7284522 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

7284522無細胞ＤＮＡの断片化パターンの分析

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27A
27B
28A
28B
29A
29B
30
31A
31B
32
33
34A
34B
35A
35B
36
37
38
39
40-1
40-2
40-3
40-4
40-5
40-6
40-7
40-8
40-9
40-10
40-11
40-12
40-13
40-14
40-15
40-16
40-17
40-18
40-19
40-20
40-21
40-22
40-23
40-24
40-25
40-26
40-27
40-28
40-29
40-30
40-31
40-32
40-33
40-34
40-35
40-36
40-37
40-38
40-39
40-40
40-41
40-42
40-43
40-44
40-45
40-46
40-47
40-48
40-49
40-50
40-51
40-52
40-53
40-54
40-55
40-56
40-57
40-58
40-59
40-60
40-61
40-62
40-63
40-64
40-65
40-66
40-67
40-68
40-69
40-70
40-71
40-72
40-73
40-74
40-75
40-76
40-77
40-78
40-79
40-80
40-81
40-82
40-83
40-84
40-85
40-86
40-87
40-88
40-89
40-90
40-91
40-92
40-93
40-94
40-95
40-96
40-97
40-98
40-99
40-100
40-101
40-102
40-103
40-104
40-105
40-106
40-107
40-108
40-109
40-110
40-111
40-112
40-113
40-114
40-115
40-116
40-117
40-118
40-119
40-120
40-121
40-122
40-123
40-124
40-125
40-126
40-127
40-128
40-129
40-130
40-131
40-132
40-133
40-134
40-135
40-136
40-137
40-138
40-139
40-140
40-141
40-142
40-143
40-144
40-145
40-146
40-147
40-148
40-149
40-150
40-151
40-152
40-153
40-154
40-155
40-156
40-157
40-158

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-05-23

(45)【発行日】2023-05-31

(54)【発明の名称】無細胞ＤＮＡの断片化パターンの分析

(51)【国際特許分類】

C12Q 1/6809 20180101AFI20230524BHJP

C12Q 1/6806 20180101ALI20230524BHJP

G16B 10/00 20190101ALN20230524BHJP

【ＦＩ】

C12Q1/6809 Z

C12Q1/6806 Z ZNA

G16B10/00

【請求項の数】 44

(21)【出願番号】P 2021129334

(22)【出願日】2021-08-05

(62)【分割の表示】P 2018503181の分割

【原出願日】2016-07-25

(65)【公開番号】P2021184732

(43)【公開日】2021-12-09

【審査請求日】2021-09-06

(31)【優先権主張番号】62/196,250

(32)【優先日】2015-07-23

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】62/294,948

(32)【優先日】2016-02-12

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】PCT/CN2016/073753

(32)【優先日】2016-02-14

(33)【優先権主張国・地域又は機関】CN

(73)【特許権者】

【識別番号】512037244

【氏名又は名称】ザチャイニーズユニバーシティオブホンコン

(74)【代理人】

【識別番号】100099759

【弁理士】

【氏名又は名称】青木篤

(74)【代理人】

【識別番号】100123582

【弁理士】

【氏名又は名称】三橋真二

(74)【代理人】

【識別番号】100117019

【弁理士】

【氏名又は名称】渡辺陽一

(74)【代理人】

【識別番号】100141977

【弁理士】

【氏名又は名称】中島勝

(74)【代理人】

【識別番号】100150810

【弁理士】

【氏名又は名称】武居良太郎

(74)【代理人】

【識別番号】100166165

【弁理士】

【氏名又は名称】津田英直

(72)【発明者】

【氏名】ロユイク－ミーンデニス

(72)【発明者】

【氏名】チーウロッサワイクーン

(72)【発明者】

【氏名】チャンクワンチー

(72)【発明者】

【氏名】ジアーンペイヨーン

【審査官】松原寛子

(56)【参考文献】

【文献】米国特許出願公開第２０１５／００１１４０３（ＵＳ，Ａ１）

【文献】米国特許出願公開第２０１４／００８０７１５（ＵＳ，Ａ１）

【文献】米国特許出願公開第２０１４／０１００１２１（ＵＳ，Ａ１）

【文献】中国特許出願公開第１０４６６２１６８（ＣＮ，Ａ）

【文献】中国特許出願公開第１０４７８１４２２（ＣＮ，Ａ）

【文献】BMC Medical Genomics，2015年06月17日，DOI 10.1186/s12920-015-0107-z

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｃ１２Ｑ１／６８０９

Ｇ１６Ｂ１０／００

Ｃ１２Ｑ１／６８０６

ＪＳＴＰｌｕｓ／ＪＭＥＤＰｌｕｓ／ＪＳＴ７５８０（ＪＤｒｅａｍＩＩＩ）

ＣＡｐｌｕｓ／ＭＥＤＬＩＮＥ／ＥＭＢＡＳＥ／ＢＩＯＳＩＳ（ＳＴＮ）

(57)【特許請求の範囲】

【請求項1】

生体試料を分析して対象における癌のレベルを決定する方法であって、以下の：
腫瘍組織型の無細胞ＤＮＡ分子の末端が、閾値を超える比率で発生する、ゲノム位置の第１のセットを特定することと、
コンピュータシステムによって、前記対象の前記生体試料の複数の組織型に由来する第１の複数の無細胞ＤＮＡ分子を分析することであって、第１の複数の無細胞ＤＮＡ分子の各無細胞ＤＮＡ分子を分析することが、
前記各無細胞ＤＮＡ分子の少なくとも１つの末端に対応する、基準ゲノムにおけるゲノム位置を決定することを含む、前記分析することと、
第１の数の前記第１の複数の無細胞ＤＮＡ分子が、前記ゲノム位置の第１のセットのうちの１つで終結することを決定することと；
前記ゲノム位置の第１のセットとは異なるゲノム位置の第２のセットで終結する、第２の数の無細胞ＤＮＡ分子を使用して、前記第１の数の前記第１の複数の無細胞ＤＮＡ分子を正規化することによって、相対的存在量を決定することと、
前記相対的存在量を、１つ以上のカットオフ値と比較することによって、前記対象の癌のレベルを決定することと、を含む、前記方法。

【請求項2】

前記ゲノム位置の第１のセットを特定することが、
少なくとも１つの第１の追加の試料に由来する第２の複数の無細胞ＤＮＡ分子を分析して、前記第２の複数の無細胞ＤＮＡ分子の終結位置を特定することであって、前記少なくとも１つの第１の追加の試料が、腫瘍組織型を含むことが既知である対象由来であり、かつ前記生体試料と同一の試料型のものである、特定することと、
複数のゲノムウインドウの各ゲノムウインドウについて、
前記ゲノムウインドウ内で終結する、前記第２の複数の無細胞ＤＮＡ分子の対応する数を決定することと、
前記対応する数を基準値と比較して、前記ゲノムウインドウ内の１つ以上のゲノム位置上で終結する無細胞ＤＮＡ分子の前記比率が前記閾値を超えるかどうかを判定することと、を含む、請求項１に記載の方法。

【請求項3】

前記複数のゲノムウインドウの第１のゲノムウインドウが、１つのゲノム位置よりも大きい幅を有し、前記対応する数が前記基準値を超える場合、前記第１のゲノムウインドウ内の前記ゲノム位置のそれぞれが、前記閾値を超える、前記ゲノム位置上で終結する無細胞ＤＮＡ分子の前記比率を有するものとして特定される、請求項２に記載の方法。

【請求項4】

前記ゲノム位置の第１のセットが、前記対応する数の最高のＮ値を有し、Ｎが、少なくとも１０，０００である、請求項２に記載の方法。

【請求項5】

前記第２の複数の無細胞ＤＮＡ分子のそれぞれのサイズを決定することであって、前記ゲノム位置の第１のセットを特定することが、
前記閾値を超える、前記比率を有すると判定された、第１のゲノムウインドウ内で終結する前記第２の複数の無細胞ＤＮＡ分子の無細胞ＤＮＡ分子のサイズ分布の第１の統計値を決定することと、
前記第１の統計値をサイズ閾値と比較することと、
前記第１の統計値が前記サイズ閾値を超えない場合、前記第１のゲノムウインドウを前記第１のゲノム位置のセットから除外することと、を更に含む、決定することを更に含む、請求項２に記載の方法。

【請求項6】

前記１つ以上のカットオフ値の少なくとも１つが、前記少なくとも１つの第１の追加の試料から決定される、請求項２に記載の方法。

【請求項7】

前記少なくとも１つの第１の追加の試料について、
前記試料の取得元の対応する対象において、癌のレベルを決定することと、
前記ゲノム位置の第１のセットで終結する前記第２の複数の無細胞ＤＮＡ分子の前記対応する数を使用して、それにより前記１つ以上のカットオフ値を得ることと、を更に含む、請求項６に記載の方法。

【請求項8】

前記ゲノム位置の第１のセットの前記各ゲノム位置が、前記ゲノム位置上で終結する前記第２の複数の無細胞ＤＮＡ分子の少なくとも特定の数の無細胞ＤＮＡ分子を有する、請求項２に記載の方法。

【請求項9】

前記基準値が、前記少なくとも１つの第１の追加の試料中の無細胞ＤＮＡ分子の確率分布及び平均長に従う、前記ゲノムウインドウ内で終結する無細胞ＤＮＡ分子の期待数である、請求項２に記載の方法。

【請求項10】

前記確率分布が、ポアソン分布であり、前記ゲノムウインドウ内の１つ以上のゲノム位置上で終結する無細胞ＤＮＡ分子の前記比率が前記閾値を超えるかどうかを判定することが、
前記対応する数及び前記期待数を使用して、対応するｐ値を決定することであって、前記閾値が、カットオフｐ値に対応し、前記対応するｐ値が、前記カットオフｐ値よりも小さいことが、前記ゲノムウインドウ内で終結する無細胞ＤＮＡ分子の前記比率が前記閾値を超えることを示す、決定することを含む、請求項９に記載の方法。

【請求項11】

前記ゲノム位置上で終結する前記第２の複数の無細胞ＤＮＡ分子の前記比率が前記閾値を超える、前記ゲノム位置が、第１の上位集合を含み、前記ゲノム位置の第１のセットを特定することが、
前記コンピュータシステムによって、減少した量の前記腫瘍組織型を有しないものとして特定される、少なくとも１つの第２の追加の試料に由来する第３の複数の無細胞ＤＮＡ分子を分析して、前記ゲノム位置上で終結する前記第３の複数の無細胞ＤＮＡ分子の第２の上位集合が前記閾値を超えることを特定することと、
前記ゲノム位置の第１のセットを、前記第１の上位集合内にはあり、かつ前記第２の上位集合内にはない、前記ゲノム位置を含むものとして特定することと、を更に含む、請求項２に記載の方法。

【請求項12】

前記基準値が、前記ゲノムウインドウ内で終結する、無細胞ＤＮＡ分子の測定された数を含み、前記測定された数が、前記腫瘍組織型を有しないものとして特定される、少なくとも１つの第２の追加の試料の第３の複数の無細胞ＤＮＡ分子から決定される、請求項２に記載の方法。

【請求項13】

前記第２の複数の無細胞ＤＮＡ分子のそれぞれのサイズを決定することであって、前記ゲノム位置の第１のセットを特定することが、
前記閾値を超える、前記比率を有すると判定された、第１のゲノム位置上で終結する、前記第２の複数の無細胞ＤＮＡ分子の無細胞ＤＮＡ分子の第１のサイズ分布の第１の統計値を決定することと、
前記閾値を超える、前記比率を有すると判定された、１つ以上の第２のゲノム位置上で終結する、前記第３の複数の無細胞ＤＮＡ分子の無細胞ＤＮＡ分子の第２のサイズ分布の第２の統計値を決定することと、
前記第１の統計値を第２の統計値と比較することと、
前記第１の統計値が少なくとも特定の量だけ前記第２の統計値を超えない場合、前記第１のゲノム位置を前記ゲノム位置の第１のセットから除外して、前記第１のサイズ分布が前記第２のサイズ分布よりも小さいことを示すことと、を更に含む、請求項１２に記載の方法。

【請求項14】

前記対応する数を前記基準値と比較することが、
前記対応する数と、前記ゲノムウインドウを網羅する第３の数の前記第２の複数の無細胞ＤＮＡ分子との、第１の比率を算出することと、
前記第１の比率を前記基準値と比較することであって、前記基準値が、前記ゲノムウインドウ内で終結する読み取りの前記測定された数と、前記ゲノムウインドウを網羅し、かつ前記ゲノムウインドウ内で終結しない、第４の数の前記第３の複数の無細胞ＤＮＡ分子との基準比率を含む、比較することと、を含む、請求項１２に記載の方法。

【請求項15】

前記第３の数の前記第２の複数の無細胞ＤＮＡ分子が、前記ゲノムウインドウ内で終結しない、請求項１４に記載の方法。

【請求項16】

前記ゲノムウインドウ内で終結する無細胞ＤＮＡ分子の前記比率が、前記閾値を超えるかどうかを判定することが、
前記第１の比率が乗法的因子掛ける前記基準比率よりも大きいかどうかを判定することを含む、請求項１４に記載の方法。

【請求項17】

前記生体試料及び前記少なくとも１つの第１の追加の試料の前記試料型が、血漿、血清、脳脊髄液、及び尿からなる群から選択される、請求項２に記載の方法。

【請求項18】

前記ゲノムウインドウが、ゲノム位置であり、前記腫瘍組織型が、複数の腫瘍特異的な対立遺伝子を有し、前記ゲノム位置上で終結する、前記第２の複数の無細胞ＤＮＡ分子の対応する数を算出することが、
前記ゲノム位置上で終結する前記無細胞ＤＮＡ分子が、前記複数の腫瘍特異的な対立遺伝子のうちの少なくとも１つを含むかどうかを特定することと、
前記無細胞ＤＮＡ分子が腫瘍特異的な対立遺伝子を含む場合、前記対応する数に前記無細胞ＤＮＡ分子を含めることと、
前記無細胞ＤＮＡ分子が腫瘍特異的な対立遺伝子を含まない場合、前記対応する数に前記無細胞ＤＮＡ分子を含めないことと、を含む、請求項２に記載の方法。

【請求項19】

前記腫瘍組織型が、少なくとも１つの追加の試料中に複数の腫瘍特異的な対立遺伝子を有し、前記ゲノム位置の第１のセットが、前記複数の腫瘍特異的な対立遺伝子のうちの少なくとも１つを含む、前記少なくとも１つの追加の試料の無細胞ＤＮＡ分子を使用して決定される、請求項１に記載の方法。

【請求項20】

ゲノム位置の第２のセットは、第２の組織型の無細胞ＤＮＡ分子の末端が、前記少なくとも１つの追加の試料中で前記閾値を超える比率で発生するようなものであり、前記第２の組織型が、前記少なくとも１つの追加の試料中に複数の第２の組織に特異的な対立遺伝子を有し、前記ゲノム位置の第２のセットが、前記複数の第２の組織に特異的な対立遺伝子のうちの少なくとも１つを含む、前記少なくとも１つの追加の試料の無細胞ＤＮＡ分子を使用して決定される、請求項１９に記載の方法。

【請求項21】

前記腫瘍組織型と前記第２の組織型との間で共有された対立遺伝子を有する無細胞ＤＮＡ分子の末端が、前記閾値を超える第２の比率で発生するゲノム位置が、前記ゲノム位置の第１のセットから除外され、前記ゲノム位置の第２のセットから除外される、請求項２０に記載の方法。

【請求項22】

前記相対的存在量が、前記第１の数及び前記第２の数の比率を含む、請求項１に記載の方法。

【請求項23】

前記相対的存在量が、
前記ゲノム位置の第１のセットの各ゲノム位置について、
前記ゲノム位置上で終結する、前記第１の複数の無細胞ＤＮＡ分子の対応する数を、前記第１の数の前記第１の複数の無細胞ＤＮＡ分子が前記ゲノム位置の第１のセットのうちのいずれか１つで終結することを判定することの一部として算出することと、
前記ゲノム位置を網羅し、前記ゲノム位置上で終結しない第３の数の前記第１の複数の無細胞ＤＮＡ分子を、前記第２の数の無細胞ＤＮＡ分子を決定することの一部として算出することと、
前記対応する数及び前記第３の数の第１の比率を算出することと、
前記第１の比率の平均を前記相対的存在量として算出することと、によって算出される、請求項１に記載の方法。

【請求項24】

正規化が、前記第１の複数の無細胞ＤＮＡ分子の少なくとも１つの末端に対応する、全てのゲノム位置を使用する、請求項１に記載の方法。

【請求項25】

前記無細胞ＤＮＡ分子のうちの１つ以上を分析することが、前記無細胞ＤＮＡ分子の両末端に対応する両方のゲノム位置を決定することを含む、請求項１に記載の方法。

【請求項26】

前記癌のレベルが、前記対象における前記腫瘍組織型の量、前記対象における前記腫瘍のサイズ、前記対象における前記腫瘍の段階、前記対象における腫瘍負荷、及び前記対象における腫瘍転移の存在からなる群から選択される、請求項１に記載の方法。

【請求項27】

分析される前記生体試料から鋳型ＤＮＡ分子を得ることと、
前記鋳型ＤＮＡ分子を使用して、分析可能なＤＮＡ分子の配列決定ライブラリを調製することであって、前記鋳型ＤＮＡ分子のＤＮＡ増幅のステップを含まない、調製することと、及び
前記分析可能なＤＮＡ分子の配列決定ライブラリを配列決定して、前記第１の複数の無細胞ＤＮＡ分子に対応する複数の配列読み取りを得ることと、を更に含み、
前記第１の複数の無細胞ＤＮＡ分子を分析することが、
コンピュータシステムから、前記複数の配列読み取りを受信することと、及び
前記コンピュータシステムによって、前記複数の配列読み取りを前記基準ゲノムに整列させて、前記複数の配列読み取りのゲノム位置を決定することと、を含む、請求項１に記載の方法。

【請求項28】

前記癌のレベルに基づいて治療的介入を提供すること、または前記癌のレベルに基づいて前記対象の撮像を実行することを更に含む、請求項１に記載の方法。

【請求項29】

前記ゲノム位置の第１のセットが、６００～１０，０００個のゲノム位置を含む、請求項１に記載の方法。

【請求項30】

生体試料を分析する方法であって、以下の：
対象の生体試料の複数の組織型に由来する第１の複数の無細胞ＤＮＡ分子を分析することであって、第１の複数の無細胞分子の各無細胞ＤＮＡ分子を分析することが、
前記無細胞ＤＮＡ分子の少なくとも１つの末端に対応する、基準ゲノムにおけるゲノム位置を決定することを含む、分析することと、
第１の組織型の無細胞ＤＮＡ分子の末端が閾値を超える比率で発生する、ゲノム位置の第１セットを取得すること；
前記第１の複数の無細胞ＤＮＡ分子の前記分析に基づいて、前記ゲノム位置の第１のセットの１つで終結する無細胞ＤＮＡ分子の第１のセットを特定することと、
前記無細胞ＤＮＡ分子の第１のセットを用いて、前記対象の健常細胞に対する第１組織型のＤＮＡにおける１つ以上の組織に関連する変化を決定すること
を含む、前記方法。

【請求項31】

前記１以上の組織に関連する変化が、増幅、欠失、１ヌクレオチド変異、異常メチル化、及び異常サイズからなる群から選ばれる少なくとも１つを含む、請求項３０に記載の方法。

【請求項32】

前記１以上の組織に関連する変化が、１つ以上の癌に関連する変化である、請求項３１に記載の方法。

【請求項33】

前記無細胞ＤＮＡ分子の第１のセットが、前記無細胞ＤＮＡ分子の第１のセットに加重を割り当てることにより用いられ；前記加重は、前記無細胞ＤＮＡ分子が前記第１の組織型に由来する可能性に相当し、そして前記無細胞ＤＮＡ分子の第１のセットの加重和が、前記１以上の組織に関連する変化を決定するために使用される、請求項３０に記載の方法。

【請求項34】

前記第１の組織型が、腫瘍に対応する、請求項３０に記載の方法。

【請求項35】

前記第１の組織型が、胎児に対応し、そしてここで前記対象が胎児を宿した妊婦である、請求項３０に記載の方法。

【請求項36】

前記１以上の組織に関連する変化を用いて前記対象の癌のレベルを決定することをさらに含む、請求項３０に記載の方法。

【請求項37】

前記ゲノム位置の第１のセットの１つで終結する前記無細胞ＤＮＡ分子の第１のセットを特定することが、前記ゲノム位置の第１のセットからの無細胞ＤＮＡ分子のハイブリダイゼーションによる捕捉を使用する、請求項３０に記載の方法。

【請求項38】

前記ゲノム位置の第１のセットの１つで終結する前記無細胞ＤＮＡ分子の第１のセットを特定することが、前記ゲノム位置の第１のセットからの無細胞ＤＮＡ分子の増幅を使用する、請求項３０に記載の方法。

【請求項39】

前記第１の複数の無細胞ＤＮＡ分子を分析することが、シーケンシングを含み、それにより配列読み取りを取得し、そしてゲノム位置の第１のセットで終結する無細胞ＤＮＡ分子の第１のセットの特定が、前記配列読み取りを前記基準ゲノムへの配列整列することを含む、請求項３０に記載の方法。

【請求項40】

コンピュータシステムを制御して、請求項１～３９に記載の方法のいずれかの操作を実行するための複数の命令を記憶するコンピュータ可読媒体を含む、コンピュータ製品。

【請求項41】

請求項４０に記載のコンピュータ製品と、
前記コンピュータ可読媒体上に記憶された命令を実行するための１つ以上のプロセッサと、を含む、システム。

【請求項42】

請求項１～３９に記載の方法のいずれかを実行するための手段を含む、システム。

【請求項43】

請求項１～３９に記載の方法のいずれかを実行するように構成された、システム。

【請求項44】

それぞれが請求項１～３９に記載の方法のいずれかのステップを実行するモジュールを含む、システム。

【発明の詳細な説明】

【背景技術】

【0001】

関連出願の相互参照
本出願は、２０１５年７月２３日出願の米国仮特許出願第６２／１９６，２５０号及び２０１６年２月１２日出願の同第６２／２９４，９４８号からの優先権、ならびに２０１６年２月１４日出願のＰＣＴ出願第ＰＣＴ／ＣＮ２０１６／０７３７５３号からの優先権を主張し、これらの内容全体が、全ての目的のために参照により本明細書に組み込まれる。

【0002】

以前の研究において、血漿ＤＮＡがほぼ２００塩基対未満の短断片からなることが示された（Ｌｏｅｔａｌ．ＳｃｉＴｒａｎｓｌＭｅｄ２０１０；２（６１）：６１ｒａ９１）。血漿ＤＮＡのサイズ分布において、ピークは、１６６塩基対で観察することができた。更に、母体血漿ＤＮＡが配列決定される場合、配列決定されたタグ密度は、転写開始部位（ＴＳＳ）に近い１８０塩基対周辺の周期性とともに変動することが観察された（Ｆａｎｅｔａｌ．ＰＮＡＳ２００８；１０５：１６２６６－７１）。これらの結果は、血漿ＤＮＡの断片化がランダムなプロセスではない可能性があるという一組の証拠である。しかしながら、血漿中のＤＮＡ断片化の正確なパターン、及びパターンを支配する因子は明らかになっていない。更に、ＤＮＡ断片化を使用する実用的な用途は、完全には理解されていない。

【発明の概要】

【0003】

様々な実施形態は、無細胞ＤＮＡ、例えば、血漿ＤＮＡ及び血清ＤＮＡの断片化パターンの分析の用途（例えば、診断的用途）を対象とする。１つの用途の実施形態において、異なる組織型に由来する無細胞ＤＮＡの混合物中の特定の組織型の比例的寄与の分類が決定され得る。例えば、特定のパーセンテージ、パーセンテージの範囲、または比例的寄与が特定のパーセンテージを超えるかどうかが、分類として判定され得る。一例において、特定の組織型の好ましい終結位置を特定することができ、好ましい終結位置上で終結する無細胞ＤＮＡ分子の相対的存在量を使用して、比例的寄与の分類を提供することができる。別の例において、特定の組織型に特異的な領域における断片化パターンの振幅（例えば、あるゲノム位置で終結する無細胞ＤＮＡ分子の数）を使用してもよい。

【0004】

別の用途の実施形態において、異なる組織型に由来する無細胞ＤＮＡの混合物中の特定の組織型の遺伝子型が決定され得る。一例において、特定の組織型の好ましい終結位置が決定され得、好ましい終結位置上で終結する無細胞ＤＮＡ分子を使用して、遺伝子型が決定され得る。

【0005】

別の用途の実施形態において、無細胞ＤＮＡ分子の左末端の極大を無細胞ＤＮＡ分子の右末端の極大と比較することによって、好ましい終結位置を特定してもよい。対応する極大が十分に分離している場合、好ましい終結位置を特定することができる。更に、左／右末端の極大上で終結する無細胞ＤＮＡ分子の量を、低い分離を有する極大の無細胞ＤＮＡ分子の量と比較して、組織型の比例的寄与を決定することができる。

【0006】

他の実施形態は、本明細書に記載される方法に関連する、システム、携帯用消費者デバイス、及びコンピュータ可読媒体を対象とする。

【0007】

以下の発明を実施するための形態及び添付の図面を参照して、本発明の実施形態の性質及び利点のより良好な理解を得ることができる。

【図面の簡単な説明】

【0008】

【図1】本発明の実施形態に従う、インタクト確率（Ｐ_Ｉ）の定義の一例示的な例を示す。

【図2】本発明の実施形態に従う、２５をｚの値として使用する、染色体６上のセグメントにわたるＰ_Ｉの変動を示す。

【図3】母体血漿中の母体由来ＤＮＡ及び胎児由来ＤＮＡのＰ_Ｉの同調変動の説明を示す。

【図4】母体血漿中の母体由来ＤＮＡ及び胎児由来ＤＮＡのＰ_Ｉの非同調変動の説明を示す。

【図5】母体ＤＮＡ分子及び胎児ＤＮＡ分子がＰ_Ｉの変動において同調するかどうかについての分析を示す、流れ図である。

【図6】母体血漿中の母体（赤色／灰色）由来ＤＮＡ断片及び胎児（青色／黒色）由来ＤＮＡ断片のＰ_Ｉの変動の２つの母体血漿試料（Ｓ２４及びＳ２６）の分析を示す。

【図7】Ｐ_Ｉの変動の振幅の説明を示す。

【図8】図８Ａはデオキシリボヌクレアーゼ高感受性部位であるが、ＴＳＳではない領域での、Ｐ_Ｉ変動のパターンを示す。図８ＢはＴＳＳであるが、デオキシリボヌクレアーゼ高感受性部位ではない領域での、Ｐ_Ｉ変動のパターンを示す。

【図9】異なる組織から放出されるＤＮＡの割合の測定の原理の説明を示す。

【図10】組織Ａに由来するＤＮＡの既知の比例的濃度を有する２つ以上の較正試料の分析によって決定される、ＦＲ_Ａと、混合物中のＤＮＡに対する組織Ａの比例的寄与との間の関係を示す。

【図11】ＦＲ_胎盤と母体血漿中の胎児ＤＮＡパーセンテージとの間の相関を示す。

【図12】ＦＲ_血液と母体血漿中の胎児ＤＮＡ濃度との間の相関を示す。

【図13】本発明の実施形態に従う、生体試料を分析して、第１の組織型の比例的寄与の分類を決定する、方法１３００の流れ図である。

【図14】腫瘍由来ＤＮＡまたは胎児由来ＤＮＡの循環ＤＮＡ断片の場合の差異の原理の説明を示す。

【図15】第１の組織型を含む複数の組織型に由来する無細胞ＤＮＡ分子の混合物を含む、生体試料を分析する方法の流れ図である。

【図16】ＨＣＣの症例に特異的である高頻度終結部位の数、妊婦に特異的である高頻度終結部位の数、及び両方の場合によって共有される高頻度終結部位の数を示す、ベン図である。

【図17】癌に特異的な終結位置上で終結する、配列決定されたＤＮＡ断片の割合と、血漿中に既知の腫瘍ＤＮＡ画分を有する癌患者の血漿中の腫瘍ＤＮＡ画分との間の関係を示す、較正曲線を示す。

【図18】胎児に特異的な対立遺伝子ならびに母親及び胎児によって共有された対立遺伝子を担持する、血漿ＤＮＡの非ランダム断片化パターンの一例示的な例を示す。

【図19】ゲノム座標が、情報提供的一塩基遺伝子多型（ＳＮＰ）を有する領域にわたって、母体血漿ＤＮＡ断片の終結位置である確率のプロットを示す。

【図20】母親においてホモ接合され、胎児においてヘテロ接合された、ＳＮＰにわたる血漿ＤＮＡ断片の終結位置の分析を示す。

【図21】胎児においてホモ接合され、母親においてヘテロ接合された、ＳＮＰにわたる血漿ＤＮＡ断片の終結位置の分析を示す。

【図22】反復胎児（セットＡ）末端及び母体（セットＸ）末端を有する血漿ＤＮＡ分子の相対的存在量（比率（胎児／母体））と、胎児ＤＮＡ画分との間の相関を示す。

【図23】胎児に好ましい終結位置上で終結する断片、及び母体に好ましい終結位置上で終結する断片の、血漿ＤＮＡサイズ分布に関するデータを示す。

【図24】胎児に好ましい終結位置上で終結する断片、及び母体に好ましい終結位置上で終結する断片の、２６人の妊娠第一期の妊婦に由来するプールされた血漿ＤＮＡ試料中の、血漿ＤＮＡサイズ分布に関するデータを示す。

【図25】ＨＣＣ患者の血漿ＤＮＡの非ランダム断片化パターンの一例示的な例を示す。

【図26】ゲノム座標が、変異部位を有する領域にわたって、血漿ＤＮＡ断片の終結位置である確率のプロットである。

【図27A】腫瘍組織中に変異が存在したゲノム位置にわたる血漿ＤＮＡ断片の終結位置の分析を示す。

【図27B】比率_{変異／野生型}と、７１人のＨＣＣ患者の血漿中の腫瘍ＤＮＡ画分との間の相関を示す。

【図28A】妊婦及びＨＣＣ患者の血漿ＤＮＡの好ましい終結位置の数を示す。セットＰは、妊婦において好ましい、２９００万個の終結位置を含有した。

【図28B】比率_{ＨＣＣ／妊娠}と、７１人のＨＣＣ患者の血漿中の腫瘍ＤＮＡ画分との間に正の相関が観察されたことを示す。

【図29A】好ましい末端終結比（ＰＥＴＲ）の概念の説明を示す。各線は、１つの血漿ＤＮＡ断片を表す。

【図29B】１１人のＨＣＣ患者における、血漿中の腫瘍ＤＮＡ画分とセットＨの位置のＰＥＴＲとの間の相関を示す。

【図30】ＨＣＣに好ましい末端、ＨＢＶに好ましい末端、または共有された末端で終結する血漿ＤＮＡ分子中に検出される、短ＤＮＡ（＜１５０塩基対）の割合を示す。

【図31A】ｗ－ＰＥＴＲの原理の説明を示す。ｗ－ＰＥＴＲの値は、ウインドウＡ内で終結するＤＮＡ断片の数と、ウインドウＢ内で終結するＤＮＡ断片の数との間の比率として計算される。

【図31B】１１人のＨＣＣ患者における、腫瘍ＤＮＡ画分とｗ－ＰＥＴＲの値との間の相関を示す。

【図32】臍帯血液血漿試料（２１０×半数体ゲノム範囲）と比較した場合の、研究試料のそれぞれの血漿試料中に検出される、一般的に共有される好ましい終結位置の割合を示す。

【図33】２つ以上の試料中に一般的に観察された好ましい終結位置の数、及びいずれか１つの試料中にのみ観察された好ましい終結位置の数を示す、ベン図を示す。

【図34A】血漿中の胎児ＤＮＡ画分と、「出産前」血漿ＤＮＡ試料及び「出産後」血漿ＤＮＡ試料の比較を通して特定された位置のセット上の、平均ＰＥＴＲとの間の相関を示す。

【図34B】血漿中の胎児ＤＮＡ画分と、「出産前」血漿ＤＮＡ試料及び「出産後」血漿ＤＮＡ試料の比較を通して特定された位置のセット上の、平均ｗ－ＰＥＴＲとの間の相関を示す。

【図35A】妊娠１８週目の妊婦（妊婦対象１）及び妊娠３８週目の妊婦（妊婦対象２）の２人の間で、上位１００万個の最も高頻度に観察された血漿ＤＮＡに好ましい終結位置を示す。

【図35B】２人の妊婦の血漿中で、上位１００万個の最も高頻度に観察された好ましい終結位置のＰＥＴＲ値の比較を示す。

【図36】本発明の実施形態に従う、生体試料を分析して、混合物中の第１の組織型の比例的寄与の分類を決定する方法の流れ図である。

【図37】胎児に好ましい終結位置に近い基準ゲノムに整列させると、異なる対立遺伝子を担持する母体血漿ＤＮＡ分子を示す。

【図38】本発明の実施形態に従う、生体試料を分析して、第１の組織型の遺伝子型を決定する方法３８００の流れ図である。

【図39】本発明の実施形態に従う、システム及び方法とともに使用することができる一例示的なコンピュータシステム１０のブロック図を示す。

【図40-1】付録Ａ

【図40-2】付録Ａの続き

【図40-3】付録Ａの続き

【図40-4】付録Ａの続き

【図40-5】付録Ａの続き

【図40-6】付録Ａの続き

【図40-7】付録Ａの続き

【図40-8】付録Ａの続き

【図40-9】付録Ａの続き

【図40-10】付録Ａの続き

【図40-11】付録Ａの続き

【図40-12】付録Ａの続き

【図40-13】付録Ａの続き

【図40-14】付録Ａの続き

【図40-15】付録Ａの続き

【図40-16】付録Ａの続き

【図40-17】付録Ａの続き

【図40-18】付録Ａの続き

【図40-19】付録Ａの続き

【図40-20】付録Ａの続き

【図40-21】付録Ａの続き

【図40-22】付録Ａの続き

【図40-23】付録Ａの続き

【図40-24】付録Ａの続き

【図40-25】付録Ａの続き

【図40-26】付録Ａの続き

【図40-27】付録Ａの続き

【図40-28】付録Ａの続き

【図40-29】付録Ａの続き

【図40-30】付録Ａの続き

【図40-31】付録Ａの続き

【図40-32】付録Ａの続き

【図40-33】付録Ａの続き

【図40-34】付録Ａの続き

【図40-35】付録Ａの続き

【図40-36】付録Ａの続き

【図40-37】付録Ａの続き

【図40-38】付録Ａの続き

【図40-39】付録Ａの続き

【図40-40】付録Ａの続き

【図40-41】付録Ａの続き

【図40-42】付録Ａの続き

【図40-43】付録Ａの続き

【図40-44】付録Ａの続き

【図40-45】付録Ａの続き

【図40-46】付録Ａの続き

【図40-47】付録Ａの続き

【図40-48】付録Ａの続き

【図40-49】付録Ａの続き

【図40-50】付録Ａの続き

【図40-51】付録Ａの続き

【図40-52】付録Ａの続き

【図40-53】付録Ａの続き

【図40-54】付録Ａの続き

【図40-55】付録Ａの続き

【図40-56】付録Ａの続き

【図40-57】付録Ａの続き

【図40-58】付録Ａの続き

【図40-59】付録Ａの続き

【図40-60】付録Ａの続き

【図40-61】付録Ａの続き

【図40-62】付録Ａの続き

【図40-63】付録Ａの続き

【図40-64】付録Ａの続き

【図40-65】付録Ａの続き

【図40-66】付録Ａの続き

【図40-67】付録Ａの続き

【図40-68】付録Ａの続き

【図40-69】付録Ａの続き

【図40-70】付録Ａの続き

【図40-71】付録Ａの続き

【図40-72】付録Ａの続き

【図40-73】付録Ａの続き

【図40-74】付録Ａの続き

【図40-75】付録Ａの続き

【図40-76】付録Ａの続き

【図40-77】付録Ａの続き

【図40-78】付録Ａの続き

【図40-79】付録Ａの続き

【図40-80】付録Ａの続き

【図40-81】付録Ａの続き

【図40-82】付録Ａの続き

【図40-83】付録Ａの続き

【図40-84】付録Ａの続き

【図40-85】付録Ａの続き

【図40-86】付録Ａの続き

【図40-87】付録Ａの続き

【図40-88】付録Ａの続き

【図40-89】付録Ａの続き

【図40-90】付録Ａの続き

【図40-91】付録Ａの続き

【図40-92】付録Ａの続き

【図40-93】付録Ａの続き

【図40-94】付録Ａの続き

【図40-95】付録Ａの続き

【図40-96】付録Ａの続き

【図40-97】付録Ａの続き

【図40-98】付録Ａの続き

【図40-99】付録Ａの続き

【図40-100】付録Ａの続き

【図40-101】付録Ａの続き

【図40-102】付録Ａの続き

【図40-103】付録Ａの続き

【図40-104】付録Ａの続き

【図40-105】付録Ａの続き

【図40-106】付録Ａの続き

【図40-107】付録Ａの続き

【図40-108】付録Ａの続き

【図40-109】付録Ａの続き

【図40-110】付録Ａの続き

【図40-111】付録Ａの続き

【図40-112】付録Ａの続き

【図40-113】付録Ａの続き

【図40-114】付録Ａの続き

【図40-115】付録Ａの続き

【図40-116】付録Ａの続き

【図40-117】付録Ａの続き

【図40-118】付録Ａの続き

【図40-119】付録Ａの続き

【図40-120】付録Ａの続き

【図40-121】付録Ａの続き

【図40-122】付録Ａの続き

【図40-123】付録Ａの続き

【図40-124】付録Ａの続き

【図40-125】付録Ａの続き

【図40-126】付録Ａの続き

【図40-127】付録Ａの続き

【図40-128】付録Ａの続き

【図40-129】付録Ａの続き

【図40-130】付録Ａの続き

【図40-131】付録Ａの続き

【図40-132】付録Ａの続き

【図40-133】付録Ａの続き

【図40-134】付録Ａの続き

【図40-135】付録Ａの続き

【図40-136】付録Ａの続き

【図40-137】付録Ａの続き

【図40-138】付録Ａの続き

【図40-139】付録Ａの続き

【図40-140】付録Ａの続き

【図40-141】付録Ａの続き

【図40-142】付録Ａの続き

【図40-143】付録Ａの続き

【図40-144】付録Ａの続き

【図40-145】付録Ａの続き

【図40-146】付録Ａの続き

【図40-147】付録Ａの続き

【図40-148】付録Ａの続き

【図40-149】付録Ａの続き

【図40-150】付録Ａの続き

【図40-151】付録Ａの続き

【図40-152】付録Ａの続き

【図40-153】付録Ａの続き

【図40-154】付録Ａの続き

【図40-155】付録Ａの続き

【図40-156】付録Ａの続き

【図40-157】付録Ａの続き

【図40-158】付録Ａの続き

【0009】

用語
「組織」は、機能的単位としてともに群化する細胞の群に対応する。単一の組織中には、２つ以上の型の細胞が見出され得る。異なる型の組織は、異なる型の細胞（例えば、肝細胞、肺胞細胞、または血液細胞）からなり得るが、異なる生物（母親対胎児）に由来する組織、または健常細胞対腫瘍細胞にも対応し得る。

【0010】

「生体試料」は、対象（例えば、妊婦などのヒト、癌を有する者、もしくは癌を有することが疑われる者、臓器移植レシピエント、または臓器に関与する疾患プロセス（例えば、心筋梗塞における心臓、または卒中における脳、または貧血における造血系）を有すことが疑われる対象）から取得され、対象となる１つ以上の核酸分子（複数可）を含有する任意の試料を指す。生体試料は、血液、血漿、血清、尿、膣液、水瘤液（例えば、陰嚢のもの）、膣洗浄液、胸膜液、腹水、脳脊髄液、唾液、汗、涙、痰、気管支肺胞洗浄液、乳頭からの分泌液、身体の異なる部分（例えば、甲状腺、乳房）からの吸引液などの体液であり得る。便試料もまた使用され得る。様々な実施形態において、無細胞ＤＮＡについて富化されている生体試料（例えば、遠心分離プロトコルを介して得られる血漿試料）中の大部分のＤＮＡは無細胞であり得、例えば、５０％、６０％、７０％、８０％、９０％、９５％、または９９％超のＤＮＡは無細胞であり得る。遠心分離プロトコルは、例えば、３，０００ｇ×１０分間で液部分を得、例えば、３０，０００ｇで更に１０分間の遠心分離して、残渣細胞を除去することを含み得る。

【0011】

「癌に関連する変化」または「癌に特異的な変化」としては、癌由来変異（単一ヌクレオチド変異、ヌクレオチドの欠失もしくは挿入、遺伝子もしくは染色体セグメントの欠失、転座、逆位を含む）、遺伝子、遺伝子セグメント、または染色体セグメントの増幅、ウイルスに関連する配列（例えば、ウイルスエピソーム及びウイルス挿入）、異常なメチル化プロファイルまたは腫瘍に特異的なメチル化シグネチャー、異常な無細胞ＤＮＡサイズプロファイル、異常なヒストン修飾マーク及び他のエピジェネティック修飾、ならびに癌に関連するか、または癌に特異的な無細胞ＤＮＡ断片の末端の位置が挙げられるが、これらに限定されない。

【0012】

「情報提供的癌ＤＮＡ断片」は、癌に関連するか、または癌に特異的な変化または変異のうちのいずれか１つ以上を保持または担持する、ＤＮＡ断片に対応する。「情報提供的胎児ＤＮＡ断片」は、患者のゲノムのうちのいずれにも見出されない変異を担持する胎児ＤＮＡ断片に対応する。「情報提供的ＤＮＡ断片」は、上記の型のＤＮＡ断片のうちのいずれも指し得る。

【0013】

「配列読み取り」は、核酸分子の任意の部分または全てから配列決定された、一連のヌクレオチドを指す。例えば、配列読み取りは、核酸断片から配列決定された、短い一連のヌクレオチド（例えば、２０～１５０）、核酸断の一端もしくは両端の短い一連のヌクレオチド、または生体試料中に存在する核酸断片全体の配列決定であり得る。配列読み取りは、例えば、配列決定技術を使用して、あるいはプローブ（例えば、ハイブリダイゼーションアレイにおけるものもしくは捕捉プローブ）を使用して、あるいは増幅技術（ポリメラーゼ連鎖反応（ＰＣＲ）または単一プライマーを使用する線形増幅もしくは等温増幅など）を使用して、様々な方法で得ることができる。

【0014】

「終結位置」または「末端位置」（または単に「末端」）は、無細胞ＤＮＡ分子、例えば、血漿ＤＮＡ分子の最外側（すなわち、先端）塩基のゲノム座標またはゲノム同一性もしくはヌクレオチド同一性を指し得る。末端位置は、ＤＮＡ分子のいずれかの末端に対応し得る。このように、ＤＮＡ分子の開始端及び末端を指す場合、両方が終結位置に対応するだろう。実際には、１つの末端位置が、超並列配列決定もしくは次世代配列決定、単一分子配列決定、二本鎖もしくは一本鎖ＤＮＡ配列決定ライブラリ調製プロトコル、ポリメラーゼ連鎖反応（ＰＣＲ）、またはマイクロアレイなどであるが、これらに限定されない分析的方法によって検出または決定される、無細胞ＤＮＡ分子の１つの先端上の最外側塩基のゲノム座標またはヌクレオチド同一性である。そのようなインビトロ技術は、無細胞ＤＮＡ分子の真のインビボ物理的末端（複数可）を変化させ得る。したがって、各検出可能な末端は、生物学的に真の末端を提示し得るか、または末端は、分子の元の末端から１つ以上のヌクレオチド内向き、もしくは１つ以上のヌクレオチド長伸長している（例えば、クレノウ断片による非平滑末端化末端二本鎖ＤＮＡ分子のオーバーハングの５’平滑末端化及び３’充填）。末端位置のゲノム同一性またはゲノム座標は、配列読み取りを、ヒト基準ゲノム、例えば、ｈｇ１９に整列させた結果から導出してもよい。それは、ヒトゲノムの元の座標を表す指標またはコードの目録から導出してもよい。それは、標的に特異的なプローブ、ミニ配列決定、ＤＮＡ増幅（これらに限定されない）によって読み取られる無細胞ＤＮＡ分子上の位置またはヌクレオチド同一性を指し得る。

【0015】

「好ましい末端」（または「反復終結位置」）は、生理学的状態（例えば、妊娠）もしくは病理学的（疾患）状態（例えば、癌）を有しない生体試料中よりも、または同一の病理学的状態もしくは生理学的状態の異なる時点もしくは段階（例えば、治療の前もしくは後）よりも、そのような状態を有する生体試料中で、（例えば、比率によって測定される場合）より高度に提示されているか、または一般的である末端を指す。したがって、好ましい末端は、他の状態と比較して、関連する生理学的状態または病理学的状態において検出される、増加した尤度または確率を有する。増加した確率は、病理学的状態と非病理学的状態との間で（例えば、癌を有する患者または有しない患者において）比較し、尤度比または相対的確率として定量化することができる。尤度比は、試験された試料中で少なくとも閾値数の好ましい末端を検出する確率に基づいて、またはそのような状態を有しない患者よりも、そのような状態を有する患者において好ましい末端を検出する確率に基づいて、決定され得る。尤度比の閾値の例としては、１．１、１．２、１．３、１．４、１．５、１．６、１．８、２．０、２．５、３．０、３．５、４．０、４．５、５、６、８、１０、２０、４０、６０、８０、及び１００が挙げられるが、これらに限定されない。そのような尤度比は、関連する状態を有する試料または有しない試料の相対的存在量の値を比較することによって測定することができる。関連する生理学的状態または疾患状態において好ましい末端を検出する確率はより高いため、そのような好ましい終結位置は、その同一の生理学的状態または疾患状態を有する２人以上の個体において見られるだろう。増加した確率によって、分析される無細胞ＤＮＡ分子の数がゲノムのサイズよりもはるかに少ない場合ですら、２つ以上の無細胞ＤＮＡ分子が、同一の好ましい終結位置上の終結として検出され得る。したがって、好ましい終結位置または反復終結位置はまた、「高頻度終結位置」とも呼ばれる。いくつかの実施形態において、定量的閾値を使用して、末端が、好ましい末端と見なされるために、同一の試料中または同一の試料のアリコート中で少なくとも複数回（例えば、３、４、５、６、７、８、９、１０、１５、２０、または５０回）検出されることを要求してもよい。関連する生理学的状態としては、人が健常であるか、疾患を有しないか、または対象となる疾患を有しないときの状態を挙げることができる。同様に、「好ましい終結ウインドウ」は、好ましい終結位置の近接した組に対応する。

【0016】

位置上で終結するＤＮＡ分子の「比率」は、ＤＮＡ分子がその位置上でどれほどの頻度で終結するかに関連する。比率は、分析されるＤＮＡ分子の数に対して正規化された位置上で終結するＤＮＡ分子の数に基づいてもよいてもよい。したがって、比率は、いくつのＤＮＡ分子がある位置上で終結するかの頻度に対応し、その位置上で終結するＤＮＡ分子の数において極大を有する位置の周期性には関連しない。

【0017】

「較正試料」は、その組織に特異的なＤＮＡ画分が既知であるか、または較正方法を介して（例えば、その組織に特異的な対立遺伝子を使用して）決定される、生体試料に対応し得る。別の例として、較正試料は、好ましい終結位置が決定され得る試料に対応し得る。較正試料は、両方の目的で使用することができる。

【0018】

「較正データ点」は、「較正値」と、対象となるＤＮＡ（すなわち、特定の組織型のＤＮＡ）の測定された比例的分布または既知の比例的分布とを含む。較正値は、その組織型の比例的分布が既知である較正試料について決定される、相対的存在量であり得る。較正データ点は、例えば、別々の点として、または較正関数（較正曲線または較正表面とも呼ばれる）として、様々な方法で定義され得る。較正関数は、較正データ点の追加の数学的変換から導出することができる。

【0019】

「配列決定深度」という用語は、ある座位がその座位に整列された配列読み取りによって網羅される回数を指す。座位は、ヌクレオチドほど小さても、染色体腕ほど大きくても、ゲノム全体ほど大きくてもよい。配列決定深度は、５０×、１００×などと表すことができ、ここで、「×」は、座位が配列読み取りで網羅される回数を指す。配列決定深度はまた、複数の座位またはゲノム全体に適用することもでき、これらの場合、×はそれぞれ、座位もしくは半数体ゲノムまたはゲノム全体が配列決定される平均回数を指し得る。超深配列決定とは、少なくとも１００×の配列決定深度を指し得る。

【0020】

「分離値」は、２つの値に関与する差異または比率に対応する。分離値は、単純な差異または比率であり得る。例として、ｘ／（ｘ＋ｙ）だけでなく、ｘ／ｙの正比例も、分離値である。分離値は、他の因子、例えば、乗法的因子を含んでもよい。他の例として、値の関数の差異または比率（例えば、２つの値の自然対数（ｌｎ）の差異または比率）も使用することができる。分離値は、差異及び比率を含んでもよい。

【0021】

「相対的存在量」は、ゲノム位置の１つのウインドウ内で終結する無細胞ＤＮＡ分子の量（１つの値）を、ゲノム位置の別のウインドウ内で終結する無細胞ＤＮＡ分子の量（他の値）に関連付ける、分離値の一種類である。２つのウインドウは重複してもよいが、異なるサイズのものである。他の実装例において、２つのウインドウは、重複しない。更に、ウインドウは１ヌクレオチド長の幅のものであり得、したがって、１つのゲノム位置に相当し得る。

【0022】

本明細書で使用される場合、「分類」という用語は、試料の特定の特性に関連付けられる任意の数（複数可）または他の文字（複数可）を指す。例えば、「＋」記号（または「正」という単語）は、試料が欠失または増幅を有するものとして分類されることを示し得る。分類は、二進法（例えば、正または負）であっても、より多いレベルの分類（例えば、１～１０または０～１の尺度）を有してもよい。「カットオフ」及び「閾値」という用語は、ある操作において使用される所定の数を指す。例えば、カットオフサイズは、それを超えると断片が除外されるサイズを指し得る。閾値は、それを超えるか、またはそれ未満であると、特定の分類が適用される値であり得る。これらの単語のうちのいずれも、これらの文脈のうちのいずれにおいても使用することができる。

【0023】

「癌のレベル」という用語は、癌が存在するかどうか（すなわち、存在もしくは不在）、癌の段階、腫瘍のサイズ、転移が存在するかどうか、身体の総腫瘍負荷、及び／または癌の重症度の他の尺度（例えば、癌の再発）を指し得る。癌のレベルは、数または他の指標（記号、アルファベット文字、及び色など）であり得る。レベルは、ゼロであってもよい。癌のレベルはまた、変異または変異の数に関連付けられる前悪性または前癌性病態（状態）を含む。癌のレベルは、様々な方法で使用することができる。例えば、スクリーニングにおいて、以前に癌を有することが既知ではない人において癌が存在するかどうかを確認することができる。評価において、癌と診断された人を調査して、癌の進行を経時的に監視するか、治療法の有効性を研究するか、または予後を決定することができる。一実施形態において、予後は、患者が癌で死亡する確率、特定の期間もしくは時間後に癌が進行する確率、または癌が転移する確率として表すことができる。検出は、「スクリーニング」を意味しても、癌の示唆的特徴（例えば、症状または他の陽性試験）を有する人が癌を有するかどうかを確認すること意味してもよい。

【0024】

「極大」は、隣接位置と比較した場合の、対象となるパラメータの最大値が得られるゲノム位置（例えば、ヌクレオチド）を指しても、そのようなゲノム位置の対象となるパラメータの値を指してもよい。例として、隣接位置は、５０塩基対～２０００塩基対の範囲であり得る。対象となるパラメータの例としては、あるゲノム位置上で終結する断片の数、その位置と重複する断片の数、または閾値サイズよりも大きいゲノム位置を網羅する断片の割合が挙げられるが、これらに限定されない。多くの極大値は、対象となるパラメータが周期的な構造を有するときに発生し得る。全体最大値は、極大値のうちの特定のものである。同様に、「極小」は、隣接位置と比較した場合の、対象となるパラメータの最小値が得られるゲノム位置を指しても、そのようなゲノム位置の対象となるパラメータの値を指してもよい。

【発明を実施するための形態】

【0025】

無細胞ＤＮＡ（例えば、血漿ＤＮＡ）の断片化パターンに影響を与える因子、及び無細胞ＤＮＡ断片化パターンの分析の、分子診断における用途を含む用途が記載される。様々な用途において、断片化パターンの特性を使用して、特定の組織型の比例的寄与を決定すること、特定の組織型（例えば、母体試料中の胎児組織もしくは癌患者に由来する試料中の腫瘍組織）の遺伝子型を決定すること、及び／または特定の組織型の好ましい終結位置を特定することができ、その後、これらを使用して、特定の組織型の比例的寄与を決定することができる。いくつかの実施形態において、特定の組織の好ましい終結位置を使用して、例えば、１単位体積当たり（例えば、１ミリリットル当たり）のゲノムの数での、試料中の特定の組織型の絶対的寄与を測定することもできる。

【0026】

比例的寄与の分類の例としては、特定のパーセンテージ、パーセンテージの範囲、または比例的寄与が特定のパーセンテージを超えるかどうかを、分類として判定することができるが挙げられる。比例的寄与の分類を決定するために、いくつかの実施形態において、特定の組織型（例えば、胎児組織または腫瘍組織）に対応する好ましい終結位置を特定することができる。そのような好ましい終結位置は、例えば、無細胞ＤＮＡ分子がゲノム位置上で終結する比率を分析すること、そのような比率を（例えば、関連する状態を有しない）他の試料と比較すること、ならびにゲノム位置のセットを、状態の違う異なる組織及び／または異なる試料の無細胞ＤＮＡ分子の末端の高い発生率と比較することによって、様々な方法で決定することもできる。他のゲノム位置で終結する無細胞ＤＮＡ分子と比較して、好ましい終結位置で終結する無細胞ＤＮＡ分子の相対的存在量は、特定の組織型の比例的寄与が既知である１つ以上の較正生体試料から決定される、１つ以上の較正値と比較することができる。本明細書に提供されるデータは、相対的存在量の様々な尺度と、試料中の様々な組織の比例的寄与との間の正の関係を示す。

【0027】

比例的寄与の分類を決定するために、いくつかの実施形態において、断片化パターン（例えば、あるゲノム位置で終結する無細胞ＤＮＡ分子の数）の振幅を使用することができる。例えば、複数のゲノム位置で終結する無細胞ＤＮＡ分子の数を分析することによって、１つ以上の極小値及び１つ以上の極大値を特定することができる。１つ以上の極大値での第１の数の無細胞ＤＮＡ分子、及び１つ以上の極小値での第２の数の無細胞ＤＮＡ分子の分離値（例えば、比率）は、特定の組織型の比例的寄与と正の関連があることが示される。

【0028】

いくつかの実施形態において、対象となる組織の濃度は、無細胞ＤＮＡ試料の体積または重量に関して測定することができる。例えば、定量的ＰＣＲを使用して、抽出された無細胞ＤＮＡ試料の単位体積または単位重量当たりの、１つ以上の好ましい末端で終結する無細胞ＤＮＡ分子の数を測定することができる。類似した測定を較正試料について行ってもよく、したがって、寄与は単位体積または単位重量当たりの濃度であるため、比例的寄与を比例的寄与として決定してもよい。

【0029】

異なる組織型に由来する無細胞ＤＮＡの混合物中の特定の組織型（例えば、胎児組織または腫瘍組織）の遺伝子型を決定するために、いくつかの実施形態において、その特定の組織型の好ましい終結位置を特定することができる。好ましい終結位置上で終結する無細胞ＤＮＡ分子のセットの各無細胞ＤＮＡ分子について、好ましい終結位置で生じる対応する塩基が決定され得る。対応する塩基を使用して、例えば、見られる異なる塩基のパーセンテージに基づいて、好ましい終結位置の遺伝子型を決定することができる。様々な実装例において、１つの塩基のみの高いパーセンテージ（例えば、９０％超）は、その塩基の遺伝子型がホモ接合であることを示し得る一方で、類似したパーセンテージ（例えば、３０～７０％の間）を有する２つの塩基は、遺伝子型がヘテロ接合であるという決定をもたらし得る。

【0030】

好ましい終結位置を特定するために、いくつかの実施形態において、無細胞ＤＮＡ分子の左末端の極大を無細胞ＤＮＡ分子の右末端の極大と比較してもよい。対応する極大が十分に分離している場合、好ましい終結位置を特定することができる。更に、左／右末端の極大上で終結する無細胞ＤＮＡ分子の量を、低い分離を有する極大の無細胞ＤＮＡ分子の量と比較して、組織型の比例的寄与を決定することができる。

【0031】

以下の記述において、断片化の概要及び技術がまず記載され、その後、断片化パターンの詳述及びその定量化の例、ならびに比例的寄与の決定、好ましい終結位置の特定、及び遺伝子型の決定に関する記述が更に記載される。

【0032】

Ｉ．断片化の概要及び技術
本開示において、我々は、無細胞ＤＮＡの非ランダム断片化プロセスが存在することを示す。非ランダム断片化プロセスは、ある程度まで無細胞ＤＮＡを含有する様々な種類の生体試料（例えば、血漿、血清、尿、唾液、脳脊髄液、胸膜液、羊膜液、腹水（ｐｅｒｉｔｏｎｅａｌｆｌｕｉｄ）、及び腹水（ａｓｃｉｔｉｃｆｌｕｉｄ））中で起こる。無細胞ＤＮＡは、短断片の形態で天然に存在する。無細胞ＤＮＡ断片化は、無細胞ＤＮＡ分子が生成または放出されるとき、高分子量ＤＮＡ（細胞の核内のＤＮＡなど）が短断片に切断、破壊、または消化されるプロセスを指す。

【0033】

全ての無細胞ＤＮＡ分子が同じ長さであるわけではない。いくつかの分子は、他の分子よりも短い。血漿ＤＮＡなどの無細胞ＤＮＡは一般に、転写開始部位周辺を含む開いたクロマチンドメイン内で、及びヌクレオソームコア間の位置（リンカー位置など）で、より短く、かつよりインタクトではない、すなわち、不良なインタクト確率である（またはより不調な統合性である）ことが示されている（ＳｔｒａｖｅｒｅｔａｌＰｒｅｎａｔＤｉａｇｎ２０１６，３６：６１４－６２１）。各異なる組織は、その特徴的遺伝子発現プロファイルを有し、これは転じて、クロマチン構造及びヌクレオソーム配置を含む手段によって制御される。したがって、特定のゲノム位置でのインタクト確率または統合性の無細胞ＤＮＡパターン（血漿ＤＮＡのものなど）は、それらのＤＮＡ分子の原発組織のシグネチャーまたは証明である。同様に、疾患プロセス、例えば、癌が、遺伝子発現プロファイル及び細胞のゲノムの機能を変化させる場合、疾患を有する細胞に由来する無細胞ＤＮＡのインタクトな確率プロファイルは、それらの細胞を反映するだろう。それ故に、無細胞ＤＮＡプロファイルは、疾患の存在の証拠を提供するか、またはその証明であるだろう。

【0034】

いくつかの実施形態は、無細胞ＤＮＡ断片化のプロファイルを研究するための解像度を更に改良する。一続きのヌクレオチドにわたる読み取りを単に合計して、より高いまたはより低いインタクト確率または統合性を有する領域を特定する代わりに、我々は、個々の無細胞ＤＮＡ分子、特に血漿ＤＮＡ分子の実際の終結位置または終端を研究した。注目すべきことに、我々のデータは、無細胞ＤＮＡ分子が切断される場所の特定の位置が、ランダムではないことを明らかにする。インビトロで剪断または超音波処理されている高分子量ゲノム組織ＤＮＡは、終結位置がゲノムにわたってランダムに散乱したＤＮＡ分子を示す。しかしながら、血漿などの試料内で高度に提示される無細胞ＤＮＡ分子の特定の終結位置が存在する。そのような終結位置の発生率または提示の数は、偶然のみから期待されるよりも統計学的に有意に高い。これらのデータによって、無細胞ＤＮＡ断片化についての我々の理解は、統合性の領域的変動の理解を一歩超えるものとなる（ＳｎｙｄｅｒｅｔａｌＣｅｌｌ２０１６，１６４：５７－６８）。ここで、我々は、切断（ｃｕｔｔｉｎｇ）または切断（ｃｌｅａｖａｇｅ）の特定のヌクレオチド位置まですら、無細胞ＤＮＡ断片化のプロセスが組織化されていることを示す。我々は、無細胞ＤＮＡ終結位置のこれらの非ランダム位置を、好ましい終結位置または好ましい末端と呼ぶ。

【0035】

本開示において、我々は、異なる生理学的状態または疾患状態を有する個体にわたって一般的に生じる無細胞ＤＮＡ終結位置が存在することを示す。例えば、妊娠している個体及び妊娠していない個体によって共有される、妊娠中の患者及び癌患者によって共有される、癌を有する個体及び癌を有しない個体によって共有される、一般的に好ましい末端が存在する。他方、主に妊婦においてのみ、癌患者においてのみ、または癌を有しない妊娠していない個体においてのみ生じる、好ましい末端が存在する。興味深いことに、これらの妊娠に特異的な末端または癌に特異的な末端または疾患に特異的な末端はまた、同等の生理学的状態または疾患状態を有する他の個体においても高度に提示される。例えば、１人の妊婦の血漿中に特定される好ましい末端は、他の妊婦の血漿中にも検出可能である。更に、そのような好ましい末端の割合の量は、他の妊婦の血漿中の胎児ＤＮＡ画分と相関した。そのような好ましい末端の量は、出産後の母体血漿試料中で実質的に減少するため、それらは実際、妊娠または胎児に関連付けられる。同様に、癌において、１人の癌患者の血漿中に特定される好ましい末端は、別の癌患者の血漿中にも検出可能である。更に、そのような好ましい末端の割合の量は、他の癌患者の血漿中の腫瘍ＤＮＡ画分と相関した。そのような好ましい末端の量は、癌の治療（例えば、外科的切除）後に減少するため、それらは、癌に関連付けられる。

【0036】

無細胞ＤＮＡの好ましい末端の分析には、いくつかの用途または有用性が存在する。それらは、妊娠における胎児ＤＮＡ画分、及びそれ故に胎児の健康についての情報を提供することができる。例えば、いくつかの妊娠関連障害（妊娠高血圧腎症、早期分娩、子宮内胎児発育遅延（ＩＵＧＲ）、胎児染色体異数性、及び他など）は、妊娠期間の適合した対照妊娠と比較して、胎児ＤＮＡの画分濃度（すなわち、胎児ＤＮＡ画分または胎児画分）の撹乱に関連付けられることが報告されている。癌に関連付けられる無細胞血漿ＤＮＡの好ましい末端は、血漿試料中の腫瘍ＤＮＡ画分または画分濃度を明らかにする。腫瘍ＤＮＡ画分を知ることは、癌の段階についての情報、予後、及び治療有効性または癌の再発を監視する上での援助を提供する。無細胞ＤＮＡの好ましい末端のプロファイルはまた、無細胞ＤＮＡを含有する生体試料（例えば、血漿）にＤＮＡを寄与する組織の組成も明らかにするだろう。したがって、癌または他の病理（例えば、脳血管発作（すなわち、卒中）、全身性エリテマトーデスの臓器症状）の原発組織を特定できる可能性がある。

【0037】

特定の生理学的状態または病理学的状態に関連する好ましい末端の目録は、異なる生理学的状態または病理学的状態を有する個体間の好ましい末端の無細胞ＤＮＡプロファイルを比較すること（例えば、妊娠していない試料と妊娠している試料との比較、癌試料と非癌試料との比較、または癌を有しない妊婦のプロファイルと妊娠していない癌患者のプロファイルとの比較）によって特定することができる。別のアプローチは、異なる生理学的（例えば、妊娠）または病理学的（例えば、癌）プロセスの時点での好ましい末端の無細胞ＤＮＡプロファイルを比較することである。そのような時点の例としては、妊娠前及び後、胎児の出産前及び後、妊娠中の異なる妊娠期間にわたって収集された試料、癌の治療（例えば、標的化療法、免疫療法、化学療法、手術）前及び後、癌の診断後の異なる時点、癌の進行前及び後、転移の発症前及び後、疾患の重症度の増加前及び後、または合併症の発症前及び後が挙げられる。

【0038】

更に、好ましい末端は、特定の組織に関連する遺伝子マーカーを使用して特定することができる。例えば、胎児に特異的なＳＮＰ対立遺伝子を含有する無細胞ＤＮＡ分子は、母体血漿などの試料中で胎児に特異的な好ましい末端を特定するのに有用であるだろう。逆も同様に、母体に特異的なＳＮＰ対立遺伝子を含有する血漿ＤＮＡ分子は、母体血漿中で母体に特異的な好ましい末端を特定するのに有用であるだろう。腫瘍に特異的な変異を含有する血漿ＤＮＡ分子を使用して、癌に関連付けられる好ましい末端を特定することができる。臓器移植の文脈において、ドナーまたはレシピエントのいずれかに特異的なＳＮＰ対立遺伝子を含有する血漿ＤＮＡ分子は、移植された臓器または移植されていない臓器の好ましい末端を特定するのに有用である。例えば、ドナーに特異的なＳＮＰ対立遺伝子は、移植された臓器に代表的な好ましい末端を特定するのに有用であるだろう。

【0039】

好ましい末端は、それがある生理学的状態または病理学的状態において検出される尤度または確率が高いときに、その生理学的状態または疾患状態に関連すると見なすことができる。他の実施形態において、好ましい末端は、他の状態よりも、関連する生理学的状態または病理学的状態において特定の確率で検出される可能性が高い。関連する生理学的状態または疾患状態において好ましい末端を検出する確率はより高いため、そのような好ましい末端もしくは反復末端（または終結位置）は、その同一の生理学的状態または疾患状態を有する２人以上の個体において見られるだろう。高い確率はまた、そのような好ましい末端または反復末端を、同一の個体の同一の無細胞ＤＮＡ試料またはアリコート中で何度も検出可能にするだろう。いくつかの実施形態において、好ましい末端と見なされるために、同一の試料または同一の試料アリコート内で少なくとも特定の回数（例えば、５、１０、１５、２０回など）検出される末端の包含を制限するように、定量的閾値が設定されてもよい。

【0040】

任意の生理学的状態または病理学的状態について、無細胞ＤＮＡの好ましい末端の目録が確立された後、標的化方法または非標的化方法を使用して、無細胞ＤＮＡ試料（例えば、血漿）中のそれらの存在を検出すること、または他の個体が、類似した健康状態、生理学的状態、もしくは疾患状態を有する試験された他の個体の分類を決定することができる。無細胞ＤＮＡの好ましい末端は、ランダム非標的化配列決定によって検出することができる。関連する好ましい末端の全てまたは一部分を特定する適切な確率が達成され得るように、配列決定深度が考慮される必要があるだろう。あるいは、高密度の好ましい末端を有する座位のハイブリダイゼーション捕捉を無細胞ＤＮＡ試料上に実行して、配列決定、マイクロアレイ、またはＰＣＲによるが、これらに限定されない検出に従って、そのような好ましい末端を有する無細胞ＤＮＡ分子を有する試料を富化してもよい。更に、あるいは、増幅に基づくアプローチ（例えば、逆ＰＣＲ、ローリングサークル増幅）を使用して、好ましい末端を有する無細胞ＤＮＡ分子を特異的に増幅し、富化してもよい。増幅生成物は、配列決定、マイクロアレイ、蛍光プローブ、ゲル電気泳動、及び当業者にとって既知である他の標準的アプローチによって特定することができる。

【0041】

実際には、１つの末端位置が、超並列配列決定もしくは次世代配列決定、単一分子配列決定、二本鎖もしくは一本鎖ＤＮＡ配列決定ライブラリ調製プロトコル、ＰＣＲ、ＤＮＡ増幅の他の酵素的方法（例えば、等温増幅）、またはマイクロアレイなどであるが、これらに限定されない分析的方法によって検出または決定される、無細胞ＤＮＡ分子の１つの先端上の最外側塩基のゲノム座標またはヌクレオチド同一性であり得る。そのようなインビトロ技術は、無細胞ＤＮＡ分子の真のインビボ物理的末端（複数可）を変化させ得る。したがって、各検出可能な末端は、生物学的に真の末端を提示し得るか、または末端は、分子の元の末端から１つ以上のヌクレオチド内向き、もしくは１つ以上のヌクレオチド長伸長している。例えば、クレノウ断片は、５’オーバーハングの平滑末端化及び３’オーバーハングの充填によって、ＤＮＡ配列決定ライブラリ構築中に平滑末端化末端二本鎖ＤＮＡ分子を作製するために使用される。そのような手順は、生物学的末端と同一ではない無細胞ＤＮＡの末端位置を明らかにし得るものの、依然として臨床的関連性が確立され得る。これは、好ましいものが特定の生理学的状態または病理学的状態に関連しているか、またはそれに関連付けられることを特定することが、較正試料（複数可）及び試験試料（複数可）中で無細胞ＤＮＡ末端に一貫的かつ再現可能な変化をもたらす、同一の実験プロトコルまたは方法論的原理に基づき得るためである。いくつかのＤＮＡ配列決定プロトコルは、一本鎖ＤＮＡライブラリを使用する（ＳｎｙｄｅｒｅｔａｌＣｅｌｌ２０１６，１６４：５７－６８）。一本鎖ライブラリの配列読み取りの末端は、二本鎖ＤＮＡライブラリの末端よりも更に内向きであっても、伸長していてもよい。

【0042】

末端位置のゲノム同一性またはゲノム座標は、配列読み取りを、ヒト基準ゲノム、例えば、ｈｇ１９に整列させた結果から導出してもよい。それは、ヒトゲノムの元の座標を表す指標またはコードの目録から導出してもよい。無細胞ＤＮＡ分子の一端または両端はヌクレオチドである一方で、末端の検出は、血漿ＤＮＡ分子上の他のヌクレオチドまたは他の一続きのヌクレオチドの認識を通して行うことができる。例えば、増幅産物の中間塩基に結合する蛍光プローブを介して検出される好ましい末端を有する血漿ＤＮＡ分子の正の増幅。例えば、末端は、断片サイズが既知である血漿ＤＮＡ分子の中間区分上のいくつかの塩基に結合する蛍光プローブの、正のハイブリダイゼーションによって特定することができる。このように、いくつの塩基が、既知の配列及びゲノム同一性を有する蛍光プローブの外部にあるかを解明することによって、ある末端のゲノム同一性またはゲノム座標を決定することができる。換言すると、末端は、同一の血漿ＤＮＡ分子上の他の塩基の検出を通して特定または検出することができる。末端は、標的に特異的なプローブ、ミニ配列決定、及びＤＮＡ増幅（これらに限定されない）によって読み取られる無細胞ＤＮＡ分子上の位置またはヌクレオチド同一性であり得る。

【0043】

ＩＩ．血漿ＤＮＡの断片化パターン
母体血漿ＤＮＡの断片化パターンの分析のために、我々は、ＤｅｐａｒｔｍｅｎｔｏｆＯｂｓｔｅｔｒｉｃｓａｎｄＧｙｎａｅｃｏｌｏｇｙから募集した、妊娠１２週目の妊婦に由来する血漿ＤＮＡを配列決定した（Ｌｏｅｔａｌ．ＳｃｉＴｒａｎｓｌＭｅｄ２０１０；２（６１）：６１ｒａ９１）。母親から得られた血漿ＤＮＡを、ＩｌｌｕｍｉｎａＧｅｎｏｍｅＡｎａｌｙｚｅｒプラットフォームを使用して超並列配列決定に供した。他の超並列配列決定装置または単一分子配列決定装置を使用してもよい。血漿ＤＮＡ分子のペアードエンド配列決定を実行した。各分子を、各末端で５０塩基対（したがって、１分子当たり合計１００塩基対）について配列決定した。ＳＯＡＰ２プログラムを使用して、各配列の２つの末端を基準ヒトゲノム（Ｈｇ１８ＮＣＢＩ．３６）に整列させた（ＬｉＲｅｔａｌ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２００９，２５：１９６６－７）。父親及び母親の軟膜試料ならびにＣＶＳ試料から、ＤＮＡも抽出した。ＡｆｆｙｍｅｔｒｉｘＧｅｎｏｍｅ－ＷｉｄｅＨｕｍａｎＳＮＰＡｒｒａｙ６．０システムを使用して、これらのＤＮＡ試料の遺伝子型を同定した。

【0044】

Ａ．断片化の例示的定量化
断片化パターンを反映するために、母体血漿ＤＮＡの配列決定結果に基づいて、ゲノムの各ヌクレオチドについてインタクト確率（Ｐ_Ｉ）が決定され得る。

【数1】

式中、Ｎ_ｚは、標的ヌクレオチドの両側（５’及び３’）で少なくともｚ個のヌクレオチド（ｎｔ）を網羅する完全長の配列決定された読み取りの数であり、Ｎ_Ｔは、標的ヌクレオチドを網羅する配列決定された読み取りの総数である。

【0045】

Ｐ_Ｉの値は、ｚの値の２倍に１を加えた（２ｚ＋１）長さを有して、インタクトなＤＮＡ分子が特定の位置で中央にある確率を反映し得る。インタクト確率（Ｐ_Ｉ）の値がより高いほど、血漿ＤＮＡが特定のヌクレオチド位置で断片化される可能性はより低くなる。これを更に説明するために、インタクト確率の定義を図１に説明する。

【0046】

図１は、インタクト確率（Ｐ_Ｉ）の定義の一例示的な例を示す。Ｔは、Ｐ_Ｉが計算される標的ヌクレオチドの位置である。Ａ及びＢはそれぞれ、Ｔのｚヌクレオチド（ｎｔ）上流（５’）及びｚヌクレオチド下流（３’）の２つの位置である。ａからｊまで標識された黒線は、母体血漿に由来する配列決定された血漿ＤＮＡ断片を表す。断片ａ～ｄは、３つ全ての位置Ａ、Ｂ、及びＴを網羅する。したがって、標的ヌクレオチド（Ｎ_ｚ）の両側（５’及び３’）の少なくともｚヌクレオチドを網羅する断片の数は、４である。更に、断片ｅ、ｆ、及びｇはまた、位置Ｔも網羅するが、それらは、位置Ａ及びＢの両方は網羅しない。したがって、位置Ｔを網羅する合計７つの断片が存在する（Ｎ_Ｔ＝７）。断片ｈ及びｊは、ＡまたはＢのいずれかを網羅するが、Ｔは網羅しない。これらの断片は、Ｎ_ｚまたはＮ_Ｔにおいて計数されない。したがって、この特定の例におけるＰ_Ｉは、４／７（５７％）である。

【0047】

一実施形態において、Ｐ_Ｉは、２５をｚの値として使用して計算することができる。したがって、インタクトな血漿ＤＮＡ断片は、標的位置の少なくとも２５ｎｔ上流から標的位置の２５ｎｔ下流までを網羅する断片として定義されるだろう。他の実施形態において、例えば、１０、１５、２０、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、及び８０であるが、これらに限定されない他のｚの値を使用してもよい。

【0048】

Ｐ_Ｉは、ゲノム位置のウインドウ内で終結する無細胞ＤＮＡ分子の相対的存在量の一例である。他の測定基準、例えば、インタクトなＤＮＡ分子を有する確率と逆の関係を有するＰ_Ｉの逆数を使用してもよい。Ｐ_Ｉの逆数のより高い値は、終結位置または終結ウインドウである確率がより高いことを示すだろう。一例は、終結ＤＮＡ断片の測定された数対終結ＤＮＡ断片の期待数のｐ値、全ての整列されたＤＮＡ断片外で終結するＤＮＡ断片の割合、または好ましい末端終結比（ＰＥＴＲ）の割合であり、これらの全てが、以下により詳細に記載される。相対的存在量の全てのそのような測定基準は、無細胞ＤＮＡ断片が、例えば、２ｚ＋１（式中、ｚはゼロであり得る）の幅を有するウインドウ内で終結する比率を測定し、それにより、そのウインドウがゲノム位置に相当するようにする。

【0049】

Ｂ．断片化パターンの周期性
ゲノムの特定の領域は、特定の組織中でより高い比率（頻度）の染色体領域の破損を受けやすく、したがって、より高い比率のその領域内のウインドウ内で終結する無細胞ＤＮＡ断片を有する。相対的存在量のプロットは、周期的構造を有し得る断片化パターンを示す。周期的構造は、最大終結位置（高切断）の位置及び最小終結位置（低切断）の位置を示す。Ｐ_Ｉを使用するとき、最大値は低切断のウインドウに対応するが、これは、Ｐ_Ｉが切断確率（終結位置確率）とは対照的にインタクト確率を測定するためであり、これらは互いに逆の関係を有する。

【0050】

図２Ａ及び２Ｂは、本発明の実施形態に従う、２５をｚの値として使用する、染色体６上のセグメントにわたるＰ_Ｉの変動を示す。図２Ａにおいて、Ｐ_Ｉの変動は、左側の記号表に示されるように、異なる強度の灰色で示される。図２Ｂにおいて、Ｐ_Ｉの変動は、より短いセグメントで可視化される。ｘ軸は、ヌクレオチド（ｎｔ）におけるゲノム座標であり、ｙ軸は、Ｐ_Ｉである。Ｐ_Ｉの変動は、約１８０塩基対の明確な周期性を有する。

【0051】

Ｃ．母体血漿中の母体ＤＮＡ及び胎児ＤＮＡのＰ_Ｉの同調変動
Ｐ_Ｉは、約１８０塩基対の周期性をもってゲノムにわたって変動する一方で、我々は、Ｐ_Ｉの変動が胎児由来血漿ＤＮＡ分子及び母体由来血漿ＤＮＡ分子で同調するかどうかを更に調査した。同調変動は、ＰＩのピーク（極大）及びトラフ（極小）が、ゲノムを通して、または十分に高い割合のゲノムで、同一の相対ヌクレオチド位置で生じることを意味する。十分に高い割合を定義するための閾値は、特定の用途について調節されてもよく、例えば、＞２０％、＞２５％、＞３０％、＞３５％、＞４０％、＞４５％、＞５０％、＞５５％、＞６０％、＞６５％、＞７０％、＞７５％、＞８０％、＞８５％、＞９０％、及び＞９５％であるが、これらに限定されない。以下の２つの図（図３及び図４）は、母体血漿中の母体由来ＤＮＡ及び胎児由来ＤＮＡのＰ_Ｉの変動間の、２つの可能性のある関係を示す。

【0052】

図３は、母体血漿中の母体由来ＤＮＡ及び胎児由来ＤＮＡのＰ_Ｉの同調変動の説明を示す。Ｐ_Ｉのピーク及びトラフは、ゲノムにわたって、またはゲノムのほとんどの部分で、母体ＤＮＡ及び胎児ＤＮＡについて同一の相対位置で生じる。領域内に同調変動が存在した場合、胎児由来ＤＮＡ及び母体由来ＤＮＡは、同一の断片化パターンを有し、それにより、組織型のうちの１つのシグネチャーとしての、領域内の断片化パターンの周期性の使用を妨害するだろう。

【0053】

図４は、母体血漿中の母体由来ＤＮＡ及び胎児由来ＤＮＡのＰ_Ｉの非同調変動の説明を示す。母体ＤＮＡ及び胎児ＤＮＡのＰ_Ｉのピーク及びトラフは、ゲノムにわたって一定の相対関係を有しない。領域Ｉで、母体ＤＮＡのＰ_Ｉのピークは、胎児ＤＮＡのピークと一致する。領域ＩＩで、母体ＤＮＡのＰ_Ｉのピークは、胎児ＤＮＡのトラフと一致する。領域ＩＩＩ及びＩＶで、母体ＤＮＡのＰ_Ｉのピークは、胎児ＤＮＡのピークと胎児ＤＮＡのトラフとの間である。変動が同調しなかった場合、胎児断片化パターン及び母体断片化パターンにおけるそのような差異をシグネチャーとして使用して、胎児または母親に由来する可能性が高いＤＮＡを特定することができる。更に、以下により詳細に記載されるように、そのような差異を使用して、胎児組織または母体組織の比例的寄与を決定することができる。例えば、領域ＩＩ内のピークのうちの１つで終結するＤＮＡ断片は、胎児ＤＮＡである可能性がより高く、他のゲノム位置と比較して、そのようなピークで終結するＤＮＡ断片の相対的存在量は、胎児ＤＮＡ画分の増加とともに増加するだろう。

【0054】

図５は、母体ＤＮＡ分子及び胎児ＤＮＡ分子が、Ｐ_Ｉの変動において同調するかどうかについての分析５００の流れ図である。分析５００は、母体血漿中の母体由来ＤＮＡと胎児由来ＤＮＡとの間でＰＩの変動が同調するかどうかを調査する。分析５００は、コンピュータシステムを使用してもよい。上述のように、分析５００は配列決定を使用して実行したものの、例えば、本明細書に記載される他の技術を使用してもよい。

【0055】

ブロック５１０で、分析５００は、妊婦がホモ接合（ＡＡ）であり、胎児がヘテロ接合（ＡＢ）であるＳＮＰを特定する。これらのＳＮＰは、情報提供的ＳＮＰと呼ばれる。Ｂ対立遺伝子は、胎児に特異的な対立遺伝子である。そのような情報提供的ＳＮＰは、母体起源のみまたは主に母体起源の母体試料を分析することによって特定することができる。白血球細胞は主に母親に由来するものであるため、例えば、血液試料の軟膜を使用してもよい。唯一のヌクレオチド（または胎児ＤＮＡ画分に依存し得る、高パーセンテージ（例えば、８０％超）の１つのヌクレオチド）が出現するゲノム位置は、母親においてホモ接合であるものとして特定することができる。血漿を分析して、別の対立遺伝子が特定された十分なパーセンテージのＤＮＡ断片が特定される、母親においてホモ接合である位置を特定することができる。

【0056】

ブロック５２０で、胎児に特異的な対立遺伝子Ｂを有する血漿ＤＮＡ分子を特定した。これらのＤＮＡ分子は、対立遺伝子Ｂの特定の結果として胎児組織に対応するものとして特定することができる。

【0057】

ブロック５３０で、母体血漿中の無細胞ＤＮＡのＰ_Ｉの値を決定した。Ｐ_Ｉのこれらの値は、胎児ＤＮＡ及び母体ＤＮＡを含む。所与のゲノム位置のＰ_Ｉの値を、基準ゲノムのそのゲノム位置に整列された配列読み取りを分析することによって得た。

【0058】

ブロック５４０で、ブロック５３０の出力を分析することによって、Ｐ_Ｉのピークを決定した。ピークは様々な方法で特定することができ、各ピークは１つのゲノム位置のみに制限されても、２つ以上のゲノム位置に対応してもよい。我々は、母体血漿中のほぼ母体由来のＤＮＡについて、Ｐ_Ｉが、約１８０塩基対の周期性を有する正弦様パターンで、ゲノム全体にわたって変動することを観察した。

【0059】

ブロック５５０で、情報提供的ＳＮＰと全母体血漿の最も近いＰ_Ｉ（ブロック５４０）との間の距離を決定した。我々は、主に妊婦自身に由来した全血漿ＤＮＡのＰ_Ｉ変動の最も近いピークに対する、ＳＮＰの位置を特定した。

【0060】

ブロック５６０で、胎児由来ＤＮＡ断片の全てを凝集した。胎児に特異的な対立遺伝子を担持する全ての検出された血漿ＤＮＡ断片を凝集して、胎児由来ＤＮＡのＰ_Ｉを計算した。その後、全母体血漿ＤＮＡの最も近いＰ_Ｉピークの位置を参照して、凝集された胎児由来ＤＮＡ断片のＰ_Ｉを計算した。全母体血漿ＤＮＡのＰ_Ｉの計算に類似した様式で、胎児由来ＤＮＡのＰ_Ｉの計算を実行した。

【0061】

ブロック５７０で、全母体血漿ＤＮＡのＰ_Ｉのピークに関する、胎児由来ＤＮＡ断片のＰ_Ｉの変動を決定した。変動を図６に示す。

【0062】

図６は、母体血漿試料中の胎児由来ＤＮＡ断片（赤色／灰色）及び全ＤＮＡ断片（青色／黒色）のＰ_Ｉの変動の２つの母体血漿試料（Ｓ２４及びＳ２６）の分析を示す。縦軸は、Ｐ_Ｉをパーセンテージとして示す。横軸は、情報提供的ＳＮＰとＰ_Ｉの最も近いピークとの間の、塩基対（ｂｐ）における距離を示す。

【0063】

合計値は、胎児ＤＮＡ及び母体ＤＮＡからの寄与を含む。合計値は、全てのピークＰ_Ｉにわたって凝集される。理解することができるように、ＳＮＰがピークＰ_Ｉにより近いほど、Ｐ_Ｉの値はより高くなる。実際、胎児由来ＤＮＡ断片について、ピークＰ_Ｉは約０位に位置した。したがって、Ｐ_Ｉは、母体由来ＤＮＡ断片及び胎児由来ＤＮＡ断片について、およそ同一の位置でピークとなった。これらのデータから、我々は、母体由来ＤＮＡ及び胎児由来ＤＮＡのＰ_Ｉの変動は同調すると結論付ける。

【0064】

断片化パターンは同調するように見えるものの、以下の記述は、周期性以外の他の特性を使用して、断片化パターンを区別し、それにより、特定の組織型のシグネチャーの決定を可能にすることができることを示す。例えば、特定のゲノム領域のピーク及びトラフの振幅の差異が見出されており、それにより、それらの領域内の特定の位置を使用して、組織に特異的な断片化パターンを決定することが可能となっている。

【0065】

Ｄ．血漿ＤＮＡの断片化パターンの変動に影響を与える因子
以前の研究において、血漿ＤＮＡの断片化はＴＳＳの近くではランダムではないことが示された（Ｆａｎｅｔａｌ．ＰＮＡＳ２００８；１０５：１６２６６－７１）。任意の血漿ＤＮＡが特定のヌクレオチド上で終結する確率は、およそヌクレオソームのサイズの周期性をもって、ＴＳＳまでの距離とともに変動するだろう。この断片化パターンは、ＤＮＡのアポトーシス分解の結果であると一般に考えられた。したがって、血漿ＤＮＡのサイズは一般に、ヒストン複合体に関連するＤＮＡのサイズに似ている。

【0066】

以前の研究において、血漿ＤＮＡのサイズが一般に、ヌクレオソームに関連するＤＮＡのサイズに似ていることも示された（Ｌｏｅｔａｌ．ＳｃｉＴｒａｎｓｌＭｅｄ２０１０；２（６１）：６１ｒａ９１）。血漿ＤＮＡは、細胞ＤＮＡ（核ＤＮＡ及びミトコンドリアＤＮＡ）のアポトーシス分解を通して生成されるであると考えられる。この考え方は、ミトコンドリアＤＮＡは細胞内のヒストンに関連付けられないため、循環ミトコンドリアＤＮＡにおいてこのヌクレオソームパターンが欠如することによって更に支持される。血漿ＤＮＡ断片が終結するヌクレオチド位置は、転写開始部位近くではランダムではないことが示された（Ｆａｎｅｔａｌ．ＰＮＡＳ２００８；１０５：１６２６６－７１）ものの、血漿ＤＮＡの断片化パターンを支配する正確な機構は、依然として不明確なままである。

【0067】

近年、異なる配列文脈を有する領域内で、血漿ＤＮＡのサイズが異なることが更に示されている（Ｃｈａｎｄｒａｎａｎｄａｅｔａｌ．ＢＭＣＭｅｄＧｅｎｏｍｉｃｓ２０１５；８：２９）。後者のデータはまた、無細胞ＤＮＡ断片が、ヌクレオソームコアでよりも、ヌクレオソームリンカー領域上で開始し、終結する可能性が高いという以前の仮説を支持する。これらの発見は、以前の節において論じた、インタクト確率におけるヌクレオチド対ヌクレオチドの変動についての我々の発見と一貫する。ここで、我々は、インタクト確率における変動の振幅が異なるゲノム領域にわたって変動すると更に仮定する。断片化の可変性におけるこの領域対領域の変動は、いかなる以前の研究においても適切には調査または定量化されていない。以下の図は、Ｐ_Ｉの局所的変動及び領域的変動の概念を説明する。

【0068】

図７は、Ｐ_Ｉの変動の振幅の説明を示す。以前の節において、我々は、短い一続きのＤＮＡ上のＰ_Ｉの正弦様パターンの変動を実証した。ここで、我々は、より大きなゲノム領域にわたる変動の振幅を更に分析する。変動の振幅は、特定のサイズを有する特定の領域での、Ｐ_Ｉの最高ピーク変動とトラフ変動との間のＰ_Ｉの差異を指す。一実施形態において、特定の領域のサイズは、１０００塩基対であり得る。他の実施形態において、他のサイズ（例えば、６００塩基対、８００塩基対、１５００塩基対、２０００塩基対、３０００塩基対、５０００塩基対、及び１００００塩基対であるが、これらに限定されない）を使用してもよい。

【0069】

図７に示されるように、領域１の振幅は、領域２の振幅よりも高い。この挙動は、以下のデータにおいて見られる。そのような高い振幅の発生が、異なる組織の異なるゲノム領域で生じる場合、組織型間で振幅が異なる領域を分析するとき、振幅の測定を使用して、組織型の比例的寄与を決定することができる。例えば、異なる組織型について振幅が異なる場合、比例的寄与は、特定の組織型（例えば、胎児組織または腫瘍組織）に由来するＤＮＡの量の増加とともに比例的に変動するだろう。したがって、振幅の尺度は、特定の比例的寄与に対応するだろう。実施形態において、米国特許公開第２００９／００８７８４７号、同第２０１１／０２７６２７７号、同第２０１１／０１０５３５３号、同第２０１３／０２３７４３１号、及び同第２０１４／０１００１２１号（これらの全体が参照により組み込まれる）に記載されるような、比例的寄与が別の技術を介して（例えば、対立遺伝子、メチル化シグネチャー、増幅／欠失の程度の分析によって）測定される試料に由来する較正データを使用してもよい。

【0070】

我々の配列決定データにおいて、我々は、Ｐ_Ｉの変動の振幅が異なるゲノム領域にわたって変動することを観察した。我々は、Ｐ_Ｉの変動の振幅が、アポトーシス中の分解に対するクロマチンのアクセス可能性に関係すると仮定する。したがって、我々は、変動の振幅と、ゲノム内のデオキシリボヌクレアーゼ高感受性部位との間の可能性のある関係を調査した。以前の研究において、血漿ＤＮＡの断片化パターンは、ＴＳＳに対するその相対位置によって影響されることが観察された。我々の分析において、我々は、血漿ＤＮＡの断片化パターンの効果に対する、ＴＳＳ及びデオキシリボヌクレアーゼ高感受性部位の相対的重要性を調査した。振幅が試験される組織に対応する、他の部位を使用してもよい。そのような種類の部位の一例は、ハイスループット配列決定でのトランスポサーゼアクセス可能クロマチンのためのアッセイ（ＡＴＡＣ－Ｓｅｑ）（Ｂｕｅｎｒｏｓｔｒｏｅｔａｌ．ＮａｔＭｅｔｈｏｄｓ２０１３；１０：１２１３－１２１８）を使用して特定されるものである。そのような種類の部位の別の例は、小球菌ヌクレアーゼ（ＭＮａｓｅ）を使用して特定されるものである。

【0071】

我々は、２つの種類のゲノム領域内のＰ_Ｉ変動の振幅を比較した。
ｉｉ．ＴＳＳであるが、デオキシリボヌクレアーゼ高感受性部位ではない領域、及び
ｉｉｉ．デオキシリボヌクレアーゼ高感受性部位であるが、ＴＳＳではない領域。

【0072】

ＴＳＳ及びデオキシリボヌクレアーゼ高感受性部位の座標を、ＥＮコードデータベース（ｇｅｎｏｍｅ．ｕｃｓｃ．ｅｄｕ／ＥＮＣＯＤＥ／ｄｏｗｎｌｏａｄｓ．ｈｔｍｌ）から検索した。

【0073】

ＴＳＳ及びデオキシリボヌクレアーゼＩ部位周辺のＰ_Ｉパターンを、以下のアプローチを使用してプロファイル化した。
１）標的とする基準部位周辺の上流及び下流の２ｋｂ領域を回収する。
２）その後、基準部位までの距離に従って、絶対ゲノム座標を再縮尺する。例えば、６０塩基対のサイズを有する特定のウインドウが基準部位から上流方向に５０塩基対である場合、それは－５０とマークされる。さもなければ、６０塩基対のサイズを有する特定のウインドウが基準部位から下流方向に５０塩基対である場合、それは＋５０とマークされる。
３）該ウインドウに重複するインタクトな断片及び全ての断片の計数を使用して、再縮尺された同一の新たな座標を有する特定のウインドウ内のＰ_Ｉ値を再計算する。

【0074】

図８Ａは、デオキシリボヌクレアーゼ高感受性部位であるが、ＴＳＳではない領域での、Ｐ_Ｉ変動のパターンを示す。図８Ｂは、ＴＳＳであるが、デオキシリボヌクレアーゼ高感受性部位ではない領域での、Ｐ_Ｉ変動のパターンを示す。示されるように、変動の振幅は、ＴＳＳであるが、デオキシリボヌクレアーゼ高感受性部位ではない領域よりも、デオキシリボヌクレアーゼ高感受性部位であるが、ＴＳＳではない領域内で一層高い。これらの観察は、血漿ＤＮＡの断片化パターンに影響を与える１つの因子が、デオキシリボヌクレアーゼ高感受性部位に対する断片化に供される領域の相対位置であることを示唆する。

【0075】

ＩＩＩ．組織の割合を決定するためのピーク及びトラフの使用
デオキシリボヌクレアーゼ高感受性部位に対する相対位置が、血漿ＤＮＡの断片化パターンを支配する重要な因子であることを実証したところで、我々は、この観察が臨床的用途に置き換えられるかどうかを調査した。デオキシリボヌクレアーゼ高感受性部位のプロファイルは、異なる組織型において異なることが観察されている。プロファイルはその部位のゲノム位置に対応し、デオキシリボヌクレアーゼ高感受性部位の位置は異なる組織について異なる。したがって、我々は、異なる組織型から放出される血漿ＤＮＡが組織に特異的な断片化パターンを呈すると考える。類似した様式で、領域の振幅が組織によって変動する他の領域を使用してもよい。

【0076】

Ａ．デオキシリボヌクレアーゼ高感受性部位の例
図９は、異なる組織から放出されるＤＮＡの割合の測定の原理の説明を示す。組織Ａに由来する血漿ＤＮＡは、高いＰ_Ｉ（ピーク、Ｐと表示）を有するヌクレオチド位置を断片化する確率がより低い。したがって、組織Ａに由来する血漿ＤＮＡの末端は、これらのヌクレオチド位置に位置する確率がより低い。対照的に、組織Ａに由来する血漿ＤＮＡは、低いＰ_Ｉ（トラフ、Ｔと表示）を有するヌクレオチド位置に位置する確率がより高い。他方、この部位は組織Ｂのデオキシリボヌクレアーゼ高感受性部位ではないため、Ｐ_Ｉ変動の振幅は、組織Ｂに由来する血漿ＤＮＡでは低い。したがって、組織Ｂに由来する血漿ＤＮＡが位置Ｐ及び位置Ｔ上で終結する確率は、少なくとも組織Ａに見られる変動の量と比較して、類似しているだろう。

【0077】

我々は、組織Ａのデオキシリボヌクレアーゼ高感受性部位である領域での断片末端比（ＦＲ_Ａ）を、以下のように定義する。

【数2】

式中、Ｎ_Ｔは、Ｐ_Ｉのトラフのヌクレオチド位置上で終結する血漿ＤＮＡ断片の数であり、Ｎ_Ｐは、Ｐ_Ｉのピークヌクレオチド位置上で終結する血漿ＤＮＡ断片の数である。ＦＲ_Ａは分離値の一例であり、より具体的には、ピーク上で終結するＤＮＡ断片に対する、トラフ上で終結するＤＮＡ断片の相対的存在量の一例である。他の実施形態において、隣接するトラフ（極小）及びピーク（極大）の分離比が決定され得、分離比の平均が決定され得る。

【0078】

組織Ａについて、Ｎ_ＴがＮ_Ｐよりも大きいため、ＦＲ_Ａは１よりも大きいだろう。組織Ｂについて、Ｎ_Ｔ及びＮ_Ｐが類似するため、ＦＲ_Ａは１に近似するだろう。したがって、組織Ａ及びＢの両方に由来する血漿ＤＮＡを含有する混合物中、ＦＲ_Ａの値は、組織Ａの比例的寄与と正の相関を有するだろう。実際には、組織ＢのＦＲ_Ａは１である必要はない。組織ＢのＦＲ_Ａが組織ＡのＦＲ_Ａと異なる限り、２つの組織型の比例的寄与が、ＦＲ_Ａから決定され得る。

【0079】

そのような領域内で、ＤＮＡ断片がトラフで終結する尤度の高い変動は、ピークで終結するよりも、そのような位置で終結する多数のＤＮＡ断片をもたらすだろう（異なる定義された相対的存在量の値について、ピークでより高い尤度が生じ得ることに留意されたい）。より多くのＤＮＡ断片が組織型Ａに由来する場合、トラフ及びピークで終結するＤＮＡの数の差異はより大きくなるだろう。したがって、組織Ａの比例的寄与が増加するにつれて、トラフ上で終結するＤＮＡ断片の数とピーク上で終結するＤＮＡ断片の数との間の分離はより大きくなるだろう。この分離値は、組織Ａについて図９に示される尤度関数の高い振幅に対応する。

【0080】

Ｂ．相対的存在量と比例的寄与との間の関係
図１０は、組織Ａに由来するＤＮＡの既知の比例的濃度を有する２つ以上の較正試料の分析によって決定される、ＦＲ_Ａと、混合物中のＤＮＡに対する組織Ａの比例的寄与との間の関係を示す。示される例において、組織Ａの比例的寄与を有する２つの試料、ｘ_１及びｘ_２を分析する。２つの試料のＦＲ_Ａ値をそれぞれ、ｙ_１及びｙ_２として決定した。ＦＲ_ＡとＡの比例的寄与との間の関係は、ｘ_１、ｘ_２、ｙ_１、及びｙ_２の値に基づいて決定され得る。

【0081】

値ｙ１及びｙ２は、較正値の例である。データ点（ｘ１，ｙ１）及び（ｘ２，ｙ２）は、較正データ点の例である。較正データ点を関数に適合させ、較正曲線１０１０を得ることができ、これは線形であり得る。新たな試料の新たなＦＲ_Ａ（または他の相対的存在量の値）を測定し、新たなＦＲ_Ａを較正値のうちの少なくとも１つと比較して、新たな試料の比例的寄与の分類を決定することができる。較正値に対する比較は、様々な方法で行うことができる。例えば、較正曲線を使用して、新たなＦＲ_Ａに対応する比例的寄与ｘを見出すことができる。別の例として、新たなＦＲ_Ａを第１の較正データ点の較正値ｙ１と比較して、新たな試料がｘ１超またはｘ１未満の比例的寄与であるかどうかを判定することができる。

【0082】

他の実施形態において、他の組織のＦＲ_Ａが比較的一定である限り、３つ以上の組織型を含有する混合物を、組織Ａの比例的寄与について同様に分析することができる。そのような方法は、異なる臨床的シナリオ（例えば、癌の検出、移植の監視、外傷の監視、感染症及び出生前診断などであるが、これらに限定されない）の分析に実用的に有用である。

【0083】

一実施形態において、癌患者の血漿中の罹患した組織の画分濃度が決定され得る。例えば、肝臓癌を有する患者において、肝臓に特異的な開いたクロマチン領域、例えば、デオキシリボヌクレアーゼ高感受性部位の分析を介して、肝臓ＤＮＡの画分濃度が決定され得る。一実施形態において、これは、ＤＮＡｓｅ－Ｓｅｑを使用して行うことができる（Ｂｏｙｌｅｅｔａｌ．Ｃｅｌｌ２００８；１３２：３１１－３２２、Ｍａｄｒｉｇａｌｅｔａｌ．ＦｒｏｎｔＧｅｎｅｔ２０１２；１６：１２３－１３１）。別の実施形態において、これは、調節エレメントのホルムアルデヒド支援単離（ＦＡＩＲＥ）－Ｓｅｑによって実行することができる（Ｇｉｒｅｓｉｅｔａｌ．ＧｅｎｏｍｅＲｅｓ２００７；１７：８７７－８８５）。更に別の実施形態において、これは、ＡＴＡＣ－Ｓｅｑによって実行することができる（Ｂｕｅｎｒｏｓｔｒｏｅｔａｌ．ＮａｔＭｅｔｈｏｄｓ２０１３；１０：１２１３－１２１８）。ＦＲ_肝臓をこれらの部位で決定し、正常な健常対象と比較することができる。肝臓に特異的なデオキシリボヌクレアーゼ高感受性部位で、ピーク領域とトラフ領域との間のＰ_Ｉの変動は、主に肝臓に起因するものだろう。図１０に類似した較正曲線との比較を通して、肝臓の寄与が決定され得る。試験された症例のＦＲ_肝臓の値を、健常対象における肝臓の寄与の範囲と比較してもよい。ある混合物の様々な組織間のゲノム位置で終結するＤＮＡ断片の、尤度関数の振幅の高い変動を有する他の領域を使用してもよい。そのような他の領域の例は、後節においてより詳細に記載される。

【0084】

同様に、臓器移植を受容した患者における移植された臓器の寄与が、この方法によって決定され得る。以前の研究において、拒絶を有する患者は移植された臓器からのＤＮＡの放出の増加を導き、これが移植された臓器からのＤＮＡの血漿中濃度の上昇をもたらすことが示された。移植された器官のＦＲの分析は、臓器拒絶の検出及び監視のための有用な方法であるだろう。そのような分析に使用される領域は、どの臓器が移植されるかによって変動し得る。

【0085】

別の実施形態において、この方法を使用して、母体血漿中の胎児ＤＮＡ濃度を決定することができる。母体血漿中、胎児遺伝子型を担持するＤＮＡ分子は実際には、胎盤に由来する。したがって、我々が胎盤に特異的であるが、血液細胞中には存在しないデオキシリボヌクレアーゼ高感受性部位に着目すると、我々は、ＦＲ_胎盤の分析を通して、血漿ＤＮＡに対する胎盤の比例的寄与を決定することができるだろう。

【0086】

図１１は、本発明の実施形態に従う、ＦＲ_胎盤と母体血漿中の胎児ＤＮＡパーセンテージとの間の相関を示す。縦軸は、１つ以上のデオキシリボヌクレアーゼ高感受性部位内に位置する１つ以上の極大値及び極小値を使用して決定される、ＦＲ_胎盤に対応する。横軸は、別個の測定技術を使用して測定される、胎児ＤＮＡ画分である。理解することができるように、ＦＲ_胎盤の値は、胎児ＤＮＡ画分と相関する。この例において、胎児ＤＮＡ画分は、母親がホモ接合され、胎児がヘテロ接合された、ＳＮＰでの胎児に特異的な対立遺伝子の割合に基づいて決定した。したがって、胎児ＤＮＡパーセンテージは、母体血漿ＤＮＡの配列決定結果に基づいて、ＦＲ_胎盤を使用して推定することができる。

【0087】

あるいは、母体血漿中の２つの重要な構成成分は胎盤由来ＤＮＡ及び血液細胞に由来するＤＮＡ（異なる組織型）であるため、我々は、ＦＲ_血液が血液血漿中の胎児ＤＮＡの画分濃度と負に相関すると考えた。したがって、血液細胞に特異的なデオキシリボヌクレアーゼ高感受性部位を特定し、ＦＲ_血液を決定した。

【0088】

図１２は、ＦＲ_血液と母体血漿中の胎児ＤＮＡ濃度との間の相関を示す。縦軸は、１つ以上のデオキシリボヌクレアーゼ高感受性部位内に位置する１つ以上の極大値及び極小値を使用して決定される、ＦＲ_血液に対応する。横軸は、母体血漿中の胎児に特異的な対立遺伝子の割合に基づいて測定される、胎児ＤＮＡ画分である。ＦＲ_血液と胎児ＤＮＡパーセンテージとの間に、負の相関を観察することができた。したがって、胎児ＤＮＡパーセンテージは、母体血漿ＤＮＡの配列決定結果に基づいて、ＦＲ_血液を使用して推定することができる。したがって、ゲノム領域は、複数の組織型に特異的な断片化パターン、例えば、いくつかの組織（複数可）について正の相関（複数可）及び他の組織（複数可）について負の相関（複数可）を有し得る。

【0089】

Ｃ．極大及び極小を使用する方法
図１３は、本発明の実施形態に従う、生体試料を分析して、第１の組織型の比例的寄与の分類を決定する、方法１３００の流れ図である。生体試料は、第１の組織型を含む複数の組織型に由来する無細胞ＤＮＡ分子の混合物を含む。本明細書に記載される他の方法と同様に、方法１３００は、コンピュータシステムを使用してもよい。第１の組織型（例えば、肝臓組織または胎児組織）は、特定の対象に基づいて選択され得る。例えば、対象が以前に肝臓癌を有した場合、肝臓癌が再発している（これは肝臓組織に由来する比例的寄与の増加をもたらすだろう）かどうかを確認するために、スクリーニングが実行され得る。そのような選択基準は、本明細書に記載される他の方法に適用される。

【0090】

ブロック１３１０で、第１の組織型に特異的な断片化パターンを有する少なくとも１つのゲノム領域を特定する。一例として、少なくとも１つのゲノム領域が、１つ以上のデオキシリボヌクレアーゼ高感受性部位を含んでもよい。例えば、節ＶＩに記載されるように、第１の組織型に特異的な断片化パターンを有する少なくとも１つのゲノム領域のそれぞれが、少なくとも１つの追加の試料中で１つ以上の第１の組織に特異的な対立遺伝子を含んでもよい。別の例として、少なくとも１つのゲノム領域が、１つ以上のＡＴＡＣ－ｓｅｑまたは小球菌ヌクレアーゼ部位を含んでもよい。第１の組織型は、特定の臓器、またはその臓器の特定の癌にすら対応し得る。

【0091】

ブロック１３２０で、生体試料に由来する複数の無細胞ＤＮＡ分子を分析する。無細胞ＤＮＡ分子の分析は、無細胞ＤＮＡ分子の少なくとも１つの末端に対応する、基準ゲノムにおけるゲノム位置（終結位置）を決定することを含む。したがって、無細胞ＤＮＡ分子の２つの終結位置が決定されても、１つの終結位置のみが決定されてもよい。

【0092】

終結位置は、本明細書に記載されるように、様々な方法で決定され得る。例えば、無細胞ＤＮＡ分子を配列決定して、配列読み取りを得てもよく、その配列読み取りを基準ゲノムにマッピングしても（整列させても）よい。生物がヒトである場合、基準ゲノムは、潜在的には特定の下位集団に由来する基準ヒトゲノムであるだろう。別の例として、無細胞ＤＮＡ分子を（例えば、ＰＣＲまたは他の増幅の後に）異なるプローブで分析してもよく、ここで、各プローブは、少なくとも１つのゲノム領域を網羅し得るゲノム位置に対応する。

【0093】

統計学的に有意な数の無細胞ＤＮＡ分子を分析して、正確な決定第１の組織型からの比例的寄与を提供することができる。いくつかの実施形態において、少なくとも１，０００個の無細胞ＤＮＡ分子が分析される。他の実施形態において、少なくとも１０，０００または５０，０００または１００，０００または５００，０００または１，０００，０００または５，０００，０００個以上の無細胞ＤＮＡ分子が分析されてもよい。

【0094】

ブロック１３３０で、第１のセットの第１のゲノム位置を特定する。各第１のゲノム位置は、第１のゲノム位置に対応する無細胞ＤＮＡ分子の末端の極小を有する。複数の隣接ゲノム位置を極値（極大または極小）として定義することができ、したがって、極大は１つの位置のみに限定されない。

【0095】

いくつかの実施形態において、複数のゲノム位置のそれぞれの比率が決定され得る。ゲノム位置で終結し、ゲノム位置の両側に少なくとも特定の数のヌクレオチド長伸長する、第１の量の無細胞ＤＮＡ分子は、例えば、図１に記載されるように決定され得る。ゲノム位置に位置する第２の量の無細胞ＤＮＡ分子を、第１の量とともに使用して、比率を決定してもよい。例えば、比率の値を通して進むことによって、比率における複数の極小値及び複数の極大値を特定して、極値（極大または極小）のそれぞれで生じる１つ以上の近接ゲノム位置を特定することができる。

【0096】

ブロック１３４０で、第２のセットの第２のゲノム位置を特定する。無細胞ＤＮＡ分子の末端の極大を有する各第２のゲノム位置は、第２のゲノム位置に対応する。第２のセットは、第１のセットに類似した様式で特定され得る。

【0097】

ブロック１３５０で、少なくとも１つのゲノム領域のうちのいずれか１つにおける、第１のゲノム位置のうちのいずれか１つで終結する、第１の数の無細胞ＤＮＡ分子を決定する。第１の数は、様々な方法で、例えば、全ての第１のゲノム位置にわたる合計として決定され得る。別の例として、各ゲノム位置で別個の値が決定されてもよい。したがって、第１の数の無細胞ＤＮＡ分子を決定することは、各第１のゲノム位置上で終結する、第１の量の無細胞ＤＮＡ分子を決定し、それにより、複数の第１の量を決定することを含み得る。

【0098】

ブロック１３６０で、少なくとも１つのゲノム領域のうちのいずれか１つにおける、第２のゲノム位置のうちのいずれか１つで終結する第２の数の無細胞ＤＮＡ分子を決定する。第２の数は、第１の数に類似した様式で決定され得る。したがって、第２の数の無細胞ＤＮＡ分子を決定することは、各第２のゲノム位置上で終結する、第２の量の無細胞ＤＮＡ分子を決定し、それにより、複数の第２の量を決定することを含み得る。

【0099】

ブロック１３７０で、第１の数及び第２の数を使用して、分離値を算出する。分離値は、様々な方法で、例えば、節ＩＩＩ．Ａに記載されるように、第１の数及び第２の数の比率によって、算出することができる。複数の極大及び極小を使用する別の実装例において、そのような各ゲノム位置での量を決定してもよい。分離値を算出することは、それぞれが、複数の第１の量のうちの１つ及び複数の第２の量のうちの１つの分離比である、複数の分離比を決定することを含み得る。分離値は、複数の分離比、例えば、分離比の平均または中央値を使用して決定することができる。

【0100】

ブロック１３８０で、分離値を、第１の組織型の比例的寄与が既知である１つ以上の較正試料から決定される、１つ以上の較正値と比較することによって、第１の組織型の比例的寄与の分類を決定する。

【0101】

Ｄ．無増幅分析
ブロック１３１０での無細胞ＤＮＡ分子の分析は、無増幅であってもよい。ＰＣＲを使用する場合、配列決定深度（すなわち、基準ゲノムにおける特定のヌクレオチドを網羅するか、または特定のヌクレオチド上で終結する配列読み取りの数）は、その特定のヌクレオチドを網羅するいくつの血漿ＤＮＡ分子が分析されるかを、直接的には反映しない。これは、１つの血漿ＤＮＡ分子が、ＰＣＲプロセス中に複数の複製を生成し得、複数の配列読み取りが単一の血漿ＤＮＡ分子に起源を持ち得るためである。この重複問題は、ｉ）配列決定ライブラリを増幅するためのより多数のＰＣＲサイクル、ｉｉ）配列決定深度の増加、及びｉｉｉ）元の血漿試料中のより少数のＤＮＡ分子（例えば、より少ない体積の血漿）に伴って、より重要となるだろう。

【0102】

更に、ＤＮＡポリメラーゼの忠実度は１００％ではなく、時折誤ったヌクレオチドがＰＣＲ娘鎖に組み込まれることがあるため、ＰＣＲステップは更なる誤差を導入する（Ｋｉｎｄｅｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ２０１１；１０８：９５３０－９５３５）。このＰＣＲ誤差が初期ＰＣＲサイクル中に生じた場合、同一の誤差を示す娘分子のクローンが生成されるだろう。誤った塩基の画分濃度は、同一の座位に由来する他のＤＮＡ分子中で高い割合に達するために、誤差が、例えば、胎児由来または腫瘍由来変異として誤解釈される可能性がある。無ＰＣＲプロトコルの例としては、ＢｅｒｒｙＧｅｎｏｍｉｃｓ（ｉｎｖｅｓｔｏｒ．ｉｌｌｕｍｉｎａ．ｃｏｍ／ｍｏｂｉｌｅ．ｖｉｅｗ？ｃ＝１２１１２７＆ｖ＝２０３＆ｄ＝１＆ｉｄ＝１９４９１１０）、Ｉｌｌｕｍｉｎａ（ｗｗｗ．ｉｌｌｕｍｉｎａ．ｃｏｍ／ｐｒｏｄｕｃｔｓ／ｔｒｕｓｅｑ－ＤＮＡ－ｐｃｒ－ｆｒｅｅ－ｓａｍｐｌｅ－ｐｒｅｐ－ｋｉｔｓ．ｈｔｍｌ）、及び様々な単一分子配列決定技術が挙げられる。無増幅分析の更なる詳細は、ＰＣＴ出願第ＰＣＴ／ＣＮ２０１６／０７３７５３号に見出すことができる。

【0103】

したがって、いくつかの実施形態は、分析される生体試料から鋳型ＤＮＡ分子を得ることと、鋳型ＤＮＡ分子を使用して、分析可能なＤＮＡ分子の配列決定ライブラリを調製すること（分析可能なＤＮＡ分子の配列決定ライブラリの調製は、鋳型ＤＮＡ分子のＤＮＡ増幅のステップを含まない）と、分析可能なＤＮＡ分子の配列決定ライブラリを配列決定して、第１の複数の無細胞ＤＮＡ分子に対応する複数の配列読み取りを得ることとを含み得る。第１の複数の無細胞ＤＮＡ分子の分析は、コンピュータシステムで、複数の配列読み取りを受信することと、コンピュータシステムによって、複数の配列読み取りを基準ゲノムに整列させて、複数の配列読み取りのゲノム位置を決定することとを含み得る。

【0104】

ＩＶ．左右のヌクレオチドの相対的存在量
図１４は、腫瘍由来ＤＮＡまたは胎児由来ＤＮＡの循環ＤＮＡ断片の場合の差異の原理の説明を示す。以前の研究において、循環ＤＮＡのサイズは、ヌクレオソームＤＮＡのサイズに非常に似ていることが示されている。血漿ＤＮＡのサイズ分布における１６６塩基対の主要ピークは、２つの連続するヒストン複合体を接続するリンカーＤＮＡとともに、ヒストン複合体のコアに関連するＤＮＡを表す。

【0105】

癌患者及び妊婦の血漿中、胎児由来ＤＮＡ分子及び腫瘍由来ＤＮＡ分子のサイズ分布が、非腫瘍由来ＤＮＡ及び非胎児由来ＤＮＡのサイズ分布よりも短いこともまた観察されている（Ｌｏｅｔａｌ．ＳｃｉＴｒａｎｓｌＭｅｄ２０１０；２（６１）：６１ｒａ９１及びＪｉａｎｇｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ２０１５；１１２：Ｅ１３１７－２５．）。血漿中の腫瘍由来ＤＮＡ及び胎児由来ＤＮＡのサイズ分布について、１６６塩基対でのピークは減少し、１４４塩基対でのピークはより顕著である。１４４塩基対ピークは、２つの連続するヒストン複合体を接続する約２０塩基対のリンカーＤＮＡの分解によるものである可能性が高い。

【0106】

この方法の原理を説明するために、我々は、癌患者のシナリオを一例として使用する。その後、同一の原理を、妊娠における母体血漿中の循環胎児ＤＮＡの分析、及び移植を受容している患者の血漿の分析を含む、他のシナリオに適用することができる。実施形態において、図１４において左末端及び右末端と表示される、血漿ＤＮＡ分子の末端を分析することができる。

【0107】

非悪性組織に由来するＤＮＡが断片化され、血漿中に放出される場合、２つの分子の接続末端はともに、ヌクレオチド位置Ａに位置するだろう。換言すると、右側の分子について、左の最外側ヌクレオチドは、ヌクレオチド位置Ａのちょうど隣りである。左側の分子について、右の最外側ヌクレオチドもまた、ヌクレオチド位置Ａのちょうど隣りである。特定のヌクレオチドで終結する分子の相対的存在量をヌクレオチド座標に対してプロットした場合、この領域にマッピングする左右の最外側ヌクレオチドの末端のピーク存在量は、位置Ａにあるだろう。腫瘍細胞に由来するＤＮＡ分子について、２０塩基対の断片は、断片化プロセス後に分子から除去されるだろう。

【0108】

結果として、右の分子の左側と左の分子の右側との間に２０塩基対の間隙が存在するだろう。特定のヌクレオチドで終結する分子の相対的存在量が、ヌクレオチド座標に対してプロットされる場合、右の最外側ヌクレオチドのピーク（Ｂに位置）及び左の最外側ヌクレオチドのピーク（Ｃに位置）は、２０塩基対によって分離されるだろう。したがって、ヌクレオチド位置Ｂ及びＣ上で終結する分子の存在量と、ヌクレオチド位置Ａ上で終結する分子の存在量との間の比率は、血漿試料中の腫瘍由来ＤＮＡの画分濃度を表すだろう。

【0109】

同一の原理を適用して、差動サイズ分布を有するＤＮＡ種を定量化（例えば、妊婦の血漿中の胎児ＤＮＡの測定、及び移植された臓器に由来するＤＮＡの測定などであるが、これらに限定されない）することができる。

【0110】

図１５は、第１の組織型を含む複数の組織型に由来する無細胞ＤＮＡ分子の混合物を含む、生体試料を分析する方法１５００の流れ図である。方法１５００の一部分を使用して、好ましい終結位置を特定するブロック１３１０及び他のブロックを実装することができる。

【0111】

ブロック１５１０で、無細胞ＤＮＡ分子を分析して、基準ゲノムにおける左右の終結位置を決定する。ブロック１５１０は、ブロック１３２０に類似した様式で実行することができる。ブロック１５１０において、対象の生体試料に由来する第１の複数の無細胞ＤＮＡ分子が分析され得、第１の複数の無細胞ＤＮＡ分子のそれぞれは、左末端及び右末端を有する。無細胞ＤＮＡ分子左末端に対応する、基準ゲノムにおける左終結位置は、例えば、ＤＮＡ断片の配列読み取りを基準ゲノムに整列させる（マッピングする）ことによって、または基準ゲノムにおける位置が既知であるプローブを介して、決定され得る。左末端は、基準ゲノムを定義するために選択される座標システムによって、いずれの末端も指し得る。同様に、無細胞ＤＮＡ分子の右末端に対応する、基準ゲノムにおける右終結位置が決定され得る。例えば、２つの末端が別個の配列読み取りを有する場合、２つの終結位置は２つの別個の整列ステップで決定してもよい。

【0112】

ブロック１５２０で、左ゲノム位置の左のセットを特定する。左のセットの各ゲノム位置は、ゲノム位置の左のセットのうちの１つに対応する第１の複数の無細胞ＤＮＡ分子の左末端の極大を有する。左のセットは、方法１３００で極大について記載されるものに類似した方法で決定され得る。

【0113】

ブロック１５３０で、右ゲノム位置の右のセットを特定する。右のセットの各ゲノム位置は、ゲノム位置の右のセットのうちの１つに対応する第１の複数の無細胞ＤＮＡ分子の右末端の極大を有する。右のセットは、方法１３００で極大について記載されるものに類似した方法で決定され得る。

【0114】

ブロック１５４０で、第１のゲノム位置のセットを、第１の組織型に特異的なものとして特定する。左のセットの左ゲノム位置の全てまたは一部分を、右のセットの右ゲノム位置の全てまたは一部分と比較して、第１のゲノム位置のセットを特定することができ、左ゲノム位置から最も近い右ゲノム位置までの距離は、基準ゲノムにおけるゲノム位置（例えば、ヌクレオチド）の第１の閾距離よりも大きい。第１の閾距離の例は、５、６、７、８、９、１０、１５、及び２０ヌクレオチド長である。

【0115】

ブロック１５５０で、第２のゲノム位置のセットを特定する。左のセットの左ゲノム位置の全てまたは一部分を、右のセットの右ゲノム位置の全てまたは一部分と比較して、第２のゲノム位置のセットを特定することができ、左ゲノム位置から最も近い右ゲノム位置までの距離は、基準ゲノムにおけるゲノム位置の第２の閾距離よりも小さい。第２の閾距離の例は、２、３、４、及び５個のゲノム位置（例えば、ヌクレオチド長）である。

【0116】

ブロック１５６０で、ゲノム位置の左のセットのうちの１つで終結する、第１の数の第１の複数の無細胞ＤＮＡ分子、及びゲノム位置の右のセットのうちの１つで終結する、第２の数の第１の複数の無細胞ＤＮＡ分子を使用して、分離値を決定する。第１の数と第２の数との間の分離値（例えば、相対的存在量の値）が決定され得る。

【0117】

一実施形態において、第１のゲノム位置のセット及び第２のゲノム位置のセットの対を特定する。対は、互いに最も近い位置のものであってもよい。対のうちの１つ以上のそれぞれについて、第１のゲノム位置で終結する第１の量の無細胞ＤＮＡ分子を決定してもよく、第１のゲノム位置で終結する第２の量の無細胞ＤＮＡ分子を決定してもよい。第１の量の無細胞ＤＮＡ分子は、第１の数の複数の無細胞ＤＮＡ分子に対応し、第２の量の無細胞ＤＮＡ分子は、第２の数の複数の無細胞ＤＮＡ分子に対応する。例えば、第１の量を合計して第１の数になってもよく、第２の量を合計して第２の数になってもよく、分離値を第１の数及び第２の数から直接的に決定してもよい。別の例として、分離値を、それぞれが１つの対について第１の量及び第２の量を含む、複数の比率から決定してもよい。様々な実装例において、比率の平均または中央値を、分離値として使用してもよい。対のそれぞれの第１及び第２の量を他の方法で使用して、全分離値を決定するのに使用される個々の分離値を決定することができる。

【0118】

ブロック１５７０で、分離値を、第１の組織型の比例的寄与が既知である１つ以上の較正試料から決定される、１つ以上の較正値と比較することによって、第１の組織型の比例的寄与の分類を決定する。ブロック１５７０は、他の比例的寄与の決定に類似した様式で実行することができる。

【0119】

様々な実施形態において、左右のセットの両方を第１のゲノム位置のセットとして使用しても、左のセットのみを使用しても、右のセットのみを使用しても、左のセットのいくつか及び右のセットのいくつかを使用してもよい。左位置のセット全体について、左位置のサブセットから閾値数のヌクレオチド長だけ分離した、対応する右の位置のセットを有する左位置のサブセットが存在する。したがって、左位置のサブセットまたは対応する右位置のサブセットを使用して、計算を行うことが可能である。

【0120】

Ｖ．組織に特異的な終結位置の使用
我々は、癌細胞、胎盤細胞、及び細胞型に由来する循環ＤＮＡの断片化パターンは異なると仮定する。この仮説に基づいて、循環ＤＮＡ断片の一端または両端の末端ヌクレオチドの座標を使用して、推定上の変異を担持するＤＮＡ断片が実際に腫瘍に由来するかどうかを予想することができる。血漿ＤＮＡ断片における、癌に特異的な終結位置及び妊娠に特異的な終結位置を特定することができる。

【0121】

Ａ．肝細胞癌腫（ＨＣＣ）を使用する癌の例
このアプローチの実現可能性を説明するために、肝細胞癌腫（ＨＣＣ）を有する患者及び妊婦の血漿ＤＮＡの配列決定データを分析した。説明の目的で、分析では染色体８に着目した。同一のアプローチを、ゲノム全体または任意の他の染色体に適用することができる。

【0122】

配列決定された各血漿ＤＮＡ断片の両端の末端ヌクレオチドの座標を決定した。その後、染色体８上の各ヌクレオチド上で終結する断片の数を計数した。それらの上で終結する、最も多い数のＤＮＡ断片を有した上位１００万個のヌクレオチドを、ＨＣＣの症例及び妊婦について決定した。上位１００万個は、閾値を超えていると見なすことができる。

【0123】

図１６は、ＨＣＣの症例に特異的である高頻度終結部位の数、妊婦に特異的である高頻度終結部位の数、及び両方の場合によって共有される高頻度終結部位の数を示す、ベン図である。ＨＣＣの症例に特異的な最も高頻度の終結位置であった５３６，７７２個のヌクレオチドの座標を、付録Ａに示す。妊婦に特異的な最も高頻度の終結位置であった５３６，７７２個のヌクレオチドの座標を、付録Ｂに列挙する。２つの場合によって共有される最も高頻度の終結位置であった４６３，２２８個のヌクレオチドの座標は、省略する。

【0124】

我々は、ちょうど５３６，７７２個のＨＣＣに特異的な終結位置で終結する末端ヌクレオチドを有する血漿ＤＮＡ断片は、腫瘍に由来する可能性がより高いと考える。この想定に基づいて、ＨＣＣに特異的な終結位置上で終結した配列決定された血漿ＤＮＡ断片の数を使用して、ＨＣＣまたは同一の血漿ＤＮＡ断片化パターンを有する他の癌の存在または不在を示すことができる。別の実施形態において、このパラメータを使用して、癌のレベル（例えば、腫瘍のサイズ、癌の段階、腫瘍負荷、及び転移の存在などであるが、これらに限定されない）を反映することもできる。

【0125】

更に別の実施形態において、ＨＣＣに特異的な終結位置上で終結する断片の数は、血漿中に既知の腫瘍ＤＮＡ画分を有する試料の、血漿中の癌由来ＤＮＡの画分濃度と相関し得る。血漿中の腫瘍ＤＮＡ画分は、例えば、非限定的に、血漿中の癌変異、または血漿ＤＮＡ中のコピー数異常の大きさの定量化によって決定され得る（Ｃｈａｎｅｔａｌ．ＣｌｉｎＣｈｅｍ２０１３；５９：２１１－２４）。この相関を、較正曲線として使用してもよい（図１）。血漿中に未知の腫瘍ＤＮＡ画分を有する患者について、ＨＣＣに特異的な終結位置上で終結するＤＮＡ断片の量を決定し得る。その後、較正曲線、及びＨＣＣに特異的な終結位置上で終結するＤＮＡ断片の量に基づいて、血漿中の腫瘍ＤＮＡ画分が決定され得る。一実装例において、ＨＣＣに特異的な終結位置上で終結するＤＮＡ断片の量は、配列決定されたＤＮＡ断片の総数、整列可能な読み取りの総数、または特定の染色体領域に整列されたＤＮＡ断片の数に対して正規化され得る。したがって、癌に特異的な位置上で終結する、配列決定されたＤＮＡ断片の割合が、パラメータとして使用され得る。

【0126】

図１７は、癌に特異的な終結位置上で終結する、配列決定されたＤＮＡ断片の割合と、血漿中に既知の腫瘍ＤＮＡ画分を有する癌患者の血漿中の腫瘍ＤＮＡ画分との間の関係を示す、較正曲線を示す。この概念図は、腫瘍ＤＮＡ画分と、癌に特異的な終結位置上で終結する、配列決定されたＤＮＡ断片の割合との間の較正曲線の相関を示す。較正曲線は、較正試料から決定されたデータ点（その腫瘍ＤＮＡ画分は他の技術を介して決定）を適合させることによって決定され得る。

【0127】

本発明の他の実施形態において、異なる種類の癌を患う患者の血漿ＤＮＡ断片化パターンが決定され得る。これらの癌患者の重複する末端は、癌に特異的な末端であると見なされ得る一方で、個々の癌の種類の終結位置は、特定の癌の種類に特異的であると見なされ得る。癌を有することが疑われる任意の個体について、まず配列決定された血漿ＤＮＡ断片を癌に特異的な終結位置と比較して、個体が癌を有する尤度が決定され得る。個体が癌を有する可能性が高い場合、癌の種類に特異的な終結位置の配列決定された断片を分析して、個体が患っている可能性が最も高い癌を決定することができる。

【0128】

本発明の別の実施形態において、異なる臓器に由来するＤＮＡの終結位置を決定することができ、血漿中の異なる臓器に由来するＤＮＡの相対的寄与を決定するために使用することができる。

【0129】

Ｂ．胎児の例
別の実施形態において、このアプローチを使用して、母体血漿試料中の胎児ＤＮＡ濃度を決定することができる。妊娠に特異的な終結位置上で終結する、配列決定された血漿ＤＮＡ断片の割合がまず決定され、既知の胎児ＤＮＡ画分を有する母体血漿試料の数の胎児ＤＮＡ画分が決定される相関によって、較正曲線が確立され得る。胎児ＤＮＡ画分は、例えば、試料中の胎児に特異的な対立遺伝子の決定、男児妊娠の染色体Ｙ上の標的の定量化、及び胎児に特異的なメチル化マーカーの分析などであるが、これらに限定されないいくつかの方法で決定され得る。未知の胎児ＤＮＡ画分を有する妊娠血漿試料について、妊娠に特異的な終結位置上で終結する、配列決定された血漿ＤＮＡ断片の割合が決定され得る。この情報を使用して、試験される血漿ＤＮＡ試料中の胎児ＤＮＡ画分を較正曲線に基づいて決定することができる。

【0130】

Ｃ．好ましい終結位置の使用のためのキット
いくつかの実施形態において、複数の組織型の無細胞ＤＮＡ分子の混合物を含有する生体試料中のＤＮＡを分析するためのキットが提供される。キットは、付録Ａ及びＢに列挙されるゲノム領域の少なくとも一区分に特異的にハイブリダイズするための１つ以上のオリゴヌクレオチドを含み得る。一実施形態において、キットは、対象をＨＣＣについて試験する上で使用するための、付録Ａにゲノム領域の少なくとも一区分に特異的にハイブリダイズするための１つ以上のオリゴヌクレオチドを含む。別の実施形態において、キットは、妊娠中の女性を試験して、例えば、この妊娠中の女性に由来する母体生体試料中の胎児ＤＮＡ画分を決定する上で使用するための、付録Ｂに列挙されるゲノム領域の少なくとも一区分に特異的にハイブリダイズするための１つ以上のオリゴヌクレオチドを含む。

【0131】

ＶＩ．遺伝子多型を使用する終結位置分析
いくつかの実施形態において、組織に特異的な対立遺伝子を使用して、組織に特異的な断片化パターンを有する領域を特定することができる。例えば、本明細書に記載されるように、母体血漿試料を分析し、検出された対立遺伝子を母体のみの試料中で検出された対立遺伝子と比較することによって、胎児に特異的な対立遺伝子を特定することができる。共有された対立遺伝子（すなわち、胎児及び母親で共有されたもの）を呈する組織の比率と比較して、それらの上で終結する胎児ＤＮＡ分子の比率が高いゲノム位置は、胎児組織に特異的な断片化パターンを有するものとして特定することができる。これらの胎児に好ましい終結位置は、デオキシリボヌクレアーゼ高感受性部位であっても、デオキシリボヌクレアーゼ高感受性部位ではなくてもよく、それにより、様々なゲノム領域が、断片化パターンの組織に特異的な振幅を有してもよく、実施形態がデオキシリボヌクレアーゼ高感受性部位に限定されないことを示す。腫瘍についてスクリーニングされている対象に由来する試料に、類似した分析を行うことができる。

【0132】

Ａ．胎児の例
好ましい終結位置は、妊婦に由来する血漿ＤＮＡを分析することによって得ることができる。胎児由来血漿ＤＮＡ断片及び母体由来血漿ＤＮＡ断片は、遺伝子多型に基づく方法を通して区別することができる。断片を担持する胎児に特異的な対立遺伝子及び母体に特異的な対立遺伝子を使用して、胎児由来ＤＮＡ及び母体由来ＤＮＡの好ましい終結位置を決定することができる。

【0133】

この研究には、ＤｅｐａｒｔｍｅｎｔｏｆＯｂｓｔｅｔｒｉｃｓａｎｄＧｙｎａｅｃｏｌｏｇｙ，ＰｒｉｎｃｅｏｆＷａｌｅｓＨｏｓｐｉｔａｌ，ＨｏｎｇＫｏｎｇから、インフォームドコンセントをもって、妊娠３８週目の男児を単胎妊娠する妊婦を募集した。血液試料を、１，６００ｇ、４℃で遠心分離した。血漿部分を回収し、１６，０００ｇ、４℃で１０分間再遠心分離して、血液細胞を除去した。血液細胞部分を２，５００ｇで再遠心分離し、いかなる残渣血漿も除去した。血液細胞に由来するＤＮＡ及び母体血漿に由来するＤＮＡをそれぞれ、ＱＩＡａｍｐＤＮＡＢｌｏｏｄＭｉｎｉＫｉｔ及びＱＩＡａｍｐＤＳＰＤＮＡＢｌｏｏｄＭｉｎｉＫｉｔ（Ｑｉａｇｅｎ）の血液及び体液プロトコルで抽出した。胎盤に由来するＤＮＡを、製造者の組織プロトコルに従って、ＱＩＡａｍｐＤＮＡＭｉｎｉＫｉｔ（Ｑｉａｇｅｎ）で抽出した。ＩｌｌｕｍｉｎａＴｒｕＳｅｑ無ＰＣＲライブラリ調製プロトコルを使用して、配列決定ライブラリを配列決定した。ＳｈｏｒｔＯｌｉｇｏｎｕｃｌｅｏｔｉｄｅＡｌｉｇｎｍｅｎｔＰｒｏｇｒａｍ２（ＳＯＡＰ２）をペアードエンドモードで使用して、ペアードエンド配列決定データを分析した（Ｌｉｅｔａｌ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２００９；２５：１９６６－１９６７）。ペアードエンド読み取りを、非反復遮蔽基準ヒトゲノム（Ｈｇ１９）に整列させた。各末端の整列について、最大２つのヌクレオチドのミスマッチを許容した。その後、２つの末端のこれらの潜在的な整列のゲノム座標を分析して、任意の組み合わせが、２つの末端が正しい配向で同一の染色体に整列され、≦６００塩基対の挿入サイズをスパニングし、基準ヒトゲノムにおいて単一位置にマッピングすることを可能にするかどうかを判定した。母体血漿試料を、半数体ヒトゲノムの２７０×範囲の深度まで配列決定した。同一の配列決定プロトコルを使用して、母体血液細胞、父系血液細胞、及び臍帯血液細胞をそれぞれ、４０×、４５×、及び５０×半数体ヒトゲノム範囲まで配列決定した。

【0134】

この目標を達成するために、母体血漿ＤＮＡ中の反復末端配列決定を分析した。

【0135】

１．胎児に特異的な終結位置の特定
非ＰＣＲ増幅ライブラリを使用する、母体血漿ＤＮＡ試料の超高配列決定深度の実行とともに、我々は、血漿ＤＮＡの生成において優先的に切断される母体ゲノム及び胎児ゲノム内の部位が存在し得るかどうかを調査した。この効果を実証するために、母親がホモ接合（ＡＡと表示される遺伝子型）であり、胎児がヘテロ接合（ＡＢと表示される遺伝子型）である情報提供的ＳＮＰ座位を特定した。この例示的な例において、Ｂ対立遺伝子は胎児に特異的なものであり、Ａ対立遺伝子は母親及び胎児によって共有されるものだろう。代表的な例を図１８に示す。対照として、血液細胞から得、超音波処理を使用して人工的に断片化したＤＮＡ試料の配列決定結果を示す。

【0136】

血漿ＤＮＡ中の非ランダム断片化パターンを観察した。ＤＮＡ断片の末端である確率のプロットでは、胎児に特異的な対立遺伝子及び母親によって共有される対立遺伝子を担持する断片の２つの群のそれぞれについて、３つのピークが観察された。これらのピークはそれぞれ、母体血漿中の胎児由来ＤＮＡ及び母体由来ＤＮＡの末端位置のホットスポットを表す。ピークの位置は、これら２つの群の間で大部分が重複した。対照的に、超音波処理されたＤＮＡの断片化パターンはランダムであるようであり、断片末端確率は領域にわたって類似する。

【0137】

図１８は、胎児に特異的な対立遺伝子ならびに母親及び胎児によって共有された対立遺伝子を担持する、血漿ＤＮＡの非ランダム断片化パターンの一例示的な例を示す。図の上部分では、各横線は１つの配列決定されたＤＮＡ断片を表す。ＤＮＡ断片の末端は、配列決定された末端の終結位置を表す。左の最外側ヌクレオチドの座標（最小のゲノム座標）に従って、断片を選別する。図の下部分では、特定の位置上で終結する断片のパーセンテージを示す。Ｘ軸はゲノム座標を表し、ＳＮＰは破線によって示される中央に位置する。

【0138】

我々は、血漿ＤＮＡ断片の終結位置である増加した確率を有する座標を更に探索した。我々は、情報提供的ＳＮＰを網羅する断片に基づいて、我々の探索を集中させて、胎児に特異的な対立遺伝子ならびに母親及び胎児によって共有される対立遺伝子を担持する断片が別個に評価できるようにした。我々は、ポアソン確率関数を使用して、ヒトゲノム内の特定の位置が、血漿ＤＮＡ断片の終結位置である有意に増加した確率を有するかどうかを判定した。母親がホモ接合（遺伝子型ＡＡ）であり、胎児がヘテロ接合（遺伝子型ＡＢ）であるＳＮＰの分析について、Ａ対立遺伝子は「共有された対立遺伝子」であり、Ｂ対立遺伝子は「胎児に特異的な対立遺伝子」であるだろう。共有された対立遺伝子及び胎児に特異的な対立遺伝子を担持する、配列決定された読み取りの数を計数する。血漿ＤＮＡのサイズ分布において、胎児由来ＤＮＡ及び母体由来ＤＮＡの両方について、ピークは１６６塩基対で観察されるだろう。血漿ＤＮＡの断片化がランダムである場合、２つの末端は、情報提供的ＳＮＰの１６６塩基対上流及び１６６塩基対下流の領域にわたって均等に分布するだろう。

【0139】

ｐ値を計算して、ポアソン確率関数に基づいて、特定の位置が、共有された対立遺伝子または胎児に特異的な対立遺伝子を担持する読み取りの末端である、有意に増加した確率を有するかどうかを判定することができる。
ｐ値＝ポアソン（Ｎ_実数値、Ｎ_予想値）
式中、ポアソン（）はポアソン確率関数であり、Ｎ_実数値は特定のヌクレオチドで終結する読み取りの実数値であり、Ｎ_予想値は読み取りの総数を１６６で割ったものである。＜０．０１のｐ値をカットオフとして使用して、胎児に特異的な対立遺伝子または共有された対立遺伝子を担持する読み取りの好ましい終結位置を定義した。共有された対立遺伝子及び胎児に特異的な対立遺伝子を独立して担持するＤＮＡ断片について、統計学的に有意な終結位置を決定した（図１９）。他の確率分布、例えば、二項分布、負の二項分布、及び正規分布を使用してもよい。

【0140】

図１９は、ゲノム座標が、情報提供的ＳＮＰを有する領域にわたって、母体血漿ＤＮＡ断片の終結位置である確率のプロットを示す。共有された対立遺伝子及び胎児に特異的な対立遺伝子を担持する血漿ＤＮＡ断片の末端である、有意に増加した確率を有するヌクレオチド位置の結果をそれぞれ、赤色及び青色で示す。Ｘ軸はゲノム座標を表し、変異は破線によって示される中央に位置する。示されるように、胎児に特異的な対立遺伝子のみ、共有された対立遺伝子のみの終結位置の高い発生率を有する座標が存在し、いくつかは両方に共通している。

【0141】

我々は、胎児に特異的な対立遺伝子及び共有された対立遺伝子を担持する血漿ＤＮＡ断片の末端である、有意に増加した確率を有する、それぞれ合計４，１３１（セットＡ）個及び１０，０２１（セットＢ）個のヌクレオチド位置を特定した。セットＣは重複セットであり、４，２５８個のヌクレオチド位置を含有した（図３）。これらの終結位置は、合計１．４２Ｍｂをスパニングし、４，３０３個のＳＮＰを網羅する領域から得た。したがって、胎児に特異的な断片の好ましい終結位置は、分析された領域の０．２９％を占めた。それぞれ、２４，５００個、２２，９４２個、及び３１，９２５個の、セットＡ、セットＢ、及びセットＣの位置上で終結する、胎児に特異的な対立遺伝子を担持する血漿ＤＮＡ断片が存在した。それぞれ、２７，２９５個、１５８，６３２個、及び８７，８０４個の、セットＡ、セットＢ、及びセットＣの位置上で終結する、共有された対立遺伝子を担持する血漿ＤＮＡ断片が存在した。好ましい終結位置の数または普及率はより一層高く、他のゲノム座標で生じることが期待される。

【0142】

本明細書に記載される遺伝子多型に基づくアプローチは、この胎児母体対の情報提供的ＳＮＰに関連付けられる好ましい終結位置のみを特定する。したがって、特定された好ましい末端は、ゲノムにおけるそのような末端のサブセットを提示するだろう。我々は、好ましい末端を特定するための、遺伝子多型に基づかないアプローチを開発した。実際、遺伝子多型に基づかないアプローチを使用する、より多くの好ましい末端アプローチを特定した。後述の他の実験を参照されたい。

【0143】

図２０は、母親においてホモ接合され、胎児においてヘテロ接合された、ＳＮＰにわたる血漿ＤＮＡ断片の終結位置の分析を示す。セットＡは、胎児に特異的な対立遺伝子を担持する断片の好ましい終結位置を含んだ。セットＢは、共有された対立遺伝子を担持する断片の好ましい終結位置を含んだ。セットＣは、両方の種類の血漿ＤＮＡ断片の好ましい終結位置を含んだ。

【0144】

同一の原理を使用して、我々は、母親においてヘテロ接合（遺伝子型ＡＢ）され、胎児においてホモ接合（遺伝子型ＡＡ）された、ＳＮＰにわたる母体由来ＤＮＡ断片の終結位置を分析した。我々は、胎児に特異的な対立遺伝子及び共有された対立遺伝子を担持する血漿ＤＮＡ断片の終結位置である、有意に増加した確率を有する、それぞれ合計７，５２７（セットＸ）個及び１８，８２９（セットＹ）個のヌクレオチド位置を特定した。セットＺは重複セットであり、１０，５３４個の位置を含有した（図４）。これらの終結位置は、合計３．１Ｍｂをスパニングし、９，４８９個のＳＮＰを網羅する領域から得た。したがって、母体に特異的な断片の好ましい終結位置は、この母親及び胎児の対について、分析された領域の０．２４％を占めた。それぞれ、６９，１３６個、８２，４１３個、及び１２１，６０７個の、セットＸ、セットＹ、及びセットＺの位置上で終結する、母体に特異的な対立遺伝子を担持する血漿ＤＮＡ断片が存在した。それぞれ、４６，５５４個、２４５，０３７個、及び１８１，７０９個の、セットＸ、セットＹ、及びセットＺの位置上で終結する、共有された対立遺伝子を担持する血漿ＤＮＡ断片が存在した。繰り返すと、この分析は、少なくとも１つの情報提供的ＳＮＰを網羅する血漿ＤＮＡ分子に着目し、特定された好ましい末端は、ゲノムを通したそのような非ランダム末端のサブセットを提示するにすぎない。

【0145】

図２１は、胎児においてホモ接合され、母親においてヘテロ接合された、ＳＮＰにわたる血漿ＤＮＡ断片の終結位置の分析を示す。セットＸは、母体に特異的な対立遺伝子を担持する断片の好ましい終結位置を含んだ。セットＹは、共有された対立遺伝子を担持する断片の好ましい終結位置を含んだ。セットＺは、両方の種類の血漿ＤＮＡ断片の好ましい終結位置を含んだ。

【0146】

２．胎児ＤＮＡ画分を推定するための反復終結位置の使用
母親及び胎児に由来する血漿ＤＮＡ断片の反復終結位置を特定した後、我々は、これらのヌクレオチド位置のセット上で終結する血漿ＤＮＡの相対的存在量は、胎児ＤＮＡ画分を反映すると考えた。これを確認するために、我々は、それぞれが男の胎児を担持する２６人の妊娠第一期（１０～１３週目）の妊婦の血漿ＤＮＡを配列決定した。マッピングされた読み取り計数の中央値は、１６００万（範囲：１２００万～２２００万）であった。染色体Ｙに整列する配列決定された読み取りの割合を使用して、各血漿試料中の実際の胎児ＤＮＡ画分を計算した。反復胎児（セットＡ）及び母体（セットＸ）末端を有する血漿ＤＮＡの相対的存在量（胎児／母体比と表示）と胎児ＤＮＡ画分との間に、正の相関を観察することができた（Ｒ＝０．６３、Ｐ＝０．０００４、ピアソン相関、図２２）。好ましい終結位置が、１つの胎児及び母親の対の情報提供的ＳＮＰに基づいて特定され、ゲノムにおけるそのような末端のサブセットを提示するにすぎなかった一方で、特定された末端が他の妊娠にも関連し、この好ましい末端のサブセットのみによってすら胎児画分との相関が達成されたことは、興味深い。

【0147】

図２２は、反復胎児（セットＡ）末端及び母体（セットＸ）末端を有する血漿ＤＮＡ分子の相対的存在量（比率（胎児／母体））と、胎児ＤＮＡ画分との間の相関を示す。データ点のそれぞれはそれぞれの較正試料に対応し得るため、較正データ点と見なされ得る。較正データ点に適合する線は、較正関数の一例である。

【0148】

セットＡ及びセットＸ以外の他のセットを使用してもよい。例えば、セットＣに対するセットＡの比率、及びセットＢに対するセットＡの比率（または他の相対的存在量もしくは比率の関数）を採用してもよい。別の例として、セットＸまたはセットＺの比率またはセットＸとセットＹとの間の比率を採用してもよく、これは、胎児ＤＮＡ画分の逆であると想定され得る母体ＤＮＡ画分を提供するだろう。そのような一例において、母体組織は、暗黙のうちにであったとしても、比例的寄与が決定される第１の組織型であり得る。

【0149】

３．サイズの使用
胎児に特異的な終結位置上で終結する血漿ＤＮＡ断片のサイズ分布は、位置が胎児に特異的であるという更なる証拠を提供する。セットＡ及びセットＸの位置がそれぞれ、胎児由来ＤＮＡ断片及び母体由来ＤＮＡ断片の好ましい終結部位であるということを更に支持するために、我々は、これら２つの位置のセット上で終結する血漿ＤＮＡのサイズ分布を比較した。これらの位置が由来した試料について、サイズ分布は、セットＡ位置上で終結する断片でより短かったは、セットＸ位置上で終結する断片よりも短かった（図２３Ａ）。

【0150】

図２３Ａは、胎児に好ましい終結位置（セットＡ）（青色）上で終結する断片、及び母体に好ましい終結位置（セットＸ）（赤色）上で終結する断片の、血漿ＤＮＡサイズ分布を示す。セットＸ位置で終結する断片と比較して、セットＡ位置上で終結する断片では、より短いサイズ分布が観察された。図２３Ｂは、２つの断片のセットのサイズ分布の累積プロットを示す。図２３Ｃは、断片サイズに対する２つの断片のセットの累積頻度の差異（ΔＳ）を示す。図２３Ｄは、セットＡ及びセットＸの末端位置を、ゼロ～５塩基対だけより大きなゲノム座標を有する位置に移動した場合の、サイズに対するΔＳを示す。図２３Ｅは、セットＡ及びセットＸの終結位置を、ゼロ～５塩基対だけ反対方向（より小さなゲノム座標を有する位置）に移動した場合の、サイズに対するΔＳを示す。

【0151】

サイズ分布の差異を更に定量化するために、２つの曲線の累積頻度をプロットした（図２３Ｂ）。ΔＳによって表される２つの曲線の差異を、図２３Ｃにプロットする。我々は、最大差異が１６６塩基対で観察されたことを観察した。これは、胎児由来ＤＮＡと母体由来ＤＮＡとの間の最大の差異が１６６塩基対で観察され得るという以前の報告と一貫する（Ｙｕｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２０１４；１１１：８５８３－８）。本発見は、母体に好ましい終結位置（セットＸ）上で終結する断片と比較して、胎児に好ましい終結位置（セットＡ）上で終結する断片の、胎児由来ＤＮＡの富化が存在することを示唆した。

【0152】

我々は、セットＡ及びセットＸの終結位置を１～５塩基対だけゲノムの上流または下流に移動することによって、これらの終結位置の特異性を更に調査した。セットＡ及びセットＸの終結位置を両方向に移動した場合のΔＳ値を、サイズに対してプロットする（図２３Ｄ及び２３Ｅ）。正の数の移動は、より大きなゲノム座標を有する位置への移動を表し（図２３Ｄ）、負の数の移動は、より小さなゲノム座標を有する位置への移動を表す（図２３Ｅ）。胎児に好ましい位置及び母体に好ましい位置の、１塩基対だけの移動ですら、これら２つの位置のセット上で終結するＤＮＡ断片の間のサイズ差異（ΔＳ）を有意に減少させる。５塩基対の移動は、サイズ差異をほぼ完全に除去した。これらの結果は、これらの代替的位置で終結する読み取りは、我々のアルゴリズムによって特定される好ましい末端位置で終結する読み取りほどは、胎児に特異的または母体に特異的ではないことを示唆した。これらのデータは、血漿または無細胞ＤＮＡ分子断片またはが、それらの好ましい末端位置で非常に正確に切断されるという、我々の解釈を更に支持する。換言すると、そこで、非ランダム無細胞ＤＮＡ断片化プロセスは、特定のヌクレオチドのレベルまで正確である。

【0153】

その後、我々は、胎児ＤＮＡ画分分析に使用された２６人の妊娠第一期の血漿試料に由来する、プールされた、配列決定された読み取りを分析した。セットＸ位置で終結する断片と比較して、セットＡ位置上で終結する断片では、より短いサイズ分布が観察された（図２４Ａ）。

【0154】

図２４Ａは、胎児に好ましい終結位置（セットＡ）（青色）上で終結する断片、及び母体に好ましい終結位置（セットＸ）（赤色）上で終結する断片の、２６人の妊娠第一期の妊婦に由来するプールされた血漿ＤＮＡ試料中の血漿ＤＮＡサイズ分布を示す。セットＸ位置で終結する断片と比較して、セットＡ位置上で終結する断片では、より短いサイズ分布が観察された。図２４Ｂは、２つの断片のセットのサイズ分布の累積プロットを示す。図２４Ｃは、断片サイズに対する２つの断片のセットの累積頻度の差異（ΔＳ）を示す。図２４Ｄは、セットＡ及びセットＸの位置を、ゼロ～５塩基対だけ移動（より大きなゲノム座標）した場合の、サイズに対するΔＳを示す。図２４Ｅは、セットＡ及びセットＸの位置を、ゼロ～５塩基対だけ反対方向に移動（より小さなゲノム座標）した場合の、サイズに対するΔＳを示す。２つの位置のセット上で終結する血漿ＤＮＡ断片の間のサイズ差異（ΔＳ）は、これらの位置の移動とともに減少し、これは、これらの位置が単一ヌクレオチドレベルまで正確であることを示す。

【0155】

Ｂ．癌の例
同一の方略が、癌由来断片の好ましい終結位置の分析にも適用され得る。この例において、我々は、肝細胞癌腫（ＨＣＣ）を患う患者の血漿（２２０×範囲）、軟膜（４８×）、及び腫瘍組織（４５×）を配列決定した。腫瘍組織及び軟膜の遺伝子型を比較することによって、患者の変異プロファイルを得た。癌由来血漿ＤＮＡ断片の好ましい終結位置を決定するために、我々は、癌変異を担持する血漿ＤＮＡ断片を分析した。図２４Ａ～２４Ｅに示されるように、ＨＣＣ患者における血漿ＤＮＡの断片化パターンは、ランダムではない。特定のヌクレオチド位置が、血漿ＤＮＡ断片の末端である増加した確率を有する。

【0156】

１．癌に特異的な終結位置の特定
図２５は、ＨＣＣ患者の血漿ＤＮＡの非ランダム断片化パターンの一例示的な例を示す。図の上部分では、各横線は１つの配列決定されたＤＮＡ断片を表す。赤色及び青色の線はそれぞれ、野生型対立遺伝子及び変異対立遺伝子を担持するＤＮＡ断片を表す。ＤＮＡ断片の末端は、配列決定された末端の終結位置を表す。左の最外側ヌクレオチドの座標（最小のゲノム座標）に従って、断片を選別する。図の下部分では、特定の位置上で終結する断片のパーセンテージを示す。Ｘ軸はゲノム座標を表し、変異は破線によって示される中央に位置する。

【0157】

我々は、既に記載したポアソン確率分布関数を使用して、変異対立遺伝子及び野生型対立遺伝子を担持する血漿ＤＮＡ断片の末端である、増加した確率を有するゲノム位置を特定した。０．０１のｐ値を閾値として使用した。ＰＣＴ出願第ＰＣＴ／ＣＮ２０１６／０７３７５３号に記載されるように、逆もまた真であり、すなわち、特定の末端を有する血漿ＤＮＡ分子が特定されるとき、ＳＮＰ対立遺伝子または分子上の変異は、どの末端のセットが血漿ＤＮＡデータ解釈において使用されたかによって、癌に由来する可能性、疾患に関連する可能性、または妊娠に関連する可能性がより高い。

【0158】

図２６は、ゲノム座標が、変異部位を有する領域にわたって、血漿ＤＮＡ断片の終結位置である確率のプロットである。野生型対立遺伝子及び変異対立遺伝子を担持する血漿ＤＮＡ断片の末端である、有意に増加した確率を有するヌクレオチド位置の結果をそれぞれ、赤色及び青色で示す。Ｘ軸はゲノム座標を表し、変異は破線によって示される中央に位置する。示されるように、変異体に特異的な対立遺伝子のみ、野生型対立遺伝子のみの終結位置の高い発生率を有する座標が存在し、いくつかは両方に共通している。

【0159】

図２７Ａは、腫瘍組織中に変異が存在したゲノム位置にわたる血漿ＤＮＡ断片の終結位置の分析を示す。セットＥは、変異対立遺伝子を担持する断片の好ましい終結位置を含んだ。セットＦは、野生型対立遺伝子を担持する断片の好ましい終結位置を含んだ。セットＧは、両方の種類の血漿ＤＮＡ断片の好ましい終結位置を含んだ。

【0160】

２．腫瘍ＤＮＡ画分を推定するための反復終結位置の使用
セットＥの位置が癌由来ＤＮＡの好ましい終結部位であり、セットＦの位置が主に非腫瘍組織に由来するバックグラウンドＤＮＡの好ましい終結部位であったため、我々は、これら２つの位置のセット上で終結する断片の間の比率は腫瘍に由来するＤＮＡと相関すると仮定する。したがって、我々は、血漿が少なくとも１％の腫瘍由来ＤＮＡを含有する、７１人のＨＣＣ患者の血漿を分析した。これらの患者は以前に血漿ＤＮＡ中のコピー数異常について分析されており、腫瘍ＤＮＡ画分はコピー数異常の大きさによって推定された。（Ｊｉａｎｇｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２０１５；１１２：Ｅ１３１７－２５）。これら２つの位置のセット上で終結する断片の間の比率（比率_{変異／野生型}）は、以下のように定義される。

【数3】

【0161】

図２７Ｂは、比率_{変異／野生型}と、７１人のＨＣＣ患者の血漿中の腫瘍ＤＮＡ画分との間の相関を示す。比率_{変異／野生型}と血漿中の腫瘍ＤＮＡ画分との間の正の相関が観察された（ｒ＝０．５３、ｐ＜０．００１、ピアソン相関）。これらの結果は、これらの癌に好ましい終結位置上で終結する断片の数が、癌患者の血漿中の腫瘍由来ＤＮＡの量を予想するのに有用であることを示唆する。

【0162】

いくつかの実施形態において、癌に特異的または癌に関連するＤＮＡメチル化シグネチャー（例えば、５－メチシトシン及びヒドロキシメチル化の位置）、癌に特異的または癌に関連する短血漿ＤＮＡ分子、癌に特異的または癌に関連するヒストン修飾マーク、ならびに癌に特異的または癌に関連する血漿ＤＮＡ末端位置と組み合わせて、様々な癌に特異的または癌に関連する変化、例えば、単一ヌクレオチド変異を組み合わせ検出することによって、アクセス可能な情報提供的癌ＤＮＡ断片の数を増加させることができる。特定の癌に特異的または癌に関連する変化を、変異を特定する上での選別基準として使用してもよい。

【0163】

ＶＩＩ．遺伝子多型非依存的末端位置分析
他の実施形態において、好ましい終結位置は、（Ａ）異なる個体に由来する血漿ＤＮＡ断片の終結位置を比較することによって、または（Ｂ）異なる時点で取得した１人の個体に由来する試料の血漿ＤＮＡ断片の終結位置を比較することによって、得ることができる。

【0164】

Ａ．異なる病理学的状態及び生理学的状態を患う対象における好ましい終結位置間の比較
１．閾値を超える排他的セットの使用
ポアソン分布確率関数に基づいて、我々は、以前の節において記載される妊婦及びＨＣＣ患者の血漿断片の終結位置である、増加した確率を有するゲノム位置を特定した。この分析において、帰無仮説は、全ての血漿ＤＮＡ断片がランダムに断片化されるため、各ゲノム位置が血漿ＤＮＡ断片の末端である等しい確率を有するというものである。血漿ＤＮＡ断片は、平均で１６６塩基対のサイズであると想定された。ｐ値を、以下のように計算した。
ｐ値＝ポアソン（Ｎ_実数値，Ｎ_予想値）
式中、ポアソン（）はポアソン確率関数であり、Ｎ_実数値は特定のヌクレオチドで終結する読み取りの実数値であり、

【数4】

であり、分母における３×１０^９はゲノムにおけるヌクレオチドの数を表す。

【0165】

ＢｅｎｊａｍｉｎｉａｎｄＨｏｃｈｂｅｒｇの補正（Ｂｅｊａｍｉｎｉｅｔａｌ．ＪｏｕｒｎａｌｏｆｔｈｅＲｏｙａｌＳｔａｔｉｓｔｉｃａｌＳｏｃｉｅｔｙ，１９９５；５７：２８９－３００）を使用して、ｐ値を調節して、期待される＜１％の偽発見率（ＦＤＲ）を達成した。

【0166】

図２８Ａは、妊婦及びＨＣＣ患者の血漿ＤＮＡの好ましい終結位置の数を示す。セットＰは、妊婦において好ましい、２９００万個の終結位置を含有した。セットＱは、ＨＣＣ患者において好ましい、６００万個の終結位置を含有した。セットＳは重複セットであり、１５００万個の終結位置を含有した。

【0167】

我々は、ＨＣＣに好ましい終結位置上で終結する断片（セットＱ）が、妊娠に好ましい終結位置上で終結する断片（セットＰ）と比較して、癌由来ＤＮＡについて富化されていると仮定する。
したがって、我々は、比率_{ＨＣＣ／妊娠}を以下のように計算し、

【数5】

この比率を、上述の７１人のＨＣＣ患者における腫瘍ＤＮＡ画分と相関させた。

【0168】

図２８Ｂは、比率_{ＨＣＣ／妊娠}と、７１人のＨＣＣ患者の血漿中の腫瘍ＤＮＡ画分との間に正の相関が観察されたことを示す。これらの結果は、特定の状態の好ましい終結部位上で終結する断片の数または割合が、その状態を検出するのに、または患部臓器から放出されるＤＮＡの量を定量化するのに有用であり得ることを示唆する。

【0169】

２．より高い終結率を有するゲノム位置のセットの使用
別の実施形態において、そのような位置上で終結する断片の数と、その位置を網羅するがその上では終結しない断片の数との間の比率を決定することによって、好ましい終結部位を特定することができる。図２９Ａは、好ましい末端終結比（ＰＥＴＲ）の計算を説明する。

【数6】

【0170】

図２９Ａは、ＰＥＴＲの概念の説明を示す。各線は、１つの血漿ＤＮＡ断片を表す。これらの断片は、ａ～ｇと標識される。断片ａ、ｂ、ｃ、及びｄは、対象となるヌクレオチド上で終結した。断片ｅ、ｆ、及びｇは、対象となるヌクレオチドを網羅するが、そのような位置上では終結しない。この例示的な例において、ＰＥＴＲは、４／３、すなわち、１．３３に等しい。他の実施形態において、分母は、ＤＮＡ断片がその位置上で終結するかどうかに関わらず、ヌクレオチドを網羅するＤＮＡ断片の数であり得る。

【0171】

ＰＥＴＲの計算を使用して、異なる疾患状態を患う個体において好ましい末端であるヌクレオチド位置を特定することができる。以下の例は、ＰＥＴＲの有用性を実証する。既に言及したＨＣＣ患者の血漿試料、及び慢性Ｂ型肝炎ウイルス（ＨＢＶ）感染症を有するが癌は有しない対象（ＨＢＶ保因者）の血漿試料を比較した。ＨＢＶ保因者の血漿ＤＮＡ試料を、２１５×半数体ゲノム範囲まで配列決定した。各対象の各ゲノム位置について、ＰＥＴＲを計算した。７，３５０，０６７個のゲノム位置（セットＨ）が、ＨＢＶ保因者と比較して、ＨＣＣ患者において少なくとも４倍より高いＰＥＴＲを有するものとして特定された。これらの位置は、ＨＢＶ保因者と比較して、ＨＣＣ患者において血漿ＤＮＡ断片の末端である少なくとも４倍増加した確率を有した。他の倍、例えば、１．５倍、２倍、及び３倍の差異が使用され得る。

【0172】

１１人の独立したＨＣＣ患者に由来する血漿試料を、より一層低い配列決定深度まで更に配列決定した。２８００万個の配列決定された読み取りの平均を、これら１１個の血漿試料から得た。これら１１人のＨＣＣ患者のそれぞれの、７，３５０，０６７個のセットＨの位置の平均ＰＥＴＲを計算し、血漿中の腫瘍ＤＮＡ画分と相関させた。既に記載したように、血漿中のコピー数異常の大きさに基づいて、血漿中の腫瘍ＤＮＡ画分を計算した（Ｃｈａｎｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２０１５；１１２：Ｅ１３１７－２５）。

【0173】

図２９Ｂは、１１人のＨＣＣ患者における、血漿中の腫瘍ＤＮＡ画分とセットＨの位置のＰＥＴＲとの間の相関を示す。２つのパラメータ間に正の相関を観察することができ、これは、ＨＣＣに好ましい（セットＨ）位置の平均ＰＥＴＲが血漿中の腫瘍ＤＮＡの量を示すのに有用であることを示唆する。

【0174】

３．終結位置が肝臓に関連することの確認
ＨＣＣ血漿ＤＮＡ試料中またはＨＢＶ血漿ＤＮＡ試料中に存在する好ましい終結位置が肝臓に関連することを示すために、我々は、ＨＣＣの外科的除去の前後で、患者から収集した血漿試料中でのそれらの存在を探索した。データを表１に示す。手術前後の試料をそれぞれ、１７×及び２０×半数体ゲノム範囲まで配列決定した。

【表1】

表１は、ＨＣＣを有する患者における肝臓腫瘍を除去するための手術前後に収集した血漿試料中の、ＨＣＣに好ましい終結位置及びＨＢＶに好ましい終結位置を示す。

【0175】

表１に見ることができるように、ＨＣＣに好ましい終結位置及びＨＢＶに好ましい終結位置の両方の数の減少が存在する。ＨＢＶデータは、好ましい終結位置の大部分が肝臓に由来し、それらの減少は手術後の肝臓細胞質量の減少によるものであることを示唆する。したがって、血漿中への肝臓由来無細胞ＤＮＡ分子の放出の減少が存在する。手術前の試料中には５倍超より多いＨＣＣに好ましい終結位置が存在し、これが手術後に消失したことに留意することは興味深い。手術後の消失を示した好ましい末端のうちのいくつかは、肝臓に由来するものである。同一の手術前の試料中に、ＨＢＶに好ましい末端よりも多くのＨＣＣに好ましい末端が検出されたという観察を考慮すると、これらの末端の大部分は、単に一般的に肝臓に関連しているだけでなく、ＨＣＣに特異的なものであることを示唆する。

【0176】

これらのデータから導出され得る、いくつかの用途が存在する。このデータは、無細胞ＤＮＡまたは血漿ＤＮＡの好ましい末端の検出を使用して、癌治療の監視をすることができることを示す。例えば、手術後の好ましい末端の減少は、ＨＣＣの外科的除去の成功を示す。腫瘍が完全に除去されなかったり、除去に成功しなかったりした場合、血漿ＤＮＡの好ましい末端の量または数量は手術後に実質的な減少を示さないだろう。これは、残っている腫瘍または転移巣が、ＨＣＣに好ましい終結位置を有する無細胞ＤＮＡまたは血漿ＤＮＡの継続した放出の供給源であるためである。このデータは、無細胞ＤＮＡの好ましい末端の分析に基づく治療の監視は、比較的浅い配列決定深度で達成され得ることを示す。

【0177】

このデータはまた、組織に関連するか、または癌に関連する血漿ＤＮＡの好ましい終結位置を使用して、癌を宿している組織を含む病理組織を特定することができることも示す。例えば、異なる臓器に由来する無細胞ＤＮＡの好ましい末端の複数のセットを使用することができる。その後、様々な組織に起源を持つ無細胞ＤＮＡの相対量を決定することができるだろう。したがって、これは、無細胞ＤＮＡ組織デコンヴォルーションのアプローチとして機能し得る。このアプローチによって、対照試料から確立された基準値からの最大の偏差を有する（有意に増加または有意に減少する）と示される組織は、病理（例えば、炎症、もしくはちょうど慢性Ｂ型肝炎ウイルス保因者におけるようなウイルス感染症）または癌を有する臓器または組織であるだろう。

【0178】

血漿ＤＮＡのＨＣＣに好ましい末端が癌またはＨＣＣに特異的であることを支持する別の証拠、我々は、ＨＣＣまたはＨＢＶに好ましい末端を示す血漿ＤＮＡ分子のサイズプロファイルを研究した（図３０）。

【0179】

図３０は、ＨＣＣに好ましい末端、ＨＢＶに好ましい末端、または共有された末端で終結する血漿ＤＮＡ分子中に検出される、短ＤＮＡ（＜１５０塩基対）の割合を示す。図３０は、ＨＣＣに好ましい末端を呈する血漿ＤＮＡ分子が一般に、ＨＢＶに好ましい末端を示す血漿ＤＮＡ分子よりも一層短い（高い短ＤＮＡの割合）ことを示す。Ｊｉａｎｇら（Ｊｉａｎｇｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２０１５；１１２：Ｅ１３１７－２５）は以前に、別のアプローチを使用して、腫瘍由来血漿ＤＮＡ分子がバックグラウンド非腫瘍ＤＮＡよりも短いことを示した。ＨＣＣに好ましい末端を有する血漿ＤＮＡ分子はより一層短いため、それらは腫瘍に由来する可能性が非常に高い。したがって、ＨＣＣに好ましい末端を有する血漿ＤＮＡ分子を、より低い配列決定深度ですら検出する確率を改善することができ、短ＤＮＡを有する試料を富化することができる。

【0180】

４．ウインドウに基づく終結比
別の実施形態において、ＨＣＣに好ましい位置を、隣接するヌクレオチドを含むように伸長してもよい。図３１Ａが、この方法を説明する。ウインドウＡ内で終結する断片の数とウインドウＢ内で終結する断片の数との間の、ウインドウに基づくＰＥＴＲ（ｗ－ＰＥＴＲ）比が決定される。ウインドウＡ及びウインドウＢのサイズは、所望される性能を達成するように調節され得る。差異ウインドウサイズの性能は、実験的に得ることができる。ウインドウＡのサイズは、例えば、５塩基対、６塩基対、７塩基対、８塩基対、９塩基対、１０塩基対、１５塩基対、２０塩基対、２５塩基対、及び３０塩基対に設定され得るが、これらに限定されない。ウインドウＢのサイズは、ウインドウＡのサイズよりも大きく、例えば、２０塩基対、２５塩基対、３０塩基対、４０塩基対、５０塩基対、６０塩基対、７０塩基対、８０塩基対、１００塩基対、１２０塩基対、１４０塩基対、１６０塩基対、１８０塩基対、及び２００塩基対に設定され得るが、これらに限定されない。以下の例示的な例において、ウインドウＡ及びウインドウＢのサイズはそれぞれ、２０塩基対及び１５０塩基対に設定した。

【0181】

図３１Ａは、ｗ－ＰＥＴＲの原理の説明を示す。ｗ－ＰＥＴＲの値は、ウインドウＡ内で終結するＤＮＡ断片の数と、ウインドウＢ内で終結するＤＮＡ断片の数との間の比率として計算される。標準ＰＥＴＲが実装されるとき、ウインドウＡはより大きく、幅１のものであり得る。ウインドウＢは、より大きなものとして示される。両方のウインドウは、好ましい終結位置で中央にあるものとして示されるが、ウインドウの他の配置が使用されてもよい。いくつかの実施形態において、ウインドウＡは、好ましい終結ウインドウに対応し得る。

【0182】

図３１Ｂは、１１人のＨＣＣ患者における、腫瘍ＤＮＡ画分とｗ－ＰＥＴＲの値との間の相関を示す。これらの結果は、ｗ－ＰＥＴＲが、癌患者の血漿中の腫瘍由来ＤＮＡの量を決定するのに有用であることを示唆する。

【0183】

５．１試料当たりの最高終結位置の使用
我々は、１人の妊婦からのデータ、１人の慢性Ｂ型肝炎ウイルス保因者（ＨＢＶ）からのデータ、１人の肺癌患者からのデータ、及び２人のＨＣＣ患者からのデータの間の、上位１００万個の最も高頻度に提示される無細胞ＤＮＡ終結位置を比較した。ＨＣＣ患者について、無ＰＣＲプロトコルを使用して、一方の症例（ＨＣＣ）の配列決定ライブラリを調製し、ＰＣＲに基づくプロトコルを使用して、他方（ＨＣＣ（ＰＣＲ）の試料を調製した。全ての他の試料は、無ＰＣＲプロトコルを使用して調製する。図３２は、臍帯血液血漿試料（２１０×半数体ゲノム範囲）と比較した場合の、研究試料のそれぞれの血漿試料中に検出される、一般的に共有される好ましい終結位置の割合を示す。

【0184】

図３２は、臍帯血液血漿試料（２１０×半数体ゲノム範囲）と比較した場合の、研究試料のそれぞれの血漿試料中に検出される、一般的に共有される好ましい終結位置の割合を示す。ＰＣＲを使用して検出された、妊娠、ＨＣＣ、ＨＢＶ、肺癌、及びＨＣＣのそれぞれの常染色体のパーセンテージを示す。

【0185】

高レベルの共通性が、血漿ＤＮＡ断片化がランダムなプロセスではないという概念を再び支持する。ＨＣＣ及びＨＣＣ（ＰＣＲ）データは、好ましい終結位置の分析が、ＰＣＲによるか、またはＰＣＲによらない、いずれのライブラリ調製プロトコルを使用しても実行され得ることを示す。共通末端を示さない血漿ＤＮＡ分子の割合が依然として存在することに留意することは興味深い。非共通末端は、試料の生理学的状態、例えば、妊娠、胎児、もしくは胎盤、または疾患状態、例えば、癌を代表する、好ましい末端である。血漿ＤＮＡの好ましい末端のより詳細な比較を、図３３に示す。

【0186】

図３３は、２つ以上の試料中に一般的に観察された好ましい終結位置の数、及びいずれか１つの試料中にのみ観察された好ましい終結位置の数を示す、ベン図を示す。肺癌患者の血漿ＤＮＡを、１７５×半数体ゲノム範囲で配列決定した。

【0187】

図３３から、１１５，３０５個の好ましい末端が、３つ全ての試料にわたって共通していることは注目すべきである。これらは、バックグラウンド血漿ＤＮＡの主要供給源、例えば、血液細胞に由来している可能性が高い。この分析はまた、ＨＣＣ患者及び肺癌患者の血漿試料中に観察された、６１，０３５個の好ましい終結位置が存在したことも示す。これらの好ましい末端は、いくつかの癌に共通であり得る。したがって、それらは癌に由来するものである。一方、ＨＣＣ患者（４７９，７６６個の末端）の血漿ＤＮＡ分子中にのみ、または肺癌患者（７４９，２３７個の末端）の血漿ＤＮＡ分子中にのみ検出されたが、両方には検出されなかった末端が存在する。したがって、これらの好ましい末端は、高レベルの特異性を示す。それらは、特定の癌組織型に特異的である。同一の理論的根拠に基づいて、類似した発掘方略を使用して、特定の臓器の癌及び特定の組織学型の癌に特異的な末端を特定することができる。異なるクラスの末端を呈する血漿ＤＮＡ分子は、様々な用途に使用することができる。例えば、特定の癌の種類を直接検出またはスクリーニングするための、ＨＣＣまたは肺癌に特異的な末端の検出を試みることができる。ＨＣＣ試料及び肺癌試料に共通する末端を使用して、一般に癌を検出またはスクリーニングすることができる。最も一般的な共通末端を、疾患に関連する好ましい末端の検出量を正規化するための分母として使用することができる。一般的な共通末端はまた、任意の疾患の徴候をスクリーニングする目的（一般的な健康スクリーニングなど）で検出されてもよい。そのような試験の陽性の所見は、より詳細な調査のために医師のもとに来診する警告として機能し得る。

【0188】

Ｂ．試料個体であるが異なる時点で収集された試料間の好ましい終結位置の間の比較
特定の状態の好ましい終結位置はまた、異なる時点で収集された試料の断片末端を比較することによっても得ることができる。例えば、癌患者において、１つの血漿試料が診断時点で収集され得、他の試料が治療後（例えば、腫瘍の外科的切除後）に収集され得る。終結位置の差異は、後者における癌由来ＤＮＡの寄与、または癌に対する身体的応答の不在を潜在的に反映する。別の例において、胎児の出産前後に取得された、妊婦から収集された血漿試料間の比較を行ってもよい。

【0189】

以下の例において、８人の妊婦から収集された血漿試料を分析した。各妊婦について、出産前に血漿試料を収集した。８人中６人の女性において、出産時点で追加の血漿試料を収集した。８人の妊婦から、出産の６時間後から複数の試料を収集し、合計２８個の出産後の血漿試料を収集した。血漿ＤＮＡ試料を、６．４９×半数体ゲノム範囲の平均深度まで配列決定した。出産前及び出産時点で収集された試料の配列決定された読み取りをＰＥＴＲ分析のためにともにプールし、これらの読み取りを「出産前の読み取り」と呼ぶ。出産の６時間後以降に収集された試料の配列決定された読み取りをＰＥＴＲ分析のためにプールし、これらの読み取りを「出産後」の読み取りと呼ぶ。妊娠に好ましい末端であったヌクレオチド位置を特定するために、「出産後」の読み取りと比較して、「出産前」の読み取りにおいて少なくとも４倍より高いＰＥＴＲを有する位置を回収した。合計４５，２８１個の部位を特定した。

【0190】

それぞれが男の胎児を担持する、８人の妊娠第一期の妊婦の独立したコホートを募集し、彼女たちの血漿ＤＮＡを配列決定した。２０００万個の配列決定された読み取りの中央値を、これらの血漿ＤＮＡ試料から得た。８人の妊婦のそれぞれについて、４５，２８１個の部位の平均ＰＥＴＲ値を決定し、これらの値を、Ｙ染色体に整列する読み取りの割合から推定された血漿中の胎児ＤＮＡ画分と相関させた（Ｃｈｉｕｅｔａｌ．ＢＭＪ２０１１；３４２：ｃ７４０１）。

【0191】

図３４Ａは、血漿中の胎児ＤＮＡ画分と、「出産前」血漿ＤＮＡ試料及び「出産後」血漿ＤＮＡ試料の比較を通して特定された位置のセット上の、平均ＰＥＴＲとの間の相関を示す。これらの結果は、特定された位置のセットが胎児由来ＤＮＡにとって好ましいこと、及びＰＥＴＲ分析が母体血漿中の胎児ＤＮＡの定量化に有用であることを示唆する。

【0192】

既に記載したアプローチと同様に、我々は、ｗ－ＰＥＴＲ分析を、この妊娠に好ましい位置のセットに適用した。ウインドウＡ及びウインドウＢのサイズはそれぞれ、２０塩基対及び１５０塩基対に設定した。他の実施形態において、他のウインドウサイズを使用してもよい。

【0193】

図３４Ｂは、血漿中の胎児ＤＮＡ画分と、「出産前」血漿ＤＮＡ試料及び「出産後」血漿ＤＮＡ試料の比較を通して特定された位置のセット上の、平均ｗ－ＰＥＴＲとの間の相関を示す。これらの結果は、これらの妊娠に好ましい位置に対するｗ－ＰＥＴＲ分析が、母体血漿中の胎児ＤＮＡの定量化に有用であることを示唆する。

【0194】

Ｃ．同一の条件間の共通末端点
我々は、２人の妊婦の血漿中で、上位１００万個の最も高頻度に観察された好ましい終結位置を比較した（図３５Ａ）。

【0195】

図３５Ａは、妊娠１８週目の妊婦（妊婦対象１）及び妊娠３８週目の妊婦（妊婦対象２）の２人の間で、上位１００万個の最も高頻度に観察された血漿ＤＮＡに好ましい終結位置を示す。このデータは、これらの女性が２１７，９４７個の好ましい末端を共有したことを示す。両方の女性が妊娠していることを考慮すると、これらの末端は、胎児、胎盤、または妊娠中の増加した細胞死（血漿ＤＮＡの生成）を有する臓器に由来する。したがって、これらのマーカーは、妊娠または胎児の健康を監視するのに最も有用である。

【0196】

我々は、この試料セットのＰＥＴＲ値を計算した。興味深いことに、２つの母体血漿試料中の血漿ＤＮＡ分子のＰＥＴＲ値間に相関（ピアソン’ｒ＝０．５２、ｐ値＜０．０００１）が観察された（図３５Ｂ）。

【0197】

図３５Ｂは、２人の妊婦の血漿中で、上位１００万個の最も高頻度に観察された好ましい終結位置のＰＥＴＲ値の比較を示す。再び繰り返すと、高程度の相関は、血漿ＤＮＡ断片化が高度に組織化されていることを示す。いくつかの終結部位は、他の終結部位より「好ましい」。興味深いことに、上位１００万個の「最も好ましい」部位間ですら、ＰＥＴＲの比較的広い動的範囲が存在する。例えば、疾患について試験するための標的化検出のために、好ましい末端のいくつかまたはサブセットを選択する場合、対象となる疾患群間で一般的に共有されるもの（理想的には、疾患及び特に非常に高いＰＥＴＲを有する終結位置を有しない対照群において観察されないか、またはより一般的でないもの）を選択するべきである。

【0198】

ＶＩＩＩ．組織に特異的な終結位置を使用する方法
図３６は、本発明の実施形態に従う、生体試料を分析して、混合物中の第１の組織型の比例的寄与の分類を決定する方法３６００の流れ図である。生体試料は、第１の組織型を含む複数の組織型に由来する無細胞ＤＮＡ分子の混合物を含む。

【0199】

ブロック３６１０で、第１の組織型の無細胞ＤＮＡ分子の末端が閾値を超える比率で生じる、第１のゲノム位置のセットを特定する。ブロック３６１０についての更なる詳細、及び好ましい終結位置の特定を実行する他のブロックの更なる詳細は、節Ｘ．Ｂにある。他の方法の他のブロックの詳細もまた、節Ｘに見出すことができる。

【0200】

ブロック３６２０で、対象の生体試料に由来する第１の複数の無細胞ＤＮＡ分子を分析する。無細胞ＤＮＡ分子の分析は、無細胞ＤＮＡ分子の少なくとも１つの末端に対応する、基準ゲノムにおけるゲノム位置を決定することを含む。ブロック３６２０は、無細胞ＤＮＡ分子を分析するための他のブロック、例えば、ブロック１３２０に類似した様式で実行することができる。

【0201】

ブロック３６３０で、第１の数の第１の複数の無細胞ＤＮＡ分子が複数のウインドウのうちの１つ内で終結することを判定する。判定は、第１の複数の無細胞ＤＮＡ分子の分析に基づいて実行する。各ウインドウは、第１のゲノム位置のセットのうちの少なくとも１つを含む。

【0202】

ブロック３６４０で、複数のウインドウのうちの１つ内で終結する第１の複数の無細胞ＤＮＡ分子の相対的存在量を算出する。相対的存在量は、第２の数の無細胞ＤＮＡ分子を使用して第１の数の第１の複数の無細胞ＤＮＡ分子を正規化することによって、決定することができる。第２の数の無細胞ＤＮＡ分子は、第１のゲノム位置のセットを含む複数のウインドウの外側の第２のゲノム位置のセットで終結する、無細胞ＤＮＡ分子を含む。

【0203】

図２７Ａに記載されるように、第２のゲノム位置のセットは、第２の組織型の無細胞ＤＮＡ分子の末端が、少なくとも１つの追加の試料中で閾値を超える比率で発生するようなものであってもよく、第２の組織型は、少なくとも１つの追加の試料中に複数の第２の組織に特異的な対立遺伝子を有する。第２のゲノム位置のセットは、複数の第２の組織に特異的な対立遺伝子のうちの少なくとも１つを含む、少なくとも１つの追加の試料の無細胞ＤＮＡ分子を使用して、決定することができる。セットＧは図２７Ｂを決定するのに使用される両方のセットから除外され得るため、第１の組織型と第２の組織型との間で共有された対立遺伝子を有する無細胞ＤＮＡ分子の末端が、閾値を超える第２の比率で発生するゲノム位置は、第１のゲノム位置のセットから除外され得、第２のゲノム位置のセットから除外され得る。

【0204】

ブロック３６５０で、相対的存在量を、第１の組織型の比例的寄与が既知である１つ以上の較正試料から決定される、１つ以上の較正値と比較することによって、第１の組織型の比例的寄与の分類を決定する。

【0205】

比例的寄与が高い場合、治療的介入または対象の撮像（例えば、第１の組織型が腫瘍に対応する場合）などの更なる措置が実行され得る。例えば、調査は撮像モダリティを使用してもよく、例えば、対象（対象全体または身体の特定の部分（例えば、胸部もしくは腹部）、あるいは特に候補臓器のもの）のコンピュータ断層撮影（ＣＴ）スキャンまたは磁気共鳴撮像（ＭＲＩ）を実行して、対照における腫瘍の存在を確認または排除してもよい。腫瘍の存在が確認された場合、治療、例えば、（メスもしくは放射線による）手術または化学療法が実行されてもよい。

【0206】

治療は、決定された癌のレベル、特定された変異、及び／または原発組織に従って提供され得る。例えば、（例えば、多型実装例の）特定された変異は、特定の薬物または化学療法によって標的化され得る。原発組織を使用して、手術または任意の他の形態の治療を誘導することができる。そして、癌のレベルを使用して、任意の種類の治療についてどれほど積極的にするかを決定することができ、これはまた、癌のレベルに基づいても決定することができる。

【0207】

ＩＸ．遺伝子型の決定
特定の組織型について好ましい終結位置が決定され得ることを考慮すると、そのような好ましい終結位置で終結する無細胞ＤＮＡ分子は、その組織に由来する高い尤度を有する。状況によっては、無細胞ＤＮＡ混合物中の組織型は、特定のゲノム位置で、他の組織型と比較して異なる遺伝子型を有し得る。例えば、胎児組織または腫瘍組織は、異なる遺伝子型を有し得る。無細胞ＤＮＡ分子は、対象となる組織型に由来する高い尤度を有し得るため、そのような位置で終結する無細胞ＤＮＡ分子を分析して、その位置の組織型の遺伝子型を決定することができる。このように、好ましい終結位置をフィルタとして使用して、その組織型に由来するＤＮＡを特定することができる。

【0208】

Ａ．胎児遺伝子型
配列決定された血漿ＤＮＡ断片の終結位置に関する情報を使用して、どの母体対立遺伝子が妊婦から胎児に遺伝しているかを決定することができる。ここで、我々は、仮定上の例を使用して、この方法の原理を説明する。我々は、母親、父親、及び胎児の遺伝子型がそれぞれ、ＡＴ、ＴＴ、及びＴＴであると想定する。胎児遺伝子型を決定するために、我々は、胎児が母親からＡまたはＴ対立遺伝子を遺伝しているかを決定する必要がある。我々は以前に、相対的変異遺伝子量（ＲＭＤ）分析と呼ばれる方法を記載している（Ｌｕｎｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ２００８；１０５：１９９２０－５）。この方法において、母体血漿中の２つの母体対立遺伝子の遺伝子量が比較されるだろう。胎児が母体Ｔ対立遺伝子を遺伝している場合、胎児はＴ対立遺伝子がホモ接合であるだろう。このシナリオにおいて、Ｔ対立遺伝子は、Ａ対立遺伝子と比較して、母体血漿中で過剰発現されるだろう。他方、胎児が母親から対立遺伝子を遺伝している場合、胎児の遺伝子型はＡＴであるだろう。このシナリオにおいて、母親及び胎児の両方のＡＴがヘテロ接合であるため、Ａ及びＴ対立遺伝子は母体血漿中におよそ同一の遺伝子量で存在するだろう。したがって、ＲＭＤ分析において、母体血漿中の２つの母体対立遺伝子の相対的遺伝子量が比較されるだろう。配列決定された読み取りの終結位置を分析して、ＲＭＤアプローチの正確性を改善することができる。

【0209】

図３７は、胎児に特異的な終結位置に近い基準ゲノムに整列させると、異なる対立遺伝子を担持する母体血漿ＤＮＡ分子を示す。実線の分子は母親に由来し、破線の分子は胎児に由来する。胎児ＤＮＡ分子は、妊娠に特異的な終結位置上で終結する可能性がより高い。一実施形態において、妊娠に特異的な終結位置上で終結する分子は、ＲＭＤ分析においてより大きな加重を与えられてもよい。別の実施形態において、妊娠に特異的な位置上で終結する血漿ＤＮＡ断片のみが、下流分析に使用される。この選択は、胎児由来血漿ＤＮＡ断片を下流分析のために潜在的に富化する。

【0210】

図３７は、遺伝子型がＡＴである妊婦における血漿ＤＮＡ分子を示す。母体組織に由来するＤＮＡ断片は実線であり、胎児に由来するＤＮＡ断片は破線である。胎児ＤＮＡ分子は、妊娠に特異的な終結位置上で終結する可能性がより高い。

【0211】

この例示的な例において、妊娠に特異的な終結位置上で終結する２つの分子の両方が、Ｔ対立遺伝子を担持する。一実施形態において、妊娠に特異的な終結位置上で終結する２つの分子のみを下流分析に使用し、胎児遺伝子型をＴＴと推定した。別の実施形態において、Ｔ対立遺伝子を担持する２つの胎児由来分子は、妊娠に特異的な終結位置上で終結したため、これらの分子には、ＲＭＤ分析においてより高い加重が与えられるだろう。妊娠に特異的な終結位置上で終結する分子に、異なる加重（例えば、１．１、１．２、１．３、１．４、１．５、２、２．５、３、及び３．５であるが、これらに限定されない）が与えられてもよい。

【0212】

一例として、ある座位がヘテロ接合かどうかを判定するための基準は、それぞれが少なくとも所定のパーセンテージ（例えば、３０％または４０％）のその座位に整列された読み取りにおいて出現する、２つの対立遺伝子の閾値であり得る。１つのヌクレオチドが十分なパーセンテージ（例えば、７０％以上）で出現する場合、座位は、ＣＧにおいてホモ接合であると判定することができる。

【0213】

Ｂ．癌遺伝子型
癌に特異的な終結位置について、類似した技術を実行することができる。例えば、癌に好ましい終結位置を上述のように特定することができる。癌に好ましい終結位置上で終結する無細胞ＤＮＡ分子を特定し、分析することができる。このセットの各無細胞ＤＮＡ分子について、この位置に対応する（例えば、整列される）塩基を決定することができ、各塩基について、全塩基のパーセンテージを算出することができる。例えば、この位置上で終結する無細胞ＤＮＡ分子上に見られるＣのパーセンテージを決定することができる。Ｃが対象の健常な組織中に見られない場合、十分な数の（例えば、閾値数を超える）Ｃが特定されるとき（これは、試料中で測定される腫瘍ＤＮＡ画分に依存し得る）、Ｃを変異として特定することができる。

【0214】

Ｃ．選別技術
終結位置を使用する以外の他の基準を使用して、腫瘍組織に由来する無細胞ＤＮＡ分子を選別することができる。他の基準はまた、胎児のシナリオにも使用してもよい。

【0215】

癌遺伝子型（例えば、癌に特異的な変異を含む）、及びそのような遺伝子型を使用する任意の試験（例えば、癌のレベルを決定するための変異負荷の使用）を特定する上での特異性は、変異を有する１つ以上の配列読み取りが整列されている座位に選別基準を適用することによって、改善することができる。癌の一例として、高い特異性は、遺伝子またはゲノムシグネチャーを、それが癌に関連するという高い信頼が存在するときにのみ、正であるとスコア化することよって達成することができる。これは、配列決定の数、及び変異として誤認され得る整列誤差を最小化することによって、例えば、健常な対照の群のゲノムプロファイルと比較することによって達成することができ、かつ／またはその人自身の体質的ＤＮＡと比較することによって達成することができ、かつ／またはその人の初期のゲノムプロファイルと比較することによって達成することができる。

【0216】

様々な基準を選別基準として適用して、腫瘍に由来する故に、情報提供的癌ＤＮＡ断片である資格がある、無細胞ＤＮＡ断片の尤度を評価することができる。各選別基準は、個々に、独立して、等分加重もしくは他の加重とともに集合的に、または特定の順序で連続的に、または先行する選別ステップの結果によって条件的に使用してもよい。条件的な使用について、ベイジアンに基づくアプローチ及び分類または決定木に基づくアプローチが使用されてもよい。ある基準の個々の使用は、１つの基準のみの使用を意味し得る。独立した使用は、２つ以上の選別基準を伴い得るが、各選別基準は、特定の順序の連続用途とは対照的に、別の選別基準の適用には依存しない（例えば、並列適用が実行され得る）。加重を使用する集合的使用の一例として、機械学習技術が使用されてもよい。例えば、教師付き学習において、既知の分類を有する試料の測定された変異負荷を使用して、任意のモデルを訓練することができる。多数（例えば、数百、数千、または数百万）の個人に由来する配列決定データを使用して、モデルを訓練することができる。より単純な形態において、そのような既知の試料を使用して、選別基準から決定された１つ以上のスコアの閾値値を決定して、ある変異が有効か否かを決定することができる。

【0217】

ＤＮＡ断片が２つ以上の癌に特異的な変化を示す場合、それらには、より高い情報提供性または癌特異性の加重が与えられてもよい。例えば、多くの癌は、特に非プロモーター領域で包括的に低メチル化されている。癌ＤＮＡは、血漿中の非癌ＤＮＡよりも短いことが示されている。腫瘍由来血漿ＤＮＡ断片は、いくつかの特定の位置で断片化する傾向がある。したがって、一端または両端が癌関連末端位置にある、サイズが短く（例えば、＜１５０塩基対）（Ｊｉａｎｇｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ２０１５；１１２：Ｅ１３１７－１３２５）、単一ヌクレオチド変異を示し、非プロモーター領域に局在化し、低メチル化されたＣｐＧ部位を有する血漿ＤＮＡ断片は、癌に関連する可能性がより高いと見なされるだろう。低メチル化されたＤＮＡの検出は、亜硫酸水素塩ＤＮＡ変換、またはメチル－シトシンを非メチル－シトシンから区別し得る直接的単一分子配列決定に使用によって達成され得る。この用途において、我々は、情報提供的癌ＤＮＡ断片の特定における特異性を増加させるためのプロセス、プロトコル、及びステップを記載する。例えば、１つ以上の選別基準を使用して、特異性を増加させることができる。例えば、１つ以上の選別基準を使用して、特異性を、少なくとも約８０％、９０％、９５％、または９９％の特異性まで増加させることができる。

【0218】

１．血漿ＤＮＡ末端位置の使用
上述のように、末端ヌクレオチド（終結位置）の座標に基づく、潜在的な癌に特異的もしくは癌に関連する変異または胎児変異の選別が実行されてもよい。上述のように、我々は、ランダムではなく、原発組織に基づいて変動する、ＤＮＡ断片の末端位置を特定した。したがって、末端位置を使用して、推定上の変異を有する配列読み取りが実際に胎児組織または腫瘍組織に由来する、尤度を決定することができる。

【0219】

近年、血漿ＤＮＡの断片化パターンがランダムではないことが示されている（Ｓｎｙｄｅｒｅｔａｌ．Ｃｅｌｌ２０１６；１６４：５７－６８及びＰＣＴＷＯ２０１６／０１５０５８Ａ２）。血漿ＤＮＡ断片化パターンは、血漿ＤＮＡ分子に寄与している細胞のゲノムにおける、ヌクレオソーム配置、転写因子結合部位、デオキシリボヌクレアーゼ切断部位または高感受性部位、発現プロファイル（Ｓｎｙｄｅｒｅｔａｌ．Ｃｅｌｌ２０１６；１６４：５７－６８及びＰＣＴＷＯ２０１６／０１５０５８；Ｉｖａｎｏｖｅｔａｌ．ＢＭＣＧｅｎｏｍｉｃｓ２０１５；１６Ｓｕｐｐｌ１３：Ｓ１）、ならびにＤＮＡメチル化プロファイル（Ｌｕｎｅｔａｌ．ＣｌｉｎＣｈｅｍ２０１３；５９：１５８３－１５９４）によって影響される。したがって、断片化パターンは、異なる原発組織の細胞について異なる。より高頻度の断片を示すゲノム領域が存在する一方で、その領域内の実際の血漿ＤＮＡ切断部位は、依然としてランダムであり得る。

【0220】

我々は、異なる組織が、異なる切断部位つまり末端位置を有する血漿ＤＮＡ断片の放出に関連付けられると仮定する。換言すると、特定の切断部位ですら、ランダムではない。実際、我々は、癌患者におけるサブセットの血漿ＤＮＡ分子が、癌を有しない患者とは異なる末端位置を示すことを示す。いくつかの実施形態において、そのような癌に関連する末端位置を有する血漿ＤＮＡ分子を、情報提供的癌ＤＮＡ断片として使用しても、そのような末端位置情報を、例えば、１つ以上の他の選別基準とともに、選別基準として使用してもよい。したがって、そのような癌に関連する血漿ＤＮＡ末端位置の特定によって、血漿ＤＮＡ断片を情報提供的癌ＤＮＡ断片としてスコア化し得るか、または差動加重をそのような断片の末端位置に基づくものとし得る。そのような基準を使用して、癌、特定の臓器、または特定の臓器の癌に起源を持つ断片の尤度を評価することができる。そのような加重を使用して、その位置で見られる特定の塩基の合計パーセンテージに対する、特定のＤＮＡ断片の特定の塩基の寄与を修正することができる。

【0221】

したがって、血漿ＤＮＡ断片が情報提供的癌ＤＮＡ断片であるという確率は、それが癌に関連付けられる末端位置だけでなく、推定上の変異及び／または癌に関連するメチル化変化も示す場合に、より一層高いだろう。様々な実施形態においてもまた、そのような断片の状態及びその長さ、またはそのような及び他のパラメータの任意の組み合わせを考慮してもよい。２つの末端（または以下の節に記載されるように潜在的に最大４つの末端）を有する血漿ＤＮＡ断片について、その末端の一方もしくは両方が癌に関連付けられるか、または癌に関連付けられる組織型に由来するかどうかを考慮することによって、それを癌由来断片として特定するための加重を更に修正してもよい。一実施形態において、末端位置に基づく類似したアプローチを使用して、他の病理または生物学的プロセス（例えば、加齢プロセスによる変異もしくは環境変異原性因子による変異）に関連付けられる変異を検出することもできる。

【0222】

類似したアプローチを使用して、胎児を担持する妊婦の血漿中のＤＮＡを配列決定することによって、その胎児のデノボ変異を特定することもできる。それ故に、胎盤に特異的または比較的特異的である末端位置を特定した後、母体血漿中のそのようなＤＮＡ断片が、胎盤に特異的な末端位置または胎盤で富化された末端位置もまた担持する場合、より高い加重の原因は、推定上の胎児デノボ変異が真のものであることとすることができる。血漿ＤＮＡ断片が２つの末端を有するため、その末端の一方もしくは両方が胎盤に関連付けられるかを考慮することによって、それを胎児由来断片として特定するための加重を更に修正してもよい。

【0223】

図１６に示されるように、ちょうど５３６，７７２個のＨＣＣに特異的な終結位置で終結する末端ヌクレオチドを有する血漿ＤＮＡ断片は、腫瘍に由来する可能性がより高いだろう。対照的に、ちょうど妊娠に特異的な終結位置、または２つの場合によって共有される位置で終結する末端ヌクレオチドを有する血漿ＤＮＡ断片は、腫瘍に由来する可能性がより低く、潜在的には妊娠に特異的な終結位置が可能性がより低く、加重を使用する任意の実施形態において、より低い加重が与えられる。

【0224】

したがって、ＨＣＣの症例に特異的である上位終結位置のリストを使用して、癌に関連する変異を選択することができ、妊娠の場合に特異的であるか、または両方の場合によって共有される上位終結位置のリストを使用して、偽陽性変異を選別して除去することができる。類似した手順を使用して、非侵襲的出生前検査で胎児変異を特定し、偽陽性変異を選別して除去することができる。

【0225】

一般に、そのような生物学的に関連する血漿ＤＮＡ末端位置を特定するために、異なる疾患または疫学的バックグラウンドまたは生理学的プロファイルを有する個人の群に由来する血漿ＤＮＡ試料が、そのような疾患またはバックグラウンドまたはプロファイルを有しない別の個人の群に由来する試料と比較され得る。一実施形態において、各試料内で血漿ＤＮＡ断片の共通末端位置を特定し得るために、これらの試料のそれぞれを深く配列し得る。別の実施形態において、無料プロファイルを有する人々の群に由来する配列データをともにプールして、その疾患または生理学的プロファイルに代表的な共通末端位置を特定することができる。

【0226】

試料中の各血漿ＤＮＡ断片を個々に調べてもよく、末端位置に基づいて尤度スコアを割り当ててもよい。特定の末端位置の尤度スコアは、対照群について終結する配列読み取りの量と比較して、標的個人（例えば、癌）について、その末端位置で終結する配列読み取りの量（例えば、配列読み取りまたは試料にわたる配列決定深度によって正規化された他の値のパーセンテージ）の分離に依存し得る。より大きな分離はより高い特異性をもたらすため、より高い尤度スコアが適用され得る。したがって、特定の末端位置を有する血漿ＤＮＡ断片の、疾患に関連する可能性が高いか否か、胎児または母体などへの分類が実行され得る。

【0227】

あるいは、同一の領域に起源を持つ血漿ＤＮＡ断片が集合的に解釈され得、すなわち、配列決定深度に正規化することによって、特定のヌクレオチドで終結する比率が計算され得る。このように、例えば、より多くの試料が使用され得るものの、単に特定の種類の１つの試料の分析に基づいて、特定のヌクレオチドが、ゲノムにおける他の位置と比較して、共通末端位置であるものとして特定され得る。したがって、特定の末端位置を有する血漿ＤＮＡ断片の、疾患に関連する可能性が高いか否か、胎児、または母体などへの分類が実行され得る。そのような生物学的に関連する血漿ＤＮＡ末端位置を有する高頻度の血漿ＤＮＡ断片を示す位置について、そのような座位は生物学的に関連するＤＮＡが富化されるため、癌に関連するか、または胎児に特異的であるか、または他の疾患もしくは生物学的プロセスに関連するものとして、高尤度の血漿ＤＮＡ断片の群として含まれるという決定を行ってもよい。尤度のレベルは、上述の異なる群にわたる比較と類似した様式で、他のヌクレオチドと比較して、所与のヌクレオチドの比率がどれほど高いかに基づき得る。

【0228】

２．結果
このアプローチの有効性を説明するために、潜在的に癌に関連する変異を、ＨＣＣ患者のＤＮＡ配列決定データから直接特定した。少なくとも２つの血漿ＤＮＡ断片の配列読み取りにおいて存在した単一ヌクレオチド変化を、潜在的に癌に関連する変異と見なした。腫瘍組織もまた配列決定し、腫瘍組織中に存在した変異を真の癌に関連する変異と見なした。

【0229】

染色体８上で、動的カットオフ分析を使用せずに、ＨＣＣ患者の血漿ＤＮＡ配列決定データから合計２０，０６５個の潜在的な変異を特定した。ある配列バリアントが少なくとも２つの配列決定されたＤＮＡ断片中に存在した場合、その配列バリアントを潜在的な変異と見なす。腫瘍組織の配列決定結果から、８８４個の真の体細胞変異を特定した。２０，０６５個の推定上の変異は、８８４個の真の変異のうちの８０２個（９１％）を含んだ。したがって、腫瘍組織中、推定上の変異のうちの４％のみが、真の体細胞変異であり、陽性的中率は４％であった。

【0230】

体細胞変異の検出の正確性を改良し、それにより、癌遺伝子型をもたらすために、我々は、推定上の変異を担持する配列読み取りの末端ヌクレオチド位置に基づく、以下の選別アルゴリズムを使用した。（１）。任意の推定上の変異について、変異を担持し、ＨＣＣに特異的な終結位置上で終結する少なくとも１つの配列読み取りが存在する場合、変異は下流変異分析の資格があるだろう。（２）。推定上の変異は担持したが、任意の妊娠に特異的な終結位置上または両方の場合によって共有される位置上で終結した配列読み取りは、除去する。変異は、このアルゴリズムに基づいて読み取りを除去した後に、同一の変異を示す２つ以上の配列読み取りが存在した場合にのみ、下流変異分析の資格があるだろう。

【0231】

上述の１及び２の選別アルゴリズムの両方を適用して、表２の結果を得た。推定上の変異を担持するＤＮＡ断片の末端ヌクレオチドの位置つまり末端位置に基づいて、異なる選別アルゴリズムを適用する効果。

【表2】

【0232】

末端位置がＨＣＣに特異的であることを必要とする３つのアルゴリズム、または妊娠に特異的な位置もしくは共有される位置を選別して除去するアルゴリズムのうちのいずれか１つを採用することによって、陽性的中率の実質的な改善が存在した。両方のアルゴリズムを適用することによって、陽性的中率は７１％まで上昇した。

【0233】

各染色体について、または実際別のゲノム領域について、または実際ゲノム全体について、他の数（例えば、５０万、２００万、３００万、４００万、５００万、６００万、７００万、８００万、９００万、または１０００万などであるが、これらに限定されない）のＨＣＣ及び妊娠に関連する末端位置が特定され得る。様々な実施形態において、血漿ＤＮＡ分子中で最も高頻度に見られる末端位置が、癌患者の１人以上のコホート（各コホートは１つの癌の種類のものである）において決定され得る。更に、血漿ＤＮＡ分子中で最も高頻度な末端位置が、癌を有しない対象において決定され得る。一実施形態において、そのような癌を有する患者及び癌を有しない対象は、異なる臨床的パラメータ、例えば、性別、喫煙状態、以前の健康（例えば、肝炎状態、糖尿病、体重）などを有する群へと更に細分化され得る。

【0234】

そのような選別基準を使用することの一部として、統計学的分析を使用して、異なる生理学的状態及び病理学的状態の循環ＤＮＡの末端ヌクレオチドまたは末端位置である、より高い確率を有する位置を特定することができる。統計学的分析の例としては、スチューデントｔ検定、カイ二乗検定、及び二項分布またはポアソン分布に基づく検定が挙げられるが、これらに限定されない。これらの統計学的分析について、異なるｐ値カットオフ（例えば、０．０５、０．０１、０．００５、０．００１、及び０．０００１などであるが、これらに限定されない）が使用され得る。ｐ値カットオフはまた、複数の比較のために調節され得る。

【0235】

Ｄ．遺伝子型を決定するための方法
図３８は、本発明の実施形態に従う、生体試料を分析して、第１の組織型の遺伝子型を決定する方法３８００の流れ図である。生体試料は、第１の組織型を含む複数の組織型に由来する無細胞ＤＮＡ分子の混合物を含む。第１の組織型は、潜在的に複数の組織型の他の組織型とは異なる遺伝子型を有する。複数のゲノム位置の遺伝子型が決定され得る。

【0236】

ブロック３８１０で、第１の組織型の無細胞ＤＮＡ分子の末端が閾値を超える比率で生じる、第１のゲノム位置を特定する。ブロック３８１０は、ブロック３６１０に類似した様式で実行することができる。節Ｘ．Ｂは、ブロック３８１０を実行するための追加の例を提供する。

【0237】

ブロック３８２０で、対象の生体試料に由来する第１の複数の無細胞ＤＮＡ分子を分析する。無細胞ＤＮＡ分子の分析は、無細胞ＤＮＡ分子の少なくとも１つの末端に対応する、基準ゲノムにおけるゲノム位置を決定することを含む。ブロック３６２０は、無細胞ＤＮＡ分子を分析するための他のブロックに類似した様式で実行することができる。

【0238】

ブロック３８３０で、第１の複数の無細胞ＤＮＡ分子の分析に基づいて、第１のゲノム位置で終結する無細胞ＤＮＡ分子のセットを特定する。例として、セットは、既知の終結位置を有する検出されたプローブの配列読み取りの整列を使用して、特定することができる。他の例が、本明細書に提供される。

【0239】

いくつかの実施形態において、例えば、上述のように、更なる選別が実行されてもよい。例えば、例えば、胎児組織及び腫瘍組織は一般に、健常な細胞に由来するＤＮＡ断片よりも短いため、無細胞ＤＮＡ分子のサイズが、特定の量未満であることが必要とされてもよい。一実装例において、無細胞ＤＮＡ分子のセットを選別して、第１のゲノム位置で終結する無細胞ＤＮＡ分子のうちの少なくとも１つの加重を除外または修正してもよい。選別された無細胞ＤＮＡ分子のセットを使用して、遺伝子型を決定することができる。

【0240】

様々な実施形態において、選別は、無細胞ＤＮＡ分子のサイズ、１つ以上の位置の無細胞ＤＮＡ分子のメチル化状態（例えば、ＣｐＧ部位がメチル化されているか、メチル化されていないか）、及び無細胞ＤＮＡ分子が、第１の組織型の無細胞ＤＮＡ分子の末端が閾値を超える比率で発生する、１つ以上の他のゲノム位置を網羅するかどうかのうちの最後に１つを使用し得る。メチル化状態は、上述のように、第１の組織型のシグネチャーを提供し得る。

【0241】

ブロック３８４０で、無細胞ＤＮＡ分子のセットの各無細胞ＤＮＡ分子について、第１のゲノム位置で生じる、対応する塩基（ヌクレオチド）が決定される。各塩基を有する分子の総数が決定され得、各塩基のパーセンテージが計算され得る。

【0242】

ブロック３８５０で、無細胞ＤＮＡ分子のセットにおいて第１のゲノム位置で生じる対応する塩基を使用して、第１のゲノム位置の第１の組織型の遺伝子型が決定される。様々な実装例において、１つの塩基のみの高いパーセンテージ（例えば、８０％、８５％、または９０％超）は、その塩基の遺伝子型がホモ接合であることを示し得る一方で、類似したパーセンテージ（例えば、３０～７０％の間）を有する２つの塩基は、遺伝子型がヘテロ接合であるという決定をもたらし得る。したがって、各塩基のパーセンテージは、遺伝子型に対するカットオフ値と比較され得る。いくつかの実施形態において、カットオフ値は、試料に対する第１の組織型の比例的寄与に基づいて決定され得る。

【0243】

したがって、いくつかの実施形態において、第１のゲノム位置の第１の組織型の遺伝子型を決定することは、複数の塩基のそれぞれの寄与パーセンテージを決定し、寄与パーセンテージのそれぞれを１つ以上のカットオフ値と比較することを含み得る。一例において、第１の塩基の寄与パーセンテージが第１のカットオフ値を超える場合、第１のカットオフ値は、第１の塩基のホモ接合遺伝子型に対応し得る。別の例において、第１の塩基及び第２の塩基の寄与パーセンテージが第１のカットオフ値を超え、かつ第２のカットオフ値未満である場合、第１のカットオフ値及び第２のカットオフ値は、第１の塩基及び第２の塩基のヘテロ接合遺伝子型に対応し得る。

【0244】

いくつかの実施形態において、ブロック３８３０において特定されるセット中の各無細胞ＤＮＡ分子について、加重が実行されてもよい。例えば、無細胞ＤＮＡ分子が第１の組織型に由来する尤度が８０％である場合、０．８が加重であり得る。特定の塩基の全ての加重の合計寄与を合計して、各塩基のそれぞれの量を決定することができる。それぞれの量を使用して、各塩基の寄与パーセンテージを決定することができ、パーセンテージを使用して、遺伝子型を決定することができる。

【0245】

したがって、選別は、無細胞ＤＮＡ分子が第１の組織型に由来する尤度に対応して、無細胞ＤＮＡ分子に加重を割り当て得る。複数の塩基のそれぞれについて、加重和が決定され得る（例えば、２、３、または４つであり得る、検出されたもののみ）。１つの塩基のみが検出された場合、その１つの塩基のホモ接合遺伝子型が検定され得る。加重和を使用して、複数の塩基のそれぞれの寄与パーセンテージを決定することができ、この寄与パーセンテージを使用して、遺伝子型を決定する。

【0246】

Ｘ．更なる詳細
上述の様々な実施形態において、特定の組織の好ましい終結位置（好ましい終結位置のうちのいくつかは近接し、それにより、好ましい終結ウインドウを形成してもよい）を特定する。異なる測定基準を使用して、ゲノムウインドウ（例えば、最小ウインドウのゲノム位置）での無細胞ＤＮＡ分子の発生率を特定することができる。そのような操作についての更なる詳細、及び基準ゲノムにおける無細胞ＤＮＡ分子の終結位置の決定についての詳細が、以下に提供される。そのような特定の技術は、上述の実施形態とともに使用することができる。

【0247】

Ａ．終結位置の決定
無細胞ＤＮＡ分子を配列決定するとき、ＤＮＡ断片の終結パターンの様々な可能性が存在する。一般に、血漿ＤＮＡの末端には４つの構成、つまり、（Ａ）２つの平滑末端を有する二本鎖ＤＮＡ分子、（Ｂ）１つの平滑末端及び１つの非平滑末端を有する二本鎖ＤＮＡ分子（二本の鎖のうちのいずれか一本が突出し得るため、２つのシナリオのそれぞれを示す）、（Ｃ）異なる組み合わせの突出末端で、２つの非平滑末端を有する二本鎖ＤＮＡ分子、ならびに（Ｄ）一本鎖ＤＮＡ分子が存在する。

【0248】

非平滑末端を有する構成について、ＤＮＡ分子の５’末端または３’末端が突出するかによって、異なるパターンが存在する。（Ｂ）について、二本鎖ＤＮＡ分子は、１つの平滑末端及び１つの非平滑末端を有する。例Ｂ１において、５’末端が突出し、例Ｂ２において、３’末端が突出する。（Ｃ）について、両端が非平滑である場合、３つの可能性のあるパターンが存在する。（Ｃ１）において、５’末端が両側で突出する。（Ｃ２）において、３’末端が両側で突出する。（Ｃ３）において、５’末端が片側で突出し、３’末端がもう片側で突出する。

【0249】

配列決定について、ペアードエンド配列決定プロトコルは一般的に、鎖のそれぞれの一端を配列決定する。したがって、それらは、二本鎖ＤＮＡ配列決定プロトコルと見なされる。２つの末端が平滑でない場合、プロトコルは、ヌクレオチドを切断するか、末端にヌクレオチドを添加して、それらを平滑にするかのいずれかであり得る。クレノウ断片は、そのような操作を実行し得る酵素である。当該分野における他のプロトコルは、一本鎖ＤＮＡ配列決定プロトコルを使用する。

【0250】

使用される特定の技術（プローブの使用を含む）に関わらず、終結位置が本明細書に示されるように反復可能であり、相関を示す限り、ＤＮＡ断片の真の末端が配列決定において得られるかどうかは、いかなるオフセットも反復可能であり、したがって、相殺されるため、結果には影響を与えない。更に、用語の節に記載されるように、特定の技術を使用して、終結位置を特定することができる。

【0251】

Ｂ．組織に特異的な終結位置の特定
上述のように、特定の組織型において、特定のゲノム領域は、他の領域よりも、無細胞ＤＮＡ分子が特定の位置上で終結する尤度の大きな変動を有する。例えば、肝臓組織は、デオキシリボヌクレアーゼ高感受性部位である領域を有し得るが、他の組織は、その領域をデオキシリボヌクレアーゼ高感受性部位としては有しない。従って、そのような領域内の特定の位置は、他の位置と比較して、それらの位置上で終結する多数の無細胞ＤＮＡ分子を有するだろう。例として、そのような位置は、例えば、節ＩＩＩに記載されるように、特定の組織の多量の切断（したがって、尤度関数の高い振幅）を有することが既知である領域の、無細胞ＤＮＡ分子の比率の最大として特定され得る。他の例において、例えば、節ＩＶに記載されるように、左ピーク及び右ピークが十分に分離しているゲノム位置が特定され得る。

【0252】

更なる他の例において、例えば、節Ｖ、ＶＩ、及びＶＩＩにおいてベン図を使用して記載されるように、ある状態（例えば、妊娠または癌、可能性としては特定の種類のもの）を有する試料及び有しない試料の高い比率（例えば、閾値を超える比率）の終結位置のセットの差異を使用して、その状態に関連付けられる特定の組織型の好ましい終結部位を特定することができる。更なる他の例として、ある状態を有しない別の試料よりも有意に高い、その状態を有する１つの試料の比率は、特定の組織型の好ましい終結部位を提供し得る。様々な実施形態において、そのような例示的な技術のうちのいくつかまたは全ては、ともに使用され得る。比率は、任意の相対的存在量の測定基準によって測定され得る。

【0253】

上記の方法のいくつかの実施形態において、第１の組織型の無細胞ＤＮＡ分子の末端が閾値を超える比率で生じる、第１のゲノム位置のセットは、以下の様式で特定することができる。較正試料は、同一の種類の２つの試料（例えば、血漿、血清、尿など）及び較正試料が、第１の組織型（例えば、妊娠中の女性の試料に由来する胎児組織、またはＨＣＣ患者の肝臓の腫瘍組織）を含むことが既知である試験試料と類似した様式で、分析され得る。あるゲノムウインドウ（例えば、幅１以上のもの）内で終結する無細胞ＤＮＡ分子の数を、基準値と比較して、終結位置の比率がその位置の閾値を超えるかどうかを判定し得る。いくつかの実施形態において、比率が基準値を超える場合、対応する数が基準値を超えるとき、第１のゲノムウインドウ内のゲノム位置のそれぞれを、閾値を超える比率を有するものとして特定し得る。そのようなプロセスは、好ましい終結位置を含む好ましい終結ウインドウを特定し得る。

【0254】

基準値は、上位Ｎ個のゲノムウインドウのみが閾値を超える比率を有するようなものであり得る。例えば、第１のゲノム位置のセットは、対応する数の最高のＮ値を有し得る。例として、Ｎは、少なくとも１０，０００、５０，０００、１００，０００、５００，０００、１，０００，０００、または５，０００，０００であり得る。

【0255】

別の例として、基準値は、例えば、節ＶＩ．Ａ．１に記載されるように、ある試料中の無細胞ＤＮＡ分子の確率分布及び平均長に従う、ゲノムウインドウ内で終結する無細胞ＤＮＡ分子の期待数であり得る。ｐ値は、対応する数及び期待数を使用して決定することができ、閾値は、カットオフｐ値（例えば、０．０１）に対応する。カットオフｐ値未満であるｐ値は、比率が閾値を超えることを示す。更なる別の別の例として、基準値は、例えば、図２９Ａ及び２９Ｂに記載されるように、減少した量の第１の組織型を有するものとして特定される試料に由来するゲノムウインドウ内で終結する、無細胞ＤＮＡ分子の測定された数を含み得る。

【0256】

比率閾値を満たすゲノム位置は、必ずしも第１のゲノム位置のセットには追加されない。更なる選別基準が追加され得る。そのような選別基準の例は、節ＶＩ．Ａ．３及びＩＸ．Ｃに明記される。サイズの選別基準について、例えば、米国特許公開第２０１１／０２７６２７７号、同第２０１３／００４０８２４号、及び同第２０１３／０２３７４３１号（これら全ての全体が参照により組み込まれる）に記載されるように、無細胞ＤＮＡ分子のサイズ（例えば、長さまたは質量）が測定されてもよい。第１の統計値は、閾値を超える比率を有すると判定される、（例えば、ウインドウが１の幅を有する場合、ゲノム位置上の）第１のゲノムウインドウ内で終結する無細胞ＤＮＡ分子のサイズ分布から決定され得る。全ての無細胞ＤＮＡ分子またはより大きな範囲内のものと比較して、第１の統計値がサイズ閾値を超えないとき、例えば、平均サイズが十分には小さくないか、または十分な数の小ＤＮＡ断片が存在しない（例えば、特定のサイズ未満）とき、第１のゲノムウインドウのゲノム位置は、第１のゲノム位置のセットから除外され得る。

【0257】

第１の統計値は、閾値を超える比率を有しないと判定される無細胞ＤＮＡ分子のサイズ分布の第２の統計値と比較され得る。２つの値が類似している（例えば、胎児組織または腫瘍組織には期待されない）場合、第１のゲノムウインドウは、好ましい終結位置のセットから除外され得る。節ＶＩＩ．Ａ．２に記載されるように、対応する数を基準値と比較することは、対応する数と、１つの試料のゲノムウインドウの任意の部分を網羅し、かつ任意で、そのゲノムウインドウ内で終結しない、無細胞ＤＮＡ分子の数との第１の比率（例えば、ＰＥＴＲ）を算出することを含み得る。基準値は、ゲノムウインドウ内で終結する読み取りの測定された数と、ゲノムウインドウを網羅し、かつ他の試料のゲノムウインドウ内で終結しない無細胞ＤＮＡ分子の数との基準比率を含み得る。第１の比率は、乗法的因子（例えば、４）掛ける基準比率よりも大きい必要があり得る。

【0258】

別の選別基準は、第１のゲノム位置のセットの各ゲノム位置が、ゲノム位置上で終結する少なくとも特定の数の無細胞ＤＮＡ分子を有する必要があり得るというものであり得る。これらの技術のうちのいずれかを使用して、第１のゲノム位置のセットは、６００～１０，０００個のゲノム位置を含み得る。

【0259】

セット間の差異（例えば、ベン図の使用）を採用する実施形態において、（例えば、ゲノムウインドウから決定される）その比率が閾値を超えるゲノム位置は、例えば、図２８ＡにセットＰ及びセットＳとして示される第１の上位集合を含む。減少した量の第１の組織型（例えば、図２８Ａに描写されるように、より少ないか、または全くない胎児組織またはＨＣＣ組織）を有する少なくとも１つの第２の追加の試料から、第３の複数の無細胞ＤＮＡ分子を分析して、第２の上位集合、例えば、セットＱ及びセットＳを特定することができる。第１のゲノム位置のセットは、どの組織型が分析されるかによって、第１の上位集合内にあり、かつ第２の上位集合内にはないゲノム位置（例えば、セットＰまたはセットＳ）を含み得る。

【0260】

節ＶＩに記載されるように、第１の組織型は、第１の組織に特異的な対立遺伝子を有し得る。ゲノム位置上で終結し、複数の第１の組織特異的対立遺伝子のうちの少なくとも１つを含む無細胞ＤＮＡ分子の計数が行われてもよい。この無細胞ＤＮＡ分子の計数（数）が、基準値と比較され得る。

【0261】

Ｃ．相対的存在量
相対的存在量の値の様々な例、例えば、インタクト確率（Ｐ_Ｉ）、節ＶＩ．Ａ．１に記載されるｐ値、及びウインドウが幅１のものであるときのゲノムウインドウまたはゲノム位置を使用して決定されるＰＥＴＲ値が、本明細書に提供される。ゲノム位置（幅１のウインドウ）のＰＥＴＲについて、ゲノム位置上で終結する、第１の複数の無細胞ＤＮＡ分子の対応する数が、第１のゲノム位置のセットの各ゲノム位置について算出され得る。これは、第１の数（例えば、分子）の第１の複数の無細胞ＤＮＡ分子が、第１のゲノム位置のセットのうちのいずれか１つの上で終結することを判定することの一部として行うことができる。ゲノム位置を網羅し、ゲノム位置上で終結しない第３の数（例えば、分母）の無細胞ＤＮＡ分子は、第２の数の無細胞ＤＮＡ分子を決定することの一部として算出され得る。対応する数及び第３の数の第１の比率が決定され、第１の比率の平均が相対的存在量として使用され得る。

【0262】

ｗ－ＰＥＴＲについて、ゲノム位置を含む、第１のウインドウ（例えば、図３１ＡのウインドウＡ）内で終結する、無細胞ＤＮＡ分子の対応する数が、第１のゲノム位置のセットの各ゲノム位置について算出され得る。ゲノム位置を含む、第２のウインドウ（例えば、図３１ＡのウインドウＢのもの）内で終結する第３の数の無細胞ＤＮＡ分子が、算出され得る。対応する数及び第３の数の第１の比率の平均が、相対的存在量として使用され得る。

【0263】

相対的存在量の値の別の例は、例えば、好ましい終結位置上で終結する、配列決定されたＤＮＡ断片の割合として測定される、ゲノムウインドウ上で終結する無細胞ＤＮＡ分子の割合である。したがって、第２のゲノム位置のセットは、第１の複数の無細胞ＤＮＡ分子の少なくとも１つの末端に対応する、全てのゲノム位置を含み得る。

【0264】

Ｄ．較正値
様々な実施形態において、較正値（複数可）は、較正試料（複数可）から決定される較正データ点（複数可）の較正値（複数可）、またはそこから決定される（例えば、較正データ点に近似する較正関数の）任意の較正値に対応し得る。１つ以上の較正試料は、好ましい終結部位を決定するために使用される任意の追加の試料を含んでも、含まなくてもよい。

【0265】

１つ以上の較正試料のそれぞれについて、第１の組織型の対応する比例的寄与は、例えば、組織に特異的な対立遺伝子を使用して測定され得る。対応する相対的存在量は、第１のゲノム位置のセットに対応する複数のウインドウ内で終結する、無細胞ＤＮＡ分子の対応する数を使用して決定され得る。測定された比例的寄与及び相対的存在量は、較正データ点を提供し得る。１つ以上の較正データ点は、複数の較正データ点に近似する較正関数を形成する、複数の較正データ点であり得る。較正値の使用についての更なる詳細は、米国特許公開第２０１３／０２３７４３１号に見出すことができる。

【0266】

Ｅ．比例的寄与の分類
いくつかの実施形態において、特定の組織の好ましい終結位置を使用して、例えば、１単位体積当たり（例えば、１ミリリットル当たり）のゲノムの数での、試料中の特定の組織型の絶対的寄与を測定することもできる。例えば、対象となる組織の濃度は、無細胞ＤＮＡ試料の体積または重量に関して測定することができる。一実装例において、定量的ＰＣＲを使用して、抽出された無細胞ＤＮＡ試料の単位体積または単位重量当たりの、１つ以上の好ましい末端で終結する無細胞ＤＮＡ分子の数を測定することができる。類似した測定を較正試料について行ってもよく、したがって、寄与は単位体積または単位重量当たりの濃度であるため、比例的寄与を比例的寄与として決定してもよい。

【0267】

第１の組織型が腫瘍組織に対応する、様々な実施形態において、分類は、対象における腫瘍組織の量、対象における腫瘍のサイズ、対象における腫瘍の段階、対象における腫瘍負荷、及び対象における腫瘍転移の存在からなる群から選択され得る。

【0268】

ＸＩ．更なる実施形態
実施形態１は、第１の組織型を含む複数の組織型に由来する無細胞ＤＮＡ分子の混合物を含む、生体試料を分析して、混合物中の第１の組織型の比例的寄与の分類を決定する方法であって、第１の組織型の無細胞ＤＮＡ分子の末端が、閾値を超える比率で発生する、第１のゲノム位置のセットを特定することと、コンピュータシステムによって、対象の生体試料に由来する第１の複数の無細胞ＤＮＡ分子を分析することであって、無細胞ＤＮＡ分子を分析することが、無細胞ＤＮＡ分子の少なくとも１つの末端に対応する、基準ゲノムにおけるゲノム位置を決定することを含む、分析することと、第１の複数の無細胞ＤＮＡ分子の分析に基づいて、第１の数の第１の複数の無細胞ＤＮＡ分子が複数のウインドウのうちの１つ内で終結することを判定することであって、各ウインドウが、第１のゲノム位置のセットのうちの少なくとも１つを含む、判定することと、第２の数の無細胞ＤＮＡ分子を使用して、第１の数の第１の複数の無細胞ＤＮＡ分子を正規化することによって、複数のウインドウのうちの１つ内で終結する第１の複数の無細胞ＤＮＡ分子の相対的存在量を算出することであって、第２の数の無細胞ＤＮＡ分子が、第１のゲノム位置のセットを含む複数のウインドウの外側の第２のゲノム位置のセットで終結する無細胞ＤＮＡ分子を含む、算出することと、相対的存在量を、第１の組織型の比例的寄与が既知である１つ以上の較正試料から決定される、１つ以上の較正値と比較することによって、第１の組織型の比例的寄与の分類を決定することとを含む、方法を含む。

【0269】

実施形態２は、実施形態１の方法を含み、第１のゲノム位置のセットを特定することが、コンピュータシステムによって、少なくとも１つの第１の追加の試料に由来する第２の複数の無細胞ＤＮＡ分子を分析して、第２の複数の無細胞ＤＮＡ分子の終結位置を特定することであって、少なくとも１つの第１の追加の試料が、第１の組織型を含むことが既知であり、かつ生体試料と同一の試料型のものである、特定することと、複数のゲノムウインドウの各ゲノムウインドウについて、ゲノムウインドウ上で終結する、第２の複数の無細胞ＤＮＡ分子の対応する数を算出することと、対応する数を基準値と比較して、ゲノムウインドウ内の１つ以上のゲノム位置上で終結する無細胞ＤＮＡ分子の比率が閾値を超えるかどうかを判定することとを含む。

【0270】

実施形態３は、実施形態２の方法を含み、複数のゲノムウインドウの第１のゲノムウインドウが、１つのゲノム位置よりも大きい幅を有し、対応する数が基準値を超える場合、第１のゲノムウインドウ内のゲノム位置のそれぞれが、閾値を超える、ゲノム位置上で終結する無細胞ＤＮＡ分子の比率を有するものとして特定される。実施形態４は、実施形態２または３の方法を含み、第１のゲノム位置のセットが、対応する数の最高のＮ値を有し、Ｎが、少なくとも１０，０００である。

【0271】

実施形態５は、実施形態２、３、または４の方法を含み、第２の複数の無細胞ＤＮＡ分子のそれぞれのサイズを決定することであって、第１のゲノム位置のセットを特定することが、閾値を超える比率を有すると判定された、第１のゲノムウインドウ内で終結する第２の複数の無細胞ＤＮＡ分子の無細胞ＤＮＡ分子のサイズ分布の第１の統計値を決定することと、第１の統計値をサイズ閾値と比較することと、第１の統計値がサイズ閾値を超えない場合、第１のゲノムウインドウを第１のゲノム位置のセットから除外することとを更に含む、決定することを更に含む。実施形態６は、実施形態２～５のいずれか１つの方法を含み、１つ以上の較正試料が、少なくとも１つの第１の追加の試料を含む。実施形態７は、実施形態１～６のいずれか１つの方法を含み、１つ以上の較正試料のそれぞれについて、第１の組織型の対応する比例的寄与を測定することと、第１のゲノム位置のセットに対応する複数のウインドウ内で終結する第２の複数の無細胞ＤＮＡ分子の対応する数を使用して、対応する相対的存在量を決定し、それにより、較正データ点を得ることであって、各較正データ点が、追加の生体試料の第１の組織型の測定された比例的寄与及び対応する相対的存在量を特定する、得ることとを更に含む。実施形態８は、実施形態７の方法を含み、１つ以上の較正データ点が、複数の較正データ点に近似する較正関数を形成する複数の較正データ点である。

【0272】

実施形態９は、実施形態２～８のいずれか１つの方法を含み、第１のゲノム位置のセットの各ゲノム位置が、ゲノム位置上で終結する第２の複数の無細胞ＤＮＡ分子の少なくとも特定の数の無細胞ＤＮＡ分子を有する。実施形態１０は、実施形態２～９のいずれか１つの方法を含み、基準値が、少なくとも１つの第１の追加の試料中の無細胞ＤＮＡ分子の確率分布及び平均長に従う、ゲノムウインドウ内で終結する無細胞ＤＮＡ分子の期待数である。実施形態１１は、実施形態１０の方法を含み、確率分布が、ポアソン分布であり、ゲノムウインドウ内の１つ以上のゲノム位置上で終結する無細胞ＤＮＡ分子の比率が閾値を超えるかどうかを判定することが、対応する数及び期待数を使用して、対応するｐ値を決定することであって、閾値が、カットオフｐ値に対応し、対応するｐ値が、カットオフｐ値よりも小さいことが、ゲノムウインドウ内で終結する無細胞ＤＮＡ分子の比率が閾値を超えることを示す、決定することを含む。

【0273】

実施形態１２は、実施形態２～１１のいずれか１つの方法を含み、ゲノム位置上で終結する第２の複数の無細胞ＤＮＡ分子の比率が閾値を超える、ゲノム位置が、第１の上位集合を含み、第１のゲノム位置のセットを特定することが、コンピュータシステムによって、減少した量の第１の組織型を有するものとして特定される、少なくとも１つの第２の追加の試料に由来する第３の複数の無細胞ＤＮＡ分子を分析して、ゲノム位置上で終結する第３の複数の無細胞ＤＮＡ分子の第２の上位集合が閾値を超えることを特定することと、第１のゲノム位置のセットを、第１の上位集合内にはあり、かつ第２の上位集合内にはない、ゲノム位置を含むものとして特定することとを更に含む。

【0274】

実施形態１３は、実施形態２～１２のいずれか１つの方法を含み、基準値が、ゲノムウインドウ内で終結する、測定された数の無細胞ＤＮＡ分子を含み、測定された数が、第１の組織型を有しないものとして特定される、少なくとも１つの第２の追加の試料の第３の複数の無細胞ＤＮＡ分子から決定される。実施形態１４は、実施形態１３の方法を含み、第２の複数の無細胞ＤＮＡ分子のそれぞれのサイズを決定することであって、第１のゲノム位置のセットを特定することが、閾値を超える、比率を有すると判定された、第１のゲノム位置上で終結する、第２の複数の無細胞ＤＮＡ分子の無細胞ＤＮＡ分子の第１のサイズ分布の第１の統計値を決定することと、閾値を超える、比率を有すると判定された、１つ以上の第２のゲノム位置上で終結する、第３の複数の無細胞ＤＮＡ分子の無細胞ＤＮＡ分子の第２のサイズ分布の第２の統計値を決定することと、第１の統計値を第２の統計値と比較することと、を含む、特定することと、第１の統計値が少なくとも特定の量だけ第２の統計値を超えない場合、第１のゲノム位置を第１のゲノム位置のセットから除外して、第１のサイズ分布が第２のサイズ分布よりも小さいことを示すこととを更に含む。実施形態１５は、実施形態１３または１４の方法を含み、対応する数を基準値と比較することが、対応する数と、ゲノムウインドウを網羅する第３の数の第２の複数の無細胞ＤＮＡ分子との、第１の比率を算出することと、第１の比率を基準値と比較することであって、基準値が、ゲノムウインドウ内で終結する読み取りの測定された数と、ゲノムウインドウを網羅し、かつゲノムウインドウ内で終結しない、第４の数の第３の複数の無細胞ＤＮＡ分子との基準比率を含む、比較することとを含む。実施形態１６は、実施形態１５の方法を含み、第３の数の第２の複数の無細胞ＤＮＡ分子が、ゲノムウインドウ内で終結しない。実施形態１７は、実施形態１５または１６の方法を含み、ゲノムウインドウ内で終結する無細胞ＤＮＡ分子の比率が、閾値を超えるかどうかを判定することが、第１の比率が乗法的因子掛ける基準比率よりも大きいかどうかを判定することを含む。

【0275】

実施形態１８は、実施形態２～１７のいずれか１つの方法を含み、生体試料及び少なくとも１つの第１の追加の試料の試料型が、血漿、血清、脳脊髄液、及び尿からなる群から選択される。実施形態１９は、実施形態２～１８のいずれか１つの方法を含み、ゲノムウインドウが、ゲノム位置であり、第１の組織型が、複数の第１の組織に特異的な対立遺伝子を有し、ゲノム位置上で終結する、第２の複数の無細胞ＤＮＡ分子の対応する数を算出することが、ゲノム位置上で終結する無細胞ＤＮＡ分子が、複数の第１の組織に特異的な対立遺伝子のうちの少なくとも１つを含むかどうかを特定することと、無細胞ＤＮＡ分子が第１の組織に特異的な対立遺伝子を含む場合、対応する数に無細胞ＤＮＡ分子を含めることと、無細胞ＤＮＡ分子が第１の組織に特異的な対立遺伝子を含まない場合、対応する数に無細胞ＤＮＡ分子を含めないこととを含む。

【0276】

実施形態２０は、実施形態１～１９のいずれか１つの方法を含み、第１の組織型が、少なくとも１つの追加の試料中に複数の第１の組織に特異的な対立遺伝子を有し、第１のゲノム位置のセットが、複数の第１の組織に特異的な対立遺伝子のうちの少なくとも１つを含む、少なくとも１つの追加の試料の無細胞ＤＮＡ分子を使用して決定される。実施形態２１は、実施形態２０の方法を含み、第２のゲノム位置のセットが、第２の組織型の無細胞ＤＮＡ分子の末端が、少なくとも１つの追加の試料中で閾値を超える比率で発生するようなものであり、第２の組織型が、少なくとも１つの追加の試料中に複数の第２の組織に特異的な対立遺伝子を有し、第２のゲノム位置のセットが、複数の第２の組織に特異的な対立遺伝子のうちの少なくとも１つを含む、少なくとも１つの追加の試料の無細胞ＤＮＡ分子を使用して決定される。実施形態２２は、実施形態２１の方法を含み、少なくとも１つの追加の試料が、妊娠中の女性に由来するものであり、第１の組織型が、胎児組織であり、第２の組織型が、母体組織である。実施形態２３は、実施形態２１または２２の方法を含み、第１の組織型と第２の組織型との間で共有された対立遺伝子を有する無細胞ＤＮＡ分子の末端が、閾値を超える第２の比率で発生するゲノム位置が、第１のゲノム位置のセットから除外され、第２のゲノム位置のセットから除外される。

【0277】

実施形態２４は、実施形態１～２３のいずれか１つの方法を含み、相対的存在量が、第１の数及び第２の数の比率を含む。実施形態２５は、実施形態１～２４のいずれか１つの方法を含み、複数のウインドウが、１つのゲノム位置の幅を有し、相対的存在量が、第１のゲノム位置のセットの各ゲノム位置について、ゲノム位置上で終結する、第１の複数の無細胞ＤＮＡ分子の対応する数を、第１の数の第１の複数の無細胞ＤＮＡ分子が第１のゲノム位置のセットのうちのいずれか１つで終結することを判定することの一部として算出することと、ゲノム位置を網羅し、ゲノム位置上で終結しない第３の数の第１の複数の無細胞ＤＮＡ分子を、第２の数の無細胞ＤＮＡ分子を決定することの一部として算出することと、対応する数及び第３の数の第１の比率を算出することと、第１の比率の平均を相対的存在量として算出することとによって算出される。実施形態２６は、実施形態１～２４のいずれか１つの方法を含み、相対的存在量が、第１のゲノム位置のセットの各ゲノム位置について、ゲノム位置を含む第１のウインドウ内で終結する第１の複数の無細胞ＤＮＡ分子の対応する数を、第１の数の第１の複数の無細胞ＤＮＡ分子が複数のウインドウのうちの１つ内で終結することを判定することの一部として算出することと、ゲノム位置を含む第２のウインドウ内で終結する、第３の数の第１の複数の無細胞ＤＮＡ分子を算出することであって、第２のウインドウが、第１のウインドウよりも大きい、算出することと、対応する数及び第３の数の第１の比率を算出することと、第１の比率の平均を相対的存在量として算出することとによって算出される。

【0278】

実施形態２７は、実施形態１～２６のいずれか１つの方法を含み、第２のゲノム位置のセット及び第１のゲノム位置のセットが、重複しない。実施形態２８は、実施形態１～２７のいずれか１つの方法を含み、第２のゲノム位置のセットが、第１の複数の無細胞ＤＮＡ分子の少なくとも１つの末端に対応する、全てのゲノム位置を含む。実施形態２９は、実施形態１～２８のいずれか１つの方法を含み、無細胞ＤＮＡ分子のうちの１つ以上を分析することが、無細胞ＤＮＡ分子の両末端に対応する両方のゲノム位置を決定することを含む。実施形態３０は、実施形態１～２９のいずれか１つの方法を含み、比例的寄与の分類が、特定のパーセンテージを超える範囲に対応する。実施形態３１は、実施形態１～３０のいずれか１つの方法を含み、第１の組織型が、腫瘍である。実施形態３２は、実施形態３１の方法を含み、分類が、対象における腫瘍組織の量、対象における腫瘍のサイズ、対象における腫瘍の段階、対象における腫瘍負荷、及び対象における腫瘍転移の存在からなる群から選択される。

【0279】

実施形態３３は、実施形態１～３２のいずれか１つの方法を含み、１つ以上の追加の生体試料が、対象に由来するものであり、生体試料とは異なる時間に得られる。実施形態３４は、実施形態１～３３のいずれか１つの方法を含み、分析される生体試料から鋳型ＤＮＡ分子を得ることと、鋳型ＤＮＡ分子を使用して、分析可能なＤＮＡ分子の配列決定ライブラリを調製することであって、鋳型ＤＮＡ分子のＤＮＡ増幅のステップを含まない、調製することと、分析可能なＤＮＡ分子の配列決定ライブラリを配列決定して、第１の複数の無細胞ＤＮＡ分子に対応する複数の配列読み取りを得ることと、を更に含み、第１の複数の無細胞ＤＮＡ分子を分析することが、コンピュータシステムから、複数の配列読み取りを受信することと、コンピュータシステムによって、複数の配列読み取りを基準ゲノムに整列させて、複数の配列読み取りのゲノム位置を決定することとを含む。実施形態３５は、実施形態１～３４のいずれか１つの方法を含み、分類に基づいて治療的介入を提供すること、または分類に基づいて対象の撮像を実行することを更に含む。実施形態３６は、実施形態１～３５のいずれか１つの方法を含み、第１のゲノム位置のセットが、６００～１０，０００個のゲノム位置を含む。

【0280】

実施形態３７は、第１の組織型を含む複数の組織型に由来する無細胞ＤＮＡ分子の混合物を含む、生体試料を分析して、混合物中の第１の組織型の比例的寄与の分類を決定する方法であって、第１の組織型に特異的な断片化パターンを有する、少なくとも１つのゲノム領域を特定することと、生体試料に由来する複数の無細胞ＤＮＡ分子を分析することであって、無細胞ＤＮＡ分子を分析することが、無細胞ＤＮＡ分子の少なくとも１つの末端に対応する、基準ゲノムにおけるゲノム位置を決定することを含む、分析することと、第１のセットの第１のゲノム位置を特定することであって、各第１のゲノム位置が、第１のゲノム位置に対応する無細胞ＤＮＡ分子の末端の極小を有する、特定することと、第２のセットの第２のゲノム位置を特定することであって、各第２のゲノム位置が、第２のゲノム位置に対応する無細胞ＤＮＡ分子の末端の極大を有する、特定することと、少なくとも１つのゲノム領域のうちのいずれか１つにおける、第１のゲノム位置のうちのいずれか１つで終結する、第１の数の無細胞ＤＮＡ分子を決定することと、少なくとも１つのゲノム領域のうちのいずれか１つにおける、第２のゲノム位置のうちのいずれか１つで終結する、第２の数の無細胞ＤＮＡ分子を決定することと、第１の数及び第２の数を使用して、分離値を算出することと、分離値を、第１の組織型の比例的寄与が既知である１つ以上の較正試料から決定される、１つ以上の較正値と比較することによって、第１の組織型の比例的寄与の分類を決定することとを含む、方法を含む。

【0281】

実施形態３８は、実施形態３７の方法を含み、第１のセットの第１のゲノム位置が、複数のゲノム位置を含み、第２のセットの第２のゲノム位置が、複数のゲノム位置を含み、第１の数の無細胞ＤＮＡ分子を決定することが、各第１のゲノム位置上で終結する、第１の量の無細胞ＤＮＡ分子を決定し、それにより、複数の第１の量を決定することを含み、第２の数の無細胞ＤＮＡ分子を決定することが、各第２のゲノム位置上で終結する、第２の量の無細胞ＤＮＡ分子を決定し、それにより、複数の第２の量を決定することを含み、分離値を算出することが、それぞれが、複数の第１の量のうちの１つ及び複数の第２の量のうちの１つの分離比である、複数の分離比を決定することと、複数の分離比を使用して、分離値を決定することとを含む。実施形態３９は、実施形態３７または３８の方法を含み、少なくとも１つのゲノム領域が、１つ以上のデオキシリボヌクレアーゼ高感受性部位を含む。実施形態４０は、実施形態３７～３８の方法を含み、第１の組織型に特異的な断片化パターンを有する少なくとも１つのゲノム領域のそれぞれが、少なくとも１つの追加の試料中で１つ以上の第１の組織に特異的な対立遺伝子を含む。実施形態４１は、実施形態３７または３８の方法を含み、少なくとも１つのゲノム領域が、１つ以上のＡＴＡＣ－ｓｅｑまたは小球菌ヌクレアーゼ部位を含む。実施形態４２は、実施形態３７～４１のいずれか１つの方法を含み、第１のゲノム位置のセットのうちの１つのゲノム位置に整列された無細胞ＤＮＡ分子が、１つのゲノム位置の両側に特定の数のヌクレオチド長伸長する。実施形態４３は、実施形態４２の方法を含み、特定の数が、１０～８０ヌクレオチド長である。実施形態４４は、実施形態３７～４３のいずれか１つの方法を含み、第１のセットの第１のゲノム位置を特定することが、複数のゲノム位置のそれぞれについて、ゲノム位置に位置し、ゲノム位置の両側に特定の数のヌクレオチド長伸長する、第１の量の無細胞ＤＮＡ分子を決定することと、ゲノム位置に位置する、第２の量の無細胞ＤＮＡ分子を決定することと、第１の量及び第２の量の比率を決定することと、比率における複数の極小値及び複数の極大値を特定することとを含む。実施形態４５は、実施形態３７～４４のいずれか１つの方法を含み、混合物が、血漿または血清である。実施形態４６は、実施形態３７～４５のいずれか１つの方法を含み、複数の無細胞ＤＮＡ分子が、少なくとも１，０００個の無細胞ＤＮＡ分子である。実施形態４７は、実施形態３７～４６のいずれか１つの方法を含み、複数のゲノム位置の所与のゲノム位置について、第２の量が、所与のゲノム位置に整列する無細胞ＤＮＡ分子の総数に対応する。

【0282】

実施形態４８は、第１の組織型を含む複数の組織型に由来する無細胞ＤＮＡ分子の混合物を含む、生体試料を分析して、第１の組織型の遺伝子型を決定する方法であって、第１の組織型が、複数の組織型の他の組織型とは異なる遺伝子型を潜在的に有し、方法が、第１の組織型の無細胞ＤＮＡ分子の末端が、閾値を超える比率で発生する、第１のゲノム位置を特定することと、コンピュータシステムによって、対象の生体試料に由来する第１の複数の無細胞ＤＮＡ分子を分析することであって、無細胞ＤＮＡ分子を分析することが、無細胞ＤＮＡ分子の少なくとも１つの末端に対応する、基準ゲノムにおけるゲノム位置を決定することを含む、分析することと、第１の複数の無細胞ＤＮＡ分子の分析に基づいて、第１のゲノム位置で終結する無細胞ＤＮＡ分子のセットを特定することと、無細胞ＤＮＡ分子のセットのそれぞれについて、第１のゲノム位置で生じる対応する塩基を決定し、それにより、第１のゲノム位置の対応する塩基を決定することと、無細胞ＤＮＡ分子のセットにおいて第１のゲノム位置で生じる対応する塩基を使用して、第１のゲノム位置の第１の組織型の遺伝子型を決定することとを含む、方法を含む。実施形態４９は、実施形態４８の方法を含み、無細胞ＤＮＡ分子のセットを選別して、第１のゲノム位置で終結する無細胞ＤＮＡ分子のうちの少なくとも１つの加重を除外または修正することであって、遺伝子型が、選別された無細胞ＤＮＡ分子のセットを使用して決定される、除外または修正することを更に含む。実施形態５０は、実施形態４９の方法を含み、選別が、無細胞ＤＮＡ分子のサイズ、１つ以上の位置の無細胞ＤＮＡ分子のメチル化状態、及び無細胞ＤＮＡ分子が、第１の組織型の無細胞ＤＮＡ分子の末端が閾値を超える比率で発生する、１つ以上の他のゲノム位置を網羅するかどうかのうちの最後に１つを使用する。実施形態５１は、実施形態４９または５０の方法を含み、選別が、無細胞ＤＮＡ分子が第１の組織型に由来する尤度に対応して、無細胞ＤＮＡ分子に加重を割り当て、方法が、複数の塩基のそれぞれの加重和を決定することと、加重和を使用して、複数の塩基のそれぞれの寄与パーセンテージを決定することであって、遺伝子型が、寄与パーセンテージを使用して決定される、決定することとを更に含む。実施形態５２は、実施形態４８～５１のいずれか１つの方法を含み、第１のゲノム位置の第１の組織型の遺伝子型を決定することが、複数の塩基のそれぞれの寄与パーセンテージを決定することと、寄与パーセンテージのそれぞれを１つ以上のカットオフ値と比較することとを含む。実施形態５３は、実施形態５２の方法を含み、第１の塩基の寄与パーセンテージが第１のカットオフ値を超える場合、１つ以上のカットオフ値の第１のカットオフ値が、第１の塩基のホモ接合遺伝子型に対応する。実施形態５４は、実施形態５２の方法を含み、第１の塩基及び第２の塩基の寄与パーセンテージが第１のカットオフ値を超え、第２のカットオフ値未満である場合、１つ以上のカットオフ値の第１のカットオフ値及び第２のカットオフ値が、第１の塩基及び第２の塩基のヘテロ接合遺伝子型に対応する。実施形態５５は、実施形態４８～５４のいずれか１つの方法を含み、第１の組織型が、腫瘍に対応する。実施形態５６は、実施形態４８～５５のいずれか１つの方法を含み、第１の組織型が、胎児に対応し、対象が、胎児を妊娠している。

【0283】

実施形態５７は、第１の組織型を含む複数の組織型に由来する無細胞ＤＮＡ分子の混合物を含む、生体試料を分析する方法であって、コンピュータシステムによって、対象の生体試料に由来する複数の無細胞ＤＮＡ分子を分析することであって、複数の無細胞ＤＮＡ分子のそれぞれが、左末端及び右末端を有し、無細胞ＤＮＡ分子を分析することが、無細胞ＤＮＡ分子の左末端に対応する、基準ゲノムにおける左終結位置を決定することと、無細胞ＤＮＡ分子の右末端に対応する、基準ゲノムにおける右終結位置を決定することとを含む、分析することと、それぞれが、ゲノム位置の左のセットのうちの１つに対応する複数の無細胞ＤＮＡ分子の左末端の極大を有する、左ゲノム位置の左のセットを特定することと、それぞれが、ゲノム位置の右のセットのうちの１つに対応する複数の無細胞ＤＮＡ分子の右末端の極大を有する、右ゲノム位置の右のセットを特定することと、左のセットの左ゲノム位置を、右のセットの右ゲノム位置と比較して、第１のゲノム位置のセットを特定することによって、第１のゲノム位置のセットを、第１の組織型に特異的なものとして特定することであって、左ゲノム位置から最も近い右ゲノム位置までの距離が、第１の閾距離よりも大きく、第１の閾距離が、基準ゲノムにおける少なくとも５個のゲノム位置である、特定することとを含む、方法を含む。実施形態５８は、実施形態５７の方法を含み、左のセットの左ゲノム位置を、右のセットの右ゲノム位置と比較して、第２のゲノム位置のセットを特定することによって、第２のゲノム位置のセットを特定することであって、左ゲノム位置から最も近い右ゲノム位置までの距離が、第２の閾距離未満である、特定することと、左ゲノム位置の左のセットのうちの１つで終結する、第１の数の複数の無細胞ＤＮＡ分子、及び右ゲノム位置の右のセットのうちの１つで終結する、第２の数の複数の無細胞ＤＮＡ分子を使用して、分離値を決定することと、分離値を、第１の組織型の比例的寄与が既知である１つ以上の較正試料から決定される、１つ以上の較正値と比較することによって、第１の組織型の比例的寄与の分類を決定することとを更に含む。実施形態５９は、実施形態５８の方法を含み、分離値を決定することが、第１のゲノム位置のセット及び第２のゲノム位置のセットの対を特定することと、対のそれぞれについて、対の、第１のゲノム位置で終結する第１の量の無細胞ＤＮＡ分子を決定することと、対の、第２のゲノム位置で終結する第２の量の無細胞ＤＮＡ分子を決定することと、を含み、第１の量の無細胞ＤＮＡ分子が、第１の数の複数の無細胞ＤＮＡ分子に対応し、第２の量の無細胞ＤＮＡ分子が、第２の数の複数の無細胞ＤＮＡ分子に対応する。実施形態６０は、実施形態５９の方法を含み、分離値を決定することが、対のそれぞれについて、第１の量及び第２の量を含む比率を決定することと、分離値を比率から決定することとを含む。実施形態６１は、実施形態５９または６０の方法を含み、第１のゲノム位置のセット及び第２のゲノム位置のセットの対が、互いに最も近い。実施形態６２は、実施形態５７～６１のいずれか１つの方法を含み、第２の閾距離が、基準ゲノムにおける５個のゲノム位置未満である。実施形態６３は、実施形態５７～６２のいずれか１つの方法を含み、第１のゲノム位置のセットが、左ゲノム位置及び右ゲノム位置の両方を含む。

【0284】

実施形態６４は、ＤＮＡ混合物中の第１の組織の比例的寄与を決定するための方法であって、第１の組織に特異的なデオキシリボヌクレアーゼ高感受性部位を特定することと、生体試料に由来する複数の無細胞ＤＮＡ分子を分析することであって、無細胞ＤＮＡ分子を分析することが、基準人ゲノムにおける無細胞ＤＮＡ分子の位置を特定することであって、位置が、無細胞ＤＮＡ分子の両端を含む、特定することを含む、分析することと、それぞれが、ゲノム位置に整列され、ゲノム位置の両側に特定の数のヌクレオチド長伸長する無細胞ＤＮＡ分子の極小を有する、第１のセットの第１のゲノム位置を特定することと、それぞれが、ゲノム位置に整列され、ゲノム位置の両側に特定の数のヌクレオチド長伸長する無細胞ＤＮＡ分子の極大を有する、第２のセットの第２のゲノム位置を特定することと、デオキシリボヌクレアーゼ高感受性部位のうちの１つ内の第１のゲノム位置のうちの１つの上で終結する第１の数の無細胞ＤＮＡ分子を算出することと、デオキシリボヌクレアーゼ高感受性部位のうちの１つ内の第１のゲノム位置のうちの１つの上で終結する第２の数の無細胞ＤＮＡ分子を算出することと、第１の数及び第２の数の割合を決定することと、割合に基づいて、第１の組織の比例的寄与を決定することとを含む、方法を含む。実施形態６５は、実施形態６４の方法を含み、第１のセットの第１のゲノム位置を特定することが、複数のゲノム位置のそれぞれについて、座位に位置し、座位の両側に特定の数のヌクレオチド長伸長する第１の量の無細胞ＤＮＡ分子を決定することと、座位に位置する第２の量の無細胞ＤＮＡ分子を決定することと、第１の量及び第２の量の第１の比率を決定すること、比率における複数の極小を特定することとを含む。実施形態６６は、実施形態６４または６５の方法を含み、ＤＮＡ混合物が、血漿または血清である。実施形態６６は、実施形態６４～６６のいずれか１つの方法を含み、複数の無細胞ＤＮＡ分子が、少なくとも１，０００個の無細胞ＤＮＡ分子である。

【0285】

実施形態６７は、ＤＮＡ混合物中の第１の組織の比例的寄与を決定するための方法であって、ＤＮＡ断片が第１の組織のＤＮＡ断片の末端の閾値を超える頻度を有する、ゲノム位置を特定することと、生体試料に由来する複数の無細胞ＤＮＡ分子を分析することであって、無細胞ＤＮＡ分子を分析することが基準人ゲノムにおける無細胞ＤＮＡ分子の位置を特定することであって、位置が、無細胞ＤＮＡ分子の両端を含む、特定することを含む、分析することと、デオキシリボヌクレアーゼ高感受性部位のうちの１つ内の特定されたゲノム位置のうちの１つの上で終結する、第１の数の無細胞ＤＮＡ分子を算出することと、第１の数及び配列決定されたＤＮＡの量から割合を算出することと、割合に基づいて、第１の組織の比例的寄与を決定することとを含む、方法を含む。実施形態６８は、実施形態６７の方法を含み、第１の組織が、腫瘍である。実施形態６９は、実施形態６７の方法を含み、第１の組織が、胎児組織である。

【0286】

実施形態７０は、推定上の変異を担持するＤＮＡ断片が実際に腫瘍に由来するかどうかを予想する方法であって、ＤＮＡ断片がＤＮＡ断片の末端の閾値を超える頻度を有する、ゲノム位置を特定することと、特定されたゲノム位置のうちの１つで終結するＤＮＡ断片に基づいて、確率を決定することとを含む、方法を含む。

【0287】

実施形態７１は、コンピュータシステムを制御して、実施形態１～７０のいずれかに記載の操作を実行するための複数の命令を記憶するコンピュータ可読媒体を含む、コンピュータ製品を含む。実施形態７２は、実施形態７１のコンピュータ製品と、コンピュータ可読媒体上に記憶された命令を実行するための１つ以上のプロセッサと含む、システムを含む。実施形態７３は、実施形態１～７０のうちのいずれかを実行するための手段を含むシステムを含む。実施形態７４は、実施形態１～７０のうちのいずれかを実行するように構成されたシステムを含む。実施形態７５は、それぞれが実施形態１～７０のうちのいずれかのステップを実行する、モジュールを含むシステムを含む。

【0288】

ＸＩＩ．コンピュータシステム
本明細書に言及されるコンピュータシステムのいずれも、任意の数のサブシステムを利用し得る。そのようなサブシステムの例を、図３９のコンピュータ装置１０に示す。いくつかの実施形態において、コンピュータシステムは単一のコンピュータ装置を含み、サブシステムはこのコンピュータ装置の構成要素であり得る。他の実施形態において、コンピュータシステムは、それぞれが内部構成要素を有するサブシステムである、複数のコンピュータ装置を含み得る。コンピュータシステムは、デスクトップコンピュータ及びラップトップコンピュータ、タブレット、携帯電話、ならびに他の携帯用デバイスを含み得る。

【0289】

図３９に示されるサブシステムは、システムバス７５を介して相互接続される。プリンタ７４、キーボード７８、記憶デバイス（複数可）７９、ディスプレイアダプタ８２に連結されるモニタ７６、及び他のものなどの追加のサブシステムが示される。Ｉ／Ｏコントローラ７１に連結する、周辺デバイス及び入力／出力（Ｉ／Ｏ）デバイスは、入力／出力（Ｉ／Ｏ）ポート７７（例えば、ＵＳＢ、ＦｉｒｅＷｉｒｅ（登録商標））などの当該技術分野において既知である任意の数の接続によって、コンピュータシステムに接続され得る。例えば、Ｉ／Ｏポート７７または外部インターフェイス８１（例えば、Ｅｔｈｅｒｎｅｔ、Ｗｉ－Ｆｉなど）を使用して、コンピュータシステム１０を広域ネットワーク（インターネット、マウス入力デバイス、またはスキャナなど）に接続することができる。システムバス７５を介した相互接続は、中央プロセッサ７３が各サブシステムと通信し、システムメモリ７２または記憶デバイス（複数可）７９（例えば、ハードドライブなどの固定ディスクまたは光学ディスク）からの複数の命令の実行、及びサブシステム間の情報交換を制御することを可能にする。システムメモリ７２及び／または記憶デバイス（複数可）７９は、コンピュータ可読媒体を具体化し得る。別のサブシステムは、カメラ、マイクロフォン、及び加速度計などのデータ収集デバイス８５である。本明細書に言及されるデータのうちのいずれも、１つの構成要素から別の構成要素へと出力され得、ユーザへと出力され得る。

【0290】

コンピュータシステムは、例えば、外部インターフェイス８１によって、または内部インターフェイスによってともに接続された、複数の同一の構成要素またはサブシステムを含み得る。いくつかの実施形態において、コンピュータシステム、サブシステム、または装置は、ネットワーク上で通信し得る。そのような例において、１つのコンピュータがクライアントと見なされ、別のコンピュータがサーバと見なされ得、それぞれが同一のコンピュータシステムの一部であり得る。クライアント及びサーバはそれぞれ、複数のシステム、サブシステム、または構成要素を含み得る。

【0291】

実施形態の態様は、ハードウェア（例えば、特定用途向け集積回路もしくはフィールドプログラマブルゲートアレイ）を使用する、かつ／またはモジュラもしくは集積様式の一般的にプログラム可能なプロセッサを有するコンピュータソフトウェアを使用する、制御論理の形態で実装され得る。本明細書で使用される場合、プロセッサは、シングルコアプロセッサ、同一の集積チップ上のマルチコアプロセッサ、または単一回路基板上の、もしくはネットワーク化された複数の処理ユニットを含む。本明細書に提供される開示及び教示に基づいて、当業者は、ハードウェア及びハードウェアとソフトウェアとの組み合わせを使用して、本発明の実施形態を実装するための他の手段及び／または方法を認識し、理解するだろう。

【0292】

本出願に記載されるソフトウェア構成要素または機能のいずれも、任意の好適なコンピュータ言語（例えば、Ｊａｖａ、Ｃ、Ｃ＋＋、Ｃ♯、Ｏｂｊｅｃｔｉｖｅ－Ｃ、Ｓｗｉｆｔなど）または例えば、従来の技術またはオブジェクト指向技術を使用するスクリプト言語（例えば、ＰｅｒｌもしくはＰｙｔｈｏｎなど）を使用してプロセッサによって実行される、ソフトウェアコードとして実装することができる。ソフトウェアコードは、記憶及び／または伝送のために、コンピュータ可読媒体上に一連の命令またはコマンドとして記憶され得る。好適な非一時的コンピュータ可読媒体としては、ランダムアクセスメモリ（ＲＡＭ）、リードオンリーメモリ（ＲＯＭ）、磁気媒体（ハードドライブもしくはフロッピーディスクなど）、または光学媒体（コンパクトディスク（ＣＤ）もしくはＤＶＤ（デジタル多用途ディスク）など）、及びフラッシュメモリを挙げることができる。コンピュータ可読媒体は、そのような記憶デバイスまたは伝送デバイスの任意の組み合わせであり得る。

【0293】

そのようなプログラムはまた、インターネットを含む様々なプロトコルに準拠する、有線、光学、及び／または無線ネットワークを介した伝送に適合されたキャリア信号を使用してコードされ、伝送されてもよい。したがって、コンピュータ可読媒体は、そのようなプログラムでコードされたデータ信号を使用して、作製されてもよい。プログラムコードでコードされたコンピュータ可読媒体は、互換デバイスとともにパッケージ化されても、他のデバイスとは別個に（例えば、インターネットダウンロードを介して）提供されてもよい。任意のそのようなコンピュータ可読媒体は、単一のコンピュータ製品（例えば、ハードドライブ、ＣＤ、またはコンピュータシステム全体）上または内に存在してもよく、あるシステムまたはネットワーク内の異なるコンピュータ製品上または内に存在してもよい。コンピュータシステムは、モニタ、プリンタ、または本明細書に言及される結果のうちのいずれかをユーザに提供するための他の好適なディスプレイを含み得る。

【0294】

本明細書に記載される方法のうちのいずれも、ステップを実行するように構成され得る１つ以上のプロセッサを含むコンピュータシステムによって、全体的または部分的に実行され得る。したがって、実施形態は、本明細書に記載される方法のうちのいずれかのステップを実行するように構成されたコンピュータシステムを対象とし得、潜在的に、異なる構成要素が、それぞれのステップまたはそれぞれのステップの群を実行する。番号付けされたステップとして提示されるものの、本明細書の方法のステップは、同時にまたは異なる順序で実行されてもよい。更に、これらのステップの一部分は、他のステップの一部分とともに使用されてもよい。また、ステップの全てまたは一部分が任意であってもよい。更に、本方法のうちのいずれかのステップのうちのいずれも、モジュール、単位、回路、またはこれらのステップを実行するための他の手段によって実行されてもよい。

【0295】

特定の実施形態の具体的な詳細は、本発明の実施形態の趣旨及び範囲から逸脱することなく、任意の好適な様式で組み合わされ得る。しかしながら、本発明の他の実施形態は、個々の各態様、またはこれらの個々の態様の特定の組み合わせに関する、特定の実施形態を対象とし得る。

【0296】

本発明の例示的実施形態の上記の記述は、説明及び記述の目的で提示されている。徹底的であること、または本発明を記載される正確な形態に制限することは意図されず、上記の教示に照らして、多くの修正及び変更が可能である。

【0297】

「１つの（ａ）」、「１つの（ａｎ）」、または「その」の引用は、具体的に反対であることが示されない限り、「１つ以上の」を意味することが意図される。「または」の使用は、具体的に反対であることが示されない限り、「排他的離接」ではなく「包含的離接」を意味することが意図される。「第１の」構成成分に対する言及は、第２の構成成分が提供されることを必ずしも必要としない。更に、「第１の」または「第２の」構成成分に対する言及は、明確に述べられない限り、言及される構成成分を特定の位置には制限しない。

【0298】

本明細書に言及される全ての特許、特許出願、広報、及び記述の全体が、全ての目的のために参照により組み込まれる。いずれも、先行技術であるとは認められてはいない。

【図1】