(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-05-23
(45)【発行日】2023-05-31
(54)【発明の名称】無細胞DNAの断片化パターンの分析
(51)【国際特許分類】
C12Q 1/6809 20180101AFI20230524BHJP
C12Q 1/6806 20180101ALI20230524BHJP
G16B 10/00 20190101ALN20230524BHJP
【FI】
C12Q1/6809 Z
C12Q1/6806 Z ZNA
G16B10/00
(21)【出願番号】P 2021129334
(22)【出願日】2021-08-05
(62)【分割の表示】P 2018503181の分割
【原出願日】2016-07-25
【審査請求日】2021-09-06
(32)【優先日】2015-07-23
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2016-02-12
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】PCT/CN2016/073753
(32)【優先日】2016-02-14
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】512037244
【氏名又は名称】ザ チャイニーズ ユニバーシティ オブ ホンコン
(74)【代理人】
【識別番号】100099759
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100117019
【氏名又は名称】渡辺 陽一
(74)【代理人】
【識別番号】100141977
【氏名又は名称】中島 勝
(74)【代理人】
【識別番号】100150810
【氏名又は名称】武居 良太郎
(74)【代理人】
【識別番号】100166165
【氏名又は名称】津田 英直
(72)【発明者】
【氏名】ロ ユイク-ミーン デニス
(72)【発明者】
【氏名】チーウ ロッサ ワイ クーン
(72)【発明者】
【氏名】チャン クワン チー
(72)【発明者】
【氏名】ジアーン ペイヨーン
【審査官】松原 寛子
(56)【参考文献】
【文献】米国特許出願公開第2015/0011403(US,A1)
【文献】米国特許出願公開第2014/0080715(US,A1)
【文献】米国特許出願公開第2014/0100121(US,A1)
【文献】中国特許出願公開第104662168(CN,A)
【文献】中国特許出願公開第104781422(CN,A)
【文献】BMC Medical Genomics,2015年06月17日,DOI 10.1186/s12920-015-0107-z
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/6809
G16B 10/00
C12Q 1/6806
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
生体試料を分析して対象における癌のレベルを決定する方法であって、以下の:
腫瘍組織型の無細胞DNA分子の末端が、閾値を超える比率で発生する、ゲノム位置の第1のセットを特定することと、
コンピュータシステムによって、前記対象の前記生体試料の複数の組織型に由来する第1の複数の無細胞DNA分子を分析することであって、
第1の複数の無細胞DNA分子の各無細胞DNA分子を分析することが、
前記
各無細胞DNA分子の少なくとも1つの末端に対応する、基準ゲノムにおけるゲノム位置を決定することを含む、前記分析することと、
第1の数の前記第1の複数の無細胞DNA分子が、前記ゲノム位置
の第1のセットのうちの1つで終結することを決定することと;
前記ゲノム位置の第1のセットとは異なるゲノム位置の第2のセットで終結する、第2の数の無細胞DNA分子を使用して、前記第1の数の前記第1の複数の無細胞DNA分子を正規化することによって、相対的存在量を決定することと、
前記相対的存在量を、1つ以上のカットオフ
値と比較することによって、前記対象の癌のレベルを決定することと、を含む、前記方法。
【請求項2】
前記
ゲノム位置の第1のセットを特定することが、
少なくとも1つの第1の追加の試料に由来する第2の複数の無細胞DNA分子を分析して、前記第2の複数の無細胞DNA分子の終結位置を特定することであって、前記少なくとも1つの第1の追加の試料が、腫瘍組織型を含むことが既知である対象由来であり、かつ前記生体試料と同一の試料型のものである、特定することと、
複数のゲノムウインドウの各ゲノムウインドウについて、
前記ゲノムウインドウ内で終結する、前記第2の複数の無細胞DNA分子の対応する数を決定することと、
前記対応する数を基準値と比較して、前記ゲノムウインドウ内の1つ以上のゲノム位置上で終結する無細胞DNA分子の前記比率が前記閾値を超えるかどうかを判定することと、を含む、請求項1に記載の方法。
【請求項3】
前記複数のゲノムウインドウの第1のゲノムウインドウが、1つのゲノム位置よりも大きい幅を有し、前記対応する数が前記基準値を超える場合、前記第1のゲノムウインドウ内の前記ゲノム位置のそれぞれが、前記閾値を超える、前記ゲノム位置上で終結する無細胞DNA分子の前記比率を有するものとして特定される、請求項2に記載の方法。
【請求項4】
前記ゲノム位置の第1のセットが、前記対応する数の最高のN値を有し、Nが、少なくとも10,000である、請求項2に記載の方法。
【請求項5】
前記第2の複数の無細胞DNA分子のそれぞれのサイズを決定することであって、前記ゲノム位置の第1のセットを特定することが、
前記閾値を超える、前記比率を有すると判定された、第1のゲノムウインドウ内で終結する前記第2の複数の無細胞DNA分子の無細胞DNA分子のサイズ分布の第1の統計値を決定することと、
前記第1の統計値をサイズ閾値と比較することと、
前記第1の統計値が前記サイズ閾値を超えない場合、前記第1のゲノムウインドウを前記第1のゲノム位置のセットから除外することと、を更に含む、決定することを更に含む、請求項2に記載の方法。
【請求項6】
前記1つ以上のカットオフ値の少なくとも1
つが、前記少なくとも1つの第1の追加の試料から決定される、請求項2に記載の方法。
【請求項7】
前記少なくとも1つの第1の追加の試料について、
前記試料の取得元の対応する対象において、癌のレベルを決定することと、
前記
ゲノム位置の第1のセットで終結する前記第2の複数の無細胞DNA分子の前記対応する数を使用して、それにより前記
1つ以上のカットオフ値を得ることと、を更に含む、請求項6に記載の方法。
【請求項8】
前記
ゲノム位置の第1のセットの前記各ゲノム位置が、前記ゲノム位置上で終結する前記第2の複数の無細胞DNA分子の少なくとも特定の数の無細胞DNA分子を有する、請求項2に記載の方法。
【請求項9】
前記基準値が、前記少なくとも1つの第1の追加の試料中の無細胞DNA分子の確率分布及び平均長に従う、前記ゲノムウインドウ内で終結する無細胞DNA分子の期待数である、請求項2に記載の方法。
【請求項10】
前記確率分布が、ポアソン分布であり、前記ゲノムウインドウ内の1つ以上のゲノム位置上で終結する無細胞DNA分子の前記比率が前記閾値を超えるかどうかを判定することが、
前記対応する数及び前記期待数を使用して、対応するp値を決定することであって、前記閾値が、カットオフp値に対応し、前記対応するp値が、前記カットオフp値よりも小さいことが、前記ゲノムウインドウ内で終結する無細胞DNA分子の前記比率が前記閾値を超えることを示す、決定することを含む、請求項9に記載の方法。
【請求項11】
前記ゲノム位置上で終結する前記第2の複数の無細胞DNA分子の前記比率が前記閾値を超える、前記ゲノム位置が、第1の上位集合を含み、
前記ゲノム位置の第1のセットを特定することが、
前記コンピュータシステムによって、減少した量の前記腫瘍組織型を有しないものとして特定される、少なくとも1つの第2の追加の試料に由来する第3の複数の無細胞DNA分子を分析して、前記ゲノム位置上で終結する前記第3の複数の無細胞DNA分子の第2の上位集合が前記閾値を超えることを特定することと、
前記ゲ
ノム位置の第1のセットを、前記第1の上位集合内にはあり、かつ前記第2の上位集合内にはない、前記ゲノム位置を含むものとして特定することと、を更に含む、請求項2に記載の方法。
【請求項12】
前記基準値が、前記ゲノムウインドウ内で終結する、無細胞DNA分子の測定された数を含み、前記測定された数が、前記腫瘍組織型を有しないものとして特定される、少なくとも1つの第2の追加の試料の第3の複数の無細胞DNA分子から決定される、請求項2に記載の方法。
【請求項13】
前記第2の複数の無細胞DNA分子のそれぞれのサイズを決定することであって、前記
ゲノム位置の第1のセットを特定することが、
前記閾値を超える、前記比率を有すると判定された、第1のゲノム位置上で終結する、前記第2の複数の無細胞DNA分子の無細胞DNA分子の第1のサイズ分布の第1の統計値を決定することと、
前記閾値を超える、前記比率を有すると判定された、1つ以上の第2のゲノム位置上で終結する、前記第3の複数の無細胞DNA分子の無細胞DNA分子の第2のサイズ分布の第2の統計値を決定することと、
前記第1の統計値を第2の統計値と比較することと、
前記第1の統計値が少なくとも特定の量だけ前記第2の統計値を超えない場合、前記第1のゲノム位置を前記ゲノム位置の
第1のセットから除外して、前記第1のサイズ分布が前記第2のサイズ分布よりも小さいことを示すことと、を更に含む、請求項12に記載の方法。
【請求項14】
前記対応する数を前記基準値と比較することが、
前記対応する数と、前記ゲノムウインドウを網羅する第3の数の前記第2の複数の無細胞DNA分子との、第1の比率を算出することと、
前記第1の比率を前記基準値と比較することであって、前記基準値が、前記ゲノムウインドウ内で終結する読み取りの前記測定された数と、前記ゲノムウインドウを網羅し、かつ前記ゲノムウインドウ内で終結しない、第4の数の前記第3の複数の無細胞DNA分子との基準比率を含む、比較することと、を含む、請求項12に記載の方法。
【請求項15】
前記第3の数の前記第2の複数の無細胞DNA分子が、前記ゲノムウインドウ内で終結しない、請求項14に記載の方法。
【請求項16】
前記ゲノムウインドウ内で終結する無細胞DNA分子の前記比率が、前記閾値を超えるかどうかを判定することが、
前記第1の比率が乗法的因子掛ける前記基準比率よりも大きいかどうかを判定することを含む、請求項14に記載の方法。
【請求項17】
前記生体試料及び前記少なくとも1つの第1の追加の試料の前記試料型が、血漿、血清、脳脊髄液、及び尿からなる群から選択される、請求項2に記載の方法。
【請求項18】
前記ゲノムウインドウが、ゲノム位置であり、前記腫瘍組織型が、複数の腫瘍特異的な対立遺伝子を有し、前記ゲノム位置上で終結する、前記第2の複数の無細胞DNA分子の対応する数を算出することが、
前記ゲノム位置上で終結する前記無細胞DNA分子が、前記複数の腫瘍特異的な対立遺伝子のうちの少なくとも1つを含むかどうかを特定することと、
前記無細胞DNA分子が腫瘍特異的な対立遺伝子を含む場合、前記対応する数に前記無細胞DNA分子を含めることと、
前記無細胞DNA分子が腫瘍特異的な対立遺伝子を含まない場合、前記対応する数に前記無細胞DNA分子を含めないことと、を含む、請求項2に記載の方法。
【請求項19】
前記腫瘍組織型が、少なくとも1つの追加の試料中に複数の腫瘍特異的な対立遺伝子を有し、前記ゲノム位置の第1のセットが、前記複数の腫瘍特異的な対立遺伝子のうちの少なくとも1つを含む、前記少なくとも1つの追加の試料の無細胞DNA分子を使用して決定される、請求項1に記載の方法。
【請求項20】
ゲノム位置の第2のセットは、第2の組織型の無細胞DNA分子の末端が、前記少なくとも1つの追加の試料中で前記閾値を超える比率で発生するようなものであり、前記第2の組織型が、前記少なくとも1つの追加の試料中に複数の第2の組織に特異的な対立遺伝子を有し、前記
ゲノム位置の第2のセットが、前記複数の第2の組織に特異的な対立遺伝子のうちの少なくとも1つを含む、前記少なくとも1つの追加の試料の無細胞DNA分子を使用して決定される、請求項19に記載の方法。
【請求項21】
前記腫瘍組織型と前記第2の組織型との間で共有された対立遺伝子を有する無細胞DNA分子の末端が、前記閾値を超える第2の比率で発生するゲノム位置が、前
記ゲノム位置の第1のセットから除外され、前記
ゲノム位置の第2のセットから除外される、請求項20に記載の方法。
【請求項22】
前記相対的存在量が、前記第1の数及び前記第2の数の比率を含む、請求項1に記載の方法。
【請求項23】
前記相対的存在量が、
前記
ゲノム位置の第1のセットの各ゲノム位置について、
前記ゲノム位置上で終結する、前記第1の複数の無細胞DNA分子の対応する数を、前記第1の数の前記第1の複数の無細胞DNA分子が
前記ゲノム位置の第1のセットのうちのいずれか1つで終結することを判定することの一部として算出することと、
前記ゲノム位置を網羅し、前記ゲノム位置上で終結しない第3の数の前記第1の複数の無細胞DNA分子を、前記第2の数の無細胞DNA分子を決定することの一部として算出することと、
前記対応する数及び前記第3の数の第1の比率を算出することと、
前記第1の比率の平均を前記相対的存在量として算出することと、によって算出される、請求項1に記載の方法。
【請求項24】
正規化が、前記第1の複数の無細胞DNA分子の少なくとも1つの末端に対応する、全てのゲノム位置を使用する、請求項1に記載の方法。
【請求項25】
前記無細胞DNA分子のうちの1つ以上を分析することが、前記無細胞DNA分子の両末端に対応する両方のゲノム位置を決定することを含む、請求項1に記載の方法。
【請求項26】
前記癌のレベルが、前記対象における前記腫瘍組織型の量、前記対象における前記腫瘍のサイズ、前記対象における前記腫瘍の段階、前記対象における腫瘍負荷、及び前記対象における腫瘍転移の存在からなる群から選択される、請求項1に記載の方法。
【請求項27】
分析される前記生体試料から鋳型DNA分子を得ることと、
前記鋳型DNA分子を使用して、分析可能なDNA分子の配列決定ライブラリを調製することであって、前記鋳型DNA分子のDNA増幅のステップを含まない、調製することと、及び
前記分析可能なDNA分子の配列決定ライブラリを配列決定して、前記第1の複数の無細胞DNA分子に対応する複数の配列読み取りを得ることと、を更に含み、
前記第1の複数の無細胞DNA分子を分析することが、
コンピュータシステムから、前記複数の配列読み取りを受信することと、及び
前記コンピュータシステムによって、前記複数の配列読み取りを前記基準ゲノムに整列させて、前記複数の配列読み取りのゲノム位置を決定することと、を含む、請求項1に記載の方法。
【請求項28】
前記癌のレベルに基づいて治療的介入を提供すること、または前記癌のレベルに基づいて前記対象の撮像を実行することを更に含む、請求項1に記載の方法。
【請求項29】
前記ゲノム位置の第1のセットが、600~10,000個のゲノム位置を含む、請求項1に記載の方法。
【請求項30】
生体試料を分析する方法であって、以下の:
対象の
生体試料
の複数の組織型に由来する第1の複数の無細胞DNA分子を分析することであって、
第1の複数の無細胞分子の各無細胞DNA分子を分析することが、
前記無細胞DNA分子の少なくとも1つの末端に対応する、基準ゲノムにおけるゲノム位置を決定することを含む、分析することと、
第1の組織型の無細胞DNA分子の末端が閾値を超える比率で発生する、ゲノム位置の第1セットを取得すること;
前記第1の複数の無細胞DNA分子の前記分析に基づいて、前記
ゲノム位置の第1のセットの1つで終結する
無細胞DNA分子の第1のセットを特定することと、
前記
無細胞DNA分子の第1のセットを用いて、前記対象の健常細胞に対する第1組織型のDNAにおける1つ以上の組織に関連する変化を決定すること
を含む、前記方法。
【請求項31】
前記1以上の組織に関連する変化が、増幅、欠失、1ヌクレオチド変異、異常メチル化、及び異常サイズからなる群から選ばれる少なくとも1つを含む、請求項
30に記載の方法。
【請求項32】
前記1以上の組織に関連する変化が、1つ以上の癌に関連する変化である、請求項
31に記載の方法。
【請求項33】
前記
無細胞DNA分子の第1のセットが、前記
無細胞DNA分子の第1のセットに加重を割り当てることにより用いられ;前記加重は、前記無細胞DNA分子が前記第1の組織型に由来する可能性に相当し、そして前記
無細胞DNA分子の第1のセットの加重和が、前記1以上の組織に関連する変化を決定するために使用される、請求項
30に記載の方法。
【請求項34】
前記第1の組織型が、腫瘍に対応する、請求項
30に記載の方法。
【請求項35】
前記第1の組織型が、胎児に対応し、そしてここで前記対象が胎児を宿した妊婦である、請求項
30に記載の方法。
【請求項36】
前記1以上の組織に関連する変化を用いて前記対象の癌のレベルを決定することをさらに含む、請求項
30に記載の方法。
【請求項37】
前記
ゲノム位置の第1のセットの1つで終結する前記
無細胞DNA分子の第1のセットを特定することが、前記
ゲノム位置の第1のセットからの無細胞DNA分子のハイブリダイゼーションによる捕捉を使用する、請求項
30に記載の方法。
【請求項38】
前記
ゲノム位置の第1のセットの1つで終結する前記
無細胞DNA分子の第1のセットを特定することが、前記
ゲノム位置の第1のセットからの無細胞DNA分子の増幅を使用する、請求項
30に記載の方法。
【請求項39】
前記第1の複数の無細胞DNA分子を分析することが、シーケンシングを含み、それにより配列読み取りを取得し、そして
ゲノム位置の第1のセットで終結する
無細胞DNA分子の第1のセットの特定が、前記配列読み取りを前記基準ゲノムへの配列整列することを含む、請求項
30に記載の方法。
【請求項40】
コンピュータシステムを制御して、請求項1~
39に記載の方法のいずれかの操作を実行するための複数の命令を記憶するコンピュータ可読媒体を含む、コンピュータ製品。
【請求項41】
請求項
40に記載のコンピュータ製品と、
前記コンピュータ可読媒体上に記憶された命令を実行するための1つ以上のプロセッサと、を含む、システム。
【請求項42】
請求項1~
39に記載の方法のいずれかを実行するための手段を含む、システム。
【請求項43】
請求項1~
39に記載の方法のいずれかを実行するように構成された、システム。
【請求項44】
それぞれが請求項1~
39に記載の方法のいずれかのステップを実行するモジュールを含む、システム。
【発明の詳細な説明】
【背景技術】
【0001】
関連出願の相互参照
本出願は、2015年7月23日出願の米国仮特許出願第62/196,250号及び2016年2月12日出願の同第62/294,948号からの優先権、ならびに2016年2月14日出願のPCT出願第PCT/CN2016/073753号からの優先権を主張し、これらの内容全体が、全ての目的のために参照により本明細書に組み込まれる。
【0002】
以前の研究において、血漿DNAがほぼ200塩基対未満の短断片からなることが示された(Lo et al.Sci Transl Med 2010;2(61):61ra91)。血漿DNAのサイズ分布において、ピークは、166塩基対で観察することができた。更に、母体血漿DNAが配列決定される場合、配列決定されたタグ密度は、転写開始部位(TSS)に近い180塩基対周辺の周期性とともに変動することが観察された(Fan et al.PNAS 2008;105:16266-71)。これらの結果は、血漿DNAの断片化がランダムなプロセスではない可能性があるという一組の証拠である。しかしながら、血漿中のDNA断片化の正確なパターン、及びパターンを支配する因子は明らかになっていない。更に、DNA断片化を使用する実用的な用途は、完全には理解されていない。
【発明の概要】
【0003】
様々な実施形態は、無細胞DNA、例えば、血漿DNA及び血清DNAの断片化パターンの分析の用途(例えば、診断的用途)を対象とする。1つの用途の実施形態において、異なる組織型に由来する無細胞DNAの混合物中の特定の組織型の比例的寄与の分類が決定され得る。例えば、特定のパーセンテージ、パーセンテージの範囲、または比例的寄与が特定のパーセンテージを超えるかどうかが、分類として判定され得る。一例において、特定の組織型の好ましい終結位置を特定することができ、好ましい終結位置上で終結する無細胞DNA分子の相対的存在量を使用して、比例的寄与の分類を提供することができる。別の例において、特定の組織型に特異的な領域における断片化パターンの振幅(例えば、あるゲノム位置で終結する無細胞DNA分子の数)を使用してもよい。
【0004】
別の用途の実施形態において、異なる組織型に由来する無細胞DNAの混合物中の特定の組織型の遺伝子型が決定され得る。一例において、特定の組織型の好ましい終結位置が決定され得、好ましい終結位置上で終結する無細胞DNA分子を使用して、遺伝子型が決定され得る。
【0005】
別の用途の実施形態において、無細胞DNA分子の左末端の極大を無細胞DNA分子の右末端の極大と比較することによって、好ましい終結位置を特定してもよい。対応する極大が十分に分離している場合、好ましい終結位置を特定することができる。更に、左/右末端の極大上で終結する無細胞DNA分子の量を、低い分離を有する極大の無細胞DNA分子の量と比較して、組織型の比例的寄与を決定することができる。
【0006】
他の実施形態は、本明細書に記載される方法に関連する、システム、携帯用消費者デバイス、及びコンピュータ可読媒体を対象とする。
【0007】
以下の発明を実施するための形態及び添付の図面を参照して、本発明の実施形態の性質及び利点のより良好な理解を得ることができる。
【図面の簡単な説明】
【0008】
【
図1】本発明の実施形態に従う、インタクト確率(P
I)の定義の一例示的な例を示す。
【
図2】本発明の実施形態に従う、25をzの値として使用する、染色体6上のセグメントにわたるP
Iの変動を示す。
【
図3】母体血漿中の母体由来DNA及び胎児由来DNAのP
Iの同調変動の説明を示す。
【
図4】母体血漿中の母体由来DNA及び胎児由来DNAのP
Iの非同調変動の説明を示す。
【
図5】母体DNA分子及び胎児DNA分子がP
Iの変動において同調するかどうかについての分析を示す、流れ図である。
【
図6】母体血漿中の母体(赤色/灰色)由来DNA断片及び胎児(青色/黒色)由来DNA断片のP
Iの変動の2つの母体血漿試料(S24及びS26)の分析を示す。
【
図8】
図8Aはデオキシリボヌクレアーゼ高感受性部位であるが、TSSではない領域での、P
I変動のパターンを示す。
図8BはTSSであるが、デオキシリボヌクレアーゼ高感受性部位ではない領域での、P
I変動のパターンを示す。
【
図9】異なる組織から放出されるDNAの割合の測定の原理の説明を示す。
【
図10】組織Aに由来するDNAの既知の比例的濃度を有する2つ以上の較正試料の分析によって決定される、FR
Aと、混合物中のDNAに対する組織Aの比例的寄与との間の関係を示す。
【
図11】FR
胎盤と母体血漿中の胎児DNAパーセンテージとの間の相関を示す。
【
図12】FR
血液と母体血漿中の胎児DNA濃度との間の相関を示す。
【
図13】本発明の実施形態に従う、生体試料を分析して、第1の組織型の比例的寄与の分類を決定する、方法1300の流れ図である。
【
図14】腫瘍由来DNAまたは胎児由来DNAの循環DNA断片の場合の差異の原理の説明を示す。
【
図15】第1の組織型を含む複数の組織型に由来する無細胞DNA分子の混合物を含む、生体試料を分析する方法の流れ図である。
【
図16】HCCの症例に特異的である高頻度終結部位の数、妊婦に特異的である高頻度終結部位の数、及び両方の場合によって共有される高頻度終結部位の数を示す、ベン図である。
【
図17】癌に特異的な終結位置上で終結する、配列決定されたDNA断片の割合と、血漿中に既知の腫瘍DNA画分を有する癌患者の血漿中の腫瘍DNA画分との間の関係を示す、較正曲線を示す。
【
図18】胎児に特異的な対立遺伝子ならびに母親及び胎児によって共有された対立遺伝子を担持する、血漿DNAの非ランダム断片化パターンの一例示的な例を示す。
【
図19】ゲノム座標が、情報提供的一塩基遺伝子多型(SNP)を有する領域にわたって、母体血漿DNA断片の終結位置である確率のプロットを示す。
【
図20】母親においてホモ接合され、胎児においてヘテロ接合された、SNPにわたる血漿DNA断片の終結位置の分析を示す。
【
図21】胎児においてホモ接合され、母親においてヘテロ接合された、SNPにわたる血漿DNA断片の終結位置の分析を示す。
【
図22】反復胎児(セットA)末端及び母体(セットX)末端を有する血漿DNA分子の相対的存在量(比率(胎児/母体))と、胎児DNA画分との間の相関を示す。
【
図23】胎児に好ましい終結位置上で終結する断片、及び母体に好ましい終結位置上で終結する断片の、血漿DNAサイズ分布に関するデータを示す。
【
図24】胎児に好ましい終結位置上で終結する断片、及び母体に好ましい終結位置上で終結する断片の、26人の妊娠第一期の妊婦に由来するプールされた血漿DNA試料中の、血漿DNAサイズ分布に関するデータを示す。
【
図25】HCC患者の血漿DNAの非ランダム断片化パターンの一例示的な例を示す。
【
図26】ゲノム座標が、変異部位を有する領域にわたって、血漿DNA断片の終結位置である確率のプロットである。
【
図27A】腫瘍組織中に変異が存在したゲノム位置にわたる血漿DNA断片の終結位置の分析を示す。
【
図27B】比率
変異/野生型と、71人のHCC患者の血漿中の腫瘍DNA画分との間の相関を示す。
【
図28A】妊婦及びHCC患者の血漿DNAの好ましい終結位置の数を示す。セットPは、妊婦において好ましい、2900万個の終結位置を含有した。
【
図28B】比率
HCC/妊娠と、71人のHCC患者の血漿中の腫瘍DNA画分との間に正の相関が観察されたことを示す。
【
図29A】好ましい末端終結比(PETR)の概念の説明を示す。各線は、1つの血漿DNA断片を表す。
【
図29B】11人のHCC患者における、血漿中の腫瘍DNA画分とセットHの位置のPETRとの間の相関を示す。
【
図30】HCCに好ましい末端、HBVに好ましい末端、または共有された末端で終結する血漿DNA分子中に検出される、短DNA(<150塩基対)の割合を示す。
【
図31A】w-PETRの原理の説明を示す。w-PETRの値は、ウインドウA内で終結するDNA断片の数と、ウインドウB内で終結するDNA断片の数との間の比率として計算される。
【
図31B】11人のHCC患者における、腫瘍DNA画分とw-PETRの値との間の相関を示す。
【
図32】臍帯血液血漿試料(210×半数体ゲノム範囲)と比較した場合の、研究試料のそれぞれの血漿試料中に検出される、一般的に共有される好ましい終結位置の割合を示す。
【
図33】2つ以上の試料中に一般的に観察された好ましい終結位置の数、及びいずれか1つの試料中にのみ観察された好ましい終結位置の数を示す、ベン図を示す。
【
図34A】血漿中の胎児DNA画分と、「出産前」血漿DNA試料及び「出産後」血漿DNA試料の比較を通して特定された位置のセット上の、平均PETRとの間の相関を示す。
【
図34B】血漿中の胎児DNA画分と、「出産前」血漿DNA試料及び「出産後」血漿DNA試料の比較を通して特定された位置のセット上の、平均w-PETRとの間の相関を示す。
【
図35A】妊娠18週目の妊婦(妊婦対象1)及び妊娠38週目の妊婦(妊婦対象2)の2人の間で、上位100万個の最も高頻度に観察された血漿DNAに好ましい終結位置を示す。
【
図35B】2人の妊婦の血漿中で、上位100万個の最も高頻度に観察された好ましい終結位置のPETR値の比較を示す。
【
図36】本発明の実施形態に従う、生体試料を分析して、混合物中の第1の組織型の比例的寄与の分類を決定する方法の流れ図である。
【
図37】胎児に好ましい終結位置に近い基準ゲノムに整列させると、異なる対立遺伝子を担持する母体血漿DNA分子を示す。
【
図38】本発明の実施形態に従う、生体試料を分析して、第1の組織型の遺伝子型を決定する方法3800の流れ図である。
【
図39】本発明の実施形態に従う、システム及び方法とともに使用することができる一例示的なコンピュータシステム10のブロック図を示す。
【0009】
用語
「組織」は、機能的単位としてともに群化する細胞の群に対応する。単一の組織中には、2つ以上の型の細胞が見出され得る。異なる型の組織は、異なる型の細胞(例えば、肝細胞、肺胞細胞、または血液細胞)からなり得るが、異なる生物(母親対胎児)に由来する組織、または健常細胞対腫瘍細胞にも対応し得る。
【0010】
「生体試料」は、対象(例えば、妊婦などのヒト、癌を有する者、もしくは癌を有することが疑われる者、臓器移植レシピエント、または臓器に関与する疾患プロセス(例えば、心筋梗塞における心臓、または卒中における脳、または貧血における造血系)を有すことが疑われる対象)から取得され、対象となる1つ以上の核酸分子(複数可)を含有する任意の試料を指す。生体試料は、血液、血漿、血清、尿、膣液、水瘤液(例えば、陰嚢のもの)、膣洗浄液、胸膜液、腹水、脳脊髄液、唾液、汗、涙、痰、気管支肺胞洗浄液、乳頭からの分泌液、身体の異なる部分(例えば、甲状腺、乳房)からの吸引液などの体液であり得る。便試料もまた使用され得る。様々な実施形態において、無細胞DNAについて富化されている生体試料(例えば、遠心分離プロトコルを介して得られる血漿試料)中の大部分のDNAは無細胞であり得、例えば、50%、60%、70%、80%、90%、95%、または99%超のDNAは無細胞であり得る。遠心分離プロトコルは、例えば、3,000g×10分間で液部分を得、例えば、30,000gで更に10分間の遠心分離して、残渣細胞を除去することを含み得る。
【0011】
「癌に関連する変化」または「癌に特異的な変化」としては、癌由来変異(単一ヌクレオチド変異、ヌクレオチドの欠失もしくは挿入、遺伝子もしくは染色体セグメントの欠失、転座、逆位を含む)、遺伝子、遺伝子セグメント、または染色体セグメントの増幅、ウイルスに関連する配列(例えば、ウイルスエピソーム及びウイルス挿入)、異常なメチル化プロファイルまたは腫瘍に特異的なメチル化シグネチャー、異常な無細胞DNAサイズプロファイル、異常なヒストン修飾マーク及び他のエピジェネティック修飾、ならびに癌に関連するか、または癌に特異的な無細胞DNA断片の末端の位置が挙げられるが、これらに限定されない。
【0012】
「情報提供的癌DNA断片」は、癌に関連するか、または癌に特異的な変化または変異のうちのいずれか1つ以上を保持または担持する、DNA断片に対応する。「情報提供的胎児DNA断片」は、患者のゲノムのうちのいずれにも見出されない変異を担持する胎児DNA断片に対応する。「情報提供的DNA断片」は、上記の型のDNA断片のうちのいずれも指し得る。
【0013】
「配列読み取り」は、核酸分子の任意の部分または全てから配列決定された、一連のヌクレオチドを指す。例えば、配列読み取りは、核酸断片から配列決定された、短い一連のヌクレオチド(例えば、20~150)、核酸断の一端もしくは両端の短い一連のヌクレオチド、または生体試料中に存在する核酸断片全体の配列決定であり得る。配列読み取りは、例えば、配列決定技術を使用して、あるいはプローブ(例えば、ハイブリダイゼーションアレイにおけるものもしくは捕捉プローブ)を使用して、あるいは増幅技術(ポリメラーゼ連鎖反応(PCR)または単一プライマーを使用する線形増幅もしくは等温増幅など)を使用して、様々な方法で得ることができる。
【0014】
「終結位置」または「末端位置」(または単に「末端」)は、無細胞DNA分子、例えば、血漿DNA分子の最外側(すなわち、先端)塩基のゲノム座標またはゲノム同一性もしくはヌクレオチド同一性を指し得る。末端位置は、DNA分子のいずれかの末端に対応し得る。このように、DNA分子の開始端及び末端を指す場合、両方が終結位置に対応するだろう。実際には、1つの末端位置が、超並列配列決定もしくは次世代配列決定、単一分子配列決定、二本鎖もしくは一本鎖DNA配列決定ライブラリ調製プロトコル、ポリメラーゼ連鎖反応(PCR)、またはマイクロアレイなどであるが、これらに限定されない分析的方法によって検出または決定される、無細胞DNA分子の1つの先端上の最外側塩基のゲノム座標またはヌクレオチド同一性である。そのようなインビトロ技術は、無細胞DNA分子の真のインビボ物理的末端(複数可)を変化させ得る。したがって、各検出可能な末端は、生物学的に真の末端を提示し得るか、または末端は、分子の元の末端から1つ以上のヌクレオチド内向き、もしくは1つ以上のヌクレオチド長伸長している(例えば、クレノウ断片による非平滑末端化末端二本鎖DNA分子のオーバーハングの5’平滑末端化及び3’充填)。末端位置のゲノム同一性またはゲノム座標は、配列読み取りを、ヒト基準ゲノム、例えば、hg19に整列させた結果から導出してもよい。それは、ヒトゲノムの元の座標を表す指標またはコードの目録から導出してもよい。それは、標的に特異的なプローブ、ミニ配列決定、DNA増幅(これらに限定されない)によって読み取られる無細胞DNA分子上の位置またはヌクレオチド同一性を指し得る。
【0015】
「好ましい末端」(または「反復終結位置」)は、生理学的状態(例えば、妊娠)もしくは病理学的(疾患)状態(例えば、癌)を有しない生体試料中よりも、または同一の病理学的状態もしくは生理学的状態の異なる時点もしくは段階(例えば、治療の前もしくは後)よりも、そのような状態を有する生体試料中で、(例えば、比率によって測定される場合)より高度に提示されているか、または一般的である末端を指す。したがって、好ましい末端は、他の状態と比較して、関連する生理学的状態または病理学的状態において検出される、増加した尤度または確率を有する。増加した確率は、病理学的状態と非病理学的状態との間で(例えば、癌を有する患者または有しない患者において)比較し、尤度比または相対的確率として定量化することができる。尤度比は、試験された試料中で少なくとも閾値数の好ましい末端を検出する確率に基づいて、またはそのような状態を有しない患者よりも、そのような状態を有する患者において好ましい末端を検出する確率に基づいて、決定され得る。尤度比の閾値の例としては、1.1、1.2、1.3、1.4、1.5、1.6、1.8、2.0、2.5、3.0、3.5、4.0、4.5、5、6、8、10、20、40、60、80、及び100が挙げられるが、これらに限定されない。そのような尤度比は、関連する状態を有する試料または有しない試料の相対的存在量の値を比較することによって測定することができる。関連する生理学的状態または疾患状態において好ましい末端を検出する確率はより高いため、そのような好ましい終結位置は、その同一の生理学的状態または疾患状態を有する2人以上の個体において見られるだろう。増加した確率によって、分析される無細胞DNA分子の数がゲノムのサイズよりもはるかに少ない場合ですら、2つ以上の無細胞DNA分子が、同一の好ましい終結位置上の終結として検出され得る。したがって、好ましい終結位置または反復終結位置はまた、「高頻度終結位置」とも呼ばれる。いくつかの実施形態において、定量的閾値を使用して、末端が、好ましい末端と見なされるために、同一の試料中または同一の試料のアリコート中で少なくとも複数回(例えば、3、4、5、6、7、8、9、10、15、20、または50回)検出されることを要求してもよい。関連する生理学的状態としては、人が健常であるか、疾患を有しないか、または対象となる疾患を有しないときの状態を挙げることができる。同様に、「好ましい終結ウインドウ」は、好ましい終結位置の近接した組に対応する。
【0016】
位置上で終結するDNA分子の「比率」は、DNA分子がその位置上でどれほどの頻度で終結するかに関連する。比率は、分析されるDNA分子の数に対して正規化された位置上で終結するDNA分子の数に基づいてもよいてもよい。したがって、比率は、いくつのDNA分子がある位置上で終結するかの頻度に対応し、その位置上で終結するDNA分子の数において極大を有する位置の周期性には関連しない。
【0017】
「較正試料」は、その組織に特異的なDNA画分が既知であるか、または較正方法を介して(例えば、その組織に特異的な対立遺伝子を使用して)決定される、生体試料に対応し得る。別の例として、較正試料は、好ましい終結位置が決定され得る試料に対応し得る。較正試料は、両方の目的で使用することができる。
【0018】
「較正データ点」は、「較正値」と、対象となるDNA(すなわち、特定の組織型のDNA)の測定された比例的分布または既知の比例的分布とを含む。較正値は、その組織型の比例的分布が既知である較正試料について決定される、相対的存在量であり得る。較正データ点は、例えば、別々の点として、または較正関数(較正曲線または較正表面とも呼ばれる)として、様々な方法で定義され得る。較正関数は、較正データ点の追加の数学的変換から導出することができる。
【0019】
「配列決定深度」という用語は、ある座位がその座位に整列された配列読み取りによって網羅される回数を指す。座位は、ヌクレオチドほど小さても、染色体腕ほど大きくても、ゲノム全体ほど大きくてもよい。配列決定深度は、50×、100×などと表すことができ、ここで、「×」は、座位が配列読み取りで網羅される回数を指す。配列決定深度はまた、複数の座位またはゲノム全体に適用することもでき、これらの場合、×はそれぞれ、座位もしくは半数体ゲノムまたはゲノム全体が配列決定される平均回数を指し得る。超深配列決定とは、少なくとも100×の配列決定深度を指し得る。
【0020】
「分離値」は、2つの値に関与する差異または比率に対応する。分離値は、単純な差異または比率であり得る。例として、x/(x+y)だけでなく、x/yの正比例も、分離値である。分離値は、他の因子、例えば、乗法的因子を含んでもよい。他の例として、値の関数の差異または比率(例えば、2つの値の自然対数(ln)の差異または比率)も使用することができる。分離値は、差異及び比率を含んでもよい。
【0021】
「相対的存在量」は、ゲノム位置の1つのウインドウ内で終結する無細胞DNA分子の量(1つの値)を、ゲノム位置の別のウインドウ内で終結する無細胞DNA分子の量(他の値)に関連付ける、分離値の一種類である。2つのウインドウは重複してもよいが、異なるサイズのものである。他の実装例において、2つのウインドウは、重複しない。更に、ウインドウは1ヌクレオチド長の幅のものであり得、したがって、1つのゲノム位置に相当し得る。
【0022】
本明細書で使用される場合、「分類」という用語は、試料の特定の特性に関連付けられる任意の数(複数可)または他の文字(複数可)を指す。例えば、「+」記号(または「正」という単語)は、試料が欠失または増幅を有するものとして分類されることを示し得る。分類は、二進法(例えば、正または負)であっても、より多いレベルの分類(例えば、1~10または0~1の尺度)を有してもよい。「カットオフ」及び「閾値」という用語は、ある操作において使用される所定の数を指す。例えば、カットオフサイズは、それを超えると断片が除外されるサイズを指し得る。閾値は、それを超えるか、またはそれ未満であると、特定の分類が適用される値であり得る。これらの単語のうちのいずれも、これらの文脈のうちのいずれにおいても使用することができる。
【0023】
「癌のレベル」という用語は、癌が存在するかどうか(すなわち、存在もしくは不在)、癌の段階、腫瘍のサイズ、転移が存在するかどうか、身体の総腫瘍負荷、及び/または癌の重症度の他の尺度(例えば、癌の再発)を指し得る。癌のレベルは、数または他の指標(記号、アルファベット文字、及び色など)であり得る。レベルは、ゼロであってもよい。癌のレベルはまた、変異または変異の数に関連付けられる前悪性または前癌性病態(状態)を含む。癌のレベルは、様々な方法で使用することができる。例えば、スクリーニングにおいて、以前に癌を有することが既知ではない人において癌が存在するかどうかを確認することができる。評価において、癌と診断された人を調査して、癌の進行を経時的に監視するか、治療法の有効性を研究するか、または予後を決定することができる。一実施形態において、予後は、患者が癌で死亡する確率、特定の期間もしくは時間後に癌が進行する確率、または癌が転移する確率として表すことができる。検出は、「スクリーニング」を意味しても、癌の示唆的特徴(例えば、症状または他の陽性試験)を有する人が癌を有するかどうかを確認すること意味してもよい。
【0024】
「極大」は、隣接位置と比較した場合の、対象となるパラメータの最大値が得られるゲノム位置(例えば、ヌクレオチド)を指しても、そのようなゲノム位置の対象となるパラメータの値を指してもよい。例として、隣接位置は、50塩基対~2000塩基対の範囲であり得る。対象となるパラメータの例としては、あるゲノム位置上で終結する断片の数、その位置と重複する断片の数、または閾値サイズよりも大きいゲノム位置を網羅する断片の割合が挙げられるが、これらに限定されない。多くの極大値は、対象となるパラメータが周期的な構造を有するときに発生し得る。全体最大値は、極大値のうちの特定のものである。同様に、「極小」は、隣接位置と比較した場合の、対象となるパラメータの最小値が得られるゲノム位置を指しても、そのようなゲノム位置の対象となるパラメータの値を指してもよい。
【発明を実施するための形態】
【0025】
無細胞DNA(例えば、血漿DNA)の断片化パターンに影響を与える因子、及び無細胞DNA断片化パターンの分析の、分子診断における用途を含む用途が記載される。様々な用途において、断片化パターンの特性を使用して、特定の組織型の比例的寄与を決定すること、特定の組織型(例えば、母体試料中の胎児組織もしくは癌患者に由来する試料中の腫瘍組織)の遺伝子型を決定すること、及び/または特定の組織型の好ましい終結位置を特定することができ、その後、これらを使用して、特定の組織型の比例的寄与を決定することができる。いくつかの実施形態において、特定の組織の好ましい終結位置を使用して、例えば、1単位体積当たり(例えば、1ミリリットル当たり)のゲノムの数での、試料中の特定の組織型の絶対的寄与を測定することもできる。
【0026】
比例的寄与の分類の例としては、特定のパーセンテージ、パーセンテージの範囲、または比例的寄与が特定のパーセンテージを超えるかどうかを、分類として判定することができるが挙げられる。比例的寄与の分類を決定するために、いくつかの実施形態において、特定の組織型(例えば、胎児組織または腫瘍組織)に対応する好ましい終結位置を特定することができる。そのような好ましい終結位置は、例えば、無細胞DNA分子がゲノム位置上で終結する比率を分析すること、そのような比率を(例えば、関連する状態を有しない)他の試料と比較すること、ならびにゲノム位置のセットを、状態の違う異なる組織及び/または異なる試料の無細胞DNA分子の末端の高い発生率と比較することによって、様々な方法で決定することもできる。他のゲノム位置で終結する無細胞DNA分子と比較して、好ましい終結位置で終結する無細胞DNA分子の相対的存在量は、特定の組織型の比例的寄与が既知である1つ以上の較正生体試料から決定される、1つ以上の較正値と比較することができる。本明細書に提供されるデータは、相対的存在量の様々な尺度と、試料中の様々な組織の比例的寄与との間の正の関係を示す。
【0027】
比例的寄与の分類を決定するために、いくつかの実施形態において、断片化パターン(例えば、あるゲノム位置で終結する無細胞DNA分子の数)の振幅を使用することができる。例えば、複数のゲノム位置で終結する無細胞DNA分子の数を分析することによって、1つ以上の極小値及び1つ以上の極大値を特定することができる。1つ以上の極大値での第1の数の無細胞DNA分子、及び1つ以上の極小値での第2の数の無細胞DNA分子の分離値(例えば、比率)は、特定の組織型の比例的寄与と正の関連があることが示される。
【0028】
いくつかの実施形態において、対象となる組織の濃度は、無細胞DNA試料の体積または重量に関して測定することができる。例えば、定量的PCRを使用して、抽出された無細胞DNA試料の単位体積または単位重量当たりの、1つ以上の好ましい末端で終結する無細胞DNA分子の数を測定することができる。類似した測定を較正試料について行ってもよく、したがって、寄与は単位体積または単位重量当たりの濃度であるため、比例的寄与を比例的寄与として決定してもよい。
【0029】
異なる組織型に由来する無細胞DNAの混合物中の特定の組織型(例えば、胎児組織または腫瘍組織)の遺伝子型を決定するために、いくつかの実施形態において、その特定の組織型の好ましい終結位置を特定することができる。好ましい終結位置上で終結する無細胞DNA分子のセットの各無細胞DNA分子について、好ましい終結位置で生じる対応する塩基が決定され得る。対応する塩基を使用して、例えば、見られる異なる塩基のパーセンテージに基づいて、好ましい終結位置の遺伝子型を決定することができる。様々な実装例において、1つの塩基のみの高いパーセンテージ(例えば、90%超)は、その塩基の遺伝子型がホモ接合であることを示し得る一方で、類似したパーセンテージ(例えば、30~70%の間)を有する2つの塩基は、遺伝子型がヘテロ接合であるという決定をもたらし得る。
【0030】
好ましい終結位置を特定するために、いくつかの実施形態において、無細胞DNA分子の左末端の極大を無細胞DNA分子の右末端の極大と比較してもよい。対応する極大が十分に分離している場合、好ましい終結位置を特定することができる。更に、左/右末端の極大上で終結する無細胞DNA分子の量を、低い分離を有する極大の無細胞DNA分子の量と比較して、組織型の比例的寄与を決定することができる。
【0031】
以下の記述において、断片化の概要及び技術がまず記載され、その後、断片化パターンの詳述及びその定量化の例、ならびに比例的寄与の決定、好ましい終結位置の特定、及び遺伝子型の決定に関する記述が更に記載される。
【0032】
I.断片化の概要及び技術
本開示において、我々は、無細胞DNAの非ランダム断片化プロセスが存在することを示す。非ランダム断片化プロセスは、ある程度まで無細胞DNAを含有する様々な種類の生体試料(例えば、血漿、血清、尿、唾液、脳脊髄液、胸膜液、羊膜液、腹水(peritoneal fluid)、及び腹水(ascitic fluid))中で起こる。無細胞DNAは、短断片の形態で天然に存在する。無細胞DNA断片化は、無細胞DNA分子が生成または放出されるとき、高分子量DNA(細胞の核内のDNAなど)が短断片に切断、破壊、または消化されるプロセスを指す。
【0033】
全ての無細胞DNA分子が同じ長さであるわけではない。いくつかの分子は、他の分子よりも短い。血漿DNAなどの無細胞DNAは一般に、転写開始部位周辺を含む開いたクロマチンドメイン内で、及びヌクレオソームコア間の位置(リンカー位置など)で、より短く、かつよりインタクトではない、すなわち、不良なインタクト確率である(またはより不調な統合性である)ことが示されている(Straver et al Prenat Diagn 2016,36:614-621)。各異なる組織は、その特徴的遺伝子発現プロファイルを有し、これは転じて、クロマチン構造及びヌクレオソーム配置を含む手段によって制御される。したがって、特定のゲノム位置でのインタクト確率または統合性の無細胞DNAパターン(血漿DNAのものなど)は、それらのDNA分子の原発組織のシグネチャーまたは証明である。同様に、疾患プロセス、例えば、癌が、遺伝子発現プロファイル及び細胞のゲノムの機能を変化させる場合、疾患を有する細胞に由来する無細胞DNAのインタクトな確率プロファイルは、それらの細胞を反映するだろう。それ故に、無細胞DNAプロファイルは、疾患の存在の証拠を提供するか、またはその証明であるだろう。
【0034】
いくつかの実施形態は、無細胞DNA断片化のプロファイルを研究するための解像度を更に改良する。一続きのヌクレオチドにわたる読み取りを単に合計して、より高いまたはより低いインタクト確率または統合性を有する領域を特定する代わりに、我々は、個々の無細胞DNA分子、特に血漿DNA分子の実際の終結位置または終端を研究した。注目すべきことに、我々のデータは、無細胞DNA分子が切断される場所の特定の位置が、ランダムではないことを明らかにする。インビトロで剪断または超音波処理されている高分子量ゲノム組織DNAは、終結位置がゲノムにわたってランダムに散乱したDNA分子を示す。しかしながら、血漿などの試料内で高度に提示される無細胞DNA分子の特定の終結位置が存在する。そのような終結位置の発生率または提示の数は、偶然のみから期待されるよりも統計学的に有意に高い。これらのデータによって、無細胞DNA断片化についての我々の理解は、統合性の領域的変動の理解を一歩超えるものとなる(Snyder et al Cell 2016,164:57-68)。ここで、我々は、切断(cutting)または切断(cleavage)の特定のヌクレオチド位置まですら、無細胞DNA断片化のプロセスが組織化されていることを示す。我々は、無細胞DNA終結位置のこれらの非ランダム位置を、好ましい終結位置または好ましい末端と呼ぶ。
【0035】
本開示において、我々は、異なる生理学的状態または疾患状態を有する個体にわたって一般的に生じる無細胞DNA終結位置が存在することを示す。例えば、妊娠している個体及び妊娠していない個体によって共有される、妊娠中の患者及び癌患者によって共有される、癌を有する個体及び癌を有しない個体によって共有される、一般的に好ましい末端が存在する。他方、主に妊婦においてのみ、癌患者においてのみ、または癌を有しない妊娠していない個体においてのみ生じる、好ましい末端が存在する。興味深いことに、これらの妊娠に特異的な末端または癌に特異的な末端または疾患に特異的な末端はまた、同等の生理学的状態または疾患状態を有する他の個体においても高度に提示される。例えば、1人の妊婦の血漿中に特定される好ましい末端は、他の妊婦の血漿中にも検出可能である。更に、そのような好ましい末端の割合の量は、他の妊婦の血漿中の胎児DNA画分と相関した。そのような好ましい末端の量は、出産後の母体血漿試料中で実質的に減少するため、それらは実際、妊娠または胎児に関連付けられる。同様に、癌において、1人の癌患者の血漿中に特定される好ましい末端は、別の癌患者の血漿中にも検出可能である。更に、そのような好ましい末端の割合の量は、他の癌患者の血漿中の腫瘍DNA画分と相関した。そのような好ましい末端の量は、癌の治療(例えば、外科的切除)後に減少するため、それらは、癌に関連付けられる。
【0036】
無細胞DNAの好ましい末端の分析には、いくつかの用途または有用性が存在する。それらは、妊娠における胎児DNA画分、及びそれ故に胎児の健康についての情報を提供することができる。例えば、いくつかの妊娠関連障害(妊娠高血圧腎症、早期分娩、子宮内胎児発育遅延(IUGR)、胎児染色体異数性、及び他など)は、妊娠期間の適合した対照妊娠と比較して、胎児DNAの画分濃度(すなわち、胎児DNA画分または胎児画分)の撹乱に関連付けられることが報告されている。癌に関連付けられる無細胞血漿DNAの好ましい末端は、血漿試料中の腫瘍DNA画分または画分濃度を明らかにする。腫瘍DNA画分を知ることは、癌の段階についての情報、予後、及び治療有効性または癌の再発を監視する上での援助を提供する。無細胞DNAの好ましい末端のプロファイルはまた、無細胞DNAを含有する生体試料(例えば、血漿)にDNAを寄与する組織の組成も明らかにするだろう。したがって、癌または他の病理(例えば、脳血管発作(すなわち、卒中)、全身性エリテマトーデスの臓器症状)の原発組織を特定できる可能性がある。
【0037】
特定の生理学的状態または病理学的状態に関連する好ましい末端の目録は、異なる生理学的状態または病理学的状態を有する個体間の好ましい末端の無細胞DNAプロファイルを比較すること(例えば、妊娠していない試料と妊娠している試料との比較、癌試料と非癌試料との比較、または癌を有しない妊婦のプロファイルと妊娠していない癌患者のプロファイルとの比較)によって特定することができる。別のアプローチは、異なる生理学的(例えば、妊娠)または病理学的(例えば、癌)プロセスの時点での好ましい末端の無細胞DNAプロファイルを比較することである。そのような時点の例としては、妊娠前及び後、胎児の出産前及び後、妊娠中の異なる妊娠期間にわたって収集された試料、癌の治療(例えば、標的化療法、免疫療法、化学療法、手術)前及び後、癌の診断後の異なる時点、癌の進行前及び後、転移の発症前及び後、疾患の重症度の増加前及び後、または合併症の発症前及び後が挙げられる。
【0038】
更に、好ましい末端は、特定の組織に関連する遺伝子マーカーを使用して特定することができる。例えば、胎児に特異的なSNP対立遺伝子を含有する無細胞DNA分子は、母体血漿などの試料中で胎児に特異的な好ましい末端を特定するのに有用であるだろう。逆も同様に、母体に特異的なSNP対立遺伝子を含有する血漿DNA分子は、母体血漿中で母体に特異的な好ましい末端を特定するのに有用であるだろう。腫瘍に特異的な変異を含有する血漿DNA分子を使用して、癌に関連付けられる好ましい末端を特定することができる。臓器移植の文脈において、ドナーまたはレシピエントのいずれかに特異的なSNP対立遺伝子を含有する血漿DNA分子は、移植された臓器または移植されていない臓器の好ましい末端を特定するのに有用である。例えば、ドナーに特異的なSNP対立遺伝子は、移植された臓器に代表的な好ましい末端を特定するのに有用であるだろう。
【0039】
好ましい末端は、それがある生理学的状態または病理学的状態において検出される尤度または確率が高いときに、その生理学的状態または疾患状態に関連すると見なすことができる。他の実施形態において、好ましい末端は、他の状態よりも、関連する生理学的状態または病理学的状態において特定の確率で検出される可能性が高い。関連する生理学的状態または疾患状態において好ましい末端を検出する確率はより高いため、そのような好ましい末端もしくは反復末端(または終結位置)は、その同一の生理学的状態または疾患状態を有する2人以上の個体において見られるだろう。高い確率はまた、そのような好ましい末端または反復末端を、同一の個体の同一の無細胞DNA試料またはアリコート中で何度も検出可能にするだろう。いくつかの実施形態において、好ましい末端と見なされるために、同一の試料または同一の試料アリコート内で少なくとも特定の回数(例えば、5、10、15、20回など)検出される末端の包含を制限するように、定量的閾値が設定されてもよい。
【0040】
任意の生理学的状態または病理学的状態について、無細胞DNAの好ましい末端の目録が確立された後、標的化方法または非標的化方法を使用して、無細胞DNA試料(例えば、血漿)中のそれらの存在を検出すること、または他の個体が、類似した健康状態、生理学的状態、もしくは疾患状態を有する試験された他の個体の分類を決定することができる。無細胞DNAの好ましい末端は、ランダム非標的化配列決定によって検出することができる。関連する好ましい末端の全てまたは一部分を特定する適切な確率が達成され得るように、配列決定深度が考慮される必要があるだろう。あるいは、高密度の好ましい末端を有する座位のハイブリダイゼーション捕捉を無細胞DNA試料上に実行して、配列決定、マイクロアレイ、またはPCRによるが、これらに限定されない検出に従って、そのような好ましい末端を有する無細胞DNA分子を有する試料を富化してもよい。更に、あるいは、増幅に基づくアプローチ(例えば、逆PCR、ローリングサークル増幅)を使用して、好ましい末端を有する無細胞DNA分子を特異的に増幅し、富化してもよい。増幅生成物は、配列決定、マイクロアレイ、蛍光プローブ、ゲル電気泳動、及び当業者にとって既知である他の標準的アプローチによって特定することができる。
【0041】
実際には、1つの末端位置が、超並列配列決定もしくは次世代配列決定、単一分子配列決定、二本鎖もしくは一本鎖DNA配列決定ライブラリ調製プロトコル、PCR、DNA増幅の他の酵素的方法(例えば、等温増幅)、またはマイクロアレイなどであるが、これらに限定されない分析的方法によって検出または決定される、無細胞DNA分子の1つの先端上の最外側塩基のゲノム座標またはヌクレオチド同一性であり得る。そのようなインビトロ技術は、無細胞DNA分子の真のインビボ物理的末端(複数可)を変化させ得る。したがって、各検出可能な末端は、生物学的に真の末端を提示し得るか、または末端は、分子の元の末端から1つ以上のヌクレオチド内向き、もしくは1つ以上のヌクレオチド長伸長している。例えば、クレノウ断片は、5’オーバーハングの平滑末端化及び3’オーバーハングの充填によって、DNA配列決定ライブラリ構築中に平滑末端化末端二本鎖DNA分子を作製するために使用される。そのような手順は、生物学的末端と同一ではない無細胞DNAの末端位置を明らかにし得るものの、依然として臨床的関連性が確立され得る。これは、好ましいものが特定の生理学的状態または病理学的状態に関連しているか、またはそれに関連付けられることを特定することが、較正試料(複数可)及び試験試料(複数可)中で無細胞DNA末端に一貫的かつ再現可能な変化をもたらす、同一の実験プロトコルまたは方法論的原理に基づき得るためである。いくつかのDNA配列決定プロトコルは、一本鎖DNAライブラリを使用する(Snyder et al Cell 2016,164:57-68)。一本鎖ライブラリの配列読み取りの末端は、二本鎖DNAライブラリの末端よりも更に内向きであっても、伸長していてもよい。
【0042】
末端位置のゲノム同一性またはゲノム座標は、配列読み取りを、ヒト基準ゲノム、例えば、hg19に整列させた結果から導出してもよい。それは、ヒトゲノムの元の座標を表す指標またはコードの目録から導出してもよい。無細胞DNA分子の一端または両端はヌクレオチドである一方で、末端の検出は、血漿DNA分子上の他のヌクレオチドまたは他の一続きのヌクレオチドの認識を通して行うことができる。例えば、増幅産物の中間塩基に結合する蛍光プローブを介して検出される好ましい末端を有する血漿DNA分子の正の増幅。例えば、末端は、断片サイズが既知である血漿DNA分子の中間区分上のいくつかの塩基に結合する蛍光プローブの、正のハイブリダイゼーションによって特定することができる。このように、いくつの塩基が、既知の配列及びゲノム同一性を有する蛍光プローブの外部にあるかを解明することによって、ある末端のゲノム同一性またはゲノム座標を決定することができる。換言すると、末端は、同一の血漿DNA分子上の他の塩基の検出を通して特定または検出することができる。末端は、標的に特異的なプローブ、ミニ配列決定、及びDNA増幅(これらに限定されない)によって読み取られる無細胞DNA分子上の位置またはヌクレオチド同一性であり得る。
【0043】
II.血漿DNAの断片化パターン
母体血漿DNAの断片化パターンの分析のために、我々は、Department of Obstetrics and Gynaecologyから募集した、妊娠12週目の妊婦に由来する血漿DNAを配列決定した(Lo et al.Sci Transl Med 2010;2(61):61ra91)。母親から得られた血漿DNAを、Illumina Genome Analyzerプラットフォームを使用して超並列配列決定に供した。他の超並列配列決定装置または単一分子配列決定装置を使用してもよい。血漿DNA分子のペアードエンド配列決定を実行した。各分子を、各末端で50塩基対(したがって、1分子当たり合計100塩基対)について配列決定した。SOAP2プログラムを使用して、各配列の2つの末端を基準ヒトゲノム(Hg18 NCBI.36)に整列させた(Li R et al.Bioinformatics 2009,25:1966-7)。父親及び母親の軟膜試料ならびにCVS試料から、DNAも抽出した。Affymetrix Genome-Wide Human SNP Array 6.0システムを使用して、これらのDNA試料の遺伝子型を同定した。
【0044】
A.断片化の例示的定量化
断片化パターンを反映するために、母体血漿DNAの配列決定結果に基づいて、ゲノムの各ヌクレオチドについてインタクト確率(P
I)が決定され得る。
【数1】
式中、N
zは、標的ヌクレオチドの両側(5’及び3’)で少なくともz個のヌクレオチド(nt)を網羅する完全長の配列決定された読み取りの数であり、N
Tは、標的ヌクレオチドを網羅する配列決定された読み取りの総数である。
【0045】
P
Iの値は、zの値の2倍に1を加えた(2z+1)長さを有して、インタクトなDNA分子が特定の位置で中央にある確率を反映し得る。インタクト確率(P
I)の値がより高いほど、血漿DNAが特定のヌクレオチド位置で断片化される可能性はより低くなる。これを更に説明するために、インタクト確率の定義を
図1に説明する。
【0046】
図1は、インタクト確率(P
I)の定義の一例示的な例を示す。Tは、P
Iが計算される標的ヌクレオチドの位置である。A及びBはそれぞれ、Tのzヌクレオチド(nt)上流(5’)及びzヌクレオチド下流(3’)の2つの位置である。aからjまで標識された黒線は、母体血漿に由来する配列決定された血漿DNA断片を表す。断片a~dは、3つ全ての位置A、B、及びTを網羅する。したがって、標的ヌクレオチド(N
z)の両側(5’及び3’)の少なくともzヌクレオチドを網羅する断片の数は、4である。更に、断片e、f、及びgはまた、位置Tも網羅するが、それらは、位置A及びBの両方は網羅しない。したがって、位置Tを網羅する合計7つの断片が存在する(N
T=7)。断片h及びjは、AまたはBのいずれかを網羅するが、Tは網羅しない。これらの断片は、N
zまたはN
Tにおいて計数されない。したがって、この特定の例におけるP
Iは、4/7(57%)である。
【0047】
一実施形態において、PIは、25をzの値として使用して計算することができる。したがって、インタクトな血漿DNA断片は、標的位置の少なくとも25nt上流から標的位置の25nt下流までを網羅する断片として定義されるだろう。他の実施形態において、例えば、10、15、20、30、35、40、45、50、55、60、65、70、75、及び80であるが、これらに限定されない他のzの値を使用してもよい。
【0048】
PIは、ゲノム位置のウインドウ内で終結する無細胞DNA分子の相対的存在量の一例である。他の測定基準、例えば、インタクトなDNA分子を有する確率と逆の関係を有するPIの逆数を使用してもよい。PIの逆数のより高い値は、終結位置または終結ウインドウである確率がより高いことを示すだろう。一例は、終結DNA断片の測定された数対終結DNA断片の期待数のp値、全ての整列されたDNA断片外で終結するDNA断片の割合、または好ましい末端終結比(PETR)の割合であり、これらの全てが、以下により詳細に記載される。相対的存在量の全てのそのような測定基準は、無細胞DNA断片が、例えば、2z+1(式中、zはゼロであり得る)の幅を有するウインドウ内で終結する比率を測定し、それにより、そのウインドウがゲノム位置に相当するようにする。
【0049】
B.断片化パターンの周期性
ゲノムの特定の領域は、特定の組織中でより高い比率(頻度)の染色体領域の破損を受けやすく、したがって、より高い比率のその領域内のウインドウ内で終結する無細胞DNA断片を有する。相対的存在量のプロットは、周期的構造を有し得る断片化パターンを示す。周期的構造は、最大終結位置(高切断)の位置及び最小終結位置(低切断)の位置を示す。PIを使用するとき、最大値は低切断のウインドウに対応するが、これは、PIが切断確率(終結位置確率)とは対照的にインタクト確率を測定するためであり、これらは互いに逆の関係を有する。
【0050】
図2A及び2Bは、本発明の実施形態に従う、25をzの値として使用する、染色体6上のセグメントにわたるP
Iの変動を示す。
図2Aにおいて、P
Iの変動は、左側の記号表に示されるように、異なる強度の灰色で示される。
図2Bにおいて、P
Iの変動は、より短いセグメントで可視化される。x軸は、ヌクレオチド(nt)におけるゲノム座標であり、y軸は、P
Iである。P
Iの変動は、約180塩基対の明確な周期性を有する。
【0051】
C.母体血漿中の母体DNA及び胎児DNAのP
Iの同調変動
P
Iは、約180塩基対の周期性をもってゲノムにわたって変動する一方で、我々は、P
Iの変動が胎児由来血漿DNA分子及び母体由来血漿DNA分子で同調するかどうかを更に調査した。同調変動は、PIのピーク(極大)及びトラフ(極小)が、ゲノムを通して、または十分に高い割合のゲノムで、同一の相対ヌクレオチド位置で生じることを意味する。十分に高い割合を定義するための閾値は、特定の用途について調節されてもよく、例えば、>20%、>25%、>30%、>35%、>40%、>45%、>50%、>55%、>60%、>65%、>70%、>75%、>80%、>85%、>90%、及び>95%であるが、これらに限定されない。以下の2つの図(
図3及び
図4)は、母体血漿中の母体由来DNA及び胎児由来DNAのP
Iの変動間の、2つの可能性のある関係を示す。
【0052】
図3は、母体血漿中の母体由来DNA及び胎児由来DNAのP
Iの同調変動の説明を示す。P
Iのピーク及びトラフは、ゲノムにわたって、またはゲノムのほとんどの部分で、母体DNA及び胎児DNAについて同一の相対位置で生じる。領域内に同調変動が存在した場合、胎児由来DNA及び母体由来DNAは、同一の断片化パターンを有し、それにより、組織型のうちの1つのシグネチャーとしての、領域内の断片化パターンの周期性の使用を妨害するだろう。
【0053】
図4は、母体血漿中の母体由来DNA及び胎児由来DNAのP
Iの非同調変動の説明を示す。母体DNA及び胎児DNAのP
Iのピーク及びトラフは、ゲノムにわたって一定の相対関係を有しない。領域Iで、母体DNAのP
Iのピークは、胎児DNAのピークと一致する。領域IIで、母体DNAのP
Iのピークは、胎児DNAのトラフと一致する。領域III及びIVで、母体DNAのP
Iのピークは、胎児DNAのピークと胎児DNAのトラフとの間である。変動が同調しなかった場合、胎児断片化パターン及び母体断片化パターンにおけるそのような差異をシグネチャーとして使用して、胎児または母親に由来する可能性が高いDNAを特定することができる。更に、以下により詳細に記載されるように、そのような差異を使用して、胎児組織または母体組織の比例的寄与を決定することができる。例えば、領域II内のピークのうちの1つで終結するDNA断片は、胎児DNAである可能性がより高く、他のゲノム位置と比較して、そのようなピークで終結するDNA断片の相対的存在量は、胎児DNA画分の増加とともに増加するだろう。
【0054】
図5は、母体DNA分子及び胎児DNA分子が、P
Iの変動において同調するかどうかについての分析500の流れ図である。分析500は、母体血漿中の母体由来DNAと胎児由来DNAとの間でPIの変動が同調するかどうかを調査する。分析500は、コンピュータシステムを使用してもよい。上述のように、分析500は配列決定を使用して実行したものの、例えば、本明細書に記載される他の技術を使用してもよい。
【0055】
ブロック510で、分析500は、妊婦がホモ接合(AA)であり、胎児がヘテロ接合(AB)であるSNPを特定する。これらのSNPは、情報提供的SNPと呼ばれる。B対立遺伝子は、胎児に特異的な対立遺伝子である。そのような情報提供的SNPは、母体起源のみまたは主に母体起源の母体試料を分析することによって特定することができる。白血球細胞は主に母親に由来するものであるため、例えば、血液試料の軟膜を使用してもよい。唯一のヌクレオチド(または胎児DNA画分に依存し得る、高パーセンテージ(例えば、80%超)の1つのヌクレオチド)が出現するゲノム位置は、母親においてホモ接合であるものとして特定することができる。血漿を分析して、別の対立遺伝子が特定された十分なパーセンテージのDNA断片が特定される、母親においてホモ接合である位置を特定することができる。
【0056】
ブロック520で、胎児に特異的な対立遺伝子Bを有する血漿DNA分子を特定した。これらのDNA分子は、対立遺伝子Bの特定の結果として胎児組織に対応するものとして特定することができる。
【0057】
ブロック530で、母体血漿中の無細胞DNAのPIの値を決定した。PIのこれらの値は、胎児DNA及び母体DNAを含む。所与のゲノム位置のPIの値を、基準ゲノムのそのゲノム位置に整列された配列読み取りを分析することによって得た。
【0058】
ブロック540で、ブロック530の出力を分析することによって、PIのピークを決定した。ピークは様々な方法で特定することができ、各ピークは1つのゲノム位置のみに制限されても、2つ以上のゲノム位置に対応してもよい。我々は、母体血漿中のほぼ母体由来のDNAについて、PIが、約180塩基対の周期性を有する正弦様パターンで、ゲノム全体にわたって変動することを観察した。
【0059】
ブロック550で、情報提供的SNPと全母体血漿の最も近いPI(ブロック540)との間の距離を決定した。我々は、主に妊婦自身に由来した全血漿DNAのPI変動の最も近いピークに対する、SNPの位置を特定した。
【0060】
ブロック560で、胎児由来DNA断片の全てを凝集した。胎児に特異的な対立遺伝子を担持する全ての検出された血漿DNA断片を凝集して、胎児由来DNAのPIを計算した。その後、全母体血漿DNAの最も近いPIピークの位置を参照して、凝集された胎児由来DNA断片のPIを計算した。全母体血漿DNAのPIの計算に類似した様式で、胎児由来DNAのPIの計算を実行した。
【0061】
ブロック570で、全母体血漿DNAのP
Iのピークに関する、胎児由来DNA断片のP
Iの変動を決定した。変動を
図6に示す。
【0062】
図6は、母体血漿試料中の胎児由来DNA断片(赤色/灰色)及び全DNA断片(青色/黒色)のP
Iの変動の2つの母体血漿試料(S24及びS26)の分析を示す。縦軸は、P
Iをパーセンテージとして示す。横軸は、情報提供的SNPとP
Iの最も近いピークとの間の、塩基対(bp)における距離を示す。
【0063】
合計値は、胎児DNA及び母体DNAからの寄与を含む。合計値は、全てのピークPIにわたって凝集される。理解することができるように、SNPがピークPIにより近いほど、PIの値はより高くなる。実際、胎児由来DNA断片について、ピークPIは約0位に位置した。したがって、PIは、母体由来DNA断片及び胎児由来DNA断片について、およそ同一の位置でピークとなった。これらのデータから、我々は、母体由来DNA及び胎児由来DNAのPIの変動は同調すると結論付ける。
【0064】
断片化パターンは同調するように見えるものの、以下の記述は、周期性以外の他の特性を使用して、断片化パターンを区別し、それにより、特定の組織型のシグネチャーの決定を可能にすることができることを示す。例えば、特定のゲノム領域のピーク及びトラフの振幅の差異が見出されており、それにより、それらの領域内の特定の位置を使用して、組織に特異的な断片化パターンを決定することが可能となっている。
【0065】
D.血漿DNAの断片化パターンの変動に影響を与える因子
以前の研究において、血漿DNAの断片化はTSSの近くではランダムではないことが示された(Fan et al.PNAS 2008;105:16266-71)。任意の血漿DNAが特定のヌクレオチド上で終結する確率は、およそヌクレオソームのサイズの周期性をもって、TSSまでの距離とともに変動するだろう。この断片化パターンは、DNAのアポトーシス分解の結果であると一般に考えられた。したがって、血漿DNAのサイズは一般に、ヒストン複合体に関連するDNAのサイズに似ている。
【0066】
以前の研究において、血漿DNAのサイズが一般に、ヌクレオソームに関連するDNAのサイズに似ていることも示された(Lo et al.Sci Transl Med 2010;2(61):61ra91)。血漿DNAは、細胞DNA(核DNA及びミトコンドリアDNA)のアポトーシス分解を通して生成されるであると考えられる。この考え方は、ミトコンドリアDNAは細胞内のヒストンに関連付けられないため、循環ミトコンドリアDNAにおいてこのヌクレオソームパターンが欠如することによって更に支持される。血漿DNA断片が終結するヌクレオチド位置は、転写開始部位近くではランダムではないことが示された(Fan et al.PNAS 2008;105:16266-71)ものの、血漿DNAの断片化パターンを支配する正確な機構は、依然として不明確なままである。
【0067】
近年、異なる配列文脈を有する領域内で、血漿DNAのサイズが異なることが更に示されている(Chandrananda et al.BMC Med Genomics 2015;8:29)。後者のデータはまた、無細胞DNA断片が、ヌクレオソームコアでよりも、ヌクレオソームリンカー領域上で開始し、終結する可能性が高いという以前の仮説を支持する。これらの発見は、以前の節において論じた、インタクト確率におけるヌクレオチド対ヌクレオチドの変動についての我々の発見と一貫する。ここで、我々は、インタクト確率における変動の振幅が異なるゲノム領域にわたって変動すると更に仮定する。断片化の可変性におけるこの領域対領域の変動は、いかなる以前の研究においても適切には調査または定量化されていない。以下の図は、PIの局所的変動及び領域的変動の概念を説明する。
【0068】
図7は、P
Iの変動の振幅の説明を示す。以前の節において、我々は、短い一続きのDNA上のP
Iの正弦様パターンの変動を実証した。ここで、我々は、より大きなゲノム領域にわたる変動の振幅を更に分析する。変動の振幅は、特定のサイズを有する特定の領域での、P
Iの最高ピーク変動とトラフ変動との間のP
Iの差異を指す。一実施形態において、特定の領域のサイズは、1000塩基対であり得る。他の実施形態において、他のサイズ(例えば、600塩基対、800塩基対、1500塩基対、2000塩基対、3000塩基対、5000塩基対、及び10000塩基対であるが、これらに限定されない)を使用してもよい。
【0069】
図7に示されるように、領域1の振幅は、領域2の振幅よりも高い。この挙動は、以下のデータにおいて見られる。そのような高い振幅の発生が、異なる組織の異なるゲノム領域で生じる場合、組織型間で振幅が異なる領域を分析するとき、振幅の測定を使用して、組織型の比例的寄与を決定することができる。例えば、異なる組織型について振幅が異なる場合、比例的寄与は、特定の組織型(例えば、胎児組織または腫瘍組織)に由来するDNAの量の増加とともに比例的に変動するだろう。したがって、振幅の尺度は、特定の比例的寄与に対応するだろう。実施形態において、米国特許公開第2009/0087847号、同第2011/0276277号、同第2011/0105353号、同第2013/0237431号、及び同第2014/0100121号(これらの全体が参照により組み込まれる)に記載されるような、比例的寄与が別の技術を介して(例えば、対立遺伝子、メチル化シグネチャー、増幅/欠失の程度の分析によって)測定される試料に由来する較正データを使用してもよい。
【0070】
我々の配列決定データにおいて、我々は、PIの変動の振幅が異なるゲノム領域にわたって変動することを観察した。我々は、PIの変動の振幅が、アポトーシス中の分解に対するクロマチンのアクセス可能性に関係すると仮定する。したがって、我々は、変動の振幅と、ゲノム内のデオキシリボヌクレアーゼ高感受性部位との間の可能性のある関係を調査した。以前の研究において、血漿DNAの断片化パターンは、TSSに対するその相対位置によって影響されることが観察された。我々の分析において、我々は、血漿DNAの断片化パターンの効果に対する、TSS及びデオキシリボヌクレアーゼ高感受性部位の相対的重要性を調査した。振幅が試験される組織に対応する、他の部位を使用してもよい。そのような種類の部位の一例は、ハイスループット配列決定でのトランスポサーゼアクセス可能クロマチンのためのアッセイ(ATAC-Seq)(Buenrostro et al.Nat Methods 2013;10:1213-1218)を使用して特定されるものである。そのような種類の部位の別の例は、小球菌ヌクレアーゼ(MNase)を使用して特定されるものである。
【0071】
我々は、2つの種類のゲノム領域内のPI変動の振幅を比較した。
ii.TSSであるが、デオキシリボヌクレアーゼ高感受性部位ではない領域、及び
iii.デオキシリボヌクレアーゼ高感受性部位であるが、TSSではない領域。
【0072】
TSS及びデオキシリボヌクレアーゼ高感受性部位の座標を、ENコードデータベース(genome.ucsc.edu/ENCODE/downloads.html)から検索した。
【0073】
TSS及びデオキシリボヌクレアーゼI部位周辺のPIパターンを、以下のアプローチを使用してプロファイル化した。
1)標的とする基準部位周辺の上流及び下流の2kb領域を回収する。
2)その後、基準部位までの距離に従って、絶対ゲノム座標を再縮尺する。例えば、60塩基対のサイズを有する特定のウインドウが基準部位から上流方向に50塩基対である場合、それは-50とマークされる。さもなければ、60塩基対のサイズを有する特定のウインドウが基準部位から下流方向に50塩基対である場合、それは+50とマークされる。
3)該ウインドウに重複するインタクトな断片及び全ての断片の計数を使用して、再縮尺された同一の新たな座標を有する特定のウインドウ内のPI値を再計算する。
【0074】
図8Aは、デオキシリボヌクレアーゼ高感受性部位であるが、TSSではない領域での、P
I変動のパターンを示す。
図8Bは、TSSであるが、デオキシリボヌクレアーゼ高感受性部位ではない領域での、P
I変動のパターンを示す。示されるように、変動の振幅は、TSSであるが、デオキシリボヌクレアーゼ高感受性部位ではない領域よりも、デオキシリボヌクレアーゼ高感受性部位であるが、TSSではない領域内で一層高い。これらの観察は、血漿DNAの断片化パターンに影響を与える1つの因子が、デオキシリボヌクレアーゼ高感受性部位に対する断片化に供される領域の相対位置であることを示唆する。
【0075】
III.組織の割合を決定するためのピーク及びトラフの使用
デオキシリボヌクレアーゼ高感受性部位に対する相対位置が、血漿DNAの断片化パターンを支配する重要な因子であることを実証したところで、我々は、この観察が臨床的用途に置き換えられるかどうかを調査した。デオキシリボヌクレアーゼ高感受性部位のプロファイルは、異なる組織型において異なることが観察されている。プロファイルはその部位のゲノム位置に対応し、デオキシリボヌクレアーゼ高感受性部位の位置は異なる組織について異なる。したがって、我々は、異なる組織型から放出される血漿DNAが組織に特異的な断片化パターンを呈すると考える。類似した様式で、領域の振幅が組織によって変動する他の領域を使用してもよい。
【0076】
A.デオキシリボヌクレアーゼ高感受性部位の例
図9は、異なる組織から放出されるDNAの割合の測定の原理の説明を示す。組織Aに由来する血漿DNAは、高いP
I(ピーク、Pと表示)を有するヌクレオチド位置を断片化する確率がより低い。したがって、組織Aに由来する血漿DNAの末端は、これらのヌクレオチド位置に位置する確率がより低い。対照的に、組織Aに由来する血漿DNAは、低いP
I(トラフ、Tと表示)を有するヌクレオチド位置に位置する確率がより高い。他方、この部位は組織Bのデオキシリボヌクレアーゼ高感受性部位ではないため、P
I変動の振幅は、組織Bに由来する血漿DNAでは低い。したがって、組織Bに由来する血漿DNAが位置P及び位置T上で終結する確率は、少なくとも組織Aに見られる変動の量と比較して、類似しているだろう。
【0077】
我々は、組織Aのデオキシリボヌクレアーゼ高感受性部位である領域での断片末端比(FR
A)を、以下のように定義する。
【数2】
式中、N
Tは、P
Iのトラフのヌクレオチド位置上で終結する血漿DNA断片の数であり、N
Pは、P
Iのピークヌクレオチド位置上で終結する血漿DNA断片の数である。FR
Aは分離値の一例であり、より具体的には、ピーク上で終結するDNA断片に対する、トラフ上で終結するDNA断片の相対的存在量の一例である。他の実施形態において、隣接するトラフ(極小)及びピーク(極大)の分離比が決定され得、分離比の平均が決定され得る。
【0078】
組織Aについて、NTがNPよりも大きいため、FRAは1よりも大きいだろう。組織Bについて、NT及びNPが類似するため、FRAは1に近似するだろう。したがって、組織A及びBの両方に由来する血漿DNAを含有する混合物中、FRAの値は、組織Aの比例的寄与と正の相関を有するだろう。実際には、組織BのFRAは1である必要はない。組織BのFRAが組織AのFRAと異なる限り、2つの組織型の比例的寄与が、FRAから決定され得る。
【0079】
そのような領域内で、DNA断片がトラフで終結する尤度の高い変動は、ピークで終結するよりも、そのような位置で終結する多数のDNA断片をもたらすだろう(異なる定義された相対的存在量の値について、ピークでより高い尤度が生じ得ることに留意されたい)。より多くのDNA断片が組織型Aに由来する場合、トラフ及びピークで終結するDNAの数の差異はより大きくなるだろう。したがって、組織Aの比例的寄与が増加するにつれて、トラフ上で終結するDNA断片の数とピーク上で終結するDNA断片の数との間の分離はより大きくなるだろう。この分離値は、組織Aについて
図9に示される尤度関数の高い振幅に対応する。
【0080】
B.相対的存在量と比例的寄与との間の関係
図10は、組織Aに由来するDNAの既知の比例的濃度を有する2つ以上の較正試料の分析によって決定される、FR
Aと、混合物中のDNAに対する組織Aの比例的寄与との間の関係を示す。示される例において、組織Aの比例的寄与を有する2つの試料、x
1及びx
2を分析する。2つの試料のFR
A値をそれぞれ、y
1及びy
2として決定した。FR
AとAの比例的寄与との間の関係は、x
1、x
2、y
1、及びy
2の値に基づいて決定され得る。
【0081】
値y1及びy2は、較正値の例である。データ点(x1,y1)及び(x2,y2)は、較正データ点の例である。較正データ点を関数に適合させ、較正曲線1010を得ることができ、これは線形であり得る。新たな試料の新たなFRA(または他の相対的存在量の値)を測定し、新たなFRAを較正値のうちの少なくとも1つと比較して、新たな試料の比例的寄与の分類を決定することができる。較正値に対する比較は、様々な方法で行うことができる。例えば、較正曲線を使用して、新たなFRAに対応する比例的寄与xを見出すことができる。別の例として、新たなFRAを第1の較正データ点の較正値y1と比較して、新たな試料がx1超またはx1未満の比例的寄与であるかどうかを判定することができる。
【0082】
他の実施形態において、他の組織のFRAが比較的一定である限り、3つ以上の組織型を含有する混合物を、組織Aの比例的寄与について同様に分析することができる。そのような方法は、異なる臨床的シナリオ(例えば、癌の検出、移植の監視、外傷の監視、感染症及び出生前診断などであるが、これらに限定されない)の分析に実用的に有用である。
【0083】
一実施形態において、癌患者の血漿中の罹患した組織の画分濃度が決定され得る。例えば、肝臓癌を有する患者において、肝臓に特異的な開いたクロマチン領域、例えば、デオキシリボヌクレアーゼ高感受性部位の分析を介して、肝臓DNAの画分濃度が決定され得る。一実施形態において、これは、DNAse-Seqを使用して行うことができる(Boyle et al.Cell 2008;132:311-322、Madrigal et al.Front Genet 2012;16:123-131)。別の実施形態において、これは、調節エレメントのホルムアルデヒド支援単離(FAIRE)-Seqによって実行することができる(Giresi et al.Genome Res 2007;17:877-885)。更に別の実施形態において、これは、ATAC-Seqによって実行することができる(Buenrostro et al.Nat Methods 2013;10:1213-1218)。FR
肝臓をこれらの部位で決定し、正常な健常対象と比較することができる。肝臓に特異的なデオキシリボヌクレアーゼ高感受性部位で、ピーク領域とトラフ領域との間のP
Iの変動は、主に肝臓に起因するものだろう。
図10に類似した較正曲線との比較を通して、肝臓の寄与が決定され得る。試験された症例のFR
肝臓の値を、健常対象における肝臓の寄与の範囲と比較してもよい。ある混合物の様々な組織間のゲノム位置で終結するDNA断片の、尤度関数の振幅の高い変動を有する他の領域を使用してもよい。そのような他の領域の例は、後節においてより詳細に記載される。
【0084】
同様に、臓器移植を受容した患者における移植された臓器の寄与が、この方法によって決定され得る。以前の研究において、拒絶を有する患者は移植された臓器からのDNAの放出の増加を導き、これが移植された臓器からのDNAの血漿中濃度の上昇をもたらすことが示された。移植された器官のFRの分析は、臓器拒絶の検出及び監視のための有用な方法であるだろう。そのような分析に使用される領域は、どの臓器が移植されるかによって変動し得る。
【0085】
別の実施形態において、この方法を使用して、母体血漿中の胎児DNA濃度を決定することができる。母体血漿中、胎児遺伝子型を担持するDNA分子は実際には、胎盤に由来する。したがって、我々が胎盤に特異的であるが、血液細胞中には存在しないデオキシリボヌクレアーゼ高感受性部位に着目すると、我々は、FR胎盤の分析を通して、血漿DNAに対する胎盤の比例的寄与を決定することができるだろう。
【0086】
図11は、本発明の実施形態に従う、FR
胎盤と母体血漿中の胎児DNAパーセンテージとの間の相関を示す。縦軸は、1つ以上のデオキシリボヌクレアーゼ高感受性部位内に位置する1つ以上の極大値及び極小値を使用して決定される、FR
胎盤に対応する。横軸は、別個の測定技術を使用して測定される、胎児DNA画分である。理解することができるように、FR
胎盤の値は、胎児DNA画分と相関する。この例において、胎児DNA画分は、母親がホモ接合され、胎児がヘテロ接合された、SNPでの胎児に特異的な対立遺伝子の割合に基づいて決定した。したがって、胎児DNAパーセンテージは、母体血漿DNAの配列決定結果に基づいて、FR
胎盤を使用して推定することができる。
【0087】
あるいは、母体血漿中の2つの重要な構成成分は胎盤由来DNA及び血液細胞に由来するDNA(異なる組織型)であるため、我々は、FR血液が血液血漿中の胎児DNAの画分濃度と負に相関すると考えた。したがって、血液細胞に特異的なデオキシリボヌクレアーゼ高感受性部位を特定し、FR血液を決定した。
【0088】
図12は、FR
血液と母体血漿中の胎児DNA濃度との間の相関を示す。縦軸は、1つ以上のデオキシリボヌクレアーゼ高感受性部位内に位置する1つ以上の極大値及び極小値を使用して決定される、FR
血液に対応する。横軸は、母体血漿中の胎児に特異的な対立遺伝子の割合に基づいて測定される、胎児DNA画分である。FR
血液と胎児DNAパーセンテージとの間に、負の相関を観察することができた。したがって、胎児DNAパーセンテージは、母体血漿DNAの配列決定結果に基づいて、FR
血液を使用して推定することができる。したがって、ゲノム領域は、複数の組織型に特異的な断片化パターン、例えば、いくつかの組織(複数可)について正の相関(複数可)及び他の組織(複数可)について負の相関(複数可)を有し得る。
【0089】
C.極大及び極小を使用する方法
図13は、本発明の実施形態に従う、生体試料を分析して、第1の組織型の比例的寄与の分類を決定する、方法1300の流れ図である。生体試料は、第1の組織型を含む複数の組織型に由来する無細胞DNA分子の混合物を含む。本明細書に記載される他の方法と同様に、方法1300は、コンピュータシステムを使用してもよい。第1の組織型(例えば、肝臓組織または胎児組織)は、特定の対象に基づいて選択され得る。例えば、対象が以前に肝臓癌を有した場合、肝臓癌が再発している(これは肝臓組織に由来する比例的寄与の増加をもたらすだろう)かどうかを確認するために、スクリーニングが実行され得る。そのような選択基準は、本明細書に記載される他の方法に適用される。
【0090】
ブロック1310で、第1の組織型に特異的な断片化パターンを有する少なくとも1つのゲノム領域を特定する。一例として、少なくとも1つのゲノム領域が、1つ以上のデオキシリボヌクレアーゼ高感受性部位を含んでもよい。例えば、節VIに記載されるように、第1の組織型に特異的な断片化パターンを有する少なくとも1つのゲノム領域のそれぞれが、少なくとも1つの追加の試料中で1つ以上の第1の組織に特異的な対立遺伝子を含んでもよい。別の例として、少なくとも1つのゲノム領域が、1つ以上のATAC-seqまたは小球菌ヌクレアーゼ部位を含んでもよい。第1の組織型は、特定の臓器、またはその臓器の特定の癌にすら対応し得る。
【0091】
ブロック1320で、生体試料に由来する複数の無細胞DNA分子を分析する。無細胞DNA分子の分析は、無細胞DNA分子の少なくとも1つの末端に対応する、基準ゲノムにおけるゲノム位置(終結位置)を決定することを含む。したがって、無細胞DNA分子の2つの終結位置が決定されても、1つの終結位置のみが決定されてもよい。
【0092】
終結位置は、本明細書に記載されるように、様々な方法で決定され得る。例えば、無細胞DNA分子を配列決定して、配列読み取りを得てもよく、その配列読み取りを基準ゲノムにマッピングしても(整列させても)よい。生物がヒトである場合、基準ゲノムは、潜在的には特定の下位集団に由来する基準ヒトゲノムであるだろう。別の例として、無細胞DNA分子を(例えば、PCRまたは他の増幅の後に)異なるプローブで分析してもよく、ここで、各プローブは、少なくとも1つのゲノム領域を網羅し得るゲノム位置に対応する。
【0093】
統計学的に有意な数の無細胞DNA分子を分析して、正確な決定第1の組織型からの比例的寄与を提供することができる。いくつかの実施形態において、少なくとも1,000個の無細胞DNA分子が分析される。他の実施形態において、少なくとも10,000または50,000または100,000または500,000または1,000,000または5,000,000個以上の無細胞DNA分子が分析されてもよい。
【0094】
ブロック1330で、第1のセットの第1のゲノム位置を特定する。各第1のゲノム位置は、第1のゲノム位置に対応する無細胞DNA分子の末端の極小を有する。複数の隣接ゲノム位置を極値(極大または極小)として定義することができ、したがって、極大は1つの位置のみに限定されない。
【0095】
いくつかの実施形態において、複数のゲノム位置のそれぞれの比率が決定され得る。ゲノム位置で終結し、ゲノム位置の両側に少なくとも特定の数のヌクレオチド長伸長する、第1の量の無細胞DNA分子は、例えば、
図1に記載されるように決定され得る。ゲノム位置に位置する第2の量の無細胞DNA分子を、第1の量とともに使用して、比率を決定してもよい。例えば、比率の値を通して進むことによって、比率における複数の極小値及び複数の極大値を特定して、極値(極大または極小)のそれぞれで生じる1つ以上の近接ゲノム位置を特定することができる。
【0096】
ブロック1340で、第2のセットの第2のゲノム位置を特定する。無細胞DNA分子の末端の極大を有する各第2のゲノム位置は、第2のゲノム位置に対応する。第2のセットは、第1のセットに類似した様式で特定され得る。
【0097】
ブロック1350で、少なくとも1つのゲノム領域のうちのいずれか1つにおける、第1のゲノム位置のうちのいずれか1つで終結する、第1の数の無細胞DNA分子を決定する。第1の数は、様々な方法で、例えば、全ての第1のゲノム位置にわたる合計として決定され得る。別の例として、各ゲノム位置で別個の値が決定されてもよい。したがって、第1の数の無細胞DNA分子を決定することは、各第1のゲノム位置上で終結する、第1の量の無細胞DNA分子を決定し、それにより、複数の第1の量を決定することを含み得る。
【0098】
ブロック1360で、少なくとも1つのゲノム領域のうちのいずれか1つにおける、第2のゲノム位置のうちのいずれか1つで終結する第2の数の無細胞DNA分子を決定する。第2の数は、第1の数に類似した様式で決定され得る。したがって、第2の数の無細胞DNA分子を決定することは、各第2のゲノム位置上で終結する、第2の量の無細胞DNA分子を決定し、それにより、複数の第2の量を決定することを含み得る。
【0099】
ブロック1370で、第1の数及び第2の数を使用して、分離値を算出する。分離値は、様々な方法で、例えば、節III.Aに記載されるように、第1の数及び第2の数の比率によって、算出することができる。複数の極大及び極小を使用する別の実装例において、そのような各ゲノム位置での量を決定してもよい。分離値を算出することは、それぞれが、複数の第1の量のうちの1つ及び複数の第2の量のうちの1つの分離比である、複数の分離比を決定することを含み得る。分離値は、複数の分離比、例えば、分離比の平均または中央値を使用して決定することができる。
【0100】
ブロック1380で、分離値を、第1の組織型の比例的寄与が既知である1つ以上の較正試料から決定される、1つ以上の較正値と比較することによって、第1の組織型の比例的寄与の分類を決定する。
【0101】
D.無増幅分析
ブロック1310での無細胞DNA分子の分析は、無増幅であってもよい。PCRを使用する場合、配列決定深度(すなわち、基準ゲノムにおける特定のヌクレオチドを網羅するか、または特定のヌクレオチド上で終結する配列読み取りの数)は、その特定のヌクレオチドを網羅するいくつの血漿DNA分子が分析されるかを、直接的には反映しない。これは、1つの血漿DNA分子が、PCRプロセス中に複数の複製を生成し得、複数の配列読み取りが単一の血漿DNA分子に起源を持ち得るためである。この重複問題は、i)配列決定ライブラリを増幅するためのより多数のPCRサイクル、ii)配列決定深度の増加、及びiii)元の血漿試料中のより少数のDNA分子(例えば、より少ない体積の血漿)に伴って、より重要となるだろう。
【0102】
更に、DNAポリメラーゼの忠実度は100%ではなく、時折誤ったヌクレオチドがPCR娘鎖に組み込まれることがあるため、PCRステップは更なる誤差を導入する(Kinde et al.Proc Natl Acad Sci USA 2011;108:9530-9535)。このPCR誤差が初期PCRサイクル中に生じた場合、同一の誤差を示す娘分子のクローンが生成されるだろう。誤った塩基の画分濃度は、同一の座位に由来する他のDNA分子中で高い割合に達するために、誤差が、例えば、胎児由来または腫瘍由来変異として誤解釈される可能性がある。無PCRプロトコルの例としては、Berry Genomics(investor.illumina.com/mobile.view?c=121127&v=203&d=1&id=1949110)、Illumina(www.illumina.com/products/truseq-DNA-pcr-free-sample-prep-kits.html)、及び様々な単一分子配列決定技術が挙げられる。無増幅分析の更なる詳細は、PCT出願第PCT/CN2016/073753号に見出すことができる。
【0103】
したがって、いくつかの実施形態は、分析される生体試料から鋳型DNA分子を得ることと、鋳型DNA分子を使用して、分析可能なDNA分子の配列決定ライブラリを調製すること(分析可能なDNA分子の配列決定ライブラリの調製は、鋳型DNA分子のDNA増幅のステップを含まない)と、分析可能なDNA分子の配列決定ライブラリを配列決定して、第1の複数の無細胞DNA分子に対応する複数の配列読み取りを得ることとを含み得る。第1の複数の無細胞DNA分子の分析は、コンピュータシステムで、複数の配列読み取りを受信することと、コンピュータシステムによって、複数の配列読み取りを基準ゲノムに整列させて、複数の配列読み取りのゲノム位置を決定することとを含み得る。
【0104】
IV.左右のヌクレオチドの相対的存在量
図14は、腫瘍由来DNAまたは胎児由来DNAの循環DNA断片の場合の差異の原理の説明を示す。以前の研究において、循環DNAのサイズは、ヌクレオソームDNAのサイズに非常に似ていることが示されている。血漿DNAのサイズ分布における166塩基対の主要ピークは、2つの連続するヒストン複合体を接続するリンカーDNAとともに、ヒストン複合体のコアに関連するDNAを表す。
【0105】
癌患者及び妊婦の血漿中、胎児由来DNA分子及び腫瘍由来DNA分子のサイズ分布が、非腫瘍由来DNA及び非胎児由来DNAのサイズ分布よりも短いこともまた観察されている(Lo et al.Sci Transl Med 2010;2(61):61ra91及びJiang et al.Proc Natl Acad Sci U S A 2015;112:E1317-25.)。血漿中の腫瘍由来DNA及び胎児由来DNAのサイズ分布について、166塩基対でのピークは減少し、144塩基対でのピークはより顕著である。144塩基対ピークは、2つの連続するヒストン複合体を接続する約20塩基対のリンカーDNAの分解によるものである可能性が高い。
【0106】
この方法の原理を説明するために、我々は、癌患者のシナリオを一例として使用する。その後、同一の原理を、妊娠における母体血漿中の循環胎児DNAの分析、及び移植を受容している患者の血漿の分析を含む、他のシナリオに適用することができる。実施形態において、
図14において左末端及び右末端と表示される、血漿DNA分子の末端を分析することができる。
【0107】
非悪性組織に由来するDNAが断片化され、血漿中に放出される場合、2つの分子の接続末端はともに、ヌクレオチド位置Aに位置するだろう。換言すると、右側の分子について、左の最外側ヌクレオチドは、ヌクレオチド位置Aのちょうど隣りである。左側の分子について、右の最外側ヌクレオチドもまた、ヌクレオチド位置Aのちょうど隣りである。特定のヌクレオチドで終結する分子の相対的存在量をヌクレオチド座標に対してプロットした場合、この領域にマッピングする左右の最外側ヌクレオチドの末端のピーク存在量は、位置Aにあるだろう。腫瘍細胞に由来するDNA分子について、20塩基対の断片は、断片化プロセス後に分子から除去されるだろう。
【0108】
結果として、右の分子の左側と左の分子の右側との間に20塩基対の間隙が存在するだろう。特定のヌクレオチドで終結する分子の相対的存在量が、ヌクレオチド座標に対してプロットされる場合、右の最外側ヌクレオチドのピーク(Bに位置)及び左の最外側ヌクレオチドのピーク(Cに位置)は、20塩基対によって分離されるだろう。したがって、ヌクレオチド位置B及びC上で終結する分子の存在量と、ヌクレオチド位置A上で終結する分子の存在量との間の比率は、血漿試料中の腫瘍由来DNAの画分濃度を表すだろう。
【0109】
同一の原理を適用して、差動サイズ分布を有するDNA種を定量化(例えば、妊婦の血漿中の胎児DNAの測定、及び移植された臓器に由来するDNAの測定などであるが、これらに限定されない)することができる。
【0110】
図15は、第1の組織型を含む複数の組織型に由来する無細胞DNA分子の混合物を含む、生体試料を分析する方法1500の流れ図である。方法1500の一部分を使用して、好ましい終結位置を特定するブロック1310及び他のブロックを実装することができる。
【0111】
ブロック1510で、無細胞DNA分子を分析して、基準ゲノムにおける左右の終結位置を決定する。ブロック1510は、ブロック1320に類似した様式で実行することができる。ブロック1510において、対象の生体試料に由来する第1の複数の無細胞DNA分子が分析され得、第1の複数の無細胞DNA分子のそれぞれは、左末端及び右末端を有する。無細胞DNA分子左末端に対応する、基準ゲノムにおける左終結位置は、例えば、DNA断片の配列読み取りを基準ゲノムに整列させる(マッピングする)ことによって、または基準ゲノムにおける位置が既知であるプローブを介して、決定され得る。左末端は、基準ゲノムを定義するために選択される座標システムによって、いずれの末端も指し得る。同様に、無細胞DNA分子の右末端に対応する、基準ゲノムにおける右終結位置が決定され得る。例えば、2つの末端が別個の配列読み取りを有する場合、2つの終結位置は2つの別個の整列ステップで決定してもよい。
【0112】
ブロック1520で、左ゲノム位置の左のセットを特定する。左のセットの各ゲノム位置は、ゲノム位置の左のセットのうちの1つに対応する第1の複数の無細胞DNA分子の左末端の極大を有する。左のセットは、方法1300で極大について記載されるものに類似した方法で決定され得る。
【0113】
ブロック1530で、右ゲノム位置の右のセットを特定する。右のセットの各ゲノム位置は、ゲノム位置の右のセットのうちの1つに対応する第1の複数の無細胞DNA分子の右末端の極大を有する。右のセットは、方法1300で極大について記載されるものに類似した方法で決定され得る。
【0114】
ブロック1540で、第1のゲノム位置のセットを、第1の組織型に特異的なものとして特定する。左のセットの左ゲノム位置の全てまたは一部分を、右のセットの右ゲノム位置の全てまたは一部分と比較して、第1のゲノム位置のセットを特定することができ、左ゲノム位置から最も近い右ゲノム位置までの距離は、基準ゲノムにおけるゲノム位置(例えば、ヌクレオチド)の第1の閾距離よりも大きい。第1の閾距離の例は、5、6、7、8、9、10、15、及び20ヌクレオチド長である。
【0115】
ブロック1550で、第2のゲノム位置のセットを特定する。左のセットの左ゲノム位置の全てまたは一部分を、右のセットの右ゲノム位置の全てまたは一部分と比較して、第2のゲノム位置のセットを特定することができ、左ゲノム位置から最も近い右ゲノム位置までの距離は、基準ゲノムにおけるゲノム位置の第2の閾距離よりも小さい。第2の閾距離の例は、2、3、4、及び5個のゲノム位置(例えば、ヌクレオチド長)である。
【0116】
ブロック1560で、ゲノム位置の左のセットのうちの1つで終結する、第1の数の第1の複数の無細胞DNA分子、及びゲノム位置の右のセットのうちの1つで終結する、第2の数の第1の複数の無細胞DNA分子を使用して、分離値を決定する。第1の数と第2の数との間の分離値(例えば、相対的存在量の値)が決定され得る。
【0117】
一実施形態において、第1のゲノム位置のセット及び第2のゲノム位置のセットの対を特定する。対は、互いに最も近い位置のものであってもよい。対のうちの1つ以上のそれぞれについて、第1のゲノム位置で終結する第1の量の無細胞DNA分子を決定してもよく、第1のゲノム位置で終結する第2の量の無細胞DNA分子を決定してもよい。第1の量の無細胞DNA分子は、第1の数の複数の無細胞DNA分子に対応し、第2の量の無細胞DNA分子は、第2の数の複数の無細胞DNA分子に対応する。例えば、第1の量を合計して第1の数になってもよく、第2の量を合計して第2の数になってもよく、分離値を第1の数及び第2の数から直接的に決定してもよい。別の例として、分離値を、それぞれが1つの対について第1の量及び第2の量を含む、複数の比率から決定してもよい。様々な実装例において、比率の平均または中央値を、分離値として使用してもよい。対のそれぞれの第1及び第2の量を他の方法で使用して、全分離値を決定するのに使用される個々の分離値を決定することができる。
【0118】
ブロック1570で、分離値を、第1の組織型の比例的寄与が既知である1つ以上の較正試料から決定される、1つ以上の較正値と比較することによって、第1の組織型の比例的寄与の分類を決定する。ブロック1570は、他の比例的寄与の決定に類似した様式で実行することができる。
【0119】
様々な実施形態において、左右のセットの両方を第1のゲノム位置のセットとして使用しても、左のセットのみを使用しても、右のセットのみを使用しても、左のセットのいくつか及び右のセットのいくつかを使用してもよい。左位置のセット全体について、左位置のサブセットから閾値数のヌクレオチド長だけ分離した、対応する右の位置のセットを有する左位置のサブセットが存在する。したがって、左位置のサブセットまたは対応する右位置のサブセットを使用して、計算を行うことが可能である。
【0120】
V.組織に特異的な終結位置の使用
我々は、癌細胞、胎盤細胞、及び細胞型に由来する循環DNAの断片化パターンは異なると仮定する。この仮説に基づいて、循環DNA断片の一端または両端の末端ヌクレオチドの座標を使用して、推定上の変異を担持するDNA断片が実際に腫瘍に由来するかどうかを予想することができる。血漿DNA断片における、癌に特異的な終結位置及び妊娠に特異的な終結位置を特定することができる。
【0121】
A.肝細胞癌腫(HCC)を使用する癌の例
このアプローチの実現可能性を説明するために、肝細胞癌腫(HCC)を有する患者及び妊婦の血漿DNAの配列決定データを分析した。説明の目的で、分析では染色体8に着目した。同一のアプローチを、ゲノム全体または任意の他の染色体に適用することができる。
【0122】
配列決定された各血漿DNA断片の両端の末端ヌクレオチドの座標を決定した。その後、染色体8上の各ヌクレオチド上で終結する断片の数を計数した。それらの上で終結する、最も多い数のDNA断片を有した上位100万個のヌクレオチドを、HCCの症例及び妊婦について決定した。上位100万個は、閾値を超えていると見なすことができる。
【0123】
図16は、HCCの症例に特異的である高頻度終結部位の数、妊婦に特異的である高頻度終結部位の数、及び両方の場合によって共有される高頻度終結部位の数を示す、ベン図である。HCCの症例に特異的な最も高頻度の終結位置であった536,772個のヌクレオチドの座標を、付録Aに示す。妊婦に特異的な最も高頻度の終結位置であった536,772個のヌクレオチドの座標を、付録Bに列挙する。2つの場合によって共有される最も高頻度の終結位置であった463,228個のヌクレオチドの座標は、省略する。
【0124】
我々は、ちょうど536,772個のHCCに特異的な終結位置で終結する末端ヌクレオチドを有する血漿DNA断片は、腫瘍に由来する可能性がより高いと考える。この想定に基づいて、HCCに特異的な終結位置上で終結した配列決定された血漿DNA断片の数を使用して、HCCまたは同一の血漿DNA断片化パターンを有する他の癌の存在または不在を示すことができる。別の実施形態において、このパラメータを使用して、癌のレベル(例えば、腫瘍のサイズ、癌の段階、腫瘍負荷、及び転移の存在などであるが、これらに限定されない)を反映することもできる。
【0125】
更に別の実施形態において、HCCに特異的な終結位置上で終結する断片の数は、血漿中に既知の腫瘍DNA画分を有する試料の、血漿中の癌由来DNAの画分濃度と相関し得る。血漿中の腫瘍DNA画分は、例えば、非限定的に、血漿中の癌変異、または血漿DNA中のコピー数異常の大きさの定量化によって決定され得る(Chan et al.Clin Chem 2013;59:211-24)。この相関を、較正曲線として使用してもよい(
図1)。血漿中に未知の腫瘍DNA画分を有する患者について、HCCに特異的な終結位置上で終結するDNA断片の量を決定し得る。その後、較正曲線、及びHCCに特異的な終結位置上で終結するDNA断片の量に基づいて、血漿中の腫瘍DNA画分が決定され得る。一実装例において、HCCに特異的な終結位置上で終結するDNA断片の量は、配列決定されたDNA断片の総数、整列可能な読み取りの総数、または特定の染色体領域に整列されたDNA断片の数に対して正規化され得る。したがって、癌に特異的な位置上で終結する、配列決定されたDNA断片の割合が、パラメータとして使用され得る。
【0126】
図17は、癌に特異的な終結位置上で終結する、配列決定されたDNA断片の割合と、血漿中に既知の腫瘍DNA画分を有する癌患者の血漿中の腫瘍DNA画分との間の関係を示す、較正曲線を示す。この概念図は、腫瘍DNA画分と、癌に特異的な終結位置上で終結する、配列決定されたDNA断片の割合との間の較正曲線の相関を示す。較正曲線は、較正試料から決定されたデータ点(その腫瘍DNA画分は他の技術を介して決定)を適合させることによって決定され得る。
【0127】
本発明の他の実施形態において、異なる種類の癌を患う患者の血漿DNA断片化パターンが決定され得る。これらの癌患者の重複する末端は、癌に特異的な末端であると見なされ得る一方で、個々の癌の種類の終結位置は、特定の癌の種類に特異的であると見なされ得る。癌を有することが疑われる任意の個体について、まず配列決定された血漿DNA断片を癌に特異的な終結位置と比較して、個体が癌を有する尤度が決定され得る。個体が癌を有する可能性が高い場合、癌の種類に特異的な終結位置の配列決定された断片を分析して、個体が患っている可能性が最も高い癌を決定することができる。
【0128】
本発明の別の実施形態において、異なる臓器に由来するDNAの終結位置を決定することができ、血漿中の異なる臓器に由来するDNAの相対的寄与を決定するために使用することができる。
【0129】
B.胎児の例
別の実施形態において、このアプローチを使用して、母体血漿試料中の胎児DNA濃度を決定することができる。妊娠に特異的な終結位置上で終結する、配列決定された血漿DNA断片の割合がまず決定され、既知の胎児DNA画分を有する母体血漿試料の数の胎児DNA画分が決定される相関によって、較正曲線が確立され得る。胎児DNA画分は、例えば、試料中の胎児に特異的な対立遺伝子の決定、男児妊娠の染色体Y上の標的の定量化、及び胎児に特異的なメチル化マーカーの分析などであるが、これらに限定されないいくつかの方法で決定され得る。未知の胎児DNA画分を有する妊娠血漿試料について、妊娠に特異的な終結位置上で終結する、配列決定された血漿DNA断片の割合が決定され得る。この情報を使用して、試験される血漿DNA試料中の胎児DNA画分を較正曲線に基づいて決定することができる。
【0130】
C.好ましい終結位置の使用のためのキット
いくつかの実施形態において、複数の組織型の無細胞DNA分子の混合物を含有する生体試料中のDNAを分析するためのキットが提供される。キットは、付録A及びBに列挙されるゲノム領域の少なくとも一区分に特異的にハイブリダイズするための1つ以上のオリゴヌクレオチドを含み得る。一実施形態において、キットは、対象をHCCについて試験する上で使用するための、付録Aにゲノム領域の少なくとも一区分に特異的にハイブリダイズするための1つ以上のオリゴヌクレオチドを含む。別の実施形態において、キットは、妊娠中の女性を試験して、例えば、この妊娠中の女性に由来する母体生体試料中の胎児DNA画分を決定する上で使用するための、付録Bに列挙されるゲノム領域の少なくとも一区分に特異的にハイブリダイズするための1つ以上のオリゴヌクレオチドを含む。
【0131】
VI.遺伝子多型を使用する終結位置分析
いくつかの実施形態において、組織に特異的な対立遺伝子を使用して、組織に特異的な断片化パターンを有する領域を特定することができる。例えば、本明細書に記載されるように、母体血漿試料を分析し、検出された対立遺伝子を母体のみの試料中で検出された対立遺伝子と比較することによって、胎児に特異的な対立遺伝子を特定することができる。共有された対立遺伝子(すなわち、胎児及び母親で共有されたもの)を呈する組織の比率と比較して、それらの上で終結する胎児DNA分子の比率が高いゲノム位置は、胎児組織に特異的な断片化パターンを有するものとして特定することができる。これらの胎児に好ましい終結位置は、デオキシリボヌクレアーゼ高感受性部位であっても、デオキシリボヌクレアーゼ高感受性部位ではなくてもよく、それにより、様々なゲノム領域が、断片化パターンの組織に特異的な振幅を有してもよく、実施形態がデオキシリボヌクレアーゼ高感受性部位に限定されないことを示す。腫瘍についてスクリーニングされている対象に由来する試料に、類似した分析を行うことができる。
【0132】
A.胎児の例
好ましい終結位置は、妊婦に由来する血漿DNAを分析することによって得ることができる。胎児由来血漿DNA断片及び母体由来血漿DNA断片は、遺伝子多型に基づく方法を通して区別することができる。断片を担持する胎児に特異的な対立遺伝子及び母体に特異的な対立遺伝子を使用して、胎児由来DNA及び母体由来DNAの好ましい終結位置を決定することができる。
【0133】
この研究には、Department of Obstetrics and Gynaecology,Prince of Wales Hospital,Hong Kongから、インフォームドコンセントをもって、妊娠38週目の男児を単胎妊娠する妊婦を募集した。血液試料を、1,600g、4℃で遠心分離した。血漿部分を回収し、16,000g、4℃で10分間再遠心分離して、血液細胞を除去した。血液細胞部分を2,500gで再遠心分離し、いかなる残渣血漿も除去した。血液細胞に由来するDNA及び母体血漿に由来するDNAをそれぞれ、QIAamp DNA Blood Mini Kit及びQIAamp DSP DNA Blood Mini Kit(Qiagen)の血液及び体液プロトコルで抽出した。胎盤に由来するDNAを、製造者の組織プロトコルに従って、QIAamp DNA Mini Kit(Qiagen)で抽出した。Illumina TruSeq無PCRライブラリ調製プロトコルを使用して、配列決定ライブラリを配列決定した。Short Oligonucleotide Alignment Program 2(SOAP2)をペアードエンドモードで使用して、ペアードエンド配列決定データを分析した(Li et al.Bioinformatics 2009;25:1966-1967)。ペアードエンド読み取りを、非反復遮蔽基準ヒトゲノム(Hg19)に整列させた。各末端の整列について、最大2つのヌクレオチドのミスマッチを許容した。その後、2つの末端のこれらの潜在的な整列のゲノム座標を分析して、任意の組み合わせが、2つの末端が正しい配向で同一の染色体に整列され、≦600塩基対の挿入サイズをスパニングし、基準ヒトゲノムにおいて単一位置にマッピングすることを可能にするかどうかを判定した。母体血漿試料を、半数体ヒトゲノムの270×範囲の深度まで配列決定した。同一の配列決定プロトコルを使用して、母体血液細胞、父系血液細胞、及び臍帯血液細胞をそれぞれ、40×、45×、及び50×半数体ヒトゲノム範囲まで配列決定した。
【0134】
この目標を達成するために、母体血漿DNA中の反復末端配列決定を分析した。
【0135】
1.胎児に特異的な終結位置の特定
非PCR増幅ライブラリを使用する、母体血漿DNA試料の超高配列決定深度の実行とともに、我々は、血漿DNAの生成において優先的に切断される母体ゲノム及び胎児ゲノム内の部位が存在し得るかどうかを調査した。この効果を実証するために、母親がホモ接合(AAと表示される遺伝子型)であり、胎児がヘテロ接合(ABと表示される遺伝子型)である情報提供的SNP座位を特定した。この例示的な例において、B対立遺伝子は胎児に特異的なものであり、A対立遺伝子は母親及び胎児によって共有されるものだろう。代表的な例を
図18に示す。対照として、血液細胞から得、超音波処理を使用して人工的に断片化したDNA試料の配列決定結果を示す。
【0136】
血漿DNA中の非ランダム断片化パターンを観察した。DNA断片の末端である確率のプロットでは、胎児に特異的な対立遺伝子及び母親によって共有される対立遺伝子を担持する断片の2つの群のそれぞれについて、3つのピークが観察された。これらのピークはそれぞれ、母体血漿中の胎児由来DNA及び母体由来DNAの末端位置のホットスポットを表す。ピークの位置は、これら2つの群の間で大部分が重複した。対照的に、超音波処理されたDNAの断片化パターンはランダムであるようであり、断片末端確率は領域にわたって類似する。
【0137】
図18は、胎児に特異的な対立遺伝子ならびに母親及び胎児によって共有された対立遺伝子を担持する、血漿DNAの非ランダム断片化パターンの一例示的な例を示す。図の上部分では、各横線は1つの配列決定されたDNA断片を表す。DNA断片の末端は、配列決定された末端の終結位置を表す。左の最外側ヌクレオチドの座標(最小のゲノム座標)に従って、断片を選別する。図の下部分では、特定の位置上で終結する断片のパーセンテージを示す。X軸はゲノム座標を表し、SNPは破線によって示される中央に位置する。
【0138】
我々は、血漿DNA断片の終結位置である増加した確率を有する座標を更に探索した。我々は、情報提供的SNPを網羅する断片に基づいて、我々の探索を集中させて、胎児に特異的な対立遺伝子ならびに母親及び胎児によって共有される対立遺伝子を担持する断片が別個に評価できるようにした。我々は、ポアソン確率関数を使用して、ヒトゲノム内の特定の位置が、血漿DNA断片の終結位置である有意に増加した確率を有するかどうかを判定した。母親がホモ接合(遺伝子型AA)であり、胎児がヘテロ接合(遺伝子型AB)であるSNPの分析について、A対立遺伝子は「共有された対立遺伝子」であり、B対立遺伝子は「胎児に特異的な対立遺伝子」であるだろう。共有された対立遺伝子及び胎児に特異的な対立遺伝子を担持する、配列決定された読み取りの数を計数する。血漿DNAのサイズ分布において、胎児由来DNA及び母体由来DNAの両方について、ピークは166塩基対で観察されるだろう。血漿DNAの断片化がランダムである場合、2つの末端は、情報提供的SNPの166塩基対上流及び166塩基対下流の領域にわたって均等に分布するだろう。
【0139】
p値を計算して、ポアソン確率関数に基づいて、特定の位置が、共有された対立遺伝子または胎児に特異的な対立遺伝子を担持する読み取りの末端である、有意に増加した確率を有するかどうかを判定することができる。
p値=ポアソン(N
実数値、N
予想値)
式中、ポアソン()はポアソン確率関数であり、N
実数値は特定のヌクレオチドで終結する読み取りの実数値であり、N
予想値は読み取りの総数を166で割ったものである。<0.01のp値をカットオフとして使用して、胎児に特異的な対立遺伝子または共有された対立遺伝子を担持する読み取りの好ましい終結位置を定義した。共有された対立遺伝子及び胎児に特異的な対立遺伝子を独立して担持するDNA断片について、統計学的に有意な終結位置を決定した(
図19)。他の確率分布、例えば、二項分布、負の二項分布、及び正規分布を使用してもよい。
【0140】
図19は、ゲノム座標が、情報提供的SNPを有する領域にわたって、母体血漿DNA断片の終結位置である確率のプロットを示す。共有された対立遺伝子及び胎児に特異的な対立遺伝子を担持する血漿DNA断片の末端である、有意に増加した確率を有するヌクレオチド位置の結果をそれぞれ、赤色及び青色で示す。X軸はゲノム座標を表し、変異は破線によって示される中央に位置する。示されるように、胎児に特異的な対立遺伝子のみ、共有された対立遺伝子のみの終結位置の高い発生率を有する座標が存在し、いくつかは両方に共通している。
【0141】
我々は、胎児に特異的な対立遺伝子及び共有された対立遺伝子を担持する血漿DNA断片の末端である、有意に増加した確率を有する、それぞれ合計4,131(セットA)個及び10,021(セットB)個のヌクレオチド位置を特定した。セットCは重複セットであり、4,258個のヌクレオチド位置を含有した(
図3)。これらの終結位置は、合計1.42Mbをスパニングし、4,303個のSNPを網羅する領域から得た。したがって、胎児に特異的な断片の好ましい終結位置は、分析された領域の0.29%を占めた。それぞれ、24,500個、22,942個、及び31,925個の、セットA、セットB、及びセットCの位置上で終結する、胎児に特異的な対立遺伝子を担持する血漿DNA断片が存在した。それぞれ、27,295個、158,632個、及び87,804個の、セットA、セットB、及びセットCの位置上で終結する、共有された対立遺伝子を担持する血漿DNA断片が存在した。好ましい終結位置の数または普及率はより一層高く、他のゲノム座標で生じることが期待される。
【0142】
本明細書に記載される遺伝子多型に基づくアプローチは、この胎児母体対の情報提供的SNPに関連付けられる好ましい終結位置のみを特定する。したがって、特定された好ましい末端は、ゲノムにおけるそのような末端のサブセットを提示するだろう。我々は、好ましい末端を特定するための、遺伝子多型に基づかないアプローチを開発した。実際、遺伝子多型に基づかないアプローチを使用する、より多くの好ましい末端アプローチを特定した。後述の他の実験を参照されたい。
【0143】
図20は、母親においてホモ接合され、胎児においてヘテロ接合された、SNPにわたる血漿DNA断片の終結位置の分析を示す。セットAは、胎児に特異的な対立遺伝子を担持する断片の好ましい終結位置を含んだ。セットBは、共有された対立遺伝子を担持する断片の好ましい終結位置を含んだ。セットCは、両方の種類の血漿DNA断片の好ましい終結位置を含んだ。
【0144】
同一の原理を使用して、我々は、母親においてヘテロ接合(遺伝子型AB)され、胎児においてホモ接合(遺伝子型AA)された、SNPにわたる母体由来DNA断片の終結位置を分析した。我々は、胎児に特異的な対立遺伝子及び共有された対立遺伝子を担持する血漿DNA断片の終結位置である、有意に増加した確率を有する、それぞれ合計7,527(セットX)個及び18,829(セットY)個のヌクレオチド位置を特定した。セットZは重複セットであり、10,534個の位置を含有した(
図4)。これらの終結位置は、合計3.1Mbをスパニングし、9,489個のSNPを網羅する領域から得た。したがって、母体に特異的な断片の好ましい終結位置は、この母親及び胎児の対について、分析された領域の0.24%を占めた。それぞれ、69,136個、82,413個、及び121,607個の、セットX、セットY、及びセットZの位置上で終結する、母体に特異的な対立遺伝子を担持する血漿DNA断片が存在した。それぞれ、46,554個、245,037個、及び181,709個の、セットX、セットY、及びセットZの位置上で終結する、共有された対立遺伝子を担持する血漿DNA断片が存在した。繰り返すと、この分析は、少なくとも1つの情報提供的SNPを網羅する血漿DNA分子に着目し、特定された好ましい末端は、ゲノムを通したそのような非ランダム末端のサブセットを提示するにすぎない。
【0145】
図21は、胎児においてホモ接合され、母親においてヘテロ接合された、SNPにわたる血漿DNA断片の終結位置の分析を示す。セットXは、母体に特異的な対立遺伝子を担持する断片の好ましい終結位置を含んだ。セットYは、共有された対立遺伝子を担持する断片の好ましい終結位置を含んだ。セットZは、両方の種類の血漿DNA断片の好ましい終結位置を含んだ。
【0146】
2.胎児DNA画分を推定するための反復終結位置の使用
母親及び胎児に由来する血漿DNA断片の反復終結位置を特定した後、我々は、これらのヌクレオチド位置のセット上で終結する血漿DNAの相対的存在量は、胎児DNA画分を反映すると考えた。これを確認するために、我々は、それぞれが男の胎児を担持する26人の妊娠第一期(10~13週目)の妊婦の血漿DNAを配列決定した。マッピングされた読み取り計数の中央値は、1600万(範囲:1200万~2200万)であった。染色体Yに整列する配列決定された読み取りの割合を使用して、各血漿試料中の実際の胎児DNA画分を計算した。反復胎児(セットA)及び母体(セットX)末端を有する血漿DNAの相対的存在量(胎児/母体比と表示)と胎児DNA画分との間に、正の相関を観察することができた(R=0.63、P=0.0004、ピアソン相関、
図22)。好ましい終結位置が、1つの胎児及び母親の対の情報提供的SNPに基づいて特定され、ゲノムにおけるそのような末端のサブセットを提示するにすぎなかった一方で、特定された末端が他の妊娠にも関連し、この好ましい末端のサブセットのみによってすら胎児画分との相関が達成されたことは、興味深い。
【0147】
図22は、反復胎児(セットA)末端及び母体(セットX)末端を有する血漿DNA分子の相対的存在量(比率(胎児/母体))と、胎児DNA画分との間の相関を示す。データ点のそれぞれはそれぞれの較正試料に対応し得るため、較正データ点と見なされ得る。較正データ点に適合する線は、較正関数の一例である。
【0148】
セットA及びセットX以外の他のセットを使用してもよい。例えば、セットCに対するセットAの比率、及びセットBに対するセットAの比率(または他の相対的存在量もしくは比率の関数)を採用してもよい。別の例として、セットXまたはセットZの比率またはセットXとセットYとの間の比率を採用してもよく、これは、胎児DNA画分の逆であると想定され得る母体DNA画分を提供するだろう。そのような一例において、母体組織は、暗黙のうちにであったとしても、比例的寄与が決定される第1の組織型であり得る。
【0149】
3.サイズの使用
胎児に特異的な終結位置上で終結する血漿DNA断片のサイズ分布は、位置が胎児に特異的であるという更なる証拠を提供する。セットA及びセットXの位置がそれぞれ、胎児由来DNA断片及び母体由来DNA断片の好ましい終結部位であるということを更に支持するために、我々は、これら2つの位置のセット上で終結する血漿DNAのサイズ分布を比較した。これらの位置が由来した試料について、サイズ分布は、セットA位置上で終結する断片でより短かったは、セットX位置上で終結する断片よりも短かった(
図23A)。
【0150】
図23Aは、胎児に好ましい終結位置(セットA)(青色)上で終結する断片、及び母体に好ましい終結位置(セットX)(赤色)上で終結する断片の、血漿DNAサイズ分布を示す。セットX位置で終結する断片と比較して、セットA位置上で終結する断片では、より短いサイズ分布が観察された。
図23Bは、2つの断片のセットのサイズ分布の累積プロットを示す。
図23Cは、断片サイズに対する2つの断片のセットの累積頻度の差異(ΔS)を示す。
図23Dは、セットA及びセットXの末端位置を、ゼロ~5塩基対だけより大きなゲノム座標を有する位置に移動した場合の、サイズに対するΔSを示す。
図23Eは、セットA及びセットXの終結位置を、ゼロ~5塩基対だけ反対方向(より小さなゲノム座標を有する位置)に移動した場合の、サイズに対するΔSを示す。
【0151】
サイズ分布の差異を更に定量化するために、2つの曲線の累積頻度をプロットした(
図23B)。ΔSによって表される2つの曲線の差異を、
図23Cにプロットする。我々は、最大差異が166塩基対で観察されたことを観察した。これは、胎児由来DNAと母体由来DNAとの間の最大の差異が166塩基対で観察され得るという以前の報告と一貫する(Yu et al.Proc Natl Acad Sci U S A.2014;111:8583-8)。本発見は、母体に好ましい終結位置(セットX)上で終結する断片と比較して、胎児に好ましい終結位置(セットA)上で終結する断片の、胎児由来DNAの富化が存在することを示唆した。
【0152】
我々は、セットA及びセットXの終結位置を1~5塩基対だけゲノムの上流または下流に移動することによって、これらの終結位置の特異性を更に調査した。セットA及びセットXの終結位置を両方向に移動した場合のΔS値を、サイズに対してプロットする(
図23D及び23E)。正の数の移動は、より大きなゲノム座標を有する位置への移動を表し(
図23D)、負の数の移動は、より小さなゲノム座標を有する位置への移動を表す(
図23E)。胎児に好ましい位置及び母体に好ましい位置の、1塩基対だけの移動ですら、これら2つの位置のセット上で終結するDNA断片の間のサイズ差異(ΔS)を有意に減少させる。5塩基対の移動は、サイズ差異をほぼ完全に除去した。これらの結果は、これらの代替的位置で終結する読み取りは、我々のアルゴリズムによって特定される好ましい末端位置で終結する読み取りほどは、胎児に特異的または母体に特異的ではないことを示唆した。これらのデータは、血漿または無細胞DNA分子断片またはが、それらの好ましい末端位置で非常に正確に切断されるという、我々の解釈を更に支持する。換言すると、そこで、非ランダム無細胞DNA断片化プロセスは、特定のヌクレオチドのレベルまで正確である。
【0153】
その後、我々は、胎児DNA画分分析に使用された26人の妊娠第一期の血漿試料に由来する、プールされた、配列決定された読み取りを分析した。セットX位置で終結する断片と比較して、セットA位置上で終結する断片では、より短いサイズ分布が観察された(
図24A)。
【0154】
図24Aは、胎児に好ましい終結位置(セットA)(青色)上で終結する断片、及び母体に好ましい終結位置(セットX)(赤色)上で終結する断片の、26人の妊娠第一期の妊婦に由来するプールされた血漿DNA試料中の血漿DNAサイズ分布を示す。セットX位置で終結する断片と比較して、セットA位置上で終結する断片では、より短いサイズ分布が観察された。
図24Bは、2つの断片のセットのサイズ分布の累積プロットを示す。
図24Cは、断片サイズに対する2つの断片のセットの累積頻度の差異(ΔS)を示す。
図24Dは、セットA及びセットXの位置を、ゼロ~5塩基対だけ移動(より大きなゲノム座標)した場合の、サイズに対するΔSを示す。
図24Eは、セットA及びセットXの位置を、ゼロ~5塩基対だけ反対方向に移動(より小さなゲノム座標)した場合の、サイズに対するΔSを示す。2つの位置のセット上で終結する血漿DNA断片の間のサイズ差異(ΔS)は、これらの位置の移動とともに減少し、これは、これらの位置が単一ヌクレオチドレベルまで正確であることを示す。
【0155】
B.癌の例
同一の方略が、癌由来断片の好ましい終結位置の分析にも適用され得る。この例において、我々は、肝細胞癌腫(HCC)を患う患者の血漿(220×範囲)、軟膜(48×)、及び腫瘍組織(45×)を配列決定した。腫瘍組織及び軟膜の遺伝子型を比較することによって、患者の変異プロファイルを得た。癌由来血漿DNA断片の好ましい終結位置を決定するために、我々は、癌変異を担持する血漿DNA断片を分析した。
図24A~24Eに示されるように、HCC患者における血漿DNAの断片化パターンは、ランダムではない。特定のヌクレオチド位置が、血漿DNA断片の末端である増加した確率を有する。
【0156】
1.癌に特異的な終結位置の特定
図25は、HCC患者の血漿DNAの非ランダム断片化パターンの一例示的な例を示す。図の上部分では、各横線は1つの配列決定されたDNA断片を表す。赤色及び青色の線はそれぞれ、野生型対立遺伝子及び変異対立遺伝子を担持するDNA断片を表す。DNA断片の末端は、配列決定された末端の終結位置を表す。左の最外側ヌクレオチドの座標(最小のゲノム座標)に従って、断片を選別する。図の下部分では、特定の位置上で終結する断片のパーセンテージを示す。X軸はゲノム座標を表し、変異は破線によって示される中央に位置する。
【0157】
我々は、既に記載したポアソン確率分布関数を使用して、変異対立遺伝子及び野生型対立遺伝子を担持する血漿DNA断片の末端である、増加した確率を有するゲノム位置を特定した。0.01のp値を閾値として使用した。PCT出願第PCT/CN2016/073753号に記載されるように、逆もまた真であり、すなわち、特定の末端を有する血漿DNA分子が特定されるとき、SNP対立遺伝子または分子上の変異は、どの末端のセットが血漿DNAデータ解釈において使用されたかによって、癌に由来する可能性、疾患に関連する可能性、または妊娠に関連する可能性がより高い。
【0158】
図26は、ゲノム座標が、変異部位を有する領域にわたって、血漿DNA断片の終結位置である確率のプロットである。野生型対立遺伝子及び変異対立遺伝子を担持する血漿DNA断片の末端である、有意に増加した確率を有するヌクレオチド位置の結果をそれぞれ、赤色及び青色で示す。X軸はゲノム座標を表し、変異は破線によって示される中央に位置する。示されるように、変異体に特異的な対立遺伝子のみ、野生型対立遺伝子のみの終結位置の高い発生率を有する座標が存在し、いくつかは両方に共通している。
【0159】
図27Aは、腫瘍組織中に変異が存在したゲノム位置にわたる血漿DNA断片の終結位置の分析を示す。セットEは、変異対立遺伝子を担持する断片の好ましい終結位置を含んだ。セットFは、野生型対立遺伝子を担持する断片の好ましい終結位置を含んだ。セットGは、両方の種類の血漿DNA断片の好ましい終結位置を含んだ。
【0160】
2.腫瘍DNA画分を推定するための反復終結位置の使用
セットEの位置が癌由来DNAの好ましい終結部位であり、セットFの位置が主に非腫瘍組織に由来するバックグラウンドDNAの好ましい終結部位であったため、我々は、これら2つの位置のセット上で終結する断片の間の比率は腫瘍に由来するDNAと相関すると仮定する。したがって、我々は、血漿が少なくとも1%の腫瘍由来DNAを含有する、71人のHCC患者の血漿を分析した。これらの患者は以前に血漿DNA中のコピー数異常について分析されており、腫瘍DNA画分はコピー数異常の大きさによって推定された。(Jiang et al.Proc Natl Acad Sci U S A.2015;112:E1317-25)。これら2つの位置のセット上で終結する断片の間の比率(比率
変異/野生型)は、以下のように定義される。
【数3】
【0161】
図27Bは、比率
変異/野生型と、71人のHCC患者の血漿中の腫瘍DNA画分との間の相関を示す。比率
変異/野生型と血漿中の腫瘍DNA画分との間の正の相関が観察された(r=0.53、p<0.001、ピアソン相関)。これらの結果は、これらの癌に好ましい終結位置上で終結する断片の数が、癌患者の血漿中の腫瘍由来DNAの量を予想するのに有用であることを示唆する。
【0162】
いくつかの実施形態において、癌に特異的または癌に関連するDNAメチル化シグネチャー(例えば、5-メチシトシン及びヒドロキシメチル化の位置)、癌に特異的または癌に関連する短血漿DNA分子、癌に特異的または癌に関連するヒストン修飾マーク、ならびに癌に特異的または癌に関連する血漿DNA末端位置と組み合わせて、様々な癌に特異的または癌に関連する変化、例えば、単一ヌクレオチド変異を組み合わせ検出することによって、アクセス可能な情報提供的癌DNA断片の数を増加させることができる。特定の癌に特異的または癌に関連する変化を、変異を特定する上での選別基準として使用してもよい。
【0163】
VII.遺伝子多型非依存的末端位置分析
他の実施形態において、好ましい終結位置は、(A)異なる個体に由来する血漿DNA断片の終結位置を比較することによって、または(B)異なる時点で取得した1人の個体に由来する試料の血漿DNA断片の終結位置を比較することによって、得ることができる。
【0164】
A.異なる病理学的状態及び生理学的状態を患う対象における好ましい終結位置間の比較
1.閾値を超える排他的セットの使用
ポアソン分布確率関数に基づいて、我々は、以前の節において記載される妊婦及びHCC患者の血漿断片の終結位置である、増加した確率を有するゲノム位置を特定した。この分析において、帰無仮説は、全ての血漿DNA断片がランダムに断片化されるため、各ゲノム位置が血漿DNA断片の末端である等しい確率を有するというものである。血漿DNA断片は、平均で166塩基対のサイズであると想定された。p値を、以下のように計算した。
p値=ポアソン(N
実数値,N
予想値)
式中、ポアソン()はポアソン確率関数であり、N
実数値は特定のヌクレオチドで終結する読み取りの実数値であり、
【数4】
であり、分母における3×10
9はゲノムにおけるヌクレオチドの数を表す。
【0165】
Benjamini and Hochbergの補正(Bejamini et al.Journal of the Royal Statistical Society,1995;57:289-300)を使用して、p値を調節して、期待される<1%の偽発見率(FDR)を達成した。
【0166】
図28Aは、妊婦及びHCC患者の血漿DNAの好ましい終結位置の数を示す。セットPは、妊婦において好ましい、2900万個の終結位置を含有した。セットQは、HCC患者において好ましい、600万個の終結位置を含有した。セットSは重複セットであり、1500万個の終結位置を含有した。
【0167】
我々は、HCCに好ましい終結位置上で終結する断片(セットQ)が、妊娠に好ましい終結位置上で終結する断片(セットP)と比較して、癌由来DNAについて富化されていると仮定する。
したがって、我々は、比率
HCC/妊娠を以下のように計算し、
【数5】
この比率を、上述の71人のHCC患者における腫瘍DNA画分と相関させた。
【0168】
図28Bは、比率
HCC/妊娠と、71人のHCC患者の血漿中の腫瘍DNA画分との間に正の相関が観察されたことを示す。これらの結果は、特定の状態の好ましい終結部位上で終結する断片の数または割合が、その状態を検出するのに、または患部臓器から放出されるDNAの量を定量化するのに有用であり得ることを示唆する。
【0169】
2.より高い終結率を有するゲノム位置のセットの使用
別の実施形態において、そのような位置上で終結する断片の数と、その位置を網羅するがその上では終結しない断片の数との間の比率を決定することによって、好ましい終結部位を特定することができる。
図29Aは、好ましい末端終結比(PETR)の計算を説明する。
【数6】
【0170】
図29Aは、PETRの概念の説明を示す。各線は、1つの血漿DNA断片を表す。これらの断片は、a~gと標識される。断片a、b、c、及びdは、対象となるヌクレオチド上で終結した。断片e、f、及びgは、対象となるヌクレオチドを網羅するが、そのような位置上では終結しない。この例示的な例において、PETRは、4/3、すなわち、1.33に等しい。他の実施形態において、分母は、DNA断片がその位置上で終結するかどうかに関わらず、ヌクレオチドを網羅するDNA断片の数であり得る。
【0171】
PETRの計算を使用して、異なる疾患状態を患う個体において好ましい末端であるヌクレオチド位置を特定することができる。以下の例は、PETRの有用性を実証する。既に言及したHCC患者の血漿試料、及び慢性B型肝炎ウイルス(HBV)感染症を有するが癌は有しない対象(HBV保因者)の血漿試料を比較した。HBV保因者の血漿DNA試料を、215×半数体ゲノム範囲まで配列決定した。各対象の各ゲノム位置について、PETRを計算した。7,350,067個のゲノム位置(セットH)が、HBV保因者と比較して、HCC患者において少なくとも4倍より高いPETRを有するものとして特定された。これらの位置は、HBV保因者と比較して、HCC患者において血漿DNA断片の末端である少なくとも4倍増加した確率を有した。他の倍、例えば、1.5倍、2倍、及び3倍の差異が使用され得る。
【0172】
11人の独立したHCC患者に由来する血漿試料を、より一層低い配列決定深度まで更に配列決定した。2800万個の配列決定された読み取りの平均を、これら11個の血漿試料から得た。これら11人のHCC患者のそれぞれの、7,350,067個のセットHの位置の平均PETRを計算し、血漿中の腫瘍DNA画分と相関させた。既に記載したように、血漿中のコピー数異常の大きさに基づいて、血漿中の腫瘍DNA画分を計算した(Chan et al.Proc Natl Acad Sci U S A.2015;112:E1317-25)。
【0173】
図29Bは、11人のHCC患者における、血漿中の腫瘍DNA画分とセットHの位置のPETRとの間の相関を示す。2つのパラメータ間に正の相関を観察することができ、これは、HCCに好ましい(セットH)位置の平均PETRが血漿中の腫瘍DNAの量を示すのに有用であることを示唆する。
【0174】
3.終結位置が肝臓に関連することの確認
HCC血漿DNA試料中またはHBV血漿DNA試料中に存在する好ましい終結位置が肝臓に関連することを示すために、我々は、HCCの外科的除去の前後で、患者から収集した血漿試料中でのそれらの存在を探索した。データを表1に示す。手術前後の試料をそれぞれ、17×及び20×半数体ゲノム範囲まで配列決定した。
【表1】
表1は、HCCを有する患者における肝臓腫瘍を除去するための手術前後に収集した血漿試料中の、HCCに好ましい終結位置及びHBVに好ましい終結位置を示す。
【0175】
表1に見ることができるように、HCCに好ましい終結位置及びHBVに好ましい終結位置の両方の数の減少が存在する。HBVデータは、好ましい終結位置の大部分が肝臓に由来し、それらの減少は手術後の肝臓細胞質量の減少によるものであることを示唆する。したがって、血漿中への肝臓由来無細胞DNA分子の放出の減少が存在する。手術前の試料中には5倍超より多いHCCに好ましい終結位置が存在し、これが手術後に消失したことに留意することは興味深い。手術後の消失を示した好ましい末端のうちのいくつかは、肝臓に由来するものである。同一の手術前の試料中に、HBVに好ましい末端よりも多くのHCCに好ましい末端が検出されたという観察を考慮すると、これらの末端の大部分は、単に一般的に肝臓に関連しているだけでなく、HCCに特異的なものであることを示唆する。
【0176】
これらのデータから導出され得る、いくつかの用途が存在する。このデータは、無細胞DNAまたは血漿DNAの好ましい末端の検出を使用して、癌治療の監視をすることができることを示す。例えば、手術後の好ましい末端の減少は、HCCの外科的除去の成功を示す。腫瘍が完全に除去されなかったり、除去に成功しなかったりした場合、血漿DNAの好ましい末端の量または数量は手術後に実質的な減少を示さないだろう。これは、残っている腫瘍または転移巣が、HCCに好ましい終結位置を有する無細胞DNAまたは血漿DNAの継続した放出の供給源であるためである。このデータは、無細胞DNAの好ましい末端の分析に基づく治療の監視は、比較的浅い配列決定深度で達成され得ることを示す。
【0177】
このデータはまた、組織に関連するか、または癌に関連する血漿DNAの好ましい終結位置を使用して、癌を宿している組織を含む病理組織を特定することができることも示す。例えば、異なる臓器に由来する無細胞DNAの好ましい末端の複数のセットを使用することができる。その後、様々な組織に起源を持つ無細胞DNAの相対量を決定することができるだろう。したがって、これは、無細胞DNA組織デコンヴォルーションのアプローチとして機能し得る。このアプローチによって、対照試料から確立された基準値からの最大の偏差を有する(有意に増加または有意に減少する)と示される組織は、病理(例えば、炎症、もしくはちょうど慢性B型肝炎ウイルス保因者におけるようなウイルス感染症)または癌を有する臓器または組織であるだろう。
【0178】
血漿DNAのHCCに好ましい末端が癌またはHCCに特異的であることを支持する別の証拠、我々は、HCCまたはHBVに好ましい末端を示す血漿DNA分子のサイズプロファイルを研究した(
図30)。
【0179】
図30は、HCCに好ましい末端、HBVに好ましい末端、または共有された末端で終結する血漿DNA分子中に検出される、短DNA(<150塩基対)の割合を示す。
図30は、HCCに好ましい末端を呈する血漿DNA分子が一般に、HBVに好ましい末端を示す血漿DNA分子よりも一層短い(高い短DNAの割合)ことを示す。Jiangら(Jiang et al.Proc Natl Acad Sci U S A.2015;112:E1317-25)は以前に、別のアプローチを使用して、腫瘍由来血漿DNA分子がバックグラウンド非腫瘍DNAよりも短いことを示した。HCCに好ましい末端を有する血漿DNA分子はより一層短いため、それらは腫瘍に由来する可能性が非常に高い。したがって、HCCに好ましい末端を有する血漿DNA分子を、より低い配列決定深度ですら検出する確率を改善することができ、短DNAを有する試料を富化することができる。
【0180】
4.ウインドウに基づく終結比
別の実施形態において、HCCに好ましい位置を、隣接するヌクレオチドを含むように伸長してもよい。
図31Aが、この方法を説明する。ウインドウA内で終結する断片の数とウインドウB内で終結する断片の数との間の、ウインドウに基づくPETR(w-PETR)比が決定される。ウインドウA及びウインドウBのサイズは、所望される性能を達成するように調節され得る。差異ウインドウサイズの性能は、実験的に得ることができる。ウインドウAのサイズは、例えば、5塩基対、6塩基対、7塩基対、8塩基対、9塩基対、10塩基対、15塩基対、20塩基対、25塩基対、及び30塩基対に設定され得るが、これらに限定されない。ウインドウBのサイズは、ウインドウAのサイズよりも大きく、例えば、20塩基対、25塩基対、30塩基対、40塩基対、50塩基対、60塩基対、70塩基対、80塩基対、100塩基対、120塩基対、140塩基対、160塩基対、180塩基対、及び200塩基対に設定され得るが、これらに限定されない。以下の例示的な例において、ウインドウA及びウインドウBのサイズはそれぞれ、20塩基対及び150塩基対に設定した。
【0181】
図31Aは、w-PETRの原理の説明を示す。w-PETRの値は、ウインドウA内で終結するDNA断片の数と、ウインドウB内で終結するDNA断片の数との間の比率として計算される。標準PETRが実装されるとき、ウインドウAはより大きく、幅1のものであり得る。ウインドウBは、より大きなものとして示される。両方のウインドウは、好ましい終結位置で中央にあるものとして示されるが、ウインドウの他の配置が使用されてもよい。いくつかの実施形態において、ウインドウAは、好ましい終結ウインドウに対応し得る。
【0182】
図31Bは、11人のHCC患者における、腫瘍DNA画分とw-PETRの値との間の相関を示す。これらの結果は、w-PETRが、癌患者の血漿中の腫瘍由来DNAの量を決定するのに有用であることを示唆する。
【0183】
5.1試料当たりの最高終結位置の使用
我々は、1人の妊婦からのデータ、1人の慢性B型肝炎ウイルス保因者(HBV)からのデータ、1人の肺癌患者からのデータ、及び2人のHCC患者からのデータの間の、上位100万個の最も高頻度に提示される無細胞DNA終結位置を比較した。HCC患者について、無PCRプロトコルを使用して、一方の症例(HCC)の配列決定ライブラリを調製し、PCRに基づくプロトコルを使用して、他方(HCC(PCR)の試料を調製した。全ての他の試料は、無PCRプロトコルを使用して調製する。
図32は、臍帯血液血漿試料(210×半数体ゲノム範囲)と比較した場合の、研究試料のそれぞれの血漿試料中に検出される、一般的に共有される好ましい終結位置の割合を示す。
【0184】
図32は、臍帯血液血漿試料(210×半数体ゲノム範囲)と比較した場合の、研究試料のそれぞれの血漿試料中に検出される、一般的に共有される好ましい終結位置の割合を示す。PCRを使用して検出された、妊娠、HCC、HBV、肺癌、及びHCCのそれぞれの常染色体のパーセンテージを示す。
【0185】
高レベルの共通性が、血漿DNA断片化がランダムなプロセスではないという概念を再び支持する。HCC及びHCC(PCR)データは、好ましい終結位置の分析が、PCRによるか、またはPCRによらない、いずれのライブラリ調製プロトコルを使用しても実行され得ることを示す。共通末端を示さない血漿DNA分子の割合が依然として存在することに留意することは興味深い。非共通末端は、試料の生理学的状態、例えば、妊娠、胎児、もしくは胎盤、または疾患状態、例えば、癌を代表する、好ましい末端である。血漿DNAの好ましい末端のより詳細な比較を、
図33に示す。
【0186】
図33は、2つ以上の試料中に一般的に観察された好ましい終結位置の数、及びいずれか1つの試料中にのみ観察された好ましい終結位置の数を示す、ベン図を示す。肺癌患者の血漿DNAを、175×半数体ゲノム範囲で配列決定した。
【0187】
図33から、115,305個の好ましい末端が、3つ全ての試料にわたって共通していることは注目すべきである。これらは、バックグラウンド血漿DNAの主要供給源、例えば、血液細胞に由来している可能性が高い。この分析はまた、HCC患者及び肺癌患者の血漿試料中に観察された、61,035個の好ましい終結位置が存在したことも示す。これらの好ましい末端は、いくつかの癌に共通であり得る。したがって、それらは癌に由来するものである。一方、HCC患者(479,766個の末端)の血漿DNA分子中にのみ、または肺癌患者(749,237個の末端)の血漿DNA分子中にのみ検出されたが、両方には検出されなかった末端が存在する。したがって、これらの好ましい末端は、高レベルの特異性を示す。それらは、特定の癌組織型に特異的である。同一の理論的根拠に基づいて、類似した発掘方略を使用して、特定の臓器の癌及び特定の組織学型の癌に特異的な末端を特定することができる。異なるクラスの末端を呈する血漿DNA分子は、様々な用途に使用することができる。例えば、特定の癌の種類を直接検出またはスクリーニングするための、HCCまたは肺癌に特異的な末端の検出を試みることができる。HCC試料及び肺癌試料に共通する末端を使用して、一般に癌を検出またはスクリーニングすることができる。最も一般的な共通末端を、疾患に関連する好ましい末端の検出量を正規化するための分母として使用することができる。一般的な共通末端はまた、任意の疾患の徴候をスクリーニングする目的(一般的な健康スクリーニングなど)で検出されてもよい。そのような試験の陽性の所見は、より詳細な調査のために医師のもとに来診する警告として機能し得る。
【0188】
B.試料個体であるが異なる時点で収集された試料間の好ましい終結位置の間の比較
特定の状態の好ましい終結位置はまた、異なる時点で収集された試料の断片末端を比較することによっても得ることができる。例えば、癌患者において、1つの血漿試料が診断時点で収集され得、他の試料が治療後(例えば、腫瘍の外科的切除後)に収集され得る。終結位置の差異は、後者における癌由来DNAの寄与、または癌に対する身体的応答の不在を潜在的に反映する。別の例において、胎児の出産前後に取得された、妊婦から収集された血漿試料間の比較を行ってもよい。
【0189】
以下の例において、8人の妊婦から収集された血漿試料を分析した。各妊婦について、出産前に血漿試料を収集した。8人中6人の女性において、出産時点で追加の血漿試料を収集した。8人の妊婦から、出産の6時間後から複数の試料を収集し、合計28個の出産後の血漿試料を収集した。血漿DNA試料を、6.49×半数体ゲノム範囲の平均深度まで配列決定した。出産前及び出産時点で収集された試料の配列決定された読み取りをPETR分析のためにともにプールし、これらの読み取りを「出産前の読み取り」と呼ぶ。出産の6時間後以降に収集された試料の配列決定された読み取りをPETR分析のためにプールし、これらの読み取りを「出産後」の読み取りと呼ぶ。妊娠に好ましい末端であったヌクレオチド位置を特定するために、「出産後」の読み取りと比較して、「出産前」の読み取りにおいて少なくとも4倍より高いPETRを有する位置を回収した。合計45,281個の部位を特定した。
【0190】
それぞれが男の胎児を担持する、8人の妊娠第一期の妊婦の独立したコホートを募集し、彼女たちの血漿DNAを配列決定した。2000万個の配列決定された読み取りの中央値を、これらの血漿DNA試料から得た。8人の妊婦のそれぞれについて、45,281個の部位の平均PETR値を決定し、これらの値を、Y染色体に整列する読み取りの割合から推定された血漿中の胎児DNA画分と相関させた(Chiu et al.BMJ 2011;342:c7401)。
【0191】
図34Aは、血漿中の胎児DNA画分と、「出産前」血漿DNA試料及び「出産後」血漿DNA試料の比較を通して特定された位置のセット上の、平均PETRとの間の相関を示す。これらの結果は、特定された位置のセットが胎児由来DNAにとって好ましいこと、及びPETR分析が母体血漿中の胎児DNAの定量化に有用であることを示唆する。
【0192】
既に記載したアプローチと同様に、我々は、w-PETR分析を、この妊娠に好ましい位置のセットに適用した。ウインドウA及びウインドウBのサイズはそれぞれ、20塩基対及び150塩基対に設定した。他の実施形態において、他のウインドウサイズを使用してもよい。
【0193】
図34Bは、血漿中の胎児DNA画分と、「出産前」血漿DNA試料及び「出産後」血漿DNA試料の比較を通して特定された位置のセット上の、平均w-PETRとの間の相関を示す。これらの結果は、これらの妊娠に好ましい位置に対するw-PETR分析が、母体血漿中の胎児DNAの定量化に有用であることを示唆する。
【0194】
C.同一の条件間の共通末端点
我々は、2人の妊婦の血漿中で、上位100万個の最も高頻度に観察された好ましい終結位置を比較した(
図35A)。
【0195】
図35Aは、妊娠18週目の妊婦(妊婦対象1)及び妊娠38週目の妊婦(妊婦対象2)の2人の間で、上位100万個の最も高頻度に観察された血漿DNAに好ましい終結位置を示す。このデータは、これらの女性が217,947個の好ましい末端を共有したことを示す。両方の女性が妊娠していることを考慮すると、これらの末端は、胎児、胎盤、または妊娠中の増加した細胞死(血漿DNAの生成)を有する臓器に由来する。したがって、これらのマーカーは、妊娠または胎児の健康を監視するのに最も有用である。
【0196】
我々は、この試料セットのPETR値を計算した。興味深いことに、2つの母体血漿試料中の血漿DNA分子のPETR値間に相関(ピアソン’r=0.52、p値<0.0001)が観察された(
図35B)。
【0197】
図35Bは、2人の妊婦の血漿中で、上位100万個の最も高頻度に観察された好ましい終結位置のPETR値の比較を示す。再び繰り返すと、高程度の相関は、血漿DNA断片化が高度に組織化されていることを示す。いくつかの終結部位は、他の終結部位より「好ましい」。興味深いことに、上位100万個の「最も好ましい」部位間ですら、PETRの比較的広い動的範囲が存在する。例えば、疾患について試験するための標的化検出のために、好ましい末端のいくつかまたはサブセットを選択する場合、対象となる疾患群間で一般的に共有されるもの(理想的には、疾患及び特に非常に高いPETRを有する終結位置を有しない対照群において観察されないか、またはより一般的でないもの)を選択するべきである。
【0198】
VIII.組織に特異的な終結位置を使用する方法
図36は、本発明の実施形態に従う、生体試料を分析して、混合物中の第1の組織型の比例的寄与の分類を決定する方法3600の流れ図である。生体試料は、第1の組織型を含む複数の組織型に由来する無細胞DNA分子の混合物を含む。
【0199】
ブロック3610で、第1の組織型の無細胞DNA分子の末端が閾値を超える比率で生じる、第1のゲノム位置のセットを特定する。ブロック3610についての更なる詳細、及び好ましい終結位置の特定を実行する他のブロックの更なる詳細は、節X.Bにある。他の方法の他のブロックの詳細もまた、節Xに見出すことができる。
【0200】
ブロック3620で、対象の生体試料に由来する第1の複数の無細胞DNA分子を分析する。無細胞DNA分子の分析は、無細胞DNA分子の少なくとも1つの末端に対応する、基準ゲノムにおけるゲノム位置を決定することを含む。ブロック3620は、無細胞DNA分子を分析するための他のブロック、例えば、ブロック1320に類似した様式で実行することができる。
【0201】
ブロック3630で、第1の数の第1の複数の無細胞DNA分子が複数のウインドウのうちの1つ内で終結することを判定する。判定は、第1の複数の無細胞DNA分子の分析に基づいて実行する。各ウインドウは、第1のゲノム位置のセットのうちの少なくとも1つを含む。
【0202】
ブロック3640で、複数のウインドウのうちの1つ内で終結する第1の複数の無細胞DNA分子の相対的存在量を算出する。相対的存在量は、第2の数の無細胞DNA分子を使用して第1の数の第1の複数の無細胞DNA分子を正規化することによって、決定することができる。第2の数の無細胞DNA分子は、第1のゲノム位置のセットを含む複数のウインドウの外側の第2のゲノム位置のセットで終結する、無細胞DNA分子を含む。
【0203】
図27Aに記載されるように、第2のゲノム位置のセットは、第2の組織型の無細胞DNA分子の末端が、少なくとも1つの追加の試料中で閾値を超える比率で発生するようなものであってもよく、第2の組織型は、少なくとも1つの追加の試料中に複数の第2の組織に特異的な対立遺伝子を有する。第2のゲノム位置のセットは、複数の第2の組織に特異的な対立遺伝子のうちの少なくとも1つを含む、少なくとも1つの追加の試料の無細胞DNA分子を使用して、決定することができる。セットGは
図27Bを決定するのに使用される両方のセットから除外され得るため、第1の組織型と第2の組織型との間で共有された対立遺伝子を有する無細胞DNA分子の末端が、閾値を超える第2の比率で発生するゲノム位置は、第1のゲノム位置のセットから除外され得、第2のゲノム位置のセットから除外され得る。
【0204】
ブロック3650で、相対的存在量を、第1の組織型の比例的寄与が既知である1つ以上の較正試料から決定される、1つ以上の較正値と比較することによって、第1の組織型の比例的寄与の分類を決定する。
【0205】
比例的寄与が高い場合、治療的介入または対象の撮像(例えば、第1の組織型が腫瘍に対応する場合)などの更なる措置が実行され得る。例えば、調査は撮像モダリティを使用してもよく、例えば、対象(対象全体または身体の特定の部分(例えば、胸部もしくは腹部)、あるいは特に候補臓器のもの)のコンピュータ断層撮影(CT)スキャンまたは磁気共鳴撮像(MRI)を実行して、対照における腫瘍の存在を確認または排除してもよい。腫瘍の存在が確認された場合、治療、例えば、(メスもしくは放射線による)手術または化学療法が実行されてもよい。
【0206】
治療は、決定された癌のレベル、特定された変異、及び/または原発組織に従って提供され得る。例えば、(例えば、多型実装例の)特定された変異は、特定の薬物または化学療法によって標的化され得る。原発組織を使用して、手術または任意の他の形態の治療を誘導することができる。そして、癌のレベルを使用して、任意の種類の治療についてどれほど積極的にするかを決定することができ、これはまた、癌のレベルに基づいても決定することができる。
【0207】
IX.遺伝子型の決定
特定の組織型について好ましい終結位置が決定され得ることを考慮すると、そのような好ましい終結位置で終結する無細胞DNA分子は、その組織に由来する高い尤度を有する。状況によっては、無細胞DNA混合物中の組織型は、特定のゲノム位置で、他の組織型と比較して異なる遺伝子型を有し得る。例えば、胎児組織または腫瘍組織は、異なる遺伝子型を有し得る。無細胞DNA分子は、対象となる組織型に由来する高い尤度を有し得るため、そのような位置で終結する無細胞DNA分子を分析して、その位置の組織型の遺伝子型を決定することができる。このように、好ましい終結位置をフィルタとして使用して、その組織型に由来するDNAを特定することができる。
【0208】
A.胎児遺伝子型
配列決定された血漿DNA断片の終結位置に関する情報を使用して、どの母体対立遺伝子が妊婦から胎児に遺伝しているかを決定することができる。ここで、我々は、仮定上の例を使用して、この方法の原理を説明する。我々は、母親、父親、及び胎児の遺伝子型がそれぞれ、AT、TT、及びTTであると想定する。胎児遺伝子型を決定するために、我々は、胎児が母親からAまたはT対立遺伝子を遺伝しているかを決定する必要がある。我々は以前に、相対的変異遺伝子量(RMD)分析と呼ばれる方法を記載している(Lun et al.Proc Natl Acad Sci USA 2008;105:19920-5)。この方法において、母体血漿中の2つの母体対立遺伝子の遺伝子量が比較されるだろう。胎児が母体T対立遺伝子を遺伝している場合、胎児はT対立遺伝子がホモ接合であるだろう。このシナリオにおいて、T対立遺伝子は、A対立遺伝子と比較して、母体血漿中で過剰発現されるだろう。他方、胎児が母親から対立遺伝子を遺伝している場合、胎児の遺伝子型はATであるだろう。このシナリオにおいて、母親及び胎児の両方のATがヘテロ接合であるため、A及びT対立遺伝子は母体血漿中におよそ同一の遺伝子量で存在するだろう。したがって、RMD分析において、母体血漿中の2つの母体対立遺伝子の相対的遺伝子量が比較されるだろう。配列決定された読み取りの終結位置を分析して、RMDアプローチの正確性を改善することができる。
【0209】
図37は、胎児に特異的な終結位置に近い基準ゲノムに整列させると、異なる対立遺伝子を担持する母体血漿DNA分子を示す。実線の分子は母親に由来し、破線の分子は胎児に由来する。胎児DNA分子は、妊娠に特異的な終結位置上で終結する可能性がより高い。一実施形態において、妊娠に特異的な終結位置上で終結する分子は、RMD分析においてより大きな加重を与えられてもよい。別の実施形態において、妊娠に特異的な位置上で終結する血漿DNA断片のみが、下流分析に使用される。この選択は、胎児由来血漿DNA断片を下流分析のために潜在的に富化する。
【0210】
図37は、遺伝子型がATである妊婦における血漿DNA分子を示す。母体組織に由来するDNA断片は実線であり、胎児に由来するDNA断片は破線である。胎児DNA分子は、妊娠に特異的な終結位置上で終結する可能性がより高い。
【0211】
この例示的な例において、妊娠に特異的な終結位置上で終結する2つの分子の両方が、T対立遺伝子を担持する。一実施形態において、妊娠に特異的な終結位置上で終結する2つの分子のみを下流分析に使用し、胎児遺伝子型をTTと推定した。別の実施形態において、T対立遺伝子を担持する2つの胎児由来分子は、妊娠に特異的な終結位置上で終結したため、これらの分子には、RMD分析においてより高い加重が与えられるだろう。妊娠に特異的な終結位置上で終結する分子に、異なる加重(例えば、1.1、1.2、1.3、1.4、1.5、2、2.5、3、及び3.5であるが、これらに限定されない)が与えられてもよい。
【0212】
一例として、ある座位がヘテロ接合かどうかを判定するための基準は、それぞれが少なくとも所定のパーセンテージ(例えば、30%または40%)のその座位に整列された読み取りにおいて出現する、2つの対立遺伝子の閾値であり得る。1つのヌクレオチドが十分なパーセンテージ(例えば、70%以上)で出現する場合、座位は、CGにおいてホモ接合であると判定することができる。
【0213】
B.癌遺伝子型
癌に特異的な終結位置について、類似した技術を実行することができる。例えば、癌に好ましい終結位置を上述のように特定することができる。癌に好ましい終結位置上で終結する無細胞DNA分子を特定し、分析することができる。このセットの各無細胞DNA分子について、この位置に対応する(例えば、整列される)塩基を決定することができ、各塩基について、全塩基のパーセンテージを算出することができる。例えば、この位置上で終結する無細胞DNA分子上に見られるCのパーセンテージを決定することができる。Cが対象の健常な組織中に見られない場合、十分な数の(例えば、閾値数を超える)Cが特定されるとき(これは、試料中で測定される腫瘍DNA画分に依存し得る)、Cを変異として特定することができる。
【0214】
C.選別技術
終結位置を使用する以外の他の基準を使用して、腫瘍組織に由来する無細胞DNA分子を選別することができる。他の基準はまた、胎児のシナリオにも使用してもよい。
【0215】
癌遺伝子型(例えば、癌に特異的な変異を含む)、及びそのような遺伝子型を使用する任意の試験(例えば、癌のレベルを決定するための変異負荷の使用)を特定する上での特異性は、変異を有する1つ以上の配列読み取りが整列されている座位に選別基準を適用することによって、改善することができる。癌の一例として、高い特異性は、遺伝子またはゲノムシグネチャーを、それが癌に関連するという高い信頼が存在するときにのみ、正であるとスコア化することよって達成することができる。これは、配列決定の数、及び変異として誤認され得る整列誤差を最小化することによって、例えば、健常な対照の群のゲノムプロファイルと比較することによって達成することができ、かつ/またはその人自身の体質的DNAと比較することによって達成することができ、かつ/またはその人の初期のゲノムプロファイルと比較することによって達成することができる。
【0216】
様々な基準を選別基準として適用して、腫瘍に由来する故に、情報提供的癌DNA断片である資格がある、無細胞DNA断片の尤度を評価することができる。各選別基準は、個々に、独立して、等分加重もしくは他の加重とともに集合的に、または特定の順序で連続的に、または先行する選別ステップの結果によって条件的に使用してもよい。条件的な使用について、ベイジアンに基づくアプローチ及び分類または決定木に基づくアプローチが使用されてもよい。ある基準の個々の使用は、1つの基準のみの使用を意味し得る。独立した使用は、2つ以上の選別基準を伴い得るが、各選別基準は、特定の順序の連続用途とは対照的に、別の選別基準の適用には依存しない(例えば、並列適用が実行され得る)。加重を使用する集合的使用の一例として、機械学習技術が使用されてもよい。例えば、教師付き学習において、既知の分類を有する試料の測定された変異負荷を使用して、任意のモデルを訓練することができる。多数(例えば、数百、数千、または数百万)の個人に由来する配列決定データを使用して、モデルを訓練することができる。より単純な形態において、そのような既知の試料を使用して、選別基準から決定された1つ以上のスコアの閾値値を決定して、ある変異が有効か否かを決定することができる。
【0217】
DNA断片が2つ以上の癌に特異的な変化を示す場合、それらには、より高い情報提供性または癌特異性の加重が与えられてもよい。例えば、多くの癌は、特に非プロモーター領域で包括的に低メチル化されている。癌DNAは、血漿中の非癌DNAよりも短いことが示されている。腫瘍由来血漿DNA断片は、いくつかの特定の位置で断片化する傾向がある。したがって、一端または両端が癌関連末端位置にある、サイズが短く(例えば、<150塩基対)(Jiang et al.Proc Natl Acad Sci USA 2015;112:E1317-1325)、単一ヌクレオチド変異を示し、非プロモーター領域に局在化し、低メチル化されたCpG部位を有する血漿DNA断片は、癌に関連する可能性がより高いと見なされるだろう。低メチル化されたDNAの検出は、亜硫酸水素塩DNA変換、またはメチル-シトシンを非メチル-シトシンから区別し得る直接的単一分子配列決定に使用によって達成され得る。この用途において、我々は、情報提供的癌DNA断片の特定における特異性を増加させるためのプロセス、プロトコル、及びステップを記載する。例えば、1つ以上の選別基準を使用して、特異性を増加させることができる。例えば、1つ以上の選別基準を使用して、特異性を、少なくとも約80%、90%、95%、または99%の特異性まで増加させることができる。
【0218】
1.血漿DNA末端位置の使用
上述のように、末端ヌクレオチド(終結位置)の座標に基づく、潜在的な癌に特異的もしくは癌に関連する変異または胎児変異の選別が実行されてもよい。上述のように、我々は、ランダムではなく、原発組織に基づいて変動する、DNA断片の末端位置を特定した。したがって、末端位置を使用して、推定上の変異を有する配列読み取りが実際に胎児組織または腫瘍組織に由来する、尤度を決定することができる。
【0219】
近年、血漿DNAの断片化パターンがランダムではないことが示されている(Snyder et al.Cell 2016;164:57-68及びPCT WO2016/015058A2)。血漿DNA断片化パターンは、血漿DNA分子に寄与している細胞のゲノムにおける、ヌクレオソーム配置、転写因子結合部位、デオキシリボヌクレアーゼ切断部位または高感受性部位、発現プロファイル(Snyder et al.Cell 2016;164:57-68及びPCT WO2016/015058;Ivanov et al.BMC Genomics 2015;16 Suppl 13:S1)、ならびにDNAメチル化プロファイル(Lun et al.Clin Chem 2013;59:1583-1594)によって影響される。したがって、断片化パターンは、異なる原発組織の細胞について異なる。より高頻度の断片を示すゲノム領域が存在する一方で、その領域内の実際の血漿DNA切断部位は、依然としてランダムであり得る。
【0220】
我々は、異なる組織が、異なる切断部位つまり末端位置を有する血漿DNA断片の放出に関連付けられると仮定する。換言すると、特定の切断部位ですら、ランダムではない。実際、我々は、癌患者におけるサブセットの血漿DNA分子が、癌を有しない患者とは異なる末端位置を示すことを示す。いくつかの実施形態において、そのような癌に関連する末端位置を有する血漿DNA分子を、情報提供的癌DNA断片として使用しても、そのような末端位置情報を、例えば、1つ以上の他の選別基準とともに、選別基準として使用してもよい。したがって、そのような癌に関連する血漿DNA末端位置の特定によって、血漿DNA断片を情報提供的癌DNA断片としてスコア化し得るか、または差動加重をそのような断片の末端位置に基づくものとし得る。そのような基準を使用して、癌、特定の臓器、または特定の臓器の癌に起源を持つ断片の尤度を評価することができる。そのような加重を使用して、その位置で見られる特定の塩基の合計パーセンテージに対する、特定のDNA断片の特定の塩基の寄与を修正することができる。
【0221】
したがって、血漿DNA断片が情報提供的癌DNA断片であるという確率は、それが癌に関連付けられる末端位置だけでなく、推定上の変異及び/または癌に関連するメチル化変化も示す場合に、より一層高いだろう。様々な実施形態においてもまた、そのような断片の状態及びその長さ、またはそのような及び他のパラメータの任意の組み合わせを考慮してもよい。2つの末端(または以下の節に記載されるように潜在的に最大4つの末端)を有する血漿DNA断片について、その末端の一方もしくは両方が癌に関連付けられるか、または癌に関連付けられる組織型に由来するかどうかを考慮することによって、それを癌由来断片として特定するための加重を更に修正してもよい。一実施形態において、末端位置に基づく類似したアプローチを使用して、他の病理または生物学的プロセス(例えば、加齢プロセスによる変異もしくは環境変異原性因子による変異)に関連付けられる変異を検出することもできる。
【0222】
類似したアプローチを使用して、胎児を担持する妊婦の血漿中のDNAを配列決定することによって、その胎児のデノボ変異を特定することもできる。それ故に、胎盤に特異的または比較的特異的である末端位置を特定した後、母体血漿中のそのようなDNA断片が、胎盤に特異的な末端位置または胎盤で富化された末端位置もまた担持する場合、より高い加重の原因は、推定上の胎児デノボ変異が真のものであることとすることができる。血漿DNA断片が2つの末端を有するため、その末端の一方もしくは両方が胎盤に関連付けられるかを考慮することによって、それを胎児由来断片として特定するための加重を更に修正してもよい。
【0223】
図16に示されるように、ちょうど536,772個のHCCに特異的な終結位置で終結する末端ヌクレオチドを有する血漿DNA断片は、腫瘍に由来する可能性がより高いだろう。対照的に、ちょうど妊娠に特異的な終結位置、または2つの場合によって共有される位置で終結する末端ヌクレオチドを有する血漿DNA断片は、腫瘍に由来する可能性がより低く、潜在的には妊娠に特異的な終結位置が可能性がより低く、加重を使用する任意の実施形態において、より低い加重が与えられる。
【0224】
したがって、HCCの症例に特異的である上位終結位置のリストを使用して、癌に関連する変異を選択することができ、妊娠の場合に特異的であるか、または両方の場合によって共有される上位終結位置のリストを使用して、偽陽性変異を選別して除去することができる。類似した手順を使用して、非侵襲的出生前検査で胎児変異を特定し、偽陽性変異を選別して除去することができる。
【0225】
一般に、そのような生物学的に関連する血漿DNA末端位置を特定するために、異なる疾患または疫学的バックグラウンドまたは生理学的プロファイルを有する個人の群に由来する血漿DNA試料が、そのような疾患またはバックグラウンドまたはプロファイルを有しない別の個人の群に由来する試料と比較され得る。一実施形態において、各試料内で血漿DNA断片の共通末端位置を特定し得るために、これらの試料のそれぞれを深く配列し得る。別の実施形態において、無料プロファイルを有する人々の群に由来する配列データをともにプールして、その疾患または生理学的プロファイルに代表的な共通末端位置を特定することができる。
【0226】
試料中の各血漿DNA断片を個々に調べてもよく、末端位置に基づいて尤度スコアを割り当ててもよい。特定の末端位置の尤度スコアは、対照群について終結する配列読み取りの量と比較して、標的個人(例えば、癌)について、その末端位置で終結する配列読み取りの量(例えば、配列読み取りまたは試料にわたる配列決定深度によって正規化された他の値のパーセンテージ)の分離に依存し得る。より大きな分離はより高い特異性をもたらすため、より高い尤度スコアが適用され得る。したがって、特定の末端位置を有する血漿DNA断片の、疾患に関連する可能性が高いか否か、胎児または母体などへの分類が実行され得る。
【0227】
あるいは、同一の領域に起源を持つ血漿DNA断片が集合的に解釈され得、すなわち、配列決定深度に正規化することによって、特定のヌクレオチドで終結する比率が計算され得る。このように、例えば、より多くの試料が使用され得るものの、単に特定の種類の1つの試料の分析に基づいて、特定のヌクレオチドが、ゲノムにおける他の位置と比較して、共通末端位置であるものとして特定され得る。したがって、特定の末端位置を有する血漿DNA断片の、疾患に関連する可能性が高いか否か、胎児、または母体などへの分類が実行され得る。そのような生物学的に関連する血漿DNA末端位置を有する高頻度の血漿DNA断片を示す位置について、そのような座位は生物学的に関連するDNAが富化されるため、癌に関連するか、または胎児に特異的であるか、または他の疾患もしくは生物学的プロセスに関連するものとして、高尤度の血漿DNA断片の群として含まれるという決定を行ってもよい。尤度のレベルは、上述の異なる群にわたる比較と類似した様式で、他のヌクレオチドと比較して、所与のヌクレオチドの比率がどれほど高いかに基づき得る。
【0228】
2.結果
このアプローチの有効性を説明するために、潜在的に癌に関連する変異を、HCC患者のDNA配列決定データから直接特定した。少なくとも2つの血漿DNA断片の配列読み取りにおいて存在した単一ヌクレオチド変化を、潜在的に癌に関連する変異と見なした。腫瘍組織もまた配列決定し、腫瘍組織中に存在した変異を真の癌に関連する変異と見なした。
【0229】
染色体8上で、動的カットオフ分析を使用せずに、HCC患者の血漿DNA配列決定データから合計20,065個の潜在的な変異を特定した。ある配列バリアントが少なくとも2つの配列決定されたDNA断片中に存在した場合、その配列バリアントを潜在的な変異と見なす。腫瘍組織の配列決定結果から、884個の真の体細胞変異を特定した。20,065個の推定上の変異は、884個の真の変異のうちの802個(91%)を含んだ。したがって、腫瘍組織中、推定上の変異のうちの4%のみが、真の体細胞変異であり、陽性的中率は4%であった。
【0230】
体細胞変異の検出の正確性を改良し、それにより、癌遺伝子型をもたらすために、我々は、推定上の変異を担持する配列読み取りの末端ヌクレオチド位置に基づく、以下の選別アルゴリズムを使用した。(1)。任意の推定上の変異について、変異を担持し、HCCに特異的な終結位置上で終結する少なくとも1つの配列読み取りが存在する場合、変異は下流変異分析の資格があるだろう。(2)。推定上の変異は担持したが、任意の妊娠に特異的な終結位置上または両方の場合によって共有される位置上で終結した配列読み取りは、除去する。変異は、このアルゴリズムに基づいて読み取りを除去した後に、同一の変異を示す2つ以上の配列読み取りが存在した場合にのみ、下流変異分析の資格があるだろう。
【0231】
上述の1及び2の選別アルゴリズムの両方を適用して、表2の結果を得た。推定上の変異を担持するDNA断片の末端ヌクレオチドの位置つまり末端位置に基づいて、異なる選別アルゴリズムを適用する効果。
【表2】
【0232】
末端位置がHCCに特異的であることを必要とする3つのアルゴリズム、または妊娠に特異的な位置もしくは共有される位置を選別して除去するアルゴリズムのうちのいずれか1つを採用することによって、陽性的中率の実質的な改善が存在した。両方のアルゴリズムを適用することによって、陽性的中率は71%まで上昇した。
【0233】
各染色体について、または実際別のゲノム領域について、または実際ゲノム全体について、他の数(例えば、50万、200万、300万、400万、500万、600万、700万、800万、900万、または1000万などであるが、これらに限定されない)のHCC及び妊娠に関連する末端位置が特定され得る。様々な実施形態において、血漿DNA分子中で最も高頻度に見られる末端位置が、癌患者の1人以上のコホート(各コホートは1つの癌の種類のものである)において決定され得る。更に、血漿DNA分子中で最も高頻度な末端位置が、癌を有しない対象において決定され得る。一実施形態において、そのような癌を有する患者及び癌を有しない対象は、異なる臨床的パラメータ、例えば、性別、喫煙状態、以前の健康(例えば、肝炎状態、糖尿病、体重)などを有する群へと更に細分化され得る。
【0234】
そのような選別基準を使用することの一部として、統計学的分析を使用して、異なる生理学的状態及び病理学的状態の循環DNAの末端ヌクレオチドまたは末端位置である、より高い確率を有する位置を特定することができる。統計学的分析の例としては、スチューデントt検定、カイ二乗検定、及び二項分布またはポアソン分布に基づく検定が挙げられるが、これらに限定されない。これらの統計学的分析について、異なるp値カットオフ(例えば、0.05、0.01、0.005、0.001、及び0.0001などであるが、これらに限定されない)が使用され得る。p値カットオフはまた、複数の比較のために調節され得る。
【0235】
D.遺伝子型を決定するための方法
図38は、本発明の実施形態に従う、生体試料を分析して、第1の組織型の遺伝子型を決定する方法3800の流れ図である。生体試料は、第1の組織型を含む複数の組織型に由来する無細胞DNA分子の混合物を含む。第1の組織型は、潜在的に複数の組織型の他の組織型とは異なる遺伝子型を有する。複数のゲノム位置の遺伝子型が決定され得る。
【0236】
ブロック3810で、第1の組織型の無細胞DNA分子の末端が閾値を超える比率で生じる、第1のゲノム位置を特定する。ブロック3810は、ブロック3610に類似した様式で実行することができる。節X.Bは、ブロック3810を実行するための追加の例を提供する。
【0237】
ブロック3820で、対象の生体試料に由来する第1の複数の無細胞DNA分子を分析する。無細胞DNA分子の分析は、無細胞DNA分子の少なくとも1つの末端に対応する、基準ゲノムにおけるゲノム位置を決定することを含む。ブロック3620は、無細胞DNA分子を分析するための他のブロックに類似した様式で実行することができる。
【0238】
ブロック3830で、第1の複数の無細胞DNA分子の分析に基づいて、第1のゲノム位置で終結する無細胞DNA分子のセットを特定する。例として、セットは、既知の終結位置を有する検出されたプローブの配列読み取りの整列を使用して、特定することができる。他の例が、本明細書に提供される。
【0239】
いくつかの実施形態において、例えば、上述のように、更なる選別が実行されてもよい。例えば、例えば、胎児組織及び腫瘍組織は一般に、健常な細胞に由来するDNA断片よりも短いため、無細胞DNA分子のサイズが、特定の量未満であることが必要とされてもよい。一実装例において、無細胞DNA分子のセットを選別して、第1のゲノム位置で終結する無細胞DNA分子のうちの少なくとも1つの加重を除外または修正してもよい。選別された無細胞DNA分子のセットを使用して、遺伝子型を決定することができる。
【0240】
様々な実施形態において、選別は、無細胞DNA分子のサイズ、1つ以上の位置の無細胞DNA分子のメチル化状態(例えば、CpG部位がメチル化されているか、メチル化されていないか)、及び無細胞DNA分子が、第1の組織型の無細胞DNA分子の末端が閾値を超える比率で発生する、1つ以上の他のゲノム位置を網羅するかどうかのうちの最後に1つを使用し得る。メチル化状態は、上述のように、第1の組織型のシグネチャーを提供し得る。
【0241】
ブロック3840で、無細胞DNA分子のセットの各無細胞DNA分子について、第1のゲノム位置で生じる、対応する塩基(ヌクレオチド)が決定される。各塩基を有する分子の総数が決定され得、各塩基のパーセンテージが計算され得る。
【0242】
ブロック3850で、無細胞DNA分子のセットにおいて第1のゲノム位置で生じる対応する塩基を使用して、第1のゲノム位置の第1の組織型の遺伝子型が決定される。様々な実装例において、1つの塩基のみの高いパーセンテージ(例えば、80%、85%、または90%超)は、その塩基の遺伝子型がホモ接合であることを示し得る一方で、類似したパーセンテージ(例えば、30~70%の間)を有する2つの塩基は、遺伝子型がヘテロ接合であるという決定をもたらし得る。したがって、各塩基のパーセンテージは、遺伝子型に対するカットオフ値と比較され得る。いくつかの実施形態において、カットオフ値は、試料に対する第1の組織型の比例的寄与に基づいて決定され得る。
【0243】
したがって、いくつかの実施形態において、第1のゲノム位置の第1の組織型の遺伝子型を決定することは、複数の塩基のそれぞれの寄与パーセンテージを決定し、寄与パーセンテージのそれぞれを1つ以上のカットオフ値と比較することを含み得る。一例において、第1の塩基の寄与パーセンテージが第1のカットオフ値を超える場合、第1のカットオフ値は、第1の塩基のホモ接合遺伝子型に対応し得る。別の例において、第1の塩基及び第2の塩基の寄与パーセンテージが第1のカットオフ値を超え、かつ第2のカットオフ値未満である場合、第1のカットオフ値及び第2のカットオフ値は、第1の塩基及び第2の塩基のヘテロ接合遺伝子型に対応し得る。
【0244】
いくつかの実施形態において、ブロック3830において特定されるセット中の各無細胞DNA分子について、加重が実行されてもよい。例えば、無細胞DNA分子が第1の組織型に由来する尤度が80%である場合、0.8が加重であり得る。特定の塩基の全ての加重の合計寄与を合計して、各塩基のそれぞれの量を決定することができる。それぞれの量を使用して、各塩基の寄与パーセンテージを決定することができ、パーセンテージを使用して、遺伝子型を決定することができる。
【0245】
したがって、選別は、無細胞DNA分子が第1の組織型に由来する尤度に対応して、無細胞DNA分子に加重を割り当て得る。複数の塩基のそれぞれについて、加重和が決定され得る(例えば、2、3、または4つであり得る、検出されたもののみ)。1つの塩基のみが検出された場合、その1つの塩基のホモ接合遺伝子型が検定され得る。加重和を使用して、複数の塩基のそれぞれの寄与パーセンテージを決定することができ、この寄与パーセンテージを使用して、遺伝子型を決定する。
【0246】
X.更なる詳細
上述の様々な実施形態において、特定の組織の好ましい終結位置(好ましい終結位置のうちのいくつかは近接し、それにより、好ましい終結ウインドウを形成してもよい)を特定する。異なる測定基準を使用して、ゲノムウインドウ(例えば、最小ウインドウのゲノム位置)での無細胞DNA分子の発生率を特定することができる。そのような操作についての更なる詳細、及び基準ゲノムにおける無細胞DNA分子の終結位置の決定についての詳細が、以下に提供される。そのような特定の技術は、上述の実施形態とともに使用することができる。
【0247】
A.終結位置の決定
無細胞DNA分子を配列決定するとき、DNA断片の終結パターンの様々な可能性が存在する。一般に、血漿DNAの末端には4つの構成、つまり、(A)2つの平滑末端を有する二本鎖DNA分子、(B)1つの平滑末端及び1つの非平滑末端を有する二本鎖DNA分子(二本の鎖のうちのいずれか一本が突出し得るため、2つのシナリオのそれぞれを示す)、(C)異なる組み合わせの突出末端で、2つの非平滑末端を有する二本鎖DNA分子、ならびに(D)一本鎖DNA分子が存在する。
【0248】
非平滑末端を有する構成について、DNA分子の5’末端または3’末端が突出するかによって、異なるパターンが存在する。(B)について、二本鎖DNA分子は、1つの平滑末端及び1つの非平滑末端を有する。例B1において、5’末端が突出し、例B2において、3’末端が突出する。(C)について、両端が非平滑である場合、3つの可能性のあるパターンが存在する。(C1)において、5’末端が両側で突出する。(C2)において、3’末端が両側で突出する。(C3)において、5’末端が片側で突出し、3’末端がもう片側で突出する。
【0249】
配列決定について、ペアードエンド配列決定プロトコルは一般的に、鎖のそれぞれの一端を配列決定する。したがって、それらは、二本鎖DNA配列決定プロトコルと見なされる。2つの末端が平滑でない場合、プロトコルは、ヌクレオチドを切断するか、末端にヌクレオチドを添加して、それらを平滑にするかのいずれかであり得る。クレノウ断片は、そのような操作を実行し得る酵素である。当該分野における他のプロトコルは、一本鎖DNA配列決定プロトコルを使用する。
【0250】
使用される特定の技術(プローブの使用を含む)に関わらず、終結位置が本明細書に示されるように反復可能であり、相関を示す限り、DNA断片の真の末端が配列決定において得られるかどうかは、いかなるオフセットも反復可能であり、したがって、相殺されるため、結果には影響を与えない。更に、用語の節に記載されるように、特定の技術を使用して、終結位置を特定することができる。
【0251】
B.組織に特異的な終結位置の特定
上述のように、特定の組織型において、特定のゲノム領域は、他の領域よりも、無細胞DNA分子が特定の位置上で終結する尤度の大きな変動を有する。例えば、肝臓組織は、デオキシリボヌクレアーゼ高感受性部位である領域を有し得るが、他の組織は、その領域をデオキシリボヌクレアーゼ高感受性部位としては有しない。従って、そのような領域内の特定の位置は、他の位置と比較して、それらの位置上で終結する多数の無細胞DNA分子を有するだろう。例として、そのような位置は、例えば、節IIIに記載されるように、特定の組織の多量の切断(したがって、尤度関数の高い振幅)を有することが既知である領域の、無細胞DNA分子の比率の最大として特定され得る。他の例において、例えば、節IVに記載されるように、左ピーク及び右ピークが十分に分離しているゲノム位置が特定され得る。
【0252】
更なる他の例において、例えば、節V、VI、及びVIIにおいてベン図を使用して記載されるように、ある状態(例えば、妊娠または癌、可能性としては特定の種類のもの)を有する試料及び有しない試料の高い比率(例えば、閾値を超える比率)の終結位置のセットの差異を使用して、その状態に関連付けられる特定の組織型の好ましい終結部位を特定することができる。更なる他の例として、ある状態を有しない別の試料よりも有意に高い、その状態を有する1つの試料の比率は、特定の組織型の好ましい終結部位を提供し得る。様々な実施形態において、そのような例示的な技術のうちのいくつかまたは全ては、ともに使用され得る。比率は、任意の相対的存在量の測定基準によって測定され得る。
【0253】
上記の方法のいくつかの実施形態において、第1の組織型の無細胞DNA分子の末端が閾値を超える比率で生じる、第1のゲノム位置のセットは、以下の様式で特定することができる。較正試料は、同一の種類の2つの試料(例えば、血漿、血清、尿など)及び較正試料が、第1の組織型(例えば、妊娠中の女性の試料に由来する胎児組織、またはHCC患者の肝臓の腫瘍組織)を含むことが既知である試験試料と類似した様式で、分析され得る。あるゲノムウインドウ(例えば、幅1以上のもの)内で終結する無細胞DNA分子の数を、基準値と比較して、終結位置の比率がその位置の閾値を超えるかどうかを判定し得る。いくつかの実施形態において、比率が基準値を超える場合、対応する数が基準値を超えるとき、第1のゲノムウインドウ内のゲノム位置のそれぞれを、閾値を超える比率を有するものとして特定し得る。そのようなプロセスは、好ましい終結位置を含む好ましい終結ウインドウを特定し得る。
【0254】
基準値は、上位N個のゲノムウインドウのみが閾値を超える比率を有するようなものであり得る。例えば、第1のゲノム位置のセットは、対応する数の最高のN値を有し得る。例として、Nは、少なくとも10,000、50,000、100,000、500,000、1,000,000、または5,000,000であり得る。
【0255】
別の例として、基準値は、例えば、節VI.A.1に記載されるように、ある試料中の無細胞DNA分子の確率分布及び平均長に従う、ゲノムウインドウ内で終結する無細胞DNA分子の期待数であり得る。p値は、対応する数及び期待数を使用して決定することができ、閾値は、カットオフp値(例えば、0.01)に対応する。カットオフp値未満であるp値は、比率が閾値を超えることを示す。更なる別の別の例として、基準値は、例えば、
図29A及び29Bに記載されるように、減少した量の第1の組織型を有するものとして特定される試料に由来するゲノムウインドウ内で終結する、無細胞DNA分子の測定された数を含み得る。
【0256】
比率閾値を満たすゲノム位置は、必ずしも第1のゲノム位置のセットには追加されない。更なる選別基準が追加され得る。そのような選別基準の例は、節VI.A.3及びIX.Cに明記される。サイズの選別基準について、例えば、米国特許公開第2011/0276277号、同第2013/0040824号、及び同第2013/0237431号(これら全ての全体が参照により組み込まれる)に記載されるように、無細胞DNA分子のサイズ(例えば、長さまたは質量)が測定されてもよい。第1の統計値は、閾値を超える比率を有すると判定される、(例えば、ウインドウが1の幅を有する場合、ゲノム位置上の)第1のゲノムウインドウ内で終結する無細胞DNA分子のサイズ分布から決定され得る。全ての無細胞DNA分子またはより大きな範囲内のものと比較して、第1の統計値がサイズ閾値を超えないとき、例えば、平均サイズが十分には小さくないか、または十分な数の小DNA断片が存在しない(例えば、特定のサイズ未満)とき、第1のゲノムウインドウのゲノム位置は、第1のゲノム位置のセットから除外され得る。
【0257】
第1の統計値は、閾値を超える比率を有しないと判定される無細胞DNA分子のサイズ分布の第2の統計値と比較され得る。2つの値が類似している(例えば、胎児組織または腫瘍組織には期待されない)場合、第1のゲノムウインドウは、好ましい終結位置のセットから除外され得る。節VII.A.2に記載されるように、対応する数を基準値と比較することは、対応する数と、1つの試料のゲノムウインドウの任意の部分を網羅し、かつ任意で、そのゲノムウインドウ内で終結しない、無細胞DNA分子の数との第1の比率(例えば、PETR)を算出することを含み得る。基準値は、ゲノムウインドウ内で終結する読み取りの測定された数と、ゲノムウインドウを網羅し、かつ他の試料のゲノムウインドウ内で終結しない無細胞DNA分子の数との基準比率を含み得る。第1の比率は、乗法的因子(例えば、4)掛ける基準比率よりも大きい必要があり得る。
【0258】
別の選別基準は、第1のゲノム位置のセットの各ゲノム位置が、ゲノム位置上で終結する少なくとも特定の数の無細胞DNA分子を有する必要があり得るというものであり得る。これらの技術のうちのいずれかを使用して、第1のゲノム位置のセットは、600~10,000個のゲノム位置を含み得る。
【0259】
セット間の差異(例えば、ベン図の使用)を採用する実施形態において、(例えば、ゲノムウインドウから決定される)その比率が閾値を超えるゲノム位置は、例えば、
図28AにセットP及びセットSとして示される第1の上位集合を含む。減少した量の第1の組織型(例えば、
図28Aに描写されるように、より少ないか、または全くない胎児組織またはHCC組織)を有する少なくとも1つの第2の追加の試料から、第3の複数の無細胞DNA分子を分析して、第2の上位集合、例えば、セットQ及びセットSを特定することができる。第1のゲノム位置のセットは、どの組織型が分析されるかによって、第1の上位集合内にあり、かつ第2の上位集合内にはないゲノム位置(例えば、セットPまたはセットS)を含み得る。
【0260】
節VIに記載されるように、第1の組織型は、第1の組織に特異的な対立遺伝子を有し得る。ゲノム位置上で終結し、複数の第1の組織特異的対立遺伝子のうちの少なくとも1つを含む無細胞DNA分子の計数が行われてもよい。この無細胞DNA分子の計数(数)が、基準値と比較され得る。
【0261】
C.相対的存在量
相対的存在量の値の様々な例、例えば、インタクト確率(PI)、節VI.A.1に記載されるp値、及びウインドウが幅1のものであるときのゲノムウインドウまたはゲノム位置を使用して決定されるPETR値が、本明細書に提供される。ゲノム位置(幅1のウインドウ)のPETRについて、ゲノム位置上で終結する、第1の複数の無細胞DNA分子の対応する数が、第1のゲノム位置のセットの各ゲノム位置について算出され得る。これは、第1の数(例えば、分子)の第1の複数の無細胞DNA分子が、第1のゲノム位置のセットのうちのいずれか1つの上で終結することを判定することの一部として行うことができる。ゲノム位置を網羅し、ゲノム位置上で終結しない第3の数(例えば、分母)の無細胞DNA分子は、第2の数の無細胞DNA分子を決定することの一部として算出され得る。対応する数及び第3の数の第1の比率が決定され、第1の比率の平均が相対的存在量として使用され得る。
【0262】
w-PETRについて、ゲノム位置を含む、第1のウインドウ(例えば、
図31AのウインドウA)内で終結する、無細胞DNA分子の対応する数が、第1のゲノム位置のセットの各ゲノム位置について算出され得る。ゲノム位置を含む、第2のウインドウ(例えば、
図31AのウインドウBのもの)内で終結する第3の数の無細胞DNA分子が、算出され得る。対応する数及び第3の数の第1の比率の平均が、相対的存在量として使用され得る。
【0263】
相対的存在量の値の別の例は、例えば、好ましい終結位置上で終結する、配列決定されたDNA断片の割合として測定される、ゲノムウインドウ上で終結する無細胞DNA分子の割合である。したがって、第2のゲノム位置のセットは、第1の複数の無細胞DNA分子の少なくとも1つの末端に対応する、全てのゲノム位置を含み得る。
【0264】
D.較正値
様々な実施形態において、較正値(複数可)は、較正試料(複数可)から決定される較正データ点(複数可)の較正値(複数可)、またはそこから決定される(例えば、較正データ点に近似する較正関数の)任意の較正値に対応し得る。1つ以上の較正試料は、好ましい終結部位を決定するために使用される任意の追加の試料を含んでも、含まなくてもよい。
【0265】
1つ以上の較正試料のそれぞれについて、第1の組織型の対応する比例的寄与は、例えば、組織に特異的な対立遺伝子を使用して測定され得る。対応する相対的存在量は、第1のゲノム位置のセットに対応する複数のウインドウ内で終結する、無細胞DNA分子の対応する数を使用して決定され得る。測定された比例的寄与及び相対的存在量は、較正データ点を提供し得る。1つ以上の較正データ点は、複数の較正データ点に近似する較正関数を形成する、複数の較正データ点であり得る。較正値の使用についての更なる詳細は、米国特許公開第2013/0237431号に見出すことができる。
【0266】
E.比例的寄与の分類
いくつかの実施形態において、特定の組織の好ましい終結位置を使用して、例えば、1単位体積当たり(例えば、1ミリリットル当たり)のゲノムの数での、試料中の特定の組織型の絶対的寄与を測定することもできる。例えば、対象となる組織の濃度は、無細胞DNA試料の体積または重量に関して測定することができる。一実装例において、定量的PCRを使用して、抽出された無細胞DNA試料の単位体積または単位重量当たりの、1つ以上の好ましい末端で終結する無細胞DNA分子の数を測定することができる。類似した測定を較正試料について行ってもよく、したがって、寄与は単位体積または単位重量当たりの濃度であるため、比例的寄与を比例的寄与として決定してもよい。
【0267】
第1の組織型が腫瘍組織に対応する、様々な実施形態において、分類は、対象における腫瘍組織の量、対象における腫瘍のサイズ、対象における腫瘍の段階、対象における腫瘍負荷、及び対象における腫瘍転移の存在からなる群から選択され得る。
【0268】
XI.更なる実施形態
実施形態1は、第1の組織型を含む複数の組織型に由来する無細胞DNA分子の混合物を含む、生体試料を分析して、混合物中の第1の組織型の比例的寄与の分類を決定する方法であって、第1の組織型の無細胞DNA分子の末端が、閾値を超える比率で発生する、第1のゲノム位置のセットを特定することと、コンピュータシステムによって、対象の生体試料に由来する第1の複数の無細胞DNA分子を分析することであって、無細胞DNA分子を分析することが、無細胞DNA分子の少なくとも1つの末端に対応する、基準ゲノムにおけるゲノム位置を決定することを含む、分析することと、第1の複数の無細胞DNA分子の分析に基づいて、第1の数の第1の複数の無細胞DNA分子が複数のウインドウのうちの1つ内で終結することを判定することであって、各ウインドウが、第1のゲノム位置のセットのうちの少なくとも1つを含む、判定することと、第2の数の無細胞DNA分子を使用して、第1の数の第1の複数の無細胞DNA分子を正規化することによって、複数のウインドウのうちの1つ内で終結する第1の複数の無細胞DNA分子の相対的存在量を算出することであって、第2の数の無細胞DNA分子が、第1のゲノム位置のセットを含む複数のウインドウの外側の第2のゲノム位置のセットで終結する無細胞DNA分子を含む、算出することと、相対的存在量を、第1の組織型の比例的寄与が既知である1つ以上の較正試料から決定される、1つ以上の較正値と比較することによって、第1の組織型の比例的寄与の分類を決定することとを含む、方法を含む。
【0269】
実施形態2は、実施形態1の方法を含み、第1のゲノム位置のセットを特定することが、コンピュータシステムによって、少なくとも1つの第1の追加の試料に由来する第2の複数の無細胞DNA分子を分析して、第2の複数の無細胞DNA分子の終結位置を特定することであって、少なくとも1つの第1の追加の試料が、第1の組織型を含むことが既知であり、かつ生体試料と同一の試料型のものである、特定することと、複数のゲノムウインドウの各ゲノムウインドウについて、ゲノムウインドウ上で終結する、第2の複数の無細胞DNA分子の対応する数を算出することと、対応する数を基準値と比較して、ゲノムウインドウ内の1つ以上のゲノム位置上で終結する無細胞DNA分子の比率が閾値を超えるかどうかを判定することとを含む。
【0270】
実施形態3は、実施形態2の方法を含み、複数のゲノムウインドウの第1のゲノムウインドウが、1つのゲノム位置よりも大きい幅を有し、対応する数が基準値を超える場合、第1のゲノムウインドウ内のゲノム位置のそれぞれが、閾値を超える、ゲノム位置上で終結する無細胞DNA分子の比率を有するものとして特定される。実施形態4は、実施形態2または3の方法を含み、第1のゲノム位置のセットが、対応する数の最高のN値を有し、Nが、少なくとも10,000である。
【0271】
実施形態5は、実施形態2、3、または4の方法を含み、第2の複数の無細胞DNA分子のそれぞれのサイズを決定することであって、第1のゲノム位置のセットを特定することが、閾値を超える比率を有すると判定された、第1のゲノムウインドウ内で終結する第2の複数の無細胞DNA分子の無細胞DNA分子のサイズ分布の第1の統計値を決定することと、第1の統計値をサイズ閾値と比較することと、第1の統計値がサイズ閾値を超えない場合、第1のゲノムウインドウを第1のゲノム位置のセットから除外することとを更に含む、決定することを更に含む。実施形態6は、実施形態2~5のいずれか1つの方法を含み、1つ以上の較正試料が、少なくとも1つの第1の追加の試料を含む。実施形態7は、実施形態1~6のいずれか1つの方法を含み、1つ以上の較正試料のそれぞれについて、第1の組織型の対応する比例的寄与を測定することと、第1のゲノム位置のセットに対応する複数のウインドウ内で終結する第2の複数の無細胞DNA分子の対応する数を使用して、対応する相対的存在量を決定し、それにより、較正データ点を得ることであって、各較正データ点が、追加の生体試料の第1の組織型の測定された比例的寄与及び対応する相対的存在量を特定する、得ることとを更に含む。実施形態8は、実施形態7の方法を含み、1つ以上の較正データ点が、複数の較正データ点に近似する較正関数を形成する複数の較正データ点である。
【0272】
実施形態9は、実施形態2~8のいずれか1つの方法を含み、第1のゲノム位置のセットの各ゲノム位置が、ゲノム位置上で終結する第2の複数の無細胞DNA分子の少なくとも特定の数の無細胞DNA分子を有する。実施形態10は、実施形態2~9のいずれか1つの方法を含み、基準値が、少なくとも1つの第1の追加の試料中の無細胞DNA分子の確率分布及び平均長に従う、ゲノムウインドウ内で終結する無細胞DNA分子の期待数である。実施形態11は、実施形態10の方法を含み、確率分布が、ポアソン分布であり、ゲノムウインドウ内の1つ以上のゲノム位置上で終結する無細胞DNA分子の比率が閾値を超えるかどうかを判定することが、対応する数及び期待数を使用して、対応するp値を決定することであって、閾値が、カットオフp値に対応し、対応するp値が、カットオフp値よりも小さいことが、ゲノムウインドウ内で終結する無細胞DNA分子の比率が閾値を超えることを示す、決定することを含む。
【0273】
実施形態12は、実施形態2~11のいずれか1つの方法を含み、ゲノム位置上で終結する第2の複数の無細胞DNA分子の比率が閾値を超える、ゲノム位置が、第1の上位集合を含み、第1のゲノム位置のセットを特定することが、コンピュータシステムによって、減少した量の第1の組織型を有するものとして特定される、少なくとも1つの第2の追加の試料に由来する第3の複数の無細胞DNA分子を分析して、ゲノム位置上で終結する第3の複数の無細胞DNA分子の第2の上位集合が閾値を超えることを特定することと、第1のゲノム位置のセットを、第1の上位集合内にはあり、かつ第2の上位集合内にはない、ゲノム位置を含むものとして特定することとを更に含む。
【0274】
実施形態13は、実施形態2~12のいずれか1つの方法を含み、基準値が、ゲノムウインドウ内で終結する、測定された数の無細胞DNA分子を含み、測定された数が、第1の組織型を有しないものとして特定される、少なくとも1つの第2の追加の試料の第3の複数の無細胞DNA分子から決定される。実施形態14は、実施形態13の方法を含み、第2の複数の無細胞DNA分子のそれぞれのサイズを決定することであって、第1のゲノム位置のセットを特定することが、閾値を超える、比率を有すると判定された、第1のゲノム位置上で終結する、第2の複数の無細胞DNA分子の無細胞DNA分子の第1のサイズ分布の第1の統計値を決定することと、閾値を超える、比率を有すると判定された、1つ以上の第2のゲノム位置上で終結する、第3の複数の無細胞DNA分子の無細胞DNA分子の第2のサイズ分布の第2の統計値を決定することと、第1の統計値を第2の統計値と比較することと、を含む、特定することと、第1の統計値が少なくとも特定の量だけ第2の統計値を超えない場合、第1のゲノム位置を第1のゲノム位置のセットから除外して、第1のサイズ分布が第2のサイズ分布よりも小さいことを示すこととを更に含む。実施形態15は、実施形態13または14の方法を含み、対応する数を基準値と比較することが、対応する数と、ゲノムウインドウを網羅する第3の数の第2の複数の無細胞DNA分子との、第1の比率を算出することと、第1の比率を基準値と比較することであって、基準値が、ゲノムウインドウ内で終結する読み取りの測定された数と、ゲノムウインドウを網羅し、かつゲノムウインドウ内で終結しない、第4の数の第3の複数の無細胞DNA分子との基準比率を含む、比較することとを含む。実施形態16は、実施形態15の方法を含み、第3の数の第2の複数の無細胞DNA分子が、ゲノムウインドウ内で終結しない。実施形態17は、実施形態15または16の方法を含み、ゲノムウインドウ内で終結する無細胞DNA分子の比率が、閾値を超えるかどうかを判定することが、第1の比率が乗法的因子掛ける基準比率よりも大きいかどうかを判定することを含む。
【0275】
実施形態18は、実施形態2~17のいずれか1つの方法を含み、生体試料及び少なくとも1つの第1の追加の試料の試料型が、血漿、血清、脳脊髄液、及び尿からなる群から選択される。実施形態19は、実施形態2~18のいずれか1つの方法を含み、ゲノムウインドウが、ゲノム位置であり、第1の組織型が、複数の第1の組織に特異的な対立遺伝子を有し、ゲノム位置上で終結する、第2の複数の無細胞DNA分子の対応する数を算出することが、ゲノム位置上で終結する無細胞DNA分子が、複数の第1の組織に特異的な対立遺伝子のうちの少なくとも1つを含むかどうかを特定することと、無細胞DNA分子が第1の組織に特異的な対立遺伝子を含む場合、対応する数に無細胞DNA分子を含めることと、無細胞DNA分子が第1の組織に特異的な対立遺伝子を含まない場合、対応する数に無細胞DNA分子を含めないこととを含む。
【0276】
実施形態20は、実施形態1~19のいずれか1つの方法を含み、第1の組織型が、少なくとも1つの追加の試料中に複数の第1の組織に特異的な対立遺伝子を有し、第1のゲノム位置のセットが、複数の第1の組織に特異的な対立遺伝子のうちの少なくとも1つを含む、少なくとも1つの追加の試料の無細胞DNA分子を使用して決定される。実施形態21は、実施形態20の方法を含み、第2のゲノム位置のセットが、第2の組織型の無細胞DNA分子の末端が、少なくとも1つの追加の試料中で閾値を超える比率で発生するようなものであり、第2の組織型が、少なくとも1つの追加の試料中に複数の第2の組織に特異的な対立遺伝子を有し、第2のゲノム位置のセットが、複数の第2の組織に特異的な対立遺伝子のうちの少なくとも1つを含む、少なくとも1つの追加の試料の無細胞DNA分子を使用して決定される。実施形態22は、実施形態21の方法を含み、少なくとも1つの追加の試料が、妊娠中の女性に由来するものであり、第1の組織型が、胎児組織であり、第2の組織型が、母体組織である。実施形態23は、実施形態21または22の方法を含み、第1の組織型と第2の組織型との間で共有された対立遺伝子を有する無細胞DNA分子の末端が、閾値を超える第2の比率で発生するゲノム位置が、第1のゲノム位置のセットから除外され、第2のゲノム位置のセットから除外される。
【0277】
実施形態24は、実施形態1~23のいずれか1つの方法を含み、相対的存在量が、第1の数及び第2の数の比率を含む。実施形態25は、実施形態1~24のいずれか1つの方法を含み、複数のウインドウが、1つのゲノム位置の幅を有し、相対的存在量が、第1のゲノム位置のセットの各ゲノム位置について、ゲノム位置上で終結する、第1の複数の無細胞DNA分子の対応する数を、第1の数の第1の複数の無細胞DNA分子が第1のゲノム位置のセットのうちのいずれか1つで終結することを判定することの一部として算出することと、ゲノム位置を網羅し、ゲノム位置上で終結しない第3の数の第1の複数の無細胞DNA分子を、第2の数の無細胞DNA分子を決定することの一部として算出することと、対応する数及び第3の数の第1の比率を算出することと、第1の比率の平均を相対的存在量として算出することとによって算出される。実施形態26は、実施形態1~24のいずれか1つの方法を含み、相対的存在量が、第1のゲノム位置のセットの各ゲノム位置について、ゲノム位置を含む第1のウインドウ内で終結する第1の複数の無細胞DNA分子の対応する数を、第1の数の第1の複数の無細胞DNA分子が複数のウインドウのうちの1つ内で終結することを判定することの一部として算出することと、ゲノム位置を含む第2のウインドウ内で終結する、第3の数の第1の複数の無細胞DNA分子を算出することであって、第2のウインドウが、第1のウインドウよりも大きい、算出することと、対応する数及び第3の数の第1の比率を算出することと、第1の比率の平均を相対的存在量として算出することとによって算出される。
【0278】
実施形態27は、実施形態1~26のいずれか1つの方法を含み、第2のゲノム位置のセット及び第1のゲノム位置のセットが、重複しない。実施形態28は、実施形態1~27のいずれか1つの方法を含み、第2のゲノム位置のセットが、第1の複数の無細胞DNA分子の少なくとも1つの末端に対応する、全てのゲノム位置を含む。実施形態29は、実施形態1~28のいずれか1つの方法を含み、無細胞DNA分子のうちの1つ以上を分析することが、無細胞DNA分子の両末端に対応する両方のゲノム位置を決定することを含む。実施形態30は、実施形態1~29のいずれか1つの方法を含み、比例的寄与の分類が、特定のパーセンテージを超える範囲に対応する。実施形態31は、実施形態1~30のいずれか1つの方法を含み、第1の組織型が、腫瘍である。実施形態32は、実施形態31の方法を含み、分類が、対象における腫瘍組織の量、対象における腫瘍のサイズ、対象における腫瘍の段階、対象における腫瘍負荷、及び対象における腫瘍転移の存在からなる群から選択される。
【0279】
実施形態33は、実施形態1~32のいずれか1つの方法を含み、1つ以上の追加の生体試料が、対象に由来するものであり、生体試料とは異なる時間に得られる。実施形態34は、実施形態1~33のいずれか1つの方法を含み、分析される生体試料から鋳型DNA分子を得ることと、鋳型DNA分子を使用して、分析可能なDNA分子の配列決定ライブラリを調製することであって、鋳型DNA分子のDNA増幅のステップを含まない、調製することと、分析可能なDNA分子の配列決定ライブラリを配列決定して、第1の複数の無細胞DNA分子に対応する複数の配列読み取りを得ることと、を更に含み、第1の複数の無細胞DNA分子を分析することが、コンピュータシステムから、複数の配列読み取りを受信することと、コンピュータシステムによって、複数の配列読み取りを基準ゲノムに整列させて、複数の配列読み取りのゲノム位置を決定することとを含む。実施形態35は、実施形態1~34のいずれか1つの方法を含み、分類に基づいて治療的介入を提供すること、または分類に基づいて対象の撮像を実行することを更に含む。実施形態36は、実施形態1~35のいずれか1つの方法を含み、第1のゲノム位置のセットが、600~10,000個のゲノム位置を含む。
【0280】
実施形態37は、第1の組織型を含む複数の組織型に由来する無細胞DNA分子の混合物を含む、生体試料を分析して、混合物中の第1の組織型の比例的寄与の分類を決定する方法であって、第1の組織型に特異的な断片化パターンを有する、少なくとも1つのゲノム領域を特定することと、生体試料に由来する複数の無細胞DNA分子を分析することであって、無細胞DNA分子を分析することが、無細胞DNA分子の少なくとも1つの末端に対応する、基準ゲノムにおけるゲノム位置を決定することを含む、分析することと、第1のセットの第1のゲノム位置を特定することであって、各第1のゲノム位置が、第1のゲノム位置に対応する無細胞DNA分子の末端の極小を有する、特定することと、第2のセットの第2のゲノム位置を特定することであって、各第2のゲノム位置が、第2のゲノム位置に対応する無細胞DNA分子の末端の極大を有する、特定することと、少なくとも1つのゲノム領域のうちのいずれか1つにおける、第1のゲノム位置のうちのいずれか1つで終結する、第1の数の無細胞DNA分子を決定することと、少なくとも1つのゲノム領域のうちのいずれか1つにおける、第2のゲノム位置のうちのいずれか1つで終結する、第2の数の無細胞DNA分子を決定することと、第1の数及び第2の数を使用して、分離値を算出することと、分離値を、第1の組織型の比例的寄与が既知である1つ以上の較正試料から決定される、1つ以上の較正値と比較することによって、第1の組織型の比例的寄与の分類を決定することとを含む、方法を含む。
【0281】
実施形態38は、実施形態37の方法を含み、第1のセットの第1のゲノム位置が、複数のゲノム位置を含み、第2のセットの第2のゲノム位置が、複数のゲノム位置を含み、第1の数の無細胞DNA分子を決定することが、各第1のゲノム位置上で終結する、第1の量の無細胞DNA分子を決定し、それにより、複数の第1の量を決定することを含み、第2の数の無細胞DNA分子を決定することが、各第2のゲノム位置上で終結する、第2の量の無細胞DNA分子を決定し、それにより、複数の第2の量を決定することを含み、分離値を算出することが、それぞれが、複数の第1の量のうちの1つ及び複数の第2の量のうちの1つの分離比である、複数の分離比を決定することと、複数の分離比を使用して、分離値を決定することとを含む。実施形態39は、実施形態37または38の方法を含み、少なくとも1つのゲノム領域が、1つ以上のデオキシリボヌクレアーゼ高感受性部位を含む。実施形態40は、実施形態37~38の方法を含み、第1の組織型に特異的な断片化パターンを有する少なくとも1つのゲノム領域のそれぞれが、少なくとも1つの追加の試料中で1つ以上の第1の組織に特異的な対立遺伝子を含む。実施形態41は、実施形態37または38の方法を含み、少なくとも1つのゲノム領域が、1つ以上のATAC-seqまたは小球菌ヌクレアーゼ部位を含む。実施形態42は、実施形態37~41のいずれか1つの方法を含み、第1のゲノム位置のセットのうちの1つのゲノム位置に整列された無細胞DNA分子が、1つのゲノム位置の両側に特定の数のヌクレオチド長伸長する。実施形態43は、実施形態42の方法を含み、特定の数が、10~80ヌクレオチド長である。実施形態44は、実施形態37~43のいずれか1つの方法を含み、第1のセットの第1のゲノム位置を特定することが、複数のゲノム位置のそれぞれについて、ゲノム位置に位置し、ゲノム位置の両側に特定の数のヌクレオチド長伸長する、第1の量の無細胞DNA分子を決定することと、ゲノム位置に位置する、第2の量の無細胞DNA分子を決定することと、第1の量及び第2の量の比率を決定することと、比率における複数の極小値及び複数の極大値を特定することとを含む。実施形態45は、実施形態37~44のいずれか1つの方法を含み、混合物が、血漿または血清である。実施形態46は、実施形態37~45のいずれか1つの方法を含み、複数の無細胞DNA分子が、少なくとも1,000個の無細胞DNA分子である。実施形態47は、実施形態37~46のいずれか1つの方法を含み、複数のゲノム位置の所与のゲノム位置について、第2の量が、所与のゲノム位置に整列する無細胞DNA分子の総数に対応する。
【0282】
実施形態48は、第1の組織型を含む複数の組織型に由来する無細胞DNA分子の混合物を含む、生体試料を分析して、第1の組織型の遺伝子型を決定する方法であって、第1の組織型が、複数の組織型の他の組織型とは異なる遺伝子型を潜在的に有し、方法が、第1の組織型の無細胞DNA分子の末端が、閾値を超える比率で発生する、第1のゲノム位置を特定することと、コンピュータシステムによって、対象の生体試料に由来する第1の複数の無細胞DNA分子を分析することであって、無細胞DNA分子を分析することが、無細胞DNA分子の少なくとも1つの末端に対応する、基準ゲノムにおけるゲノム位置を決定することを含む、分析することと、第1の複数の無細胞DNA分子の分析に基づいて、第1のゲノム位置で終結する無細胞DNA分子のセットを特定することと、無細胞DNA分子のセットのそれぞれについて、第1のゲノム位置で生じる対応する塩基を決定し、それにより、第1のゲノム位置の対応する塩基を決定することと、無細胞DNA分子のセットにおいて第1のゲノム位置で生じる対応する塩基を使用して、第1のゲノム位置の第1の組織型の遺伝子型を決定することとを含む、方法を含む。実施形態49は、実施形態48の方法を含み、無細胞DNA分子のセットを選別して、第1のゲノム位置で終結する無細胞DNA分子のうちの少なくとも1つの加重を除外または修正することであって、遺伝子型が、選別された無細胞DNA分子のセットを使用して決定される、除外または修正することを更に含む。実施形態50は、実施形態49の方法を含み、選別が、無細胞DNA分子のサイズ、1つ以上の位置の無細胞DNA分子のメチル化状態、及び無細胞DNA分子が、第1の組織型の無細胞DNA分子の末端が閾値を超える比率で発生する、1つ以上の他のゲノム位置を網羅するかどうかのうちの最後に1つを使用する。実施形態51は、実施形態49または50の方法を含み、選別が、無細胞DNA分子が第1の組織型に由来する尤度に対応して、無細胞DNA分子に加重を割り当て、方法が、複数の塩基のそれぞれの加重和を決定することと、加重和を使用して、複数の塩基のそれぞれの寄与パーセンテージを決定することであって、遺伝子型が、寄与パーセンテージを使用して決定される、決定することとを更に含む。実施形態52は、実施形態48~51のいずれか1つの方法を含み、第1のゲノム位置の第1の組織型の遺伝子型を決定することが、複数の塩基のそれぞれの寄与パーセンテージを決定することと、寄与パーセンテージのそれぞれを1つ以上のカットオフ値と比較することとを含む。実施形態53は、実施形態52の方法を含み、第1の塩基の寄与パーセンテージが第1のカットオフ値を超える場合、1つ以上のカットオフ値の第1のカットオフ値が、第1の塩基のホモ接合遺伝子型に対応する。実施形態54は、実施形態52の方法を含み、第1の塩基及び第2の塩基の寄与パーセンテージが第1のカットオフ値を超え、第2のカットオフ値未満である場合、1つ以上のカットオフ値の第1のカットオフ値及び第2のカットオフ値が、第1の塩基及び第2の塩基のヘテロ接合遺伝子型に対応する。実施形態55は、実施形態48~54のいずれか1つの方法を含み、第1の組織型が、腫瘍に対応する。実施形態56は、実施形態48~55のいずれか1つの方法を含み、第1の組織型が、胎児に対応し、対象が、胎児を妊娠している。
【0283】
実施形態57は、第1の組織型を含む複数の組織型に由来する無細胞DNA分子の混合物を含む、生体試料を分析する方法であって、コンピュータシステムによって、対象の生体試料に由来する複数の無細胞DNA分子を分析することであって、複数の無細胞DNA分子のそれぞれが、左末端及び右末端を有し、無細胞DNA分子を分析することが、無細胞DNA分子の左末端に対応する、基準ゲノムにおける左終結位置を決定することと、無細胞DNA分子の右末端に対応する、基準ゲノムにおける右終結位置を決定することとを含む、分析することと、それぞれが、ゲノム位置の左のセットのうちの1つに対応する複数の無細胞DNA分子の左末端の極大を有する、左ゲノム位置の左のセットを特定することと、それぞれが、ゲノム位置の右のセットのうちの1つに対応する複数の無細胞DNA分子の右末端の極大を有する、右ゲノム位置の右のセットを特定することと、左のセットの左ゲノム位置を、右のセットの右ゲノム位置と比較して、第1のゲノム位置のセットを特定することによって、第1のゲノム位置のセットを、第1の組織型に特異的なものとして特定することであって、左ゲノム位置から最も近い右ゲノム位置までの距離が、第1の閾距離よりも大きく、第1の閾距離が、基準ゲノムにおける少なくとも5個のゲノム位置である、特定することとを含む、方法を含む。実施形態58は、実施形態57の方法を含み、左のセットの左ゲノム位置を、右のセットの右ゲノム位置と比較して、第2のゲノム位置のセットを特定することによって、第2のゲノム位置のセットを特定することであって、左ゲノム位置から最も近い右ゲノム位置までの距離が、第2の閾距離未満である、特定することと、左ゲノム位置の左のセットのうちの1つで終結する、第1の数の複数の無細胞DNA分子、及び右ゲノム位置の右のセットのうちの1つで終結する、第2の数の複数の無細胞DNA分子を使用して、分離値を決定することと、分離値を、第1の組織型の比例的寄与が既知である1つ以上の較正試料から決定される、1つ以上の較正値と比較することによって、第1の組織型の比例的寄与の分類を決定することとを更に含む。実施形態59は、実施形態58の方法を含み、分離値を決定することが、第1のゲノム位置のセット及び第2のゲノム位置のセットの対を特定することと、対のそれぞれについて、対の、第1のゲノム位置で終結する第1の量の無細胞DNA分子を決定することと、対の、第2のゲノム位置で終結する第2の量の無細胞DNA分子を決定することと、を含み、第1の量の無細胞DNA分子が、第1の数の複数の無細胞DNA分子に対応し、第2の量の無細胞DNA分子が、第2の数の複数の無細胞DNA分子に対応する。実施形態60は、実施形態59の方法を含み、分離値を決定することが、対のそれぞれについて、第1の量及び第2の量を含む比率を決定することと、分離値を比率から決定することとを含む。実施形態61は、実施形態59または60の方法を含み、第1のゲノム位置のセット及び第2のゲノム位置のセットの対が、互いに最も近い。実施形態62は、実施形態57~61のいずれか1つの方法を含み、第2の閾距離が、基準ゲノムにおける5個のゲノム位置未満である。実施形態63は、実施形態57~62のいずれか1つの方法を含み、第1のゲノム位置のセットが、左ゲノム位置及び右ゲノム位置の両方を含む。
【0284】
実施形態64は、DNA混合物中の第1の組織の比例的寄与を決定するための方法であって、第1の組織に特異的なデオキシリボヌクレアーゼ高感受性部位を特定することと、生体試料に由来する複数の無細胞DNA分子を分析することであって、無細胞DNA分子を分析することが、基準人ゲノムにおける無細胞DNA分子の位置を特定することであって、位置が、無細胞DNA分子の両端を含む、特定することを含む、分析することと、それぞれが、ゲノム位置に整列され、ゲノム位置の両側に特定の数のヌクレオチド長伸長する無細胞DNA分子の極小を有する、第1のセットの第1のゲノム位置を特定することと、それぞれが、ゲノム位置に整列され、ゲノム位置の両側に特定の数のヌクレオチド長伸長する無細胞DNA分子の極大を有する、第2のセットの第2のゲノム位置を特定することと、デオキシリボヌクレアーゼ高感受性部位のうちの1つ内の第1のゲノム位置のうちの1つの上で終結する第1の数の無細胞DNA分子を算出することと、デオキシリボヌクレアーゼ高感受性部位のうちの1つ内の第1のゲノム位置のうちの1つの上で終結する第2の数の無細胞DNA分子を算出することと、第1の数及び第2の数の割合を決定することと、割合に基づいて、第1の組織の比例的寄与を決定することとを含む、方法を含む。実施形態65は、実施形態64の方法を含み、第1のセットの第1のゲノム位置を特定することが、複数のゲノム位置のそれぞれについて、座位に位置し、座位の両側に特定の数のヌクレオチド長伸長する第1の量の無細胞DNA分子を決定することと、座位に位置する第2の量の無細胞DNA分子を決定することと、第1の量及び第2の量の第1の比率を決定すること、比率における複数の極小を特定することとを含む。実施形態66は、実施形態64または65の方法を含み、DNA混合物が、血漿または血清である。実施形態66は、実施形態64~66のいずれか1つの方法を含み、複数の無細胞DNA分子が、少なくとも1,000個の無細胞DNA分子である。
【0285】
実施形態67は、DNA混合物中の第1の組織の比例的寄与を決定するための方法であって、DNA断片が第1の組織のDNA断片の末端の閾値を超える頻度を有する、ゲノム位置を特定することと、生体試料に由来する複数の無細胞DNA分子を分析することであって、無細胞DNA分子を分析することが基準人ゲノムにおける無細胞DNA分子の位置を特定することであって、位置が、無細胞DNA分子の両端を含む、特定することを含む、分析することと、デオキシリボヌクレアーゼ高感受性部位のうちの1つ内の特定されたゲノム位置のうちの1つの上で終結する、第1の数の無細胞DNA分子を算出することと、第1の数及び配列決定されたDNAの量から割合を算出することと、割合に基づいて、第1の組織の比例的寄与を決定することとを含む、方法を含む。実施形態68は、実施形態67の方法を含み、第1の組織が、腫瘍である。実施形態69は、実施形態67の方法を含み、第1の組織が、胎児組織である。
【0286】
実施形態70は、推定上の変異を担持するDNA断片が実際に腫瘍に由来するかどうかを予想する方法であって、DNA断片がDNA断片の末端の閾値を超える頻度を有する、ゲノム位置を特定することと、特定されたゲノム位置のうちの1つで終結するDNA断片に基づいて、確率を決定することとを含む、方法を含む。
【0287】
実施形態71は、コンピュータシステムを制御して、実施形態1~70のいずれかに記載の操作を実行するための複数の命令を記憶するコンピュータ可読媒体を含む、コンピュータ製品を含む。実施形態72は、実施形態71のコンピュータ製品と、コンピュータ可読媒体上に記憶された命令を実行するための1つ以上のプロセッサと含む、システムを含む。実施形態73は、実施形態1~70のうちのいずれかを実行するための手段を含むシステムを含む。実施形態74は、実施形態1~70のうちのいずれかを実行するように構成されたシステムを含む。実施形態75は、それぞれが実施形態1~70のうちのいずれかのステップを実行する、モジュールを含むシステムを含む。
【0288】
XII.コンピュータシステム
本明細書に言及されるコンピュータシステムのいずれも、任意の数のサブシステムを利用し得る。そのようなサブシステムの例を、
図39のコンピュータ装置10に示す。いくつかの実施形態において、コンピュータシステムは単一のコンピュータ装置を含み、サブシステムはこのコンピュータ装置の構成要素であり得る。他の実施形態において、コンピュータシステムは、それぞれが内部構成要素を有するサブシステムである、複数のコンピュータ装置を含み得る。コンピュータシステムは、デスクトップコンピュータ及びラップトップコンピュータ、タブレット、携帯電話、ならびに他の携帯用デバイスを含み得る。
【0289】
図39に示されるサブシステムは、システムバス75を介して相互接続される。プリンタ74、キーボード78、記憶デバイス(複数可)79、ディスプレイアダプタ82に連結されるモニタ76、及び他のものなどの追加のサブシステムが示される。I/Oコントローラ71に連結する、周辺デバイス及び入力/出力(I/O)デバイスは、入力/出力(I/O)ポート77(例えば、USB、FireWire(登録商標))などの当該技術分野において既知である任意の数の接続によって、コンピュータシステムに接続され得る。例えば、I/Oポート77または外部インターフェイス81(例えば、Ethernet、Wi-Fiなど)を使用して、コンピュータシステム10を広域ネットワーク(インターネット、マウス入力デバイス、またはスキャナなど)に接続することができる。システムバス75を介した相互接続は、中央プロセッサ73が各サブシステムと通信し、システムメモリ72または記憶デバイス(複数可)79(例えば、ハードドライブなどの固定ディスクまたは光学ディスク)からの複数の命令の実行、及びサブシステム間の情報交換を制御することを可能にする。システムメモリ72及び/または記憶デバイス(複数可)79は、コンピュータ可読媒体を具体化し得る。別のサブシステムは、カメラ、マイクロフォン、及び加速度計などのデータ収集デバイス85である。本明細書に言及されるデータのうちのいずれも、1つの構成要素から別の構成要素へと出力され得、ユーザへと出力され得る。
【0290】
コンピュータシステムは、例えば、外部インターフェイス81によって、または内部インターフェイスによってともに接続された、複数の同一の構成要素またはサブシステムを含み得る。いくつかの実施形態において、コンピュータシステム、サブシステム、または装置は、ネットワーク上で通信し得る。そのような例において、1つのコンピュータがクライアントと見なされ、別のコンピュータがサーバと見なされ得、それぞれが同一のコンピュータシステムの一部であり得る。クライアント及びサーバはそれぞれ、複数のシステム、サブシステム、または構成要素を含み得る。
【0291】
実施形態の態様は、ハードウェア(例えば、特定用途向け集積回路もしくはフィールドプログラマブルゲートアレイ)を使用する、かつ/またはモジュラもしくは集積様式の一般的にプログラム可能なプロセッサを有するコンピュータソフトウェアを使用する、制御論理の形態で実装され得る。本明細書で使用される場合、プロセッサは、シングルコアプロセッサ、同一の集積チップ上のマルチコアプロセッサ、または単一回路基板上の、もしくはネットワーク化された複数の処理ユニットを含む。本明細書に提供される開示及び教示に基づいて、当業者は、ハードウェア及びハードウェアとソフトウェアとの組み合わせを使用して、本発明の実施形態を実装するための他の手段及び/または方法を認識し、理解するだろう。
【0292】
本出願に記載されるソフトウェア構成要素または機能のいずれも、任意の好適なコンピュータ言語(例えば、Java、C、C++、C♯、Objective-C、Swiftなど)または例えば、従来の技術またはオブジェクト指向技術を使用するスクリプト言語(例えば、PerlもしくはPythonなど)を使用してプロセッサによって実行される、ソフトウェアコードとして実装することができる。ソフトウェアコードは、記憶及び/または伝送のために、コンピュータ可読媒体上に一連の命令またはコマンドとして記憶され得る。好適な非一時的コンピュータ可読媒体としては、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、磁気媒体(ハードドライブもしくはフロッピーディスクなど)、または光学媒体(コンパクトディスク(CD)もしくはDVD(デジタル多用途ディスク)など)、及びフラッシュメモリを挙げることができる。コンピュータ可読媒体は、そのような記憶デバイスまたは伝送デバイスの任意の組み合わせであり得る。
【0293】
そのようなプログラムはまた、インターネットを含む様々なプロトコルに準拠する、有線、光学、及び/または無線ネットワークを介した伝送に適合されたキャリア信号を使用してコードされ、伝送されてもよい。したがって、コンピュータ可読媒体は、そのようなプログラムでコードされたデータ信号を使用して、作製されてもよい。プログラムコードでコードされたコンピュータ可読媒体は、互換デバイスとともにパッケージ化されても、他のデバイスとは別個に(例えば、インターネットダウンロードを介して)提供されてもよい。任意のそのようなコンピュータ可読媒体は、単一のコンピュータ製品(例えば、ハードドライブ、CD、またはコンピュータシステム全体)上または内に存在してもよく、あるシステムまたはネットワーク内の異なるコンピュータ製品上または内に存在してもよい。コンピュータシステムは、モニタ、プリンタ、または本明細書に言及される結果のうちのいずれかをユーザに提供するための他の好適なディスプレイを含み得る。
【0294】
本明細書に記載される方法のうちのいずれも、ステップを実行するように構成され得る1つ以上のプロセッサを含むコンピュータシステムによって、全体的または部分的に実行され得る。したがって、実施形態は、本明細書に記載される方法のうちのいずれかのステップを実行するように構成されたコンピュータシステムを対象とし得、潜在的に、異なる構成要素が、それぞれのステップまたはそれぞれのステップの群を実行する。番号付けされたステップとして提示されるものの、本明細書の方法のステップは、同時にまたは異なる順序で実行されてもよい。更に、これらのステップの一部分は、他のステップの一部分とともに使用されてもよい。また、ステップの全てまたは一部分が任意であってもよい。更に、本方法のうちのいずれかのステップのうちのいずれも、モジュール、単位、回路、またはこれらのステップを実行するための他の手段によって実行されてもよい。
【0295】
特定の実施形態の具体的な詳細は、本発明の実施形態の趣旨及び範囲から逸脱することなく、任意の好適な様式で組み合わされ得る。しかしながら、本発明の他の実施形態は、個々の各態様、またはこれらの個々の態様の特定の組み合わせに関する、特定の実施形態を対象とし得る。
【0296】
本発明の例示的実施形態の上記の記述は、説明及び記述の目的で提示されている。徹底的であること、または本発明を記載される正確な形態に制限することは意図されず、上記の教示に照らして、多くの修正及び変更が可能である。
【0297】
「1つの(a)」、「1つの(an)」、または「その」の引用は、具体的に反対であることが示されない限り、「1つ以上の」を意味することが意図される。「または」の使用は、具体的に反対であることが示されない限り、「排他的離接」ではなく「包含的離接」を意味することが意図される。「第1の」構成成分に対する言及は、第2の構成成分が提供されることを必ずしも必要としない。更に、「第1の」または「第2の」構成成分に対する言及は、明確に述べられない限り、言及される構成成分を特定の位置には制限しない。
【0298】
本明細書に言及される全ての特許、特許出願、広報、及び記述の全体が、全ての目的のために参照により組み込まれる。いずれも、先行技術であるとは認められてはいない。