(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-12-20
(54)【発明の名称】尿及び他のDNAの特徴を使用する方法
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20231213BHJP
C12M 1/34 20060101ALI20231213BHJP
G01N 33/50 20060101ALI20231213BHJP
【FI】
C12Q1/6869 Z
C12M1/34 B
G01N33/50 P
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023534991
(86)(22)【出願日】2021-12-07
(85)【翻訳文提出日】2023-06-30
(86)【国際出願番号】 CN2021136087
(87)【国際公開番号】W WO2022121894
(87)【国際公開日】2022-06-16
(32)【優先日】2020-12-08
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2021-05-26
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】512037244
【氏名又は名称】ザ チャイニーズ ユニバーシティ オブ ホンコン
(71)【出願人】
【識別番号】522380594
【氏名又は名称】グレイル,リミティド ライアビリティ カンパニー
(74)【代理人】
【識別番号】100099759
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100117019
【氏名又は名称】渡辺 陽一
(74)【代理人】
【識別番号】100141977
【氏名又は名称】中島 勝
(74)【代理人】
【識別番号】100138210
【氏名又は名称】池田 達則
(74)【代理人】
【識別番号】100134784
【氏名又は名称】中村 和美
(72)【発明者】
【氏名】ロー ユク-ミン デニス
(72)【発明者】
【氏名】チャン クァン チー
(72)【発明者】
【氏名】チアン ペイヨン
(72)【発明者】
【氏名】チョン ソク ハン
(72)【発明者】
【氏名】チョウ ツォー
(72)【発明者】
【氏名】シエ ティンティン
(72)【発明者】
【氏名】ワン コアンヤー
(72)【発明者】
【氏名】ティン チェン
【テーマコード(参考)】
2G045
4B029
4B063
【Fターム(参考)】
2G045AA16
2G045CA25
2G045CA26
2G045CB03
2G045CB07
2G045DA12
2G045DA13
4B029AA07
4B029BB20
4B029FA15
4B063QA13
4B063QA19
4B063QQ03
4B063QQ42
4B063QR08
4B063QR32
4B063QR62
4B063QS28
4B063QX02
(57)【要約】
無細胞DNA断片の末端は、生体試料の分析のために使用され得る。いくつかの実施形態では、尿試料からのDNAが分析され得る。無細胞DNA断片は、多くの場合、不揃い末端を含み、二本鎖DNAの一方の鎖の一方の末端が他方の鎖の他方の末端を超えて伸長する。これらの不揃い末端の長さ及び量は、個体の状態のレベルを判定するように使用され得る。ある特定の領域における断片の末端の密度もまた、状態のレベルを分類する際に使用され得る。更に、DNA断片は、オーバーハングの長さに対応するDNA断片の量を有する周期的パターンを示し得る。周期性は、生体試料の特性を判定するように分析され得る。不揃い末端はまた、二本鎖DNAのオーバーハング3’末端をトリミングするのを回避する技術を用いて分析され得る。
【特許請求の範囲】
【請求項1】
尿試料を分析する方法であって、前記方法が、
個体の前記尿試料からの無細胞の複数の核酸分子の各核酸分子の特徴を測定することであって、前記無細胞の複数の核酸分子の各核酸分子が、第1の部分を有する第1の鎖及び第2の鎖を有する二本鎖であり、前記無細胞の複数の核酸分子のうちの少なくともいくつかの前記第1の鎖の前記第1の部分が、前記第2の鎖からオーバーハングしており、前記特徴が、前記第2の鎖からオーバーハングしている前記第1の鎖の長さに相関する、測定することと、
前記無細胞の複数の核酸分子の前記測定された特徴を使用して、不揃い指数値を判定することと、
前記不揃い指数値を使用して前記個体の状態のレベルを判定することと、を含む、方法。
【請求項2】
前記状態が、疾患、障害、又は妊娠を含む、請求項1に記載の方法。
【請求項3】
前記状態が、がん、自己免疫疾患、又は妊娠関連状態である、請求項2に記載の方法。
【請求項4】
前記測定することが、各核酸分子について、第1の鎖、第2の鎖、又は第1の鎖及び第2の鎖の特徴を測定することを含む、請求項1に記載の方法。
【請求項5】
前記第1の部分が、前記第1の鎖の第1の末端にあり、前記第1の末端が、5’末端である、請求項1に記載の方法。
【請求項6】
核酸分子のサイズを測定することであって、前記無細胞の複数の核酸分子が、指定された範囲内のサイズを有する、測定することを更に含む、請求項1に記載の方法。
【請求項7】
前記指定された範囲が、140~160bpである、請求項6に記載の方法。
【請求項8】
前記無細胞の複数の核酸分子が、第1の複数の核酸分子であり、
前記指定された範囲が、第1の指定された範囲であり、
前記方法が、
第2の無細胞の複数の核酸分子のうちの各核酸分子の鎖の前記特徴を測定することであって、前記第2の無細胞の複数の核酸分子が、第2の指定された範囲を有するサイズを有する、測定することを更に含み、
前記不揃い指数値を判定することが、前記第1の複数の核酸分子の前記測定された特徴及び前記第2の無細胞の複数の核酸分子の前記測定された特徴を使用して比を計算することを含む、請求項6に記載の方法。
【請求項9】
前記特徴が、前記無細胞の複数の核酸分子の各々の前記第1の鎖、前記第2の鎖、又は前記第1の鎖及び前記第2の鎖の末端部分における1つ以上の部位におけるメチル化状態であり、前記不揃い指数値が、前記第1の鎖、前記第2の鎖、又は前記第1の鎖及び前記第2の鎖の末端部分の1つ以上の部位における前記無細胞の複数の核酸分子にわたるメチル化レベルを含む、請求項1に記載の方法。
【請求項10】
前記特徴が、長さである、請求項1に記載の方法。
【請求項11】
より高いメチル化レベルが、前記第2の鎖からオーバーハングしている前記第1の鎖のより長い長さと相関している、請求項9に記載の方法。
【請求項12】
核酸分子を分析して、リードを生成することと、
前記リードを参照ゲノムにアライメントすることと、を更に含み、
前記無細胞の複数の核酸分子が、転写開始部位に対して、ある特定の距離範囲内のリードを有する、請求項1に記載の方法。
【請求項13】
核酸分子を分析して、リードを生成することと、
前記リードを参照ゲノムにアライメントすることと、を更に含み、
前記無細胞の複数の核酸分子が、CTCF部位、又はDNASE1高感受性部位に対して、ある特定の距離範囲内のリードを有する、請求項1に記載の方法。
【請求項14】
前記状態の前記レベルを判定することが、前記不揃い指数値を参照値と比較することに基づく、請求項1に記載の方法。
【請求項15】
前記参照値が、前記状態を有する対象の1つ以上の参照試料を使用して判定される、請求項14に記載の方法。
【請求項16】
前記参照値が、前記状態を有しない対象の1つ以上の参照試料を使用して判定される、請求項14に記載の方法。
【請求項17】
機械学習モデルを使用して、前記不揃い指数値の前記参照値との前記比較、及び前記個体の前記状態の前記レベルの前記判定を実行する、請求項14に記載の方法。
【請求項18】
移植状態を判定する方法であって、前記方法が、
個体の生体試料からの無細胞の複数の核酸分子の各核酸分子の特徴を測定することであって、個体が、第1の組織の移植のレシピエントであり、前記無細胞の複数の核酸分子の各核酸分子が、第1の部分を有する第1の鎖及び第2の鎖を有する二本鎖であり、前記無細胞の複数の核酸分子のうちの少なくともいくつかの前記第1の鎖の前記第1の部分が、前記第2の鎖からオーバーハングしており、前記特徴が、前記第2の鎖からオーバーハングする前記第1の鎖の長さに相関する、測定することと、
前記無細胞の複数の核酸分子の前記測定された特徴を使用して、不揃い指数値を判定することと、
前記不揃い指数値を使用することに基づいて、前記個体に移植された前記第1の組織の前記移植状態を判定することと、を含む、方法。
【請求項19】
前記移植が、腎臓、1つ以上の造血幹細胞、又は肝臓である、請求項18に記載の方法。
【請求項20】
前記移植状態が、拒絶、移植片機能不全、感染、又はそれらの組み合わせの可能性を含む、請求項18に記載の方法。
【請求項21】
前記個体に移植された前記第1の組織における前記移植状態を判定することが、前記不揃い指数値を参照値と比較することを含む、請求項18に記載の方法。
【請求項22】
前記不揃い指数値が前記参照値よりも大きい場合に、前記移植状態が、拒絶されるか又は拒絶される可能性が高いとして分類される、請求項21に記載の方法。
【請求項23】
前記第1の組織が、1つ以上の造血幹細胞又は肝臓である、請求項22に記載の方法。
【請求項24】
前記不揃い指数値が前記参照値未満である場合に、前記移植状態が、拒絶されるか又は拒絶される可能性が高いとして分類される、請求項21に記載の方法。
【請求項25】
前記第1の組織が、腎臓からのものである、請求項24に記載の方法。
【請求項26】
前記参照値が、前記第1の組織の移植を拒絶した対象の1つ以上の参照試料を使用して、又は前記第1の組織の移植を拒絶しなかった対象の1つ以上の参照試料を使用して判定される、請求項21に記載の方法。
【請求項27】
前記参照値が、前記生体試料が前記個体から得られる前に前記個体から得られた1つ以上の参照試料を使用して判定される、請求項21に記載の方法。
【請求項28】
前記移植状態を判定することが、前記移植が拒絶されていると判定することを含み、
前記方法が、前記移植の急性拒絶に対して、前記個体を治療することを更に含む、請求項18に記載の方法。
【請求項29】
前記生体試料が、血液、血漿、血清、尿、又は唾液を含む、請求項18~28のいずれか一項に記載の方法。
【請求項30】
前記生体試料が、尿を含む、請求項18~28のいずれか一項に記載の方法。
【請求項31】
生体試料を分析する方法であって、前記方法が、
個体の生体試料からの無細胞の複数の核酸分子を配列決定して配列リードを生成することであって、前記無細胞の複数の核酸分子の各核酸分子が、第1の部分を有する第1の鎖及び第2の鎖を有する二本鎖であり、前記無細胞の複数の核酸分子のうちの少なくともいくつかの前記第1の鎖の前記第1の部分が、前記第2の鎖からオーバーハングしている、生成することと、
前記配列リードを参照ゲノムにアライメントさせて、前記無細胞の複数の核酸分子のゲノム位置を判定することと、
前記無細胞の複数の核酸分子の核酸分子のセットを識別することであって、前記核酸分子のセットの各核酸分子の前記ゲノム位置が、所定のタイプのゲノム部位から特定の距離にある、識別することと、
前記核酸分子のセットの各核酸分子の特徴を測定することであって、前記特徴が、前記第2の鎖からオーバーハングしている前記第1の鎖の長さに相関する、測定することと、
前記核酸分子のセットの前記測定された特徴を使用して、不揃い指数値を判定することと、
前記不揃い指数値を使用して、前記個体の状態のレベルを判定することと、を含む、方法。
【請求項32】
前記生体試料が、血液、血漿、血清、尿、又は唾液を含む、請求項31に記載の方法。
【請求項33】
前記特定の距離が、ある範囲である、請求項31又は32に記載の方法。
【請求項34】
前記特定の距離が、0ntである、請求項31又は32に記載の方法。
【請求項35】
前記ゲノム部位が、CTCF結合部位、DNASE1高感受性部位(DHS)、又はヒストン修飾を有する領域である、請求項31~34のいずれか一項に記載の方法。
【請求項36】
前記ゲノム部位が、前記ヒストン修飾を有する領域である、請求項35に記載の方法。
【請求項37】
前記ヒストン修飾が、H3K4me1、H3K4me3、H3K36me3、H3K27me2、H3K9Ac、H3K27Ac、H4K16Ac、H3K27me3、又はH3K9me3を含む、請求項36に記載の方法。
【請求項38】
前記個体の前記状態を判定することが、前記不揃い指数値を参照値と比較することを含む、請求項31に記載の方法。
【請求項39】
生体試料を分析する方法であって、前記方法が、
前記生体試料から無細胞の複数の核酸分子内の核酸分子のサブセットを選択することであって、
前記無細胞の複数の核酸分子が、前記臨床的に関連する核酸分子及び他の核酸分子を含み、
前記無細胞の複数の核酸分子の各核酸分子が、第1の部分を有する第1の鎖及び第2の鎖を有する二本鎖であり、
前記無細胞の複数の核酸分子のうちの少なくともいくつかの前記第1の鎖の前記第1の部分が、前記第2の鎖からオーバーハングしており、
前記核酸分子のサブセットの各核酸分子に対して、
前記第2の鎖からオーバーハングしている前記第1の鎖の長さが、閾値よりも大きい、選択することと、
前記核酸分子のサブセットを分析して、前記臨床的に関連する核酸分子の特性を判定することと、を含む、方法。
【請求項40】
前記核酸分子のサブセットを選択することが、
前記無細胞の複数の核酸分子のうちの各核酸分子について、
前記第1の鎖、前記第2の鎖、又は前記第1の鎖及び前記第2の鎖の特徴を測定することであって、前記特徴が、前記第2の鎖からオーバーハングしている前記第1の鎖の前記長さに相関する、測定することと、
コンピュータシステムによって、カットオフ値よりも大きい前記特徴を有する核酸分子を選択して、前記核酸分子のサブセットを得ることと、を含む、請求項39に記載の方法。
【請求項41】
前記核酸分子のサブセットを選択することが、
前記核酸分子のサブセットを、前記無細胞の複数の核酸分子の残りから物理的に分離することを含む、請求項39に記載の方法。
【請求項42】
前記核酸分子のサブセットを物理的に分離することが、前記核酸分子のサブセットの不揃い末端へのプローブのハイブリダイゼーションを含み、前記プローブが、前記閾値よりも大きい前記第2の鎖からオーバーハングしている前記第1の鎖の前記長さを有する前記不揃い末端にハイブリダイズするように設計されている、請求項41に記載の方法。
【請求項43】
前記ハイブリダイゼーションが、磁気ビーズベースのハイブリダイゼーションアッセイにより達成される、請求項42に記載の方法。
【請求項44】
ゲル電気泳動又はマイクロ流体力学を使用して、前記プローブにハイブリダイズした前記核酸分子を分離することを更に含む、請求項42に記載の方法。
【請求項45】
オリゴヌクレオチドを前記第1の鎖の前記長さにハイブリダイズさせることを更に含む、請求項41に記載の方法。
【請求項46】
前記オリゴヌクレオチドの特徴を測定することであって、前記オリゴヌクレオチドの前記特徴が、前記第2の鎖からオーバーハングしている前記第1の鎖の前記長さに相関する、測定することと、
カットオフ値よりも大きい前記特徴を有する核酸分子を選択して、前記核酸分子のサブセットを得ることと、を更に含む、請求項45に記載の方法。
【請求項47】
前記オリゴヌクレオチドが、カットオフ長さを超えるオリゴヌクレオチドについてのマーカーに結合しており、
前記方法が、
前記マーカーを有する核酸分子を捕捉して、前記核酸分子のサブセットを得ることを更に含む、請求項45に記載の方法。
【請求項48】
前記核酸分子のサブセットを増幅して、核酸分子の増幅されたサブセットを得ることを更に含み、
前記核酸分子のサブセットを分析することが、前記核酸分子の増幅されたサブセットを使用することを含む、請求項47に記載の方法。
【請求項49】
前記核酸分子のサブセットを分析することが、前記核酸分子のサブセットのパラメータの値を判定することを含み、
状態の分類を判定することが、前記パラメータの前記値を使用することを含む、請求項39~48のいずれか一項に記載の方法。
【請求項50】
前記分類を判定することが、前記パラメータの前記値を参照値と比較することを含む、請求項49に記載の方法。
【請求項51】
前記パラメータの前記値が、核酸分子の量又はサイズプロファイルの統計的尺度である、請求項49に記載の方法。
【請求項52】
前記状態が、疾患、障害、妊娠、又は移植状態を含む、請求項51に記載の方法。
【請求項53】
前記状態が、がん、自己免疫疾患、妊娠関連状態、又は移植拒絶である、請求項52に記載の方法。
【請求項54】
生体試料を分析する方法であって、前記方法が、
個体の前記生体試料から無細胞の複数の核酸分子の核酸分子のセットを検出することであって、前記核酸分子のセットの各核酸分子が、所定のタイプのゲノム部位から特定の距離にゲノム位置を有する少なくとも1つの末端を含む、検出することと、
前記核酸分子のセットの各核酸分子の両方の末端に対して、
一方の末端を上流末端として、かつ他方の末端を下流末端として識別することと、
前記特定の距離に上流末端を有する核酸分子の第1の量を判定することと、
前記特定の距離に下流末端を有する核酸分子の第2の量を判定することと、
前記第1の量及び前記第2の量を使用して、分離値を判定することと、
前記分離値を使用して、前記個体の状態のレベルを判定することと、を含む、方法。
【請求項55】
一方の末端を上流末端として、かつ他方の末端を下流末端として分類することが、上流末端よりも前記ゲノム位置についてより高い値を有するとして下流末端を識別することを含む、請求項54に記載の方法。
【請求項56】
前記ゲノム部位が、CTCF結合部位又はDNASE1高感受性部位(DHS)である、請求項54に記載の方法。
【請求項57】
前記個体の前記状態の前記レベルを判定することが、前記分離値を参照値と比較することを含む、請求項54に記載の方法。
【請求項58】
前記参照値が、前記状態を有しない対象からの1つ以上の対照試料から、又は前記状態を有する対象由来の1つ以上の対照試料から判定される、請求項57に記載の方法。
【請求項59】
前記状態が、疾患、障害、妊娠、又は移植状態を含む、請求項54~58のいずれか一項に記載の方法。
【請求項60】
前記状態が、がん、自己免疫疾患、妊娠関連状態、又は移植拒絶である、請求項59に記載の方法。
【請求項61】
前記状態が、膀胱がんである、請求項54~58のいずれか一項に記載の方法。
【請求項62】
前記状態のより重度のレベルが、より大きい分離値と関連付けられる、請求項54~61のいずれか一項に記載の方法。
【請求項63】
前記生体試料が、血液、血漿、血清、尿、又は唾液を含む、請求項54~62のいずれか一項に記載の方法。
【請求項64】
前記核酸分子のセットを識別することが、
前記核酸分子のセットの各核酸分子に対して、
前記核酸分子を配列決定して1つ以上のリードを生成することと、
前記1つ以上のリードを参照ゲノムにアライメントさせて、前記核酸分子のゲノム位置を判定することと、を含む、請求項54~63のいずれか一項に記載の方法。
【請求項65】
生体試料を分析する方法であって、前記方法が、
前記生体試料における第1の無細胞の複数の核酸分子の各核酸分子であって、前記第1の無細胞の複数の核酸分子の各核酸分子が、第1の鎖及び第2の鎖を有する二本鎖であり、各第1の鎖が、前記第2の鎖からオーバーハングしている第1の部分を含み、各第1の部分が、前記第1の鎖の5’末端に存在する、各核酸分子について、
1つ以上のヌクレオチドを含む第1の化合物を前記第1の鎖の前記第1の部分にハイブリダイズさせて、伸長された核酸分子を形成することであって、前記第1の化合物が前記第2の鎖の3’末端に結合して、前記第1の化合物を含む3’末端を有する細長い第2の鎖を形成し、前記第1の化合物が前記第2の鎖と接触しない3’末端を有し、前記第1の化合物における各第1のタイプのヌクレオチドが、前記第2の鎖における前記第1のタイプのヌクレオチドの各々と反対のメチル化状態を有する、形成することと、
前記生体試料において、前記第1の化合物における前記第1のタイプのヌクレオチド又は前記第2の鎖における前記第1のタイプのヌクレオチドのいずれかを第2のタイプのヌクレオチドに変換することであって、前記生体試料が、変換後に第2の無細胞の複数の核酸分子を含み、前記第2の無細胞の複数の核酸分子の各核酸分子が二本鎖であり、第3の鎖及び第4の鎖を含み、各第3の鎖が、前記第4の鎖からオーバーハングしている第1の部分を含み、各第1の部分が、前記第3の鎖の3’末端に存在する、変換することと、
前記第1の化合物における前記第1のタイプのヌクレオチドに対応する1つ以上の部位の各々について第1のメチル化状態を判定することと、を含む、方法。
【請求項66】
前記第2の無細胞の複数の核酸分子の核酸分子の前記第1の部分を除去するように構成された酵素が、前記生体試料に添加されない、請求項65に記載の方法。
【請求項67】
エキソヌクレアーゼが、前記生体試料に添加されない、請求項66に記載の方法。
【請求項68】
前記生体試料が、前記第2の無細胞の複数の核酸分子における前記核酸分子以外の他の鎖からオーバーハングしている1つの鎖の3’末端を有する二本鎖核酸分子を含まず、
前記第2の無細胞の複数の核酸分子の数が、前記第1の無細胞の複数の核酸分子の数の少なくとも50%である、請求項65に記載の方法。
【請求項69】
前記第1のタイプのヌクレオチドが、シトシンである、請求項65に記載の方法。
【請求項70】
前記第1の無細胞の複数の核酸分子の各第1の化合物の長さを、前記第2のタイプのヌクレオチドに隣接する前記第1のタイプのヌクレオチドを識別することによって判定することを更に含む、請求項65に記載の方法。
【請求項71】
前記第1のメチル化状態を使用してメチル化レベルを計算することと、
前記メチル化レベルを使用して不揃い指数値を判定することと、を更に含む、請求項65に記載の方法。
【請求項72】
前記第1の化合物における前記第1のタイプのヌクレオチド又は前記第2の鎖における前記第1のタイプのヌクレオチドのいずれかを変換することが、前記第1の化合物における前記第1のタイプのヌクレオチドを変換することを含み、
前記第1のメチル化状態を判定することが、前記第2のタイプのヌクレオチドの同一性を判定することを含み、
前記第1のメチル化状態が、メチル化されていないと判定される、請求項65に記載の方法。
【請求項73】
前記複数の伸長された核酸分子をリン酸化することと、
前記第2の無細胞の複数の核酸分子をリン酸化することと、
前記伸長された核酸分子にアダプタを加えることと、を更に含む、請求項65に記載の方法。
【請求項74】
前記第1の化合物における前記第1のタイプのヌクレオチド又は前記第2の鎖における前記第1のタイプのヌクレオチドのいずれかを変換することが、前記第1の化合物における前記第1のタイプのヌクレオチド又は前記第2の鎖における前記第1のタイプのヌクレオチドのいずれかのバイサルファイト処理を含む、請求項65に記載の方法。
【請求項75】
前記第1の化合物における前記第1のタイプのヌクレオチド又は前記第2の鎖における前記第1のタイプのヌクレオチドのいずれかを変換することが、前記第2の鎖における前記第1のタイプのヌクレオチドを変換することを含み、
前記方法が、
前記第2の無細胞の複数の核酸分子における前記第1のタイプのヌクレオチドを変換することを更に含む、請求項65に記載の方法。
【請求項76】
尿試料を分析する方法であって、前記方法が、
個体の前記尿試料からの無細胞の複数の核酸分子の各核酸分子の特徴を測定することであって、前記無細胞の複数の核酸分子の各核酸分子が、第1の部分を有する第1の鎖及び第2の鎖を有する二本鎖であり、前記無細胞の複数の核酸分子のうちの少なくともいくつかの前記第1の鎖の前記第1の部分が、前記第2の鎖からオーバーハングしており、前記特徴が、前記第2の鎖からオーバーハングしている前記第1の鎖の長さに相関する、測定することと、
前記測定された特徴の複数の値の各々を有する核酸分子の量を測定することによってヒストグラムを作成することと、
前記ヒストグラムを使用して、複数のピーク量及び複数の局所的最小量を識別することと、
前記複数のピーク量及び前記複数の局所的最小量を使用して不揃い指数値を判定することと、
前記不揃い指数値を使用して、前記個体の状態のレベルを判定することと、を含む、方法。
【請求項77】
測定することが、各核酸分子について、前記第1の鎖、前記第2の鎖、又は前記第1の鎖及び前記第2の鎖の特徴を測定することを含む、請求項76に記載の方法。
【請求項78】
前記不揃い指数値が、前記ピーク量の、前記局所的最小量に対する集合的尺度を含む、請求項76に記載の方法。
【請求項79】
前記ヒストグラムが、表形式にある、請求項76に記載の方法。
【請求項80】
前記特徴が、長さである、請求項76に記載の方法。
【請求項81】
前記状態が、がんである、請求項76に記載の方法。
【請求項82】
前記状態が、腎臓がんである、請求項81に記載の方法。
【請求項83】
前記不揃い指数値が、前記複数の局所的最小量を使用して判定され、前記不揃い指数値が、前記複数のピーク量と前記複数の局所的最小量との間の差の集合的尺度を提供する、請求項76に記載の方法。
【請求項84】
前記不揃い指数値が、前記複数のピーク量の各ピーク量の、少なくとも1つの隣接する局所的最小量との比較を使用して判定される、請求項83に記載の方法。
【請求項85】
前記複数のピーク量が、前記測定された特徴の周期的間隔で現れ、
前記複数の局所的最小量が、前記測定された特徴の周期的間隔で現れる、請求項76に記載の方法。
【請求項86】
前記測定された特徴の前記周期的間隔が、9~11ntの長さに対応する、請求項85に記載の方法。
【請求項87】
前記無細胞の複数の核酸分子が、50~170ntの範囲内のサイズを有する、請求項76に記載の方法。
【請求項88】
前記状態の前記レベルを分類することが、前記不揃い指数値を参照値と比較することを含む、請求項76に記載の方法。
【請求項89】
前記参照値が、前記状態を有する対象の1つ以上の参照試料を使用して判定されるか、又は前記参照値が、前記状態を有しない対象の1つ以上の参照試料を使用して判定される、請求項88に記載の方法。
【請求項90】
コンピュータ製品であって、複数の命令を記憶する非一時的コンピュータ可読媒体を含み、実行されると、コンピュータシステムを制御して、請求項1~89のいずれか一項に記載の方法を実施する、コンピュータ製品。
【請求項91】
システムであって、
請求項90に記載のコンピュータ製品と、
前記コンピュータ可読媒体に記憶された命令を実行するための1つ以上のプロセッサと、を含む、システム。
【請求項92】
請求項1~89のいずれか一項に記載の方法を実行するための手段を含む、システム。
【請求項93】
請求項1~89のいずれか一項に記載の方法を実行するように構成された1つ以上のプロセッサを含む、システム。
【請求項94】
請求項1~89のいずれか一項に記載の方法のステップをそれぞれ実行するモジュールを含む、システム。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本出願は、2021年5月26日に出願された「METHODS USING CHARACTERISTICS OF URINARY AND OTHER DNA」と題された米国仮出願第63/193,508号、及び2020年12月8日に出願された「METHODS USING CHARACTERISTICS OF URINARY AND OTHER DNA」と題された米国仮出願第63/122,669号からの優先権を主張し、それらの非仮出願であり、それらの各々は、あらゆる目的のためにそれらの全体が参照により本明細書に組み込まれる。
【背景技術】
【0002】
無細胞DNAは、分子診断及びモニタリングに特に有用であることが証明されている。無細胞ベースの適用としては、以下が挙げられる:非侵襲的出生前検査(Chiu RKW et al.Proc Natl Acad Sci USA.2008;105:20458-63)、がん検出及びモニタリング(Chan KCA et al.Clin Chem.2013;59:211-24、Chan KCA et al.Proc Natl Acad Sci USA.2013;110:1876-8、Jiang P et al.Proc Natl Acad Sci USA.2015;112:E1317-25)、移植モニタリング(Zheng YW et al.Clin Chem.2012;58:549-58)及び原発組織の追跡(Sun K et al.Proc Natl Acad Sci USA.2015;112:E5503-12;Chan KCA、Snyder MW et al.Cell.2016;164:57-68)。これまでに開発された無細胞核酸分析手法としては、一塩基変位(single nucleotide variant、SNV)、コピー数異常(copy number aberrations、CNA)、ヒトゲノムの無細胞DNA末端位置、又はメチル化マーカーの分析に基づくものが挙げられる。新しい特性を検出するための新しい核酸分析手法を識別し、既存の処方に精度を追加することは有益であると考えられる。
【発明の概要】
【0003】
二本鎖無細胞DNA断片は、しばしば、互いに正確に相補的ではない2本の鎖を有し得る。一方の鎖は、他方の鎖を超えて伸長し、オーバーハングを発生させ得る。これらのオーバーハングは、しばしば、分析で平滑末端(blunt end)を形成するために修復される。しかしながら、これらのオーバーハングによって作成された「不揃い(jagged)末端」は、生体試料の分析に有用であり得る。この文書では、不揃い末端を分析に使用し得る方法、及び不揃い末端を測定する方法について説明する。一例として、尿試料からの無細胞DNAにおける不揃い末端は、非侵襲的かつ正確に状態を診断又は検出するために、使用され得る。
【0004】
試料内の不揃い末端の程度(不揃い末端の量又は長さであり得る)は、個体の状態のレベルを反映し得る。例えば、不揃い末端の程度は、疾患(例えば、がん)、障害、妊娠関連の状態、又は移植状態に関連し得る。いくつかの実施形態では、不揃い末端の程度は、移植の拒絶の可能性を判定し得る。いくつかの実施形態では、特定のゲノム位置における不揃い末端は、状態のレベルを分類するのに有用であり得る。例えば、部位(例えば、CTCF結合部位又はDNASE1高感受性部位[DHS])からある特定の距離にある不揃い末端は、状態のレベルを分類する際に使用され得る。
【0005】
いくつかの実施形態では、断片の末端の密度は、状態のレベルを分類する際に使用され得る。断片は、ゲノム座標に基づいて、上流にある末端及び下流にある別の末端を有し得る。ある特定のゲノム位置(例えば、特定の部位から特定の距離)では、上流末端の数及び下流末端の数が、状態のレベルを分類する際に使用され得る。上流末端の量と下流末端の量の差が、使用され得る。
【0006】
いくつかの実施形態では、不揃い末端は、改善された技術によって分析され得る。その技術は、二本鎖DNAのオーバーハング3’末端をトリミングするのを回避する。オーバーハング3’末端をトリミングするのを回避することによって、5’オーバーハング末端、特に、短い突出末端の分析が予想外に改善される。短い突出末端のより正確なカウントによって、不揃い末端長さの分析は、より正確になり、生体試料の改善された分析を提供することができる。
【0007】
いくつかの実施形態では、DNA断片は、オーバーハングの長さに対応するDNA断片の量を有する周期的パターンを示す。異なる不揃い末端長さでのDNAの量の周期性を分析して、生体試料の特性を判定することができる。例えば、周期性は、状態のレベルを判定するように使用され得る。
【0008】
本発明の実施形態の性質及び利点に関するより良好な理解は、以下の詳細な説明及び添付の図面を参照して得ることができる。
【図面の簡単な説明】
【0009】
【
図1】本発明の実施形態による、尿DNAの不揃い末端分析のためのワークフローの概略図を示す。
【
図2】本発明の実施形態による、血漿DNAの不揃い末端の直接評価を示す。
【
図3A】本発明の実施形態による、血漿DNAと尿DNAとの間の不揃い状態の比較を示す。
【
図3B】本発明の実施形態による、血漿DNAと尿DNAとの間の不揃い状態の比較を示す。
【
図4A】本発明の実施形態による、血漿DNAと尿DNAとの間の断片化パターンを示す。
【
図4B】本発明の実施形態による、血漿DNAと尿DNAとの間の断片化パターンを示す。
【
図5A】本発明の実施形態による、尿DNAにおける不揃い指数-非メチル化(JI-U)値の膀胱がんとの関係を示す。
【
図5B】本発明の実施形態による、尿DNAにおける不揃い指数-非メチル化(JI-U)値の膀胱がんとの関係を示す。
【
図5C】本発明の実施形態による、尿DNAにおける不揃い指数-非メチル化(JI-U)値の膀胱がんとの関係を示す。
【
図5D】本発明の実施形態による、尿DNAにおける不揃い指数-非メチル化(JI-U)値の膀胱がんとの関係を示す。
【
図6】本発明の実施形態による、尿試料を分析するように不揃い末端指数値を使用する方法を示す。
【
図7A】本発明の実施形態による、末端密度とヌクレオソームトラックとの間の関係を示す。
【
図7B】本発明の実施形態による、末端密度とヌクレオソームトラックとの間の関係を示す。
【
図8】本発明の実施形態による、CTCF結合部位に対する尿DNAについての末端密度のグラフである。
【
図9】本発明の実施形態による、異なる膀胱がん状態にわたる末端密度の累積差の箱ひげ図である。
【
図10A】本発明の実施形態による、末端密度メトリックを使用して、がんを有する患者と有しない患者とを差別化するためのROC曲線を示す。
【
図10B】本発明の実施形態による、末端密度メトリックを使用して、がんを有する患者と有しない患者とを差別化するためのROC曲線を示す。
【
図11】本発明の実施形態による、末端密度情報を使用して、個体から得られた生体試料を分析して、状態のレベルを分類する方法を示す。
【
図12】本発明の実施形態による、妊婦の母体由来尿DNAと胎児由来尿DNAとの間のJI-U値を示す。
【
図13A】本発明の実施形態による、腎臓移植、造血幹細胞移植(hematopoietic stem cell transplantation、HSCT)、及び肝臓移植による患者におけるレシピエント由来のDNAとドナー由来のDNAとの間のJI-U値を示す。
【
図13B】本発明の実施形態による、腎臓移植、造血幹細胞移植(hematopoietic stem cell transplantation、HSCT)、及び肝臓移植による患者におけるレシピエント由来のDNAとドナー由来のDNAとの間のJI-U値を示す。
【
図13C】本発明の実施形態による、腎臓移植、造血幹細胞移植(hematopoietic stem cell transplantation、HSCT)、及び肝臓移植による患者におけるレシピエント由来のDNAとドナー由来のDNAとの間のJI-U値を示す。
【
図14】本発明の実施形態による、ある特定の不揃い指数値を有するDNAを選択することによって生体試料を濃縮する方法を示す。
【
図15】本発明の実施形態による、急性拒絶を有する及び有しない腎臓移植患者間の尿DNAのJI-U値を示す。
【
図16】本発明の実施形態による、個体からの生体試料を分析して移植状態を分類する方法を示す。
【
図17A】本発明の実施形態による、不揃い末端とヌクレオソームトラックとの間の関係を示す。
【
図17B】本発明の実施形態による、不揃い末端とヌクレオソームトラックとの間の関係を示す。
【
図18】本発明の実施形態による、MIBCを有する患者と膀胱がんを有しない患者とを差別化するための受信者操作特徴(receiver operating characteristic、ROC)プロットを示す。
【
図19A】本発明の実施形態による、これらのヒストン修飾に関連するゲノム領域に由来する尿DNAの不揃い末端を分析することからの結果を示す。
【
図19B】本発明の実施形態による、これらのヒストン修飾に関連するゲノム領域に由来する尿DNAの不揃い末端を分析することからの結果を示す。
【
図20】本発明の実施形態による、ある特定のゲノム位置でのJI-U値を使用して、個体から得られた生体試料を分析して、状態のレベルを分類する方法を示す。
【
図21A】本発明の実施形態による、以前のJag-seq方法及び新しいJag-seqII方法を示す。
【
図21B】本発明の実施形態による、以前のJag-seq方法及び新しいJag-seqII方法を示す。
【
図22A】本発明の実施形態による、5’突出不揃い末端を有するスパイクイン分子に対するJag-seq技術及びJag-seqII技術の使用の効果を示す。
【
図22B】本発明の実施形態による、5’突出不揃い末端を有するスパイクイン分子に対するJag-seq技術及びJag-seqII技術の使用の効果を示す。
【
図22C】本発明の実施形態による、5’突出不揃い末端を有するスパイクイン分子に対するJag-seq技術及びJag-seqII技術の使用の効果を示す。
【
図22D】本発明の実施形態による、5’突出不揃い末端を有するスパイクイン分子に対するJag-seq技術及びJag-seqII技術の使用の効果を示す。
【
図22E】本発明の実施形態による、5’突出不揃い末端を有するスパイクイン分子に対するJag-seq技術及びJag-seqII技術の使用の効果を示す。
【
図22F】本発明の実施形態による、5’突出不揃い末端を有するスパイクイン分子に対するJag-seq技術及びJag-seqII技術の使用の効果を示す。
【
図23】本発明の実施形態による、尿cfDNAにおける異なるサイズ範囲にわたるリード2(JI-M)におけるCHメチル化レベルのプロファイルのグラフを示す。
【
図24A】本発明の実施形態による、尿cfDNAにおける異なるサイズ範囲にわたる平均及び中央不揃い末端長さを示す。
【
図24B】本発明の実施形態による、尿cfDNAにおける異なるサイズ範囲にわたる平均及び中央不揃い末端長さを示す。
【
図25A】本発明の実施形態による、膀胱がん対象及び対照対象についてのJI-M及び平均不揃い末端長さについての箱ひげ図を示す。
【
図25B】本発明の実施形態による、膀胱がん対象及び対照対象についてのJI-M及び平均不揃い末端長さについての箱ひげ図を示す。
【
図26】本発明の実施形態による、試料における断片の3’末端をトリミングすることなく、個体から得られた生体試料を分析する方法である。
【
図27】本発明の実施形態による、尿中にCCタグ技術によって推定される不揃い末端長さの分布のグラフを示す。
【
図28】本発明の実施形態による、異なる断片サイズにわたる不揃い末端長さの周期性指数のグラフを示す。
【
図29A】本発明の実施形態による、腎臓細胞がん(renal cell cancer、RCC)を有する対象から対照対象を区別する際に周期性指数及び平均不揃い末端長さを使用することからの結果を示す。
【
図29B】本発明の実施形態による、腎臓細胞がん(renal cell cancer、RCC)を有する対象から対照対象を区別する際に周期性指数及び平均不揃い末端長さを使用することからの結果を示す。
【
図29C】本発明の実施形態による、腎臓細胞がん(renal cell cancer、RCC)を有する対象から対照対象を区別する際に周期性指数及び平均不揃い末端長さを使用することからの結果を示す。
【
図30】本発明の実施形態による、ヘパリンインキュベーション処理を用いた尿cfDNAのサイズプロファイルを示す。
【
図31】本発明の実施形態による、ヘパリンインキュベーション処理を用いた尿cfDNAにおける不揃い末端長さ分布を示す。
【
図32A】本発明の実施形態による、尿中の異なるEDTA及びヘパリン処理についてのJI-M、平均不揃い末端長さ、及び周期性指数の分析を示す。
【
図32B】本発明の実施形態による、尿中の異なるEDTA及びヘパリン処理についてのJI-M、平均不揃い末端長さ、及び周期性指数の分析を示す。
【
図32C】本発明の実施形態による、尿中の異なるEDTA及びヘパリン処理についてのJI-M、平均不揃い末端長さ、及び周期性指数の分析を示す。
【
図33】本発明の実施形態による、DNA断片における不揃い末端長さの周期性を使用した生体試料を分析する方法である。
【
図34】本発明の実施形態による、測定システムを示す。
【
図35】本発明の実施形態による、システム及び方法によって使用可能な例示的なコンピュータシステムのブロック図を示す。
【発明を実施するための形態】
【0010】
用語
「組織」は、機能単位としてともにグループ化する細胞の群に対応する。2つ以上のタイプの細胞が、単一の組織内に見出され得る。異なるタイプの組織は、異なるタイプの細胞(例えば、肝細胞、肺胞又は血球)からなり得るが、異なる生物(母親対胎児)からの組織又は健常細胞対腫瘍細胞に対応し得る。「参照組織」は、組織特異的メチル化レベルを判定するように使用される組織に対応し得る。異なる個体からの同じ組織タイプの複数の試料を使用して、その組織タイプの組織特異的メチル化レベルを判定することができる。
【0011】
「器官」は、同様の機能を有する組織の群に対応する。1つ以上のタイプの組織が、単一の器官内に見出され得る。器官は、心血管系、消化器系、内分泌系、排泄系、リンパ系、外皮系、筋肉系、神経系、生殖系、呼吸器系、及び骨格系を含む、異なる器官系の一部であり得る。
【0012】
「生体試料」は、対象(例えば、妊婦、がんを有する人、若しくはがんを有すると疑われる人、臓器移植レシピエント)、又は器官が関与する疾患過程(例えば、心筋梗塞における心臓、卒中における脳、若しくは貧血における造血系)を有すると疑われる対象から採取され、目的の1つ以上の核酸分子を含有する何らかの試料を指す。生体試料は、血液、血漿、血清、尿、膣液、陰のう水腫からの(例えば、精巣の)流体、膣洗浄流体、胸水、腹水、脳脊髄液、唾液、汗、涙、痰、気管支肺胞洗浄液、乳首からの分泌液、体の異なる部分(例えば、甲状腺、乳房)からの吸引液などの体液であり得る。便試料もまた、使用され得る。様々な実施形態では、無細胞DNAについて濃縮された生体試料(例えば、遠心分離プロトコルを介して取得された血漿試料)におけるDNAの大部分は、無細胞であり得、例えば、DNAの50%超、60%超、70%超、80%超、90%超、95%超、又は99%超は、無細胞であり得る。遠心分離プロトコルは、例えば、3,000g×10分で流体部分を取得することと、残留細胞を除去するために30,000gで更に10分間再遠心分離することと、を含み得る。
【0013】
「配列リード」は、核酸分子の任意の部分又は全部から配列決定されたヌクレオチドの鎖を指す。例えば、配列リードは、核酸断片から配列決定されたヌクレオチドの短鎖(例えば、約20~150個)、核酸断片の一方又は両方の末端におけるヌクレオチドの短鎖、又は生体試料中に存在する核酸断片全体の配列決定であり得る。配列リードは、例えば、配列決定技術を使用した、又はプローブを使用した種々の方法で、例えば、ハイブリダイゼーションアレイ若しくは捕捉プローブで、又は単一プライマー若しくは等温増幅を使用した、ポリメラーゼ連鎖反応(polymerase chain reaction、PCR)若しくは線形増幅などの増幅技術で、取得され得る。
【0014】
「部位」(「ゲノム部位」とも呼ばれる)は、単一の塩基位置、又は相関する塩基位置の群、例えば、CpG部位、又は相関する塩基位置のより大きい群であり得る、単一の部位に対応する。「遺伝子座」は、複数の部位を含む領域に対応し得る。遺伝子座は、遺伝子座をその文脈における部位と等価にするただ1つの部位を含み得る。
【0015】
各ゲノム部位(例えば、CpG部位)に対する「メチル化指数」又は「メチル化状態」は、その部位におけるメチル化を、その部位を覆う総リード数にわたって示す、DNA断片の割合(例えば、配列リード又はプローブから判定される)を指し得る。「リード」は、DNA断片から取得された情報(例えば、部位におけるメチル化状態)に対応し得る。特定のメチル化状態のDNA断片と優先的にハイブリッド形成する試薬(例えば、プライマー又はプローブ)を用いて、読み取りを得ることができる。典型的には、そのような試薬は、DNA分子のメチル化状態、例えば、バイサルファイト変換、又はメチル化感受性制限酵素、又はメチル化結合タンパク質、又は抗メチルシトシン抗体、又はメチルシトシン及びヒドロキシメチルシトシンを認識する一分子配列決定技術に応じて、DNA分子を差別的に修飾するか、又は差別的に認識するプロセスにより処理後に適用される。
【0016】
領域の「メチル化密度」は、この領域における部位をカバーする総リード数で除算した、メチル化を示す領域内の部位でのリード数を指し得る。この部位は、具体的な特徴、例えば、CpG部位、を有し得る。したがって、領域の「CpGメチル化密度」は、この領域におけるCpG部位(例えば、特定のCpG部位、CpGアイランド内又はそれより大きい領域内のCpG部位)をカバーする総リード数で除算したCpGメチル化を示すリード数を指し得る。例えば、ヒトゲノム中の各100kbビンについてのメチル化密度は、100kb領域にマッピングされた配列リードによってカバーされた全てのCpG部位の割合として、CpG部位においてバイサルファイト処理後に変換されていないシトシン(メチル化されたシトシンに対応する)の総数から判定され得る。この分析はまた、例えば、500bp、5kb、10kb、50kb、又は1Mbなどの他のビンサイズに対して実施され得る。領域は、全ゲノム、又は染色体若しくは染色体の一部(例えば、染色体腕)であり得る。CpG部位のメチル化指数は、領域がそのCpG部位のみを含む場合に、その領域についてのメチル化密度と同じである。「メチル化シトシンの割合」は、領域において、分析されたシトシン残基の総数にわたって、メチル化されている(例えば、バイサルファイト変換後に変換されていない)、すなわち、CpGコンテキスト外のシトシンを含む、ことが示されるシトシン部位の数、「C」、を指し得る。メチル化指数、メチル化密度及びメチル化シトシンの割合は、「メチル化レベル」の例である。バイサルファイト変換とは別に、当業者に既知の他のプロセス(メチル化状態に感受性のある酵素(例えば、メチル化感受性制限酵素)、メチル化結合タンパク質、メチル化状態に感受性のあるプラットフォームを使用する(例えば、ナノポア配列決定(Schreiber et al.Proc Natl Acad Sci 2013;110:18910-18915)、及びPacific Biosciences単一分子配列決定による(Flusberg et al.Nat Methods 2010;7:461-465))を含むが、それらに限定されない)を使用して、DNA分子のメチル化状態を調べることができる。
【0017】
「配列決定深度」という用語は、遺伝子座が、その遺伝子座にアライメントされた配列リードによってカバーされる回数を指す。遺伝子座は、ヌクレオチドの小ささ、又は染色体腕の大きさ、又はゲノム全体の大きさであり得る。配列決定深度は、50x、100xなどと表され得、「x」は、遺伝子座が配列リードでカバーされる回数を指す。配列決定深度はまた、複数の遺伝子座、又はゲノム全体に適用することもでき、この場合、xは、それぞれ、遺伝子座若しくはハプロイドゲノム、又はゲノム全体が配列決定される平均回数を指し得る。ウルトラディープ配列決定は、少なくとも100xの配列決定深度を指し得る。
【0018】
「分離値」は、2つの値を伴う差又は比、例えば、2つの分率寄与又は2つのメチル化レベルに対応する。分離値は、単純な差又は比であり得る。例としては、x/yの正比は、x/(x+y)と同様に、分離値である。分離値は、他の係数、例えば、乗算係数を含み得る。他の例としては、値の関数の差又は比、例えば、2つの値の自然対数(ln)の差又は比が使用され得る。分離値は、差及び比を含み得る。
【0019】
本明細書で使用される「分類」という用語は、試料の特定の特性と関連付けられた任意の数又は他の特徴を指す。例えば、「+」という記号(又は「陽性」という単語)は、試料が欠失又は増幅を有するとして分類されることを意味し得る。分類は、二者択一(例えば、陽性若しくは陰性)であり得、又はより多くのレベルの分類(例えば、1~10若しくは0~1のスケール)を有し得る。「カットオフ」及び「閾値」という用語は、ある操作において使用される所定の数を指す。例えば、カットオフサイズは、断片が除外されるサイズ超のサイズを指し得る。閾値は、特定の分類が適用されるのを上回る又は下回る値であり得る。これらの用語のいずれかは、これらの文脈のいずれかにおいて使用され得る。
【0020】
DNA分子を記載する場合の「損傷」という用語は、DNAニック、二本鎖DNA中に存在する一本鎖、二本鎖DNAのオーバーハング、酸化グアニンによる酸化的DNA修飾、脱塩基部位、チミジン二量体、酸化ピリミジン、ブロックされた3’末端、又は不揃い末端を指し得る。
【0021】
「不揃い末端」という用語は、DNAの粘着性末端、DNAのオーバーハング、又は二本鎖DNAがDNAの他の鎖にハイブリダイズしていないDNAの鎖を含む場合を指し得る。「不揃い末端値」又は「不揃い指数」は、不揃い末端の範囲の尺度である。不揃い末端値は、二本鎖DNAにおいて第2の鎖からオーバーハングした1本の鎖の平均長さに相関(例えば、比例)し得る。複数のDNA分子の不揃い末端値は、DNA分子間の平滑末端の考慮を含み得る。
【0022】
いくつかの例では、不揃い指数値は、ある鎖が複数の無細胞DNA分子において別の鎖にオーバーハングする集合的尺度を提供し得る。不揃い状態の集合的尺度は、複数の無細胞DNA分子におけるオーバーハングの推定長さ、例えば、無細胞DNA分子の各々の個々の測定値の平均、中央値、又は他の集合的尺度に基づいて判定され得る。いくつかの例では、不揃い状態の集合的尺度は、特定の断片サイズ範囲(例えば、130~160bps、200~300bps)について判定される。いくつかの例では、不揃い状態の集合的尺度は、複数の無細胞DNA分子の末端に近接するメチル化シグナル変化に基づいて判定され得る。
【0023】
「アライメント」という用語及び関連する用語は、配列を参照配列に一致させることを指し得る。参照配列は、参照ゲノム(例えば、ヒトゲノム)又は特定の分子の配列であり得る。そのような参照配列は、少なくとも100kb、1Mb、10Mb、50Mb、100Mb、及びそれ以上を含み得る。そのようなアライメント方法は、手動で実施され得ず、専門のコンピュータソフトウェアによって実施される。アライメントは、長く多数の配列(例えば、少なくとも1,000、10,000、100,000、1,000,000、10,000,000、又は100,000,000個の配列)を伴い得る。更に、アライメントは、配列自体内の可変性又は配列リード内のエラーを伴い得る。したがって、そのような変動性又はエラーを伴うアライメントは、参照配列との正確な一致を必要としない場合がある。
【0024】
「リアルタイム」という用語は、ある特定の時間制約内で完了されるコンピューティング動作又はプロセスを指し得る。時間制約は、1分、1時間、1日、又は7日であり得る。
【0025】
無細胞DNAは、非ランダムに断片化されることが報告されている(Lo et al.,Sci Transl Med.2010;2:61ra91)。ごく最近では、二本鎖血漿無細胞DNAが、不揃い末端と呼ばれる一本鎖末端を担持することが見出された。血漿DNA不揃い末端の特徴は、非侵襲性出生前検査及びがん検出のためのバイオマーカーとして役立ち得る。血漿DNA及び尿DNAの断片化パターンは異なる。例えば、尿DNA分子は、血漿DNA分子よりも短い(Tsui et al.PLoS One.2012;7:e48319)。更に、更なる調査のための尿DNA分子の態様には、(1)尿DNA中の不揃い末端の程度、(2)バイオマーカー(例えば、膀胱がん検出のための)としての尿DNA不揃い末端の使用、(3)更なる臨床状況における尿DNA不揃い末端の実装、が含まれる。任意の特定の理論に拘束されることを意図するものではないが、不揃い末端は、無細胞DNAがどのように断片化されるかに関連し得ると考えられる。例えば、DNAは段階的に断片化する場合があり、不揃い末端のサイズは、断片化の段階を反映し得る。不揃い末端の数及び/又は不揃い末端のオーバーハングのサイズを使用して、無細胞DNAを有する生物学的試料を分析し、試料及び/又は試料が得られた個体に関する情報を提供し得る。
【0026】
特定の器官又は組織で細胞死を引き起こす異なる病原性の理由により、無細胞DNA分子に存在するDNA損傷の相対的な表現が変化することがある。例えば、二本鎖DNAのオーバーハングは、原発組織との関係を有する。したがって、無細胞DNA損傷を分析するための本発明の実施形態は、がん検出、器官損傷、免疫疾患、及び移植状態(これらに限定されないが)を検出又はモニタするため、並びに非侵襲的出生前検査を実施するための新たな可能性を提供する。
【0027】
実施形態は、生体試料を分析するために、不揃い末端の程度、不揃い末端の密度、及び/又は不揃い末端の周期性を使用することを含む。不揃い末端は、ある特定のゲノム部位、又はある特定のゲノム部位からのある特定の距離であり得るある特定の位置で分析され得る。ゲノム部位は、クロマチン中のタンパク質の改変に関連付けられるか、又はタンパク質相互作用に関連付けられる部位であり得る。不揃い末端のこれらの分析は、個体の状態のレベルを判定する際の精度を改善し得る。
【0028】
非従来技術は、生体試料の分析において不揃い末端を測定するために使用され得る。いくつかの実施形態では、本発明者らは、DNA末端修復を使用して、非メチル化シトシン又はメチル化シトシンがDNA末端修復措置において使用されたかどうかに依存して、元の配列と不揃い末端との間に差別的メチル化シグナルを導入し、その後、バイサルファイト配列決定を行った。
【0029】
いくつかの実施形態では、オーバーハング5’末端が分析される場合、オーバーハング3’末端は、平滑末端化されない場合がある。予想外に、3’末端の平滑末端化を回避することにより、分析するのに利用可能なオーバーハング5’末端の量が増加される。その結果、生体試料の分析が改善され得る。
【0030】
I.不揃い末端の検出
尿DNAの不揃い末端は、間接的に及び直接的に含むいくつかの様式で検出され得る。尿DNAは、ヌクレオチドにおいて意図的にメチル化又は非メチル化され得る。不揃い末端は、末端修復を伴わないDNA断片とは反対のメチル化状態を有するヌクレオチドを使用して修復され得る。次いで、メチル化レベルは、尿DNA断片についての不揃い末端の程度の指標を与える。断片中のある特定の長さの既知の配列にハイブリダイズする合成プローブが使用され得る。更に、不揃い長さは、二本鎖DNAの末端にアダプタを加え、二本鎖DNAの一本鎖を配列判定し、次いで、一方の鎖の配列を他方の鎖にアライメントさせてオーバーハングを判定することによって、直接判定され得る。
【0031】
A.メチル化の使用
図1は、尿DNA不揃い末端分析についてのワークフローの概略図を示す。一実施形態では、尿DNAの5’オーバーハング不揃い末端は、不揃い末端の末端修復プロセス中に組み込まれた非メチル化シトシンに基づいて推定され得る。いくつかの実施形態では、3’末端は、突出不揃い末端であり得る。不揃い末端はまた、オーバーハング末端又は粘着性末端とも呼ばれる。
【0032】
ステージ110では、不揃い末端を有するDNA分子は、尿試料を含む生体試料から抽出され得る。生体試料は、個体から得られ得る。塗りつぶされたロリポップは、メチル化されたCpG部位を表す。
【0033】
ステージ120では、DNA分子は、末端修復を受け得る。不揃い末端は、ヌクレオチド(すなわち、dNTP)で充填された。塗りつぶされていないロリポップは、非メチル化CpG部位を表す。破線は、新たに充填されたヌクレオチドを表す。末端修復されたDNA分子は更に、バイサルファイト配列決定に供された。新たに充填されたヌクレオチド中の非メチル化Cは、TとしてPCRによって増幅されるウラシル(U)に変換され得るが、分子内に存在する元のメチル化Cは未修飾のままである。したがって、元のDNA分子中のCpGシトシンは、概して、メチル化され得るが、尿DNAの3’末端(又は他の実施形態では、5’末端)に近接する新たに合成された鎖に末端修復プロセスによって組み込まれたCpGシトシンはメチル化されていない場合がある。したがって、不揃い末端の修復は、3’末端(又は他の実施形態では、5’末端)に近い領域におけるメチル化レベルを低下させる。末端修復分子のバイサルファイト配列決定は、両端におけるメチル化レベルの尺度を提供して、不揃い末端の長さの尺度を提供することができる。
【0034】
いくつかの実施形態では、少なくとも1,000個の無細胞DNA分子が修復される。他の実施形態では、少なくとも10,000個又は50,000個又は100,000個又は500,000個又は1,000,000個又は5,000,000個、又はそれより多い無細胞DNA分子が修復され得る。
【0035】
ステージ130では、DNAの不揃い状態が分析される。CpGメチル化シグナルに基づいて不揃い状態を定量化するために、本発明者らは、CpG部位にわたる非メチル化シトシンにおけるリード1とリード2との間の差を利用して、不揃い指数-非メチル化(JI-U)と称される不揃い状態を反映させた。リード1は、ステージ120における上部の鎖の青色の末端に対応する。リード2は、ステージ120における上部の鎖の破線の赤色の末端に対応する。JI-Uは、以下の式により計算され、
【0036】
【0037】
式中、M1は、断片中の位置から、5’尿DNA末端に近接する、30個の塩基が寄与するメチル化密度を表し、M2は、断片中の位置から、3’尿DNA末端に近接する、30個の塩基が寄与するメチル化密度を表す。
いくつかの実施形態では、尿不揃い末端、並びにそれらの組み合わせを評価するために、3’尿DNA末端に近接する、1個の塩基、2個の塩基、3個の塩基、4個の塩基、5個の塩基、10個の塩基、20個の塩基、40個の塩基、50個の塩基など(それらに限定されない)を使用することができる。メチル化密度M1及びM2は、異なるDNA断片にわたるメチル化密度の統計値(例えば、平均値、中央値、最頻値、又はパーセンタイル)であり得る。より高いJI-Uは、リード1とリード2との間のメチル化の差の増加に対応する。より高いJI-Uは、DNA断片についてより多くの不揃い末端を示し得る。
【0038】
ステージ140では、JI-Uパターンが分析される。例として、本発明者らは、膀胱がんを有する患者(n=46)と膀胱がんを有しない患者(対照、n=39)との間の尿DNAのJI-U分布、及びCTCF結合部位周辺のJI-Uパターンを試験した。JI-Uは、CTCF結合部位までの距離とともに変化することが理解される。JI-Uと結合部位との間の関係は、本開示において後に考察される。更に、JI-Uは、生体試料のタイプ(例えば、血漿対尿)に依存することが観察される。移植された組織を有する対象では、JI-Uは、移植される組織のタイプ及び拒絶の可能性に基づいて変化する。
【0039】
いくつかの実施形態では、元のDNA断片のヌクレオチド(例えば、シトシン)は、メチル化されていない場合がある。不揃い末端は、メチル化されたヌクレオチド(例えば、シトシン)で充填され得る。これらの条件下で、不揃い指数メチル化(Jagged Index-Methylated、JI-M)を使用することができる。ステージ130では、リード1はメチル化されておらず、したがって、M1は0であるか又は0に近い。リード2は、メチル化されており、非0であるか又は0を有意に上回る。したがって、JI-Mは、リード2のメチル化レベルと等価(又は比例)であり得る。
【0040】
B.プローブの使用
いくつかの実施形態では、DNAの不揃い状態は、メチル化シグナルを使用することなく判定され得る。例えば、合成プローブを使用することができる。合成プローブは、断片中の既知の配列のある特定の長さにハイブリダイズする部分を含み得る。様々な長さの相補的部分を有する複数のプローブを使用することができる。プローブは、相補的部分の長さ、したがって、プローブにハイブリダイズした不揃い末端の長さを識別する分子タグを含み得る。分子タグを配列決定して、不揃い末端のサイズを判定することができる。
【0041】
例として、不揃い末端は、Aluの24bpの共通配列に存在するものとして認識され得る。異なる長さのプローブは、共通配列の少なくとも一部分に相補的であるように設計され得る。例えば、1つのプローブは、共通配列の13個の連続したヌクレオチドに相補的な配列を含み得、別のプローブは、共通配列の22個の連続したヌクレオチド(13個の連続したヌクレオチドを含む22個の連続したヌクレオチドを有する)に相補的な配列を含み得る。1~24個のヌクレオチドの他のプローブの長さが使用され得る。これらの相補的配列は、更に、分子タグと連結され得る。分子タグは、バーコードと同様に、13ntの不揃い末端を有する合成DNAを22ntの不揃い末端を有する合成DNAから差別化することを可能にする多数のヌクレオチド(例えば、6個)の鎖であり得る。ハイブリダイズしたDNAは、配列決定され、かつアライメントされ得る。各分子タグに関連付けられるリードの数は、ある特定の長さの不揃い末端を有する断片の数を示し得る。
【0042】
C.アダプタのアライメント
いくつかの実施形態では、不揃い末端の長さは、直接判定され得る。不揃い末端の長さを直接判定することは、二本鎖DNAの末端にアダプタを加えること、二本鎖DNAから一本鎖DNAを形成すること、得られた一本鎖DNAを配列決定すること、次いで、一方の鎖の配列を他方の鎖にアライメントさせることを含み得る。アダプタのアライメントを使用して、不揃い末端におけるオーバーハングの量を判定することができる。
【0043】
図2は、血漿DNAの環状化による血漿DNA粘着性末端/オーバーハングの直接評価の実施形態を示す。血漿DNAは、一本鎖DNA(ssDNA)リガーゼを介して一本鎖DNAアダプタ(黄色)でライゲーションされる。バイサルファイト処理により、ワトソン(上部の鎖)及びクリック鎖(下部の鎖)はもはや相補的ではなくなり、これは、両方の鎖における非CpG部位からのほとんど全てのシトシンがウラシルに変換され、環状の一本鎖DNA分子が形成されるためである。このような環状化一本鎖DNAは、3’配列決定アダプタ(例えば、Illumina P7、青色)でタグ付けされたランダムプライマー(例えば、5-mer)を使用して増幅され得、一本鎖DNAアダプタ(黄色)を含み得る多数の線状DNA分子を生成する。最初にライゲーションされた一本鎖アダプタに隣接するDNA配列は、不揃い末端を推測することを可能にする。線状DNA分子を配列決定に適したものにするために、5’配列決定アダプタ(赤色、例えば、Illumina P5、赤色)がアニーリング及びPCRベースの伸長によって組み込まれる。次に、P5及びP7アダプタでタグ付けされた分子が増幅され、配列決定される。元の一本鎖アダプタ(黄色)に隣接する配列(「a」及び「b」は赤い矢印で示されている)は、概略図に示されているように「a」及び「b」配列の相対的な位置を調べることにより、アライメント又は自己相補性分析によって判定される。環状分子の「c」及び「d」配列は、「a」及び「b」配列の分析に使用されるのと同様の戦略で分析することができる。DNAを環状化し、自己相補性分析を使用する他の技術も可能である。
【0044】
メチル化レベルの測定を伴わない実施形態では、不揃い末端の長さを使用して、指数を判定することができる。長さの統計値は、平均値、中央値、最頻値、又はパーセンタイルを含む指数として使用され得る。
【0045】
II.血漿DNAと尿DNAとの間の不揃い状態における差
尿DNAは、血漿DNAとは異なる不揃い状態を示すことが観察される。尿DNAは、概して、血漿DNAよりも高い不揃い状態を示した。更に、尿DNAは、ほとんどのサイズのDNA断片において、血漿中DNAよりも多い不揃い状態を示した。尿DNAはまた、異なるサイズについて不揃い状態の周期性を示すことが観察された。
【0046】
A.Jagged末端及びメチル化レベルの比較
図3A及び
図3Bは、血漿DNAと尿DNAとの間の不揃い状態の比較を示す。
図3Aは、妊婦の血漿中DNAと血尿を有する対照対象の尿DNAとの間のJI-U値をグラフで示す。y軸は、不揃い指数-非メチル化(jagged index-unmethylated、JI-U)である。x軸は、血漿中DNA(30人の対象)及び尿DNA(39人の対象)についての結果を示す。
図3Aは、血尿を有する対照対象の尿DNAのJI-U値(中央値:35.8、範囲:21.3~60.0)が、妊婦の血漿DNAのJI-U値(中央値:21.7、範囲:14.7~26.2)(P値<0.0001、マン-ホイットニーU検定)よりも1.6倍高かったことを示す。
【0047】
図3Bは、無細胞DNA断片の最初の30個のヌクレオチド及び最後の30個のヌクレオチドにおける異なる遺伝子座にわたる血漿中(青色三角)DNAと尿(赤色丸)DNAとの間のメチル化レベルをグラフで示す。y軸は、メチル化レベルを全てのCpG部位のパーセンテージとして示す。x軸は、断片の鎖の5’末端及び3’末端両方のヌクレオチド位置を示す。「nt」は、ヌクレオチドを表す。本出願において、「nt」及びヌクレオチドは、塩基と互換的に使用され得る。「5’末端に対して30nt近位」については、より高いヌクレオチド数は、より低いヌクレオチド数よりも5’末端から遠い。「3’末端に対して30nt近位」については、より低いヌクレオチド数は、より高いヌクレオチド数よりも3’末端から遠い。全てのアライメントされたペアエンドリードをプールした後に、リード1及びリード2において異なるCpG部位にわたるメチル化レベルを分析することによって、本発明者らは、尿DNA分子の3’末端に近位のメチル化レベルが、血漿DNA分子のメチル化レベルよりも低下したことを観察した。これらの結果は、尿DNAが、血漿中DNAと比較した場合に、より不揃い末端を有することを示した。
【0048】
B.不揃い末端によるサイズ分析
図4A及び
図4Bは、血漿DNA及び尿DNA間の断片化パターンを示す。
図4Aは、妊婦の血漿DNA(青色線404)及び対照対象の尿DNA(赤色線408)のサイズ分布を示す。対象は、
図3A及び
図3Bにおいて分析された同じ対象である。x軸は、断片のサイズを塩基対で示す。断片のサイズは、文脈上特に指示がない限り、末端修復後の分子の最も外側のヌクレオチドに基づき得る。y軸は、特定のサイズの断片の頻度を示す。
図4Aは、尿DNA及び血漿DNA間のサイズプロファイルが顕著に異なっていたことを示す。尿DNAは、血漿中DNAよりも断片化されていた。
【0049】
図4Bは、複数の断片サイズにわたるJI-U値を示す。x軸は、断片のサイズを塩基対で示す。y軸は、JI-Uを示す。60~600bpの範囲にある各サイズにわたる尿DNA(赤色線412)のJI-U値はほぼ全て、血漿DNA(青色線416)のJI-U値よりも高かった。興味深いことに、血漿DNAのJI-Uプロファイルは、小分子について、約165bp間隔(すなわち、およそ1ヌクレオソーム単位)でのいくつかの強く振動する主要ピーク及び約10bp周期性での一連の弱く振動するマイナーピークを示し、一方、尿DNAは、弱く振動する主要ピークを示したが、強く振動するマイナーピークが存在した。この異なる挙動は、尿DNAの不揃い末端及び血漿DNAの不揃い末端が臨床的に異なる様式で実施され得ることを示唆し得る。例えば、いくつかの実施形態では、ある特定のサイズ範囲の不揃い末端の選択的分析は、尿DNA不揃い末端に基づく試験についての性能を向上させ得る。
【0050】
III.がん及び非がん間の差別的不揃い状態
膀胱腫瘍DNA分子は、膀胱がんを有する患者からの尿DNAに存在し(Cheng et al.,Clin Chem.2019;65:927-936)、本発明者らは、膀胱がんを有する患者を評価するために尿DNAの不揃い状態を使用することの実現可能性を調査した。尿DNAの不揃い状態は、DNA断片の異なるサイズ範囲を含む、膀胱がんの異なるレベルにわたって変動することが見出された。結果は、異なるレベルの障害が不揃い状態の尺度を使用して分類され得ることを示す。更に、断片の特定のサイズ又は断片の特定の位置を見ることにより、障害のレベルを判定する感受性及び/又は特異性を改善することができる。
【0051】
A.指数値の差を示す結果
図5A、
図5B、
図5C及び
図5Dは、膀胱がんを有する患者の尿DNAにおけるJI-U値を示す。
図5Aは、血尿を有するが膀胱がん、低悪性度非筋肉浸潤性膀胱がん(non-muscle invasive bladder cancer、NMIBC LG)、高悪性度非筋肉浸潤性膀胱がん(NMIBC HG)、及び筋肉浸潤性膀胱がん(muscle invasive bladder cancer、MIBC)を有しない対照対象にわたるJI-Uの箱ひげ図を示す。
図5Aのx軸は、対照対象及び膀胱がんを有する対象を示す。各群における対象の数を、x軸ラベルに示す。JI-Uは、y軸上に示されている。
図5Aに示すように、血尿を有するがんのない対照(中央値:33.9、範囲21.3~50.7)と比較すると、尿DNAの不揃い末端指数(JI-U)は、血尿を頻繁に呈した膀胱がんを有する患者において有意に低かった(中央値:26.6、範囲:3.5~50.7)(P値<0.0001、マン-ホイットニーU検定)。MIBCを有する患者は、最も低い中央値JI-U値を示した。
【0052】
図5Bは、異なるタイプの試料について異なるサイズにわたって変化するJI-U値を示す。
図5Bは、y軸上にJI-Uを、x軸上に塩基対における断片のサイズを示す。青色線504は、血尿を有するが膀胱がんを有しない対照対象を示す。緑色線508は、低悪性度非筋肉浸潤性膀胱がん(NMIBC LG)を示す。黄色線512は、高悪性度非筋肉浸潤性膀胱がん(NMIBC HG)を示す。赤色線516は、筋肉浸潤性膀胱がん(MIBC)を示す。膀胱がんを有する患者における尿DNAの不揃い状態の低減は、異なるサイズの範囲にわたって規則的に現れる。
【0053】
図5Cは、
図5Aと同様に、血尿を有するが膀胱がん、低悪性度非筋肉浸潤性膀胱がん(NMIBC LG)、高悪性度非筋肉浸潤性膀胱がん(NMIBC HG)、及び筋肉浸潤性膀胱がん(MIBC)を有しない対照対象にわたるJI-Uの箱ひげ図を示す。しかしながら、
図5Cは、130~160bpの断片、及びDNASE1高感受性部位(DNASE1 hypersensitive site、DHS)との重複についての結果を示す。
図5Aのx軸は、対照対象及び膀胱がんを有する対象を示す。各群における対象の数を、x軸ラベルに示す。JI-Uは、y軸上に示されている。
図5Cは、
図5Aと比較して、対照対象及び膀胱がんを有する対象についてのJI-U間のより大きな分離を示す。
図5Cはまた、130~160bpについてのJI-Uが、
図5Aに示される結果と比較して、異なる膀胱がんグレード間でより多い差別性を示すことを示す。
【0054】
尿中のDNASE1活性が血漿中よりもはるかに高かったという事実(Nadano et al.,Clin Chem.1993;39:448-52)に基づいて、一実施形態では、不揃い末端分析のためにDHSと重複する尿DNA分子を用いることができる。DHSは、DNASE I切断部位の過剰発現を示すゲノム領域として定義された。DHSを、ENCODE(DNAエレメントの百科事典)データベース(encodeproject.org)からダウンロードした。DHSと重複した130~160bpの断片を使用してがんを差別化することは、全ての断片で差別化することと比較して改善された(P値:0.02、DeLong検定)。
【0055】
B.分類精度
図5Dは、膀胱がんを判定するJI-Uを使用するための受信者操作特徴(ROC)曲線を示す。感受性は、y軸にプロットされ、特異性は、x軸にプロットされている。赤色曲線520は、全ての断片サイズでJI-Uを使用するためのものである。青色曲線524は、130~160bpの範囲内の断片サイズでJI-Uを使用し、DNASE1高感受性部位(DHS)と重複するためのものである。ROC曲線下の面積(AUC)は、全ての断片を使用した場合に0.75であった。これらの結果は、尿DNAの不揃い末端が膀胱がんのバイオマーカーとして役立ち得ることを示唆した。膀胱がんを有する患者における尿DNAの不揃い状態についての観察は、血漿DNA不揃い末端について観察されたものとは反対であった。HCCを有する患者の血漿中の腫瘍DNAの不揃い状態は、造血起源のそのDNAよりも高く(Jiang et al.,Genome Res.2020;30:1144-1153)、血漿及び尿DNA分子の不揃い末端の異なる特性を更に示唆している。
【0056】
その結果、本発明者らは、膀胱がんを有する患者と膀胱がんを有しない患者とを差別化する能力の増強を観察した(AUC:0.83)(
図5D)。いくつかの実施形態では、40~70bp、70~100bp、100~130bp、130~160bp、160~190bpなどのサイズ範囲、及び/又はこれらのサイズ範囲の組み合わせを含むサイズ範囲を使用することができるが、それらに限定されない。
【0057】
C.例示的な方法
図6は、不揃い末端指数値を使用して生体試料を分析する方法600を示している。
【0058】
ブロック601では、尿試料が受け取られ得る。尿試料は、個体から得られ得る。尿試料は、無細胞である複数の核酸分子を含み得る。複数の核酸分子のうちの各核酸分子は、第1の部分を有する第1の鎖及び第2の鎖を有する二本鎖であり得る。複数の核酸分子のうちの少なくともいくつかの第1の鎖の第1の部分は、第2の鎖からオーバーハングする場合があり、第2の鎖にハイブリダイズしない場合がある。第1の部分は、第1の鎖の第1の末端にあり得る。第1の末端は、3’末端又は5’末端であり得る。
【0059】
統計的に有意な数の無細胞核酸分子は、第1の組織タイプからの比例的寄与の正確な判定を提供するために分析され得る。いくつかの実施形態では、少なくとも1,000個の無細胞核酸分子が分析される。他の実施形態では、少なくとも10,000個又は50,000個又は100,000個又は500,000個又は1,000,000個又は5,000,000個、又はそれより多い無細胞核酸分子が分析され得る。更なる例として、少なくとも10,000又は50,000又は100,000又は500,000又は1,000,000又は5,000,000の配列リードを生成することができる。分析される無細胞核酸分子の数は、本明細書に記載される任意の方法に適用され得る。
【0060】
ブロック602では、方法600は、複数の核酸分子の各核酸分子の特徴を測定することを含み得る。測定することは、第2の鎖にオーバーハングするか又はハイブリダイズしない第1の鎖の長さに相関する(例えば、比例する)第1の鎖、第2の鎖、又は第1の鎖及び第2の鎖の特徴を測定することを含み得る。特徴はまた、第2の鎖にオーバーハングする第1の鎖の長さに相関し得る。特徴は、複数の核酸のうちの各核酸について測定され得る。特徴は、複数の核酸分子の各々の第1及び/又は第2の鎖の末端部分における1つ以上の部位におけるメチル化状態であり得る。特徴は、記載される任意の技術によって測定され得る。いくつかの実施形態では、特徴は、第2の鎖にオーバーハングするか又はハイブリダイズしない第1の鎖の長さであり得る。長さは、直接判定され得る。
【0061】
いくつかの実施形態では、方法600は、核酸分子のサイズを測定することを含み得る。複数の核酸分子は、特定の範囲内のサイズを有し得る。指定された範囲は、40~70bp、70~100bp、100~130bp、130~160bp、160~190bp、190~250bp、250bp超、生体試料中に存在するサイズの全範囲未満の任意の範囲、本明細書に記載される任意の範囲、又は本明細書に記載される範囲の任意の組み合わせ(不連続な範囲を含む)であり得る。指定された範囲は、異なる状態レベル間の統計的に有意な分離を示す以前のデータに基づき得る。サイズ範囲は、より短い鎖又はより長い鎖のサイズに基づき得る。サイズ範囲は、末端修復後の分子の最も外側のヌクレオチドに基づき得る。5’末端が突出している場合、5’から3’までのポリメラーゼを介した伸長が起こり、サイズはより長い鎖になり得るであろう。3’から5’までの合成機能を持つDNAポリメラーゼなしで、3’末端が突出している場合、3’末端の突出した一本鎖がトリミングされ、サイズがより短い鎖になり得る。
【0062】
実施形態では、方法600は、リードを生成する核酸分子を分析することを含み得る。リードは、参照ゲノムにアライメントされ得る。複数の核酸分子は、CTCF部位又はDNASE1高感受性部位(DHS)部位を含む、転写開始部位又は結合部位に対して、ある特定の距離範囲内のリードであり得る。ある特定の部位からの距離に関連する方法は、本開示における他の箇所で更に詳細に考察される。
【0063】
ブロック604では、不揃い指数値が、複数の核酸分子の測定された特徴を使用して、判定され得る。不揃い指数値は、後述するように、不揃い指数-非メチル化(JI-U)又は不揃い指数-メチル化(JI-M)を含む、不揃い末端値であり得る。不揃い指数値は、第1及び/又は第2の鎖の末端部分の1つ以上の部位における複数の核酸分子にわたるメチル化レベルを含み得る。いくつかの実施形態では、不揃い指数値は、複数の核酸分子の不揃い末端の長さの統計値(例えば、平均値、中央値、最頻値、パーセンタイル)であり得る。
【0064】
第1の複数の核酸分子が指定されたサイズ範囲にある場合、方法は、第2の複数の核酸分子のうちの各核酸分子の特徴を測定することを含み得る。第2の複数の核酸分子は、第2の指定されたサイズ範囲を有するサイズを有し得る。不揃い指数値を判定することは、第1の複数の核酸分子の測定された特徴及び第2の複数の核酸分子の測定された特徴を使用して、比を計算することを含み得る。
【0065】
不揃い指数値は、参照値と比較され得る。参照値又は比較は、トレーニングデータセットを用いた機械学習を使用して判定され得る。
【0066】
ブロック606では、個体の状態のレベルが、不揃い指数値を使用して判定され得る。いくつかの実施形態では、状態のレベルは、不揃い指数値の参照値に対する比較に基づいて判定され得る。状態のレベルは、不揃い指数値が参照値を超える場合に、存在する、可能性が高い、又は重度であるとして分類され得る。状態には、疾患、障害、又は妊娠が含まれ得る。状態には、がん、自己免疫疾患、妊娠関連状態、又は本明細書に記載の任意の状態が含まれ得る。例として、がんには、膀胱がん、肝細胞がん(hepatocellular carcinoma、HCC)、大腸直腸がん(colorectal cancer、CRC)、白血病、肺がん、又は咽頭がんが含まれ得る。自己免疫疾患には、全身性エリテマトーデス(systemic lupus erythematosus、SLE)を挙げることができる。いくつかの実施形態では、疾患には、泌尿器問題、尿路感染症、腎臓の炎症、又は膀胱の炎症(すなわち、膀胱炎)が含まれ得る。以下の様々なデータは、状態のレベルを判定するための例を提供する。
【0067】
方法は、患者における疾患又は状態のレベルを判定した後に、患者における疾患又は状態を治療することを更に含み得る。治療は、判定されたがんのレベル、識別された変異、及び/又は原発組織によって提供され得る。例えば、(例えば、多型実装例の)識別された変異は、特定の薬物又は化学療法によって標的化され得る。原発組織を使用して、手術又は任意の他の形態の治療を誘導することができる。また、がんのレベルを使用して、任意のタイプの治療においてどれほど積極的になるべきかを判定することができ、これもまた、がんのレベルに基づいて判定され得る。がんは、化学療法、薬物、食事療法、療法、及び/又は手術によって治療され得る。いくつかの実施形態では、パラメータの値が参照値を超えるほど、治療はより積極的になり得る。
【0068】
治療には、経尿道的膀胱腫瘍切除術(TURBT)が含まれ得る。この措置は、診断、病期分類、及び治療に使用される。TURBT中、外科医は、膀胱鏡を尿道から膀胱に挿入する。次いで、小型ワイヤーループ、レーザー、又は高エネルギー電気を備えたツールを使用して、腫瘍が切除される。NMIBCを有する患者の場合、がんの治療又は除去のためにTURBTが使用され得る。別の治療には、根治的膀胱切除術及びリンパ節郭清が含まれ得る。根治的膀胱切除術は、膀胱全体、並びに場合によっては周囲の組織及び器官の除去である。治療はまた、尿路変更術を含み得る。尿路変更術は、膀胱が治療の一部として除去された場合に、医師が、尿が体外に出るための新しい経路を作り出す場合である。
【0069】
治療には、化学療法が含まれ得、これは、通常がん細胞の成長及び分裂を防ぐことによって、がん細胞を破壊するための薬物の使用である。薬物は、例えば、膀胱内化学療法のためのマイトマイシン-C(ジェネリック医薬品として入手可能)、ゲムシタビン(Gemzar)、及びチオテパ(Tepadina)を伴い得るが、これらに限定されない。全身化学療法は、例えば、シスプラチンゲムシタビン、メトトレキサート(Rheumatrex、Trexall)、ビンブラスチン(Velban)、ドキソルビシン、及びシスプラチンを伴い得るが、これらに限定されない。
【0070】
いくつかの実施形態において、治療には、免疫療法が含まれ得る。免疫療法には、PD-1と呼ばれるタンパク質をブロックする免疫チェックポイント阻害剤が含まれ得る。阻害剤には、アテゾリズマブ(Tecentriq)、ニボルマブ(Opdivo)、アベルマブ(Bavencio)、デュルバルマブ(Imfinzi)、及びペムブロリズマブ(Keytruda)が含まれ得るが、これらに限定されない。
【0071】
治療の実施形態はまた、標的療法を含み得る。標的療法は、がんの成長及び生存に寄与するがんの特定の遺伝子及び/又はタンパク質を標的とする治療である。例えば、エルダフィチニブは、がん細胞の成長又は拡散を続けているFGFR3又はFGFR2遺伝子変異を伴う局所進行性又は転移性尿路上皮がんを有する人々を治療するために承認された、経口投与される薬物である。
【0072】
一部の治療法には、放射線療法が含まれ得る。放射線療法は、がん細胞を破壊するために高エネルギーX線又は他の粒子を使用することである。各個々の治療に加えて、本明細書に記載のこれらの治療の組み合わせが使用され得る。いくつかの実施形態において、パラメータの値が閾値を超え、閾値自体が参照値を超える場合、治療の組み合わせが使用され得る。参考文献における治療に関する情報は、参照により本明細書に組み込まれる。
【0073】
状態の分類はまた、他の臨床因子に基づき得る。例えば、個体は、遺伝的要因のために又は年齢のために特定の状態のリスクにあるとみなされ得る。いくつかの例では、個体は、状態の症状を示している場合がある。
【0074】
ブロック606が実施されるとき、参照値は、状態を有する対象の1つ以上の参照試料を使用して判定され得る。別の例として、参照値は、状態を有しない対象の1つ以上の参照試料を使用して判定される。参照試料から複数の参照値を判定でき、異なる参照値は、状態の異なるレベルを識別する可能性がある。参照値は、本明細書に記載される任意の参照値であり得る。
【0075】
いくつかの実施形態では、参照との比較は、例えば、教師あり学習を使用して訓練された機械学習モデルを伴うことができる。不揃い指数値(並びにコピー数、DNA断片のサイズ、及びメチル化レベルなどの可能性がある他の基準)、並びにトレーニング試料を取得した対象をトレーニングする既知の状態は、トレーニングデータセットを形成することができる。機械学習モデルのパラメータは、トレーニングセットに基づいて最適化され、状態のレベルを分類する際の最適化された精度を提供することができる。機械学習モデルの例としては、ニューラルネットワーク、決定木、クラスタリング、サポートベクターマシンが挙げられる。
【0076】
IV.末端密度によるヌクレオソームフットプリント
CTCF結合部位付近の末端密度を調べた。末端密度は、DNA断片のU末端とD末端との間で相殺され得る。本発明者らは、異なる末端の密度間の差が状態のレベルを判定するために使用され得るかどうかを調査した。尿DNAの異なる末端の密度の差を使用して、膀胱がんの異なるレベルを正確に判定した。
【0077】
A.末端密度の差
図7Aは、血漿及び尿DNA分子についてのCTCF結合部位付近のU末端密度及びD末端密度を示す。y軸は、血漿DNA末端密度である。末端密度は、CTCF結合部位に対して1kb上流/下流にわたる遺伝子座にわたるそれらの値の中央値によって正規化された末端発生の値である。上のグラフは、血漿DNAについての末端密度を示す。紫色線704は、上流末端を表す。青色線708は、下流末端を表す。下のグラフは、尿DNAの末端密度を示す。紫色線712は、上流末端を表す。青色線716は、下流末端を表す。x軸は、CTCF結合部位からの塩基対における距離である。正の数は、CTCF結合部位の下流である。負の数は、CTCF結合部位の上流である。上のグラフの上の漫画は、血漿中DNAでの及び尿DNAでの末端密度についての結果に関連する可能なヌクレオソーム構造を示す。
図7Aについてのデータは、がんを有する対象及びがんを有しない対象の両方からのものである。
【0078】
図7Aに見られるように、ワトソン鎖(すなわち、参照ゲノムに示される鎖と同一の鎖)に由来する血漿DNA分子については、CTCF結合部位付近のU末端密度及びD末端密度の両方が、ヌクレオソームアレイのよく組織化されたパターンに似た、約180bp間隔の周期的シグナルを示した。末端密度の2つの連続するピーク間の距離は、ヌクレオソームフットプリントの判定を容易にし得る。末端密度のピークは、血漿DNA生成中の好ましい切断を示唆していた。U末端密度及びD末端密度の配向パターンはまた、CTCF結合部位付近(上流/下流300)でも観察され、これは以前の報告(Sun et al.Genome Res.2019;29;418:27)と一貫性があった。CTCF結合部位の上流及び下流300bpの範囲外のU末端密度及びD末端密度トラック間の小さなオフセット(約20bp)は、リンカーDNAの部分分解による可能性が高かった。対照的に、尿DNA分子については、ヌクレオソームアレイのパターンはあまり明らかにならず、オフセットはより広くなり、高い可能性で、血漿DNA生成と比較して、尿DNA断片の生成中に更なるDNA分解があったことを示唆している。
【0079】
図7Bのグラフの末端密度及びJI-U値は、ヌクレオソーム中心に対して遺伝子座にわたって分布されている。両方のグラフのx軸は、ヌクレオソーム中心までの距離である。上のグラフは、y軸上に末端密度を示す。上のグラフは、血漿DNA分子に基づくU末端(紫色線720)及びD末端(青色線724)の末端密度をプロットしている。下のグラフは、血漿DNA(青色線728)及び尿DNA(赤色線732)の両方についてのJI-U値を示す。上のグラフの上の漫画は、x軸に対するヌクレオソーム中心の位置を示す。上のグラフは、U末端密度及びD末端密度がリンカー領域に近位の領域において濃縮されたことを示し、これは以前の報告(Sun et al.,Proc Natl Acad Sci U S A.2018;115:E5106-14)と合致している。下のグラフは、JI-U値が、他の位置よりもリンカー領域に近位の領域において比較的高いことが観察されたことを示す。血漿DNAの平均JI-Uにおける22.4%の上昇が、ヌクレオソームコア領域と比較して、リンカーDNA領域において観察された。尿DNAについては、リンカーDNA領域における平均JI-Uは、13.1%増加した。
【0080】
図8は、CTCF結合部位についての尿DNAの末端密度のグラフである。y軸は、尿DNA末端の発生(すなわち、末端密度)を示す。x軸は、CTCF結合部位からの塩基対における距離を示す。末端密度は、CTCF結合部位に対して1kb上流/下流にわたる遺伝子座にわたるそれらの値の中央値によって正規化された末端発生の値であった。紫色線804は、上流末端を表す。青色線808は、下流末端を表す。グラフ中の縦のカラムは、-80±20bp及び+80±20bpの距離範囲を強調している。尿DNAのU末端密度及びD末端密度は、CTCF結合部位の周囲の周期的なシグナルを示す。U末端及びD末端の密度は、オープンクロマチン領域内の病態生理学的状態を知らせるためのバイオマーカーとして使用され得る。
図8のデータは、がんを有しない対象に基づく。
【0081】
本発明者らは、-80±20bpの距離範囲内のD末端とU末端との間の末端密度における累積差(ΔC1)及び+80±20bpの距離範囲内のU末端とD末端との間の末端密度における累積差(ΔC2)を測定値として使用した。一実施形態では、ΔC1とΔC2の和(ΔC)は、患者ががんを有し得るかどうかを評価するための分子指標として使用され得る。-80±20bp及び+80±20bpのサイズ範囲は、U末端密度とD末端密度との間のオフセットを示した。他の実施形態では、サイズ範囲は、-40±20bp、-50±20bp、-60±20bp、-70±20bp、-100±20bp、+40±20bp、+50±20bp、+60±20bp、+70±20bp、+100±20bp(これらに限定されないが)、又はこれらの範囲の組み合わせを含み得る。
【0082】
図9は、血尿を有する対照対象、並びに低悪性度非筋肉浸潤性膀胱がん(NMIBC-LG)、高悪性度非筋肉浸潤性膀胱がん(NMIBC-HG)及び筋肉浸潤性膀胱がん(MIBC)を有する患者にわたる末端密度の累積差(ΔC)の箱ひげ図を示す。y軸は、末端密度の累積差(ΔC)を示す。x軸は、対象の異なる群を示す。尿DNAのΔC値は、がんを有しない対象(中央値:7.2;範囲:-4.9~22.77)(P値<0.0001、マン-ホイットニーU検定)と比較して、膀胱がんを有する患者において有意により高かった(中央値:12.8;範囲:-36.1~25.9)。結果は、ΔCが非侵襲的な様式でがんを検出するために使用され得ることを示唆した。
【0083】
B.分類精度
図10A及び
図10Bは、ΔC測定基準を使用してがんを有する患者とがんを有しない患者とを差別化するためのROC曲線を示す。両方のグラフは、y軸上に感受性を、x軸上に特異性を有する。
図10Aは、任意のレベルの膀胱がんを有する全ての患者対対照対象を使用したROC曲線である。AUCは、任意のレベルの膀胱がんを有する対象を対照対象から区別するための0.75である。
図10Bは、筋肉浸潤性膀胱がん(MIBC)を有する患者対対照対象を使用したROC曲線である。AUCは、MIBCを有する対象を対照対象から区別するための0.88である。これらのデータは、がん検出のためのΔCメトリックのべき乗ががんステージに基づいて変化し得ることを示唆している。より進行したステージのがんは、より大きなΔCメトリック及びより高いAUCをもたらし得る。これらのデータはまた、がんの異なるステージがΔCメトリックに基づいて区別され得ることを示唆している。
【0084】
C.例示的な方法
図11は、個体から得られた生体試料を分析する方法1100を示す。生体試料は、本明細書に記載の任意の生体試料であり得る。いくつかの実施形態では、生体試料は、尿試料であり得る。生体試料は、複数の核酸分子を含み得る。複数の核酸分子は、無細胞である。
【0085】
ブロック1102では、複数の核酸分子の核酸分子のセットが、検出され得る。核酸分子のセットの各核酸分子は、所定のタイプのゲノム部位からの特定の距離にゲノム位置を有する少なくとも1つの末端によって特徴付けられ得る。所定のタイプは、ゲノム部位におけるクロマチン中のタンパク質の改変又はゲノム部位におけるタンパク質相互作用に関連し得る。所定のとは、部位のタイプが配列決定及び/又はアライメントの前に判定されることを意味し得る。ゲノム部位は、CTCF結合部位又はDNASE1高感受性部位(DHS)であり得る。いくつかの実施形態では、ゲノム部位は、ヌクレオソーム中心、ヌクレオソームの末端、又はヌクレオソームに対応する領域であり得る。
【0086】
核酸分子のセットを識別することは、核酸分子のセットの各核酸分子を配列決定して、1つ以上のリードを生成することを含み得る。配列決定は、例えば本明細書に記載されるような様々な方法で実施することができる。1つ以上のリードは、参照ゲノム(例えば、ヒト参照ゲノム)に対してアライメントされ得る。核酸分子のゲノム位置は、1つ以上のリードから判定され得る。
【0087】
ブロック1104では、核酸分子のセットの各核酸分子の一方の末端は、上流末端として分類され得、他方の末端は、下流末端として分類され得る。分類は、各核酸分子をアライメントさせることを含み得る。アライメントにより、核酸分子の末端で又はその付近でゲノム座標の判定がもたらされ得る。下流末端は、ゲノム位置についてより高い値(例えば、より高いゲノム座標)を有する末端に基づいて、識別され得る。いくつかの実施形態では、5’末端は、DNAポリメラーゼ伸長方向の上流にあることによって判定され得る(すなわち、5’→3’DNA合成)。いくつかの実施形態では、5’末端及び3’末端は、ヌクレオチドの化学構造によって判定され得る。例えば、デオキシリボース環の5番目の炭素は、概して、リン酸基(すなわち、5’末端)を担持し、デオキシリボース環の3番目の炭素は、概して、ヒドロキシル基(すなわち、3’末端)を担持する。その結果、両方の末端が分類され得る。
【0088】
ブロック1106では、指定された距離に上流末端を有する核酸分子の第1の量が判定され得る。第1の量は、核酸分子の数、全長、又は全質量であり得る。
【0089】
ブロック1108では、特定の距離に下流末端を有する核酸分子の第2の量が判定され得る。第2の量は、核酸分子の数、全長、又は全質量であり得る。
【0090】
ブロック1110では、第1の量及び第2の量を使用する分離値が判定され得る。分離値は、それらの量の差又は比であり得る。
【0091】
分離値は、カットオフ値と比較され得る。参照値は、状態を有しない対象からの1つ以上の対照試料から、又は状態を有する対象からの1つ以上の対照試料から判定され得る。参照値は、本明細書に記載される任意の参照値として判定され得る。
【0092】
ブロック1112では、個体の状態のレベルは、分離値を使用して判定され得る。その判定は、分離値を参照値と比較することに基づき得る。状態は、本明細書に記載される任意の状態であり得る。より深刻なレベルの状態は、より大きな分離値に関連付けられ得る。分離値が参照値を超える場合、個体は、状態を有するか、又は状態の高い可能性を有するとして分類され得る。方法は、本明細書に記載される治療で状態を治療することを含み得る。
【0093】
いくつかの実施形態では、分類は、例えば、
図6のブロック606について記載されるように、機械学習モデルを使用して実施され得る。
【0094】
V.臨床的に関連するDNAの濃縮
ある特定のタイプの組織又は試料は、他のものとは異なる不揃い状態特性を有し得る。例えば、胎児DNAは、母体DNAよりも不揃いであり得る。移植組織のレシピエントについて、レシピエントのDNAは、ドナーのDNAとは異なる不揃い状態を有し得る。したがって、ある特定の量又は範囲の不揃い状態についてDNAを(物理的に若しくはインシリコで)濃縮又はフィルタリングすることを使用して、特定のタイプの組織のシグナルを増強することができる。次いで、濃縮されたDNAを、異なる分析のために使用することができる。
【0095】
A.妊婦の母体尿DNA分子及び胎児尿DNA分子間の不揃い末端
本発明者らはまた、妊婦の尿DNA中の母体由来分子及び胎児由来分子間の不揃い状態の差異を試験した。本発明者らは、マイクロアレイプラットフォーム(Human Omni2.5、Illumina)を使用して、母体バフィーコート及び胎盤組織の遺伝子型を特定した。5人の妊婦から排泄された尿試料を収集した。
【0096】
母親がホモ接合性(すなわち、AA)であり、かつ胎児がヘテロ接合性(すなわち、AB)である、胎児特異的対立遺伝子を既定することを可能にした、191,143の有益な一塩基多型(single nucleotide polymorphism、SNP)遺伝子座(範囲:311~207,363)の中央値が存在していた。本発明者らは、母親がヘテロ接合体(AB)であり、胎児がホモ接合体(AA)である、母体特異的対立遺伝子を既定することを可能にした、191,655の有益なSNP遺伝子座(範囲:8,764~214,815)の中央値を得た。母体特異的対立遺伝子及び胎児特異的対立遺伝子を担持する尿DNA分子は、母体由来の尿DNA分子及び胎児由来の尿DNA分子とみなされた。
【0097】
中央値4500万(範囲:2500万~9300万)のマッピングされた対をなす尿DNAリードが、各妊娠血漿対象から得られた。それらの試料間の中央値の胎児DNA画分は、0.5%(範囲:0.4%~0.9%)であった。全ての母体特異的DNA分子及び胎児特異的DNA分子が、それぞれプールされ、本開示の実施形態による不揃い末端指数(JI-U)を計算するために使用された。
【0098】
図12は、妊婦の母体由来尿DNA及び胎児由来尿DNA間のJI-U値を示す。y軸は、JI-Uを示す。x軸は、母体由来DNA及び胎児由来DNAを示す。
図12に示すように、胎児尿DNA(JI-U:30.1)のJI-Uは、妊婦の尿中の母体DNA(JI-U:28.9)のJI-Uよりも高い。言い換えれば、胎児由来尿DNAでは、母体由来尿DNAと比較して、4.1%のJI-U値の増加が認められた。これらの結果は、尿DNAの不揃い末端が原発組織を反映し得ることを示唆した。尿DNAの不揃い状態は、非侵襲性出生前検査に有用であり得る。例えば、より高い不揃い状態指数を有するDNA分子は、胎児DNAを濃縮する。尿DNA不揃い末端に基づくそのような選択は、尿DNAプールにおける胎児DNA画分が高いほど、尿DNAを使用する胎児障害の検出がより感受性であるために、尿DNA分子を使用する胎児障害の検出を容易にする。
【0099】
B.移植を受けた患者における不揃い末端
本発明者らは、腎臓移植(n=10)、造血幹細胞移植(HSCT、n=1)及び肝臓移植(n=1)を含む、移植を受けた12人の患者における尿DNAのJI-Uを分析した。本発明者らは、超並列バイサルファイト配列決定を使用して、中央値5400万の対をなす末端リード(範囲:2900万~2億9600万)を得た。レシピエントがホモ接合性(すなわち、AA)であり、かつドナーがヘテロ接合性(すなわち、AB)であるか、又はレシピエント及びドナーの両方がホモ接合性であるが異なる遺伝子型(すなわち、AA対BB)にある、ドナー特異的対立遺伝子を既定することを可能にする、ドナー特異的情報提供的SNP遺伝子座の中央値201,499(範囲:14,091~328,861)が存在した。レシピエントがヘテロ接合性(すなわち、AB)であり、かつドナーがホモ接合性(すなわち、AA)であるか、又はレシピエント及びドナーの両方がホモ接合性であるが異なる遺伝子型(すなわち、AA対対BB)にある、レシピエント特異的対立遺伝子を既定することを可能にした、レシピエント特異的情報提供的SNP遺伝子座の中央値195,475(範囲:2,913~334,122)が存在した。レシピエント特異的対立遺伝子及びドナー特異的対立遺伝子を担持する尿DNA分子は、レシピエント由来尿DNA分子及びドナー由来尿DNA分子とみなされた。それらの試料間の胎児DNA画分中央値は、32.9%(範囲:2.5%~94.0%)であった。尿中のレシピエント由来DNA分子及びドナー由来DNA分子についてのJI-Uパターンが、本開示の実施形態に従って各試料についてそれぞれ推定された。
【0100】
図13A、
図13B、及び
図13Cは、異なる移植患者におけるレシピエント由来DNA及びドナー由来DNAのJI-U値を示す。
図13Aは、腎臓移植を受けた患者を示す。
図13Bは、造血幹細胞移植(HSCT)を受けた患者を示す。
図13Cは、肝臓移植を受けた患者を示す。3つの図の各々のy軸は、JI-Uを示す。3つの図の各々のx軸は、レシピエント由来DNA及びドナー由来DNAを示す。
【0101】
図13Aは、腎臓移植を受けた患者の尿中のレシピエントDNA(中央値:32.2)と比較して、ドナーDNA(中央値:30.1)でJI-Uの6.5%の減少を示す。対照的に、
図13B及び
図13Cは、ドナーDNAにおけるJI-Uの増加を示す。
【0102】
図13Bは、HSCTにおけるレシピエントDNA(JI-U:33.4)と比較して、ドナーDNA(JI-U:39.3)におけるJI-Uの17.6%の増加を示す。
【0103】
図13Cは、肝臓移植の患者の尿中のレシピエントDNA(38.7)と比較して、ドナーDNA(42.6)におけるJI-Uの増加(上昇:約10.0%)を示す。
【0104】
これらの結果は、経腎性DNA分子が、腎後性DNA分子よりも大きい不揃い状態によって特徴付けられ得ることを示唆した。したがって、一実施形態では、不揃い状態マーカーを使用して、長い不揃い末端を有する尿DNA分子を選択的に分析することによって経腎性DNA分子を濃縮することができ、それによって、尿DNAを使用した泌尿器系外の器官損傷(例えば、血球、肝臓、肺、及び結腸など)のモニタリングの性能を改善することができる。選択的分析は、所望の尿DNA分子のインシリコ選択及び物理的選択を伴い得る。物理的選択としては、DNAプローブによって媒介される磁気ビーズベースのハイブリダイゼーションアッセイ、ゲル電気泳動、及びマイクロ流体力学(それらに限定されない)が挙げられ得る。
【0105】
C.例示的濃縮方法
図14は、臨床的に関連する核酸分子について個体から得られた生体試料を濃縮する方法1400を示す。生体試料は、複数の核酸分子を含み得る。複数の核酸分子は、無細胞であり得る。複数の核酸分子は、臨床的に関連する核酸分子及び他の核酸分子を含み得る。第1の複数の核酸分子の各核酸分子は、第1の部分を有する第1の鎖及び第2の鎖を有する二本鎖であり得る。複数の核酸分子のうちの少なくともいくつかの第1の鎖の第1の部分は、第2の鎖からの相補的な部分を有しない。第1の部分は、第2の鎖にハイブリダイズしない場合がある。第1の部分は、第1の鎖の第1の末端に存在し得る。第1の部分は、第2の鎖からオーバーハングし得る。臨床的に関連する核酸分子は、胎児DNA、腫瘍由来DNA、移植DNA、又は障害に関連するDNAを含み得る。
【0106】
ブロック1402では、第1の複数の核酸分子内の核酸分子のサブセットが選択され得る。核酸分子のサブセットの各核酸分子について、第2の鎖にオーバーハングするか又はハイブリダイズしない第1の鎖の長さは、閾値よりも大きくあり得る。第1の鎖の長さは、第2の鎖からオーバーハングし得る。核酸分子のサブセットは、複数の核酸分子よりも少ない核酸分子を含み得る。
【0107】
いくつかの実施形態では、核酸分子のサブセットを選択することは、第1の鎖及び/又は第2の鎖の特徴を測定することを含み得る。特徴は、複数の核酸分子の各核酸分子について、第2の鎖にオーバーハングするか又はハイブリダイズしない第1の鎖の長さに相関し得る(例えば、比例し得る)。特徴は、第2の鎖からオーバーハングした第1の鎖の長さに比例し得る。特徴は、第2の鎖にオーバーハングするか又はハイブリダイズしない第1の鎖の長さを含む、本明細書に記載される任意の特徴であり得る。核酸分子のサブセットを識別することは、コンピュータシステムによって、カットオフ値よりも大きい特徴を有する核酸分子を選択して、第2の複数の核酸分子を得ることを含み得る。カットオフ値は、オーバーハングの最小長さであり得る。例えば、その最小長さは、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、10~15個、15~20個、又は20個以上のヌクレオチドであり得る。
【0108】
いくつかの実施形態では、核酸分子のサブセットを選択することは、最小長さのオーバーハングを有する分子の物理的選択を含み得る。核酸分子のサブセットを選択することは、複数の核酸分子の残りから核酸分子のサブセットを物理的に分離することを含み得る。例えば、方法は、オリゴヌクレオチドを、第1の複数の核酸分子の各核酸分子についての第1の鎖の長さにハイブリダイズさせることを含み得る。オリゴヌクレオチドの特徴は、測定され得る。オリゴヌクレオチドの特徴は、第2の鎖にオーバーハングするか又はハイブリダイズしない第1の鎖の長さに比例し得る。カットオフ値よりも大きい特徴を有する核酸分子を選択して、第2の複数の核酸分子を得ることができる。オリゴヌクレオチドは、1つ以上の蛍光マーカーを含み得る。特徴は、蛍光であり得る。オリゴヌクレオチドは、蛍光に基づいて選別され得る。一部の実施形態では、物理的選択は、DNAプローブによって媒介される磁気ビーズベースのハイブリダイゼーションアッセイ、ゲル電気泳動、及びマイクロ流体力学を含み得る。
【0109】
他のハイブリダイゼーションベースの捕捉濃縮技術とは異なり、ハイブリダイゼーション技術は、オリゴヌクレオチドへのハイブリダイゼーションを容易にするために、二本鎖DNAを変性させて一本鎖DNAを形成することを伴わない。二本鎖DNA分子の不揃い末端は、すでに一本鎖DNAであり、不揃い末端を有する二本鎖DNA分子を変性させることは、不揃い末端の長さを判定することをより困難にすることがある。
【0110】
いくつかの実施形態では、オリゴヌクレオチドは、カットオフ長さを超えるオリゴヌクレオチドのマーカーに結合され得る。方法は、マーカーを有する核酸分子を捕捉して、第2の複数の核酸分子を得ることを含み得る。マーカーは、選択的に捕捉され得る構造を有するビオチン又は他の分子を含み得る。核酸分子は、マーカーを結合することによって捕捉され得る。捕捉された核酸分子を増幅して、核酸分子の増幅されたサブセットを得ることができる。
【0111】
核酸分子の増幅されたサブセットは、他の領域よりも多い不揃い末端を有するゲノム領域を表し得る。例として、がんを有しない対象よりもがん(例えば、膀胱がん)を有する対象において、より長い不揃い末端を有するより多い分子を生成するゲノム領域が識別され得る。長い不揃い末端(例えば、10ntより長い)を標的とするプローブが設計され得る。プローブは、より短い不揃い末端よりも長い不揃い末端に優先的に結合し得る。ある特定の長さより長いプローブは、そのある特定の長さより短い不揃い末端にハイブリダイズするのが困難である。加えて、プローブがより短い長さにハイブリダイズすることができた場合であっても、プローブとより短い末端との間の親和性は、プローブとより長い長さとの間よりも低い。その結果、ハイブリダイズしたプローブ及びより短い不揃い末端は、安定でない可能性があり、ある特定の温度(インキュベーション温度など)では、ハイブリダイゼーションが変性することがある。
【0112】
様々なハイブリダイゼーションアッセイが使用され得る。ハイブリダイゼーションは、液体溶液中か又は固体支持体上のいずれかで達成され得る。液体溶液では、アッセイには、ハイブリッド生成物を単離する分離ステップが後続し得る。分離ステップは、磁場中に磁性粒子を伴い得る。ストレプトアビジンでコーティングされた磁気ビーズは、標的化された長い不揃い末端を選択的に収集し得る。いくつかの実施形態では、分離のために、吸収クロマトグラフィー、分別沈殿、電気泳動、アフィニティークロマトグラフィー、又は免疫沈降を使用することができる。固体支持体を用いる場合、支持体は、ポリマービーズ、ガラススライド、樹脂を有するカラム、又は膜を含み得る。タグ付けされた長い不揃い末端は、支持基材に結合され得、非結合断片は、洗い流され得る(例えば、流体工学を使用して)。
【0113】
ブロック1404では、核酸分子のサブセットを分析して、臨床的に関連する核酸分子の特性を判定することができる。いくつかの実施形態では、核酸分子のサブセットを分析することは、核酸分子の増幅されたサブセットを使用することを含み得る。
【0114】
核酸分子のサブセットを分析することは、第2の複数の核酸分子を使用してパラメータの値を判定することを含み得る。パラメータの値を判定することは、核酸分子の増幅されたサブセットを使用し得る。パラメータは、平均値、中央値、最頻値、パーセンタイル、最小値、又は最大値を含むサイズプロファイルの統計的尺度であり得る。いくつかの実施形態では、パラメータの値は、核酸分子の量であり得る。いくつかの実施形態では、パラメータの値は、ある特定の領域における核酸分子の量を使用して判定され得る。例えば、核酸分子の量を使用して、欠失及び増幅を含むコピー数異常の数を判定することができる。
【0115】
パラメータの値を使用した状態のレベルの分類が判定され得る。状態のレベルの分類を判定することは、パラメータの値を参照値と比較することを含み得る。状態のレベルは、パラメータの値が参照値を超える場合に、存在する、可能性が高い、又は重度であるとして分類され得る。参照値は、本明細書に記載される任意の参照値であり得る。状態には、疾患、障害、妊娠、又は移植状態が含まれ得る。状態には、がん、自己免疫疾患、妊娠関連状態、又は移植拒絶が含まれ得る。状態には、本明細書に記載の任意のメチル化が含まれ得る。方法は、状態が存在するか又は重篤であると分類することに続く治療を更に含み得る。その治療は、本明細書に記載される任意の治療を含み得る。
【0116】
状態の分類はまた、他の臨床因子に基づき得る。例えば、個体は、遺伝的要因のために又は年齢のために特定の状態のリスクにあるとみなされ得る。いくつかの例では、個体は、状態の症状を示している場合がある。
【0117】
いくつかの実施形態では、分類は、例えば、
図6のブロック606について記載されるように、機械学習モデルを使用して実施され得る。
【0118】
VI.移植条件
本発明者らは更に、2つの腎臓移植試料(RT01及びRT02)を、それぞれ7200万及び7900万の対をなすリードを用いて分析した。ドナーDNA画分は、RT01及びRT02について、それぞれ、32.9%及び53.2%であることが見出された。
【0119】
図15は、急性拒絶を有する腎臓移植患者及び急性拒絶を有しない腎臓移植患者の尿DNAのJI-U値を示す。y軸は、JI-U値を示す。x軸は、異なる試料、拒絶のない試料及び2つの腎臓移植試料(RT01及びRT02)についてのカテゴリーを示す。
【0120】
図15に示されるように、本発明者らは、拒絶のない10人の腎臓移植患者(JI-U中央値:30.9)と比較して、急性拒絶を有する腎臓移植患者RT01(JI-U:24.7)においてJI-Uの20.0%の減少を観察した。本発明者らは、拒絶のない10人の腎臓移植患者(JI-U中央値:30.9)と比較して、急性拒絶を有する腎臓移植患者RT01(JI-U:24.6)においてJI-Uの20.4%の減少を観察した。これらのデータにより、尿DNA分子のJI-Uを使用して、臓器移植を有する患者をモニタし得ることが示唆された。
【0121】
レシピエント由来DNAよりもドナー由来DNAについてより高いJI-U値を示す
図13B及び
図13Cに基づいて、本発明者らは、HSCT及び肝臓移植拒絶試料が、拒絶のない試料よりも高いJI-U値を有することを予想する。
【0122】
図16は、個体から得られた生体試料を分析する方法1600を示す。個体は、第1の組織の移植のレシピエントであり得る。移植された第1の組織は、腎臓、造血幹細胞、又は肝臓からのものであり得る。いくつかの実施形態では、移植された組織は、心臓、肺、膵臓、又は腸を含む器官からのものであり得る。移植された組織は、器官とともに移植され得る。いくつかの実施形態では、移植は、角膜、皮膚、血液、骨、又は肢を含み得る。
【0123】
生体試料は、血液、血漿、尿、若しくは唾液を含み得るか、又は本明細書に開示される任意の生体試料であり得る。生体試料は、複数の核酸分子を含み得る。複数の核酸分子は、無細胞であり得る。複数の核酸分子の各核酸分子は、第1の部分を有する第1の鎖及び第2の鎖を有する二本鎖であり得る。複数の核酸分子のうちの少なくともいくつかの第1の鎖の第1の部分は、第2の鎖からの相補的な部分を有しない場合がある。第1の部分は、オーバーハングであり得るか、又は第2の鎖にハイブリダイズしていない場合がある。第1の部分は、第1の鎖の第1の末端に存在し得る。
【0124】
ブロック1602では、第1の鎖及び/又は第2の鎖の特徴は、複数の核酸分子の各核酸分子について測定され得る。特徴は、第2の鎖にオーバーハングするか又はハイブリダイズしない第1の鎖の長さに相関し得る(例えば、比例し得る)。特徴は、不揃い末端の長さを含む、本明細書に記載される任意の特徴であり得る。
【0125】
ブロック1604では、複数の核酸分子の測定された特徴を使用して、不揃い指数値が判定され得る。不揃い指数値は、複数の核酸分子中の別の鎖にオーバーハングするか又はハイブリダイズしない鎖の長さの集合的尺度を提供し得る。不揃い指数値は、不揃い末端値(例えば、不揃い指数-非メチル化[JI-U])であり得る。不揃い指数値は、複数の核酸分子の不揃い末端の長さの統計値を含む、本明細書に記載される任意の不揃い指数値であり得る。
【0126】
不揃い指数値は、参照値と比較され得る。参照値は、移植を拒絶した対象の1つ以上の参照試料を使用して判定され得る。一部の実施形態では、参照値は、移植を拒絶しなかった対象の1つ以上の参照試料を使用して判定され得る。参照値は、生体試料が個体から得られる前に個体から得られた1つ以上の参照試料を使用して判定され得る。例えば、参照値は、個体が移植を受ける前に得られた1つ以上の参照試料から判定され得る。別の例として、参照値は、移植後であるが現在の生体試料の前に個体から得られた1つ以上の参照試料から判定され得る。不揃い指数値は、参照値としての役割を果たす過去の不揃い指数値を、移植のレシピエントにおいて経時的にモニタリングされ得る。
【0127】
ブロック1606では、個体に移植された第1の組織の移植状態は、不揃い指数値を使用して判定され得る。この判定は、不揃い指数値の参照値との比較に基づき得る。移植状態は、拒絶、移植片機能不全、又は感染の可能性を含み得る。いくつかの実施形態では、移植状態は、不揃い指数値が参照値よりも大きい場合に、拒絶された、拒絶された可能性が高い、移植片機能不全を有する、移植片機能不全を有する可能性が高い、感染した、又は感染した可能性が高いとして分類され得る。例えば、第1の組織は、1つ以上の造血幹細胞であり得るか、又は肝臓からのものであり得る。他の実施形態では、移植状態は、不揃い指数値が参照値未満である場合に、拒絶された、拒絶された可能性が高い、移植片機能不全を有する、移植片機能不全を有する可能性が高い、感染した、又は感染した可能性が高いと判定され得る。例えば、移植は、腎臓からのものであり得る。
【0128】
移植状態は、移植が拒絶されているか、又は拒絶される可能性が高いときに判定され得る。方法は、移植の急性拒絶に対して、個体を治療することを含み得る。例えば、移植は、個体から除去され得る。いくつかの実施形態では、個体は、免疫抑制薬を投与され得る。いくつかの実施形態では、個体は、抗体、血液移入、骨髄移植、又は遺伝子療法で治療され得る。
【0129】
いくつかの実施形態では、判定は、例えば、
図6のブロック606について説明したように、機械学習モデルを使用して実施され得る。
【0130】
VII.ゲノム部位周辺の差別的不揃い状態
本発明者らは更に、不揃い末端が、ヌクレオソーム構造に関連するかどうかを調査した。不揃い末端を、ゲノム部位におけるクロマチン中のタンパク質の改変又はゲノム部位におけるタンパク質相互作用に関連し得る部位に対するそれらの位置に基づいて試験した。本発明者らは、最初に、ヌクレオソームアレイと呼ばれる一連の良好に整列されたヌクレオソームが存在するゲノム領域を特定した。例えば、CTCF(CTCF遺伝子によってコードされる転写因子)結合部位付近のゲノム領域に位置するヌクレオソームは、十分に組織化されていることが知られていた(Snyder et al.Cell.2016;164:57-68、Sun et al.Genome Res.2019;29:418-27)。本発明者らは、CTCF結合部位に対して1kb上流/下流内の尿DNA及び血漿DNAの不揃い状態を分析した。本発明者らは、CTCF結合部位周辺での血漿DNA末端の発生(すなわち、末端密度)を計算した。末端密度は、CTCF結合部位に対して1kb上流/下流にわたる遺伝子座にわたるそれらの値の中央値によって正規化された末端発生の値であった。断片末端シグナルは、参照ゲノムに関する血漿DNA断片の上流末端及び下流末端(すなわち、U末端及びD末端)の配向に従って末端を別々に分析する場合に、オープンクロマチン領域周辺で差次的に段階分けされた(Sun et al.Genome Res.2019;29:418-27)。言い換えれば、配列決定された断片をヒト参照ゲノムにアライメントした後、断片のU末端は、ゲノム座標においてより小さい値を有する末端を表し、一方、D末端は、ゲノム座標においてより大きい値を有する末端を表した(Sun et al.Genome Res.2019;29;418:27)。
【0131】
CTCF部位に対する位置に加えて、不揃い状態は、ヒストン修飾及びDNASE1高感受性部位(DHS)を含む他の部位に対して変化することが見られた。これらの部位に対するある特定の位置でのDNA断片についての不揃い指数値は、状態(例えば、がん)のレベルを判定するように使用され得る。
【0132】
A.特定の部位での不揃い状態の差を示す結果
図17A及び
図17Bは、不揃い末端とヌクレオソームトラックとの間の関係を示す。
【0133】
図17Aは、非がん性対象におけるワトソン鎖に由来するプールされた血漿及び尿DNA分子についてのCTCF結合部位周囲のJI-U値を示す。y軸は、血漿DNA末端密度である。x軸は、CTCF結合部位からの塩基対における距離である。赤色線1704は、尿DNAを表す。青色線1708は、尿DNAを表す。興味深いことに、CTCF結合部位に関する尿DNAのJI-Uシグナルもまた、末端密度から推定されるヌクレオソームアレイのパターンに段階的に実行された。JI-Uシグナルのピーク位置は、リンカーDNA領域にほぼアライメントしており、DNAヌクレアーゼによるリンカーDNA切断が、場合により不揃い末端の生成を伴うことを示唆している。そのようなJI-Uシグナルのヌクレオソームパターンは、ワトソン鎖に由来する血漿DNA分子においても観察された。しかしながら、CTCF付近の尿DNA JI-U波の振幅(中央値:35.4)は、対照試料についての血漿DNAの振幅(中央値:20.2)よりも高かったが、尿DNA JI-Uシグナルと血漿DNA JI-Uシグナルとの間の周期性の位置には感知できるほどの差がなかった。
【0134】
図17Bは、対照対象及び膀胱がんの異なるステージを有する患者におけるワトソン鎖に由来する尿DNA分子についてのCTCF結合部位周囲のJI-U値を示す。y軸は、血漿DNA末端密度である。x軸は、CTCF結合部位からの塩基対における距離である。異なる色の線は、血尿を有するが膀胱がんを有しない対照対象(青色線1712)、低悪性度非筋肉浸潤性膀胱がん(NMIBC LG)(緑色線1716)、高悪性度非筋肉浸潤性膀胱がん(NMIBC HG)(黄色線1720)、及び筋肉浸潤性膀胱がん(MIBC)(赤色線1724)を示す。
図17Bに示されるように、CTCF付近のJI-U値はまた、膀胱がんを有しない患者と比較して、膀胱がんを有する患者の尿DNAにおいてより低く、典型的には、MIBC及び高悪性度NMIBCを有する患者において最も低いことが見出された。ワトソン鎖に由来する細胞DNA分子によって測定されるJI-U値のパターンは、クリック鎖からのそれらの値によって反映され得る。これらの結果は、ヌクレオソーム構造に沿ったJI-U値ががん検出のために使用され得ることを示唆した。
【0135】
上記のように、
図7Bは、ヌクレオソーム中心についての距離に対する血漿DNA及び尿DNAの両方についてのJI-U値を示す。JI-U値は、ヌクレオソーム中心までの同じ距離について、血漿DNAと比較して、尿DNAについてより高いことが観察された。
【0136】
不揃い末端がヌクレオソームリンカーDNA領域において優先的に生じるかどうかを更に検証するために、本発明者らは、各ヌクレオソームトラックの中心に対する断片を使用してJI-U値を計算した。ヌクレオソームトラック(1,037,961領域)は、以前に公開された試験から得られた(Gaffney et al.PLoS Genet.2012;8:e1003036)。
【0137】
B.CTCF部位での不揃い状態を使用した条件を差別化する際の精度
図18は、CTCF部位に対して0~500の範囲の位置についてのJI-Uの累積JI-U値を使用して、MIBCを有する患者と膀胱がんを有しない患者とを差別化するためのROCプロットを示す。感受性を、y軸上に示す。特異性を、x軸上に示す。
図17BにおけるCTCF部位に対して0~500の範囲の位置に沿ったJI-Uの累積JI-U値は、MIBCを有する患者と膀胱がんを有しない患者とを差別化する際に0.85のAUCを達成した。これらの結果は、ヌクレオソーム構造に沿った尿DNAのJI-U値ががん検出のために使用され得ることを示す。
【0138】
C.ヒストン修飾を有する領域での不揃い状態を使用した条件を差別化する際の精度
特定の領域における不揃い状態は、がん検出のために使用され得る。例えば、H3K4me1、H3K4me3、H3K36me3、H3K27me2、H3K9Ac、H3K27Ac、H4K16Ac、H3K27me3、及びH3K9me3を含む特定のヒストン修飾が使用され得る。H3K4me1及びH3K4me3が分析される。H3K4me1は、DNAパッケージングタンパク質ヒストンH3に作用するエピジェネティック修飾であり、ヒストンH3タンパク質の4番目のリジン残基でのモノメチル化を伴う。H3K4me1は、遺伝子エンハンサーに関連することが報告された。H3K4me3は、DNAパッケージングタンパク質ヒストンH3に作用するエピジェネティック修飾であり、ヒストンH3タンパク質の4番目のリジン残基でのトリメチル化を伴った。H3K4me3は、遺伝子発現を活性化することに関連することが報告された。
【0139】
図19A及び
図19Bは、これらのヒストン修飾に関連するゲノム領域に由来する尿DNA不揃い末端を分析することからの結果を示す。
図19A及び
図19Bは、累積JI-U値を使用して、MIBCを有する患者と膀胱がんを有しない患者とを差別化するためのROCプロットを示す。
図19Aは、H3K4me1ヒストン修飾に関連するゲノム領域を使用することについての結果を示す。
図19Bは、H3K4me3ヒストン修飾に関連するゲノム領域を使用することについての結果を示す。感受性は、両方のグラフにおけるy軸上に示され、特異性は、両方のグラフにおけるx軸上に示される。両図から分かるように、H3K4me3によってマークされたゲノム領域から推定されたJI-U値は、H3K4me1に関連するJI-U値(AUC:0.77)と比較して、膀胱がんを有する患者を、がんを有しない患者から差別化することにおいてより良好な性能(AUC:0.80)を生じた。この結果は、特定のエピジェネティック修飾に関連する不揃い末端の選択的分析が診断力を増強し得ることを示唆した。
【0140】
D.例示的な方法
図20は、個体から得られた生体試料を分析する方法2000を示す。生体試料は、本明細書に記載される任意の生体試料であり得る。生体試料は、複数の核酸分子を含み得る。複数の核酸分子は、無細胞であり得る。複数の核酸分子の各核酸分子は、末端で第1の部分を有する第1の鎖及び第2の鎖を有する二本鎖であり得る。複数の核酸分子のうちの少なくともいくつかの第1の鎖の第1の部分は、第2の鎖からの相補的な部分を有しない場合がある。第1の部分は、第2の鎖にハイブリダイズしない場合がある。第1の部分はまた、第1の鎖の第1の末端に存在し得る。第1の鎖の第1の部分は、第2の鎖からオーバーハングし得る。
【0141】
ブロック2002では、複数の核酸分子を配列決定して、配列リードを生成することができる。配列決定は、本明細書に開示される任意の技術によるものであり得る。
【0142】
ブロック2004では、配列リードを参照ゲノムに対してアライメントさせて、複数の核酸分子のゲノム位置を判定することができる。参照配列は、ヒト参照ゲノムであり得る。
【0143】
ブロック2006では、複数の核酸分子の核酸分子のセットが識別され得る。核酸分子のセットの各核酸分子は、ゲノム部位から特定の距離にゲノム位置を有し得る。ゲノム部位は、所定のタイプの部位であり得る。ゲノム部位は、ゲノム部位におけるクロマチン中のタンパク質の改変又はゲノム部位におけるタンパク質相互作用と関連し得る。ゲノム部位は、CTCF結合部位又はDNASE1高感受性部位(DHS)であり得る。ゲノム部位は、単一のゲノム座標に限定されるのではなく、ゲノム領域を指す場合がある。加えて、ゲノム部位は、特定のヒストン修飾を有する領域、例えば、H3K4me1、H3K4me3、H3K36me3、H3K27me2、H3K9Ac、H3K27Ac、H4K16Ac、H3K27me3、及びH3K9me3を含み得る。いくつかの実施形態では、ゲノム部位は、ヌクレオソーム中心、ヌクレオソームの末端、又はヌクレオソームに対応する領域であり得る。核酸分子のセットを識別することは、核酸分子のセットの各核酸分子を配列決定して、1つ以上のリードを生成することを含み得る。配列決定は、例えば本明細書に記載されるような様々な方法で実施することができる。例示的な技法は、プローブ、合成による配列決定、ライゲーション、及びナノポアを使用し得る。1つ以上のリードは、参照ゲノム(例えば、ヒト参照ゲノム)に対してアライメントされ得る。核酸分子のゲノム位置は、1つ以上のリードから判定され得る。
【0144】
ゲノム部位からの特定の距離は、ある範囲であり得る。例えば、この範囲は、0~40nt、40~70nt、70~100nt、100~130nt、130~160nt、160~190nt、190~200nt、200~250nt、250~300nt、300~350nt、350~400nt、400~500nt、500~750nt、750~1,000nt、又は1,000nt超であり得る。いくつかの実施形態では、指定された距離は、0ntであり得る。
【0145】
ブロック2008では、核酸分子のセットの各核酸分子についての第1の鎖及び/又は第2の鎖の特徴が測定され得る。特徴は、第2の鎖にオーバーハングするか又はハイブリダイズしない第1の鎖の長さに相関し得る(例えば、比例し得る)。特徴は、直接判定された長さを含む、本明細書に記載される任意の特徴であり得る。
【0146】
ブロック2010では、核酸分子のセットの測定された特徴を使用した不揃い指数値が判定され得る。不揃い指数値は、核酸分子のセットにおける別の鎖にハイブリダイズしていない鎖の長さの集合的尺度を提供し得る。不揃い指数値は、核酸分子のセットの不揃い末端の長さの統計値を含む、本明細書に記載される任意の不揃い指数値であり得る。
【0147】
不揃い指数値は、参照値と比較され得る。参照値は、状態を有する対象又は状態を有しない対象からの参照試料から判定され得る。参照値は、例えば本明細書に記載される任意の様式で判定され得る。
【0148】
ブロック2012では、個体の状態のレベルは、不揃い指数値に基づいて判定され得る。この判定は、不揃い末端値の参照値との比較に基づき得る。状態は、本明細書に記載される任意の状態であり得る。不揃い指数値が参照値を超える場合、状態は、存在する、可能性が高い、又は重度であると判定され得る。方法は、状態を治療することを含み得る。この治療は、本明細書に記載される任意の治療であり得る。
【0149】
いくつかの実施形態では、その判定は、例えば、
図6のブロック606について記載されるように、機械学習モデルを使用して実施され得る。
【0150】
VIII.3’末端のトリミングを有しない不揃い末端分析技術
本明細書における開示は、無細胞DNA(cfDNA)の豊富な一本鎖オーバーハングが血漿中だけでなく尿中にも存在することを示す。本発明者らの以前の研究は、配列決定(Jag-seq)による不揃い末端分析が不揃い末端の特徴を試験することを可能にすることを示しており、本発明者らは、血漿DNA中の不揃い末端が分子診断におけるバイオマーカーとして使用され得るという証拠を見出した(Jiang et al.,2020)。しかしながら、尿cfDNA中の不揃い末端の分子特徴に関する情報は少ない。したがって、本発明者らは、Jag-seqの改変バージョン(Jag-seqII)を尿cfDNAに適用して、不揃い末端の性質、特に、尿中の不揃い末端の長さ及び尿DNAにおける不揃い末端分析の適用について更に調査する。新しいバージョンであるJag-seqIIは、予想外に、不揃い末端の長さのより正確な判定、及び不揃い末端の長さの分析からもたらされる状態のレベルのより正確な判定を可能にする。オーバーハング5’末端は、オーバーハング3’末端をトリミングする処理なしで分析される。3’末端のトリミングを回避することにより、分析されるオーバーハング5’末端、特に、より短い5’末端オーバーハングの量を増加させる。
【0151】
A.cfDNA分子のオーバーハングを調べるための酵素処理
図21Aは、不揃い末端の長さを判定するための以前のJag-seqアプローチを示す。Jag-seqアプローチは、主に、5’突出末端及び平滑末端(例えば、断片2304)を判定することに適用された。ステージ2110は、5’突出末端を有する断片2104、及び3’突出末端を有する断片2108を示す。断片中のシトシンは、ほとんどメチル化されていない。
【0152】
ステージ2120は、3’突出末端がエキソヌクレアーゼであるExoTで除去された後の断片を示す。断片2108は、断片2112になる。断片2104は、影響を受けない。
【0153】
ステージ2130は、5’突出末端をクレノウ(exo-)で充填した後の断片2104の結果を示す。青色破線(例えば、線2116及び2118)は、平滑末端断片の新たに充填されたヌクレオチドを表している。5’オーバーハング分子中の3’末端を、dATP(A)、dTTP(T)、dGTP(G)、及びmdCTP(mC)で充填して、平滑末端を形成した。新たに充填されたヌクレオチドのシトシンはメチル化されているが、元の断片のシトシンはメチル化されていない。新たに充填されたヌクレオチドと元の断片との間のメチル化の差異は、メチル化プロファイルが不揃い末端の長さを示すことを可能にする。断片2112は、試料中に依然として存在し得るが、断片は後の不揃い末端分析に影響を及ぼさないので、もはや示されていない。
【0154】
ステージ2140は、PNKによる5’リン酸化後の平滑末端化断片を示す。ステージ2150は、配列決定アダプタ(例えば、アダプタ2122及び2124)とのライゲーション後の平滑末端断片を示す。
【0155】
ステージ2150の後、断片には、バイサルファイト処理が後続し得る。不揃い末端分析は、
図1におけるステージ120で記載されるように進み得る。3’オーバーハングを元々有していた断片(例えば、断片2308)は、これらの断片が不揃い末端を充填する新たなヌクレオチドを受容しないので、不揃い末端分析の考慮に入れない。
【0156】
図21Bは、cfDNAの断片化をよりよく理解するための不揃い末端検出のための、Jag-seqIIと呼ばれる改善された方法を示す。本発明者らは、3’突出末端に対するトリミング処理ステップを省略することによってJag-seq法を精緻化した。これは、3’オーバーハング分子中の3’突出末端が末端修復措置中に洗練化されなかったことを意味する。
【0157】
ステージ2160では、5’突出末端(断片2104)及び3’突出末端(断片2108)を有する両方の断片が存在する。ステージ2160は、ステージ2110と同等であり得る。次いで、断片は、Hemo Klen Taqで処理されて、5’突出末端を充填するが、3’トリム処理は、加えられない。
【0158】
ステージ2170は、5’突出末端が充填されて平滑末端断片を形成した後の断片を示す。断片2104は、断片2164になる。青色破線は、平滑末端断片の新たに充填されたヌクレオチドに対応する。新たに充填されたヌクレオチドのシトシンはメチル化されているが、元の断片のシトシンはメチル化されていない。他の実施形態では、新たに充填されたヌクレオチドは、メチル化されない場合があるが、一方、元の断片のヌクレオチドは、メチル化される。断片2108は、変化しないままである。
【0159】
ステージ2180は、PNKによる5’リン酸化後の断片を示す。断片2164は、リン酸化されて断片2168になる。断片2108は、リン酸化されて断片2172になる。
【0160】
ステージ2190は、配列決定アダプタ(例えば、アダプタ2182及び2184)とのライゲーション後の断片を示す。配列決定アダプタは、平滑末端断片に加えられて、断片2176になる。次いで、断片2176は、バイサルファイト配列決定を受け得、
図1におけるステージ120で記載されるように、不揃い末端について分析され得る。断片2172は、平滑末端ではなく、配列決定アダプタは、この断片に連結されない。その結果、断片2172は、バイサルファイト配列決定を受けない(赤色Xによって示されている)。
【0161】
この改善されたアプローチは、酵素トリミングによる人工的な改変なしに、突出3’末端の立体配置を保存する。この新しいアプローチは、特に、短い5’突出末端又は平滑末端を含有する分子について、先のアプローチよりも、不揃い末端長さの推定に対してより正確な性能を達成する。短い5’突出末端による改善は、以下により詳細に記載され、突出末端の分析における数個のヌクレオチドエラーは、不揃い末端の長さにおいてより大きいパーセンテージ差を生じる。3’突出末端のトリミングを回避することは、バイサルファイト配列決定後に判定される平滑末端のカウントを人為的に増加させない。
【0162】
図22A~
図22Fは、5’突出不揃い末端を有するスパイクイン分子に対するJag-seq技術及びJag-seqII技術を使用する効果を示す。スパイクインDNA分子は、既知の配列のDNA分子である。
図22Aは、1ntのスパイクイン不揃い末端の配列構造を示す。
図22Bは、14ntのスパイクイン不揃い末端の配列構造を示す。太字で下線を引いた塩基は、5’突出末端を表す。
【0163】
2つの分子は、より短い不揃い末端を含有する分子が、Jag-seqIIではなくJag-seqにおいて使用される3’末端トリミングステップによってより深刻な影響を受けるかどうかを試験するために設計された。両方の分子は、5’突出末端を有する鎖にハイブリダイズした鎖の3’末端にCヌクレオチドを含む。
図22Aは、末端における単一のCヌクレオチドを示す。
【0164】
図22Bに示すように、本発明者らは、短い方の鎖の3’末端に4つの連続したCを有する14ntの5’突出末端を有する46bpの分子を設計した。更に、より長い鎖の第1のオーバーハング塩基はGであり、これは、Gの相補的塩基であるmCが、末端修復ステップ中に第1の塩基として組み込まれることを可能にした。したがって、この特別な配列塩基組成を通して、本発明者らは、ライブラリー調製の間に作製された任意の人為的な不揃い末端を検出することができた。本発明者らは、
図22Dに示されるように、この分子をライブラリー調製中に内部対照として加えた。この分子により、本発明者らは、新しい配列決定プロトコルが末端修復プロセス中に不揃い末端を充填することを確認することができる。
【0165】
図22C~
図22Fは、既知の不揃い末端を有するスパイクイン配列についてのCの変換のグラフを示す。不揃い末端に充填するように加えられるCは、メチル化され、かつTに変換されない。元の分子の一部であるCはメチル化されず、かつTに変換される。1nt及び14ntの不揃い末端を有するスパイクイン配列の部分配列をx軸上に示す。大文字アルファベットで示されるヌクレオチドは、配列が二本鎖形態であることを示す。小文字アルファベット及び下線付きのヌクレオチドは、配列が末端修復中に新たに充填されることを示す。縦棒の網掛け部分は、T(変換されたC)の頻度を示す。縦棒の白い部分は、C(変換されていないC)の頻度を示す。
図22C及び
図22Dは、Jag-seqII技術を使用した結果である。
図22E及び
図22Fは、Jag-seq技術を使用した結果である。本発明者らは、取り込みステップにおいてメチル化Cを使用したために、末端修復前の元の配列に対応するヌクレオチドは、変換されたC(すなわち、T、灰色で示される)となり、一方、末端修復のためのヌクレオチドに対応するヌクレオチドは、変換されていないC(すなわち、C、白色で示される)となる。
【0166】
図22Dに示されるように、バイサルファイト配列決定後のJag-seqII技術を用いて、本発明者らは、DNA分子の元の二本鎖部分に位置するCの99.96%がTに変換され、一方、本発明者らが組み込みステップにおいてメチル化Cを使用したために、新たに充填されたC(メチル化)の98.32%がCとして残存したことを観察した。
【0167】
対照的に、
図22Fに示されるように、短い鎖中の最後の塩基におけるCの15.85%は、Jag-seqにおいて変換されていないC(すなわち、バイサルファイト処理前にmCで充填された)であり、これは、不揃い末端長さ推定又は不揃い末端長さを用いたその後の分析に対する精度に影響を及ぼす可能性があり得る。二本鎖上のより短い3’末端でのmCにおける望ましくない充填が、より短い3’末端が突出末端ではない場合であっても、Jag-seqにおける3’末端トリミングプロセスによって引き起こされた。
図22FにおけるJag-seqでの変換されていないCであった短い鎖における最後の塩基中のCの15.85%と比較して、
図22Dは、Jag-seqIIでは、有意に少ない変換されていないCを有することを示し、短い鎖における最後の塩基中のCの約0.04%のみが変換されていないCであった。
【0168】
図22Cは、Jag-seqII技術を用いると、二本鎖の最後の塩基上のCが、わずか0.19%のみが変換されていなかったことを示す。対照的に、
図22Eは、Jag-seq技術を用いると、最後の塩基上のCが、98.23%が変換されていなかったことを示す。言い換えれば、断片の99.81%が、改変Jag-seqIIプロトコルを用いて、元々設計された1ntの不揃い末端の長さと一致すると判定され、一方、断片の1.77%のみが、以前のJag-seqプロトコルを用いて、1ntの不揃い末端の長さと一致すると判定された。これらの結果は、洗練されたアプローチが分子末端の性質に影響を及ぼさないことを示し、したがって、本発明者らは、特に、短い5’不揃い末端について、正確な不揃い末端長推定の精度を首尾よく改善した。3’突出末端をトリミングする処理は、5’突出末端を有する断片の精度に影響を与えるとは予想されなかったことから、これらの改善された精度の結果は驚くべきものである。
【0169】
B.尿cfDNAにおける不揃い末端指数値及び平均不揃い末端長さ
不揃い末端分析におけるJag-seqIIの使用を確認した。尿試料中の断片を、不揃い末端長さと相関する、不揃い末端長さ及びメチル化レベルについて分析した。
【0170】
図23は、Jag-seqIIを使用した尿cfDNAにおける異なるサイズ範囲にわたるリード2(JI-M)におけるCHメチル化レベルのプロファイルのグラフを示す。ここで、CHメチル化は、HがA、C、又はTである任意のCのメチル化を含むが、HがGである場合は含まない。リード2は、5’突出末端を充填するように加えられたヌクレオチドを含むリードに対応する。この図では、リード2は、末端75ヌクレオチドを含む。JI-Mは、Jagged Index-Methylatedであり、これはリード2におけるCHメチル化レベルである。より高いJI-Mは、より多いメチル化及びより長い不揃い末端を示す。異なる線は、異なる健康な個体からの異なる試料を表す。
【0171】
本発明者らは、健康な尿試料に対してJag-seqIIを行って、尿不揃い末端の基本的特性を調べた。y軸は、リード2(JI-M)におけるCHメチル化レベルをパーセントとして示す。x軸は、断片サイズ(bp)を示す。1U~5Uについての異なる線は、異なる健康な個体を表す。JI-Mの値は、分子の異なるサイズにわたって変化し、波状パターンを示した。JI-Mは急速に増加し、断片サイズが約130bpであるときに約50%の小さなピークに達した。JI-Mは、240bpの分子サイズ付近の65%~80%の第1の主要ピークまで連続的に増加した。続いて、第2の主要ピークが約410bpの断片サイズで現れた。
【0172】
本発明者らの以前の試験(Jiang et al.,2020)は、非メチル化Cの隣のメチル化Cを使用して不揃い末端の開始を推測するCCタグ戦略が、正確な不揃い末端長さを推測するための解決策を提供することを見出した。例えば、元の断片の3’末端の最末端におけるCはメチル化され得る。5’突出末端を有する他方の鎖上の次のヌクレオチドは、Gである。その結果、不揃い末端を充填するために新たに加えられるヌクレオチドは、メチル化されていないCである。次いで、非メチル化Cに隣接するメチル化Cのパターンは、不揃い末端の正確な開始を識別し得る。本発明者らは、異なる分子サイズ下で平均及び中央不揃い末端長さを調べ、JI-Mのものと同様の波状パターンを観察した。
【0173】
図24A及び
図24Bは、尿cfDNA中の異なる断片サイズにわたる平均及び中央不揃い末端長さを示す。x軸は、両方の図において断片サイズ(bp)を示す。
図24Aのy軸は、平均(mean)不揃い末端長さを示す。
図24Bのy軸は、中央不揃い末端長さを示す。1U~5Uについての異なる線は、異なる健康な個体を表す。両方のグラフは、不揃い末端長さについての波状パターンを示す。2つのピーク間の距離は約170bpであり、これはヌクレオソームフットプリント法に対応する。これらの図は、不揃い末端プロファイリングを使用して、ヌクレオソームパターンを判定及びモニタすることができることを示す。
【0174】
C.がんバイオマーカー
尿cfDNAの不揃い末端の特徴が、がん診断の更なる分野を提供するための新しいバイオマーカーとして役立ち得るかどうかを更に調べるために、本発明者らは、がん患者の尿cfDNAにJag-seqIIを適用した。
【0175】
図25A及び
図25Bは、膀胱がん患者及び対照対象についてのJI-M及び平均不揃い末端長さについての箱ひげ図を示す。平均不揃い末端長さは、CCタグから判定された不揃い末端の全ての長さについての平均値である。グラフ中のx軸は、対照対象及び膀胱がん患者を示す。
図25Aのy軸は、JI-M値を示す。
図25Bのy軸は、平均不揃い末端長さ(nt)を示す。明らかに、膀胱がん患者におけるJI-M及び平均不揃い末端長さの両方(JI-M:中央値、40.69;範囲、34.11~44.25;平均不揃い末端長さ:中央値、22.10;範囲、18.83~24.01)は、健康な対照のもの(JI-M:中央値、48.14;範囲;範囲、37.94~56.46;平均不揃い末端長さ:中央値、25.16;範囲、20.30~26.63)と比較して、統計的に減少した。JI-M値又は平均不揃い末端長さは、膀胱がんについての可能性のあるバイオマーカーであることが示された。
【0176】
D.例示的な方法
図26は、試料中の断片の3’末端をトリミングなしに個体から得られた生体試料を分析することに関連する例示的なプロセス2600のフローチャートである。いくつかの実施態様では、
図26の1つ以上のプロセスブロックは、システム(例えば、
図34におけるシステム3400)によって実行され得る。いくつかの実施態様では、
図26の1つ以上のプロセスブロックは、システムとは別個の又はシステムを含む別のデバイス又はデバイスの群によって実行され得る。追加的に、又は代替的に、
図26の1つ以上のプロセスブロックは、プロセッサ3450、メモリ3435、外部メモリ3440、記憶デバイス3445、試料ホルダ3410、検出器3420、及び/又は論理システム3430などのシステム3400の1つ以上の構成要素によって実行され得る。
【0177】
生体試料は、第1の複数の核酸分子を含み、5’末端は3’末端からオーバーハングする。例えば、第1の複数の核酸分子は、
図21Bにおける断片2104を含み得る。第1の複数の核酸分子は、無細胞であり得る。第1の複数の核酸分子の各核酸分子は、第1の鎖及び第2の鎖を有する二本鎖である。各第1の鎖は、第2の鎖にハイブリダイズしていない第1の部分を含む。各第1の部分は、第1の鎖の5’末端にある。生体試料は、本明細書に記載される任意の生体試料であり得る。
【0178】
生体試料は、第2の複数の核酸分子を含み得、3’末端は5’末端からオーバーハングする。例えば、第2の複数の核酸分子は、
図21Bの断片2108を含み得る。第2の複数の核酸分子は、無細胞であり得る。第2の複数の核酸分子の各核酸分子は、第3の鎖及び第4の鎖を有する二本鎖である(第1の複数の核酸分子についての第1の鎖及び第2の鎖とは異なる条件である)。各第3の鎖は、第4の鎖にハイブリダイズしていない第1の部分を含む。各第1の部分は、第3の鎖の3’末端にある。生体試料は、第2の複数の核酸分子中の核酸分子以外の他方の鎖にハイブリダイズしていない一方の鎖の3’末端を有する二本鎖核酸分子を含まない場合がある。一部の実施形態では、第2の複数の核酸分子は、生体試料中のオーバーハング3’末端を有する全ての核酸分子の少なくとも50%、60%、70%、80%、90%、又は95%を含む。いくつかの実施形態では、第2の複数の核酸分子の数は、第1の複数の核酸分子の数の少なくとも50%、60%、70%、80%、90%、又は95%であり得る。いくつかの実施形態では、第1の複数の核酸分子及び/又は第2の複数の核酸分子は、本明細書に記載される任意のサイズ範囲を含むある特定のサイズ範囲であり得る。
【0179】
第1の複数の核酸分子の核酸分子中の第1のタイプのヌクレオチドは、全てメチル化され得るか、又は全て非メチル化されない場合がある。第1のタイプのヌクレオチドは、シトシン又は本明細書に記載される任意のヌクレオチドであり得る。例えば、
図21Bでは、
図21Bの断片2104中の全てのシトシンがメチル化され得る。いくつかの実施形態では、核酸分子中の第1のタイプのヌクレオチドは、ある特定のパーセンテージ(例えば、60%、70%、80%、90%、又は95%)を超えてメチル化又は非メチル化され得る。
【0180】
ブロック2604では、1つ以上のヌクレオチドを含む第1の化合物は、第1の複数の核酸分子の核酸分子の第1の鎖の第1の部分にハイブリダイズし得る。第1の化合物は、5’末端オーバーハングを充填し、不揃い末端を除去して平滑末端を形成することができる。例えば、第1の化合物は、
図21Bにおける断片2164内の青色破線であり得る。第1の化合物は、第2の鎖の3’末端に結合されて、伸長された核酸分子を形成する。伸長された核酸分子は、第1の化合物を含む3’末端を有する伸長された第2の鎖を有する。第1の化合物は、第2の鎖と接触しない3’末端を有する。例えば、
図21Bのステージ2170では、断片2164の青色破線の3’末端は、それが伸長する元の鎖と接触しない。第1の化合物は、第2の鎖とは異なるようにメチル化された第1のタイプのヌクレオチドを含み得る。例えば、第2の鎖における第1のタイプのヌクレオチドがメチル化される場合、第1の化合物における第1のタイプのヌクレオチドはメチル化されない。逆に、第2の鎖における第1のタイプのヌクレオチドがメチル化されない場合、第1の化合物における第1のタイプのヌクレオチドはメチル化される。第1の化合物中の各第1のタイプのヌクレオチドは、第2の鎖中の第1のタイプのヌクレオチドの各々とは反対のメチル化状態を有し得る。ブロック2604は、第1の複数の核酸分子の各核酸分子について反復され得る。
【0181】
生体試料は、ハイブリダイジング中、第2の複数の核酸分子を含み得る。例えば、第2の複数の核酸分子の核酸分子の第1の部分を除去するように構成された酵素は、生体試料に添加されない場合がある。例えば、エキソヌクレアーゼは、生体試料に添加されない。生体試料は、平滑末端核酸分子を形成するようにトリミングされた第2の複数の核酸分子のオーバーハング3’末端を有しない場合がある。第2の複数の核酸分子は、
図21Bにおける断片2108と同様に、トリミングされた3’突出末端を有するのではなく、3’オーバーハングを維持し得る。
【0182】
いくつかの実施形態では、方法2600は、複数の伸長された核酸分子のサイズをリン酸化することを含み得る。プロセス2600はまた、第2の複数の核酸分子をリン酸化することを含み得る。例えば、5’末端は、
図21Bのステージ2180におけるようにリン酸化され得る。アダプタが、伸長された核酸分子に加えられ得る。第2の複数の核酸分子は、アダプタが加えられていない場合がある。
【0183】
ブロック2606では、第1の化合物中の第1のタイプのヌクレオチドか、又は第2の鎖中の第1のタイプのヌクレオチドのいずれかが、第2のタイプのヌクレオチドに変換され得る。第2のタイプのヌクレオチドは、第1のタイプのヌクレオチドと異なり得る。変換は、バイサルファイト処理によるものであり得る。例えば、第2のタイプのヌクレオチドは、ウラシルであり得、一方、第1のタイプのヌクレオチドは、シトシンである。シトシン、特に、非メチル化シトシンは、バイサルファイト処理によってウラシルに変換され得る。変換は、生体試料中で起こり得、生体試料は、変換中に第2の複数の核酸分子を含み得る。
【0184】
いくつかの実施形態では、第2の鎖中の第1のタイプのヌクレオチドが変換され得る。次いで、この方法はまた、第2の複数の核酸分子中の第1のタイプのヌクレオチドを変換することを含み得る。例えば、第2の複数のヌクレオチドは、非メチル化シトシンを変換することから生じるウラシルを含み得る。
【0185】
ブロック2608では、第1のメチル化状態は、第1の化合物中の第1のタイプのヌクレオチドに対応する1つ以上の部位の各々について判定され得る。メチル化状態は、第2のタイプのヌクレオチドの同一性を判定することによって判定され得る。例えば、第1の化合物中の第1のタイプのヌクレオチドは、第2のタイプのヌクレオチドに変換され得る。第2のタイプのヌクレオチドは、第1のタイプのヌクレオチドと異なり得る。例えば、ウラシルは、第1の化合物中で識別され得、これは、ブロック2608におけるバイサルファイト処理の前にウラシルが非メチル化シトシンであり、第1のメチル化状態が非メチル化であることを意味する。ヌクレオチドの同一性は、本明細書に記載されるものを含む、任意の好適な配列決定技術によって判定され得る。
【0186】
別の例として、第2の鎖中の第1のタイプのヌクレオチドが第2のタイプのヌクレオチドに変換される場合、第1の化合物中のヌクレオチドはシトシンであると判定され得、これは、第1の化合物がメチル化シトシンを含むことを意味する。次いで、第1のメチル化状態がメチル化される。ブロック2608は、第1の複数の核酸分子の各核酸分子について反復され得る。
【0187】
いくつかの実施形態では、メチル化レベルは、第1のメチル化状態を使用して計算され得る。メチル化レベルは、第1の複数の核酸分子においてメチル化される(又はメチル化されない)部位のパーセンテージ、割合、又は数であり得る。
【0188】
いくつかの実施形態では、メチル化レベルを使用した不揃い指数値が判定され得る。不揃い指数値は、第1の複数の核酸分子中の別の鎖にハイブリダイズしていない鎖の長さの集合的尺度を提供し得る。不揃い指数値は、JI-U、JI-M、又は本明細書で記載される任意の指数値を含み得る。不揃い指数値は、ある特定の断片サイズについてのものであり得る。
【0189】
いくつかの実施形態では、プロセス2600は、複数の第1のメチル化状態を使用して、第1の複数の核酸分子の各第1の化合物の長さを判定することを含み得る。長さは、メチル化の量に基づいて判定され得る。いくつかの実施形態では、正確な長さは、異なるメチル化状態を示す同じタイプの連続する部位に基づいて判定され得る(例えば、
図24A及び
図24Bにおいて、CCヌクレオチドを使用して、長さを測定する)。第1のタイプのヌクレオチドは、第2のタイプのヌクレオチドに隣接する。
【0190】
図26は、プロセス2600の例示的なブロックを示すが、いくつかの実装形態では、プロセス2600は、
図26に示されるブロックに追加のブロック、それらよりもより少ないブロック、それらとは異なるブロック、又はそれらとは異なるように配置されたブロックを含み得る。追加的に、又は代替的に、プロセス2600のブロックのうちの2つ以上が、並列して実行され得る。
【0191】
IX.尿CFDNAにおける不揃い末端長さの周期性パターン
尿中の無細胞DNAは、不揃い末端長さの頻度において周期的な挙動を示す。尿中の無細胞DNA断片の周期性は、対象の状態のレベルを分類するのに役立ち得る。状態は、がん、例えば、腎臓がんを含み得る。
【0192】
図27は、セクションVIII.Bに記載されるCCタグ技術を使用することによって推定される、尿中の不揃い末端長さの分布のグラフを示す。x軸は、不揃い末端長さをヌクレオチドで示す。y軸は、0~74ntの不揃い末端長さサイズの頻度(%)を示す。CCタグ技術は、
図24A及び
図24Bを用いて上述されている。
【0193】
図27は、概して、不揃い末端がより長くなる場合、相対頻度はゆっくりと減少することを示す。例えば、40ntの不揃い末端を有する断片は、10ntの場合よりも少ない。この漸減に加えて、尿cfDNAの不揃い末端長さは、約10ntの周期性パターンを示し、これは血漿DNA中の不揃い末端では見られなかった。周期性パターンをより詳細に見ることによって、不揃い末端の周期性の幅は、異なる個体間で変化するために、本発明者らの注目を集めた。不揃い末端の周期性の幅を分析するために、以下の式に示す数学的アプローチによって波の強度(例えば、合計7つのピークについて)を計算した。
【0194】
【0195】
式中、pは特定のピークの頻度であり、vl/vrは相対的な左(右)谷の頻度である。不揃い末端長さ周期性指数は、ピークと谷との間の差の尺度を提供する。
ピークと谷との間の差を定量化する他の指数がまた、使用され得る。
【0196】
より高い不揃い末端長さ周期性指数は、不揃い末端長さ分布のより強い10ntの周期性パターンを示す。本発明者らは、更に分析して、不揃い末端長さ周期性指数が断片の長さによって影響され得るかどうかを調べる。
【0197】
図28は、異なる断片サイズにわたる周期性指数のグラフを示す。x軸は、断片サイズを塩基対で示す。y軸は、不揃い末端長さ周期性指数を示す。
図28に示されるように、不揃い末端長さの周期性指数により、断片長さが170bp未満である場合に、異なる断片サイズにわたる10ntの周期性パターンが明らかなった。例えば、本発明者らは、90bp、100bp、111bp、121bp、132bp、及び142bpにおける不揃い末端長さの周期性指数の多数のピーク、並びに85bp、95bp、106bp、116bp、127bp、137bp、及び148bpにおける不揃い末端長さの周期性指数の多数の谷を観察した。
【0198】
A.腎細胞がんを判定するための不揃い末端長さ周期性指数
不揃い末端長さ周期性指数は、腎細胞がん(RCC)を有する対象と健常対照対象とを差別化するために使用され得る。不揃い末端長さ周期性指数は、不揃い末端値を使用するよりも有効なバイオマーカーであり得る。
【0199】
図29Aは、対照対象及びRCCを有する対象についての不揃い末端長さ周期性指数のグラフを示す。x軸は、対照対象及びRCC(すなわち、腎臓がん)を有する対象を示す。y軸は、不揃い末端長さ周期性指数を示す。
図29Aに示されるように、腎臓がん尿試料は、より高い不揃い末端長さ周期性指数値と関連付けられた。RCC対象の不揃い末端長さ周期性指数値(中央値、0.41;範囲(0.21~0.58)は、健常対照対象(中央値、0.25;範囲、0.12~0.42)よりも有意に高いことが見出された。
【0200】
図29Bは、対照対象及びRCCを有する対象についての平均不揃い末端長さのグラフを示す。x軸は、対照対象及びRCC(すなわち、腎臓がん)を有する対象を示す。縦軸は、平均不揃い末端長さ(nt)を示す。このグラフは、対照対象とRCC対象との間に平均不揃い末端長さについて統計的有意差が存在しないことを示す。対照対象及びRCC対象もまた、JI-Mで統計的に有意な差を示さなかった。
【0201】
図29Cは、対照対象とRCCを有する対象とを差別化するために周期性指数及び平均不揃い末端長さを使用するためのROC曲線を示す。周期性指数を使用した場合の曲線下面積(AUC)は、0.857である。対照的に、平均不揃い末端長さを使用した場合のAUCは、0.629であり、これは、平均不揃い末端長さが健常対照対象とRCCを有する対象とを差別化するのに有効ではないことを示している。驚くべきことに、不揃い末端長さ周期性指数は、尿試料中の腎がん患者と非がん患者との識別を可能にするシグネチャーである。
【0202】
B.尿cfDNAにおける不揃い末端長さ周期性に対するヘパリン処理の効果
尿の不揃い末端長さに現れた特有の周期性パターンは、不揃い末端の生成の根底にある機構を更に調査する動機を本発明者らに与えた。
【0203】
不揃い長さ分布の10bp周期性が、ヌクレオソーム立体構造に関連するかどうかは不明である。DNA断片サイズの10ntの周期性切断パターンは、二本鎖DNA上の単一切断を好むDNaseIの消化によって引き起こされる可能性が高く、同時に、ヒストン-DNA結合構造に大きく依存することが報告された(Suck,1994)。以前の試験によりまた、ヘパリンが、ヒストン結合を弛緩させることによってクロマチン構造を破壊し得、したがって、DNAアクセス可能性を増加させ得ることが見出された(Villeponteau,1992)。したがって、この変化したヌクレオソーム立体構造は、主要なヌクレアーゼの1つであるDNaseIによる消化に対してより高い感受性を示した(Brotherton et al.,1989)。これらの試験に基づいて、本発明者らは、次いで、ヌクレオソーム構造が尿cfDNAにおける不揃い末端長さの10ntの周期性パターンの生成を伴い得るかどうかを理解することを目的とした一連のヘパリン処理実験を実行した。
【0204】
図30は、ヘパリンインキュベーション処理による尿cfDNAのサイズプロファイルを示す。x軸は、断片サイズ(bp)を示す。y軸は、頻度(%)を示す。異なる線は、異なる処理を示す。赤色(線3002)、青色(線3004)、緑色(線3006)、及び紫色(線3008)の線は、それぞれ、EDTA0時間、ヘパリン0時間、ヘパリン0.5時間、及びヘパリン1時間処理を表す。時間は、室温でのインビトロインキュベーションの持続時間を表す。処理には、続いてJag-seqIIが後続された。EDTAによる処理は、不揃い末端長さ周期性を変化させると予想されず、ヘパリンによる処理と比較するための対照として役立つ。
【0205】
EDTA0時間処理(線3002)と比較して、10ntの不揃い末端長さ周期性の振幅は、ヘパリンによって0時間処理した場合(線3004)よりもわずかに弱かった。興味深いことに、ヘパリンのインキュベーション時間が増加するにつれて、周期性は徐々に消失し始めた。注目すべきことに、ヘパリンによる1時間の処理(線3008)により、クロマチン構造の破壊の増加に起因して、尿cfDNAにおける10bpの不揃い末端長さ周期性パターンのほとんど全ての消失がもたらされた。
【0206】
図31は、ヘパリンインキュベーション処理による尿cfDNAにおける不揃い末端長さ分布を示す。x軸は、不揃い末端長さ(nt)を示す。y軸は、頻度(%)を示す。赤色(線3102)、青色(線3104)、緑色(線3106)、及び紫色(線3108)の線は、それぞれ、EDTA0時間、ヘパリン0時間、ヘパリン0.5時間、及びヘパリン1時間処理を表す。
図31の場合の基礎となるデータは、
図30の場合と同じである。
【0207】
本発明者らは、ヘパリン処理が、クロマチン構造を変化させることにより尿の不揃い末端の生成及び分布に影響を及ぼすかどうかを調査した。
図31に示すように、10ntの不揃い末端長さ周期性パターンは、尿試料をヘパリンで0時間処理した場合には、著しく弱かった。ヘパリンインキュベーション時間が1時間に達すると、周期性パターンはほぼ消失した。
図31は、ヘパリン処理時間の増加が周期性を減少させるようであることを示す。
【0208】
図32A、
図32B、及び
図32Cは、EDTA及びヘパリンインキュベーションの異なる期間についてのJI-M、平均不揃い末端長さ、及び不揃い末端長さ周期性指数の分析を示す。
図32A~
図32Cでの基礎データは、
図30及び
図31におけるのと同じである。
図32A~
図32Cでは、x軸は、異なる処理(異なるインキュベーション時間に対するEDTA又はヘパリン)を示す。
【0209】
図32Aでは、y軸は、JI-M指数である。
図32Bでは、y軸は、平均不揃い末端長さ(nt)である。
図32A及び
図32Bでは、本発明者らは、JI-Mの値及び平均不揃い末端長さが、EDTA0時間処理とヘパリン0時間処理との間で有意に異ならないことを見出した。次いで、長期間(0.5時間又は1時間)のヘパリンインキュベーションとともに、JI-M及び平均不揃い末端長さは、徐々に減少した。
【0210】
図32Cは、y軸上の不揃い末端長さ周期性指数を示す。
図32Cは、EDTA0時間処理と比較して、ヘパリン0時間処理による周期性指数の大きな低減を示す。より長いヘパリン処理時間により、不揃い末端長さ周期性指数のより小さい低減がもたらされた。
【0211】
図32A~
図32Cをまとめると、これらの結果は、不揃い末端長さの10ntの周期性パターンが、DNaseIの活性レベルと組み合わされた、ヒストン及び尿cfDNA結合構造と密接に関連することを強く示唆した。
【0212】
C.例示的な方法
図33は、無細胞DNA断片の不揃い末端長さに関連する周期性を使用して、生体試料を分析して、状態のレベルを分類することに関連する例示的なプロセス3300のフローチャートである。いくつかの実施態様では、
図33の1つ以上のプロセスブロックは、システム(例えば、
図34におけるシステム3400)によって実行され得る。いくつかの実施態様では、
図33の1つ以上のプロセスブロックは、システムとは別個の又はシステムを含む別のデバイス又はデバイスの群によって実行され得る。追加的に、又は代替的に、
図33の1つ以上のプロセスブロックは、プロセッサ3450、メモリ3435、外部メモリ3440、記憶デバイス3445、試料ホルダ3410、検出器3420、及び/又は論理システム3430などのシステム3400の1つ以上の構成要素によって実行され得る。
【0213】
生体試料は、複数の核酸分子を含み得る。いくつかの実施形態では、生体試料は、尿、血清、唾液、又は血漿以外の本明細書に記載される任意の試料であり得る。複数の核酸分子は、無細胞であり得る。複数の核酸分子の各核酸分子は、第1の部分を有する第1の鎖及び第2の鎖を有する二本鎖であり得る。複数の核酸分子のうちの少なくともいくつかの第1の鎖の第1の部分は、第2の鎖からの相補的部分を有せず、第2の鎖にハイブリダイズせず、かつ第1の鎖の第1の末端に存在する。複数の核酸分子は、50~170nt、50~100nt、100~140nt、140~170nt、170~200nt、200~240nt、又は240nt超の範囲内にあるサイズを有する。複数の核酸分子は、分析のための統計的に有意な数であり得、これは、本明細書に記載される無細胞核酸分子について任意の数であり得る。
【0214】
ブロック3302では、複数の核酸分子の各核酸分子の特徴が測定される。特徴は、第2の鎖にオーバーハングするか又はハイブリダイズしない第1の鎖の長さに相関する(例えば、比例する)。特徴は、長さであり得る。いくつかの実施形態では、特徴は、メチル化レベルであり得る。特徴は、各核酸分子についての第1の鎖及び/又は第2の鎖について測定され得る。
【0215】
ブロック3304では、ヒストグラムが作成され得る。ヒストグラムは、測定された特徴の複数の値の各々を有する核酸分子の量を測定することによって作成され得る。ヒストグラムは、異なる不揃い末端長さに対して量(例えば、頻度)をプロットし得る。ヒストグラムの例は、
図27又は
図31を含む。ヒストグラムは、グラフとして提示されない場合がある。いくつかの実施形態では、ヒストグラムは、表形式であり得る。
【0216】
ブロック3306では、複数のピーク量及び複数の局所的最小量が、ヒストグラムを使用して識別され得る。ピーク量は、局所的最大量であり得る。ピーク量及び局所的最小量は、ヒストグラムから視覚的に判定され得る。いくつかの実施形態では、ピーク量及び局所的最小量は、数学的に判定され得る。例えば、ピーク量又は局所的最小量は、ヒストグラムの導関数が0であるときに判定され得る。ピーク量は、二次導関数が負であるときであり得る。局所的最小量は、二次導関数が正であるときであり得る。
【0217】
複数のピーク量が、測定された特徴の周期的間隔で現れる場合がある。例えば、ピーク量は、波状パターンの頂点に現れる場合がある。測定された特徴の周期的間隔は、9~11nt、5~9nt、12~15nt、15~20nt、20~25nt、又はそれ以上の長さに対応し得る。局所的最小量は、測定された特徴の周期的間隔で現れ得る。例えば、複数の局所的最小量が、波状パターンの底部に現れ得る。複数のピーク量は、2、3、4、5、6、7、8、9、10、又はそれ以上のピーク数であり得る。複数の局所的最小量の数が、2、3、4、5、6、7、8、9、10、又はそれ以上であり得る。いくつかの実施形態では、複数のピーク量及び複数の局所的最小量は、ヒストグラムに存在する全てのピーク量及び全ての局所的最小量を含まない場合がある。例えば、短い(例えば、5nt未満の)不揃い末端長さ又は長い不揃い末端長さでのピーク量及び局所的最小量は除外され得る。
【0218】
ブロック3308では、不揃い指数値が判定され得る。不揃い指数値は、複数のピーク量及び複数の局所的最小量を使用して判定され得る。不揃い指数値は、ピーク量の、局所的最小量に対する集合的尺度を提供し得る。いくつかの実施形態では、不揃い指数値は、複数のピーク量のみ又は複数の局所的最小量のみを使用して判定され得る。例えば、不揃い指数値は、複数のピーク量の頻度、周期、又は振幅を使用して判定され得る。いくつかの例では、不揃い指数値は、複数の局所的最小量の頻度、周期、又は振幅を使用して判定され得る。平均若しくは中央頻度、周期、又は振幅が使用され得る。
【0219】
不揃い指数値は、複数の局所的最小量の振幅を使用して判定され得る。不揃い指数値は、複数のピーク量の各ピーク量の、少なくとも1つの隣接する局所的最小量との比較を使用して判定され得る。比較は、差、和、比、又は積を含み得る。不揃い指数値は、上述した周期性指数であり得る。
【0220】
不揃い指数値は、参照値と比較され得る。参照値は、状態を有する対象の1つ以上の参照試料を使用して判定され得るか、又は参照値は、状態を有しない対象の1つ以上の参照試料を使用して判定され得る。参照値は、状態を有する対象又は状態を有しない対象についての期待値からの統計的有意差を示す閾値であり得る。例えば、参照値は、参照対象についての平均不揃い指数値からの1、2、又は3標準偏差に設定され得る。いくつかの実施形態では、参照値は、より早い時点での(例えば、がん治療の前又は健常なベースライン状態からの)同じ被験体からの不揃い指数値であり得る。
【0221】
ブロック3310では、個体の状態のレベルを、不揃い指数値を使用して判定され得る。この判定は、不揃い指数値を参照値と比較することに基づき得る。状態は、がんであり得る。例えば、状態は、腎臓がんであり得る。分類は、不揃い指数値が参照値を超える場合にがんが存在することであり得る。分類は、本明細書に記載される任意の分類であり得る。分類は、がんの重症度であり得、これは、がんのステージを含み得る。分類は、がんが多かれ少なかれ重篤になっていることであり得る。
【0222】
プロセス3300は、状態を処置することを更に含み得、これは、方法600を含む、本明細書に記載される任意の治療であり得る。
【0223】
図33は、プロセス3300の例示的なブロックを示すが、いくつかの実装形態では、プロセス3300は、
図33に示されているブロックへの追加のブロック、それより少ないブロック、それとは異なるブロック、又はそれとは異なるように配置されたブロックを含み得る。追加的に、又は代替的に、プロセス3300のブロックのうちの2つ以上が、並列に実行され得る。
【0224】
X.例示的なシステム
図34は、本発明の実施形態による測定システム3400を例示している。示されるシステムは、試料ホルダ3410内の無細胞DNA分子などの試料3405を含み、試料3405は、アッセイ3408と接触して、物理的特徴3415の信号を提供し得る。試料ホルダの例は、アッセイのプローブ及び/若しくはプライマー、又はその中をドロップレットが(アッセイを含むドロップレットとともに)移動するチューブを含む、フローセルであり得る。試料からの物理的特徴3415(例えば、蛍光強度、電圧、又は電流)は、検出器3420によって検出される。検出器3420は、データ信号を構成するデータポイントを得るために、間隔(例えば、周期的間隔)を空けて測定を行うことができる。一実施形態では、アナログ-デジタル変換器は、検出器からのアナログ信号をデジタル形態へと、複数回、変換する。試料ホルダ3410及び検出器3420は、アッセイデバイス、例えば、本明細書に記載される実施形態に従って配列決定を実行する配列決定デバイスを形成し得る。データ信号3425は、検出器3420から論理システム3430に送信される。データ信号3425は、ローカルメモリ3435、外部メモリ3440、又は記憶デバイス3445に保存され得る。
【0225】
論理システム3430は、コンピュータシステム、ASIC、マイクロプロセッサなどであり得るか、又はそれらを含み得る。それはまた、ディスプレイ(例えば、モニタ、LEDディスプレイなど)、及びユーザ入力デバイス(例えば、マウス、キーボード、ボタンなど)を含み得るか、又はそれらに連結され得る。論理システム3430及び他の構成要素は、スタンドアローン若しくはネットワーク接続されたコンピュータシステムの一部であり得るか、又は検出器3420及び/又は試料ホルダ3410を含むデバイス(例えば、配列決定デバイス)に直接取り付けられ得るか、又は組み込まれ得る。論理システム3430はまた、プロセッサ3450で実行するソフトウェアを含み得る。論理システム3430は、本明細書に記載される方法のいずれかを実行するようにシステム3400を制御するための指示を記憶するコンピュータ可読媒体を含み得る。例えば、論理システム3430は、配列決定又は他の物理的動作が実行されるように、試料ホルダ3410を含むシステムにコマンドを提供し得る。そのような物理的動作は、特定の順序で実行され得、例えば、試薬は、特定の順序で添加及び除去される。そのような物理的動作は、試料を取得してアッセイを実行するように使用され得るように、例えば、ロボットアームを含む、ロボットシステムによって実行され得る。
【0226】
本明細書で言及されるコンピュータシステムのうちのいずれも、任意の好適な数のサブシステムを利用し得る。そのようなサブシステムの例は、
図35においてコンピュータシステム10に示されている。いくつかの実施形態では、コンピュータシステムは、単一のコンピュータ装置を含み、サブシステムは、コンピュータ装置の構成要素であり得る。他の実施形態では、コンピュータシステムは、各々がサブシステムであり、内部構成要素を備える、複数のコンピュータ装置を含み得る。コンピュータシステムは、デスクトップコンピュータ及びラップトップコンピュータ、タブレット、携帯電話、並びに他の携帯デバイスを含み得る。
【0227】
図35に示されるサブシステムは、システムバス75を介して相互接続される。プリンタ74、キーボード78、記憶デバイス79、ディスプレイアダプタ82に結合されたモニタ76(例えば、LEDなどのディスプレイスクリーン)、及び他などの追加のサブシステムが示されている。I/Oコントローラ71に結合する周辺機器及び入力/出力(I/O)デバイスは、入力/出力(input/output、I/O)ポート77(例えば、USB、FireWire(登録商標))などの当該技術分野において既知である任意の数の手段によって、コンピュータシステムに接続され得る。例えば、I/Oポート77又は外部インターフェース81(例えば、Ethernet、Wi-Fiなど)を使用して、Internetなどの広域ネットワーク、マウス入力デバイス、又はスキャナに、コンピュータシステム10を接続することができる。システムバス75を介した相互接続は、中央プロセッサ73が、各サブシステムと通信し、システムメモリ72又は記憶デバイス79(例えば、ハードドライブ又は光ディスクなどの固定ディスク)からの複数の命令の実行、及びサブシステム間の情報交換を制御することを可能にする。システムメモリ72及び/又は記憶デバイス79は、コンピュータ可読媒体を具現化し得る。別のサブシステムは、カメラ、マイクロホン、及び加速度計などのデータ収集デバイス85である。本明細書に言及されるデータのうちのいずれも、1つの構成要素から別の構成要素に出力され得、ユーザに対して出力され得る。
【0228】
コンピュータシステムは、例えば、外部インターフェース81によって、内部インターフェースによって、又は1つの構成要素から別の構成要素に接続することができる取り外し可能な記憶デバイスを介してともに接続される、複数の同じ構成要素又はサブシステムを含み得る。いくつかの実施形態では、コンピュータシステム、サブシステム、又は装置は、ネットワーク上で通信することができる。そのような例においては、1つのコンピュータは、クライアント及び別のコンピュータをサーバとみなされ得、各々は、同じコンピュータシステムの一部であり得る。クライアント及びサーバは各々、複数のシステム、サブシステム、又は構成要素を含むことができる。
【0229】
実施形態の態様は、ハードウェア回路構成(例えば、アプリケーション特異的集積回路又はフィールドプログラマブルゲートアレイ)を使用して、及び/又はモジュール式若しくは統合様式で概してプログラム可能なプロセッサとともにコンピュータソフトウェアを使用して、制御論理の形態で実行され得る。本明細書で使用される場合、プロセッサは、シングルコアプロセッサ、同じ集積チップ上のマルチコアプロセッサ、又は単一の回路基板上の若しくはネットワーク化された複数の処理ユニット、並びに専用のハードウェアを含み得る。本開示及び本明細書に提供される教示に基づいて、当業者は、ハードウェア、及びハードウェアとソフトウェアとの組み合わせを使用して、本発明の実施形態を実装する他の様式及び/又は方法を認識かつ理解するであろう。
【0230】
本出願で記載されるソフトウェア構成要素又は機能のうちのいずれも、例えば、Java、C、C++、C#、Objective-C、Swiftなどの任意の好適なコンピュータ言語、又は、例えば、従来の技術若しくは物体指向の技術を使用するPerl若しくはPythonなどのスクリプト言語を使用する、プロセッサによって実行されるソフトウェアコードとして実装され得る。ソフトウェアコードは、保存及び/又は伝送のためのコンピュータ可読媒体上に一連の命令又はコマンドとして記憶され得る。好適な非一時的コンピュータ可読媒体は、ランダムアクセスメモリ(random access memory、RAM)、読み出し専用メモリ(read only memory、ROM)、磁気媒体(ハードドライブ若しくはフロッピーディスクなど)、又は光学媒体(コンパクトディスク(compact disk、CD)若しくはDVD(digital versatile disk、デジタル多用途ディスク)など、又はブルーレイディスク、フラッシュメモリなどを含み得る。コンピュータ可読媒体は、そのような記憶デバイス又は伝送デバイスの任意の組み合わせであり得る。
【0231】
そのようなプログラムはまた、インターネットを含む様々なプロトコルに従う有線ネットワーク、光ネットワーク、及び/又は無線ネットワークを介した伝送に適合した搬送波信号を使用して、コード化されかつ伝送され得る。したがって、コンピュータ可読媒体は、そのようなプログラムでコード化されたデータ信号を使用して作成され得る。プログラムコードでコード化されたコンピュータ可読媒体は、互換性のあるデバイスでパッケージ化され得るか、又は他のデバイスとは別個に(例えば、インターネットダウンロードを介して)提供され得る。任意のそのようなコンピュータ可読媒体が、単一のコンピュータ製品(例えば、ハードドライブ、CD、又はコンピュータシステム全体)上又は内に存在し得、システム又はネットワーク内の異なるコンピュータ製品上又は内に存在し得る。コンピュータシステムは、本明細書に記載の結果のうちのいずれかをユーザに提供するための、モニタ、プリンタ、又は他の好適なディスプレイを含み得る。
【0232】
本明細書に記載される方法のいずれも、ステップを実行するように構成することができる1つ以上のプロセッサを含むコンピュータシステムを用いて全体的に又は部分的に実行され得る。プロセッサを用いて実行される任意の動作(例えば、アライメントさせること、判定すること、比較すること、コンピューティングすること、計算すること)が、リアルタイムで実行され得る。したがって、実施形態は、本明細書に記載される方法のうちのいずれかのステップを実行するように構成されたコンピュータシステムを対象とし得、潜在的には異なる構成要素がそれぞれのステップ又はそれぞれのステップの群を実行する。本明細書の方法のステップは、番号付けされたステップとして提示されているが、同時に若しくは異なる時間に、又は異なる順序で実行され得る。更に、これらのステップの部分は、他の方法からの他のステップの部分と使用され得る。また、あるステップの全て又は部分は、任意選択的であり得る。更に、方法のうちのいずれかのステップのいずれも、これらのステップを実行するためのシステムのモジュール、ユニット、回路、又は他の手段で実行され得る。
【0233】
特定の実施形態の具体的な詳細は、本発明の実施形態の趣旨及び範囲から逸脱することなく、任意の好適な様式で組み合わせられ得る。しかしながら、本発明の他の実施形態は、各個々の態様、又はこれらの個々の態様の特定の組み合わせに関する特定の実施形態を対象とし得る。
【0234】
本開示の例示的実施形態の上の記載は、例示及び記載の目的のために提示されている。網羅的であること、又は本開示を記載された正確な形態に限定することは意図されず、多くの修正及び変更が、上の教示に鑑みて可能である。
【0235】
「a」、「an」、又は「the」の記述は、それとは反対に具体的に示されない限り、「1つ以上」を意味することが意図される。「又は」の使用は、それとは反対に具体的に示されない限り、「排他的な又は」ではなく「包括的な又は」を意味するように意図される。「第1」の構成要素への言及は、第2の構成要素が提供されることを必ずしも必要としない。更に、「第1」又は「第2」の構成要素への言及は、明示的に述べられていない限り、言及される構成要素を特定の場所に限定するものではない。「~に基づいて」という用語は、「少なくとも一部に基づいて」を意味することを意図している。
【0236】
本明細書で言及される全ての特許、特許出願、刊行物、及び明細書は、全ての目的のために参照によりそれらの全体が組み込まれる。いかなるものも、先行技術であるとは認められるものではない。
XI.参考文献
Brotherton,T.W.,Jagannadham,M.V.,& Ginder,G.D.(1989).Heparin Binds to Intact Mononucleosomes and Induces a Novel Unfolded Structure.Biochemistry.https://doi.org/10.1021/bi00434a055
Jiang,P.,Xie,T.,Ding,S.C.,Zhou,Z.,Cheng,S.H.,Chan,R.W.Y.,Lee,W.S.,Peng,W.,Wong,J.,Wong,V.W.S.,Chan,H.L.Y.,Chan,S.L.,Poon,L.C.Y.,Leung,T.Y.,Chan,K.C.A.,Chiu,R.W.K.,& Lo,Y.M.D.(2020).Detection and characterization of jagged ends of double-stranded DNA in plasma.Genome Research、30、(8).https://doi.org/10.1101/gr.261396.120
Suck,D.(1994).DNA recognition by DNase I.In Journal of Molecular Recognition.https://doi.org/10.1002/jmr.300070203
Villeponteau,B.(1992).Heparin increases chromatin accessibility by binding the trypsin-sensitive basic residues in histones.Biochemical Journal.https://doi.org/10.1042/bj2880953
【国際調査報告】