(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-08-31
(54)【発明の名称】無細胞核酸についてのヌクレアーゼに関連する末端シグネチャ分析
(51)【国際特許分類】
C12Q 1/6883 20180101AFI20230824BHJP
C12N 15/09 20060101ALI20230824BHJP
C12Q 1/44 20060101ALI20230824BHJP
C12Q 1/6869 20180101ALI20230824BHJP
【FI】
C12Q1/6883 Z
C12N15/09 Z
C12Q1/44
C12Q1/6869 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023501816
(86)(22)【出願日】2021-07-13
(85)【翻訳文提出日】2023-01-31
(86)【国際出願番号】 CN2021105939
(87)【国際公開番号】W WO2022012504
(87)【国際公開日】2022-01-20
(32)【優先日】2020-07-13
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】512037244
【氏名又は名称】ザ チャイニーズ ユニバーシティ オブ ホンコン
(71)【出願人】
【識別番号】522380594
【氏名又は名称】グレイル,リミティド ライアビリティ カンパニー
(74)【代理人】
【識別番号】100099759
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100117019
【氏名又は名称】渡辺 陽一
(74)【代理人】
【識別番号】100141977
【氏名又は名称】中島 勝
(74)【代理人】
【識別番号】100138210
【氏名又は名称】池田 達則
(74)【代理人】
【識別番号】100134784
【氏名又は名称】中村 和美
(72)【発明者】
【氏名】ロー ユク-ミン デニス
(72)【発明者】
【氏名】チウ ロッサ ワイ クン
(72)【発明者】
【氏名】チャン クワン チョー
(72)【発明者】
【氏名】チアン ペイヨン
(72)【発明者】
【氏名】チャン ウィン イェン
(72)【発明者】
【氏名】ラム ワイ ケイ
(72)【発明者】
【氏名】ハン ダイアナ シアオ チョン
(72)【発明者】
【氏名】ポン ウェンレイ
(72)【発明者】
【氏名】ティン チェン
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA19
4B063QQ34
4B063QR08
4B063QR32
4B063QR62
4B063QS28
4B063QS36
4B063QX02
(57)【要約】
無細胞DNA末端シグネチャ/モチーフ及びDNA鎖間のオーバーハングのサイズに影響を与える組織におけるヌクレアーゼ発現を使用して、様々な実施形態が実施される。実施形態は、正常細胞と比較して異常細胞において異なって調節されるヌクレアーゼを同定することができる。実施形態は、ヌクレアーゼが、(i)特定の配列末端シグネチャ、又は(ii)第1の鎖と第2の鎖との間に指定された長さのオーバーハングを有するDNA分子へと、DNAを優先的に切断することを決定することができる。パラメータは、特定の配列末端シグネチャに対応する末端配列を含むDNA分子の量及び/又は指定された長さのオーバーハングに正確に相関する測定された特性に基づいて、生物学的試料について決定することができる。このパラメータを使用して、組織タイプの特徴、臨床的に関連するDNA分子の画分濃度、又は生物学的試料中の組織タイプの異常レベルを決定することができる。
【選択図】なし
【特許請求の範囲】
【請求項1】
対象の生物学的試料中の異常レベルを分類する方法であって、
第1のヌクレアーゼが、1つ以上の組織タイプの正常組織と比較して、前記1つ以上の組織タイプの異常細胞において異なって調節されることを同定することと、
前記第1のヌクレアーゼが、他の配列末端シグネチャと比較して、第1の配列末端シグネチャを有するDNA分子へと、DNAを優先的に切断することを決定することと、
配列リードを取得するために、前記生物学的試料由来の複数の無細胞DNA分子を分析することであって、前記配列リードが、前記複数の無細胞DNA分子の末端に対応する末端配列を含む、分析することと、
前記配列リードの第1のセットを同定することであって、前記配列リードの前記第1のセットの各配列リードが、前記第1の配列末端シグネチャに対応する末端配列を含む、同定することと、
前記配列リードの前記第1のセットの第1の量を決定することと、
前記配列リードの前記第1の量を使用して第1のパラメータを決定することと、
前記第1のパラメータを使用して、前記生物学的試料中の前記1つ以上の組織タイプの前記異常レベルの分類を決定することと、を含む、方法。
【請求項2】
前記異常レベルの前記分類の前記決定が、前記第1のパラメータと参照値との間の比較に基づく、請求項1に記載の方法。
【請求項3】
第2のヌクレアーゼが、前記1つ以上の組織タイプの前記正常組織と比較して、前記1つ以上の組織タイプの前記異常細胞において異なって調節されることを同定することと、
前記第2のヌクレアーゼが、前記他の配列末端シグネチャと比較して、第2の配列末端シグネチャを有するDNA分子へと、DNAを優先的に切断することを決定することと、
前記配列リードの第2のセットを同定することであって、前記配列リードの前記第2のセットの各配列リードが、前記第2の配列末端シグネチャに対応する末端配列を含む、同定することと、
前記配列リードの前記第2のセットの第2の量を決定することと、
前記配列リードの前記第2の量を使用して第2のパラメータを決定することであって、前記生物学的試料中の前記1つ以上の組織タイプにおける前記異常レベルの前記分類が、更に前記第2のパラメータを使用して決定される、決定することと、を更に含む、請求項1又は2に記載の方法。
【請求項4】
前記1つ以上の組織タイプの前記正常組織と比較して、前記異常細胞において、前記第1のヌクレアーゼがアップレギュレートされ、前記第2のヌクレアーゼがダウンレギュレートされる、請求項3に記載の方法。
【請求項5】
第2のヌクレアーゼが、前記1つ以上の組織タイプの前記正常組織と比較して、前記1つ以上の組織タイプの前記異常細胞において異なって調節されることを同定することと、
前記第2のヌクレアーゼが、前記他の配列末端シグネチャと比較して、前記第2の配列末端シグネチャを有するDNA分子へと、DNAを優先的に切断することを決定することと、
前記配列リードの第2のセットを同定することであって、前記配列リードの前記第2のセットの各配列リードが、前記第2の配列末端シグネチャに対応する末端配列を含む、同定することと、
前記配列リードの前記第2のセットの第2の量を決定することであって、前記第2の量が、前記第1のパラメータを決定するために使用される、決定することと、を更に含む、請求項1又は2に記載の方法。
【請求項6】
前記1つ以上の組織タイプの前記正常組織と比較して、前記異常細胞において、前記第1のヌクレアーゼがアップレギュレートされ、前記第2のヌクレアーゼがダウンレギュレートされる、請求項5に記載の方法。
【請求項7】
前記1つ以上の組織タイプが、胎児組織を含む、請求項1~6のいずれか一項に記載の方法。
【請求項8】
前記対象が、妊婦であり、前記1つ以上の組織タイプが、母体血漿中に検出される胎盤組織を含む、請求項1~6のいずれか一項に記載の方法。
【請求項9】
前記異常が、子癇前症、早産、胎児染色体異数性、又は胎児遺伝性障害を含む、請求項8に記載の方法。
【請求項10】
別の対象の生物学的試料を分析することであって、前記別の対象が、前記対象とは異なる生物である、分析することと、
前記別の対象の前記生物学的試料に基づいて、前記第1のヌクレアーゼが、前記第1の配列末端シグネチャを有するDNA分子へと、DNAを優先的に切断することを決定することと、を更に含む、請求項1~9のいずれか一項に記載の方法。
【請求項11】
前記異常が、病理である、請求項1~10のいずれか一項に記載の方法。
【請求項12】
前記病理が、がんであり、前記がんが、肝細胞がん、肺がん、乳がん、胃がん、多形膠芽腫、膵臓がん、結腸直腸がん、上咽頭がん、若しくは頭頸部扁平上皮がん、又はそれらの任意の組み合わせを含む、請求項11に記載の方法。
【請求項13】
前記分類が、前記病理の複数のステージのうちの1つである、請求項11に記載の方法。
【請求項14】
前記病理が、自己免疫障害である、請求項11に記載の方法。
【請求項15】
前記自己免疫障害が、全身性エリテマトーデスである、請求項14に記載の方法。
【請求項16】
対象の生物学的試料中の臨床的に関連するDNA分子の画分濃度を推定する方法であって、
第1のヌクレアーゼが、複数の組織タイプのうちの少なくとも1つの他の組織タイプと比較して、標的組織タイプにおいて異なって調節されていることを同定することであって、前記臨床的に関連するDNA分子が、前記標的組織タイプに由来する、同定することと、
前記第1のヌクレアーゼが、他の配列末端シグネチャと比較して、第1の配列末端シグネチャを有するDNA分子へと、DNAを優先的に切断することを決定することと、
配列リードを取得するために、前記生物学的試料由来の複数の無細胞DNA分子を分析することであって、前記生物学的試料が、前記複数の組織タイプ由来の無細胞DNA分子の混合物を含み、前記配列リードが、前記複数の無細胞DNA分子の末端に対応する末端配列を含む、分析することと、
前記配列リードの第1のセットを同定することであって、前記配列リードの前記第1のセットの各配列リードが、前記第1の配列末端シグネチャに対応する末端配列を含む、同定することと、
前記配列リードの前記第1のセットの第1の量を決定することと、
前記配列リードの前記第1の量を使用して第1のパラメータを決定することと、
前記第1のパラメータと、前記臨床的に関連するDNA分子の画分濃度が既知である1つ以上の較正試料から決定される1つ以上の較正値と、を使用して、前記生物学的試料中の前記臨床的に関連するDNA分子の前記画分濃度を推定することと、を含む、方法。
【請求項17】
前記臨床的に関連するDNA分子が、胎児DNA、腫瘍DNA、又は移植された臓器のDNAを含む、請求項16に記載の方法。
【請求項18】
標的組織タイプの特徴を決定する方法であって、
第1のヌクレアーゼが、複数の組織タイプのうちの少なくとも1つの他の組織タイプと比較して、前記標的組織タイプにおいて異なって調節されることを同定することと、
前記第1のヌクレアーゼが、他の配列末端シグネチャと比較して、第1の配列末端シグネチャを有するDNA分子へと、DNAを優先的に切断することを決定することと、
配列リードを取得するために、生物学的試料由来の複数の無細胞DNA分子を分析することであって、前記生物学的試料が、前記複数の組織タイプ由来の無細胞DNA分子の混合物を含み、前記配列リードが、前記複数の無細胞DNA分子の末端に対応する末端配列を含む、分析することと、
前記配列リードの第1のセットを同定することであって、前記配列リードの前記第1のセットの各配列リードが、前記第1の配列末端シグネチャに対応する末端配列を含む、同定することと、
前記配列リードの前記第1のセットの第1の量を決定することと、
前記配列リードの前記第1の量についての第1のパラメータを決定することと、
前記第1のパラメータと、前記特徴についての値が既知である1つ以上の較正試料から決定された1つ以上の較正値と、を使用して、前記標的組織タイプの前記特徴についての第1の値を推定することと、を含む、方法。
【請求項19】
第2のヌクレアーゼが、前記標的組織タイプで異なって調節されていることを同定することと、
前記第2のヌクレアーゼが、前記他の配列末端シグネチャと比較して、第2の配列末端シグネチャを有するDNA分子へと、DNAを優先的に切断することを決定することと、
前記配列リードの第2のセットを同定することであって、前記配列リードの前記第2のセットの各配列リードが、前記第2の配列末端シグネチャに対応する末端配列を含む、同定することと、
前記配列リードの前記第2のセットの第2の量を決定することと、
前記第2の量を使用して第2のパラメータを決定することであって、前記画分濃度又は前記標的組織タイプの前記特徴についての前記第1の値が、前記第2のパラメータを使用することによって推定される、決定することと、を更に含む、請求項16又は18に記載の方法。
【請求項20】
前記複数の組織タイプの正常組織と比較して、前記標的組織タイプにおいて、前記第1のヌクレアーゼがアップレギュレートされ、前記第2のヌクレアーゼがダウンレギュレートされる、請求項19に記載の方法。
【請求項21】
前記画分濃度又は前記標的組織タイプの特徴についての前記第1の値が、前記第2のパラメータを別の参照値と比較することによって推定される、請求項19に記載の方法。
【請求項22】
第2のヌクレアーゼが、前記複数の組織タイプのうちの少なくとも1つの他の組織タイプと比較して、前記標的組織タイプにおいて異なって調節されることを同定することと、
前記第2のヌクレアーゼが、前記他の配列末端シグネチャと比較して、前記第2の配列末端シグネチャを有するDNA分子へと、DNAを優先的に切断することを決定することと、
前記配列リードの第2のセットを同定することであって、前記配列リードの前記第2のセットの各配列リードが、前記第2の配列末端シグネチャに対応する末端配列を含む、同定することと、
前記配列リードの前記第2のセットの第2の量を決定することであって、前記第2の量が、前記第1のパラメータを決定するために使用される、決定することと、を更に含む、請求項16又は18に記載の方法。
【請求項23】
少なくとも1つの他の組織タイプと比較して、前記標的組織タイプにおいて、前記第1のヌクレアーゼがアップレギュレートされ、前記第2のヌクレアーゼがダウンレギュレートされる、請求項22に記載の方法。
【請求項24】
別の対象の生物学的試料を分析することであって、前記別の対象が、前記対象とは異なる生物である、分析することと、
前記別の対象の前記生物学的試料に基づいて、前記第1のヌクレアーゼが、前記第1の配列末端シグネチャを有するDNA分子へと、DNAを優先的に切断することを決定することと、を更に含む、請求項16又は18に記載の方法。
【請求項25】
前記標的組織タイプが、肝臓又は造血細胞である、請求項16又は18に記載の方法。
【請求項26】
前記標的組織タイプが、胎児組織である、請求項16又は18に記載の方法。
【請求項27】
前記標的組織タイプが、がんを有する臓器である、請求項16又は18に記載の方法。
【請求項28】
前記対象が、妊婦であり、前記標的組織タイプが、胎盤組織である、請求項16又は18に記載の方法。
【請求項29】
前記標的組織タイプが、胎盤組織であり、前記胎盤組織の特徴が、妊娠中の対象の妊娠期間を含む、請求項18に記載の方法。
【請求項30】
前記第1のパラメータ及び前記1つ以上の較正値を使用することが、前記第1のパラメータを前記1つ以上の較正値と比較することを含む、請求項16又は18に記載の方法。
【請求項31】
前記第1のパラメータを前記1つ以上の較正値と比較することが、前記第1のパラメータを前記1つ以上の較正値を含む較正曲線と比較することを含む、請求項30に記載の方法。
【請求項32】
前記第1のパラメータを前記較正曲線と比較することが、前記第1のパラメータを、前記較正曲線を表す較正関数に入力することを含む、請求項31に記載の方法。
【請求項33】
前記第1のヌクレアーゼが、デオキシリボヌクレアーゼ1様3(DNASE1L3)、デオキシリボヌクレアーゼ1(DNASE1)、DNA断片化因子サブユニットベータ(DFFB)、3’修復エキソヌクレアーゼ1(TREX1)、アポトーシス増強ヌクレアーゼ(AEN)、エキソヌクレアーゼ1(EXO1)、デオキシリボヌクレアーゼ2(DNASE2)、エンドヌクレアーゼG(ENDOG)、アプリン/アピリミジン末端デオキシリボヌクレアーゼ1(APEX1)、フラップ構造特異的エンドヌクレアーゼ1(FEN1)、デオキシリボヌクレアーゼ1様1(DNASE1L1)、デオキシリボヌクレアーゼ1様2(DNASE1L2)、又はエキソ/エンドヌクレアーゼG(EXOG)を含む、請求項1~32のいずれか一項に記載の方法。
【請求項34】
前記第1のヌクレアーゼが、前記DNASE1L3であり、
前記第1の配列末端シグネチャが、CCCA又はCGTAを含むヌクレオチド末端配列に対応する、請求項33に記載の方法。
【請求項35】
第1のヌクレアーゼが、前記DFFBであり、
前記第1の配列末端シグネチャが、AAAA又はAAATを含むヌクレオチド末端配列に対応する、請求項33に記載の方法。
【請求項36】
前記第1のヌクレアーゼが、前記DNASE1であり、
前記第1の配列末端シグネチャが、TAATを含むヌクレオチド末端配列に対応する、請求項33に記載の方法。
【請求項37】
前記第2のヌクレアーゼが、デオキシリボヌクレアーゼ1様3(DNASE1L3)、デオキシリボヌクレアーゼ1(DNASE1)、DNA断片化因子サブユニットベータ(DFFB)、3’修復エキソヌクレアーゼ1(TREX1)、アポトーシス増強ヌクレアーゼ(AEN)、エキソヌクレアーゼ1(EXO1)、デオキシリボヌクレアーゼ2(DNASE2)、エンドヌクレアーゼG(ENDOG)、アプリン/アピリミジン末端デオキシリボヌクレアーゼ1(APEX1)、フラップ構造特異的エンドヌクレアーゼ1(FEN1)、デオキシリボヌクレアーゼ1様1(DNASE1L1)、デオキシリボヌクレアーゼ1様2(DNASE1L2)、又はエキソ/エンドヌクレアーゼG(EXOG)を含む、請求項3、4、5、6、19、20、21、22、又は23のいずれか一項に記載の方法。
【請求項38】
前記複数の無細胞DNA分子を分析することが、前記配列リードを取得するために、前記複数の無細胞DNA分子の配列決定を行うことを含む、請求項1~37のいずれか一項に記載の方法。
【請求項39】
前記第1のパラメータが、前記第1の量と前記配列リードの別の量との間の比である、請求項1~38のいずれか一項に記載の方法。
【請求項40】
対象から取得した生物学的試料を分析する方法であって、
第1のヌクレアーゼが、1つ以上の組織タイプの正常組織と比較して、前記1つ以上の組織タイプの異常細胞において異なって調節されることを同定することと、
前記第1のヌクレアーゼが、2つの対応するDNA鎖間に第1の指定された長さのオーバーハングを有するDNA分子へと、DNAを優先的に切断することを決定することと、
前記対象の前記生物学的試料の複数の無細胞DNA分子を分析することであって、前記複数の無細胞DNA分子の各々が、第1の鎖と第2の鎖とで部分的又は完全な二本鎖を形成し、前記複数の無細胞DNA分子のうちの少なくともいくつかの前記第1の鎖が、前記第2の鎖に突出し、前記複数の無細胞DNA分子を分析することが、
前記複数の無細胞DNA分子の各無細胞DNA分子について、
前記第2の鎖に突出した前記第1の鎖の長さに相関する前記第1の鎖、前記第2の鎖、又は前記第1の鎖及び前記第2の鎖の特性を測定することを含む、分析することと、
前記複数の無細胞DNA分子の前記測定された特性を使用して、不揃い指数値を決定することと、
前記不揃い指数値及び前記第1の指定された長さのオーバーハングに対応する参照値を使用して、前記生物学的試料中の前記1つ以上の組織タイプにおける異常レベルの分類を決定することと、を含む、方法。
【請求項41】
第2のヌクレアーゼが、前記1つ以上の組織タイプの前記正常組織と比較して、前記1つ以上の組織タイプの前記異常細胞において異なって調節されることを同定することと、
前記第2のヌクレアーゼが、前記第1の鎖と前記第2の鎖との間に第2の指定された長さのオーバーハングを有するDNA分子へと、DNAを優先的に切断することを決定することであって、前記異常レベルの前記分類が、更に前記第2の指定された長さのオーバーハングに対応する別の参照値を使用して決定される、決定することと、を更に含む、請求項40に記載の方法。
【請求項42】
前記異常が、病理である、請求項40又は41に記載の方法。
【請求項43】
前記病理が、がんであり、前記がんが、肝細胞がん、肺がん、乳がん、胃がん、多形膠芽腫、膵臓がん、結腸直腸がん、上咽頭がん、頭頸部扁平上皮がん、又はそれらの任意の組み合わせを含む、請求項42に記載の方法。
【請求項44】
対象から取得した生物学的試料中の臨床的に関連するDNA分子の画分を決定する方法であって、
第1のヌクレアーゼが、複数の組織タイプのうちの少なくとも1つの他の組織タイプと比較して、標的組織タイプにおいて異なって調節されていることを同定することであって、前記臨床的に関連するDNA分子が、前記標的組織タイプに由来する、同定することと、
前記第1のヌクレアーゼが、2つの対応するDNA鎖間に第1の指定された長さのオーバーハングを有するDNA分子へと、DNAを優先的に切断することを決定することと、
前記対象の前記生物学的試料の複数の無細胞DNA分子を分析することであって、前記生物学的試料が、前記複数の組織タイプ由来の無細胞DNA分子の混合物を含み、前記無細胞DNA分子の各々が、第1の鎖と第2の鎖とで部分的又は完全な二本鎖を形成し、前記複数の無細胞DNA分子のうちの少なくともいくつかの前記第1の鎖が、前記第2の鎖に突出し、前記複数の無細胞DNA分子を分析することが、
前記複数の無細胞DNA分子の各無細胞DNA分子について、
前記第2の鎖に突出した前記第1の鎖の長さと相関する前記第1の鎖、前記第2の鎖、又は前記第1の鎖及び前記第2の鎖の特性を測定することを含む、分析することと、
前記複数の無細胞DNA分子の前記測定された特性を使用して、不揃い指数値を決定することと、
前記不揃い指数値及び前記第1の指定された長さのオーバーハングに対応する参照値を使用して、前記生物学的試料中の前記臨床的に関連するDNA分子の前記画分を決定することと、を含む、方法。
【請求項45】
前記参照値が、前記臨床的に関連するDNA分子の画分濃度が既知である1つ以上の較正試料から決定される、請求項44に記載の方法。
【請求項46】
第2のヌクレアーゼが、前記少なくとも1つの他の組織タイプと比較して、前記標的組織タイプにおいて異なって調節されることを同定することと、
前記第2のヌクレアーゼが、前記第1の鎖と前記第2の鎖との間に第2の指定された長さのオーバーハングを有するDNA分子へと、DNAを優先的に切断することを決定することであって、前記生物学的試料中の前記臨床的に関連するDNA分子の前記画分が、前記不揃い指数値を前記第2の指定された長さのオーバーハングに対応する別の参照値と比較することに更に基づく、決定することと、を更に含む、請求項44又は45に記載の方法。
【請求項47】
前記臨床的に関連するDNA分子が、胎児DNAを含む、請求項40~46のいずれか一項に記載の方法。
【請求項48】
別の対象の生物学的試料を分析することであって、前記別の対象が、前記対象とは異なる生物である、分析することと、
前記別の対象の前記生物学的試料に基づいて、前記第1のヌクレアーゼが、前記第1の鎖と前記第2の鎖との間に前記第1の指定された長さのオーバーハングを有するDNA分子へと、DNAを優先的に切断することを決定することと、を更に含む、請求項40~47のいずれか一項に記載の方法。
【請求項49】
前記複数の無細胞DNA分子の各々が、指定された範囲内のサイズを有する、請求項40~48のいずれか一項に記載の方法。
【請求項50】
前記指定された範囲が、130~160bpである、請求項49に記載の方法。
【請求項51】
前記複数の無細胞DNA分子が、第1の複数の無細胞DNA分子であり、
前記指定された範囲が、第1の指定された範囲であり、
前記方法が、
第2の複数の無細胞DNA分子のうちの各核酸分子の鎖の特性を測定することであって、前記第2の複数の無細胞DNA分子が、第2の指定された範囲のサイズを有する、測定することを更に含み、
前記不揃い指数値を決定することが、前記第1の複数の無細胞DNA分子の前記測定された特性と、前記第2の複数の無細胞DNA分子の前記測定された特性と、を使用して、比を計算することを含む、請求項49に記載の方法。
【請求項52】
機械学習モデルを使用して、前記不揃い指数値及び前記参照値を使用して、前記生物学的試料中の前記臨床的に関連するDNA分子の前記画分を決定することを行う、請求項40~51のいずれか一項に記載の方法。
【請求項53】
前記機械学習モデルが、線形回帰、ロジスティック回帰、深層再帰型ニューラルネットワーク、ベイズ分類器、隠れマルコフモデル(HMM)、線形判別分析(LDA)、k平均クラスタリング、ノイズを伴うアプリケーションの密度に基づく空間クラスタリング(DBSCAN)、ランダムフォレストアルゴリズム、又はサポートベクターマシン(SVM)を含む、請求項52に記載の方法。
【請求項54】
前記特性が、前記複数の無細胞DNA分子の各々の前記第1の鎖、前記第2の鎖、又は前記第1の鎖及び前記第2の鎖の末端部分の1つ以上の部位におけるメチル化状態であり、前記不揃い指数値が、前記第1の鎖、前記第2の鎖、又は前記第1の鎖及び前記第2の鎖の末端部分の1つ以上の部位における前記複数の無細胞DNA分子にわたるメチル化レベルを含む、請求項40~53のいずれか一項に記載の方法。
【請求項55】
前記第1のヌクレアーゼが、デオキシリボヌクレアーゼ1様3(DNASE1L3)、デオキシリボヌクレアーゼ1(DNASE1)、DNA断片化因子サブユニットベータ(DFFB)、3’修復エキソヌクレアーゼ1(TREX1)、アポトーシス増強ヌクレアーゼ(AEN)、エキソヌクレアーゼ1(EXO1)、デオキシリボヌクレアーゼ2(DNASE2)、エンドヌクレアーゼG(ENDOG)、アプリン/アピリミジン末端デオキシリボヌクレアーゼ1(APEX1)、フラップ構造特異的エンドヌクレアーゼ1(FEN1)、デオキシリボヌクレアーゼ1様1(DNASE1L1)、デオキシリボヌクレアーゼ1様2(DNASE1L2)、又はエキソ/エンドヌクレアーゼG(EXOG)を含む、請求項40~54のいずれか一項に記載の方法。
【請求項56】
前記第2のヌクレアーゼが、デオキシリボヌクレアーゼ1様3(DNASE1L3)、デオキシリボヌクレアーゼ1(DNASE1)、DNA断片化因子サブユニットベータ(DFFB)、3’修復エキソヌクレアーゼ1(TREX1)、アポトーシス増強ヌクレアーゼ(AEN)、エキソヌクレアーゼ1(EXO1)、デオキシリボヌクレアーゼ2(DNASE2)、エンドヌクレアーゼG(ENDOG)、アプリン/アピリミジン末端デオキシリボヌクレアーゼ1(APEX1)、フラップ構造特異的エンドヌクレアーゼ1(FEN1)、デオキシリボヌクレアーゼ1様1(DNASE1L1)、デオキシリボヌクレアーゼ1様2(DNASE1L2)、又はエキソ/エンドヌクレアーゼG(EXOG)を含む、請求項41又は46に記載の方法。
【請求項57】
前記不揃い指数値及び前記参照値を使用することが、前記不揃い指数値を前記参照値と比較することを含む、請求項40~56のいずれか一項に記載の方法。
【請求項58】
前記不揃い指数値を前記参照値と比較することが、前記不揃い指数値を、1つ以上の較正試料から決定された1つ以上の較正データ点を含む較正曲線と比較することを含む、請求項57に記載の方法。
【請求項59】
前記不揃い指数値を前記較正曲線と比較することが、前記不揃い指数値を、前記較正曲線を表す較正関数に入力することを含む、請求項58に記載の方法。
【請求項60】
対象から取得した生物学的試料を分析する方法であって、前記方法が、
前記生物学的試料を取得することであって、前記生物学的試料が、無細胞DNA分子を含み、前記無細胞DNA分子の各々が、第1の鎖と第2の鎖とで部分的又は完全な二本鎖を形成し、前記無細胞DNA分子のうちの少なくともいくつかの前記第1の鎖が、前記第2の鎖に突出している、取得することと、
前記第1の鎖と前記第2の鎖との間に指定された長さのオーバーハングを有する無細胞DNA分子について前記生物学的試料を濃縮することと、
配列リードを取得するために、前記生物学的試料由来の複数の無細胞DNA分子を分析することであって、前記配列リードが、前記複数の無細胞DNA分子の末端に対応する末端配列を含む、分析することと、
前記配列リードの第1のセットを同定することと、
前記配列リードの前記第1のセットの第1のサブセットを同定することであって、前記第1のサブセットの各配列リードが、第1の配列末端シグネチャに対応する末端配列を含む、同定することと、
前記配列リードの前記第1のサブセットの第1の量を決定することと、
前記配列リードの前記第1の量を使用して第1のパラメータを決定することと、
前記第1のパラメータを使用して前記生物学的試料の特徴を決定することと、を含む、方法。
【請求項61】
前記生物学的試料の前記特徴が、前記生物学的試料中の臨床的に関連するDNA分子の画分濃度である、請求項60に記載の方法。
【請求項62】
前記生物学的試料の前記特徴が、前記生物学的試料における異常レベルである、請求項60に記載の方法。
【請求項63】
前記第1の配列末端シグネチャが、ヌクレアーゼの切断優先度に対応し、前記ヌクレアーゼが、複数の組織タイプのうちの少なくとも1つの他の組織タイプと比較してある組織タイプにおいて異なって調節され、前記生物学的試料の前記特徴を決定することが、前記組織タイプの特徴を決定することを含む、請求項60に記載の方法。
【請求項64】
前記組織タイプが、肝臓又は造血細胞である、請求項63に記載の方法。
【請求項65】
前記組織タイプが、腫瘍である、請求項63に記載の方法。
【請求項66】
前記組織タイプが、がんを有する臓器である、請求項63に記載の方法。
【請求項67】
前記対象が、妊婦であり、前記組織タイプが、胎盤組織である、請求項63に記載の方法。
【請求項68】
前記胎盤組織の特徴が、妊娠中の対象の妊娠期間を含む、請求項67に記載の方法。
【請求項69】
前記生物学的試料の前記特徴が、臓器のサイズ又は栄養状態である、請求項60に記載の方法。
【請求項70】
前記第1の配列末端シグネチャが、ヌクレアーゼの切断優先度に対応する、請求項60~69のいずれか一項に記載の方法。
【請求項71】
前記生物学的試料の前記特徴を決定することが、前記第1のパラメータを参照値と比較することを更に含む、請求項60~70のいずれか一項に記載の方法。
【請求項72】
前記ヌクレアーゼが、デオキシリボヌクレアーゼ1様3(DNASE1L3)、デオキシリボヌクレアーゼ1(DNASE1)、DNA断片化因子サブユニットベータ(DFFB)、3’修復エキソヌクレアーゼ1(TREX1)、アポトーシス増強ヌクレアーゼ(AEN)、エキソヌクレアーゼ1(EXO1)、デオキシリボヌクレアーゼ2(DNASE2)、エンドヌクレアーゼG(ENDOG)、アプリン/アピリミジン末端デオキシリボヌクレアーゼ1(APEX1)、フラップ構造特異的エンドヌクレアーゼ1(FEN1)、デオキシリボヌクレアーゼ1様1(DNASE1L1)、デオキシリボヌクレアーゼ1様2(DNASE1L2)、又はエキソ/エンドヌクレアーゼG(EXOG)を含む、請求項70に記載の方法。
【請求項73】
前記ヌクレアーゼが、前記DNASE1L3であり、
前記第1の配列末端シグネチャが、CCCA又はCGTAを含むヌクレオチド末端配列に対応する、請求項72に記載の方法。
【請求項74】
前記ヌクレアーゼが、前記DFFBであり、
前記第1の配列末端シグネチャが、AAAA又はAAATを含むヌクレオチド末端配列に対応する、請求項72に記載の方法。
【請求項75】
前記ヌクレアーゼが、前記DNASE1であり、
前記第1の配列末端シグネチャが、TAATを含むヌクレオチド末端配列に対応する、請求項72に記載の方法。
【請求項76】
前記配列リードの前記第1のセットを同定することが、前記配列リードの第1のセットを取得するために前記無細胞DNA分子を配列決定することを含む、請求項60~75のいずれか一項に記載の方法。
【請求項77】
前記第1のパラメータが、前記第1の量及び配列リードの別の量を使用して決定される、請求項60~76のいずれか一項に記載の方法。
【請求項78】
前記生物学的試料を濃縮することが、ハイブリダイゼーションに基づく標的化捕捉、ライゲーションに基づく増幅、又はライゲーションに基づく捕捉を使用することを含む、請求項60~77のいずれか一項に記載の方法。
【請求項79】
生物学的試料が得られる対象における病理のレベルを決定するために前記生物学的試料を分析する方法であって、
配列リードを取得するために、前記生物学的試料由来の複数の無細胞DNA分子を分析することであって、前記配列リードが、前記複数の無細胞DNA分子、前記対象及びウイルス由来の前記複数の無細胞DNA分子の末端に対応する末端配列を含む、分析することと、
参照ゲノムにアラインする前記配列リードの第1のセットを決定することであって、前記参照ゲノムが、前記ウイルスに対応する、決定することと、
前記配列リードの前記第1のセットの各々について、対応する無細胞DNA分子の1つ以上の末端配列の各々についての配列モチーフを決定することと、
前記配列リードの前記第1のセットの前記1つ以上の末端配列に対応する1つ以上の配列モチーフのセットの相対頻度を決定することであって、配列モチーフの相対頻度が、前記配列モチーフに対応する末端配列を有する前記複数の無細胞DNA分子の割合を含む、決定することと、
前記1つ以上の配列モチーフのセットの前記相対頻度の集計値を決定することと、
前記集計値を使用して、前記対象の病理レベルの分類を決定することと、を含む、方法。
【請求項80】
前記病理が、がんである、請求項79に記載の方法。
【請求項81】
前記がんが、肝細胞がん、肺がん、乳がん、胃がん、多形膠芽腫、膵臓がん、結腸直腸がん、上咽頭がん、頭頸部扁平上皮がん、又はそれらの任意の組み合わせを含む、請求項80に記載の方法。
【請求項82】
前記分類が、がんの複数のステージを含むがんの複数のレベルから決定される、請求項79に記載の方法。
【請求項83】
前記病理が、自己免疫障害である、請求項79に記載の方法。
【請求項84】
前記自己免疫障害が、全身性エリテマトーデスである、請求項83に記載の方法。
【請求項85】
前記病理のレベルが、前記病理に関連する臨床的に関連するDNAの画分濃度に対応する、請求項79に記載の方法。
【請求項86】
前記1つ以上の配列モチーフのセットの配列モチーフが、単一ヌクレオチド、2ヌクレオチド配列、3ヌクレオチド配列、4ヌクレオチド配列、5ヌクレオチド配列、6ヌクレオチド配列、又は7ヌクレオチド配列に対応する、請求項79~85のいずれか一項に記載の方法。
【請求項87】
前記集約値が、(i)エントロピー値、(ii)相対頻度の合計、及び(iii)前記1つ以上の配列モチーフのセットについてのカウントのベクトルに対応する多次元データ点からなる群から選択される値である、請求項79~86のいずれか一項に記載の方法。
【請求項88】
前記病理レベルの前記分類を決定することが、前記集計値を参照値と比較することを含む、請求項79~87のいずれか一項に記載の方法。
【請求項89】
対象から取得した生物学的試料を分析する方法であって、前記方法が、
前記対象及びウイルス由来の無細胞DNA分子を含む前記生物学的試料の複数の無細胞DNA分子を分析することであって、前記複数の無細胞DNA分子の各々が、第1の鎖及び第2の鎖とで部分的又は完全な二本鎖を形成し、前記複数の無細胞DNA分子のうちの少なくともいくつかの前記第1の鎖が、前記第2の鎖に突出し、前記複数の無細胞DNA分子を分析することが、
参照ゲノムにアラインする前記生物学的試料の無細胞DNA分子の第1のセットを同定することであって、前記参照ゲノムが、前記ウイルスに対応する、同定することと、
無細胞DNA分子の前記第1のセットの各々について、
前記第2の鎖に突出した前記第1の鎖の長さに比例する前記第1の鎖、前記第2の鎖、又は前記第1の鎖及び前記第2の鎖の特性を測定することと、を含む、分析することと、
前記複数の無細胞DNA分子の前記測定された特性を使用して、不揃い指数値を決定することと、
前記不揃い指数値及び参照値を使用することによって前記対象の病態のレベルを決定することと、を含む、方法。
【請求項90】
前記対象の前記病態のレベルを決定することが、前記不揃い指数値を前記参照値と比較することを更に含む、請求項89に記載の方法。
【請求項91】
前記不揃い指数値を前記参照値と比較することが、前記不揃い指数値を、1つ以上の較正試料から決定された1つ以上の較正データ点を含む較正曲線と比較することを含む、請求項90に記載の方法。
【請求項92】
前記不揃い指数値を前記較正曲線と比較することが、前記不揃い指数値を、前記較正曲線を表す較正関数に入力することを含む、請求項91に記載の方法。
【請求項93】
前記病態が、疾患又は障害を含む、請求項89~92のいずれか一項に記載の方法。
【請求項94】
前記病態が、がん又は自己免疫疾患である、請求項93に記載の方法。
【請求項95】
前記第1の鎖が、5’末端を含む、請求項89~94のいずれか一項に記載の方法。
【請求項96】
核酸分子のサイズを測定することを更に含み、前記複数の無細胞DNA分子が、指定された範囲内のサイズを有する、請求項89~95のいずれか一項に記載の方法。
【請求項97】
前記指定された範囲が、140~160bpである、請求項96に記載の方法。
【請求項98】
前記複数の無細胞DNA分子が、第1の複数の核酸分子であり、
前記指定された範囲が、第1の指定された範囲であり、
前記方法が、
第2の複数の核酸分子のうちの各核酸分子の鎖の特性を測定することであって、前記第2の複数の核酸分子が、第2の指定された範囲を有するサイズを有する、測定することを更に含み、
前記不揃い指数値を決定することが、前記第1の複数の核酸分子の前記測定された特性と、前記第2の複数の核酸分子の前記測定された特性と、を使用して、比を計算することを含む、請求項96に記載の方法。
【請求項99】
前記特性が、前記複数の無細胞DNA分子の各々の前記第1の鎖、前記第2の鎖、又は前記第1の鎖及び前記第2の鎖の末端部分における1つ以上の部位におけるメチル化状態であり、前記不揃い指数値が、前記第1の鎖、前記第2の鎖、又は前記第1の鎖及び前記第2の鎖の末端部分の1つ以上の部位における前記複数の無細胞DNA分子にわたるメチル化レベルを含む、請求項89に記載の方法。
【請求項100】
より高いメチル化レベルが、前記第2の鎖に突出した前記第1の鎖のより長い長さと相関している、請求項99に記載の方法。
【請求項101】
リードを生成するために、核酸分子を分析することと、
前記リードを参照ゲノムにアラインメントすることと、を更に含み、
ここで、
前記複数の無細胞DNA分子が、転写開始部位に対してある特定の距離範囲内のリードを有する、請求項89に記載の方法。
【請求項102】
前記測定された特性が、長さである、請求項89に記載の方法。
【請求項103】
前記参照値が、前記病態を有する対象の1つ以上の参照試料を使用して決定される、請求項89に記載の方法。
【請求項104】
前記参照値が、前記病態を有さない対象の1つ以上の参照試料を使用して決定される、請求項89に記載の方法。
【請求項105】
機械学習モデルが、前記不揃い指数値及び前記参照値を使用して、前記対象の前記病態の前記レベルの決定を行うために使用される、請求項89に記載の方法。
【請求項106】
前記ウイルスが、発がん性ウイルスである、請求項79又は89に記載の方法。
【請求項107】
無細胞DNAを含む対象の生物学的試料を使用して、ヌクレアーゼに関連する遺伝子についての遺伝性障害を検出するための方法であって、
前記生物学的試料の複数の無細胞DNA分子を分析することであって、前記複数の無細胞DNA分子の各々が、第1の鎖と第2の鎖とで部分的又は完全な二本鎖を形成し、前記複数の無細胞DNA分子のうちの少なくともいくつかの前記第1の鎖が、前記第2の鎖に突出し、前記複数の無細胞DNA分子を分析することが、
前記複数の無細胞DNA分子の各無細胞DNA分子について、
前記第2の鎖に突出した前記第1の鎖の長さに相関する前記第1の鎖及び/又は前記第2の鎖の特性を測定することと、
前記複数の無細胞DNA分子の前記測定された特性を使用して、不揃い指数値を決定することと、を含む、分析することと、
前記不揃い指数値及び参照値を使用して、前記遺伝子が前記対象において前記遺伝性障害を示すかどうかの分類を決定することと、を含む、方法。
【請求項108】
前記生物学的試料が、抗凝固剤で処理され、少なくとも指定された時間にわたってインキュベートされる、請求項107に記載の方法。
【請求項109】
前記遺伝子が前記対象において前記遺伝性障害を示すかどうかの前記分類を決定することが、前記不揃い指数値を前記参照値と比較することを更に含む、請求項107又は108に記載の方法。
【請求項110】
前記不揃い指数値を前記参照値と比較することが、前記不揃い指数値が、少なくとも閾値量だけ前記参照値と異なるかどうかを決定することを含む、請求項109に記載の方法。
【請求項111】
前記不揃い指数値を前記参照値と比較することが、前記不揃い指数値が、少なくとも閾値量だけ前記参照値よりも小さいかどうかを決定することを含む、請求項109に記載の方法。
【請求項112】
前記不揃い指数値を前記参照値と比較することが、前記不揃い指数値が、少なくとも閾値量だけ前記参照値よりも大きいかどうかを決定することを含む、請求項109に記載の方法。
【請求項113】
前記参照値が、前記遺伝性障害を有さない1つ以上の参照試料から決定される、請求項107~112のいずれか一項に記載の方法。
【請求項114】
前記参照値が、前記遺伝性障害を有する1つ以上の参照試料から決定される、請求項107~112のいずれか一項に記載の方法。
【請求項115】
無細胞DNAを含む対象の生物学的試料を使用して、ヌクレアーゼに関連する遺伝子についての遺伝性障害を検出するための方法であって、
前記生物学的試料の複数の無細胞DNA分子を分析することであって、前記複数の無細胞DNA分子の各々が、第1の鎖と第2の鎖とで部分的又は完全な二本鎖を形成し、前記複数の無細胞DNA分子のうちの少なくともいくつかの前記第1の鎖が、前記第2の鎖に突出し、前記複数の無細胞DNA分子を分析することが、
前記対象の第1の生物学的試料中の第1の複数の無細胞DNA分子の各無細胞DNA分子について、
前記第2の鎖に突出した前記第1の鎖の長さに相関する前記第1の鎖及び/又は前記第2の鎖の特性を測定することであって、前記第1の生物学的試料が、抗凝固剤で処理され、第1の時間の長さにわたってインキュベートされる、測定することと、
前記対象の第2の生物学的試料中の第2の複数の無細胞DNA分子の各無細胞DNA分子について、
前記第2の鎖に突出した前記第1の鎖の長さに相関する前記第1の鎖及び/又は前記第2の鎖の特性を測定することであって、前記第2の生物学的試料が、前記抗凝固剤で処理され、前記第1の時間の長さよりも長い第2の時間の長さにわたってインキュベートされる、測定することと、を含む、分析することと、
前記第1の複数の無細胞DNA分子の前記測定された特性を使用して、第1の不揃い指数値を決定することと、
前記第2の複数の無細胞DNA分子の前記測定された特性を使用して、第2の不揃い指数値を決定することと、
前記第1の不揃い指数値及び前記第2の不揃い指数値を使用して、前記遺伝子が前記対象において前記遺伝性障害を示すかどうかの分類を決定することと、を含む、方法。
【請求項116】
前記遺伝子が前記対象において前記遺伝性障害を示すかどうかの前記分類を決定することが、前記第1の不揃い指数値と前記第2の不揃い指数値とを比較することを更に含む、請求項115に記載の方法。
【請求項117】
前記第1の不揃い指数値を前記第2の不揃い指数値と比較することが、前記第1の不揃い指数値が少なくとも閾値量だけ前記第2の不揃い指数値と異なるかどうかを決定することを含む、請求項116に記載の方法。
【請求項118】
前記分類が、前記第1の不揃い指数値が前記第2の不揃い指数値の閾値内にある場合、前記遺伝性障害が存在するというものである、請求項116に記載の方法。
【請求項119】
前記分類が、前記第2の不揃い指数値が少なくとも閾値だけ前記第1の不揃い指数値よりも小さい場合、前記遺伝性障害が存在するというものである、請求項116に記載の方法。
【請求項120】
前記第1の時間の長さが、ゼロである、請求項115~119のいずれか一項に記載の方法。
【請求項121】
前記抗凝固剤が、ヘパリンである、請求項115~120のいずれか一項に記載の方法。
【請求項122】
前記抗凝固剤が、EDTAである、請求項115~120のいずれか一項に記載の方法。
【請求項123】
前記遺伝子が、DNASE1である、請求項107~122のいずれか一項に記載の方法。
【請求項124】
前記遺伝子が、DFFBである、請求項107~122のいずれか一項に記載の方法。
【請求項125】
前記遺伝子が、DNASE1L3である、請求項107~122のいずれか一項に記載の方法。
【請求項126】
前記ヌクレアーゼが、細胞内DNAを切断する、請求項107~125のいずれか一項に記載の方法。
【請求項127】
前記遺伝性障害が、前記遺伝子の欠失を含む、請求項107~126のいずれか一項に記載の方法。
【請求項128】
前記遺伝性障害の前記分類に基づいて前記対象を治療することを更に含む、請求項107~127のいずれか一項に記載の方法。
【請求項129】
無細胞DNAを含む対象の生物学的試料を使用してヌクレアーゼの活性を監視するための方法であって、
前記生物学的試料の複数の無細胞DNA分子を分析することであって、前記複数の無細胞DNA分子の各々が、第1の鎖と第2の鎖とで部分的又は完全な二本鎖を形成し、前記複数の無細胞DNA分子のうちの少なくともいくつかの前記第1の鎖が、前記第2の鎖に突出し、前記複数の無細胞DNA分子を分析することが、
前記複数の無細胞DNA分子の各無細胞DNA分子について、
前記第2の鎖に突出した前記第1の鎖の長さに相関する前記第1の鎖及び/又は前記第2の鎖の特性を測定することを含む、分析することと、
前記複数の無細胞DNA分子の前記測定された特性を使用して、不揃い指数値を決定することであって、前記不揃い指数値が、鎖が前記複数の無細胞DNA分子において別の鎖に突出していることの集合的な尺度を提供する、決定することと、
前記不揃い指数値及び参照値を使用して、前記ヌクレアーゼの活性の第1の分類を決定することと、を含む、方法。
【請求項130】
前記第1の分類が、数値による分類値であり、前記方法が、
前記数値による分類値をカットオフと比較して、前記ヌクレアーゼに関連する遺伝子が前記対象において遺伝性障害を示すかどうかの第2の分類を決定することを更に含む、請求項129に記載の方法。
【請求項131】
前記生物学的試料が、抗凝固剤で処理され、少なくとも指定された時間にわたってインキュベートされる、請求項129又は130に記載の方法。
【請求項132】
前記参照値が、前記ヌクレアーゼの前記活性の特定の分類を有する較正試料から決定される、請求項129~131のいずれか一項に記載の方法。
【請求項133】
前記特定の分類が、正常、増加、又は減少である、請求項132に記載の方法。
【請求項134】
前記ヌクレアーゼの前記活性の前記第1の分類を決定することが、前記不揃い指数値を前記参照値と比較することを含む、請求項129~133のいずれか一項に記載の方法。
【請求項135】
前記不揃い指数値を前記参照値と比較することが、前記不揃い指数値が、少なくとも閾値量だけ前記参照値と異なるかどうかを決定することを含む、請求項134に記載の方法。
【請求項136】
前記不揃い指数値を前記参照値と比較することが、前記不揃い指数値が、少なくとも閾値量だけ前記参照値よりも小さいかどうかを決定することを含む、請求項134に記載の方法。
【請求項137】
前記不揃い指数値を前記参照値と比較することが、前記不揃い指数値が、少なくとも閾値量だけ前記参照値よりも大きいかどうかを決定することを含む、請求項134に記載の方法。
【請求項138】
前記ヌクレアーゼが、DFFB、DNASE1L3、又はDNASE1である、請求項129~137のいずれか一項に記載の方法。
【請求項139】
前記生物学的試料を取得する前に、前記対象が、前記ヌクレアーゼによる治療を提供されている、請求項129~138のいずれか一項に記載の方法。
【請求項140】
前記不揃い指数値と前記参照値との比較に基づいて、前記ヌクレアーゼによる前記治療の有効性の第2の分類を決定すること、を更に含む、請求項139に記載の方法。
【請求項141】
前記参照値が、前記ヌクレアーゼの前記活性について既知の又は測定された分類を有する1つ以上の参照試料を使用して決定される、請求項129~140のいずれか一項に記載の方法。
【請求項142】
前記1つ以上の参照試料についての前記ヌクレアーゼの前記活性を測定することと、
前記1つ以上の参照試料における前記不揃い指数値を測定することと、を更に含む、請求項141に記載の方法。
【請求項143】
前記1つ以上の参照試料が、複数の参照試料であり、前記方法が、
前記複数の参照試料について前記測定された活性及び測定された不揃い指数値に対応する較正データ点を近似する較正関数を決定することを更に含む、請求項142に記載の方法。
【請求項144】
前記ヌクレアーゼが、エンドヌクレアーゼである、請求項129~143のいずれか一項に記載の方法。
【請求項145】
前記ヌクレアーゼが、エキソヌクレアーゼである、請求項129~143のいずれか一項に記載の方法。
【請求項146】
コンピュータ製品であって、複数の命令を記憶する非一時的コンピュータ可読媒体を含み、実行されると、コンピュータシステムを制御して、請求項1~145のいずれか一項に記載の方法を実施する、コンピュータ製品。
【請求項147】
システムであって、
請求項146に記載のコンピュータ製品と、
前記コンピュータ可読媒体に記憶された命令を実行するための1つ以上のプロセッサと、を備える、システム。
【請求項148】
請求項1~145のいずれか一項に記載の方法を実施するための手段を備える、システム。
【請求項149】
請求項1~145のいずれか一項に記載の方法を実施するように構成された1つ以上のプロセッサを備える、システム。
【請求項150】
請求項1~145のいずれか一項に記載の方法のステップをそれぞれ実施するモジュールを備える、システム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2020年7月13日に出願された「Nuclease-Associated End Signature Analysis For Cell-Free Nucleic Acids」という名称の米国仮特許出願第63/051,268号に対する優先権を主張し、その内容はあらゆる目的で参照によりその全体が本明細書に組み込まれる。
【背景技術】
【0002】
無細胞DNA(cfDNA)は、妊娠及びがんなどの多くの生理学的及び病理学的状態の診断及び予後予測に適用され得る豊富な情報源である(Chan,K.C.A.et al.(2017),New England Journal of Medicine 377,513-522、Chiu,R.W.K.et al.(2008),Proceedings of the National Academy of Sciences of the United States of America 105,20458-20463、Lo,Y.M.D.et al.,(1997),The Lancet 350,485-487)。循環cfDNAは現在、非侵襲的バイオマーカーとして一般的に使用されており、短い断片の形態で循環することが知られているが、cfDNAの断片化及び分子プロファイルを支配する生理学的要因は、依然として理解しにくいままである。
【0003】
近年の研究は、cfDNAの断片化が、ヌクレオソームの位置決定に関連する非ランダムプロセスであることを示唆している(Chandrananda,D.et al.,(2015),BMC Medical Genomics 8,29、Ivanov,M.et al.,(2015),BMC genomics 16,S1、Lo,Y.M.D.et al.(2010),Science Translational Medicine 2,61ra91-61ra91、Snyder,M.W.et al.,(2016),Cell 164,57-68、Sun,K.et al.,(2019),Genome Research 29,418-427))。以前に、我々は、デオキシリボヌクレアーゼ1様3(DNASE1L3)が血漿中のcfDNAのサイズプロファイルに寄与することを実証している(Serpas,L.et al.(2019),Proceedings of the National Academy of Sciences 116,641-649)。上記にもかかわらず、ヌクレアーゼ発現レベルを分析するための多くの技法は、RNA配列決定又は他の種類のRNA分析(例えば、逆転写酵素ポリメラーゼ連鎖反応)を使用する。しかしながら、RNAはDNAよりも不安定であり、かつ、安定性が低いことが既知であるため、これらのRNAに基づく技法は効率及び精度が低いという問題があり得る。他の技法には、臨床評価のために侵襲的技法(侵襲的生検又は羊水検査又は絨毛生検など)の使用を必要とし得る、組織特異的ヌクレアーゼの測定が含まれる。
【0004】
したがって、ヌクレアーゼ発現レベル又は他の関連する値、例えば、対象における異常に関連する値を非侵襲的に決定することができる、より堅牢で、効率的で、再現性があり、効果的な技法に対する必要性がある。
【発明の概要】
【0005】
本開示は、無細胞DNA末端シグネチャ/モチーフに影響を与える、組織でのヌクレアーゼ発現を使用するための技法を記載する。例として、特定のヌクレアーゼに対応する末端シグネチャは、DNA末端配列(例えば、配列末端シグネチャ)又はDNA鎖間の指定された長さのオーバーハング(例えば、不揃いな末端指数として測定され得る不揃いな末端シグネチャ)の形態であり得る。いくつかの態様では、組織ヌクレアーゼ発現レベルと無細胞DNA末端シグネチャとの間の関係を使用して、異常組織と正常組織とを区別し、組織タイプ(例えば、造血組織対非造血組織、胎児対母体)を区別し、臨床的に関連するDNA又は標的組織タイプの特徴を決定することができる。
【0006】
別の態様では、生物学的試料は、指定された長さの不揃いな末端を有する無細胞DNA分子について濃縮され得る。濃縮された無細胞DNA分子からの配列リードを分析して、特定のヌクレアーゼ発現に関連するDNA末端シグネチャに対応する配列リードのサブセットを同定することができる。配列リードのサブセットを使用して、生物学的試料の特徴(例えば、造血、非造血、腫瘍、非腫瘍、母体、胎児など)を特定するためのパラメータを決定することができる。
【0007】
更に別の態様では、本開示は、ウイルスの無細胞DNA末端シグネチャを分析するための技法を記載する。一例では、配列モチーフのセットの相対頻度は、無細胞ウイルスDNAから得られた配列リードのセットから同定することができ、決定された相対頻度を使用して、対象における病理(例えば、上咽頭がん)を決定することができる。一実施形態において、病理は、ウイルス感染(例えば、エプスタイン・バール・ウイルス及び上咽頭がん、リンパ腫若しくは胃がん、若しくはヒトパピローマウイルス及び子宮頸がん、又はB型肝炎ウイルス及び肝細胞がん)に関連し得る。別の例では、無細胞ウイルスDNAの測定された特性に基づいて決定された不揃い指数値を使用して、対象の病態を決定することもすることができる。
【0008】
本開示のこれら及び他の実施形態を、以下で詳細に説明する。例えば、他の実施形態は、本明細書に記載の方法と関連付けられたシステム、デバイス、及びコンピュータ可読媒体を対象とする。
【0009】
図面及び特許請求の範囲を含む明細書の残りの部分を参照することにより、本開示の他の特徴及び利点が理解されるであろう。本開示の更なる特徴及び利点、並びに本開示の様々な実施形態の構造及び操作は、添付の図面に関して以下に詳細に記載される。図面において、同様の参照番号は、同一の又は機能的に類似する要素を示し得る。
【0010】
特許又は出願ファイルには、カラーで作成された少なくとも1つの図面が含まれている。カラー図面を含むこの特許又は特許出願公開のコピーは、申請及び必要な手数料の支払いに応じて、特許庁によって提供される。
【図面の簡単な説明】
【0011】
【
図1】いくつかの実施形態による、末端モチーフの例を示す。
【
図2】いくつかの実施形態による、無細胞DNA分子のオーバーハングの程度を示す一例を示す。
【
図3】いくつかの実施形態による、ヌクレアーゼ切断末端シグネチャの例を示す。
【
図4】いくつかの実施形態による、異なる組織にわたる異なるヌクレアーゼに対応する発現プロファイルの例を示す。
【
図5】いくつかの実施形態による、ヌクレアーゼDFFB、DNASE1、及びDNASE1L3について示された切断優先度を有するcfDNAの生成及び消化のモデルを示す。
【
図6】いくつかの実施形態による、組織の生理学的状態又は病理学的状態を決定するための特定の末端シグネチャを有する無細胞DNA分子の例示的な分布を示す。
【
図7A】いくつかの実施形態による、異なる組織群にわたるモチーフ多様性スコア及びDNASE1L3/DFFB切断シグネチャ比を示す箱ひげ図を示す。
【
図7B】いくつかの実施形態による、異なる組織群にわたるモチーフ多様性スコア及びDNASE1L3/DFFB切断シグネチャ比を示す箱ひげ図を示す。
【
図8】いくつかの実施形態による、末端シグネチャを検出するために異なるパラメータを評価するための受信者動作特性(ROC)曲線を示す。
【
図9】いくつかの実施形態による、DNASE1L3切断シグネチャ、DFFB切断シグネチャ、及びDNASE1切断シグネチャの三次元散布図を示す。
【
図10】いくつかの実施形態による、ロジスティック回帰を使用してDNASE1L3切断シグネチャ、DFFB切断シグネチャ、及びDNASE1切断シグネチャを決定する性能レベルを示すROC曲線を示す。
【
図11】いくつかの実施形態による、2つの血漿末端モチーフの比(ACGA/CCCG)を示す箱ひげ図を示す。
【
図12】いくつかの実施形態による、野生型マウスとDNASE1L3欠失マウスとの間の2つの血漿末端モチーフの比(ACGA/CCCG)を示す箱ひげ図を示す。
【
図13】いくつかの実施形態による、野生型マウス(DFFB
+/+)とDFFB欠失マウス(DFFB
-/-)との間のAAAT末端モチーフを有する血漿DNA断片のパーセンテージを示す。
【
図14】いくつかの実施形態による、肝細胞がん(HCC)を有するヒト対象と肝細胞がん(HCC)を有さないヒト対象との間のAAAT末端モチーフを有する血漿DNA断片のパーセンテージを示す。
【
図15A】
図15Aは、いくつかの実施形態による、ヒト健常対照対象(CTR)、慢性B型肝炎感染(HBV)を有する患者、及びHCCを有する患者にわたるDNASE1L3/DFFB切断シグネチャ比値の箱ひげ図を示す。
【
図15B】
図15Bは、いくつかの実施形態による、DNASE1L3/DFFB切断シグネチャ比(密な破線)、末端モチーフCCCA(CCCA、緩い破線)を有する断片のパーセンテージ、及びモチーフ多様性スコア(MDS、実線)を使用した、HCCを有する患者とHCCを有しない患者との間のROC曲線を示す。
【
図16】対照対象(例えば、子癇前症を有さない妊婦)及び子癇前症を有する妊娠中の対象にわたるDNASE1/DNASE1L3切断シグネチャ比の箱ひげ図を示す。
【
図17】いくつかの実施形態による、配列末端シグネチャに基づいて生物学的試料中の異常レベルを分類するフローチャートである。
【
図18A】いくつかの実施形態による、モチーフ多様性スコア及びDNASE1L3/DFFB切断シグネチャ比を使用して、母体DNA分子と胎児DNA分子とを区別する例を示す。
【
図18B】いくつかの実施形態による、モチーフ多様性スコア及びDNASE1L3/DFFB切断シグネチャ比を使用して、母体DNA分子と胎児DNA分子とを区別する例を示す。
【
図19】いくつかの実施形態による、胎児DNA分子と母体DNA分子とを区別するための2つの血漿末端モチーフの比(CGAA/AAAA)の箱ひげ図を示す。
【
図20】いくつかの実施形態による、母体DNA分子と胎児DNA分子とを区別する際のMDS、CCCA%、及びDNASE1L3/DFFB切断シグネチャ比についてのROC曲線を示す。
【
図21】いくつかの実施形態による、配列末端シグネチャに基づいて生物試料中の臨床的に関連するDNA分子の画分濃度を推定する方法を示すフローチャートである。
【
図22A】いくつかの実施形態による、ヒト胎盤組織(A、DNASE1L3)及びマウス胎盤組織(B、Dnase1l3)の異なる妊娠期間にわたるデオキシリボヌクレアーゼ1様3発現レベルの箱ひげ図を示す。
【
図22B】いくつかの実施形態による、ヒト胎盤組織(A、DNASE1L3)及びマウス胎盤組織(B、Dnase1l3)の異なる妊娠期間にわたるデオキシリボヌクレアーゼ1様3発現レベルの箱ひげ図を示す。
【
図23】いくつかの実施形態による、異なる妊娠期間にわたるDNASE1L3/DFFB切断シグネチャ比の箱ひげ図を示す。
【
図24A】いくつかの実施形態による、モチーフ多様性スコア及びDNASE1L3/DFFB切断シグネチャ比を使用して、肝臓由来のDNA分子と造血由来のDNA分子とを区別する例を示す。
【
図24B】いくつかの実施形態による、モチーフ多様性スコア及びDNASE1L3/DFFB切断シグネチャ比を使用して、肝臓由来のDNA分子と造血由来のDNA分子とを区別する例を示す。
【
図25】いくつかの実施形態による、肝臓由来のDNA分子と造血由来のDNA分子とを区別する際のMDS、CCCA%、及びDNASE1L3/DFFB切断シグネチャ比についてのROC曲線を示す。
【
図26】いくつかの実施形態による、配列末端シグネチャに基づいて標的組織タイプの特徴を決定する方法を示すフローチャートである。
【
図27】野生型マウスとDNASE1L3欠失マウスとの間の血漿DNAの不揃いを示すグラフのセットを示す。
【
図28】Dnase1
-/-マウスとWTマウスの血漿DNAとの間の血漿DNA(JI-M)の不揃いを同定する箱ひげ図を示す。
【
図29】WTマウスとDFFB
-/-マウスとの間の血漿DNAの不揃いを同定するグラフのセットを示す。
【
図30A】いくつかの実施形態による、胎児特異的DNA分子と共有DNA分子との間の不揃い指数値の比較を示す。
【
図30B】いくつかの実施形態による、胎児特異的DNA分子と共有DNA分子との間の不揃い指数値の比較を示す。
【
図31A】
図31Aは、いくつかの実施形態による、胎盤組織及び白血球におけるDNASE1の遺伝子発現を示す。
【
図31B】
図31Bは、いくつかの実施形態による、サイズ選択なしでの胎児特異的断片と共有断片との間の非メチル化不揃い指数(JI-U)値の箱ひげ図を示す。
【
図31C】
図31Cは、いくつかの実施形態による、130bp~160bpのサイズ範囲内の胎児特異的断片と共有断片との間のJI-U値の箱ひげ図を示す。
【
図32】HCCを有する患者における変異対立遺伝子(腫瘍性DNA)及び野生型対立遺伝子(主に非腫瘍性DNA)を有する血漿DNA分子間のJI-M値の累積差を同定するグラフを示す。
【
図33】いくつかの実施形態による、不揃い指数値に基づいて臨床的に関連するDNA分子の画分を決定する方法を示すフローチャートである。
【
図34】いくつかの実施形態による、野生型、DNASE1
-/-、及びDNASE1L3
-/-を含む異なる遺伝子型にわたるマウスにおける血漿DNAの不揃い指数値の箱ひげ図を示す。
【
図35A】
図35Aは、いくつかの実施形態による、正常肝組織及び肝臓がん組織におけるDNASE1遺伝子発現の箱ひげ図を示し、
図35Bは、いくつかの実施形態による、HCCを有さない患者とHCCを有する患者との間のJI-U値の箱ひげ図を示し、
図35Cは、いくつかの実施形態による、サイズ選択がある及びサイズ選択のない断片によって推定されるJI-U値間の性能を比較するためのROC曲線を示す。
【
図35B】
図35Aは、いくつかの実施形態による、正常肝組織及び肝臓がん組織におけるDNASE1遺伝子発現の箱ひげ図を示し、
図35Bは、いくつかの実施形態による、HCCを有さない患者とHCCを有する患者との間のJI-U値の箱ひげ図を示し、
図35Cは、いくつかの実施形態による、サイズ選択がある及びサイズ選択のない断片によって推定されるJI-U値間の性能を比較するためのROC曲線を示す。
【
図35C】
図35Aは、いくつかの実施形態による、正常肝組織及び肝臓がん組織におけるDNASE1遺伝子発現の箱ひげ図を示し、
図35Bは、いくつかの実施形態による、HCCを有さない患者とHCCを有する患者との間のJI-U値の箱ひげ図を示し、
図35Cは、いくつかの実施形態による、サイズ選択がある及びサイズ選択のない断片によって推定されるJI-U値間の性能を比較するためのROC曲線を示す。
【
図36】いくつかの実施形態による、不揃い指数値に基づいて組織の異常レベルを分類する方法を示すフローチャートである。
【
図37】DNASE1L3に関連するバリアントの異なる遺伝子型を有するヒト対象のDNA分子における不揃いな末端の分布を同定するグラフを示す。
【
図38】対照群とSLEを有する患者との間の末梢血単核細胞におけるDNASE1L3の遺伝子発現レベルを同定する箱ひげ図を示す。
【
図39】対照試料並びに非活動性SLE及び活動性SLEを有する試料の血漿DNA(JI-U)の不揃いを同定するグラフのセットを示す。
【
図40】対照対象とSLE対象とを区別するための不揃い指数値及びサイズ比方法の性能を同定する受信者動作特性(ROC)曲線を示す。
【
図41】野生型マウスからの0時間のヘパリンインキュベーションと6時間のヘパリンインキュベーションとの間の異なる断片サイズにわたるJI-M値を同定するグラフを示す。
【
図42】DNASE1
-/-マウスについて0時間のインキュベーションとヘパリンとともに6時間のインキュベーションとの間の異なる断片サイズにわたるJI-M値を特定するグラフを示す。
【
図43】本開示の実施形態による、無細胞DNAを含む生物学的試料を使用して、ヌクレアーゼに関連する遺伝子についての遺伝性障害を検出するための方法を例示するフローチャートを示す。
【
図44】本開示の実施形態による、無細胞DNAを含む生物学的試料を使用して、ヌクレアーゼに関連する遺伝子についての遺伝性障害を検出するための方法を例示するフローチャートを示す。
【
図45】ExoTで処理した又はExoTで処理していないアニールされたdsDNAの不揃いを同定するプロトコルを示す。
【
図46】本開示の実施形態による、無細胞DNAを含む生物学的試料を使用して、ヌクレアーゼの活性を監視するための方法を例示するフローチャートである。
【
図47A】いくつかの実施形態による、GC%と不揃いな末端の長さとの間の関係を示すグラフの例を示す。
【
図47B】いくつかの実施形態による、GC%と不揃いな末端の長さとの間の関係を示すグラフの例を示す。
【
図48】いくつかの実施形態による、CCGT末端モチーフを有する断片のパーセンテージの箱ひげ図を示す。
【
図49】いくつかの実施形態による、不揃いな末端指数(JI-U)、末端モチーフ(CCGT)、及び末端モチーフと不揃いな末端分析との組み合わせを使用して、母体DNA断片と胎児DNA断片とを区別するための分類力分析を示す。
【
図50】いくつかの実施形態による、妊婦の血漿DNA試料における予測された胎児DNA画分と実際の胎児DNA画分との間の散布図を示す。
【
図51】いくつかの実施形態による、HCCを有する患者における予測された腫瘍DNA画分と実際の腫瘍DNA画分との間の散布図である。
【
図52】いくつかの実施形態による、不揃いな末端を有する無細胞DNA分子に由来する末端シグネチャに基づいて生物学的試料の特徴を決定する方法を示すフローチャートである。
【
図53】いくつかの実施形態による、特定の数の目的の不揃いな末端を濃縮するための不揃いな末端特異的ハイブリダイゼーションに基づく標的捕捉を使用する方法の例を示す。
【
図54】いくつかの実施形態による、特定の数の目的の不揃いな末端を濃縮するための不揃いな末端特異的アダプターライゲーションに基づくアンプリコン配列決定を使用する方法の例を示す。
【
図55】いくつかの実施形態による、特定の数の目的の不揃いな末端を決定するためのドロップレットPCRを使用する方法の例を示す。
【
図56】いくつかの実施形態による、非腫瘍性上咽頭上皮組織とNPC組織との間のDNASE1L3の発現レベルの箱ひげ図を示す。
【
図57A】
図57Aは、いくつかの実施形態による、上咽頭がんの様々なステージを有する異なる対象にわたるDNASE1L3に関連する末端モチーフCCCAの箱ひげ図を示し、
図57Bは、いくつかの実施形態による、NPCを有するEBV DNA陽性対象とNPCを有さないEBV DNA陽性対象とを区別する際の末端モチーフCCCAの性能レベルを示すROC曲線を示す。
【
図57B】
図57Aは、いくつかの実施形態による、上咽頭がんの様々なステージを有する異なる対象にわたるDNASE1L3に関連する末端モチーフCCCAの箱ひげ図を示し、
図57Bは、いくつかの実施形態による、NPCを有するEBV DNA陽性対象とNPCを有さないEBV DNA陽性対象とを区別する際の末端モチーフCCCAの性能レベルを示すROC曲線を示す。
【
図58】いくつかの実施形態による、様々なステージの上咽頭がんを有する異なる対象にわたるモチーフ多様性スコアの箱ひげ図を示す。
【
図59】いくつかの実施形態による、MDSとサイズ分析との組み合わせの性能レベルを評価するためのROC曲線を示す。
【
図60】いくつかの実施形態による、上咽頭がん(NPC)を有する患者及び一過的又は持続的に陽性のEBV DNAを有するがNPCを有さない患者にわたる血漿EBV DNA断片から推定される256の末端モチーフのヒートマップを示す。
【
図61】いくつかの実施形態による、陽性EBV DNAを有する非NPC対象において優先的に存在した血漿EBV DNAの末端モチーフを同定するヒートマップを示す。
【
図62】いくつかの実施形態による、生物学的試料が得られる対象における病理のレベルを決定するために、無細胞ウイルスDNA分子を含む生物学的試料を分析する方法を示すフローチャートである。
【
図63A】いくつかの実施形態による、異なる対象にわたる非メチル化シグナルから推定される不揃い指数値の箱ひげ図を示す。
【
図63B】いくつかの実施形態による、異なる対象にわたる非メチル化シグナルから推定される不揃い指数値の箱ひげ図を示す。
【
図64】いくつかの実施形態による、NPC組織と非腫瘍性上咽頭上皮組織との間のDNASE1発現レベルの箱ひげ図を示す。
【
図65】いくつかの実施形態による、生物学的試料中の無細胞ウイルスDNA分子の不揃いな末端を分析する方法を示すフローチャートである。
【
図66】本発明の実施形態による、測定システムを示す。
【
図67】本発明の実施形態による、測定システムを実行する例示的なサブシステムを示す。
【発明を実施するための形態】
【0012】
用語
「組織」は、機能単位としてともにグループ化する細胞のグループに対応する。2つ以上のタイプの細胞が、単一の組織内に見出され得る。種々のタイプの組織は、種々のタイプの細胞(例えば、肝細胞、肺胞細胞、又は血球細胞)からなり得るが、種々の生物(母体対胎児)由来の組織又は健常細胞対腫瘍細胞にも対応し得る。「参照組織」は、組織特異的メチル化レベルを決定するために使用される組織に対応し得る。異なる個体由来の同じ組織タイプの複数の試料を使用して、その組織タイプの組織特異的メチル化レベルを決定することができる。
【0013】
「生物学的試料」は、対象(例えば、妊婦、がんを有する人、又はがんを有する疑いがある人などのヒト(又は他の動物)、臓器移植レシピエント、又は臓器が関与する疾患プロセス(例えば、心筋梗塞における心臓、脳卒中における脳、若しくは貧血における造血系)を有する疑いがある対象)から採取され、目的の1つ以上の核酸分子を含有する任意の試料を指す。生物学的試料は、体液、例えば、血液、血漿、血清、尿、膣液、睾丸瘤(例えば、精巣)由来の液体、膣洗浄液、胸膜液、腹水、脳脊髄液、唾液、汗、涙、痰、気管支肺胞洗浄液、乳首からの排出液、体の異なる部分(例えば、甲状腺、乳房)由来の吸引液、眼内液(例えば、房水)であり得る。便試料も使用され得る。様々な実施形態において、無細胞DNAのために濃縮された生物学的試料(例えば、遠心分離プロトコルを介して取得された血漿試料)におけるDNAの大部分は、無細胞であり得、例えば、DNAの50%超、60%超、70%超、80%超、90%超、95%超、又は99%超は、無細胞であり得る。遠心分離プロトコルは、例えば、3,000g×10分で流体部分を取得することと、残留細胞を除去するために30,000gで更に10分間再遠心分離することと、を含み得る。生物学的試料の分析の一環として、少なくとも1,000個の無細胞DNA分子が分析され得る。他の例として、少なくとも10,000個又は50,000個又は100,000個又は500,000個又は1,000,000個又は5,000,000個、又はそれより多い無細胞DNA分子が分析され得る。
【0014】
「臨床的に関連するDNA」は、例えば、そのようなDNAの画分濃度を決定するため、又は試料(例えば、血漿)の表現型を分類するために、測定されるべき特定の組織供給源のDNAを指し得る。臨床的に関連するDNAの例は、母体血漿における胎児DNA、又は患者の血漿における腫瘍DNA、又は無細胞DNAを含む他の試料である。別の例は、移植患者の血漿、血清又は尿における移植片関連DNAの量の測定を含む。更なる例は、対象の血漿における造血性及び非造血性DNAの画分濃度、又は試料における肝臓DNA断片(若しくは他の組織)の画分濃度、又は脳脊髄液における脳DNA断片の画分濃度の測定を含む。
【0015】
「配列リード」は、核酸分子の任意の部分又は全部から配列決定されるヌクレオチドの鎖を指す。例えば、配列リードは、核酸断片から配列決定された短鎖ヌクレオチド(例えば、約20~150ヌクレオチド)、核酸断片の片端若しくは両端の短鎖ヌクレオチド、又は生物学的試料中に存在する核酸断片全体の配列決定であり得る。配列リードは、例えば、配列決定技術を使用した、又はプローブを使用した種々の方法で、例えば、ハイブリダイゼーションアレイ若しくは捕捉プローブで、又は単一プライマー若しくは等温増幅を使用した、ポリメラーゼ連鎖反応(PCR)若しくは線形増幅などの増幅技術で、取得することができる。生物学的試料の分析の一部として、少なくとも1,000個の配列リードが分析され得る。他の例として、少なくとも10,000個又は50,000個又は100,000個又は500,000個又は1,000,000個又は5,000,000個、又はそれより多い配列リードが分析され得る。
【0016】
「切断部位」は、核酸、例えば、DNAがヌクレアーゼによって切断され、それによって核酸、例えば、DNA、断片を生じる位置を指し得る。
【0017】
配列リードは、断片の末端に関連する「末端配列」を含み得る。末端配列は、断片の最も外側のN塩基、例えば断片の末端の2~30塩基に対応し得る。配列リードが断片全体に対応する場合、配列リードは2つの末端配列を含み得る。対形成末端配列決定が断片の末端に対応する2つの配列リードを提供する場合、各配列リードは1つの末端配列を含み得る。
【0018】
「配列末端シグネチャ」の「配列モチーフ」は、核酸断片(例えば、無細胞DNA断片)における塩基の短い反復パターンを指し得る。配列モチーフは、断片の末端に生じ得、したがって、末端配列の一部であるか、又はそれを含み得る。「末端モチーフ」は、潜在的には特定の組織タイプについて、核酸、例えばDNA断片の末端において優先的に生じる末端配列についての配列モチーフを指し得る。末端モチーフはまた、断片の末端の直前又は直後に生じ得、それにより、依然として末端配列に対応する。
【0019】
「不揃いな末端」という用語は、核酸(例えば、DNA)の粘着末端、核酸のオーバーハング、又は二本鎖核酸が他の核酸鎖とハイブリダイズしていない核酸鎖を含む場合を指し得る。「不揃い指数値」は、不揃いな末端の程度の尺度である。不揃い指数値は、二本鎖核酸において第2の鎖に突出した1つの鎖の平均長に比例し得る。複数の核酸分子の不揃い指数値は、核酸分子間の平滑末端の考慮を含み得る。
【0020】
いくつかの場合では、不揃い指数値は、複数の無細胞DNA分子において鎖が別の鎖に突出している集合的な尺度を提供し得る。不揃いの集合的な尺度は、複数の無細胞DNA分子におけるオーバーハングの推定される長さ、例えば、無細胞DNA分子の各々の個々の尺度の平均値、中央値、又は他の集合的な測定値に基づいて決定することができる。いくつかの場合では、不揃いの集合的な尺度は、特定の断片サイズ範囲(例えば、130~160bps、200~300bps)について決定される。いくつかの場合では、不揃いの集合的な尺度は、複数の無細胞DNA分子の末端に近接するメチル化シグナルの変化に基づいて決定することができる。
【0021】
DNA鎖間の「オーバーハングの長さ」という用語は、参照試料(例えば、正常細胞)と異なって調節されるヌクレアーゼ試料(例えば、腫瘍細胞)との間の血漿DNA全体又は特定の断片サイズ範囲内の血漿DNAの不揃い(例えば、不揃い指数値)を比較することによって推定され得る値を指し得る。いくつかの場合では、オーバーハングの長さは、生物学的試料の特徴を決定するために選択された特定のDNA断片サイズ範囲(例えば、130~160bp、200~300bp)に基づいて異なる。
【0022】
いくつかの実施形態において、DNA鎖におけるオーバーハングの長さは、二本鎖DNA間のオーバーハングの長さを特徴付ける分類値である。例えば、「長い」オーバーハングは、5nt、6nt、7nt、8nt、10nt、15nt、20nt、30nt、40nt、50nt、100ntのサイズ、及び100ntより大きいサイズを有するDNA鎖のオーバーハングを含み得る。「短い」オーバーハングは、0nt、1nt、2nt、3nt、4nt、5ntのサイズを有するDNA鎖のオーバーハングを含み得る。更に又はあるいは、DNA鎖中のオーバーハングの指定された長さは、特定の閾値を超えるオーバーハングのサイズを有する分子のパーセンテージに基づいて推定することができる。例えば、血漿DNAにおける「長い」オーバーハングの存在は、5nt、6nt、7nt、8nt、10nt、15nt、20nt、30nt、40nt、50nt、100nt、又はそれらの組み合わせよりも大きい分子のパーセンテージとして表すことができる。
【0023】
「末端シグネチャ」は、配列モチーフ、不揃いな末端、又はその両方を指し得る。
【0024】
「対立遺伝子」という用語は、同じ物理的ゲノム遺伝子座にある代替核酸(例えば、DNA)配列を指し、異なる表現型の特徴をもたらす場合ともたらさない場合がある。各染色体のコピーが2つある任意の特定の二倍体生物(男性の対象の性染色体を除く)では、各遺伝子の遺伝子型は、ホモ接合体においては同じであり、ヘテロ接合体においては異なる、その遺伝子座に存在する対立遺伝子の対を含む。生物の集団又は種は、典型的には、様々な個体の各遺伝子座に複数の対立遺伝子を含む。集団内に2つ以上の対立遺伝子が見られるゲノム遺伝子座は、多型部位と呼ばれる。遺伝子座での対立遺伝子多様性は、存在する対立遺伝子の数(すなわち、多型の程度)、又は集団内のヘテロ接合体の割合(すなわち、ヘテロ接合性率)として測定可能である。本明細書で使用される「多型」という用語は、その頻度に関係なく、ヒトゲノムにおける任意の個体間の多様性を指す。そのような多様性の例は、一塩基多型、単純なタンデムリピート多型、挿入-欠失多型、変異(疾患を引き起こし得る)、及びコピー数の多様性を含むが、これらに限定されない。本明細書で使用される「ハプロタイプ」という用語は、同じ染色体又は染色体領域上で一緒に伝達される複数の遺伝子座での対立遺伝子の組み合わせを指す。ハプロタイプは、わずか1対の遺伝子座、又は染色体領域、又は染色体全体又は染色体腕を指し得る。
【0025】
「画分胎児DNA濃度」という用語は、「胎児DNAの割合」及び「胎児DNA画分」という用語と互換的に使用され、胎児に由来する生物学的試料(例えば、母体の血漿又は血清試料)に存在する胎児DNA分子の割合を指す(Lo et al,Am J Hum Genet.1998;62:768-775、Lun et al,Clin Chem.2008;54:1664-1672)。
【0026】
「相対頻度」は、割合(例えば、パーセンテージ、画分、又は濃度)を指し得る。特に、特定の末端モチーフ(例えば、CCGA)の相対頻度は、例えば、CCGAの末端配列を有することによって、末端モチーフCCGAに関連する無細胞DNA断片の割合を提供し得る。
【0027】
「集計値」は、集合的な特性、すなわち、末端モチーフのセットの相対頻度などの1より大きい数又は測定値を有するデータセットの特性を記述する値又はパラメータを指し得る。例には、平均、中央値、相対頻度の合計、相対頻度間の変動(例えば、エントロピー、標準偏差(SD)、変動係数(CV)、四分位範囲(IQR)若しくは異なる相対頻度間の特定のパーセンタイルカットオフ(例えば95又は99パーセンタイル))、又はクラスタリングで実装され得る相対頻度の参照パターンからの差(例えば、距離)を含む。
【0028】
「較正試料」は、臨床的に関連する核酸の画分濃度(例えば、組織特異的DNA画分)が、既知であるか、又は例えば、ドナーのゲノムには存在するがレシピエントのゲノムには存在しない対立遺伝子を移植臓器のマーカーとして使用し得る移植などにおいて組織に特異的な対立遺伝子を使用して較正方法を介して決定される、生物学的試料に対応し得る。別の例として、較正試料は、末端モチーフを決定し得る試料に対応し得る。較正試料は、両方の目的に使用され得る。
【0029】
「較正データ点」は、「較正値」、及び標的組織タイプの測定値若しくは既知の特徴値、又は臨床的に関連する核酸(例えば、特定の組織タイプのDNA)の画分濃度を含む。較正値は、試料の核酸分子から測定された様々なタイプのデータ、例えば、末端モチーフの量又は不揃い指数値から決定され得る。較正値は、所望の特性、例えば、標的組織タイプの特徴値又は臨床的に関連するDNAの画分濃度に相関するパラメータに対応する。例えば、較正値は、所望の特性が既知である較正試料について決定された末端シグネチャの相対頻度(例えば、集計値)から決定され得る。較正データ点は、様々な方法で、例えば、離散点として、又は較正関数(検量線又は較正面とも呼ばれる)として定義され得る。較正関数は、較正データ点の追加の数学的変換から導出され得る。
【0030】
「分離値」は、2つの値を包含する差又は比、例えば、2つの画分寄与又は2つのメチル化レベルに相当する。分離値は、単純な差又は比であり得る。例として、x/yの直接比は、x/(x+y)と同様に分離値である。分離値は、他の因子、例えば、乗法的因子を含み得る。他の例として、値の関数の差又は比、例えば、2つの値の自然対数(ln)の差又は比が使用され得る。分離値には、差及び比を含み得る。
【0031】
「分離値」及び「集計値」(例えば、相対頻度)は、異なる分類(状態)間で変化する試料の測定値を提供するパラメータ(メトリックとも呼ばれる)の2つの例であり、したがって様々な分類を決定するために使用され得る。集計値は、例えば、クラスタリングで行われるように、試料の相対頻度のセットと相対頻度の参照セット間で差が取られる場合の分離値であり得る。
【0032】
本明細書で使用される「分類」という用語は、試料の特定の特性と関係した任意の数又は他の特徴を指す。例えば、「+」という記号(又は「陽性」という語)は、試料が欠失又は増幅を有するものとして分類されることを意味し得る。分類は、二者択一(例えば、陽性若しくは陰性)であり得、又はより多くのレベルの分類(例えば、1~10若しくは0~1のスケール)を有し得る。更なる例として、分類のレベルは、例えば、試料又は標的組織タイプの画分濃度又は特徴の値に対応することができる。
【0033】
本明細書で使用される場合、「パラメータ」という用語は、定量的データセットを特徴付ける数値、及び/又は定量的データセット間の数的関連性を意味する。例えば、第1の核酸配列の第1の量と第2の核酸配列の第2の量との比(又は比の関数)は、パラメータである。
【0034】
「カットオフ」及び「閾値」という用語は、ある操作において使用される所定の数を指す。例えば、カットオフサイズは、それを超えると断片が除外されるサイズを指し得る。閾値は、特定の分類が適用されるのを上回る又は下回る値であり得る。これらの用語のいずれかは、これらの文脈のいずれかにおいて使用され得る。カットオフ又は閾値は、「参照値」であり得るか、又は特定の分類を表すか、若しくは2つ以上の分類間を区別する参照値から導出され得る。そのような参照値は、当業者によって理解されるように、様々な方法で決定され得る。例えば、異なる既知の分類を有する対象の2つの異なるコホートについてメトリック(パラメータ)を決定することができ、参照値を1つの分類(例えば、平均)の代表として、又はメトリックの2つのクラスター間の値(例えば、所望の感度及び特異度を得るために選択される)として選択し得る。別の例として、参照値は、試料の統計シミュレーションに基づいて決定され得る。カットオフ、閾値、参照などの特定の値は、所望の精度(例えば、感度及び特異度)に基づいて決定され得る。パラメータをカットオフ値、閾値、参照値、又は較正値と比較して、分類を決定することができる。このような値を決定するためのプロセスは、例えば、1つ以上のパラメータのセットのトレーニングベクターを受ける機械学習モデルのトレーニングの一部として行うことができる。そして、パラメータとそのような値のいずれかとの比較は、パラメータを、別の対象、例えば、病態、異常、若しくは病理を有する対象若しくは有さない対象、又は既知のパラメータ値(例えば、較正値)を有する対象から決定されたパラメータ値を使用してトレーニングされた機械学習モデルに入力することによって達成することができる。
【0035】
「がんのレベル」という用語は、がんが存在するかどうか(すなわち、存在又は不存在)、がんのステージ、腫瘍のサイズ、転移があるかどうか、体の総腫瘍負荷、治療に対するがんの応答、及び/又はがんの重症度の他の尺度(例えば、がんの再発)を指し得る。がんのレベルは、数字、又は、記号、アルファベット文字、及び色などの他のしるしであり得る。レベルは、ゼロであり得る。がんのレベルは、前悪性病態又は前がん性病態(状態)も含み得る。がんのレベルは、様々な方法で使用され得る。例えば、スクリーニングは、がんを有することを今まで知らなかった人物においてがんが存在するかどうかをチェックし得る。評価は、がんと診断されている人物を調べて、がんの進行を経時的に監視し、療法の有効性を研究し、又は予後を決定し得る。一実施形態において、予後は、患者ががんで死亡する可能性、又は特定の持続時間又は特定の時間の後、がんが進行する可能性、又はがんが転移する可能性若しくは程度として表すことができる。検出は、がんの示唆的特徴(例えば、症状又は他の陽性試験)を有する人ががんを有するかどうかを「スクリーニングすること」を意味し得、又はそれを確認することを意味し得る。
【0036】
「異常レベル」は、生物に関連する異常の量、程度、又は重症度を指し得、このレベルはがんについて上記で記載したとおりであり得る。異常の例は、生物に関連する病理である。異常の別の例は、移植された臓器の拒絶反応である。異常の他の例には、自己免疫発作(例えば、腎臓を損傷するループス腎炎又は多発性硬化症)、炎症性疾患(例えば、肝炎)、線維化プロセス(例えば、肝硬変)、脂肪浸潤(例えば、脂肪肝疾患)、変性プロセス(例えば、アルツハイマー病)、及び虚血性組織損傷(例えば、心筋梗塞又は脳卒中)を含み得る。対象の健常な状態は、正常分類とみなし得る。
【0037】
「妊娠期間」という用語は、女性の最終月経(LMP)の開始からかかった妊娠の期間の尺度、又は可能であればより正確な方法で推定される妊娠の対応する期間を指し得る。このような方法には、受精(体外受精で可能である)からの既知の期間に14日間追加すること、又は産科的超音波検査によることが含まれる。
【0038】
DNA分子を説明する際の「損傷」という用語は、DNAニック、二本鎖DNAに存在する一本鎖、二本鎖DNAのオーバーハング、酸化グアニンによる酸化的DNA修飾、脱塩基部位、チミジン二量体、酸化ピリミジン、ブロックされた3’末端、又は不揃いな末端を指し得る。
【0039】
「部位」(「ゲノム部位」とも呼ばれる)は、単一の塩基位置、又は相関する塩基位置の群、例えば、CpG部位、又は相関する塩基位置のより大きい群であり得る、単一の部位に対応する。「遺伝子座」は、複数の部位を含む領域に対応し得る。遺伝子座は、遺伝子座をその文脈における部位と等価にするであろうただ1つの部位を含み得る。
【0040】
各ゲノム部位(例えば、CpG部位)についての「メチル化指数」又は「メチル化状態」は、部位におけるメチル化を、その部位を覆うリードの総数にわたって示す、核酸断片(例えば、配列リード又はプローブから決定されるDNA断片)の比を指し得る。「リード」は、核酸断片から得られる情報(例えば、部位におけるメチル化状態)に対応することができる。リードは、特定のメチル化状態の核酸断片と優先的にハイブリダイズする試薬(例えば、プライマー又はプローブ)を使用して取得することができる。典型的には、このような試薬は、核酸分子のメチル化状態、例えば、重亜硫酸塩変換、若しくはメチル化感受性制限酵素、若しくはメチル化結合タンパク質、若しくは抗メチルシトシン抗体、又はメチルシトシン及びヒドロキシメチルシトシンを認識する一分子配列決定技法に応じて、核酸分子を異なって修飾するか又は異なって認識するプロセスによる処理後に適用される。
【0041】
領域の「メチル化密度」は、この領域における部位をカバーするリードの総数で割った、メチル化を示す領域内の部位でのリード数を指し得る。この部位は、具体的な特徴を有し得、例えば、CpG部位であり得る。したがって、領域の「CpGメチル化密度」は、この領域におけるCpG部位(例えば、特定のCpG部位、CpGアイランド内又はそれより大きい領域のCpG部位)をカバーするリードの総数で割ったCpGメチル化を示すリード数を指し得る。例えば、ヒトゲノム中の各100kbビンのメチル化密度は、100kb領域へマッピングされた配列リードによってカバーされた全てのCpG部位の割合として、CpG部位のバイサルファイト処理後に変換されていないシトシン(メチル化されたシトシンに対応する)の総数から決定され得る。この分析はまた、例えば、500bp、5kb、10kb、50kb、又は1Mbなどの他のビンサイズに対して実施され得る。領域は、全ゲノム、又は染色体、又は染色体の一部(例えば、染色体腕)であり得る。CpG部位のメチル化指数は、領域がそのCpG部位のみを含む場合、その領域のメチル化密度と同じである。「メチル化シトシンの割合」は、領域において分析されたシトシン残基の総数、すなわちCpGの文脈外のシトシンを含む、に対する、メチル化されていることが示されている(例えば、バイサルファイト変換後に変換されていない)シトシン部位「C」の数を指し得る。メチル化指数、メチル化密度、及びメチル化シトシンの比は、「メチル化レベル」の例である。重亜硫酸塩変換の他に、当業者に既知の他のプロセスを使用して、メチル化状態に感度の高い酵素(例えば、メチル化感受性制限酵素)、メチル化結合タンパク質、メチル化状態に感度の高いプラットフォームを使用する単一分子配列決定(例えば、ナノポア配列決定(Schreiber et al.Proc Natl Acad Sci 2013;110:18910-18915)及びPacific Biosciences単一分子リアルタイム分析(Flusberg et al.Nat Methods 2010;7:461-465)によるもの)を含むがこれらに限定されない、DNA分子のメチル化状態を調べることができる。
【0042】
「約」又は「およそ」という用語は、当業者によって決定される特定の値の許容誤差範囲内を意味し得、これは値の測定又は決定方法、すなわち測定システムの制限について部分的に依存する。例えば、「約」は、当技術分野の慣例により、1以内又は1を超える標準偏差を意味し得る。あるいは、「約」は、所与の値の最大20%、最大10%、最大5%、又は最大1%の範囲を意味し得る。あるいは、特に生物学的システム又はプロセスに関して、「約」又は「およそ」という用語は、値の1桁以内、5倍以内、いくつかの形態では2倍以内を意味し得る。本出願及び特許請求の範囲に特定の値が記載されている場合、特に明記しない限り、特定の値の許容誤差範囲内の「約」という用語を想定すべきである。「約」という用語は、当業者によって一般に理解されている意味を有し得る。「約」という用語は、±10%を指し得る。「約」という用語は、±5%を指し得る。
【0043】
値の範囲が提供される場合、文脈が明確に別段に示さない限り、その範囲の上限と下限との間の各介在する値も、下限の10分の1まで具体的に開示されていると理解される。提供される範囲の端点が範囲に含まれることも理解される。記載された範囲における任意の記載された値又は介在する値と、その記載された範囲における任意の他の記載された値又は介在する値との間の各より小さい範囲が、本開示の実施形態内に包含される。これらのより小さい範囲の上限及び下限は、範囲に独立して含まれるか除外されてもよく、どちらか一方、両方の限度がより小さい範囲に含まれるか、又はどちらも含まれない各範囲も、記載された範囲における任意の具体的に除外された限度を条件として、本開示内に包含される。記載された範囲が一方又は両方の限度を含む場合、それらの含まれた限度のいずれか又は両方を除外する範囲も、本開示に含まれる。
【0044】
標準的な略語、例えば、bp:塩基対、kb:キロベース、pi:ピコリットル、s又はsec:秒、min:分、h又はhr:時間、aa:アミノ酸、nt:ヌクレオチドなどが使用され得る。
【0045】
別段の定義がない限り、本明細書で使用される技術用語及び科学用語は全て、本開示が属する技術の分野における当業者によって一般に理解されているのと同じ意味を有する。本開示の実施形態の実施又は試験には、本明細書に記載されているものと類似又は同等の任意の方法及び材料が使用され得るが、いくつかの潜在的かつ例示的な方法及び材料が、ここで説明され得る。
【0046】
本開示は、無細胞試料(例えば、血漿又は血清)における無細胞DNA末端シグネチャに影響を与える特定の組織又はDNAタイプにおけるヌクレアーゼ発現を使用して、無細胞試料の非侵襲的測定を介して特定の組織又はDNAのタイプの特性を決定することができる技法を記載する。ヌクレアーゼが正常細胞と比較して標的組織タイプの異常細胞において異なって調節される例では、試料中の無細胞DNA分子における末端シグネチャの測定を使用して、試料/対象中の異常レベル、例えば、異常細胞の存在を決定することができる。例えば、デオキシリボヌクレアーゼ1様3(DNASE1L3)の発現は、健常な対象における肝臓組織と比較して、肝細胞がん(HCC)細胞において相対的にダウンレギュレートされている。
【0047】
異なって調節されるヌクレアーゼを評価して、このヌクレアーゼが、特定の末端シグネチャを有するDNA分子へと、DNAを優先的に切断することを同定することができる。様々な実施形態において、特定のヌクレアーゼに対応する末端シグネチャは、少なくとも2つの異なる形態:(i)配列末端モチーフ及び(ii)DNA鎖間の指定された長さのオーバーハング(例えば、不揃いな末端シグネチャ)で同定することができる。例えば、DNASE1L3発現の末端シグネチャは、CCCA末端モチーフ配列であり得る。別の例として、特定のヌクレアーゼは、そのような無細胞試料における典型的な(通常の)オーバーハングよりも大きなオーバーハング(又は小さなオーバーハング)を好み得る。
【0048】
無細胞DNA分子の末端シグネチャを使用して、無細胞DNA分子を含む生物学的試料から得られた配列リードに基づいて、様々なタイプのパラメータを決定することができる。例えば、パラメータは、2つの末端モチーフ間の量の比(例えば、CCCA/AAAT)であり得る。別の例では、パラメータは、DNA分子における不揃いな末端の程度の尺度を同定する不揃い指数値であり得る。これらのパラメータに基づいて、組織ヌクレアーゼ発現レベルと無細胞DNA末端シグネチャとの間の関係を使用して、異常な組織と正常な組織とを区別し、組織タイプ(造血組織対非造血組織、胎児対母体など)を区別し、臨床的に関連するDNAの画分濃度又は標的組織タイプの特徴を決定することができる。
【0049】
いくつかの場合では、生物学的試料は、指定された長さの不揃いな末端を有する無細胞DNA分子について濃縮することができる。第1の鎖と第2の鎖の間に指定された長さのオーバーハングを有する無細胞DNA分子を濃縮するために、不揃いな末端特異的ハイブリダイゼーションに基づく標的化捕捉、不揃いな末端特異的アダプターライゲーションに基づくアンプリコン配列決定、及びデジタルPCR(例えば、ドロップレットデジタルPCR)を含む、異なる手法を使用することができる。濃縮された無細胞DNA分子からの配列リードを分析して、特定のヌクレアーゼに関連する配列末端シグネチャに対応する配列リードのサブセットを同定することができる。
【0050】
不揃いの濃縮の有無にかかわらず、配列リードのサブセットには、DNASE1L3発現に関連する末端シグネチャであるCCCA末端モチーフ配列が含まれ得る。配列リードのサブセットを使用して、パラメータ(例えば、CCCA/AAAT間の比)を決定し、生物学的試料の特徴を同定することができる。例えば、決定された特徴は、例えば、ヌクレアーゼが胎児組織と母体組織との間で異なって調節される場合、特定の妊娠期間又は範囲(例えば、8週、9~12週)を含み得る。別の例では、決定された特徴は、別の組織タイプ(例えば、造血細胞)と比較して異なって調節される特定の組織タイプ(例えば、肝細胞)に対応する臓器のサイズ又は栄養状態であり得る。
【0051】
本開示はまた、ウイルスの無細胞DNA末端シグネチャを分析するための技法を記載する。参照ウイルスゲノムにアラインする配列リードのセットが決定される。配列リードのセットの各々について、配列末端モチーフが決定される。配列リードのセットに対応する配列末端モチーフに基づいて、配列モチーフのセットの相対頻度を同定することができ、その集計値(例えば、モチーフ多様性スコア)を決定することができる。集計値を使用して、対象の病理(例えば、上咽頭がんなどのがん)を決定することができる。一実施形態において、病理は、ウイルス感染(例えば、エプスタイン・バール・ウイルス及び上咽頭がん、リンパ腫若しくは胃がん、若しくはヒトパピローマウイルス及び子宮頸がん、又はB型肝炎ウイルス及び肝細胞がん)に関連し得る。
【0052】
いくつかの場合では、無細胞ウイルスDNAの測定された特性に基づいて決定された不揃い指数値を使用して、対象の病態を決定することもできる。参照ウイルスゲノムにアラインする配列リードのセットを決定することができる。配列リードのセットの各々について、第2の鎖に突出した第1の鎖の長さに比例する第1の鎖及び/又は第2の鎖の特性。測定された特性に基づいて、不揃い指数値を決定することができる。不揃い指数値を参照値と比較して、対象の病態(例えば、HCC、結腸直腸がん、白血病、肺がん、乳がん、前立腺がん、咽頭がんなど)を決定することができる。
【0053】
本明細書に記載される特定の技法は、異常組織と正常組織との区別、組織タイプの区別(例えば、造血組織対非造血組織、胎児対母体)、及び無細胞DNA末端シグネチャ/モチーフに影響を与える組織におけるヌクレアーゼ発現を利用することによる臨床的に関連するDNAの画分濃度の決定を改善する。更に、無細胞DNA末端シグネチャに基づく技法は、ヌクレアーゼ発現レベルのみを分析する技法よりも有利である。例えば、ヌクレアーゼ発現レベルの遺伝子分析は、RNA配列決定又は他のタイプのRNA分析(例えば、逆転写酵素ポリメラーゼ連鎖反応)を含み得る。RNAは、加水分解を受けやすいため、DNAよりも不安定であり、かつ、安定性が低いことが既知である。したがって、試料の収集、調製、及び分析のプロトコルは、RNAよりもDNA分析に対してより堅牢で、効率的で、再現性があり、かつ、効果的であり得る。更に、短いリード配列決定を使用して循環RNAを分析する場合、循環RNAはより広い分子の長さを有するため、断片のカウントを発現レベルに変換するための追加のメトリックが必要になる。1つの分子が2つ以上の断片を生成し得るが、1回だけ発現したものとしてカウントする必要がある。上記を考慮して、ヌクレアーゼ発現レベルに由来する無細胞DNA末端シグネチャは、対象の異なるタイプの臨床評価のためのより正確な及び/又は実用的な指標となり得る。
【0054】
更に、局所的に作用する組織特異的ヌクレアーゼは簡単に測定することができない。これらのヌクレアーゼは、臨床評価のために侵襲的技法(例えば、侵襲的生検又は羊水検査又は絨毛採取など)の使用を必要とし得る組織分析によって測定する必要があり得る。一方、ヌクレアーゼの発現レベルは、血漿中を循環する対応する末端シグネチャを有する無細胞DNA分子に反映され得る。このようなシグネチャは、組織細胞のヌクレアーゼ分析と比較して非常に侵襲性の低い技法である血漿DNAの分析を通じて取ることができる。
【0055】
本発明をより詳細に説明する前に、本発明は、記載される特定の実施形態に限定されず、当然それ自体変化し得ることを理解されたい。本明細書で使用される用語は、特定の実施形態を説明するためのものにすぎず、本発明の範囲が、添付の特許請求の範囲によってのみ限定されるため、限定することを意図したものではないことも理解されたい。使用される数値(例えば、量、温度など)に関して精度を確実にするための努力がなされてきたが、ある程度の実験誤差及び偏差が考慮されるべきである。特に明記されていない限り、部は重量部であり、分子量は重量平均分子量であり、温度は摂氏であり、圧力は大気圧又はそれ近くである。
【0056】
I.無細胞DNA末端モチーフ
末端モチーフは、無細胞DNA断片の末端配列、例えば、断片のいずれかの末端でのK塩基の配列に関する。末端配列は、例えば、1、2、3、4、5、6、7などの様々な数の塩基を有するk merであり得る。末端モチーフ(又は「配列モチーフ」)は、参照ゲノムの特定の位置とは対照的に、配列自体に関する。したがって、同じ末端モチーフは、参照ゲノム全体の多数の位置に生じ得る。末端モチーフは、例えば、開始位置の直前又は終了位置の直後の塩基を同定するために、参照ゲノムを使用して決定され得る。このような塩基は、例えば、断片の末端配列に基づいて同定されるため、無細胞DNA断片の末端に対応する。
【0057】
図1は、本開示の実施形態による末端モチーフの例を示す。
図1は、分析する4mer末端モチーフを定義する2つの方法を示す。技術140において、4mer末端モチーフは、血漿DNA分子の各末端の最初の4bp配列から直接構築される。例えば、配列決定された断片の最初の4ヌクレオチド又は最後の4ヌクレオチドが使用され得る。技術160において、4mer末端モチーフは、断片の配列決定された末端からの2mer配列及びその断片の末端に隣接するゲノム領域からの他の2mer配列を利用することによって共同で構築される。他の実施形態において、他のタイプのモチーフ、例えば、1mer、2mer、3mer、5mer、6mer、7mer末端モチーフが使用され得る。
【0058】
図1に示すとおり、無細胞DNA断片110は、例えば、遠心分離などによる血液試料の精製プロセスを使用して取得される。血漿DNA断片に加えて、例えば、血清、尿、唾液、及び本明細書で言及されるその他由来の他のタイプの無細胞DNA分子が使用され得る。一実施形態において、DNA断片は、平滑末端化され得る。
【0059】
ブロック120で、DNA断片は、対形成末端配列決定に供される。いくつかの実施形態において、対形成末端配列決定は、DNA断片の2つの末端から2つの配列リード、例えば、配列リード当たり30~120塩基を生成し得る。これらの2つの配列リードは、DNA断片(分子)の一対のリードを形成し得、各配列リードは、DNA断片のそれぞれの末端の末端配列を含む。他の実施形態において、DNA断片全体が配列決定され得、それにより、DNA断片の両端の末端配列を含む単一の配列リードを提供する。
【0060】
ブロック130で、配列リードは、参照ゲノムにアラインメントされ得る。このアラインメントは、配列モチーフを定義するための異なる方法を説明するためのものであり、いくつかの実施形態において使用されない場合がある。アラインメント手順は、BLAST、FASTA、Bowtie、BWA、BFAST、SHRiMP、SSAHA2、NovoAlign、及びSOAPなどの様々なソフトウェアパッケージを使用して実施され得る。
【0061】
技術140は、ゲノム145へのアラインメントを有する、配列決定された断片141の配列リードを示す。5’末端を開始とみなして、第1の末端モチーフ142(CCCA)は、配列決定された断片141の開始にある。第2の末端モチーフ144(TCGA)は、配列決定された断片141の尾部にある。無細胞DNA(cfDNA)断片(例えば、血漿DNA)の末端優位性を分析する場合、この配列リードは5’末端のC末端カウントに寄与する。そのような末端モチーフは、一実施形態において、酵素がCCCAを認識し、次に最初のCの直前に切断を行うときに生じ得る。その場合、CCCAは優先的に血漿DNA断片の末端にある。TCGAについては、酵素がそれを認識し、Aの後に切断を行い得る。
【0062】
技術160は、ゲノム165へのアラインメントを有する、配列決定された断片161の配列リードを示す。5’末端を開始とみなして、第1の末端モチーフ162(CGCC)は、配列決定された断片161の開始の直前に生じる第1の部分(CG)、及び配列決定された断片161の開始の末端配列の一部である第2の部分(CC)を有する。第2の末端モチーフ164(CCGA)は、配列決定された断片161の尾部の直後に生じる第1の部分(GA)、及び配列決定された断片161の尾部の末端配列の一部である第2の部分(CC)を有する。そのような末端モチーフは、一実施形態において、酵素がCGCCを認識し、次いで、G及びCの直前を切断するときに生じ得る。その場合、CCは、その直前にCGが生じている血漿DNA断片の末端に優先的に存在し、それによってCGCCの末端モチーフを提供するであろう。第2の末端モチーフ164(CCGA)については、酵素はCとGとの間を切断し得る。その場合、CCは優先的に血漿DNA断片の末端に存在するであろう。技術160について、隣接するゲノム領域及び配列決定された血漿DNA断片からの塩基の数を変えられ得、必ずしも固定比率に制限されるとは限らず、例えば、2:2の代わりに、比は、2:3、3:2、4:4、2:4などであり得る。
【0063】
無細胞DNA末端のシグネチャに含まれるヌクレオチドの数が多いほど、モチーフの特異性が高くなり、これは、ゲノムにおいて正確な構成で順序付けられた6塩基を有する確率が、ゲノムにおいて正確な構成で順序付けられた2塩基を有する確率よりも低いためである。したがって、末端モチーフの長さの選択は、使用目的の用途に必要な感度及び/又は特異度によって支配され得る。
【0064】
末端配列は、配列リードを参照ゲノムにアラインメントするために使用されるため、末端配列、又は直前/直後から決定された任意の配列モチーフは、依然として末端配列から決定される。したがって、技術160は、他の塩基への末端配列の関連を作成し、参照は、その関連を作成するためのメカニズムとして使用される。技術140と160間の差異は、特定のDNA断片がどの2つの末端モチーフに割り当てられるかであり、これは、相対頻度についての特定の値に影響を与える。しかし、製造において使用されるものとして一貫した技術がトレーニングデータに使用される限り、全体的な結果(例えば、臨床的に関連するDNAの画分濃度、病理のレベルの分類など)は、DNA断片が末端モチーフにどのように割り当てられるかによって影響を受ない。
【0065】
特定の末端モチーフに対応する末端配列を有するDNA断片のカウントされた数は、相対頻度を決定するためにカウントされ得る(例えば、メモリ内のアレイに保存され得る)。以下でより詳細に説明するように、無細胞DNA断片についての末端モチーフの相対頻度は分析され得る。末端モチーフの相対頻度における差は、種々のタイプの組織及び種々の表現型、例えば種々のレベルの病理について検出されている。この差は、特定の末端モチーフを有するDNA断片の量又は末端モチーフのセット(例えば、使用される長さに対応するk merの全ての可能な組み合わせ)にわたる全体的なパターン、例えば、分散(エントロピーなど、モチーフ多様性スコアとも呼ばれる)によって定量化され得る。
【0066】
II.無細胞DNAにおける不揃いな末端
無細胞DNA末端は、末端の様式に応じて2つの形態に分類されるであろう。無細胞DNAの1つの形態は、平滑末端を有して血液循環に存在し、他の形態は、粘着末端を保有するであろう。粘着末端は、他の鎖にハイブリダイズしていない少なくとも1つの最も外側のヌクレオチドを有する二本鎖DNAの末端である。粘着末端は、オーバーハング又は不揃いな末端とも称する。任意の特定の理論に拘束されることを意図するものではないが、不揃いな末端は、無細胞DNAがどのように切断、破壊、又は分解されて断片になるかに関連し得ると考えられている。例えば、DNAは段階的に断片化する場合があり、不揃いな末端のサイズは、断片化の段階を反映することができる。不揃いな末端の数及び/又は不揃いな末端のオーバーハングのサイズを使用して、無細胞DNAを有する生物学的試料を分析し、試料及び/又は試料が得られた個体に関する情報を提供し得る。
【0067】
図2は、無細胞DNA分子のオーバーハングの程度(すなわち、オーバーハング指数)をどのように推定できるかを示す一例を例示している。ダイアグラム210、220、230は、無細胞DNA分子の例を示し、塗りつぶされたロリポップはメチル化CpG部位を表し、塗りつぶされていないロリポップは非メチル化CpG部位を表す。ダイアグラム220及び230では、破線は、塗りつぶされていないロリポップを含む、新しく塗りつぶされたヌクレオチドを表す。ダイアグラム230では、左から右を指す赤い矢印は、配列決定結果の第1のリード(リード1)を表し、右から左を指すシアン色の矢印は、第2のリード(リード2)を表す。更に、グラフ240は、5’から3’までのリード1及びリード2におけるメチル化レベルを示す。式250は、無細胞DNA分子のオーバーハング指数を決定する式を示し、式中、R1が、リード1のメチル化レベルを表し、R2が、リード2のメチル化レベルを表す。
【0068】
以下のプロセスは、不揃い指数値を使用して生物学的試料を分析する例を示す。生物学的試料は、個体から得ることができる。生物学的試料は、無細胞である複数の核酸分子を含み得る。複数の核酸分子のうちの各核酸分子は、第1の部分を有する第1の鎖と、第2の鎖と、を有する二本鎖であり得る。複数の核酸分子のうちの少なくとも一部の第1の鎖の第1の部分は、第2の鎖に突出することができ、第2の鎖にハイブリダイズすることができず、かつ第1の鎖の第1の末端にあり得る。第1の末端は、3’末端又は5’末端であり得る。血漿DNA分子における不揃いな末端の分析は、2019年7月23日に出願された米国特許出願公開第2020/0056245/A1号(その全体の内容は、あらゆる目的のために参照により本明細書に組み込まれる)に記載されている様々なアプローチを使用して行うことができる。
【0069】
プロセスは、第2の鎖に突出した第1の鎖の長さに比例する第1の鎖及び/又は第2の鎖の特性を測定することを含み得る。特性は、複数の核酸のうちの各核酸について測定され得る。特性は、本明細書に記載の任意の技法によって測定することができる。
【0070】
特性は、複数の核酸分子の各々の第1の鎖及び/又は第2の鎖の末端部分における1つ以上の部位でのメチル化状態であり得る。不揃いな末端値は、第1の鎖及び/又は第2の鎖の末端部分の1つ以上の部位における複数の核酸分子にわたるメチル化レベルを含み得る。
【0071】
いくつかの実施形態において、プロセスは、核酸分子のサイズを測定することを含む。複数の核酸分子は、指定された範囲内のサイズを有し得る。指定された範囲は、140~160bp、生物学的試料に存在するサイズの全範囲よりも小さい任意の範囲、又は本明細書に記載の任意の範囲であり得る。サイズ範囲は、より短い鎖又はより長い鎖のサイズに基づき得る。サイズ範囲は、末端修復後の分子の最も外側のヌクレオチドに基づいてもよい。5’末端が突出している場合、5’から3’までのポリメラーゼを介した伸長が起こり、サイズはより長い鎖になり得るであろう。3’から5’までの合成機能を持つDNAポリメラーゼなしで、3’末端が突出している場合、3’末端の突出した一本鎖がトリミングされ、サイズがより短い鎖になり得る。
【0072】
実施形態において、プロセスは、核酸分子を分析してリードを生成することを含み得る。リードは参照ゲノムにアラインメントされ得る。複数の核酸分子は、転写開始部位に対してある特定の距離範囲内で読み取られ得る。
【0073】
プロセスは、複数の核酸分子の測定された特性を使用して不揃い指数値を決定することを含み得る。
【0074】
第1の複数の核酸分子が指定されたサイズ範囲にある場合、方法は、第2の複数の核酸分子のうちの各核酸分子の特性を測定することを含み得る。第2の複数の核酸分子は、第2の指定されたサイズ範囲を有するサイズを有し得る。不揃い指数値を決定することは、第1の複数の核酸分子の測定された特性と、第2の複数の核酸分子の測定された特性とを使用して、比を計算することを含み得る。不揃い指数値には、本明細書に記載の不揃いな末端比又はオーバーハング指数比が含まれ得る。
【0075】
プロセスは、不揃い指数値を参照値と比較し得る。参照値又は比較は、トレーニングデータセットを用いた機械学習を使用して決定され得る。比較は、生物学的試料又は個体に関する異なる情報を決定するために使用し得る。
【0076】
プロセスは、比較に基づいて個人の病態のレベルを決定することを含み得る。病態には、疾患、障害、又は妊娠を挙げることができる。病態は、がん、自己免疫疾患、妊娠関連病態、又は本明細書に記載の任意の病態であり得る。例として、がんには、肝細胞がん(HCC)、結腸直腸がん(CRC)、白血病、肺がん、乳がん、前立腺がん、又は咽頭がんが含まれ得る。自己免疫疾患には、全身性エリテマトーデス(SLE)を挙げることができる。以下の様々なデータは、病態のレベルを決定するための例を提供する。
【0077】
いくつかの場合では、参照値は、病態を有さない対象の1つ以上の参照試料を使用して決定される。別の例として、参照値は、病態を有さない対象の1つ以上の参照試料を使用して決定される。参照試料から複数の参照値を決定でき、異なる参照値は、病態の異なるレベルを識別する可能性がある。
【0078】
このプロセスは、比較に基づいて生物学的試料中の臨床的に関連するDNAの画分を決定することを含み得る。臨床的に関連するDNAとしては、胎児DNA、腫瘍由来DNA、又は移植DNAを挙げることができる。参照値は、臨床的に関連するDNAの既知の画分を有する1つ以上の参照対象からの核酸分子を使用して得ることができる。臨床的に関連するDNAの画分を決定するための方法は、第1の鎖及び/又は第2の鎖の特性を測定する前に、複数の核酸分子を、プロトコルによって処理することを含み得る。1つ以上の参照対象からの核酸分子は、測定された特性を有する複数の核酸分子と同じプロトコルによって処理され得る。
【0079】
較正データ点には、測定された不揃い指数値及び臨床的に関連するDNAの測定された/既知の画分が含まれる。別の技法を介して(例えば、組織特異的対立遺伝子を使用して)画分が測定される任意の試料についての測定された不揃い指数値は、参照値に対応することができる。別の例として、検量線(関数)を較正データポイントに適合させることができ、参照値は検量線上のポイントに対応させることができる。したがって、新しい試料の測定された不揃い指数値を較正関数に入力することができ、これにより、臨床的に関連するDNAの画分を出力することができる。
【0080】
III.ヌクレアーゼの異なる調節
無細胞DNA(cfDNA)は、がん及び出生前検査のための強力な非侵襲的バイオマーカーであり、血漿(及び他の無細胞試料)中を短い断片として循環する。cfDNA断片化の生物学を解明するために、これらのヌクレアーゼの各々を欠損したマウスを用いて、DNASE1、DNASE1L3、及びDNA断片化因子サブユニットベータ(DFFB)の役割を調べた。各タイプのヌクレアーゼ欠損マウスにおけるcfDNA断片の末端を野生型マウスのものとともに分析することによって、各ヌクレアーゼが、cfDNA断片化の段階的なプロセスを明らかにする特定の切断優先度を有することを示した。DNAの断片化は、まず、DFFB、DNASE1L3、及び他のヌクレアーゼを用いて細胞内で始まることを示す。次いで、cfDNA断片化は、循環DNASE1L3及びDNASE1を用いて細胞外で継続する。ヌクレオソーム構造を破壊するためにヘパリンを使用することで、10bpの周期性が無傷のヌクレオソーム構造内のDNAの切断に由来したことも示した。要するに、この作業により、cfDNA断片化のモデルが確立される。
【0081】
無細胞DNA(cfDNA)分子は、非ランダムで断片化される。cfDNA断片化パターンがヌクレオソーム構造に関連していることが報告された(Sun et al.Proc Natl Acad Sci USA.2018;115:E5106;Snyder et al.Cell.2016;164:57-68)。cfDNA分子の非ランダム性はまた、特徴的なサイズプロファイルに反映され、約166bpにおいてモーダル頻度を示し、より小さな分子は10bpの周期性を示す一連のピークを形成した(Lo et al.Sci Transl Med.2010;2:61ra91)。最近、ゲノム位置のサブセットが、血漿DNA分子の生成中に優先的に切断されることが見出された(Chan et al.Proc Natl Acad Sci USA.2016;113:E8159-E8168;Jiang et al.Proc Natl Acad Sci USA.2018;115:E10925-E10933)。例えば、肝臓組織に由来する血漿DNA断片末端について、多くのゲノム部位が濃縮されるであろう(Jiang et al.Proc Natl Acad Sci USA.2018;115:E10925-E10933)。当時のこれらのデータにより、血漿DNA又は無細胞DNAが特定のゲノム位置、すなわち、ゲノムの特定のゲノム配位において優先的に断片化し得ることが示唆された。遺伝子ノックアウトを有するマウスモデルを使用して、ヌクレアーゼが血漿DNAの断片化に寄与することを示した。我々は更に、異なるヌクレアーゼが、特徴的な末端モチーフ又はシグネチャを有する血漿DNA又は無細胞DNA分子と関連していることを示した(Serpas et al.Proc Natl Acad Sci USA.2019;116:641-649;Han et al.Am J Hum Genet.2020;106:202-14)。言い換えれば、特定のゲノム位置における断片化以外に、これらの観察により、DNAの配列コンテクストが、特定のヌクレアーゼによるプロセシングの好ましい基質であるかどうかに影響を与え得ることが示唆される。ここでは、様々なヌクレアーゼに関連する無細胞DNA末端モチーフをバイオマーカーとして利用するためのアプローチを開発する。ヌクレアーゼ酵素活性は異なる組織にわたって変動し、がん、妊娠、及び臓器移植などの異なる病態生理学的状態によって変化することを示す。特定の疾患状態において異常であるであろう関連するヌクレアーゼに関連する血漿DNA断片化シグネチャの選択的分析は、そのような疾患の検出及び監視に使用することができる。
【0082】
関連するヌクレアーゼは、異なる組織にわたる異なる病態生理学的条件に従って発現の変化(アップレギュレーション又はダウンレギュレーション)を有するものとして定義することができる。ヌクレアーゼの異なる調節は、2019年12月18日に出願された米国出願第62/949,867号、及び2020年1月8日に出願された米国出願第62/958,651号に記載されるアプローチを使用して測定され、その内容全体はあらゆる目的で参照により本明細書に組み込まれる。これらの組織がDNAを循環に放出された場合、関連するヌクレアーゼの発現レベルの変化の結果として、特定の末端シグネチャを有する血漿DNA分子の相対的存在量が変化する。一実施形態において、そのような末端シグネチャの形式は、末端モチーフ及び不揃いな末端を含むことができるが、これらに限定されない。血漿DNA分子における末端モチーフは、2019年12月19日に出願された米国特許出願公開第2020/0199656A1号に記載されるアプローチを使用して測定され、その内容全体はあらゆる目的で参照により本明細書に組み込まれる。血漿DNA分子の不揃いな末端は、2019年7月23日に出願された米国特許出願公開第2020/0056245/A1号に記載されるアプローチを使用して測定され、その内容全体はあらゆる目的で参照により本明細書に組み込まれる。
【0083】
いくつかの実施形態において、ヌクレアーゼの異なる調節と標的組織タイプの病態(例えば、がん)との間の関係は、ヌクレアーゼと特定の末端サインとの関連についての知識が与えられた場合に、標的組織の病態を有する対象由来の試料中の特定の末端シグネチャを有する無細胞DNA分子の量に基づいて予測することができる。例えば、病態を有する対象からの試料について、高量/低量の特定の末端シグネチャは、ヌクレアーゼの異なる調節が標的組織タイプの病態を有する対象において生じていることを示し得る。
【0084】
他の実施形態において、ヌクレアーゼに関連する末端シグネチャは、特定の末端シグネチャを有する無細胞DNA分子の量に基づいて予測することができる。例えば、異なって調節されるヌクレアーゼを有する組織から得られた配列リードを使用して、それぞれの末端シグネチャに対応する末端配列を有する配列リードの1つ以上のセットを同定することができる。別の例として、ヌクレアーゼが異なって調節される標的組織の病態を有することが既知である対象の無細胞試料中の高量/低量の特定の末端シグネチャ。
【0085】
A.異常細胞と正常細胞との間のヌクレアーゼの異なる調節
様々な組織タイプ(例えば、肝臓)にわたって、特定のヌクレアーゼは、正常細胞と比較して異常細胞において異なって調節され得る。これは、そのようなヌクレアーゼの発現の増加又は減少をもたらす異常細胞の遺伝子変異に起因し得る。例えば、HCC細胞におけるDNASE1L3の発現は、正常細胞におけるDNASE1L3の発現と比較してダウンレギュレートされる可能性が高い。異常細胞と正常細胞との間のヌクレアーゼ発現におけるこれらの差異を使用して、対象の生物学的試料がその対応するヌクレアーゼ発現に基づいて異常細胞を含むかどうかを予測することができる。
【0086】
図3は、いくつかの実施形態による、ヌクレアーゼ切断末端シグネチャの例を示す。血漿DNA断片化プロセスは、マウスモデルにおけるヌクレアーゼ切断に関連することが見出された(Serpas et al.Proc Natl Acad Sci USA.2019;116:641-649;Han et al.Am J Hum Genet.2020;106:202-14)。1つ以上のヌクレアーゼの遺伝子発現が、がんなどの特定の病態生理学的状態で変化するであろうと仮定する(
図3)。例えば、DNASE1L3デオキシリボヌクレアーゼ1様3(DNASE1L3)の発現は相対的にダウンレギュレートされ、DFFBDNA断片化因子サブユニットベータ(DFFB)、及びDNASE1デオキシリボヌクレアーゼ1(DNASE1)の発現は、健常な対象の肝臓組織と比較して、HCC組織において相対的にアップレギュレートされる。したがって、肝臓組織で機能するヌクレアーゼ又は血液循環に入るヌクレアーゼの相対的な活性は異常であり、これにより、血漿DNAのヌクレアーゼ切断末端シグネチャの存在量が変化する。
【0087】
一実施形態において、局所臓器/組織で機能するヌクレアーゼによって引き起こされるDNA断片化での効果は、局所効果(例えば、異なる調節を引き起こす細胞の異常による)として定義されるが、ヌクレアーゼ循環によって引き起こされるDNA断片化での効果は、全身効果として定義される。ヌクレアーゼ切断末端シグネチャと称するヌクレアーゼ関連切断シグネチャを具体的に分析するために、シグナル対ノイズ比を改善し、したがって、疾患(例えば、がん)を有する患者と有しない患者とを区別する際の性能が向上する。一実施形態において、
図3に示すように、一方がアップレギュレートされたヌクレアーゼ(DNASE1L3)に対応し、他方がダウンレギュレートされた核(DFFB)に対応する血漿DNAプール中の2つのヌクレアーゼ切断シグネチャの比(すなわち、ヌクレアーゼ切断シグネチャ比)を使用することができる。一実施形態において、相対/絶対偏差、相対/絶対パーセンテージ増加、相対/絶対パーセンテージ低下、複数の比又は偏差の線形/非線形の組み合わせなどを含むがこれらに限定されない、他の統計的及び/又は数学的計算を使用して、1つ以上のヌクレアーゼ切断シグネチャを利用することができる。別の実施形態において、ヌクレアーゼには、TREX1(スリープライム修復エキソヌクレアーゼ1(Three Prime Repair Exonuclease 1))、AEN(アポトーシス増強ヌクレアーゼ)、EXO1(エキソヌクレアーゼ1)、DNASE2(デオキシリボヌクレアーゼ2)、ENDOG(エンドヌクレアーゼG)、APEX1(アプリン/アピリミジンエンドデオキシリボヌクレアーゼ1)、FEN1(フラップ(Flap)構造特異的エンドヌクレアーゼ1)、DNASE1L1(デオキシリボヌクレアーゼ1様1)、DNASE1L2(デオキシリボヌクレアーゼ1様2)、及びEXOG(エキソ/エンドヌクレアーゼG))が含まれるが、これらに限定されない。
【0088】
説明のために、例としてがんを有する又はがんを有さない肝臓のシナリオを用いる。正常な肝臓では、DNASE1及びDFFBよりもDNASE1L3の発現が高い。これらのヌクレアーゼは肝臓内で機能し、DNA断片化を促進する(ヌクレアーゼの局所効果と称する)。一方、そのようなヌクレアーゼは循環中に受動的又は能動的に放出され、血液循環中のDNA断片化における役割を有する(ヌクレアーゼの全身効果と称する)。その結果、正常な肝臓を有する対象由来の血漿試料は、DFFB及びDNASE1に関連するものよりもDNASE1L3に関連する末端シグネチャを有するより多くの血漿DNA分子を示す。しかしながら、特定の臨床シナリオ、例えばHCCを有する肝臓において、HCCに罹患した肝臓での異なるヌクレアーゼの発現レベルは異常であるであろう。例えば、DNASE1L3遺伝子発現のダウンレギュレーション並びにDNASE1及びDFFB遺伝子発現のアップレギュレーションは、HCCを有する肝臓で生じる。したがって、DNASE1L3に関連する末端シグネチャは、がんを有さない患者と比較して、がん患者において相対的に減少し、DNASE1関連及びDFFB関連の末端シグネチャは、がんを有さない患者と比較して、がんを有する患者において相対的に増加するであろう。これらのヌクレアーゼに関連する末端シグネチャの相乗的プロファイリングのためのアプローチは本開示で実施され、がんなどの疾患を有する患者と有さない患者とを区別するための血漿DNA断片シグナルを改善する。一実施形態において、DNA切断における局所及び全身効果を有する臓器には、結腸、小腸、胃、腎臓、膀胱、膵臓、脳、肺、唾液腺、樹状細胞、T細胞、B細胞、胸腺、リンパ節、単球、筋肉、心臓、胎盤、卵巣、乳房、及び精巣が含まれるが、これらに限定されない。
【0089】
説明のために、対形成末端配列決定(75bp×2(すなわち、対形成末端配列決定)、イルミナ)を行った。健常な対照(n=38)、慢性B型肝炎を有する患者(n=17)、HCCを有する患者(n=34)由来の血漿DNAをそれぞれ配列決定し、対形成末端配列リードの中央値は3,800万(範囲:1,800万~6,500万)であった。結腸直腸がん、肺がん、上咽頭がん、及び頭頸部扁平上皮がんを有する各患者群由来の10の血漿DNA試料の配列決定も行い、対形成末端配列リードの中央値は4,200万(範囲:1,900万~6,500万)であった。
【0090】
一方、野生型マウス(n=9)、DNASE1遺伝子欠失マウス(n=3)、DNASE1L3遺伝子欠失マウス(n=13)、及びDFFB遺伝子欠失マウス(n=5)由来の血漿DNAをそれぞれ配列決定した。リード数の中央値は3,500万(範囲:1,600万~7,800万)であった。
【0091】
B.異なる組織タイプについてのヌクレアーゼの異なる調節
正常細胞から異常細胞を区別することに加えて、ヌクレアーゼ発現を使用して組織タイプを区別することができる。第1の組織タイプから検出されたヌクレアーゼ発現は、第2の組織タイプのヌクレアーゼ発現とは異なり得る。例えば、肝細胞において検出されるDNASE1L3の発現量は、食道細胞において検出されるDNASE1L3の発現量よりも相対的に多い。更に、ヌクレアーゼ発現の違いはまた、異なる組織タイプにわたる異常細胞において見出され得る。例えば、異常な肝細胞(例えば、HCC)で検出されるDFFB発現量は、異常な膀胱細胞(例えば、膀胱尿路上皮がん)で検出されるDFFB発現量よりも相対的に少ない。異なる組織タイプ間のヌクレアーゼ発現のこれらの違いを使用して、異常細胞が由来する組織タイプを予測することができる。
【0092】
図4は、いくつかの実施形態による、異なる組織にわたる異なるヌクレアーゼに対応する発現プロファイルの例を示す。例えば、第1の棒プロット405は、異なる組織にわたるDNASE1L3の発現プロファイルを示し、第2の棒プロット410は、異なる組織にわたるDFFBの発現プロファイルを示し、第3の棒プロット415は、異なる組織にわたるDNASE1の発現プロファイルを示す。棒グラフ405、410、及び415の各々において、以下の頭字語は以下を指す:(1)BLCA-膀胱尿路上皮がん、(2)BRCA-浸潤性乳がん、(3)ESCA-食道がん、(4)HNSC-頭頸部扁平上皮がん、(5)KIPAN-腎色素嫌性型、腎明細胞がん、及び腎乳頭細胞がんを含む、腎汎がん、(6)KIRC-腎明細胞がん、(7)LIHC-HCCとも称する肝細胞がん、(8)LUAD-肺腺がん、(9)LUSC-肺扁平上皮がん、(10)STAD-胃腺がん、(11)STES-胃及び食道がん、(12)THCA-甲状腺がん、及び(13)UCEC-子宮体子宮内膜がん。
【0093】
更に、RPKMは、RNA配列決定の結果から推定される正規化された遺伝子発現単位である。すなわち、配列決定された100万のリード当たりのキロベース当たりのリード数である(Trapnell et al.Nat Biotechnol.2010;28:511-5)。
図4に示されるように、異なるヌクレアーゼは、異なる組織にわたって異なる発現レベルを有する。例えば、第2棒グラフ410におけるDFFB発現は、HCCとUCECとの間の差異を示す。
【0094】
更に、異なるヌクレアーゼは、異常組織と正常組織との間で異なる発現レベルを有する。例えば、第1棒グラフ405におけるDNASE1L3発現は、隣接する非腫瘍組織(68.18RPKM)と比較して、HCC/LIHC腫瘍組織(2.85RPKM)においてダウンレギュレーションを示した(P値<0.0001、マン・ホイットニーのU検定)。一方、DFFB及びDNASE1の発現は、隣接する非腫瘍組織(0.66及び0.23RPKM)と比較して、HCC/LIHC腫瘍組織(1.17及び0.53RPKM)においてアップレギュレーションを示した(P値<0.0001、マン・ホイットニーのU検定)。
【0095】
C.無細胞DNA末端モチーフに対するヌクレアーゼの異なる調節の影響
末端モチーフは、無細胞DNA断片の末端にある多数のヌクレオチド、及び/又は断片末端に近いが末端にはない1つ若しくはいくつかのヌクレオチドによって定義され得る。一実施形態において、断片末端は5’末端を指す。別の実施形態において、断片末端は3’末端を指す。更に他の実施形態において、5’末端及び3’末端の両方が使用される。分析に使用される断片末端におけるヌクレオチド(nt)の数は、例えば、1ヌクレオチド(nt)、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、及び10nt以上であるが、これらに限定されない。一実施形態において、ヌクレアーゼに関連する末端モチーフは、ヌクレアーゼによって優先的に切断される部位に対応する。別の実施形態において、ヌクレアーゼに関連する末端モチーフは、1つ以上のヌクレアーゼによって優先的に切断される末端モチーフに対応する。別の実施形態において、ヌクレアーゼに関連する末端モチーフは、疾患(例えば、がん)若しくは臨床シナリオ(例えば、移植後)、又は特定の生理学的状態(例えば、妊娠)において過剰に示されるか又は過少に示される末端モチーフによって定義されるであろう。更に別の実施形態において、ヌクレアーゼに関連する末端モチーフは、ヌクレアーゼノックアウトマウス又は他の遺伝子改変動物において過剰に示されるか又は過少に示される末端モチーフによって定義され得る。
【0096】
図5は、本開示の実施形態による、ヌクレアーゼDFFB、DNASE1、及びDNASE1L3について示される切断優先度を有するcfDNA生成及び消化のモデルを示す。DFFBは、A末端が濃縮された新しいcfDNAを生成する。DNASE1L3は、典型的な末端プロファイル(「プロファイル」とも称する)に見られる主にC末端が濃縮されたcfDNAを生成する。DNASE1は、ヘパリン及び内因性プロテアーゼの助けを得て、cfDNAをT末端断片へと更に消化することができる。
【0097】
図5は、細胞内に示されるDFFB(緑色のはさみ)及びDNASE1L3(青色のはさみ)を有するアポトーシス細胞を示す。説明文は、異なる塩基についての3つのヌクレアーゼを切断する選択順序を示す。DFFBは、細胞内でのみ作用していることが示される。DNASE1L3は、血漿中でも作用していることが示される。ヘパリンを有するDNASE1(赤色のはさみ)は、血漿中で作用していることが示される。末端塩基での得られた断片が、対応するヌクレアーゼについて異なる色で示される。DNA分子は、細胞内で切断された後により短くなり、次いで、血漿中で切断された後に更により短くなる。
【0098】
異なるマウスモデルにおけるcfDNA断片末端に関する本研究から、cfDNAを生成した断片化プロセスの概要を示すモデルの全貌を明らかにすることができる。EDTA中で全血をインキュベートした後に自発的に作られた新たに放出されたcfDNAの我々の分析において、新鮮でより長いcfDNAが、A末端断片が濃縮されていることを実証した。特に、A<>A、A<>G、及びA<>C断片は、約200bp及び400bpで強いヌクレオソーム周期性を実証する。この同じ実験モデルがDFFB欠損マウスの全血に適用されると、長いA末端断片の濃縮は見られない。したがって、DFFBがこれらのA末端断片の生成に関与している可能性が高いと結論付けることができる。
【0099】
この仮説は、アポトーシス中のDNA断片化において主要な役割を果たすDFFB酵素について発表された文献によって実証されている(Elmore,S.(2007),Toxicologic pathology 35,495-516;Larsen,B.D.and Sorensen,C.S.(2017),The FEBS Journal 284,1160-1170)。酵素の特徴付け研究により、DFFBが、A及びGヌクレオチド(プリン)を好んで、開いたヌクレオソーム間DNA領域に平滑二本鎖切断をもたらすことが示されている(Larsen,B.D.and Sorensen,C.S.(2017),The FEBS Journal 284,1160-1170;Widlak,P.,and Garrard,W.T.(2005),Journal of cellular biochemistry 94,1078-1087;Widlak,P.et al.,(2000),The Journal of biological chemistry 275,8226-8232))。ヌクレオソーム間リンカー領域のみにおける平滑二本鎖切断のこの生物学は、例えば、A<>A、A<>G、及びA<>C断片におけるヌクレオソームパターン形成を説明している。
【0100】
本研究では、インキュベーション前に取得された血漿中の典型的なcfDNAが、全ての断片サイズにわたって主にCで終わることも実証しており、このC末端の過剰表現は、ゲノム全体にわたって複数の異なる領域で一致している。cfDNAの典型的なプロファイルは、新鮮なcfDNAとは非常に異なるため、1)1つ以上の追加のヌクレアーゼがこのプロファイルを作ること、2)このヌクレアーゼ又はこれらのヌクレアーゼが典型的なcfDNAの切断プロセスで優位に立つこと、及び3)このプロセスが新鮮なA末端断片の生成後に主に生じることを推測することができる。
【0101】
このC末端優位性は、DNASE1L3欠損マウスにおいて失われるため、このC末端断片の過剰発現に関与する1つのヌクレアーゼは、DNASE1L3であると考えられる。DNASE1L3の特定のヌクレオチド切断選択を調査する既存の酵素研究はないが、DNASE1L3は、タンパク質分解の助けなしにほとんど検出できないレベルまで高効率でクロマチンを切断することが知られている(Napirei,M.et al.,(2009),The FEBS Journal 276,1059-1073)、Sisirak,V.et al.(2016),Cell 166,88-101)。全ての断片サイズ間でC末端断片がかなり均一に存在することは、DNASE1L3が全てのDNA、更にはヌクレオソーム内DNAを効率的に切断することができることを示唆する。
【0102】
DNASE1L3は、興味深い特性を有し、これは、小胞体で発現して、主要な血清ヌクレアーゼのうちの1つとして細胞外に分泌され、またアポトーシスが誘導された後、その小胞体を標的とするモチーフが切断されると核に移行する(Errami,Y.et al.(2013),The Journal of Biological Chemistry 288,3460-3468)、Napirei,M.et al.,(2005),The Biochemical Journal 389,355-364))。アポトーシス細胞内エンドヌクレアーゼとしてのその役割において、DNASE1L3は、DNA断片化においてDFFBと協働することが示唆されている(Errami,Y.et al.(2013),The Journal of Biological Chemistry 288,3460-3468)、Koyama,R.et al.,(2016),Genes to Cells 21,1150-1163))。新鮮なcfDNAの断片末端プロファイルをDNASE1L3欠損マウスのものと比較すると、A末端断片、特にA<>Cフラグメントにおいて周期性の顕著な減衰がある。この減衰は、WT対DNASE1L3欠損マウスにおいてアポトーシスから新たに断片化されたDNAの生成中のDNASE1L3の共存する細胞内活性によるものである。
【0103】
血漿ヌクレアーゼとして、DNASE1L3は、アポトーシス後に食作用を免れた循環中のDNAを消化するのに役立つ。したがって、DNASE1L3は、細胞内断片化が生じた後、断片化されたcfDNAに対して効果を発揮する可能性が高い。理論的な2ステッププロセスにおいて、第2のステップを阻害することは、第1のステップの通常は一時的な結果が明らかにするはずである。したがって、本質的に、DNASE1L3欠損マウスの血漿は、DNASE1L3作用のこの第2のステップを阻害し、第1のステップのcfDNAプロファイルであるアポトーシスからの細胞内DNA断片化を明らかにする。これはまさに我々が発見したものであり、新しく生成されたcfDNAに見出されるものと非常に類似したcfDNA断片プロファイルを有する。したがって、血漿内でのDNASE1L3消化は、典型的な恒常性cfDNAをもたらす後続のステップになり得る。
【0104】
DNASE1欠損マウスからのcfDNAのサイズプロファイルが、WTマウスのものと実質的に異なるようでなかったことを以前に発見したが、DNASE1は、「裸の」DNAの切断を好むことが既知であり、インビボでタンパク質分解の助けを得てクロマチンを切断することだけできる(Cheng,T.H.T.et al.,(2018),Clin Chem 64,406-408;Napirei,M.et al.,(2009),The FEBS Journal 276,1059-1073))。ヘパリンを使用してインビボプロテアーゼの機能に取って代わり、DNASE1活性を強化することで、DNASE1がT末端断片へとDNAを切断することを好むことを実証している。ヘパリンインキュベーションによるT末端断片の増加は、主に下位ヌクレオソームサイズ(50~150bp)であり、DNASE1が短い150bp未満の断片の生成において役割を果たすことを示唆している。DNASE1が裸のDNAをT末端断片に切断することを好むことが知られているため、典型的なcfDNAプロファイルから、50~150bp及び250~300bpの範囲のT末端断片ピークが、ほとんど裸であり得ると推測することができる。これらのサイズがサブヌクレオソーム断片又はリンカー断片に対応することは可能であり得るが、この仮説を更に調べるために、より研究を行う必要がある。
【0105】
ヘパリンインキュベーション及び末端分析の使用はまた、10bpの周期性の起源への独特の洞察を提供している。全ての断片タイプが10bpの周期性を実証するために、短い断片における10bpの周期性に完全に関与する特定のヌクレアーゼはないことを示す。代わりに、全ての断片タイプについて、ヘパリンが使用されると10bpの周期性が破壊される。DNASE1活性を増強することに加えて、ヘパリンは、ヌクレオソーム構造を破壊する(Villeponteau,B.(1992),The Biochemical journal 288(Pt3),953-958)。多くの人が、10bpの周期性が無傷のヌクレオソーム構造内のDNAの切断に由来すると仮定しているが、本研究が裏付けとなる証拠を提供し、破壊されたヌクレオソームの存在下では10bpの周期性が生じないことを示すと考えている。
【0106】
近年、Watanabeらは、DNASE1L3及びDFFB欠損マウスにおけるアセトアミノフェンの過剰投与及び抗Fas抗体治療により、インビボ肝細胞壊死及びアポトーシスを誘導した(Watanabe,T.et al.,(2019),Biochemical and biophysical research communications 516,790-795)。Watanabeらは、cfDNAがDNASE1L3及びDFFBによって生成されることを示したと主張しているが、彼らのデータは、DNASE1L3及びDFFBダブルノックアウトマウスにおける肝細胞損傷後に血清cfDNAが増加しているようではないことを示すだけである。その場合でさえ、彼らの方法からの肝細胞損傷の程度は、野生型でも大きく変動し、彼らのアポトーシス抗Fas抗体実験におけるcfDNA量との相関は驚くほど低い。ノックアウトマウスにおいて誘導されるアポトーシスの程度に不確実性を与えるこれらの不一致に加えて、彼らは、本研究で提供された断片末端に関する詳細をなにも有していない。
【0107】
本研究において、典型的なcfDNA断片が、2つの主要なステップ:1)DFFB、細胞内DNASE1L3、及び他のアポトーシスヌクレアーゼによる細胞内DNA断片化、並びに2)血清DNASE1L3による細胞外DNA断片化で作ら得ることを実証している。次いで、おそらくインビボタンパク質分解により、DNASE1は、cfDNAを短いT末端断片へと更に分解することができる。この最初のモデルは、cfDNA生成に関与する多くの主要なヌクレアーゼを含んでいたと考えられるが、モデルは、将来更に改良され得る。例えば、他の潜在的なアポトーシスヌクレアーゼには、エンドヌクレアーゼG、AIF、トポイソメラーゼII、及びシクロフィリンが含まれ、おそらく更に発見されるであろう(Nagata,S.(2018),Annual Review of Immunology 36,489-517、Samejima,K.and Earnshaw,W.C.(2005),Nature Reviews:Molecular Cell Biology 6,677-688、Yang,W.(2011),Quarterly reviews of biophysics 44,1-93)。ダブルノックアウトモデルを用いたこれらのヌクレアーゼの更なる研究は、このモデルを更に改良し、G末端選択を有するヌクレアーゼを明らかにし得る。本質的に、本研究において、異なるヌクレアーゼの作用をcfDNA断片末端プロファイルに明確に関連付けて、基礎生物学及びcfDNA断片の生物学を明らかにしている。
【0108】
ヌクレアーゼ生物学とcfDNA生理学との間のこの関連性が確立されたことで、cfDNAの分野に多くの重要かつ実用的な影響がある。第一に、病理学的結果を伴うヌクレアーゼ生物学の異常は、異常なcfDNAプロファイルに反映され得る(Al-Mayouf et al.(2011),Nat Genet 43,1186-1188;Jimenez-Alcazar,M.et al.(2017),Science 358,1202-1206;Ozcakar,Z.B.et al.,(2013),Arthritis Rheum 65,2183-2189))。第二に、血漿末端モチーフ分析は、cfDNA生物学を調査するための強力なアプローチであり、診断用途があり得る。そして最後に、抗凝固剤のタイプ及び血液分離の時間遅延などの分析前の変数は、エピジェネティック情報及び遺伝情報についてcfDNAをマイニングするときに覚えておくべき重要な交絡因子である。
【0109】
D.無細胞DNAにおける不揃いな末端に対するヌクレアーゼの異なる調節の効果
不揃いな末端を有する無細胞DNA分子について、末端モチーフは、二本鎖DNA分子に結合した一本鎖DNA分子のヌクレオチドのストレッチによって定義することができる。そのような一本鎖DNA分子の長さは、例えば、1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、及び10nt以上であり得るが、これらに限定されない。一実施形態において、ヌクレアーゼ関連不揃いな末端は、ヌクレアーゼ認識部位に対応する。別の実施形態において、ヌクレアーゼ関連不揃いな末端は、1つ以上のヌクレアーゼによって優先的に生成される不揃いな末端に対応する。別の実施形態において、ヌクレアーゼ関連不揃いな末端は、疾患において過剰に示されるか又は過少に示される不揃いな末端によって定義されるであろう。
【0110】
更に別の実施形態において、ヌクレアーゼ関連不揃いな末端は、ヌクレアーゼノックアウトマウス又は他の遺伝子改変動物において過剰に示されるか又は過少に示される不揃いな末端によって定義され得る。不揃いな末端の量は、DNA末端修復ステップ中のメチル化又は非メチル化シトシンの充填に基づくアプローチ(例えば、米国特許出願公開第2020/0056245号に記載)又はオリゴヌクレオチドプローブに基づくハイブリダイゼーションに基づくアプローチ(Harkins et al.Nucleic Acids Res.2020;48:e47)を含むがこれらに限定されない、多くの技法で測定することができる。無細胞DNA分子に存在する不揃いな末端の量は、不揃い指数値と称する。DNA末端修復ステップ中のメチル化シトシンの充填によって推定される不揃い指数値[すなわち、対形成末端配列決定反応のリード2のCH部位(H:A、C、T)でのメチル化シグナルのパーセンテージ]は、JI-M(すなわち、不揃い指数値-メチル化)と称する。DNA末端修復ステップ中の非メチル化シトシンの充填によって推定される不揃い指数値(すなわち、リード2のCG部位での非メチル化シグナルの減少したパーセンテージ)は、JI-U(すなわち、不揃い指数値-非メチル化)と称する。
【0111】
IV.ヌクレアーゼの異なる調節に基づく末端シグネチャ分析
ヌクレアーゼ発現は正常細胞から異常細胞を同定するために使用することができるが、ヌクレアーゼ発現レベルの分析には侵襲的な手順が必要になり得る。更に、RNA配列決定などの技法は、精度が低くなり得る。上記を考慮すると、疾患診断の目的のためにヌクレアーゼ発現を安全かつ正確に検出することは困難である。これらの欠陥を克服するために、本開示の実施形態は、特定のヌクレアーゼ(例えば、DNASE1)が特定の配列末端シグネチャを有するDNA分子へとDNAを優先的に切断することを決定し、配列末端シグネチャを含む配列リードの量を決定し、その量を使用して、生物学的試料に対応する組織の異常レベルの分類を予測する。
【0112】
A.対象における異常細胞の検出
一実施形態において、ヌクレアーゼ切断シグネチャ(例えば、特定のヌクレアーゼの優先的切断)は、がんを有する対象と有さない対象との間の血漿DNA末端モチーフ(例えば、血漿DNAの末端の4nt配列)を分析することによって同定することができる。一実施形態において、モチーフは、1つ以上のヌクレアーゼの遺伝子発現パターン及び1つ以上のヌクレアーゼの好ましい切断配列に基づいて選択することができる。一例では、様々なヌクレアーゼ欠失マウスモデルで明らかにされているように(Han et al.Am J Hum Genet.2020;106:202-14)、DNASE1L3酵素は、DNA分子を切断する場合に5’C末端断片を優先的に作成することが既知であり、DFFB酵素は、DNA分子を切断する場合に5’A末端断片を優先的に作成することが既知であり、DNASE1酵素は、DNA分子を切断する場合に5’T末端断片を優先的に作成することが既知である。一実施形態において、Cが末端である末端モチーフは、DNASE1L3切断シグネチャとして定義され、Aが末端である末端モチーフは、DFFB切断シグネチャとして定義され、Tが末端である末端モチーフはDNASE1切断シグネチャとして定義され得る。
【0113】
したがって、アップレギュレートされたヌクレアーゼ(例えば、DFFB)に関連する末端モチーフの存在量によって正規化された、ダウンレギュレートされたヌクレアーゼ(例えば、DNASE1L3)に関連する末端モチーフの存在量、又はその逆は、関連する組織の生理学的又は病理学的病態を反映すると仮定した。一実施形態において、相対偏差/絶対偏差、相対パーセンテージ増加/絶対パーセンテージ増加、相対パーセンテージ減少/絶対パーセンテージ減少、複数の比又は偏差の線形結合/非線形結合などを含むがこれらに限定されない、1つ以上のヌクレアーゼ切断シグネチャを利用するための他の統計的及び/又は数学的計算を使用することができる。
【0114】
図6は、いくつかの実施形態による、組織の生理学的状態又は病理学的状態を決定するための特定の末端シグネチャを有する無細胞DNA分子の例示的な分布を示す。この目的のために、健常者と比較してHCC患者において頻度が減少した5’C末端(ヌクレアーゼDNASE1L3で優先される)を有する末端モチーフと、健常な対象と比較してHCC対象において頻度が増加した5’A末端を有する末端モチーフ(ヌクレアーゼDFFBで優先される)又はT末端を有する末端モチーフ(ヌクレアーゼDNASE1で優先される)と、に注目した。
図6において、3つのアスタリスク***は、0.001未満であるp値を表し、2つのアスタリスク**は、0.01未満であるp値を表す。灰色の破線は、1/256の頻度を示す。一実施形態において、非HCC対象と比較して、CCCA末端モチーフはDNASE1L3切断シグネチャとして定義することができ、AAAA末端モチーフはDFFB切断シグネチャとして定義することができ、TTTTはDNASE1切断シグネチャとして定義することができる(図.6)。一実施形態において、DNA断片の他の位置において3’A末端、C末端、T末端、若しくはG末端、又は塩基組成を有する末端モチーフに着目する。例えば、結合親和性の高いヌクレアーゼ認識部位が切断部位よりも保存的である場合、結合部位で発生するモチーフに着目した末端シグネチャシグナルはより特異的であるであろう。
【0115】
いくつかの実施形態において、血漿DNA末端モチーフプロファイルは、疾患を有する患者及び疾患を有さない患者から収集された生物学的試料に基づいて決定される。特に、生物学的試料は、そのような疾患に罹患した臓器のヌクレアーゼ発現プロファイルを評価するために分析される。更に又はあるいは、特定の疾患を有する又は有さない特定の組織に由来する細胞株は、細胞アポトーシスの誘導の際のヌクレアーゼ発現レベル及びDNA末端モチーフを(例えば、薬理学的薬剤、抗体、放射線などの使用によって)評価するために分析することができる。いくつかの場合では、細胞株又は動物対象における遺伝子発現、例えば、特定のヌクレアーゼの発現を弱めるためにsiRNAを改変し、得られた血漿DNAを分析することによって、血漿DNA末端モチーフプロファイルを決定することができる。
【0116】
図7A及び7Bは、いくつかの実施形態による、異なる組織群にわたるモチーフ多様性スコア及びDNASE1L3/DFFB切断シグネチャ比を示す箱ひげ図を示す。一実施形態において、DNASE1L3/DFFB切断シグネチャ比と称する、DFFB切断シグネチャに対するDNASE1L3切断シグネチャの比を、診断、例えば、がん検出のための1つのメトリックとして使用した。更に、
図7A及び7Bの各々は、以下の対象カテゴリー:(i)「対照」-健康な対照対象、(ii)「HBV」-B型肝炎ウイルスによる慢性感染、及び(iii)「HCC」-肝細胞がんを有する対象についての結果を示す。
【0117】
一実施形態において、対照対象での5パーセンタイルの比を閾値として使用した場合、DNASE1L3/DFFB切断シグネチャ比を使用することによって、HCCを有する患者のうちの8.8%のみが正常対象として誤分類される。一方、モチーフ多様性スコア(MDS)を使用することよって、HCCを有する患者のうちの29.4%が正常な対象として誤分類される。モチーフの多様性スコアは以下のように定義された(Jiang et al.Cancer Discov.2020;10:664-673):
【0118】
【0119】
式中、Piは、特定のモチーフの頻度である。MDS値が高いほど、多様性が高い(すなわち、ランダム性の度合いが高い)ことを示す。理論的なスケールの範囲は0~1である。したがって、DNASE1L3/DFFB切断シグネチャ比により、対象をがん、例えば、HCCを有するものとして分類する精度が増す。
【0120】
図8は、いくつかの実施形態による、末端シグネチャの検出のための異なるパラメータを評価するための受信者動作特性(ROC)曲線を示す。これらの結果により、DNASE1L3/DFFB切断シグネチャ比を使用した性能が、最近報告されたMDSメトリックを使用した性能よりも優れているであろうことが示唆された(Jiang et al.Cancer Discov.2020;10:664-673)。このような結論は、受信者動作特性曲線(ROC)分析によって更に裏付けられ(
図8)、DNASE1L3/DFFB切断シグネチャ比に基づく分析の曲線下面積(AUC)(AUC:0.96)は、MDS分析(AUC:0.86;P値<0.01、ブートストラップ検定)及びCCCA%分析(AUC:0.91;P値=0.05、ブートストラップ検定)より大きかった。これらの結果により、目的の組織/臓器における異常なヌクレアーゼと関連付けられるモチーフの選択が、がんを有する患者とがんを有さない患者とを区別する際の識別力を改善し、患者の臨床状態がより良好に同定されることが示唆された。
【0121】
図9は、いくつかの実施形態による、DNASE1L3切断シグネチャ、DFFB切断シグネチャ、及びDNASE1切断シグネチャの三次元散布図を示す。x軸はDFFB切断シグネチャ(AAAA)を示し、y軸はDNASE1L3切断シグネチャ(CCCA)を示すし、z軸はDNASE1切断シグネチャ(TTTT)を示す。更に、ドット902(例えば、「HCC」)は、HCCを有する対象の末端切断シグネチャを表し、ドット904(例えば、「HBV」)は、慢性HBV感染を有する対象の末端切断シグネチャを表し、ドット906(例えば、「対照」)」)は、健常な対象の末端切断シグネチャを表す。影付き領域908は、がんを有する対象とがんを有さない対象とを区別するために使用された分類超平面を示す。
【0122】
図9に示すように、DNASE1L3、DFFB、及びDNASE1ヌクレアーゼを含むがこれらに限定されない、3つ以上のヌクレアーゼ切断シグネチャを使用して評価を行った。
図9に示されるように、HCC対象は、健常な対照及び慢性HBV感染を有する患者を含む非HCC対象から逸脱した。3次元プロットにおいて分類超平面(-8.6*x+2.6*y-3.2*z+4.8=0)を設定したときに、HCCを有する対象とHBVを有する対象又は健常な対象とを識別するために91.1%の感度及び96.4%の特異性を達成することができた。一実施形態において、血漿DNAにおけるヌクレアーゼ切断シグネチャの使用は、化学療法、放射線療法、免疫療法、及び標的療法を含む療法中の患者の反応を監視するための予後マーカーとして役立つ。
【0123】
図10は、いくつかの実施形態による、ロジスティック回帰を使用してDNASE1L3切断シグネチャ、DFFB切断シグネチャ、及びDNASE1切断シグネチャを決定する性能レベルを示すROCグラフを示す。一実施形態において、多くのヌクレアーゼ切断シグネチャを選択的に利用するために、例えば、ロジスティック回帰、サポートベクターマシン(SVM)、決定木、単純ベイズ分類、クラスタリングアルゴリズム、主成分分析、特異値分解(SVD)、t分布型確率的近傍埋め込み(tSNE)、人工ニューラルネットワーク、及び分類子のセットを構成し、次いでそれらの予測の加重投票を行うことによって新たなデータ点を分類するアンサンブル方法を含むがこれらに限定されない、異なる統計的アプローチを使用することができる。
図10に示されるように、3つのヌクレアーゼ(例えば、DNASE1L3、DFFB、及びDNASE1)の3つの切断末端シグネチャを利用することによってロジスティック回帰分析及びSVMモデルを使用することにより、HCCを有する対象をそれぞれ0.94及び0.93のAUCを有する非HCC対象と区別することができた。0.85の回帰スコアを使用して、94%の感度及び93%の特異性が達成された。
【0124】
図11は、いくつかの実施形態による、2つの血漿末端モチーフの比(ACGA/CCCG)を示す箱ひげ図を示す。一実施形態において、血漿DNA末端シグネチャの全ての組み合わせを列挙して、臓器移植、妊娠、がん、免疫関連疾患、及び他の疾患を含む、ヌクレアーゼ活性の異常なプロファイルに関連する疾患を有する患者と疾患を有さない患者とを区別するための最適な組み合わせを決定することにより、ヌクレアーゼ切断シグネチャを定義することができた。一例として、任意の2つの末端モチーフ間の頻度比に関する全ての組み合わせを列挙することができる。256のモチーフがあり、32,640の組み合わせが得られる。任意の2つの末端モチーフ間の32,640の頻度比の中で、CCCG末端モチーフに対するACGA末端モチーフの頻度比は、HCC患者において増加し(
図11)、HCCを有する患者(n=34)とHCCを有さない患者(n=55)を区別する際に最も識別力が高く、AUCは0.99であった。
【0125】
一方、結腸直腸がん、肺がん、上咽頭がん、及び頭頸部扁平上皮がんを含む他のがん患者を検出するために、TCAA末端モチーフに対するAGTA末端モチーフの頻度比が最も識別力が高く、AUCは0.98であった。一実施形態において、TCAA末端モチーフに対するAGTA末端モチーフの頻度比は、結腸直腸がんを有する患者と結腸直腸がんを有さない患者とを区別するときに、0.99の最高のAUCを示した。GAGA末端モチーフに対するCATC末端モチーフの頻度比は、肺がんを有する患者と肺がんを有さない患者とを区別するときに、最高のAUC1を示した。GAAC末端モチーフに対するCACT末端モチーフの頻度比は、頭頸部扁平上皮がんを有する患者と頭頸部扁平上皮がんを有さない患者とを区別するときに、最高のAUC1を示した。
【0126】
1.野生型マウスとDNASE1L3欠失マウスと間の末端シグネチャ比分析
図12は、いくつかの実施形態による、野生型マウスとDNASE1L3欠失マウスとの間の2つの血漿末端モチーフの比(ACGA/CCCG)を示す箱ひげ図を示す。一実施形態において、DNASE1L3、DFFB、及びDNASE1などであるがこれらに限定されない1つ以上のヌクレアーゼ遺伝子を欠失しているマウスと欠失していないマウスとの間の4nt末端モチーフを分析することによって、ヌクレアーゼ切断シグネチャを定義又は確認することができた。例えば、CCCG末端モチーフに対するACGA末端モチーフの比の増加は、DNASE1L3欠失マウスでも確認された(
図12)。これらの結果により、HCCを有する患者におけるDNASE1L3のダウンレギュレーションによって潜在的に引き起こされた特定の末端モチーフ比の変化が、DNASE1L3欠失マウスで直交的に反映され得ることが示唆された。一実施形態において、末端モチーフ比の変化パターンのそのような直交的な確認によって、ヒトの臨床評価のための有益な末端モチーフ比を決定することが可能になる。
【0127】
図13は、いくつかの実施形態による、野生型マウス(DFFB
+/+)とDFFB欠失マウス(DFFB
-/-)との間のAAAT末端モチーフを有する血漿DNA断片のパーセンテージを示す。一実施形態において、
図13に示すように、DFFB(DFFB
-/-)が欠失したマウスの血漿DNAにおけるAAAT末端モチーフを有する分子の頻度(中央値:0.70%;範囲:0.66~0.74%)は、野生型マウス(DFFB
+/+)よりも低くなる(中央値:0.66%;範囲:0.64~0.7%)ことが見出された。
【0128】
2.ヒト対象の正常細胞と異常細胞との間の末端シグネチャ比分析
図14は、いくつかの実施形態による、HCCを有するヒト対象とHCCを有さないヒト対象との間のAAAT末端モチーフを有する血漿DNA断片のパーセンテージを示す。そのようなAAAT末端モチーフは、HCCを有さない対象と比較して、HCCを有するヒト患者において上昇することが見出された(
図14)。HCC組織におけるDFFB発現の相対的上昇を考慮すると(
図4B)、一実施形態において、末端モチーフAAATは、DFFB切断シグネチャとみなすことができる。
【0129】
いくつかの実施形態において、特定の末端モチーフ(例えば、AAAT)は、特定の末端モチーフの量の増加又は減少が、対応するヌクレアーゼ(例えば、DFFB)の量の増加又は減少にそれぞれ実質的に対応するという決定に基づいて、複数の既知の末端モチーフから選択される。更に又はあるいは、異なる統計的アプローチを使用して、対応するヌクレアーゼの切断シグネチャを表す可能性が高い末端モチーフを選択的に同定することができる。異なる統計的アプローチには、ロジスティック回帰、サポートベクターマシン(SVM)、決定木、単純ベイズ分類、クラスタリングアルゴリズム、主成分分析、特異値分解(SVD)、t分布型確率的近傍埋め込み(tSNE)、人工ニューラルネットワーク、分類子のセットを構成し、次いでそれらの予測の加重投票を行うことによって新たなデータ点を分類するアンサンブル方法が含まれ得るが、これらに限定されない。
【0130】
図15Aは、いくつかの実施形態による、ヒト健常対照対象(CTR)、慢性B型肝炎感染(HBV)を有する対象、及びHCCを有する対象(HCC)にわたるDNASE1L3/DFFB切断シグネチャ比の値の箱ひげ図を示し、
図15Bは、いくつかの実施形態による、DNASE1L3/DFFB切断シグネチャ比(密な破線)、末端モチーフCCCAを有する断片のパーセンテージ(CCCA、緩い破線)、及びモチーフ多様性スコア(MDS、実線)を使用した、HCCを有する患者とHCCを有さない患者との間のROC曲線を示す。いくつかの場合では、血漿DNAにおける末端モチーフCCCAと末端モチーフAAATとの比をDNASE1L3/DFFB切断シグネチャ比として定義することができる。
【0131】
図15Aは、健常な対照及びB型肝炎ウイルス保有者と比較して、HCCを有する患者の血漿に存在するDNASE1L3/DFFB切断シグネチャ比がより低かったことを示している。
図15Bは、DNASE1L3/DFFB切断シグネチャ比メトリック(曲線下面積(AUC):0.96)が、CCCA末端モチーフ(AUC:0.91)及びMDS(AUC:0.86)よりも優れていたことを示す。これらの結果により、HCC、他のがん、更には他の疾患を有する患者と有さない患者をより効果的に区別するための新しい方法を考案するために、ヌクレアーゼによって優先的に切断される末端モチーフ(例えば、DNASE1L3によって優先的に切断されるCCCAモチーフ)と、ヌクレアーゼ(例えば、DFFB)が遺伝子型が改変されたマウスにおいて変更された末端モチーフと、に関する情報を使用することができることが示唆された。他の実施形態は、TREX1、AEN、EXO1、DNASE2、DNASE1、ENDOG、APEX1、FEN1、DNASE1L1、DNASE1L2、及びEXOGを含むがこれらに限定されない他のヌクレアーゼに適用することができる。
【0132】
3.子癇前症を有する又は子癇前症を有さない妊娠中の対象間の末端シグネチャ比分析
特定のヌクレアーゼは、子癇前症を有さない対象と比較して、子癇前症を有する対象において異なって調節され得ることが示されている。例えば、以前に公開された研究(Nishizawa et al.Reprod Biol Endocrinol.2011;9:107;Gormley et al.Am J Obstet Gynecol.2017;217:200.e1-200.e17)ではマイクロアレイに基づく遺伝子発現プロファイリングデータセットを分析することによって、子癇前症を有する妊娠中の対象では、正常血圧を有する対照妊婦と比較して、DNASE1L3発現レベルが6%ダウンレギュレートされることが見出された。対照的に、DNASE1発現レベルは、非感染の早産と比較して、子癇前症を有する妊娠中の対象において5.7%アップレギュレートされることが見出された。したがって、特定のヌクレアーゼの1つ以上の末端切断シグネチャを使用して、妊娠中の対象が子癇前症を有するかどうかを予測するパラメータを決定することができる。
【0133】
DNASE1切断末端シグネチャ(例えば、チミンヌクレオチドで終結する断片)とDNASE1L3切断末端シグネチャ(例えば、シトシンヌクレオチドで終結する断片)との間の比は、子癇前症を有する妊婦と子癇前症を有さない妊婦とを区別するために使用することができる。
【0134】
図16は、対照対象(例えば、子癇前症を有さない妊娠中の対象)及び子癇前症を有する妊娠中の対象にわたるDNASE1/DNASE1L3切断シグネチャ比値の箱ひげ図を示す。
図16において、DNASE1切断末端シグネチャは配列TAATに対応し、DNASE1L3切断末端シグネチャはCGTAに対応する。次世代配列決定法(短いリード対形成末端配列決定(short-read paired-end sequencing)、イルミナ)を使用して、子癇前症を有する妊娠中の対象(n=4)及び子癇前症を有さない妊娠中の対象(n=10)について配列決定し、マッピングされたリードの中央値は4,200万であった(範囲:2,100万~5,000万)。
【0135】
図16に示される例を続けると、子癇前症を有する妊婦のCGTA末端モチーフ頻度に対するTAATの比の中央値(中央値:7.39;範囲:6.27~7.84)は、対照対象の比の中央値(中央値:5.21;範囲4.90~6.11))よりも高い(P値=0.001;マン・ホイットニーのU検定)。したがって、DNASE1/DNASE1L3切断シグネチャ比の値は、子癇前症を有する妊婦と子癇前症を有さない妊婦とを区別するのに有利であり得る。
【0136】
4.組織タイプにおける異常レベルを決定する方法
図17は、いくつかの実施形態による、配列末端シグネチャに基づいて生物学的試料における異常レベルを分類するための方法を示すフローチャートである。いくつかの場合では、生物学的試料は無細胞DNA分子を含む。異常は、がん(例えば、肝細胞がん、肺がん、乳がん、胃がん、多形膠芽腫、膵臓がん、結腸直腸がん、上咽頭がん、頭頸部扁平上皮がんなど)、及び自己免疫障害(例えば、全身性エリテマトーデス)を含む病理であり得る。いくつかの場合では、生物学的試料における異常は、子癇前症、早産、胎児染色体異数性、又は胎児遺伝性障害を含む、胎盤組織(例えば、母体血漿中に検出される胎盤組織)の異常である。
【0137】
ステップ1702において、1つ以上の組織タイプの正常組織と比較して、1つ以上の組織タイプの異常細胞において異なって調節される第1のヌクレアーゼが同定される。例えば、DNASE1L3の発現は、健常な対象の肝臓組織と比較して、HCC細胞において相対的にダウンレギュレートされている。いくつかの場合では、1つ以上の組織タイプの正常組織と比較して、1つ以上の組織タイプの異常組織細胞において異なって調節される第2のヌクレアーゼも同定される。例えば、DFFB及びDNASE1の発現は、健常な対象の肝臓組織と比較して、HCC細胞で相対的にアップレギュレートされている。
【0138】
ステップ1704において、第1のヌクレアーゼは、他の配列末端シグネチャと比較して第1の配列末端シグネチャを有するDNA分子へと、DNAを優先的に切断するように決定される。例えば、ヌクレアーゼで切断されたシグネチャは、がんを有する対象と有さない対象との間の血漿末端モチーフ(例えば、血漿DNAの末端における4-nt配列)を分析することによって同定することができる。いくつかの場合では、第1のヌクレアーゼの切断優先度は、別の生物(例えば、マウス)の生物学的試料を分析することによって決定される。
【0139】
ステップ1706において、配列リードを取るために、生物学的試料由来の複数の無細胞DNA断片が分析される。いくつかの実施形態において、対形成末端配列決定を使用して、DNA断片の2つの末端から2つの配列リード、例えば、配列リード当たり30~120塩基を得る。本明細書に記載されるように、配列リードは、例えば、配列決定技法を使用して(例えば、合成による配列決定アプローチ(例えば、イルミナ)、又は単一分子配列決定(例えば、Pacific Biosciencesの単一分子リアルタイムシステム、又はナノポア配列決定(例えば、Oxford Nanopore Technologiesによる)を使用して)、又は例えばハイブリダイゼーションアレイ若しくは捕捉プローブにおいてプローブを使用して、様々な方法において得てもよい。いくつかの実施形態において、配列決定プロセスは、ポリメラーゼ連鎖反応(PCR)又は単一のプライマーを使用する線形増幅若しくは等温増幅などの増幅技法によって先行され得る。生物学的試料の分析の一部として、少なくとも1,000個の配列リードが分析され得る。他の例として、少なくとも10,000個又は50,000個又は100,000個又は500,000個又は1,000,000個又は5,000,000個、又はそれより多い配列リードが分析され得る。例として、分析は、本明細書に記載されるように、プローブに基づく又は配列に基づく技法を使用することができる。
【0140】
ステップ1708において、配列リードの第1のセットが同定される。いくつかの実施形態において、配列リードの第1のセットの各配列リードは、第1の配列末端シグネチャに対応する末端配列を含む。いくつかの実施形態において、配列リードの第1のセットは、複数の無細胞DNA分子の末端に対応する末端配列を含む。第1の配列末端シグネチャを有する末端配列は、例えば、開始位置の直前又は終了位置の直後の塩基を同定するために、参照ゲノムを使用して決定され得る。このような塩基は、例えば、断片の末端配列に基づいて同定されるため、無細胞DNA断片の末端に対応する。
【0141】
ステップ1710において、配列リードの第1のセットの第1の量が決定される。いくつかの実施形態において、配列リードの第1のセットの第1の量がカウントされ得る(例えば、メモリ内のアレイに保存され得る)。
【0142】
ステップ1712において、配列リードの第1の量及び潜在的には別の量を使用することによって、第1のパラメータが決定される。いくつかの例では、そのような量の両方は、別個のパラメータであり得る。他の量は、例えば、配列リード及び/又は分析されたDNA分子の総数に対応する、様々な形態を取ることができる。別の例として、他の量は、各々が1つ以上の他の配列末端シグネチャ(末端モチーフ)に対応する末端配列を含む配列リードの第2のセットの量に対応し得る。したがって、第1のパラメータは、それぞれの末端モチーフを有する配列リードの2つのセット間の量の比であり得る。そのような例では、他の量は、試料サイズ又は分析されたDNA分子の数に関係なく、一貫した測定値を提供するために第1の量を正規化することができる。そのような正規化によって、第1の量と他の量との間の相対量(例えば、量の比又は量の関数の比)を提供する正規化されたパラメータを得ることができる。
【0143】
いくつかの場合では、第1のパラメータ(例えば、DNAS1L3/DFFB)は、第1のヌクレアーゼ(例えば、DNAS1L3)の末端シグネチャに対応する末端配列を含む配列リードの第1の量と、第2のヌクレアーゼ(例えば、DFFB)の末端シグネチャに対応する末端配列を含む配列リードの第2の量とを使用することによって生成され、第2のヌクレアーゼは、1つ以上の組織タイプのうちの正常な組織と比較して、1つ以上の組織タイプのうちの異常な組織細胞において異なって調節される。したがって、様々な例において、第1のパラメータには、モチーフ多様性スコア、末端モチーフの相対頻度、又はDNASE1L3/DFFB切断シグネチャ比が含まれ得る。
【0144】
末端モチーフの相対頻度の差は、異なる組織タイプ及び異なる表現型、例えば異なる病理レベルのために検出され得る。この差は、特定の末端モチーフを有するDNA断片の量又は末端モチーフのセット(例えば、使用される長さに対応するk merの全ての可能な組み合わせ)にわたる全体的なパターン、例えば、分散(エントロピーなど、モチーフ多様性スコアとも呼ばれる)によって定量化され得る。
【0145】
いくつかの場合では、対応するヌクレアーゼの発現レベルを表す各パラメータを正規化するために、同じ量の配列リードが使用される。更に又はあるいは、異なる量の配列リードを使用して、対応するヌクレアーゼの各パラメータを正規化することができる。
【0146】
ステップ1714において、生物学的試料中の1つ以上の組織タイプにおける異常レベルの分類が決定され、異常レベルの分類の決定は、第1のパラメータと参照値との比較に基づく。例えば、CCCG末端モチーフに対するACGAの比に対応する値の増加は、肝細胞がん(HCC)の分類を示す。いくつかの実施形態において、異常レベルの分類には、病理(例えば、HCC)の複数のステージのうちの1つが含まれる。
【0147】
したがって、いくつかの実施形態において、それぞれのヌクレアーゼに基づいて生成されたパラメータを使用して、異常レベルを分類することができる。これらのそれぞれのパラメータを組み合わせて、例えば、比として、それぞれのパラメータのそれぞれの関数の比として、及び機械学習モデルなどのより複雑な関数への2つの入力として、新しい組み合わせパラメータを形成することができる。パラメータの組み合わせの例には、DNASE1L3/DFFB、DNASE1/DFFB、又はDNASE1L3:DNASE1:DFFBの他の比が含まれる。更に、3つ以上のヌクレアーゼのパラメータを使用することができ、例えば、3つ以上のヌクレアーゼの相対パラメータを使用することができる。
【0148】
いくつかの実施形態において、異常レベルの分類は、パラメータのセットの分析に基づいて決定することができ、各パラメータは、別の量と組み合わせて(例えば正規化のため)、各々が特定の配列末端シグネチャに対応する末端配列を含む配列リードの量に対応する。例えば、パラメータには、それぞれの末端シグネチャを有する配列リードの2つのセット間の頻度比の特定の組み合わせが含まれ得る。例えば、パラメータのセットの第1のパラメータは、各々が第1のヌクレアーゼの末端シグネチャに対応する末端配列を含む配列リードの第1の量と配列リードの別の量との間の末端シグネチャの比(例えば、CCCA/AAAT)に対応し得、パラメータのセットの第2のパラメータは、各々が第2のヌクレアーゼの末端シグネチャに対応する末端配列を含む配列リードの第2の量と配列リードの第3の量との間の末端シグネチャの比(例えば、ACGA/CCCG)に対応し得る。いくつかの場合では、配列リードの第3の量は、第1のパラメータを決定するために使用される配列リードの他の量である。
【0149】
ステップ1712及び1714を実施するためのいくつかの例では、(例えば、本明細書で説明するように)第1の量及び第2の量を機械学習モデルに入力することができる。機械学習モデルは、パラメータを内部的に(例えば、中間値として)生成し、2つの量に基づいて出力分類を提供することができる。トレーニングセットは、1つ以上の既知の異常レベルを有する試料から開発することができる。機械学習モデルのトレーニングにより、参照値、及び第1のパラメータがどのように決定されるかの構築を提供することができる。
【0150】
B.臨床的に関連するDNAの画分濃度
MDS値は母体DNA分子よりも胎児DNA分子で低いため、末端モチーフのプロファイルは胎児DNA分子と母体DNA分子との間で異なることが報告された(Jiang et al.Cancer Discov.2020;10:664-673)。妊婦におけるヌクレアーゼ切断シグネチャ分析が、胎児DNA分子と母体DNA分子とを区別するためのシグナルを改善するかどうかを検査するために、AAAA末端モチーフに対するCCCA末端モチーフの頻度比(すなわち、DNASE1L3/DFFB切断シグネチャ比)を計算した。
【0151】
1.末端シグネチャ比分析を使用した母体DNAと胎児DNAと間の区別
図18A及び18Bは、いくつかの実施形態による、モチーフ多様性スコア及びDNASE1L3/DFFB切断シグネチャ比を使用して、母体DNA分子と胎児DNA分子とを区別する例を示す。
図18A及び18Bに示されるように、胎児特異的配列は、一般に、母体特異的配列のものよりも低いモチーフ多様性スコア及びDNASE1L3/DFFB切断シグネチャ比に対応する。しかしながら、母親特異的配列と胎児特異的配列との間の測定値の相対的な違いは、モチーフの多様性スコアと比較して、DNASE1L3/DFFB切断シグネチャ比の方が大きくなる。したがって、DNASE1L3/DFFB切断シグネチャ比は、母体特異的配列と胎児特異的配列とを区別する際により大きな識別力を示し得る。
【0152】
図19は、いくつかの実施形態による、胎児DNA分子と母体のDNA分子とを区別するための2つの血漿末端モチーフ(CGAA/AAAA)の比の箱ひげ図を示す。一実施形態において、並び替え分析を使用して、母体バックグラウンドDNA分子から胎児DNA分子を区別する際に最も識別力を示す切断シグネチャの組み合わせを決定することにより、ヌクレアーゼ切断シグネチャを定義することができる。一例として、任意の2つの末端モチーフ間の頻度比の全ての組み合わせを列挙することができる。256のモチーフがあり、32,640になる。任意の2つの末端モチーフ間の32,640の頻度比の中で、AAAA末端モチーフに対するCGAA末端モチーフの頻度比は胎児DNA分子で減少し、胎児DNA分子と母体のDNA分子との間でAUC1を示した(
図23)。これらの結果により、2つの特定の末端モチーフ(例えば、末端モチーフ比)の選択的分析によって、血漿DNA分子由来の組織を決定する際の識別力が改善されることが示唆された。
【0153】
図20は、いくつかの実施形態による、母体DNA分子と胎児DNA分子とを区別する際のMDS、CCCA%、及びDNASE1L3/DFFB切断シグネチャ比についてのROC曲線を示す。MDS、CCCA%、及び切断シグネチャ比に対応する値をリードのセットによって決定した。最初に、妊婦の各血漿試料の母体断片及び胎児断片をSNP部位に基づいて同定した。母体がホモ接合体(AA)であり、かつ、胎児がヘテロ接合体(AB)であるSNPにより、胎児特異的DNA分子を同定することが可能となる。母体がヘテロ接合体(AB)であり、かつ、胎児がホモ接合体(AA)であるSNPにより、母体特異的DNA分子(すなわち、母体DNA)を同定することが可能となる。
【0154】
各血漿DNA試料について、2つの切断比の値が得られた:一方は母体DNA(X)であり、他方は胎児DNA(Y)である。例えば、30人の妊娠中の対象を分析した場合、30のX値及び30のY値が存在するであろう。胎児DNA及び母体DNAが異なる切断優先度を有する場合、X及びYは異なるはずである。X値とY値との間のROCを使用して、どの特徴(例えば、MDS、CCCA%、及びDNASE1L3/DFFB切断比)が母体DNA分子及び胎児DNA分子のセット間の最大の差をもたらすかを説明することを目指した。ROCにおけるより高いAUCは、対応する特徴が、血漿DNAプールにおける母体/胎児DNAの寄与又は母体/胎児DNAに関連する切断変化を反映するためにより強力であろうことを示した。したがって、
図20のROC曲線は、母体DNAと胎児DNAとを区別することができ、それによって本明細書に記載の方法において胎児画分濃度の提供を可能とする際のMDS、CCCA%、及び末端切断シグネチャ比の特徴の重要性を示すために使用される。
【0155】
胎児DNA分子と母体DNA分子との間のモチーフ多様性スコア値に基づく0.92のAUC(
図18A及び
図20)と比較して、AAAA末端モチーフに対するCCCA末端モチーフの頻度比(すなわち、DNASE1L3/DFFB切断シグネチャ比)は、より高いAUC(0.94)に上昇する(
図18B及び
図20)。CCCA%(すなわち、DNASE1L3切断シグネチャ)の尺度は、最小の識別力を与えた(AUC:0.71)。したがって、MDS及びDNASE1L3/DFFB切断シグネチャ比は、母体DNA分子と胎児DNA分子との区別が可能であることについて優れた精度を提供することができる。
【0156】
2.組織の分化
MDS値は、造血由来のDNA分子のものよりも肝臓由来のDNA分子で低かったために、肝臓由来のDNA分子と主に造血由来のDNA分子との間では末端モチーフのプロファイルが異なることも報告されている(Jiang et al.Cancer Discov.2020;10:664-673)。肝移植患者におけるヌクレアーゼ切断シグネチャ分析が、肝臓由来のDNA分子を主に造血由来のDNA分子と区別するためのシグナルを改善するかどうかを検査するために、AAAA末端モチーフに対するCCCA末端モチーフの頻度比も計算した。
【0157】
図21A及び21Bは、いくつかの実施形態による、モチーフ多様性スコア及びDNASE1L3/DFFB切断シグネチャ比を使用して、肝臓由来のDNA分子と造血由来のDNA分子とを区別する例を示す。
図24A及び24Bに示されるように、肝臓由来の配列(例えば、ドナー特異的配列)は、一般に、造血由来の配列(例えば、共有配列)のものよりも低いモチーフ多様性スコア及びDNASE1L3/DFFB切断シグネチャ比に対応する。しかしながら、2つの配列間の測定値の相対的な違いは、モチーフ多様性スコアと比較して、DNASE1L3/DFFB切断シグネチャ比の方が大きい。したがって、DNASE1L3/DFFB切断シグネチャ比は、母体特異的配列と胎児特異的配列とを区別する際により大きな識別力を示し得る。
【0158】
図22は、いくつかの実施形態による、肝臓由来のDNA分子と造血由来のDNA分子とを区別する際のMDS、CCCA%、及びDNASE1L3/DFFB切断シグネチャ比についてのROC曲線を示す。ここでは、肝移植患者の血漿DNA試料を使用した。最初に、肝移植患者の各試料血漿について、ドナー及びレシピエントの対象が異なる遺伝子型(例えば、ドナーの遺伝子型AA及びレシピエントの遺伝子型AB、又はドナーAB及びレシピエントAA)を有するSNPに基づき、肝臓由来のDNA分子及び造血由来のDNA分子を同定した。
【0159】
図20で使用した技法と同様に、ROC曲線を使用して、どの特徴(例えば、MDS、CCCA%、及びDNASE1L3/DFFB切断比)が肝臓由来のDNA分子と造血由来のDNA分子(すなわち、レシピエント特異的DNA)との間の最大の差をもたらすかを示した。ROCにおけるより高いAUCは、対応する特徴が、血漿DNAプールにおける肝臓由来DNAの寄与又は肝臓由来のDNAに関連する切断変化を反映するためにより強力であろうことを示した。
【0160】
肝臓由来のDNA分子と造血DNA分子との間のMDS分析についての0.76のAUC(
図24A及び
図25)と比較して、AAAA末端モチーフに対するCCCA末端モチーフの頻度比は、より高いAUC(0.88)に上昇した(
図24B及び
図25)。CCCA%は最小の識別力(AUC:0.72)を与えた。したがって、MDS及びDNASE1L3/DFFB切断シグネチャ比は、肝臓由来のDNA分子と造血由来のDNA分子との区別が可能であることについて良好な精度を提供することができる。
【0161】
一実施形態において、ヌクレアーゼ切断シグネチャは、並び替え分析を使用して、主に造血由来のDNA分子から肝臓由来のDNA分子を区別する際に最も識別力を示す切断シグネチャの組み合わせを決定することによって定義される。一例として、任意の2つの末端モチーフ間の頻度比の全ての組み合わせを列挙することができる。256のモチーフがあり、合計32,640の組み合わせが得られる。任意の2つの末端モチーフ間の32,640の頻度比の中で、GGAG末端モチーフに対するCTGA末端モチーフの頻度比はAUC1を与えた。これらの結果により、2つの特定のモチーフの選択的分析は、血漿DNA分子由来の組織を区別する際の識別力を改善することが示唆された。
【0162】
3.臨床的に関連するDNAの画分濃度を決定するための方法
図23は、いくつかの実施形態による、配列末端シグネチャに基づいて生物学的試料中の臨床的に関連するDNA分子の画分濃度を推定するための方法2300を示すフローチャートである。生物学的試料は、複数の組織タイプ由来の無細胞DNA分子の混合物を含む。いくつかの実施形態において、臨床的に関連するDNAには、胎児DNA、腫瘍DNA、又は移植臓器のDNAが含まれる。標的組織タイプには、肝臓組織、造血細胞、胎児組織、がんを有する臓器、及び胎盤組織が含まれ得る。方法2300における同様のステップは、
図17の方法1700と同様の方法で行うことができる。更に、同様のステップを伴う他の方法は、同様の方法で行うことができる。したがって、各方法について追加の説明を繰り返さない場合がある。
【0163】
ステップ2302において、複数の組織タイプのうちの少なくとも1つの他の組織タイプと比較して、標的組織タイプにおいて異なって調節される第1のヌクレアーゼが同定される。いくつかの実施形態において、臨床的に関連するDNA分子は、標的組織タイプに由来する。いくつかの場合では、複数の組織タイプのうちの少なくとも1つの他の組織タイプと比較して、1つ以上の組織タイプの標的組織タイプにおいて異なって調節される第2のヌクレアーゼも同定される。ステップ2302は、
図17のステップ1702と同様の方法で実施され得る。
【0164】
ステップ2304において、第1のヌクレアーゼは、他の配列末端シグネチャと比較して第1の配列末端シグネチャを有するDNA分子へと、DNAを優先的に切断するように決定される。いくつかの場合では、第1のヌクレアーゼの切断優先度は、別の生物(例えば、マウス)の生物学的試料を分析することによって決定される。
【0165】
ステップ2306において、配列リードを取得するために、生物学的試料由来の複数の無細胞DNA断片が分析される。いくつかの実施形態において、配列リードは、複数の無細胞DNA断片の末端に対応する末端配列を含む。いくつかの実施形態において、対形成末端配列決定を使用して配列リードを取得し、その2つの配列リードは、DNA断片の2つの末端から得られる(例えば、配列リード当たり30~120塩基)。本明細書に記載されるように、配列リードは、例えば、配列決定技法を使用して(例えば、合成による配列決定アプローチ(例えば、イルミナ)、又は単一分子配列決定(例えば、Pacific Biosciencesの単一分子リアルタイムシステム、又はナノポア配列決定(例えば、Oxford Nanopore Technologiesによる)を使用して)、又は例えばハイブリダイゼーションアレイ若しくは捕捉プローブにおいてプローブを使用して、様々な方法において得てもよい。いくつかの実施形態において、配列決定プロセスは、ポリメラーゼ連鎖反応(PCR)又は単一のプライマーを使用する線形増幅若しくは等温増幅などの増幅技法によって先行され得る。生物学的試料の分析の一部として、少なくとも1,000個の配列リードが分析され得る。他の例として、少なくとも10,000個又は50,000個又は100,000個又は500,000個又は1,000,000個又は5,000,000個、又はそれより多い配列リードが分析され得る。
【0166】
ステップ2308において、配列リードの第1のセットが同定される。いくつかの実施形態において、配列リードの第1のセットの各配列リードは、第1の配列末端シグネチャに対応する末端配列を含む。いくつかの実施形態において、配列リードの第1のセットは、複数の無細胞DNA分子の末端に対応する末端配列を含む。第1の配列末端シグネチャを有する末端配列は、例えば、開始位置の直前又は終了位置の直後の塩基を同定するために、参照ゲノムを使用して決定され得る。このような塩基は、例えば、断片の末端配列に基づいて同定されるため、無細胞DNA断片の末端に対応する。
【0167】
ステップ2310において、配列リードの第1のセットの第1の量が決定される。いくつかの実施形態において、配列リードの第1のセットの第1の量がカウントされ得る(例えば、メモリ内のアレイに保存され得る)。
【0168】
ステップ2312において、第1のパラメータは、配列リードの第1の量及び潜在的には別の量を使用して決定される。いくつかの例では、そのような量の両方は、別個のパラメータであり得る。本明細書に記載されるように、他の量は、例えば、分析される配列リード及び/又はDNA分子の総数に対応する、様々な形態をとることができる。別の例として、他の量は、各々が1つ以上の他の配列末端シグネチャ(末端モチーフ)に対応する末端配列を含む配列リードの第2のセットの量に対応し得る。いくつかの実施形態において、第1のパラメータは、それぞれの末端モチーフを有する配列リードの2つのセット間の量の比(例えば、CCCA/AAAA)である。いくつかの場合では、第1のパラメータ(例えば、DNAS1L3/DFFB)は、第1のヌクレアーゼ(例えば、DNASE1L3)に対応する末端シグネチャに対応する末端配列を含む配列リードの第1の量と、第2のヌクレアーゼ(例えば、DFFB)の末端シグネチャに対応する末端配列を含む配列リードの第2の量と、を使用することによって生成され、第2のヌクレアーゼは、1つ以上の組織タイプの正常組織と比較して、1つ以上の組織タイプの異常な組織細胞において異なって調節される。いくつかの場合では、第1のパラメータは、モチーフ多様性スコア、末端モチーフの相対頻度、又はDNASE1L3/DFFB切断シグネチャ比を示す。
【0169】
末端モチーフの相対頻度の差は、異なる組織タイプ及び異なる表現型、例えば異なる病理レベルのために検出され得る。この差は、特定の末端モチーフを有するDNA断片の量又は末端モチーフのセット(例えば、使用される長さに対応するk merの全ての可能な組み合わせ)にわたる全体的なパターン、例えば、分散(エントロピーなど、モチーフ多様性スコアとも呼ばれる)によって定量化され得る。
【0170】
いくつかの場合では、対応するヌクレアーゼの発現レベルを表す各パラメータを正規化するために、同じ量の配列リードが使用される。更に又はあるいは、異なる量の配列リードを使用して、対応するヌクレアーゼの各パラメータを正規化することができる。
【0171】
ステップ2314において、生物学的試料中の臨床的に関連するDNA分子の画分濃度が推定される。それぞれのヌクレアーゼに基づいて生成されたパラメータを使用して、配列末端シグネチャに基づいて臨床的に関連するDNA分子の画分濃度を決定することができる。これらのそれぞれのパラメータを組み合わせて、例えば、比、それぞれのパラメータのそれぞれの関数の比として、及び機械学習モデルなどのより複雑な関数への2つの入力として、新しい組み合わせパラメータを形成することができる。パラメータの組み合わせの例には、DNASE1L3/DFFB、DNASE1/DFFB、又はDNASE1L3:DNASE1:DFFBの他の比が含まれる。更に、3つ以上のヌクレアーゼのパラメータを使用することができ、例えば、3つ以上のヌクレアーゼの相対パラメータを使用することができる。
【0172】
いくつかの実施形態において、臨床的に関連するDNA分子の画分濃度は、パラメータのセットを分析することに基づいて推定され、各パラメータは、配列リードの別の量(例えば、正規化のため)と組み合わせて、各々が特定の配列末端シグネチャに対応する末端配列を含む配列リードの量に対応する。例えば、パラメータには、それぞれの末端シグネチャを有する配列リードの2つのセット間の頻度比の特定の組み合わせが含まれ得る。例えば、パラメータのセットの第1のパラメータは、各々が第1のヌクレアーゼの末端シグネチャに対応する末端配列を含む配列リードの第1の量と配列リードの別の量との間の末端シグネチャの比(例えば、CGTA/GGAG)に対応し得、パラメータのセットの第2のパラメータは、各々が第2のヌクレアーゼの末端シグネチャに対応する末端配列を含む配列リードの第2の量と配列リードの第3の量との間の末端シグネチャの比(例えば、CCCA/AAAA)に対応し得る。いくつかの場合では、配列リードの第3の量は、第1のパラメータを決定するために使用される配列リードの別の量である。
【0173】
いくつかの実施形態において、画分濃度は、第1のパラメータを、臨床的に関連するDNA分子の画分濃度が既知である1つ以上の較正試料から決定された1つ以上の較正値と比較することによって推定される。例えば、比較は、第1のパラメータ(例えば、CCCA/AAAA末端モチーフ比)が、臨床的に関連するDNA分子の特定の画分濃度を表す較正値よりも高いか低いかであり得る。比較は、較正曲線(較正データ点で構成される)と比較することを伴うことができ、したがって、比較により、第1のパラメータの第1の値を有する曲線上の点を同定することができる。次に、同定された点に対応する画分濃度を使用して、第1パラメータの画分濃度を推定することができる。例えば、第1のパラメータは、画分濃度の出力を得るための較正関数(例えば、線形又は非線形適合)への入力として提供され得る。同じ技法を使用して、標的組織タイプの特徴値を決定することができる。
【0174】
比較は、複数の較正値に対してであり得る。比較は、試料中の臨床関連DNAの画分濃度の変化に対する第1のパラメータの変化を提供する較正データに適合する較正関数に第1のパラメータを入力することによって行うことができる。別の例として、1つ以上の較正値は、1つ以上の較正試料における他のパラメータに対応することができる。多次元較正曲線を使用することができる。例えば、第1のパラメータ及び第2のパラメータを、画分濃度が既知であり、かつ、第1及び第2のパラメータが測定されている較正試料からの較正データ点の関数適合(例えば、較正表面)から同定される多次元較正関数に入力することができる。
【0175】
様々な実施形態において、臨床的に関連するDNAの画分濃度を測定することは、組織特異的対立遺伝子又はエピジェネティックマーカーを使用して、又は、例えば、米国特許公開第2013/0237431号に記載されているようなDNA断片のサイズを使用して、実施され得、それは参照によって全体が組み込まれる。組織特異的なエピジェネティックマーカーは、試料における組織特異的なDNAメチル化パターンを示すDNA配列を含み得る。
【0176】
様々な実施形態において、臨床的に関連するDNAは、胎児DNA、腫瘍DNA、移植された臓器由来のDNA、及び特定の組織タイプ(例えば、特定の臓器由来)からなる群から選択され得る。臨床的に関連するDNAは、特定の組織タイプのものであり得、例えば、特定の組織タイプは、肝臓又は造血性である。対象が妊婦である場合、臨床的に関連するDNAは、胎児DNAに対応する胎盤組織であり得る。別の例として、臨床的に関連するDNAは、がんを有する臓器に由来する腫瘍DNAであり得る。
【0177】
概して、1つ以上の較正試料から決定された1つ以上の較正値は、画分濃度が測定されている生物学的(試験)試料に使用されるのと同様のアッセイを使用して生成されることが好ましい。例えば、配列決定ライブラリは同じ方法で生成され得る。処理技術の2つの例は、GeneRead(www.qiagen.com/us/shop/sequencing/generead-size-selection-kit/#orderinginformation)及びSPRI(固相可逆固定化、AMPureビーズ、www.beckman.hk/reagents_depr/genomic_depr/cleanup-and-size-selection/pcr)である。GeneReadは、主に腫瘍断片である短いDNAを除去し得、それは、野生型及び変異体断片と同様に胎児及び移植の場合の末端モチーフの相対頻度に影響を与え得る。
【0178】
C.標的組織の特徴
様々な実施形態において、無細胞DNA末端シグネチャを使用して、標的組織の特徴を決定する。例えば、決定された特徴は、例えば、ヌクレアーゼが胎児組織と母体組織との間で異なって調節される場合、特定の妊娠期間又は範囲(例えば、8週、9~12週)を含み得る。別の例では、決定された特徴は、妊娠中の対応する対象の代謝変化によって影響を受け得る特定の組織タイプに対応する臓器のサイズ又は栄養状態であり得る。妊娠期間が異なると、胎盤だけでなく、母体側及び胎児側の両方の多くの臓器の代謝が変化するであろう。
【0179】
1.妊娠期間の決定
DNASE1L3発現レベルは、妊娠初期(例えば、第1期)の妊娠対象におけるDNASE1L3発現レベルと比較して、妊娠後期(例えば、第3期)の妊娠対象においてアップレギュレートされ得る。したがって、特定のヌクレアーゼを表す1つ以上の末端切断シグネチャを使用して、妊娠対象の妊娠期間を予測するパラメータを決定することができる。
【0180】
図24A及び24Bは、いくつかの実施形態による、ヒト胎盤組織(A、DNASE1L3)及びマウス胎盤組織(B、Dnase1l3)の異なる妊娠期間にわたるDNASE1L3発現レベルの箱ひげ図を示す。ヌクレアーゼ活性は、妊娠などの異なる病態生理学的ステージによって変わる。例えば、正期産で出産した合併症のない妊娠について募集された21人の女性及び妊娠9~12週で外科的中絶を受けた16人の健常な女性を含む、Gene Expression Omnibus(NCBI)(www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE28551)からの1つのマイクロアレイに基づくデータセットを分析した。
図22Aに示されるように、DNASE1L3発現レベルは、第1期(発現レベルの中央値:10.3;範囲:7.7~12.4)と比較して、第3期(発現レベルの中央値:12.4;範囲:10.9~14.4)でヒト胎盤において有意に増加することが見出された(P値<0.0001、マン・ホイットニーのU検定)。一方、10日目、15日目、及び19日目の各妊娠期間の5匹のマウスを含む、Expression Omnibus(NCBI)(www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE41438)からの別のマイクロアレイに基づくデータセットも分析した。その結果、マウスのオーソロガス遺伝子DNASE1L3は、妊娠初期の10日目(発現レベルの中央値:8.8;範囲:8.5~9.9)と比較して、妊娠後期の15日目及び19日目(発現レベルの中央値:10.1、範囲:7.8~10.4)において有意に増加した(P値=0.02、マン・ホイットニーのU検定)(
図22B)。
【0181】
図25は、いくつかの実施形態による、異なる妊娠期間にわたるDNASE1L3/DFFB切断シグネチャ比の箱ひげ図を示す。
図22に示されるように、AAAA末端モチーフに対するCCCA末端モチーフのヌクレアーゼ切断シグネチャ比は、妊娠期間が進むにつれて増加した。これらの結果により、2つのモチーフ間のヌクレアーゼ切断シグネチャ比は妊娠期間を評価するためのバイオマーカーとして役立ち得ることが示唆される。したがって、これらのデータは、例えばがんを含む病態生理学的変化を経時的に反映するために、ヌクレアーゼ切断シグネチャ比を使用することの実現可能性を裏付けている。この発見に基づいて、ヌクレアーゼ切断シグネチャ比が、がん又は他の疾患を有する患者の治療的介入に対する反応を経時的に監視又は予測するために使用されるであろうことを企図することができる。
【0182】
2.標的組織の特徴値を決定する方法
図26は、いくつかの実施形態による、配列末端シグネチャに基づいて標的組織タイプの特徴を決定する方法を示すフローチャートである。標的組織タイプの特徴は、複数の組織タイプからの無細胞DNA分子の混合物を含む生物学的試料を分析することによって決定することができる。いくつかの実施形態において、標的組織タイプの特徴は、胎盤組織における妊娠期間、又は子癇前症、早産、胎児染色体異数性、及び/若しくは胎児遺伝性障害を含む胎盤組織に関連する病態を示す。標的組織タイプの特徴はまた、肝臓由来のDNA分子と主に造血由来のDNA分子とを区別するなど、組織タイプを区別するために使用され得る。
【0183】
ステップ2602において、複数の組織タイプのうちの少なくとも1つの他の組織タイプと比較して、標的組織タイプにおいて異なって調節される第1のヌクレアーゼが同定される。いくつかの実施形態において、臨床的に関連するDNA分子は、標的組織タイプに由来する。いくつかの場合では、複数の組織タイプのうちの少なくとも1つの他の組織タイプと比較して、1つ以上の組織タイプの標的組織タイプにおいて異なって調節される第2のヌクレアーゼも同定される。
【0184】
ステップ2604において、第1のヌクレアーゼは、他の配列末端シグネチャと比較して第1の配列末端シグネチャを有するDNA分子へと、DNAを優先的に切断するように決定される。いくつかの場合では、第1のヌクレアーゼの切断優先度は、別の生物(例えば、マウス)の生物学的試料を分析することによって決定される。いくつかの場合では、第1のヌクレアーゼの切断優先度は、並び替え分析を使用して、組織DNA分子(例えば、肝臓由来のDNA分子と主にDNA分子と)を区別する際に最も識別力を示す末端シグネチャの組み合わせを決定することによって決定される。
【0185】
ステップ2606において、配列リードを取得するために、生物学的試料由来の複数の無細胞DNA断片が分析される。いくつかの実施形態において、配列リードは、複数の無細胞DNA断片の末端に対応する末端配列を含む。いくつかの実施形態において、対形成末端配列決定を使用して配列リードを取得し、その2つの配列リードは、DNA断片の2つの末端から得られる(例えば、配列リード当たり30~120塩基)。本明細書に記載されるように、配列リードは、例えば、配列決定技法を使用して(例えば、合成による配列決定アプローチ(例えば、イルミナ)、又は単一分子配列決定(例えば、Pacific Biosciencesの単一分子リアルタイムシステム、又はナノポア配列決定(例えば、Oxford Nanopore Technologiesによる)を使用して)、又は例えばハイブリダイゼーションアレイ若しくは捕捉プローブにおいてプローブを使用して、様々な方法において得てもよい。いくつかの実施形態において、配列決定プロセスは、ポリメラーゼ連鎖反応(PCR)又は単一のプライマーを使用する線形増幅若しくは等温増幅などの増幅技法によって先行され得る。生物学的試料の分析の一部として、少なくとも1,000個の配列リードが分析され得る。他の例として、少なくとも10,000個又は50,000個又は100,000個又は500,000個又は1,000,000個又は5,000,000個、又はそれより多い配列リードが分析され得る。
【0186】
ステップ2608において、配列リードの第1のセットが同定される。いくつかの実施形態において、配列リードの第1のセットの各配列リードは、第1の配列末端シグネチャに対応する末端配列を含む。いくつかの実施形態において、配列リードの第1のセットは、複数の無細胞DNA分子の末端に対応する末端配列を含む。第1の配列末端シグネチャを有する末端配列は、例えば、開始位置の直前又は終了位置の直後の塩基を同定するために、参照ゲノムを使用して決定され得る。このような塩基は、例えば、断片の末端配列に基づいて同定されるため、無細胞DNA断片の末端に対応する。
【0187】
ステップ2610において、配列リードの第1のセットの第1の量が決定される。いくつかの実施形態において、配列リードの第1のセットの第1の量がカウントされ得る(例えば、メモリ内のアレイに保存され得る)。
【0188】
ステップ2612において、第1のパラメータは、配列リードの第1の量及び潜在的には別の量を使用して決定される。いくつかの例では、そのような量の両方は、別個のパラメータであり得る。他の量は、例えば、配列リード及び/又は分析されたDNA分子の総数に対応する、様々な形態を取ることができる。別の例として、他の量は、各々が1つ以上の他の配列末端シグネチャ(末端モチーフ)に対応する末端配列を含む配列リードの第2のセットの量に対応し得る。第1のパラメータは、それぞれの末端モチーフを有する配列リードの2つのセット間の量の比(例えば、CCCA/AAAA)であり得る。
【0189】
いくつかの場合では、第1のパラメータ(例えば、DNASE1L3/DFFB)は、第1のヌクレアーゼ(例えば、DNASE1L3)の末端シグネチャに対応する末端配列を含む配列リードの第1の量と、第2のヌクレアーゼ(例えば、DFFB)の末端シグネチャに対応する末端配列を含む配列リードの第2の量とを使用することによって生成され、第2のヌクレアーゼは、1つ以上の組織タイプのうちの正常な組織と比較して、1つ以上の組織タイプのうちの異常な組織細胞において異なって調節される。いくつかの場合では、第1のパラメータは、モチーフ多様性スコア、末端モチーフの相対頻度、又はDNASE1L3/DFFB切断シグネチャ比を示す。
【0190】
末端モチーフの相対頻度の差は、異なる組織タイプ及び異なる表現型、例えば異なる病理レベルのために検出され得る。この差は、特定の末端モチーフを有するDNA断片の量又は末端モチーフのセット(例えば、使用される長さに対応するk merの全ての可能な組み合わせ)にわたる全体的なパターン、例えば、分散(エントロピーなど、モチーフ多様性スコアとも呼ばれる)によって定量化され得る。
【0191】
いくつかの場合では、対応するヌクレアーゼの発現レベルを表す各パラメータを正規化するために、同じ量の配列リードが使用される。更に又はあるいは、異なる量の配列リードを使用して、対応するヌクレアーゼの各パラメータを正規化することができる。
【0192】
ステップ2614において、第1のパラメータを、特徴についての値が既知である1つ以上の較正試料から決定された1つ以上の較正値と比較することによって、標的組織タイプの特徴についての第1の値が推定される。ステップ2614は、
図23のステップ2314と同様の方法で実施され得る。
【0193】
したがって、それぞれのヌクレアーゼに基づいて生成されたパラメータを使用して、標的組織タイプの特徴を決定することができる。これらのそれぞれのパラメータを組み合わせて、例えば、比、それぞれのパラメータのそれぞれの関数の比として、及び機械学習モデルなどのより複雑な関数への2つの入力として、新しい組み合わせパラメータを形成することができる。パラメータの組み合わせの例には、DNASE1L3/DFFB、DNASE1/DFFB、又はDNASE1L3:DNASE1:DFFBの他の比が含まれる。更に、3つ以上のヌクレアーゼのパラメータを使用することができ、例えば、3つ以上のヌクレアーゼの相対パラメータを使用することができる。
【0194】
いくつかの実施形態において、標的組織タイプの特徴についての第1の値は、パラメータのセットの分析に基づいて推定され、各パラメータは、別の量と組み合わせて(例えば正規化のため)、各々が特定の配列末端シグネチャに対応する末端配列を含む配列リードの量に対応する。例えば、パラメータには、それぞれの末端シグネチャを有する配列リードの2つのセット間の頻度比の特定の組み合わせが含まれ得る。例えば、パラメータのセットの第1のパラメータは、各々が第1のヌクレアーゼの末端シグネチャに対応する末端配列を含む配列リードの第1の量と配列リードの別の量との間の末端シグネチャの比(例えば、CGTA/GGAG)に対応し得、パラメータのセットの第2のパラメータは、各々が第2のヌクレアーゼの末端シグネチャに対応する末端配列を含む配列リードの第2の量と配列リードの第3の量との間の末端シグネチャの比(例えば、CCCA/AAAA)に対応し得る。いくつかの場合では、配列リードの第3の量は、第1のパラメータを決定するために使用される配列リードの別の量である。
【0195】
決定された特徴は、例えば、ヌクレアーゼが胎児組織と母体組織との間で異なって調節される場合、妊娠期間又は範囲(例えば、8週、又は9~12週)を含み得る。別の例では、決定された特徴は、他の組織タイプ(例えば、造血細胞)と比較して特定の組織タイプ(例えば、肝細胞)であり得る。標的組織タイプの特徴はまた、標的組織タイプの特定の病態(例えば、HCC、子癇前症、早産)を示し得る。別の例では、決定された特徴は、特定の組織タイプ(例えば、肝細胞)に対応する臓器のサイズ又は栄養状態であり得る。
【0196】
比較は、複数の較正値に対してであり得る。比較は、試料中の特徴の変化に対する第1のパラメータの変化を提供する較正データに適合する較正関数に第1のパラメータを入力することによって行うことができる。別の例として、1つ以上の較正値は、1つ以上の較正試料における他のパラメータに対応することができる。
【0197】
一般に、1つ以上の較正試料から決定された1つ以上の較正値は、生物学的(検査)試料に使用されるのと同様のアッセイを使用して生成されることが好ましい。例えば、配列決定ライブラリは同じ方法で生成され得る。処理技術の2つの例は、GeneRead(www.qiagen.com/us/shop/sequencing/generead-size-selection-kit/#orderinginformation)及びSPRI(固相可逆固定化、AMPureビーズ、www.beckman.hk/reagents_depr/genomic_depr/cleanup-and-size-selection/pcr)である。GeneReadは、主に腫瘍断片である短いDNAを除去し得、それは、野生型及び変異体断片と同様に胎児及び移植の場合の末端モチーフの相対頻度に影響を与え得る。
【0198】
V.ヌクレアーゼの異なる調節に基づく不揃いな末端分析
本明細書に記載されるように、DNA末端修復ステップにおいて非メチル化シトシン又はメチル化シトシンを利用することにより、血漿DNAが不揃いな末端と称する一本鎖末端を有するかどうかを決定することができる。DNA末端修復は、一本鎖DNAにおいて充填されて、二本鎖DNAを形成する。非比メチル化シトシンの充填を伴うDNA末端修復に基づく方法では、不揃いの程度は、リード2におけるメチル化レベルの低下によって推定することができる。非メチル化シトシンの充填によって推測されるこのような不揃いの程度をJI-Uと称した。一方、メチル化シトシンの充填を伴う末端修復に基づく方法では、不揃いの程度は、リード2におけるメチル化レベルの増加によって推定することができる。メチル化シトシンの充填によって推測されるこのような不揃いの程度をJI-Mと称した。
【0199】
いくつかの実施形態において、異常組織を正常組織から区別し、臨床的に関連するDNAの画分濃度を決定し、組織タイプを区別するなどのために不揃い指数値と比較するように、異なる参照値を決定することができる。例えば、参照値は、ヌクレアーゼが無細胞試料の不揃いの典型的なレベル/正常レベルと比較して不揃いを増加/減少させるかどうかと組み合わせて、ヌクレアーゼがアップレギュレートされているか又はダウンレギュレートされているかに基づいて変化することができる。
【0200】
他の実施形態において、異なるヌクレアーゼに対応する発現レベルを表すために、複数の不揃い指数値を生成することができる。例えば、第1のヌクレアーゼは、二本鎖DNA間に第1の長さのオーバーハングをもたらす末端シグネチャと関連付けることができる。第2のヌクレアーゼは、二本鎖DNA間に第2の長さのオーバーハングをもたらす異なる末端シグネチャと関連付けることができる。
【0201】
参照値は、典型的な値/正常値と比較した第1の長さ及び第2の長さに基づいて変動し得、ヌクレアーゼがアップレギュレートされているか又はダウンレギュレートされているかに基づいて変動する。例えば、2つのヌクレアーゼが両方ともアップレギュレート/ダウンレギュレートされており、どちらも通常より短い/長い長さをもたらす場合、通常からのより大きな偏差が予想されるであろう。あるいは、ヌクレアーゼが不揃い指数値について異なる方向に作用する場合、より小さな偏差が予想され得る。複数の不揃い指数値は、正常組織から異常組織を区別し、臨床的に関連するDNAの画分濃度を決定し、組織タイプを区別するなどのために、それぞれの参照値と比較することができる。例えば、異常組織と正常組織とを区別するために超平面を決定することができるように、ヌクレアーゼ(例えば、DNASE1L3、DFFB、及びDNASE1)の複数の不揃い指数値を三次元散布図にプロットする。
【0202】
A.様々なヌクレアーゼ及び断片サイズにわたる無細胞DNAの不揃い
野生型マウスと比較して、DNASE1L3欠失マウスでは、130~160bpのサイズを有する無細胞DNA分子の不揃いが増加したが(Jiang et al.Genome Res.2020;30:1144-1153)、いくつかのヌクレアーゼ(例えば、DNASE1L3)の不揃いな末端分析では、他の断片サイズを考慮することができる。説明のために、無細胞DNAの不揃いは、50~600bpの広い範囲のサイズで評価される。無細胞DNAの不揃いは、超並列重亜硫酸塩配列決定に基づいて、リード1と比較したリード2のCpG部位におけるメチル化レベルの低下によって定義された。無細胞DNAの不揃いの定量化の原理は、本明細書、及び2020年12月8日に出願された米国出願第63/122,669号及び2021年5月26日に出願された米国出願第63/193,508号に記載されている。その全体が、全ての目的のために参照により本明細書に組み込まれる。
【0203】
1.DNASE1L3
図27は、野生型マウスとDNASE1L3を欠失をしたマウスとの間の血漿DNAの不揃いを示すグラフ2700のセットを示す。
図27において、グラフ2702は、野生型マウス及びDNASE1L3欠失マウスの様々な断片サイズにわたるJI-M値を示す。箱ひげ
図2704は、野生型マウス及びDNASE1L3欠失マウスの200~600bp範囲内の血漿DNAのJI-M値を示す。本実施例では、メチル化シトシンを使用して、野生型(n=12)及びDNASE1L3
-/-マウス(n=5)の50~600bpのより広い範囲のサイズにおいて不揃い指数値を測定した。マッピングされた対形成末端リードの中央値は1億1,500万(範囲:5,100万~2億1,600万)であった。グラフ2702に示されるように、130~160bpのサイズを有する血漿DNA分子での不揃いが、野生型マウスよりも、DNASE1L3欠失を有するマウスの血漿においてより高いことに加えて、血漿DNAの不揃いは、DNASE1L3を欠失しているマウスの200bpより大きい分子ではより低いことが示された。
【0204】
グラフ2702に示されるように、野生型マウスと比較して、DNASE1L3が欠失したマウスでは、断片サイズにわたって二相性の不揃い分布が観察された。ほぼ1つのヌクレオソームのサイズである170bpよりも短いサイズの短い断片では、DNASE1L3
-/-マウスにおいて不揃いの増加を見ることができる。対照的に、箱ひげ
図2704は、200bpより長い断片では、24.95%の中央値の減少がDNASE1L3
-/-マウスにおいて観察することができることを示す。
【0205】
いくつかの場合では、200bpより大きい血漿DNA分子の不揃いの使用によって、130~160bpの範囲の血漿DNA分子に基づく結果と比較して、DNASE1L3を欠失しているマウスとDNASE1L3を欠失していないマウスとの間の差が大きくなる(箱ひげ
図2704)。これらの結果は、比較的長い血漿DNAの不揃いの使用によってDNAヌクレアーゼ活性が反映されることを示している。いくつかの実施形態において、血漿DNAの不揃いは、170bp、180bp、190bp、210bp、220bp、230bp、240bp、250bp、260bp、270bp、280bp、290bp、300bp、310bp、320bp、330bp、340bp、350bp、400bp、450bp、500bp、550bp、600bpなどより大きいが、これらに限定されないサイズを有するDNA分子に基づいて決定される。
【0206】
2.DNASE1
不揃いの増加は、DNASE1L3-/-マウスモデルにおける短い断片(例えば、<170bp)に存在し、他の原因となる酵素に起因し得る。例えば、血漿DNA不揃いな末端に対するDNASE1の影響を試験した。
【0207】
図28は、Dnase1
-/-マウスとWTマウスとの間の血漿DNAの不揃い(JI-M)を同定する箱ひげ図を示す。
図28では、7匹のDNASE1
-/-マウス及び12匹のWTマウスのセットを使用して、不揃いの差異を調べた。この例では、170bps未満のサイズを有するDNA断片について、不揃い指数値を測定した。DNASE1
-/-マウスDNA分子に存在する不揃いの平均(JI-M平均値:20.19;範囲:18.49~22.70)は、WTマウスの分子由来の分子のもの(JI-M平均値:22.12;範囲:20.01~25.14;P値=0.017、マン・ホイットニーのU検定)よりも有意に低かった。この結果は、DNASE1が不揃いな末端を無細胞DNA分子に導入することができる要因のうちの1つであろうことを示している。
【0208】
3.DFFB
不揃いの末端の生成に関連する酵素を更に調べるために、6匹のDffb
-/-マウス及び6匹のWTマウスを使用した。
図29は、WTマウスとDFFB
-/-マウスとの間の血漿DNAの不揃いを同定するグラフのセットを示す。
図29では、箱ひげ
図2902は、WTマウスとDFFB
-/-マウスとの間のJI-M値の差を示す。DFFBのノックアウト(JI-M中央値:43.96;範囲:42.53~45.28)によって、WTマウス(JI-M中央値:41.64;範囲:39.63~42.86;P値=0.009、マン・ホイットニーのU検定)と比較して、200bp超の断片サイズでJI-Mが5.57%増加した。更に、グラフ2904は、WTマウスとDFFB
-/-マウスとの間の異なる断片サイズにわたる血漿DNAのJI-M値を示す。グラフ2904に示されるように、JI-M値の増加は、異なる断片サイズにわたるJI-M分布においても見ることができる。この結果は、DFFBがDNA断片化プロセス中に非常に短い不揃いな末端又は平滑末端の生成を促進し得ることを予備的に明らかにすることができる。
【0209】
これらの結果は、様々なサイズにわたる血漿DNAの不揃いな末端を使用することによって、様々なDNAヌクレアーゼ活性の情報を得ることができることを示している。DNAヌクレアーゼ活性の異常に関連する疾患は、本開示に存在する実施形態による血漿DNAの不揃いな末端の分析を通じて検出されるであろう。
【0210】
B.臨床的に関連するDNAの画分濃度
いくつかの実施形態において、二本鎖DNA間の指定された長さのオーバーハングは、特定のヌクレアーゼの末端切断シグネチャと関連付けることができる。
【0211】
特定の対象の生物学的試料では、この特性(例えば、指定された長さのオーバーハング)を有するDNA分子の量を同定するパラメータを生成することができ、パラメータを使用して、対象の臨床的に関連するDNAの画分濃度を決定することができる。例えば、不揃い指数値などのパラメータは、特定の量の胎児特異的DNA、腫瘍DNA、又は移植DNAを含む生物学的試料を示すことができる。例えば、不揃い指数値が別の試料の別の不揃い指数値と比較して高いという決定は、胎児特異的DNA又は腫瘍DNAの異なる画分濃度を示す。
【0212】
1.胎児DNA及び母体DNAについての不揃い
図30A及び30Bは、いくつかの実施形態による、胎児特異的DNA分子と共有DNA分子との間の不揃い指数値の比較を示す。胎児特異的データ3002に示されるように、異なるサイズの血漿DNA断片にわたって胎児遺伝子型と母体遺伝子型との間で共有される対立遺伝子(主に母体由来)を有する、共有データ3004によって表される共有DNA断片と比較して、より高いJI-M値が、胎児特異的DNA分子に存在する(
図30A)。
図30Bは、異なるサイズの血漿DNA断片に関連する、胎児DNA分子と母体DNA分子との間の短い分子から長い分子までの異なるサイズにわたるJI-Mの差(すなわち、ΔJ)のプロットを示す。正のJI-Mは、胎児特異的対立遺伝子を有する分子がより高いJI-Mを有することを意味する。130bp~160bpのサイズ範囲内での正の徐々に上昇するΔJ値は、このサイズ範囲にわたって胎児特異的DNAに存在し、160bpで範囲の最大値を達成した(
図30B)。
【0213】
図31Aは、いくつかの実施形態による、胎盤組織及び白血球におけるDNASE1の遺伝子発現を示し、
図31Bは、いくつかの実施形態による、サイズ選択なしでの胎児特異的断片と共有断片との間の非メチル化の不揃い指数(JI-U)値の箱ひげ図を示し、
図31Cは、いくつかの実施形態による、胎児特異的断片と130~160bpのサイズ範囲内の共有断片との間のJI-U値の箱ひげ図を示す。DNASE1の発現レベルは、白血球のDNASE1発現レベルと比較して、胎盤組織において2.5倍高いことが見出された。したがって、DNASE1は、胎児DNA分子の不揃いの増強に寄与した1つの酵素であり得る(
図31A)。以前に公開されたデータセット(Jiang et al.Clin Chem.2017;63:606-608)を使用したJI-U測定に基づいて、30人の妊娠中の対象も分析した。サイズ選択なしの共有DNA断片のJI-U値(
図31B)(平均:16.1;範囲:14.3~18.2)と比較して、130~160bpの胎児DNA分子において、より高いJI-U値が観察された(平均:20.4;範囲:15.9~26.2)(
図31C)(P値<0.0001、マン・ホイットニーのU検定)。胎児断片と共有断片との間のJI-Uの絶対差の中央値(4.5)は、130~160bpのサイズ範囲において、サイズ選択のない全ての断片のもの(1.7)よりも非常に高かった(P値<0.0001、マン・ホイットニーのU検定)。
【0214】
これらの結果により、不揃いが、胎盤組織におけるDNASE1活性を反映することに有益であり、したがって、血漿DNA分子由来の組織の情報を得るための新しいアプローチを提供するであろうことが示唆される。例えば、妊婦の血漿DNAの不揃いが高いほど、胎盤組織に由来するDNA分子が多くなるであろう。サイズ選択により、胎児DNA分子と母体DNA分子とを区別する際のシグナル対雑音比が高くなる。
【0215】
2.腫瘍DNAと非腫瘍DNAとの間の不揃い
図32は、HCCを有する対象における変異対立遺伝子(腫瘍DNA)及び野生型対立遺伝子(主に非腫瘍DNA)を有する血漿DNA分子間のJI-M値の累積差を同定するグラフ3200を示す。
図32に示されるように、変異対立遺伝子を有する血漿DNAは腫瘍由来のものであったが、野生型対立遺伝子を有する血漿DNAは主に非腫瘍性であった。31,234の腫瘍由来のDNA分子及び野生型対立遺伝子を有する209,027のDNA分子があった。腫瘍由来DNAの不揃いは、野生型を有する配列よりも高いことが観察され、腫瘍由来DNA分子と野生型分子との間のJI-Mの累積差は、DNA断片のサイズが大きくなるにつれて増加した。この不揃いの差異を使用して、胎児DNAについてと同様の方法で腫瘍DNAの画分濃度を決定することができる。
【0216】
3.臨床的に関連するDNAの画分を決定する方法
図33は、いくつかの実施形態による、不揃い指数値に基づいて臨床的に関連するDNA分子の画分を決定する方法を示すフローチャートである。生物学的試料は、複数の組織タイプ由来の無細胞DNA分子の混合物を含み得、無細胞DNA分子の各々は、第1の部分を有する第1の鎖及び第2の鎖と部分的又は完全な二本鎖を形成する。いくつかの場合では、無細胞DNA分子の少なくともいくつかの第1の鎖の第1の部分は、第2の鎖由来の相補部分を有さず、第2の鎖にハイブリダイズせず、第1の鎖の第1の末端にある。
【0217】
ステップ3302において、第1のヌクレアーゼは、複数の組織タイプのうちの少なくとも1つの他の組織タイプと比較して、標的組織タイプにおいて異なって調節されることが同定される。臨床的に関連するDNA分子は、標的組織タイプに由来し得る。例えば、DNASE1発現は、白血球のDNASE1発現レベルと比較して、胎盤組織において相対的にアップレギュレートされる(
図31A)。別の例では、DNASE1L3の発現は、健常な対象における肝臓組織と比較して、HCC細胞では相対的にダウンレギュレートされている。ステップ3302は、
図17のステップ1702と同様の方法で実施され得る。
【0218】
いくつかの実施形態において、異なるヌクレアーゼに対応する発現レベルを表すために、複数の不揃い指数値が生成される。複数の不揃い指数値は、正常組織から異常組織を区別し、臨床的に関連するDNAの画分濃度を決定し、組織タイプを区別するなどのために比較することができる。例えば、臨床的に関連するDNA分子を決定するための超平面を決定するために、ヌクレアーゼ(例えば、DNASE1L3、DFFB、及びDNASE1)の複数の不揃い指数値を三次元散布図にプロットすることができる。
【0219】
ステップ3304において、第1のヌクレアーゼは、DNAを、第1の鎖と第2の鎖との間に指定された長さのオーバーハングを有するDNA分子に優先的に切断するように決定される。いくつかの場合では、第1のヌクレアーゼの切断優先度は、別の生物(例えば、マウス)の生物学的試料を分析することによって決定される。
【0220】
ステップ3306において、複数の無細胞DNA分子の各無細胞DNA分子について、第2の鎖に突出した第1の鎖の長さと相関する第1の鎖及び/又は第2の鎖の特性が測定される。例えば、測定された特性には、第1の鎖のより高いメチル化レベルが含まれ、より高いメチル化レベルは、第2の鎖に突出した第1の鎖のより長い長さに相関する。別の例では、測定された特性には、第1の鎖のメチル化レベルの低下が含まれ、より低いメチル化レベルは、第2の鎖に突出した第1の鎖のより長い長さと相関する。いくつかの場合では、特性は、複数の核酸分子の各々の第1の鎖及び/又は第2の鎖の末端部分の1つ以上の部位におけるメチル化状態である。他の場合では、特性は、第2の鎖に突出した第1の鎖の長さに比例する第1の鎖及び/又は第2の鎖の長さである。
【0221】
いくつかの実施形態において、(特性が測定される)複数の無細胞DNA分子は、指定された範囲内のサイズ、例えば130~160bpsを有するように構成される。100~130bp、110~140bp、120~150bp、140~170bp、150~180bp、160~190bp、170~200bp、180~210bp、190~220bpが含まれるがこれらに限定されない他のサイズ範囲、及び他のサイズ範囲又は異なるサイズ範囲の複数の組み合わせが、他の実施形態で使用されるであろう。
【0222】
いくつかの実施形態において、異なるサイズ範囲及び異なるゲノム位置にわたる不揃いな末端を機械学習アルゴリズムのトレーニングデータとして使用して、臨床的に関連するDNAの画分濃度を決定し、異常細胞などを正常組織から区別することができる。機械学習アルゴリズムには、線形回帰、ロジスティック回帰、深層再帰型ニューラルネットワーク、ベイズ分類器、隠れマルコフモデル(HMM)、線形判別分析(LDA)、k平均クラスタリング、ノイズを伴うアプリケーションの密度に基づく空間クラスタリング(DBSCAN)、ランダムフォレストアルゴリズム、及びサポートベクターマシン(SVM)が含まれ得るが、これらに限定されない。
【0223】
ステップ3308において、複数の無細胞DNA分子の測定された特性を使用して、不揃い指数値が決定される。いくつかの実施形態において、不揃い指数値は、複数の無細胞DNA分子において鎖が別の鎖に突出した集合的な尺度を提供する。いくつかの場合では、不揃い指数値は、第1の鎖及び/又は第2の鎖の末端部分の1つ以上の部位における複数の核酸分子にわたるメチル化レベルを同定する。いくつかの実施形態において、不揃い指数値は、指定された範囲内のサイズ、例えば130~160bpsを有する複数の無細胞DNA分子の測定された特性に対応する(
図31C)。
【0224】
第1の複数の核酸分子が指定されたサイズ範囲にある場合、方法は、第2の複数の核酸分子のうちの各核酸分子の特性を測定することを含み得る。第2の複数の核酸分子は、第2の指定されたサイズ範囲を有するサイズを有し得る。不揃いな末端値を決定することは、第1の複数の核酸分子の測定された特性と、第2の複数の核酸分子の測定された特性とを使用して、比を計算することを含み得る。不揃い指数値は、本明細書に記載の不揃いな末端比又はオーバーハング指数比を含み得る。
【0225】
ステップ3310において、不揃い指数値が参照値と比較される。参照値は、第1の鎖と第2の鎖の間の指定された長さのオーバーハングに基づいて決定することができる。いくつかの場合では、参照値又は比較は、トレーニングデータセットを使用した機械学習を使用して決定される。比較は、生物学的試料又は個体に関する異なる情報を決定するために使用し得る。
【0226】
ステップ3312において、生物試料中の臨床的に関連するDNA分子の画分が、比較に基づいて決定される。いくつかの場合では、参照値は、病態を有する対象の1つ以上の参照試料を使用して決定される。別の例として、参照値は、病態を有さない対象の1つ以上の参照試料を使用して決定される。参照試料から複数の参照値を決定でき、異なる参照値は、病態の異なるレベルを識別する可能性がある。
【0227】
様々な実施形態において、臨床的に関連するDNAの画分濃度を測定することは、組織特異的対立遺伝子又はエピジェネティックマーカーを使用して、又は、例えば、米国特許公開第2013/0237431号に記載されているようなDNA断片のサイズを使用して、実施され得、それは参照によって全体が組み込まれる。組織特異的なエピジェネティックマーカーは、試料における組織特異的なDNAメチル化パターンを示すDNA配列を含み得る。
【0228】
様々な実施形態において、臨床的に関連するDNAは、胎児DNA、腫瘍DNA、移植された臓器由来のDNA、及び特定の組織タイプ(例えば、特定の臓器由来)からなる群から選択され得る。臨床的に関連するDNAは、特定の組織タイプのものであり得、例えば、特定の組織タイプは、肝臓又は造血性である。対象が妊婦である場合、臨床的に関連するDNAは、胎児DNAに対応する胎盤組織であり得る。別の例として、臨床的に関連するDNAは、がんを有する臓器に由来する腫瘍DNAであり得る。
【0229】
概して、1つ以上の較正試料から決定された1つ以上の較正値は、画分濃度が測定されている生物学的(試験)試料に使用されるのと同様のアッセイを使用して生成されることが好ましい。例えば、配列決定ライブラリは同じ方法で生成され得る。処理技術の2つの例は、GeneRead(www.qiagen.com/us/shop/sequencing/generead-size-selection-kit/#orderinginformation)及びSPRI(固相可逆固定化、AMPureビーズ、www.beckman.hk/reagents_depr/genomic_depr/cleanup-and-size-selection/pcr)である。GeneReadは、主に腫瘍断片である短いDNAを除去し得、それは、野生型及び変異体断片と同様に胎児及び移植の場合の末端モチーフの相対頻度に影響を与え得る。
【0230】
参照値は、既知の分類を有する較正(参照)試料を使用して決定された較正値であり得、参照値又は較正関数を決定するために集合的に分析され得る(例えば、分類が連続変数である場合)。参照値を決定するための較正データ点は、測定された不揃い指数値及び臨床的に関連するDNAの測定された/既知の画分を含むことができる。画分が別の技法(例えば、組織特異的対立遺伝子を使用)を介して測定される、任意の試料についての測定された不揃いな末端値は、参照値に対応させることができる。別の例として、検量線(関数)を較正データポイントに適合させることができ、参照値は検量線上のポイントに対応させることができる。したがって、新しい試料の測定された不揃いな末端値を較正関数に入力することができ、これにより、臨床的に関連するDNAの画分を出力することができる。
【0231】
C.生物学的混合物を用いた異常細胞の検出
二本鎖DNA間の指定された長さのオーバーハングはまた、特定のヌクレアーゼの末端切断シグネチャと関連付けることができる。特定の対象の生物学的試料について、この特性を有するDNA分子の量を同定するパラメータ(例えば、指定された長さのオーバーハング)を使用して、異常細胞と正常細胞とを区別することができる。例えば、不揃い指数値などのパラメータは、不揃い指数値が正常細胞を表す別の不揃い指数値と比較して高いという決定に応答して、HCC細胞を含む生物学的試料を予測することができる。このような区別を使用して、対象の病理レベルを予測することができる。
【0232】
1.異常細胞由来のDNA対正常細胞由来のDNAの不揃い
図34は、いくつかの実施形態による、野生型、DNASE1
-/-、及びDNASE1L3
-/-を含む異なる遺伝子型にわたるマウスにおける血漿DNAの不揃い指数値の箱ひげ図を示す。
図34を参照して、y軸は、メチル化シトシン(JI-M)の充填に基づく不揃い指数値を示す。WT:野生型;DNASE1
-/-:DNASE1欠失マウス。DNASE1
-/-:DNASE1L3欠失マウス。ヌクレアーゼと血漿DNA断片化パターンの間の関連付けを明らかにするアプローチを更に検証するために、1億1,500万(範囲:3,100万~2億2,300万)のマッピングされた対形成末端リードの中央値を使用して、12匹の野生型マウス、DNASE1を欠失した(DNASE1
-/-)7匹のマウス、及びDNASE1L3を欠失した(DNASE1L3
-/-)5匹のマウスの配列を決定した。130~160bpの血漿DNA断片を分析した。
図34に示すように、野生型マウスと比較して、DNASE1L3を欠失させたマウス(DNASE1L3
-/-)では不揃い(JI-M)の増加が観察されたのに対し、DNASE1を欠失させた(DNASE1
-/-)マウスでは減少傾向が見られた(
図34)(P値:0.01;クラスカル・ウォリス検定)。これらの結果は、血漿DNAの不揃いを使用してヌクレアーゼの活性を監視することができる可能性を示唆している。一方、これらの結果によって、DNASE1が血漿DNAにおける長い不揃いな末端の生成に寄与するが、DNASE1L3は比較的短い不揃いな末端又は平滑末端を有する血漿DNA分子の生成に役割を果たすことも示唆される。
【0233】
図35Aは、いくつかの実施形態による、正常肝臓組織及び肝臓がん組織におけるDNASE1遺伝子発現の箱ひげ図を示し、
図35Bは、いくつかの実施形態による、HCCを有する患者とHCCを有さない患者との間のJI-U値の箱ひげ図を示し、
図35Cは、いくつかの実施形態による、サイズ選択あり及びサイズ選択なしの断片によって推定されるJI-U間の性能を比較するためのROC曲線を示す。マウスモデルで示された結果に基づいて、HCC腫瘍においてDNASE1発現がアップレギュレートされたが、DNASE1L3がダウンレギュレートされたため、HCCを有する患者における血漿DNAについての不揃いの異常は増強されるであろう(
図35A)。130~160bpの範囲内の断片から推定される非常に高いJI-U値が、HCCを有さない患者(平均:13.9;範囲:12.2~15.6)と比較して、HCCを有する患者(平均:15.3;範囲:13.2~17.3)で観察された(
図35B)(P値<0.0001、マン・ホイットニーのU検定)。HCCを有する患者と有さない患者との間の130~160bpの断片を使用したJI-UのAUCは0.87であり、これはサイズ選択のないアプローチ(AUC:0.54)よりも優れていた(
図35C)。これらの結果は、一実施形態において、130~160bpの断片についてのJI-Uが、がん検出の臨床的可能性を有することを示唆している。100~130bp、110~140bp、120~150bp、140~170bp、150~180bp、160~190bp、170~200bp、180~210bp、190~220bpが含まれるがこれらに限定されない他のサイズ範囲、及び他のサイズ範囲又は異なるサイズ範囲の複数の組み合わせが、他の実施形態で使用されるであろう。いくつかの実施形態において、肺がん、乳がん、胃がん、多形膠芽腫、膵臓がん、結腸直腸がん、上咽頭がん、及び/又は頭頸部扁平上皮がんを含む組織異常を検出するために、異なる組織タイプにわたる不揃い指数値が生成される。
【0234】
一実施形態において、異なるサイズ範囲及び異なるゲノム位置にわたる不揃いな末端を利用することにより、がんなどの患者を区別するための分類子をトレーニングするために、線形回帰、ロジスティック回帰、深層再帰型ニューラルネットワーク、ベイズ分類器、隠れマルコフモデル(HMM)、線形判別分析(LDA)、k平均クラスタリング、ノイズを伴うアプリケーションの密度に基づく空間クラスタリング(DBSCAN)、ランダムフォレストアルゴリズム、及びサポートベクターマシン(SVM)を含むがこれらに限定されない、機械学習アルゴリズムが適用されるであろう。
【0235】
2.組織タイプの異常を決定する方法
図36は、いくつかの実施形態による、不揃い指数値に基づいて組織の異常レベルを分類する方法を示すフローチャートである。生物学的試料は、複数の無細胞DNA分子を含み、複数の無細胞DNA分子の各々は、第1の部分を有する第1の鎖及び第2の鎖と部分的又は完全な二本鎖を形成する。いくつかの場合では、複数の無細胞DNA分子のうちの少なくともいくつかの第1の鎖の第1の部分は、第2の鎖由来の相補部分を有さず、第2の鎖にハイブリダイズせず、第1の鎖の第1の末端にある。異常は、がん(例えば、肝細胞がん、肺がん、乳がん、胃がん、多形膠芽腫、膵臓がん、結腸直腸がん、上咽頭がん、及び/又は頭頸部扁平上皮がん)、及び自己免疫障害(例えば、全身性エリテマトーデス)を含む病理であり得る。いくつかの場合では、生物学的試料における異常は、子癇前症、早産、胎児染色体異数性、又は胎児遺伝性障害を含む、胎盤組織(例えば、母体血漿中に検出される胎盤組織)の異常である。
【0236】
ステップ3602において、第1のヌクレアーゼは、1つ以上の組織タイプの正常組織と比較して、1つ以上の組織タイプの異常細胞において異なって調節されることが同定される。例えば、DNASE1L3(デオキシリボヌクレアーゼ1様3)の発現は、健常な対象における肝臓組織と比較して、HCC細胞において相対的にダウンレギュレートされる。別の例では、DFFB(DNA断片化因子サブユニットベータ)及びDNASE1(デオキシリボヌクレアーゼ1)の発現は、健常な対象における肝臓組織と比較して、HCC細胞において相対的にアップレギュレートされる。ステップ3602は、
図17のステップ1702と同様の方法で実施され得る。
【0237】
ステップ3604において、第1のヌクレアーゼは、DNAを、第1の鎖と第2の鎖との間に指定された長さのオーバーハングを有するDNA分子に優先的に切断するように決定される。いくつかの場合では、第1のヌクレアーゼの切断優先度は、別の生物(例えば、マウス)の生物学的試料を分析することによって決定される。
【0238】
いくつかの実施形態において、異なるヌクレアーゼに対応する発現レベルを表すために、複数の不揃い指数値が生成される。複数の不揃い指数値は、正常組織から異常組織を区別し、臨床的に関連するDNAの画分濃度を決定し、組織タイプを区別するなどのために比較することができる。例えば、異常組織と正常組織とを区別するために超平面を決定することができるように、ヌクレアーゼ(例えば、DNASE1L3、DFFB、及びDNASE1)の複数の不揃い指数値を三次元散布図にプロットする。
【0239】
ステップ3606において、複数の無細胞DNA分子の各無細胞DNA分子について、第2の鎖に突出した第1の鎖の長さに相関する第1の鎖及び/又は第2の鎖の特性が測定される。例えば、測定された特性には、第1の鎖のより高いメチル化レベルが含まれ、より高いメチル化レベルは、第2の鎖に突出した第1の鎖のより長い長さに相関する。別の例では、測定された特性には、第1の鎖のメチル化レベルの低下が含まれ、より低いメチル化レベルは、第2の鎖に突出した第1の鎖のより長い長さと相関する。ステップ3606は、
図33のステップ3306と同様の方法で実施され得る。
【0240】
ステップ3608において、複数の無細胞DNA分子の測定された特性を使用して、不揃い指数値が決定される。いくつかの実施形態において、不揃い指数値は、複数の無細胞DNA分子において鎖が別の鎖に突出した集合的な尺度を提供する。いくつかの実施形態において、不揃いな末端値は、第1の鎖及び/又は第2の鎖の末端部分の1つ以上の部位における複数の核酸分子にわたるメチル化レベルを含み得る。いくつかの実施形態において、不揃い指数値は、指定された範囲内のサイズ、例えば130~160bpsを有する複数の無細胞DNA分子の測定された特性に対応する(
図35C)。ステップ3608は、
図33のステップ3308と同様の方法で実施され得る。
【0241】
ステップ3610において、生物学的試料中の1つ以上の組織タイプにおける異常レベルの分類が、不揃い指数値と参照値との比較に基づいて決定される。参照値は、第1の鎖と第2の鎖の間の指定された長さのオーバーハングに基づいて決定することができる。いくつかの実施形態において、異常レベルの分類は、病理(例えば、HCC)の複数のステージのうちの1つを含む。例えば、DNASE1発現がHCC腫瘍においてアップレギュレートされたが、DNASE1L3はダウンレギュレートされたため、HCC患者における血漿DNAの不揃いの異常が増強されるであろう。いくつかの実施形態において、肺がん、乳がん、胃がん、多形膠芽腫、膵臓がん、結腸直腸がん、上咽頭がん、及び/又は頭頸部扁平上皮がんを含む組織異常を検出するために、異なる組織タイプにわたる不揃い指数値が生成される。いくつかの場合では、機械学習アルゴリズムを適用して、正常組織から異常細胞を区別するための分類子をトレーニングする。
【0242】
D.遺伝性障害を決定するための不揃い分析
自己免疫疾患は、体の免疫システムが自己寛容を失い、体の細胞及び組織自体を誤って攻撃するときに発生する。自己免疫疾患は、疾患の異種群であり、80種類以上の自己免疫疾患が同定されている(Hayter et al.Autoimmunity Reviews.2012;11(10):754-65;The American Autoimmune Related Diseases Association,Autoimmune Disease List.https://www.aarda.org/diseaselist/)。最も一般的な自己免疫疾患には、関節リウマチ、1型糖尿病、多発性硬化症、全身性エリテマトーデス(SLE)、炎症性腸疾患、乾癬、強皮症、及び自己免疫性甲状腺炎が含まれる(Hayter et al.Autoimmunity Reviews.2012;11(10):754-65)。
【0243】
自己免疫疾患は、ほぼ任意の臓器系に影響を与え得る。1型糖尿病及び多発性硬化症などのこれらの疾患のいくつかは特定の臓器を攻撃する(Bias et al.Am.J.Hum.Genet.1986;39:584-602)一方で、例えばSLEなどの他の疾患は複数の臓器を攻撃する(Fava et al.Journal of Autoimmunity.2019;96:1-13)。全ての自己免疫疾患の全体的な累積有病率は5%であるが(Hayter et al.Autoimmunity Reviews.2012;11(10):754-65)、近年、有病率が増加する傾向がある(Dinse et al.Arthritis & Rheumatology.2020;72(6):1026-1035)。ほとんどの自己免疫疾患は慢性であり、適切な治療で制御することができる。しかしながら、時間の経過とともに個人間及び個人内で不確かな変化する症状により、診断及び疾患の監視が困難になる場合が多い。
【0244】
cfDNA分子は非ランダムに断片化され、アポトーシス及びネクローシスなどの細胞死を介して体内の様々な組織から放出される(Chandrananda et al.BMC Med Genomics.2015;8:29;Thierry et al.Cancer Metastasis Rev.2016;35:347-376)。血漿核酸の分析は、妊娠、がん、及び同種移植拒絶反応を含むがこれらに限定されない様々な疾患のための非侵襲的予後及び診断ツールとして開発されてきた(Chiu et al.BMJ.2011;342: c7401;Chan et al.N.Engl.J.Med.2017;377:513-522;Cohen et al.Science.2018;359:926-930;Gielis et al.Am J Transplant.2015;15:2541-2551)。血漿DNAのゲノム及びエピジェネティックなシグネチャについての高解像度分析は、SLE患者の疾患活動性を反映することが示されている(Chan et al.Proc Natl Acad Sci USA.2014;111:E5302-11)。
【0245】
DNAの分解は、体が健常に機能するための重要なプロセスである(Keyel.Dev Biol.2017;429(1):1-11)。血漿DNAのクリアランス障害は、自己免疫の発症を引き起こし得る(Duvvuri et al.Front Immunol.2019;10:502)。例えばDNaseファミリーなどのヌクレアーゼは、DNAの断片化において極めて重要な役割を果たす。異なるヌクレアーゼは、異なる組織において異なる発現をする(The human protein atlas,https://www.proteinatlas.org/)。それらは、血漿DNAの断片化を調節する役割を果たす(Han et al.Am J Hum Genet.2020;106:202-214)。多くの研究が、様々な自己免疫疾患の病因におけるヌクレアーゼの関与を実証している(Malickova et al.Autoimmune Dis.2011;2011:945861;Zykova et al.PLoS One;2010;5(8):e12096;Gatselis et al.Autoimmunity.2017 Mar;50(2):125-132)。最近のいくつかの研究では、マウスモデルにおいて、DNAヌクレアーゼとDNA末端モチーフなどの血漿DNA末端モダリティとの関係(Serpas et al.Proc Natl Acad Sci USA.2019;116:641-649;Han et al.Am J Hum Genet.2020;106:202-14)及び不揃いな末端(Jiang et al.Genome Res.2020;30:1144-1153)が示されている。このような末端モダリティをDNA断片化に関連する新しいタイプのバイオマーカーとして開発することができた。例えば、DNASE1L3欠損症を有するヒト患者は、血漿DNAの断片サイズ及び末端モチーフに異常を示した(Chan et al.Am J Hum Genet.2020;107:882-894)。
【0246】
多くの免疫学的検査が開発され、診療所で日常的に使用されている。例えば、患者の血液試料は、リウマチ因子(RF)、抗dsDNA抗体、抗核抗体(ANA)、抗可溶性核抗原抗体(ENA)、抗好中球細胞質抗体(ANCA)、C-反応性タンパク質(CRP)、及び赤血球沈降速度(ESR)について検査することができる。しかしながら、特に、ほとんどの自己免疫疾患は本来的に慢性であり、かつ、不明確な症状を示すという事実があり、自己免疫疾患の不均一性並びに早期発見及び治療の重要性のために、自己免疫疾患の診断及び監視について感度の高い方法が必要である。
【0247】
本開示のいくつかの実施形態において、無細胞DNAの末端モダリティに関連する様々なパラメータが、自己免疫疾患を検出及び監視するために使用される。末端モダリティには、末端モチーフ及び不揃いな末端が含まれ得、パラメータには、多くのリード(末端モチーフ)及び不揃い指数値(不揃いな末端)が含まれ得る。そのような末端モダリティは、DNASE1L3、DFFB、DNASE1、TREX1、AEN、EXO1、DNASE2、ENDOG、APEX1、FEN1、DNASE1L1、DNASE1L2、及びEXOGを含むがこれらに限定されないDNAヌクレアーゼ活性に関連し得る。例えば、血漿DNA不揃いな末端の提示に関連するパラメータを使用して、健常な対照、非活動性SLE、及び活動性SLEを区別することができる。
【0248】
1.DNASE1L3疾患に関連するバリアントにおける無細胞DNAの不揃い
DNASE1L3疾患に関連するバリアントにわたる無細胞DNAの不揃いの違いを同定するために、DNASE1L3疾患に関連するバリアントを有する5人の対象の各々について、血漿DNAの不揃いを測定した。
図37は、DNASE1L3に関連するバリアントの異なる遺伝子型を有するヒト対象におけるDNA分子の不揃いな末端の分布を同定するグラフを示す。線3702は、ヘテロ接合性DNASE1L3に関連するバリアントである「H1」を表す(すなわち、DNASE1L3遺伝子の1つのコピーがまだ機能している)。線3704~3710は、ホモ接合性DNASE1L3バリアントを有する(すなわち、DNASE1L3遺伝子の両方のコピーが、機能的なDNASE1L3酵素を生成することができない)対象である、各々「H2」、「H4」、「V11」、及び「V12」をそれぞれ表す。H2及びH4対象は、ホモ接合フレームシフトc.290_291delCA(p.Thr97Ilefs*2)変異を有していた。
【0249】
短い血漿DNA断片(例えば、<150bp)のJI-Uとは対照的に、長い血漿DNA断片(例えば、>200bp)のJI-Uは、ヘテロ接合型DNASE1L3バリアントを有する対象(JI-U中央値:38.00)と比較して、ホモ接合型DNASE1L3に関連するバリアントを有する対象において低かった(JI-U中央値:22.01)。
【0250】
これらの結果により、血漿DNAの不揃いがヌクレアーゼ欠損症を有する患者の検出のために使用することができることが示唆される。長い血漿DNAの不揃いは、DNAヌクレアーゼ活性を反映するためのより感度の高いアプローチを提供する。一実施形態において、血漿DNAの不揃いは、DNAヌクレアーゼ関連疾患の治療の関連における治療的介入を監視するために使用されるであろう。
【0251】
2.SLEを有する患者における無細胞DNAの不揃い
図38は、対照対象とSLEを有する患者との間の末梢血単核細胞におけるDNASE1L3の遺伝子発現レベルを同定する箱ひげ図を示す。
図38に示されるように、DNASE1L3発現レベルの有意な減少が、発表されたデータ(Rinchai D et al.Clin Transl Med.2020 Dec;10(8):e244)(
図3)からSLE患者において観察されたが、これはDNASE1L3部分欠損症とみなされ得る。DNASE1L3の異なる発現レベルに照らして、14人の健常な対照の試料、14人の非活動性SLE患者、及び20人の活動性SLE患者を含む、以前に公開された重亜硫酸塩配列データに基づき(Chan et al.Proc Natl Acad Sci USA.2014;111:E5302-11)、血漿DNAの不揃いを分析した。
【0252】
図39は、対照サンプル並びに非活動性SLE及び活動性SLEを有するサンプルの血漿DNA(JI-U)の不揃いを同定するグラフ3900のセットを示す。
図39では、グラフ3902は、対照対象3904、不活動性SLEを有する対象3906、及び活動性SLEを有する対象3908における様々なDNA断片サイズにわたる不揃い指数(JI-U)値を示す。グラフ3902は、活動性SLE患者のJI-Uが、それらの対照対象(中央値JI-U値:52.31)と比較して、約230bpのサイズを有する分子(JI-U中央値:39.16)の最低の不揃いレベルを示したことを示す。非活動性SLE患者の血漿DNA不揃い(JI-U中央値:48.21)は、対照対象及び活動性SLEを有する患者の中間であることが示された。
【0253】
箱ひげ
図3910は、対照対象、非活動性SLE対象、及び活動性SLE対象の200bp~300bp範囲内の血漿DNAの不揃い指数値を示す。箱ひげ
図3910では、200bp~300bpのサイズ範囲を有する選択された断片の不揃いにより、3つの群、すなわち、対照対象、非活動性SLE対象、及び活動性SLE対象を区別することが可能となった。活動性SLE患者における不揃いの中央値25.91%の減少(JI-U値の中央値:36.21;範囲:30.34~38.47)が、対照対象(JI-U中央値:45.59;範囲:41.46~49.09)と比較して観察され(P値<0.0001、マン・ホイットニーのU検定)、不揃いの中央値8.68%の減少が非活動性SLEの患者において観察された(JI-U値の中央値:41.95;範囲:37.14~50.51)(P値=0.00079)、マン・ホイットニーのU検定)。
【0254】
比較として、箱ひげ
図3912は、対照対象、非活動性SLE対象、及び活動性SLE対象における短い血漿DNA(115bpより短い)の割合を示す。箱ひげ
図3912に示されるように、短い血漿DNA(すなわち、<115bp)の割合に関するメトリック(Chan et al.Proc Natl Acad Sci USA.2014;111:E5302-11)は、2つの群、すなわち、活動性SLE対象に対する対照対象及び非活動性SLE対象しか区別できなかった。非活動性SLE群と対照群との間で有意な増加は観察されなかったが、これは、不揃い指数値が、正常な対象とSLEの対象とを区別するためのより効果的な手法であり得ることを示す。
【0255】
図40は、対照対象とSLE対象とを区別するための不揃い指数値及びサイズ比方法の性能を同定する受信者動作特性(ROC)曲線4000を示す。ROC曲線4002は、対照対象と不活動SLE対象とを区別するための不揃い指数値及びサイズ比方法の性能を示す。血漿DNAサイズ比(AUC:0.7;ライン4006)を使用する技法と比較して、不揃い指数値は、非活動性 SLE 患者と健常な対象(ライン4004)を区別する際にAUC0.86での改善された性能を示した。
図40はまた、不活動性SLE対象と活動SLE対象とを区別するための不揃い指数値及びサイズ比方法の性能を同定するROC曲線4008を示す。ここで、不揃いは、サイズ比法に基づく結果(AUC:0.95;ライン4010)と比較して、活動性SLE患者と非活動性SLE患者とを区別する際にAUC0.98(ライン4008)での改善された性能を示した。したがって、200~300bpのサイズ範囲において決定された不揃い指数値は、SLEを検出するためのバイオマーカーとして使用することができる。更に、参照試料を異なるヌクレアーゼノックアウトを有する試料又は変異ヌクレアーゼ遺伝子を有することが既知である試料と比較することにより、不揃いな末端分析のための最適なサイズ範囲を決定することができる。
【0256】
3.抗凝固剤とともにインキュベートした試料の不揃いな末端分析
ヘパリンは、DNASE1活性を増強し、DNASE1L3活性を阻害することが既知である。DNASE1-/-マウスモデルの使用とは別に、不揃いな末端生成プロセスにおけるDNASE1の役割を更に調べるために、インビトロヘパリンインキュベーション法を使用した。
【0257】
図41は、野生型マウスからの0時間のヘパリンインキュベーションから6時間のヘパリンインキュベーションにおける異なる断片サイズにわたるJI-M値を特定するグラフ4100を示す。グラフ4100に示されるように、WTマウスにおけるDNASE1の存在(JI-M:34.01)は、6時間のヘパリンインキュベーション後に不揃いが62.57%増加する(JI-M:46.72)。したがって、異なるヘパリンインキュベーション時間によるWTマウスDNA分子の全体的なJI-M分布は、6時間のヘパリンインキュベーション血漿からのDNA分子がより高い不揃いを有することを示す。
【0258】
図42は、DNASE1
-/-マウスについてヘパリンとともに行う0時間のインキュベーションから6時間のインキュベーションにおける異なる断片サイズにわたるJI-M値を同定するグラフ4200を示す。グラフ4200は、DNASE1がノックアウトされたときに、6時間のヘパリンインキュベーションにおける不揃いの増加が消失することを示す。DNASE1
-/-cfDNA分子の断片サイズにわたるJI-M分布は、0時間~6時間のインキュベーションにおいて全体的に同様の傾向を示す。6時間のヘパリンインキュベーション後の野生型マウスにおける不揃いの有意な増加と比較して、DNASE1
-/-マウスのサイズにわたる不揃いの全体的な傾向はほぼ重複することが見出された。
【0259】
これらのデータは、DNASE1の活性のヘパリンに基づく増強により、特に短い血漿DNA断片において不揃いが増加したことを示唆し、これは、DNASE1が短い血漿DNA断片に関する不揃いな末端生成の原因であり得ることを意味する。
【0260】
4.遺伝性障害を決定するための方法
様々な技法を使用して、ヌクレアーゼに関連する遺伝性障害を検出することができる。遺伝性障害は、特定の遺伝子に対応するヌクレアーゼの変異(例えば、欠失)に関連し得る。そのような変異により、ヌクレアーゼは存在しないか、又は不規則に機能する可能性がある。したがって、影響を受けたヌクレアーゼの発現レベルの変化の程度を決定することができる。いくつかの場合では、生物学的試料中の複数の核酸分子に対応する不揃い指数値を決定して、ヌクレアーゼ発現レベルの変化を同定することができる。これらの不揃い指数値は、遺伝性障害を決定するために対象について決定された不揃い指数値と比較することができる参照値として使用することができる。そのような方法の例が以下のフローチャートに示される。1つのフローチャートについて説明される技術は、他のフローチャートにも適用可能であり、簡潔にするために繰り返されない。
【0261】
a)インキュベーションを使用した遺伝性障害の経時的な検出
試料の異なるインキュベーション量は、遺伝性障害が存在するかどうかに応じて、異なる不揃い指数値をもたらし得る(例えば、
図40及び41)。特定の不揃い指数値は、特定のヌクレアーゼが発現され、かつ、適切に機能しているかどうかに依存し得るため、そのような挙動の正常からの変化は、遺伝性障害が存在することを示し得る。
【0262】
図43は、本開示の実施形態による、無細胞DNAを含む生物学的試料を使用して、ヌクレアーゼに関連する遺伝子についての遺伝性障害を検出するための方法4300を例示するフローチャートを示す。本明細書の方法4300及び他の方法は、コンピュータシステムによって制御されることを含めて、コンピュータシステムを用いて全体的又は部分的に実施され得る。例として、遺伝子は、ヌクレアーゼをコードすること、その転写のためのエピジェネティックマーカーを有すること、そのRNA転写物が存在すること、可変的にスプライシングされたRNAを有すること、又はそのRNAが可変的に翻訳されることによって、ヌクレアーゼに関連付けられ得る。遺伝性障害は、特定の組織(例えば、腫瘍組織)にのみ存在する可能性がある。したがって、遺伝性障害の検出は、がんのレベルを決定するために使用され得る。
【0263】
ブロック4310で、第2の鎖に突出した第1の鎖の長さと相関する第1の鎖及び/又は第2の鎖の特性が、第1の生物学的試料の第1の複数の無細胞DNA分子の各無細胞DNA分子について測定される。第1の生物学的試料は、抗凝固剤で処理され、第1の時間の長さにわたってインキュベートされ得る。インキュベーションは、特定の温度以上、例えば、摂氏5度、10度、15度、20度、25度、又は30度を超えることができる。より低温での保管は、インキュベーション時間の一部としてカウントされない場合がある。第1の時間の長さは、ゼロであり得る。他の実装例において、第1の生物学的試料は、抗凝固剤で処理されることなく、第1の時間の長さにわたってインキュベートされる。例として、抗凝固剤は、EDTA又はヘパリンであり得る。EDTAは、血漿ヌクレアーゼ(例えば、DNASE1及びDNASE1L3)を阻害して、分析用にcfDNAを保存するのに役立ち得る。
【0264】
いくつかの場合では、測定された特性には、第1の鎖のより高いメチル化レベルが含まれ、より高いメチル化レベルは、第2の鎖に突出した第1の鎖のより長い長さに相関する。別の例では、測定された特性には、第1の鎖のメチル化レベルの低下が含まれ、より低いメチル化レベルは、第2の鎖に突出した第1の鎖のより長い長さと相関する。いくつかの場合では、特性は、複数の核酸分子の各々の第1の鎖及び/又は第2の鎖の末端部分の1つ以上の部位におけるメチル化状態である。他の場合では、特性は、第2の鎖に突出した第1の鎖の長さに比例する第1の鎖及び/又は第2の鎖の長さである。
【0265】
いくつかの実施形態において、(特性が測定される)複数の無細胞DNA分子は、指定された範囲内のサイズ、例えば130~160bpsを有するように構成される。100~130bp、110~140bp、120~150bp、140~170bp、150~180bp、160~190bp、170~200bp、180~210bp、190~220bpが含まれるがこれらに限定されない他のサイズ範囲、及び他のサイズ範囲又は異なるサイズ範囲の複数の組み合わせが、他の実施形態で使用されるであろう。
【0266】
いくつかの実施形態において、異なるサイズ範囲及び異なるゲノム位置にわたる不揃いな末端を機械学習アルゴリズムのトレーニングデータとして使用して、臨床的に関連するDNAの画分濃度を決定し、異常細胞などを正常組織から区別することができる。機械学習アルゴリズムには、線形回帰、ロジスティック回帰、深層再帰型ニューラルネットワーク、ベイズ分類器、隠れマルコフモデル(HMM)、線形判別分析(LDA)、k平均クラスタリング、ノイズを伴うアプリケーションの密度に基づく空間クラスタリング(DBSCAN)、ランダムフォレストアルゴリズム、及びサポートベクターマシン(SVM)が含まれ得るが、これらに限定されない。
【0267】
ブロック4320で、第1の複数の無細胞DNA分子の測定された特性を使用して、第1の不揃い指数値が決定される。いくつかの実施形態において、第1の不揃い指数値は、第1の複数の無細胞DNA分子において鎖が別の鎖に突出した集合的な尺度を提供する。いくつかの場合では、第1の不揃い指数値は、第1の鎖及び/又は第2の鎖の末端部分の1つ以上の部位における複数の核酸分子にわたるメチル化レベルを同定する。いくつかの実施形態において、第1の不揃い指数値は、指定された範囲内のサイズ、例えば130~160bpsを有する第1の複数の無細胞DNA分子の測定された特性に対応する。
【0268】
ブロック4330で、第2の鎖に突出した第1の鎖の長さと相関する第1の鎖及び/又は第2の鎖の特性が、第2の生物学的試料の第2の複数の無細胞DNA分子の各無細胞DNA分子について測定される。第2の生物学的試料は、抗凝固剤で処理され、第1の時間の長さよりも長い第2の時間の長さにわたってインキュベートされ得る。他の実装例において、第2の生物学的試料は、抗凝固剤によって処理されることなくインキュベートされ得る。時間の長さは、温度係数を含むことができ、例えば、より高い温度は、時間の長さを取得するために時間単位を乗算した重み付け係数として機能し得る。このように、より大きい/同じ量の細胞死が、より高い温度でのインキュベーションにより、試料/より短い時間で生じ得る。ステップ4330は、ステップ4310と同様の様式で実施され得る。
【0269】
ブロック4340で、第2の複数の無細胞DNA分子の測定された特性を使用して、第2の不揃い指数値が決定される。いくつかの実施形態において、第2の不揃い指数値は、第2の複数の無細胞DNA分子において鎖が別の鎖に突出した集合的な尺度を提供する。いくつかの場合では、第2の不揃い指数値は、第1の鎖及び/又は第2の鎖の末端部分の1つ以上の部位における複数の核酸分子にわたるメチル化レベルを同定する。いくつかの実施形態において、第2の不揃い指数値は、指定された範囲内のサイズ、例えば130~160bpsを有する第2の複数の無細胞DNA分子の測定された特性に対応する。ステップ4340は、ステップ4320と同様の様式で実施され得る。
【0270】
ブロック4350で、第1の不揃い指数値を第2の不揃い指数値と比較して、遺伝子が対象における遺伝性障害を示すかどうかの分類を決定する。いくつかの実装例において、第1の不揃い指数値を第2の不揃い指数値と比較することは、第1の不揃い指数値が第2の不揃い指数値と少なくとも閾値量だけ異なるかどうかを決定することを含み、統計的に有意な差又は他の分離値がある場合、不揃い指数値が他よりも大きいことを含み得る。したがって、分類は、第1の不揃い指数値が第2の不揃い指数値の閾値内にある場合、遺伝性障害が存在するというものであり得る。
【0271】
いくつかの場合では、遺伝性障害には、関節リウマチ、1型糖尿病、多発性硬化症、全身性エリテマトーデス(SLE)、炎症性腸疾患、乾癬、強皮症、自己免疫性甲状腺炎、又はそれらの任意の組み合わせが含まれる。分類は、例えば、ヌクレアーゼのコード遺伝子が両方の染色体において、一方の染色体においてのみ欠損しているか、特定の組織においてのみ欠損しているか、又は変異が発現を低減するが、ヌクレアーゼの存在を排除しないかからの、障害のレベル又は重症度であり得る。ヌクレアーゼの発現のそのような部分的低減は、変異(例えば、欠失)が特定の組織においてのみ存在する場合、又は変異が支持領域内、例えば、ヌクレアーゼの発現レベルに影響を及ぼすmiRNAなどの非コード領域内に存在する場合に生じ得る。参照レベルと比較した差の異なる量の結果としての、遺伝性障害の異なるレベル又は重症度。複数の参照レベルを使用して、差の分類を決定することができる。
【0272】
いくつかの例では、第1の不揃い指数値が不揃い指数値量の閾値内にある場合、分類は、遺伝性障害が存在するというものであり得る。いくつかの実施形態において、比較は、第1の不揃い指数値と第2の不揃い指数値との間の分離値を決定することを含むことができる。分離値を参照値(例えば、カットオフ)と比較して、分類を決定することができる。参照値は、既知の分類を有する較正(参照)試料を使用して決定された較正値であり得、参照値又は較正関数を決定するために集合的に分析され得る(例えば、分類が連続変数である場合)。第1の不揃い指数値及び第2の不揃い指数値は、参照値/較正値と比較することができるパラメータ値の例である。このような技法は、本明細書の全ての方法に使用され得る。
【0273】
1つ以上の較正値は、1つ以上の参照値であり得るか、又は参照値を決定するために使用され得る。参照値は、分類についての特定の数値に対応することができる。例えば、較正データ点(較正値、及びヌクレアーゼ活性又は有効性のレベルなどの測定された特性)を、補間又は回帰を介して分析して、較正関数(例えば、線形関数)を決定することができる。次いで、較正関数の点を使用して、測定された量又は他のパラメータ(例えば、2つの量間、若しくは測定された量と参照値との間の分離値)の入力に基づいて、入力としての数値分類を決定することができる。そのような技術は、本明細書に記載の方法のいずれにも適用され得る。
【0274】
試験されている遺伝性障害のタイプは、cfDNAの挙動が異なるため、障害が存在するかどうかを決定するために使用される基準のタイプを提供することができる。
【0275】
一例として、遺伝性障害には、遺伝子の欠失が含まれ得る。例として、遺伝子は、DFFB、DNASE1L3、又はDNASE1であり得る。ヌクレアーゼは、細胞内DNAを切断するもの、例えば、DFFB又はDNASE1L3であり得る。ヌクレアーゼは、細胞外DNAを切断するもの、例えば、DNASE1又はDNASE1L3であり得る。
【0276】
b)参照値を使用した遺伝性障害の検出
上記のように、異なるインキュベーションを伴う試料間の不揃いの差又は他の分離値(例えば、小さいか大きいか)を使用して、ヌクレアーゼに関連する遺伝子の遺伝性障害を分類することができる。あるいは、核酸分子の測定された特性から決定された不揃い指数値が、参照値と比較され得る。そのような参照値は、健常な対象において測定された不揃い指数値に対応し得る。
【0277】
図44は、本開示の実施形態による、無細胞DNAを含む生物学的試料を使用して、ヌクレアーゼに関連する遺伝子についての遺伝性障害を検出するための方法4300を例示するフローチャートを示す。方法4300に使用されるのと同様の技術が、方法4400で使用され得る。例として、遺伝子は、DNASE1L3、DFFB、又はDNASE1である。いくつかの場合では、遺伝性障害には、関節リウマチ、1型糖尿病、多発性硬化症、全身性エリテマトーデス(SLE)、炎症性腸疾患、乾癬、強皮症、自己免疫性甲状腺炎、又はそれらの任意の組み合わせが含まれる。
【0278】
ブロック4410で、第2の鎖に突出した第1の鎖の長さと相関する第1の鎖及び/又は第2の鎖の特性が、生物学的試料の複数の無細胞DNA分子の各無細胞DNA分子について測定される。いくつかの場合では、測定された特性には、第1の鎖のより高いメチル化レベルが含まれ、より高いメチル化レベルは、第2の鎖に突出した第1の鎖のより長い長さに相関する。別の例では、測定された特性には、第1の鎖のメチル化レベルの低下が含まれ、より低いメチル化レベルは、第2の鎖に突出した第1の鎖のより長い長さと相関する。いくつかの場合では、特性は、複数の核酸分子の各々の第1の鎖及び/又は第2の鎖の末端部分の1つ以上の部位におけるメチル化状態である。他の場合では、特性は、第2の鎖に突出した第1の鎖の長さに比例する第1の鎖及び/又は第2の鎖の長さである。
図43のブロック4310に使用されるのと同様の技法が、ブロック4410で使用され得る。
【0279】
いくつかの場合では、生物学的試料は、抗凝固剤で処理され、指定された時間にわたってインキュベートされ得る。インキュベーションは、特定の温度以上、例えば、摂氏5度、10度、15度、20度、25度、又は30度を超えることができる。より低温での保管は、インキュベーション時間の一部としてカウントされない場合がある。第1の時間の長さは、ゼロであり得る。他の実装例において、生物学的試料は、抗凝固剤で処理することなく、指定された時間にわたってインキュベートされる。例として、抗凝固剤は、EDTA又はヘパリンであり得る。EDTAは、血漿ヌクレアーゼ(例えば、DNASE1及びDNASE1L3)を阻害して、分析用にcfDNAを保存するのに役立ち得る。
【0280】
ブロック4420で、複数の無細胞DNA分子の測定された特性を使用して不揃い指数値が決定される。いくつかの実施形態において、不揃い指数値は、第1の複数の無細胞DNA分子において鎖が別の鎖に突出した集合的な尺度を提供する。いくつかの場合では、不揃い指数値は、第1の鎖及び/又は第2の鎖の末端部分の1つ以上の部位における複数の核酸分子にわたるメチル化レベルを同定する。いくつかの実施形態において、不揃い指数値は、指定された範囲内のサイズ、例えば130~160bpsを有する複数の無細胞DNA分子の測定された特性に対応する。例えば、生物試料中のSLEを検出するための不揃い指数値は、200~300bps以内のサイズを有する複数の無細胞DNA分子の測定された特性に対応し得る。
図43のブロック4320に使用されるのと同様の技法が、ブロック4420で使用され得る。
【0281】
ブロック4430で、不揃い指数値を参照値と比較して、遺伝子が対象において遺伝性障害を示すかどうかの分類を決定する。様々な実施形態において、第1の量を第2の量と比較することは、(1)不揃い指数値が参照値よりも少なくとも閾値量だけ異なるか、又は差が閾値量未満であるかを決定すること、(2)不揃い指数値が参照値よりも少なくとも閾値量だけ少ないかどうかを決定すること、又は(3)不揃い指数値が参照値よりも少なくとも閾値量だけ大きいかどうかを決定することを含み得る。不揃い指数値は、パラメータ値の一例であり、参照値は、較正値であるか、又は較正試料の較正値から決定され得る。いくつかの場合では、分類は、遺伝子が対象において症候性障害又は無症候性障害(例えば、活動性SLE)を示すかどうかを更に同定する。
【0282】
参照値は、既知の分類を有する較正(参照)試料を使用して決定された較正値であり得、参照値又は較正関数を決定するために集合的に分析され得る(例えば、分類が連続変数である場合)。例えば、ヌクレアーゼ活性は、連続変数であり得、量と参照値との比較は、例えば、本明細書に記載されるように、量を較正関数に入力することによって決定され得る。既知の分類に関して、参照値は、遺伝性障害を有さない1つ以上の参照試料から決定することができる。更に又はあるいは、参照値は、遺伝性障害を有する1つ以上の参照試料から決定される。ブロック4350に使用されるのと同様の技術が、ブロック4430で使用され得る。
【0283】
E.ヌクレアーゼ活性を監視するための不揃いな末端分析
ヌクレアーゼ、例えば、DFFB、DNASE1、及びDNASE1L3の活性を監視するために、無細胞DNAの不揃いを決定することができる。そのような活性は、内部ヌクレアーゼから(すなわち、身体の自然なプロセスとして)、及び/又はヌクレアーゼ、例えば、DNASE1を添加した結果からのものであり得る。そのような監視を使用して、治療の有効性について遺伝性障害の変化を決定することができる。例えば、DNASE1を使用して対象を治療することができる。処理の効果は、T末端断片のパーセンテージ又はサイズを分析することによって測定され得る。いくつかの実施形態において、DNASE1(例えば、外因的に添加された)を使用して、SLEなどの自己免疫状態を治療することができる。活性の決定に応じて、ヌクレアーゼの治療の投与量が変更され得る。いくつかの場合では、エキソヌクレアーゼ(例えば、エキソヌクレアーゼT)の活性が監視される。
【0284】
異常なヌクレアーゼ活性(例えば、正常/健康な値に対応する参照値よりも上又は下)の決定は、単独で、又は他の要因と組み合わせて、病理のレベルを示すことができる。病理は、がんであり得る。
【0285】
1.ヌクレアーゼの切断特性を決定する際の不揃い
マウスモデルでの研究とは別に、不揃いはまた、エキソヌクレアーゼ及びエンドヌクレアーゼ、Cas9などの市販の酵素の切断特性を明らかにするために使用することができる。例えば、エキソヌクレアーゼT(ExoT)は、平滑末端を生成するために一般的に使用される酵素である。既知の不揃いな末端を有するDNA分子(例えば、合成オリゴヌクレオチド)に基づいて、ExoT処理した又はExoT処理しない不揃いな末端の検出を研究した。
【0286】
図45は、ExoTで処理した又はExoTで処理していないアニールされたdsDNAの不揃いを同定するプロトコル4500を示す。プロトコル4502は、ExoTを使用してライブラリを調製するプロセスを示し、これは、不揃いな末端部位の上流にあるいくつかの余分な部位が、アニールされたオリゴ対照のmCとともに取り込まれるであろうことを示す。大文字による文字は、二本鎖領域を表す。小文字による文字は、一本鎖の不揃いな末端を表す。プロトコル4502に示すように、不揃いな末端部位の1bp上流の68.8%はメチル化シトシンの取り込みを示し、不揃いな末端部位の2bp上流の15.04%はメチル化シトシンの取り込みを示し、不揃いな末端部位の3bp上流の2.71%は、メチル化シトシンの取り込みを示した。
【0287】
プロトコル4504は、ExoTなしで調製されたライブラリを調製するためのプロセスを示し、アニールされたオリゴ対照における不揃いな末端部位の上流にそのように余分なmCを取り込みことはない。プロトコル4502とは対照的に、不揃いな末端の近くにおけるメチル化シトシンの余分な取り込みは、ExoT処理なしの試料では観察できなかった。箱ひげ
図4506は、2つの異なるライブラリ調製プロセスを使用した8つの対の試料における不揃いな末端の平均長さを示す。ExoTなしで調製されたDNAライブラリ(中央値JI-M値:13.74;範囲11.84~15.27)と比較して、ヒト試料において、15.16%の不揃いの増加中央値が見出された(中央値JI-M値15.82;範囲13.40~19.21)(
図10C)。これらの結果により、ExoTが二本鎖領域においても3’から5’へのエキソヌクレアーゼ活性を有することが示唆される。
【0288】
2.ヌクレアーゼ活性を監視するための方法
図46は、本開示の実施形態による、無細胞DNAを含む生物学的試料を使用して、ヌクレアーゼの活性を監視するための方法4600を例示するフローチャートである。いくつかの実施形態において、ヌクレアーゼはDNASE1、DFFB、DNASE1L3、ENDOG、APEX1、FEN1、DNASE1L1、DNASE1L2、又はDNASE2などのエンドヌクレアーゼである。更に又はあるいは、ヌクレアーゼは、ExoT、EXOG、TREX1、又はEXO1などのエキソヌクレアーゼである。方法4600の態様は、本明細書に記載の他の方法と同様の方法で実施され得る。
【0289】
ブロック4610で、第2の鎖に突出した第1の鎖の長さと相関する第1の鎖及び/又は第2の鎖の特性が、生物学的試料の複数の無細胞DNA分子の各無細胞DNA分子について測定される。いくつかの場合では、測定された特性には、第1の鎖のより高いメチル化レベルが含まれ、より高いメチル化レベルは、第2の鎖に突出した第1の鎖のより長い長さに相関する。別の例では、測定された特性には、第1の鎖のメチル化レベルの低下が含まれ、より低いメチル化レベルは、第2の鎖に突出した第1の鎖のより長い長さと相関する。いくつかの場合では、特性は、複数の核酸分子の各々の第1の鎖及び/又は第2の鎖の末端部分の1つ以上の部位におけるメチル化状態である。他の場合では、特性は、第2の鎖に突出した第1の鎖の長さに比例する第1の鎖及び/又は第2の鎖の長さである。
図43のブロック4310に使用されるのと同様の技法が、ブロック4610で使用され得る。
【0290】
ブロック4620で、複数の無細胞DNA分子の測定された特性を使用して不揃い指数値が決定される。いくつかの実施形態において、不揃い指数値は、第1の複数の無細胞DNA分子において鎖が別の鎖に突出した集合的な尺度を提供する。いくつかの場合では、不揃い指数値は、第1の鎖及び/又は第2の鎖の末端部分の1つ以上の部位における複数の核酸分子にわたるメチル化レベルを同定する。いくつかの実施形態において、不揃い指数値は、指定された範囲内のサイズ、例えば130~160bpsを有する第1の複数の無細胞DNA分子の測定された特性に対応する。
図43のブロック430に使用されるのと同様の技法が、ブロック4620で使用され得る。
【0291】
ブロック4630で、不揃い指数値を参照値と比較して、ヌクレアーゼの活性の分類を決定する。いくつかの実施形態において、活性が参照値を下回る場合、対象は、障害を有すると分類され得る。そのような場合、対象は、例えば本明細書に記載されるように治療され得る。分類は、数分類値であり得、これをカットオフと比較して、ヌクレアーゼに関連する遺伝子が対象において遺伝性障害を示すかどうかの第2の分類を決定することができる。
【0292】
参照値は、既知の分類を有する較正(参照)試料を使用して決定された較正値であり得、参照値又は較正関数を決定するために集合的に分析され得る(例えば、分類が連続変数である場合)。例えば、ヌクレアーゼ活性は、連続変数であり得、量と参照値との比較は、例えば、本明細書に記載されるように、量を較正関数に入力することによって決定され得る。
【0293】
いくつかの場合では、参照値は、ヌクレアーゼの活性について既知又は測定された分類を有する1つ以上の参照試料を使用して決定される。1つ以上の参照試料についてのヌクレアーゼの活性は、本明細書に記載されるように、例えば、cfDNA量の蛍光測定又は分光光度測定で測定され得、これは、それ自体で、又はヌクレアーゼ含有試料の添加の前、後、及び/又はそれとリアルタイムで行われ得る。別の例は、放射状酵素拡散法を使用することである。較正値は、1つ以上の参照試料で測定することができ、それにより、参照/較正試料についての2つの測定値を含む較正データ点を提供する。1つ以上の参照試料は、複数の参照試料であり得る。複数の参照試料の測定された活性及び測定された量に対応する較正データ点を、例えば、補間又は回帰によって近似する較正関数が決定され得る。
【0294】
VI.不揃いな末端と末端シグネチャとの組み合わせ分析
末端シグネチャ及び不揃いな末端の両方を一緒に使用して、ヌクレアーゼの発現レベルを表すことができる。例えば、
図47A及び47Bは、いくつかの実施形態による、GC%と不揃いな末端の長さとの間の関係を示すグラフの例を示す。短い不揃いな末端(例えば、3、4、及び5nt)を有する一本鎖DNAは、長い不揃いな末端を有するもの(例えば、>12nt;平均GC%:45%)よりも高いGC%(平均:51%)を含んでいた(
図47A)。しかしながら、そのようなパターンは、ヒト参照ゲノムからインシリコでランダムに生成された結果には存在しなかった(
図47B)。これらの結果により、異なる不揃いな末端の長さにわたって塩基組成が均一ではないことが示唆された。実施形態は、配列モチーフと不揃い指数との間のこの相乗効果を使用することができる。一実施形態において、モチーフ多様性スコアが、不揃いな末端の長さ6の分子について最大のAUC値(AUC:0.84)を与えることを見出し、これは、不揃いな末端の長さによる選択なしの分子を使用したもの(AUC:0.77)よりも高かった。したがって、これらの結果は、特定の不揃いな末端の長さ又は所望の範囲を有する分子を選択的に分析することにより、区別力を改善することができることを示唆している。
【0295】
図48は、いくつかの実施形態による、CCGT末端モチーフを有する断片のパーセンテージの箱ひげ図を示す。末端モチーフCCGTの存在量は、母体DNA分子(中央値:0.11;範囲:0.078~0.15)よりも胎児DNA分子(中央値:0.079;範囲:0.067~0.09)において高かった(P値<0.0001)(
図34)。
【0296】
A.臨床的に関連するDNAの画分濃度
末端シグネチャと不揃いな末端との組み合わせ分析を使用して、組織タイプの特徴を決定することができ、この特徴は、臨床的に関連するDNAの画分濃度に対応する。
図49は、いくつかの実施形態による、不揃いな末端指数(JI-U)、末端モチーフ(CCGT)、並びに末端モチーフと不揃いな末端との組み合わせ分析を使用して、母体及び胎児のDNA断片を区別するための分類力分析を示す。一例として、上記の組み合わせ分析を次のように実行した:
(1)HCCを有する患者及びHCCを有さない患者を含むデータセットを、特定のカットオフと比較した末端モチーフCCGTの存在量に基づいて2つのクラス(すなわち、陽性症例及び陰性症例)に分類した。
(2)次いで、上記のステップで決定された陽性ケースを、特定のカットオフと比較した不揃いな末端指数に基づいて2つのクラス(すなわち、陽性症例及び陰性症例)に更に分類した。
(3)2項分類の2つのステップにおいて持続的に陽性と分類された症例を陽性とみなした。2項分類の上記のプロセスで使用されるカットオフは様々であり得、多くの得られる分類モデルを形成する。これらの分類モデルの中から、末端モチーフ及び不揃いな末端を組み合わせた分析を使用して、最適なモデルを決定することができる。一実施形態において、この組み合わせ分析は、2つ以上の末端モチーフ、並びに断片サイズ、断片サイズ画分化(fragment size-fractionated)不揃いな末端、好ましい末端、及び血漿DNA分子のヌクレオソームフットプリントなどであるがこれらに限定されない他の断片化特徴を含むように拡張されるであろう。更に他の実施形態において、これらのメトリックうちの1つ以上を、血漿DNAの他の非断片化(non-fragmentomic)特徴、例えばメチル化状態と組み合わせることができる。
【0297】
図49に示すように、末端モチーフと不揃いな末端との組み合わせた分析は、個々の分析のAUC値(不揃いな末端=0.96AUC;末端モチーフ=0.96AUC)と比較して、より高いAUC(0.98)を示した。したがって、組み合わせ分析を使用して、異常組織を正常組織から区別し、臨床的に関連するDNAの画分濃度を決定し、組織タイプを区別するなどの精度を向上させることができる。
【0298】
図50は、いくつかの実施形態による、妊婦の血漿DNA試料中の予測される胎児DNA画分と実際の胎児DNA画分との間の散布図を示す。実際の胎児DNA画分をSNPアプローチ(Lo et al.Sci Transl Med.2010;2:61ra91)によって推定した。
図50を参照して、末端モチーフ及び不揃いな末端を使用する回帰分析を使用して、妊婦の血漿DNA中の胎児DNA画分を予測し得る。説明のために、1つの試料を試験試料とみなし、残りの試料を使用して、数学的モデル(例えば、多重線形回帰モデル)をトレーニングし、全ての試料が試験されるまでこのプロセスを繰り返す、一つ抜き分析を使用し得る。一例として、従属変数としての胎児DNA画分に関して多重線形回帰モデルを適合させるために、独立変数としての末端モチーフCCGT及び不揃いな末端指数メトリックを使用した。トレーニングプロセスにおいて、実際の胎児DNA画分は、一実施形態において、SNPアプローチによって(例えば、Lo et al.Sci Transl Med.2010;2:61ra91に従って)決定され得る。一実施形態において、予測される胎児DNA画分は、実際の胎児DNA画分と相関していた(r=0.74及びP値<0.0001)(
図50)。胎児DNA画分を推定するためのこのような結合末端モチーフと不揃いな末端との組み合わせ分析は、単一の測定基準CCGT末端モチーフ(r=0.72)又は不揃いな末端指数(0.3)を使用したモデルよりも優れていた。
【0299】
末端シグネチャと不揃いな末端との組み合わせ分析はまた、生物学的試料中の組織タイプの特徴を決定するために使用することができ、この特徴は、異常細胞(例えば、腫瘍DNA)の画分に対応する。
【0300】
図51は、いくつかの実施形態による、HCCを有する患者における予測される腫瘍DNA画分と実際の腫瘍DNA画分との間の散布図である。実際の腫瘍DNA画分は、コピー数異常によって決定された(Adalsteinsson et al.Nat Commun.2017;8:1324)。別の実施形態において、HCCを有する患者では、末端モチーフACGAの存在及び不揃いな末端指数(JI-U)を使用して、腫瘍DNA画分に関して多重線形回帰を適合させた。トレーニングプロセスにおいて、実際の腫瘍DNA画分をコピー数異常によって決定した(Adalsteinsson et al.Nat Commun.2017;8:1324)。
図50に示すように、一つ抜き分析に基づいて、予測される腫瘍DNA画分と実際の腫瘍DNA画分との間の相関係数は0.83であった(P値<0.0001)。この結果は、末端モチーフ及び不揃いな末端の組み合わせ分析により、HCCを有する患者の腫瘍DNA画分を推定することが可能であることを示唆している。
【0301】
いくつかの場合では、末端モチーフと不揃いな末端とを選択的に組み合わせるために、例えば、ロジスティック回帰、サポートベクターマシン(SVM)、決定木、CARTアルゴリズム(分類木及び回帰木)、単純ベイズ分類、クラスタリングアルゴリズム、主成分分析、特異値分解(SVD)、t分布型確率的近傍埋め込み(tSNE)、人工ニューラルネットワーク、分類子のセットを構成し、次いでそれらの予測の加重投票を行うことによって新たなデータ点を分類するアンサンブル方法を含むがこれらに限定されない、異なる統計的アプローチが使用される。
【0302】
B.組み合わせ分析を用いた標的組織の特徴値を決定するための方法
図52は、いくつかの実施形態による、不揃いな末端を有する無細胞DNA分子に由来する末端シグネチャに基づいて生物学的試料の特徴を決定する方法を示すフローチャートである。いくつかの実施形態において、生物学的試料は、無細胞DNA分子を含み、無細胞DNA分子の各々は、第1の部分を有する第1の鎖及び第2の鎖と部分的又は完全な二本鎖を形成する。いくつかの場合では、無細胞DNA分子の少なくともいくつかの第1の鎖の第1の部分は、第2の鎖由来の相補部分を有さず、第2の鎖にハイブリダイズせず、第1の鎖の第1の末端にある。いくつかの実施形態において、標的組織タイプの特徴は、胎盤組織における妊娠期間、又は子癇前症、早産、胎児染色体異数性、代謝障害、及び/若しくは胎児遺伝性障害を含む、胎盤組織に関連する病態を示す。標的組織タイプの特徴はまた、肝臓由来のDNA分子と主に造血由来のDNA分子とを区別するなど、組織タイプを区別するために使用され得る。
【0303】
ステップ5202において、生物学的試料は、第1の鎖と第2の鎖との間に指定された長さのオーバーハングを有する無細胞DNA分子について濃縮される。第1の鎖と第2の鎖の間に指定された長さのオーバーハングを有する無細胞DNA分子を濃縮するために、異なる手法を使用し得、これには、不揃いな末端特異的ハイブリダイゼーションに基づく標的化捕捉、不揃いな末端特異的アダプターライゲーションに基づくアンプリコン配列決定、及びデジタルPCR(例えば、ドロップレットデジタルPCR)が含まれる。
【0304】
ステップ5204において、配列リードを取得するために、生物学的試料由来の複数の無細胞DNA断片が分析される。いくつかの実施形態において、配列リードは、複数の無細胞DNA断片の末端に対応する末端配列を含む。本明細書に記載されるように、配列リードは、例えば、配列決定技法を使用して(例えば、合成による配列決定アプローチ(例えば、イルミナ)、又は単一分子配列決定(例えば、Pacific Biosciencesの単一分子リアルタイムシステム、又はナノポア配列決定(例えば、Oxford Nanopore Technologiesによる)を使用して)、又は例えばハイブリダイゼーションアレイ若しくは捕捉プローブにおいてプローブを使用して、様々な方法において得てもよい。いくつかの実施形態において、配列決定プロセスは、ポリメラーゼ連鎖反応(PCR)又は単一のプライマーを使用する線形増幅若しくは等温増幅などの増幅技法によって先行され得る。生物学的試料の分析の一部として、少なくとも1,000個の配列リードが分析され得る。他の例として、少なくとも10,000個又は50,000個又は100,000個又は500,000個又は1,000,000個又は5,000,000個、又はそれより多い配列リードが分析され得る。
【0305】
ステップ5206において、濃縮から得られた配列リードの第1のセットが同定される。いくつかの実施形態において、対形成末端配列決定を使用して配列リードを取得し、その2つの配列リードは、DNA断片の2つの末端から得られる(例えば、配列リード当たり30~120塩基)。
【0306】
ステップ5208において、配列リードの第1のセットの第1のサブセットが同定される。いくつかの実施形態において、第1のサブセットの各配列リードは、第1の配列末端シグネチャに対応する末端配列を含む。いくつかの実施形態において、配列リードの第1のセットは、複数の無細胞DNA分子の末端に対応する末端配列を含む。第1の配列末端シグネチャを有する末端配列は、例えば、開始位置の直前又は末端位置の直後の塩基を同定するために、参照ゲノムを使用して決定され得る。このような塩基は、例えば、断片の末端配列に基づいて同定されるため、無細胞DNA断片の末端に対応する。ステップ5208は、
図26のステップ2608と同様の方法で実施され得る。
【0307】
ステップ5210において、配列リードの第1のサブセットの第1の量が決定される。いくつかの実施形態において、配列リードの第1のセットの第1の量がカウントされ得る(例えば、メモリ内のアレイに保存され得る)。ステップ5210は、
図26のステップ2610と同様の方法で実施され得る。
【0308】
ステップ5212において、配列リードの第1の量及び潜在的には別の量を使用して、第1のパラメータが決定される。いくつかの例では、そのような量の両方は、別個のパラメータであり得る。他の量は、例えば、配列リード及び/又は分析されたDNA分子の総数に対応する、様々な形態を取ることができる。別の例として、他の量は、1つ以上の他の配列末端シグネチャ(末端モチーフ)の量に対応することができる。第1のパラメータは、2つの血漿末端モチーフ(例えば、CCCA/AAAT)間の量の比であり得る。ステップ5212は、
図26のステップ2612と同様の方法で実施され得る。
【0309】
ステップ5214において、第1のパラメータと参照値との比較に基づいて生物学的試料の特性が決定される。例えば、決定された特徴は、例えばヌクレアーゼが胎児組織と母体組織との間で異なって調節される場合、妊娠期間又は範囲(例えば、8週、9~12週)を含み得る。別の例では、決定された特徴は、他の組織タイプ(例えば、造血細胞)に対する特定の組織タイプ(例えば、肝細胞)であり得る。標的組織タイプの特徴はまた、標的組織タイプの特定の病態(例えば、HCC、子癇前症、早産)を示し得る。別の例では、決定された特徴は、特定の組織タイプ(例えば、肝細胞)に対応する臓器のサイズ又は栄養状態であり得る。更に別の例では、決定された特徴は、生物学的試料中の臨床的に関連するDNAの画分を含むことができる。いくつかの実施形態において、臨床的に関連するDNAには、胎児DNA、腫瘍由来DNA、又は移植DNAが含まれる。ステップ5214は、
図26のステップ2612と同様の方法で実施され得る。
【0310】
VII.DNA分子中の不揃いな末端を検出するための技法の例
様々な実施形態で実施することができる、DNA分子中の不揃いな末端を検出するための様々な技法の例を以下に記載する。
【0311】
A.不揃いな末端特異的ハイブリダイゼーションに基づく不揃いな末端の濃縮
別の実施形態において、最大の識別力を示した特定の不揃いな末端を有する分子を物理的に濃縮する。このような物理的濃縮には、不揃いな末端特異的ハイブリダイゼーションに基づく標的化捕捉、不揃いな末端特異的ライゲーションに基づくPCR増幅、及び不揃いな末端特異的ライゲーションに基づく捕捉が含まれ得るが、これらに限定されない。別の実施形態において、リアルタイムPCR(定量的PCR又はqPCRとも称する)及びドロップレットデジタルPCR(ddPCR)が、不揃いな末端を検出及び定量化するために使用されるであろう。
【0312】
図53は、いくつかの実施形態による、特定数の目的の不揃いな末端を濃縮するために、不揃いな末端特異的ハイブリダイゼーションに基づく標的捕捉を使用する方法の例を示す。物理的濃縮分析の一実施形態において、目的の不揃いな末端を濃縮するために、不揃いな末端特異的ハイブリダイゼーションに基づく標的化捕捉を使用することができる。目的の不揃いな末端に特異的にハイブリダイズすることができるビオチン化RNAプローブを設計した(ステップ1及び2に示されている)。ビオチン化プローブとハイブリダイズする目的の不揃いな末端は、ストレプトアビジンでコーティングされた磁気ビーズによってプルダウンすることができる(ステップ3に示されている)。RNAプローブは、RNaseHなどのリボヌクレアーゼによって分解されるであろう(ステップ4に示されている)。目的の不揃いな末端は、プルダウン(pull-down)材料中で濃縮され、アデニン(A)、グアニン(G)、チミン(T)、及びメチル化C(5mC)によるDNA末端修復に供されるであろう(ステップ5に示されている)。したがって、目的の不揃いな末端を有する分子に結合した一本鎖は、5mCが充填され、重亜硫酸塩配列のための平滑分子になるであろう。目的の不揃いな末端に関する情報は、限定されないが、2019年7月23日に出願された米国特許出願公開第2020/0056245A1号に記載されているアプローチに従って重亜硫酸塩配列決定の結果から決定でき、その内容は、その全体があらゆる目的で参照により本明細書に組み込まれる。一実施形態において、1つ以上の異なる不揃いな末端を一緒に分析し、例えば、実際の適用のために、異なる不揃いな末端のリード値間の比又は偏差を分析した。
【0313】
B.不揃いな末端特異的アダプターライゲーションに基づく不揃いな末端の濃縮
図54は、いくつかの実施形態による、特定の数の目的の不揃いな末端を濃縮するための不揃いな末端特異的アダプターライゲーションに基づくアンプリコン配列決定を使用する方法の例を示す。物理的濃縮分析の一実施形態において、分子の目的の不揃いな末端は、アダプター(すなわち、不揃いな末端特異的アダプター(ステップ1及び2に示される)と特異的にライゲートされるであろう。同じ分子のもう一方の端は、DNA末端修復後に平滑化され、ユニバーサルアダプター(すなわち、共通アダプター)とライゲートすることができる(ステップ3に示されている)。共通アダプター及び不揃いな末端特異的アダプターの両方でライゲーションされた分子を、例えばイルミナP5配列を含む共通プライマー及びイルミナP7配列を含む不揃いな末端特異的プライマーを使用してPCR増幅に供した(ステップ4及び5に示されている)。増幅産物は、目的の不揃いな末端を決定するために使用することができる。一実施形態において、DNA分子の両末端を特定のアダプターとライゲートすることができ、したがって、分子の2つの末端に存在する目的の不揃いな末端を検出することが可能になる。一実施形態において、1つ以上の異なる不揃いな末端を一緒に分析し、例えば、実際の適用のために、異なる不揃いな末端のリード値間の比又は偏差を分析した。
【0314】
C.目的の不揃いな末端の検出
図55は、いくつかの実施形態による、ドロップレットPCRを使用して特定の数の目的の不揃いな末端を決定する方法の例を示す。物理的濃縮分析の一実施形態において、分子についての目的の不揃いな末端は、アダプター(すなわち、不揃いな末端特異的アダプターと特異的にライゲートされるであろう(ステップ1及び2に示される)。同じ分子のもう一方の末端は、DNA末端修復後に平滑になり、これはユニバーサルアダプター(共通アダプター)とライゲートすることができる(ステップ3に示されている)。共通アダプター及び不揃いな末端特異的アダプターの両方でライゲートされた分子を、ドロップレットデジタルPCR分析(ddPCR)に供した(ステップ4に示されている)。一実施形態において、このようなddPCR分析は、共通アダプターを標的とするフォワードプライマー、クエンチャ及び蛍光レポーターを有するプローブ、並びに不揃いな末端特異的アダプターを標的とするリバースプライマーを利用する。したがって、目的の不揃いな末端を含むドロップレットは、正のリード値になる。一実施形態において、1つ以上の異なる不揃いな末端が一緒に分析され、例えば、実際の適用のために、異なる不揃いな末端のリード値間の比又は偏差が分析された。
【0315】
異なる一実施形態において、5mC(又は他の確認可能な修飾塩基)を有するDNA末端修復及び特定のアダプターライゲーションを、目的の不揃いな末端を検出するためのいくつかの適用において組み合わせることができる。
【0316】
VIII.ウイルスDNA末端モチーフ分析
エプスタイン・バール・ウイルス(EBV)は、上咽頭がん(NPC)、バーキットリンパ腫、ホジキンリンパ腫、ナチュラルキラーT細胞(NK-T細胞)リンパ腫、及び移植後リンパ増殖性疾患を含む、多くの悪性腫瘍に関連する発がん性ウイルスである。EBVはまた、伝染性単核症と称する非悪性疾患を引き起こす。患者の血漿DNAプールにおけるEBV DNAの存在は、予測及び再発の監視のためのバイオマーカーとみなされ(Lo et al.Cancer Res.1999;59:5452-5455)、これは大規模な前向き研究で更に確認された(Chan et al.N Engl J Med.2017;377:513-522)。血漿中のEBV DNAの断片サイズは、EBV DNA陽性の患者がNPCを有するか否かを決定するために使用されるであろう(Lam et al.Proc Natl Acad Sci USA.2018;115:E5115-E5124)。
【0317】
図56は、いくつかの実施形態による、非腫瘍性上咽頭上皮組織とNPC組織との間のDNASE1L3の発現レベルの箱ひげ図を示す。本開示では、公表されているマイクロアレイデータセット(Sengupta et al.Cancer Res.2006)に従って、NPC組織と非腫瘍性上咽頭上皮組織との間のDNASE1L3発現レベルを分析した。非腫瘍性上咽頭上皮組織(n=10)と比較して、NPC組織(n=31)ではDNASE1L3発現レベルが有意に減少する(例えば、ダウンレギュレートする)ことが見出された(P値=0.0003、マン・ホイットニーのU検定)(
図56)。
【0318】
A.ヌクレアーゼの異なる調節に基づくウイルスDNAの末端シグネチャ分析
図57Aは、いくつかの実施形態による、様々なステージの上咽頭がんを有する異なる対象にわたるDNASE1L3に関連する末端モチーフCCCAの箱ひげ図を示し、
図57Bは、いくつかの実施形態による、NPCを有するEBV DNA陽性対象とNPCを有さないEBV DNA陽性対象とを区別する際の末端モチーフCCCAの性能レベルを示すROC曲線を示す。したがって、DNASE1L3に関連する末端モチーフ(例えば、CCCA)を使用して、EBV DNA陽性患者のがん病態を分類した。説明のために、以前に発表された研究(Lam et al.Proc Natl Acad Sci USA.2018;115:E5115-E5124)において、少なくとも1000個のEBV DNA断片を有する対象由来の血漿EBV DNAの末端シグネチャを分析した。
図57Aに示されるように、NPCを有さない患者(平均CCCA%:2.01;範囲:1.19~2.43)と比較して、ステージI、II、III、及びIVを有する患者を含むNPC群(平均CCCA%:1.68;範囲:1.25~1.98)(P値<0.0001、マン・ホイットニーのU検定)において、DNASE1L3に関連する末端モチーフCCCAのパーセンテージが有意に減少した(例えば、ダウンレギュレートした)。AUCは0.85であった(
図57B)。これらの結果は、DNASE1L3に関連する末端モチーフがNPCを有する患者を検出するためのバイオマーカーとしても使用することができることを示唆している。
【0319】
一実施形態において、NPCを有するEBV DNA陽性患者とNPCを有さないEBV DNA陽性患者とを区別する際に最も識別力を示す切断シグネチャの組み合わせを決定するための並べ替え分析を使用することによって、ヌクレアーゼ切断シグネチャを定義することができる。一例として、任意の2つの末端モチーフ間の頻度比の全ての組み合わせを列挙することができる。256のモチーフがあり、32、640が得られる。任意の2つの末端モチーフ間の32,640の頻度比の中で、TGGTに対するCCCGの末端モチーフの頻度比は0.87のAUCを示し、これはCCCA%のみに基づくAUCよりも大きかった。
【0320】
図58は、いくつかの実施形態による、様々なステージの上咽頭がんを有する異なる対象にわたるモチーフ多様性スコアの箱ひげ図を示す。一実施形態において、ヌクレアーゼ異常は、末端モチーフのゆがみをもたらす。したがって、モチーフの多様性はそれに応じて変更されるであろう。モチーフ多様性スコアは、NPCを有さない患者(平均:0.933;範囲:0.921~0.949)と比較して、NPCを有する患者(平均:0.950;範囲:0.937~0.966)において異常に高かった(
図58)(P値<0.0001、マン・ホイットニーのU検定)。
【0321】
図59は、いくつかの実施形態による、MDS及びサイズの組み合わせ分析の性能レベルを評価するためのROC曲線を示す。
図59において、MDS_のみのライン5902は、MDSを使用した分析についてのROC曲線を表し、Size_のみのライン5904は、サイズ比を使用した分析についてのROC曲線を表し、MDS+サイズのライン5906は、MDS及びサイズを組み合わせた分析についてのROC曲線を表す。一実施形態において、がん検出の性能を向上させるために、MDSシグナル及びサイズシグナルを組み合わせる。
図59は、MDSと及びサイズの組み合わせ分析(AUC:0.99)が、MDS(AUC:0.97)又はサイズ(AUC:0.97)のみを考慮する分析よりも優れていることを示す。
【0322】
図60は、いくつかの実施形態による、NPCを有する患者(色6010)及び一過的(色6030)又は持続的に陽性のEBV DNAを有するがNPCを有さない患者(色6020)にわたる血漿EBV DNA断片から推定される256個の末端モチーフのヒートマップを示す。
図60に示されるように、256個の末端モチーフのパターンを利用することによって、NPCを有する患者及び有さない患者を2つの別個の群にクラスター化することができ、このことは、一実施形態において、がん検出を行うために2つ以上の末端モチーフを使用することができることを示唆している。別の実施形態において、多くの末端モチーフを選択的に利用するために、例えば、ロジスティック回帰、サポートベクターマシン(SVM)、決定木、単純ベイズ分類、クラスタリングアルゴリズム、主成分分析、特異値分解(SVD)、t分布型確率的近傍埋め込み(tSNE)、人工ニューラルネットワーク、分類子のセットを構成し、次いでそれらの予測の加重投票を行うことによって新たなデータ点を分類するアンサンブル方法を含むがこれらに限定されない、異なる統計的アプローチが使用され得る。
【0323】
図61は、いくつかの実施形態による、陽性EBV DNAを有する非NPC対象において優先的に存在した血漿EBV DNAの末端モチーフを同定するヒートマップを示す。一実施形態において、疾患優先末端モチーフ(disease preferred end motif)と称する、特定の疾患において優先的に存在する一連の末端モチーフを決定することができる。例えば、
図61に示されるように、TCCC、TCCT、TCTTを含むがこれらに限定されない陽性EBV DNAを有する非NPC対象において優先的に存在する血漿EBV DNA6102の末端モチーフを同定することができた。GCGC、GCGT、TTTAを含むがこれらに限定されないNPC6104を有する対象において優先的に存在する血漿EBV DNAの末端モチーフを同定することができた。ATCT、ATCA、ATCCを含むがこれらに限定されないリンパ腫6106を有する患者において優先的に存在する血漿EBV DNAの末端モチーフを同定することができた。
【0324】
B.ウイルスDNAの末端シグネチャ分析を使用して病理レベルを決定する方法
図62は、いくつかの実施形態による、無細胞ウイルスDNA分子を含む生物学的試を分析して、生物学的試料が得られる対象における病理レベルを決定する方法を示すフローチャートである。生物学的試料は、対象由来の複数の無細胞DNA分子及びウイルス(例えば、EBV)を含む。異常は、がん(例えば、NPC、HCC、肺がん、乳がん、胃がん、多形膠芽腫、膵臓がん、結腸直腸がん、及び/又は頭頸部扁平上皮がん)、及び自己免疫障害(例、全身性エリテマトーデス)を含む病理であり得る。いくつかの場合では、生物学的試料における異常は、子癇前症、早産、胎児染色体異数性、又は胎児遺伝性障害を含む、胎盤組織(例えば、母体血漿中に検出される胎盤組織)の異常である。
【0325】
ステップ6202において、生物学的試料由来の複数の無細胞DNA分子が分析されて、配列リードが得られる。いくつかの実施形態において、配列リードは、複数の無細胞DNA分子の末端に対応する末端配列を含む。配列リードは、複数の無細胞DNA断片の末端に対応する末端配列を含み得る。例として、配列リードは、配列決定又はプローブに基づく技術を使用して取得され得、これらのいずれかは、例えば、増幅又は捕捉プローブを介した濃縮を含み得る。
【0326】
配列決定は、様々な方法で、例えば、超並列配列決定又は次世代配列決定法を使用して、単一分子配列決定を使用して、及び/又は二本鎖若しくは一本鎖DNA配列決定ライブラリ調製プロトコルを使用して、実施され得る。当業者は、使用され得る様々な配列決定技術を理解するであろう。配列決定の一部として、配列リードの一部が細胞核酸に対応し得ることが可能である。
【0327】
配列決定は、例えば本明細書に記載されるような標的化配列決定であり得る。例えば、生物学的試料は、特定の領域由来のDNA断片について濃縮され得る。濃縮は、例えば参照ゲノムによって定義されるように、ゲノムの一部又は全体に結合する捕捉プローブを使用することを含み得る。
【0328】
統計的に有意な数の無細胞DNA分子は、画分濃度の正確な決定を提供するために分析され得る。いくつかの実施形態において、少なくとも1,000個の無細胞DNA分子が分析される。他の実施形態において、少なくとも10,000個又は50,000個又は100,000個又は500,000個又は1,000,000個又は5,000,000個、又はそれより多い無細胞DNA分子が分析され得る。
【0329】
ステップ6204において、参照ゲノムにアラインする配列リードの第1のセットが決定される。いくつかの実施形態において、参照ゲノムは、ウイルスに対応する。
【0330】
ステップ6206において、配列リードの第1セットの各々について、配列モチーフが、対応する無細胞DNA分子の1つ以上の末端配列の各々について決定される。配列モチーフは、N塩基位置(例えば、1、2、3、4、5、6など)を含み得る。例として、配列モチーフは、例えば、
図1に記載されているように、DNA断片の末端に対応する末端での配列リードを分析すること、信号を特定のモチーフと相関させること(例えば、プローブが使用される場合)、及び/又は配列リードを参照ゲノムにアラインメントすることによって決定され得る。
【0331】
例えば、配列決定デバイスによる配列決定後、配列リードは、例えば、有線又は無線通信又は取り外し可能な記憶デバイスを介して配列決定を実施する配列決定デバイスに通信可能に結合され得るコンピュータシステムによって受信され得る。いくつかの実装において、核酸断片の両端を含む1つ以上の配列リードが受信され得る。DNA分子の位置は、DNA分子の1つ以上の配列リードをヒトゲノムのそれぞれの部分、例えば、特定の領域にマッピングする(アラインメントする)ことによって決定され得る。他の実施形態において、特定のプローブ(例えば、PCR又は他の増幅後)は、特定の蛍光色などを介して位置又は特定の末端モチーフを示し得る。同定は、無細胞DNA分子が配列モチーフのセットの1つに対応することであり得る。
【0332】
ステップ6208において、配列リードの第1のセットの1つ以上の末端配列に対応する1つ以上の配列モチーフのセットの相対頻度が決定される。いくつかの実施形態において、配列モチーフの相対頻度は、配列モチーフに対応する末端配列を有する複数の無細胞DNA分子の割合を提供する。1つ以上の配列モチーフのセットは、1つ以上の参照試料の参照セットを使用して同定され得る。臨床的に関連するDNAの末端モチーフ及び他のDNA(例えば、健康なDNA、母体DNA、又は移植された臓器をどのように受け取ったかという対象のDNA)間の差が同定され得るように、遺伝子型の差が決定され得るが、参照試料については臨床的に関連するDNAの画分濃度を知る必要はない。特定の末端モチーフは、差に基づいて選択され得る(例えば、絶対又はパーセンテージの差が最も大きい末端モチーフを選択する)。相対頻度の例は、本開示全体を通して説明されている。
【0333】
いくつかの実装において、配列モチーフはN塩基位置を含み、1つ以上の配列モチーフのセットは、N塩基の全ての組み合わせを含む。一例では、Nは、2又は3以上の整数であり得る。1つ以上の配列モチーフのセットは、1つ以上の較正試料又は画分濃度の較正に使用されない他の参照試料で生じる最も頻度の高いものから上位M(例えば、10)個の配列モチーフであり得る。
【0334】
ステップ6210において、1つ以上の配列モチーフのセットの相対頻度の集計値が決定される。例示的な集計値は、例えば、エントロピー値(モチーフ多様性スコア)、相対頻度の合計、及びモチーフのセットについてカウントのベクトル(例えば、ベクトルは可能な4merの245モチーフについての256カウント、又は可能な3merの64モチーフの64カウント)に対応する多次元データ点を含む、開示全体を通して説明される。1つ以上の配列モチーフのセットが複数の配列モチーフを含む場合、集計値は、セットの相対頻度の合計を含み得る。
【0335】
一例として、1つ以上の配列モチーフのセットが複数の配列モチーフを含む場合、集計値は、セットの相対頻度の合計を含み得る。別の例として、集計値は、相対頻度の分散に対応し得る。例えば、集計値は、エントロピー項を含み得る。エントロピー項は、項の合計を含み得、各項は、相対頻度に相対頻度の対数を掛けたものを含み得る。別の例として、集計値は、機械学習モデル、例えばクラスタリングモデルの最終出力又は中間出力を含み得る。
【0336】
ステップ6212において、集計値と参照値との比較に基づいて、対象の病理レベルの分類が決定される。いくつかの実施形態において、異常レベルの分類には、病理(例えば、NPC)の複数のステージのうちの1つが含まれる。
【0337】
IX.ウイルスDNAの不揃いな末端分析
いくつかの実施形態において、二本鎖DNA間の指定された長さのオーバーハングは、特定のウイルス関連疾患(例えば、EBVによって引き起こされる上咽頭がん)を有する対象の末端切断シグネチャと関連付けることができる。生物学的試料について、この特性を有するDNA分子の量を同定するパラメータ(例えば、指定された長さのオーバーハング)を生成することができ、そのパラメータを使用して、対象のウイルスに関連状する病態(例えば、NPC)を予測することができる。
【0338】
A.ヌクレアーゼの異なる調節に基づくウイルスDNAの不揃いな末端分析
図63A及び63Bは、いくつかの実施形態による、異なる対象にわたる非メチル化シグナルから推定される不揃い指数値の箱ひげ図を示す。我々はまた、本開示において血漿EBV DNAの不揃いな末端の臨床的有用性を調べた。
図63Aに示されるように、配列決定された総血漿EBV DNA断片を使用して、血漿中のEBV DNAの不揃いな末端の量は、がんを有する患者とがんを有さない患者との間で異なることが示された。がん患者にはNPC及びリンパ腫が含まれ、がんを有さない患者は、一過的に陽性のEBV DNAを有する対象、及び持続的に陽性のEBV DNAを有する対象、並びに伝染性単核症有する対象から構成された。がん患者における血漿DNA EBV DNAの不揃い指数値は、一過的に陽性のEBV DNA及び持続的に陽性のEBV DNAを有する非NPC対象よりも12.5%低かった(P値=0.0006、マン・ホイットニーのU検定)。がん患者における血漿DNA EBV DNAの不揃い指数値は、伝染性単核症を有する患者よりも9.3%低かった(P値=0.06、マン・ホイットニーのU検定)。しかしながら、がん患者における血漿DNA EBV DNAの不揃い指数値は、リンパ腫患者と同等であり、1.3%の差しかなかった(P値=1、マン・ホイットニーのU検定)。これらの結果は、ウイルスDNAの不揃いな末端が、ウイルス駆動性がんを有する患者とこれを有さない患者とを区別するための潜在的なバイオマーカーになるであろうことを示唆している。
【0339】
別の実施形態において、
図63Bに示されるように、血漿EBV DNAの不揃い指数値は、がんを有するEBV DNA陽性患者とがんを有さないEBV DNA陽性患者とを区別するためのシグナル対雑音比を高めるために、130~160bpのサイズの断片から推定することができる。がん患者における血漿DNA EBV DNAの不揃い指数値は、一過的に陽性のEBV DNA及び持続的に陽性のEBV DNAを有する非NPC対象よりも29.6%低かった(P値<0.0001、マン・ホイットニーのU検定)。がん患者における血漿DNA EBV DNAの不揃い指数値は、伝染性単核症を有する患者よりも17.8%低かった(P値=0.01、マン・ホイットニーのU検定)。したがって、130~160bpのサイズ範囲間のものから推定される不揃いを使用して、一過的に陽性のEBV DNA及び持続的に陽性のEBV DNAを有するNPC対象と非NPC対象との間の分離の増加が観察され、サイズ選択がシグナル対ノイズ比を増加させることが示唆された。しかしながら、がんを有する患者における血漿DNA EBV DNAの不揃い指数値は、リンパ腫患者と同等であり、3.3%の差しかなかった(P値=0.56、マン・ホイットニーのU検定)。別の実施形態において、他のサイズ範囲、例えば、これらに限定されないが、50~80bp、60~90bp、70~100bp、80~110bp、90~120bp、100~130bp、110~140bp、120~150bp、140~170bp、150~180bp、160~190bp、170~200bp、180~210bp、190~220bp、200~230bp、210~240bp、220~250bp、230~260bp、230~270bp、250~280bp、又は異なるサイズ範囲のいくつかの組み合わせを使用することができる。
【0340】
図64は、いくつかの実施形態による、NPC組織と非腫瘍性上咽頭上皮組織との間のDNASE1発現レベルの箱ひげ図を示す。
図63に戻って参照し、NPCを有する患者で観察された血漿EBV DNAの不揃いの減少は、HCCを有する患者の血漿DNAの不揃いの増加とは対照的であった。あり得る理由の1つは、DNASE1発現レベルがNPC組織と非腫瘍性上咽頭上皮組織との間で有意な変化を示さなかったためであり得(P値=0.77、マン・ホイットニーのU検定)(
図64)、このことは、DNASE1発現レベルが、近傍の非腫瘍性肝臓組織と比較して、HCC組織において有意にアップレギュレートされた事実と対照的である。
【0341】
B.ウイルスDNAの不揃いな末端の分析を使用して病態のレベルを決定する方法
図65は、いくつかの実施形態による、生物学的試料中の無細胞ウイルスDNA分子の不揃いな末端を分析する方法を示すフローチャートである。いくつかの場合では、生物学的試料は、対象由来の複数の無細胞DNA分子及びウイルス(例えば、発がん性ウイルス)を含み、複数の無細胞DNA分子の各々は、第1の部分及び第2の鎖を有する第1の鎖と部分的又は完全な二重鎖を形成する。いくつかの実施形態において、複数の無細胞DNA分子の少なくともいくつかの第1の鎖の第1の部分は、第2の鎖由来の相補部分を有さず、第2の鎖にハイブリダイズせず、第1の鎖の第1の末端にある。いくつかの場合では、第1は5’末端である。
【0342】
ステップ6502において、参照ゲノムにアラインする無細胞DNA分子の第1のセットが同定され、参照ゲノムはウイルスに対応する。リードは参照ゲノムにアラインメントされ得る。複数の核酸分子は、転写開始部位に対してある特定の距離範囲内で読み取られ得る。
【0343】
ステップ6504において、第2の鎖に突出した第1の鎖の長さに比例する第1の鎖及び/又は第2の鎖の特性が、無細胞DNA分子の第1のセットの各々について測定される。例えば、測定された特性には、第1の鎖のより高いメチル化レベルが含まれ、このより高いメチル化レベルは、第2の鎖に突出した第1の鎖のより長い長さと相関する。別の例では、測定された特性には、第1の鎖のメチル化レベルの低下が含まれ、より低いメチル化レベルは、第2の鎖に突出した第1の鎖のより長い長さと相関する。いくつかの場合では、特性は、複数の核酸分子の各々の第1の鎖及び/又は第2の鎖の末端部分の1つ以上の部位におけるメチル化状態である。他の場合では、特性は、第2の鎖に突出した第1の鎖の長さに比例する第1の鎖及び/又は第2の鎖の長さである。
【0344】
ステップ6506において、複数の無細胞DNA分子の測定された特性を使用して、不揃い指数値が決定される。いくつかの実施形態において、不揃い指数値は、複数の無細胞DNA分子において鎖が別の鎖に突出した集合的な尺度を提供する。いくつかの実施形態において、不揃いな末端値は、第1の鎖及び/又は第2の鎖の末端部分の1つ以上の部位における複数の核酸分子にわたるメチル化レベルを含み得る。いくつかの実施形態において、不揃い指数値は、指定された範囲内のサイズ、例えば130~160bpsを有する複数の無細胞DNA分子の測定された特性に対応する(
図49B参照)。
【0345】
第1の複数の核酸分子が指定されたサイズ範囲にある場合、方法は、第2の複数の核酸分子のうちの各核酸分子の特性を測定することを含み得る。第2の複数の核酸分子は、第2の指定されたサイズ範囲を有するサイズを有し得る。不揃い指数値を決定することは、第1の複数の核酸分子の測定された特性と、第2の複数の核酸分子の測定された特性とを使用して、比を計算することを含み得る。不揃い指数値は、本明細書に記載の不揃いな末端比又はオーバーハング指数比を含み得る。
【0346】
ステップ6508おいて、不揃い指数値が参照値と比較される。参照値又は比較は、トレーニングデータセットを用いた機械学習を使用して決定され得る。比較は、生物学的試料又は個体に関する異なる情報を決定するために使用し得る。
【0347】
ステップ6510において、対象の病態のレベルが、比較に基づいて決定され得る。病態には、疾患、障害、又は妊娠を挙げることができる。病態は、がん、自己免疫疾患、妊娠関連病態、又は本明細書に記載の任意の病態であり得る。例として、がんには、がんには、上咽頭がん(NPC)、肝細胞がん(HCC)、結腸直腸がん(CRC)、白血病、肺がん、乳がん、前立腺がん、又は咽頭がんが含まれ得る。自己免疫疾患には、全身性エリテマトーデス(SLE)を挙げることができる。以下の様々なデータは、病態のレベルを決定するための例を提供する。
【0348】
いくつかの場合では、参照値は、病態を有する対象の1つ以上の参照試料を使用して決定される。別の例として、参照値は、病態を有さない対象の1つ以上の参照試料を使用して決定される。参照試料から複数の参照値を決定でき、異なる参照値は、病態の異なるレベルを識別する可能性がある。
【0349】
このプロセスは、比較に基づいて生物学的試料中の臨床的に関連するDNAの画分を決定することを含み得る。臨床的に関連するDNAとしては、胎児DNA、腫瘍由来DNA、又は移植DNAを挙げることができる。参照値は、臨床的に関連するDNAの既知の画分を有する1つ以上の参照対象からの核酸分子を使用して得ることができる。臨床的に関連するDNAの画分を決定するための方法は、第1の鎖及び/又は第2の鎖の特性を測定する前に、複数の核酸分子を、プロトコルによって処理することを含み得る。1つ以上の参照対象からの核酸分子は、測定された特性を有する複数の核酸分子と同じプロトコルによって処理され得る。
【0350】
較正データ点には、測定された不揃い指数値、及び臨床的に関連するDNAの測定された/既知の画分が含まれる。別の技法(例えば、組織特異的対立遺伝子を使用)を介して画分が測定される、任意の試料についての測定された不揃い指数値は、参照値に対応することができる。別の例として、検量線(関数)を較正データポイントに適合させることができ、参照値は検量線上のポイントに対応させることができる。したがって、新しい試料の測定された不揃いな末端値を較正関数に入力することができ、これにより、臨床的に関連するDNAの画分を出力することができる。
【0351】
X.治療
実施形態は、対象の分類を決定した後、患者における病理を治療することを更に含み得る。治療は、病理の決定されたレベル、臨床的に関連するDNAの画分濃度、又は起源の組織に従って提供され得る。例えば、同定された変異は、特定の薬物又は化学療法を用いて標的化され得る。起源の組織を使用して、手術又は任意の他の形態の治療を誘導することができる。そして、病理のレベルを使用して、任意のタイプの治療についてどれほど積極的にするかを決定することができ、これはまた、病理のレベルに基づいても決定され得る。病理(例えば、がん)は、化学療法、薬物、食事療法、療法、及び/又は手術によって治療され得る。いくつかの実施形態において、パラメータの値(例えば、量又はサイズ)が参照値を超えるほど、治療は、より積極的になり得る。
【0352】
治療には、切除が含まれ得る。膀胱がんの場合、治療には、経尿道的膀胱腫瘍切除術(TURBT)が含まれ得る。この手順は、診断、病期分類、及び治療に使用される。TURBT中、外科医は、膀胱鏡を尿道から膀胱に挿入する。次いで、小型ワイヤーループ、レーザー、又は高エネルギー電気を備えたツールを使用して、腫瘍が切除される。非筋肉浸潤性膀胱がん(NMIBC)の患者の場合、がんの治療又は除去のためにTURBTが使用され得る。別の治療には、根治的膀胱切除術及びリンパ節郭清が含まれ得る。根治的膀胱切除術は、膀胱全体、並びに場合によっては周囲の組織及び臓器の除去である。治療には、尿路変向術も含まれ得る。尿路変向術とは、治療の一部として膀胱が除去されたときに、医師が尿を体外に排出するための新しい経路を作る場合である。
【0353】
治療には、化学療法が含まれ得、これは、通常がん細胞の成長及び分裂を防ぐことによって、がん細胞を破壊するための薬物の使用である。薬物には、例えば、膀胱内化学療法のためのマイトマイシン-C(ジェネリック医薬品として入手可能)、ゲムシタビン(Gemzar)、及びチオテパ(Tepadina)が含まれ得るが、これらに限定されない。全身化学療法には、例えば、シスプラチンゲムシタビン、メトトレキサート(Rheumatrex、Trexall)、ビンブラスチン(Velban)、ドキソルビシン、及びシスプラチンが含まれ得るが、これらに限定されない。
【0354】
いくつかの実施形態において、治療には、免疫療法が含まれ得る。免疫療法には、PD-1と呼ばれるタンパク質をブロックする免疫チェックポイント阻害剤が含まれ得る。阻害剤には、アテゾリズマブ(Tecentriq)、ニボルマブ(Opdivo)、アベルマブ(Bavencio)、デュルバルマブ(Imfinzi)、及びペムブロリズマブ(Keytruda)が含まれ得るが、これらに限定されない。
【0355】
治療の実施形態はまた、標的療法を含み得る。標的療法は、がんの成長及び生存に寄与するがんの特定の遺伝子及び/又はタンパク質を標的とする治療である。例えば、エルダフィチニブは、がん細胞の成長又は拡散を続けているFGFR3又はFGFR2遺伝子変異を伴う局所進行性又は転移性尿路上皮がんを有する人々を治療するために承認された、経口投与される薬物である。
【0356】
一部の治療法には、放射線療法が含まれ得る。放射線療法は、がん細胞を破壊するために高エネルギーX線又は他の粒子を使用することである。各個々の治療に加えて、本明細書に記載のこれらの治療の組み合わせが使用され得る。いくつかの実施形態において、パラメータの値が閾値を超え、閾値自体が参照値を超える場合、治療の組み合わせが使用され得る。参考文献における治療に関する情報は、参照により本明細書に組み込まれる。
【0357】
XI.例示的なシステム
図66は、本発明の実施形態による、測定システム6600を例示する。示されたシステムは、試料ホルダ6610内の無細胞DNA分子などの試料6605を含み、試料6605はアッセイ6608と接触して物理的特性6615の信号を提供し得る。試料ホルダの例は、アッセイのプローブ及び/又はプライマー、あるいはドロップレットが(アッセイを含むドロップレットとともに)移動するチューブを含む、フローセルであり得る。試料からの物理的特性6615(例えば、蛍光強度、電圧、又は電流)は、検出器6620によって検出される。検出器6620は、データ信号を構成するデータ点を取得するために、間隔をおいて(例えば、周期的な間隔)測定し得る。一実施形態において、アナログ-デジタル変換器は、検出器からのアナログ信号をデジタル形態へと複数回変換する。試料ホルダ6610及び検出器6620は、アッセイデバイス、例えば、本明細書に記載される実施形態に従って配列決定を実施する配列決定装置を形成し得る。データ信号6625は、検出器6620から論理システム6630へ送信される。データ信号6625は、ローカルメモリ6635、外部メモリ6640、又は記憶デバイス6645に保存され得る。
【0358】
論理システム6630は、コンピュータシステム、ASIC、マイクロプロセッサなどであり得るか、又はそれらを含み得る。それはまた、ディスプレイ(例えば、モニタ、LEDディスプレイなど)、及びユーザ入力デバイス(例えば、マウス、キーボード、ボタンなど)を含み得るか、又はそれらに連結され得る。論理システム6630及び他の構成要素は、スタンドアローン若しくはネットワーク接続されたコンピュータシステムの一部であり得るか、又は検出器6620及び/又は試料ホルダ6610を含むデバイス(例えば、配列決定デバイス)に直接取り付けられ得るか、又は組み込まれ得る。論理システム6630はまた、プロセッサ6650において実行するソフトウェアを含み得る。論理システム6630は、本明細書に説明される方法のいずれかを実施するようにシステム6600を制御するための命令を保存するコンピュータ可読媒体を含み得る。例えば、論理システム6630は、配列決定又は他の物理的操作が実施されるように、試料ホルダ6610を含むシステムにコマンドを提供し得る。そのような物理的操作は、特定の順序で、例えば、試薬が特定の順序で追加及び除去されるように、実施され得る。そのような物理的操作は、試料を取得してアッセイを実施するために使用され得るように、例えば、ロボットアームを含む、ロボットシステムによって実施され得る。
【0359】
本明細書で言及されるコンピュータシステムのうちのいずれも、任意の好適な数のサブシステムを利用し得る。コンピュータシステム10においてこのようなサブシステムの例を
図67に示す。いくつかの実施形態において、コンピュータシステムは、単一のコンピュータ装置を含み、サブシステムは、コンピュータ装置の構成要素であり得る。他の実施形態において、コンピュータシステムは、各々がサブシステムであり、内部構成要素を備える、複数のコンピュータ装置を含み得る。コンピュータシステムは、デスクトップコンピュータ及びラップトップコンピュータ、タブレット、携帯電話、並びに他の携帯装置を含み得る。
【0360】
図67に示されるサブシステムは、システムバス75を介して相互接続される。プリンタ74、キーボード78、記憶デバイス79、ディスプレイアダプター82に接続されたモニタ76(例えば、LEDなどのディスプレイスクリーン)、及びその他などの追加のサブシステムが示されている。I/Oコントローラ71に結合する周辺機器及び入力/出力(I/O)デバイスは、入力/出力(I/O)ポート77(例えば、USB、FireWire(登録商標))などの当技術分野において既知である任意の数の手段によって、コンピュータシステムに接続され得る。例えば、I/Oポート77又は外部インターフェース81(例えば、Ethernet、Wi-Fiなど)を使用して、Internetなどの広域ネットワーク、マウス入力装置、又はスキャナへ、コンピュータシステム10を接続することができる。システムバス75を介した相互接続は、中央プロセッサ73が、各サブシステムと通信し、システムメモリ72又は記憶デバイス79(例えば、ハードドライブ又は光ディスクなどの固定ディスク)からの複数の命令の実行、及びサブシステム間の情報交換を制御することを可能にする。システムメモリ72及び/又は記憶デバイス79は、コンピュータ可読媒体を具現化し得る。別のサブシステムは、カメラ、マイクロホン、及び加速度計、並びにこれらに類するものなどのデータ収集デバイス85である。本明細書に言及されるデータのうちのいずれも、1つの構成要素から別の構成要素に出力されてもよく、ユーザに対して出力されてもよい。
【0361】
コンピュータシステムは、例えば、外部インターフェース81によって、内部インターフェースによって、又は1つの構成要素から別の構成要素に接続され得る、若しくは取り外され得る記憶デバイスを介して、ともに接続された、複数の同じ構成要素又はサブシステムを含み得る。いくつかの実施形態において、コンピュータシステム、サブシステム、又は装置は、ネットワーク上で通信し得る。そのような例において、1つのコンピュータをクライアント、別のコンピュータをサーバとみなすことができ、各々が、同じコンピュータシステムの一部であり得る。クライアント及びサーバは各々、複数のシステム、サブシステム、又は構成要素を含むことができる。
【0362】
実施形態の態様は、ハードウェア回路(例えば、特定用途向け集積回路若しくはフィールドプログラマブルゲートアレイ)を使用して、及び/又はモジュール様式又は一体的な様式で一般的にプログラム可能なプロセッサを備えたメモリに保存されたコンピュータソフトウェアを使用して、制御ロジックの形態で実装され得、したがって、プロセッサは、ハードウェア回路を構成するソフトウェア命令を保存するメモリ、及び構成命令又はASICを備えたFPGAを含み得る。本明細書で使用される場合、プロセッサは、シングルコアプロセッサ、同じ集積チップ上のマルチコアプロセッサ、又は単一の回路基板若しくはネットワーク化された上の複数の処理ユニット、並びに専用のハードウェアを含み得る。本開示及び本明細書に提供される教示に基づいて、当業者は、ハードウェア、並びにハードウェア及びソフトウェアの組み合わせを使用して、本開示の実施形態を実装するための他の手段及び/又は方法を認識及び理解するであろう。
【0363】
本出願で説明されるソフトウェアコンポーネント又は関数のうちのいずれも、例えば、Java(登録商標)、C、C++、C#、Objective-C、Swiftなどの任意の好適なコンピュータ言語、又は、例えば、従来の技術若しくは物体指向の技術を使用するPerl若しくはPythonなどのスクリプト言語を使用する、処理デバイスによって実行されるソフトウェアコードとして実装され得る。ソフトウェアコードは、記憶及び/又は伝送のためのコンピュータ可読媒体上に一連の命令又はコマンドとして記憶され得る。好適な非一時的コンピュータ可読媒体は、ランダムアクセスメモリ(RAM)、リード専用メモリ(ROM)、磁気媒体(ハードドライブ若しくはフロッピーディスクなど)、又は光学媒体(コンパクトディスク(CD)若しくはDVD(デジタル多用途ディスク)など)、又はブルーレイディスク及びフラッシュメモリなどを含み得る。コンピュータ可読媒体は、そのようなデバイスの任意の組み合わせであり得る。更に、操作の順番は並べ替え得る。プロセスは、その操作が完了すると終了し得るが、図に含まれていない追加のステップを有し得る。プロセスは、メソッド、関数、プロシージャ、サブルーチン、サブプログラムなどに対応する場合がある。プロセスが関数に対応する場合、その終了は、呼び出し関数又はメイン関数への関数の戻りに対応する場合がある。
【0364】
そのようなプログラムはまた、コード化され、インターネットを含む様々なプロトコルに従う有線ネットワーク、光ネットワーク、及び/又は無線ネットワークを介した伝送に適合した搬送波信号を使用して伝送され得る。したがって、コンピュータ可読媒体は、そのようなプログラムでコード化されたデータ信号を使用して作成され得る。プログラムコードでコード化されたコンピュータ可読媒体は、互換性のあるデバイスでパッケージ化されてもよく、又は(例えば、インターネットダウンロードを介して)他のデバイスとは別個に提供され得る。任意のそのようなコンピュータ可読媒体は、単一のコンピュータ製品(例えば、ハードドライブ、CD、若しくはコンピュータシステム全体)上若しくはその内部に存在し得、システム又はネットワーク内の異なるコンピュータ製品上若しくはその内部に存在し得る。コンピュータシステムは、モニタ、プリンタ、又は本明細書に記載の結果のうちのいずれかをユーザに提供するための他の好適なディスプレイを含み得る。
【0365】
本明細書記載の方法のうちのいずれも、ステップを実施するように構成することができる1つ以上のプロセッサを含むコンピュータシステムを用いて全体的又は部分的に実施され得る。プロセッサで実施される任意の操作(例えば、位置合わせ、決定、比較、コンピューティング、計算)は、リアルタイムで実施され得る。「リアルタイム」という用語は、特定の時間制限内に完了するコンピューティング操作又はプロセスを指し得る。時間制限は、1分、1時間、1日、又は7日であり得る。したがって、実施形態は、本明細書に説明される方法のうちのいずれかのステップを実施するように構成されたコンピュータシステムを対象とし得、潜在的には異なるコンポーネントがそれぞれのステップ又はそれぞれのステップの群を実施する。番号付けされた工程として提示されるが、本明細書の方法の工程は、同時に若しくは異なる時間に、又は異なる順序で実施され得る。更に、これらのステップの部分は、他の方法からの他のステップの部分と併用され得る。また、あるステップの全て又は部分は、任意選択的であり得る。更に、本方法のうちのいずれかの任意のステップは、これらのステップを実行するためのシステムのモジュール、ユニット、回路、又は他の手段で実行することができる。
【0366】
特定の実施形態の具体的な詳細は、本発明の実施形態の趣旨及び範囲から逸脱することなく、任意の好適な様態で組み合わせることができる。しかしながら、本開示の他の実施形態は、各個々の態様、又はこれらの個々の態様の特定の組み合わせに関する特定の実施形態を対象とし得る。
【0367】
本開示の例示的実施形態の上の説明は、例示及び説明の目的で提示されている。網羅的であること、又は本開示を説明された正確な形態に限定することは意図されず、多くの修正及び変更が、先の教示に鑑みて可能である。
【0368】
「a」、「an」、又は「the」の記述は、それとは反対に具体的に示されない限り、「1つ以上」を意味することが意図される。「又は」の使用は、それとは反対に具体的に示されない限り、「を除く、又は」ではなく「を含む、又は」を意味することが意図される。「第1」の構成要素への言及は、第2の構成要素が提供されることを必ずしも必要としない。更に、「第1」又は「第2」の構成要素への言及は、明示的に述べられていない限り、言及される構成要素を特定の場所に限定するものではない。「~に基づいて」という用語は、「少なくとも一部に基づいて」を意味することを意図している。
【0369】
特許請求の範囲は、任意選択的であり得るいかなる要素も除外するように起草され得る。したがって、この記述は、請求項要素の列挙に関連する「単独で」、「のみ」などの排他的な用語の使用、又は「否定的な」限定の使用についての先行詞として機能することを意図している。
【0370】
本明細書において言及される全ての特許、特許出願、刊行物、及び明細書は、全ての目的のために参照によりそれらの全体が組み込まれる。いかなるものも、先行技術であるとは認められていない。本出願と本明細書で提供される参考文献との間に矛盾が存在する場合、本出願が優先するものとする。
【国際調査報告】