IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ デルフィ ダイアグノスティックス インコーポレイテッドの特許一覧

特表2023-541368がんを評価するための無細胞DNA断片サイズ密度のための方法及びシステム
<>
  • 特表-がんを評価するための無細胞DNA断片サイズ密度のための方法及びシステム 図1
  • 特表-がんを評価するための無細胞DNA断片サイズ密度のための方法及びシステム 図2
  • 特表-がんを評価するための無細胞DNA断片サイズ密度のための方法及びシステム 図3
  • 特表-がんを評価するための無細胞DNA断片サイズ密度のための方法及びシステム 図4
  • 特表-がんを評価するための無細胞DNA断片サイズ密度のための方法及びシステム 図5
  • 特表-がんを評価するための無細胞DNA断片サイズ密度のための方法及びシステム 図6
  • 特表-がんを評価するための無細胞DNA断片サイズ密度のための方法及びシステム 図7
  • 特表-がんを評価するための無細胞DNA断片サイズ密度のための方法及びシステム 図8
  • 特表-がんを評価するための無細胞DNA断片サイズ密度のための方法及びシステム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-10-02
(54)【発明の名称】がんを評価するための無細胞DNA断片サイズ密度のための方法及びシステム
(51)【国際特許分類】
   C12Q 1/68 20180101AFI20230925BHJP
   C12M 1/00 20060101ALI20230925BHJP
   A61K 45/00 20060101ALI20230925BHJP
   A61P 35/00 20060101ALI20230925BHJP
   G01N 33/50 20060101ALI20230925BHJP
   C12Q 1/6869 20180101ALN20230925BHJP
【FI】
C12Q1/68 100Z
C12M1/00 A
A61K45/00
A61P35/00
G01N33/50 P
C12Q1/6869 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023512375
(86)(22)【出願日】2021-08-17
(85)【翻訳文提出日】2023-03-28
(86)【国際出願番号】 US2021046272
(87)【国際公開番号】W WO2022040163
(87)【国際公開日】2022-02-24
(31)【優先権主張番号】63/067,244
(32)【優先日】2020-08-18
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】63/163,434
(32)【優先日】2021-03-19
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】523057482
【氏名又は名称】デルフィ ダイアグノスティックス インコーポレイテッド
(74)【代理人】
【識別番号】100102978
【弁理士】
【氏名又は名称】清水 初志
(74)【代理人】
【識別番号】100160923
【弁理士】
【氏名又は名称】山口 裕孝
(74)【代理人】
【識別番号】100119507
【弁理士】
【氏名又は名称】刑部 俊
(74)【代理人】
【識別番号】100142929
【弁理士】
【氏名又は名称】井上 隆一
(74)【代理人】
【識別番号】100148699
【弁理士】
【氏名又は名称】佐藤 利光
(74)【代理人】
【識別番号】100188433
【弁理士】
【氏名又は名称】梅村 幸輔
(74)【代理人】
【識別番号】100128048
【弁理士】
【氏名又は名称】新見 浩一
(74)【代理人】
【識別番号】100129506
【弁理士】
【氏名又は名称】小林 智彦
(74)【代理人】
【識別番号】100205707
【弁理士】
【氏名又は名称】小寺 秀紀
(74)【代理人】
【識別番号】100114340
【弁理士】
【氏名又は名称】大関 雅人
(74)【代理人】
【識別番号】100214396
【弁理士】
【氏名又は名称】塩田 真紀
(74)【代理人】
【識別番号】100121072
【弁理士】
【氏名又は名称】川本 和弥
(72)【発明者】
【氏名】キャリー ジェイコブ
(72)【発明者】
【氏名】ドラコポリ ニコラス シー.
(72)【発明者】
【氏名】ジョーンズ シアン
【テーマコード(参考)】
2G045
4B029
4B063
4C084
【Fターム(参考)】
2G045AA26
2G045CB02
2G045DA13
2G045FB02
4B029AA07
4B029BB20
4B029FA12
4B063QA13
4B063QA19
4B063QQ42
4C084AA17
4C084NA20
4C084ZB26
(57)【要約】
本開示は、患者から得られた試料における無細胞DNA(CFDNA)断片サイズ密度の分析を利用して、がんの状態を診断及び予測する方法及びシステムを提供する。また、試料についての低カバレッジの全ゲノム配列決定データセットを生成するように構成されているシーケンサーを備えるシステムも提供される。
【特許請求の範囲】
【請求項1】
以下の工程を含む、対象のがんの状態を判定する方法:
(a)対象からの試料における無細胞DNA(cfDNA)断片サイズ密度曲線の形状を分析する工程であって、前記対象からの前記cfDNA曲線の前記形状と、健常な対象の参照試料からの曲線の形状との差が、前記対象におけるがんを示す、工程、および
(b)任意選択的に、がん治療を前記対象に施す工程。
【請求項2】
前記cfDNA断片サイズ密度曲線の前記形状を分析する工程が、分布の有限混合を断片サイズのカウント数に適合させることを含む、請求項1に記載の方法。
【請求項3】
前記分布の有限混合を断片サイズのカウント数に適合させることが、前記試料の成分を定量することを含む、請求項2に記載の方法。
【請求項4】
前記試料の成分を定量することが、複数のcfDNA断片サイズ密度曲線を定量することを含む、請求項3に記載の方法。
【請求項5】
前記試料が、12個の成分を含む、請求項3に記載の方法。
【請求項6】
前記分布が、切断正規分布を含む、請求項2に記載の方法。
【請求項7】
前記方法が、統計パラメータと混合全体への寄与とによって前記成分を特性評価する工程を更に含み、前記統計パラメータが、平均、分散又は形状を含む、請求項3に記載の方法。
【請求項8】
前記統計パラメータが1.1以下の多変量潜在的スケール縮小を有することを判定することによって収束を評価する工程を更に含む、請求項7に記載の方法。
【請求項9】
前記cfDNA断片サイズ密度曲線の前記形状を分析する工程が、約10、50、100又は105bpより小さい断片サイズおよび約220、250、300、350bpより大きい又はより大きい断片サイズを除外することを含む、請求項2に記載の方法。
【請求項10】
前記cfDNA断片サイズ密度曲線の前記形状を分析する工程が、所与の長さの断片のカウント数に適合する多項式回帰の係数を使用して前記曲線の前記形状を定量することを含む、請求項1に記載の方法。
【請求項11】
前記断片のカウント数を、平均が0及び分散が1となるように標準化する工程を更に含む、請求項10に記載の方法。
【請求項12】
前記cfDNA断片サイズ密度曲線の前記形状を分析する工程が、105bpより小さい断片サイズ及び170bpより大きい断片サイズを除外することを含む、請求項10に記載の方法。
【請求項13】
前記cfDNA断片サイズ密度曲線の前記形状を分析する工程が、
(i)cfDNA断片を含む前記対象からの試料を配列決定ライブラリへと処理することと、
(ii)前記配列決定ライブラリを低カバレッジの全ゲノム配列決定に供して、配列決定された断片を得ることと、
(iii)前記配列決定された断片をゲノムにマッピングして、マッピングされた配列のウィンドウを得ることと、
(iv)前記マッピングされた配列のウィンドウを分析して、cfDNA断片長を決定することと
を更に含む、請求項1に記載の方法。
【請求項14】
前記マッピングされた配列が、数十~数千のウィンドウを含む、請求項13に記載の方法。
【請求項15】
前記ウィンドウが、非重複ウィンドウである、請求項13に記載の方法。
【請求項16】
前記ウィンドウが、各々、約500万の塩基対を含む、請求項13に記載の方法。
【請求項17】
各ウィンドウ内でcfDNA断片化プロファイルが決定される、請求項13に記載の方法。
【請求項18】
前記cfDNA断片化プロファイルが、最も頻度が高い断片サイズを含む、請求項17に記載の方法。
【請求項19】
前記cfDNA断片化プロファイルが、様々な頻度の断片サイズを有する断片サイズ分布を含む、請求項17に記載の方法。
【請求項20】
前記cfDNA断片化プロファイルが、前記マッピングされた配列のウィンドウ内の小型cfDNA断片と大型cfDNA断片との比を含む、請求項17に記載の方法。
【請求項21】
前記cfDNA断片化プロファイルが、前記ゲノムにわたるウィンドウ内の小型cfDNA断片の配列カバレッジを含む、請求項17に記載の方法。
【請求項22】
前記cfDNA断片化プロファイルが、前記ゲノムにわたるウィンドウ内の大型cfDNA断片の配列カバレッジを含む、請求項17に記載の方法。
【請求項23】
前記cfDNA断片化プロファイルが、前記ゲノムにわたるウィンドウ内の小型及び大型cfDNA断片の配列カバレッジを含む、請求項17に記載の方法。
【請求項24】
前記cfDNA断片化プロファイルが、全ゲノムにわたる、請求項17に記載の方法。
【請求項25】
前記cfDNA断片化プロファイルが、サブゲノム区間にわたる、請求項17に記載の方法。
【請求項26】
対象におけるDNA-ヌクレオソーム相互作用ダイナミクスを判定する方法であって、対象における無細胞DNA(cfDNA)断片サイズ密度曲線の形状を、請求項1~25のいずれか一項に記載の方法を使用して分析する工程を含み、前記曲線の前記形状が、前記DNA-ヌクレオソーム相互作用ダイナミクスを示す、方法。
【請求項27】
以下の工程を含む、対象のがんの状態を予測する方法:
(a)前記対象から得られた試料における無細胞DNA(cfDNA)断片サイズ密度曲線の形状を分析する工程、
(b)前記試料の前記cfDNA断片サイズ密度曲線の前記形状を参照曲線形状と比較する工程、および
(c)前記試料の前記cfDNA断片サイズ密度曲線の前記形状が前記参照曲線形状と異なる場合に前記対象におけるがんを検出する工程であって、それにより前記対象の前記がんの状態を予測する、工程。
【請求項28】
前記cfDNA断片サイズ密度曲線の前記形状を分析する工程が、分布の有限混合を断片サイズのカウント数に適合させることを含む、請求項27に記載の方法。
【請求項29】
前記混合が、切断正規分布を含む、請求項28に記載の方法。
【請求項30】
前記切断正規分布の有限混合を断片サイズのカウント数に適合させることが、前記試料の成分を定量することを含む、請求項29に記載の方法。
【請求項31】
前記試料の成分を定量することが、複数のcfDNA断片サイズ密度曲線の形状のパラメータを定量することを含む、請求項30に記載の方法。
【請求項32】
前記試料が、12個の成分を含む、請求項30に記載の方法。
【請求項33】
統計パラメータと混合全体への寄与とによって前記成分を特性評価する工程を更に含む、請求項30に記載の方法。
【請求項34】
前記統計パラメータが1.1以下の多変量潜在的スケール縮小を有することを判定することによって収束を評価する工程を更に含む、請求項33に記載の方法。
【請求項35】
前記cfDNA断片サイズ密度曲線曲線の前記形状を分析する工程が、約10、50、100又は105bpより小さい断片サイズ及び約220、250、300、350bpより大きい又はより大きい断片サイズを除外することを含む、請求項28に記載の方法。
【請求項36】
前記参照曲線形状が、健常な対象から得られた試料中で測定されたcfDNA断片サイズ密度曲線の形状である、請求項27に記載の方法。
【請求項37】
前記がんが、結腸直腸がん、肺がん、乳がん、胃がん、膵臓がん、胆管がん、及び卵巣がんからなる群より選択される、請求項27に記載の方法。
【請求項38】
前記比較する工程が、全ゲノムにわたって、前記cfDNA断片サイズ密度曲線の形状を参照曲線形状と比較することを含む、請求項27に記載の方法。
【請求項39】
前記比較する工程が、サブゲノム区間にわたって、前記cfDNA断片サイズ密度曲線の形状を参照曲線形状と比較することを含む、請求項27に記載の方法。
【請求項40】
対象におけるがんを治療する方法であって、
(a)前記対象におけるがんを検出する工程であって、前記対象から得られた試料における無細胞DNA(cfDNA)断片サイズ密度曲線の形状を分析する工程と、前記試料の前記cfDNA断片サイズ密度曲線の前記形状を参照曲線形状と比較する工程と、前記試料の前記cfDNA断片サイズ密度曲線の前記形状が前記参照曲線形状と異なる場合に前記対象におけるがんを検出する工程と、を含む、工程、および
(b)前記対象にがん治療を施す工程
を含み、それにより前記対象におけるがんを治療する、方法。
【請求項41】
前記対象が、ヒトである、請求項40に記載の方法。
【請求項42】
前記がんが、結腸直腸がん、肺がん、乳がん、胃がん、膵臓がん、胆管がん、及び卵巣がんからなる群より選択される、請求項40に記載の方法。
【請求項43】
前記がん治療が、手術、アジュバント化学療法、ネオアジュバント化学療法、放射線療法、ホルモン療法、細胞毒性療法、免疫療法、養子T細胞療法、標的療法、及びそれらの組み合わせからなる群より選択される、請求項40に記載の方法。
【請求項44】
前記参照曲線形状が、健常な対象から得られた試料中で測定されたcfDNA断片サイズ密度曲線の形状のものである、請求項40に記載の方法。
【請求項45】
前記cfDNA断片サイズ密度曲線の前記形状を分析する工程が、分布の有限混合を断片サイズのカウント数に適合させることを含む、請求項40に記載の方法。
【請求項46】
前記混合が、切断正規分布を含む、請求項45に記載の方法。
【請求項47】
前記切断正規分布の有限混合を断片サイズのカウント数に適合させることが、前記試料の成分を定量することを含む、請求項46に記載の方法。
【請求項48】
前記試料の成分を定量することが、複数のcfDNA断片サイズ密度曲線の形状のパラメータを定量することを含む、請求項47に記載の方法。
【請求項49】
前記試料が、12個の成分を含む、請求項47に記載の方法。
【請求項50】
統計パラメータと混合全体への寄与とによって前記成分を特性評価する工程を更に含む、請求項47に記載の方法。
【請求項51】
前記統計パラメータが1.1以下の多変量潜在的スケール縮小を有することを判定することによって収束を評価する工程を更に含む、請求項50に記載の方法。
【請求項52】
前記cfDNA断片サイズ密度曲線の前記形状を分析する工程が、105bpより小さい断片サイズ及び220bpより大きい断片サイズを除外することを含む、請求項45に記載の方法。
【請求項53】
前記比較する工程が、全ゲノムにわたって、前記cfDNA断片サイズ密度曲線の前記形状を参照曲線形状と比較することを含む、請求項40に記載の方法。
【請求項54】
前記比較する工程が、サブゲノム区間にわたって、前記cfDNA断片サイズ密度曲線の前記形状を参照曲線形状と比較することを含む、請求項40に記載の方法。
【請求項55】
対象におけるがんをモニタリングする方法であって、
(a)前記対象におけるがんの状態を判定する工程であって、前記対象から得られた第1の試料における無細胞DNA(cfDNA)断片サイズ密度曲線の形状を分析することと、前記第1の試料の前記cfDNA断片サイズ密度曲線の前記形状を参照曲線形状と比較することと、前記第1の試料の前記cfDNA断片サイズ密度曲線の前記形状が前記参照曲線形状と異なる場合に前記対象におけるがんを検出することと、によって前記がんの状態が判定される、工程と、
(b)前記対象にがん治療を施す工程と、
(c)前記対象から得られた第2の試料のcfDNA断片サイズ密度曲線の形状を決定する工程と、
(d)前記第2の試料の前記cfDNA断片サイズ密度曲線の前記形状を、前記第1の試料の前記cfDNA断片サイズ密度曲線の前記形状及び/又は前記参照曲線形状と比較する工程と
を含み、それにより前記対象におけるがんをモニタリングする、方法。
【請求項56】
(a)試料についての低カバレッジの全ゲノム配列決定データセットを生成するように構成されているシーケンサーと、
(b)コンピュータシステムであって、
(i)前記低カバレッジの全ゲノム配列決定データセットを処理して、前記試料の断片サイズ密度曲線を生成する、
(ii)前記試料の前記断片サイズ密度曲線を、少なくとも2つの異なる確立された統計パラメータセットに適合させて、少なくとも2つの推奨曲線適合を生成する、
(iii)前記少なくとも2つの推奨曲線適合を表示して、更なる処理のために前記少なくとも2つの推奨曲線適合のうちの少なくとも1つをユーザが選択することを可能にする、及び
(iv)(iii)の選択された推奨曲線適合に対応する推奨曲線適合線を参照曲線適合線とともに表示して、前記選択された推奨曲線適合線と前記参照曲線適合線との比較を可能にする
ための命令を含む非一時的コンピュータ可読媒体を有する、コンピュータシステムと
を備える、システム。
【請求項57】
前記コンピュータシステムが、
曲線適合分析に好適な成分を選択するように動作可能な、抽出ユニットと、
ユーザ定義の式の使用により、正規分布の有限混合適合を実行するか、又は多項式回帰適合を実行するように動作可能な、曲線適合ユニットと、
前記曲線適合ユニットによって生成された適合品質の指標を提供するように動作可能な、曲線適合度分析ユニットと、
基準値と比較して曲線適合パラメータを分類するように動作可能な、曲線適合パラメータ特性評価ユニットと、
適合係数及びそれらの特性評価を記憶するための、特性評価データベースと
を更に含む、請求項56に記載のシステム。
【請求項58】
前記断片サイズ密度曲線が、試料の無細胞DNA(cfDNA)断片サイズ密度曲線である、請求項56に記載のシステム。
【請求項59】
前記断片サイズ密度曲線を適合させることが、前記曲線の前記形状を定量することを含む、請求項56に記載のシステム。
【請求項60】
前記曲線適合線、前記参照曲線適合線、及び両方の比較を表示するように動作可能な視覚表示装置を更に備える、請求項56に記載のシステム。
【請求項61】
前記曲線適合線、前記参照曲線適合線、及び両方の比較を表示するレポートを印刷するために前記コンピュータシステムに接続されたプリンタを更に備える、請求項56に記載のシステム。
【請求項62】
コンピュータプログラムで符号化された非一時的コンピュータ可読記憶媒体であって、前記プログラムが命令を含み、前記命令が、1つ以上のプロセッサによって実行されると、請求項1~55のいずれか一項に記載の方法を実行する動作を前記1つ以上のプロセッサに実行させる、非一時的コンピュータ可読記憶媒体。
【請求項63】
メモリと、前記メモリに接続された1つ以上のプロセッサと、を備える、コンピューティングシステムであって、前記1つ以上のプロセッサが、請求項1~55のいずれか一項に記載の方法を実行する動作を実行するように構成されている、コンピューティングシステム。
【請求項64】
以下の工程を含む、対象のがんの状態を判定する方法:
(a)対象からの試料におけるジヌクレオソームDNA断片の無細胞DNA(cfDNA)断片サイズ密度曲線の形状を分析する工程であって、前記対象からの前記cfDNA曲線の前記形状と、健常な対象の参照試料からの曲線の形状との差が、前記対象におけるがんを示す、工程、および
(b)任意選択的に、がん治療を前記対象に施す工程。
【請求項65】
前記cfDNA断片サイズ密度曲線の前記形状を分析する工程が、約230、240、250、260bpより小さい断片サイズ及び約420、430、440、450bpより大きい又はより大きい断片サイズを除外することを含む、請求項64に記載の方法。
【請求項66】
前記cfDNA断片サイズ密度曲線の前記形状を分析する工程が、約260bpより小さい断片サイズ及び約440bpより大きい断片サイズを除外することを含む、請求項65に記載の方法。
【請求項67】
前記cfDNA断片サイズ密度曲線の前記形状を分析する工程が、染色体アームについて、約260bp~440bpの長さの断片の数を決定することと、アーム当たりのジヌクレオソーム断片の割合を算出することと、を含む、請求項65に記載の方法。
【請求項68】
各染色体アームにおけるジヌクレオソーム断片の数を算出することを更に含む、請求項67に記載の方法。
【請求項69】
前記cfDNA断片サイズ密度曲線の前記形状を分析する工程が、
(i)cfDNA断片を含む前記対象からの試料を配列決定ライブラリへと処理することと、
(ii)前記配列決定ライブラリを低カバレッジの全ゲノム配列決定に供して、配列決定された断片を得ることと、
(iii)前記配列決定された断片をゲノムにマッピングして、マッピングされた配列のウィンドウを得ることと、
(iv)前記マッピングされた配列のウィンドウを分析して、cfDNA断片長を決定することと
を更に含む、請求項65に記載の方法。
【請求項70】
前記マッピングされた配列が、数十~数千のウィンドウを含む、請求項69に記載の方法。
【請求項71】
前記ウィンドウが、非重複ウィンドウである、請求項69に記載の方法。
【請求項72】
前記ウィンドウが、各々、約500万の塩基対を含む、請求項69に記載の方法。
【請求項73】
各ウィンドウ内でcfDNA断片化プロファイルが決定される、請求項69に記載の方法。
【請求項74】
前記cfDNA断片化プロファイルが、最も頻度が高い断片サイズを含む、請求項73に記載の方法。
【請求項75】
前記cfDNA断片化プロファイルが、様々な頻度の断片サイズを有する断片サイズ分布を含む、請求項73に記載の方法。
【請求項76】
前記cfDNA断片化プロファイルが、前記マッピングされた配列のウィンドウ内の小型cfDNA断片と大型cfDNA断片との比を含む、請求項73に記載の方法。
【請求項77】
前記cfDNA断片化プロファイルが、前記ゲノムにわたるウィンドウ内の小型cfDNA断片の配列カバレッジを含む、請求項73に記載の方法。
【請求項78】
前記cfDNA断片化プロファイルが、前記ゲノムにわたるウィンドウ内の大型cfDNA断片の配列カバレッジを含む、請求項73に記載の方法。
【請求項79】
前記cfDNA断片化プロファイルが、前記ゲノムにわたるウィンドウ内の小型及び大型cfDNA断片の配列カバレッジを含む、請求項73に記載の方法。
【請求項80】
前記cfDNA断片化プロファイルが、全ゲノムにわたる、請求項73に記載の方法。
【請求項81】
前記cfDNA断片化プロファイルが、サブゲノム区間にわたる、請求項73に記載の方法。
【請求項82】
対象におけるDNA-ヌクレオソーム相互作用ダイナミクスを判定する方法であって、対象における無細胞DNA(cfDNA)断片サイズ密度曲線の形状を、請求項64~81のいずれか一項に記載の方法を使用して分析することを含み、前記曲線の前記形状が、前記DNA-ヌクレオソーム相互作用ダイナミクスを示す、方法。
【請求項83】
対象のがんの状態を予測する方法であって、
(a)前記対象から得られた試料におけるジヌクレオソームDNA断片の無細胞DNA(cfDNA)断片サイズ密度曲線の形状を分析する工程と、
(b)前記試料の前記cfDNA断片サイズ密度曲線の前記形状を参照曲線形状と比較する工程と、
(c)前記試料の前記cfDNA断片サイズ密度曲線の前記形状が前記参照曲線形状と異なる場合に前記対象におけるがんを検出する工程であって、それにより前記対象の前記がんの状態を予測する、工程と
を含む、方法。
【請求項84】
前記cfDNA断片サイズ密度曲線の前記形状を分析する工程が、約230、240、250、260bpより小さい断片サイズ及び約420、430、440、450bpより大きい又はより大きい断片サイズを除外することを含む、請求項83に記載の方法。
【請求項85】
前記cfDNA断片サイズ密度曲線の前記形状を分析する工程が、約260bpより小さい断片サイズ及び440bpより大きい断片サイズを除外することを含む、請求項84に記載の方法。
【請求項86】
前記cfDNA断片サイズ密度曲線の前記形状を分析する工程が、染色体アームについて、約260bp~440bpの長さの断片の数を決定することと、アーム当たりのジヌクレオソーム断片の割合を算出することと、を含む、請求項84に記載の方法。
【請求項87】
各染色体アームにおけるジヌクレオソーム断片の数を算出することを更に含む、請求項86に記載の方法。
【請求項88】
前記参照曲線形状が、健常な対象から得られた試料中で測定されたcfDNA断片サイズ密度曲線の形状である、請求項84に記載の方法。
【請求項89】
前記がんが、結腸直腸がん、肺がん、乳がん、胃がん、膵臓がん、胆管がん、及び卵巣がんからなる群より選択される、請求項84に記載の方法。
【請求項90】
前記比較する工程が、全ゲノムにわたって、前記cfDNA断片サイズ密度曲線の形状を参照曲線形状と比較することを含む、請求項84に記載の方法。
【請求項91】
前記比較する工程が、サブゲノム区間にわたって、前記cfDNA断片サイズ密度曲線の形状を参照曲線形状と比較することを含む、請求項84に記載の方法。
【請求項92】
対象におけるがんを治療する方法であって、
(a)前記対象におけるがんを検出する工程であって、前記対象から得られた試料におけるジヌクレオソームDNA断片の無細胞DNA(cfDNA)断片サイズ密度曲線の形状を分析する工程と、前記試料の前記cfDNA断片サイズ密度曲線の前記形状を参照曲線形状と比較する工程と、前記試料の前記cfDNA断片サイズ密度曲線の前記形状が前記参照曲線形状と異なる場合に前記対象におけるがんを検出する工程と、を含む、工程、および、
(b)前記対象にがん治療を施す工程
を含み、それにより前記対象におけるがんを治療する、方法。
【請求項93】
前記対象が、ヒトである、請求項92に記載の方法。
【請求項94】
前記がんが、結腸直腸がん、肺がん、乳がん、胃がん、膵臓がん、胆管がん、及び卵巣がんからなる群より選択される、請求項92に記載の方法。
【請求項95】
前記がん治療が、手術、アジュバント化学療法、ネオアジュバント化学療法、放射線療法、ホルモン療法、細胞毒性療法、免疫療法、養子T細胞療法、標的療法、及びそれらの組み合わせからなる群より選択される、請求項92に記載の方法。
【請求項96】
前記参照曲線形状が、健常な対象から得られた試料中で測定されたcfDNA断片サイズ密度曲線の形状のものである、請求項92に記載の方法。
【請求項97】
前記cfDNA断片サイズ密度曲線の前記形状を分析する工程が、約230、240、250、260bpより小さい断片サイズ及び約420、430、440、450bpより大きい又はより大きい断片サイズを除外することを含む、請求項92に記載の方法。
【請求項98】
前記cfDNA断片サイズ密度曲線の前記形状を分析する工程が、約260bpより小さい断片サイズ及び440bpより大きい断片サイズを除外することを含む、請求項97に記載の方法。
【請求項99】
前記cfDNA断片サイズ密度曲線の前記形状を分析する工程が、染色体アームについて、約260bp~440bpの長さの断片の数を決定することと、アーム当たりのジヌクレオソーム断片の割合を算出することと、を含む、請求項97に記載の方法。
【請求項100】
各染色体アームにおけるジヌクレオソーム断片の数を算出することを更に含む、請求項99に記載の方法。
【請求項101】
前記比較する工程が、全ゲノムにわたって、前記cfDNA断片サイズ密度曲線の前記形状を参照曲線形状と比較することを含む、請求項92に記載の方法。
【請求項102】
前記比較する工程が、サブゲノム区間にわたって、前記cfDNA断片サイズ密度曲線の前記形状を参照曲線形状と比較することを含む、請求項92に記載の方法。
【請求項103】
対象におけるがんをモニタリングする方法であって、
(a)前記対象におけるがんの状態を判定する工程であって、前記対象から得られた第1の試料におけるジヌクレオソームDNA断片の無細胞DNA(cfDNA)断片サイズ密度曲線の形状を分析することと、前記第1の試料の前記cfDNA断片サイズ密度曲線の前記形状を参照曲線形状と比較することと、前記第1の試料の前記cfDNA断片サイズ密度曲線の前記形状が前記参照曲線形状と異なる場合に前記対象におけるがんを検出することと、によって前記がんの状態が判定される、工程、
(b)前記対象にがん治療を施す工程、
(c)前記対象から得られた第2の試料におけるジヌクレオソームDNA断片のcfDNA断片サイズ密度曲線の形状を決定する工程、ならびに
(d)前記第2の試料の前記cfDNA断片サイズ密度曲線の前記形状を、前記第1の試料の前記cfDNA断片サイズ密度曲線の前記形状及び/又は前記参照曲線形状と比較する工程
を含み、それにより前記対象におけるがんをモニタリングする、方法。
【請求項104】
前記第1の試料及び前記第2の試料における前記cfDNA断片サイズ密度曲線の前記形状を分析することが、約230、240、250、260bpより小さい断片サイズ及び約420、430、440、450bpより大きい又はより大きい断片サイズを除外することを含む、請求項102に記載の方法。
【請求項105】
前記cfDNA断片サイズ密度曲線の前記形状を分析することが、約260bpより小さい断片サイズ及び440bpより大きい断片サイズを除外することを含む、請求項103に記載の方法。
【請求項106】
コンピュータプログラムで符号化された非一時的コンピュータ可読記憶媒体であって、前記プログラムが命令を含み、前記命令が、1つ以上のプロセッサによって実行されると、請求項64~104のいずれか一項に記載の方法を実行する動作を前記1つ以上のプロセッサに実行させる、非一時的コンピュータ可読記憶媒体。
【請求項107】
メモリと、前記メモリに接続された1つ以上のプロセッサと、を備える、コンピューティングシステムであって、前記1つ以上のプロセッサが、請求項64~104のいずれか一項に記載の方法を実行する動作を実行するように構成されている、コンピューティングシステム。
【請求項108】
(a)試料についての低カバレッジの全ゲノム配列決定データセットを生成するように構成されているシーケンサーと、
(b)請求項105に記載の非一時的コンピュータ可読記憶媒体、又は請求項106に記載のコンピュータシステムと
を備える、システム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2020年8月18日に出願された米国仮出願第63/067,244号、及び2021年3月19日に出願された米国仮出願第63/163,434号の米国特許法第119条(e)に基づく優先権の利益を主張する。先行出願の開示は、その全体が本出願の開示の一部と見なされ、参照により本明細書に組み込まれる。
【0002】
発明の分野
本発明は、概して、遺伝子分析に関し、より具体的には、対象におけるがんを検出及び/又は評価するための無細胞DNA断片サイズ密度の分析のための方法及びシステムに関する。
【背景技術】
【0003】
背景情報
世界中のヒトのがんの罹患率及び死亡率の多くは、これらの疾患の診断が遅れた結果であり、治療効果は低い。残念ながら、早期がんを有する患者を広く診断及び治療するために使用できる臨床的に証明されたバイオマーカーは、広く利用できるものではない。
【0004】
無細胞DNA(cfDNA)の分析は、そのようなアプローチが早期診断のための新たな道を提供する可能性があることを示唆している。循環腫瘍DNA(ctDNA)断片は、非腫瘍細胞由来の他のcfDNAよりも平均して短いことが示されている。これまでの研究では、ヒストンコア若しくはリンカータンパク質に結合することによって引き起こされる異なるサイズ(例えば、短いものと長いもの、又は相互に排他的なサイズのセット)の断片をグループに分けること、これら断片のカウント数を使用してctDNAを定量すること、及び/又は個々の試料を腫瘍が存在するもの/存在しないものに分類することが探索されてきた。しかしながら、これまでの研究は、断片サイズ密度曲線の形状の重要性を無視している。
【0005】
したがって、断片サイズ密度曲線の形状の分析を利用するがんの検出及び/又は評価方法は、対象におけるがんのより堅牢かつ信頼性の高い検出を可能にするために望ましい。
【発明の概要】
【0006】
本開示は、患者から得られた試料におけるcfDNA断片サイズ密度曲線の形状の分析を利用する方法及びシステムを提供する。曲線の形状は、がんの状態の強力な予測となることが本明細書で実証される。
【0007】
したがって、一実施形態では、本発明は、対象のがんの状態を判定する方法を提供する。本方法は、(a)対象からの試料におけるcfDNA断片サイズ密度曲線の形状を分析する工程であって、対象からのcfDNA断片サイズ密度曲線の形状と、健常な対象の参照試料からの曲線の形状との差が、対象におけるがんを示す、工程と、(b)任意選択的に、対象にがん治療を施す工程と、を含む。
【0008】
別の実施形態では、本発明は、対象におけるDNA-ヌクレオソーム相互作用ダイナミクスを判定する方法であって、本発明の方法を使用して、対象におけるcfDNA断片サイズ密度曲線の形状を分析することを含む、方法を提供する。ある特定の態様では、曲線の形状は、DNA-ヌクレオソーム相互作用ダイナミクスを示している。
【0009】
更に別の実施形態では、本発明は、対象のがんの状態を予測する方法を提供する。本方法は、(a)対象から得られた試料におけるcfDNA断片サイズ密度曲線の形状を分析することと、(b)試料のcfDNA断片サイズ密度曲線の形状を参照曲線形状と比較することと、(c)試料のcfDNA断片サイズ密度曲線の形状が参照曲線形状と異なる場合に対象におけるがんを検出し、それにより、対象のがんの状態を予測することと、を含む。
【0010】
別の実施形態では、本発明は、対象におけるがんを診断及び治療する方法を提供する。本方法は、(a)対象におけるがんを検出する工程であって、対象から得られた試料におけるcfDNA断片サイズ密度曲線の形状を分析することと、試料のcfDNA断片サイズ密度曲線の形状を参照曲線形状と比較することと、試料のcfDNA断片サイズ密度曲線の形状が参照曲線形状と異なる場合に対象におけるがんを検出することと、を含む、検出する工程と、(b)がん治療を対象に施す工程とを含み、それにより対象におけるがんを治療する。
【0011】
更に別の実施形態では、本発明は、対象におけるがんをモニタリングする方法を提供する。本方法は、(a)対象におけるがんの状態を判定する工程であって、対象から得られた第1の試料におけるcfDNA断片サイズ密度曲線の形状を分析することと、第1の試料のcfDNA断片サイズ密度曲線の形状を参照曲線形状と比較することと、第1の試料のcfDNA断片サイズ密度曲線の形状が参照曲線形状と異なる場合に対象におけるがんを検出することと、によってがんの状態が判定される、判定する工程と、(b)対象にがん治療を施す工程と、(c)対象から得られた第2の試料のcfDNA断片サイズ密度曲線の形状を決定する工程と、(d)第2の試料のcfDNA断片サイズ密度曲線の形状を、第1の試料のcfDNA断片サイズ密度曲線の形状及び/又は参照曲線形状と比較する工程とを含み、それにより対象におけるがんをモニタリングする。
【0012】
別の実施形態では、本発明は、遺伝子分析及びがんの評価のためのシステムを提供する。本システムは、(a)試料についての低カバレッジの全ゲノム配列決定データセットを生成するように構成されているシーケンサーと、(b)コンピュータシステムと、を備える。様々な態様において、コンピュータシステムは、以下のうちの1つ以上を実行するための命令を含む、非一時的コンピュータ可読媒体を有する:(i)低カバレッジの全ゲノム配列決定データセットを処理して、試料の断片サイズ密度曲線を生成すること、(ii)試料の断片サイズ密度曲線を、少なくとも2つの異なる確立された統計パラメータセットに適合させて、少なくとも2つの推奨(suggested)曲線適合を生成すること、(iii)少なくとも2つの推奨曲線適合を表示して、更なる処理のために少なくとも2つの推奨曲線適合のうちの少なくとも1つをユーザが選択することを可能にすること、及び(iv)(iii)の選択された推奨曲線適合に対応する推奨曲線適合線を参照曲線適合線とともに表示して、選択された推奨曲線適合線と参照曲線適合線との比較を可能にすること。
【0013】
本発明の様々な態様において、cfDNA断片サイズ密度曲線の形状を分析することは、様々な断片サイズの分析を含む。いくつかの態様では、cfDNA断片サイズ密度曲線の形状を分析することにより、約10、50、100又は105bpより小さい断片サイズ、及び約220、250、300、350bpより大きい又はより大きい断片サイズが除外される。いくつかの態様では、cfDNA断片サイズ密度曲線の形状を分析することにより、約105bpより小さい断片サイズ及び約170bpより大きい断片サイズが除外される。いくつかの態様では、cfDNA断片サイズ密度曲線の形状を分析することは、ジヌクレオソームDNA断片のものである。いくつかの態様では、cfDNA断片サイズ密度曲線の形状を分析することでは、約230、240、250、260bpより小さい断片サイズ、及び約420、430、440、450bpより大きい又はより大きい断片サイズが除外される。いくつかの態様では、cfDNA断片サイズ密度曲線の形状を分析することでは、約260bpより小さい断片サイズ及び約440bpより大きい断片サイズが除外される。
【0014】
更に別の実施形態では、本発明は、コンピュータプログラムで符号化された非一時的コンピュータ可読記憶媒体を提供する。コンピュータプログラムは命令を含み、命令は、1つ以上のプロセッサによって実行されると、本発明の方法を実行する動作を1つ以上のプロセッサに実行させる。
【0015】
更に別の実施形態では、本発明は、コンピューティングシステムを提供する。本システムは、メモリと、メモリに接続された1つ以上のプロセッサと、を備え、1つ以上のプロセッサは、本発明の方法を実装する動作を実行するように構成されている。
【0016】
更に別の実施形態では、本発明は、遺伝子分析及びがんの評価のためのシステムであって、(a)試料についての全ゲノム配列決定データセットを生成するように構成されているシーケンサーと、(b)本発明の非一時的コンピュータ可読記憶媒体及び/又はコンピュータシステムと、を備える、システムを提供する。
【図面の簡単な説明】
【0017】
図1】本発明の一実施形態において本開示の方法論を使用して生成されたデータを示すグラフプロットである。
図2】本発明の一実施形態において本開示の方法論を使用して生成されたデータを示すグラフプロットである。
図3】本発明の一実施形態において本開示の方法論を使用して生成されたデータを示すグラフプロットである。
図4】本発明の一実施形態において本開示の方法論を使用して生成されたデータを示すグラフプロットである。
図5】本発明の一実施形態において本開示の方法論を使用して生成されたデータを示すグラフプロットである。
図6】ジヌクレオソームのRSCスライド化によって生成される、様々な状態を示す画像である。Montel et al.(2011.“RSC remodeling of oligo-nucleosomes:an atomic force microscopy study.”Nucleic Acids Research 39(7):2571-2579。)
図7】様々な断片サイズをもたらす潜在的なエンドヌクレアーゼ切断部位の例を示す画像である。状態ごとに2つの部位のみが示されているが、切断は、リンカーDNA内の複数の異なる位置で生じ得る。Montel et al.(2011)。
図8】本発明の一実施形態において本開示の方法論を使用して生成されたデータを示すグラフプロットである。
図9】本発明の一実施形態において本開示の方法論を使用して生成されたデータを示すグラフプロットである。
【発明を実施するための形態】
【0018】
発明の詳細な説明
本発明は、患者由来の試料中のcfDNAからのcfDNA断片サイズ密度曲線の形状の分析を利用する革新的な方法及びシステムに基づいている。本明細書で考察されるように、本発明は、1)多項式回帰、及び2)ベイズ有限混合モデルを使用する2つのアプローチにおいて、曲線の形状を定量する。本発明の方法及びシステムは、対象のがんの状態に関連するDNA-ヌクレオソーム相互作用ダイナミクスを要約するための新規アプローチとなる。
【0019】
本発明の組成物及び方法を説明する前に、本発明は、記載された特定の方法及びシステムに限定されるものではなく、そのような方法及びシステムは様々であり得ることを理解されたい。また、本明細書で使用される用語は、特定の実施形態のみを説明するためのものであり、限定することを意図するものではなく、本発明の範囲は、添付の特許請求の範囲のみに限定されることも理解されたい。
【0020】
本明細書及び添付の特許請求の範囲で使用される場合、単数形の「a」、「an」及び「the」は、文脈から明らかにそうではない限り、複数の参照を含む。したがって、例えば、「方法(the method)」への言及は、本明細書に記載される種類の1つ以上の方法及び/又は工程を含み、本開示などを読めば当業者には明白になるであろう。
【0021】
別途定義されない限り、本明細書で使用される全ての技術用語及び科学用語は、本発明が属する技術分野の当業者によって一般的に理解されているものと同じ意味を有する。本明細書に記載される方法及び材料と類似するか、又は同等のあらゆる方法及び材料を本発明の実施又は試験に使用することができるが、好ましい方法及び材料を以下に記載する。
【0022】
本開示は、がんを検出するか、又はそうでなければ評価するための分析cfDNA断片サイズ密度のための革新的な方法及びシステムを提供する。
【0023】
一態様では、断片サイズ密度曲線の形状を定量するための本発明の方法論を開発するために使用されるデータは、浅い全ゲノム配列データ(1~2倍のカバレッジ)に基づいている。図1は、平均断片サイズ密度の比較を示す。図1において、DNAリード量によって正規化されたがん個体及びがんを有しない個体による平均断片サイズ密度をプロットする。
【0024】
以前の研究において概して示されるように、がんを有しない個体のcfDNA断片はより長く(平均サイズ:167.09bp)、一方、がんを有する個体のcfDNA断片はより短い(平均サイズ:164.88bp)。しかしながら、図1は、短い断片の増加を越える、これら密度の全体形状の差を示す。更に、これらの差は、以前の取り組みで利用されたような特定ピークの周期性によって捉えられるものではない。代わりに、これらの断片サイズ密度の差は、DNA-ヌクレオソーム相互作用ダイナミクスの差を表し得、正確にモデリングするための、ビン又は周期性のカウントを越える代替アプローチを必要とする。本明細書に記載の方法は、血漿ドナーのがんの状態に関連するDNA-ヌクレオソーム相互作用ダイナミクスを要約するための新規アプローチとなる。
【0025】
様々な態様において、本開示は、断片サイズ密度が分布の混合としてモデリングされ得、そのパラメータががんの状態を予測するものであり得ることを実証する。いくつかの態様では、本開示は、単一のヌクレオソームのサイズ(260bp未満のサイズ)に密接に対応する断片サイズの使用を例示する。これらは典型的には、H1ヒストン及びリンカーDNA(20bp)とともに147bpのDNAが巻き付いたヒストンオクトマーを含み)、167bpサイズの主要なピークが観察される。本開示はまた、中央値が334bpのピークをもたらす2つのヌクレオソームを含む可能性が高い260bpを超えるcfDNA断片の使用を例示する。
【0026】
したがって、一実施形態では、本発明は、対象のがんの状態を判定する方法を提供する。本方法は、(a)対象からの試料におけるcfDNA断片サイズ密度曲線の形状を分析する工程であって、対象からのcfDNA断片サイズ密度曲線の形状と、健常な対象の参照試料からの当該曲線の形状との差が、対象におけるがんを示す、分析する工程と、(b)任意選択的に、対象にがん治療を施す工程と、を含む。
【0027】
別の実施形態では、本発明は、対象のがんの状態を予測する方法を提供する。本方法は、(a)対象から得られた試料におけるcfDNA断片サイズ密度曲線の形状を分析することと、(b)試料のcfDNA断片サイズ密度曲線の形状を参照曲線形状と比較することと、(c)試料のcfDNA断片サイズ密度曲線の形状が参照曲線形状と異なる場合に対象におけるがんを検出し、それにより、対象のがんの状態を予測することと、を含む。
【0028】
更に別の実施形態では、本発明は、対象におけるがんを治療する方法を提供する。本方法は、(a)対象におけるがんを検出する工程であって、対象から得られた試料におけるcfDNA断片サイズ密度曲線の形状を分析することと、試料のcfDNA断片サイズ密度曲線の形状を参照曲線形状と比較することと、試料のcfDNA断片サイズ密度曲線の形状が参照曲線形状と異なる場合に対象におけるがんを検出することと、を含む、検出する工程と、(b)がん治療を対象に施す工程とを含み、それにより対象におけるがんを治療する。
【0029】
別の実施形態では、本発明は、対象におけるがんをモニタリングする方法を提供する。本方法は、(a)対象におけるがんの状態を判定する工程であって、対象から得られた第1の試料におけるcfDNA断片サイズ密度曲線の形状を分析することと、第1の試料のcfDNA断片サイズ密度曲線の形状を参照曲線形状と比較することと、第1の試料のcfDNA断片サイズ密度曲線の形状が参照曲線形状と異なる場合に対象におけるがんを検出することと、によってがんの状態が判定される、判定する工程と、(b)対象にがん治療を施す工程と、(c)対象から得られた第2の試料のcfDNA断片サイズ密度曲線の形状を決定する工程と、(d)第2の試料のcfDNA断片サイズ密度曲線の形状を、第1の試料のcfDNA断片サイズ密度曲線の形状及び/又は参照曲線形状と比較する工程とを含み、それにより対象におけるがんをモニタリングする。
【0030】
様々な態様において、本発明の方法は、分布の有限混合を断片サイズのカウント数に適合させることによって、cfDNA断片サイズ密度曲線の形状を分析することを含む。特定の態様では、分布の有限混合を断片サイズのカウント数に適合させることは、試料の成分を定量することを含み、これは、複数のcfDNA断片サイズ密度曲線を定量することを含み得る。いくつかの態様では、試料は、約2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、又はより多くの成分を含む。1つの例示的な態様では、実施例1で考察されるように、試料は、12個の成分を含む。
【0031】
様々な態様において、分布は、切断正規分布を含む。
【0032】
様々な態様において、本方法は、統計パラメータと混合全体への寄与とによって、試料の成分を特性評価することを含む。このような統計パラメータとしては、限定されないが、平均、分散及び/又は形状、並びに重みが挙げられ得る。
【0033】
本発明の方法は、統計パラメータが1.5、1.4、1.3、1.2、1.1若しくは1.0以下、又は約1.5、1.4、1.3、1.2、1.1若しくは1.0の多変量潜在的スケール縮小係数(multivariate potential scale reduction factor)を有することを判定することによって収束を評価することを更に含み得る。
【0034】
様々な態様において、cfDNA断片サイズ密度曲線の形状を分析することは、約10、50、100又は105bpより小さい連続した断片サイズ範囲、及び約220、250、300、350bpより大きい又はより大きい連続した断片サイズ範囲を除外することを含む。一態様では、cfDNA断片サイズ密度曲線の形状を分析することは、105bpより小さい断片サイズ及び170bpより大きい断片サイズを除外することを含む。
【0035】
特定の態様では、cfDNA断片サイズ密度曲線の形状を分析することは、ジヌクレオソームDNA断片のものである。いくつかの態様では、cfDNA断片サイズ密度曲線の形状を分析することにより、約230、240、250、260bpより小さい断片サイズ、及び約420、430、440、450bpより大きい又はより大きい断片サイズが除外される。一態様では、cfDNA断片サイズ密度曲線の形状を分析することは、260bpより小さい断片サイズ及び440bpより大きい断片サイズを除外することを含む。
【0036】
加えて、cfDNA断片サイズ密度曲線の形状を分析することは、所与の長さの断片のカウント数に適合する多項式回帰の係数を使用して曲線の形状を定量することを含む。実施例1において示されるように、本方法は、断片のカウント数を、平均が0及び分散が1となるように標準化することを更に含み得る。
【0037】
様々な態様において、cfDNA断片サイズ密度曲線の形状を分析することは、(i)cfDNA断片を含む対象からの試料を配列決定ライブラリへと処理すること、(ii)配列決定ライブラリを低カバレッジの全ゲノム配列決定に供して、配列決定された断片を得ること、(iii)配列決定された断片をゲノムにマッピングして、マッピングされた配列のウィンドウを得ること、及び(iv)マッピングされた配列のウィンドウを分析して、cfDNA断片長を決定すること、のうちの1つ以上を含み得る。
【0038】
ある特定の態様では、マッピングされた配列は、数十~数千のゲノムウィンドウ、例えば、10個、50個、100個~1,000個、5,000個、10,000個、またはより多くのウィンドウを含む。そのようなウィンドウは、非重複又は重複であり得、約100万、200万、300万、400万、500万、600万、700万、800万、900万又は1000万塩基対を含む。
【0039】
様々な態様において、cfDNA断片化プロファイルは、各ウィンドウ内で決定される。したがって、本発明は、対象における(例えば、対象から得られた試料における)cfDNA断片化プロファイルを決定するための方法を提供する。本明細書で使用される場合、「断片化プロファイル」、「断片化パターンにおける位置依存性の差」、及び「ゲノムにわたる位置依存的な断片サイズ及びカバレッジの差」という用語は等価であり、互換的に使用され得る。
【0040】
いくつかの態様では、対象におけるcfDNA断片化プロファイルを決定することは、cfDNA断片サイズ密度曲線の形状を分析することによって、がんを有する対象を特定するのに使用することができる。例えば、対象から(例えば、対象から得られた試料から)得られたcfDNA断片を低カバレッジの全ゲノム配列決定に供することができ、配列決定された断片を参照ヒトゲノムに(例えば、非重複ウィンドウ内で)マッピングし、評価して、分析されたcfDNA断片化プロファイル及びcfDNA断片サイズ密度曲線の形状を決定することができる。本明細書に記載されるように、がんを有する対象のcfDNA断片化プロファイルは、健常な対象(例えば、がんを有しない対象)のcfDNA断片化プロファイルよりも(例えば、断片長が)不均一である。
【0041】
いくつかの態様では、cfDNA断片化プロファイルは、cfDNA断片サイズ密度曲線のピークを画定する最も頻度が高い断片サイズを含む。いくつかの態様では、cfDNA断片化プロファイルは、様々な頻度の断片サイズを有する断片サイズ分布を含む。いくつかの態様では、cfDNA断片化プロファイルは、マッピングされた配列の当該ウィンドウにおける、小型cfDNA断片と大型cfDNA断片との比を含む。いくつかの態様では、cfDNA断片化プロファイルは、ゲノムにわたるウィンドウ内の小型cfDNA断片の配列カバレッジを含む。いくつかの態様では、cfDNA断片化プロファイルは、ゲノムにわたるウィンドウ内の大型cfDNA断片の配列カバレッジを含む。いくつかの態様では、cfDNA断片化プロファイルは、ゲノムにわたるウィンドウ内の小型及び大型cfDNA断片の配列カバレッジを含む。いくつかの態様では、cfDNA断片化プロファイルは、全ゲノムにわたる。いくつかの態様では、cfDNA断片化プロファイルは、サブゲノム区間にわたる。
【0042】
cfDNA断片化プロファイルは、1つ以上のcfDNA断片化パターンを含むことができる。cfDNA断片化パターンは、任意の適切なcfDNA断片化パターンを含むことができる。cfDNA断片化パターンの例としては、限定されないが、断片サイズ中央値、断片サイズ分布、小型cfDNA断片と大型cfDNA断片との比、及びcfDNA断片のカバレッジが挙げられる。いくつかの態様では、cfDNA断片化パターンは、断片サイズ中央値、断片サイズ分布、小型cfDNA断片と大型cfDNA断片との比、及びcfDNA断片のカバレッジのうちの2つ以上(例えば、2つ、3つ、又は4つ)を含む。いくつかの態様では、cfDNA断片化プロファイルは、ゲノム全体のcfDNAプロファイル(例えば、ゲノムにわたるウィンドウ内のゲノム全体のcfDNAプロファイル)であり得る。いくつかの態様では、cfDNA断片化プロファイルは、標的領域プロファイルであり得る。標的領域は、ゲノムの任意の適切な部分(例えば、染色体領域)であり得る。本明細書に記載されるように、cfDNA断片化プロファイルが決定され得る染色体領域の例としては、限定されないが、染色体の一部(例えば、2q、4p、5p、6q、7p、8q、9q、10q、11q、12q及び/若しくは14qの一部)並びに染色体アーム(例えば、8q、13q、11q及び/若しくは3pの染色体アーム)が挙げられる。いくつかの態様では、cfDNA断片化プロファイルは、2つ以上の標的領域プロファイルを含むことができる。
【0043】
いくつかの態様では、cfDNA断片化プロファイルを使用して、cfDNA断片長の変化(例えば、改変)を特定することができる。改変は、ゲノム全体の改変又は1つ以上の標的領域/遺伝子座の改変であり得る。標的領域は、1つ以上のがん特異的改変を含む任意の領域であり得る。いくつかの態様では、cfDNA断片化プロファイルを使用して、約10の改変~約500の改変(例えば、約25~約500、約50~約500、約100~約500、約200~約500、約300~約500、約10~約400、約10~約300、約10~約200、約10~約100、約10~約50、約20~約400、約30~約300、約40~約200、約50~約100、約20~約100、約25~約75、約50~約250、又は約100~約200の改変)を特定(例えば、同時に特定)することができる。
【0044】
様々な態様において、cfDNA断片化プロファイルは、cfDNA断片サイズパターンを含み得る。cfDNA断片は、任意の適切なサイズであり得る。例えば、いくつかの態様では、cfDNA断片は、約50塩基対(bp)~約400bpの長さであり得る。本明細書に記載されるように、がんを有する対象は、健常な対象におけるcfDNA断片サイズ中央値よりも短いcfDNA断片サイズ中央値を含むcfDNA断片サイズパターンを有することができる。健常な対象(例えば、がんを有しない対象)は、約166.6bp~約167.2bp(例えば、約166.9bp)のcfDNA断片サイズ中央値を有するcfDNA断片サイズを有することができる。ある態様では、がんを有する対象は、健常な対象におけるcfDNA断片サイズよりも平均して約1.28bp~約2.49bp(例えば、約1.88bp)短いcfDNA断片サイズを有することができる。例えば、がんを有する対象は、約164.11bp~約165.92bp(例えば、約165.02bp)のcfDNA断片サイズ中央値を有するcfDNA断片サイズを有することができる。
【0045】
いくつかの態様では、ジヌクレオソームcfDNA断片は、約230塩基対(bp)~約450bpの長さとすることができる。本明細書に記載されるように、がんを有する対象は、健常な対象におけるジヌクレオソームcfDNA断片サイズ中央値よりも短いジヌクレオソームcfDNA断片サイズ中央値を含むジヌクレオソームcfDNA断片サイズパターンを有することができる。図5に見られるようないくつかの態様では、平均して、がんを有しない対象は、ジヌクレオソーム範囲内でより長いcfDNA断片(平均サイズ:334.75bp)を有するのに対し、がんを有する対象は、より短いジヌクレオソームcfDNA断片(平均サイズ:329.6bp)を有することが明らかである。したがって、健常な対象(例えば、がんを有しない対象)は、約334.75bpのcfDNA断片サイズ中央値を有するジヌクレオソームcfDNA断片サイズを有することができる。いくつかの態様では、がんを有する対象は、健常な対象におけるジヌクレオソームcfDNA断片サイズよりも短いジヌクレオソームcfDNA断片サイズを有することができる。例えば、がんを有する対象は、約329.6bpのcfDNA断片サイズ中央値を有するジヌクレオソームcfDNA断片サイズを有することができる。
【0046】
cfDNA断片化プロファイルは、cfDNA断片サイズ分布を含み得る。本明細書に記載されるように、がんを有する対象は、健常な対象におけるcfDNA断片サイズ分布よりも可変性が高いcfDNAサイズ分布を有することができる。いくつかの態様では、サイズ分布は、標的領域内にあることができる。健常な対象(例えば、がんを有しない対象)は、約1又は約1未満の標的領域cfDNA断片サイズ分布を有することができる。いくつかの態様では、がんを有する対象は、健常な対象における標的領域cfDNA断片サイズ分布よりも長い(例えば、10、15、20、25、30、35、40、45、50、若しくはより大きいbp、又はこれらの数の間の任意の数の塩基対分だけ長い)標的領域cfDNA断片サイズ分布を有することができる。いくつかの態様では、がんを有する対象は、健常な対象における標的領域cfDNA断片サイズ分布よりも短い(例えば、10、15、20、25、30、35、40、45、50若しくはより大きいbp、又はこれらの数の間の任意の数の塩基対分だけ短い)標的領域cfDNA断片サイズ分布を有することができる。いくつかの態様では、がんを有する対象は、健常な対象における標的領域cfDNA断片サイズ分布よりも約47bp小さい~約30bp長い標的領域cfDNA断片サイズ分布を有することができる。いくつかの態様では、がんを有する対象は、平均して、10、11、12、13、14、15、15、17、18、19、20又はより大きいbpのcfDNA断片長差がある標的領域cfDNA断片サイズ分布を有することができる。例えば、がんを有する対象は、平均して約13bpのcfDNA断片長差がある標的領域cfDNA断片サイズ分布を有することができる。いくつかの態様では、サイズ分布は、ゲノム全体のサイズ分布であり得る。
【0047】
cfDNA断片化プロファイルは、小型cfDNA断片と大型cfDNA断片との比、及び断片比と参照断片比との相関を含み得る。本明細書で使用される場合、小型cfDNA断片と大型cfDNA断片との比に関して、小型cfDNA断片は、約100bp長~約150bp長であり得る。本明細書で使用される場合、小型cfDNA断片と大型cfDNA断片との比に関して、大型cfDNA断片は、約151bp~220bp長であり得る。本明細書に記載されるように、がんを有する対象は、断片比の相関(例えば、cfDNA断片比と参照DNA断片比(例えば、1以上の健常な対象からのDNA断片比)との相関)が、健常な対象のものよりも低い(例えば、2倍低い、3倍低い、4倍低い、5倍低い、6倍低い、7倍低い、8倍低い、9倍低い、10倍低い、又はより低い)ものであり得る。健常な対象(例えば、がんを有しない対象)は、断片比の相関(例えば、cfDNA断片比と参照DNA断片比(例えば、1以上の健常な対象からのDNA断片比)との相関)が、約1(例えば、約0.96)であり得る。いくつかの態様では、がんを有する対象は、断片比の相関(例えば、cfDNA断片比と参照DNA断片比(例えば、1以上の健常な対象からのDNA断片比)との相関)が、健常な対象の断片比の相関(例えば、cfDNA断片比と参照DNA断片比(例えば、1以上の健常な対象からのDNA断片比)との相関)よりも平均して約0.19~約0.30(例えば、約0.25)低いものであり得る。
【0048】
本明細書に記載の方法及びシステムは、対象におけるがんの状態を検出、予測、治療及び/又はモニタリングするために有用である。哺乳動物などの任意の適切な対象は、本明細書に記載されるように、評価、モニタリング、及び/又は治療することができる。本明細書に記載されるように評価、モニタリング、及び/又は治療することができるいくつかの哺乳動物の例としては、限定されないが、ヒト、サル、イヌ、ネコ、ウマ、ウシ、ブタ、ヒツジ、マウス、及びラットなどの霊長類が挙げられる。例えば、がんを有する、又はがんを有する疑いのあるヒトは、本明細書に記載の方法を使用して評価することができ、任意選択的に、本明細書に記載の1つ以上のがん治療で治療することができる。
【0049】
任意の適切な種類のがんを有するか、又は有する疑いのある対象は、本明細書に記載の方法及びシステムを使用して、(例えば、対象に1つ以上のがん治療を施すことによって)評価及び/又は治療することができる。がんは、任意のステージのがんであり得る。いくつかの態様では、がんは、早期がんであり得る。いくつかの態様では、がんは、無症候性がんであり得る。いくつかの態様では、がんは、残存疾患及び/又は再発(例えば、外科的切除後及び/又はがん療法後)であり得る。がんは、任意の種類のがんであり得る。本明細書に記載されるように評価、モニタリング、及び/又は治療することができる種類のがんの例としては、限定されないが、結腸直腸がん、肺がん、乳がん、胃がん、膵臓がん、胆管がん、頭頸部がん、腎臓がん、骨がん、脳がん、造血がん及び卵巣がんが挙げられる。
【0050】
本明細書に記載のがんを有する対象、又はがんを有する疑いのある対象を治療する場合、対象に1つ以上のがん治療を施すことができる。がん治療は、任意の適切ながん治療であり得る。本明細書に記載される1つ以上のがん治療は、任意の適切な頻度で対象に(例えば、数日~数週間の期間にわたって1回又は複数回)施すことができる。がん治療の例としては、限定されないが、アジュバント化学療法、ネオアジュバント化学療法、放射線療法、ホルモン療法、細胞傷害療法、免疫療法、養子T細胞療法(例えば、キメラ抗原受容体及び/又は野生型若しくは修飾T細胞受容体を有するT細胞)、キナーゼ阻害剤(例えば、転座若しくは変異などの特定の遺伝性病変を標的とするキナーゼ阻害剤)(例えば、キナーゼ阻害剤、抗体、二重特異性抗体)の投与などの標的療法、シグナル導入阻害剤、二重特異性抗体若しくは抗体断片(例えば、BiTE)、モノクローナル抗体、免疫チェックポイント阻害剤、手術(例えば、外科的切除)、又は上記の任意の組み合わせが挙げられる。いくつかの態様では、がん治療は、がんの重症度を低減させ、がんの症状を低減させ、及び/又は対象内に存在するがん細胞の数を低減させることができる。
【0051】
いくつかの態様では、がん治療は、化学療法剤であり得る。化学療法剤の非限定的な例としては、アムサクリン、アザシチジン、アキサチオプリン、ベバシズマブ(又はその抗原結合断片)、ブレオマイシン、ブスルファン、カルボプラチン、カペシタビン、クロラムブシル、シスプラチン、シクロホスファミド、シタラビン、ダカルバジン、ダウノルビシン、ドセタキセル、ドキシフルリジン、ドキソルビシン、エピルビシン、エルロチニブ塩酸化物、エトポシド、フィウダラビン、フロキシウリジン、フルダラビン、フルオロウシル、ゲムシタビン、ヒドロキシ尿素、イダルビシン、イホスファミド、イリノテカン、ロムスチン、メクロレタミン、メルファラン、メルカプトプリン、メトトレキサート、マイトマイシン、ミトキサントロン、オキサリプラチン、パクリタキセル、ペメトレキセド、プロカルバジン、オールトランスレチノイン酸、ストレプトゾシン、タフルポシド、テモゾロミド、テニポシド、チオグアニン、トポテカン、ウラムスチン、バルルビシン、ビンブラスチン、ビンクリスチン、ビンデシン、ビノレルビン、及びそれらの組み合わせが挙げられる。抗がん療法の更なる例は、当該技術分野において知られており、例えば、米国臨床腫瘍学会(American Society of Clinical Oncology、ASCO)、欧州臨床腫瘍学会(European Society for Medical Oncology、ESMO)、又は全米総合がん情報ネットワーク(National Comprehensive Cancer Network、NCCN)からの療法のためのガイドラインを参照されたい。
【0052】
本明細書に記載されるように、がんを有する対象、又はがんを有する疑いのある対象をモニタリングする際、モニタリングすることは、がん治療の過程の前、中、及び/又は後であり得る。本明細書に提供されるモニタリングする方法を使用して、1つ以上のがん治療の有効性を判定すること、及び/又はモニタリングの増強のために対象を選択することができる。いくつかの態様では、モニタリングすることは、対象から得られた試料におけるcfDNA断片サイズ密度曲線の形状を分析することを含むことができる。例えば、がんを有する、又はがんの疑いのある若しくはがんを有する対象に、1つ以上のがん治療を施す前に、cfDNA断片サイズ密度曲線の形状を得ることができ、1つ以上のがん治療を対象に施すことができ、がん治療の過程中に、1つ以上のcfDNA断片サイズ密度曲線を得ることができる。いくつかの態様では、cfDNA断片サイズ密度曲線の形状は、がん治療(例えば、本明細書に記載のがん治療のいずれか)の過程中に変化し得る。例えば、対象ががんを有することを示しているcfDNA断片サイズ密度曲線の形状は、対象ががんを有しないことを示しているcfDNA断片サイズ密度曲線の形状に変化し得る。
【0053】
いくつかの態様では、モニタリングすることは、1つ以上のがん治療(例えば、1つ以上のがん治療の有効性)をモニタリングすることができる従来の技術を含むことができる。いくつかの態様では、モニタリングの増強のために選択された対象には、モニタリングの増強のために選択されていない対象と比較して増加した頻度で、診断テスト(例えば、本明細書に開示された診断テストのいずれか)を投与することができる。例えば、モニタリングの増強のために選択された対象には、1日2回、毎日、隔週、毎週、隔月、毎月、四半期ごと、半年ごと、毎年、又はそのいずれかの頻度で、診断テストを投与することができる。
【0054】
様々な態様において、DNAは、対象から採取し、本発明の方法論で使用する生物学的試料中に存在する。生物学的試料は、DNAを含む実質的に任意の種類の生物学的試料であり得る。生物学的試料は、典型的に、循環cfDNAを含む全血又はその一部などの流体である。実施形態では、試料としては、腫瘍又は液体生検、例えば、限定されないが、羊水、房水、硝子体液、血液、全血、分画された血液、血漿、血清、母乳、脳脊髄液(CSF)、耳垢(cerumen)(耳垢(earwax))、乳糜、チャイム(chime)、内リンパ、外リンパ、糞便、呼吸、胃酸、胃液、リンパ、粘液(鼻漏及び痰(phlegm)を含む)、心膜液、腹腔液、胸膜液、膿、カタル性分泌物、唾液、呼気凝縮液、皮脂、精液、痰(sputum)、汗(sweat)、滑液、涙、嘔吐物、前立腺液、乳頭吸引液、涙液、汗(perspiration)、口腔粘膜スワブ、細胞溶解液、胃腸液、生検組織、並びに尿又は他の生体液からのDNAが挙げられる。一態様では、試料は、循環腫瘍細胞からのDNAを含む。
【0055】
上に開示されるように、生物学的試料は、血液試料であり得る。血液試料は、当該技術分野で知られている方法、例えば、指先採取(finger prick)又は静脈切開術(phlebotomy)を使用して得ることができる。好適には、血液試料は、約0.1~20ml、又は代替的に約1~15mlであり、血液量は約10mlである。少量を使用してもよく、また血液中で遊離DNAを循環させてもよい。針生検、カテーテル、排泄、又はDNAを含有する体液の産生によるマイクロサンプリング及びサンプリングもまた、潜在的な生物学的試料源である。
【0056】
本開示の方法及びシステムは、核酸配列情報を利用し、したがって、核酸増幅、ポリメラーゼ連鎖反応(PCR)、ナノポア配列決定、454配列決定、挿入タグ付け配列決定(insertion tagged sequencing)を含む核酸配列決定を実行するためのあらゆる方法又は配列決定装置を含むことができる。いくつかの態様では、本開示の方法論又はシステムは、Illumina,Inc(HiSeq(商標)X10、HiSeq(商標)1000、HiSeq(商標)2000、HiSeq(商標)2500、Genome Analyzers(商標)、MiSeq(商標)、NextSeq、NovaSeq6000システムを含むがこれらに限定されない)、Applied Biosystems Life Technologies(SOLiD(商標)System、Ion PGM(商標)Sequencer、ion Proton(商標)Sequencer)、又はGenapsys、又はBGI MGIによって提供されるシステム及び他のシステムなどのシステムを利用する。核酸分析は、Oxford Nanopore Technologies(GridiON(商標)、MiniON(商標))又はPacific Biosciences(Pacbio(商標)RS II若しくはSequel I又はII)によって提供されるシステムによって実施できる。
【0057】
本発明は、開示される方法の工程を実行するためのシステムを含み、部分的には、機能的成分及び様々な処理工程の観点から説明される。そのような機能的成分及び処理工程は、指定された機能を実行し、様々な結果を達成するように構成された任意の数の成分、動作及び技術によって実現され得る。例えば、本発明は、様々な生物学的試料、バイオマーカー、要素、材料、コンピュータ、データソース、記憶システム及び媒体、情報収集技術及びプロセス、データ処理基準、統計分析、回帰分析などを用いてもよく、これらは様々な機能を実施し得る。
【0058】
したがって、本発明は、がんを検出、分析、及び/又は評価するためのシステムを更に提供する。様々な態様において、本システムは、(a)試料についての低カバレッジの全ゲノム配列決定データセットを生成するように構成されているシーケンサーと、(b)本発明の方法を実行するための機能を有するコンピュータシステム及び/又はプロセッサと、を備える。
【0059】
特定の態様では、コンピュータシステムは、以下のうちの1つ以上を実行するための命令を含む、非一時的コンピュータ可読媒体を有する。(i)低カバレッジの全ゲノム配列決定データセットを処理して、試料の断片サイズ密度曲線を生成すること、(ii)試料の断片サイズ密度曲線を、少なくとも2つの異なる確立された統計パラメータセットに適合させて、少なくとも2つの推奨曲線適合を生成すること、(iii)少なくとも2つの推奨曲線適合を表示して、更なる処理のために少なくとも2つの推奨曲線適合のうちの少なくとも1つをユーザが選択することを可能にすること、及び(iv)(iii)の選択された推奨曲線適合に対応する推奨曲線適合線を参照曲線適合線とともに表示して、選択された推奨曲線適合線と参照曲線適合線との比較を可能にすること。
【0060】
いくつかの態様では、コンピュータシステムは、ゲノムの1つ以上の染色体アームについて、長さが約260bp~440bpの断片の数を決定し、アーム当たりのジヌクレオソーム断片の割合を算出するための命令を含む、非一時的コンピュータ可読媒体を有する。いくつかの態様では、コンピュータシステムは、ゲノムの1つ以上の染色体アームについて、長さが約260bp~440bpの断片の数を決定し、アーム当たりのジヌクレオソーム断片の割合を算出し、各染色体アーム中のジヌクレオソーム断片の数を算出するための命令を含む、非一時的コンピュータ可読媒体を有する。いくつかの態様では、コンピュータシステムは、ゲノムの1つ以上の染色体アームについて、長さが約260bp~440bpの断片の数を決定し、アーム当たりのジヌクレオソーム断片の割合を算出し、各染色体アームにおけるジヌクレオソーム断片の数を算出し、断片サイズ密度曲線を生成するための命令を含む、非一時的コンピュータ可読媒体を有する。
【0061】
いくつかの態様では、コンピュータシステムは、1つ以上の追加のモジュールを更に備える。例えば、本システムは、曲線適合分析に好適な成分を選択するように動作可能な抽出ユニット、正規分布の有限混合の適合を実行するか又は多項式回帰適合を実行する(ユーザ定義の式の使用による)ように動作可能な曲線適合ユニット、曲線適合ユニットによって生成された適合品質の指標を提供するように動作可能な曲線適合度(fitting goodness)分析ユニット、基準値と比較して曲線適合パラメータを分類するように動作可能な曲線適合パラメータ特性評価ユニット、適合係数及びそれらの特性評価を記憶するための特性評価データベース、又はそれらの任意の組み合わせのうちの1つ以上を備え得る。
【0062】
いくつかの態様では、コンピュータシステムは、視覚表示装置を更に備える。視覚表示装置は、曲線適合線、参照曲線適合線、及び/又は両方の比較を表示するように動作可能であり得る。
【0063】
本発明の様々な態様による検出及び分析のための方法は、例えば、コンピュータシステム上で動作するコンピュータプログラムを使用して、任意の好適な方法で実施され得る。本明細書で考察されるように、本発明の様々な態様による例示的なシステムは、コンピュータシステム、例えば、プロセッサと、ランダムアクセスメモリと、を備える従来のコンピュータシステム(リモートアクセス可能なアプリケーションサーバ、ネットワークサーバ、パーソナルコンピュータ又はワークステーションなど)と併せて実装され得る。コンピュータシステムはまた、好適には、追加のメモリ装置又は情報記憶システム(大容量記憶システムなど)及びユーザインターフェース(例えば、従来のモニタ、キーボード及び追跡装置)を備える。しかしながら、コンピュータシステムは、任意の好適なコンピュータシステム及び関連する装置を備え得、任意の好適な様式で構成され得る。一実施形態では、コンピュータシステムは、スタンドアロンシステムを備える。別の実施形態では、コンピュータシステムは、サーバと、データベースと、を備えるコンピュータのネットワークの一部である。
【0064】
情報の受信、処理、及び分析に必要なソフトウェアは、単一の装置に実装され得るか、又は複数の装置に実装され得る。ソフトウェアは、情報の記憶及び処理がユーザに関してリモートで行われるように、ネットワークを介してアクセスされ得る。本発明の様々な態様によるシステム及びその様々な要素は、データの収集、処理、分析、報告及び/又は診断などの検出及び/又は分析を容易にする機能及び動作を提供する。例えば、本態様では、コンピュータシステムは、ヒトゲノム又はその領域に関連する情報を受信、記憶、検索、分析、及び報告し得るコンピュータプログラムを実行する。コンピュータプログラムは、生データを処理し、補足データを生成するための処理モジュール、並びに生データ及び補足データを分析して、疾患状態モデル及び/又は診断情報の定量的評価を生成するための分析モジュールなど、様々な機能又は操作を実行する複数のモジュールを備え得る。
【0065】
システムによって実行される手順は、分析及び/又はがん診断を容易にするための任意の好適なプロセスを含み得る。一実施形態では、本システムは、疾患状態モデルを確立する、及び/又は患者における疾患状態を判定するように構成される。疾患状態の判定又は特定は、診断の実行、診断に役立つ情報の提供、疾患の病期若しくは進行の評価、疾患の感受性を示す可能性のある状態の特定、更なる試験を推奨してもよいかどうかの特定、1つ以上の治療プログラムの有効性の予測及び/若しくは評価、又はそうでなければ患者の疾患状態、疾患の可能性、若しくは他の健康面の評価など、疾患に対する患者の状態に関する任意の有用な情報を生成することを含み得る。
【0066】
以下の実施例は、本発明の利点及び特徴を更に例示するために提供されるが、本発明の範囲を限定することを意図するものではない。この実施例は、使用してもよい実施例の典型であるが、当業者に既知の他の手順、方法又は技術を代替的に使用してもよい。
【実施例
【0067】
実施例1
がんの検出
この実施例では、本開示の方法論を、がんを検出するために利用した。以下では、がんの検出に使用される方法論及びプロセスについて詳細に考察する。207名のがんを有する個体及び214名のがんを有しない個体からなるドナーから収集された421個の血漿試料からの全ゲノムデータを使用して、ヌクレオソーム再配置に関連する方法で断片サイズ密度の形状がどのように算出されるかを実証する。更に、単独で及び他の開発されたアプローチと併せてがんの状態を予測するためにどのように結果を使用するかを示す。
【0068】
断片サイズ密度の形状を要約するために使用される2つの方法論が、本明細書で先に説明され、以下のようにより詳細に説明される。
【0069】
第1の方法(多項式回帰法)では、試料によって別々に適合する所与の長さの断片のカウント数に適合する多項式回帰の係数を使用した。サイズが105bpより小さい断片及び170bpより大きい断片は、断片のカウント数が少なく、かつ、モードがあまり顕著ではなく、多項式回帰では容易には捉えられないために除外した。詳細には、サイズNの断片のカウント数を、平均が0及び分散が1となるように、試料によって標準化した。この回帰への入力として、断片サイズの1~12次の直交多項式があった。したがって、各回帰モデルについて、入力はサイズ66×12の行列であり、出力はスケーリングされたカウント数である。各多項式回帰モデルから係数を抽出する。多項式回帰モデルは、断片サイズ密度の形状を明示的に捉え、ヌクレオソームの摺動及びDNAループの寄与を暗黙的にモデリングする。
【0070】
第2の方法(ベイズ有限混合モデル)では、切断正規分布の有限混合を断片サイズのカウント数に適合させた。105bpより小さい断片サイズ及び220bpより大きい断片サイズは、その範囲外のDNA断片のカウント数が少ないために除外した。分布の上昇側には、モードに対応する7つの成分が見られる。成分のうちの3つは、下降側に見られる成分に対応する。1つの成分は、塩基全体を特徴付け、試料の98.33%中の混合物の50%超を構成する。最後の成分は、断片サイズ密度の下降側に見られるスキューを捉える。各成分は、平均がより大きい成分の分散の過小評価を防ぐために、220bpで切断されている。これらの成分の各々は、平均、分散及び混合全体への寄与によって特性評価される。交換不可能で適度に有益な事前分布は、混合の平均及び分散に関するものとし、あまり有益でないディリクレ事前分布は、混合割合に関するものとした。このモデルは、2,000個の試料(1,000個のウォームアップ試料)を用いて、No-U-Turn-Sampler(Hoffman,Matthew D.,and Andrew Gelman.2014.“The No-U-Turn Sampler:Adaptively Setting Path Lengths in Hamiltonian Monte Carlo.”J.Mach.Learn.Res.15(1):1593-1623.)を使用して、試料ごとに適合させる。収束は、全てのパラメータの多変量潜在的スケール縮小係数が1.1以下であることを確認することによって評価する(Gelman,Andrew,and Donald B.Rubin.1992.“Inference from Iterative Simulation Using Multiple Sequences.”Statistical Science7(4):457-72.https://doi.org/10.1214/ss/1177011136)。モデルはまた、変分推論(Variational Inference)を使用して適合させてもよい。
【0071】
結果
図2に見られるように、多項式モデルは断片サイズ密度の形状のニュアンスのうちの一部を捉えるが、混合モデルは断片サイズ密度の形状にほぼ正確に適合する。重要なことに、図3は、混合モデルの解釈可能性を示し、根底にあるDNA-ヌクレオソーム相互作用との関係をより明確にする。
【0072】
断片サイズ密度の形状は、DNA-ヌクレオソーム相互作用ダイナミクスを反映し得ると考えられる。Lequieu et al.(Lequieu,Joshua,David C.Schwartz,and Juan J.de Pablo.2017.“In Silico Evidence for Sequence-Dependent Nucleosome Sliding.”Proceedings of the National Academy of Sciences114(44):E9197-E9205.https://doi.org/10.1073/pnas.1705685114)は、ヌクレオソームがゲノム内で再配置される様々な方法を説明している。特に、Lequieuらは、「ヌクレオソームの一方の側に導入され、その後、シャクトリムシのように(in an inchworm-like manner)ヒストンコアに沿って移動する」DNAループを説明するための分子モデルを開発する。Lequieuらは、これらのDNAループの位置が「DNA配列に感受性がない」ことを見出し、それらの分子モデルに基づいて、ヒストン上の位置によるDNAループの密度プロットを図6で実証する。この密度プロットは、図2に示される我々の密度の形状の多くを反映する。注目すべきことに、両方の密度は、同様の小さなモードのパターンを示す。これらループの導入により、エンドヌクレアーゼ酵素がリンカーヒストン内部のヌクレオソームDNAを切断する機会が得られる場合がある。例えば、ヌクレオソームDNAの末端にあるDNAループは、167bpよりわずかに短い断片の作製を可能にし得る。ヒストンに沿ってループが「少しずつ動く(inches)」ほど、得られる切断断片は短くなる。更に、DNAループによって再配置されているヌクレオソームは、リンカーヒストンで切断され得、167bpよりも長いcfDNA断片として現れ得る。
【0073】
Lequieu et al.に記載されている説明に基づいて、混合モデル内の成分の多くは、DNAループの位置及び安定性によって駆動され得る。この理解では、周期性及び断片サイズのカウント数が、DNAループのこれらの特徴を捉えることはできない。DNAループは、所与の試料におけるヒストン上の特定の位置でより頻度が高くなり得る。これは、混合割合に反映されるであろう。加えて、ループの安定性は、成分の分散を反映している可能性がある。
【0074】
ドナーのがんの状態を予測する混合モデルパラメータの能力を評価するために、係数を、Cristiano et al.,(Cristiano,Stephen,Alessandro Leal,Jillian Phallen,Jacob Fiksel,Vilmos Adleff,Daniel C.Bruhm,Sarah Ostrup Jensen,et al.2019.“Genome-Wide Cell-Free DNA Fragmentation in Patients with Cancer.”Nature570(7761):385-89.https://doi.org/10.1038/s41586-019-1272-6.)で説明されているのと同じアプローチで、機械学習モデルの特徴として使用した。要するに、ハイパーパラメータチューニングを行わない勾配ブースティングマシン(Gradient Boosting Machine)(Friedman,Jerome H.2000.“Greedy Function Approximation:A Gradient Boosting Machine.”Annals of Statistics29:1189-1232)の10分割10回反復交差検証を使用した。以下の特徴を使用した。
【0075】
1)混合モデル係数:12の平均、12の分散、及び12の混合割合で、混合モデルは十分に説明される。モデリングでは、他の11の割合の線形結合であるため、12番目の割合を除外する。35の特徴は、未変換であった。
【0076】
2)短/長比:Cristiano et al.と同様に、ゲノムにわたる504個の相互に排他的な5MBビンにおけるGC含有量補正短(100~150bp)及び長(151~220bp)断片の数を算出し、試料によって中心化された、短断片のカウント数を長断片のカウント数で割った。
【0077】
3)短/総カバレッジ:この比と同様に、短断片(100~150bp)及び総断片(100~220bp)のカバレッジを特徴として使用した。これらのカバレッジは、試料及び種類(短断片、総断片)によって、平均が0及び標準偏差が1になるように標準化する。
【0078】
これら3つの特徴セットを、GBMへの入力として個別に使用し、また、混合モデル係数と(2)及び(3)との組み合わせも使用した。表1に、95%及び98%の特異度でのROC曲線下面積(AUC)及び感度として、結果を報告する。
【0079】
(表1)がん検出の交差検証結果
【0080】
表1に示されるように、混合モデル係数のAUCは、がんの状態の強い予測因子を示す。高い特異度での感度が、早期がん検出のための有用性をより示している。混合モデル係数は、カバレッジパラメータよりも感度がわずかに低いが、2つを組み合わせると、AUC及び感度の両方の改善が示される。特徴の組み合わせの結果は、この断片サイズ密度の新規な要約が、がんの状態を判定するために他のゲノム特徴をどのように補完することができるかを実証する。
【0081】
図4には、これら5つのモデルのROC曲線をプロットした。これらの曲線は、特徴としての混合係数の特異度が高くても、また混合特徴とカバレッジ特徴とを組み合わせても感度が高いことを実証する。参照線は、95%及び98%の特異度を示す。
【0082】
実施例2
ジヌクレオソーム断片サイズ密度を用いたがんの検出
この実施例では、本開示の方法論を、がんを検出するために利用した。本明細書で考察されるように、ctDNA断片は、非腫瘍細胞由来の他のcfDNAよりも平均して短いことが示されている。これまでの研究では、異なるサイズ(例えば、短いもの及び長いもの、又は相互に排他的なサイズのセット)の断片をグループに分けること、これらのビンのカウント数を使用してctDNAを定量すること、及び/又は個々の試料を腫瘍が存在するもの/存在しないものに分類することが探索されてきた。
【0083】
本明細書で実証されるように、断片サイズ密度を分布の混合としてモデリングし得、そのパラメータはがんの状態を予測するものであり得る。これらのアプローチは全て、単一のヌクレオソームのサイズ(サイズが260bp未満)に密接に対応する断片サイズに焦点を当てている。これらは典型的には、147bpのDNAが巻き付いたヒストンオクトマーを含み)、H1ヒストン及びリンカーDNA(20bp)とともに、167bpサイズの主要なピークが観察される。
【0084】
本実施例に記載される研究は、334bpの中央値でピークをもたらす2つのヌクレオソームを含む可能性が高い低カバレッジの全ゲノム配列決定(1~2倍のカバレッジ)からの260bp未満のcfDNA断片の分析に焦点を当てている。
【0085】
方法
各試料について、断片の数は、各染色体アーム(末端動原体型染色体アームを除く)について260bp~440bpの塩基対によって決定する。アーム当たりのジヌクレオソーム断片の幅当たりの割合を算出した。所与のアームにおける全181個の断片サイズにわたるこれらの比は、合計で1である。この181個の割合のセットは、ジヌクレオソーム断片サイズ密度として定義される。各試料は、非末端動原体型染色体アームによって算出された39セットのジヌクレオソーム断片サイズ密度を有する。
【0086】
購入された排他的にがんを含まない48個の試料のセットにおいて、これらの断片サイズ密度を各アームについて算出し、39個の参照断片サイズ密度を表すように全ての試料にわたって集計した。
【0087】
データセット内の各試料について、所与の試料/アームと参照との類似性を、経験的試料/アームと参照/アームとの間のカルバック・ライブラー情報量を算出することによって決定した。更に、各染色体アームにおけるジヌクレオソーム断片の数を算出した。
【0088】
ドナーのがんの状態を予測するこれらジヌクレオソームパラメータの能力を評価するために、本発明者らは、Cristiano et al.((Cristiano et al.2019.“Genome-wide cell-free DNA fragmentation in patients with cancer.”Nature 570(7761):385-389)に記載されているのと同じアプローチを使用して、パラメータを機械学習モデルの特徴として使用する。要するに、ハイパーパラメータチューニングを行わない勾配ブースティングマシン(Gradient Boosting Machine)(Friedman,Jerome H.2000.“Greedy Function Approximation:A Gradient Boosting Machine.”Annals of Statistics29:1189-1232)の10分割10回反復交差検証を使用する。以下の特徴セットを使用した。
【0089】
1)ジヌクレオソーム:本発明者らは、各試料/アームのサイズ割合と参照との間のカルバック・ライブラー情報量を算出した。アーム当たりのジヌクレオソームリード(260bp~440bp)の数も決定した。
【0090】
2)短/総カバレッジ:Cristiano et al.(2019)と同様に、本発明者らは、ゲノムにわたる504個の相互に排他的な5MBビン中のGC含有量補正短(100~150bp)及び総(100~220bp)断片の数を算出した。これらのカバレッジは、試料及び種類(短断片、総断片)によって、平均が0及び標準偏差が1になるように標準化する。
【0091】
これら2つの特徴セットを、GBMへの入力として個別に使用し、これら2つの特徴の組み合わせも使用した。以下の表2に、95%及び98%の特異度でのROC曲線下面積(AUC)及び感度として、結果を報告する。
【0092】
結果
図5において、DNAリード量によって正規化されたがんを有する個体及びがんを有しない個体による平均断片サイズ密度を260bp~440bpの間でプロットする。
【0093】
図5に見られるように、平均して、がんを含まない個体は、ジヌクレオソーム範囲でより長いcfDNA断片(平均サイズ:334.75bp)を有するのに対し、がん患者は、より短いcfDNA断片(平均サイズ:329.6bp)を有することが明らかである。いくつかの研究は、単ヌクレオソームcfDNAに焦点を当てており、がんを有する個体における平均260bp未満のcfDNA断片が、がんを有しない個体よりも短いことを示している。しかしながら、これらの取り組みでは、がん患者又は健常な個体におけるジヌクレオソームcfDNAのサイズ分布(260bp未満のサイズ)は評価されなかった。
【0094】
本発明者らは、334bpのピークが、ジヌクレオソーム、すなわちH1とリンカーDNAとが結合した2つの隣接するヌクレオソームを表し、各々が167bpのDNAを包含すると予想する。典型的には、ヌクレオソーム間に追加のリンカーDNAが存在することを考えると、この仮説を支持するためには、一方又は両方のヌクレオソームの再配置が必要となる。1つの研究は、原子間力顕微鏡(ATM)を使用して、ヌクレオソームが、図6に示されるように、RSC(クロマチン構造リモデリング)複合体によってそのような方法で再配置され得ることを実証した。特定された5つの状態のうち、最も安定な状態(#4)のうちの1つは、裸のDNAの末端に直接隣接するヌクレオソームを表し、切断は、この構成の5′及び3′末端で生じ得る。リモデリングは、DNAの長さとは無関係である。
【0095】
ATMを用いて観察されたヌクレオソーム構成に基づいて、データ内でより低い頻度(260bp~334bpの間)で観察されたより小型のctDNA断片は、ヌクレオソームの片側での切断、及び隣接するヌクレオソームまでの異なる位置での介在リンカーDNAの更なるエンドヌクレアーゼ消化を表し得る(図7;状態2又は5)。より大型の断片(334bp~440bp)は、2つの隣接するモノヌクレオソームの外側のリンカーDNAに作用するエンドヌクレアーゼから生じ得る(図7;状態1、3又は4)。
【0096】
この複合体は、高度に発現された遺伝子で濃縮されるため、ジヌクレオソーム形成は、RSCとのそれらの結合に基づいてプロモーター領域に連結され得る。酵母モデルを使用するデータはまた、RSCによるヌクレオソームのスライド化、DNAの解明、及び経路に沿ったヒストンオクタマーの排出のモデルに適合するプロモーター活性化時に、ヌクレオソームのうちの1つを除く全てが除去され、プロセスの終了時にRSCに結合した単一ヌクレオソームのみが残ることを実証した。RSCレベルが欠失した酵母モデルにおいてChIP-Seqを使用した追加のデータは、転写開始部位(TSS)の上流及び下流のヒストンが増加したことを示した。まとめると、これらのデータは、NDR(ヌクレオソーム欠失領域)内でのヌクレオソーム除去及び転写調節時のRSC介在性再配置を含む。
【0097】
図8において、各試料についての染色体アーム1pにおけるジヌクレオソーム断片サイズ密度を青色で、各試料種類についての断片サイズ密度中央値を黒色で、及び参照をオレンジ色でプロットする。図8から、ステージ4のがんからの試料は、ステージ1~3の試料よりも参照との類似性が低いことが明らかである。特に、ステージ4ではステージ1~3のがんと比較して、かつ、ステージ1~3のがんではがんを有しない場合と比較して、ジヌクレオソーム断片サイズ密度がより歪み、断片全体がより短くなることが明らかである。
【0098】
表2は、無細胞DNAから抽出されたこの新規なゲノム特徴を使用して、がんを有する個体をがんを有しない個体から区別する機械学習モデルの能力を例示する。ジヌクレオソーム係数を用いた機械学習モデルのAUCは、がんの状態の強い予測因子を示す。高い特異度での感度が、早期がん検出のための有用性をより示している。2つの特徴を組み合わせると、最良の特徴と同等か、それよりも良好なAUC及び感度が示される。特徴の組み合わせの結果は、この断片サイズ密度の新規な要約が、がんの状態を判定するために他のゲノム特徴をどのように補完することができるかを実証する。
【0099】
(表2)アーム当たりのジヌクレオソーム参照からのダイバージェンスを使用したがん検出の交差検証結果
【0100】
図9は、これら3つのモデルのROC曲線を示す。これらの曲線は、特徴としてのジヌクレオソーム係数の特異度が高くても、またジヌクレオソーム特徴とカバレッジ特徴とを組み合わせても感度が高いことを実証する。参照線は、90%、95%及び98%の特異度を示す。
【0101】
本発明は、上記の実施例を参照して説明されているが、変更及び変形は、本発明の趣旨及び範囲内に包含されることが理解されよう。したがって、本発明は、以下の特許請求の範囲によってのみ限定される。
図1
図2
図3
図4
図5
図6
図7
図8
図9
【国際調査報告】