(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-06-21
(54)【発明の名称】相同組換え修復欠損の検出
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20230614BHJP
G16B 20/00 20190101ALI20230614BHJP
C12N 15/12 20060101ALN20230614BHJP
【FI】
C12Q1/6869 Z
G16B20/00
C12N15/12
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022568800
(86)(22)【出願日】2021-05-14
(85)【翻訳文提出日】2023-01-10
(86)【国際出願番号】 US2021032539
(87)【国際公開番号】W WO2021231921
(87)【国際公開日】2021-11-18
(32)【優先日】2020-05-14
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2020-06-19
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】515059083
【氏名又は名称】ガーダント ヘルス, インコーポレイテッド
(74)【代理人】
【識別番号】100078282
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】イェン, ジェニファー
(72)【発明者】
【氏名】ヘルマン, エレナ
(72)【発明者】
【氏名】ヤブロノビッチ, アリエル
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA12
4B063QA19
4B063QQ03
4B063QQ42
4B063QQ52
4B063QR08
4B063QR32
4B063QR35
4B063QR73
4B063QS25
4B063QS39
(57)【要約】
相同組換え欠損(HRD)スコアを生成する方法、参照HRDスコアを決定する方法、1つもしくは複数のがん型を有する試験対象のHRDステータスを決定する方法、および/またはHRDステータスに基づいて疾患を処置する方法が、本明細書で提供される。追加の方法、ならびに関連システム、装置、およびコンピュータ可読媒体も、提供される。本開示は、相同組換え修復欠損(HRD)スコアを生成する方法、および状態(例えば、がん)を有する試験対象のHRDステータスを決定する方法を提供する。
【特許請求の範囲】
【請求項1】
生体試料の配列データを決定するステップであって、前記生体試料が無細胞DNA(cfDNA)を含む、ステップ;
前記配列データに基づいて、カバレッジデータを決定するステップ;
前記カバレッジデータに基づいて、1つまたは複数の融合事象に関連する1つまたは複数の切断点を決定するステップ;
前記カバレッジデータに基づいて、1つまたは複数の遺伝子に関連する1つまたは複数の欠失を決定するステップ;
前記1つまたは複数の切断点および前記1つまたは複数の欠失に基づいて、相同組換え欠損(HRD)スコアを決定するステップ;および
前記HRDスコアに基づいて、前記生体試料をHRD陽性として分類するステップ
を含む方法。
【請求項2】
前記生体試料の配列データを決定するステップが、1つまたは複数のHRR遺伝子のパネルをシークエンシングすることを含む、請求項1に記載の方法。
【請求項3】
前記1つまたは複数のHRR遺伝子が、ATM、ATR、BARD1、BRCA1、BRCA2、BRIP1、CDK12、CHEK1、CHEK2、FANCA、FANCL、NBN、PALB2、RAD51、RAD51B、RAD51C、RAD51D、RAD54L、HDAC2、MRE11、PPP2R2A、XRCC5、WRN、MLH1、FANCC、BAP1、XRCC2、XRCC3、およびRAD50からなる群から選択される、請求項2に記載の方法。
【請求項4】
前記生体試料が、疾患を有する対象に関連付けられる、前記請求項いずれか一項に記載の方法。
【請求項5】
前記疾患が、がんである、請求項4に記載の方法。
【請求項6】
前記カバレッジデータが、複数のビンに関連付けられ、前記複数のビンが、染色体の領域を表す、前記請求項いずれか一項に記載の方法。
【請求項7】
前記カバレッジデータに基づいて、1つまたは複数の融合事象に関連する1つまたは複数の切断点を決定するステップが、
前記配列データからの複数の配列リードを参照配列にアラインすること;
複数の配列リードについての前記複数の配列リードの前記参照配列へのアラインメントで1つまたは複数の切断点を決定すること;
前記アラインメントで前記1つまたは複数の切断点に関連付けられる任意の配列リードを候補融合配列リードとして同定すること;
1つまたは複数の切断点のうちの共通の切断点に関連付けられる候補融合配列リードを決定すること;
1つまたは複数の共通の切断点に基づいて前記候補融合配列リードを群別化すること;
群内の前記候補融合配列リードをアセンブルして1つまたは複数のコンティグを生成すること;
複数の群のうちの前記群からの前記コンティグを前記参照配列にアラインすること;
前記群からの前記コンティグの前記アラインメントに基づいて、1つまたは複数の候補融合事象を決定すること;
前記1つまたは複数の候補融合事象に1つまたは複数の基準を適用すること;および
前記1つまたは複数の候補融合事象への前記1つまたは複数の基準の適用に基づいて、1つまたは複数の融合事象を決定すること
を含む、前記請求項いずれか一項に記載の方法。
【請求項8】
前記カバレッジデータに基づいて、1つまたは複数の遺伝子に関連する前記1つまたは複数の欠失を決定するステップが、前記カバレッジデータに基づいて、複数のセグメントを決定することを含み、前記複数のセグメントが、変化点により分離されている、前記請求項いずれか一項に記載の方法。
【請求項9】
前記複数のセグメントを決定することが、セグメンテーションアルゴリズムを適用することを含む、請求項8に記載の方法。
【請求項10】
前記セグメンテーションアルゴリズムが、循環バイナリセグメンテーションアルゴリズムを含む、請求項9に記載の方法。
【請求項11】
前記変化点が、基礎DNAコピー数が変化したことを前記カバレッジデータが示す位置に対応する、請求項8に記載の方法。
【請求項12】
前記1つまたは複数の欠失が、ホモ接合型欠失またはヘテロ接合性消失(LOH)欠失の1つまたは複数を含む、前記請求項いずれか一項に記載の方法。
【請求項13】
前記複数のセグメントを参照配列と比較して、少なくとも1つの欠失を含む前記複数のセグメントのサブセットを同定するステップ;
前記複数のセグメントの前記サブセットから、染色体の長さにわたる任意のセグメントを除去するステップ;
前記複数のセグメントの前記サブセットの中の、閾値距離以上離れていない任意のセグメントを組み合わせるステップ;
前記複数のセグメントの前記サブセットから、閾値長未満の長さを有する任意のセグメントを除去するステップ;および
前記複数のセグメントの前記サブセットから、技術的アーチファクトに関連する任意のセグメントを除去するステップ
をさらに含む、請求項8に記載の方法。
【請求項14】
前記複数のセグメントの前記サブセットの中の1つまたは複数の残存セグメントに基づいて、および前記1つまたは複数の融合事象に関連する前記1つまたは複数の切断点に基づいて、閾値内の隣接しているセグメント間の切断点の数を決定するステップをさらに含む、請求項13に記載の方法。
【請求項15】
前記複数のセグメントの前記サブセットの中の1つまたは複数の残存セグメントに基づいて、欠失される目的の領域の単一のコピーに関連する、または目的の領域の両方のコピーに関連する、セグメントの数を決定するステップをさらに含む、請求項13に記載の方法。
【請求項16】
前記1つまたは複数の切断点および前記1つまたは複数の欠失に基づいて、前記HRDスコアを決定するステップが、切断点の数およびセグメントの数を合計することを含む、請求項8に記載の方法。
【請求項17】
前記シークエンシングデータに基づいて、1つまたは複数のゲノム再編成の存在を決定するステップをさらに含む、前記請求項いずれか一項に記載の方法。
【請求項18】
前記HRDスコアを決定するステップが、前記1つまたは複数のゲノム再編成にさらに基づく、請求項17に記載の方法。
【請求項19】
前記HRDスコアを決定するステップが、切断点の数、セグメントの数、およびゲノム再編成の数を合計することを含む、請求項17に記載の方法。
【請求項20】
最大体細胞アレル割合(MSAF)を決定するステップをさらに含む、前記請求項いずれか一項に記載の方法。
【請求項21】
前記MSAFを決定するステップが、クローン性造血起源と注釈されない任意の体細胞バリアントであって、融合または非同義SNVまたはインデルである任意の体細胞バリアントを含む、前記生体試料中のバリアントの最大パーセンテージを、前記配列データに基づいて決定することをさらに含む、請求項20に記載の方法。
【請求項22】
前記配列データに含有されている1つまたは複数のバリアントを注釈するステップをさらに含む、前記請求項いずれか一項に記載の方法。
【請求項23】
前記配列データに含有されている1つまたは複数のバリアントを注釈するステップが、ヒトの健康への前記1つまたは複数のバリアントの影響に関連する臨床的有意性の注釈を決定することを含む、請求項22に記載の方法。
【請求項24】
前記配列データ、前記カバレッジデータ、前記1つまたは複数の切断点、前記1つまたは複数の欠失、および前記HRDスコアを集約するステップをさらに含む、前記請求項いずれか一項に記載の方法。
【請求項25】
集約された配列データ、カバレッジデータ、1つまたは複数の切断点、1つまたは複数の欠失、およびHRDスコアを出力するステップをさらに含む、請求項24に記載の方法。
【請求項26】
前記HRDスコアに基づいて、前記生体試料をHRD陽性として分類するステップが、前記HRDスコアが閾値を超えると決定することを含む、前記請求項いずれか一項に記載の方法。
【請求項27】
1つまたは複数の参照HRDスコアに基づいて前記閾値を決定することをさらに含む、請求項26に記載の方法。
【請求項28】
前記生体試料をHRD陽性として分類するステップに基づいて、療法を投与するステップをさらに含む、前記請求項いずれか一項に記載の方法。
【請求項29】
前記療法が、ポリADPリボースポリメラーゼ(PARP)阻害剤または塩基除去修復(BER)阻害剤である、請求項28に記載の方法。
【請求項30】
前記PARP阻害剤が、ベリパリブ、オラパリブ、タラゾパリブ、ルカパリブ、ニラパリブ、パミパリブ、CEP 9722、E7016、E7449、または3-アミノベンズアミドのうちの少なくとも1つである、請求項29に記載の方法。
【請求項31】
前記療法が、PARP阻害剤と放射線療法の組合せである、請求項28に記載の方法。
【請求項32】
コンピュータを少なくとも部分的に使用して相同組換え修復欠損(HRD)スコアを生成する方法であって、
1つまたは複数のがん型を有する1または複数の参照対象から得られた無細胞核酸(cfDNA)に由来する配列情報からの相同組換え修復(HRR)遺伝子のセットの中の1つまたは複数の遺伝子についての参照HRDスコアを前記コンピュータにより生成して、参照HRDスコアのセットを生じさせるステップであって、所与の参照HRDスコアが、所与のHRD核酸バリアントの保有率を含む、ステップ;および
参照HRDスコアの前記セットから参照HRDスコアを生成するステップ
を含む方法。
【請求項33】
前記1つまたは複数のがん型を有する試験対象から得られたcfDNAに由来する配列情報からのHRR遺伝子の前記セットの中の前記1つまたは複数の遺伝子についての試験HRDスコアを生成して、試験HRDスコアのセットを生じさせるステップであって、所与の試験HRDスコアが、前記所与のHRD核酸バリアントの保有率を含む、ステップ;
試験HRDスコアの前記セットから試験HRDスコアを生成するステップ;および
前記試験HRDスコアが前記参照HRDスコアを超えた場合に前記試験対象におけるHRDを検出するステップ
をさらに含む、請求項32に記載の方法。
【請求項34】
コンピュータを少なくとも部分的に使用して1つまたは複数のがん型を有する試験対象の相同組換え修復欠損(HRD)ステータスを決定する方法であって、
前記試験対象から得られた無細胞核酸(cfDNA)に由来する配列情報からの相同組換え修復(HRR)遺伝子のセットの中の1つまたは複数の遺伝子についての試験HRDスコアを生成して、試験HRDスコアのセットを生じさせるステップであって、所与の試験HRDスコアが、所与のHRD核酸バリアントの保有率を含む、ステップ;
試験HRDスコアの前記セットから試験HRDスコアを生成するステップ;および
前記試験HRDスコアを参照HRDスコアと比較するステップであって、前記参照HRDスコアより上である試験HRDスコアが、それらの試験HRDスコアがHRDを有する試験対象からのものであることを示し、前記参照HRDスコアであるかまたはそれ未満である試験HRDスコアが、それらの試験HRDスコアがHRDを欠いている試験対象からのものであることを示し、それによって、前記1つまたは複数のがん型を有する前記試験対象の前記HRDステータスを決定する、ステップ
を含む方法。
【請求項35】
1つまたは複数のがん型を有する1または複数の参照対象から得られた無細胞核酸(cfDNA)に由来する配列情報からの相同組換え修復(HRR)遺伝子のセットの中の1つまたは複数の遺伝子についての参照HRDスコアを前記コンピュータにより生成して、参照HRDスコアのセットを生じさせるステップであって、所与の参照HRDスコアが、所与のHRD核酸バリアントの保有率を含む、ステップ;および
参照HRDスコアの前記セットから参照HRDスコアを生成するステップ
をさらに含む、請求項34に記載の方法。
【請求項36】
コンピュータを少なくとも部分的に使用して対象における相同組換え修復欠損(HRD)の存在または非存在を検出する方法であって、前記対象から得られた無細胞核酸(cfDNA)に由来する相同組換え修復(HRR)遺伝子のセットの中の1つまたは複数の遺伝子に関連する配列情報における少なくとも1つのHRD核酸バリアントの存在または非存在を、(i)前記配列情報が第1の状態を含む第1の確率、および前記配列情報が第2の状態を含む第2の確率であって、前記第1または第2の状態が少なくとも第1のHRD核酸バリアントを含む、第1の確率および第2の確率、ならびに/または(ii)前記配列情報から生成された1つまたは複数のアラインされた連続する配列(コンティグ)であって、少なくとも第2のHRD核酸バリアントを含む前記アラインされたコンティグを使用して、前記コンピュータにより決定することによって、前記対象における前記HRDを検出するステップを含む、方法。
【請求項37】
疾患を処置する方法であって、前記疾患、および前記疾患に関連する相同組換え修復欠損(HRD)を有する対象に、1つまたは複数の療法を投与するステップを含み、前記対象から得られた無細胞核酸(cfDNA)に由来する相同組換え修復(HRR)遺伝子のセットの中の1つまたは複数の遺伝子に関連する配列情報における少なくとも1つのHRD核酸バリアントの存在または非存在を、(i)前記配列情報が第1の状態を含む第1の確率、および前記配列情報が第2の状態を含む第2の確率であって、前記第1または第2の状態が少なくとも第1のHRD核酸バリアントを含む、第1の確率および第2の確率、ならびに/または(ii)前記配列情報から生成された1つまたは複数のアラインされた連続する配列(コンティグ)であって、少なくとも第2のHRD核酸バリアントを含む前記アラインされたコンティグを使用して決定することにより、HRDが検出され、それによって前記疾患を処置する方法。
【請求項38】
前記第1のHRD核酸バリアントが、少なくとも1つのホモ接合型欠失、少なくとも1つのヘテロ接合性消失(LOH)バリアントおよび/または少なくとも1つのコピー数多様性(CNV)を含む、前記請求項いずれか一項に記載の方法。
【請求項39】
前記LOHバリアントが、少なくとも1つの遺伝子特異的LOHバリアント、コピー数変化を伴わない少なくとも1つのLOHバリアント、および/または少なくとも1つのLOHバリアントを含む、請求項38に記載の方法。
【請求項40】
前記第2のHRD核酸バリアントが、少なくとも1つの構造的再編成を含む、前記請求項いずれか一項に記載の方法。
【請求項41】
前記構造的再編成が、少なくとも1つの短縮再編成および/または少なくとも1つのマルチエクソン欠失を含む、請求項40に記載の方法。
【請求項42】
前記第1および/または第2のHRD核酸バリアントが、少なくとも1つの一塩基多様性(SNV)および/または少なくとも1つのインデルを含む、前記請求項いずれか一項に記載の方法。
【請求項43】
ステップ(i)および/または(ii)の技法が、前記配列情報のセグメントを少なくとも1つの参照配列にアラインすることを少なくとも含む、前記請求項いずれか一項に記載の方法。
【請求項44】
ステップ(i)~(ii)の1つだけを使用することを含む、前記請求項いずれか一項に記載の方法。
【請求項45】
ステップ(i)~(ii)の各々を使用することを含む、前記請求項いずれか一項に記載の方法。
【請求項46】
少なくとも1つの相同組換え修復(HRR)遺伝子が、前記HRD核酸バリアントを含む、前記請求項いずれか一項に記載の方法。
【請求項47】
前記HRR遺伝子が、ATM、ATR、BARD1、BRCA1、BRCA2、BRIP1、CDK12、CHEK1、CHEK2、FANCA、FANCL、NBN、PALB2、RAD51、RAD51B、RAD51C、RAD51D、RAD54L、HDAC2、MRE11、PPP2R2A、XRCC5、WRN、MLH1、FANCC、BAP1、XRCC2、XRCC3、およびRAD50からなる群から選択される、請求項46に記載の方法。
【請求項48】
HRR遺伝子の前記セットが、少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、またはそれより多くの遺伝子を含む、前記請求項いずれか一項に記載の方法。
【請求項49】
前記HRD核酸バリアントの1つまたは複数が、所与のHRR遺伝子の両アレル性不活性化を生じさせる、前記請求項いずれか一項に記載の方法。
【請求項50】
前記HRD核酸バリアントの1つまたは複数が、所与のHRR遺伝子の片アレル性不活性化を生じさせる、前記請求項いずれか一項に記載の方法。
【請求項51】
前記HRD核酸バリアントが、疾患を有する前記対象と相関する、前記請求項いずれか一項に記載の方法。
【請求項52】
前記対象が、疾患を有することが分かっていない、前記請求項いずれか一項に記載の方法。
【請求項53】
前記対象が、疾患を有することが分かっている、前記請求項いずれか一項に記載の方法。
【請求項54】
前記疾患が、がんである、前記請求項いずれか一項に記載の方法。
【請求項55】
前記疾患を処置するために前記対象に1つまたは複数の療法を投与するステップを含む、前記請求項いずれか一項に記載の方法。
【請求項56】
前記療法が、少なくとも1つのポリADPリボースポリメラーゼ(PARP)阻害剤を含む、前記請求項いずれか一項に記載の方法。
【請求項57】
前記療法が、少なくとも1つの塩基除去修復(BER)阻害剤を含む、前記請求項いずれか一項に記載の方法。
【請求項58】
ステップ(i)が、
前記配列情報が前記第1の状態を含む前記第1の確率を生成すること;
前記配列情報が前記第2の状態を含む前記第2の確率を生成すること;
前記第1の確率と前記第2の確率を比較すること;および
前記比較に基づいて、前記配列情報が、前記第1の状態を含むのか、または前記第2の状態を含むのかについての予測を生成すること
を含む、前記請求項いずれか一項に記載の方法。
【請求項59】
ステップ(i)が、
前記配列情報における少なくとも1つの遺伝子座位に関連する1つまたは複数の生殖細胞系列一塩基多型(SNP)位置に基づくアレル計数値の第1のモデルであって、少なくとも1つの体細胞ホモ接合型欠失を表す第1のモデルを、第1の確率分布によって生成すること;
前記配列情報における前記遺伝子座位に関連する前記1つまたは複数の生殖細胞系列SNP位置に基づくアレル計数値の第2のモデルであって、少なくとも1つの体細胞ヘテロ接合型欠失を表す第2のモデルを、第2の確率分布によって生成すること;
前記第1のモデルの第1の出力データと前記第2のモデルの第2の出力データを比較すること;および
前記比較に基づいて、前記遺伝子座位についての前記体細胞ホモ接合型欠失が前記配列情報に存在するという予測を生成すること
を含む、前記請求項いずれか一項に記載の方法。
【請求項60】
ステップ(i)が、
前記配列情報が体細胞ホモ接合型欠失を含む前記第1の確率を生成すること;
前記配列情報が体細胞ヘテロ接合型欠失を含む前記第2の確率を生成すること;
前記第1の確率と前記第2の確率を比較すること;および
前記比較に基づいて、前記配列情報が、前記体細胞ホモ接合型欠失を含むのか、または前記体細胞ヘテロ接合型欠失を含むのかについての予測を生成すること
を含む、前記請求項いずれか一項に記載の方法。
【請求項61】
ステップ(ii)が、
複数の配列リードを参照配列にアラインすること;
前記複数の配列リードの少なくとも1つの配列リードの前記参照配列へアラインメントで1つまたは複数の切断点を決定すること;
前記アラインメントで前記1つまたは複数の切断点に関連付けられる任意の配列リードを候補融合配列リードとして同定すること;
1つまたは複数の切断点のうちの共通の切断点に関連付けられる候補融合配列リードを決定すること;
1つまたは複数の共通の切断点に基づいて前記候補融合配列リードを群別化すること;
各群内の前記候補融合配列リードをアセンブルして1つまたは複数のコンティグを生成すること;
各群からの前記コンティグを参照配列にアラインすること;
各群からの前記コンティグの前記アラインメントに基づいて、1つまたは複数の候補融合事象を決定すること;
前記1つまたは複数の候補融合事象に1つまたは複数の基準を適用すること;および
前記1つまたは複数の候補融合事象への前記1つまたは複数の基準の適用に基づいて、前記第2のHRD核酸バリアントを含む1つまたは複数の融合事象を決定すること
を含む、前記請求項いずれか一項に記載の方法。
【請求項62】
CNVおよび/またはデノボ融合コーラーを使用して前記HRD、または前記対象における前記HRDを検出するステップを含む、前記請求項いずれか一項に記載の方法。
【請求項63】
遺伝子が、前記HRD核酸バリアントを含む、前記請求項いずれか一項に記載の方法。
【請求項64】
プロセッサーによる実行時に請求項1から31のいずれかに記載の方法を前記プロセッサーに行わせるプロセッサー実行可能命令を自体が記憶している、1つまたは複数の非一時的なコンピュータ可読媒体。
【請求項65】
請求項1から31のいずれかに記載の方法を行うように構成されたコンピュータデバイスと、
前記HRDスコアを出力するように構成された出力デバイスと
を含むシステム。
【請求項66】
1または複数台のプロセッサーと、
前記1または複数台のプロセッサーによる実行時に請求項1から31のいずれかに記載の方法を前記装置に行わせるプロセッサー実行可能命令を記憶しているメモリと
を含む装置。
【請求項67】
プロセッサーによる実行時に請求項32から33または38から63のいずれかに記載の方法を前記プロセッサーに行わせるプロセッサー実行可能命令を自体が記憶している、1つまたは複数の非一時的なコンピュータ可読媒体。
【請求項68】
請求項32から33または38から63のいずれかに記載の方法を行うように構成されたコンピュータデバイスと、
前記参照HRDスコアを出力するように構成された出力デバイスと
を含むシステム。
【請求項69】
1または複数台のプロセッサーと、
前記1または複数台のプロセッサーによる実行時に請求項32から33または38から63のいずれかに記載の方法を前記装置に行わせるプロセッサー実行可能命令を記憶しているメモリと
を含む装置。
【請求項70】
プロセッサーによる実行時に請求項34から35または38から63のいずれかに記載の方法を前記プロセッサーに行わせるプロセッサー実行可能命令を自体が記憶している、1つまたは複数の非一時的なコンピュータ可読媒体。
【請求項71】
請求項34から35または38から63のいずれかに記載の方法を行うように構成されたコンピュータデバイスと、
前記試験対象の前記HRDステータスを出力するように構成された出力デバイスと
を含むシステム。
【請求項72】
1または複数台のプロセッサーと、
前記1または複数台のプロセッサーによる実行時に請求項34から35または38から63のいずれかに記載の方法を前記装置に行わせるプロセッサー実行可能命令を記憶しているメモリと
を含む装置。
【請求項73】
プロセッサーによる実行時に請求項36または38から63のいずれかに記載の方法を前記プロセッサーに行わせるプロセッサー実行可能命令を自体が記憶している、1つまたは複数の非一時的なコンピュータ可読媒体。
【請求項74】
請求項36または38から63のいずれかに記載の方法を行うように構成されたコンピュータデバイスと、
前記対象におけるHRDの存在または非存在についての表示を出力するように構成された出力デバイスと
を含むシステム。
【請求項75】
1または複数台のプロセッサーと、
前記1または複数台のプロセッサーによる実行時に請求項36または38から63のいずれかに記載の方法を前記装置に行わせるプロセッサー実行可能命令を記憶しているメモリと
を含む装置。
【発明の詳細な説明】
【技術分野】
【0001】
関連特許出願の相互参照
本願は2020年6月19日に出願した米国仮特許出願第63/041,721号および2020年5月14日に出願した米国仮特許出願第63/025,126号に基づく優先権を主張するものであり、前記仮出願は、それらの全体が参照により本書に組み入れられる。
【背景技術】
【0002】
背景
ゲノムの安定性を維持するためにDNA損傷を修復するように機能する分子経路の複雑なネットワークがある。例えば、相同組換えDNA修復(HRR)は、細胞周期のSおよびG2期にDNAの二本鎖切断を修正するための経路として動作する[Lupo et al., "Inhibition of poly(ADP-ribosyl)ation in cancer: old and new paradigms revisited," Biochim Biophys Acta, 1846:201-15 (2014);Moschetta et al., "BRCA somatic mutations and epigenetic BRCA modifications in serous ovarian cancer," Ann Oncol.,27:1449-55 (2016)]。HRR欠損(HRD)と呼ばれる、HRR経路の障害は、ゲノムのヘテロ接合性消失(LOH)として公知の、染色体領域の喪失または重複をもたらし、腫瘍変異数およびネオアンチゲン率を増加させると考えられる[Solinas et al., "BRCA gene mutations do not shape the extent and organization of tumor infiltrating lymphocytes in triple negative breast cancer," Cancer Lett, 450:88-97 (2019)]。細胞がHRDを有する場合、非相同末端結合(NHEJ)などの他の修復経路が、損傷したDNAを修復するために使用され得る[Wang et al., "PARP-1 and Ku compete for repair of DNA double strand breaks by distinct NHEJ pathways," Nucleic Acids Res, 34:6170-82 (2006)]。NHEJは、HRRより誤りがちであり、多くの場合、さらなる変異の蓄積および染色体不安定性をもたらし、それによって腫瘍形成の尤度が高まる[Hoeijmakers, "Genome maintenance mechanisms for preventing cancer," Nature, 411:366-74 (2001)]。生殖細胞系列または体細胞HRDを有する患者は、DNA損傷応答(DDR)阻害剤、例えば、ポリ(ADP-リボース)ポリメラーゼ(PARP)阻害剤(PARPi)を含む、標的療法の候補者であり得る[Fong et al., "Poly(ADP)-ribose polymerase inhibition: frequent durable responses in BRCA carrier ovarian cancer correlating with platinum-free interval," J Clin Oncol, 28:2512-9 (2010);Audeh et al., "Oral poly(ADP-ribose) polymerase inhibitor olaparib in patients with BRCA1 or BRCA2 mutations and recurrent ovarian cancer: a proof-of-concept trial," Lancet, 376:245-51 (2010)]。
したがって、がんなどの疾患を診断するおよび/または疾患の処置の指針を得るために、特に無細胞核酸(cfDNA)試料から、患者におけるHRDを検出するまたは患者のHRDステータスを分類する必要がある。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】Lupo et al., "Inhibition of poly(ADP-ribosyl)ation in cancer: old and new paradigms revisited," Biochim Biophys Acta, 1846:201-15 (2014)
【非特許文献2】Moschetta et al., "BRCA somatic mutations and epigenetic BRCA modifications in serous ovarian cancer," Ann Oncol.,27:1449-55 (2016)
【非特許文献3】Solinas et al., "BRCA gene mutations do not shape the extent and organization of tumor infiltrating lymphocytes in triple negative breast cancer," Cancer Lett, 450:88-97 (2019)
【非特許文献4】Wang et al., "PARP-1 and Ku compete for repair of DNA double strand breaks by distinct NHEJ pathways," Nucleic Acids Res, 34:6170-82 (2006)
【非特許文献5】Hoeijmakers, "Genome maintenance mechanisms for preventing cancer," Nature, 411:366-74 (2001)
【非特許文献6】Fong et al., "Poly(ADP)-ribose polymerase inhibition: frequent durable responses in BRCA carrier ovarian cancer correlating with platinum-free interval," J Clin Oncol, 28:2512-9 (2010)
【非特許文献7】Audeh et al., "Oral poly(ADP-ribose) polymerase inhibitor olaparib in patients with BRCA1 or BRCA2 mutations and recurrent ovarian cancer: a proof-of-concept trial," Lancet, 376:245-51 (2010)
【発明の概要】
【課題を解決するための手段】
【0004】
要旨
本開示は、相同組換え修復欠損(HRD)スコアを生成する方法、および状態(例えば、がん)を有する試験対象のHRDステータスを決定する方法を提供する。開示される方法は、がん検出アッセイの感度および特異度を向上させ、ポリ(ADP-リボース)ポリメラーゼ(PARP)療法から恩恵を受ける可能性がある患者を同定する感度および特異度を向上させる。開示される方法は、処置戦略の指針を得るために使用することができる。追加の方法、ならびに関連システムおよびコンピュータ可読媒体も、提供される。
【0005】
ある実施形態では、少なくとも部分的にコンピュータを使用して相同組換え修復欠損(HRD)スコアを生成する方法であって、1つまたは複数のがん型を有する1または複数の参照対象から得られた無細胞核酸(cfDNA)に由来する配列情報からの相同組換え修復(HRR)遺伝子のセットの中の1つまたは複数の遺伝子についての参照HRDスコアをコンピュータにより生成して、参照HRDスコアのセットを生じさせるステップであって、所与の参照HRDスコアが、所与のHRD核酸バリアントの保有率を含む、ステップ;および参照HRDスコアのセットから参照HRDスコアを生成するステップを含む方法が、提供される。
【0006】
ある実施形態では、コンピュータを少なくとも部分的に使用して1つまたは複数のがん型を有する試験対象の相同組換え修復欠損(HRD)ステータスを決定する方法であって、試験対象から得られた無細胞核酸(cfDNA)に由来する配列情報からの相同組換え修復(HRR)遺伝子のセットの中の1つまたは複数の遺伝子についての試験HRDスコアを生成して、試験HRDスコアのセットを生じさせるステップであって、所与の試験HRDスコアが、所与のHRD核酸バリアントの保有率を含む、ステップ;試験HRDスコアのセットから試験HRDスコアを生成するステップ;および試験HRDスコアを参照HRDスコアと比較するステップであって、参照HRDスコアより上である試験HRDスコアが、それらの試験HRDスコアがHRDを有する試験対象からのものであることを示し、参照HRDスコアであるかまたはそれ未満である試験HRDスコアが、それらの試験HRDスコアがHRDを欠いている試験対象からのものであることを示し、それによって、1つまたは複数のがん型を有する試験対象のHRDステータスを決定する、ステップを含む方法が、提供される。
【0007】
ある実施形態では、コンピュータを少なくとも部分的に使用して対象における相同組換え修復欠損(HRD)の存在または非存在を検出する方法であって、対象から得られた無細胞核酸(cfDNA)に由来する相同組換え修復(HRR)遺伝子のセットの中の1つまたは複数の遺伝子に関連する配列情報における少なくとも1つのHRD核酸バリアントの存在または非存在を、(i)配列情報が第1の状態を含む第1の確率、および配列情報が第2の状態を含む第2の確率であって、第1または第2の状態が少なくとも第1のHRD核酸バリアントを含む、第1の確率および第2の確率、ならびに/または(ii)配列情報から生成された1つまたは複数のアラインされた連続する配列(コンティグ)であって、少なくとも第2のHRD核酸バリアントを含むアラインされたコンティグを使用して、コンピュータにより決定することによって、対象におけるHRDを検出するステップを含む方法が、提供される。
【0008】
ある実施形態では、疾患を処置する方法であって、疾患、および疾患に関連する相同組換え修復欠損(HRD)を有する対象に、1つまたは複数の療法を投与するステップを含み、対象から得られた無細胞核酸(cfDNA)に由来する相同組換え修復(HRR)遺伝子のセットの中の1つまたは複数の遺伝子に関連する配列情報における少なくとも1つのHRD核酸バリアントの存在または非存在を、(i)配列情報が第1の状態を含む第1の確率、および配列情報が第2の状態を含む第2の確率であって、第1または第2の状態が少なくとも第1のHRD核酸バリアントを含む、第1の確率および第2の確率、ならびに/または(ii)配列情報から生成された1つまたは複数のアラインされた連続する配列(コンティグ)であって、少なくとも第2のHRD核酸バリアントを含むアラインされたコンティグを使用して決定することにより、そのHRDが検出され、それによって疾患を処置する方法が、提供される。
【0009】
ある実施形態では、生体試料についての配列データを決定するステップを含む方法が、提供される。生体試料は、無細胞DNA(cfDNA)を含み得る。方法は、配列データに基づいて、カバレッジデータを決定するステップを含み得る。方法は、カバレッジデータに基づいて、1つまたは複数の融合事象に関連する1つまたは複数の切断点を決定するステップを含み得る。方法は、カバレッジデータに基づいて、1つまたは複数の遺伝子に関連する1つまたは複数の欠失を決定するステップを含み得る。方法は、1つまたは複数の切断点および1つまたは複数の欠失に基づいて、相同組換え欠損(HRD)スコアを決定するステップを含み得る。方法は、HRDスコアに基づいて、生体試料をHRD陽性として分類するステップを含み得る。
【0010】
ある実施形態では、生体試料についての配列データを決定するステップを含む方法が、提供される。生体試料は、無細胞DNA(cfDNA)を含み得る。方法は、配列データに基づいて、カバレッジデータを決定するステップを含み得る。方法は、カバレッジデータに基づいて、1つまたは複数の融合事象に関連する1つまたは複数の切断点を決定するステップを含み得る。方法は、カバレッジデータに基づいて、1つまたは複数の遺伝子に関連する1つまたは複数の欠失を決定するステップを含み得る。方法は、1つまたは複数の切断点および1つまたは複数の欠失に基づいて、相同組換え欠損(HRD)スコアを決定するステップを含み得る。方法は、HRDスコアに基づいて、生体試料をHRD陰性として分類するステップを含み得る。
【0011】
一部の実施形態では、開示される方法のいずれかにより決定されるようなHRDを有する対象に、標的療法が投与され得る。標的療法は、PARP阻害剤を含み得る。投与され得るPARP阻害剤の例としては、ベリパリブ、オラパリブ、タラゾパリブ、ルカパリブ、ニラパリブ、パミパリブ、CEP 9722(Cephalon)、E7016(Eisai)、E7449(Eisai、PARP 1/2およびタンキラーゼ1/2阻害剤)、または3-アミノベンズアミドのうちの1つまたは複数が挙げられる。一部の実施形態では、標的療法は、少なくとも1つの塩基除去修復(BER)阻害剤を含み得る。例えば、オラパリブは、BERを阻害し得る。ある特定の実施形態では、標的療法は、PARP阻害剤と放射線療法の組合せを含み得る。ある実施形態では、PARP阻害剤と放射線療法の組合せによって、PARP阻害剤が、腫瘍組織(例えば、BRCA1/BRCA2変異を有する組織)において放射線療法により生成される一本鎖切断からの二本鎖切断の形成をもたらすことが可能になる。この組合せは、1放射線線量あたりのより強力な療法を提供することができる。
【0012】
一部の実施形態では、本明細書で開示されるシステムおよび方法の結果は、レポートを生成するための入力データとして使用される。レポートは、紙または電子形式のものであり得る。例えば、対象がHRDスコアに従ってHRDを有するか否かの決定を、本明細書で開示される方法またはシステムによって決定された場合、そのようなレポートで直接表示することができる。
【0013】
本明細書で開示される方法の様々なステップ、または本明細書で開示されるシステムにより実行されるステップは、同じもしくは異なる時点で、同じもしくは異なる地理的位置、例えば国において、および/または同じもしくは異なる人物により、実行され得る。
【0014】
本出願に組み込まれ、その一部を構成する添付の図面は、ある特定の実施形態を例示し、本明細書の記載と共に、本明細書で開示される方法、コンピュータ可読媒体、およびシステムのある特定の原理を説明するように機能する。本明細書で提供される記載は、限定としてではなく例として含められる添付の図面と併せて読むと、より良く理解される。文脈が他を示さない限り、同様の参照数字は、これらの図面を通じて同様の構成要素を特定すると理解される。また、図面の一部または全ては、例示を目的とした概略表示であり得、示された要素の実際の相対的なサイズまたは位置を必ずしも示さないことが理解される。
【図面の簡単な説明】
【0015】
【
図1】
図1(パネルAおよびB)は、相同組換え修復(HRR)経路中に欠損を有する細胞が、増加したDNA損傷に対して脆弱であり、DNA損傷修復阻害剤(例えば、PARP阻害剤など)および/または他の療法に対する増加した感度を有することを概略的に示す図(Peng et al. Exploiting the homologous recombination DNA repair network for targeted cancer therapy. World J Clin Oncol 2011; 2(2): 73-79 [PMID: 21603316]から改変した)である。
【0016】
【
図2】
図2は、本開示のある実施形態に従うHRDスコアリングモジュールを含むシステムの一例を示す。
【0017】
【
図3】
図3は、本開示のある実施形態に従うHRDスコアリングモジュールの概略図を示す。
【0018】
【
図4】
図4は、本開示のある実施形態に従う融合コーラーの概略図を示す。
【0019】
【
図5】
図5は、本開示のある実施形態に従う欠失コーラーの概略図を示す。
【0020】
【
図6】
図6は、本開示のある実施形態に従う注釈モジュールの概略図を示す。
【0021】
【
図7】
図7は、本開示のある実施形態に従う復帰を決定するための方法の概略図を示す。
【0022】
【
図8】
図8は、本開示のある実施形態に従うHRDスコアリングのための方法の概略図を示す。
【0023】
【
図9】
図9は、がん型にわたる例となるHRDスコアのヒストグラムを示す。
【0024】
【
図10】
図10は、一部の実施形態に従う、相同組換えDNA修復欠損(HRD)スコアを生成する、および試験対象におけるHRDを検出する、例示的な方法ステップを概略的に示すフローチャートである。
【0025】
【
図11】
図11は、一部の実施形態に従う、所与のがん型を有する試験対象の相同組換えDNA修復欠損(HRD)ステータスを決定する例示的な方法ステップを概略的に示すフローチャートである。
【0026】
【
図12】
図12は、一部の実施形態に従う、対象における相同組換えDNA修復欠損(HRD)を検出する例示的な方法ステップを概略的に示すフローチャートである。
【0027】
【
図13】
図13は、一部の実施形態に従う、対象における疾患を処置する例示的な方法ステップを概略的に示すフローチャートである。
【0028】
【
図14】
図14は、一部の実施形態に従う、対象におけるDNA損傷修復欠損(DDRD)を検出する例示的な方法ステップを概略的に示すフローチャートである。
【0029】
【
図15】
図15(パネルA~C)は、HRR欠失および融合についてのGuardantOMNI(登録商標)RUOの検出限界(LoD)を示すデータのプロットである。パネルAは、ホモ接合型BRCA2欠失についてのLoDを示し、パネルBは、LOHについてのLoD2を示し、パネルCは、長いBRCA1欠失についてのLoDを示し、図中、y軸は、検出の確率をプロットし、x軸は、腫瘍割合(TF)をプロットする。
【0030】
【
図16】
図16は、前立腺がんコホートにおけるHRR変異のオンコプリント(oncoprint)である。
【0031】
【
図17】
図17(パネルA~C)は、前立腺コホートにおいて検出されたバリアントクラスごとのHRR変異の保有率のプロットである。
【発明を実施するための形態】
【0032】
定義
本開示をより容易に理解することができるように、ある特定の用語が最初に下で定義される。以下の用語および他の用語についてのさらなる定義は、本明細書を通じて示され得る。下で示される用語の定義が、参照により組み込まれる特許出願または交付済み特許における定義と矛盾する場合には、本願で示される定義を、用語の意味を理解するために使用されたい。
【0033】
本明細書および添付の特許請求の範囲で使用される場合、単数形「1つの(a)」、「1つの(an)」および「その(the)」は、文脈による別段の明白な指図がない限り、複数の言及対象を含む。したがって、例えば、「方法(a method)」への言及は、本明細書に記載されるタイプの、および/または本開示などを読むことで当業者には明らかになるタイプの、1つまたは複数の方法および/またはステップを含む。本明細で論じられる温度、濃度、時間、塩基または塩基対の数、カバレッジなどの前に暗黙の「約」があり、したがって、ほんのわずかな、非実質的な同等のものは、本開示の範囲内であることも、理解されるであろう。本願では、単数形の使用は、別段の具体的な記述がない限り複数形を含む。また、「含む(comprise)」、「含む(comprises)」、「含むこと(comprising)」、「含有する(contain)」、「含有する(contains)」、「含有すること(containing)」、「含む(include)」、「含む(includes)」、および「含むこと(including)」は、制限となるように意図されたものではない。
【0034】
本明細書において使用される用語法が特定の実施形態の説明を目的にしたものに過ぎず、限定となるように意図されたものでないことも、理解されたい。さらに、別段の定義がない限り、本明細書で使用される全ての専門および科学用語は、本開示が属する技術分野の当業者によって一般に理解されているのと同じ意味を有する。方法、コンピュータ可読媒体、およびシステムについての記述、および特許請求の範囲への記載には、以下の用語法、およびその文法上の異表記が、下で示される定義に従って使用されることになる。
【0035】
約:本明細書で使用される場合、目的の1つまたは複数の値または要素に適用される場合の「約」または「おおよそ」は、述べられている参照値または要素と同様である値または要素を指す。ある特定の実施形態では、用語「約」または「おおよそ」は、別段の記述がない限り、または文脈からそうでないことが明らかでない限り、述べられている参照値または要素の(それを超えるまたはそれに満たない)両方向に25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、またはそれ未満の%内に入る、値または要素の範囲を指す(ただし、そのような数が可能な値または要素の100%を超える場合を除く)。
【0036】
アダプター:本明細書で使用される場合、「アダプター」は、通常は少なくとも部分的に二本鎖であり、かつ所与の試料核酸分子のどちらかまたは両方の末端に連結させるために使用される、短い核酸(例えば、長さ約500ヌクレオチド未満、約100ヌクレオチド未満、または約50ヌクレオチド未満)を指す。アダプターは、両末端がアダプターと隣接している核酸分子の増幅を可能にするための核酸プライマー結合部位、および/または様々な次世代シークエンシング(NGS)応用などのシークエンシング応用のためのプライマー結合部位をはじめとするシークエンシングプライマー結合部位を含み得る。アダプターは、フローセル支持体またはこれに類するものに結合されたオリゴヌクレオチドなどの、捕捉用プローブのための結合部位も含み得る。アダプターは、本明細書に記載の核酸タグも含み得る。核酸タグは、核酸タグが所与の核酸分子のアンプリコンおよびシークエンシングリードに含まれるように、増幅プライマーおよびシークエンシングプライマー結合部位に対して通常は位置する。同じまたは異なる配列のアダプターを、核酸分子のそれぞれの末端に連結させることができる。ある特定の実施形態では、核酸タグがその配列の点で異なることを除いて、同じアダプターが、核酸分子のそれぞれの末端に連結される。一部の実施形態では、アダプターは、一方の末端が本明細書に記載されるように平滑末端化されているかまたは尾部を有するY型アダプターであって、同じく平滑末端化されている核酸分子に、または1つもしくは複数の相補的ヌクレオチドを伴う尾部を有する核酸分子に結合させるための、Y型アダプターである。さらに他の例示的な実施形態では、アダプターは、分析されることになる核酸に結合させるための平滑末端または尾部を有する末端を含む、釣り鐘型アダプターである。他の例示的なアダプターとしては、Tを尾部に有するアダプターおよびCを尾部に有するアダプターが挙げられる。
【0037】
投与する:本明細書で使用される場合、治療剤(例えば、免疫学的治療剤、DNA損傷応答(DDR)阻害剤(例えば、ポリ(ADP-リボース)ポリメラーゼ(PARP)阻害剤(PARPi))など)を対象に「投与する」または「投与すること」は、組成物を対象に与えること、適用すること、または対象と接触させることを意味する。投与は、例えば、局所、経口、皮下、筋肉内、腹腔内、静脈内、髄腔内および皮内経路をはじめとする、いくつかの経路のいずれかによって遂行され得る。
【0038】
アラインする:本明細書で使用される場合、核酸の文脈での「アラインする」、「アラインメント」、および「アラインすること」は、類似性の領域を同定するためにDNAまたはRNAの配列を並べることを指す。類似性は、配列間の機能的、構造的および/または進化的関係に関するものであり得る。DNA配列のアラインメントは、1つの配列のゲノムDNAと少なくとも1つの他の配列のゲノムDNAのアラインメントを含む。そのようなアラインメントは、非ゲノムDNA、例えば、分子バーコード、パディング塩基、およびこれらに類するものを除外し得る。例えば、配列リードのゲノムDNAは、配列リードに結合され得るあらゆる分子タグを除外して、参照DNA配列のゲノムDNAにアラインされ得る。
【0039】
アレル:本明細書で使用される場合、「アレル」または「アレルバリアント」は、定義された遺伝子位置またはゲノム座位における特定の遺伝的バリアントを指す。アレルバリアントは、通常、アレルがヘテロ接合性であるのか、ホモ接合性であるのかに依存して50%(0.5)または100%の頻度で示される。例えば、生殖細胞系バリアントは遺伝され、通常、0.5または1の頻度を有する。しかし、体細胞バリアントは、後天的バリアントであり、通常は、<0.5の頻度を有する。遺伝子座位のメジャーおよびマイナーアレルは、参照配列のヌクレオチドおよび参照配列とは異なるバリアントヌクレオチドによってそれぞれ占められている座位を持つ核酸を指す。遺伝子座位における測定値は、アレルが試料中に見られる頻度の測度となるアレル割合(AF)の形をとり得る。
【0040】
増幅する:本明細書で使用される場合、核酸の文脈での「増幅する」または「増幅」は、少量のポリヌクレオチド(例えば、単一ポリヌクレオチド分子)から通常は始まる、ポリヌクレオチドの、またはポリヌクレオチドの一部分の、複数のコピーの産生を指し、増幅産物またはアンプリコンは、一般に検出可能である。ポリヌクレオチドの増幅は、様々な化学的および酵素的プロセスを包含する。
【0041】
バーコード:本明細書で使用される場合、核酸の文脈での「バーコード」は、分子識別子としての機能を果たすことができる配列を有する核酸分子を指す。例えば、個々の「バーコード」配列は、通常は、最終データ分析の前に各リードを識別および選別することができるように、次世代シークエンシング(NGS)ライブラリー調製中にDNA断片に付加される。
【0042】
塩基除去修復阻害剤:本明細書で使用される場合、「塩基除去修復阻害剤」または「BER阻害剤」は、塩基除去修復(BER)経路、機構またはプロセスを阻害する、治療剤を指す。
【0043】
切断点:本明細書で使用される場合、核酸融合分子または対応するシークエンシングリードの文脈での「切断点」は、核酸融合体の融合した部分配列間の接合部における末端ヌクレオチド位置、または対応するシークエンシングリードで表される末端ヌクレオチド位置を指す。例えば、所与の分割配列リードは、その分割配列リードにおける第2の部分配列と連続しており、かつ第2の部分配列の5’側にある、第1の部分配列を含み、この第1の部分配列は、参照配列における第1の遺伝子座位に位置し、この第1の遺伝子座位は、第2の部分配列が位置するその参照配列内の第2の遺伝子座位と不連続である。この例では、分割配列リードの第1の部分配列は、3’末端ヌクレオチドに切断点を含むが、分割配列リードの第2の部分配列は、5’末端ヌクレオチドに切断点を含む。ある特定の応用では、切断点、例えばこれらの切断点は、「切断点対」と呼ばれる。
【0044】
がん型:本明細書で使用される場合、「がん」、「がん型」または「腫瘍型」は、例えば病理組織診断により定義される、がんのタイプまたはサブタイプを指す。がん型は、任意の従来の基準により、例えば、所与の組織における存在(例えば、血液がん、中枢神経系(CNS)、脳がん、肺がん(小細胞および非小細胞)、皮膚がん、鼻のがん、咽頭がん、肝臓がん、骨がん、リンパ腫、膵臓がん、腸がん、直腸がん、甲状腺がん、膀胱がん、腎臓がん、口腔がん、胃がん、乳がん、前立腺がん、卵巣がん、肺がん、腸管がん、軟部組織がん、神経内分泌がん、胃食道がん、頭頸部がん、婦人科がん、大腸がん、尿路上皮がん、固体がん、異種がん、同種がん)、原因不明、およびこれらに類するものに、ならびに/または同じ細胞系列(例えば、癌腫、肉腫、リンパ腫、胆管癌、白血病、中皮腫、黒色腫、もしくは膠芽細胞腫)に、ならびに/またはがんマーカー、例えば、Her2、CA15-3、CA19-9、CA-125、CEA、AFP、PSA、HCG、KRAS、BRAF、NRAS、ホルモン受容体およびNMP-22、を提示するがんに基づいて、定義され得る。がんはまた、ステージ(例えば、ステージ1、2、3または4)によって、および一次性であるのか、二次性であるのかによって、分類され得る。
【0045】
無細胞核酸:本明細書で使用される場合、「無細胞核酸」は、細胞内に含有されておらず、別様に細胞に結合してもいない、核酸を指す。一部の実施形態では、「無細胞核酸」は、対象からの単離の時点で、細胞内に含有されておらず、別様に細胞に結合してもいない、核酸を指す。無細胞核酸は、例えば、対象からの体液(例えば、血液、血漿、血清、尿、脳脊髄液(CSF)など)から供給される全ての非カプセル化核酸を含み得る。無細胞核酸は、ゲノムDNA、ミトコンドリアDNA、循環DNA、siRNA、miRNA、循環RNA(cRNA)、tRNA、rRNA、核小体低分子RNA(snoRNA)、Piwi結合RNA(piRNA)、長鎖ノンコーディングRNA(長鎖ncRNA)、および/またはこれらのいずれかの断片を含む、DNA(cfDNA)、RNA(cfRNA)およびこれらのハイブリッドを含む。無細胞核酸は、二本鎖のもの、一本鎖のもの、またはこれらのハイブリッドであり得る。無細胞核酸は、分泌または細胞死プロセス、例えば、細胞壊死、アポトーシス、またはそれに類するプロセスによって、体液に放出され得る。がん細胞から体液に放出される無細胞核酸、例えば、循環腫瘍DNA、(ctDNA)もある。健康な細胞から放出されるものもある。ctDNAは、非カプセル化腫瘍由来断片化DNAであり得る。無細胞核酸の別の例は、母体血流中を自由に循環している胎児DNAであり、これは、無細胞胎児DNA(cffDNA)とも呼ばれる。無細胞核酸は、1つまたは複数のエピジェネティック改変を有することがあり、例えば、無細胞核酸は、アセチル化、5-メチル化、ユビキチン化、リン酸化、SUMO化、リボシル化および/またはシトルリン化されていることがある。
【0046】
分類器:本明細書で使用される場合、「分類器」は、試験データを入力データとして受信し、1つまたは別のクラス(例えば、DNA損傷修復欠損(DDRD)を有するまたはDDRDを有さない、腫瘍DNAまたは非腫瘍DNA)に属するものとしての入力データの分類を出力データとして生じさせる、アルゴリズムコンピュータコードを一般に指す。
【0047】
連続する配列:本明細書で使用される場合、「連続する配列」または「コンティグ」は、核酸のコンセンサス領域を一緒に表す、オーバーラップ核酸セグメントのセットを指す。
【0048】
コピー数バリアント:本明細書で使用される場合、「コピー数バリアント」、「CNV」、または「コピー数多様性」は、ゲノムの区画が反復されてゲノム内のリピート数が考慮中の集団内の個体間で異なる現象を指す。
【0049】
カバレッジ:本明細書で使用される場合、「カバレッジ」は、特定の塩基位置を表す核酸分子の数を指す。
【0050】
デノボ融合コーラー:本明細書で使用される場合、「デノボ融合コーラー」、「融合コーラー」、または「デノボ法」は、デノボで、すなわち、既知の遺伝子融合事象のデータベースから得ることができるものなどの過去の知識なしで、融合事象を識別する、DNA融合コーラーまたはRNA融合コーラーのどちらかの、融合コーラーを指す。
【0051】
デオキシリボ核酸またはリボ核酸:本明細書で使用される場合、「デオキシリボ核酸」または「DNA」は、糖部分の2’位に水素基を有する、天然または改変ヌクレオチドを指す。典型的に、DNAは、4つのタイプの核酸塩基、すなわち、アデニン(A)、チミン(T)、シトシン(C)およびグアニン(G)、のうちの1つを含むデオキシリボヌクレオシドを含むヌクレオチド鎖を指す。本明細書で使用される場合、「リボ核酸」または「RNA」は、糖部分の2’位にヒドロキシル基を有する、天然または改変ヌクレオチドを指す。典型的に、RNAは、4つのタイプの核酸塩基、すなわち、A、ウラシル(U)、GおよびC、のうちの1つを含むリボヌクレオシドを含むヌクレオチド鎖を指す。本明細書で使用される場合、用語「ヌクレオチド」は、天然ヌクレオチドまたは改変ヌクレオチドを指す。ある特定のヌクレオチド対は、相補的な形で互いに特異的に結合する(これは、相補的塩基対合と呼ばれる)。DNAでは、アデニン(A)は、チミン(T)と対合し、シトシン(C)は、グアニン(G)と対合する。RNAでは、アデニン(A)は、ウラシル(U)と対合し、シトシン(C)は、グアニン(G)と対合する。第1の核酸鎖が、第1の鎖内のものと相補的であるヌクレオチドで構成されている第2の核酸鎖に結合する場合、これら2本の鎖は、二重鎖を形成するように結合する。本明細書で使用される場合、「核酸シークエンシングデータ」、「核酸シークエンシング情報」、「配列情報」、「核酸配列」、「ヌクレオチド配列」、「ゲノム配列」、「遺伝子配列」、または「断片配列」、または「核酸シークエンシングリード」は、DNAまたはRNAなどの核酸の分子(例えば、全ゲノム、全トランスクリプトーム、エクソーム、オリゴヌクレオチド、ポリヌクレオチド、または断片)中のヌクレオチド塩基(例えば、アデニン、グアニン、シトシン、およびチミンまたはウラシル)の順序および同一性を示す任意の情報またはデータを意味する。本教示が、キャピラリー電気泳動、マイクロアレイ、ライゲーションに基づくシステム、ポリメラーゼに基づくシステム、ハイブリダイゼーションに基づくシステム、直接または間接的ヌクレオチド同定システム、パイロシークエンシング、イオンまたはpHに基づく検出ステム、および電子署名に基づくシステムを含むがこれらに限定されない、あらゆる利用可能な種類の技法、プラットフォームまたは技術を使用して得られる配列情報を企図していることを、理解されたい。
【0052】
検出する:本明細書で使用される場合、「検出する」、「検出すること」、または「検出」は、試料中の1つまたは複数の標的核酸(例えば、標的変異または他のマーカーを有する核酸)の存在(existence)または存在(presence)を決定する行為を指す。
【0053】
DNA損傷修復:本明細書で使用される場合、「DNA損傷修復」または「DDR」は、細胞周期中にDNA損傷を修復する生化学的経路、機構またはプロセスを指す。方向反転DNA損傷修復機構は、基礎をなす損傷が、影響を受けたDNA中のホスホジエステル骨格の切断を含まないので、鋳型を含まない。他のDNA損傷修復経路、機構またはプロセスは、鋳型を含む。これらは、所与の二重らせんの2本の鎖の一方のみが損傷したときにDNAを修復するように作用する一本鎖損傷修復機構、例えば、塩基除去修復(BER)、ヌクレオチド除去修復(NER)、およびミスマッチ修復(MMR)を含む。鋳型依存性DNA修復プロセスは、所与の二重らせんの両方の鎖が損傷した(例えば、切断された)ときにDNAを修復するように作用する二本鎖損傷修復機構、例えば、相同組換え(HR)、マイクロホモロジー媒介末端結合(MMEJ)および非相同末端結合(NHEJ)も含む。
【0054】
DNA損傷修復欠損:本明細書で使用される場合、「DNA損傷修復欠損」または「DDRD」は、DNA損傷修復経路、機構またはプロセスを部分的にまたは完全に破壊する、変異、または変異のセットを指す。
【0055】
DNA損傷修復遺伝子:本明細書で使用される場合、「DNA損傷修復遺伝子」または「DDR遺伝子」は、DNA損傷修復経路、機構またはプロセスに関与するポリペプチドをコードする遺伝子を指す。
【0056】
融合事象:本明細書で使用される場合、「融合事象」は、特定の位置における少なくとも2つの別々の遺伝子間の融合を指す。融合事象の原因例としては、転座、中間部欠失、または染色体逆位事象が挙げられる。
【0057】
遺伝子:本明細書で使用される場合、「遺伝子」は、生物学的機能に関連するDNAの任意のセグメントを指す。したがって、遺伝子は、コード配列、および必要に応じて、それらの発現に必要な調節配列を含む。遺伝子はまた、必要に応じて、例えば他のタンパク質の認識配列を形成する、非発現DNAセグメントを含む。
【0058】
相同組換え修復欠損のスコア:本明細書で使用される場合、「相同組換え修復欠損スコア」または「HRDスコア」は、所与の対象の1つもしくは複数のゲノム領域にもしくは所与の対象集団における1つもしくは複数のゲノム領域に見られる、またはそこに存在することが別様に公知である、相同組換え修復欠損(HRD)などのDNA損傷修復欠損(DDRD)に関連する変異または変異のセットの数または他の測度を表す値を指す。
【0059】
生殖細胞系変異:本明細書で使用される場合、「生殖細胞系変異」は、生殖細胞における変異、したがって、子孫に継代され得る変異を意味する。
【0060】
相同組換え修復:本明細書で使用される場合、「相同組換え修復」または「HRR」は、DNA複製中に起こる鋳型依存性DNA修復プロセスを指す。典型的に、姉妹染色分体上の相同領域は、損傷したDNA鎖を修復するためのプロセスの一部として、鋳型として機能する。
【0061】
相同組換え修復欠損:本明細書で使用される場合、「相同組換え修復欠損」または「HRD」は、相同組換え修復経路、機構またはプロセスを部分的にまたは完全に破壊する、変異、または変異のセットを指す。
【0062】
相同組換え修復遺伝子:本明細書で使用される場合、「相同組換え修復遺伝子」または「HRR遺伝子」は、相同組換え修復経路、機構またはプロセスに関与するポリペプチドをコードする遺伝子を指す。
【0063】
ホモ接合型欠失:本明細書で使用される場合、「ホモ接合型欠失」または「両アレル性不活性化」は、所与の遺伝子の両方のアレルの喪失をもたらす、変異または核酸バリアントを指す。
【0064】
半接合型欠失:本明細書で使用される場合、「半接合型欠失」または「片アレル性不活性化」は、所与の遺伝子の2つのアレルの一方の喪失をもたらす、変異または核酸バリアントを指す。「ヘテロ接合型欠失」は、所与の遺伝子の本来のまたは初期の2つのアレルが互いに異なる、半接合型欠失である。
【0065】
インデル:本明細書で使用される場合、「インデル」は、対象のゲノムにおけるヌクレオチド位置の挿入または欠失を含む変異を指す。
【0066】
機能喪失:本明細書で使用される場合、生化学的経路、機構またはプロセスの文脈での「機能喪失」または「LoF」は、生化学的経路、機構またはプロセスを非機能性にする、変異または変異のセット(例えば、所与の試料中の)を指す。例えば、機能喪失(LoF)DNA損傷修復欠損(DDRD)は、所与のDNA損傷修復(DDR)経路、機構またはプロセス(例えば、塩基除去修復(BER)経路、機構もしくはプロセス、ヌクレオチド除去修復(NER)経路、機構もしくはプロセス、ミスマッチ修復(MMR)経路、機構もしくはプロセス、相同組換え修復(HRR)経路、機構もしくはプロセス、非相同末端結合(NHEJ)経路、機構もしくはプロセス、および/またはこれらに類するもの)を非機能性にする、変異または変異のセットである。
【0067】
ヘテロ接合性消失:本明細書で使用される場合、「ヘテロ接合性消失」または「LOH」は、所与の細胞または所与の細胞クローン群(例えば、遺伝子全体および周囲の染色体領域)への一方の親の寄与の喪失をもたらす変異事象を指す。LOHは、例えば、遺伝子変換、直接欠失、有糸分裂組換え、バランスの悪い編成に起因する欠失、または染色体の喪失(モノソミー)によって引き起こされ得る。
【0068】
マイナーアレル頻度:本明細書で使用される場合、「マイナーアレル頻度」は、マイナーアレル(例えば、最も頻度の高いアレルではない)が、対象から得られた試料などの所与の核酸集団に存在する頻度を指す。低いマイナーアレル頻度の遺伝的バリアントは、通常は、試料中の存在頻度が相対的に低い。
【0069】
変異型アレル割合:本明細書で使用される場合、「変異型アレル割合」または「MAF」は、所与の試料中の所与のゲノム位置における参照に対してアレル変更または変異を内部に持つ核酸分子の割合を指す。MAFは、一般に、割合またはパーセンテージとして表される。例えば、MAFは、通常は、所与の座位に存在する全ての体細胞バリアントまたはアレルの約0.5、0.1、0.05、または0.01未満(すなわち、約50%、10%、5%、または1%未満)である。
【0070】
最大変異型アレル割合:本明細書で使用される場合、「最大変異型アレル割合」、「最大MAF」、または「MAX MAF」は、所与の試料に存在するまたは見られる全ての体細胞バリアントの最大または最も大きいMAFを指す。
【0071】
変異:本明細書で使用される場合、「変異」、「核酸バリアント」、「バリアント」、または「遺伝子異常」は、既知の参照配列からの変動を指し、例えば、一塩基バリアント(SNV)、コピー数バリアントまたは多様性(CNV)/異常、挿入または欠失(インデル)、短縮化、遺伝子融合、トランスバージョン、転座、フレームシフト、重複、リピート伸長、およびエピジェネティックバリアントなどの、変異を含む。変異は、生殖細胞系または体細胞変異であり得る。一部の実施形態では、比較目的の参照配列は、試験試料を提供する対象の種の野生型ゲノム配列、通常はヒトゲノムである。ある特定の場合には、変異またはバリアントは、腫瘍形成を引き起こす、または腫瘍形成に少なくとも寄与する、「腫瘍関連遺伝的バリアント」である。
【0072】
次世代シークエンシング:本明細書で使用される場合、「次世代シークエンシング」または「NGS」は、旧来のサンガーおよびキャピラリー電気泳動に基づく手法と比較してスループットが増大した、例えば、何十万もの比較的短い配列リードを同時に生成する能力がある、シークエンシング技術を指す。次世代シークエンシング技法の一部の例としては、一塩基合成法、ライゲーションによるシークエンシング、およびハイブリダイゼーションによるシークエンシングが挙げられるが、これらに限定されない。
【0073】
核酸タグ:本明細書で使用される場合、「核酸タグ」は、短い核酸(例えば、長さ約500、約100、約50または約10ヌクレオチド未満)であって、異なるタイプの、もしくは異なる処理を経た、異なる試料からの核酸を区別するために核酸分子を標識するために使用される核酸(例えば、試料インデックスを表す)、または異なるタイプの、もしくは異なる処理を経た、同じ試料中の異なる核酸分子を区別するために核酸分子を標識するために使用される核酸(例えば、分子タグを表す)を指す。核酸タグは、一本鎖状、二本鎖状、または少なくとも部分的に二本鎖状であることがある。核酸タグは、必要に応じて、同じ長さまたは多様な長さを有する。核酸タグは、1つもしくは複数の平滑末端を有する二本鎖分子を含むこともあり、5’もしくは3’一本鎖領域(例えば、オーバーハング)を含むこともあり、および/または1つもしくは複数の他の一本鎖領域を所与の分子内の他の位置に含むこともある。核酸タグを、他の核酸(例えば、増幅および/またはシークエンシングされることになる試料核酸)の一方の末端または両末端に結合させることができる。核酸タグを解読して、所与の核酸の起源試料、形態または処理などの情報を明らかにすることができる。核酸タグを使用して、異なる核酸タグおよび/または試料インデックスを有する核酸を含む複数の試料のプールおよび/または並行処理を可能にすることもでき、これらの核酸は、その後、核酸タグを読み取ることによりデコンボリューションされる。核酸タグは、分子識別子もしくはタグ、試料識別子、インデックスタグ、および/またはバーコードと呼ばれることもある。加えてまたは代替的に、核酸タグを使用して同じ試料中の異なる分子を区別することができる。これは、例えば、所与の試料中の異なる核酸分子に一意的にタグ付けすること、またはそのような分子に非一意的にタグ付けすることを含む。非一意なタグ付け応用の場合には、限定数の異なる配列を有するタグを使用して、核酸分子にタグ付けすることができ、したがって、異なる分子を、例えば、それらが少なくとも1つの核酸タグとの組合せで選択された参照ゲノムに位置する開始および/または停止位置に基づいて、区別することできる。通常は、異なる核酸タグの十分な数が使用され、したがって、任意の2つの分子が、同じ開始/停止位置を有することになり、かつ同じ核酸タグも有することになる確率は低い(例えば、約10%未満、約5%未満、約1%未満、または約0.1%未満の機会)。一部の核酸タグは、試料、試料の中の核酸分子の形態、ならびに同じ開始および停止位置を有する形態の中の核酸分子を標識するために、複数の分子識別子を含む。大文字の文字が、試料タイプを示し、アラビア数字が、試料の中の分子の形態を示し、小文字のローマ数字が、ある形態の中の分子を示す、例示的な形態「A1i」を使用して、そのような核酸タグを参照することができる。
【0074】
ポリADPリボースポリメラーゼ阻害剤:本明細書で使用される場合、「ポリADPリボースポリメラーゼ阻害剤」、「PARP阻害剤」、または「PARPi」は、酵素ポリADPリボースポリメラーゼ(PARP)の作用を阻害する治療剤を指す。
【0075】
ポリヌクレオチド:本明細書で使用される場合、「ポリヌクレオチド」、「核酸」、「核酸分子」、または「オリゴヌクレオチド」は、ヌクレオシド間連結により結合されたヌクレオシドの直鎖状ポリマー(デオキシリボヌクレオシド、リボヌクレオシド、またはこれらのアナログ)を指す。通常は、ポリヌクレオチドは、少なくとも3つのヌクレオシドを含む。オリゴヌクレオチドは、多くの場合、少数のモノマー単位、例えば3~4から、数百のモノマー単位まで、サイズに幅がある。ポリヌクレオチドが、「ATGCCTG」などの文字の配列によって表される場合は常に、別段の断り書きがない限り、ヌクレオチドが左から右へ5’→3’の順序であること、およびDNAの場合、「A」がデオキシアデノシンを示し、「C」がデオキシシチジンを示し、「G」がデオキシグアノシンを示し、「T」がデオキシチミジンを示すことは、理解されるであろう。文字A、C、GおよびTは、当技術分野では一般的であるように、塩基自体を指すために使用されることもあり、ヌクレオシドを指すために使用されることもあり、または塩基を含むヌクレオチドを指すために使用されることもある。
【0076】
保有率(prevalence):本明細書で使用される場合、核酸バリアントの文脈での「保有率」は、所与の核酸バリアントが、所与の試料(例えば、所与の体液試料、所与の非体液試料など)または他の集団(例えば、体液試料の所与の集団、非体液試料の所与の集団、など)に見られるまたは見られた程度、広汎性、または頻度を指す。
【0077】
参照試料:本明細書で使用される場合、「参照試料」または「参照cfDNA試料」は、分析手順の精度を評価するために試験試料と一緒に分析されるまたは試験試料と比較される、既知組成の、および/または特定の特性(例えば、既知核酸バリアント、既知細胞起源、既知腫瘍割合、既知カバレッジ、および/またはこれらに類すること)を有する、または有することもしくは欠いていることが分かっている、試料を指す。参照試料データセットは、通常は、少なくとも約25~少なくとも約30,000またはそれより多くの参照試料を含む。一部の実施形態では、参照試料データセットは、約50、75、100、150、200、300、400、500、600、700、800、900、1,000、2,500、5,000、7,500、10,000、15,000、20,000、25,000、50,000、100,000、1,000,000、またはそれより多くの参照試料を含む。
【0078】
参照配列:本明細書で使用される場合、「参照配列」または「参照ゲノム」は、実験的に決定された配列と比較する目的で使用される既知配列を指す。例えば、既知配列は、全ゲノム、染色体、またはこれらの任意のセグメントであり得る。参照配列は、通常は、少なくとも約20、少なくとも約50、少なくとも約100、少なくとも約200、少なくとも約250、少なくとも約300、少なくとも約350、少なくとも約400、少なくとも約450、少なくとも約500、少なくとも約1000、少なくとも約10,000、少なくとも約100,000、少なくとも約1,000,000、少なくとも約10,000,000、少なくとも約100,000,000、少なくとも約1,000,000,000、またはそれより多くのヌクレオチドを含む。参照配列をゲノムもしくは染色体の単一の連続する配列とアラインすることができ、または参照配列は、ゲノムもしくは染色体の異なる領域とアラインする不連続なセグメントを含み得る。例示的な参照配列としては、例えば、ヒトゲノム、例えば、hG19およびhG38が挙げられる。
【0079】
試料:本明細書で使用される場合、「試料」は、本明細書で開示される方法および/またはシステムにより分析することができる任意の生体試料を意味する。本開示のある特定の態様では、試料は、体液試料、例えば、無細胞(細胞内に含有されても、別様に細胞に結合されてもいない、循環)核酸が供給される体液のタイプの中でも特に、全血もしくはその画分、リンパ液、尿、および/または脳脊髄液である。ある特定のインプリメンテーションでは、体液試料は、血漿試料であり、これは、赤血球および白血球などの細胞を除く、全血の流体部分である。一部のインプリメンテーションでは、体液試料は、血清試料、すなわち、フィブリノゲンを欠いている血漿である。本開示の一部の態様では、試料は、「非体液試料」または「非血漿試料」、すなわち、「体液試料」以外の生体試料、例えば、無細胞核酸以外の核酸が供給される細胞および/または組織試料のような生体試料である。
【0080】
感度:本明細書で使用される場合、所与のアッセイまたは方法の文脈での「感度」は、標的(例えば、核酸バリアント)分析物および非標的分析物を検出するならびにこれらを区別する、アッセイまたは方法の能力を指す。
【0081】
シークエンシング:本明細書で使用される場合、「シークエンシング」は、生体分子、例えば、DNAまたはRNAなどの核酸、の配列(例えば、同一性、およびモノマー単位の順序)を決定するために使用されるいくつかの技術のいずれかを指す。例示的なシークエンシング方法としては、標的シークエンシング、単一分子リアルタイムシークエンシング、エクソンまたはエクソームシークエンシング、イントロンシークエンシング、電子顕微鏡法に基づくシークエンシング、パネルシークエンシング、トランジスタ媒介シークエンシング、ダイレクトシークエンシング、ランダムショットガンシークエンシング、サンガージデオキシターミネーションシークエンシング、全ゲノムシークエンシング、ハイブリダイゼーションによるシークエンシング、パイロシークエンシング、キャピラリー電気泳動、デュプレックスシークエンシング、サイクルシークエンシング、一塩基伸長シークエンシング、固相シークエンシング、ハイスループットシークエンシング、大規模並列シグネチャーシークエンシング、エマルジョンPCR、より低い変性温度での共増幅-PCR(COLD-PCR)、マルチプレックスPCR、可逆的ダイターミネーターによるシークエンシング、ペアエンドシークエンシング、ニアタームシークエンシング、エクソヌクレアーゼシークエンシング、ライゲーションによるシークエンシング、ショートリードシークエンシング、単一分子シークエンシング、一塩基合成法、リアルタイムシークエンシング、リバースターミネーターシークエンシング、ナノポアシークエンシング、454シークエンシング、Solexa Genome Analyzerシークエンシング、SOLiD(商標)シークエンシング、MS-PETシークエンシング、およびこれらの組合せが挙げられるが、それらに限定されない。一部の実施形態では、シークエンシングは、例えば、数ある中でも特に、Illumina,Inc.、Pacific Biosciences,Inc.、またはApplied Biosystems/Thermo Fisher Scientificから市販されている遺伝子分析装置などの、遺伝子分析装置により行うことができる。
【0082】
配列情報:本明細書で使用される場合、核酸ポリマーの文脈での「配列情報」は、そのポリマー中のモノマー単位(例えば、ヌクレオチドなど)の順序および/または同一性を意味する。
【0083】
一塩基バリアント:本明細書で使用される場合、「一塩基バリアント」または「SNV」は、ゲノム内の特定の位置に存在する単一ヌクレオチドの変異または多様性を意味する。
【0084】
体細胞変異:本明細書で使用される場合、「体細胞変異」は、受胎後に起こる所与のゲノムの変異を意味する。体細胞変異は、生殖細胞を除く身体のあらゆる細胞で起こるものであり得、したがって、子孫に継代されない。
【0085】
特異度:本明細書で使用される場合、診断分析またはアッセイの文脈での「特異度」は、分析またはアッセイが所与の試料の他の成分を除外して意図された標的分析物を検出する程度を指す。
【0086】
ステータス:本明細書で使用される場合、対象についての文脈での「ステータス」は、所与の対象の1つまたは複数のステータス、例えば、対象がDNA損傷修復欠損(DDRD)(例えば、相同組換え修復欠損(HRD)および/またはこれに類するもの)を有するか否かを指す。
【0087】
対象:本明細書で使用される場合、「対象」または「試験対象」は、動物、例えば、哺乳類種(例えば、ヒト)またはトリ(例えば、鳥)種、または他の生物、例えば植物を指す。より具体的には、対象は、脊椎動物、例えば、哺乳動物、例えばマウス、霊長類、サルまたはヒトであり得る。動物は、家畜(例えば、生産牛、乳牛、家禽、馬、豚、およびこれらに類するもの)、競技動物、および伴侶動物(例えば、ペットまたは支援動物)を含む。対象は、健康な個体、疾患もしくは疾患素因がある、もしくはある疑いがある個体、または療法を必要としている、もしくは療法を必要とする疑いがある個体であり得る。用語「個体」または「患者」は、「対象」と同義であるように意図されている。一部の実施形態では、対象は、がんを有する、または有する疑いがある、ヒトである。例えば、対象は、がんを有すると診断された個体、がん療法を受けることになる個体、および/または少なくとも1つのがん療法を受けたことがある個体であり得る。対象は、がんの寛解期にあることもある。別の例として、対象は、自己免疫疾患を有すると診断される個体であり得る。別の例では、対象は、疾患、例えば、がん、自己免疫疾患を有すると、もしくは有する疑いがあると診断されたことがあり得る妊娠している女性個体、または妊娠を計画している女性個体であり得る。「参照対象」は、特定の特性(例えば、既知DDRDもしくはHRDステータス、既知核酸バリアント、既知細胞起源、既知腫瘍割合、既知カバレッジ、および/またはこれらに類すること)を有することまたは欠いていることが分かっている対象を指す。
【0088】
閾値:本明細書で使用される場合、「閾値(threshold)」は、実験的に決定された値を特徴付けるまたは分類するために使用される、別々に決定された値を指す。ある特定の実施形態では、例えば、「閾値(threshold value)」は、所与の標的核酸バリアントが所与の遺伝子座位に非存在であることを決定するために定量値が比較される、選択された値を指す。
【0089】
腫瘍割合:本明細書で使用される場合、「腫瘍割合」は、所与の試料中の腫瘍に由来する核酸分子の割合の推定値を指す。例えば、試料の腫瘍割合は、試料の最大変異型アレル頻度(MAX MAF)、または試料のカバレッジ、または試料中のcfDNA断片の長さ、エピジェネティック状態、もしくは他の特性、または試料の任意の他の選択された特徴から導出される測度であり得る。用語「MAX MAF」は、所与の試料中に存在する全ての体細胞バリアントの最大または最も大きいMAFを指す。一部の実施形態では、試料の腫瘍割合は、試料のMAX MAFに等しい。
【0090】
値:本明細書で使用される場合、「値」または「スコア」は、一般に、値が指す特徴を特徴付けるあらゆるものであり得るデータセット内の登録事項を指す。これは、数、語または句、記号(例えば、+もしくは-)または程度を含むが、これらに限定されない。
詳細な説明
【0091】
序論
【0092】
DNA損傷修復(DDR)は、ゲノムの完全性または安定性を維持する機能を果たす細胞プロセスである。所与のDDR機構の欠陥または欠損は、腫瘍形成または他の疾患につながることがあり、これらの欠陥または欠損を使用して、所与の標的療法からの恩恵を受ける可能性がある試験対象または患者を同定することができる。例えば、相同組換え修復欠損(HRD)は、患者をPARP阻害剤などの治療剤の投与の候補者にし得る細胞表現型である。例を挙げて説明すると、
図1(パネルAおよびB)は、相同組換え修復(HRR)経路の欠損を有する細胞が、DNA損傷増加を起こしやすく、DNA損傷修復阻害剤(例えば、PARP阻害剤など)および/または他の療法に対する感受性が上昇していることを模式的に示す図である。示されているように、DNA損傷を有する正常な細胞(パネルA)は、たとえPARP阻害剤が患者に投与されても、PARP阻害剤が一本鎖切断(SSB)のPARP媒介修復しか阻害しないので、多くの場合、生き残ることになる。DNA複製中に、DNAらせんが巻き戻ると、これらのSSBは結果として二本鎖切断(DSB)になる。これらの正常な細胞の場合、このDNA損傷は、DSBを修復する相同組換え(HR)媒介修復経路によって修復され得、したがって、正常な細胞は、生き残ることになる。対照的に、例えば、HR欠損がん細胞(パネルB)の場合、HR媒介修復経路は機能せず、したがって、投与されたPARP阻害剤は、がん細胞の死につながる残存するPARP媒介修復経路を阻害することになる。
【0093】
HRDを不活性化する変更または変異の様々なクラスがある。これらの一部としては、数ある変更の中でも特に、HRR遺伝子のSNVおよび/またはインデル、ホモ接合型欠失、遺伝子特異的LOH、コピー数変化を伴わないLOH、ゲノムワイドなLOH、短縮再編成、ならびにマルチエクソン(長い)欠失が挙げられる。本明細書で開示されるある特定の実施形態では、SNVおよびインデルは、病原性の注釈技法を使用して同定され、ホモ接合型欠失、遺伝子特異的LOH、コピー数変化を伴わないLOH、およびゲノムワイドなLOHは、ホモ接合型欠失/LOH CNVコーラーを使用して同定され、ならびに短縮再編成、およびマルチエクソン欠失は、再編成またはデノボ融合コーラーを使用して同定される。
【0094】
一部の実施形態では、本明細書で開示される方法および関連態様は、卵巣がん、前立腺がん、乳がん、または他のがん患者におけるPARP阻害剤処置の指針を得るためのHRR経路の欠損の同定に使用される。これらの実施形態のいくつかでは、HRDワークフローは、HRDを有する試料を同定するための、ひいては、PARP阻害剤を含む標的療法の候補者を同定するための、HRR遺伝子に関するコピー数減少、再編成ならびに病原性SNVおよびインデルについての情報を提供する。これらのうちの一部の実施形態では、これは、SNV/インデル、融合、およびCNVコーラーなどの、システムモジュールによって達成される。一部の実施形態では、これらのプロセスの出力データとして生成されるレポートが、関連HRR遺伝子の機能喪失(LoF)を示すバリアント型についての値を明らかにする。
【0095】
本質的に任意のDDR(例えばHRR)遺伝子またはバイオマーカーを、所与の試料において、対応するDDR(例えば、HRR)経路を正常に機能しない状態または非機能性にする関連変異について、評価することができる。この情報を、患者への標的療法(例えば、PARP阻害剤、BER阻害剤など)の投与の選択基準として使用することができる。ある特定の実施形態では、標的療法は、PARP阻害剤を含み得る。投与され得るPARP阻害剤の例としては、ベリパリブ、オラパリブ、タラゾパリブ、ルカパリブ、ニラパリブ、パミパリブ、CEP 9722(Cephalon)、E7016(Eisai)、E7449(Eisai、PARP 1/2およびタンキラーゼ1/2阻害剤)、または3-アミノベンズアミドのうちの1つまたは複数が挙げられる。一部の実施形態では、標的療法は、少なくとも1つの塩基除去修復(BER)阻害剤を含み得る。例えば、オラパリブは、BIRを阻害し得る。ある特定の実施形態では、標的療法は、PARP阻害剤と放射線療法の組合せを含み得る。ある実施形態では、PARP阻害剤と放射線療法の組合せによって、PARP阻害剤が、腫瘍組織(例えば、BRCA1/BRCA2変異を有する組織)において放射線療法により生成される一本鎖切断からの二本鎖切断の形成をもたらすことが可能になる。この組合せは、1放射線線量あたりのより強力な療法を提供することができる。本開示の方法および関連態様を使用して、本質的に任意の数の遺伝子が必要に応じて評価される。一部の実施形態では、例えば、本明細書に記載の分析の対象となるDDR遺伝子(例えばHRR遺伝子)のセットは、少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、100、1,000、10,000、またはそれより多くの遺伝子を含む。HRR遺伝子の非網羅的リストが表1で提供され、必要に応じて、これらのHRR遺伝子のうちの1つまたは複数が、本明細書で開示される方法および関連態様を使用する評価に選択される。
【表1】
【0096】
特定の標的療法の候補者である患者を同定するために本明細書に記載されるように評価することができるHRR遺伝子の例示的なセットが、表2に収載される。
【表2】
【0097】
例示的なシステムおよび方法
【0098】
図2は、本開示の実施形態に従って、試験対象111のDNA損傷修復欠損(DDRD)ステータス(例えば、HRDステータスまたはこれに類するもの)を決定するためのシステム100の例を図示する。システム100は、対象111からの1つまたは複数の試料101を処理して、バリアント検出およびDDRDステータス決定のための配列リードを生成することができる。システム100は、研究室システム102、コンピュータシステム110、および/または他の構成要素を含み得る。研究室システム102およびコンピュータシステム110が、互いに遠く離れたところにあり得、コンピュータネットワーク(図示されていない)によって互いに接続され得ることに留意されたい。研究所システム102は、試料収集および調製パイプライン103、シークエンシングパイプライン105、配列リードデータストア109、および/または他の構成要素を含み得る。シークエンシングパイプライン105は、1つまたは複数のシークエンシングデバイス107(
図2にシークエンシングデバイス107a...nとして図示されている)を含み得る。
【0099】
本開示の方法は、無細胞核酸の操作、調製、同定、定量化および/または分析において多種多様に使用することができる。
図2に示されているように、試料収集および調製パイプライン103は、1または複数の参照対象からcfDNA参照試料101を、および試験対象からcfDNA試験試料111を得ることを含む。本明細書に記載されるように、ポリヌクレオチドは、DNAおよび/またはRNAなどの、任意のタイプの核酸を含み得る。例えば、ポリヌクレオチドがDNAである場合、それは、ゲノムDNA、相補的DNA(cDNA)、または任意の他のデオキシリボ核酸であり得る。ポリヌクレオチドはまた、無細胞核酸、例えば、無細胞DNA(cfDNA)であり得る。例えば、ポリヌクレオチドは、循環cfDNAであり得る。循環cfDNAは、アポトーシスまたは壊死によって体の細胞から排出されるDNAを含み得る。アポトーシスまたは壊死によって排出されるcfDNAは、正常な(例えば、健康な)体の細胞が起源であり得る。異常な組織増殖、例えば、がんのための異常な組織増殖がある場合、腫瘍DNAが排出され得る。循環cfDNAは、循環腫瘍DNA(ctDNA)を含み得る。
i.試料
【0100】
様々な技法を使用して試料を収集することによって、無細胞ポリヌクレオチドの単離および抽出を行うことができる。試料は、対象から単離された任意の生体試料であり得る。試料は、体内組織、全血、血小板、血清、血漿、糞便、赤血球、白血球またはロイコサイト、内皮細胞、組織生検材料(例えば、既知のまたは疑わしい固形腫瘍からの生検材料)、脳脊髄液、滑液、リンパ液、腹水、間質または細胞外液(例えば、間質腔からの流体)、歯肉滲出液、歯肉溝滲出液、骨髄、胸水、脳脊髄液、唾液、粘液、痰、精液、汗、尿を含み得る。試料は、好ましくは、体液、特に、血液およびその画分ならびに尿である。そのような試料は、腫瘍から排出された核酸を含む。核酸は、DNAおよびRNAを含み得、二本鎖形態または一本鎖形態であり得る。試料は、対象から最初に単離された形態であることもあり、あるいは細胞などの成分を除去もしくは追加するための、ある成分を別の成分と比べて濃縮するための、または核酸のある形態を別の形態に、例えば、RNAをDNAに、もしくは一本鎖核酸を二本鎖核酸に、変換するための、さらなる処理に付されたものであることもある。したがって、例えば、分析のための体液試料は、無細胞核酸、例えば無細胞DNA(cfDNA)、を含有する血漿または血清である。
【0101】
一部の実施形態では、対象から採取される体液の試料体積は、シークエンシングされる領域についての所望の読み取り深度に依存する。例示的な体積は、約0.4~40ml、約5~20ml、約10~20mlである。例えば、体積は、約0.5ml、約1ml、約5ml、約10ml、約20ml、約30ml、約40ml、またはそれを超えるミリリットルである。試料採取される血漿の体積は、通常は、約5ml~約20mlの間である。
【0102】
試料は、様々な量の核酸を含み得る。通常は、所与の試料中の核酸の量は、複数のゲノム等価物と同等とみなされる。例えば、約30ngのDNAの試料は、約10,000(104)半数体ヒトゲノム等価物、およびcfDNAの場合は約200,000,000,000(2×1011)の個々のポリヌクレオチド分子を含有し得る。同様に、約100ngのDNAの試料は、約30,000の半数体ヒトゲノム等価物、およびcfDNAの場合は約600,000,000,000の個々の分子を含有し得る。
【0103】
一部の実施形態では、試料は、異なる供給源からの、例えば、細胞からの、および無細胞源(例えば、血液試料など)からの、核酸を含む。通常は、試料は、変異を保有する核酸を含む。例えば、試料は、必要に応じて、生殖細胞系変異および/または体細胞変異を保有するDNAを含む。通常は、試料は、がん関連変異(例えば、がん関連体細胞変異)を保有するDNAを含む。本開示の一部の実施形態では、対象における無細胞核酸は、腫瘍に由来し得る。例えば、試料から単離された無細胞DNAは、ctDNAを含み得る。
【0104】
増幅前の試料中の無細胞核酸の例示的な量は、通常は、約1フェムトグラム(fg)~約1マイクログラム(μg)、例えば、約1ピコグラム(pg)~約200ナノグラム(ng)、約1ng~約100ng、約10ng~約1000ngの範囲である。一部の実施形態では、試料は、約600ng以下、約500ng以下、約400ng以下、約300ng以下、約200ng以下、約100ng以下、約50ng以下、または約20ng以下の無細胞核酸分子を含む。必要に応じて、量は、無細胞核酸分子少なくとも約1fg、少なくとも約10fg、少なくとも約100fg、少なくとも約1pg、少なくとも約10pg、少なくとも約100pg、少なくとも約1ng、少なくとも約10ng、少なくとも約100ng、少なくとも約150ng、または少なくとも約200ngである。ある特定の実施形態では、量は、無細胞核酸分子約1fg、約10fg、約100fg、約1pg、約10pg、約100pg、約1ng、約10ng、約100ng、約150ng、または約200ng以下である。一部の実施形態では、方法は、試料から約1fg~約200ngの無細胞核酸分子を得るステップを含む。
【0105】
無細胞核酸は、通常は、長さ約100ヌクレオチド~長さ約500ヌクレオチドの間のサイズ分布を有し、長さ約110ヌクレオチド~長さ約230ヌクレオチドの分子が試料中の分子の約90%に相当し、最頻値は、約168ヌクレオチド長であり、第二の微小ピークが、長さ約240~約440ヌクレオチドの間の範囲にある。ある特定の実施形態では、無細胞核酸は、長さ約160~約180ヌクレオチド、または長さ約320~約360ヌクレオチド、または長さ約440~約480ヌクレオチドである。
【0106】
一部の実施形態では、無細胞核酸は、分別ステップによって体液から単離され、このステップで、溶液中に見られる場合の無細胞核酸は、無傷細胞、および体液中の他の不溶性成分から分離される。これらのうちの一部の実施形態では、分別は、遠心分離または濾過などの技法を含む。あるいは、体液中の細胞は溶解され、無細胞核酸と細胞核酸が一緒に処理される。一般に、緩衝剤の添加および洗浄ステップ後、無細胞核酸は、例えばアルコールで、沈殿される。ある特定の実施形態では、夾雑物または塩を除去するためのシリカに基づくカラムなどの、追加の清浄化ステップが、使用される。例えば、非特異的バルク担体核酸が、収率などの例示的な手順のある特定の態様を最適化するために、反応を通じて、必要に応じて、添加される。そのような処理後、試料は、二本鎖DNA、一本鎖DNAおよび/または一本鎖RNAをはじめとする、様々な形態の核酸を典型的に含む。必要に応じて、一本鎖DNAおよび/または一本鎖RNAは、後続の処理および分析ステップにそれらを含めるために、二本鎖形態に変換される。cfDNA分別、および本明細書で開示される方法を行う際の使用に必要に応じて適応されるエピジェネティック改変の関連分析に関するさらなる詳細は、例えば、2017年12月22日に出願されたWO2018/119452に記載されており、この参考特許文献は、参照により本明細書に組み込まれる。
ii.核酸タグ
【0107】
ある特定の実施形態では、分子識別子またはバーコードを提供するタグは、試料収集および調製パイプライン103の一部として、数ある方法の中でも特に、化学合成、ライゲーション、またはオーバーラップ伸長PCRによって、アダプターに組み込まれるかまたは別様に結合される。一部の実施形態では、反応における一意もしくは非一意の識別子、または分子バーコードの割り当ては、例えば、各々が参照により本明細書に組み込まれる、米国特許出願公開第20010053519号、同第20030152490号、同第20110160078号、ならびに米国特許第6,582,908号、同第7,537,898号および同第9,598,731号に記載されている方法に従い、これらに記載されているシステムを利用する。
【0108】
タグは、無作為にまたは作為的に試料核酸に連結される。一部の実施形態では、タグは、期待される識別子(例えば、一意および/または非一意のバーコードの組合せ)比でマイクロウェルに導入される。例えば、約1、2、3、4、5、6、7、8、9、10、20、50、100、500、1000、5000、10000、50,000、100,000、500,000、1,000,000、10,000,000、50,000,000または1,000,000,000より多くの識別子がゲノム試料ごとに負荷されるように、識別子を負荷することができる。一部の実施形態では、識別子は、約2、3、4、5、6、7、8、9、10、20、50、100、500、1000、5000、10000、50,000、100,000、500,000、1,000,000、10,000,000、50,000,000または1,000,000,000未満の識別子がゲノム試料ごとに負荷されるように、負荷される。ある特定の実施形態では、試料ゲノムあたりの負荷される識別子の平均数は、ゲノム試料あたり識別子約1、2、3、4、5、6、7、8、9、10、20、50、100、500、1000、5000、10000、50,000、100,000、500,000、1,000,000、10,000,000、50,000,000もしくは1,000,000,000未満であるか、またはそれを超える。識別子は、一般に、一意および/または非一意である。
【0109】
1つの例示的な形式は、標的核酸分子の両末端にライゲーションされた約2~約1,000,000の異なるタグ、または約5~約150の異なるタグ、または約20~約50の異なるタグを使用する。20~50×20~50のタグの場合、合計400~2500のタグが作出される。通常は、そのようなタグ数は、同じ開始点および停止点を有する異なる分子が、タグの異なる組合せを受け取る確率が高くなる(例えば、少なくとも94%、99.5%、99.99%、99.999%)のに十分な数である。
【0110】
一部の実施形態では、識別子は、所定、無作為または半無作為の配列のオリゴヌクレオチドである。他の実施形態では、複数のバーコード中のバーコードが互いに必ずしも一意でないような複数のバーコードが使用され得る。これらの実施形態では、バーコードは、一般に、個々の分子に(例えば、ライゲーションまたはPCR増幅により)結合され、その結果、バーコードとそれに結合され得る配列の組合せによって、個々に追跡することができる一意の配列が作出される。本明細書に記載されるように、配列リードの開始(出発)および終了(停止)部分の配列データと組み合わせて、非一意的にタグ付けされたバーコードを検出することにより、通常は、特定の分子に一意の同一性を割り当てることが可能になる。個々の配列リードの長さまたは塩基対の数も、必要に応じて、所与の分子に一意の同一性を割り当てるために使用される。本明細書に記載するように、それによって、一意の同一性が割り当てられた核酸の一本鎖からの断片により、親鎖および/または相補鎖からの断片のその後の同定が可能になり得る。
iii.核酸増幅
【0111】
アダプターと隣接している試料核酸は、通常は、試料収集および調製パイプライン103の一部として、増幅されることになるDNA分子に隣接しているアダプターの中のプライマー結合部位への核酸プライマーの結合を使用して、PCRおよび他の増幅方法により増幅される。一部の実施形態では、増幅方法は、熱循環の結果として生じる伸長、変性およびアニーリングのサイクルを含み、または例えば、転写媒介増幅の場合のように、等温性であることもある。必要に応じて利用される他の例示的な増幅方法としては、数ある手法の中でも特に、リガーゼ連鎖反応、鎖置換増幅、核酸配列ベース増幅、および自家持続配列ベース複製が挙げられる。
【0112】
従来の核酸増幅法を使用して核酸分子に分子タグおよび/または試料インデックス/タグを導入するために、1または複数ラウンドの増幅サイクルが一般に適用される。増幅は、通常は、1つまたは複数の反応混合物で行われる。分子タグおよび試料インデックス/タグは、必要に応じて、同時にまたは任意の順序で導入される。一部の実施形態では、分子タグおよび試料インデックス/タグは、配列捕捉ステップが行われる前におよび/または後に導入される。一部の実施形態では、分子タグのみがプローブ捕捉の前に導入され、試料インデックス/タグは、配列捕捉ステップが行われた後に導入される。ある特定の実施形態では、分子タグと試料インデックス/タグの両方が、プローブに基づく捕捉ステップを行う前に導入される。一部の実施形態では、試料インデックス/タグは、配列捕捉ステップが行われた後に導入される。通常は、配列捕捉プロトコールは、標的核酸配列、例えば、ゲノム領域のコード配列、およびがん型に関連するそのような領域の変異のコード配列、に相補的な一本鎖核酸分子を導入することを含む。通常は、増幅反応は、約200ヌクレオチド(nt)~約700nt、250nt~約350nt、または約320nt~約550ntの範囲のサイズの、分子タグおよび試料インデックス/タグで非一意的にまたは一意的にタグ付けされた複数の核酸アンプリコンを生成する。一部の実施形態では、アンプリコンは、約300ntのサイズを有する。一部の実施形態では、アンプリコンは、約500ntのサイズを有する。
iv.核酸濃縮
【0113】
一部の実施形態では、配列は、試料収集および調製パイプライン103の一部として、核酸をシークエンシングする前に濃縮される。濃縮は、必要に応じて、特定の標的領域に行われるか、または非特異的に(「標的配列」に)行われる。一部の実施形態では、目的の標的領域を、差次的タイリングおよび捕捉スキームを使用して1つまたは複数のベイトセットパネルに選択された核酸捕捉用プローブ(「ベイト」)を用いて濃縮することができる。差次的タイリングおよび捕捉スキームは、一般に、異なる相対濃度のベイトセットを使用して、ベイトに関連するゲノム領域にわたって差次的に(例えば、異なる「解像度」で)タイリングし、一連の制約(例えば、シーケンサーの制約、例えば、シークエンシング負荷、各ベイトの利用、など)をかけ、下流のシーケンシングに所望されるレベルで標的核酸を捕捉する。目的のこれらの標的ゲノム領域は、必要に応じて、核酸構築物の天然または合成ヌクレオチド配列を含む。一部の実施形態では、目的の1つまたは複数の区画にプローブを有するビオチン標識ビーズを使用して、標的配列を捕捉することができ、必要に応じて、続いてそれらの区画の増幅を行って、目的領域について濃縮することができる。
【0114】
配列捕捉は、通常は、標的核酸配列にハイブリダイズするオリゴヌクレオチドプローブの使用を含む。ある特定の実施形態では、プローブセット戦略は、目的の区画にわたってプローブをタイリングすることを含む。そのようなプローブは、例えば、長さ約60~約120ヌクレオチドであり得る。このセットは、約2倍、3倍、4倍、5倍、6倍、8倍、9倍、10倍、15倍、20倍、50倍またはそれを超える深度を有し得る。一般に、配列捕捉の有効性は、一部は、プローブの配列と相補的(またはほぼ相補的)である標的分子内の配列の長さに依存する。
b.核酸シークエンシング
【0115】
図2に示されているように、試料収集および調製パイプライン103による試料からのcfDNAの抽出および単離の後、1つまたは複数のシークエンシングデバイス107を含むシークエンシングパイプライン105によって、cfDNAをシークエンシングすることができる。事前に増幅されたまたはされていない、必要に応じてアダプターと隣接している、試料核酸が、一般に、シークエンシングに付される。必要に応じて利用されるシークエンシング方法または市販の形式としては、例えば、サンガーシークエンシング、ハイスループットシークエンシング、バイサルファイトシークエンシング、パイロシークエンシング、一塩基合成法、単一分子シークエンシング、ナノポアベースのシークエンシング、半導体シークエンシング、ライゲーションによるシークエンシング、ハイブリダイゼーションによるシークエンシング、RNA-Seq(Illumina)、Digital Gene Expression(Helicos)、次世代シークエンシング(NGS)、Single Molecule Sequencing by Synthesis(SMSS)(Helicos)、大規模並列シークエンシング、Clonal Single Molecule Array(Solexa)、ショットガンシークエンシング、Ion Torrent、Oxford Nanopore、Roche Genia、Maxim-Gilbertシークエンシング、プライマーウォーキング;PacBio、SOLiD、Ion Torrentまたはナノポアプラットフォームを使用するシークエンシングが、挙げられる。複数のレーン、複数のチャネル、複数のウェル、または実質的に同時に複数の試料セットを処理する他の手段を含み得る、様々な試料処理ユニットで、シークエンシング反応を行うことができる。試料処理ユニットは、複数の実行を同時に処理することを可能にするための複数の試料チャンバーも含み得る。
【0116】
シークエンシング反応を、がんのまたは他の疾患のマーカーを含有することが分かっている1つまたは複数の核酸断片型または区画に関して行うことができる。シークエンシング反応を、試料中に存在する任意の核酸断片に関して行うこともできる。シークエンシング反応は、ゲノムの少なくとも約5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、95%、99%、99.9%または100%である、ゲノムの配列カバレッジを提供することができる。他の場合には、ゲノムの配列カバレッジは、ゲノムの約5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、95%、99%、99.9%または100%未満であり得る。
【0117】
マルチプレックスシークエンシング技法を使用して、同時シークエンシング反応を行うことができる。一部の実施形態では、無細胞ポリヌクレオチドは、少なくとも約1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000または100,000のシークエンシング反応でシークエンシングされる。他の実施形態では、無細胞ポリヌクレオチドは、約1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000または100,000未満のシークエンシング反応でシークエンシングされる。シークエンシング反応は、通常は、逐次的にまたは同時に行われる。後続のデータ分析は、一般に、シークエンシング反応の全てまたは一部に関して行われる。一部の実施形態では、データ分析は、少なくとも約1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000または100,000のシークエンシング反応に関して行われる。他の実施形態では、データ分析は、約1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000または100,000未満のシークエンシング反応に関して行われ得る。例示的な読み取り深度は、1座位(塩基位置)あたり約1000~約50000リードである。
【0118】
一部の実施形態では、核酸集団は、シークエンシングのために、一方または両方の末端に一本鎖オーバーハングを有する二本鎖核酸に平滑末端を酵素的に形成することにより調製される。これらの実施形態では、集団は、ヌクレオチド(例えば、A、C、GおよびTまたはU)の存在下で、5’-3’DNAポリメラーゼ活性および3’-5’エキソヌクレアーゼ活性を有する酵素で通常は処理される。必要に応じて使用される例示的な酵素またはその触媒性断片としては、クレノウ大断片およびT4ポリメラーゼが挙げられる。5’オーバーハングでは、通常は、酵素は、反対の鎖上の陥凹3’末端を、その3’末端が5’末端とぴったり重なって平滑末端を生成するまで伸長する。3’オーバーハングでは、酵素は、反対の鎖の3’末端から5’末端までを一般に消化し、5’末端を超えて消化することもある。この消化が、反対の鎖の5’末端を超えて進行した場合、5’オーバーハングに使用されるのと同じポリメラーゼ活性を有する酵素が、そのギャップを埋めることができる。二本鎖核酸上の平滑末端の形成は、例えば、アダプターの結合およびその後の増幅を助長する。
【0119】
一部の実施形態では、核酸集団は、追加の処理、例えば、一本鎖核酸の二本鎖核酸への変換、および/またはRNAのDNAへの変換に付される。核酸のこれらの形態も、必要に応じて、アダプターに連結され、増幅される。
【0120】
事前に増幅されたまたはされていない、上記の平滑末端形成プロセスに付される核酸、および必要に応じて試料中の他の核酸をシークエンシングして、シークエンシングされた核酸を生じさせることができる。シークエンシングされた核酸は、核酸の配列(すなわち、配列情報)を指すこともあり、または配列が決定された核酸を指すこともある。シークエンシングを行って、試料中の個々の核酸分子の配列データを、試料中の個々の核酸分子の増幅産物のコンセンサス配列から、直接または間接的に得ることができる。
【0121】
一部の実施形態では、試料中の一本鎖オーバーハングを有する二本鎖核酸は、平滑末端形成後、両末端が、バーコードを含むアダプターに連結され、シークエンシングによって、核酸配列はもちろん、アダプターにより誘導されたインラインバーコードも決定される。平滑末端DNA分子は、少なくとも部分的に二本鎖のアダプター(例えば、Y型または釣り鐘型)の平滑末端に、必要に応じてライゲーションされる。あるいは、試料核酸およびアダプターの平滑末端に、ライゲーション(例えば、付着末端ライゲーション)を助長するために相補的ヌクレオチドの尾部をつけることができる。
【0122】
通常は、核酸試料を十分な数のアダプターと接触させ、したがって、同じ核酸の任意の2つのコピーが、両末端に連結されたアダプターからアダプターバーコードの同じ組合せを受け取る確率は低い(例えば、<1または0.1%)。このようにアダプターを使用することよって、参照核酸上の同じ開始および停止点を有し、かつバーコードの同じ組合せに連結されている、核酸配列のファミリーの同定が可能になる。そのようなファミリーは、増幅前の試料中の核酸の増幅産物の配列を示す。平滑末端形成およびアダプター結合により改変された場合、ファミリーメンバーの配列をコンパイルして、元の試料中の核酸分子のコンセンサスヌクレオチドまたは完全コンセンサス配列を導出することができる。言い換えると、試料中の核酸の特定位置を占めるヌクレオチドは、ファミリーメンバー配列中の対応する位置を占めるヌクレオチドのコンセンサスであると判定される。ファミリーは、二本鎖核酸の一方または両方の鎖の配列を含み得る。ファミリーのメンバーが、二本鎖核酸からの両方の鎖の配列を含む場合、一方の鎖の配列は、コンセンサスヌクレオチドまたは配列を導出するために全ての配列をコンパイルすることを目的として、それらの相補鎖に変換される。一部のファミリーは、単一のメンバー配列のみを含む。この場合、この配列を増幅前の試料中の核酸の配列と考えることができる。あるいは、単一のメンバー配列のみを有するファミリーを後続の分析から除外することができる。
【0123】
本明細書に記載される形式および応用を含む、核酸シークエンシングに関する追加の詳細は、例えば、Levy et al., Annual Review of Genomics and Human Genetics, 17: 95-115 (2016)、Liu et al., J. of Biomedicine and Biotechnology, Volume 2012, Article ID 251364:1-11 (2012)、Voelkerding et al., Clinical Chem., 55: 641-658 (2009)、MacLean et al., Nature Rev. Microbiol., 7: 287-296 (2009)、Astier et al., J Am Chem Soc., 128(5):1705-10 (2006)、米国特許第6,210,891号、米国特許第6,258,568号、米国特許第6,833,246号、米国特許第7,115,400号、米国特許第6,969,488号、米国特許第5,912,148号、米国特許第6,130,073号、米国特許第7,169,560号、米国特許第7,282,337号、米国特許第7,482,120号、米国特許第7,501,245号、米国特許第6,818,395号、米国特許第6,911,345号、米国特許第7,501,245号、米国特許第7,329,492号、米国特許第7,170,050号、米国特許第7,302,146号、米国特許第7,313,308号、および米国特許第7,476,503号においても提供されており、これらの参考文献は、各々、それら全体が参照により本明細書に組み込まれる。
i.シークエンシングパネル
【0124】
目的のゲノム領域を検出する尤度、および必要に応じて、変異を示す腫瘍を検出する尤度を高めるために、シークエンシングされるDNAの区画は、既知のゲノム領域を含む遺伝子またはゲノム区画のパネルを含み得る。限られた区画(例えば、限られたパネル)をシークエンシングに選択することによって、必要とされる全シークエンシング(例えば、シークエンシングされるヌクレオチドの総量)は低減され得る。シークエンシングパネルは、複数の異なる遺伝子または領域を、例えば、単一のがん、がんのセット、または全てのがんを検出するための標的とすることができる。あるいは、全ゲノムシークエンシング(WGS)、または他の不偏の(unbiased)シークエンシング方法によって、シークエンシングパネルを使用せずにDNAをシークエンシングすることができる。好適なパネルおよびパネルにおける使用のための標的の例は、2020年1月31日に出願された国際出願WO2020160414に記載されているエピジェネティック標的において見つけることができ、前記参考特許文献は、その全体が参照により本明細書に組み込まれる。
【0125】
一部の態様では、複数の異なる遺伝子またはゲノム領域(例えば、転写因子結合領域、遠位調節エレメント(DRE)、反復エレメント、イントロン-エクソン連結部、転写開始部位(TSS)、および/またはこれらに類するもの)を標的とするパネルが、がんを有する対象の所定の比率がパネル内の1つまたは複数の遺伝子において遺伝的バリアントまたは腫瘍マーカーを示すように選択される。パネルは、シークエンシングする領域を固定数の塩基対に限定するように選択され得る。パネルは、DNAの所望の量をシークエンシングするように選択され得る。パネルは、さらに、所望の配列読み取り深度を達成するように選択され得る。パネルは、シークエンシングされる塩基対の量について所望される配列読み取り深度または配列読み取りカバレッジを達成するように選択され得る。パネルは、試料中の1つまたは複数の遺伝的バリアントの検出についての理論感度、理論特異度、および/または理論精度を達成するように選択され得る。
【0126】
このパネルに含まれるHRR遺伝子は、ATM、ATR、BAP1、BARD1、BRCA1、BRCA2、BRIP1、CDK12、CHEK1、CHEK2、FANCA、FANCL、HDAC2、MRE11、NBN、PALB2、RAD50、RAD51、RAD51B、RAD51C、RAD51D、RAD54L、XRCC2、XRCC3のうちの1つまたは複数を含み得る。
【0127】
領域のパネルを検出するためのプローブは、目的のゲノム領域(ホットスポット領域)を検出するためのものはもちろん、ヌクレオソーム認識プローブ(例えば、KRASコドン12および13)も含むことができ、そのようなプローブを、ヌクレオソーム結合パターンおよびGC配列組成による影響を受けるcfDNAカバレッジおよび断片サイズの変動についての分析に基づいて捕捉を最適化するように設計することができる。この場合に使用される領域は、ヌクレオソーム位置およびGCモデルに基づいて最適化された非ホットスポット領域も含み得る。パネルは、原発組織を同定するためのサブパネル(例えば、組織にわたって最も多様な転写プロファイルを有する遺伝子(必ずしもプロモーターとは限らない)を代表する50~100のベイトを定義するための公開文献の使用)、全ゲノム足場を同定するためのサブパネル(例えば、超保存的ゲノムコンテンツを同定し、コピー数ベースライニングを目的として少数のプローブを用いて染色体全体にわたって疎にタイリングするための)、転写開始部位(TSS)/CpGアイランドを同定するためのサブパネル(例えば、差次的なメチル化領域(例えば、可変メチル化領域(DMR))を、例えば、腫瘍抑制遺伝子(例えば、大腸がんにおけるSEPT9/VIM)のプロモーターにおいて、捕捉するための)をはじめとする、複数のサブパネルを含み得る。一部の実施形態では、原発組織のためのマーカーは、組織特異的な後成的マーカーである。
【0128】
一部の実施形態では、パネル内の1つまたは複数の領域は、外科手術後の残存がんを検出するために1つまたは複数の遺伝子からの1つまたは複数の座位を含む。この検出は、既存のがん検出方法が可能であるものより早期であり得る。一部の実施形態では、パネル内の1つまたは複数の遺伝子位置は、高リスク患者集団においてがんを検出するために1つまたは複数の遺伝子からの1つまたは複数の座位を含む。例えば、喫煙者は、一般集団よりはるかに高い肺がん率を有する。さらに、喫煙者は、肺における不規則な小結節の発症などの、がんの検出をより困難にする他の肺の状態を発症し得る。一部の実施形態では、本明細書に記載される方法は、高リスク患者におけるがんを、既存のがん検出方法が可能であるものより早期に検出することができる。
【0129】
シークエンシングパネルに含めるための遺伝子位置を、腫瘍マーカーがその遺伝子または領域にあるがんを有する対象の数に基づいて選択することができる。シークエンシングパネルに含めるための遺伝子位置を、がんおよび腫瘍マーカーがその遺伝子に存在するがんを有する対象の有病率に基づいて選択することができる。領域内の腫瘍マーカーの存在は、がんを有する対象を示し得る。
【0130】
一部の事例では、1つまたは複数のデータベースからの情報を使用して、パネルを選択することができる。がんに関する情報は、がん腫瘍生検またはcfDNAアッセイから導出され得る。データベースは、シークエンシングされた腫瘍試料の集団を記述する情報を含み得る。データベースは、腫瘍試料におけるmRNA発現についての情報を含み得る。データベースは、腫瘍試料における調節エレメントまたはゲノム領域についての情報を含み得る。シークエンシングされた腫瘍試料に関する情報は、様々な遺伝的バリアントの頻度を含み得、遺伝的バリアントが存在する遺伝子または領域を記述するものであり得る。遺伝的バリアントは、腫瘍マーカーであり得る。そのようなデータベースの非限定的な例は、COSMICである。COSMICは、様々ながんに見られる体細胞変異のカタログである。特定のがんについて、COSMICは、変異の頻度に基づいて遺伝子をランク付けしている。所与の遺伝子の中での変異頻度が高いことから、パネルに含めるための遺伝子を選択することができる。例えば、COSMICは、シークエンシングされた乳がん試料の集団の33%がTP53の変異を有し、試料採取された乳がんの集団の22%がKRASの変異を有することを示す。APCをはじめとする、他のランク付けされた遺伝子は、シークエンシングされた乳がん試料の集団の約4%にしか見られない変異を有する。TP53およびKRASを、試料採取された乳がんの中で(例えば、約4%の頻度で存在するAPCと比較して)頻度が相対的に高いことに基づいてシークエンシングパネルに含めることができる。COSMICを非限定的な例として提供するが、がんを遺伝子または遺伝領域に位置する腫瘍マーカーと関連付ける任意のデータベースまたは情報セットを使用することができる。別の例では、COSMICにより提供されているように、1156の胆道がん試料のうちの380の試料(33%)は、TP53の変異を保有する。APCなどの、いくつかの他の遺伝子は、全試料の4~8%に変異を有する。したがって、TP53を、胆道がん試料の集団における相対的に高い頻度に基づいてパネルに含めるために選択することができる。
【0131】
遺伝子またはゲノム区画は、腫瘍マーカーの頻度が、試料採取された腫瘍組織または循環腫瘍DNAにおいて所与のバックグラウンド集団に見られる頻度より有意に高い場合、パネルに選択することができる。がんを有する対象の少なくとも大多数が、パネル内の遺伝子位置または遺伝子の少なくとも1つに存在する腫瘍マーカーまたはゲノム領域を有するような、遺伝子位置の組合せを、パネルに含めるために選択することができる。特定のがんまたはがんのセットについて、対象の大多数が、選択された領域の1つまたは複数に1つまたは複数の腫瘍マーカーを有することを示すデータに基づいて、遺伝子位置の組合せを選択することができる。例えば、がん1を検出するために、がん1を有する対象の90%がパネルの領域A、B、Cおよび/またはDに腫瘍マーカーを有することを示すデータに基づいて、領域A、B、Cおよび/またはDを含むパネルを選択することができる。あるいは、腫瘍マーカーは、がんを有する対象の2つまたはそれより多くの領域に独立して存在することが示されることがあり、したがって、併せると、2つまたはそれより多くの領域における腫瘍マーカーが、がんを有する対象の集団の大部分に存在する。例えば、がん2を検出するために、対象の90%が1つまたは複数の領域に腫瘍マーカーを有すること、ならびにそのような対象の30%では、腫瘍マーカーが領域Xにおいてのみ検出されるが、腫瘍マーカーが検出された対象の残部については腫瘍マーカーが領域Yおよび/またはZにおいてのみ検出されることを示すデータに基づいて、領域X、YおよびZを含むパネルを選択することができる。1つまたは複数のがんに関連することが以前に証明された1つまたは複数の遺伝子位置に存在する腫瘍マーカーは、腫瘍マーカーがそのときの50%またはそれより多くの領域の1つまたは複数で検出された場合、対象ががんを有することを示すことまたは予測することができる。1つまたは複数の領域内の腫瘍マーカーのセットについてのがんの頻度から判断してがんを検出する条件付き確率を利用するモデルなどの、計算論的手法を使用して、どの領域が、単独でまたは組合せで、がんを予測し得るのかを予測することができる。パネル選択のための他の手法は、大パネルでの腫瘍の包括的ゲノムプロファイリングおよび/または全ゲノムシークエンシング(WGS、RNA-seq、Chip-seq、バイサルファイトシークエンシング、ATAC-seqなど)を用いる研究からの情報を記述するデータベースの使用を含む。文献から集められた情報には、ある特定のがんの場合に一般に影響を受け、変異する経路も、記述されていることがある。遺伝子情報を記述するオントロジーの使用によって、パネル選択のさらなる情報を得ることができる。
【0132】
シークエンシングのためのパネルに含まれる遺伝子は、完全転写領域、プロモーター領域、エンハンサー領域、調節エレメント、および/または下流の配列を含み得る。変異を示す腫瘍を検出する尤度をさらに高めるために、エクソンのみをパネルに含めることができる。パネルは、選択された遺伝子の全てのエクソンを含むこともあり、または選択された遺伝子のエクソンのうちの1つだけもしくは複数を含むこともある。パネルは、複数の異なる遺伝子の各々からのエクソンを含むことがある。パネルは、複数の異なる遺伝子の各々からの少なくとも1つのエクソンを含むこともある。
【0133】
一部の態様では、複数の異なる遺伝子の各々からのエクソンのパネルは、がんを有する対象の所定の比率が、エクソンのパネル内の少なくとも1つのエクソンにおける遺伝的バリアントを示すように選択される。
【0134】
遺伝子のパネル内の異なる遺伝子各々からの少なくとも1つの全エクソンをシークエンシングすることができる。シークエンシングされるパネルは、複数の遺伝子からのエクソンを含み得る。パネルは、2~100の異なる遺伝子、2~70の遺伝子、2~50の遺伝子、2~30の遺伝子、2~15の遺伝子、または2~10の遺伝子からのエクソンを含み得る。
【0135】
選択されるパネルは、様々な数のエクソンを含み得る。パネルは、2~3000のエクソンを含み得る。パネルは、2~1000のエクソンを含み得る。パネルは、2~500のエクソンを含み得る。パネルは、2~100のエクソンを含み得る。パネルは、2~50のエクソンを含み得る。パネルは、300以下のエクソンを含み得る。パネルは、200以下のエクソンを含み得る。パネルは、100以下のエクソンを含み得る。パネルは、50以下のエクソンを含み得る。パネルは、40以下のエクソンを含み得る。パネルは、30以下のエクソンを含み得る。パネルは、25以下のエクソンを含み得る。パネルは、20以下のエクソンを含み得る。パネルは、15以下のエクソンを含み得る。パネルは、10以下のエクソンを含み得る。パネルは、9以下のエクソンを含み得る。パネルは、8以下のエクソンを含み得る。パネルは、7以下のエクソンを含み得る。
【0136】
パネルは、複数の異なる遺伝子からの1つまたは複数のエクソンを含み得る。パネルは、複数の異なる遺伝子のある比率の各々からの1つまたは複数のエクソンを含み得る。パネルは、異なる遺伝子の少なくとも25%、50%、75%または90%の各々からの少なくとも2つのエクソンを含み得る。パネルは、異なる遺伝子の少なくとも25%、50%、75%または90%の各々からの少なくとも3つのエクソンを含み得る。パネルは、異なる遺伝子の少なくとも25%、50%、75%または90%の各々からの少なくとも4つのエクソンを含み得る。
【0137】
シークエンシングパネルのサイズは、様々であり得る。例えば、シークエンシングされるヌクレオチドの総量、またはパネル内の特定の領域についてシークエンシングされる一意の分子の数を含む、いくつかの因子に依存して、シークエンシングパネルを(ヌクレオチドサイズに関して)より大きくまたはより小さくすることができる。シークエンシングパネルを5kb~50kbサイズにすることができる。シークエンシングパネルを10kb~30kbサイズにすることができる。シークエンシングパネルを12kb~20kbサイズにすることができる。シークエンシングパネルを12kb~60kbサイズにすることができる。シークエンシングパネルは、少なくとも10kb、12kb、15kb、20kb、25kb、30kb、35kb、40kb、45kb、50kb、60kb、70kb、80kb、90kb、100kb、110kb、120kb、130kb、140kb、または150kbのサイズであり得る。シークエンシングパネルは、100kb、90kb、80kb、70kb、60kb、または50kb未満のサイズであり得る。
【0138】
シークエンシングに選択されるパネルは、少なくとも1、5、10、15、20、25、30、40、50、60、80、または100の遺伝子位置(例えば、各々が目的のゲノム領域を含む)を含み得る。一部の場合には、位置のサイズが相対的に小さい、パネル内の遺伝子位置が、選択される。一部の場合には、パネル内の領域は、約10kbもしくはそれ未満、約8kbもしくはそれ未満、約6kbもしくはそれ未満、約5kbもしくはそれ未満、約4kbもしくはそれ未満、約3kbもしくはそれ未満、約2.5kbもしくはそれ未満、約2kbもしくはそれ未満、約1.5kbもしくはそれ未満、または約1kbもしくはそれ未満またはそれ未満のサイズを有する。一部の場合には、パネル内の遺伝子位置は、約0.5kb~約10kb、約0.5kb~約6kb、約1kb~約11kb、約1kb~約15kb、約1kb~約20kb、約0.1kb~約10kb、または約0.2kb~約1kbのサイズを有する。例えば、パネル内の領域は、約0.1kb~約5kbのサイズを有し得る。
【0139】
本明細書で選択されるパネルは、低頻度の遺伝的バリアント(例えば、試料から得られた無細胞核酸分子中の)を検出するのに十分である深いシークエンシングを可能にし得る。試料中の遺伝的バリアントの量は、所与の遺伝的バリアントについてのマイナーアレル頻度の点から言及されることがある。マイナーアレル頻度は、マイナーアレル(例えば、最も頻度の高いアレルではない)が、試料などの所与の核酸集団に存在する頻度を指し得る。低いマイナーアレル頻度の遺伝的バリアントは、試料中の存在頻度が相対的に低いものであり得る。一部の場合には、パネルは、少なくとも0.0001%、0.001%、0.005%、0.01%、0.05%、0.1%、または0.5%のマイナーアレル頻度の遺伝的バリアントの検出を可能にする。パネルは、0.001%またはそれより大きいマイナーアレル頻度の遺伝的バリアントの検出を可能にし得る。パネルは、0.01%またはそれより大きいマイナーアレル頻度の遺伝的バリアントの検出を可能にし得る。パネルは、0.0001%、0.001%、0.005%、0.01%、0.025%、0.05%、0.075%、0.1%、0.25%、0.5%、0.75%、または1.0%ほども低い頻度で試料中に存在する遺伝的バリアントの検出を可能にする。パネルは、少なくとも0.0001%、0.001%、0.005%、0.01%、0.025%、0.05%、0.075%、0.1%、0.25%、0.5%、0.75%、または1.0%の頻度で試料中に存在する腫瘍マーカーの検出を可能にする。パネルは、試料中の1.0%ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の0.75%ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の0.5%ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の0.25%ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の0.1%ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の0.075%ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の0.05%ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の0.025%ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の0.01%ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の0.005%ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の0.001%ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の0.0001%ほども低い頻度の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の1.0%~0.0001%ほども低い頻度のシークエンシングされたcfDNA中の腫瘍マーカーの検出を可能にし得る。パネルは、試料中の0.01%~0.0001%ほども低い頻度のシークエンシングされたcfDNA中の腫瘍マーカーの検出を可能にし得る。
【0140】
遺伝的バリアントを、疾患(例えば、がん)を有する対象の集団のパーセンテージで示すことができる。一部の場合には、がんを有する集団の少なくとも1%、2%、3%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、または99%は、パネル内の領域のうちの少なくとも1つの領域における1つまたは複数の遺伝的バリアントを示す。例えば、がんを有する集団の少なくとも80%は、パネル内のゲノム位置のうちの少なくとも1つのゲノム位置における1つまたは複数の遺伝的バリアントを示し得る。
【0141】
パネルは、1つまたは複数の遺伝子の各々からの目的のゲノム領域を含む1つまたは複数の位置を含み得る。一部の場合には、パネルは、少なくとも1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、50、または80の遺伝子の各々からの目的のゲノム領域を含む1つまたは複数の位置を含み得る。一部の場合には、パネルは、多くても1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、50、または80の遺伝子の各々からの目的のゲノム領域を含む1つまたは複数の位置を含み得る。一部の場合には、パネルは、約1~約80、1~約50、約3~約40、5~約30、10~約20の異なる遺伝子の各々からの目的のゲノム領域を含む1つまたは複数の位置を含み得る。
【0142】
1つまたは複数のエピジェネティックに改変された領域が検出されるように、パネル内のゲノム領域を含む位置を選択することができる。1つまたは複数のエピジェネティックに改変された領域は、アセチル化、メチル化、ユビキチン化、リン酸化、SUMO化、リボシル化、および/またはシトルリン化されていることがある。例えば、1つまたは複数のメチル化領域が検出されるように、パネル内の領域を選択することができる。
【0143】
パネル内の領域を、それらが1つまたは複数の組織にわたって差次的に転写された配列を含むように選択することができる。一部の場合には、ゲノム領域を含む位置は、ある特定の組織に他の組織と比較して高いレベルで転写された配列を含み得る。例えば、ゲノム領域を含む位置は、転写された配列をある特定の組織に含み得るが、他の組織には含み得ない。
【0144】
パネル内の遺伝子位置は、コードおよび/または非コード配列を含み得る。例えば、パネル内の遺伝子位置は、エクソン、イントロン、3’非翻訳領域、5’非翻訳領域、調節エレメント、転写開始部位、および/またはスプライス部位における1つまたは複数の配列を含み得る。一部の場合には、パネル内の領域は、偽遺伝子、反復配列、トランスポゾン、ウイルスエレメント、およびテロメアをはじめとする、他の非コード配列を含み得る。一部の場合には、パネル内の遺伝子位置は、非コードRNA、例えば、リボソームRNA、トランスファーRNA、Piwi結合RNA、およびマイクロRNA内の配列を含み得る。
【0145】
パネル内の遺伝子位置を、所望の感度レベルで(例えば、1つまたは複数の遺伝的バリアントの検出によって)がんを検出(診断)するように選択することができる。例えば、パネル内の領域を、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、または99.9%の感度で(例えば、1つまたは複数の遺伝的バリアントの検出によって)がんを検出するように選択することができる。パネル内の遺伝子位置を、100%の感度でがんを検出するように選択することができる。
【0146】
パネル内の遺伝子位置を、所望の特異度レベルで(例えば、1つまたは複数の遺伝的バリアントの検出によって)がんを検出(診断)するように選択することができる。例えば、パネル内の遺伝子位置を、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、または99.9%の特異度で(例えば、1つまたは複数の遺伝的バリアントの検出によって)がんを検出するように選択することができる。パネル内の遺伝子位置を、100%の特異度で1つまたは複数の遺伝的バリアントを検出するように選択することができる。
【0147】
パネル内の遺伝子位置を、所望の陽性予測値でがんを検出(診断)するように選択することができる。感度(実際の陽性が検出される機会)および/または特異度(実際の陰性を陽性と間違えない機会)を高めることによって、陽性予測値を上昇させることができる。非限定的な例として、パネル内の遺伝子位置を、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、または99.9%の陽性予測値で1つまたは複数の遺伝的バリアントを検出するように選択することができる。パネル内の領域を、100%の陽性予測値を有する1つまたは複数の遺伝的バリアントを検出するように選択することができる。
【0148】
パネル内の遺伝子位置を、所望の精度でがんを検出(診断)するように選択することができる。本明細書で使用される場合、用語「精度」は、疾患状態(例えば、がん)と健康な状態とを弁別する試験の能力を指す。精度は、感度および特異度、予測値、尤度比、ROC曲線下面積、ヨーデン指標および/または診断オッズ比などの尺度を使用して定量化することができる。
【0149】
精度は、パーセンテージとして提示することができ、このパーセンテージは、正しい結果を与える試験の数と行われた試験の総数との比を指す。パネル内の領域を、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、または99.9%の精度でがんを検出するように選択することができる。パネル内の遺伝子位置を、100%の精度でがんを検出するように選択することができる。
【0150】
高感度になるように、および低頻度の遺伝的バリアントを検出するように、パネルを選択することができる。例えば、試料中に0.01%、0.05%、または0.001%ほども低い頻度で存在する遺伝的バリアントまたは腫瘍マーカーを少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、または99.9%の感度で検出することができるように、パネルを選択することができる。パネル内の遺伝子位置を、試料中に1%またはそれ未満の頻度で存在する腫瘍マーカーを70%またはそれより高い感度で検出するように選択することができる。試料中の0.1%ほども低い頻度の腫瘍マーカーを少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、または99.9%の感度で検出するように、パネルを選択することができる。試料中の0.01%ほども低い頻度の腫瘍マーカーを少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、または99.9%の感度で検出するように、パネルを選択することができる。試料中の0.001%ほども低い頻度の腫瘍マーカーを少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、または99.9%の感度で検出するように、パネルを選択することができる。
【0151】
高い特異度になるように、および低頻度の遺伝的バリアントを検出するように、パネルを選択することができる。例えば、試料中に0.01%、0.05%、または0.001%ほども低い頻度で存在する遺伝的バリアントまたは腫瘍マーカーを少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、または99.9%の特異度で検出することができるように、パネルを選択することができる。パネル内の遺伝子位置を、試料中に1%またはそれ未満の頻度で存在する腫瘍マーカーを70%またはそれより高い特異度で検出するように選択することができる。試料中の0.1%ほども低い頻度の腫瘍マーカーを少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、または99.9%の特異度で検出するように、パネルを選択することができる。試料中の0.01%ほども低い頻度の腫瘍マーカーを少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、または99.9%の特異度で検出するように、パネルを選択することができる。試料中の0.001%ほども低い頻度の腫瘍マーカーを少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、または99.9%の特異度で検出するように、パネルを選択することができる。
【0152】
高精度になるように、および低頻度の遺伝的バリアントを検出するように、パネルを選択することができる。試料中に0.01%、0.05%、または0.001%ほども低い頻度で存在する遺伝的バリアントまたは腫瘍マーカーを少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、または99.9%の精度で検出することができるように、パネルを選択することができる。パネル内の遺伝子位置を、試料中に1%またはそれ未満の頻度で存在する腫瘍マーカーを70%またはそれより高い精度で検出するように選択することができる。試料中の0.1%ほども低い頻度の腫瘍マーカーを少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、または99.9%の精度で検出するように、パネルを選択することができる。試料中の0.01%ほども低い頻度の腫瘍マーカーを少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、または99.9%の精度で検出するように、パネルを選択することができる。試料中の0.001%ほども低い頻度の腫瘍マーカーを少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、または99.9%の精度で検出するように、パネルを選択することができる。
【0153】
高度に予測するように、および低頻度の遺伝的バリアントを検出するように、パネルを選択することができる。試料中に0.01%、0.05%、または0.001%ほども低い頻度で存在する遺伝的バリアントまたは腫瘍マーカーが少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、または99.9%の陽性予測値を有することができるように、パネルを選択することができる。
【0154】
パネルに使用されるプローブまたはベイトの濃度を、試料中のより多くの核酸分子を捕捉するために(2から6ng/μLに)上昇させることができる。パネルに使用されるプローブまたはベイトの濃度は、少なくとも2ng/μL、3ng/μL、4ng/μL、5ng/μL、6ng/μL、またはそれより高い濃度であり得る。プローブの濃度は、約2ng/μL~約3ng/μL、約2ng/μL~約4ng/μL、約2ng/μL~約5ng/μL、約2ng/μL~約6ng/μLであり得る。パネルに使用されるプローブまたはベイトの濃度は、2ng/μLまたはそれより高い濃度~6ng/μLまたはそれ未満の濃度であり得る。一部の事例では、これは、生物製剤中のより多くの分子を分析することを可能にし、それによって、より低頻度のアレルを検出することが可能になる。
【0155】
ある実施形態では、シークエンシング後、配列リードを配列リードデータストア109に記憶させることができる。配列リードを任意の形式で記憶させることができる。配列リードストア109は、シークエンシングが行われる位置に対してローカルおよび/または遠隔にあり得る。
【0156】
図2に示されているように、記憶された配列リードは、配列分析パイプライン112に供され得る。配列分析パイプライン112は、研究室システム102からの配列リードをフィルタリングすることができる配列品質管理(QC)構成要素113を含み得る。配列品質管理(QC)構成要素113は、1つまたは複数の配列リードに品質スコアを割り当てることができる。品質スコアは、配列リードの表示であって、それらの配列リードが閾値に基づいて後続の分析に有用であり得るかどうかを示す表示であり得る。一部の場合には、一部の配列リードは、後続のマッピングステップを行うのに十分な品質のものでも長さのものでもない。品質スコア少なくとも90%、95%、99%、99.9%、99.99%または99.999%を有する配列リードをフィルタリングして配列リードのデータセットから除去することができる。他の場合には、品質スコア少なくとも90%、95%、99%、99.9%、99.99%または99.999%が割り当てられた配列リードをフィルタリングしてデータセットから除去することができる。
【0157】
特定品質スコア閾値を満たす配列リードをコピー数モジュール115により参照ゲノムにマッピングすることができる。マッピングアラインメント後、配列リードにマッピングスコアを割り当てることができる。マッピングスコアは、各位置が一意的にマッピング可能であるか否かを示す、参照配列にマッピングし直された配列リードの表示であり得る。マッピングスコア少なくとも90%、95%、99%、99.9%、99.99%または99.999%を有する配列リードをフィルタリングしてデータセットから除去することができる。他の場合には、90%、95%、99%、99.9%、99.99%または99.999%未満のマッピングスコアが割り当てられた配列リードをフィルタリングして配列リードのデータセットから除去することができる。
【0158】
フィルタリング後、複数の配列リードは、染色体のカバレッジ領域を生成する。コピー数モジュール115は、その染色体領域を可変長のウインドウまたはビンに分割することができる。ウインドウまたはビンは、少なくとも5kb、10、kb、25kb、30kb、35、kb、40kb、50kb、60kb、75kb、100kb、150kb、200kb、500kb、または1000kbであり得る。ウインドウまたはビンはまた、5kb、10、kb、25kb、30kb、35、kb、40kb、50kb、60kb、75kb、100kb、150kb、200kb、500kb、または1000kb以下の塩基を有し得る。ウインドウまたはビンはまた、約5kb、10、kb、25kb、30kb、35、kb、40kb、50kb、60kb、75kb、100kb、150kb、200kb、500kb、または1000kbであり得る。
【0159】
コピー数モジュール115は、ウインドウまたはビンにほぼ同数のマッピング可能な塩基を含有させることにより、カバレッジを正規化することができる。一部の場合には、染色体領域内の各ウインドウまたはビンは、ちょうど同数のマッピング可能な塩基を含有することがある。他の場合には、各ウインドウまたはビンは、異なる数のマッピング可能な塩基を含有することもある。加えて、各ウインドウまたはビンは、隣接するウインドウともビンともオーバーラップしていないことがある。他の場合には、ウインドウまたはビンは、別の隣接するウインドウまたはビンとオーバーラップしていることもある。一部の場合には、ウインドウまたはビンは、少なくとも1bp、2、bp、3bp、4bp、5、bp、10bp、20bp、25bp、50bp、100bp、200bp、250bp、500bp、または1000bpオーバーラップしていることがある。他の場合には、ウインドウまたはビンは、1bp、2、bp、3bp、4bp、5、bp、10bp、20bp、25bp、50bp、100bp、200bp、250bp、500.bp、または1000bp以下オーバーラップしていることがある。一部の場合には、ウインドウまたはビンは、約1bp、2、bp、3bp、4bp、5、bp、10bp、20bp、25bp、50bp、100bp、200bp、250bp、500bp、または1000bpオーバーラップしていることがある。
【0160】
一部の場合には、ウインドウ領域の各々は、指定されたサイズを有することができ、そのため、それらは、ほぼ同数の一意的にマッピング可能な塩基を含有する。ウインドウ領域を構成する各塩基のマッピング可能性が決定され、マッピング可能性ファイルを生成するために使用され、このマッピング可能性ファイルは、各ファイルの参照にマッピングし直される参照からのリードの表示を含有する。マッピング可能性ファイルは、位置ごとに一行を含有し、これによって各位置が一意にマッピング可能であるか否かが示される。
【0161】
加えて、ゲノム全体にわたってシークエンシングが困難であることまたはかなり高いGCバイアスを含有することが分かっている、事前に定義されたウインドウを、データセットからフィルタリングすることができる。例えば、染色体のセントロメア(すなわち、セントロメアDNA)付近にあることが分かっている領域は、偽陽性結果を生じさせ得る高反復配列を含有することが分かっている。これらの領域をフィルタリングして除去することができる。ゲノムの他の領域、例えば、マイクロサテライトDNAなどの異常に高濃度の他の高反復配列を含有する領域を、データセットからフィルタリングすることができる。
【0162】
分析されるウインドウの数も、様々であり得る。一部の場合には、少なくとも10、20、30、40、50、100、200、500、1000、2000、5,000、10,000、20,000、50,000または100,000のウインドウが分析される。他の場合には、分析されるウインドウの数は、10、20、30、40、50、100、200、500、1000、2000、5,000、10,000、20,000、50,000または100,000以下であり、これらのウインドウが分析される。
【0163】
コピー数モジュール115は、ウインドウ/ビン領域ごとにリードカバレッジを決定することができる。この決定を、バーコードを伴うリードまたはバーコードを伴わないリードのどちらかを使用して行うことができる。バーコードを伴わない場合、前のマッピングステップは、異なる塩基位置のカバレッジを提供することになる。十分なマッピングおよび品質スコアを有する配列リードであって、フィルタリングされない染色体ウインドウ内に入る配列リードが、計数され得る。カバレッジリードの数に、各マッピング可能な位置ごとにスコアが割り当てられる。
【0164】
ある実施形態では、シークエンシングリードカバレッジに関する定量的測度は、遺伝子座位に対応するDNA分子に由来するリード(例えば、参照ゲノムからの特定の位置、塩基、領域、遺伝子または染色体)の数を示す測度である。リードを遺伝子座位と関連付けるために、リードを参照にマッピングまたはアラインすることができる。マッピングまたはアライニングを行うためのソフトウェア(例えば、Bowtie、BWA、mrsFAST、BLAST、BLAT)は、シークエンシングリードを遺伝子座位と関連付けることができる。マッピングプロセス中に、特定のパラメーターを最適化することができる。マッピング処理の最適化の非限定的な例としては、反復領域のマスキング;マッピング品質(例えば、MAPQ)スコアカットオフの利用;アラインメントを生成するための異なるシード長の使用;およびゲノム位置間の編集距離の制限を挙げることができる。
【0165】
シークエンシングリードカバレッジに関連する定量的測度は、遺伝子座位に関連付けられたリードの計数値を含み得る。一部の場合には、これらの計数値は、異なるシークエンシング深度、ライブラリーの複雑度、または遺伝子座位のサイズの効果を和らげるために、新たなメトリクスに変換される。例示的なメトリクスは、100万リードあたりのキロベースあたりのリード(RPKM:Read Per Kilobase per Million)、100万断片あたりのキロベースあたりの断片(FPKM:Fragments Per Kilobase per Million)、m値のトリム平均(TMM:Trimmed Mean of M values)、分散安定化された生の計数値、およびlog変換された生の計数値である。他の変換も、当業者には公知であり、それらを特定の応用に使用することができる。
【0166】
リードファミリーまたは折り畳まれたリードの各々が初期鋳型DNA分子に対応する、リードファミリーまたは折り畳まれたリードの数を使用して、定量的測度を決定することができる。リードファミリーを折り畳むためのおよび定量化するための方法は、PCT/US2013/058061およびPCT/US2014/000048において見つけることができ、これらの参考特許文献の各々は、その全体が参照により本明細書に組み込まれる。特に、参照配列にマッピングされたときに各ファミリーがバーコード配列とシークエンシングリード配列および/または同じゲノム座標の少なくとも一部分とを共有するように、シークエンシングリードからのバーコードおよび配列情報を使用してリードをファミリーに選別する、リードファミリーの定量化および/または折り畳み方法を、用いることができる。したがって、ファミリーの大部分について、各ファミリーは、単一の初期鋳型DNA分子に由来する。ファミリーからの配列のマッピングから導出される計数値を、「一意の分子計数値」(UMC)と呼ぶことができる。一部の場合には、シークエンシングリードカバレッジに関連する定量的測度を決定することは、ライブラリーサイズに関連するメトリクスによりUMCを正規化して、正規化されたUMC(「正規化UMC」)を得ることを含む。例示的な方法は、遺伝子座位のUMCを全てのUMCの合計で割ること;遺伝子座位のUMCを全ての常染色体UMCの合計で割ることである。複数のシークエンシングリードデータセットを比較する場合、UMCを、例えば、2つのシークエンシングリードデータセットの遺伝子座位のUMC中央値によって正規化することができる。一部の場合には、シークエンシングリードカバレッジに関連する定量的測度は、以下のようにさらに正規化される、正規化UMCであり得る:(i)訓練試料から導出されたシークエンシングリードからの対応する遺伝子座位について、正規化UMCを決定する;(ii)各遺伝子座位について、試料の正規化UMCを対応する座位における訓練試料の正規化UMCの中央値により正規化し、それによって、遺伝子座位の相対存在量(RA)を得る。
【0167】
コンセンサス配列を、それらの配列に基づいて、例えば、最初の5、10、15、20または25塩基の中の同一配列に基づいてシークエンシングリードを折り畳むことにより、同定することができる。一部の場合には、折り畳みは、他の点では同一であるリードにおける1つの差異、2つの差異、3つの差異、4つの差異、または5つの差異を許容する。一部の場合には、折り畳みは、リードのマッピング位置、例えば、シークエンシングリードの初期の塩基のマッピング位置を使用する。一部の場合には、折り畳みは、バーコードを使用し、バーコード配列を共有するシークエンシングリードがコンセンサス配列に折り畳まれる。一部の場合には、折り畳みは、バーコードと初期鋳型分子の配列との両方を使用する。例えば、バーコードを共有し、参照ゲノム内の同じ位置にマッピングされる全てのリードを、折り畳むことができる。別の例では、バーコードと初期鋳型分子の配列(または初期鋳型分子の配列に対する同一性パーセンテージ)とを共有する全てのリードを折り畳むことができる。
【0168】
一部の場合には、シークエンシングリードカバレッジの定量的測度は、ゲノムの特定の小領域について決定される。領域は、ビン、目的の遺伝子、エクソン、配列プローブに対応する領域、プライマー増幅産物に対応する領域、またはプライマー結合部位に対応する領域であり得る。一部の場合には、ゲノム小領域は、配列捕捉用プローブに対応する領域である。リードは、リードの少なくとも一部分が、配列捕捉用プローブに対応する領域の少なくとも一部分をマッピングする場合、配列捕捉用プローブに対応する領域に位置し得る。リードは、リードの少なくとも一部分が、配列捕捉用プローブに対応する領域の大部分に位置する場合、配列捕捉用プローブに対応する領域に位置し得る。リードは、リードの少なくとも一部分が、配列捕捉用プローブに対応する領域の中心点を横断して位置する場合、配列捕捉用プローブに対応する領域に位置し得る。
【0169】
バーコードを含む別の実施形態では、同じバーコード、物理的特性、またはこれら2つの組合せを有する全ての配列を、それらが試料親分子に由来する場合、1つのリードに折り畳んで、増幅中に導入された可能性があるバイアスを低減させることができる。例えば、ある分子は10回増幅されるが、別の分子は1000回増幅される場合、各分子折り畳み後に1回だけ提示されることによって、不均一な増幅の効果が打ち消される。一意のバーコードを有するリードのみが、マッピング可能な位置ごとに計数され得、割り当てられるスコアに影響を与え得る。
【0170】
コンセンサス配列を、配列リードのファミリーから当技術分野において公知の任意の方法により生成することができる。そのような方法としては、例えば、デジタル通信理論、情報理論、またはバイオインフォマティクスから導出された、コンセンサス配列の線形または非線形構築方法(例えば、投票、平均化、統計的、最大事後もしくは最大尤度検出、ダイナミックプログラミング、ベイジアン、隠れマルコフまたはサポートベクターマシン方法など)が挙げられる。
【0171】
配列リードカバレッジを決定した後、確率論的モデリングアルゴリズムを適用して、各ウインドウ/ビン領域についての正規化核酸配列リードカバレッジを別々のコピー数状態に変換することができる。一部の場合には、このアルゴリズムは、次のうちの1つまたは複数を含み得る:隠れマルコフモデル、ダイナミックプログラミング、サポートベクターマシン、ベイジアンネットワーク、トレリス復号、ビタビ復号、期待値最大化、カルマンフィルタリング方法論およびニューラルネットワーク。各ウインドウ領域の別々のコピー数状態を利用して、染色体領域におけるコピー数多様性を同定することができる。一部の場合には、同じコピー数を有する全ての隣接ウインドウ/ビン領域をマージしてセグメントにして、コピー数多様性状態の存在または非存在を報告することができる。一部の場合には、様々なウインドウ/ビンを、それらを他のセグメントとマージする前にフィルタリングすることができる。
【0172】
配列分析パイプライン112により分析および/または出力されたデータを、分析データストア117に記憶させることができる。
【0173】
バリアント検出パイプライン130は、分析データストア117からデータを取り込む/受信することができる。例えば、バリアント検出パイプライン130は、複数の配列リードを表すデータを取り込む/受信することができる。複数の配列リードを、コピー数モジュール115および/またはHRDモジュール300によって分析して1つまたは複数のバリアントを決定することができる。バリアントは、例えば、一塩基バリアント(SNV)、インデル、融合、およびコピー数多様性を含み得る。バリアントコーリングのための任意の公知の技法を使用することができる。ある実施形態では、シークエンシングされた核酸におけるヌクレオチドの多様性を、シークエンシングされた核酸を参照配列と比較することにより決定することができる。参照配列は、多くの場合、既知の配列、例えば、対象からの既知の全または部分ゲノム配列(例えば、ヒト対象からの全ゲノム配列)である。参照配列は、例えば、hG19またはhG38であり得る。シークエンシングされた核酸は、上で説明されたとおり、試料中の核酸について直接決定された配列を表すこともあり、またはそのような核酸の増幅産物の配列のコンセンサスであることもある。参照配列上の1つまたは複数の指定位置で比較を行うことができる。それぞれの配列を最大限にアラインしたときに参照配列の指定に対応する位置を含む、シークエンシングされた核酸配列のサブセットを同定することができる。そのようなサブセットの中で、もしあれば、シークエンシングされたどの核酸が、指定位置にヌクレオチドの多様性を含むのか;その終点(すなわち、その5’および3’末端ヌクレオチド)が参照配列に位置する場合、cfDNA断片内のゲノム領域の中点からの所与のcfDNA断片の中点のオフセットに基づいて、所与のcfDNA断片の長さ;および必要に応じて、もしあれば、どれが、参照ヌクレオチド(すなわち、参照配列内のものと同じもの)を含むのかを、決定することができる。ヌクレオチドバリアントを含むサブセット中のシークエンシングされた核酸の数が、選択された閾値を超えると、バリアントヌクレオチドは、指定位置でコールされ得る。閾値は、ヌクレオチドバリアントを含むサブセット内のシークエンシングされた核酸の少なくとも1、2、3、4、5、6、7、9もしくは10などの単純な数であり得、または閾値は、数ある可能性の中でも特に、ヌクレオチドバリアントを含むサブセット内のシークエンシングされた核酸の少なくとも0.5、1、2、3、4、5、10、15もしくは20などの比であり得る。参照配列中の目的の任意の指定位置について比較を繰り返すことができる。ときには、参照配列上の少なくとも約20、100、200または300の連続する位置、例えば、約20~500、約50~300の連続する位置、を占める指定位置について、比較を行うことができる。
【0174】
一般的に言えば、プロセッサー120は、バリアント検出パイプライン130の様々な構成要素、例えば、コピー数モジュール115、HRDモジュール300、および/または他の構成要素を実装し得る(そのような要素によってプログラムされ得る)。あるいは、バリアント検出パイプライン130のこれらの構成要素は、ハードウェアモジュールを含み得ることに留意されたい。便宜上、別々に図示されているが、コピー数モジュール115およびHRDモジュール300などの、様々な構成要素または命令の1つまたは複数を互いに統合することができる。いずれにせよ、バリアント検出パイプライン130は、コンピュータシステム110に、バリアント、バリアントからの疾患(正確な診断)、HRD、および/または処置レジメンを特定させることができる。正確な診断および処置レジメンを、臨床結果ストア160または診断結果ストア150などのレポジトリに記憶させることができる。
【0175】
HRDモジュール300を、配列分析パイプライン112からの出力データを分析するように構成することができる。HRDモジュール300を、デノボ融合再編成コール、欠失コール、SNV/インデル病原性の注釈、および/またはHRDスコアのうちの1つまたは複数を生じさせるように構成することができる。HRDモジュール300は、試料レベルHRDステータスの要約を生成するように構成されたHRDアグリゲーターを含み得る。
【0176】
図3に示されているように、HRDモジュール300を、融合コーラー301、欠失コーラー302、注釈モジュール303、HRDスコアリングモジュール304、アグリゲーター305、および/または出力モジュール306のうちの1つまたは複数を実行するように構成することができる。
【0177】
融合コーラー301を、配列分析パイプライン112から受信したデータを分析することにより1つまたは複数の候補融合コールを生成するように構成することができる。融合コーラー301を、候補融合リードをde Bruijnグラフでアセンブルし、候補融合事象をコールし、候補融合コールをフィルタリングし、技術上の偽陽性を除去するように、構成することができる。融合コーラー301を、融合候補リードを選択し、融合候補リードをパケットにクラスター化し、クラスター化された融合候補リードをアセンブルしてde Bruijnグラフアセンブリを生成するように、構成することができる。融合コーラー301を、de Bruijnグラフアセンブリを展開して融合候補コンティグにし、デコイを有する参照に融合候補コンティグをアラインし、候補融合コールを生成するように、構成することができる。
【0178】
ある実施形態では、融合コーラー301を、候補融合リードを選択し、一貫した切断点を有するリードを結合することによりリードの無向グラフGを作り、出力データをパケットとしてファイルに保存するように、構成することができる。融合コーラー301を、リードをハイブリッド化し、それらをアセンブルしてde Bruijnグラフアセンブリを生成するように、構成することができる。融合コーラー301を、アセンブリを展開して線状コンティグにするように構成することができる。融合コーラー301を、デコイを有する参照上のコンティグをアラインし、推定融合をコールするように、構成することができる。
【0179】
融合コーラー301を、1つまたは複数の基準に基づいて候補融合コールをフィルタリングするように構成することができる。1つまたは複数の基準は、候補融合を、その切断点がいずれもプローブセット内のプローブの1つから350塩基またはそれより大きく離れている場合、フィルタリングすることを含み得る。1つまたは複数の基準は、候補融合を、その切断点がいずれも遺伝子リスト内の遺伝子のうちの1つに属さない場合、フィルタリングすることを含み得る。1つまたは複数の基準は、候補融合を、互いに48塩基またはそれ未満離れている2つの欠失(96塩基またはそれ未満)からそれがなる場合、フィルタリングすることを含み得る。1つまたは複数の基準は、候補融合を、それが厳密に60塩基未満の欠失である場合、フィルタリングすることを含み得る。1つまたは複数の基準は、候補融合を、それが少なくとも1つの二本鎖分子支持体を有さず、その平均ファミリーサイズが<1/0.9(約1.10)である場合、フィルタリングすることを含み得る。平均ファミリーサイズは、支持分子の数で割った支持リードの数と定義され得る。1つまたは複数の基準は、第1の切断点に中心がある参照の120塩基セグメントと、第2の切断点に中心がある参照の120塩基セグメントとのアラインメントが、50またはそれより大きいアラインメントスコアを有する場合、候補融合をフィルタリングすることを含み得る。1つまたは複数の基準は、第1の切断点から長さ36離れているセグメントの、第2の切断点から長さ36離れているセグメントに対するアラインメントが、20またはそれより大きいアラインメントスコアを有する場合、候補融合をフィルタリングすることを含み得る。1つまたは複数の基準は、候補融合を、それがロバストな支持体を有さない場合、フィルタリングすることを含み得る。分子は、その分子が2またはそれより大きいファミリーサイズを有する場合(ここでのファミリーサイズは、その分子を支持するリードの数を指す)、ロバストとみなされ得る。
【0180】
候補融合が、1つの、および1つだけの他の候補融合と相互的なのものである場合、および他の候補融合が、いずれの他の基準によるフィルタリングによっても除去されていない場合、その候補融合を合格に格上げするように、融合コーラー301を構成することができる。候補融合の切断点の1つまたは複数が、増幅された領域にある場合、候補融合にタグ付けするように、融合コーラー301を構成することができる。
【0181】
融合コーラー301を、フィルタリングされた融合コールを含む融合データを出力するように構成することができる。融合データは、融合事象の深度分析のための補助データを含み得る。融合コーラー301により出力されたデータは、注釈モジュール303および/またはアグリゲーター305により読み取られ得る。
【0182】
図4は、本開示の実施形態に従ってデノボ融合コーラー(例えば、
図3で参照される融合(再編成)コーラー301)の模式図を示す。示されている実施形態では、融合コーラーは、共有切断点を調べること(ステップ1)、位置が特定されたバグをアセンブルすること(ステップ2)、位置が特定されたバグを線形化してコンティグにすること(ステップ3)、およびコンティグを参照配列にアラインすること(ステップ4)によって、リードの位置を特定して、所与の試料がHRD核酸バリアントを含むかどうかを決定する。一部の実施形態では、デノボ融合コーラーは、複数の配列リードを参照配列にアラインするように構成された命令、複数の配列リードの少なくとも1つの配列リードの参照配列へのアラインメントの切断点を決定するように構成された命令、アラインメントで切断点に関連付けられる任意の配列リードを候補融合配列リードとして同定するように構成された命令、および1つまたは複数の切断点のうちの共通の切断点に関連付けられる候補融合配列リードを決定するように構成された命令を含む。これらの実施形態は、通常は、1つまたは複数の共通の切断点に基づいて候補融合配列リードを群別化することも含み得る。ある実施形態では、リードを、ヌクレオチドの閾値ウインドウ内に切断点を有することに基づいて群別化(例えば、クラスター化)することができる。さらに、命令を、群内の候補融合配列リードをアセンブルして1つまたは複数のコンティグを生成するように、群からのコンティグを参照配列にアラインするように、群からのコンティグのアラインメントに基づいて1つまたは複数の候補融合事象を決定するように、1つまたは複数の候補融合事象に1つまたは複数の基準を適用するように、および1つまたは複数の候補融合事象への1つまたは複数の基準の適用に基づいて、第2のLoF HRD核酸バリアントを含む1つまたは複数の融合事象を決定するように、構成することができる。ある特定の実施形態では、基準は、フィルタリング基準、例えば、プローブ付近の切断点の非存在、報告すべき遺伝子における切断点の非存在、小さいインデルおよびイントロン事象の排除、「pc_molecules」テスト((pc_molecules=n_molecules/n_reads)の実行、および一部の実施形態では1.7未満である平均ファミリーサイズを有する融合の破棄、アドレススイッチに関連することが公知のアーチファクト、事象が「鋳型乗り換え」であり得る場合のそれらの排除、最小ロバスト分子検定の適用、ならびに/またはこれらに類するものを含む。本開示の方法および関連態様を行う際の使用に必要に応じて適応されるデノボ融合コーラーに関するさらなる詳細は、例えば、2020年2月27日に出願された米国特許出願第16/803,680号に記載されており、この参考特許文献は、その全体が参照により本明細書に組み込まれる。
【0183】
図3に戻って、欠失コーラー302を、配列分析パイプライン112から受信したデータ(例えば、コピー数データ)を分析することによって遺伝子およびゲノムワイドなレベルでホモ接合型欠失およびヘテロ接合性消失(LOH)を決定するように構成することができる。欠失コーラー302を、目的の領域のカバレッジと欠失を有さないがん試料から生成された参照プロファイルとを比較することによって欠失を検出するように構成することができる。
【0184】
ある実施形態では、欠失コーラー302は、セグメント化アルゴリズム(例えば、循環バイナリセグメンテーション(CBS)アルゴリズム)を利用して、コピー数データをセグメント化し、異常なコピー数を有するゲノム領域を同定することができる。セグメンテーションアルゴリズムは、最大t統計量に基づいて2つのサブセグメントまたは3つのサブセグメントのどちらかに染色体を再帰的に分割することによって、コピー数データを推定同コピー数領域にセグメント化することができる。分割するか否かを決めるために使用する参照分布を、順列により推定することができる。かくて、セグメンテーションアルゴリズムは、コピー数データにおける変化点を見つけることができる。変化点は、(log)試験対参照比が位置を変えた後の点を指し得る。それ故、変化点は、基礎となるDNAコピー数が変化した位置に対応する。したがって、変化点を使用して、コピー数獲得および喪失領域を同定することができる。セグメンテーションアルゴリズムの出力データは、行が、試料、染色体、開始および終了マップ位置、マーカー数、各セグメントの平均値を示す、表を含み得る。セグメンテーションアルゴリズムに関するさらなる詳細は、例えば、Olshen, A. B., Venkatraman, E. S., Lucito, R., Wigler, M. (2004). Circular binary segmentation for the analysis of array-based DNA copy number data. Biostatistics 5: 557-572、およびVenkatraman, E. S., Olshen, A. B. (2007) A faster circular binary segmentation algorithm for the analysis of array CGH data. Bioinformatics 23: 657-63に記載されており、各々の内容は、それら全体が参照により本明細書に組み込まれる。
【0185】
欠失が検出されると、その欠失をラベルするように、欠失コーラー302を構成することができる。例えば、欠失コーラー302を、欠失に「cov_del」、「loh」、「loh_cn_neutral」、または「homdel」とラベルするように構成することができる。欠失コーラー302は、生殖細胞系SNPの事前に定義されたリストの変異型アレル割合(MAF)を利用して、がん細胞が目的の領域の単一のコピーを有する(「LOH」とラベルする)かどうか、または両方のコピーが欠失されている(「homdel」とラベルする)かどうかを決定することができる。これら2つの場合の弁別子は、腫瘍細胞における単一コピーがヘテロ接合型SNP MAFのアレル不均衡を生じさせるという観察の中に存在する。決定規則は、2つのタイプの欠失を表す2つのモデルの尤度比が、「検出されない標的」(TND)試料の訓練セットから推定される閾値と比較される、尤度比検定に基づき得る。尤度モデルは、3つの可能なSNP遺伝子型全てについてのヘテロ接合型SNPの訓練されたMAF分布に基づき得る。ヘテロ接合型SNPが観察されない欠失の場合に使用される出力ラベルは、「cov_del」であり得、予測される欠失を表す第3のラベルを表す。
【0186】
図5に示されている、ある実施形態では、検出コーラー302は、目的の領域のカバレッジと501で欠失を有さないがん試料から生成された参照プロファイルとを比較することに基づいて欠失が観察されるかどうかを決定することにより、欠失コールを生成し得る。欠失が501で観察された場合、ベースラインMAFにより調整された遺伝子カバレッジおよびzスコアを、502で分析して体細胞が遺伝子欠失を有するかどうかを決定することができる。欠失が502で報告されなかった場合、結果として生じるコールは、欠失なしまたは増幅なし、503での「cnvなし」、であり得る。欠失が502で報告された場合、遺伝子をオーバーラップさせるヘテロ接合型SNPを504で同定することができる。遺伝子をオーバーラップさせるヘテロ接合型SNPが504で観察されなかった場合、遺伝子は、たとえ欠失があった、505で「cov_del」であった、としても差別化を図るためにヘテロ接合型SNPなしとコールされ得る。遺伝子をオーバーラップさせるヘテロ接合型SNPが504で観察された場合、アレル不均衡を示すヘテロ接合型SNPを506で決定することができる。506で、アレル不均衡を示すヘテロ接合型SNPが決定されなかった場合、遺伝子は、ホモ接合型欠失、「homdel」、と507でコールされ得る。506で、アレル不均衡を示すヘテロ接合型SNPが1つのコピーに関して決定された場合、遺伝子は、ヘテロ接合性消失、「LOH」、と508でコールされ得る。506で、アレル不均衡を示すヘテロ接合型SNPが、2つのコピーに関して決定された場合、遺伝子は、コピー数の変化を伴わないヘテロ接合性消失、「LOH CN NEUTRAL」、と509でコールされ得る。
【0187】
欠失コーラー302を、報告すべき遺伝子および/または有効遺伝子を決定するように構成することができる。有効遺伝子を最終欠失コール出力表に含めることができる。有効遺伝子は、次の基準を満たす遺伝子であり得る:良好なプローブの数が>30である、およびLOHの95%検出限界(LoD)が<0.3である(生物学的に重要な遺伝子について可能なこの閾値を満たすという例外)。報告すべきLOHまたはホモ接合型欠失遺伝子は、ヘテロ接合型SNPの検出確率>50%を伴う遺伝子であり得る。ヘテロ接合型SNPの検出確率が50%未満またはそれにに等しい場合、遺伝子は、カバレッジに基づく検出(「cov_del」)として報告され得る。
【0188】
ある特定の実施形態では、ホモ接合型欠失/LOH融合(CNV)コーラー(例えば、欠失コーラー302)は、遺伝子レベルのLOHを検出し、ホモ接合型欠失を検出し、および/または所与の試料中のゲノムワイドなLOHレベルを推定する。これらのインプリメンテーションの一部では、ホモ接合型欠失/LOH融合(CNV)コーラーは、通常は、HRR遺伝子欠失の検出について約5%検出限界(LOD)および99%より高い特異度を達成する。一部の実施形態では、CNVコーラーは、分子カバレッジに基づくものであり、SNP情報を使用してLOH(アレル不均衡)とホモ接合型欠失(SNPについての50%MAF)とを区別する。ある特定の実施形態では、CNVコーラーは、断片サイズ情報に基づくものである。これらのインプリメンテーションは、遺伝子またはゲノム領域および関連欠失の検出感度/特異度を向上させることができる、断片サイズ分布の使用を含む。
【0189】
さらに例を挙げて説明すると、一部の実施形態では、CNVコーラーは、考慮中の配列情報が第1の状態を含む第1の確率、および配列情報が第2の状態を含む第2の確率であって、第1または第2の状態がLoF HRD核酸バリアントを含む、第1の確率および第2の確率の使用を含む。通常は、これらの実施形態は、配列情報が第1の状態を含む第1の確率を生成すること、配列情報が第2の状態を含む第2の確率を生成すること、第1の確率と第2の確率を比較すること、および比較するステップに基づいて、配列情報が第1の状態を含むのか、または第2の状態を含むのかの予測を生成することを含む。これらの実施形態の一部では、CNVコーラーは、配列情報における少なくとも1つの遺伝子座位に関連する1つまたは複数の生殖細胞系一塩基多型(SNP)位置に基づくアレル計数値の第1のモデルを、第1の確率分布によって生成することを含む。第1のモデルは、通常は、少なくとも1つの体細胞ホモ接合型欠失を表す。これらの実施形態は、配列情報における遺伝子座位に関連する1つまたは複数の生殖細胞系SNP位置に基づくアレル計数値の第2のモデルを、第2の確率分布によって生成することも含む。第2のモデルは、一般に、少なくとも1つの体細胞ヘテロ接合型欠失を表す。これらのインプリメンテーションは、第1のモデルの第1の出力データと第2のモデルの第2の出力データを比較すること、および比較に基づいて、遺伝子座位についての体細胞ホモ接合型欠失が配列情報に存在するという予測を生成することも含む。ある特定の実施形態では、CNVコーラーは、考慮中の配列情報が体細胞ホモ接合型欠失を含む第1の確率、および配列情報が体細胞ヘテロ接合型欠失を含む第2の確率を生成し、第1の確率と第2の確率を比較し、比較に基づいて、配列情報が体細胞ホモ接合型欠失を含むのか、または体細胞ヘテロ接合型欠失を含むのかの予測を生成する。本開示の方法および関連態様を行う際の使用に必要に応じて適応されるCNVコーラーに関するさらなる詳細は、例えば、2020年2月27日に出願された通常の米国特許出願第16/803,680号に記載されており、この参考特許文献は、その全体が参照により本明細書に組み込まれる。
【0190】
欠失コーラー302を、欠失コールデータを出力するように構成することができる。欠失コールデータは、例えば、ラベル(例えば、no_cnv、cov_del、loh、loh_cn_neutral、homdel、no_call、およびこれらに類するもの)を示し得る。欠失コールデータは、例えば、loh/homdelが報告された遺伝子、および予測が単一ヘテロ接合型SNPに基づくときを示し得る。欠失コールデータは、例えば、異なる染色体上の複数の遺伝子が「homdel」とラベルされたとき(例えば、報告すべき遺伝子に限定されない、潜在的ベースラインMAFエラー)を示し得る。欠失コールデータは、例えば、体細胞SNV/インデルを有する遺伝子を示し得、「homdel」とラベルされる(例えば、潜在的ラベルエラー)。欠失コールデータは、パネル上の全ての遺伝子についての全てのCNVコール(増幅、局所性、欠失、異数性など)を含み得る。欠失コールデータは、次の状態:ホモ接合型欠失、LOH、カバレッジに基づく欠失、コピー数変化を伴わないLOH、またはコールなし、のうちの1つを有する、パネル上の全ての遺伝子を含み得る。欠失コールデータは、次の状態:ホモ接合型欠失、LOH、カバレッジに基づく欠失、コピー数変化を伴わないLOH、またはコールなし、のうちの1つを有する、全ての報告すべき遺伝子を含み得る。欠失コーラー302を、カバレッジおよびSNPを含む遺伝子レベルのLOHまたは欠失を要約するための1つまたは複数のプロットを決定し、出力するように、構成することができる。プロットは、プローブがHRR遺伝子によって、およびHRR遺伝子が、cov_del、homdel、loh欠失と報告されるかどうかによって強調表示されている、ゲノムワイドな(連結された全ての領域)および染色体レベルのCNVプロットを含み得る。欠失コールデータは、LOHまたは欠失を有するセグメントのパーセントを含み得る。欠失コールデータは、欠失コーリングに使用されるセグメントを含み得る。欠失コーラー302により出力されたデータは、HRDスコアリングモジュール304および/またはアグリゲーター305により読み取られ得る。
【0191】
図3に戻って、注釈モジュール303を、バリアントおよび表現型同士の関係(例えば、ClinVarデータ)などの、臨床的有意性を示すデータを提供するように構成することができる。注釈モジュール303を、一部のまたは全てのSNV/インデルについての機能的影響の注釈を提供するように構成することができる。注釈モジュール303を、体細胞コール(例えば、体細胞または生殖細胞系のもの)を示すように、および/またはコールされる融合についての機能的影響(例えば、GHまたは復帰変異による有害なものとみなされるもの)を示すように構成することができる。
【0192】
注釈モジュール303は、配列分析パイプライン112から受信したデータ、および/または融合コーラー301から受信した融合データを分析することができる。注釈モジュール303は、
図6に示されている注釈方法600を実行することができる。
【0193】
注釈モジュール303は、601で臨床的有意性を示すデータを決定することができる。注釈モジュール303は、試料中のバリアントに関連するデータをデータソースから取り込むことにより臨床的有意性を示すデータを決定することができる。例えば、臨床的有意性を示すデータは、遠隔またはローカルデータソースから取り込まれるClinVarデータであり得る。例えば、ClinVar VCFファイル中のそのバリアントについての「CLNSIG」フィールドからのデータを、染色体(「chrom」)、位置(「pos」)、変異型ヌクレオチド(「mut_nt」)、および遺伝子名(「gene」)に関するマッチングによって決定することができる。臨床的有意性を示すデータをバリアントに関連付けることができる。臨床的有意性を示すデータは、例えば、良性、良性の可能性が高い、不確実な陽性、病原性の可能性が高い、病原性、薬物応答、関連、リスク因子、保護的、情動、提出者からの矛盾するデータ、その他であることもあり、および/または提供されないこともある。臨床的有意性を示すデータは、データの正確さを示す審査ステータスに関することもあり、例えば、断定なし、提供された断定基準なし、個々のバリアントについての断定なし、提供された基準(単一の提出者)、提供された基準(矛盾する解釈)、提供された基準(複数の提出者、矛盾なし)、専門家パネルにより審査された、および/または診療ガイドラインであることもある。
【0194】
注釈モジュール303を、602で一部のまたは全てのSNV/インデルについての分子的帰結を決定するように構成することができる。試料中の一部または全てのバリアントに、一連の規則の適用に基づいて分子的帰結を割り当てることができる。規則が当てはまらない場合、分子的帰結は、「NULL」であり得る。これらの規則を、優先順位によって、すなわち、最上位から始めることによって適用することができ、1つの規則が当てはまった場合には残りの規則を無視することができる。分子的帰結は、例えば、ナンセンス、フレームシフト、ストップ喪失、スタート喪失、インフレーム挿入、インフレーム欠失、インフレーム重複、ミスセンス、スプライスアクセプター、スプライスドナー、同義、非コード、utr、プロモーター、スプライス領域、スプライス事象、およびこれらに類するものであり得る。
【0195】
注釈モジュール303を、603で一部のまたは全てのSNV/インデルについての機能的影響の注釈を決定するように構成することができる。試料におけるバリアント(SNV/インデル)は、「有害」または「NULL」と注釈され得る。例として、変異が、原因となり得る、もしくは疾患に強く関連し得る(例えば、「病原性」または「病原性の可能性が高い」)、および/または療法に対する応答に強く関連し得る(例えば、「薬物応答」)ことを示す臨床的有意性を示すデータに関連する任意の遺伝子におけるSNV/インデル。既知HRR遺伝子におけるSNV/インデル、またはナンセンス、フレームシフト、スプライスアクセプター、スプライスドナーのいずれかであり、一般的でなく(例えば、<0.001の集団アレル頻度)、3326より多いコドン数を有するBRCA2にはない、既知腫瘍抑制遺伝子におけるSNV/インデルは、有害と注釈され得る。いずれの残りのバリアントも、「NULL」と注釈され得る。
【0196】
注釈モジュール303を、604で復帰変異バリアント(例えば、小さいバリアント)を決定するように構成することができる。復帰変異バリアントは、病原性アレルにより破壊された遺伝子の機能を修復することができる。一般に、復帰変異バリアントは、以下の基準のいずれかが満たされた場合、決定される:
・ 有害なSNVと同じコドン内にあるSNVであって、コドンを有害でない状態に復帰させるSNV
・ 有害なSNV/インデルの位置全体に及ぶインフレームインデル
・ フレームシフトインデルと共に距離閾値内にあるインデルであって、タンパク質をフレーム内に戻すインデル
・ フレームシフトインデルから遠く離れているインデルであって、タンパク質を、それらがシスまたは有害なトランスと確認された場合、フレーム内に戻すインデル
・ 体細胞性である長い欠失であって、同じ遺伝子内の別の有害なSNVまたはインデルに及ぶ長い欠失。
【0197】
図7は、復帰バリアントを決定するための例となる方法700を示す。方法700に従って、生殖系列として分類されるが、復帰の要件を満たすSNVおよび小さいインデルについて、バリアントは、手動による再検討のためにフラグ付けされ得る。
【0198】
別のフレームシフトインデルの上流または下流にあり、タンパク質をインフレームに戻す(挿入または欠失されたヌクレオチドの合計が3の倍数になる)インデルは、そのインデルが、第2のフレームシフトインデルとシスである(同じ分子を共有する)と確認できる場合、「reversion_cis」と呼ばれる。バリアントがトランスである(異なる分子上にある)と確認される場合、注釈は、「deleterious_trans」と呼ばれる。支持分子が、シス/トランス注釈を決定するように両方のインデルにわたることがなく、タンパク質がインフレームに戻る場合、注釈は、単に「復帰」である。
【0199】
有害なSNV(例えば、ナンセンス、病原性ミスセンス)と同じコドン中にあり、コドンを非有害に(例えば、ナンセンスをミスセンスに、病原性ミスセンスを同義に)復帰させるSNVは、復帰と標識され得る。SNVが有害なSNVと同じゲノム位置にあるかどうかの決定がなされ得、SNVが有害なSNVと同じゲノム位置にあり、非有害の結果(例えば、「同義」)のものである場合、そのSNVは、復帰と標識され得る。
【0200】
インフレームであり、別の有害なSNVまたはインデルにわたるインデルは、復帰と標識され得る。
【0201】
注釈モジュール303は、604において復帰バリアント(例えば、長い欠失バリアント)を決定するようにも構成され得る。融合コーラー301から受け取った融合データからの融合および長い欠失は、体細胞コールおよび機能的影響を注釈するために使用され得る。長い欠失は、同じ遺伝子内のDNA配列の喪失を生じる大きいゲノム再編成として定義され得る。長い欠失についての体細胞分類は、注釈モジュール303によって行われ得る。融合および長い欠失は、バリアントパーセンテージが構成可能な閾値未満である(例えば、<15%)場合、体細胞と注釈され得、バリアントパーセンテージが構成可能な閾値より上である場合、生殖系列と注釈され得る。復帰の要件を満たす長い欠失は、バリアントパーセンテージにかかわらず、「体細胞」の体細胞コールを有し得る。長い欠失は、長い欠失が体細胞であり、同じ遺伝子中の別の有害なSNVまたはインデルにわたる場合、「復帰」の機能的影響を有し得る。
【0202】
復帰の要件を満たす、構成可能な閾値より上の(例えば、≧15%)バリアントパーセンテージを有する長い欠失は、「復帰」の機能的影響および「体細胞」の体細胞コールを有し得る。この体細胞ステータスは、構成可能な閾値によって決定された元の生殖系列コールを上書きする。ある実施形態では、全ての長い欠失は、その長い欠失が復帰とみなされない限り、「有害」の機能的影響の注釈を有し得る。ある実施形態では、少なくとも2つの異なる遺伝子間で生じる全ての融合は、「有害」の機能的影響の注釈を有し得る。
【0203】
注釈モジュール303は、注釈データを出力するように構成され得る。注釈データは、例えば、体細胞コールおよび機能的影響を示す融合表を含み得る。注釈データは、例えば、臨床的有意性データ、有害の注釈、および/または復帰の注釈を有する、コピー数モジュール115からの一部もしくは全てのSNV結果および/または一部もしくは全てのインデル結果を含むSNVコールデータを含み得る。注釈データは、例えば、臨床的有意性の注釈、分子的帰結、および/または機能的影響を有する、SNV/インデルコールに関連付けられたデータを含み得る。注釈モジュール303によるデータ出力は、HRDスコアリングモジュール304および/またはアグリゲーター305によって読み取られ得る。
【0204】
図3に戻ると、HRDスコアリングモジュール304は、HRDスコア(例えば、HRDの尺度の測定基準)を生成するために、融合コーラー301、欠失コーラー302および/または注釈モジュール303からのデータを分析および/または要約するように構成され得る。HRDスコアリングモジュール304は、最大体細胞アレル割合(msaf)を計算するために、配列分析パイプライン112および/またはバリアント検出パイプライン130からの一部または全ての体細胞バリアント出力からのデータを分析するように構成され得る。
【0205】
HRDスコアリングモジュール304は、少なくとも一部において、融合コーラー301によって決定された、再編成の数および/もしくは性質ならびに/または再編成の切断点の周囲の配列コンテキストを利用することによって、HRDスコアを生成するように構成され得る。
【0206】
HRDスコアリングモジュール304は、少なくとも一部において、欠失コーラー302によって決定された、試料1つ当たりの切断点および/または欠失を有するセグメントの数を要約することによって、HRDスコアを生成するように構成され得る。セグメントは、ゲノム中の異なるコピー数状態、より多くのコピー数状態、より多くのゲノム不安定性を示し得、潜在的に、基礎HRR欠損を示す。一般に、HRDスコアリングモジュール304は、以下のために構成され得る:
・ セグメント平均の1.5標準偏差以内にあるセグメント間の3MB未満の長さのセグメントをスムージングする
・ 染色体の長さの90%であるセグメントを除去する
・ 非HRD機構の産物であり得るセグメントを排除するための構成可能な長さ閾値(10Mb)未満であるセグメントをフィルタリングして除く
・ 隣接しているセグメント間の切断点の数を計数する
・ 正常または腫瘍が検出されない試料において見出される反復するセグメント(情報にならない場合がある)に関して、欠失コーラーからセグメントをフィルタリングする
・ 欠失(loh、homdel、またはカバレッジベースの欠失)を有するセグメントの数を計数する
・ 切断点および欠失セグメントの数を加算する
【0207】
ある実施形態では、HRDスコアの決定は、HRDステータスと相関する1つまたは複数の測定基準に基づき得る。例えば、1つまたは複数の測定基準は、ヘテロ接合性消失(LOH)、テロメアアレルインバランス(Telomere Allele Imbalance)(TAI)、大規模遷移(Large Scale Transitions)(LST)、それらの組合せなどのうち1つまたは複数を含み得る。
【0208】
LSTは、3MBの領域をフィルタリングした後の、少なくとも10Mbの隣接している領域間の切断点を指し得る。LSTの数は、隣接している切断点の数および遺伝子変異ステータスと相関する。3MBのカットオフは、大抵は染色体間転座を示す大規模な多様性から、HRDとは無関係な小規模な多様性を除去するために使用され得る。
【0209】
ある実施形態では、HRDスコアリングモジュール304は、
図8に示される方法800に従ってHRDスコアを決定するように構成され得る。HRDスコアリングモジュール304は、欠失コーリングのために使用されるセグメントを含む欠失コールデータにアクセスし得る。染色体の長さ(>90%)にわたるセグメントは、801において除去され得る。これらのセグメントは、HRDではなく染色体不分離から生じている可能性が高い。3MB未満の長さのセグメントは、802においてスムージングされ得る。セグメントをスムージングすることは、3MB以上離れていないセグメントを組み合わせることを含み得、第2のセグメントは、以前のセグメントの1.5標準偏差以内のセグメント平均(例えば、セグメント中の正規化されたカバレッジ)を有する。セグメントは、803においてサイズに基づいてフィルタリングされ得る。例えば、10Mb未満のセグメントが除去され得る。小規模な多様性のセグメントは、典型的には、大抵は染色体間転座を示すLSTと対比して、HRDとは無関係の染色体内再編成に対応する。技術的アーチファクトを示す可能性が高い、試料(患者試料、腫瘍が検出されない試料および健康な正常試料を含む)の大きいコホート中の反復する(例えば、>10回)ビン中のセグメントは、804において除去され得る。ビンサイズは、例えば、セグメントの開始点/終点のいずれかから500bpであり得る。ある特定のbp距離内の隣接しているセグメント間の切断点の数は、805において決定され得る。LOH、Homdel、および/または欠失の標識を有するセグメントの数は、806において決定され得る。切断点の数およびセグメントの数は、807においてHRDスコアを決定するために合計され得る。
【0210】
HRDスコアリングモジュール304は、例えば、最大体細胞アレル割合(MSAF)を使用して、試料から腫瘍割合を決定するように構成され得る。MSAFは、割合として表される、クローン性造血起源と注釈されない任意の体細胞バリアントであって、融合または非同義SNVまたはインデルである任意の体細胞バリアントを含む、試料中のバリアントの最大パーセンテージを含み得る。SNVにもインデルにも融合にもデノボ融合出力にも体細胞バリアントが存在しない場合、MSAFは0であり得る。雄性試料におけるX染色体上の増幅された遺伝子上に存在するバリアントについて、パーセンテージは、以下のように、一倍体染色体を説明するために調整され得る:
調整済みパーセンテージ=バリアントパーセンテージ/log2(遺伝子CN*2)、ここで、性別は、配列分析パイプライン112によって予測され得る。増幅された遺伝子上に存在する全ての他のバリアントについて、パーセンテージは、以下のように調整され得る:
調整済みパーセンテージ=バリアントパーセンテージ/log2(遺伝子CN)。腫瘍割合は、低い腫瘍シェディングを有する試料に関して、HRDスコアの調整済み推定値を得るために、HRDスコアリングモジュール304において使用され得る。
【0211】
図9は、がん型にわたる例となるHRDスコアのヒストグラムを示す。OMNI 2.12パネルからの臨床的患者試料を、HRDスコアについて評価した(卵巣および皮膚を除く全てのがん型についてn=200であり、卵巣および皮膚については、それぞれn=139およびn=113である)。HRDスコアにおけるより長いテイル(>100)が、乳房および泌尿生殖器がん型において観察された。
【0212】
HRDスコアモジュール305は、HRDスコアデータを出力するように構成され得る。HRDスコアデータは、例えば、HRDスコアおよび/またはMSAFを含み得る。ある実施形態では、MSAFは、スコアの情報を与え得る(例えば、低い腫瘍割合および低いスコアは、ある特定の条件下では閾値を越え得るが、高い腫瘍割合および低いスコアはそうではない場合がある)。
【0213】
HRDスコアは、閾値と比較され得る。試料のHRDスコアが閾値を超える場合、その試料は、HRD陽性として決定され得る。閾値は、特定の機能喪失型ゲノムバイオマーカー(例えば、BRCA1/2両アレル性不活性化)の存在によってHRD+veおよびHRD-veとみなされた腫瘍型ごとの集団の分析を介して、またはPARP阻害剤に対して臨床的に応答したもしくはしなかった腫瘍型ごとの集団に基づいて(応答者は、高いHRDスコアを有する可能性が高いはずである)、経験的に決定され得る。
【0214】
図3に戻ると、アグリゲーター305は、他のHRDモジュール(融合コーラー301、欠失コーラー302、注釈303、および/またはHRDスコアリングモジュール304)から試料-レベルサマリーを提供するように、および/または試料中の両アレル性不活性化を有するHRR遺伝子を決定するように構成され得る。アグリゲーター305は、融合コーラー301からのデータ、欠失コーラー302からのデータ(例えば、欠失コールデータ)、注釈モジュール303からのデータ(例えば、注釈データ)、および/またはHRDスコアリングモジュール304からのデータ(例えば、HRDスコアデータ)を分析するように構成され得る。
【0215】
ある実施形態では、アグリゲーター305は、機能的影響を有するデノボ融合コールと体細胞コールとを含む注釈データ;臨床的有意性の注釈、有害の注釈、および/もしくは復帰の注釈を有する、コピー数モジュール115からの一部もしくは全てのSNV結果を含むSNVコール;ならびに/または臨床的有意性の注釈、分子的帰結、および機能的影響を有する、SNV/インデルコールを含むデータを受け取る/検索することができる。ある実施形態では、アグリゲーター305は、以下の状態のうち1つを有する一部または全ての報告可能な遺伝子を含む欠失コールデータを受け取る/検索することができる:ホモ接合型欠失、LOH、カバレッジベースの欠失、コピー数変化を伴わないLOH、もしくはコールなし;および/またはセグメントに基づくゲノムワイドなLOHのコールを含むゲノムワイドなLOHコールデータ。ある実施形態では、アグリゲーター305は、HRDスコアおよび/または最大体細胞アレル割合を含むHRDスコアデータを受け取る/検索することができる。ある実施形態では、アグリゲーター305は、融合コーラー301によって検出された一部または全ての融合を含む融合データ、ならびに融合事象の深度分析のための補助データを受け取る/検索することができる。
【0216】
一実施形態では、アグリゲーター305は、例として、BRCA1/2機能の喪失にしばしば帰せられる、試料中の再編成の総数、またはHRDの特色/シグネチャー特徴、例えば、タンデム重複もしくは欠失、クラスタリングされた欠失およびクラスタリングされていない欠失(>100kb)、逆位ならびに染色体間転座を有するこれらの再編成のサブセットを決定し得る。別の実施形態では、アグリゲーター305は、これもまたBRCA1/2機能の喪失に先に帰せられた、試料中のインデルの総数、または基礎HRDを示すマイクロホモロジーを有する隣接する配列コンテキストを有するこれらのインデルのサブセットを決定し得る。
【0217】
両アレル性不活性化は、遺伝子の両方のコピーが機能喪失を示す場合に生じる;これは、遺伝子の両方のアレルにおける病原性バリアント、欠失、または再編成の存在を介して生じ得る。両アレル性不活性化を有する患者は、1つのアレルだけが不活性化された患者と比較して、より強いHRD表現型を有することが示されており、PARPで処置した場合、片アレル性不活性化と比較して、改善された臨床的利益を示し得る。アグリゲーター305は、試料中の遺伝子が両アレル性不活性化に関連するかどうかを決定するように構成され得、遺伝子がHRR遺伝子である場合には、以下のうち少なくとも1つが真である:
・ 遺伝子は、少なくとも2つの異なる有害なSNVまたはインデルを有する
・ 遺伝子は、少なくとも1つの融合/再編成状態にあり、少なくとも1つの有害なSNVまたはインデルを有する
・ 遺伝子は、少なくとも1つの有害なSNVまたはインデルを有し、LOHまたはカバレッジベースの欠失を有する
・ 遺伝子は、少なくとも1つの融合/再編成状態にあり、LOHまたはカバレッジベースの欠失を有する
・ 遺伝子は、2つの異なる融合/再編成状態にある(相互(reciprocal)融合も異なる切断点を有する同じ融合遺伝子対も含まない)
・ 遺伝子は、ホモ接合型欠失を有する
【0218】
アグリゲーター305は、HRR遺伝子リストを決定する/検索する/受け取るように構成され得る。アグリゲーター305は、同じHRR遺伝子において検出されたホモ接合型欠失および融合を有する試料をフラグ付けするように構成され得る。
【0219】
アグリゲーター305は、両アレル性変異の数、HRDスコアおよび最大体細胞アレル割合(MSAF)が含まれる(がこれらに限定されない)試料-レベルHRD情報を要約するデータを生成するように構成され得る。
【0220】
出力モジュール306は、手動による再検討を目的とした、コピー数モジュール115およびHRDモジュール300によってコールされた一部または全てのバリアントのユーザーフレンドリーなサマリーを出力するように構成され得る。出力モジュール306は、コピー数モジュール115およびHRDモジュール300の両方の出力からの測定基準を含む試料-レベルデータを生成するように構成され得る。出力モジュール306は、HRDモジュール300からもたらされた手動による再検討のフラグを要約する報告を生成するように構成され得る。報告は、手動による再検討を要求する試料およびバリアントを示し得る。出力モジュール306は、試料レベルおよびバリアントレベルのQC測定基準を含む報告を生成するように構成され得る。出力モジュール306は、報告を生成するために試料およびバリアントレベルのQC測定基準を得るように構成され得る。出力モジュール306は、コピー数モジュール115およびHRDモジュール300の両方からのバリアントコールおよび手動による再検討のコメントを要約する報告を生成するように構成され得る。出力モジュール306は、欠失コール、および対応するカットオフ閾値の表を生成するように構成され得る。
【0221】
図10は、一部の実施形態に従う、1つまたは複数のHRDスコアを生成する(例えば、システム100のHRDモジュール300を使用する)、および試験対象におけるHRDを検出する、例示的な方法ステップを概略的に示すフローチャートである。示されるように、方法1000は、所与のがん型を有する参照対象から得られた無細胞核酸(cfDNA)に由来する配列情報からのHRR遺伝子(例えば、相同組換え修復(HRR)遺伝子)のセットの中の遺伝子についての参照HRDスコアを生成して、参照HRDスコアのセットを生じさせるステップ(ステップ1001)を含む。一部の実施形態では、HRR遺伝子のセットは、表1に列挙されるものから選択される。所与の参照HRDスコアは、典型的には、所与のHRD核酸バリアントの保有率を含む。参照HRDスコアは、参照HRDスコアのセットに基づいて生成され得る(ステップ1002)。次いで、参照HRDスコアは、試験対象におけるHRDを検出するために使用され得る。方法1000に示されるように、これは、一般に、所与のがん型を有する試験対象から得られたcfDNAに由来する配列情報からのHRR遺伝子のセットの中の遺伝子についての試験HRDスコアを生成して、試験HRDスコアのセットを生じさせるステップ(ステップ1003)を含む。所与の試験HRDスコアは、典型的には、所与のHRD核酸バリアントの保有率を含む。一部の実施形態では、所与のHRD核酸バリアントは、対応するHRR遺伝子の片アレル性不活性化または両アレル性不活性化を生じさせる。試験対象におけるHRDを検出するために、方法1000は、試験HRDスコアのセットから試験HRDスコアを生成するステップ(ステップ1004)および試験HRDスコアが参照HRDスコアを超える場合、試験対象におけるHRDを検出するステップ(ステップ905)もまた含む。
【0222】
図11は、一部の実施形態に従う、所与のがん型を有する試験対象のHRDステータスを決定する(例えば、システム100のHRDモジュール300を使用する)例示的な方法ステップを概略的に示すフローチャートである。示されるように、方法1100は、試験対象から得られた無細胞核酸(cfDNA)に由来する配列情報からのHRR遺伝子(例えば、相同組換え修復(HRR)遺伝子)のセットの中の遺伝子についての試験HRDスコアを生成して、試験HRDスコアのセットを生じさせるステップ(ステップ1101)を含む。所与の試験HRDスコアは、一般に、所与のHRD核酸バリアントの保有率を含む。一部の実施形態では、HRR遺伝子のセットは、表1に列挙されるものから選択される。方法1100は、試験HRDスコアのセットから試験HRDスコアを生成するステップ(ステップ1102)もまた含む。さらに、方法1100は、試験HRDスコアを参照HRDスコアと比較するステップであって、参照HRDスコアより上である試験HRDスコアが、それらの試験HRDスコアがHRDを有する試験対象からのものであることを示し、参照HRDスコアであるかまたはそれ未満である試験HRDスコアが、それらの試験HRDスコアがHRDを欠いている試験対象からのものであることを示し、それによって、所与のがん型を有する試験対象のHRDステータスを決定する、ステップ(ステップ1103)もまた含む。
【0223】
方法1100は、1つまたは複数のがん型を有する1または複数の参照対象から得られた無細胞核酸(cfDNA)に由来する配列情報からの相同組換え修復(HRR)遺伝子のセットの中の1つまたは複数の遺伝子についての参照HRDスコアを生成して、参照HRDスコアのセットを生じさせるステップであって、所与の参照HRDスコアが、所与のHRD核酸バリアントの保有率を含む、ステップ、および参照HRDスコアのセットから参照HRDスコアを生成するステップをさらに含み得る。
【0224】
さらに説明するために、
図12は、一部の実施形態に従う、対象におけるHRDを検出する(例えば、システム100のHRDモジュール300を使用する)例示的な方法ステップを概略的に示すフローチャートである。示されるように、方法1200は、対象から得られた無細胞核酸(cfDNA)に由来する配列情報における少なくとも1つのHRD核酸バリアントの存在または非存在を、(i)配列情報が第1の状態を含む第1の確率、および配列情報が第2の状態を含む第2の確率であって、第1または第2の状態が少なくとも第1のHRD核酸バリアントを含む、第1の確率および第2の確率(例えば、本明細書に記載されるCNVコーラーを使用する)、および/または(ii)配列情報から生成された1つまたは複数のアラインされた連続する配列(コンティグ)であって、少なくとも第2のHRD核酸バリアントを含むアラインされたコンティグ(例えば、本明細書に記載されるデノボ融合コーラーを使用する)、を使用して決定することにより、対象におけるHRDを検出するステップ(ステップ1201)を含む。方法1200の一部の実施形態は、ステップ(i)~(ii)のうち1つだけを使用することを含むが、他の実施形態は、ステップ(i)~(ii)の各々を使用することを含む。
【0225】
図13は、一部の実施形態に従う、対象における疾患を処置する例示的な方法ステップを概略的に示すフローチャートである。示されるように、方法1300は、疾患(例えば、所与のがん型)、および疾患に関連するDNA損傷修復欠損(DDRD)(例えば、HRD)を有する対象に、1つまたは複数の療法(例えば、PARP阻害剤、BER阻害剤など)を投与するステップを含み、このDDRDは、対象から得られた無細胞核酸(cfDNA)に由来する配列情報における少なくとも1つのHRD核酸バリアントの存在を、(i)配列情報が第1の状態を含む第1の確率、および配列情報が第2の状態を含む第2の確率であって、第1または第2の状態が少なくとも第1のHRD核酸バリアントを含む、第1の確率および第2の確率(例えば、本明細書に記載されるCNVコーラーを使用する)、および/または(ii)配列情報から生成された1つまたは複数のアラインされた連続する配列(コンティグ)であって、少なくとも第2のHRD核酸バリアントを含むアラインされたコンティグ(例えば、本明細書に記載されるデノボ融合コーラーを使用する)、を使用して決定することにより、対象におけるHRDを検出するステップ(ステップ1301)によって検出される。方法1300の一部の実施形態は、ステップ(i)~(ii)のうち1つだけを使用することを含むが、他の実施形態は、ステップ(i)~(ii)の各々を使用することを含む。
【0226】
一部の実施形態では、第1のHRD核酸バリアントは、ホモ接合型欠失、ヘテロ接合性消失(LOH)バリアント(例えば、遺伝子特異的LOHバリアント、コピー数変化を伴わないLOHバリアント、および/またはゲノムワイドなLOHバリアント)、コピー数多様性(CNV)などを含む。ある特定の実施形態では、第2のHRD核酸バリアントは、構造的再編成(例えば、短縮再編成、マルチエクソン欠失など)を含む。一部の実施形態では、第1および/または第2のHRD核酸バリアントは、一塩基多様性(SNV)、インデルなどを含む。
【0227】
これらの方法におけるステップ(i)および/または(ii)の技法は、配列情報のセグメントを少なくとも1つの参照配列にアラインすることを少なくとも含み得る。これらの方法は、ステップ(i)~(ii)のうち1つだけを使用することを含み得る。これらの方法は、ステップ(i)~(ii)の各々を使用することを含み得る。
【0228】
これらの方法における少なくとも1つの相同組換え修復(HRR)遺伝子は、HRD核酸バリアントを含み得る。これらの方法におけるHRR遺伝子は、ATM、ATR、BARD1、BRCA1、BRCA2、BRIP1、CDK12、CHEK1、CHEK2、FANCA、FANCL、NBN、PALB2、RAD51、RAD51B、RAD51C、RAD51D、RAD54L、HDAC2、MRE11、PPP2R2A、XRCC5、WRN、MLH1、FANCC、BAP1、XRCC2、XRCC3、およびRAD50からなる群から選択され得る。HRR遺伝子のセットは、少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、またはそれより多くの遺伝子を含み得る。
【0229】
これらの方法におけるHRD核酸バリアントの1つまたは複数は、所与のHRR遺伝子の両アレル性不活性化を生じさせ得る。これらの方法におけるHRD核酸バリアントの1つまたは複数は、所与のHRR遺伝子の片アレル性不活性化を生じさせ得る。これらの方法におけるHRD核酸バリアントは、疾患を有する対象と相関し得る。対象は、疾患を有するかどうかがわかっていない場合がある。対象は、疾患を有することがわかっている場合がある。疾患は、がんであり得る。
【0230】
これらの方法は、疾患を処置するために対象に1つまたは複数の療法を投与するステップを含み得る。療法は、少なくとも1つのポリADPリボースポリメラーゼ(PARP)阻害剤を含み得る。療法は、少なくとも1つの塩基除去修復(BER)阻害剤を含み得る。
【0231】
これらの方法のステップ(i)は、配列情報が第1の状態を含む第1の確率を生成すること、配列情報が第2の状態を含む第2の確率を生成すること;第1の確率と第2の確率を比較すること、および比較に基づいて、配列情報が、第1の状態を含むのか、または第2の状態を含むのかについての予測を生成することを含み得る。
【0232】
これらの方法のステップ(i)は、配列情報における少なくとも1つの遺伝子座位に関連する1つまたは複数の生殖細胞系列一塩基多型(SNP)位置に基づくアレル計数値の第1のモデルであって、少なくとも1つの体細胞ホモ接合型欠失を表す第1のモデルを、第1の確率分布によって生成すること、配列情報における遺伝子座位に関連する1つまたは複数の生殖細胞系列SNP位置に基づくアレル計数値の第2のモデルであって、少なくとも1つの体細胞ヘテロ接合型欠失を表す第2のモデルを、第2の確率分布によって生成すること、第1のモデルの第1の出力物と第2のモデルの第2の出力物を比較すること、および比較に基づいて、遺伝子座位についての体細胞ヘテロ接合型欠失が配列情報に存在するという予測を生成することを含み得る。
【0233】
これらの方法のステップ(i)は、配列情報が体細胞ホモ接合型欠失を含む第1の確率を生成すること、配列情報が体細胞ヘテロ接合型欠失を含む第2の確率を生成すること、第1の確率と第2の確率を比較すること、および比較に基づいて、配列情報が、体細胞ホモ接合型欠失を含むのか、または体細胞ヘテロ接合型欠失を含むのかについての予測を生成することを含み得る。
【0234】
これらの方法のステップ(ii)は、複数の配列リードを参照配列にアラインすること、複数の配列リードの少なくとも1つの配列リードの参照配列へのアラインメントで1つまたは複数の切断点を決定すること、アラインメントで1つまたは複数の切断点に関連付けられる任意の配列リードを候補融合配列リードとして同定すること、1つまたは複数の切断点のうちの共通の切断点に関連付けられる候補融合配列リードを決定すること、1つまたは複数の共通の切断点に基づいて候補融合配列リードを群別化すること、各群内の候補融合配列リードをアセンブルして1つまたは複数のコンティグを生成すること、各群からのコンティグを参照配列にアラインすること、各群からのコンティグのアラインメントに基づいて、1つまたは複数の候補融合事象を決定すること、1つまたは複数の候補融合事象に1つまたは複数の基準を適用すること、および1つまたは複数の候補融合事象への1つまたは複数の基準の適用に基づいて、第2のHRD核酸バリアントを含む1つまたは複数の融合事象を決定することを含み得る。
【0235】
これらの方法は、CNVおよび/またはデノボ融合コーラーを使用してHRD、または対象におけるHRDを検出するステップを含み得る。遺伝子は、HRD核酸バリアントを含み得る。
【0236】
ある実施形態では、
図14に示されるように、HRDステータスを決定するための方法1400が開示される。ある実施形態では、配列QC構成要素113、コピー数モジュール115、および/またはHRDモジュール300は、単独で、および/またはそれらの組合せで、配列リードデータストア150および/または分析データストア117にアクセスし、方法1400を全体においておよび/または一部において行うように構成され得る。方法1400は、単一のコンピュータデバイス、複数のコンピュータデバイスなどによって、全体においてまたは一部において行われ得る。方法1400は、ステップ1401において、生体試料の配列データを決定するステップを含み得る。生体試料は、無細胞DNA(cfDNA)を含み得る。方法1400は、ステップ1402において、配列データに基づいて、カバレッジデータを決定するステップを含み得る。方法1400は、ステップ1403において、カバレッジデータに基づいて、1つまたは複数の融合事象に関連する1つまたは複数の切断点を決定するステップを含み得る。方法1400は、ステップ1404において、カバレッジデータに基づいて、1つまたは複数の遺伝子に関連する1つまたは複数の欠失を決定するステップを含み得る。方法1400は、ステップ1405において、1つまたは複数の切断点および1つまたは複数の欠失に基づいて、相同組換え欠損(HRD)スコアを決定するステップを含み得る。方法1400は、ステップ1406において、HRDスコアに基づいて、生体試料を分類するステップを含み得る。方法1400は、ステップ1406において、HRDスコアに基づいて、生体試料をHRD陽性として分類するステップを含み得る。方法1400は、ステップ1406において、HRDスコアに基づいて、生体試料をHRD陰性として分類するステップを含み得る。
【0237】
生体試料の配列データを決定するステップは、1つまたは複数のHRR遺伝子のパネルをシークエンシングすることを含み得る。1つまたは複数のHRR遺伝子は、ATM、ATR、BARD1、BRCA1、BRCA2、BRIP1、CDK12、CHEK1、CHEK2、FANCA、FANCL、NBN、PALB2、RAD51、RAD51B、RAD51C、RAD51D、RAD54L、HDAC2、MRE11、PPP2R2A、XRCC5、WRN、MLH1、FANCC、BAP1、XRCC2、XRCC3、およびRAD50からなる群から選択され得る。
【0238】
生体試料は、疾患を有する対象に関連付けられ得る。疾患は、がんであり得る。カバレッジデータは、複数のビンに関連付けられ得る。複数のビンは、染色体の領域を示し得る。
【0239】
カバレッジデータに基づいて、1つまたは複数の融合事象に関連する1つまたは複数の切断点を決定するステップは、配列データからの複数の配列リードを参照配列にアラインすること、複数の配列リードについての複数の配列リードの参照配列へのアラインメントで1つまたは複数の切断点を決定すること、アラインメントで1つまたは複数の切断点に関連付けられる任意の配列リードを候補融合配列リードとして同定すること、1つまたは複数の切断点のうちの共通の切断点に関連付けられる候補融合配列リードを決定すること、1つまたは複数の共通の切断点に基づいて候補融合配列リードを群別化すること、群内の候補融合配列リードをアセンブルして1つまたは複数のコンティグを生成すること、複数の群のうちの群からのコンティグを参照配列にアラインすること、群からのコンティグのアラインメントに基づいて、1つまたは複数の候補融合事象を決定すること、1つまたは複数の候補融合事象に1つまたは複数の基準を適用すること、および1つまたは複数の候補融合事象への1つまたは複数の基準の適用に基づいて、1つまたは複数の融合事象を決定することを含み得る。
【0240】
カバレッジデータに基づいて、1つまたは複数の遺伝子に関連する1つまたは複数の欠失を決定するステップは、カバレッジデータに基づいて、複数のセグメントを決定することを含み得、複数のセグメントは、変化点により分離されている。複数のセグメントを決定することは、セグメンテーションアルゴリズムを適用することを含み得る。セグメンテーションアルゴリズムは、循環バイナリセグメンテーションアルゴリズムを含み得る。変化点は、基礎DNAコピー数が変化したことをカバレッジデータが示す位置に対応し得る。1つまたは複数の欠失は、ホモ接合型欠失またはヘテロ接合性消失(LOH)欠失の1つまたは複数を含み得る。
【0241】
方法1400は、複数のセグメントを参照配列と比較して、少なくとも1つの欠失を含む複数のセグメントのサブセットを同定するステップ、複数のセグメントのサブセットから、染色体の長さにわたる任意のセグメントを除去するステップ、複数のセグメントのサブセットの中の、閾値距離以上離れていない任意のセグメントを組み合わせるステップ、複数のセグメントのサブセットから、閾値長未満の長さを有する任意のセグメントを除去するステップ、および複数のセグメントのサブセットから、技術的アーチファクトに関連する任意のセグメントを除去するステップをさらに含み得る。方法1400は、複数のセグメントのサブセットの中の1つまたは複数の残存セグメントに基づいて、および1つまたは複数の融合事象に関連する1つまたは複数の切断点に基づいて、閾値内の隣接しているセグメント間の切断点の数を決定するステップをさらに含み得る。
【0242】
方法1400は、複数のセグメントのサブセットの中の1つまたは複数の残存セグメントに基づいて、目的の領域の単一のコピーに関連する、または欠失される目的の領域の両方のコピーに関連する、セグメントの数を決定するステップをさらに含み得る。
【0243】
1つまたは複数の切断点および1つまたは複数の欠失に基づいて、HRDスコアを決定するステップは、切断点の数およびセグメントの数を合計することを含み得る。
【0244】
方法1400は、シークエンシングデータに基づいて、1つまたは複数のゲノム再編成の存在を決定するステップをさらに含み得る。HRDスコアを決定するステップは、1つまたは複数のゲノム再編成にさらに基づき得る。HRDスコアを決定するステップは、切断点の数、セグメントの数、およびゲノム再編成の数を合計することを含み得る。
【0245】
方法1400は、最大体細胞アレル割合(MSAF)を決定するステップをさらに含み得る。MSAFを決定するステップは、クローン性造血起源と注釈されない任意の体細胞バリアントであって、融合または非同義SNVまたはインデルである任意の体細胞バリアントを含む、生体試料中のバリアントの最大パーセンテージを、配列データに基づいて決定することをさらに含み得る。
【0246】
方法1400は、配列データに含有されている1つまたは複数のバリアントを注釈するステップをさらに含み得る。配列データに含有されている1つまたは複数のバリアントを注釈するステップは、ヒトの健康への1つまたは複数のバリアントの影響に関連する臨床的有意性の注釈を決定することを含み得る。
【0247】
方法1400は、配列データ、カバレッジデータ、1つまたは複数の切断点、1つまたは複数の欠失、およびHRDスコアを集約するステップをさらに含み得る。方法1400は、集約された配列データ、カバレッジデータ、1つまたは複数の切断点、1つまたは複数の欠失、およびHRDスコアを出力するステップをさらに含み得る。
【0248】
HRDスコアに基づいて、生体試料をHRD陽性として分類するステップは、HRDスコアが閾値を超えると決定することを含み得る。HRDスコアに基づいて、生体試料をHRD陰性として分類するステップは、HRDスコアが閾値を超えないと決定することを含み得る。方法1400は、1つまたは複数の参照HRDスコアに基づいて閾値を決定することをさらに含み得る。閾値は、参照HRDスコアを含み得る。1または複数の参照対象から得られた無細胞核酸(cfDNA)に由来する配列情報は、参照HRDスコアのセットを生じさせるために使用され得る。参照対象は、生体試料がそれから採取された対象と同じ状態を有し得る。例えば、参照対象および生体試料がそれから採取された対象は、同じ疾患(例えば、がんおよび/またはがん型)を有し得る。参照HRDスコアは、例えば、参照HRDスコアのセットの平均(または他の統計的分析)を取ることによって、参照HRDスコアのセットから生成され得る。
【0249】
方法1400は、生体試料をHRD陽性として分類するステップに基づいて、療法を投与するステップをさらに含み得る。療法は、ポリADPリボースポリメラーゼ(PARP)阻害剤または塩基除去修復(BER)阻害剤であり得る。PARP阻害剤は、ベリパリブ、オラパリブ、タラゾパリブ、ルカパリブ、ニラパリブ、パミパリブ、CEP9722、E7016、E7449、または3-アミノベンズアミドのうちの少なくとも1つであり得る。療法は、PARP阻害剤と放射線療法の組合せであり得る。
【0250】
図面に示される種々の処理操作および/または方法は、本明細書に詳細に記載されるシステム構成要素の一部または全てを使用して達成され得、一部のインプリメンテーションでは、種々の操作は異なるシーケンスで行われ得、種々の操作は割愛され得る。さらなる操作が、示されたフローダイヤグラム中に示される操作の一部または全てと共に行われ得る。1つまたは複数の操作は、同時に行われ得る。したがって、例示される(本明細書にさらに詳細に記載される)操作は、例として提供されており、したがって、限定とみなすべきではない。
【0251】
コンピュータインプリメンテーション
【0252】
湿式化学ステップ以外の、本明細書および添付の特許請求の範囲に記載された任意のまたは全ての操作が、適切なプログラミングされたコンピュータで行われ得るように、本発明の方法は、コンピュータで実施され得る。コンピュータは、メインフレーム、パーソナルコンピュータ、タブレット、スマートフォン、クラウド、オンラインデータストレージ、リモートデータストレージなどであり得る。コンピュータは、1つまたは複数の場所で操作され得る。
【0253】
本発明の方法の種々の操作は、コンピュータ可読媒体(例えば、ハードドライブ、補助メモリ、外部メモリ、サーバー;データベース、ポータブルメモリデバイス(例えば、CD-R、DVD、ZIPディスク、フラッシュメモリカード)など上に記憶された情報および/またはプログラムを利用でき、および/または結果を生成することができる。
【0254】
本開示は、実行された場合に本発明の方法のステップを実施する1つまたは複数のプログラムを含有する機械可読媒体を含む、核酸集団を分析するための製造品もまた含む。
【0255】
本開示は、ハードウェアおよび/またはソフトウェアにおいて実施され得る。例えば、本開示の異なる態様は、クライアント側の論理回路またはサーバー側の論理回路のいずれかにおいて実施され得る。本開示またはその構成要素は、適切に構成されたコンピュータデバイス中にロードされた場合に、そのデバイスに本開示に従って遂行させる論理命令および/またはデータを含有する固定媒体プログラム構成要素で具体化され得る。論理命令を含有する固定媒体は、視聴者のコンピュータ中に物理的にロードするための固定媒体上で視聴者に届けられ得、または論理命令を含有する固定媒体は、プログラム構成要素をダウンロードするために通信媒体を介して視聴者がアクセスするリモートサーバー上に存在し得る。
【0256】
本開示は、本開示の方法を実施するようにプログラミングされるコンピュータ制御システムを提供する。
図1に戻ると、プロセッサー120には、シングルコアもしくはマルチコアプロセッサー、または平行処理のための複数のプロセッサーが含まれ得る。ストレージデバイス122には、ランダムアクセスメモリ、リードオンリーメモリ、フラッシュメモリ、ハードディスク、および/または他の型のストレージが含まれ得る。コンピュータシステム110は、1つまたは複数の他のシステム、および周辺デバイス、例えば、キャッシュ、他のメモリ、データストレージおよび/または電子ディスプレイアダプターと通信するための通信インターフェース(例えば、ネットワークアダプター)を含み得る。コンピュータシステム110の構成要素は、内部通信バス、例えば、マザーボードを介して、互いに通信し得る。ストレージデバイス122は、データを記憶するためのデータストレージユニット(またはデータリポジトリ)であり得る。コンピュータシステム110は、通信インターフェースの助けにより、コンピュータネットワーク(「ネットワーク」)に動作可能に連結され得る。ネットワークは、インターネット、インターネットおよび/またはエクストラネット、またはインターネットを介して通信したイントラネットおよび/もしくはエクストラネットであり得る。ネットワークは、一部の場合には、遠隔通信および/またはデータネットワークである。ネットワークには、ローカルエリアネットワークが含まれ得る。ネットワークは、分散コンピューティング、例えば、クラウドコンピューティングを可能にすることができる1つまたは複数のコンピュータサーバーを含み得る。ネットワークは、一部の場合には、コンピュータシステム110の助けにより、コンピュータシステム120に連結されたデバイスがクライアントまたはサーバーとして挙動するのを可能にし得るピアツーピアネットワークを実施し得る。
【0257】
プロセッサー120は、プログラムまたはソフトウェアで具体化され得る機械可読命令のシーケンスを実行し得る。命令は、メモリ場所、例えば、ストレージデバイス122中に記憶され得る。命令は、プロセッサー120に向けられ得、これにより、本開示の方法を実施するようにプロセッサー120を引き続いてプログラミングまたは他の方法で構成することができる。プロセッサー120によって行われる操作の例には、フェッチ、デコード、実行、およびライトバックが含まれ得る。
【0258】
プロセッサー120は、回路、例えば集積回路の一部であり得る。システム100の1つまたは複数の他の構成要素が、回路中に含められ得る。一部の場合には、回路には、アプリケーション特異的集積回路(ASIC)が含まれ得る。
【0259】
ストレージデバイス122は、ファイル、例えば、ドライバー、ライブラリーおよび保存されたプログラムを記憶し得る。ストレージデバイス122は、ユーザーデータ、例えば、ユーザー選好およびユーザープログラムを記憶することができる。コンピュータシステム110は、一部の場合には、コンピュータシステム110に対して外部の、例えば、イントラネットまたはインターネットを介してコンピュータシステム110と通信するリモートサーバー上に位置する、1つまたは複数のさらなるデータストレージユニットを含み得る。
【0260】
コンピュータシステム110は、ネットワークを介して1つまたは複数のリモートコンピュータシステムと通信できる。例えば、コンピュータシステム110は、ユーザーのリモートコンピュータシステムと通信できる。リモートコンピュータシステムの例には、パーソナルコンピュータ(例えば、ポータブルPC)、スレートもしくはタブレットPC(例えば、Apple(登録商標)iPad(登録商標)、Samsung(登録商標)Galaxy Tab)、電話、スマートフォン(例えば、Apple(登録商標)iPhone(登録商標)、Android(登録商標)使用可能デバイス、Blackberry(登録商標))、またはパーソナルデジタルアシスタントが含まれる。ユーザーは、ネットワークを介してコンピュータシステム110にアクセスできる。
【0261】
本明細書に記載される方法は、コンピュータシステム110の電子ストレージ場所、例えば、ストレージデバイス122などの上に記憶された機械(例えば、コンピュータプロセッサー)実行可能コードによって実施され得る。機械実行可能または機械可読コードは、ソフトウェアの形態で提供され得る(例えば、コンピュータ可読媒体)。使用の間に、コードは、プロセッサー120によって実行され得る。一部の場合には、コードは、プロセッサー120による即座のアクセスのために、ストレージデバイス122から検索され得、ストレージデバイス122上に記憶され得る。
【0262】
コードは、コードを実行するように適合されたプロセッサーを有する機械との使用のために、プリコンパイルおよび構成され得、またはランタイムの間にコンパイルされ得る。コードは、プリコンパイルまたはアズコンパイルされた(as-compiled)様式でのコードの実行を可能にするために選択され得るプログラミング言語で供給され得る。
【0263】
本明細書で提供されるシステムおよび方法の態様、例えば、コンピュータシステム110は、プログラミングで具体化され得る。技術の種々の態様は、典型的には、ある型の機械可読媒体上で運搬されるまたはある型の機械可読媒体で具体化される機械(またはプロセッサー)実行可能コードおよび/または関連データの形態の、「製品」または「製造品」と考えられ得る。機械実行可能コードは、電子ストレージユニット、例えば、メモリ(例えば、リードオンリーメモリ、ランダムアクセスメモリ、フラッシュメモリ)またはハードディスク上に記憶され得る。
【0264】
「ストレージ」型媒体は、ソフトウェアプログラミングのための非一時的なストレージをいつでも提供し得る、任意のまたは全ての、コンピュータの有形メモリ、プロセッサーなど、またはその関連のモジュール、例えば、種々の半導体メモリ、テープドライブ、ディスクドライブなどを含み得る。ソフトウェアの全てまたは部分は、インターネットまたは種々の他の遠隔通信ネットワークを介して、折に触れ通信され得る。かかる通信は、例えば、1つのコンピュータまたはプロセッサーから別のコンピュータまたはプロセッサーへの、例えば、管理サーバーまたはホストコンピュータからアプリケーションサーバーのコンピュータプラットフォームへの、ソフトウェアのローディングを可能にし得る。したがって、ソフトウェアエレメントを保有し得る別の型の媒体には、ローカルデバイス間の物理的インターフェースを横断して、有線のおよび光学的固定電話回線ネットワークを介して、および種々のエアリンク(air-link)を通じて使用されるものなどの、光波、電波および電磁波が含まれる。かかる波を搬送する物理的エレメント、例えば、有線または無線リンク、光学リンクなどもまた、ソフトウェアを保有する媒体とみなされ得る。本明細書で使用される場合、非一時的な有形ストレージ媒体に限定されない限り、「媒体」は、他の型の(無形)媒体を含み得る。
【0265】
「ストレージ」媒体、コンピュータまたは機械「可読媒体」などの用語は、実行のために命令をプロセッサーに提供することに関与する任意の有形の(例えば、物理的な)非一時的な媒体を指す。
【0266】
したがって、機械可読媒体、例えば、コンピュータ実行可能コードは、有形ストレージ媒体、搬送波媒体または物理的伝送媒体が含まれるがこれらに限定されない多くの形態を取り得る。非揮発性ストレージ媒体には、例えば、光学または磁気ディスク、例えば、図面中に示されるデータベースなどを実施するために使用され得るものなどの、任意のコンピュータ中のストレージデバイスのいずれかなどが含まれる。揮発性ストレージ媒体には、ダイナミックメモリ、例えば、かかるコンピュータプラットフォームのメインメモリが含まれる。有形伝送媒体には、同軸ケーブル;コンピュータシステム内のバスを含むワイヤを含む銅ワイヤおよび光ファイバーが含まれる。搬送波伝送媒体は、無線周波数(RF)および赤外線(IR)データ通信の間に生成されるものなどの、電気的もしくは電磁気信号、または音波もしくは光波の形態を取り得る。したがって、コンピュータ可読媒体の一般的な形態には、例えば、以下が含まれる:フロッピー(登録商標)ディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、CD-ROM、DVDもしくはDVD-ROM、任意の他の光学媒体、パンチカード紙テープ、穴のパターンを有する任意の他の物理的ストレージ媒体、RAM、ROM、PROMおよびEPROM、FLASH-EPROM、任意の他のメモリチップもしくはカートリッジ、データもしくは命令を輸送する搬送波、かかる搬送波を輸送するケーブルもしくはリンク、またはコンピュータがそこからプログラミングコードおよび/もしくはデータを読み取り得る任意の他の媒体。これらの形態のコンピュータ可読媒体の多くは、1つまたは複数の命令の1つまたは複数のシーケンスを実行のためにプロセッサーに搬送することに関与し得る。
【0267】
コンピュータシステム110は、例えば、報告を提供するためのユーザーインターフェース(UI)を含む電子ディスプレイ935を含み得るかまたはそれと通信し得る。UIの例には、グラフィカルユーザーインターフェース(GUI)およびウェブベースのユーザーインターフェースが含まれるがこれらに限定されない。
【0268】
本開示の方法およびシステムは、1つまたは複数のアルゴリズムによって実施され得る。アルゴリズムは、プロセッサー120による実行の際にソフトウェアによって実施され得る。
【0269】
本発明の方法は、対象における状態、特にがんの存在または非存在を診断するため、状態を特徴付けるため(例えば、がんをステージ分類するためまたはがんの不均一性を決定するため)、状態のための処置を選択するため、状態の処置に対する応答をモニタリングするため、状態または状態の引き続く過程を発症する予後リスクを生じさせるために使用され得る。
【0270】
種々のがんが本発明の方法を使用して検出され得る。がん細胞は、ほとんどの細胞と同様、古い細胞が死に、新しい細胞によって置き換えられるターンオーバーの速度によって特徴付けられ得る。一般に、所与の対象における脈管構造と接触している死細胞は、DNAまたはDNAの断片を血流中に放出し得る。これは、種々のステージの疾患の間のがん細胞についても当てはまる。がん細胞は、疾患のステージに依存して、種々の遺伝子異常、例えば、コピー数多様性ならびに稀な変異によっても特徴付けられ得る。この現象は、本明細書に記載される方法およびシステムを使用して個体におけるがんの存在または非存在を検出するために使用され得る。
【0271】
ある特定の実施形態では、本明細書で開示される方法および態様は、患者における所与の疾患、障害または状態を診断するために使用される。典型的には、考慮される疾患は、ある型のがんである。かかるがんの非限定的な例には、胆道がん、膀胱がん、移行上皮癌、尿路上皮癌、脳がん、神経膠腫、星細胞腫、乳房癌、化生性癌、子宮頸部がん、子宮頸部扁平上皮癌、直腸がん、結腸直腸癌、結腸がん、遺伝性非ポリポーシス結腸直腸がん、結腸直腸腺癌、消化管間質腫瘍(GIST)、子宮内膜癌、子宮内膜間質肉腫、食道がん、食道扁平上皮癌、食道腺癌、眼黒色腫、ブドウ膜黒色腫、胆嚢癌、胆嚢腺癌、腎細胞癌、淡明細胞型腎細胞癌、移行上皮癌、尿路上皮癌、ウィルムス腫瘍、白血病、急性リンパ球性白血病(ALL)、急性骨髄性白血病(AML)、慢性リンパ球性(CLL)、慢性骨髄性(CML)、慢性骨髄単球性(CMML)、肝臓がん、肝臓癌、ヘパトーマ、肝細胞癌、胆管細胞癌、肝芽腫、肺がん、非小細胞肺がん(NSCLC)、中皮腫、B細胞リンパ腫、非ホジキンリンパ腫、びまん性大細胞型B細胞リンパ腫、マントル細胞リンパ腫、T細胞リンパ腫、非ホジキンリンパ腫、前駆Tリンパ芽球性リンパ腫/白血病、末梢性T細胞リンパ腫、多発性骨髄腫、鼻咽頭癌(NPC)、神経芽腫、中咽頭がん、口腔扁平上皮癌、骨肉腫、卵巣癌、膵がん、膵管腺癌、偽乳頭状新生物、腺房細胞癌、前立腺がん、前立腺腺癌、皮膚がん、黒色腫、悪性黒色腫、皮膚黒色腫、小腸癌、胃がん、胃癌、消化管間質腫瘍(GIST)、子宮がん、または子宮肉腫が含まれる。
【0272】
本明細書で開示される方法およびシステムを使用して評価され得る他の遺伝子ベースの疾患、障害、または状態の非限定的な例には、DNA損傷修復欠損、軟骨無形成症、アルファ-1アンチトリプシン欠損症、抗リン脂質抗体症候群、自閉症、常染色体優性多発性嚢胞腎、シャルコー・マリー・トゥース(CMT)、ネコ鳴き、クローン病、嚢胞性線維症、ダーカム病、ダウン症候群、デュアン症候群、デュシェンヌ型筋ジストロフィー、第V因子ライデン血栓性素因、家族性高コレステロール血症、家族性地中海熱、脆弱X症候群、ゴーシェ病、ヘモクロマトーシス、血友病、全前脳胞症、ハンチントン病、クラインフェルター症候群、マルファン症候群、筋強直性ジストロフィー、神経線維腫症、ヌーナン症候群、骨形成不全症、パーキンソン病、フェニルケトン尿症、ポーランド症候群、ポルフィリン症、早老症、網膜色素変性症、重症複合免疫不全症(scid)、鎌状赤血球症、脊髄性筋萎縮症、テイ・サックス、サラセミア、トリメチルアミン尿症、ターナー症候群、口蓋心臓顔面症候群、WAGR症候群、ウィルソン病などが含まれる。
【0273】
がんは、変異、稀な変異、インデル、コピー数多様性、トランスバージョン、転座、逆位、欠失、異数性、部分的異数性、倍数性、染色体不安定性、染色体構造変更、遺伝子融合、染色体融合、遺伝子短縮、遺伝子増幅、遺伝子重複、染色体病変、DNA病変、核酸の化学的改変における異常な変化、エピジェネティックパターンにおける異常な変化が含まれる遺伝的多様性から検出され得る。
【0274】
遺伝子データは、特定の型のがんを特徴付けるためにも使用され得る。がんは、組成およびステージ分類の両方において不均一である場合が多い。遺伝子プロファイルデータは、その特定のサブタイプの診断または処置において重要であり得るがんの特定のサブタイプの特徴付けを可能にし得る。この情報はまた、対象または実務者に、特定の型のがんの予後に関する手がかりを提供し得、対象または実務者のいずれかに、疾患の進行に合わせて処置選択肢を適合させ得る。一部のがんは、進行すると、より高悪性度かつ遺伝的に不安定になる。他のがんは、良性、不活性または休止状態のままであり得る。本開示のシステムおよび方法は、疾患進行を決定する際に有用であり得る。
【0275】
本発明の分析は、特定の処置選択肢の有効性を決定する際にも有用である。処置が首尾よい場合には、より多くのがんが死んでDNAをシェディングし得るので、首尾よい処置選択肢は、対象の血液において検出されるコピー数多様性または稀な変異の量を増加させ得る。他の例では、これは起こらない場合がある。別の例では、おそらくは、ある特定の処置選択肢は、がんの遺伝子プロファイルと経時的に相関し得る。この相関は、療法を選択する際に有用であり得る。さらに、がんが処置後に寛解状態にあることが観察される場合、本発明の方法は、残存疾患または疾患の再発をモニタリングするために使用され得る。
【0276】
本発明の方法は、がん以外の状態における遺伝的多様性を検出するためにも使用され得る。免疫細胞、例えば、B細胞は、ある特定の疾患の存在に際して、迅速なクローン性拡大増殖を受け得る。クローン性拡大増殖は、コピー数多様性検出を使用してモニタリングされ得、ある特定の免疫状態がモニタリングされ得る。この例では、コピー数多様性分析は、特定の疾患がどのように進行している可能性があるかのプロファイルを生じさせるために経時的に行われ得る。
【0277】
さらに、本開示の方法は、対象における異常な状態の不均一性を特徴付けるために使用され得、この方法は、対象における細胞外ポリヌクレオチドの遺伝子プロファイルを生成するステップを含み、この遺伝子プロファイルは、コピー数多様性および稀な変異の分析から得られた複数のデータを含む。一部の場合には、がんが含まれるがこれに限定されない疾患は、不均一であり得る。疾患細胞は、同一でない場合がある。がんの例では、一部の腫瘍は、異なる型の腫瘍細胞を含むことが公知であり、一部の細胞は、がんの異なるステージにあることが公知である。他の例では、不均一性は、疾患の複数の病巣を含み得る。重ねて、がんの例では、複数の腫瘍病巣が存在し得、おそらくは、このとき、1つまたは複数の病巣は、原発部位から広がった転移の結果である。
【0278】
本発明の方法は、不均一な疾患における異なる細胞に由来する遺伝子情報の概要であるフィンガープリントまたはデータのセットを生成またはプロファイリングするために使用され得る。データのこのセットは、コピー数多様性および稀な変異の分析を単独でまたは組み合わせて含み得る。
【0279】
例示的な精密処置
【0280】
改善されたコンピュータシステム110によって提供される精密診断法は、精密処置計画を生じ得、これは、コンピュータシステム110によって同定され得る(および/または医療専門家によってキュレートされ得る)。例えば、精密診断および処置の1つの型は、相同組換え修復(HRR)経路中の遺伝子に関連し得る。
【0281】
相同組換えは、ヌクレオチド配列がDNAの2つの類似または同一の分子間で交換される遺伝子組換えの型である。これは、二本鎖切断(DSB)として公知の、DNAの両方の鎖上で生じる有害な切断を正確に修復するために、細胞によって最も広く使用されている。HRRは、細胞分裂が生じる前に染色体切断を取り除くために、複製されたDNA(S期およびG2期)中に存在する損傷をエラーなしに除去するための機構を提供する。相同組換えがDNA中の二本鎖切断をどのように修復するかについての当初のモデルは、二本鎖切断修復(DSBR)経路および合成依存的鎖アニーリング(SDSA)経路を媒介する相同組換え修復経路である。相同組換え遺伝子における生殖系列および体細胞欠損は、乳房、卵巣および前立腺がんと強く関連付けられてきた。
【0282】
試料中のバリアントヌクレオチドの数および型は、処置、即ち、治療介入に対する、試料を提供する対象の従順さの指標を提供し得る。例えば、種々のポリADPリボースポリメラーゼ(PARP)阻害剤は、BRCA1またはBRCA2遺伝子における遺伝性変異によって引き起こされる乳房、卵巣および前立腺がんからの腫瘍の成長を停止させることが示されている。これらの治療剤の一部は、塩基除去修復(BER)を阻害し得、これが、HRRの欠損を相殺し得る。
【0283】
他方、ある特定のBRCAおよびHRR野生型患者は、PARP阻害剤による処置から臨床的利益を得ない場合がある。さらに、BRCA変異を有する全ての卵巣がん患者がPARP阻害剤に対して応答するわけではない。さらに、異なる型の変異は、異なる療法を示し得る。例えば、HRR遺伝子中の体細胞ヘテロ接合型欠失は、体細胞ホモ接合型欠失とは異なる療法を示し得る。したがって、遺伝子材料の状態は、療法に影響し得る。一例では、PARP阻害剤は、HRR遺伝子中に体細胞ホモ接合型欠失を有する個体に投与され得るが、HRR遺伝子中に野生型アレルまたは体細胞ヘテロ接合型欠失を有する個体には投与されない。
【0284】
シークエンシングされた核酸におけるヌクレオチド多様性は、シークエンシングされた核酸を参照配列と比較することによって決定され得る。参照配列は、既知の配列、例えば、対象由来の既知の全体的または部分的ゲノム配列、ヒト対象の全ゲノム配列である場合が多い。参照配列は、hG19であり得る。シークエンシングされた核酸は、上記のように、試料中の核酸について直接決定された配列、またはかかる核酸の増幅産物の配列のコンセンサスを示し得る。比較は、参照配列上の1つまたは複数の指定された位置において行われ得る。それぞれの配列が最大限にアラインされる場合、参照配列の指定された位置と対応する位置を含むシークエンシングされた核酸のサブセットが同定され得る。かかるサブセット内で、存在する場合、シークエンシングされた核酸が、指定された位置においてヌクレオチド多様性を含むこと、および必要に応じて、存在する場合、参照ヌクレオチド(即ち、参照配列中と同じヌクレオチド)を含むことが決定され得る。ヌクレオチドバリアントを含むサブセット中のシークエンシングされた核酸の数が閾値を超える場合、バリアントヌクレオチドは、指定された位置においてコールされ得る。閾値は、他の可能性のうちでも、ヌクレオチドバリアントを含むサブセット内の単純な数、例えば、少なくとも1、2、3、4、5、6、7、8、9、もしくは10個のシークエンシングされた核酸であり得、またはヌクレオチドバリアントを含むサブセット内のシークエンシングされた核酸の比率、例えば、少なくとも0.5、1、2、3、4、5、10、15、もしくは20であり得る。比較は、参照配列中の目的の任意の指定された位置について反復され得る。ときどき、比較は、参照配列上の少なくとも20、100、200、または300連続する位置、例えば、20~500、または50~300連続する位置を占有する指定された位置について行われ得る。
【実施例】
【0285】
(実施例1)
ctDNA次世代シークエンシングによってプロファイリングされた前立腺がんにおける相同組換え修復(HRR)変異の状況
【0286】
背景
【0287】
PARP阻害は、HRR遺伝子の分子プロファイリングを介して検出され得るHRR欠損(HRD)を有する患者において、合成致死性および増加した治療感度を引き起こし得る。例えば、FDAは、HRR遺伝子中に変異を有する転移性去勢抵抗性前立腺がん(mCRPC)患者におけるPARP阻害剤オラパリブ(de Bono et al., "Olaparib for Metastatic Castration-Resistant Prostate Cancer," N Engl J Med., 382(22):2091-2102 (2020))およびルカパリブ(Abida et al., "Non-BRCA DNA Damage Repair Gene Alterations and Response to the PARP Inhibitor Rucaparib in Metastatic Castration-Resistant Prostate Cancer: Analysis From the Phase II TRITON2 Study," Clin Cancer Res., 10.1158/1078-0432.CCR-20-0394 (2020))の使用を最近承認した。前立腺がんは、男性において最も一般的な悪性疾患であり(Siegel et al., "Cancer statistics, 2020," CA Cancer J Clin, 70(1):7-30 (2020))、進行型前立腺がんを有する男性においてHRDの高い保有率(20~30%、Athie et al., "Targeting DNA Repair Defects for Precision Medicine in Prostate Cancer" Curr Oncol Rep, 21(5):42 (2019);Mateo et al., "Olaparib in patients with metastatic castration-resistant prostate cancer with DNA repair gene aberrations (TOPARP-B): a multicentre, open-label, randomised, phase 2 trial," Lancet Oncol., 21(1):162-174 (2020);Robinson et al., "Integrative clinical genomics of advanced prostate cancer" [published correction appears in Cell. 2015 Jul 16;162(2):454]. Cell, 161(5):1215-1228 (2015))を有する。転移性前立腺がん患者における組織生検の高い失敗率(25~75%、またはさらにより高い(例えば、≧90%))(Ross et al., "Predictors of prostate cancer tissue acquisition by an undirected core bone marrow biopsy in metastatic castration-resistant prostate cancer--a Cancer and Leukemia Group B study," Clin Cancer Res, 11(22):8109-13 (2005);Spritzer et al., "Bone marrow biopsy: RNA isolation with expression profiling in men with metastatic castration-resistant prostate cancer--factors affecting diagnostic success," Radiology, 269(3):816-23 (2013);Sailer et al., "Bone biopsy protocol for advanced prostate cancer in the era of precision medicine," Cancer, 124(5):1008-1015 (2018))は、HRDプロファイリングの課題になっており、非侵襲性のctDNA代替法の必要性を強調している。ctDNAでは、HRDの高頻度の原因であるコピー数喪失の検出は、無細胞白血球性DNAによるシグナル希釈に起因して、コールするのがさらに困難である(Barbacioru et al., "Abstract 435: Cell-free circulating tumor DNA (ctDNA) detects somatic copy number loss in homologous recombination repair genes," Proceedings: AACR Annual Meeting 2019; March 29-April 3, 2019; Atlanta, GA)。したがって、機能喪失型SNV/インデル、構造的再編成、および遺伝子欠失を検出して、500遺伝子液体生検パネルであるGuardantOMNI上でHRDを同定するパイプラインを開発した。この実施例は、650を超える前立腺がんGuardantOMNI試料にわたるその性能を示している。
【0288】
方法
【0289】
687人の前立腺がん患者由来の試料を、GuardantOMNI RUO上で処理し(表3は、産物特色の一部を示す)、およそ4600分子の独自のカバレッジの中央値を、20,000×の読み取り深度までシークエンシングした。体細胞および生殖系列のSNVおよび小さいインデルを、Guardantバイオインフォマティクスパイプラインを使用してコールした(Helman et al., "Cell-Free DNA Next-Generation Sequencing Prediction of Response and Resistance to Third-Generation EGFR Inhibitor," Clin Lung Cancer, 19(6):518-530 (2018))。新規HRDモジュールを開発して、病原性SNV/インデルを注釈し、新規CNV(Barbacioru et al., "Abstract 435: Cell-free circulating tumor DNA (ctDNA) detects somatic copy number loss in homologous recombination repair genes," Proceedings: AACR Annual Meeting 2019; March 29-April 3, 2019; Atlanta, GA)およびデノボ融合コーラー(Yablonovitch et al., "Identification of FGFR2/3 fusions from clinical cfDNA NGS using a de novo fusion caller," 2020 May. ASCO Poster)から構成される、構造的再編成、遺伝子-レベルホモ接合型欠失、ヘテロ接合性消失(LOH)およびゲノムワイドなLOHを同定した。LOH欠失を、野生型アレルの喪失を考慮して予想されたアレル頻度に基づいて決定した(Barbacioru et al., "Abstract 435: Cell-free circulating tumor DNA (ctDNA) detects somatic copy number loss in homologous recombination repair genes," Proceedings: AACR Annual Meeting 2019; March 29-April 3, 2019; Atlanta, GA)。機能喪失型バリアントを、24のHRR遺伝子:ATM、ATR、BAP1、BARD1、BRCA1、BRCA2、BRIP1、CDK12、CHEK1、CHEK2、FANCA、FANCL、HDAC2、MRE11、NBN、PALB2、RAD51、RAD50、RAD51B、RAD51C、RAD51D、RAD54L、XRCC2、XRCC3において分析した。
【表3】
【0290】
結果
【0291】
HRR遺伝子中の病原性変更が、ctDNAが検出された300/687(43.6%)の前立腺がん試料においてコールされた:全ての試料の23%は、病原性体細胞または生殖系列のSNV/インデルを有し、7.8%は、ホモ接合型欠失を有し、3.0%は、HRR遺伝子が関連する再編成を有した。SNV/インデルの大多数は、組織と同様に、BRCA2(159全ての有害なSNV/インデルの32%)およびATM(35%)中に存在したが(Dhawan et al., "DNA Repair Deficiency Is Common in Advanced Prostate Cancer: New Therapeutic Opportunities," Oncologist, 21(8):940-5 (2016))、変異は、CDK12(13%)、CHEK2(8%)およびNBN(6%)を含む、21のさらなる遺伝子にわたっても存在した。生殖系列BRCA1/2 SNV/インデル、およびLOH検出に十分な腫瘍シェディング(最大MAF>20%)を有する前立腺患者のうち、組織における86%と比較して、6/12(50%)は、LOHもまた有した(Jonsson et al., "Tumour lineage shapes BRCA-mediated phenotypes," Nature, 571(7766):576-579 (2019))。ホモ接合型欠失は、BRCA2(全ての試料の12%)、ATM(6%)およびFANCA(5%)において富化された。融合およびマルチエクソン欠失を含む再編成は、検出された不活性化HRD変異の6.5%を占めた。合計で、前立腺試料の6.8%が、SNV、インデルまたは欠失が関与する両アレル性不活性化を有した。
【0292】
表4は、GuardantOMNI RUO性能測定基準をさらに要約する。特に、95%LoDについて列挙された範囲(
*で示される)は、それぞれ、臨床的にアクショナブルなバリアントおよび臨床的にアクショナブルでないバリアントを含む。95%LoDについて列挙された範囲(
**で示される)は、それぞれホモ接合型欠失およびヘテロ接合型欠失についてである。全ての測定基準は、以下でさらに議論されるin-silicoシミュレーションに基づいたHRR欠失を除いて、cfDNAの臨床試料を使用して30ngの投入物に基づいた。特異性は、正常試料の大きいコホートにわたる偽陰性バリアント検出に基づく。
【表4】
【0293】
図15(パネルA~C)は、HRR欠失および融合についてのGuardantOMNI RUOの検出限界(LoD)を示すデータのプロットである。より具体的には、in-silicoシミュレーションにより、試料についてBRCA2欠失を検出する際の95%の感度が、ホモ接合型欠失について12.5%の腫瘍割合(TF)(パネルA)、LOHについて25%の腫瘍割合(TF)(パネルB)を示すことが実証された。欠失についてのLoDは、接合性が確定的(DET)かつ不確定(INDET)である場所に示される。既知の融合および長い欠失を含有する臨床的cfDNAを使用する実験を、プロビットモデルを使用して評価して、MAF0.15%の95%LoDを決定した(パネルC)。
【0294】
表5は、GuardantOMNI RUO血漿を用いた組織中のHRR遺伝子変異保有率の比較を示す。示されるように、FFPE組織と比較して大きい割合の試料が、GuardantOMNI RUOにおいて報告可能な結果を有した(PROFOUND - FoundationOne (de Bono et al., "Olaparib for Metastatic Castration-Resistant Prostate Cancer," N Engl J Med., 382(22):2091-2102 (2020))、TOPARP-Institute of Cancer Research(Mateo et al., "Olaparib in patients with metastatic castration-resistant prostate cancer with DNA repair gene aberrations (TOPARP-B): a multicenter, open-label, randomized, phase 2 trial," Lancet Oncol., 21(1):162-174 (2020)))。
*GuardantOMNI RUOアッセイへの投入物が、変動する投入体積(平均=2.78mL)を有する血漿であったことに留意されたい。より高い成功率が、10mLの全血の要件を考慮して、実験室診断試験(Laboratory Diagnostic Test)(LDT)について予想された。FACFおよびRANCM(
**)を除き、強調された遺伝子は、GuardantOMNI RUO HRR遺伝子リスト(欠失および融合出力なし)上に現在存在しないが、OMNIパネル上ではカバーされている遺伝子を示す。MSKCC比較研究は、Jonsson et al., "Tumour lineage shapes BRCA-mediated phenotypes," Nature, 571(7766):576-579 (2019)に記載されている。
【表5-1】
【表5-2】
【0295】
図16は、前立腺がんコホートにおけるHRR変異のオンコプリントである。ホモ接合型遺伝子コピー数欠失のみが示される。
【0296】
図17(パネルA~C)は、前立腺コホートにおいて検出されたバリアントクラスごとのHRR変異の保有率のプロットである。パネルAは、HRR変異をバリアント型ごとに示し、図中、「欠失」は、接合性を決定するのに不十分なアレル情報を有する欠失を示す。パネルBの左は、遺伝子および体細胞ステータスごとの有害なSNV/インデルを示す。臨床的前立腺コホートにおける低い保有率(3/1000の試料)と一致して、復帰はこのコホートでは検出されなかった(データ示さず)。右は、融合および長い欠失を遺伝子ごとに示す。HRRの融合および長い欠失は、試料の3.2%(21/654)において見出され、有害なHRR SNV/インデルを有したものは存在しなかった。パネルCは、エクソン24~26のBRCA2欠失の例を示す。中央の黒い線は、不連続な軸を示し、下は、検出されたマルチエクソンの距離の表示を示す。
【0297】
結論
【0298】
この実施例は、前立腺がんコホートにおいて、GuardantOMNI ctDNAプロファイリングが、HRDに寄与する全てのクラスの変異をコールし、変更の相対的保有率が、組織におけるものと一致していることを実証している。cfDNAは、小さいバリアントを使用した28%から完全なHRDバイオマーカーセットを用いた42%まで保有率を引き上げる、PARPまたはシスプラチン/白金療法から利益を得る可能性がある患者を同定するための代替法を提示する。
【0299】
上または下で引用された全ての特許出願、ウェブサイト、他の刊行物、受託番号などは、各個々の項目がそのように参照により組み込まれると具体的かつ個々に示されるのと同程度まで、全ての目的のためにそれらの全体が参照により組み込まれる。異なる時点において異なるバージョンの配列が受託番号に関連付けられている場合、本出願の有効出願日の時点でその受託番号に関連付けられたバージョンを意味する。有効出願日とは、該当する場合、実際の出願日またはその受託番号に言及する優先出願の出願日のいずれか早い方を意味する。同様に、異なる時点において異なるバージョンの刊行物、ウェブサイトなどが公開されている場合、他が示されない限り、本出願の有効出願日の時点で一番最近公開されたバージョンを意味する。本開示の任意の特色、ステップ、要素、実施形態、または態様は、具体的に他が示されない限り、任意の他の特色、ステップ、要素、実施形態、または態様と組み合わせて使用され得る。本開示は、明確さおよび理解を目的として、例示および例を目的としていくらか詳細に記載されてきたが、ある特定の変化および改変が添付の特許請求の範囲内で実施され得ることは明らかである。
【国際調査報告】