(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-08-24
(54)【発明の名称】試料中のがんDNAを検出するための高感度の方法
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20230817BHJP
G01N 33/53 20060101ALI20230817BHJP
【FI】
C12Q1/6869 Z
G01N33/53 M
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023507545
(86)(22)【出願日】2021-08-05
(85)【翻訳文提出日】2023-03-24
(86)【国際出願番号】 IB2021057217
(87)【国際公開番号】W WO2022029688
(87)【国際公開日】2022-02-10
(32)【優先日】2020-08-05
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】521056124
【氏名又は名称】イニヴァータ リミテッド
(74)【代理人】
【識別番号】100092783
【氏名又は名称】小林 浩
(74)【代理人】
【識別番号】100120134
【氏名又は名称】大森 規雄
(74)【代理人】
【識別番号】100126354
【氏名又は名称】藤田 尚
(72)【発明者】
【氏名】ペリー,マルコム
(72)【発明者】
【氏名】マルシコ,ジョヴァンニ
(72)【発明者】
【氏名】オズボーン,ロバート
(72)【発明者】
【氏名】ローゼンフェルド,ニツァン
(72)【発明者】
【氏名】フォーシュー,ティム
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA13
4B063QA19
4B063QQ42
4B063QR32
4B063QS10
(57)【要約】
患者からのDNAの試験試料中のがんDNAを検出するための方法が本明細書に記載されている。いくつかの実施形態では、方法は、(a)試験試料の複数のアリコートを配列決定して、各アリコートについて、各々が患者のがん内に存在する配列バリエーションを有する2つ以上の標的領域に対応する配列リードを生成することと、(b)各アリコートについて、各標的領域について:i.配列バリエーションを有する配列リードの数を決定し、ii.配列リードの総数を決定し、iii.i.及びii.を配列バリエーションの1つ以上のエラー確率分布モデルと比較することであって、1つ以上のモデルが、配列バリエーションを含まないDNAから得られる、比較することと、(c)ステップ(b)の集合的な結果を統合して、試験試料中にがんDNAが存在するかを決定することと、を含み得る。
【特許請求の範囲】
【請求項1】
患者からのDNAの試験試料中のがんDNAを検出するための方法であって、
(a)前記試験試料の複数のアリコートを配列決定して、各アリコートについて、各々が前記患者のがん内に存在する配列バリエーションを有する2つ以上の標的領域に対応する配列リードを生成することと、
(b)各アリコートについて、各標的領域について:
i.前記配列バリエーションを有する配列リードの数を決定し、
ii.配列リードの総数を決定し、
iii.i.及びii.を前記配列バリエーションの1つ以上のエラー確率分布モデルと比較し、前記1つ以上のモデルが、前記配列バリエーションを含まないDNAから得られ、
iv.統計的にありそうもない数のアリコートにおいて閾値を超えるバリアントを除外することと、
(c)ステップ(b)の集合的な結果を統合して、前記試験試料中にがんDNAが存在するかを決定することと、を含む、方法。
【請求項2】
統計的にありそうもない数のアリコートが、
各アリコートに添加された試験試料DNAの量を測定し、
前記バリアントの全て又はサブセットの配列決定データを使用して、前記試験試料中のがんDNAの画分を計算し、
i.及びii.に基づいて、閾値を超える前記配列バリエーションを含むアリコートの数を観測する確率を推定することによって特定される、請求項1に記載の方法。
【請求項3】
DNAの前記試験試料中のがんDNAの画分が、0.01%以下である、いずれかの先行請求項に記載の方法。
【請求項4】
ステップ(a)が、前記試験試料の少なくとも3つのアリコートにおいて少なくとも10個の標的領域を配列決定することを含む、いずれかの先行請求項に記載の方法。
【請求項5】
前記方法が、ステップ(a)の前に、前記患者のがん内に存在する配列バリエーションのセットを特定することを含む、いずれかの先行請求項に記載の方法。
【請求項6】
前記がんが、血液がんであり、前記試験試料が、末梢血、リンパ節、又は骨髄からの細胞から単離された細胞DNAを含む、いずれかの先行請求項に記載の方法。
【請求項7】
前記がんが、固形腫瘍であり、前記試験試料が、cfDNAを含む、請求項1~5のいずれか一項に記載の方法。
【請求項8】
ステップ(b)が、
v.
(i)前記配列バリエーションを有する分子の数の推定値を導出し、
(ii)前記配列バリエーションを有する少なくとも1つの分子が存在する確率を計算し、
(iii)配列リードの総数と比較した前記配列バリエーションを有する配列リードの頻度が閾値を超えているかを決定し、
(iv)(i)の尤度比を計算し、かつ/又は
(v)(i)、(ii)、若しくは(iv)のいずれかが閾値を超えているかを決定することを含む、いずれかの先行請求項に記載の方法。
【請求項9】
ステップ(b)の結果に基づいて前記試験試料中のがんDNAの画分又は総量を計算することを更に含む、いずれかの先行請求項に記載の方法。
【請求項10】
(b)(iv)が、試料:
(i)がんDNAが存在する場合
(ii)がんDNAが存在しない場合
において(b)(i)で得られた結果を観測する尤度間の尤度比を計算し、
個々の尤度比を試験試料の全ての配列バリエーション及びアリコートにわたる累積尤度比スコアに組み合わせることによって行われる、請求項8に記載の方法。
【請求項11】
ステップ(c)の結果が前記閾値以上である場合に前記患者をがんを有するとして特定することを更に含む、いずれかの先行請求項に記載の方法。
【請求項12】
前記患者に療法を施すことを更に含む、いずれかの先行請求項に記載の方法。
【請求項13】
前記患者が、以前に第1の療法を受けており、ステップ(c)の結果に基づいて、前記方法が、前記第1の療法とは異なる第2の療法を前記患者に施すことを含む、いずれかの先行請求項に記載の方法。
【請求項14】
前記患者が、がんを有するか、若しくは有したか、又はまだがんではないが形質転換する潜在性を有するクローン増殖を有する、いずれかの先行請求項に記載の方法。
【請求項15】
前記患者が、前記がんの治療を受けたか、又は受けている、いずれかの先行請求項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
相互参照
本出願は、2020年8月5日に出願された、米国仮特許出願第63/061,568号の利益を主張するものであり、その出願は参照により本明細書に組み込まれる。
【背景技術】
【0002】
多くの場合では、がん治療は、少なくとも2つのステップ:腫瘍細胞を除去することを意図した第1の治療、次いで初期治療が完全に成功していない場合、患者の体内に残存するあらゆるがん細胞を根絶することを目的とした第2の治療を必要とし得る。残存するがん細胞を根絶するために使用される治療は、多くの場合、第1の治療とは異なる。
【0003】
患者が明らかに寛解期であり得る初期治療後に患者に残存する少数のがん細胞は、多くの場合、「微小残存病変」(MRD)又は残存病変と呼ばれる。これらの残存細胞は、最終的に多くのがんにおいて再発の原因となるであろう。追加の治療を必要とする可能性が最も高い患者が追加の治療を受けることができ、追加の治療を必要としない患者が免れ、それによって患者への危害を低減し、治療のコストを低下させるように、初期治療後に疾患の再発(recurrence)及び再発(relapsing)を有する患者の尤度を決定することが重要である。そのため、微小残存病変を検出するための効果的な方法が非常に望ましい。また、(例えば、通常は画像化又は臨床分析によって行われる)現在の方法よりも早期にがん再発のリスクを検出する感度の高い方法を有することが重要である。
【0004】
MRDは、比較的多量のDNAを分析することができ、一般的な腫瘍特異的融合の頻度を簡単な方法で測定することができるため、いくつかの血液学的悪性腫瘍において成功裏に検出されている。現在、循環腫瘍DNA(ctDNA)について無細胞DNA(cfDNA)を評価することによって、多くの固形腫瘍についてMRDを検出することができるという強力な証拠がある。しかしながら、cfDNAにおいて微小残存病変を検出する際の問題は、試料における配列バリエーションを検出するために使用される試験のうちの多くが十分に高感度ではないことである。今日の分子試験のうちの多くは、既知の遺伝子のパネルについてcfDNAを配列決定することによって行われる。cfDNAを配列決定することによって微小残存病変を検出することでの問題は、無細胞DNA中の腫瘍DNAの量が、多くの場合そのような方法の検出限界をはるかに下回ることである。具体的には、微小残存病変を有する患者のcfDNAに発生すると予想される個々の腫瘍配列バリエーションの頻度は、典型的には、配列決定アーチファクトがPCRエラー、塩基ミスコール、及び/又はDNA損傷によって生成される頻度をかなり下回る。この問題は、いくつかの場合では、変異体DNAのレベルが非常に低い場合があり、平均で、分析されているcfDNA試料において評価されている各変異のコピーが1つ未満であるという事実によって悪化する。加えて、血流中に溶解した白血球に由来する比較的少量の変異体DNAは、間違った結果につながり得る。よって、配列決定ベースのアプローチによる微小残存病変の検出は、困難なままである。
【0005】
本開示は、腫瘍DNAを検出するための高感度の方法を提供する。方法は、とりわけ、微小残存病変を診断するために使用され得る。
【発明の概要】
【0006】
患者からのDNAの試験試料中のがんDNAを検出するための方法が以下に記載される。いくつかの実施形態では、方法は、(a)試験試料の複数のアリコートを配列決定して、各アリコートについて、各々が患者のがん内に存在する配列バリエーションを有する2つ以上の標的領域に対応する配列リードを生成することと、(b)各アリコートについて、各標的領域について:i.配列バリエーションを有する配列リードの数を決定し、ii.配列リードの総数を決定し、iii.i.及びii.を配列バリエーションの1つ以上のエラー確率分布モデルと比較することであって、1つ以上のモデルが、配列バリエーションを含まないDNAから得られる、比較することと、(c)ステップ(b)の集合的な結果を統合して、試験試料中にがんDNAが存在するかを決定することと、を含み得る。任意の実施形態では、ステップ(b)は、iv.統計的にありそうもない数のアリコートにおいて閾値を超えるバリアントを除外することを含み得る。これらのバリアント(すなわち、統計的にありそうもない数のアリコートにあるバリアント)は、各アリコートに添加された試験試料DNAの量を測定し、試験試料中のがんDNAの画分を計算し、i及びiiに基づいて閾値を超えるバリアントを含むアリコートの数を観測する確率を推定することによって特定することができる。
【0007】
本方法は、2つの特徴:(i)アリコートベースの配列決定(すなわち、同じ試料、すなわち、分割又は分配された試料の複数のアリコートにおける同じ標的領域を配列決定すること)及び(ii)アリコートのいずれかにおけるシグナルについて評価し(1つのアリコートにおけるバリアントDNAを特定し、次いで同じバリアントが別のアリコートにおいて見つかり得るため、試料ががんDNAを確実に含むと決定することとは対照的に)、統計的にありそうもないデータ点が除去された後、データのうちの全てを分析する複数のバリアントの分析に依存する。
【0008】
この方法によって解決される1つの問題は、いくつかの試料(すなわち、がんDNAの小画分、例えば、0.01%未満のtDNAを含む試料)について、特定の配列バリエーションを含む配列リードの数が、ノイズ(すなわち、塩基ミスコール、PCRエラー、損傷したDNAなどの組み合わせ)によって引き起こされるバリエーションと実質的には区別できないことである。そのため、多くの場合では、試料ががんDNAを含むことを従来の配列決定アプローチによって確実に決定することは単純に不可能である。
【0009】
上記のように、本発明は、アリコートベースである。例えば、いくつかの実施形態では、方法は、試験試料の少なくとも3つのアリコートにおいて少なくとも10個の標的領域を配列決定することを含み得、実際には、方法は、試験試料の少なくとも4つのアリコートにおいて少なくとも24個の標的領域を配列決定することを含み得る。アリコートベースの配列は、同じ数の野生型分子及びバリアント分子が依然として配列決定されている(ただし、複数のアリコートにわたって分割されている)ため、当初は労力の無駄のように見える場合があるが、シグナル対ノイズ比は、アリコートベースの方法において実際に増加する。具体的には、試料中に非常に少ないバリアント分子(例えば、1つ又は2つのバリアント分子)がある状況では、バリアント分子対野生型分子の比は、バリアント分子を含むアリコートにおいてはるかに高いであろう。これは、ひいては、ミスコールを除外し、データをより確実にする。シグナル対ノイズ比を増加させることに加えて、方法は、従来のアプローチよりも多くのデータを生成し、これは、ひいては、データがより洗練された統計及び/又は閾値ベースの方法によって分析されることを可能にする。例えば:(i)いわゆる「ノイジー塩基」(すなわち、頻繁にミスコールされる高い固有のバックグラウンドを有する位置)は、シグナルがほとんど又は全てのアリコートにおいて(バックグラウンドに対して比較的に)一貫して高いので、特定及び除外することができ、(ii)ありそうもなく高いシグナルに関連付けられるバリアント(例えば、1つのアリコートにおける単一バリアント分子について予想されるよりも3倍の配列リードの数、及び他のアリコートにおける配列リードのバックグラウンド数を有するバリアント、又は他のバリアントがアリコートのうちの1若しくは0個にのみあるとき、4つのアリコートのうちの3つにあるように見えるバリアント)は、特定及び除外することができる。様々な他の利点を以下に記載する。
【0010】
いかに方法が実施されるかに応じて、方法は、従来の方法に対して特定の利点を有し得る。例えば、方法は、試料中のがんDNAの画分が0.01%未満である場合でも、DNA試料ががんDNAを有するかを一貫して確実に決定するために使用され得る。これは、従来の方法の感度のレベルをはるかに下回っており、エラーによって配列決定アーチファクトが生成され得る頻度をはるかに下回っている。いくつかの配列バリエーションを評価することによって、方法はまた、平均して1つ未満の各個々の配列バリエーションのコピーが存在するDNAの試料中にがんDNAを検出することができる。
【0011】
方法は、特異性を犠牲にする(すなわち、多くの偽陽性結果を生成する)ことなく、感度のレベルに到達するように実施することができる。ctDNAの存在は、DNA配列決定後のバリアントリードではなく、各アリコートに付加されたバリアント分子のレベルで推定することができる。これは、いくつかの状況(例えば、高い配列決定深度でのDNA分子の低い初期入力)では偽陽性を低減することができ、がんDNAの全体的な画分のより正確な推定値を提供する。
【0012】
加えて、いくつかの実施形態では、本方法は、任意に、試料ががんDNAを含むかを、陽性の数(ctDNAの明確な証拠を有するアリコートの数)を計算するのではなく、確率的連続体(すなわち、観測された分子の数にわたる確率分布)において全てのアリコートにおける全てのバリエーションをスコア付けし、単純なルールの適用を通して陽性又は陰性結果を決定することによって決定する。これは、個別に取得されるときに重要ではないが、複数のバリアントにわたるctDNAの強力な証拠に組み合わせることができ、感度を増加させる、境界シグナルの調査を可能にする。それはまた、信頼度に基づく柔軟な報告、及び他のデータ、例えば、がんタイプ又はステージに基づく疾患再発の事前確率を組み合わせる潜在性を可能にする。
【0013】
加えて、増幅前のDNA損傷又は初期サイクルPCRエラーなどの、稀なエラーは、このアプローチによって直接モデル化することができる。これは、以前の段落に記載される推定プロセスに基づいて実際のシグナルであるように見えるであろう。これらの効果は、DNA配列決定エラーのほとんどのモデルにおいて捕捉されず、したがって、説明されないままである場合、偽陽性につながり得る。代替的に、これらはアリコートにおいて検出されるシグナルを必要とすることによって対処することができるが(単一試料における2つのそのような事象は非常に可能性が低いため)、これは感度を低減する。方法は、推定がんDNA画分又はDNA塩基変化のタイプなどの因子を考慮することによって、各アリコートにおいて検出される分子がctDNAに由来する可能性が高いか、又は稀なエラーに由来する可能性が高いかを考慮することによって、この効果をモデル化することができる。
【0014】
方法は、推定がんDNA画分に基づいて、複数のアリコートにおいて異常に高いレベルのシグナルを示すバリアントを除外することによって、更なるエラー低減戦略を使用することができる。直感的には、全体として試料においてほんの少数のバリアント分子だけ検出される場合、これらが全て(増幅又はコピー数変化がなければ)単一の場所で存在するであろう可能性は低い。これは、未確定の潜在能をもつクローン造血(CHIP)変異、汚染、又は同様のエラーに起因し得る。それはまた、バックグラウンドモデルにおいて説明されるよりもかなり多くの配列決定エラーを生成する単一DNA塩基によるものであり得、これは、この方法を、正常な試料のパネルに対してまず配列決定することなしでの「ワンショット」使用に好適なものにする。
【0015】
これら及び他の利点は、以下の議論に鑑みて明らかになり得る。
【0016】
当業者は、以下に記載される図面が例示目的のみであることを理解するだろう。図面は、いかなる方法においても本教示の範囲を限定することを意図するものではない。
【図面の簡単な説明】
【0017】
【
図1】アリコートベースの配列決定を実施することができる方法を示すフローチャートである。明らかであろうように、試験試料の異なるアリコートは、異なるアリコート識別子配列でバーコード化し、次いで配列決定の前に組み合わせることができる。
【
図2】
図1のフローチャートから続くフローチャートである。
図2は、(b)各アリコートについて、各標的領域について、配列バリエーションを有する配列リードの数及び配列リードの総数を決定するために、配列リードを処理することができる方法を示す。
【
図3】
図2のフローチャートで示されるワークフローを実施することができる方法の一例を示すフローチャートである。
図3に示されるステップは、任意の便利な順序で行うことができる。
【
図4】
図2のフローチャートから続くフローチャートである。
図4は、各配列バリエーション及びアリコートについてのバリアント及び合計リードカウントを、各配列バリエーションについての確率分布とともに分析し、次いで統合して、試料にがんDNAが存在するかを決定することができる方法を示す。
【
図5】各配列バリエーションについての確率分布モデルを生成することができる方法を示すフローチャートである。確率分布は、二項、過分散二項、ベータ、正規、指数、又はガンマ確率分布モデルを含む。そのようなモデルは、分子インデックスを使用する実施形態では必要とされない場合がある。
【
図6】各アリコートにおける各配列バリエーションについてのデータを分析するための閾値ベースのアプローチを示すフローチャートである。
【
図7】
図6に示される閾値ベースの方法の結果を統合する方法を示すフローチャートである。
【
図8】各アリコートにおける各配列バリエーションのデータを分析するための統計的アプローチを示すフローチャートである。
【
図9】
図8に示される統計結果を統合することができる方法を示すフローチャートである。
【
図10】
図1における最後のステップを示すフローチャートであり、1つの試験試料の結果を1つ以上の追加の試料と比較することができる2つのアプローチを示す。
【
図11】本方法の実施形態の原理のうちのいくつかを概略的に示す。
【
図12】バリアント分子の数を推定するための確率分布の原理を示す。
【
図13A-B】エラー確率分布の例を示す。
図13Aに示されるモデルでは、低頻度高シグナル事象に対応するデータがハッチングされている。
図13Bに示されるモデルは、混合モデルである。「VAF」は、バリアント対立遺伝子頻度を指す。そのようなモデルは、配列バリエーションを含まないDNAから得られ、それらは、この正常なDNA中の異なるバリアント対立遺伝子画分の確率(又は合計wtリードに対するバリアントリードの数)を示す。そのような分布は、バリアントクラス間及び配列深度間で異なり得る。いくつかの場合では、異なるタイプのエラーを説明するために2つ以上の分布が必要となる。いくつかの場合では、配列リードにおいて特定された配列バリエーションがエラーではないことを合理的に確信することができる閾値が確立され得る。
【
図14】アリコートアプローチを使用して「ノイズの多い」塩基からのデータを特定及び除外することができる方法を示す。
【
図15】個々のアリコートが特定のバリアントを含むかどうかについてスコア付けされる方法によってがんDNAを検出する際の困難のいくつかを示す。
【
図16】がんDNAの画分を計算することができる方法を示す。
【
図17】変動するレベルの循環腫瘍(ctDNA)を含む3つの異なる試料の各々の4つのアリコートにおいて40を超える配列バリエーションが評価された実験の結果を示す。
【0018】
定義
別段の定義がない限り、本明細書で使用される全ての技術用語及び科学用語は、本発明が属する技術分野の当業者によって一般的に理解されるものと同じ意味を有する。依然として、参照を明確かつ容易にするために、特定の要素が定義される。
【0019】
本明細書で使用される核酸化学、生化学、遺伝学、及び分子生物学の用語及び記号は、当該技術分野における標準的な論文及び文書、例えば、Kornberg and Baker,DNA Replication,Second Edition(W.H.Freeman,New York,1992)、Lehninger,Biochemistry,Second Edition(Worth Publishers,New York,1975)、Strachan and Read,Human Molecular Genetics,Second Edition(Wiley-Liss,New York,1999)、Eckstein,editor,Oligonucleotides and Analogs:A Practical Approach(Oxford University Press,New York,1991)、Gait,editor,Oligonucleotide Synthesis:A Practical Approach(IRL Press,Oxford,1984)などに従う。
【0020】
「ヌクレオチド」という用語は、既知のプリン及びピリミジン塩基だけでなく、修飾された他の複素環式塩基も含有する部分を含むことが意図されている。そのような修飾は、メチル化プリン又はピリミジン、アシル化プリン又はピリミジン、アルキル化リボース又は他の複素環を含む。加えて、「ヌクレオチド」という用語は、ハプテン又は蛍光標識を含有する部分を含み、従来のリボース及びデオキシリボース糖だけでなく、他の糖も含有し得る。修飾されたヌクレオシド又はヌクレオチドはまた、例えば、ヒドロキシル基のうちの1つ以上がハロゲン原子若しくは脂肪族基で置き換えられるか、又はエーテル、アミンなどとして官能化される、糖部分に対する修飾を含む。
【0021】
「核酸」及び「ポリヌクレオチド」という用語は、本明細書では互換的に使用して、ヌクレオチド、例えば、デオキシリボヌクレオチド又はリボヌクレオチドからなる、任意の長さ、例えば、約2塩基を超える、約10塩基を超える、約100塩基を超える、約500塩基を超える、1000塩基を超える、10,000塩基を超える、100,000塩基を超える、約1,000,000、最大約1010又はそれ以上の塩基のポリマーを記載し、これは、酵素によって又は合成によって生成することができ(例えば、米国特許第5,948,902号及びその中に引用された参照文献中に記載されたPNA)、2つの天然に存在する核酸のものに類似する配列特異的な様式で天然に存在する核酸にハイブリダイズすることができ、例えば、ワトソン-クリック塩基対形成相互作用に関与することができる。天然に存在するヌクレオチドには、グアニン、シトシン、アデニン、チミン、ウラシル(それぞれ、G、C、A、T、及びU)が含まれる。DNA及びRNAは、それぞれ、デオキシリボース及びリボース糖バックボーンを有し、PNAのバックボーンは、ペプチド結合によって結合した反復N-(2-アミノエチル)-グリシン単位からなる。PNAでは、様々なプリン及びピリミジン塩基は、メチレンカルボニル結合によってそのバックボーンに結合している。しばしばアクセス不可能なRNAと称される、ロックド核酸(LNA)は、修飾されたRNAヌクレオチドである。LNAヌクレオチドのリボース部分は、2’酸素及び4’炭素を連結する追加の架橋で修飾されている。架橋は、しばしばA型二本鎖に見られる、3’-エンド(North)立体構造においてリボースを「ロック」する。LNAヌクレオチドは、所望であればいつでも、オリゴヌクレオチド中のDNA又はRNA残基と混合することができる。「非構造化核酸」又は「UNA」という用語は、低減した安定性で互いに結合する非天然ヌクレオチドを含有する核酸である。例えば、非構造化核酸は、G’残基及びC’残基を含有し得、これらの残基は、低減した安定性で互いに塩基対形成するが、それぞれ、天然に存在するC及びG残基と塩基対形成する能力を保持する、G及びCの、天然に存在しない形態、すなわち、類似体に対応する。非構造化核酸は、US2005/0233340に記載されており、これは、UNAの開示のために参照により本明細書に組み込まれる。
【0022】
本明細書で使用される「核酸試料」という用語は、核酸を含有する試料を示す。本明細書で使用される核酸試料は、それらが配列を含有する複数の異なる分子を含有するという点において複合体であり得る。哺乳動物(例えば、マウス又はヒト)からのゲノムDNA試料は、複合試料のタイプである。複合試料は、約104、105、106、又は107、108、109、又は1010個を超える異なる核酸分子を有し得る。核酸、例えば、組織培養細胞からのゲノムDNAを含有する任意の試料又は組織の試料が、本明細書で採用され得る。
【0023】
本明細書で使用される「オリゴヌクレオチド」という用語は、約2~200ヌクレオチド、最大500ヌクレオチド長のヌクレオチドの一本鎖マルチマーを示す。オリゴヌクレオチドは、合成であり得るか、又は酵素的に作製され得、いくつかの実施形態では、30~150ヌクレオチド長である。オリゴヌクレオチドは、リボヌクレオチドモノマー(すなわち、オリゴリボヌクレオチドであり得る)、又はデオキシリボヌクレオチドモノマー、又はリボヌクレオチドモノマー及びデオキシリボヌクレオチドモノマーの両方を含有し得る。オリゴヌクレオチドは、例えば、10~20、21~30、31~40、41~50、51~60、61~70、71~80、80~100、100~150、又は150~200ヌクレオチド長であり得る。
【0024】
「プライマー」は、ポリヌクレオチド鋳型と二本鎖を形成するとき、核酸合成の開始点として作用することができ、伸長した二本鎖が形成されるように鋳型に沿ってその3’末端から伸長することができる、天然又は合成の、オリゴヌクレオチドを意味する。伸長プロセス中に加えられるヌクレオチドの配列は、鋳型ポリヌクレオチドの配列によって決定される。プライマーは、DNAポリメラーゼによって伸長される。プライマーは、一般に、プライマー伸長産物の合成におけるそれらの使用に適合性の長さであり、通常、8~200ヌクレオチド長、例えば、10~100ヌクレオチド長又は15~80ヌクレオチド長の範囲内である。プライマーは、鋳型にハイブリダイズしない5’尾部を含み得る。
【0025】
プライマーは、通常、増幅における最大効率のために一本鎖であるが、代替的に、二本鎖又は部分的に二本鎖であり得る。参照によって本明細書に組み込まれる、Zhang et al(Nature Chemistry 2012 4:208-214)に記載されるように、トーホールド交換プライマーも、この定義に含まれる。
【0026】
よって、「プライマー」は、鋳型に相補的であり、鋳型との水素結合又はハイブリダイゼーションによって複合体形成して、ポリメラーゼによる合成の開始のためにプライマー/鋳型複合体をもたらし、それはDNA合成のプロセスで鋳型に相補的なその3’末端で結合している共有結合した塩基の付加によって伸長される。
【0027】
「ハイブリダイゼーション」又は「ハイブリダイズする」という用語は、核酸鎖の一領域が正常なハイブリダイゼーション条件下で第2の相補的核酸鎖にアニールして、これとホモ二本鎖又はヘテロ二本鎖のいずれかの、安定した二本鎖を形成し、同じ正常なハイブリダイゼーション条件下で無関係な核酸分子と安定した二本鎖を形成しないプロセスを指す。二本鎖の形成は、ハイブリダイゼーション反応において2つの相補的核酸鎖領域をアニールすることによって達成される。ハイブリダイゼーション反応は、2つの核酸鎖が、実質的に又は完全に相補的である特定の配列における特定数のヌクレオチドを含有しない限り、2つの核酸鎖が、安定した二本鎖、例えば、正常なストリンジェンシー条件下で二本鎖状態の領域を保持する二本鎖を形成しないように、ハイブリダイゼーション反応が起こるハイブリダイゼーション条件の調節によって高度に特異的にすることができる。「正常なハイブリダイゼーション又は正常なストリンジェンシー条件」は、任意の所与のハイブリダイゼーション反応について容易に決定される。例えば、Ausubel et al.,Current Protocols in Molecular Biology,John Wiley&Sons,Inc.,New York、又はSambrook et al.,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory Pressを参照されたい。本明細書で使用される場合、「ハイブリダイズすること」又は「ハイブリダイゼーション」という用語は、核酸の鎖が塩基対形成を通して相補鎖と結合する任意のプロセスを指す。
【0028】
核酸は、2つの配列が中等度~高ストリンジェンシーのハイブリダイゼーション条件下で互いに特異的にハイブリダイズする場合、参照核酸配列に「選択的にハイブリダイズ可能」であると考えられる。中等度及び高ストリンジェンシーのハイブリダイゼーション条件が既知である(例えば、Ausubel,et al.,Short Protocols in Molecular Biology,3rd ed.,Wiley&Sons 1995及びSambrook et al.,Molecular Cloning:A Laboratory Manual,Third Edition,2001 Cold Spring Harbor,N.Y.を参照されたい)。
【0029】
本明細書で使用される「二本鎖」又は「二本鎖化」という用語は、塩基対形成される、すなわち、一緒にハイブリダイズされる2つの相補的ポリヌクレオチド領域を表す。
【0030】
ゲノム又は標的ポリヌクレオチドに関する「遺伝学的遺伝子座」、「遺伝子座」、「目的の遺伝子座」、「領域」、又は「セグメント」は、ゲノム又は標的ポリヌクレオチドの連続的な部分領域又はセグメントを意味する。本明細書で使用される場合、遺伝学的遺伝子座、遺伝子座、又は目的の遺伝子座は、ゲノムにおけるヌクレオチド、遺伝子、若しくは遺伝子の一部分の位置を指し得るか、又はそれは、遺伝子、例えば、コード配列内にあるか、若しくはそれに関連しているか否かにかかわらず、ゲノム配列の任意の連続的な部分を指し得る。遺伝学的遺伝子座、遺伝子座、又は目的の遺伝子座は、単一のヌクレオチドから、数百又は数千のヌクレオチド長以上のセグメントまでであり得る。一般に、目的の遺伝子座は、それと関連した参照配列を有するであろう(以下の「参照配列」の記載を参照されたい)。
「複数」、「集団」、及び「収集物」という用語は、少なくとも2つのメンバーを含有するものを指すために交換可能に使用される。特定の場合では、複数、集団、又は収集物は、少なくとも5、少なくとも10、少なくとも100、少なくとも1,000、少なくとも10,000、少なくとも100,000、少なくとも106、少なくとも107、少なくとも108、又は少なくとも109以上のメンバーを有し得る。
【0031】
「試料識別子配列」、「試料インデックス」、「多重識別子」、又は「MID」という用語は、標的ポリヌクレオチドに付加されるヌクレオチドの配列であり、配列は、標的ポリヌクレオチド(すなわち、標的ポリヌクレオチドが由来する試料からの試料)の供給源を特定する。使用中、各試料は、異なる試料識別子配列でタグ付けされ(例えば、1つの配列が各試料に付加され、異なる試料が異なる配列に付加され)、タグ付けされた試料がプールされる。プールした試料を配列決定した後、試料識別子配列を使用して、配列の源を特定することができる。試料識別子配列は、ポリヌクレオチドの5’末端又はポリヌクレオチドの3’末端に付加され得る。特定の場合では、試料識別子配列のいくつかは、ポリヌクレオチドの5’末端であり得、試料識別子配列の残部は、ポリヌクレオチドの3’末端であり得る。試料識別子の要素が各末端で配列を有するとき、一緒に、3’及び5’試料識別子配列は、試料を特定する。多くの例では、試料識別子配列は、標的オリゴヌクレオチドに付加される塩基のサブセットのみである。識別子配列は、ライゲーションによって又はプライマー伸長によってポリヌクレオチドに付加することができる。後者の実施形態では、識別子配列は、5’尾部又はプライマー伸長に使用されるプライマーにあり得る。そのような実施形態では、標的ポリヌクレオチドは、元の標的ポリヌクレオチドのコピーである。
【0032】
「アリコート識別子配列」という用語は、異なるアリコートからの配列リードが互いに区別されることを可能にする付加された配列を指す。アリコート識別子配列は、異なる試料ではなく、それらが試料のアリコート上で使用されることを除いて、上述の試料識別子配列と同じように機能する。単一配列は、試料識別子及びアリコート識別子として機能し得る。
【0033】
「可変」という用語は、可変である2つ以上の核酸配列の文脈において、互いに対して異なるヌクレオチドの配列を有する2つ以上の核酸を指す。換言すれば、集団のポリヌクレオチドが可変配列を有する場合、集団のポリヌクレオチド分子のヌクレオチド配列は、分子によって異なり得る。「可変」という用語は、集団における全ての分子が、集団における他の分子と異なる配列を有することを必要とするように読み取られるべきではない。
【0034】
「実質的に」という用語は、ハミング距離、レーベンシュタイン距離、ジャッカード距離、コサイン距離などを含むが、これらに限定されない、相似関数によって測定されるほぼ複製である配列を指す(一般に、Kemena et al,Bioinformatics 2009 25:2455-65を参照されたい)。正確な閾値は、分析を実施するために使用される試料調製及び配列決定のエラー率に依存し、より高いエラー率は、類似性のより低い閾値を必要とする。特定の場合では、実質的に同一の配列は、少なくとも98%又は少なくとも99%の配列同一性を有する。
【0035】
本明細書で使用される「配列バリエーション」という用語は、頬スワブなどの体性バリアントを含むことが予想されない患者の試料からの参照ゲノム又は配列などの、参照配列とは異なるバリアントである。多くの事例では、「配列バリエーション」は、試料中の他の分子と比較して、50%未満の頻度で存在するバリアントである。多くの配列バリエーション、例えば、インデル及びヌクレオチド置換は、配列バリエーションを含まない分子と実質的に同一である。いくつかの場合では、特定の配列バリエーションは、20%未満、10%未満、5%未満、1%未満、0.5%未満、0.1%未満、0.05%未満、又は0.01%未満の頻度で試料中に存在し得る。
【0036】
「核酸鋳型」という用語は、増幅中にコピーされる初期核酸分子を指すよう意図されている。この文脈におけるコピーすることは、特定の一本鎖核酸の相補体の形成を含むことができる。「初期」核酸は、既に処理されている核酸、例えば、アダプターで増幅、伸長、標識されている核酸などを含むことができる。
【0037】
「尾部」という用語は、尾部プライマー又は5’尾部を有するプライマーの文脈において、プライマーの3’末端と同じ標的にハイブリダイズしないか、又は部分的にハイブリダイズする、その5’末端における領域(例えば、少なくとも12~50ヌクレオチドの領域)を有するプライマーを指す。
【0038】
「初期鋳型」という用語は、増幅される標的配列を含有する試料を指す。本明細書で使用される「増幅すること」という用語は、標的核酸を鋳型として使用して、標的核酸の1つ以上のコピーを生成することを指す。
【0039】
本明細書で使用される「アンプリコン」という用語は、PCR反応における特定のプライマー対によって増幅された産物(又は「バンド」)を指す。
【0040】
本明細書で使用される「複製アンプリコン」は、試料の異なる部分又はアリコートを使用して増幅された同じアンプリコンを指す。複製アンプリコンは、典型的には、鋳型における配列バリエーション、PCRエラー、及び各アリコートに使用されるプライマーの配列における違い(例えば、アリコート識別子配列などのプライマーの5’末端における違いなど)を除いて、ほぼ同一の配列を有する。
【0041】
「ポリメラーゼ連鎖反応」又は「PCR」は、特異的鋳型DNAが1つ以上の配列特異的プライマー対を使用して増幅される、酵素反応である。
【0042】
「PCR条件」は、当該技術分野で既知であるように、PCRが実施される条件であり、試薬(例えば、ヌクレオチド、緩衝液、ポリメラーゼなど)、及び温度サイクル(例えば、変性、再飽和、及び伸長に好適な温度のサイクルを通した)の存在を含む。
【0043】
「多重ポリメラーゼ連鎖反応」又は「多重PCR」は、異なる標的鋳型について2つ以上のプライマー対を採用する酵素反応である。標的鋳型が反応中に存在する場合、多重ポリメラーゼ連鎖反応は、対応する数の配列特異的プライマー対を使用して単一反応で共増幅される2つ以上の増幅されたDNA産物をもたらす。
【0044】
「次世代配列決定」という用語は、核酸配列決定を実施する、いわゆる高度に並列化された方法を指し、Illumina、Life Technologies、Pacific Biosciences and Rocheなどによって現在採用されている合成による配列決定又はライゲーションプラットフォームによる配列決定を含む。次世代配列決定方法には、Oxford Nanoporeによって提供されるようなナノ細孔配列決定方法、又はLife Technologiesによって商品化されたIon Torrent技術などの電子検出ベースの方法も含まれ得るが、これらに限定されない。
【0045】
「配列リード」という用語は、シーケンサーの出力を指す。配列リードは、典型的には、50~1000塩基以上の長さの、G、A、T、及びCの列を含有し、多くの場合では、配列リードの各塩基は、塩基コールの質を示すスコアと関連し得る。
【0046】
「~の存在を評価すること(assessing)」及び「~の存在を評価すること(evaluating)」という用語は、要素が存在するかを決定すること、及び要素の量を推定することを含む、任意の形態の測定を含む。「決定する」、「測定する」、「判断する」、「評価する」及び「分析する」は互換的に使用され、定量的及び定性的決定を含む。評価は、相対的又は絶対的であってもよい。「~の存在を評価すること」は、存在するものの量を決定すること、及び/又はそれが存在するか若しくは不在であるかを決定することを含む。
【0047】
2つの核酸が「相補的」である場合、それらは、高ストリンジェンシー条件下で互いにハイブリダイズする。「完全に相補的」という用語は、核酸塩基のうちの1つの各塩基が他の核酸中の相補的ヌクレオチドと対合する二本鎖を説明するために使用される。多くの場合では、相補的である2つの配列は、少なくとも10、例えば、少なくとも12又は15ヌクレオチドの相補性を有する。
【0048】
「オリゴヌクレオチド結合部位」は、オリゴヌクレオチドが標的ポリヌクレオチド中でハイブリダイズする部位を指す。オリゴヌクレオチドがプライマーの結合部位を「提供する」場合、プライマーは、そのオリゴヌクレオチド又はその相補体にハイブリダイズし得る。
【0049】
本明細書で使用される「鎖」という用語は、共有結合、例えば、ホスホジエステル結合によって一緒に共有結合したヌクレオチドからなる核酸を指す。細胞において、DNAは、通常、二本鎖形態で存在し、したがって、本明細書において「上」及び「下」鎖と称される核酸の2つの相補鎖を有する。特定の場合では、染色体領域の相補鎖は、「プラス」及び「マイナス」鎖、「第1の」及び「第2の」鎖、「コード化」及び「非コード化」鎖、「ワトソン」及び「クリック」鎖、又は「センス」及び「アンチセンス」鎖と称され得る。上又は下鎖であるとしての鎖の割り当ては、任意であり、いずれかの特定の配向、機能、又は構造を示さない。いくつかの例示的な哺乳動物染色体領域(例えば、BAC、アセンブリ、染色体など)の第1の鎖のヌクレオチド配列は、既知であり、例えば、NCBIのGenbankデータベースに見出され得る。
【0050】
本明細書で使用される「伸長すること」という用語は、ポリメラーゼを使用したヌクレオチドの付加によるプライマーの伸長を指す。核酸にアニーリングされるプライマーが伸長される場合、核酸は、伸長反応の鋳型として作用する。
【0051】
本明細書で使用される「配列決定すること」という用語は、ポリヌクレオチドの少なくとも10個の連続するヌクレオチドの同一性(例えば、少なくとも20個、少なくとも50個、少なくとも100個、又は少なくとも200個以上の連続するヌクレオチドの同一性)が得られる方法を指す。
【0052】
本明細書で使用される「プールすること」という用語は、それらの試料又はアリコート内の分子が溶液中で互いに散在するように、2つ以上の試料又は試料のアリコートを組み合わせること、例えば、混合することを指す。
【0053】
本明細書で使用される「プールされた試料」という用語は、プールすることの産物を指す。
【0054】
本明細書で使用される「部分」という用語は、同じ試料の異なる部分の文脈において、試料のアリコート又は一部を指す。例えば、100ulの試料の1マイクロリットルが、10個の異なるPCR反応の各々に加えられる場合、それらの反応は、各々、同じ試料の異なる部分を含有する。
【0055】
本明細書で使用される場合、「無細胞DNA」(「cfDNA」)という用語は、細胞ではなく、体液中で遊離しているDNAを指す。cfDNAは、例えば、血漿、血清、脳脊髄液、尿、唾液、又は便から単離することができる。「血流からの無細胞DNA」及び「循環無細胞DNA」は、患者の末梢血中で循環しているDNAを指す。無細胞DNA中のDNA分子は、1kb未満の中央サイズ(例えば、50bp~500bp、80bp~400bp、又は100~1,000bpの範囲内)を有し得るが、この範囲外の中央サイズを有する断片が存在し得る。無細胞DNAは、腫瘍DNA(tDNA)、例えば、がん患者の血液中を自由に循環する腫瘍DNAを含み得る。cfDNAは、試料を遠心分離して全ての細胞を除去し、次いで残った液体(例えば、血漿又は血清)からDNAを単離することによって得ることができる。そのような方法は、周知である(例えば、Lo et al,Am J Hum Genet 1998;62:768-75を参照されたい)。循環無細胞DNAは、二本鎖又は一本鎖であり得る。この用語は、血流中で循環している遊離DNA分子、及び血流中で循環している細胞外小胞(エクソソームなど)中に存在するDNA分子を包含することが意図されている。
【0056】
本明細書で使用される場合、「腫瘍DNA」(又は「tDNA」)という用語は、腫瘍由来のDNAである。tDNAは、変異を含むため、特定することができる。tDNAは、組織生検から、循環腫瘍細胞(CTC)から、尿若しくは便試料中のものなどの、腫瘍組織の一部ではなくなったが、循環していない他の細胞から、直接単離することができるか、又は患者のcfDNAの一部(又は「画分」)であり得る。tDNAは、クローン変異及びサブクローン変異の両方を含む。腫瘍の進化には、クローン変異とサブクローン変異との間の移行がある。サブクローン変異は、腫瘍中の細胞のサブセットにのみ存在し、これらは、腫瘍試料中の全てのがん細胞の最も近い共通祖先の後に発生する。対照的に、クローン変異は、全てのがん細胞の最も近い共通祖先の前に発生した。クローン変異は、したがって、変異、例えば、その場合では細胞のサブセットにおいて遺伝子座全体が失われる、構造的バリエーションを除去した何らかのメカニズムがない限り、腫瘍中の全ての細胞に存在する。ctDNAは、腫瘍起源のものであり、腫瘍又は循環腫瘍細胞(CTC)に直接由来し、これらは、原発腫瘍から流出し、血流又はリンパ系に入ることができる生存可能でインタクトな腫瘍細胞である。ctDNAが放出される方法の正確なメカニズムは不明であるが、それは、瀕死細胞からのアポトーシス及び壊死、又は生存腫瘍細胞からの活性放出を伴うと仮定される。循環tDNA(ctDNA)は、高度に断片化され得、いくつかの場合では、約100~250bp、例えば、150~200bpの長さの平均断片サイズを有し得る。がん患者から単離された無循環細胞DNAの試料中のctDNAの量は、大いに変動する:典型的な試料は、10%未満のctDNAを含有するが、MRDについて評価されている患者からの多くの試料は、0.01%未満のctDNAを有し得、いくつかの試料は、10%を超えるctDNAを有する。ctDNAの分子は、多くの場合、それらが腫瘍原性変異を含有するため、特定することができる。
【0057】
本明細書で使用される場合、「配列バリエーション」という用語は、配列改変の位置及びタイプの組み合わせを指す。例えば、配列バリエーションは、バリエーションの位置によって、どのタイプの置換(例えば、GからA、GからT、GからC、AからGなど、又はG、A、T、若しくはCなどの挿入/欠失)が位置に存在するかによって称され得る。配列バリエーションは、1つ以上のヌクレオチドの置換、欠失、挿入、再配列であり得る。本方法の文脈において、配列バリエーションは、例えば、PCRエラー、配列決定におけるエラー、又は遺伝的バリエーションによって生成され得る。
【0058】
本明細書で使用される場合、「遺伝的バリエーション」という用語は、核酸試料中に存在するか、又は存在する可能性が高いとみなされるバリエーション(例えば、ヌクレオチド置換、インデル、又は再配列)を指す。遺伝的バリエーションは、任意の供給源からのものであり得る。例えば、遺伝的バリエーションは、変異(例えば、体性変異)によって生成することができるか、又は臓器移植若しくは妊娠などにおける生殖系列であり得る。配列バリエーションが、遺伝的バリエーションとしてコールされる場合、コールは、試料がバリエーションを含有する可能性が高いことを示し、いくつかの場合では、「コール」は、不正確であり得る。多くの場合では、「遺伝的バリエーション」という用語は、「変異」という用語に置き換えることができる。例えば、方法が、がん又は変異によって引き起こされる他の疾患に関連する配列バリエーションを検出するために使用されている場合、「遺伝的バリエーション」は、「変異」という用語に置き換えることができる。
【0059】
本明細書で使用される場合、文脈に応じて、「コーリング」という用語は、特定の遺伝的バリエーションが配列に存在するか、試料が遺伝的バリエーションを含むか、又は試料ががんDNAを含むかを示すことを意味し得る。
【0060】
本明細書で使用される場合、「閾値」という用語は、コールを行うために必要とされる証拠のレベル(例えば、比)を指す。
【0061】
本明細書で使用される場合、「値」という用語は、証拠の強度を示すことができる数値、文字、単語(例えば、「高」、「中」、若しくは「低」)、又は記述子(例えば、「+++」若しくは「++」)を指す。値は、値がどのように分析されるかに応じて、1つの構成要素(例えば、単数)又は2つ以上の構成要素を含むことができる。
【0062】
本明細書で使用される場合、「アリコート」という用語は、試料の一部分を指す。例えば、3つの体積が独立して同じ試料から除去される場合、体積の各々は、アリコートと称され得る。アリコートは、同じ体積である必要はない。
【0063】
本明細書で使用される場合、「がん関連細胞」という用語は、患者のがんの細胞の一部であるか、又はそれに遺伝的に関連する細胞を意味する。がん関連細胞は、固形腫瘍の一部、血液/血液学的がん、又は固形腫瘍であり得る。患者におけるがん関連細胞の存在は、全てのがん細胞が治療中に除去又は殺滅されなかった証拠であり得る。がん関連細胞は、患者のがんの細胞と実質的に同じ体性変異を有し、いくつかの場合では、がんの1つ以上の細胞の子孫であり得る。がん関連細胞は、微小残存病変に起因し得るか、あるいは腫瘍の不完全な除去、不完全な治療、原発部位若しくは遠位部位でのがん再発(recurrence)若しくは再発(relapse)、及び/又は腫瘍転移(微小転移を含む)によって生成され得る。
【0064】
本明細書で使用される場合、「患者のがんに関連する(その内に存在する)配列バリエーション」という用語は、患者のがんの細胞のゲノムにあるか、又は任意のがん治療の前に患者のがんの細胞のゲノムにあった体性変異を意味することを意図している。それはまた、がん試料内に存在するエピジェネティックな変化を意味し得る。
【0065】
本明細書で使用される場合、「最小残存病変」(MRD)は、治癒目的での治療後のがん細胞の存在を指す。MRDはまた、いくつかの出版物では「分子残存病変」又は「残存病変」と称され得る。
【0066】
本明細書で使用される場合、「再発を検出すること」という用語は、変異体DNAの特定を通して腫瘍の再発を検出することを指す。この文脈において、「早期検出」という用語は、腫瘍再発が放射線撮像などのような従来の標準治療/監視モニター方法を通して確実に検出することができる前の変異体DNAの検出を指す。これは、例えば、以下に記載されるように、cfDNA中のctDNAの存在について複数の時点で連続的に収集された血液試料をモニターすることによって達成され得る。
【0067】
「がん」という用語は、本明細書では、制御されていない細胞分裂を特徴とする任意の疾患を指すために使用される。がんは、血液のがん(すなわち、血液学的がん)、例えば、白血病、リンパ腫、又は多発性骨髄腫であり得るか、又はがんは、腫瘍性であり、例えば、細胞が必要以上に増殖及び分裂するか、又は死滅すべきときに死滅しない異常組織腫瘤に関連し得る。腫瘍性がん、例えば、肺がん、乳がん、又は肝臓がんは、固形腫瘍に関連している。
【0068】
「がんDNA」という用語は、がん性細胞に由来するDNAを指す。がんDNAは、患者が血液がんを有する場合、患者のリンパ、骨髄、又は循環血液から単離される細胞の集団から単離されたDNAに存在し得る。固形腫瘍由来のがんDNAは、cfDNAにおいて見ることができ、その場合では、tDNA又はctDNAが参照される。
【0069】
「エラー確率分布」及び「エラー確率分布モデル」という用語は、観測(典型的にはバリアント対立遺伝子画分)がエラーによるものである確率を推定又はモデル化する分布を指す。これらの用語は、「高シグナルバックグラウンド事象」(DNA損傷又は非常に初期のサイクルPCRエラーが原因であり得る)及び「推定バックグラウンドエラー率」(シーケンサー及びPCRポリメラーゼ「エラー」を含む)の両方を捉える。そのような分布の例を
図13A及びBに示す。
【0070】
「集合的な結果」を分析する文脈における「集合的な」という用語は、肯定的な結果だけではなく、バリアント及びアリコートの全てについての結果を意味する(任意の統計的外れ値、又は、例えば、それらが腫瘍DNAに存在しないか、若しくはバフィーコートDNAに存在するため除外される、他のバリアントを除外する)。
【0071】
用語の他の定義は、明細書全体を通して現れ得る。特許請求の範囲がいずれの任意選択的な要素も排除するように起草されている場合があることに更に留意されたい。したがって、この記述は、特許請求の範囲の要素の列挙に関連する「単に」、「のみ」などの排他的な用語の使用、又は「否定的」限定の使用の先行詞としての役割を果たすことが意図されている。
【発明を実施するための形態】
【0072】
本発明をより詳細に説明する前に、本発明は記載された特定の実施形態に限定されず、したがって、当然のことながら変更され得ることを理解されたい。本発明の範囲は、添付の特許請求の範囲のみによって限定されるので、本明細書で使用される用語は、特定の実施形態を説明する目的のためのみのものであり、限定することを意図していないこともまた理解されるべきである。
【0073】
値の範囲が提供される場合、その範囲の上限値と下限値の間の、文脈上そうではないと明確に指示されない限りは下限値の単位の10分の1までの各介在値、及びその記載される範囲内の任意の他の記載値又は介在値が、本発明に包含されることを理解されたい。
【0074】
別途定義されない限り、本明細書で使用される全ての技術用語及び科学用語は、本発明が属する技術分野の当業者に一般に理解されるのと同じ意味を有する。本明細書に記載されるものと同様又は同等の任意の方法及び物質はまた、本発明の実施又は試験においても使用することができるが、好ましい方法及び物質をここで説明する。
【0075】
本明細書に引用される全ての刊行物及び特許は、各個々の刊行物又は特許が参照により組み込まれるように具体的かつ個別に示されているかのように参照により本明細書に組み込まれ、刊行物が引用される関連する方法及び/又は物質を開示かつ記載するために、参照により本明細書に組み込まれる。任意の刊行物の引用は、出願日前のその開示に関するものであり、本発明が先行発明のためにその刊行物に先行する権限を有しないことを認めるものと解釈されるべきではない。更に、示されている公開日は、実際の公開日とは異なる場合があり、別個に確認する必要がある。
【0076】
本明細書及び添付の特許請求の範囲で使用される場合、単数形「a」、「an」、及び「the」は、文脈がそうでないことを明確に示さない限り、複数の指示対象を含むことが留意されなければならない。特許請求の範囲がいずれの任意選択的な要素も排除するように起草されている場合があることに更に留意されたい。したがって、この記述は、特許請求の範囲の要素の列挙に関連して「単に」、「のみ」などの排他的な用語の使用、又は「否定的な」限定の使用のための先行詞としての役割を果たすよう意図されている。
【0077】
本開示を読む際に当業者に明らかであるように、本明細書に説明及び例証される個々の実施形態の各々は、本発明の範囲又は趣旨から逸脱することなく、他のいくつかの実施形態のいずれかの特徴から容易に分離することができるか、又は該特徴と組み合わせることができる個別の要素及び特徴を有する。何らかの列挙された方法は、列挙された事象の順序で、又は論理的に可能であるその他の順序で実施することができる。
【0078】
明らかであり得るように、2つ以上の標的領域について複数のアリコートを評価する各アッセイは、検出限界又はLODと称されることもある、がんDNAを確実に検出することができる異なる下限を有し得る。それはまた、定量限界又はLOQと称されることもある、がんDNAの量を正確に定量化することができる異なる限界を有し得る。そのようなアッセイが最も有用であるためには、いくつかの場合では、LOD又はLOQのいずれか又は両方の正確な推定値を得ることが重要であり得る。そのような推定値は、クローン性、マッピング可能性、推定エラー率、高シグナルバックグラウンド事象の推定割合、領域内でのコピー数増加の存在、又は標的とされる患者のがんに関連する各配列バリエーションの増幅を含み得る因子を組み合わせることによって得ることができる。それはまた、アリコートの数、標的化された領域の配列決定リードの総数、及び各アリコートに入力される分子の数を含み得る、ライブラリー調製及び配列決定ランに特異的な因子を含み得る。
【0079】
上記のように、患者(例えば、がん患者)からのDNAの試験試料中のがんDNAを検出するための方法が提供される。いくつかの実施形態では、方法は、試験試料の複数のアリコート(例えば、試験試料の少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、又は少なくとも6つのアリコート)を配列決定して、各アリコートについて、各々が患者のがん内に存在する配列バリエーションを有する2つ以上の標的領域(例えば、少なくとも3つ、少なくとも5つ、少なくとも10個、少なくとも20個、少なくとも50個、少なくとも100個、少なくとも1000個、又は少なくとも5000個の標的領域)に対応する配列リードを生成することを含み得る。例えば、方法は、試験DNA試料の3~10個のアリコートを配列決定して、各アリコートについて、8~100個の標的領域に対応する配列リードを生成することを含み得る。非常に一般的に言えば、感度は、アリコートの数を増加させることによって、バリアントの数を増加させることによって、又はアリコート及びバリアントの数を増加させることによって、増加させることができる。例えば、いくつかの実施形態では、方法は、試験試料の少なくとも2つ(例えば、3つ又は4つ)のアリコートを配列決定して、各アリコートについて、各々が配列バリエーションを有する10個以上の標的領域に対応する配列リードを生成することを含み得る。他の実施形態では、方法は、試験試料の少なくとも10個のアリコートを配列決定して、各アリコートについて、各々が配列バリエーションを有する2つ(例えば、3つ又は4つ)以上の標的領域に対応する配列リードを生成することを含み得る。実際に、方法は、十分な数の配列バリエーションが分析される場合、単一のアリコートを使用して行うことができる。
【0080】
方法は、(a)試験試料の複数のアリコートを配列決定して、各アリコートについて、各々が患者のがん内に存在する配列バリエーションを有する2つ以上の標的領域に対応する配列リードを生成することと、(b)各アリコートについて、各標的領域について:i.配列バリエーションを有する配列リードの数を決定し、ii.配列リードの総数を決定し、iii.i.及びii.を配列バリエーションの1つ以上のエラー確率分布モデルと比較することであって、1つ以上のモデルが、配列バリエーションを含まないDNAから得られる、比較することと、(c)ステップ(b)の集合的な結果を統合して、試験試料中にがんDNAが存在するかを決定することと、を含み得る。
【0081】
これらの実施形態では、異なるアリコートは、同じ試料の異なるアリコート(すなわち、部分)を含む。理解されるように、異なるバーコード配列は、異なる試料に付加することができ、異なる試料は、配列決定の前にプールすることができる。
【0082】
フローチャート
本方法のワークフローのいくつかを添付のフローチャートに示す(
図1~10)。これらのフローチャートは、主に自明であると考えられる。
【0083】
方法をより詳細に記載する前に、本方法を使用して、固形腫瘍及び血液学的がんの両方からのがんDNAを検出することができることに留意されたい。したがって、この請求項が「がん」という用語を使用する場合、用語は、血液がん及び固形腫瘍を指す。固形腫瘍の実施形態では、方法は、cfDNA(例えば、循環cfDNA)中のがんDNA(又は、より正確には、腫瘍DNA)を特定し得る。血液がんの実施形態では、方法は、骨髄、リンパ節、若しくは循環白血球から採取された細胞から抽出されたDNA中、又はcfDNA中のがんDNAを特定し得る。例えば、血液がんの実施形態では、AML患者(治療前)から骨髄吸引物を採取し、そのAMLにおけるバリアントを発見することができ、次いで、治療後、更なる骨髄吸引物、無細胞DNA、又は尿を検査して、患者が依然としてがんDNAを有するかを決定することができる。
【0084】
加えて、方法で分析される核酸は、DNA又はRNAであり得る。本開示は、DNA(具体的にはctDNA)を利用する実施形態を記載して書かれている。しかしながら、方法はまた、同じものから作製されたRNA(又はcDNA)を使用するときに機能するはずである。
【0085】
加えて、本方法は、「アンプリコン」配列決定を利用する例を使用して詳細に記載されるが、本方法は、分子バーコード又はインデックス、例えば、増幅前の核酸に付加されるランダム配列を利用する方法に容易に適用され得る。分子バーコード配列は、サイズ及び組成において広く変動し得、以下の参考文献は、特定の実施形態に適したバーコード配列のセットを選択するためのガイダンスを提供する:Casbon(Nuc.Acids Res.2011,22 e81)、Brenner、米国特許第5,635,400号、Brenner et al,Proc.Natl.Acad.Sci.,97:1665-1670(2000)、Shoemaker et al,Nature Genetics,14:450-456(1996)、Morris et al、欧州特許公開0799897A1、Wallace、米国特許第5,981,179号など。特定の実施形態では、バーコード配列は、2~36ヌクレオチド、又は6~30ヌクレオチド、又は8~20ヌクレオチドの範囲の長さを有し得る。例えば、アリコートベースの配列決定は、インデックス付けされたDNAに対して行われ得、分子の数/存在する分子の確率は、各アリコートにおいてインデックス配列を使用して推定することができる。
【0086】
図5に示される事前較正方法では、エラー確率分布が生成されるバリアントのタイプ及びクラスは、異なり得ることに留意されたい。例えば、特定のバリアントは、その周囲の配列の文脈内で分析され得る。これは、変異体を含むことが予想されないDNA(例えば、健康なドナーからのDNA)を使用して標的領域を配列決定するか、又は野生型配列及びバーコードを含む標的領域(バリアント領域の外側)について合成DNA/RNAをスパイクインし、試験反応に対するバーコード及びスパイクの分離を可能にすることによって達成することができる。別の例では、特定のバリアントは、バリアントのクラスの文脈内で分析され得る。バリアントのクラスは、同じタイプのバリアント(例えば、A>TなどのSNV、TTTTの挿入などのインデル、CT>AAなどの二塩基置換など)、転位又は転換、一塩基バリアント及び3’、5’、又は両方のいずれかの1~5塩基(例えば、Aが5’TTCAを有する、A>T(TTCAA>TTCAT)、又はAが5’T及び3’Gを有する、A>T(TAG>TTG))を含む。代替的に、バリアントは、上記のクラスに群化され得るが、バリアントの塩基3’及び/又は5’のいくつか又は全ては、IUPAC縮重ヌクレオチドコードによって記載される複数の塩基のうちの1つであり得る。(例えば、Aが5’K及び3’Sを有する、A>T(KAS>KTS)(K=G/T及びS=C/G)。代替の実施形態では、ローカル配列コンテキストは、Nが1~100である、目的のバリアントの周囲のN3’及び又は5’塩基のウィンドウを選択することと、各位置での塩基変化、各位置での塩基変化のタイプ(例えば、転位又は転換)、プライマー末端からの距離、反復配列からの距離などの異なる配列記述子を抽出することによって探索され、これらは次いで、ヒューリスティックな組み合わせスコア又は機械学習法(教師なし若しくは教師あり)を使用することによってカテゴリー的エラー率クラス(例えば、高、中、低)又は数値的エラー率値を予測するために組み合わされる。上記の1つとしての方法であるが、ペナルティスコアは、倍数因子の形態で、モノヌクレオチド反復、反復領域、又は同様のものなどの、予め定義された配列特徴に近接したバリアントの推定エラー率に割り当てられる。この分析は、バリアントのクラスを含むことが予想されないDNA(例えば、健康なドナーからのDNA)を配列決定することによって行うことができる。この実施形態では、各バリアントクラスが少なくとも1回(及び理想的には、例えば、10回又は50回又は100回超)で表されるように、十分な領域が標的化され、配列決定されなければならない。
【0087】
加えて、エラー確率分布の数及びタイプは異なり得る。各バリアント(又はクラス)のいくつかのバージョンでは、全てのエラーについて単一の分布がある。他の実施形態では、異なるタイプのエラーを分離する複数の分布がある。いくつかの実施形態では、各バリアントについて2つのエラー分布があり、そのうちの1つは、「推定バックグラウンドエラー率」のものである。これらは、典型的には、ライブラリー調製の後半(例えば、PCRの最初の数サイクル後)において発生する配列決定エラー及びPCRエラーである。次いで、発生頻度がかなり低いが、発生するときは、かなり高いレベル、典型的には試料中の実際のバリアントと同様のレベル(バリアント対立遺伝子頻度の点で)である事象がある。これらの「高シグナルバックグラウンド事象」は、ライブラリー調製の最初の数サイクル又は前増幅におけるDNA損傷及びポリメラーゼエラーなどを含む。これらは、第2の分布によって捉えることができる(例えば、推定バックグラウンドエラー率に1つの二項分布及び高シグナルバックグラウンド事象に1つ)。いくつかの実施形態では、異なる分布は、推定バックグラウンドエラー率及び高シグナルバックグラウンド事象について使用される(例えば、推定バックグラウンドエラー率にベータ分布及び高シグナルバックグラウンド事象に二項分布)。
【0088】
各バリアントのいくつかの実施形態では、同じバリアントクラス(例えば、2bp3’及び2bp5’)が両方の分布に使用される。しかしながら、いくつかの実施形態では、2つの異なる分布が異なるエラープロセス(例えば、DNA損傷及びPCRエラー)の結果である場合があるため、各バリアントについて、2つの分布について異なるバリアントクラスが使用される。
【0089】
1つ又は複数の分布を生成するための対照物質及び方法もまた異なり得る。例えば、確率分布は、同じライブラリー調製において生成し、事前に対照DNAを使用して、試験試料として実行するか、又は事前に試験試料を評価するときにバリアントを含むと予想される塩基以外の全ての塩基を使用して調整することができる。
【0090】
全ての場合では、モデルを生成するために、同じ配列決定プロセス(ライブラリー調製、シーケンサーを含む)並びに最適には同じ試料タイプ及び抽出方法(例えば、cfDNA採血管に採取された血液から抽出されたcfDNA)が使用されるべきである。
【0091】
いくつかの場合では、一連の異なるDNA入力について異なるモデルが生成され、最もマッチしたDNA入力を有するモデルを使用して試験試料が分析される。例えば、各アリコートについての最大、最小、及び中央DNA入力を定義し、次いで試験されるバリアントの全てのクラスの3つ全てについて1つ又は複数の分布を得ることができる。試験試料が評価されると、そのDNA入力が最も近いマッチである分布と比較される。
【0092】
最適には、モデルを構築するために試験される数十、数百、又は数千の試料が存在するであろう。
【0093】
分布は、データベースに保存及び/又は公開データベースからダウンロードすることができる。
【0094】
いくつかの実施形態では、(例えば、
図8に示されるように)がんDNAの量は、方法を使用して定量化され得る。これらの実施形態では、(変異体及びアリコートにわたる)平均又は中央バリアント対立遺伝子画分、(以前に予め決定されたオフセット又はベースラインエラー率を差し引くことによって生成された)補正された平均又は中央バリアント対立遺伝子画分、(レベルの範囲を試験し、最もありそうなものを決定する)最大尤度、腫瘍画分を推定すること:最大尤度、ベイズ事後を与える腫瘍画分を選択するグリッドベース又は期待値最大化検索法、又は各バリアント(及び任意に各アリコート)の推定バリアント分子の数を合計することのうちの1つ又は組み合わせを使用して、試験試料中のがんDNAの量、試験試料又は推定腫瘍画分中のありそうな量の範囲を決定し得る。別の実施形態では、がんDNAの量は、各アリコートにおけるバリアント陽性標的領域(閾値を超える標的領域)の数をカウントし、これを、アリコートを掛けた標的領域の総数に対して比較し、陽性結果の画分にポアソン補正を適用することによってアリコート当たりの標的領域当たりの標的配列を含むバリアントの平均数を定量化することによって決定され得る。いくつかの実施形態では、より正確な定量化を行うために、バリアントのセット全体について推定高シグナルバックグラウンド事象の割合はまた、ポアソン補正で使用され得る。
【0095】
一般的な方法論
いくつかの実施形態では、(a)試験試料の複数のアリコートを配列決定して、各アリコートについて、各々が患者のがん内に存在する配列バリエーションを有する2つ以上の標的領域に対応する配列リードを生成することと、(b)各アリコートについて、各標的領域について、配列バリエーションを有する分子の数の推定値を導出するか、配列バリエーションを有する少なくとも1つの分子が存在する確率を計算するか、又は配列リードの総数と比較した配列バリエーションを有する(a)の配列リードの頻度が閾値を超えているかを決定することと、(c)ステップ(b)の推定値、又は確率又は頻度を使用して試験試料中にがんDNAが存在するかを決定することと、を含む、方法。いくつかの実施形態では、ステップ(b)は、以下に記載される、閾値化アプローチによって行われ得、代替の実施形態では、ステップ(a)は、十分な数の標的領域がある限り、アリコート化することなく行うことができる。
【0096】
いくつかの実施形態では、各アリコート及び各標的領域について、試験試料中の配列バリエーションを有する分子の数、又は配列バリエーションを有する少なくとも1つの分子が存在する確率は、(b)(i)配列バリエーションを有する(a)の配列リードの数、(ii)(a)の配列リードの総数、及び(iii)配列バリエーションの推定バックグラウンドエラー率を使用して推定される。(iii)のバックグラウンドエラー率は、エラー確率分布で表され得る。加えて、配列バリエーションを有する少なくとも1つの分子が存在する確率は、(a)の各アリコートに入力された分子の数を使用して推定される。(iii)の推定バックグラウンドエラー率は、目的のバリアントを除いて、ステップ(a)で得られた対照塩基のデータを使用して調整された、例えば、先行配列決定反応、若しくは、例えば、先行配列決定反応からの、公に入手可能な情報から、及び/又は現在の配列決定反応から、任意の便利な方法によって推定される。例えば、推定バックグラウンドエラー率は、ステップ(a)で生成された対照配列決定リードの分析によって推定され得る。
【0097】
任意の実施形態では、バックグラウンドエラー率は、確率分布を使用して推定することができる。いくつかの実施形態では、同じファミリーの2つの分布(例えば、2つの二項分布)があり得るか、又は2つの異なるファミリーが使用される場合、バックグラウンドエラー率について1つの分布、高シグナルバックグラウンド事象の推定割合について別のものがあり得る。上記のように、任意の実施形態では、推定値は、存在するバリアント分子の数にわたる確率分布である。
【0098】
任意の実施形態では、(c)は、試料中に:(i)がんDNAが存在する場合、(ii)がんDNAが存在しない場合、(b)における推定値を観測する尤度間の尤度比を計算することによって行われ得る。同様に、任意の実施形態では、(c)は、各標的領域及びアリコートについて:(i)がんDNAが存在する場合、(ii)がんDNAが存在しない場合、(b)における推定値を観測する尤度間の尤度比(LRi)を計算することによって行われ得る。これらの実施形態では、個々の尤度比LRiは、試料の全ての領域及びアリコートにわたる累積LRスコア(対数尤度の合計に等しいLRiの積)に組み合わされ得る。これらの実施形態では、試験試料中にがんDNAが存在する場合に(b)の推定値を観測する尤度は、(i)ステップ(b)の推定値又は確率、及び任意に(ii)試験試料中のがんDNA画分の推定値に基づいて計算され得る。同様に、試験試料中にがんDNAが存在しない場合に(b)の推定値を観測する尤度は、(i)ステップ(b)の推定値又は確率、及び(ii)高シグナルバックグラウンド事象の推定割合に基づいて計算され得る。
任意の実施形態では、ステップ(c)は、(i)ステップ(b)の推定値又は確率、(ii)高シグナルバックグラウンド事象の推定割合、及び任意に(iii)試験試料中のがんDNA画分の推定値を組み込む混合モデルを使用することによって計算され得る。例えば、いくつかの場合、ステップ(c)は、混合モデルの出力又は尤度比を閾値と比較することを更に含み得、閾値以上である出力は、試験試料が腫瘍DNAを含むことを示す。閾値は、少なくとも10個又は少なくとも100個又は少なくとも1000個又は少なくとも10,000個の、がんDNAを含まない(又は少なくともがんDNAを有することが知られていない)試料をアッセイに通し、対照試料中の特定されたシグナルを超える閾値又は対照試料を使用して決定される偽陽性率が1%以下、0.1%以下、又は0.01%以下であると推定されるような閾値を選択することによって決定され得る。明らかであろうように、方法は、結果が閾値以上である場合に患者ががん細胞を有すると特定すること、及び、例えば、患者に療法を施すことを更に含み得る。これらの実施形態では、患者は、以前に第1の療法を受けている場合がある。これらの場合、方法は、第1の療法とは異なる第2の療法を患者に施すことを含む。
【0099】
任意の実施形態では、方法は、ステップ(b)の推定値に基づいて試験試料中のがんDNAの量又はがんDNAのありそうな量の範囲を決定することを更に含み得る。このステップは、例えば、(i)平均若しくは中央バリアント対立遺伝子画分を計算すること、(ii)最尤分析、(iii)ベイズ事後分析、(iv)各バリアント及び各アリコートについて推定された変異体分子の数をカウントすることによって、又は(v)各アリコートにおけるバリアント陽性標的領域の数をカウントし、これを、アリコートを掛けた標的領域の総数に対して比較し、陽性結果の画分にポアソン補正を適用することによってアリコート当たりの標的領域当たりの標的配列を含むバリアントの平均数を定量化することによって行われ得る。このタイプの分析は、デジタルPCRにおいて出発分子の数を計算するために行われており、そこから適応させることができる。
【0100】
任意の実施形態では、方法は、少なくとも第1の時点及び第2の時点の間に患者から得られる試料に対して実施され得、第1の時点は、治療前であり、第2の時点は、治療後であり、方法は、第1の時点と第2の時点との間でがんDNAの量又はがんDNAのありそうな量の範囲に変化があるかを決定することを含む。この変化は、点推定、信頼区間、又は両方を使用して決定され得、有意な減少は、療法が有効であることを示し、有意な変化がないこと又は増加は、療法が有効ではないことを示す。これらの場合、少なくとも20%、少なくとも30%、少なくとも50%、少なくとも70%、又は少なくとも90%の変化が有意とみなされ得る。いくつかの実施形態では、変化が50%など閾値よりも大きく、第1及び第2の時点についてがんDNAを定量化するときの信頼区間が重複しない場合、変化は有意とみなされる。これらの実施形態では、有意な減少は、療法が有効であることを示し、有意な変化がないこと又は増加は、療法が有効ではないことを示す。
【0101】
任意の実施形態では、推定がんDNA画分、各アリコートに付加されたDNA分子の数、及び任意に、各バリアントが個々のがんコールにおいて表示される回数(コピー数分析を通して決定され得る)に基づいて統計的にありそうもない数のアリコートにおいて特定される配列バリエーションは、ステップ(c)の前にステップ(b)の結果から除外される。任意の実施形態では、ステップ(a)は、少なくとも3つのアリコート、例えば、3、4、5、6、7、8、9、10、11、又は12個以上のアリコートを配列決定することを含み得る。
【0102】
いくつかの場合では、バリアントががん細胞において増幅される場合、それは全てのアリコートにあると予想され得る。そのため、方法のこの部分は、がん細胞における各バリアントのコピー数を入力し、これを使用して、各バリアントの閾値を上回るべきであるアリコートのありそうな数を推定することによって、更に改善することができる。
【0103】
いくつかの実施形態では、ステップ(a)はまた、同じ患者に由来する吸引物、生検、又は手術試料からのがんDNA、バフィーコートDNA、頬スワブDNA、全血DNA、隣接する正常なDNA、すなわち、正常又は参照DNAのように見える腫瘍に隣接する組織のうちの少なくとも1つを含み得る陽性及び又は陰性対照を配列決定することを含み得る。これらの試料の配列決定は、試験試料と同時に行われ得るか、又は試験試料の配列決定の前若しくは後に行われ得る。
【0104】
任意の実施形態では、がんDNAにおいて検出されないバリアントは、除外される。加えて又は個別に、バフィーコート、頬スワブ、隣接する正常な血液又は全血中で検出されるバリアントが除外され得る。
【0105】
任意の実施形態では、2つ以上の標的領域は、少なくとも2、少なくとも4、少なくとも10、少なくとも20、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、又は少なくとも5,000個の標的領域である。多くの実施形態では、2~200個の、例えば、10~100個の、標的領域が調査され得る。ステップ(a)の配列バリエーションは、独立して、一塩基バリアント、インデル、二塩基置換(DBS)、転位、再配列、可変数タンデムリピート、短タンデムリピート、又は患者ゲノムに組み込まれたウイルスゲノム(HPVなど)であり得る。
【0106】
いくつかの実施形態では、バリアントは、5-メチルシトシン(5mC)又は5-ヒドロキシメチルシトシンなどの配列バリアントではなく、エピジェネティックなバリアントであり得る。特定の実施形態では、配列バリアント及びエピジェネティックなバリアントは、2つ以上が10bp未満離れて、50bp未満離れて、又は100bp未満離れて存在するときに選択される。
【0107】
上記のように、方法において分析される配列バリエーションは、予め特定された配列バリエーションである。例えば、配列バリエーションは、(i)がん細胞を含む組織生検から単離されたDNA若しくはRNA、(ii)がん細胞を含む手術で得られたがん組織から単離されたDNA若しくはRNAの試料を配列決定すること、又は(iii)無細胞DNA若しくはRNA、又は(iv)循環がん細胞から単離されたDNA若しくはRNAを配列決定することによって特定され得、試料は、例えば、任意の治療前の、同じ患者からのものである。血液がんについて、配列バリエーションは、例えば、骨髄、循環血液細胞、又はリンパ節からのDNA又はRNAの試料を配列決定することによって特定され得る。いくつかの実施形態では、DNA及びRNAの両方が配列決定され、各々組み合わされたバリアントが特定される。これらの配列バリエーションは、全ゲノムを配列決定することによって、あるいは全エクソーム、がんにおいて頻繁に変異される遺伝子(例えば、COSMIC-Cancer Gene Censusにあるもの)、ミトコンドリアゲノム、共通の構造的再配列の領域(例えば、共通の融合物又はMYCなどの共通の増幅のエッジ)、共通の増幅の領域、共通の再配列の領域(例えば、クロモスリプシス)、共通の局在化した超変異の領域(例えば、カタエギス)、又は標的患者集団の80%若しくは90%若しくは95%超が、必要な感度に到達するために十分な特定された変異を有するであろう目的のがんタイプに十分な数の変異を典型的には含むことが特定されたゲノムの領域のうちの1つ以上を配列決定することによって特定され得る(必要な感度は、この感度を満たすために必要なバリアントの数と同様に、予め決定されており、これは、標的とするゲノムのMbの数を決定するために、メガ塩基(Mb)当たりの変異の割合及び目的のがんタイプにおける患者間のばらつきと比較される)。
【0108】
いくつかの実施形態では、ウイルス配列は、ヒトゲノムに組み込まれたもの、及びそれらが組み込まれた場所を特定するために標的化される。いくつかの実施形態では、全ゲノム又はゲノムの特定の領域のいずれかは、エピジェネティックな変化について、例えば、全ゲノムバイサルファイト配列決定、TETアシストピリジンボラン配列決定、酵素的メチル配列決定、バイサルファイト配列決定の縮小表示、メチル化DNA免疫沈降配列決定、又は標的バイサルファイト配列決定によって評価される。エピジェネティックな及び遺伝的変化の両方はまた、アレイによって特定することができる。いくつかの実施形態では、メチル化変化及び/又は配列バリアントのいずれかを利用するアッセイは、ctDNAにおけるこれらの変化の特定を通したがんの早期検出のためのアッセイとして実施される。そのような実施形態では、患者がctDNA及びしたがってがんを有する可能性があるとして特定されると、患者のctDNA試料中に存在するエピジェネティック及び/又は配列バリアントが標的化のために特定及び選択される。
【0109】
ホットスポットはまた、配列決定することができる。代替的に、配列バリエーションは、RNA-seqによって特定され得、任意に、特定のタイプのRNAを標的とするためにポリA選択又はリボソームRNA枯渇などのRNA選択/枯渇が使用される。
【0110】
いくつかの実施形態では、複数の候補配列バリエーションがまず特定され、次いで特定の配列バリエーションが選択され得る。いくつかの実施形態では、バリエーションは、ランク付けされ得、次いで「最良」バリエーションが選択され得、バリアントがフィルター処理され得、追跡に最適ではないいずれも除去し、又はバリアントは、まずフィルター処理され、次いでランク付けされ得る。いくつかの実施形態では、配列バリエーションは、以下のうちの1つ以上に基づいてフィルター処理、スコア付け、又はランク付けされる:
i)腫瘍全体に存在するバリアントが好ましい、クローン性、
ii)バリアントのリードが、領域又は予めアノテーションが付けられたブラックリスター領域内の存在を増幅するように設計された予測PCRアンプリコンの試行されたアラインメントに基づいてマッピングすることが難しく、重複する反復及びホモポリマー領域アノテーションが回避されるべきである、マッピング可能性、
iii)高いエラー率を有するバリアントが、不利にされるか、又はフィルター処理されるべきである、推定バックグラウンドエラー率、
iv)低い割合を有する塩基が優先される、高シグナルバックグラウンド事象の推定割合、
v)別の選択されたバリアントからの距離。いくつかの実施形態では、バリアントは、ゲノム全体に等間隔で配置されるべきであり、密集させるべきではなく、例えば、任意の染色体、又は任意の染色体アーム、又は任意の1Mb領域上には全てのバリアントの10%以下が存在する。これは、追跡のための多くのバリアントが存在しなくなる、ゲノムの領域の喪失(例えば、進化中の染色体アームの喪失による)を防止するためである。別の実施形態では、2つのバリアントが、単一配列決定リードで標的化され、同じ染色体上に存在するほど十分に近い場合、そのようなバリアントが好ましい。
vi)配列決定する予測能力、
vii)単一がん細胞において複数のコピーに存在するバリアントが好ましい、コピー数増加又は増幅の領域内の存在、
viii)変異体対立遺伝子を濃縮するために使用され得る任意の生殖系列バリアントの近接性、
ix)体性である尤度、
x)体性であるが、未確定の潜在能をもつクローン造血であるなど、標的がんに由来しない尤度、
xi)そのような領域を避けることが好ましい、試験されているがんタイプにおいて頻繁に喪失される領域上の存在、
xii)バリアントが共通のSNP/多型である尤度
xiii)バリアントが特定のプロトコル/配列決定方法/捕捉キットから発生するアーチファクトである尤度
これは、現在及び/又は以前の反応/配列決定バッチにおけるバリアントの普及を通したもの、並びに既知のFFPE/他のエラーのものと一致するバリアントプロファイルを含む。
【0111】
いくつかの実施形態では、これらの因子の全て又は組み合わせがスコア付けされ、バリアントがスコアによってランク付けされ、次いで選択される。いくつかの実施形態では、ゲノムの領域は、特定のバリアントではなくランク付けされる。そのような実施形態では、ゲノムは、重複するウィンドウ又は重複しないウィンドウに分割され得る。ウィンドウは、例えば、10bp又は50bp又は100bpの長さであり得、これらのウィンドウは、5bp、25bp、50bp重複するか、又は全く重複しない場合がある。当業者には明らかであろうように、ウィンドウは、試験試料からのDNAの典型的な長さよりも小さく、意図された配列決定プラットフォームの配列決定リード長さよりも短いべきである。したがって、高分子量DNA及びロングリードシーケンサーでは、ウィンドウは、例として100又は1000又は10,000bpであり得る。Illuminaシーケンサー及びcfDNAでは、ウィンドウは常に、160bp(cfDNAの典型的な長さ)未満であるべきである。好ましい実施形態では、ウィンドウは、20~100bpであり、全ウィンドウの長さの半分である重複を伴う。各バリアントのスコア付け後、各領域のスコアは、領域内の全てのバリアントのスコアを組み合わせ、任意にこれを、マッピング可能性、配列決定する予測能力、及びコピー数増加又は増幅の領域内の存在を含み得る、領域特異的特徴の1つ又は複数のスコアと組み合わせることによって生成される。そのような実施形態では、領域をランク付けし、最良の領域を選択することができ、アッセイは、これらの領域を標的とするように設計される。そのような方法の利点は、情報が試験DNAの単一分子からの複数のバリアント(バリアントが同じ染色体上でシスであるとき)から取得され得るゲノムの領域に重みを与えること、及びバリアントが同じゲノム領域にあるが、トランスである、すなわち、他の染色体上にあるとき、単一領域を標的とすることから単純により多くの情報を取得することである。
【0112】
いくつかの実施形態では、PCRプライマー対(フォワード及びリバース)の異なる組み合わせは、特定された複数の候補配列バリエーション又は領域を標的とするように設計され、これらは、以下を含み得る特徴に基づいてバリエーション又は領域の各々について単一の最良プライマー対を特定するために、選択、スコア付け、フィルター処理、又はランク付けされる:
i)プライマー配列内の反復領域の存在(例えば、>= 6ヌクレオチドのホモポリマー領域を回避する)、
ii)プライマー配列内の既知の一塩基多型の存在(これが回避されるか、又はSNPが存在することを確認するために腫瘍配列決定が使用されるかのいずれか)、
iii)プライマー間及び/又はプライマーとアンプリコン領域との間のインシリコPCR及び/又はローカルアラインメント及び/又は3’ベースのアラインメントに基づいて1つのフォワード及び1つのリバースプライマーを使用して生成されるため、配列決定可能である可能性が高い意図しないPCR産物の予測された形成(このようなプライマーの組み合わせには高いペナルティがある)、
iv)iii)と同様であるが、配列決定不可能である可能性が高い意図しないPCR産物の予測された形成(2つのフォワードプライマー又は2つのリバースプライマーのいずれかで作製され、そのような産物は、両方の必要なシーケンサーアダプターを含有しないので、配列決定を可能にしないであろうため)(iii)と比較してこのようなプライマーの組み合わせには低いペナルティがある)、
v)ヌクレオチドでの合計アンプリコンサイズ、
vi)予測されたPCR産物が予想された標的を超えてゲノムの領域にアラインする回数(ランク付けスコアは複数のマッピングに基づき得る)、
vii)プライマー配列が意図した標的以外のゲノムの領域にアラインする回数、
viii)近接している(すなわち、予め定義された閾値に基づいて、50、100、又は150ヌクレオチド未満)意図したもの以外のフォワード及びリバースプライマーによって構成されたプライマー対のアラインメントがある回数、
ix)標的アンプリコン内に存在する全てのバリアントの組み合わされたスコア。
【0113】
いくつかの実施形態では、プライマーは、スコアが閾値を超える場合、これらの特徴のいくつか又は全てに基づいてフィルター処理される。いくつかの実施形態では、特徴のいくつか又は全ての線形又は多項式の組み合わせに基づく複合スコア付けは、最適多重を選択するために使用される。いくつかの実施形態では、試料又は細胞株を含むがんDNAから多数のバリアントが選択され、これらのバリアントに対して複数の多重PCRパネルが設計される。がんDNAの正常DNAへの希釈系列が生成され、次いで複数の多重PCRアッセイがDNAからの配列決定ライブラリーを生成するために使用される。プロセスは、少なくとも10個又は少なくとも100個の試料で最適に繰り返される。プライマー特徴のいくつか又は全ては、配列決定シグナルとともに、試験試料中のがんDNAを検出するためのプライマーの最適な組み合わせを決定するために機械学習システム又はニューラルネットワークに入力される。
【0114】
いくつかの実施形態では、バリアントを標的とする試薬(例えば、捕捉ベイト又は多重PCRプライマー)は、全てのバリアントについて設計され得、次いでバリアント又は領域を選択するのではなく、プライマー又はベイトの最良の組み合わせが選択される。プライマー又はベイトは、各プライマー、プライマー又はベイトの対、並びに他のプライマー又はベイトの多重内の標的化バリアント又は領域を増幅及び/又は濃縮及び/又は配列決定する予測された能力によって標的化される全てのバリアント又は領域のスコアの組み合わせに基づいてランク付け及び選択され得る。明らかであろうように、バリアント又は領域ではなく、この方法でプライマー又はベイトを選択及びランク付けすることが有利であり得る。これは、アッセイの出力が複数のバリアントの集合的な結果の統合された分析であり、したがって、いくつかの実施形態では、スコアは高いが他との多重化することが困難であり得るいくつかのバリアントを犠牲にして、より多数のバリアントを評価することが好ましい場合があるためである。
【0115】
一実施形態では、最良の多重アッセイは、上位のバリアントが選択された後に設計される。
【0116】
任意の実施形態では、患者は、がんを有するか、若しくはがんを有したか、又はまだがんではないが形質転換する潜在性を有するクローン増殖を有する。いくつかの実施形態では、患者は、がんの治療を受けたか、又は受けている。
【0117】
任意の実施形態では、DNAは、無細胞DNAであり、例えば、無細胞DNAは、血漿、血清、脳脊髄液、尿、唾液、又は便から単離される。他の実施形態では、DNAは、細胞、例えば、骨髄細胞、リンパ節由来の細胞、血液がんの場合には、循環白血球細胞、リンパ節由来の細胞、腫瘍マージン由来の細胞、又は現在は他の手段によって固形腫瘍由来のがん細胞の存在について現在スクリーニングされているCSF及び全血などの他の試料タイプから単離され得る。
【0118】
DNAの試験試料中のがんDNAの画分は、0.01%以下、0.005%以下、0.002%以下、又は0.001%以下であり得、いくつかの実施形態では、試験試料は、25,000未満のゲノム当量のDNA、例えば、20,000未満、10,000未満、又は5,000未満のゲノム当量のDNAを含む。
【0119】
いくつかの実施形態では、アリコートの数及びアリコート当たりの分子の最大数は、単一アリコート中の入力された分子の数が十分に低く、単一バリアント分子が存在する場合、バックグラウンドとは顕著に異なるシグナルを生成するであろうように、入力された分子の総数及び推定バックグラウンドエラー率に基づいて調整される。
【0120】
任意の実施形態では、各配列バリエーションの各アリコートについて、ステップ(a)のリード深度は、少なくとも10,000、少なくとも25,000、少なくとも50,000、又は少なくとも100,000、又は少なくとも500,000であり得る。任意の実施形態では、方法は、ステップ(a)の前に試験試料中のDNAの量を測定することを含み得る。
【0121】
任意の実施形態では、標的領域の配列は、ステップ(a)の前に、PCRによって、又は核酸プローブへのハイブリダイゼーションによって、又は標的DNA分子の一方の側に普遍的な配列があり、少なくとも1つの、及び任意に更なるネステッドプライマーが、分子の他方の側を標的化するために使用される、片側PCRアプローチを使用して、試験試料から濃縮され得る。Linked Target Capture、分子反転プローブ、及びATOM Seqなどの当業者に知られている他の方法も使用され得る。
【0122】
上記のように、本方法は、閾値ベースのアプローチを使用して行われ得る。これらの実施形態では、任意のアリコートにおける任意の標的領域は、i)ステップbにおいて配列バリエーションを有する分子の数の推定値が1以上である場合、ii)ステップbにおいて計算された確率が特異性閾値(例えば、95%、99%、99.9%)を超えている場合、iii)頻度が閾値を超えている場合、又はiv)(i)がんDNAが存在する場合、及び(ii)がんDNAが存在しない場合、試料中で(b)における推定値を観察する尤度間の各アリコートにおける各バリアントについての尤度比を計算することによって、少なくとも1つの変異体分子を含むと決定され得る。標的領域が2つのバリアントを含むいくつかの実施形態では、領域は、両方のバリアントのシグナルが同じ配列内に存在する場合、少なくとも1つの変異体分子を含有すると決定され得る。
【0123】
いくつかの実施形態では、がんDNAは、方法のステップ(c)において:i)少なくとも1つの変異体分子を含むと決定された任意のアリコートにおいて閾値数以上の標的領域が存在する場合、及び/又はii)少なくとも1つの変異体分子を有する少なくとも1つの標的領域を含むと決定された少なくとも2つ若しくは少なくとも3つのアリコートが存在する場合に決定され得る。これらの実施形態では、標的領域の閾値数は、i)少なくとも1つの変異体分子を含むと決定される任意のアリコートにおける2つ以上(例えば、3、4、5、又は10以上)の標的領域であり得るか、又はii)高シグナルバックグラウンド事象の数が5%、0.5%、0.1%、若しくは0.01%、若しくは0.001%未満の確率で発生すると予想する場合、閾値を決定するために全ての標的領域及びアリコートについての高シグナルバックグラウンド事象の推定割合を組み合わせることによって決定され得るか(例えば、4つのアリコート及び48個の標的領域が存在する場合、並びに標的領域及びこれらの領域内のバリアントの特定の組み合わせについて、0.01%未満の確率で全てのアリコートにわたって4つ以上の高シグナル事象を得るであろうと推定され、次いで4の閾値が設定されるであろう)、又はiii)標的領域若しくはバリアントの固定数ではなくスコアであり得、閾値スコアは、2若しくは3のいずれかであり、陽性標的領域若しくはバリアントは、高シグナルバックグラウンド事象のその割合に応じて異なるスコアに寄与する。一実施形態では、高シグナルバックグラウンド事象を決して有さないバリアント又はバリアントのクラスは、1のスコアが与えられ、残りのバリアント又はバリアントのクラスは、高シグナルバックグラウンド事象のそれらの割合に基づいて1つ以上の群に分けられ、より低いスコアが与えられる。例えば、2つの群があり得る。高シグナル事象の最も低い割合を有するバリアント又はバリアントクラスの50%は、0.75のスコアを受け取り、陽性のときは常に最も高い割合を有する50%は、0.5のスコアを受け取る。
【0124】
任意の実施形態では、ステップ(b)の閾値頻度は、配列バリエーションについてのバックグラウンドエラー率の二項、過分散二項、ベータ、正規、指数、又はガンマ確率分布モデルを使用して決定され得、頻度は、変異体分子が存在しない場合、バリアント特異性当たりの所望の予め定義されたものに応じて、5%、2%、1%、0.1%、0.01%、又は0.001%未満の確率でシグナルが観察されるように選択される。
【0125】
本発明の更なる詳細、代替ステップ、及び実施形態を以下に記載する。
【0126】
患者のがんに関連する配列バリエーション
本方法は、試料中の患者のがんに関連する複数の配列バリエーションを分析することを含み、そのような配列バリエーションは、患者のがんの細胞中に存在すると考えられる。任意の個々の配列バリエーションは、ドライバー変異又はパッセンジャー変異であり得、配列バリエーションは、クローン性又は非クローン性であり得る。本方法で使用される配列バリエーションは、患者における正常細胞ではなくがん細胞中にのみあると考えられているという意味で、がんに関連している。患者のがんを定義する変異のセットは、患者毎に変動するという意味で患者特異的であるが、いくつかの変異(例えば、KRASなど)は、数人の患者及び/又はいくつかの異なるタイプのがんにおいて発生し得る。ゲノムにおけるパッセンジャー変異の位置は、事前に予測することが困難であり(いくつかのホットスポットがあり得るが)、配列バリエーションの位置は、患者毎に異なるため、本方法で分析される配列バリエーションは、患者間ベースで特定され得る。いくつかの実施形態では、配列バリエーションは、がん画分がより高い試料、例えば、骨髄吸引物、組織生検試料、又は単離された循環がん細胞から特定することができる。例えば、配列バリエーションは、骨髄吸引物、腫瘍組織生検、又は外科的切除から、循環腫瘍細胞(CTC)から、尿若しくは便試料中のものなどの、腫瘍組織の一部ではないが循環していない他の細胞、又はDNAが抽出される試料が、ctDNAレベルが高くなる可能性が高いとき、がんのための治療前に患者から採取された、無細胞DNAから単離されたDNAを配列決定することによって特定されている場合がある。いくつかの実施形態では、クローン性を決定するために、同じ試料からの複数の試料タイプ又は複数の領域が配列決定され得る。この配列決定ステップは、上記のように、全ゲノム配列決定、エクソーム配列決定、又は標的化配列決定(例えば、がん遺伝子のパネルを配列決定することによって、又は変異のホットスポットである配列のパネルを配列決定することによって)などによって行われ得る。明らかであろうように、患者は、がん患者であり得、患者は、がんの治療を受けたか、受けている場合があるか、又は治療を受けようとしている場合がある。換言すれば、配列バリエーションは、それらが比較的高レベルで存在する試料、例えば、任意のがん治療が開始される前に収集された試料において特定され得る。
【0127】
方法がどのように行われるかに応じて、配列バリエーションは、試験試料が分析される前に、又は試験試料が分析されるのと同時に、特定され得る。したがって、本方法のいくつかの実施形態は、「予め特定された」配列バリエーションを使用し、「予め特定された」配列バリエーションは、例えば、治療前又は治療中に、患者のがんに関連するものとして以前に特定された配列バリエーションである。他の実施形態では、配列バリエーションは、予め特定されておらず、代わりに、配列バリエーションは、試験試料からの配列リードを対照試料(例えば、以下に記載されるように、陽性及び陰性対照試料)から得られた配列リードと比較することによって特定され得る。
【0128】
方法で分析される配列バリエーションは、独立して、単一ヌクレオチドバリエーション、インデル、転位、又は再配列であり得る。一般に、配列バリエーションは、がん細胞を含む組織試料(例えば、生検、外科的切除、又は細針/太針吸引)から単離されたDNAを配列決定すること、又は患者からの無細胞DNAを配列決定すること(例えば、全ゲノム配列決定、エクソーム配列決定、又は標的化配列決定アプローチ)によって特定することができ、複数の領域が配列決定される。例えば、いくつかの実施形態では、配列バリアントのリストは、少なくとも50kbのがんDNAを配列決定することを通して、ゲノムの大きな領域の標的化配列決定又は全ゲノム配列決定を通して得られ得、がんDNAは、腫瘍組織(例えば、生検)又はその中に高レベルのがんDNAを有すると予想される試料(治療前の血漿DNA試料など)のいずれかから得られる。いくつかの実施形態では、がんDNAのみが配列決定される。代替の実施形態では、全血、バフィーコート、腫瘍に隣接する明らかに正常な組織、又は頬スワブなどの、がんDNA及び正常であると予想されるDNAの両方が配列決定され得る。バリアントは、がん及び正常DNAを評価することによって、又はがんDNAのみを評価し、当該技術分野で知られている他の特徴を任意に使用することに加えてバリアント対立遺伝子画分を使用することによってのいずれかで、生殖系列の体性として分類され得る。
【0129】
いくつかの場合では、初期がんDNA試料の分析は、候補配列バリエーションのリストをもたらし得、候補配列バリエーションのいくつかは、予め特定された配列バリエーションのリストを生成するために除外される。いくつかの実施形態では、この方法は、その試料が(例えば、生検を配列決定することによって)評価されている患者から体性であると考えられる候補バリアントのリストを得、次いでバリアントに優先順位を付けることを含み得る。これらの実施形態では、優先順位付けは、例えば、配列決定アーチファクトとは対照的に実際のバリアントである確率、体性遺伝子異常である確率、クローン変異である確率、エラー率の推定値、他のバリアントと多重化する適合性の推定値、並びに/又はバリアント及び周辺領域のマッピング可能性、増加又は増幅の領域における、エピソーム又は二重微小染色体又は連環染色体断裂融合の領域における存在などのような各がんにおけるバリアントのコピーの推定数に基づき得る。候補バリエーションに優先順位を付けることに加えて、候補配列バリエーションのうちの1つ以上が除外され得、候補配列バリエーションのサブセットのみがその後の分析のために選択され得る。例えば、候補配列バリエーションが特定された後、それらの配列バリエーションを含む標的領域は、正常細胞(バフィーコート、白血球、頬スワブ、又は隣接組織)からのDNAにおいて配列決定され得る。この配列決定は、腫瘍DNAを配列決定するために使用されるのと同じアプローチを使用して行われ得るか、又は配列決定は、腫瘍DNAにおいて特定されたバリアントを検出するように設計されたアッセイを使用して行われ得る。これらの正常細胞において特定された任意のバリアントは、生殖系列多型又はクローン性造血である可能性が高いため、候補から除外され得、配列バリエーションの残部が優先され得る。例えば、いくつかの実施形態では、方法は、患者由来の白血球のDNA中の標的領域の少なくともいくつかを配列決定することを更に含み得る。これらの実施形態では、方法は、候補遺伝的バリエーションを、白血球DNAを使用してコールされた遺伝的バリエーションと比較することを含み得る。バリエーションが両方の試料において特定される場合、それは予め特定された配列バリエーションであることから除外され得る。この実施形態は、その後の分析から除外することができるように、未確定の潜在能をもつクローン造血(CHIP)に潜在的に起因し得るバリエーション(一般に、Funari et al,Blood 2016 128:3176及びHeuser et al,Dtsch.Arztebl.Int.2016 113:317-322を参照されたい)及び生殖系列バリアントを特定する方法を提供する。代替の実施形態では、方法は、候補遺伝的バリエーションを、腫瘍に隣接した明らかに正常な組織を使用してコールされた遺伝的バリエーションと比較することを含み得る。バリエーションが両方の試料において特定される場合、それは予め特定された配列バリエーションであることから除外され得る。この実施形態は、その後の分析から除外することができるように、がんフィールド効果に潜在的に起因し得るバリエーション及び生殖系列バリアントを特定する方法を提供する。
【0130】
したがって、任意の実施形態では、方法は、1つ以上の陽性及び/又は陰性対照試料を配列決定すること(試験試料の前又はそれと同時に実行され得る)を含み得る。明らかであろうように、このアッセイは、初期がんDNA試料、対照試料、及び試験試料が同じ個体から得られるという点で「個別化」されている。陽性及び陰性対照試料は、これらに限定されないが、原発腫瘍若しくは転移のいずれかからの生検若しくは手術試料からの腫瘍DNA、バフィーコートDNA、頬スワブDNA、全血DNA、正常組織(例えば、隣接組織)から単離されたDNA)、又は参照DNAを含む。これらの実施形態では、腫瘍DNA中で検出されない配列バリエーションが除外され得、バフィーコート、頬スワブ、隣接する正常な血液又は全血中で検出される配列バリエーションが除外される。任意の実施形態では、配列バリエーションは、クローン性、マッピング可能性、推定エラー率、別の選択されたバリアントからの距離、多重PCR又はハイブリッド捕捉パネルを設計するとき他のバリアントとの適合性、配列決定する予測能力、コピー数増加又は増幅の領域内での存在、及び変異体対立遺伝子を濃縮するために使用され得るシス又はトランスのいずれかでの任意の生殖系列バリアントの近接性を含み得る1つ以上の因子に基づいて優先され得る。生殖系列バリアントに近接した配列バリエーションの濃縮を可能にするであろう方法は、プライマーのうちの少なくとも1つが生殖系列変化を有する鎖に特異的であり、バリアントが同じ鎖(シス)上にある、対立遺伝子特異的PCRを行うこと、又は野生型鎖を除去するためにバリアントが反対の鎖(又はトランス)上にあるとき、例えば、制限酵素、cas9、若しくは同様の方法で生殖系列変化を標的とすることを含む。他の実施形態では、配列バリエーションは、対立遺伝子特異的PCR、COLD-PCR、又は当業者に知られている他の方法などのバリアント濃縮方法についてのその適合性に基づいて優先され得る。
【0131】
明らかであり得るように、方法において分析される配列バリエーションは、方法において分析される配列バリエーションが各患者に「カスタマイズ」されるように、患者間で異なり得る。したがって、多くの実施形態では、方法は、第1の患者からのDNA試料から配列バリエーションの第1のセット、第2の患者からのDNA試料から配列バリエーションの第2のセット、第3の患者からのDNA試料から配列バリエーションの第3のセットなどを特定することを含み得る。
【0132】
アリコートベースの配列決定
アリコートベースの配列決定方法は、様々な異なる方法で実施され得る。いくつかの実施形態では、配列バリエーションを有する標的領域は、予め特定された配列バリエーションを有する標的断片が、試料からPCRによって直接増幅される、「アンプリコンベース」アプローチを使用して配列決定され得る。いくつかの実施形態では、試験試料はまず、例えば、アダプターのライゲーション及びライゲートされたアダプターを標的とするPCRを実施することによって前増幅され得る。これらの実施形態では、配列決定アダプターは、増幅中に付加され得るか、又は増幅後にライゲートされ得る。他の実施形態では、予め特定された配列バリエーションを有する標的領域は、アダプターが試料にライゲートされ、標的領域を含む断片がアダプターにハイブリダイズするプライマーを使用した増幅前の核酸プローブへのハイブリダイゼーションによって濃縮される、「標的濃縮ベース」アプローチを使用して配列決定され得る。そのような実施形態では、アリコートライゲーション反応が実施され得るか、又は複数のバーコードを有するアダプターが、DNA上にライゲートされ、分子群の別個のバーコード群若しくは「アリコート」への効果的な分離を可能にし得るかのいずれかである。したがって、標的領域の配列は、PCRによって又は核酸プローブへのハイブリダイゼーションによって試料から濃縮することができる。他の濃縮方法が使用され得る。他の実施形態では、物理的複製又は分子バーコードの使用のいずれかを伴う任意の他の方法、例えば、Molecule Inversion Probes(MIP)又はAnchored Multiplex PCR(AMP)が利用され得る。アンプリコンベースの方法の原理のいくつかを以下に記載する。同様の概念は、標的化濃縮アプローチに適用することができる。いくつかの実施形態では、バリアント配列は、COLD-PCR、バリアントを標的とする対立遺伝子特異的PCR、隣接する生殖系列変化を標的とする対立遺伝子特異的PCR、隣接する生殖系列変化の利用による野生型配列の消化、又は当業者に知られている他の方法を含む方法を使用して標的化ステップ中に濃縮され得る。
【0133】
予め特定された配列バリエーションを使用する実施形態では、予め特定された配列バリエーションが特定された後に、複数のプライマー対が得られ、各プライマー対は、予め特定された配列バリエーションのうちの1つ以上を有する標的領域を増幅する。いくつかの実施形態では、各アンプリコンの長さは、独立して、50bp~500bpの範囲、例えば、70~150bpであり得るが、いくつかの実施では、より長い又はより短いアンプリコンが使用され得る。いくつかの実施形態では、バリアントのいくつかは、再配列である。これらの実施形態では、プライマーは、再配列の3’側の1つのプライマー及び5’側の1つのプライマーを用いて設計され、再配列された配列は、プライマー対を設計するために使用され、プライマーは、再配列された配列を増幅するように特異的に設計される。プライマー対が得られた後、方法は、各々、同じ試料の一部分(すなわち、同じ試料の異なるアリコート)を含有する、少なくとも2つの多重PCR反応(例えば、2、3、4、5、6、7、8、9、又は10個の多重PCR反応などの、最大10個の多重PCR反応)を設定することを含み得る。このステップでは、全ての反応が同じプライマー及び同じ試料の異なる部分を有するという点で、多重PCR反応は、互いに同一であり得る。この方法では、アリコートの数及びアリコート当たりの分子の最大数は、単一アリコート中の入力された分子の数が十分に低く、単一バリアント分子が存在する場合、バックグラウンドとは顕著に異なるシグナルを生成するであろうように、入力された分子の総数及び推定バックグラウンドエラー率に基づいて調整され得る。明らかであろうように、各多重PCRは、適合性プライマーを含むべきであり、適合性プライマーは、反応がプライマーに適切な鋳型を用いた適切な熱循環条件下に供されるとき、プライマーダイマー及び意図しない又は非特異的なPCR産物の生成を最小限に抑えながら、PCRプライマー対に対応するアンプリコンを生成する目的の領域を特異的に増幅するように設計される。典型的には、必ずしもそうではないが、各プライマー対は、多重PCR反応において目的の単一領域を増幅する。多重PCR及び適合性プライマーを設計するためのプログラムを実施するための条件は、周知である(例えば、Sint et al,Methods Ecol Evol.2012 3:898-90及びShen et al BMC Bioinformatics 2010 11:143を参照されたい)。適合性プライマー対は、多重PCR法のためのプライマー対を設計するように特異的に設計されたいくつかの異なるプログラムのいずれか1つを使用して設計され得る。例えば、プライマー対は、Yamada et al.(Nucleic Acids Res.2006 34:W665-9)、Lee et al.(Appl.Bioinformatics 2006 5:99-109)、Vallone et al.(Biotechniques.2004 37:226-31)、Rachlin et al.BMC Genomics.2005 6:102、又はGorelenkov et al.(Biotechniques.2001 31:1326-30)の方法を使用して設計され得る。いくつかの実施形態では、方法は、少なくとも5対の適合性プライマー、例えば、少なくとも10対、少なくとも50対、少なくとも100対、少なくとも1000対、又は少なくとも5000対の適合性プライマーを採用し得る。増幅されたアンプリコンは、任意の好適な長さのものであり得、長さが変動し得る。いくつかの実施形態では、配列バリエーションは、多重PCRにおけるプライマー設計の適合性の可能性に基づいて優先され得る。
【0134】
次に、反応を熱循環することによって生成されたアンプリコン、又はその増幅産物(例えば、アンプリコンが、プライマーにおいて5’尾部にハイブリダイズする普遍的プライマーによって再増幅される場合)が配列決定されて、配列リードが生成される。様々なアリコートPCR反応は、複製アンプリコンを生成するはずであり、「複製」アンプリコンは、アリコートにおける同じプライマーによって増幅されるアンプリコンである。複製アンプリコンは、一般に、同じ配列を有する(PCRエラー、試料中の遺伝的バリエーションに対応するバリエーション、PCRプライマーにおける任意のバリエーションなどを除く)。
【0135】
アンプリコンを配列決定する際に、各異なる多重PCR反応に由来するアンプリコンは、互いに別々に配列決定され得るか、又はアンプリコンは、アリコート識別子でバーコード化され、次いで配列決定の前にプールされ得る。いくつかの実施形態では、多重PCR反応におけるプライマーは、アリコート識別子を含有する5’尾部を有し得、そのため、PCR反応が完了した後、プライマーの5’尾部の配列がアンプリコン中に存在する。他の実施形態では、アリコート識別子を含有する5’尾部を有するプライマーを使用せずに、多重PCR反応を行うことができる。これらの実施形態では、PCR産物は、アリコート識別子を含有する5’尾部を有するPCRプライマーを使用する第2ラウンドの増幅において、アリコート識別子でバーコード化され得る。アダプター配列はまた、産物にライゲートすることができる。いずれにせよ、アンプリコンは、特定の配列決定プラットフォームとの適合性を提供する5’尾部を有するプライマーを使用して、配列決定の前に増幅され得る。特定の実施形態では、アリコート識別子に加えて、このステップにおいて使用されるプライマーのうちの1つ以上は、試料識別子を追加的に含有し得る。いくつかの実施形態では、プライマーの一方又は両方は、バーコードを含み得、それは独立して又は組み合わせてのいずれかで、試料及びアリコートの両方を特定するために使用され得る。プライマーが試料識別子を有する場合、異なる試料由来の産物は、配列決定の前にプールすることができる。いくつかの実施形態では、標的特異的プライマーは、5’から3’までの普遍的「タグ付け」配列、任意のアリコートバーコード配列、続いて目的の標的に設計された配列を含有する。初期産物を更に増幅するために使用されるプライマーは、特定の配列決定プラットフォームとの適合性を提供する5’尾部、試料バーコード、及び任意にアリコートバーコード又は試料及びアリコートの両方を特定するバーコード、並びに標的特異的プライマー上に存在するタグ付け配列の逆相補体の一部又は全てのいずれかに結合することができる配列を含有し得る。典型的には、フォワード及びリバースプライマーは、異なるタグ付け配列を有するであろう。明らかであろうように、増幅ステップのために使用されるプライマーは、プライマー伸長が使用される任意の次世代配列決定プラットフォーム、例えば、Illuminaの可逆的ターミネーター法、Rocheのパイロシーケンシング法(454)、ライゲーションによるLife Technologiesの配列決定(SOLiDプラットフォーム)、Life TechnologiesのIon Torrentプラットフォーム、又はPacific Biosciencesの蛍光塩基開裂法、及び任意の他のプラットフォーム、例えば、Oxford Nanoporeでの使用と適合し得る。そのような方法の例は、以下の参考文献:Margulies et al(Nature 2005 437:376-80)、Ronaghi et al(Analytical Biochemistry 1996 242:84-9)、Shendure(Science 2005 309:1728)、Imelfort et al(Brief Bioinform.2009 10:609-18)、Fox et al(Methods Mol Biol.2009;553:79-108)、Appleby et al(Methods Mol Biol.2009;513:19-39)、English(PLoS One.2012 7:e47768)、及びMorozova(Genomics.2008 92:255-64)に記載されており、これらは、ステップの各々における全ての出発産物、試薬、及び最終産物を含む、方法の一般的な説明及び方法の特定のステップについて参照により組み込まれる。
【0136】
代替の実施形態では、アリコートベースの配列決定は、変異ホットスポットのパネル、がん遺伝子のパネルを標的とすることができる。代替的に、配列決定ステップは、エクソーム若しくは全ゲノム配列決定によって、又は少なくとも1、少なくとも5、若しくは少なくとも10MBのゲノムを好適な深度に配列決定することによって行うことができる。これらの実施形態では、配列バリエーションは、「予め特定」される必要はない。むしろ、配列バリエーションは、試験試料が配列決定される同じアッセイにおいて、すなわち、同じアッセイ(例えば、同じ配列決定ラン)においても実行される対照とのデータの比較によって特定することができる。対照試料を使用して配列バリエーションが特定されると、それらの配列バリエーションは、試験試料において分析することができる。
【0137】
配列決定ステップは、任意の便利な次世代配列決定方法を使用して行われ得、反応当たり少なくとも100,000、少なくとも500,000、少なくとも1M、少なくとも10M、少なくとも100M、少なくとも1B、又は少なくとも10Bの配列リードをもたらし得る。いくつかの場合では、リードは、ペアエンドリードであり得る。
【0138】
配列を処理すること、バリアント分子を推定すること、及びがんDNAの存在を決定すること
次いで、配列リードを計算的に処理する。初期処理ステップは、バーコード(試料識別子又はアリコート識別子配列を含む)の特定、及び低品質又はアダプター配列を除去するためにリードをトリミングすることを含み得る。加えて、データセットが許容可能な品質であることを保証するために、品質評価メトリクスを実行することができる。
【0139】
配列リードが初期処理を受けた後、それらは、どのリードが標的領域に対応するかを特定するために分析され得る。これらの配列は、標的領域の配列と同一又はほぼ同一であるため、特定することができる。認識されるであろうように、標的領域と同一又はほぼ同一である配列リードを分析して、標的配列に潜在的なバリエーションが存在するかを決定することができる。配列は、この方法において参照配列、例えば、ゲノム配列とアラインされるか、又は予想される配列のデータベースにマッチされ得る。
【0140】
配列リードが処理された後、方法は、各アリコート及び各配列バリエーションについて、配列バリエーションを有する配列リードの数をカウントすること、及び配列リードの総数をカウントすることを含み得る。リードをカウントするための方法は、例えば、Forshew et al(Sci.Transl.Med.2012 4:136ra68)、Gale et al(PLoS One 2018 13:e0194630)、及びWeaver et al(Nat.Genet.2014 46:837-843)によって記載されるものから適合され得る。同様の結果は、分子インデックスを採用するアプローチを使用して得ることができる。これらの方法では、配列決定された分子の総数及びバリアント分子の数は、インデックスを使用して推定することができる。そのような分子識別子配列は、断片間を区別する断片の他の特徴(例えば、切断点を定義する、断片の末端配列)と併せて使用され得る。分子識別子配列は、(Casbon Nucl.Acids Res.2011,22 e81)に記載されている。
【0141】
図11に示されるように、バリエーションを有する配列リードの数をカウントし、配列リードの総数をカウントした後、配列バリエーションを有した、増幅前の元の試料中の分子の数の推定値は、各標的領域の各アリコートについて決定することができる。代替的に、各標的領域の各アリコートについて、配列バリエーションを有する少なくとも1つの分子が存在する確率を計算することができる。後者は、例えば、分子の全ての非ゼロ数(すなわち、全ての正の整数)の個々の確率を合計することによって、導出することができる。これらの実施形態では、推定値は、確率的推定値であり得、推定値が点推定値ではないが、確率分布であることを意味する。このステップは、アリコートにおけるバリアント分子の各々の可能な数に確率を割り当てることによって行われ得、それは確率密度関数を介して行われ得、その例は
図12に示される。これらの実施形態では、各アリコート及び標的領域について、配列バリエーションを有する分子の数、又は配列バリエーションを有する少なくとも1つの分子が存在する確率は、(i)配列バリエーションを有する配列リードの数、(ii)配列リードの総数、(iii)各アリコートに入力される分子の数、及び(iv)配列バリエーションの推定バックグラウンドエラー率を使用して計算され得る。これらの実施形態では、標的領域の配列は、配列リードの数(例えば、少なくとも10,000個のリードであるが、この数は、配列決定されるアリコートの数に応じて変動し得る)によって表され、それらのリードのいくつかは、配列バリエーションを含み得る。これらのリードは、入力値(i)及び(ii)を提供するためにカウントすることができる。入力値(iii)は、方法を開始する前にDNA試料中のDNAの量を測定することによって計算することができる。これは、例えば、DNAの総量、二本鎖DNAの総量、二本鎖及び一本鎖DNAの総量、特定のサイズ範囲内のDNAの総量、又はアンプリコンサイズなどの特定のパラメータを有するプライマーを使用して増幅することができるDNAの総量を測定することによって行うことができる。このステップは、デジタルPCR、qPCRによって、蛍光分析的に、電気泳動を通して、又は様々なキット又は他の戦略のいずれかを使用して行うことができる。各配列バリエーションの推定バックグラウンドエラー率、すなわち、入力値(iv)は、先行配列決定反応、例えば、配列バリエーションを有さないことが知られている試料、又はがんを有することが知られておらず、したがって多数の体性バリアントを有することが予想されない個体からの試料に対して行われる配列決定反応から決定することができる。具体的には、各バリエーションのバックグラウンドエラー率は、同じ実行において、過去の実行において、又は過去の実行を使用し、次いで選択される対照塩基(又はバリアントを含むことが知られていない塩基)の使用を調整してのいずれかで評価されている類似のバリアントに体性変異を含むと予想されないDNAにおける類似のバリアントの配列決定を通して推定することができ、バリアントは、塩基変化、塩基変化のタイプ(転位/転換)、及びトリヌクレオチドコンテキスト、ペンタヌクレオチドコンテキスト、プライマーを参照したアンプリコンにおける位置、挿入のサイズ、挿入された塩基のタイプ及び数、欠失のサイズ、欠失した塩基のタイプ及び数、又は再配列のクラス、例えば、タンデム重複を含み得る特徴に基づいて類似しているとみなされる。仮想的エラーモデルは、
図13Aに度数分布として、又は
図13Bに混合モデルとして示される。これらの例では、体性バリアントを含むことが知られていない複数の試料(例えば、数百の試料)が配列決定され、特定のタイプの配列バリエーションを有する配列リードの画分を各試料について計算することができる。バリアント配列リードは、主にPCR中に発生するエラー、塩基ミスコール、及びDNA損傷などのPCR 前の事象によって引き起こされる(例えば、Aと塩基対合し、配列リードにおいてGからTへのバリエーションとして現れる、グアニンの8-オキソグアニンへの酸化)。これらの画分は、度数分布としてプロットすることができ、これは、ひいては、配列リードにおいて観察された配列バリエーションが実際に遺伝的バリエーションであるかの確率を計算するために使用することができる。
【0142】
次いで、試料中のがんDNAの存在又は不在は、元の試料の各アリコートからの各標的領域におけるバリアント分子の推定値(又は確率)を使用して決定することができる。いくつかの場合では、データはまた、試料中の全体的ながんDNA画分を推定するために使用することができる。この推定値は、試験試料中のがんDNAの最もありそうな量又はがんDNAのありそうな量の範囲であり得、元の試料中のバリアントリードの画分又はバリアント分子の推定値に基づいて、例えば、平均若しくは中央バリアント対立遺伝子画分、最尤、又はベイズ事後によって推定され得る。
【0143】
一実施形態では、試料中のがんDNAの存在又は不在は、同じ結果がいずれのがんDNAも含まない試料によって生成され得る尤度でがんDNAが存在することを考慮して、結果を観察する尤度を比較することによって、尤度比を介して決定することができる。いずれのがんDNAも含有しない試料によって同じデータが生成され得る尤度がより高い場合、試料は、いずれのがんDNAも含有しない場合がある。第1の尤度(がんDNAが存在する尤度)は、(i)各標的領域の各アリコートについて上記で計算される、配列バリエーション又は確率を有する分子の推定数、及び任意に、(ii)試料中の推定がんDNA画分を使用して計算され得る。第2の尤度(帰無仮説の尤度)は、(i)上記で計算される、確率的推定値又は確率、及び(ii)「高シグナルバックグラウンド事象」が、リード当たりのバックグラウンドエラー率の単純なモデルによって説明されない事象である、高シグナルバックグラウンド事象の推定率を使用して計算され得る。試料中にがんDNAが存在する尤度及び帰無仮説の尤度が計算された後、それらは尤度比を得るために比較することができ、順に、尤度比は閾値と比較することができる。いくつかの実施形態では、各標的領域の各アリコートについて尤度比が決定される。個々の尤度比は、次いで、試料の全ての領域及びアリコートにわたる累積尤度比スコアに組み合わされる。閾値以上の尤度比は、DNA試料ががんDNAを含有することを示す。代替的に、尤度比は、直接又は対照試料で計算された参照分布との比較によってのいずれかで、試料ががんDNAを含有する確率として解釈することができる。
【0144】
具体的には、上記のように、
図13A及びBのモデルには少なくとも3つのタイプのエラーがある:PCR 中に発生するエラー、配列決定中の塩基ミスコール、及びDNA損傷などのPCR前の事象。PCR前のエラーは、稀であるという意味で「高シグナル」である(全ての試料に関連しているわけではない)が、発生すると、元の試料中に存在しているバリアント分子と一致する他のエラーよりもはるかに高いバリアントリードの画分をもたらし、すなわち、真陽性ctDNAバリアントの外観を模倣する。いくつかの場合では、PCRの最初の1、2、又は3サイクルで発生するエラーはまた、高シグナル事象をもたらし得る。そのようなエラーの割合は、様々な異なる方法を使用して決定することができる。いくつかの場合では、エラー分布又はエラー確率の分布が使用され得る。これらの実施形態では、エラーは、
図13A及びBに示されるように分布を歪める。そのようなエラー分布の分析は、高シグナル事象が別個の事象として特定されることを可能にする。例えば、いくつかの場合では、事象は、
図13Aに示されるように、閾値(例えば、平均値又は中央値からの1、2、又は3つの標準偏差である事象)を使用して特定することができる。そのような閾値は、バリエーション間で変化することができるが、一般に、それらは、
図13Aに示されるように定義された閾値を超える頻度を有するものとして特定することができる。これらの高シグナル事象は、別個にモデル化され、各配列バリエーションの高シグナルバックグラウンド事象の割合を決定するために使用され得る。
【0145】
別の実施形態では、試験試料ががんDNAを含有するかの決定は、(i)各標的領域の各アリコートにおけるバリアント分子の推定値又は確率、高シグナルバックグラウンド事象の推定割合、及び任意に試験試料中のがんDNA画分の先行推定値を組み込む混合モデル(
図13B)を使用することによって計算される。混合モデルの出力は、閾値と比較することができ、閾値以上である出力は、試験試料ががんDNAを含むことを示す。いずれかの方法のそのような閾値は、がんDNAを含有することが知られていない複数の試料を分析し、結果の分布を決定し、次いで偽陽性が0.01%未満の確率、0.1%未満の確率、0.5%未満の確率、1%未満の確率、又は5%未満の確率で予想されるように閾値を設定することによって決定され得る。
【0146】
いくつかの実施形態では、試料中にがんDNAが存在する尤度を計算する前に、又はがんDNAの混合モデルで試料を評価する前に、又はがんDNAが存在することを示すために十分な標的領域、バリアント、及び又はアリコートが閾値を超えているかを決定する前に、推定がんDNA画分に基づいて統計的にありそうもない数のアリコートにおいて特定される配列バリエーションの確率的推定値又は確率が除外される。例えば、比較的高い偶発的なアリコートを除いて、ほとんどのバリエーションのほとんどのアリコートについての推定値又は確率が比較的低く、バリアントDNAを含む可能性が低いことを示している場合、1つの配列バリエーションが全て又はほぼ全てのアリコートに比較的高い確率で存在することは統計的にありそうもない。更なる例として、4つのアリコートを有する実施形態では、ほとんどのバリアントについての証拠が、バリアントDNAを含む0又は1つのアリコートのいずれかを支持する場合、4つ全てのアリコートについての証拠がバリアントDNAの存在を支持する任意のバリアントは、外れ値である可能性が高い。これらの外れ値(「ノイズベース」、又は、例えば、CHIPに由来する非がん特異的変化によって引き起こされ得る)を特定し、計算から除外することができる。別の例では、各アリコートに付加された試験DNA分子の数及び全てのバリアント(又はサブセット)を使用して計算された腫瘍画分の推定値を使用して、少なくとも1つのがん分子を含む各アリコートにおける各個々のバリアントの可能性を計算することできる。次いで、閾値を超えるアリコートの数は、アリコートの総数と比較して、バリアントがありそうもない結果を与えているかを決定することができる。いくつかの実施形態では、各バリアントのコピー数は、この計算中に補正される。この概念は、
図14に示される。
【0147】
本方法では、(cfDNA濃度及び推定ctDNA画分を考慮して)高シグナルで予想されるであろうよりも多くのアリコートをもたらすバリアント含有領域を特定及び除外することができる。これは、既知のcfDNA濃度及び推定ctDNA画分を考慮して、パーティション当たり少なくとも1つのctDNA分子をサンプリングする確率を使用して計算され得る。これが統計的にありそうもないバリアント(例えば、p<0.05)は、除外され得る。例えば、4つのパーティションの各々がバリアントを含む0.2の確率を有した場合(推定ctDNA画分及び入力分子の数に基づいて)、高いスコアを有する2つのパーティションを示す尤度を計算することができる。
【0148】
明瞭性のために、この方法のいくつかの実施形態は、異なるアリコートにおけるバリエーションを特定すること(「又はコールすること」)を含まない。具体的には、方法のいくつかの実施形態は、潜在的な配列バリエーションの頻度が各アリコートにおいて閾値を上回るか又は下回るかを決定することを含まない。むしろ、これらの実施形態は、全体としてのデータの分析に依存する。
【0149】
方法は、その中にがんDNAを有する任意のタイプの試料で実施することができるが、方法は、がんDNAの画分が0.01%未満(すなわち、100ppm未満)である限られた試料の分析に最も使用されており、それはこのとき他のアッセイではがんDNAを含む試料ががんDNAを含まない試料と区別不可能になるためである。例えば、いくつかの実施形態では、方法は、0.0001%(1ppm)~0.001%(10ppm)のがんDNAを含有する試料においてがんDNAを検出するために使用され得、試料は、25,000未満のゲノム当量のDNA(例えば、100~10,000、500~5000、又は2000~20,000ゲノム当量のDNA)を含むが、これらの数は変動し得る。また、統計的に有意な結果を得るために、各標的領域の各アリコートは、所望に応じて、少なくとも5,000、少なくとも10,000、少なくとも20,000、又は少なくとも100,000のリード深度まで配列決定することができる。
【0150】
がんDNAの量を推定すること
いくつかの実施形態では、がんDNAの量は、バリアント含有分子の総数として測定され得る。別の実施形態では、がんDNAの量は、推定バリアント対立遺伝子画分(VAF)として測定され得る。いくつかの実施形態では、平均又は中央VAF(すなわち、分析された全てのバリアントの平均値又は中央値)が生成され得、他の実施形態では、補正された平均又は中央VAFが決定され得る(すなわち、各バリアントについての以前に予め決定されたオフセット又はベースラインエラー率を差し引いた後のバリアントにわたる平均又は中央レベル)。いくつかの実施形態では、VAF及び配列決定反応に付加されたcfDNA分子の総数は、配列決定反応に付加されたバリアント腫瘍分子の総数を推定するための方法として一緒に乗算され得る。
【0151】
他の実施形態では、腫瘍組織を配列決定することを通して得られた情報は、単一がん細胞内の各バリアントのコピー数を推定するために使用され得、この情報は、それが表す腫瘍細胞の数、すなわち、「表されるがん細胞」を決定するために、試料中で検出されたバリアント及びそれらの頻度と組み合わせて使用され得る。
【0152】
いくつかの実施形態では、バリアント含有分子の測定値、又はがん細胞の推定数は、試料1ml当たりの分子の数を推定するために、DNAが抽出された血漿などの液体のミリリットル数と組み合わされ得る。そのような分析の例では、血漿1ml当たりのバリアント分子の平均値、血漿1ml当たりのバリアント分子の中央値、血漿1ml当たりの腫瘍細胞の中央値、又はCSF1ml当たりのバリアント分子の中央値などの一連の出力を計算し得る。
【0153】
いくつかの実施形態では、この計算は、採血と配列決定分析との間で失われたDNAについて補正するステップを含み得る。これは、cfDNA抽出効率について補正すること又はライブラリー調製効率について補正することを含むことができる。例として、血漿1ml当たりのバリアント分子の中央値を計算するとき、まず試料中で検出することができる変異体分子の数、及び使用されたcfDNA試料がどの体積の血漿から抽出されたかを決定するであろう。次いで、この数は、使用される抽出化学によって典型的に回収される分子の既知の数並びに/又は配列決定ライブラリー調製及び分析中にそのような分子を変換、次いで配列決定する割合について補正される。いくつかの実施形態では、既知の配列を有する少なくとも1つの合成スパイクDNA配列は、抽出の前に試料に付加され、この配列は、抽出及びライブラリー調製の効率を決定するために配列決定中に分析され、次いで、以前に記載された変異体分子推定値を補正するために適用される。特定の実施形態では、スパイク配列は、分子バーコードを含有して、成功裏に読み取られる分子の数をカウントすることを可能にすることができる。
【0154】
検出限界を推定すること
当業者に明らかであろうように、多くの因子は、このような方法の感度に影響を与える。アプローチに応じて、これらの因子は、ライブラリー調製反応に付加され、配列決定された試験試料からのDNAの量、アリコートの数、標的領域及びバリアントの数、バックグラウンドエラー率、並びに各バリアントについての高シグナルバックグラウンド事象の割合を含み得る。
【0155】
いくつかの実施形態では、試料が分析される毎に検出限界が決定される。いくつかの実施形態では、バリアントについて評価されるDNA分子の数を決定するために、配列決定反応に添加される試料からのDNAの量は、標的領域の数によって乗算される。分析的検証研究中、バリアントについて評価された異なる数の分子を有する広範な試料は、それらの検出限界を経験的に決定するために試験される。いくつかの設定では、加えて、バリアントは、クラスに分けられ、各クラスの影響が決定される。試料が試験されると、その検出限界は次いで、バリアントの数、各アリコートに添加されたDNAの量、バリアントについて評価された分子の数、又は評価されたバリアントのクラスのうちの少なくとも1つに基づいて推定される。
【0156】
がんシグネチャーを利用すること
一連の変異プロセスが、がんゲノムにおける体性変異形成を駆動し、これらの各々が特徴的な変異シグネチャーを生成することが当該技術分野で知られている(Alexandrov,Nature 2020 578:94-101)。これらのプロセスのいくつか及びしたがってそれらのシグネチャーは、多くのがんに共通しているが、他のものは、特定のがんに特異的である。エクソーム又は全ゲノムなどのゲノムの十分に大きな領域を配列決定することによって、腫瘍DNAにおいてこれらのシグネチャーを検出することが可能である。本方法の一実施形態では、患者からの腫瘍DNAが配列決定されると、存在するシグネチャーを決定するために分析され得る。腫瘍が原発不明であるとき、がんの起源を推測するためにシグネチャーが使用され得る。例として、腫瘍内に存在するSBS7aシグネチャー(Alexandrov、上記)は、黒色腫である原発腫瘍と一致するであろう。
【0157】
別の実施形態では、腫瘍において特定されたバリアントが、アーチファクト、生殖系列、CHIPのいずれかではなく、がんに特異的な体性変化である尤度を決定するために、シグネチャーが使用され得る。そのような実施形態では、複数の潜在的な腫瘍特異的体性バリアントは、腫瘍DNAを配列決定することによって特定される。腫瘍のタイプ(例えば、黒色腫)は、その腫瘍タイプに存在する共通のシグネチャー(例えば、TCNで主にC>TであるSBS7a)であるとして特定される。がんタイプの共通のシグネチャーと一致するバリアントが含まれ、優先順位が付けられるか、又は標的化配列決定のためにバリアントを選択、ランク付け、若しくはスコア付けするときに実際の体性変化である可能性が高いことを示すスコアが与えられるが、主なシグネチャーと一致しないバリアントはフィルター処理で除外されるか、又はより低い優先順位若しくはスコアが与えられるかのいずれかである。
【0158】
cfDNA品質を評価するための方法
試験試料が無細胞DNAであり、血漿からの無細胞DNAを配列決定する前に、無細胞DNAが高分子量である量又は比率を決定するために評価される方法。無細胞DNAは、典型的には、短い(約160bp)。血液試料の取り扱いが悪いか、又は輸送されるとき、白血球は溶解し得、溶解すると高分子量DNAを放出し得、それはcfDNAをマスクし得る。したがって、長いDNA分子の高い比率は、偽陰性のリスクを有する質が悪い試料を示し得る。短いDNA分子の数と長いDNA分子の数との間の比が決定され、短いものは、50bp、60bp、70bp、80bp、90bp、100bp、110bp、120bp、130bp、140bp、150bp、又は160bp未満であり得、長いものは、320bp、480bp、1000bp、又は2000bp超である。1:10、1:5、1:4、1:3、又は1:2を超えるDNAが長い場合、試料には、採血後に白血球DNAが放出された証拠であり得る高レベルの長いDNA分子を潜在的に含むことについてフラグが立てられる。
【0159】
比がアガロースゲル分析などの電気泳動又はフラグメントアナライザー若しくはテープステーションなどの市販のシステムを使用して測定される方法。比がPCRベースのアプローチを使用して測定される方法。例は、ゲノムの長い領域及び短い領域の両方を標的とするプライマー及びプローブでデジタルPCR又はqPCRを使用することを含む。1つの長い領域及び1つの短い領域のいずれかが標的化され得るか、又はアッセイが、様々な異なるサイズ又は1つのサイズの複数のマーカー及び別のサイズの複数のマーカーで多重化され得る。そのような方法の利点は、ゲノムのいくつかの領域がコピー数変化によって影響を受けるときに補償する能力を含む。代替的に、アッセイは、反復配列を標的とすることができ、反復配列の短い領域が標的化され、反復配列の長い領域が標的化される。そのような実施形態の利点は、比を測定するために必要な試験DNAが少ないことである。別の実施形態では、ゲノムの短い領域を標的とする2つ以上のプライマー対が使用され、2つの領域が同じ染色体上にあるが、320bp超、480bp超、1000bp超、又は2000bp超だけ離れている。複製PCR反応は、同じ反応で両方の領域が増幅する回数、反応において一方の領域のみが増幅する回数、及びどちらの領域も増幅しない回数を決定するために、典型的には、反応当たり1コピー未満のゲノムが存在するように希釈された試験DNAに対して行われる。これらの3つの事象の頻度を使用して、長い分子及び短い分子の数を推定することができる。別の実施形態では、次世代配列決定が使用され得る。一実施形態では、標準ライブラリーは、シーケンサーアダプター上でライゲートし、任意にDNAを増幅することによって、cfDNAから生成される。代替の例では、配列決定前にcfDNAを増幅するために1つ以上の反復領域を標的とする1つ以上のプライマーが使用される。次いで、配列決定リードは、ゲノムにアラインされ、分子のサイズは、各配列決定リードの開始及び終了を特定することによって決定される。次いで、配列決定リードの長さに基づいて配列決定リードを群に分け、次いで比を決定することによって、短い分子と長い分子との間の比を得ることができる。そのような設定では、PCR及び次世代配列決定方法が両方、典型的には、より短いDNA分子についてのバイアスを有するため、補正因子を使用することが重要であり得る。cfDNA分子の少なくとも片側にアダプターをライゲートする代替方法、並びに1つ以上の標的化プライマー及びアダプターを標的とするプライマーも使用するPCR、続いてNGSは、cfDNAの長さの測定値を得るために使用することができる。いくつかの実施形態では、試験試料は、無細胞DNAであり、配列決定ライブラリーを生成する前に、より短いcfDNA分子を濃縮し、ctDNAの画分を増加させるために、サイズ選択が使用され、この濃縮は、ビーズ又はゲル上でのサイズ選択を使用して行われ得、短い分子は、160bp又は150bp又は140bp未満の長さのものである。
【0160】
有用性
患者からのDNA試料ががんDNAを含有する場合、患者は、例えば、微小残存病変、早期再発、又は転移に起因するがん関連細胞を有し得る。ctDNAは、約1時間の半減期を有するため、この設定では特に強力なバイオマーカーであり、腫瘍が完全に除去された場合、いずれの残ったctDNAも迅速に除去されているはずである。
【0161】
いくつかの場合では、治療後に患者から採取された無細胞DNAを使用して微小残存病変について試験する場合、腫瘍が正確な微小残存病変検出に十分な高レベルでctDNAを放出するかをまず確認することは重要であり得る。一実施形態では、無細胞DNA試料は、治癒目的での治療前に採取され、試験され、治療前に検出可能なctDNAを有さない任意の患者、又は治療前に腫瘍DNAを含有する試料の確率が特定の閾値を下回る場合は、正確な微小残存病変検出には少なすぎるctDNAを放出するため、更なる分析から除外され得る。代替の実施形態では、患者は、治療前のctDNAが、0.01%VAF、0.005%VAF、又は0.001%VAFなどの閾値未満であると推定される場合、更なる分析から除外され得る。別の実施形態では、治療前のctDNAのレベルは、設定された体積の腫瘍によって放出されたctDNAの量の推定値、よって腫瘍ctDNA放出の標準化された尺度を与えるために、画像化によって評価される治療前の腫瘍体積と相関する。この標準化された測定値が設定された閾値を下回る患者、例えば、1cm3の腫瘍がアッセイの所定の検出限界を下回るレベルのctDNAを放出すると予測される場合は、除外され得る。代替的に、治療後のctDNAレベルの変化は、腫瘍体積変化を予測し、それが腫瘍の完全な除去と一致するか、又は残存病変が残っていても等しく一定であるかを決定するために、この推定値と組み合わされ得る。
【0162】
試験試料を提供する患者は、がんを有し得、過去に(例えば、少なくとも2週間前、少なくとも3か月前、少なくとも6か月前、少なくとも1年前)がんについて治療を受けた場合があり、完全に寛解している場合があり、かつ/又は形質転換する潜在性を有するクローン性増殖(例えば、結節、ポリープ、及び嚢胞又はしこりなどの腫瘍性増殖)を有し得る。
【0163】
同様に、試料中のがんDNAの供給源は、異なり得る。例えば、がんDNAは、悪性化するクローン増殖、腫瘍転移、不完全な腫瘍除去、又は無効な治療の結果としての、MRDの結果であり得る。
【0164】
いくつかの実施形態では、方法は、試料中にがんDNAが存在するかを示すレポートを提供することを含み得る。いくつかの実施形態では、レポートは、尤度比、混合モデル、スコア、又はバリアントの閾値数、及び上記のアリコート出力、又はそれらを表す別の数、並びに尤度比又は混合モデル結果を比較して、試料ががんDNAを含むかを決定することができる閾値を含み得る。いくつかの実施形態では、レポートは、残存病変の治療のための承認された(例えば、FDA承認)療法、例えば、化学療法又は免疫療法などを更に列挙し得る。この情報は、疾患の診断(例えば、患者がMRDを有するか)及び/又は医師による治療の判断に役立ち得る。
【0165】
いくつかの実施形態では、レポートは、電子的形態であり得、方法は、レポートを遠隔地に、例えば、医師又は他の医療専門家に転送して、好適な行動経過を特定する、例えば、対象を診断する、又は対象に好適な療法を特定するのを支援することを含む。レポートは、例えば、対象が療法の影響を受けやすいかを決定するために、他の患者のメトリクスとともに使用され得る。
【0166】
任意の実施形態では、レポートは、「遠隔地」に転送することができ、「遠隔地」は、配列が分析される場所以外の場所を意味する。例えば、遠隔地は、同じ市内の別の場所(例えば、オフィス、実験室など)、異なる市内の別の場所、異なる州の別の場所、異なる国の別の場所などであり得る。したがって、1つの項目が別の項目から「遠隔」にあると示されるとき、それは、2つの項目が、同じ部屋にあるが離れているか、又は少なくとも異なる部屋若しくは異なる建物にあり、少なくとも1マイル、10マイル、又は少なくとも100マイル離れていることを意味する。情報を「通信する」とは、その情報を表すデータを電気信号として好適な通信チャネル(例えば、プライベート又は公的なネットワーク)を介して送信することを指す。項目を「転送する」とは、その項目を物理的に輸送するか又は別の方法(それが可能である場合)によるかに関わらず、その項目を1つの場所から次の場所に移動する任意の手段を指し、少なくともデータの場合、データを有する媒体を物理的に輸送するか、又はデータを通信することを含む。通信媒体の例は、無線又は赤外線送信チャネル、並びに別のコンピュータ又はネットワークデバイスへのネットワーク接続、並びに電子メール送信及びウェブサイトに記録された情報などを含む、インターネットを含む。特定の実施形態では、レポートは、MD又は他の適格な医療専門家によって分析され得、配列の分析の結果に基づいたレポートは、試料が得られた患者に転送され得る。
【0167】
いくつかの実施形態では、試料は、第1の場所で、例えば、病院又は医師のオフィスなどの臨床環境において患者から収集され得、試料は、第2の場所、例えば、試料が処理され、レポートを生成するために上記の方法が実施される、実験室に転送され得る。本明細書に記載される「レポート」は、試料中のがんDNAの存在及び/又は量を示し得る試験結果を提供するレポート要素を含む、電子的又は有形文書である。生成されると、レポートは、臨床判断の一部として、それが医療専門家(例えば、臨床医、臨床検査技師、又は腫瘍学者、外科医、病理学者、若しくはウイルス学者などの医師)によって解釈され得る、別の場所(第1の場所と同じ場所であり得る)に転送され得る。
【0168】
この方法で分析される患者は、任意のタイプのがんを有し得るか、又は以前に任意のタイプのがんのための治療を受けている場合がある。例えば、患者は、黒色腫、がん腫、リンパ腫、肉腫、又は神経膠腫を有し得るか、又は有していた場合がある。例えば、がんは、他の固形腫瘍及び血液がんを含む、他の多くの中でも、黒色腫、肺がん(例えば、非小細胞肺がん)、乳がん、頭頸部がん、膀胱がん、メルケル細胞がん、子宮頸がん、肝細胞がん、胃がん、皮膚扁平上皮がん、古典的ホジキンリンパ腫、B細胞リンパ腫、結腸直腸がん、膵臓がん、胃がん、又は乳がんであり得る。
【0169】
いくつかの実施形態では、方法は、治療決定を導くために使用され得る。いくつかの実施形態では、方法は、患者が、例えば、同じ療法又は第2の療法で、再度治療されるべきか決定するために使用され得る。例えば、患者が、第1のがん療法で以前に治療されており、患者が本方法を使用してMRDを有すると特定された場合、患者は、第1のがん療法と同じ又は異なる第2のがん療法で治療され得る。例えば、患者が以前に手術又は免疫チェックポイント阻害剤で治療されており、患者がMRDを有すると特定される場合、患者は、更なる手術、同じ若しくは異なる免疫チェックポイント阻害剤、又は別のタイプの療法で治療され得、免疫チェックポイント療法は、CTLA-4、PD1、PD-L1、TIM-3、VISTA、LAG-3、IDO、又はKIRチェックポイント阻害剤の投与を含み、他のタイプの療法は、例えば、(a)アントラサイクリン療法(例えば、ダウノマイシン、ドキソルビシン、又はミトキサントロンを投与することによる)、(b)アルキル化剤療法(例えば、メクロレタン、シクロホスファミド、イホスファミド、メルファラン、シスプラチン、カルボプラチン、ニトロソウレア、ダカルバジン及びプロカルバジン、又はブスルファンを投与することによる)、(c)トポイソメラーゼII阻害剤療法(例えば、エトポシド又はテニポシドを投与することによる)、(d)ブレオマイシン療法、(e)代謝拮抗剤療法(例えば、メトトレキサート、5-フルオロシル、シタラビン、6-メルカプトプリン、又は6-チオグアニンを投与することによる)、(f)ビンカアルキロイド治療(例えば、ビンクリセン又はビンブラスチンを投与することによる)、(g)ステロイド療法(例えば、プレドニゾン又はデキサメタゾンを投与することによる)、及び(h)放射線治療などを含む。代替療法は、標的化療法及び非標的化化学療法を含み、標的化療法は、EGFRにおける活性化変異を有する患者に投与され得るエルロチニブ(Tarceva)、アファチニブ(Gilotrif)、ゲフィチニブ(Iressa)、若しくはオシメルチニブ(Tagrisso)、ALK融合物を有する患者に投与され得るクリゾチニブ(Xalkori)、セリチニブ(Zykadia)、アレクチニブ(Alecensa)、若しくはブリガチニブ(Alunbrig)、ROS1融合物を有する患者に投与され得るクリゾチニブ(Xalkori)、エントレクチニブ(RXDX-101)、ロルラチニブ(PF-06463922)、クリゾチニブ(Xalkori)、エントレクチニブ(RXDX-101)、ロルラチニブ(PF-06463922)、ロポトレクチニブ(TPX-0005)、DS-6051b、セリチニブ、エンサルチニブ、若しくはカボザンチニブ、又はBRAFにおける活性化変異を有する患者に投与され得るダブラフェニブ(Tafinlar)若しくはトラメチニブ(Mekinist)での治療を含む。多くの他の実施可能な変異が知られている。患者が非標的化化学療法に切り替えられる場合、療法は、例えば、白金ベースのダブレット化学療法であり得る(白金ベースのダブレット化学療法は、シスプラチン(CDDP)、カルボプラチン(CBDCA)、及びネダプラチン(CDGP)から選択される白金ベースの薬剤、並びに1つの第3世代薬剤(ドセタキセル(DTX)、パクリタキセル(PTX)、ビノレルビン(VNR)、ゲムシタビン(GEM)、イリノテカン(CPT-11)、ペメトレキセド(PEM)、及びテガフールギメラシルオテラシル(S1)から選択される)を含み得る)。
【0170】
いくつかの実施形態では、方法は、治療をモニターするために使用され得る。例えば、方法は、方法を使用して第1の時点で得られた試料を分析することと、方法によって第2の時点で得られた試料を分析することと、結果を比較すること、すなわち、試料中にがんDNAが存在するかを決定すること、又は第1の時点と第2の時点との間でがんDNAの量若しくはがんDNAのありそうな量の範囲に変化があるかを決定することと、を含み得る。いくつかの実施形態では、そのような変化は、点推定値又は信頼区間を使用して決定され得、有意な減少は、療法が有効であることを示し、有意な減少がないこと又は増加は、療法が有効ではないことを示す。第1及び第2の時点は、治療前及び治療後、又は治療後の2つの時点であり得る。例えば、ある時点から得られた結果を別のものと比較することによって、方法は、治療の経過中に以前に特定されたバリエーションが対象にもはや存在しないかを決定するために使用され得る。第1の時点と第2の時点との間の期間は、少なくとも1か月、少なくとも6か月、又は少なくとも1年であり得、いくつかの場合では、患者は、定期的に、例えば、3か月毎、6か月毎、又は毎年、数年、例えば、5年以上にわたって試験され得る。
【0171】
この方法はまた、対象が無疾患であるか、又は疾患が再発しているかを決定するために使用され得る。上記のように、方法は、微小残存病変の分析及び再発検出に使用され得る。これらの実施形態では、方法で使用されるプライマー対は、がん物質、より早い時点でのcfDNAを配列決定すること、又は別の好適な試料を配列決定することのいずれかを通して、患者のがんにおいて以前に特定されたバリエーションを含む配列を増幅するように設計され得る。
【0172】
いくつかの実施形態では、微小残存疾患又は再発検出について試験する場合、患者からのDNAの試験試料は、無細胞DNAであろう。この無細胞DNAは、治療後の任意の時点で患者から採取され得る。いくつかの実施形態では、この無細胞DNAは、がんが成功裏に治療された場合にがんからの残りのctDNAが除去されたであろう時点で採取され得る。この時点は、ctDNAの初期量及び治療モダリティなどの因子に依存し得る。全ての腫瘍が一度に除去される方法について、例えば、手術時点は、治癒目的での治療の1週間、2週間、3週間、又は4週間後であり得る。治療ががんをより徐々に除去し得る場合、これらの時点は、1か月又は2か月など、より長くなり得る。明らかであろうように、代替の供給源から抽出された他のDNAはまた、がんDNAの存在又は量について評価することができる。例としては、脳脊髄液の細胞画分、脳脊髄液の細胞画分及び無細胞画分、糞便試料、尿内に存在する細胞、生検、又は細針吸引物質が挙げられるが、これらに限定されない。
【0173】
いくつかの実施形態では、方法はまた、リンパ節などからの生検又は細針吸引物質内に残存するがん細胞の存在について評価するために使用され得る。明らかであろうように、そのような方法は、生検試料中の腫瘍細胞の数が、病理学者による組織病理学的分析にとって生検中の十分な細胞を調査して残りのがんを特定することが実際的ではないほど低いレベルであり得るときに特に強力であろう。
【0174】
いくつかの実施形態では、方法はまた、複数のバリアントを並行して追跡するために使用され得、例えば、免疫療法又は個別化ワクチン後に予測されたネオアンチゲンをコードする変異を追跡する。
【0175】
いくつかの実施形態では、方法は、臨床試験で使用され得る。例えば、方法は、臨床登録のために特定の群の患者を特定するか、又は新薬(例えば、非特異的であるか、若しくは患者のがんに標的化され得るネオアジュバント療法若しくはアジュバント療法、又は任意の併用療法)の有効性を評価するために潜在的に使用され得る。いくつかの実施形態では、患者の血流中のctDNAの量は、複数の時点で推定することができ、それによって、例えば、試験中に患者に投与される薬物の用量を改変することを可能にする。いくつかの実施形態では、患者の血流中のctDNAの量は、臨床試験中の複数の時点で推定され、特定の療法、治療のレベル、治療の期間、又は治療タイプ及び患者の組み合わせが機能しているかを決定するために使用され得る。容易に理解されるように、方法の多くのステップ、例えば、配列処理ステップ及びDNAの試験試料中のがんDNAの存在を示すレポートの生成は、コンピュータ上で実施され得る。したがって、いくつかの実施形態では、方法は、患者が配列リードの分析に基づいて患者から採取されたDNAの試験試料中に存在するがんDNAを有するかの尤度を計算するアルゴリズムを実行することと、尤度を出力することと、を含み得る。いくつかの実施形態では、この方法は、配列をコンピュータに入力することと、入力測定値を使用して尤度を計算することができるアルゴリズムを実行することと、を含み得る。
【0176】
明らかであろうように、記載される計算ステップは、コンピュータで実施され得、したがって、ステップを行うための指示は、好適な物理コンピュータ可読記憶媒体に記録され得るプログラミングとして記載され得る。配列決定リードは、計算的に分析され得る。
【0177】
実施形態
実施形態1.患者からのDNAの試験試料中の腫瘍DNAを検出するための方法であって、(a)試験試料の複数のアリコートを配列決定して、各アリコートについて、各々が患者の腫瘍に関連する配列バリエーションを有する2つ以上の標的領域に対応する配列リードを生成することと、(b)各アリコートについて、各標的領域について、配列バリエーションを有する分子の数の推定値を導出するか、又は配列バリエーションを有する少なくとも1つの分子が存在する確率を計算することと、(c)ステップ(b)の推定値又は確率を使用して、試験試料中に腫瘍DNAが存在するかを決定することと、を含む、方法。
【0178】
実施形態2.各アリコートについて、各標的領域について、試験試料中の配列バリエーションを有する分子の数、又は配列バリエーションを有する少なくとも1つの分子が存在する確率が、(b)(i)配列バリエーションを有する(a)の配列リードの数、(ii)(a)の配列リードの総数、(iii)(a)の各アリコートに入力される分子の数、及び(iv)配列バリエーションの推定バックグラウンドエラー率を使用して推定される、実施形態1の方法。
【0179】
実施形態3.(iv)の推定バックグラウンドエラー率が、先行配列決定反応から推定される、実施形態2の方法。
【0180】
実施形態4.(iv)の推定バックグラウンドエラー率が、ステップ(a)で得られた対照塩基のデータを使用して調整された、先行配列決定反応から推定される、実施形態3の方法。
【0181】
実施形態5.(iv)の推定バックグラウンドエラー率が、ステップ(a)で生成された対照配列決定リードの分析によって推定される、実施形態2の方法。実施形態6.推定値が、点推定値ではなく、存在するバリアント分子の数にわたる確率分布である、実施形態1の方法。
【0182】
実施形態7.(c)が、試料中に:(i)ctDNAが存在する場合、(ii)ctDNAが存在しない場合、(b)における推定値を観測する尤度間の尤度比を計算することによって行われる、いずれかの先行実施形態の方法。
【0183】
実施形態8.試験試料中に腫瘍DNAが存在する場合に(b)の推定値を観測する尤度が、(i)ステップ(b)の推定値又は確率、及び任意に(ii)試験試料中の腫瘍画分の推定値に基づいて計算される、実施形態7の方法。
【0184】
実施形態9.試験試料中に腫瘍DNAが存在しない場合に(b)の推定値を観測する尤度が、(i)ステップ(b)の推定値又は確率、及び(ii)高シグナルバックグラウンド事象の推定割合に基づいて計算される、実施形態7又は8の方法。
【0185】
実施形態10.(c)が、(i)ステップ(b)の推定値又は確率、(ii)高シグナルバックグラウンド事象の推定率、及び任意に(iii)試験試料中の腫瘍画分の推定値を組み込む混合モデルを使用することによって計算される、いずれかの先行実施形態の方法。
【0186】
実施形態11.ステップ(c)が、混合モデルの出力又は尤度比を閾値と比較することを更に含み、閾値以上である出力が、試験試料が腫瘍DNAを含むことを示す、実施形態7又は10の方法。
【0187】
実施形態12.結果が閾値以上である場合に患者を腫瘍関連細胞を有するとして特定することを更に含む、実施形態11の方法。
【0188】
実施形態13.患者に療法を施すことを更に含む、実施形態12の方法。
【0189】
実施形態14.患者が、以前に第1の療法を受けており、方法が、第1の療法とは異なる第2の療法を患者に施すことを含む、実施形態13の方法。
【0190】
実施形態15.方法が、ステップ(b)の推定値に基づいて試験試料中の腫瘍DNAの量又は腫瘍DNAのありそうな量の範囲を、例えば、平均若しくは中央バリアント対立遺伝子画分、最尤、又はベイズ事後によって決定することを更に含み得る、いずれかの先行実施形態の方法。
【0191】
実施形態16.方法が、少なくとも第1の時点及び第2の時点の間に患者から得られる試料に対して実施され、第1の時点が、治療前であり、第2の時点が、治療後であり、方法が、第1の時点と第2の時点との間で腫瘍DNAの量又は腫瘍DNAのありそうな量の範囲に変化があるかを決定することを含む、実施形態15の方法。
【0192】
実施形態17.変化が、点推定値又は信頼区間を使用して決定され、有意な減少が、療法が有効であることを示し、有意な変化がないこと又は増加が、療法が有効ではないことを示す、実施形態16の方法。
【0193】
実施形態18.療法が有効であるか否かを示すレポートを生成することを更に含む、実施形態17の方法。
【0194】
実施形態19.推定腫瘍画分に基づいて統計的にありそうもない数のアリコートにおいて特定される配列バリエーションの推定値が、ステップ(c)の前にステップ(b)の結果から除外される、いずれかの先行実施形態の方法。
【0195】
実施形態20.ステップ(a)が、少なくとも3つのアリコートを配列決定することを含む、いずれかの先行実施形態の方法。
【0196】
実施形態21.ステップ(a)がまた、生検又は手術試料からの腫瘍DNA、バフィーコートDNA、頬スワブDNA、全血DNA、隣接する正常なDNA、参照DNAのうちの少なくとも1つを含み得る、陽性及び/又は陰性対照を配列決定することを含む、いずれかの先行実施形態の方法。
【0197】
実施形態22.腫瘍DNA中で検出されないバリアントが、除外され、バフィーコート、頬スワブ、隣接する正常な血液又は全血中で検出されるバリアントが、除外される、実施形態21の方法。
【0198】
実施形態23.2つ以上の標的領域が、少なくとも10個の標的領域である、いずれかの先行実施形態の方法。
【0199】
実施形態24.ステップ(a)の配列バリエーションが、独立して、単一ヌクレオチドバリアント、インデル、転位、又は再配列である、いずれかの先行実施形態の方法。
【0200】
実施形態25.配列バリエーションが、予め特定された配列バリエーションである、いずれかの先行実施形態の方法。
【0201】
実施形態26.配列バリエーションが、(i)腫瘍細胞を含む組織生検から単離されたDNA、(ii)腫瘍細胞を含む手術で得られた腫瘍組織から単離されたDNAを配列決定すること、又は(iii)無細胞DNA若しくは(iv)循環腫瘍細胞から単離されたDNAを配列決定することによって特定される、いずれかの先行実施形態の方法。
【0202】
実施形態27.配列バリエーションが、全ゲノム、全エクソーム、又はがん変異を共通して含むために選択されたゲノムの領域を配列決定することによって特定される、実施形態26の方法。
【0203】
実施形態28.複数の候補配列バリエーションが、まず特定され、配列バリエーションが、クローン性、マッピング可能性、推定エラー率、別の選択されたバリアントからの距離、配列決定する予測能力、コピー数増加又は増幅の領域内での存在、及び変異体対立遺伝子を濃縮するために使用され得る任意の生殖系列バリアントの近接性のうちの1つ以上に基づいて選択される、実施形態26~27の方法。
【0204】
実施形態29.患者が、がんを有するか、若しくは有したか、又はまだがんではないが形質転換する潜在性を有するクローン増殖を有する、いずれかの先行実施形態の方法。
【0205】
実施形態30.患者が、がんの治療を受けたか、又は受けている、いずれかの先行実施形態の方法。
【0206】
実施形態31.DNAが、無細胞DNAである、いずれかの先行実施形態の方法。
【0207】
実施形態32.無細胞DNAが、血漿、血清、脳脊髄液、尿、唾液、又は便から単離される、実施形態31の方法。
【0208】
実施形態33.DNAの試験試料中の腫瘍DNAの画分が、0.01%以下である、いずれかの先行実施形態の方法。実施形態34.試験試料が、25,000ゲノム当量未満のDNAを含む、いずれかの先行実施形態の方法。
【0209】
実施形態35.アリコートの数及びアリコート当たりの分子の最大数が、単一アリコート中の入力された分子の数が十分に低く、単一バリアント分子が存在する場合、バックグラウンドとは顕著に異なるシグナルを生成するであろうように、入力された分子の総数及び推定バックグラウンドエラー率に基づいて調整される、いずれかの先行実施形態の方法。
【0210】
実施形態36.各配列バリエーションの各アリコートについて、ステップ(a)のリード深度が、少なくとも10,000である、いずれかの先行実施形態の方法。
【0211】
実施形態37.ステップ(a)の前に試験試料中のDNAの量を測定することを更に含む、いずれかの先行実施形態の方法。
【0212】
実施形態38.標的領域の配列が、ステップ(a)の前に、PCRによって、又は核酸プローブへのハイブリダイゼーションによって試験試料から濃縮される、いずれかの先行実施形態の方法。
【実施例】
【0213】
以下の例は、当業者に、本発明をどのように作製及び使用するのかの完全な開示及び説明を提供するように提案されており、本発明者らが彼らの発明としてみなすものの範囲を制限するよう意図されていない。
【0214】
図15は、特に低い腫瘍画分を有する試料について、試料を腫瘍DNAを含有するとみなすことが困難であり得る理由を示す。上のパネルに示されるように、高い腫瘍画分(TF)を有する試料は、複数のアリコートにおいていくつかの陽性シグナルが得られるので、腫瘍DNAを容易にコールすることができる。これはほとんどの偽陽性を除外する。下のパネルに示されるように、低い腫瘍画分を有する試料は、データがバックグラウンドエラー率によって説明され得るため、コールするのがより難しい。例えば、各陽性バリアントが実際の配列バリエーションに対応する80%の確率を有する場合、
図15における低腫瘍画分試料について示された証拠は、試料が腫瘍DNAを含有するとみなすには不十分である。しかしながら、証拠が複数のバリアント及びアリコートにわたって集約される場合、試料が腫瘍DNAを含有するとみなすには十分な証拠があり得る。
【0215】
図11は、複数のバリアントにわたって証拠を組み合わせることができる方法を示す。希薄試料(<<0.1%腫瘍画分)について、ドロップアウト効果のため、各試料中の個々のバリアントの変異体リードの画分は、全体的な腫瘍画分に近似すると予想されない。例えば、多くのバリアント及びアリコートは、0個の分子を含有するであろう。代わりに、アリコート当たりのn/入力リードを離散分布として取得する効果がモデル化される。この例では、腫瘍画分は、直接測定されない。むしろ、それは全ての可能な入力に対して除外され、それは試料の腫瘍画分の正確な推定値を提供する。具体的には、バリアント分子の数を推測する代わりに、全ての可能な値の確率は、(i)配列バリエーションを有する配列決定リードの数、(ii)配列決定リードの総数、(iii)各アリコートに入力される分子の数、及び(iv)配列バリエーションの推定バックグラウンドエラー率に基づいて計算され、最も高い確率を有する値が特定される。これは推測することを回避する。
図15では、バリアントは、各アリコートについて存在又は不在として示されている。しかしながら、これらは実際には、腫瘍画分及び塩基当たりのノイズ推定値などの多くの因子を考慮する確率である。グラウンドトゥルースライン(
図16)を構築することができる。
図14は、特にノイジーなバリエーション、すなわち、統計的にありそうもない数のアリコートにおいて特定されるバリエーションを分析から除外することができることを示す。
【0216】
図17は、変動するレベルの循環腫瘍DNA(ctDNA)を含む3つの異なる試料の各々の4つのアリコートにおいて40を超える配列バリエーションが、本方法を使用して分析された、実験の結果を示す。52ppm及び544ppm試料は、ctDNAを有すると特定され、それは複数のアリコート及びバリアントにわたって証拠を組み合わせる利点を示す。この図では、色強度はVAF(バリアント対立遺伝子画分)と相関し、最も明るい色は>=1%を表す。いくつかのバリアント名は、元の腫瘍試料中のそれらの不在を示すためにグレー表示される。
【0217】
実施例1
残存病変を検出するための最適なアッセイを構築するために、目的のがんタイプ、この事例では、乳がんをまず選択した。がんの変異率は、精査され、患者の約90%において1Mb当たり0.5を超える変異であると特定され、平均的な患者は、1Mb当たり1を超える変異を有した(Martincorena and Campbell,Science 2015 349:1483-9)。22人の早期乳がん患者のパイロット研究では、ctDNAが0.06%VAFの中央値から0.0007%VAFまで検出されることが特定された。
【0218】
3つのがん細胞株を正常なDNAに希釈する研究は、48個のバリアントを追跡する個別化されたアッセイを使用して実施され、48個のバリアントを組み合わせて分析するとき、がんDNAを0.001%VAFで一貫して検出することができるが、バリアントの数が半減する度に感度のレベルが半減することを実証した。
【0219】
乳がんの変異率、ctDNAが約50%の確率で0.06%未満で検出され、パイロット研究において0.0007%VAFまで検出可能であるという観察に基づいて、少なくとも0.001%VAFの検出限界を有する乳がん試料の少なくとも90%の標的を設定した。1Mb当たり0.5変異の変異率では、乳がんにおける配列決定にはゲノムの96Mb領域が必要であった。
【0220】
このアプローチの主な利点は、少なくとも90%の患者において≧48個のバリアントが特定されるように、目的のがんタイプに必要な感度のレベルを再現可能に達成することを含む。別の利点は、より低い変異率を有する試料が標的化されると、配列決定コストを低減することができることである。
【0221】
実施例2
最適なMRDアッセイを設計するために、システムは、可能な限り多くの高品質バリアントを調査するように設計する。これを行うためには、腫瘍生検をまず得て、50%の腫瘍含有量を標的としてマクロ解剖し、エクソーム捕捉を行い、次いでIlluminaシーケンサーを使用して試料を配列決定する。全ての潜在的なバリアントは、標準Illuminaパイプラインを使用して特定し、次いで1)実際のものである尤度、2)体性である尤度、3)バリアントのバックグラウンドエラー率、4)高シグナルバックグラウンドエラー率、5)クローン性である確率、6)バリアントの増幅又はコピー数増加のレベルに基づいて組み合わされたスコアを与える。ゲノムは50bpウィンドウに分割し、これらのウィンドウは25bp重複する。各ウィンドウには、1)ウィンドウ内に存在する全てのバリアントのスコア、2)領域を一意的にアラインする能力のスコア(一意的にアラインすることができない領域にはペナルティが与えられ、ミスアラインメントの数が大きいほどペナルティが高くなる)、3)領域を増幅及び配列決定する能力のスコア(反復を含む配列決定にチャレンジすることが知られる機能にペナルティが与えられる)を含む組み合わされたスコアを与える。次いで、領域をスコアによって選別し、PCRプライマーを設計するために上位100個を選択する。重複する2つの領域が上位100のリストにある場合、最も高いスコアを有する領域が維持され、より弱いスコアを有する領域が破棄される。次いで、101番目の領域をリストに加え、以降も同様である。多重PCRは、上位48個のバリアントのために設計する。Insilico PCRは、全てのプライマー対を使用して行う。≧2の非特異的領域をもたらすプライマーの組み合わせが特定されると、この非特異的産物を引き起こしている最もスコアが低い領域のプライマーを破棄し、代替プライマーを設計する。非特異的PCR問題を克服しない場合、領域を破棄し、次の領域をプライマー設計に加える。
【0222】
試験試料中のがんDNAを検出するこの腫瘍情報に基づく方法の1つの課題は、堅牢かつ費用効果的に標的化することができる領域の数である。領域をランク付けするこの戦略は、試験DNA試料で成功裏に調査されるバリアントの数を最大化することができる。バリアントがシスにある(同じ染色体上で隣り合っている)とき、それらは一緒に読み取ることができ、これはシグナルをノイズから分離する能力が増加させる。バリアントがトランスにあるが、依然として同じプライマー対(又はベイトなどの他の標的化試薬)で読み取り可能であるとき、単一の標的化された領域からの情報の量は、倍増されるはずである。アプローチは、非特異的産物で浪費されるリードの数も限定するはずである。
【0223】
実施例3
試験試料中のがんDNAを高感度で検出するためには、複数のバリアントを標的とすることが有利である。いくつかのがんタイプについて、1つのタイプのバリアントのみを標的とすることで十分である。ただし、複数のタイプのバリアントを標的とするほうがよい場合もある。この例では、特定の乳がん患者について、多数の構造バリアントが存在し、他の患者ではより多くのSNV及びインデルが存在することが特定される。乳がん腫瘍DNAを配列決定して、SNV、インデル、及び再配列について評価するように大きなパネルを設計する。領域を含む最適なバリアントを特定する。これらの領域を標的とするようにプライマーを設計する。領域が1つ以上のSNV/インデルを含む場合、プライマーを全てのSNV及びインデルに隣接するように設計する。「領域」が再配列を含むと特定される場合、同じ染色体の2つの異なる部分又は2つの異なる染色体が結合しているであろう。再配列配列は、プライマー設計に使用され、1つのプライマーは再配列の3’であり、もう1つは5’である。SNV、インデル、又は他のバリアント(例えば、DBS)が再配列を伴うシスである事例では、プライマーは、腫瘍から得られた再配列された配列を使用して、再配列及び他のバリアントの両方に隣接するように設計される。このアプローチの利点は、試験試料中のがんDNAの評価のために多数のバリアントを一貫して得る能力である。
【0224】
実施例4
バックグラウンドエラー率及び高シグナルバックグラウンド事象の割合の両方を決定するために、各々48個のアンプリコンを有する、50個の異なるパネルを設計する。パネルの各々は、肺がん、CRC、又は乳がんのいずれかを有する患者のエクソームに対して設計する。パネル中の各アンプリコンは、平均約100bpの長さであり、この中に平均約60bpの試験DNAから読み取り可能な配列(すなわち、非プライマー配列)がある。血液を200人の健康なドナーから得る。各ドナー血液をStreck無細胞DNA採血管に引き込む。血液を血漿まで回転させ、無細胞DNAを抽出し、次いでデジタルPCRによってDNAを定量化する。各パネルを4人のドナーからのcfDNAで試験する。パネル及びcfDNAを使用して、複数のアリコート(3)での多重PCRをセットアップする。このPCRをバーコード化する。患者からのバーコード化された産物を一緒にプールする。これらをIllumina NovaSeqシーケンサーで実行する。評価されるバリアントタイプは、SNV及びインデルとして合意される。これらのバリアントを次のクラスに分割する:SNVのタイプ(例えば、C>A、T>A、又はG>A)、インデルのタイプ及びサイズ(例えば、1bp、2bp、3bpのdelなど)。ドナーからの結果を、cfDNAのデジタルPCR定量化に基づいて3つの群(低DNA入力、中DNA入力、及び高DNA入力)に分割する。プライマー配列、3bpのバッファー、潜在的な生殖系列バリアントがgnomADで報告されている全ての場所を除き、各場所の残りの塩基について、リードの総数、各非参照塩基の数、及びインデルの各々の異なるタイプ/サイズの数を得る。各変化(例えば、C>A)について、ベータ分布をデータに適合する。平均値及びCVの両方が得られる。特定の塩基変化の累積分布関数(CDF)を使用して、0.9999の閾値を使用して、試料が陽性とみなされなければならない対立遺伝子画分カットオフを決定する。これがバックグラウンドエラー率である。高シグナルバックグラウンド事象の割合を決定するために、各変化(例えば、C>A)について、試験パネルにおける変化の全ての事例を評価し、CDFで決定された対立遺伝子画分の閾値を超えるシグナルを検出する割合を計算する。
【0225】
実施例5
生検試料を得、腫瘍のゲノムの96Mbを配列決定し、次いで48個の領域を増幅するプライマーを選択することによって、乳がん患者の腫瘍についてパネルを設計し、合計で、48個の領域は、体性であり、腫瘍に特異的であると考えられる50個のバリアント(SNV及びインデル)を含む。患者特異的プライマーを多重化し、腫瘍DNAを使用して多重PCRをセットアップする。PCR産物をバーコード化し、次いでIlluminaシーケンサーで配列決定する。腫瘍DNA中で検出されなかったバリアントをバイオインフォマティクスでフィルター処理する。同じパネルを患者からのバフィーコートDNAに適用する。ライブラリーを生成し、配列決定する。40%を超えるVAFで特定された全てのバリアントに生殖系列としてフラグを立て、フィルター処理する。バリアントタイプ及びバックグラウンドエラー率によって決定されるように対立遺伝子画分カットオフを超えるが40%未満であると特定された全てのバリアントに、未確定の潜在能をもつクローン造血の可能性があるとしてフラグを立て、フィルター処理する。フィルター処理後に12を超えるバリアントが残る場合、パネルを患者から抽出されたcfDNAに適用する(残りが少ない場合、パネル再設計を試みる)。CfDNAを3つのアリコートに分割し、3つのアリコート全てで患者特異的プライマーを使用して多重PCRを行う。PCR産物をバーコード化し、ビーズクリーンアップを行い、次いで試料をプールし、配列決定する。配列決定の完了時、リードを逆多重化、トリム、品質に基づいてフィルター処理、及び参照ゲノムにアラインする。各標的領域で、各標的領域における全てのバリアントについて、野生型リードの数及びリードの総数をカウントする。
【0226】
実施例6
乳がん患者からのcfDNAの3つのアリコートの配列決定の完了後、変異体の総数及びフィルター処理されたバリアントを除く全てのバリアントの全てのアリコートの総リードを得る。バリアント対立遺伝子画分(変異体/総リード)を決定し、次いでこのバリアント対立遺伝子画分をバックグラウンドエラー率を使用して生成された閾値と比較する。全てのバリアントの全てのアリコートを評価して、それらが陽性又は陰性である(閾値を超えている)かを決定する。腫瘍画分は、まずバックグラウンドエラー率を使用して全てのVAFを補正し、次いで全てのバリアントの全てのアリコートにわたって平均することによって推定する。各ライブラリー調製物に付加されたDNA分子の数を平均VAFと比較して、各バリアントの各アリコートにおいて少なくとも1つの変異体分子を予想する可能性を決定する。次いで、各バリアントを評価して、偶然に予想されるよりも多くの陽性アリコートが存在するかを決定し、ありそうもない数の陽性アリコート(P<0.05)を有すると決定されるものをフィルター処理する。次いで、1のスコアを、高シグナルバックグラウンド事象(例えば、典型的にはインデル)を有さない任意のバリアントに与える。残りのバリアントについて、それらを「高シグナルバックグラウンド事象」の高い割合を有するもの(上位50%)及び「高シグナルバックグラウンド事象」の低い割合を有するもの(「高シグナルバックグラウンド事象」を有さないものを除く下位50%にある全てのもの)に分離する。低い割合を有する全てのバリアントは、0.75のスコアに寄与し、高い割合を有するものは、0.5のスコアに寄与する。試験DNA試料が2以上の合計スコアを有すると決定される場合、及び少なくとも2つのアリコートが0.5以上のスコアを有する場合、試験試料は、がんDNAを有するとみなされる。そのようなアプローチの多くの利点がある。いくつかのアプローチでは、十分なバリアントが閾値を超えているか(例えば、閾値を超える2つのバリアント)を単純に決定することができる。これは、いくつかのバリアントが一般に高シグナルバックグラウンド事象をもたらすが、他が決してもたらさないため、限定される。したがって、このアプローチは、これらのバリアントが高シグナルバックグラウンド事象を決してもたらさないとき、2つのバリアントのみが検出されるとき、高い特異性で確実なコーリングを可能にする。特定されたバリアントが高シグナルバックグラウンド事象をより起こしやすい場合、スコア付けアプローチは、したがってより慎重になり、アッセイが高い特異性を維持することを可能にするためには、3~4つのバリアントが必要である。複数のアリコートにおいてスコアを必要とすることによって、アッセイは、単一のアリコートの汚染による偽陽性を防止し、バフィーコートに存在するか、又は推定腫瘍画分に基づく可能性が高いよりも多くのアリコートに存在するかのいずれかであるバリアントをフィルターで除外しながら、CHIP及びエラーが発生しやすい塩基を含む偽陽性の一般的な供給源が根絶される。
【0227】
実施例6
乳がん患者からのcfDNAの3つのアリコートの配列決定の完了後、変異体の総数及びフィルター処理されたバリアントを除く全てのバリアントの全てのアリコートの総リードを得る。バリアント対立遺伝子画分(変異体/総リード)を決定し、次いでこのバリアント対立遺伝子画分をバックグラウンドエラー率を使用して生成された閾値と比較する。全てのバリアントの全てのアリコートを評価して、それらが陽性又は陰性である(閾値を超えている)かを決定する。腫瘍画分は、まずバックグラウンドエラー率を使用して全てのVAFを補正し、次いで全てのバリアントの全てのアリコートにわたって平均することによって推定する。各ライブラリー調製物に付加されたDNA分子の数を平均VAFと比較して、各バリアントの各アリコートにおいて少なくとも1つの変異体分子を予想する可能性を決定する。次いで、各バリアントを評価して、偶然に予想されるよりも多くの陽性アリコートが存在するかを決定し、ありそうもない数の陽性アリコート(P<0.05)を有すると決定されるものをフィルター処理する。次いで、バリアントの数のコーリング閾値は、全ての残りフィルター処理されていないバリアントの高シグナルバックグラウンド事象の推定割合を得、次いで全ての残りのアリコート及びバリアントにわたる高シグナルバックグラウンド事象のありそうな数の分布を計算することによって決定する。次いで、陽性バリアントの閾値数が得られ、純粋に高シグナルバックグラウンド事象を通して陽性事象の数を得る0.01%未満の変化がある。陽性バリアント(VAF閾値を超えるバリアント)の総数が陽性バリアントの閾値数を超えている場合、及び少なくとも2つのアリコートが陽性バリアントを有する場合、試料は次いで陽性とみなされる。そのようなアプローチの多くの利点がある。いくつかのアプローチでは、十分なバリアントが閾値を超えているか(例えば、閾値を超える2つのバリアント)を単純に決定することができる。これは、いくつかのバリアントが一般に高シグナルバックグラウンド事象をもたらすが、他が決して生成しないため、限定される。したがって、このアプローチは、高シグナルバックグラウンド事象がどれほど一般的に及びどのような分布で存在するかを推定することによって、確実なコーリングを可能にする。次いで、バリアントがどれほどノイジーか及びどれほど多くのバリアントが存在するかに応じて、個別化された閾値を設定する。これは、非常に高感度を可能にするが、特異性とのバランスも可能にする(例えば、共通の高シグナルバックグラウンド事象を有する多数のバリアントが試験されるとき、閾値は、高シグナルバックグラウンド事象をめったに有さない少数のバリアントが試験されるときよりも高い)。複数のアリコートにおいて陽性を必要とすることによって、アッセイは、単一のアリコートの汚染による偽陽性を防止し、バフィーコートに存在するか、又は推定腫瘍画分に基づく可能性が高いよりも多くのアリコートに存在するかのいずれかであるバリアントをフィルターで除外しながら、CHIP及びエラーが発生しやすい塩基を含む偽陽性の一般的な供給源が根絶される。
【0228】
実施例7
FFPE腫瘍物質を得る。組織を切片化し、トータルRNAを10枚のスライドから抽出する。リボソームRNA枯渇、逆転写、及び配列決定ライブラリー調製を行う。配列決定ライブラリーをバーコード化し、次いで患者からの他のライブラリーと多重化する。Illumina NovaSeqプラットフォームでの配列決定を行う。リードを逆多重化し、アラインさせ、次いでバリアントをコールする。バリアントは、SNV、インデル、及び遺伝子融合物を含む。これらのバリアントは次いで、プライマー設計のためにそれらのRNA転写産物から正しいゲノムDNA座標にマッピングされる。
【国際調査報告】