IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ミリアド・ジェネティックス・インコーポレイテッドの特許一覧

特許7499239体細胞変異のための方法およびシステム、ならびにそれらの使用
<>
  • 特許-体細胞変異のための方法およびシステム、ならびにそれらの使用 図1
  • 特許-体細胞変異のための方法およびシステム、ならびにそれらの使用 図2
  • 特許-体細胞変異のための方法およびシステム、ならびにそれらの使用 図3
  • 特許-体細胞変異のための方法およびシステム、ならびにそれらの使用 図4
  • 特許-体細胞変異のための方法およびシステム、ならびにそれらの使用 図5
  • 特許-体細胞変異のための方法およびシステム、ならびにそれらの使用 図6
  • 特許-体細胞変異のための方法およびシステム、ならびにそれらの使用 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-05
(45)【発行日】2024-06-13
(54)【発明の名称】体細胞変異のための方法およびシステム、ならびにそれらの使用
(51)【国際特許分類】
   C12Q 1/6869 20180101AFI20240606BHJP
   C12Q 1/6886 20180101ALI20240606BHJP
   G01N 33/53 20060101ALI20240606BHJP
   G16B 30/00 20190101ALI20240606BHJP
   C12N 5/09 20100101ALN20240606BHJP
   C12Q 1/6844 20180101ALN20240606BHJP
   C12Q 1/6827 20180101ALN20240606BHJP
【FI】
C12Q1/6869 Z
C12Q1/6886 Z
G01N33/53 M
G16B30/00
C12N5/09
C12Q1/6844 Z
C12Q1/6827 Z
【請求項の数】 42
(21)【出願番号】P 2021525656
(86)(22)【出願日】2019-11-12
(65)【公表番号】
(43)【公表日】2022-02-07
(86)【国際出願番号】 US2019061036
(87)【国際公開番号】W WO2020102261
(87)【国際公開日】2020-05-22
【審査請求日】2022-11-08
(31)【優先権主張番号】62/760,743
(32)【優先日】2018-11-13
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/929,554
(32)【優先日】2019-11-01
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】500086515
【氏名又は名称】ミリアド・ジェネティックス・インコーポレイテッド
(74)【代理人】
【識別番号】110001656
【氏名又は名称】弁理士法人谷川国際特許事務所
(72)【発明者】
【氏名】ザルキフ,アンドレイ
(72)【発明者】
【氏名】ティムス,クリスティン
(72)【発明者】
【氏名】ペリー,マイケル
(72)【発明者】
【氏名】グチン,アレキサンダー
【審査官】福澤 洋光
(56)【参考文献】
【文献】国際公開第2018/068028(WO,A2)
【文献】国際公開第2017/151524(WO,A2)
【文献】Brandi L Cantarel et al.,BAYSIC: a Bayesian method for combining sets of genome variants with improved specificity and sensitivity,BMC Bioinformatics,BioMed Central,2014年04月12日,Vol.15:104,pp.1-12
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/00- 3/00
C12N 1/00-15/90
CAplus/BIOSIS/MEDLINE/EMBASE(STN)
JSTPlus/JMEDPlus/JST7580(JDreamIII)
PubMed
(57)【特許請求の範囲】
【請求項1】
体細胞変異体を検出するための方法であって、
(a)サンプルの細胞からの核酸の配列を決定することと、
(b)ヘテロ接合SNP位置のセットを特定することであって、各SNPが対立遺伝子BおよびAを有する、特定することと、
(c)SNP位置および前記SNP位置に近い位置にある変異体について2つの生殖細胞系対立遺伝子ペアリングを検出することであって、前記2つの生殖細胞系対立遺伝子ペアリングが、(i)対立遺伝子Bと、第1の変異型対立遺伝子、および(ii)対立遺伝子Aと、前記第1の変異型対立遺伝子と同じであっても異なっていてもよい第2の対立遺伝子、である、2つの生殖細胞系対立遺伝子ペアリングを検出することと、
(d)(iii)対立遺伝子Bと、前記第1の変異型対立遺伝子とは異なる第3の変異型対立遺伝子である、第3の対立遺伝子ペアリングを検出することと、を含む、方法。
【請求項2】
前記対立遺伝子ペアリングがそれぞれ、前記SNP位置のうちの1つを含む連続する核酸配列において検出され、その結果、前記変異体の位置が、前記SNP位置の1つの検出長内にある、請求項1に記載の方法。
【請求項3】
前記連続する核酸配列が、約100~5000塩基のリード長である、請求項2に記載の方法。
【請求項4】
前記検出長が、前記SNP位置の各側の200~1000個の連続する塩基位置である、請求項2に記載の方法。
【請求項5】
前記方法が、別個の生殖細胞系コンパレータサンプルを利用しない、請求項1に記載の方法。
【請求項6】
前記サンプルが、癌組織サンプル、腫瘍細胞のサンプル、または腫瘍サンプルである、請求項1に記載の方法。
【請求項7】
前記サンプル中の非腫瘍細胞の量が、最小化される、請求項1に記載の方法。
【請求項8】
記サンプルが、非腫瘍細胞を含む、請求項1に記載の方法。
【請求項9】
前記対立遺伝子ペアリングが、大規模並列配列決定によって、ハイブリダイゼーションによって、または増幅によって検出される、請求項1に記載の方法。
【請求項10】
前記ヘテロ接合SNP位置のセットが、少なくとも5000個のSNP位置、または少なくとも100,000個のSNP位置、または少なくとも500,000個のSNP位置、または少なくとも1,000,000個のSNP位置、または少なくとも2,000,000個のSNP位置である、請求項1に記載の方法。
【請求項11】
前記方法が、Mbあたり0.1体細胞変異体、またはMbあたり0.3体細胞変異体、またはMbあたり0.7体細胞変異体の最小レベルで体細胞変異体を検出する、請求項1に記載の方法。
【請求項12】
前記検出が、標的化されたSNPパネルを用いて得られる、請求項1に記載の方法。
【請求項13】
前記検出が、ヒト参照ゲノムを使用する断片化配列決定によって得られる、請求項1に記載の方法。
【請求項14】
体細胞変異体を検出するための方法であって、
(a)腫瘍サンプルの細胞からの核酸の配列を決定することと、
(b)大規模並列核酸配列決定プロセスを使用して前記サンプルから配列リードを得ることであって、前記配列リードがリード長を有する、配列リードを得ることと、
(c)前記配列リードを参照ゲノムにマッピングすることと、
(d)前記参照ゲノムのヘテロ接合SNP位置にマッピングされた配列リードの体細胞変異体カウントマトリックスをアセンブルすることであって、前記カウントマトリックスが、変異型対立遺伝子に対するSNP対立遺伝子BおよびAそれぞれの対立遺伝子ペアリングをカウントする第1および第2の要素を有し、前記カウントマトリックスが、前記第1の要素におけるものとは異なる変異型対立遺伝子と対になっているSNP対立遺伝子Bからのリード配列をカウントする第3の要素を有する、アセンブルすることと、
(e)前記第3の要素について体細胞変異有意性スコア(S)を計算することと、を含む、方法。
【請求項15】
前記方法が、別個の生殖細胞系コンパレータサンプルを利用しない、請求項14に記載の方法。
【請求項16】
前記サンプルが、癌組織サンプル、腫瘍細胞のサンプル、または腫瘍サンプルである、請求項14に記載の方法。
【請求項17】
前記方法が、Mbあたり0.1体細胞変異体、またはMbあたり0.3体細胞変異体、またはMbあたり0.7体細胞変異体の最小レベルで体細胞変異体を検出する、請求項14に記載の方法。
【請求項18】
前記配列リードが、標的化されたSNPパネルを用いて得られる、請求項14に記載の方法。
【請求項19】
前記リード長が、100~5000、または200~1000個の連続する塩基位置である、請求項14に記載の方法。
【請求項20】
平均リード深度が、カバーされる前記参照ゲノムの部分について少なくとも50倍である、請求項14に記載の方法。
【請求項21】
前記参照ゲノムが、ヒトゲノムである、請求項14に記載の方法。
【請求項22】
前記配列リードが、
複数のマップ位置を有するリードを無視するステップ、
長さ100塩基の各リードにおいて1~10および86よりも大きい番号の塩基を無視するステップ、
同じインサートのフォワードリードおよびリバースリードについてインサートサイズにマップ位置サイズを一致させるステップ、
フォワードリードもリバースリードも前記SNP位置と重複しないリードを無視するステップ、および
重複するフォワードリードおよびリバースリードの塩基コールを組み合わせるステップであって、前記SNPが同じであり、異なる塩基コールを有する前記重複における位置を無視するステップ、のうちの1つ以上によってエラーフィルタリングされる、請求項14に記載の方法。
【請求項23】
前記配列リードが、
あいまいな野生型配列を有する位置を無視するステップ、
既知のSNP多型を有する位置を無視するステップ、
リード深度が50未満の位置を無視するステップ、
無関係のゲノムセグメントが前記配列に一致した反復位置を無視するステップ、および
無関係なサンプルの代表的なセットにおいて特定された未知のSNP多型を有する位置を無視するステップ、のうちの1つ以上によって位置フィルタリングされる、請求項14に記載の方法。
【請求項24】
前記体細胞変異有意性スコア(S)が、式Iによって与えられ、
S=(C(Z,P)/(C(Z,P)+C(X,P))+(C(Z,P)-E)/E)/2*10
式I
式中、C(Z,P)が、前記第の要素のカウントであり、C(X,P)が、前記第1の要素のカウントであり、Eが、すべてのSNP領域についての前記マトリックス内の他のすべてのカウント(上位3つのカウントを除く)の平均から計算されたエラー率である、請求項14に記載の方法。
【請求項25】
治療の恩恵を受ける、癌を有する対象を特定するための、体細胞変異体を含むキットであって、前記体細胞変異体は、
(a)前記対象からの腫瘍サンプルの細胞からの核酸の配列決定することと、
(b)ヘテロ接合SNP位置のセットを特定することであって、各SNPが対立遺伝子BおよびAを有する、特定することと、
(c)SNP位置および前記SNP位置に近い位置にある変異体について2つの生殖細胞系対立遺伝子ペアリングを検出することであって、前記2つの生殖細胞系対立遺伝子ペアリングが、(i)対立遺伝子Bおよび第1の変異型対立遺伝子と、(ii)対立遺伝子Aおよび前記第1の変異型対立遺伝子と同じであっても異なってもよい第2の対立遺伝子と、である、検出することと、
(d)(iii)対立遺伝子Bと、前記第1の変異型対立遺伝子とは異なる第3の変異型対立遺伝子である、第3の対立遺伝子ペアリングを検出することであって、前記第3の対立遺伝子ペアリングが、体細胞変異体から生じる、第3の対立遺伝子ペアリングを検出することと、
(f)前記対立遺伝子ペアリングから検出された前記体細胞変異体からの遺伝子変異量の値を計算することと、
(g)参照レベルよりも前記遺伝子変異量が大きい、治療の恩恵を受ける、癌を有する前記対象を特定することと、を含む、方法によって検出される、キット
【請求項26】
治療の恩恵を受ける、癌を有する対象を特定するための、体細胞変異体を含むキットであって、前記体細胞変異体は、
(a)前記対象からの腫瘍サンプルの細胞からの核酸の配列を決定することと、
(b)大規模並列核酸配列決定プロセスを使用して前記サンプルから配列リードを得ることであって、前記配列リードがリード長を有する、配列リードを得ることと、
(c)前記配列リードを参照ゲノムにマッピングすることと、
(d)前記参照ゲノムのヘテロ接合SNP位置にマッピングされた配列リードの体細胞変異体カウントマトリックスをアセンブルすることであって、前記カウントマトリックスが、変異型対立遺伝子に対するSNP対立遺伝子BおよびAそれぞれの対立遺伝子ペアリングをカウントする第1および第2の要素を有し、前記カウントマトリックスが、前記第1の要素におけるものとは異なる変異型対立遺伝子と対になったSNP対立遺伝子Bからのリード配列をカウントする第3の要素を有する、アセンブルすることと、
(e)
(i)前記第3の要素について体細胞変異有意性スコア(S)を計算するステップ、および
(ii)ヘテロ接合SNP領域内の位置の総数で正規化された、閾値を超える体細胞変異有意性スコアを有する体細胞変異体の数から遺伝子変異量の値を計算するステップ、によって、前記サンプルの前記遺伝子変異量の値を計算することと、
(f)体細胞変異の参照レベルよりも前記遺伝子変異量が大きい、治療の恩恵を受ける、癌を有する前記対象を特定することと、を含む、方法によって検出される、キット
【請求項27】
前記参照ゲノム内のヘテロ接合SNPの数が、約100~前記参照ゲノム内のヘテロ接合SNPの総数である、請求項26に記載のキット
【請求項28】
前記体細胞変異の参照レベルが、前記対象が前記治療の恩恵を受けるレベルである、請求項25または26に記載のキット
【請求項29】
前記体細胞変異の参照レベルが、前記参照ゲノムの平均遺伝子変異量である、請求項26に記載のキット
【請求項30】
前記体細胞変異の参照レベルが、前記対象と同じ種類の癌を有する参照集団の平均遺伝子変異量である、請求項25または26に記載のキット
【請求項31】
前記体細胞変異の参照レベルが、癌を有さない参照集団の平均遺伝子変異量である、請求項25または26に記載のキット
【請求項32】
前記体細胞変異の参照レベルが、前記治療の恩恵を受けない参照集団の平均遺伝子変異量である、請求項25または26に記載のキット
【請求項33】
前記体細胞変異の参照レベルが、前記対象とは異なるサンプルを用いて得られる、請求項25または26に記載のキット
【請求項34】
前記体細胞変異有意性スコア(S)が、15、または20、または30、または40より大きく、式Iによって与えられ、
S=(C(Z,P)/(C(Z,P)+C(X,P))+(C(Z,P)-E)/E)/2*10
式I
式中、C(Z,P)が、前記第3の要素のカウントであり、C(X,P)が、前記第1の要素のカウントであり、Eが、すべてのSNP領域についての前記マトリックス内の他のすべてのカウント(上位3つのカウントを除く)の平均から計算されたエラー率である、請求項26に記載のキット
【請求項35】
前記遺伝子変異量の閾値が15、または20、または30、または40であり、前記遺伝子変異量が、式IIによって与えられ、
TMB=N(S>閾値)/(N(HomHet)+N(HetHet))*1000000
式II
式中、Nが、前記ヘテロ接合SNP領域内の位置の総数(N(HomHet)+N(HetHet))で正規化された、前記閾値を超える体細胞変異有意性スコアを有する体細胞変異体の数である、請求項26に記載のキット
【請求項36】
癌を有する対象の治療に対する応答を監視するための方法であって、
(a)前記対象からの腫瘍サンプルの細胞からの核酸の配列を決定することと、
(b)ヘテロ接合SNP位置のセットを特定することであって、各SNPが対立遺伝子BおよびAを有する、特定することと、
(c)SNP位置および前記SNP位置に近い位置にある変異体について2つの生殖細胞系対立遺伝子ペアリングを検出することであって、前記2つの生殖細胞系対立遺伝子ペアリングが、(i)対立遺伝子Bと、第1の変異型対立遺伝子、および(ii)対立遺伝子Aと、前記第1の変異型対立遺伝子と同じであっても異なっていてもよい第2の対立遺伝子、である、2つの生殖細胞系対立遺伝子ペアリングを検出することと、
(d)(iii)対立遺伝子Bと、前記第1の変異型対立遺伝子とは異なる第3の変異型対立遺伝子である、第3の対立遺伝子ペアリングを検出することであって、前記第3の対立遺伝子ペアリングが、体細胞変異体から生じる、第3の対立遺伝子ペアリングを検出することと、
(e)前記検出された体細胞変異体から遺伝子変異量の値を計算することと、を含む、方法。
【請求項37】
癌を有する対象の治療に対する応答を監視するための方法であって、
(a)前記対象からの腫瘍サンプルの細胞からの核酸の配列を決定することと、
(b)大規模並列核酸配列決定プロセスを使用して前記サンプルから配列リードを得ることであって、前記配列リードがリード長を有する、配列リードを得ることと、
(c)前記配列リードを参照ゲノムにマッピングすることと、
(d)前記参照ゲノムのヘテロ接合SNP位置にマッピングされた配列リードの体細胞変異体カウントマトリックスをアセンブルすることであって、前記カウントマトリックスが、変異型対立遺伝子に対するSNP対立遺伝子BおよびAそれぞれの対立遺伝子ペアリングをカウントする第1および第2の要素を有し、前記カウントマトリックスが、前記第1の要素におけるものとは異なる変異型対立遺伝子と対になったSNP対立遺伝子Bからのリード配列をカウントする第3の要素を有する、アセンブルすることと、
(e)
(i)各体細胞変異体に関して、第3の要素についての体細胞変異有意性スコア(S)を計算するステップ、および
(ii)ヘテロ接合SNP領域内の位置の総数で正規化された、閾値を超える体細胞変異有意性スコアを有する体細胞変異体の数から遺伝子変異量の値を計算するステップ、によって、前記サンプルの前記遺伝子変異量の値を計算することと、を含む、方法。
【請求項38】
癌を有する対象を予後予測するための方法であって、
(a)前記対象からの腫瘍サンプルの細胞からの核酸の配列を決定することと、
(b)ヘテロ接合SNP位置のセットを特定することであって、各SNPが対立遺伝子BおよびAを有する、特定することと、
(c)SNP位置および前記SNP位置に近い位置にある変異体について2つの生殖細胞系対立遺伝子ペアリングを検出することであって、前記2つの生殖細胞系対立遺伝子ペアリングが、(i)対立遺伝子Bと、第1の変異型対立遺伝子、および(ii)対立遺伝子Aと、前記第1の変異型対立遺伝子と同じであっても異なっていてもよい第2の対立遺伝子、である、2つの生殖細胞系対立遺伝子ペアリングを検出することと、
(d)(iii)対立遺伝子Bと、前記第1の変異型対立遺伝子とは異なる第3の変異型対立遺伝子である、第3の対立遺伝子ペアリングを検出することであって、前記第3の対立遺伝子ペアリングが、体細胞変異体から生じる、第3の対立遺伝子ペアリングを検出することと、
(e)前記検出された体細胞変異体から遺伝子変異量の値を計算することと、
(f)TMB参照レベルよりも前記遺伝子変異量が大きい前記対象を、予後不良であるとして予後予測することと、を含む、方法。
【請求項39】
癌を有する対象を予後予測するための、、体細胞変異体を含むキットであって、前記体細胞変異体は、
(a)前記対象からの腫瘍サンプルの細胞からの核酸の配列を決定することと、
(b)大規模並列核酸配列決定プロセスを使用して前記サンプルから配列リードを得ることであって、前記配列リードがリード長を有する、配列リードを得ることと、
(c)前記配列リードを参照ゲノムにマッピングすることと、
(d)前記参照ゲノムのヘテロ接合SNP位置にマッピングされた配列リードの体細胞変異体カウントマトリックスをアセンブルすることであって、前記カウントマトリックスが、変異型対立遺伝子に対するSNP対立遺伝子BおよびAそれぞれの対立遺伝子ペアリングをカウントする第1および第2の要素を有し、前記カウントマトリックスが、前記第1の要素におけるものとは異なる変異型対立遺伝子と対になったSNP対立遺伝子Bからのリード配列をカウントする第3の要素を有する、アセンブルすることと、
(e)
(i)各体細胞変異体に関して、前記第3の要素について体細胞変異有意性スコア(S)を計算するステップ、および
(ii)ヘテロ接合SNP領域内の位置の総数で正規化された、閾値を超える体細胞変異有意性スコアを有する体細胞変異体の数から遺伝子変異量の値を計算するステップ、によって、前記サンプルの前記遺伝子変異量の値を計算することと、
(f)TMB参照レベルよりも前記遺伝子変異量が大きい前記対象を、予後不良であるとして予後予測することと、
(g)癌の治療を施すことと、を含む、方法によって検出される、キット
【請求項40】
前記治療が、免疫チェックポイント阻害剤を投与することである、請求項39に記載のキット
【請求項41】
体細胞変異体を検出するためのシステムであって、
サンプルから核酸を受け取り、濃縮し、増幅するための手段であって、前記サンプルが、癌細胞および非癌細胞を含む、手段と、
前記核酸からライブラリを合成するための手段と、
前記ライブラリを配列決定チップと接触させるための手段と、
前記ライブラリ内の配列を検出し、配列データをプロセッサに転送するための手段と、
1つ以上のプロセッサであって、
(a)癌細胞および非癌細胞を含むサンプルを提供するステップ、
(b)大規模並列核酸配列決定プロセスを使用して前記サンプルから配列リードを得るステップであって、前記配列リードがリード長を有する、ステップ、
(c)前記配列リードを参照ゲノムにマッピングするステップ、
(d)前記参照ゲノムのヘテロ接合SNP位置にマッピングされた配列リードの体細胞変異体カウントマトリックスをアセンブルするステップであって、前記カウントマトリックスが、変異型対立遺伝子に対するSNP対立遺伝子BおよびAそれぞれの対立遺伝子ペアリングをカウントする第1および第2の要素を有し、前記カウントマトリックスが、前記第1の要素におけるものとは異なる変異型対立遺伝子と対になったSNP対立遺伝子Bからのリード配列をカウントする第3の要素を有する、ステップ、
(e)
(i)各体細胞変異体に関して、前記第3の要素について体細胞変異有意性スコア(S)を計算するステップ、および
(ii)ヘテロ接合SNP領域内の位置の総数で正規化された、閾値を超える体細胞変異有意性スコアを有する体細胞変異体の数から遺伝子変異量の値を計算するステップ、によって、前記サンプルの前記遺伝子変異量の値を計算するステップ、を実施するための1つ以上のプロセッサと、
配列情報を表示、グラフ化、および報知するためのディスプレイと、を含む、システム。
【請求項42】
体細胞変異体を検出するための方法のステップをプロセッサに実行させる、前記プロセッサによる実行のための命令を記憶した非一時的な機械可読記憶媒体であって、前記方法が、
(a)癌細胞および非癌細胞を含むサンプルを提供することと、
(b)大規模並列核酸配列決定プロセスを使用して前記サンプルから配列リードを得ることであって、前記配列リードがリード長を有する、配列リードを得ることと、
(c)前記配列リードを参照ゲノムにマッピングすることと、
(d)前記参照ゲノムのヘテロ接合SNP位置にマッピングされた配列リードの体細胞変異体カウントマトリックスをアセンブルすることであって、前記カウントマトリックスが、変異型対立遺伝子に対するSNP対立遺伝子BおよびAそれぞれの対立遺伝子ペアリングをカウントする第1および第2の要素を有し、前記カウントマトリックスが、前記第1の要素におけるものとは異なる変異型対立遺伝子と対になったSNP対立遺伝子Bからのリード配列をカウントする第3の要素を有する、アセンブルすることと、
(e)
(i)各体細胞変異体に関して、前記第3の要素について体細胞変異有意性スコア(S)を計算するステップ、および
(ii)ヘテロ接合SNP領域内の位置の総数で正規化された、閾値を超える体細胞変異有意性スコアを有する体細胞変異体の数から遺伝子変異量の値を計算するステップ、によって、前記サンプルの前記遺伝子変異量の値を計算することと、
(f)前記サンプルからの配列情報を表示、グラフ化、および報告することと、を含む、非一時的な機械可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、核酸配列決定によって癌細胞内での体細胞変異を検出するための方法、組成物、キットおよびシステムに関する。より具体的には、本開示は、遺伝子変異量を測定するための、免疫チェックポイント阻害剤などの抗癌剤による治療の恩恵を受ける対象を特定および治療するための、ならびに対象において癌を治療するための、および癌を有する対象を監視および予後予測するための方法を提供する。
【背景技術】
【0002】
細胞内の癌の特徴の1つは、ゲノム内の体細胞変異体の存在である。例えば、Theodor Boveri,J.Cell Sci.(2008)121:1-84を参照のこと。体細胞変異体は、特に変異体の頻度を正確に検出して記録できる場合に、癌のバイオマーカーとして使用できる。しかしながら、体細胞変異体を定量的に検出することは困難である。
【0003】
癌細胞内での体細胞変異の頻度は、Mbあたり0.1未満~数百の範囲である可能性がある。体細胞変異体を検出する方法の欠点には、変異体の出現頻度が低いことを原因とする低感度が含まれる。低周波数で体細胞変異体を特定してカウントしようとしても、ハイスループット核酸配列決定法のノイズレベルを克服できない場合がある。
【0004】
さらに、参照ゲノムを必要とする核酸配列決定法では、参照ゲノム内の様々な対立遺伝子の表現が不十分であると、グループまたは民族的偏向が原因で不正確になる可能性がある。
【0005】
いくつかの従来の配列決定法における重大な欠点は、生殖細胞変異体を、癌サンプルにおいて検出された変異体から区別するために使用される非癌生殖細胞系コンパレータサンプルの必要性である。非癌生殖細胞系コンパレータサンプルは、癌細胞で検出された体細胞変異体から差し引かれるベースラインを提供することができる。実際、多くの場合、そのようなコンパレータサンプルは利用できない場合もある。
【0006】
必要なのは、高感度で体細胞変異体を検出するための方法、組成物、およびシステムである。体細胞変異体を正確に検出してカウントするために、配列決定法を改善することも望ましい。
【0007】
癌を治療するための方法、および治療の恩恵を受ける対象を特定するための方法が緊急に必要とされている。必要なのは、癌を有する対象からの腫瘍または組織のサンプルとともに、非癌コンパレータサンプルを必要としない方法およびシステムである。
【0008】
エラーを減らすために変異体を直接検出することを含む方法によってこれらの目標を達成することが長い間必要とされている。
【発明の概要】
【0009】
本発明は、癌細胞における体細胞変異を検出するための、免疫チェックポイント阻害剤などの抗癌剤による治療の恩恵を受ける対象を同定および治療するための、遺伝子変異量を測定するための、対象において癌を治療するための、ならびに癌を有する対象を監視および予後予測するための方法、組成物、キット、およびシステムを提供する。
【0010】
体細胞変異の測定は、癌を治療、診断、および予後予測する方法を提供することができる。
【0011】
いくつかの態様において、本発明は、抗癌剤を使用する癌の治療などの治療の恩恵を受ける対象を選択および特定するための方法を提供する。そのような対象については、癌を治療するための治療様式を選択することができる。
【0012】
さらなる態様において、本発明は、癌細胞における腫瘍変異頻度を測定およびスコアリングするための方法を提供する。スコアは、対象からのサンプルについての遺伝子変異量を計算するために使用できる。遺伝子変異量は、癌などの疾患のバイオマーカーとして役立つ。
【0013】
体細胞変異体は、特定の薬剤を使用した治療に対する対象の応答と関連付けられている可能性がある。例えば、高い遺伝子変異量値は、免疫チェックポイント阻害剤の投与に対する、癌を有する対象の好ましい応答と関連付けられている可能性がある。
【0014】
本発明の実施形態は以下を含む:
【0015】
体細胞変異体を検出するための方法であって、
(a)サンプルの細胞を配列決定することと、
(b)ヘテロ接合SNP位置のセットを特定することであって、各SNPが対立遺伝子BおよびAを有する、特定することと、
(c)SNP位置およびSNP位置に近い位置にある変異体について2つの生殖細胞系対立遺伝子ペアリングを検出することであって、2つの生殖細胞系対立遺伝子ペアリングが、(i)対立遺伝子Bと、第1の変異型対立遺伝子、および(ii)対立遺伝子Aと、第1の変異型対立遺伝子と同じであっても異なっていてもよい第2の対立遺伝子、である、2つの生殖細胞系対立遺伝子ペアリングを検出することと、
(d)(iii)対立遺伝子Bと、第1の変異型対立遺伝子とは異なる第3の変異型対立遺伝子である、第3の対立遺伝子ペアリングを検出することと、を含む、方法。対立遺伝子ペアリングはそれぞれ、SNP位置のうちの1つを含む連続する核酸配列において検出され得、その結果、変異体の位置は、SNP位置の1つの検出長内にある。連続する核酸配列は、約100~5000塩基のリード長である。検出長は、SNP位置の各側の200~1000個の連続する塩基位置である。この方法は、別個の生殖細胞系コンパレータサンプルを利用しない。サンプルは、癌組織サンプル、腫瘍細胞のサンプル、または腫瘍サンプルである可能性がある。サンプル中の非腫瘍細胞の量を最小限に抑えることができる。サンプルには非腫瘍細胞が含まれている場合がある。対立遺伝子のペアリングは、大規模並列配列決定、ハイブリダイゼーション、または増幅によって検出できる。ヘテロ接合SNP位置のセットは、少なくとも500個のSNP位置、または少なくとも1000個のSNP位置、または少なくとも5000個のSNP位置であり得る。この方法は、Mbあたり0.1、またはMbあたり0.3、またはMbあたり0.7の最小レベルで体細胞変異体を検出できる。検出は、標的とされたSNPパネルを用いて得ることができる。検出は、ヒト参照ゲノムを使用する断片化配列決定によって得ることができる。
【0016】
体細胞変異体を検出するための方法であって、
(a)腫瘍サンプルの細胞を配列決定することと、
(b)大規模並列核酸配列決定プロセスを使用してサンプルから配列リードを得ることであって、配列リードがリード長を有する、配列リードを得ることと、
(c)配列リードを参照ゲノムにマッピングすることと、
(d)参照ゲノムのヘテロ接合SNP位置にマッピングされた配列リードの体細胞変異体カウントマトリックスをアセンブルすることであって、カウントマトリックスが、変異型対立遺伝子に対するSNP対立遺伝子BおよびAそれぞれの対立遺伝子ペアリングをカウントする第1および第2の要素を有し、カウントマトリックスが、第1の要素におけるものとは異なる変異型対立遺伝子と対になったSNP対立遺伝子Bからのリード配列をカウントする第3の要素を有する、アセンブルすることと、
(e)第3の要素について体細胞変異有意性スコア(S)を計算することと、を含む、方法。この方法は、別個の生殖細胞系コンパレータサンプルを利用しない。サンプルは、癌組織サンプル、腫瘍細胞のサンプル、または腫瘍サンプルであり得る。この方法は、Mbあたり0.1、またはMbあたり0.3、またはMbあたり0.7の最小レベルで体細胞変異体を検出できる。検出は、標的とされたSNPパネルを用いて得られる場合がある。リード長は、100~5000個、または200~1000個の連続する塩基位置であり得る。平均リード深度は、カバーされる参照ゲノムの部分について、少なくとも50倍または100倍であり得る。参照ゲノムは、ヒトゲノムであり得る。配列リードは、エラーフィルタリングおよび位置フィルタリングされる場合がある。
体細胞変異有意性スコア(S)は、式Iによって与えられ、
S=(C(Z,P)/(C(Z,P)+C(X,P))+(C(Z,P)-E)/E)/2*10 式I
式中、C(Z,P)は、第3の要素のカウントであり、C(X,P)は、第1の要素のカウントであり、Eは、すべてのSNP領域についてのマトリックス内の他のすべてのカウント(上位3つのカウントを除く)の平均から計算されたエラー率である。
【0017】
治療の恩恵を受ける、癌を有する対象を特定するための方法であって、
(a)対象からの腫瘍サンプルの細胞を配列決定することと、
(b)ヘテロ接合SNP位置のセットを特定することであって、各SNPが対立遺伝子BおよびAを有する、特定することと、
(c)SNP位置およびSNP位置に近い位置にある変異体について2つの生殖細胞系対立遺伝子ペアリングを検出することであって、2つの生殖細胞系対立遺伝子ペアリングが、(i)対立遺伝子Bと、第1の変異型対立遺伝子、および(ii)対立遺伝子Aと、第1の変異型対立遺伝子と同じであっても異なっていてもよい第2の対立遺伝子、である、2つの生殖細胞系対立遺伝子ペアリングを検出することと、
(d)(iii)対立遺伝子Bと、第1の変異型対立遺伝子とは異なる第3の変異型対立遺伝子である、第3の対立遺伝子ペアリングを検出することであって、第3の対立遺伝子ペアリングが、体細胞変異体から生じる、第3の対立遺伝子ペアリングを検出することと、
(f)対立遺伝子ペアリングから検出された体細胞変異体からの遺伝子変異量の値を計算することと、
(g)参照レベルよりも遺伝子変異量が大きい、治療の恩恵を受ける、癌を有する対象を特定することと、を含む、方法。
【0018】
治療の恩恵を受ける、癌を有する対象を特定するための方法であって、
(a)対象からの腫瘍サンプルの細胞を配列決定することと、
(b)大規模並列核酸配列決定プロセスを使用してサンプルから配列リードを得ることであって、配列リードがリード長を有する、配列リードを得ることと、
(c)配列リードを参照ゲノムにマッピングすることと、
(d)参照ゲノムのヘテロ接合SNP位置にマッピングされた配列リードの体細胞変異体カウントマトリックスをアセンブルすることであって、カウントマトリックスが、変異型対立遺伝子に対するSNP対立遺伝子BおよびAそれぞれの対立遺伝子ペアリングをカウントする第1および第2の要素を有し、カウントマトリックスが、第1の要素におけるものとは異なる変異型対立遺伝子と対になったSNP対立遺伝子Bからのリード配列をカウントする第3の要素を有する、アセンブルすることと、
(e)
(i)第3の要素について体細胞変異有意性スコア(S)を計算するステップ、および
(ii)ヘテロ接合SNP領域内の位置の総数で正規化された、閾値を超える体細胞変異有意性スコアを有する体細胞変異体の数から遺伝子変異量の値を計算するステップ、によって、サンプルの遺伝子変異量の値を計算することと、
(f)体細胞変異の参照レベルよりも遺伝子変異量が大きい、治療の恩恵を受ける、癌を有する対象を特定することと、を含む、方法。参照ゲノム内のヘテロ接合SNPの数は、約100~参照ゲノム内のヘテロ接合SNPの総数であり得る。体細胞変異の参照レベルは、対象が治療の恩恵を受けるレベルであり得る。体細胞変異の参照レベルは、参照ゲノムの平均遺伝子変異量である可能性がある。体細胞変異の参照レベルは、対象と同じ種類の癌を有する参照集団の平均遺伝子変異量である可能性がある。体細胞変異の参照レベルは、癌を有さない参照集団の平均遺伝子変異量である可能性がある。体細胞変異の参照レベルは、治療の恩恵を受けない参照集団の平均遺伝子変異量であり得る。体細胞変異の参照レベルは、対象とは異なるサンプルを用いて得られる可能性がある。遺伝子変異量の閾値は、15、または20、または30、または40である場合があり、遺伝子変異量は、式IIによって与えられ、
TMB=N(S>閾値)/(N(HomHet)+N(HetHet))*1000000 式II
式中、Nは、ヘテロ接合SNP領域内の位置の総数(N(HomHet)+N(HetHet))で正規化された、閾値を超える体細胞変異有意性スコアを有する体細胞変異体の数である。
【0019】
癌の治療を必要とする対象において癌を治療するための方法であって、
(a)対象からの腫瘍サンプルの細胞を配列決定することと、
(b)ヘテロ接合SNP位置のセットを特定することであって、各SNPが対立遺伝子BおよびAを有する、特定することと、
(c)SNP位置およびSNP位置に近い位置にある変異体について2つの生殖細胞系対立遺伝子ペアリングを検出することであって、2つの生殖細胞系対立遺伝子ペアリングが、(i)対立遺伝子Bと、第1の変異型対立遺伝子、および(ii)対立遺伝子Aと、第1の変異型対立遺伝子と同じであっても異なっていてもよい第2の対立遺伝子、である、2つの生殖細胞系対立遺伝子ペアリングを検出することと、
(d)(iii)対立遺伝子Bと、第1の変異型対立遺伝子とは異なる第3の変異型対立遺伝子である、第3の対立遺伝子ペアリングを検出することであって、第3の対立遺伝子ペアリングが、体細胞変異体から生じる、第3の対立遺伝子ペアリングを検出することと、
(e)検出された体細胞変異体から遺伝子変異量の値を計算することと、
(f)参照レベルよりも遺伝子変異量が大きい、治療の恩恵を受ける、癌を有する対象を特定することと、
(g)癌の治療を施すことと、を含む、方法。
【0020】
癌の治療を必要とする対象において癌を治療するための方法であって、
(a)対象からの腫瘍サンプルの細胞を配列決定することと、
(b)大規模並列核酸配列決定プロセスを使用してサンプルから配列リードを得ることであって、配列リードがリード長を有する、配列リードを得ることと、
(c)配列リードを参照ゲノムにマッピングすることと、
(d)参照ゲノムのヘテロ接合SNP位置にマッピングされた配列リードの体細胞変異体カウントマトリックスをアセンブルすることであって、カウントマトリックスが、変異型対立遺伝子に対するSNP対立遺伝子BおよびAそれぞれの対立遺伝子ペアリングをカウントする第1および第2の要素を有し、カウントマトリックスが、第1の要素におけるものとは異なる変異型対立遺伝子と対になったSNP対立遺伝子Bからのリード配列をカウントする第3の要素を有する、アセンブルすることと、
(e)
(i)各体細胞変異体に関して、第3の要素について体細胞変異有意性スコア(S)を計算するステップ、および
(ii)ヘテロ接合SNP領域内の位置の総数で正規化された、閾値を超える体細胞変異有意性スコアを有する体細胞変異体の数から遺伝子変異量の値を計算するステップ、によって、サンプルの遺伝子変異量の値を計算することと、
(f)体細胞変異の参照レベルよりも遺伝子変異量が大きい、治療の恩恵を受ける、癌を有する対象を特定することと、
(g)癌の治療を施すことと、を含む、方法。癌の治療は、免疫チェックポイント阻害剤を投与することを含み得る。
【0021】
癌の治療を必要とする対象において癌を治療するための方法であって、
(a)対象からの腫瘍サンプルの細胞を配列決定することと、
(b)大規模並列核酸配列決定プロセスを使用してサンプルから配列リードを得ることであって、配列リードがリード長を有する、配列リードを得ることと、
(c)配列リードを参照ゲノムにマッピングすることと、
(d)参照ゲノムのヘテロ接合SNP位置にマッピングされた配列リードの体細胞変異体カウントマトリックスをアセンブルすることであって、カウントマトリックスが、変異型対立遺伝子に対するSNP対立遺伝子BおよびAそれぞれの対立遺伝子ペアリングをカウントする第1および第2の要素を有し、カウントマトリックスが、第1の要素におけるものとは異なる変異型対立遺伝子と対になったSNP対立遺伝子Bからのリード配列をカウントする第3の要素を有する、アセンブルすることと、
(e)
(i)各体細胞変異体に関して、第3の要素について体細胞変異有意性スコア(S)を計算するステップ、および
(ii)ヘテロ接合SNP領域内の位置の総数で正規化された、閾値を超える体細胞変異有意性スコアを有する体細胞変異体の数から遺伝子変異量の値を計算するステップ、によって、サンプルの遺伝子変異量の値を計算することと、
(f)体細胞変異の参照レベルよりも遺伝子変異量が大きい、治療の恩恵を受ける、癌を有する対象を特定することと、
(g)一定期間、癌の徴候および症状について対象を監視することと、
(h)癌の治療を施すことと、を含む、方法。治療は、免疫チェックポイント阻害剤を投与することであり得る。
【0022】
癌を有する対象の治療に対する応答を監視するための方法であって、
(a)対象からの腫瘍サンプルの細胞を配列決定することと、
(b)ヘテロ接合SNP位置のセットを特定することであって、各SNPが対立遺伝子BおよびAを有する、特定することと、
(c)SNP位置およびSNP位置に近い位置にある変異体について2つの生殖細胞系対立遺伝子ペアリングを検出することであって、2つの生殖細胞系対立遺伝子ペアリングが、(i)対立遺伝子Bと、第1の変異型対立遺伝子、および(ii)対立遺伝子Aと、第1の変異型対立遺伝子と同じであっても異なっていてもよい第2の対立遺伝子、である、2つの生殖細胞系対立遺伝子ペアリングを検出することと、
(d)(iii)対立遺伝子Bと、第1の変異型対立遺伝子とは異なる第3の変異型対立遺伝子である、第3の対立遺伝子ペアリングを検出することであって、第3の対立遺伝子ペアリングが、体細胞変異体から生じる、第3の対立遺伝子ペアリングを検出することと、
(e)検出された体細胞変異体から遺伝子変異量の値を計算することと、を含む、方法。
【0023】
癌を有する対象の治療に対する応答を監視するための方法であって、
(a)対象からの腫瘍サンプルの細胞を配列決定することと、
(b)大規模並列核酸配列決定プロセスを使用してサンプルから配列リードを得ることであって、配列リードがリード長を有する、配列リードを得ることと、
(c)配列リードを参照ゲノムにマッピングすることと、
(d)参照ゲノムのヘテロ接合SNP位置にマッピングされた配列リードの体細胞変異体カウントマトリックスをアセンブルすることであって、カウントマトリックスが、変異型対立遺伝子に対するSNP対立遺伝子BおよびAそれぞれの対立遺伝子ペアリングをカウントする第1および第2の要素を有し、カウントマトリックスが、第1の要素におけるものとは異なる変異型対立遺伝子と対になったSNP対立遺伝子Bからのリード配列をカウントする第3の要素を有する、アセンブルすることと、
(e)
(i)各体細胞変異体に関して、第3の要素について体細胞変異有意性スコア(S)を計算するステップ、および
(ii)ヘテロ接合SNP領域内の位置の総数で正規化された、閾値を超える体細胞変異有意性スコアを有する体細胞変異体の数から遺伝子変異量の値を計算するステップ、によって、サンプルの遺伝子変異量の値を計算することと、を含む、方法。
【0024】
癌を有する対象を予後予測するための方法であって、
(a)対象からの腫瘍サンプルの細胞を配列決定することと、
(b)ヘテロ接合SNP位置のセットを特定することであって、各SNPが対立遺伝子BおよびAを有する、特定することと、
(c)SNP位置およびSNP位置に近い位置にある変異体について2つの生殖細胞系対立遺伝子ペアリングを検出することであって、2つの生殖細胞系対立遺伝子ペアリングが、(i)対立遺伝子Bと、第1の変異型対立遺伝子、および(ii)対立遺伝子Aと、第1の変異型対立遺伝子と同じであっても異なっていてもよい第2の対立遺伝子、である、2つの生殖細胞系対立遺伝子ペアリングを検出することと、
(d)(iii)対立遺伝子Bと、第1の変異型対立遺伝子とは異なる第3の変異型対立遺伝子である、第3の対立遺伝子ペアリングを検出することであって、第3の対立遺伝子ペアリングが、体細胞変異体から生じる、第3の対立遺伝子ペアリングを検出することと、
(e)検出された体細胞変異体から遺伝子変異量の値を計算することと、
(f)TMB参照レベルよりも遺伝子変異量が大きい対象を、予後不良であるとして予後予測することと、を含む、方法。
【0025】
癌を有する対象を予後予測するための方法であって、
(a)対象からの腫瘍サンプルの細胞を配列決定することと、
(b)大規模並列核酸配列決定プロセスを使用してサンプルから配列リードを得ることであって、配列リードがリード長を有する、配列リードを得ることと、
(c)配列リードを参照ゲノムにマッピングすることと、
(d)参照ゲノムのヘテロ接合SNP位置にマッピングされた配列リードの体細胞変異体カウントマトリックスをアセンブルすることであって、カウントマトリックスが、変異型対立遺伝子に対するSNP対立遺伝子BおよびAそれぞれの対立遺伝子ペアリングをカウントする第1および第2の要素を有し、カウントマトリックスが、第1の要素におけるものとは異なる変異型対立遺伝子と対になったSNP対立遺伝子Bからのリード配列をカウントする第3の要素を有する、アセンブルすることと、
(e)
(i)各体細胞変異体に関して、第3の要素について体細胞変異有意性スコア(S)を計算するステップ、および
(ii)ヘテロ接合SNP領域内の位置の総数で正規化された、閾値を超える体細胞変異有意性スコアを有する体細胞変異体の数から遺伝子変異量の値を計算するステップ、によって、サンプルの遺伝子変異量の値を計算することと、
(f)TMB参照レベルよりも遺伝子変異量が大きい対象を、予後不良であるとして予後予測することと、
(g)癌の治療を施すことと、を含む、方法。
【0026】
治療の恩恵を受ける、癌を有する対象を特定するためのキットであって、
(a)対象からのサンプルから配列リードを得るための試薬であって、配列リードを使用して、サンプルの遺伝子変異量の値を得ることができる、試薬と、
(b)配列リードを得るための試薬および遺伝子変異量の値を使用して対象を特定するための説明書と、を含む、キット。
【0027】
体細胞変異体を検出するためのシステムであって、
サンプルから核酸を受け取り、濃縮し、増幅するための手段であって、サンプルが、癌細胞および非癌細胞を含む、手段と、
核酸からライブラリを合成するための手段と、
ライブラリを配列決定チップと接触させるための手段と、
ライブラリ内の配列を検出し、配列データをプロセッサに転送するための手段と、
(a)癌細胞および非癌細胞を含むサンプルを提供するステップ、
(b)大規模並列核酸配列決定プロセスを使用してサンプルから配列リードを得るステップであって、配列リードがリード長を有する、ステップ、
(c)配列リードを参照ゲノムにマッピングするステップ、
(d)参照ゲノムのヘテロ接合SNP位置にマッピングされた配列リードの体細胞変異体カウントマトリックスをアセンブルするステップであって、カウントマトリックスが、変異型対立遺伝子に対するSNP対立遺伝子BおよびAそれぞれの対立遺伝子ペアリングをカウントする第1および第2の要素を有し、カウントマトリックスが、第1の要素におけるものとは異なる変異型対立遺伝子と対になったSNP対立遺伝子Bからのリード配列をカウントする第3の要素を有する、ステップ、
(e)
(i)各体細胞変異体に関して、第3の要素について体細胞変異有意性スコア(S)を計算するステップ、および
(ii)ヘテロ接合SNP領域内の位置の総数で正規化された、閾値を超える体細胞変異有意性スコアを有する体細胞変異体の数から遺伝子変異量の値を計算するステップ、によって、サンプルの遺伝子変異量の値を計算するステップ、を実施するための1つ以上のプロセッサと、
配列情報を表示、グラフ化、および報知するためのディスプレイと、を含む、システム。
【0028】
体細胞変異体を検出するための方法のステップをプロセッサに実行させる、プロセッサによる実行のための命令を記憶した非一時的な機械可読記憶媒体であって、この方法が、
(a)癌細胞および非癌細胞を含むサンプルを提供することと、
(b)大規模並列核酸配列決定プロセスを使用してサンプルから配列リードを得ることであって、配列リードがリード長を有する、配列リードを得ることと、
(c)配列リードを参照ゲノムにマッピングすることと、
(d)参照ゲノムのヘテロ接合SNP位置にマッピングされた配列リードの体細胞変異体カウントマトリックスをアセンブルすることであって、カウントマトリックスが、変異型対立遺伝子に対するSNP対立遺伝子BおよびAそれぞれの対立遺伝子ペアリングをカウントする第1および第2の要素を有し、カウントマトリックスが、第1の要素におけるものとは異なる変異型対立遺伝子と対になったSNP対立遺伝子Bからのリード配列をカウントする第3の要素を有する、アセンブルすることと、
(e)
(i)各体細胞変異体に関して、第3の要素について体細胞変異有意性スコア(S)を計算するステップ、および
(ii)ヘテロ接合SNP領域内の位置の総数で正規化された、閾値を超える体細胞変異有意性スコアを有する体細胞変異体の数から遺伝子変異量の値を計算するステップ、によって、サンプルの遺伝子変異量の値を計算することと、
(f)サンプルからの配列情報を表示、グラフ化、および報告することと、を含む、非一時的な機械可読記憶媒体。
【図面の簡単な説明】
【0029】
図1】核酸配列決定により遺伝子変異量を検出および評価する方法および手順の図解。
図2】生殖細胞系対立遺伝子および生殖細胞変異体の図解。(上)ヘテロ接合SNP B/Aの近くに位置するヘテロ接合変異体V/Wの生殖細胞系対立遺伝子。各SNP対立遺伝子は、1つの変異型対立遺伝子にのみ関連付けられており、SNP位置およびVAR位置の両方をカバーするリードでは、BVおよびAWの2つの固有の配列リードのみが予想される。(下)ヘテロ接合SNP B/Aの近くに位置するホモ接合変異体W/Wの生殖細胞系対立遺伝子。各SNP対立遺伝子は、1つの変異型対立遺伝子にのみ関連付けられており、SNP位置およびVAR位置の両方をカバーするリードについて、BWおよびAWの2つの一意の配列リードのみが予想される。
図3】体細胞対立遺伝子および体細胞変異体の図解。(上)ヘテロ接合SNP B/Aの近くに位置するヘテロ接合変異体V/Wについて観察された対立遺伝子。SNP位置およびVAR位置の両方をカバーするリードでは、2つの通常の対立遺伝子ペアであるBVおよびAWについて、2つの固有の配列リードが予想される。しかしながら、SNP対立遺伝子Bは、2つの変異型対立遺伝子BVおよびBWと関連付けられている。したがって、BWは、デノボ変異を表す。これらのリードのマトリックスは、BVおよびAWのカウントが大きく(L)、BWのカウントが小さい場合があることを示す。(下)ヘテロ接合SNP B/Aの近くに位置するホモ接合変異体W/Wについて観察された対立遺伝子。SNP位置およびVAR位置の両方をカバーするリードでは、2つの通常の対立遺伝子ペアであるBWおよびAWについて、2つの固有の配列リードが予想される。しかしながら、SNP対立遺伝子Bは、2つの変異型対立遺伝子BVおよびBWと関連付けられている。したがって、BVは、デノボ変異を表す。これらのリードのマトリックスは、BWおよびAWのカウントが大きく(L)、BVのカウントが小さい場合があることを示す。
図4】核酸配列決定により遺伝子変異量を検出・評価する方法の例としての実施形態。ヘテロ接合SNP(Hom/Het)の近くにあるホモ接合体細胞変異体について、配列リードスタックを、示されているように参照ゲノム(WT)にマッピングした。対立遺伝子ペアGA(カウント55)、AA(カウント32)、およびAG(カウント23)の検出を示すカウントマトリックスをアセンブルした。3番目に大きなカウントAG(カウント23)の出現は、一部の癌細胞における体細胞変異から生じた。
図5】核酸配列決定により遺伝子変異量を検出・評価する方法の例としての実施形態。ヘテロ接合SNP(Het/Het)の近くに位置するヘテロ接合体細胞変異体について、対立遺伝子CG(カウント39)、GT(カウント34)、およびGG(カウント7)の検出を示すカウントマトリックスをアセンブルした。3番目に大きなカウントGG(カウント7)の出現は、一部の癌細胞における体細胞変異から生じた。
図6】結腸癌サンプルからの配列決定データの図解。各曲線は、対立遺伝子比率%(X軸)によって変異体位置(Y軸)の数を表す。1つのサンプルは、高TMBサンプルを表す大きなピークを示した。対立遺伝子比率の値が10%未満と非常に低い左側の高いピークは、無視される配列決定エラーを反映している。TMB値をカウントするために、TMB値は、30を超えるスコア(Y軸)について、約15%~約65%の対立遺伝子比率の範囲における曲線下面積として計算され得る。
図7】生殖細胞系コンパレータサンプルまたは生殖細胞系フィルタリングからデータを差し引くことを含む従来の方法と比較した、核酸配列決定によって結腸および乳癌サンプルにおける遺伝子変異量を検出および評価するための本発明のSNPベースの方法からのデータのプロット。腫瘍サンプルのみを使用し、第2の生殖細胞系コンパレータサンプルを使用しない、本発明の直接SNP分析法(黒丸)を使用して、従来の方法よりも驚くほど優れた遺伝子変異量の評価が得られた。本発明のSNPベースの方法(黒丸)の感度は、従来の方法よりも驚くほど増大した。より具体的には、本発明のSNPベースの方法(黒丸)は、既知の生殖細胞変異体のデータベースを使用して遺伝子変異量を評価し、生殖細胞系変異バックグラウンドの除去を試みるための一般的な変異体をフィルタリングするための核酸配列決定の方法よりも驚くほど正確であった(白丸)。
【発明を実施するための形態】
【0030】
本発明は、癌細胞における体細胞変異を検出するための方法、組成物、キットおよびシステムを提供する。体細胞変異の測定は、癌を治療、診断、および予後予測する方法を提供することができる。
【0031】
いくつかの態様において、本発明は、抗癌剤を使用する癌の治療などの治療の恩恵を受ける対象を選択および特定するための方法を提供する。そのような対象については、癌を治療するための治療様式を選択することができる。
【0032】
さらなる態様において、本発明は、癌細胞における腫瘍変異頻度を測定およびスコアリングするための方法を提供する。スコアは、対象からのサンプルについての遺伝子変異量を計算するために使用できる。遺伝子変異量は、癌などの疾患のバイオマーカーとして役立つ。
【0033】
体細胞変異体は、特定の薬剤を使用した治療に対する対象の応答と関連付けられている可能性がある。例えば、高い遺伝子変異量値は、免疫チェックポイント阻害剤の投与に対する、癌を有する対象の好ましい応答と関連している可能性がある。
【0034】
本明細書で使用される場合、体細胞変異体の頻度に関連する量は、「遺伝子変異量」(TMB)として定義することができる。TMBは、体細胞変異体のカウントを決定する際にアッセイされたゲノム位置の総数に正規化された、癌サンプル中の体細胞変異体のカウントとして計算できる。TMBは、DNAのメガベースあたりの変異の数として表すことができる。
【0035】
TMBは、RNAから測定することもでき、RNAのメガベースあたりの変異の数として表すことができる。
【0036】
TMBの測定値は、ゲノム位置のセットにおける体細胞変異の測定値として得ることができる。ゲノム位置のセットは、ゲノムのSNP領域のセットである可能性がある。
【0037】
いくつかの実施形態において、ヘテロ接合SNP位置のセットは、配列決定データまたは配列決定リードを使用して特定され得る。
【0038】
いくつかの実施形態において、ヘテロ接合SNP位置のセットは、既知のヒトSNP位置を使用して特定され得る。
【0039】
本発明のTMBの測定値は、ゲノムの体細胞変異の負荷の代用となり得る。本発明のTMBの測定値は、ゲノムの体細胞変異の数を直接反映する数値レベルを提供することができる。本発明のTMBの測定値は、ゲノムの総変異負荷の効果的な推定値となり得る数値レベルを提供することができる。本発明のTMBの測定値は、他の文献において「TMB」と呼ばれる量とは異なる場合がある。
【0040】
いくつかの態様において、本発明は、体細胞変異を検出し、変異レベルを決定するための方法およびシステムを提供する。変異負荷は、ゲノム内の体細胞変異の検出を包含する独自のアルゴリズムから得ることができ、ここでは、体細胞変異はそれぞれ、ゲノム内のSNP位置のアレイにおけるSNP位置の近くに位置する。
【0041】
特定の態様において、本発明のTMBの測定値は、ゲノム内の体細胞変異の部分の検出を包含する独自のアルゴリズムから得ることができ、ここでは、体細胞変異はそれぞれ、ゲノム内のSNP位置のアレイにおけるSNP位置の近くに位置する。
【0042】
さらなる態様において、本発明のTMBの測定値は、ゲノムの体細胞変異の数を直接反映する数値レベルを提供することができ、ここでは、変異は、ゲノム内の位置の機能に影響を及ぼす可能性がある。
【0043】
追加の態様では、TMBを測定するための本発明の方法は、目的の遺伝子座の複数の独立したリードを提供する任意の配列決定テクノロジーを用いて得られたデータを利用することができる。様々な実施形態において、サンガー配列法を利用することができる。
【0044】
さらなる態様において、TMBを測定するための本発明の方法は、SNPパネル、全エクソーム/ゲノム配列決定、およびSNPが配列決定され得る遺伝子パネルのうちのいずれかと共に利用することができる。
【0045】
いくつかの実施形態において、ゲノム全体からSNPをサンプリングするハイブリダイゼーションキャプチャーベースの遺伝子パネルであるHRD(Myriad Genetics,Inc.)配列決定を使用することができる。HRDアッセイはSNPを利用して腫瘍-CN/LOHプロファイルを再構築し、そこからHRDスコアを導き出すことができる。HRDアッセイを使用して、多数のSNP遺伝子座を配列決定することができる。
【0046】
特定の実施形態では、両側の隣接領域を含む、十分な数のSNPを有する任意の配列決定データを使用することができる。
【0047】
さらなる態様において、任意の配列ベースのNGSアッセイは、TMBを測定するための本発明の方法において使用され得る。
【0048】
追加の態様では、本発明の実施形態は、癌を有する対象を治療するための方法を提供する。癌を有する対象は、対象からのサンプルにおける遺伝子変異量を評価することによって選択および特定することができる。対象を、有効量の免疫チェックポイント阻害剤などの抗癌剤で治療してもよい。
【0049】
本発明の態様は、本発明のTMBの測定を含む、有利に優れた感度でサンプル中の体細胞変異体を検出するための方法、組成物、およびシステムを含む。
【0050】
本発明は、サンプルの核酸を配列決定するための改良された方法をさらに提供することができる。本発明の改良された配列決定法を使用して、体細胞変異体を正確に検出およびカウントすることができる。
【0051】
本開示に記載される実施形態は、癌を治療するための方法、および治療の恩恵を受ける対象を特定するための方法を含む。本発明の独自の方法は、対象からの単一のサンプルを使用して、非癌コンパレータサンプルを使用せずに実行することができる。本開示の方法は、体細胞変異体のスコアおよび遺伝子変異量の値を決定するために使用することができる体細胞変異体の直接的な測定値を提供する。体細胞変異の直接測定および対象からのサンプル(癌を有する対象からの腫瘍または組織サンプルなど)における遺伝子変異量の評価は、疾患の正確なバイオマーカーを提供することができる。
【0052】
本発明の追加の態様は、民族的偏向によるエラーを減らすことができる体細胞変異体を直接検出するための方法を含む。本開示の方法は、癌細胞のみに起因する可能性がある配列リードをカウントすることにより、単一の試験サンプルから体細胞変異体を検出することができる。これらの方法では、個体に関連し、グループまたは民族的偏向による影響が少ない遺伝子変異量を決定することができる。
【0053】
本発明の方法によって決定される遺伝子変異量は、特定の癌において特に予測することができる。遺伝子変異量を使用して、癌を検出および診断し、予後を決定することができる。
【0054】
癌の例には、前立腺癌、黒色腫、膀胱癌、乳癌、血液癌、中皮腫、肺癌、および固形腫瘍が含まれる。
【0055】
いくつかの実施形態において、本発明は、遺伝子変異量を評価するための方法を提供し、ここで、異常な状態は、予後不良を示し得る。
【0056】
さらなる実施形態において、遺伝子変異量を評価するための方法は、癌を診断および/または予後予測する際に1つ以上の臨床パラメータと組み合わせることができる。
【0057】
臨床パラメータの例には、例えば、臨床ノモグラムが含まれる。
【0058】
特定の実施形態において、高レベルの遺伝子変異量は、癌の存在を示し得る。
【0059】
追加の実施形態では、高レベルの遺伝子変異量は、臨床ノモグラムスコアが再発または進行のリスクが比較的低いことを示す対象において、癌の再発または進行のリスクが増加したことを示し得る。
【0060】
例えば、高レベルの遺伝子変異量は、腫瘍のグレードもしくは病期に関係なく、またはノモグラムスコアに関係なく、癌の再発または進行のリスクが増加したことを示し得る。したがって、高レベルの遺伝子変異量は、臨床パラメータのみを使用して検出されないリスクの増加を検出することができる。
【0061】
いくつかの態様において、本開示は、癌患者の少なくとも1つの臨床パラメータを決定することと、患者から得られたサンプルにおける遺伝子変異量を決定することと、を含む、インビトロ診断方法を提供する。
【0062】
いくつかの実施形態において、遺伝子変異量の異常な状態は、癌の再発または進行の可能性が増加したことを示し得る。
【0063】
特定の実施形態において、1つ以上の臨床パラメータと遺伝子変異量の評価とを組み合わせることにより、癌に関する予測能力を向上させることができる。いくつかの実施形態では、2つ以上の臨床パラメータを評価し、遺伝子変異量の評価と組み合わせてもよい。
【0064】
さらなる態様において、本発明は、患者の少なくとも1つの臨床パラメータまたはノモグラムスコアを決定することと、患者の遺伝子変異量を評価することと、を含む、インビトロ診断方法を含む。
【0065】
本発明の態様は、対象からの組織または細胞サンプル、より具体的には腫瘍サンプルにおける遺伝子変異量を評価することによって癌を分類するための方法を含む。
【0066】
本開示の腫瘍サンプルは、癌細胞および非癌正常細胞の混合物を含み得る。本開示の腫瘍サンプルは、サンプル中の非癌または非腫瘍含有量を最小限に抑えるように得ることができる。例えば、生検で腫瘍組織のみを切除することによって、または正常組織の縁を全く伴わないか最小限に伴う病変のみを除去することによって、サンプル中の非腫瘍含有量を最小限に抑えることができる。
【0067】
特定の実施形態では、測定された体細胞変異が遺伝子変異量の量に関連し得るように、サンプル中の非腫瘍含有量を最小化することが好ましい。遺伝子変異量を使用して、腫瘍におけるデノボ変異または体細胞変異のレベルを特徴付けることができる。
【0068】
追加の実施形態では、サンプルが多少の非腫瘍含有量を含む場合でさえ、測定された体細胞変異は、遺伝子変異量の量(quantity for tumor mutation burden)に関連し得る。遺伝子変異量を使用して、対象の臨床状態を分析するために腫瘍サンプル中のデノボ変異または体細胞変異のレベルを特徴付けることができる。
【0069】
本発明の実施形態は、生殖細胞系サブトラクションを行わずに体細胞変異を検出するための方法において、癌細胞および非癌細胞を含むサンプルを有利に利用することができる。生殖細胞系サブトラクションを行わずに体細胞変異を検出するための本発明の方法は、癌細胞および非癌正常細胞の混合物を含むサンプルにおいてさえ、腫瘍にのみ存在する変異の数をカウントすることができる。生殖細胞系サブトラクションを行わずに体細胞変異を検出するための本発明の方法は、どの変異が正常細胞に存在し、どの変異が腫瘍細胞に存在するかを特定し、腫瘍に存在する変異のみをカウントすることができる。
【0070】
いくつかの実施形態では、本開示の腫瘍サンプルは、サンプル中の非癌含有量を最小限に抑えるように得ることができ、その結果、体細胞変異をより高い精度および/または正確性で検出することができる。
【0071】
特定の実施形態において、本発明の方法は、癌細胞および非癌細胞を含むサンプルにおいてさえ、生殖細胞系サブトラクションを行わずに癌細胞における体細胞変異を有利に検出することができる。
【0072】
遺伝子変異量に関する参照値は、複数の訓練された患者、例えば癌患者の平均TMBレベルを表す場合があり、臨床データおよびフォローアップデータを利用することができ、疾患の転帰(例えば、再発または予後)によって患者を定義および分類するのに十分な同様の結果が得られる。
【0073】
TMBの参照値は、抗癌剤で治療された癌を有する対象の集団におけるTMBレベルであり得る。いくつかの実施形態では、集団は、特定の抗癌剤で治療された対象のグループと、異なる抗癌剤で治療された対象の異なるグループと、を含み得る。
【0074】
TMBの参照値は、抗癌剤による治療に応答しない癌を有する対象の集団におけるTMBレベルであり得る。
【0075】
いくつかの実施形態において、TMB値は、抗癌剤による治療に対して異なる応答性を有する対象同士を区別することができる。特定の実施形態において、TMB値は、全生存期間、または抗癌剤による治療後の無増悪生存期間が増加した対象を、生存期間が増加していない対象から区別することができる。追加の実施形態では、TMB値は、治療的処置の恩恵を受けるか、または治療的処置に応答する集団の対象を特定することができる。
【0076】
「良好な予後値」は、「転帰が良好である」と特徴付けられる複数の訓練された癌患者、例えば、初回治療後5年もしくは10年またはそれ以上の期間にわたって癌が再発しなかった患者、あるいは初回診断後5年または10年またはそれ以上癌が進行しなかった患者から生成され得る。
【0077】
「不良な予後値」は、「転帰が不良である」と定義された複数の訓練された癌患者、例えば、初回治療後5年もしくは10年またはそれ以上以内に癌が再発した患者、あるいは初回診断後5年もしくは10年またはそれ以上以内に癌が進行した患者から生成され得る。
【0078】
したがって、良好な予後値は、「転帰が良好である」患者のTMBの平均レベルを表す場合があり、一方、不良な予後値は、「転帰が不良である」患者のTMBの平均レベルを表す場合がある。
【0079】
いくつかの実施形態では、TMBの値が増加すると、対象は予後不良であり得る。
【0080】
特定の実施形態において、TMBの値は、通常値または閾値量を超えて増加される場合がある。
【0081】
様々な実施形態において、TMBの値は、良好な予後値よりも不良な予後値に近い場合があり、これは、対象の予後が不良であることを示し得る。
【0082】
他の実施形態では、TMBの値は、不良な予後値よりも良好な予後値に近い場合があり、これは、対象の予後が良好であることを示し得る。
【0083】
さらなる実施形態では、患者をリスクグループに割り当てることによってTMB値を決定してもよく、TMB平均の閾値を設定することができる。
【0084】
閾値は、受信者動作特性(ROC)曲線に基づいて選択することができる。この曲線は、感度と{1-特異度}をプロットする。
【0085】
いくつかの実施形態では、TMB参照レベルは、Mbあたり約1~約30、または約2~約30、または約3~約30、または約4~約30、または約5~約30、または約6~約30、または約7~約30、または約8~約30、または約9~約30、または約10~約30、または約10~約20の変異であり得る。
【0086】
いくつかの実施形態では、TMB参照レベルは、Mbあたり約5~約300、または約10~約300、または約30~約300、または約50~約300の変異であり得る。
【0087】
いくつかの実施形態では、TMB参照レベルは、Mbあたり約1、または約2、または約3、または約4、または約5、または約6、または約7、または約8、または約9、または約10、または約20の変異であり得る。
【0088】
いくつかの実施形態では、TMB参照値は、Mbあたり約30または約50の変異であり得る。
【0089】
一般に、癌は、癌の1つ以上の臨床的に関連する特徴を決定すること、および/または癌を有する患者の特定の予後を決定することによって分類され得る。したがって、「癌の分類」には、(i)転移の可能性、特定の臓器への転移の可能性、再発のリスク、および/または腫瘍の経過を評価すること、(ii)腫瘍の病期を評価すること、(iii)癌の治療がない場合の患者の予後を決定すること、(iv)治療(例えば、化学療法、放射線療法、腫瘍切除のための手術など)に対する患者の応答(例えば、腫瘍の縮小または無増悪生存期間)の予後を決定すること、(v)現在および/または過去の治療に対する実際の患者の応答を診断すること、(vi)患者にとって好ましい治療方針を決定すること、(vii)治療(一般的な治療またはある特定の治療のいずれか)後の患者の再発を予後予測すること、(viii)患者の平均余命を予後予測すること(例えば、全生存期間の予後予測)が含まれ得る。
【0090】
「陰性分類」とは、癌の好ましくない臨床的特徴(例えば、予後不良)を指す。例としては、(i)転移の可能性の増加、特定の臓器への転移の可能性、および/または再発のリスク、(ii)腫瘍の病期の進行、(iii)癌の治療がない場合の患者の予後不良、(iv)特定の治療(例えば、化学療法、放射線療法、腫瘍切除のための手術など)に対する患者の応答(例えば、腫瘍の縮小または無増悪生存期間)の予後予測不良、(v)治療(一般的な治療またはある特定の治療のいずれか)後の患者の再発の予後不良、(vi)患者の平均余命の予後予測(例えば、全生存期間の予後予測)不良が挙げられる。
【0091】
いくつかの実施形態では、再発に関連する臨床パラメータ(または高いノモグラムスコア)およびTMBの増加は、癌における陰性分類(例えば、再発または進行の可能性の増加)を示し得る。
【0092】
一般に、TMBの値の上昇は、急速に増殖する癌細胞を伴う場合があり、これはより攻撃的な癌を示している場合がある。TMBの値が上昇した対象は、治療後に再発する可能性が高くなる場合がある。TMBの値が上昇した対象は、癌の進行、またはより急速な進行の可能性が高く、急速に増殖する細胞により腫瘍が急速に成長し、毒性が高まり、かつ/または転移する場合がある。TMBの値が上昇した対象は、比較的積極的な治療を必要とする場合がある。
【0093】
いくつかの実施形態において、本発明は、遺伝子変異量を評価することによって癌を分類するための方法を提供し、ここで、異常な状態は、再発または進行の可能性の増加を示す。
【0094】
さらなる実施形態において、本発明は、遺伝子変異量を評価することによって対象における癌の予後を決定するための方法を提供し、ここで、上昇したTMBは、癌の再発または進行の可能性の増加を示し得る。
【0095】
追加の実施形態では、例えば生検サンプルを使用して、癌手術の前に評価を行うことができる。他の実施形態では、評価は、例えば、切除された癌サンプルを使用して、癌手術後に行うことができる。
【0096】
特定の実施形態において、1つ以上の細胞のサンプルは、治療前、治療中、または治療後に癌患者から得られ得る。
【0097】
癌治療の例には、罹患臓器の外科的切除、放射線療法、ホルモン療法(例えば、GnRHアンタゴニスト、GnRHアゴニスト、抗アンドロゲンの使用)、化学療法、および高密度焦点式超音波療法が含まれる。
【0098】
癌患者の能動的監視(surveillance)には、侵襲的治療を伴わない観察および定期的な監視が含まれる。症状が現れた場合、または癌の増殖が進行または加速している兆候がある場合は、監視中または監視後に能動的治療を開始することができる。
【0099】
能動的監視は、癌転移のリスクの増加に関与している場合がある。監視は、1か月以上、1年以上、またはそれ以上続く場合がある。
【0100】
本発明は、癌患者を治療するための方法を提供するか、または患者の治療を選択するためのガイダンスを提供することができる。この方法では、TMBおよび1つ以上の再発に関連する臨床パラメータの評価を決定することができる。患者からのサンプルのTMBが上昇しており、患者に1つ以上の再発に関連する臨床パラメータがある場合、能動的治療を推奨、開始、または継続してもよい。患者のTMBが上昇しておらず、再発に関連する臨床パラメータもない場合に、能動的監視が推奨、開始、または継続される場合もある。特定の実施形態では、TMB、またはTMBおよび1つ以上の臨床パラメータは、能動的治療が推奨されること、または特定の能動的治療が推奨されること、または積極的な治療が推奨されることを示し得る。
【0101】
一般に、前立腺切除術または放射線療法後の補助療法(例えば、化学療法、放射線療法、HIFU、ホルモン療法など)が進行性疾患に推奨される場合がある。
【0102】
体細胞変異を検出する方法
図1を参照すると、本開示は、体細胞変異を検出し、核酸配列決定によってゲノムの遺伝子変異量を評価するための方法を含む。
【0103】
体細胞変異体を検出する方法では、ステップS101で、大規模並列核酸配列決定プロセスを使用して、癌細胞および非癌細胞を含むサンプルから配列リードを得ることができる。配列リードは、約50~約5000ヌクレオチドの範囲のリード長を有することができる。配列リードは、参照ゲノムにマッピングすることができる。配列リードは、ステップS103でエラーフィルタリングすることができる。ヌクレオチドの塩基コールは、ステップS105でカウントすることができ、位置フィルタリングは、ステップS107で実行することができる。体細胞変異体-SNP配列リード塩基コールカウントマトリックスは、ステップS109でアセンブルすることができる。カウントマトリックスは、参照ゲノムのヘテロ接合SNP領域のセットを使用できる。各ヘテロ接合SNP位置について、カウントマトリックスは、ヘテロ接合SNP位置の1つのリード長内に位置する少なくとも第1の変異体を有するリード配列のみをカウントする第1および第2の要素と、ヘテロ接合SNP位置の1つのリード長内に位置する少なくとも体細胞の第2の変異体を有する癌細胞からのリード配列のみをカウントする第3の要素とを有する。ステップS111において、体細胞変異有意性スコア(S)は、ヘテロ接合SNP位置の1つのリード長内に位置する各体細胞変異体に関して、第3の要素について計算することができる。ステップS113では、体細胞変異有意性スコアに基づいて、サンプルの遺伝子変異量を計算できる。
【0104】
ヘテロ接合SNP領域のセットは、患者とは無関係な個体のグループに基づいて認定できる。
【0105】
特定の実施形態では、位置の完全なフィルタリングを行って、多型位置を除去することができる。複数のサンプルにおいて変異体を有する位置は、多型であると見なされる場合がある。関係する個体の存在により、バリエーションが複製され、誤った多型位置が作製される場合がある。したがって、多型を特定する前に、無関係な個体のセットを使用することができる。
【0106】
SNP位置のセットは、事前に決定することができる。位置は、反復性がなく、多型性がなく、エラー率が高くなる傾向がない場合に認定される。これは、例えば、以前に分析された約100人以上の無関係な個体、または約50人以上の無関係な個体、または約20人以上の無関係な個体、または約10人以上の無関係な個体に基づく統計から推定することができる。
【0107】
特定の実施形態では、TMBを計算するために使用される適格な位置の数は、1000個以上、または5000個以上、または100,000個以上、または300,000個以上、または500,000個以上、または10,0000,000個以上、または1,500,000個以上、または1,700,000個以上、または1,900,000個以上、または2,000,000個以上であり得る。
【0108】
いくつかの実施形態では、TMBを計算するために使用される適格な位置の数は、少なくとも1000個、または少なくとも5000個、または少なくとも100,000個、または少なくとも300,000個、または少なくとも500,000個、または少なくとも1,000,000個、または少なくとも1,500,000個、または少なくとも1,700,000個、または少なくとも1,900,000個、または少なくとも2,000,000個であり得る。
【0109】
いくつかの実施形態では、TMBを計算するために使用される適格な位置の数は、1000~3,000,000個、または5000~2,500,000個、100,000~2,500,000個、または500,000~2,500,000個であり得る。
【0110】
いくつかの実施形態では、平均リード深度は、カバーされる参照ゲノムの部分について少なくとも50倍、または100倍であり得る。
【0111】
サンプルは、癌細胞および非癌細胞を含むことができる。サンプル中の癌細胞および非癌細胞の存在は、本発明の方法が体細胞変異を検出すること、および生殖細胞系コンパレータサンプルなどのコンパレータサンプルを使用せずに体細胞変異を生殖細胞系変異から区別することを可能にすることができる。
【0112】
一般に、サンプルは癌を有する対象から採取され、癌部位から採取した組織または細胞を含み得るので、癌細胞が存在し得る。いくつかの実施形態において、サンプルは、腫瘍から除去された組織または細胞であり得る。特定の実施形態では、サンプルは、悪性腫瘍から除去された組織または細胞であり得る。さらなる実施形態では、サンプルは、腫瘍から除去された組織または細胞であり得、これには、非腫瘍組織または細胞の縁が含まれる。
【0113】
本発明の実施形態は、体細胞変異を直接検出し、コンパレータサンプルから得られた生殖細胞系量を差し引くためのステップを行わずに、対象からの単一のサンプルのみを使用して遺伝子変異量を評価するための方法で使用される独自のアルゴリズムを含む。
【0114】
図2は、生殖細胞系対立遺伝子および生殖細胞変異体の図解を示す。図2の上部には、対立遺伝子BおよびAを有するヘテロ接合SNPの近くに位置する、対立遺伝子VおよびWを有するヘテロ接合変異体位置の、生殖細胞における核酸配列が示されている。各SNP対立遺伝子は、1つの変異型対立遺伝子、すなわちBVおよびAWのみと関連付けられている。これらの対立遺伝子ペアの検出では、BVおよびAWの2つの固有の配列検出のみが予想される。断片化による配列決定では、SNPおよびVARの両方の位置をカバーするリード長の場合、BVおよびAWの2つの固有の配列リードのみが予想される。
【0115】
図2の上部で、変異型対立遺伝子VおよびWの両方がBと関連付けられている確率は非常に小さいかゼロであることに留意されたい。
【0116】
図2の下部には、対立遺伝子BおよびAを有するヘテロ接合SNPの近くに位置する、対立遺伝子WおよびWを有するホモ接合変異体位置の生殖細胞における核酸配列が示されている。各SNP対立遺伝子は、同じ変異型対立遺伝子、すなわちBWおよびAWと関連付けられている。これらの対立遺伝子ペアの検出では、BWおよびAWの2つの固有の配列検出のみが予想される。断片化による配列決定では、SNPおよびVARの両方の位置をカバーするリード長の場合、BWおよびAWの2つの固有の配列リードのみが予想される。
【0117】
図3は、体細胞対立遺伝子および体細胞変異体の図解を示す。
【0118】
図3の上図には、対立遺伝子BおよびAを有するヘテロ接合SNPの近くに位置する、対立遺伝子VおよびWを有するヘテロ接合変異体位置のサンプル細胞における核酸配列が示されている。体細胞変異変異体のない細胞では、各SNP対立遺伝子は、1つの変異型対立遺伝子、例えばBVおよびAWのみと関連付けられている。これらの対立遺伝子ペアの検出では、BVおよびAWの2つの固有の配列検出のみが予想される。断片化による配列決定では、SNPおよびVARの両方の位置をカバーするリード長の場合、BVおよびAWの2つの固有の配列リードのみが予想される。したがって、通常予想される2つの対立遺伝子ペアBVおよびAWのリードカウントLおよびLは、比較的大きい。体細胞変異変異体を有する癌細胞では、SNP対立遺伝子は、2番目の変異型対立遺伝子、例えばBWと関連付けられている。したがって、新しい対立遺伝子ペアBWのリードカウントは、比較的小さい。sのゼロ以外のカウントの存在は、SNP対立遺伝子Bが検出されたか、2つの異なる変異型対立遺伝子VおよびWと関連付けられていることを示す。したがって、VまたはWのいずれかをデノボ変異、より具体的には体細胞変異と見なすことができる。sのゼロ以外のカウントは、BWが体細胞変異によって癌細胞から発生することを示す。
【0119】
図3の上図には、対立遺伝子BおよびAを有するヘテロ接合SNPの近くに位置する、対立遺伝子VおよびWを有するヘテロ接合変異体位置のHet-Hetカウントマトリックスが示されている。癌細胞の非存在下、または体細胞変異の非存在下では、sはゼロであり、図3の上図は図2の上図と等しくなる。
【0120】
本発明の実施形態は、体細胞変異の対立遺伝子比率である特徴を企図している。対立遺伝子比率は、非野生型塩基の比率として定義することができ、0~100%まで変化し得る。
【0121】
一般に、対立遺伝子比率は、WT参照対立遺伝子に対する変異型対立遺伝子の割合を表し、0~100%まで変化し得る。
【0122】
一般に、体細胞変異を含む癌細胞が存在しない場合、対立遺伝子比率はゼロであり得る。一般に、対立遺伝子比率が100%の場合、体細胞変異が高レベルで存在することを示す。
【0123】
図3の下図には、対立遺伝子BおよびAを有するヘテロ接合SNPの近くに位置する、対立遺伝子WおよびWを有するホモ接合変異体位置のサンプル細胞における核酸配列が示されている。体細胞変異変異体のない細胞では、各SNP対立遺伝子は、1つの変異型対立遺伝子、例えばBWおよびAWのみと関連付けられている。これらの対立遺伝子ペアの検出では、BWおよびAWの2つの固有の配列検出のみが予想される。断片化による配列決定では、SNPおよびVARの両方の位置をカバーするリード長の場合、BWおよびAWの2つの固有の配列リードのみが予想される。したがって、通常予想される2つの対立遺伝子ペアBWおよびAWのリードカウントLおよびLは、比較的大きい。体細胞変異変異体を有する癌細胞では、SNP対立遺伝子は、2番目の変異型対立遺伝子、例えばBVと関連付けられている。したがって、新しい対立遺伝子ペアBVのリードカウントは、比較的小さい。sのゼロ以外のカウントの存在は、SNP対立遺伝子Bが検出されるか、2つの異なる変異型対立遺伝子VおよびWと関連付けられていることを示す。したがって、VまたはWのいずれかをデノボ変異、より具体的には体細胞変異と見なすことができる。sのゼロ以外のカウントは、BVが体細胞変異によって癌細胞から発生することを示す。
【0124】
図3の下図には、対立遺伝子BおよびAを有するヘテロ接合SNPの近くに位置する、対立遺伝子WおよびWを有するホモ接合変異体位置のHom-Hetカウントマトリックスが示されている。癌細胞の非存在下、または体細胞変異の非存在下では、sはゼロであり、図3の下図は図2の下図と等しくなる。
【0125】
ゼロ以外のsの存在は、SNP対立遺伝子Bが検出されるか、2つの異なる変異型対立遺伝子VおよびWと関連付けられていることを示し、したがって、デノボ変異が存在することを特定する。
【0126】
いくつかの実施形態では、ヘテロ接合SNPの近くに位置する変異体の場合、ノイズレベルを超えて検出可能な第3のゼロ以外のリードカウントは、癌細胞中の体細胞変異からのみ生じ得る。3番目の有意なリードカウントは、非癌細胞の存在下で、第2の生殖細胞系コンパレータサンプルから得られた生殖細胞系量を差し引かずに得ることができる。実際、この独自のアルゴリズムでは、第2の生殖細胞系コンパレータサンプルは必要ない。
【0127】
遺伝子変異量
特定の理論に拘束されることを望まないが、体細胞変異スコアおよび遺伝子変異量(TMB)の評価方法を以下に示す。
【0128】
本発明によるTMB値は、生殖細胞系サブトラクションを必要としない本発明の独自のアルゴリズムを使用して、対象からの単一のサンプルから得られた配列決定データを使用して計算することができる。配列決定データは、マイクロ電気泳動法、ハイブリダイゼーションによる配列決定、単一分子のリアルタイム観察、および周期的アレイ配列決定を含む当技術分野で知られている様々な方法によって得ることができる。
【0129】
TMB値は、生殖細胞系サブトラクションを必要としない本発明の独自のアルゴリズムを使用して、対象からの単一のサンプルから得られた断片化配列決定データを使用して計算することができる。変異体およびSNPの両方の位置にまたがる長さの配列リードのみをカウントマトリックスのアセンブリに含めることができる。一般に、リードはSNPおよびカウントされる位置をカバーする必要がある。コンパレータサンプルを使用した生殖細胞系サブトラクションは必要ない。SNP位置のセットを使用して、配列データを得ることができる。SNPの対立遺伝子頻度を変異体と比較して、変異体が生殖細胞変異体であるか体細胞変異体であるかを判断できる。
【0130】
約1つのリード長のSNP領域を使用して、SNP位置の近くの変異体を検出できる。リード長は、SNP位置および変異体位置の両方をカバーするのに十分であり得る。SNP領域のセットは、体細胞変異を検出し、サンプルのTMBの値を定量化するために必要な配列決定データを提供することができる。
【0131】
本明細書で使用される場合、変異体が、SNP位置の約1つの配列決定リード長内にある場合、変異体は、SNP位置の「近く」であり得る。SNP領域は、SNP位置について±1のリード長である可能性がある。
【0132】
当技術分野で知られているヒトSNP位置セットの例には、SNP Array 6.0(Affymetrix)が含まれる。
【0133】
変異体位置を含むSNP領域の場合、カウントマトリックスを計算できる。ここで、カウントマトリックスC(X1,X2)の各要素はマッピングされたリードの数であり得、非SNPコールX1=(T、C、G、またはA)であり、SNPコールX2=(T、C、G、またはA)である。
【0134】
量X、YおよびP、Qは、図2および3の例V、WおよびB、Aそれぞれに対応する。
【0135】
このマトリックスの2つの最大カウントであるC(X,P)≧C(Y、Q)は、4つの位置の対立遺伝子条件のうちの1つに起因し得る。
HomHom:C(Y,Q)≦3は、1つの有意なカウントC(X,P)のみを残す。これは、非SNPおよびSNPの両方の位置がホモ接合であることを示す。
HetHom:X≠YおよびP=Q。これは、非SNP位置がヘテロ接合であり、SNP位置がホモ接合であることを示す。
HomHet:X=YおよびP≠Q。これは、非SNP位置がホモ接合であり、SNP位置がヘテロ接合であることを示す。そして
HetHet:X≠YおよびP≠Q。これは、非SNPおよびSNPの両方の位置がヘテロ接合であることを示す。
【0136】
ヘテロ接合SNP位置を有するHomHetおよびHetHet条件を使用して、体細胞変異に起因するリードカウントを、正常な生殖細胞系対立遺伝子ペアリングに起因するリードカウントから区別することができる。癌を有する対象からのサンプルの場合、体細胞変異は、癌細胞の存在に起因する可能性がある。これは、別のサンプルから生殖細胞系コンパレータデータを個別に得ることなく実行できる。
【0137】
上記のカウントマトリックスの場合、マトリックス内の3番目に大きなカウントC(Z,P)またはC(Z,Q)の存在は、癌細胞の体細胞変異に起因する可能性がある。
【0138】
カウントがバックグラウンド配列決定エラー率を大幅に上回っている場合、3番目に大きなカウントを使用して体細胞変異を検出することができる。平均エラー率Eは、上位3つのカウントを除く他のすべてのカウントから計算できる。特定の実施形態では、平均エラー率Eは、上位3つのカウントを除いて、マトリックス内の他のすべてのカウントの平均から計算してもよい。
【0139】
体細胞変異のPhredのような有意性スコアは、自由度1のカイ二乗確率であり、式Iを使用して計算することができる。
S=(C(Z,P)/(C(Z,P)+C(X,P))+(C(Z,P)-E)/E)/2*10 式I
式中、C(Z,P)は、第3の要素のカウントであり、C(X,P)は、第1の要素のカウントであり、Eは、すべてのSNP領域についてのマトリックス内の他のすべてのカウント(上位3つのカウントを除く)の平均から計算されたエラー率である。
【0140】
エラー率Eの値は、すべての位置の平均として計算でき、通常は約1以下である。
【0141】
TMBレベルは、式IIに示すように、ヘテロ接合SNP領域{N(HomHet)+N(HetHet)}における位置の総数で正規化された、S>30である位置の数(メガベース)とすることができる。
TMB=N(S>30)/(N(HomHet)+N(HetHet))*1000000 式II
【0142】
特定の理論に拘束されることを望まないが、上記の説明に基づいて遺伝子変異量(TMB)の値を決定するための方法を以下に記載する。
【0143】
TMB値は、生殖細胞系サブトラクションを必要としない本発明の独自のアルゴリズムを使用して、対象からの単一のサンプルから得られた断片化配列決定データを使用して計算することができる。コンパレータサンプルを使用した生殖細胞系サブトラクションは必要ない。SNP位置のセットを使用することができる。
【0144】
SNP領域のセットからの配列データをプロットして、変異体位置の数(y軸)と対立遺伝子比率(x軸)を示すことができる。曲線下面積は、体細胞変異の存在の推定値である可能性がある。配列決定データのこの配置を使用して、曲線下面積を統合することにより、体細胞変異体として特定される変異体の総数の値を得ることができる。体細胞変異体として特定される変異体の総数の値は、TMBの測定値になり得る。したがって、TMBの測定値は、約15%の対立遺伝子比率~約85%の対立遺伝子比率または約65%の対立遺伝子比率の曲線下面積として得ることができる。ここで、曲線は、変異体の対立遺伝子比率(x軸)に対する、SNP領域のセットにおける変異体の位置の数(y軸)をプロットする。
【0145】
いくつかの実施形態では、TMBの測定値は、約15%の対立遺伝子比率~約50%の対立遺伝子比率、または15%の対立遺伝子比率~約50%の対立遺伝子比率、約15%の対立遺伝子比率~約55%の対立遺伝子比率、または約15%の対立遺伝子比率~約60%の対立遺伝子比率、または約15%の対立遺伝子比率~約65%の対立遺伝子比率、または約15%の対立遺伝子比率~約75%の対立遺伝子比率、または約15%の対立遺伝子比率~約85%の対立遺伝子比率として得ることができる。
【0146】
一般に、非野生型塩基を有する位置での体細胞変異の発生はまれであり得るため、高い対立遺伝子比率値のエラーは信頼性が低い場合がある。したがって、変異体カウント(y軸)/対立遺伝子比率(x軸)曲線下面積は、エラーを低減するために、好ましくは、約15%の対立遺伝子比率~約65%の対立遺伝子比率とすることができる。
【0147】
いくつかの実施形態では、平均エラー率Eの測定値は、約10~15%の対立遺伝子比率での変異体カウント(y軸)/対立遺伝子比率(x軸)曲線の値として得ることができる。
【0148】
システム
本発明のシステムでは、サンプル分析の結果は、医師、介護者、遺伝カウンセラー、患者、およびその他のうちのいずれかに通信または送信することができる送信可能な形式で、上記の当事者に送信され得る。このような形式はさまざまであり、有形または無形である可能性がある。結果は、説明文、図、写真、チャート、画像、またはその他の表示可能な形式で具体化できる。文章(statements)および視覚的形態は、紙などの有形媒体、フロッピーディスク、コンパクトディスクなどのコンピュータ可読媒体、または無形媒体、例えば、インターネットもしくはイントラネット上の電子メールもしくはウェブサイト形態の電子媒体に記録することができる。さらに、結果を音声形式で記録し、任意の好適な媒体、例えば、アナログまたはデジタルケーブル回線、光ファイバーケーブルなどを通じて、電話、ファクシミリ、無線携帯電話、インターネット電話などを介して送信することもできる。
【0149】
本発明のシステムでは、試験結果の情報およびデータをどこでも生成し、異なる場所に送信することができる。本発明はさらに、少なくとも1つの患者サンプルについて送信可能な形式の試験情報を生成するための方法を包含する。
【0150】
コンピュータベースの分析機能は、任意の好適な言語および/またはブラウザで実施できる。例えば、C言語により、好ましくはVisual Basic、SmallTalk、C++などのオブジェクト指向型の高水準プログラミング言語を使用して実施できる。アプリケーションは、Windows(商標)98、Windows(商標)2000、Windows(商標)NTなどを含むMicrosoft Windows(商標)環境などの環境に合わせて作製できる。さらに、このアプリケーションは、MacIntosh(商標)、SUN(商標)、UNIX、またはLINUX環境用に作製することもできる。さらに、機能ステップは、ユニバーサルまたはプラットフォームに依存しないプログラミング言語を使用して実施することもできる。このようなマルチプラットフォームプログラミング言語の例には、ハイパーテキストマークアップ言語(HTML)、JAVA(商標)、JavaScript(商標)、Flashプログラミング言語、共通ゲートウェイインターフェイス/構造化クエリ言語(CGI/SQL)、実用的な抽出レポート言語(PERL)、AppleScript(商標)およびその他のシステムスクリプト言語、プログラミング言語/構造化クエリ言語(PL/SQL)などが含まれるが、これらに限定されない。HotJava(商標)、Microsoft(商標)Explorer(商標)、Netscape(商標)などのJava(商標)またはJavaScript(商標)対応のブラウザを使用できる。アクティブコンテンツのWebページを使用する場合、Java(商標)アプレット、ActiveX(商標)コントロール、またはその他のアクティブコンテンツテクノロジーが含まれる場合がある。
【0151】
分析機能は、コンピュータプログラム製品で具体化することもでき、上記のシステムまたは他のコンピュータベースのシステムまたはインターネットベースのシステムで使用することができる。したがって、本発明の別の態様は、プロセッサが体細胞変異スコアおよび/またはTMB分析を実行することを可能にするために、コンピュータ可読プログラムコードまたは命令が具体化されたコンピュータ使用可能媒体を含むコンピュータプログラム製品に関する。これらのコンピュータプログラム命令は、機械を構成する(to produce a machine)コンピュータまたは他のプログラム可能な装置にロードされ、その結果、コンピュータまたは他のプログラム可能な装置上で実行される命令が、上記の機能またはステップを実施するための手段をもたらす。これらのコンピュータプログラム命令はまた、コンピュータまたは他のプログラム可能な装置に特定の方法で機能するように指示することができるコンピュータ可読メモリまたは媒体に格納され得、その結果、コンピュータ可読メモリまたは媒体に記憶された命令が、分析を実施する指示手段を含む製品を構成する(produce)。コンピュータプログラム命令はまた、コンピュータまたは他のプログラム可能な装置にロードされ、一連の操作ステップがコンピュータまたは他のプログラム可能な装置上で実行されて、コンピュータまたは他のプログラム可能な装置上で実行される命令が上記の機能またはステップを実施するためのステップを提供するようなコンピュータ実施プロセスを生成し得る。
【0152】
本発明の実施形態は、TMBを決定および計算するための方法のステップをプロセッサに実行させるための命令を記憶した非一時的な機械可読記憶媒体を提供することができる。
【0153】
不揮発性の非一時的な機械可読記憶媒体の例には、様々な種類のリードオンリーメモリ(ROM)、ハードドライブ、ソリッドステートメモリデバイス、フラッシュドライブ、コンパクトディスクリードオンリーメモリ(CD-ROM)、DVD、光学ディスク、磁気ディスク、またはコンピュータで実行可能な命令もしくはデータ構造を有するプログラムコードを担持または記憶するために使用できるその他の記憶媒体が含まれる。媒体は、プロセッサなどの汎用コンピュータまたは専用コンピュータからアクセスできる。
【0154】
本発明の実施形態は、それぞれが通信可能に結合され得る1つ以上のプロセッサ、1つ以上のメモリデバイス、ファイルシステム、通信モジュール、オペレーティングシステム、および/またはユーザインターフェースを有し得る演算システムを提供し得る。
【0155】
演算システムは、様々なハードウェアおよびソフトウェアリソースを利用するように構成され得るオペレーティングシステムを有することができる。オペレーティングシステムは、システムの他のコンポーネントの命令を受信して実行するように構成できる。
【0156】
演算システムの例には、ラップトップコンピューター、デスクトップコンピューター、サーバーコンピューター、携帯電話またはスマートフォン、タブレット、およびその他のポータブル演算システムが含まれる。
【0157】
演算システムの例には、プロセッサ、専用コンピュータまたは汎用コンピュータが含まれる。
【0158】
プロセッサは、機械可読記憶媒体に記憶された命令を実行するように構成され得る。プロセッサは、1つ以上のマイクロプロセッサ、様々なコントローラ、デジタル信号プロセッサ、または特定用途向け集積回路を含み得、データを受信および/または転送することができ、かつ、記憶された命令を実行してデータを変換することができる。いくつかの実施形態では、プロセッサは、プログラムコードまたは様々な媒体から命令を受信、解釈、および実行することができる。プロセッサは、データを受信して変換したり、メモリまたはファイルにデータを記憶したりすることができる。特定の実施形態では、プロセッサは、メモリまたはファイルから命令をフェッチし、命令を受信してメモリに記憶することができる。
【0159】
機械可読記憶媒体は、不揮発性である可能性がある。メモリまたは媒体は、命令ファイルまたはデータファイルをファイルシステムに記憶することができ、機械可読記憶媒体を含むことができる。機械可読記憶媒体は、非一時的である可能性がある。機械可読記憶媒体は、プロセッサによって実行可能であり得る命令を記憶することができる。
【0160】
通信デバイスは、データを送信および/または受信することができる任意の装置、システム、またはコンポーネントの組み合わせであり得る。データは、ネットワークまたは通信回線を介して送信および/または受信できる。通信デバイスは、他のコンポーネントに通信可能に連結されてもよい。
【0161】
通信デバイスの例には、ネットワークカード、モデム、アンテナ、赤外線または可視通信コンポーネント、Bluetoothコンポーネント、通信チップセット、ワイドエリアネットワーク、WiFiコンポーネント、802.6以上のデバイス、およびセルラー通信デバイスが含まれる。通信デバイスは、回線、ワイヤ、またはネットワーク上で、他のコンポーネント、デバイス、またはシステムとデータを交換できる。
【0162】
本開示のシステムは、1つ以上のプロセッサ、1つ以上の非一時的な機械可読記憶媒体、1つ以上のファイルシステム、1つ以上のメモリデバイス、オペレーティングシステム、1つ以上の通信モジュール、および1つ以上のユーザインターフェイスを含むことができ、これらはそれぞれ、通信可能に連結されている場合がある。
【0163】
いくつかの演算的な生物学的方法は、例えば、Setubal et al.,Introduction To Computational Biology Methods(1997);Salzberg et al.,Computational Methods In Molecular Biology(1998);Rashidi&Buehler,Bioinformatics Basics:Application In Biological Science And Medicine(2000);Ouelette&Bzevanis,Bioinformatics:A Practical Guide For Analysis Of Gene And Proteins(2001)に記載されている。
【0164】
抗癌剤
免疫チェックポイント阻害剤は、T細胞を解放し、対象における癌細胞を死滅させることができる。これらの薬剤は、癌細胞が免疫系を回避し、生存率を改善することを可能にするタンパク質をブロックすることができる。
【0165】
免疫チェックポイント阻害剤は、免疫細胞および/または免疫応答が、オフになるか、または死滅させようとするまさにその癌細胞によって下方調節もしくは阻害されるのを防止もしくは阻害することができる治療薬である。
【0166】
一般に、免疫チェックポイント阻害剤は、癌を有する対象の13%未満に有効である。したがって、そのような薬物による治療の恩恵を受ける対象を選択および特定することができることは有用である。
【0167】
免疫チェックポイント阻害剤の例には、PD1阻害剤であるイピリムマブ(例えば、Gulley&Dahut,Nat.Clin.Practice Oncol.(2007)4:136-137を参照)、トレメリムマブ(例えば、Ribas et al.,Oncologist(2007)12:873-883を参照)、および表1に列挙されている薬剤が含まれる。
【表1】
【0168】
追加の定義
以下の用語または定義は、本開示の理解を助けるためにのみ提供されている。
【0169】
本明細書で具体的に定義されない限り、本明細書で使用されるすべての用語は、本開示の当業者にとってそれらの用語が意味するのと同じ意味を有する。
【0170】
いくつかの方法は、Sambrook et al.,Molecular Cloning:A Laboratory Manual,2nd ed.,Cold Spring Harbor Press,Plainview,N.Y.(1989);およびAusubel et al.,Current Protocols in Molecular Biology(Supplement 47),John Wiley&Sons,New York(1999)に記載されている。
【0171】
本明細書で明示的に別段の定義がない限り、本明細書で使用される用語は、当業者によって理解されるよりも狭い範囲を有するものと解釈されるべきではない。
【0172】
本明細書で使用される場合、「一塩基多型」(SNP)または「SNP遺伝子座」は、1つの塩基だけが異なる対立遺伝子を有する遺伝子座であり、よりまれな対立遺伝子の集団内での頻度は、少なくとも1%である。
【0173】
本明細書で使用される場合、遺伝子座の「対立遺伝子」は、集団内のその遺伝子座で発生するすべての遺伝的変異体のセットであり、各変異体は単一の「対立遺伝子」である。例えば、SNP遺伝子座には一般に2つの対立遺伝子しかない。
【0174】
本明細書で使用される場合、「変異体」は、試験遺伝子配列と参照遺伝子配列との差異である。変異体は1つの塩基のみが異なる場合もあれば、変異体は複数の塩基が異なる場合がある。変異体は、挿入および欠失も含む。
【0175】
本明細書で使用される場合、第1および第2の変異体が両方とも同じ染色体(母方または父方)DNA鎖上に位置する場合、第1の変異体は第2の変異体に「連結」される。「連結」とは、連結されている2つ以上の変異体の状態を指す。
【0176】
「位置対立遺伝子モデル」は、試験遺伝子座の対立遺伝子とSNP遺伝子座の対立遺伝子との連結を表すモデルである。生殖細胞系では、位置対立遺伝子モデルは通常、試験遺伝子座の父方対立遺伝子とSNP遺伝子座の父方対立遺伝子との間の連結、および試験遺伝子座の母体対立遺伝子とSNP遺伝子座の母体対立遺伝子との連結を説明する。体細胞変異体が試験遺伝子座に存在する場合(すなわち、試験遺伝子座の第3の可能な対立遺伝子)、位置対立遺伝子モデルは、試験遺伝子座のこの第3の対立遺伝子とSNP遺伝子座の母方または父方の対立遺伝子との連結をさらに説明する。
【0177】
本明細書で使用される場合、「変異」は、以下で詳細に説明されるが、一般に、対象の生殖細胞系と比較したときの、体細胞組織における後天的なヌクレオチド変化を指す。「変異負荷」は、以下で詳細に説明されるが、一般に、変異を有する分析された遺伝子座の数または割合を指し、「高変異負荷」または「HML」は、一般に、ある参照もしくは閾値を超える数または割合、あるいはそこから導き出されたスコアを指す。
【0178】
本明細書で使用される場合、「次世代配列決定」または「NGS」は、配列決定プロセスを並列化し、一度に数千または数百万の配列を生成する、様々なハイスループット配列決定プロセスおよびテクノロジーを指す。NGSは通常、次の手順で実行される。まず、DNA配列決定ライブラリを、インビトロでのPCRによるクローン増幅によって生成する。第2に、DNAを合成によって配列決定し、その結果、DNA配列を、サンガー配列決定に典型的な連鎖停止化学によってではなく、相補鎖へのヌクレオチドの付加によって決定する。第3に、空間的に分離し、増幅したDNA鋳型を、通常は、物理的な分離ステップを必要とせずに、大規模並列プロセスにおいて同時に配列決定する。配列決定反応のNGS並列化により、1回の機器の実行で数百メガベース~ギガベースのヌクレオチド配列リードを生成できる。分子の集合体の平均遺伝子型を通常報告するサンガー配列決定などの従来の配列決定技術とは異なり、NGSテクノロジーは通常、低頻度変異体(例えば、核酸分子の不均一な集団において約10%、5%、または1%未満の頻度で存在する変異体)を検出することができるように、多数の個々のDNA断片の配列をデジタルで表にする(配列リードについては以下で詳しく説明する)。「大規模並列」という用語は、NGSによる多くの異なる鋳型分子からの配列情報の同時生成を指すためにも使用できる。
【0179】
NGS戦略には、(i)マイクロ電気泳動法、(ii)ハイブリダイゼーションによる配列決定、(iii)単一分子のリアルタイム観察、および(iv)周期的アレイ配列決定を含むがこれらに限定されない、いくつかの方法を含めることができる。周期的アレイ配列決定とは、鋳型を伸長および画像化ベースのデータ収集の反復サイクルによって、高密度DNAアレイの配列が得られるテクノロジーを指す。市販の周期的アレイ配列決定テクノロジーには、例えば454 Genome Sequencers(Roche Applied Science;Basel)で使用される454配列決定、例えばIllumina Genome Analyzer、Illumina HiSeq、MiSeqおよびNextSeq(カリフォルニア州サンディエゴ)で使用されるSolexaテクノロジー、SOLiDプラットフォーム(Applied Biosystems;カリフォルニア州フォスターシティ)、Polonator(Dover/Harvard)、ならびにHeliScope Single Molecule Sequencerテクノロジー(Helicos;マサチューセッツ州ケンブリッジ)が含まれるが、これらに限定されない。他のNGS方法には、単一分子リアルタイム配列決定(例えば、Pacific Bio)およびイオン半導体配列決定(例えば、Ion Torrent配列決定)が含まれる。NGS配列テクノロジーの詳細な検討については、例えば、Shendure&Ji,Next Generation DNA Sequencing,NAT.BIOTECH.(2008)26:1135-1145を参照のこと。
【0180】
本明細書で使用される場合、「患者」または「個体」または「対象」は、ヒトを指す。患者、個体または対象は、男性または女性である可能性がある。患者、個体または対象は、疾患に対する治療的介入をすでに受けた、または受けているヒトである可能性がある。患者、個体、または対象は、以前に疾患と診断されたことがないヒトでもあり得る。
【0181】
本明細書で使用される場合、「サンプル」または「生物学的サンプル」は、生検または組織サンプル、凍結サンプル、血液および血液画分または生成物(例えば、血清、血小板、赤血球など)、腫瘍サンプル、痰、気管支肺胞洗浄液、培養細胞(例えば、初代培養物)、外植片、ならびに形質転換細胞、便、尿などのサンプルを指す。
【0182】
「生検」とは、診断または予後評価のために組織サンプルを除去するプロセス、および組織標本自体を指す。様々な生検技術を本開示の方法に適用することができる。適用される生検技術は、要因の中でもとりわけ、評価される組織の種類(例えば、肺など)、腫瘍のサイズおよび種類に依存する。代表的な生検技術には、切除生検、切開生検、針生検、外科生検、および骨髄生検が含まれるが、これらに限定されない。「切除生検」とは、周囲の正常組織のわずかな縁を伴う腫瘍塊全体の除去を指す。「切開生検」は、腫瘍の断面直径を含む組織のくさびの除去を指す。内視鏡検査または透視検査によって行われる診断には、「コア針生検」、または一般に標的組織内から細胞の懸濁液を得る「細針吸引生検」が必要になる可能性がある。
【0183】
「体液」には、哺乳動物の体から得られた、処理済み(例えば、血清)または未処理のすべての体液が含まれ、例えば、血液、血漿、尿、リンパ、胃液、胆汁、血清、唾液、汗、ならびに脊髄液および脳液などである。生物学的サンプルは通常、対象から得られる。
【0184】
本明細書で使用される場合、「癌細胞サンプル」または「腫瘍サンプル」は、少なくとも1つの癌細胞またはそれに由来する生体分子のいずれかを含む標本を意味する。癌の例には、肺癌(例えば、非小細胞肺癌(NSCLC))、卵巣癌、結腸直腸癌、乳癌、子宮内膜癌、および前立腺癌が含まれる。そのような生体分子の非限定的な例には、核酸およびタンパク質が含まれる。癌細胞サンプルに「由来する」生体分子には、サンプル内に位置するか、サンプルから抽出された分子、およびそのような生体分子の人工的に合成されたコピーまたはバージョンが含まれる。そのような人工的に合成された分子の1つの例示的な非限定例としては、サンプルからの核酸がPCR鋳型として機能するPCR増幅産物が挙げられる。癌細胞サンプル「の核酸」には、癌細胞内に位置する核酸または癌細胞に由来する生体分子が含まれる。
【0185】
本明細書で使用される場合、「スコア」は、対象の状態もしくはサンプル中の変異負荷の程度の変数もしくは特徴の定量的測定値を提供するため、および/または識別、区別、もしくはその他の方法で変異の負荷を特徴付けるように選択される値または一組の値を意味する。スコアを構成する値(複数可)は、例えば、対象から得られた1つ以上のサンプル構成要素の測定量をもたらす定量的データに基づくことができる。特定の実施形態では、スコアは、単一の構成要素、パラメータ、または評価から導出することができ、他の実施形態では、スコアは、複数の構成要素、パラメータ、および/もしくは評価から導出することができる。スコアは、解釈関数、例えば、様々な統計アルゴリズムのうちのいずれかを使用して特定の予測モデルから導出された解釈関数に基づくか、それから導出することもできる。「スコアの変化」は、例えば、ある時点から次の時点へのスコアの絶対的な変化、またはスコアのパーセント変化、または単位時間あたりのスコアの変化(すなわち、スコアの変化率)を指すことができる。
【0186】
本明細書で使用される場合、「試験遺伝子座」は、配列または遺伝子型が本開示に従って評価されるゲノム遺伝子座(例えば、染色体内の特定の位置にある単一ヌクレオチド)であり、(例えば、参照遺伝子型または配列と比較したときの)そのような遺伝子座での変異は、変異負荷の測定において潜在的にカウントされる。
【0187】
本明細書で使用される場合、「治療」または「療法」または「治療計画」という用語は、生物学的、化学的、物理的、もしくはそれらの組み合わせを問わず、対象の状態を持続、改良、改善、もしくはその他の方法で変更することを目的とした、対象のすべての臨床的管理および介入を含む。これらの用語は、本明細書では同義語として使用することができる。治療には、予防薬または治療化合物(小分子および生物学的薬剤を含む)の投与、運動療法、理学療法、食生活の改善および/または食品による栄養補充、肥満症の外科的介入、治療化合物(処方箋ありまたは処方箋なし(over-the-counter))の投与、ならびにHMLを特徴とする疾患の予防、疾患の発症の遅延、または疾患を改善するのに有効なその他の治療法が含まれるが、これらに限定されない。「治療に対する応答」は、上記の治療のうちのいずれか(生物学的、化学的、物理的、または前述のものの組み合わせであるかどうかにかかわらない)に対する対象の応答を含む。「治療方針」は、特定の治療または療法計画の投与量、期間、範囲などに関連する。本明細書で使用される初期の療法計画は、第一線治療である。
【0188】
本開示の追加の態様 この開示の態様には、以下が含まれる。
【0189】
サンプル中の試験遺伝子座における体細胞変異体の存在を検出するための方法であって、サンプルからの核酸の第1の連続鎖上で一塩基多型(「SNP」)遺伝子座における第1の対立遺伝子および試験遺伝子座における第2の対立遺伝子を検出することと、サンプルからの核酸の第2の連続鎖上で、SNP遺伝子座における第3の対立遺伝子および試験遺伝子座における第4の対立遺伝子を検出することと、サンプルからの核酸の第3の連続鎖上で、SNP遺伝子座の第3の対立遺伝子および試験遺伝子座における第5の対立遺伝子を検出することと、を含む方法であって、第1の対立遺伝子および第3の対立遺伝子が、異なる対立遺伝子であり、第4の対立遺伝子および第5の対立遺伝子が、異なる対立遺伝子である、方法。
【0190】
いくつかの実施形態において、第2の対立遺伝子および第4の対立遺伝子は、同じまたは異なる対立遺伝子である。核酸は、デオキシリボ核酸(DNA)であり得る。1つ以上の対立遺伝子は、配列決定によって検出され得る。1つ以上の対立遺伝子は、ハイブリダイゼーションによって検出され得る。1つ以上の対立遺伝子は、ポリメラーゼ連結反応(PCR)増幅によって検出され得る。サンプルは、試験遺伝子座に体細胞変異を有する細胞、および試験遺伝子座に体細胞変異を有さない細胞を含み得る。サンプルは、組織サンプルであり得る。サンプルは、腫瘍サンプルであり得る。
【0191】
サンプル中の体細胞変異体を検出するための方法であって、個体がヘテロ接合であるSNP遺伝子座を検出することと、SNP遺伝子座を取り囲む連続領域内の試験位置で、SNP遺伝子座の第1のSNP対立遺伝子に連結された第1の試験対立遺伝子を検出することと、SNP遺伝子座を取り囲む連続領域内の試験位置で、SNP遺伝子座の第1のSNP対立遺伝子に連結された第2の試験対立遺伝子を検出することと、を含む方法であって、第1の試験対立遺伝子および第2の試験対立遺伝子が、異なる対立遺伝子である、方法。いくつかの実施形態では、SNP遺伝子座を取り囲む連続領域内の試験位置で、SNP遺伝子座の第2のSNP対立遺伝子に連結された第3の試験対立遺伝子を特定することをさらに含み、第1のSNP対立遺伝子および第2のSNP対立遺伝子は、異なる対立遺伝子である。第1の試験対立遺伝子および第3の試験対立遺伝子は、同じ対立遺伝子であり得る。第1の試験対立遺伝子および第3の試験対立遺伝子は、異なる対立遺伝子であり得る。1つ以上の対立遺伝子は、配列決定、ハイブリダイゼーション、またはポリメラーゼ連結反応増幅によって検出され得る。サンプルは、試験遺伝子座に体細胞変異を有する細胞、および試験遺伝子座に体細胞変異を有さない細胞を含み得る。サンプルは、組織サンプルであり得る。サンプルは、腫瘍サンプルであり得る。
【0192】
サンプル中の体細胞変異体の頻度を測定するための方法であって、サンプルがヘテロ接合である複数のSNP遺伝子座を検出することと、パートaで特定された各SNP遺伝子座を取り囲む連続領域内で、複数の試験遺伝子座をアッセイして、複数の試験遺伝子座のそれぞれについて各SNP対立遺伝子に連結された多数の試験対立遺伝子を検出することと、アッセイされた試験遺伝子座の総数に対して正規化された、SNP対立遺伝子に連結された試験対立遺伝子の検出数が、1より大きい試験遺伝子座の数を含む、変異頻度を決定することと、を含む、方法。1つ以上の対立遺伝子は、配列決定によって、ハイブリダイゼーションによって、またはポリメラーゼ連結反応増幅によって検出され得る。サンプルは、試験遺伝子座に体細胞変異を有する細胞、および試験遺伝子座に体細胞変異を有さない細胞を含み得る。サンプルは、組織サンプルまたは腫瘍サンプルであり得る。
【0193】
所定のSNPのセットのそれぞれを取り囲む領域内の各位置の位置対立遺伝子モデル数を測定するための複数のセンサーを含む、体細胞変異を検出するためのシステム。
【0194】
芽根季チェックポイント阻害剤で個体を治療する方法であって、個体がヘテロ接合である複数のSNP遺伝子座を検出することと、パートaで特定された各SNP遺伝子座を取り囲む連続領域内で、複数の試験遺伝子座をアッセイして、複数の試験遺伝子座のそれぞれについて各SNP対立遺伝子に連結された多数の試験対立遺伝子を検出することと、アッセイされた試験遺伝子座の総数に対して正規化された、SNP対立遺伝子に連結された試験対立遺伝子の検出数が、1より大きい試験遺伝子座の数を含む、変異頻度を決定することと、変異頻度が所定の閾値を超える場合に、治療有効量の免疫チェックポイント阻害剤を個体に投与することと、を含む、方法。1つ以上の対立遺伝子は、配列決定によって、ハイブリダイゼーションによって、またはポリメラーゼ連結反応増幅によって検出され得る。サンプルは、試験遺伝子座に体細胞変異を有する細胞、および試験遺伝子座に体細胞変異を有さない細胞を含み得る。サンプルは、組織サンプルまたは腫瘍サンプルであり得る。
【0195】
本明細書で具体的に言及されているすべての刊行物、特許および文献は、すべての目的のためにその全体が参照により本明細書に組み込まれる。
【0196】
別段の定義がない限り、本明細書で使用されるすべての技術用語および科学用語は、本発明が関係する当業者によって一般に理解されるのと同じ意味を有する。本明細書に記載されているものと類似または同等の方法および材料を本発明の実施または試験に使用することができるが、適切な方法および材料を以下に説明する。さらに、本明細書の材料、方法、および実施例は、例示にすぎず、限定することを意図するものではない。
【0197】
前述の開示は、理解を明確にする目的で図解および実施例としていくらか詳細に説明されてきたが、当業者には、本発明および添付する請求項の範囲内で様々な変更および修正を実施できることが理解される。
【実施例
【0198】
実施例1:図4は、核酸配列決定によって遺伝子変異量を検出および評価するための方法の結果を示す。ヘテロ接合SNP(Hom/Het)の近くにあるホモ接合体細胞変異体を含むモデルについて、配列リードスタックを、示されているように参照ゲノム(WT)にマッピングした。対立遺伝子ペアGA(55)、AA(32)、およびAG(23)の検出を示すカウントマトリックスをアセンブルした。3番目に大きなカウントAG(23)の出現は、癌細胞における体細胞変異から生じた。
【0199】
対立遺伝子比率は、VAR位置にある様々な対立遺伝子の比率として計算した。このHom-Hetの例では、対立遺伝子比率=(23+1)/(32+55+23+1)*100=21.6%である。
【0200】
SNPは、対立遺伝子比率(32+23)/{(32+23)+(55+1)}×100=49.5%(A/G 55:56)のヘテロ接合体であった。
【0201】
図4に示すように、エラー率Eは約1.0であった。したがって、Sの値は約
S=((23×23/(23+55))+(23-E)(23-E)/E)/2×10=2679である。Eの値は、すべての位置の平均として計算し、通常は約1.0以下であった。
【0202】
この位置の例の場合、サンプルは図6の306926であり、TMBが高かった。
【0203】
実施例2:図5は、核酸配列決定によって遺伝子変異量を検出および評価するための方法の結果を示す。
【0204】
この特定の例では、リード長は100bpであり、総SNPウィンドウは100*2-1=199bpであった。この位置の例の場合、サンプルは図6の306926であり、TMBが高かった。
【0205】
ヘテロ接合SNP(Het/Het)の近くに位置するヘテロ接合体細胞変異体について、対立遺伝子CG(39)、GT(34)、およびGG(7)の検出を示すカウントマトリックスをアセンブルした。3番目に大きなカウントGG(7)の出現は、癌細胞における体細胞変異から生じた。
【0206】
対立遺伝子比率は、VAR位置にある様々な対立遺伝子の比率として計算した。このHet-Hetの例では、対立遺伝子比率=39/(34+7+39)*100=48.8%である。
【0207】
SNPは、T/Gとしてヘテロ接合であった。
【0208】
実施例3:図6は、結腸癌サンプルからの配列決定データを示す。各曲線は、対立遺伝子比率%(X軸)によって変異体位置(Y軸)の数を表す。1つのサンプルは、高TMBサンプルを表す大きなピークを示した。対立遺伝子比率の値が10%未満と非常に低い左側の高いピークは、無視される配列決定エラーを反映している。TMBスコアをカウントするために、TMBカウントを、対立遺伝子比率が15%~65%の範囲にある曲線下面積として採用した。図6のデータを表2に示す。表2の最後の2列は、認定された位置の総数(絶対値)および1Mbあたりの正規化されたTMB値を示している。サンプル306926のTMBは1Mbあたり417で、サンプル306932のTMBは1Mbあたり32.7である。
【表2】
【0209】
一般に、Mbあたり10個の変異を有するTMBは比較的高く、ゲノム全体に外挿すると、合計32,000を超える体細胞変異に相当する。
【0210】
図6を参照して、変異スコアが30以上の位置からTMBを計算し、対立遺伝子比率が15~65%の範囲内でカウントし、認定された位置の総数(Mb)によって正規化した。図6を参照すると、データ曲線は、必要なスコアを有する変異体位置(Y軸)の数を示した。
【0211】
実施例4:図7は、生殖細胞系コンパレータサンプルまたは生殖細胞系フィルタリングからデータを差し引くことを含む従来の方法と比較した、核酸配列決定によって結腸および乳癌サンプルにおける遺伝子変異量を検出および評価するための本発明のSNPベースの方法を用いて得られたデータのプロットを示す。図7からのデータを表3に要約する。
【0212】
結腸癌サンプルは、Colon Micro-Satelliteであった。乳癌サンプルは、プラチナ感受性の乳房腫瘍である44人の患者サンプルのセットであった。
【表3-1】
【表3-2】
【0213】
腫瘍サンプルのみを使用し、第2の生殖細胞系コンパレータサンプルを使用しない、本発明の直接SNPベースの方法(図7、黒丸)を使用して、従来の方法よりも驚くほど優れた遺伝子変異量の評価が得られた。本発明のSNPベースの方法(図7、黒丸)の感度は、従来の方法よりも驚くほど増加した。
【0214】
図7において、同じx軸位置での白丸および黒丸は、生殖細胞系フィルタリング(図7、白丸)と比較したときの、本発明の方法(図7、黒丸)による同じ患者サンプルでの測定値を表す。
【0215】
図7において、X軸は、各患者の血液ベースの生殖細胞系参照サンプルを使用して生殖細胞変異体が差し引かれた全エクソーム配列決定によって評価されたTMB値を表す。本発明の方法(図7、黒丸)および生殖細胞系フィルタリングの方法(図7、白丸)と同じサンプルを全エクソーム配列決定に使用した。この方法は、血液ベースのサブトラクションが生殖細胞系変異を除去する従来の「ゴールドスタンダード」と見なされている。
【0216】
図7において、Y軸は、従来の「ゴールドスタンダード」アプローチと比較して、本発明の方法(図7、黒丸)および生殖細胞系フィルタリングの方法(図7、白丸)がどのように行われるかを示す。Y軸の値は、HRDアッセイを使用して得られたデータから決定した。
【0217】
より具体的には、本発明のSNPベースの方法(図7、黒丸)は、既知の生殖細胞変異体のデータベースを使用して遺伝子変異量を評価し、生殖細胞系変異バックグラウンドを除去することを試みるべく一般的な変異体をフィルタリングするための核酸配列決定の方法よりも驚くほど正確であった(図7、白丸)。既知の生殖細胞変異体のデータベースを使用する核酸配列決定および生殖細胞系バックグラウンドの除去を試みるための一般的な変異体のフィルタリング(図7、白丸)によって遺伝子変異量を検出および評価するこの従来の方法によって得られた遺伝子変異量レベルは不正確であった。したがって、本発明の独自の直接的なSNPベースの方法(図7、黒丸)の精度および感度は、生殖細胞系量を差し引くことを試みる方法(図7、白丸)よりも驚くほど増大し、予想外に有利であった。
【0218】
さらに、本発明の直接的なSNPベースの方法は、Mbあたり0.1個の変異~Mbあたり100個の変異(1000倍の増加)の広範な変異頻度にわたって生殖細胞系サブトラクションを用いて実行される従来の全エクソーム配列決定よりも驚くほど優れていた。この理由は、本発明のSNPベースの方法が、生殖細胞系サブトラクションサンプルを必要とせず、感度が改善されたからである。より具体的には、本発明のSNPベースの方法(図7、黒丸)は、生殖細胞系量を差し引くために、対になった腫瘍および生殖細胞系コンパレータサンプルを利用せず、必要ともしなかった。本発明のSNPベースの方法(図7、黒丸)は、腫瘍サンプルのみを利用した。腫瘍サンプルのみを使用する本発明のSNPベースの方法は、驚くべきことに、生殖細胞系量から体細胞変異を検出、特定、および分離した。
【0219】
より具体的には、図7は、本発明のSNPベースの方法(図7、黒丸)により、生殖細胞系フィルタリング(図7、白丸)よりも全エクソーム配列決定(x軸として表される)に対してより一致した結果が得られたことを示す。図7に示されるように、生殖細胞系フィルタリングの方法(図7、白丸)は、メガベースあたり約10のTMB、またはメガベースあたり約20のTMBで不正確であった(線から逸脱した)。したがって、生殖細胞系フィルタリングでは、メガベースあたり約10未満、またはメガベースあたり約20未満のTMB値を正確に評価することはできない。
【0220】
実施例5:体細胞変異を直接検出し、生殖細胞系量を差し引くためのステップを行わずに、癌を有する対象からの第1の単一サンプルのみを使用して遺伝子変異量を評価するための独自のアルゴリズムを使用する本発明の方法を、生殖細胞系量を差し引くために、対になった腫瘍および生殖細胞系コンパレータサンプルを使用した全エクソーム配列決定(WES)の方法と比較した。本発明の方法を、生殖細胞系コンパレータのサブトラクションを行うMYCHOICE HRD-PLUS法とさらに比較した。
【0221】
WES法およびMYCHOICE HRD-PLUS法のそれぞれを、44個の乳房腫瘍および12個の結腸腫瘍からの一致した腫瘍DNAおよび正常DNAに対して実行した。MYCHOICE HRD-PLUSアッセイは、相同組換え欠損分析と、108遺伝子の再配列決定およびMSI分析とを組み合わせたものである。
【0222】
1つの比較として、ペアのサンプル内のすべての変異体を特定し、生殖細胞変異体を差し引くことにより、WESからTMB測定値を計算した。
【0223】
別の比較のために、MYCHOICE HRD-PLUSを使用した。このアッセイは、ゲノム全体に分布する約27,000個のSNPを対象としている。約100bpの配列リードを、各SNPの周囲に±400塩基のウィンドウがあり、最大7つのミスマッチがあるSNPセグメントのセットにマッピングした。
【0224】
マップされた配列にいくつかのエラーフィルターを適用して、変異コールの潜在的なあいまいさを減らした。
複数のマップ位置を有するリードは無視した。
リード末端は配列決定エラーが発生しやすいため、各リードの1~10および86を超える塩基は無視した。
同じインサートのフォワード(F)リードおよびリバース(R)リードの両方をマッピングした場合、それらのマップ位置は、50~500bpのインサートサイズに対応している必要がある。
FリードまたはRリードのいずれかが、SNP位置と重複する必要がある。
FリードおよびRリードが重複している場合、それらのコールを組み合わせた。この場合、SNPコールは同じである必要がある。
異なる塩基コールと重複位置は、無視する(特定可能な配列決定エラー)。
【0225】
MYCHOICE HRD-PLUSデータを2通りの方法で使用してTMB値を計算した。まず、生殖細胞系量を差し引く。この方法では、各SNPに隣接する400bpの配列が観察された。これらの配列領域内で変異体を特定し、ペアになったサンプルを使用して生殖細胞系サブトラクションを実行した。
【0226】
第2の実験では、癌を有する対象からの第1の単一サンプルおよび生殖細胞系サブトラクションを必要としない本発明の独自のアルゴリズムのみを使用して、MYCHOICE HRD-PLUSデータについてTMB値を計算した。
【0227】
2番目の実験では、変異体およびSNPの両方にまたがる配列リードのみをカウントマトリックスのアセンブリに含めた。SNPの対立遺伝子頻度を変異体と比較して、変異体が生殖細胞系であるか体細胞系であるかを決定した。生殖細胞系サブトラクションは使用しなかった。
【0228】
この2番目の実験では、残りすべての位置について、カウントマトリックスを計算した。ここで、各要素C(X1,X2)はマッピングされたリードの数であって、非SNPコールX1=(T、C、G、またはA)、SNPコールX2=(T、C、G、またはA)であった。このマトリックスの2つの最大カウントであるC(X,P)≧C(Y、Q)は、4つの位置の対立遺伝子条件のうちの1つに起因した。
HomHom:C(Y,Q)≦3は、1つの有意なカウントC(X,P)のみを残す。これは、非SNPおよびSNPの両方の位置がホモ接合であることを意味する。
HetHom:X≠YおよびP=Q、すなわち、非SNP位置はヘテロ接合であり、SNP位置はホモ接合であった。
HomHet:X=YおよびP≠Q、すなわち、非SNP位置はホモ接合であり、SNP位置はヘテロ接合であった。
HetHet:X≠YおよびP≠Q、すなわち、非SNPおよびSNPの両方の位置は、ヘテロ接合であった。
【0229】
ヘテロ接合SNP位置を有するHomHetおよびHetHet条件を使用して、リードカウントを癌細胞および非癌細胞から区別した。これらの条件では、マトリックスの3番目に大きいカウントC(Z,P)またはC(Z,Q)は、癌細胞の体細胞変異に起因する可能性がある。
【0230】
カウントがバックグラウンド配列決定エラー率を大幅に上回っている場合、3番目に大きなカウントを使用して体細胞変異を検出することができる。平均エラー率Eを、上位3つのカウントを除く他のすべてのカウントから計算した。
【0231】
体細胞変異のPhredのような有意性スコアは、自由度1のカイ二乗確率であり、式Iを使用して計算した。
S=(C(Z,P)/(C(Z,P)+C(X,P))+(C(Z,P)-E)/E)/2*10
式I
【0232】
TMBレベルは、式IIに示すように、ヘテロ接合SNP領域{N(HomHet)+N(HetHet)}における位置の総数で正規化された、S>30である位置の数(メガベース)である。
TMB=N(S>30)/(N(HomHet)+N(HetHet))*1000000
式II
【0233】
TMBの計算に使用された配列長の中央値は、WESでは9.7Mb、生殖細胞系サブトラクションを行うMYCHOICE HRD-PLUSでは4.6Mb、生殖細胞系サブトラクションを必要としない本発明の独自のアルゴリズムでは1.9Mbであった。
【0234】
TMBを決定するための3つの異なる方法について結果を比較した。比較は、生殖細胞系サブトラクションを必要としない本発明の独自のアルゴリズムが驚くほど正確なTMB値を提供することを示した。TMBの結果の比較を表4に示す。
【表4】
【0235】
表4の相関係数は、生殖細胞系サブトラクションを必要としない独自のアルゴリズムを使用する本発明の方法が、生殖細胞系サブトラクションを行うWESベースの従来の方法、および生殖細胞系サブトラクションを行うMYCHOICE HRD-PLUSと比較して、驚くほど正確なTMB値を提供したことを示す。
【0236】
したがって、生殖細胞系サブトラクションを必要としない独自のアルゴリズムを使用する本発明の方法は、生殖細胞系コンパレータサンプルを必要とせず、癌細胞および非癌細胞を含む任意のサンプルで実行できるため、予想外に有利である。
【0237】
生殖細胞系サブトラクションを必要としない独自のアルゴリズムを使用する本発明の方法は、評価される各疾患または集団についてTMBレベルの閾値または参照を決定できるため、強力なツールである。
図1
図2
図3
図4
図5
図6
図7