(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024112843
(43)【公開日】2024-08-21
(54)【発明の名称】ゲノム変化を評価するための組成物および方法
(51)【国際特許分類】
C12Q 1/6876 20180101AFI20240814BHJP
C12Q 1/6869 20180101ALI20240814BHJP
【FI】
C12Q1/6876
C12Q1/6869 Z ZNA
C12Q1/6869 Z
C12Q1/6876 ZNA
【審査請求】有
【請求項の数】1
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024076341
(22)【出願日】2024-05-09
(62)【分割の表示】P 2020568719の分割
【原出願日】2019-06-11
(31)【優先権主張番号】62/683,469
(32)【優先日】2018-06-11
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】517192663
【氏名又は名称】ファウンデーション・メディシン・インコーポレイテッド
(74)【代理人】
【識別番号】110002077
【氏名又は名称】園田・小林弁理士法人
(72)【発明者】
【氏名】オットー, ジェフリー アラン
(72)【発明者】
【氏名】クラーク, トラヴィス
(72)【発明者】
【氏名】リプソン, ドロン
(72)【発明者】
【氏名】リーバー, ダニエル
(72)【発明者】
【氏名】ファブリツィオ, デーヴィッド
(57)【要約】 (修正有)
【課題】患者試料からのゲノムまたはエクソームのサブセットを標的とするゲノムプロファイリングを含む新規な手法を提供する。
【解決手段】標的捕捉および配列決定を用いてcfDNAまたはctDNA患者試料中のゲノム変化を評価する組成物および方法が開示される。
【選択図】なし
【特許請求の範囲】
【請求項1】
第1の標的捕捉試薬(R1)および第2の標的捕捉試薬(R2)を含む複数の標的捕捉試薬であって、
R1は、結合対の機能的な第1のメンバーを含むR1、および、場合により、結合対の機能的な第1のメンバーを欠くR1を含み;
R2は、結合対の機能的な第1のメンバーを含むR2、および結合対の機能的な第1のメンバーを欠くR2を含み;
結合対の第1のメンバーは、基質上に配置された結合対の第2のメンバーに結合することができ、
結合対の機能的な第1のメンバーを含むR1の比率は、結合対の機能的な第1のメンバーを含むR2の比率よりも大きい、複数の標的捕捉試薬。
【請求項2】
結合対の機能的な第1のメンバーを含むR1の比率が、結合対の機能的な第1のメンバーを含むR2の比率よりも、少なくとも0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000倍大きい、請求項1に記載の複数の標的捕捉試薬。
【請求項3】
R1の各々が第1の断片/第1の標的捕捉試薬(F1/R1)ハイブリッドを形成することができ、R2の各々が第2の断片/第2の標的捕捉試薬(F2/R2)ハイブリッドを形成することができ、
F1、F2、またはその両方は、表1A~5Aに記載される遺伝子からの対象区間を含む、請求項1または2に記載の複数の標的捕捉試薬。
【請求項4】
F1が、高い配列決定深度事象を含み;
F2が、低い配列決定深度事象を含み、例えば、そのレベルが、1つ以上のバイオマーカー、例えば、腫瘍遺伝子変異量(TMB)、またはマイクロサテライト不安定性(MSI)の決定と関連する、請求項3に記載の複数の標的捕捉試薬。
【請求項5】
第3の標的捕捉試薬(R3)をさらに含み、
R3が、結合対の機能的な第1のメンバーを含むR3、および結合対の機能的な第1のメンバーを欠くR3を含み;
結合対の第1のメンバーが、基質上に配置された結合対の第2のメンバーに結合することができ、
結合対の機能的な第1のメンバーを含むR2の比率は、結合対の機能的な第1のメンバーを含むR3の比率よりも大きい、請求項1から4のいずれか一項に記載の複数の標的捕捉試薬。
【請求項6】
R3の各々が第3の断片/第1の標的捕捉試薬(F3/R3)ハイブリッドを形成することができ、
F3は、表1A~5Aに記載される遺伝子からの対象区間を含む、請求項1から5のいずれか一項に記載の複数の標的捕捉試薬。
【請求項7】
試料を分析する方法であって、
複数の第1の断片/第1の標的捕捉試薬(F1/R1)ハイブリッドを基質と接触させて、F1/R1ハイブリッド/基質複合体を形成すること;および
複数の第2の断片/第2の標的捕捉試薬(F2/R2)ハイブリッドを基質と接触させて、F2/R2ハイブリッド/基質複合体を形成すること
を含み、基質に結合するF1/R1ハイブリッドの比率は、基質に結合するF2/R2ハイブリッドの比率よりも大きく、
それによって試料を分析する、試料を分析する方法。
【請求項8】
F1が、高い配列決定深度事象を含み;
F2が、低い配列決定深度事象を含み、例えば、そのレベルが、1つ以上のバイオマーカー、例えば、腫瘍遺伝子変異量(TMB)、またはマイクロサテライト不安定性(MSI)の決定と関連する、請求項7に記載の方法。
【請求項9】
R1の一部およびR2の一部が結合対の機能的な第1のメンバーを含み、結合対の第1のメンバーが基質上に配置された結合対の第2のメンバーに結合することができる、請求項7または8に記載の方法。
【請求項10】
R1の一部、R2の一部、またはその両方が、結合対の機能的な第1のメンバー、例えば、基質上に配置された結合対の第2のメンバーに結合することができないかまたはそれに対する結合親和性が低下している変化またはブロックされた第1のメンバーを欠く、請求項7から9のいずれか一項に記載の方法。
【請求項11】
R1が、結合対の機能的な第1のメンバーを含むR1、および結合対の機能的な第1のメンバーを欠くR1を含み;
R2が、結合対の機能的な第1のメンバーを含むR2、および結合対の機能的な第1のメンバーを欠くR2を含む、請求項7から10のいずれか一項に記載の方法。
【請求項12】
結合対の機能的な第1のメンバーを含むR1の比率が、結合対の機能的な第1のメンバーを含むR2の比率よりも大きい、請求項7から11のいずれか一項に記載の方法。
【請求項13】
結合対の機能的な第1のメンバーを含むR1の比率が、結合対の機能的な第1のメンバーを含むR2の比率よりも、少なくとも0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000倍大きい、請求項11に記載の方法。
【請求項14】
結合対の機能的な第1のメンバーを含むR1の比率および結合対の機能的な第1のメンバーを含むR2の比率が、F1/R1ハイブリッド/基質複合体およびF2/R2ハイブリッド/基質複合体の形成時に、F1/R1ハイブリッド/基質複合体中のF1の数およびF2/R2ハイブリッド/基質複合体中のF2の数が、以下の関係:
(i)F1の数が、F2の数より大きいかまたはF2の数と実質的に同じである;および/または
(ii)第1の対象区間における変化を含むF1の数が、第2の対象区間における変化を含むF2の数よりも大きいかまたは実質的に同じである
のうちの1つまたは両方を有するようなものである、請求項7から13のいずれか一項に記載の方法。
【請求項15】
F1の数が、F2の数よりも、少なくとも0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000倍大きい、請求項14に記載の方法。
【請求項16】
第1の対象区間における変化を含むF1の数が、第2の対象区間における変化を含むF2の数よりも、少なくとも0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000倍大きい、請求項14または15に記載の方法。
【請求項17】
第1の対象区間、第2の対象区間、またはその両方が、表1A~5Aに記載される遺伝子由来である、請求項14から16のいずれか一項に記載の方法。
【請求項18】
第1の対象区間における変化が、試料中の約0.1%に等しいかまたはそれより大きい(例えば、約0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、または0.9%に等しいかまたはそれより大きい、例えば、約0.1%~0.9%、0.2%~0.8%、0.3%~0.7%、または0.4%~0.6%の)突然変異対立遺伝子頻度で存在する、請求項14から17のいずれか一項に記載の方法。
【請求項19】
第2の対象区間における変化が、試料中の約1%に等しいかまたはそれより大きい(例えば、約2%、3%、4%、5%、6%、7%、8%、または9%に等しいかまたはそれより大きい、例えば、約1%~9%、2%~8%、3%~7%、または4%~6%の)突然変異対立遺伝子頻度で存在する、請求項14から18のいずれか一項に記載の方法。
【請求項20】
F1、F2、またはその両方が、表1A~5Aに記載される遺伝子からの対象区間を含む、請求項7から19のいずれか一項に記載の方法。
【請求項21】
F1における対象区間が第1の深度まで配列決定され、F2における対象区間が第2の深度まで配列決定され、第1の深度が第2の深度よりも、少なくとも1、2、3、4、5、6、7、8、9、または10倍大きい、請求項20に記載の方法。
【請求項22】
F1が、表1A~5Aに記載される遺伝子からの対象区間を含み、対象区間が、変化、例えば、体細胞性変化、例えば、がんにおける機能的変化を含む、請求項14から21のいずれか一項に記載の方法。
【請求項23】
対象区間が、少なくとも約5,000×深度まで配列決定される、請求項17に記載の方法。
【請求項24】
F2が、表1A~5Aに記載される遺伝子からの対象区間を含み、対象区間が、変化、例えば、体細胞性変化を含み、変化の決定が、1つ以上のゲノムシグネチャー、例えば、連続的/複雑なバイオマーカーを評価するために使用される、請求項7から23のいずれか一項に記載の方法。
【請求項25】
対象区間が、例えば、1つ以上のゲノムシグネチャー、例えば、連続的/複雑なバイオマーカーを評価するために、少なくとも約800×であるが約5,000×未満まで配列決定される、請求項24に記載の方法。
【請求項26】
複数の第3の断片/第3の標的捕捉試薬(F3/R3)ハイブリッドを基質とさらに接触させて、F3/R3ハイブリッド/基質複合体を形成する、請求項7から25のいずれか一項に記載の方法。
【請求項27】
R3が、結合対の機能的な第1のメンバーを含むR3、および結合対の機能的な第1のメンバーを欠くR3を含む、請求項25または26に記載の方法。
【請求項28】
結合対の機能的な第1のメンバーを含むR2の比率が、結合対の機能的な第1のメンバーを含むR3の比率よりも大きい、請求項26から27のいずれか一項に記載の方法。
【請求項29】
結合対の機能的な第1のメンバーを含むR2の比率が、結合対の機能的な第1のメンバーを含むR3の比率よりも、少なくとも0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000倍大きい、請求項26から28のいずれかに一項に記載の方法。
【請求項30】
結合対の機能的な第1のメンバーを含むR2の比率および結合対の機能的な第1のメンバーを含むR3の比率が、F2/R2ハイブリッド/基質複合体およびF3/R3ハイブリッド/基質複合体の形成時に、F2/R2ハイブリッド/基質複合体中のF2の数およびF3/R3ハイブリッド/基質複合体中のF3の数が、以下の関係:
(i)F2の数が、F3の数より大きい;および/または
(ii)第2の対象区間における変化を含むF2の数が、第3の対象区間における変化を含むF3の数よりも大きい
のうちの1つまたは両方を有するようなものである、請求項26から29のいずれか一項に記載の方法。
【請求項31】
F2の数が、F3の数よりも、少なくとも0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000倍大きい、請求項30に記載の方法。
【請求項32】
第2の対象区間における変化を含むF2の数が、第3の対象区間における変化を含むF3の数よりも、少なくとも0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000倍大きい、請求項30または31に記載の方法。
【請求項33】
第2の対象区間、第3の対象区間、またはその両方が、表1A~5Aに記載される遺伝子由来である、請求項30から32のいずれか一項に記載の方法。
【請求項34】
F1、F2、またはF3のうちの1つ、2つ、または全てが、表1A~5Aに記載される遺伝子からの対象区間を含む、請求項26から33のいずれか一項に記載の方法。
【請求項35】
F2における対象区間が第2の深度まで配列決定され、F3における対象区間が第3の深度まで配列決定され、第2の深度が第3の深度よりも、少なくとも1、2、3、4、5、6、7、8、9、または10倍大きい、請求項34に記載の方法。
【請求項36】
F3が、表1A~5Aに記載される遺伝子からの対象区間を含み、対象区間が、生殖系列変化、例えば、生殖系列SNPを含む、請求項26から35のいずれか一項に記載の方法。
【請求項37】
対象区間が、少なくとも約100×深度であるが約800×未満まで配列決定される、請求項36に記載の方法。
【請求項38】
対象から試料を提供することをさらに含む、請求項7から37のいずれか一項に記載の方法。
【請求項39】
試料が、DNA、例えば、ゲノムDNA、例えば、無細胞DNA(cfDNA)または循環腫瘍DNA(ctDNA)を含む、請求項7から38のいずれか一項に記載の方法。
【請求項40】
試料が、RNA、例えば、mRNAを含む、請求項7から39のいずれか一項に記載の方法。
【請求項41】
RNAからcDNAを提供することをさらに含む、請求項40に記載の方法。
【請求項42】
試料から核酸を得ること、例えば、単離することをさらに含む、請求項7から41のいずれか一項に記載の方法。
【請求項43】
試料中の核酸を断片化してF1およびF2を提供することをさらに含む、請求項7から42のいずれか一項に記載の方法。
【請求項44】
F1を増幅して複数のF1を提供し、F2を増幅して複数のF2を提供することをさらに含む、請求項7から43のいずれか一項に記載の方法。
【請求項45】
アダプター配列をF1およびF2に付着させて、アダプター化F1(AF1)およびアダプター化F2(AF2)を提供することをさらに含む、請求項7から44のいずれか一項に記載の方法。
【請求項46】
AF1を増幅して複数のAF1を提供し、AF2を増幅して複数のAF2を提供することをさらに含む、請求項7から45のいずれか一項に記載の方法。
【請求項47】
複数のF1をR1と接触させて複数のF1/R1ハイブリッドを提供し、複数のF2をR2と接触させて複数のF2/R2ハイブリッドを提供することをさらに含む、請求項7から46のいずれか一項に記載の方法。
【請求項48】
複数のAF1をR1と接触させて複数のAF1/R1ハイブリッドを提供し、複数のAF2をR2と接触させて複数のAF2/R2ハイブリッドを提供することをさらに含む、請求項7から47のいずれか一項に記載の方法。
【請求項49】
複数のF1/R1ハイブリッドを基質と接触させてF1/R1ハイブリッド/基質複合体を形成することが、複数のAF1/R1ハイブリッドを基質と接触させてAF1/R1ハイブリッド/基質複合体を形成することを含み;
複数のF2/R2ハイブリッドを基質と接触させてF2/R2ハイブリッド/基質複合体を形成することが、複数のAF2/R2ハイブリッドを基質と接触させてAF2/R2ハイブリッド/基質複合体を形成することを含む、請求項7から48のいずれか一項に記載の方法。
【請求項50】
接触が溶液中で起こる、請求項47から49のいずれか一項に記載の方法。
【請求項51】
接触が固体表面上で起こる、請求項47から49のいずれか一項に記載の方法。
【請求項52】
結合対の第1のメンバーがビオチン部分を含み、結合対の第2のメンバーがストレプトアビジンまたはアビジン(または修飾バージョン、例えば、NeutrAvidinもしくはCaptAvidin)部分を含む、請求項8から51のいずれか一項に記載の方法。
【請求項53】
結合対の第1のメンバーがジゴキシゲニン部分を含み、結合対の第2のメンバーが抗ジゴキシゲニン抗体部分を含む、請求項8から51のいずれか一項に記載の方法。
【請求項54】
結合対の第1のメンバーがFITC部分を含み、結合対の第2のメンバーが抗FITC抗体部分を含む、請求項8から51のいずれか一項に記載の方法。
【請求項55】
R1中の結合対の第1のメンバーが、リンカーを介してF1を捕捉する(例えば、ハイブリダイズする)R1中の部分(例えば、ヌクレオチド配列)にカップリングされ、R2中の結合対の第1のメンバーが、リンカーを介してF2を捕捉する(例えば、ハイブリダイズする)R2中の部分(例えば、ヌクレオチド配列)にカップリングされ、
場合により、リンカーは切断可能なリンカーである、請求項8から51のいずれか一項に記載の方法。
【請求項56】
複数のF1/R1ハイブリッド/基質複合体からF1を配列決定し、複数のF2/R2ハイブリッド/基質複合体からF2を配列決定することをさらに含む、請求項7から55のいずれか一項に記載の方法。
【請求項57】
F1が、例えば、F2より、少なくとも1、2、3、4、5、6、7、8、9、または10倍大きい深度まで配列決定される、請求項56に記載の方法。
【請求項58】
試料を分析する方法であって、
a)複数の第1の断片/第1の標的捕捉試薬(F1/R1)ハイブリッドおよび複数の第2の断片/第2の標的捕捉試薬(F2/R2)ハイブリッドを提供することであって、
結合対の機能的な第1のメンバーを含むR1の比率は、結合対の機能的な第1のメンバーを含むR2の比率よりも大きく、
結合対の第1のメンバーは、基質上に配置された結合対の第2のメンバーに結合することができる、ハイブリッドを提供すること;
b)複数のF1/R1ハイブリッドを基質と接触させて、F1/R1ハイブリッド/基質複合体を形成し、複数のF2/R2ハイブリッドを基質と接触させて、F2/R2ハイブリッド/基質複合体を形成することであって、
基質に結合するF1/R1ハイブリッドの比率は、基質に結合するF2/R2ハイブリッドの比率よりも大きい、複合体を形成すること;ならびに
c)複数のF1/R1ハイブリッド/基質複合体からF1を配列決定し、複数のF2/R2ハイブリッド/基質複合体からF2を配列決定すること
を含み、F1はF2より大きな深度まで配列決定され、
それによって試料を分析する、試料を分析する方法。
【請求項59】
F1が、高い配列決定深度事象を含み;
F2が、低い配列決定深度事象を含み、例えば、そのレベルが、1つ以上のバイオマーカー、例えば、腫瘍遺伝子変異量(TMB)、またはマイクロサテライト不安定性(MSI)の決定と関連する、請求項58に記載の方法。
【請求項60】
試料を分析する方法であって、
1)対象からの試料、例えば、ゲノムDNA、例えば、無細胞DNA(cfDNA)または循環腫瘍DNA(ctDNA)を含む試料を提供すること;
2)試料から核酸を得ること、例えば、単離すること;
3)核酸を断片化して、複数の断片(F)を提供すること;
4)アダプター配列を複数の断片(F)に付着させて、複数のアダプター化断片(AF)を提供すること;
5)第1のAF(AF1)を増幅して複数のAF1を提供し、第2のAF(AF2)を増幅して複数のAF2を提供すること;
6)複数のAF1を、各々がAF1にハイブリダイズするヌクレオチド配列を含む第1の標的捕捉試薬(R1)と接触させて、複数のAF1/R1ハイブリッドを提供し、複数のAF2を、各々がAF2にハイブリダイズするヌクレオチド配列を含む第2の標的捕捉試薬(R2)と接触させて、複数のAF2/R2ハイブリッドを提供することであって、
R1の一部およびR2の一部は、結合対の機能的な第1のメンバーを含み、結合対の第1のメンバーは、基質上に配置された結合対の第2のメンバーに結合することができ、
R1の一部、R2の一部、またはその両方は、結合対の機能的な第1のメンバーを欠く、ハイブリッドを提供すること;
7)複数のAF1/R1ハイブリッドを基質と接触させて、AF1/R1ハイブリッド/基質複合体を形成し、複数のAF2/R2ハイブリッドを基質と接触させて、AF2/R2ハイブリッド/基質複合体を形成することであって、
基質に結合するAF1/R1ハイブリッドの比率は、基質に結合するAF2/R2ハイブリッドの比率よりも大きい、複合体を形成すること;ならびに
8)複数のAF1/R1ハイブリッド/基質複合体からのAF1を配列決定し、複数のAF2/R2ハイブリッド/基質複合体からAF2を配列決定すること
を含み、場合により、AF1は、AF2より、例えば、少なくとも1、2、3、4、5、6、7、8、9、または10倍大きな深度まで配列決定され、
それによって試料を分析する、試料を分析する方法。
【請求項61】
F1が、高い配列決定深度事象を含み;
F2が、低い配列決定深度事象を含み、例えば、そのレベルが、1つ以上のバイオマーカー、例えば、腫瘍遺伝子変異量(TMB)、またはマイクロサテライト不安定性(MSI)の決定と関連する、請求項60に記載の方法。
【請求項62】
試料から複数の核酸分子を含むライブラリーを取得することをさらに含む、請求項7から61のいずれか一項に記載の方法。
【請求項63】
ライブラリーを標的捕捉試薬と接触させて、選択された核酸分子を提供することをさらに含み、前記標的捕捉試薬が核酸分子とハイブリダイズし、それによってライブラリーキャッチを提供する、請求項62に記載の方法。
【請求項64】
前記ライブラリーまたはライブラリーキャッチからの腫瘍核酸分子からの変化(例えば、体細胞性変化)を含む対象区間についてのリードを取得することをさらに含み、それによって、例えば、次世代シークエンシング法によって、対象区間についてのリードを取得する、請求項63に記載の方法。
【請求項65】
複数の遺伝子において対象区間についてのリードを取得することを含む、請求項64に記載の方法。
【請求項66】
複数の遺伝子が、突然変異体形態の遺伝子を含み、例えば、突然変異体遺伝子が、細胞分裂、増殖もしくは生存に対する作用と関連するか、またはがんと関連する、請求項65に記載の方法。
【請求項67】
複数の遺伝子が、全エクソンシークエンシング(WES)のために、少なくとも約50以上、約100以上、約150以上、約200以上、約250以上、約300以上、約350以上、約400以上、約450以上、約500以上の遺伝子、もしくは約1,000以上の遺伝子、または全ての遺伝子を含む、請求項65または66に記載の方法。
【請求項68】
複数の遺伝子が、表1A~5Aに記載される遺伝子の少なくとも約50以上、約100以上、約150以上、約200以上、約250以上、約300以上、または全てを含む、請求項64から67のいずれか一項に記載の方法。
【請求項69】
対象区間についてのリードの取得が、表1A~5Aに記載の遺伝子の少なくとも約50以上、約100以上、約150以上、約200以上、約250以上、約300以上、または全てからの対象区間の配列決定を含む、請求項64から68のいずれか一項に記載の方法。
【請求項70】
対象区間が、約100×より大きい、約250×より大きい、約500×より大きい、約800×より大きい、約1,000×より大きい、約2,000×より大きい、約3,000×より大きい、約4,000×より大きい、または約5,000×より大きい平均深度まで配列決定される、請求項64から69のいずれか一項に記載の方法。
【請求項71】
対象区間が、配列決定された遺伝子(例えば、エクソン)の約95%超、約97%超、または約99%超で、約100×より大きい、約250×より大きい、約500×より大きい、約800×より大きい、約1,000×より大きい、約2,000×より大きい、約3,000×より大きい、約4,000×より大きい、または約5,000×より大きい平均深度まで配列決定される、請求項64から70のいずれか一項に記載の方法。
【請求項72】
アラインメント法によって前記リードを整列させることをさらに含む、請求項64から71のいずれか一項に記載の方法。
【請求項73】
ヌクレオチド位置について前記リードからヌクレオチド値を割り当てることをさらに含む、請求項72に記載の方法。
【請求項74】
試料中の1つ以上のゲノムシグネチャー、例えば、連続的/複雑なバイオマーカーを評価することをさらに含む、請求項7から73のいずれか一項に記載の方法。
【請求項75】
試料が血液試料である、請求項74に記載の方法。
【請求項76】
体細胞性変化または生殖系列変化として試料中の変化を特徴づけることをさらに含む、請求項7から75のいずれか一項に記載の方法。
【請求項77】
試料中の変化の接合性を決定することをさらに含む、請求項7から76のいずれか一項に記載の方法。
【請求項78】
試料、または試料の分析に応答して得られた試料に由来する対象を分類することをさらに含む、請求項7から77のいずれか一項に記載の方法。
【請求項79】
報告書、例えば、電子的な、ウェブベースの、または紙による報告書を、得られた試料に由来する対象に、または別の人もしくは団体、介護者、医師、がん専門医、病院、診療所、第三者支払人、保険会社もしくは政府機関に提供することをさらに含む、請求項7から78のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
【0002】
本出願は、2018年6月11日に出願された米国仮出願第62/683,469号の利益を主張する。上記出願の内容は、その全体が参照により本明細書に組み込まれる。
【0003】
配列表
【0004】
本出願は、ASCIIフォーマットで電子的に提出され、参照によりその全体が本明細書に組み込まれる配列表を含有する。前記ASCIIコピーは、2019年6月6日に作成され、F2036-7072WO_SL.txtと命名され、サイズは840バイトである。
【0005】
発明の分野
【0006】
本発明は、ゲノム変化を評価するための組成物および方法に関する。
【背景技術】
【0007】
がん細胞は、がんの発生および進行中に突然変異を蓄積する。これらの突然変異は、DNA修復、複製、もしくは修飾の固有の機能異常、または外因性突然変異原への曝露の結果であり得る。ある種の突然変異は、がん細胞に増殖の利点を与え、がんが生じる組織の微小環境において正に選択される。有利な突然変異の選択は腫瘍形成に寄与するが、腫瘍新生抗原を生成し、その後の免疫認識の可能性もまた突然変異が発生するにつれて増加する可能性がある(GubinおよびSchreiber.Science 350巻:158-9頁、2015年)。したがって、全突然変異量は、全エクソームシークエンシング(WES)によって測定した場合、例えば、がん免疫療法に対する持続的な反応を予測するために、患者の治療決定の指針として用いることができる。しかしながら、ゲノム研究を常套的臨床現場に翻訳することは、全エクソームシークエンシングが広く利用可能ではなく、費用がかかり、時間を要し、技術的に困難であるため、依然として問題がある。
【0008】
したがって、患者試料からのゲノムまたはエクソームのサブセットを標的とするゲノムプロファイリングを含む新規な手法の必要性は依然として存在する。
【発明の概要】
【0009】
一態様では、本発明は、第1の標的捕捉試薬(R1)および第2の標的捕捉試薬(R2)を含む、複数の標的捕捉試薬を特徴とし、
R1は、結合対(例えば、本明細書に記載される結合対)の機能的な第1のメンバーを含むR1、および、場合により、結合対の機能的な第1のメンバーを欠くR1を含み;
R2は、結合対の機能的な第1のメンバーを含むR2、および結合対の機能的な第1のメンバーを欠くR2を含み;
結合対の第1のメンバーは、基質上に配置された結合対の第2のメンバーに結合することができ、
結合対の機能的な第1のメンバーを含むR1の比率は、結合対の機能的な第1のメンバーを含むR2の比率よりも大きい。
【0010】
複数の標的捕捉試薬の一部の実施形態では、結合対の機能的な第1のメンバーを含むR1の比率は、結合対の機能的な第1のメンバーを含むR2の比率よりも、少なくとも0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000倍大きい。
【0011】
複数の標的捕捉試薬の一部の実施形態では、R1の各々は、第1の断片/第1の標的捕捉試薬(F1/R1)ハイブリッドを形成することができ、R2の各々は、第2の断片/第2の標的捕捉試薬(F2/R2)ハイブリッドを形成することができ、F1、F2、またはその両方は、表1A~5Aに記載される遺伝子からの対象区間を含む。
【0012】
一部の実施形態では、F1は、高い配列決定深度事象を含む。
【0013】
一部の実施形態では、F2は、低い配列決定深度事象を含む。他の実施形態では、低い配列決定深度事象のレベルは、1つ以上のバイオマーカー、例えば、腫瘍遺伝子変異量(TMB)、またはマイクロサテライト不安定性(MSI)の決定と関連する。
【0014】
一部の実施形態では、複数の標的捕捉試薬は、第3の標的捕捉試薬(R3)をさらに含み、
R3は、結合対の機能的な第1のメンバーを含むR3、および結合対の機能的な第1のメンバーを欠くR3を含み;
結合対の第1のメンバーは、基質上に配置された結合対の第2のメンバーに結合することができ、
結合対の機能的な第1のメンバーを含むR2の比率は、結合対の機能的な第1のメンバーを含むR3の比率よりも(例えば、少なくとも0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000倍)大きい。
【0015】
複数の標的捕捉試薬の一部の実施形態では、R3の各々は、第3の断片/第1の標的捕捉試薬(F3/R3)ハイブリッドを形成することができ、F3は、表1A~5Aに記載される遺伝子からの対象区間を含む。
【0016】
複数の標的捕捉試薬の一部の実施形態では、結合対(例えば、本明細書に記載される結合対)の機能的な第1のメンバーを含むR1の、結合対の機能的な第1のメンバーを欠くR1に対する比は、約2%~約50%、例えば、約3%~約40%、約4%~約30%、約5%~約25%、約8%~約20%、約10%~約15%、例えば、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約11%、約12%、約13%、約14%、約15%、約16%、約17%、約18%、約19%、約20%、約21%、約22%、約23%、約24%、約25%、約26%、約27%、約28%、約29%、約30%、約31%、約32%、約33%、約34%、約35%、約36%、約37%、約38%、約39%、約40%、約41%、約42%、約43%、約44%、約45%、約46%、約47%、約48%、約49%、または約50%である。
【0017】
複数の標的捕捉試薬の一部の実施形態では、結合対(例えば、本明細書に記載される結合対)の機能的な第1のメンバーを欠くR1の、結合対の機能的な第1のメンバーを含むR1に対する比は、約2%~約50%、例えば、約3%~約40%、約4%~約30%、約5%~約25%、約8%~約20%、約10%~約15%、例えば、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約11%、約12%、約13%、約14%、約15%、約16%、約17%、約18%、約19%、約20%、約21%、約22%、約23%、約24%、約25%、約26%、約27%、約28%、約29%、約30%、約31%、約32%、約33%、約34%、約35%、約36%、約37%、約38%、約39%、約40%、約41%、約42%、約43%、約44%、約45%、約46%、約47%、約48%、約49%、または約50%である。
【0018】
複数の標的捕捉試薬の一部の実施形態では、結合対(例えば、本明細書に記載される結合対)の機能的な第1のメンバーを含むR2の、結合対の機能的な第1のメンバーを欠くR2に対する比は、約2%~約50%、例えば、約3%~約40%、約4%~約30%、約5%~約25%、約8%~約20%、約10%~約15%、例えば、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約11%、約12%、約13%、約14%、約15%、約16%、約17%、約18%、約19%、約20%、約21%、約22%、約23%、約24%、約25%、約26%、約27%、約28%、約29%、約30%、約31%、約32%、約33%、約34%、約35%、約36%、約37%、約38%、約39%、約40%、約41%、約42%、約43%、約44%、約45%、約46%、約47%、約48%、約49%、または約50%である。
【0019】
複数の標的捕捉試薬の一部の実施形態では、結合対(例えば、本明細書に記載される結合対)の機能的な第1のメンバーを欠くR2の、結合対の機能的な第1のメンバーを含むR2に対する比は、約2%~約50%、例えば、約3%~約40%、約4%~約30%、約5%~約25%、約8%~約20%、約10%~約15%、例えば、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約11%、約12%、約13%、約14%、約15%、約16%、約17%、約18%、約19%、約20%、約21%、約22%、約23%、約24%、約25%、約26%、約27%、約28%、約29%、約30%、約31%、約32%、約33%、約34%、約35%、約36%、約37%、約38%、約39%、約40%、約41%、約42%、約43%、約44%、約45%、約46%、約47%、約48%、約49%、または約50%である。
【0020】
複数の標的捕捉試薬の一部の実施形態では、結合対(例えば、本明細書に記載される結合対)の機能的な第1のメンバーを含むR3の、結合対の機能的な第1のメンバーを欠くR3に対する比は、約2%~約50%、例えば、約3%~約40%、約4%~約30%、約5%~約25%、約8%~約20%、約10%~約15%、例えば、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約11%、約12%、約13%、約14%、約15%、約16%、約17%、約18%、約19%、約20%、約21%、約22%、約23%、約24%、約25%、約26%、約27%、約28%、約29%、約30%、約31%、約32%、約33%、約34%、約35%、約36%、約37%、約38%、約39%、約40%、約41%、約42%、約43%、約44%、約45%、約46%、約47%、約48%、約49%、または約50%である。
【0021】
複数の標的捕捉試薬の一部の実施形態では、結合対(例えば、本明細書に記載される結合対)の機能的な第1のメンバーを欠くR3の、結合対の機能的な第1のメンバーを含むR3に対する比は、約2%~約50%、例えば、約3%~約40%、約4%~約30%、約5%~約25%、約8%~約20%、約10%~約15%、例えば、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約11%、約12%、約13%、約14%、約15%、約16%、約17%、約18%、約19%、約20%、約21%、約22%、約23%、約24%、約25%、約26%、約27%、約28%、約29%、約30%、約31%、約32%、約33%、約34%、約35%、約36%、約37%、約38%、約39%、約40%、約41%、約42%、約43%、約44%、約45%、約46%、約47%、約48%、約49%、または約50%である。
【0022】
複数の標的捕捉試薬の実施形態では、A対Bの比は、約2%~約50%、例えば、約3%~約40%、約4%~約30%、約5%~約25%、約8%~約20%、約10%~約15%、例えば、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約11%、約12%、約13%、約14%、約15%、約16%、約17%、約18%、約19%、約20%、約21%、約22%、約23%、約24%、約25%、約26%、約27%、約28%、約29%、約30%、約31%、約32%、約33%、約34%、約35%、約36%、約37%、約38%、約39%、約40%、約41%、約42%、約43%、約44%、約45%、約46%、約47%、約48%、約49%、または約50%であり、
Aは、R1(例えば、結合対の機能的な第1のメンバーを含む)、および結合対(例えば、本明細書に記載される結合対)の機能的な第1のメンバーを欠くR2を含み;
Bは、R1(例えば、結合対の機能的な第1のメンバーを含む)、および結合対の機能的な第1のメンバーを含むR2を含む。
【0023】
複数の標的捕捉試薬の実施形態では、A対Bの比は、約2%~約50%、例えば、約3%~約40%、約4%~約30%、約5%~約25%、約8%~約20%、約10%~約15%、例えば、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約11%、約12%、約13%、約14%、約15%、約16%、約17%、約18%、約19%、約20%、約21%、約22%、約23%、約24%、約25%、約26%、約27%、約28%、約29%、約30%、約31%、約32%、約33%、約34%、約35%、約36%、約37%、約38%、約39%、約40%、約41%、約42%、約43%、約44%、約45%、約46%、約47%、約48%、約49%、または約50%であり、
Aは、結合対の機能的な第1のメンバーを含むR1;および結合対(例えば、本明細書に記載される結合対)の機能的な第1のメンバーを欠くR2を含み;
Bは、結合対の機能的な第1のメンバーを含むR1;および結合対の機能的な第1のメンバーを含むR2を含む。
【0024】
ある実施形態では、複数の標的捕捉試薬の比は、実施例1に記載されるアッセイによって決定される。ある実施形態では、比は、第1の配列決定深度、例えば、本明細書に記載される、高い配列決定深度事象を含む1つ以上のサブゲノム区間の配列決定深度に基づいて決定される。ある実施形態では、比は、第2の配列決定深度、例えば、異なるサブゲノム区間の配列決定深度、例えば、低い配列決定深度事象を含む1つ以上のサブゲノム区間に基づいて決定される。ある実施形態では、比は、第1の配列決定深度、例えば、本明細書に記載されるような、高い配列決定深度事象を含む1つ以上のサブゲノム区間の配列決定深度;および第2の配列決定深度、例えば、異なるサブゲノム区間、例えば、低い配列決定深度事象を含む1つ以上のサブゲノム区間の配列決定深度に基づいて決定される。ある実施形態では、比は、第1の断片(F1)、例えば、高い配列決定深度事象を含むF1の配列決定深度に基づいて決定される。ある実施形態では、比は、第2の断片(F2)、例えば、低い配列決定深度事象を含むF2の配列決定深度に基づいて決定される。ある実施形態では、比は、F1の配列決定深度、例えば、高い配列決定深度事象を含むF1;およびF2の配列決定深度、例えば、低い配列決定深度事象を含むF2に基づいて決定される。
【0025】
ある実施形態では、比は、1つ以上の遺伝子、例えば、予め選択された遺伝子の配列決定深度に基づいて決定される。ある実施形態では、比は、1つ以上の遺伝子またはサブゲノム区間、例えば、予め選択された遺伝子または予め選択されたサブゲノム区間の配列決定深度を決定することによって選択される。ある実施形態では、比は、1つ以上の遺伝子、例えば、予め選択された遺伝子または予め選択されたサブゲノム区間の配列決定深度に基づいて、変化、例えば、増加または減少される。ある実施形態では、比は、1つ以上の遺伝子またはサブゲノム区間の予め選択された配列決定深度を得るために、変化、例えば、増加または減少される。
【0026】
ある実施形態では、複数の標的捕捉試薬は、結合対の機能的な第1のメンバーを含む標的捕捉試薬の、第1の配列決定深度を可能にする結合対の機能的な第1のメンバーを欠く標的捕捉試薬に対する、ある比を有する。ある実施形態では、複数の標的捕捉試薬は、結合対の機能的な第1のメンバーを含む標的捕捉試薬の、第2の配列決定深度を可能にする結合対の機能的な第1のメンバーを欠く標的捕捉試薬に対する、ある比を有する。ある実施形態では、第2の配列決定深度は、第1の配列決定深度以外である。ある実施形態では、第1の配列決定深度は、第2の配列決定深度よりも大きく、例えば、第2の配列決定深度よりも、少なくとも1.1、2、3、4、5、6、7、8、9または10倍大きい。ある実施形態では、第1の配列決定深度は、第2の配列決定深度よりも約1.1~10倍、約1.1~9倍、約1.1~8倍、約1.1~7倍、約1.1~6倍、約1.1~5倍、約1.1~4倍、約1.1~3倍、約1.1~2倍、約2~10倍、約3~10倍、約4~10倍、約5~10倍、約6~10倍、約7~10倍、約8~10倍、または約9~10倍大きい。ある実施形態では、第1の配列決定深度は、第2の配列決定深度よりも約1.1倍、約2倍、約3倍、約4倍、約5倍、約6倍、約7倍、約8倍、約9倍、約10倍大きい。
【0027】
ある実施形態では、第2の配列決定深度は、第1の配列決定深度よりも大きく、例えば、第1の配列決定深度よりも、少なくとも1.1、2、3、4、5、6、7、8、9または10倍大きい。ある実施形態では、第2の配列決定深度は、第1の配列決定深度よりも約1.1~10倍、約1.1~9倍、約1.1~8倍、約1.1~7倍、約1.1~6倍、約1.1~5倍、約1.1~4倍、約1.1~3倍、約1.1~2倍、約2~10倍、約3~10倍、約4~10倍、約5~10倍、約6~10倍、約7~10倍、約8~10倍、または約9~10倍大きい。ある実施形態では、第2の配列決定深度は、第1の配列決定深度よりも約1.1倍、約2倍、約3倍、約4倍、約5倍、約6倍、約7倍、約8倍、約9倍、約10倍大きい。
【0028】
ある実施形態では、第1の配列決定深度、例えば、F1配列決定深度は、例えば、実施例1に記載されているように、狭く高い配列決定深度である。
【0029】
ある実施形態では、第2の配列決定深度、例えば、F2配列決定深度は、例えば、実施例1に記載されるように、広く中程度の配列決定深度である。
【0030】
ある実施形態では、第1の配列決定深度、例えば、F2配列決定深度は、例えば、実施例1に記載されるように、狭く高い配列決定深度である。
【0031】
ある実施形態では、第2の配列決定深度、例えば、F1配列決定深度は、例えば、実施例1に記載されるように、広く中程度の配列決定深度である。
【0032】
ある実施形態では、F1は、高い配列決定深度事象を含む。ある実施形態では、高い配列決定深度事象は、実施可能な事象、例えば、本明細書に記載される実施可能な事象を含む。ある実施形態では、高い配列決定深度事象は、高い配列決定深度、例えば、低い配列決定深度事象よりも、少なくとも1、2、3、4、5、6、7、8、9、または10倍大きい深度まで配列決定される配列(例えば、サブゲノム区間配列)を含む。
【0033】
ある実施形態では、F1は、低い配列決定深度事象を含まない。
【0034】
ある実施形態では、F2は、低い配列決定深度事象を含む。ある実施形態では、低い配列決定深度事象は、ある事象を含む。ある実施形態では、低い配列決定深度事象のレベルは、1つ以上のバイオマーカー、例えば、腫瘍遺伝子変異量(TMB)、マイクロサテライト不安定性(MSI)、またはその両方の決定と関連する。ある実施形態では、低い配列決定深度事象は、実施可能な事象、例えば、本明細書に記載される実施可能な事象を含む。ある実施形態では、低い配列決定深度事象は、実施可能な事象、例えば、本明細書に記載される実施可能な事象を含まない。ある実施形態では、低い配列決定深度事象は、低い配列決定深度、例えば、高い配列決定深度事象より1、2、3、4、5、6、7、8、9、または10倍未満低い深度まで配列決定される配列(例えば、サブゲノム区間配列)を含む。
【0035】
ある実施形態では、F2は、高い配列決定深度事象を含まない。
【0036】
ある実施形態では、複数の標的捕捉試薬、例えば、R1、R2および/またはR3は、限定的ではなく、例えば、約100~2000×の過剰、例えば、モル過剰である。ある実施形態では、複数の標的捕捉試薬は、約100×、200×、300×、400×、500×、600×、700×、800×、900×、1000×、1100×、1200×、1300×1400×、1500×、1600×1700×、1800×、1900×、または2000×の過剰、例えば、モル過剰である。ある実施形態では、複数の標的捕捉試薬は、約100~1900×、100~1800×、100~1700×、100~1600×、100~1500×、100~1400×、100~1300×、100~1200×、100~1100×、100~1000×、100~900×、100~800×、100~700×、100~600×、100~500×、100~400×、100~300×、100~200×、200~2000×、300~2000×、400~2000×、500~2000×、600~2000×、700~2000×、800~2000×、900~2000×、1000~2000×、1100~2000×、1200~2000×、1300~2000×、1400~2000×、1500~2000×、1600~2000×、1700~2000×、1800~2000×、または1900~2000×の過剰、例えば、モル過剰である。
【0037】
複数の標的捕捉試薬の実施形態では、(i)第1のメンバーを含むR2の濃度;(ii)第1のメンバーを含まないR2の濃度;および(iii)F2の濃度は、第1のメンバーを含まないR2の、第1のメンバーを含むR2に対する比率が、第1のメンバーを含むF2-R2の複合体の数に影響を及ぼすようなものである。
【0038】
複数の標的捕捉試薬の実施形態では、(i)第1のメンバーを含むR1の濃度;(ii)第1のメンバーを含まないR1の濃度;および(iii)F1の濃度は、第1のメンバーを含まないR1の、第1のメンバーを含むR1に対する比率が、第1のメンバーを含むF1-R1の複合体の数に影響を及ぼすようなものである。
【0039】
別の態様では、本明細書には、試料を分析する方法が開示され:
複数の第1の断片/第1の標的捕捉試薬(F1/R1)ハイブリッドを基質と接触させて、F1/R1ハイブリッド/基質複合体を形成すること;および
複数の第2の断片/第2の標的捕捉試薬(F2/R2)ハイブリッドを基質と接触させて、F2/R2ハイブリッド/基質複合体を形成すること
を含み、
基質に結合するF1/R1ハイブリッドの比率は、基質に結合するF2/R2ハイブリッドの比率よりも大きく、
それによって試料を分析する。
【0040】
一部の実施形態では、R1の一部およびR2の一部は、結合対の機能的な第1のメンバーを含む。一部の実施形態では、結合対の第1のメンバーは、基質上に配置された結合対の第2のメンバーに結合することができる。
【0041】
一部の実施形態では、R1の一部、R2の一部、またはその両方は、結合対の機能的な第1のメンバー、例えば、基質上に配置された結合対の第2のメンバーに結合することができないかまたはそれに対する結合親和性が低下している変化またはブロックされた第1のメンバーを欠く。
【0042】
一部の実施形態では、R1は、結合対の機能的な第1のメンバーを含むR1、および結合対の機能的な第1のメンバーを欠くR1を含み;R2は、結合対の機能的な第1のメンバーを含むR2、および結合対の機能的な第1のメンバーを欠くR2を含む。
【0043】
一部の実施形態では、結合対の機能的な第1のメンバーを含むR1の比率は、結合対の機能的な第1のメンバーを含むR2の比率よりも大きい。
【0044】
一部の実施形態では、結合対の機能的な第1のメンバーを含むR1の比率は、結合対の機能的な第1のメンバーを含むR2の比率よりも、少なくとも0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000倍大きい。
【0045】
一部の実施形態では、F1は、高い配列決定深度事象を含む。
【0046】
一部の実施形態では、F2は、低い配列決定深度事象を含む。他の実施形態では、低い配列決定深度事象のレベルは、1つ以上のバイオマーカー、例えば、腫瘍遺伝子変異量(TMB)、またはマイクロサテライト不安定性(MSI)の決定と関連する。
【0047】
一部の実施形態では、結合対の機能的な第1のメンバーを含むR1の比率および結合対の機能的な第1のメンバーを含むR2の比率は、F1/R1ハイブリッド/基質複合体およびF2/R2ハイブリッド/基質複合体の形成時に、F1/R1ハイブリッド/基質複合体中のF1の数およびF2/R2ハイブリッド/基質複合体中のF2の数が、以下の関係:
(i)F1の数は、F2の数より大きいかまたは実質的に同じである;および/または
(ii)第1の対象区間における変化を含むF1の数は、第2の対象区間における変化を含むF2の数よりも大きいかまたは実質的に同じである
のうちの1つまたは両方を有するようなものである。
【0048】
一部の実施形態では、F1の数は、F2の数よりも、少なくとも0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000倍大きい
【0049】
一部の実施形態では、第1の対象区間における変化を含むF1の数は、第2の対象区間における変化を含むF2の数よりも、少なくとも0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000倍大きい。
【0050】
一部の実施形態では、第1の対象区間、第2の対象区間、またはその両方は、表1A~5Aに記載される遺伝子由来である。
【0051】
一部の実施形態では、第1の対象区間における変化は、試料中に、約0.01~20%、例えば、約0.02~19%、0.03~18%、0.04~17%、0.05~16%、0.06~15%、0.07~14%、0.08~13%、0.09~12%、0.1~10%、0.2~9%、0.3~8%、0.4~7%、0.5~6%、0.6~5%、0.7~4%、0.8~3%、0.9~2%、1~1.9%、1.1~1.8%、1.2~1.7%、1.3~1.6%、または1.4~1.5%の突然変異対立遺伝子頻度(MAF)で存在する。一部の実施形態では、第1の対象区間は、試料中に、約0.1%に等しいかまたはそれより大きい(例えば、約0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%または0.9%に等しいかまたはそれより大きい、例えば、約0.1%~0.9%、0.2%~0.8%、0.3%~0.7%、または0.4%~0.6%の)突然変異対立遺伝子頻度(MAF)で存在する。一部の実施形態では、第1の対象区間は、試料中に、約1%に等しいかまたはそれより大きい(例えば、約2%、3%、4%、5%、6%、7%、8%、または9%に等しいかもしくはそれより大きい、例えば、約1%~9%、2%~8%、3%~7%、または4%~6%の)突然変異対立遺伝子頻度(MAF)で存在する。
【0052】
一部の実施形態では、F1、F2、またはその両方は、表1A~5Aに記載される遺伝子からの対象区間を含む。
【0053】
一部の実施形態では、F1における対象区間は、第1の深度まで配列決定され、F2における対象区間は、第2の深度まで配列決定され、第1の深度は、第2の深度よりも、少なくとも1、2、3、4、5、6、7、8、9、10倍大きい。
【0054】
一部の実施形態では、F1は、表1A~5Aに記載される遺伝子からの対象区間を含み、本対象区間は、変化、例えば、体細胞性変化、例えば、がんにおける機能的変化を含む。
【0055】
一部の実施形態では、対象区間は、少なくとも約5,000×深度まで配列決定される。
【0056】
一部の実施形態では、F2は、表1A~5Aに記載される遺伝子からの対象区間を含み、本対象区間は、変化、例えば、体細胞性変化を含み、変化の決定は、1つ以上のゲノムシグネチャー、例えば、連続的/複雑なバイオマーカー、例えば、腫瘍遺伝子変異量(TMB)、例えば、血液腫瘍遺伝子変異量(bTMB)を評価するために使用される。
【0057】
一部の実施形態では、対象区間は、例えば、1つ以上のゲノムシグネチャー、例えば、連続的/複雑なバイオマーカー、例えば、腫瘍遺伝子変異量(TMB)、例えば、血液腫瘍遺伝子変異量(bTMB)を評価するために、少なくとも約800×であるが約5,000×未満まで配列決定される。
【0058】
一部の実施形態では、本明細書に開示される方法のいずれかは、複数の第3の断片/第3の標的捕捉試薬(F3/R3)ハイブリッドを基質と接触させて、F3/R3ハイブリッド/基質複合体を形成することをさらに含む。
【0059】
一部の実施形態では、R3は、結合対の機能的な第1のメンバーを含むR3、および結合対の機能的な第1のメンバーを欠くR3を含む。
【0060】
一部の実施形態では、結合対の機能的な第1のメンバーを含むR2の比率は、結合対の機能的な第1のメンバーを含むR3の比率よりも大きい。
【0061】
一部の実施形態では、結合対の機能的な第1のメンバーを含むR2の比率は、結合対の機能的な第1のメンバーを含むR3の比率よりも、少なくとも0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000倍大きい。
【0062】
複数の標的捕捉試薬の一部の実施形態では、結合対(例えば、本明細書に記載される結合対)の機能的な第1のメンバーを含むR1の、結合対の機能的な第1のメンバーを欠くR1に対する比は、約2%~約50%、例えば、約3%~約40%、約4%~約30%、約5%~約25%、約8%~約20%、約10%~約15%、例えば、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約11%、約12%、約13%、約14%、約15%、約16%、約17%、約18%、約19%、約20%、約21%、約22%、約23%、約24%、約25%、約26%、約27%、約28%、約29%、約30%、約31%、約32%、約33%、約34%、約35%、約36%、約37%、約38%、約39%、約40%、約41%、約42%、約43%、約44%、約45%、約46%、約47%、約48%、約49%、または約50%である。
【0063】
複数の標的捕捉試薬の一部の実施形態では、結合対(例えば、本明細書に記載される結合対)の機能的な第1のメンバーを欠くR1の、結合対の機能的な第1のメンバーを含むR1に対する比は、約2%~約50%、例えば、約3%~約40%、約4%~約30%、約5%~約25%、約8%~約20%、約10%~約15%、例えば、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約11%、約12%、約13%、約14%、約15%、約16%、約17%、約18%、約19%、約20%、約21%、約22%、約23%、約24%、約25%、約26%、約27%、約28%、約29%、約30%、約31%、約32%、約33%、約34%、約35%、約36%、約37%、約38%、約39%、約40%、約41%、約42%、約43%、約44%、約45%、約46%、約47%、約48%、約49%、または約50%である。
【0064】
複数の標的捕捉試薬の一部の実施形態では、結合対(例えば、本明細書に記載される結合対)の機能的な第1のメンバーを含むR2の、結合対の機能的な第1のメンバーを欠くR2に対する比は、約2%~約50%、例えば、約3%~約40%、約4%~約30%、約5%~約25%、約8%~約20%、約10%~約15%、例えば、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約11%、約12%、約13%、約14%、約15%、約16%、約17%、約18%、約19%、約20%、約21%、約22%、約23%、約24%、約25%、約26%、約27%、約28%、約29%、約30%、約31%、約32%、約33%、約34%、約35%、約36%、約37%、約38%、約39%、約40%、約41%、約42%、約43%、約44%、約45%、約46%、約47%、約48%、約49%、または約50%である。
【0065】
複数の標的捕捉試薬の一部の実施形態では、結合対(例えば、本明細書に記載される結合対)の機能的な第1のメンバーを欠くR2の、結合対の機能的な第1のメンバーを含むR2に対する比は、約2%~約50%、例えば、約3%~約40%、約4%~約30%、約5%~約25%、約8%~約20%、約10%~約15%、例えば、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約11%、約12%、約13%、約14%、約15%、約16%、約17%、約18%、約19%、約20%、約21%、約22%、約23%、約24%、約25%、約26%、約27%、約28%、約29%、約30%、約31%、約32%、約33%、約34%、約35%、約36%、約37%、約38%、約39%、約40%、約41%、約42%、約43%、約44%、約45%、約46%、約47%、約48%、約49%、または約50%である。
【0066】
複数の標的捕捉試薬の一部の実施形態では、結合対(例えば、本明細書に記載される結合対)の機能的な第1のメンバーを含むR3の、結合対の機能的な第1のメンバーを欠くR3に対する比は、約2%~約50%、例えば、約3%~約40%、約4%~約30%、約5%~約25%、約8%~約20%、約10%~約15%、例えば、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約11%、約12%、約13%、約14%、約15%、約16%、約17%、約18%、約19%、約20%、約21%、約22%、約23%、約24%、約25%、約26%、約27%、約28%、約29%、約30%、約31%、約32%、約33%、約34%、約35%、約36%、約37%、約38%、約39%、約40%、約41%、約42%、約43%、約44%、約45%、約46%、約47%、約48%、約49%、または約50%である。
【0067】
複数の標的捕捉試薬の一部の実施形態では、結合対(例えば、本明細書に記載される結合対)の機能的な第1のメンバーを欠くR3の、結合対の機能的な第1のメンバーを含むR3に対する比は、約2%~約50%、例えば、約3%~約40%、約4%~約30%、約5%~約25%、約8%~約20%、約10%~約15%、例えば、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約11%、約12%、約13%、約14%、約15%、約16%、約17%、約18%、約19%、約20%、約21%、約22%、約23%、約24%、約25%、約26%、約27%、約28%、約29%、約30%、約31%、約32%、約33%、約34%、約35%、約36%、約37%、約38%、約39%、約40%、約41%、約42%、約43%、約44%、約45%、約46%、約47%、約48%、約49%、または約50%である。
【0068】
複数の標的捕捉試薬の実施形態では、A対Bの比は、約2%~約50%、例えば、約3%~約40%、約4%~約30%、約5%~約25%、約8%~約20%、約10%~約15%、例えば、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約11%、約12%、約13%、約14%、約15%、約16%、約17%、約18%、約19%、約20%、約21%、約22%、約23%、約24%、約25%、約26%、約27%、約28%、約29%、約30%、約31%、約32%、約33%、約34%、約35%、約36%、約37%、約38%、約39%、約40%、約41%、約42%、約43%、約44%、約45%、約46%、約47%、約48%、約49%、または約50%であり、
Aは、R1(例えば、結合対の機能的な第1のメンバーを含む)、および結合対(例えば、本明細書に記載される結合対)の機能的な第1のメンバーを欠くR2を含み;
Bは、R1(例えば、結合対の機能的な第1のメンバーを含む)、および結合対の機能的な第1のメンバーを含むR2を含む。
【0069】
複数の標的捕捉試薬の実施形態では、A対Bの比は、約2%~約50%、例えば、約3%~約40%、約4%~約30%、約5%~約25%、約8%~約20%、約10%~約15%、例えば、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約11%、約12%、約13%、約14%、約15%、約16%、約17%、約18%、約19%、約20%、約21%、約22%、約23%、約24%、約25%、約26%、約27%、約28%、約29%、約30%、約31%、約32%、約33%、約34%、約35%、約36%、約37%、約38%、約39%、約40%、約41%、約42%、約43%、約44%、約45%、約46%、約47%、約48%、約49%、または約50%であり、
Aは、結合対の機能的な第1のメンバーを含むR1;および結合対(例えば、本明細書に記載される結合対)の機能的な第1のメンバーを欠くR2を含み;
Bは、結合対の機能的な第1のメンバーを含むR1;および結合対の機能的な第1のメンバーを含むR2を含む。
【0070】
ある実施形態では、複数の標的捕捉試薬の比は、実施例1に記載されるアッセイによって決定される。ある実施形態では、比は、第1の配列決定深度、例えば、本明細書に記載される、高い配列決定深度事象を含む1つ以上のサブゲノム区間の配列決定深度に基づいて決定される。ある実施形態では、比は、第2の配列決定深度、例えば、異なるサブゲノム区間の配列決定深度、例えば、低い配列決定深度事象を含む1つ以上のサブゲノム区間に基づいて決定される。ある実施形態では、比は、第1の配列決定深度、例えば、本明細書に記載されるような、高い配列決定深度事象を含む1つ以上のサブゲノム区間の配列決定深度;および第2の配列決定深度、例えば、異なるサブゲノム区間、例えば、低い配列決定深度事象を含む1つ以上のサブゲノム区間の配列決定深度に基づいて決定される。ある実施形態では、比は、第1の断片(F1)、例えば、高い配列決定深度事象を含むF1の配列決定深度に基づいて決定される。ある実施形態では、比は、第2の断片(F2)、例えば、低い配列決定深度事象を含むF2の配列決定深度に基づいて決定される。ある実施形態では、比は、F1の配列決定深度、例えば、高い配列決定深度事象を含むF1;およびF2の配列決定深度、例えば、低い配列決定深度事象を含むF2に基づいて決定される。
【0071】
ある実施形態では、比は、1つ以上の遺伝子、例えば、予め選択された遺伝子の配列決定深度に基づいて決定される。ある実施形態では、比は、1つ以上の遺伝子またはサブゲノム区間、例えば、予め選択された遺伝子または予め選択されたサブゲノム区間の配列決定深度を決定することによって選択される。ある実施形態では、比は、1つ以上の遺伝子、例えば、予め選択された遺伝子または予め選択されたサブゲノム区間の配列決定深度に基づいて、変化、例えば、増加または減少される。ある実施形態では、比は、1つ以上の遺伝子またはサブゲノム区間の予め選択された配列決定深度を得るために、変化、例えば、増加または減少される。
【0072】
ある実施形態では、複数の標的捕捉試薬は、結合対の機能的な第1のメンバーを含む標的捕捉試薬の、第1の配列決定深度を可能にする結合対の機能的な第1メンバーを欠く標的捕捉試薬に対する、ある比を有する。ある実施形態では、複数の標的捕捉試薬は、結合対の機能的な第1のメンバーを含む標的捕捉試薬の、第2の配列決定深度を可能にする結合対の機能的な第1のメンバーを欠く標的捕捉試薬に対する、ある比を有する。ある実施形態では、第2の配列決定深度は、第1の配列決定深度以外である。ある実施形態では、第1の配列決定深度は、第2の配列決定深度よりも大きく、例えば、第2の配列決定深度よりも、少なくとも1.1、2、3、4、5、6、7、8、9または10倍大きい。ある実施形態では、第1の配列決定深度は、第2の配列決定深度よりも約1.1~10倍、約1.1~9倍、約1.1~8倍、約1.1~7倍、約1.1~6倍、約1.1~5倍、約1.1~4倍、約1.1~3倍、約1.1~2倍、約2~10倍、約3~10倍、約4~10倍、約5~10倍、約6~10倍、約7~10倍、約8~10倍、または約9~10倍大きい。ある実施形態では、第1の配列決定深度は、第2の配列決定深度よりも約1.1倍、約2倍、約3倍、約4倍、約5倍、約6倍、約7倍、約8倍、約9倍、約10倍大きい。
【0073】
ある実施形態では、第2の配列決定深度は、第1の配列決定深度よりも大きく、例えば、第1の配列決定深度よりも、少なくとも1.1、2、3、4、5、6、7、8、9または10倍大きい。ある実施形態では、第2の配列決定深度は、第1の配列決定深度よりも約1.1~10倍、約1.1~9倍、約1.1~8倍、約1.1~7倍、約1.1~6倍、約1.1~5倍、約1.1~4倍、約1.1~3倍、約1.1~2倍、約2~10倍、約3~10倍、約4~10倍、約5~10倍、約6~10倍、約7~10倍、約8~10倍、または約9~10倍大きい。ある実施形態では、第2の配列決定深度は、第1の配列決定深度よりも約1.1倍、約2倍、約3倍、約4倍、約5倍、約6倍、約7倍、約8倍、約9倍、約10倍大きい。
【0074】
ある実施形態では、第1の配列決定深度、例えば、F1配列決定深度は、例えば、実施例1に記載されているように、狭く高い配列決定深度である。
【0075】
ある実施形態では、第2の配列決定深度、例えば、F2配列決定深度は、例えば、実施例1に記載されるように、広く中程度の配列決定深度である。
【0076】
ある実施形態では、第1の配列決定深度、例えば、F2配列決定深度は、例えば、実施例1に記載されるように、狭く高い配列決定深度である。
【0077】
ある実施形態では、第2の配列決定深度、例えば、F1配列決定深度は、例えば、実施例1に記載されるように、広く中程度の配列決定深度である。
【0078】
ある実施形態では、複数の標的捕捉試薬、例えば、R1、R2および/またはR3は、限定的ではなく、例えば、約100~2000×の過剰、例えば、モル過剰である。ある実施形態では、複数の標的捕捉試薬は、約100×、200×、300×、400×、500×、600×、700×、800×、900×、1000×、1100×、1200×、1300×1400×、1500×、1600×1700×、1800×、1900×、または2000×の過剰、例えば、モル過剰である。ある実施形態では、複数の標的捕捉試薬は、約100~1900×、100~1800×、100~1700×、100~1600×、100~1500×、100~1400×、100~1300×、100~1200×、100~1100×、100~1000×、100~900×、100~800×、100~700×、100~600×、100~500×、100~400×、100~300×、100~200×、200~2000×、300~2000×、400~2000×、500~2000×、600~2000×、700~2000×、800~2000×、900~2000×、1000~2000×、1100~2000×、1200~2000×、1300~2000×、1400~2000×、1500~2000×、1600~2000×、1700~2000×、1800~2000×、または1900~2000×の過剰、例えば、モル過剰である。
【0079】
複数の標的捕捉試薬の実施形態では、(i)第1のメンバーを含むR2の濃度;(ii)第1のメンバーを含まないR2の濃度;および(iii)F2の濃度は、第1のメンバーを含まないR2の、第1のメンバーを含むR2に対する比率が、第1のメンバーを含むF2-R2の複合体の数に影響を及ぼすようなものである。
【0080】
複数の標的捕捉試薬の実施形態では、(i)第1のメンバーを含むR1の濃度;(ii)第1のメンバーを含まないR1の濃度;および(iii)F1の濃度は、第1のメンバーを含まないR1の、第1のメンバーを含むR1に対する比率が、第1のメンバーを含むF1-R1の複合体の数に影響を及ぼすようなものである。
【0081】
一部の実施形態では、結合対の機能的な第1のメンバーを含むR2の比率、および結合対の機能的な第1のメンバーを含むR3の比率は、F2/R2ハイブリッド/基質複合体およびF3/R3ハイブリッド/基質複合体の形成時に、F2/R2ハイブリッド/基質複合体中のF2の数、およびF3/R3ハイブリッド/基質複合体中のF3の数が、以下の関係のうち1つまたは両方を有するようなものである:
(i)F2の数がF3の数より大きい;および/または
(ii)第2の対象区間における変化を含むF2の数が、第3の対象区間における変化を含むF3の数よりも大きい。
【0082】
一部の実施形態では、F2の数は、F3の数よりも、少なくとも0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000倍大きい。
【0083】
一部の実施形態では、第2の対象区間における変化を含むF2の数は、第3の対象区間における変化を含むF3の数よりも、少なくとも0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000倍大きい。
【0084】
一部の実施形態では、第2の対象区間、第3の対象区間、またはその両方は、表1A~5Aに記載される遺伝子由来である。
【0085】
一部の実施形態では、F1、F2、またはF3のうちの1つ、2つまたは全ては、表1A~5Aに記載される遺伝子からの対象区間を含む。
【0086】
一部の実施形態では、F2における対象区間は、第2の深度まで配列決定され、F3における対象区間は、第3の深度まで配列決定され、第2の深度は、第3の深度よりも、少なくとも1、2、3、4、5、6、7、8、9、10倍大きい。
【0087】
一部の実施形態では、F3は、表1A~5Aに記載される遺伝子からの対象区間を含み、対象区間は、生殖系列変化、例えば、生殖系列一塩基多型(SNP)を含む。
【0088】
一部の実施形態では、対象区間は、少なくとも約100×深度であるが約800×未満まで配列決定される。
【0089】
一部の実施形態では、本明細書に開示される方法のいずれかは、対象から試料を提供することをさらに含む。一部の実施形態では、試料は、DNA、例えば、ゲノムDNA、例えば、無細胞DNA(cfDNA)または循環腫瘍DNA(ctDNA)を含む。一部の実施形態では、試料は、RNA、例えば、mRNAを含む。一部の実施形態では、本方法は、RNAからcDNAを提供することをさらに含む。
【0090】
一部の実施形態では、本明細書に開示される方法のいずれかは、例えば、試料から核酸を得ること、例えば、単離することをさらに含む。
【0091】
一部の実施形態では、本明細書に開示される方法のいずれかは、試料中の核酸を断片化してF1およびF2を提供することをさらに含む。
【0092】
一部の実施形態では、本明細書に開示される方法のいずれかは、複数のF1を提供するためにF1を増幅し、複数のF2を提供するためにF2を増幅することをさらに含む。
【0093】
一部の実施形態では、本明細書に開示される方法のいずれかは、アダプター配列をF1およびF2に付着させて、アダプター化F1(AF1)およびアダプター化F2(AF2)を提供することをさらに含む。
【0094】
一部の実施形態では、本明細書に開示される方法のいずれかは、AF1を増幅して複数のAF1を提供し、AF2を増幅して複数のAF2を提供することをさらに含む。
【0095】
一部の実施形態では、本明細書に開示される方法のいずれかは、複数のF1をR1と接触させて複数のF1/R1ハイブリッドを提供し、複数のF2をR2と接触させて複数のF2/R2ハイブリッドを提供することをさらに含む。
【0096】
一部の実施形態では、本明細書に開示された方法のいずれかは、複数のAF1をR1と接触させて複数のAF1/R1ハイブリッドを提供し、複数のAF2をR2と接触させて複数のAF2/R2ハイブリッドを提供することをさらに含む。
【0097】
一部の実施形態では、本明細書に開示される方法は、複数のF1/R1ハイブリッドを基質と接触させてF1/R1ハイブリッド/基質複合体を形成することが、複数のAF1/R1ハイブリッドを基質と接触させてAF1/R1ハイブリッド/基質複合体を形成することを含み;複数のF2/R2ハイブリッドを基質と接触させてF2/R2ハイブリッド/基質複合体を形成することが、複数のAF2/R2ハイブリッドを基質と接触させてAF2/R2ハイブリッド/基質複合体を形成することを含む。
【0098】
一部の実施形態では、接触は、溶液中または固体表面上で起こる。
【0099】
本明細書に開示される方法のいずれかの一部の実施形態では、結合対の第1のメンバーはビオチン部分を含み、結合対の第2のメンバーはストレプトアビジンまたはアビジン(または修飾バージョン、例えば、NeutrAvidinもしくはCaptAvidin)部分を含む。
【0100】
本明細書に開示される方法のいずれかの一部の実施形態では、結合対の第1のメンバーはジゴキシゲニン部分を含み、結合対の第2のメンバーは抗ジゴキシゲニン抗体部分を含む。
【0101】
本明細書に開示される方法のいずれかの一部の実施形態では、結合対の第1のメンバーはFITC部分を含み、結合対の第2のメンバーは抗FITC抗体部分を含む。
【0102】
本明細書に開示される方法の一部の実施形態では、R1中の結合対の第1のメンバーは、リンカーを介してF1を捕捉する(例えば、ハイブリダイズする)R1中の部分(例えば、ヌクレオチド配列)にカップリングされる。一部の実施形態では、R2中の結合対の第1のメンバーは、リンカーを介してF2を捕捉する(例えば、ハイブリダイズする)R2中の部分(例えば、ヌクレオチド配列)にカップリングされる。一部の実施形態では、リンカーは切断可能なリンカーである。
【0103】
一部の実施形態では、本明細書に開示される方法のいずれかは、複数のF1/R1ハイブリッド/基質複合体からF1を配列決定し、複数のF2/R2ハイブリッド/基質複合体からF2を配列決定することをさらに含む。一部の実施形態では、F1は、F2より、例えば、少なくとも1、2、3、4、5、6、7、8、9、または10倍大きい深度まで配列決定される。
【0104】
さらに別の態様では、本開示は、試料を分析する方法を提供し、
a)複数の第1の断片/第1の標的捕捉試薬(F1/R1)ハイブリッドおよび複数の第2の断片/第2の標的捕捉試薬(F2/R2)ハイブリッドを提供することであって、
結合対の機能的な第1のメンバーを含むR1の比率は、結合対の機能的な第1のメンバーを含むR2の比率よりも大きく、
結合対の第1のメンバーは、基質上に配置された結合対の第2のメンバーに結合することができる、ハイブリッドを提供すること;
b)複数のF1/R1ハイブリッドを基質と接触させて、F1/R1ハイブリッド/基質複合体を形成し、複数のF2/R2ハイブリッドを基質と接触させて、F2/R2ハイブリッド/基質複合体を形成することであって、
基質に結合するF1/R1ハイブリッドの比率は、基質に結合するF2/R2ハイブリッドの比率よりも大きい、複合体を形成すること;ならびに
c)複数のF1/R1ハイブリッド/基質複合体からF1を配列決定し、複数のF2/R2ハイブリッド/基質複合体からF2を配列決定すること
を含み、F1はF2より大きな深度まで配列決定され、
それによって試料を分析する。
【0105】
ある態様では、本明細書には、試料を分析する方法が開示され、
1)対象からの試料、例えば、ゲノムDNA、例えば、無細胞DNA(cfDNA)または循環腫瘍DNA(ctDNA)を含む試料を提供すること;
2)試料から核酸を得ること、例えば、単離すること;、
3)核酸を断片化して、複数の断片(F)を提供すること;
4)アダプター配列を複数の断片(F)に付着させて、複数のアダプター化断片(AF)を提供すること;
5)第1のAF(AF1)を増幅して複数のAF1を提供し、第2のAF(AF2)を増幅して複数のAF2を提供すること;、
6)複数のAF1を、各々がAF1にハイブリダイズするヌクレオチド配列を含む第1の標的捕捉試薬(R1)と接触させて、複数のAF1/R1ハイブリッドを提供し、複数のAF2を、各々がAF2にハイブリダイズするヌクレオチド配列を含む第2の標的捕捉試薬(R2)と接触させて、複数のAF2/R2ハイブリッドを提供することであって;
R1の一部およびR2の一部は、結合対の機能的な第1のメンバーを含み、結合対の第1のメンバーは、基質上に配置された結合対の第2のメンバーに結合することができ、
R1の一部、R2の一部、またはその両方は、結合対の機能的な第1のメンバーを欠く、ハイブリッドを提供すること;
7)複数のAF1/R1ハイブリッドを基質と接触させて、AF1/R1ハイブリッド/基質複合体を形成し、複数のAF2/R2ハイブリッドを基質と接触させて、AF2/R2ハイブリッド/基質複合体を形成することであって、
基質に結合するAF1/R1ハイブリッドの比率は、基質に結合するAF2/R2ハイブリッドの比率よりも大きい、複合体を形成すること;ならびに
8)複数のAF1/R1ハイブリッド/基質複合体からのAF1を配列決定し、複数のAF2/R2ハイブリッド/基質複合体からAF2を配列決定すること
を含み、場合により、AF1は、AF2より、例えば、少なくとも1、2、3、4、5、6、7、8、9、または10倍大きな深度まで配列決定され、
それによって試料を分析する。
【0106】
一部の実施形態では、本明細書に開示される方法のいずれかは、試料から複数の核酸分子を含むライブラリーを取得することをさらに含む。
【0107】
一部の実施形態では、本明細書に開示される方法のいずれかは、ライブラリーを標的捕捉試薬と接触させて、選択された核酸分子を提供することをさらに含み、前記標的捕捉試薬は核酸分子とハイブリダイズし、それにより、ライブラリーキャッチを提供する。
【0108】
一部の実施形態では、本明細書に開示される方法のいずれかは、前記ライブラリーまたはライブラリーキャッチから、変化(例えば、体細胞性変化)を含む対象区間についてのリードを取得することをさらに含み、それにより、例えば、次世代シークエンシング法によって、対象区間についてのリードを取得する。
【0109】
一部の実施形態では、本方法は、複数の遺伝子において対象区間についてのリードを取得することを含む。
【0110】
一部の実施形態では、複数の遺伝子は、突然変異体形態の遺伝子を含み、例えば、突然変異体遺伝子は、細胞分裂、増殖もしくは生存に対する作用と関連するか、またはがんと関連する。一部の実施形態では、複数の遺伝子は、全エクソンシークエンシング(WES)のために、少なくとも約50以上、約100以上、約150以上、約200以上、約250以上、約300以上、約350以上、約400以上、約450以上、約500以上の遺伝子、もしくは約1,000以上の遺伝子、または全ての遺伝子を含む。
【0111】
一部の実施形態では、複数の遺伝子は、表1A~5Aに記載される遺伝子の少なくとも約50以上、約100以上、約150以上、約200以上、約250以上、約300以上、または全てを含む。
【0112】
一部の実施形態では、対象区間についてのリードを取得することは、表1A~5Aに記載された遺伝子の少なくとも約50以上、約100以上、約150以上、約200以上、約250以上、約300以上、または全てからの対象区間を配列決定することを含む。
【0113】
一部の実施形態では、対象区間は、約100×より大きい、約250×より大きい、約500×より大きい、約800×より大きい、約1,000×より大きい、約2,000×より大きい、約3,000×より大きい、約4,000×より大きい、または約5,000×より大きい平均深度まで配列決定される。
【0114】
一部の実施形態では、対象区間は、配列決定された遺伝子(例えば、エクソン)の約95%超、約97%超、または約99%超で、約100×より大きい、約250×より大きい、約500×より大きい、約800×より大きい、約1,000×より大きい、約2,000×より大きい、約3,000×より大きい、約4,000×より大きい、または約5,000×より大きい平均深度まで配列決定される。
【0115】
一部の実施形態では、本明細書に開示される方法のいずれかは、アライメント法によって前記リードを整列させることをさらに含む。
【0116】
一部の実施形態では、本明細書に開示される方法のいずれかは、ヌクレオチド位置についての前記リードからヌクレオチド値を割り当てることをさらに含む。
【0117】
本明細書に開示される方法のいずれかの一部の実施形態では、1つ以上のゲノムシグネチャー、例えば、試料中の連続的/複雑なバイオマーカー、例えば、腫瘍遺伝子変異量(TMB)、例えば、血液TMB(bTMB)を評価する。
【0118】
一部の実施形態では、試料は血液試料であり、bTMBが評価される。
【0119】
一部の実施形態では、本明細書に開示される方法のいずれかは、体細胞性または生殖系列変化として、試料中の変化を特徴づけることをさらに含む。
【0120】
一部の実施形態では、本明細書に開示される方法のいずれかは、試料中の変化の接合性を決定することをさらに含む。
【0121】
一部の実施形態では、本明細書に開示される方法のいずれかは、試料、または試料の分析に応答して得られた試料に由来する対象を分類することをさらに含む。
【0122】
一部の実施形態では、本明細書に開示される方法のいずれかは、報告書、例えば、電子的な、ウェブベースの、または紙による報告書を、得られた試料に由来する対象に、または別の人もしくは団体、世話人、医師、がん専門医、病院、診療所、第三者支払人、保険会社もしくは政府機関に提供することをさらに含む。
【0123】
本明細書に開示される組成物および方法のいずれかは、以下の実施形態のうちの1つ以上と組み合わせることができる。
【0124】
多重遺伝子解析
【0125】
本明細書に記載される方法および組成物は、例えば、本明細書に記載される遺伝子または遺伝子産物のセットから、対象区間セットを評価するために使用することができる。
【0126】
ある種の実施形態では、遺伝子セットは複数の遺伝子を含み、これは、突然変異体形態で、細胞分裂、増殖、もしくは生存における作用と関連するか、またはがん、例えば、本明細書に記載されるがんと関連する。
【0127】
ある種の実施形態では、遺伝子セットは、少なくとも約50以上、約100以上、約150以上、約200以上、約250以上、約300以上、約350以上、約400以上、約450以上、約500以上、約550以上、約600以上、約650以上、約700以上、約750以上、または約800以上の遺伝子、例えば、本明細書に記載される遺伝子を含む。一部の実施形態では、遺伝子セットは、表1A~5Aに記載される選択された遺伝子の少なくとも約50以上、約100以上、約150以上、約200以上、約250以上、約300以上、または全てを含む。
【0128】
ある種の実施形態では、本方法は、試料から複数の腫瘍核酸分子を含むライブラリーを取得することを含む。一部の実施形態では、本方法は、ライブラリーを標的捕捉試薬と接触させて、選択された腫瘍核酸分子を提供することをさらに含み、前記標的捕捉試薬は、ライブラリーからの腫瘍核酸分子とハイブリダイズし、それにより、ライブラリーキャッチを提供する。一部の実施形態では、本方法は、ライブラリーまたはライブラリーキャッチから、腫瘍核酸分子からの変化(例えば、体細胞性変化)を含む、対象区間についてのリードを取得することをさらに含み、それにより、例えば、次世代シークエンシング法によって、対象区間についてのリードを取得する。ある種の実施形態では、本方法は、アライメント法、例えば、本明細書に記載されるアライメント法によって、対象区間についてのリードを整列させることをさらに含む。一部の実施形態では、本方法は、例えば、本明細書に記載される突然変異コーリング法によって、対象区間についてのリードからヌクレオチド位置についてのヌクレオチド値を割り当てることをさらに含む。
【0129】
一部の実施形態では、本方法は、以下のうちの1つ、2つ、3つ、4つ、または全てを含む:
(a)試料から複数の腫瘍核酸分子を含むライブラリーを取得し;
(b)ライブラリーを複数の標的捕捉試薬と接触させて、選択された腫瘍核酸分子を提供し、前記複数の標的捕捉試薬は、腫瘍核酸分子とハイブリダイズし、それによりライブラリーキャッチを提供し;
(c)前記ライブラリーキャッチから、腫瘍核酸分子からの変化(例えば、体細胞性変化)を含む対象区間についてのリードを獲得し、それにより、例えば、次世代シークエンシング法によって対象区間についてのリードを取得し;
(d)アライメント法、例えば、本明細書に記載されるアライメント法によって前記リードを整列させ;または
(e)例えば、本明細書に記載される突然変異コーリング法によって、ヌクレオチド位置について前記リードからヌクレオチド値を割り当てる。
【0130】
ある種の実施形態では、対象区間についてのリードを取得することは、対象区間を、少なくとも約50以上、約100以上、約150以上、約200以上、約250以上、約300以上、約350以上、約400以上、約450以上、約500以上、約550以上、約600以上、約650以上、約700以上、約750以上、または約800以上の遺伝子から配列決定することを含む。ある種の実施形態では、対象区間についてのリードを取得することは、対象区間を、表1A~5Aに記載される遺伝子の少なくとも約50以上、約100以上、約150以上、約200以上、約250以上、約300以上、または全部から配列決定することを含む。
【0131】
ある種の実施形態では、対象区間についてのリードを取得することは、100×以上の平均深度で配列決定することを含む。ある種の実施形態では、対象区間についてのリードを取得することは、約250×以上の平均深度で配列決定することを含む。他の実施形態では、対象区間についてのリードを取得することは、約500×以上の平均深度で配列決定することを含む。ある種の実施形態では、対象区間についてのリードを取得することは、約800×以上の平均深度で配列決定することを含む。他の実施形態では、対象区間についてのリードを取得することは、約1,000×以上の平均深度で配列決定することを含む。他の実施形態では、対象区間についてのリードを取得することは、約1,500×以上の平均深度で配列決定することを含む。他の実施形態では、対象区間についてのリードを取得することは、約2,000×以上の平均深度で配列決定することを含む。他の実施形態では、対象区間についてのリードを取得することは、約2,500×以上の平均深度で配列決定することを含む。ある種の実施形態では、対象区間についてのリードを取得することは、約3,000×以上の平均深度で配列決定することを含む。ある種の実施形態では、対象区間についてのリードを取得することは、約3,500×以上の平均深度で配列決定することを含む。ある種の実施形態では、対象区間についてのリードを取得することは、約4,000×以上の平均深度で配列決定することを含む。ある種の実施形態では、対象区間についてのリードを取得することは、約4,500×以上の平均深度で配列決定することを含む。ある種の実施形態では、対象区間についてのリードを取得することは、約5,000×以上の平均深度で配列決定することを含む。ある種の実施形態では、対象区間についてのリードを取得することは、約5,500×以上の平均深度で配列決定することを含む。ある種の実施形態では、対象区間についてのリードを取得することは、約6,000×以上の平均深度で配列決定することを含む。
【0132】
一部の実施形態では、対象区間についてのリードを取得することは、配列決定された遺伝子(例えば、エクソン)の約99%を超えて、約100×以上の平均深度で配列決定することを含む。ある種の実施形態では、対象区間についてのリードを取得することは、配列決定された遺伝子(例えば、エクソン)の約99%を超えて、約250×以上の平均深度で配列決定することを含む。他の実施形態では、対象区間についてのリードを取得することは、配列決定された遺伝子(例えば、エクソン)の約95%を超えて、約500×以上の平均深度で配列決定することを含む。他の実施形態では、対象区間についてのリードを取得することは、配列決定された遺伝子(例えば、エクソン)の約95%を超えて、約800×以上の平均深度で配列決定することを含む。他の実施形態では、対象区間についてのリードを取得することは、配列決定された遺伝子(例えば、エクソン)の約90%を超えて、約1,000×以上の平均深度で配列決定することを含む。他の実施形態では、対象区間についてのリードを取得することは、配列決定された遺伝子(例えば、エクソン)の約90%を超えて、約2,000×以上の平均深度で配列決定することを含む。他の実施形態では、対象区間についてのリードを取得することは、配列決定された遺伝子(例えば、エクソン)の約90%を超えて、約3,000×以上の平均深度で配列決定することを含む。他の実施形態では、対象区間についてのリードを取得することは、配列決定された遺伝子(例えば、エクソン)の約90%を超えて、約3,500×以上の平均深度で配列決定することを含む。他の実施形態では、対象区間についてのリードを取得することは、配列決定された遺伝子(例えば、エクソン)の約90%を超えて、約4,000×以上の平均深度で配列決定することを含む。他の実施形態では、対象区間についてのリードを取得することは、配列決定された遺伝子(例えば、エクソン)の約90%を超えて、約4,500×以上の平均深度で配列決定することを含む。他の実施形態では、対象区間についてのリードを取得することは、配列決定された遺伝子(例えば、エクソン)の約90%を超えて、約5,000×以上の平均深度で配列決定することを含む。他の実施形態では、対象区間についてのリードを取得することは、配列決定された遺伝子(例えば、エクソン)の約90%を超えて、約5,500×以上の平均深度で配列決定することを含む。他の実施形態では、対象区間についてのリードを取得することは、配列決定された遺伝子(例えば、エクソン)の約90%を超えて、約6,000×以上の平均深度で配列決定することを含む。ある種の実施形態では、対象区間についてのリードを取得することは、配列決定された遺伝子(例えば、エクソン)の約99%を超えて、約100×以上、約250×以上、約500×以上、約1,000×以上、約1,500×以上、約2,000×以上、約2,500×以上、約3,000×以上、約3,500×以上、約4,000×以上、約4,500×以上、約5,000×以上、約5,500×以上、または約6,000×以上の平均深度で配列決定することを含む。
【0133】
一部の実施形態では、本明細書に記載される対象区間(例えば、コーディング対象区間)セットの配列、例えば、ヌクレオチド配列は、本明細書に記載される方法によって提供される。ある種の実施形態では、配列は、合致した正常対照(例えば、野生型対照)、合致した腫瘍対照(例えば、原発性対転移性)、またはその両方を含む方法を使用することなしに提供される。
【0134】
試料
【0135】
本明細書に記載される方法および組成物は、多数の異なる供給源からの種々の試料タイプにおける対象区間を評価するために使用することができる。
【0136】
一部の実施形態では、試料は、核酸、例えば、DNA、RNA、またはその両方を含む。一部の実施形態では、試料は、腫瘍由来の1つ以上の核酸を含む。ある種の実施形態では、試料は、腫瘍由来の1つ以上の非核酸成分、例えば、細胞、タンパク質、炭水化物、または脂質をさらに含む。ある種の実施形態では、試料は、非腫瘍細胞または組織由来の1つ以上の核酸をさらに含む。ある種の実施形態では、試料は、固形腫瘍、血液がん、またはその転移性形態から取得される。一部の実施形態では、試料は、本明細書に記載されるように、がんを有する対象、またはがんを治療するための療法を受けたことがないか、がんを治療するための療法を受けているか、またはがんを治療するための療法を受けたことがある対象から得られる。
【0137】
一部の実施形態では、試料は、前がん状態の細胞もしくは悪性細胞;固形腫瘍、軟組織腫瘍もしくは転移性病変由来の細胞;外科的切除縁由来の組織もしくは細胞;組織学的に正常な組織;1つ以上の循環性腫瘍細胞(CTC);正常な隣接組織(NAT);血液試料;またはホルムアルデヒドもしくはパラホルムアルデヒド固定したパラフィン包埋(FFPE)試料のうちの1つ以上を含む。ある種の実施形態では、試料は、血液試料である。ある種の実施形態では、試料は、血漿試料である。ある種の実施形態では、試料は、無細胞DNA(cfDNA)を含む。ある種の実施形態では、試料は、循環腫瘍DNA(ctDNA)を含む。ある種の実施形態では、試料は、脳脊髄液(CSF)を含む。ある種の実施形態では、試料は、尿を含む。ある種の実施形態では、試料は、胸水を含む。ある種の実施形態では、試料は、腹水を含む。ある種の実施形態では、試料は、FFPE試料である。ある種の実施形態では、試料は、切除、針生検、細針吸引物、または細胞診スメアを含む。
【0138】
標的捕捉試薬
【0139】
本明細書に記載される組成物および方法は、配列決定される標的核酸分子の選択のための標的捕捉試薬の、例えば、溶液ハイブリダイゼーションにおいて使用するための標的捕捉試薬の適切な選択によって、1つ以上の対象由来の試料からの、例えば、本明細書に記載されるがんからの多数の遺伝子および遺伝子産物の最適化された配列決定を提供する。標的捕捉試薬によって捕捉される標的核酸分子は、典型的には、基質によって回収される。一部の実施形態では、標的捕捉試薬によって捕捉される標的核酸分子は、例えば、基質に結合することによって回収される。一部の実施形態では、各々が異なる標的核酸分子を捕捉する、2つ以上の複数の標的捕捉試薬が使用される。
【0140】
一部の実施形態では、回収効率は、全標的核酸分子に対する、基質によって回収される(例えば、結合された)標的捕捉試薬により捕捉される標的核酸分子の比である。一部の実施形態では、少なくとも2つの複数の標的捕捉試薬は、異なる回収効率を有する。一部の実施形態では、回収効率は、標的対象区間に従って調整される場合、配列決定深度に相関する。一部の実施形態では、回収効率は、標的対象区間に関する配列決定深度に相関する。一部の実施形態では、標的捕捉試薬の回収効率は、機能的結合対を含む標的捕捉試薬の比率と相関される。
【0141】
したがって、一部の実施形態では、本明細書に記載される方法は、選択された核酸分子(例えば、ライブラリーキャッチ)を同定または単離するために、ライブラリーを、異なる回収効率を有する2つ、3つ、またはそれ以上の複数の標的捕捉試薬と接触させることを含む。一部の実施形態では、ライブラリーは、本質的に同時におよび/または同じ試料容器(例えば、チューブ)内で異なる回収効率を有する2つ、3つ、またはそれ以上の複数の標的捕捉試薬と接触される。一部の実施形態では、標的核酸分子は、本質的に同時におよび/または同じ試料容器(例えば、チューブ)内で異なる回収効率を有する2つ、3つ、またはそれ以上の複数の標的捕捉試薬によって捕捉される。一部の実施形態では、異なる回収効率を有する2つ、3つ、またはそれ以上の複数の標的捕捉試薬によって捕捉された標的核酸分子は、実質的に同時におよび/または同じ試料容器(例えば、チューブ)中で基質によって回収される。
【0142】
一部の実施形態では、第1の複数の標的捕捉試薬は、結合対の機能的な第1のメンバーを含む標的捕捉試薬、および結合対の機能的な第1のメンバーを欠く標的捕捉試薬を含み、第2の複数の標的捕捉試薬は、結合対の機能的な第1のメンバーを含む標的捕捉試薬、および結合対の機能的な第1のメンバーを欠く標的捕捉試薬を含み、結合対の機能的な第1のメンバーは、基質上に配置された結合対の第2のメンバーに結合することができる。一部の実施形態では、第1の複数における結合対の機能的な第1のメンバーを含む標的捕捉試薬の比率は、第2の複数における結合対の機能的な第1のメンバーを含む標的捕捉試薬の比率より大きく、その結果、第1の複数の標的捕捉試薬の回収効率は、第2の複数の標的捕捉試薬の回収効率よりも大きい。
【0143】
2つ、3つ、4つ、5つ、またはそれ以上の複数の標的捕捉試薬の任意の組合せを使用することができ、例えば、第1および第2の複数の標的捕捉試薬;第1および第3の複数の標的捕捉試薬;第1および第4の複数の標的捕捉試薬;第1および第5の複数の標的捕捉試薬;第2および第3の複数の標的捕捉試薬;第2および第4の複数の標的捕捉試薬;第2および第5の複数の標的捕捉試薬;第3および第4の複数の標的捕捉試薬;第3および第5の複数の標的捕捉試薬;第4および第5の複数の標的捕捉試薬;第1、第2および第3の複数の標的捕捉試薬;第1、第2および第4の複数の標的捕捉試薬;第1、第2および第5の複数の標的捕捉試薬;第1、第2、第3、および第4の複数の標的捕捉試薬;第1、第2、第3、第4、および第5の複数の標的捕捉試薬の組合せなどが挙げられる。
【0144】
一部の実施形態では、本方法は、
(a)試料からの複数の核酸分子(例えば、標的核酸分子)、例えば、試料、例えば、本明細書に記載される試料からの複数の腫瘍核酸分子を含むライブラリーを取得すること;
(b)選択された核酸分子(例えば、ライブラリーキャッチ)を提供するために、ライブラリーを2つ、3つ、またはそれ以上の複数の標的捕捉試薬と接触させること;
(c)核酸分子、例えば、前記ライブラリーまたはライブラリーキャッチからの腫瘍核酸分子からの対象区間についてのリードを、例えば、配列決定を含む方法によって、例えば、次世代シークエンシング法を用いて取得すること;
(d)アライメント法、例えば、本明細書に記載されるアライメント法によって前記リードを整列させること;ならびに
(e)ヌクレオチド位置についての前記リードからヌクレオチド値を割り当てる(例えば、突然変異を、例えば、ベイズ法または本明細書に記載される方法でコールする)こと
を含む。
【0145】
一部の実施形態では、本方法は、ライブラリーを、少なくとも2つまたは3つの複数の標的捕捉試薬と接触させることを含み、各複数は、(複数における他の標的捕捉試薬とは対照的に)固有の回収効率を有する。例えば、各固有の複数の標的捕捉試薬は、固有の深度の配列決定をもたらすかまたはそれと相関する。
【0146】
ある実施形態では、本方法は、サブゲノム区間に対応する核酸分子、および発現されたサブゲノム区間に対応する核酸分子が各々得られるライブラリーを取得することを含む。ある実施形態では、本方法は、サブゲノム区間に対応する核酸分子が得られる第1のライブラリーを取得し、発現されたサブゲノム区間に対応する核酸分子が得られる第2のライブラリーを取得することを含む。ある実施形態では、標的捕捉試薬は、サブゲノム区間と発現されたサブゲノム区間の両方を含む核酸分子またはライブラリーキャッチを提供するために使用される。ある実施形態では、第1の標的捕捉試薬は、サブゲノム区間を含む核酸分子またはライブラリーキャッチを提供するために使用され、第2の標的捕捉試薬は、発現されたサブゲノム区間を含む核酸分子またはライブラリーキャッチを提供するために使用される。
【0147】
ある実施形態では、第1の複数の標的捕捉試薬の回収効率は、第2の複数の標的捕捉試薬の回収効率と少なくとも2、5、10、25、50、100、200、300、400、500、600、700、800、900、または1,000倍異なる。ある実施形態では、第1および第2の複数の標的捕捉試薬は、少なくとも2、5、10、25、50、100、200、300、400、500、600、700、800、900、または1,000倍異なる配列決定の深度を提供する。
【0148】
一部の実施形態では、本明細書で使用される配列決定深度のレベル(例えば、配列決定深度のX倍レベル)とは、二重リード、例えば、PCR二重リードの検出および除去後のリード数(例えば、固有のリード)を指す。他の実施形態では、二重リードは、例えば、コピー数変化(CNA)の検出をサポートするために評価される。
【0149】
一実施形態では、標的捕捉試薬は、1つ以上の再配列を含む対象区間、例えば、ゲノム再配列を含むイントロンを含む対象区間を選択する。このような実施形態では、標的捕捉試薬は、選択効率を増加させるために反復配列がマスクされるように設計される。再配列が公知の接合部配列を有する実施形態では、相補的な標的捕捉試薬を接合部配列に設計して、選択効率を増加させることができる。
【0150】
一部の実施形態では、本方法は、2つ以上の異なる標的カテゴリーを捕捉するように設計された標的捕捉試薬の使用を含み、各カテゴリーは異なる設計戦略を有する。一部の実施形態では、本明細書に開示される方法(例えば、ハイブリッド捕捉方法)および組成物は、標的配列のサブセット(例えば、標的核酸分子)を捕捉し、標的配列の均一なカバレッジを提供する一方で、そのサブセットの外側のカバレッジを最小化する。一実施形態では、標的配列は、ゲノムDNAからの全エクソーム、またはその選択されたサブセットを含む。別の実施形態では、標的配列は、大きな染色体領域、例えば、染色体アーム全体を含む。本明細書に開示される方法および組成物は、複雑な標的核酸配列(例えば、核酸ライブラリー)について異なる配列決定深度およびカバレッジパターンを達成するための異なる標的捕捉試薬を提供する。
【0151】
ある実施形態では、本方法は、1つまたは複数の核酸ライブラリー(例えば、ライブラリーキャッチ)の選択された核酸分子を提供することを含む。
例えば、本方法は、
複数の核酸分子、例えば、標的核酸分子(例えば、複数の腫瘍核酸分子および/または参照核酸分子を含む)を含む1つまたは複数のライブラリー(例えば、1つまたは複数の核酸ライブラリー)を提供すること;
例えば、溶液ベースの反応において、1つまたは複数のライブラリーを、2つ、3つ、またはそれ以上の複数の標的捕捉試薬(例えば、オリゴヌクレオチド標的捕捉試薬)と接触させて、複数の標的捕捉試薬/核酸分子ハイブリッドを含むハイブリダイゼーション混合物を形成すること;
例えば、前記ハイブリダイゼーション混合物を、ハイブリダイゼーション混合物から前記複数の標的捕捉試薬/核酸分子ハイブリッドを分離することを可能にする結合実体と接触させることによって、前記ハイブリダイゼーション混合物から複数の標的捕捉試薬/核酸分子ハイブリッドを分離すること
を含み、
それにより、ライブラリーキャッチ(例えば、1つまたは複数のライブラリーからの核酸分子の選択されたまたは濃縮されたサブグループ)を提供する。
【0152】
一実施形態では、第1、第2、または第3の複数の標的捕捉試薬の各々は、固有の回収効率を有する。一部の実施形態では、少なくとも2つ、または3つ全ての複数の標的捕捉試薬は、異なる回収効率値を有する。例えば、回復効率の値は、以下のうちの1つ以上から選択される:
(i)第1の回収効率は、少なくとも約5,000×もしくはそれより高い配列決定深度である値を有し、例えば、第2または第3の回収効率の値より大きい(例えば、第2の回収効率の値より約5~10倍(例えば、6~7倍)大きい;または第3の回収効率の値より約40~60倍(例えば、45~50倍)大きい)回収効率の値を有する;
(ii)第2の回収効率は、少なくとも約800×もしくはそれより高い配列決定深度である値を有し、例えば、第3の回収効率の値より大きい(例えば、第3の回収効率の値より約5~10倍(例えば、7~9倍)大きい)回収効率の値を有する;または
(iii)第3の回収効率は、少なくとも約100×もしくはそれより高い配列深度である値を有する。
【0153】
ある種の実施形態では、回収効率の値は、異なる標的捕捉試薬の微分表現、標的捕捉試薬サブセットの微分重なり、微分標的捕捉試薬パラメータ、異なる標的捕捉試薬の混合、および/または異なるタイプの標的捕捉試薬の使用のうちの1つ以上によって修飾される。例えば、回収効率の変動(例えば、各標的捕捉試薬/標的カテゴリーの相対的な配列カバレッジ)は、例えば、複数の標的捕捉試薬内および/または異なる複数の標的捕捉試薬間で、以下のうちの1つ以上を変化することによって調整することができる:
(i)異なる標的捕捉試薬の微分表現-所定の標的(例えば、標的核酸分子)を捕捉するための標的捕捉試薬設計は、相対的な標的配列決定深度を増大/低下させるために、より多く/より少ないコピー数に含めることができる;
(ii)標的捕捉試薬サブセットの微分重なり-所定の標的(例えば、標的核酸分子)を捕捉するための標的捕捉試薬設計は、相対的な標的配列決定深度を増大/減少させるために、隣接する標的捕捉試薬間のより長いまたはより短い重複を含むことができる;
(iii)微分標的捕捉試薬パラメータ-所定の標的(例えば、標的核酸分子)を捕捉するための標的捕捉試薬設計は、捕捉効率を低下させ、相対的な標的配列決定深度を低くするために、配列修飾/より短い長さを含むことができる;
(iv)異なる標的捕捉試薬の混合-異なる標的セットを捕捉するように設計された標的捕捉試薬は、異なるモル比で混合して、相対的な標的配列決定深度を増大/低下させることができる;
(v)異なる修飾された標的捕捉試薬の混合-異なる基質結合特性を有するように修飾された標的捕捉試薬は、異なるモル比で混合されて、相対的な標的配列決定深度を増大/低下させることができる;
(vi)異なるタイプのオリゴヌクレオチド標的捕捉試薬の使用-ある種の実施形態では、標的捕捉試薬は、以下を含むことができる:
(a)1つ以上の化学的に(例えば、非酵素的に)合成された(例えば、個別に合成された)標的捕捉試薬、
(b)アレイで合成された1つ以上の標的捕捉試薬、
(c)1つ以上の酵素的に調製された、例えば、in vitro転写された標的捕捉試薬、
(d)(a)、(b)および/または(c)のいずれかの組合せ、
(e)1つ以上のDNAオリゴヌクレオチド(例えば、天然に存在するまたは天然に存在しないDNAオリゴヌクレオチド)、
(f)1つ以上のRNAオリゴヌクレオチド(例えば、天然に存在するまたは天然に存在しないRNAオリゴヌクレオチド)、
(g)(e)と(f)の組合せ、または
(h)上記のいずれかの組合せ。
【0154】
異なるオリゴヌクレオチドの組合せは、異なる比、例えば、1:1、1:2、1:3、1:4、1:5、1:10、1:20、1:50;1:100、1:1000などから選択される比で混合することができる。一実施形態では、化学合成された標的捕捉試薬の、アレイで生成された標的捕捉試薬に対する比は、1:5、1:10、または1:20から選択される。DNAまたはRNAオリゴヌクレオチドは、天然に存在するかまたは天然に存在しないものであり得る。ある種の実施形態では、標的捕捉試薬は、例えば、融解温度を上昇させるために、1つ以上の天然に存在しないヌクレオチドを含む。例示的な天然に存在しないオリゴヌクレオチドは、修飾されたDNAまたはRNAヌクレオチドを含む。例示的な修飾されたヌクレオチド(例えば、修飾されたRNAまたはDNAヌクレオチド)には、限定されないが、LNAヌクレオチドのリボース部分が2’酸素および4’炭素を接続する余分な架橋で修飾されているロックド核酸(LNA);ペプチド核酸(PNA)、例えば、ペプチド結合によって連結された反復N-(2-アミノエチル)-グリシン単位で構成されるPNA;低GC領域を捕捉するように修飾されたDNAまたはRNAオリゴヌクレオチド;二環式核酸(BNA);架橋されたオリゴヌクレオチド;修飾された5-メチルデオキシチジン;および2,6-ジアミノプリンが含まれる。他の修飾されたDNAおよびRNAヌクレオチドは、当該技術分野において公知である。
【0155】
ある種の実施形態では、標的配列(例えば、標的核酸分子)の実質的な均一または均質なカバレッジが得られる。例えば、各標的捕捉試薬/標的カテゴリー内では、カバレッジの均一性は、標的捕捉試薬パラメータを、例えば、以下のうちの1つ以上によって修正することにより最適化することができる:
(i)標的捕捉試薬表現または重なりの増加/減少は、同じカテゴリーの他の標的と比較して過小/過剰にカバーされている標的(例えば、標的核酸分子)のカバレッジを増大/低下させるために使用することができる;
(ii)低いカバレッジについて、標的配列(例えば、GC含量の高い配列)を捕捉することが困難な場合、標的捕捉試薬で標的化される領域を拡大して、例えば、隣接配列(例えば、高GC隣接配列)をカバーする;
(iii)標的捕捉試薬配列の修飾は、標的捕捉試薬の二次構造を低下させ、その回収効率を増大させるために使用することができる;
(iv)標的捕捉試薬の長さの修飾は、同じカテゴリー内の異なる標的捕捉試薬の融解ハイブリダイゼーション動力学を等化するために使用することができる;標的捕捉試薬の長さは、直接的に(様々な長さを有する標的捕捉試薬を生成することによって)または間接的に(一定の長さの標的捕捉試薬を生成し、標的捕捉試薬の末端を任意の配列で置換することによって)修飾することができる;
(v)同じ標的領域(すなわち、フォワード鎖およびリバース鎖)に対して異なる配向の標的捕捉試薬の修飾は、異なる結合効率を有することができる。各標的に対して最適なカバレッジを提供するいずれかの配向を有する標的捕捉試薬を選択することができる;
(vi)各標的捕捉試薬上に存在する結合実体、例えば、捕捉タグ(例えば、ビオチン)の量の修飾は、その結合効率に影響し得る。特定の標的を標的とする標的捕捉試薬のタグレベルの増加/減少は、相対的な標的カバレッジを増大/低下させるために使用することができる;
(vii)異なる標的捕捉試薬に使用されるヌクレオチドタイプの修飾は、標的に対する結合親和性に影響を及ぼし、相対的な標的カバレッジを増大/減少させるために使用することができる;または
(viii)修飾されたオリゴヌクレオチド標的捕捉試薬を用いることは、例えば、より安定な塩基ペアリングを有することは、高いGC含量に対して低いまたは通常のGC含量の領域間の融解ハイブリダイゼーション動態を等化するために使用することができる。
【0156】
他の実施形態では、回収効率は、結合対の機能的な第1のメンバーを含む標的捕捉試薬、および結合対の機能的な第1のメンバーを欠く標的捕捉試薬の相対的存在量を調整することによって調整される。一部の実施形態では、結合対の第1のメンバーは、基質上に配置された結合対の第2のメンバーに結合することができ、その結果、結合対の第1のメンバーを含む標的捕捉試薬によって捕捉された標的核酸分子が、結合対の第2のメンバーを含む基質によって回収される。
【0157】
ある実施形態では、本方法は、腫瘍核酸分子、例えば、腫瘍細胞からの対象区間を含む核酸分子を選択する標的捕捉試薬を含む複数の標的捕捉試薬の使用を含む。腫瘍核酸分子は、腫瘍細胞中に存在する任意のヌクレオチド配列、例えば、本明細書に記載されるように、腫瘍細胞またはがん細胞中に存在する突然変異した、野生型、参照またはイントロンヌクレオチド配列であり得る。一実施形態では、腫瘍核酸分子は、低頻度で現れる変化(例えば、1つ以上の突然変異)を含み、例えば、試料からの約5%以下の細胞が、それらのゲノムに変化を担持する。他の実施形態では、腫瘍核酸分子は、試料からの細胞の約10%の頻度で現れる変化(例えば、1つ以上の突然変異)を含む。他の実施形態では、腫瘍核酸分子は、イントロン配列、例えば、本明細書に記載されるイントロン配列、腫瘍細胞中に存在する参照配列からのサブゲノム区間を含む。
【0158】
他の実施形態では、本方法は、(例えば、PCRによって)ライブラリーキャッチを増幅することを含む。他の実施形態では、ライブラリーキャッチは増幅されない。
【0159】
別の態様では、本発明は、本明細書に記載される標的捕捉試薬、および本明細書に記載される個々の複数の標的捕捉試薬の組合せを特徴とする。標的捕捉試薬は、場合により、指示書、標準、バッファーもしくは酵素、または他の試薬を含むことができるキットの一部であり得る。
【0160】
アライメント
【0161】
本明細書に開示される方法は、配列決定法における性能を最適化するために、特に、多数の多様な遺伝子における多数の多様な遺伝的事象の大規模並列配列決定に依存する方法、例えば、試料、例えば、本明細書に記載されるがん由来の試料を分析する方法における、多重の、個別に調整された、アラインメント法またはアルゴリズムの使用を統合することができる。
【0162】
一部の実施形態では、リードを分析するために使用されるアラインメント法は、異なる遺伝子における多数の変異体の各々に個別にカスタマイズされずまたは調整されない。一部の実施形態では、異なる遺伝子における多数の変異体の少なくともサブセットに個別にカスタマイズされるかまたは調整される多重アラインメント法を用いて、リードを分析する。一部の実施形態では、異なる遺伝子における多数の変異体の各々に個別にカスタマイズされるかまたは調整される多重アラインメント法を用いて、リードを分析する。一部の実施形態では、調整は、配列決定される(1つ以上の)遺伝子(または他の対象区間)、試料中の腫瘍タイプ、配列決定される変異体、または試料もしくは対象の特徴の関数であり得る。配列決定される多数の対象区間に個別に調整されるアライメント条件の選択または使用は、速度、感受性および特異性の最適化を可能にする。本方法は、比較的多数の多様な対象区間についてのリードのアラインメントが最適化される場合に、特に効果的である。
【0163】
一部の実施形態では、X個の固有の対象区間の各々からのリードは、固有のアラインメント法を用いて整列され、固有の対象区間(例えば、対象区間または発現された対象区間)は、他のX-1個の対象区間とは異なることを意味し、固有のアラインメント法は、他のX-1個のアラインメント法とは異なることを意味し、Xは少なくとも2である。
【0164】
ある実施形態では、少なくともX個の遺伝子、例えば、表1A~5Aからの少なくともX個の遺伝子からの対象区間は、固有のアラインメント法を用いて整列され、Xは、2、3、4、5、10、15、20、30、40、50、60、70、80、90、100、200、300、400、500に等しいかまたはそれより大きい。
【0165】
ある実施形態では、方法は、リードを分析するための、例えば、整列するためのアラインメント法を選択するかまたは使用することを含み、前記アラインメント法は、
(i)腫瘍タイプ、例えば、前記試料における腫瘍タイプ;
(ii)配列決定される対象区間(例えば、対象区間または発現された対象区間)が位置する遺伝子または遺伝子タイプ、例えば、変異体もしくは変異体タイプ、例えば、突然変異によって、または頻度の突然変異によって特徴づけられる遺伝子または遺伝子タイプ;
(iii)分析される部位(例えば、ヌクレオチド位置);
(iv)評価される対象区間(例えば、対象区間または発現された対象区間)内の変異体タイプ、例えば、置換;
(v)試料タイプ、例えば、本明細書に記載される試料;ならびに
(vi)評価される前記対象区間内または近傍の配列、例えば、前記対象区間(例えば、対象区間または発現された対象区間)に対するミスアラインメントの予測傾向、例えば、前記対象区間(例えば、対象区間または発現された対象区間)内または近傍における反復配列の存在
のうちの1つ以上もしくは全部の関数であり、それに応答して選択され、またはそのために最適化される。
【0166】
本明細書の他の箇所で言及されるように、一部の実施形態では、比較的多数の対象区間についてのリードのアラインメントが最適化される場合、本方法は特に効果的である。したがって、ある実施形態では、少なくともX個の固有のアラインメント法を用いて、少なくともX個の固有の対象区間についてのリードを分析し、固有とは他のX-1とは異なることを意味し、Xが、2、3、4、5、10、15、20、30、50、100、200、300、400、500、600、700、800、900、1,000に等しいかまたはそれより大きい。
【0167】
ある実施形態では、表1A~5Aからの少なくともX個の遺伝子からの対象区間を分析し、Xは2、3、4、5、10、15、20、30、40、50、60、70、80、90、100、200、300、400、500に等しいかまたはそれより大きい。
【0168】
ある実施形態では、固有のアラインメント法は、少なくとも3、5、10、20、30、40、50、60、70、80、90、100、200、300、400、または500個の異なる遺伝子の各々において対象区間に適用される。
【0169】
ある実施形態では、少なくとも20、30、40、60、80、100、120、140、160または180、200、300、400、または500個の遺伝子、例えば、表1A~5Aからの遺伝子におけるヌクレオチド位置が、ヌクレオチド値に割り当てられる。ある実施形態では、固有のアラインメント法は、分析された前記遺伝子のうちの少なくとも10%、20%、30%、40%、または50%の各々において対象区間に適用される。
【0170】
本明細書に開示される方法は、困難なリード、例えば、再配列を有するリードの迅速であり効率的なアラインメントを可能にする。したがって、対象区間(例えば、対象区間または発現された対象区間)についてのリードが、再配列を伴うヌクレオチド位置、例えば転座を含む実施形態では、本方法は、適切に調整され、以下を含むアラインメント法を使用することを含むことができる:
リードを含むアラインメントについて再配列参照配列を選択し、前記再配列参照配列が、再配列(一部の実施形態では、参照配列はゲノム再配列と同一ではない)とともに整列させ;および
リードを前記再配列参照配列と比較する、例えば、整列させること
を含む。
【0171】
一部の実施形態では、異なる方法、例えば、別の方法を用いて、困難なリードを整列させる。これらの方法は、比較的多数の多様な対象区間についてのリードのアラインメントが最適化される場合に特に効果的である。一例として、試料を分析する方法は、
第1のパラメータセット(例えば、第1のマッピングアルゴリズムまたは第1の参照配列)下でのリードの比較、例えば、アラインメント比較を行うこと、および
前記リードが第1のアラインメント基準を満たすかどうかを決定すること(例えば、リードが、例えば、ミスマッチ数未満である、前記第1の参照配列と整列させることができる)、
前記リードが第1のアラインメント基準を満たさない場合、第2のパラメータセット(例えば、第2のマッピングアルゴリズムまたは第2の参照配列)下で第2のアラインメント比較を行うこと;および
場合により、前記リードが前記第2の基準を満たすか否かを決定すること(例えば、リードが、所定数未満のミスマッチを有する前記第2の参照配列と整列させることができる)
を含むことができ、前記第2のパラメータセットは、パラメータセット、例えば、前記第1のパラメータセットと比較して、変異体、例えば、再配列、例えば、挿入、欠失、または転座についてのリードとのアラインメントをもたらす可能性がより高い、例えば、前記第2の参照配列の使用を含む。
【0172】
これらおよび他のアラインメント法は、本明細書の他の箇所で、例えば、発明の詳細な説明の「アラインメント」と題するセクションで、より詳細に検討される。そのモジュールの要素は、腫瘍を分析する方法に含めることができる。実施形態では、「アラインメント」(発明の概要および/または発明の詳細な説明)と題するセクションからのアラインメント法は、「突然変異コーリング」(発明の概要および/または発明の詳細な説明)と題するセクションからの突然変異コーリング法、ならびに/または「標的捕捉試薬」(発明の概要)と題するセクションおよび/もしくは「標的捕捉試薬の設計および構築」および「標的捕捉試薬の競合」(発明の詳細な説明)と題するセクションからの標的捕捉試薬と組み合わされる。本方法は、「遺伝子選択」(発明の概要および/または発明の詳細な説明)と題するセクションからの対象区間セットに適用することができる。
【0173】
突然変異コーリング
【0174】
本明細書に開示される方法は、配列決定方法における性能を最適化するために、特に、例えば、試料、例えば、本明細書に記載されるがんに由来する多数の多様な遺伝子における、多数の多様な遺伝的事象の大規模な並行配列決定に依存する方法において、カスタマイズされたまたは調整された突然変異コーリングパラメータの使用を統合することができる。
【0175】
理論に拘束されることを望まないが、一部の実施形態では、突然変異コーリングは、観察される非参照変化、例えば、本明細書に記載される変化について、予想される確率を決定すると考えられる。突然変異コーリングは、典型的には、コールされた変化が実際であり、配列決定もしくは分析プロセスのノイズまたは他のアーチファクトの結果ではないという十分な信頼性を提供するために確立された閾値に基づく。
【0176】
一部の実施形態では、多数の対象区間の各々についての突然変異コーリングは、個別にカスタマイズされずまたは微調整されない。一部の実施形態では、多数の対象区間の少なくともサブセットについての突然変異コーリングは、個別に、カスタマイズされるかまたは微調整される。一部の実施形態では、多数の対象区間の各々についての突然変異コーリングは、個別に、カスタマイズされるかまたは微調整される。カスタマイズまたは調整は、本明細書に記載される1つ以上の因子、例えば、試料中のがんタイプ、配列決定されるべき対象区間が位置する遺伝子、または配列決定されるべき変異体に基づくことができる。この選択、または配列決定すべき多数の対象区間に微調整されたアラインメント条件の使用は、速度、感受性および特異性の最適化を可能にする。本方法は、比較的多数の多様な対象区間についてのリードのアラインメントが最適化される場合に特に効果的である。
【0177】
一部の実施形態では、ヌクレオチド値は、固有のコーリング法によって、X個の固有の対象区間の各々におけるヌクレオチド位置に対して割り当てられ、固有の対象区間は、他のX-1個の対象区間(例えば、サブゲノム区間、発現されたサブゲノム区間、またはその両方)とは異なることを意味し、固有のコーリング法は、他のX-1個のコーリング法とは異なることを意味し、Xは少なくとも2である。コーリング法は異なることができ、それにより、例えば、異なるベイズの事前値に依存することによって、固有であり得る。
【0178】
ある実施形態では、前記ヌクレオチド値の割り当ては、変異体、例えば、腫瘍タイプにおける前記ヌクレオチド位置での突然変異を示すリードを観察するという、以前の(例えば、文献の)期待値であるかまたはそれを表す値の関数である。
【0179】
ある実施形態では、本方法は、少なくとも10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000ヌクレオチド位置についてのヌクレオチド値(例えば、突然変異をコールするため)を割り当てることを含み、各割り当ては、変異体、例えば、突然変異を示すリードを、腫瘍タイプにおける前記ヌクレオチド位置で観察するという従来の(例えば、文献の)期待値であるかまたは表す固有の(他の割り当ての値とは対照的である)値の関数である。
【0180】
ある実施形態では、前記ヌクレオチド値を割り当てることは、変異体が試料中に、ある頻度(例えば、1%、5%、10%など)で存在する場合、および/または変異体が存在しない場合(例えば、塩基コーリングエラーのみに起因するリードにおいて観察される場合)、前記ヌクレオチド位置で前記変異体を示すリードを観察する確率を表す値のセットの関数である。
【0181】
ある実施形態では、本明細書に記載される突然変異コーリング法は、以下を含むことができる:
X個の対象区間の各々におけるヌクレオチド位置の獲得:
(i)X型腫瘍における前記ヌクレオチド位置で変異体、例えば、突然変異を示すリードを観察するという、以前の(例えば、文献の)期待値であるまたはそれを表す第1の値;
(ii)変異体が、ある頻度(例えば、1%、5%、10%など)で試料中に存在する場合、および/または変異体が存在しない場合(例えば、塩基コーリングエラーのみに起因するリードにおいて観察される場合)、前記ヌクレオチド位置で前記変異体を示すリードを観察する確率を表す第2の値のセット;
前記値に応答して、例えば、本明細書に記載されるベイズ法によって、第1の値を用いた第2のセットにおける値間での比較を検討すること(例えば、突然変異の存在の事後確率を計算すること)によって、前記ヌクレオチド位置の各々についての前記リードからヌクレオチド値を割り当て(例えば、突然変異をコールし)、それによって前記試料を分析すること。
【0182】
ある実施形態では、本方法は、以下のうちの1つ以上または全てを含む:
(i)少なくとも10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000ヌクレオチド位置についてヌクレオチド値を割り当て(例えば、突然変異をコールし)、各割り当ては、固有の(他の割り当てとは対照的である)第1および/または第2の値に基づき;
(ii)(i)の方法の割り当てであって、割り当ての少なくとも10、20、30、40、50、60、70、80、90、100、200、300、400、または500は、変異体が、例えば、腫瘍タイプの細胞の5%未満、10%未満または20%未満に存在する確率の関数である第1の値を用いて行われる割り当て;
(iii)少なくともX個のヌクレオチド位置についてのヌクレオチド値を割り当てる(例えば、突然変異をコール)し、その各々が、腫瘍タイプ、例えば、前記試料の腫瘍タイプに存在する固有の(他のX-1個の割り当てと対照的である)確率を有する変異体と関連し、場合により、前記X個の割り当ての各々は、第1および/または第2の値(X=2、3、5、10、20、30、40、50、60、70、80、90、100、200、300、400、または500)に基づき;
(iv)第1および第2のヌクレオチド位置にヌクレオチド値を割り当て(例えば、突然変異をコールし)、前記第1のヌクレオチド位置における第1の変異体が腫瘍タイプ(例えば、前記試料の腫瘍タイプ)中に存在する可能性が、前記第2のヌクレオチド位置における第2の変異体が存在する可能性よりも、少なくとも2、5、10、20、30、または40倍高く、場合により、各割り当ては、固有の(他の割り当てに対照的である)第1および/または第2の値に基づき;
(v)複数のヌクレオチド位置にヌクレオチド値を割り当て(例えば、突然変異をコールし)、前記複数は、以下の確立パーセンテージ範囲:0.01%未満またはそれに等しい;0.01%より大きく、0.02%未満またはそれに等しい;0.02%より大きく、0.03%未満またはそれに等しい;0.03%より大きく、0.04%未満またはそれに等しい;0.04%より大きく、0.05%未満またはそれに等しい;0.05%より大きく、0.1%未満またはそれに等しい;0.1%より大きく、0.2%未満またはそれに等しい;0.2%より大きく、0.5%未満またはそれに等しい;0.5%より大きく、1.0%未満またはそれに等しい;1.0%より大きく、2.0%未満またはそれに等しい;2.0%より大きく、5.0%未満またはそれに等しい;5.0%より大きく、10.0%未満またはそれに等しい;10.0%より大きく、20.0%未満またはそれに等しい;20.0%より大きく、50.0%未満またはそれに等しい;および50%より大きく、100.0%未満またはそれに等しい、のうちの1つ以上、例えば、少なくとも3、4、5、6、7、または全てに分類する変異体についての割り当てを含み、
確率範囲は、ヌクレオチド位置における変異体が腫瘍タイプ(例えば、前記試料の腫瘍タイプ)中に存在する確率の範囲、またはヌクレオチド位置における変異体が、予め選択されたタイプ(例えば、前記試料の腫瘍タイプ)について、試料中の細胞、試料からのライブラリー、またはそのライブラリーからのライブラリーキャッチの列挙されたパーセンテージ(%)で存在する確率の範囲であり、
場合により、各割り当ては、固有の第1および/または第2の値(例えば、列挙された確率範囲内の他の割り当てとは対照的である固有、または他の列挙された確率範囲の1つ以上もしくは全部についての第1および/または第2の値とは対照的である固有)に基づき;
(vi)少なくとも1、2、3、5、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、900、または1,000ヌクレオチド位置にヌクレオチド値を割り当て(例えば、突然変異をコールし)、各々は、独立して、前記試料中に50%、40%、25%、20%、15%、10%、5%、4%、3%、2%、1%、0.5%、0.4%、0.3%、0.2%、または0.1%未満のDNAに存在する変異体を有し、場合により、各々の割り当ては、固有の(他の割り当てに対称的である)第1および/または第2の値に基づき;
(vii)第1および第2のヌクレオチド位置にヌクレオチド値を割り当て(例えば、突然変異をコールし)、前記試料のDNAの第1の位置における変異体の可能性は、前記試料のDNAの前記第2のヌクレオチド位置における変異体の可能性よりも、少なくとも2、5、10、20、30、または40倍高く、場合により、各々の割り当ては、固有の(他の割り当てに対照的である)第1および/または第2の値に基づき;
(viii)以下のうちの1つ以上または全部においてヌクレオチド値を割り当てる(例えば、突然変異をコールする)こと:
(1)前記試料からのライブラリー中の核酸、またはそのライブラリーからのライブラリーキャッチ中の核酸の、前記試料中の1%未満の細胞に存在する変異体を有する少なくとも1、2、3、4または5ヌクレオチド位置;
(2)前記試料からのライブラリー中の核酸、またはそのライブラリーからのライブラリーキャッチ中の核酸の、前記試料中の1~2%の細胞に存在する変異体を有する少なくとも1、2、3、4または5ヌクレオチド位置;
(3)前記試料からのライブラリー中の核酸、またはそのライブラリーからのライブラリーキャッチ中の核酸の、前記試料中の2%より大きく、3%未満またはそれに等しい細胞に存在する変異体を有する少なくとも1、2、3、4または5ヌクレオチド位置;
(4)前記試料からのライブラリー中の核酸、またはそのライブラリーからのライブラリーキャッチ中の核酸の、前記試料中の3%より大きく、4%未満またはそれに等しい細胞に存在する変異体を有する少なくとも1、2、3、4または5ヌクレオチド位置;
(5)前記試料からのライブラリー中の核酸、またはそのライブラリーからのライブラリーキャッチ中の核酸の、前記試料中の4%より大きく、5%未満またはそれに等しい細胞に存在する変異体を有する少なくとも1、2、3、4または5ヌクレオチド位置;
(6)前記試料からのライブラリー中の核酸、またはそのライブラリーからのライブラリーキャッチ中の核酸の、前記試料中の5%より大きく、10%未満またはそれに等しい細胞に存在する変異体を有する少なくとも1、2、3、4または5ヌクレオチド位置;
(7)前記試料からのライブラリー中の核酸、またはそのライブラリーからのライブラリーキャッチ中の核酸の、前記試料中の10%より大きく、20%未満またはそれに等しい細胞に存在する変異体を有する少なくとも1、2、3、4または5ヌクレオチド位置;
(8)前記試料からのライブラリー中の核酸、またはそのライブラリーからのライブラリーキャッチ中の核酸の、前記試料中の20%より大きく、40%未満またはそれに等しい細胞に存在する変異体を有する少なくとも1、2、3、4または5ヌクレオチド位置;
(9)前記試料からのライブラリー中の核酸、またはそのライブラリーからのライブラリーキャッチ中の核酸の、前記試料中の40%より大きく、50%未満またはそれに等しい細胞に存在する変異体を有する少なくとも1、2、3、4または5ヌクレオチド位置;
(10)前記試料からのライブラリー中の核酸、またはそのライブラリーからのライブラリーキャッチ中の核酸の、前記試料中の50%より大きく、100%未満またはそれに等しい細胞に存在する変異体を有する少なくとも1、2、3、4または5ヌクレオチド位置;
場合により、各々の割り当ては、固有の第1および/または第2の値(例えば、列挙された範囲(例えば、1%未満の(1)の範囲)における他の割り当てとは対照的に固有であるか、または他の列挙された範囲の1つ以上もしくは全部における決定についての第1および/または第2の値とは対照的に固有である)に基づく;あるいは
(ix)X個のヌクレオチド位置の各々にヌクレオチド値を割り当て(例えば、突然変異をコールし)、各ヌクレオチド位置は、独立して、他のX-1個のヌクレオチド位置における変異体の可能性と比較して固有である可能性(変異体が前記試料のDNA中に存在する可能性)を有し、Xは、1、2、3、5、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000に等しいかまたはそれより大きく、各割り当ては、固有の(他の割り当てとは対照的である)第1および/または第2の値に基づく。
【0183】
一部の実施形態では、「閾値」は、リードを評価するために使用され、リードから、例えば、遺伝子の特定の位置で突然変異をコールするヌクレオチド位置の値を選択する。一部の実施形態では、多数の対象区間の各々についての閾値はカスタマイズまたは微調整される。カスタマイズまたは調整は、本明細書に記載される1つ以上の因子、例えば、試料中のがんタイプ、配列決定される対象区間(サブゲノム区間または発現されたサブゲノム区間)が位置する遺伝子、または配列決定される変異体に基づくことができる。これは、配列決定されるべき多数の対象区間の各々に微調整されるコーリングを提供する。一部の実施形態では、本方法は、比較的多数の多様なサブゲノム区間が分析される場合に特に効果的である。
【0184】
したがって、別の実施形態では、本方法は、以下の突然変異コーリング法を含む:
X個の対象区間の各々について、閾値を取得し、前記取得されたX個の閾値の各々は、他のX-1個の閾値と比較して固有であり、それにより、X個の固有の閾値を提供し;
前記X個の対象区間の各々について、ヌクレオチド位置におけるヌクレオチド値を有するリード回数の関数である観察値をその固有の閾値と比較し、それにより、前記X個の対象区間の各々にその固有の閾値を適用し;
場合により、前記比較の結果に応答して、ヌクレオチド位置にヌクレオチド値を割り当て、
Xは、2に等しいかまたはそれより大きい。
【0185】
ある実施形態では、本方法は、ヌクレオチド値を、少なくとも2、3、5、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000ヌクレオチド位置に割り当てることを含み、各々は、独立して、0.5、0.4、0.25、0.15、0.10、0.05、0.04、0.03、0.02、または0.01未満である確率の関数である第1の値を有する。
【0186】
ある実施形態では、本方法は、少なくともX個のヌクレオチド位置の各々にヌクレオチド値を割り当てることを含み、各々は、独立して、他のX-1個の第1の値と比較して固有である第1の値を有し、前記X個の第1の値の各々は、0.5、0.4、0.25、0.15、0.10、0.05、0.04、0.03、0.02、または0.01未満の確率の関数であり、Xは、1、2、3、5、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000に等しいかまたはそれより大きい。
【0187】
ある実施形態では、少なくとも20、30、40、60、80、100、120、140、160または180、200、300、400または500個の遺伝子、例えば、表1A~5Aからの遺伝子におけるヌクレオチド位置がヌクレオチド値に割り当てられる。ある実施形態では、固有の第1および/または第2の値は、分析された前記遺伝子の少なくとも10%、20%、30%、40%、または50%の各々において対象区間に適用される。
【0188】
本方法の実施形態は、例えば、以下の実施形態から分かるように、比較的多数の対象区間の閾値が最適化される場合に適用することができる。
【0189】
ある実施形態では、固有の閾値は、対象区間、例えば、サブゲノム区間、または発現されたサブゲノム区間に、少なくとも3、5、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000個の異なる遺伝子の各々において適用される。
【0190】
ある実施形態では、少なくとも20、30、40、60、80、100、120、140、160または180、200、300、400または500個の遺伝子、例えば表1A~5Aからの遺伝子におけるヌクレオチド位置がヌクレオチド値に割り当てられる。ある実施形態では、固有の閾値は、分析された前記遺伝子の少なくとも10%、20%、30%、40%、または50%の各々においてサブゲノム区間に適用される。
【0191】
ある実施形態では、表1A~5Aからの少なくとも5、10、20、30、または40個の遺伝子におけるヌクレオチド位置は、ヌクレオチド値に割り当てられる。ある実施形態では、固有の閾値は、分析された前記遺伝子の少なくとも10%、20%、30%、40%、または50%の各々における対象区間(例えば、サブゲノム区間または発現されたサブゲノム区間)に適用される。
【0192】
これらおよび他の突然変異コーリング法は、本明細書の他の箇所、例えば、「突然変異コーリング」と題するセクションでより詳細に検討される。そのモジュールの要素は、腫瘍を分析する方法に含めることができる。ある実施形態では、「突然変異コーリング」と題するセクションからのアライメント法は、「アライメント」(発明の概要および/または発明の詳細な説明)と題するセクションからのアラインメント法、および/また「標的捕捉試薬」(発明の概要)と題するセクションおよび/または「標的捕捉試薬の設計および構築」と「標的捕捉試薬の競合」(発明の詳細な説明)と題するセクションからの標的捕捉試薬と組み合わせられる。本方法は、「遺伝子選択」(発明の概要および/または発明の詳細な説明)と題するセクションからの対象区間セットに適用することができる。
【0193】
SGZ分析
【0194】
ある種の実施形態では、本明細書に記載される方法に従って評価される変化は、生殖系列変化である。ある種の実施形態では、生殖系列変化は、SGZアルゴリズム(例えば、Sunら、PLoS Comput Biol.2018年;14(2):e1005965、および米国特許第9,792,403号に記載される)によって同定される。例えば、腫瘍遺伝子変異量を評価する場合、SGZアルゴリズムの使用を含む方法またはシステムによって、生殖系列変化を除外することができる。
【0195】
ある種の実施形態では、本方法は、対象由来の試料中の変異体を、体細胞性事象または生殖系列事象であるとして特徴づけることをさらに含み、本方法は、以下を含む:
a)複数の選択された対象区間の各々、複数の選択された生殖系列SNPの各々、および変異体を配列決定し;
b)以下:
i)複数の選択された対象区間の各々について、選択された対象区間で正規化された配列カバレッジの値を含む配列カバレッジ入力(SCI)であって、SCIは、対象区間についてのリード数と、プロセス合致した対照についてのリード数との比較を含むSCI;
ii)複数の選択された生殖系列SNPの各々について、試料中のマイナー対立遺伝子頻度の値を含む、SNP対立遺伝子頻度入力(SAFI);および
iii)特徴づけられる前記変異体については、試料中の前記変異体の対立遺伝子頻度を含む変異体対立遺伝子頻度入力(VAFI)
を取得し;
c)SCIとSAFIの関数として、
複数のゲノムセグメントの各々に対するゲノムセグメントの全コピー数(C);
複数のゲノムセグメントの各々に対するゲノムセグメントマイナー対立遺伝子コピー数(M);および
試料純度(p)
についての値を取得し、SCI、SAFI、C、M、pは、次のように互いに関連付けられる:
SCIおよびSAFIをそれぞれr
ijおよびf
ikと表記する場合、
r
ijはゲノムセグメント(S
i)内の対象区間jの対数比(LR)であり、C
iはS
iの全コピー数(C)であり、l
iはS
iの長さであり、f
ikはS
i内のSNP kのマイナー対立遺伝子頻度であり、M
iはS
iにおけるマイナー対立遺伝子(M)のコピー数であり、ならびにσ
riおよびσ
fiはノイズパラメータであり;
d)、変異体が体細胞性、サブクローン性体細胞性変異体、生殖系列、または識別不能であることを示す、突然変異タイプの値gを取得し、g、VAFI、p、C、およびMは、以下により互いに関連付けられる。
【0196】
一部の実施形態では、0であるかまたは0に近いgの値は、変異体が体細胞性変異体であることを示し;1であるかまたは1に近いgの値は、変異体が生殖系列変異体であることを示し;1未満であるが0を超えるgの値は、識別不能な結果を示し;有意に0未満であるgの値は、変異体がサブクローン性体細胞性変異体であることを示す。
【0197】
一部の実施形態では、試料純度(p)は、全体的な純度値である。
【0198】
一部の実施形態では、Mの値が0に等しく、Cに等しくないことは、変異体の不存在を示し;Mの非ゼロ値がCに等しいことは、変異体のホモ接合型を示し;Mの値が0に等しく、Cに等しいことは、変異体のホモ接合性の欠失を示し;Mの非ゼロ値がCに等しくないことは、変異体のヘテロ接合性を示す。
【0199】
一部の実施形態では、複数の選択された対象区間は、エクソンを含む。一部の実施形態では、変異体は、対象に存在する腫瘍タイプと正に関連する。一部の実施形態では、本方法は、試料中の変異体の接合性の指標を取得することをさらに含む。一部の実施形態では、突然変異型の値gは、対象が合致した正常対照を使用することなく取得される。一部の実施形態では、正規化前の平均配列決定深度は、少なくとも約100×、250×、500×、800×、1,000×、1,500×、2,000×、2,500×、3,000×、3,500×、4,000×、4,500×、5,000×、5,500×、6,000×、6,500×、7,000×、7,500×、または8,000×である。
【0200】
腫瘍遺伝子変異量
【0201】
本明細書に記載される方法および組成物は、腫瘍遺伝子変異量を評価するために使用することができる。
【0202】
ある種の実施形態では、本方法は、試料(例えば、本明細書に記載される試料)からのサブゲノム区間セットの配列を提供すること;および突然変異量荷の値を決定することを含み、その値は、サブゲノム区間セットにおける変化の数の関数である。ある種の実施形態では、サブゲノム区間セットは、遺伝子セット、例えば、全ゲノムまたはエクソームを含まない遺伝子セットからのものである。ある種の実施形態では、サブゲノム区間セットは、コーディングサブゲノム区間セットである。他の実施形態では、サブゲノム区間セットは、1つ以上のコーディングサブゲノム区間および1つ以上の非コーディングサブゲノム区間を含む。ある種の実施形態では、突然変異量の値は、サブゲノム区間セットにおける変化(例えば、体細胞性変化)の数の関数である。ある種の実施形態では、変化の数は、機能的変化、生殖系列変異、またはその両方の数を除外する。
【0203】
本明細書に記載される方法はまた、例えば、試料からの複数の腫瘍核酸分子を含むライブラリーを取得すること;ライブラリーを標的捕捉試薬と接触させて、ハイブリダイゼーションにより選択された腫瘍核酸分子を提供し、それによりライブラリーキャッチを提供すること;ライブラリーキャッチから腫瘍核酸分子からの変化を含むサブゲノム区間についてのリードを取得すること;アラインメント法によりリードを整列させること;ヌクレオチド位置についてのリードからヌクレオチド値を割り当てること;および割り当てられたヌクレオチド位置セットからサブゲノム区間セットを選択すること(ここで、サブゲノム区間セットは、遺伝子セット由来である)のうちの1つ以上を含むことができる。
【0204】
ある種の実施形態では、突然変異量は、対象、例えば、本明細書に記載される対象由来の試料において測定される。ある種の実施形態では、突然変異量は、百分位として、例えば、参照集団からの試料における突然変異量の間で表される。ある種の実施形態では、参照集団は、対象と同じタイプのがんを有する患者を含む。他の実施形態では、参照集団は、対象と同じタイプの治療を受けているか、または受けたことがある患者を含む。ある種の実施形態では、本明細書に記載される方法によって、例えば、表1A~5Aに示される遺伝子セットにおける変化(例えば、体細胞性変化)のレベルを評価することによって得られる突然変異量は、全ゲノムまたはエクソーム突然変異量と相関する。
【0205】
変化のタイプ
【0206】
種々の変化(例えば、体細胞性変化)タイプは、本明細書に記載される方法またはシステムにおいて、ゲノム変化の分析のために評価および使用することができる。例えば、がんおよび/または腫瘍遺伝子変異量に関連するゲノム変化を分析することができる。理論に拘束されることを望まないが、一部の実施形態では、本明細書に記載される方法は、低い腫瘍含有量および/または低い量の腫瘍核酸を含む試料を分析するのに有用であると考えられる。
【0207】
体細胞性変化
【0208】
ある種の実施形態では、本明細書に記載される方法に従って評価される変化は、体細胞性変化である。
【0209】
ある種の実施形態では、変化(例えば、体細胞性変化)は、コーディング短鎖変異体、例えば、塩基置換またはインデル(挿入または欠失)である。ある種の実施形態では、変化(例えば、体細胞性変化)は、点突然変異である。他の実施形態では、変化(例えば、体細胞性変化)は、再配列以外のもの、例えば、転座以外のものである。ある種の実施形態では、変化(例えば、体細胞性変化)は、スプライス変異体である。
【0210】
ある種の実施形態では、変化(例えば、体細胞性変化)は、サイレント突然変異、例えば、同義置換である。他の実施形態では、変化(例えば、体細胞性変化)は、非同義の一塩基変異体(SNV)である。他の実施形態では、変化(例えば、体細胞性変化)は、パッセンジャー突然変異、例えば、細胞クローンの適応度に検出可能な影響がない変化である。ある種の実施形態では、変化(例えば、体細胞性変化)は、意義不明の変異体(VUS)であり、例えば、変化であって、その病原性が確認され得ず、または除外され得ない。ある種の実施形態では、変化(例えば、体細胞性変化)は、がん表現型と関連するものとして同定されていない。
【0211】
ある種の実施形態では、変化(例えば、体細胞性変化)は、細胞分裂、増殖または生存における影響と関連しないかまたは関連することが知られていない。他の実施形態では、変化(例えば、体細胞性変化)は、細胞分裂、増殖または生存における影響と関連する。
【0212】
ある種の実施形態では、体細胞性変化の増加レベルは、体細胞性変化(例えば、再配列、点突然変異、インデル、またはそれらの任意の組合せ)のうちの1つ以上のクラスまたはタイプの増加レベルである。ある種の実施形態では、体細胞性変化の増加レベルは、1つのクラスまたはタイプの体細胞性変化の増加レベル(例えば、再配列のみ、点突然変異のみ、またはインデルのみ)である。ある種の実施形態では、体細胞性変化の増加レベルは、ある位置(例えば、ヌクレオチド位置、例えば、1つ以上のヌクレオチド位置)、またはある領域(例えば、ヌクレオチド領域、例えば、1つ以上のヌクレオチド領域)における体細胞性変化の増加レベルである。ある種の実施形態では、体細胞性変化の増加レベルは、体細胞性変化(例えば、本明細書に記載される体細胞性変化)の増加レベルである。
【0213】
機能的変化
【0214】
ある種の実施形態では、変化(例えば、体細胞性変化)は、サブゲノム区間における機能的変化である。他の実施形態では、変化(例えば、体細胞性変化)は、サブゲノム区間における公知の機能的変化ではない。例えば、腫瘍遺伝子変異量を評価する場合、変化(例えば、体細胞性変化)の数は、1つ以上の機能的変化を除外することができる。
【0215】
一部の実施形態では、機能的変化は、参照配列、例えば、野生型または非突然変異配列と比較して、細胞分裂、増殖または生存に影響を及ぼす変化、例えば、細胞分裂、増殖または生存を促進する変化である。ある種の実施形態では、機能的変化は、機能的変化のデータベース、例えば、COSMICデータベース(cancer.sanger.ac.uk/cosmic;Forbesら Nucl.Acids Res.2015年;43巻(D1):D805-D811)に含めることによって同定される。他の実施形態では、機能的変化は、公知の機能的状態を有する変化であり、例えば、COSMICデータベースにおける公知の体細胞性変化として生じる変化である。ある種の実施形態では、機能的変化は、可能性のある機能的状態、例えば、腫瘍抑制遺伝子におけるトランケーションを伴う変化である。ある種の実施形態では、機能的変化は、ドライバー突然変異であり、例えば、細胞生存または複製を増加させることによって、その微小環境におけるクローンに選択的利点を与える変化などである。他の実施形態では、機能的変化は、クローン性拡大を引き起こすことができる変化である。ある種の実施形態では、機能的変化は、(a)増殖シグナルにおける自己充足性;(b)抗増殖シグナルに対する減少した、例えば非感受性;(c)減少したアポトーシス;(d)増加した複製可能性;(e)持続した血管新生;または(f)組織浸潤もしくは転移のうちの1つ、2つ、3つ、4つ、5つ、または全てを引き起こすことができる変化である。
【0216】
ある種の実施形態では、機能的変化は、パッセンジャー突然変異ではなく、例えば、細胞クローンの適応度において検出可能な影響がない変化はない。ある種の実施形態では、機能的変化は、意義不明の変異体(VUS)ではなく、例えば、変化ではなく、その病原性は、確認され得ず、除外され得ない。
【0217】
ある種の実施形態では、表1A~5Aに記載される遺伝子における複数(例えば、約10%、20%、30%、40%、50%、60%、70%、80%、90%、またはそれ以上)の機能的変化が除外される。ある種の実施形態では、表1A~5Aに記載される遺伝子における全ての機能的変化が除外される。ある種の実施形態では、表1A~5Aに記載される複数の遺伝子における複数の機能的変化が除外される。ある種の実施形態では、表1A~5Aに記載される全ての遺伝子における全ての機能的変化が除外される。
【0218】
生殖系列変化
【0219】
一部の実施形態では、変化は生殖系列変化である。他の実施形態では、変化は生殖系列変化ではない。一部の実施形態では、変化は、例えば、生殖系列変化と同一ではなく、または類似ではなく、例えば、それと区別される。例えば、腫瘍遺伝子変異量を評価する場合、変化の数は生殖系列変化の数を除外することができる。
【0220】
ある種の実施形態では、生殖系列変化は、一塩基多型(SNP)、塩基置換、インデル(例えば、挿入または欠失)、またはサイレント変化(例えば、同義変化)である。
【0221】
ある種の実施形態では、生殖系列変化は、合致する正常な配列との比較を使用しない方法の使用によって同定される。他の実施形態では、生殖系列変化は、SGZアルゴリズムの使用を含む方法によって同定される。ある種の実施形態では、生殖系列変化は、生殖系列変化のデータベース、例えば、dbSNPデータベース(www.ncbi.nlm.nih.gov/SNP/index.html;Sherryら Nucleic Acids Res.2001年;29巻(1号):308-311頁)に含めることによって同定される。他の実施形態では、生殖系列変化は、例えば、ExACデータベース(exac.broadinstitute.org;Exome Aggregation Consortiumら、「Analysis of protein-coding genetic variation in 60,706 humans」、bioRxiv preprint.2015年10月30日)の2つ以上のカウントに含めることによって同定される。一部の実施形態では、生殖系列変化は、例えば、1000ゲノムプロジェクトデータベース(www.1000genomes.org;McVeanら、Nature.2012年;491巻、56-65頁)に含めることによって同定される。一部の実施形態では、生殖系列変化は、例えば、ESPデータベース(Exome Variant Server、NHLBI GO Exome Sequencing Project(ESP)、Seattle、WA)(evs.gs.washington.edu/EVS/)に含めることによって同定される。
【0222】
遺伝子選択
【0223】
対象区間、例えば、サブゲノム区間、発現されたサブゲノム区間、またはその両方、分析用に、例えば、遺伝子および他の領域のセットまたはグループについてのサブゲノム区間のグループまたはセットは、本明細書に記載される。
【0224】
一部の実施形態では、本方法は、例えば、次世代シークエンシング法によって、取得された核酸試料からの少なくとも5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400、500、もしくはそれ以上の遺伝子または遺伝子産物からの対象区間を配列決定することを含み、遺伝子は表1A~5Aから選択される。
【0225】
一部の実施形態では、本方法は、例えば、次世代シークエンシング法によって、試料からの少なくとも5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400、500個、もしくはそれ以上の遺伝子または遺伝子産物からの対象区間を配列決定することを含み、遺伝子は表1A~5Aから選択される。
【0226】
別の実施形態では、以下のセットまたはグループのうちの1つの対象区間が分析される。例えば、腫瘍またはがん遺伝子もしくは遺伝子産物と関連する対象区間、および参照(例えば、野生型)遺伝子または遺伝子産物は、試料からのサブゲノム区間のグループまたはセットを提供することができる。
【0227】
ある実施形態では、本方法は、リード、例えば、配列、試料からの対象区間セットを取得し、対象区間は、以下のうちの少なくとも1、2、3、4、5、6、7個または全てから選択され:
A)表1A~5Aによる突然変異または野生型遺伝子からの少なくとも5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400、500個、またはそれ以上の対象区間、例えば、サブゲノム区間、もしくは発現されたサブゲノム区間、またはその両方;
B)少なくとも5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400、500個、またはそれ以上の、腫瘍もしくはがんに関連する遺伝子または遺伝子産物からの対象区間(例えば、陽性もしくは陰性の治療反応予測因子であるか、腫瘍もしくはがんの陽性または陰性の予後因子であるか、あるいは、腫瘍もしくはがんの、例えば表1A~5Aによる遺伝子の鑑別診断を可能にする);
C)表1A~5Aから選択される遺伝子に存在するサブゲノム区間の突然変異したまたは野生型の遺伝子もしくは遺伝子産物(例えば、一塩基多型(SNP))からの少なくとも5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400、500、またはそれ以上の対象区間;
(D)(i)薬物で治療されたがん患者のより良好な生存(例えば、パクリタキセルで治療された乳がん患者のより良好な生存);(ii)パクリタキセル代謝;(iii)薬物に対する毒性;または(iv)薬物に対する副作用のうちの1つ以上と関連する、表1A~5Aから選択される遺伝子に存在する対象区間の突然変異したまたは野生型の遺伝子(例えば、一塩基多型(SNP))からの少なくとも5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400、500個、またはそれ以上の対象区間;
E)表1A~5Aによる少なくとも5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400、500個、またはそれ以上の遺伝子もしくは遺伝子産物を伴う複数の転座変化;
F)表1A~5Aから選択される少なくとも5つの遺伝子であって、例えば、ある位置における対立遺伝子変動は腫瘍タイプと関連し、前記対立遺伝子変動は、前記腫瘍タイプの細胞の5%未満に存在する遺伝子;
G)表1A~5Aから選択され、高GC領域に埋め込まれている少なくとも5つの遺伝子;あるいは
H)がん発生の遺伝的(例えば、生殖系列リスク)因子を示す少なくとも5つの遺伝子(例えば、遺伝子または遺伝子産物は表1A~5Aから選択される)。
【0228】
さらに別の実施形態では、本方法は、試料から対象区間セットについてのリード、例えば、配列を取得し、対象区間は、表1A~1Cに記載される遺伝子の5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400個、または全てから選択される。
【0229】
さらに別の実施形態では、本方法は、試料から対象区間セットについてのリード、例えば、配列を取得し、対象区間は、表2A~2Bに記載される遺伝子の5、6、7、8、9、10、15、20、25、30個、または全てから選択される。
【0230】
さらに別の実施形態では、本方法は、試料から対象区間セットについてのリード、例えば、配列を取得し、対象区間は、表3A~3Cに記載される遺伝子の5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300個、または全てから選択される。
【0231】
さらに別の実施形態では、本方法は、試料から対象区間セットについてのリード、例えば、配列を取得し、対象区間は、表4A~4Bに記載される遺伝子の5、6、7、8、9、10、15、20、25、30、40、50、60、70、80個、または全てから選択される。
【0232】
サブゲノム区間のこれらおよび他のセットおよびグループは、本明細書の他の箇所、例えば、「遺伝子選択」(概要および/または発明の詳細な説明)と題されるセクションにおいてより詳細に検討される。
【0233】
用途
【0234】
本明細書に開示される方法は、最適化された標的捕捉試薬(例えば、ベイト)ベースの選択、最適化されたアラインメント、および最適化された突然変異コーリングを含む、例えば、ゲノムのがん関連セグメントに適用されるような、多数の最適化された要素の統合を可能にする。本明細書に記載される方法は、がんごと、遺伝子ごとおよび部位ごとを基準に最適化され得る腫瘍のNGSに基づく分析を提供する。これは、例えば、本明細書に記載される遺伝子/部位および腫瘍タイプに適用することができる。本方法は、所定の配列決定技術を用いて突然変異検出の感受性および特異性のレベルを最適化する。がんごと、遺伝子ごと、部位ごとの最適化は、臨床製品に不可欠な感受性/特異性の非常に高いレベル(例えば、両方とも99%を超える)を提供する。
【0235】
理論に拘束されることを望まないが、一部の実施形態では、本明細書に記載される方法は、選択されたゲノム領域の検出における感受性の増加から恩恵を受ける一般的な配列決定応用に適用することができると考えられる。例えば、これらの用途には、限定されないが、有病率に基づいてカバレッジが増加した遺伝性がんパネル、特定の疾患経路を標的とした他の全エクソームシークエンシング(WES)検査、および実施可能な局所事象の候補の濃縮を伴う出生前検査が含まれる。
【0236】
一部の実施形態では、本明細書に記載される方法および組成物は、例えば、変化タイプまたは分析の目的に基づいて、1つ以上のサブゲノム区間についての配列決定深度を調節する(例えば、調整または最適化する)ために使用することができる。例えば、高感受性の体細胞性突然変異コーリングは、高い配列決定深度を必要とし得、腫瘍遺伝子変異量(TMB)の評価は、中等度の配列決定深度を必要し得る。一部の実施形態では、少数のサブゲノム区間をより高い配列決定深度まで配列決定し(例えば、体細胞性突然変異を分析するためである)、多数のサブゲノム区間をより低い配列決定深度まで配列決定する(例えば、TMBを評価するためである)。
【0237】
一部の実施形態では、本明細書に記載される方法および組成物は、組み合わせた生殖系列および体細胞性突然変異コーリングに使用することができる。例えば、体細胞性突然変異コーリングに(例えば、コーリングの感受性を高めるために)、高い配列決定の深度を必要とし得るが、生殖系列突然変異コーリングには必要ではない。一部の実施形態では、本明細書に記載される標的捕捉試薬(例えば、ベイト)は、体細胞性突然変異に関連する対象区間の回復を増加させ、生殖系列突然変異に関連する対象区間の回復を低くするように、例えば、同時に、または単一の捕捉工程において、調節することができる。一部の実施形態では、標的捕捉試薬(例えば、ベイト)を調節することは、標的捕捉試薬(例えば、ベイト)の1つ以上(例えば、全て)の比を変化させることを含む。本明細書に記載される方法および組成物は、例えば、臨床的意義を有する生殖系列変異を分析するのに有用であり得る(例えば、BRCA1/2)。本明細書に記載される方法および組成物は、例えば、ヒト白血球抗原(HLA)タイピングを用いた組み合わせた体細胞性突然変異コーリングに、例えば、バックグラウンド突然変異率(pCV)を決定するのに有用であり得る。
【0238】
一部の実施形態では、本明細書に記載される方法および組成物は、大きなダイナミックレンジ遺伝子発現プロファイリングの最適化のために使用することができる。例えば、高い配列決定深度は、高発現遺伝子の分析に必要とされ得るが、低発現遺伝子の分析には必要ではない。一部の実施形態では、高い配列決定深度は、低発現遺伝子の分析に必要とされ得る。一部の実施形態では、高い配列決定深度は、高発現遺伝子についてではなく、低発現遺伝子を分析するために必要とされ得る。一部の実施形態では、本明細書に記載される標的捕捉試薬(例えば、ベイト)は、高発現遺伝子に関連する対象区間の回復を低下させ、低発現遺伝子に関連する対象区間の回復を増加させるために、例えば、同時にまたは単一の捕捉工程において調節することができる。
【0239】
一部の実施形態では、本明細書に記載される方法および組成物は、組み合わせたコピー数変化(CNA)コーリングおよび体細胞性突然変異コーリングのために使用することができる。例えば、体細胞性突然変異をコールするため(例えば、コーリングの感受性を増加させるため)であるが、CNAをコールしないために、高い配列決定深度が必要とされ得る。一部の実施形態では、本明細書に記載される標的捕捉試薬(例えば、ベイト)は、体細胞性突然変異に関連する対象区間の回復を増加させ、例えば、同時に、または単一の捕捉工程において増幅された対象区間の回復を低くするように調節することができる。
【0240】
一部の実施形態では、本方法は、ゲノム変化、例えば、体細胞性変化の評価に応答する治療を選択することをさらに含む。一部の実施形態では、本方法は、突然変異量、例えば、突然変異量レベルの増加または減少の評価に応答する治療を選択することをさらに含むことができる。一部の実施形態では、本方法は、ゲノム変化の評価に応答する治療を投与することをさらに含む。一部の実施形態では、本方法は、試料、またはゲノム変化の評価に応答して試料が誘導された対象を分類することをさらに含む。一部の実施形態では、本方法は、試料が得られる対象のために臨床治験の適格性を決定することをさらに含む。一部の実施形態では、本方法は、報告書、例えば、電子的な、ウェブベースの、または紙による報告書を、患者に、または別の人もしくは団体、世話人、医師、がん専門医、病院、診療所、第三者支払人、保険会社もしくは政府機関に生成および送達することをさらに含む。一部の実施形態では、報告書は、本明細書に記載される方法からの出力を含む。
【0241】
本明細書に記載される方法は、最適な治療および疾患管理の決定に情報を提供するために、常套的な実世界の試料からの次世代シークエンシング技術を用いて、妥当と考えられる(典型的には50~500遺伝子の範囲であり得る)包括的な遺伝子セットについての、臨床的および調節グレードの包括的分析およびゲノム異常の解釈を提供する。
【0242】
本明細書に記載される方法は、最適な治療および疾患管理の決定に情報を提供するために、がん専門医/病理医が試料を送付し、腫瘍に関するゲノムおよび他の分子変化の包括的な分析および説明を受け取るためのワンストップショッピングを提供する。
【0243】
本明細書に記載される方法は、標準的に利用可能な試料を採取する、強固な実世界の臨床腫瘍学診断ツールを提供し、1つの検査では、腫瘍を駆動する可能性があり、がん専門医の治療決定に情報を与えるために有用であり得る異常の包括的な説明をがん専門医に提供するための包括的なゲノムおよび他の分子異常分析を提供する。
【0244】
本明細書に記載される方法は、例えば、臨床グレードの質を有する次世代シークエンシング(NGS)による、患者のがんゲノムの包括的な分析を提供する。方法は、最も関連する遺伝子および潜在的な変化を含み、突然変異(例えば、インデルまたは塩基置換)、コピー数、再配列、例えば、転座、発現、およびエピジェネティックマーカーの分析のうちの1つ以上を含む。遺伝学的分析のアウトプットは、実施可能な結果の記述的報告と関連付けることができる。方法は、最新の一連の関連する科学的および医学的知識と使用を結びつける。
【0245】
一部の実施形態では、本方法は、ヒトの任意の疾患(例えば、がん)もしくは障害の診断、予防もしくは治療、または健康の評価のための情報を提供する目的で、ヒト由来の試料を分析する。一部の実施形態では、本方法は、臨床検査改善修正法案(CLIA)および/または米国病理学会(CAP)によって提供されるガイドラインに従って行われる。一部の実施形態では、本方法は、CLIAおよび/またはCAP認定施設において行われる。一部の実施形態では、本方法は、食品医薬品局(FDA)、欧州医薬品庁(EMA)、品質システム規制(QSR)、欧州委員会(CE)、例えば、CE体外診断(CE-IVD)、中国食品医薬品局(CFDA)または他の規制機関によって提供されるガイドラインに従って行われる。一部の実施形態では、本方法は、FDA、QSR、CEまたはCFDA認定施設において行われる。一部の実施形態では、本方法は、QSR認証施設において行われる。一部の実施形態では、本方法は、臨床グレードの試料、例えば、臨床診療、治験、または患者ケアの管理に適した試料を分析する。一部の実施形態では、試料は、レトロスペクティブ試料および/またはプロスペクティブ試料を含む。一部の実施形態では、レトロスペクティブ試料は、治療が投与される前または後に分析される試料を含むかまたは研究試料である。一部の実施形態では、プロスペクティブ試料は、治療で処理されていない対象由来の試料を含む。一部の実施形態では、プロスペクティブ試料を分析するための本明細書に記載される方法の使用は、試料が得られた、例えば、由来する対象に対する治療の結果の予測をもたらすことができる。
【0246】
一部の実施形態では、本方法は、例えば、本明細書に記載されるように、診断として使用される。一部の実施形態では、本方法は、コンパニオン診断においてまたはコンパニオン診断とともに使用される。一部の実施形態では、本方法は、補足的診断として使用される。
【0247】
一部の実施形態では、本方法の有効性は、精度、正確さ、感受性、特異性、報告可能な範囲、または参照区間のうちの1つ以上(例えば、2、3、4、5個、または全て)の決定によって(例えば、CLIA規則に基づいて)確立される。一部の実施形態では、精度は、カバレッジおよび品質(例えば、Phredスコア)、例えば、標的領域における公知の変異体(例えば、SNP、インデル)によって決定される。ある種の実施形態では、正確さは、例えば、公知の変異体について、異なるオペレータと機器の間の配列複製およびカバレッジ分布によって決定される。ある種の実施形態では、特異性は、例えば、十分に特徴づけられた標的を有するいくつかの試料において、偽陽性率、偽変異体が特定のカバレッジ閾値で同定される程度によって決定される。ある種の実施形態では、感受性は、例えば、十分に特徴づけられた標的を有するいくつかの試料において、公知の変異体を検出する尤度検定によって決定される。ある種の実施形態では、報告可能な範囲は、例えば、反復領域、インデル、または対立遺伝子ドロップアウトを用いて、1つ以上の遺伝子のイントロンバッファーおよびエクソン領域により決定される。ある種の実施形態では、参照間隔は、例えば、影響を受けていない集団において、配列変動バックグラウンド測定によって決定される。
【0248】
一部の実施形態では、本方法は、検証済み試料抽出、ライブラリー調製、バーコード化、プール化、標的濃縮、またはバイオインフォマティクス(例えば、精度および感受性の高い変異体がどのようにコールするか)のうちの1つ以上(例えば、2、3、4、5つ、または全て)の検討を含む設定(例えば、CAP規則の下で)で実施される。
【0249】
本明細書に記載される方法は、患者ケアの質と効率の両方の増加を提供する。これには、ケアの標準はないか、または患者が確立されたラインの療法に不応性であるような、腫瘍が稀なであるかまたは十分に研究されていないタイプの場合の適用が含まれ、さらなる療法の選択または臨床治験への参加の合理的な根拠が有用であり得る。例えば、本方法は、いかなる療法時点でも、意思決定に情報を与えるために完全な「分子イメージ」および/または「分子サブ診断」を利用可能にすることによって、がん専門医が利益を得る選択を可能にする。この結果は、患者が臨床治験への登録に適格であるかどうかを判断するために用いることができる。
【0250】
本明細書に記載される方法は、例えば、電子的な、ウェブベースの、または紙形式で、患者にまたは別の人もしくは団体、例えば、世話人、例えば、医師、例えば、がん専門医、病院、診療所、第三者支払人、保険会社または政府機関に報告書を提供することを含むことができる。報告書は、本方法からのアウトプット、例えば、ヌクレオチド値の同定、変化、突然変異または野生型配列の存在もしくは不存在の指標、例えば、試料タイプの腫瘍と関連する対象区間を含むことができる。報告書はまた、腫瘍遺伝子変異量のレベルに関する情報も含むことができる。報告書はまた、1つ以上の他のゲノムシグネチャー、例えば、連続的/複雑なバイオマーカー、例えば、マイクロサテライト不安定性のレベル、またはヘテロ接合性(LOH)の存在もしくは不存在に関する情報を含むことができる。報告書はまた、疾患における、配列、例えば、変化、突然変異、または野生型配列の役割に関する情報を含むことができる。このような情報には、予後、耐性、または潜在的もしくは示唆される療法オプションに関する情報が含まれ得る。報告書は、療法オプションの可能性のある有効性、療法オプションの受容性、または療法オプションを患者、例えば、配列を有する患者に適用する妥当性に関する情報、試験で同定された変化、および実施形態では報告書で同定された変化を含むことができる。例えば、報告書は、患者への、薬物の投与、例えば、ある投薬量でまたは治療レジメンでの投与、例えば、他の薬物と組み合わせた投与に関する情報または推奨を含むことができる。ある実施形態では、本方法で同定された全ての突然変異が報告書で同定されるわけではない。例えば、報告書は、例えば、治療オプションを用いて、がんの発生、予後、病期、または治療に対する感受性と相関のレベルを有する遺伝子における突然変異に限定することができる。本明細書に特徴づけられる方法は、本方法を実施する実体による試料の受領から7、14、または21日以内に、例えば、本明細書に記載される実体への報告書の送達を可能にする。したがって、本発明に特徴づけられる方法は、例えば、試料の受領後の7、14または21日以内の迅速な応答時間を可能にする。
【0251】
本明細書に記載される方法はまた、組織学的に正常な試料、例えば、外科的切除縁からの試料を評価するために使用することができる。本明細書に記載される1つ以上の変化が検出される場合、組織は、例えば、悪性または前がんとして再分類することができ、および/または治療の経過を修飾することができる。
【0252】
一部の実施形態では、本明細書に記載される方法は、がんでない用途、例えば、法医学的応用(例えば、歯科記録の使用に代わる、またはそれに加える同定)、父性検査、および疾患診断および予後、とりわけ、例えば、感染症、自己免疫疾患、嚢胞性線維症、ハンチントン病、アルツハイマー病において有用である。例えば、本明細書に記載される方法による遺伝的変化の同定は、特定の障害を発症する個体の存在またはリスクを示すことができる。
【0253】
システム
【0254】
別の態様では、本発明は、試料中のゲノム変化を評価するためのシステムを特徴とする。システムは、メモリに作動可能に接続された少なくとも1つのプロセッサを含み、実行時の少なくとも1つのプロセッサは、本明細書に記載されるように、試料を分析する方法を行うように構成されている。
【0255】
別段の定義がない限り、本明細書において使用される全ての技術用語および科学用語は、本発明が属する技術分野の当業者によって一般的に理解されるものと同じ意味を有する。本明細書に記載されたものと類似または同等の方法および材料が、本発明の実施または試験において使用され得るが、適切な方法および材料は、以下に記載される。本明細書に記載される全ての刊行物、特許出願、特許、および他の参考文献は、それらの全体が参照により本明細書に組み込まれる。さらに、材料、方法、および実施例は、単に例示的であり、限定することを意図しない。
【0256】
本発明の他の特徴および利点は、発明の詳細な説明、図面、および特許請求の範囲から明らかである。
【図面の簡単な説明】
【0257】
【
図1】ブロッカーなしの3つの遺伝子(EGFR、NF1およびTP53)に対するATMおよびAPCの標的カバレッジを示すプロットである。y軸はlog2の比を示し、x軸は遺伝子標的を示す。
【
図2】他の全てのNHC標的領域と比較したAPC標的領域の観察されたカバレッジ対予想されるカバレッジ中央値を示すグラフである。
【
図3】狭く高いカバレッジ(NHC)標的とブロックされた低下したカバレッジの非NHC標的との分離を示す、平均コンセンサス標的カバレッジを示すヒストグラムである。y軸はカウントを示し、x軸は標的配列決定深度を示す。
【発明を実施するための形態】
【0258】
本明細書に記載される方法は、標的の示差的配列決定深度が、異なる標的に対する標的捕捉試薬上の修飾(例えば、ビオチン化)のレベルを最適化することによって制御された方法で達成され得るという観察に、少なくとも部分的に基づいている。ある種の実施形態では、本方法は、サブクローン性突然変異を含む可能性が高いかまたはより臨床的に重要である特定のゲノム領域、エクソン、またはRNA転写物に対してより高い感受性を提供する。他の実施形態では、本方法は、体細胞性突然変異が評価される標的対、生殖系列SNP対立遺伝子バランスを評価するために使用される標的に、より高い配列決定深度を提供する。
【0259】
理論に拘束されることを望まないが、一部の実施形態では、本明細書に記載される方法は、より低いコストでゲノム変化を評価するために同様の性能を達成することができると考えられる。
【0260】
本明細書に記載される方法は、より小さい遺伝子セットにおける高い配列決定深度で組織、血液、CTC、cfDNA、またはctDNAからの体細胞性突然変異を測定することができる標的捕捉試薬を提供することを可能にし、より低い配列決定深度でより大きなゲノム領域上のゲノムシグネチャー、例えば、連続的/複雑なバイオマーカー(例えば、腫瘍遺伝子変異量、例えば、血液腫瘍遺伝子変異量)を同時に測定することを可能にする。ある種の実施形態では、本明細書に記載される方法は、高い配列決定深度での体細胞性変化および低い配列決定深度での生殖系列変化コーリングを測定することを可能にする。ある種の実施形態では、本明細書に記載される方法は、高い配列決定深度で体細胞性変化を測定し、低い配列決定深度でコピー数または構造変異体(例えば、約1Kb~3Mbの長さ)を測定することを可能にする。他の実施形態では、この方法を使用して、RNA配列決定またはcDNA配列決定用途、または異なる遺伝子もしくは配列の存在量が供給源試料において示差的である他の用途における特定の遺伝子の配列決定深度を制御することができる。このような状況では、存在量の低い遺伝子の測定効率を改善するために、存在量の高い遺伝子の配列カバレッジを低下させる利点があり得る。理論に拘束されることを望まないが、一部の実施形態では、本明細書に記載される方法は、異なる標的全体にわたる配列決定カバレッジを正規化するために使用され得ると考えられ、いくつかの標的が標的捕捉試薬により、より効率的におよび/または特異的に捕捉されるが、他の標的は、標的捕捉試薬によりあまり効率的におよび/または特異的に捕捉されない(例えば、標的中の高いまたは低いGC含有量、または2つの異なる標的間の類似性に起因する)。本明細書に記載される方法の他の有用性は、限定されないが、遺伝子発現プロファイリング、SNPの同定、およびコピー数変化(CNA)の決定を含む。
【0261】
ハイブリッド捕捉手法を用いて示差的配列決定深度を得る上での課題の1つは、標的捕捉試薬が、典型的には、効率的な捕捉(例えば、標的捕捉の飽和を確実にするため)に必要とされる標的DNAに対して高いモル過剰であり、標的DNAのコピー数の定量的測定を可能にすることである(例えば、標的DNAの大部分が捕捉される場合、深度は、標的のコピー数にほぼ直線的に比例する)。この状況では、特定の標的捕捉試薬の相対量を増加または減少させることは、得られた配列決定深度に対して比較的小さな効果を有する。
【0262】
本明細書に記載される方法は、例えば、異なる標的に対する標的捕捉試薬上の修飾(例えば、ビオチン化)レベルを制御することによって、示差的配列深度を提供する。(標的捕捉試薬が過剰であるために)標的DNAの大部分が捕捉されると仮定すると、修飾された(例えば、ビオチン化された)特定の標的に対する標的捕捉試薬の相対量は、ハイブリッド捕捉反応によって保持される特定の標的DNAの量に直接影響を及ぼし得る。例えば、標的Aの標的捕捉試薬が25%ビオチン化され、標的Bの標的捕捉試薬が50%ビオチン化されている場合、標的AのDNAの相対量対標的BのDNAの量は約1:2であると予想される。修飾されていない(例えば、ビオチン化されていない)標的捕捉試薬中で所定の比率で混合することによって、特定のタイプの標的捕捉試薬の修飾(例えば、ビオチン化)のレベルを低下することが容易であり、配列決定によって異なる標的の出力配列決定深度比を決定することが容易であるため、特定の標的の特異的な示差的配列決定深度を達成するために、反応を滴定することが望ましい。
【0263】
一部の実施形態では、特定のタイプの標的捕捉試薬上の修飾(例えば、ビオチン化)のレベルを増加させることは、異なる修飾、精製方法、または捕捉のための基質(例えば、溶液中対表面上)によって達成され得る。他の実施形態では、異なる標的の配列決定深度の均一性は、実施がより良好である標的捕捉試薬上の修飾(例えば、ビオチン化)のレベルを低下させ、および/または測定された標的配列決定深度の分布を強化するために、実施がより低い標的捕捉試薬の修飾(例えば、ビオチン化)のレベルを増加させることによって増加される。
【0264】
定義
【0265】
ある種の用語が最初に定義される。追加の用語は、明細書全体を通じて定義される。
【0266】
本明細書で使用される場合、冠詞「ある(a)」および「ある(an)」は、冠詞の文法的対象物の1つまたは1を超える(例えば、少なくとも1つ)を指す。
【0267】
「約」および「ほぼ」とは、一般的に、測定の性質または正確さを与えられる測定された量についての許容可能な誤差の程度を意味する。誤差の例示的な程度は、所定の値または値の範囲の20パーセント(%)以内であり、典型的には10%以内であり、より典型的には5%以内である。
【0268】
「高い配列決定深度事象」という用語は、本明細書で使用される場合、配列(例えば、サブゲノム区間配列)であって、例えば、少なくとも2000×、2500×、3000×、3500×、4000×、4500×、5000×、5500×、6000×、6500×、7000×、7500×、8000×、8500×、9000×、9500×、10000×またはそれ以上の、高い配列決定深度まで配列決定されるものを指す。ある実施形態では、高い配列決定深度事象は、表現型(例えば、がん表現型、細胞分裂、増殖または生存における効果)と関連する。ある実施形態では、高い配列決定深度事象は、転帰(例えば、治療転帰、診断または予後)と相関を有する。ある実施形態では、高い配列決定深度事象は、望ましくない表現型、療法に対する反応の障害または可能性と相関(例えば、正の相関または負の相関)を有する遺伝的事象である。ある実施形態では、高い配列決定深度事象は、変化、例えば、腫瘍形成につながるかもしくはそれを引き起こす突然変異、または療法様式に対する応答性もしくは非応答性と相関する突然変異を含む。ある実施形態では、高い配列決定深度事象は、表1A~5Aのいずれか1つに記載される遺伝子における遺伝的事象を含む。ある実施形態では、高い配列決定深度事象は、表3C、3D、3Eまたは5Aに記載される遺伝子における遺伝的事象を含む。ある実施形態では、第1の断片(F1)は、高い配列決定深度事象と関連付けられる。ある実施形態では、高い配列決定深度事象は、F1にまたはF1内に存在する。ある実施形態では、F1は、高い配列決定深度事象を含む。ある実施形態では、第2の断片(F2)は、高い配列決定深度事象と関連しない。ある実施形態では、高い配列決定深度事象は、F2にまたはF2内に存在しない。ある実施形態では、F2は、高い配列決定深度事象を含まない。ある実施形態では、高い配列決定深度事象は、ある事象ではなく、そのレベルが、1つ以上のバイオマーカー、例えば、腫瘍遺伝子変異量(TMB)、マイクロサテライト不安定性(MSI)、またはその両方の決定と関連する。ある実施形態では、高い配列決定深度事象は、実施可能な事象、例えば、本明細書に記載される実施可能な事象を含む。ある実施形態では、高い配列深度事象は、高い配列深度、例えば、低い配列深度事象よりも、少なくとも1、2、3、4、5、6、7、8、9、または10倍大きい深度まで配列決定される配列(例えば、サブゲノム区間配列)を含む。
【0269】
「低い配列決定深度事象」という用語は、本明細書で使用される場合、例えば、2000×、1500×、1000×、900×、800×、700×、600×、500×、400×、300×、200×未満、またはそれより低い、低い配列決定深度まで配列決定される配列(例えば、サブゲノム区間配列)を指す。ある実施形態では、低い配列決定深度事象は、表現型(例えば、がん表現型、細胞分裂、増殖または生存に対する効果)と関連しない。ある実施形態では、低い配列決定深度事象は、転帰(例えば、治療転帰、診断または予後)と相関を有しているかまたは有していない。ある実施形態では、低い配列決定深度事象は、望ましくない表現型、療法に対する反応の障害または可能性と相関(例えば、正の相関または負の相関)を有するかまたは有しない遺伝的事象である。ある実施形態では、低い配列決定深度事象は、表現型を伴わない変化、例えば、サイレント突然変異またはSNPである。ある実施形態では、低い配列決定深度事象は、表1A~5Aのいずれか1つに記載される遺伝子における遺伝的事象である。ある実施形態では、低い配列決定深度事象は、表3C、3D、3Eまたは5Aに記載される遺伝子における遺伝的事象ではない。ある実施形態では、第2の断片(F2)は、低い配列決定深度事象と関連付けられる。ある実施形態では、低い配列決定深度事象は、F2にまたはF2内に存在する。ある実施形態では、F2は、低い配列決定深度事象を含む。ある実施形態では、第1の断片(F1)は、低い配列決定深度事象と関連しない。ある実施形態では、低い配列決定深度事象は、F1にまたはF1内に存在しない。ある実施形態では、F1は、低い配列決定深度事象を含まない。ある実施形態では、低い配列決定深度事象は、ある事象を含み、そのレベルが、1つ以上のバイオマーカー、例えば、腫瘍遺伝子変異量(TMB)、マイクロサテライト不安定性(MSI)、またはその両方の決定に関連する。ある実施形態では、低い配列決定深度事象は、実施可能な事象、例えば、本明細書に記載される実施可能な事象を含む。ある実施形態では、低い配列決定深度事象は、実施可能な事象、例えば、本明細書に記載される実施可能な事象を含まない。ある実施形態では、低い配列深度事象は、低い配列深度、例えば、高い配列深度事象よりも1、2、3、4、5、6、7、8、9、または10倍未満低い深度まで配列決定される配列(例えば、サブゲノム区間配列)を含む。
【0270】
「実施可能な事象」または「実施可能性」という用語は、本明細書で使用される場合、表現型(例えば、がん表現型、細胞分裂、増殖または生存に対する効果)と関連する配列(例えば、サブゲノム区間配列)を指す。ある実施形態では、実施可能な事象は、結果(例えば、治療結果、診断または予後)と相関を有する。ある実施形態では、実施可能な事象は、望ましくない表現型、療法に対する反応の障害または可能性と相関(例えば、正の相関または負の相関)を有する遺伝的事象である。ある実施形態では、実施可能な事象は、変化、例えば、腫瘍形成につながるかまたはそれを引き起こす突然変異、または療法様式に対する応答性もしくは非応答性と相関する突然変異である。ある実施形態では、実施可能な事象は、表1A~5Aのいずれか1つに記載される遺伝子における遺伝的事象である。ある実施形態では、TMBまたはMSIのレベルは、実施可能な事象と関連付けることができるが、TMBまたはMSIのレベルを決定する場合に識別される1つ以上の変化は、実施可能であり得るかまたはあり得ない。
【0271】
ある実施形態では、実施可能な事象は、全内容が参照により本明細書に組み込まれるHedleyら、(2016年)Nature Reviews 16巻(5号)319-29頁に記載される方法に基づいて決定することができる。ある実施形態では、実施可能な事象は、十分に特徴づけられた再発突然変異を含む。ある実施形態では、実施可能な事象は、細胞アッセイにおいて形質転換をもたらすことができる突然変異を含む。ある実施形態では、実施可能な事象は、化合物に対する細胞の感受性を変化させる、例えば、増大させることができる突然変異を含む。ある実施形態では、実施可能な事象は、病原性である突然変異を含む。
【0272】
「取得する」または「取得すること」という用語は、本明細書で使用される場合、物理的実体または値を「直接的に取得すること」または「間接的に取得すること」によって、物理的実体または値、例えば数値の所有を得ることを指す。「直接的に取得すること」とは、物理的実体または値を得るためのプロセス(例えば、合成方法または分析方法を行うこと)を行うことを意味する。「間接的に取得すること」とは、物理的実体または値を別の団体または供給源(例えば、物理的実体または値を直接的に取得した第三者研究所)から受け取ることを指す。物理的実体を直接的に取得することは、物理的物質、例えば、出発物質の物理的変化を含むプロセスを行うことを含む。例示的な変化には、2つ以上の出発物質から物理的実体を作製し、物質をせん断または断片化し、物質を分離または精製し、2つ以上の別々の実体を混合物に合わせ、共有結合もしくは非共有結合を切断または形成することを含む化学反応を行うことが含まれる。値を直接的に取得することには、試料または別の物質の物理的変化を含むプロセスを行い、例えば、物質、例えば、試料、被分析物、または試薬の物理的変化を含む分析プロセス(本明細書では「物理的分析」と称されることもある)を行い、分析法を行う方法が含まれ、例えば、方法は、以下:物質、例えば、被分析物、またはその断片もしくは他の誘導体を別の物質から分離または精製すること;被分析物、またはその断片もしくは他の誘導体を、別の物質、例えば、バッファー、溶媒、または反応物と組み合わせること;あるいは、被分析物、またはその断片もしくは他の誘導体の構造を、例えば、被分析物の第1の原子と第2の原子との間の共有結合または非共有結合を切断または形成することによって変化させ、または試薬、またはその断片もしくは他の誘導体の構造を、例えば、試薬の第1の原子と第2の原子との間の共有結合または非共有結合を切断または形成することによって変化させることのうちの1つ以上を含む。
【0273】
「配列を取得すること」または「リードを取得すること」という用語は、本明細書で使用される場合、配列またはリードを「直接的に取得すること」または「間接的に取得すること」によって、ヌクレオチド配列またはアミノ酸配列の保有を得ることを指す。配列またはリードを「直接的に取得すること」とは、配列決定方法(例えば、次世代シークエンシング(NGS)法)を行うなどの、配列を得るためのプロセスを行うこと(例えば、合成方法または分析方法を行うこと)を意味する。配列またはリードを「間接的に取得すること」とは、別の団体または供給源(例えば、配列を直接的に取得した第三者研究所)から配列の情報もしくは知識を受け取るか、または配列を受け取ることを指す。取得された配列またはリードは、完全な配列、例えば、少なくとも1つのヌクレオチドを配列決定すること、または対象に存在するものとして本明細書に開示された変化のうちの1つ以上を同定し、配列を取得することを構成する情報もしくは知識を得ることは必要ではない。
【0274】
配列またはリードを直接的に取得することは、物理的物質、例えば、本明細書に記載される試料などの出発物質の物理的変化を含むプロセスを行うことを含む。例示的な変化には、2つ以上の出発物質から物理的実体を作製すること、ゲノムDNA断片などの物質をせん断または断片化すること;物質を分離または精製すること(例えば、組織から核酸試料を単離すること);2つ以上の別々の実体を混合物に合わせること、共有結合または非共有結合を切断または形成することを含む化学反応を行うことが含まれる。値を直接的に取得することは、上述したように、試料または別の物質の物理的変化を含むプロセスを行うことを含む。断片のサイズ(例えば、断片の平均サイズ)は、2500bp以下、2000bp以下、1500bp以下、1000bp以下、800bp以下、600bp以下、400bp以下、または200bp以下であり得る。一部の実施形態では、断片(例えば、cfDNA)のサイズは、約150bp~約200bp(例えば、約160bp~約170bp)である。一部の実施形態では、断片(例えば、FFPE試料由来のDNA断片)のサイズは、約150bp~約250bpである。一部の実施形態では、断片(例えば、FFPE試料中のRNAから得られたcDNA断片)のサイズは、約100bp~約150bpである。
【0275】
「試料を取得する」という用語は、本明細書で使用される場合、試料、例えば、本明細書に記載される試料の所持を、試料を「直接的に取得する」ことによって、または「間接的に取得する」ことによって得ることを指す。「試料を直接的に取得する」とは、試料を得るためのプロセスを行うこと(例えば、手術または摘出などの物理的方法を行うこと)を意味する。「試料を間接的に取得する」とは、別の団体または供給源(例えば、試料を直接的に取得した第三者研究所)から試料を受け取ることを意味する。試料を直接的に取得することは、物理的物質、例えば、組織、例えば、ヒト患者の組織、または以前に患者から単離された組織などの出発物質の物理的変化を含むプロセスを行うことを含む。例示的な変化には、出発物質から物理的実体を作製すること、組織を解剖または擦過すること;物質(例えば、試料組織または核酸試料)を分離または精製すること;2つ以上の別々の実体を混合物に合わせること;共有結合もしくは非共有結合を切断または形成することを含む化学反応を行うことが含まれる。試料を直接的に取得することは、例えば、上述したように、試料または別の物質の物理的変化を含むプロセスを行うことを含む。
【0276】
遺伝子または遺伝子産物(例えば、マーカー遺伝子または遺伝子産物)の「変化」または「変化した構造」とは、本明細書で使用される場合、正常または野生型遺伝子と比較して、遺伝子または遺伝子産物の完全性、配列、構造、量または活性に影響を与える、遺伝子または遺伝子産物内の突然変異または複数の突然変異の存在、例えば、突然変異を指す。変化は、正常もしくは健康な組織または細胞(例えば、対照)におけるその量、構造、および/または活性と比較した、がん組織もしくはがん細胞における量、構造、および/または活性であり得、がんなどの病状と関連する。例えば、がんに関連する変化、または抗がん療法に対する応答性を予測する変化は、正常、健康な組織または細胞と比較して、がん組織またはがん細胞において、変化されたヌクレオチド配列(例えば、突然変異)、アミノ酸配列、染色体転座、染色体内逆位、コピー数、発現レベル、タンパク質レベル、タンパク質活性、エピジェネティック修飾(例えば、メチル化またはアセチル化状態)、または翻訳後修飾を有することができる。例示的な突然変異は、限定されないが、点突然変異(例えば、サイレント、ミスセンス、またはナンセンス)、欠失、挿入、逆位、重複、増幅、転座、染色体間および染色体内再配列を含む。突然変異は、遺伝子のコード化領域または非コード化領域に存在し得る。ある種の実施形態では、変化(複数可)は、再配列、例えば、1つ以上のイントロンまたはその断片を含むゲノム再配列(例えば、5’-および/または3’-UTRにおける1つ以上の再配列)として検出される。ある種の実施形態では、変化は、表現型、例えば、がん性表現型(例えば、1つ以上のがんリスク、がん進行、がん治療またはがん治療に対する抵抗性)と関連する(または関連しない)。一実施形態では、変化(または腫瘍遺伝子変異量)は、がんの遺伝的なリスク因子、ポジティブな治療反応予測因子、ネガティブな治療反応予測因子、ポジティブな予後因子、ネガティブな予後因子、または診断因子のうちの1つ以上と関連する。
【0277】
本明細書で使用される場合、用語「インデル」は、細胞の核酸中の1つ以上のヌクレオチドの挿入、欠失、または両方を指す。ある種の実施形態では、インデルは、1つ以上のヌクレオチドの挿入と欠失の両方を含み、挿入と欠失の両方は、核酸上で近接する。ある種の実施形態では、インデルは、ヌクレオチドの総数の正味の変化をもたらす。ある種の実施形態では、インデルは、約1~約50ヌクレオチドの正味の変化をもたらす。
【0278】
「クローンプロファイル」という用語は、本明細書で使用される場合、対象区間(またはそれを含む細胞)の1つ以上の配列、例えば、対立遺伝子またはシグネチャーの出現、同一性、変動性、分布、発現(サブゲノムシグネチャーの転写されたコピーの出現またはレベル)、または存在量、例えば、相対的存在量を指す。ある実施形態では、クローンプロファイルは、対象区間についての複数の配列、対立遺伝子、またはシグネチャーが試料中に存在する場合、対象区間(またはそれを含む細胞)についての、1つの配列、対立遺伝子、またはシグネチャーの相対的存在量の値である。例えば、ある実施形態では、クローンプロファイルは、対象区間についての複数のVDJまたはVJの組合せの1つ以上の相対的存在量に対する値を含む。ある実施形態では、クローンプロファイルは、対象区間に対する選択されたVセグメントの相対的存在量の値を含む。ある実施形態では、クローンプロファイルは、例えば、体細胞性高頻度突然変異から生じるような、対象区間の配列内の多様性の値を含む。ある実施形態では、クローンプロファイルは、例えば、配列、対立遺伝子もしくはシグネチャーを含む発現されたサブゲノム区間の出現またはレベルによって証明されるように、配列、対立遺伝子もしくはシグネチャーの発現の出現またはレベルに対する値を含む。
【0279】
「発現されたサブゲノム区間」という用語は、本明細書で使用される場合、サブゲノム区間の転写された配列を指す。ある実施形態では、発現されたサブゲノム区間の配列は、それが転写されるサブゲノム区間とは異なり、例えば、これは、いくつかの配列が転写されない場合があるからである。
【0280】
「突然変異対立遺伝子頻度」(MAF)という用語は、本明細書で使用される場合、例えば、試料中の、特定の遺伝子座における突然変異対立遺伝子の相対的頻度を指す。一部の実施形態では、突然変異対立遺伝子頻度は、分率またはパーセンテージとして表される。
【0281】
「シグネチャー」という用語は、本明細書で使用される場合、対象区間の配列を指す。シグネチャーは、対象区間における複数の可能性のうちの1つの出現を診断することができ、例えば、シグネチャーは、再構成された重鎖または軽鎖可変領域遺伝子における選択されたVセグメントの出現;選択されたVJ接合点の出現、例えば、再構成された重鎖可変領域遺伝子における選択されたVセグメントおよび選択されたJセグメントの出現を診断することができる。ある実施形態では、シグネチャーは、複数の特定の核酸配列を含む。したがって、シグネチャーは、特定の核酸配列に限定されるものではなく、むしろ、対象区間における第1の配列群または可能性と、対象区間における第2の群の可能性とを区別することができるほど十分に固有であり、例えば、第1のVセグメントと第2のVセグメントとを区別することができ、例えば、様々なVセグメントの使用の評価を可能にする。シグネチャーという用語は、特定の核酸配列である特定のシグネチャーという用語を含む。ある実施形態では、シグネチャーは、特定の事象、例えば、再配列事象を示すか、またはその生成物である。
【0282】
「サブゲノム区間」という用語は、本明細書で使用される場合、ゲノム配列の一部を指す。ある実施形態では、サブゲノム区間は、単一のヌクレオチド位置であり得、例えば、その位置での変異体は、腫瘍表現型と(正または負に)関連している。ある実施形態では、サブゲノム区間は、1を超えるヌクレオチド位置を含む。そのような実施形態は、長さが少なくとも2、5、10、50、100、150、または250ヌクレオチド位置の配列を含む。サブゲノム区間は、全遺伝子、またはその一部、例えばコード化領域(またはその一部)、イントロン(またはその一部)、またはエクソン(またはその一部)を含むことができる。サブゲノム区間は、天然に存在する、例えば、ゲノムDNA、核酸の断片の全部または一部を含むことができる。例えば、サブゲノム区間は、配列決定反応に供されるゲノムDNAの断片に対応し得る。実施形態では、サブゲノム区間は、ゲノム供給源からの連続した配列である。実施形態では、サブゲノム区間は、ゲノム中で近接していない配列を含み、例えば、cDNA中のサブゲノム区間は、スプライシングの結果として形成されるエクソン-エクソン接合点を含み得る。
【0283】
ある実施形態では、サブゲノム区間は、再配列された配列、例えば、VセグメントとDセグメントとの連結、DセグメントとJセグメントとの連結、VセグメントとJセグメントとの連結、またはJセグメントとクラスセグメントとの連結の結果として生じるB細胞またはT細胞における配列に対応する。
【0284】
ある実施形態では、サブゲノム区間は、1つの配列によって表される。ある実施形態では、サブゲノム区間は、1を超える配列によって表され、例えば、VD配列をカバーするサブゲノム区間は、1を超えるシグネチャーによって表すことができる。
【0285】
ある実施形態では、サブゲノム区間は、単一のヌクレオチド位置;遺伝子内領域または遺伝子間領域;エクソンもしくはイントロン、またはその断片、典型的にはエクソン配列またはその断片;コード化領域または非コード化領域、例えば、プロモーター、エンハンサー、5’非翻訳領域(5’UTR)、もしくは3’非翻訳領域(3’UTR)、またはその断片;cDNAまたはその断片;SNP;体細胞性突然変異、生殖系列突然変異、またはその両方;変化、例えば、点突然変異または単一突然変異;欠失突然変異(例えば、インフレーム欠失、遺伝子内欠失、完全遺伝子欠失);挿入突然変異(例えば、遺伝子内挿入);逆位突然変異(例えば、染色体内逆位);逆位重複突然変異;タンデム重複(例えば、染色体内のタンデム重複);転座(例えば、染色体転座、非逆数転座);再配列(例えば、ゲノム再配列(例えば、1つ以上のイントロンの再配列、1つ以上のエクソンの再配列、またはその組合せおよび/もしくは断片;再配列されたイントロンは5’および/または3’UTRを含み得る));遺伝子コピー数の変化;遺伝子発現の変化;RNAレベルの変化;またはそれらの組合せを含むまたはそれからなる。「遺伝子のコピー数」とは、特定の遺伝子産物をコードする細胞内のDNA配列の数を指す。一般的に、所定の遺伝子について、哺乳動物は、各遺伝子のコピーを2つ有する。コピー数は、例えば、遺伝子増幅または重複によって増加させることができ、または欠失によって低下させることができる。
【0286】
「対象区間」という用語は、本明細書で使用される場合、サブゲノム区間または発現されたサブゲノム区間を指す。ある実施形態では、サブゲノム区間および発現されたサブゲノム区間が対応し、これは、発現されたサブゲノム区間が、対応するサブゲノム区間から発現される配列を含むことを意味する。ある実施形態では、サブゲノム区間および発現されたサブゲノム区間は非対応であり、これは、発現されたサブゲノム区間が、非対応のサブゲノム区間から発現された配列を含まず、むしろ、異なるサブゲノム区間に対応することを意味する。ある実施形態では、サブゲノム区間および発現されたサブゲノム区間は部分的に対応し、これは、発現されたサブゲノム区間が、対応するサブゲノム区間から発現される配列、および異なる対応するサブゲノム区間から発現される配列を含むことを意味する。
【0287】
本明細書で使用される場合、用語「ライブラリー」とは、核酸分子の集合体を指す。一実施形態では、ライブラリーは、核酸分子の集合体、例えば、全ゲノム断片、サブゲノム断片、cDNA、cDNA断片、RNA、例えば、mRNA、RNA断片、またはそれらの組合せの集合体を含む。典型的には、核酸分子は、DNA分子、例えば、ゲノムDNAまたはcDNAである。核酸分子は、断片化された、例えば、せん断されたまたは酵素的に調製されたゲノムDNAであり得る。核酸分子は、対象由来の配列を含み、また、対象に由来しない配列、例えば、アダプター配列、プライマー配列、または同定を可能にする他の配列、例えば「バーコード」配列を含み得る。一実施形態では、ライブラリー核酸分子の一部または全部は、アダプター配列を含む。アダプター配列は、一方または両方の端部に配置することができる。アダプター配列は、例えば、配列決定方法(例えば、NGS法)、増幅、逆転写、またはベクターへのクローニングに有用であり得る。ライブラリーは、核酸分子、例えば、標的核酸分子(例えば、腫瘍核酸分子、参照核酸分子、またはそれらの組合せ)の集合体を含むことができる。ライブラリーの核酸分子は、単一の個体由来であり得る。ある実施形態では、ライブラリーは、1を超える対象(例えば、2、3、4、5、6、7、8、9、10、20、30またはそれ以上の対象)由来の核酸分子を含むことができ、例えば、異なる対象由来の2つ以上のライブラリーを組み合わせて、1を超える対象由来の核酸分子を含むライブラリーを形成することができる。一実施形態では、対象は、がんまたは腫瘍を有する、またはそれを有するリスクがあるヒトである。
【0288】
「ライブラリーキャッチ」とは、ライブラリーのサブセット、例えば、標的捕捉試薬とのハイブリダイゼーションによって捕捉された生成物など、対象区間について濃縮されたサブセットを指す。
【0289】
本明細書で使用される「標的捕捉試薬」とは、標的を捕捉することができる分子を指す。標的捕捉試薬(例えば、ベイトまたは標的捕捉オリゴヌクレオチド)は、標的核酸にハイブリダイズすることができ(例えば、それに相補的である)、それによって標的核酸の捕捉を可能にすることができる核酸分子、例えば、DNAまたはRNA分子を含むことができる。一実施形態では、標的捕捉試薬は、DNA分子(例えば、天然に存在するかまたは修飾されたDNA分子)、RNA分子(例えば、天然に存在するかまたは修飾されたRNA分子)、またはそれらの組合せを含む。一部の実施形態では、標的捕捉試薬は、結合対の機能的な第1のメンバーをさらに含み、これは、例えば、基質上に配置された、結合対の第2のメンバーに結合することができる。他の実施形態では、標的捕捉試薬は、結合対の機能的な第1のメンバーを欠いており、例えば、結合対の第1のメンバーは、結合対の第1のメンバーと第2のメンバーとの間の親和性が低下または除去されるように、変化またはブロックされる。一実施形態では、標的捕捉試薬は、溶液相ハイブリダイゼーションに適している。結合対の機能的な第1のメンバーを含む標的捕捉試薬は、例えば、異なる比で、結合対の機能的な第1のメンバーを欠く標的捕捉試薬と混合して、異なる配列深度に相関し得る、基質による異なる効率の回収を達成することができる。一部の実施形態では、標的捕捉試薬は、例えば、結合対の第1のメンバー、例えば、結合対の機能的な第1のメンバーを含むことによって修飾される。一部の実施形態では、標的捕捉試薬は、修飾されず、例えば、結合対の機能的な第1のメンバーを含まず、または結合対の第1のメンバーが変化されているかもしくはブロックされている。
【0290】
結合対の第1のメンバーは、標的捕捉試薬に直接的または間接的に付着され得る任意の分子タグであり得、それは、機能的である場合、基質に特異的に結合することができる。結合対の第1のメンバーは、標的捕捉試薬配列上の親和性タグであり得る。ある種の実施形態では、結合対の第1のメンバーは、結合対の第2のメンバー、例えば、アビジン分子、またはハプテンもしくはその抗原結合断片に結合する抗体に結合することによって、ハイブリダイゼーション混合物から標的捕捉試薬/核酸分子ハイブリッドの分離を可能にする。結合対の例示的な第1のメンバーとしては、限定されないが、ビオチン分子、ハプテン、抗体、抗体結合断片、ペプチド、およびタンパク質が挙げられる。一部の実施形態では、基質は、ビーズを含む。
【0291】
「相補的」とは、2つの核酸鎖の領域間または同一核酸鎖の2つの領域間の配列相補性を指す。第1の核酸領域のアデニン残基は、残基がチミンまたはウラシルである場合、第1の領域と逆平行である第2の核酸領域の残基と特異的な水素結合(「塩基ペアリング」)を形成することができることが公知である。同様に、第1の核酸鎖のシトシン残基は、残基がグアニンである場合、第1の鎖と逆平行である第2の核酸鎖の残基と塩基ペアリングすることができることが公知である。核酸の第1の領域は、2つの領域が逆平行に配置されるとき、第1の領域の少なくとも1つのヌクレオチド残基が第2の領域の残基と塩基ペアリングすることができる場合、同一または異なる核酸の第2の領域に相補的である。ある種の実施形態では、第1の領域は、第1の部分を含み、第2の領域は、第2の部分を含み、それにより、第1の部分および第2の部分が逆平行に配列される場合、第1の部分のヌクレオチド残基の少なくとも約50%、少なくとも約75%、少なくとも約90%、または少なくとも約95%は、第2の部分のヌクレオチド残基と塩基ペアリングすることができる。他の実施形態では、第1の部分の全てのヌクレオチド残基は、第2の部分のヌクレオチド残基と塩基ペアリングすることができる。
【0292】
用語「がん」および「腫瘍」は、本明細書において互換的に使用される。これらの用語は、制御不能な増殖、不死化、転移能、急速な成長および増殖速度、およびある種の特徴的な形態学的特徴などの、がんを引き起こす細胞の典型的な特性を有する細胞の存在を指す。がん細胞は、多くの場合、腫瘍の形態であるが、このような細胞は、動物内に単独で存在することができ、または白血病細胞などの非腫瘍形成性がん細胞であり得る。これらの用語には、固形腫瘍、軟部組織腫瘍、または転移性病変が含まれる。本明細書で使用される場合、用語「がん」は、前がん、ならびに悪性がんを含む。
【0293】
本明細書で使用される「可能性が高い」または「可能性が増加している」とは、アイテム、対象物、物または人が起こる確率が増加することを指す。したがって、一例において、治療に反応する可能性が高い対象は、参照対象または対象群と比較して、治療に反応する確率が増加している。
【0294】
「可能性は低い」とは、ある事象、アイテム、対象物、物または人が、ある参照に関して発生する確率が減少したことを指す。したがって、治療に反応する可能が低い対象は、参照対象または対象群と比較して、治療に反応する確率が減少している。
【0295】
「対照核酸分子」とは、非腫瘍細胞からの配列を有する核酸分子をいう。
【0296】
本明細書で用いる「次世代シークエンシング」または「NGS」または「NGシークエンシング」とは、個々の核酸分子(例えば、単一分子配列決定における)または個々の核酸分子のクローン的に拡大されたプロキシのいずれかのヌクレオチド配列を高処理量で(例えば、103、104、105またはそれ以上の分子が同時に配列決定される)決定する任意の配列決定方法を指す。一実施形態では、ライブラリー中の核酸種の相対的存在量は、配列決定実験によって生成されたデータ中のそれらの同族配列の相対的存在数をカウントすることによって推定することができる。次世代シークエンシング法は、該技術分野において公知であり、例えば、本明細書に参照により組み込まれるMetzker,M.(2010年)Nature Biotechnology Reviews 11巻:31-46頁に記載される。次世代シークエンシングは、試料中の核酸の5%未満または1%未満に存在する変異体を検出することができる。
【0297】
本明細書において言及される「ヌクレオチド値」は、ヌクレオチド位置を占めるかまたはそれに割り当てられたヌクレオチド(複数可)の同一性を表す。典型的なヌクレオチド値には、不足(例えば、欠失);付加(例えば、1以上のヌクレオチドの挿入であって、その同一性が含まれ得るかまたは含まれ得ない);または存在(占有される);A;T;C;またはGが含まれる。他の値は、例えば、Yではない場合があり、YはA、T、G、またはCであり;AまたはXであり得、XはT、G、またはCのうちの1つまたは2つであり;TまたはXであり得、XはA、G、またはCのうちの1つまたは2つであり;GまたはXであり得、XはT、A、またはCのうちの1つまたは2つであり;CまたはXであり得、XはT、G、またはAのうちの1つまたは2つであり;ピリミジンヌクレオチド;またはプリンヌクレオチドであり得る。ヌクレオチド値は、ヌクレオチド位置における1つ以上、例えば、2、3または4つの塩基(または本明細書に記載される他の値、例えば、不足または追加)の頻度であり得る。例えば、ヌクレオチド値は、ヌクレオチド位置において、Aの頻度、およびGの頻度を含み得る。
【0298】
「または」は、本明細書では、文脈が明確に別のことを示していない限り、用語「および/または」を意味するために使用され、用語「および/または」と互換的に使用される。本明細書のある箇所における用語「および/または」の使用は、文脈が明確に別のことを示していない限り、用語「または」の使用が用語「および/または」と置き換えられないことを意味しない。
【0299】
「一次対照」とは、試料中の正常な隣接組織(NAT)組織以外の非腫瘍組織を指す。血液は、典型的な一次対照である。
【0300】
本明細書で使用される「試料」とは、本明細書に記載されるように、目的とする供給源から得られたかまたはそれに由来する生物学的試料を指す。一部の実施形態では、目的とする供給源は、動物またはヒトなどの生物体を含む。試料の供給源は、新鮮な、凍結されたおよび/または保存された臓器、組織試料、生検、切除、スメア、または吸引物からの固形組織;血液または任意の血液成分;脳脊髄液、羊水、腹水または間質液などの体液;または対象の妊娠中または発達中の任意の時間点からの細胞であり得る。一部の実施形態では、試料の供給源は、血液または血液成分である。
【0301】
一部の実施形態では、試料は、生物学的組織または流体であるかまたはそれを含む。試料は、防腐剤、抗凝固剤、バッファー、固定剤、栄養剤、抗生物質などの、天然において組織と自然に混合されない化合物を含有することができる。一実施形態では、試料は、凍結試料として、またはホルムアルデヒドもしくはパラホルムアルデヒド固定されたパラフィン包埋(FFPE)組織調製物として保存される。例えば、試料は、マトリックス、例えば、FFPEブロックまたは凍結試料中に包埋することができる。別の実施形態では、試料は、血液または血液成分試料である。さらに別の実施形態では、試料は、骨髄吸引物試料である。別の実施形態では、試料は、無細胞DNA(cfDNA)を含む。理論に拘束されることを望まないが、一部の実施形態では、cfDNAは、アポトーシスまたはネクローシス細胞由来のDNAであると考えられる。典型的には、cfDNAはタンパク質(例えば、ヒストン)に結合し、ヌクレアーゼによって保護される。cfDNAは、非侵襲的出生前検査(NIPT)、臓器移植、心筋症、マイクロバイオーム、およびがんのバイオマーカーとして用いることができる。別の実施形態では、試料は、循環腫瘍DNA(ctDNA)を含む。理論に拘束されることを望まないが、一部の実施形態では、ctDNAは、腫瘍細胞対非腫瘍細胞に由来するそれを識別することができる、遺伝的またはエピジェネティックな変化(例えば、体細胞性変化またはメチル化シグネチャー)を有するcfDNAであると考えられる。別の実施形態では、試料は、循環性腫瘍細胞(CTC)を含む。理論に拘束されることを望まないが、一部の実施形態では、CTCは、原発性または転移性腫瘍から循環に放出される細胞であると考えられる。一部の実施形態では、CTCアポトーシスは、血液/リンパ中のctDNAの供給源である。
【0302】
一部の実施形態では、生物学的試料は、骨髄;血液;血球;腹水;組織もしくは細針生検試料;細胞を含む体液;浮遊核酸;喀痰;唾液;尿;脳脊髄液、腹腔液;胸水;糞便;リンパ;婦人科液;皮膚スワブ;膣スワブ;口腔スワブ;鼻腔スワブ;洗浄液または乳管洗浄物もしくは気管支肺胞洗浄物などの洗浄物;吸引物;擦過物;骨髄標本;組織生検標本;手術標本;糞便、他の体液、分泌物、および/または排泄物;および/またはそこからの細胞などであるり得るかまたはそれを含み得る。一部の実施形態では、生物学的試料は、個体から得られた細胞であるかまたはそれを含む。一部の実施形態では、得られた細胞は、試料が得られた個体由来の細胞であるかまたはそれを含む。
【0303】
一部の実施形態では、試料は、任意の適切な手段によって目的とする供給源から直接得られる「一次試料」である。例えば、一部の実施形態では、一次生物学的試料は、生検(例えば、細針吸引または組織生検)、手術、体液(例えば、血液、リンパ液または糞便)の回収などから選択される方法によって得られる。一部の実施形態では、文脈から明らかであるように、用語「試料」は、一次試料を処理することによって(例えば、1つ以上の成分を除去することによって、および/または1つ以上の薬剤を添加することによって)、例えば、半透膜を用いてろ過することによって得られる調製物を指す。このような「処理された試料」は、例えば、試料から抽出された、または一次試料を、mRNAの増幅もしくは逆転写、特定の成分の単離および/もしくは精製などの技術に供することによって得られた核酸またはタンパク質などを含み得る。
【0304】
ある実施形態では、試料は、腫瘍、例えば、腫瘍細胞または腫瘍浸潤リンパ球(TIL)と関連する細胞である。一実施形態では、試料は、1つ以上の前がん細胞または悪性細胞を含む。ある実施形態では、試料は、血液学的悪性腫瘍(または異型前がん)、例えば、本明細書に記載される血液学的悪性腫瘍(または異型前がん)から取得される。ある種の実施形態では、試料は、固形腫瘍、軟組織腫瘍、または転移性病変から獲得される。他の実施形態では、試料は、外科的切除縁からの組織または細胞を含む。別の実施形態では、試料は、1つ以上の循環性腫瘍細胞(CTC)(例えば、血液試料から獲得されたCTC)を含む。ある実施形態では、試料は、腫瘍と関連しない細胞、例えば、非腫瘍細胞または末梢血リンパ球である。
【0305】
本明細書で使用される「感受性」は、配列の不均質な集団における配列変異体を検出する方法の能力の尺度である。ある方法は、仮に配列変異体が試料中の配列の少なくともF%として存在する試料を与えたとして、本方法が、C%の信頼度で、その時間のS%、配列を検出することができた場合、F%の変異体に対してS%の感受性を有する。一例として、仮に変異体配列が試料中の配列の少なくとも5%として存在する試料を与えたとして、本方法は、99%の信頼度で、10回のうち9回、配列を検出することができた場合、5%の変異体に対して90%の感受性を有する(F=5%;C=99%;S=90%)。例示的な感受性は、C=90%、95%、99%、および99.9%の信頼度レベルで、F=1%、5%、10%、20%、50%、100%における配列変異体についてS=90%、95%、99%の感受性を含む。
【0306】
本明細書で使用される「特異性」は、真に存在する配列変異体を配列決定アーチファクトまたは他の密接に関連する配列から区別する方法の能力の尺度である。これは、偽陽性検出を回避する能力である。偽陽性検出は、試料調製中に目的とする配列に導入された誤差、配列決定誤差、または遺伝子ファミリーの偽遺伝子もしくは核酸分子のような密接に関連した配列の不注意な配列決定から生じ得る。ある方法は、仮に、XTrue配列が真に変異体であり、XNot trueが真に変異体ではないNTotal配列の試料セットに適用された場合、真に変異体ではないもののうち少なくともX%を非変異体として選択するならば、X%の特異性を有する。例えば、ある方法は、仮に、500個の配列が真に変異体であり、500個が真に変異体ではない1,000個の配列の試料セットに適用された場合、真に変異体ではない500個の配列のうちの90%を非変異体として選択するならば、90%の特異性を有する。例示的特異性は、90、95、98、および99%を含む。
【0307】
本明細書で使用される「腫瘍核酸」とは、腫瘍またはがん由来の核酸分子を指す。典型的には、それは、DNA、例えば、ゲノムDNA、またはRNA由来のcDNA、腫瘍もしくはがん試料由来のものである。一部の実施形態では、腫瘍核酸試料は、精製または単離される(例えば、それは、その天然状態から除去される)。一部の実施形態では、腫瘍核酸はcfDNAである。一部の実施形態では、腫瘍核酸は、ctDNAである。一部の実施形態では、腫瘍核酸は、CTC由来のDNAである。
【0308】
「対照核酸」または「参照核酸」とは、本明細書で使用される場合、対照または基準試料由来の核酸分子を指す。典型的には、それは、DNA、例えば、ゲノムDNA、またはRNA由来のcDNAであり、遺伝子または遺伝子産物の変化もしくは変動を含まない。ある種の実施形態では、参照または対照核酸試料は、野生型または非突然変異配列である。一部の実施形態では、参照核酸試料は、精製または単離される(例えば、それは、その天然状態から除去される)。他の実施形態では、参照核酸試料は、血液対照、正常な隣接組織(NAT)、または同一もしくは異なる対象由来の任意の他の非がん性試料からのものである。一部の実施形態では、参照核酸試料は、正常なDNA混合物を含む。一部の実施形態では、正常なDNA混合物は、プロセス適合対照である。一部の実施形態では、参照核酸試料は、生殖系列変異体を有する。一部の実施形態では、参照核酸試料は、例えば、陰性対照として役立つ体細胞性変化を有さない。
【0309】
核酸分子を「配列決定すること」は、分子(例えば、DNA分子、RNA分子、またはRNA分子に由来するcDNA分子)中の少なくとも1ヌクレオチドの同一性を決定することを必要とする。実施形態では、分子中のヌクレオチドの全て未満の同一性が決定される。他の実施形態では、分子中のヌクレオチドの大部分または全部の同一性が決定される。
【0310】
本明細書で使用される「閾値」は、対象区間(例えば、サブゲノム区間または発現されたサブゲノム区間)にヌクレオチド値を割り当てるために存在するのに必要なリード数の関数である値である。例えば、それは、サブゲノム区間におけるそのヌクレオチド位置にそのヌクレオチド値を割り当てるのに必要とされる、ヌクレオチド位置で特定のヌクレオチド値、例えば、「A」を有するリードの数の関数である。閾値は、例えば、多数のリード、例えば整数として(またはその関数として)、または値を有するリードの比率として表すことができる。例として、閾値がXであり、「A」のヌクレオチド値を有するX+1個のリードが存在する場合、「A」の値は、対象区間の位置(例えば、サブゲノム区間または発現されたサブゲノム区間)に割り当てられる。閾値はまた、突然変異または変異体期待値、突然変異頻度、またはベイズ事前分布の関数として表すことができる。ある実施形態では、突然変異頻度は、ヌクレオチド値をコールするために、ある位置にヌクレオチド値、例えば、AまたはGを有するリードの数または比率を必要とする。実施形態では、閾値は、突然変異期待値、例えば、突然変異頻度、および腫瘍タイプの関数であり得る。例えば、ヌクレオチド位置における変異体は、患者が第1の腫瘍タイプを有する場合には第1の閾値を、患者が第2の腫瘍タイプを有する場合には第2の閾値を有することができる。
【0311】
本明細書で使用される場合、「標的核酸分子」とは、核酸ライブラリーから単離することを望む核酸分子を指す。一実施形態では、標的核酸分子は、本明細書に記載されるように、腫瘍核酸分子、参照核酸分子、または対照核酸分子であり得る。
【0312】
「腫瘍核酸分子」または他の類似の用語(例えば、「腫瘍またはがん関連核酸分子」)は、本明細書で使用される場合、腫瘍細胞からの配列を有する核酸分子を指す。一実施形態では、腫瘍核酸分子は、がん性表現型に関連する変化(例えば、突然変異)を有する配列(例えば、ヌクレオチド配列)を有する対象区間を含む。他の実施形態では、腫瘍核酸分子は、野生型配列(例えば、野生型ヌクレオチド配列)を有する対象区間を含む。例えば、がん細胞に存在するヘテロ接合またはホモ接合の野生型対立遺伝子からの対象区間。腫瘍核酸分子は、参照核酸分子を含むことができる。
【0313】
「参照核酸分子」または他の類似の用語(例えば、「対照核酸分子」)は、本明細書で使用される場合、がん性表現型と関連しない配列(例えば、ヌクレオチド配列)を有する対象区間を含む核酸分子を指す。一実施形態では、参照核酸分子は、突然変異した場合にがん性表現型と関連する遺伝子または遺伝子産物の野生型または非突然変異ヌクレオチド配列を含む。基準核酸分子は、がん細胞または非がん細胞に存在することができる。
【0314】
「変異体」とは、本明細書で使用される場合、1を超える構造、例えば、多型遺伝子座における対立遺伝子を有することができるサブゲノム区間で存在することができる構造を指す。
【0315】
「単離された」核酸分子は、核酸分子の天然源に存在する他の核酸分子から分離されたものである。ある種の実施形態では、「単離された」核酸分子は、核酸が由来する生物体のゲノムDNA中の核酸(すなわち、核酸の5’および3’末端に位置する配列)に天然に隣接する配列(タンパク質をコードする配列など)を含まない。例えば、種々の実施形態では、単離された核酸分子は、核酸が由来する細胞のゲノムDNA中の核酸分子に天然に隣接する約5kB未満、約4kB未満、約3kB未満、約2kB未満、約1kB未満、約0.5kB未満、または約0.1kB未満のヌクレオチド配列を含むことができる。さらに、RNA分子またはcDNA分子などの「単離された」核酸分子は、他の細胞材料または培地を実質的に含まないことができ、例えば、組換え技術によって生成される場合、または化学的に合成される場合など、化学的前駆体または他の化学物質を実質的に含まないことができる。
【0316】
「他の細胞材料または培地を実質的に含まない」という用語は、核酸分子の調製物を含み、この分子は、それが単離されるかまたは組換え的に生成される細胞の細胞成分から分離される。したがって、細胞材料を実質的に含まない核酸分子は、他の細胞材料または培地の約30%未満、約20%未満、約10%未満、または約5%未満(乾燥重量)を有する核酸分子の調製物を含む。
【0317】
本明細書で使用される場合、「XはYの関数である」とは、例えば、1つの変数Xが、別の変数Yと関連付けられることを意味する。一実施形態では、XがYの関数である場合、XとYとの間の因果関係が暗示され得るが、必ずしも存在しない。
【0318】
見出し、例えば、(a)、(b)、(i)などは、明細書および特許請求の範囲を読みやすくするためにのみ提示される。明細書または特許請求の範囲における見出しの使用は、工程または要素をアルファベット順もしくは数字順またはそれらが提示される順序で行うことを必要としない。明細書または特許請求の範囲における見出しの使用もまた、全ての工程または要素の実施を必要としない。
【0319】
標的捕捉試薬の競合
【0320】
ハイブリッド捕捉(例えば、溶液または固体相中)は、全ゲノムまたはトランスクリプトームライブラリーからの目的とする遺伝子を濃縮するために使用することができる。例えば、ハイブリダイゼーション反応は、5’ビオチン化標的捕捉試薬(例えば、一本鎖DNA(ssDNA)または二本鎖DNA(dsRNA))を使用して、標的領域にハイブリダイズし、その後、ストレプトアビジン被覆した常磁性ビーズに対するdsDNA捕捉複合体の親和性捕捉、オフ標的配列を除去するためのバッファーでのストリンジェント洗浄、および標的分子を増幅するための濃縮後PCRを行うことができる。一部の実施形態では、目標は、標的領域全体にわたってさえカバレッジを有することであるが、標的捕捉試薬セットにおける標的全体にわたるカバレッジの変動は、標的配列特異的であり得、高いGCまたはAT含有量および反復配列は、捕捉効率の過剰または過小をもたらすことができる。インプット全ゲノムライブラリーにおける固有の標的の効率的な捕捉を駆動するために、過剰の冗長な(例えば>50×)、タイリング標的捕捉試薬(例えば、ベイト)が、典型的には捕捉反応において使用される。標的捕捉試薬の過剰および標的全体での捕捉効率の差により、標的あたりのカバレッジは、一般的に予測可能であり、試料タイプ全体で再現可能であるが、単に標的捕捉試薬の量を調整することによって高いおよび低いカバレッジに調整することはできない。
【0321】
ある種の用途(例えば、液体生検アッセイ)では、ゲノムライブラリー中に低頻度で存在し得る関心のある変化を有する領域に対して高い固有のカバレッジを有する必要がある。他の情報を与える領域(例えば、性別SNP、試料同定SNP、染色体コピー数コーリングのためのハプロタイピングSNP、もしくは腫瘍遺伝子変異量または他のゲノムシグネチャー、例えば、連続的/複雑なバイオマーカー)は、高いカバレッジを必要とせず、しばしば、標的捕捉試薬セット中の成分として捕捉され、過剰配列決定されるか、または別の反応中でより低い深度で配列決定される。ある種の実施形態では、同じ試料ライブラリーの多重反応を処理することは、限定されたライブラリー材料の使用において非効率的であり、アッセイワークフローに複雑さを加え、より高い配列決定コストを加える場合がある。
【0322】
本明細書に記載される方法は、例えば、非修飾の標的捕捉試薬および修飾された(例えば、5’ビオチン化された)標的捕捉試薬の組合せを使用して、標的ごとの特定の基準で標的カバレッジを調節する。ある種の実施形態では、標的捕捉試薬上の修飾(例えば、5’ビオチン)は、ゲノムライブラリー中のオン標的と非標的とを分離するためにのみ使用され、修飾されていない標的捕捉試薬を使用することにより、同じ反応条件を進行させることができるが、ゲノムライブラリーから引き出され、さらにその後に配列決定された標的の量は、修飾された標的捕捉試薬対非修飾の標的捕捉試薬の比によることがある。本明細書に記載される方法は、単一の標的捕捉試薬反応の使用を可能にし、低い、高い、および中間の標的カバレッジを有する単一の捕捉ライブラリーを有する。
【0323】
試料
【0324】
種々の組織が、本方法で使用される試料の供給源であり得る。ゲノムまたはサブゲノム核酸(例えば、DNAまたはRNA)は、対象の試料(例えば、腫瘍細胞を含む試料、血液試料、血液成分試料、無細胞DNA(cfDNA)を含む試料、循環腫瘍DNA(ctDNA)を含む試料、循環性腫瘍細胞(CTC)を含む試料、または任意の正常対照(例えば、正常な隣接組織(NAT))から単離され得る。
【0325】
一部の実施形態では、試料は、例えば、腫瘍由来の核酸、例えば、DNA、RNA、またはその両方を含む。核酸は、DNAまたはRNAであり得る。一部の実施形態では、試料は、非核酸成分、例えば、細胞、タンパク質、炭水化物、または脂質、例えば、腫瘍由来のものをさらに含む。ある種の実施形態では、試料は、正常な細胞または組織由来の核酸をさらに含む。
【0326】
ある種の実施形態では、試料は、凍結試料として、またはホルムアルデヒドもしくはパラホルムアルデヒド固定したパラフィン包埋(FFPE)組織調製物として保存される。例えば、試料は、マトリックス、例えば、FFPEブロックまたは凍結試料に包埋することができる。ある種の実施形態では、試料は、血液試料である。ある種の実施形態では、組織試料は、血液成分試料である。ある種の実施形態では、試料は、血漿試料である。ある種の実施形態では、試料は、血清試料である。ある種の実施形態では、試料は、cfDNA試料である。ある種の実施形態では、試料は、ctDNA試料である。ある種の実施形態では、試料は、CTC試料である。他の実施形態では、組織試料は、骨髄吸引物(BMA)試料である。ある種の実施形態では、試料は、尿試料である。単離工程は、個々の染色体のフロー選別;および/または対象の試料(例えば、本明細書に記載される試料)のマイクロ解剖を含むことができる。
【0327】
他の実施形態では、試料は、1つ以上の前がん細胞または悪性細胞を含む。一部の実施形態では、試料は、固形腫瘍、軟組織腫瘍、または転移性病変から取得される。一部の実施形態では、試料は、血液学的悪性腫瘍または異型前がんから取得される。他の実施形態では、試料は、外科的切除縁からの組織または細胞を含む。ある種の実施形態では、試料は、腫瘍浸潤リンパ球を含む。試料は、組織学的に正常な組織であり得る。ある実施形態では、試料は、1つ以上の非悪性細胞を含む。
【0328】
ある種の実施形態では、FFPE試料は、以下の特性:(a)約10mm2もしくはそれを超える、約25mm2もしくはそれを超える、または約50mm2もしくはそれを超える表面積を有し;(b)約0.1mm3もしくはそれを超える、約0.2mm3もしくはそれを超える、約0.3mm3もしくはそれを超える、約0.4mm3もしくはそれを超える、約0.5mm3もしくはそれを超える、約0.6mm3もしくはそれを超える、約0.7mm3もしくはそれを超える、約0.8mm3もしくはそれを超える、約0.9mm3もしくはそれを超える、約1mm3もしくはそれを超える、約2mm3もしくはそれを超える、約3mm3もしくはそれを超える、約4mm3もしくはそれを超える、または約5mm3もしくはそれを超える試料体積を有し;(c)約50%以上、約60%以上、約70%以上、約80%以上、または約90%以上の細胞性を有し;および/あるいは(d)約10,000個以上、約20,000個以上、約30,000個以上、約40,000個以上、または約50,000個以上の有核細胞の数を有する、のうちの1つ、2つまたは全てを有する。
【0329】
一実施形態では、本方法は、試料、例えば、本明細書に記載される試料を取得することをさらに含む。試料は、直接的または間接的に取得することができる。ある実施形態では、試料は、例えば、単離または精製によって、cfDNAを含む試料から取得される。ある実施形態では、試料は、ctDNAを含む試料から、例えば、単離または精製によって取得される。ある実施形態では、試料は、悪性細胞と非悪性細胞(例えば、腫瘍浸潤リンパ球)の両方を含む試料から、例えば、単離または精製によって取得される。ある実施形態では、試料は、CTCを含む試料から、例えば、単離または精製によって取得される。
【0330】
他の実施形態では、本方法は、本明細書に記載される方法を用いて、試料、例えば、組織学的に正常な試料、例えば、外科的切除縁からの試料を評価することを含む。理論に拘束されることを望まないが、一部の実施形態では、組織学的に正常な組織(例えば、さもなければ組織学的に正常な組織の辺縁)から得られた試料は、本明細書に記載されるような変化をなお有し得ると考えられる。したがって、本方法は、検出された変化の存在に基づいて試料を再分類することをさらに含み得る。ある実施形態では、例えば、異なる対象由来の多重試料を同時に処理する。
【0331】
ある実施形態では、本方法は、単離された核酸試料を提供するために、試料から核酸を単離することを含む。ある実施形態では、本方法は、単離された対照核酸試料を提供するために、対照から核酸を単離することを含む。ある実施形態では、方法は、検出可能な核酸を含まない試料を拒絶することをさらに含む。
【0332】
ある実施形態では、本方法は、一次対照が利用可能であるかどうか、およびもし利用可能であれば、対照核酸(例えば、DNA)を前記一次対照から単離することをさらに含む。ある実施形態では、本方法は、NATが前記試料中に存在するか否かを決定することをさらに含む(例えば、一次対照試料が入手できない場合)。ある実施形態では、方法は、例えば、一次対照を伴わない試料中の前記NATからの非腫瘍組織をマクロ解剖することによって、非腫瘍細胞について濃縮された部分試料を取得することをさらに含む。ある実施形態では、方法は、一次対照が利用できず、NATが利用できないことを決定し、合致した対照なしで分析のために前記試料をマーキングすることをさらに含む。
【0333】
ある実施形態では、方法は、前記試料中の核酸収率の値を取得し、取得した値を参照基準と比較することを含み、例えば、前記取得した値が前記参照基準未満である場合、ライブラリー構築の前に核酸を増幅することをさらに含む。ある実施形態では、方法は、前記試料中の核酸断片のサイズの値を取得し、取得した値を参照基準、例えば、サイズ、例えば、平均サイズ、少なくとも300、600、または900bpのサイズと比較することをさらに含む。本明細書に記載されるパラメータは、この決定に応答して調整または選択することができる。
【0334】
ある種の実施形態では、本方法は、経年試料、例えば、経年FFPE試料から核酸を単離することを含む。経年試料は、例えば、1年、2年、3年、4年、5年、10年、15年、20年、25年、50年、75年、または100年以上であり得る。
【0335】
核酸は、様々な大きさの試料から得ることができる。例えば、核酸は、5~200μmまたはそれより大きい試料から単離することができる。例えば、試料は、5μm、10μm、20μm、30μm、40μm、50μm、70μm、100μm、110μm、120μm、150μmもしくは200μmまたはそれ以上を測定することができる。
【0336】
試料からのDNA単離のためのプロトコールは、当該技術分野において公知であり、例えば、国際特許出願公開第2012/092426号の実施例に提供される。ホルムアルデヒドまたはパラホルムアルデヒド固定したパラフィン包埋(FFPE)組織から核酸(例えば、DNA)を単離するためのさらなる方法は、例えば、
Cronin M.ら、(2004年)Am J Pathol.164巻(1号):35-42頁;Masuda N.ら、(1999年)Nucleic Acids Res.27巻(22号):4436-4443頁;SpechtK.ら、(2001年)Am J Pathol.158巻(2号):419-429頁に開示され、Ambion RecoverAll(商標)全核酸単離プロトコール(Ambion、カタログ番号AM1975、2008年9月)、Maxwell(登録商標)16 FFPE Plus LEV DNA 精製キットテクニカルマニュアル(Promega Literature #TM349、2011年2月)、E.Z.N.A.(登録商標)FFPE DNAキットハンドブック(OMEGA bio-tek、Norcross、GA、製造番号D3399-00、D3399-01、およびD3399-02;2009年6月)、ならびにQIAamp(登録商標)DNA FFPE組織ハンドブック(Qiagen、カタログ番号37625、2007年10月)が挙げられる。RecoverAll(商標)全核酸単離キットは、高温でキシレンを使用して、パラフィン包埋した試料およびガラス繊維フィルターを可溶化し、核酸を捕捉する。Maxwell(登録商標)16 FFPE Plus LEV DNA精製キットは、Maxwell(登録商標)16装置とともに使用され、FFPE組織の1~10μmの切片からゲノムDNAを精製する。DNAは、シリカ被覆常磁性粒子(PMP)を用いて精製され、低溶出量で溶出される。E.Z.N.A.(登録商標)FFPE DNAキットは、ゲノムDNAの単離にスピンカラムおよびバッファー系を使用する。QIAamp(登録商標)DNA FFPE組織キットは、ゲノムおよびミトコンドリアDNAの精製にQIAamp(登録商標) DNAマイクロ技術を使用する。血液からのDNA単離のためのプロトコールは、例えば、Maxwell(登録商標)16 LEV血液DNAキットおよびMaxwell 16 Buccal Swab LEV DNA精製キット技術マニュアル(Promega Literature #TM333、2011年1月1日)に開示されている。
【0337】
RNA単離のためのプロトコールは、例えば、Maxwell(登録商標)16全RNA精製キット技術会報(Promega Literature #TB351、2009年8月)に開示されている。
【0338】
単離された核酸(例えば、ゲノムDNA)は、常套的技術を実施することによって断片化またはせん断することができる。例えば、ゲノムDNAは、物理的せん断法、酵素的切断法、化学的切断法、および当業者に周知である他の方法によって断片化することができる。核酸ライブラリーは、ゲノムの複雑性の全部または実質的に全部を含有することができる。これの関連で「実質的に全て」という用語は、手法の初期工程の間に、実際にはゲノム複雑性の何らかの望ましくない喪失が存在し得る可能性を指す。本明細書に記載される方法はまた、核酸ライブラリーがゲノムの一部である場合に、例えば、ゲノムの複雑性が設計により低下される場合に有用である。一部の実施形態では、ゲノムの任意の選択された部分は、本明細書に記載される方法とともに使用され得る。ある種の実施形態では、全エクソームまたはそのサブセットが単離される。
【0339】
ある種の実施形態では、本方法は、ライブラリー(例えば、本明細書に記載される核酸ライブラリー)を提供するために、試料から核酸を単離することをさらに含む。ある種の実施形態では、試料は、全ゲノム断片、サブゲノム断片、またはその両方を含む。単離された核酸は、核酸ライブラリーを調製するために使用することができる。全ゲノム断片またはサブゲノム断片からライブラリーを単離し、調製するためのプロトコールは、当該技術分野において公知である(例えば、IlluminaのゲノムDNA試料調製キット)。ある種の実施形態では、ゲノムまたはサブゲノムDNA断片は、対象の試料(例えば、本明細書に記載される試料)から単離される。一実施形態では、試料は、保存された標本、例えば、マトリックスに包埋された試料、例えば、FFPEブロックまたは凍結試料である。ある種の実施形態では、単離工程は、個々の染色体のフロー選別;および/または試料の微小解剖を含む。ある種の実施形態では、核酸ライブラリーを生成するために使用される核酸の量は、5マイクログラム未満、1マイクログラム未満、または500ng未満、200ng未満、100ng未満、50ng未満、10ng未満、5ng未満、または1ng未満である。
【0340】
さらに他の実施形態では、ライブラリーを生成するために使用される核酸は、RNAまたはRNA由来のcDNAを含む。一部の実施形態では、RNAは、全細胞RNAを含む。他の実施形態では、ある種の豊富なRNA配列(例えば、リボソームRNA)が枯渇している。一部の実施形態では、全RNA調製物中のポリ(A)尾部mRNA画分が濃縮されている。一部の実施形態では、cDNAは、ランダムプライムされたcDNA合成法によって生成される。他の実施形態では、cDNA合成は、オリゴ(dT)含有オリゴヌクレオチドによってプライミングすることによって、成熟mRNAのポリ(A)尾部で開始される。枯渇、ポリ(A)濃縮、およびcDNA合成の方法は、当業者に周知である。
【0341】
他の実施形態では、核酸は、物理的方法もしくは酵素的方法によって断片化またはせん断され、必要に応じて、合成アダプターに連結され、サイズ選択され(例えば、調製用ゲル電気泳動による)、増幅される(例えば、PCRによる)。DNAせん断のための代替の方法は、当該技術分野において公知であり、例えば、国際特許出願公開第2012/092426号の実施例4に記載されている。例えば、代替のDNAせん断法は、より自動化可能であり、および/またはより効率的であり得る(例えば、分解されたFFPE試料を用いる)。ライブラリーの調製中にライゲーション工程を回避するために、DNAせん断法の代替物を使用することもできる。
【0342】
他の実施形態では、単離されたDNA(例えば、ゲノムDNA)は、断片化されるかまたはせん断される。一部の実施形態では、ライブラリーは、ゲノムDNAの50%未満、例えば、還元された表現であるゲノムDNAのサブ画分、またはゲノムの画定された部分、例えば、他の手段によってサブ画分化されたものを含む。他の実施形態では、ライブラリーは、全てまたは実質的に全てのゲノムDNAを含む。
【0343】
他の実施形態では、核酸の断片化されたおよびアダプター連結された群は、ハイブリッド選択の前に、明示的なサイズ選択または増幅なしに使用される。一部の実施形態では、核酸は、当業者に周知である特異的または非特異的な核酸増幅法によって増幅される。一部の実施形態では、核酸は、例えば、ランダムプライム鎖置換増幅などの全ゲノム増幅法によって増幅される。
【0344】
本明細書に記載される方法は、少量の核酸、例えば、供給源のDNAまたはRNA量が制限されている場合に(例えば、全ゲノム増幅後でさえ)用いて行うことができる。一実施形態では、核酸は、核酸試料の約5μg、4μg、3μg、2μg、1μg、0.8μg、0.7μg、0.6μg、0.5μg、もしくは400ng、300ng、200ng、100ng、50ng、10ng、5ng、1ng、またはそれ未満を含む。例えば、典型的には、50~100ngのゲノムDNAから開始することができる。しかしながら、ハイブリダイゼーション工程、例えば、溶液ハイブリダイゼーションの前に(例えば、PCRを用いて)ゲノムDNAを増幅する場合には、より少ない量で開始することができる。したがって、ハイブリダイゼーション、例えば、溶液ハイブリダイゼーションの前にゲノムDNAを増幅することは可能であるが、必須ではない。
【0345】
ある実施形態では、試料は、非がん細胞または非悪性細胞、例えば、腫瘍浸潤リンパ球からのDNA、RNA(またはRNA由来のcDNA)、またはその両方を含む。ある実施形態では、試料は、非がん細胞または非悪性細胞、例えば、腫瘍浸潤リンパ球からのDNA、RNA(またはRNA由来のcDNA)、またはその両方を含み、がん細胞または悪性細胞からのDNA、RNA(またはRNA由来のcDNA)、またはその両方を含まず、または本質的には含まない。
【0346】
ある実施形態では、試料は、がん細胞または悪性細胞からのDNA、RNA(またはRNAに由来するcDNA)を含む。ある実施形態では、試料は、がん細胞または悪性細胞からのDNA、RNA(またはRNA由来のcDNA)を含み、非がん細胞または非悪性細胞、例えば、腫瘍浸潤リンパ球からのDNA、RNA(またはRNA由来のcDNA)、またはその両方を含まず、または本質的に含まない。
【0347】
ある実施形態では、試料は、非がん細胞または非悪性細胞、例えば、腫瘍浸潤リンパ球からのDNA、RNA(またはRNA由来のcDNA)、またはその両方、およびがん細胞または悪性細胞からのDNA、RNA(またはRNA由来のcDNA)、またはその両方を含む。
【0348】
ある種の実施形態では、試料は、がんを有する対象から取得される。例示的ながんには、限定されないが、B細胞がん、例えば、多発性骨髄腫、メラノーマ、乳がん、肺がん(非小細胞肺がんまたはNSCLCなど)、気管支がん、結腸直腸がん、前立腺がん、膵臓がん、胃がん、卵巣がん、膀胱がん、脳または中枢神経系がん、末梢神経系がん、食道がん、子宮頸がん、子宮がんまたは子宮内膜がん、口腔または咽頭のがん、肝臓がん、腎臓がん、精巣がん、胆道がん、小腸がんまたは虫垂がん、唾液腺がん、甲状腺がん、副腎がん、骨肉腫、軟骨肉腫、血液組織のがん、腺がん、炎症性筋線維芽細胞腫瘍、消化管間質腫瘍(GIST)、結腸がん、多発性骨髄腫(MM)、骨髄異形成症候群(MDS)、骨髄増殖性疾患(MPD)、急性リンパ性白血病(ALL)、急性骨髄性白血病(AML)、慢性骨髄性白血病(CML)、慢性リンパ性白血病(CLL)、真性多血症、ホジキンリンパ腫、非ホジキンリンパ腫(NHL)、軟部肉腫、線維肉腫、粘液肉腫、脂肪肉腫、骨形成性肉腫、脊索腫、血管肉腫、内皮肉腫、リンパ管肉腫、リンパ管内皮肉腫、滑膜腫、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、扁平上皮がん、基底細胞がん、腺がん、汗腺がん、脂腺がん、乳頭がん、乳頭腺がん、髄様がん、肺がん、腎細胞がん、肝細胞がん、胆管がん、絨毛がん、セミノーマ、胎生期癌、ウィルムス腫瘍、膀胱がん、上皮がん、神経膠腫、星状細胞腫、髄芽腫、頭蓋咽頭腫、上衣腫、松果体腫瘍、血管芽細胞腫、聴神経腫、乏突起神経膠腫、髄膜腫、神経芽細胞腫、網膜芽細胞腫、濾胞性リンパ腫、びまん性大細胞型B細胞リンパ腫、マントル細胞リンパ腫、肝細胞がん、甲状腺がん、胃がん、頭頸部がん、小細胞がん、本態性血小板血症、免疫原性骨髄化生、好酸球増加症候群、全身性肥満細胞症、家族性過好酸球増加症、慢性好酸球性白血病、神経内分泌がん、カルシノイド腫瘍などが含まれる。
【0349】
ある実施形態では、がんは、血液学的悪性腫瘍(または異型前がん)である。本明細書で使用される場合、血液悪性腫瘍とは、造血またはリンパ組織の腫瘍、例えば、血液、骨髄、またはリンパ節に影響を与える腫瘍を指す。例示的な血液悪性腫瘍には、限定されないが、白血病(例えば、急性リンパ芽球性白血病(ALL)、急性骨髄性白血病(AML)、慢性リンパ性白血病(CLL)、慢性骨髄性白血病(CML)、毛様細胞性白血病、急性単球性白血病(AMoL)、慢性骨髄単球性白血病(CMML)、若年性骨髄単球性白血病(JMML)、または大顆粒リンパ球性白血病)、リンパ腫(例えば、AIDS関連リンパ腫、皮膚T細胞リンパ腫、ホジキンリンパ腫(例えば、古典的なホジキンリンパ腫または結節性リンパ球優位型ホジキンリンパ腫)、菌状息肉症、非ホジキンリンパ腫(例えば、B細胞非ホジキンリンパ腫(例えば、バーキットリンパ腫、小リンパ球性リンパ腫(CLL/SLL)、びまん性大細胞型B細胞リンパ腫、濾胞性リンパ腫、免疫芽球性大細胞リンパ腫、前駆体Bリンパ芽球性リンパ腫、またはマントル細胞リンパ腫)またはT細胞非ホジキンリンパ腫(菌状息肉症、未分化大細胞リンパ腫、または前駆Tリンパ芽球性リンパ腫))、原発性中枢神経系リンパ腫、セザリー症候群、ヴァルデンストレームマクログロブリン血症)、慢性骨髄増殖性腫瘍、ランゲルハンス細胞組織球増加症、多発性骨髄腫/形質細胞新生物、骨髄異形成症候群、または骨髄異形成/骨髄増殖性腫瘍が含まれる。本明細書で使用される「異型前がん」とは、まだ悪性ではないが、悪性になる準備が整っている組織を指す。
【0350】
一部の実施形態では、本明細書に記載される試料は、標本とも呼ばれる。
【0351】
一部の実施形態では、試料は、組織試料、血液試料または骨髄試料である。
【0352】
一部の実施形態では、血液試料は、無細胞DNA(cfDNA)を含む。一部の実施形態では、cfDNAは、健康な組織、例えば、非疾患細胞、または腫瘍組織、例えば、腫瘍細胞からのDNAを含む。一部の実施形態では、腫瘍組織由来のcfDNAは、循環腫瘍DNA(ctDNA)を含む。一部の実施形態では、ctDNA試料は、例えば、固形腫瘍、例えば、肺がん、乳がんまたは結腸がんを有する患者から得られる、例えば収集される。
【0353】
一部の実施形態では、試料、例えば、標本は、ホルマリン固定したパラフィン包埋(FFPE)標本である。一部の実施形態では、FPPE標本は、限定されないが、コア針生検、細針吸引物、または滲出液細胞学から選択される標本を含む。一部の実施形態では、試料は、FPPEブロック、ならびに1つのオリジナルのヘマトキシリンおよびエオシン(H&E)染色スライドを含む。一部の実施形態では、試料は、染色されていないスライド(例えば、正に荷電された、焼き付けられていない、厚さ4~5ミクロンのスライド;例えば、1、2、3、4、5、6、7、8、9、10個またはそれ以上のこのようなスライド)および1つ以上のH&E染色スライドを含む。
【0354】
一部の実施形態では、試料は、FPPEブロックまたは染色されていないスライド、例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16個またはそれ以上の染色されていないスライドおよび1つ以上のH&Eスライドを含む。一部の実施形態では、試料は、例えば、本明細書に記載されるような標準的な固定方法を用いて、ホルマリン固定され、パラフィンブロックに包埋された組織を含む。
【0355】
一部の実施形態では、試料は、少なくとも1~30mm2、例えば、約5~25mm2の表面積を含む。一部の実施形態では、試料は、少なくとも1、2、3、4、5、6、7、8、9、または10mm2、例えば、5mm2の表面積を含む。一部の実施形態では、試料は、少なくとも5mm2の表面積を含む。一部の実施形態では、試料は、約20、21、22、23、24、25、26、27、28、29または30mm2、例えば25mm2の表面積を含む。一部の実施形態では、試料は、25mm2の表面積を含む。
【0356】
一部の実施形態では、試料は、少なくとも1~5mm3、例えば、約2mm3の表面積を含む。一部の実施形態では、約2mm3の表面積は、約80ミクロン、例えば、少なくとも80ミクロンまたはそれ以上の深度で約25mm2の表面積を有する試料を含む。
【0357】
一部の実施形態では、試料は、例えば、腫瘍核を含む、腫瘍含有量を含む。一部の実施形態では、試料は、少なくとも5~50%、10~40%、15~25%、または20~30%の腫瘍核を有する腫瘍含有量を含む一部の実施形態では、試料は、少なくとも20%の腫瘍核の腫瘍含有量を含む。一部の実施形態では、試料は、約30%の腫瘍核の腫瘍含有量を含む。一部の実施形態では、腫瘍核パーセントは、例えば、腫瘍細胞数を、核を有する全ての細胞の総数で割ることによって計算される。一部の実施形態では、試料が、例えば、肝細胞を含む肝臓試料である場合、より高い腫瘍含有量が必要とされ得る。一部の実施形態では、肝細胞は、例えば、他の、例えば、非肝細胞体細胞のDNAコンテントの2倍(twice)、例えば、2倍(double)の核を有する。一部の実施形態では、例えば、本明細書に記載されるように、変化の検出の感受性は、試料の腫瘍含有量に依存し、例えば、より低い腫瘍含有量は、検出のより低い感受性をもたらすことができる。
【0358】
一部の実施形態では、DNAは、試料由来の有核細胞から抽出される。一部の実施形態では、試料は、例えば、試料が主に赤血球、過剰な細胞質を含む病変細胞、または線維化を伴う組織で構成される場合、低い有核細胞性を有する。一部の実施形態では、低い有核細胞性を有する試料は、DNA抽出のために、より多くの、例えば、より大きな組織容積、例えば、2mm3より大きい組織容積を必要とすることができる。
【0359】
一部の実施形態では、FPPE試料、例えば、標本は、核酸の完全性を保存するために、標準的な固定方法を用いて調製される。一部の実施形態では、標準的な固定方法は、10%中性緩衝ホルマリン、例えば、6~72時間を使用することを含む。一部の実施形態では、本方法は、ホランドのブインズ、B5、AZFなどの固定剤を含まない。一部の実施形態では、本方法は、脱灰を含まない。一部の実施形態では、本方法は、脱灰を含む。実施形態では、脱灰は、EDTAを用いて行われる。一部の実施形態では、強酸、例えば、塩酸、硫酸またはピクリン酸は、脱灰に使用されない。
【0360】
一部の実施形態では、試料は、FPPEブロックまたは染色されていないスライド、例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16個またはそれ以上の染色されていないスライドおよび1つ以上のH&Eスライドを含む。一部の実施形態では、試料は、例えば、本明細書に記載されるような標準的な固定方法を用いて、ホルマリン固定され、パラフィンブロックに包埋された組織を含む。
【0361】
一部の実施形態では、試料は、末梢全血または骨髄吸引物を含む。一部の実施形態では、試料、例えば、病変組織は、少なくとも20%の有核要素を含む。一部の実施形態では、末梢全血試料または骨髄吸引物試料は、約2.5mlの容積で回収される。一部の実施形態では、血液試料は、例えば、常温、例えば、43~99°Fまたは6~37℃で、回収と同じ日に発送される。一部の実施形態では、血液試料は、凍結または冷蔵されない。
【0362】
一部の実施形態では、試料は、単離された、例えば、抽出された、核酸、例えば、DNAまたはRNAを含む。一部の実施形態では、単離された核酸は、DNAまたはRNAを、例えば、ヌクレアーゼを含まない水に含む。
【0363】
一部の実施形態では、試料は、血液試料、例えば、末梢全血試料を含む。一部の実施形態では、末梢全血試料は、例えば、チューブに、例えば、チューブあたり約8.5mlの血液を有する2つのチューブに回収される。一部の実施形態では、末梢全血試料は、例えば、CLSI H3-A6に従って静脈穿刺によって回収される。一部の実施形態では、血液は、例えば、穏やかな反転によって、例えば、約8~10回、直ちに混合される。一部の実施形態では、反転は、例えば、手首の完全な、例えば、180°の旋回によって行われる。一部の実施形態では、血液試料は、例えば、常温、例えば、回収と同じ日に、43~99°Fまたは6~37℃で発送される。一部の実施形態では、血液試料は、凍結または冷蔵されない。一部の実施形態では、回収された血液試料は、例えば、43~99°Fまたは6~37℃で保持される。
【0364】
対象の選択
【0365】
一部の実施形態では、試料は、例えば、状態または疾患、例えば、過剰増殖性疾患(例えば、本明細書に記載される)または非がん性適応症を有する対象、例えば、患者から得られ、例えば、回収される。一部の実施形態では、疾患は、過剰増殖性疾患である。一部の実施形態では、過剰増殖性疾患は、がん、例えば、固形腫瘍または血液学的がんである。一部の実施形態では、がんは、固形腫瘍である。一部の実施形態では、がんは、血液学的がん、例えば、白血病またはリンパ腫である。
【0366】
一部の実施形態では、患者は、標的療法、例えば、1つ以上の標的療法で以前に治療されている。一部の実施形態では、標的療法で以前に治療された患者については、標的療法後の試料、例えば、標本が得られる、例えば収集される。一部の実施形態では、標的療法後の試料は、標的療法の完了後に得られた、例えば回収された試料である。
【0367】
一部の実施形態では、患者は、以前に標的療法で治療されたことがない。一部の実施形態では、以前に標的療法で治療されたことがない患者については、試料は、切除、例えば、最初の切除、または再発、例えば、療法後の疾患再発、例えば、非標的療法後の疾患再発を含む。一部の実施形態では、試料は、原発腫瘍もしくは転移、例えば、転移生検であるか、またはその一部である。一部の実施形態では、試料は、隣接部位、例えば、腫瘍細胞と隣接する部位と比較して、腫瘍、例えば、腫瘍細胞の最大パーセントを有する部位、例えば、腫瘍部位から得られる。一部の実施形態では、試料は、隣接する部位、例えば、腫瘍細胞と隣接する部位と比較して最大の腫瘍焦点を有する部位、例えば、腫瘍部位から得られる。
【0368】
一部の実施形態では、疾患は、非小細胞肺がん(NSCLC)、メラノーマ、乳がん、結腸直腸がん(CRC)、または卵巣がんから選択される。一部の実施形態では、本明細書に記載されるNSCLCは、例えば、EGFR変化(例えば、エクソン19欠失またはエクソン21 L858R変化)、ALK再配列、またはBRAF V600Eを有するNSCLCを含む。一部の実施形態では、本明細書に記載されるメラノーマは、BRAF変化、例えば、V600Eおよび/またはV600Kを有するメラノーマを含む。一部の実施形態では、本明細書に記載される乳がんは、ERBB2(HER2)増幅を有する乳がんを含む。一部の実施形態では、本明細書に記載される結腸直腸がんは、野生型KRAS、例えば、コドン12および/もしくは13における突然変異の欠如、またはコドン2、3、および/もしくは4における突然変異の欠如を有する結腸直腸がんを含む。一部の実施形態では、本明細書に記載される結腸直腸がんは、野生型NRASを有する結腸直腸がん、例えば、コドン2、3、および/または4における突然変異の欠如を含む。一部の実施形態では、本明細書に記載される結腸直腸がんは、例えば、本明細書に記載されるような野生型KRAS、および、例えば、本明細書に記載されるような野生型NRASを有する結腸直腸がんを含む。一部の実施形態では、本明細書に記載される卵巣がんは、BRCA1および/またはBRCA2変化を有する卵巣がんを含む。
【0369】
標的捕捉試薬の設計および構成
【0370】
一部の実施形態では、標的捕捉試薬は、標的分子に結合し、それによって標的分子の捕捉を可能にすることができる分子である。例えば、標的捕捉試薬は、ベイト、例えば、標的核酸分子、例えば、標的核酸にハイブリダイズすることができ(例えば、相補的であり)、それによって標的核酸の捕捉を可能にすることができるDNAまたはRNA分子であり得る。一部の実施形態では、標的捕捉試薬、例えば、ベイトは、捕捉オリゴヌクレオチドである。ある種の実施形態では、標的核酸は、ゲノムDNA分子である。他の実施形態では、標的核酸は、RNA分子、またはRNA分子に由来するcDNA分子である。一実施形態では、標的捕捉試薬は、DNA分子である。一実施形態では、標的捕捉試薬は、RNA分子である。他の実施形態では、標的捕捉試薬は、標的捕捉試薬によって形成されたハイブリッドと標的捕捉試薬にハイブリダイズした核酸分子との結合および分離を可能にする結合対の第1のメンバーを含む。一実施形態では、標的捕捉試薬は、溶液相ハイブリダイゼーションに適している。一実施形態では、標的捕捉試薬は、固体相ハイブリダイゼーションに適している。一実施形態では、標的捕捉試薬は、溶液相と固体相ハイブリダイゼーションの両方に適している。
【0371】
典型的には、DNA分子は、標的捕捉試薬配列として使用されるが、RNA分子もまた使用され得る。一部の実施形態では、DNA分子標的捕捉試薬は、一本鎖DNA(ssDNA)または二本鎖DNA(dsDNA)であり得る。
【0372】
一部の実施形態では、RNA-DNA二本鎖は、DNA-DNA二本鎖よりも安定であり、したがって、核酸の潜在的により良好な捕捉を提供する。RNA標的捕捉試薬は、限定されないが、DNA依存性RNAポリメラーゼを使用するDNA分子のデノボ化学合成および転写を含む、当該技術分野において公知である方法を使用して、本明細書の他の箇所に記載されるように作製することができる。一実施形態では、標的捕捉試薬配列は、例えば、鋳型としてヒトDNAまたはプールされたヒトDNA試料を使用するPCRなどの公知の核酸増幅方法を使用して生成される。次に、オリゴヌクレオチドをRNA標的捕捉試薬に変換することができる。一実施形態では、in vitro転写は、例えば、オリゴヌクレオチドの一端にRNAポリメラーゼプロモーター配列を付加することに基づいて使用される。一実施形態では、RNAポリメラーゼプロモーター配列は、例えば、PCRまたは別の核酸増幅方法を用いて、例えば、各標的特異的プライマー対の1つのプライマーをRNAプロモーター配列で尾引きすることによって、標的捕捉試薬配列を増幅または再増幅することにより標的捕捉試薬の末端に付加される。一実施形態では、RNAポリメラーゼは、T7ポリメラーゼ、SP6ポリメラーゼ、またはT3ポリメラーゼである。一実施形態では、RNA標的捕捉試薬は、タグ、例えば、親和性タグで標識される。一実施形態では、RNA標的捕捉試薬は、例えば、ビオチン化UTPを用いて、in vitro転写によって作製される。別の実施形態では、RNA標的捕捉試薬は、ビオチンなしで生成され、次に、ビオチンは、当該技術分野において周知である方法、例えば、ソラレン架橋を用いてRNA分子に架橋される。一実施形態では、RNA標的捕捉試薬は、RNase耐性RNA分子であり、これは、例えば、転写中に修飾されたヌクレオチドを使用して、RNase分解に抵抗性であるRNA分子を生成することによって作製することができる。一実施形態では、RNA標的捕捉試薬は、二本鎖DNA標的の1本鎖のみに対応する。典型的には、このようなRNA標的捕捉試薬は、自己相補的ではなく、ハイブリダイゼーション駆動因子としてより効果的である。
【0373】
標的捕捉試薬は、標的捕捉試薬が参照配列の標的を選択するのに最適であるように、参照配列から設計することができる。一部の実施形態では、標的捕捉試薬配列は、混合塩基(例えば、縮重)を使用して設計される。例えば、混合塩基(複数可)は、両方の対立遺伝子(例えば、SNPと非SNP;突然変異体と非突然変異体)を捕捉するように標的捕捉試薬配列を最適化するために、共通のSNPまたは突然変異の位置(複数可)で標的捕捉試薬配列に含まれ得る。一部の実施形態では、全ての公知の配列変動(またはそのサブセット)は、混合された縮重オリゴヌクレオチドを用いるよりはむしろ、多重のオリゴヌクレオチド標的捕捉試薬を用いて標的化することができる。
【0374】
ある種の実施形態では、標的捕捉試薬は、長さが約100ヌクレオチド~300ヌクレオチドのオリゴヌクレオチド(または複数のオリゴヌクレオチド)を含む。典型的には、標的捕捉試薬は、長さが約130ヌクレオチド~230ヌクレオチド、または約150ヌクレオチド~200ヌクレオチドのオリゴヌクレオチド(または複数のオリゴヌクレオチド)を含む。他の実施形態では、標的捕捉試薬は、長さが約300ヌクレオチド~1000ヌクレオチドのオリゴヌクレオチド(または複数のオリゴヌクレオチド)を含む。
【0375】
一部の実施形態では、オリゴヌクレオチド中の標的核酸分子特異的配列は、長さが約40~1000ヌクレオチド、約70~300ヌクレオチド、約100~200ヌクレオチドであり、典型的には、長さは約120~170ヌクレオチドである。
【0376】
一部の実施形態では、標的捕捉試薬は、結合対の第1のメンバーを含む。結合対の第1のメンバーは、標的捕捉試薬上の親和性タグであり得る。一部の実施形態では、親和性タグは、ビオチン分子またはハプテンである。一部の実施形態では、結合対の第1のメンバーは、結合対の第2のメンバー、例えば、アビジン分子、またはハプテンもしくはその抗原結合断片に結合する抗体に結合することによって、ハイブリダイゼーション混合物から標的捕捉試薬/核酸分子ハイブリッドを分離することを可能にする。
【0377】
他の実施形態では、標的捕捉試薬中のオリゴヌクレオチドは、同じ標的核酸分子配列に対してフォワードおよびリバース相補配列を含み、それによって逆相補核酸分子特異的配列を有するオリゴヌクレオチドもまた逆相補ユニバーサル尾部を有する。これにより、同じ鎖である、すなわち、互いに相補的でないRNA転写物が生じ得る。
【0378】
他の実施形態では、標的捕捉試薬は、1つ以上の位置に縮重または混合塩基を含有するオリゴヌクレオチドを含む。さらに他の実施形態では、標的捕捉試薬は、単一の種または生物体群集の集団中に存在する多重のまたは実質的に全ての公知の配列変異体を含む。一実施形態では、標的捕捉試薬は、ヒト集団に存在する多重のまたは実質的に全ての公知の配列変異体を含む。
【0379】
他の実施形態では、標的捕捉試薬は、cDNA配列を含むかまたはcDNA配列に由来する。他の実施形態では、標的捕捉試薬は、ゲノムDNA、cDNAまたはクローン化DNAから増幅された増幅産物(例えば、PCR産物)を含む。
【0380】
他の実施形態では、標的捕捉試薬は、RNA分子を含む。一部の実施形態では、このセットは、化学的、酵素的に修飾された、またはin vitro転写されたRNA分子を含み、限定されないが、より安定であり、RNaseに対して抵抗性であるものが含まれる。
【0381】
さらに他の実施形態では、標的捕捉試薬は、参照により本明細書に組み込まれる米国特許出願第2010/0029498号およびGnirke,A.ら(2009年)Nat Biotechnol.27巻(2号):182-189頁に記載されている方法によって生成される。例えば、ビオチン化RNA標的捕捉試薬は、マイクロアレイ上で最初に合成された、合成の長いオリゴヌクレオチドのプールを得て、および標的捕捉試薬配列を生成するためにオリゴヌクレオチドを増幅することによって製造することができる。一部の実施形態では、標的捕捉試薬は、標的捕捉試薬配列の一端にRNAポリメラーゼプロモーター配列を付加し、およびRNAポリメラーゼを用いてRNA配列を合成することによって生成される。一実施形態では、合成オリゴデオキシヌクレオチドのライブラリーは、Agilent Technologies,Inc.などの供給業者から得ることができ、公知の核酸増幅法を用いて増幅することができる。
【0382】
したがって、上記の標的捕捉試薬を作製する方法が提供される。本方法は、例えば、1つ以上の標的捕捉試薬、例えば、標的特異的なベイトオリゴヌクレオチド配列(例えば、本明細書に記載される1つ以上の突然変異捕捉、参照または制御オリゴヌクレオチド配列)を選択すること;標的捕捉試薬のプール、例えば、標的特異的なベイトオリゴヌクレオチド配列のプールを得ること(例えば、マイクロアレイ合成により、標的特異的なベイトオリゴヌクレオチド配列のプールを合成すること);および場合により、標的捕捉試薬、例えば、標的特異的なベイトオリゴヌクレオチド配列を増幅することを含む。
【0383】
他の実施形態では、本方法は、1つ以上のビオチン化プライマーを用いてオリゴヌクレオチドを(例えば、PCRにより)増幅することをさらに含む。一部の実施形態では、オリゴヌクレオチドは、マイクロアレイに付着された各オリゴヌクレオチドの末端にユニバーサル配列を含む。本方法はさらに、オリゴヌクレオチドからユニバーサル配列を除去することを含み得る。このような方法はまた、オリゴヌクレオチドの相補鎖の除去、オリゴヌクレオチドのアニーリング、およびオリゴヌクレオチドの延長を含むことができる。これらの実施形態の一部では、オリゴヌクレオチドを(例えば、PCRにより)増幅する方法は、1つ以上のビオチン化プライマーを使用する。一部の実施形態では、本方法は、増幅されたオリゴヌクレオチドをサイズ選択することをさらに含む。
【0384】
一実施形態では、RNA標的捕捉試薬が作製される。本方法は、本明細書に記載される方法に従って、標的捕捉試薬配列セットを生成し、標的捕捉試薬配列の一端にRNAポリメラーゼプロモーター配列を付加し、およびRNAポリメラーゼを用いてRNA配列を合成することを含む。RNAポリメラーゼは、T7 RNAポリメラーゼ、SP6 RNAポリメラーゼ、またはT3 RNAポリメラーゼから選択することができる。他の実施形態では、RNAポリメラーゼプロモーター配列は、標的捕捉試薬配列を(例えば、PCRにより)増幅することによって、標的捕捉試薬配列の末端に付加される。標的捕捉試薬配列がゲノムDNAまたはcDNAからの特異的プライマー対を用いてPCRにより増幅される実施形態では、各対における2つの特異的プライマーのうちの1つの5’末端にRNAプロモーター配列を付加することは、標準方法を用いてRNA標的捕捉試薬に転写することができるPCR産物をもたらす。
【0385】
他の実施形態では、標的捕捉試薬は、鋳型としてヒトDNAまたはプールされたヒトDNA試料を用いて生成することができる。このような実施形態では、オリゴヌクレオチドは、ポリメラーゼ連鎖反応(PCR)によって増幅される。他の実施形態では、増幅されたオリゴヌクレオチドは、ローリングサークル増幅または超分岐ローリングサークル増幅によって再増幅される。また、同じ方法を使用して、鋳型としてヒトDNAまたはプールされたヒトDNA試料を用いて標的捕捉試薬配列を生成することができる。同じ方法をまた使用して、限定されないが、制限消化、パルスフィールドゲル電気泳動、フロー選別、CsCl密度勾配遠心分離法、選択的な動力学的再結合、染色体調製物の微小解剖、および当業者に公知である他の分画法を含む、他の方法によって得られるゲノムのサブ画分を用いて標的捕捉試薬配列を生成することができる。
【0386】
ある種の実施形態では、複数の標的捕捉試薬中の標的捕捉試薬(例えば、ベイト)の数は、1,000未満である。他の実施形態では、複数の標的捕捉試薬中の標的捕捉試薬(例えば、ベイト)の数は、1,000を超え、5,000を超え、10,000を超え、20,000を超え、50,000を超え、100,000を超え、または500,000を超える。
【0387】
標的捕捉試薬配列の長さは、約70ヌクレオチド~1000ヌクレオチドであり得る。一実施形態では、標的捕捉試薬長は、長さが約100~300ヌクレオチド、110~200ヌクレオチド、または120~170ヌクレオチドである。上述のものに加えて、長さにして約70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、300、400、500、600、700、800、および900ヌクレオチドの中間オリゴヌクレオチド長が、本明細書に記載される方法に使用され得る。一部の実施形態では、約70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、または230塩基のオリゴヌクレオチドを使用することができる。
【0388】
各標的捕捉試薬配列は、標的特異的な(例えば、核酸分子特異的な)標的捕捉試薬配列および一方または両方の末端上のユニバーサル尾部を含むことができる。本明細書で使用される場合、用語「標的捕捉試薬配列」は、標的特異的な標的捕捉試薬配列、または標的特異的な「標的捕捉試薬配列」およびオリゴヌクレオチドの他のヌクレオチドを含むオリゴヌクレオチド全体を指すことができる。標的捕捉試薬中の標的特異的配列は、長さが約40ヌクレオチド~1000ヌクレオチドである。一実施形態では、標的特異的配列は、長さが約70ヌクレオチド~300ヌクレオチドである。別の実施形態では、標的特異的配列は、長さが約100ヌクレオチド~200ヌクレオチドである。さらに別の実施形態では、標的特異的配列は、長さが約120ヌクレオチド~170ヌクレオチド、典型的には長さが約120ヌクレオチドである。また、上述のものに加えて中間の長さを本明細書に記載される方法において使用することができ、例えば、標的特異的配列は、長さが約40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、300、400、500、600、700、800、および900ヌクレオチドであり、ならびに標的特異的配列の長さは上述の長さの間の長さである。
【0389】
一実施形態では、標的捕捉試薬は、長さが約50~200ヌクレオチド(例えば、長さが約50、60、80、90、100、110、120、130、140、150、160、170、190、または200ヌクレオチド)のオリゴマー(例えば、RNAオリゴマー、DNAオリゴマー、またはそれらの組合せで構成される)である。一実施形態では、各標的捕捉試薬オリゴマーは、標的特異的な標的捕捉試薬配列である、約120~170個、または典型的には約120個のヌクレオチドを含む。標的捕捉試薬は、1つまたは両方の末端にさらなる非標的特異的なヌクレオチド配列を含むことができる。追加のヌクレオチド配列は、例えば、PCR増幅用に、または標的捕捉試薬識別子として使用することができる。ある種の実施形態では、標的捕捉試薬は、本明細書に記載される結合対の第1のメンバー(例えば、ビオチン分子などの親和性タグ)をさらに含む。結合対の第1のメンバー、例えば、ビオチン分子は、標的捕捉試薬に、例えば、標的捕捉試薬の5’末端、3’末端、または内部(例えば、ビオチン化ヌクレオチドを取り込むことによって)に付着され得る。一実施形態では、ビオチン分子は、標的捕捉試薬の5’末端に付着される。
【0390】
1つの例示的な実施形態では、標的捕捉試薬は、長さ約150ヌクレオチドのオリゴヌクレオチドであり、そのうちの120ヌクレオチドは標的特異的な「標的捕捉試薬配列」である。他の30ヌクレオチド(例えば、各末端の15ヌクレオチド)は、PCR増幅に使用されるユニバーサルな任意の尾部である。尾部は、ユーザが選択した任意の配列であり得る。例えば、合成オリゴヌクレオチドのプールは、標的特異的な標的捕捉試薬配列を示すN120を有する5’-ATCGCACCAGCGTGTN120CACTGCGGCTCCTCA-3’(配列番号1)の配列のオリゴヌクレオチドを含むことができる。
【0391】
本明細書中に記載される標的捕捉試薬配列は、エクソンおよび短い標的配列の選択に使用することができる。一実施形態では、標的捕捉試薬は、長さが約100ヌクレオチド~300ヌクレオチドである。別の実施形態では、標的捕捉試薬は、長さが約130ヌクレオチド~230ヌクレオチドである。さらに別の実施形態では、標的捕捉試薬は、長さが約150ヌクレオチド~200ヌクレオチドである。標的捕捉試薬中の標的特異的配列、例えば、エクソンおよび短い標的配列の選択は、長さが約40ヌクレオチド~1000ヌクレオチドである。一実施形態では、標的特異的配列は、長さが約70ヌクレオチド~300ヌクレオチドである。別の実施形態では、標的特異的配列は、長さが約100ヌクレオチド~200ヌクレオチドである。さらに別の実施形態では、標的特異的配列は、長さが約120ヌクレオチド~170ヌクレオチドである。
【0392】
一部の実施形態では、長いオリゴヌクレオチドは、標的配列を捕捉するのに必要なオリゴヌクレオチドの数を最小限にすることができる。例えば、エクソンあたり1つのオリゴヌクレオチドを使用することができる。ヒトゲノム中のタンパク質をコードするエクソンの平均および中央値の長さは、それぞれ約164および120塩基対であることが当該技術分野において公知である。より長い標的捕捉試薬配列は、より短いものよりもより特異的であり、より良好に捕捉することができる。結果として、オリゴヌクレオチド標的捕捉試薬配列あたりの成功率は、短いオリゴヌクレオチドよりも高い。一実施形態では、最小の標的捕捉試薬をカバーした配列は、例えば、エクソンサイズの標的では、1つの標的捕捉試薬のサイズ(例えば、120~170塩基)である。標的捕捉試薬配列の長さを決定する際に、不必要に長い標的捕捉試薬が、標的に直接隣接するより望ましくないDNAを捕捉することを考慮することもできる。より長いオリゴヌクレオチド標的捕捉試薬はまた、より短いものよりも、DNA試料中の標的領域における多型に対してより耐性であり得る。典型的には、標的捕捉試薬配列は、参照ゲノム配列に由来する。実際のDNA試料中の標的配列が、例えば、それが一塩基多型(SNP)を含む場合に、参照配列から逸脱する場合、それは、標的捕捉試薬に対してより効率的にハイブリダイズすることができず、したがって、標的捕捉試薬配列にハイブリダイズした配列において、過少表示され得るか、または完全に存在しないことがある。SNPによる対立遺伝子脱落は、例えば、120~170塩基の単一ミスマッチが、それぞれ、多重増幅およびマイクロアレイ捕捉における典型的な標的捕捉試薬またはプライマー長さである20または70塩基の単一ミスマッチよりも、ハイブリッド安定性に影響を及ぼさない場合があるという理由で、より長い合成標的捕捉試薬分子では可能性が低い。
【0393】
ゲノム領域などの捕捉標的捕捉試薬の長さと比較して長い標的の選択には、標的捕捉試薬配列長は、典型的には、隣接配列の標的化を最小化する唯一の目的のために標的捕捉試薬配列の最大サイズを制限する必要がないことを除いて、上述の短い標的のための標的捕捉試薬と同じサイズ範囲である。あるいは、オリゴヌクレオチドは、はるかに広い窓(典型的には600塩基)全体でタイル化することができる。この方法は、典型的なエクソンよりもはるかに大きい(例えば、約500塩基)DNA断片を捕捉するために用いることができる。結果として、はるかに望ましくない隣接非標的配列が選択される。
【0394】
標的捕捉試薬の合成
【0395】
標的捕捉試薬は、例えば、任意のタイプのオリゴヌクレオチド、例えば、DNAまたはRNAであり得る。DNAまたはRNA標的捕捉試薬(「オリゴ標的捕捉試薬」)は、個別に合成することができ、またはDNAもしくはRNA標的捕捉試薬(例えば、「アレイベイト」)としてアレイ中で合成することができる。オリゴ標的捕捉試薬は、アレイフォーマットで提供されるか、または単離されたオリゴとして提供されるかにかかわらず、典型的には一本鎖である。標的捕捉試薬は、本明細書に記載される結合対の第1のメンバー(例えば、ビオチン分子などの親和性タグ)をさらに含むことができる。結合対の第1のメンバー、例えば、ビオチン分子は、標的捕捉試薬、例えば、標的捕捉試薬の5’末端または3’末端に、典型的には標的捕捉試薬の5’末端に付着され得る。標的捕捉試薬は、例えば、国際特許出願公開第第2012/092426号、または国際特許出願公開第WO2015/021080号に記載されるように、当該技術分野において記載される方法によって合成することができ、それらの全内容は参照により本明細書に組み込まれる。
【0396】
ハイブリダイゼーション条件
【0397】
本発明において特徴づけられる方法は、ライブラリー(例えば、核酸ライブラリー)を複数の標的捕捉試薬と接触させて、選択されたライブラリーキャッチを提供する工程を含む。接触工程は、溶液ハイブリダイゼーションにおいて行うことができる。一部の実施形態では、本方法は、溶液ハイブリダイゼーションの1回以上の追加ラウンドによってハイブリダイゼーション工程を繰り返すことを含む。一部の実施形態では、本方法は、さらに、ライブラリーキャッチを、同じかまたは異なる回収の標的捕捉試薬を用いた溶液ハイブリダイゼーションの1回以上の追加ラウンドに供することを含む。本明細書における方法での使用に適合させることができるハイブリダイゼーション法は、例えば、国際特許出願公開第2012/092426号に記載されているように、当該技術分野において報告されている。
【0398】
本発明のさらなる実施形態または特徴は、以下の通りである。
【0399】
ある種の実施形態では、本方法は、試料中のがん性表現型(例えば、本明細書に記載される遺伝子または遺伝子産物における変化の少なくとも10、20、30、50個またはそれ以上)に、例えば、正にまたは不に関連する変化の存在または不存在を決定することを含む。他の実施形態では、本方法は、ゲノムシグネチャー、例えば、連続的/複雑なバイオマーカー(例えば、腫瘍遺伝子変異量のレベル)を決定することを含む。他の実施形態では、本方法は、1つ以上のゲノムシグネチャー、例えば、連続的/複雑なバイオマーカー、例えば、マイクロサテライト不安定性のレベル、またはヘテロ接合性(LOH)の存在もしくは不存在を決定することを含む。本方法は、ライブラリーキャッチを得るために、本明細書に記載される方法および標的捕捉試薬のいずれかに従って、溶液ベースの反応において試料中の核酸を接触させること;およびライブラリーキャッチの全部またはサブセットを(例えば、次世代シークエンシングによって)配列決定することを含み、それによって本明細書に記載される遺伝子または遺伝子産物における変化の存在または不存在を決定する。
【0400】
ある種の実施形態では、標的捕捉試薬は、長さが約100ヌクレオチド~300ヌクレオチドのオリゴヌクレオチド(または複数のオリゴヌクレオチド)を含む。典型的には、標的捕捉試薬は、長さが約130ヌクレオチド~230ヌクレオチド、または約150ヌクレオチド~200ヌクレオチドのオリゴヌクレオチド(または複数のオリゴヌクレオチド)を含む。他の実施形態では、標的捕捉試薬は、長さが約300ヌクレオチド~1000ヌクレオチドのオリゴヌクレオチド(または複数のオリゴヌクレオチド)を含む。
【0401】
他の実施形態では、標的捕捉試薬は、cDNA配列を含むか、またはcDNA配列に由来する。一実施形態では、cDNAは、RNA配列、例えば、腫瘍またはがん細胞由来のRNA、例えば、腫瘍-FFPE試料、血液試料、または骨髄吸引試料から得られたRNAから調製される。他の実施形態では、標的捕捉試薬は、ゲノムDNA、cDNAまたはクローン化DNAから増幅された増幅生成物(例えば、PCR生成物)を含む。
【0402】
一部の実施形態では、ライブラリー(例えば、核酸ライブラリー)は、核酸分子の集合体を含む。本明細書に記載されるように、ライブラリーの核酸分子は、標的核酸分子(例えば、腫瘍核酸分子、参照核酸分子および/または対照核酸分子;本明細書中は、それぞれ、第1、第2および/または第3の核酸分子とも呼ばれる)を含むことができる。ライブラリーの核酸分子は、単一の個体由来であり得る。一部の実施形態では、ライブラリーは、1を超える対象(例えば、2、3、4、5、6、7、8、9、10、20、30またはそれ以上の対象)由来の核酸分子を含むことができ、例えば、異なる対象由来の2つ以上のライブラリーを組み合わせて、1を超える対象由来の核酸分子を有するライブラリーを形成することができる。一実施形態では、対象は、がんまたは腫瘍を有するヒト、またはそれを有するリスクがあるヒトである。
【0403】
一部の実施形態では、本方法は、1つまたは複数のライブラリー(例えば、1つまたは複数の核酸ライブラリー)を複数の標的捕捉試薬と接触させて、核酸の選択されたサブグループ、例えば、ライブラリーキャッチを提供する工程を含む。一実施形態では、接触工程は、固体支持体、例えばアレイにおいて行われる。ハイブリダイゼーションのための適切な固体支持体は、例えば、Albert,T.J.ら(2007年)Nat.Methods 4巻(11号):903-5年;Hodges,E.ら(2007年)Nat.Genet.39巻(12号):1522-7頁;およびOkou,D.T.ら(2007年)Nat.Methods 4巻(11号):907-9頁に記載され、それらの内容は参照により本明細書に組み込まれる。他の実施形態では、接触工程は、溶液ハイブリダイゼーションにおいて行われる。一部の実施形態では、本方法は、ハイブリダイゼーションの1回以上の追加ラウンドによってハイブリダイゼーション工程を繰り返すことを含む。一部の実施形態では、本方法は、さらに、ライブラリーキャッチを、標的捕捉試薬の同じまたは異なる集合体とのハイブリダイゼーションの1回以上の追加ラウンドに供することを含む。
【0404】
さらに他の実施形態では、本方法は、ライブラリーキャッチをジェノタイピングに供し、それによって、選択された核酸の遺伝子型を同定する工程をさらに含む。
【0405】
ある種の実施形態では、本方法は、以下:
i)試料をフィンガープリントすること;
ii)試料中の遺伝子または遺伝子産物(例えば、本明細書に記載される遺伝子または遺伝子産物)の存在量を定量すること(例えば、試料中の転写物の相対的存在量を定量すること);
iii)特定の対象(例えば、正常対照またはがん患者)に属する試料を同定すること;
iv)試料中の遺伝的形質(例えば、1つ以上の対象の遺伝的構成(例えば、民族性、人種、家族性形質))を同定すること;
v)核酸試料中の倍数性を決定すること;試料中のヘテロ接合性の喪失を決定すること;
vi)本明細書に記載される変化、例えば、試料中のヌクレオチド置換、コピー数変化、インデル、または再配列の存在または不在を決定すること;
vii)試料中の腫瘍遺伝子変異量および/またはマイクロサテライト不安定性(および/または他の複雑なバイオマーカー)のレベルを決定すること;または
viii)試料中の腫瘍/正常細胞混合物のレベルを決定すること
のうちの1つ以上をさらに含む。
【0406】
異なるオリゴヌクレオチドの組合せは、異なる比、例えば、1:1、1:2、1:3、1:4、1:5、1:10、1:20、1:50、1:100、1:1000などから選択される比で混合することができる。一実施形態では、アレイを生成する標的捕捉試薬(例えば、ベイト)に対する化学合成された標的捕捉試薬(例えば、ベイト)の比は、1:5、1:10、または1:20から選択される。DNAまたはRNAオリゴヌクレオチドは、天然に存在するかまたは天然に存在しないものであり得る。ある種の実施形態では、標的捕捉試薬(例えば、ベイト)は、例えば、融解温度を上昇させるために、1つ以上の天然に存在しないヌクレオチドを含む。例示的な天然に存在しないオリゴヌクレオチドは、修飾されたDNAまたはRNAヌクレオチドを含む。例示的な修飾されたRNAヌクレオチドは、ロックされた核酸(LNA)であり、LNAヌクレオチドのリボース部分は、2’酸素および4’炭素を連結する余分な架橋で修飾される(Kaur,H;Arora,A;Wengel,J;Maiti,S;Arora,A.;Wengel,J.;Maiti,S.(2006年).「Thermodynamic,Counterion,and Hydration Effects for the Incorporation of Locked Nucleic Acid Nucleotides into DNA Duplexes」、Biochemistry 45巻(23号):7347-55頁)。他の修飾された例示的なDNAおよびRNAヌクレオチドには、限定されないが、ペプチド結合によって連結された反復N-(2-アミノエチル)-グリシン単位で構成されるペプチド核酸(PNA)(Egholm,Mら(1993年)Nature 365巻(6446号):566-8頁);低GC領域を捕捉するように修飾されたDNAまたはRNAオリゴヌクレオチド;二環式核酸(BNA)または架橋されたオリゴヌクレオチド;修飾された5-メチルデオキシチジン;および2,6-ジアミノプリンが挙げられる。他の修飾されたDNAおよびRNAヌクレオチドは、当該技術分野において公知である。
【0407】
ある実施形態では、方法は、ライブラリー中の前記核酸断片のサイズが基準値未満またはそれに等しいライブラリーを取得することをさらに含み、前記ライブラリーは、DNA単離とライブラリーの作製との間の断片化工程なしに作製される。
【0408】
ある実施形態では、方法は、核酸断片を取得することをさらに含み、前記核酸断片のサイズが基準値に等しいかまたはそれを超え、断片化された場合、このような核酸断片がライブラリーに作製される。
【0409】
ある実施形態では、方法は、複数のライブラリー核酸分子の各々を、例えば、識別可能な別個の核酸配列(バーコード)を複数の核酸分子の各々に付加することによって標識することをさらに含む。
【0410】
ある実施形態では、方法は、複数のライブラリー核酸分子の各々にプライマーを付着させることをさらに含む。
【0411】
ある実施形態では、方法は、複数の標的捕捉試薬を提供し、複数の標的捕捉試薬を選択することをさらに含み、前記選択は、1)患者特性、例えば、年齢、腫瘍の病期、前治療、または抵抗性;2)腫瘍タイプ;3)試料の特性;4)対照試料の特性;5)対照の存在またはタイプ;6)単離された腫瘍(または対照)核酸試料の特性;7)ライブラリー特性;8)試料中の腫瘍タイプと関連することが公知である突然変異;9)試料中の腫瘍タイプと関連することが公知でない突然変異;10)配列を配列決定する(または配列にハイブリダイズするもしくはそれを回収する)能力、または突然変異を同定する能力、例えば、高いGC領域または再配列を有する配列に関連する困難性;あるいは11)配列決定される遺伝子、に応答する。
【0412】
ある実施形態では、方法は、例えば、前記試料中の少数の腫瘍細胞の決定に応答し、標的捕捉試薬、または複数の標的捕捉試薬を選択し、第2の遺伝子の核酸分子と比較して、第1の遺伝子の核酸分子を比較的高効率で捕捉することをさらに含み、例えば、第1の遺伝子における突然変異は、試料の腫瘍タイプについての腫瘍表現型と関連し、場合により、第2の遺伝子における突然変異は、試料の腫瘍タイプについての腫瘍表現型と関連しない。
【0413】
ある実施形態では、本方法は、ライブラリーキャッチ特性、例えば、核酸濃度についての値を取得し、取得した値を特徴についての参照基準と比較することをさらに含む。
【0414】
ある実施形態では、方法は、ライブラリー定量のための参照基準を満たすライブラリー特性の値を有するライブラリーを選択することをさらに含む。
【0415】
配列決定
【0416】
本発明はまた、核酸を配列決定する方法を含む。これらの方法において、ライブラリーからの核酸分子は、本明細書に記載された方法を用いて、例えば、溶液ハイブリダイゼーションを用いて単離され、それによってライブラリーキャッチを提供する。ライブラリーキャッチまたはそのサブグループを配列決定することができる。したがって、本発明で特徴づけられる方法は、ライブラリーキャッチを分析することをさらに含む。一実施形態では、ライブラリーキャッチは、配列決定方法、例えば、本明細書に記載される次世代シークエンシング法によって分析される。本方法は、溶液ハイブリダイゼーションによりライブラリーキャッチを単離し、核酸配列決定によりライブラリーキャッチを行うことを含む。ある種の実施形態では、ライブラリーキャッチは、再配列決定され得る。
【0417】
当該技術分野において公知である任意の配列決定方法を使用することができる。選択方法によって単離された核酸の配列決定は、典型的には、次世代シークエンシング(NGS)を用いて行われる。本明細書で使用するのに適した配列決定法は、例えば、国際特許出願公開第2012/092426号に記載されるように、当該技術分野において報告されている。
【0418】
ある実施形態では、取得または分析されたリードの少なくとも10%、20%、30%、40%、50%、60%、70%、80%、または90%は、本明細書に記載される遺伝子、例えば、表1A~5Aからの遺伝子に由来する対象区間についてのものである。ある実施形態では、少なくとも0.01、0.02、0.03、0.04、0.05、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、2.0、5.0、10、15、または30メガ塩基、例えば、ゲノム塩基が配列決定される。ある実施形態では、本方法は、本明細書に記載される試料から得られたヌクレオチド配列リードを取得することを含む。ある実施形態では、リードは、NGS配列決定法によって提供される。
【0419】
本明細書に開示される方法は、対象のゲノム、全エクソームまたはトランスクリプトームに存在する変化を検出するために使用することができ、DNAおよびRNA配列決定、例えば、標的DNAおよび/またはRNA配列決定に適用することができる。一部の実施形態では、本明細書に記載される遺伝子の転写物は、配列決定される。他の実施形態では、本方法は、遺伝子または遺伝子産物のレベルの変化(例えば、増加または減少)、例えば、本明細書に記載される遺伝子または遺伝子産物の発現の変化の検出を含む。本方法は、場合により、標的RNAについて試料を濃縮する工程を含むことができる。他の実施形態では、本方法は、ある種の高存在量RNA、例えば、リボソームRNAまたはグロビンRNAの試料を枯渇させる工程を含む。RNA配列決定法は、単独で、または本明細書に記載されるDNA配列決定法と組み合わせて使用することができる。一実施形態では、本方法は、DNA配列決定工程およびRNA配列決定工程を行うことを含む。本方法は、任意の順序で行うことができる。例えば、本方法は、RNA配列決定により、本明細書に記載される変化の発現を確認すること、例えば、本発明のDNA配列決定法により検出された突然変異または融合の発現を確認することを含み得る。他の実施形態では、本方法は、RNA配列決定工程、続いてDNA配列決定工程を行うことを含む。
【0420】
アライメント
【0421】
アラインメントは、リードを、位置、例えば、ゲノム位置と合致させるプロセスである。ミスアラインメント(例えば、ゲノム内の正しくない位置を短いリードから塩基対を配置すること)、例えば、実際のがん突然変異の周囲のリードの配列状況(例えば、反復配列の存在)のためミスアラインメントは、代替の対立遺伝子のリードが代替の対立遺伝子のリードの主な積み重ねからずれてしまう可能性があるため、突然変異検出の感受性の低下につながる場合がある。実際の突然変異が存在しない場合に問題となる配列の状況が生じた場合、ミスアラインメントは、参照ゲノム塩基の実際のリードを誤った位置に配置することによって、「突然変異した」対立遺伝子のアーチファクトによるリードを導入する可能性がある。多重の多重遺伝子解析のための突然変異コーリングアルゴリズムは、少量の突然変異に対してさえも感受性が高いはずであるため、これらのミスアラインメントは、偽陽性の発見率を増加させ/特異性を低下させることがある。
【0422】
本明細書で検討する場合、実際の突然変異に対する感受性の低下は、分析される遺伝子の予想される突然変異部位の周囲のアラインメントの質を(手動または自動化された方法で)評価することによって対処することができる。評価されるべき部位は、がん突然変異のデータベース(例えば、COSMIC)から得ることができる。問題があるものとして同定された領域は、関連する配列状況においてより良い性能を与えるように選択されたアルゴリズムを使用することによって、例えば、Smith-Watermanアラインメントなどの遅いがより正確なアラインメントアルゴリズムを使用するアラインメント最適化(または再アラインメント)によって、修正することができる。一般的なアラインメントアルゴリズムが問題を解決することができない場合、カスタマイズされたアラインメント手法は、例えば、置換を含む可能性が高い遺伝子についての最大差ミスマッチペナルティパラメータの調整;ある種の腫瘍タイプ(例えば、メラノーマにおけるC→T)に共通する特定の突然変異タイプに基づいた、特定のミスマッチペナルティパラメータの調整;またはある種の試料タイプに共通する特定の突然変異タイプ(例えば、FFPEに共通する置換)に基づいた、特定のミスマッチペナルティパラメータの調整によって作製することができる。
【0423】
ミスアラインメントによる評価された遺伝子領域における特異性の低下(偽陽性率の上昇)は、配列決定された試料における全ての突然変異コーリングの手動または自動検査によって評価することができる。ミスアラインメントにより誤った突然変異コーリングを起こしやすいことが見出された領域は、上記と同じアラインメント修正を受けることができる。アルゴリズムによる修正が見つからない場合は、問題領域の「突然変異」を検査パネルから分類またはスクリーニングすることができる。
【0424】
本明細書に開示される方法は、特に、多数の多様な遺伝子の、例えば、試料由来の遺伝子の多数の多様な遺伝的事象の大規模並列配列決定に依存する方法において、再配列、例えば、インデルに関連する対象区間の配列決定における性能を最適化するために、多重の、個別に調整された、アラインメント法またはアルゴリズムの使用を可能にする。一部の実施形態では、異なる遺伝子における多数の再配列の各々に個別にカスタマイズまたは調整される多重アラインメント法が、リードを分析するために使用される。実施形態では、調整は、配列決定される遺伝子(または他の対象区間)、試料中の腫瘍タイプ、配列決定される変異体、または試料もしくは対象の特徴(のうちの1つ以上)の関数であり得る。この選択または配列決定すべき多数の対象区間に微調整されたアラインメント条件の使用は、速度、感受性および特異性の最適化を可能にする。本方法は、比較的多数の多様な対象区間についてのリードのアラインメントが最適化される場合に特に効果的である。実施形態では、本方法は、再配列のために最適化されたアライメント法の使用、および再配列に関連しない対象区間のために最適化された他のアライメント法の使用を含む。
【0425】
一部の実施形態では、アライメントセレクターが使用される。本明細書で使用される「アラインメントセレクター」とは、アラインメント法の選択を可能にするまたは指向するパラメータ、例えば、対象区間の配列決定を最適化することができるアラインメントアルゴリズムまたはパラメータを指す。アライメントセレクターは、関数、例えば、以下の1つ以上の関数に特異的であり得るかまたは関数として選択することができる:
1.配列状況、例えば、前記対象区間についてのリードのミスアラインメントの傾向に関連する、対象区間(例えば、評価されるヌクレオチド位置)の配列状況。例えば、ゲノムの他の箇所で反復される、評価される対象区間内またはその近傍に配列要素が存在すると、ミスアラインメントを引き起こし、それによって性能を低下させる可能性がある。性能は、ミスアラインメントを最小にするアルゴリズムまたはアルゴリズムパラメータを選択することによって増大させることができる。この場合、アラインメントセレクターの値は、配列状況、例えば、ゲノム(または分析されるゲノムの部分)において少なくとも何回も反復される長さの配列の存在または不存在の関数であり得る。
2.分析される腫瘍タイプ。例えば、特定の腫瘍タイプは、欠失の増加率によって特徴づけることができる。したがって、インデルにより感受性であるアルゴリズムまたはアルゴリズムパラメータを選択することによって性能を増大させることができる。この場合、アライメントセレクターの値は、腫瘍タイプ、例えば、腫瘍タイプの識別子の関数であり得る。ある実施形態では、値は、腫瘍タイプ、例えば、固形腫瘍または血液悪性腫瘍(または異型前)の同一性である。
3.分析される遺伝子、または遺伝子タイプ、例えば、遺伝子、または遺伝子タイプを分析することができる。一例として、がん遺伝子は、しばしば、置換またはインフレームインデルによって特徴づけられる。したがって、性能は、これらの変異体に対して特に感受性であり、他の変異体に対して特異的であるアルゴリズムまたはアルゴリズムパラメータを選択することによって増大させることができる。腫瘍抑制因子は、しばしば、フレームシフトインデルによって特徴づけられる。したがって、性能は、これらの変異体に対して特に感受性であるアルゴリズムまたはアルゴリズムパラメータを選択することによって増大させることができる。したがって、性能は、対象区間と合致するアルゴリズムまたはアルゴリズムパラメータを選択することによって増大させることができる。この場合、アラインメントセレクターの値は、遺伝子または遺伝子タイプの関数、例えば、遺伝子または遺伝子タイプの識別子であり得る。ある実施形態では、値は、遺伝子の同一性である。
4.分析される部位(例えば、ヌクレオチド位置)。この場合、アラインメントセレクターの値は、部位または部位タイプの関数、例えば、部位または部位タイプの識別子であり得る。ある実施形態では、値は、部位の同一性である。(例えば、その部位を含む遺伝子が別の遺伝子と高度に相同である場合、正常の/速い短いリードアラインメントアルゴリズム(例えば、BWA)は、2つの遺伝子間の区別が困難であり得、より集約したアラインメント法(Smith-Waterman)またはさらにアセンブリ(ARACHNE)を必要とする可能性がある。同様に、遺伝子配列が低複雑性領域(例えば、AAAAAA)を含む場合、より集約したアラインメント法が必要であり得る。
5.評価される対象区間に関連する変異体または変異体タイプ。例えば、置換、挿入、欠失、転座または他の再配列。したがって、特定の変異体タイプにより感受性であるアルゴリズムまたはアルゴリズムパラメータを選択することによって、性能を増大させることができる。この場合、アライメントセレクターの値は、変異体タイプの関数、例えば、変異体タイプの識別子であり得る。ある実施形態では、値は、変異体タイプ、例えば置換の同一性である。
6.試料タイプ、例えば、本明細書に記載される試料。試料タイプ/品質は、誤差(非参照配列の誤った観察)率に影響を与える可能性がある。したがって、性能は、試料中の真の誤差率を正確にモデル化するアルゴリズムまたはアルゴリズムパラメータを選択することによって増大させることができる。この場合、アライメントセレクターの値は、試料タイプの関数、例えば、試料タイプの識別子であり得る。ある実施形態では、値は、試料タイプの同一性である。
【0426】
一般的に、インデル突然変異の正確な検出は、アラインメントにおけるエクササイズである。これは、本明細書において無効にされた配列決定プラットフォーム上の誤ったインデル速度が比較的低いからである(したがって、正確に整列されたインデルのほんの一握りの観察さえ、突然変異の強力な証拠となり得る)。しかしながら、インデルの存在下での正確なアライメントは、(特にインデルの長さが増加するにつれて)困難になることがある。例えば、置換の整列に関連する一般的な問題に加えて、インデル自体が、アラインメントに問題を引き起こす可能性がある(例えば、2bpのジヌクレオチド反復配列の欠失は、容易に決定的に配置することができない)。感受性と特異性の両方は、見かけ上のインデルを含む短い(<15bp)リードを正しく配置しないことにより低下され得る。より大きなインデル(個々のリードの長さに大きさがより近づき、例えば、36bpのリード)は、リードがまったく整列しない場合があり、整列したリードの標準セットでインデルの検出が不可能になる。
【0427】
がん突然変異のデータベースは、これらの問題に対処し、性能を改善するために使用することができる。偽陽性のインデル発見を減らす(特異性を改善する)ために、一般に予測されるインデルの周囲の領域を、配列の状況による問題のあるアラインメントについて調べることができ、上記の置換と同様に対処することができる。インデル検出の感受性を改善するために、がんにおいて予測されるインデルに関する情報を使用するいくつかの異なる手法を使用することができる。例えば、予想されるインデルを含む短いリードをシミュレートし、アラインメントを試みることができる。アラインメントは、研究することができ、問題のあるインデル領域は、例えば、ギャップオープン/延長ペナルティを減少させることによって、または部分的なリード(例えば、リードの第1または第2の半分)を整列させることによって、アラインメントパラメータを調整することができる。
【0428】
あるいは、最初のアラインメントは、正常な参照ゲノムだけでなく、公知または可能性のあるがんインデル突然変異の各々を含む、ゲノムの代替バージョンでも試みることができる。この手法では、最初は整列ができず、または不正確に整列させたインデルのリードが、ゲノムの代替(突然変異)バージョンにうまく配置される。
【0429】
このようにして、インデルアラインメント(したがって、コーリング)は、期待されるがん遺伝子/部位に対して最適化され得る。本明細書で使用される場合、配列アラインメントアルゴリズムは、リード配列と参照配列との間の類似性を評価することによって生じる可能性が最も高いリード配列(例えば、次世代シークエンシングからの、例えば、短いリード配列)をゲノム中のどこからか同定するために使用される計算方法または手法を具体化する。種々のアルゴリズムを配列アラインメント問題に適用することができる。いくつかのアルゴリズムは、比較的ゆっくりとしたものもあるが、特異性は比較的高い。これらは、例えば、動的プログラミングに基づくアルゴリズムを含む。動的プログラミングは、複雑な問題をより簡単な工程に分解することによって解決する方法である。他の手法は比較的効率的であるが、典型的にはそれほど完全ではない。これらは、例えば、発見的アルゴリズムおよび大規模データベース検索のために設計された確率的方法を含む。
【0430】
アラインメントパラメータは、アラインメントアルゴリズムにおいて使用され、アルゴリズムの性能を調整して、例えば、リード配列と参照配列との間に最適な全体的または局所的アラインメントを生成する。アライメントパラメータは、マッチ、ミスマッチ、およびインデルの重み付けを与えることができる。例えば、低い重み付けは、より多くのミスマッチおよびインデルとのアライメントを可能にする。
【0431】
配列関係、例えば、反復配列(例えば、タンデム反復、散在反復)、低複雑性領域、インデル、偽遺伝子、またはパラログの存在は、アラインメント特異性に影響を及ぼし得る(例えば、ミスアラインメントを引き起こし得る)。本明細書で使用される場合、ミスアラインメントとは、ゲノム中の不正確な位置上の短いリードからの塩基対の配置を指す。
【0432】
アライメントの感受性は、アライメントアルゴリズムが選択される場合、またはアライメントパラメータが腫瘍タイプ、例えば、特定の突然変異または突然変異タイプを有する傾向のある腫瘍タイプに基づいて調整される場合、増大され得る。
【0433】
アラインメントの感受性は、アラインメントアルゴリズムが選択された場合、またはアラインメントパラメータが特定の遺伝子型(例えば、がん遺伝子、腫瘍抑制遺伝子)に基づいて調整された場合に増大され得る。がん関連遺伝子の異なるタイプの突然変異は、がん表現型に異なる影響を及ぼす可能性がある。例えば、変異がん遺伝子の対立遺伝子は、典型的には優性である。突然変異腫瘍抑制対立遺伝子は、典型的には劣性であり、これは、ほとんどの場合、腫瘍抑制遺伝子の両方の対立遺伝子が、影響が現れる前に影響を受けなければならないことを意味する。
【0434】
アラインメントの感受性は、アラインメントアルゴリズムが選択された場合、またはアラインメントパラメータが突然変異型(例えば、一塩基多型、インデル(挿入または欠失)、逆位、転座、タンデム反復)に基づいて調整された場合、調整され得る(例えば、増加され得る)。
【0435】
アライメントの感受性は、アライメントアルゴリズムが選択された場合、またはアライメントパラメータが突然変異部位(例えば、突然変異ホットスポット)に基づいて調整された場合、調整され得る(例えば、増加され得る)。突然変異ホットスポットとは、突然変異が正常な突然変異率の最大100倍にもなるゲノム中の部位を指す。
【0436】
アライメントの感受性/特異性は、アライメントアルゴリズムが選択された場合、またはアライメントパラメータが試料タイプ(例えば、cfDNA試料、ctDNA試料、FFPE試料、またはCTC試料)に基づいて調整された場合、調整され得る(例えば、増加され得る)。
【0437】
一部の実施形態では、NGSリードは、公知の参照配列に整列させることができ、またはデノボでアセンブルさせることができる。例えば、NGSリードは、参照配列(例えば、野生型配列)に整列させることができる。NGSのための配列アラインメントの方法は、例えば、Trapnell C.およびSalzberg S.L.Nature Biotech.、2009年、27巻:455-457頁に記載される。デノボアセンブリの例は、例えば、Warren R.ら、Bioinformatics、2007年、23巻:500-501頁;Butler J.ら、Genome Res.、2008年、18巻:810-820頁;Zerbino D.R.およびBirney E.、Genome Res.、2008年、18巻:821-829頁に記載される。配列アライメントまたはアセンブリは、例えば、Roche/454およびIllumina/Solexaリードデータを混合する1つ以上のNGSプラットフォームからのリードデータを使用して行うことができる。
【0438】
アラインメントの最適化は、例えば、国際特許出願公開第2012/092426号に記載されるように、当該技術分野において記載される。
【0439】
突然変異コーリング
【0440】
ベースコーリングとは、シークエンシング装置の生出力を指す。突然変異コーリングとは、配列決定されるヌクレオチド位置について、例えば、A、G、T、またはCのヌクレオチド値を選択するプロセスを指す。典型的には、ある位置に対する配列決定リード(または塩基コーリング)は、1を超える値を提供し、例えば、いくつかのリードはTを与え、いくつかはGを与える。突然変異コーリングは、ヌクレオチド値、例えば、それらの値の1つを配列に割り当てるプロセスである。これを「突然変異」コーリングと呼ぶが、ヌクレオチド値を任意のヌクレオチド位置、例えば、突然変異対立遺伝子、野生型対立遺伝子、突然変異型もしくは野生型として特徴づけられていない対立遺伝子に対応する位置に、または可変性によって特徴づけられていない位置に割り当てるために、これを適用することができる。突然変異コーリングの方法には、以下:参照配列中の各位置の情報に基づいて独立したコーリングを行うこと(例えば、配列リードを検査すること;ベースコールと品質スコアを検査すること;観察された塩基の確率と潜在的な遺伝子型を与えられた品質スコアを計算すること;および遺伝子型を割り当てること(例えば、ベイズ則を用いる));偽陽性を除去すること(例えば、リード深度が予想よりもはるかに低いかまたは高いSNPを拒絶する深度閾値;小さなインデルによる偽陽性を除去するための局所的な再配置を用いること);およびコーリングを精緻化するための連鎖不均衡(LD)/補定に基づく分析を行うことのうちの1つ以上が含まれ得る。
【0441】
特定の遺伝子型および位置に関連する遺伝子型尤度を計算する式は、例えば、Li H.およびDurbin R.Bioinformatics、2010年;26巻(5号):589-95頁に記載される。ある種のがんタイプにおける特定の突然変異に対する事前予測は、そのがんタイプからの試料を評価する際に使用することができる。このような尤度は、がん突然変異の公的データベース、例えば、がんにおける体細胞性突然変異カタログ(COSMIC)、HGMD(ヒト遺伝子突然変異データベース)、SNPコンソーシアム、乳がん突然変異データベース(BIC)、および乳がん遺伝子データベース(BCGD)から得ることができる。
【0442】
LD/補定に基づく分析の例は、例えば、Browning B.L.およびYu Z.Am.J.Hum.Genet.2009年、85巻(6号):847-61頁に記載される。低いカバレッジSNPコーリング法の例は、例えば、Li Y.ら、Annu.Rev.Genomics Hum.Genet.2009年、10巻:387-406頁に記載される。
【0443】
アラインメントの後、置換の検出は、コーリング法、例えば、ベイズ突然変異コーリング法を用いて行うことができ;これは、対象区間の各々の塩基、例えば、評価される遺伝子のエクソンに適用され、代替の対立遺伝子の存在が観察される。この方法は、突然変異の存在下でのリードデータを観察する確率と、塩基コーリングエラーのみの存在下でのリードデータを観察する確率とを比較する。突然変異は、この比較が突然変異の存在を十分強力に支持するものである場合、コールすることができる。
【0444】
がんDNAの分析において、50%または100%の頻度からの限られた逸脱に対処する方法が開発されている(例えば、SNVMix-Bioinformatics.2010年3月15日;26巻(6号):730-736頁)。しかしながら、本明細書に開示される方法は、試料DNAの1%~100%のいずれかの位置、特に50%未満のレベルで、突然変異対立遺伝子の存在の可能性を考慮することを可能にする。この手法は、天然(多クローン性)腫瘍DNAの低純度FFPE試料における突然変異の検出に特に重要である。
【0445】
ベイズ突然変異検出手法の利点は、突然変異の存在の確率と塩基コーリングエラー単独の確率との比較が、その部位における突然変異の存在の事前予想によって重み付けできることである。所定のがんタイプについて頻繁に突然変異した部位で、代替の対立遺伝子のいくつかのリードが観察された場合、突然変異の証拠の量が通常の閾値を満たさないとしても、突然変異の存在を明確にコールすることがある。次に、この柔軟性を用いて、さらに稀な突然変異/より低い純度の試料に対する検出感受性を増加させるか、またはリードカバレッジの減少に対して検査をより頑健にすることができる。ゲノム中のランダムな塩基対ががんにおいて突然変異する可能性は約1e-6である。典型的な多遺伝子性がんゲノムパネルの多くの部位における特異的な突然変異の可能性は、数桁も高いことがある。これらの可能性は、がん突然変異の公的データベース(例えば、COSMIC)から導き出すことができる。インデルコーリングとは、典型的には、関連する信頼スコアまたは統計的証拠メトリックを含む、挿入または欠失によって参照配列と異なる配列決定データ中の塩基を見出すプロセスである。
【0446】
インデルコーリング法は、候補インデルを同定する工程、局所的再アラインメントを介して遺伝子型尤度を計算する工程、およびLDベースの遺伝子型推論およびコーリングを行う工程を含むことができる。典型的には、潜在的なインデル候補を得るためにベイズ手法を使用し、次に、これらの候補をベイズフレームワークにおける参照配列と一緒にテストする。
【0447】
候補インデルを生成するためのアルゴリズムは、例えば、McKenna A.ら,Genome Res.2010年;20巻(9号):1297-303頁;Ye K.ら,Bioinformatics、2009年;25巻(21号):2865-71;Lunter G.およびGoodson M.Genome Res.2011年;21巻(6号):936-9号;およびLi H.ら、Bioinformatics 2009年、Bioinformatics 25巻(16号):2078-9頁に記載される。
【0448】
インデルコールおよび個人レベルの遺伝子型尤度を生成する方法は、例えば、ディンデルアルゴリズム(Albers C.A.ら,Genome Res.2011年;21巻(6号):961-73頁)を含む。例えば、ベイズEMアルゴリズムを用いて、リードを分析し、最初のインデルコーリングを行い、各候補インデルについて遺伝子型尤度を生成し、次に、例えば、QCALL(Le S.Q.およびDurbin R.Genome Res.2011年;21巻(6号):952-60頁)を用いて遺伝子型の補定を行うことができる。インデルを観察する事前の期待などのパラメータは、インデルのサイズまたは位置に基づいて調整する(例えば、増減または減少させる)ことができる。
【0449】
ある実施形態では、本方法で行われる突然変異コールの少なくとも10%、20%、30%、40%、50%、60%、70%、80%、または90%は、本明細書に記載される遺伝子または遺伝子産物、例えば、表1A~5Aからの遺伝子または遺伝子産物からの対象区間についてのものである。ある実施形態では、本明細書に記載される固有の閾値の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、または90%は、本明細書に記載される遺伝子または遺伝子産物、例えば、表1A~5Aからの遺伝子または遺伝子産物からの対象区間についてのものである。ある実施形態では、注釈されたまたは第三者に報告された突然変異コールの少なくとも10%、20%、30%、40%、50%、60%、70%、80%、または90%は、本明細書に記載される遺伝子または遺伝子産物、例えば、表1A~5Aからの遺伝子または遺伝子産物からの対象区間についてのものであるである。
【0450】
ある実施形態では、ヌクレオチド位置に割り当てられた値は、場合により、説明注釈付きで、第三者に送信される。ある実施形態では、ヌクレオチド位置に割り当てられた値は、第三者に送信されない。ある実施形態では、複数のヌクレオチド位置に割り当てられた値は、場合により、説明注釈付きで、第三者に送信され、第2の複数のヌクレオチド位置に割り当てられた値は、第三者に送信されない。
【0451】
ある実施形態では、本方法は、例えば、バーコードデコンボリューションによって、1つ以上のリードを対象に割り当てることを含む。ある実施形態では、本方法は、例えば、バーコードデコンボリューションによって、腫瘍リードまたは対照リードとして1つ以上のリードを割り当てることを含む。ある実施形態では、本方法は、例えば、参照配列とのアラインメントによって、前記1つ以上のリードの各々をマッピングすることを含む。ある実施形態では、本方法は、コールされた突然変異を記憶することを含む。
【0452】
ある実施形態では、本方法は、コールされた突然変異に注釈を付けること、例えば、突然変異構造、例えば、ミスセンス突然変異、または機能、例えば、疾患表現型の指示でコールされた突然変異に注釈を付けることを含む。ある実施形態では、本方法は、腫瘍および対照核酸についてのヌクレオチド配列リードを取得することを含む。ある実施形態では、本方法は、例えば、ベイズコーリング法または非ベイズコーリング法を用いて、対象区間(例えば、サブゲノム区間、発現されたサブゲノム区間、またはその両方)の各々について、ヌクレオチド値、例えば、変異体、例えば、突然変異をコールすることを含む。ある実施形態では、本方法は、少なくとも1つのSNPを含む複数のリードを評価することを含む。ある実施形態では、本方法は、試料および/または対照リードにおけるSNP対立遺伝子比を決定することを含む。
【0453】
一部の実施形態では、本方法は、標的化されたサブゲノム領域のための配列決定/アラインメントアーチファクトのデータベースを構築することをさらに含む。ある実施形態では、データベースを使用して、誤った突然変異コーリングをフィルタリングし、特異性を改善することができる。ある実施形態では、データベースは、関連のない試料または細胞株を配列決定し、これらの正常試料のうちの1つ以上において、ランダム配列決定エラーのみのために予想よりも頻繁に現れる非参照対立遺伝子事象を記録することによって構築される。この手法は、生殖系列突然変動をアーチファクトとして分類することができるが、体細胞性突然変異に関する方法では受け入れ可能である。アーチファクトとして生殖系列変動のこの誤った分類は、所望であれば、公知の生殖系列変動(共通の変異体を除去する)およびただ1人の個体に現れるアーチファクト(稀な変動を除去する)についてこのデータベースをフィルタリングすることによって、改善され得る。
【0454】
突然変異コーリングの最適化は、例えば、国際特許出願公開第2012/092426号に記載されているように、当該技術分野において記載される。
【0455】
SGZアルゴリズム
【0456】
様々なタイプの変化、例えば、体細胞性変化および生殖系列突然変異は、本明細書に記載される方法(例えば、配列決定、アラインメント、または突然変異コーリング法)によって検出することができる。ある種の実施形態では、生殖系列突然変異は、SGZ(体細胞性-生殖系列-接合性)アルゴリズムを用いる方法によってさらに同定される。
【0457】
臨床現場では、合致した正常対照は、一般的には得られない。理論に拘束されることを望まないが、一部の実施形態では、十分に特徴づけられたゲノム変化は、解釈のために正常組織を必要としないが、少なくともいくつかの変化は、合致する正常対照がない場合には、それらが生殖系列であるかまたは体細胞性であるのか不明であると考えられる。SGZは、がん標本の次世代シークエンシングから同定された変異体の体細胞性対生殖系列起源およびホモ接合対ヘテロ接合またはサブクローン性状態を予測するための計算法である。
【0458】
SGZ法は、合致した正常対照を必要とせず、臨床現場で広範な適用を可能にする。SGZは、変化の対立遺伝子頻度(AF)をモデル化することによって同定された各変化の体細胞性対生殖系列の状態を、腫瘍含量、腫瘍倍数性、および局所コピー数を考慮に入れて予測する。予測の精度は、配列決定の深度とコピー数モデルの適合度に依存し、これは、がん関連遺伝子およびゲノムワイド一塩基多型(SNP)を高深度に配列決定することによって達成することができる。コールは、SNP AFのリード深度と局所変動に基づく統計を用いて行われる。
【0459】
一部の実施形態では、本方法は、対象、例えば、ヒト、例えば、がん患者由来の組織(例えば、腫瘍)または試料における変異体、例えば、突然変異を特徴づけることをさらに含み、
a)以下:
i)配列カバレッジ入力(SCI)であって、複数の選択された対象区間、例えば、エクソンの各々について、選択された対象区間における正規化された配列カバレッジの値を含むSCI;
ii)SNP対立遺伝子頻度入力(SAFI)であって、複数の選択された生殖系列SNPの各々について、腫瘍または試料中の対立遺伝子頻度の値を含むSAFI;
iii)変異体対立遺伝子頻度入力(VAFI)であって、腫瘍または試料における前記変異体、例えば、突然変異についての対立遺伝子頻度を含むVAFI;
を取得すること;
b)SCIおよびSAFIの関数として、以下:
複数のゲノムセグメントの各々についてのC、Cはゲノムセグメントの全コピー数である;
複数のゲノムセグメントの各々についてのM、Mはゲノムセグメントのマイナー対立遺伝子コピー数である;
p、pは試料の純度である
についての値を取得すること;ならびに
c)以下:
i)変異体型、例えば、突然変異型の値、例えば、gであって、変異体、例えば、突然変異を示すものであって、体細胞性、サブクローン性体細胞性変異体、生殖系列、または識別不能であり、VAFI、p、C、およびMの関数である値;
ii)CおよびMの関数として、腫瘍または試料における変異体、例えば、突然変異の接合性の指標
のうちの一方または両方を取得すること
を含む。
【0460】
ある実施形態では、対象からの非腫瘍組織を分析する必要なく、分析を行うことができる。ある実施形態では、分析は、対象由来の非腫瘍組織を分析することなく行われ、例えば、同一対象由来の非腫瘍組織は配列決定されない。
【0461】
ある実施形態では、SCIは、例えば、試料からの、対象区間についてのリード数、および対照についてのリード数、例えば、プロセスが合致した対照の関数、例えば、その比のlogである値を含む。ある実施形態では、SCIは、例えば、少なくとも10、25、50、100、150、200、250、300、350、400、450、500、1,000、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、または10,000個の対象区間、例えば、エクソンについての値、例えば、log r値を含む。ある実施形態では、SCIは、少なくとも100個の対象区間、例えば、エクソンについての値、例えば、log r値を含む。ある実施形態では、SCIは、例えば、1,000~10,000、2,000~9,000、3,000~8,000、3,000~7,000、3,000~6,000、または4,000~5,000個の対象区間、例えば、エクソンについての値、例えば、log r値を含む。ある実施形態では、SCIは、例えば、少なくとも10、25、50、100、150、200、250、300、350、400、450、500、1,000、2,000、3,000、または4,000個の遺伝子からの対象区間、例えば、エクソンについての値、例えば、log r値を含む。
【0462】
ある実施形態では、SCIに含まれる値の少なくとも1つ、複数の、または実質的に全ては、GC含量との相関のために補正される。
【0463】
ある実施形態では、試料からの対象区間、例えば、エクソンは、少なくとも10、20、30、40、50、100、150、200、250、300、350、400、450、500、600、700、800、900、または1,000個のリードを有する。ある実施形態では、試料からの複数の、例えば、少なくとも10、25、50、100、150、200、250、300、350、400、450、500、1,000、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、または10,000個の対象区間、例えば、エクソンは、多数のリードを有する。ある実施形態では、読みの数は、少なくとも10、20、30、40、50、100、150、200、250、300、350、400、450、500、600、700、800、900、または1,000個である。ある実施形態では、複数の生殖系列SNPは、少なくとも10、25、50、100、150、200、250、300、350、400、450、500、1,000、2,000、3,000、4,000、5000、6000、7000、8000、9000、10,000、または15,000個の生殖系列SNPを含む。
【0464】
ある実施形態では、複数の生殖系列SNPは、少なくとも100個の生殖系列SNPを含む。ある実施形態では、複数の生殖系列SNPは、500~5,000個、1,000~4,000個、または2,000~3,000個の生殖系列SNPを含む。ある実施形態では、対立遺伝子頻度は、マイナー対立遺伝子頻度である。ある実施形態では、対立遺伝子頻度は、代替対立遺伝子、例えば、ヒトゲノム参照データベースにおける標準的な対立遺伝子以外の対立遺伝子である。
【0465】
ある実施形態では、本方法は、試料中の複数の変異体、例えば、突然変異体を特徴づけることを含む。ある実施形態では、本方法は、少なくとも2、3、4、5、6、7、8、9、10、25、50、100、150、200、250、300、350、400、450、または500個の変異体、例えば、突然変異体を特徴づけることを含む。ある実施形態では、本方法は、少なくとも2、3、4、5、6、7、8、9、10、25、50、100、150、200、250、300、350、400、450、または50個の異なる遺伝子において、変異体、例えば、突然変異体を特徴づけることを含む。
【0466】
ある実施形態では、本方法は、少なくとも2、3、4、5、6、7、8、9、10、25、50、100、150、200、250、300、350、400、450、または500個の変異体、例えば、突然変異体についてVAFIを取得することを含む。ある実施形態では、本方法は、少なくとも2、3、4、5、6、7、8、9、10、25、50、100、150、200、250、300、350、400、450、または500個の変異体、例えば、突然変異体について、工程a)、b)、およびc)の1つ、2つまたは全部を行うことを含む。ある実施形態では、C、M、およびpの値は、ゲノムワイドコピー数モデルをSCIおよびSAFIの一方または両方に適合させることによって得られ、得られたものであり、または得ることができる。ある実施形態では、C、M、およびpの値は、SCIおよびSAFIの複数のゲノムワイドコピー数モデル入力に適合する。ある実施形態では、ゲノムセグメントは、複数の対象区間、例えば、エクソン、例えば、SCI値が割り当てられた対象区間を含む。
【0467】
ある実施形態では、ゲノムセグメントは、少なくとも10、20、30、40、50、60、70、80、90、100、125、150、175、200、225、250、275、300、400、または500個の対象区間、例えば、エクソンを含む。ある実施形態では、ゲノムセグメントは、10~1,000、20~900、30~700、40~600、50~500、60~400、70~300、80~200、80~150、または80~120、90~110、または約100個の対象区間、例えば、エクソンを含む。ある実施形態では、ゲノムセグメントは、100~10,000、100~5,000、100~4,000、100~3,000、100~2,000、または100~1,000個の対象区間、例えば、エクソンを含む。ある実施形態では、ゲノムセグメントは、SAFI値が割り当てられている10~1,000、20~900、30~700、40~600、50~500、60~400、70~300、80~200、80~150もしくは80~120、90~110、または約100個のゲノムSNPを含む。ある実施形態では、ゲノムセグメントは、SAFI値が割り当てられている100~10,000、100~5,000、100~4,000、100~3,000、100~2,000、または100~1,000個のゲノムSNPを含む。
【0468】
ある実施形態では、複数のゲノムセグメントの各々は、以下のいずれか1つまたは両方を有することによって特徴づけられる:
正規化された配列カバレッジの尺度、例えば、log rは、予め選択された量以下にしか相違せず、例えば、ゲノムセグメントの境界内の対象区間、例えば、エクソンについてのlog2rの値は、参照値以下にしか相違せず、または実質的に一定である;
生殖系列SNPのSNP対立遺伝子頻度は、予め選択された量以下にしか相違せず、例えば、ゲノムセグメントの境界内の対象区間、例えば、エクソンの生殖系列SNP対立遺伝子の値は、参照値以下にしか相違せず、または実質的に一定である。
【0469】
ある実施形態では、ゲノムセグメントに含まれるか、またはゲノムセグメントを形成するために組み合わされる対象区間、例えば、エクソンの数は、ゲノムセグメントの数の少なくとも2、5、10、15、20、50、または100倍である。ある実施形態では、対象区間、例えば、エクソンの数は、ゲノムセグメントの数の少なくとも3、4、5、6、7、8、9、10、11、12、13、14、または15倍である。
【0470】
ある実施形態では、ゲノムセグメントの境界が提供される。ある実施形態では、本方法は、対象区間、例えば、エクソンのための配列を遺伝的セグメントにアセンブルさせることを含む。
【0471】
ある実施形態では、本方法は、本明細書に記載される方法、例えば、環状二分割法(CBS)、HMMベースの方法、ウェーブレットベースの方法、または染色体に沿ったクラスター法を含む方法を用いて、対象区間のための配列をアセンブルさせることを含む。
【0472】
ある実施形態では、ゲノムワイドコピー数モデルのSCIへの適合は、以下の式を使用することを含む:
ψは腫瘍倍数性である。
【0473】
ある実施形態では、ψ=(ΣiliCi)/Σiliであり、liをゲノムセグメントの長さとする。
【0474】
ある実施形態では、ゲノムワイドコピー数モデルのSAFIへの適合は、以下の式を使用することを含む:
AFは対立遺伝子頻度である。
【0475】
ある実施形態では、適合は、ギブスサンプリングを使用することを含む。ある実施形態では、適合は、例えば、マルコフ連鎖モンテカルロ(MCMC)アルゴリズム、例えば、ASCAT(腫瘍の対立遺伝子特異的コピー数分析)、OncoSNP、またはPICNIC(がんにおける統合コピー数の予測)を使用することを含む。ある実施形態では、適合は、メトロポリス-ハスティングスMCMCを使用することを含む。ある実施形態では、適合は、非ベイズ手法、例えば、頻度論的手法を用いること、例えば、最小二乗適合を使用することを含む。
【0476】
ある実施形態では、gは、VAFI、p、C、およびMについての値の体細胞性/生殖系列の状態に関するモデルへの適合度を決定することによって決定される。ある実施形態では、本方法は、前記変異体、例えば、突然変異に対するヘテロ接合性の指標を取得することを含む。ある実施形態では、試料純度(p)は、全体的な純度であり、例えば、全ゲノムセグメントに対して同じである。
【0477】
ある実施形態では、gの値は、以下によって取得される:
AFは対立遺伝子頻度である。
【0478】
ある実施形態では、0に近い、例えば、0と有意に異ならないgの値は、その変異体が体細胞性変異体であることを示す。ある実施形態では、0である、または0に近い、例えば、0からある距離内のgの値、例えば、0.4未満のgの値は、変異体が体細胞性変異体であることを示す。ある実施形態では、1に近い、例えば、1と有意に異ならないgの値は、変異体が生殖系列変異体であることを示す。ある実施形態では、1である、または1に近い、例えば、1からある距離内のgの値、例えば、0.6を超えるgの値は、変異体が生殖系列変異体であることを示す。ある実施形態では、gの値は、1未満であるが、0を超え、例えば、gが量で1未満であり、量で0を超えている場合、例えば、gが0.4~0.6である場合、それは識別不能な結果を示す。
【0479】
ある実施形態では、0よりも有意に小さいgの値は、サブクローン性体細胞性変異体を示す。
【0480】
ある実施形態では、gの値は、以下によって取得される:
AFは対立遺伝子頻度であり、M’=C-M(例えば、Mが非マイナー対立遺伝子頻度である場合)であり、例えば、変異体は、g=1であれば生殖系列多型であり、変異体は、g=0であれば体細胞性突然変異である。
【0481】
ある実施形態では、体細胞性/生殖系列の状態は、例えば、試料の純度が約40%未満、例えば、約10%~30%、例えば、約10%~20%、または約20%~30%である場合に決定される。
【0482】
一実施形態では、Mの値が0に等しく、Cに等しくない場合、変異体、例えば、突然変異が存在しないこと、例えば、腫瘍に存在しないことを示す;Cに等しく、ゼロでないMの値は、変異体、例えば、突然変異のホモ接合性を示し、例えば、ヘテロ接合性の喪失(LOH)を伴う;0に等しく、Cに等しいMの値は、変異体、例えば、突然変異のホモ接合型欠失を示し、例えば、腫瘍に存在しないことを示す;およびCに等しくなく、ゼロでないMの値は、変異体、例えば、突然変異のヘテロ接合性を示す。
【0483】
ある実施形態では、本方法は、前記変異体、例えば、突然変異に対する接合性の指標を取得することを含む。ある実施形態では、突然変異状態は、M=C≠0の場合、ホモ接合体(例えば、LOH)として決定される。ある実施形態では、突然変異状態は、M=C=0の場合、ホモ接合型欠失として決定される。ある実施形態では、突然変異状態は、ヘテロ接合性が0<M<Cであると決定される。ある実施形態では、突然変異は、M=0およびC≠0の場合、腫瘍に存在しない。ある実施形態では、接合性は、例えば、試料純度が約80%を超える場合、例えば、約90%~100%、例えば、約90%~95%、または約95%~100%である場合に決定される。
【0484】
ある実施形態では、対照は、試料が由来する対象以外の対象由来の正倍体(例えば、二倍体)組織の試料であるか、または試料が由来する対象以外の1以上(例えば、少なくとも2、3、4、または5)の対象由来の混合正倍体(例えば、2倍体)組織の試料である。ある実施形態では、本方法は、選択された対象区間の各々、および選択された生殖系列SNPの各々を、例えば、次世代シークエンシング(NGS)によって配列決定することを含む。ある実施形態では、正規化前の配列カバレッジは、少なくとも約10×、20×、30×、50×、100×、250×、500×、750×、800×、900×、1,000×、1,500×、2,000×、2,500×、3,000×、3,500×、4,000×、4,500×、5,000×、5,500×、6,000×、6,500×、7,000×、7,500×、8,000×、8,500×、9,000×、9,500×、または10,000×の配列決定深度である。
【0485】
ある実施形態では、対象は、抗がん療法を受けたことがある。ある実施形態では、対象は、抗がん療法を受けたことがあり、療法に抵抗性であるか、または疾患の進行を示す。ある実施形態では、対象は、FDA、EMA、もしくは他の規制機関により承認された治療剤;またはFDA、EMA、もしくは他の規制機関により承認されていない治療剤から選択される抗がん療法を受けたことがある。ある実施形態では、対象は、臨床治験、例えば、第I相、第II相、または第III相臨床治験(またはこのような試験の米国外同等物)の過程で抗がん療法を受けたことがある。ある実施形態では、変異体は、対象に存在する腫瘍タイプ、例えば、治療の発生または治療に対する抵抗性と正に関連する。ある実施形態では、変異体は、対象に存在する腫瘍タイプと正に関連しない。ある実施形態では、変異体は、対象に存在する腫瘍タイプ以外の腫瘍と正に関連する。ある実施形態では、変異体は、対象に存在する腫瘍タイプと正に関連しない変異体である。
【0486】
ある実施形態では、本方法は、腫瘍における他の突然変異、例えば、試料中の腫瘍タイプに関連する他の突然変異、試料中の腫瘍タイプと関連しない他の突然変異、または試料中の腫瘍タイプ以外の腫瘍に関連する他の突然変異の存在、不存在、もしくは頻度;変異体の特徴づけ;対立遺伝子もしくは遺伝子;または腫瘍タイプ、例えば、腫瘍タイプの名称、腫瘍が原発性であるか二次性であるか;対象の特性;または治療代替物、推奨、またはオプションのうちの1つ以上についての記述子を、例えば、データベース、例えば、機械リード可能データベースに記憶するか、記述子を含む報告書を提出するか、または送信することができる。
【0487】
ある実施形態では、変異体の特徴づけに関する記述子は、接合性または生殖系列対体細胞性状態の記述子を含む。ある実施形態では、対象の特徴に関連する記述子は、対象の同一性;対象の年齢、性別、体重、もしくは他の類似の特徴、職業の1つ以上;対象の病歴、例えば、腫瘍もしくは他の障害の発生;対象の家族歴、例えば、変異体を共有するかまたは共有しない近親者;または対象の以前の治療歴、例えば、受けた治療、例えば、以前に投与された抗がん治療に対する反応、例えば、疾患抵抗性、反応性、または進行の記述子のうちの1つ以上を含む。
【0488】
SGZアルゴリズムはまた、Sunら PLoS Comput Biol.2018年;14(2):e1005965;Sunら Cancer Research 2014年;74巻(19S):1893-1893頁;国際出願公開第WO2014/183078号、米国特許第9,792,403号、および米国特許出願公開第2014/0336996号に記載され、これらの内容は全体として参照により組み込まれる。
【0489】
腫瘍遺伝子変異量
【0490】
本明細書に記載される方法および組成物は、腫瘍遺伝子変異量(TMB)を評価するために使用することができる。
【0491】
用語「突然変異の量」、「突然変異量荷」、「突然変異荷重」、および「突然変異の荷重」は、本明細書において互換的に使用される。腫瘍との関連で、突然変異の荷重はまた、本明細書において「腫瘍遺伝子変異の量」、「腫瘍遺伝子変異量」、または「TMB」とも呼ばれる。理論に拘束されることを望まないが、一部の実施形態では、TMBは、あるタイプのゲノムシグネチャー、例えば、連続的/複雑なバイオマーカーとみなすことができると考えられる。
【0492】
本明細書で使用される場合、用語「突然変異量」または「突然変異の量」は、遺伝子セット(例えば、遺伝子セットのコード化領域)における所定の単位あたり(例えば、1メガ塩基あたり)の変化(例えば、1つ以上の変化、例えば、1つ以上の体細胞性変化)のレベル、例えば、数を指す。突然変異量は、例えば、全ゲノムもしくはエクソームベースで、またはゲノムもしくはエクソームのサブセットに基づいて測定することができる。一部の実施形態では、ゲノムまたはエクソームのサブセットに基づいて測定される突然変異量は、全ゲノムまたはエクソーム突然変異量を決定するために外挿することができる。
【0493】
ある実施形態では、方法は、
a)試料からの対象区間セット(例えば、コーディング対象区間)の配列、例えば、ヌクレオチド配列を提供し、対象区間セットは遺伝子セットからのものであり;
b)突然変異量の値を決定し、値は、対象区間セットにおける変化(例えば、1つ以上の変化)、例えば、体細胞性変化(例えば、1つ以上の体細胞性変化)の数の関数である
を含む。
【0494】
ある種の実施形態では、変化の数は、対象区間における機能的変化を除外する。他の実施形態では、変化の数は、対象区間における生殖系列変化を除外する。一部の実施形態では、変化の数は、対象区間における機能的変化および対象区間における生殖系列変化を除外する。
【0495】
ある種の実施形態では、対象区間セットは、コーディング対象区間を含む。他の実施形態では、対象区間セットは、非コーディング対象区間を含む。ある種の実施形態では、対象区間セットは、コーディング対象区間を含む。他の実施形態では、対象区間セットは、1つ以上のコーディング対象区間および1つ以上の非コーディング対象区間を含む。ある種の実施形態では、対象区間セットにおける対象区間の約5%以上、約10%以上、約20%以上、約30%以上、約40%以上、約50%以上、約60%以上、約70%以上、約80%以上、約90%以上、または約95%以上は、コーディング対象区間である。他の実施形態では、対象区間セットにおける対象区間の約90%以下、約80%以下、約70%以下、約60%以下、約50%以下、約40%以下、約30%以下、約20%以下、約10%以下、または約5%以下は、非コーディング対象区間である。
【0496】
他の実施形態では、対象区間のセットは、全ゲノムまたは全エクソームを含まない。他の実施形態では、コーディング対象区間セットは、全エクソームを含まない。
【0497】
ある種の実施形態では、遺伝子セットは、全ゲノムまたは全エクソームを含まない。他の実施形態では、遺伝子セットは、表1A~5Aに示される1つ以上の遺伝子を含むかまたはそれからなる。
【0498】
ある種の実施形態では、値は、遺伝子セットの関数として表される。ある種の実施形態では、値は、遺伝子セットのコード化領域の関数として表される。他の実施形態では、値は、遺伝子セットの非コード化領域の関数として表される。ある種の実施形態では、値は、遺伝子セットのエクソンの関数として表される。他の実施形態では、値は、遺伝子セットのイントロンの関数として表される。
【0499】
ある種の実施形態では、値は、配列決定され遺伝子セットの関数として表される。ある種の実施形態では、値は、配列決定された遺伝子セットのコード化領域の関数として表される。他の実施形態では、値は、配列決定された遺伝子セットの非コード化領域の関数として表される。ある種の実施形態では、値は、配列決定された遺伝子セットのエクソンの関数として表される。他の実施形態では、値は、配列決定された遺伝子セットのイントロンの関数として表される。
【0500】
ある種の実施形態では、値は、遺伝子セットの多数の位置における変化(例えば、体細胞性変化)の数の関数として表される。ある種の実施形態では、値は、遺伝子セットのコード化領域の多数の位置における変化(例えば、体細胞性変化)の数の関数として表される。他の実施形態では、値は、遺伝子セットの非コード化領域の多数の位置における変化(例えば、体細胞性変化)の数の関数として表される。ある種の実施形態では、値は、遺伝子セットのエクソンの多数の位置における変化(例えば、体細胞性変化)の数の関数として表される。他の実施形態では、値は、遺伝子セットのイントロンの多数の位置における変化(例えば、体細胞性変化)の数の関数として表される。
【0501】
ある種の実施形態では、値は、配列決定された遺伝子セットの多数の位置における変化(例えば、体細胞性変化)の数の関数として表される。ある種の実施形態では、値は、配列決定された遺伝子セットのコード化領域の多数の位置における変化(例えば、体細胞性変化)の数の関数として表される。他の実施形態では、値は、配列決定された遺伝子セットの非コード化領域の多数の位置における変化(例えば、体細胞性変化)の数の関数として表される。ある種の実施形態では、値は、配列決定された遺伝子セットのエクソンの多数の位置における変化(例えば、体細胞性変化)の数の関数として表される。他の実施形態では、値は、配列決定された遺伝子セットのイントロンの多数の位置における変化(例えば、体細胞性変化)の数の関数として表される。
【0502】
ある種の実施形態では、値は、単位あたりの変化(例えば、体細胞性変化)の数の関数として、例えば、メガ塩基あたりの体細胞性変化の数の関数として表される。
【0503】
ある種の実施形態では、値は、遺伝子セットのメガ塩基あたりの変化(例えば、体細胞性変化)の数の関数として表される。ある種の実施形態では、値は、遺伝子セットのコード化領域におけるメガ塩基あたりの変化(例えば、体細胞性変化)の数の関数として表される。他の実施形態では、値は、遺伝子セットの非コード化領域におけるメガ塩基あたりの変化(例えば、体細胞性変化)の数の関数として表される。ある種の実施形態では、値は、遺伝子セットのエクソンにおけるメガ塩基あたりの変化(例えば、体細胞性変化)の数の関数として表される。他の実施形態では、値は、遺伝子セットのイントロンにおけるメガ塩基あたりの変化(例えば、体細胞性変化)の数の関数として表される。
【0504】
ある種の実施形態では、値は、配列決定された遺伝子セットにおけるメガ塩基あたりの変化(例えば、体細胞性変化)の数の関数として表される。ある種の実施形態では、値は、配列決定された遺伝子セットのコード化領域におけるメガ塩基あたりの変化(例えば、体細胞性変化)の数の関数として表される。他の実施形態では、値は、配列決定された遺伝子セットの非コード化領域におけるメガ塩基あたりの変化(例えば、体細胞性変化)の数の関数として表される。ある種の実施形態では、値は、配列決定された遺伝子セットのエクソンにおけるメガ塩基あたりの変化(例えば、体細胞性変化)の数の関数として表される。他の実施形態では、値は、配列決定された遺伝子セットのイントロンにおけるメガ塩基あたりの変化(例えば、体細胞性変化)の数の関数として表される。
【0505】
ある種の実施形態では、突然変異量は、例えば、全突然変異量を得るために、大部分のゲノムに、例えば、エクソームまたは全ゲノムに外挿される。他の実施形態では、突然変異量は、大部分のエクソーム、例えば、全エクソームに外挿される。
【0506】
ある種の実施形態では、試料は、対象由来である。ある種の実施形態では、対象は、障害、例えば、がんを有する。他の実施形態では、対象は、療法、例えば、免疫療法を受けているかまたは受けたことがある。
【0507】
ある種の実施形態では、突然変異量は、百分位として、例えば、参照集団からの試料における突然変異量のうちで表される。ある種の実施形態では、参照集団は、対象と同じタイプのがんを有する患者を含む。他の実施形態では、参照集団は、対象と同じタイプの療法を受けているかまたは受けたことがある患者を含む。
【0508】
ある種の実施形態では、本方法は、
(i)試料から複数の腫瘍核酸分子を含むライブラリーを取得すること;
(ii)ライブラリーを標的捕捉試薬と接触させて、選択された腫瘍核酸分子を提供し、前記標的捕捉試薬は、腫瘍核酸分子とハイブリダイズし、それによってライブラリーキャッチを提供すること;
(iii)例えば、次世代シークエンシング法により、前記ライブラリーキャッチ由来の腫瘍核酸分子からの変化(例えば、体細胞性変化)を含む対象区間についてのリードを取得すること;
(iv)アライメント法により前記リードを整列させること;
(v)ヌクレオチド位置についての前記リードからヌクレオチド値を割り当てること;
(vi)割り当てられたヌクレオチド位置セットから、対象区間セットを選択すること(例えば、対象区間をコードすること)であって、対象区間セットは遺伝子セットに由来する、対象区間セットを選択すること;ならびに
(vii)突然変異量の値を決定することであって、値は、対象区間セットにおける変化(例えば、1つ以上の変化)、例えば、体細胞性変化(例えば、1つ以上の体細胞性変化)の数の関数である、突然変異量の値を決定すること
を含む。
【0509】
ある種の実施形態では、変化(例えば、体細胞性変化)の数は、対象区間における機能的変化を除外する。他の実施形態では、変化の数は、対象区間における生殖系列変化を除外する。ある種の実施形態では、変化(例えば、体細胞性変化)の数は、対象区間における機能的変化および対象区間における生殖系列変化を除外する。
【0510】
腫瘍遺伝子変異量を評価する他の方法は、その内容が全体として参照により組み込まれる国際出願公開第WO2017/151524号に記載される。
【0511】
遺伝子選択
【0512】
選択された遺伝子または遺伝子産物(本明細書では「標的遺伝子または遺伝子産物」とも称する)は、遺伝子内領域または遺伝子間領域を含む対象区間を含むことができる。例えば、対象区間は、エクソンもしくはイントロン、またはそれらの断片、典型的にはエクソン配列もしくはその断片を含むことができる。対象区間は、コード化領域または非コード化領域、例えば、プロモーター、エンハンサー、5’非翻訳領域(5’UTR)、もしくは3’非翻訳領域(3’UTR)、またはその断片を含み得る。他の実施形態では、対象区間は、cDNAまたはその断片を含む。他の実施形態では、対象区間は、SNP、例えば、本明細書に記載されるSNPを含む。
【0513】
他の実施形態では、対象区間は、ゲノム中の実質的に全てのエクソン、例えば、本明細書に記載される対象区間の1つ以上(例えば、目的とする遺伝子または遺伝子産物(例えば、本明細書に記載されるがん性表現型に関連する遺伝子または遺伝子産物)からのエクソン)を含む。一実施形態では、対象区間は、体細胞性突然変異、生殖細胞突然変異、またはその両方を含む。一実施形態では、対象区間は、変化、例えば、点または単一の突然変異、欠失突然変異(例えば、インフレーム欠失、遺伝子内欠失、完全遺伝子欠失)、挿入突然変異(例えば、遺伝子内挿入)、逆位突然変異(例えば、染色体内逆位)、連結突然変異、連結挿入突然変異、逆位重複突然変異、タンデム重複(例えば、染色体内タンデム重複)、転座(例えば、染色体内転座、非相互転座)、再配列、遺伝子コピー数の変化、またはそれらの組合せを含む。ある種の実施形態では、対象区間は、試料中の腫瘍細胞のゲノムのコード化領域の5%、1%、0.5%、0.1%、0.05%、0.01%、0.005%または0.001%未満を構成する。他の実施形態では、対象区間は、疾患に関与せず、例えば、本明細書に記載されるがん性表現型と関連しない。
【0514】
一実施形態では、標的遺伝子または遺伝子産物は、バイオマーカーである。本明細書で使用される場合、「バイオマーカー」または「マーカー」は、変化され得る遺伝子、mRNA、またはタンパク質であり、前記変化はがんと関連する。変化は、正常もしくは健康な組織または細胞(例えば、対照)におけるその量、構造、および/または活性と比較した、がん組織またはがん細胞における量、構造、および/または活性であり得、がんなどの病状と関連する。例えば、がんに関連するマーカー、または抗がん療法に対する反応性を予測するマーカーは、正常、健康な組織または細胞と比較して、がん組織またはがん細胞において、変化したヌクレオチド配列、アミノ酸配列、染色体転座、染色体内逆位、コピー数、発現レベル、タンパク質レベル、タンパク質活性、エピジェネティック修飾(例えば、メチル化もしくはアセチル化状態、または翻訳後修飾)を有することができる。さらに、「マーカー」は、がんなどの病状と関連する組織または細胞に存在する場合、構造が変化し、例えば、突然変異し(突然変異を含む)、例えば、ヌクレオチドまたはアミノ酸レベルで野生型配列と、例えば、置換、欠失、または挿入により相違する分子を含む。
【0515】
一実施形態では、標的遺伝子または遺伝子産物は、一塩基多型(SNP)を含む。別の実施形態では、遺伝子または遺伝子産物は、小さな欠失、例えば、小さな遺伝子内欠失(例えば、インフレーム欠失またはフレームシフト欠失)を有する。さらに別の実施形態では、標的配列は、遺伝子全体の欠失から生じる。さらに別の実施形態では、標的配列は、小さな挿入、例えば、小さな遺伝子内挿入を有する。一実施形態では、標的配列は、逆位、例えば、染色体内逆位から生じる。別の実施形態では、標的配列は、染色体間転座から生じる。さらに別の実施形態では、標的配列は、タンデム重複を有する。一実施形態では、標的配列は、望ましくない特徴(例えば、高いGC含量または反復要素)を有する。別の実施形態では、標的配列は、例えば、その反復性のために、それ自体ではうまく標的化することができないヌクレオチド配列の一部を有する。一実施形態では、標的配列は、選択的スプライシングから生じる。別の実施形態では、標的配列は、表1A~5Aに従う遺伝子もしくは遺伝子産物、またはその断片から選択される。
【0516】
ある実施形態では、標的遺伝子もしくは遺伝子産物、またはその断片は、抗体遺伝子もしくは遺伝子産物、免疫グロブリンスーパーファミリー受容体(例えば、B細胞受容体(BCR)もしくはT細胞受容体(TCR)))遺伝子もしくは遺伝子産物、またはその断片である。
【0517】
ヒト抗体分子(およびB細胞受容体)は、少なくとも以下の3つの遺伝子座上の遺伝子によってコードされる定常領域(C)と可変領域(V)の両方を含む重鎖および軽鎖で構成される。
【0518】
1.免疫グロブリン重鎖の遺伝子セグメントを含む、第14染色体上の免疫グロブリン重遺伝子座(IGH@);
2.免疫グロブリン軽鎖の遺伝子セグメントを含む、第2染色体上の免疫グロブリンカッパ(κ)遺伝子座(IGK@);
3.免疫グロブリン軽鎖の遺伝子セグメントを含む、第22染色体上の免疫グロブリンラムダ(λ)遺伝子座(IGL@)。
【0519】
各重鎖および軽鎖遺伝子は、抗体タンパク質の可変領域に対する3つの異なるタイプの遺伝子セグメントの多重コピーを含む。例えば、免疫グロブリン重鎖領域は、5個の異なるクラスγ、δ、α、μおよびε、44個の可変(V)遺伝子セグメント、27個の多様性(D)遺伝子セグメント、および6個の結合(J)遺伝子セグメントのうちの1つを含むことができる。軽鎖はまた、多数のVおよびJ遺伝子セグメントを持つが、D遺伝子セグメントを持たない。ラムダ軽鎖は、7つの可能なC領域を有し、カッパ軽鎖は1つを有する。
【0520】
免疫グロブリン重遺伝子座(IGH@)は、ヒト第14染色体上の領域であり、ヒト抗体(または免疫グロブリン)の重鎖の遺伝子を含む。例えば、IGH遺伝子座には、IGHV(可変)、IGHD(多様性)、IGHJ(結合)、およびIGHC(定常)遺伝子が含まれる。免疫グロブリン重鎖をコードする例示的な遺伝子には、限定されないが、IGHV1-2、IGHV1-3、IGHV1-8、IGHV1-12、IGHV1-14、IGHV1-17、IGHV1-18、IGHV1-24、IGHV1-45、IGHV1-46、IGHV1-58、IGHV1-67、IGHV1-68、IGHV1-69、IGHV1-38-4、IGHV1-69-2、IGHV2-5、IGHV2-10、IGHV2-26、IGHV2-70、IGHV3-6、IGHV3-7、IGHV3-9、IGHV3-11、IGHV3-13、IGHV3-15、IGHV3-16、IGHV3-19、IGHV3-20、IGHV3-21、IGHV3-22、IGHV3-23、IGHV3-25、IGHV3-29、IGHV3-30、IGHV3-30-2、IGHV3-30-3、IGHV3-30-5、IGHV3-32、IGHV3-33、IGHV3-33-2、IGHV3-35、IGHV3-36、IGHV3-37、IGHV3-38、IGHV3-41、IGHV3-42、IGHV3-43、IGHV3-47、IGHV3-48、IGHV3-49、IGHV3-50、IGHV3-52、IGHV3-53、IGHV3-54、IGHV3-57、IGHV3-60、IGHV3-62、IGHV3-63、IGHV3-64、IGHV3-65、IGHV3-66、IGHV3-71、IGHV3-72、IGHV3-73、IGHV3-74、IGHV3-75、IGHV3-76、IGHV3-79、IGHV3-38-3、IGHV3-69-1、IGHV4-4、IGHV4-28、IGHV4-30-1、IGHV4-30-2、IGHV4-30-4、IGHV4-31、IGHV4-34、IGHV4-39、IGHV4-55、IGHV4-59、IGHV4-61、IGHV4-80、IGHV4-38-2、IGHV5-51、IGHV5-78、IGHV5-10-1、IGHV6-1、IGHV7-4-1、IGHV7-27、IGHV7-34-1、IGHV7-40、IGHV7-56、IGHV7-81、IGHVII-1-1、IGHVII-15-1、IGHVII-20-1、IGHVII-22-1、IGHVII-26-2、IGHVII-28-1、IGHVII-30-1、IGHVII-31-1、IGHVII-33-1、IGHVII-40-1、IGHVII-43-1、IGHVII-44-2、IGHVII-46-1、IGHVII-49-1、IGHVII-51-2、IGHVII-53-1、IGHVII-60-1、IGHVII-62-1、IGHVII-65-1、IGHVII-67-1、IGHVII-74-1、IGHVII-78-1、IGHVIII-2-1、IGHVIII-5-1、IGHVIII-5-2、IGHVIII-11-1、IGHVIII-13-1、IGHVIII-16-1、IGHVIII-22-2、IGHVIII-25-1、IGHVIII-26-1、IGHVIII-38-1、IGHVIII-44、IGHVIII-47-1、IGHVIII-51-1、IGHVIII-67-2、IGHVIII-67-3、IGHVIII-67-4、IGHVIII-76-1、IGHVIII-82、IGHVIV-44-1、IGHD1-1、IGHD1-7、IGHD1-14、IGHD1-20、IGHD1-26、IGHD2-2、IGHD2-8、IGHD2-15、IGHD2-21、IGHD3-3、IGHD3-9、IGHD3-10、IGHD3-16、IGHD3-22、IGHD4-4、IGHD4-11、IGHD4-17、IGHD4-23、IGHD5-5、IGHD5-12、IGHD5-18、IGHD5-24、IGHD6-6、IGHD6-13、IGHD6-19、IGHD6-25、IGHD7-27、IGHJ1、IGHJ1P、IGHJ2、IGHJ2P、IGHJ3、IGHJ3P、IGHJ4、IGHJ5、IGHJ6、IGHA1、IGHA2、IGHG1、IGHG2、IGHG3、IGHG4、IGHGP、IGHD、IGHE、IGHEP1、IGHM、およびIGHV1-69Dが含まれる。
【0521】
免疫グロブリンカッパ遺伝子座(IGK@)は、ヒト第2染色体上の領域であり、抗体(または免疫グロブリン)のカッパ(κ)軽鎖の遺伝子を含む。例えば、IGK遺伝子座には、IGKV(可変)、IGKJ(結合)、およびIGKC(定常)遺伝子が含まれる。免疫グロブリンカッパ軽鎖をコードする例示的な遺伝子には、限定されないが、IGKV1-5、IGKV1-6、IGKV1-8、IGKV1-9、IGKV1-12、IGKV1-13、IGKV1-16、IGKV1-17、IGKV1-22、IGKV1-27、IGKV1-32、IGKV1-33、IGKV1-35、IGKV1-37、IGKV1-39、IGKV1D-8、IGKV1D-12、IGKV1D-13、IGKV1D-16 IGKV1D-17、IGKV1D-22、IGKV1D-27、IGKV1D-32、IGKV1D-33、IGKV1D-35、IGKV1D-37、IGKV1D-39、IGKV1D-42、IGKV1D-43、IGKV2-4、IGKV2-10、IGKV2-14、IGKV2-18、IGKV2-19、IGKV2-23、IGKV2-24、IGKV2-26、IGKV2-28、IGKV2-29、IGKV2-30、IGKV2-36、IGKV2-38、IGKV2-40、IGKV2D-10、IGKV2D-14、IGKV2D-18、IGKV2D-19、IGKV2D-23、IGKV2D-24、IGKV2D-26、IGKV2D-28、IGKV2D-29、IGKV2D-30、IGKV2D-36、IGKV2D-38、IGKV2D-40、IGKV3-7、IGKV3-11、IGKV3-15、IGKV3-20、IGKV3-25、IGKV3-31、IGKV3-34、IGKV3D-7、IGKV3D-11、IGKV3D-15、IGKV3D-20、IGKV3D-25、IGKV3D-31. IGKV3D-34、IGKV4-1、IGKV5-2、IGKV6-21、IGKV6D-21、IGKV6D-41、IGKV7-3、IGKJ1、IGKJ2、IGKJ3、IGKJ4、IGKJ5、およびIGKCが含まれる。
【0522】
免疫グロブリンラムダ座(IGL@)は、ヒト第22染色体上の領域であり、抗体(または免疫グロブリン)のラムダ軽鎖の遺伝子を含む。例えば、IGL遺伝子座には、IGLV(可変)、IGLJ(結合)、およびIGLC(定常)遺伝子が含まれる。免疫グロブリンラムダ軽鎖をコードする例示的な遺伝子には、限定されないが、IGLV1-36、IGLV1-40、IGLV1-41、IGLV1-44、IGLV1-47、IGLV1-50、IGLV1-51、IGLV1-62、IGLV2-5、IGLV2-8、IGLV2-11、IGLV2-14、IGLV2-18、IGLV2-23、IGLV2-28、IGLV2-33、IGLV2-34、IGLV3-1、IGLV3-2、IGLV3-4、IGLV3-6、IGLV3-7、IGLV3-9、IGLV3-10、IGLV3-12、IGLV3-13、IGLV3-15、IGLV3-16、IGLV3-17、IGLV3-19、IGLV3-21、IGLV3-22、IGLV3-24、IGLV3-25、IGLV3-26、IGLV3-27、IGLV3-29、IGLV3-30、IGLV3-31、IGLV3-32、IGLV4-3、IGLV4-60、IGLV4-69、IGLV5-37、IGLV5-39、IGLV5-45、IGLV5-48、IGLV5-52、IGLV6-57、IGLV7-35、IGLV7-43、IGLV7-46、IGLV8-61、IGLV9-49、IGLV10-54、IGLV10-67、IGLV11-55、IGLVI-20、IGLVI-38、IGLVI-42、IGLVI-56、IGLVI-63、IGLVI-68、IGLVI-70、IGLVIV-53、IGLVIV-59、IGLVIV-64、IGLVIV-65、IGLVIV-66-1、IGLVV-58、IGLVV-66、IGLVVI-22-1、IGLVVI-25-1、IGLVVII-41-1、IGLJ1、IGLJ2、IGLJ3、IGLJ4、IGLJ5、IGLJ6、IGLJ7、IGLC1、IGLC2、IGLC3、IGLC4、IGLC5、IGLC6、およびIGLC7が含まれる。
【0523】
B細胞受容体(BCR)は、2つの部分:i)1つのアイソタイプ(例えば、IgDまたはIgM)の膜結合免疫グロブリン分子で構成される。内在性膜ドメインの存在を除いて、これらは、それらの分泌型と同一であり得、およびii)シグナル伝達部分:ジスルフィド架橋によって一緒に結合されたIg-α/Ig-β(CD79)と呼ばれるヘテロダイマー。ダイマーの各核酸分子は、細胞膜を貫通し、免疫受容体チロシン活性化モチーフ(ITAM)を持つ細胞質尾部を有する。
【0524】
T細胞受容体(TCR)は、2つの異なるタンパク質鎖(すなわち、ヘテロダイマー)で構成される。T細胞の95%では、アルファ(α)鎖とベータ(β)鎖からなり、T細胞の5%では、ガンマ(γ)鎖とデルタ(δ)鎖からなる。この比は、個体発生の間および罹患状態において変化し得る。T細胞受容体遺伝子はまた、固有の抗原受容体を各々の細胞に提供するために、リンパ球の発生中に再配列される、ベータ鎖とデルタ鎖に多重のV、DおよびJ遺伝子断片(およびアルファ鎖とガンマ鎖にVおよびJ遺伝子断片)を含むという点において、免疫グロブリン遺伝子と類似している。
【0525】
T細胞受容体アルファ遺伝子座(TRA)は、TCRアルファ鎖の遺伝子を含むヒト第14染色体上の領域である。例えば、TRA遺伝子座は、例えば、TRAV(可変)、TRAJ(結合)、およびTRAC(定常)遺伝子を含む。T細胞受容体アルファ鎖をコードする遺伝子の例には、限定されないが、TRAV1-1、TRAV1-2、TRAV2、TRAV3、TRAV4、TRAV5、TRAV6、TRAV7、TRAV8-1、TRAV8-2、TRAV8-3、TRAV8-4、TRAV8-5、TRAV8-6、TRAV8-7、TRAV9-1、TRAV9-2、TRAV10、TRAV11、TRAV12-1、TRAV12-2、TRAV12-3、TRAV13-1、TRAV13-2、TRAV14DV4、TRAV15、TRAV16、TRAV17、TRAV18、TRAV19、TRAV20、TRAV21、TRAV22、TRAV23DV6、TRAV24、TRAV25、TRAV26-1、TRAV26-2、TRAV27、TRAV28、TRAV29DV5、TRAV30、TRAV31、TRAV32、TRAV33、TRAV34、TRAV35、TRAV36DV7、TRAV37、TRAV38-1、TRAV38-2DV8、TRAV39、TRAV40、TRAV41、TRAJ1、TRAJ2、TRAJ3、TRAJ4、TRAJ5、TRAJ6、TRAJ7、TRAJ8、TRAJ9、TRAJ10、TRAJ11、TRAJ12、TRAJ13、TRAJ14、TRAJ15、TRAJ16、TRAJ17、TRAJ18、TRAJ19、TRAJ20、TRAJ21、TRAJ22、TRAJ23、TRAJ24、TRAJ25、TRAJ26、TRAJ27、TRAJ28、TRAJ29、TRAJ30、TRAJ31、TRAJ32、TRAJ33、TRAJ34、TRAJ35、TRAJ36、TRAJ37、TRAJ38、TRAJ39、TRAJ40、TRAJ41、TRAJ42、TRAJ43、TRAJ44、TRAJ45、TRAJ46、TRAJ47、TRAJ48、TRAJ49、TRAJ50、TRAJ51、TRAJ52、TRAJ53、TRAJ54、TRAJ55、TRAJ56、TRAJ57、TRAJ58、TRAJ59、TRAJ60、TRAJ61、およびTRACが含まれる。
【0526】
T細胞受容体ベータ遺伝子座(TRB)は、TCRベータ鎖の遺伝子を含むヒト第7染色体上の領域である。例えば、TRB遺伝子座は、例えば、TRBV(可変)、TRBD(多様性)、TRBJ(結合)、およびTRBC(定常)遺伝子を含む。T細胞受容体ベータ鎖をコードする例示的な遺伝子には、限定されないが、TRBV1、TRBV2、TRBV3-1、TRBV3-2、TRBV4-1、TRBV4-2、TRBV4-3、TRBV5-1、TRBV5-2、TRBV5-3、TRBV5-4、TRBV5-5、TRBV5-6、TRBV5-7、TRBV6-2、TRBV6-3、TRBV6-4、TRBV6-5、TRBV6-6、TRBV6-7、TRBV6-8、TRBV6-9、TRBV7-1、TRBV7-2、TRBV7-3、TRBV7-4、TRBV7-5、TRBV7-6、TRBV7-7、TRBV7-8、TRBV7-9、TRBV8-1、TRBV8-2、TRBV9、TRBV10-1、TRBV10-2、TRBV10-3、TRBV11-1、TRBV11-2、TRBV11-3、TRBV12-1、TRBV12-2、TRBV12-3、TRBV12-4、TRBV12-5、TRBV13、TRBV14、TRBV15、TRBV16、TRBV17、TRBV18、TRBV19、TRBV20-1、TRBV21-1、TRBV22-1、TRBV23-1、TRBV24-1、TRBV25-1、TRBV26、TRBV27、TRBV28、TRBV29-1、TRBV30、TRBVA、TRBVB、TRBV5-8、TRBV6-1、TRBD1、TRBD2、TRBJ1-1、TRBJ1-2、TRBJ1-3、TRBJ1-4、TRBJ1-5、TRBJ1-6、TRBJ2-1、TRBJ2-2、TRBJ2-2P、TRBJ2-3、TRBJ2-4、TRBJ2-5、TRBJ2-6、TRBJ2-7、TRBC1、およびTRBC2が含まれる。
【0527】
T細胞受容体デルタ遺伝子座(TRD)は、TCRデルタ鎖の遺伝子を含むヒト第14染色体上の領域である。例えば、TRD遺伝子座は、例えば、TRDV(可変)、TRDJ(結合)、およびTRDC(定常)遺伝子を含む。T細胞受容体デルタ鎖をコードする例示的な遺伝子には、限定されないが、TRDV1、TRDV2、TRDV3、TRDD1、TRDD2、TRDD3、TRDJ1、TRDJ2、TRDJ3、TRDJ4、およびTRDCが含まれる。
【0528】
T細胞受容体γ遺伝子座(TRG)は、TCRガンマ鎖の遺伝子を含むヒト第7染色体上の領域である。例えば、TRG遺伝子座は、例えば、TRGV(可変)、TRGJ(結合)、およびTRGC(定常)遺伝子を含む。T細胞受容体ガンマ鎖をコードする例示的な遺伝子には、限定されないが、TRGV1、TRGV2、TRGV3、TRGV4、TRGV5、TRGV5P、TRGV6、TRGV7、TRGV8、TRGV9、TRGV10、TRGV11、TRGVA、TRGVB、TRGJ1、TRGJ2、TRGJP、TRGJP1、TRGJP2、TRGC1、およびTRGC2が含まれる。
【0529】
一実施形態では、標的遺伝子もしくは遺伝子産物、またはその断片は、表1A~5Aに記載される遺伝子または遺伝子産物のいずれかから選択される。
【0530】
さらなる例示的な遺伝子は、例えば、その内容が全体として参照により組み込まれる国際出願公開第WO2012/092426号の表1~11に記載される。
【0531】
上述の方法の適用には、限定されないが、医学標本中の配列決定のための特定の遺伝子または複数の遺伝子の、全て公知である配列変異体(またはそのサブセット)を含むオリゴヌクレオチドのライブラリーを用いることが含まれる。
【0532】
他の実施形態
【0533】
あるいは、または本明細書に記載される方法と組み合わせて、一部の実施形態では、本方法は、(a)~(h)のうちの1つ以上(例えば、2、3、4、5、6、7つ、または全て)をさらに含む:
(a)例えば、本明細書に記載される複数の標的捕捉試薬を用いて、試料(例えば、血液試料)から核酸分子(例えば、cfDNA)を提供し;
(b)複数の異なるバーコード配列を含むバーコードを含むアダプターを核酸分子に付着させて、それによるタグ化された親核酸分子を生成し;
(c)タグ化された親核酸分子を増幅して、増幅されたタグ化された子孫核酸分子を生成し;
(d)増幅されたタグ化された子孫核酸分子を配列決定して、タグ化された親核酸分子の各々から複数の配列リードを生成し、複数の配列リードの各配列リードは、バーコード配列および核酸分子に由来する配列を含み;
(e)複数の配列リードの配列リードを1つ以上の参照配列にマッピングし;
(f)配列リードのバーコード配列に少なくとも基づいて、e)においてマッピングされた配列リードをファミリーにグループ化し、ファミリーの各々は、同一のバーコード配列を含む配列リードを含み、それによってファミリーの各々は、同一のタグ化された親核酸分子から増幅された配列リードを含み;
(g)1つ以上の参照配列における複数の対象区間の各々で、各ファミリーにおいて配列リードを分解して、対象区間で各ファミリーについての突然変異コールを生じさせ;
(h)1つ以上の対象区間で、1つ以上のゲノム異常、例えば、インデル、コピー数変動、トランスバージョン、転座、逆位、欠失、異数性、部分的異数性、倍数性、染色体不安定性、染色体構造変化、遺伝子融合、染色体融合、遺伝子トランケーション、遺伝子増幅、遺伝子重複、染色体損傷、DNA損傷、核酸化学修飾の異常変化、エピジェネティックパターンの異常変化、核酸メチル化の異常変化、またはそれらの組合せを検出する。
【0534】
あるいは、または本明細書に記載される方法と組み合わせて、一部の実施形態では、本方法は、例えば、ゲノム変化(例えば、単一ヌクレオチド変異体)を定量するために、(a)~(i)のうちの1つ以上(例えば、2、3、4、5、6、7、8つ、または全て)をさらに含む:
(a)例えば、本明細書に記載される複数の標的捕捉試薬を用いて、試料(例えば、血液試料)から核酸分子(例えば、cfDNA)を提供し;
(b)別個のバーコード配列を含むバーコードを含むアダプターを前記核酸分子に付着させて、タグ化された親核酸分子を生成し;
(c)タグ化された親核酸分子を増幅して、増幅されたタグ化された子孫核酸分子を生成し;
(d)増幅されたタグ化された子孫核酸分子を配列決定して、各親核酸分子から複数の配列リードを生成し、各配列リードは、バーコード配列および核酸分子に由来する配列を含み;
(e)各タグ化された親核酸分子から生成された複数の配列リードを、(i)バーコード配列、および(ii)核酸に由来する配列の始まりにおける配列情報、核酸に由来する配列の終わりにおける配列情報、または配列リードの長さのうちの1つ以上に基づいてファミリーにグループ化し、各ファミリーは、タグ化された親核酸分子のうち、固有の核酸分子から増幅されたタグ化された子孫核酸分子の配列リードを含み;
(f)各ファミリー内にグループ化された配列リードを互いに比較することにより、各ファミリーについてのコンセンサス配列を決定し、各コンセンサス配列は、タグ化された親核酸分子間のうち、固有の核酸分子に対応し;
(g)1つ以上の対象区間を含む1つ以上の参照配列を提供し;
(h)前記1つ以上の対象区間の所定の対象区間にマッピングするコンセンサス配列を同定し;
(i)ゲノム変化を含む所定の対象区間にマッピングする多数のコンセンサス配列を計算し、それによって試料中のゲノム変化を定量する。
【0535】
あるいは、または本明細書に記載される方法と組み合わせて、一部の実施形態では、本方法は、(a)~(h)のうちの1つ以上(例えば、2、3、4、5、6、7つ、または全て)をさらに含む:
(a)例えば、本明細書に記載される複数の標的捕捉試薬を用いて、試料(例えば、血液試料)から核酸分子(例えば、cfDNA)を提供し;
(b)複数の核酸分子を複数のタグ化された親核酸分子に変換し、タグ化された親核酸分子の各々は、(i)複数の核酸分子のうちの核酸分子からの配列、および(ii)1つ以上のバーコードを含む識別子配列を含み;
(c)複数のタグ化された親核酸分子を増幅して、対応する複数の増幅された子孫核酸分子を生成し;
(d)複数の増幅された子孫核酸分子を配列決定して、配列リードセットを生成し;
(e)配列リードセットの配列リードを1つ以上の参照配列にマッピングし;
(f)配列リードをファミリーにグループ化し、各ファミリーは、同一の識別子配列を含み、同じ開始位置および停止位置を有する配列リードを含み、各ファミリーは、同一のタグ化された親核酸分子から増幅された配列リードを含み;
(g)1つ以上の参照配列における複数の対象区間の各対象区間で、各ファミリーにおいて配列リードを分解して、対象区間で各ファミリーについての突然変異を生じさせ;または
(h)ファミリーのうち、対象区間で1つ以上の突然変異コールの頻度を決定する。
【0536】
あるいは、または本明細書に記載される方法と組み合わせて、一部の実施形態では、本方法は、例えば、コピー数変動を検出するために、(a)~(f)のうちの1つ以上(例えば、2、3、4、5つ、または全て)をさらに含む:
(a)例えば、本明細書に記載される複数の標的捕捉試薬を用いて、試料(例えば、血液試料)から核酸分子(例えば、cfDNA)を提供し;
(b)核酸分子を配列決定し、各核酸分子は、複数の配列リードを生成し;
(c)一連の精度、品質スコア、マッピングスコア閾値を満たさないリードを取り除き;
(d)複数の配列リードを参照配列にマッピングし;
(e)参照配列の複数の領域におけるマッピングされたリードまたは固有の配列リードを定量し;
(f)i)複数の領域における多数のリードを互いに正規化するか、もしくは複数の領域における多数の固有の配列リードを互いに正規化し;および/またはii)複数の領域における多数のリードもしくは複数の領域における多数の固有の配列リードを、対照試料から得られる数で処理することによって、複数の所定の領域のうちの1つ以上においてコピー数変動を決定する。
【0537】
あるいは、または本明細書に記載される方法と組み合わせて、一部の実施形態では、本方法は、例えば、コピー数変動を検出するために、(a)~(h)の1つ以上(例えば、2、3、4、5、6、7つ、または全て)をさらに含む:
(a)例えば、本明細書に記載される複数の標的捕捉試薬を用いて、試料(例えば、血液試料)から核酸分子(例えば、cfDNA)を提供し;
(b)核酸分子を配列決定し、各核酸分子は、複数の配列リードを生成し;
(c)セット精度、品質スコア、マッピングスコア閾値を満たさないリードを取り除き;
(d)配列決定から得られた配列リードを参照配列にマッピングし;
(e)配列リードのうち、核酸分子に対応する固有の配列リードを決定し;
(f)マッピング可能な各塩基位置における参照配列と比較して変異体を含むマッピングされた固有の配列リードのサブネットを同定し
(g)マッピング可能な各塩基位置について、(a)参照配列と比較して変異体を含む多数のマッピングされた固有の配列リード対(b)マッピング可能な各塩基位置についての全固有の配列リードの比を計算し;
(h)基準試料から同様に導出された数で比を処理する。
【0538】
あるいは、または本明細書に記載される方法と組み合わせて、一部の実施形態では、方法は、(a)~(h)の1つ以上(例えば、2、3、4、5、6、7つ、または全て)をさらに含む:
(a)二重鎖タグを用いて、対象からの試料(例えば、血液試料)における二本鎖DNA分子(例えば、cfDNA)をタグ化し、二重鎖タグセットが、複数の異なる分子バーコードを含み、二重鎖タグセットの各二重鎖タグは、試料中の二本鎖DNA分子のうちの二本鎖DNA分子の相補鎖を示差的にタグ化して、タグ化された鎖を提供し、タグ化は、二本鎖DNA分子と比較して、少なくとも10倍過剰の二重鎖タグを用いて行われ、この過剰な二重鎖タグは、対象からの試料において二本鎖DNA分子の少なくとも20%をタグ化するには十分であり;
(b)参照ゲノム中の1つ以上の遺伝子座セットにおける各遺伝子座について、例えば、本明細書に記載される複数の標的捕捉試薬を用いて、遺伝子座にマッピングされるタグ化された鎖のサブセットについてタグ化された鎖を選択的に濃縮して、濃縮されたタグ化された鎖を提供し;
(c)対象由来の試料からの複数の未処理の配列リードを生成するために、濃縮されたタグ化された鎖の少なくとも一部を配列決定し;
(d)複数の未処理の配列リードを複数のファミリーに分類し、各ファミリーは、同じ親ポリヌクレオチドから生成された未処理の配列リードを含み、分類は、(i)親ポリヌクレオチドに関連する分子バーコード、ならびに(ii)親ポリヌクレオチドの未処理の配列の開始部分および/または終端部分からの情報に基づき;
(e)複数のファミリーに分類された複数の未処理のリードを複数のコンセンサス配列リードに分解し、複数のコンセンサス配列リードの各コンセンサス配列リードは、(i)1つ以上の遺伝子座セットにおける各遺伝子座についての複数のコンセンサス塩基を含み、および(ii)二本鎖DNA分子の一本鎖を表し;
(f)1つ以上の遺伝子座セットにおける各遺伝子座について、複数のコンセンサス配列リードにおいて相補鎖が検出される遺伝子座にマッピングする濃縮されたタグ化された鎖の第1の量的尺度を計算し;
(g)1つ以上の遺伝子座セットにおける各遺伝子座について、複数のコンセンサス配列リードにおいて相補鎖のうちの1本鎖のみが検出される遺伝子座にマッピングする濃縮されたタグ化された鎖の第2の量的尺度を計算し;あるいは
(h)1つ以上の遺伝子座セットにおける各遺伝子座について、複数のコンセンサス配列リードにおいていずれの相補鎖も検出されない遺伝子座にマッピングする濃縮されたタグ化された鎖の第3の量的尺度を計算し、第3の量的尺度は、少なくとも部分的には、第1および第2の量的尺度に基づいて計算され、それによって対象からの試料中の二本鎖DNA分子を検出する。
【0539】
あるいは、または本明細書に記載される方法と組み合わせて、一部の実施形態では、本方法は、例えば、多重のゲノム領域について濃縮するために、(a)~(b)の1つまたは両方をさらに含む:
(a)本明細書に記載される複数の標的捕捉試薬:
(i)第1の複数の標的捕捉試薬であって、第1の複数の標的捕捉試薬が、第1の複数の標的捕捉試薬の飽和点未満である第1の濃度で提供される、試料からの核酸の第1のゲノム領域セットに選択的にハイブリダイズする第1の複数の標的捕捉試薬、および
(ii)第2の複数の標的捕捉試薬であって、第2の複数の標的捕捉試薬が、第2の複数の標的捕捉試薬の飽和点またはそれを超える第2の濃度で提供される、試料からの核酸の第2のゲノム領域セットに選択的にハイブリダイズする第2の複数の標的捕捉試薬
と接触している試料から所定量の核酸をもたらし:ならびに
(b)ゲノム領域の第1のセットおよびゲノム領域の第2のセットの試料から核酸を濃縮し、それによって濃縮された核酸を生成する。
【0540】
あるいは、または本明細書に記載される方法と組み合わせて、一部の実施形態では、本方法は、(a)~(e)の1つ以上(例えば、2、3、4つ、または全て)をさらに含む:
(a)複数の標的捕捉試薬混合物を提供し、複数の標的捕捉試薬混合物の各々は、第1のゲノム領域セットに選択的にハイブリダイズする第1の複数の標的捕捉試薬、および第2のゲノム領域セットに選択的にハイブリダイズする第2の複数の標的捕捉試薬を含み、
第1の複数の標的捕捉試薬は、複数の標的捕捉試薬混合物全体で異なる濃度であり、第2の複数の標的捕捉試薬は、複数の標的捕捉試薬混合物全体で同じ濃度であり;
(b)複数の標的捕捉試薬混合物の各々を試料(例えば、血液試料)と接触させて、試料からの核酸を第1の複数の標的捕捉試薬および第2の複数の標的捕捉試薬を用いて捕捉し、各標的捕捉試薬混合物中の第2の複数の標的捕捉試薬は、第2の複数の標的捕捉試薬の飽和点またはそれを超える第1の濃度で提供され、試料からの核酸は、第1の複数の標的捕捉試薬および第2の複数の標的捕捉試薬によって捕捉され;
(c)各標的捕捉試薬混合物で捕捉された核酸の一部を配列決定して、割り当てられた数の配列リード内に配列リードセットを生成し;
(d)各標的捕捉試薬混合物についての第1の複数の標的捕捉試薬および第2の複数の標的捕捉試薬についての配列リード深度を決定し;または
(e)第2のゲノム領域セットのリード深度を提供する、少なくとも1つの標的捕捉試薬混合物を同定し、
第2のゲノム領域セットのリード深度は、少なくとも0.0001%のマイナー対立遺伝子頻度(MAF)の遺伝的変異体の検出の感受性を提供する。
【0541】
あるいは、または本明細書に記載される方法と組み合わせて、一部の実施形態では、本方法は、(a)~(c)の1つ以上(例えば、2つまたは全部)をさらに含む:
(a)非固有にタグ化された細胞外ポリヌクレオチドの集団を生成するために、対象由来の生体試料から得られた細胞外ポリヌクレオチドの集団を非固有にタグ化し;
(b)非固有にタグ化された細胞外ポリヌクレオチドの集団を配列決定して、非固有にタグ化された細胞外ポリヌクレオチド中のマッピング可能な位置で塩基コールを生成し;
(c)マッピング可能な位置での塩基コールについて、塩基コールを有する固有分子の総数に対して、塩基コールを含有する固有分子の頻度を測定し、
複数の参照配列からの偏差のセット尺度を上回る、マッピング可能な位置で塩基コールを含有する固有分子の頻度は、マッピング可能な位置での稀な突然変異を示す。
【0542】
他の実施形態は、米国特許第9,598,731号、米国特許第9,834,822号、米国特許第9,840,743号、米国特許第9,902,992号、米国特許第9,920,366号、米国特許第9,850,523号、および米国特許第10,041,127号に記載され、その各々の内容は、全体として参照により本明細書に組み込まれる。
【0543】
本明細書に記載される方法の実施形態では、本方法における工程またはパラメータは、本方法における下流の工程またはパラメータを修飾するために使用される。
【0544】
ある実施形態では、試料の特徴を使用して、下流の工程またはパラメータを、前記試料からの核酸の単離;ライブラリーの構築;標的捕捉試薬(例えば、ベイト)の設計もしくは選択;ハイブリダイゼーション条件;配列決定;リードマッピング;突然変異コーリング法の選択;突然変異コーリング;または突然変異注釈のうちの1つ以上もしくは全体において修飾する。
【0545】
ある実施形態では、単離された腫瘍、または対照、核酸の特徴を使用して、下流の工程またはパラメータを、前記試料からの核酸の単離;ライブラリーの構築;標的捕捉試薬(例えば、ベイト)の設計もしくは選択;ハイブリダイゼーション条件;配列決定;リードマッピング;突然変異コーリング法の選択;突然変異コーリング;または突然変異注釈のうちの1つ以上もしくは全部において修飾する。
【0546】
ある実施形態では、ライブラリーの特徴を使用して、下流の工程またはパラメータを、前記試料からの核酸の再単離;その後のライブラリー構築;標的捕捉試薬(例えば、ベイト)の設計もしくは選択;ハイブリダイゼーション条件;配列決定;リードマッピング;突然変異コーリング法の選択;突然変異コーリング;または突然変異注釈のうちの1つ以上または全部において修飾する。
【0547】
ある実施形態では、ライブラリーキャッチの特徴を使用して、下流の工程またはパラメータを、前記試料からの核酸の再単離;その後のライブラリー構築;標的捕捉試薬(例えば、ベイト)の設計もしくは選択;ハイブリダイゼーション条件;配列決定;リードマッピング;突然変異コーリング法の選択;突然変異コーリング;または突然変異注釈のうちの1つ以上もしくは全部において修飾する。
【0548】
ある実施形態では、配列決定方法の特徴を使用して、下流の工程またはパラメータを、前記試料からの核酸の再単離;その後のライブラリー構築;標的捕捉試薬(例えば、ベイト)の設計もしくは選択;その後のハイブリダイゼーション条件の決定、その後の配列決定;リードマッピング;突然変異コーリング法の選択;突然変異コーリング;または突然変異注釈のうちの1つ以上もしくは全部において修飾する。
【0549】
ある実施形態では、マッピングされたリードの回収の特徴を使用して、下流の工程またはパラメータを、前記試料からの核酸の再単離;その後のライブラリー構築;標的捕捉試薬(例えば、ベイト)の設計もしくは選択;その後のハイブリダイゼーション条件の決定、その後の配列決定;その後のリードマッピング;突然変異コーリング法の選択;突然変異コーリング;または突然変異注釈のうちの1つ以上もしくは全部において修飾する。
【0550】
ある実施形態において、本方法は、試料特徴についての値、例えば、前記試料中の腫瘍細胞の比率についての値;前記試料の細胞性についての値;または試料の画像からの値を取得することを含む。実施形態において、本方法は、試料特性についての前記取得された値に応答して、試料からの核酸の単離、ライブラリー構築;標的捕捉試薬(例えば、ベイト)の設計もしくは選択;標的捕捉試薬(例えば、ベイト)/ライブラリー核酸分子ハイブリダイゼーション;配列決定;または突然変異コーリングについてのパラメータを選択することを含む。
【0551】
ある実施形態では、本方法は、前記試料に存在する腫瘍組織の量について値を取得すること、前記取得された値を参照基準と比較すること、および前記参照基準が満たされる場合、前記試料を受け入れること、例えば、前記試料が30%、40%または50%を超える腫瘍細胞を含む場合、前記試料を受け入れることをさらに含む。ある実施形態では、方法は、参照基準を満たさない試料から、例えば、前記試料から腫瘍組織をマクロ解剖することによって、腫瘍細胞について濃縮された部分試料を取得することをさらに含む。
【0552】
ある実施形態では、本方法は、前記試料に存在する腫瘍核酸(例えば、DNA)の量についての値を取得すること、前記取得された値を参照基準と比較すること、および前記参照基準が満たされた場合、前記試料を受け入れることをさらに含む。ある実施形態では、本方法は、参照基準を満たさない試料から、例えば、前記試料から腫瘍組織をマクロ解剖することによって、腫瘍核酸について濃縮された部分試料を得ることをさらに含む。
【0553】
ある実施形態では、方法は、対象に対して、腫瘍タイプ、遺伝子、および遺伝子変化(TGA)の会合を提供することをさらに含む。ある実施形態では、方法は、複数の要素を有するデータベースを提供することをさらに含み、各要素はTGAを含む。
【0554】
ある実施形態では、方法は、対象のTGAを特徴づけることをさらに含み、前記TGAが、データベース、例えば、検証されたTGAのデータベースに存在するかどうかを決定し;データベースからのTGAに関する情報を前記対象からの前記TGAと関連付け;場合により、前記対象についての第2またはその後のTGAが前記データベースに存在するかどうかを決定し、もしそうであれば、データベースからの第2またはその後のTGAに関する情報を前記患者に存在する前記第2のTGAと関連付けることを含む。ある実施形態では、本方法は、レポートを形成するために、TGAの存在または不存在、場合により、関連する注釈を記憶することをさらに含む。ある実施形態では、方法は、前記報告書をレシピエント団体に送信することを含む。
【0555】
ある実施形態では、方法は、対象のTGAを特徴づけることをさらに含み、前記TGAが、データベース、例えば、検証されたTGAのデータベースに存在するかどうかを決定し;または前記データベースに存在しないTGAが、公知の臨床的に関連する遺伝子または変化を有するかどうか、またはもしそうであれば、前記データベースに前記TGAのためのエントリーを提供するかどうかを決定することを含む。ある実施形態では、本方法は、レポートを形成するために、対象からの試料のDNA中に見出される突然変異の存在または不存在を記憶することをさらに含む。
【0556】
本開示は、例えば、以下の番号付けされた実施形態のいずれかにおいて定義され得る。
【0557】
実施形態1.第1の標的捕捉試薬(R1)および第2の標的捕捉試薬(R2)を含む複数の標的捕捉試薬であって、
R1は、結合対の機能的な第1のメンバーを含むR1、および、場合により、結合対の機能的な第1のメンバーを欠くR1を含み;
R2は、結合対の機能的な第1のメンバーを含むR2、および結合対の機能的な第1のメンバーを欠くR2を含み;
結合対の第1のメンバーは、基質上に配置された結合対の第2のメンバーに結合することができ、
結合対の機能的な第1のメンバーを含むR1の比率は、結合対の機能的な第1のメンバーを含むR2の比率よりも大きい、複数の標的捕捉試薬。
【0558】
実施形態2.結合対の機能的な第1のメンバーを含むR1の比率が、結合対の機能的な第1のメンバーを含むR2の比率よりも、少なくとも0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000倍大きい、実施形態1の複数の標的捕捉試薬。
【0559】
実施形態3.R1の各々が第1の断片/第1の標的捕捉試薬(F1/R1)ハイブリッドを形成することができ、R2の各々が第2の断片/第2の標的捕捉試薬(F2/R2)ハイブリッドを形成することができ、
F1、F2、またはその両方は、表1A~5Aに記載される遺伝子からの対象区間を含む、実施形態1または2の複数の標的捕捉試薬。
【0560】
実施形態4.F1が、高い配列決定深度事象を含み;
F2が、低い配列決定深度事象を含み、例えば、そのレベルが、1つ以上のバイオマーカー、例えば、腫瘍遺伝子変異量(TMB)、またはマイクロサテライト不安定性(MSI)の決定と関連する、実施形態3の複数の標的捕捉試薬。
【0561】
実施形態5.第3の標的捕捉試薬(R3)をさらに含み、
R3が、結合対の機能的な第1のメンバーを含むR3、および結合対の機能的な第1のメンバーを欠くR3を含み;
結合対の第1のメンバーが、基質上に配置された結合対の第2のメンバーに結合することができ、
結合対の機能的な第1のメンバーを含むR2の比率は、結合対の機能的な第1のメンバーを含むR3の比率よりも大きい、実施形態1から4のいずれか1つの複数の標的捕捉試薬。
【0562】
実施形態6.R3の各々が第3の断片/第1の標的捕捉試薬(F3/R3)ハイブリッドを形成することができ、
F3は、表1A~5Aに記載される遺伝子からの対象区間を含む、実施形態1から5のいずれか1つの複数の標的捕捉試薬。
【0563】
実施形態7.試料を分析する方法であって、
複数の第1の断片/第1の標的捕捉試薬(F1/R1)ハイブリッドを基質と接触させて、F1/R1ハイブリッド/基質複合体を形成すること;および
複数の第2の断片/第2の標的捕捉試薬(F2/R2)ハイブリッドを基質と接触させて、F2/R2ハイブリッド/基質複合体を形成すること
を含み、基質に結合するF1/R1ハイブリッドの比率は、基質に結合するF2/R2ハイブリッドの比率よりも大きく、
それによって試料を分析する、試料を分析する方法。
【0564】
実施形態8.F1が、高い配列決定深度事象を含み;
F2が、低い配列決定深度事象を含み、例えば、そのレベルが、1つ以上のバイオマーカー、例えば、腫瘍遺伝子変異量(TMB)、またはマイクロサテライト不安定性(MSI)の決定と関連する、実施形態7の方法。
【0565】
実施形態9.R1の一部およびR2の一部が結合対の機能的な第1のメンバーを含み、結合対の第1のメンバーが基質上に配置された結合対の第2のメンバーに結合することができる、実施形態7または8の方法。
【0566】
実施形態10.R1の一部、R2の一部、またはその両方が、結合対の機能的な第1のメンバー、例えば、基質上に配置された結合対の第2のメンバーに結合することができないかまたはそれに対する結合親和性が低下している変化またはブロックされた第1のメンバーを欠く、実施形態7から9のいずれか1つの方法。
【0567】
実施形態11.R1が、結合対の機能的な第1のメンバーを含むR1、および結合対の機能的な第1のメンバーを欠くR1を含み;
R2が、結合対の機能的な第1のメンバーを含むR2、および結合対の機能的な第1のメンバーを欠くR2を含む、実施形態7から10のいずれか1つの方法。
【0568】
実施形態12.結合対の機能的な第1のメンバーを含むR1の比率が、結合対の機能的な第1のメンバーを含むR2の比率よりも大きい、実施形態7から11のいずれか1つの方法。
【0569】
実施形態13.結合対の機能的な第1のメンバーを含むR1の比率が、結合対の機能的な第1のメンバーを含むR2の比率よりも、少なくとも0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000倍大きい、実施形態11の方法。
【0570】
実施形態14.結合対の機能的な第1のメンバーを含むR1の比率および結合対の機能的な第1のメンバーを含むR2の比率が、F1/R1ハイブリッド/基質複合体およびF2/R2ハイブリッド/基質複合体の形成時に、F1/R1ハイブリッド/基質複合体中のF1の数およびF2/R2ハイブリッド/基質複合体中のF2の数が、以下の関係:
(i)F1の数が、F2の数より大きいかまたはF2の数と実質的に同じである;および/または
(ii)第1の対象区間における変化を含むF1の数が、第2の対象区間における変化を含むF2の数よりも大きいかまたは実質的に同じである
のうちの1つまたは両方を有するようなものである、実施形態7から13のいずれか1つの方法。
【0571】
実施形態15.F1の数が、F2の数よりも、少なくとも0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000倍大きい、実施形態14の方法。
【0572】
実施形態16.第1の対象区間における変化を含むF1の数が、第2の対象区間における変化を含むF2の数よりも、少なくとも0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、200、300、400、500、600、700、800、900、または1,000倍大きい、実施形態14または15の方法。
【0573】
実施形態17.第1の対象区間、第2の対象区間、またはその両方が、表1A~5Aに記載される遺伝子由来である、実施形態14から16のいずれか1つの方法。
【0574】
実施形態18.第1の対象区間における変化が、試料中の約0.1%に等しいかまたはそれより大きい(例えば、約0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、または0.9%に等しいかまたはそれより大きい、例えば、約0.1%~0.9%、0.2%~0.8%、0.3%~0.7%、または0.4%~0.6%の)突然変異対立遺伝子頻度で存在する、実施形態14から17のいずれか1つの方法。
【0575】
実施形態19.第2の対象区間における変化が、試料中の約1%に等しいかまたはそれより大きい(例えば、約2%、3%、4%、5%、6%、7%、8%、または9%に等しいかまたはそれより大きい、例えば、約1%~9%、2%~8%、3%~7%、または4%~6%の)突然変異対立遺伝子頻度で存在する、実施形態14から18のいずれか1つの方法。
【0576】
実施形態20.F1、F2、またはその両方が、表1A~5Aに記載される遺伝子からの対象区間を含む、実施形態7から19のいずれか1つの方法。
【0577】
実施形態21.F1における対象区間が第1の深度まで配列決定され、F2における対象区間が第2の深度まで配列決定され、第1の深度が第2の深度よりも、少なくとも1、2、3、4、5、6、7、8、9、または10倍大きい、実施形態20の方法。
【0578】
実施形態22.F1が、表1A~5Aに記載される遺伝子からの対象区間を含み、対象区間が、変化、例えば、体細胞性変化、例えば、がんにおける機能的変化を含む、実施形態14から21のいずれか1つの方法。
【0579】
実施形態23.対象区間が、少なくとも約5,000×深度まで配列決定される、実施形態17の方法。
【0580】
実施形態24.F2が、表1A~5Aに記載される遺伝子からの対象区間を含み、対象区間が、変化、例えば、体細胞性変化を含み、変化の決定が、1つ以上のゲノムシグネチャー、例えば、連続的/複雑なバイオマーカーを評価するために使用される、実施形態7から23のいずれか1つの方法。
【0581】
実施形態25.対象区間が、例えば、1つ以上のゲノムシグネチャー、例えば、連続的/複雑なバイオマーカーを評価するために、少なくとも約800×であるが約5,000×未満まで配列決定される、実施形態24の方法。
【0582】
実施形態26.複数の第3の断片/第3の標的捕捉試薬(F3/R3)ハイブリッドを基質とさらに接触させて、F3/R3ハイブリッド/基質複合体を形成する、実施形態7~25のいずれか1つの方法。
【0583】
実施形態27.R3が、結合対の機能的な第1のメンバーを含むR3、および結合対の機能的な第1のメンバーを欠くR3を含む、実施形態25または26の方法。
【0584】
実施形態28.結合対の機能的な第1のメンバーを含むR2の比率が、結合対の機能的な第1のメンバーを含むR3の比率よりも大きい、実施形態26から27のいずれか1つの方法。
【0585】
実施形態29.結合対の機能的な第1のメンバーを含むR2の比率が、結合対の機能的な第1のメンバーを含むR3の比率よりも、少なくとも0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000倍大きい、実施形態26~28のいずれかに1つの方法。
【0586】
実施形態30.結合対の機能的な第1のメンバーを含むR2の比率および結合対の機能的な第1のメンバーを含むR3の比率が、F2/R2ハイブリッド/基質複合体およびF3/R3ハイブリッド/基質複合体の形成時に、F2/R2ハイブリッド/基質複合体中のF2の数およびF3/R3ハイブリッド/基質複合体中のF3の数が、以下の関係:
(i)F2の数が、F3の数より大きい;および/または
(ii)第2の対象区間における変化を含むF2の数が、第3の対象区間における変化を含むF3の数よりも大きい
のうちの1つまたは両方を有するようなものである、実施形態26から29のいずれか1つの方法。
【0587】
実施形態31.F2の数が、F3の数よりも、少なくとも0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000倍大きい、実施形態30の方法。
【0588】
実施形態32.第2の対象区間における変化を含むF2の数が、第3の対象区間における変化を含むF3の数よりも、少なくとも0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1,000倍大きい、実施形態30または31の方法。
【0589】
実施形態33.第2の対象区間、第3の対象区間、またはその両方が、表1A~5Aに記載される遺伝子由来である、実施形態30から32のいずれか1つの方法。
【0590】
実施形態34.F1、F2、またはF3のうちの1つ、2つ、または全てが、表1A~5Aに記載される遺伝子からの対象区間を含む、実施形態26から33のいずれか1つの方法。
【0591】
実施形態35.F2における対象区間が第2の深度まで配列決定され、F3における対象区間が第3の深度まで配列決定され、第2の深度が第3の深度よりも、少なくとも1、2、3、4、5、6、7、8、9、または10倍大きい、実施形態34の方法。
【0592】
実施形態36.F3が、表1A~5Aに記載される遺伝子からの対象区間を含み、対象区間が、生殖系列変化、例えば、生殖系列SNPを含む、実施形態26から35のいずれか1つの方法。
【0593】
実施形態37.対象区間が、少なくとも約100×深度であるが約800×未満まで配列決定される、実施形態36の方法。
【0594】
実施形態38.対象から試料を提供することをさらに含む、実施形態7から37のいずれか1つの方法。
【0595】
実施形態39.試料が、DNA、例えば、ゲノムDNA、例えば、無細胞DNA(cfDNA)または循環腫瘍DNA(ctDNA)を含む、実施形態7から38のいずれか1つの方法。
【0596】
実施形態40.試料が、RNA、例えば、mRNAを含む、実施形態7から39のいずれか1つの方法。
【0597】
実施形態41.RNAからcDNAを提供することをさらに含む、実施形態40の方法。
【0598】
実施形態42.試料から核酸を得ること、例えば、単離することをさらに含む、実施形態7から41のいずれか1つの方法。
【0599】
実施形態43.試料中の核酸を断片化してF1およびF2を提供することをさらに含む、実施形態7から42のいずれか1つの方法。
【0600】
実施形態44.F1を増幅して複数のF1を提供し、F2を増幅して複数のF2を提供することをさらに含む、実施形態7から43のいずれか1つの方法。
【0601】
実施形態45.アダプター配列をF1およびF2に付着させて、アダプター化F1(AF1)およびアダプター化F2(AF2)を提供することをさらに含む、実施形態7から44のいずれか1つの方法。
【0602】
実施形態46.AF1を増幅して複数のAF1を提供し、AF2を増幅して複数のAF2を提供することをさらに含む、実施形態7から45のいずれか1つの方法。
【0603】
実施形態47.複数のF1をR1と接触させて複数のF1/R1ハイブリッドを提供し、複数のF2をR2と接触させて複数のF2/R2ハイブリッドを提供することをさらに含む、実施形態7から46のいずれか1つの方法。
【0604】
実施形態48.複数のAF1をR1と接触させて複数のAF1/R1ハイブリッドを提供し、複数のAF2をR2と接触させて複数のAF2/R2ハイブリッドを提供することをさらに含む、実施形態7から47のいずれか1つの方法。
【0605】
実施形態49.複数のF1/R1ハイブリッドを基質と接触させてF1/R1ハイブリッド/基質複合体を形成することが、複数のAF1/R1ハイブリッドを基質と接触させてAF1/R1ハイブリッド/基質複合体を形成することを含み;
複数のF2/R2ハイブリッドを基質と接触させてF2/R2ハイブリッド/基質複合体を形成することが、複数のAF2/R2ハイブリッドを基質と接触させてAF2/R2ハイブリッド/基質複合体を形成することを含む、実施形態7から48のいずれか1つの方法。
【0606】
実施形態50.接触が溶液中で起こる、実施形態47から49のいずれか1つの方法。
【0607】
実施形態51.接触が固体表面上で起こる、実施形態47から49のいずれか1つの方法。
【0608】
実施形態52.結合対の第1のメンバーがビオチン部分を含み、結合対の第2のメンバーがストレプトアビジンまたはアビジン(または修飾バージョン、例えば、NeutrAvidinもしくはCaptAvidin)部分を含む、実施形態8から51のいずれか1つの方法。
【0609】
実施形態53.結合対の第1のメンバーがジゴキシゲニン部分を含み、結合対の第2のメンバーが抗ジゴキシゲニン抗体部分を含む、実施形態8から51のいずれか1つの方法。
【0610】
実施形態54.結合対の第1のメンバーがFITC部分を含み、結合対の第2のメンバーが抗FITC抗体部分を含む、実施形態8から51のいずれか1つの方法。
【0611】
実施形態55.R1中の結合対の第1のメンバーが、リンカーを介してF1を捕捉する(例えば、ハイブリダイズする)R1中の部分(例えば、ヌクレオチド配列)にカップリングされ、R2中の結合対の第1のメンバーが、リンカーを介してF2を捕捉する(例えば、ハイブリダイズする)R2中の部分(例えば、ヌクレオチド配列)にカップリングされ、
場合により、リンカーは切断可能なリンカーである、実施形態8から51のいずれか1つの方法。
【0612】
実施形態56.複数のF1/R1ハイブリッド/基質複合体からF1を配列決定し、複数のF2/R2ハイブリッド/基質複合体からF2を配列決定することをさらに含む、実施形態7から55のいずれか1つの方法。
【0613】
実施形態57.F1が、F2より、例えば、少なくとも1、2、3、4、5、6、7、8、9、または10倍大きい深度まで配列決定される、実施形態56の方法。
【0614】
実施形態58.試料を分析する方法であって、
a)複数の第1の断片/第1の標的捕捉試薬(F1/R1)ハイブリッドおよび複数の第2の断片/第2の標的捕捉試薬(F2/R2)ハイブリッドを提供することであって、
結合対の機能的な第1のメンバーを含むR1の比率は、結合対の機能的な第1のメンバーを含むR2の比率よりも大きく、
結合対の第1のメンバーは、基質上に配置された結合対の第2のメンバーに結合することができる、ハイブリッドを提供すること;
b)複数のF1/R1ハイブリッドを基質と接触させて、F1/R1ハイブリッド/基質複合体を形成し、複数のF2/R2ハイブリッドを基質と接触させて、F2/R2ハイブリッド/基質複合体を形成することであって、
基質に結合するF1/R1ハイブリッドの比率は、基質に結合するF2/R2ハイブリッドの比率よりも大きい、複合体を形成すること;ならびに
c)複数のF1/R1ハイブリッド/基質複合体からF1を配列決定し、複数のF2/R2ハイブリッド/基質複合体からF2を配列決定すること
を含み、F1はF2より大きな深度まで配列決定され、
それによって試料を分析する、試料を分析する方法。
【0615】
実施形態59.F1が、高い配列決定深度事象を含み;
F2が、低い配列決定深度事象を含み、例えば、そのレベルが、1つ以上のバイオマーカー、例えば、腫瘍遺伝子変異量(TMB)、またはマイクロサテライト不安定性(MSI)の決定と関連する、実施形態58の方法。
【0616】
実施形態60.試料を分析する方法であって、
1)対象からの試料、例えば、ゲノムDNA、例えば、無細胞DNA(cfDNA)または循環腫瘍DNA(ctDNA)を含む試料を提供すること;
2)試料から核酸を得ること、例えば、単離すること;
3)核酸を断片化して、複数の断片(F)を提供すること;
4)アダプター配列を複数の断片(F)に付着させて、複数のアダプター化断片(AF)を提供すること;
5)第1のAF(AF1)を増幅して複数のAF1を提供し、第2のAF(AF2)を増幅して複数のAF2を提供すること;
6)複数のAF1を、各々がAF1にハイブリダイズするヌクレオチド配列を含む第1の標的捕捉試薬(R1)と接触させて、複数のAF1/R1ハイブリッドを提供し、複数のAF2を、各々がAF2にハイブリダイズするヌクレオチド配列を含む第2の標的捕捉試薬(R2)と接触させて、複数のAF2/R2ハイブリッドを提供することであって、
R1の一部およびR2の一部は、結合対の機能的な第1のメンバーを含み、結合対の第1のメンバーは、基質上に配置された結合対の第2のメンバーに結合することができ、
R1の一部、R2の一部、またはその両方は、結合対の機能的な第1のメンバーを欠く、ハイブリッドを提供すること;
7)複数のAF1/R1ハイブリッドを基質と接触させて、AF1/R1ハイブリッド/基質複合体を形成し、複数のAF2/R2ハイブリッドを基質と接触させて、AF2/R2ハイブリッド/基質複合体を形成することであって、
基質に結合するAF1/R1ハイブリッドの比率は、基質に結合するAF2/R2ハイブリッドの比率よりも大きい、複合体を形成すること;ならびに
8)複数のAF1/R1ハイブリッド/基質複合体からのAF1を配列決定し、複数のAF2/R2ハイブリッド/基質複合体からAF2を配列決定すること
を含み、場合により、AF1は、AF2より、例えば、少なくとも1、2、3、4、5、6、7、8、9、または10倍大きな深度まで配列決定され、
それによって試料を分析する、試料を分析する方法。
【0617】
実施形態61.AF1が、高い配列決定深度事象を含み;
AF2が、低い配列決定深度事象を含み、例えば、そのレベルが、1つ以上のバイオマーカー、例えば、腫瘍遺伝子変異量(TMB)、またはマイクロサテライト不安定性(MSI)の決定と関連する、実施形態60の方法。
【0618】
実施形態62.試料から複数の核酸分子を含むライブラリーを取得することをさらに含む、実施形態7から61のいずれか1つの方法。
【0619】
実施形態63.ライブラリーを標的捕捉試薬と接触させて、選択された核酸分子を提供することをさらに含み、前記標的捕捉試薬が核酸分子とハイブリダイズし、それによってライブラリーキャッチを提供する、実施形態62の方法。
【0620】
実施形態64.前記ライブラリーまたはライブラリーキャッチから腫瘍核酸分子からの、変化(例えば、体細胞性変化)を含む対象区間についてのリードを取得することをさらに含み、それによって、例えば、次世代シークエンシング法によって、対象区間についてのリードを取得する、実施形態63の方法。
【0621】
実施形態65.複数の遺伝子において対象区間についてのリードを取得することを含む、実施形態64の方法。
【0622】
実施形態66.複数の遺伝子が、突然変異体形態の遺伝子を含み、例えば、突然変異体遺伝子が、細胞分裂、増殖もしくは生存に対する作用と関連するか、またはがんと関連する、実施形態65の方法。
【0623】
実施形態67.複数の遺伝子が、全エクソンシークエンシング(WES)のために、少なくとも約50以上、約100以上、約150以上、約200以上、約250以上、約300以上、約350以上、約400以上、約450以上、約500以上の遺伝子、もしくは約1,000以上の遺伝子、または全ての遺伝子を含む、実施形態65または66の方法。
【0624】
実施形態68.複数の遺伝子が、表1A~5Aに記載される遺伝子の少なくとも約50以上、約100以上、約150以上、約200以上、約250以上、約300以上、または全てを含む、実施形態64から67のいずれか1つの方法。
【0625】
実施形態69.対象区間についてのリードの取得が、表1A~5Aの遺伝子の少なくとも約50以上、約100以上、約150以上、約200以上、約250以上、約300以上、または全てからの対象区間の配列決定を含む、実施形態64から68のいずれか1つの方法。
【0626】
実施形態70.対象区間が、約100×より大きい、約250×より大きい、約500×より大きい、約800×より大きい、約1,000×より大きい、約2,000×より大きい、約3,000×より大きい、約4,000×より大きい、または約5,000×より大きい平均深度まで配列決定される、実施形態64から69のいずれか1つの方法。
【0627】
実施形態71.対象区間が、配列決定された遺伝子(例えば、エクソン)の約95%超、約97%超、または約99%超で、約100×より大きい、約250×より大きい、約500×より大きい、約800×より大きい、約1,000×より大きい、約2,000×より大きい、約3,000×より大きい、約4,000×より大きい、または約5,000×より大きい平均深度まで配列決定される、実施形態64から70のいずれか1つの方法。
【0628】
実施形態72.アラインメント法によって前記リードを整列させることをさらに含む、実施形態64から71のいずれか1つの方法。
【0629】
実施形態73.ヌクレオチド位置について前記リードからヌクレオチド値を割り当てることをさらに含む、実施形態72の方法。
【0630】
実施形態74.試料中の1つ以上のゲノムシグネチャー、例えば、連続的/複雑なバイオマーカーを評価することをさらに含む、実施形態7から73のいずれか1つの方法。
【0631】
実施形態75.試料が血液試料である、実施形態74の方法。
【0632】
実施形態76.体細胞性変化または生殖系列変化として試料中の変化を特徴づけることをさらに含む、実施形態7から75のいずれか1つの方法。
【0633】
実施形態77.試料中の変化の接合性を決定することをさらに含む、実施形態7から76のいずれか1つの方法。
【0634】
実施形態78.試料、または試料の分析に応答して得られた試料に由来する対象を分類することをさらに含む、実施形態7から77のいずれか1つの方法。
【0635】
実施形態79.報告書、例えば、電子的な、ウェブベースの、または紙による報告書を、得られた試料に由来する対象に、または別の人もしくは団体、介護者、医師、がん専門医、病院、診療所、第三者支払人、保険会社もしくは政府機関に提供することをさらに含む、実施形態7から78のいずれか1つの方法。
【実施例0636】
本発明は、以下の実施例によってさらに例証されるが、これらは限定的と解釈されるべきではない。本出願全体で引用される全ての参考文献、図面、配列表、特許および公開された特許出願の内容は、参照により本明細書に組み込まれる。
【0637】
実施例1:無細胞DNAにおける変化の検出
【0638】
導入
【0639】
本実施例に記載される無細胞DNA(cfDNA)アッセイは、例えば、約60個または60個を超える遺伝子における、例えば、置換、挿入および欠失の変化(インデル)の検出、コピー数変化(CNAs)の選択、ならびにがん患者の抗凝固末梢全血由来の血漿から単離された循環遊離DNA(cfDNA)を用いる遺伝子再配列の選択のための次世代シークエンシングに基づくアッセイである。無細胞DNAの循環腫瘍DNA(ctDNA)画分の量が少ないため、標的捕捉含量は、高い感受性および特異性のために標的領域の狭く高い配列決定深度を達成するために制限される。この実施例に記載されるcfDNAアッセイはまた、より大きな遺伝子パネル(>300遺伝子)を使用して、標的捕捉領域全体にわたって広い中程度のカバレッジを達成することにより、ゲノムシグネチャーに使用することができる。ほとんどの場合、狭い標的捕捉領域は、合理的な配列決定コストで高い感受性および特異性を達成するために、凝集標的サイズが0.1~0.3Mbに制限され、一方、ゲノムシグネチャーは、0.8~1.0Mbの最小凝集標的捕捉領域を必要とする。現在、標準的なcfDNAアッセイへのゲノムシグネチャー分析の追加は、並列ワークフローを利用し、各々は2つの血管回収から始まり、単一アッセイの配列決定データ生成の2倍を必要とする。
【0640】
この実施例に記載される研究は、高い感受性および特異性を必要とする関連ゲノム変化と、ゲノムシグネチャーの検出とを組み合わせ、試験される患者あたり全2本の血液チューブのみを必要とするために、現在のcfDNAアッセイワークフローを最適化することを目的として設計された。概説した実験は、<200Mリード対の配列決定データ標的内で狭く高い配列決定深度と広い中程度の配列決定深度の両方を達成することができる組合せアッセイのためのいくつかのオプションを評価するように設計された。組合せアッセイのワークフロー最適化を評価して、cfDNAアッセイの要件を満たすために各オプションを利用する可能性を評価した。
【0641】
この実施例に記載される研究は、組み合わせたアッセイ設計要件を達成するためのいくつかのオプションを評価した。第1のオプションは、同じライブラリー構築(「LC」)材料からの二重(並列)ハイブリッド捕捉(「HC」)手法を評価することであり、これには、他の考慮事項の中でも特に過剰増幅によってライブラリーの複雑性を有意に減少させることなく、二重ハイブリッド捕捉反応をサポートするのに最低限十分な量に達するように作り出すことができるLCポストPCRアウトプット材料の量を増加させるための開発作業が含まれた(以下に詳述するように、このような第1のオプションに関連する活動、まとめて「パス1」とする)。第2のオプションは、ゲノム変化とゲノムシグネチャーの両方をコールするために広く高い配列決定深度でゲノムシグネチャー標的捕捉試薬を利用することを評価することであり、ゲノム変化およびゲノムシグネチャーコーリングの性能を保持するために配列負荷密度を最適化することを評価した(以下に詳述するように、このような第2のオプションに関連する活動、まとめて「パス2」とする)。
【0642】
第3のオプションは、5’ビオチン化プローブと非修飾のプローブ(抗標的捕捉試薬またはブロッキング標的捕捉試薬と呼ばれることがある)の組合せを使用して、特異的な標的ごとの基準により標的配列決定深度を調節する、複雑な標的捕捉試薬戦略を評価することであった。例えば、ビオチン化プローブ(例えば、5’ビオチン化プローブ)は、結合対(例えば、本明細書に記載される)の機能的な第1のメンバーを含む標的捕捉試薬である。別の例として、非修飾のプローブ(例えば、抗標的捕捉試薬、ブロッキングプローブ、ビオチン化されていないプローブ)は、結合対(例えば、本明細書に記載される)の機能的な第1のメンバーを欠く標的捕捉試薬である。この戦略は、ゲノムシグネチャーのための標的領域の残りの部分にわたって、特定の標的の狭き高い配列決定深度および広い中程度の配列決定深度を可能にする。実験は、単一のハイブリダイゼーション反応の能力を評価するように設計され、ゲノムライブラリーから引き出され、続いて配列決定された標的の量は、修飾および非修飾のプローブの比によって予め決定することができる。これは、パス2に概説されているような単一のHC反応の使用を可能にするが、パス1で達成された低い、高い、および中間の標的配列決定深度を有する能力がある(以下に詳述するように、このような第3のオプションに関連する活動、まとめて「パス2B」とする)。
【0643】
結果:
パス1
【0644】
単一ライブラリー構成からの二重ハイブリッド捕捉
【0645】
ライブラリー構築プロトコールの最適化は、プロセス適格性評価で示されたように、LC出力のより高い効率および均一性をもたらした。この場合、20ng~100ngの範囲のLC入力を表す192のDNA試料を、3つの別々のLCプレートにわたって実行し、狭くい高い配列決定深度(NHSD、0.3Mb)のための標的捕捉試薬と広い中程度の配列決定深度(WMSD、2Mb)のための標的捕捉試薬との同等の表現で捕捉した。以前の開発作業により、自動液体ハンドリングワークステーション上に設置された自動化cfDNAアッセイライブラリー構築プロトコールが、例示的な試料のQC基準の評価を通じて、プロセス全体で実行されることにより、期待される臨床性能を満たすかまたは上回ることが確認された。低入力(≧20~50ng)および高入力(≧50~100ng)における100%試料のライブラリー構築収率は、全て>2μg LC収率を達成し、NHSD標的捕捉試薬で捕捉された100%試料は≧5000×中央値の固有の配列決定深度を有し、WMSD標的捕捉試薬で捕捉された100%試料は≧800×中央値の固有の配列決定深度を有した。プロトコール最適化は、並列ハイブリッド捕捉反応のために十分なLC出力を提供する必要な結果を達成した。展開後は、全投入濃度に対して同等のLC収率分布であった。対照的に、最適化前のプロトコールは、LC入力によるLC収率スケーリングにおいて、cfDNAアッセイにおいて使用される広範囲のLC入力に対して2つのハイブリッド捕捉反応を有することが困難であることを例証した。
【0646】
酵素的に断片化された正常ヒトDNAは、cfDNAアッセイライブラリー構築を受け、6複製は、各々2つのHC反応に分割した。一方のHC反応をNHSD標的捕捉試薬を用いて行い、他方はWMSD標的捕捉試薬を用いて行った。試料を試料あたりの標的100Mリード対について、HiSeq 4000フローセルに装填した。表6に概説されているように、150Mを超えるリード対を有する各試料は、NHSDとWMSD標的捕捉物の両方について、標的未処理、固有、および冗長の配列決定深度指定を達成し、単一のLCパスからの二重HCがカバレッジ目標を達成したことを証明した。
【0647】
1LC>2HCの変異体レベル性能評価
【0648】
変異体レベルの一致における単一LCからの二重HCをさらに評価するために、43個の例示的な試料は、ゲノムシグネチャーのための短いヌクレオチド変異体、挿入/欠失、遺伝子再配列、およびWMSD標的捕捉についてNHSD標的捕捉を受けた。
1.ALKイントロン19再配列(N=5)
2.EGFRエクソン19欠失(N=5)
3.EGFR L858R(N=5)
4.RET再配列(N=5)
5.ゲノムシグネチャー0.88~27.2mut/mb(N=23)
【0649】
単一ライブラリーからの二重HCの変異体レベルでの実験結果は、パス1が実施可能性を達成したことを示す。標的カバレッジプロファイルは、標的捕捉試薬セットと達成された変異体レベルの一致の両方について達成された。
【0650】
パス2
【0651】
単一ライブラリー構成からの単一ハイブリッド捕捉
【0652】
酵素的に断片化された正常ヒトDNAは、cfDNAアッセイライブラリー構築を受け、6反復は、WMSD標的捕捉試薬セットを用いて行われた単一のHC反応を受けた。この実験を用いて、単一の標的捕捉による並行アッセイからの200Mリード量を配列決定することによって、広く高い配列決定深度(WHSD)が達成できるかどうかを決定した。試料ごとに、標的<200Mリード対について、試料をHiSeq 4000フローセルに装填した。表7に概説されているように、各試料は、NHSD標的捕捉についてではなく、WMSD標的捕捉についてのみ、標的未処理、固有、および冗長の配列決定深度指定を達成し、単一のLCパスからの二重HCが、試料量あたり200Mリード対での目標を達成しなかったことを示した。NHSD標的領域の冗長カバレッジは、組合せアッセイ性能要件に必要なデータを達成するのに十分に高くなかった。cfDNAアッセイ(約700M=約30,000×/約7500×*約170M)のための十分に冗長な配列決定深度を達成するためには約700Mリードが必要であると推定され、これは、試料あたり200Mリード対を超えないようにするための要件を十分に上回る。このパスについては、さらなるデータは収集しなかった。
【0653】
パス2B
【0654】
カバレッジ調節のための複雑な標的捕捉試薬戦略
【0655】
実験1:NHSD標的捕捉試薬中に滴定されたAPCおよびATMのためのブロッキング標的捕捉試薬の添加
【0656】
特異的な標的の捕捉性能に影響を与える非修飾の標的捕捉試薬の能力の概念評価の最初の証明として、2つの遺伝子であるAPCおよびATMの過剰な非修飾の標的捕捉試薬を、1X-2Xのビオチン化標的捕捉試薬のNHSD標的捕捉試薬中への滴定において添加した。表8および
図1は、この実験の結果を示し、非修飾のブロッカーまたは抗標的捕捉試薬の添加により、特定の標的のカバレッジが低下し得るが、過剰の標的捕捉試薬に過剰のブロッカーを入れる効果は、全標的捕捉試薬量を一定に保ち、ブロッカー対標的捕捉試薬の比を調整した場合と同様に顕著ではなかったことを示す。
【0657】
実験2:NHSD標的捕捉試薬中に滴定されたAPCおよびATMのためのブロッキング標的捕捉試薬の添加
【0658】
実験2において、最終プール中の0.032pMの全標的捕捉試薬量を一定に保ち、ビオチン化標的捕捉試薬対非ビオチン化標的捕捉試薬の比を滴定して、単一の遺伝子標的APCに対する抗標的捕捉試薬戦略を例証した。遺伝子APCの標的捕捉試薬(164個の標的捕捉試薬)は、NHSD標的捕捉試薬に添加された完全遺伝子サブプールであり、これは、APC遺伝子の標的試薬なしでNHSD標的捕捉試薬を有する標的捕捉試薬セットバックボーンの作製を可能にした。100%ビオチン化APC~99%ビオチン化されていない1%ビオチン化APCの範囲を評価し、
図2および表9に示されるように、観察された配列決定深度と予想される配列決定深度との広い範囲を示した。100%ビオチン化APCを有するNHSD標的捕捉試薬を100%APCと比較し、標的捕捉試薬へのAPCの再添加がAPC配列決定深度に有害作用を及ぼさないことを示した。標的捕捉試薬量を一定に保つことにより、抗標的捕捉試薬方法が成功し、より大きなスケールの試験が次の実験であり得ることを示す予測可能な配列決定深度抑制応答があった。
【0659】
実験3:NHSD標的以外の標的に対するブロッキング標的捕捉試薬の添加
【0660】
実験3の目的は、単一ハイブリッド捕捉反応によって得られる狭く高い配列決定深度(NHSD)および広く中程度の配列決定深度(WMSD)を有するために、NHSD領域上で高い深度を得、非NHSD(本明細書ではWMSD標的とも呼ばれる)領域上で低い深度を標的とするために、複雑な標的捕捉試薬戦略を継続することであった。
【0661】
標的捕捉試薬セットは、標的捕捉試薬の3つのサブプールを利用することによって、完全プロトタイプとして製剤化された。NHSD標的捕捉試薬(3780個の標的捕捉試薬、0.3Mb)を、NHSD/非NHSD標的比(14%NHSD:86%非NHSD)で、非修飾の標的捕捉試薬(全標的マイナスNHSD標的、ビオチンなし、22563個の標的捕捉試薬、1.7Mb)と組み合わせた。次に、この混合物を、完全な標的捕捉セット(2.0Mb、26343)に滴定し、ビオチンの有無にかかわらず、非NHSD領域の比率を変化させた。(NHSD-ビオチン/非ビオチン):非NHSDビオチンの滴定系列を、100、50、30、20、10、5、1、0%で行い、最初に、各成分の標的配列決定深度プロファイルを達成するのに必要な標的捕捉試薬の比を決定した。
【0662】
表10および表11に示される滴定の結果は、非NHSDを減少させ、必要なNHSDを維持する能力を示す。10%製剤(90%非ビオチン~10%ビオチン)を例示的な試料に使用する製剤として選択した。滴定の配列決定深度の結果を表10および11に示す。
図3は、ヒストグラムの形での10%製剤についての実験3の結果を示す。
図3に示されるように、NHSD(狭く高い配列決定深度)標的は、グラフの左側にある別個のグループを形成する非NHSD標的からグラフの右側にある別個のクラスターに分離する。NHSD標的は、非NHSD標的(本明細書ではWMSD標的とも呼ばれる)と比較して、より高い配列決定深度を有する。この実験はまた、臨床試料を用いても行われ、同様の結果が得られた。
【0663】
要約
【0664】
この実施例では、高感受性および高特異性を必要とするゲノム変化と、単一のアッセイに必要とするゲノムシグナリングとの組み合わせのための3つの異なるパスについての結果を記載し、要約する。この分析は、(a)単一のライブラリー構築後の並列ハイブリッド捕捉が、配列決定深度指定を達成し、特定のゲノムシグネチャー、ならびに単一のヌクレオチド変異体(SNV)、インデル、および再配列について変異体レベルの一致を維持すること、(b)200Mリード対が、高感受性および特異性に必要とされる広く高い配列決定深度を達成するのに十分な配列決定ではないこと、ならびに(c)抗標的捕捉試薬手法を利用する予備データは、抗標的捕捉試薬戦略が、特定のゲノムシグネチャー領域上の規定された標的および広く中程度の配列決定深度で必要とされる高く狭い配列決定深度を達成するために使用され得ることを示唆し、単一のハイブリッド捕捉反応が、実施可能な配列決定深度内で性能指定を達成する組合せアッセイの目標を達成することを可能にすることを実証した。
【0665】
本明細書に記載される方法およびシステムに関連する追加の実施例は、例えば、国際特許出願公開第WO2012/092426号および第WO2016/090273号に記載され、上述の刊行物および実施例の内容は、その全体が参照により組み込まれる。
【0666】
参照による組み込み
【0667】
本明細書に記載される全ての刊行物、特許、および特許出願は、各々個々の刊行物、特許または特許出願が、参照により組み込まれるように具体的であり個別に示されたものとして、参照によりそれらの全体が本明細書に組み込まれる。相反する場合、本出願は、本明細書中の任意の定義を含むが、制御される。
【0668】
また、それらの全体が、公開データベースのエントリーに相関する寄託番号を参照する任意のポリヌクレオチドおよびポリペプチド配列であり、例えば、tigr.orgのワールドワイドウェブ上のInstitute for Genomic Research(TIGR)、および/またはncbi.nlm.nih.govのワールドワイドウェブ上のNational Center for Biotechnology Information(NCBI)によって維持されるものである。
【0669】
同等物
【0670】
当業者であれば、本明細書に記載される本発明の特定の実施形態に対する多くの同等物を、常套的実験のみを用いて認識するか、または確認することができる。このよう同等物は、以下の特許請求の範囲に包含されることが意図される。