IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 深▲セン▼恒特基因有限公司の特許一覧

特許6998404標的ヌクレオチド配列の富化及び決定方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2021-12-22
(45)【発行日】2022-02-04
(54)【発明の名称】標的ヌクレオチド配列の富化及び決定方法
(51)【国際特許分類】
   C12Q 1/686 20180101AFI20220128BHJP
   C12Q 1/6876 20180101ALI20220128BHJP
   C12Q 1/6883 20180101ALI20220128BHJP
   C12Q 1/6886 20180101ALI20220128BHJP
   C12Q 1/6869 20180101ALI20220128BHJP
   C12N 15/12 20060101ALN20220128BHJP
【FI】
C12Q1/686 Z ZNA
C12Q1/6876 Z
C12Q1/6883 Z
C12Q1/6886 Z
C12Q1/6869 Z
C12N15/12
【請求項の数】 59
(21)【出願番号】P 2019567770
(86)(22)【出願日】2017-08-01
(65)【公表番号】
(43)【公表日】2020-03-19
(86)【国際出願番号】 CN2017095404
(87)【国際公開番号】W WO2019023924
(87)【国際公開日】2019-02-07
【審査請求日】2019-08-23
(73)【特許権者】
【識別番号】519307805
【氏名又は名称】深▲セン▼恒特基因有限公司
【氏名又は名称原語表記】HELITEC LIMITED
【住所又は居所原語表記】Room 6A,Building F3,TCL International E-City,1001 Zhongshanyuan Road,Xili Street,Nanshan District Shenzhen,Guangdong 518000 (CN)
(74)【代理人】
【識別番号】110001139
【氏名又は名称】SK特許業務法人
(74)【代理人】
【識別番号】100130328
【弁理士】
【氏名又は名称】奥野 彰彦
(74)【代理人】
【識別番号】100130672
【弁理士】
【氏名又は名称】伊藤 寛之
(72)【発明者】
【氏名】ジョン、ジュンリ
【審査官】佐久 敬
(56)【参考文献】
【文献】特表2015-517307(JP,A)
【文献】国際公開第2016/176091(WO,A1)
【文献】NATURE MEDICINE,2014年11月10日,Vol. 20,pp. 1479-1484,ONLINE METHODS, Supplementary figures and tables
【文献】Nature Protocols,2011,Vol.6,No.7,p.1026-1036,Supplementary figures and table
【文献】Julia Sandberg,Massively parallel analysis of cells and nucleic acids,Doctoral Thesis in Biotechnology, Stockholm, Sweden 2011, p.1-71
(58)【調査した分野】(Int.Cl.,DB名)
C12Q
C12N
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
標的ヌクレオチド配列を含有する核酸テンプレートを含む核酸試料から、関心対象の遺伝子座を有する前記標的ヌクレオチド配列を富化する方法であって、
(a)第1の末端に二本鎖部分を有し、第2の末端に非二本鎖部分を有するオリゴヌクレオチドであるユニバーサルアダプターを、前記第1の末端によって前記核酸テンプレートにライゲートすることにより、ライゲートされた核酸を提供するステップと、
(b)前記ライゲートされた核酸を、前記標的ヌクレオチド配列を含む第1の鎖、及び第2の鎖に解離させるステップと、
(c)外部プライマーは、前記ライゲートされた核酸の第1の鎖中の前記標的ヌクレオチド配列の近傍にアニールするステップと、
(d)DNAポリメラーゼを用いて、前記外部プライマーを、前記ライゲートされた核酸の第1鎖の全長にわたって伸長させることにより、新生DNA線形的増幅二本鎖を提供するステップと、
(e)十分に高い温度で前記新生DNA線形的増幅二本鎖を、前記ライゲートされた核酸の第1の鎖と一本鎖DNA線形的増幅生成物に解離させるステップと、
(f)ステップ(c)~(e)を繰り返して1つないしそれ以上のDNA線形的増幅サイクルを行うステップと、
(g)前記標的ヌクレオチド配列のPCR増幅に十分な条件下で、前記一本鎖DNA線形的増幅生成物をDNAポリメラーゼ、ユニバーサルアダプタープライマー及び内部プライマーに接触させるステップであって、前記ユニバーサルアダプタープライマーは、前記一本鎖DNA線形的増幅生成物における前記ユニバーサルアダプターの前記非二本鎖部分の相補的配列にアニールし、前記内部プライマーは、3'末端において、前記標的ヌクレオチド配列に特異的にアニールする配列を含み、かつ、前記関心対象の遺伝子座について、前記内部プライマーは前記外部プライマーに対してネストされたものであるステップと、
(h)ステップ(g)を繰り返して1つないしそれ以上のPCR増幅サイクルを行って、前記標的ヌクレオチド配列のアンプリコンを提供することにより、前記標的ヌクレオチド配列を富化するステップと、
を含む方法。
【請求項2】
前記標的ヌクレオチド配列の前記アンプリコンは、次世代シークエンシング(NGS)に使用される、請求項1に記載の方法。
【請求項3】
前記方法は、前記ライゲートされた核酸の第1の鎖に特異的にアニール可能な第1組の外部プライマー及び第1組の内部プライマーと、前記ライゲートされた核酸の第2の鎖に特異的にアニール可能な第2組の外部プライマー及び第2組の内部プライマーとを用いて、前記関心対象の遺伝子座を有する標的ヌクレオチド配列を富化することを含む、請求項1又は2に記載の方法。
【請求項4】
前記第1組の外部プライマー及び前記第2組の外部プライマーは、少なくとも13ヌクレオチド長の第1の5'タグ配列を含み、かつ、前記第1組の内部プライマー及び前記第2組の内部プライマーは、少なくとも13ヌクレオチド長の第2の5'タグ配列を含む、請求項3に記載の方法。
【請求項5】
前記第1の5'タグ配列のGC含有量は、前記核酸テンプレートのGC含有量と実質的に同一である、請求項4に記載の方法。
【請求項6】
前記方法は、複数組の外部プライマー及び内部プライマーを用いて、異なる関心対象の遺伝子座を有する複数の標的ヌクレオチド配列を富化することを含む、請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記複数の標的ヌクレオチド配列中の少なくとも2つは、前記核酸テンプレートの異なる鎖中に存在している、請求項6に記載の方法。
【請求項8】
前記方法は、異なる関心対象の遺伝子座を2~5000個有する複数の標的ヌクレオチド配列を富化することを含む、請求項6または7に記載の方法。
【請求項9】
ステップ(c)~(e)を~100サイクル繰り返す、請求項1~8のいずれか一項に記載の方法。
【請求項10】
前記外部プライマーは、前記内部プライマーよりも前記関心対象の遺伝子座から1~100ヌクレオチド離れた領域にアニールする、請求項1~9のいずれか一項に記載の方法。
【請求項11】
前記外部プライマー及び/又は前記内部プライマーの少なくとも最後の12のヌクレオチドは、前記核酸試料中に異なるアニーリング遺伝子座を20個未満有する、請求項1~10のいずれか一項に記載の方法。
【請求項12】
前記核酸テンプレートはゲノムDNAである、請求項1~10のいずれか一項に記載の方法。
【請求項13】
前記ゲノムDNAは染色体DNAである、請求項12に記載の方法。
【請求項14】
前記ゲノムDNAはミトコンドリアDNA又はその他の染色体外DNAである、請求項12に記載の方法。
【請求項15】
前記核酸テンプレートはエクソームDNAである、請求項1~11のいずれか一項に記載の方法。
【請求項16】
前記核酸テンプレートはcDNAである、請求項1~11のいずれか一項に記載の方法。
【請求項17】
前記cDNAは全RNAの逆転写によって得られるものである、請求項16に記載の方法。
【請求項18】
前記cDNAは、mRNA、miRNA又はその他の非コードRNAの逆転写によって得られるものである、請求項16に記載の方法。
【請求項19】
前記核酸試料はゲノムDNA及びcDNAの両方を含む、請求項1~18のいずれか一項に記載の方法。
【請求項20】
前記核酸テンプレートは無細胞DNAである、請求項1~11のいずれか一項に記載の方法。
【請求項21】
前記核酸試料は血液試料に由来する、請求項1~20のいずれか一項に記載の方法。
【請求項22】
前記核酸試料は細胞又は組織試料に由来する、請求項1~20のいずれか一項に記載の方法。
【請求項23】
前記核酸試料は腫瘍生検試料に由来する、請求項22に記載の方法。
【請求項24】
前記核酸試料はホルマリン固定パラフィン包埋(FFPE)試料に由来する、請求項22または23に記載の方法。
【請求項25】
前記関心対象の遺伝子座は染色体再編成に関連する、請求項1~24のいずれか一項に記載の方法。
【請求項26】
前記染色体再編成は染色体転座である、請求項25に記載の方法。
【請求項27】
前記関心対象の遺伝子座は単一ヌクレオチド変異(SNV)に関連する、請求項1~24のいずれか一項に記載の方法。
【請求項28】
前記関心対象の遺伝子座は挿入欠失に関連する、請求項1~24のいずれか一項に記載の方法。
【請求項29】
前記関心対象の遺伝子座はスプライス変異に関連する、請求項1~24のいずれか一項に記載の方法。
【請求項30】
前記関心対象の遺伝子座はがんに関わる遺伝子中にある、請求項1~29のいずれか一項に記載の方法。
【請求項31】
前記関心対象の遺伝子座は免疫細胞受容体をコードする遺伝子中にある、請求項1~29のいずれか一項に記載の方法。
【請求項32】
前記関心対象の遺伝子座は遺伝性疾患に関わる遺伝子中にある、請求項1~29のいずれか一項に記載の方法。
【請求項33】
前記関心対象の遺伝子座はCRISPR遺伝子編集のオフターゲット部位にある、請求項1~29のいずれか一項に記載の方法。
【請求項34】
前記核酸テンプレートは前記次世代シークエンシングに適したサイズに断片化される、請求項2~33のいずれか一項に記載の方法。
【請求項35】
前記方法は、ステップ(a)の前に前記核酸テンプレートに対して末端修復およびA-テーリングを行うことをさらに含む、請求項1~34のいずれか一項に記載の方法。
【請求項36】
前記ユニバーサルアダプターの前記非二本鎖部分は、ブロッキング部分を有する3'末端を含む、請求項1~35のいずれか一項に記載の方法。
【請求項37】
前記ブロッキング部分はリバースヌクレオチドである、請求項36に記載の方法。
【請求項38】
前記ブロッキング部分は、1つ又は複数のホスホロチオエート修飾を有するフラッピング状のヌクレオチドフラグメントである、請求項36に記載の方法。
【請求項39】
前記ユニバーサルアダプターの前記非二本鎖部分は、縮重設計された核酸塩基を含有する分子バーコードを含む、請求項1~38のいずれか一項に記載の方法。
【請求項40】
前記ユニバーサルアダプターの前記二本鎖部分は試料バーコードを含む、請求項1~39のいずれか一項に記載の方法。
【請求項41】
前記試料バーコードは前記ユニバーサルアダプターの第1の末端にある、請求項40に記載の方法。
【請求項42】
前記試料バーコードは4~13のヌクレオチドからなる、請求項41に記載の方法。
【請求項43】
前記ユニバーサルアダプターの第1の末端には、ステップ(b)~(f)の間に残存ユニバーサルアダプターによる無差別プライミングを防止するために、十分に短い長さの一定の核酸塩基を含む、請求項1~42のいずれか一項に記載の方法。
【請求項44】
前記十分に高い温度は少なくとも90℃である、請求項1~43のいずれか一項に記載の方法。
【請求項45】
前記ライゲートされた核酸はステップ(b)の前にクリーンアップ工程に供される、請求項1~44のいずれか一項に記載の方法。
【請求項46】
前記DNA線形的増幅生成物はステップ(g)の前にクリーンアップ工程に供される、請求項1~45のいずれか一項に記載の方法。
【請求項47】
前記ステップ(g)を2~100サイクル繰り返す、請求項1~46のいずれか一項に記載の方法。
【請求項48】
前記ユニバーサルアダプタープライマーの5'末端又は前記ユニバーサルアダプターは、前記NGSに用いられる第1のシークエンシングプライマーの配列と同一の又は相補的な配列を含む、請求項2に記載の方法。
【請求項49】
前記ステップ(g)は、前記標的ヌクレオチド配列のPCR増幅に十分な条件下で、前記一本鎖DNA線形的増幅生成物をDNAポリメラーゼ、ユニバーサルアダプタープライマー、内部プライマー及びシークエンシングアダプタープライマーに接触させることを含み、前記シークエンシングアダプタープライマーは、3'末端において、前記標的ヌクレオチド配列に特異的にアニールする配列を含み、かつ、5'末端において、前記NGSに用いられる第2のシークエンシングプライマーの配列と同一の又は相補的な配列を含む、請求項48に記載の方法。
【請求項50】
核酸試料中に関心対象の遺伝子座を有する標的ヌクレオチド配列を決定する方法であって、前記核酸試料は核酸テンプレートを含み、前記核酸テンプレートは前記標的ヌクレオチド配列を含み、前記方法は、
(i)請求項1~49のいずれか一項に記載の方法により前記関心対象の遺伝子座を有する前記標的ヌクレオチド配列を富化するステップと、
(ii)前記標的ヌクレオチド配列の前記アンプリコンに対して次世代シークエンシングを行うことにより、前記標的ヌクレオチド配列を提供するステップと、を含む方法。
【請求項51】
2~5000個の異なる関心対象の遺伝子座を有する標的ヌクレオチド配列が同時に決定される、請求項50に記載の方法。
【請求項52】
前記方法は、ステップ(ii)の前記次世代シークエンシングの前に、前記標的ヌクレオチド配列の前記アンプリコンを用いてシークエンシングライブラリーを作製することをさらに含む、請求項50又は51に記載の方法。
【請求項53】
核酸試料中の関心対象の遺伝子座における配列変異体を検出する方法であって、前記核酸試料は核酸テンプレートを含み、前記核酸テンプレートは前記関心対象の遺伝子座を有する標的ヌクレオチド配列を含み、前記方法は、
(1)請求項50~52のいずれか一項に記載の方法により前記関心対象の遺伝子座を有する前記標的配列を決定するステップと、
(2)前記標的ヌクレオチド配列中の前記配列変異体を検出するステップと、を含む方法。
【請求項54】
前記配列変異体は1:100を超えない対立遺伝子頻度で存在している、請求項53に記載の方法。
【請求項55】
前記配列変異体は生殖細胞系DNAに遺伝している、請求項53または54に記載の方法。
【請求項56】
前記配列変異体は体細胞突然変異又は染色体再編成である、請求項54または55に記載の方法。
【請求項57】
複数種の配列変異体が検出される、請求項53~55のいずれか一項に記載の方法。
【請求項58】
前記複数種の配列変異体は、染色体再編成、スプライス変異、SNP、欠失、挿入、コピー数多型(CNV)、およびそれらの組み合わせから選択される、請求項57に記載の方法。
【請求項59】
前記方法は、cDNA配列に基づく染色体再編成又はCNVと、gDNA配列に基づく突然変異とを同時に検出する、請求項53~58のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ゲノミクス分野に属し、具体的には、ヌクレオチド配列の富化及び決定方法に関するものである。
【0002】
ASCIIフォーマットによる配列表の提出
以下、ASCIIフォーマットで提出する内容は、その全体が参照により本明細書に組み入れられる:コンピュータ読み込み可能な形式(CRF)の配列表(名称:776252000140SEQLIST.txt、記録日:2017年7月26日、サイズ:17KB)。
【背景技術】
【0003】
次世代シークエンシング(NGS)技術は、過去の10年間にゲノミクス分野に変革をもたらした。各NGSランは、通常、シークエンシング実行毎に、数十万~数十億のDNAテンプレートに関する数ギガバイトの配列情報を並行に生成する。現在、ヒトゲノム配列決定のコストは1000ドルの基準になっている。NGS技術の低コスト及び高スループットによって、核酸配列決定を臨床ツールとして使用することが可能になる。
【0004】
しかしながら、NGS臨床適用に要求される所望のコスト、速度、分析感度及び精度を達成するには、未だ多くの課題が残っている。従来、主要なNGSプラットフォームは、比較的短いリード(35-700bp)、比較的高い誤り率(~0.1-15%)及びプラットフォーム依存のバイアスを有する。臨床試料、例えば生検試料やホルマリン固定パラフィン包埋(FFPE)試料では、少量の出発材料だけが提供される。まれな遺伝子変異を検出するには、100000×までのカバレッジ(coverage)が必要である場合がある。例えばS. Goodwin et al., Nat. Rev. Genetics (2016), 17:333を参照されたい。
【0005】
標的化シークエンシングは、適切な幅及び深さのシークエンシングデータを提供することにより、臨床に関連する遺伝子変異の検出を可能にする。当該方法の肝心なステップは、シークエンシングの前に核酸試料(例えばゲノムDNA試料)中から選択的に標的領域を捕捉する標的富化(target enrichment)ということである。様々な既知の標的富化方法、例えば、ミクロドロップレットに基づくPCR、分子反転プローブ及びハイブリッド捕捉法では、いずれも数多くのインプットテンプレート、専門的な機器又はエサの設計、及び偏った配列カバレッジが必要である。Mamanova et al., Nat. Methods (2010), 7(2): 111を参照されたい。
【0006】
本明細書に記載のすべての刊行物、特許、特許出願及び公開された特許出願の開示内容は、その全体が参照により本明細書に組み入れられる。
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明は、ヌクレオチド配列を富化して決定するための方法、組合物、キット及び分析システムを提供する。
【0008】
本願の1つの局面において、標的ヌクレオチド配列を含有する核酸テンプレートを含む核酸試料から、関心対象の遺伝子座を有する標的ヌクレオチド配列を富化する方法であって、(a)第1の末端に二本鎖部分を有し、第2の末端に非二本鎖部分を有するオリゴヌクレオチドであるユニバーサルアダプターを、第1の末端によって核酸テンプレートにライゲートすることにより、ライゲートされた核酸を提供するステップと、(b)ライゲートされた核酸を、標的ヌクレオチド配列を含む第1の鎖、及び第2の鎖に解離させるステップと、(c)外部プライマーをライゲートされた核酸の第1の鎖中の標的ヌクレオチド配列の近傍にアニールするステップと、(d)DNAポリメラーゼを用いて、外部プライマーを、ライゲートされた核酸の第1鎖の全長にわたって伸長させることにより、新生のプライマー伸長二本鎖を提供するステップと、(e)十分に高い温度で新生のプライマー伸長二本鎖を、ライゲートされた核酸の第1の鎖と、一本鎖プライマー伸長生成物に解離させるステップと、(f)ステップ(c)~(e)を繰り返して1つないしそれ以上のプライマー伸長サイクルを行うステップと、(g)標的ヌクレオチド配列のPCR増幅に十分な条件下で、一本鎖プライマー伸長生成物をDNAポリメラーゼ、ユニバーサルアダプタープライマー及び内部プライマーに接触させるステップであって、前記ユニバーサルアダプタープライマーは、一本鎖プライマー伸長生成物におけるユニバーサルアダプターの非二本鎖部分の相補的な配列にアニールし、前記内部プライマーは、3'末端において標的ヌクレオチド配列に特異的にアニールする配列を含み、かつ関心対象の遺伝子座について、前記内部プライマーは外部プライマーに対してネストされた(nested)ものであるステップと、(h)ステップ(g)を繰り返して1つないしそれ以上のサイクルのPCR増幅を行って、標的ヌクレオチド配列のアンプリコンを提供することにより、標的ヌクレオチド配列を富化するステップと、を含む方法を提供する。いくつかの実施形態では、標的ヌクレオチド配列のアンプリコンは次世代シークエンシング(NGS)に使用される。
【0009】
上記いずれかの方法のいくつかの実施形態では、当該方法は、ライゲートされた核酸の第1の鎖に特異的にアニール可能な第1組の外部プライマー及び内部プライマーと、ライゲートされた核酸の第2の鎖に特異的にアニール可能な第2組の外部プライマー及び内部プライマーとを用いて、関心対象の遺伝子座を有する標的ヌクレオチド配列を富化することを含む。いくつかの実施形態では、第1組の外部プライマー及び第2組の外部プライマーは、少なくとも約13ヌクレオチド長の第1の5'タグ配列を含み、かつ第1組の内部プライマー及び第2組の内部プライマーは、少なくとも約13ヌクレオチド長の第2の5'タグ配列を含む。いくつかの実施形態では、第1の5'タグ配列のGC含有量は、核酸テンプレートのGC含有量と実質的に類似している。
【0010】
上記いずれかの方法のいくつかの実施形態では、当該方法は、複数組の外部プライマー及び内部プライマーを用いて、異なる関心対象の遺伝子座を有する複数の標的ヌクレオチド配列を富化することを含む。いくつかの実施形態では、複数の標的ヌクレオチド配列中の少なくとも2つは、核酸テンプレートの異なる鎖中に存在している。いくつかの実施形態では、当該方法は、異なる関心対象の遺伝子座を約2~5000個有する複数の標的ヌクレオチド配列を富化することを含む。
【0011】
上記いずれかの方法のいくつかの実施形態では、ステップ(c)~(e)を約2~100サイクル繰り返す。いくつかの実施形態では、外部プライマーは、内部プライマーよりも関心対象の遺伝子座から約1~100ヌクレオチド離れた領域にアニールする。いくつかの実施形態では、外部プライマー及び/又は内部プライマーの少なくとも最後の12のヌクレオチドは、核酸試料中に異なるアニーリング遺伝子座を約20個未満有する。
【0012】
上記いずれかの方法のいくつかの実施形態では、核酸テンプレートはゲノムDNAである。いくつかの実施形態では、ゲノムDNAは染色体DNAである。いくつかの実施形態では、ゲノムDNAはミトコンドリアDNA又はその他の染色体外DNAである。いくつかの実施形態では、核酸テンプレートはエクソームDNAである。いくつかの実施形態では、核酸テンプレートはcDNAである。いくつかの実施形態では、全RNAの逆転写によってcDNAを得る。いくつかの実施形態では、mRNA、miRNA又はその他の非コードRNAの逆転写によってcDNAを得る。いくつかの実施形態では、核酸試料はゲノムDNA及びcDNAの両方を含む。いくつかの実施形態では、核酸テンプレートは無細胞DNAである。
【0013】
上記いずれかの方法のいくつかの実施形態では、核酸試料は血液試料に由来する。いくつかの実施形態では、核酸試料は細胞又は組織試料に由来する。いくつかの実施形態では、核酸試料は腫瘍生検試料に由来する。いくつかの実施形態では、核酸試料はホルマリン固定パラフィン包埋(FFPE)試料に由来する。
【0014】
上記いずれかの方法のいくつかの実施形態では、関心対象の遺伝子座は染色体再編成に関連する。いくつかの実施形態では、染色体再編成は染色体転座である。いくつかの実施形態では、関心対象の遺伝子座は単一ヌクレオチド変異(SNV)に関連する。いくつかの実施形態では、関心対象の遺伝子座は挿入または欠失に関連する。いくつかの実施形態では、関心対象の遺伝子座はスプライス変異に関連する。
【0015】
上記いずれかの方法のいくつかの実施形態では、関心対象の遺伝子座はがんに関わる遺伝子中にある。いくつかの実施形態では、関心対象の遺伝子座は免疫細胞受容体をコードする遺伝子中にある。いくつかの実施形態では、関心対象の遺伝子座は遺伝性疾患に関わる遺伝子中にある。いくつかの実施形態では、関心対象の遺伝子座はCRISPR遺伝子編集のオフターゲット部位(例えば従来既知又は未知のオフターゲット部位)にある。
【0016】
上記いずれかの方法のいくつかの実施形態では、核酸テンプレートは次世代シークエンシングに適したサイズに断片化される。いくつかの実施形態では、当該方法は、ステップ(a)の前に核酸テンプレートに対して末端修復およびA-テーリングを行うことをさらに含む。
【0017】
上記いずれかの方法のいくつかの実施形態では、ユニバーサルアダプターの非二本鎖部分は、ブロッキング部分を有する3'末端を含む。いくつかの実施形態では、ブロッキング部分は逆位ヌクレオチドである。いくつかの実施形態では、ブロッキング部分は、1つ又は複数のホスホロチオエート修飾を有するフラッピング状のヌクレオチド(flapping nucleotides)フラグメントである。
【0018】
上記いずれかの方法のいくつかの実施形態では、ユニバーサルアダプターの非二本鎖部分は、縮重設計(degenerately designed)された核酸塩基を含有する分子バーコードを含む。いくつかの実施形態では、ユニバーサルアダプターの二本鎖部分は試料バーコードを含む。いくつかの実施形態では、試料バーコードはユニバーサルアダプターの第1の末端にある。いくつかの実施形態では、試料バーコードは約4~13のヌクレオチドからなる。いくつかの実施形態では、ユニバーサルアダプターの第1の末端には、ステップ(b)~(f)の間に残存ユニバーサルアダプターによる無差別プライミング(promiscuous priming)を防止するために、十分に短い長さの一定の核酸塩基を含む。
【0019】
上記いずれかの方法のいくつかの実施形態では、十分に高い温度は少なくとも約90℃である。いくつかの実施形態では、ライゲートされた核酸はステップ(b)の前にクリーンアップ工程に供される。いくつかの実施形態では、プライマー伸長生成物はステップ(g)の前にクリーンアップ工程に供される。いくつかの実施形態では、ステップ(g)を約2~100サイクル繰り返す。
【0020】
上記いずれかの方法のいくつかの実施形態では、ユニバーサルアダプタープライマーの5'末端又はユニバーサルアダプターは、NGSに用いられる第1のシークエンシングプライマーの配列と同一の又は相補的な配列を含む。いくつかの実施形態では、ステップ(g)は、標的ヌクレオチド配列のPCR増幅に十分な条件下で、一本鎖プライマー伸長生成物をDNAポリメラーゼ、ユニバーサルアダプタープライマー、内部プライマー及びシークエンシングアダプタープライマーに接触させることを含み、当該シークエンシングアダプタープライマーは、3'末端において、内部プライマーの配列と同一の配列を含み、かつ5'末端において、NGSに用いられる第2のシークエンシングプライマーの配列と同一の又は相補的な配列を含む。
【0021】
本願の1つの局面において、核酸試料中に関心対象の遺伝子座を有する標的ヌクレオチド配列を決定する方法であって、前記核酸試料は核酸テンプレートを含有する核酸試料を含み、前記核酸テンプレートは標的ヌクレオチド配列を含み、当該方法は、(i)上記いずれかの方法により関心対象の遺伝子座を有する標的ヌクレオチド配列を富化するステップと、(ii)標的ヌクレオチド配列のアンプリコンに対して次世代シークエンシングを行うことにより、標的ヌクレオチド配列を提供するステップと、を含む方法を提供する。いくつかの実施形態では、約2~5000個の異なる関心対象の遺伝子座を有する標的ヌクレオチド配列を同時に決定する。いくつかの実施形態では、当該方法は、ステップ(ii)の次世代シークエンシングの前に、標的ヌクレオチド配列のアンプリコンを用いてシークエンシングライブラリーを作製することをさらに含む。
【0022】
本願の別の局面において、核酸試料中の関心対象の遺伝子座での配列変異体を検出する方法であって、前記核酸試料は核酸テンプレートを含有する核酸試料を含み、前記核酸テンプレートは関心対象の遺伝子座を有する標的ヌクレオチド配列を含み、当該方法は、(1)上述の標的ヌクレオチド配列を決定するいずれかの方法により関心対象の遺伝子座を有する標的配列を決定するステップと、(2)標的ヌクレオチド配列中の配列変異体を検出するステップと、を含む方法を提供する。いくつかの実施形態では、配列変異体は約1:100を超えない(例えば約1:1000以下、1:10000以下のいずれか又はより低い)対立遺伝子頻度で存在している。いくつかの実施形態では、配列変異体は生殖細胞系DNAの中で遺伝している。いくつかの実施形態では、配列変異体は体細胞突然変異又は染色体再編成である。いくつかの実施形態では、複数種の配列変異体を検出する。いくつかの実施形態では、複数種の配列変異体は、染色体再編成、スプライス変異、SNP、欠失、挿入、コピー数多型(CNV)、およびそれらの組み合わせから選択される。いくつかの実施形態では、当該方法は、cDNA配列に基づく染色体再編成又はCNVと、gDNA配列に基づく突然変異とを同時に検出する。
【0023】
本願の別の局面において、上述のいずれかの配列変異体検出方法を用いて、個体由来の核酸試料中の関心対象の遺伝子座における疾患に関連する配列変異体を検出することにより、疾患の診断を提供することを含む、個体の疾患を診断する方法を提供する。
【0024】
本願は、(a)第1の末端においてライゲート可能な二本鎖部分を含みかつ第2の末端において非二本鎖部分を含むオリゴヌクレオチドであるユニバーサルアダプターと、(b)ユニバーサルアダプターの非二本鎖部分の相補的配列にアニール可能なユニバーサルアダプタープライマーと、(c)外部プライマーと、(d)関心対象の遺伝子座について、外部プライマーに対してネストされた内部プライマーと、を含む、キットをさらに提供する。いくつかの実施形態では、ユニバーサルアダプタープライマーの5'末端又はユニバーサルアダプターは、NGSプラットフォームと適合する第1のシークエンシングプライマーの配列と同一の又は相補的な配列を含む。いくつかの実施形態では、内部プライマーは、NGSプラットフォームと適合する第2のシークエンシングプライマーの配列と同一の又は相補的な配列を含む。いくつかの実施形態では、当該キットはさらに、3'末端に内部プライマーの配列と同一の配列を含みかつ5'末端にNGSプラットフォームと適合する第2のシークエンシングプライマーの配列と同一の又は相補的な配列を含むシークエンシングアダプタープライマーを含む。いくつかの実施形態では、当該キットは複数組の外部プライマー及び内部プライマーを含む。
【0025】
上記いずれかのキットのいくつかの実施形態では、当該キットはがんの診断に用いられる。いくつかの実施形態では、がんは肺がん、乳がん又は大腸がんである。いくつかの実施形態では、関心対象の遺伝子座は、ALK、BRAF、EGFR、ERBB2、HRAS、KDR、KIT、KRAS、MET、NRAS、NTRK1、PDGFRA、PIK3CA、PTEN、RET、ROS1及びTP53から選ばれる遺伝子のうちのいずれか1つ又は複数にある。
【0026】
後述する具体的な実施形態及び特許請求の範囲によれば、本発明のこれらの局面及びその他の局面並びにメリットは明らかになる。本明細書に記載の各実施形態の特徴の1つ、いくつか又は全ては、各組み合わせが個々にかつ明確的に開示されるのと同様に、本発明のさらなる実施形態を形成するために組み合わせることができると理解されよう。
【図面の簡単な説明】
【0027】
図1】標的ヌクレオチド配列の富化によってシークエンシングライブラリーを作製する例示的な方法の模式図である。
図2】ターゲット遺伝子座を有する核酸テンプレートの二本鎖において標的ヌクレオチド配列を富化するために用いられる2組の例示的な外部プライマー及び内部プライマーを示す図である。
図3】プライマー伸長サイクルにおける残存ユニバーサルアダプターによる潜在的な副産物を示す図である。
図4】(a)は、従来で公開された標的富化のためのAMP方法を用いて得られたEGFR遺伝子座を有するマッピングされたリードを示す図であり、(b)は、本願の実施例1に記載の方法を用いて得られたEGFR遺伝子座を有するマッピングされたリードを示す図である。
図5】(a)は、実施例1に記載の方法及び50ngのインプットDNAを用いて得られたEGFR遺伝子座の全長における配列カバレッジ及び配列深度を示す図であり、(b)は、実施例1に記載の方法及び5ngのインプットDNAを用いて得られたEGFR遺伝子座の全長における配列カバレッジ及び配列深度を示す図である。
図6】(a)~(b)は、KIF5Bエクソン15 c.1723とRETエクソン12 c. 2138の間のインフレーム遺伝子融合のRNAに基づく検出を示す図であり、(c)~(d)は、EML4エクソン4 c. 468とALKエクソン20 c. 3173の間の遺伝子融合のRNAに基づく検出を示す図であり、(e)~(f)は、EML4エクソン17 c. 1880とALKエクソン 20 c. 3173の間のインフレーム遺伝子融合のRNAに基づく検出を示す図である。
図7】(a)は、X32-P732試料中のEML4-ALK遺伝子融合のRNAに基づく検出を示す図であり、(b)は、X32-P732試料中のKRASにおける突然変異のgDNAに基づく検出を示す図である。
図8】(a)は、シークエンシングライブラリーL17-00154~L17-00159の全パネルカバレッジの統計を示す図であり、(b)は、シークエンシングライブラリーL17-00160~L17-00165の全パネルカバレッジの統計を示す図であり、(c)は、シークエンシングライブラリーL17-00166~L17-00171の全パネルカバレッジの統計を示す図であり、(d)は、シークエンシングライブラリーL17-00172~L17-00177の全パネルカバレッジの統計を示す図である。
図9】(a)は、シークエンシングライブラリーL17-00154~L17-00159由来のマッピングされたリードによるKRASエクソン2へのカバレッジを示す図であり、(b)は、シークエンシングライブラリーL17-00160~L17-00165由来のマッピングされたリードによるKRASエクソン2へのカバレッジを示す図であり、(c)は、シークエンシングライブラリーL17-00166~L17-00171由来のマッピングされたリードによるKRASエクソン2へのカバレッジを示す図であり、(d)は、シークエンシングライブラリーL17-00172~L17-00177由来のマッピングされたリードによるKRASエクソン2へのカバレッジを示す図である。
【発明を実施するための形態】
【0028】
本願は、核酸テンプレートをユニバーサルアダプターにライゲートすること、プライマー伸長ステップ(又は線形的増幅(linear amplification)ステップ)を行い、次にネストされた標的特異的なプライマーを用いてPCR増幅ステップ(又は指数的増幅ステップ)を行うことを含む、1つないしそれ以上の関心対象の遺伝子座を有する標的ヌクレオチド配列の富化及び決定のための方法を提供する。本明細書に記載の方法は、インプット核酸試料を非常に少ない量で用いる場合でも、配列多様性が高められたシークエンシングライブラリーを効率よく構築することができる、改良された標的富化方法を提供する。本明細書に記載の方法のプライマー伸長ステップでは、標的ヌクレオチド配列を線形的に増幅することが可能であり、かつPCR増幅ステップでは、プライマー伸長生成物由来の標的ヌクレオチド配列を指数的で特異的に増幅することが可能である。従来、ネストされた標的特異的プライマーを用いて2段階のPCR増幅により標的核酸を富化するアンカード・マルチプレックスPCR(AMP)が開発されている。例えば、国際PCT出願の公開公報No.WO2015112948を参照されたい。しかしながら、AMP法の2つの増幅ステップにおいてアンプリコンはいずれも指数的に増加しているので、増幅のバイアス及び誤差が広がり、富化効率及び正確度が損なわれる。本願は、本明細書に記載の方法により得られたデータを提供し、これらのデータによって、当該方法はAMP法よりも優れた効率、特異性及び感度を有することが証明されている。また、その他の標的富化方法に比べて、本明細書に記載の方法では、RNAに基づく配列変異体の検出とgDNAに基づく配列変異体の検出を同時に行うことが可能であり、かつより大きい数の目的遺伝子座に対して多重探索することが可能である。このような特性は、低品質の核酸を含む希少な臨床試料から疾患に関わる一般にはまれな遺伝子変異を費用効果よく、迅速かつ正確的に検出することが求められる本明細書に記載の方法の臨床への適用において特に望ましい。
【0029】
したがって、本願の1つの局面において、標的ヌクレオチド配列を含有する核酸テンプレートを含む核酸試料から、関心対象の遺伝子座を有する標的ヌクレオチド配列を富化する方法(例えば次世代シークエンシングに用いられる)であって、(a)第1の末端に二本鎖部分を有し、第2の末端に非二本鎖部分を有するオリゴヌクレオチドであるユニバーサルアダプターを、第1の末端によって核酸テンプレートにライゲートすることにより、ライゲートされた核酸を提供するステップと、(b)ライゲートされた核酸を、標的ヌクレオチド配列を含む第1の鎖、及び第2の鎖に解離させるステップと、(c)外部プライマーをライゲートされた核酸の第1の鎖中の標的ヌクレオチド配列の近傍にアニールするステップと、(d)DNAポリメラーゼを用いて、外部プライマーを、ライゲートされた核酸の第1鎖の全長にわたって伸長させることにより、新生のプライマー伸長二本鎖を提供するステップと、(e)十分に高い温度で新生のプライマー伸長二本鎖を、ライゲートされた核酸の第1の鎖と、一本鎖プライマー伸長生成物に解離させるステップと、(f)ステップ(c)~(e)を繰り返して1つないしそれ以上のプライマー伸長サイクルを行うステップと、(g)標的ヌクレオチド配列のPCR増幅に十分な条件下で、一本鎖プライマー伸長生成物をDNAポリメラーゼ、ユニバーサルアダプタープライマー及び内部プライマーに接触させるステップであって、前記ユニバーサルアダプタープライマーは、一本鎖プライマー伸長生成物におけるユニバーサルアダプターの非二本鎖部分の相補的な配列にアニールし、前記内部プライマーは、3'末端において標的ヌクレオチド配列に特異的にアニールする配列を含み、かつ、関心対象の遺伝子座について、前記内部プライマーは外部プライマーに対してネストされたものであるステップと、(h)ステップ(g)を繰り返して1つないしそれ以上のサイクルのPCR増幅を行って、標的ヌクレオチド配列のアンプリコンを提供することにより、標的ヌクレオチド配列を富化するステップと、を含む方法を提供する。
【0030】
本願の別の局面において、標的ヌクレオチド配列を含有する核酸テンプレートを含む核酸試料中に関心対象の遺伝子座を有する標的ヌクレオチド配列を決定する方法であって、(a)第1の末端に二本鎖部分を有し、第2の末端に非二本鎖部分を有するオリゴヌクレオチドであるユニバーサルアダプターを、第1の末端によって核酸テンプレートにライゲートすることにより、ライゲートされた核酸を提供するステップと、(b)遺伝子座を含む各ライゲートされた核酸を標的ヌクレオチド配列を含む第1の鎖、及び第2の鎖に解離させるステップと、(c)外部プライマーを、ライゲートされた核酸の第1の鎖中の標的ヌクレオチド配列の近傍にアニールするステップと、(d)DNAポリメラーゼを用いて、外部プライマーを、ライゲートされた核酸の第1鎖の全長にわたって伸長させることにより、新生のプライマー伸長二本鎖を提供するステップと、(e)十分に高い温度で新生のプライマー伸長二本鎖を、ライゲートされた核酸の第1の鎖と、一本鎖プライマー伸長生成物に解離させるステップと、(f)ステップ(c)~(e)を繰り返して1つないしそれ以上のプライマー伸長サイクルを行うステップと、(g)標的ヌクレオチド配列のPCR増幅に十分な条件下で、一本鎖プライマー伸長生成物をDNAポリメラーゼ、ユニバーサルアダプタープライマー及び内部プライマーに接触させるステップであって、前記ユニバーサルアダプタープライマーは、一本鎖プライマー伸長生成物におけるユニバーサルアダプターの非二本鎖部分の相補的な配列にアニールし、前記内部プライマーは、3'末端において標的ヌクレオチド配列に特異的にアニールする配列を含み、かつ、関心対象の遺伝子座について、前記内部プライマーは外部プライマーに対してネストされたものであるステップと、(h)ステップ(g)を繰り返して1つないしそれ以上のサイクルのPCR増幅を行って、標的ヌクレオチド配列のアンプリコンを提供するステップと、(i)標的ヌクレオチド配列のアンプリコンの次世代シークエンシングを行うことにより、標的ヌクレオチド配列を提供するステップと、を含む方法を提供する。
【0031】
本願はさらに、シークエンシングライブラリーの作製方法、配列変異体の検出方法、および疾患の診断及び治療方法、並びにこれらの方法に用いられる組成物、キット、製品及び分析ソフトウェアを提供する。
【0032】
I.定義
本明細書において互換的に用いられる「ポリヌクレオチド」又は「核酸」とは、任意の長さのヌクレオチドポリマーを指し、かつDNAとRNAを含む。ヌクレオチドは、デオキシリボヌクレオチド、リボヌクレオチド、修飾されたヌクレオチド又は塩基、及び/又はそれらの類似体であってもよく、DNAやRNAポリメラーゼによってポリマーに組み込まれることができる任意の基質であってもよい。ポリヌクレオチドは、修飾されたヌクレオチド、例えばメチル化ヌクレオチド及びそれらの類似体を含んでもよい。
【0033】
本明細書に用いられる「オリゴヌクレオチド」とは、通常、短く、一般に一本鎖の、一般に合成されたポリヌクレオチドを指し、その長さが一般的に約200ヌクレオチドを超えないが、必ずしもそうではない。技術用語「オリゴヌクレオチド」と「ポリヌクレオチド」は互いに排他的ではない。以上のポリヌクレオチドに関する説明は、オリゴヌクレオチドにおいても同様かつ完全に適用することができる。
【0034】
技術用語「3'」とは、一般にポリヌクレオチド又はオリゴヌクレオチドにおいて、同一のポリヌクレオチド又はオリゴヌクレオチドにおける別の領域又は位置よりも下流の領域又は位置を指す。
【0035】
技術用語「5'」とは、一般にポリヌクレオチド又はオリゴヌクレオチドにおいて、同一のポリヌクレオチド又はオリゴヌクレオチドにおける別の領域又は位置よりも上流の領域又は位置を指す。
【0036】
本明細書に用いられる「核酸テンプレート」とは、標的富化及び配列決定のための出発材料として用いられる核酸試料中に存在するポリヌクレオチドを指す。
【0037】
「鋳型核酸」とは、プライマー伸長反応又はPCR増幅反応においてテンプレートとして用いられるポリヌクレオチドを指す。鋳型核酸は、二本鎖又は一本鎖であってもよい。
【0038】
「関心対象の遺伝子座」とは、研究者が関心を持つポリヌクレオチド、例えば遺伝子又は遺伝子融合産物の断片、を指す。遺伝子座は、単一ヌクレオチドを含む任意の数のヌクレオチドを有してもよい。遺伝子座は1つないしそれ以上の異なる配列と関連することができる。
【0039】
「関心対象の遺伝子座を有する標的ヌクレオチド配列」とは、関心対象の遺伝子座を含むか、又は関心対象の遺伝子座に含まれるポリヌクレオチドのヌクレオチド配列を指す。標的ヌクレオチド配列は、ポリヌクレオチドのプラス鎖又はマイナス鎖における配列であってもい。ポリヌクレオチドは、関心対象の遺伝子座よりも長いものであっても短いものであってもよい。
【0040】
例えば、第1の核酸又はプライマーの少なくとも2つの連続的な塩基が逆平行で結合できるか、又は第2の核酸の少なくとも1つのサブ配列とハイブリダイズして二本鎖を形成する場合、核酸又はプライマーは別の核酸と「相補的」であるといえる。いくつかの実施形態では、相補的とは、2つの所定のポリヌクレオチド又はヌクレオチド配列が互いにアニールする場合に、DNAにおいてAがTと対を形成してGがCと対を形成し、そしてRNAにおいてGがCと対を形成してAがUと対を形成するように、ヌクレオチド塩基G、A、T、C、及びUの間の水素結合による塩基対形成選択性(preferences)を意味する。本明細書において用いられる「実質的に相補的」とは、核酸分子またはその一部(例えばプライマー)が、第2のヌクレオチド配列に対して、当該分子の全長又はその一部にわたって少なくとも90%の相補性を有する(例えば90%相補的、95%相補的、98%相補的、99%相補的又は100%相補的である)ことを意味する。本明細書において用いられる「実質的に同一」とは、核酸分子又はその一部が、第2のヌクレオチド配列に対して、当該分子の全長又はその一部にわたって少なくとも90%のアイデンティティ(例えば90%のアイデンティティ、95%のアイデンティティ、98%のアイデンティティ、99%のアイデンティティ又は100%のアイデンティティ)を有することを意味する。
【0041】
「プライマー」とは、通常、一般に遊離3'-OH基を有する短い一本鎖ポリヌクレオチドを指し、当該プライマーは、標的配列とハイブリダイズすることによって目的のターゲットに結合してターゲットと相補的であるポリヌクレオチドの重合を促進する。
【0042】
本明細書において互換的に用いられる「ハイブリダイズ」と「アニール」とは、1つないしそれ以上のポリヌクレオチドが反応して、ヌクレオチド基の塩基同士の水素結合によって安定化される複合体を形成するという反応を指す。水素結合はWatson-Crick塩基対形成、Hoogstein結合又はその他のいかなる配列特異的態様によって生じ得る。
【0043】
本明細書において用いられる技術用語「特異的にハイブリダイズ」又は「特異的にアニール」とは、核酸と、相補的配列の核酸とをハイブリダイズすることを指す。本明細書において用いられる、核酸分子の一部は、別の核酸分子における相補的配列と特異的にハイブリダイズすることができる。すなわち、別の分子に「特異的にハイブリダイズする」ために、核酸配列の全長は必ずしもそのような配列の一部にハイブリダイズする必要がなく、例えば分子の5'末端にはハイブリダイズしていないヌクレオチドの配列が存在しながら、同一の分子の3'末端の配列が別の分子に特異的にハイブリダイズすることができる。
【0044】
本明細書において互換的に用いられるポリヌクレオチド又はオリゴヌクレオチドの「一部」又は「領域」とは、2つないそれ以上の塩基の連続的な配列である。その他のいくつかの実施形態では、1つの領域又は一部は、少なくとも約3、5、10、15、20、25のうちのいずれかの連続的なヌクレオチドである。
【0045】
本明細書において用いられる、標的核酸に対して特異的なプライマーのコンテキストにおいて用いられる「特異的」とは、プライマーが標的核酸にアニールして、標的核酸の増幅を媒介するが、試料中に存在する非標的配列にはアニールせず、非標的配列の増幅を媒介しないアニーリング温度が存在するような、プライマーとターゲットの間の相補性のレベルを意味する。
【0046】
「内部プライマー」及び対応する「外部プライマー」とは、ネストされた増幅反応(例えば第1のプライマー伸長反応、次いで関心対象の遺伝子座を含む標的ポリヌクレオチドで行われるポリメラーゼ連鎖反応)を行うために設計された2つのネストされた標的特異的プライマーを指す。関心対象の遺伝子座については、「内部プライマー」が「外部プライマー」に対して「ネスト」化されたものであるとは、内部プライマー及び外部プライマーが標的ポリヌクレオチドの同じ鎖に特異的にハイブリダイズして、かつ外部プライマーのハイブリダイズ部位が内部プライマーのハイブリダイズ部位よりも関心対象の遺伝子座から遠く離れていることを意味する。「1組の外部プライマー及び内部プライマー」とは、関心対象の遺伝子座のための、外部プライマーに対してネストされた1つないしそれ以上の内部プライマーを指す。例えば図1又は図2を参照されたい。
【0047】
本明細書において用いられる「アダプター」とは、ポリヌクレオチド断片にライゲート可能なオリゴヌクレオチドを指す。
【0048】
本明細書において用いられる「ライゲート」は2つのポリヌクレオチド(例えばアダプターとポリヌクレオチド断片)に関し、連続的な主鎖を有する比較的大きなポリヌクレオチドを形成するように、個々の2つのポリヌクレオチドが共有結合によってライゲートすることを意味する。
【0049】
本明細書において互換的に用いられる技術用語「変性」又は「解離」とは、核酸二本鎖を2つの一本鎖に単離させることを指す。
【0050】
「プライマー伸長」とは、核酸ポリメラーゼが、テンプレート特異的な形式(つまりプライマー伸長反応から生じる娘鎖が標的ヌクレオチド配列と相補的である)で標的ヌクレオチド配列にハイブリダイズするプライマーの3'末端に1つないしそれ以上のヌクレオチドを付加る分子反応を意味する。伸長は、プライマー3'末端に付加される1番目のヌクレオチドに関するのみならず、伸長されたプライマーからなるポリヌクレオチドの任意のさらなる伸長をも含んでいる。複数のプライマー伸長サイクルは、標的ヌクレオチド配列の線形的増幅につながる。「プライマー伸長二本鎖」とは、テンプレート鎖及び娘鎖を含むプライマー伸長反応の二本鎖産物を指す。「一本鎖プライマー伸長生成物」は具体的に、プライマー伸長反応から生じる娘鎖を指す。
【0051】
本明細書において用いられる「増幅」とは、一般に所望の配列を生成する2つ又はより多くのコピーのプロセスを指す。増幅反応の成分は、例えばプライマー、ポリヌクレオチドテンプレート、ポリメラーゼ、ヌクレオチド、dNTPなどを含むが、これらに制限されない。
【0052】
「ポリメラーゼ連鎖反応増幅」又は「PCR増幅」とは、目的二本鎖DNAの特定の断片又はサブ配列を等比級数的に増幅する方法を指す。PCRは当業者によく知られている。例えば米国特許No. 4,683,195及び4,683,202、並びに、PCR Protocols: A Guide to Methods and Applications, Innis et al., eds, 1990を参照されたい。PCR増幅によって、標的ヌクレオチド配列の数は指数的に増加する。
【0053】
「増幅された産物」、「増幅産物」又は「アンプリコン」とは、ヌクレオチド配列において鋳型ヌクレオチド配列及び/又はその相補的配列に対応する特定の標的核酸鋳型鎖及び/又はその相補的配列の一部のコピーであるPCR増幅反応から得られたオリゴヌクレオチドを意味する。増幅産物はさらに、プライマーに対して特異的で、標的核酸及び/又はその相補体の一部である配列に隣接する配列を含みうる。本明細書に記載のアンプリコンは、その個々の鎖について言及することができるものの、一般的に二本鎖DNAであろう。
【0054】
「反応混合物」は成分(例えば1種又は複数種のポリペプチド、核酸及び/又はプライマー)の組み合わせであり、適切な条件下で、例えばプライマー伸長反応又はPCR増幅反応のような特定の反応を進めるように反応する。
【0055】
技術用語「富化」とは、処理前に前記試料中に最初に存在する核酸配列全体のレベルに対して、試料中の特定の核酸配列の相対的な量を増加させるプロセスを指す。したがって、富化ステップでは、例えば目的核酸配列の絶対コピー数などの量を直接増加させるのではなく、相対的割合や分率の増加量を提供する。富化ステップの後に、分析される試料は、富化されたまたは選択されたポリヌクレオチドと呼ぶことができる。
【0056】
本明細書において用いられる技術用語「ライブラリー」とは、核酸配列の集団を指す。
【0057】
技術用語「決定」、「検出」、「測定」、「評価」、「評定」、「アッセイ」及び「分析」は、本明細書において互換的に用いられて任意の形の測定を指すことができ、かつある元素の有無を確認することを含む。これらの用語は、定量的及び/又は定性的に決定することを含む。
【0058】
本明細書において互換的に用いられる「配列変異体」とは、参照配列と比較して目的配列における任意の配列変化を指す。参照配列は、野生型配列、又は目的配列との比較が意図される配列でありうる。配列変異体は、染色体再編成、コピー数多型(CNV)、挿入または欠失、スプライス変異及び単一ヌクレオチド突然変異を含むが、これらに制限されない。配列変異体は、例えば置換、欠失、挿入、構造的再編成及び遺伝子操作による単一ヌクレオチドの変化、又は配列中の2以上のヌクレオチドの変化を含む。
【0059】
本明細書において用いられる技術用語「単一ヌクレオチド変異」又はその略「SNV」とは、ゲノム配列中に特定の位置における単一ヌクレオチドが変化することを意味する。選択し得る対立遺伝子が集団にある頻度(例えば集団において少なくとも1%)で存在する場合、SNVは「一塩基多型」又は「SNP」とも呼ばれる
【0060】
本明細書に記載の本発明の局面及び実施形態は、「...からなる」及び/又は「実質的に...からなる」局面及び実施形態を含むことが理解されよう。
【0061】
特に説明がない限り、本明細書において用いられる単数形「1つの」、「1種の」、及び「当該」は複数形を含む。
【0062】
当業者に理解されるように、本明細書に記載の「約」の値又はパラメータは、当該値又はパラメータ自体に関する実施形態を含む(かつ記述する)。例えば、「約X」は、「X」に関する記述を含む。
【0063】
数値範囲を記述する場合、当該範囲の上限と下限の間の各中間値、および当該範囲内の任意の特定の値又は中間値は、本明細書の開示範囲に含まれることが理解されよう。所定の範囲が上限又は下限を含む場合、含まれる限界のいずれかを除く範囲も本明細書の開示に含まれる。
【0064】
特に説明がない限り、本発明は、例えばSambrook et al., Molecular Cloning: A Laboratory Manual (3 ed.), Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., USA (2001); 及び、Davis et al., Basic Methods in Molecular Biology, Elsevier Science Publishing, Inc., New York, USA (1995)という参考文献において記述される標準的な技法を用いて行われる。これらの参考文献は、その全体が参照により本明細書に組み入れられる。
【0065】
II.標的の富化方法
本願の一局面は、次世代シークエンシングに用いられる標的の富化方法に関し、つまり次世代シークエンシング技術により標的ヌクレオチド配列を決定する前に、1つないしそれ以上の関心対象の遺伝子座を有する標的ヌクレオチド配列を富化する方法である。
【0066】
いくつかの実施形態では、標的ヌクレオチド配列を含有する核酸テンプレートを含む核酸試料から、関心対象の遺伝子座を有する標的ヌクレオチド配列を富化する方法(例えば次世代シークエンシングに用いられる)であって、(a)第1の末端に二本鎖部分を有し、第2の末端に非二本鎖部分を有するオリゴヌクレオチドであるユニバーサルアダプターを、第1の末端によって核酸テンプレートにライゲートすることにより、ライゲートされた核酸を提供するステップと、(b)ライゲートされた核酸を、標的ヌクレオチド配列(例えばプラス鎖配列又はマイナス鎖配列)を含む第1の鎖、及び第2の鎖に解離させるステップと、(c)外部プライマーをライゲートされた核酸の第1の鎖中の標的ヌクレオチド配列の近傍にアニールするステップと、(d)DNAポリメラーゼを用いて、外部プライマーを、ライゲートされた核酸の第1鎖の全長にわたって伸長させることにより、新生のプライマー伸長二本鎖を提供するステップと、(e)十分に高い温度で新生のプライマー伸長二本鎖を、ライゲートされた核酸の第1の鎖と、一本鎖プライマー伸長生成物に解離させるステップと、(f)必要に応じてステップ(c)~(e)を繰り返して1つないしそれ以上のプライマー伸長サイクルを行うステップと、(g)標的ヌクレオチド配列のPCR増幅に十分な条件下で、一本鎖プライマー伸長生成物をDNAポリメラーゼ、ユニバーサルアダプタープライマー及び内部プライマーに接触させるステップであって、前記ユニバーサルアダプタープライマーは、一本鎖プライマー伸長生成物におけるユニバーサルアダプターの非二本鎖部分の相補的な配列にアニールし、前記内部プライマーは、3'末端において標的ヌクレオチド配列に特異的にアニールする配列を含み、かつ、関心対象の遺伝子座について、前記内部プライマーは外部プライマーに対してネストされたものであるステップと、(h)ステップ(g)を繰り返して1つないしそれ以上のサイクルのPCR増幅を行って、標的ヌクレオチド配列のアンプリコンを提供することにより、標的ヌクレオチド配列を富化するステップと、を含む方法を提供する。いくつかの実施形態では、ステップ(c)~(e)を繰り返して1つないしそれ以上のサイクルを行う。いくつかの実施形態では、ステップ(c)~(e)を繰り返さない。
【0067】
いくつかの実施形態では、複数組の外部プライマー及び内部プライマーを用いて、関心対象の遺伝子座を有する標的ヌクレオチド配列を富化する。本明細書において用いられる「標的ヌクレオチド配列」とは、一般に二本鎖標的ポリヌクレオチドの配列を指し、プラス鎖配列又はマイナス鎖配列であってもよい。いくつかの実施形態では、当該方法は、ライゲートされた核酸の第1の鎖に特異的にアニールした第1組の外部プライマー及び内部プライマーと、ライゲートされた核酸の第2の鎖に特異的にアニールした第2組の外部プライマー及び内部プライマーとを用いて、関心対象の遺伝子座を有する標的ヌクレオチド配列を富化することを含む。いくつかの実施形態では、第1組の外部プライマー及び第2組の外部プライマーは、少なくとも約13ヌクレオチド長(例えば少なくとも約15、20、25のうちのいずれか又はより多くのヌクレオチド長)の第1の5'タグ配列を含み、かつ第1組の内部プライマー及び第2組の内部プライマーは、少なくとも約13ヌクレオチド長(例えば少なくとも約15、20、25のうちのいずれか又はより多くのヌクレオチド長)の第2の5'タグ配列を含む。外部プライマー中の5'タグ配列は、PCR増幅産物及びプライマー二量体の形成を抑制でき、これにより線形的増幅(又はプライマー伸長)になる。いくつかの実施形態では、標的ヌクレオチド配列に対する一方向又は両方向に複数組の外部プライマー及び内部プライマーを用いることで、関心対象の遺伝子座にタイリングするアンプリコンを提供する。
【0068】
したがって、いくつかの実施形態では、標的ヌクレオチド配列を含有する核酸テンプレートを含む核酸試料から、関心対象の遺伝子座を有する標的ヌクレオチド配列を富化する方法(例えば次世代シークエンシングに用いられる)であって、(a)第1の末端に二本鎖部分を有し、第2の末端に非二本鎖部分を有するオリゴヌクレオチドであるユニバーサルアダプターを、第1の末端によって核酸テンプレートにライゲートすることにより、ライゲートされた核酸を提供するステップと、(b)ライゲートされた核酸を標的ヌクレオチド配列のプラス鎖配列を含む第1の鎖、および標的ヌクレオチド配列のマイナス鎖配列を含む第2の鎖に解離させるステップと、(c)第1の外部プライマーは、ライゲートされた核酸の第1の鎖中の標的ヌクレオチド配列のプラス鎖配列の近傍にアニールし、かつ第2の外部プライマーは、ライゲートされた核酸の第2の鎖中の標的ヌクレオチド配列のマイナス鎖配列の近傍にアニールするステップと、(d)DNAポリメラーゼを用いて、第1の外部プライマーを、ライゲートされた核酸の第1の鎖の全長に伸長させ、かつ第2の外部プライマーを、ライゲートされた核酸の第2の鎖の全長にわたって伸長させることにより、新生プライマー伸長二本鎖を提供するステップと、(e)十分に高い温度で新生プライマー伸長二本鎖を、ライゲートされた核酸の第1の鎖及び第1の一本鎖プライマー伸長生成物と、当該核酸の第2の鎖及び第2の一本鎖プライマー伸長生成物に解離させるステップと、(f)ステップ(c)~(e)を繰り返して1つないしそれ以上のプライマー伸長サイクルを行うステップと、(g)標的ヌクレオチド配列及び相補的な標的ヌクレオチド配列のPCR増幅に十分な条件下で、第1の一本鎖プライマー伸長生成物及び第2の一本鎖プライマー伸長生成物を、DNAポリメラーゼ、ユニバーサルアダプタープライマー、第1の内部プライマー及び第2の内部プライマーに接触させるステップであって、ユニバーサルアダプタープライマーは第1の一本鎖プライマー伸長生成物及び第2の一本鎖プライマー伸長生成物におけるユニバーサルアダプターの非二本鎖部分の相補的配列にアニールし、第1の内部プライマーは3'末端において標的ヌクレオチド配列のプラス鎖配列に特異的にアニールする配列を含み、第2の内部プライマーは3'末端において標的ヌクレオチド配列のマイナス鎖配列に特異的にアニールする配列を含み、関心対象の遺伝子座について、第1の内部プライマーは第1の外部プライマーに対してネストされたものであり、かつ関心対象の遺伝子座について、第2の内部プライマーは第2の外部プライマーに対してネストされたものであるステップと、(h)ステップ(g)を繰り返して1つないしそれ以上のPCR増幅サイクルを行って、標的ヌクレオチド配列のプラス鎖配列及びマイナス鎖配列のアンプリコンを提供することにより、標的ヌクレオチド配列を富化するステップと、を含む方法を提供する。いくつかの実施形態では、第1組の外部プライマー及び第2組の外部プライマーは、少なくとも約13ヌクレオチド長の第1の5'タグ配列を含み、かつ第1組の内部プライマー及び第2組の内部プライマーは、少なくとも約13ヌクレオチド長の第2の5'タグ配列を含む。
【0069】
いくつかの実施形態では、当該方法は標的富化ステップの間に、NGSプラットフォームに対して特異的なシークエンシングプライマーと適合する配列を組み込む。いくつかの実施形態では、ユニバーサルアダプターの非二本鎖部分は、NGSプラットフォームの第1のシークエンシングプライマーの配列と同一の又は相補的な配列を含む。いくつかの実施形態では、ユニバーサルアダプタープライマーは5'末端に、NGSプラットフォームの第1のシークエンシングプライマーの配列と同一の又は相補的な配列を含む。いくつかの実施形態では、内部プライマーは5'末端において、NGSプラットフォームの第2のシークエンシングプライマーの配列と同一の又は相補的な配列を含む。いくつかの実施形態では、ステップ(g)つまりPCR増幅ステップは、標的ヌクレオチド配列のPCR増幅に十分な条件下で、一本鎖プライマー伸長生成物をDNAポリメラーゼ、ユニバーサルアダプタープライマー、内部プライマー及びシークエンシングアダプタープライマーに接触させることを含み、当該シークエンシングアダプタープライマーは、3'末端において、内部プライマーの配列と同一の配列を含み、かつ5'末端において、第2のシークエンシングプライマーの配列と同一の又は相補的な配列を含む。いくつかの実施形態では、シークエンシングアダプタープライマーは試料バーコードを含む。いくつかの実施形態では、ユニバーサルアダプタープライマーは、シークエンシングアダプタープライマーの試料バーコードと同一の又は相補的な配列を有する試料バーコードを含む。
【0070】
したがって、いくつかの実施形態では、標的ヌクレオチド配列を含有する核酸テンプレートを含む核酸試料から、関心対象の遺伝子座を有する標的ヌクレオチド配列を富化する方法(例えば次世代シークエンシングに用いられる)方法であって、(a)第1の末端に二本鎖部分を有し、第2の末端に非二本鎖部分を有するオリゴヌクレオチドであるユニバーサルアダプターを、第1の末端によって核酸テンプレートにライゲートすることにより、ライゲートされた核酸を提供するステップと、(b)ライゲートされた核酸を、標的ヌクレオチド配列(例えばプラス鎖配列又はマイナス鎖配列)を含む第1の鎖、及び第2の鎖に解離させるステップと、(c)外部プライマーは、第1の鎖中の標的ヌクレオチド配列の近傍にアニールするステップと、(d)DNAポリメラーゼを用いて、外部プライマーを、ライゲートされた核酸の第1の鎖の全長にわたって伸長させることにより、新生プライマー伸長二本鎖を提供するステップと、(e)十分に高い温度で新生プライマー伸長二本鎖を、ライゲートされた核酸の第1の鎖と一本鎖プライマー伸長生成物に解離させるステップと、(f)ステップ(c)~(e)を繰り返して1つないしそれ以上(例えば約2~100、約5~50又は約10~30)のプライマー伸長サイクルを行うステップと、(g)標的ヌクレオチド配列のPCR増幅に十分な条件下で、一本鎖プライマー伸長生成物をDNAポリメラーゼ、ユニバーサルアダプタープライマー、内部プライマー及びシークエンシングアダプタープライマーに接触させるステップであって、当該ユニバーサルアダプタープライマーは、一本鎖プライマー伸長生成物におけるユニバーサルアダプターの非二本鎖部分の相補的配列にアニールし、内部プライマーは、3'末端において標的ヌクレオチド配列に特異的にアニールする配列を含み、且つ、関心対象の遺伝子座について、内部プライマーは外部プライマーに対してネストされたものであり、ユニバーサルアダプター(例えば非二本鎖部分又は二本鎖部分)及び/又はユニバーサルアダプタープライマーの5'末端には、NGSプラットフォームの第1のシークエンシングプライマーの配列と同一の又は相補的な配列を含み、当該シークエンシングアダプタープライマーは、3'末端において内部プライマーの配列と同一の配列を含み、かつ、5'末端においてNGSプラットフォームの第2のシークエンシングプライマーの配列と同一の又は相補的な配列を含むステップと、(h)ステップ(g)を繰り返して1つないしそれ以上の(例えば約2~100、約5~50又は約10~30の)PCR増幅サイクルを行って、標的ヌクレオチド配列のアンプリコンを提供することにより、標的ヌクレオチド配列を富化するステップと、を含む方法を提供する。いくつかの実施形態では、当該方法は、ライゲートされた核酸の第1の鎖に特異的にアニールした第1組の外部プライマー及び内部プライマーと、ライゲートされた核酸の第2の鎖に特異的にアニールした第2組の外部プライマー及び内部プライマーとを用いて、関心対象の遺伝子座を有する標的ヌクレオチド配列を富化することを含む。いくつかの実施形態では、第1組の外部プライマー及び第2組の外部プライマーは、少なくとも13ヌクレオチド長の第1の5'タグ配列を含み、かつ第1組の内部プライマー及び第2組の内部プライマーは、少なくとも13ヌクレオチド長の第2の5'タグ配列を含む。
【0071】
本明細書に記載の方法は、核酸試料から関心対象の遺伝子座を有する標的ヌクレオチド配列を富化するために利用でき、当該核酸試料は、標的ヌクレオチド配列を含有する任意の数の核酸テンプレートを含み、例えば標的ヌクレオチド配列を含有する核酸テンプレートを少なくとも約2、5、10、20、50、100、200、500、1000、2000、5000、10000のうちのいずれか又はより多く含む。本明細書に記載の方法は多重のものであってもよい。本明細書に記載の方法に適用される技術用語「多重」とは、複数組の外部及び内部プライマーを用いて、同じ反応において異なる関心対象の遺伝子座を少なくとも2つ有する標的ヌクレオチド配列を特異的に富化することを意味する。いくつかの実施形態では、複数組の外部及び内部プライマーはすべて1つの反応混合物中に存在し、例えば同じ反応混合物において複数の異なるアンプリコンを産生し得る。いくつかの実施形態では、複数の標的ヌクレオチド配列中の少なくとも2つは核酸テンプレートの異なる鎖中に存在している。
【0072】
いくつかの実施形態では、複数の異なる関心対象の遺伝子座(例えば少なくとも約2、5、10、20、50、100、200、500、1000、1500、2000、5000のうちのいずれか又はより多くの関心対象の遺伝子座)を有する標的ヌクレオチド配列は富化される。いくつかの実施形態では、約2~5000個(例えば約2~100個、5~200個、100~2000個、2~2000個、101~5000個又は1500~5000個のうちのいずれか)の異なる関心対象の遺伝子座を有する標的配列は1つの反応において富化される。
【0073】
したがって、いくつかの実施形態では、標的ヌクレオチド配列を含有する核酸テンプレートを含む核酸試料から、異なる関心対象の遺伝子座を複数(例えば少なくとも約1000、1500、2000又はより多く)有する標的ヌクレオチド配列を富化する方法(例えば次世代シークエンシングに用いられる)であって、(a)第1の末端に二本鎖部分を含みかつ第2の末端に非二本鎖部分を含むオリゴヌクレオチドであるユニバーサルアダプターを核酸テンプレートにライゲートすることにより、ライゲートされた核酸を提供するステップであって、各核酸テンプレートは、第1の末端によってユニバーサルアダプターにライゲートされているステップと、(b)各ライゲートされた核酸を標的ヌクレオチド配列(例えばプラス鎖配列又はマイナス鎖配列)を含む第1の鎖、及び第2の鎖に解離させるステップと、(c)外部プライマーは、第1の鎖中の各標的ヌクレオチド配列の近傍にアニールするステップと、(d)DNAポリメラーゼを用いて、外部プライマーを第1の鎖の全長にわたって伸長させることにより、新生プライマー伸長二本鎖を提供するステップと、(e)十分に高い温度で新生プライマー伸長二本鎖を、第1の鎖と一本鎖プライマー伸長生成物に解離させるステップと、(f)ステップ(c)~(e)を繰り返して1つないしそれ以上の(例えば約2~100、約5~50、又は約10~30の)プライマー伸長サイクルを行うステップと、(g)標的ヌクレオチド配列のPCR増幅に十分な条件下で、一本鎖プライマー伸長生成物をDNAポリメラーゼ、ユニバーサルアダプタープライマー及び内部プライマーに接触させるステップであって、前記ユニバーサルアダプタープライマーは、一本鎖プライマー伸長生成物におけるユニバーサルアダプターの非二本鎖部分の相補的配列にアニールし、各内部プライマーは、3'末端において標的ヌクレオチド配列に特異的にアニールする配列を含み、かつ、各関心対象の遺伝子座について、内部プライマーは外部プライマーに対してネストされたものであるステップと、(h)ステップ(g)を繰り返して1つないしそれ以上の(例えば約2~100、約5~50又は約10~30の)PCR増幅サイクルを行って、標的ヌクレオチド配列のアンプリコンを提供することにより、標的ヌクレオチド配列を富化するステップと、を含む方法を提供する。いくつかの実施形態では、当該方法は、ライゲートされた核酸の第1の鎖に特異的にアニール可能な第1組の外部プライマー及び内部プライマーと、ライゲートされた核酸の第2の鎖に特異的にアニール可能な第2組の外部プライマー及び内部プライマーとを用いて、関心対象の遺伝子座を有する標的ヌクレオチド配列を富化することを含む。いくつかの実施形態では、第1組の外部プライマー及び第2組の外部プライマーは、少なくとも13ヌクレオチド長の第1の5'タグ配列を含み、かつ第1組の内部プライマー及び第2組の内部プライマーは、少なくとも13ヌクレオチド長の第2の5'タグ配列を含む。いくつかの実施形態では、ユニバーサルアダプタープライマーの5'末端又はユニバーサルアダプターは、NGSプラットフォームの第1のシークエンシングプライマーの配列と同一の又は相補的な配列を含む。いくつかの実施形態では、内部プライマーは、3'末端において標的ヌクレオチド配列に特異的にアニールした配列を含み、かつ5'末端においてNGSプラットフォームの第2のシークエンシングプライマーの配列と同一の又は相補的な配列を含む。いくつかの実施形態では、ステップ(g)は、標的ヌクレオチド配列のPCR増幅に十分な条件下で、一本鎖プライマー伸長生成物をDNAポリメラーゼ、ユニバーサルアダプタープライマー、内部プライマー及びシークエンシングアダプタープライマーに接触させることを含む。
【0074】
いくつかの実施形態では、当該方法は高感度であり、例えば少なくとも約70%、80%、90%、95%のうちのいずれか又はより多くの標的ヌクレオチド配列が1つないしそれ以上の配列リードによって表される。いくつかの実施形態では、当該方法は高い特異性を有し、例えば少なくとも約70%、80%、85%、90%、95%、98%のうちのいずれか又はより多くのリード配列が所望の標的ヌクレオチド配列にマッピングされる。いくつかの実施形態では、当該方法は高い均一性を有する。いくつかの実施形態では、当該方法は高い再現性を有する。いくつかの実施形態では、当該方法は少量のインプット核酸試料を必要とし、例えば約50ng以下、25ng以下、10ng以下、5ng以下、1ng以下のうちのいずれか又はより少ない核酸を必要とする。
【0075】
図1は、関心対象の遺伝子座を有する標的ヌクレオチド配列を富化する例示的な方法を示す模式図である。当該非制限的な例において、まず標的ヌクレオチド配列を含む核酸テンプレートをユニバーサルアダプターにライゲートし、核酸テンプレートの末端毎に1つのコピーをライゲートした。第1のプライマー伸長サイクルにおいて、外部プライマーはライゲートされた核酸の第1の鎖に特異的にアニールした。外部プライマーの設計方向に応じて、プラス鎖及び/又はマイナス鎖におけるアニーリング部位の上流又は下流にある配列が合成された。外部プライマープールもタイリングされるプライマー伸長生成物の提供のために使用可能である。新生一本鎖プライマー伸長生成物は3'末端に、ユニバーサルアダプターの一本鎖と相補的な全長配列を有する。次の各プライマー伸長サイクルにおいて、元のライゲートされた核酸鎖は、プライマー伸長のテンプレートとして働き続き、一本鎖プライマー伸長生成物の線形的増幅を可能にする。反対方向の各外部プライマーは、PCR増幅産物の発生を抑制しかつライゲートされた核酸の線形的増幅を促進する同じ5'タグ配列を含む。次のPCR増幅サイクルにおいて、ユニバーサルアダプタープライマー及び内部プライマーは、プライマー伸長生成物又はそのPCR増幅産物の適切な鎖に特異的にアニールすることで、標的ヌクレオチド配列の指数的増幅を可能にする。反対方向の各内部プライマーは、プライマー二量体及び望ましくない副産物の発生を抑制する同じ5'タグ配列を含む。PCR増幅サイクルは、シークエンシングプライマーと同一の又は相補的な配列を有するシークエンシングアダプタープライマーをさらに含み得る。ペアエンドシークエンシングについて、ユニバーサルアダプター又はユニバーサルアダプタープライマーは、リバースシークエンシングプライマーと同一の又は相補的な配列を有する5'部分を含みうる。これにより、NGSシークエンシングのために用意する標的ヌクレオチド配列のアンプリコンを含むシークエンシングライブラリーが得られる。
【0076】
本明細書に記載の方法によって製造された標的ヌクレオチド配列のアンプリコンを、様々方法により分析することができ、その方法は、核酸シークエンシング(例えばSangerシークエンシング又は次世代シークエンシング、本明細書において「NGS」とも呼ばれる)、マイクロアレイ分析、定量的PCR及びデジタルPCRを含むが、これらに限定されない。
【0077】
ライゲーション
第1のステップとして、本明細書に記載の方法は、ユニバーサルアダプターを核酸試料中の1つないしそれ以上の核酸テンプレートにライゲートすることを含む。いくつかの実施形態では、核酸試料は、標的ヌクレオチド配列及び非標的ヌクレオチド配列の両方を含有する核酸テンプレートを含む。いくつかの実施形態では、ユニバーサルアダプターは核酸試料中の実質的にすべての核酸テンプレートにライゲートされている。いくつかの実施形態では、ユニバーサルアダプターは、標的ヌクレオチド配列を含む標的核酸テンプレート、及び標的ヌクレオチド配列を含まない非標的核酸テンプレートの両方にライゲートされている。
【0078】
ユニバーサルアダプターと核酸テンプレートとのライゲーションは、当技術分野において既知の任意の方法、例えば平滑末端ライゲーション又はTAライゲーションによって行うことができる。いくつかの実施形態では、ユニバーサルアダプターのライゲーションの前に、核酸テンプレートの末端を平滑にするために、試料中の核酸テンプレートを核酸末端修復に供する。末端修復は当技術分野において周知であり、関連キット及び/又は酵素は市販されている(例えば、NEBNEXT(TM) End Repair Module, New England Biolabs; Ipswich, Mass.)。
【0079】
いくつかの実施形態では、ユニバーサルアダプターのライゲーションの前に、試料中の核酸テンプレートは、リン酸化及び/又はアデニル化されうる。アデニル化は、核酸テンプレートの3'末端上でアデノシンオーバーハングを提供しうる。次に、3'チミジン(T)オーバーハングを有する第2の核酸を、TAライゲーションによって第1の核酸にライゲートすることができる。TAライゲーションの方法は当技術分野において周知であり、関連キット及び/又は酵素が市販されており、例えば、NEBNEXT(TM) dA-Tailing module, New England Biolabs; Ipswich, Mass.を用いて、核酸の平滑末端をアデニル化することができる。いくつかの実施形態では、ユニバーサルアダプターは3'Tオーバーハングを含む。
【0080】
プライマー伸長
外部プライマーを用いて、ライゲートされた核酸に対して1つないしそれ以上のプライマー伸長サイクル又は線形的増幅サイクルを行う。標的ヌクレオチド配列を含む核酸テンプレートは各プライマー伸長サイクルにおいてテンプレートとして働くので、プライマー伸長サイクルは標的ヌクレオチド配列の量を線形的に増加させることができる。いくつかの実施形態では、プライマー伸長サイクルを1回又は複数回繰り返す。いくつかの実施形態では、プライマー伸長サイクルを繰り返さない。いくつかの実施形態では、当該方法は少なくとも2又はより多くのプライマー伸長サイクルを含み、例えば少なくとも約5、10、15、20、25、30のうちのいずれか又はより多くの反復プライマー伸長サイクルを含む。いくつかの実施形態では、当該方法は約2~100のプライマー伸長サイクルを含み、例えば約5~50、約5~30、約5~20、約10~20、約10~15、約15~30、約30~50又は約10~30のうちのいずれかのプライマー伸長サイクルを含む。各プライマー伸長サイクルは、1)鎖の分離(例えば熱変性)、2)標的ヌクレオチド配列を含むライゲートされた核酸の第1の鎖への外部プライマーのアニーリング、及び、3)アニールしたプライマーの核酸ポリメラーゼによる伸長のステップ、を含む。これらのステップの各々にとって必要な条件及び時間は、当業者によって考案されうる。プライマー伸長サイクルはサーマルサイクラーにおいて行うことができ、その多くは市販されている。
【0081】
各プライマー伸長サイクルは、一般に反応混合物の加熱を含む鎖の解離又は分離ステップを含む。本明細書において用いられる「鎖の分離」、「鎖の解離」又は「融解」とは、相補的二本鎖分子を、オリゴヌクレオチドプライマーにアニールするために利用することができる2つの一本鎖へと分離する核酸試料の処置を意味する。いくつかの実施形態では、二本鎖プライマー伸長生成物の解離は、十分に高い温度でプライマー伸長反応混合物を加熱することにより行われる。いくつかの実施形態では、十分に高い温度は、プライマー伸長鎖の融解温度(Tm)よりも高い。いくつかの実施形態では、十分に高い温度は少なくとも約90℃であり、例えば少なくとも約91℃、92℃、93℃、94℃、95℃、96℃又は97℃のうちのいずれかであってもよい。いくつかの実施形態では、十分に高い温度は約90℃~97℃である。いくつかの実施形態では、二本鎖プライマー伸長生成物は、当該二本鎖プライマー伸長生成物の変性温度を上昇または低下させることができる試薬の存在下で解離される。二本鎖プライマー伸長生成物の変性温度を上昇または低下させることができる代表的な試薬は、塩及びDMSOを含むが、これらに限定されない。いくつかの実施形態では、外部プライマーとライゲートされた核酸の第1の鎖との間のアニーリングのための条件は、プライマーの長さ及び配列と共に変化し得る。いくつかの実施形態では、アニーリングのための条件は外部プライマーのTm(例えば計算されるTm)に基づく。いくつかの実施形態では、プライマー伸長サイクルのアニーリングステップは、そのようなアニーリングを可能にするために十分な期間、鎖分離ステップ後の温度を外部プライマーのTm(例えば計算されるTm)に基づく温度までに低下させる段階を伴う。
【0082】
いくつかの実施形態では、プライマー伸長サイクルの間にプライマーアニーリングを行うことができる時間は、反応の体積に依存し、体積がより大きければより長い時間を必要とするが、プライマー及びテンプレートの濃度にも依存して、テンプレートに対するプライマーの相対的濃度がより高ければ、相対的濃度が低い場合より必要な時間は短くなる。いくつかの実施形態では、プライマー伸長サイクルは、二本鎖核酸を解離するために十分に高い温度(例えば90℃~95℃)までに徐々に加熱して、続いてプライマー伸長の前に、プライマー伸長のための温度(例えば60℃)までに徐々に冷却することを含む。いくつかの実施形態では、約1℃/秒以下、0.8℃/秒以下、0.7℃/秒以下、0.6℃/秒以下、0.5℃/秒以下、0.4℃/秒以下、0.3℃/秒以下、0.2℃/秒以下、0.1℃/秒以下のうちのいずれか又はより低い連続的な温度差でプライマー伸長反応を徐々に加熱又は冷却する。
【0083】
ポリメラーゼ伸長ステップでは、鋳型核酸配列と相補的であるプライマー伸長生成物を形成するためにヌクレオチド三リン酸の鋳型依存的重合化を触媒する核酸ポリメラーゼの使用が必要である。核酸ポリメラーゼはアニールしたプライマーの3'末端で合成を開始して、鋳型の5'末端に向かう方向に合成を行う。いくつかの実施形態では、核酸ポリメラーゼは熱安定性であり、つまり相補的核酸のアニールした鎖を変性させるために十分な温度(例えば94℃又はより高い温度)に供された後でも機能を維持することができる。いくつかの実施形態では、前記核酸ポリメラーゼはDNAポリメラーゼである。
【0084】
多くの核酸ポリメラーゼは当技術分野で既知であり、かつ市販されている。いくつかの実施形態では、核酸ポリメラーゼはDNAポリメラーゼ I、Taq ポリメラーゼ、Pheonix Taq ポリメラーゼ、PHUSION(R)ポリメラーゼ、T4 ポリメラーゼ、T7 ポリメラーゼ、klenow断片、Klenow exo-、phi29 ポリメラーゼ、AMV逆転写酵素、M-MuLV 逆転写酵素、HIV-1 逆転写酵素、VERASEQ(TM) ULtra ポリメラーゼ、VERASEQ(TM) HF2.0 ポリメラーゼ、ENZSCRIPT(TM)又は別の適切なポリメラーゼである。いくつかの実施形態では、核酸ポリメラーゼは逆転写酵素ではない。いくつかの実施形態では、核酸ポリメラーゼはDNAテンプレートに作用する。いくつかの実施形態では、Taq DNAポリメラーゼ(例えば、PLATINUM(TM) Taq)はプライマー伸長サイクルに用いられる。
【0085】
いくつかの実施形態では、核酸テンプレートはRNAテンプレートであり、かつDNAポリメラーゼ又はDNAポリメラーゼ以外のRNAテンプレートに作用する核酸ポリメラーゼを代替してプライマー伸長サイクルに用いられる。いくつかの実施形態では、伸長反応はRNAに逆転写を行って相補的なDNA分子を生成することを含む(「RNA依存性DNAポリメラーゼ活性」)。いくつかの実施形態では、逆転写酵素はマウスモロニーマウス白血病ウイルスポリメラーゼ、AMV逆転写酵素、RSV逆転写酵素、HIV-1逆転写酵素、HIV-2逆転写酵素又は別の適切な逆転写酵素である。
【0086】
いくつかの実施形態では、ポリメラーゼ伸長は、アニールしたオリゴヌクレオチドプライマーの伸長を可能にする条件で行われる。本明細書において用いられる技術用語「ポリメラーゼ伸長」とは、核酸ポリメラーゼによる、アニールしたプライマーの3'末端への少なくとも1つの相補的ヌクレオチドの鋳型依存的組み込みを意味する。ポリメラーゼ伸長は好ましくは、1つ以上のヌクレオチド、好ましくは鋳型の完全長に対応するヌクレオチドまでおよび完全長を含むヌクレオチドを付加する。これらの条件は、例えば適切な温度、塩及び補因子濃度、pH及び酵素濃度を含む。いくつかの実施形態では、このような条件は少なくとも部分的に用いられる核酸ポリメラーゼに基づく。いくつかの実施形態では、ポリメラーゼは適切な反応調製物中でプライマー伸長反応を行うことができる。いくつかの実施形態では、適切な反応調製物は、1種又は複数種の塩(例えば1mM~100mMのKCl、0.1mM~10mMのMgCl)、少なくとも1種の緩衝剤(例えば1mM~20mMのTris-HCL)、及びキャリア(例えば0.01%~0.5%のBSA)、並びに1種又は複数種のヌクレオチド三リン酸(例えば10μM~200μMのdATP、dTTP、dCTP及びdGTPのうちのいずれか1つ)を含有する。ポリメラーゼ伸長のために用いられる温度は、一般的に、酵素の公知の活性特性に基づく。アニーリング温度が例えば酵素の至適温度より下である必要がある場合、より低い伸長温度を用いることが容認可能である。一般には、酵素は、その至適伸長温度より下でも少なくとも部分的に活性を保持するが、最も一般的に用いられる熱安定性ポリメラーゼ(例えばTaqポリメラーゼ及びその変種)によるポリメラーゼ伸長は60℃~75℃で行われる。1つの非制限的な条件セットは、60℃(当該温度で、ポリメラーゼ、例えばPLATINUM(TM) Taq ポリメラーゼはプライマー伸長を触媒する)で50mM KCl、10mM Tris-HCl(25℃depH 8.8)、0.5mM~3mM MgCl2、200μM各dNTP、及び 0.1%BSAである。
【0087】
プライマー伸長サイクルのポリメラーゼ伸長ステップは、ライゲートされた核酸の第1の鎖の全長にわたるプライマー伸長を可能にするように、例えばユニバーサルアダプターの第1の鎖の5'末端までに伸長するように、十分な時間にわたって継続することができる。ポリメラーゼ伸長ステップの十分な時間は、ライゲートされた核酸の平均長さ及びポリメラーゼ速度によって決定できる。いくつかの実施形態では、ポリメラーゼ伸長ステップの時間は少なくとも約2分間、4分間、6分間、8分間、10分間、15分間のうちのいずれか又はより長い時間である。
【0088】
Taqポリメラーゼ(例えばPLATINUM(TM) Taq)を用いてプライマー伸長を行う態様の1つの非制限的例示は、95℃で5分間保持し、次に、+0.2℃/秒の速度で温度を95℃までに上昇させ、95℃で10秒間融解し、-0.2℃/秒の速度で温度を60℃までに下げてアニールし、かつ60℃で10分間伸長させることを10~30サイクル行い、次に、4℃で反応を停止させるという条件で行われる。すなわち。一方、その他の適切な反応条件を利用することもできる。いくつかの実施形態では、塩濃度の差を解消するようにアニーリング/伸長温度を調整することができる(例えば高い塩濃度では温度を3℃高くする)。
【0089】
PCR増幅
ユニバーサルアダプタープライマーと内部プライマーと必要に応じてシークエンシングアダプタープライマーを用いて、一本鎖プライマー伸長生成物に対して1つないしそれ以上のポリメラーゼ連鎖反応(PCR)増幅サイクルを行う。前のポリメラーゼ伸長生成物は連続的サイクル伸長のテンプレートとして使用されているので、PCR増幅サイクルは標的ヌクレオチド配列の量を指数的に増加させることができる。いくつかの実施形態では、当該方法は少なくとも2以上のPCR増幅サイクルを含み,例えば少なくとも約5、10、15、20、25、30のうちのいずれか又はより多くの反復PCR増幅サイクルを含む。いくつかの実施形態では、当該方法は約2~100のPCR増幅サイクルを含み、例えば約5~50、約5~30、約5~20、約10~20、約10~15、約15~30、約30~50又は約10~30のうちのいずれかのPCR増幅サイクルを含む。各PCR増幅サイクルは、1)鎖の分離(例えば熱変性)、2)鋳型分子へのユニバーサルアダプタープライマー及び内部プライマーのアニーリング、および、3)アニールしたプライマーの核酸ポリメラーゼによる伸長の段階を含む。これらの段階の各々にとって必要な条件および時間は、当業者によって考案されうる。PCR増幅サイクルはサーマルサイクラーにおいて行うことができ、その多くは市販されている。
【0090】
PCR増幅サイクルのための各段階の条件(例えば酵素、塩、緩衝液、温度等)は、プライマー伸長サイクル中の対応する段階の条件と同じ又は実質的に同じであってもよい。「プライマー伸長」節に記載のいずれかの核酸ポリメラーゼ、緩衝条件、鎖の解離温度及びポリメラーゼ伸長時間はすべて、PCR増幅サイクルに適用し得る。いくつかの実施形態では、PCR増幅サイクルに使用される核酸ポリメラーゼは、プライマー伸長サイクルに使用される核酸ポリメラーゼと同じである。いくつかの実施形態では、PCR増幅サイクルに使用される核酸ポリメラーゼは、プライマー伸長サイクルに使用される核酸ポリメラーゼと異なる。いくつかの実施形態では、核酸ポリメラーゼはDNAポリメラーゼである。いくつかの実施形態では、Taqポリメラーゼ(例えばPLATINUM(TM) Taq)をPCR増幅サイクルに用いる。いくつかの実施形態では、PCR増幅サイクルの伸長時間は、プライマー伸長サイクルの伸長時間と同じである。いくつかの実施形態では、PCR増幅サイクルの伸長時間は、プライマー伸長サイクルの伸長時間と異なる。
【0091】
増幅態様の1つの非制限的な例は、95℃で5分間保持し、次に、95℃で30秒間融解することを10~25サイクル行い、次に、60℃でアニールして5分間伸長させ、次に反応を4℃で保持するという条件でポリメラーゼ(例えば、PLATINUM(TM) Taq ポリメラーゼ)を用いる。一方、その他の適切な反応条件を利用することもできる。いくつかの実施形態では、塩濃度の差を解消するようにアニーリング/伸長温度を調整することができる(例えば高い塩濃度では温度を3℃高くする)。
【0092】
その他のステップ
本明細書に記載の方法はその他のステップを含んでもよく、断片化、酵素消化及び/又はクリーンアップステップを含むが、これらに限定されない。
【0093】
本明細書に記載の方法に適するNGSシークエンシング方法の多くは、何十個から何百個ものヌクレオチド塩基の最適なリード長でのシークエンシング実行を提供する(例えばION TORRENT(TM)技術は、200bp~400bpのリード長を生じ得る)。例えば、所定のシークエンシング技術の最適なリード長が200bpである場合に、本明細書に記載の方法による標的ヌクレオチド配列のアンプリコンは、約800bp以下、700bp以下、600bp以下、500bp以下、400bp以下、300bp以下、約200bp以下のうちのいずれか又はより短い平均長さを有することができる。いくつかの実施形態では、ユニバーサルアダプター、外部及び内部プライマー及び/又はユニバーサルアダプタープライマーは、特定のシークエンシング技術に用いられる適切な長さのアンプリコンを提供するために設計される。いくつかの実施形態では、当該方法は、ライゲーションステップの前に核酸テンプレートを断片化するか、又はプライマー伸長生成物或いは標的ヌクレオチド配列のアンプリコンを断片化する。本明細書において用いられるポリヌクレオチドの「断片化」とは、ポリヌクレオチドを異なるポリヌクレオチド断片に分解することを意味する。断片化は、例えば剪断または酵素反応によって行われる。いくつかの実施形態では、核酸テンプレートは、次世代シークエンシングに適するサイズに断片化される。
【0094】
いくつかの実施形態では、本明細書に記載の方法中のステップ(例えば、プライマー伸長、PCR増幅、又はシークエンシングの前)に由来する核酸テンプレート又は核酸産物は、任意の所望のサイズの断片を生成するように剪断、例えば機械的又は酵素的に剪断されうる。いくつかの実施形態では、核酸テンプレートは超音波処理によって機械的に剪断される。いくつかの実施形態では、核酸テンプレートは剪断又は酵素消化されていない。いくつかの実施形態では、本明細書に記載の方法中のステップ(例えばプライマー伸長、PCR増幅、又はシークエンシングの前)に由来する核酸産物は、剪断又は酵素消化されていない。いくつかの実施形態では、核酸テンプレートは、約1kb以下、800bp以下、700bp以下、600bp以下、500bp以下、400bp以下、300bp以下、約200bp以下のうちのいずれか又はより小さい平均サイズに断片化される。
【0095】
ゲノムDNA(例えば染色体)、mRNA及びcDNAの全長又は長い断片は、ライゲーションステップの前に任意の所望の断片を生成するように剪断、例えば機械的又は酵素的に剪断されうる。機械的剪断方法の非制限的な例には、超音波処理、噴霧化、及びCovaris, Woburn, Mass.から入手できるAFA(TM)剪断技術が挙げられる。いくつかの実施形態では、超音波処理によってゲノムDNAを機械的に剪断して適切な長さの核酸テンプレートにする。いくつかの実施形態では、核酸テンプレートがRNA由来のcDNAである場合に、当該RNA試料を逆転写に供してcDNAを生成することができ、その後cDNAテンプレートを剪断に供することができる。いくつかの実施形態では、逆転写の前にRNAを剪断することができる。
【0096】
いくつかの実施形態では、当該方法は、ライゲーションステップ、プライマー伸長サイクル及び/又はPCR増幅サイクルの後に未反応のアダプター及びプライマー、ポリメラーゼ及びヌクレオチドを除去するために、1つないしそれ以上のクリーンアップステップを含む。いくつかの実施形態では、ライゲートされた核酸はプライマー伸長サイクル(例えばステップ(b))の前にクリーンアップ工程に供される。いくつかの実施形態では、プライマー伸長生成物は、PCR増幅サイクル(例えばステップ(g))の前にクリーンアップ工程に供される。核酸クリーンアップ工程は当技術分野で既知であり、プライマー伸長生成物及びPCR増幅産物をクリーンアップするためのキットは市販されており、例えばBeckman Coulter製のAMPURE(R)ビーズが挙げられる。
【0097】
いくつかの実施形態では、当該方法はさらに、「核酸試料」節に記載の生体試料及び/又は核酸試料を獲得、加工又は調製するためのいずれか1つ又は複数のステップを含む。
【0098】
プライマー及びアダプター
本明細書に記載の方法ではオリゴヌクレオチドアダプター及びプライマーが用いられており、ユニバーサルアダプター、ネストされた標的特異的プライマー(つまり外部プライマー及び内部プライマー)、ユニバーサルアダプタープライマー及びシークエンシングアダプタープライマー、並びに特定のNGSプラットフォームに適するシークエンシングプライマーを含む。本明細書に記載のプライマー及びアダプターは、高い特異性、感度、効率(例えばライゲーション、プライマー伸長、PCR増幅又はNGSシークエンシング)、及び/又はあるタイプの配列(例えば高いGC含有量の配列)に対して少ないバイアスを実現するために、特別に設計及び最適化することができる。
【0099】
本明細書に記載のプライマーは、鋳型核酸中の既知のヌクレオチド配列に特異的にアニールするように設計される。いくつかの実施形態では、プライマーは鋳型核酸中の鎖と相補的又は実質的に相補的な配列を含み、前記プライマーは前記鋳型核酸に特異的にアニールする。いくつかの実施形態では、プライマー中の鋳型核酸にハイブリダイズする配列は配列の3'末端にある。
【0100】
本明細書に使用されるプライマーは一般に一本鎖であり、かつプライマー及びその相補体はアニールして二本鎖ポリヌクレオチドを形成することができる。いくつかの実施形態では、プライマーの長さは約300ヌクレオチドを超えず、例えば長さは約300以下、250以下、200以下、150以下、100以下、90以下、80以下、70以下、60以下、50以下、40以下、30以下、20以下、15以下のうちのいずれか又はより少ないヌクレオチドであり、ただし、長さは少なくとも約10ヌクレオチドである。
【0101】
いくつかの実施形態では、本明細書に記載のプライマー(例えば外部プライマー及び内部プライマー、ユニバーサルアダプタープライマー及び/又はシークエンシングアダプタープライマー)は、約55~72℃、60~72℃、約60~70℃、約62~69℃、約63~67℃又は約64~66℃のうちのいずれかのアニーリング温度でその相補的配列に特異的にアニールすることができるように設計される。いくつかの実施形態では、本明細書に記載のプライマーは、約72℃未満、70℃未満、68℃未満、65℃未満又は60℃未満のいずれかのアニーリング温度でその相補的配列に特異的にアニールすることができるように設計される。プライマーのアニーリング温度(融解温度又はTmとも呼ばれる)は、様々なアルゴリズム(例えばMolecular Biology Insights Inc. Colorado社のOLIGO(TM)プライマー設計ソフトウェア、及び、Invitrogen, Inc. California社のVENTRO NTI(TM)プライマー設計ソフトウェア、並びに、Primer3、Oligo Calculator及びPremier Biosoft; Palo Alto, CA社のNetPrimerを含むインターネットから入手可能なプログラム)のいずれかによって決定されうる。いくつかの実施形態では、プライマーのTmは、式:Tm = AH/(AS + R * ln(C/4))+ 16.6 log ([K+]/(l + 0.7 [K+]))-273.15を用いて計算することができ、ここで、ΔHはヘリックス形成のためのエンタルピーであり、ASは、ヘリックス形成のためのエントロピーであり、Rはモル気体定数(1.987cal/℃×mol)であり、Cは核酸濃度であり、かつ[K+]は塩濃度である。Frieir et al. PNAS 1986 83:9373-9377を参照されたい。
【0102】
以下の設計原理のいずれか1つ以上を利用してプライマーの設計を最適化することができる。例えば、低カバレッジのために、高いGC含有量の配列を含む標的ヌクレオチド配列を富化することが困難である場合、プライマーは隣接の配列をカバーするように設計されうる。プライマーの二次構造を減少させてかつそのハイブリダイゼーション効率を高めるために、プライマー配列を修飾することもできる。同じカテゴリー中の異なるプライマーの融解ハイブリダイズキネティクスをバランスするために、プライマー長又はプライマー中の鋳型特異的にハイブリダイズする部分の長さを修飾することができる。異なる結合効率を得るために、同じ標的領域のフォワード鎖及びリバース鎖に用いられる異なる配向プライマーを修飾することができる。
【0103】
アダプター及びプライマーは、当該方法の各ステップ中においていずれも適切な濃度で使用される。いくつかの実施形態では、本願は、ユニバーサルアダプター、外部プライマー、内部プライマー、ユニバーサルアダプタープライマー及び必要に応じてシークエンシングアダプタープライマーのうちのいずれか2つ又はより多くのものの濃度比を最適化している。例えばいくつかの実施形態では、ユニバーサルアダプターと外部プライマーの濃度比は、約5000:1以下、1000:1以下、100:1以下、50:1以下、20:1以下、10:1以下、5:1以下、4:1以下、3:1以下、2:1以下、1:1以下のうちのいずれか又はより小さい濃度比である。いくつかの実施形態では、2つの異なる外部プライマーの濃度比は約1:4~約4:1、約1:3~約3:1、約1:2~約2:1、約2:3~約3:2、又は約1:1のうちのいずれかである。いくつかの実施形態では、2つの異なる内部プライマーの濃度比は約1:4~約4:1、約1:3~約3:1、約1:2~約2:1、約2:3~約3:2、又は約1:1のうちのいずれかである。例えば、比較的高濃度の内部及び/又は外部プライマーは、比較的富化し難い標的ヌクレオチド配列に使用しうる。いくつかの実施形態では、ユニバーサルアダプタープライマーと内部プライマーの濃度比は、約5000:1以下、1000:1以下、100:1以下、50:1以下、20:1以下、10:1以下、5:1以下、4:1以下、3:1以下、2:1以下、1:1以下のうちのいずれか又はより小さい濃度比である。いくつかの実施形態では、個々の外部プライマーと対応する内部プライマーの濃度比は約1:4~約4:1、約1:3~約3:1、約1:2~約2:1、約2:3~約3:2、又は約1:1のうちのいずれかである。例えば、ある関心対象の遺伝子座を有する標的ヌクレオチドのカバレッジを増加又は減少させるために、異なる外部プライマー組と内部プライマー組の相対的濃度を調整することができる。
【0104】
いくつかの実施形態では、富化される標的ヌクレオチド配列はNGSのために用意される。標的ヌクレオチド配列の決定、配列変異体の検出及び下記III節、IV節に記載の診断方法のいくつかの実施形態では、当該方法は、第1のシークエンシングプライマー及び第2のシークエンシングプライマーの使用に依存するシークエンシングステップを含む。いくつかの実施形態では、本明細書に記載の次世代シークエンシング方法に適合するように、第1及び第2のシークエンシングプライマーを選択する。いくつかの実施形態では、第1のシークエンシングプライマーは、ILLUMINA(R)に基づくシークエンシング技術に用いられるP5配列を含み、かつ第2のシークエンシングプライマーは、ILLUMINA(R)に基づくシークエンシング技術に用いられるP7配列を含むか、又は、第2のシークエンシングプライマーは、ILLUMINA(R) に基づくシークエンシング技術に用いられるP5配列を含み、かつ第1のシークエンシングプライマーは、ILLUMINA(R)に基づくシークエンシング技術に用いられるP7配列を含む。いくつかの実施形態では、第1のシークエンシングプライマーは、ION TORRENT(TM)シークエンシング技術に適合するPI配列を含み、かつ第2のシークエンシングプライマーは、ION TORRENT(TM)シークエンシング技術に適合するA配列を含むか、又は、第2のシークエンシングプライマーは、ION TORRENT(TM) シークエンシング技術に適合するA 配列を含み、かつ第1のシークエンシングプライマーは、ION TORRENT(TM)シークエンシング技術に適合するPI配列を含む。ユニバーサルアダプター及び/又はユニバーサルアダプタープライマーは、第1のシークエンシングプライマーの配列と同一の又は相補的な配列を含みうる。内部プライマー及び/又はシークエンシングアダプタープライマーは、第2のシークエンシングプライマーの配列と同一の又は相補的な配列を含みうる。当業者は、ユニバーサルアダプター、ユニバーサルアダプタープライマー、内部プライマー及び/又はシークエンシングアダプタープライマー中の配列の、第1又は第2のシークエンシングプライマーに対する方向を選択して、適切な方向にそのような配列を有するアンプリコンをペアエンドシークエンシングのために提供することができる。
【0105】
いくつかの実施形態では、プライマー及び/又はアダプターは、修飾されたヌクレオチド又は非天然型ヌクレオチドを含まない。いくつかの実施形態では、プライマー及び/又はアダプターは、修飾された塩基又は非天然型塩基を含む。いくつかの実施形態では、プライマー及び/又はアダプターは、検出可能なシグナルを直接又は間接的に提供できる標識物質で修飾される。このような標識物質の非制限的な例としては、放射性同位体、蛍光分子、ビオチンなどが挙げられる。いくつかの実施形態では、プライマー及び/又はアダプターは、ビオチンリンカー又は他の適切なリンカーを含む(例えば、プライマーを支持体に結合させるために用いられる)。いくつかの実施形態では、プライマー及び/又はアダプターは、適切な酵素による切断を可能にするために、ヌクレアーゼ切断部位を含む。他の実施形態では、プライマーの5'末端には、ビーズ又は他の支持体(例えばフローセル基質)に結合された核酸と相補的な配列を含む。いくつかの実施形態では、プライマー及び/又はアダプターは、修飾されたヌクレオチド間結合、例えばホスホロチオエートを含む。
【0106】
任意の適切な方法によってアダプター及びプライマーを合成することができる。いくつかの実施形態では、多数の企業が、本明細書に記載の方法及び組成物に従うプライマーを提供するために適したオリゴヌクレオチド合成サービス、例えばLife Technologies, Grand Island, NY社のINVITROGEN(TM) Custom DNA Oligos、又はIDT, Coralville, IA社のカスタムDNA Oligosを提供する。いくつかの実施形態では、アダプター及びプライマーのうちのいずれかは、2つ以上のアダプター及びプライマー部分をライゲートすることにより調製することができる。
【0107】
ユニバーサルアダプター及びユニバーサルアダプタープライマー
本明細書に用いられるユニバーサルアダプターは、第1の末端にライゲート可能な二本鎖部分を含み、かつ第2の末端に非二本鎖部分を含むオリゴヌクレオチドである。いくつかの実施形態では、ユニバーサルアダプターは、2つの別々の鎖、つまり第1の鎖及び第2の鎖を有する。いくつかの実施形態では、ユニバーサルアダプターは第1の鎖及び第2の鎖を含む。ユニバーサルアダプターの第1の鎖とは、3'末端がユニバーサルアダプターの第1の末端(つまりライゲート可能な末端)にある鎖を指す。ユニバーサルアダプターの第2の鎖とは、5'末端がユニバーサルアダプターの第1の末端(つまりライゲート可能な末端)にある鎖を指す。
【0108】
いくつかの実施形態では、第1の鎖は、5'非対合部分、3'対合部分及び3'Tオーバーハングを含む。いくつかの実施形態では、第2の鎖は、3'非対合部分及び5'対合部分を含む。いくつかの実施形態では、ユニバーサルアダプターの非二本鎖部分は一本鎖であり、例えば第1の鎖の5'非対合部分が挙げられる。いくつかの実施形態では、第2の鎖の全体は対合している。第1の鎖及び第2の鎖の対合部分は実質的に相補的であり、かつライゲート可能な二本鎖部分及び3'Tオーバーハングを含む第1の末端を形成し、かつ二本鎖部分はライゲーション温度で二本鎖型を保つのに十分な長さである。
【0109】
いくつかの実施形態では、ユニバーサルアダプターは「Y」形状を有し、つまり非対合部分は第1の鎖及び第2の鎖の一部を含む。第2の鎖の非対合部分の長さは、第1の鎖の非対合部分より短いか、長いか、或いは同じであってもよい。いくつかの実施形態では、第2の鎖の非対合部分は、第1の鎖の非対合部分より短いものであってもよい。Y形状のユニバーサルアダプターは、第2の鎖の非対合部分がPCR増幅ステップにおいて増幅されないというメリットを有する。
【0110】
いくつかの実施形態では、ユニバーサルアダプターの第2の鎖は、第1の鎖の5'非対合部分と実質的に相補的でない3'非対合部分を含み、かつ第2の鎖の3'非対合部分は、他の任意のプライマーと実質的に相補的でないか、又は実質的に同一ではない。いくつかの実施形態では、ユニバーサルアダプターの第2の鎖は、アニーリング温度で第1の鎖の5'非対合部分に特異的にアニールしない3'非対合部分を含み、かつ第2の鎖の3'非対合部分は、アニーリング温度で他の任意のプライマー又はその相補的配列に特異的にアニールしない。
【0111】
いくつかの実施形態では、ユニバーサルアダプターはヘアピン構造であり、その非二本鎖部分はループ構造である。いくつかの実施形態では、増幅鎖の非対合5'部分とブロック鎖の非対合3'部分は互いに連結している。いくつかの実施形態では、ループ構造ははまず酵素によって切断され、次にライゲートされた核酸はプライマー伸長ステップの前に2つの別々の鎖に解離される。
【0112】
いくつかの実施形態では、ユニバーサルアダプターの二本鎖部分(例えばいずれか1つ又は2つの鎖の対合部分)の長さは、少なくとも約7塩基対であり、例えば長さが少なくとも約7bp、8bp、9bp、10bp、11bp、12bp、13bp、14bpのうちのいずれか又はよい長い。いくつかの実施形態では、ユニバーサルアダプターの二本鎖部分の長さは約18bpを超えず、例えば長さが約17bp以下、16bp以下、15bp以下、14bp以下、13bp以下、12bp以下のうちのいずれか又はより短い。いくつかの実施形態では、ユニバーサルアダプターの二本鎖部分の長さは約14bpを超えない。ユニバーサルアダプターの二本鎖部分は、所望のアンプリコンのプライマー伸長及び/又はPCR増幅を阻害しないように、長すぎてはならない。また、図3に示すようなインフレーションUMI複雑さの問題を軽減するように、ユニバーサルアダプターの二本鎖部分の長さを制限することができる。
【0113】
いくつかの実施形態では、ユニバーサルアダプターの非二本鎖部分は、NGSプラットフォームの第1のシークエンシングプライマーの配列と同一の又は相補的な配列を含む。いくつかの実施形態では、ユニバーサルアダプターの第1の鎖の非対合5'部分は、NGSプラットフォームの第1のシークエンシングプライマーの配列と同一の又は相補的な配列を含む。いくつかの実施形態では、ユニバーサルアダプターの二本鎖部分の第1の鎖は、NGSプラットフォームの第1のシークエンシングプライマーの配列と同一の又は相補的な配列を含む。
【0114】
いくつかの実施形態では、ユニバーサルアダプターはバーコードを含む。いくつかの実施形態では、ユニバーサルアダプターの二本鎖部分はバーコードを含む。次世代シークエンシング応用におけるバーコードの使用は当技術分野で周知であり、かつ例えばMargulies, M. et al. 「Genome Sequencing in Microfabricated. High-Density Picoliter Reactors」, Nature, 437, 376-80 (2005); Mikkelsen, T. et al. 「Genome-Wide Maps of Chromatin State in Pluripotent and Lineage-Committed. Cells」, Nature, 448, 553-60 (200); McLaughlin, S. et al, 「Whole-Genome Resequencing With Short Reads; Accurate Mutation Discovery With Mate Pairs and Quality Values」, ASHG Annual Meeting (2007); Shendure I. et al. 「Accurate Multiplex Polony Sequencing of an Evolved Bacterial Genome」, Science, 309, 1728-32 (2005); Harris, T. et al. 「Single-Molecule DNA Sequencing of a Viral Genome」 Science, 320, 106-9 (2008); Simen, B. et al, 「Prevalence of LOW Abundance Drug Resistant Variants by Ultra Deep Sequencing in Chronically HIV-infected Antiretroviral (ARV) Naive Patients and the impact on Virologic Outcomes」, 16th International HIV Drug Resistance Workshop, Barbados (2007); Thomas, R. et al. 「Sensitive Mutation Detection in Heterogeneous Cancer Specimens by Massively Parallel Picoliter Reactor Sequencing」, Nature Med., 12, 852-855 (2006); Mitsuya, Y et al. 「Minority Human Immunodeficiency Virus Type I Variants in Antiretroviral-Naive Persons With Reverse Transcriptase Codon 215 Revertant Mutations」, I. Vir., 82, 10747-10755 (2008); Binladen, J. et al. 「The Use of Coded PCR Primers Enables High-Throughput Sequencing of Multiple HomologAmplification Products by 454 Parallel Sequencing」, PLoS ONE, 2, e197 (2007); および、Hoffmann, C. et al. 「DNA Bar Coding and Pyrosequencing to Identify Rare HIV Drug Resistance Mutations」, Nuc. Acids Res., 35, e91 (2007)などの文献に報告されている。これらの文献はすべて参照により本明細書に組み入れられる。
【0115】
いくつかの実施形態では、ユニバーサルアダプターは、ランダム及び/又は縮重設計された核酸塩基を含有する分子バーコードを含む。分子バーコードは、「ユニーク分子インデックス」又は「UMI」とも呼ばれる。分子バーコードを含有する複数のユニバーサルアダプターを含む組成物において、各ユニバーサルアダプター中の分子バーコードは異なっていてもよく、なぜなら、ランダムに設計(つまり4つの核酸塩基A、C、T、Gのうちのいずれか1つ)又は縮重設計(つまり少なくとも2つのタイプの核酸塩基のうちの1つを1セット含み、例えばB=C/G/T、D=A/G/T、H=A/C/T、V=A/C/G、W=A/T、S=C/G、R=A/G、Y=C/T)されたヌクレオチドを含むヌクレオチド配列を含有するからである。したがって、分子バーコードを用いて、同じ核酸テンプレート由来のアンプリコンのシークエンシングリードを整列させることによって、プライマー伸長及び/又はPCR増幅サイクルによる誤差の補正を可能にする。分子バーコードはさらに、組成物中のすべてのユニバーサルアダプターと同じアイデンティティを有するヌクレオチド(つまり「一定」又は特異的に設計されたヌクレオチド)を含みうる。一定の核酸塩基を、ランダム又は縮重設計された配列の任意の側に位置させるか、又は、ランダム又は縮重設計されたヌクレオチドの間に散在させることができる。いくつかの実施形態では、分子バーコードは、ランダム及び/又は縮重設計された核酸塩基を少なくとも約5個(例えば少なくとも約10個、15個、20個又は25個のうちのいずれか)有する。いくつかの実施形態では、分子バーコードは、一定の(つまり特異的に設計された)核酸塩基を少なくとも約1個、2個、3個、4個、5個、6個、7個、8個、9個、10個のうちのいずれか又はより多く有する。いくつかの実施形態では、分子バーコードはランダムに設計、縮重設計又は一定の核酸塩基の混合物である。分子バーコードにおいて、ランダム及び/又は縮重設計された核酸塩基の数は、核酸試料の複雑さによる。いくつかの実施形態では、ユニバーサルアダプターの非二本鎖部分は分子バーコードを含む。いくつかの実施形態では、分子バーコードは一本鎖である。いくつかの実施形態では、ユニバーサルアダプターの第1の鎖は、非対合部分の3'末端に分子バーコードを含む。いくつかの実施形態では、分子バーコードは二本鎖である。いくつかの実施形態では、ユニバーサルアダプターの二本鎖部分は分子バーコードを含む。
【0116】
いくつかの実施形態では、ユニバーサルアダプターの二本鎖部分は試料バーコードを含む。試料バーコードは、各核酸試料から1つないしそれ以上の関心対象の遺伝子座を標的富化するために使用し得る。いくつかの実施形態では、前記方法は、複数の核酸試料から標的ヌクレオチド配列を富化することを含み、核酸試料の各々はステップ(a)~(h)に供され、かつ核酸試料の各々は異なる試料バーコードを含む1つのユニバーサルアダプターを使用する。いくつかの実施形態では、試料バーコードを含むユニバーサルアダプターを各核酸試料中の核酸テンプレートにライゲートし、かつ異なるバーコード試料由来のライゲートされた産物をプールしながら、プライマー伸長サイクル及びPCR増幅試料に供し、これにより得られたアンプリコンの各々は、アンプリコンがどの核酸試料に由来するかを標識する試料バーコードを含む。いくつかの実施形態では、試料バーコードは、少なくとも約3、4、5、6、8、10、12、15のうちのいずれか又はより多くの一定のヌクレオチドを含む。いくつかの実施形態では、試料バーコードは、約4~15、4~13、5~12、5~10又は6~10のうちのいずれかの一定したヌクレオチドを有する。いくつかの実施形態では、ユニバーサルアダプターの非二本鎖部分は試料バーコードを含む。いくつかの実施形態では、ユニバーサルアダプターの二本鎖部分は試料バーコードを含む。いくつかの実施形態では、試料バーコードは、ユニバーサルアダプターの二本鎖部分のライゲート可能な末端(つまり第1の鎖において対合部分の3'末端を含む二本鎖末端)にある。いくつかの実施形態では、試料バーコードは、ユニバーサルアダプターの第1の末端にある。
【0117】
試料バーコードは、同じNGSシークエンシング反応中に複数の試料に対する多重配列決定のために使用し得る。異なる試料バーコードは、異なるシークエンシングプラットフォームに使用し得る。例えば、ION TORRENT(TM)は各アンプリコンの1つの末端に、試料バーコードを有するライブラリーに対して配列決定を行うことができる。しかし、二重バーコードは、例えばILLUMINA(R)のプラットフォームにおいてNGSシークエンシングのための二重インデックスシークエンシングライブラリーを構築するために使用し得る。二重試料バーコードを有するアンプリコンを提供するために、例えばPCR増幅ステップにおいてユニバーサルアダプター中の試料バーコードと同一の又は相補的な配列を含むシークエンシングアダプタープライマーを使用することができる。
【0118】
いくつかの実施形態では、ユニバーサルアダプターは、試料バーコード及び分子バーコードの両方を含む。いくつかの実施形態では、試料バーコードは、ユニバーサルアダプターの第1の末端、例えば二本鎖部分のライゲート可能な末端にある。いくつかの実施形態では、分子バーコードは非二本鎖部分中にあり、例えばユニバーサルアダプターの第1の鎖における非対合部分の3'末端にある。いくつかの実施形態では、ユニバーサルアダプターは、第1の鎖において5'から3'までに分子バーコード及び試料バーコードを含み、かつ第2の鎖において5'から3'までに試料バーコードを含む。いくつかの実施形態では、ユニバーサルアダプターは、第1の鎖において5'から3'までに第1のシークエンシングプライマーの配列と同一の又は相補的な配列、分子バーコード及び試料バーコードを含み、かつ第2の鎖において5'から3'までに試料バーコードを含む。いくつかの実施形態では、ユニバーサルアダプターは第1の鎖において5'から3'までに分子バーコード、第1のシークエンシングプライマーの配列と同一の又は相補的な配列、分子バーコード及び試料バーコードを含み、かつ第2の鎖において5'から3'までに第1のシークエンシングプライマーの配列と相補的又は同一の配列、及び試料バーコードを含む。いくつかの実施形態では、ユニバーサルアダプターは、第1の鎖において5'から3'までに分子バーコード、試料バーコード及び第1のシークエンシングプライマーの配列と同一の又は相補的な配列、分子バーコードを含み、かつ第2の鎖において5'から3'までに第1のシークエンシングプライマーの配列と相補的又は同一の配列、及び試料バーコードを含む。
【0119】
プライマー伸長サイクル由来の非特異的副産物を減少させるために、ユニバーサルアダプターの配列を最適化することができる。非特異的副産物の潜在的な由来としては、図3に示すように生成することが可能でありる。例えば、プライマー伸長の第1のサイクルにおいて、ユニバーサルアダプターの第1の鎖の相補的配列を含む一本鎖プライマー伸長生成物が生成し、その3'部分は、ユニバーサルアダプターの5'非対合部分のリバース相補的配列を含む。次のプライマー伸長サイクルにおいて、残存ユニバーサルアダプターは、ユニバーサルアダプターの5'非対合部分の相補的配列を有する一本鎖プライマー伸長生成物の3'部分にアニールすることができる。しかし、残存ユニバーサルアダプターは一般には、異なる分子バーコード又はユニーク分子インデックス(UMI)を有する。したがって、UMIインフレーション産物は、プライマー伸長のような非特異的副産物によって増幅されることが可能である。この問題の深刻性は、ユニバーサルアダプター中の一定の塩基(縮重設計されたヌクレオチドを含む分子バーコードではなく)を有する3'二本鎖部分の長さに依存する。いくつかの実施形態では、ユニバーサルアダプターの第1の末端には、ステップ(b)~(f)間に残存ユニバーサルアダプターによる無差別プライミングを防止するために、十分に短い長さの一定の核酸塩基を含む。いくつかの実施形態では、ユニバーサルアダプターの第1の末端は鎖の各々に、約5~15個、例えば約5個、6個、7個、8個、9個、10個、11個、12個、13個、14個又は15個のいずれかの一定の核酸塩基を有する。いくつかの実施形態では、ユニバーサルアダプターの第1の末端は鎖の各々に、一定の核酸塩基を約6~12個有する。いくつかの実施形態では、第1の(つまりライゲートし得る)末端(十分に短い長さの一定の核酸塩基)を含むユニバーサルアダプターを用いることによって、UMIインフレーション問題を軽減又は回避することができる。いくつかの実施形態では、ユニバーサルアダプターの第1の末端は、約25以下、20以下、15以下、12以下、10以下のうちのいずれか又はより少ないbpを含む。
【0120】
いくつかの実施形態では、ユニバーサルアダプターの非二本鎖部分は、ブロッキング部分を有する3'末端を含む。ブロッキング部分は、プライマー伸長サイクルの間に、核酸ポリメラーゼによる3'末端の伸長を防止する。いくつかの実施形態では、ユニバーサルアダプターの第2の鎖の3'末端はブロッキング部分を有し、かつプライマー伸長サイクルの間に伸長がブロックされる。いくつかの実施形態では、ブロッキング部分は逆位ヌクレオチドである。いくつかの実施形態では、ユニバーサルアダプターの第2の鎖の3'末端は逆位ヌクレオチドを含む。いくつかの実施形態では、ブロッキング部分は、1つないしそれ以上の(例えば約1、2、3、4のうちのいずれか又はより多くの)ホスホロチオエート修飾を有するフラッピング状のヌクレオチド(flapping nucleotide)フラグメントである。いくつかの実施形態では、ユニバーサルアダプターの第2の鎖の3'末端は、1つないしそれ以上の(例えば約1、2、3、4のうちのいずれか又はより多くの)ホスホロチオエート修飾を有するフラッピング状のヌクレオチドフラグメントを含む。フラッピング状のヌクレオチドは、核酸ポリメラーゼによるプライマー伸長をブロックすることができる。1つないしそれ以上のホスホロチオエート修飾は、ヌクレアーゼ(例えば核酸ポリメラーゼのエキソヌクレアーゼ機能)がフラッピング状のヌクレオチドを除去することを防止するのに十分である。いくつかの実施形態では、フラッピング状のヌクレオチドフラグメントは、約1、2、3、4のうちのいずれか又はより多くのヌクレオチドを有する。いくつかの実施形態では、ユニバーサルアダプターの3'末端のブロッキング部分は、ライゲートされた核酸には相補的な末端(例えばブロッキング部分が存在しない場合、一方がライゲートし、他方がプライマー伸長する)が存在することで鋳型DNAにヘアピン構造を形成することを防止することができる。鋳型DNAにヘアピン構造を形成すると、プライマーアニーリングが低くなり、これにより鋳型DNAが「閉」じてプライマー伸長効率が低くなる。
【0121】
ユニバーサルアダプタープライマーは、PCR増幅サイクルにおいて一本鎖プライマー伸長生成物におけるユニバーサルアダプターの非二本鎖部分の相補的配列にアニールするように設計される。いくつかの実施形態では、ユニバーサルアダプタープライマーの3'部分は、ユニバーサルアダプターの非二本鎖部分の第1の鎖と相補的な配列を含む。いくつかの実施形態では、ユニバーサルアダプタープライマーは3'末端に、ユニバーサルアダプターの第1の鎖における少なくとも約12の(例えば少なくとも約15、20、25、30のうちのいずれか又はより多くの)最も5'側のと相補的な配列を含む。いくつかの実施形態では、ユニバーサルアダプタープライマーの5'部分は、NGSプラットフォームの第1のシークエンシングプライマーの配列と同一の又は相補的な配列を含む。いくつかの実施形態では、ユニバーサルアダプタープライマーは5'から3'までに、NGSプラットフォームの第1のシークエンシングプライマーの配列と同一の又は相補的な配列、及び、ユニバーサルアダプターの非二本鎖部分の第1の鎖と相補的な配列を含む。
【0122】
ネストされた標的特異的プライマー
本明細書に記載の方法は、1組又は複数組の外部プライマー及び内部プライマーを用いて、関心対象の遺伝子座を有する標的ヌクレオチド配列を富化する。関心対象の遺伝子座について、内部プライマーは外部プライマーに対してネストされたものである。いくつかの実施形態では、1つの外部プライマー及び1つの内部プライマーを用いて、関心対象の遺伝子座を有する標的ヌクレオチド配列を増幅する。いくつかの実施形態では、複数の(例えば2、3、4、5、6、10、12、15のうちのいずれか又はより多くの)外部プライマー及び複数の(例えば2、3、4、5、6、10、12、15のうちのいずれか又はより多くの)内部プライマーを用いて、関心対象の遺伝子座を有する標的ヌクレオチド配列を増幅する。いくつかの実施形態では、1つの関心対象の遺伝子座の外部プライマー及び内部プライマーは、鋳型核酸の同一の鎖に特異的にアニールする。いくつかの実施形態では、複数の外部プライマー及び対応する内部プライマーは、鋳型核酸の1つの鎖に特異的にアニールし、かつ複数の外部プライマー及び対応する内部プライマーは、鋳型核酸の相補的鎖に特異的にアニールする。
【0123】
いくつかの実施形態では、複数組の外部及び内部プライマーが1つの関心対象の遺伝子座に用いられる時、複数の区別可能なアンプリコンが得られる。いくつかの実施形態では、各標的配列よりも長い関心対象の遺伝子座への標的配列のタイリングを可能にするために、互いに重複するアンプリコンを生成する。いくつかの実施形態では、これらの複数のアンプリコンをシークエンシングすることができ、かつ、プライマー伸長及びPCR増幅サイクル或いはシークエンシングの間に導入される配列エラーを検出するために、重複配列リードを互いに整列させることができる。いくつかの実施形態では、アンプリコンの各々を整列させることができ、かつ、特定の塩基において配列が異なる場合に、標的富化ステップ及び/又はシークエンシング由来のアーチファクト又はエラーが存在し得る。
【0124】
いくつかの実施形態では、標的ヌクレオチド配列を含むライゲートされた核酸の第1の鎖に特異的にアニールした第1組の外部プライマー及び内部プライマーと、相補的な標的ヌクレオチド配列を含むライゲートされた核酸の第2の鎖に特異的にアニールした第2組の外部プライマー及び内部プライマーとを用いて、各関心対象の遺伝子座を富化する。図2を加味すれば、2組の例示的な外部及び内部プライマーを理解でき、この2組のプライマーは、関心対象の遺伝子座を有する核酸テンプレートの2つの鎖における標的ヌクレオチド配列(つまり標的ヌクレオチド配列及び相補的な標的ヌクレオチド配列)を富化するために使用しうる。
【0125】
いくつかの実施形態では、反対方向の外部プライマー又は内部プライマーからのPCR増幅産物を有意に減少又は除去するために、反対方向を有する外部プライマーの各々は、同一の5'ヌクレオチド配列(本明細書には「5'タグ配列」と呼ばれる)を含む。いくつかの実施形態では、反対方向を有する内部プライマーの各々も、外部プライマーの5'タグ配列と同一の又は異なる5'タグ配列を含む。いくつかの実施形態では、5'タグ配列は、外部プライマーを用いたPCR増幅を抑制するのに十分な長さである。例えば、反対方向を有する2つの外部プライマーから生成する二本鎖PCR増幅産物は、末端に相補的な配列(つまり5'タグ配列及びその相補的な配列)をもつため、「フライパンの柄」のような構造を形成する。いくつかの実施形態では、5'タグ配列は、少なくとも約13、15、20、25、30のうちのいずれか又はより多くのヌクレオチドを含む。外部及び内部プライマー中の5'タグ配列は、プライマー二量体の形成を減少させることができ、これによりプライマー伸長及び/又はPCR増幅サイクルの効率が向上する。
【0126】
いくつかの実施形態では、(i)5'タグ配列自体は既知のゲノム標的を有しないか、又は少ないゲノム標的を有することと、(ii)5'タグ配列は高いTm(例えば少なくとも約65℃、70℃、75℃のうちのいずれか又はより高い)を有することと、(iii)5'タグ配列自体又は反応混合物中のその他のプライマーとはプライマー二量体を形成し難いことと、(iv)5'タグ配列は安定した二次構造を有しないことという設計原理のうちのいずれか又は複数のものに従って外部プライマー及び/又は内部プライマーの5'タグ配列を最適化する。例えばDiagnostics Z. et al. 「The elimination of primer-dimer accumulation in PCR」、Nuc. Acids Res., 1997, 25(16): 3235-3241を参照されたい。いくつかの実施形態では、プライマー伸長サイクル中のプライマー二量体の形成又は非特異的プライミングを回避するために、5'タグ配列のGC含有量を最適化する。いくつかの実施形態では、ユニバーサルアダプターのGC含有量は核酸テンプレートのGC含有量と実質的に類似している。いくつかの実施形態では、ユニバーサルアダプターのGC含有量は、少なくとも約40%、45%、50%、55%、60%、65%のうちのいずれか又はより高い。
【0127】
いくつかの実施形態では、各組の外部及び内部プライマーは、関心対象の遺伝子座の近傍の既知のヌクレオチド配列に特異的にアニールすることができる。関心対象の遺伝子座を有する標的ヌクレオチド配列は、外部及び内部プライマーの設計を可能にするために、1つの末端に1つないしそれ以上の既知のヌクレオチド配列を有しなければならない,従来のPCR富化技術に比べて、本明細書に記載の方法の1つの強力な利点は、ネストされた標的特異的プライマーを、標的ヌクレオチド配列を含む核酸テンプレートの一方側に固定しながら、他方の末端をユニバーサルアダプターにランダムにライゲートすることにある。他の従来のPCR技術とは違って、本明細書に記載の方法は、目的領域末端の1つの末端しか知らないまま当該目的領域を富化することができる。いくつかの実施形態では、異なる組の外部及び内部プライマーは、遺伝子の異なる断片、例えばエクソンを富化するように設計される。公的に利用可能なデータベースからの参照ゲノム配列に基づいて、既知の遺伝子配列を得ることができる。配列の新規決定のための他の手段を用いて、例えばゲノム又はエクソームDNA配列決定を含む、関心対象の遺伝子座の近傍の既知の配列を提供することもできる,既知のヌクレオチド配列の長さは少なくとも約10、20、30、40、50、100、200のうちのいずれか又はより多くのヌクレオチドであってもよい。いくつかの実施形態では、既知のヌクレオチド配列は約10~100ヌクレオチド、約10~500ヌクレオチド、約10~1000ヌクレオチド、約100~500ヌクレオチド、約100~1000ヌクレオチド、約500~1000ヌクレオチド又は約500~5000ヌクレオチドのうちのいずれかの長さである。既知のヌクレオチド配列は、関心対象の遺伝子座の上流又は下流であってもよく、かつセンス鎖又はアンチセンス鎖に位置していてもよい。
【0128】
既知のヌクレオチド配列と関心対象の遺伝子座との間の距離は、プライマー伸長及びPCR増幅に適する任意の長さであってもよい。いくつかの実施形態では、既知のヌクレオチド配列の関心対象の遺伝子座からの距離は、約1000以下、900以下、800以下、700以下、600以下、500以下、400以下、300以下、200以下、100以下、50以下、30以下、20以下のいずれか又はより少ないbpである。いくつかの実施形態では、外部及び内部プライマーは、特定のシークエンシング技術に用いられる適切な長さのアンプリコンを提供するために設計される。例えば、所定のシークエンシング技術の最適なリード長が200bpである場合、本明細書に記載の方法由来の標的ヌクレオチド配列のアンプリコンは約400bp又はより少ない平均長を有することができる。
【0129】
本明細書に記載の方法は、既知のヌクレオチド配列の任意側又は両側における既知のヌクレオチド配列に隣接する標的ヌクレオチド配列を富化することが可能である。核酸テンプレートが一般には一本鎖核酸であろうと、二本鎖核酸であろうと、配列情報は通常、5'から3'までの一本鎖型(鎖A)で発現される。鎖Aの既知の標的ヌクレオチド配列の配列5'が決定される場合、遺伝子特異的プライマーは鎖Aと相補的であってもよい(つまり鎖Aにアニールする)。鎖Aの既知の標的ヌクレオチド配列の配列3'が決定される場合、遺伝子特異的プライマーは鎖Aと同一であってもよく、これらが二本鎖核酸の相補的鎖にアニールする。このようなプライマー設計の配慮は、当業者に周知されている。
【0130】
関心対象の遺伝子座を有する標的ヌクレオチド配列は、関心対象の遺伝子座の配列(センス鎖及び/又はアンチセンス鎖にある)、関心対象の遺伝子座の近傍の既知のヌクレオチド配列、及び決定される隣接するヌクレオチド配列(未知配列とも呼ばれる)を含みうる。標的ヌクレオチド配列は任意の適切な長さであってもよい。いくつかの実施形態では、標的ヌクレオチド配列の集団は、本明細書に記載の方法によって富化され、かつその標的ヌクレオチド配列の集団は、内部プライマーの配列と一致する同一の5'又は3'末端配列を有する。
【0131】
いくつかの実施形態では、外部プライマーは3'部分を含む一本鎖オリゴヌクレオチドであり、当該3'部分は、関心対象の遺伝子座の近傍の既知のヌクレオチド配列の一部に特異的にアニール可能な配列を含む。いくつかの実施形態では、外部プライマーは3'末端に、関心対象の遺伝子座の近傍の第1の既知のヌクレオチド配列(つまり第1のアニーリング部位)に特異的にアニール可能な配列を含む。いくつかの実施形態では、内部プライマーは3'末端に、関心対象の遺伝子座の近傍の第2の既知のヌクレオチド配列(つまり第2のアニーリング部位)に特異的にアニール可能な配列を含む。いくつかの実施形態では、第1の既知のヌクレオチド配列は、第2の既知のヌクレオチド配列よりも関心対象の遺伝子座から約1~100ヌクレオチド(例えば約2~50、1~20又は1~10ヌクレオチドのうちのいずれか)離れている。いくつかの実施形態では、外部プライマーは、内部プライマーよりも関心対象の遺伝子座から約1~100ヌクレオチド離れた領域にアニールする。いくつかの実施形態では、外部プライマーは、内部プライマーよりも関心対象の遺伝子座から約100以下、80以下、60以下、50以下、40以下、30以下、20以下、10以下、5以下のうちのいずれか又はより少ないヌクレオチド離れた領域にアニールする。
【0132】
いくつかの実施形態では、内部プライマーは外部プライマーに対してネストされたものである。いくつかの実施形態では、内部プライマーは外部プライマーに対して少なくとも約1、2、3、4、5、6、7、8、9、10、15、20のうちのいずれか又はより多くのヌクレオチドがネストされたものである。
【0133】
外部及び内部プライマーは、オフターゲットプライミングを減少又は回避するために、高い特異性の既知の配列にアニールするものに設計される。いくつかの実施形態では、外部プライマー及び/又は内部プライマーの3'部分は、関心対象の遺伝子座の近傍の既知のヌクレオチド配列に特異的にアニールした少なくとも10(例えば少なくとも約12、13、14、15、20、25、30、35のうちのいずれか又はより多くの)ヌクレオチドを含む。いくつかの実施形態では、外部プライマー及び内部プライマーの3'部分は核酸テンプレートにおいて、約20以下、15以下、10以下、5以下、4以下、3以下又は2以下のうちのいずれかの異なるアニーリング遺伝子座を有する。「異なるアニーリング遺伝子座」とは、核酸テンプレートにおいて異なる既知のゲノム位置を有するか及び/又は異なる遺伝子或いは遺伝子融合産物に属する配列を有し、かつ前記配列が外部又は内部プライマーの3'部分と相補的又は実質的に相補的であることを意味する。
【0134】
いくつかの実施形態では、既知の標的ヌクレオチド配列に特異的にアニールする外部及び内部プライマーの一部は、約55~72℃、約60~72℃、約60~70℃、約62~69℃、約63~67℃又は約64~66℃のうちのいずれかの温度で特異的にアニールすることができる。いくつかの実施形態では、既知の標的ヌクレオチド配列に特異的にアニールする外部及び内部プライマーの一部は、プライマー伸長又はPCR緩衝液中で約65℃の温度で特異的にアニールすることができる。
【0135】
外部プライマー、内部プライマー又はそれらの3'標的特異的部分は、遺伝子のエクソン、遺伝子のイントロン、遺伝子のイントロン-エクソン連結領域又はゲノムの非コード領域に特異的にアニールすることができる。関心対象の遺伝子座の特性及び核酸試料中の核酸テンプレートの種類に応じて、外部及び内部プライマーのアニーリング部位の位置を設計することができる。例えば、ゲノムDNA試料から遺伝子のエクソン領域中の遺伝子座を富化するために、外部及び内部プライマーは、エクソン領域に入る方向に遺伝子座の近傍のイントロンにおける既知の配列に特異的にアニールするように設計される。いくつかの実施形態では、cDNA試料から融合遺伝子中の遺伝子座を富化するために、第1組の外部及び内部プライマーは、融合点に入る方向に第1の融合遺伝子のエクソンにおける既知の配列に特異的にアニールするように設計され、かつ第2組の外部及び内部プライマーは、融合点に入る方向に第2の融合遺伝子のエクソンにおける既知の配列に特異的にアニールするように設計される。
【0136】
いくつかの実施形態では、外部プライマー及び内部プライマーは、プライマー二量体の形成を抑制できる同一の5'部分を含む。いくつかの実施形態では、内部プライマーは5'末端に、NGSプラットフォームの第2のシークエンシングプライマーの配列と同一の又は相補的な配列を含む。
【0137】
核酸試料
本明細書に記載の方法は各種の核酸試料に使用可能である。いくつかの実施形態では、核酸試料はゲノムDNA又はその断片を含む。いくつかの実施形態では、核酸試料はRNAを含み、例えばmRNA、miRNA、lincRNA、rRNAなど又はそれらの断片を含む。いくつかの実施形態では、核酸試料はcDNA又はその断片を含む。いくつかの実施形態では、核酸試料はゲノムDNAとRNAとの混合物を含む。いくつかの実施形態では、核酸試料はゲノムDNAとcDNAとの混合物を含む。
【0138】
いくつかの実施形態では、核酸試料はDNAテンプレートを含む。いくつかの実施形態では、核酸試料はRNAテンプレートを含む。いくつかの実施形態では、核酸試料はDNAテンプレートとRNAテンプレートの両方を含む。いくつかの実施形態では、核酸テンプレートはゲノムDNAである。いくつかの実施形態では、核酸テンプレートは染色体DNAである。いくつかの実施形態では、核酸テンプレートはミトコンドリアDNAである。いくつかの実施形態では、核酸テンプレートはエクソームDNAである。いくつかの実施形態では、核酸テンプレートはcDNAである。いくつかの実施形態では、核酸テンプレートはRNA、例えばmRNA、miRNA、lincRNA、rRNなどである。いくつかの実施形態では、核酸テンプレート(例えば断片化)は、長さがNGS方法又はプラットフォームの最適なリード長を超える核酸、例えば完全長染色体DNA又は完全長mRNAに由来する。
【0139】
いくつかの実施形態では、核酸試料はcDNAを含む。いくつかの実施形態では、全RNA又はその一部(例えばmRNA、miRNA又はその他の非コードRNA)を逆転写することによってcDNAを得る。いくつかの実施形態では、cDNは一本鎖であり、例えばcDNAの少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、90%又は95%のうちのいずれか又はより多くのは一本鎖である。いくつかの実施形態では、核酸試料は二本鎖cDNAを含む。
【0140】
いくつかの実施形態では、核酸試料はgDNAを含む。いくつかの実施形態では、gDNAは一本鎖であり、例えばgDNAの少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%のうちのいずれか又はより多くは一本鎖である。いくつかの実施形態では、核酸試料は二本鎖gDNAを含む。
【0141】
いくつかの実施形態では、核酸試料はcDNAとgDNAとの混合物を含む。いくつかの実施形態では、cDNAとgDNAの重量比は約1:5超、1:3超、1:2超、1:1超、2:1超、3:1超、5:1超、10:1超のいずれか又はより大きい。
【0142】
いくつかの実施形態では、核酸試料は少量の核酸テンプレートを含む。いくつかの実施形態では、核酸試料は約1000ng以下、500ng以下、200ng以下、100ng以下、50ng以下、40ng以下、30ng以下、25ng以下、20ng以下、15ng以下、10ng以下、5ng以下、4ng以下、3ng以下、2ng以下、1ng以下のうちのいずれか又はより少ない核酸テンプレート(例えば,cDNA、gDNA、RNA、それらの集団又は全核酸)を含む。
【0143】
いくつかの実施形態では、核酸試料は細胞又は組織試料に由来する。いくつかの実施形態では、核酸試料は細胞系試料又は培養細胞に由来する。いくつかの実施形態では、核酸試料は遺伝子操作された細胞株に由来する。いくつかの実施形態では、核酸試料はCRISPR遺伝子編集技術によって操作された細胞に由来する。いくつかの実施形態では、核酸試料は免疫細胞、例えばT細胞、B細胞又はPMBCに由来する。いくつかの実施形態では、核酸試料は腫瘍細胞に由来する。
【0144】
いくつかの実施形態では、核酸試料は食品試料、環境試料又は生体試料から得られる。いくつかの実施形態では、核酸試料は個体由来の生体試料に由来する。いくつかの実施形態では、核酸試料は疾患(例えばがん)の治療を必要とする生体試料に由来する。いくつかの実施形態では、核酸試料は個体から得られる診断試料である。いくつかの実施形態では、核酸試料は健康な個体由来の生体試料に由来する。いくつかの実施形態では、核酸試料は遺伝子操作された動物(例えばマウス、ラット又は非ヒト霊長類)に由来する。いくつかの実施形態では、核酸試料はCRISPR遺伝子編集技術によって操作された動物に由来する。
【0145】
いくつかの実施形態では、生体試料は、タンパク質、細胞、液体、生体液、保存剤及び/又は他の物質をさらに含む。非制限的な例として、試料は、口腔内スワブ、血液、血清、血漿、喀痰、脳脊髄液、尿、涙液、肺胞単離液、胸水、心膜液、嚢液、腫瘍組織、組織、生検、唾液、吸引液、またはその組み合わせでありうる。いくつかの実施形態では、生体試料は切除または生検によって得られうる。いくつかの実施形態では、核酸試料は個体の血液試料に由来する。いくつかの実施形態では、核酸試料は個体の末梢血単核細胞(PMBC)試料に由来する。いくつかの実施形態では、核酸試料は個体の血液試料における免疫細胞(例えば、T細胞、NK細胞又はB細胞)の一部に由来する。いくつかの実施形態では、核酸テンプレートは無細胞DNAである。いくつかの実施形態では、核酸テンプレートは個体の血液試料に由来する無細胞DNAである。いくつかの実施形態では、核酸テンプレートは循環腫瘍DNA(つまりctDNA)である。いくつかの実施形態では、核酸テンプレートは個体の血液試料由来の循環腫瘍細胞に由来する。
【0146】
いくつかの実施形態では、核酸試料は個体の生検試料に由来する。いくつかの実施形態では、核酸試料は腫瘍生検、例えば未処置の生検組織又は処置後の生検組織に由来する。いくつかの実施形態では、核酸試料は個体のホルマリン固定及び/又はパラフィン包埋生検組織に由来する。
【0147】
いくつかの実施形態では、生体試料は、遺伝子変化に関連する疾患(例えばがん又は遺伝性疾患)の治療を必要とする個体から得られる。いくつかの実施形態では、既知の標的配列は疾患に関連する遺伝子にある。いくつかの実施形態では、生体試料は、がんの治療を必要とする個体から得られる。いくつかの実施形態では、生体試料は個体中の1つないしそれ以上の腫瘍部位の腫瘍細胞を含む。
【0148】
いくつかの実施形態では、生体試料は個体から新たに採取される。いくつかの実施形態では、生体試料は本明細書に記載の方法に用いられる前に一時保存され、例えば少なくとも約1日、1週、1ヶ月、3ヶ月、6ヶ月、1年のうちのいずれか又はより長く保存される。いくつかの実施形態では、生体試料はホルマリン固定パラフィン包埋(FFPE)試料である。いくつかの実施形態では、生体試料は本明細書に記載の方法中の核酸試料として直接使用される。いくつかの実施形態では、生体試料は溶液中に希釈及び/又は懸濁させることによって前処理される。いくつかの実施形態では、生体試料は被検者から得て、かつ本明細書に記載の方法に用いられる前に保存又は加工される。例えば、生体試料はパラフィンロウに包埋、冷蔵又は凍結されうる。凍結された生体試料は使用前に解凍することができる。生体試料の他の例示的な処理又は加工は、遠心分離、濾過、超音波処理、ホモジナイゼーション、加熱、凍結融解、保存剤(例えば、抗凝固剤又はヌクレアーゼ阻害剤)との接触、及びこれらの任意の組み合わせが挙げられるが、これらに限定されない。いくつかの実施形態では、生体試料は、化学試薬及び/又は生物試薬によって処理される。化学試薬及び/又は生物試薬は、処理及び/又は保存期間において、生体試料又は生体試料煮含まれる核酸テンプレートの安定性を保護及び/又は維持するために用いられうる。いくつかの実施形態では、化学試薬及び/又は生物試薬は、生体試料の他の成分から核酸テンプレートを放出させるために用いられうる。非制限的な例として、血液試料は、本明細書に記載の方法に用いられる核酸試料を得るために使用する前に、抗凝固剤によって処理することができる。当業者は、生体試料を加工、保存、又は処理するための方法及びプロセス、並びに核酸分析のために生体試料又は細胞試料から核酸を分離する方法を十分に承知している。いくつかの実施形態では、生体試料は、例えば遠心分離によって透明にされた液体試料でありうる。いくつかの実施形態では、試料を、低速遠心分離(例えば3000×g又はそれ未満)によって透明にして、透明な液体試料を含む上清を回収することができる。
【0149】
いくつかの実施形態では、生体試料又は核酸試料中の核酸テンプレートは、本明細書に記載の方法に用いられる前に単離、富化又は精製することができる。試料から核酸を単離、富化又は精製する適切な方法を利用することができる。例えば、各種の試料の種類からゲノムDNA及びRNAを単離するためのキットは市販されている(例えばQiagen, Germantown, MD)。本明細書に記載の標的富化方法は単独で使用するか、又は当技術分野で既知の他の標的富化方法と組み合わせて使用することができる。いくつかの実施形態では、前記方法はハイブリダイゼーション富化を含まない。
【0150】
いくつかの実施形態では、RNAテンプレートを含む核酸試料は本明細書に記載の方法に使用しうる。核酸試料は、cDNAシークエンシングのためにゲノムDNAを除去する必要がなく、新しい又は分解した標本から抽出した総核酸を含みうる。いくつかの実施形態では、RNAを含む核酸試料は、cDNAシークエンシングのためには、リボソームRNAを枯渇させるように処理されない。いくつかの実施形態では、RNAを含む核酸試料は、いずれのステップにおいても機械的又は酵素的に切断されていない。いくつかの実施形態では、RNAは、ランダムヘキサマーを用いた二本鎖cDNAの合成に供されることなく、本明細書に記載の方法に使用される。
【0151】
関心対象の遺伝子座
本明細書に記載の方法により様々な関心対象の遺伝子座を研究することができる。いくつかの実施形態では、関心対象の遺伝子座は、配列変異体(染色体再編成、単一ヌクレオチド変異(SNV)、挿入または欠失、スプライス変異、コピー数多型(CNV)及びそれらの組み合わせを含むが、これらに限定されない)に関連する。いくつかの実施形態では、関心対象の遺伝子座は、染色体再編成(例えば染色体融合又は遺伝子融合)に関連する。いくつかの実施形態では、関心対象の遺伝子座は染色体転座に関連する。いくつかの実施形態では、関心対象の遺伝子座は単一ヌクレオチド変異(SNV)に関連する。いくつかの実施形態では、関心対象の遺伝子座は挿入変異又は欠失変異(総称して「挿入または欠失」変異と呼ばれる)に関連する。いくつかの実施形態では、関心対象の遺伝子座は置換変異に関連する。いくつかの実施形態では、関心対象の遺伝子座はコピー数多型に関連する。いくつかの実施形態では、関心対象の遺伝子座はスプライス変異に関連している。関心対象の遺伝子座は任意の長さであってもよく、例えば少なくとも1、2、5、10、20、50、100、200、300、400、500、1000、2000のうちのいずれか又はより少ないbpであってもよい。
【0152】
いくつかの実施形態では、関心対象の遺伝子座は天然に存在する遺伝子中にある。いくつかの実施形態では、関心対象の遺伝子座は、目的遺伝子のいずれか1つ又は複数の連続的なエクソン、イントロン、イントロン-エクソン連結領域、5'UTR、3'UTR又はその他の非コード領域、及びそれらの断片であってもよい。いくつかの実施形態では、関心対象の遺伝子座は操作された遺伝子又はゲノム部位にある。いくつかの実施形態では、関心対象の遺伝子座は、遺伝性疾患に関わる遺伝子にある。いくつかの実施形態では、関心対象の遺伝子座はがんに関わる遺伝子(例えばがん遺伝子)にある。いくつかの実施形態では、関心対象の遺伝子座は免疫細胞受容体、例えば組換えT細胞受容体を含むT細胞受容体に関連する。いくつかの実施形態では、関心対象の遺伝子座は遺伝子操作された部位(例えば以前に既知又は未知のオフターゲット部位のようなCRISPR遺伝子編集のオフターゲット部位、)に関連する。
【0153】
疾患又は状態に「関連」する遺伝子又は遺伝子座とは、健康な個体における野生型配列に比べて、例えば欠失、挿入、SNV、染色体再編成(例えば遺伝子融合)などの変化によって少なくとも部分的に疾患又は状態を引き起こすか、又は、疾患又は状態に関連する遺伝子又は遺伝子座を指す。例えば、疾患は、その変化が、個体が疾患を発症するリスクを増加させる場合、疾患(感染疾患、又は感染成分を有する疾患を含む)に対する被検者の感受性を増加させる場合、疾患関連分子の産生を引き起こす場合、又は細胞を疾患にするもしくは異常にする場合(例えばがん細胞における細胞周期調節の喪失)、少なくとも部分的に、個体の遺伝子又は遺伝子座の変化によって引き起こされうる。疾患は、複数の遺伝子変化に関連しうる。
【0154】
いくつかの実施形態では、関心対象の遺伝子座は、染色体又は遺伝子再編成による融合配列に関連する。いくつかの実施形態では、本明細書に記載の方法は遺伝子再編成の存在及び/又はアイデンティティーを確認するのに適する。いくつかの実施形態では、遺伝子再編成の一部のアイデンティティーは従来既知であり(例えば外部及び内部プライマーによって標的化される遺伝子再編成の一部)、かつ本明細書に記載の方法によってその他の部分の配列を決定することができる。いくつかの実施形態では、遺伝子再編成はがん遺伝子に関連する。いくつかの実施形態では、遺伝子再編成は融合がん遺伝子を含む。
【0155】
III.標的ヌクレオチド配列の決定方法及びその応用
本願はさらに、上述のいずれかの1つの標的富化方法によって標的ヌクレオチド配列のアンプリコンをシークエンシングすることにより、核酸試料中の1つないしそれ以上の関心対象の遺伝子座を有する標的ヌクレオチド配列を決定する方法を提供する。
【0156】
したがって、いくつかの実施形態では、標的ヌクレオチド配列を含有する核酸テンプレートを含む核酸試料から、関心対象の遺伝子座を有する標的ヌクレオチド配列を決定する方法であって、(a)第1の末端に二本鎖部分を有し、第2の末端に非二本鎖部分を有するオリゴヌクレオチドであるユニバーサルアダプターを、第1の末端によって当該核酸テンプレートにライゲートすることにより、ライゲートされた核酸を提供するステップと、(b)ライゲートされた核酸を、標的ヌクレオチド配列を含む第1の鎖、及び第2の鎖に解離させるステップと、(c)外部プライマーは、ライゲートされた核酸の第1の鎖中の標的ヌクレオチド配列の近傍にアニールするステップと、(d)DNAポリメラーゼを用いて、外部プライマーを、ライゲートされた核酸の第1鎖の全長にわたって伸長させることにより、新生プライマー伸長二本鎖を提供するステップと、(e)十分に高い温度で新生プライマー伸長二本鎖を、ライゲートされた核酸の第1の鎖と一本鎖プライマー伸長生成物に解離させるステップと、(f)ステップ(c)~(e)を繰り返して1つないしそれ以上のプライマー伸長サイクルを行うステップと、(g)標的ヌクレオチド配列のPCR増幅に十分な条件下で、一本鎖プライマー伸長生成物をDNAポリメラーゼ、ユニバーサルアダプタープライマー及び内部プライマーに接触させるステップであって、当該ユニバーサルアダプタープライマーは、一本鎖プライマー伸長生成物におけるユニバーサルアダプターの非二本鎖部分の相補的配列にアニールし、当該内部プライマーは、3'末端において、標的ヌクレオチド配列に特異的にアニールした配列を含み、かつ、関心対象の遺伝子座について、当該内部プライマーは外部プライマーに対してネストされたものであるステップと、(h)ステップ(g)を繰り返して1つないしそれ以上の(例えば約2~100(例えば約5~50又は約10~30)の)PCR増幅サイクルを行うことにより、標的ヌクレオチド配列のアンプリコンを提供するステップと、(i)標的ヌクレオチド配列のアンプリコンに対して次世代シークエンシングを行うことにより、標的ヌクレオチド配列を提供するステップと、を含む方法を提供する。いくつかの実施形態では、ステップ(a)~(h)は、ライゲートされた核酸の第1の鎖に特異的にアニールした第1組の外部プライマー及び内部プライマーと、ライゲートされた核酸の第2の鎖に特異的にアニールした第2組の外部プライマー及び内部プライマーとを用いる。いくつかの実施形態では、第1組の外部プライマー及び第2組の外部プライマーは、少なくとも13ヌクレオチド長の第1の5'タグ配列を含み、かつ第1組の内部プライマー及び第2組の内部プライマーは、少なくとも13ヌクレオチド長の第2の5'タグ配列を含む。
【0157】
本明細書に記載の方法は多重フォーマットで用いうる。いくつかの実施形態では、前記方法は、複数の異なる関心対象の遺伝子座を有する標的ヌクレオチド配列の決定及び/又は配列変異体の検出のために使用しうる。いくつかの実施形態では、少なくとも約1500の(例えば、少なくとも約2000、2500、3000、4000、5000又はより多くの)異なる関心対象の遺伝子座を有する標的ヌクレオチド配列を同時に決定する。いくつかの実施形態では、約2~5000個の(例えば約2~100個、5~200個、100~2000個、2~2000個、101~5000個、1500~5000個のうちのいずれか)関心対象の遺伝子座を有する標的ヌクレオチド配列を同時に決定する。いくつかの実施形態では、各標的ヌクレオチド配列のリード平均カバレッジは少なくとも約2×、10×、20×、50×、100×、200×、500×、1000×、10000×のうちのいずれか又はより高い。
【0158】
いくつかの実施形態では、関心対象の遺伝子座を有する標的ヌクレオチド配列は1つの核酸試料に由来する。いくつかの実施形態では、関心対象の遺伝子座を有する標的ヌクレオチド配列は複数の(例えば少なくとも約2、3、4、5、6、7、8、10のうちのいずれか又はより多くの)核酸試料に由来する。異なる核酸試料は、試料バーコードを含むユニバーサルアダプターを用いてバーコード化することができ、かつプライマー伸長サイクルの前にそれらをプールするか、或いは標的富化ステップの終了時にその増幅産物をプールすることで、複数の核酸試料に由来する標的ヌクレオチド配列を同時にシークエンシングすることを可能にする。
【0159】
いくつかの実施形態では、標的富化ステップの間に、特定のNGSプラットフォームへの使用に適するシークエンシングプライマーの配列を標的ヌクレオチド配列のアンプリコン中に導入する。いくつかの実施形態では、ユニバーサルアダプター(例えば非二本鎖部分又は二本鎖部分)は、ステップ(i)に用いられる第1のシークエンシングプライマーの配列と同一の又は相補的な配列を含むか、又は、ユニバーサルアダプタープライマーは5'末端に、第1のシークエンシングプライマーの配列と同一の又は相補的な配列を含む。いくつかの実施形態では、ステップ(g)は、標的ヌクレオチド配列のPCR増幅に十分な条件下で、一本鎖プライマー伸長生成物をDNAポリメラーゼ、ユニバーサルアダプタープライマー、内部プライマー及びシークエンシングアダプタープライマーに接触させ、前記シークエンシングアダプタープライマーは3'末端に、内部プライマーの配列と同一の配列を含み、かつ5'末端に、ステップ(ii)に用いられる第2のシークエンシングプライマーの配列と同一の又は相補的な配列を含む。
【0160】
いくつかの実施形態では、前記方法はさらに、ステップ(ii)の次世代シークエンシングの前に標的ヌクレオチド配列のアンプリコンを用いて、シークエンシングライブラリーを作製することを含む。いくつかの実施形態では、前記方法は、PCR増幅サイクルの後に標的ヌクレオチド配列のアンプリコンをクリーンアップすることを含む。いくつかの実施形態では、前記方法はアンプリコンを断片化することを含む。いくつかの実施形態では、前記方法は、複数の試料に由来する標的ヌクレオチド配列のアンプリコンを定量化し、かつ標的ヌクレオチド配列のアンプリコンをプールして1つのシークエンシングライブラリーにすることを含む。いくつかの実施形態では、シークエンシングステップ用のシークエンシングライブラリーを構築するために、標的ヌクレオチド配列のアンプリコンを別のプロセスに供して、アダプターを添加するか及び/又はプライマー配列をシークエンシングする。
【0161】
本明細書に記載の「次世代シークエンシング」又は「NGS」とは、何千から何百万ものシークエンシング反応を行って読み取ることにより、通常のシークエンシング法(例えばSangerシークエンシング)で可能であった速度を超える速度でオリゴヌクレオチドをシークエンシングする能力を有するオリゴヌクレオチドシークエンシング技術を意味する。次世代シークエンシング法/プラットフォームの非制限的な例には、Massively Parallel Signature Sequencing (Lynx Therapeutics)、454ピロシークエンシング(454 Life Sciences/Roche Diagnostics)、固相可逆的ダイターミネーターシークエンシング( Solexa/Illumina)、SOLiD 技術( Applied Biosystems)、イオン半導体シークエンシング(ION TORRENTTM)、DNA ナノボールシークエンシング(Complete Genomics)、並びにPacific Biosciences、Intelligen Bio-systems、Oxford Nanopore Technologies、及び Helicos Biosciencesから入手可能な技術が挙げられる。
【0162】
いくつかの実施形態では、シークエンシングプライマーは、選択された次世代シークエンシング法と適合性の部分を含みうる。次世代シークエンシング技術及び関連するシークエンシングプライマーの制約及び設計パラメータは、当技術分野において周知である(例えばShendure, et al., 「Next-generation DNA sequencing,」 Nature, 2008, vol. 26, No. 10, 1 135-1 145; Mardis,「The impact of next-generation sequencing technology on genetics,」 Trends in Genetics, 2007, vol. 24, No. 3, pp. 133-141 ; Su, et al., 「Next-generation sequencing and its applications in molecular diagnostics」 Expert Rev Mol Diagn, 201 1 , 1 1(3):333-43; Zhang et al., 「The impact of next-generation sequencing on genomics」, J Genet Genomics, 201 1 , 38(3):95-109;Nyren, P. et al. Anal Biochem 208: 17175 (1993);Bentley, D. R. Curr Opin Genet Dev 16:545-52 (2006); Strausberg, R. L., et al. Drug Disc Today 13:569-77 (2008);米国特許No. 7,282,337;米国特許 No. 7,279,563;米国特許 No. 7,226,720 ;米国特許No. 7,220,549;米国特許 No. 7,169,560;米国特許 No. 6,818,395;米国特許 No. 6,91 1 ,345;米国特許出願公開 No. 2006/0252077、No. 2007/0070349 及び No. 20070070349を参照されたい。これらの参考文献は、その全体が参照により本明細書に組み入れられる)。
【0163】
いくつかの実施形態では、ピロシークエンシング技術を含む。ピロシークエンシングは、特定のヌクレオチドが新生鎖中に組み込まれる時の無機ピロリン酸(PPi)の放出を検出する(Ronaghi, M.、Karamohamed, S.、Pettersson, B.、Uhlen, M. 及びNyren, P. (1996)「Real-time DNA sequencing using detection of pyrophosphate release.」、Analytical Biochemistry 242(1), 84-9;Ronaghi, M. (2001)「Pyrosequencing sheds light on DNA sequencing.」Genome Res. 11(1), 3-11;Ronaghi, M.、Uhlen, M. 及び Nyren, P. (1998)「A sequencing method based on real-time pyrophosphate.」、Science 281(5375), 363、米国特許No. 6,210,891、米国特許No. 6,258,568 及び米国特許No. 6,274,320が挙げられ、これらの参考文献は、その全体が参照により本明細書に組み入れられる)。ピロシークエンシングでは、放出されたPPiは、ATPスルフリラーゼによってアデノシン三リン酸(ATP)に直ちに変換されることによって検出することができ、生じたATPのレベルは、ルシフェラーゼによって製造される光子を介して検出することができる。
【0164】
合成しながらシークエンシングする(SBS)別の例示的な技術において、例えば米国特許No. 7,427,673、米国特許No. 7,414,116 及び米国特許No. 7,057,026(これらの特許文献は、その全体が参照により本明細書に組み入れられる)に記載の開裂可能又は光脱色可能な顔料標識を含有する可逆的ターミネーターヌクレオチドを段階的に添加することにより、サイクルシークエンシングを行う。このアプローチは、Solexa社(現Illumina社)により市販されており、また、WO 91/06678及びWO 07/123,744(米国特許局及び商標局へ米国出願No.12/295,337として提出された)にも記載されており、これらの特許文献は、その全体が参照により本明細書に組み入れられる。蛍光標識されたターミネーター(ターミネーションを反転可能で、かつ蛍光標識を開裂しうる)を利用可能なため、効率的な周期的可逆的ターミネーション(CRT)シークエンシングが容易になる。また、ポリメラーゼも共に設計(co-engineered)して、これらの修飾ヌクレオチドを効率的に組み込み、修飾ヌクレオチドから伸長させることもできる。
【0165】
本明細書に記載の方法及びシステムとともに利用可能な別の例示的なSBSシステム及び方法は、米国特許出願公開No. 2007/0166705 、米国特許出願公開No. 2006/0188901 、米国特許No. 7,057,026、米国特許出願公開No. 2006/0240439、米国特許出願公開No. 2006/0281109、PCT公開No. WO 05/065814、米国特許出願公開No. 2005/0100900、PCT公開No. WO 06/064199及びPCT公開No. WO 07/010,251に記載されており、これらの文献の内容は、その全体が参照により本明細書に組み入れられる。
【0166】
いくつかの実施形態では、ライゲート法によるシークエンシングを利用することができる。そのような手法は、DNAリガーゼを利用して短いオリゴヌクレオチドに結合し、かつその短いオリゴヌクレオチドが結合したことを識別する。本明細書に記載の方法及びシステムとともに使用し得る例示的なSBSシステム及び方法は、米国特許No. 6,969,488、米国特許No. 6,172,218 及び米国特許No. 6,306,597に記載されており、これらの文献の内容は、その全体が参照により本明細書に組み入れられる。
【0167】
いくつかの実施形態では、例えば次次世代技術のような手法を含みうる。その例としては、ナノポアシークエンシング技術が挙げられる(Deamer, D. W. &Akeson, M. 「Nanopores and nucleic acids: prospects for ultrarapid sequencing.」、Trends Biotechnol. 18, 147-151 (2000); Deamer, D. &D.Branton, 「Characterization of nucleic acids by nanopore analysis」、Acc. Chem. Res. 35:817-825 (2002); Li, J.、M. Gershow、D. Stein、E. Brandin &J. A. Golovchenko, 「DNA molecules and configurations in a solid-state nanopore microscope」、 Nat. Mater. 2:611-615(2003)が挙げられ、これらの文献の内容は、その全体が参照により本明細書に組み入れられる)。このような実施形態において、標的核酸はナノポアを通過する。ナノポアは、合成ポア、又は、α‐ヘモリジン等の生体膜タンパク質とすることができる。標的核酸がナノポアを通過するため、各塩基対は当該ポアの導電率の変動を測定することにより識別することができる(米国特許No. 7,001,792;Soni, G. V. &Meller, 「A. Progress toward ultrafast DNA sequencing using solid-state nanopores.」、Clin. Chem. 53, 1996-2001 (2007);Healy, K. 「Nanopore-based single-molecule DNA analysis.」Nanomed. 2, 459-481 (2007);Cockroft, S. L., Chu, J., Amorin, M. &Ghadiri, M. R. 「A single-molecule nanopore device detects DNA polymerase activity with single-nucleotide resolution.」、J. Am. Chem. Soc. 130, 818-820 (2008)が挙げられ、これらの文献の内容は、その全体が参照により本明細書に組み入れられる)。このような実施形態では、ナノポアシークエンシング技術は、本明細書に記載の方法によって生成する配列情報を確認するのに用いうる。
【0168】
いくつかの実施形態は、DNAポリメラーゼ活性のリアルタイムモニタリングを実施する方法を利用することができる。ヌクレオチド組み込みは、例えば米国特許No. 7,329,492及び米国特許No. 7,211,414(これらの特許は、その全体が参照により本明細書に組み込まれ)に記載されるように、フルオロフォア保有ポリメラーゼとγ‐リン酸標識ヌクレオチドとの間の蛍光共鳴エネルギー移動(FRET)相互作用によって、又は、例えば米国特許No. 7,315,019(この特許の全体は参照により本明細書に組み入れられる)に記載されるように、及び、例えば米国特許No. 7,405,281及び米国特許出願公開No. 2008/0108082(これらの特許は、その全体が参照により本明細書に組み入れられる) に記載されるように、蛍光ヌクレオチド類似体及び操作されたポリメラーゼを用いて、ゼロモード導波管を用いて検出することができる。照明は、表面凍結ポリメラーゼ(surface-tethered polymerase)周囲のゼプトリットルスケール(zeptoliter-scale)体積に限定して、蛍光標識したヌクレオチドの組込を低バックグラウンドで観測できるようにする(Levene, M. J. et al. 「Zero-mode waveguides for single-molecule analysis at high concentrations.」Science 299, 682-686 (2003);Lundquist, P. M et al. 「Parallel confocal detection of single molecules in real time.」Opt. Lett. 33, 1026-1028 (2008);Korlach, J. et al. 「Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nanostructures.」Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008)が挙げられ、これらの特許の内容は、その全体が参照により本明細書に組み入れられる)。一例では、Pacific Biosciences Inc.社によって提供される単一分子リアルタイム(SMRT)DNAシークエンシング技術は、本明細書に記載の方法とともに使用し得る。いくつかの実施形態では、SMRTチップなどを使用することができる(米国特許No. 7,181,122、No. 7,302,146、No. 7,313,308が挙げられ、上記特許文献はその全体が参照により本明細書に組み込まれる)。SMRTチップは複数のゼロモード導波管(ZMW)を含む。ZMWの各々は、透明基板によって支持された薄い金属膜を貫通する直径が数十ナノメートルである円筒状の孔を含む。透明基板を通ってZMWを照射する時、減衰した光は、各ZMWの低20~30nmを透過し、約1×10 -21 Lの検出量を形成することができる。比較的小さい検出量は、観察され得るバックグラウンドの量を減少させることによって蛍光シグナルの検出感度を増加させる。
【0169】
SMRTチップ及び類似技術は、ヌクレオチドの末端リン酸に蛍光標識されたヌクレオチド単量体と組み合わせて使用することができる(Korlach J. et al.,「Long, processive enzymatic DNA synthesis using 100% dye-labeled terminal phosphate-linked nucleotides.」Nucleosides, Nucleotides and Nucleic Acids, 27:1072- 1083, 2008が挙げられ、当該文献は、その全体が参照により本明細書に組み入れられる)。当該ヌクレオチドをポリヌクレオチドに組み込む時、標識はヌクレオチド単量体から取り除かれる。そのため、標識はポリヌクレオチドに組み込まれることなく、シグナル:バックグラウンド比を増加させる。また、標識されたヌクレオチド単量体から標識を取り除く条件の要求が低くなる。
【0170】
Helicos Biosciences社は、本明細書に記載のいくつかの実施形態と組み合わせ使用可能なシークエンシングプラットフォームの別の例示を提供する。いくつかの実施形態では、真の一分子配列決定を使用できる(Harris T. D. et al.,「Single Molecule DNA Sequencing of a viral Genome」 Science 320:106-109 (2008)が挙げられ、当該文献はその全体が参照により本明細書に組み入れられる)。1つの実施形態では、標的核酸のライブラリーは、各標的核酸に3'ポリ(A)尾部を付加することによって作製しうる。ポリ(A)尾部は、カバーガラスに固定されたポリ(T)オリゴヌクレオチドにハイブリダイズする。ポリ(T)オリゴヌクレオチドは、標的核酸と相補的なポリヌクレオチドを伸長させるためのプライマーとして使用しうる。1つの実施形態では、蛍光標識されたヌクレオチド単量体、つまりA、C、G又はTは、DNAポリメラーゼの存在下で標的核酸に1回に1つずつ送達される。標的核酸と相補的なポリヌクレオチドへの標識ヌクレオチドの組み込みを検出し、かつカバーガラス上における蛍光シグナルの位置は、伸長された分子を示す。シークエンシングサイクルを続けるために、次のヌクレオチドを加える前に蛍光標識を除去する。各ポリヌクレオチド鎖におけるヌクレオチドの組み込みを追跡することにより、個々の標的核酸についての配列情報を提供することが可能になる。
【0171】
本明細書に記載の方法はさらに、1つ又は複数のデータ分析ステップを含みうる。各種の方法によりシークエンシングリードを分析することができる。いくつかの実施形態では、コンピュータソフトウェアなどの自動化プロセスを用いてシークエンシングリードを分析することで、標的遺伝子座での対立遺伝子を検出する(例えば、野生型対立遺伝子、或いは、例えば染色体再編成、SNV、挿入または欠失、CNV又はスプライス変異といった突然変異)。いくつかの実施形態では、シークエンシングリード中の分子バーコードの配列に基づいて、同じ鋳型核酸由来のアンプリコンのシークエンシングリードを同定し、かつそれらを1つの配列にプールする。いくつかの実施形態では、突然変異を検出するためにDNAテンプレート及びRNAテンプレートに由来するヌクレオチド配列を同時に分析する。本明細書はさらに、複数の関心対象の遺伝子座のヌクレオチド配列を決定するためのコンピュータソフトウェア及びシステムを提供する。
【0172】
シークエンシングリードと、ゲノム及び/又はcDNA配列の既知の配列データベースとを整列させる方法は当技術分野において周知であり、かつ当該プロセスに適用するソフトウェアは市販されている。いくつかの実施形態では、野生型配列データベースに全体的にマッピングされていないリード(シークエンシングプライマー及び/又はアダプターヌクレオチド配列を除く)は、ゲノム再編成又は大きな挿入または欠失変異であってもよい。
【0173】
いくつかの実施形態では、ゲノム中の複数の位置にマッピングされた配列を含むリード(シークエンシングプライマー及び/又はアダプターヌクレオチド配列を除く)は、ゲノム再編成でありうる。本明細書に記載のいくつかの実施形態は、ヌクレオチド試料中の標的ヌクレオチド配列を参照配列と対比するか、及び/又は1つの試料の標的ヌクレオチド配列を参照試料の標的ヌクレオチド配列と対比することを含む。参照配列及び参照値はデータベースから得られる。参照試料は健康な個体又は野生型個体、組織或いは細胞に由来する試料であってもよい。例えばいくつかの実施形態では、個体の腫瘍細胞に由来する標的ヌクレオチド配列を分析し、同一の個体の健康細胞に由来する標的ヌクレオチド配列と対比して診断を提供する。
【0174】
配列変異体の検出方法
本願はさらに、本明細書に記載の標的ヌクレオチド配列の決定方法のいずれかにより核酸試料中に1つないしそれ以上の関心対象の遺伝子座を有する標的ヌクレオチド配列を決定し、かつ標的ヌクレオチド配列中の配列変異体を検出することを含む、核酸テンプレートを含む核酸試料中の関心対象の遺伝子座での配列変異体を検出する方法をさらに含む。
【0175】
いくつかの実施形態では、核酸テンプレートを含む核酸試料中の関心対象の遺伝子座での配列変異体を検出する方法であって、前記核酸テンプレートは関心対象の遺伝子座を有する標的ヌクレオチド配列を含み、当該方法は、(a)第1の末端に二本鎖部分を有し、第2の末端に非二本鎖部分を有するオリゴヌクレオチドであるユニバーサルアダプターを、第1の末端によって当該核酸テンプレートにライゲートすることにより、ライゲートされた核酸を提供するステップと、(b)ライゲートされた核酸を、標的ヌクレオチド配列を含む第1の鎖、及び第2の鎖に解離させるステップと、(c)外部プライマーは、ライゲートされた核酸の第1の鎖中の標的ヌクレオチド配列の近傍にアニールするステップと、(d)DNAポリメラーゼを用いて、外部プライマーを、ライゲートされた核酸の第1鎖の全長にわたって伸長させることにより、新生プライマー伸長二本鎖を提供するステップと、(e)十分に高い温度で新生プライマー伸長二本鎖を、ライゲートされた核酸の第1の鎖と一本鎖プライマー伸長生成物に解離させるステップと、(f)ステップ(c)~(e)を繰り返して1つないしそれ以上のプライマー伸長サイクルを行うステップと、(g)標的ヌクレオチド配列のPCR増幅に十分な条件下で、一本鎖プライマー伸長生成物をDNAポリメラーゼ、ユニバーサルアダプタープライマー及び内部プライマーに接触させるステップであって、当該ユニバーサルアダプタープライマーは、一本鎖プライマー伸長生成物におけるユニバーサルアダプターの非二本鎖部分の相補的配列にアニールし、当該内部プライマーは、3'末端において、標的ヌクレオチド配列に特異的にアニールした配列を含み、かつ、関心対象の遺伝子座について、当該内部プライマーは外部プライマーに対してネストされたものであるステップと、(h)ステップ(g)を繰り返して1つないしそれ以上の(例えば約2~100、約5~50又は約10~30の)PCR増幅サイクルを行うことにより、標的ヌクレオチド配列のアンプリコンを提供するステップと、(i)標的ヌクレオチド配列のアンプリコンに対して次世代シークエンシングを行うステップと、(j)シークエンシングリード中の配列変異体を検出するステップと、を含む方法を提供する。いくつかの実施形態では、ステップ(a)~(h)は、ライゲートされた核酸の第1の鎖に特異的にアニールした第1組の外部プライマー及び内部プライマーと、ライゲートされた核酸の第2の鎖に特異的にアニールした第2組の外部プライマー及び内部プライマーとを使用する。いくつかの実施形態では、第1組の外部プライマー及び第2組の外部プライマーは、少なくとも13ヌクレオチド長の第1の5'タグ配列を含み、かつ第1組の内部プライマー及び第2組の内部プライマーは、少なくとも13ヌクレオチド長の第2の5'タグ配列を含む。
【0176】
本明細書に記載の方法により複数種の配列変異体を検出することができる。いくつかの実施形態では、配列変異体は生殖細胞系DNAの中で遺伝している。いくつかの実施形態では、配列変異体は体細胞突然変異又は染色体再編成に由来する。いくつかの実施形態では、配列変異体は、例えばT細胞やB細胞受容体などの複数種の免疫受容体を提供するために、体細胞高頻度変異に由来する。いくつかの実施形態では、配列変異体は操作された配列変異体である。いくつかの実施形態では、配列変異体は、例えばCRISPR遺伝子編集といった遺伝子操作によるオフターゲット変異である。
【0177】
いくつかの実施形態では、複数種の配列変異体を検出する。本明細書に検出される配列変異体は1つの種類に限られない。いくつかの実施形態では、前記複数種の配列変異体は、染色体再編成、スプライス変異、点突然変異、欠失、挿入及びそれらの組み合わせから選ばれる。いくつかの実施形態では、前記複数種の配列変異体は遺伝子融合を含む。いくつかの実施形態では、前記複数種の配列変異体は染色体再編成を含む。いくつかの実施形態では、前記複数種の配列変異体は染色体転座を含む。いくつかの実施形態では、前記複数種の配列変異体は単一ヌクレオチド突然変異を含む。いくつかの実施形態では、前記複数種の配列変異体はSNVを含む。いくつかの実施形態では、前記複数種の配列変異体は挿入または欠失、例えば挿入又は欠失を含む。いくつかの実施形態では、当該方法は、RNA配列(又はcDNA配列)に基づく遺伝子融合とゲノムDNA配列に基づく突然変異(例えばSNV又は挿入または欠失)を同時に検出する。いくつかの実施形態では、当該方法は、RNA及びDNAに基づく同時検出のために、FFPE試料由来の核酸試料を用いる。いくつかの実施形態では、当該方法はctDNA試料を使用する。
【0178】
本明細書はさらに、標的核酸(例えばゲノムDNA)のメチル化状態を分析するためのビスルファイトシークエンシング方法も提供する。DNAメチル化は、様々な生物のゲノムの調節において重要な役割を果たす広汎なエピジェネティックな変化である。哺乳類動物ゲノムにおいて最も一般的で広く研究されているDNAメチル化形態は、通常はCpGジヌクレオチドという背景において、シトシン残基の炭素5位に発生する。5mCの検出のために使用可能な全ゲノムビスルファイトシークエンシング方法が記載されている。重亜硫酸ナトリウムによるゲノムDNAの処理は、5mCよりも遥かに速くシトシンを化学的に脱アミノ化し、優先的にそれらをウラシルに変換する。NGSを使用すれば、これらは全ゲノム範囲において単一塩基対の分解能で検出することができる。1つないしそれ以上の関心対象の遺伝子座を有する標的ヌクレオチド配列のメチル化分析の方法を、高精度かつ高効率で提供するために、任意の既知のビスルファイトシークエンシングプロセスを、本明細書に記載の方法に適用することができる。
【0179】
いくつかの実施形態では、配列変異体は低い対立遺伝子頻度で存在する。例えば、配列変異体は、約5核酸テンプレートあたり1コピー、10核酸テンプレートあたり1コピー、50核酸テンプレートあたり1コピー、100核酸テンプレートあたり1コピー、500核酸テンプレートあたり1コピー、1000核酸テンプレートあたり1コピー、10000核酸テンプレートあたり1コピーのうちのいずれか又はより低い頻度で存在しうる。
【0180】
IV. 応用
上記方法は、臨床診断及び予後並びに遺伝子操作ためのツールを含む複数種の応用に利用し得るが、これらに限定されない。いくつかの実施形態では、本明細書に記載の方法のいずれかを用いて、個体由来の核酸試料中の関心対象の遺伝子座における疾患に関連する配列変異体を検出することにより、疾患についての診断を提供する、個体の疾患(例えば遺伝性疾患又はがん)を診断する方法を提供する。
【0181】
したがって、いくつかの実施形態では、個体の疾患(例えば遺伝性疾患又はがん)を診断する方法であって、(a)個体から、標的ヌクレオチド配列を含有する核酸テンプレートを含む核酸試料を得るステップと、(b)第1の末端に二本鎖部分を有し、第2の末端に非二本鎖部分を有するオリゴヌクレオチドであるユニバーサルアダプターを、第1の末端によって当該核酸テンプレートにライゲートすることにより、ライゲートされた核酸を提供するステップと、(c)ライゲートされた核酸を、標的ヌクレオチド配列を含む第1の鎖、及び第2の鎖に解離させるステップと、(d)外部プライマーは、ライゲートされた核酸の第1の鎖中の標的ヌクレオチド配列の近傍にアニールするステップと、(e)DNAポリメラーゼを用いて、外部プライマーを、ライゲートされた核酸の第1鎖の全長にわたって伸長させることにより、新生プライマー伸長二本鎖を提供するステップと、(f)十分に高い温度で新生プライマー伸長二本鎖を、ライゲートされた核酸の第1の鎖と一本鎖プライマー伸長生成物に解離させるステップと、(g)ステップ(d)~(f)を繰り返して1つないしそれ以上のプライマー伸長サイクルを行うステップと、(h)標的ヌクレオチド配列のPCR増幅に十分な条件下で、一本鎖プライマー伸長生成物をDNAポリメラーゼ、ユニバーサルアダプタープライマー及び内部プライマーに接触させるステップであって、当該ユニバーサルアダプタープライマーは、一本鎖プライマー伸長生成物におけるユニバーサルアダプターの非二本鎖部分の相補的配列にアニールし、当該内部プライマーは、3'末端において標的ヌクレオチド配列に特異的にアニールする配列を含み、かつ、関心対象の遺伝子座について、当該内部プライマーは外部プライマーに対してネストされたものであるステップと、(i)ステップ(h)を繰り返して1つないしそれ以上の(例えば約2~100、約5~50又は約10~30の)PCR増幅サイクルを行うことにより、標的ヌクレオチド配列のアンプリコンを提供するステップと、(j)標的ヌクレオチド配列のアンプリコンに対して次世代シークエンシングを行うステップと、(k)シークエンシングリード中の疾患に関連する配列変異体を検出することにより、疾患についての診断を提供するステップと、を含む方法を提供する。いくつかの実施形態では、ステップ(b)~(i)は、ライゲートされた核酸の第1の鎖に特異的にアニールした第1組の外部プライマー及び内部プライマーと、ライゲートされた核酸の第2の鎖に特異的にアニールした第2組の外部プライマー及び内部プライマーとを使用する。いくつかの実施形態では、第1組の外部プライマー及び第2組の外部プライマーは、少なくとも13ヌクレオチド長の第1の5'タグ配列を含み、かつ第1組の内部プライマー及び第2組の内部プライマーは、少なくとも13ヌクレオチド長の第2の5'タグ配列を含む。いくつかの実施形態では、当該方法はさらに、疾患に関わる遺伝子の発現レベルを決定することを含む。
【0182】
いくつかの実施形態では、当該方法は、例えば遺伝性疾患又はがんなどの疾患の治療に関する情報を提供する。いくつかの実施形態では、当該方法は、疾患の治療を補助するために使用しうる。いくつかの実施形態では、疾患に関連する複数種の配列変異体を検出する。いくつかの実施形態では、配列変異体は、遺伝性疾患又はがんに関連する既知の配列変異体である。いくつかの実施形態では、配列変異体は、がん遺伝子又は腫瘍サプレッサーに関連する。いくつかの実施形態では、配列変異体は、融合がん遺伝子である。
【0183】
いくつかの実施形態では、当該方法はがんの診断に用いられる。いくつかの実施形態では、がんは肺がん、乳がん又は大腸がんである。いくつかの実施形態では、がんは非小細胞肺がんである。いくつかの実施形態では、当該方法は、がんに関連するSNV、挿入または欠失、CNV、遺伝子融合及び/又は異常なRNA発現を検出する。いくつかの実施形態では、当該方法は無細胞DNA試料を使用し、例えば循環腫瘍DNA(ctDNA)試料を使用する。いくつかの実施形態では、当該方法はFFPE試料由来の核酸試料を使用する。いくつかの実施形態では、当該方法はcDNA(又はRNA)及びgDNA配列の両方に基づいて配列変異体を検出する。
【0184】
いくつかの実施形態では、配列変異体は肺がんに関連する。いくつかの実施形態では、配列変異体は、ALK、ROS1、RET及び/又はRasにある。ALK、ROS1及びRET遺伝子に関わりかつ融合がん遺伝子を生じる遺伝子再編成は当技術分野において周知である(例えばSoda et al. Nature 2007 448561-6;Rikova et al. Cell 2007 131:1190-1203;Kohno et al. Nature Medicine 2012 18:375-7;Takouchi et al. Nature Medicine 2012 18:378-81を参照)。しかし、遺伝子再編成の正確な位置(例えば、ALK、ROS1及び/又はRET遺伝子において再編成が発生する位置)及び再編成に関与する第2の遺伝子のアイデンティティは変化し得る。本明細書に記載の方法において、そのような再編成の存在及びアイデンティティは、再構成の位置又は遺伝子再構成に関係する第2の遺伝子のアイデンティティを知る必要なく、検出されうる。
【0185】
本明細書に記載の方法の応用の非制限的な例には、血液悪性腫瘍マーカー及びそのパネル(例えば、リンパ腫及び白血病における染色体再編成を検出するための応用を含む)の検出、肉腫関連染色体再編成及びそのパネルの検出、リンパ腫の試験のためのIGH/TCR遺伝子再編成及びそのパネルの検出、および、肺がん、乳がん又は大腸がんに関連する遺伝子集団の検出、を含む。
【0186】
がんに対するある治療は、特定のがん遺伝子を含む腫瘍に対して特に有効であり、例えば所定の融合がん遺伝子の作用又は発現を標的とする治療剤は、当該融合がん遺伝子を含む腫瘍に対して有効でありうるが、融合がん遺伝子を欠如する腫瘍に対しては有効ではない。本明細書に記載の方法は、がん遺伝子の状態(例えば突然変異及び/又は染色体再編成)を明らかにする特異的配列を決定することができる。本明細書に記載の如き、本明細書に記載の方法は、片側の隣接配列のみが既知である特異的配列を決定することができ、例えば、本明細書に記載の方法は、正確な位置及び/又は再編成パートナーが、本明細書に記載の方法を行う前にわかっていない、既知のがん遺伝子を伴う遺伝子再再編成の存在及びアイデンティティを決定することができる。
【0187】
いくつかの実施形態では、当該方法、複数の試料及び/又は遺伝子の組み合わせ又は関心対象の遺伝子座に対する多重分析に使用される。いくつかの実施形態では、当該方法は、遺伝性疾患に関連する遺伝子の組み合わせをシークエンシングするために使用される。いくつかの実施形態では、当該方法は、がんに関連する遺伝子の組み合わせ(例えばがん遺伝子又は腫瘍抑制遺伝子)をシークエンシングするために使用される。
【0188】
下記表1には、本明細書に記載のがんの診断のための方法により検出できる配列変異体及び遺伝子の非制限的な例、及び、配列変異体を有するがんの治療に使用できる例示的な試薬が挙げられている。
【0189】
【表1】
【0190】
「個体」とはヒト又は動物を指す。いくつかの実施形態では、個体は、例えば霊長類動物、齧歯類動物、家畜動物又は狩猟動物などの脊椎動物である。霊長類動物は、チンパンジー、カニクイザル、クモザル、及び、例えばアカゲザルのようなマカクを含む。齧歯動物は、マウス、ラット、グラウンドホッグ、フェレット、ウサギ、及びハムスターを含む。家畜及び狩猟動物は、ウシ、ウマ、ブタ、シカ、バイソン、バッファロー、例えばネコのようなネコ種、例えばイヌ、キツネ、オオカミのようなイヌ種、例えばニワトリ、エミュー、ダチョウのような鳥類、及び、例えばマス、ナマズ及びサケのような魚類を含む。いくつかの実施形態では、個体は、例えばヒト、非ヒト霊長類動物、マウス、ラット、イヌ、ネコ、ウマ又はウシのような哺乳類動物である。技術用語「個体」、「患者」及び「被検者」は本明細書において互換的に用いられる。個体は、治療を必要とする状態(例えばがん)、又はそのような状態に関連する1つもしくは複数の合併症に罹っている又は有すると既に診断されているか、または同定されている、及び任意で状態または状態に関連する1つもしくは複数の合併症に関する治療を既に受けている対象でありうる。または、個体は、状態(例えばがん)または状態に関連する1つもしくは複数の合併症を有するとこれまで診断されていない個体でもありうる。例えば、個体は、状態に関するまたは状態に関連する1つもしくは複数の合併症に関する1つもしくは複数の危険因子を示す個体、または危険因子を示さない個体でありうる。
【0191】
いくつかの実施形態では、がんの治療を必要とする個体から得られた腫瘍試料において、本明細書に記載の方法のいずれかによって、がんに関連する1種又は複数種の配列変異体(例えば融合がん遺伝子又は発がん性突然変異)の存在を検出すること、及び、検出されたがんに関連する任意の配列変異体を有する腫瘍に対して有効ながん治療剤を投与すること、を含むがんの治療方法を提供する。いくつかの実施形態では、被検者から得られた腫瘍試料において、本明細書に記載の方法のいずれかによって、がんに関連する配列変異体(例えば融合がん遺伝子又は発がん性突然変異)の存在を検出し、そこで、がんに関連する配列変異体の存在を検出した場合、被検者が治療レジメンに対して応答性であると確認することを含む、がんの治療を必要とする個体が治療レジメンに応答するか否かを確認する方法を提供する。
【0192】
いくつかの実施形態では、当該方法は、インプットされる核酸の量が少なく及び/又はインプットされる核酸の品質が低い応用へ使用される。いくつかの実施形態では、当該方法は臨床試料、例えばFFPE試料のような腫瘍生検試料をシークエンシングするために使用される。いくつかの実施形態では、当該方法は、古い試料をシークエンシングするために使用される。
【0193】
いくつかの実施形態では、当該方法は、標的ヌクレオチド配列が核酸試料において非常に低いレベルで存在する応用へ使用される。例えば、当該方法は、微生物相シークエンシング、及び新しい変種ウイルス遺伝子タイピングのために使用される。
【0194】
いくつかの実施形態では、当該方法は、例えばCRISPR遺伝子編集技術によって得られた遺伝子操作された細胞集団又は動物においてクローンを同定するために使用される。いくつかの実施形態では、当該方法は、CRISPR遺伝子編集されたオフターゲット部位(例えば従来既知又は未知のオフターゲット部位)を表すために使用される。いくつかの実施形態では、当該方法用は、細胞に基づく治療法に用いられる操作された細胞を評価するために使用される。いくつかの実施形態では、当該方法は、細胞に基づく治療法の安全性を改善するために使用され、ここで、CRISPR遺伝子編集技術によって個体に投与される細胞が操作される。
【0195】
いくつかの実施形態では、当該方法は、免疫細胞受容体をコードする遺伝子を同定するために使用される。いくつかの実施形態では、免疫細胞受容体はT細胞受容体である。いくつかの実施形態では、当該方法は、操作された免疫細胞受容体、例えばキメラ抗原受容体(CAR)又は組換えT細胞受容体(TCR)を同定するために使用される。いくつかの実施形態では、当該方法は、例えばTCR配列(例えばCDR3配列)の多様性を決定することによって、免疫分析に使用される。いくつかの実施形態では、当該方法は、腫瘍抗原に応答するTCR配列を同定するために使用される。いくつかの実施形態では、当該方法は、腫瘍抗原に対する免疫療法についての個体の免疫応答を評価するために使用される。
【0196】
IV. キット及び製品
本願はさらに、1つないしそれ以上の関心対象の遺伝子座を有するヌクレオチド配列を補強及び決定するための組成物、キット及び製品、或いは本明細書に記載の各種の応用を提供する。前記組成物、キット及び製品は、本明細書に記載のユニバーサルアダプター、ネストされた標的特異的プライマー、ユニバーサルアダプタープライマー、シークエンシングアダプタープライマー及びシークエンシングプライマーのうちのいずれか1種又は複数種を含みうる。
【0197】
いくつかの実施形態では、(a)第1の末端にライゲート可能な二本鎖部分を含みかつ第2の末端に非二本鎖部分を含むオリゴヌクレオチドであるユニバーサルアダプターと、(b)ユニバーサルアダプターの非二本鎖部分の相補的配列にアニール可能なユニバーサルアダプタープライマーと、(c)外部プライマーと、(d)内部プライマーと、を含み、関心対象の遺伝子座について、内部プライマーが外部プライマーに対してネストされたものである、キットを提供する。いくつかの実施形態では、当該キットはさらにDNAポリメラーゼ及びヌクレオチドを含む。いくつかの実施形態では、関心対象の遺伝子座は、ALK、BRAF、EGFR、ERBB2、HRAS、KDR、KIT、KRAS、MET、NRAS、NTRK1、PDGFRA、PIK3CA、PTEN、RET、ROS1及びTP53から選ばれる遺伝子のうちのいずれか1つ又は複数にある。
【0198】
いくつかの実施形態では、(a)第1の末端にライゲート可能な二本鎖部分を含みかつ第2の末端に非二本鎖部分を含むオリゴヌクレオチドであるユニバーサルアダプターと、(b)ユニバーサルアダプタープライマーであって、当該ユニバーサルアダプタープライマーは3'末端に、ユニバーサルアダプターの非二本鎖部分の相補的配列に特異的にアニール可能な配列を含み、かつ5'末端又は当該ユニバーサルアダプターに、NGSプラットフォームに適合する第1のシークエンシングプライマーの配列と同一の又は相補的な配列を含むユニバーサルアダプタープライマーと、(c)外部プライマーと、(d)内部プライマーとを、を含み、関心対象の遺伝子座について、内部プライマーが外部プライマーに対してネストされたものである、キットを提供する。いくつかの実施形態では、内部プライマーは、NGSプラットフォームに適合する第2のシークエンシングプライマーの配列と同一の又は相補的な配列を含む。いくつかの実施形態では、当該キットはさらに、3'末端に内部プライマーの配列と同一の配列を含み、5'末端にNGSプラットフォームに適合する第2のシークエンシングプライマーの配列と同一の又は相補的な配列を含むシークエンシングアダプタープライマーを含む。いくつかの実施形態では、キットはさらに、第1のシークエンシングプライマー及び第2のシークエンシングプライマーを含む。いくつかの実施形態では、当該キットはさらにDNAポリメラーゼ及びヌクレオチドを含む。いくつかの実施形態では、関心対象の遺伝子座は、ALK、BRAF、EGFR、ERBB2、HRAS、KDR、KIT、KRAS、MET、NRAS、NTRK1、PDGFRA、PIK3CA、PTEN、RET、ROS1及びTP53から選ばれる遺伝子のうちのいずれか1つ又は複数にある。
【0199】
いくつかの実施形態では、当該キットは、関心対象の遺伝子座を有する標的ヌクレオチド配列を富化するために使用される。いくつかの実施形態では、当該キットはシークエンシングライブラリーを作製するために使用される。いくつかの実施形態では、当該キットは、関心対象の遺伝子座を有する標的ヌクレオチド配列を決定するために使用される。いくつかの実施形態では、当該キットは、関心対象の遺伝子座を有する配列変異体を検出するために使用される。いくつかの実施形態では、当該キットは、疾患又は状態を診断するために使用される。いくつかの実施形態では、当該キットは、疾患又は状態を治療するために使用される。いくつかの実施形態では、当該キットは、例えば肺がん、乳がん又は大腸がんのようながんを診断するために使用される。いくつかの実施形態では、当該キットは、例えば肺がん、乳がん又は大腸がんのようながんを治療するために使用される。
【0200】
いくつかの実施形態では、当該キットは、関心対象の遺伝子座を含む核酸テンプレートの第1の鎖に特異的にアニール可能な第1組の外部プライマー及び内部プライマーと、核酸テンプレートの第1の鎖の相補的鎖に特異的にアニール可能な第2組の外部プライマー及び内部プライマーとを含む。いくつかの実施形態では、第1組の外部プライマー及び第2組の外部プライマーは、少なくとも約13ヌクレオチド長の第1の5'タグ配列を含み、かつ第1組の内部プライマー及び第2組の内部プライマーは、少なくとも約13ヌクレオチド長の第2の5'タグ配列を含む。いくつかの実施形態では、当該キットは、複数組の(例えば少なくとも約2、5、10、20、50、100、200、500、1000、2000、5000、10000、20000のうちのいずれか又はより多くの)外部プライマー及び内部プライマーを含む。いくつかの実施形態では、複数の異なる関心対象の遺伝子座を有する標的配列を富化又は決定するために、複数組の外部プライマー及び内部プライマーを用いうる。いくつかの実施形態では、前記複数組の外部プライマー及び内部プライマーは、少なくとも約2、5、10、20、50、100、200、500、1000、2000、5000のうちのいずれか又はより多くの異なる関心対象の遺伝子座を有する標的配列の富化又は決定のために使用しうる。いくつかの実施形態では、複数組の外部プライマー及び内部プライマーは、約2~200、例えば約2~100、2~50、5~100、10~100又は50~150のうちのいずれかの異なる関心対象の遺伝子座を有する標的配列の富化又は決定のために使用しうる。いくつかの実施形態では、複数組の外部プライマー及び内部プライマーは、約100~5000、例えば約100~500、500~1000、100~2000、1000~2000、2000~3000又は3000~5000のうちのいずれかの異なる関心対象の遺伝子座を有する標的配列の富化又は決定のために使用することができる。いくつかの実施形態では、ユーザのニーズに応じてに応じて、キットは関心対象の遺伝子座について特注設計のものである。
【0201】
いくつかの実施形態では、当該キットはさらに、核酸試料を調製するための試薬及び酵素を含む。いくつかの実施形態では、当該キットは、血液試料から核酸試料を調製するための試薬を含む。いくつかの実施形態では、当該キットは、腫瘍生検試料から核酸試料を調製するための試薬を含む。いくつかの実施形態では、当該キットは、FFPE試料から核酸試料を調製するための試薬を含む。いくつかの実施形態では、当該キットは、例えば循環腫瘍DNA試料のような無細胞DNA試料から核酸試料を調製するための試薬を含む。いくつかの実施形態では、当該キットは、少なくとも1、2、4、10、15、20、100、500、1000のうちのいずれか又はより多くのシークエンシングライブラリーの作製に十分な試薬、プライマー及びアダプターを提供する。
【0202】
いくつかの実施形態では、当該キットはさらに、ある配列変異体の検出に基づくがんの治療に適する試薬を含む医薬組成物を含む。例えば表1を参照されたい。
【0203】
当該キットは、例えば容器、緩衝液、試薬、又は補因子などの1種又は複数種の追加要素、又は、例えば変性剤のような追加試薬を含みうる。キットの構成要素は一緒にパッケージすることができ、かつパッケージには、キットを本明細書に記載の方法のいずれかに使用する時の取扱説明書が含まれているか、又は添付されていることができる。いくつかの実施形態では、当該キットはさらに、例えばがんのような疾患又は状態を診断及び/又は治療するための取扱説明書を含む。
【0204】
本発明から逸脱することなく種々の改変、組み合わせ及び/又は補正が行われ得るということは、当業者であれば理解できる。
【0205】
実施例
以下の実施例は、本発明について例示するのみのためであり、本発明をいかなる形でも限定するものと解釈されるべきではない。以下の実施例及び詳しい記載は、本発明を限定するものではなく、説明するためのものである。
【0206】
実施例1:がん関連配列変異体の高感度検出のための効率的な標的富化及び配列決定法
当該実施例は、がん関連配列変異体を検出する例示的な方法を示している。8つのユニバーサルアダプターの各々は、多重シークエンシングライブラリーの作製のための試料バーコードを有する。各核酸試料から、遺伝子座を合計246個有する標的配列を富化する。開始インプットヒトDNA試料の2つの異なる量、つまり5ngと50ngを使用する。KAPA酵素を例として説明する。図1は当該方法を示す模式図である。
【0207】
プライマーの調製
表2に示される1つの上鎖オリゴヌクレオチド(TOP-Oligo、第1の鎖)と1つの下鎖オリゴヌクレオチド(BOT-Oligo、第2の鎖)をアニールして各ユニバーサルアダプターを調製する。また、表2には、ユニバーサルアダプタープライマー、シークエンシングプライマー、及び、TP53遺伝子における複数の関心対象の遺伝子座に対する外部プライマー及び内部プライマーの例示的なプールが示されている。
【0208】
ブロッキング部分を有するユニバーサルアダプター又はブロッキング部分を有さないユニバーサルアダプターを用いることができる。例えば、第2の鎖中にブロッキング部分を有するユニバーサルアダプター(例えば、ホスホロチオエート修飾を有するフラップ状のヌクレオチド)は、Y-TOP-01とY-BOT-01をアニールすることによって調製することができる。第2の鎖中にブロッキング部分を有さない対応するユニバーサルアダプターは、Y-TOP-01と、ブロックされていないY-BOT-01をアニールすることによって調製することができる。ブロックされたユニバーサルアダプターとブロックされていないユニバーサルアダプターを使用したライブラリーの構築効率を確認する。
【0209】
【表2】
【0210】
ステップ 1. 1本のチューブでの断片化、末端修復、A-テーリング及びライゲーション
1)断片化:氷上で、断片化緩衝液(10X)2.5μL、断片化酵素(Frag Enzyme)(KAPA Bio)5.0μL、及びDNA試料を混合することによって断片化したマスターミックスを調製し、かつヌクレアーゼフリー水を用いてマスターミックスを17.5μLにした。反応物を37℃で15分間インキュベートした。4℃で温度保持した。
2)末端修復及びA-テーリング:氷上で、末端修復及びA-テーリング緩衝液3.5μL、末端修復及びA-テーリング酵素混合物1.5μLを混合することによってマスターミックスを調製した。このマスターミックス5.0μLを上記断片化した反応物中に加え、穏やかにボルテックスして短時間遠心分離した。直ちに反応物をサーマルサイクラーに戻し、37℃で15分間、65℃で15分間インキュベーションし、次に4℃で温度保持して末端修復及びA-テーリングを行い、直ちに次のステップに入る。
3)アダプターライゲーション:氷上で、結合緩衝液15.0μLと、DNAリガーゼ5.0μLを混合することによってマスターミックスを調製した。10μMユニバーサルアダプター(試料バーコード付)5.0μLを上記末端修復及びA-テーリング反応物に加え、ピペッティングを5回行って穏やかに混合し、次いでマスターミックス20.0μLを上記ステップ2)由来の各反応物に添加し、穏やかにボルテックスして短時間遠心分離し、次に16℃で30分間、30℃で30分間インキュベーションし、かつ12℃で温度保持した。
4)ライゲーション後のクリーンアップ(PCR前領域に行う):1.5容量(すなわち82.5μL)のAMPURE(R)ビーズを製造業者のプロトコルに従って使用してライゲーション反応をクリーンアップし、これを最終20μLの1X Tris-緩衝液中で溶出させた。ビーズを次のステップ(プライマー伸長)に移す。
【0211】
ステップ 2. 標的富化 1‐プライマー伸長
ヌクレアーゼフリー水4.4μL、Taqポリメラーゼ緩衝液(10X、マグネシウムフリー、ThermoFisher)3.0μL、dNTP混合物(10mM)0.6μL、Mg2+(50mM)1.2μL、PLATINUM(TM) Taqポリメラーゼ(5U/μL)0.3μL、及び外部プライマープール(50μM)0.5μLを混合することによって、プライマー伸長マスターミックスを調製した。ライゲーション後のクリーンアップ試料20.0μLをプライマー伸長マスターミックス30.0μLに加えた。得られた混合物をサーマルサイクラー中でインキュベートし、95℃で5分間保持し、[+0.2℃/秒の速度で95℃までに昇温、95℃で10秒間保持、-0.2℃/秒の速度で60℃までに降温、60℃で10分間保持]を20サイクル行い、そして、4℃で温度保持するというプロセスでプライマー伸長反応を行った。
【0212】
PCR後領域において、1.2X容量(36.0μL)のAMPURE(R)ビーズを製造業者のプロトコルに従って使用してプライマー伸長生成物をクリーンアップし、かつ20μLの1X Tris-緩衝液中で溶出させた。
【0213】
ステップ 3. 標的富化 2‐PCR
ヌクレアーゼフリー水1.9μL、Taqポリメラーゼ緩衝液(10X、マグネシウムフリー、ThermoFisher)3.0μL、dNTP混合物(10mM)0.6μL、Mg2+(50mM)1.2μL、PLATINUM(TM) Taqポリメラーゼ(5U/μL)0.3μL、P5プライマー(10μM)1.0μL、及び内部プライマープール(50μM)1.0μLを混合することによって、PCRマスターミックスを調製した。プライマー伸長後のクリーンアップ試料20.0μLをPCRマスターミックス9.0μL中に加え、かつ各試料中に、1.0μLの各対応するI7プライマー(バーコード付、10μM)を添加した。得られた混合物をサーマルサイクラー中でインキュベートし、95℃で5分間保持し、[95℃で30秒、60℃で5分間]を15サイクル行い、そして、4℃で温度保持する、というプロセスでポリメラーゼ連鎖反応を行った。
【0214】
PCR後領域において、1.2X容量(36.0μL)のAMPURE(R)ビーズを製造業者のプロトコルに従って使用してPCR産物をクリーンアップし、かつ20μLの1X Tris-緩衝液で溶出させた。
【0215】
ステップ 4. シークエンシング
クリーンアップしたPCR産物をKAPA qPCRキットにより定量化し、かつ標準プロトコルに従って Illuminaシークエンシングシステムによりシークエンシングを行った。
【0216】
ステップ 5. データ分析
bcl2fqパッケージを用いて、BCLフォーマットのシークエンシングデータをFASTQフォーマットに変換し、I7バーコードを用いて試料の逆多重化を行った。カスタムスクリプトを用いて、初期処理されたFASTQファイルを、リード1に統合されたアダプターバーコードに基づいてさらに逆多重化し、次いでアダプター配列を切断した。BWA-MEMを用いて、二重逆多重化されたFASTQファイルをヒトゲノム(hg19)にマッピングした。分子バーコード配列に基づいて、同じ核酸テンプレートに由来する増幅産物配列を同定してプールした。BEDtools、ターゲットBEDファイル及びカスタムスクリプトを用いてシークエンシング仕様を計算した。ユニーク分子インデックスを認識し得るスクリプトを用いてSNV及び挿入または欠失(Indel)を呼び出すことにより、変異体を呼び出した。
【0217】
結果
図4(a)~図4(b)は、IGVソフトウェアに由来するマッピングされたリードを示す図であり、EGFR遺伝子内に関心対象の遺伝子座を有するリード集積を示している。図4(a)は図S5の複製であり、Zheng Z. et al. Nature Medicine 20: 1479-1484 (2014)の記載に基づいて、使用名が「固定多重PCR」又は「AMP」の方法の結果を示している。AMP法においてインプットDNAを5ng使用する場合、マッピングされたリードは関心対象の遺伝子座の周りにブロック状のリード集積を有することから、少量のインプットDNAを使用する場合にライブラリーの複雑さが低くなり、ライブラリー構築効率が低下することが分かった。
【0218】
これに対し、図4(b)は、本実施例に記載の方法を利用した結果を示している。AMP法と同じ量のインプットDNA(例えば、図4(a)及び図4(b)において○で強調表示された5ngのパネル中のマッピングされたリード)を用いて、本発明の方法はより平滑なリード集積を生成することから、少量のインプットDNAを使用することでより高いライブラリー複雑さ及びより高いライブラリー構築効率が得られることが分かった。
【0219】
図5(a)及び図5(b)はそれぞれ、2つのシークエンシングライブラリーY01-P749(50ngのインプットDNAを使用)とY02-P750(5ngのインプットDNAを使用)の全パネルカバレッジの統計を示している。原データは、標的にマッピングされた全てのシークエンシングリードを意味する。統合されたデータは、同一の核酸テンプレートに属するシークエンシングリードを同定及び併合した後のシークエンシングリードを意味する。その結果、本明細書に記載の方法において50ngと5ngのインプットDNAの両方を使用する場合、標的ヌクレオチド配列をバイアスなく富化することが分かった。
【0220】
実施例2:1つの反応において、RNAに基づく遺伝子融合の検出とgDNAに基づく突然変異の検出を同時に行う。
本実施例は、1つのシークエンシング反応においてRNAとgDNAに由来する配列変異体を検出することを説明する。
【0221】
ステップ 1. FFPE 試料からRNAを精製する
簡単に言えば、まずFORMAPURE(R) FFPEキットを用いてFFPE試料からRNAを抽出した。QUBIT(R) RNAキットを用いてRNA濃度を測定した。合計約15ngの全核酸(10ngの抽出したRNA及び 5ngのgDNAを含む)を次のステップに供する。
【0222】
ステップ 2. 二本鎖 cDNAの合成
1)RNA変性: PCRチューブ内に各RNA試料が11.0μLになるようにDEPC処理された水を用いて調整し、次にランダム六量体(300ng/μL)1.0μL及びdNTP(10mM)1.0μLを添加した。ピペッティングを5回行って混合物を混合し、かつ65℃で5分間インキュベートする(103℃で熱蓋(heat lid)を「on」にする)ことによりRNA変性を行った。インキュベートした後、直ちに試料プレートを氷水上で少なくとも1分間冷却し、短時間遠心分離し、氷上に戻した。
2)逆転写(第1の鎖cDNAの合成):SUPERSCRIPT(R) IV緩衝液(5X, ThermoFisher)5.0μL、RNASEOUT(R)1.0μL、SUPERSCRIPT(R) IV(ThermoFisher)1.0μL、及びDTT(新鮮で0.1M)2.0μLを混合することによって、マスターミックスを調製した。マスターミックス9.0μLをPCRプレートにおける反応物の各々に加え、ピペッティングを5回行って十分に混合した。PCRプレートをサーマルサイクラー中でインキュベートし、25℃で10分間、42℃で30分間、70℃で15分間、4℃で温度保持する(103℃で熱蓋を「on」にする)というプロセスで逆転写を行った。
3)第2の鎖cDNAの合成:DEPC処理された水18.0μL、10x第2の鎖反応緩衝液5.0μL、DNAポリメラーゼI 4.0μL、及びRNase H 1.0μLを混合することによって、マスターミックスを調製した。スターミックス28μLを以上のステップに由来する各反応物に加え、ピペッティングを5回行って穏やかに混合した。混合の反応温度を16℃以下に制御した。反応混合物を16℃で2時間インキュベートし、次に4℃に温度保持した(熱蓋を「off」にした)。
【0223】
SPRI製造業者のクリーンアッププロトコールに従って、1.8X容量(つまり90μL)のAMPURE(R)ビーズを用いて反応混合物をクリーンアップし、最終15μLの1X Tris-緩衝液で溶出させた。
【0224】
クリーンアップした反応混合物からシークエンシングライブラリーを作製し、実施例1と同じステップ(ステップ1~5)によりシークエンシング及び分析を行った。
【0225】
図6(a)~図6(f)は、本明細書に記載の例示的な方法によって、がんに関連する各種の遺伝子融合に対してRNAに基づく検出に成功したことを示している。図7(a)~図7Bは、1つのシークエンシング試料において、EML4-ALK遺伝子融合のRNAに基づく検出(図7(a))及びKRAS突然変異のgDNAに基づく検出(図7B)を同時に行ったことを示している。ここで検出されたEML4-ALK突然変異及びKRAS突然変異(例えばG12D、G13C及びG13D)の両方も肺がんを意味する。
【0226】
実施例3:標的富化方法の対比
本実施例は、標的富化1(つまり実施例1のステップ2)における指数的増幅(つまりAMP法)と線形的増幅(つまり本願の例示的な方法)、プライマー伸長サイクルの間の高速温度勾配モードと低速温度勾配モード、及び、異なる開始量のDNA試料を含む種々の標的富化方法を対比する。
【0227】
表3に示されているように、合計24個の標的富化試料を有する多重シークエンシングライブラリーを作製して、3つの異なる実験要素を評価した。各要素は異なる2つの配置があり、かつ1式3部で各実験条件の組み合わせを測定した。3つの実験要素のほか、実施例1と同じ実験ステップを行った。この3つの要素は、(1)DNAインプット量(50ng又は5ng)、(2)標的富化1ステップ:プライマー伸長(つまり線形的増幅)又はPCR増幅(つまり指数的増幅)、及び(3)プライマー伸長温度勾配モード(一般の勾配:95℃で3分間保持し、[95℃で30秒間保持、0.5℃/秒で60℃までに降温、60℃で10分間温度保持、72℃で30秒間保持]を20サイクル行い、4℃に温度保持すること、及び、緩やか勾配:95℃で3分間保持し、[95℃で30秒間保持、0.2℃/秒で60℃までに降温、60℃で10分間温度保持、0.2℃/秒で95℃までに昇温]を20サイクル行い、4℃で温度保持すること)である。
【0228】
【表3】
【0229】
図8(a)~図8(d)及び表3に示されているように、標的富化1(つまり実施例1のステップ2)においてプライマー伸長サイクル(つまり線形的増幅)を用いる方法は、PCR増幅サイクル(つまりPCR増幅)を用いる方法に比べて、そして、温度勾配モードは一般勾配モードに比べて、50ngのDNAと5ngのDNAの両方を用いる時により高いライブラリー構築効率を得ることができる。図9(a)~図9(d)はさらに、12個のシークエンシングライブラリー由来のマッピングされたリードによるKRASエクソン2へのカバレージを示している。
【0230】
【表4】
【0231】
本明細書に記載のすべての刊行物、特許、特許出願及び公開された特許出願の開示内容は、その全文が参照により本明細書に組み入れられる。
図1
図2
図3
図4(a)】
図4(b)】
図5(a)】
図5(b)】
図6(a)】
図6(b)】
図6(c)】
図6(d)】
図6(e)】
図6(f)】
図7(a)】
図7(b)】
図8(a)】
図8(b)】
図8(C)】
図8(d)】
図9(a)】
図9(b)】
図9(C)】
図9(d)】
【配列表】
0006998404000001.app