(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-01-18
(45)【発行日】2022-01-26
(54)【発明の名称】DNAプロファイリングのための方法および組成物
(51)【国際特許分類】
C12Q 1/686 20180101AFI20220119BHJP
C12M 1/00 20060101ALI20220119BHJP
C12M 1/34 20060101ALI20220119BHJP
C12N 15/10 20060101ALI20220119BHJP
C12Q 1/6869 20180101ALI20220119BHJP
C40B 40/06 20060101ALI20220119BHJP
【FI】
C12Q1/686 Z ZNA
C12M1/00 A
C12M1/34 Z
C12N15/10 Z
C12Q1/6869 Z
C40B40/06
(21)【出願番号】P 2016552591
(86)(22)【出願日】2015-02-13
(86)【国際出願番号】 US2015015939
(87)【国際公開番号】W WO2015126766
(87)【国際公開日】2015-08-27
【審査請求日】2017-12-05
【審判番号】
【審判請求日】2020-01-17
(32)【優先日】2014-02-18
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2015-01-14
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2014-08-28
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】514202402
【氏名又は名称】イラミーナ インコーポレーテッド
(74)【代理人】
【識別番号】100147485
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】100167623
【氏名又は名称】塚中 哲雄
(72)【発明者】
【氏名】キャサリン エム スティーブンス
(72)【発明者】
【氏名】シドニー ホルト
(72)【発明者】
【氏名】キャリー デイビス
(72)【発明者】
【氏名】アン イェーガー
(72)【発明者】
【氏名】パウリナ ワリチェウィツ
(72)【発明者】
【氏名】ヨンミー ハン
(72)【発明者】
【氏名】デイビッド シルバ
(72)【発明者】
【氏名】ミン ジュイ リチャード シェン
(72)【発明者】
【氏名】ササン アミニ
(72)【発明者】
【氏名】フランク ステーマス
【合議体】
【審判長】森井 隆信
【審判官】松野 広一
【審判官】高堀 栄二
(56)【参考文献】
【文献】国際公開第2012/155084(WO,A1)
【文献】国際公開第2006/004659(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00-15/90
C12M 1/00-3/10
C12Q 1/00-3/00
PubMed
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/BIOSIS/EMBASE/WPIDS(STN)
(57)【特許請求の範囲】
【請求項1】
DNAプロファイルを構築する方法であって、
核酸試料を用意すること、
一塩基多型(SNP)を含む少なくとも1つの標的配列および縦列反復配列を含む少なくとも1つの標的配列に特異的にハイブリダイズする複数のプライマーを含む1つのプライマーセットを用いて該核酸試料を多重反応において増幅させ、増幅産物を生成することであって、
該1つのプライマーセットに含まれる複数の該プライマーの全ては、60℃未満の融解温度を有し、前記標的配列にハイブリダイズする少なくとも24ヌクレオチドの長さを有し、そして、AT含量は少なくとも
60%とATリッチであ
る、ならびに
該増幅産物中の少なくとも1つのSNPおよび少なくとも1つの縦列反復配列の遺伝子型を決定し、それにより該核酸試料のDNAプロファイルを構築することを含む方法。
【請求項2】
該増幅産物から核酸ライブラリーを作成することをさらに含む、請求項1に記載の方法。
【請求項3】
前記核酸ライブラリーの配列を決定することをさらに含む、請求項2に記載の方法。
【請求項4】
該核酸試料がヒト、環境試料、植物、非ヒト動物、細菌、古細菌、真菌、またはウイルス由来である、請求項1~3のいずれか一項に記載の方法。
【請求項5】
少なくとも1つの該SNPが、該核酸試料の供給源の祖先型または表現型の特徴を示す、請求項1~4のいずれか一項に記載の方法。
【請求項6】
該DNAプロファイルが、疾患の診断または予後、がんバイオマーカーの同定、遺伝子異常の同定または遺伝的多様性分析、データバンキング、法医学、刑事事件捜査、父親または個人識別の1つ以上に使用される、請求項1~5のいずれか一項に記載の方法。
【請求項7】
該核酸試料がポリメラーゼ連鎖反応(PCR)により増幅される、請求項1~6のいずれか一項に記載の方法。
【請求項8】
該核酸試料が、従来方式で設計されたプライマーと共に使用される増幅緩衝液の塩濃度と比べて増加した塩濃度を有する増幅緩衝液中で増幅され、前記従来方式で設計されたプライマーは、18~22ヌクレオチドの長さを有し、55℃~58℃の融解温度を有し、GC含量は40~60%であり、4ジヌクレオチドAT反復を最大とすることを特徴とする、請求項7に記載の方法。
【請求項9】
該SNPが、祖先型SNP、表現型SNP、同一性SNP、またはそれらの組み合わせであり、および/または複数の該プライマーが、少なくとも30のSNPまたは少なくとも50のSNPに特異的にハイブリダイズし;および/または前記縦列反復配列が、短鎖縦列反復配列(STR)、中鎖縦列反復配列(ITR)、またはそれらの変異であり;および/または、前記複数の該プライマーが、少なくとも24の縦列反復配列または少なくとも60の縦列反復配列に特異的にハイブリダイズし;および/または前記核酸試料が100pg~100ngのDNA、または10pg~100pgのDNA、または5pg~10pgのDNAを含み;および/または前記核酸試料がゲノムDNAを含み;および/または前記少なくとも1つのSNPおよび少なくとも1つの縦列反復配列の遺伝子型の少なくとも50%、80%、90%、または95%が決定される、請求項1~8のいずれか一項に記載の方法。
【請求項10】
複数の該プライマーのそれぞれが、前記標的配列に相同でない1つ以上のタグ配列を含む、請求項1~9のいずれか一項に記載の方法。
【請求項11】
1つ以上の該タグ配列が、プライマータグ、捕捉タグ、配列決定タグ、固有分子識別子タグ、またはそれらの組合せを含む、請求項10に記載の方法。
【請求項12】
核酸ライブラリーを構築する方法であって、
核酸試料を用意すること、ならびに
一塩基多型(SNP)を含む少なくとも1つの標的配列および縦列反復配列を含む少なくとも1つの標的配列に特異的にハイブリダイズする複数のプライマーを含む1つのプライマーセットを用いて該核酸試料を多重反応において増幅させ、増幅産物を生成することであって、
前記1つのプライマーセットに含まれる複数の該プライマーの全ては、60℃未満の融解温度を有し、および前記標的配列にハイブリダイズする少なくとも24ヌクレオチドの長さを有し、そして、AT含量は少なくとも
60%とATリッチである
ことを含む方法。
【請求項13】
請求項12に記載の方法において、該核酸試料が、増幅前に断片化されない、方法。
【請求項14】
請求項12または13に記載の方法において、該標的配列が、増幅前に濃縮されない、方法。
【請求項15】
請求項12~14のいずれか一項に記載の方法において、少なくとも1つの該SNPが、該核酸試料の供給源の祖先型または表現型の特徴を示す、方法。
【請求項16】
請求項12~15のいずれか一項に記載の方法において、複数の該プライマーのそれぞれが、前記標的配列に相同でない1つ以上のタグ配列を含む、方法。
【請求項17】
請求項12~16のいずれか一項に記載の方法において、該方法が、さらに複数のプライマーを用いて該増幅産物を増幅する、方法。
【請求項18】
該核酸試料および/または該増幅産物が、ポリメラーゼ連鎖反応(PCR)により増幅される、請求項12
~16のいずれか一項に記載の方法。
【請求項19】
該核酸試料および/または該増幅産物が、従来方式で設計されたプライマーと共に使用される増幅緩衝液の塩濃度と比べて増加した塩濃度を有する増幅緩衝液中で増幅され、該従来方式で設計されたプライマーは18~22ヌクレオチドの長さを有し、55℃~58℃の融解温度を有し、GC含量は40~60%であり、4ジヌクレオチドAT反復を最大とすることを特徴とする、請求項
18に記載の方法。
【請求項20】
該塩が、KCl、LiCl、NaCl、またはそれらの組合せを含む、請求項8または
19に記載の方法。
【請求項21】
複数のプライマーのそれぞれが、ホモポリマーヌクレオチド配列を含む、請求項1~
20のいずれか一項に記載の方法。
【発明の詳細な説明】
【関連出願】
【0001】
本出願は、2015年1月14日出願された特許文献1、2014年8月28日に出願された特許文献2、および2014年2月18日に出願された特許文献3の優先権を主張し、その内容は、その全体が参照により本明細書に組み込まれる。
【0002】
(配列表、表、またはコンピュータプログラムリストの相互参照)
本出願は、配列表とともに電子形式で提出されている。配列表は、2015年2月13日に作成された、ILLINC276WO_Sequence_Listing.TXTと題するファイルとして提供され、サイズは55Kbである。電子形式での配列表の情報は、その全体が参照により本明細書に組み込まれる。
【技術分野】
【0003】
本明細書において提供される実施形態は、DNAプロファイリングのための方法および組成物に関する。いくつかの実施形態は、変異サイズの標的配列の単一反応での増幅方法、その後に続くライブラリーの配列決定に関する。
【背景技術】
【0004】
歴史的に、ヒトゲノム中のマーカーのサブセットの使用は、個人の個人識別、またはDNA指紋またはプロファイルを決定するために利用されている。これらのマーカーは、一個人を別の個人から遺伝子レベルで識別するのに組み合わせで役立つ短鎖縦列反復配列(STR)および中鎖縦列反復配列(ITR)の位置または遺伝子座を含む。これらのマーカーの分析は、犯罪現場で見つかったDNAの分析で標準化されている。例えば、米国では、これらの反復配列の数は、刑事事件でのDNAプロファイリングの検査標準となる統合DNAインデックスシステム(CODIS)を作成するために結合されている。他国では同様に、DNAプロファイリングの標準システムを採用している。これらのシステムはまた、父系および家族関係を決定するために利用されてきた。しかし、現在のシステムは、全て電気泳動システムでのこれらの反復遺伝子座のサイズ分離に基づいているので、そのようなシステムで分別させることができる遺伝子座の数に限定される。例えば、法医学的目的のDNAプロファイリングのための現在の商業用システムの一部は、電気泳動検出方法の制限のために、わずか16マーカーしか分別しない。
【先行技術文献】
【特許文献】
【0005】
【文献】米国仮特許出願第62/103524号明細書
【文献】米国仮特許出願第62/043060号明細書
【文献】米国仮特許出願第61/940942号明細書
【文献】米国特許第7,985,565号明細書
【文献】米国特許第7,115,400号明細書
【文献】米国特許第6,210,891号明細書
【文献】米国特許第6,258,568号明細書
【文献】米国特許第6,274,320号明細書
【文献】国際公開第04/018497号
【文献】米国特許第7,057,026号明細書
【文献】国際公開第91/06678号
【文献】国際公開第07/123,744号
【文献】米国特許出願公開第2007/0166705号明細書
【文献】米国特許出願公開第2006/0188901号明細書
【文献】米国特許第7,057,026号明細書
【文献】米国特許出願公開第2006/0240439号明細書
【文献】米国特許出願公開第2006/0281109号明細書
【文献】国際公開第05/065814号パンフレット
【文献】米国特許出願公開第2005/0100900号明細書
【文献】国際公開第06/064199号パンフレット
【文献】国際公開第07/010251号パンフレット
【文献】米国特許出願公開第2012/0270305号明細書
【文献】米国特許出願公開第2013/0260372号明細書
【文献】米国特許出願公開第2013/0079232号明細書
【文献】米国特許第6,969,488号明細書
【文献】米国特許第6,172,218号明細書
【文献】米国特許第6,306,597号明細書
【文献】米国特許第7,001,792号明細書
【文献】米国特許第7,329,492号明細書
【文献】米国特許第7,211,414号明細書
【文献】米国特許第7,315,019号明細書
【文献】米国特許第7,405,281号明細書
【文献】米国特許出願公開第2008/0108082号明細書
【文献】米国特許出願公開第2009/0026082 A1号明細書
【文献】米国特許出願公開第2009/0127589 A1号明細書
【文献】米国特許出願公開第2010/0137143 A1号明細書
【文献】米国特許出願公開第2010/0282617 A1号明細書
【文献】PCT/US2013/30867
【非特許文献】
【0006】
【文献】Kivioja et al., Nat. Meth.9, 72-74 (2012)
【文献】Ronaghi, M., Karamohamed, S., Pettersson, B., Uhlen, M. and Nyren, P. (1996) "Real-time DNA sequencing using detection of pyrophosphate release." Analytical Biochemistry 242(1), 84-9
【文献】Ronaghi, M. (2001) "Pyrosequencing sheds light on DNA sequencing." Genome Res. 11(1), 3-11
【文献】Ronaghi, M., Uhlen, M. and Nyren, P. (1998) "A sequencing method based on real-time pyrophosphate." Science 281(5375), 363
【文献】Deamer, D. W. & Akeson, M. "Nanopores and nucleic acids: prospects for ultrarapid sequencing." Trends Biotechnol. 18, 147-151 (2000)
【文献】Deamer, D. and D. Branton, "Characterization of nucleic acids by nanopore analysis". Acc. Chem. Res. 35:817-825 (2002)
【文献】Li, J., M. Gershow, D. Stein, E. Brandin, and J. A. Golovchenko, "DNA molecules and configurations in a solid-state nanopore microscope" Nat. Mater. 2:611-615 (2003)
【文献】Soni, G. V. & Meller, "A. Progress toward ultrafast DNA sequencing using solid-state nanopores." Clin. Chem. 53, 1996-2001 (2007)
【文献】Healy, K. "Nanopore-based single-molecule DNA analysis." Nanomed. 2, 459-481 (2007)
【文献】Cockroft, S. L., Chu, J., Amorin, M. & Ghadiri, M. R. "A single-molecule nanopore device detects DNA polymerase activity with single-nucleotide resolution." J. Am. Chem. Soc. 130, 818-820 (2008)
【文献】Levene, M. J. et al. "Zero-mode waveguides for single-molecule analysis at high concentrations." Science 299, 682-686 (2003)
【文献】Lundquist, P. M. et al. "Parallel confocal detection of single molecules in real time." Opt. Lett. 33, 1026-1028 (2008)
【文献】Korlach, J. et al. "Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nano structures." Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008)
【発明の概要】
【0007】
実施形態は、限定された内容ではなく、個人に関する様々な遺伝情報をまとめて、包括的で、より完全な個人のDNAプロファイルを提供するシステムおよび方法に関する。本開示は、個人のこのプロファイルを可能にし、これにより、個人および法医学ゲノミクスの分野を発展させる方法および組成物を説明する。
【0008】
DNAプロファイリングは現在、DNA試料の同一性を決定するために選択された生物学的マーカーを使用している。例えば、DNAプロファイルを決定するための最も一般的な分析は、生物のゲノム中に見られる短鎖縦列反復配列(STR)の数のプロファイルを決定することである。分析は、電気泳動ゲルでサイズにより、またはキャピラリー電気泳動(CE)の使用により分別することができる最大400bp長の規定STR配列を増幅することからなる。電気泳動は、所与の遺伝子座における反復のSTRの数の違いによるサイズ変化を、したがって、CEシステムでは50~500bpの間であるPCRアンプリコンの長さを検出するために使用される。サイズ分別方法論により課せられる制限(すなわち、重複アンプリコンサイズのSTRを分別することができない)を克服するために、DNAプロファイリングの現在の方法は、サイズが重複するアンプリコンを異なる蛍光色素で標識し、励起時に発光スペクトルが異なるように、標識プライマーの異なるセットを利用して、それにより、重複アンプリコンが色素励起および発光スペクトルの差を用いて分別されるのを可能にする。分別ラベリングを使用して、現在の方法は、1つのDNAプロファイリング実行において6つの異なって検出可能な色素を使用しながら、24の異なるSTR遺伝子座の多重化を可能にする。
【0009】
現在のDNAプロファイリング方法論には多くの制限がある。前述のように、サイズ分別システムは、所与の時点で離散的に決定され得る遺伝子座の数を制限する。DNAプロファイリングのために確立された方法の別の制限は、分析されるDNAがしばしば分解され、いくつかのマーカーのサイズ範囲が分解DNAに対応していないことであり、例えば、アンプリコンが分解DNA断片のサイズよりも大きい可能性がある。分解DNAにとって、400bpのアンプリコンは非常に長いと考えられ、それらの長い遺伝子座の増幅の損失につながり得る。DNAアナリストは、分解DNA試料を増幅してそのSTRプロファイルを識別する場合、例えば犯罪現場で発見された試料などで、しばしば彼らは全ての遺伝子座を検出することができず、犯罪現場の容疑者を犯罪の試料にマッチングすることを困難または不可能にする不完全なプロファイルをもたらす。そのような試料のデフォルトでは、DNAアナリストは選択の余地がほぼなく、任意の試料が残されている場合、個人の識別に関する手がかりを与える可能性のある他のマーカーを同定するために、一塩基多型(SNP)、ミニSTR、またはミトコンドリアDNA(mtDNA)分析などの追加のアッセイを実行する必要がある。しかし、貴重な試料を、最終的に個人の識別に成功する確実性のない各アッセイに費やさなければならない。
図1Aは、DNA鑑定の考えられる様々な経路を示し、それらの全ては別々のワークフローであって、貴重な試料のアリコートを必要とする。1つ以上の単純なワークフローを合わせ、潜在的に複数回反復される必要がある場合、得られたプロセスは、もはや貴重な試料の単純なまたは効果的な使用ではない。
【0010】
本出願に記載の実施形態は、次世代配列決定(NGS)により個人または生物のDNAプロファイルを決定するための方法、組成物およびシステムを提供し、これにより、DNAプロファイリングのための現在の方法論の問題および制限に対する解決策を提供する。
図1Bは、一実施形態において開示される方法の例示的なワークフローを示す。本明細書に開示されているのは、短鎖縦列反復配列(STR)、中鎖縦列反復配列(ITR)、同一性インフォーマティブ一塩基多型(iSNP)、祖先インフォーマティブ一塩基多型(aSNP)および表現型インフォーマティブ一塩基多型(pSNP)を含むが、これらに限定されない多数の法医学関連マーカーを1つのアッセイにまとめるための方法および組成物である。
【0011】
本開示は、DNAプロファイリングの現在の方法論の制限を克服するアッセイを説明する。開示される実施形態は、多重増幅、ライブラリー作成ならびに1つの核酸試料から合わせたSTR、ITR、iSNP、aSNP、およびpSNPの単一の多重反応における配列決定のための方法および組成物を提供する。開示される方法は、最小限の試料処理で、分解DNAを含む試料DNAの低量を使用して、1つの実験的アッセイにおいて複数のマーカーを分析する。記載されるいくつかの実施形態は、DNAプロファイルのデータバンキングおよび/または犯罪ケースワークに使用することができるDNAプロファイルに利用することができる。いくつかの実施形態は、DNAのサブナノグラム量を検出するのに十分な感度を有するように開発されたPCRの方法および組成物を提供する。また、非従来型プライマー設計パラメータは、1つの多重化反応におけるSTR、ITRおよびSNPの識別のための高度多重PCRを可能にする。犯罪ケースワークでは、本発明の方法および組成物は、例えば、PCRおよび配列決定のエラー、配列決定の結果からのスタッターなどの除去に役立つ固有分子識別子(UMI)を包含する。非特許文献1を参照。同様に、本明細書に開示される方法および組成物から得られた結果は、既存のデータベースと互換性がある。
【0012】
したがって、本明細書に開示される実施形態は、核酸試料を用意すること、一塩基多型(SNP)を含む少なくとも1つの標的配列および縦列反復配列を含む少なくとも1つの標的配列に特異的にハイブリダイズする複数のプライマーを用いて該核酸試料を多重反応において増幅させ、増幅産物を生成すること、ならびに該増幅産物中の少なくとも1つのSNPおよび少なくとも1つの縦列反復配列の遺伝子型を決定し、それにより該核酸試料のDNAプロファイルを構築することを含む、DNAプロファイルを構築する方法を提供する。
【0013】
いくつかの実施形態では、本方法は、増幅産物から核酸ライブラリーを作成すること含む。いくつかの実施形態では、本方法は、核酸ライブラリーの配列を決定することを含む。いくつかの実施形態では、核酸試料はヒト由来である。いくつかの実施形態では、核酸試料は、環境試料、植物、非ヒト動物、細菌、古細菌、真菌、またはウイルス由来である。いくつかの実施形態では、DNAプロファイルは、疾患の診断または予後、がんバイオマーカーの同定、遺伝子異常の同定または遺伝的多様性分析の1つ以上に使用される。いくつかの実施形態では、DNAプロファイルは、データバンキング、法医学、刑事事件捜査、父親または個人識別の1つ以上に使用される。いくつかの実施形態では、少なくとも1つのSNPは、核酸試料の供給源の祖先型または表現型の特徴を示す。いくつかの実施形態では、複数のプライマーのそれぞれは低い融解温度を有する、および/または少なくとも24ヌクレオチドの長さを有する。いくつかの実施形態では、複数のプライマーのそれぞれは、60℃未満の融解温度を有する。いくつかの実施形態では、複数のプライマーのそれぞれは、約50℃~約60℃の融解温度を有する。いくつかの実施形態では、複数のプライマーのそれぞれは、少なくとも24ヌクレオチドの長さを有する。いくつかの実施形態では、複数のプライマーのそれぞれは、約24ヌクレオチド~約38ヌクレオチドの長さを有する。いくつかの実施形態では、複数のプライマーのそれぞれは、ホモポリマーヌクレオチド配列を含む。いくつかの実施形態では、核酸試料はポリメラーゼ連鎖反応(PCR)により増幅される。いくつかの実施形態では、核酸試料は、従来方式で設計されたプライマーと共に使用される増幅緩衝液の塩濃度と比べて増加した塩濃度を有する増幅緩衝液中で増幅される。いくつかの実施形態では、塩はKCl、LiCl、NaCl、またはそれらの組合せを含む。いくつかの実施形態では、塩はKClを含む。いくつかの実施形態では、増幅緩衝液のKClの濃度は約100mM~約200mMである。いくつかの実施形態では、増幅緩衝液のKClの濃度は約150mM未満である。いくつかの実施形態では、増幅緩衝液のKClの濃度は約145mMである。いくつかの実施形態では、SNPは、祖先型SNP、表現型SNP、同一性SNP、またはそれらの組み合わせである。いくつかの実施形態では、複数のプライマーは、少なくとも30のSNPに特異的にハイブリダイズする。いくつかの実施形態では、複数のプライマーは、少なくとも50のSNPに特異的にハイブリダイズする。いくつかの実施形態では、縦列反復配列は、短鎖縦列反復配列(STR)、中鎖縦列反復配列(ITR)、またはそれらの変異である。いくつかの実施形態では、複数のプライマーは、少なくとも24の縦列反復配列に特異的にハイブリダイズする。いくつかの実施形態では、複数のプライマーは、少なくとも60の縦列反復配列に特異的にハイブリダイズする。いくつかの実施形態では、核酸試料は約100pg~約100ngのDNAを含む。いくつかの実施形態では、核酸試料は約10pg~約100pgのDNAを含む。いくつかの実施形態では、核酸試料は約5pg~約10pgのDNAを含む。いくつかの実施形態では、核酸試料はゲノムDNAを含む。いくつかの実施形態では、ゲノムDNAは法医学試料に由来する。いくつかの実施形態では、ゲノムDNAは分解DNAを含む。いくつかの実施形態では、少なくとも1つのSNPおよび少なくとも1つの縦列反復配列の遺伝子型の少なくとも50%が決定される。いくつかの実施形態では、少なくとも1つのSNPおよび少なくとも1つの縦列反復配列の遺伝子型の少なくとも80%が決定される。いくつかの実施形態では、少なくとも1つのSNPおよび少なくとも1つの縦列反復配列の遺伝子型の少なくとも90%が決定される。いくつかの実施形態では、少なくとも1つのSNPおよび少なくとも1つの縦列反復配列の遺伝子型の少なくとも95%が決定される。いくつかの実施形態では、複数のプライマーのそれぞれは1つ以上のタグ配列を含む。いくつかの実施形態では、1つ以上のタグ配列は、プライマータグ、捕捉タグ、配列決定タグ、固有分子識別子タグ、またはそれらの組合せを含む。いくつかの実施形態では、1つ以上のタグ配列はプライマータグを含む。いくつかの実施形態では、1つ以上のタグ配列は固有分子識別子タグを含む。
【0014】
本明細書に開示される実施形態は、核酸試料を用意すること、ならびに一塩基多型(SNP)を含む少なくとも1つの標的配列および縦列反復配列を含む少なくとも1つの標的配列に特異的にハイブリダイズする複数のプライマーを用いて該核酸試料を多重反応において増幅させ、増幅産物を生成することを含む、核酸ライブラリーを構築する方法を提供する。
【0015】
いくつかの実施形態では、核酸試料は、増幅前に断片化されない。いくつかの実施形態では、標的配列は、増幅前に濃縮されない。いくつかの実施形態では、少なくとも1つのSNPは、核酸試料の供給源の祖先型または表現型の特徴を示す。いくつかの実施形態では、複数のプライマーのそれぞれは1つ以上のタグ配列を含む。いくつかの実施形態では、1つ以上のタグ配列は、プライマータグ、捕捉タグ、配列決定タグ、もしくは固有分子識別子タグ、またはそれらの組合せを含む。いくつかの実施形態では、本方法は、第2の複数のプライマーを用いて増幅産物を増幅することを含む。いくつかの実施形態では、第2の複数のプライマーのそれぞれは、複数のプライマーのプライマータグに相当する部分および1つ以上のタグ配列を含む。いくつかの実施形態では、第2の複数のプライマーの1つ以上のタグ配列は、捕捉タグ、もしくは配列タグ、またはそれらの組合せを含む。いくつかの実施形態では、本方法は、一本鎖結合タンパク質(SSB)を増幅産物に付加することを含む。いくつかの実施形態では、核酸試料および/または増幅産物は、ポリメラーゼ連鎖反応(PCR)により増幅される。いくつかの実施形態では、核酸試料および/または増幅産物は、従来方式で設計されたプライマーと共に使用される増幅緩衝液の塩濃度と比べて増加した塩濃度を有する増幅緩衝液中で増幅される。いくつかの実施形態では、塩は、KCl、LiCl、NaCl、またはそれらの組合せを含む。いくつかの実施形態では、塩はKClを含む。いくつかの実施形態では、増幅緩衝液のKClの濃度は約100mM~約200mMである。いくつかの実施形態では、増幅緩衝液のKClの濃度は約150mM未満である。いくつかの実施形態では、増幅緩衝液のKClの濃度は約145mMである。
【0016】
本明細書に開示される実施形態は、複数の核酸分子を含む核酸ライブラリーを提供し、複数の核酸分子は、タグ配列の第1の対に隣接する少なくとも1つの縦列反復配列およびタグ配列の第2の対に隣接する少なくとも1つの一塩基多型(SNP)配列を含む。さらに、本明細書に開示される方法および組成物を用いて構築された核酸ライブラリーが提供される。いくつかの実施形態では、少なくとも1つのSNPは、複数の核酸分子の供給源の祖先型または表現型の特徴を示す。
【0017】
本明細書に開示される実施形態は、核酸試料の少なくとも1つの短鎖標的配列および少なくとも1つの長鎖標的配列に特異的にハイブリダイズする複数のプライマーを提供し、単一の多重反応において複数のプライマーを用いて核酸試料を増幅させることで、少なくとも1つの短い増幅産物および少なくとも1つの長い増幅産物が得られ、複数のプライマーのそれぞれは1つ以上のタグ配列を含む。
【0018】
いくつかの実施形態では、短鎖標的配列は一塩基多型(SNP)を含み、長鎖標的配列は縦列反復配列を含む。いくつかの実施形態では、1つ以上のタグ配列は、プライマータグ、捕捉タグ、配列決定タグ、固有分子識別子タグ、またはそれらの組合せを含む。いくつかの実施形態では、複数のプライマーのそれぞれは、低い融解温度を有する、および/または少なくとも24ヌクレオチドの長さを有する。いくつかの実施形態では、複数のプライマーのそれぞれは、60℃未満の融解温度を有する。いくつかの実施形態では、複数のプライマーのそれぞれは、約50℃~約60℃の融解温度を有する。いくつかの実施形態では、複数のプライマーのそれぞれは、少なくとも24ヌクレオチドの長さを有する。いくつかの実施形態では、複数のプライマーのそれぞれは、約24ヌクレオチド~約38ヌクレオチドの長さを有する。いくつかの実施形態では、複数のプライマーのそれぞれは、ホモポリマーヌクレオチド配列を含む。いくつかの実施形態では、核酸試料はポリメラーゼ連鎖反応(PCR)により増幅される。いくつかの実施形態では、SNPは、祖先型SNP、表現型SNP、同一性SNP、またはそれらの組み合わせである。いくつかの実施形態では、複数のプライマーは、少なくとも30のSNPに特異的にハイブリダイズする。いくつかの実施形態では、複数のプライマーは、少なくとも50のSNPに特異的にハイブリダイズする。いくつかの実施形態では、縦列反復配列は、短鎖縦列反復配列(STR)、中鎖縦列反復配列(ITR)、またはそれらの変異である。いくつかの実施形態では、複数のプライマーは、少なくとも24の縦列反復配列に特異的にハイブリダイズする。いくつかの実施形態では、複数のプライマーは、少なくとも60の縦列反復配列に特異的にハイブリダイズする。
【0019】
本明細書に開示される実施形態は、少なくとも1つの容器手段を含むキットを提供し、少なくとも1つの容器手段は、本明細書に開示される複数のプライマーを含む。
【0020】
いくつかの実施形態では、キットは、増幅反応用試薬をさらに含む。いくつかの実施形態では、試薬は、ポリメラーゼ連鎖反応(PCR)用増幅緩衝液である。いくつかの実施形態では、増幅緩衝液は、従来方式で設計されたプライマーと共に使用される増幅緩衝液の塩濃度と比べて増加した塩濃度を有する。いくつかの実施形態では、塩は、KCl、LiCl、NaCl、またはそれらの組合せを含む。いくつかの実施形態では、塩はKClを含む。いくつかの実施形態では、増幅緩衝液のKClの濃度は約100mM~約200mMである。いくつかの実施形態では、増幅緩衝液のKClの濃度は約150mM未満である。いくつかの実施形態では、増幅緩衝液のKClの濃度は約145mMである。
【図面の簡単な説明】
【0021】
【
図1】
図1A及び
図1Bは、A)DNAプロファイリングの現在のワークフロー対B)本開示の例示的な一実施形態のそれの違いを示す図である。
【
図2】DNAプロファイリングに有用なライブラリーを作成する方法の例示的な一実施形態を示す図である。
【
図3】DNAプロファイリングに有用なライブラリーを作成する方法の別の例示的な一実施形態を示す図である。
【
図4】
図4A~Dは、従来方法ならびに続いて確立されたPCRプライマー設計プロトコルおよび制限により設計されたプライマー対が、本開示の方法に従って設計されたプライマーと組み合わせた場合に、ゲノム標的の非特異的増幅と所望のアンプリコン検出の不明瞭化とをどのように引き起こし得るかという電気泳動の結果を示す線グラフである;A)本開示の方法により、SNP遺伝子座に向けて設計された10のプライマー対、B)およびD)10のプライマーに加え、従来方法により設計された追加のプライマー対であって、追加のプライマー対が増幅中に10のプライマー対を妨害することを実証している、ならびにC)10プライマー対に加え、追加のプライマー対であって、追加のプライマー対も以下の本開示の方法により設計されており、全ての標的SNPの増幅に成功した。X軸はライブラリー断片のサイズ(bp)であり、Y軸は増幅断片の増幅ピークの蛍光単位(FU)である。
【
図5】
図5A~Eは、56のSTRのパネルならびに75の同一性インフォーマティブSNP(iSNP)、祖先インフォーマティブSNP(aSNP)および表現型インフォーマティブSNP(pSNP)の組み合わせを、多重増幅および配列決定反応において試料から識別するために使用された、
図2で概説したワークフローに従った実験の例示的な結果を示すボックスプロットを示す図である。パネルからのSTR遺伝子座の増幅および配列決定の成功を実証する再現された結果が報告された;A)パネルからの25のヘテロ接合STRについて遺伝子座内平衡を実証するボックスプロット、B)56のSTR遺伝子座の大部分について低スタッターを実証するボックスプロット、C)STR遺伝子座について配列カバー率を実証するボックスプロット、D)SNPについて配列カバー率を実証ボックスプロット、およびE)パネルからの22のヘテロ接合SNPについて平衡を実証するボックスプロット。下のエラーバーは最小値を示し、上のエラーバーは最大値を示し、下のボックスは25パーセンタイルを報告し、上のボックスは75パーセンタイルを報告し、平均値は下上のボックスの交線である。
【
図6】
図5の実験からの例示的なSTR遺伝子座のプロットを示す棒グラフのシリーズを示す図である。プロットは、
図5のパネルのSTRについて異なる対立遺伝子コールを示している。
【
図7】
図7A~Eは、26のSTRのパネルならびに94のiSNP、aSNPおよびpSNPの組み合わせを、多重増幅および配列決定反応において試料からの識別するために使用された、
図3で概説したワークフローに従った実験の例示的な結果を示すボックスプロットを示す図である。パネルからのSTRの増幅および配列決定の成功を実証する再現された結果が報告された;A)パネルからの21のヘテロ接合STRについて遺伝子座内平衡を実証するボックスプロット、B)26のSTR遺伝子座について低スタッターを実証するボックスプロット(26の遺伝子座の47の対立遺伝子のうちの39は、スタッターを示さなかった)、C)STR遺伝子座について配列カバー率を実証するボックスプロット(UMIを用いて正規化されたリード番号)、D)SNPについて配列カバー率を実証ボックスプロット、およびE)パネルからの21のヘテロ接合iSNPについて平衡を実証するボックスプロット。下のエラーバーは最小値を示し、上のエラーバーは最大値を示し、下のボックスは25パーセンタイルを報告し、上のボックスは75パーセンタイルを報告し、平均値は下上のボックスの交線である。
【
図8】
図7の実験からの例示的なSTR遺伝子座のプロットを示す棒グラフのシリーズを示す図である。プロットは、
図7のパネルのSTRについて異なる対立遺伝子コールを示している。
【
図9】UMIなしおよびUMIを用いて分析した試料の棒グラフを示す図である。各セットの左側のパネルは、UMIなしで分析した試料を表し、各セットの右側のパネルは、UMIを用いて分析した試料を表す。X軸はSTRの繰り返し回数を指定し、Y軸は特定の対立遺伝子のカウント数を指定する。バー内のエラー線は、配列決定のエラー(バーの上部)を、STR配列内の正しい配列(バーの下部)から分離する。
【
図10】
図10A~Bは、DNA比が90:10=男性:女性であった実験からの例示的な結果を示す図である。A)現在のキャピラリー電気泳動DNAプロファイリング方法を使用した場合の、STR遺伝子座についてのSTR遺伝子座コールのサブセットの結果、およびB)本出願の方法を使用した場合の、複数のSTR遺伝子座についてのいくつかのSTR遺伝子座コールの結果。CE方法および本出願の方法の両方は、低レベルの男性DNAコンタミネーションを検出した。
【
図11】
図9の実験においてY染色体に特定のSTR遺伝子座が検出されたことを示す棒グラフであり、さらに、そうするためには2つの実験が現在のCEの方法論で実行される必要がある一方、本出願はコンタミ男性DNAおよび特定のSTR遺伝子座をその男性のDNAから検出することができることを実証する図である。
【
図12】12の試料個体および参照個体を用いた実験からの例示的な高レベルの配列決定結果を示し、2つの複製間のSTRおよびSNPコールの整合性を実証する表である。
【
図13】
図12に示す実験からの例示的な母集団統計値を示す表である。
【
図14】
図12に示す実験からのpSNPの遺伝子型に基づく、例示的な表現型の予測を示す表である。
【
図15】
図12に示す実験からのaSNPの遺伝子型に基づく、例示的な祖先型のマッピングを示すグラフである。
【
図18】
図18A~Bは、
図12の実験からの例示的なSTRおよびSNP遺伝子座の遺伝子座内平衡を示すショーボックスプロットを示す図である。
【
図19】
図19A~Bは、
図12の実験からの例示的なSTR遺伝子座のスタッター分析を示すグラフである。
【
図20】
図12の実験からのSTR遺伝子座内の例示的なアイソメトリックヘテロ接合体を示す表である。
【
図21】
図12の実験からのSTR D8S1179での変異に基づく、例示的な遺伝プロットを示すブロック図である。
【
図22】
図12の実験からのSTR D13S317での変異に基づく、例示的な遺伝プロットを示すブロック図である。
【
図23】分解DNAを用いた、例示的な遺伝子型判定結果を示す表である。
【
図24】
図24A~Bは、差動DNA入力での例示的なSTR遺伝子型判定結果および遺伝子座内平衡を示す。
【
図25】
図25A~Bは、差動DNA入力での例示的なSNP遺伝子型判定結果および遺伝子座内平衡を示す。
【0022】
(定義)
本明細書において参照される全ての特許、出願、公開出願およびその他の刊行物は、参照により、参照資料にその全体が組み込まれる。用語または語句が、本明細書において参考により組み込まれる特許、出願、公開出願およびその他の刊行物に記載の定義に反しているか、そうでなければ矛盾するように本明細書中で使用される場合、本明細書でのその使用は、参照により本明細書に組み込まれる定義より優先する。
【0023】
本明細書で使用される場合、別段の、明確な、または文脈により指示がない限り、単数形「a」、「an」および 「the」は複数の言及を含む。例えば、別段の、明確な、または文脈により指示がない限り、二量体は1つ以上の二量体を含む。
【0024】
本明細書で使用される場合、用語「DNAプロファイル」、「遺伝子指紋」、および「遺伝子型プロファイル」は同じ意味で使用され、縦列反復配列、一塩基多型(SNP)などの多型遺伝子座のコレクション内の対立遺伝子変異を指す。DNAプロファイルは、核酸試料に基づいて個人を識別するための科学捜査に有用である。本明細書において使用されるDNAプロファイルは、がんを含む疾患の診断および予後、がんバイオマーカーの同定、遺伝分析、遺伝的多様性分析、遺伝子異常の同定、データバンキング、法医学、刑事事件捜査、父親または個人識別などのその他の用途にも使用され得る。
【0025】
用語「ポリヌクレオチド」、「オリゴヌクレオチド」、「核酸」および「核酸分子」は、本明細書において同じ意味で使用され、任意の長さのヌクレオチドのポリマー型を指し、リボヌクレオチド、デオキシリボヌクレオチド、それらの類似体、またはそれらの混合物を含み得る。この用語は分子の一次構造のみを指す。したがって、この用語は、三本鎖、二本鎖および一本鎖デオキシリボ核酸(「DNA」)、ならびに三本鎖、二本鎖および一本鎖リボ核酸(「RNA」)を含む。
【0026】
本明細書で使用される場合、2つのヌクレオチド配列の文脈における「配列同一性」または「同一性」または「相同性」は、指定された比較ウィンドウにわたる一致が最大となるように整列された場合と同じである2つの配列中の残基への言及を含む。比較ウィンドウ内のヌクレオチド配列の部分は、2つの配列の最適なアラインメントの参照配列と比べた場合、付加または欠失(すなわち、ギャップ)を含み得る。パーセンテージは、同一核酸塩基残基が両方の配列において存在する位置の数を決定することにより一致した位置の数を得て、一致した位置の数を比較のウィンドウにおける位置の総数で割り、その結果に100を乗じて配列同一性のパーセンテージを得ることにより計算される。
【0027】
本明細書で使用される場合、「実質的に相補的または実質的に一致する」とは、2つの核酸配列が少なくとも90%の配列同一性を有することを意味する。好ましくは、2つの核酸配列は、少なくとも95%、96%、97%、98%、99%または100%の配列同一性を有する。あるいは、「実質的に相補的または実質的に一致する」とは、2つの核酸配列が高ストリンジェンシー条件(単数または複数)でハイブリダイズできることを意味する。
【0028】
本明細書に記載の本発明の態様および実施形態は、態様および実施形態「からなる」および/または「から本質的になる」ことが含まれることが理解される。
【0029】
本発明のその他の目的、利点および特徴は、添付の図面と併せて以下の明細書から明らかになるであろう。
【0030】
(DNAプロファイルを構築する方法)
DNAプロファイルを決定するための確立した方法論は、多くの方法で制限されている。例えば、現在の方法は、DNA試料中に見られる縦列反復配列の長さの変化に起因して異なる増幅した遺伝子座のサイズ変化を検出する。可視化のためのSTR増幅を多重化するために、増幅は、電気泳動システムのサイズ分離の制限内の様々なアンプリコンサイズ、CEシステムでは約50~500bpである間隔を開けるように設計されなければならない。このようにして、限られた数の反復配列を、1つのアッセイで可視化することができる。例えば、GLOBALFILER PCR増幅キット(アプライドバイオシステムズ社)は、伝えられるところによると、6つの異なる色素を使用することにより24のSTR遺伝子座を分別することができる。さらに、犯罪現場のDNA試料に共通するように試料DNAが分解している場合、そのような方法は、より長い増幅産物が不可能となり、不完全なDNAプロファイルをもたらすような問題がある。 現在の方法はまた、しばしば少量のコンタミDNAを検出するのに十分な感度ではなく、そのため混合試料が検出されず、報告されずに終わってしまう可能性があり、犯罪ケースワークでは問題となり得る。このように、現在の方法は、不完全な結果につながる可能性があり、それは決定的ではない結果をもたらし、DNAプロファイリングに弊害をもたらし得る。
【0031】
さらに、現在の標的は、試料の祖先、考えられる目の色およびその他の個別の試料情報などの表現形質に関する情報が含まれていない。いくつかの配列決定方法は、STRおよびSNP検出の両方を含むことを試みてきた。例えば、STRおよびSNPのカスタム濃縮が続くライブラリー作成が試みられてきたが、ライブラリー作成方法は標的配列を消し去る可能性がある試料せん断を一般的に伴うため、全てのSTRが完全にカバーされているわけではない。さらに、確立されたプライマーの設計方法およびプロトコルは、長い配列(例えば、STR)または短い配列(例えば、SNP)を増幅するためのプライマーセットを提供することができるが、両方の組み合わせが1つの反応で成功してはいない。
【0032】
本開示は、現在のDNAプロファイリングシステムの問題および制限に対する解決策を記載する。本明細書に記載の方法および組成物は、STRおよびSNPの組み合わせをPCRを使用する1つのアッセイにすることを可能にし、標的を増幅させ、配列決定のためのライブラリーを作成する。本発明のアッセイを開発している間に思いがけなく発見されたことは、例えば、非従来型で直感に反するプライマー設計を利用する場合、全ての標的遺伝子座についての配列が決定されるのを可能にする1つの反応において、STRおよびSNPの両方を増幅することができるということである。驚くべきことに、プライマー設計を取り巻く現在の教義に反してパラメータを使用して増幅プライマーを設計する場合、より長いSTR領域が増幅されることおよび短いSNP領域が増幅されることを、多かれ少なかれ平衡のとれた形で可能にしたプライマーが作成され、それによりSTRおよびSNPの両方が一緒に多重増幅されるのを可能にした。
【0033】
異なるサイズのアンプリコンのセットがDNAプロファイリングの他に1つの増幅反応から望まれているときはいつでも、本明細書に開示されている生物のDNAプロファイルを決定するための方法および組成物を使用することができる。例えば、PCRの目的とする標的が、大きな遺伝子領域および短いSNP領域の両方を含み、それぞれ数百~数千塩基対のサイズの異なるアンプリコン、100塩基対未満のアンプリコンを生じ得る場合なら、本明細書に記載の方法および組成物は、開示の方法の実施なしでは可能ではなかったと思われる遺伝子およびSNP標的の同時増幅を成功させることができるかもしれない。さらに、本明細書に開示される方法および組成物は、例えばヒト、非ヒト霊長類、動物、植物、ウイルス、細菌、真菌などの、任意の生物に適用され得る。このように、本発明の方法および組成物は、標的ゲノムとしてDNAプロファイリング(例えば、法医学、父子鑑定、個人識別など)およびヒトに有用であるだけでなく、がんおよび疾患のマーカー、遺伝子異常のマーカーならびに/または標的ゲノムがヒトに基づくものではない場合などの他の標的にも使用することができる。
【0034】
したがって、本明細書に開示される実施形態は、核酸試料を用意すること、ならびに一塩基多型(SNP)を含む少なくとも1つの標的配列および縦列反復配列を含む少なくとも1つの標的配列に特異的にハイブリダイズする複数のプライマーを用いて該核酸試料を増幅させること、ならびに該増幅産物中の少なくとも1つのSNPおよび少なくとも1つの縦列反復配列の遺伝子型を決定し、それにより該核酸試料のDNAプロファイルを構築することを含む、DNAプロファイルを構築する方法を提供する。
【0035】
アレイベースのハイブリダイゼーション、配列決定などが挙げられるが、これらに限定されない任意の適切な技術が標的配列の遺伝子型を決定するのに使用され得ることが、当業者には理解されるであろう。したがって、いくつかの実施形態では、本明細書に開示される方法は、配列決定ライブラリーなどの核酸ライブラリーを増幅産物から生成すること、ならびに核酸ライブラリーの配列を決定することを含み得る。
【0036】
いくつかの実施形態では、本開示は、例えば集団または個人データバンキングで使用するためのSTRおよびiSNPの同時識別を含むDNAプロファイリングの方法および組成物を提供する。そのようなデータバンクでは、個人は典型的には知られているため、個人データは必ずしも必要ではない。しかし、追加情報が望まれる場合なら、追加情報の標的を同時識別のために追加することができる。短鎖縦列反復配列は当該技術分野においてよく知られており、反復ジ-またはトリヌクレオチド配列から構成されている。中鎖縦列反復配列は、典型的には4~7のヌクレオチド配列の反復配列と考えられる。ここで利用されるSNPは、人の身体的特徴への識見を提供し得る任意の形式であることができる。本明細書において例示されたものは、祖先または遺伝形質の手がかりを提供するSNP(aSNP)および表現型の特徴の手がかりを提供するそれ(表現型インフォーマティブSNP)である。本明細書に記載の方法では、DNAプロファイルアッセイは、STRおよびITR座位決定と組み合わせて、これらのSNPの任意の数を含めることができる。
【0037】
例えば、本開示は、STRおよびiSNPSとともに追加標的が含まれている追加の方法および組成物を提供する。個人についてのより詳細な情報が望まれる場合、例えば、犯罪ケースワークの場合のように、試料が未知の個人または個人の集団のものである場合、その他の情報マーカーを、STR、ならびに、祖先型に関連するSNP(aSNP)および表現型の変異(表現型インフォーマティブSNP)に関連するSNPなどのiSNPに追加することができる。追加の情報は、例えば、未知の個人の遺伝形質、目の色、髪の色などへの識見を提供することにより、研究者を支援するために使用することができる。このように、全ての組み合わされた情報の追加は、DNAプロファイリングの現在の方法を使用した以前には知られていなかった個人のより完全なDNAプロファイルを提供することができる。
【0038】
本明細書に開示される方法および組成物は、核酸分子のサブナノグラム量を検出するのに十分な感度を有するように設計されている。さらに、本明細書に開示される方法および組成物は、法医学試料からの分解および/または断片化ゲノムDNAのような低品質の核酸分子からなる核酸試料を増幅するのに有用であり得る。核酸試料は、精製された試料、または、例えば、唾液、血液、もしくはその他の体液を含浸させることができる口腔スワップ、紙、布もしくはその他の基材からの溶解物を含むクルードDNAであってもよい。このように、いくつかの実施形態では、核酸試料は、ゲノムDNAなどの、少量のDNA、またはDNAの断片化部分を含み得る。例えば、核酸試料は、約1pg、2pg、3pg、4pg、5pg、6pg、7pg、8pg、9pg、10pg、11pg、12pg、13pg、14pg、15pg、16pg、17pg、18pg、19pg、20pg、30pg、40pg、50pg、60pg、70pg、80pg、90pg、100pg、200pg、300pg、400pg、500pg、600pg、700pg、800pg、900pg、1ng、10ng、100ng、もしくはそれら未満の、または、これらの値のいずれか2つにより定義される範囲内、例えば、10pg~100pg、10pg~1ng、100pg~1ng、1ng~10ng、10ng~100ngなどの核酸(例えば、ゲノムDNA)の量を含んでいてもよい。いくつかの実施形態では、核酸試料は、約100pg~約1ngである核酸(例えば、ゲノムDNA)の量を含んでもよい。いくつかの実施形態では、核酸試料は、約62.5pgより多い核酸(例えば、ゲノムDNA)の量を含んでもよい。いくつかの実施形態では、超音波処理またはエンドヌクレアーゼ消化などの追加の断片化工程は、断片化手順に含まれていない。
【0039】
いくつかの実施形態では、本明細書に開示される方法および組成物は、例えば、SNP、STRなどの1つ以上の標的配列の遺伝子型を、サブナノグラム量のおよび/または分解された核酸試料であってもうまく決定することができる。例えば、本明細書に開示される方法および組成物は、標的配列の約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、100%、もしくはそれらより多くの、または上記の値のいずれか2つの間の範囲の遺伝子型を決定することができる。いくつかの実施形態では、本明細書に開示される方法および組成物は、標的配列の約50%、80%、90%、95%、98%またはそれ以上の遺伝子型を決定することが可能である。いくつかの実施形態では、本明細書に開示される方法および組成物は、標的配列の約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、100%、または上記の値のいずれか2つの間の範囲の遺伝子座内平衡を達成することができる。
【0040】
法医学的捜査では、複数のプライマーは、例えば、PCRおよび配列決定のエラー、配列決定の結果からのスタッターなどの除去に役立つ固有分子識別子(UMI)を包含し得る。前出の非特許文献1を参照。本開示の他の箇所でさらに詳細に議論されるように、プライマー中のUMIの包含は、縦列反復遺伝子座内の変異の同定も可能にし、さらに、DNAプロファイリングおよび固有分析などの他の目的のための現在の方法および組成物の有用性を高める。
【0041】
したがって、いくつかの実施形態では、本明細書に開示される縦列反復配列の遺伝子型は縦列反復配列遺伝子座内の配列変異を含み得る。したがって、従来の方法を用いての縦列反復配列についてのホモ接合体(例えば、D9S1122の13、13)は、縦列反復配列内の配列変異に基づくアイソメトリックヘテロ接合として同定され得る。当業者により理解されるように、イントラ座配列変異を考慮することは、例えば遺伝分析のための本明細書に開示される方法の有用性を大きく高めるであろう。
(核酸ライブラリーを構築するための方法)
【0042】
本明細書に開示される実施形態は、核酸試料を用意すること、ならびに一塩基多型(SNP)を含む少なくとも1つの標的配列および縦列反復配列を含む少なくとも1つの標的配列に特異的にハイブリダイズする複数のプライマーを用いて該核酸試料を増幅させることを含む、核酸ライブラリーを構築する方法を提供する。
【0043】
本明細書に開示される方法および組成物は、核酸分子のサブナノグラム量を検出するのに十分な感度を有するように設計されている。さらに、本明細書に開示される方法および組成物は、法医学試料からの分解および/または断片化ゲノムDNAのような低品質の核酸分子からなる核酸試料を増幅するのに有用であり得る。核酸試料は、精製された試料、または、例えば、唾液、血液、もしくはその他の体液を含浸させることができる口腔スワップ、紙、布もしくはその他の基材からの溶解物を含むクルードDNAのいずれであってもよい。このように、いくつかの実施形態では、核酸試料は、ゲノムDNAなどの、少量のDNA、または断片化DNAを含み得る。例えば、核酸試料は、約1pg、2pg、3pg、4pg、5pg、6pg、7pg、8pg、9pg、10pg、11pg、12pg、13pg、14pg、15pg、16pg、17pg、18pg、19pg、20pg、30pg、40pg、50pg、60pg、70pg、80pg、90pg、100pg、200pg、300pg、400pg、500pg、600pg、700pg、800pg、900pg、1ng、10ng、100ng、もしくはそれら未満の、または、これらの値のいずれか2つにより定義される範囲内、例えば、10pg~100pg、10pg~1ng、100pg~1ng、1ng~10ng、10ng~100ngなどの核酸(例えば、ゲノムDNA)の量を含んでいてもよい。いくつかの実施形態では、核酸試料は、約100pg~約1ngである核酸(例えば、ゲノムDNA)の量を含んでもよい。いくつかの実施形態では、核酸試料は、約62.5pgより多い核酸(例えば、ゲノムDNA)の量を含んでもよい。いくつかの実施形態では、超音波処理またはエンドヌクレアーゼ消化などの追加の断片化工程は含まれていない。
【0044】
いくつかの実施形態では、本明細書に開示される方法は、下流並列配列決定を見込んでの増幅およびライブラリー作成を含む。アッセイは、2つのPCRマスターミックス、2つの熱安定性ポリメラーゼ、2つのプライマーミックスおよびライブラリーアダプターを含み得る。いくつかの実施形態では、DNAの試料は、標的特異的領域および非標的特異的タグ領域ならびに第1PCRマスターミックスを含む第1の増幅プライマーのセットを使用して、数サイクルにわたり増幅され得る。タグ領域は、ユニバーサルタグ領域、捕捉タグ領域、増幅タグ領域、配列決定タグ領域、UMIタグ領域などの任意の配列であってもよい。例えば、タグ領域は、増幅の第2またはその後のラウンドで、例えばライブラリー作成のために利用される増幅プライマーの鋳型であってもよい。いくつかの実施形態では、本方法は、一本鎖結合タンパク質(SSB)を第1増幅産物に添加することを含む。第1増幅試料のアリコートは、除去され、1つ以上の下流配列決定のワークフロー、および同一のまたは第2のPCRマスターミックスに特異的な配列タグなどの、1つ以上の付加的なタグ配列を含み得る第1増幅プライマーのタグ領域、例えばユニバーサルタグ領域または増幅タグ領域などに特異的な第2の増幅プライマーのセットを使用して二度目の増幅することができる。これにより、元のDNA試料のライブラリーは、配列決定の準備ができている。
【0045】
代替方法は、第1の増幅を少量(例えば、15ul)で実施することを含むことができ、アリコートを第2ラウンドの増幅のための新しい位置に移す代わりに、第2ラウンドの増幅を実行するための追加の試薬をチューブに添加することができる。
【0046】
ライブラリーが作成されたら、それを精製し、定量することができる。いくつかの実施例において、精製は、DNA断片を反応成分から精製する働きをするAMPURE XPビーズ(ベックマンコールター社)のような基材を介して試料を処理することにより実施することができる。別の方法は、ハプテン部分などの精製部分の、第2の増幅プライマーのセットへの組み込みである。例えば、ビオチンが第2の増幅プライマーのセットのプライマーに組み込まれた場合なら、例えばビーズ上のストレプトアビジン部分を使用してライブラリー断片を捕捉することができる。捕捉戦略を活用して、ライブラリーは、ビーズに基づく標準化(BBN)を用いることにより標準化および定量することもできる。しかしながら、多重反応がBBNを使用せずに実行されている場合は、ライブラリーを精製して定量するか、またはプールして定量することができる。例えば、ライブラリーは、当技術分野で知られているように、ゲル電気泳動法、バイオアナライザー、qPCR、分光光度法、定量キット(例えば、ピコグリーンなど)などにより定量化等することができる。定量後、ライブラリーを並列配列決定により配列決定することができる。
【0047】
いくつかの実施形態では、標的DNAを増幅するために使用される第1の増幅プライマーのセットは、このような制限された濃度で提供されるため、第1の増幅反応のアリコートが新しいチューブに添加され、第2の増幅反応からの試薬が添加される場合、第1の増幅プライマーのセットからの極小~検出不可能な程度の繰越増幅があり、第1増幅反応と第2増幅反応の間の洗浄工程は要求されない。いくつかの実施例では、最初のPCR用の増幅プライマーの濃度は、約0.5nM、0.6nM、0.7nM、0.8nM、0.9nM、1.0nM、1.5nM、2.0nM、3.0nM、4.0nM、5.0nM、6.0nM、7.0nM、8.0nM、9.0nm 10.0nM、11.0nM 12.0nM、もしくはそれら未満、または、これらの値のいずれかの間の範囲内、例えば0.5nM~1.0nM、1.0nM~12nM、0.8nM~1.5nMなどである。いくつかの実施形態では、最初のPCR用の増幅プライマーの濃度は、約0.9nM~約10nMである。
【0048】
図2は、本開示の方法の一実施形態における例示的なワークフローを示す。標的ゲノムDNA配列は、標的配列と増幅タグ領域(同一でも異なっていてもよい)に隣接する領域を含む第1のプライマーのセットを用いて増幅され、両末端に標的配列とタグを含むアンプリコンを生じる。最初のPCRからのアンプリコンのアリコートは、第1タグ配列に特異的な第2のプライマーのセットを用いてさらに増幅され、プライマー配列(i5およびi7アダプター配列)を配列決定することをさらに含み、これにより並列配列決定に使用される配列に挟まれた標的DNA配列を含むライブラリーを生成し、この場合、i5およびi7配列は、イルミナ社により普及された合成法による配列において利用される。
【0049】
試料からのDNAプロファイルを決定する代替ワークフローの例が、
図3に記載されている。この例では、DNA標的は、標的配列、非標的タグ配列(同一または異なる)およびランダム化塩基を含むさらなる固有分子識別子配列またはUMIに隣接する配列を含む第1のプライマー対を用いて増幅される。UMIを使用して、例えば、ライブラリー作成プロセス中に発生したエラー(例えば、PCRアーチファクトまたは誤取り込みなど)をバイオインフォマティクス的に減少または排除することができる。UMIの使用はDNAプロファイリングに重要となり得るが、試料が犯罪ケースワークのために配列決定された場合、エラーの排除の支援のために使用するには特に重要である。この例では、増幅の第1ラウンドは2サイクルかけて行われ、その後一本鎖結合タンパク質(SSB)の添加および37℃にて15分間のインキュベーションが続き、そして増幅の第2ラウンドの間の第1増幅プライマーのセットのさらなる増幅を効果的にクエンチする95℃/5分の不活性化が続く。メカニズムは不明であるが、SSBの追加は不可逆的に一本鎖の第1増幅プライマーに結合し、それらがその後の増幅反応に加わるのを防ぐことができると考えられる。SSBのインキュベーションに続いて、配列タグを含む第2のプライマーセットおよび第2のPCRミックスが添加され、配列決定ライブラリーを得る。
【0050】
(核酸ライブラリー)
本明細書に開示される実施形態は、配列決定に使用され得る核酸ライブラリーを提供する。いくつかの実施形態では、本明細書に開示される核酸ライブラリーは、複数の核酸分子を含んでもよく、複数の核酸分子は、タグ配列の第1の対に隣接する少なくとも1つの縦列反復配列およびタグ配列の第2の対に隣接する少なくとも1つの一塩基多型(SNP)配列を含む。
【0051】
本明細書で概説したように、核酸分子のサイズは、本明細書に開示される方法および組成物を使用して大きく異なる場合がある。縦列反復(例えば、STR)を含む標的配列から増幅された核酸分子は大きいサイズを有する場合があり、一方SNPを含む標的配列から増幅された核酸分子は小さいサイズを有する場合があることは、当業者により理解される。例えば、核酸分子は、100未満のヌクレオチド~数百または数千におよぶヌクレオチドを含み得る。したがって、核酸分子のサイズは、約50bp、約60bp、約70bp、約80bp、約90bp、約100bp、約110bp、約120bp、約130bp、約140bp、約150bp、約200 bpの、約300bp、約400bp、約500bp、約600bpの、約700bp、約800bp、約900bp、約1kb、またはそれ以上の任意の2つの値の間の範囲を有し得る。いくつかの実施形態では、核酸分子の最小サイズは、約、または50bp、60bp、70bp、80bp、90bp、もしくは100bp未満の長さであってもよい。いくつかの実施形態では、核酸分子の最大サイズは、約、または100bp、150bp、200bp、250bp、300bp、350bp、400bp、450bp、500bp、もしくは1kbを超える長さであってもよい。
【0052】
クラスター生成では、ライブラリー断片は、例えば、DNAライブラリー断片を捕捉して固定するための相同オリゴヌクレオチド配列を含むスライドなどの基体上に固定化されている。固定化されたDNAライブラリー断片は、特許文献4および特許文献5の開示により例示されるようなクラスター増幅法を用いて増幅され、それぞれの内容は、その全体が参照により本明細書に組み込まれる。特許文献4および特許文献5の組み込まれた資料は、クラスターまたは固定された核酸分子の「コロニー」からなるアレイを形成するために、増幅産物が固体支持体上に固定化されることを可能にする固相核酸増幅の方法を記載する。そのようなアレイ上の各クラスターまたはコロニーは、複数の同一の固定化されたポリヌクレオチド鎖および複数の同一の固定化された相補的ポリヌクレオチド鎖から形成される。そのように形成されたアレイは、一般に「クラスター化配列」と呼ばれる。特許文献4および特許文献5に記載されているような固相増幅反応の生成物は、固定化されたポリヌクレオチド鎖と固定化された相補鎖との対のアニーリングにより形成された、いわゆる「架橋」構造であり、両鎖は、5'末端で、好ましくは共有結合を介して固体支持体上に固定されている。クラスター増幅方法は、固定化された核酸鋳型を使用して固定化アンプリコンを生成する方法の例である。その他の適切な方法を使用して、本明細書で提供される方法に従って生成された固定化DNA断片からの固定化アンプリコンを生成することもできる。例えば、1つ以上のクラスターまたはコロニーは、増幅プライマーの各対の一方または両方のプライマーが固定化されていれば、固相PCRを介して形成することができる。しかしながら、本明細書に記載される方法は、任意の特定の配列決定調製法または配列決定プラットフォームに限定されるものではなく、その他の並列配列決定プラットフォーム調製方法および関連する配列決定プラットフォームに適し得る。
【0053】
(プライマー)
本明細書に開示される実施形態は、核酸試料の少なくとも1つの短鎖標的配列および少なくとも1つの長鎖標的配列に特異的にハイブリダイズする複数のプライマーを提供し、単一の多重反応において複数のプライマーを用いて核酸試料を増幅させることで、少なくとも1つの短い増幅産物および少なくとも1つの長い増幅産物が得られ、複数のプライマーのそれぞれは1つ以上のタグ配列を含む。本明細書においてさらに開示されるのは、表1~2に記載の配列を有する複数のプライマーである。
【0054】
大きな標的配列(例えば、STR、ITR)および小さな標的配列(例えば、SNP)の多重増幅では、プライマーは、全ての標的タイプにわたって平衡のとれた増幅が可能となるように設計されている。本明細書に開示される方法および組成物は、単一の多重反応で多重縦列反復標的配列を増幅するために使用され得る。例えば、複数のプライマーは、約、もしくは4、6、8、10、12、14、16、18、24、30、40、50、60、70、80、90、100より多くの、または、4~12、10~24、30~100などのいずれか2つの値の間の範囲内の数ほどの縦列反復配列に特異的にハイブリダイズし得る。いくつかの実施形態では、複数のプライマーは、少なくとも24の縦列反復配列に特異的にハイブリダイズし得る。いくつかの実施形態では、複数のプライマーは、少なくとも60の縦列反復配列に特異的にハイブリダイズし得る。本明細書に開示される方法および組成物は、単一の反応で多重SNP標的配列を増幅するために使用され得る。例えば、複数のプライマーは、約、もしくは4、6、8、10、12、14、16、18、24、30、40、50、60、70、80、90、100より多くの、または、4~12、10~24、30~100などのいずれか2つの値の間の範囲内の数ほどのSNP配列に特異的にハイブリダイズし得る。いくつかの実施形態では、複数のプライマーは、少なくとも30のSNP配列に特異的にハイブリダイズし得る。いくつかの実施形態では、複数のプライマーは、少なくとも50のSNP配列に特異的にハイブリダイズし得る。
【0055】
プライマー設計の成功のための以下の確立された基準および知恵を設計するプライマーを使用する場合、長いSTR標的配列よりも短いSNP標的配列が優先的に増幅されていることが実験中に発見された。さらに、少なくとも、クラスターが生成され、クラスターそれ自体が配列決定される合成ワークフローによる配列において(例えば、イルミナ社のシーケンサーに関連する合成による以下の配列(SBS、本明細書の他の箇所に開示されている))、短いライブラリーSNP断片の優先的なクラスター増幅も発生した。これら2つの偏りを克服するために、新たな戦略が、短いSNP標的配列と長いSTR標的配列との間の平衡のとれた増幅を可能にするプライマーの設計に必要とされた。
【0056】
戦略の1つは、STR増幅用のプライマーを設計することを含んでいた。STRでは、反復配列は多くの場合、より大きな反復配列領域内に埋め込まれており;したがって、STR増幅用の特異的なプライマーを設計することは問題となり得る。さらに、STRおよびその隣接領域は、多くの場合ATリッチである。一例では、従来型で十分に確立されたPCRの設計基準に反する設計戦略を使用して、問題の領域に対してプライマーが設計された。PCRプライマー設計のための確立された基準は、いくつかの基準の中で特に、1)プライマーの最適な長さは、18~22ヌクレオチドである、2)Tmは55~58℃の範囲にあるべきである、3)GC含量は約40~60%であるべきである、および4)反復ATジヌクレオチド領域は避けるべきであり、<4ジヌクレオチドAT反復を最大とする、と言明している。例えば、18~22ヌクレオチドではなく23~35ヌクレオチドの長さなど、その典型的なPCRプライマーよりも長いプライマーが設計され、それらは、例えば約58℃ではなく約54℃などの低い融解温度(Tm)を有しており、そしてプライマーはATリッチであり、従来型の確立されたPCR条件が教える3つのパラメータは、最適なプライマー設計には避けるべきである。実際には、非最適なプライマーが設計された。驚くべきことに、これらの長くてATリッチで低Tmのプライマーは実際に、短くて高Tmで少ないATを含むプライマーよりも良好にSTRを多重化したことが発見された。いかなる理論にも拘束されることなく、確立されたPCR設計基準に従って設計された短いプライマーは、高い融解温度を有する二量体を形成する可能性があり、したがって正常なPCR条件下で効率的に二量体を形成し、一方、長くて低Tmのプライマーは、かなり低いTmで二量体を形成する可能性があり、そのため二量体形成には安定ではなかったので、その結果、正常な増幅条件下で、短くて高Tmのプライマー(例えば、18~22ヌクレオチド、60℃のTm、50%GC含量)に比べて、長い低Tmのプライマーの関与の増加を可能にしたことが考えられる。
【0057】
STR増幅用の長くて低TmでATリッチなプライマーをその後、SNPを標的とする従来設計で高Tmの短いプライマーを用いて多重化した。しかしながら、多重増幅反応は、単一の多重反応においてSTRおよびSNP両方の平衡のとれた増幅を提供することに再び失敗に終わった。非従来型のプライマー設計を適用して、問題のない標的を増幅する、例えば、SNP標的を増幅すれば、多重増幅の成功がもたらされるかもしれないと考えられた。このように、STRについての非最適なプライマーを設計するために使用したのと同じ基準を、SNP(長い、低Tm、ATリッチ)についてのプライマー設計に適用した。驚くべきことに、新たに設計されたプライマーは、多重反応でのSTRおよびSNPの増幅の間のより良好な平衡をもたらした。
【0058】
図4は、多重反応において従来および非従来設計プライマーの間の相互作用の例を示している。
図4Aにおいて、10のSNP標的の多重反応は、ライブラリーについて、約200~350bpの所望範囲に予想される増幅を示している。多重化において10のSNPを増幅するために使用されるプライマーは、確立されたPCRプライマー設計基準により推奨されているように、より長く、より低いTmを有し、よりATリッチになるように設計された。第11プライマー対を、確立したPCR設計基準を使用して設計する場合、プライマーが短くて高Tmを有し、AT豊富ではなく、10対の得られた多重化に添加された場合、標的DNAの非特異的な増幅を示す。
図4Bおよび4Dに見られるように、従来設計の第11プライマー対の添加は、10プレックスの非従来型プライマー対に干渉し、標的SNPの多重増幅の失敗をもたらす。しかしながら、10プレックスのプライマー対と同じ基準に従って非従来型設計されてもいる第11プライマー対の添加は、SNP標的の増幅の成功をもたらす(
図4C)。
【0059】
したがって、いくつかの実施形態では、複数のプライマーのそれぞれは、例えば、60℃未満もしくは約50℃~約60℃のなど低い融解温度を有する、および/または少なくとも24ヌクレオチドの長さ、例えば約24ヌクレオチド~約38ヌクレオチドの長さを有する。いくつかの実施形態では、複数のプライマーのそれぞれは、ホモポリマーヌクレオチド配列を含む。
【0060】
いくつかの実施例では、非従来型設計のプライマーは、標的STRおよびSNPに隣接する配列ならびに追加の非鋳型配列を含む。追加の配列は、例えば、ライブラリーの作成または配列決定方法論の間に目的を果たすタグ配列となることができる。例えば、タグ配列は、ライブラリー断片を精製するために、固定化パートナー部分により捕捉されるハプテン部分などの捕獲配列となることができる。ハプテン部分の例は、反応成分などから分離されたライブラリー断片用のストレプトアビジンにより捕捉することができるビオチンである。タグ配列は、例えば、増幅プライマーに相補的であり、1つ以上の増幅反応において使用される増幅配列であってもよい。
図2および3は、増幅の第1ラウンドに続く増幅の第2ラウンドで使用さるタグ配列の例を示す。タグ配列は、配列タグである可能性もある。
図2および
図3はまた、配列タグの例、i5アダプターおよびi7アダプターが、本明細書に記載されるような合成反応による配列中に、ハイブリダイゼーション、クラスター生成およびプライマーの配列決定をする際の配列決定において使用されることを示す。
図3に示すように、タグ配列の別の例は、固有分子識別子、すなわちUMIである。
【0061】
UMIは、配列決定中にPCRおよび配列決定のエラーを訂正するのに使用することができるヌクレオチドのランダムなストレッチを含み、これにより配列決定の結果にエラー訂正の追加の層を追加する。UMIは、例えば3~10ヌクレオチド長に由来し得るが、その数は入力DNAの量に依存する。例えば、1ngのDNAを使用して約250の部位を標的とする場合、約350コピー×250標的、すなわち約90,000の異なるUMIが必要となることが予想される。より多くのDNAが利用される場合、例えば10ngでは、約100万の異なるUMIが必要とされ得る。同一のPCR反応からの全てのPCR複製は、同じUMI配列を有するはずであり、したがって重複を比較することができ、一塩基置換、欠失、挿入(すなわち、PCRにおけるスタッター)などの配列中の任意のエラーを配列決定の結果からバイオインフォマティクス的に除外することができる。独特の分子識別子は、混合試料の分析に用いることもできる。例えば、男性DNAが混入している女性のDNA試料などの混合試料をデコンボリューションし、UMI配列を用いて女性および男性DNA寄与の両方を明らかにすることができる。例えば、2つの混合DNAについて4つの異なる反復数の合計がある可能性があり;しかし、2つの試料の混合物が特定の遺伝子座における対立遺伝子を共有する場合は4未満である可能性がある。これらの共有対立遺伝子は、識別され、DNA分子の最初の集団内の異なる対立遺伝子の数を決定するためにUMIを用いて決定されたパーセンテージを概算することができる。例えば、最初の分子を計数することができ、重要でない寄与因子が、例えば5%で存在した場合なら、UMIの5%は1つの遺伝子型を同定し、95%は第2の遺伝子型を同定することになる。PCR後、増幅の際に対立遺伝子の1つ(あるいはそれ以上)に偏りをかけた場合には、5:95比は見られないだろう。しかしながら、PCRの重複がUMI検出および訂正を用いて凝縮された後、UMIを用いて偏りのある比を補正することができる。PCRからのスタッターアーチファクトおよび真の重要でない寄与因子から区別しようとする場合、これは重要である。
【0062】
本方法のプライマーは、1つ以上のタグ配列を含むことができる。タグ配列は、標的配列に相同でない1つ以上のプライマー配列であることができるが、例えば1つ以上の増幅反応の鋳型として使用することができる。タグ配列は、例えば、反応成分からアンプリコンを精製するために使用することができるビオチンなどのハプテン配列などの捕捉配列であり得る。タグ配列は、例えば、本明細書に記載されているような合成技術による配列を予想しての架橋増幅のための、基体上のライブラリーアンプリコンを捕捉するのに有利であるアダプター配列などの配列とすることができる。さらに、タグ配列は、典型的には、例えば、ライブラリー作成および/または配列決定法の間にエラー訂正に使用することができるヌクレオチドのランダム化ストレッチから構成される3~10ヌクレオチドの間の固有分子識別子タグであることができる。
【0063】
加えて、多重化PCR反応にとって、1つの混合物に一緒にプールされている実質上全ての標的に対するオリゴヌクレオチドプライマーを含むことが有利である。しかしながら、本明細書に開示されるように、オリゴヌクレオチドは、従来のパラメータを用いて設計されたプライマーよりも珍しく長い。遺伝子標的特異的配列を付加するUMIの追加などの、タグ配列のプライマーへのさらなる付加は、それでも長いプライマー配列を作成する。いくつかの実施形態では、グリシンベタイン(約1.5M)が複数のプライマーに付加され得る。例えば、いくつかの実施形態では、本明細書に開示されるような非従来型プライマーを用いた増幅反応において使用される増幅緩衝液は、約、もしくは100mM、200mM、300mM、400mM、500mM、600mM、700mM、800mM、900mM、1M、1.2M、1.3M、1.4M、1.5M、1.6M、1.7M、1.8M、1.9M、2M、3M、4M、5M、6M、7M、8M、9M、10Mより大きい、または、これらの値のいずれか2つの間の範囲内、例えば500mM~2M、1M~1.5Mなどのベタイン濃度を含む。したがって、本開示の方法を実施する場合、本明細書に開示されるように、ベタインを例えば約1.5Mで補充したようなプライマー混合物は有利であろう。いくつかの実施形態では、グリセロールを複数のプライマーに添加してもよい。例えば、いくつかの実施形態では、本明細書に開示されるような非従来型プライマーを用いた増幅反応において使用される増幅緩衝液は、約、もしくは100mM、200mM、300mM、400mM、500mM、600mM、700mM、800mM、900mM、1M、1.2M、1.3M、1.4M、1.5M、1.6M、1.7M、1.8M、1.9M、2M、3M、4M、5M、6M、7M、8M、9M、10Mより大きい、または、これらの値のいずれか2つの間の範囲内、例えば500mM~2M、1M~1.5Mなどのグリセロール濃度を含む。 したがって、本開示の方法を実施する場合、本明細書に開示されるように、グリセロールを例えば約1.5Mで補充したようなプライマー混合物は有利であろう。
【0064】
いくつかの実施形態では、本開示の増幅方法において使用される非従来型プライマー設計に関連する緩衝液は、変更されてもよい。例えば、いくつかの実施形態では、増幅緩衝液のKCl、LiCl、NaCl、またはそれらの組み合わせなどの塩の濃度は、従来設計されたプライマーと共に使用される増幅緩衝液の塩濃度と比べて増加している。いくつかの実施形態では、本明細書に開示されるような非従来型プライマーを用いた増幅反応において使用される増幅緩衝液は、約、もしくは60mM、70mM、80mM、90mM、100mM、110mM、120mM、130mM、140mM、150mM、160mM、170mM、180mM、190mM、200mM、250mM、300mM、400mM、500mMより大きい、または、これらの値のいずれか2つの間の範囲内、例えば60mM~200mM、100mM~250mMなどのKCl濃度を含む。いくつかの実施形態では、本明細書に開示されるような非従来型プライマーを用いた増幅反応において使用される増幅緩衝液は、約145mMのKCl濃度を含む。いくつかの実施形態では、本明細書に開示されるような非従来型プライマーを用いた増幅反応において使用される増幅緩衝液は、約、もしくは60mM、70mM、80mM、90mM、100mM、110mM、120mM、130mM、140mM、150mM、160mM、170mM、180mM、190mM、200mM、250mM、300mM、400mM、500mMより大きい、または、これらの値のいずれか2つの間の範囲内、例えば60mM~200mM、100mM~250mMなどのLiCl濃度を含む。いくつかの実施形態では、本明細書に開示されるような非従来型プライマーを用いた増幅反応において使用される増幅緩衝液は、約145mMのLiCl濃度を含む。いくつかの実施形態では、本明細書に開示されるような非従来型プライマーを用いた増幅反応において使用される増幅緩衝液は、約、もしくは60mM、70mM、80mM、90mM、100mM、110mM、120mM、130mM、140mM、150mM、160mM、170mM、180mM、190mM、200mM、250mM、300mM、400mM、500mMより大きい、または、これらの値のいずれか2つの間の範囲内、例えば60mM~200mM、100mM~250mMなどのNaCl濃度を含む。いくつかの実施形態では、本明細書に開示されるような非従来型プライマーを用いた増幅反応において使用される増幅緩衝液は、約145mMのNaCl濃度を含む。
【0065】
いくつかの態様において、本明細書に開示されるような非従来型プライマーを用いた増幅反応において使用される増幅緩衝液は、MgSO4、MgCl2、またはそれらの組合せを含むことができる。
【0066】
(キット)
本明細書に開示される実施形態は、少なくとも1つの容器手段を含むキットを提供し、少なくとも1つの容器手段は、本明細書に開示されるような複数のプライマーを含む。いくつかの実施形態では、容器手段は、チューブ、ウェル、マイクロタイタープレートなどであってもよい。いくつかの実施形態では、複数のプライマーは、約、もしくは4、6、8、10、12、14、16、18、24、30、40、50、60、70、80、90、100より多くの、または、4~12、10~24、30~100などのいずれか2つの値の間の範囲内の数ほどの縦列反復配列に特異的にハイブリダイズし得る。いくつかの実施形態では、複数のプライマーは、少なくとも24の縦列反復配列に特異的にハイブリダイズし得る。いくつかの実施形態では、複数のプライマーは、少なくとも60の縦列反復配列に特異的にハイブリダイズし得る。本明細書に開示される方法および組成物は、単一の反応で多重SNP標的配列を増幅するために使用され得る。例えば、複数のプライマーは、約、もしくは4、6、8、10、12、14、16、18、24、30、40、50、60、70、80、90、100より多くの、または、4~12、10~24、30~100などのいずれか2つの値の間の範囲内の数ほどのSNP配列に特異的にハイブリダイズし得る。いくつかの実施形態では、複数のプライマーは、少なくとも30のSNP配列に特異的にハイブリダイズし得る。いくつかの実施形態では、複数のプライマーは、少なくとも50のSNP配列に特異的にハイブリダイズし得る。
【0067】
いくつかの実施形態では、少なくとも1つの容器手段は、増幅緩衝液を含む。いくつかの実施形態では、本開示の増幅方法において使用される非従来型プライマー設計に関連する緩衝液は、変更されてもよい。例えば、いくつかの実施形態では、増幅緩衝液のKCl、LiCl、NaCl、またはそれらの組み合わせなどの塩の濃度は、従来設計されたプライマーと共に使用される増幅緩衝液の塩濃度と比べて増加している。いくつかの実施形態では、本明細書に開示されるような非従来型プライマーを用いた増幅反応において使用される増幅緩衝液は、約、もしくは60mM、70mM、80mM、90mM、100mM、110mM、120mM、130mM、140mM、150mM、160mM、170mM、180mM、190mM、200mM、250mM、300mM、400mM、500mMより大きい、または、これらの値のいずれか2つの間の範囲内、例えば60mM~200mM、100mM~250mMなどのKCl、NaClまたはLiCl濃度を含む。いくつかの実施形態では、本明細書に開示されるような非従来型プライマーを用いた増幅反応において使用される増幅緩衝液は、約145mMのKCl、NaClまたはLiCl濃度を含む。
【0068】
いくつかの態様において、本明細書に開示されるような非従来型プライマーを用いた増幅反応において使用される増幅緩衝液は、MgSO4、MgCl2、またはそれらの組合せを含むことができる。
【0069】
(配列決定法)
本方法は、任意の特定の配列決定プラットフォームに限定されるものではないが、SBS、または合成による配列、並列配列決定の種類に関して、本明細書において例示されている。特に適用可能な技術は、核酸が、その相対位置が変化しないようにアレイ内の固定位置に取り付けられているもの、そしてアレイが繰り返し画像化されるものである。例えば、あるヌクレオチド塩基型を別のものから区別するために使用される様々な標識と一致する様々なカラーチャネルで画像が得られる実施例は、特に適用可能である。
【0070】
SBS技術は、一般的に、鋳型鎖に対するヌクレオチドの反復付加を介する、新生核酸鎖の酵素的拡張を伴う。SBSの従来の方法では、単一のヌクレオチドモノマーは、それぞれの送達においてポリメラーゼの存在下で標的ヌクレオチドに提供されることができる。しかしながら、本明細書に記載の方法において、複数のタイプのヌクレオチドモノマーは、送達においてポリメラーゼの存在下で標的核酸に提供されることができる。
【0071】
SBS技術は、標識部分を有するヌクレオチドモノマーまたは標識部分を欠いているそれを利用することができる。したがって、組み込み事象は、標識の蛍光などの標識の特性;分子量または電荷などのヌクレオチドモノマーの特性;ピロリン酸放出などのヌクレオチドの取り込みの副産物などに基づいて検出することができる。2つ以上の異なるヌクレオチドが配列決定試薬中に存在するいくつかの実施例では、異なるヌクレオチドは互いに識別可能であるか、あるいは、2つ以上の異なる標識が、使用される検出技術の下で識別不可能である可能性がある。例えば、配列決定試薬中に存在する異なるヌクレオチドは、異なる標識を持つことができ、それらはSolexa(現在イルミナ社)により開発された配列決定法により例示されるような適切な光学系を使用して識別することができる。
【0072】
いくつかの実施例は、ピロ配列決定技術を含む。ピロ配列決定は、特定のヌクレオチドが新生鎖に取り込まれる際の無機ピロリン酸(PPI)の放出を検出する(非特許文献2、非特許文献3、非特許文献4、特許文献6、特許文献7および特許文献8、これらの開示は、その全体が参照により本明細書に組み込まれる)。ピロ配列決定では、放出されたPPiは、アデノシン三リン酸(ATP)にATPスルフリラーゼにより直ちに変換されることにより検出することができ、生成されたATPのレベルは、ルシフェラーゼにより生成される光子を介して検出される。配列決定される核酸を、アレイのフィーチャーに結合することができ、そしてアレイを画像化して、アレイのフィーチャーにおけるヌクレオチドの取り込みに起因して生成される化学発光信号を捕捉することができる。アレイを特定のヌクレオチド種(例えばA、T、CまたはG)で処理した後、画像を得ることができる。それぞれのヌクレオチド種の添加後に得られた画像は、アレイ内のどのフィーチャーが検出されたかに関しては異なる。画像内のこれらの違いは、アレイ上のフィーチャーの異なる配列内容を反映している。しかし、各フィーチャーの相対的な位置については、画像の変化はない。画像は、本明細書に記載の方法を用いて格納、処理および分析することができる。例えば、可逆的ターミネーターに基づく配列決定法のためのに、異なる検出チャネルから得られた画像について本明細書に例示されるのと同じ方法で、それぞれ異なるヌクレオチド種でのアレイの処理後に得られた画像を処理することができる。
【0073】
SBSの別の例では、例えば、その開示が参照により本明細書に組み込まれる特許文献9および特許文献10記載されているように、例えば、切断可能なまたは光退色可能な色素標識を含む可逆的ターミネーターヌクレオチドの段階的添加により、サイクル配列決定が達成される。この手法は、Solexa(現在イルミナ社)により商業化されており、その各々が参照により本明細書に組み込まれる特許文献11および特許文献12に記載されている。両方の終結を逆転させることができる蛍光標識されたターミネーターおよび切断された蛍光標識の有用性は、効率的な環状可逆ターミネーター(CRT)配列決定を容易にする。ポリメラーゼを同時操作して効率的に組み込み、これらの修飾ヌクレオチドから延長させることができる。本明細書に記載の方法およびシステムで利用することができる追加の例示的なSBSシステムおよび方法は、特許文献13~特許文献23に記載されており、これらの開示は、その全体が参照により本明細書に組み込まれる。
【0074】
いくつかの実施例は、4つ未満の異なる標識を使用して、4つの異なるヌクレオチドの検出を利用することができる。例えば、特許文献24に組み込まれた資料に記載されている方法およびシステムを利用して、SBSを実施することができる。第1の例として、ヌクレオチド種は対同じ波長で検出することができるが、対の一方のメンバーの、もう一方と比べての強度の差に基づいて、または、対のもう一方のメンバーについて検出されたシグナルと比較して、明らか信号を現れたり消えたりさせる、対の一方のメンバーへの変更(例えば、化学的修飾、光化学修飾または物理修飾を介して)に基づいて識別することができる。第2の例としては、4つの異なるヌクレオチド種のうちの3つをの特定の条件下で検出することができ、その間、第4ヌクレオチド種はそれらの条件下で検出可能な標識を欠いているか、またはこれらの条件下でわずかに検出される(例えば、バックグラウンド蛍光などに起因する最小検出)。最初の3つのヌクレオチド種の核酸への取り込みは、それぞれの信号の存在に基づいて決定することができ、第4ヌクレオチド種の核酸への組込みは、任意の信号の不在または最小検出に基づいて決定することができる。第3の例として、1つのヌクレオチド種は、2つの異なるチャネルで検出される標識(単数または複数)を含むことができ、その一方他のヌクレオチド種は、1つのチャネルのみで検出される。前述の3つの例示的な設定は、相互排他的とはみなされず、様々な組み合わせで使用することができる。3つ全ての例を組み合わせた例示的な実施形態は、第1チャネルで検出される第1ヌクレオチド種(例えば、第1励起波長により励起された際に第1チャネルで検出される標識を有するdATP)、第2チャネルで検出される第2ヌクレオチド種(例えば、第2励起波長により励起された際に第2チャネルで検出される標識を有するdCTP)、第1および第2チャネルの両方で検出される第3ヌクレオチド種(例えば、第1および/または第2励起波長により励起された際に両チャネルで検出される少なくとも1つの標識を有するdTTP)、ならびにいずれのチャネルで検出されないか、またはわずかに検出される標識を欠く第4ヌクレオチド種(例えば、標識を持たないdGTP)を使用する蛍光ベースのSBS法である。
【0075】
さらに、特許文献24の組み込まれた資料に記載されているように、配列決定データを、単一チャネルを使用して得ることができる。そのようないわゆる一色素配列決定手法では、第1ヌクレオチド種は標識されているが、標識は第1画像が生成された後に除去され、第2ヌクレオチド種は、第1画像が生成された後にのみ標識される。第3ヌクレオチド種は、第1および第2画像の両方で標識を保持し、第4ヌクレオチド種は両方の画像において未標識のままである。
【0076】
いくつかの実施例は、ライゲーション技術による配列決定を利用することができる。このような技術は、DNAリガーゼを利用してオリゴヌクレオチドを組み込み、そのようなオリゴヌクレオチドの組み込みを同定する。オリゴヌクレオチドは、典型的には、オリゴヌクレオチドがハイブリダイズする配列中の特定のヌクレオチドの同一性と相関する様々な標識を有する。他のSBS方法と同様に、画像は、標識された配列決定試薬での核酸フィーチャーのアレイの処置後に得ることができる。各画像は、特定の種類の組み込まれている標識を有する核酸フィーチャーを表示する。異なるフィーチャーは、各フィーチャーの異なる配列内容により、異なる画像中に存在するか、または存在しないが、フィーチャーの相対位置では、画像の変化はない。ライゲーション系配列決定法から得られた画像は、本明細書に記載のように格納、処理および分析することができる。本明細書に記載の方法およびシステムで利用することができる例示的なSBSシステムおよび方法は、特許文献25~特許文献27に記載されており、これらの開示は、その全体が参照により本明細書に組み込まれる。
【0077】
いくつかの実施例は、ナノ細孔配列決定を利用することができる(非特許文献5~非特許文献7、これらの開示は、その全体が参照により本明細書に組み込まれる)。このような実施形態において、標的核酸は、ナノ細孔を通過する。ナノ細孔は、合成細孔またはα溶血素などの生体膜タンパク質であることができる。標的核酸がナノ細孔を通過する際、細孔の電気伝導度の変動を測定することにより、各塩基対を同定することができる(特許文献28,非特許文献8~非特許文献10、これらの開示は、その全体が参照により本明細書に組み込まれる)。ナノ細孔配列決定から得られたデータは、本明細書に記載のように格納、処理および分析することができる。特に、データは、光学画像および本明細書に記載されているその他の画像の例示的な処理に従って、画像として扱うことができる。
【0078】
いくつかの実施例は、DNAポリメラーゼ活性のリアルタイムモニタリングを含む方法を利用することができる。ヌクレオチド取り込みは、例えば特許文献29および特許文献30(その各々が参照により本明細書に組み込まれる)に記載されるように、フルオロフォア含有ポリメラーゼとγ-リン酸標識ヌクレオチドとの間の蛍光共鳴エネルギー移動(FRET)相互作用を介して検出することができ、または、ヌクレオチド取り込みは、例えば特許文献31(参照により本明細書に組み込まれる)に記載されるように、ゼロモード導波路で、ならびに、例えば特許文献32および特許文献33(その各々が参照により本明細書に組み込まれる)に記載されるように、蛍光ヌクレオチドアナログおよび遺伝子操作ポリメラーゼを用いて検出することができる。照射は、蛍光標識ヌクレオチドの取り込みを低バックグラウンドで観察できるように、表面係留ポリメラーゼの周りのゼプトリットルスケールの体積に制限することができる(非特許文献11~非特許文献13、これらの開示は、その全体が参照により本明細書に組み込まれる)。このような方法から得られた画像は、本明細書に記載のように格納、処理および分析することができる。
【0079】
いくつかのSBSの実施形態は、ヌクレオチドの伸長産物への取り込みの際に放出されるプロトンの検出を含む。例えば、放出プロトンの検出に基づく配列決定は、電気検出器およびイオントレント(ギルフォード、コネチカット州、ライフテクノロジー社の子会社)から市販されている関連技術、または、その各々が参照により本明細書に組み込まれる特許文献34~特許文献37に記載の配列決定法およびシステムを使用することができる。結合平衡除外法を使用して標的核酸を増幅するための本明細書に記載の方法は、プロトンを検出するために使用される基材に容易に適用することができる。より具体的には、本明細書に記載された方法を使用して、プロトンを検出するのに使用されるアンプリコンのクローン集団を産生するために使用することができる。
【0080】
上記のSBS方法は、複数の異なる標的核酸を同時に操作するように、多重形式で有利に実施することができる。特定の実施形態では、異なる標的核酸を、一般的な反応容器内で、または特定の基材の表面上で処理することができる。これは、配列決定試薬の便利な送達、未反応試薬の除去および組み込み事象の検出を、多重方法で可能にする。表面結合標的核酸を使用する実施形態において、標的核酸は、アレイ形式であることができる。アレイ形式では、標的核酸は、典型的には、空間的に区別可能なやり方で表面に結合することができる。標的核酸は、直接共有結合、ビーズもしくは他の粒子への結合、または表面に付着するポリメラーゼまたは他の分子へ結合することにより、結合されることができる。アレイは、標的核酸の単一コピーを各部位(フィーチャーとも称される)で含むことができ、または、同一配列を有する複数のコピーは、各部位またはフィーチャーに存在することができる。複数のコピーは、以下にさらに詳細に記載されるように、架橋増幅またはエマルジョンPCRなどの増幅方法により製造することができる。
【0081】
本開示の方法は、本明細書に記載の方法を実施することにより作成されたDNAプロファイルライブラリーを配列決定するために、イルミナ社の技術を利用する。MiSeq配列決定機器を、本明細書に記載の実施例でのクラスタリングおよび配列決定に使用した。しかし、先に述べたように、および当業者により理解されるように、本方法は、使用する配列決定プラットフォームの種類により限定されるものではない。
【実施例】
【0082】
以下の実施例は、DNAプロファイリングのためのいくつかの方法および材料を開示している。本発明の趣旨および範囲を維持しながら、これらの方法および材料を変更することができる。このような変更は、本開示の考察または本明細書に開示の方法の実施から、当業者にとって明らかとなるであろう。したがって、これらの方法または材料が、本明細書に開示される特定の実施例に限定されることは意図されていないが、それは、本開示の範囲および趣旨に含まれる全ての変更および代替を網羅する。
【0083】
(実施例1:非従来型プライマー設計)
イルミナ社(サンディエゴ、カリフォルニア州)からのコンピュータ設計プログラムのデザインスタジオを、プライマー設計のために修正および使用した。プライマー3などの代替プライマー設計プログラムが使用されてもよく、デフォルトパラメータをリセットして、プライマー設計のために修正されたパラメータの目的を再現することを、当業者はもちろん理解するであろう。設定は、典型的には、ソフトウェアに付属のconfig.xmlファイルにリセットされるが、しかしながら、異なるソフトウェアを使用し、各ソフトウェアのデフォルトパラメータにアクセスするための特定の資料を調べることが一般的な慣行である場合、これは異なり得る。以下のパラメータは、プライマー設計ソフトウェアでリセットすることができる:
1)所望の最小長アンプリコンを>60<にリセット
2)所望の最大長アンプリコンを>120<にリセット
3)タイトな候補間隔を>3<にリセット(デフォルトは30bp)
4)%GC最大プローブを>60<にリセットし、ATリッチ反復ストレッチ数の増加を可能にする
5)平均Tmを>57<(デフォルトは59℃)にリセットし、平均Tmを下げる
6)最大Tmを>60<(デフォルトは71)にリセット
7)最小Tmを>51<(デフォルトは55)にリセット
8)平均プローブ長を>28<(デフォルトは27)にリセット
9)最大プローブ長を>38<(デフォルトは30)にリセット
10)最小プローブ長を>25<(デフォルトは22)にリセット
【0084】
SNPプライマーを設計するために、プライマーの3'末端を標的とする範囲を「小」に設定し、標的SNPについてプライマーを約1bp離しておく。全てのパラメータがリセットされた後、プライマー設計プログラムをその配列で実行、新しいパラメータに該当するプライマー対候補を決定することができる。例えば、ソフトウェアのユーザは、プライマーを設計するためにゲノムのどこを検索するかをソフトウェアに伝える標的リストを生成することができる。本実施例では、標的領域を、デザインスタジオソフトウェアが配向とプライマー設計に使用したグラフィック・ユーザ・インタフェース・アプリケーションにコピー・アンド・ペーストした。標的領域をプログラムに入力した後、プログラムはクリエイト・デザインファイルに向かい、ツールを起動し、プライマー設計を作成する。本実施例では、主出力は、プライマー配列を含む.txtファイルおよび/または不具合を含むいくつかの領域であり、標的配列を再定義および再実行する必要がある時点では「設計不可」だった。この実験で使用したソフトウェアは、標的領域として指定された配列上にマッピングされている設計されたプライマーを提供した。リセットパラメータに続いて、増幅用のプライマー設計の従来基準に従わなかったプライマーを設計した;しかしながら、それは長いSTRおよび短いSNPの多重増幅をもたらした。
【0085】
本明細書に開示の方法で有利な、設計されたSTR標的プライマーの例には、表1に列挙されたものが挙げられる。本明細書に開示の方法で有利な、SNP標的プライマーの例には、表2に列挙されたものが挙げられる。
【表1-1】
【表1-2】
【表1-3】
【表1-4】
【0086】
【表2-1】
【表2-2】
【表2-3】
【表2-4】
【表2-5】
【表2-6】
【表2-7】
【表2-8】
【表2-9】
【表2-10】
【表2-11】
【表2-12】
【0087】
(実施例2:データバンキングのためのDNAプロファイリング)
この実施例は、
図2のワークフローに従った実験を説明している。得られた試料は、その身元が既に知られている個人からのものであると推測できたため、この実施例はUMIを利用していない。
【0088】
この実験では、表3に見られるように、STRはiSNPで多重化されている。
【表3】
【0089】
追加のSNPおよびSTRを上記のリストに追加することももちろんできる。その他の潜在的な標的の例には、表4に見られるマーカーが挙げられるが、これらに限定されない。
【表4】
【0090】
プライマーを、3'末端の遺伝子特異的PCRプライマー配列と、5'末端のアダプタータグ配列とを含むように設計した。この実験では、フォワードプライマーは、TruSeqカスタムアンプリコンi5アダプターのタグ配列を含み、リバースプライマーは、TruSeqスモールRNAキットi7アダプターのタグ配列を含む。タグを、配列決定プライマー部位と同様に、増幅プライマー部位として使用することができる。
アダプターi5タグ配列 5'TACACGACGCTCTTCCGATCT3' (配列番号:403)
アダプターi7タグ配列 5'CTTGGCACCCGAGAATTCCA3' (配列番号:404)
【0091】
多重化でのSTRおよびSNP間の増幅の平衡をとるために、実施例1で説明したように、プライマー設計パラメータをSNPについて変更した。イルミナ社のデザインスタジオを使用して設計されたSNPプライマーの元のセットは、古典的なPCRプライマー:高い融解温度を有し、二次構造がほとんど~全くない短い配列であった。デザインスタジオを使用して、TruSeqカスタムアンプリコンプローブを設計し、リバースPCRプライマーを作る下流プローブのリバース相補体を作成した。しかしながら、これらのプライマーは十分に多重化しておらず、1つの不良なプライマーが、アッセイを良好から不良に変え得る(例えば、全てプライマー二量体で、生成物なし)(
図4)。多重化のためのより良好なプライマーを作成する試みにおいて、ミスプライミングライブラリーフィーチャーを含むプライマー3(シェアウェア)を使用した。プライマー3により設計されたプライマーは、多重アッセイにおいて、デザインスタジオのプライマーよりもさらに不完全に働いたとが発見された。驚くべきことに、データは、STRプライマーが良好に多重化していることを示しながら生成されていた。STR標的に向けられ、不完全に設計されたプライマー対は、SNPプライマーがしたように、多重化に障害を引き起こすことはなかったと観察された。STRプライマーは、「良好な」プライマーとして知られているものとは違い、長くて、ATリッチであり、低い融解温度を有する。
【0092】
SNPプライマーを、実施例1のパラメータに従って再設計した。全ての標的に対するプライマーを、一緒に混合した。この例では、56のSTRに対するプライマー対を、75のiSNP、aSNP、および表現型インフォーマティブSNPに対するプライマー対と混合した。ポリメラーゼ(この例ではホットスタートPhusion II)を、PCRに必要な全ての成分のマスターミックスに添加し、プライマーを添加した。混合物を、PCRプレートのウェルにピペッティングしたが、増幅はチューブなどにおいても実施することができる。DNAを、精製DNAとして、15マイクロリットルの体積でプレートに添加したが、スワブまたは無処理濾紙からの血液または口腔試料の溶解抽出物、または、FTAカード上の血液または口腔試料などから直接得た溶解抽出物を使用することもできる。この実験では、精製された対照2800M DNAを1ngおよび100pgで用いた。反応液を、プロトコルに従い、規定回数のサイクル(この例の場合、25サイクル)でPCRにかけた:
【0093】
サイクリング後、プレートを熱循環装置から取り出した。反応液を、ポリメラーゼ(Kapa HiFi、カパバイオシステムズ社)、PCRに必要な全ての成分を含むPCRマスターミックス、ならびにアダプター対(1つのi7および1つのi5アダプター)で、50マイクロリットルにした。PCRの第2ラウンドを規定回数サイクル(この例の場合、10サイクル)で実施し、プロトコルに従って、配列決定ライブラリーを作成した。
【0094】
サイクリング後、完成したライブラリーを含むプレートを熱循環装置から取り出した。この時点で、試料を体積によりプールし、単一試料として、例えば磁気ビーズ(SPRI)を使用して精製することができる。試料は、個々に精製することもできる。プールされたまたは個々のライブラリーは、qPCRベースの方法を用いることで、フラグメント分析器もしくはバイオアナライザーを用いることで、またはピコグリーンおよびプレートリーダー(この例の場合のように)を用いることで定量することができる。当業者は、ライブラリー定量の数多くの選択肢を知っているであろう。ライブラリーが個々に精製されている場合、それらを2nM各濃度に正規化し、体積によりプールすることができる。
【0095】
精製されたライブラリーのプールを変性、希釈、クラスター化し、MiSeqの配列決定機器により、350-サイクル配列決定ランおよび2つのインデックスリードで配列決定した。配列決定後、試料を、アダプター配列に応じて逆多重化し、法医学ゲノミクスパイプライン(イルミナ社)を介して分析した。STRリードを、SNPリードから分離し、独立して分析した。STRを、以前の特許出願(その全体が参照により本明細書に組み込まれる、特許文献38)に記載されているアルゴリズムを使用して分析した。反復数(単数または複数)および任意の配列変異を、リード番号とともに報告した。SNPをマニフェストを使用して分析し、コールをリード番号とともに報告した。対立遺伝子間の相対的平衡(最小/最大%)、遺伝子座間の平衡(%CV)、エラー率、およびスタッター率を、STR遺伝子座について計算した。初期データバンキング多重化でのSTRの結果を、
図5A~Cに示す。平衡(平均平衡80%)、スタッター(~3%)およびエラー率(5%未満)は、この実施例に含まれる遺伝子座の設計入力要件を満たす。%CV(~142%)は、全56遺伝子座を用いて計算した。使用したプライマーは遺伝子座内平衡を示すにもかかわらず、さらなるプライマー最適化は遺伝子座内平衡を改善することが予想される。既知遺伝子座のコールは、公表された2800Mについての結果と一致する。SNPについての結果を、
図5D~Eに示す。大規模な多重化における56のSTR遺伝子座についてのカバー率、対立遺伝子コール、スタッターおよびその他のアーチファクトを、
図6に示す。これらのグラフは、CE技術により生成された電気泳動図を再現する。バーは、定義された対立遺伝子のピーク(X軸)に類似し、リードカウント(Y軸)はRFUに類似している。SNPについてのカバー率は、SNPに応じて10~2500Xの範囲であり、しかしながら、多重化された全てのSNPはカウントされ、正確なコールを提供した。
【0096】
(実施例3:犯罪ケースワークのためのDNAプロファイリング)
この実施例は、
図3のワークフローに従った実験を説明している。得られた試料は、その身元が既に知られてはいない個人からのものであると推測できたため、この実施例ではUMIがプライマーに組み込まれている。
【0097】
この実験では、表5に見られるように、STRはiSNP、aSNPおよび表現型インフォーマティブSNPで多重化されている。
【表5-1】
【表5-2】
【0098】
この実施例には、STRプライマーのUMIが含まれている。これらの実施例では、STRプライマーのみがUMIを含むが、必要に応じてSTRおよびSNPプライマーの両方がUMIを含む場合もあり、その選択肢は慣行から除外されていない。しかしながら、この実施例では、STRプライマーのみが、デモンストレーション用UMIを組み込む。固有分子識別子を、PCRの2サイクルの間に導入した(
図3)。まず、実施例2と同様に、PCRプライマーは、3'末端の遺伝子特異的PCRプライマー配列と、5'末端のアダプタータグ配列を含み、i5およびi7配列について実施例2で使用したタグ配列と同じである。この実験では、UMIは、遺伝子特異的プライマー配列とタグ配列との間に配置されている。この実施例の場合、フォワードおよびリバースの両方のプライマーのUMIに使用される5つのランダム化塩基があった。全ての標的に対するプライマーを、一緒に混合した。プライマー混合物は、26の常染色体STRプライマー対および86のSNPプライマー対からなっていた(カバーされた92のSNP)。ポリメラーゼ(この例ではホットスタートPhusion II)を、PCRに必要な全ての成分のマスターミックスに添加し、プライマーを添加した。混合物を、PCRプレートのウェルにピペッティングした。DNAを、精製DNAとしてプレートに、最適には1ngで添加した。実施例2のように、2800M対照からの精製DNAを、1ngで試験した。多重反応混合物を、プロトコルに従って、2サイクルのPCRにかけた:
【0099】
サイクリング後、試料を熱循環装置から取り出し、大腸菌一本鎖DNA結合タンパク質(SSB)を反応物に添加した。SSBは、未使用のタグ付けされた遺伝子特異的プライマーによりプライマー二量体を低減し、これらのプライマーからのそれ以上の増幅を防止すると考えられた。SSBを試料と氷上でインキュベートし、あるいは室温または37℃のインキュベーションを使用することもできる。このインキュベーションの後、ポリメラーゼ(この例ではホットスタートPhusion II)を、PCRに必要な全ての成分のマスターミックスに添加し、マスターミックスを、アダプターの対(i7およびi5アダプター)とともに試料に添加し、プロトコルに従って規定回数のサイクル(この実験では34サイクル)で循環させた:
【0100】
試料をSPRIビーズで精製し、個々のライブラリーは、qPCRベースの方法を用いることで、フラグメント分析器(この例の場合のように)もしくはバイオアナライザーを用いることで、またはピコグリーンおよびプレートリーダーを用いることで定量することができた。ライブラリーを2nM各濃度に正規化し、体積によりプールした。
【0101】
精製されたライブラリーのプールを変性、希釈、クラスター化し、MiSeqを使用して、350x100-サイクル配列決定ランおよび2つのインデックスリードで配列決定した。配列決定後、実施例2で説明したように、データを測定した。しかしながら、プライマーはUMIを含むため、PCRの重複を使用することにより、配列決定ならびにPCRエラーおよびアーチファクトを除去するために、UMIを使用してデータを折り畳んだ。SNPをマニフェストを使用して分析し、コールをリード番号とともに報告した。対立遺伝子間の相対的平衡(最小/最大%)、遺伝子座間の平衡(%CV)、エラー率、およびスタッター率を計算した。初期ケースワーク多重化の結果を、
図7A~Eに示す。大規模な多重化における26のSTR遺伝子座についてのカバー率、対立遺伝子コール、スタッターおよびその他のアーチファクトを、
図8に示す。これらのグラフは、CEにより生成された電気泳動図を再現する。バーはピークに類似し、リードカウントはRFUに類似している。SNPについてのカバー率は、SNPに応じて10~5500Xの範囲であり、しかしながら、多重化された全てのSNPはカウントされ、有用な結果を提供した。
【0102】
これらの研究によりもたらされた1つの結果は、スタッターがPCRアーチファクトであることが示されたということであった。これは、多くの研究者により推定されてきたが(およびポリメラーゼスリッページが、ヒト結腸がんにおいて示されてきた)、これは、法医学分析では実証されていない。UMIを使用して、スタッターが実際にはPCRアーチファクトであることを示すことができる。n+1またはn-1反復を有する生成品は、正確な反復数の生成品と同じUMIを有する(
図9)。
図9Aでは、各遺伝子座は、UMI補正が実行される
図9Bと異なり、UMI補正なしでの結果を示している。示されるように、UMI補正なし対立遺伝子間の平衡は、UMI補正を行った場合ほど良好ではない。さらに、UMI補正なしでは明らかであるスタッターがかなり多くある。バーライン間の上のバー部分は配列決定エラーを表し、それに対してラインの下はSTR配列内の正しい配列を表す。エラーはUMI補正で大幅に低減される。例えば、SE33遺伝子座は、UMI補正で除去されるエラーを有する。犯罪ケースワークが、考えられる最も正確なDNAプロファイリングを提供するために、エラー訂正は非常に重要となることがある。
【0103】
(実施例4:12の試料個体を用いるDNAプロファイリング)
[方法および材料]
12の試料個体からのDNA(試料#1、3、4、5、6、7、10、13、14、15、16、17)および1つの参照ゲノム(2800M)を、
図3のワークフローに従って試験した。この実験は、実施例3に記載のように、UMIをSTRプライマーに組み込む。各試料の2つの複製を、イルミナ(登録商標)ForenSeq DNAシグネチャーライブラリープレップキットを用い、MiSeqシーケンサー上で分析した。DNAプライマーミックスB(61のSTRのプライマーと、加えてアメロゲニン、95の同一性インフォーマティブSNP、56の祖先インフォーマティブSNP、22の表現型インフォーマティブSNP(2つの祖先型SNPは、表現型の予測にも用いられる)を含む、採取した試料の混合物)を使用する各複製に、1ngのDNAを用いた。
【0104】
[デフォルト設定]
STR:分析閾値= 6.5%;解釈閾値= 15%。SNP:分析閾値= 3%;解釈閾値= 15%。
【0105】
12の試料個体のDNAプロファイリングについて、カバー率および遺伝子座コールなどの高レベル配列決定コールを、
図12に示す。見て分かるように、全ての遺伝子座は、両複製において、少なくとも100,000リードによりカバーされた。2つの試料のみが、失敗したSTRコール(61のうち1つ)をもたらした。173のSNPの全てが、両複製における全ての個体でのコールに成功した。2つの試料個体の試料STRコールを、
図16に示す。2つの試料個体の試料SNPコールを、
図17に示す。
図13は、国立標準技術研究所(NIST)オートSTRのランダムマッチ確率(RMP)、NIST Y-STRの95%信頼ハプロタイプ頻度、dbSNP iSNPのRMP、およびU.S. Y-STRデータベースからのSTRのRMPなどの母集団統計値を示している。
【0106】
12の試料個体および参照個体の目の色および髪色などの表現型を、実験でのpSNPの遺伝子型に基づいて予測し、自己申告の表現型と比較した(
図14)。予測および報告された表現型の間の高い相関が観察された。
【0107】
12の試料個体の祖先型を、実験での56のaSNPの遺伝子型を用いて予測した。各試料個体のPCA1およびPCA3スコアを計算し、参照試料に対して祖先型プロット上にプロットした。
図15に示されるように、試料個体の祖先型は、祖先型プロット上の位置に基づいて予測することができる。14重心点は、祖先型プロット(円)に含まれていた。最も近い重心点に基づいて、各試料個体の祖先型を予測した。
【0108】
DNAプロファイリング実験はまた、
図18に見られるように、STR遺伝子座およびSNP遺伝子座の両方において高いレベル遺伝子座内平衡を示し、ならびに、
図19に見られるように、低いレベルのスタッターを示した。
【0109】
12のうちの6個体に加えて、2800Mは、少なくとも1つのアイソメトリックヘテロ接合遺伝子座を有し、それは
図20に示されている。アイソメトリックヘテロ接合遺伝子座は、同じ反復回数、均等に平衡のとれた2つの異なる配列を有するSTRとして定義される。STR D8S1179での変異情報を用いて、試料15の13の対立遺伝子は、試料17の祖母にたどった(
図21)。STR D13S317における類似の変異情報を使用し、試料15の対立遺伝子を追跡した。しかしながら、この場合にはいずれの対立遺伝子の起源の把握することができない(
図22)。
【0110】
(実施例5:研究、法医学、または父親鑑定使用のためのDNAプロファイリング)
この実施例では、ForenSeq(商標)DNAシグネチャープレップガイド(イルミナ社、サンディエゴ、カリフォルニア州)に記載のワークフローに基づいており、その内容は、参照によりその全体が本明細書に組み込まれる。
【0111】
精製DNAまたはクルード溶解物のいずれかを、この実施例に使用することができる。精製DNAでは、それぞれ1ngの試料を、ヌクレアーゼが含まれていない水で0.2ng/μlに希釈する。クルード溶解物では、それぞれ2μlの試料を、3μlのヌクレアーゼが含まれていない水で希釈する。マスターミックスは、8以上の反応用に設定されている。各反応について、5.4μlのForenSeq PCR1反応ミックス、0.4μlのForenSeq酵素ミックスおよび5.8μlのDNAプライマーミックス(AまたはB)を1.5mlマイクロチューブに加える。10μlのマスターミックスをPCRプレートの各ウェルに移し、DNAまたは溶解物を添加する。多重反応混合物を、プロトコルに従ってPCRにかける:
98℃で3分間
以下の8サイクル:
96℃で45秒間
80℃で30秒間
54℃で2分間、特定のランピングモードで
68℃で2分間、特定のランピングモードで
以下の10サイクル:
96℃で30秒間
68℃で3分間、特定のランピングモードで
68℃で10分間
10℃で保留。
【0112】
サイクリング後、試料熱循環装置から取り出した。ForenSeq PCR2反応ミックスを、アダプターの対(i7およびi5アダプター)とともに試料に添加し、プロトコルに従って15サイクルで循環させた:
98℃で30秒間
以下の15サイクル:
98℃で20秒間
66℃で30秒間
68℃で90秒間
68℃で10分間
10℃で保留。
【0113】
試料を試料精製ビーズで精製し、ライブラリーを正規化し、体積によりプールした。プールされたライブラリーをハイブリダイゼーション緩衝液(HT1)中で希釈し、ヒト配列決定制御(HSC)で加え、配列決定に備えて熱変性させた。
【0114】
(実施例6:分解DNAでの遺伝子型判定)
図23は、分解DNAを表す、せん断されたおよび/またはDNase処理されたDNAを用いた遺伝子型決定の結果を示している。示されているように、50%より多いSTRおよびSNP遺伝子座が、せん断されたDNAで正しくコールされた。10
-19のランダムマッチ確率(RMP)が、100bp未満のDNAで達成された。正しい祖先型も、分解DNAを用いて予測された。
【0115】
(実施例7:遺伝子型判定感度)
図24および25は、7.82pg~1ngのサブナノグラムDNA入力レベルでの遺伝子型判定感度結果を表す。示されているように、100%の対立遺伝子がSTRおよびSNPの両方で125ng入力DNAで正常にコールされた。50%より多くの対立遺伝子が、7.82 pgと低い入力DNAで、正常にコールされた。遺伝子座内平衡は、ほとんどの遺伝子座について、1ngの入力DNAで、70%を越えていた。
【0116】
本明細書で使用される、成分の量、反応条件などを表す全ての数字は、全ての場合において、「約」という用語により変更されるものとして理解されるべきである。したがって、特に断りのない限り、本明細書に記載される数値パラメータは、得ようとする所望の特性に依存して変化し得る近似値である。最低限、そして、本出願の優先権を主張する任意の出願における任意の請求項の範囲への均等論の適用を制限する試みとしてではなく、各数値パラメータは、有効数字の数および通常の端数処理に照らして解釈されるべきである。
【0117】
公開および未公開の出願、特許、および参考文献を含むがこれらに限定されない、本明細書に引用される全ての参考文献は、その全体が参照により本明細書に組み込まれており、これにより本明細書の一部となる。参照により組み込まれる刊行物および特許または特許出願が、本明細書に含まれる開示と矛盾する限りにおいて、本明細書は、任意のこのような矛盾する資料に取って代わるおよび/または優先することが意図されている。
【0118】
上記の刊行物または文書の引用は、前述のいずれかが関連先行技術であることを承認するものではなく、およびこれらの刊行物または文書の内容または日付に関する任意の承認を構成するものでもないことが意図されている。
【0119】
本発明は、添付の図面を参照してその実施形態に関連して説明してきたが、様々な変更および修正は、当業者には明らかとなるであろうことに留意すべきである。このような変更および修正は、本発明の範囲内に含まれるものとして理解されるべきである。本発明の様々な実施形態は、限定する目的ではなく、ほんの一例として提示されているということが理解されるべきである。同様に、様々な図表は、発明についての構造上の例またはその他の構成を示すことができ、本発明に含まれ得る特性および機能の理解を助けるためになされている。本発明は、図示例の構造または構成に限定されるものではないが、様々な代替構造および構成を用いて実現されることができる。さらに、本発明は、種々の例示的な実施形態および実装に関して上述されているが、個々の実施形態のうちの1つ以上において記載されている様々な特性および機能性は、それらが記載されている特定の実施形態への適用に限定されるものではないことが理解されるべきである。むしろそれらは、本発明の他の実施形態の1つ以上に単独でまたはいくつかの組み合わせで、そのような実施形態が記載されているか否かにせよ、およびそのような特性が記載の実施形態の一部として提示されているか否かにせよ、適用することができる。したがって、本発明の広さおよび範囲は、任意の上述した例示的な実施形態により限定されるべきではない。
【0120】
本明細書で使用する用語および語句、ならびにその実施形態は、特に明記のない限り、制限するの対語として、制限のないものとして解釈されるべきである。前述の例としては:用語「含む(including)」は、「限定することなく含む(including, without limitation)」などの意味で読まれるべきである;用語「例(example)」は、議論の項目の例示的な例を提供するために使用され、それらの包括的または制限するリストではない;ならびに、このような「従来の(conventional)」、「伝統的な(traditional)」、「通常の(normal)」、「標準的な(standard)」、「知られている(known)」などの形容詞、および類似の意味の用語は、記載の項目を一定期間に、または所定時間で利用可能な項目に制限するよう解釈されるべきではない。しかし、その代わりに、これらの用語は、利用可能で、現在または将来の任意の時点で知られている、従来の、伝統的な、通常の、または標準的な技術を包含すると読まれるべきである。同様に、接続詞「および(and)」と結びついている項目の集団は、それらの項目の1つ1つが、集団内に存在することを要求するものとして読まれるべきではなく、むしろ、文脈から明らかであるか、または特に明記しない限り、「および/または(and/or)」として読まれるべきである。同様に、接続詞「または(or)」と結びついている項目の集団は、その集団間の相互排他性を要求するものとして読まれるべきではなく、むしろここでも、文脈から明らかであるか、または特に明記しない限り、「および/または(and/or)」として読まれるべきである。また、本発明の項目、要素もしくは構成要素は、単数で説明または請求され得るが、単数への限定が明示的に述べられていない限り、複数はその範囲内であることが意図される。例えば、「少なくとも1つ」は、単数または複数について言及することができ、いずれかに限定されるものではない。「1つ以上」、「少なくとも」、「限定するものではない」などの広げる言葉や語句、または、いくつかの例における他のそのような語句の存在は、より狭い例が意図されること、または、そのような広がり語句が存在しない事例で必要とされることを意味すると読み取られるべきではない。
【配列表】