【文献】
Mol. Microbiol.,2008年,Vol.67, No.3,p.528-540
【文献】
FEMS Microbiol. Lett.,2007年,Vol.274,p.132-138
(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0022】
DNA配列決定のための一部のサンプル調製方法では、各テンプレートは挿入物の何れかの端にアダプタを含み、そして、DNAまたはRNAを修飾し、所望の修飾反応生成物を精製するために、多くのステップをしばしば必要とする。これらのステップは、典型的には、適応断片をフローセルに付加する前に溶液中で実行し、ここで該適応断片は、プライマーの伸長反応により表面に結合し、これにより、ハイブリダイズされた断片は、表面に共有結合的に付着したプライマーの端にコピーされる。これらの「播種」テンプレートは、その後、数回の増幅サイクルを通し、コピー済みテンプレートのモノクローナルクラスタを発生させる。しかしながら、内容の全体が本明細書に組み込まれる、米国特許出願公開第2010/0120098号明細書に開示されるように、クラスタ形成および配列決定のために用意した溶液中のアダプタ修正テンプレートに、DNAを形質転換するのに必要なステップの数は、トランスポザーゼが仲介する断片化およびタグ付け(本明細書ではタグメント化という)を用いることにより最小化することが可能である。例えば、タグメント化は、例えばNextera(登録商標)DNAサンプル調製キット(Illumina社)のワークフロー等で例示されるように、DNAの断片化のために用いることが可能であり、ここではゲノムDNAを、インプットDNAを同時に断片化およびタグ付けする設計トランスポソームにより断片化することにより、断片の端に固有アダプタ配列を含む断片化核酸分子の集団を生成することが可能である。しかしながら、改善された挿入バイアスを呈すトランスポザーゼ酵素が必要である。
【0023】
従って、本明細書では、核酸サンプルの改善された断片化およびタグ付けのためのトランスポザーゼを提示する。本発明者らは驚くべきことに、改善された挿入配列バイアスを呈し、多くの他の関連する利点を有する、ある改変トランスポザーゼを特定した。本明細書に提示する改変トランスポザーゼの一実施形態は、改善された挿入バイアスを呈すトランスポザーゼである。
【0024】
本明細書で用いる場合、用語「正規化トランスポソームアクティビティ」は、25nggDNAインプット収量において、曲線下の全面積についてバイオアナライザ断片サイズ分布をもたらすトランスポソームの最小濃度を意味する:50μL反応において、100〜300bp=20%〜30%;301〜600bp=30%〜40%;601〜7,000bp=30〜40%;100〜7,000bp≧90%である。この最小濃度を1Xという。
【0025】
本出願全体で用いる場合、トランスポソーム濃度を正規化アクティビティと区別せずに用いる。加えて、本出願全体で用いる場合、トランスポソーム濃度をトランスポザーゼ濃度と区別せずに用いる。
【0026】
本明細書で用いる場合、用語「挿入バイアス」は、挿入部位に対するトランスポザーゼの配列優先性を意味する。例えば、ポリヌクレオチドサンプルにおいてA/T/C/Gのバックグラウンド頻度が等しく分布している場合(25%A、25%T、25%C、25%G)、トランスポザーゼの結合部位または切断部位で他の3つより1つのヌクレオチドが過剰出現することは、該部位における挿入バイアスを映す。挿入バイアスは、当技術分野で既知である多くの方法のうち何れか一つを用いて測定することが可能である。例えば、下記の実施例1で概ね説明するように、挿入部位を配列決定し、挿入部位の各位置における任意の特定のヌクレオチドの相対存在量を比較することが可能である。
【0027】
「挿入バイアスにおける改善」は、改変トランスポザーゼの結合部位の1つまたは複数の位置における特定の塩基の頻度が低減または増加し、ポリヌクレオチドサンプルの該塩基のバックグラウンド頻度により近づくことを示す。改善とは、非改変トランスポザーゼの該位置における頻度と比較し、該位置における頻度の増加とすることが可能である。あるいは、改善とは、該位置における頻度の減少とすることが可能である。したがって、例えば、ポリヌクレオチドサンプルにおけるTヌクレオチドのバックグラウンド頻度が0.25であり、改変トランスポザーゼがトランスポザーゼ結合部位の特定位置において、Tヌクレオチド頻度を0.25超の頻度から0.25により近い頻度に低減する場合、改変トランスポザーゼは挿入バイアスが改善されている。同様に、例えば、ポリヌクレオチドサンプルのTヌクレオチドのバックグラウンド頻度が0.25であり、改変トランスポザーゼがトランスポザーゼ結合部位の特定位置において、Tヌクレオチド頻度を0.25未満の頻度から0.25により近い頻度に増加させる場合、改変トランスポザーゼは挿入バイアスが改善されている。
【0028】
挿入バイアスを測定する一方法論は、挿入部位の大規模配列決定により、結合部位の各位置における塩基頻度を挿入部位と比較して測定することである。これは例えばGreen et al. Mobile DNA (2012) 3:3に記載されており、これはその全体が参照により本明細書に組み込まれる。各位置における存在量を表示する典型的なツールは、例えば
図2に示すような強度対サイクルの分布プロットである。下記の実施例1に記載するように、トランスポゾンが仲介するタグ化および断片化により生成される断片端は、大規模で配列決定することが可能であり、挿入部位の各位置での塩基の分布頻度を測定して該挿入部位の1つまたは複数の位置のバイアスを検出することが可能である。したがって、例えば
図2に示すように、位置(1)において、「G」ヌクレオチドについては0.55、「A」ヌクレオチドについては0.16という頻度の塩基分布は、該位置におけるGに対する著しい優先性と、Aを避けるバイアスを映す。別の例としては、対照的に、
図3に示すように、位置(20)での塩基分布は、4塩基のそれぞれについて原則的に0.25であり、これは該位置において配列バイアスがほとんど、または全くないことを映す。
【0029】
本明細書に提示する一部の実施形態では、改変トランスポザーゼ酵素は、挿入部位から1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、または21塩基以上上流または下流に位置する1つまたは複数の部位で、挿入バイアスの縮小をもたらす。一部の実施形態では、改変トランスポザーゼ酵素は、挿入部位から1〜15塩基下流に位置する1つまたは複数の部位で、挿入バイアスの縮小をもたらす。一部の実施形態では、改変トランスポザーゼ酵素は、挿入部位から1〜15塩基上流に位置する1つまたは複数の部位で、挿入バイアスの縮小をもたらす。
【0030】
本明細書の下記でより詳細に記載するように、発明者らは驚くべきことに、トランポザーゼのアミノ酸配列のある位置における残基への1つまたは複数の変異が、転移事象中に改善された配列挿入バイアスをもたらすことを発見した。これらの改変トランスポザーゼは、高多様性および低多様性の核酸サンプルのタグメント化において改善された性能を提供し、これは、配列決定される様々な領域において、より優れたカバレッジ均一性とドロップアウトの減少をもたらす。
【0031】
本明細書で用いる場合、用語「DNAインプット許容差」は、ある範囲のインプットDNA量にわたり均一なDNA断片サイズを生成する、トランスポザーゼの能力を意味する。
【0032】
本明細書で用いる場合、伸長因子:TSについての表記は、Tsfと区別せずに用いる。
【0033】
一部の実施形態では、インプットDNAはゲノムDNAである。一部の実施形態では、インプットDNAの範囲は、0.001μg〜1mg、1ng〜1mg、1ng〜900ng、1ng〜500ng、1ng〜300ng、1ng〜250ng、1ng〜100ng、5ng〜250ng、または5ng〜100ngとすることが可能であり、トランスポザーゼの濃度は、5nM〜500nMである。一部の実施形態では、上記範囲のインプットDNAに対するトランスポザーゼの濃度は、およそ、25nM、30nM、35nM、40nM、50nM、60nM、65nM、70nM、75nM、80nM、90nM、95nM、100nM、125nM、130nM、140nM、150nM、175nM、180nM、190nM、200nM、210nM、225nM、230nM、240nM、250nM、260nM、275nM、280nM、290nM、300nM、325nM、350nM、360nM、375nM、380nM、390nM、400nM、425nM、450nM、475nM、または500nMである。一部の実施形態では、上記範囲のインプットDNAに対するトランスポザーゼまたは正規化トランスポソームの、正規化濃度の濃度は、およそ、0.1X〜10X、1X〜10X、3X〜8X、4X〜7Xの範囲から選択する。一部の実施形態では、上記範囲のインプットDNAに対するトランスポザーゼまたは正規化トランスポソームの正規化濃度は、およそ、0.1X、0.2X、0.3X、0.4X、0.5X、0.6X、0.7X、0.8X、0.9X、1X、1.1X、1.2X、1.3X、1.4X、1.5X、1.6X、1.7X、1.8X、1.9X、2X、2.1X、2.2X、2.3X、2.4X、2.5X、2.6X、2.7X、2.8X、2.9X、3X、3.1X、3.2X、3.3X、3.4X、3.5X、3.6X、3.7X、3.8X、3.9X、4X、4.1X、4.2X、4.3X、4.4X、4.5X、4.6X、4.7X、4.8X、4.9X、5X、5.1X、5.2X、5.3X、5.4X、5.5X、5.6X、5.7X、5.8X、5.9X、6X、6.1X、6.2X、6.3X、6.4X、6.5X、6.6X、6.7X、6.8X、6.9X、7X、または7.5X、8X、8.5X、9X、9.5X、10Xである。
【0034】
一部の実施形態では、インプットDNAの量は、1ng、2ng、3ng、4ng、5ng、6ng、7ng、8ng、9ng、10ng、11ng、12ng、13ng、15ng、20ng、25ng、30ng、35ng、40ng、45ng、50ng、55ng、60ng、65ng、70ng、75ng、80ng、85ng、90ng、95ng、100ng、110ng、115ng、120ng、125ng、130ng、135ng、140ng、150ng、155ng、160ng、165ng、170ng、180ng、185ng、190ng、195ng、200ng、210ng、220ng、225ng、230ng、235ng、240ng、245ng、250ng、260ng、270ng、280ng、290ng、300ng、325ng、350ng、375ng、400ng、425ng、450ng、475ng、500ng、525ng、550ng、600ng、650ng、700ng、750ng、800ng、850ng、または900ngである。一部の実施形態では、上記量のインプットDNAに対するトランポザーゼの濃度は、およそ、25nM、30nM、35nM、40nM、50nM、60nM、65nM、70nM、75nM、80nM、90nM、95nM、100nM、125nM、130nM、140nM、150nM、175nM、180nM、190nM、200nM、210nM、225nM、230nM、240nM、250nM、260nM、275nM、280nM、290nM、300nM、325nM、350nM、360nM、375nM、380nM、390nM、400nM、425nM、450nM、475nM、または500nMである。一部の実施形態では、上記量のインプットDNAに対するトランポザーゼまたは正規化トランスポソームの、正規化濃度の濃度は、およそ、0.1X〜10X、1X〜10X、3X〜8X、4X〜7Xの範囲から選択する。一部の実施形態では、上記量のインプットDNAに対するトランポザーゼまたは正規化トランスポソームの正規化濃度は、およそ、0.1X、0.2X、0.3X、0.4X、0.5X、0.6X、0.7X、0.8X、0.9X、1X、1.1X、1.2X、1.3X、1.4X、1.5X、1.6X、1.7X、1.8X、1.9X、2X、2.1X、2.2X、2.3X、2.4X、2.5X、2.6X、2.7X、2.8X、2.9X、3X、3.1X、3.2X、3.3X、3.4X、3.5X、3.6X、3.7X、3.8X、3.9X、4X、4.1X、4.2X、4.3X、4.4X、4.5X、4.6X、4.7X、4.8X、4.9X、5X、5.1X、5.2X、5.3X、5.4X、5.5X、5.6X、5.7X、5.8X、5.9X、6X、6.1X、6.2X、6.3X、6.4X、6.5X、6.6X、6.7X、6.8X、6.9X、7X、または7.5X、8X、8.5X、9X、9.5X、10Xである。
【0035】
一部の実施形態では、ng量のインプットDNAに対するトランスポザーゼのnM濃度比率はおよそ、0.5〜5、1〜5、2〜5、2.1〜3、または2.1〜2.5である。
【0036】
本明細書で用いる場合、用語「ゲノムDNA」は、様々な細胞タンパク質をコードする1つまたは複数の遺伝子を含む細胞に存在する核酸を意味する。一部の実施形態では、ゲノムDNAは原核生物、例えば細菌および古細菌に由来する。一部の実施形態では、ゲノムDNAは真核生物、例えば、ヒト、植物、菌類、アメーバに由来する。
【0037】
本明細書で用いる場合の用語「変異」または「修正」は、野生型の遺伝子または遺伝子産物と比較した場合に配列および/または機能特性において修正(つまり、改変特性)を示す、遺伝子または遺伝子産物を意味する。「変異」または「修正」はまた、野生型の遺伝子または遺伝子産物と比較した場合に配列および/または機能特性における修正(つまり、改変特性)を示す、特異的なヌクレオチド位置での配列、特定のコドン位置での配列、または特定のアミノ酸位置での配列を意味する。
【0038】
本明細書で用いる場合の「含んで(including)」は、用語「含んで(comprising)」と同じ意味を持つ。
【0039】
本明細書で用いる場合の「約(およそ)」は、数量的にプラス10%またはマイナス10%を意味する。
【0040】
下記でさらに詳細に記載するように、本発明者らは驚くべきことに、トランスポザーゼのアミノ酸配列のある位置での残基への1つ又は複数の変異は、DNAインプット許容差の拡大をもたらし、結果として、変異トランスポザーゼは野生型トランスポザーゼと比較し、ある範囲のインプットDNA量にわたって均一なDNAフラグメントサイズを生成することを発見した。一実施形態では、TS−Tn5059トランスポザーゼは、他のトランスポザーゼ、例えばTS−Tn5およびTn5バージョン1(TDE1)と比較し、拡大したDNAインプット許容差を呈す。
【0041】
一部の実施形態では、TS−Tn5059は他のトランスポザーゼと比較し、DNAインプット許容差の拡大を呈すが、該実施形態ではインプットDNAの範囲は1ng〜200ngのゲノムDNAであり、TS−Tn5059の濃度は100〜300nMである。一部の実施形態では、TS−Tn5059は他のトランスポザーゼと比較しDNAインプット許容差の拡大を呈すが、該実施形態ではインプットDNAの範囲は5ng〜200ngのゲノムDNAであり、TS−Tn5059の濃度は100〜250nMである。一部の実施形態では、TS−Tn5059は他のトランスポザーゼと比較しDNAインプット許容差の拡大を呈すが、該実施形態では、インプットDNAの範囲は5ng〜100ngのゲノムDNAであり、TS−Tn5059の濃度は240nM〜250nMである。
【0042】
拡大したDNAインプット許容差を有する改善された挿入バイアスは、現在のNextera(登録商標) Rapid Capture protocol(Illumina社)より、より速くより柔軟なサンプル調製およびエクソーム濃縮プロトコルを提供する。
【0043】
本明細書で用いる場合、用語「タグメント化」はトランスポソーム複合体によるDNAの修飾を意味し、該トランスポソーム複合体は、トランスポゾン端配列を備えるアダプタと複合体化した、トランスポザーゼ酵素を含む。タグメント化は、DNAの同時断片化と、二重断片の両鎖の5’端へのアダプタのライゲーションとをもたらす。
【0044】
本明細書で用いる場合、「トランスポソーム複合体」または「トランスポソーム」は、少なくとも一つのトランスポザーゼ酵素とトランスポザーゼ認識部位からなる。一部のこのような系において、トランスポザーゼは、トランスポゾン認識部位と機能的複合体を形成することが可能であり、これは転移反応に触媒作用を及ぼすことが可能である。トランスポザーゼは、トランスポザーゼ認識部位に結合し、本明細書でタグメント化と呼ぶプロセスにおいて、該トランスポザーゼ認識部位を標的核酸に挿入することができる。このような挿入事象の一部では、トランスポザーゼ認識部位の一方の鎖を標的核酸に移動させることができる。
【0045】
本明細書で示す改変トランスポザーゼ酵素は、トランスポソーム複合体の一部を形成することが可能である。例示的転移複合体には過活動Tn5トランスポザーゼおよびTn5型トランスポザーゼ認識部位が含まれるが、これらに限定されない。過活動Tn5トランスポザーゼには、米国特許第5925545号明細書、同第5965443号明細書、同第7083980号明細書、および同第7608434号明細書、ならびにGoryshin and Reznikoff, J. Biol. Chem., 273:7367 (1998)の開示内容に記載のものも含まれ、これらの各内容はその全体が参照により本明細書に組み込まれる。しかしながら、本明細書で示す改変トランスポザーゼ酵素は、意図した目的のために十分効率的に、ランダムまたはほぼランダムなやり方で、トランスポゾン端をタグ標的核酸に挿入することができる任意の転移系で利用可能であり、そして、提示した方法で用いることが可能であることが理解されよう。
【0046】
例えば、提示する改変トランスポザーゼは、Tn5アミノ酸配列の部位と機能的に同等の位置で少なくとも一つのアミノ酸置換変異を含むことが可能である。
図1に例示するように、Tn5に対して相同な領域を本明細書で説明し、他のトランスポザーゼ酵素、例えば、Hermesトランスポザーゼ、HIVインテグラーゼ、Muトランスポザーゼ、およびMos1トランスポザーゼにおける機能的に同等な部位の特定を可能にする。同様に、他のトランスポザーゼ酵素またはインテグラーゼ酵素における機能的に同等の部位は、例えば、Tn5アミノ酸配列の配列アライメントを実行し、保存または半保存された残基またはドメインを特定することにより、当業者に即座に明らかになろう。したがって、本明細書で提供するある実施形態で用いることが可能な転移系には、Tn5の部位と機能的に同等な部位を有する任意の既知のトランスポザーゼが含まれることが理解されよう。例えば、このような系は、MuAトランスポザーゼ、ならびに、R1およびR2の端配列を備えるMuトランスポザーゼ認識部位が含まれ得る(Mizuuchi, K., Cell, 35: 785, 1983; Savilahti, H, et al., EMBO J., 14: 4893, 1995)。
【0047】
本明細書で提供するある実施形態に含まれる転移系のより多くの例には、黄色ブドウ球菌Tn552(Colegio et al., J. Bacteriol., 183: 2384-8, 2001; Kirby C et al., Mol. Microbiol., 43: 173-86, 2002)、Ty1(Devine & Boeke, Nucleic Acids Res., 22: 3765-72, 1994および国際公開W95/23875)、トランスポゾンTn7(Craig, N L, Science. 271: 1512, 1996; Craig, N L, Review in: Curr Top Microbiol Immunol., 204:27-48, 1996)、Tn/OおよびIS10(Kleckner N, et al., Curr Top Microbiol Immunol., 204:49-82, 1996)、Marinerトランスポザーゼ((Lampe D J, et al., EMBO J., 15: 5470-9, 1996)、Tc1(Plasterk R H, Curr. Topics Microbiol. Immunol., 204: 125-43, 1996)、P因子(Gloor, G B, Methods Mol. Biol., 260: 97-114, 2004), Tn3 (Ichikawa & Ohtsubo, J Biol. Chem. 265:18829-32, 1990)、細菌挿入配列(Ohtsubo & Sekine, Curr. Top. Microbiol. Immunol. 204: 1-26, 1996)、レトロウイルス(Brown, et al., Proc Natl Acad Sci USA, 86:2525-9, 1989)、ならびにイーストのレトロトランスポゾン(Boeke & Corces, Annu Rev Microbiol. 43:403-34, 1989)が含まれる。上記で引用した参考文献は、その全体が参照により本明細書に組み込まれる。
【0048】
簡潔に言えば、「転移反応」は、1つ又は複数のトランスポゾンを標的核酸のランダムな部位またはほぼランダムな部位に挿入する反応である。転移反応において必須の構成要素は、トランスポザーゼ、および、トランスポゾンのヌクレオチド配列を呈すDNAオリゴヌクレオチドであり、移動するトランスポゾン配列およびその相補体(つまり、非移動トランスポゾン端配列)、ならびに、機能転移またはトランスポソーム複合体を形成するのに必要な他の構成要素が含まれる。DNAオリゴヌクレオチドはさらに、必要に応じてまたは所望により、追加配列(例えば、アダプタまたはプライマー配列)を含むことが可能である。
【0049】
核酸の5’および/または3’端に付加するアダプタは、ユニバーサル配列を含むことが可能である。ユニバーサル配列は、2つ以上の核酸分子に共通する、つまり共有されるヌクレオチド配列領域である。任意で、2つ以上の核酸分子はまた、配列の異なる領域を有する。したがって、例えば、5’アダプタは同一またはユニバーサルな核酸配列を含むことが可能であり、3’アダプタは同一またはユニバーサルな配列を含むことが可能である。複数の核酸分子の異なるメンバーに存在し得るユニバーサル配列は、ユニバーサル配列に対して相補的な単一ユニバーサルプライマーを用いて多数の異なる配列の複製または増幅を可能にする。
【0050】
トランスポザーゼ変異
したがって、本明細書では、野生型とトランスポザーゼと比較し修正した変異トランスポザーゼを提示する。改変トランスポザーゼは、下記の表1に記載の残基に機能的に同等な位置において、少なくとも1つのアミノ酸置換変異を含むことが可能である。表1は、トランスポザーゼ残基における置換変異を記載し、これは改善された挿入バイアスをもたらすことが示されている。表1に記載するように、本明細書で示す置換変異は、本明細書で配列番号1として例示する野生型Tn5トランスポザーゼ、または、他の部位に更なる変異を有するトランスポザーゼといった、任意の機能的トランスポザーゼバックボーンに存在し得、これには、過活動Tn5トランスポザーゼとして知られ、本明細書では配列番号11として例示するトランスポザーゼ配列にあるもの、例えば、米国特許第5925545号明細書、同第5965443号明細書、同第7083980号明細書、および同第7608434号明細書に組み込まれた事項に記載される1つまたは複数の変異が含まれる。
【0052】
当技術分野で理解されるように、上記表に挙げた参照番号は、野生型Tn5配列(配列番号1)のアミノ酸位置を意味する。当業者は、ナンバリングはN末端の切断、挿入、または融合により変わり得ることを理解しよう。上に挙げたアミノ酸の機能的位置は、位置のナンバリングが変わったとしても同じままだろう。例えば、配列番号25に記載の配列のうち最初の285個のアミノ酸残基は大腸菌TSのN末端融合を含み、その後ろに配列番号11のアミノ酸残基2〜476が続く。したがって、例えば配列番号25のPro656は、配列番号11のPro372と機能的に対応する。
【0053】
したがって、ある実施形態では、本明細書で提示する改変トランスポザーゼは、野生型トランスポザーゼと比較し、例えば、Tn5トランスポザーゼのアミノ酸配列のAsp248、Asp119、Trp125、Lys120、Lys212、Pro214、Gly251、Ala338、Glu146、および/またはGlu190と機能的に同等の位置で少なくとも1つのアミノ酸置換変異を含む。
【0054】
一部の実施形態では、変異トランスポザーゼは、位置Asp248で変異を含む。位置Asp248での変異は、例えば、置換変異または挿入変異とすることが可能である。ある実施形態では、変異はAsp以外の任意の残基への置換変異である。ある実施形態では、位置Asp248での置換変異は、Tyr、Thr、Lys、Ser、Leu、Ala、Trp、Pro、Gln、Arg、Phe、およびHisからなる群から選択される残基への変異を含む。
【0055】
ある実施形態では、位置Asp248での変異は、位置Asp248の後ろにおける挿入変異である。ある態様では、挿入変異には、Asp248の後ろへの任意の残基の挿入が含まれ得る。ある態様では、挿入変異には、位置Asp248の後ろへの疎水性残基の挿入が含まれ得る。疎水性残基は当業者には既知であり、該疎水性残基には、例えば、Val、Leu、Ile、Phe、Trp、Met、Ala、Tyr、およびCysが含まれる。ある態様では、挿入変異には、位置Asp248の後ろへのバリン残基の挿入が含まれ得る。
【0056】
本明細書で提示する一部の実施形態には、野生型Tn5トランスポザーゼと比較し修正した変異Tn5トランスポザーゼを含み、該変異トランスポザーゼは位置Asp119で変異を含む。ある態様では、位置Asp119における変異は置換変異である。ある態様では、位置Asp119における置換変異には、疎水性残基への変異が含まれ得る。疎水性残基は当業者に既知であり、例えば、Val、Leu、Ile、Phe、Trp、Met、Ala、Tyr、およびCysが含まれる。ある態様では、位置Asp119における置換変異には、親水性残基への変異が含まれ得る。親水性残基は当業者に既知であり、例えば、Arg、Lys、Asn、His、Pro、Asp、およびGluが含まれる。ある態様では、位置Asp119での置換変異には、Leu、Met、Ser、Ala、およびValからなる群から選択される残基への変異が含まれ得る。
【0057】
本明細書で提示する一部の実施形態には、野生型Tn5トランスポザーゼと比較し修正した変異Tn5トランスポザーゼを含み、該変異トランスポザーゼは位置Trp125で変異を含む。ある態様では、位置Trp125での変異は置換変異である。ある態様では、位置Trp125での置換変異には、メチオニン残基への変異が含まれ得る。
【0058】
本明細書に提示する一部の実施形態には、野生型Tn5トランスポザーゼと比較し修正した変異Tn5トランスポザーゼを含み、該変異トランスポザーゼは、位置Lys120で変異を含む。ある態様では、位置Lys120における変異は置換変異である。ある態様では、位置Lys120での置換変異には、嵩高い芳香族残基への変異が含まれ得る。嵩高い芳香族残基として特徴付けられる残基は当業者にとって既知であり、例えば、Phe、Tyr、およびTrpが含まれる。ある態様では、位置Lys120での置換変異に、Tyr、Phe、Trp、およびGluからなる群から選択される残基への変異が含まれ得る。
【0059】
本明細書で提示される一部の実施形態には、野生型Tn5トランスポザーゼと比較し修正した変異Tn5トランスポザーゼを含み、該変異トランスポザーゼはLys212および/またはPro214および/またはAla338の位置で変異を含む。ある態様では、Lys212および/またはPro214および/またはAla338の位置での変異は、置換変異である。ある態様では、位置Lys120での置換変異にはアルギニンへの変異が含まれる。ある態様では、位置Pro214での置換変異にはアルギニンへの変異が含まれる。ある態様では、位置Ala338での置換変異にはバリンへの変異が含まれる。一部の実施形態では、トランスポザーゼはGly251で置換変異をさらに含むことが可能である。ある態様では、位置Gly251での置換変異にはアルギニンへの変異が含まれる。
【0060】
本明細書で提示する一部の実施形態は、野生型Tn5トランスポザーゼと比較し修正した変異TN5トランスポザーゼを含み、該変異トランスポザーゼはGlu146および/またはGlu190および/またはGly251の位置で変異を含む。ある態様では、Glu146および/またはGlu190および/またはGly251の位置での変異は置換変異である。ある態様では、位置Glu146での置換変異にはグルタミンへの変異が含まれ得る。ある態様では、位置Glu190での置換変異にはグリシンへの変異が含まれ得る。ある態様では、位置Gly251での置換変異にはアルギニンへの変異が含まれ得る。
【0061】
上記実施形態の何れかにおいて、変異Tn5トランスポザーゼはさらに、Tn5トランスポザーゼのアミノ酸配列のGlu54および/またはMet56および/またはLeu372と機能的に同等の位置で置換変異を含むことが可能である。ある実施形態では、トランスポザーゼは、Tn5トランスポザーゼのアミノ酸配列のGlu54Lysおよび/またはMet56Alaおよび/またはLeu372Proに対し相同な置換変異を含む。
【0062】
本明細書に提示する一部の実施形態には、配列番号2〜10および12〜20の何れか一つのアミノ酸配列を含む変異Tn5トランスポザーゼが含まれる。
【0063】
本明細書では、半保存されたドメインへの置換変異を含む改変トランスポザーゼも提示する。本明細書で用いる場合、用語「半保存されたドメイン」は、様々なトランスポザーゼおよび/または様々な種のうち、完全に保存された、または、少なくとも部分的に保存された、トランスポザーゼの一部分を意味する。半保存されたドメインは、トランスポザーゼの触媒コアドメインに存在するアミノ酸残基を含む。驚くべきことに、半保存されたドメインにある1つまたは複数の残基の変異はトランスポザーゼアクティビティに影響を及ぼし、挿入バイアスにおいて改善をもたらすということを発見した。
【0064】
一部の実施形態では、半保存されたドメインは配列番号21に記載される配列を有するアミノ酸を含む。配列番号21はTn5トランスポザーゼのアミノ酸配列の残基124〜133に対応し、これは本明細書では配列番号1と記載する。半保存されたドメインにおける、様々なトランスポザーゼのうち保存を示す構造アライメントを
図1に記載する。
図1に示すトランスポザーゼ配列には、Tn5トランスポザーゼ(1MUH)、Hermesトランスポザーゼ(2BW3)、HIVインテグラーゼ(1ITG)、Muトランスポザーゼ(1BCM)、およびMos1トランスポザーゼ(3HOS)の触媒コアドメインが含まれる。
【0065】
半保存されたドメインにおける1つまたは複数の残基への変異は、驚くべきことに、挿入バイアスの改善をもたらすことが分かっている。例えば、本明細書で提示する改変トランスポザーゼの一部の実施形態では、置換変異には、配列番号21の位置2でTrp以外の任意の残基への変異が含まれる。ある実施形態では、改変トランスポザーゼは、配列番号21の位置2でMetへの変異を含む。
【0066】
「機能的に同等な」とは、異なるトランスポザーゼを全面的に用いる研究の場合に、対照トランスポザーゼが、酵素において同一の機能的役割を有する他のトランスポザーゼのアミノ酸位置で起きると考えられるアミノ酸置換を含むことを意味する。例えば、Muトランスポザーゼの位置288におけるリシンからメチオニンへの変異(K288M)は、Tn5トランスポザーゼの位置125におけるトリプトファンからメチオニンへの置換(W125M)と機能的に同等だろう。
【0067】
2つ以上の異なるトランスポザーゼにおいて通常機能的に同等な置換変異は、トランスポザーゼのアミノ酸配列における相同なアミノ酸位置において起きる。つまり、用語「機能的に同等な」を本明細書で用いる場合、変異アミノ酸の特定の機能が既知であるか否かに関わらず、所定の変異に「位置的に同等」または「相同」である変異も含む。2つ以上の異なるトランスポザーゼのアミノ酸配列において、位置的に同等または相同なアミノ酸残基は、配列アライメントおよび/または分子モデリングを基に特定することが可能である。位置的に同等および/または機能的に同等な残基を特定するための配列アライメントおよび分子モデリングの例を
図1に記載する。したがって、例えば、
図1に示すように、半保存されたドメインにおける残基は、Tn5トランスポザーゼのアミノ酸配列の位置124〜133として特定される。Hermesトランスポザーゼ、HIVインテグラーゼ、Muトランスポザーゼ、およびMos1トランスポザーゼにおける対応残基は、垂直に並べた図において特定される。これらは、Tn5トランスポザーゼのアミノ酸配列の対応残基と機能的に同等であると同時に、位置的に同等であると考えられる。
【0068】
上記の改変トランスポザーゼは追加の置換変異を含むことが可能であり、これは、トランスポザーゼアクティビティの1つまたは複数の態様を高めることが知られている。例えば、一部の実施形態では、上記の変異のうち何れかに加え、改変Tn5トランスポザーゼは、Tn5トランスポザーゼのアミノ酸配列のGlu54および/またはMet56および/またはLeu372と機能的に同等な位置で置換変異をさらに含むことが可能である。当技術分野で既知のように、そして、米国特許第5925545号明細書、同第5965443号明細書、同第7083980号明細書、および同第7608434号明細書の開示内容、ならびに、Goryshin and Reznikoff, J. Biol. Chem., 273:7367 (1998)の開示内容(これらは各々、その全体が参照により組み込まれる)により例示されるように、Tn5トランスポザーゼのアミノ酸配列のGlu54および/またはMet56および/またはLeu372と機能的に同等な位置にある1つまたは複数の位置において、改善されたアクティビティをもたらす種々の置換変異のうち何れかを行うことが可能である。実施形態では、トランスポザーゼは、Tn5トランスポザーゼのアミノ酸配列のGlu54Lysおよび/またはMet56Alaおよび/またはLeu372Proに相同な置換変異を含む。例えば、置換変異には、Tn5トランスポザーゼのアミノ酸配列のGlu54Lysおよび/またはMet56Alaおよび/またはLeu372Proに相同な置換変異を含み得る。
【0069】
トランスポザーゼ変異
様々な型の突然変異誘発を本開示で任意に用いて、例えば、上記のトランスポザーゼモデルおよびモデル予測に従って、または、ランダムもしくは半ランダムな変異アプローチを用いて、例えば、トランスポザーゼを修飾して多様体を生成する。通常、任意の利用可能な突然変異誘発手順を、トランスポザーゼ変異体を作成するために用いることが可能である。このような突然変異誘発手順には、対象の1つまたは複数のアクティビティ(例えば、改善された挿入バイアス)のために、変異核酸および変異ポリペプチドを選択することが任意で含まれる。用いることが可能な手順には、部位特異的点突然変異誘発、ランダム点突然変異誘発(random point mutagenesis)、in vitroまたはin vivoの相同組み換え(DNAシャッフリングおよびコンビナトリアルオーバーラップPCR)、テンプレートを含むウラシルを用いた突然変異誘発、オリゴヌクレオチド特異的突然変異誘発、ホスホロチオエート修正DNA突然変異誘発、ギャップ付き二重DNAを用いた突然変異誘発、点不一致修復、欠損修復宿主株を用いた突然変異誘発、制約選択および制約精製、欠失突然変異誘発、全遺伝子合成による突然変異誘発、縮重PCR、二重鎖切断修復、ならびに、当業者に既知の他の多くのものが含まれるが、これらに限定されない。変異用開始トランスポザーゼは本明細書に記載のもののうち何れかとすることが可能であり、これには、例えば、米国特許第5925545号明細書、同第5965443号明細書、同第7083980号明細書、および同第7608434号明細書、ならびにGoryshin and Reznikoff, J. Biol. Chem., 273:7367 (1998) の開示内容(これらはそれぞれ、参照によりその全体が組み込まれる)で特定されるものといった、利用可能なトランスポザーゼ変異体が含まれる。
【0070】
任意で、突然変異誘発は、天然発生トランスポザーゼ分子からの既知の情報、または、既知の改変もしくは変異したトランスポザーゼ(例えば、上記参考文献に記載される既存の変異トランスポザーゼを用いる)についての既知の情報、例えば、上記のような、配列、配列比較、物理特性、および/または結晶構造等により誘導することが可能である。しかしながら、別の種類の実施形態では、修飾は、(例えば、標準的または「ファミリー」のDNAシャッフリングのように(例えば、Crameri et al. (1998) "DNA shuffling of a family of genes from diverse species accelerates directed evolution" Nature 391:288-291を参照))、基本的にランダムとすることが可能である。
【0071】
変異フォーマットについての追加情報は以下にある:Sambrook et al., Molecular Cloning--A Laboratory Manual (3rd Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y., 2000 ("Sambrook");Current Protocols in Molecular Biology, F. M. Ausubel et al., eds., Current Protocols, a joint venture between Greene Publishing Associates, Inc. and John Wiley & Sons, Inc., (supplemented through 2011) ("Ausubel")) and PCR Protocols A Guide to Methods and Applications (Innis et al. eds) Academic Press Inc. San Diego, Calif. (1990) ("Innis")。以下の刊行物およびその中で引用される参考文献は、変異フォーマットについてさらなる詳細を提供する:Arnold, Protein engineering for unusual environments, Current Opinion in Biotechnology 4:450-455 (1993);Bass et al., Mutant Trp repressors with new DNA-binding specificities, Science 242:240-245 (1988);Bordo and Argos (1991) Suggestions for "Safe" Residue Substitutions in Site-directed Mutagenesis 217:721-729; Botstein & Shortle, Strategies and applications of in vitro mutagenesis, Science 229:1193-1201 (1985);Carter et al., Improved oligonucleotide site-directed mutagenesis using M13 vectors, Nucl. Acids Res. 13: 4431-4443 (1985);Carter, Site-directed mutagenesis, Biochem. J. 237:1-7 (1986);Carter, Improved oligonucleotide-directed mutagenesis using M13 vectors, Methods in Enzymol. 154: 382-403 (1987);Dale et al., Oligonucleotide-directed random mutagenesis using the phosphorothioate method, Methods Mol. Biol. 57:369-374 (1996);Eghtedarzadeh & Henikoff, Use of oligonucleotides to generate large deletions, Nucl. Acids Res. 14: 5115 (1986);Fritz et al., Oligonucleotide-directed construction of mutations: a gapped duplex DNA procedure without enzymatic reactions in vitro, Nucl. Acids Res. 16: 6987-6999 (1988);Grundstrom et al., Oligonucleotide-directed mutagenesis by microscale `shot-gun` gene synthesis, Nucl. Acids Res. 13: 3305-3316 (1985);Hayes (2002) Combining Computational and Experimental Screening for rapid Optimization of Protein Properties PNAS 99(25) 15926-15931;Kunkel, The efficiency of oligonucleotide directed mutagenesis, in Nucleic Acids & Molecular Biology (Eckstein, F. and Lilley, D. M. J. eds., Springer Verlag, Berlin)) (1987);Kunkel, Rapid and efficient site-specific mutagenesis without phenotypic selection, Proc. Natl. Acad. Sci. USA 82:488-492 (1985);Kunkel et al., Rapid and efficient site-specific mutagenesis without phenotypic selection, Methods in Enzymol. 154, 367-382 (1987);Kramer et al., The gapped duplex DNA approach to oligonucleotide-directed mutation construction, Nucl. Acids Res. 12: 9441-9456 (1984);Kramer & Fritz Oligonucleotide-directed construction of mutations via gapped duplex DNA, Methods in Enzymol. 154:350-367 (1987);Kramer et al., Point Mismatch Repair, Cell 38:879-887 (1984);Kramer et al., Improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed construction of mutations, Nucl. Acids Res. 16: 7207 (1988);Ling et al., Approaches to DNA mutagenesis: an overview, Anal Biochem. 254(2): 157-178 (1997);Lorimer and Pastan Nucleic Acids Res. 23, 3067-8 (1995);Mandecki, Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli: a method for site-specific mutagenesis, Proc. Natl. Acad. Sci. USA, 83:7177-7181(1986);Nakamaye & Eckstein, Inhibition of restriction end onuclease Nci I cleavage by phosphorothioate groups and its application to oligonucleotide-directed mutagenesis, Nucl. Acids Res. 14: 9679-9698 (1986);Nambiar et al., Total synthesis and cloning of a gene coding for the ribonuclease S protein, Science 223: 1299-1301(1984);Sakamar and Khorana, Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein (transducin), Nucl. Acids Res. 14: 6361-6372 (1988);Sayers et al., Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis, Nucl. Acids Res. 16:791-802 (1988);Sayers et al., Strand specific cleavage of phosphorothioate-containing DNA by reaction with restriction end onucleases in the presence of ethidium bromide, (1988) Nucl. Acids Res. 16: 803-814;Sieber, et al., Nature Biotechnology, 19:456-460 (2001);Smith, In vitro mutagenesis, Ann. Rev. Genet. 19:423-462 (1985);Methods in Enzymol. 100: 468-500 (1983);Methods in Enzymol. 154: 329-350 (1987);Stemmer, Nature 370, 389-91(1994);Taylor et al., The use of phosphorothioate-modified DNA in restriction enzyme reactions to prepare nicked DNA, Nucl. Acids Res. 13: 8749-8764 (1985);Taylor et al., The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified DNA, Nucl. Acids Res. 13: 8765-8787 (1985);Wells et al., Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin, Phil. Trans. R. Soc. Lond. A 317: 415-423 (1986);Wells et al., Cassette mutagenesis: an efficient method for generation of multiple mutations at defined sites, Gene 34:315-323 (1985);Zoller & Smith, Oligonucleotide-directed mutagenesis using M 13-derived vectors: an efficient and general procedure for the production of point mutations in any DNA fragment, Nucleic Acids Res. 10:6487-6500 (1982);Zoller & Smith, Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13 vectors, Methods in Enzymol. 100:468-500 (1983);Zoller & Smith, Oligonucleotide-directed mutagenesis: a simple method using two oligonucleotide primers and a single-stranded DNA template, Methods in Enzymol. 154:329-350 (1987);Clackson et al. (1991) "Making antibody fragments using phage display libraries" Nature 352:624-628;Gibbs et al. (2001) "Degenerate oligonucleotide gene shuffling (DOGS): a method for enhancing the frequency of recombination with family shuffling" Gene 271:13-20;および、Hiraga and Arnold (2003) "General method for sequence-independent site-directed chimeragenesis: J. Mol. Biol. 330:287-296。上記方法の多くについてのさらなる詳細はMethods in Enzymology Volume 154に見られ、これまた、様々な突然変異誘発法にまつわるトラブルシューティング問題に対する有用な制御について記載する。
【0072】
組み換えトランスポザーゼの作成と単離
概して、本明細書に提示するトランスポザーゼをコードする核酸は、クローニング、組み換え、in vitro合成、in vitro増幅、および/または他の利用可能な方法により作成することが可能である。種々の組み換え方法を、本明細書に提示するトランスポザーゼをコードする発現ベクターを発現するために用いることが可能である。組み換え核酸を作成する方法、発現産物を発現する方法、および発現産物を単離する方法は、当技術分野では周知であり、記載されている。多くの例示的変異および変異の組み合わせ、ならびに所望の変異を設計するための方法を本明細書では記載する。トランスポザーゼの触媒ドメインにおいて変異を作成し選択する方法は、本明細書にあるほか、米国特許第5925545号明細書、同第5965443号明細書、同第7083980号明細書、および同第7608434号明細書で例示されており、これらはその全体が参照により組み込まれる。
【0073】
変異、組み換え、およびin vitro核酸操作の方法(クローニング、発現、およびPCR等を含む)についての追加の有用な参考文献には、Berger and Kimmel, Guide to Molecular Cloning Techniques, Methods in Enzymology volume 152 Academic Press, Inc., San Diego, Calif. (Berger);Kaufman et al. (2003) Handbook of Molecular and Cellular Methods in Biology and Medicine Second Edition Ceske (ed) CRC Press (Kaufman);The Nucleic Acid Protocols Handbook Ralph Rapley (ed) (2000) Cold Spring Harbor, Humana Press Inc (Rapley);Chen et al. (ed) PCR Cloning Protocols, Second Edition (Methods in Molecular Biology, volume 192) Humana Press;およびin Viljoen et al. (2005) Molecular Diagnostic PCR Handbook Springer, ISBN 1402034032が含まれる。
【0074】
加えて、多量のキットが、細胞からプラスミドまたは他の関連核酸を精製するために商業的に利用可能である(例えば、Pharmacia Biotech社によるEasyPrep(登録商標)およびFlexiPrep(登録商標)、Stratagene社によるStrataClean(登録商標)、ならびに、Qiagen社によるQIAprep(登録商標)を参照)。任意の単離および/または精製した核酸をさらに操作して、細胞をトランスフェクトするのに用いる、および/または、関連ベクターに組み込んで発現のために有機体を感染させるなどする他の核酸を、生成することが可能である。典型的なクローニングベクターは、転写ターミネーターおよび翻訳ターミネーター、転写開始配列および翻訳開始配列、ならびに、特定の標的核酸の発現の調節に有用なプロモーターを含む。ベクターは任意で、少なくとも1つの独立ターミネーター配列を含む汎用発現カセットと、真核生物、原核生物、またはその両方において該カセットの複製を可能にする配列(例えば、シャトルベクター)と、原核生物系および真核生物系の両方のための選択マーカーとを含む。ベクターは、原核生物、真核生物、またはその両方における複製および統合に適している。
【0075】
一部の実施形態において、本明細書で提示するトランスポザーゼは融合タンパク質として発現する。融合タンパク質は、例えば、トランスポザーゼの可溶性、発現、および/または精製などの特性を高めることが可能である。本明細書で用いる場合、用語「融合タンパク質」は、天然の単一ポリペプチドには普通は存在しない少なくとも2つのポリペプチドドメインを有する、単一ポリペプチド鎖を意味する。したがって、天然に発生するタンパク質およびその点変異体は、本明細書で用いる「融合タンパク質」ではない。好適には、対象のポリペプチドはペプチド結合を介して少なくとも1つのポリペプチドドメインと融合し、該融合タンパク質はまた、別々のタンパク質に由来するアミノ酸部分間で、アミノ酸の連結領域を含み得る。対象のポリペプチドに融合したポリペプチドドメインは、対象のポリペプチドの可溶性および/または発現を高めることができ、そして、精製タグを提供して、組み換え融合タンパク質を宿主細胞、培養上清、またはその両方から精製することを可能にすることができる。発現、精製、および/または保存中に可溶性を高めるポリペプチドドメインは当技術分野で周知であり、該ポリペプチドドメインには、Fox, J.D. and Waugh D.S., E. coli Gene Expression Protocols Methods in Molecular Biology, (2003) 205:99-117およびHan et al. FEMS Microbiol. Lett. (2007) 274:132-138(これらはそれぞれ、その全体が参照により本明細書に組み込まれる)等で例示されるように、例えばマルトース結合タンパク質(MBP)および伸長因子Ts(Tsf)が含まれる。対象のポリペプチドに融合したポリペプチドドメインは、対象のポリペプチドのN末端またはC末端で融合することができる。用語「組み換え」は、例えば、アミノ酸もしくは核酸の単離セグメントを、遺伝子工学技術により化学的に合成する、または、操作することにより、さもなければ分離している2つの配列セグメントを人工的に組み合わせることを意味する。
【0076】
一実施形態では、本発明は修正Tn5トランスポザーゼおよび伸長因子Ts(Tsf)を含むトランスポザーゼ融合タンパク質を提供する。Tsf−Tn5融合タンパク質は、融合トランスポザーゼおよびフリートランスポゾン端を含む、機能的二量体トランスポソーム複合体に組み込むことができる。Tsf−Tn5融合タンパク質の可溶性および熱安定性は、非融合Tn5タンパク質と比較し高い。
【0077】
別の実施形態では、本発明は、修正Tn5トランスポザーゼと、5−メチルシトシンを認識するタンパク質ドメインとを含むトランスポザーゼ融合タンパク質を提供する。5−メチルシトシンを提供する。5−メチルシトシン−Tn5融合タンパク質は、融合トランスポザーゼおよびフリートランスポゾン端を含む、機能的二量体トランスポソーム複合体に組み込むことができる。5−メチルシトシン結合タンパク質ドメインを用いて、例えば、Tn5トランスポソーム複合体をゲノムのメチル化領域に標的させることができる。
【0078】
さらに別の実施形態では、本発明は、修正Tn5トランスポザーゼおよびドメインを結合するタンパク質A抗体を含む、トランスポザーゼ融合タンパク質を提供する。タンパク質A−Tn5融合タンパク質は、融合トランスポザーゼおよびフリートランスポゾン端を含む機能的二量体トランスポソーム複合体に組み込むことができる。タンパク質Aのドメインを結合する抗体は、例えば、Tn5トランスポソーム複合体を、ゲノムの抗体結合領域に標的させるのに用いることができる。
【0079】
本発明は、修正Tn5トランスポザーゼと、伸長因子TS(Tsf)の全てまたは一部とを含む、トランスポザーゼ融合タンパク質を提供する。Tsfはタンパク質タグであり、これを用いて、細菌の発現系、例えば大腸菌発現系で発現した異種タンパク質の可溶性を高めることができる。異種タンパク質の可溶性を高めるTsfの機能は、Tsfタンパク質に固有の高い折りたたみ効率に起因し得る。タンパク質精製実験において(データ表示なし)、Tsfをタンパク質Tuとの複合体として精製した。Tuを複合体中で結合させるには、Tsfを正しく折りたたむことが必要である、Tsf−Tu複合体の精製は、Tsfが正しく折りたたまれたことを示唆する。例示的な、核酸および大腸菌伸長因子TSの対応核酸配列は、それぞれ、配列番号22および23と示す。
【0080】
一例では、TS−Tn5融合タンパク質を、TSを過活動Tn5トランスポザーゼのN末端に融合させることにより構築した。変異Tn5トランスポザーゼタンパク質とのTS−融合の例示的アミノ酸配列は、それぞれ配列番号25および26と示す。配列番号24は、配列番号25のTS−変異タンパク質融合をコードする核酸配列に対応する。
【0081】
TSの全てまたは一部はN末端またはC末端で融合することが可能だが、当業者は、リンカー配列をTS配列とトランスポザーゼのN末端またはC末端との間に挿入可能であることを理解するだろう。一部の実施形態では、リンカー配列は1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50以上のアミノ酸長とすることが可能である。一部の実施形態では、融合タンパク質のトランスポザーゼ部分の1つまたは複数のアミノ酸は、削除する、または、リンカー配列と置き換えることができる。一部の実施形態では、融合タンパク質のトランスポザーゼ部分の第一メチオニンは、2つのアミノ酸、例えば、配列番号25および26で示されるGly−Thrと置き換えることができる。
【0082】
TS−Tn5融合構築物を大腸菌で発現させ、発現、可溶性、および熱安定性について評価した。Tn5のN末端へのTSの融合はTn5の可溶性を高めた。可溶性の向上は、トランスポソーム複合体のロバスト性の増大とタンパク質凝集の低下と関連付けることができる。TS−Tn5トランスポソームの熱安定性は、非融合Tn5トランスポソームの熱安定性と比較し実質的に改善する。一例では、熱によるTn5の凝集は、非融合Tn5対照と比較し、Tsf−Tn5融合構築物において実質的に縮小する。
【0083】
一応用例では、TS−Tn5融合タンパク質は、次世代配列決定プラットフォーム(例えば、Illumina社のGAまたはHiSeqプラットフォーム)での配列決定向けに、ディレクショナルRNA−seqライブラリの構築において用いる。
【0084】
別の適用例では、TS−Tn5融合タンパク質を正規化プロセスで用いることができる。別の適用例では、TS可溶化タグを、他の修正(変異)Tn5トランスポザーゼ酵素の発現および精製のために用いることができる。
【0085】
TS融合タグに特異的な抗体をプルダウンプロセスに用いて、トランスポソームタグ付き配列を捕捉することができる。一例では、TS融合タグ抗体はウサギポリクローナルである。
【0086】
別の適用例では、TS−Tn5トランスポソームおよび抗TS抗体を、混合トランスポソームプロセスで用いることができる。例えば、トランスポソーム反応を、Tsf−Tn5トランスポソームおよびTn5トランスポソーム(つまり、TSでタグ付けされてない)を用いて実行する。抗TS抗体を用いて、Tsf−Tn5トランスポソームタグ付き配列を特異的にプルダウンする。
【0087】
本発明は、修正Tn5トランスポザーゼと、5−メチルシトシンを認識するタンパク質ドメインとを含む、トランスポザーゼ融合タンパク質を提供する。タンパク質ドメインを結合する5−メチルシトシンは、例えば、Tn5トランスポソーム複合体をゲノムのメチル化領域に標的させるために用いることができる。一適用例では、ドメイン−Tn5トランスポソーム複合体を結合する5−メチルシトシンを用いて、メチル濃縮し断片化した、そしてタグを付けた(タグメント化)ライブラリを、メチル化分析用に生成することができる。
【0088】
一部の実施形態では、トランスポザーゼに融合したポリペプチドドメインは、タンパク質Aのドメインを結合する抗体を含む。タンパク質Aは、強固な折りたたみ特性のない、比較的小さいコンパクトな分子である。タンパク質Aのドメインを結合する抗体は、例えば、Tn5トランスポソーム複合体を、ゲノムの抗体結合領域に標的させるために用いることができる。例えば、5−メチルシトシンに特異的な抗体を用いて、ゲノムのメチル化領域に結合する、および、該領域を特定することができる。ゲノムの抗体結合領域は、タンパク質A−Tn5融合トランスポソーム複合体を用いて、断片化およびタグ付け(つまり、タグメント化)のために実質的に標的とすることができる。
【0089】
一部の実施形態では、トランスポザーゼに融合したポリペプチドドメインは精製タグを含む。本明細書で用いる場合の用語「精製タグ」は、ポリペプチドの精製または特定に適切な任意のペプチド配列を意味する。精製タグは、該精製タグに対し親和性のある別の部分に特異的に結合する。精製タグに特異的に結合するこのような部分は、通常、アガロースビーズなどの母材または樹脂に付着する。精製タグに特異的に結合する部分には、抗体、他のタンパク質(例えば、タンパク質Aまたはストレプトアビジン)、ニッケルまたはコバルトのイオンまたは樹脂、ビオチン、アミロース、マルトース、およびシクロデキストリンが含まれる。例示的な精製タグには(ヘキサヒスチジンペプチドなどの)ヒスチジン(HIS)タグが含まれ、これはニッケルイオンまたはコバルトイオンなどの金属イオンに結合するだろう。他の例示的精製タグは、mycタグ(EQKLISEEDL)、連鎖球菌(Strep)タグ(WSHPQFEK)、フラグ(Flag)タグ(DYKDDDDK)、およびV5タグ(GKPIPNPLLGLDST)である。用語「精製タグ」にはまた、「エピトープタグ」、つまり、抗体により特異的に認識されるペプチド配列が含まれる。例示的エピトープタグにはFLAGタグが含まれ、これはモノクローナル抗FLAG抗体により特異的に認識される。抗FLAG抗体により認識されるペプチド配列は、配列DYKDDDDKまたは実質的に同一であるその多様体からなる。一部の実施形態では、トランスポザーゼに融合したポリペプチドドメインは、SUMOタグおよびSTREPタグなど、下記の実施例1で例示するような2つ以上のタグを含む。用語「精製タグ」にはまた、実質的に同一の精製タグ多様体が含まれる。本明細書で用いる場合、「実質的に同一の多様体」は、精製タグの誘導体または断片を意味し、これは元の精製タグと比較し、(例えば、アミノ酸の置換、削除、または挿入を介して)修正されているが、精製タグを特異的に認識する部分に特異的に結合するという精製タグの特性は保持する。
【0090】
一部の実施形態では、トランスポザーゼに融合するポリペプチドドメインは発現タグを含む。本明細書で用いる場合、用語「発現タグ」は、第2ポリペプチドに付着することが可能で、対象の組み換えポリペプチドの可溶性、安定性、および/または発現をサポートするとされる、任意のペプチドまたはポリペプチドを意味する。例示的発現タグには、Fc−タグおよびSUMO−タグが含まれる。原則として、任意のペプチド、ポリペプチド、またはタンパク質は発現タグとして用いることが可能である。
【0091】
例えば、細胞単離および培養についての(例えば、後続核酸単離についての)他の有用な参考文献には、Freshney (1994) Culture of Animal Cells, a Manual of Basic Technique, third edition, Wiley-Liss, New York、ならびに、そこで言及された参考文献;Payne et al. (1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc. New York, N.Y.;Gamborg and Phillips (eds) (1995) Plant Cell, Tissue and Organ Culture;Fundamental Methods Springer Lab Manual, Springer-Verlag (Berlin Heidelberg New York)、およびAtlas and Parks (eds) The Handbook of Microbiological Media (1993) CRC Press, Boca Raton, Flaが含まれる。
【0092】
本明細書で開示する組み換えトランスポザーゼをコードする核酸はまた、本明細書で提示する実施形態の特徴である。特定のアミノ酸を多数のコドンによりコードすることが可能であり、ある翻訳系(例えば、原核細胞または真核細胞)はしばしばコドンバイアスを呈し、例えば、異なる有機体はしばしば、同一のアミノ酸をコードするいくつかの同義語コドンのうち一つを好む。このように、本明細書で提示する核酸は任意で「コドン最適化」されており、これは、トランスポザーゼを発現するのに用いられる特定の翻訳系に好まれるコドンを含むように核酸を合成することを意味する。例えば、細菌細胞において(または、細菌の特定株であっても)トランスポザーゼを発現することが望ましい場合、トランスポザーゼの効率的な発現のために、該細菌細胞のゲノムに最も多く見受けられるコドンを含むように核酸を合成することが可能である。真核細胞においてトランスポザーゼを発現することが望ましい場合、同様の手法を用いることができ、例えば、核酸は該真核細胞に好まれるコドンを含むことが可能である。
【0093】
種々のタンパク質の単離方法および検出方法は既知であり、例えば、本明細書で提示する組み換えトランスポザーゼを発現する細胞の組み換え培養物から、トランスポザーゼを単離するために用いることが可能である。種々のタンパク質単離方法および検出方法は、当技術分野では周知であり、例えば、以下に記載のものを含む:R. Scopes, Protein Purification, Springer-Verlag, N.Y. (1982);Deutscher, Methods in Enzymology Vol. 182: Guide to Protein Purification, Academic Press, Inc. N.Y. (1990);Sandana (1997) Bioseparation of Proteins, Academic Press, Inc.;Bollag et al. (1996) Protein Methods, 2.sup.nd Edition Wiley-Liss, NY;Walker (1996) The Protein Protocols Handbook Humana Press, NJ, Harris and Angal (1990) Protein Purification Applications: A Practical Approach IRL Press at Oxford, Oxford, England;Harris and Angal Protein Purification Methods: A Practical Approach IRL Press at Oxford, Oxford, England;Scopes (1993) Protein Purification: Principles and Practice 3.sup.rd Edition Springer Verlag, NY;Janson and Ryden (1998) Protein Purification: Principles, High Resolution Methods and Applications, Second Edition Wiley-VCH, NY;およびWalker (1998) Protein Protocols on CD-ROM Humana Press, NJ;ならびにそこに引用される参考文献。タンパク質の精製方法および検出方法に関する更なる詳細は、Satinder Ahuja ed., Handbook of Bioseparations, Academic Press (2000)に見られる。
【0094】
使用方法
本明細書で提示する改変トランスポザーゼは、in vitro転移技法などの配列決定手順において用いることが可能である。簡潔に言うと、in vitro転移は、トランスポソーム複合体と標的DNAを接触させることにより開始することが可能である。本開示のトランスポザーゼとともに用いるのに容易に適応させることが可能な例示的な転移手順および系は、例えば、国際公開第10/048605;米国特許出願公開第2012/0301925号明細書;同第2013/0143774号明細書に記載されており、これらはその全体が参照により本明細書に組み込まれる。
【0095】
例えば、一部の実施形態では、(例えば、次世代配列決定または増幅のテンプレートとして用いるために)対象の任意のdsDNAを含む標的DNAからタグ付きDNA断片のライブラリを精製する方法において、本明細書で提示するトランスポザーゼ酵素を用いることが可能であり、該方法は、少なくとも一つのトランスポザーゼと該トランスポザーゼが転移複合体を共に形成するトランスポゾン端組成物とを用いて、標的DNAをin vitro転移反応でインキュベーションするステップであって、該トランスポゾン端組成物は、標的DNAへの多数の挿入が起きる条件および十分な時間において、(i)移動トランスポゾン端配列、および、任意で、該移動トランスポゾン端配列の追加配列5’−を呈する移動鎖と、(ii)移動トランスポゾン端配列と相補的な配列を呈す非移動鎖とを含み、それぞれは、移動鎖を含む、または移動鎖からなる第1タグを、標的DNAにおいてヌクレオチドの5’端につなぎ合わせ、それにより標的DNAの断片化とアニールした5’タグ付きDNA断片集団の生成をもたらし、該集団はそれぞれが5’端に第1タグを有する、ステップと、その後、5’タグ付きDNA断片の3’端を第1タグまたは第2タグにつなぎ合わせ、それによりタグ付きDNA断片の、(例えば、タグ付き環状ssDNA断片または5’タグ付きおよび3’タグ付きのDNA断片(つまり、「2つタグ付けされたDNA断片」)の何れかを含む)ライブラリを生成するステップと、を含む。
【0096】
一部の実施形態では、in vitro転移反応で用いる、トランスポザーゼおよびトランスポゾン端組成物の量またはトランスポソーム組成物の量は、50マイクロリットル反応につき50ナノグラムの標的DNAに対し約1ピコモル〜約25ピコモルである。本発明の任意の方法の一部の好適な実施形態では、in vitro転移反応で用いるトランスポザーゼおよびトランスポゾン端組成物の量またはトランスポソーム組成物の量は、50マイクロリットル反応につき50ナノグラムの標的DNAに対し約5ピコモル〜約50ピコモルである。トランスポザーゼが過活動Tn5トランスポザーゼであって、トランスポゾン端組成物がMEDSトランスポゾン端組成物を含むか、または、トランスポソーム組成物が前記過活動Tn5トランスポザーゼと、MEDSトランスポゾン端を備えるトランスポゾン端組成物とを含む、本発明の何れかの方法の一部の好適な実施形態では、in vitro転移反応で用いる前記トランスポザーゼおよびトランスポゾン端組成物の量または前記トランスポソーム組成物の量は、50マイクロリットル反応につき50ナノグラムの標的DNAに対し約5ピコモル〜約25ピコモルである。トランスポザーゼが過活動Tn5トランスポザーゼまたはMuAトランスポザーゼである、本発明の何れかの方法の一部の好適な実施形態では、in vitro転移反応で用いる、トランスポザーゼおよびトランスポゾン端組成物の最終濃度またはトランスポソーム組成物の最終濃度は、少なくとも250nMであり;一部の他の実施形態では、過活動Tn5トランスポザーゼまたはMuAトランスポザーゼの最終濃度、および、その各々のトランスポゾン端組成物またはトランスポソーム組成物の最終濃度は、少なくとも500nMである。
【0097】
一部の実施形態では、本発明は、エクソーム配列決定のためにゲノムDNAライブラリを調製し濃縮する方法を提供する。様々な実施形態において、本発明の方法は、ゲノムライブラリの調製のために、改変Tn5トランスポザーゼ、例えば、TS−Tn5059を用いる。一実施形態では、本発明の方法は、改変トランスポザーゼ、例えば、TS−TN5059の縮小挿入配列バイアスによって引き起こされる、縮小バイアスを有するゲノムライブラリの調製を可能にする。TS−Tn5059を用いたゲノムDNAのタグメント化は、広いGC/AT範囲にわたり、ゲノムのより完全なカバレッジをもたらす。
【0098】
別の実施形態では、本発明は、DNAインプット許容差が拡大した改変トランスポザーゼを用いたゲノムライブラリの調製方法を提供する。TS−Tn5059を用いたゲノムDNAのタグメント化は、ある範囲のDNAインプット量にわたって均一な挿入サイズをもたらす。一部の実施形態では、本発明はエクソーム配列決定方法を提供する。
【0099】
タグメント化反応条件
本明細書では、タグメント化反応用の、反応条件およびバッファを提示する。一部の実施形態では、二価カチオンをタグメント化反応バッファに含む。特定の実施形態では、二価カチオンは、例えば、Co
2+、Mn
2+、Mg
2+、Cd
2+、またはCa
2+とすることが可能である。二価カチオンは、塩化物塩といった任意の適切な塩の形態で、例えば、CoCl
2、MnCl
2、MgCl
2、酢酸マグネシウム、CdCl
2、またはCaCl
2として含めることが可能である。特定の実施形態では、下記の実施例で例示するようにタグメント化バッファはCoCl
2を含む。実施例5の実験証拠により示すように、タグメント化バッファ配合におけるCoCl
2の追加は、驚くべきことにタグメント化中の配列バイアスを改善する。
【0100】
ある実施形態では、タグメント化バッファは、ある濃度の二価カチオン、つまり、およそ、0.01mM、0.02mM、0.05mM、0.1mM、0.2mM、0.5mM、1mM、2mM、5mM、8mM、10mM、12mM、15mM、20mM、30mM、40mM、50mM、60mM、70mM、80mM、90mM、100mM、もしくはそれ以上の濃度の二価カチオン、または、これらのうち任意の値の間の範囲にある濃度の二価カチオン、例えば、0.01mM〜0.05mM、0.02mM〜0.5mM、8mM〜12mM等の二価カチオンを有することができる。一部の実施形態では、タグメント化バッファは、ある濃度のCoCl
2、つまり、およそ、0.01mM、0.02mM、0.05mM、0.1mM、0.2mM、0.5mM、1mM、2mM、5mM、8mM、10mM、12mM、15mM、20mM、30mM、40mM、50mM、60mM、70mM、80mM、90mM、100mM、もしくはそれ以上の濃度のCoCl
2、または、これらのうち任意の値の間の範囲にある濃度の二価カチオン、例えば、0.01mM〜0.05mM、0.02mM〜0.5mM、8mM〜12mM等の濃度の二価カチオンを有することができる。一部の実施形態では、タグメント化バッファは、ある濃度のMnCl
2、つまり、およそ、0.01mM、0.02mM、0.05mM、0.1mM、0.2mM、0.5mM、1mM、2mM、5mM、8mM、10mM、12mM、15mM、20mM、30mM、40mM、50mM、60mM、70mM、80mM、90mM、100mM、もしくはそれ以上の濃度のMnCl
2、または、これらのうち任意の値の間の範囲にある濃度の二価カチオン、例えば、0.01mM〜0.05mM、0.02mM〜0.5mM、8mM〜12mM等の濃度の二価カチオンを有することができる。一部の実施形態では、タグメント化バッファは、ある濃度のMgCl
2、つまり、およそ、0.01mM、0.02mM、0.05mM、0.1mM、0.2mM、0.5mM、1mM、2mM、5mM、8mM、10mM、12mM、15mM、20mM、30mM、40mM、50mM、60mM、70mM、80mM、90mM、100mM、もしくはそれ以上の濃度のMgCl
2、または、これらのうち任意の値の間の範囲にある濃度の二価カチオン、例えば、0.01mM〜0.05mM、0.02mM〜0.5mM、8mM〜12mM等の濃度の二価カチオンを有することができる。一部の実施形態では、タグメント化バッファは、ある濃度のCdCl
2、つまり、およそ、0.01mM、0.02mM、0.05mM、0.1mM、0.2mM、0.5mM、1mM、2mM、5mM、8mM、10mM、12mM、15mM、20mM、30mM、40mM、50mM、60mM、70mM、80mM、90mM、100mM、もしくはそれ以上の濃度のCdCl
2、または、これらのうち任意の値の間の範囲にある濃度の二価カチオン、例えば、0.01mM〜0.05mM、0.02mM〜0.5mM、8mM〜12mM等の濃度の二価カチオンを有することができる。一部の実施形態では、タグメント化バッファは、ある濃度のCaCl
2、つまり、およそ、0.01mM、0.02mM、0.05mM、0.1mM、0.2mM、0.5mM、1mM、2mM、5mM、8mM、10mM、12mM、15mM、20mM、30mM、40mM、50mM、60mM、70mM、80mM、90mM、100mM、もしくはそれ以上の濃度のCaCl
2、または、これらのうち任意の値の間の範囲にある濃度の二価カチオン、例えば、0.01mM〜0.05mM、0.02mM〜0.5mM、8mM〜12mM等の濃度の二価カチオンを有することができる。
【0101】
一部の実施形態では、トランスポザーゼまたはタグメント化反応によるゲノムDNAの断片化は、25℃〜70℃、37℃〜65℃、50℃〜65℃、または50℃〜60℃の温度範囲で実行することが可能である。一部の実施形態では、トランスポザーゼまたはタグメント化反応によるゲノムDNA断片化は、37℃、40℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、または65℃で実行することが可能である。
【0102】
改変トランスポザーゼをコードする核酸
本明細書ではさらに、本明細書で提示する改変トランスポザーゼ酵素をコードする核酸分子を提示する。トランスポザーゼの変異バージョンである任意の所定改変トランスポザーゼであって、該改変トランスポザーゼのアミノ酸配列と、好適には、該トランスポザーゼをコードする野生型ヌクレオチド配列も既知である、改変トランスポザーゼについては、分子生物学の基本原則に従って変異をコードするヌクレオチド配列を得ることが可能である。例えば、Tn5トランスポザーゼをコードする野生型ヌクレオチド配列が既知である場合、1つまたは複数のアミノ酸置換を有する、Tn5の任意の所定変異バージョンをコードするヌクレオチド配列を、標準遺伝子コードを用いて推定することが可能である。同様に、ヌクレオチド配列は、他のトランスポザーゼの変異バージョンについても容易に導き出すことが可能である。その後、必要なヌクレオチド配列を有する核酸分子を、当技術分野で既知の標準分子生物学を用いて構築することができる。
【0103】
本明細書で提示する実施形態によると、定義した核酸は、同一の核酸だけでなく、任意のマイナーな塩基バリエーションも含み、特に、保存アミノ酸置換にある縮重コードに従って同義語コドン(同一のアミノ酸残基を特定する異なるコドン)をもたらす場合、置換を含む。用語「核酸配列」には、塩基バリエーションに関して与えられる任意の単一鎖配列に対し、相補的な配列も含まれる。
【0104】
本明細書に記載の核酸分子はまた、有利には、適切な発現ベクターに含まれ、そこからコードされるトランスポザーゼタンパク質を、適切な宿主において発現することができる。クローン化DNAを、前記細胞をその後形質転換し、そして、形質転換された細胞をその後選択するために適切な発現ベクターに組み込むことは、当業者にとって周知であり、これはSambrook et al. (1989), Molecular cloning: A Laboratory Manual, Cold Spring Harbor Laboratory(これはその全体が参照により組み込まれる)で提示されている。
【0105】
このような発現ベクターには、前記DNA断片の発現に影響を及ぼすことが可能な、プロモーター領域などの調節配列に操作可能に連結する、本明細書に提示の実施形態に記載の核酸を有するベクターが含まれる。用語「操作可能に連結する」とは並列を意味し、ここでは記載した構成要素が、意図したやり方で機能することができる関係にある。このようなベクターを適切な宿主細胞に形質転換して、本明細書に提示の実施形態に記載のタンパク質を発現させることができる。
【0106】
核酸分子は、成熟タンパク質、または、プレタンパク質にリーダー配列をコードし、その後宿主細胞により切断され成熟タンパク質を形成するものを含む、プロ配列を有するタンパク質をコードすることができる。ベクターは、例えば、複製起点とともに提供されるプラスミドベクター、ウイルスベクター、またはファージベクター、および、任意で、前記ヌクレオチドの発現用プロモーター、および、任意で、該プロモーターの調節因子とすることができる。ベクターは、例えば抗生物質耐性遺伝子などの1つまたは複数の選択可能なマーカーを含むことができる。
【0107】
発現に必要な調節エレメントには、RNAポリメラーゼを結合し、リボソーム結合のために転写開始配列と翻訳開始配列の適切なレベルを指示する、プロモーター配列が含まれる。例えば、細菌発現ベクターには、lacプロモーターなどのプロモーター、ならびに、翻訳を開始するためのシャイン・ダルガノ配列および開始コドンAUGが含まれ得る。同様に、真核発現ベクターには、RNAポリメラーゼII用の異種または相同のプロモーター、下流ポリアデニレーションシグナル、開始コドンAUG、およびリボソームを分離するための停止コドンが含まれ得る。このようなベクターは、商業的に得るか、または、当技術分野で周知の方法により、記載される配列から組み立てることができる。
【0108】
高等真核生物による、トランスポザーゼをコードするDNAの転写は、エンハンサー配列をベクターに含めることにより最適化することができる。エンハンサーは、DNAのcis作用エレメントであり、これは、プロモーターに影響を与えて転写レベルを上げる。ベクターは、概して、選択可能なマーカーに加え、複製起点も含むだろう。
【実施例】
【0109】
(実施例1)
アッセイ法および条件の概略
以下の段落に下記に提示する実施例で用いるアッセイ条件の概略を記載する。
【0110】
ヒトgDNAにおいてWGSに対しTN5を用いたタグメント化
このセクションでは、トランスポザーゼの挿入バイアスをモニタリングするために、下記の実施例で用いるタグメント化アッセイについて記載する。簡潔に言うと、50ngのヒトゲノムDNAを、10mMTris酢酸、pH7.6、25mM酢酸マグネシウムにおいて、5μLのTDE1と共に5分間55℃でインキュベーションした。その後、125mMのHEPES、pH7.5、1MのNaCl、50mMのMgCl
2の反応体積の1/5を加え、続いて、Tn5トランスポソームを100nMまで加え、60分間30℃でインキュベーションした。反応物はその後、Illumina社のNextera手順に記載されているように浄化および増幅し、HiSeq2000機器を用いた配列決定向けに提出した。
【0111】
Tn5トランスポソームアセンブリ
Tn5を、25mMのHEPES、pH7.6、125mMのKCl、18.75mMのNaCl、0.375mMのEDTA、31.75%のグリセロールにおいて、30分間室温で、アニール化トランスポゾンと共に20μMまでインキュベーションした。
【0112】
トランスポゾンアセンブリ
トランスポゾンを、10mMのTrisHCl、pH7.5、50mMのNaCl、1mMのEDTAにおいて、反応物を94℃まで加熱し、それをゆっくりと室温まで冷却することにより、40μMまで別々にアニールした。Tn5−ME−Aでは、Tn5モザイク端配列A14(Tn5MEA)をTn5非移動配列(NTS)にアニールし、Tn5−ME−Bでは、Tn5端配列B15(Tn5MEB)をTn5非移動配列(NTS)にアニールした。これらの配列を以下に示す。
Tn5MEA: 5’-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3’
Tn5MEB: 5’-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3’
Tn5 NTS: 5’- CTGTCTCTTATACACATCT-3’
【0113】
2.トランスポザーゼのクローニングおよび発現
このセクションでは、下記の実施例で用いる様々なトランスポザーゼ変異体のクローニングおよび発現で用いるアプローチについて記載する。
【0114】
突然変異誘発を、標準の部位特異的突然変異誘発方法論を用い、トランスポザーゼに対しバックボーン遺伝子配列をコードする遺伝子において実行した。作成した各変異について、クローン遺伝子配列を配列決定することにより、変異遺伝子の適切な配列を確かめた。
【0115】
Tn5トランスポザーゼ遺伝子を修正pET11aプラスミドにクローン化した。修正プラスミドは、pASK5plusに由来する精製タグStrepTag−IIと、pET−SUMOに由来するSUMOとを含んだ。発現をBL21(DE3)pLysYコンピテント細胞(New England Biolabs)を用いて実行した。細胞を25℃で0.5OD
600nmまで成長させ、その後、100μMのIPTGを用いて誘導した。発現を18℃で19時間実行した。細胞ペレットを、プロテアーゼ阻害剤の存在下で、100mMのTrisHCl、pH8.0、1MのNaCl、1mMのEDTAにおいて、ミクロ流動化剤を用いて溶解した。溶解後、細胞溶解物を、デオキシコール酸を用いて最終濃度が0.1%になるまで30分間インキュベーションした。30000xgで20分間遠心分離する前に、ポリエチレンイミンを0.5%まで加えた。上清を集め、同量の飽和硫酸アンモニウム溶液と混ぜ、その後、氷の上で少なくとも1時間撹拌した。溶液をその後20分間30000xgで遠心分離し、100mMのTris、pH8.0、1MのNaCl、1mMのEDTA、および1mMのDTTにおいてペレットを再懸濁した。再懸濁し、ろ過した溶液を、その後、AKTA精製システムを用いてStreptactinカラムに適応した。カラムを、100mMのTris、pH8.0、1mMのEDTA、1mMのDTT、4MのNaClで洗浄し、その後100mMのTris、pH7.5、1mMのEDTA、1mMのDTT、100mMのNaClで洗浄した。溶出を、100mMのTris、pH7.5、1mMのEDTA、1mMのDTT、100mMのNaCl、および5mM デスチオビオチンを用いて実行した。溶出物を、100mMのTris pH 7.5、100mMのNaCl、0.2mMのEDTA、および2mMのDTTを用いて、ヘパリントラップカラム(heparin trap column)に乗せた。同じバッファを用いて洗浄した後、Tn5多様体を、100mMのTris pH 7.5、1MのNaCl、0.2mMのEDTA、および2mMのDTTを用いて、塩勾配で溶出した。画分を集め、プールし、濃縮化し、そして、グリセロールを加え、−20℃での長期保存の前に50%最終濃度を生成した。
【0116】
3.大腸菌ゲノムDNAにおける挿入バイアスのIVC分析
挿入配列バイアスの分析を、IVC−プロットデータ(強度対サイクル)を用いて実行した。このデータは、各DNAトランスポザーゼを用いて生成したDNAライブラリを配列決定した後に、利用可能に生成した。簡潔に言うと、突然変異誘発および発現を上記のように実行した。トランスポザーゼを上記のトランスポゾンAおよびトランスポゾンBを用いてインキュベーションし、大腸菌ゲノムDNAと共にインキュベーションして、DNAライブラリを生成した。各ライブラリを、製造業者の指示書に従い、MiSeq Fast chemistry(Illumina社、カリフォルニア州、サンディエゴ)を行うIllumina社のGenome Analyzerにおいて、少なくとも35サイクルほど配列決定した。Illumina RTA ソフトウェアを用いて、各サイクルでベースコール(base call)と強度値を生成した。IVCプロットを生成するため、配列決定リードを大腸菌参照ゲノムに位置合わせし、各サイクルで4つの塩基それぞれの強度(発生)を、位置合わせした全ての配列決定リードの全強度値の画分としてプロットした。
【0117】
(実施例2)
挿入バイアスに対するTn5トランスポザーゼ変異の特定
この実施例は、IVC−プロットデータ(強度対サイクル)を用いた挿入配列バイアスの分析について記載する。このデータは、各DNAトランスポザーゼを用いて生成したDNAライブラリを配列決定した後に利用可能となった。この分析は、安定した結果をもたらすのにいくらかの配列決定リード(20k〜40k)のみを必要とし、各Tn5トランスポザーゼ多様体を発現するのに用いる大腸菌細胞溶解物で実行することが可能で、HTS(ハイスループットスクリーニング)目的に適っていた。
【0118】
様々な単一アミノ酸置換Tn5多様体についての代表的な結果を、
図2〜7に記載する。図示する多様体は、例えば、位置248での置換による対称性の喪失(
図2)、位置119での置換によるIVCプロットの平坦化(
図3)、位置125での置換または位置248の後ろへの挿入による、IVCプロット後半におけるIVCの縮小(
図4、5)、および、位置K120で異なる芳香族アミノ酸を使用することによる、9bpから10bpへの複製の増加(
図6、対称性が1および9番目のbpから1および10番目のbpへ変化することを示す)を示す。これらの結果は、特定の変異が、wt対照と比較し、改善した挿入バイアスをもたらすことを示す。
【0119】
(実施例3)
細菌gDNAにおける全ゲノム配列決定
これらの実験は、a)推定ライブラリサイズ/多様性およびb)AT/GC−ドロップアウトについて、様々なトランスポザーゼ変異体を比較するために行った。これらの実験は、精製し、アクティビティを正規化したTn5トランスポザーゼ多様体を用いて行った。これらの実験は、500k〜1Mの配列決定リード/実験を必要とする。
【0120】
示した精製Tn5トランスポザーゼ多様体を用いてセレウス菌gDNAにおいてタグメント化を実行することにより、結果を得た。酵素をアクティビティにより正規化し、Nextera(登録商標)キットと共に販売されている商業TDE1酵素のアクティビティに合うように設定した。
【0121】
Tn5001として示す変異体は配列番号11と同じアミノ酸配列を有し、「wt」対照の役割をする。上記表で示すように、Tn5058、Tn5059、およびTn5061として示す変異体は、それぞれ配列番号18、19、および20と同じアミノ酸配列を有する。実験は三回行い、データは、集めたデータの平均と標準偏差を示す。「推定ライブラリサイズ」は、最適複製を用いることなしに計算し、再現可能な結果をもたらす。
【0122】
図8Aに示すように、GC−ドロップアウトは低く維持するのに対し、Tn5058およびTn5059のAT−ドロップアウトは、Tn5001と比較し顕著に減少する。同様に、
図8Bに示すように、ライブラリサイズは1.7x(Tn5058)および2.2x(Tn5059)と、著しく増加する。これらの結果は、変異体Tn5058および変異体Tn5059は、野生型トランスポザーゼと比較し、配列挿入バイアスを大きく改善することを示し、下記の実施例4で記載するさらなる実験につながる。
【0123】
(実施例4)
ヒトgDNAについてのNextera Rapid Capture Enrichment実験
以下の実験を、実施例3で上記したものと同じ、精製し、アクティビティを正規化したTn5トランスポザーゼ多様体を用いて行った。これらの実験は、典型的には40M〜100Mの配列決定リード/実験を必要とし、配列決定データを分析して、a)多様性、b)濃縮、c)カバレッジ、d)カバレッジ均一性、e)ペナルティスコアを比較した。
【0124】
Nextera Rapid Capture Exome (Illumina(登録商標)) CEXのプールキャプチャプローブ(pool capture probes)を製造業者の指示書に従って用い、キャプチャを三重に実行した。
図9Aに示すように、示した変異体は、wt対照Tn5001と比較し、カバレッジ均一性において顕著な改善をもたらした。さらに、
図9Bに示すように、平均標的カバレッジはより低いにも関わらず、標的カバレッジについて10xおよび20xでテストした変異体により、統計的に著しい改善がもたらされた。
【0125】
図10Aに示すように、示した変異体は、固有リード数およびハイブリッド選択ライブラリサイズの増大をもたらした。同様に、
図10Bに示すように、変異体は、Tn5001と比較してより低いペナルティスコアをもたらし、これは、カバレッジ深さが10x、20x、または30xに到達するのに必要な、倍強い配列決定である。これらの結果は、テストした変異体が、対照と比較し、より優れた挿入バイアスおよびより均一なカバレッジをもたらすことを示す。
【0126】
(実施例5)
Tn5アクティビティに対するタグメント化バッファ組成物の効果
以下の実験を行い、ライブラリアウトプットおよび配列決定測定基準に対する、Tn5タグメント化バッファ組成物の効果および反応条件を特徴付けた。
【0127】
ライブラリアウトプットおよび配列決定測定基準に対する、Tn5タグメント化バッファ組成物の効果および反応条件を評価するため、Tn5タグメント化DNAライブラリを、セレウス菌ゲノムDNAを用いて構築した。2つの異なるTn5トランスポザーゼを、タグメント化ライブラリ、つまり変異Tn5(「TS−Tn5059」)および対照過活動Tn5(「TS−Tn5」)の構築のために用いた。Tsは融合タグであり、これはTn5およびTn5059のタンパク質の精製のために用いる。Tn5059は、過活動Tn5アミノ酸配列(配列番号11)に関し、4つの追加変異体、K212R、P214R、G251R、およびA338Vを有する。TS−Tn5059は、Tn5059のN末端にTSタグを含む。一部の実施形態では、TS−タグのC末端は、リンカーによりTn5059のN末端に融合することができ、これは、第1メチオニン残基を置換する。一部の実施形態では、リンカーはGly−Thrである。
【0128】
TS−Tn5059を10、40、および80nMの最終濃度で用いた。TS−Tn5を、4、15、および30nMの最終濃度で用いた。TS−Tn5059およびTS−Tn5に対する酵素濃度を(標準バッファ配合を用いて)正規化し、ほぼ同じレベルのタグメント化アクティビティを提供した。つまり、10、40、および80nMのTS−Tn5059は、4、15、および30nMのTn5とそれぞれほぼ同じレベルのアクティビティを有する。各タグメント化ライブラリを、25ngのセレウス菌ゲノムDNAインプットを用いて調製した。セレウス菌のゲノム内容量は約40%のGCと約60%のATである。
【0129】
タグメント化バッファを2x配合で調製した。2x配合とは以下である:標準バッファ(TD;20mMのTris酢酸、pH7.6、10mMの酢酸マグネシウム、および20%ジメチルホルムアミド(DMF));コバルトバッファ(Co;20mMのTris酢酸、pH7.6、および20mMのCoCl
2);コバルト+DMSOバッファ(Co−DMSO;20mMのTris酢酸、pH7.6、20mMのCoCl
2、および20%ジメチルスルホキシド(DMSO));高分子量バッファ(HMW;20mMのTris酢酸、pH7.6、および10mMの酢酸マグネシウム);NF2バッファ(NF2;20mMのTris酢酸、pH7.6、20mMのCoCl
2、および20%DMF)。CoCl
2を含むタグメント化バッファは、毎日新しく調製した。各ライブラリについて、50μLの総反応体積中で、20μLのセレウス菌ゲノムDNA(25ng)、25μLの2xタグメント化バッファ、および5μLの酵素(10x Ts−Tn5059または10x Ts−Tn5)を混ぜることにより、タグメント化反応を行った。反応物を55℃で5分間インキュベーションした。タグメント化反応に続き、サンプルを標準Nextera(登録商標)サンプル調製プロトコルに従って処理した。ライブラリを、MiSeq装置において、Illumina社のSBS(sequencing−by−synthesis)化学反応を用いて配列決定した。配列決定ランは、V2 MiSeqキットを用いて2x71サイクルだった。各ライブラリにおける断片サイズ分布は、配列決定ランはV2MiSeqキットを用いて2x71サイクルだった。各ライブラリの断片サイズ分布は、Bioanalyzerで評価した。
【0130】
図11は、異なるタグメント化バッファを用いて調製した、TS−Tn5059およびTS−Tn5のタグメント化DNAライブラリにおける固有分子数についての棒グラフ100を示す。ライブラリ中の固有分子数は、ライブラリの多様性(複雑性)の表れである。グラフの各棒は、タグメント化ライブラリを表す。実験は3回繰り返した(n=3)。対照ライブラリ(つまり、標準タグメント化バッファを用いて調製したライブラリ)は、「酵素−酵素濃度−DNAインプット」により指定する。例えば、棒グラフ100の1番目の棒は「TS−Tn5059−10nM−25ng」とラベル付けされるが、これは、標準バッファ配合において最終濃度が10nMのTS−Tn5059と、25ngのインプットDNAとを用いて調製した対照ライブラリを指定する。修正タグメント化バッファ配合を用いて調製したライブラリは、「酵素−酵素濃度−バッファ添加物−DNAインプット」により指定する。例えば、棒グラフ100の4番目の棒は「TS−Tn5059−10nM−Co−25ng」とラベル付され、これは、10mMのCoCl
2を含む修正タグメント化バッファにおいて最終濃度が10nMのTS−Tn5059を用いて調製したライブラリを指定する。データは、10mMのCoCl
2を含むタグメント化バッファ(つまり、Coバッファ、Co−DMSOバッファ、およびNF2バッファ)を用いて調製した、TS−Tn5059およびTS−Tn5のタグメント化ライブラリは、CoCl
2の添加なしのバッファ(つまり、標準バッファまたはHMW)において調製したライブラリと比較し、平均多様性がより高い。
【0131】
図12は、異なるタグメント化バッファを用いて調製した、TS−Tn5059およびTS−Tn5のタグメント化DNAライブラリにおける、GCドロップアウト率についての棒グラフ200を示す。対照ライブラリおよび修正タグメント化バッファを用いて調製したライブラリは、
図11に記載するように指定する。GCドロップアウトは、タグメント化ライブラリからドロップした(なくなった)、ゲノム中のGCリッチ領域の割合として定義することができる。データは、標準タグメント化バッファを用いて調製した、TS−Tn5059およびTS−Tn5の対照ライブラリでは、GCドロップアウト率が比較的低いことを示す。データはまた、10mMのCoCl
2を含むタグメント化バッファ(つまり、Coバッファ、Co−DMSOバッファ、およびNF2バッファ)を用いて調製した、TS−Tn5059およびTS−Tn5のタグメント化バッファは、CoCl
2の添加なしのバッファ(つまり、標準バッファまたはHMW)で調製したライブラリと比較し、GCドロップアウト率がより高い(つまり、最大約6%)ことを示す。Co含有バッファを用いて調製したライブラリにおけるGCドロップアウトの増加は、TS−Tn5059およびTS−Tn5の濃度の上昇により改善する。例えば、TS−Tn5059−10nm−Co−25ngライブラリにおけるGCドロップアウト率は、TS−Tn5059−10nm−25ng対照ライブラリと比較し、比較的高い。TS−Tn5059の濃度を40nM(つまり、TS−Tn5059−40nm−Co−25ng)および80nM(つまり、TS−Tn5059−80nm−Co−25ng)まで上昇させると、GCドロップアウト率は低下する。
【0132】
図13は、異なるタグメント化バッファを用いて調製したTS−Tn5059およびTS−Tn5のタグメント化DNAライブラリにおけるATドロップアウト率についての棒グラフ300を示す。対照ライブラリおよび修正タグメント化バッファを用いて調製したライブラリを、
図11に記載するように指定する。ATドロップアウトは、タグメント化ライブラリからドロップした(なくなった)、ゲノム中のATリッチ領域の割合として定義することができる。データは、標準タグメント化バッファを用いて調製した、TS−Tn5059およびTS−Tn5の対照ライブラリでは、ある量のATドロップアウト(つまり、それぞれ、約1%〜約3%、および約7%〜約3%)が観察されることを示す。データはまた、低濃度(つまり、10nM)の酵素と10mMのCoCl
2を含むタグメント化バッファ(つまり、Coバッファ、Co−DMSOバッファ、およびNF2バッファ)とを用いて調製したTS−Tn5059タグメント化ライブラリは、CoCl
2の添加なしのバッファ(つまり、標準バッファまたはHMW)において調製したライブラリと比較し、ATドロップアウト率が低いことを示す。同様に、10mMのCoCl
2を含むタグメント化バッファ(つまり、Coバッファ、Co−DMSOバッファ、およびNF2バッファ)を用いて調製したTS−Tn5ライブラリは、CoCl
2の添加のないバッファ(つまり、標準バッファまたはHMW)において調製したライブラリと比較し、ATドロップアウト率はより低い。
【0133】
ここで
図12および13を参照すると、タグメント化バッファにCoCl
2(10nM)を添加すること(つまり、Coバッファ、Co−DMSOバッファ、およびNF2バッファ)は、タグメント化ライブラリにおけるGCおよびATのドロップアウト率を「フリップ(flip)」することができる。例えば、TS−Tn5059−10nm−Co−25ngライブラリにおけるGCドロップアウト率(
図12)は、TS−Tn5059−10nm−25ng対照ライブラリと比較し比較的高い。一方、TS−Tn5059−10nm−Co−25ngライブラリにおけるATドロップアウト率(
図13)は、TS−Tn5059−10nm−25ng対照ライブラリと比較し、比較的低い(または、ない)。
【0134】
図14は、標準バッファ(TD)配合およびコバルトバッファ(Co)配合を用いて調製したTS−Tn5059ライブラリにおける、断片サイズ分布についてのBioanalyzerトレースのプロット400を示す。プロット400は、Ts−Tn5059−10nM−Co−25ngライブラリにおける断片サイズ分布の曲線である曲線410、Ts−Tn5059−40nM−Co−25ngライブラリにおける断片サイズ分布の曲線である曲線415、Ts−Tn5059−80nM−Co−25ngライブラリにおける断片サイズ分布の曲線である曲線420、Ts−Tn5059−10nM−TD−25ngライブラリにおける断片サイズ分布の曲線である曲線425、Ts−Tn5059−10nM−TD−25ngライブラリにおける断片サイズ分布の曲線である曲線430、および、Ts−Tn5059−80nM−TD−25ngライブラリにおける断片サイズ分布の曲線である曲線435を示す。プロット400はまた、塩基対(bp)におけるDNA断片サイズの標準ラダー(standard ladder)である曲線440を示す。ラダー(左から右へ)における断片サイズを表2に示す。
【0135】
【表2】
【0136】
データは、タグメント化反応で用いるTS−Tn5059の濃度を10nMから40nMおよび80nMへ増加させることは、断片サイズ分布をより小さい断片サイズにシフトさせることを示す。断片サイズ分布のシフトは、標準バッファ(TD)配合を用いて調製したライブラリにおいてより顕著である。例えば、コバルトバッファ(Co)配合を用いて調製したライブラリにおけるフラグメントサイズ分布は、10nMのTS−Tn5059(曲線410)を用いて調製したライブラリでは約3000bpであり、40nMのTS−Tn5059および80nMのTS−Tn5059(それぞれ、曲線415および曲線420)を用いて調製したライブラリでは約1000〜約2000bpである。標準バッファ(TD)配合および80nMのTS−Tn5059(曲線435)を用いて調製したライブラリでは、断片サイズ分布は、約200bp〜約1000bpである。
【0137】
図15は、コバルト−DMSO(Co−DMSO)、NF2、およびHMWのバッファ配合を用いて調製したTS−Tn5059における断片サイズ分布についての、Bioanalyzerトレースのプロット500を示す。プロット500は、Ts−Tn5059−10nM−Co−DMSO−25ngライブラリにおける断片サイズ分布の曲線である曲線510、Ts−Tn5059−10nM−NF2−25ngライブラリにおける断片サイズ分布の曲線である曲線515、Ts−Tn5059−10nM−HMW−25ngライブラリにおける断片サイズ分布の曲線である曲線520、Ts−Tn5059−40nM−Co−DMSO−25ngライブラリにおける断片サイズ分布の曲線である曲線525、Ts−Tn5059−40nM−NF2−25ngライブラリにおける断片サイズ分布の曲線である曲線530、Ts−Tn5059−40nM−HMW−25ngライブラリにおける断片サイズ分布の曲線である曲線535、Ts−Tn5059−80nM−Co−DMSO−25ngライブラリにおける断片サイズ分布の曲線である曲線540、Ts−Tn5059−80nM−NF2−25ngライブラリにおける断片サイズ分布の曲線である曲線545、およびTs−Tn5059−80nM−HMW−25ngライブラリにおける断片サイズ分布の曲線である曲線550を示す。プロット500はまた、
図14のプロット400の曲線440を示し、これは、塩基対(bp)単位のDNA断片サイズの標準ラダーである。
【0138】
データは、概して、タグメント化反応で用いるTS−Tn5059の濃度を10nMから40nMおよび80nMへ増加させることは、断片サイズ分布をより小さい断片サイズにシフトさせることを示す。断片サイズ分布のシフトは、CoCl
2を含まないHMWバッファを用いて調製したライブラリ(例えば、曲線520および曲線535)において、Co−DMSOを用いて調製したライブラリ(例えば、曲線510および曲線525)と比較し、より顕著である。
【0139】
図16は、標準バッファ配合(TD)およびコバルトバッファ(Co)配合を用いて調製したTS−Tn5ライブラリにおける断片サイズ分布についてのBioanalyzerトレースのプロット600を示す。プロット600は、Ts−Tn5−4nM−Co−25ngライブラリにおける断片サイズ分布の曲線である曲線610、Ts−Tn5−15nM−Co−25ngライブラリにおける断片サイズ分布の曲線である曲線615、Ts−Tn5−30nM−Co−25ngライブラリにおける断片サイズ分布の曲線である曲線620、Ts−Tn5−4nM−TD−25ngライブラリにおける断片サイズ分布の曲線である曲線625、Ts−Tn5−15nM−TD−25ngライブラリにおける断片サイズ分布の曲線である曲線630、および、Ts−Tn5−30nM−TD−25ngライブラリにおける断片サイズ分布の曲線である曲線635を示す。プロット600はまた、
図14のプロット400の曲線440も示し、これは、塩基対(bp)単位のDNA断片サイズの標準ラダーである。
【0140】
データは、タグメント化反応において用いるTS−Tn5の濃度を4nMから15nMおよび30nMへ増加させることは、断片サイズ分布をより小さい断片サイズにシフトさせることを示す。断片サイズ分布におけるシフトは、標準バッファ(TD)配合を用いて調製したライブラリにおいてより顕著である。この観察結果は、
図14のTS−Tn5059ライブラリでの断片サイズ分布と同様である。
【0141】
図17は、コバルト−DMSO(Co−DMSO)、NF2、およびHMWのバッファ配合を用いて調製したTS−Tn5ライブラリにおける断片サイズ分布についての、Bioanalyzerトレースのプロット700を示す。プロット700は、Ts−Tn5−4nM−Co−DMSO−25ngライブラリにおける断片サイズ分布の曲線である曲線710、Ts−Tn5−4nM−NF2−25ngライブラリにおける断片サイズ分布の曲線である曲線715、Ts−Tn5−4nM−HMW−25ngライブラリにおける断片サイズ分布の曲線である曲線720、Ts−Tn5−15nM−Co−DMSO−25ngライブラリにおける断片サイズ分布の曲線である曲線725、Ts−Tn5−15nM−NF2−25ngライブラリにおける断片サイズ分布の曲線である曲線730、Ts−Tn5−15nM−HMW−25ngライブラリにおける断片サイズ分布の曲線である曲線735、Ts−Tn5−30nM−Co−DMSO−25ngライブラリにおける断片サイズ分布の曲線である曲線740、Ts−Tn5−30nM−NF2−25ngライブラリにおける断片サイズ分布の曲線である曲線745、およびTs−Tn5−30nM−HMW−25ngライブラリにおける断片サイズ分布の曲線である曲線750を示す。プロット700はまた、
図14のプロット400の曲線400も示し、これは、塩基対(bp)単位のDNA断片サイズの標準ラダーである。
【0142】
データは、タグメント化反応において用いるTS−Tn5の濃度を4nMから15nMおよび30nMへ増加させることは、断片サイズ分布をより小さい断片サイズにシフトさせることを示す。断片サイズ分布におけるシフトは、標準バッファ(TD)配合を用いて調製したライブラリにおいてより顕著である。この観察結果は、
図15のTS−Tn5059ライブラリにおける断片サイズ分布と同様である。
【0143】
概して、ここで
図14〜17を参照すると、10nMのCoCl
2(例えば、Coバッファ、Co−DMSOバッファ、およびNF2バッファ)を含むタグメント化バッファを用いて調製したTn5059およびTS−Tn5のライブラリにおける断片サイズは、CoCl
2なしのタグメント化バッファ(つまり、TDおよびHMWバッファ)を用いて調製したTS−Tn5059およびTS−Tn5のライブラリよりも大きい。
【0144】
図18A、18B、18C、18Dはそれぞれ、TS−Tn5ライブラリにおける配列含有量のバイアスグラフ800、TS−TN5−Coライブラリにおける配列含有量のバイアスグラフ830、TS−Tn5−Co−DMSOライブラリにおける配列含有量のバイアスグラフ840、およびTS−Tn5−NF2ライブラリにおける配列含有量のバイアスグラフ850を示す。バイアスグラフ(つまり、強度対サイクル数(IVC)のグラフ)は、SBSサイクル数の関数として、観察された塩基(A,C,G、またはT)の比率をプロットし、タグメント化中にTn5が有する好適配列コンテキストを示す。
【0145】
バイアスグラフ800、830、840、および850はそれぞれ、サイクル数によるA含有量の曲線である曲線810、サイクル数によるC含有量の曲線である曲線815、サイクル数によるG含有量の曲線である曲線820、およびサイクル数によるT含有量の曲線である曲線825を示す。例えば、
図18AのTS−TN5のライブラリにおいて、塩基Gを表す曲線820は、サイクル1で観察される塩基の約38%がGであることを示し;塩基Tを表す曲線825は、サイクル1で観察される塩基の約15%がTであることなどを示す。
【0146】
図18Aを参照すると、データは、Tn5配列バイアスが、標準タグメント化バッファ配合を用いて調製したTS−Tn5ライブラリにおけるSBSの、最初の15サイクルあたりで観察されることを示す。約15サイクル後、配列バイアスは徐々に縮小し、A、T、C、およびGの含有量は予想されるゲノム組成物を反映する。セレウス菌については、ゲノムは約40%のGCと約60%のATであり、これはサイクル16または17あたりからサイクル35までのバイアスグラフで表され、ここで、曲線810(つまり、A)および曲線825(つまり、T)は約30%(A+T〜60%)に収束し;曲線815(つまり、C)および曲線820(つまり、G)は、約20%(C+G〜40%)に収束する。
【0147】
図18B、18C、および18Dを参照すると、データはまた、Tn5配列バイアスが、CoCl
2を含んだタグメント化バッファを用いて調製したライブラリである、TS−Tn5−Co、TS−Tn5−Co−DMSO、およびTs−Tn5−NF2のライブラリにおいて、SBSの最初の15サイクルあたりで観察されることを示す。この場合もやはり、
図18Aに関して記載したように、約15サイクルより後で配列バイアスは徐々に縮小し、A,T、C、およびGの含有量は、予想されるゲノム組成物を反映する。しかしながら、TS−Tn5−Co、TS−Tn5−Co−DMSO、およびTs−Tn5−NF2のライブラリでは、曲線810(つまり、A)および曲線825(つまり、T)は、サイクル10〜サイクル15あたりで、予想されるゲノム組成物に向かってシフトし始め、曲線815(つまり、C)および曲線820(つまり、G)は、サイクル10〜サイクル15あたりで、予想されるゲノム組成物に向かってシフトし始める。加えて、サイクル2〜8の間のバイアスは、
図18Aと比べた場合、縮小する。データは、タグメント化バッファ配合におけるCoCl
2の添加が、タグメント化中にTn5配列を改善することを示す。
【0148】
図19A、19B、19C、および19Dはそれぞれ、TS−Tn5059ライブラリにおける配列含有量のバイアスグラフ900、TS−TN5059−Coライブラリにおける配列含有量のバイアスグラフ930、TS−Tn5059−Co−DMSOライブラリにおける配列含有量のバイアスグラフ940、およびTS−Tn5059−NF2ライブラリにおける配列含有量のバイアスグラフ950を示す。バイアスグラフ900、930、940、および950はそれぞれ、サイクル数によるA含有量の曲線である曲線910、サイクル数によるC含有量の曲線である曲線915、サイクル数によるG含有量の曲線である曲線920、および、サイクル数によるT含有量の曲線である曲線925を示す。
【0149】
図19Aを参照すると、データは、Tn5059配列バイアスが、TS−Tn5059タグメント化ライブラリにおいて、SBSの最初の15サイクルあたりで観察されることを示す。約15サイクルより後で配列バイアスは縮小し、A、T、C、およびGの含有量は、
図18Aに関して記載したように、予想されるゲノム組成物を反映する。しかしながら、変異体Tn5059は、
図18Aに示すTn5配列バイアスと比較し、配列バイアスの縮小を示す。TS−Tn5059ライブラリでは、曲線910(つまり、A)および曲線925(つまり、T)は、サイクル10〜サイクル15あたりで、予想されるゲノム組成物に向かってシフトし始め、曲線915(つまり、C)および曲線920(つまり、G)は、サイクル10〜サイクル15あたりで、予想されるゲノム組成物に向かってシフトし始める。
【0150】
図19B、19C、および19Dを参照すると、データはまた、Tn5059配列バイアスが、CoCl
2を含んだタグメント化バッファを用いて調製したライブラリである、TS−Tn5059−Co、TS−Tn5059−Co−DMSO、およびTs−Tn5059−NF2のライブラリにおいて、SBSの最初の15サイクルあたりで観察されることを示す。この場合もやはり、
図18Aに関して記載したように、約15サイクルより後で配列バイアスは徐々に縮小し、A,T、C、およびGの含有量は、予想されるゲノム組成物を反映する。しかしながら、TS−Tn5059−Coライブラリでは、曲線910(つまり、A)および曲線925(つまり、T)は、サイクル5あたりで、予想されるゲノム組成物に向かってシフトし始め、曲線915(つまり、C)および曲線920(つまり、G)は、サイクル5あたりで、予想されるゲノム組成物に向かってシフトし始める。TS−Tn5059−Co−DMSO、およびTs−Tn5059−NF2のライブラリでは、曲線910(つまり、A)および曲線925(つまり、T)は、サイクル5より前に、予想されるゲノム組成物に向かってシフトし始め、曲線915(つまり、C)および曲線920(つまり、G)は、サイクル5より前に、予想されるゲノム組成物に向かってシフトし始める。
【0151】
(実施例6)
Mos1アクティビティに対するタグメント化バッファ組成物の影響
以下の実験を行い、ライブラリアウトプットおよび配列決定測定基準に対する、Tn5タグメント化バッファ組成物の効果および反応条件を特徴付けた。
【0152】
Mos1タグメント化DNAライブラリを、セレウス菌ゲノムDNAを用いて構築した。タグメント化ライブラリの構築で用いるMos1トランスポザーゼは、MBP−Mos1融合タンパク質だった。マルトース結合タンパク質(MBP)は融合タグであり、これはMos1タンパク質の精製に用いる。MBP−Mos1は、100μMという最終濃度で用いた。各タグメント化ライブラリは、50ngのセレウス菌ゲノムDNAインプットを用いて調製した。
【0153】
タグメント化配合を2x配合で調製した。2x配合は以下の通りである:標準バッファ(TD;20mMのTris酢酸、pH7.6、10mMの酢酸マグネシウム、および20%のジメチルホルムアミド(DMF);TD+NaCl(TD−NaCl; 20mMのTris酢酸、pH7.6、10mMの酢酸マグネシウム、20%のDMF、および200mMのNaCl);高分子量バッファ(HMW;20mMのTris酢酸、pH7.6、および10mの酢酸マグネシウム);HEPES(50mMのHEPES、pH7.6、10mMの酢酸マグネシウム、20%のDMF);HEPES−DMSO(50mMのHEPES pH7.6、10mMの酢酸マグネシウム、および20%のDMSO);HEPES−DMSO−Co(50mMのHEPES、pH7.6、20%のDMSO、および20mMのCoCl
2);ならびに、HEPES−DMSO−Mn(50mMのHEPES、pH7.6、20%のDMSO、および20mMのマンガン(Mn))。CoCl
2を含むタグメント化バッファは、毎日新しく調製した。
【0154】
各ライブラリについて、50μLの総反応体積中で、20μLのセレウス菌ゲノムDNA(50ng)、25μLの2xタグメント化バッファ、および5μLの酵素(10x MBP−Mos1)を混ぜることにより、タグメント化反応を行った。反応物を30℃で60分間インキュベーションした。タグメント化反応に続き、サンプルを標準Nextera(登録商標)サンプル調製プロトコルに従って処理した。ライブラリを、MiSeq装置において、Illumina社のSBS(sequencing−by−synthesis)化学反応を用いて配列決定した。配列決定ランは、2x71サイクルだった。
【0155】
図20は、異なるタグメント化バッファを用いて調製した、MBP−Mos1タグメント化DNAライブラリにおける平均総リード数および平均多様性についての棒グラフ1000を示す。総リード数とは、フローセルからの総リード数である。多様性とは、ライブラリ中の固有分子数であり、ライブラリの複雑性の指標として用いる。グラフの棒の各対は、タグメント化ライブラリを表す。実験は3回繰り返した(n=3)。最初の2つのグラフ棒、EZTn5−std−bcereusおよびNexteraV2−30Cは、比較ライブラリであり、これはそれぞれ、Tn5および標準バッファ配合を用いて、55℃および30℃で調製した。タグメント化反応のためにMBP−Mos1を用いて調製したライブラリは、「酵素−酵素濃度−バッファ」により指定する。例えば、グラフ棒の3番目の対は「MBPMos1−100μM−TD」とラベル付してあり、これは、標準タグメント化バッファ(TD)において、最終濃度が100μMのMBPMos1を用いて調製したライブラリを指定する。データは、比較的同一の数または配列決定リードの下、Mos1タグメント化により調製したライブラリの多様性に対する、異なるバッファの効果を示す。特に、HEPES−DMSO−Mnバッファは、ライブラリの多様性の増大に寄与する。
【0156】
図21は、MBP−Mos1タグメント化ライブラリにおける、GCとATのドロップアウトについての棒グラフ1100を示す。GCおよびATのドロップアウトはそれぞれ、タグメント化ライブラリからドロップした(なくなった)、ゲノム中のGCリッチ領域およびATリッチ領域の割合として定義することができる。ライブラリは
図20に記載するように指定する。データは、EZTn5およびNexteraV2(つまり、Tn5トランスポザーゼ)を用いて調製したライブラリでは、GCドロップアウトは基本的にないが、ATリッチ領域は、それぞれ約7%および約5%がタグメント化ライブラリからドロップすることを示す。MBP−Mos1および標準タグメント化バッファ(MBPMos1−100μM−TD)を用いて調製したライブラリでは、ATドロップアウトは基本的にないが、GCリッチ領域の約2%以下がタグメント化ライブラリからドロップする。MBP−Mos1タグメント化ライブラリにおけるGCドロップアウト率は、タグメント化バッファの組成物により影響を受ける。GCドロップアウト率は、HMW、HEPES、HEPES−DMSO、HEPES−DMSO−Co、およびHEPES−DMSO−Mnバッファを用いて調製したMBP−Mos1タグメント化ライブラリにおいて増加する。
【0157】
図22A、22B、22C、および22Dはそれぞれ、Mos1−HEPESライブラリにおける配列含有量についてのバイアスグラフ1200、Mos1−HEPES−DMSOライブラリにおける配列含有量についてのバイアスグラフ1230、Mos1−HEPES−DMSO−Coライブラリにおける配列含有量についてのバイアスグラフ1240、および、Mos1−HEPES−DMSO−Mnライブラリにおける配列含有量についてのバイアスグラフ1250を示す。バイアスグラフ1200、1230、1240、および1250はそれぞれ、サイクル数によるA含有量の曲線である曲線1210、サイクル数によるC含有量の曲線である曲線1215、サイクル数によるG含有量の曲線である曲線1220、および、サイクル数によるT含有量の曲線である曲線1225を示す。
【0158】
図22Aおよび22Bを参照すると、データは、Mos1配列バイアスが、Mos1−HEPESおよびMos1−HEPES−DMSOのタグメント化ライブラリにおいて、SBSの最初の数サイクルで観察されることを示す。第1SBSサイクルでは、Tの検出はフローセルを通して約100%である。第2SBSサイクルでは、Aの検出はフローセルを通して約100%である。約4サイクルより後で配列バイアスは縮小し、A,T、C、およびGの含有量は、予想されるゲノム組成物を反映する。
【0159】
図22Cおよび22Dを参照すると、データはまた、Mos1配列バイアスが、マグネシウム(Mg)をそれぞれコバルト(Co)またはマンガン(Mn)で置き換えたタグメント化バッファを用いて調製したライブラリである、Mos1−HEPES−DMSO−CoおよびMos1−HEPES−DMSO−Mnのタグメント化ライブラリにおいて、SBSの最初の数サイクルで観察されることを示す。この場合もやはり、約4サイクルより後で配列バイアスは縮小し、A,T、C、およびGの含有量は、予想されるゲノム組成物を反映する。しかしながら、Mos1−HEPES−DMSO−CoおよびMos1−HEPES−DMSO−Mnのライブラリ、つまり、曲線1210(つまり、A)および曲線1225(つまり、T)では、予想されるゲノム組成物へのシフトは、サイクル1およびサイクル2において観察される。予想されるゲノム組成物へのシフトは、Mos1−HEPES−DMSO−Mnライブラリにおいてより顕著である。
【0160】
(実施例7)
TS−Tn5059ライブラリ調製およびエクソーム濃縮プロトコル
一実施形態では、本発明の方法は、Tn5トランスポソームベースのエクソームライブラリの調製および濃縮に対し、合理化ワークフローを提供する。
【0161】
図23は、エクソーム配列決定用のゲノムDNAライブラリを調製し濃縮する方法1260の一例のフロー図を示す。方法1260は、TS−Tn5059トランスポソームと、現在のNextera(登録商標) Rapid Captureプロトコルのあるプロセスステップへの修正とを用いて、ある範囲のDNAインプット量にわたる改善されたライブラリ収量および配列決定測定基準を提供する。例えば、方法1260は、「両面」固相可逆固定(solid phase reversible immobilization、SPRI(登録商標))プロトコル(Agencourt AMPure XPビーズ;Beckman Coulter社)を用いて標的DNAを精製し、そして、PCR増幅の前に、第1DNA断片サイズ選択ステップおよび第2DNA断片サイズ選択ステップを提供する。別の例では、前濃縮プロセスを用いて、エクソーム濃縮の前に標的DNAライブラリを濃縮する。方法1260は、以下のステップを含むが、それらに限定されない。
【0162】
ステップ1270で、ゲノムDNAをトランスポソームによりタグメント化(タグ付けおよび断片化)する。トランスポソームはゲノムDNAを同時に断片化して端にアダプタ配列を加え、後続のPCRによる増幅を可能にする。一例では、トランスポソームはTS−Tn5059である。タグメント化反応の完了時に、タグメント化停止バッファを反応物に加える。タグメント化停止バッファは、TS−Tn5059トランスポソーム複合物をタグメント化DNAから確実に十分に変性することができるように、修正することができる(例えば、停止バッファにおけるSDS濃度を、高熱と組み合わせて、0.1%から1.0%へ増加させる)。
【0163】
ステップ1275では、第1浄化を行ってトランスポソームからタグメント化DNAを精製し、第1DNA断片サイズ選択ステップを提供する。DNA断片サイズは、DNAに対するSPRIビーズの、体積対体積の比率を変更することにより選択することができる(例えば、1xSPRI=1:1体積SPRI:DNA)。例えば、第1サイズ選択では、DNAに対するSRPIビーズの体積比率を選択し、あるサイズよりも大きいDNA断片を結合させ(つまり、より大きいDNA断片をサンプルから取り除く)、一方で、あるサイズよりも小さいDNA断片は上清に残す。サイズを選択したDNA断片を有する上清を、次の処理のため浄化反応容器に移す。より大きいDNA断片が付いたSPRIビーズは廃棄してよい。一実施形態では、SPRIビーズの濃度は0.8X〜1.5Xまで変えることが可能である。一実施形態では、SPRIビーズの濃度は0.8Xである。
【0164】
ステップ1280では、第2浄化を行って、あるサイズ範囲のDNA断片をさらに選択する。例えば、DNAに対するSPRIビーズの体積比率を選択して、あるサイズより大きいDNA断片を結合させる(つまり、所望のサイズ範囲のDNA断片をSPRIビーズに結合させる)。より小さいDNA断片は上清に残し、廃棄する。結合DNA断片はその後、次の処理のためにSPRIビーズから溶出する。
【0165】
任意のステップ1285では、DNA断片サイズ分布を求める。DNA断片サイズ分布は、例えば、Bioanalyzerを用いて求める。
【0166】
ステップ1290では、精製タグメント化DNAを限定サイクル(limited−cycle)PCRプログラムを用いて増幅する。PCRステップはまた、次のクラスタ生成および配列決定に必要な共通アダプタ(P5およびP7)と同様に、インデックス1(i7)およびインデックス2(i5)、ならびに、配列決定を加える。両面SPRIプロセス(つまり、ステップ1275およびステップ1280)を用いて所望のDNA断片サイズ範囲を選択することから、所望のサイズ範囲にあるタグメント化DNA断片のみ、PCR増幅で利用可能となる。その結果、ライブラリ収量は著しく増加し、次の配列決定測定基準(例えば、リード濃縮率)は改善する。
【0167】
ステップ1295では、増幅したタグメント化DNAライブラリを、ビーズベースの精製プロセスを用いて精製する。
【0168】
任意のステップ1300では、PCR後のDNA断片サイズ分布を求める。DNA断片サイズ分布は、例えば、Bioanalyzerを用いて求める。
【0169】
ステップ1310では、タグメント化DNAライブラリを、次のエクソーム濃縮のためのハイブリダイゼーションの前に予め濃縮する。例えば、タグメント化DNAライブラリを約50μLから約10μLへ予め濃縮する。タグメント化DNAライブラリを予め濃縮することにより、ハイブリダイゼーション速度はより速くなり、ハイブリダイゼーションの時間は減る。
【0170】
ステップ1320では、エクソーム濃縮用の第1ハイブリダイゼーションを行う。例えば、DNAライブラリを、対象領域に標的させたビオチン化捕捉プローブと混ぜる。DNAライブラリを約95℃で約10分間変性し、約58℃で約30分間プローブにハイブリダイズし、総反応時間を約40分とする。
【0171】
ステップ1325では、ストレプトアビジンビーズを用いて、対象標的領域にハイブリダイズしたビオチン化プローブを捕捉する。2つの加熱洗浄手順を用いて、非特異的に結合したDNAをビーズから取り除く。濃縮ライブラリをその後ビーズから溶出し、ハイブリダイゼーションの第2ラウンドに備える。
【0172】
ステップ1330では、エクソーム濃縮用の第2ハイブリダイゼーションを、第1ハイブリダイゼーションと同じプローブおよび遮断薬を用いて行う。例えば、ステップ155により溶出したDNAライブラリを約95℃で約10分間変性し、約58℃で約30分間ハイブリダイズし、総反応時間を約40分とする。第2ハイブリダイゼーションを用いて、捕捉領域の高特異性を確保する。
【0173】
ステップ1335では、ストレプトアビジンビーズを用いて、対象標的領域にハイブリダイズしたビオチン化プローブを捕捉する。2つの加熱洗浄手順を用いて、非特異的に結合したDNAをビーズから取り除く。エクソーム濃縮ライブラリをその後ビーズから溶出し、配列決定に備えて10サイクルのPCRにより増幅する。
【0174】
ステップ1340では、エクソーム濃縮捕捉サンプル(つまり、エクソーム濃縮DNAライブラリ)を、ビーズベースの精製プロトコルを用いて精製する。
【0175】
ステップ1345では、エクソーム濃縮DNAライブラリを配列決定のためにPCR増幅する。
【0176】
ステップ1350では、増幅した濃縮DNAライブラリを、ビーズベースの精製プロトコルを用いて任意で精製する。例えば、1X SPRIビーズプロトコルを用いて、次のクラスタ増幅および配列決定を妨げる可能性のある不要な産物(例えば、過剰プライマー)を取り除く。
【0177】
方法100は、約11時間でライブラリ調製とエクソーム濃縮を可能にする。任意のステップ1285および1300を省略する場合、方法1260は約9時間でライブラリ調製とエクソーム濃縮を可能にする。
【0178】
(実施例8)
TS−Tn5059挿入バイアス
トランスポザーゼは、タグメント化反応において、ある挿入部位(DNA配列)バイアスを有する場合がある。DNA配列バイアスは、ゲノムのある領域(例えば、GC−リッチ、またはAT−リッチ)をタグメント化ライブラリからドロップさせ得る。例えば、Tn5トランスポザーゼは、ゲノムのGC−リッチ領域に対しあるバイアスを有する。その結果、ゲノムのAT領域はTn5タグメント化ライブラリにおいてドロップする場合がある。より完全なゲノムカバレッジを提供するため、最少の配列バイアスが望ましい。
【0179】
ライブラリアウトプットおよび配列決定測定基準に対するTS−Tn5059トランスポソームの影響を評価するため、TS−Tn5059タグメント化DNAライブラリを、全ゲノム配列決定用標準Nextera(登録商標)DNAライブラリ調製キットおよびセレウス菌ゲノムDNAを用いて調製した。TS−Tn5059は最終濃度40nMで用いた。参照対照ライブラリを、25nMのNexteraV2トランスポソームという標準反応条件を用いて調製した。ライブラリをsequencing−by−synthesis(SBS)により評価した。
【0180】
図24Aは、TS−Tn5059トランスポソームを用いて調製したタグメント化セレウス菌ゲノムDNAライブラリにおけるカバレッジについてのプロット1400を示す。TS−Tn5059トランスポソームは、GC含有量が増えるにつれ、増加するバイアスレベルに対し耐性を示すようになる。
図24Bは、NexteraV2トランスポソームを用いて調製したタグメント化セレウス菌ゲノムDNAライブラリにおけるカバレッジについてのプロット1450を示す。
図24Bは、GC含有量が増えると、GCリッチ領域のNexteraV2カバレッジはバイアスの増加とともに歪み出す。データは、TS−Tn5059を用いて調製したタグメント化DNAライブラリが、NexteraV2を用いて調製したタグメント化ライブラリと比較し、より挿入バイアスが低く、広いGC/AT範囲にわたって、改善されたさらに均一のカバレッジを有することを示す。
【0181】
図25Aは、TS−Tn5059トランスポソームを用いて調製したタグメント化セレウス菌ゲノムDNAライブラリにおける、ギャップ位置およびギャップ長についてのプロット1500を示す。
図25Bは、NexteraV2トランスポソームを用いて調製したタグメント化セレウス菌ゲノムタグメント化DNAライブラリにおける、ギャップ位置およびギャップ長についてのプロットを示す。TS−Tn5059タグメント化ライブラリにおけるギャップ数は27である。NexteraV2タグメント化ライブラリにおけるギャップ数は208である。データは、TS−Tn5059トランスポソームを用いて調製したタグメント化DNAライブラリが、NexteraV2トランスポソームを用いて調製したタグメント化ライブラリと比較し、よりギャップの少ない、さらに均一なカバレッジを有することを示す。
【0182】
(実施例8)
TS−Tn5059DNAインプット許容差
タグメント化ライブラリの調製に、酵素DNA断片化ステップ(例えば、トランスポソーム仲介タグメント化)を用いることから、例えば機械的断片化方法と比較し、DNAインプットに対しより影響を受けやすい場合がある。一実施例では、現在のNextera(登録商標) Rapid Capture Enrichmentプロトコルは、50ngの総ゲノムDNAインプットに対し最適化されている。より高質量のゲノムDNAインプットは、不完全なタグメント化およびより大きい挿入サイズをもたらす可能性があり、これは、次の濃縮動作に影響を与え得る。より低質量のゲノムDNAインプットまたは低品質のゲノムDNAは、タグメント化反応において、予想より小さい挿入サイズを生成する可能性がある。より小さい挿入物は、次の浄化ステップ中に失われ、ライブラリ多様性が低下する場合がある。
【0183】
断片(挿入)サイズ分布に対する異なるDNAインプット量の影響を評価するため、様々な酵素濃度で、様々な量のインプットゲノムDNAを用いてTS−Tn5059タグメント化ライブラリを調製し、断片サイズを他トランスポザーゼで得た断片サイズと比較した。該他トランスポザーゼのアクティビティは、40nMのTS−Tn5059および25ngのゲノムDNAインプットのアクティビティに対し正規化する。
【0184】
40nMのTS−Tn5059、正規化TDE1(Tn5バージョン−1)、および正規化TS−Tn5により、25ngのヒトゲノムDNAを用いて生成した断片サイズ分布は、
図26および27に示すように類似していた。
【0185】
しかしながら、TS−Tn5059は、より高い酵素濃度で、広範囲のインプットDNA量にわたり、DNAインプット許容差の拡大を示した。
図28は、ある範囲のDNAインプットを用いて調製したタグメント化ゲノムDNAライブラリにおける断片サイズ分布についての、Bioanalyzerトレースのパネル1600を示す。240nMのTS−Tn5059タグメント化ライブラリを、タグメント化、1.8X SPRI浄化により調製し、その後Bioanalyzerトレースを続けた。参照対照ライブラリを、現在のNextera(登録商標) Rapid Captureキット(「Nextera」)およびAgilent QXTキット(「Agilent QXT」)を用いて調製した。タグメント化ライブラリを、25ng、50ng、75ng、および100ngのセレウス菌ゲノムDNAを用いて調製した。データは、TS−Tn5059トランスポソームを用いて調製したタグメント化DNAライブラリの断片サイズ分布は、NexteraトランスポソームまたはAgilentQXTトランスポソームを用いて調製したライブラリと比較し、25〜100ngのDNAインプット範囲にわたってより一貫していることを示す。DNAインプットの量が25ngから100ngに増加するにつれ、TS−Tnタグメント化ライブラリにおいてタグメント化DNAの収量は増えるが、断片サイズ分布は実質的に同じままである。対照的に、75ngおよび100ngのDNAインプットでは、NexteraおよびAgilent QXTのタグメント化ライブラリは、DNA断片サイズ分布が大きい断片サイズへ実質的にシフトすることを示す。
【0186】
図29Aは、5ngから100ngへ変動するヒトCorielDNAインプットを用いて第1ユーザが調製した、TS−Tn5059タグメント化ライブラリにおける断片サイズ分布についての、Bioanalyzerトレースのプロット1700を示す。
図29Bは、第2ユーザが調製したTS−Tn5059タグメント化ライブラリにおける断片サイズ分布についての、Bioanalyzerトレースのプロット1750を示す。タグメント化ライブラリは、5ng、10ng、25ng、50ng、75ng、および100ngのセレウス菌ゲノムDNAを用いて調製した。
図29Aのプロット1700および
図29Bのプロット1750は両者とも、5ngのDNAインプットを用いて調製したタグメント化ライブラリにおける断片サイズ分布のライン1710、10ngのDNAインプットを用いて調製したタグメント化ライブラリにおける断片サイズ分布のライン1715、25ngのDNAインプットを用いて調製したタグメント化ライブラリにおける断片サイズ分布のライン1720、50ngのDNAインプットを用いて調製したタグメント化ライブラリにおける断片サイズ分布のライン1725、75ngのDNAインプットを用いて調製したタグメント化ライブラリにおける断片サイズ分布のライン1730、および100ngのDNAインプットを用いて調製したタグメント化ライブラリにおける断片サイズ分布のライン1735を示す。データは、TS−Tn5059タグメント化DNAライブラリにおける断片サイズ分布が、5〜100ngのDNAインプット範囲で一貫していることを示す。断片サイズ分布における一貫性は、異なるユーザについて観察される。
【0187】
別の例では、表3に、5〜200ngのDNAインプット範囲にわたるTS−Tn5059タグメント化DNAライブラリでの、ライブラリ挿入サイズの中央値を示す。
【0188】
【表3】
【0189】
さらに別の例では、表4に、25ng、50ng、75ng、および100ngのDNAインプットを用いて調製したTS−Tn5059タグメント化DNAについての、ライブラリ挿入サイズとエクソーム濃縮配列決定測定基準を示す。データは、リード濃縮率(%)が約80%であることを示す。現在のNextera(登録商標)Rapid Capture Enrichmentプロトコルを用いて調製したタグメント化ライブラリについてのリード濃縮率は、約60%である(データ表示なし)。データはまた、15ng〜100ngのDNAインプット範囲にわたり、一貫した挿入サイズを示す。
【0190】
【表4】
【0191】
別の例では、表5に、TS−Tn5059タグメント化ライブラリにおける、25ng〜100ngのDNAインプット範囲にわたる前濃縮ライブラリの収量を示す。
【0192】
【表5】
【0193】
さらに別の例では、表6に、TS−Tn5059タグメント化DNAライブラリについてのエクソーム濃縮配列決定測定基準を示す。50ngのインプットDNAで開始し、ライブラリは、エクソーム濃縮に対し500ng、625ng、および750ngのライブラリDNAインプットを用いて調製した。データは、エクソーム濃縮測定基準は、ある範囲の前濃縮ライブラリインプット量(つまり、500ng〜750ng)にわたり一貫していることを示す。
【0194】
【表6】
【0195】
さらに別の例では、表7に現在のNextera(登録商標) Rapid Capture Enrichmentハイブリダイゼーションプロトコル(「NRC」)と、
図23の方法1260の濃縮ステップ1310〜1350とを用いて調製したタグメント化DNAライブラリについての、エクソーム濃縮配列決定測定基準を示す。データは、エクソーム濃縮測定基準が、現在のNextera(登録商標) Rapid Capture Enrichmentプロトコル(「NRC」)においてハイブリダイゼーションプロトコル用いて調製したライブラリと比較し、
図23の方法1260を用いて調製したTS−Tn5059タグメント化ライブラリにおいて改善および/または維持されることを示す。
【0196】
【表7】
【0197】
別の実験では、TS−Tn5059は、より高い濃度(6Xに正規化)で、同じ濃度に正規化したTn5バージョン−1およびTS−Tn5トランスポザーゼと比較し、DNAインプット許容差の改善を示す。結果を
図30〜33を示す。6X「正規化」濃度のTn5バージョン1(
図30)およびTS−Tn5(
図31)は、両者とも、gDNAインプットを25〜100ngの間で変動させると断片サイズ分布のシフトを示す。対照的に、6X正規化濃度のTS−Tn5059は、10〜100ngのDNAインプットでは顕著なサイズシフトを示さない(
図32)。断片サイズ分布は、200〜500ngへgDNAを増加させると、シフトし始める(
図33)。TS−Tn5059のDNAインプット許容差の拡大についての結果を下記の表8にまとめる。
【0198】
【表8】
【0199】
このように、TS−Tn5059では、≧2.4(nM TS−Tn5059:ngインプットDNA)の比率においてDNAインプット許容差の拡大を示すサイズシフトはなかった。
【0200】
本出願を通して、様々な刊行物、特許、および/または特許出願を参照した。これらの刊行物の開示内容はその全体が、本出願で参照されることにより本明細書に組み込まれる。
【0201】
用語「含む」は本明細書では非限定的であることを意図し、言及された要素だけを含むのでなく、任意の追加要素をさらに包含する。
【0202】
多くの実施形態が記載されている。そうは言うものの、様々な修正が可能であることが理解されよう。したがって、他の実施形態も以下の請求項の範囲内にある。