(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-04
(45)【発行日】2024-07-12
(54)【発明の名称】ポリメラーゼ、組成物、および使用方法
(51)【国際特許分類】
C12N 9/12 20060101AFI20240705BHJP
C12N 15/31 20060101ALN20240705BHJP
C12N 15/54 20060101ALN20240705BHJP
【FI】
C12N9/12 ZNA
C12N15/31
C12N15/54
(21)【出願番号】P 2020572427
(86)(22)【出願日】2019-10-31
(86)【国際出願番号】 US2019059246
(87)【国際公開番号】W WO2020092830
(87)【国際公開日】2020-05-07
【審査請求日】2022-06-24
(32)【優先日】2018-10-31
(33)【優先権主張国・地域又は機関】US
【前置審査】
(73)【特許権者】
【識別番号】514202402
【氏名又は名称】イラミーナ インコーポレーテッド
(73)【特許権者】
【識別番号】518199104
【氏名又は名称】イルミナ シンガポール ピーティーイー リミテッド
【氏名又は名称原語表記】ILLUMINA SINGAPORE PTE LTD
(74)【代理人】
【識別番号】100147485
【氏名又は名称】杉村 憲司
(72)【発明者】
【氏名】ミーシャ ゴリンスキー
(72)【発明者】
【氏名】セス マクドナルド
(72)【発明者】
【氏名】サウラブ ニランター
(72)【発明者】
【氏名】マシュー ケリンジャー
(72)【発明者】
【氏名】マイケル プリバイト
(72)【発明者】
【氏名】セルジオ ペイサジョビッチ
(72)【発明者】
【氏名】モリー ヘ
【審査官】西澤 龍彦
(56)【参考文献】
【文献】米国特許出願公開第2007/0048748(US,A1)
【文献】米国特許出願公開第2018/0119115(US,A1)
【文献】米国特許出願公開第2011/0301041(US,A1)
【文献】特表2017-518750(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
C12N
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
UniProt/GeneSeq
(57)【特許請求の範囲】
【請求項1】
配列番号10~34から選択されるアミノ酸配列を含む組換えDNAポリメラーゼ。
【請求項2】
配列番号10~11、23~25及び27~34から選択される
アミノ酸配列を含む、請求項1に記載の組換えDNAポリメラーゼ。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願への相互参照)
この出願は、2018年10月31日に出願された米国仮出願シリアル番号第62/753,558号の利益を主張し、これは参照によりその全体が本明細書に組み込まれる。
【0002】
(配列表)
この出願は、224キロバイトのサイズを有し2019年10月31日に創生された、「IP-1546-PCT_ST25.txt」と表題されたASCIIテキストファイルとしてEFS-Webを介して米国特許商標庁に電子的に提出された配列表を含む。当該配列表に含まれる情報は、参照により本明細書に組み込まれる。
【0003】
(分野)
本開示は、とりわけ、合成による核酸シーケンシングの文脈において、ヌクレオチド取込み反応を実施する際に使用するための改変(altered)ポリメラーゼに関する。
【背景技術】
【0004】
(背景)
次世代シーケンシング(NGS)テクノロジーは、シーケンシングプロセスの重要なコンポーネントとしてDNAポリメラーゼに依存する。高い忠実度を維持しつつテンプレートをシーケンシングする時間を減少することが望まれる。合成によるシーケンシング(sequencing by synthesis:SBS)プロセスの各サイクルを減少することは、より短いシーケンシングランタイムを達成するために有用なステップである。サイクルタイムを減少するための1つのアプローチは、取込みステップの時間を減少することである。しかしながら、取込み時間を減少することで、ランタイム全体に大幅な向上を与えることができた一方で、典型的には、そのようにすると忠実度に犠牲を払うことになる。例えば、フェージング率、プレフェージング率、および/またはバイパス率が増加すると、その結果、エラー率が増加する。低エラー率では、シーケンシングランの最中に、クラスター中の大部分のテンプレート分子が同じラベル化ヌクレオチドで終結し、シグナルが明確である。対照的に、減少した忠実度では、シーケンシングランの最中に、クラスター中で不正確にラベル化されたヌクレオチドで終結したテンプレート分子の数が増加し、シグナルがノイズ化しすぎてしまい得て、どのヌクレオチドが取り込まれたかを正確に決定することができなくなる。
【発明の概要】
【発明が解決しようとする課題】
【0005】
(要旨)
本明細書で提供されるのは、組換えDNAポリメラーゼである。本開示のポリメラーゼの一例は、9°N DNAポリメラーゼアミノ酸配列配列番号1と少なくとも80%同一であるアミノ酸配列を含む。
【課題を解決するための手段】
【0006】
一実施形態では、ポリメラーゼはまた、9°N DNAポリメラーゼアミノ酸配列中の、Tyr497と機能的に等価な位置でのアミノ酸置換変異およびPhe152、Val278、Met329、Val471、Thr514、Leu631、またはGlu734と機能的に等価な位置での少なくとも1つのアミノ酸置換変異を含み、および任意に、9°N DNAポリメラーゼアミノ酸配列中のアミノ酸Met129、Asp141、Glu143、Cys223、Leu408、Tyr409、Pro410、およびAla485と機能的に等価な位置でのアミノ酸置換変異をさらに含む。
【0007】
一実施形態では、ポリメラーゼはまた、9°N DNAポリメラーゼアミノ酸配列中の、Tyr497と機能的に等価な位置でのアミノ酸置換変異およびLys476、Lys477、Thr514、Ile521、またはThr590と機能的に等価な位置での少なくとも1つのアミノ酸置換変異を含み、および任意に、9°N DNAポリメラーゼアミノ酸配列中のアミノ酸Met129、Asp141、Glu143、Cys223、Leu408、Tyr409、Pro410、およびAla485と機能的に等価な位置でのアミノ酸置換変異をさらに含む。
【0008】
一実施形態では、ポリメラーゼはまた、9°N DNAポリメラーゼアミノ酸配列中の、Tyr497と機能的に等価な位置でのアミノ酸置換変異およびArg247、Glu599、Lys620、His633、またはVal661と機能的に等価な位置での少なくとも1つのアミノ酸置換変異を含み、および任意に、9°N DNAポリメラーゼアミノ酸配列中のアミノ酸Met129、Asp141、Glu143、Cys223、Leu408、Tyr409、Pro410、およびAla485と機能的に等価な位置でのアミノ酸置換変異をさらに含む。
【0009】
一実施形態では、ポリメラーゼはまた、(i)Tyr497と機能的に等価な位置でのアミノ酸置換変異;(ii)9°N DNAポリメラーゼアミノ酸配列中のPhe152、Val278、Met329、Val471、Leu631、またはGlu734と機能的に等価な位置での少なくとも1つのアミノ酸置換変異、および(iii)9°N DNAポリメラーゼアミノ酸配列中のLys476、Lys477、Thr514、Ile521、またはThr590と機能的に等価な位置での少なくとも1つのアミノ酸置換変異を含み、および任意に、9°N DNAポリメラーゼアミノ酸配列中のアミノ酸Met129、Asp141、Glu143、Cys223、Leu408、Tyr409、Pro410、およびAla485と機能的に等価な位置でのアミノ酸置換変異をさらに含む。
【0010】
一実施形態では、ポリメラーゼはまた、(i)Tyr497と機能的に等価な位置でのアミノ酸置換変異;(ii)9°N DNAポリメラーゼアミノ酸配列中のLys476、Lys477、Thr514、Ile521、またはThr590と機能的に等価な位置での少なくとも1つのアミノ酸置換変異、および(iii)9°N DNAポリメラーゼアミノ酸配列中のArg247、Glu599、Lys620、His633、またはVal661と機能的に等価な位置での少なくとも1つのアミノ酸置換変異を含み、および任意に、9°N DNAポリメラーゼアミノ酸配列中のアミノ酸Met129、Asp141、Glu143、Cys223、Leu408、Tyr409、Pro410、およびAla485と機能的に等価な位置でのアミノ酸置換変異をさらに含む。
【0011】
一実施形態では、ポリメラーゼはまた、(i)Tyr497と機能的に等価な位置でのアミノ酸置換変異;(ii)9°N DNAポリメラーゼアミノ酸配列中のPhe152、Val278、Met329、Val471、Leu631、またはGlu734と機能的に等価な位置での少なくとも1つのアミノ酸置換変異、(iii)9°N DNAポリメラーゼアミノ酸配列中のLys476、Lys477、Thr514、Ile521、またはThr590と機能的に等価な位置での少なくとも1つのアミノ酸置換変異、および(iv)Arg247、Glu599、Lys620、His633、またはVal661と機能的に等価な位置での少なくとも1つのアミノ酸置換変異を含み、および任意に、9°N DNAポリメラーゼアミノ酸配列中のアミノ酸Met129、Asp141、Glu143、Cys223、Leu408、Tyr409、Pro410、およびAla485と機能的に等価な位置でのアミノ酸置換変異をさらに含む。
【0012】
本開示のポリメラーゼの別の例は、9°N DNAポリメラーゼアミノ酸配列配列番号8と少なくとも80%同一であるアミノ酸配列を含み、また、(i)9°N DNAポリメラーゼアミノ酸配列中のTyr497、Phe152、Val278、Met329、Val471、およびThr514と機能的に等価な位置でのアミノ酸置換変異;(ii)9°N DNAポリメラーゼアミノ酸配列中のTyr497、Met329、Val471、およびGlu734と機能的に等価な位置でのアミノ酸置換変異;(iii)9°N DNAポリメラーゼアミノ酸配列中のTyr497、Arg247、Glu599、およびHis633と機能的に等価な位置でのアミノ酸置換変異;(iv)9°N DNAポリメラーゼアミノ酸配列中のTyr497、Arg247、Glu599、Lys620、およびHis633と機能的に等価な位置でのアミノ酸置換変異;(v)9°N DNAポリメラーゼアミノ酸配列中のTyr497、Met329、Thr514、Lys620、およびVal661と機能的に等価な位置でのアミノ酸置換変異;または(vi)9°N DNAポリメラーゼアミノ酸配列中のTyr497、Val278、Val471、Arg247、Glu599、およびHis633と機能的に等価な位置でのアミノ酸置換変異を含む。
【0013】
また、本明細書で提供されるのは、配列番号10~34のいずれか1つのアミノ酸配列を含む組換えDNAポリメラーゼ、本明細書に記載のポリメラーゼをコードする核酸分子、当該核酸分子を含む発現ベクター、および当該ベクターを含む宿主細胞である。
【0014】
本開示はまた、方法を含む。一実施形態では、方法は、修飾ヌクレオチド類を成長中のDNA鎖の中へ取り込ませるためのものである。当該方法は、以下の成分が相互作用することを可能にすることを含む:(i)本明細書に記載のポリメラーゼ;(ii)DNAテンプレート;および(iii)ヌクレオチド溶液。
【0015】
また、本明細書で提供されるのは、キットである。一実施形態では、当該キットは、ヌクレオチド取込み反応を実施するためのものである。当該キットは、例えば、本明細書に記載のポリメラーゼおよびヌクレオチド溶液を含むことができる。
【図面の簡単な説明】
【0016】
【
図1】
図1は、Thermococcus sp. 9°N-7(9°N、配列番号1)、Thermococcus litoralis(Vent、配列番号2およびDeep Vent、配列番号3)、Thermococcus waiotapuensis(Twa、配列番号7)、Thermococcus kodakaraenis(KOD、配列番号5)、Pyrococcus furiosus(Pfu、配列番号4)、Pyrococcus abyssi(Pab、配列番号6)に由来するポリメラーゼアミノ酸配列のアラインメントを示す概略図である。「*」(アスタリスク)は、すべてのポリメラーゼ間で完全に保存された単一の残基を有する位置を表示する。「:」(コロン)は、以下のような強同類性プロパティのグループ間の保存-Gonnet PAM250マトリックスのスコアリング> 0.5とほぼ同等-を表示する。「.」(ピリオド)は、以下のような弱同類性プロパティのグループ間の保存-Gonnet PAM250マトリックスのスコアリング=<0.5および>0とほぼ同等-を表示する。
【
図2】
図2は、Pol 812(配列番号8)対照と比較した場合の、本開示の改変ポリメラーゼの1つであるPol 1558(配列番号11)によって示される短い取込み時間での減少したフェージングおよび累積エラー率を示す(左パネル)。2つの酵素は、標準取込み時間で同類の(comparable)フェージングおよびエラー率を示す(右パネル)。
【
図3A】
図3Aは、Pol 812(配列番号8)およびPol 963(配列番号9)対照と比較した場合の、選択された本開示の改変ポリメラーゼであるPol 1558(配列番号11)、Pol 1671(配列番号23)、Pol 1682(配列番号25)、Pol 1682(配列番号26)、およびPol 1745(配列番号28)によって示される短い取込み時間での減少したR1フェージングおよび累積E.coliエラー率を示す。上部パネルおよび下部パネルの破線は、標準取込み時間でPol812により示される累積E.coliエラーおよびR1フェージング率を示す。
【
図3B】
図3Bは、Pol 812およびPol 963対照を参照して、同じ改変ポリメラーゼのフェージングおよびプレフェージング率を比較する。
【
図4】
図4は、長いシーケンシング読取り(2×250サイクル)の最中の標準および短い取込み時間での、Pol 1550(配列番号10)およびPol 1558(配列番号11)の累積PhiXエラー率とPol 812(配列番号8)対照のそれとを比較する。両方の変異体は、ペアエンドターン後のエラー率の顕著な減少を示す。
【
図5A】
図5Aは、短い取込み時間で示される本発明の改変ポリメラーゼの1つであるPol 1671(配列番号23)のNovaSeq(商標)シーケンシングメトリックスと、標準および短い取込み時間で示されるPol 812(配列番号8)対照のそれらとの間の比較を示す。上部パネルは、フィルターを通過するクラスター(「クラスターPF」)のパーセンテージを示す;下部パネルは、累積PhiXエラー率を示す。明るい白丸は、標準取込み時間でのPol 812メトリックスを示し、一方暗い白丸は、短い取込み時間でのPol 812メトリックスを示す。黒丸で示されたすべてのPol 1671メトリックスは、短い取込み時間である。
【
図5B】
図5Bは、標準および短い取込み時間でのNovaSeq(商標)読取り1および2についてのPol 812対照を参照してのPol 1671によって示された累積PhiXエラー率、Q30値、およびフェージング率を要約する。Pol 1671を使用した場合、両方の読取りの品質の大幅な向上が観察された。
【発明を実施するための形態】
【0017】
(例示的実施形態の詳細な説明)
「および/または」の用語は、リストされた要素の1つもしくはすべて、またはリストされた要素の任意の2つ以上の組合せを意味する。
【0018】
「好ましい(preferred)」および「好ましく(preferably)」の語は、特定の状況下で特定の利益をもたらし得る本発明の実施形態を指す。しかしながら、同じまたは他の状況下では、他の実施形態もまた、好ましくなり得る。さらに、1つ以上の好ましい実施形態の記述は、他の実施形態が有用でないことを暗示するものではなく、他の実施形態を本発明の範囲から除外することを意図するものではない。
【0019】
「含む(comprises)」の用語およびその変形は、これらの用語が明細書および特許請求の範囲に現れる場合、限定的な意味を有しない。
【0020】
実施形態が「含む(include)」、「含む(includes)」、または「含む(including)」等の言語で本明細書に記載される場合は常に、「からなる(consisting of)」および/または「から本質的になる(consisting essentially of)」に関して記載される類似の実施形態もまた提供されることが、理解される。
【0021】
特に明記しない限り、「a」、「an」、「the」、および「少なくとも1つ(at least one)」は交換可能に使用され、1つまたは1つより多くを意味する。
【0022】
イベントが発生するために「適している(suitable)」条件または「適した(suitable)」条件とは、そのようなイベントの発生を妨げない状態である。したがって、これらの条件は、イベントを許可、増強、促進し、および/またはイベントに助長的である。
【0023】
本明細書で使用される場合、組成物、物品、核酸、または核の文脈で「提供する(providing)」とは、組成物、物品、核酸、または核を作製すること、組成物、物品、核酸、または核を購入すること、あるいはそれ以外の、化合物、組成物、物品、または核を取得することを意味する。
【0024】
また、本明細書において、エンドポイントによる数値範囲の記述は、その範囲内に包含されるすべての数を含む(例、1~5は、1、1.5、2、2.75、3、3.80、4、5等を含む)。
【0025】
本明細書全体を通じて、「一実施形態(one embodiment)」、「実施形態(an embodiment)」、「特定の実施形態(certain embodiments)」、または「いくつかの実施形態(some embodiments)」等への参照は、実施形態に関連して説明される特定の特徴(feature)、構成、組成、または特徴(characteristic)が本開示の少なくとも1つの実施形態に含まれることを意味する。したがって、本明細書全体を通じての種々の場所でのそのような語句の出現は、必ずしも本開示の同じ実施形態を参照しているわけではない。さらには、1つ以上の実施形態では、特定の特徴(feature)、構成、組成、または特徴(characteristic)を任意の適切な様式で組み合わせ得る。
【0026】
より急速な取込み時間で現在のレベルのパフォーマンスを維持または超えることは、新世代のポリメラーゼによって支援することができる。本明細書に提示されるのは、合成によるシーケンシング(sequencing by synthesis:SBS)の急速なサイクルタイム条件下で優位に向上したパフォーマンスを有するポリメラーゼ酵素である。本発明者らは、驚くべきことに、短い取込み時間の最中の向上した正確性を含む向上した特徴(characteristics)を示す特定の改変ポリメラーゼを同定した。向上した正確性は、減少したエラー率および減少したフェージングを含む。改変ポリメラーゼは、減少したプレフェージング、減少したバイパス率、SBS反応の向上した品質メトリックスを含めた、多数の他の関連する利点を有する。この向上は、ポリメラーゼが低濃度で使用された場合でも維持される。よって、一実施形態では、SBS反応におけるDNAポリメラーゼの濃度は、120ng/μlから80ng/μlまでであり得る。一実施形態では、SBS反応におけるDNAポリメラーゼの濃度は、120ng/μl以下、110ng/μl以下、100ng/μl以下、または90ng/μl以下であり得る。一実施形態では、SBS反応におけるDNAポリメラーゼの濃度は、少なくとも80ng/μl、少なくとも90ng/μl、少なくとも100ng/μl、または少なくとも110ng/μlであり得る。
【0027】
エラー率とは、シーケンシング反応の最中での、特定の位置でのテンプレート配列の正しい塩基、即ち、相補物の同定におけるエラーの頻度の測定値を指す。シーケンスされたライブラリーが元のゲノム配列と合致する忠実度は、核酸の抽出からシーケンシングプラットフォームでのシーケンシングまでの任意の段階で発生する塩基変異の頻度に依存して変化し得る。この頻度は、シーケンスされた塩基が正しくなる蓋然性に上限を設ける。いくつかの実施形態では、品質スコアは、数値として提示される。例えば、品質スコアはQXXとして引用することができ、XXはスコアであり、特定の呼び値が10-XX/10のエラーの蓋然性を有することを意味する。したがって、例として、Q30は、1000分の1、あるいは0.1%のエラー率に等しく、Q40は、10,000分の1、つまり0.01%のエラー率に等しい。
【0028】
フェージングおよびプレフェージングは、当業者に公知の用語であり、クラスターの配列コピーの読出しにおける同期性の喪失を記載するために使用される。フェージングおよびプレフェージングによって、特定のサイクルで抽出された強度が、現在のサイクルのシグナルと前後のサイクル由来のノイズとを含むことになる。したがって、本明細書で使用される場合、「フェージング」の用語は、所定のシーケンシングサイクルでのポリメラーゼによるクラスター内のDNA鎖のある部分でのヌクレオチドの不完全な取込みによって引き起こされるSBSにおける現象を指し、したがってクラスター内の単一分子が互いとの同期を喪失する率の尺度である。フェージングは、各サイクルでのクラスターシグナルの検出中に測定することができ、クラスター中のシグナルと同期していないクラスター由来の検出可能なシグナルのパーセンテージとして報告することができる。例として、クラスターは、第Nサイクルの最中に「緑」のフルオロフォアシグナルで検出される。次のサイクル(第N+1サイクル)では、99.9%のクラスターシグナルが「赤」チャネルで検出され、0.1%のシグナルが前のサイクルから残存し、「緑」チャネルで検出される。この結果は、フェージングが発生していることを示したであろうし、0.1のフェージング値といったような数値として報告することができ、クラスター中の0.1%の分子が各サイクルで遅滞していることを示す。
【0029】
本明細書で使用される「プレフェージング」の用語は、有効な3’ターミネーターなしでのヌクレオチド類の取込みによって引き起こされ、取込みイベントを1サイクル先に進行させる、SBSにおける現象を指す。サイクル数が増加すると、フェージングの影響を受けるクラスターあたりの配列のフラクションが増加し、正しい塩基の特定が妨げられる。プレフェージングは、シーケンシング機器で検出することができ、0.1のプレフェージング値といったような数値として報告することができ、クラスター中の0.1%の分子が各サイクルで先行していることを示す。
【0030】
フェージングおよびプレフェージングの検出は、例えば、米国特許第8,965,076号に記載されているように、当該分野で公知の任意の適した方法に従って実施および報告することができる。例えば、以下の例で説明するように、フェージングは、Illumina,Inc.(San Diego、CA)からのHiSeq(商標)、Genome Analyzer(商標)、NextSeq(商標)、NovaSeq(商標)、iSeq(商標)、MiniSeq(商標)、またはMiSeq(商標)シーケンシングプラットフォーム等のシーケンシング機器または当該分野で公知の他の適した機器でのSBSシーケンシングランの最中にルーチン的に検出および報告される。
【0031】
サイクルタイムを減少すると、それぞれがエラー率に寄与するフェージング、プレフェージング、および/またはバイパス率の発生が増加し得る。急速サイクルタイム条件で使用された場合でも、フェージング、プレフェージング、および/またはバイパス率の発生を減少させる改変ポリメラーゼの発見は、驚くべきことであり、SBSアプリケーションに大きな利点を提供する。例えば、改変ポリメラーゼは、より急速なSBSサイクル時間、より低いフェージングおよびプレフェージング値、および/またはより長いシーケンシング読取り長を提供することができる。本明細書で提供されるような改変ポリメラーゼのエラー率およびフェージングの特徴付けは、以下の実施例のセクションに示される。
【0032】
(ポリメラーゼ)
本明細書で提供されるのは、ポリメラーゼ、ポリメラーゼを含む組成物、およびポリメラーゼを使用する方法である。本明細書に記載のポリメラーゼは、DNAポリメラーゼである。一実施形態では、本明細書で「改変ポリメラーゼ」とも呼ばれる本開示のポリメラーゼは、参照ポリメラーゼのアミノ酸配列に基づく。改変ポリメラーゼは、参照ポリメラーゼと比較した場合に1つ以上の残基に置換変異を含む。置換変異は、参照ポリメラーゼと比較して同じ位置または機能的に等価な位置であり得る。参照ポリメラーゼおよび機能的に等価な位置は、本明細書に詳細に記載される。当業者は、本明細書に記載の改変ポリメラーゼが天然に生じないことを容易に理解するであろう。
【0033】
本明細書に記載の参照ポリメラーゼは、SBS反応に有用なエラー率を有する;しかしながら、より短い取込み時間を伴うSBS反応で参照ポリメラーゼを使用すると、エラー率が増加する。本明細書に記載の改変ポリメラーゼは、改変ポリメラーゼがより短い取込み時間のSBS反応で使用される場合でさえ、参照ポリメラーゼで観察される優れたエラー率を維持する。一実施形態では、改変ポリメラーゼが急速な取込み時間を使用してテストされる場合、エラー率の減少が生じる。取込みとは、DNAポリメラーゼがテンプレートと接触している時間量を指す。本明細書で使用される場合、遅い取込み時間は、MiniSeq(商標)ベンチトップシーケンシングシステムを使用する標準サイクル下で使用される取込み時間である。遅い取込み時間としては、40秒から50秒までが挙げられる。本明細書で使用される場合、急速なサイクル時間は、10秒から40秒までである取込みステップを指す。一実施形態では、急速なサイクル時間は、40秒以下、30秒以下、20秒以下、18秒以下、16秒以下、14秒以下、または12秒以下の取込み時間である。一実施形態では、急速なサイクル時間は、少なくとも10秒、少なくとも12秒、少なくとも14秒、少なくとも16秒、少なくとも18秒、少なくとも20秒、または少なくとも30秒の取込み時間である。一実施形態では、急速なサイクル時間は、40秒未満、30秒未満、20秒未満、18秒未満、16秒未満、14秒未満、12秒未満、または10秒未満の取込み時間である。
【0034】
本明細書に記載の改変ポリメラーゼは、異なる長さのランについてのSBS反応で使用することができる。「ラン」とは、テンプレート上で同定されるヌクレオチド類の数を指す。ランは、典型的に、テンプレートの1つの鎖を読み取る第1のプライマー(例、read1プライマー)に基づくランおよびテンプレートの相補鎖を読み取る第2のプライマー(例、read2プライマー)に基づくランを含む。一実施形態では、第1のプライマーまたは第2のプライマーを使用して同定されるヌクレオチド類の数は、10から150ヌクレオチドまでであり得る。一実施形態では、第1のプライマーまたは第2のプライマーを使用して同定されるヌクレオチド類の数は、150ヌクレオチド以下、130ヌクレオチド以下、110ヌクレオチド以下、90ヌクレオチド以下、70ヌクレオチド以下、50ヌクレオチド以下、30ヌクレオチド以下、または20ヌクレオチド以下であり得る。一実施形態では、第1のプライマーまたは第2のプライマーを使用して同定されるヌクレオチド類の数は、少なくとも10、少なくとも20、少なくとも30、少なくとも50、少なくとも70、少なくとも90、少なくとも110、または少なくとも130ヌクレオチドであり得る。
【0035】
特定の実施形態において、改変ポリメラーゼは、ファミリーB型DNAポリメラーゼに基づく。改変ポリメラーゼは、例えば、ファミリーB古細菌DNAポリメラーゼ、ヒトDNAポリメラーゼ-α、またはファージポリメラーゼに基づき得る。
【0036】
ファミリーB古細菌DNAポリメラーゼは、米国特許第8,283,149号の開示によって例示されるように当該分野で周知である。特定の実施形態において、古細菌DNAポリメラーゼは、超好熱性古細菌に由来し、熱安定性である。
【0037】
特定の実施形態において、ファミリーB古細菌DNAポリメラーゼは、例えば、サーモコッカス(Thermococcus)、パイロコッカス(Pyrococcus)、またはメタノコッカス(Methanococcus)等の属に由来する。サーモコッカス属のメンバーは当該分野で周知であり、T.4557、T.barophilus、T.gammatolerans、T.onnurineus、T.sibiricus、T.kodakarensis、T.gorgonarius、およびT.waiotapuensisが含まれるが、これらに限定されない。パイロコッカス属のメンバーは当該分野で周知であり、P.NA2、P.abyssi、P.furiosus、P.horikoshii、P.yayanosii、P.endeavori、P.glycovorans、およびP.woesei.が含まれるが、これらに限定されない。メタノコッカス属のメンバーは当該分野で周知であり、M.aeolicus、M.maripaludis、M.vannielii、M.voltae、M.thermolithotrophicus、およびM.jannaschiiが含まれるが、これらに限定されない。
【0038】
一実施形態では、改変されたポリメラーゼは、Vent(登録商標)、Deep Vent(登録商標)、9°N、Pfu、KOD、またはPabポリメラーゼに基づく。Vent(登録商標)およびDeepVent(登録商標)は、超好熱性古細菌Thermococcus litoralisから単離されたファミリーB DNAポリメラーゼに使用される商品名である。9°Nポリメラーゼは、Thermococcus sp.から単離されたファミリーBポリメラーゼである。Pfuポリメラーゼは、Pyrococcus furiosusから分離されたファミリーBポリメラーゼである。KODポリメラーゼは、Thermococcus kodakaraenisから単離されたファミリーBポリメラーゼである。Pabポリメラーゼは、Pyrococcus abyssiから単離されたファミリーBポリメラーゼである。Twaは、T.waiotapuensisから単離されたファミリーBポリメラーゼである。Vent(登録商標)、DeepVent(登録商標)、9°N、Pfu、KOD、Pab、およびTwaポリメラーゼの例は、
図1に開示されている。
【0039】
特定の実施形態において、ファミリーB古細菌DNAポリメラーゼは、例えば、T4、RB69、またはφ29ファージ等といったファージに由来する。
【0040】
図1は、配列番号1~7に示されるアミノ酸配列を有するタンパク質の配列アラインメントを示す。アラインメントは、異なるファミリーBポリメラーゼで保存されているアミノ酸を示す。当業者は、保存されたアミノ酸および保存された領域は、それらがポリメラーゼの機能にとって重要であり、それゆえに、ポリメラーゼの構造と機能との間の相関を示すので、最も保存され易いことを理解するであろう。アラインメントは、異なるファミリーBポリメラーゼ間で変動する領域も示す。当業者は、改変ポリメラーゼの生物学的活性に過度に影響を与えることなく、置換、とりわけ保存的置換が許容され得るポリメラーゼのそのようなデータ領域から推測することができる。
【0041】
本明細書に記載の改変ポリメラーゼは、公知のポリメラーゼ(本明細書では参照ポリメラーゼとも呼ばれる)のアミノ酸配列に基づき、1つ以上の残基での置換変異をさらに含む。一実施形態では、置換変異は、参照ポリメラーゼのアミノ酸と機能的に等価な位置でのものある。「機能的に同等」とは、改変ポリメラーゼが、参照ポリメラーゼおよび改変ポリメラーゼの両方において同じ機能的役割を有する参照ポリメラーゼのアミノ酸位置でのアミノ酸置換を有することを意味する。
【0042】
概して、2つ以上の異なるポリメラーゼにおける機能的に等価な置換変異は、ポリメラーゼのアミノ酸配列の相同アミノ酸位置で発生する。したがって、本明細書での「機能的に同等」の用語の使用は、変異アミノ酸の特定の機能が知られているかどうかに関係なく、所定の変異に対して「位置的に同等」または「相同」である変異も包含する。配列アラインメントおよび/または分子モデリングに基づいて、2つ以上の異なるポリメラーゼのアミノ酸配列における機能的に同等および位置的に等価なアミノ酸残基の位置を同定することが可能である。位置的に同等および/または機能的に等価な残基を同定するための配列アラインメントの例は、
図1に示される。例えば、
図1の垂直に整列させたTwa、KOD、Pab、Pfu、Deep Vent、およびVentポリメラーゼの残基は、9°Nのポリメラーゼアミノ酸配列の対応する残基と位置的に同等であると同時に機能的に同等であると考慮される。したがって、例えば、9°N、Twa、KOD、Pfu、Deep Vent、およびPabポリメラーゼの残基349およびVentポリメラーゼの残基351は、機能的に同等であり、位置的に同等である。同様に、例えば、9°N、Twa、KOD、およびPabポリメラーゼの残基633、PfuおよびDeep Ventポリメラーゼの残基634、およびVentポリメラーゼの残基636は、機能的に同等であり、位置的に同等である。当業者は、DNAポリメラーゼにおける機能的に等価な残基を容易に同定することができる。
【0043】
特定の実施形態において、置換変異は、非極性側鎖を有する残基への変異を含む。非極性側鎖を有するアミノ酸は、当該分野で周知であり、例えば、アラニン、グリシン、イソロイシン、ロイシン、メチオニン、フェニルアラニン、プロリン、トリプトファン、およびバリンが挙げられる。
【0044】
特定の実施形態において、置換変異は、極性側鎖を有する残基への変異を含む。極性側鎖を有するアミノ酸は、当該分野で周知であり、例えば、アルギニン、アスパラギン、アスパラギン酸、グルタミン、グルタミン酸、ヒスチジン、リジン、セリン、システイン、チロシン、およびスレオニンが挙げられる。
【0045】
特定の実施形態において、置換変異は、疎水性側鎖を有する残基への変異を含む。疎水性側鎖を有するアミノ酸は、当該分野で周知であり、例えば、グリシン、アラニン、バリン、ロイシン、イソロイシン、プロリン、フェニルアラニン、メチオニン、およびトリプトファンが挙げられる。
【0046】
特定の実施形態において、置換変異は、非荷電側鎖を有する残基への変異を含む。非荷電側鎖を有するアミノ酸は、当該分野で周知であり、例えば、グリシン、セリン、システイン、アスパラギン、グルタミン、チロシン、およびスレオニンが挙げられる。
【0047】
一実施形態では、改変されたポリメラーゼは、本明細書に開示される参照ポリメラーゼと構造的に類似(similar)であるアミノ酸配列を有する。一実施形態では、参照ポリメラーゼは、9°Nのアミノ酸配列(配列番号1)を含むものである。任意で、参照ポリメラーゼは、配列番号1に以下の置換変異を持つものである:Met129Ala、Asp141Ala、Glu143Ala、Cys223Ser、Leu408Ala、Tyr409Ala、Pro410Ile、およびAla485Val。置換変異Met129Ala、Asp141Ala、Glu143Ala、Cys223Ser、Leu408Ala、Tyr409Ala、Pro410Ile、およびAla485Valを持つ9°Nのアミノ酸配列(配列番号1)を有するポリメラーゼは、配列番号8で開示されており、また本明細書では、Pol 812ポリメラーゼとして参照される。他の参照配列としては、配列番号2、3、4、5、6、または7が挙げられる。任意で、参照ポリメラーゼは、配列番号2、3、4、5、6、または7に、配列番号1の以下の置換変異:Met129Ala、Asp141Ala、Glu143Ala、Cys223Ser、Leu408Ala、Tyr409Ala、Pro410Ile、およびAla485Valと機能的および位置的に等価な置換変異を持つものである。
【0048】
本明細書で使用される場合、改変ポリメラーゼのアミノ酸配列が、参照ポリメラーゼと比較して特定の量の配列類似性(similarity)および/または配列同一性を有する場合、改変されたポリメラーゼは、参照ポリメラーゼと「構造的に類似」であり得る。
【0049】
2つのアミノ酸配列の構造的類似性は、2つの配列(例えば、本明細書に記載の候補ポリメラーゼおよび参照ポリメラーゼ)の残基を整列させて、それらの配列の長さに沿って同一のアミノ酸の数を最適化することによって決定することができる;同一のアミノ酸の数を最適化するために、いずれかまたは両方の配列のギャップが、アラインメントの作成において許可されるが、それでも、各配列のアミノ酸は適切な順序のままでなければならない。候補ポリメラーゼは、参照ポリメラーゼと比較されているポリメラーゼである。参照ポリメラーゼおよびポリメラーゼ活性と構造的類似性を有する候補ポリメラーゼは、改変ポリメラーゼである。
【0050】
本明細書に別段の記載があるように改変されない限り、アミノ酸配列またはヌクレオチド配列のペアワイズ比較分析は、例えば、Smith&Waterman,Adv.Appl.Math.2:482(1981)の局所相同性アルゴリズムによって、Needleman&Wunsch,J.Mol.Biol.48:443(1970)の相同性アラインメントアルゴリズムによって、Pearson&Lipman,Proc.Nat’l.Acad.Sci.USA 85:2444(1988)の類似性方法のためのサーチによって、これらのアルゴリズムのコンピューター化された実装(Wisconsin Genetics Software Package,Genetics Computer Group,575 Science Dr.、マディソン、ウィスコンシン中のGAP、BESTFIT、FASTA、およびTFASTA)によって、または目視検査(概して、Current Protocols in Molecular Biology,Ausubel et al.編,Current Protocols、Greene Publishing Associates、Inc.およびJohn Wiley&Sons、Inc.の間の合弁、2004年までの補遺)によって実施することができる。
【0051】
構造的類似性を決定するのに適したアルゴリズムの一例は、BLASTアルゴリズムであり、Altschul et al.,J.Mol.Biol.215:403-410(1990)に記載される。BLAST分析を実施するためのソフトウェアは、国立バイオテクノロジー情報センターを通じて公衆に入手可能である。このアルゴリズムでは、最初に、クエリ配列で長さWの短いワードを同定することにより、データベース配列で同じ長さのワードと整列すると、正値の閾値スコアTと合致するか充足するかのいずれかである、高スコアのシーケンシングペア(HSP)を特定することを含む。Tは、近傍ワードスコア閾値と呼ばれる(Altschul et al.,J.Mol.Biol.215:403-410(1990))。これらの最初の近隣ワードヒットは、それらを含むより長いHSPを見つけるための検索を開始するためのシードとして作用する。次いで、ワードヒットは、累積アラインメントスコアを増やすことができる限り、各配列に沿って両方向に拡張される。累積スコアは、ヌクレオチド配列について、パラメーターM(合致する残基のペアの報酬スコア;常に>0)およびN(非合致の残基のペナルティスコア;常に<0)を使用して計算される。アミノ酸配列の場合、スコアリングマトリックスを使用して累積スコアを計算する。各方向へのワードヒットの拡張は、次の場合に中断される:累積アラインメントスコアが最大達成値から数量Xだけ低下する場合;1つ以上の負のスコアの残基アラインメントの蓄積により、累積スコアがゼロ以下になる場合;または、いずれかの配列の終結に到達する場合。BLASTアルゴリズムパラメーターW、T、およびXは、アラインメントの感度およびスピードを決定する。BLASTNプログラム(ヌクレオチド配列用)は、デフォルトとして、11のワード長(W)、10の期待値(E)、100のカットオフ、M=5、N=-4、および両鎖の比較を使用する。アミノ酸配列の場合、BLASTPプログラムはデフォルトとして、3のワード長(W)、10の期待値(E)、およびBLOSUM62スコアリングマトリックスを使用する(Henikoff&Henikoff(1989)Proc.Natl.Acad.Sci.USA89:10915を参照)。
【0052】
パーセント配列同一性を計算することに加えて、BLASTアルゴリズムはまた、2つの配列間の類似性の統計分析を実施する(例、Karlin&Altschul、Proc.Nat’l.Acad.Sci.USA 90:5873-5778(1993)を参照)。BLASTアルゴリズムによって提供される類似性の1つの尺度は、最小合計確率(P(N))であり、2つのヌクレオチドまたはアミノ酸配列間の合致が偶然に発生する確率の指標を提供する。例えば、テスト核酸と参照核酸との比較における最小合計確率が約0.1未満、より好ましくは約0.01未満、最も好ましくは約0.001未満である場合、核酸は参照配列に類似していると考慮される。
【0053】
2つのアミノ酸配列の比較において、構造的類似性は、パーセント「同一性」によって参照され得るか、またはパーセント「類似性」によって参照され得る。「同一性」とは、同一であるアミノ酸の存在を指す。「類似性」は、同一であるアミノ酸の存在だけでなく、保存的置換の存在も指す。タンパク質中のアミノ酸の保存的置換は、アミノ酸が属するクラスの他のメンバーから選択し得る。例えば、特定のサイズまたは特性(電荷、疎水性、または親水性等)を有するアミノ酸のグループに属するアミノ酸を、タンパク質の活性、特に生物学的活性に直接関連しないタンパク質の領域を変更することなく別のアミノ酸に置換することができることは、タンパク質生化学の分野で周知である。例えば、非極性アミノ酸としては、アラニン、グリシン、イソロイシン、ロイシン、メチオニン、フェニルアラニン、プロリン、トリプトファン、およびバリンが挙げられる。疎水性アミノ酸としては、グリシン、アラニン、バリン、ロイシン、イソロイシン、プロリン、フェニルアラニン、メチオニン、およびトリプトファンが挙げられる。極性アミノ酸としては、アルギニン、アスパラギン、アスパラギン酸、グルタミン、グルタミン酸、ヒスチジン、リジン、セリン、システイン、チロシン、およびスレオニンが挙げられる。非荷電アミノ酸としては、とりわけ、グリシン、セリン、システイン、アスパラギン、グルタミン、チロシン、およびスレオニンが挙げられる。
【0054】
したがって、本明細書で使用される場合、本明細書に記載の1つ以上の配列番号のアミノ酸配列への参照等の本明細書に記載のポリメラーゼへの参照は、参照ポリメラーゼに対して少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%のアミノ酸配列類似性を持つタンパク質を含み得る。
【0055】
あるいは、本明細書で使用される場合、本明細書に記載の1つ以上の配列番号のアミノ酸配列への参照等の本明細書に記載のポリメラーゼへの参照は、参照ポリメラーゼに対して少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%のアミノ酸配列同一性を持つのタンパク質を含み得る。
【0056】
本開示は、本明細書に記載の1つ以上の活性を有するポリメラーゼをもたらす変異のコレクションを記載する。本明細書に記載のポリメラーゼは、配列番号1または配列番号8等の参照ポリメラーゼと比較して任意の数の変異、例えば、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、または少なくとも18の変異を含み得る。同様に、本明細書に記載のポリメラーゼは、任意の組み合わせで変異を含み得る。例えば、表1は、本明細書に記載の変異の異なる組合せを含む特定の改変ポリメラーゼの例を示す。チェックマーク(レ)は、リストされた変異の存在を示す。リストされた変異、例えば、Y497G、F152G、V278L等は、配列番号1上の位置の変異である。
【0057】
【0058】
【0059】
本開示の改変ポリメラーゼは、9°Nポリメラーゼ(配列番号1)におけるTyr497と機能的に等価な位置での置換変異を含む。一実施形態では、Tyr497と機能的に等価な位置での置換変異は、非極性、疎水性、または非荷電アミノ酸、例えばGlyへの変異である。
【0060】
一実施形態では、改変ポリメラーゼは、9°Nポリメラーゼ(配列番号1)のPhe152と機能的に等価な位置での置換変異を含む。一実施形態では、Phe152と機能的に等価な位置での置換変異は、非極性、疎水性、または非荷電アミノ酸、例えばGlyへの変異である。
【0061】
一実施形態では、改変ポリメラーゼは、9°Nポリメラーゼ(配列番号1)のVal278と機能的に等価な位置での置換変異を含む。一実施形態では、Val278と機能的に等価な位置での置換変異は、非極性または疎水性アミノ酸、例えば、Leuへの変異である。
【0062】
一実施形態では、改変ポリメラーゼは、9°Nポリメラーゼ(配列番号1)のMet329と機能的に等価な位置での置換変異を含む。一実施形態では、Met329と機能的に等価な位置での置換変異は、極性アミノ酸、例えば、Hisへの変異である。
【0063】
一実施形態では、改変ポリメラーゼは、9°Nポリメラーゼ(配列番号1)のVal471と機能的に等価な位置での置換変異を含む。一実施形態では、Val471と機能的に等価な位置での置換変異は、極性または非荷電アミノ酸、例えば、Serへの変異である。
【0064】
一実施形態では、改変ポリメラーゼは、当該分野で公知であり、米国特許出願第2016/0032377号によって例示されるように、9°Nポリメラーゼ(配列番号1)中のThr514と機能的に等価な位置での置換変異を含む。一実施形態では、Thr514と機能的に等価な位置での置換変異は、非極性または疎水性アミノ酸、例えば、Alaへの変異である。いくつかの実施形態では、Thr514と機能的に等価な位置での非極性または疎水性アミノ酸と組み合わせて使用することができる他の置換変異としては、Phe152、Val278、M329、Val471、Lue631、Glu734、またはそれらの組み合わせが挙げられる。一実施形態では、Thr514と機能的に等価な位置での置換変異は、極性または非荷電アミノ酸、例えば、Serである。いくつかの実施形態では、Thr514と機能的に等価な位置で極性または非荷電アミノ酸と組み合わせて使用することができる他の置換変異としては、Lys476、Lys477、Ile521、Thr590、またはそれらの組み合わせが挙げられる。
【0065】
一実施形態では、改変ポリメラーゼは、9°Nポリメラーゼ(配列番号1)のLeu631と機能的に等価な位置での置換変異を含む。一実施形態では、Leu631と機能的に等価な位置での置換変異は、非極性または疎水性アミノ酸、例えば、Metへの変異である。
【0066】
一実施形態では、改変ポリメラーゼは、9°Nポリメラーゼ(配列番号1)のGlu734と機能的に等価な位置での置換変異を含む。一実施形態では、Glu734と機能的に等価な位置での置換変異は、極性または非荷電アミノ酸、例えば、Argへの変異である。
【0067】
一実施形態では、改変ポリメラーゼは、9°Nポリメラーゼ(配列番号1)のLys476と機能的に等価な位置での置換変異を含む。一実施形態では、Lys476と機能的に等価な位置での置換変異は、疎水性アミノ酸の非極性、例えば、Trpへの変異である。
【0068】
一実施形態では、改変ポリメラーゼは、当該分野で知られており、米国特許第9,765,309号の開示によって例示されるように、9°Nポリメラーゼ(配列番号1)のLys477と機能的に等価な位置での置換変異を含む。一実施形態では、Lys477と機能的に等価な位置での置換変異は、非極性または疎水性アミノ酸、例えば、Metへの変異である。
【0069】
一実施形態では、改変ポリメラーゼは、当該分野で公知であり、米国特許出願第2016/0032377号によって例示されるように、9°Nポリメラーゼ(配列番号1)のIle521と機能的に等価な位置での置換変異を含む。一実施形態では、Ile521と機能的に等価な位置での置換変異は、非極性アミノ酸、例えば、Leuへの変異である。
【0070】
一実施形態では、改変ポリメラーゼは、9°Nポリメラーゼ(配列番号1)のThr590と機能的に等価な位置での置換変異を含む。一実施形態では、Thr590と機能的に等価な位置での置換変異は、非極性または疎水性アミノ酸、例えばIleへの変異である。
【0071】
一実施形態では、改変ポリメラーゼは、9°Nポリメラーゼ(配列番号1)のArg247と機能的に等価な位置での置換変異を含む。一実施形態では、Arg247と機能的に等価な位置での置換変異は、非極性または非荷電アミノ酸、例えば、Tyrへの変異である。
【0072】
一実施形態では、改変ポリメラーゼは、9°Nポリメラーゼ(配列番号1)のGlu599と機能的に等価な位置での置換変異を含む。一実施形態では、Glu599と機能的に等価な位置での置換変異は、極性または非荷電アミノ酸、例えば、Aspへの変異である。
【0073】
一実施形態では、改変ポリメラーゼは、9°Nポリメラーゼ(配列番号1)のLys620と機能的に等価な位置での置換変異を含む。一実施形態では、Lys620と機能的に等価な位置での置換変異は、極性または非荷電アミノ酸、例えば、Argへの変異である。
【0074】
一実施形態では、改変ポリメラーゼは、9°Nポリメラーゼ(配列番号1)のHis633と機能的に等価な位置での置換変異を含む。一実施形態では、His633と機能的に等価な位置での置換変異は、非極性、疎水性、または非荷電アミノ酸、例えばGlyへの変異である。
【0075】
一実施形態では、改変ポリメラーゼは、9°Nポリメラーゼ(配列番号1)のVal661と機能的に等価な位置での置換変異を含む。一実施形態では、Val661と機能的に等価な位置での置換変異は、極性または非荷電アミノ酸、例えば、Aspへの変異である。
【0076】
一実施形態では、改変ポリメラーゼは、アミノ酸Met129、Asp141、Glu143、Cys223、Lys408、Tyr409、Pro410、Ala485、またはそれらの組み合わせと機能的に等価な位置での少なくとも1つの置換変異を含む。一実施形態では、Met129、Asp141、Glu143、Lys408、またはTyr409と機能的に等価な位置での置換変異は、非極性または疎水性アミノ酸、例えば、Alaへの変異である。一実施形態では、Cys223と機能的に等価な位置での置換変異は、極性または非荷電アミノ酸、例えばSerへの変異である。一実施形態では、Pro410と機能的に等価な位置での置換変異は、非極性または疎水性アミノ酸、例えばIleへの変異である。一実施形態では、Ala485と機能的に等価な位置での置換変異は、非極性または疎水性アミノ酸、例えばValへの変異である。
【0077】
一実施形態では、改変ポリメラーゼは、9°N DNAポリメラーゼアミノ酸配列中の、Tyr497と機能的に等価な位置でのアミノ酸置換変異およびPhe152、Val278、Met329、Val471、Thr514、Leu631、およびGlu734から選択されるアミノ酸と機能的に等価な位置での少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、または7つのアミノ酸置換変異を含む。一実施形態では、改変ポリメラーゼはまた、9°N DNAポリメラーゼアミノ酸配列中のアミノ酸Met129、Asp141、Glu143、Cys223、Leu408、Tyr409、Pro410、およびAla485と機能的に等価な位置でのアミノ酸置換変異を含む。
【0078】
一実施形態では、改変ポリメラーゼは、9°N DNAポリメラーゼアミノ酸配列中の、Tyr497と機能的に等価な位置でのアミノ酸置換変異およびLys476、Lys477、Thr514、Ile521、およびThr590から選択されるアミノ酸と機能的に等価な位置での少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または5つのアミノ酸置換変異を含む。一実施形態では、改変ポリメラーゼはまた、9°N DNAポリメラーゼアミノ酸配列中のアミノ酸Met129、Asp141、Glu143、Cys223、Leu408、Tyr409、Pro410、およびAla485と機能的に等価な位置でのアミノ酸置換変異を含む。
【0079】
一実施形態では、改変ポリメラーゼは、9°N DNAポリメラーゼアミノ酸配列中の、Tyr497と機能的に等価な位置でのアミノ酸置換変異およびArg247、Glu599、Lys620、His633、およびVal661から選択されるアミノ酸と機能的に等価な位置での少なくとも2、少なくとも3、少なくとも4、または5つのアミノ酸置換変異を含む。一実施形態では、改変ポリメラーゼはまた、9°N DNAポリメラーゼアミノ酸配列中のアミノ酸Met129、Asp141、Glu143、Cys223、Leu408、Tyr409、Pro410、およびAla485と機能的に等価な位置でのアミノ酸置換変異を含む。
【0080】
一実施形態では、改変ポリメラーゼは、9°N DNAポリメラーゼアミノ酸配列中の、Tyr497と機能的に等価な位置でのアミノ酸置換変異、Phe152、Val278、Met329、Val471、Thr514、Leu631、またはGlu734と機能的に等価な位置での少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、または7つのアミノ酸置換変異、および(iii)9°N DNAポリメラーゼアミノ酸配列中のLys476、Lys477、Thr514、Ile521、またはThr590と機能的に等価な位置での少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または5つのアミノ酸置換変異を含む。一実施形態では、改変ポリメラーゼはまた、9°N DNAポリメラーゼアミノ酸配列中のアミノ酸Met129、Asp141、Glu143、Cys223、Leu408、Tyr409、Pro410、およびAla485と機能的に等価な位置でのアミノ酸置換変異を含む。
【0081】
一実施形態では、改変ポリメラーゼは、Tyr497と機能的に等価な位置でのアミノ酸置換変異、9°N DNAポリメラーゼアミノ酸配列中のPhe152、Val278、Met329、Val471、Thr514、Leu631、およびGlu734から選択されるアミノ酸と機能的に等価な位置での少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、または7つのアミノ酸置換変異、および9°N DNAポリメラーゼアミノ酸配列中のArg247、Glu599、Lys620、His633、またはVal661から選択されたアミノ酸と機能的に等価な位置での少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つまたは5つのアミノ酸置換変異を含む。一実施形態では、改変ポリメラーゼはまた、9°N DNAポリメラーゼアミノ酸配列中のアミノ酸Met129、Asp141、Glu143、Cys223、Leu408、Tyr409、Pro410、およびAla485と機能的に等価な位置でのアミノ酸置換変異を含む。
【0082】
一実施形態では、改変ポリメラーゼは、Tyr497と機能的に等価な位置でのアミノ酸置換変異、9°N DNAポリメラーゼアミノ酸配列中のLys476、Lys477、Thr514、Ile521、またはThr590から選択されるアミノ酸と機能的に等価な位置での少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または5つのアミノ酸置換変異、および9°N DNAポリメラーゼアミノ酸配列中のArg247、Glu599、Lys620、His633、またはVal661から選択されたアミノ酸と機能的に等価な位置での少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または5つのアミノ酸置換変異を含む。実施形態では、改変ポリメラーゼはまた、9°N DNAポリメラーゼアミノ酸配列中のアミノ酸Met129、Asp141、Glu143、Cys223、Leu408、Tyr409、Pro410、およびAla485と機能的に等価な位置でのアミノ酸置換変異を含む。
【0083】
一実施形態では、改変ポリメラーゼは、Tyr497と機能的に等価な位置でのアミノ酸置換変異、9°N DNAポリメラーゼアミノ酸配列中のPhe152、Val278、Met329、Val471、Leu631、およびGlu734から選択されるアミノ酸と機能的に等価な位置での少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、または6つのアミノ酸置換変異、9°N DNAポリメラーゼアミノ酸配列中のLys476、Lys477、Thr514、Ile521、またはThr590から選択されるアミノ酸と機能的に等価な位置での少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または5つのアミノ酸置換変異、および9°N DNAポリメラーゼアミノ酸配列中のArg247、Glu599、Lys620、His633、またはVal661から選択されるアミノ酸と機能的に等価な位置での少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または5つのアミノ酸置換変異を含む。一実施形態では、改変ポリメラーゼはまた、9°N DNAポリメラーゼアミノ酸配列中のアミノ酸Met129、Asp141、Glu143、Cys223、Leu408、Tyr409、Pro410、およびAla485と機能的に等価な位置でのアミノ酸置換変異を含む。
【0084】
改変ポリメラーゼの特定の例としては、Pol 1550(配列番号10)、Pol 1558(配列番号11)、Pol 1563(配列番号12)、Pol 1565(配列番号13)、Pol 1630(配列番号14)、Pol 1634(配列番号15)、Pol 1641(配列番号16)、Pol 1573(配列番号17)、Pol 1576(配列番号18)、Pol 1584(配列番号19)、Pol 1586(配列番号20)、Pol 1601(配列番号21)、Pol 1611(配列番号22)、Pol 1671(配列番号23)、Pol 1677(配列番号24)、Pol 1682(配列番号25)、Pol 1680(配列番号27)、Pol 1745(配列番号28)、Pol 1758(配列番号29)、Pol 1761(配列番号30)、Pol 1762(配列番号31)、Pol 1765(配列番号32)、Pol 1769(配列番号33)、およびPol 1770(配列番号34)が挙げられる。
【0085】
本明細書に記載の改変ポリメラーゼは、ポリメラーゼ活性に影響を与えることが知られている追加の変異を含み得る。そのような置換では、変異は、9°Nポリメラーゼ(配列番号1)のArg713と機能的に等価な位置でのものである。減少したエキソヌクレアーゼ活性の結果を生じることが知られている1つ以上の位置での種々の置換変異のいずれかを、当該分野で公知であるように行うことができ、米国特許第8,623,628号に例示される。一実施形態では、位置Arg713での置換変異は、非極性、疎水性、または非荷電アミノ酸、例えば、Gly、Met、またはAlaへの変異である。
【0086】
一実施形態では、改変ポリメラーゼは、当該分野で公知であるように当該分野で公知であるように、Arg743またはLys705と機能的に等価な位置での置換変異を含み、米国特許第8,623,628号の開示に例示される。一実施形態では、位置Arg743またはLys705での置換変異は、非極性または疎水性アミノ酸、例えば、Alaへの変異である。
【0087】
本開示はまた、本明細書に記載の改変ポリメラーゼを含む組成物を提供する。組成物は、改変ポリメラーゼに加えて他の成分を含むことができる。例えば、組成物は、バッファー、ヌクレオチド溶液、またはそれらの組合せを含むことができる。ヌクレオチド溶液は、ラベル化、合成、修飾、またはそれらの組合せをされたヌクレオチド類等のヌクレオチド類を含むことができる。一実施形態では、組成物は、標的核酸のライブラリー等の標的核酸を含む。
【0088】
(ポリメラーゼへの変異導入)
種々のタイプの変異導入が、例えば、上記のようなポリメラーゼモデルおよびモデル予測に従って、またはランダムまたはセミランダム変異アプローチを使用して、例えば、ポリメラーゼを改変して変異体を生成するために、本開示において任意で使用される。概して、利用可能な任意の変異導入手順を、ポリメラーゼ変異体を作製するために使用することができる。そのような変異導入手順は、目的の1つ以上の活性(例、減少したピロリン酸分解、増加した代謝回転、例えば、所定のヌクレオチドアナログについてのもの)のための変異体核酸およびポリペプチドの選択を任意で含む。使用することができる手順としては、以下が挙げられる:部位特異的点変異導入、ランダム点変異導入、インビトロまたはインビボ相同組換え(DNAシャッフリングおよびコンビナトリアルオーバーラップPCR)、ウラシル含有テンプレートを使用した変異導入、オリゴヌクレオチド特異的変異導入、ホスホロチオエート修飾DNA変異導入、ギャップ化デュプレックスDNAを使用した変異導入、ポイントミスマッチ修復、修復欠損宿主株を使用した変異導入、制限選択および制限精製、欠失変異導入、全遺伝子合成による変異導入、縮重PCR、二本鎖切断修復、および当業者に公知の他の多く。変異の開始ポリメラーゼは、例えば、米国特許第8,460,910号および米国特許第8,623,628号中で同定されたもの等の利用可能なポリメラーゼ変異体を含み、本明細書に記載のいずれかであり得、これらのそれぞれは、参照によりその全体が組み込まれる。
【0089】
任意で、変異導入は、天然に生じるポリメラーゼ分子からの公知情報、または公知の改変もしくは変異されたポリメラーゼ(例、既存の変異ポリメラーゼを使用する)、例えば、上で考察したような、配列、配列比較、物性、結晶構造等によって案内され得る。しかしながら、別のクラスの実施形態では、修飾は本質的にランダムであり得る(例えば、古典的または「ファミリー」DNAシャッフリングのように、例えば、Crameri et al. (1998) ”DNA shuffling of a family of genes from diverse species accelerates directed evolution” Nature 391:288-291を参照)。
【0090】
変異フォーマットに関する追加情報は、以下に見いだされる:Sambrook et al., Molecular Cloning--A Laboratory Manual (3rd Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y., 2000 (”Sambrook”); Current Protocols in Molecular Biology, F. M. Ausubel et al., eds., Current Protocols, a joint venture between Greene Publishing Associates, Inc. and John Wiley & Sons, Inc., (supplemented through 2011) (”Ausubel”)) and PCR Protocols A Guide to Methods and Applications (Innis et al. eds) Academic Press Inc. San Diego, Calif. (1990) (”Innis”)。以下に引用される参考文献は、変異の形式に関する追加の詳細を提供する:Arnold, Protein engineering for unusual environments, Current Opinion in Biotechnology 4:450-455 (1993); Bass et al., Mutant Trp repressors with new DNA-binding specificities, Science 242:240-245 (1988); Bordo and Argos (1991) Suggestions for ”Safe” Residue Substitutions in Site-directed Mutagenesis 217:721-729; Botstein & Shortle, Strategies and applications of in vitro mutagenesis, Science 229:1193-1201 (1985); Carter et al., Improved oligonucleotide site-directed mutagenesis using M13 vectors, Nucl. Acids Res. 13: 4431-4443 (1985); Carter, Site-directed mutagenesis, Biochem. J. 237:1-7 (1986); Carter, Improved oligonucleotide-directed mutagenesis using M13 vectors, Methods in Enzymol. 154: 382-403 (1987); Dale et al., Oligonucleotide-directed random mutagenesis using the phosphorothioate method, Methods Mol. Biol. 57:369-374 (1996); Eghtedarzadeh & Henikoff, Use of oligonucleotides to generate large deletions, Nucl. Acids Res. 14: 5115 (1986); Fritz et al., Oligonucleotide-directed construction of mutations: a gapped duplex DNA procedure without enzymatic reactions in vitro, Nucl. Acids Res. 16: 6987-6999 (1988); Grundstrom et al., Oligonucleotide-directed mutagenesis by microscale `shot-gun` gene synthesis, Nucl. Acids Res. 13: 3305-3316 (1985); Hayes (2002) Combining Computational and Experimental Screening for rapid Optimization of Protein Properties PNAS 99(25) 15926-15931; Kunkel, The efficiency of oligonucleotide directed mutagenesis, in Nucleic Acids & Molecular Biology (Eckstein, F. and Lilley, D. M. J. eds., Springer Verlag, Berlin)) (1987); Kunkel, Rapid and efficient site-specific mutagenesis without phenotypic selection, Proc. Natl. Acad. Sci. USA 82:488-492 (1985); Kunkel et al., Rapid and efficient site-specific mutagenesis without phenotypic selection, Methods in Enzymol. 154, 367-382 (1987); Kramer et al., The gapped duplex DNA approach to oligonucleotide-directed mutation construction, Nucl. Acids Res. 12: 9441-9456 (1984); Kramer & Fritz Oligonucleotide-directed construction of mutations via gapped duplex DNA, Methods in Enzymol. 154:350-367 (1987); Kramer et al., Point Mismatch Repair, Cell 38:879-887 (1984); Kramer et al., Improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed construction of mutations, Nucl. Acids Res. 16: 7207 (1988); Ling et al., Approaches to DNA mutagenesis: an overview, Anal Biochem. 254(2): 157-178 (1997); Lorimer and Pastan Nucleic Acids Res. 23, 3067-8 (1995); Mandecki, Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli: a method for site-specific mutagenesis, Proc. Natl. Acad. Sci. USA, 83:7177-7181(1986); Nakamaye & Eckstein, Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application to oligonucleotide-directed mutagenesis, Nucl. Acids Res. 14: 9679-9698 (1986); Nambiar et al., Total synthesis and cloning of a gene coding for the ribonuclease S protein, Science 223: 1299-1301(1984); Sakamar and Khorana, Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein (transducin), Nucl. Acids Res. 14: 6361-6372 (1988); Sayers et al., Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis, Nucl. Acids Res. 16:791-802 (1988); Sayers et al., Strand specific cleavage of phosphorothioate-containing DNA by reaction with restriction endonucleases in the presence of ethidium bromide, (1988) Nucl. Acids Res. 16: 803-814; Sieber, et al., Nature Biotechnology, 19:456-460 (2001); Smith, In vitro mutagenesis, Ann. Rev. Genet. 19:423-462 (1985); Methods in Enzymol. 100: 468-500 (1983); Methods in Enzymol. 154: 329-350 (1987); Stemmer, Nature 370, 389-91(1994); Taylor et al., The use of phosphorothioate-modified DNA in restriction enzyme reactions to prepare nicked DNA, Nucl. Acids Res. 13: 8749-8764 (1985); Taylor et al., The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified DNA, Nucl. Acids Res. 13: 8765-8787 (1985); Wells et al., Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin, Phil. Trans. R. Soc. Lond. A 317: 415-423 (1986); Wells et al., Cassette mutagenesis: an efficient method for generation of multiple mutations at defined sites, Gene 34:315-323 (1985); Zoller & Smith, Oligonucleotide-directed mutagenesis using M 13-derived vectors: an efficient and general procedure for the production of point mutations in any DNA fragment,
Nucleic Acids Res. 10:6487-6500 (1982); Zoller & Smith, Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13 vectors, Methods in Enzymol. 100:468-500 (1983); Zoller & Smith, Oligonucleotide-directed mutagenesis: a simple method using two oligonucleotide primers and a single-stranded DNA template, Methods in Enzymol. 154:329-350 (1987); Clackson et al. (1991) ”Making antibody fragments using phage display libraries” Nature 352:624-628; Gibbs et al. (2001) ”Degenerate oligonucleotide gene shuffling (DOGS): a method for enhancing the frequency of recombination with family shuffling” Gene 271:13-20;およびHiraga and Arnold (2003) ”General method for sequence-independent site-directed chimeragenesis: J. Mol. Biol. 330:287-296。上記の方法の多くに関する追加の詳細は、Methods in Enzymology Volume 154に見いだすことができ、種々の変異導入方法が持つトラブルシューティング問題についての有用なコントロールについても記載している。
【0091】
(組換えポリメラーゼの作製および単離)
概して、本明細書に提示されるようなポリメラーゼをコードする核酸は、クローニング、組換え、インビトロ合成、インビトロ増幅、および/または他の利用可能な方法によって作製することができる。本明細書に提示されるようなポリメラーゼをコードする発現ベクターを発現させるために、種々の組換え法を使用することができる。組換え核酸を作製するための方法、発現された産物の発現および単離は、当該分野で周知であり、記載されている。多数の例示的な変異および変異の組み合わせ、ならびに望ましい変異を設計するための戦略は、本明細書に記載されている。ヌクレオチドアナログによるアクセスの改善を可能にするために活性部位内またはその近くの立体的特徴を改変することを含む、ポリメラーゼの活性部位における変異を作成および選択するための方法は、本明細書および例えば、国際公開第WO2007/076057号および国際公開第2008/051530号に見出される。
【0092】
変異、組換えおよびインビトロ核酸操作法(クローニング、発現、PCR等を含む)に関する追加の有用な参考文献としては、以下が挙げられる。Berger and Kimmel, Guide to Molecular Cloning Techniques, Methods in Enzymology volume 152 Academic Press, Inc., San Diego, Calif. (Berger); Kaufman et al. (2003) Handbook of Molecular and Cellular Methods in Biology and Medicine Second Edition Ceske (ed) CRC Press (Kaufman); The Nucleic Acid Protocols Handbook Ralph Rapley (ed) (2000) Cold Spring Harbor, Humana Press Inc (Rapley); Chen et al. (ed) PCR Cloning Protocols, Second Edition (Methods in Molecular Biology, volume 192) Humana Press;およびin Viljoen et al. (2005) Molecular Diagnostic PCR Handbook Springer, ISBN 1402034032
【0093】
また、プラスミドまたは他の関連する核酸を細胞から精製するためのキットが多数市販されている(例えば、両方ともPharmacia BiotechからのEasyPrep(商標)およびFlexiPrep(商標)、StratageneからのStrataClean(商標)、およびQiagenからのQIAprep(商標)を参照)。任意の単離および/または精製された核酸は、他の核酸を生成するためにさらに操作され、細胞をトランスフェクトするために使用され、発現のために生物に感染するために関連するベクターに組み込まれる等をされ得る。典型的なクローニングベクターは、転写および翻訳ターミネーター、転写および翻訳開始配列、ならびに特定の標的核酸の発現の調節に有用なプロモーターを含む。ベクターは、少なくとも1つの独立したターミネーター配列、真核生物、または原核生物、あるいはその両方におけるカセットの複製を可能にする配列(例えば、シャトルベクター)、および原核生物と真核生物の両方のシステムの選択マーカーを含む一般的な発現カセットを任意で含む。ベクターは、原核生物、真核生物、またはその両方での複製および移入に適する。
【0094】
他の有用な参考文献、例えば細胞の単離および培養(例えば、その後の核酸の単離)としては、以下が挙げられる。Freshney (1994) Culture of Animal Cells, a Manual of Basic Technique, third edition, Wiley-Liss, New Yorkおよびそれに引用される参考文献; Payne et al. (1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc. New York, N.Y.; Gamborg and Phillips (eds) (1995) Plant Cell, Tissue and Organ Culture; Fundamental Methods Springer Lab Manual, Springer-Verlag (Berlin Heidelberg New York); and Atlas and Parks (eds) The Handbook of Microbiological Media (1993) CRC Press, Boca Raton, Fla
【0095】
本開示はまた、本明細書に開示される改変されたポリメラーゼをコードする核酸を含む。特定のアミノ酸は、複数のコドンによってコードされ得、特定の翻訳システム(例、原核生物または真核生物の細胞)はしばしばコドンバイアスを呈し、例えば、異なる生物体は、同じアミノ酸をコードするいくつかの同義コドンのうちの1つをしばしば好む。したがって、本明細書に提示される核酸は、任意で「コドン最適化」され、ポリメラーゼを発現するために使用される特定の翻訳システムによって好ましいコドンを含むように核酸が合成されることを意味する。例えば、細菌細胞(または特定の細菌株ですら)中でポリメラーゼを発現させることが望ましい場合、核酸は、ポリメラーゼの効率的な発現のために、その細菌細胞のゲノムで最も頻繁に見られるコドンを含むように合成され得る。真核細胞でポリメラーゼを発現することが望ましい場合、例えば、核酸がその真核細胞によって好ましいコドンを含み得る場合、同様の戦略を採用することができる。
【0096】
種々のタンパク質の単離および検出方法は、公知であり、ポリメラーゼを、例えば、本明細書に提示される組換えポリメラーゼを発現する細胞の組換え培養物から単離するために使用することができる。種々のタンパク質の単離および検出方法は、当該分野で周知であり、例えば、R.Scopes,Protein Purification,Springer-Verlag,N.Y.(1982);Deutscher,Methods in Enzymology Vol.182:Guide to Protein Purification,Academic Press,Inc.N.Y.(1990);Sandana(1997)Bioseparation of Proteins,Academic Press,Inc.;Bollag et al.(1996)Protein Methods,2nd Edition Wiley-Liss,NY;Walker(1996)The Protein Protocols Handbook Humana Press,NJ,Harris and Angal(1990)Protein Purification Applications:A Practical Approach IRL Press at Oxford,Oxford,England;Harris and Angal Protein Purification Methods:A Practical Approach IRL Press at Oxford,Oxford,England;Scopes(1993)Protein Purification:Principles and Practice 3rd Edition Springer Verlag,NY;Janson and Ryden(1998)Protein Purification:Principles,High Resolution Methods and Applications,Second Edition Wiley-VCH,NY;およびWalker(1998)Protein Protocols on CD-ROM Humana Press,NJ;ならびにこれらに引用される参考文献に示されるものが挙げられる。タンパク質の精製および検出方法に関する追加の詳細は、Satinder Ahuja ed.,Handbook of Bioseparations,Academic Press(2000)に見いだすことができる。
【0097】
(使用方法)
本明細書に提示される改変ポリメラーゼは、合成によるシーケンシング(sequencing-by-synthesis:SBS)技術等のシーケンシング手順で使用することができる。簡単に言えば、SBSは、標的核酸を1つ以上のヌクレオチド類(例えば、ラベル化、合成、修飾、またはそれらの組み合わせ)、DNAポリメラーゼ等と接触させることによって開始することができる。プライマーが標的核酸をテンプレートとして使用して伸長されるこれらの特徴は、検出することができるラベル化ヌクレオチドを取り込むであろう。シーケンシングランに使用される取込み時間は、本明細書に記載の改変ポリメラーゼを使用して大幅に減少することができる。任意で、ラベル化ヌクレオチド類は、いったんヌクレオチドがプライマーに添加さてしまうと、さらなるプライマー伸長を終結させる可逆的終結特性をさらに含むことができる。例えば、可逆的ターミネーター部分を有するヌクレオチドアナログは、脱ブロッキング剤が送達されて当該部分を除去するまでその後の伸長が起こり得ないように、プライマーに添加することができる。したがって、可逆的終結を使用する実施形態について、脱ブロッキング試薬をフローセルに送達することができる(検出が行われる前または後に)。洗浄は、種々の送達ステップの間に実施することができる。次いで、このサイクルをn回繰り返して、プライマーをn個のヌクレオチド類により延長させ、それによってn個の長さの配列を検出することができる。本開示の方法によって生成されたアレイを使用して容易に適合させることができる例示的なSBS手順、流体システム、および検出プラットフォームは、例えば、Bentley et al.,Nature 456:53-59(2008);国際公開第04/018497号;国際公開第91/06678号;国際公開第07/123744号;米国特許第7,057,026号、同第7,329,492号、同第7,211,414号、同第7,315,019号、同第7,405,281号、および同第8,343,746号に記載されている。
【0098】
パイロシーケンシング等の周期的反応を使用する他のシーケンシング手順を使用することができる。パイロシーケンシングは、特定のヌクレオチド類が新生核酸鎖に取り込まれる際に無機ピロリン酸(PPi)の解放を検出する(Ronaghi,et al.,Analytical Biochemistry 242(1),84-9(1996);Ronaghi,Genome Res.11(1),3-11(2001);Ronaghi et al.Science 281(5375),363(1998);米国特許第6,210,891号;同第6,258,568号および同第6,274,320号)。パイロシーケンシングでは、放出されたPPiは、ATPスルフリラーゼによってアデノシン三リン酸(ATP)に変換されることで検出することができ、結果として生じるATPは、ルシフェラーゼで生成された光子を介して検出することができる。したがって、シーケンシング反応は、発光検出システムを介して監視することができる。蛍光ベースの検出システムに使用される励起放射線源は、パイロシーケンシング手順のためには必要でない。本開示のアレイへのパイロシーケンシングの適用に使用することができる有用な流体システム、検出器、および手順は、例えば、国際公開第2012/058096号、米国特許出願公開第2005/0191698A1号、米国特許第7,595,883号および同第7,244,559号に記載されている。
【0099】
いくつかの実施形態は、DNAポリメラーゼ活性のリアルタイムモニタリングを含む方法を使用することができる。例えば、ヌクレオチドの取込みは、フルオロフォアを含むポリメラーゼとγ-リン酸ラベル化ヌクレオチド類との間の蛍光共鳴エネルギー移動(FRET)相互作用を介して、またはゼロモード導波路を用いて検出することができる。FRETベースのシーケンシングのための技術および試薬は、例えば、Levene et al.Science 299,682-686(2003);Lundquist et al.Opt.Lett.33,1026-1028(2008);Korlach et al.Proc.Natl.Acad.Sci.USA 105,1176-1181(2008)に記載されている。
【0100】
いくつかのSBS実施形態は、ヌクレオチドが伸長産物に取り込まれると放出されるプロトンの検出を含む。例えば、放出されたプロトンの検出に基づくシーケンシングは、Ion Torrent(Guilford、CT、Life Technologiesの子会社)から市販されている電気検出器および関連技術、または米国特許第8,262,900号、同第7,948,015号、同8,349,167号、および米国公開特許出願番号第2010/0137143A1号に記載されるシーケンシング方法およびシステムを使用することができる。
【0101】
したがって、本明細書に提示されるのは、以下の成分が相互作用することを可能にすることを含む、ヌクレオチドアナログをDNAに取り込ませるの方法である:(i)上記実施形態のいずれかに従っての改変ポリメラーゼ、(ii)DNAテンプレート;および(iii)ヌクレオチド溶液。特定の実施形態では、DNAテンプレートは、クラスター化アレイを含む。特定の実施形態において、ヌクレオチド類は、3’糖ヒドロキシルにて修飾され、3’糖ヒドロキシルにて修飾を含み、その結果、置換基が、天然に生じる3’ヒドロキシル基よりもサイズが大きくなる。
【0102】
(改変ポリメラーゼをコードする核酸)
本開示はまた、本明細書に記載の改変ポリメラーゼをコードする核酸分子を含む。アミノ酸配列、好ましくはポリメラーゼをコードする野生型ヌクレオチド配列も公知であるポリメラーゼの変異体バージョンである任意の改変ポリメラーゼについて、分子生物学の基本原理に従って変異体をコードするヌクレオチド配列を得ることが可能である。例えば、9°Nポリメラーゼをコードする野生型ヌクレオチド配列が公知である場合、標準的遺伝暗号を使用して、1つ以上のアミノ酸置換を有する任意の所定の9°Nの変異体バージョンをコードするヌクレオチド配列を推定することが可能である。同様に、ヌクレオチド配列は、例えば、Vent(登録商標)ポリメラーゼ、Deep Vent(登録商標)ポリメラーゼ、Pfuポリメラーゼ、KODポリメラーゼ、Pabポリメラーゼ等の他のポリメラーゼの変異体バージョンについて容易に導き出すことができる。次いで、必要なヌクレオチド配列を有する核酸分子は、当技術分野で公知の標準的な分子生物学技術を使用して構築し得る。
【0103】
本明細書に提示される実施形態によれば、定義された核酸は、同一の核酸のみならず、とりわけ保存的アミノ酸置換における縮重コードによって同義コドン(同じアミノ酸残基を特定する異なるコドン)の結果を生じる場合の置換が挙げられる、任意のマイナーな塩基バリエーションも含む。「核酸配列」の用語はまた、塩基バリエーションに関して与えられた任意の一本鎖配列に対する相補的配列を含む。
【0104】
本明細書に記載の核酸分子はまた、有利には、適した宿主中でそこからコードされるポリメラーゼタンパク質を発現するための適した発現ベクター中に含まれ得る。当該細胞のその後の形質転換および形質転換細胞のその後の選択のための適切な発現ベクター中へのクローン化DNAの取込みは、Sambrook et al.(1989),Molecular cloning:A Laboratory Manual,Cold Spring Harbor Laboratoryに提供されるように当業者に周知である。
【0105】
そのような発現ベクターは、当該DNAフラグメントの発現を有効化することが可能である、プロモーター領域等の調節配列に作動可能に連結された、本明細書に提示される実施形態による核酸を有するベクターを含む。「作動可能に連結された」の用語は、記載された構成要素がそれらが意図された方法で機能することを可能にする関係にある並置を指す。そのようなベクターは、本明細書に提示される実施形態にしたがってタンパク質の発現を提供するために適した宿主細胞に形質転換され得る。
【0106】
核酸分子は、成熟タンパク質またはプロ配列を有するタンパク質をコードし得、宿主細胞によって次いで切断されて成熟タンパク質を形成するプレタンパク質上のリーダー配列をコードするものが含まれる。ベクターは、例えば、複製起点、および任意で当該ヌクレオチドの発現のためのプロモーターおよび任意でプロモーターのレギュレーターを備えたプラスミド、ウイルスまたはファージベクターであり得る。ベクターは、例えば、抗生物質耐性遺伝子等の1つ以上の選択可能マーカーを含み得る。
【0107】
発現に必要な調節エレメントとしては、RNAポリメラーゼに結合し、適切なレベルの転写開始を指示するプロモーター配列およびリボソーム結合のための翻訳開始配列が挙げられる。例えば、細菌発現ベクターは、lacプロモーター等のプロモーターを含み得、翻訳開始のために、Shine-Dalgarno配列および開始コドンAUGを含み得る。同様に、真核生物の発現ベクターは、RNAポリメラーゼIIの異種または同種プロモーター、下流ポリアデニル化シグナル、開始コドンAUG、およびリボソーム脱離のための終止コドンを含み得る。そのようなベクターは、商業的に入手するか、または当該分野で周知の方法によって記載される配列から組み立てることができる。
【0108】
高等真核生物によるポリメラーゼをコードするDNAの転写は、ベクター中にエンハンサー配列を含ませることによって最適化することができる。エンハンサーは、転写のレベルを増大させるためにプロモーターに作用するDNAのシス作用エレメントである。ベクターは、概して選択可能マーカーに加えて複製起点も含むであろう。
【0109】
本開示はまた、ヌクレオチド取込み反応を実施するためのキットを提供する。キットは、本明細書に記載の少なくとも1つの改変ポリメラーゼおよび少なくとも1つのヌクレオチド取込み反応に十分な量の適切な包装材料中のヌクレオチド溶液を含む。任意で、改変ポリメラーゼおよびヌクレオチド溶液を使用するために必要なバッファーおよび溶液等の他の試薬も含まれる。パッケージ化されたコンポーネントの指示書も、典型的に含まれる。
【0110】
特定の実施形態では、ヌクレオチド溶液は、ラベル化ヌクレオチド類を含む。特定の実施形態では、ヌクレオチド類は、合成ヌクレオチドである。特定の実施形態では、ヌクレオチド類は、修飾ヌクレオチド類である。特定の実施形態において、修飾ヌクレオチドは、置換基が天然に生じる3’ヒドロキシル基よりもサイズが大きくなるように、3’糖ヒドロキシルにて修飾されている。特定の実施形態において、修飾ヌクレオチド類は、プリンまたはピリミジン塩基と、それに共有結合的に接合した除去可能な3’-OHブロッキング基を有するリボースもしくはデオキシリボース糖部分とを含む修飾ヌクレオチドまたはヌクレオシド分子を含み、その結果、3’炭素原子は、構造
-O-Z
の基を接合したものとなり、
Zは、-C(R’)2-OR”、-C(R’)2-N(R”)2、-C(R’)2-N(H)R”、-C(R’)2-SR’および-C(R’)2-Fであり、
各R”は、除去可能な保護基であるか、またはその一部であり;
各R’は、独立して、水素原子、アルキル、置換されたアルキル、アリールアルキル、アルケニル、アルキニル、アリール、ヘテロアリール、ヘテロサイクリック、アシル、シアノ、アルコキシ、アリールオキシ、ヘテロアリールオキシもしくはアミド基、または連結基を介して接合した検出可能なラベルであり;または、(R’)2は、式=C(R’’’)2のアルキリデン基を表し、各R’’’は、同じであっても異なっていてもよく、水素およびハロゲン原子ならびにアルキル基を含む群から選択されれ;かつ
当該分子は、反応されて、各R”がHと交換されているか、またはZが-C(R’)2-Fである場合、FがOH、SHまたはNH2、好ましくはOHと交換されている、中間体を生成してもよく、その中間体が、水性条件下で解離して、遊離の3’OHを有する分子を与え;
ただし、Zが-C(R’)2-S-R”である場合、両方のR’基が、Hではない。
特定の実施形態において、修飾ヌクレオチドまたはヌクレオシドのR’は、アルキルまたは置換されたアルキルである。特定の実施形態において、修飾ヌクレオチドまたはヌクレオシドの-Zは、式-C(R’)2-N3のものである。特定の実施形態において、Zは、アジドメチル基である。
【0111】
特定の実施形態において、修飾ヌクレオチド類は、それらの検出を可能にするために蛍光ラベルされる。特定の実施形態では、修飾ヌクレオチド類は、切断可能なリンカーを介して検出可能なラベルに接合した塩基を有するヌクレオチドまたはヌクレオシドを含む。特定の実施形態において、検出可能なラベルは、蛍光ラベルを含む。
【0112】
本明細書で使用される場合、「包装材料」という語句は、キットの内容物を収容するために使用される1つ以上の物理的構造を指す。包装材料は、既知の方法によって、好ましくは無菌で汚染物質のない環境を提供するために、構築される。包装材料には、成分がヌクレオチド取込み反応を行うために使用することができることを示すラベルを有する。また、包装材料は、いかにしてキット内の材料を使用してヌクレオチド取込み反応を実行するかを示す指示を含む。本明細書で使用される場合、「包装」の用語は、ポリペプチドを一定の範囲内に保持することができる、ガラス、プラスチック、紙、ホイル等の固体マトリックスまたは材料を指す。「使用指示書」は、典型的に、試薬濃度または混合する試薬とサンプルの相対量、試薬/サンプル混合物のメンテナンス期間、温度、バッファー条件等の少なくとも1つのアッセイ方法パラメーターを説明する具体的な表現を含む。
【0113】
背景、例示的実施形態の詳細な説明、および本明細書の他の場所で引用される特許、特許文献、および刊行物の完全な開示は、それぞれが個別に組み込まれたかのように、参照によりそれらの全体が組み込まれる。
【0114】
本発明の例示的実施形態は、考察され、参照は、本発明の範囲内の可能な変形に対してなされてきている。本発明におけるこれらのおよび他の変形、組合せ、および改変は、本発明の範囲から逸脱することなく当業者に明らかであろうし、本発明が本明細書に記載の例示的実施形態に限定されないことを理解すべきである。よって、本発明は、以下に提供される特許請求の範囲およびそれらの均等物によってのみ限定されるべきである。
【実施例】
【0115】
本発明は、以下の例によって例示される。特定の例、材料、量、および手順は、本明細書に示される本発明の範囲および精神に従って広く解釈されるべきであることが理解されるべきである。
【0116】
(例1:一般的なアッセイ方法および条件)
特に断りのない限り、これは、本明細書に記載の実施例で使用される一般的なアッセイ条件を記載する。
【0117】
(A.ポリメラーゼのクローニングおよび発現)
組換え核酸の作製、発現、および発現した産物の単離のための方法は、当該分野で公知であり記載されている。変異導入は、9°Nポリメラーゼ(配列番号1)をコードするコード領域で、標準の部位特異的変異導入方法論を使用して実施した。PCRベースのアプローチを使用して、変異したコード領域を増幅しHisタグを付加した。作製された各変異について、改変コード領域の適切な配列は、クローン化DNAの配列を決定することによって確認した。
【0118】
Hisタグ化変異体ポリメラーゼコード領域を、pET11aベクター中へサブクローニングし、BL21 Star(DE3)発現細胞(Invitrogen)中へ形質転換した。シングルピックしたコロニー由来の一晩培養物を使用して、2.8Lフラスコに発現培養物を接種した。培養物を37℃でOD600が約0.8になるまで増殖させ、次いで、タンパク質発現を0.2mM IPTGで誘導し、その後4時間追加で増殖させた。培養物を7000rpmで20分間遠心分離した。精製まで細胞ペレットを-20℃で保存した。
【0119】
ペレットを凍結融解し、製造者推奨に従ってReady-Lyse試薬およびOmnicleave試薬(Epicentre)の存在下で5×w/v溶解バッファー(50mM Tris-HCl pH7.5、1mM EDTA、0.1%BME、および5%グリセロール)で溶解した。最終NaCl濃度を500mMに上げ、ライセートを氷上で5分間インキュベートした。遠心分離後、上清を80℃で約70分間インキュベートした。さらなる精製はすべて4℃で実施した。上清を30分間氷結させた後、遠心分離し、5mL Ni Sepharose HPカラム(GE)を使用して精製した。カラムは、バッファーA(50mM Tris-HCl pH7.5、1mM EDTA、5%グリセロール、500mM NaCl、および20mMイミダゾール)でプレ平衡化した。カラムは、20から500mMまでのイミダゾールの75mLグラジエントを使用して溶出した。ピークフラクションをプールし、10%グリセロールで希釈してSPバッファーA(50mM Tris-HCl pH7.5、150mM NaCl、1mM EDTA、5%グリセロール)の導電率に合致させ、5mL SPセファロースカラム(GE)上へロードした。カラムは、150から1000mMまでのNaClの100mLグラジエントを使用して溶出した。ピークフラクションをプールし、保存バッファー(10mM Tris-HCl pH7.5、300mM KCL、0.1mM EDTA、および50%グリセロール)に透析し、-20℃で保存した。
【0120】
(B.エラー率およびフェージング分析)
シーケンシング実験を使用して、エラー率およびフェージング値を比較した。特に明記しない限り、実験は、MiniSeq(商標)システム(Illumina,Inc.、サンディエゴ、カリフォルニア)で、製造者の指示に従って実施した。例えば、各ポリメラーゼについて、個別の取込みミックス(IMX)を調製し、短いラン(読取り1で35サイクル)または長いラン(読取り1で151および読取り2で76の227サイクルラン)で使用した。標準のポリメラーゼをテストされるポリメラーゼで置換し、90μg/mLの濃度で、標準のMiniSeq Mid Output Reagent Cartridge製剤を使用した。フローセル上でのIMXのインキュベーション時間を、本明細書の実施例に記載されているように変化させた。使用したDNAライブラリーは、標準のTruSeq(商標)Nanoプロトコール(Illumina,Inc.)に従って、350bpターゲットインサートサイズで、E.coliゲノムDNAを使用して、作製した;PhiX DNA(Illumina,Inc)を、結果として得られたライブラリーに~1:10のモル比で添加した。Illumina RTA Softwareを使用して、両方のゲノムのエラー率、およびフェージングレベルを評価した。
【0121】
(例2:改変ポリメラーゼのシーケンシング性能)
標準取込み時間下での短いランで使用された対照ポリメラーゼより実質的に大きくない、短い取込み時間下での短いランでのエラー率およびフェージングレベルを有する多数の改変ポリメラーゼを同定した。以下の表2は、Pol 812(配列番号8)によって表される対照ポリメラーゼと比較した、14秒の取込み時間での表1にリストされた改変ポリメラーゼのシーケンシングパフォーマンスを比較する。改変ポリメラーゼを評価するために使用された品質メトリックスは、読取り1のフェージング率(「R1フェージング」)およびE.coli(「E.coliエラー」)およびバクテリオファージPhiX(「PhiXエラー」)シーケンシング対照の累積エラー率であった。メトリックスは、標準(46秒)取込み時間(「812 STD」)での対応するPol 812フェージングおよびエラー率に正規化された。例えば、短い取込み時間でのPol 812のR1フェージング率(「812 急速」)は、標準取込み時間でのR1フェージングよりも6倍高く、一方で、累積E.coliおよびPhiXエラー率は、それぞれ12.5および6.4倍高い。同様に、短い取込み時間でのPol 963(配列番号9)のR1フェージング率は、標準取込み時間でのPol 812のR1フェージング率よりも5.9倍高く、一方で、Pol 963の累積E.coliおよびPhiXエラー率は、それぞれ4.6倍および3.6倍高い。
【0122】
【0123】
短い取込み時間での相対フェージング率が3.0以下および累積エラー率が2.0以下であることを特徴とする改変ポリメラーゼは、急速SBSアプリケーションについて特に魅力的な候補を提示する。そのようなポリメラーゼの例は、表2に太字およびアスタリスクで示される。追加の結果は、
図2および3に示す。
【0124】
図2は、Pol 812対照(左パネル)と比較した場合の実施例2で同定された改変ポリメラーゼの1つであるPol 1558(配列番号11)によって示される短い取込み時間での減少したフェージングおよび累積エラー率を示す。2つの酵素は、標準的な取込み時間で同類のフェージングおよびエラー率を示す(右パネル)。
【0125】
図3Aは、Pol 812およびPol 963対照と比較した場合の実施例2で同定された選択された改変ポリメラーゼであるPol 1558、Pol 1671(配列番号23)、Pol 1682(配列番号25)、およびPol 1745(配列番号28)によって示される短い取込み時間での減少したR1フェージングおよび累積E.coliエラー率を示す。上部および下部パネルの破線は、標準取込み時間でPol 812によって示された累積E.coliエラーおよびR1フェージング率を示す。
【0126】
図3Bは、Pol 812およびPol 963対照を参照しての同じ改変ポリメラーゼのフェージングおよびプレフェージング率を比較し、Pol 1558、1671、1682、および1745によるフェージング率の減少を示す。
【0127】
(例3:長いラン条件下での改変ポリメラーゼの活性)
実施例2で同定された選択された改変ポリメラーゼを、異なるラン長を使用して評価した。標準取込み時間(46秒)での改変ポリメラーゼのそれぞれの累積PhiXエラー率を、長いシーケンシングラン(読取り1で250サイクルの後に読取り2で250サイクル、合計500サイクル)の最中の短い取込み時間(22秒)でのフェージングおよび累積エラー率と比較した。ラン条件がより長くなると、ランごとに、より多くの配列情報が得られ(即ち、より多くのヌクレオチド類の同一性が決定される)、例えばゲノム全体をシーケンスする場合に、シーケンシングプラットフォームで頻繁に使用される条件と同様となる。結果を
図4に示す。
【0128】
図4は、長いシーケンシング読取り(2×250サイクル)の最中の標準および短い取込み時間でのPol 1550(配列番号10)およびPol 1558(配列番号11)の累積PhiXエラー率を、Pol 812(配列番号8)対照のそれと比較する。両方の変異体は、ペアエンドターン後のエラー率の顕著な減少を示す。また、Pol 1550は、最初の配列読取りの最中にPol 812と比較してエラー率の大幅な減少を示す。
【0129】
(例4:NovaSeq(商標)でのシーケンシングメトリックスの評価)
例2で同定された改変ポリメラーゼの1つであるPol 1671を、S1フローセルおよびNovaSeq(商標)シーケンシングケミストリーを使用して、IlluminaのNovaSeq(商標)プラットフォームで評価した。エラー率、フェージングレベル、および他のシーケンシング品質メトリックスを、短いおよび標準の取込み時間での読取り1および2について決定した。Pol 1671およびPol 812の結果は、
図1に要約される。
【0130】
図5Aは、短い取込み時間(10秒)で示されるPol 1671(配列番号23)のNovaSeq(商標)シーケンシングメトリックスと、標準(40秒)および短い(10秒)取込み時間で示されたPol 812(配列番号8)対照のそれらとの間の比較を示す。上部パネルは、フィルターを通過するクラスター(「クラスターPF」)のパーセンテージを示す;下部パネルは、累積PhiXエラー率を示す。明るい白丸は、標準取込み時間でのPol 812メトリックスを示し、一方、暗い白丸は、短い取込み時間でのPo l812メトリックスを示す。黒丸で示された全てのPol1671メトリックスは、短い取込み時間でのものある。結果は、Pol 1671が、短い取込み時間での両方の読み取りで、標準取込み時間でのPol 812と同類のパフォーマンスを示すことを示す。
【0131】
図5Bは、標準(40秒)および短い(22秒)取込み時間でのNovaSeq(商標)読取り1および2のPol 812対象を参照してのPol 1671によって示された累積PhiXエラー率、Q30値、およびフェージング率を要約する。Pol 1671を使用した場合、両方の読取りのシーケンシング品質に大幅な向上が、観察された。
【0132】
本明細書で引用されるすべての特許、特許出願、および刊行物、ならびに電子的に入手可能な資料(例えば、GenBankおよびRefSeqでのヌクレオチド配列の提出、およびSwissProt、PIR、PRF、PDBなどでのアミノ酸配列の提出、およびGenBankおよびRefSeqの注釈付きコーディング領域からの翻訳を含む)の完全な開示は、それらの全体が参照により組み込まれる。刊行物で参照されている補足資料(補足表、補足図、補足資料および方法、および/または補足実験データ等)も同様に、その全体が参照により組み込まれる。本出願の開示と、参照により本明細書に組み込まれる文書の開示との間に矛盾が存在する場合、本出願の開示が優先するものとする。前述の詳細な説明および例は、理解を明確にするためにのみ提供されてきている。そこから不必要な限定制を理解する必要はない。本発明は、示されおよび記載された正確な詳細に限定されず、当業者に明らかな変形が、特許請求の範囲によって定義される本発明に含まれるであろう。
【0133】
特に明記しない限り、本明細書および特許請求の範囲で使用される成分の量、分子量等を表す全ての数字は、すべての場合において「約」の用語によって修飾されるものとして理解すべきものである。したがって、特に明記しない限り、本明細書および特許請求の範囲に示される数値パラメーターは、本発明によって得られることが求められる所望の特性に応じて変化し得る近似である。少なくとも、均等論を特許請求の範囲の範囲に限定する試みとしてではなく、各数値パラメーターは、報告された有効桁数に照らして、通常の丸め手法を適用することによって少なくとも解釈されるべきである。
【0134】
本発明の広い範囲を示す数値範囲およびパラメーターが近似値であるにもかかわらず、特定の例に示される数値は、可能な限り正確に報告される。しかしながら、すべての数値は、それぞれのテスト測定で見いだされた標準偏差から必然的に生じる範囲を生来的に含む。
【0135】
すべての見出しは読者の便宜のためのものであり、特に明記されていない限り、見出しに続くテキストの意味を制限するために使用されるべきではない。
【配列表】