(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-06-05
(45)【発行日】2023-06-13
(54)【発明の名称】例外的なスプライシング活性を有するスプリットインテイン
(51)【国際特許分類】
C07K 14/435 20060101AFI20230606BHJP
C07K 19/00 20060101ALI20230606BHJP
C07K 16/00 20060101ALI20230606BHJP
C12N 15/12 20060101ALI20230606BHJP
C12N 15/62 20060101ALI20230606BHJP
C12N 15/63 20060101ALI20230606BHJP
C07K 1/02 20060101ALI20230606BHJP
【FI】
C07K14/435 ZNA
C07K19/00
C07K16/00
C12N15/12
C12N15/62 Z
C12N15/63 Z
C07K1/02
(21)【出願番号】P 2018539361
(86)(22)【出願日】2017-01-27
(86)【国際出願番号】 US2017015455
(87)【国際公開番号】W WO2017132580
(87)【国際公開日】2017-08-03
【審査請求日】2020-01-23
(32)【優先日】2016-01-29
(33)【優先権主張国・地域又は機関】US
【前置審査】
(73)【特許権者】
【識別番号】500184305
【氏名又は名称】ザ・トラスティーズ・オブ・プリンストン・ユニバーシティ
【氏名又は名称原語表記】THE TRUSTEES OF PRINCETON UNIVERSITY
【住所又は居所原語表記】619 Alexander Road, Suite 102, Princeton,NJ 08540-6000 U.S.A.
(74)【代理人】
【識別番号】100094640
【氏名又は名称】紺野 昭男
(74)【代理人】
【識別番号】100103447
【氏名又は名称】井波 実
(74)【代理人】
【識別番号】100111730
【氏名又は名称】伊藤 武泰
(74)【代理人】
【識別番号】100180873
【氏名又は名称】田村 慶政
(72)【発明者】
【氏名】ミューア、トム、ダブリュー
(72)【発明者】
【氏名】スティーブンス、アダム、ジェイ
(72)【発明者】
【氏名】シャー、ニール、エイチ
【審査官】小田 浩代
(56)【参考文献】
【文献】特表2014-528720(JP,A)
【文献】特表2015-522020(JP,A)
【文献】Shah, N. H. et al.,Ultrafast protein splicing is common among cyanobacterial split inteins: implications for protein engineering,J. Am. Chem. Soc.,2012年,Vol. 134(28),pp. 11338-11341, Supporting information
【文献】山崎俊夫 ほか,インテインを利用した蛋白質フラグメントのライゲーション,生物物理,1999年,Vol. 39,pp. 182-184
(58)【調査した分野】(Int.Cl.,DB名)
C07K 1/00-19/00
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS/WPIDS(STN)
UniProt/GeneSeq
PubMed
(57)【特許請求の範囲】
【請求項1】
下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGL(配列番号1)
に対して少なくとも98%、99%または100%の配列同一性を有し、1位のCys残基(Cys1)、70位のLys残基(Lys70)、72位のHis残基(His72)、75位のMet残基(Met75)および81位のMet残基(Met81)が保存されているアミノ酸配列を含んでなる、スプリットインテインN断片。
【請求項2】
下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP(配列番号2)
に対して少なくとも98%、99%または100%の配列同一性を有し、1位のCys残基(Cys1)、70位のLys残基(Lys70)、72位のHis残基(His72)、75位のMet残基(Met75)および81位のMet残基(Met81)が保存されているアミノ酸配列を含んでなる、請求項1に記載のスプリットインテインN断片。
【請求項3】
請求項1または2に記載のスプリットインテインN-断片と化合物とを含んでなる複合体であって、前記化合物がペプチドもしくはポリペプチドであるか、または、ペプチドもしくはポリペプチドを含むものである、複合体。
【請求項4】
前記化合物が抗体鎖である、請求項3に記載の複合体。
【請求項5】
前記化合物が抗体重鎖である、請求項3に記載の複合体。
【請求項6】
下記配列:
VKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号3)
に対して少なくとも98%、99%または100%の配列同一性を有し、16位のAsp残基(Asp16)、23位のHis残基(His23)、34位のSer残基(Ser34)および35位のAsn残基(Asn35)が保存されているアミノ酸配列を含んでなる、スプリットインテインC断片。
【請求項7】
前記C断片の前記アミノ酸配列が、下記配列:
MVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号4)
に対して少なくとも98%、99%または100%配列同一性を有し、17位のAsp残基(Asp17)、24位のHis残基(His24)、35位のSer残基(Ser35)および36位のAsn残基(Asn36)が保存されているアミノ酸配列を含むものである、請求項6に記載のスプリットインテインC断片。
【請求項8】
下記配列:
VKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASN(配列番号389)
に対して少なくとも98%、99%または100%の配列同一性を有し、16位のAsp残基(Asp16)、23位のHis残基(His23)、34位のSer残基(Ser34)および35位のAsn残基(Asn35)が保存されているアミノ酸配列を含んでなる、スプリットインテインC断片。
【請求項9】
請求項6、7または8のいずれか一項に記載のスプリットインテインC断片と化合物とを含んでなる複合体であって、
・ 前記化合物が、下記構造:
【化1】
[式中、R1、R2、R3およびR4は、独立して、水素(H)およびカーゴ分子からなる群から選択されるものである]
を有するデンドリマーであるか、または
・ 前記化合物が、ペプチドであるか、または、ペプチドを含むものである、複合体。
【請求項10】
R1、R2、R3およびR4が、それぞれ色素分子である、請求項9に記載の複合体。
【請求項11】
R1、R2、R3およびR4が、それぞれ下記構造:
【化2】
を有するフルオレセイン誘導体である、請求項9に記載の複合体。
【請求項12】
前記化合物が、ペプチドに結合してなる1,2-アミノチオールである、請求項9に記載の複合体。
【請求項13】
前記化合物が、ペプチドに結合してなる1,2-アミノアルコールである、請求項9に記載の複合体。
【請求項14】
下記構造:
【化3】
[式中、IntCは、請求項6、7または8のいずれか一項に記載のスプリットインテインC断片であり、nは0~8である]
を有する複合体。
【請求項15】
下記構造:
【化4】
[式中、IntCは、請求項6、7または8のいずれか一項に記載のスプリットインテインC断片であり、nは0~8である]
を有する複合体。
【請求項16】
下記構造:
【化5】
[式中、IntCは、請求項6、7または8のいずれか一項に記載のスプリットインテインC断片であり、Xは、硫黄(S)または酸素(O)である]
を有する複合体。
【請求項17】
請求項1または2に記載のスプリットインテインN断片と、
請求項6、7または8のいずれか一項に記載のスプリットインテインC断片と
を含んでなる組成物。
【請求項18】
請求項1または2に記載のスプリットインテインN断片をコードするヌクレオチド配列を含んでなるヌクレオチドプラスミド。
【請求項19】
請求項6、7または8のいずれか一項に記載のスプリットインテインC断片をコードするヌクレオチド配列を含んでなるヌクレオチドプラスミド。
【請求項20】
2つの複合体をスプライシングするための方法であって、
第1の化合物と、請求項1または2に記載のスプリットインテインN断片とを含む第1の複合体と、第2の化合物と、請求項6、7または8のいずれか一項に記載のスプリットインテインC断片とを含む第2の複合体とを接触させ、当該接触が、前記スプリットインテインN断片と前記スプリットインテインC断片とを結合させてインテイン中間体を形成する条件下で実施されることを特徴とする工程と、
前記インテイン中間体を反応させて前記第1の化合物と前記第2の化合物とのコンジュゲートを形成する工程と
を少なくとも含んでなることを特徴とし、
前記第1の化合物が、ペプチドであるか、または、ペプチドを含むものであり、
前記第2の化合物が、
・ 下記構造:
【化6】
[式中、R1、R2、R3およびR4は、独立して、水素(H)およびカーゴ分子からなる群から選択されるものである]
を有するデンドリマーであるか、または
・ ペプチドであるか、または、ペプチドを含むものである、方法。
【請求項21】
第1の化合物と、請求項1または2に記載のスプリットインテインN断片とを含む第1の複合体と、第2の化合物と、請求項6、7または8のいずれか一項に記載のスプリットインテインC断片とを含む第2の複合体とを接触させ、当該接触が、前記スプリットインテインN断片と前記スプリットインテインC断片とを結合させてインテイン中間体を形成する条件下で実施されることを特徴とする工程と、
前記インテイン中間体と求核剤とを反応させて前記第1の化合物と前記求核剤とのコンジュゲートを形成する工程と
を少なくとも含んでなることを特徴とする方法であって、
前記第1の化合物が、ペプチドもしくはポリペプチドであるか、または、ペプチドもしくはポリペプチドを含むものであり、
前記第2の化合物が、
・ 下記構造:
【化7】
[式中、R1、R2、R3およびR4は、独立して、水素(H)およびカーゴ分子からなる群から選択されるものである]
を有するデンドリマーであるか、または
・ ペプチドであるか、または、ペプチドを含むものである、方法。
【請求項22】
前記第1の化合物が、ポリペプチドまたは抗体である、請求項21に記載の方法。
【請求項23】
前記第2の化合物が、デンドリマーまたはポリペプチドである、請求項21に記載の方法。
【請求項24】
下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLPVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号390)
に対して少なくとも98%、99%または100%の配列同一性を有し、1位のCys残基(Cys1)、70位のLys残基(Lys70)、72位のHis残基(His72)、75位のMet残基(Met75)、81位のMet残基(Met81)、117位のAsp残基(Asp117)、124位のHis残基(His124)、135位のSer残基(Ser135)および136位のAsn残基(Asn136)が保存されているアミノ酸配列を含んでなるインテイン。
【請求項25】
2つの複合体を一緒にスプライシングするためのキットであって、
請求項1または2に記載のスプリットインテインN断片と、
請求項6、7または8のいずれか一項に記載のスプリットインテインC断片と、
前記スプリットインテインN断片と前記スプリットインテインC断片とを結合させてインテイン中間体を形成するための試薬と、
求核剤と
を含んでなる、キット。
【請求項26】
請求項1または2に記載のスプリットインテインN断片のアミノ酸配列をコードする第1のヌクレオチド配列と、請求項6、7または8のいずれか一項に記載のスプリットインテインC断片のアミノ酸配列をコードする第2のヌクレオチド配列とを融合させ、前記第1のヌクレオチド配列と前記第2のヌクレオチド配列との融合物が隣接インテインをコードするようにする工程を少なくとも含んでなることを特徴とする方法。
【請求項27】
請求項
26に記載の方法であって、
下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGL(配列番号1)
を含んでなるスプリットインテインN断片のアミノ酸配列をコードする第1のヌクレオチド配列と、
下記配列:
VKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号3)
を含んでなるスプリットインテインC断片のアミノ酸配列をコードする第2のヌクレオチド配列と
を融合させ、前記第1のヌクレオチド配列と前記第2のヌクレオチド配列との融合物が隣接インテインをコードするようにする工程を少なくとも含んでなることを特徴とする、方法。
【請求項28】
請求項6、7または8のいずれか一項に記載のスプリットインテインC断片のアミノ酸配列をコードする第2のヌクレオチ配列と融合してなる、請求項1または2に記載のスプリットインテインN断片のアミノ酸配列をコードする第1のヌクレオチド配列を含んでなる遺伝子融合物。
【請求項29】
下記配列:
VKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号3)
を含んでなる、スプリットインテインC断片のアミノ酸配列をコードする第2のヌクレオチド配列と融合してなる、
下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGL(配列番号1)
を含んでなる、スプリットインテインN断片のアミノ酸配列をコードする第1のヌクレオチド配列を含んでなる、請求項
28に記載の遺伝子融合物。
【請求項30】
請求項1に記載のスプリットインテインN断片または請求項6~8のいずれか一項に記載のスプリットインテインC断片をコードするポリヌクレオチド。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2016年1月29日に出願された米国仮出願第62/288,661号の優先権を主張し、その全体が参照により本明細書に組み込まれる。
【0002】
本発明は、アメリカ国立衛生研究所により付与された助成金GM086868のもと政府支援によりなされた。政府は本発明に一定の権利を有する。
【背景技術】
【0003】
1.技術分野
本発明の特許請求の範囲に記載されている実施形態の分野は、インテイン、スプリットインテイン、インテインを含んでなる組成物、およびタンパク質エンジニアリングのためのそれらの使用方法に関する。
【0004】
2.関連技術の考察
タンパク質スプライシングは、隣接するポリペプチド配列(エクステイン)が通常のペプチド結合を介して一緒にライゲーションされるように、インテインと呼ばれる介在タンパク質ドメインが宿主タンパク質から無傷で自己切断される翻訳後自己分解事象である1。タンパク質スプライシングは、典型的には、連続したポリペプチドの翻訳後に自発的に起こるが、いくつかのインテインは分割された形態で自然に存在する1。スプリットインテインの2つの断片は別々に発現され、それらの相補的なパートナーに遭遇するまで不活性のままであり、遭遇したら協調的に折り畳まれてトランススプライシングされる。この活性は、インビトロおよびインビボの両方でタンパク質の構造および活性の制御を提供する多数のタンパク質エンジニアリング方法において利用されている1。シアノバクテリアSynechocystis種PCC6803(Ssp)およびNostoc punctiforme PCC73102(Npu)から特徴付けられる最初の2つのスプリットインテインは、DNAポリメラーゼIII(DnaE)のα-サブユニットに挿入された天然に存在するオルソログである2-4。Npuは、タンパク質トランス-スプライシング(PTS)(30℃でt1/2=50秒)の顕著に速い速度のために特に注目に値する5。この半減期は、Ssp(30℃でt1/2=80分)の半減期よりもかなり短いことから、PTSの適用範囲が広がることになる1。
【発明の概要】
【発明が解決しようとする課題】
【0005】
新しい高速インテインの発見が続いているにもかかわらず6,7、より遅いホモログからそれらを分離することについてはほとんど知られていない。そのような理解は、速やかにスプライシングする可能性の高い新規のインテインを同定するのに役立ち、優れたPTS特性を有するスプリットインテインのエンジニアリングを潜在的に可能にするはずである。
【課題を解決するための手段】
【0006】
本発明の実施形態には、下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGL(配列番号1)に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなるスプリットインテインN断片が含まれる。
【0007】
本発明の実施形態には、下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP(配列番号2)に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなるスプリットインテインN断片が含まれる。
【0008】
本発明の実施形態には、下記配列:
VKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号3)に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなるスプリットインテインC断片が含まれる。
【0009】
本発明の実施形態には、下記配列:
MVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号4)に対して少なくとも80%、85%、90%、95%、98%、99%または100%配列同一性を有するアミノ酸配列を含んでなるスプリットインテインC断片が含まれる。
【0010】
本発明の実施形態には、下記配列:
VKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASN(配列番号389)に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなるスプリットインテインC断片が含まれる。
【0011】
本発明の実施形態には、下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGL(配列番号1)または
下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP(配列番号2)
に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなるスプリットインテインN断片と、
下記配列:
VKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号3)、
下記配列:
MVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号4)または
下記配列:
VKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASN(配列番号389)
に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列と
を含むスプリットインテインC断片と
を含んでなる組成物が含まれる。
【0012】
本発明の実施形態には、下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGL(配列番号1)または
下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP(配列番号2)
に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなるスプリットインテインN断片をコードするヌクレオチド配列を含んでなるヌクレオチドプラスミドが含まれる。
【0013】
本発明の実施形態には、下記配列:
VKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号3)、
下記配列:
MVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号4)または
下記配列:
VKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASN(配列番号389)
に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなるスプリットインテインC断片をコードするヌクレオチド配列を含んでなるヌクレオチドプラスミドが含まれる。
【0014】
本発明の実施形態には、以下の工程を少なくとも含んでなることを特徴とする、2つの複合体をスプライシングするための方法が含まれる:第1の化合物と、スプリットインテインN断片とを含む第1の複合体と、第2の化合物と、スプリットインテインC断片とを含む第2の複合体とを接触させる工程であって、当該接触が、スプリットインテインN断片とスプリットインテインC断片とを結合させてインテイン中間体を形成する条件下で実施されることを特徴とする工程;インテイン中間体を反応させて第1の化合物と第2の化合物とのコンジュゲートを形成する工程。スプリットインテインN断片は、
下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGL(配列番号1)または
下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP(配列番号2)
に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなり、かつスプリットインテインC断片は、
下記配列:
VKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号3)、
下記配列:
MVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号4)または
下記配列:
VKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASN(配列番号389)
に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなる。
【0015】
本発明の実施形態には、以下の工程を少なくとも含んでなることを特徴とする方法が含まれる:第1の化合物と、スプリットインテインN断片とを含む第1の複合体と、第2の化合物と、スプリットインテインC断片とを含む第2の複合体とを接触させる工程であって、当該接触が、スプリットインテインN断片とスプリットインテインC断片とを結合させてインテイン中間体を形成する条件下で実施されることを特徴とする工程;インテイン中間体と求核剤とを反応させて第1の化合物と求核剤とのコンジュゲートを形成する工程。スプリットインテインN断片は、
下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGL(配列番号1)または
下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP(配列番号2)
に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなり、かつスプリットインテインC断片は、
下記配列:
VKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号3)、
下記配列:
MVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号4)または
下記配列:
VKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASN(配列番号389)
に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなる。
【0016】
いくつかの実施形態において、化合物、第1の化合物または第2の化合物は、ペプチドもしくはポリペプチドであるか、またはペプチドもしくはポリペプチドを含む。いくつかの実施形態において、化合物、第1の化合物または第2の化合物は、抗体、抗体鎖もしくは抗体重鎖であるか、または抗体、抗体鎖もしくは抗体重鎖を含む。いくつかの実施形態において、化合物、第1の化合物または第2の化合物は、ペプチド、オリゴヌクレオチド、薬物もしくは細胞傷害性分子であるか、またはペプチド、オリゴヌクレオチド、薬物もしくは細胞傷害性分子を含むものである。
【0017】
本発明の実施形態には、下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLPVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号390)に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなるインテインが含まれる。
【0018】
本発明の実施形態には、2つの複合体を一緒にスプライシングするためのキットであって、下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGL(配列番号1)または
下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP(配列番号2)
に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなるスプリットインテインN断片;
下記配列:
VKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号3)、
下記配列:
MVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号4)または
下記配列:
VKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASN(配列番号389)
に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなるスプリットインテインC断片;
スプリットインテインN断片のスプリットインテインC断片への結合を可能にしてインテイン中間体を形成するための試薬;および求核剤
を含んでなる、キットが含まれる。
【0019】
本発明の実施形態には、以下の工程を少なくとも含んでなることを特徴とする、合成コンセンサスインテインペプチド配列を生成するための方法が含まれる:複数の相同インテインペプチド配列の集団を生成する工程;複数の相同インテインペプチド配列の集団内の高速スプライシングに関連するアミノ酸を同定する工程;第2の複数の相同インテインペプチド配列の亜集団を生成し、当該第2の複数の相同インテインペプチド配列が高速スプライシングに関連するアミノ酸を含むことを特徴とする工程;亜集団の少なくとも3つのペプチド配列のアライメントを作製する工程;少なくとも3つのペプチド配列の各位置で最も頻繁に出現するアミノ酸残基を決定する工程;および少なくとも3つのペプチド配列の各位置で最も頻繁に出現するアミノ酸残基に基づいて合成コンセンサスインテインペプチド配列を生成する工程。
【0020】
本発明の実施形態には、第1のヌクレオチド配列と第2のヌクレオチド配列との融合物が隣接インテインをコードするように、第1のインテイン断片(スプリットインテインN断片)のアミノ酸配列をコードする第1のヌクレオチド配列を、第2のインテイン断片(スプリットインテインC断片)のアミノ酸配列をコードする第2のヌクレオチド配列と融合させる工程を少なくとも含んでなることを特徴とする方法が含まれる。スプリットインテインN断片は、
下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGL(配列番号1)または
下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP(配列番号2)
に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなり、かつスプリットインテインC断片は、
下記配列:
VKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号3)、
下記配列:
MVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号4)または
下記配列:
VKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASN(配列番号389)
に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなる。
【0021】
本発明の実施形態には、以下の工程を少なくとも含んでなることを特徴とする方法が含まれる:第1のヌクレオチド配列と第2のヌクレオチド配列との融合物が隣接インテインをコードするように、
下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGL(配列番号1)を含んでなる第1のインテイン断片(スプリットインテインN断片)のアミノ酸配列をコードする第1のヌクレオチド配列を、
下記配列:
VKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号3)を含んでなる第2のインテイン断片(スプリットC断片)のアミノ酸配列をコードする第2のヌクレオチド配列と融合させる工程。
【0022】
本発明の実施形態には、第1のインテイン断片(スプリットインテインN断片)のアミノ酸配列をコードする第1のヌクレオチド配列と、第2のインテイン断片(スプリットインテインC断片)のアミノ酸配列をコードする第2のヌクレオチド配列とを含んでなる遺伝子融合物が含まれる。スプリットインテインN断片は、
下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGL(配列番号1)または
下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP(配列番号2)
に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなり、かつスプリットインテインC断片は、
下記配列:
VKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号3)、
下記配列:
MVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号4)または
下記配列:
VKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASN(配列番号389)
に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなる。
【0023】
本発明の実施形態には、下記配列:
VKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号3)を含んでなる第2のインテイン断片(スプリットインテインC断片)のアミノ酸配列をコードする第2のヌクレオチド配列と融合してなる、
下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGL(配列番号1)を含んでなる第1のインテイン断片(スプリットインテインN断片)のアミノ酸配列をコードする第1のヌクレオチド配列を含んでなる遺伝子融合物が含まれる。
【0024】
本発明の実施形態には、スプリットインテインN断片と化合物とを含んでなる複合体(例えば融合タンパク質)が含まれる。例えば、この化合物は、ペプチド、ポリペプチドもしくは抗体鎖、例えば抗体重鎖であってもよいか、またはペプチド、ポリペプチドもしくは抗体鎖、例えば抗体重鎖を含んでいてもよい。例えば、この化合物は、ペプチド、オリゴヌクレオチド、薬物または細胞毒性分子を含んでいてもよい。例えば、この化合物は、ペプチド、オリゴヌクレオチド、薬物または細胞毒性分子に結合した1,2-アミノチオールまたは1,2-アミノアルコールであってもよい。スプリットインテインN断片は、
下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGL(配列番号1)に対して少なくとも80%、85%、90%、95%、98%、99%もしくは100%の配列同一性を有するアミノ酸配列、または
下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP(配列番号2)に対して少なくとも80%、85%、90%、95%、98%、99%もしくは100%の配列同一性を有するアミノ酸配列を含んでなる。
【0025】
本発明の実施形態には、スプリットインテインC断片と化合物とを含んでなる複合体(例えば融合タンパク質)が含まれる。例えば、この化合物は、デンドリマー、ペプチドもしくはポリペプチドであってもよいか、またはデンドリマー、ペプチドもしくはポリペプチドを含んでいてもよい。例えば、この化合物は、ペプチド、オリゴヌクレオチド、薬物または細胞毒性分子に結合した1,2-アミノチオールまたは1,2-アミノアルコールであってもよい。スプリットインテインC断片は、
下記配列:
VKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号3)に対して少なくとも80%、85%、90%、95%、98%、99%もしくは100%の配列同一性を有するアミノ酸配列、
下記配列:
MVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号4)に対して少なくとも80%、85%、90%、95%、98%、99%もしくは100%の配列同一性を有するアミノ酸配列、または
下記配列:
VKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASN(配列番号389)に対して少なくとも80%、85%、90%、95%、98%、99%もしくは100%の配列同一性を有するアミノ酸配列を含んでなる。デンドリマーは、下記構造を有する化合物であってもよい:
【化1】
式中、R1、R2、R3およびR4は、それぞれ(独立して)、水素(H)またはカーゴ分子(R1、R2、R3およびR4上のカーゴ分子は互いに異なっていてもよい)である。R1、R2、R3およびR4は、それぞれ色素分子であってもよい。例えば、R1、R2、R3およびR4は、それぞれ下記構造を有するフルオレセイン誘導体であってもよい:
【化2】
【0026】
本発明の実施形態には、下記構造を有する複合体が含まれる:
【化3】
式中、IntCは、スプリットインテインC断片であり、nは0~8である。
【0027】
本発明の実施形態には、下記構造を有する複合体が含まれる:
【化4】
式中、IntCは、スプリットインテインC断片であり、nは0~8である。
【0028】
本発明の実施形態には、下記構造を有する複合体が含まれる:
【化5】
式中、IntCはスプリットインテインC-断片であり、Xは硫黄(S)または酸素(O)である。スプリットインテインC断片は、
下記配列:
VKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号3)に対して少なくとも80%、85%、90%、95%、98%、99%もしくは100%の配列同一性を有するアミノ酸配列、
下記配列:
MVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号4)に対して少なくとも80%、85%、90%、95%、98%、99%もしくは100%の配列同一性を有するアミノ酸配列、または
下記配列:
VKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASN(配列番号389)に対して少なくとも80%、85%、90%、95%、98%、99%もしくは100%の配列同一性を有するアミノ酸配列を含んでなる。
【0029】
本発明の実施形態には、例えば、発現タンパク質ライゲーションなどの従来の半合成用途に使用することができる隣接インテインが含まれる。
【図面の簡単な説明】
【0030】
【
図1】本発明の一つの実施形態によるCfaスプリットインテインの設計のアライメントおよびコンピュータ生成モデルを示す。
【
図2】本発明の一つの実施形態によるCfaインテインの特徴を示すグラフを示す。
【
図3】本発明の一つの実施形態によるCfaインテインを用いたマウスモノクローナル抗体の発現および修飾を示す。
【
図4】本発明の一つの実施形態による速やかなタンパク質トランススプライシングに重要な第2のシェルの「アクセラレータ(accelerator)」残基の同定を示す。
【
図5】本発明の一つの実施形態によるバッチ2変異体およびコンピュータ生成モデルの動態分析を示す。
【
図6】本発明の一つの実施形態によるバッチ1変異体およびコンピュータ生成モデルの分析を示す図である。
【
図7】
図7Aおよび
図7Bは、本発明の一つの実施形態によるDnaEインテインファミリーのアライメントおよび精製を示す。
【
図8】本発明の一つの実施形態によるHis
6-SUMO-Npu
NおよびHis
6-SUMO-Cfa
Nの試験発現のSDS-PAGE分析の画像である。
【
図9】本発明の一つの実施形態によるCfa
GEPの乱雑さ増大を示す概略図およびグラフを示す。
【
図10】本発明の一つの実施形態による可変残基を有する大腸菌におけるeGFPの環化を示すグラフおよび概略図を示す。
【
図11】本発明の一つの実施形態によるいくつかの複合体および化合物を示す表を示す。
【0031】
詳細な説明
本発明の実施形態を以下に詳細に説明する。分かりやすくする意味で、実施形態を説明する際には特定の用語を使用する。しかしながら、本発明は、そのように選択された特定の用語に限定されることを意図するものではない。当業者であれば、本発明の精神および範囲から逸脱することなく、他の均等部分を用いて、他の方法を開発できることを認識するであろう。本明細書に引用される全ての参考文献は、各々が個々に組み込まれているかのように、その全体が参照により本明細書に組み込まれる。
【0032】
本発明の実施形態には、下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGL(配列番号1)に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなるスプリットインテインN断片が含まれる。
【0033】
本発明の実施形態には、下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP(配列番号2)に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなるスプリットインテインN断片が含まれる。
【0034】
本発明の実施形態には、下記配列:
VKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号3)に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなるスプリットインテインC断片が含まれる。
【0035】
本発明の実施形態には、下記配列:
MVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号4)に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなるスプリットインテインC断片が含まれる。
【0036】
本発明の実施形態には、下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGL(配列番号1)に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなるスプリットインテインN断片と、
下記配列:
VKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号3)に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなるスプリットインテインC断片と
を含んでなる組成物が含まれる。
【0037】
本発明の実施形態には、下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGL(配列番号1)に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなるスプリットインテインN断片をコードするヌクレオチド配列を含んでなるヌクレオチドプラスミドが含まれる。
【0038】
本発明の実施形態には、下記配列:
VKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号3)に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなるスプリットインテインC断片をコードするヌクレオチド配列を含んでなるヌクレオチドプラスミドが含まれる。
【0039】
本発明の実施形態には、第1の化合物と、スプリットインテインN断片とを含む第1の複合体と、第2の化合物と、スプリットインテインC断片とを含む第2の複合体とを接触させる工程であって、当該接触が、スプリットインテインN断片とスプリットインテインC断片とを結合させてインテイン中間体を形成する条件下で実施されることを特徴とする工程;および
インテイン中間体を反応させて第1の化合物と第2の化合物とのコンジュゲートを形成する工程を少なくとも含んでなる、2つの複合体をスプライシングするための方法が含まれ、ここで、前記スプリットインテインN断片は、
下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGL(配列番号1)に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなり、かつ、前記スプリットインテインC断片は、
下記配列:
VKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号3)に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなる。いくつかの実施形態において、インテイン中間体を反応させることは、インテイン中間体と求核剤とを接触させることを含む。いくつかの実施形態において、前記第1の化合物はポリペプチドである。いくつかの実施形態において、前記第1の化合物は抗体である。
【0040】
本発明の実施形態には、下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLPVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号390)に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなるインテインが含まれる。
【0041】
本発明の実施形態には、2つの複合体を一緒にスプライシングするためのキットであって、下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGL(配列番号1)
に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなるスプリットインテインN断片;
下記配列:
VKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号3)に対して少なくとも80%、85%、90%、95%、98%、99%または100%の配列同一性を有するアミノ酸配列を含んでなるスプリットインテインC断片;
スプリットインテインN断片のスプリットインテインC断片への結合を可能にしてインテイン中間体を形成するための試薬;および
求核剤を含んでなる、キットが含まれる。
【0042】
本発明の実施形態には、以下の工程を少なくとも含んでなることを特徴とする、合成コンセンサスインテインペプチド配列を生成するための方法が含まれる:複数の相同インテインペプチド配列の集団を生成する工程;複数の相同インテインペプチド配列の集団内の高速スプライシングに関連するアミノ酸を同定する工程;第2の複数の相同インテインペプチド配列の亜集団を生成し、当該第2の複数の相同インテインペプチド配列が高速スプライシングに関連するアミノ酸を含むことを特徴とする工程;前記亜集団の少なくとも3つのペプチド配列のアライメントを作製する工程;前記少なくとも3つのペプチド配列の各位置で最も頻繁に出現するアミノ酸残基を決定する工程;および前記少なくとも3つのペプチド配列の各位置で最も頻繁に出現するアミノ酸残基に基づいて合成コンセンサスインテインペプチド配列を生成する工程。
【0043】
本発明の実施形態には、第1のヌクレオチド配列と第2のヌクレオチド配列との融合物が隣接インテインをコードするように、下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGL(配列番号1)を含んでなる第1のインテイン断片のアミノ酸配列をコードする第1のヌクレオチド配列を、
下記配列:
VKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号3)を含んでなる第2のインテイン断片のアミノ酸配列をコードする第2のヌクレオチド配列と融合させる工程を少なくとも含んでなることを特徴とする方法が含まれる。
【0044】
本発明の実施形態には、下記配列:
VKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(配列番号3)を含んでなる第2のインテイン断片のアミノ酸配列をコードする第2のヌクレオチド配列と融合してなる、
下記配列:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGL(配列番号1)を含んでなる第1のインテイン断片のアミノ酸配列をコードする第1のヌクレオチド配列を含んでなる遺伝子融合物が含まれる。
【0045】
本発明の実施形態には、例えば、発現タンパク質ライゲーションなどの従来の半合成用途に使用することができる隣接インテインが含まれる。
【0046】
いくつかの実施形態において、記載される種々のインテイン断片は、当技術分野で公知の従来の方法によって、ポリマー、ペプチド、ポリペプチド、オリゴペプチド、小分子、ヌクレオチド、ポリヌクレオチド、オリゴヌクレオチド、薬物、細胞傷害性分子またはそれらの組み合せ物に連結、融合、化学結合、複合体化またはカップリングされる。
【0047】
実施例1:
いくつかの実施形態において、最初の2つの特徴付けられたスプリットインテインであるNpuおよびSspの比較研究を通じて、速やかなタンパク質スプライシングの基礎を調べた。これらの2つのタンパク質間のスプライシング速度の実質的差異は、それらの非常に類似した配列(63%の同一性)およびほぼ重ね合わせることができる活性部位構造を考慮に入れると、特に判別しにくい。NpuおよびSspに関する以前の突然変異誘発研究は、2つの間の活性の差異が、単一の部位ではなく、いくつかの残基の複合効果に起因する可能性が高いことを示唆している6,8。しかしながら、速い反応速度と緩慢な反応速度に関与する残基の数や、その延長線上で考えて、これらの「アクセラレータ」残基がタンパク質スプライシングプロセス全体の個々の化学的ステップに等しく寄与しているかどうかは、はっきりしないままである。したがって、これらの疑問点を調査し、これがPTSシステム改善の出発点を提供するという期待を抱いて研究を開始した。
【0048】
NpuおよびSspの活性部位内の高レベルの保存は、より遠位のアミノ酸の差異が2つの間のスプライシング速度の不一致につながることを示唆している。したがって、活性部位に直接隣接する「第2のシェル」残基に着目した。この分析を単純化するために、バッチ突然変異誘発戦略を、以前に報告されたインビトロPTSアッセイと共に用いた5。このアッセイは、短いネイティブなエクステイン配列を有するスプリットインテイン構築物を使用し、スリーステート動態モデルを使用して分岐状中間体形成(k1、k2)速度およびその最終スプライス産物(k3)へのその分解能を決定することを可能にする。
【0049】
NpuおよびSspインテイン断片の公知の交差反応性は、スプリットインテインのどの半分が活性の差異に最も有意に寄与するかを評価するための有益なプラットフォームとして役立った
3。Ssp
N-Npu
C(キメラ1)およびNpu
N-Ssp
C(キメラ2)キメラの両方とも、ネイティブなNpuのものと比較して分岐形成および分解速度の低下を示す(
図4C、4D)。これは、NpuおよびSspのN-およびC-インテイン断片の両方の残基がそれらのスプライシング速度の差異に寄与していることを示す。次に、これらの各キメラの第2のシェル位置の4つのグループを活性部位へのそれらの近接度合いに基づいて選択し、対応するSsp残基をNpuのものに突然変異させた(
図4Aおよび4B)。キメラ1変異体から、バッチ2(L56F、S70K、A83P、E85D)は、ネイティブなNpuのものへの分岐形成活性を完全に回復したが(
図4C)、バッチ1(R73K、L75M、Y79G、L81M)は、分岐分解活性の大部分を回復した(
図4D)。キメラ2のバックグラウンドに及ぼす突然変異の効果は、ネイティブなNpuのものへのスプライシング活性を回復することができない単一のバッチでは、より単調であった(
図4Cおよび4D)。最後に、Ssp
CのA136S突然変異はタンパク質スプライシングを促進することが以前に示されており、別々に試験した
8。このA136S突然変異は、分岐分解速度を2倍に増加させるが、分岐形成には影響を及ぼさない(
図4Cおよび4D)。
【0050】
図4は、本発明の一つの実施形態による、速やかなタンパク質トランススプライシングに重要な第2のシェルの「アクセラレータ」残基の同定を示す。パネルAおよびBには、キメラ1(Ssp
N-Npu
C)およびキメラ2(Npu
N-Ssp
C)上の第2シェルバッチ変異体の設計が示されている。それぞれの場合において、Npu(pdb=4k15)の結晶構造を使用して変異体(スティック状に描写される)の位置が示されている。触媒残基は黒色で示されている(スティック状に描写される)。パネルCは、本研究において記載される種々の構築物(誤差=SD(n=3))の出発物質からの分岐状中間体形成の順方向(k
1、青色)および逆方向(k
2、赤色)速度を示す。パネルDは、種々の構築物(誤差=SD(n=3))の分岐分解(k
3)速度を示す
【0051】
次に、バッチ変異体1および2内の残基の個々の寄与はスプライシング活性に最も深刻な影響を及ぼすため、これらについて調べた。バッチ2について、更なる突然変異誘発は、F56、K70およびD85の間の相互作用がNpu
Nにおける分岐形成速度の増加に関与する可能性が高いことを示す(
図5A)。K70は、Npu
N(残基69~72)における高度に保存されたTXXHブロックBループの一部であって、タンパク質スプライシングにおける最初のN→Sアシルシフトを触媒することから、構造的証拠がこのデータを支持する
9。したがって、(F56およびD85に対して充填された)K70の位置および動態は、触媒残基T69およびH72に直接影響を及ぼすはずである(
図5B)
10-12。バッチ1から、K73、M75およびM81は、Npu
Nにおけるより速い分岐分解速度に関与する(
図6A)。これらの残基は、タンパク質スプライシングの最終段階においてスクシンイミド形成を経なければならないC-インテインの末端アスパラギンの周囲を充填する(
図6B)。総合すると、突然変異誘発データは、第2のシェルの「アクセラレータ」残基がスプリットインテインの活性を調整する際に果たす重要な役割を指し示す。
【0052】
図5は、本発明の一つの実施形態によるバッチ2変異体およびコンピュータ生成モデルの動態分析を示す。パネルAは、バッチ2(L56F、S70K、A83P、E85D)(誤差=SD(n=3))を含むSsp
Nの単一(A83P)、二重(A83P、S70K)および三重(L56F、S70K、A83P)点変異体についての分岐形成の平衡速度(k
1、k
2)および分岐分解速度(k
3)を示す。パネルBは、Npu活性部位(pdb=4kl5)におけるバッチ2(ラベルF56、K70、P83およびD85に接する緑色のスティック)の拡大表示を示す。触媒残基は黒色のスティックとして描写される。
【0053】
図6は、本発明の一つの実施形態によるバッチ1変異体およびコンピュータ生成モデルの動態分析を示す。パネルAは、バッチ1(誤差=SD(n=3))を含む単一(R73K)、二重(R73K、Y79G)および三重(R73K、Y79G、L81M)点変異体についての分岐形成の平衡速度(k
1、k
2)および分岐分解速度(k
3)を示す。パネルBは、Npu構造(pdb=4kl5)におけるバッチ1(ラベルK73、M75、G79およびM81に接する赤色のスティック)の拡大表示を示す。触媒残基は黒色のスティックとして描写される。
【0054】
スプライシング速度に影響を与えることが見出された「アクセラレータ」残基は、コンセンサスDnaEインテインをエンジニアリングするための活性誘導アプローチを可能にする。コンセンサスタンパク質エンジニアリングは、親ファミリーに由来する熱安定性変異体を作製するためにタンパク質のホモログ・セットに適用されるツールである
13,14。特定のタンパク質のホモログから多配列アライメント(MSA)が最初に生成され、そこから各位置で最も統計的に頻繁な残基がコンセンサス配列の代表として選択される。DnaEインテインについて、JGI
16およびNCBI
17データベースのBLAST
15検索により105の配列を同定した(
図7A)。次に、高速スプライシングの第2のシェルインジケーターを持つ配列:K70、M75、M81およびS136のみを含むようにアライメントをフィルタリングした。次いで、MSA中に残った73個の理論上高速のインテイン(
図7B)を使用して、コンセンサス高速DnaEインテイン配列(Cfa)を生成した(
図1)。
図7Aおよび
図7Bに開示された種々の配列を以下に示す:
【0055】
>NpuPCC73102/1-137
【0056】
CLSYETEILTVEYGLLPIGKIVEKRIECTVYSVDNNGNIYTQPVAQWHDRGEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPIDEIFERELDLMRVDNLPN(配列番号5)
【0057】
IKIATRKYLGKQNVYDIGVERDHNFALKNGFIASN(配列番号6)
【0058】
>CthPCC7203:/1-137 Chroococcidiopsis thermalis PCC 7203
【0059】
CLSYDTEILTVEYGAIPIGKIVEERIECTVYSVDNNGFIYTQPIAQWHNRGQQEVFEYCLEDGSIIRATKDHKFMTFEGKMLPIDEIFEQELDLKQVKSIQN(配列番号7)
【0060】
VKIISRKSLGIQPVYDIGVERDHKFVLKNGLVASN(配列番号8)
【0061】
>NspCCY9414:/1-137 Nodularia spumigena CCY9414 genome
【0062】
CLSYDTEILTVEYGYIPIGEIVEKAIECSVYSVDNNGNVYTQPIAQWHNRGEQEVFEYSLEDGSTIRATKDHKFMTTDGQMLPIDEIFAQELDLLQVHGLPK(配列番号9)
【0063】
VKITARKFVGRENVYDIGVERYHNFAIKNGLIASN(配列番号10)
【0064】
>AcyPCC7122:/1-137 Anabaena cylindrica PCC 7122
【0065】
CLSYDTEVLTVEYGFIPIGEIVEKRIECSIFSVDKNGNVYTQPIAQWHNRGRQEIYEYCLDDGSKIRATKDHKFMTTAGEMLPIDEIFERDLDLLKVEGLPE(配列番号11)
【0066】
VKIISRQYLGQADVYDIGVEEDHNFAIKNGFIASN(配列番号12)
【0067】
>CspPCC7507:/1-137 Calothrix sp.PCC 7507,complete genome
【0068】
CLSYDTEVLTVEYGLLPIGEIVEKGIECRVFSVDNHGNVYTQPIAQWHNRGQQEVFEYGLDDGSVIRATKDHKFMTTDGKMLPIDEIFERGLDLLQVQGLPE(配列番号13)
【0069】
VKVITRKYIGKENVYDIGVELDHNFAIRNGLVASN(配列番号14)
【0070】
>NspPCC7524:/1-137 Nostoc sp.PCC 7524
【0071】
CLSYDTEILTVEYGFLPIGEIVEKGIECTVFSVASNGIVYTQPIAQWHNRGQQEIFEYCLEDGSIIRATKDHKFMTQDGQMLPIDEIFACELDLLQVQGLPE(配列番号15)
【0072】
VKVVTRKYIGKENVYDIGVERDHNFVIRNGLVASN(配列番号16)
【0073】
>Naz0708:/1-137 ’Nostoc azollae’0708
【0074】
CLSYKTEVLTVEYGLIPIGEIVEKRIECSLFSVDENGNIYTQPIAQWHHRGVQEVYEYCLDDGTIIRATKDHKFMTTIGEMLPIDEIFERDLNLLQVNGLPT(配列番号17)
【0075】
VKIISRQFLGPANVYDIGVAQDHNFAIKNGLIASN(配列番号18)
【0076】
>NspPCC7120:/1-137 Nostoc sp.PCC 7120 DNA
【0077】
CLSYDTEVLTVEYGFVPIGEIVEKGIECSVFSINNNGIVYTQPIAQWHHRGKQEVFEYCLEDGSIIKATKDHKFMTQDGKMLPIDEIFEQELDLLQVKGLPE(配列番号19)
【0078】
IKIASRKFLGVENVYDIGVRRDHNFFIKNGLIASN(配列番号20)
【0079】
>AvaATCC29413/1-137 Anabaena variabilis ATCC 29413
【0080】
CLSYDTEVLTVEYGFVPIGEIVDKGIECSVFSIDSNGIVYTQPIAQWHHRGKQEVFEYCLEDGSIIKATKDHKFMTQDGKMLPIDEIFEQELDLLQVKGLPE(配列番号21)
【0081】
IKIASRKFLGVENVYDIGVGRDHNFFVKNGLIASN(配列番号22)
【0082】
>PspPCC7327:/1-135 Pleurocapsa sp.PCC 7327.
【0083】
CLSYDTKILTVEYGAMPIGKIVEEQIDCTVYTVNQNGFVYTQPIAQWHDRGKQEIFEYCLEDGSIIRATKDHKFMTTDGQMLPIDKIFEKGLDLKTINCD(配列番号23)
【0084】
VKILSRKSLGIQSVYDIGVEKDHNFLLANGLVASN(配列番号24)
【0085】
>CspPCC7424:/1-135 Cyanothece sp.PCC 7424
【0086】
CLSYETQIMTVEYGLMPIGKIVEEQIDCTVYTVNKNGFVYTQPIAQWHYRGEQEVFEYCLEDGSTIRATKDHKFMTTDGQMLPIDEIFEQGLELKQIHLS(配列番号25)
【0087】
VKIISRQSLGIQPVYDIGVEKDHNFLISDGLIASN(配列番号26)
【0088】
>CspPCC7822:/1-134 Cyanothece sp.PCC 7822
【0089】
CLSYDTEILTVEYGPMPIGKIVEEQIECTVYTVDKNGLVYTQPIAQWHHRGQQEVFEYCLEDGSIIRATKDHKFMTDDGQMLPIEEIFEKGLELKQIIL(配列番号27)
【0090】
VKIISRQLAGNQTVYDLGVEKDHNFLLANGLIASN(配列番号28)
【0091】
>NspPCC7107:/1-137 Nostoc sp.PCC 7107
【0092】
CLSYDTQVLTVEYGLVPIGEIVEKQLECSVFTIDGHGYVYTQAIAQWHNRGQQEVFEYGLEDGSVIRATKDHKFMTTDGQMLPIDEIFERELDLLQVQGLRW(配列番号29)
【0093】
VKIITRKYIGQANVYDIGVAQDHNFVIENRLIASN(配列番号30)
【0094】
>TboIicb1/1-136 Tolypothrix bouteillei Iicb1
【0095】
CLSYDTEILTVEYGFLPIGKIVEKGIECNVYSVDKNGNIYTQPIAQWHDRGEQEVFEYCLENGSVIRATKDHKFMTTSGEMLPIDEIFERGLDLIRVEDLP(配列番号31)
【0096】
VKILTRKSIGKQTVYDIGVERDHNFVIKNGSVASN(配列番号32)
【0097】
>Aov:/1-136 Aphanizomenon ovalisporum DnaE precursor (dnaE) gene
【0098】
CLSADTEILTVEYGFLPIGEIVGKAIECRVYSVDGNGNIYTQSIAQWHNRGEQEVFEYTLEDGSIIRATKDHKFMTTDGEMLPIDEXFARQLDLMQVQGLH(配列番号33)
【0099】
VKITARKFVGRENVYDIGVEHHHNFAIKNGLIASN(配列番号34)
【0100】
>OnvPCC7112:/1-137 Oscillatoria nigro-viridis PCC 7112
【0101】
CLSYDTKILTVEYGPMAIGKIVEEKIECTVYSVDSNGYIYTQSIAQWHRRGQQEVFEYCLEDGSIIRATKDHKFMTVGGQMLPIDEIFEQGLDLKQINSSSD(配列番号35)
【0102】
VKIISRKSLGTQEVYDIGVEREHNFILENSLVASN(配列番号36)
【0103】
>RspPCC7116:/1-135 Rivularia sp.PCC 7116,complete genome
【0104】
CLSYDTEVLTEEFGLIPIGKIVEEKIDCTVYSVDVNGNVYSQPIAQWHNRGMQEVFEYELEDGSTIRATKDHKFMTVDGEMLAIDEIFEKGLELKRVGIY(配列番号37)
【0105】
VKIISRKVLKTENVYDIGLEGDHNFIIKDGLIASN(配列番号38)
【0106】
>TerIMS101:/1-137 Trichodesmium erythraeum IMS101
【0107】
CLTYETEIMTVEYGPLPIGKIVEYRIECTVYTVDKNGYIYTQPIAQWHNRGMQEVYEYSLEDGTVIRATPEHKFMTEDGQMLPIDEIFERNLDLKCLGTLEL(配列番号39)
【0108】
VKIVSRKLAKTENVYDIGVTKDHNFVLANGLIASN(配列番号40)
【0109】
>MspPCC7113:/1-137 Microcoleus sp.PCC 7113,
【0110】
CLSYDSEILTVEYGLMPIGKIVEEGIECTVYSVDSHGYLYTQPIAQWHHRGQQEVFEYDLEDGSVIRATKDHKFMTSEGQMLAIDEIFERGLELKQVKRSQP(配列番号41)
【0111】
VKIVRRKSLGIQTVYDIGVERDHNFLLANGLVASN(配列番号42)
【0112】
>ScyPCC7437:/1-137 Stanieria cyanosphaera PCC 7437
【0113】
CLSYDTEILTVEYGAMPIGKIVKEQIECNVYTVNQNGFIYPQAIAQWHERGKQEIFEYTLDNGLVIRATKDHKFMTIDGQMLPIDEIFERGLELQRINDYSN(配列番号43)
【0114】
VKIVSRKSLGKQPVYDIGVTKDHNFLLSNGVVASN(配列番号44)
【0115】
>CspPCC6303:/1-137 Calothrix sp.PCC 6303
【0116】
CLSYDTEILTWEYGFLKIGEIVEKQILCSVFSVDEQGNVYTQPIAQWHNRGLQELFAYQLEDGGVIRATKDHKFMTTDGQMLAIDEIFERQLDLFQVKGLPE(配列番号45)
【0117】
VKIISRKVLKTENVYDIGLEGDHNFIIKDGLIASN(配列番号46)
【0118】
>Cst/1-134 PCC7202: Cyanobacterium stanieri PCC 7202
【0119】
CLSYDTEVLTVEYGVLPIGKIVEEQIQCTVYSVDQYGFVYTQAIAQWHDRGEQEVFEYELENGATIKATKDHKMMTSDGQMLPIDQIFEQGLDLFMVSF(配列番号47)
【0120】
VKIVKRRSHGIQKVYDIGVAKDHNFLLHNGLVASN(配列番号48)
【0121】
>CspATCC51142:/1-134 Cyanothece sp.ATCC 51142
【0122】
CLSYDTEILTVEYGPMPIGKIVEENINCTVYTVDPNGFVYTQAIAQWHYRGEQEIFEYYLEDGATIRATKDHKFMTMEGKMLPIDEIFENNLDLKQLTL(配列番号49)
【0123】
VKIIGRQSLGVQKVYDIGVEKEHNFLLHNGLIASN(配列番号50)
【0124】
>CspPCC8801:/1-134 Cyanothece sp.PCC 8801
【0125】
CLSYDTEILTVEYGAIPIGKVVEENIDCTVYTVDKNGFVYTQNIAQWHLRGQQEVFEYYLDDGSILRATKDHQFMTLEGEMLPIHEIFERGLELKKIKI(配列番号51)
【0126】
VKIVSYRSLGKQFVYDIGVAQDHNFLLANGSIASN(配列番号52)
【0127】
>Asp:/1-136 Anabaena sp.90 chromosome
【0128】
CLSYDTEILTVEYGFLEIGEIVEKQIECKVYTIDSNGMLYTQSIAQWHNRGQQEVYEYLLENGAIIRATKDHKFMTEAGQMLPIDEIFAQGLDLLQVGVAE(配列番号53)
【0129】
VKIVSRTYVGQANVYDIGVESDHNFVIKNGFIASN(配列番号54)
【0130】
>Aha:/1-137 Aphanothece halophytica
【0131】
CLSYDTEIWTVEYGAMPIGKIVEEKIECSVYTVDENGFVYTQPIAQWHPRGQQEIIEYTLEDGRKIRATKDHKMMTESGEMLPIEEIFQRELDLKVETFHEM(配列番号55)
【0132】
VKIIKRQSLGRQNVYDVCVETDHNFVLANGCVASN(配列番号56)
【0133】
>HspPCC7418:/1-137 Halothece sp.PCC 7418
【0134】
CLSYDTEIWTVEYGAMPIGKIVEEKIECSVYTVDENGFVYTQPIAQWHPRGQQEIIEYTLEDGRKIRATKDHKMMTESGEMLPIEEIFQRELDLKVETFHEM(配列番号57)
【0135】
VKIIKRQSLGRQNVYDIGVETDHNFVLANGCVASN(配列番号58)
【0136】
>CapPCC10605:/1-137 Cyanobacterium aponinum PCC 10605
【0137】
CLSYDTEILTVEYGAISIGKIVEEKINCQVYSVDKNGFIYTQNIAQWHDRGSQELFEYELEDGRIIKATKDHKMMTKDGQMLAINDIFEQELELYSVDDMGV(配列番号59)
【0138】
VKIVKRRSLGVQPVYDIGVEKDHNFILANGLVASN(配列番号60)
【0139】
>Cat:/1-133 Candidatus Atelocyanobacterium thalassa isolate
【0140】
CLSYDTKVLTVEYGPLPIGKVVQENIRCRVYTTNDQGLIYTQPIAQWHNRGKQEIFEYHLDDKTIIRATKEHQFMTVDHVMMPIDEIFEQGLELKKIK(配列番号61)
【0141】
LKIIRRKSLGMHEVFDIGLEKDHNFVLSNGLIASN(配列番号62)
【0142】
>Oli:/1-137 Oscillatoria limnetica ’Solar Lake’ DnaE precursor
【0143】
CLSYNTEVLTVEYGPLPIGKIVDEQIHCRVYSVDENGFVYTQAIAQWHDRGYQEIFAYELADGSVIRATKDHQFMTEDGQMFPIDEIWEKGLDLKKLPTVQD(配列番号63)
【0144】
VKIVRRQSLGVQNVYDIGVEKDHNFLLASGEIASN(配列番号64)
【0145】
>Cen:/1-137 Cyanobacterium endosymbiont of Epithemia turgida
【0146】
CLSYDTEVLTVEYGAIPIGRMVEESLDCTVYTVDKNGFVYTQSIQQWHSRGQQEIFEYCFEDGSIIRATKDHKFMTAEGKMSSIHDIFEQGLELKKIIPWSG(配列番号65)
【0147】
AKIISCKSLGKQSVYDIGVVQDHNFLLANGVVASN(配列番号66)
【0148】
>SspPCC7502:/1-133 Synechococcus sp.PCC 7502
【0149】
CLGYDTPVLTVEYGFMPIGKIVEEKIQCHVYSVDQNGLVFTQAIAQWHNRGQQEVWEYNLDNGDIVRATKDHKFMTIDGQMLPINQIFEQGLELKVIA(配列番号67)
【0150】
VKIVSCKPLRVQTVYDIGVEKDHNFILDNGLVASN(配列番号68)
【0151】
>DsaPCC8305:/1-134 Dactylococcopsis salina PCC 8305
【0152】
CLSYDTEVLTEEYGAIPIGKIVEERMNCHVYSVDENGFIYSQPIAQWHPRGEQEVVEYTLEDGKIIRATADHKMMTETGEMLPIEQIFQQQLDLKISNQ(配列番号69)
【0153】
VKIINRQSLGKQTVYDIGVEKDHNFILGNGLVASN(配列番号70)
【0154】
>CstPCC7417:/1-137 Cylindrospermum stagnale PCC 7417
【0155】
CLSYDTEILTVEYGFIPIGEIVEKRIECSVYSVDNHGNVYTQPIAQWHNRGLQEVFEYCLEDGSTIRATKDHKFMTTDKEMLPIDEIFERGLDLLRVEGLPI(配列番号71)
【0156】
VKIIMRSYVGRENVYDIGVERDHNFVAKNGLIAAN(配列番号72)
【0157】
>SspPCC6803:/1-137 Synechocystis sp.PCC 6803
【0158】
CLSFGTEILTVEYGPLPIGKIVSEEINCSVYSVDPEGRVYTQAIAQWHDRGEQEVLEYELEDGSVIRATSDHRFLTTDYQLLAIEEIFARQLDLLTLENIKQ(配列番号73)
【0159】
VKVIGRRSLGVQRIFDIGLPQDHNFLLANGAIAAN(配列番号74)
【0160】
>GspPCC7407:/1-137 Geitlerinema sp.PCC 7407
【0161】
CLSYETPVMTVEYGPLPIGRIVEEQLDCTVYSVDEQGHVYTQPVAQWHHRGLQEVVEYELEDGRRLRATADHRFMTETGEMLPLAEIFERGLELRQVALRVP(配列番号75)
【0162】
VKIVSRRSLGMQLVYDIGVAADHNFVLADGLIAAN(配列番号76)
【0163】
>SspPCC6714:/1-137 Synechocystis sp.PCC 6714
【0164】
CLSFDAEILTVEYGPLSIGKIVGEEINCSVYSVDPQGRIYTQAIAQWHDRGVQEVFEYELEDGSVIRATPDHRFLTTDYELLAIEEIFARQMDLLTLTNLKL(配列番号77)
【0165】
VKVVRRRSLGMHRVFDIGLAQDHNFLLANGAIAAN(配列番号78)
【0166】
>MaePCC7806:/1-135 Microcystis aeruginosa PCC 7806
【0167】
CLGGETLILTEEYGLLPIAKIVSEEVNCTVYSVDKNGFVYSQPISQWHERGLQEVFEYTLENGQTIQATKDHKFMTNDGEMLAIDTIFERGLDLKSSDFS(配列番号79)
【0168】
VKIISRQSLGRKPVYDIGVEKDHNFLLGNGLIASN(配列番号80)
【0169】
>MaeNIES843:/1-135 Microcystis aeruginosa NIES-843 DNA
【0170】
CLGGETLILTEEYGLLPIAKIVSEEINCTVYTVDQNGFVYSQPISQWHERGLQEVFEYTLENGQTIQATKDHKFMTSDGEMLAIDTIFERGLDLKSSDFS(配列番号81)
【0171】
VKIIGRQSLGRKPVYDIGVEKDHNFLLGNGLIASN(配列番号82)
【0172】
>AmaMBIC11017:/1-137 Acaryochloris marina MBIC11017,
【0173】
CLSYDTPVLTLEYGWLPIGQVVQEQIECQVFSINERGHLYTQPIAQWHHRGQQEVFEYTLADGSTIQATAEHQFMTTDGQMYPVQQIFEEGLSLKQLPLPWQ(配列番号83)
【0174】
VKIIQRRSLGLQSVYDIGLAQDHNFVMANGWVAAN(配列番号84)
【0175】
>LspPCC7376:/1-137 Leptolyngbya sp.PCC 7376
【0176】
CLDGETPIVTVEYGVLPIREIVEKELLCSVYSIDENGFVYTQPVEQWHQRGDRQMFEYQLDNGGVIRATPDHKFLTTEGEMVAIDEIFEKGLNLAEFAPAD(配列番号85)
【0177】
VKILRRHSIGKAKTYDIGVSKNHNFLLANGLFASN(配列番号86)
【0178】
>SelPCC6301:/1-137 Synechococcus elongatus PCC 6301
【0179】
CLAADTEVLTVEYGPIAIGKLVEENIRCQVYCCNPDGYIYSQPIGQWHQRGEQEVIEYELSDGRIIRATADHRFMTEEGEMLSLDEIFERSLELKQIPTPLL(配列番号87)
【0180】
VKIVRRRSLGVQPVYDLGVATVHNFVLANGLVASN(配列番号88)
【0181】
>SspPCC6312:/1-137 Synechococcus sp.PCC 6312
【0182】
CLSADTELYTVEYGWLPIGRLVEEQIECQVLSVNAHGHVYSQPIAQWHRRAWQEVFEYQLETGGTIKATTDHQFLTTDGQMYRIEDIFQRGLDLWQLPPDRF(配列番号89)
【0183】
VKIISRCSLGIQPVYDIGVAQDHNFVIRGGLVASN(配列番号90)
【0184】
>Tel:/1-137 Thermosynechococcus elongatus BP-1 DNA
【0185】
CLSGETAVMTVEYGAVPIRRLVQERLSCHVYSLDGQGHLYTQPIAQWHFQGFRPVYEYQLEDGSTICATPDHRFMTTRGQMLPIEQIFQEGLELWQVAIAPR(配列番号91)
【0186】
GKIVGRRLMGWQAVYDIGLAADHNFVLANGAIAAN(配列番号92)
【0187】
>Tsp:/1-137 Thermosynechococcus sp.NK55 genome
【0188】
CLSGETAVMTVEYGAVPIRRLVQERLTCHVYSLDAQGHLYTQPIAQWHFQGFRPVYEYQLEDGSTIWATPDHRFMTTRGQMLPIEQIFQEGLELWQGPIAPS(配列番号93)
【0189】
CKIVGRQLVGWQAVYDIGVARDHNFLLANGAIAAN(配列番号94)
【0190】
>Tvu:/1-137 Thermosynechococcus vulcanus DnaE precursor
【0191】
CLSGETAVMTVEYGAIPIRRLVQERLICQVYSLDPQGHLYTQPIAQWHFQGFRPVYAYQLEDGSTICATPDHRFMTTSGQMLPIEQIFREGLELWQVAIAPP(配列番号95)
【0192】
CKIVGRRLVGWQAVYDIGLAGDHNFLLANGAIAAN(配列番号96)
【0193】
>SspPCC7002:/1-137 Synechococcus sp.PCC 7002
【0194】
CLAGGTPVVTVEYGVLPIQTIVEQELLCHVYSVDAQGLIYAQLIEQWHQRGDRLLYEYELENGQMIRATPDHRFLTTTGELLPIDEIFTQNLDLAAWAVPDS(配列番号97)
【0195】
VKIIRRKFIGHAPTYDIGLSQDHNFLLGQGLIAAN(配列番号98)
【0196】
>ShoPCC7110:/1-136 Scytonema hofmanni PCC 7110 contig00136
【0197】
CLSYDTEVLTAEYGFLPIGKIVEKAIECTVYSVDNDGNIYTQPIAQWHDRGQQEVFEYSLDDGSVIRATKDHKFMTTGGQMLPIDEIFERGLDLMRIDSLP(配列番号99)
【0198】
VKILTRKSIGKQTVYDIGVERDHNFVIKNGLVASN(配列番号100)
【0199】
>WinUHHT291/1-136 Westiella intricata UH HT-29-1
【0200】
CLSYDTEILTVEYGFLPIGEIVEKRIECTVYTVDTNGYVYTQAIAQWHNRGEQEVFEYALEDGSIIRATKDHKFMTSEGQMLPIDEIFVKGLDLLQVQGLP(配列番号101)
【0201】
VKIITRKFLGIQNVYDIGVEQNHNFVIKNGLVASN(配列番号102)
【0202】
>FspPCC9605:/1-136 Fischerella sp.PCC 9605 FIS9605DRAFT
【0203】
CLSYDTEILTVEYGFLPIGEIVEKGIECTVYTVDNNGNVYTQTIAQWHNRGQQEVFEYCLEDGSVIRATKDHKFMTTDGQMLPIDEIFARGLDLLQVKNLP(配列番号103)
【0204】
VKIVTRRPLGTQNVYDIGVESDHNFVIKNGLVASN(配列番号104)
【0205】
>MrePCC10914:/1-137 Mastigocladopsis repens PCC 10914
【0206】
CLSYDTEVLTVEYGFLPIGEIVEKSIECSVYTVDSNGNVYTQPIAQWHNRGQQEVFEYCLEDGSIIRATKDHKFMTIHGQMLPIDEIFERGLELMKIQGLPE(配列番号105)
【0207】
AKIITRKSLGTQNVYDIGVERDHNFVTRDGFIASN(配列番号106)
【0208】
>ShoUTEX2349:/1-137 [Scytonema hofmanni] UTEX 2349
【0209】
CLSYNSEVLTVEYGFLPIGKIVEKGIECSVYSVDSYGKIYTQVIAQWHNRGQQEVFEYCLEDGTIIQATKDHKFMTVDGQMLPIDEIFERGLDLMQVQGLPD(配列番号107)
【0210】
VKIITRKSLGTQNVYDIGVSSDHNFVMKNGLIASN(配列番号108)
【0211】
>AspPCC7108:/1-137 Anabaena sp.PCC 7108 Ana7108scaffold_2_Cont3
【0212】
CLSSDTEVLTVEYGLIPIGEIIEKRIDCSVFSVDKNGNIYTQPIAQWHDRGIQELYEYCLDDGSTIRATKDHKFMTTAGEMLPIDEIFERGLDLLKVHNLPQ(配列番号109)
【0213】
VKIITRNYVGKENVYDIGVERDHNFAIKNGLIASN(配列番号110)
【0214】
>FspPCC9339:/1-137 Fischerella sp.PCC 9339 PCC9339DRAFT
【0215】
CLSYDTEVLTVEYGFLPIGEIVEKRIECTVYTVDHNGYVYTQPIAQWHNRGYQEVFEYGLEDGSVIRATKDHKFMTSEGQMLPIDEIFARELDLLQVTGLVN(配列番号111)
【0216】
VKIVTRRLLGIQNVYDIGVEQNHNFVIKNGLVASN(配列番号112)
【0217】
>Csp336:/1-137 Calothrix sp.336/3
【0218】
CLSYDTEIFTVEYGFLPIGEIVEKRLECTVLTVDNHGNIYSQPIAQWHHRGQQQIYEYGLEDGSVIRATKDHKFMTTDGQMLPIDEIFERGLDLLQVTNLDN(配列番号113)
【0219】
VKVITRKLADTENVYDIGVENHHNFLIKNGLVASN(配列番号114)
【0220】
>FthPCC7521:/1-136 Fischerella thermalis PCC 7521
【0221】
CLSYETEILTVEYGFLPIGEIVEKRIECSVYTVDNNGYVCTQPIAQWHNRGYQEVFEYGLEDGSVIRATKDHKFMTIDRQMLPIDEIFARGLDLLQVTGLP(配列番号115)
【0222】
VKIITRKSLGTQNVYDIGVEQNHNFVIKNGLVASN(配列番号116)
【0223】
>CyaPCC7702/1-137 cyanobacterium PCC 7702 Chl7702
【0224】
CLSYDTEILTVEYGFLSIGEIVEKEIECTVYTVDSNGYIYTQPIAQWHEQGEQEIFEYSLEDGSTIRATKDHKFMTIEGEMLPIDQIFARQLDLMQITGLPQ(配列番号117)
【0225】
VKISTKKSLGKQKVYDIGVVRDHNFIIKNGFVASN(配列番号118)
【0226】
>FspPCC9431:/1-136 Fischerella sp.PCC 9431
【0227】
CLSYDTEVLTVEYGFLPIGEIVEKRIECTVYTVDTNGYVYTQAIAQWHNRDEQEVFEYALEDGSIIRATKDHKFMTSEGQMLPIDEIFAKGLDLLQVQGLP(配列番号119)
【0228】
VKIVTRKFLGIQNVYDIGVEQNHNFVIKNGLVASN(配列番号120)
【0229】
>FmuPCC7414:/1-137 Fischerella muscicola PCC 7414
【0230】
CLSYETEILTVEYGFLPIGEIVEKRIECSVYTVDNNGYVCTQTIAQWHNRGYQEVFEYGLEDGSVIRATKDHKFMTIDRQMLPIDEIFARGLDLLQVKGLPE(配列番号121)
【0231】
VKIITRQSLGTQNVYDIGVEQNHNFVIKNGLVASN(配列番号122)
【0232】
>FmuPCC73103:/1-137 Fischerella muscicola SAG 1427-1 = PCC 73103
【0233】
CLSYDTEVLTVEYGFLPIGEIVEKTIECNVFTVDSNGYVYTQPIAQWHNRGYQEVFEYGLEDGSVIRATKDHKFMTSEGKMLPIDEIFARELDLLQVTGLIN(配列番号123)
【0234】
VKIVTRKFLGIQNVYDIGVEQNHNFVIKNGLVASN(配列番号124)
【0235】
>Lae:/1-137 Lyngbya aestuarii BL J laest3.contig.3
【0236】
CLSYDTEILTVEYGAIPIGKVVDEKIECTVYSVDKNGLIYTQPIAQWHNRGKQEVFEYSLEDGSTIRATKDHKFMTMDNQMLPIDEILEKGLELKQVNADSV(配列番号125)
【0237】
VKIVSRKSLDSQTVYDIGVETDHNFLLANGSVASN(配列番号126)
【0238】
>MspPCC7126:/1-135 Microchaete sp.PCC 7126
【0239】
CLSYKTQVLTVEYGLLAIGEIVEKNIECSVFSVDIHGNVYTQPIAQWHHRGQQEVFEYGLEDGSIIRATKDHKFMTTQGEMLPIDEIFARGLDLLQVKGV(配列番号127)
【0240】
VKIITRKYIGKENVYDIGVEQDHNFAIKNGLIAAN(配列番号128)
【0241】
>Lsp:/1-137 Leptolyngbya sp.JSC-1
【0242】
CLSYDTEILTVEYGALPIGKIVENQMICSVYSIDNNGYIYIQPIAQWHNRGQQEVFEYILEDGSIIRSTKDHKFMTKGGEMLPIDEIFERGLELAQVTRLEQ(配列番号129)
【0243】
VKIISRRSVGVQSVYDIGVKQDHNFFLRNGLIASN(配列番号130)
【0244】
>CwaWH8501:/1-137 Crocosphaera watsonii WH8501
【0245】
CLSYDTEILTVEYGAMYIGKIVEENINCTVYTVDKNGFVYTQTIAQWHNRGEQEIFEYDLEDGSKIKATKDHKFMTIDGEMLPIDEIFEKNLDLKQVVSHPD(配列番号131)
【0246】
VKIIGCRSLGTQKVYDIGVEKDHNFLLANGSIASN(配列番号132)
【0247】
>CchPCC7420:/1-135 Coleofasciculus chthonoplastes PCC 7420(Mcht)
【0248】
CLSYDTQILTVEYGAVAIGEIVEKQIECTVYSVDENGYVYTQPIAQWHNRGEQEVFEYLLEDGATIRATKDHKFMTDEDQMLPIDQIFEQGLELKQVEVL(配列番号133)
【0249】
VKIIGRKPLGTQPVYDIGVERDHNFLLFNGSVASN(配列番号134)
【0250】
>CspPCC6712/1-133
【0251】
CLSYDTEVLTVEYGAIPIGKIVEEKIACNVYSVDKNGFVYTQPIAQYHDRGIQEVFEYRLENGSVIRATKDHKMMTADGQMLPIDEIFKQNLDLKQLN(配列番号135)
【0252】
VKIISRQSLGKQSVFDIGVAKDHNFLLANGLVASN(配列番号136)
【0253】
>AflNIES81:/1-132 Aphanizomenon flos-aquae NIES-81
【0254】
CLSYDTEILTVEYGFLQIGEIVEKQIECKVYTVDSNGILYTQSIAQWHNRGQQEVYEYLLENGAIIRATKDHKFMTEEGQMLPIDEIFSQGLDLLQV(配列番号137)
【0255】
VKIISRTYVGQANVYDIGVENDHNFVIKNGFIAAN(配列番号138)
【0256】
>Rbr:/1-137 Raphidiopsis brookii D9 D9_5,
【0257】
CLSYETEVLTLEYGFLPIGEIVDKQMVCTVFSVNDSGNVYTQPIGQWHDRGVQELYEYCLDDGSTIRATKDHKFMTTQGEMVPIDEIFHQGWELVQVSGTMN(配列番号139)
【0258】
VKIVSRRYLGKADVYDIGVAKDHNFIIKNGLVASN(配列番号140)
【0259】
>CspCCy0110:/1-134 Cyanothece sp.CCY0110 1101676644604
【0260】
CLSYDTEILTVEYGPMPIGKIVEENINCSVYTVNKNGFVYTQSIAQWHHRGEQEVFEYYLEDGETIRATKDHKFMTTEGKMLPIDEIFENNLDLKKLTV(配列番号141)
【0261】
VKIIERRSLGKQNVYDIGVEKDHNFLLSNNLIASN(配列番号142)
【0262】
>XspPCC7305:/1-135 Xenococcus sp.PCC 7305
【0263】
CLSADTEVLTVEYGAISIGKIVEERIECTVYSVDANGFVYTQEIAQWHNRGEQEVFEYMLDDGSVIRATKDHKLMTIDGQMVAIDEIFSQGLELKQVLGL(配列番号143)
【0264】
VKIVSRKSLGTQTVYDLGVARDHNFLLANGTVASN(配列番号144)
【0265】
>PspPCC7319:/1-135 Pleurocapsa sp.PCC 7319
【0266】
CLSYDTEIYTVEYGALPIGKIVESRIKCTVLTVDKNGLVYSQPIVQWHDRGIQEVFEYTLDNGATIRATKDHKFMTVEGQMLPIDEIFELGLELKEIQQF(配列番号145)
【0267】
VKIISRQSLGKQSVYDIGVAKDHNFLLANGMVASN(配列番号146)
【0268】
>CraCS505:/1-137 Cylindrospermopsis raciborskii CS-505
【0269】
CLSYETEVLTLEYGFVPIGEIVNKQMVCTVFSLNDSGNVYTQPIGQWHDRGVQDLYEYCLDDGSTIRATKDHKFMTTQGEMVPIDEIFHQGWELVQVSGISK(配列番号147)
【0270】
VKIVSRRYLGKADVYDIGVAKDHNFIIKNGLVASN(配列番号148)
【0271】
>SmaPCC6313/1-129 Spirulina major PCC 6313
【0272】
CLTYDTLVLTVEYGPVPIGKLVEAQINCQVYSVDANGFIYTQAIAQWHDRGQRQVYEYTLEDGSTIRATPDHKFMTATGEMLPIDQIFEQGLDL(配列番号149)
【0273】
VKIIHRRALPPQSVYDIGVERDHNFLLPSGWVASN(配列番号150)
【0274】
>SsuPCC9445:/1-131 Spirulina subsalsa PCC 9445
【0275】
CLSYDTKIITVEYGAIAIGTIVEQGLHCHVYSVDPNGFIYTQPIAQWHQRGEQEVFAYTLENGSIIQATKDHKFMTQQGKMLPIDTIFEQGLDLLQ(配列番号151)
【0276】
VKIIKRTSLGVRPVYDIGVIQDHNFLLENGLVASN(配列番号152)
【0277】
>MaePCC9807:/1-135 Microcystis aeruginosa 9807
【0278】
CLGGETLILTEEYGLLPIAKIVSEEINCTVYSVDKNGFIYSQPISQWHERGLQEVFEYTLENGQTIQATKDHKFMTSDGEMLAIDTIFERGLDLKSSDFS(配列番号153)
【0279】
VKIISRQFLGRKPVYDIGVEKDHNFLLGNGLIASN(配列番号154)
【0280】
>MspGI1:/1-130 Myxosarcina sp.GI1 contig_13
【0281】
CLSYDTEVLTLKYGALPIGEIVEKRINCHVYTRAESGFFYIQSIEQWHDRGEQEVFEYTLENGATIKATKDHKFMTSGGQMLPIDEIFERGLDLL(配列番号155)
【0282】
VKIVSRKSLGKQPVYDLGVAKDHNFLLANGTVASN(配列番号156)
【0283】
>LspPCC6406:/1-136 Leptolyngbya sp.PCC 6406
【0284】
CLSADTQLLTVEYGPLEIGRIVEEQIACHVYSVDANGFVYTQPIAQWHSRGEQEIFEYQLEDGRTLRATADHKFMTTTGEMGRINDIFEQGLDLKQIDLPQ(配列番号157)
【0285】
VKVVSRQSLGVQPVYDIGVATDHNFLLADGLVASN(配列番号158)
【0286】
>AspCCMEE5410:/1-132 Acaryochloris sp.CCMEE 5410
【0287】
CLSYDTPVLTLEYGWLPIGQVVQEQIECQVFSINERGHLYTQPIAQWHHRGQQEVFEYTLTDGSTIQATAEHQFMTTDGQMYPIQQIFEEGLSLKQL(配列番号159)
【0288】
VKITQRRSLGLQSVYDIGLAQDHNFVIANGWVAAN(配列番号160)
【0289】
>GhePCC6308:/1-133 Geminocystis herdmanii PCC 6308
【0290】
CLSYDTEVLTVEFGAIPMGKIVEERLNCQVYSVDKNGFIYTQNIAQWHDRGVQEVFEYELEDGRIIKATKDHKMMIENCEMVEIDRIFEEGLELFEVN(配列番号161)
【0291】
VKILKRRSISSQQVYDIGVEKDHNFLLANGLVASN(配列番号162)
【0292】
>NnoPCC7104:/1-133 Nodosilinea nodulosa PCC 7104
【0293】
CLSADTELLTLEYGPLTIGEIVAKRIPCHVFSVDESGYVYTQPVAQWHQRGHQEVFEYQLDDGTTIRATADHQFMTELGEMMAIDEIFQRGLELKQVE(配列番号163)
【0294】
VKIISRQSLGVQPVYDIGVARDHNFLLADGQVASN(配列番号164)
【0295】
>RlaKORDI51-2:/1-137 Rubidibacter lacunae KORDI 51-2
【0296】
CLSYDTEVLTVEYGPLAIGTIVSERLACTVYTVDRSGFLYAQAISQWHERGRQDVFEYALDNGMTIRATKDHKLMTADGQMVAIDDIFTQGLTLKAIDTAAF(配列番号165)
【0297】
MKIVSRKSLGVQHVYDIGVARDHNFLLANGAIASN(配列番号166)
【0298】
>CfrPCC9212/1-136 Chlorogloeopsis fritschii PCC 9212
【0299】
CLSYDTAILTVEYGFLPIGEIVEKGIECTVYTVDSNGYIYTQPIAQWHNRGEQELFEYSLEDGSIIRATKDHKFMTIDGQMLPIDEIFARKLELMQVKGLP(配列番号167)
【0300】
VKIIAKKSLGTQNVYDIGVERDHNFVIKNGLVASN(配列番号168)
【0301】
>RinHH01:/1-137 Richelia intracellularis HH01 WGS project
【0302】
CLSYDTQILTVEHGPMSIGEIVEKCLECHVYTVNKNGNICIQTITQWHFRGEQEIFEYELEDGSFIQATKDHKFMTTTGEMLPIHEIFTNGLEILQLSKSLL(配列番号169)
【0303】
VKILARKSLGTQKVYDIGVNDDHNFALSNSFIASN(配列番号170)
【0304】
>SspPCC7117/1-137
【0305】
CLAGDTPVVTVEYGVLPIQTIVEQELLCQVYSVDAQGLIYTQPIEQWHNRGDRLLYEYELENGQMIRATPDHKFLTTTGELLPIDEIFTQNLDLAAWAVPDS(配列番号171)
【0306】
VKIIRRKFIGHAPTYDIGLSQDHNFLLGQGLIAAN(配列番号172)
【0307】
>SspPCC8807/1-137
【0308】
CLAGDTPVVTVEYGVLPIQTIVEQELLCHVYSVDAQGLIYTQPIEQWHQRGDRFLYEYELENGQMIRATPDHKFLTTTGKLLPIDEIFTQNLDLAAWAVPDS(配列番号173)
【0309】
VKIIRRKFIGHAPTYDIGLSQDHNFLLGQGFIAAN(配列番号174)
【0310】
>SspNKBG042902:/1-137 Synechococcus sp.NKBG 042902
【0311】
CLAGDTPVVTVEYGVLPIQTIVEQELLCHVYSVDAQGLIYTQPIEQWHQRGDRLLYEYELENGQMIRATPDHKFLTTTGELLPIDEIFTQNLDLAAWAVPDS(配列番号175)
【0312】
VKILRRKFIGRAPTYDIGLSQDHNFLLGQGLVAAN(配列番号176)
【0313】
>SspNKBG15041:/1-129 Synechococcus sp.NKBG15041
【0314】
CLAGDTPVVTVEYGVLPIRTIVDQELLCHVYSLDPQGFIYAQPVEQWHRRGDRLLYEYELETGAVIRATPDHKFLTATGEMLPIDEIFVRNLDL(配列番号177)
【0315】
VKIIRRNLIGEAATYDIGLGKDHNFLLGQGLIASN(配列番号178)
【0316】
>SspPCC73109/1-130
【0317】
CLAGGTPVVTVEYGVLPIQTIVEQELLCHVYSVDAQGLIYTQPIEQWHQRGDRLLYEYELENGQMIRATPDHKFLTTTGELLPIDEIFTQNLDLL(配列番号179)
【0318】
VKIIRRKFIGHAPTYDIGLSQDHNFLLGQGLIAAN(配列番号180)
【0319】
>SspPCC7003/1-130
【0320】
CLAGDTPVVTVEYGVLPIQTIVEQELLCHVYSVDAQGLIYTQPIEQWHKRGDRLLYEYELENGQIIRATPDHKFLTTTGEMRPIDEIFAKNLSLL(配列番号181)
【0321】
VKIIRRKFVGHAPTYDIGLSQDHNFLLGQGLIAAN(配列番号182)
【0322】
>CspPCC8802/1-134 : Cyanothece sp.PCC 8802
【0323】
CLSYDTEILTVEYGAIPIGKVVEENIDCTVYTVDKNGFVYTQNIAQWHLRGQQEVFEYYLDDGSILRATKDHQFMTLEGEMLPIHEIFERGLELKKIKI(配列番183)
【0324】
VKIVSYRSLGKQFVYDIGVAQDHNFLLANGSIASN(配列番号184)
【0325】
>SelPCC7942:/1-137 Synechococcus elongatus PCC 7942
【0326】
CLAADTEVLTVEYGPIAIGKLVEENIRCQVYCCNPDGYIYSQPIGQWHQRGEQEVIEYELSDGRIIRATADHRFMTEEGEMLSLDEIFERSLELKQIPTPLL(配列番号185)
【0327】
VKIVRRRSLGVQPVYDLGVATVHNFVLANGLVASN(配列番号186)
【0328】
>CfrPCC6912:/1-137 Chlorogloeposis fritschii PCC 6912
【0329】
CLSYDTAILTVEYGFLPIGEIVEKGIECTVYTVDSNGYIYTQPIAQWHNRGEQELFEYSLEDGSIIRATKDHKFMTIDGQMLPIDEIFARKLELMQVKGLPE(配列番号187)
【0330】
VKIIAKKSLGTQNVYDIGVERDHNFVIKNGLVASN(配列番号188)
【0331】
>CspATC51472:/1-132 Cyanothece sp.ATCC 51472
【0332】
CLSYDTEILTVEYGPMPIGKIVEENINCTVYTVDPNGFVYTQAIAQWHYRGEQEIFEYYLEDGATIRATKDHKFMTMEGKMLPIDEIFENNLDLKQL(配列番号189)
【0333】
VKIIGRQSLGVQKVYDIGVEKEHNFLLHNGLIASN(配列番号190)
【0334】
>Lma:/1-132 Lyngbya majuscula
【0335】
CLSYDTEIITVEYGPIAIGEIVEKGIPCTVYSVDSNGYVYTQPIAQWHNRGEQEVFEYTLDDGSVIRATKDHKFMTIDGQMLPIDEIFEGGLELKQL(配列番号191)
【0336】
VKIISRKSLGTQPVYDIGVKDDHNFILANGMVASN(配列番号192)
【0337】
>CspESFC/1-137
【0338】
CLSYDTEVLTVEYGAVPIGKLVEEKLNCSVYTVDPNGYIYTQAIAQWHDRGIQEVFEYQLEDNTIIRATKDHKFMTEDHQMLPIDEIFERGLELKKCPQPQQ(配列番号193)
【0339】
VKIIRRRSLGFQPVYDIGLEQDHNFLLNQGAIASN(配列番号194)
【0340】
>SspPCC7002:/1-129 Synechococcus sp.PCC 7002
【0341】
CLAGGTPVVTVEYGVLPIQTIVEQELLCHVYSVDAQGLIYAQLIEQWHQRGDRLLYEYELENGQMIRATPDHRFLTTTGELLPIDEIFTQNLDL(配列番号195)
【0342】
VKIIRRKFIGHAPTYDIGLSQDHNFLLGQGLIAAN(配列番号196)
【0343】
>AmaMBIC11017:/1-132 Acaryochloris marina MBIC11017
【0344】
CLSYDTPVLTLEYGWLPIGQVVQEQIECQVFSINERGHLYTQPIAQWHHRGQQEVFEYTLADGSTIQATAEHQFMTTDGQMYPVQQIFEEGLSLKQL(配列番号197)
【0345】
VKIIQRRSLGLQSVYDIGLAQDHNFVMANGWVAAN(配列番号198)
【0346】
>Mae905:/1-129 Microcystis aeruginosa DIANCHI905
【0347】
CLGGETLILTEEYGLLPIAKIVSEEVNCTVYSVDKNGFVYSQPISQWHERGLQEVFEYTLENGQTIQATKDHKFMTNDGEMLAIDTIFERGLDL(配列番号199)
【0348】
VKIISRQSLGRKPVYDIGVEKDHNFLLGNGLIASN(配列番号200)
【0349】
>AciAWQC310F:/1-125 AWQC: Anabaena circinalis AWQC310F
【0350】
CLSYDTEILTVEYGFLEIGEIVEKQIECKVYTVDSNGILYTQPIAQWHHRGQQEVYEYLLENGAIIRATKDHKFMTEAGEMLPIDDIFTQ(配列番号201)
【0351】
VKIISRTYVGQANVYDIGVENDHNFVIKNGFVAAN(配列番号202)
【0352】
>AciAWQC131C:/1-125 Anabaena circinalis AWQC131C
【0353】
CLSYDTEILTVEYGFLEIGEIVEKQIECRVYTVDSNGILYTQPIAQWHYRGQQEVYEYLLENGAIIRATKDHNFMTEAGEMLPIDDIFTQ(配列番号203)
【0354】
IKIISRKYVGQANVYDIGVENDHNFVIKNGFVAAN(配列番号204)
【0355】
>CspUCYN:/1-124 Cyanobacterium sp.UCYN-A2
【0356】
CLSYDTKVLTVEYGPLPIGKVVQENIRCRVYTTNDQGLIYTQPIAQWHNRGKQEIFEYHLDDKTIIRATKEHQFMTVDHVMMPIDEIFEQ(配列番号205)
【0357】
KIIRRKSLGMHEVFDIGLEKDHNFVLSNGLIASN(配列番号206)
【0358】
>Pst:/1-129 Planktothrix st147 : st147_cleanDRAFT_c6
【0359】
CLSYDTEVLTVEYGLIPISKIVEEKIECTVYTVNNQGYVYTQPIAQWHNRGEQEVFEYYLEDGSVIRATKDHKFMTVEGQMLPIDEIFEKELDL(配列番号207)
【0360】
VKIISRKSLGTQPVYDIGVQEDHNFVLNNGLVASN(配列番号208)
【0361】
>PlaCYA98/1-129 : Planktothrix NIVA-CYA 98
【0362】
CLSYDTEILTVEYGLMPIGKIVKEKIECTVYTVNNQGYVYTQPIAQWHHRGEQEVFEYCLEDGSVIRATKDHKFMTVQGQMLPIDEIFEKELDL(配列番号209)
【0363】
VKIISRKSLGTQPVYDIGVQEDHNFLLNNGLVASN(配列番号210)
【0364】
>FdiUTEX481:/1-137 Fremyella diplosiphon UTEX 481
【0365】
CLSYDTEVLTVEYGLIPIGEIVEKRLECSVYSVDINGNVYTQPIAQWHHRGQQEVFEYALEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLLQVPHLPE(配列番号211)
【0366】
VKIVTRRAIGAANVYDIGVEQDHNFAIKNGLIAAN(配列番号212)
【0367】
>Pst585:/1-129 Planktothrix sp.585: Length=1586997
【0368】
CLSYDTEILTVEYGLIPISKIVEEKIECTVYTVNNQGYVYTQPIAQWHNRGEQEVFEYYLEDGSVIRATKDHKFMTVDGQMLPIDEIFEKELDL(配列番号213)
【0369】
VKIISRKSLGTQPVYDIGVQEDHNFVLNNGLVASN(配列番号214)
【0370】
>NpuPCC73102/1-137
【0371】
CLSYETEILTVEYGLLPIGKIVEKRIECTVYSVDNNGNIYTQPVAQWHDRGEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPIDEIFERELDLMRVDNLPN(配列番号215)
【0372】
IKIATRKYLGKQNVYDIGVERDHNFALKNGFIASN(配列番号216)
【0373】
>CthPCC7203:/1-137 Chroococcidiopsis thermalis PCC 7203
【0374】
CLSYDTEILTVEYGAIPIGKIVEERIECTVYSVDNNGFIYTQPIAQWHNRGQQEVFEYCLEDGSIIRATKDHKFMTFEGKMLPIDEIFEQELDLKQVKSIQN(配列番号217)
【0375】
VKIISRKSLGIQPVYDIGVERDHKFVLKNGLVASN(配列番号218)
【0376】
>NspCCY9414:/1-137 Nodularia spumigena CCY9414 genome
【0377】
CLSYDTEILTVEYGYIPIGEIVEKAIECSVYSVDNNGNVYTQPIAQWHNRGEQEVFEYSLEDGSTIRATKDHKFMTTDGQMLPIDEIFAQELDLLQVHGLPK(配列番号219)
【0378】
VKITARKFVGRENVYDIGVERYHNFAIKNGLIASN(配列番号220)
【0379】
>AcyPCC7122:/1-137 Anabaena cylindrica PCC 7122
【0380】
CLSYDTEVLTVEYGFIPIGEIVEKRIECSIFSVDKNGNVYTQPIAQWHNRGRQEIYEYCLDDGSKIRATKDHKFMTTAGEMLPIDEIFERDLDLLKVEGLPE(配列番号221)
【0381】
VKIISRQYLGQADVYDIGVEEDHNFAIKNGFIASN(配列番号222)
【0382】
>CspPCC7507:/1-137 Calothrix sp.PCC 7507,complete genome
【0383】
CLSYDTEVLTVEYGLLPIGEIVEKGIECRVFSVDNHGNVYTQPIAQWHNRGQQEVFEYGLDDGSVIRATKDHKFMTTDGKMLPIDEIFERGLDLLQVQGLPE(配列番号223)
【0384】
VKVITRKYIGKENVYDIGVELDHNFAIRNGLVASN(配列番号224)
【0385】
>NspPCC7524:/1-137 Nostoc sp.PCC 7524
【0386】
CLSYDTEILTVEYGFLPIGEIVEKGIECTVFSVASNGIVYTQPIAQWHNRGQQEIFEYCLEDGSIIRATKDHKFMTQDGQMLPIDEIFACELDLLQVQGLPE(配列番号225)
【0387】
VKVVTRKYIGKENVYDIGVERDHNFVIRNGLVASN(配列番号226)
【0388】
>Naz0708:/1-137 ’Nostoc azollae’ 0708
【0389】
CLSYKTEVLTVEYGLIPIGEIVEKRIECSLFSVDENGNIYTQPIAQWHHRGVQEVYEYCLDDGTIIRATKDHKFMTTIGEMLPIDEIFERDLNLLQVNGLPT(配列番号227)
【0390】
VKIISRQFLGPANVYDIGVAQDHNFAIKNGLIASN(配列番号228)
【0391】
>NspPCC7120:/1-137 Nostoc sp.PCC 7120 DNA
【0392】
CLSYDTEVLTVEYGFVPIGEIVEKGIECSVFSINNNGIVYTQPIAQWHHRGKQEVFEYCLEDGSIIKATKDHKFMTQDGKMLPIDEIFEQELDLLQVKGLPE(配列番号229)
【0393】
IKIASRKFLGVENVYDIGVRRDHNFFIKNGLIASN(配列番号230)
【0394】
>AvaATCC29413/1-137 Anabaena variabilis ATCC 29413
【0395】
CLSYDTEVLTVEYGFVPIGEIVDKGIECSVFSIDSNGIVYTQPIAQWHHRGKQEVFEYCLEDGSIIKATKDHKFMTQDGKMLPIDEIFEQELDLLQVKGLPE(配列番号231)
【0396】
IKIASRKFLGVENVYDIGVGRDHNFFVKNGLIASN(配列番号232)
【0397】
>PspPCC7327:/1-135 Pleurocapsa sp.PCC 7327.
【0398】
CLSYDTKILTVEYGAMPIGKIVEEQIDCTVYTVNQNGFVYTQPIAQWHDRGKQEIFEYCLEDGSIIRATKDHKFMTTDGQMLPIDKIFEKGLDLKTINCD(配列番号233)
【0399】
VKILSRKSLGIQSVYDIGVEKDHNFLLANGLVASN(配列番号234)
【0400】
>CspPCC7424:/1-135 Cyanothece sp.PCC 7424
【0401】
CLSYETQIMTVEYGLMPIGKIVEEQIDCTVYTVNKNGFVYTQPIAQWHYRGEQEVFEYCLEDGSTIRATKDHKFMTTDGQMLPIDEIFEQGLELKQIHLS(配列番号235)
【0402】
VKIISRQSLGIQPVYDIGVEKDHNFLISDGLIASN(配列番号236)
【0403】
>CspPCC7822:/1-134 Cyanothece sp.PCC 7822
【0404】
CLSYDTEILTVEYGPMPIGKIVEEQIECTVYTVDKNGLVYTQPIAQWHHRGQQEVFEYCLEDGSIIRATKDHKFMTDDGQMLPIEEIFEKGLELKQIIL(配列番号237)
【0405】
VKIISRQLAGNQTVYDLGVEKDHNFLLANGLIASN(配列番号238)
【0406】
>NspPCC7107:/1-137 Nostoc sp.PCC 7107
【0407】
CLSYDTQVLTVEYGLVPIGEIVEKQLECSVFTIDGHGYVYTQAIAQWHNRGQQEVFEYGLEDGSVIRATKDHKFMTTDGQMLPIDEIFERELDLLQVQGLRW(配列番号239)
【0408】
VKIITRKYIGQANVYDIGVAQDHNFVIENRLIASN(配列番号240)
【0409】
>TboIicb1/1-136 Tolypothrix bouteillei Iicb1
【0410】
CLSYDTEILTVEYGFLPIGKIVEKGIECNVYSVDKNGNIYTQPIAQWHDRGEQEVFEYCLENGSVIRATKDHKFMTTSGEMLPIDEIFERGLDLIRVEDLP(配列番号241)
【0411】
VKILTRKSIGKQTVYDIGVERDHNFVIKNGSVASN(配列番号242)
【0412】
>Aov:/1-136 Aphanizomenon ovalisporum DnaE precursor (dnaE) gene
【0413】
CLSADTEILTVEYGFLPIGEIVGKAIECRVYSVDGNGNIYTQSIAQWHNRGEQEVFEYTLEDGSIIRATKDHKFMTTDGEMLPIDEXFARQLDLMQVQGLH(配列番号243)
【0414】
VKITARKFVGRENVYDIGVEHHHNFAIKNGLIASN(配列番号244)
【0415】
>OnvPCC7112:/1-137 Oscillatoria nigro-viridis PCC 7112
【0416】
CLSYDTKILTVEYGPMAIGKIVEEKIECTVYSVDSNGYIYTQSIAQWHRRGQQEVFEYCLEDGSIIRATKDHKFMTVGGQMLPIDEIFEQGLDLKQINSSSD(配列番号245)
【0417】
VKIISRKSLGTQEVYDIGVEREHNFILENSLVASN(配列番号246)
【0418】
>RspPCC7116:/1-135 Rivularia sp.PCC 7116,complete genome
【0419】
CLSYDTEVLTEEFGLIPIGKIVEEKIDCTVYSVDVNGNVYSQPIAQWHNRGMQEVFEYELEDGSTIRATKDHKFMTVDGEMLAIDEIFEKGLELKRVGIY(配列番号247)
【0420】
VKIISRKVLKTENVYDIGLEGDHNFIIKDGLIASN(配列番号248)
【0421】
>MspPCC7113:/1-137 Microcoleus sp.PCC 7113,
【0422】
CLSYDSEILTVEYGLMPIGKIVEEGIECTVYSVDSHGYLYTQPIAQWHHRGQQEVFEYDLEDGSVIRATKDHKFMTSEGQMLAIDEIFERGLELKQVKRSQP(配列番号249)
【0423】
VKIVRRKSLGIQTVYDIGVERDHNFLLANGLVASN(配列番号250)
【0424】
>ScyPCC7437:/1-137 Stanieria cyanosphaera PCC 7437
【0425】
CLSYDTEILTVEYGAMPIGKIVKEQIECNVYTVNQNGFIYPQAIAQWHERGKQEIFEYTLDNGLVIRATKDHKFMTIDGQMLPIDEIFERGLELQRINDYSN(配列番号251)
【0426】
VKIVSRKSLGKQPVYDIGVTKDHNFLLSNGVVASN(配列番号252)
【0427】
>CspPCC6303:/1-137 Calothrix sp.PCC 6303
【0428】
CLSYDTEILTWEYGFLKIGEIVEKQILCSVFSVDEQGNVYTQPIAQWHNRGLQELFAYQLEDGGVIRATKDHKFMTTDGQMLAIDEIFERQLDLFQVKGLPE(配列番号253)
【0429】
VKIISRKVLKTENVYDIGLEGDHNFIIKDGLIASN(配列番号254)
【0430】
>Cst:/1-134 PCC7202: Cyanobacterium stanieri PCC 7202
【0431】
CLSYDTEVLTVEYGVLPIGKIVEEQIQCTVYSVDQYGFVYTQAIAQWHDRGEQEVFEYELENGATIKATKDHKMMTSDGQMLPIDQIFEQGLDLFMVSF(配列番号255)
【0432】
VKIVKRRSHGIQKVYDIGVAKDHNFLLHNGLVASN(配列番号256)
【0433】
>CspATCC51142:/1-134 Cyanothece sp.ATCC 51142
【0434】
CLSYDTEILTVEYGPMPIGKIVEENINCTVYTVDPNGFVYTQAIAQWHYRGEQEIFEYYLEDGATIRATKDHKFMTMEGKMLPIDEIFENNLDLKQLTL(配列番号257)
【0435】
VKIIGRQSLGVQKVYDIGVEKEHNFLLHNGLIASN(配列番号258)
【0436】
>CspPCC8801:/1-134 Cyanothece sp.PCC 8801
【0437】
CLSYDTEILTVEYGAIPIGKVVEENIDCTVYTVDKNGFVYTQNIAQWHLRGQQEVFEYYLDDGSILRATKDHQFMTLEGEMLPIHEIFERGLELKKIKI(配列番号259)
【0438】
VKIVSYRSLGKQFVYDIGVAQDHNFLLANGSIASN(配列番号260)
【0439】
>Asp:/1-136 Anabaena sp.90 chromosome
【0440】
CLSYDTEILTVEYGFLEIGEIVEKQIECKVYTIDSNGMLYTQSIAQWHNRGQQEVYEYLLENGAIIRATKDHKFMTEAGQMLPIDEIFAQGLDLLQVGVAE(配列番号261)
【0441】
VKIVSRTYVGQANVYDIGVESDHNFVIKNGFIASN(配列番号262)
【0442】
>Aha:/1-137 Aphanothece halophytica
【0443】
CLSYDTEIWTVEYGAMPIGKIVEEKIECSVYTVDENGFVYTQPIAQWHPRGQQEIIEYTLEDGRKIRATKDHKMMTESGEMLPIEEIFQRELDLKVETFHEM(配列番号263)
【0444】
VKIIKRQSLGRQNVYDVCVETDHNFVLANGCVASN(配列番号264)
【0445】
>HspPCC7418:/1-137 Halothece sp.PCC 7418
【0446】
CLSYDTEIWTVEYGAMPIGKIVEEKIECSVYTVDENGFVYTQPIAQWHPRGQQEIIEYTLEDGRKIRATKDHKMMTESGEMLPIEEIFQRELDLKVETFHEM(配列番号265)
【0447】
VKIIKRQSLGRQNVYDIGVETDHNFVLANGCVASN(配列番号266)
【0448】
>CapPCC10605:/1-137 Cyanobacterium aponinum PCC 10605
【0449】
CLSYDTEILTVEYGAISIGKIVEEKINCQVYSVDKNGFIYTQNIAQWHDRGSQELFEYELEDGRIIKATKDHKMMTKDGQMLAINDIFEQELELYSVDDMGV(配列番号267)
【0450】
VKIVKRRSLGVQPVYDIGVEKDHNFILANGLVASN(配列番号268)
【0451】
>Cat:/1-133 Candidatus Atelocyanobacterium thalassa isolate
【0452】
CLSYDTKVLTVEYGPLPIGKVVQENIRCRVYTTNDQGLIYTQPIAQWHNRGKQEIFEYHLDDKTIIRATKEHQFMTVDHVMMPIDEIFEQGLELKKIK(配列番号269)
【0453】
LKIIRRKSLGMHEVFDIGLEKDHNFVLSNGLIASN(配列番号270)
【0454】
>Oli:/1-137 Oscillatoria limnetica ’Solar Lake’ DnaE precursor
【0455】
CLSYNTEVLTVEYGPLPIGKIVDEQIHCRVYSVDENGFVYTQAIAQWHDRGYQEIFAYELADGSVIRATKDHQFMTEDGQMFPIDEIWEKGLDLKKLPTVQD(配列番号271)
【0456】
VKIVRRQSLGVQNVYDIGVEKDHNFLLASGEIASN(配列番号272)
【0457】
>Cen:/1-137 Cyanobacterium endosymbiont of Epithemia turgida
【0458】
CLSYDTEVLTVEYGAIPIGRMVEESLDCTVYTVDKNGFVYTQSIQQWHSRGQQEIFEYCFEDGSIIRATKDHKFMTAEGKMSSIHDIFEQGLELKKIIPWSG(配列番号273)
【0459】
AKIISCKSLGKQSVYDIGVVQDHNFLLANGVVASN(配列番号274)
【0460】
>SspPCC7502:/1-133 Synechococcus sp.PCC 7502
【0461】
CLGYDTPVLTVEYGFMPIGKIVEEKIQCHVYSVDQNGLVFTQAIAQWHNRGQQEVWEYNLDNGDIVRATKDHKFMTIDGQMLPINQIFEQGLELKVIA(配列番号275)
【0462】
VKIVSCKPLRVQTVYDIGVEKDHNFILDNGLVASN(配列番号276)
【0463】
>CspUCYN:/1-124 Cyanobacterium sp.UCYN-A2
【0464】
CLSYDTKVLTVEYGPLPIGKVVQENIRCRVYTTNDQGLIYTQPIAQWHNRGKQEIFEYHLDDKTIIRATKEHQFMTVDHVMMPIDEIFEQ(配列番号277)
【0465】
KIIRRKSLGMHEVFDIGLEKDHNFVLSNGLIASN(配列番号278)
【0466】
>Pst:/1-129 Planktothrix st147 : st147_cleanDRAFT_c6
【0467】
CLSYDTEVLTVEYGLIPISKIVEEKIECTVYTVNNQGYVYTQPIAQWHNRGEQEVFEYYLEDGSVIRATKDHKFMTVEGQMLPIDEIFEKELDL(配列番号279)
【0468】
VKIISRKSLGTQPVYDIGVQEDHNFVLNNGLVASN(配列番号280)
【0469】
>PlaCYA98/1-129 : Planktothrix NIVA-CYA 98
【0470】
CLSYDTEILTVEYGLMPIGKIVKEKIECTVYTVNNQGYVYTQPIAQWHHRGEQEVFEYCLEDGSVIRATKDHKFMTVQGQMLPIDEIFEKELDL(配列番号281)
【0471】
VKIISRKSLGTQPVYDIGVQEDHNFLLNNGLVASN(配列番号282)
【0472】
>Pst585:/1-129 Planktothrix sp.585: Length=1586997
【0473】
CLSYDTEILTVEYGLIPISKIVEEKIECTVYTVNNQGYVYTQPIAQWHNRGEQEVFEYYLEDGSVIRATKDHKFMTVDGQMLPIDEIFEKELDL(配列番号283)
【0474】
VKIISRKSLGTQPVYDIGVQEDHNFVLNNGLVASN(配列番号284)
【0475】
>CspPCC8802/1-134 : Cyanothece sp.PCC 8802
【0476】
CLSYDTEILTVEYGAIPIGKVVEENIDCTVYTVDKNGFVYTQNIAQWHLRGQQEVFEYYLDDGSILRATKDHQFMTLEGEMLPIHEIFERGLELKKIKI(配列番号285)
【0477】
VKIVSYRSLGKQFVYDIGVAQDHNFLLANGSIASN(配列番号286)
【0478】
>CfrPCC6912:/1-137 Chlorogloeposis fritschii PCC 6912
【0479】
CLSYDTAILTVEYGFLPIGEIVEKGIECTVYTVDSNGYIYTQPIAQWHNRGEQELFEYSLEDGSIIRATKDHKFMTIDGQMLPIDEIFARKLELMQVKGLPE(配列番号287)
【0480】
VKIIAKKSLGTQNVYDIGVERDHNFVIKNGLVASN(配列番号288)
【0481】
>CspATC51472:/1-132 Cyanothece sp.ATCC 51472
【0482】
CLSYDTEILTVEYGPMPIGKIVEENINCTVYTVDPNGFVYTQAIAQWHYRGEQEIFEYYLEDGATIRATKDHKFMTMEGKMLPIDEIFENNLDLKQL(配列番号289)
【0483】
VKIIGRQSLGVQKVYDIGVEKEHNFLLHNGLIASN(配列番号290)
【0484】
>Lma:/1-132 Lyngbya majuscula
【0485】
CLSYDTEIITVEYGPIAIGEIVEKGIPCTVYSVDSNGYVYTQPIAQWHNRGEQEVFEYTLDDGSVIRATKDHKFMTIDGQMLPIDEIFEGGLELKQL(配列番号291)
【0486】
VKIISRKSLGTQPVYDIGVKDDHNFILANGMVASN(配列番号292)
【0487】
>CspESFC/1-137
【0488】
CLSYDTEVLTVEYGAVPIGKLVEEKLNCSVYTVDPNGYIYTQAIAQWHDRGIQEVFEYQLEDNTIIRATKDHKFMTEDHQMLPIDEIFERGLELKKCPQPQQ(配列番号293)
【0489】
VKIIRRRSLGFQPVYDIGLEQDHNFLLNQGAIASN(配列番号294)
【0490】
>Mae905:/1-129 Microcystis aeruginosa DIANCHI905
【0491】
CLGGETLILTEEYGLLPIAKIVSEEVNCTVYSVDKNGFVYSQPISQWHERGLQEVFEYTLENGQTIQATKDHKFMTNDGEMLAIDTIFERGLDL(配列番号295)
【0492】
VKIISRQSLGRKPVYDIGVEKDHNFLLGNGLIASN(配列番号296)
【0493】
>RlaKORDI51-2:/1-137 Rubidibacter lacunae KORDI 51-2
【0494】
CLSYDTEVLTVEYGPLAIGTIVSERLACTVYTVDRSGFLYAQAISQWHERGRQDVFEYALDNGMTIRATKDHKLMTADGQMVAIDDIFTQGLTLKAIDTAAF(配列番号297)
【0495】
MKIVSRKSLGVQHVYDIGVARDHNFLLANGAIASN(配列番号298)
【0496】
>CfrPCC9212/1-136 Chlorogloeopsis fritschii PCC 9212
【0497】
CLSYDTAILTVEYGFLPIGEIVEKGIECTVYTVDSNGYIYTQPIAQWHNRGEQELFEYSLEDGSIIRATKDHKFMTIDGQMLPIDEIFARKLELMQVKGLP(配列番号299)
【0498】
VKIIAKKSLGTQNVYDIGVERDHNFVIKNGLVASN(配列番号300)
【0499】
>RinHH01:/1-137 Richelia intracellularis HH01 WGS project
【0500】
CLSYDTQILTVEHGPMSIGEIVEKCLECHVYTVNKNGNICIQTITQWHFRGEQEIFEYELEDGSFIQATKDHKFMTTTGEMLPIHEIFTNGLEILQLSKSLL(配列番号301)
【0501】
VKILARKSLGTQKVYDIGVNDDHNFALSNSFIASN(配列番号302)
【0502】
>GhePCC6308:/1-133 Geminocystis herdmanii PCC 6308
【0503】
CLSYDTEVLTVEFGAIPMGKIVEERLNCQVYSVDKNGFIYTQNIAQWHDRGVQEVFEYELEDGRIIKATKDHKMMIENCEMVEIDRIFEEGLELFEVN(配列番号303)
【0504】
VKILKRRSISSQQVYDIGVEKDHNFLLANGLVASN(配列番号304)
【0505】
>SsuPCC9445:/1-131 Spirulina subsalsa PCC 9445
【0506】
CLSYDTKIITVEYGAIAIGTIVEQGLHCHVYSVDPNGFIYTQPIAQWHQRGEQEVFAYTLENGSIIQATKDHKFMTQQGKMLPIDTIFEQGLDLLQV(配列番号305)
【0507】
KIIKRTSLGVRPVYDIGVIQDHNFLLENGLVASN(配列番号306)
【0508】
>MaePCC9807:/1-135 Microcystis aeruginosa 9807
【0509】
CLGGETLILTEEYGLLPIAKIVSEEINCTVYSVDKNGFIYSQPISQWHERGLQEVFEYTLENGQTIQATKDHKFMTSDGEMLAIDTIFERGLDLKSSDFS(配列番号307)
【0510】
VKIISRQFLGRKPVYDIGVEKDHNFLLGNGLIASN(配列番号308)
【0511】
>MspGI1:/1-130 Myxosarcina sp.GI1 contig_13
【0512】
CLSYDTEVLTLKYGALPIGEIVEKRINCHVYTRAESGFFYIQSIEQWHDRGEQEVFEYTLENGATIKATKDHKFMTSGGQMLPIDEIFERGLDLL(配列番号309)
【0513】
VKIVSRKSLGKQPVYDLGVAKDHNFLLANGTVASN(配列番号310)
【0514】
>ShoPCC7110:/1-136 Scytonema hofmanni PCC 7110 contig00136
【0515】
CLSYDTEVLTAEYGFLPIGKIVEKAIECTVYSVDNDGNIYTQPIAQWHDRGQQEVFEYSLDDGSVIRATKDHKFMTTGGQMLPIDEIFERGLDLMRIDSLP(配列番号311)
【0516】
VKILTRKSIGKQTVYDIGVERDHNFVIKNGLVASN(配列番号312)
【0517】
>WinUHHT291/1-136 Westiella intricata UH HT-29-1
【0518】
CLSYDTEILTVEYGFLPIGEIVEKRIECTVYTVDTNGYVYTQAIAQWHNRGEQEVFEYALEDGSIIRATKDHKFMTSEGQMLPIDEIFVKGLDLLQVQGLP(配列番号313)
【0519】
VKIITRKFLGIQNVYDIGVEQNHNFVIKNGLVASN(配列番号314)
【0520】
>FspPCC9605:/1-136 Fischerella sp.PCC 9605 FIS9605DRAFT
【0521】
CLSYDTEILTVEYGFLPIGEIVEKGIECTVYTVDNNGNVYTQTIAQWHNRGQQEVFEYCLEDGSVIRATKDHKFMTTDGQMLPIDEIFARGLDLLQVKNLP(配列番号315)
【0522】
VKIVTRRPLGTQNVYDIGVESDHNFVIKNGLVASN(配列番号316)
【0523】
>MrePCC10914:/1-137 Mastigocladopsis repens PCC 10914
【0524】
CLSYDTEVLTVEYGFLPIGEIVEKSIECSVYTVDSNGNVYTQPIAQWHNRGQQEVFEYCLEDGSIIRATKDHKFMTIHGQMLPIDEIFERGLELMKIQGLPE(配列番号317)
【0525】
AKIITRKSLGTQNVYDIGVERDHNFVTRDGFIASN(配列番号318)
【0526】
>ShoUTEX2349:/1-137 [Scytonema hofmanni] UTEX 2349
【0527】
CLSYNSEVLTVEYGFLPIGKIVEKGIECSVYSVDSYGKIYTQVIAQWHNRGQQEVFEYCLEDGTIIQATKDHKFMTVDGQMLPIDEIFERGLDLMQVQGLPD(配列番号319)
【0528】
KIITRKSLGTQNVYDIGVSSDHNFVMKNGLIASN(配列番号320)
【0529】
>AspPCC7108:/1-137 Anabaena sp.PCC 7108 Ana7108scaffold_2_Cont3
【0530】
CLSSDTEVLTVEYGLIPIGEIIEKRIDCSVFSVDKNGNIYTQPIAQWHDRGIQELYEYCLDDGSTIRATKDHKFMTTAGEMLPIDEIFERGLDLLKVHNLPQ(配列番号321)
【0531】
VKIITRNYVGKENVYDIGVERDHNFAIKNGLIASN(配列番号322)
【0532】
>FspPCC9339:/1-137 Fischerella sp.PCC 9339 PCC9339DRAFT
【0533】
CLSYDTEVLTVEYGFLPIGEIVEKRIECTVYTVDHNGYVYTQPIAQWHNRGYQEVFEYGLEDGSVIRATKDHKFMTSEGQMLPIDEIFARELDLLQVTGLVN(配列番号323)
【0534】
VKIVTRRLLGIQNVYDIGVEQNHNFVIKNGLVASN(配列番号324)
【0535】
>Csp336:/1-137 Calothrix sp.336/3
【0536】
CLSYDTEIFTVEYGFLPIGEIVEKRLECTVLTVDNHGNIYSQPIAQWHHRGQQQIYEYGLEDGSVIRATKDHKFMTTDGQMLPIDEIFERGLDLLQVTNLDN(配列番号325)
【0537】
VKVITRKLADTENVYDIGVENHHNFLIKNGLVASN(配列番号326)
【0538】
>FthPCC7521:/1-136 Fischerella thermalis PCC 7521
【0539】
CLSYETEILTVEYGFLPIGEIVEKRIECSVYTVDNNGYVCTQPIAQWHNRGYQEVFEYGLEDGSVIRATKDHKFMTIDRQMLPIDEIFARGLDLLQVTGLP(配列番号327)
【0540】
VKIITRKSLGTQNVYDIGVEQNHNFVIKNGLVASN(配列番号328)
【0541】
>CyaPCC7702/1-137 cyanobacterium PCC 7702 Chl7702
【0542】
CLSYDTEILTVEYGFLSIGEIVEKEIECTVYTVDSNGYIYTQPIAQWHEQGEQEIFEYSLEDGSTIRATKDHKFMTIEGEMLPIDQIFARQLDLMQITGLPQ(配列番号329)
【0543】
VKISTKKSLGKQKVYDIGVVRDHNFIIKNGFVASN(配列番号330)
【0544】
>FspPCC9431:/1-136 Fischerella sp.PCC 9431
【0545】
CLSYDTEVLTVEYGFLPIGEIVEKRIECTVYTVDTNGYVYTQAIAQWHNRDEQEVFEYALEDGSIIRATKDHKFMTSEGQMLPIDEIFAKGLDLLQVQGLP(配列番号331)
【0546】
VKIVTRKFLGIQNVYDIGVEQNHNFVIKNGLVASN(配列番号332)
【0547】
>FmuPCC7414:/1-137 Fischerella muscicola PCC 7414
【0548】
CLSYETEILTVEYGFLPIGEIVEKRIECSVYTVDNNGYVCTQTIAQWHNRGYQEVFEYGLEDGSVIRATKDHKFMTIDRQMLPIDEIFARGLDLLQVKGLPE(配列番号333)
【0549】
VKIITRQSLGTQNVYDIGVEQNHNFVIKNGLVASN(配列番号334)
【0550】
>FmuPCC73103:/1-137 Fischerella muscicola SAG 1427-1 = PCC 73103
【0551】
CLSYDTEVLTVEYGFLPIGEIVEKTIECNVFTVDSNGYVYTQPIAQWHNRGYQEVFEYGLEDGSVIRATKDHKFMTSEGKMLPIDEIFARELDLLQVTGLIN(配列番号335)
【0552】
VKIVTRKFLGIQNVYDIGVEQNHNFVIKNGLVASN(配列番号336)
【0553】
>Lae:/1-137 Lyngbya aestuarii BL J laest3.contig.3
【0554】
CLSYDTEILTVEYGAIPIGKVVDEKIECTVYSVDKNGLIYTQPIAQWHNRGKQEVFEYSLEDGSTIRATKDHKFMTMDNQMLPIDEILEKGLELKQVNADSV(配列番号337)
【0555】
VKIVSRKSLDSQTVYDIGVETDHNFLLANGSVASN(配列番号338)
【0556】
>Lsp:/1-137 Leptolyngbya sp.JSC-1
【0557】
CLSYDTEILTVEYGALPIGKIVENQMICSVYSIDNNGYIYIQPIAQWHNRGQQEVFEYILEDGSIIRSTKDHKFMTKGGEMLPIDEIFERGLELAQVTRLEQ(配列番号339)
【0558】
VKIISRRSVGVQSVYDIGVKQDHNFFLRNGLIASN(配列番号340)
【0559】
>CwaWH8501:/1-137 Crocosphaera watsonii WH8501
【0560】
CLSYDTEILTVEYGAMYIGKIVEENINCTVYTVDKNGFVYTQTIAQWHNRGEQEIFEYDLEDGSKIKATKDHKFMTIDGEMLPIDEIFEKNLDLKQVVSHPD(配列番号341)
【0561】
VKIIGCRSLGTQKVYDIGVEKDHNFLLANGSIASN(配列番号342)
【0562】
>CchPCC7420:/1-135 Coleofasciculus chthonoplastes PCC 7420
【0563】
CLSYDTQILTVEYGAVAIGEIVEKQIECTVYSVDENGYVYTQPIAQWHNRGEQEVFEYLLEDGATIRATKDHKFMTDEDQMLPIDQIFEQGLELKQVEVL(配列番号343)
【0564】
VKIIGRKPLGTQPVYDIGVERDHNFLLFNGSVASN(配列番号344)
【0565】
>CspPCC6712/1-133
【0566】
CLSYDTEVLTVEYGAIPIGKIVEEKIACNVYSVDKNGFVYTQPIAQYHDRGIQEVFEYRLENGSVIRATKDHKMMTADGQMLPIDEIFKQNLDLKQLN(配列番号345)
【0567】
VKIISRQSLGKQSVFDIGVAKDHNFLLANGLVASN(配列番号346)
【0568】
>Rbr:/1-137 Raphidiopsis brookii D9 D9_5,
【0569】
CLSYETEVLTLEYGFLPIGEIVDKQMVCTVFSVNDSGNVYTQPIGQWHDRGVQELYEYCLDDGSTIRATKDHKFMTTQGEMVPIDEIFHQGWELVQVSGTMN(配列番号347)
【0570】
VKIVSRRYLGKADVYDIGVAKDHNFIIKNGLVASN(配列番号348)
【0571】
>CspCCy0110:/1-134 Cyanothece sp.CCY0110 1101676644604
【0572】
CLSYDTEILTVEYGPMPIGKIVEENINCSVYTVNKNGFVYTQSIAQWHHRGEQEVFEYYLEDGETIRATKDHKFMTTEGKMLPIDEIFENNLDLKKLTV(配列番号349)
【0573】
VKIIERRSLGKQNVYDIGVEKDHNFLLSNNLIASN(配列番号350)
【0574】
>XspPCC7305:/1-135 Xenococcus sp.PCC 7305
【0575】
CLSADTEVLTVEYGAISIGKIVEERIECTVYSVDANGFVYTQEIAQWHNRGEQEVFEYMLDDGSVIRATKDHKLMTIDGQMVAIDEIFSQGLELKQVLGL(配列番号351)
【0576】
VKIVSRKSLGTQTVYDLGVARDHNFLLANGTVASN(配列番号352)
【0577】
>PspPCC7319:/1-135 Pleurocapsa sp.PCC 7319
【0578】
CLSYDTEIYTVEYGALPIGKIVESRIKCTVLTVDKNGLVYSQPIVQWHDRGIQEVFEYTLDNGATIRATKDHKFMTVEGQMLPIDEIFELGLELKEIQQF(配列番号353)
【0579】
VKIISRQSLGKQSVYDIGVAKDHNFLLANGMVASN(配列番号354)
【0580】
>CraCS505:/1-137 Cylindrospermopsis raciborskii CS-505
【0581】
CLSYETEVLTLEYGFVPIGEIVNKQMVCTVFSLNDSGNVYTQPIGQWHDRGVQDLYEYCLDDGSTIRATKDHKFMTTQGEMVPIDEIFHQGWELVQVSGISK(配列番号355)
【0582】
VKIVSRRYLGKADVYDIGVAKDHNFIIKNGLVASN(配列番号356)
【0583】
>MaePCC7806:/1-135 Microcystis aeruginosa PCC 7806
【0584】
CLGGETLILTEEYGLLPIAKIVSEEVNCTVYSVDKNGFVYSQPISQWHERGLQEVFEYTLENGQTIQATKDHKFMTNDGEMLAIDTIFERGLDLKSSDFS(配列番号357)
【0585】
VKIISRQSLGRKPVYDIGVEKDHNFLLGNGLIASN(配列番号358)
【0586】
>MaeNIES843:/1-135 Microcystis aeruginosa NIES-843 DNA
【0587】
CLGGETLILTEEYGLLPIAKIVSEEINCTVYTVDQNGFVYSQPISQWHERGLQEVFEYTLENGQTIQATKDHKFMTSDGEMLAIDTIFERGLDLKSSDFS(配列番号359)
【0588】
VKIIGRQSLGRKPVYDIGVEKDHNFLLGNGLIASN(配列番号360)
【0589】
図1は、本発明の一つの実施形態によるCfaスプリットインテインの設計のアライメントおよびコンピュータ生成モデルを示す。パネルAは、Npu DnaEおよびCfa DnaEの配列アライメントを示す。これらの配列は、一次配列を介して均等に分布した差異(下線部、シアン)と82%の同一性を共有する。触媒残基と第2のシェルの「アクセラレータ」残基とは、それぞれカレット(オレンジ色)とアスタリスク(緑色)とで示されている。パネルBは、Npu構造(pdb=4k15)にマッピングされたものと同じ残基(パネルaにおいて強調されている)を示す。
【0590】
CfaインテインはNpu(82%)と高い配列類似性を有し、非同一残基はタンパク質の3D構造全体に広がっている。
【0591】
モデルエクステインに融合したCfaインテイン断片を生成し、それらのPTS活性を前述のインビトロアッセイを用いて測定した(
図2)。これによりCfaインテインがNpuよりも30℃で2.5倍速くスプライスすることが明らかになった(t
1/220秒対50秒)。つまり、後者は最も速い特徴付けられたDnaEスプリットインテインであるため、活性増強が顕著である(
図2A)。この加速された速度は、分岐形成(3倍増加)および分岐分解(2倍増加)の両方で現れる。親DnaEインテインと一致して、CfaはC-エクステインの+2位で嵩高い疎水性残基の選択を保持する。驚くべきことに、Cfaは温度の関数として増加したスプライシング速度を示し、Npuよりも一貫して速い(
図2A)。スプライス産物の収量は低下するものの、Cfaインテインは80℃でも活性を維持するのに対して、Npuはこの温度では不活性である。これらの結果は、コンセンサスエンジニアリングが広範囲の温度にわたって高度に活性であるインテインを産生するのに有効であることを示している。
【0592】
PTSの適用は、典型的には、標的タンパク質の分裂および得られた断片の適切なスプリットインテインセグメントへの融合を必要とする
1。その結果、これらの融合タンパク質の溶解性が低いことも時々起こりうる。これらの難溶性断片を溶解状態に保つために、塩酸グアニジン(GuHCl)および尿素などのタンパク質変性剤が頻繁に使用されるので、これらのカオトロピック剤の存在下でCfaのスプライシング能を試験した。Cfaインテインは4M GuHClの存在下でスプライシングすることが見出されたが(3Mまで活性の低下はほとんどない)、3M以上のGuHClのNpuについて活性は観察されなかった(
図2B)。注目すべきことに、Cfaのスプライシングは尿素が8Mまでだとほとんど影響されないが、Npuのスプライシングは尿素が4Mを上回ると大幅に低下する(
図2C)。
【0593】
図2は、本発明の一つの実施形態によるCfaインテインの特徴を示すグラフを示す。パネルAには、温度の関数としてのCfaおよびNpuのスプライシング速度が示されている。Npuは80℃で不活性である(誤差=SD(n=3))。パネルBおよびCには、添加されたカオトトピックの関数としてのCfaおよびNpuのスプライシング速度が示されている。Npuは、3M GuHClまたは8M尿素において不活性である。注:Cfaは4M GuHCl(k=7×10
-5)(誤差=SD(n=3))において残留活性を有する。
【0594】
高濃度のGuHClおよび尿素に対するCfaの前例がなく予期しない耐性は、インテインが細菌封入体からの不溶性タンパク質のカオトロピック抽出の直後に活性を保持することを示唆しており、それによってPTSベースの研究が早く進むようになる。したがって、モデル融合タンパク質であるHis6-Sumo-CfaNを大腸菌細胞において過剰発現させ、6M尿素により封入体からタンパク質を抽出した。タンパク質はこの抽出物からニッケルアフィニティークロマトグラフィーにより精製し、次いで、変性条件下でPTSにより直接的かつ効率的に修飾した。すなわち、介在するリフォールディングステップを必要としなかった。一般に、カオトロピック剤の存在下でのCfaの強い活性により、天然条件下での溶解度が低いことを示すタンパク質断片を用いて作業する場合に有用であることが立証されるだろう。
【0595】
対象のタンパク質をスプリットインテインに融合すると、タンパク質単独と比較して細胞発現レベルが著しく低下する可能性がある
6。この状況は、C-インテインよりもN-インテインへの融合の場合により頻繁に起こり、これは前者のサイズの方が大きく、それらが部分的にフォールディンされた状態である可能性が高いためである
18。したがって、Cfaの熱安定性およびカオトロピック安定性の改善がCfa
N融合体の発現レベルの増加につながるかどうかを検討した。実際、大腸菌におけるモデル研究により、対応するNpu
N融合と比較して、Cfa
N融合に対する可溶性タンパク質発現の有意な(30倍)増加が明らかになった(
図8)。この結果を考慮に入れて、Cfa
N融合体が哺乳類細胞においてもタンパク質発現レベルの増加を示すかどうかを調べた。特に、モノクローナル抗体(mAb)の重鎖(HC)へのインテイン融合は、合成カーゴの部位特異的コンジュゲーションのための強力なツールとして持ち上がっている
19-21。mAb(αDec205)のHEK293細胞におけるそのHCに融合したN-インテインの機能としての発現レベルを調べた。細菌の発現結果と一致して、HC-Cfa
N融合体の産生は、検査した他のインテインと比較して有意に高かった。例えば、mAb-Cfa構築物の分泌レベルは、対応するNpu融合物よりも~10倍高かった(
図3Aおよび3B)。重要なことに、mAb-CfaはPTS活性を保持し、37℃で4日間発現させた後に増殖培地中で直接スプライシングすることにより合成ペプチドを用いて部位特異的に修飾することができた。
【0596】
図8は、His
6-SUMO-Npu
NおよびHis
6-SUMO-Cfa
Nの試験発現のSDS-PAGE分析である。大腸菌培養液1Lの可溶性画分の4mLカラム容量(CV)Ni-NTA精製からのクマシーブリリアントブルー染色ゲル。各レーンは、(P)封入体ペレット、(FT)バッチ結合Ni-NTA溶液のフロースルー、(W1)5mMイミダゾールを用いた5CV洗浄、(W2)25mMイミダゾールの5CV洗浄、(E1-E4)および250mMイミダゾールの4回の1.5CV溶出に対応する。
【0597】
最後に、PTS系を用いて合成カーゴの多コピーをmAbの重鎖に結合させることができるかどうかを、抗体コンジュゲーションとの関わりにおけるCfaインテインの有用性をさらに調べるために検討した。したがって、半合成を用いて、Cfa(Cfa
C)のC-末端半分が、カーゴ、この場合はフルオレセインの多量体結合を可能にするデンドリマー骨格を含むC-エクステインに融合された構築物を調製した(
図3C)。この樹枝状カーゴは、Cfa媒介PTSを介してαDec205抗体に首尾よく連結され、再び細胞増殖培地中で直接インサイチューにおいて行った(
図3Dおよび3E)。これは、PTSが分岐エクステイン構築物を標的タンパク質に結合させるために初めて使用されたことを表し、抗体薬物コンジュゲートのペイロード量を操作するためのシステムの可能性が際立つことになる
22。
【0598】
図3は、本発明の一つの実施形態によるCfaインテインを用いたマウスモノクローナル抗体の発現および修飾を示す。パネルAは、マウスαDec205モノクローナル抗体の重鎖のC-末端に融合した種々のInt
Nホモログ(Npu、Mcht、AvaおよびCfa)のHEK293T細胞における試験発現を示す。上部:96時間の発現後の培地中に存在する抗体レベルのウェスタンブロット分析(αMouse IgG)。下部:ローディングコントロールとしての細胞溶解物のα-アクチンウェスタンブロット。パネルBは、パネルAにおけるαDEC205HC-Int
Nシグナルのデンシトメトリーによる正規化発現収量の定量化を示す(誤差=SD(n=4))。パネルCは、αDEC205HC-Int
N融合体とのPTS反応に使用されるCfa
C-デンドリマー構築物の構造を示す。単純化のために、Cfa
Cペプチド配列は、記号を使って緑色で描写している(左に三角形の切り抜きを有する長方形として)。パネルDは、多価カーゴを有するmAbのHCを修飾するために使用されるインサイチューPTSアプローチの概略図である。パネルEは、PTS反応のSDS-PAGE分析である。レーン1:野生型マウスαDEC205mAB。レーン2:マウスαDEC205-Cfa
NmAB融合体。レーン3:αDEC205-Cfa
NmABを含む培地へのCfa
C-デンドリマーの添加。スプライシング反応を、蛍光発光(下部)およびウェスタンブロット(上部、αMouse IgG)により分析した。
【0599】
高速スプリットインテインの発見は、タンパク質トランススプライシングの応用に革命を起こした。この研究で説明されているCfaインテインの顕著な堅牢性は、PTSをより広い範囲の反応条件で実施することを可能にすることにより、これらの技術の多くの有用性を拡大するはずである。さらに、N-インテイン融合体の発現収量を増加させるCfaの能力は、タンパク質半合成のためのスプリットインテインの更なる使用を促すはずである。このインテインをエンジニアリングするために使用する活性誘導アプローチは、他のインテインファミリーに適用することができるか、またはコンセンサスエンジニアリングに使用される多配列アライメントの精製のための一般的な戦略として行われる。
【0600】
材料および方法
材料
オリゴヌクレオチドおよび合成遺伝子は、Integrated DNA Technologies(Coralville,IA)から購入した。QuickChange XL II部位特異的突然変異誘発キットおよびPfu Ultra II Hotsart融合ポリメラーゼは、Agilent(La Jolla、CA)から購入した。全ての制限酵素および2x Gibson Assembly Master Mixは、New England Biolabs(Ipswich、MA)から購入した。クローニングおよびタンパク質発現に使用した「インハウス」の高コンピテンシー細胞は、Invitrogen(Carlsbad、CA)から購入したOne Shot Bl21(DE3)ケミカリーコンピテント大腸菌およびサブクローニング効率DH5αコンピテント細胞から生成した。ダルベッコ変法イーグル培地(DMEM)、リポフェクタミン2000、および低IgGウシ胎児血清は、Invitrogenからも購入した。DNA精製キットはQiagen(Valencia、CA)から購入した。全てのプラスミドは、GENEWIZ(South Plainfield、NJ)により配列決定した。N,N-ジイソプロピルエチルアミン(DIPEA)、Luria Bertani(LB)培地、および全ての緩衝塩は、Fisher Scientific(Pittsburgh、PA)から購入した。ジメチルホルムアミド(DMF)、ジクロロメタン(DCM)、クマシーブリリアントブルー、トリイソプロピルシラン(TIS)、β-メルカプトエタノール(BME)、DL-ジチオスレイトール(DTT)、2-メルカプトエタンスルホン酸ナトリウム(MESNa)、テトラキス(トリフェニルホスフィン)パラジウム(0)Pd(PPh3)4)、および5(6)-カルボキシフルオレセインは、Sigma-Aldrich(Milwaukee、WI)から購入し、さらに精製することなく使用した。トリス(2-カルボキシエチル)ホスフィン塩酸塩(TCEP)およびイソプロピル-β-D-チオガラクトピラノシド(IPTG)は、Gold Biotechnology(St.Louis、MO)から購入した。使用したプロテアーゼインヒビターは、Roche Completeプロテアーゼインヒビター(Roche、Branchburg、NJ)であった。ニッケル-ニトリロトリ酢酸(Ni-NTA)樹脂は、Thermo scientific(Rockford、IL)から購入した。Fmocアミノ酸は、Novabiochem(Darmstadt、Germany)またはBachem(Torrance、CA)から購入した。(7-アザベンゾトリアゾール-1-イルオキシ)トリピロリジノホスホニウムヘキサフルオロホスフェート(PyAOP)およびO-(ベンゾトリアゾール-1-イル)-N,N,N‘,N’-テトラメチルウロニウムヘキサフルオロホスフェート(HBTU)は、Genscript(Piscataway、NJ)から購入した。Rink Amide-ChemMatrix樹脂は、Biotage(Charlotte、NC)から購入した。トリフルオロ酢酸(TFA)は、Halocarbon(North Augusta、SC)から購入した。イムノブロットPVDF膜(0.2μm)およびCriterion XTビス-トリスゲル(12%ポリアクリルアミド)は、Bio-Rad(Hercules、CA)から購入した。MES-SDSランニングバッファーは、Boston Bioproducts(Ashland、MA)から購入した。抗マウスIgG二次抗体(Licorマウス800)およびマウスαActin一次抗体は、Li-COR biotechnology(Lincoln、NE)から購入した。
【0601】
装置
分析用RP-HPLCは、C18Vydacカラム(5μm、4.6×150mm)を備えたHewlett-Packard 1100および1200シリーズ装置で流速1mL/分で行った。分取RP-HPLCは、Waters 2545 Binary Gradient ModuleおよびWaters 2489 UV検出器からなるWaters prep LCシステムで行った。精製は、18mL/分の流速でC18Vydac 218TP1022カラム(10μM;22×250mm)で行った。全ての分析は、水(溶媒A)中0.1%TFA(トリフルオロ酢酸)および0.1%TFAを含む水(溶媒B)中90%アセトニトリルを使用した。特に明記しない限り、ペプチドおよびタンパク質は、以下のグラジエントを使用して分析した:2分間で0%B(アイソクラティック)、続けて30分間にわたり0~73%B。エレクトロスプレーイオン化質量分析(ESI-MS)は、Bruker Daltonics MicroTOF-Q II質量分析計で行った。サイズ排除クロマトグラフィーは、Superdex S75 16/60(CV=125mL)カラムを使用して、AKTA FPLCシステム(GE Healthcare)で行った。クーマシー染色されたゲルおよびウェスタンブロットをLI-CORオデッセイ赤外線画像装置を用いて画像化した。蛍光ゲルは、GE ImageQuant LAS 4000 Imagerを用いて画像化した。スプライシング依存性大腸菌増殖アッセイは、Molecular DevicesからのVersaMaxチューナブルマイクロプレートリーダーで行った。細胞溶解は、S-450D Branson Digital Sonifierを用いて行った。
【0602】
DNAプラスミドのクローニング
大腸菌発現のための全てのN-インテイン構築物を、予め使用したpETおよびpTXB1ベクターにクローニングした1。WT pet30-His6-SUMO-AEY-SspN、pet30-His6-SUMO-AEY-NpuN、pTXB1-SspC-MxeGyrA His6、およびpTXB1-NpuC-MxeGyrA-His6プラスミドをコードするプラスミドを、前述のようにクローニングし、以下のタンパク質配列をコードする。SUMO切断(N-インテイン)またはチオール開裂(C-インテイン)後のタンパク質産物は、全てのプラスミドについて太字で示す。
【0603】
プラスミド1:
WT Ssp
N
:pet30-His
6
-SUMO-AEY-Ssp
N
MGSSHHHHHHGSGLVPRGSASMSDSEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAFAKRQGKEMDSLRFLYDGIRIQADQTPEDLDMEDNDIIEAHREQIGGAEYCLSFGTEILTVEYGPLPIGKIVSEEINCSVYSVDPEGRVYTQAIAQWHDRGEQEVLEYELEDGSVIRATSDHRFLTTDYQLLAIEEIFARQLDLLTLENIKQTEEALDNHRLPFPLLDAGTIK(配列番号361)
【0604】
プラスミド2:
WT Npu
N
:pet30-His
6
-SUMO-AEY-Np
uN
MGSSHHHHHHGSGLVPRGSASMSDSEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAFAKRQGKEMDSLRFLYDGIRIQADQTPEDLDMEDNDIIEAHREQIGGAEYALSYETEILTVEYGLLPIGKIVEKRIECTVYSVDNNGNIYTQPVAQWHDRGEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPIDEIFERELDLMRVDNLPN(配列番号362)
【0605】
プラスミド3:
WT Ssp
C
:pTXB1-Ssp
C
-MxeGyrA-His
6
MVKVIGRRSLGVQRIFDIGLPQDHNFLLANGAIAANCITGDALVALPEGESVRIADIVPGARPNSDNAIDLKVLDRHGNPVLADRLFHSGEHPVYTVRTVEGLRVTGTANHPLLCLVDVAGVPTLLWKLIDEIKPGDYAVIQRSAFSVDCAGFARGKPEFAPTTYTVGVPGLVRFLEAHHRDPDAQAIADELTDGRFYYAKVASVTDAGVQPVYSLRVDTADHAFITNGFVSHAHHHHHH(配列番号363)
【0606】
プラスミド4:
WT Npu
C
:pTXB1-Npu
C
-MxeGyrA-His
6
MIKIATRKYLGKQNVYDIGVERDHNFALKNGFIASNCITGDALVALPEGESVRIADIVPGARPNSDNAIDLKVLDRHGNPVLADRLFHSGEHPVYTVRTVEGLRVTGTANHPLLCLVDVAGVPTLLWKLIDEIKPGDYAVIQRSAFSVDCAGFARGKPEFAPTTYTVGVPGLVRFLEAHHRDPDAQAIADELTDGRFYYAKVASVTDAGVQPVYSLRVDTADHAFITNGFVSHAHHHHHH(配列番号364)
【0607】
全てのSspNバッチ変異体を、プラスミド1をテンプレートとして用いたQuikChange部位特異的突然変異誘発キットを用いてクローニングし、以下に示すタンパク質配列をコードする。N-インテイン配列は太字で示しており、バッチ突然変異に対応する残基には下線を引いている。
【0608】
プラスミド5:
バッチ1:Pet30-His
6
-SUMO-AEY-Ssp
N
(R73K,L75M,Y79G,L81M)
MGSSHHHHHHGSGLVPRGSASMSDSEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAFAKRQGKEMDSLRFLYDGIRIQADQTPEDLDMEDNDIIEAHREQIGGAEYCLSFGTEILTVEYGPLPIGKIVSEEINCSVYSVDPEGRVYTQAIAQWHDRGEQEVLEYELEDGSVIRATSDHKFMTTDGQMLAIEEIFARQLDLLTLENIKQTEEALDNHRLPFPLLDAGTIK(配列番号365)
【0609】
プラスミド6:
Ssp
N
R73K:Pet30-His
6
-SUMO-AEY-Ssp
N
(R73K)
MGSSHHHHHHGSGLVPRGSASMSDSEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAFAKRQGKEMDSLRFLYDGIRIQADQTPEDLDMEDNDIIEAHREQIGGAEYCLSFGTEILTVEYGPLPIGKIVSEEINCSVYSVDPEGRVYTQAIAQWHDRGEQEVLEYELEDGSVIRATSDHKFLTTDYQLLAIEEIFARQLDLLTLENIKQTEEALDNHRLPFPLLDAGTIK(配列番号366)
【0610】
プラスミド7:
Ssp
N
R73K Y79G:Pet30-His
6
-SUMO-AEY-Ssp
N
(R73K、Y79G)
MGSSHHHHHHGSGLVPRGSASMSDSEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAFAKRQGKEMDSLRFLYDGIRIQADQTPEDLDMEDNDIIEAHREQIGGAEYCLSFGTEILTVEYGPLPIGKIVSEEINCSVYSVDPEGRVYTQAIAQWHDRGEQEVLEYELEDGSVIRATSDHKFLTTDGQLLAIEEIFARQLDLLTLENIKQTEEALDNHRLPFPLLDAGTIK(配列番号367)
【0611】
プラスミド8:
Ssp
N
R73K Y79G L81M:Pet30-His
6
-SUMO-AEY-Ssp
N
(R73K、Y79G、L81M)
MGSSHHHHHHGSGLVPRGSASMSDSEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAFAKRQGKEMDSLRFLYDGIRIQADQTPEDLDMEDNDIIEAHREQIGGAEYCLSFGTEILTVEYGPLPIGKIVSEEINCSVYSVDPEGRVYTQAIAQWHDRGEQEVLEYELEDGSVIRATSDHKFLTTDGQMLAIEEIFARQLDLLTLENIKQTEEALDNHRLPFPLLDAGTIK(配列番号368)
【0612】
プラスミド9:
バッチ2:Pet30-His
6
-SUMO-AEY-Ssp
N
(L56F、S70K、A83P、E85D)
MGSSHHHHHHGSGLVPRGSASMSDSEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAFAKRQGKEMDSLRFLYDGIRIQADQTPEDLDMEDNDIIEAHREQIGGAEYCLSFGTEILTVEYGPLPIGKIVSEEINCSVYSVDPEGRVYTQAIAQWHDRGEQEVFEYELEDGSVIRATKDHRFLTTDYQLLPIDEIFARQLDLLTLENIKQTEEALDNHRLPFPLLDAGTIK(配列番号369)
【0613】
プラスミド10:
Ssp
N
A83P:Pet30-His
6
-SUMO-AEY-Ssp
N
(A83P)
MGSSHHHHHHGSGLVPRGSASMSDSEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAFAKRQGKEMDSLRFLYDGIRIQADQTPEDLDMEDNDIIEAHREQIGGAEYCLSFGTEILTVEYGPLPIGKIVSEEINCSVYSVDPEGRVYTQAIAQWHDRGEQEVLEYELEDGSVIRATSDHRFLTTDYQLLPIEEIFARQLDLLTLENIKQTEEALDNHRLPFPLLDAGTIK(配列番号370)
【0614】
プラスミド11:
Ssp
N
S70K A83P:Pet30-His
6
-SUMO-AEY-Ssp
N
(S70K、A83P)
MGSSHHHHHHGSGLVPRGSASMSDSEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAFAKRQGKEMDSLRFLYDGIRIQADQTPEDLDMEDNDIIEAHREQIGGAEYCLSFGTEILTVEYGPLPIGKIVSEEINCSVYSVDPEGRVYTQAIAQWHDRGEQEVLEYELEDGSVIRATKDHRFLTTDYQLLPIEEIFARQLDLLTLENIKQTEEALDNHRLPFPLLDAGTIK(配列番号371)
【0615】
プラスミド12:
Ssp
N
L56,S70K,A83P:Pet30-His
6
-SUMO-AEY-Ssp
N
(L56F、S70K、A83P)
MGSSHHHHHHGSGLVPRGSASMSDSEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAFAKRQGKEMDSLRFLYDGIRIQADQTPEDLDMEDNDIIEAHREQIGGAEYCLSFGTEILTVEYGPLPIGKIVSEEINCSVYSVDPEGRVYTQAIAQWHDRGEQEVFEYELEDGSVIRATKDHRFLTTDYQLLPIEEIFARQLDLLTLENIKQTEEALDNHRLPFPLLDAGTIK(配列番号372)
【0616】
プラスミド13:
バッチ3:Pet30-His
6
-SUMO-AEY-Ssp
N
(S23E、E24K、E25R、N27E)
MGSSHHHHHHGSGLVPRGSASMSDSEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAFAKRQGKEMDSLRFLYDGIRIQADQTPEDLDMEDNDIIEAHREQIGGAEYCLSFGTEILTVEYGPLPIGKIVEKRIECSVYSVDPEGRVYTQAIAQWHDRGEQEVLEYELEDGSVIRATSDHRFLTTDYQLLAIEEIFARQLDLLTLENIKQTEEALDNHRLPFPLLDAGTIK(配列番号373)
【0617】
プラスミド14:
バッチ4:Pet30-His
6
-SUMO-AEY-Ssp
N
(P35N、E36N、R38N、V39I)
MGSSHHHHHHGSGLVPRGSASMSDSEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAFAKRQGKEMDSLRFLYDGIRIQADQTPEDLDMEDNDIIEAHREQIGGAEYCLSFGTEILTVEYGPLPIGKIVSEEINCSVYSVDNNGNIYTQAIAQWHDRGEQEVLEYELEDGSVIRATSDHRFLTTDYQLLAIEEIFARQLDLLTLENIKQTEEALDNHRLPFPLLDAGTIK(配列番号374)
【0618】
SspCインテイン上の4つのバッチ変異体(バッチ5~8)およびA136S点変異体を、プラスミド3をテンプレートとしたPfu Ultra II HSポリメラーゼ(Agilent)を用いた逆PCRによってクローニングし、以下に示すタンパク質配列をコードした:
【0619】
プラスミド15:
バッチ5:pTXB1-Ssp
C
-MxeGyrA-His
6
(V103I、V105I、I106A、G107T)
MIKIATRRSLGVQRIFDIGLPQDHNFLLANGAIAANCITGDALVALPEGESVRIADIVPGARPNSDNAIDLKVLDRHGNPVLADRLFHSGEHPVYTVRTVEGLRVTGTANHPLLCLVDVAGVPTLLWKLIDEIKPGDYAVIQRSAFSVDCAGFARGKPEFAPTTYTVGVPGLVRFLEAHHRDPDAQAIADELTDGRFYYAKVASVTDAGVQPVYSLRVDTADHAFITNGFVSHAHHHHHH(配列番号375)
【0620】
プラスミド16:
バッチ6:pTXB1-Ssp
C
-MxeGyrA-His
6
(R115N、I116V、F117Y)
MVKVIGRRSLGVQNVYDIGLPQDHNFLLANGAIAANCITGDALVALPEGESVRIADIVPGARPNSDNAIDLKVLDRHGNPVLADRLFHSGEHPVYTVRTVEGLRVTGTANHPLLCLVDVAGVPTLLWKLIDEIKPGDYAVIQRSAFSVDCAGFARGKPEFAPTTYTVGVPGLVRFLEAHHRDPDAQAIADELTDGRFYYAKVASVTDAGVQPVYSLRVDTADHAFITNGFVSHAHHHHHH(配列番号376)
【0621】
プラスミド17:
バッチ7:pTXB1-Ssp
C
-MxeGyrA-His
6
(L121V、P122E、Q123R)
MVKVIGRRSLGVQRIFDIGVERDHNFLLANGAIAANCITGDALVALPEGESVRIADIVPGARPNSDNAIDLKVLDRHGNPVLADRLFHSGEHPVYTVRTVEGLRVTGTANHPLLCLVDVAGVPTLLWKLIDEIKPGDYAVIQRSAFSVDCAGFARGKPEFAPTTYTVGVPGLVRFLEAHHRDPDAQAIADELTDGRFYYAKVASVTDAGVQPVYSLRVDTADHAFITNGFVSHAHHHHHH(配列番号377)
【0622】
プラスミド18:
バッチ8:pTXB1-Ssp
C
-MxeGyrA-His
6
(L128A、A130K、A133F)
MVKVIGRRSLGVQRIFDIGLPQDHNFALKNGFIAANCITGDALVALPEGESVRIADIVPGARPNSDNAIDLKVLDRHGNPVLADRLFHSGEHPVYTVRTVEGLRVTGTANHPLLCLVDVAGVPTLLWKLIDEIKPGDYAVIQRSAFSVDCAGFARGKPEFAPTTYTVGVPGLVRFLEAHHRDPDAQAIADELTDGRFYYAKVASVTDAGVQPVYSLRVDTADHAFITNGFVSHAHHHHHH(配列番号378)
【0623】
プラスミド19:
Ssp
C
A136S:pTXB1-Ssp
C
-MxeGyrA-His
6
(A136S)
MVKVIGRRSLGVQRIFDIGLPQDHNFLLANGAIASNCITGDALVALPEGESVRIADIVPGARPNSDNAIDLKVLDRHGNPVLADRLFHSGEHPVYTVRTVEGLRVTGTANHPLLCLVDVAGVPTLLWKLIDEIKPGDYAVIQRSAFSVDCAGFARGKPEFAPTTYTVGVPGLVRFLEAHHRDPDAQAIADELTDGRFYYAKVASVTDAGVQPVYSLRVDTADHAFITNGFVSHAHHHHHH(配列番号379)
【0624】
融合コンセンサスDnaE配列の遺伝子は、IDT DNAによる大腸菌発現のためにコドン最適化し、gBlockとして取得した。DNA gBlock配列を以下に示す:
【0625】
TGCCTGTCTTACGACACAGAGATTCTGACCGTTGAATATGGATTCCTTCCTATCGGTAAGATCGTGGAGGAACGGATTGAATGCACAGTCTATACGGTAGATAAAAATGGCTTTGTGTATACACAACCTATTGCTCAGTGGCATAACCGGGGAGAACAGGAAGTTTTCGAATACTGCTTAGAAGACGGTTCGATTATCCGTGCAACGAAAGATCACAAATTTATGACGACCGACGGTCAGATGTTACCGATTGATGAGATTTTCGAACGGGGGTTAGACCTGAAACAAGTTGATGGTTTGCCGATGGTCAAGATCATTAGTCGTAAGAGTCTGGGCACTCAAAACGTCTACGATATTGGAGTAGAAAAAGATCATAATTTTTTGCTGAAGAATGGGCTGGTGGCCTCTAAC(配列番号380)
【0626】
Gibsonアセンブリを用いてプラスミド1にCfaNの発現プラスミドをクローニングし、以下に示す以下のタンパク質をコードするベクターを得た:
【0627】
プラスミド20:
Cfa
N
:pET30-His
6
-SUMO-AEY-Cfa
N
MGSSHHHHHHGSGLVPRGSASMSDSEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAFAKRQGKEMDSLRFLYDGIRIQADQTPEDLDMEDNDIIEAHREQIGGAEYCLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP(配列番号381)
【0628】
Gibsonアセンブリを用いてプラスミド3にコンセンサスC-インテインの発現プラスミドをクローニングし、以下に示す以下の遺伝子をコードするベクターを得た:
【0629】
プラスミド21:
Cfa
C
:pTXB1-Cfa
C
-MxeGyrA-H6
MVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASNCITGDALVALPEGESVRIADIVPGARPNSDNAIDLKVLDRHGNPVLADRLFHSGEHPVYTVRTVEGLRVTGTANHPLLCLVDVAGVPTLLWKLIDEIKPGDYAVIQRSAFSVDCAGFARGKPEFAPTTYTVGVPGLVRFLEAHHRDPDAQAIADELTDGRFYYAKVASVTDAGVQPVYSLRVDTADHAFITNGFVSHAHHHHHH(配列番号382)
【0630】
大腸菌増殖スクリーニングに使用されるCfa構築物
C-エクステインの+2位でのスプライシングの依存性をスクリーニングするために使用されるCfaプラスミドは、スプリットアミノグリコシドホスホトランスェラーゼ(KanR)遺伝子の二重発現系を含む予め生成されたプラスミド2中への制限クローニングを用いて生成した。Cfa二重発現構築物を以下に示す:
【0631】
プラスミド22~25
[KanRプロモーター]-[RBS]-[KanR
N
]-[Cfa
N
]-[iRBS]-[Cfa
C
-[CXN-KanR
C
]
プロモーター配列に続いて、このベクター(RBSおよびiRBS)には2つの別個の大腸菌リボソーム結合部位が存在する。各RBSには、分割されたKanR-インテイン構築物の半分が続き、そのタンパク質配列を以下に示す(Cfaインテインは太字で強調している)。
【0632】
KanR
N
-Cfa
N
:
MEQKLISEEDLSHIQRETSCSRPRLNSNMDADLYGYKWARDNVGQSGATIYRLYGKPDAPELFLKHGKGSVANDVTDEMVRLNWLTEFMPLPTIKHFIRTPDDAWLLTTAIPGKTAFQVLEEYPDSGENIVDALAVFLRRLHSIPVCNCPFNSDRVFRLAQAQSRMNNGLVDASDFDDERNGWPVEQVWKEMHKLLPFCLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP(配列番号384)
【0633】
Cfa
C
-KanR
C
MVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASNCXNSVVTHGDFSLDNLIFDEGKLIGCIDVGRVGIADRYQDLAILWNCLGEFSPSLQKRLFQKYGIDNPDMNKLQFHLMLDEFF(配列番号385)
【0634】
C-エクステインの+2位には下線を引いており、フェニルアラニン、グリシン、アルギニンまたはグルタミン酸塩のいずれかである。
【0635】
αDEC205-HC-Cfa
N
αDEC205抗体軽鎖(LC)、重鎖(HC)、およびHC-インテイン融合体(HC-NpuN、HC-MchtN、HC-AvaN)を含むpCMVプラスミドを前述のようにして得た3。哺乳動物細胞発現のためのコドン最適化Cfa DnaE配列を、JCAT4を用いて生成し、IDT DNAによるgBlockとして取得した。配列を以下に示す:
【0636】
TGCCTGAGCTACGACACCGAGATCCTGACCGTGGAGTACGGCTTCCTGCCCATCGGCAAGATCGTGGAGGAGCGCATCGAGTGCACCGTGTACACCGTGGACAAGAACGGCTTCGTGTACACCCAGCCCATCGCCCAGTGGCACAACCGCGGCGAGCAGGAGGTGTTCGAGTACTGCCTGGAGGACGGCAGCATCATCCGCGCCACCAAGGACCACAAGTTCATGACCACCGACGGCCAGATGCTGCCCATCGACGAGATCTTCGAGCGCGGCCTGGACCTGAAGCAGGTGGACGGCCTGCCCGTGAAGATCATCAGCCGCAAGAGCCTGGGCACCCAGAACGTGTACGACATCGGCGTGGAGAAGGACCACAACTTCCTGCTGAAGAACGGCCTGGTGGCCAGCAAC(配列番号386)
【0637】
次いで、哺乳動物コドン最適化CfaN配列を、制限クローニングを用いてpCMV HC-NpuNプラスミド中にクローニングすることで以下のタンパク質をコードする配列を得た:
【0638】
プラスミド26:
HC-Cfa
N
:pCMV-HC-Cfa
N
MGWSCIILFLVATATGVHSEVKLLESGGGLVQPGGSLRLSCAASGFTFNDFYMNWIRQPPGQAPEWLGVIRNKGNGYTTEVNTSVKGRFTISRDNTQNILYLQMNSLRAEDTAIYYCARGGPYYYSGDDAPYWGQGVMVTVSSATTKGPSVYPLAPGSAAQTNSMVTLGCLVKGYFPEPVTVTWNSGSLSSGVHTFPAVLQSDLYTLSSSVTVPSSTWPSETVTCNVAHPASSTKVDKKIVPRDCGCKPCICTVPEVSSVFIFPPKPKDVLTITLTPKVTCVVVAISKDDPEVQFSWFVDDVEVHTAQTQPREEQFNSTFRSVSELPIMHQDWLNGKEFKCRVNSAAFPAPIEKTISKTKGRPKAPQVYTIPPPKEQMAKDKVSLTCMITDFFPEDITVEWQWNGQPAENYKNTQPIMDTDGSYFVYSKLNVQKSNWEAGNTFTCSVLHEGLHNHHTEKSLSHSPGKASGGCLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLPGHHHHHHG(配列番号387)
【0639】
デンドリマーのライゲーションのためのCfa
C
インテイン:
C-エクステインリンカーを有するCfa C-インテインを含むプラスミドを、逆PCRによりプラスミド21中にクローニングし、以下に示すタンパク質配列をコードする:
【0640】
プラスミド27:
Cfa
C
-link:pTXB1-H6-Cfa
C
-CFNSGG-MxeGyrA-H6
MGHHHHHHSGVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASNCFNSGGCITGDALVALPEGESVRIADIVPGARPNSDNAIDLKVLDRHGNPVLADRLFHSGEHPVYTVRTVEGLRVTGTANHPLLCLVDVAGVPTLLWKLIDEIKPGDYAVIQRSAFSVDCAGFARGKPEFAPTTYTVGVPGLVRFLEAHHRDPDAQAIADELTDGRFYYAKVASVTDAGVQPVYSLRVDTADHAFITNGFVSHAHHHHHH(配列番号388)
【0641】
全てのHis6-SUMO-AEY-IntN(プラスミド1、2、5~14、20)およびIntC-GyrA-His6(プラスミド3、4、15~19、21~27)構築物の発現および精製プロトコルは、前述の方法から適合した1。
【0642】
全てのHis
6
-SUMO-AEY-Int
N
構築物の発現
大腸菌BL21(DE3)細胞をN-インテインプラスミドにより形質転換し、50μg/mLのカナマイシンを含む1LのLBに37℃で増殖させた。培養液がOD600=0.6に達したら、0.5mM IPTGを添加して発現を誘導した(最終濃度0.5mM、37℃で3時間)。細胞を遠心分離(10,500rcf、30分)によりペレット化し、-80℃で保存した。
【0643】
全てのHis6-SUMO-AEY-IntN構築物の精製
バッチ突然変異誘発のためのN-インテイン構築物の精製
Roche Completeプロテアーゼインヒビターカクテルを含有する30mLの溶解バッファー(50mMリン酸塩、300mM NaCl、5mMイミダゾール、pH8.0)に細胞ペレット(プラスミド1、2、5~14の発現由来)を再懸濁した。次いで、再懸濁した細胞を氷上で超音波処理(35%振幅、8×20秒のパルスオン時間/30秒のオフ時間)して溶解させた。N-インテインを含む不溶性封入体を遠心分離(35,000rcf、30分)により回収した。上清を捨て、ペレットを30mLのトリトン洗浄バッファー(0.1%トリトンX-100を含む溶解バッファー)に再懸濁し、室温で30分間インキュベートした。次いで、トリトン洗浄剤を35,000rcfで30分間遠心分離した。上清を捨て、6M尿素を含む30mLの溶解バッファー中に封入体ペレットを再懸濁し、懸濁液を4℃で一晩インキュベートし、タンパク質を抽出および再可溶化した。次いで、この混合物を35,000rcfで30分間遠心分離した。
【0644】
次いで、上清を4mLのNi-NTA樹脂(His6タグを用いたアフィニティー精製用)と混合し、4℃で30分間インキュベートしてタンパク質をバッチ結合させた。この混合物をフリット処理済みカラムに充填し、フロースルーを回収し、6M尿素を有する5カラム容量(CV)の溶解バッファーならびに25mMイミダゾールおよび6M尿素を含む5CVの溶解バッファーでカラムを洗浄した。次いで、250mMイミダゾールおよび6M尿素を含む4つの1.5CV画分の溶解バッファーにタンパク質を溶出させた。最初の2つの溶出画分は、一般的にSDS-PAGE(12%ビス-トリスゲル、170Vで50分間運転)により発現されたタンパク質を含むことが見出され、リフォールディングのために組み合わせた。
【0645】
N-インテインは、4℃で0.5mMのDTTを含む溶解バッファーに段階的透析によってリフォールディングした。次いで、このリフォールディングされたタンパク質を10mM TCEPおよびUlp1プロテアーゼ(一晩、RT)で処理してHis6-SUMO発現タグを切断した。次いで、溶液を4mLのNi-NTA樹脂と混合し、4℃で30分間インキュベートした。スラリーをフリット処理済みカラムに適用し、溶解バッファーを含む3CV洗浄液と共にフロースルーを回収した。次いで、タンパク質を10mM TCEPで処理し、10mLに濃縮し、脱気したスプライシングバッファー(100mMリン酸ナトリウム、150mM NaCl、1mM EDTA、pH7.2)を移動相として用いるS75 16/60ゲル濾過カラムを使用するサイズ排除クロマトグラフィーによってさらに精製した。画分を、SDS-PAGE、分析用RP-HPLCおよびESI-MSによって分析した。純粋なタンパク質を、グリセロール(20%v/v)の添加後、液体窒素中で急速凍結することによって保存した。注:リフォールディング工程中、バッチ3について有意なタンパク質沈殿が観察され、これは凝集する傾向があることを示唆するものである。
【0646】
CfaNの精製:
Roche Completeプロテアーゼインヒビターカクテルを含有する30mLの溶解バッファー(50mMリン酸塩、300mM NaCl、5mMイミダゾール、pH8.0)に細胞ペレット(プラスミド20の発現由来)を最初に再懸濁した。次いで、細胞を超音波処理(35%振幅、8×20秒のパルスオン時間/30秒のオフ時間)により溶解し、溶解物を遠心分離(35,000rcf、30分間)によりペレット化した。
上清を4mLのNi-NTA樹脂と共に4℃で30分間インキュベートして、可溶性CfaNタンパク質を濃縮した。次いで、スラリーをフリット処理済みカラムに充填し、カラムを20mLの洗浄バッファー1(溶解バッファー)、続けて20mLの洗浄バッファー2(25mMイミダゾールを含む溶解バッファー)により洗浄した。最後に、タンパク質を4×1.5CVの溶出バッファー(溶解バッファー+250mMイミダゾール)によりカラムから溶出した。
【0647】
次いで、SDS-PAGE(170Vで50分間、MES-SDSランニングバッファーに12%のビス-トリスゲルを泳動)により測定した溶出画分1および2に存在する所望のタンパク質を溶解バッファーに4℃で4時間透析した。透析後、タンパク質を10mM TCEPおよびUlp1プロテアーゼにより室温で一晩処理してHis6-SUMO発現タグを切断した。次いで、溶液を4mLのNi-NTA樹脂と共に4℃で30分間インキュベートした。スラリーをフリット処理済みカラムに適用し、溶解バッファーを含む3CV洗浄液と共にフロースルーを回収した。次いで、タンパク質を10mM TCEPで処理し、10mLまで濃縮し、脱気したスプライシングバッファー(100mMリン酸ナトリウム、150mM NaCl、1mM EDTA、pH7.2)を移動相として用いるS75 16/60ゲル濾過カラムを使用するサイズ排除クロマトグラフィーによってさらに精製した。画分を、SDS-PAGE(170Vで60分間、MES-SDSランニングバッファーに12%のビス-トリスゲルを泳動)、分析用RP-HPLCおよびESI-MSによって分析した。純粋なタンパク質を、グリセロール(20%v/v)に保存し、液体窒素中で急速凍結した。
【0648】
IntC-CFN構築物の半合成
大腸菌BL21(DE3)細胞を適切なpTXB1-IntC-GyrA-H6プラスミド(プラスミド3、4、15~19、21)により形質転換し、37℃でアンピシリン(100μg/mL)を含有する2LのLB培地に37℃で増殖させた。培養液がOD600=0.6に達したら、IPTG(0.5mM、3時間、37℃)を添加して発現を誘導した。遠心分離(10,500rcf、30分)により細胞ペレットを採取し、溶解バッファーに再懸濁し、氷上で(35%振幅、10×20秒のパルスオン時間/30秒のオフ時間)して溶解させた。可溶性画分中のタンパク質を遠心分離(35,000rcf、30分)により単離し、次いでNi-NTA精製(ビーズ4mL、N-インテイン構築物について記載したとおり行った)により濃縮した。250mMイミダゾールを含む溶解バッファーに溶出した後、イミダゾールを透析により新しい溶解バッファーに除去した。次いで、10mM TCEP、Roche Completeプロテアーゼインヒビターカクテル、100mM MESNa、5mM EDTA、および5mM CFN-NH2(pH7.0)を添加して、室温で一晩ライゲーションを行った。ライゲーションされたIntC-CFNペプチドを0.5%TFAにより酸性化し、C18分取カラム:グラジエント=10分間(アイソクラティック)で10%B、続けて60分間にわたり20~60%BでRP-HPLCにより精製した。各タンパク質の純度を分析用RP-HPLCにより決定し、その同一性をESI-MSにより確認した。
【0649】
CfaC-link-MESNaの単離
インテイン-デンドリマー融合体の半合成に使用されるCfaC-link-MESNaペプチドは、IntC-CFN構築物(プラスミド27からの発現)について上記で記載したとおり正確に発現および精製した。しかしながら、最終的なライゲーションステップの間にトリペプチドは添加せず、代わりにインテインのチオール開裂およびα-チオエステルの形成が生じた。次いで、このCfaC-MESNaα-チオエステルを分取RP-HPLCにより精製した。画分をESI-MSにより分析し、合一し、凍結乾燥した。
【0650】
バッチ変異体についてのRP-HPLCおよびESI-MSによるタンパク質トランススプライシングの分析
スプライシング反応は、上述のプロトコルから適合させて行った1。簡潔に述べると、N-およびC-インテイン(15μMIntN、10μMIntC)を個々にスプライシングバッファー(100mMリン酸ナトリウム、150mM NaCl、1mM EDTA、pH7.2)に2mM TCEPと共に15分間プレインキュベートした。他に指示がない限り、全てのスプライシング反応は30℃で行った。指示された濃度の尿素または塩酸グアニジンを用いて、カオトロピック剤に対するNpuおよびCfaの耐性を比較するスプライシング反応を行った。等しい容量のN-およびC-インテインを、指示された時間に取り出したアリコートと混合し、8Mグアニジン塩酸塩、4%TFA(3:1v/v)の添加によりクエンチすることにより、スプライシングを開始した。NpuC-CFNまたはCfaC-CFNのいずれかを含む全てのスプライシング反応について、反応の進行をRP-HPLCによりモニターした。SspC-CFNを含む全てのスプライシング反応では、予め見られた各状態のクロマトグラフィー分離度が低いため、ESI-MS(注入前にZipTipにより脱塩したサンプル)により反応の進行をモニターした1。80℃でのバッチ3およびCfa(15分間のプレインキュベーション)のスプライシングは両方とも非効率的であり、約50%の完了に達することが観察された。これはN-インテインの凝集(および不活性化)に起因する可能性が高い。注:80℃でのCfaのプレインキュベーションが短くなると、スプライシングがより効率的になる。
【0651】
バッチ変異体のトランススプライシング反応の動態分析:
動態分析は、上述のとおり行った1。簡潔に述べると、5つの種(1~5)をRP-HPLCにより分離し、ピーク面積を決定する。ESI-MSの場合、ピーク面積は1~4の種について計算する。個々のピークは、全ての合わせたピークの合計面積に対して正規化し、反応進行曲線をプロットした(n=3)。次いで、データは、スリーステート動態スプライシングモデルのための結合された微分速度方程式に対する解析解にProFitに適合させた。このアッセイを用いて出発物質を線状チオエステルから分離することはできないので、スリーステート動態モデルは結合ステップおよびスプライシング反応の最初の2つのステップを1つの平衡に崩壊させる。各スプライシング反応は、各複製を別々に分析して三重反復で行った。全ての値(n=3)の平均および標準偏差を報告する。
【0652】
NpuおよびCfaに対する全体のトランススプライシング反応の動態解析
NpuおよびCfaを比較する全てのスプライシング反応はRP-HPLCにより分離し、ピーク面積はメーカーのソフトウェアを使用してもう一度計算した。これらの反応について、出発物質および分岐状中間体(種1および2)および産物(種3、4、5)のピーク面積を計算した。次に、GraphPad Prismソフトウェアを使用して、データを一次速度式に適合させた。
【数1】
[P]が正規化された積の強度である場合、[P]
maxはt=∞(反応プラトー)でのこの値であり、kは速度定数(s
-1)である。平均および標準偏差(n=3)を報告する。
【0653】
DnaEインテイン多配列アライメントの生成および精製
Npu DnaEのホモログは、Npu DnaEタンパク質配列を用いたNCBI
6(ヌクレオチドコレクション)およびJGI
7データベースのBLAST
5検索により同定した。これにより、>60%の配列同一性を有する105のタンパク質を同定した。長いC-末端尾部を有するN-インテインについて、タンパク質はNpuの長さである102の残基に切断した。JGIデータベースからのN-インテインについて、切断点はBLASTプログラムの結果により決定した(Blast検索で同定された最後の残基を切断点として選択した)。次に、Jalview(
図7A)の全ての105のインテインの融合配列(すなわち、C-インテインに連結されたN-インテイン)の多配列アライメント(MSA)を生成した
8。迅速にスプライシングされると予想されるインテインについてMSAを精製するために、K70、M75、M81、およびS136を含有しない全ての配列(「アクセラレータ」残基)をアライメントから除去し、高速スプライシング動態を有すると予想される73のインテインを残した(
図7B)。高速インテイン(Cfa)のこの精製されたアライメントのコンセンサス配列は、各位置で最も頻繁に現れるアミノ酸を決定することによりJalviewで計算した。アライメントにおいて相同性の欠如ゆえにコンセンサス残基は位置98および102で同定されなかったので、コンセンサス配列は101のアミノ酸に切断し、位置98はNpu DnaEに見出される残基に固定した。次いで、このコンセンサス配列をJalviewのNpu DnaEと整列させて、その同一性の割合を計算した。非同一残基は、Npu DnaE(pdb=4K15)の結晶構造上にマッピングした(
図1)。
【0654】
図7Aおよび7Bは、DnaEインテインファミリーのアライメントおよび精製を示す。
図7Aは、JGIおよびNCBI配列データベースのBLAST検索から見出されたDnaEインテインファミリーの105メンバーの多配列アライメント(MSA)を示す。アライメントをフィルタリングするために使用される「アクセラレータ」残基の位置は、黒色の矢印で示している。
図7Bは、全ての4つのアクセラレータ残基の存在に起因して高速スプライシング動態を示すと予測される73のDnaEインテインのMSAを示す。
【0655】
Cfaエクステイン依存性のための大腸菌Kan
Rスクリーニング
前述のとおり、タンパク質スプライシングカップリングカナマイシン耐性(Kan
R)アッセイを行った
2.9。簡潔に述べると、C-エクステインの+2位(プラスミド22~25)に存在するF、G、RまたはEのいずれかを有するスプリットインテイン(Cfa)に融合した断片化アミノグリコシドホスホトランスフェラーゼをコードするプラスミドを、DH5αコンピテント細胞に形質転換し、スターター培養液において一晩培養した(LBブロス、100μg/mLアンピシリン、18時間)。次いで、これらの培養液を96ウェルプレートに20倍に希釈し、大腸菌の増殖を種々の濃度のカナマイシン(100μg/mLアンピシリンを含む2.5、10、25、50、100、250、1000μg/mLのカナマイシン)で測定した。24時間の終点で650nm(OD
650)における細胞の光学密度を、可変傾斜を有する用量反応曲線に適合させた。
【数2】
ここでOD
minは650nmにおけるバックグラウンド吸光度に固定した。各アッセイを三重反復で行い、別々に適合させ、IC
50値を、これら3つの別々の測定についてIC
50の平均および標準偏差として報告する。
【0656】
抽出された封入体のタンパク質トランススプライシング
His6-Sumo-CfaN発現(プラスミド20)を含む大腸菌封入体を再懸濁し、6M尿素を含む溶解バッファーに4℃で一晩抽出した。遠心分離(35,000rcf、30分)後、上清を除去し、タンパク質を変性条件下でNi-NTAにより濃縮した(上記のとおり)。しかしながら、タンパク質をリフォールディングする代わりに、CfaC-CFN(10μMCfaC、2mM TCEP、2mM EDTA、2時間、室温)の添加によりトランススプライシングを直接開始した。反応の進行をSDS-PAGEでモニターした。
【0657】
αDec205-HC-IntN試験発現およびスプライシング
HC-NpuN、HC-MchtN、HC-AvaN、HC-CfaNの試験発現
全てのmAb構築物の発現は、上述のとおり行った3。簡潔に述べると、αDec205-LCおよびαDec205-HC-IntNをコードするプラスミドをHEK293T細胞に同時トランスフェクションし、96時間(5%CO2)インキュベートした。細胞をスピンダウン(5分、1,000rcf)し、各インテイン融合のための培地15μLを5μLの4×ローディング色素と混合し、MES-SDSランニングバッファー中の12%ビス-トリスゲル上で泳動させた(50分で170V)。次いで、タンパク質をウェスタンブロットにより分析した(PVDF膜に転写し、αMouse IgGに対してブロッティングした)。発現収量は、デンシトメトリーにより決定した培地中のHC-IntNの量として測定した。様々な細胞増殖および生存を説明するために、HEK293T細胞溶解物のα-アクチンブロット(5秒の超音波、35%振幅、1×ローディング色素中)を用いて収量を正規化し、HC-CfaNの発現と比較して表した。この試験発現の4回の反復を行い、標準偏差として表される誤差を用いて平均値を計算した。
【0658】
増殖培地におけるタンパク質トランススプライシング
上記のmAB-AvaNおよびmAB-CfaN構築物の37℃での96時間の発現の後、培地をスピンダウンした(1,000rcf、5分間)。次いで、上清をCfaC-CFNペプチド(発現プラスミド21の半合成)と混合し、室温(2μMCfaC-CFN、2mM TCEP、2mM EDTA)で2時間インキュベートした。スプライシング反応を、SDS-PAGE(170Vで50分間MES-SDSランニングバッファー中での12%ビス-トリスの泳動)により分析し、続けてウェスタンブロット(αMouse IgG)により分析した。
【0659】
ペプチドおよびデンドリマーの合成
Cys-Gly-Lys(フルオレセイン)。このペプチドは、前で公開した手順に従ってRink Amide樹脂上に試薬を手動で添加することによって合成した
2。
【化6】
補足スキーム1
【0660】
化合物2(デンドリマーチオエステル)。この化合物は、400mgのRink Amide樹脂(置換:0.47mmol/g、188μmol)のスケールで、補足スキーム1に概説した経路を用いて固相上で合成した。一般的な手順が最初に与えられ、続けてこのペプチドに対する任意の特定の方法が与えられる。DMF中の3mLの20%ピペリジンを用いてFmoc基を除去し、2回実施した(30秒間の脱保護1回、続けて15分間の更なる脱保護)。それぞれの脱保護ステップの後、ならびにその後の全ての合成ステップの後、フロー洗浄を使用した(それぞれ約5mLのDMFで3×5秒)。4当量のモノマー、4当量のHBTUおよび8当量のDIPEAのいずれかを用いて、特に明記しない限り、予備活性化なしでカップリングを実施した。完全にアシル化するように、全ての残基について二重カップリングを用いた。
【0661】
トリチル保護基を、DCM中の1%TFA、5%TISを用いて、合計30mL(10×3mL)の脱保護カクテルを用いて選択的に除去した。これらのサイクル中およびサイクル後の両方で、樹脂をDCMで徹底的に洗浄することにより、遊離したトリチル種の除去を確実にした。樹脂をDMF中の5%DIPEAでも中和した後、次のカップリングを行った。Alloc基を0.1当量のテトラキス(トリフェニルホスフィン)パラジウム(0)、20当量のフェニルシランを用いてDCM中でそれぞれ3×45分間脱保護した。これらのサイクル中およびサイクル後のDCMによる樹脂の徹底的な洗浄、ならびに次のカップリング前のDMF洗浄における5%DIPEAを使用した。グルタル酸無水物モノマーは、チオエステルの形成を可能にする(すなわち、官能化する遊離樹脂結合カルボン酸を有するようにする)ために、予備活性化されたジカルボン酸として使用した。20当量のグルタル酸無水物および10当量のDIPEA(アシル化すべきアミンの数に対して)を樹脂に添加し、1時間反応させた。次いで、樹脂を洗浄し、カップリングを繰り返して樹脂に結合した第一級アミンの完全な反応を確実にした。樹脂に結合したチオエステルを形成するために、DMF中の30当量のチオグリコール酸メチル、5当量のPyAOPおよび10当量のDIPEA(カルボキシレートの数に対する)を樹脂に添加し、1時間反応させた。樹脂を過剰のDMFで洗浄し、カップリング手順をさらに2回繰り返した。
【0662】
切断は、95%TFA、2.5%TISおよび2.5%H2Oにより室温で2時間実施した。次いでペプチドをジエチルエーテルにより沈殿させ、0.1%TFAを含む水に溶解し、RP-HPLCで分析した。粗製物質をセミ分取スケールRP-HPLCで精製し、所望の画分を分析し、プールし、凍結乾燥した。RP-HPLCの特性:グラジエント0~73%B、tr=18.4分。予想される質量:2198.86Da.実測値:2198.82Da。
【0663】
化合物3(デンドリマーフルオレセイン)
化合物3を天然のケミカルライゲーション(スキーム2)により合成した。化合物2をライゲーションバッファーに溶解し、5当量のCys-Gly-Lys(フルオレセイン)(1mM 2、5mMペプチド、4Mグアニジン、100mMリン酸塩、150mM NaCl、100mM MPAA、20mM TCEP、pH7.0)で希釈し、室温で一晩反応させた。次いで、0.1Mメトキシアミン(最終濃度)の添加およびライゲーションバッファーのpHを4.0(一晩、室温)まで低下させることにより、チアゾリジンの脱保護を達成した。
【0664】
RP-HPLCにより化合物3を精製しようとした場合、それを酸性化して水で希釈すると難溶性であることを確認した。しかしながら、Cys-Gly-Lys(フルオレセイン)、MPAA、およびメトキシアミンは全て溶液中に残った。この観察から、0.1%TFAを用いて水中で10倍希釈した後、選択的沈殿により3を精製した。沈殿した粉末を遠心分離(17,000rcf、5分)により単離し、次いで残りの汚染物質をすべて洗い流すために再溶解した(100mMリン酸塩、150mM NaCl、pH7.2)。もう一度、酸性化によって溶液を沈殿させ、遠心分離(17,000rcf、5分)により単離した。次いで、この単離された粉末を凍結乾燥した。予想される質量:4417.8Da.実測値:4417.5Da。
【化7】
補足的スキーム2。ネイティブケミカルライゲーションを使用して、蛍光トリペプチドを有するテトラチオエステル含有化合物2を合成した。更なるライゲーションのために、メトキシルアミンを用いたその後の脱保護を使用してN-末端システインを曝すことで、四官能化デンドリマー、化合物3を得た。
【0665】
化合物1:(CfaC-デンドリマー)
化合物1は発現されたタンパク質ライゲーションによって合成した。化合物3をライゲーションバッファーに溶解し、1.5当量のCfaC-MESNaチオエステル(100μM3、150μMCfaC-MESNa、4Mグアニジン、100mMリン酸塩、150mM NaCl、20mM TCEP、100mM MPAA)と混合した。反応を室温で一晩進行させた。次いで、ライゲーションされた産物をセミ分取RP-HPLCによって精製した。所望の画分をプールし、凍結乾燥した。予想される質量:9860.8Da.実測値:9860.3Da。
【0666】
αDec205mAbを用いたデンドリマーのタンパク質トランススプライシング
そのC-末端に融合したCfaNを有するαDec205mAbを上記のとおり発現させた。96時間の発現の後、培地をAmicon 30K濃縮器(0.5mL)中で10倍に濃縮した。化合物1をスプライシングバッファー(100mMリン酸塩、150mM NaCl、1mM EDTA、pH7.2)に溶解し、次いで濃縮培地(2μM化合物1、2mM TCEP、1mM EDTA)と混合し、反応を室温で2時間進行させた。次いで、スプライシング混合物をSDS-PAGE(170Vで50分間、MES-SDSランニングバッファーに12%ビス-トリスを泳動)により分析し、蛍光画像装置で画像化した。これに続いて、PVDF膜への転写およびウェスタンブロット分析(αMouse IgG)を行った。
【0667】
本発明は、スプリットインテイン断片と化合物との間の種々の複合体の形成を可能にする。そのような複合体および化合物のいくつかを
図11の表に示す。Int
Cは、スプリットインテイン断片、例えばスプリットインテインC断片である。例えば、デンドリマーは、化合物2、化合物3またはこれらの一部の形態をとり得る。例えば、カーゴは、色素(例えば、フルオレセイン)、別のマーカー分子、薬物(例えば、癌の治療に使用されるような細胞傷害性分子)、またはヌクレオチドであり得る。例えば、ポリペプチドは、完全にまたは部分的に合成されたポリペプチドまたは天然に存在するポリペプチドまたはその一部であり得る。デンドリマーは、1つ以上の「カーゴ(cargo)」分子がその上に「装填」され得る分岐状化学構造を有する分子であり得る。「カーゴ」分子は、天然に存在する分子の合成物であり得る。カーゴ分子は、遊離1,2-アミノチオールまたは1,2-アミノアルコールを有しないように構成することができる。インテインがアミノチオールまたはアミノアルコールを介してポリペプチドに結合される場合、
図11の表の3列目に示すように、形成された複合体は組換え融合タンパク質であると考えることができる。
【0668】
実施例2:
スプライシングに基づく方法に対する主な注意点は、全ての特徴付けられたインテインがスプライス部位に隣接するエクステイン残基に配列優先を示すことである。+1位に必須の触媒性Cys、Ser、またはThr残基(すなわち、C-エクステイン内の第1残基)に加えて、ネイティブ挿入部位に見出される近位N-およびC-エクステイン配列に似ている残基の偏りがある。この好ましい配列の文脈からの逸脱は、スプライシング活性の著しい低下につながり、PTSに基づく方法の適用性を制限する23,24。したがって、その活性が局所配列環境によって最小限に影響されるスプリットインテインが必要である。DnaEインテインについて、エクステイン配列の選択は、+1位の触媒システインおよび+2位で好ましい大きな疎水性残基に大きく限定されている25。
【0669】
この実施例では、カナマイシン耐性アッセイにおいて、Cfa(Cfa
GEP)の残基122~124への「EKD」から「GEP」のループ突然変異をエンジニアリングし、C-エクステインの+2位置で乱雑さを増加させた(
図9)。EKD→GEP突然変異は、広範囲のエクステインの状況下でCfaの活性を増加させる。さらに、これらの同じ(または類似の)突然変異が、DnaEインテインファミリー(Npuおよび
図7Aおよび7Bに列挙されたものを含む)の他のメンバーとの乱雑さを増加させることが合理的に予測され得る。
【0670】
以下の配列は、エンジニアリングされたインテインを表す:
本発明の一つの実施形態による、より「乱雑な」活性を付与する「GEP」突然変異を有するCfaC-インテインは:
VKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASN(配列番号389)である。
【0671】
配列番号389の「GEP」突然変異を有するCfa-NインテインおよびCfa-Cインテインの融合インテインの一例は:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLPVKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASN(配列番号390)である。
【0672】
図9は、Cfa
GEPの増加した乱雑さを示す概略図および表を示す。パネルAは、Cfaスプリットインテインを有するPTS依存性大腸菌選択系を示す概略図を示す。カナマイシン耐性タンパク質KanRは分裂し、N-およびC-インテイン断片(Cfa
NおよびCfa
C)に融合する。+2C-エクステイン残基(赤色X)は系内で変化する。パネルBには、指示された+2C-エクステイン残基を有するCfa
EKD(WT)およびCfa
GEP(GEP)インテインのカナマイシン耐性のIC
50値を示している(誤差=標準誤差(n=3))。
【0673】
さらに、様々なエクステイン配列に対するこの同じ耐性も、大腸菌におけるeGFPの環化において観察された(
図10)。Cfa
GEPインテインは、試験した全ての好ましくない+2C-エクステインの状況において、環化産物の収量の改善を示した(
図10パネルA、
図10パネルB)。さらに、Cfa
GEPは、-1および+3エクステイン位置が変化しても、この改善された環化活性を維持する(
図10パネルC、
図10パネルD)。野生型天然スプリットDnaEインテインにおいて同定されていないこのエンジニアリングされた「GEP」ループ配列は、PTSに基づく技術にアクセス可能なタンパク質およびペプチドの幅を広げるべきである。
【0674】
図10は、Cfa
GEPスプリットインテインを用いたeGFP環化を示す概略図およびグラフを示す。パネルAは、+2C-エクステイン位置(赤色X)で可変残基を有する大腸菌におけるeGFPの環化を示す概略図である。パネルBには、指示された+2C-エクステイン残基を有するCfa
EKD(WT)およびCfa
GEP(GEP)について大腸菌において一晩発現後に形成された環化eGFPの画分を示している(平均±標準偏差、n=3)。パネルCは、+3C-エクステイン位置(青色X)および-1N-エクステイン位置(赤色X)における可変残基を有する大腸菌におけるeGFPの環化を示す概略図である。パネルDは、指示された+3C-エクステインおよび-1N-エクステイン残基(平均±標準偏差、n=3)を有するCfa
EKD(WT)およびCfa
GEP(GEP)についての大腸菌における一晩発現後に形成された環化eGFPの画分を示す。
【0675】
したがって、以下の特許請求の範囲は、上で具体的に図示し記載したもの、概念的に同等であるもの、明白に置換できるもの、本質的に本発明の本質的な考え方を組み込んだものも含むと理解されるべきである。当業者であれば、本発明の範囲から逸脱することなく、上述の好ましい実施形態の様々な適応および変更を構成できることを理解するであろう。例示された実施形態は、例示のためだけに記載されており、本発明を限定するものとして解釈すべきではない。したがって、添付の特許請求の範囲内で、本発明は本明細書に具体的に記載された以外のものとして実施されてもよいことが理解されるべきである。
【0676】
参考文献
(1)Shah,N.H.;Muir,T.W.Chem.Sci.2014,5,15.
(2)Wu,H.;Hu,Z.;Liu,X.Q.Proc.Natl.Acad.Sci.U.S.A.1998,95,9226.
(3)Iwai,H.;Zuger,S.;Jin,J.;Tam,P.H.FEBS Lett.2006,580,1853.
(4)Zettler,J.;Schutz,V.;Mootz,H.D.FEBS Lett.2009,583,909.
(5)Shah,N.H.;Eryilmaz,E.;Cowburn,D.;Muir,T.W.J.Am.Chem.Soc.2013,135,5839.
(6)Shah,N.H.;Dann,G.P.;Vila-Perello,M.;Liu,Z.;Muir,T.W.J.Am.Chem.Soc.2012,134,11338.
(7)Carvajal-Vallejos,P.;Pallisse,R.;Mootz,H.D.;Schmidt,S.R.J.Biol.Chem 2012,287,28686.
(8)Wu,Q.;Gao,Z.;Wei,Y.;Ma,G.;Zheng,Y.;Dong,Y.;Liu,Y.Biochem.J.2014,461,247.
(9)Aranko,A.S.;Oeemig,J.S.;Kajander,T.;Iwai,H.Nat.Chem.Biol.2013,9,616.
(10)Pietrokovski,S.Protein Sci.1994,3,2340.
(11)Dearden,A.K.;Callahan,B.;Roey,P.V.;Li,Z.;Kumar,U.;Belfort,M.;Nayak,S.K.Protein Sci.2013,22,557.
(12)Du,Z.;Shemella,P.T.;Liu,Y.;McCallum,S.A.;Pereira,B.;Nayak,S.K.;Belfort,G.;Belfort,M.;Wang,C.J.Am.Chem.Soc.2009,131,11581.
(13)Lehmann,M.;Kostrewa,D.;Wyss,M.;Brugger,R.;D’Arcy,A.;Pasamontes,L.;van Loon,A.P.Protein Eng.2000,13,49.
(14)Steipe,B.Methods Enzymol.2004,388,176.
(15)Altschul,S.F.;Gish,W.;Miller,W.;Myers,E.W.;Lipman,D.J.J.Mol.Biol.1990,215,403.
(16)Grigoriev,I.V.;Nordberg,H.;Shabalov,I.;Aerts,A.;Cantor,M.;Goodstein,D.;Kuo,A.;Minovitsky,S.;Nikitin,R.;Ohm,R.A.;Otillar,R.;Poliakov,A.;Ratnere,I.;Riley,R.;Smirnova,T.;Rokhsar,D.;Dubchak,I.Nucleic Acids Res.2012,40,D26.
(17)Tatusova,T.;Ciufo,S.;Fedorov,B.;O’Neill,K.;Tolstoy,I.Nucleic Acids Res.2014,42,D553.
(18)Shah,N.H.;Eryilmaz,E.;Cowburn,D.;Muir,T.W.J.Am.Chem.Soc.2013,135,18673.
(19)Mohlmann,S.;Bringmann,P.;Greven,S.;Harrenga,A.BMC Biotechnol.2011,11,76.
(20)Barbuto,S.;Idoyaga,J.;Vila-Perello,M.;Longhi,M.P.;Breton,G.;Steinman,R.M.;Muir,T.W.Nat.Chem.Biol.2013,9,250.
(21)Vila-Perello,M.;Liu,Z.;Shah,N.H.;Willis,J.A.;Idoyaga,J.;Muir,T.W.J.Am.Chem.Soc.2013,135,286.
(22)Shah,N.D.;Parekh,H.S.;Steptoe,R.J.Pharm.Res.2014,31,3150.
(23)Iwai,H.;Zuger,S.;Jin,J.;Tam,P.H.FEBS Lett.2006,580,1853.
(24)Amitai,G.;Callahan,B.P.;Stanger,M.J.;Belfort,G.;Belfort,M.Proc Natl Acad Sci USA 2009,106,11005.
(25)Cheriyan,M.;Pedamallu,C.S.;Tori,K.;Perler,F.J Biol Chem 2013,288,6202.
【配列表】