IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ グリコシン リミテッド ライアビリティー カンパニーの特許一覧

特開2023-110032シアリルトランスフェラーゼおよびその使用
<>
  • 特開-シアリルトランスフェラーゼおよびその使用 図1
  • 特開-シアリルトランスフェラーゼおよびその使用 図2
  • 特開-シアリルトランスフェラーゼおよびその使用 図3
  • 特開-シアリルトランスフェラーゼおよびその使用 図4
  • 特開-シアリルトランスフェラーゼおよびその使用 図5
  • 特開-シアリルトランスフェラーゼおよびその使用 図6A
  • 特開-シアリルトランスフェラーゼおよびその使用 図6B
  • 特開-シアリルトランスフェラーゼおよびその使用 図6C
  • 特開-シアリルトランスフェラーゼおよびその使用 図7
  • 特開-シアリルトランスフェラーゼおよびその使用 図8
  • 特開-シアリルトランスフェラーゼおよびその使用 図9
  • 特開-シアリルトランスフェラーゼおよびその使用 図10
  • 特開-シアリルトランスフェラーゼおよびその使用 図11
  • 特開-シアリルトランスフェラーゼおよびその使用 図12
  • 特開-シアリルトランスフェラーゼおよびその使用 図13
  • 特開-シアリルトランスフェラーゼおよびその使用 図14
  • 特開-シアリルトランスフェラーゼおよびその使用 図15
  • 特開-シアリルトランスフェラーゼおよびその使用 図16
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023110032
(43)【公開日】2023-08-08
(54)【発明の名称】シアリルトランスフェラーゼおよびその使用
(51)【国際特許分類】
   C12N 15/54 20060101AFI20230801BHJP
   C12P 19/28 20060101ALI20230801BHJP
   C12N 9/10 20060101ALI20230801BHJP
   C12N 1/21 20060101ALN20230801BHJP
   C12M 1/00 20060101ALN20230801BHJP
   C12N 15/61 20060101ALN20230801BHJP
   C12N 15/56 20060101ALN20230801BHJP
   C12N 9/90 20060101ALN20230801BHJP
【FI】
C12N15/54
C12P19/28 ZNA
C12N9/10
C12N1/21
C12M1/00 D
C12N15/61
C12N15/56
C12N9/90
【審査請求】有
【請求項の数】19
【出願形態】OL
(21)【出願番号】P 2023091542
(22)【出願日】2023-06-02
(62)【分割の表示】P 2020551785の分割
【原出願日】2018-12-14
(31)【優先権主張番号】62/599,481
(32)【優先日】2017-12-15
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】520210387
【氏名又は名称】グリコシン リミテッド ライアビリティー カンパニー
(74)【代理人】
【識別番号】100102978
【弁理士】
【氏名又は名称】清水 初志
(74)【代理人】
【識別番号】100205707
【弁理士】
【氏名又は名称】小寺 秀紀
(74)【代理人】
【識別番号】100160923
【弁理士】
【氏名又は名称】山口 裕孝
(74)【代理人】
【識別番号】100119507
【弁理士】
【氏名又は名称】刑部 俊
(74)【代理人】
【識別番号】100142929
【弁理士】
【氏名又は名称】井上 隆一
(74)【代理人】
【識別番号】100148699
【弁理士】
【氏名又は名称】佐藤 利光
(74)【代理人】
【識別番号】100128048
【弁理士】
【氏名又は名称】新見 浩一
(74)【代理人】
【識別番号】100129506
【弁理士】
【氏名又は名称】小林 智彦
(74)【代理人】
【識別番号】100114340
【弁理士】
【氏名又は名称】大関 雅人
(74)【代理人】
【識別番号】100121072
【弁理士】
【氏名又は名称】川本 和弥
(72)【発明者】
【氏名】マリペディ スリクリシュナン
(72)【発明者】
【氏名】ハイトマン マシュー イアン
(72)【発明者】
【氏名】メリーギ マッシモ
(72)【発明者】
【氏名】マッコイ ジョン エム.
(57)【要約】      (修正有)
【課題】精製されたヒトミルクオリゴ糖を生産する新しい方法を提供する。
【解決手段】細菌においてシアル化オリゴ糖を生産するための方法であって、外因性ラクトース利用性シアリルトランスフェラーゼ酵素を含む細菌を提供する工程を含み、該酵素が、(i)少なくとも250アミノ酸のストレッチにわたってPst6-224のアミノ酸配列と5%~30%同一、または(ii)少なくとも250アミノ酸のストレッチにわたってHAC1268のアミノ酸配列と45%~75%同一であるアミノ酸配列を含む、方法とする。
【選択図】図1
【特許請求の範囲】
【請求項1】
細菌においてシアル化オリゴ糖を生産するための方法であって、外因性ラクトース利用性シアリルトランスフェラーゼ酵素を含む細菌を提供する工程を含み、該酵素が、
(i)少なくとも250アミノ酸のストレッチにわたってPst6-224のアミノ酸配列(SEQ ID NO:1)と5%~30%同一、または
(ii)少なくとも250アミノ酸のストレッチにわたってHAC1268のアミノ酸配列(SEQ ID NO:8)と45%~75%同一
であるアミノ酸配列を含む、方法。
【請求項2】
前記酵素が、BstN(SEQ ID NO:10)、BstC(SEQ ID NO:2)、Δ20BstC*2(SEQ ID NO:27)、BstD(SEQ ID NO:3)、Δ20BstC*(SEQ ID NO:15)、Δ20BstC(SEQ ID NO:18)、BstE(SEQ ID NO:4)、BstE*(SEQ ID NO:16)、BstH(SEQ ID NO:5)、BstI(SEQ ID NO:6)、BstJ(SEQ ID NO:7)、またはBstM(SEQ ID NO:9)のうちの1つまたは複数のアミノ酸配列と5%~100%同一であるアミノ酸配列を含む、請求項1記載の方法。
【請求項3】
前記酵素のアミノ酸配列が、BstN(SEQ ID NO:10)、BstC(SEQ ID NO:2)、ΔBstC*2(SEQ ID NO:27)、BstD(SEQ ID NO:3)、Δ20BstC(SEQ ID NO:18)、Δ20BstC*(SEQ ID NO:15)、BstE(SEQ ID NO:4)、BstE*(SEQ ID NO:16)、BstH(SEQ ID NO:5)、BstI(SEQ ID NO:6)、BstJ(SEQ ID NO:7)、またはBstM(SEQ ID NO:9)のアミノ酸配列と100%未満同一である、請求項1記載の方法。
【請求項4】
前記酵素が、BstN(SEQ ID NO:10)、BstC(SEQ ID NO:2)、ΔBstC*2(SEQ ID NO:27)、BstD(SEQ ID NO:3)、Δ20BstC(SEQ ID NO:18)、Δ20BstC*(SEQ ID NO:15)、BstE(SEQ ID NO:4)、BstE*(SEQ ID NO:16)、BstH(SEQ ID NO:5)、BstI(SEQ ID NO:6)、BstJ(SEQ ID NO:7)、またはBstM(SEQ ID NO:9)と比較して欠失または挿入を含まない、請求項1記載の方法。
【請求項5】
前記酵素のアミノ酸配列とBstN(SEQ ID NO:10)、BstC(SEQ ID NO:2)、Δ20BstC*2(SEQ ID NO:27)、BstD(SEQ ID NO:3)、Δ20BstC(SEQ ID NO:18)、Δ20BstC*(SEQ ID NO:15)、BstE(SEQ ID NO:4)、BstE*(SEQ ID NO:16)、BstH(SEQ ID NO:5)、BstI(SEQ ID NO:6)、BstJ(SEQ ID NO:7)、またはBstM(SEQ ID NO:9)のアミノ酸配列との間の相違が、1つまたは複数の保存的アミノ酸置換からなる、請求項4記載の方法。
【請求項6】
前記酵素が、天然に存在する酵素と5%~100%同一であるアミノ酸配列を含む、請求項1記載の方法。
【請求項7】
天然に存在する酵素が、細菌GT80ファミリーのシアリルトランスフェラーゼである、請求項6記載の方法。
【請求項8】
細菌GT80ファミリーのシアリルトランスフェラーゼが、GT-B構造的フォールドを含む、請求項7記載の方法。
【請求項9】
天然に存在する酵素が、微生物によって生産される、請求項6記載の方法。
【請求項10】
微生物が、哺乳類の胃腸管に天然に存在している細菌である、請求項9記載の方法。
【請求項11】
微生物が、フォトバクテリウム(Photobacterium)属、アビバクテリウム(Avibacterium)属、シュワネラ(Shewanella)属、ビベルシュタイニア(Bibersteinia)属、ヘモフィルス(Haemophilus)属、アリステペス(Alistepes)属、アクチノバチルス(Actinobacillus)属またはヘリコバクター(Helicobacter)属の細菌である、請求項10記載の方法。
【請求項12】
シアリルトランスフェラーゼが、α(2,3)シアリルトランスフェラーゼまたはα(2,6)シアリルトランスフェラーゼを含む、請求項1記載の方法。
【請求項13】
前記酵素が、天然に存在するα(2,3)シアリルトランスフェラーゼと比較して変異を含む、請求項1記載の方法。
【請求項14】
前記酵素のアミノ酸配列とBstE*のアミノ酸配列を整列させたとき、該酵素が、BstE*のアミノ酸配列(SEQ ID NO:16)の13位と整列する位置に変異を含んでいる、請求項13記載の方法。
【請求項15】
前記酵素が、BstE*のアミノ酸配列(SEQ ID NO:16)の13位と整列する位置に非保存的変異を含んでいる、請求項14記載の方法。
【請求項16】
前記酵素が、BstE*のアミノ酸配列(SEQ ID NO:16)の13位と整列する位置にヒスチジンまたはアラニンを含んでいる、請求項15記載の方法。
【請求項17】
前記酵素のアミノ酸配列とBstE*のアミノ酸配列を整列させたとき、該酵素が、BstE*のアミノ酸配列(SEQ ID NO:16)の130位と整列する位置に変異を含んでいる、請求項13記載の方法。
【請求項18】
前記酵素が、BstE*のアミノ酸配列(SEQ ID NO:16)の130位と整列する位置に非保存的変異を含んでいる、請求項17記載の方法。
【請求項19】
前記酵素が、BstE*のアミノ酸配列(SEQ ID NO:16)の130位と整列する位置にヒスチジンまたはアラニンを含んでいる、請求項18記載の方法。
【請求項20】
前記変異が、天然に存在するα(2,3)シアリルトランスフェラーゼよりも高いα(2,6)選択性を前記酵素に与える、請求項1記載の方法。
【請求項21】
前記酵素が、α(2,6)シアリルトランスフェラーゼを含む、請求項1記載の方法。
【請求項22】
前記酵素の骨格と天然に存在するシアリルトランスフェラーゼの骨格との間のCα平均二乗偏差(RMSD)が3Å未満である、請求項1記載の方法。
【請求項23】
天然に存在するシアリルトランスフェラーゼが、Pst6-224、BstC、BstD、BstE、BstH、BstI、BstJ、HAC1268、BstMまたはBstNである、請求項1記載の方法。
【請求項24】
前記細菌が、培養培地中に存在する、請求項1記載の方法。
【請求項25】
前記細菌が、バイオ発酵装置中で培養される、請求項1記載の方法。
【請求項26】
前記細菌からまたは該細菌の培養上清からシアル化オリゴ糖を回収する工程をさらに含む、請求項1記載の方法。
【請求項27】
シアル化オリゴ糖がシアリルラクトースを含む、請求項1記載の方法。
【請求項28】
シアル化オリゴ糖が、3'-シアリルラクトース(3'-SL)、6'-シアリルラクトース(6'-SL)、3'-シアリル-3-フコシルラクトース(3'-S3FL)、シアリルラクト-N-テトラオースa(SLNT a)、シアリルラクト-N-テトラオースb(SLNT b)、ジシアリルラクト-N-テトラオース(DSLNT)、シアリルラクト-N-フコペンタオースII(SLNFP II)またはシアリルラクト-N-テトラオースc(SLNT c)を含む、請求項1記載の方法。
【請求項29】
前記細菌が、外因性もしくは内因性ラクトース利用性α(1,3)フコシルトランスフェラーゼ酵素、外因性もしくは内因性ラクトース利用性α(1,4)フコシルトランスフェラーゼ酵素、外因性もしくは内因性β(1,3)ガラクトシルトランスフェラーゼ酵素、外因性もしくは内因性β(1,4)ガラクトシルトランスフェラーゼ酵素、外因性もしくは内因性β-1,3-N-アセチルグルコサミニルトランスフェラーゼ、またはそれらの任意の組み合わせをさらに含む、請求項1記載の方法。
【請求項30】
前記細菌が、外因性もしくは内因性N-アセチルノイラミン酸シンターゼ、外因性もしくは内因性UDP-N-アセチルグルコサミン2-エピメラーゼ、外因性もしくは内因性N-アセチルノイラミン酸シチジリルトランスフェラーゼ、またはそれらの任意の組み合わせをさらに含む、請求項1記載の方法。
【請求項31】
前記細菌が、カンピロバクター・ジェジュニ(Campylobacter jejuni)由来の外因性N-アセチルノイラミン酸シンターゼ、UDP-N-アセチルグルコサミン2-エピメラーゼおよびN-アセチルノイラミン酸シチジリルトランスフェラーゼを含む、請求項30記載の方法。
【請求項32】
前記細菌が、対応する野生型細菌と比較して低下したレベルのβ-ガラクトシダーゼ活性を含む、請求項1記載の方法。
【請求項33】
低下したレベルのβ-ガラクトシダーゼ活性が、β-ガラクトシダーゼ遺伝子の低下した発現または低下したβ-ガラクトシダーゼ酵素活性を含む、請求項32記載の方法。
【請求項34】
低下したレベルが、ラクトースの存在下での対応する野生型細菌のレベルの10%未満である、請求項32記載の方法。
【請求項35】
前記細菌が、欠失したまたは不活性化された内因性β-ガラクトシダーゼ遺伝子を含む、請求項32記載の方法。
【請求項36】
前記細菌が、欠失したもしくは不活性化された内因性lacZ遺伝子および/または欠失したもしくは不活性化された内因性lacI遺伝子を含む、請求項32記載の方法。
【請求項37】
前記細菌が内因性β-ガラクトシダーゼ遺伝子を含み、該内因性β-ガラクトシダーゼ遺伝子のプロモーターの少なくとも一部が欠失している、請求項32記載の方法。
【請求項38】
前記細菌が、対応する野生型細菌の内因性β-ガラクトシダーゼ酵素と比較して低下した酵素活性を有する外因性β-ガラクトシダーゼ酵素を含む、請求項32記載の方法。
【請求項39】
前記細菌が、対応する野生型細菌内の内因性β-ガラクトシダーゼ遺伝子よりも低いレベルで発現される外因性β-ガラクトシダーゼ遺伝子を含む、請求項32記載の方法。
【請求項40】
前記細菌が、ラクトースの存在下で培養されたときに、50単位未満のβ-ガラクトシダーゼ活性を含む、請求項39記載の方法。
【請求項41】
前記細菌が、ラクトースパーミアーゼ遺伝子を含む、請求項1記載の方法。
【請求項42】
前記細菌が、thyA遺伝子内に変異をさらに含む、請求項1記載の方法。
【請求項43】
前記細菌が、β-ガラクトシドトランスアセチラーゼを発現しない、請求項1記載の方法。
【請求項44】
前記細菌がlacA変異を含む、請求項43記載の方法。
【請求項45】
前記細菌が、外因性ラクトースの存在下で細胞内ラクトースを蓄積する、請求項1記載の方法。
【請求項46】
前記細菌が大腸菌(Escherichia coli;E. coli)である、請求項1記載の方法。
【請求項47】
前記細菌が、バチルス(Bacillus)属、パントエア(Pantoea)属、ラクトバチルス(Lactobacillus)属、ラクトコッカス(Lactococcus)属、ストレプトコッカス(Streptococcus)属、プロピオニバクテリウム(Proprionibacterium)属、エンテロコッカス(Enterococcus)属、ビフィドバクテリウム(Bifidobacterium)属、スポロラクトバチルス(Sporolactobacillus)属、ミクロモノスポラ(Micromomospora)属、ミクロコッカス(Micrococcus)属、ロドコッカス(Rhodococcus)属またはシュードモナス(Pseudomonas)属のメンバーである、請求項1記載の方法。
【請求項48】
前記細菌が、バチルス・リケニフォルミス(Bacillus licheniformis)、バチルス・サブティリス(Bacillus subtilis)、バチルス・コアグランス(Bacillus coagulans)、バチルス・サーモフィルス(Bacillus thermophilus)、バチルス・ラテロスポルス(Bacillus laterosporus)、バチルス・メガテリウム(Bacillus megaterium)、バチルス・ミコイデス(Bacillus mycoides)、バチルス・プミルス(Bacillus pumilus)、バチルス・レンタス(Bacillus lentus)、バチルス・セレウス(Bacillus cereus)およびバチルス・サーキュランス(Bacillus circulans)、エルビニア・ヘルビコーラ(Erwinia herbicola)(パントエア・アグロメランス(Pantoea agglomerans))、シトロバクター・フロインディー(Citrobacter freundii)、パントエア・シトレア(Pantoea citrea)、ペクトバクテリウム・カロトボラム(Pectobacterium carotovorum)、キサントモナス・カンペストリス(Xanthomonas campestris)、ラクトバチルス・アシドフィルス(Lactobacillus acidophilus)、ラクトバチルス・サリバリウス(Lactobacillus salivarius)、ラクトバチルス・プランタルム(Lactobacillus plantarum)、ラクトバチルス・ヘルベティカス(Lactobacillus helveticus)、ラクトバチルス・デルブルエッキイー(Lactobacillus delbrueckii)、ラクトバチルス・ラムノサス(Lactobacillus rhamnosus)、ラクトバチルス・ブルガリカス(Lactobacillus bulgaricus)、ラクトバチルス・クリスパタス(Lactobacillus crispatus)、ラクトバチルス・ガセリ(Lactobacillus gasseri)、ラクトバチルス・カゼイ(Lactobacillus casei)、ラクトバチルス・ロイテリ(Lactobacillus reuteri)、ラクトバチルス・ジェンセニイ(Lactobacillus jensenii)、ラクトコッカス・ラクティス(Lactococcus lactis)、ストレプトコッカス・サーモフィラス(Streptococcus thermophiles)、プロピオニバクテリウム・フロイデンライシー(Proprionibacterium freudenreichii)、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロコッカス・サーモフィラス(Enterococcus thermophiles)、ビフィドバクテリウム・ロングム(Bifidobacterium longum)、ビフィドバクテリウム・インファンティス(Bifidobacterium infantis)、ビフィドバクテリウム・ビフィダム(Bifidobacterium bifidum)、シュードモナス・フルオレッセンス(Pseudomonas fluorescens)またはシュードモナス・エルギノーサ(Pseudomonas aeruginosa)細菌である、請求項1記載の方法。
【請求項49】
大腸菌が、GI724株細菌である、請求項46記載の方法。
【請求項50】
前記細菌が、lacIqまたはlacPL8プロモーター変異を含む、請求項49記載の方法。
【請求項51】
前記細菌が、ラクトース利用性シアリルトランスフェラーゼ酵素をコードする単離された核酸を含む核酸構築物を含む、請求項1記載の方法。
【請求項52】
前記細菌の染色体が、ラクトース利用性シアリルトランスフェラーゼ酵素をコードする単離された核酸を含む核酸構築物を含む、請求項1記載の方法。
【請求項53】
前記核酸が、前記細菌内で前記酵素の生産を指示する異種制御配列に機能的に連結されている、請求項51記載の方法。
【請求項54】
異種制御配列が、細菌プロモーター、細菌オペレーター、細菌リボソーム結合部位、細菌転写ターミネーターまたはプラスミド選択マーカーを含む、請求項53記載の方法。
【請求項55】
前記細菌が、以下の遺伝子型:
PlacIq-lacY, Δ(lacI-lacZ), ΔlacA, ΔthyA::(0.8RBS lacZ+), ampC::(Ptrp M13g8 RBS-λcI+, CAT), ΔnanATE::scar
を含む、請求項1記載の方法。
【請求項56】
前記酵素が、SEQ ID NO:15、16、20、21、22、23、24、25、26、27、28、29または30に示されるアミノ酸配列を含む、請求項2記載の方法。
【請求項57】
SEQ ID NO:15、16、20、21、22、23、24、25、26、27、28、29または30に示される配列内のアミノ酸を含む変異酵素をコードする、核酸。
【請求項58】
SEQ ID NO:15、16、20、21、22、23、24、25、26、27、28、29または30に示される配列内のアミノ酸を含む、ラクトース利用性シアリルトランスフェラーゼ酵素。
【請求項59】
外因性ラクトース利用性シアリルトランスフェラーゼ酵素を含む単離された細菌であって、該酵素が、
(i)少なくとも250アミノ酸のストレッチにわたってPst6-224のアミノ酸配列(SEQ ID NO:1)と5%~30%同一、または
(ii)少なくとも250アミノ酸のストレッチにわたってHAC1268のアミノ酸配列(SEQ ID NO:8)と45%~75%同一
であるアミノ酸配列を含む、細菌。
【請求項60】
実質的に純粋なシアリルラクトースおよび5%未満のKDO-ラクトースを含む、組成物。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本願は、2017年12月15日出願の米国仮出願番号62/599,481からの優先権を主張し、その全体をすべての目的のために本明細書に組み入れる。
【0002】
配列表の参照
2018年12月11日に作成された、124,706バイトのサイズの、「37847-522001WO_SequenceListing_ST25.txt」と名付けられたテキストファイルの内容は、その全体が参照により本明細書に組み入れられる。
【背景技術】
【0003】
発明の背景
ラクトースは、すべての哺乳類の母乳の主要な栄養性炭水化物であるが、ヒト母乳は、集合的にヒトミルクオリゴ糖(hMOS)として公知の、より複雑な中性および酸性糖の多様かつ豊富なセットを含む(Kunz, C., et al. (2000). Annu Rev Nutr 20, 699-722(非特許文献1); Bode, L., and Jantscher-Krenn, E. (2012). Adv Nutr 3, 383S-391S(非特許文献2))。数百の異なるhMOS種が同定されており、それらの豊かな構造的多様性および全体量は、ヒトに特有である。これらの分子は、ヒト腸によって十分に吸収されず、直接的な栄養分として幼児に利用されないが、それらは健康な腸ミクロビオームの構築、腸発生、疾患予防および免疫機能において重要な役割を果たしていることが示されている(Newburg, D.S., and Walker, W.A. (2007). Pediatr Res 61, 2-8(非特許文献3))。
【0004】
精製されたヒトミルクオリゴ糖を生産する新しい方法が必要とされている。
【先行技術文献】
【非特許文献】
【0005】
【非特許文献1】Kunz, C., et al. (2000). Annu Rev Nutr 20, 699-722
【非特許文献2】Bode, L., and Jantscher-Krenn, E. (2012). Adv Nutr 3, 383S-391S
【非特許文献3】Newburg, D.S., and Walker, W.A. (2007). Pediatr Res 61, 2-8
【発明の概要】
【0006】
発明の要旨
本明細書には、特に、シアル化オリゴ糖を生産するための方法、酵素、組成物および遺伝子操作された細菌が提供される。本明細書に提供される酵素は、ラクトースをシアル化し、ラクトースに対するα(2,3)グリコシド結合、α(2,6)結合またはα(2,3)およびα(2,6)結合の両方のいずれかを生成することができ、したがって、特に、ヒト母乳のラクトースベースの分子と同一のオリゴ糖分子を生産する上で有益である。1つの局面において、細菌においてシアル化オリゴ糖を生産するための方法が提供される。いくつかの態様において、細菌は、外因性ラクトース利用性シアリルトランスフェラーゼ酵素、例えば、α(2,3)シアリルトランスフェラーゼまたはα(2,6)シアリルトランスフェラーゼを含む。様々な態様において、この酵素は、少なくとも250アミノ酸のストレッチにわたってPst6-224のアミノ酸配列(SEQ ID NO:1)と5%~30%同一のアミノ酸配列を有する。特定の態様において、この酵素は、少なくとも250アミノ酸のストレッチにわたってHAC1268のアミノ酸配列(SEQ ID NO:8)と45%~75%同一のアミノ酸配列を有する。
【0007】
1つの局面において、本明細書には、外因性ラクトース利用性シアリルトランスフェラーゼ酵素を含む単離された細菌が含まれる。いくつかの態様において、この酵素は、少なくとも250アミノ酸のストレッチにわたってPst6-224のアミノ酸配列(SEQ ID NO:1)と5%~30%同一のアミノ酸配列を有する。特定の態様において、この酵素は、少なくとも250アミノ酸のストレッチにわたってHAC1268のアミノ酸配列(SEQ ID NO:8)と45%~75%同一のアミノ酸配列を有する。
【0008】
様々な態様において、この酵素は、BstC(SEQ ID NO: 2)、BstD(SEQ ID NO: 3)、Δ20BstC*(SEQ ID NO: 15)、Δ20BstC(SEQ ID NO: 18)、BstE(SEQ ID NO: 4)、BstE*(SEQ ID NO: 16)、BstH(SEQ ID NO: 5)、BstI(SEQ ID NO: 6)、BstJ(SEQ ID NO: 7)、BstM(SEQ ID NO: 9)、またはBstN(SEQ ID NO: 10)のうちの1つまたは複数のアミノ酸配列と5%~100%同一であるアミノ酸配列を有する。
【0009】
いくつかの態様において、この酵素のアミノ酸配列は、BstC(SEQ ID NO: 2)、BstD(SEQ ID NO: 3)、Δ20BstC(SEQ ID NO: 18)、Δ20BstC*(SEQ ID NO: 15)、BstE(SEQ ID NO: 4)、BstE*(SEQ ID NO: 16)、BstH(SEQ ID NO: 5)、BstI(SEQ ID NO: 6)、BstJ(SEQ ID NO: 7)、BstM(SEQ ID NO: 9)、またはBstN(SEQ ID NO: 10)のアミノ酸配列と100%未満同一である。
【0010】
特定の態様において、この酵素は、BstC(SEQ ID NO: 2)、BstD(SEQ ID NO: 3)、Δ20BstC(SEQ ID NO: 18)、Δ20BstC*(SEQ ID NO: 15)、BstE(SEQ ID NO: 4)、BstE*(SEQ ID NO: 16)、BstH(SEQ ID NO: 5)、BstI(SEQ ID NO: 6)、BstJ(SEQ ID NO: 7)、BstM(SEQ ID NO: 9)、またはBstN(SEQ ID NO: 10)と比較して欠失または挿入を有さない。
【0011】
様々な態様において、この酵素のアミノ酸配列とBstC(SEQ ID NO: 2)、BstD(SEQ ID NO: 3)、Δ20BstC(SEQ ID NO: 18)、Δ20BstC*(SEQ ID NO: 15)、BstE(SEQ ID NO: 4)、BstE*(SEQ ID NO: 16)、BstH(SEQ ID NO: 5)、BstI(SEQ ID NO: 6)、BstJ(SEQ ID NO: 7)、BstM(SEQ ID NO: 9)、またはBstN(SEQ ID NO: 10)のアミノ酸配列との間の相違は、1つまたは複数の保存的アミノ酸置換からなる。
【0012】
様々な態様において、この酵素のアミノ酸配列とBstC(SEQ ID NO: 2)、BstD(SEQ ID NO: 3)、Δ20BstC(SEQ ID NO: 18)、Δ20BstC*(SEQ ID NO: 15)、BstE(SEQ ID NO: 4)、BstE*(SEQ ID NO: 16)、BstH(SEQ ID NO: 5)、BstI(SEQ ID NO: 6)、BstJ(SEQ ID NO: 7)、BstM(SEQ ID NO: 9)、またはBstN(SEQ ID NO: 10)のアミノ酸配列との間の相違は、1つまたは複数の保存的アミノ酸置換からなる。
【0013】
いくつかの態様において、この酵素は、天然に存在する酵素と5%~100%、10%~90%、20%~80%、30%~70%、40%~60%、5%~75%、5%~50%、5%~25%、10%~75%、10%~50%、15%~25%、15%~75%、15%~50%、15%~25%、25%~50%、50%~75%、または75%~100%同一であるアミノ酸配列を有する。特定の態様において、この酵素は、天然に存在する酵素と少なくとも約5%、10%、15%または20%であるが、約30%、35%、40%または45%未満同一であるアミノ酸配列を有する。様々な態様において、この酵素は、天然に存在する酵素と少なくとも約45%、50%または55%であるが約65%、70%または75%未満同一であるアミノ酸配列を有する。
【0014】
いくつかの態様において、天然に存在する酵素は、細菌GT80ファミリーのシアリルトランスフェラーゼである。GT80ファミリーは、Audry, M., et al. (2011). Glycobiology 21, 716-726に記載されており、その全内容が参照により本明細書に組み入れられる。
【0015】
特定の態様において、細菌GT80ファミリーのシアリルトランスフェラーゼは、GT-B構造的フォールド(structural fold)を有する。GT-B構造的フォールドは、Audry, M., et al. (2011). Glycobiology 21, 716-726に記載されており、その全内容が参照により本明細書に組み入れられる。
【0016】
様々な態様において、天然に存在する酵素は、例えば自然界で、微生物によって生産される。いくつかの態様において、微生物は、哺乳類の胃腸管に天然に存在している細菌である。特定の態様において、微生物は、フォトバクテリウム(Photobacterium)属、アビバクテリウム(Avibacterium)属、シュワネラ(Shewanella)属、ビベルシュタイニア(Bibersteinia)属、ヘモフィルス(Haemophilus)属、アリステペス(Alistepes)属、アクチノバチルス(Actinobacillus)属またはヘリコバクター(Helicobacter)属の細菌である。
【0017】
様々な態様において、酵素は、天然に存在するα(2,3)シアリルトランスフェラーゼと比較して変異(1、2、3、4、5またはそれ以上の変異、例えば置換変異)を有する。
【0018】
いくつかの態様において、この酵素のアミノ酸配列とBstE*のアミノ酸配列を整列させたとき、この酵素は、BstE*のアミノ酸配列(SEQ ID NO:16)の13位と整列する位置に変異を有している。配列の整列は、CLC Main Workbench、バージョン8.0を含むがこれらに限定されない様々な公衆利用可能なソフトウェアプログラムを用いて実行される。
【0019】
特定の態様において、この酵素は、BstE*のアミノ酸配列(SEQ ID NO:16)の13位と整列する位置に非保存的変異を有している。様々な態様において、この酵素は、BstE*のアミノ酸配列(SEQ ID NO:16)の13位と整列する位置にヒスチジンまたはアラニンを有している。
【0020】
様々な態様において、この酵素のアミノ酸配列とBstE*のアミノ酸配列を整列させたとき、この酵素は、BstE*のアミノ酸配列(SEQ ID NO:16)の130位と整列する位置に変異を有している。
【0021】
いくつかの態様において、この酵素は、BstE*のアミノ酸配列(SEQ ID NO:16)の130位と整列する位置に非保存的変異を有している。特定の態様において、この酵素は、BstE*のアミノ酸配列(SEQ ID NO:16)の130位と整列する位置にヒスチジンまたはアラニンを有している。
【0022】
いくつかの態様において、この酵素は、Δ20BstC(SEQ ID NO:18)のアミノ酸配列の122位と整列する位置に非保存的変異を有している。特定の態様において、この酵素は、Δ20BstC(SEQ ID NO:18)のアミノ酸配列の122位と整列する位置にアラニン、バリン、ロイシン、メチオニンまたはフェニルアラニンを有している。
【0023】
様々な態様において、変異は、天然に存在するα(2,3)シアリルトランスフェラーゼよりも高いα(2,6)選択性を前記酵素に与える。
【0024】
いくつかの態様において、この酵素は、α(2,6)シアリルトランスフェラーゼである。
【0025】
いくつかの態様において、この酵素は、Δ20BstC*(SEQ ID NO: 15)、Δ20BstC*2(SEQ ID NO: 27)、Δ20BstC*3(SEQ ID NO: 28)、Δ20BstC*4(SEQ ID NO: 29)、またはΔ20BstC*2(SEQ ID NO: 30)のアミノ酸配列を含む。
【0026】
特定の態様において、この酵素の骨格と天然に存在するシアリルトランスフェラーゼの骨格との間のCα平均二乗偏差(RMSD)は3Å未満である。いくつかの態様において、天然に存在するシアリルトランスフェラーゼは、Pst6-224(SEQ ID NO:1)である。Pst6-224(SEQ ID NO:1)の構造は解明されている、例えば、その全内容が参照により本明細書に組み入れられるCrystal Structure of Vibrionaceae Photobacterium sp. JT-ISH-224 2,6-sialyltransferase in a Ternary Complex with Donor Product CMP and Accepter Substrate Lactose, Kakuta et al. (2008) Glycobiology 18 66-73を参照のこと。
【0027】
様々な態様において、天然に存在するシアリルトランスフェラーゼは、BstC、BstD、BstE、BstH、BstI、BstJ、BstMもしくはBstN、またはそれらのホモログである
【0028】
いくつかの態様において、細菌は、培養培地中に存在する。特定の態様において、細菌は、培養プレート上またはフラスコ中に存在する。細菌は、バイオ発酵装置中で培養される。
【0029】
本明細書に開示されるシアル化オリゴ糖を生産する方法は、細菌から(例えば、細菌を溶解させることにより細菌の細胞質から)または細菌の培養上清からシアル化オリゴ糖(例えば、シアリルラクトース)を回収する工程をさらに含み得る。
【0030】
特定の態様において、シアル化オリゴ糖は、3'-シアリルラクトース(3'-SL)、6'-シアリルラクトース(6'-SL)、3'-シアリル-3-フコシルラクトース(3'-S3FL)、シアリルラクト-N-テトラオースa(SLNT a)、シアリルラクト-N-テトラオースb(SLNT b)、ジシアリルラクト-N-テトラオース(DSLNT)、シアリルラクト-N-フコペンタオースII(SLNFP II)およびシアリルラクト-N-テトラオースc(SLNT c)のいずれか1つ、または2、3、4、5、6、7もしくは8つの任意の組み合わせを含む。
【0031】
様々な態様において、この細菌は、外因性もしくは内因性ラクトース利用性α(1,3)フコシルトランスフェラーゼ酵素、外因性もしくは内因性ラクトース利用性α(1,4)フコシルトランスフェラーゼ酵素、外因性もしくは内因性β(1,3)ガラクトシルトランスフェラーゼ酵素、外因性もしくは内因性β(1,4)ガラクトシルトランスフェラーゼ酵素、外因性もしくは内因性β-1,3-N-アセチルグルコサミニルトランスフェラーゼ、またはそれらの任意の組み合わせを含む。
【0032】
特定の態様において、この細菌は、対応する野生型細菌(例えば、その細菌がラクトースの存在下で培養されたとき)と比較して、上昇したレベルの細胞質ラクトース、ウリジン二リン酸-N-アセチルグルコサミン(UDP-GlcNAc)および/またはシチジン5'-一ホスホシアル酸(cytidine-5'-monophosphosialic acid, CMP-Neu5Ac)を含む。非限定的な例において、ラクトース、UDP-GlcNAcおよび/またはCMP-Neu5Acのレベルは、その細菌の細胞質において、対応する野生型細菌(例えば、その細菌がラクトースの存在下で培養されたとき)よりも少なくとも約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、75%、100%、200%、300%、400%または500%高い。
【0033】
様々な態様は、外因性ラクトース利用性シアリルトランスフェラーゼ遺伝子、欠陥的なシアル酸異化経路、シアル酸合成能および機能的ラクトースパーミアーゼ遺伝子を含む細菌を提供する工程;ならびに該細菌をラクトースの存在下で培養する工程を含む。シアル化オリゴ糖は、その後、細菌からまたは細菌の培養上清から回収される。詳細に、シアル酸合成能は、外因性CMP-Neu5Acシンセターゼ、外因性シアル酸シンターゼおよび外因性UDP-GlcNAc-2-エピメラーゼまたはそれらの機能的変種もしくはフラグメントの発現を含む。
【0034】
シアル化オリゴ糖を生産するための方法に関連するいくつかの態様において、細菌は、増加したUDP-GlcNAc生産能をさらに有し得る。「増加した生産能」は、宿主細菌が、ネイティブ、内因性の細菌よりも10%、20%、50%、100%、2倍、5倍、10倍超またはそれ以上の生成物を生産することを意味する。好ましくは、細菌は、UDP-GlcNAc合成の正の内因性調節因子を過剰発現する。いくつかの態様において、細菌は、大腸菌(E.coli)のnagC遺伝子を過剰発現する。特定の態様において、細菌は、大腸菌glmS(L-グルタミン:D-フルクトース-6-リン酸アミノトランスフェラーゼ)遺伝子またはそのグルコサミン-6-リン酸生産物によるフィードバック阻害に供されないGlmS酵素をもたらすglmS遺伝子の変異体を過剰発現する(例えば、その全内容が参照により本明細書に組み入れられる、Deng, M.D., Grund, A.D., Wassink, S.L., Peng, S.S., Nielsen, K.L., Huckins, B.D., and Burlingame, R.P. (2006). Directed evolution and characterization of Escherichia coli glucosamine synthase. Biochimie 88, 419-429を参照のこと)。様々な態様において、細菌は、大腸菌glmY遺伝子(glmSの正の翻訳調節因子)を過剰発現する。いくつかの態様において、細菌は、大腸菌glmZ遺伝子(glmSの別の正の翻訳調節因子:gmlYおよびglmZはReichenbach et al Nucleic Acids Res 36, 2570-80 (2008)に記載されている)を過剰発現する。特定の態様において、細菌は、これらの遺伝子の任意の組み合わせを過剰発現する。様々な態様において、細菌は、nagCおよびglmSを過剰発現する。いくつかの態様において、細菌は、nagCおよびglmYを過剰発現する。特定の態様において、細菌は、nagCおよびglmZを過剰発現する。いくつかの態様において、遺伝子転写物またはコードされる遺伝子産物は、対応するネイティブ、天然に存在するまたは内因性の遺伝子により発現または生産されるレベルよりも10%、20%、50%、2倍、5倍、10倍またはそれ以上多く発現または生産される。nagC、glmS、glmYまたはglmZの任意のホモログまたは機能的変種もしくはフラグメント(またはそれらの任意の組み合わせ)が過剰発現される対応する方法および細菌も、本明細書に提供される。様々な態様において、大腸菌nagC、glmS、glmYまたはglmZ(またはそれらの任意の組み合わせ)は、大腸菌以外の細菌において外因的に発現される。
【0035】
UDP-GlcNAc代謝の他の要素は、(GlcNAc-1-P) N-アセチルグルコサミン-1-リン酸;(GlcN-1-P)グルコサミン-1-リン酸;(GlcN-6-P)グルコサミン-6-リン酸;(GlcNAc-6-P)N-アセチルグルコサミン-6-リン酸;および(Fruc-6-P)フルクトース-6-リン酸を含む。特定の態様において、本明細書に記載される特徴を有する細菌は、ラクトースの存在下で培養され、そして細菌自体から(すなわち、溶解により)または細菌の培養上清からのいずれからラクト-N-ネオテトラオースが回収される。
【0036】
様々な態様において、細菌は、欠陥的なシアル酸異化経路を含む。「シアル酸異化経路」は、シアル酸を分解する、通常酵素により制御および触媒される、一連の反応を意味する。大腸菌における例示的なシアル酸異化経路は、本明細書に記載されている。本明細書に記載されるシアル酸異化経路において、シアル酸(Neu5Ac;N-アセチルノイラミン酸)は、酵素NanA(N-アセチルノイラミン酸リアーゼ)ならびにNanK(N-アセチルマンノサミンキナーゼ)およびNanE(N-アセチルマンノサミン-6-リン酸エピメラーゼ)によって分解され、これらはすべてnanATEK-yhcHオペロンにおいてコードされ、NanRによって抑制される(ecocyc.org/ECOLI)。いくつかの態様において、欠陥的なシアル酸異化経路は、大腸菌において、内因性nanA(N-アセチルノイラミン酸リアーゼ)(例えば、参照により本明細書に組み入れられるGenBankアクセッション番号D00067.1(GI:216588))ならびに/またはnanK(N-アセチルマンノサミンキナーゼ)遺伝子(例えば、参照により本明細書に組み入れられるGenBankアクセッション番号(アミノ酸)BAE77265.1(GI:85676015))、および/もしくはnanE(N-アセチルマンノサミン-6-リン酸エピメラーゼ、参照により本明細書に組み入れられるGI: 947745)における変異により操作される。特定の態様において、nanT(N-アセチルノイラミン酸トランスポーター)遺伝子もまた、不活性化または変異される。シアル酸代謝の他の中間体は、(ManNAc-6-P)N-アセチルマンノサミン-6-リン酸;(GlcNAc-6-P)N-アセチルグルコサミン-6-リン酸;(GlcN-6-P)グルコサミン-6-リン酸;および(Fruc-6-P)フルクトース-6-リン酸を含む。いくつかの態様において、nanAが変異される。様々な態様において、nanAおよびnanKが変異され、nanEが機能的に維持される。いくつかの態様において、nanAおよびnanEが変異され、nanKが変異、不活性化または欠失されない。様々な態様において、変異は、nanA、nanK、nanEおよび/またはnanTの遺伝子産物をコードする核酸配列における1つまたは複数の変化である。例えば、変異は、この核酸配列における1、2、5、10、25、50または100個の変化であり得る。例えば、nanA、nanK、nanEおよび/またはnanTは、ヌル変異により変異される。
【0037】
本明細書に記載されるヌル変異は、酵素の機能消失(すなわち、活性の低下もしくは活性なし)または酵素の消失(すなわち、遺伝子産物なし)のいずれかをもたらすアミノ酸置換、付加、欠失または挿入を包含する。欠失は、遺伝子産物が生産されないようそのコード領域が全体的にまたは部分的に除去されることを意味する。様々な態様において、遺伝子は、そのコード配列が、生じる遺伝子産物が機能的に不活性となるよう変更されるまたはネイティブの天然に存在する内因性遺伝子産物の活性の100%、80%、50%もしくは20%未満を有する遺伝子産物をコードするよう、不活性化される。
【0038】
様々な態様において、細菌はまた、シアル酸合成能を有する。いくつかの態様において、細菌は、大腸菌である。例えば、細菌は、外因性UDP-GlcNAc 2-エピメラーゼ(例えば、カンピロバクター・ジェジュニ(Campylobacter jejuni)のneuC、GenBank AAK91727.1;GI15193223、参照により本明細書に組み入れられる)もしくは等価物(例えば、大腸菌S88 neuC GenBank YP_002392936.1;GI: 218560023)、Neu5Acシンターゼ(例えば、C.ジェジュニAAK91726.1のneuB、GenBank GI:15193222、参照により本明細書に組み入れられる)もしくは等価物(例えば、フラボバクテリウム・リムノセディミニス(Flavobacterium limnosediminis)シアル酸シンターゼ、GenBank GI:559220424)および/またはCMP-Neu5Acシンターゼ(例えば、C.ジェジュニのneuA(GenBank AAK91728.1; GI:15193224、参照により本明細書に組み入れられる)もしくは等価物(例えば、ビブリオ・ブラジリエンシス(Vibrio brasiliensis)CMP-シアル酸シンターゼ、GenBank GI: 493937153)の提供を通じてシアル酸合成能を有する。機能的変種およびフラグメントも、本明細書に開示される。
【0039】
いくつかの態様において、細菌は、外因性もしくは内因性N-アセチルノイラミン酸シンターゼ、外因性もしくは内因性UDP-N-アセチルグルコサミン 2-エピメラーゼ、外因性もしくは内因性N-アセチルノイラミン酸シチジリルトランスフェラーゼ、またはそれらの任意の組み合わせを含む。
【0040】
特定の態様において、細菌は、カンピロバクター・ジェジュニ由来の外因性N-アセチルノイラミン酸シンターゼ、UDP-N-アセチルグルコサミン 2-エピメラーゼ、およびN-アセチルノイラミン酸シチジリルトランスフェラーゼを含む。
【0041】
様々な態様において、細菌は、対応する野生型細菌(例えば、その細菌がラクトースの存在下で培養されたとき)と比較して低下したレベルのβ-ガラクトシダーゼ活性を有する。局面において、低下したレベルのβ-ガラクトシダーゼ活性は、低下したβ-ガラクトシダーゼ遺伝子の発現または低下したβ-ガラクトシダーゼ酵素活性を含む。局面において、低下したレベルは、ラクトースの存在下で培養されたときの対応する野生型細菌のレベルの10%未満である。
【0042】
いくつかの態様において、細菌は、欠失したまたは不活性化された内因性β-ガラクトシダーゼ遺伝子を含む。特定の態様において、細菌は、欠失したもしくは不活性化された内因性lacZ遺伝子および/または欠失したもしくは不活性化された内因性lacI遺伝子を含む。
【0043】
様々な態様において、細菌は、内因性β-ガラクトシダーゼ遺伝子を含み、該内因性β-ガラクトシダーゼ遺伝子のプロモーターの少なくとも一部が欠失される。
【0044】
いくつかの態様において、細菌は、対応する野生型細菌における内因性β-ガラクトシダーゼ酵素と比較して低下した酵素活性を有する外因性β-ガラクトシダーゼ酵素を含む。特定の態様において、外因性β-ガラクトシダーゼ遺伝子は、対応する野生型細菌における内因性β-ガラクトシダーゼ遺伝子よりも低いレベルで発現される。
【0045】
様々な態様において、細菌は、ラクトースの存在下で培養されたときに、1000、900、800、700、600、500、400、300、200、100、75、50、45、40、35、30、25、20、15、14、13、12、11、10、9、8、7、6、5、4、3、2または1単位未満のβ-ガラクトシダーゼ活性を有する。いくつかの態様において、細菌は、その細菌がラクトースの存在下で培養されたとき、少なくとも約0.5、0.75、1、1.25、1.5、1.75、2または2.5単位のβ-ガラクトシダーゼ活性であるが、約1000、900、800、700、600、500、400、300、200、100、75、50、45、40、35、30、25、20、15、14、13、12、11、10、9、8、7、6、5、4または3単位未満のβ-ガラクトシダーゼ活性を有する。
【0046】
いくつかの態様において、細菌は、ラクトースパーミアーゼ遺伝子を有する。特定の態様において、ラクトースパーミアーゼ遺伝子は、lacY遺伝子を含む。
【0047】
1つの局面において、細菌は、不活性化されたアデノシン-5'-三リン酸(ATP)依存性細胞内プロテアーゼを有する。局面において、不活性化されたATP依存性細胞内プロテアーゼは、ATP依存性細胞内プロテアーゼ遺伝子内にヌル変異を有する。局面において、ヌル変異は、内因性lon遺伝子の欠失である。
【0048】
局面において、細菌はさらに、外因性大腸菌rcsAまたは大腸菌rcsB遺伝子を含む。
【0049】
特定の態様において、細菌はさらに、thyA遺伝子内に変異を含む。
【0050】
様々な態様において、細菌は、β-ガラクトシドトランスアセチラーゼを発現しない。いくつかの態様において、細菌内でβ-ガラクトシドトランスアセチラーゼ遺伝子が不活性化(例えば、欠失)される。
【0051】
特定の態様において、細菌は、lacA変異を有する。
【0052】
様々な態様において、細菌は、外因性ラクトースの存在下で細胞内ラクトースを蓄積する。
【0053】
いくつかの態様において、細菌は、バチルス(Bacillus)属、パントエア(Pantoea)属、ラクトバチルス(Lactobacillus)属、ラクトコッカス(Lactococcus)属、ストレプトコッカス(Streptococcus)属、プロピオニバクテリウム(Proprionibacterium)属、エンテロコッカス(Enterococcus)属、ビフィドバクテリウム(Bifidobacterium)属、スポロラクトバチルス(Sporolactobacillus)属、ミクロモノスポラ(Micromomospora)属、ミクロコッカス(Micrococcus)属、ロドコッカス(Rhodococcus)属またはシュードモナス(Pseudomonas)属のメンバーである。
【0054】
特定の態様において、細菌は、バチルス・リケニフォルミス(Bacillus licheniformis)、バチルス・サブティリス(Bacillus subtilis)、バチルス・コアグランス(Bacillus coagulans)、バチルス・サーモフィルス(Bacillus thermophilus)、バチルス・ラテロスポルス(Bacillus laterosporus)、バチルス・メガテリウム(Bacillus megaterium)、バチルス・ミコイデス(Bacillus mycoides)、バチルス・プミルス(Bacillus pumilus)、バチルス・レンタス(Bacillus lentus)、バチルス・セレウス(Bacillus cereus)およびバチルス・サーキュランス(Bacillus circulans)、エルビニア・ヘルビコーラ(Erwinia herbicola)(パントエア・アグロメランス(Pantoea agglomerans))、シトロバクター・フロインディー(Citrobacter freundii)、パントエア・シトレア(Pantoea citrea)、ペクトバクテリウム・カロトボラム(Pectobacterium carotovorum)、キサントモナス・カンペストリス(Xanthomonas campestris)、ラクトバチルス・アシドフィルス(Lactobacillus acidophilus)、ラクトバチルス・サリバリウス(Lactobacillus salivarius)、ラクトバチルス・プランタルム(Lactobacillus plantarum)、ラクトバチルス・ヘルベティカス(Lactobacillus helveticus)、ラクトバチルス・デルブルエッキイー(Lactobacillus delbrueckii)、ラクトバチルス・ラムノサス(Lactobacillus rhamnosus)、ラクトバチルス・ブルガリカス(Lactobacillus bulgaricus)、ラクトバチルス・クリスパタス(Lactobacillus crispatus)、ラクトバチルス・ガセリ(Lactobacillus gasseri)、ラクトバチルス・カゼイ(Lactobacillus casei)、ラクトバチルス・ロイテリ(Lactobacillus reuteri)、ラクトバチルス・ジェンセニイ(Lactobacillus jensenii)、ラクトコッカス・ラクティス(Lactococcus lactis)、ストレプトコッカス・サーモフィラス(Streptococcus thermophiles)、プロピオニバクテリウム・フロイデンライシー(Proprionibacterium freudenreichii)、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロコッカス・サーモフィラス(Enterococcus thermophiles)、ビフィドバクテリウム・ロングム(Bifidobacterium longum)、ビフィドバクテリウム・インファンティス(Bifidobacterium infantis)、ビフィドバクテリウム・ビフィダム(Bifidobacterium bifidum)、シュードモナス・フルオレッセンス(Pseudomonas fluorescens)またはシュードモナス・エルギノーサ(Pseudomonas aeruginosa)細菌である。局面において、細菌は、大腸菌(Escherichia coli(E.coli))である。
【0055】
様々な態様において、大腸菌は、GI724株細菌である。
【0056】
いくつかの態様において、細菌は、lacIqプロモーター変異を有する。特定の態様において、細菌は、lacPL8プロモーター変異を有する。
【0057】
様々な態様において、細菌は、ラクトース利用性シアリルトランスフェラーゼ酵素をコードする単離された核酸を有する核酸構築物を有する。
【0058】
いくつかの態様において、細菌の染色体は、ラクトース利用性シアリルトランスフェラーゼ酵素をコードする単離された核酸を含む核酸構築物を有する。
【0059】
特定の態様において、核酸は、細菌内での酵素の生産を指示する異種制御配列に機能的に連結される。様々な態様において、異種制御配列は、細菌プロモーター、細菌オペレーター、細菌リボソーム結合部位、細菌転写ターミネーターまたはプラスミド選択マーカーを含む。
【0060】
様々な態様において、細菌は、遺伝子型:
PlacIq-lacY, Δ(lacI-lacZ), ΔlacA, ΔthyA::(0.8RBS lacZ+), ampC::(Ptrp M13g8 RBS-λcI+, CAT), ΔnanATE::scar
を有する。
【0061】
局面において、変異酵素をコードする核酸が、本明細書に提供される。いくつかの態様において、変異酵素は、SEQ ID NO:15、16、19、20、21、22、23、24、25、26、27、28、29または30に示される配列内のアミノ酸を有する。
【0062】
SEQ ID NO:15、16、19、20、21、22、23、24、25、26、27、28、29または30に示される配列内のアミノ酸を有するラクトース利用性シアリルトランスフェラーゼ酵素もまた、本明細書に提供される。
【0063】
本明細書に記載される特定のシアリルトランスフェラーゼは、このクラスの他の酵素よりも大きな利点を有する。好ましいシアリルトランスフェラーゼ、例えばBstMおよびBstNは、ラクトース利用性であり、細菌生産株、例えば改変された大腸菌においてより多量のシアリルラクトースを生産する。シアリルトランスフェラーゼクラスのすべての酵素がラクトースを利用するのではない。例えば、BstDおよびBstJは、ラクトースを利用しないことが見いだされた。したがって、ラクトース利用性シアリルトランスフェラーゼ酵素は、シアリルトランスフェラーゼクラスの酵素の中でも稀である。
【0064】
記載される好ましいシアリルトランスフェラーゼの別の利点は、それらが少ない副活性を有する、すなわち、少ない望ましくない副産物を生産することである。そのような望ましくない副産物の例は、KDO-ラクトース副産物である。KDOは大腸菌リポ多糖(LPS、内毒素)の成分であり、LPSは一部の哺乳類、特にヒトにおいて強くしばしば危険な免疫応答を誘発する分子である。KDOは、LPSのコア構造の一部である。KDO-ラクトースは、大腸菌のすべての株において生来的に見いだされるCMP-KDOヌクレオチド糖前駆体から生成される。KDOとシアル酸の類似性のため、いくつかのシアリルトランスフェラーゼ、例えばPst6-224は、基質としてCMP-KDOを利用し、望まれない副反応物として許容できないレベルのKDO-ラクトースを生産する。本発明の特定の酵素(例えば、BstM、BstN、Δ20BstC*)は、他、例えばPst6-224と比較してこの望まれない副産物を少ししか生産しない。したがって、これらの好ましい酵素を発現する(改変された大腸菌生産株内に)異種遺伝子を含む本明細書に記載される方法は、減少したまたは無視できる量のKDO-ラクトースをもたらす。そのような減少した量は、望ましい最終産物であるシアリルラクトースの精製を容易にし、ヒト利用におけるより良い安全プロフィールを有する。
【0065】
1つの局面において、シアル化オリゴ糖および5%未満、例えば、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%または0.1%未満のKDO-ラクトースを含む組成物が、本明細書に提供される。いくつかの態様において、組成物は実質的に純粋である。いくつかの態様において、組成物はシアリルラクトースを含む。
【0066】
Δ20BstC*により生産されるシアリルラクトースは、6'-SLおよび3'-SLから構成されることが見いだされた。1回のバイオ発酵の過程でのこれらのヒトミルクオリゴ糖の両方の生産は、2回の別個の発酵よりも、製造時間および費用の点で大きな利点となる。いくつかの状況、例えばヒト母乳をより模倣する幼児用配合物を開発する努力において、1回の製造発酵でヒトミルクオリゴ糖の混合物を生産することは、費用の観点で有益である。
【0067】
したがって、好ましい酵素を発現する構築物を用いる製造過程およびそのような過程から生産される最終精製生産物は、先行技術のアプローチと比較して高い安全性、高い純度(および精製の容易さ)ならびに安い費用により特徴づけられる。本明細書に記載される方法、構築物、生産株を用いて生産されるシアリルラクトースを含む組成物は、他の方法により生産される、例えばフォトバクテリウム種JT-ISH-224由来の遺伝子によりコードされるPst6-224またはa(2→6)-シアリルトランスフェラーゼをコードする構築物を用いて生産される組成物と比較して、少なくとも10%、25%、50%、2倍、5倍、10倍またはそれより少ないKDO-ラクトースを含む。本発明はまた、最小限または微量レベルのKDO-ラクトースしか存在しない実質的に純粋なシアリルラクトースを含む方法および組成物を包含する。例えば、組成物は、SLの総量の5%、4%、3%、2%、1%もしくは0.5%未満の(またはそれより少ない)KDO-ラクトースを含む。例えば、Bst遺伝子、例えばΔ20BstC*における変異、例えばΔ(欠失)変異は、KDO-ラクトースを減少させる。
【0068】
本発明の他の特徴および利点は、以下のその好ましい態様の記載から、および特許請求の範囲から明らかとなるであろう。それ以外の定義がなされていない限り、本明細書で使用されるすべての技術および科学用語は、本発明の属する技術の分野における通常の知識を有する者によって広く理解されているのと同じ意味を有する。本発明の実施または試験においては本明細書に記載されているのと同様または同等の方法および材料を使用することができるが、以下では適当な方法および材料を説明する。
【図面の簡単な説明】
【0069】
この特許または出願書類は、彩色された少なくとも1つの図面を含んでいる。カラー図面を含むこの特許または特許出願公報の複製物は、申請および必要な費用の支払いにより、該当官公庁により提供されるであろう。
【0070】
図1図1は、ヒト母乳の主要なシアル化オリゴ糖種の構造、それらがどの程度相互に関連しているか、およびラクトースからのそれらの酵素合成に必要な工程を概説する図である。
図2図2は、2つのα(2,6)シアリルラクトース(SL)プローブ配列と8つの同定されたST候補の間のペアワイズパーセントアミノ酸配列同一性比較を示す表である。
図3図3は、候補ST遺伝子の1つであるbstNを有する発現ベクターのマップである(プラスミドpG543、SEQ ID NO: 11)。
図4図4は、改変大腸菌におけるSL生合成のスキームを概説する図である。
図5図5は、薄層クロマトグラフィー結果の画像である。細胞内ラクトースプールに対応する濃いスポットが、対照株(bst+neuBCA発現プラスミドを含まないE1406)においておよびすべてのbst候補培養物においても見られる。
図6A】様々な熱抽出物(E1406対照、Δ16Pst60224、HAC1268、およびΔ20BstC)に対するHPLC実施からのUVトレースを示す画像である。
図6B】様々な熱抽出物(Δ20stC*、BstE、およびBstH)に対するHPLC実施からのUVトレースを示す画像である。
図6C】様々な熱抽出物(BstI、BstM、およびBstN)に対するHPLC実施からのUVトレースを示す画像である。
図7図7は、Dowex 1x4カラムからの画分の薄層クロマトグラフィーの画像である。典型的に、画分3が最も純粋な画分であり、脱塩後に、NMR分析に適するものであった。
図8図8は、3つのアノマーシグナル:どちらも還元末端Glcpに起因するδ5.22(A)、δ4.66(B)、およびβ-Galp残基に割り当てられたδ4.42(C)を示した、BstMにより生産されたSLサンプル(BstM-SL)の1D 1H NMRスペクトルである。
図9図9は、3つのアノマーシグナル:どちらも還元末端Glcpに起因するδ5.22(A)、δ4.66(B)、およびβ-Galp残基に割り当てられたδ4.42(C)を示した、BstNにより生産されたSLサンプル(BstN-SL)の1D-1H NMRスペクトルである。
図10図10は、野生型PdST、Δ20BstCおよびBstE α(2,3)シアリルトランスフェラーゼの配列アラインメントを示す画像である。
図11図11は、BstE*生産細胞により合成されたSLがシアリダーゼSおよびシアリダーゼCの両方によって効率的にラクトースに変換されたことを示す薄層クロマトグラフィーの画像である。この結果は、BstE*が依然としてもっぱらα(2,3)選択的な活性を有していること、および予想通り、導入された変異がこの酵素の位置選択性を変化させないことを示している。
図12図12は、Δ20BstC*によって生産されたSLの1D 1H NMRスペクトルである。このスペクトルの独特の特徴は、4つの別個のアノマーピークおよびシアル酸のアキシャルおよびエクアトリアルH-3の高磁場(up-field)シグナルであった。
図13図13は、ΔBstC*生産細胞により合成されたシアリルラクトースのHSQCおよびHMBC NMRスペクトルを重ね合わせた画像である。NMR分析は、大きい方のシグナルが6'-シアリルラクトースに属し、小さい方が混在する3'-シアリルラクトースの一部であることを示した。
図14図14は、BLOSUM62行列の画像である。
図15図15は、Δ20BstC*により合成されたシアリルラクトースの2つの主要な成分の化学シフトの割り当てを示す表である。オレンジ色の線は、ROESYおよびHMBCの両実験で見られた残基間相関を示し、青色の線は、HMBCのみで見られた残基間相関を示す。
図16図16は、様々な細胞抽出物(Δ20BstC*、Δ20BstC*2、Δ20BstC*3、Δ20BstC*4、Δ20BstC*5)に対するHPLC実施からのUVトレースを示す画像である。
【発明を実施するための形態】
【0071】
発明の詳細な説明
ヒト母乳の酸性オリゴ糖は、3'-シアリルラクトースおよび6'-シアリルラクトースを含む主要なシアリルラクトース(SL)画分を含む(Bode, L., and Jantscher-Krenn, E. (2012). Adv Nutr 3, 383S-391S)。構造的に、3'-シアリルラクトース(3'-SL)は、α(2,3)結合を通じてラクトースのガラクトース部分に連結されたN-アセチルノイラミン酸(Neu5Ac)部分からなり(α(2,3)Neu5Ac Gal(β1-4)Glc)、6'-シアリルラクトース(6'-SL)は、α(2,6)結合を通じてラクトースのガラクトース部分に連結されたNeu5Ac部分からなる(α(2,6)Neu5Ac Gal(β1-4)Glc)。3'-SLおよび6'-SLは、合わせて最大約0.5 g/Lの濃度で存在する、ヒト母乳中に存在する最も豊富なシアル化オリゴ糖の2つである(Bao, Y., Zhu, L., and Newburg, D.S. (2007). Anal Biochem 370, 206-214)。
【0072】
本発明は、シアル化オリゴ糖を生産するための効率的かつ経済的な方法、細胞、酵素および核酸を提供する。本明細書に開示される「ラクトース利用性シアリルトランスフェラーゼ酵素」は、ラクトース利用性シアリルトランスフェラーゼ酵素のアミノ酸配列ならびにシアリルトランスフェラーゼ活性を示すその変種およびフラグメントを含む。
【0073】
本明細書に記載される方法より以前、精製された酸性ヒトミルクオリゴ糖(hMOS)、例えば3'-SLおよび6'-SLを大規模で安価に生産する能力は問題があり非効率的であった。天然供給源、例えば哺乳類の母乳からのシアル化オリゴ糖の精製は、経済的に有効なアプローチではなく、化学合成を通じたhMOSの生産は、現時点で、立体特異性問題、前駆体の入手性、生産物の純度および高い総費用による制約を受けている。化学合成の代替法として、細菌が、hMOSを生産するよう代謝的に改変され得る。このアプローチは、例えばDumon, C., et al. (2004). Biotechnol Prog 20, 412-19; Ruffing, A., and Chen, R.R. (2006). Microb Cell Fact 5, 25; Mao, Z., et al. (2006). Biotechnol Prog 22, 369-374に記載されるように、異種グリコシルトランスフェラーゼ、細菌細胞質への糖前駆体の移入のための膜トランスポーターを過剰発現し、生合成前駆体として使用される再生ヌクレオチド糖の増強されたプールを有する微生物株の樹立を必要とする。
【0074】
このアプローチの鍵となる局面は、微生物宿主における過剰発現のために選択される異種グリコシルトランスフェラーゼの同定および使用である。グリコシルトランスフェラーゼの選択は、これらの酵素がそれらの反応速度、ドナーおよびアクセプター基質特異性、副反応産物ならびに酵素安定性および溶解性の点で大きく相違し得ることから、望まれる合成されるオリゴ糖の最終的収率に大きく影響し得る。異なる細菌種由来のいくつかのグリコシルトランスフェラーゼが同定され、大腸菌宿主株におけるhMOSの生合成を触媒するそれらの能力について特徴づけられている[(Dumon, C., et al. (2006). Chembiochem 7, 359-365; Dumon, C., et al. (2004). Biotechnol Prog 20, 412-19; Li, M., et al. (2008). Biochemistry 47, 378-387; Li, M., et al. (2008). Biochemistry 47, 11590-97)]。
【0075】
しかし、代謝的に改変された細菌宿主におけるhMOSの合成に有用であるさらなるグリコシルトランスフェラーゼを同定および特徴づける要望が高まっている。より速い反応速度、ヌクレオチド糖ドナーおよび/もしくはアクセプター構造に対するより高い親和性、または細菌宿主内でのより高い安定性を有するさらなるグリコシルトランスフェラーゼの同定は、治療的に有用なhMOSの収率を大いに改善する可能性がある。この目的で、より効率的な酵素をコードする新しいα(2,3)およびα(2,6)シアリルトランスフェラーゼ遺伝子を同定するための候補遺伝子スクリーニングアプローチを行った。
【0076】
ラクトース利用性シアリルトランスフェラーゼ酵素
いくつかの態様において、ラクトース利用性シアリルトランスフェラーゼ酵素は、天然に存在するタンパク質の活性(例えば、酵素活性)の少なくとも約10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%もしくは99.5%または約100%を維持しつつ、天然に存在するタンパク質と比較して1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、1~10、1~15、1~20、5~15、5~20、10~25、10~50、20~50、25~75、25~100またはそれ以上の変異を含む。
【0077】
変異は、置換(例えば、保存的および非保存的置換)、挿入および欠失を含むがこれらに限定されない。ラクトース利用性シアリルトランスフェラーゼ酵素の非限定的な例は、天然に存在するタンパク質の活性(例えば、酵素活性)の少なくとも約10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%もしくは99.5%または約100%を維持しつつ、天然に存在するタンパク質と比較して1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、1~10、1~15、1~20、5~15、5~20、10~25、10~50、20~50、25~75、25~100またはそれ以上の置換変異を有し得る。
【0078】
あるいは、ラクトース利用性シアリルトランスフェラーゼ酵素は、対応する野生型配列と比較して変異体(または変更された配列)でない。
【0079】
様々な態様において、ラクトース利用性シアリルトランスフェラーゼ酵素は、天然に存在するタンパク質のアミノ酸配列と少なくとも約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%または99.5%同一である配列内のアミノ酸配列のストレッチ(例えば、ラクトース利用性シアリルトランスフェラーゼ酵素の全長または少なくとも約50、100、200、250、300、350もしくは400アミノ酸を含む部分)を含み得る。
【0080】
いくつかの態様において、変異は保存的であり、本発明は、唯一の変異が置換変異である多数のラクトース利用性シアリルトランスフェラーゼ酵素を含む。非限定的な例において、ラクトース利用性シアリルトランスフェラーゼ酵素は、天然に存在するタンパク質(例えば、天然に存在する対応物)と比較して欠失または挿入を有さない。
【0081】
特定の態様において、ラクトース利用性シアリルトランスフェラーゼ酵素は、天然に存在するラクトース利用性シアリルトランスフェラーゼ酵素と比較して欠失または挿入を含まない。あるいは、ラクトース利用性シアリルトランスフェラーゼ酵素は、天然に存在するタンパク質と比較して(i)約5、4、3、2もしくは1未満の挿入されたアミノ酸および/または(ii)約5、4、3、2もしくは1未満の欠失されたアミノ酸を有し得る。
【0082】
様々な態様において、ラクトース利用性シアリルトランスフェラーゼ酵素の比較対象であるまたはラクトース利用性シアリルトランスフェラーゼ酵素を(例えば、変異、融合もしくは他の修飾により)得る元となった天然に存在するタンパク質は、微生物タンパク質、例えば原核生物ラクトース利用性シアリルトランスフェラーゼ酵素、例えば、細菌ラクトース利用性シアリルトランスフェラーゼ酵素である。例えば、原核生物ラクトース利用性シアリルトランスフェラーゼ酵素は、天然(例えば、野生型)細菌タンパク質の変異体または変種である。
【0083】
いくつかの態様において、微生物タンパク質は、グラム陽性細菌またはグラム陰性細菌により生産される。
【0084】
いくつかの態様において、ラクトース利用性シアリルトランスフェラーゼ酵素は、シグナルペプチドを含まない。例えば、(例えば、天然に存在する対応物に存在する)シグナルペプチドは、メチオニンで置換され得る。
【0085】
本明細書で使用される場合、「シグナルペプチド」という用語は、そのタンパク質の輸送を指揮するタンパク質のN末端のアミノ酸の短いストレッチ(例えば、5~20または10~50アミノ酸長)を表す。様々な態様において、シグナルペプチドは、細胞によるタンパク質の翻訳後修飾の間に切り落とされる。シグナルペプチドが本明細書で議論されるタンパク質に関して定義されていない例においては、シグナルペプチドは、任意で、(シグナルペプチドが除去されていないタンパク質との比較で、例えば天然に存在するタンパク質との比較で)翻訳されるタンパク質のN末端から最初の5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49または50アミノ酸であるとみなされ得る。
【0086】
定義されるポリペプチドに関して、本明細書に提供されるそれらよりも高いまたは低い%同一性値は、様々な態様を包含するであろう。したがって、適用可能な場合、最小%同一性値の観点で、ラクトース利用性シアリルトランスフェラーゼ酵素は、参照SEQ ID NOまたは参照SEQ ID NOの各々に対して少なくとも60%、65%、70%、75%、76%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%または99.9%同一であるアミノ酸配列を含み得る。態様において、ラクトース利用性シアリルトランスフェラーゼ酵素は、参照SEQ ID NOと100%同一であるアミノ酸配列を含む。適用可能な場合、参照配列に対する最大%同一性の観点で、ラクトース利用性シアリルトランスフェラーゼ酵素は、参照SEQ ID NO:または参照SEQ ID NOの各々に対して75%、70%、65%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%、50%、49%、48%、47%、46%、45%、44%、43%、42%、41%、40%、39%、38%、37%、36%、35%、34%、33%、32%、31%または30%未満同一であるアミノ酸配列を含み得る。特定の態様において、ポリペプチドは、参照SEQ ID NO:または参照SEQ ID NOの各々に対して、好ましくは少なくとも約5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%かつ約75%、70%、65%、60%、55%、50%、45%、44%、43%、42%、41%、40%、39%、38%、37%、36%、35%、34%、33%、32%、31%または30%未満同一である配列のアミノ酸を含む。特定の態様において、ポリペプチドは、参照SEQ ID NOまたは参照SEQ ID NOの各々に対して、約5%~約75%、約6%~約75%、約7%~約75%、約8%~約75%、約9%~約75%、約10%~約75%、11%~約75%、12%~約75%、13%~約75%、14%~約75%、15%~約75%、16%~約75%、17%~約75%、18%~約75%、19%~約75%、20%~約75%、21%~約75%、22%~約75%、23%~約75%、24%~約75%、25%~約75%、26%~約75%、27%~約75%、28%~約75%、29%~約75%、30%~約75%、約5%~約100%、約5%~約95%、約5%~約85%、約5%~約75%、約5%~約70%、約5%~約65%、60%、約5%~約55%、約5%~約50%、約5%~約45%、約5%~約44%、約5%~約43%、約5%~約42%、約5%~約41%、約5%~約40%、約5%~約39%、約5%~約38%、約5%~約37%、約5%~約36%、約5%~約35%、約5%~約34%、約5%~約33%、約5%~約32%、約5%~約31%または約5%~約30%同一である配列内のアミノ酸を含む。
【0087】
本明細書に開示される参照ラクトース利用性シアリルトランスフェラーゼ酵素およびアミノ酸配列の非限定的な例は、
(i)本明細書で「Pst6-224」として参照されるフォトバクテリウム種JT-ISH-224由来のラクトース利用性シアリルトランスフェラーゼ酵素(GenBankアクセッション番号BAF92026.1;SEQ ID NO:1);
(ii)本明細書で「BstC」として参照されるアビバクテリウム・パラガリナルム(Avibacterium paragallinarum)由来のラクトース利用性シアリルトランスフェラーゼ酵素[National Center for Biotechnology Information(NCBI)参照配列:WP_021724759.1;SEQ ID NO:2];
(iii)本明細書で「BstD」として参照されるアクチノバチルス・ウレアエ(Actinobacillus ureae)由来のラクトース利用性シアリルトランスフェラーゼ酵素(NCBI参照配列:WP_005625206.1;SEQ ID NO: 3);
を含む。
(iv)本明細書で「BstE」として参照されるヘモフィルス・デュクレイ(Haemophilus_ducreyi)由来のラクトース利用性シアリルトランスフェラーゼ酵素(GenBankアクセッション番号AAP95068.1;SEQ ID NO: 4);
(v)本明細書で「BstH」として参照されるアリスティペス(Alistipes)(複数種)由来のラクトース利用性シアリルトランスフェラーゼ酵素(NCBI参照配列:WP_018695526.1;SEQ ID NO: 5);
(vi)本明細書で「BstI」として参照されるビベルシュタイニア・トレアロシ(Bibersteinia trealosi)由来のラクトース利用性シアリルトランスフェラーゼ酵素(GenBankアクセッション番号AGH37861.1;SEQ ID NO: 6);
(vii)本明細書で「BstJ」として参照されるシュワネラ・ピエゾトレランス(Shewanella piezotolerans)由来のラクトース利用性シアリルトランスフェラーゼ酵素(NCBI参照配列番号YP_002314261.1およびWP_020915003.1;SEQ ID NO: 7);
(viii)本明細書で「HAC1268」として参照されるヘリコバクター・アシノニキス(Helicobacter acinonychis)由来のラクトース利用性シアリルトランスフェラーゼ酵素(GenBankアクセッション番号CAK00018.1;SEQ ID NO: 8);
(ix)本明細書で「BstM」として参照されるヘリコバクター・ピロリ(Helicobacter pylori)由来のラクトース利用性シアリルトランスフェラーゼ酵素(NCBI参照配列:WP_000743106.1;SEQ ID NO: 9);および
(x)本明細書で「BstN」として参照されるヘリコバクター・セトラム(Helicobacter cetorum)由来のラクトース利用性シアリルトランスフェラーゼ酵素(NCBI参照配列WP_014661583.1;SEQ ID NO: 10)
を含む。
【0088】
いくつかの態様において、ラクトース利用性シアリルトランスフェラーゼ酵素は、本明細書に開示される1、2、3、4、5、6、7、8、9、10またはそれ以上のラクトース利用性シアリルトランスフェラーゼ酵素に対して少なくとも15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90または100%の同一性を有するアミノ酸配列を含む。
【0089】
態様において、タンパク質のアミノ酸配列は、その天然に存在する対応物と比較して1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45または50個以下の変異を含む。いくつかの態様において、50、45、40、35、30、25、20、15、10、9、8、7、6、5、4、3または2個未満の変異は、1、2、3、4もしくは5個または1、2、3、4もしくは5個以下のアミノ酸の欠失または挿入である。いくつかの態様において、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50個またはそれ以上の変異は、置換変異である。特定の態様において、その天然に存在する対応物と比較してのタンパク質に対するあらゆる変異は、置換変異である。様々な態様において、その天然に存在する対応物と比較してのタンパク質に対する1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50個もしくはそれ以上またはすべての変異が、保存的置換変異である。
【0090】
様々な態様において、ポリペプチドは、(任意の)シグナルペプチドの除去および/またはそのN末端またはC末端での化合物、例えば別のポリペプチドの融合を除き、その天然対応物と比較していかなる挿入または欠失も有さない。
【0091】
様々な態様において、ラクトース利用性シアリルトランスフェラーゼ酵素の骨格とPst6-224(SEQ ID NO:1)、BstC(SEQ ID NO:2)、BstD(SEQ ID NO:3)、Δ20BstC(SEQ ID NO:1)、Δ20BstC*(SEQ ID NO:15)、BstE(SEQ ID NO: 4)、BstE*(SEQ ID NO:16)、BstH(SEQ ID NO:5)、BstI(SEQ ID NO:6)、 BstJ(SEQ ID NO:7)、HAC1268(SEQ ID NO:8)、BstM(SEQ ID NO: 9)、BstN(SEQ ID NO:10)またはPdST(SEQ ID NO:13)の骨格との間のCα平均二乗偏差(RMSD)は、例えば、0~3Å、0~1Å、0~1.5Å、0~2Å、0.1~3Å、0.5~1Å、0.5~1.5Åもしくは0.5~2Å、または約0.1Å、0.2Å、0.3Å、0.4Å、0.5Å、0.6Å、0.7Å、0.8Å、0.9Å、1.0Å、1.5Å、1.6Å、1.7Å、1.8Å、1.9Å、2.0Å、2.5Åもしくは3Å未満である。相同なタンパク質間の配列および構造の差異に関する非限定的な検討については、Chothia and Lesk (1986) The EMBO Journal, 5(4):823-826に記載されており、その全内容が参照により本明細書に組み入れられる。
【0092】
本明細書に記載される遺伝子または遺伝子産物の機能的フラグメントも提供される。タンパク質のフラグメントは、そのタンパク質の全長成熟形態の長さより短い長さ(アミノ酸の数)によって特徴づけられる。これらの配列および本明細書に提供されるすべての他のものの例において、フラグメントは、全体よりも短い全体の一部分であり得る。さらに、フラグメントは、サイズが、ポリヌクレオチドまたはポリペプチド配列内の単一ヌクレオチドまたはアミノ酸から全ポリヌクレオチドまたはポリペプチド配列よりも少ないヌクレオチドまたはアミノ酸の範囲である。最後に、フラグメントは、上記の極端値の間の中間である完全なポリヌクレオチドまたはポリペプチド配列の任意の部分と定義される。
【0093】
例えば、本明細書に開示されるまたは本明細書に開示される任意の遺伝子によってコードされる任意のタンパク質または酵素のフラグメントは、10~20アミノ酸、10~30アミノ酸、10~40アミノ酸、10~50アミノ酸、10~60アミノ酸、10~70アミノ酸、10~80アミノ酸、10~90アミノ酸、10~100アミノ酸、50~100アミノ酸、75~125アミノ酸、100~150アミノ酸、150~200アミノ酸、200~250アミノ酸、250~300アミノ酸、300~350、350~400アミノ酸または400~425アミノ酸であり得る。本発明に包含されるフラグメントは、機能的フラグメントを維持しているフラグメントを含む。したがって、フラグメントは、好ましくは、シアリルトランスフェラーゼ活性に必要とされるまたは重要であるドメインを維持している。フラグメントは、当技術分野で公知の標準的方法を用いてシアリルトランスフェラーゼ活性について決定または生成および試験され得る。例えば、コードされるタンパク質は、当技術分野で公知の任意の組み換え技術によって発現され得、そのタンパク質のシアリルトランスフェラーゼ活性が決定され得る。
【0094】
本明細書で使用される場合、「生物学的に活性な」フラグメントは、全長参照ポリペプチドの1つまたは複数の活性を維持しているポリペプチドの一部分である。本明細書で使用される場合、生物学的に活性なフラグメントは、全長ポリペプチドを含まない。生物学的に活性なフラグメントは、それらが定義された活性を維持している限り、任意のサイズであり得る。好ましくは、生物学的に活性なフラグメントは、全長タンパク質の少なくとも10%、少なくとも50%、少なくとも75%または少なくとも90%の活性(例えば、シアリルトランスフェラーゼ活性)を維持している。
【0095】
本明細書で定義されるポリペプチドのアミノ酸配列変種/変異体は、本明細書で定義される核酸に適当なヌクレオチド変化を導入することによって、または所望のポリペプチドのインビトロ合成によって、調製され得る。そのような変種/変異体は、例えば、アミノ酸配列内の残基の欠失、挿入または置換を含む。最終ポリペプチド産物が所望の活性および/または特異性を有している限り、最終構築物に到達するために欠失、挿入および置換の組み合わせが行われ得る。
【0096】
(野生型対応物と比較して)変異(変化した)ペプチドは、当技術分野で公知の任意の技術を用いて調製され得る。例えば、本明細書で定義されるポリヌクレオチドは、インビトロ変異誘発またはDNAシャッフリング技術に供され得る。変異/変化したDNAから得られる生産物は、それらが、例えば、シアリルトランスフェラーゼ活性を有しているかどうかを決定するため、本明細書に記載される技術を用いて容易にスクリーニングされ得る。
【0097】
アミノ酸配列の欠失は、通常、約1~15残基、例えば約1~10残基、しばしば約1~5連続残基の範囲である。いくつかの態様において、変異または修飾タンパク質は、いかなる欠失または挿入も含まない。様々な態様において、変異または修飾タンパク質は、約10、9、8、7、6、5、4、3または2つ未満の欠失または挿入アミノ酸を有する。
【0098】
置換変異は、そのポリペプチド分子内の少なくとも1つのアミノ酸残基が除去され、その代わりにその位置に異なる残基を有する。活性および/特異性を維持するよう、比較的保存的な様式で部位が置換され得る。そのような保存的置換は、「例示的置換」という表題がつけられた以下の表に示されている。
【0099】
特定の態様において、変異/変種ポリペプチドは、天然に存在するポリペプチドと比較して、1つもしくは2つもしくは3つもしくは4つのみまたはそれを超えない保存的アミノ酸変化を有する。保存的アミノ酸変化の詳細は、以下の表に提供されている。当業者が理解しているように、そのような小さな変化は、組み換え細胞において発現されたときにそのポリペプチドの活性を変化させないことが合理的に予想され得る。
【0100】
例示的置換
【0101】
変異は、例えば標準的技術、例えば部位特異的変異誘発およびPCRを通じた変異誘発により、コードされるアミノ酸配列が変更されるよう、核酸配列に導入され得る。様々な態様において、保存的アミノ酸置換は、1つまたは複数の推定非必須アミノ酸残基において行われる。「保存的アミノ酸置換」は、アミノ酸残基が、類似の側鎖を有するアミノ酸残基と置き換えられるものである。類似の側鎖を有するアミノ酸残基のファミリーは、当技術分野で定義されている。特定のアミノ酸は、2つ以上の分類可能な特徴を有する側鎖を有する。これらのファミリーは、塩基性側鎖(例えば、リジン、アルギニン、ヒスチジン)、酸性側鎖(例えば、アスパラギン酸、グルタミン酸)、非荷電極性側鎖(例えば、グリシン、アスパラギン、グルタミン、セリン、スレオニン、チロシン、トリプトファン、システイン)、非極性側鎖(例えば、アラニン、バリン、ロイシン、イソロイシン、プロリン、フェニルアラニン、メチオニン、チロシン、トリプトファン)、β分枝側鎖(例えば、スレオニン、バリン、イソロイシン)および芳香族側鎖(例えば、チロシン、フェニルアラニン、トリプトファン、ヒスチジン)を有するアミノ酸を含む。したがって、そのポリペプチドの内の推定非必須アミノ酸残基は、同じ側鎖ファミリーの別のアミノ酸残基と置き換えられる。いくつかの態様において、変異は、例えば飽和変異誘発により、そのコード配列の全体または一部に無作為に導入され得、そして得られる変異体は、活性を維持する変異体を同定するため、そのポリペプチドの生物学的活性についてスクリーニングされ得る。逆に、本発明は、内因性生物学的活性を強化または増加させる変異を有する変種も提供する。核酸配列に対する変異誘発後、コードされるタンパク質は、当技術分野で公知の任意の組み換え技術により発現され得、そのタンパク質の活性/特異性が決定され得る。本明細書に開示される変種の特定の生物学的活性の増加、減少または消失は、当業者により、すなわち、リガンドに結合する能力および/またはシグナル伝達を測定することにより、容易に測定され得る。
【0102】
様々な態様において、天然アミノ酸による置換は、BLOcks SUbstitution Matrix(BLOSUM行列)を用いて特徴づけられる。BLOSUM行列の非限定的な例は、その全内容が参照により本明細書に組み入れられるStyczynski et al. (2008) “BLOSUM62 miscalculations improve search performance” Nat Biotech 26 (3): 274-275に記載されるBLOSUM62行列である。BLOSUM62行列は、図14に示されている。
【0103】
BLOSUM62行列におけるスコアが少なくとも4の置換は、本明細書で「クラスI置換」と称され、BLOSUM62行列におけるスコアが3の置換は、本明細書で「クラスII置換」と称され、BLOSUM62行列におけるスコアが2または1の置換は、本明細書で「クラスIII置換」と称され、BLOSUM62行列におけるスコアが0または-1の置換は、本明細書で「クラスIV置換」と称され、BLOSUM62行列におけるスコアが-2、-3または-4の置換は、本明細書で「クラスV置換」と称される。
【0104】
本願の様々な態様は、天然に存在するラクトース利用性シアリルトランスフェラーゼ酵素(例えば、本明細書で言及されるラクトース利用性シアリルトランスフェラーゼ酵素)と比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25もしくはそれ以上のクラスI、II、III、IVもしくはV置換、または天然に存在するラクトース利用性シアリルトランスフェラーゼ酵素、例えば本明細書で例示されるラクトース利用性シアリルトランスフェラーゼ酵素と比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25もしくはそれ以上のクラスI、II、III、IVおよび/もしくはV置換の任意の組み合わせを有するラクトース利用性シアリルトランスフェラーゼ酵素を含む。
【0105】
文脈に依存して、「保存的アミノ酸置換」は、2つの配列間の変異または相違を表し得る。例えば、いくつかの態様において、変異は、天然に存在するタンパク質と比較しての保存的アミノ酸置換を含み、その置換は、天然に存在するタンパク質由来のタンパク質を生成するよう意図的に(例えば、人為的な遺伝子操作により)変異体に導入されたものである。別の例において、1つの天然に存在するタンパク質は、別の天然に存在するタンパク質と比較して保存的アミノ酸置換を含み、この例において、「置換」は、各タンパク質の配列を整列させたときの所定位置における2つの配列間の保存的な相違である。
【0106】
いくつかの態様において、本開示のラクトース利用性シアリルトランスフェラーゼ酵素は、天然に存在するα(2,3)シアリルトランスフェラーゼよりもα(2,6)選択的である。本明細書で使用される場合、「α(2,6)選択的」酵素は、少なくとも1:1、例えば約1.2:1~約100:1、例えば約1.2:1~50:1、2:1~50:1、3.1~50:1、4:1~50:1、1.2:1~40:1、1.2:1~30:1、1.2:1~20:1、1.2:1~10:1、2:1~10:1、1.3:1~10:1、または約5:1~約10:1のα(2,6):α(2,3)比でシアル酸の転移をもたらす。
【0107】
生産方法
本明細書に提供されるオリゴ糖生合成方法においては、様々な細菌種、例えば、大腸菌、エルビニア・ヘルビコーラ(パントエア・アグロメランス)、シトロバクター・フロインディー、パントエア・シトレア、ペクトバクテリウム・カロトボラムまたはキサントモナス・カンペストリスが使用され得る。バチルス・サブティリス、バチルス・リケニフォルミス、バチルス・コアグランス、バチルス・サーモフィルス、バチルス・ラテロスポルス、バチルス・メガテリウム、バチルス・ミコイデス、バチルス・プミルス、バチルス・レンタス、バチルス・セレウスおよびバチルス・サーキュランスを含むバチルス属の細菌も使用され得る。同様に、ラクトバチルス・アシドフィルス、ラクトバチルス・サリバリウス、ラクトバチルス・プランタルム、ラクトバチルス・ヘルベティカス、ラクトバチルス・デルブルエッキイー、ラクトバチルス・ラムノサス、ラクトバチルス・ブルガリカス、ラクトバチルス・クリスパタス、ラクトバチルス・ガセリ、ラクトバチルス・カゼイ、ラクトバチルス・ロイテリ、ラクトバチルス・ジェンセニイおよびラクトコッカス・ラクティスを含むがこれらに限定されないラクトバチルス属およびラクトコッカス属の細菌が、本発明の方法を用いて改変され得る。ストレプトコッカス・サーモフィラスおよびプロピオニバクテリウム・フロイデンライシーも、本明細書に記載される発明に適した細菌種である。エンテロコッカス属(例えば、エンテロコッカス・フェシウムおよびエンテロコッカス・サーモフィラス)、ビフィドバクテリウム属(例えば、ビフィドバクテリウム・ロングム、ビフィドバクテリウム・インファンティスおよびビフィドバクテリウム・ビフィダム)、スポロラクトバチルス種、ミクロモノスポラ種、ミクロコッカス種、ロドコッカス種ならびにシュードモナス種(例えば、シュードモナス・フルオレッセンスおよびシュードモナス・エルギノーサ)由来の本明細書に記載されるようにして改変された菌株もまた、本発明の一部として含まれる。様々な態様において、本明細書に記載される特徴を含む細菌は、ラクトースの存在下で培養され、そして細菌自体からまたは細菌の培養上清からのいずれかからシアル化オリゴ糖が回収される。いくつかの態様において、シアル化オリゴ糖は、治療もしくは栄養補給製品において使用するために精製される、または細菌がそのような製品において直接使用される。特定の態様において、適当な生産宿主細菌株は、ラクトース利用性シアリルトランスフェラーゼ酵素をコードする核酸配列が同定された元の細菌株と同じ細菌株でないものである。
【0108】
本明細書に記載される生産方法において使用される細菌は、シアル化オリゴ糖産物の効率および収率を増大させるよう遺伝子操作される。様々な態様において、宿主生産細菌は、減少したレベルのβ-ガラクトシダーゼ活性、対応する野生型細菌と比較してより多くのUDP-GlcNAcもしくはより速い速度でUDP-GlcNAcを生産する能力、対応する野生型細菌と比較してより多くのCMP-Neu5Acもしくはより速い速度でCMP-Neu5Acを生産する能力、欠陥的なまたは減少したシアル酸分解経路、不活性化されたβ-ガラクトシドトランスアセチラーゼ遺伝子、ラクトースパーミアーゼ遺伝子またはそれらの組わせを有する点で特徴づけられる。
【0109】
いくつかの態様において、細菌は、対応する野生型細菌と比較してより多くのUDP-GlcNAcもしくはより速い速度でUDP-GlcNAcを生産する能力を有する。
【0110】
ヌクレオチド糖であるウリジン二リン酸N-アセチルグルコサミン(UDP-GlcNAc)は、その細胞エンベロープの合成および維持に関与する、細菌における鍵となる代謝中間体である。すべての公知の細菌クラスにおいて、UDP-GlcNAcは、その構造完全性が成長および生存に絶対的に必要となる細菌細胞壁を構成するポリマーであるペプチドグリカン(ムレイン)を生成するために使用される。加えて、グラム陰性細菌は、外側細胞膜の重要な成分であるリピドAの合成のためにUDP-GlcNAcを使用する。したがって、細菌にとって、UDP-GlcNAcの十分な細胞内プールを維持する能力は重要である。
【0111】
大腸菌においてUDP-GlcNAcプールは、3つのglm遺伝子、glmS(L-グルタミン:D-フルクトース-6-リン酸アミノトランスフェラーゼ)、glmM(ホスホグルコサミンムターゼ)および二機能性glmU(融合されたN-アセチルグルコサミン-1-リン酸ウリジルトランスフェラーゼおよびグルコサミン-1-リン酸アセチルトランスフェラーゼ)の共同作用を通じて生成される(図2)。これらの3つの遺伝子は、フルクトース-6-リン酸(豊富な主要エネルギー代謝の分子)から始まる流れである、UDP-GlcNAcへの炭素の安定的な流れを指揮する。glm遺伝子の発現は、転写活性化因子タンパク質NagCによる正の制御下にある。大腸菌がその環境においてグルコサミンまたはN-アセチル-グルコサミンに接したとき、これらの分子は各々、個々の膜輸送タンパク質を通じて細胞内に輸送され、UDP-GlcNAcプールへの炭素の流れを補足するために使用されるか、あるいはそれらは、nagオペロン遺伝子産物(すなわち、nagA[N-アセチルグルコサミン-6-リン酸デアセチラーゼ]およびnagB[グルコサミン-6-リン酸デアミナーゼ])の作用の下でエネルギーを生成するために消費されるかのいずれかである。glm遺伝子とは対照的に、nagAおよびnagBの発現は負の転写制御下にあるが、これはglm遺伝子と同じ調節タンパク質、すなわちNagCによるものである。NagCはしたがって二機能性であり、UDP-GlcNAc合成を活性化すると同時に、グルコサミン-6-リン酸およびN-アセチルグルコサミン-6-リン酸の分解を抑制することができる。特異的な調節DNA配列(オペレーター)へのNagCの結合は、そのような結合が遺伝子の活性化をもたらすものであろうが抑制をもたらすものであろうが、低分子誘導因子および代謝産物であるGlcNAc-6-リン酸の細胞質レベルの変動の影響を受ける。GlcNAc-6-リン酸の細胞内濃度は、その環境でN-アセチルグルコサミンが炭素源として利用可能である場合に増加し、したがって、これらの条件下で、(生命に必要なUDP-GlcNAcプールを維持するのに必要な)glm遺伝子の発現は、補完機能が働かない限り、減少するであろう。大腸菌は、上流のnagA遺伝子内に存在する2つの構成性プロモーターにより指揮されるnagCの継続的発現を通じて基準レベルのUDP-GlcNAc合成を維持する。この構成的レベルのnagC発現は、分解性nagオペロンが誘導される条件下でおよそ3倍補足され、これは、大腸菌が、すべての条件下で、N-アセチルグルコサミンが炭素源として利用される場合でさえも、十分なレベルのglm遺伝子発現を確保することを意味する。多くのhMOSは、それらの構造に直接的にGlcNAcを取り込み、かつ多くはまた、その合成がUDP-GlcNAcの消費を伴う糖であるシアル酸も取り込む。したがって、改変された大腸菌における多くのタイプのhMOSの合成は、生産物の収率の減少および細菌のUDP-GlcNAcプールの枯渇による細胞の生存能力の低下という大きな危険を伴う。GlcNAcまたはシアル酸含有hMOSの人為的合成の間にこの問題に対処する1つの方法は、nagCの同時過剰発現を通じて、または好ましくは、nagCおよびglmSの両方の同時過剰発現により、UDP-GlcNAcプールを強化することである。
【0112】
大腸菌または大腸菌以外の細菌に関するいくつかの態様において、細菌は、好ましくは、UDP-GlcNAcの生産増加を伴う。上記のように、これを達成する例示的な手段は、UDP-GlcNAc合成の正の内因性調節因子の過剰発現、例えば、大腸菌のnagC遺伝子の過剰発現によるものである。特定の態様において、このnagCの過剰発現は、プラスミドベクター上にnagC遺伝子の追加コピーを提供することによって、または追加のnagC遺伝子コピーを宿主細胞の染色体に組み込むことによって達成される。様々な態様において、過剰発現は、nagC翻訳を指揮するリボソーム結合配列の強度を調整することによってまたはnagC転写を指揮するプロモーターの強度を調整することによって達成される。いくつかの態様において、細胞内UDP-GlcNAcプールは、他の手段によって、例えば、大腸菌glmS(L-グルタミン:D-フルクトース-6-リン酸アミノトランスフェラーゼ)遺伝子の過剰発現によって、あるいは大腸菌glmY遺伝子(glmSの正の翻訳調節因子)の過剰発現によって、あるいは大腸菌glmZ遺伝子(glmSの別の正の翻訳調節因子)の過剰発現によって、あるいはアプローチの組み合わせを同時に使用することによって強化され得る。様々な態様において、例えば、本明細書に提供される配列をコードするnagC(参照により本明細書に組み入れられる、GenBankタンパク質アクセッションBAA35319.1)およびglmS(参照により本明細書に組み入れられる、GenBankタンパク質アクセッションNP_418185.1)遺伝子が、UDP-GlcNAcの細胞内プールを増大させるよう、同じ宿主細胞内で同時に過剰発現される。
【0113】
特定の態様において、対応する野生型細菌と比較してより多くのCMP-Neu5Acまたはより速い速度でCMP-Neu5Acを生産する能力は、N-アセチルノイラミン酸シンターゼ、UDP-N-アセチルグルコサミン 2-エピメラーゼおよびN-アセチルノイラミン酸シチジリルトランスフェラーゼの任意の1つ、任意の組み合わせまたは3つすべての発現を含む。これらの酵素の非限定的な例は、カンピロバクター・ジェジュニ由来のNeuB、NeuCおよびNeuA(例えば、カンピロバクター・ジェジュニATCC43484)を含む。いくつかの態様において、neuBCA遺伝子が、オペロン内で共発現される。
【0114】
様々な態様において、欠陥的なまたは減弱化されたシアル酸分解経路は、nanR遺伝子、nanA遺伝子、nanT遺伝子、nanE遺伝子またはnanK遺伝子の任意の1つ、任意の組み合わせまたは各々の不活性化または欠失を含む。いくつかの態様において、nanA、nanTおよびnanE遺伝子が、細菌内で不活性化または欠失される。
【0115】
本明細書で使用される場合、「不活性化された」または遺伝子、コードされる遺伝子産物(すなわち、ポリペプチド)もしくは経路の「不活性化」は、その遺伝子、遺伝子産物または経路の発現(すなわち、転写もしくは翻訳)、タンパク質レベル(すなわち、翻訳、分解速度)または酵素活性の減少または消失を表す。経路が不活性化される例において、好ましくはその経路内の1つの酵素またはポリペプチドが、減少したまたは無視できる程度の活性を示す。いくつかの態様において、その経路内の酵素は、その経路の生産物が野生型細菌またはインタクトな経路と比較して低いレベルで生産されるよう、変更、欠失または変異される。特定の態様において、その経路の生産物は、生産されない。様々な態様において、その経路によって利用される(例えば、基質として使用される、変更される、触媒されるまたはそれ以外の方法で減少もしくは消費される)化合物のレベルは、増加する。いくつかの態様において、遺伝子の不活性化は、その遺伝子がもはや転写または翻訳されないようにするその遺伝子またはその遺伝子の調節エレメントの欠失または変異によって達成される。特定の態様において、ポリペプチドの不活性化は、その遺伝子産物をコードする遺伝子の欠失もしくは変異またはその活性を妨げるそのポリペプチドの変異によって達成され得る。不活性化変異は、その遺伝子またはポリペプチドの発現または活性の減少または消失をもたらす核酸またはアミノ酸配列の1つまたは複数のヌクレオチドまたはアミノ酸の付加、欠失または置換を含む。様々な態様において、ポリペプチドの不活性化は、そのポリペプチドの活性が(例えば、立体障害によって)減少または消失するようにするそのポリペプチドのNまたはC末端への外因性配列(例えば、タグ)の付加を通じて達成される。
【0116】
本明細書に記載される生産システムに適した宿主細菌は、強化されたまたは増大したラクトースおよび/またはUDP-GlcNAcおよび/またはCMP-Neu5Acの細胞質または細胞内プールを示すものである。いくつかの態様において、細菌は大腸菌であり、内因性の大腸菌代謝経路および遺伝子は、野生型大腸菌において見いだされるレベルと比較して増大した細胞質濃度のラクトースおよび/またはUDP-GlcNAcおよび/またはCMP-Neu5Acを生成するよう操作される。好ましくは、細菌は、増大した細胞内ラクトースプールならびに増大した細胞内UDP-GlcNAcおよび/またはCMP-Neu5Acプールを蓄積する。例えば、細菌は、本明細書に記載される遺伝子修飾を欠く対応する野生型細菌と比較して、少なくとも10%、20%、50%もしくは2倍、5倍、10倍またはそれ以上高いレベルの細胞内ラクトースならびに/または細胞内UDP-GlcNAcおよび/もしくはCMP-Neu5Acを含む。
【0117】
特定の態様において、野生型細菌と比較して増大した宿主細菌内のラクトースの細胞内濃度は、ラクトース輸入、輸出および異化に関与する遺伝子および経路の操作により達成される。非限定的な例において、内因性β-ガラクトシダーゼ遺伝子(lacZ)およびラクトースオペロンレプレッサー遺伝子(lacI)の同時欠失によりヒトミルクオリゴ糖を生産するよう遺伝子操作された大腸菌において細胞内ラクトースレベルを増大させる方法が、本明細書に記載される。この欠失を行う中で、lacIqプロモーターが、ラクトースパーミアーゼ遺伝子lacYのすぐ上流に(lacYと連続するよう)配置される、すなわち、lacIqプロモーターの配列は、lacY遺伝子がlacIqプロモーターによる転写調節下に置かれるよう、lacY遺伝子をコードする配列の開始部分の直接上流でありかつ隣接する。修飾された菌株は、(LacYを通じて)培養培地からラクトースを輸送する能力を維持するが、ラクトース異化を担う(β-ガラクトシダーゼをコードする)lacZ遺伝子の野生型染色体コピーが欠失される。したがって、細胞内ラクトースプールは、この修飾株が外因性ラクトースの存在下で培養されたときに形成される。
【0118】
いくつかの態様において、大腸菌内でのラクトースの細胞内濃度の増加は、β-ガラクトシドトランスアセチラーゼ遺伝子、例えばlacA遺伝子の不活性化によるものである。大腸菌に関して、lacAの不活性化変異、ヌル変異または欠失は、細胞内アセチルラクトースの形成を防ぎ、この分子を混入物質としてその後の精製から除去するだけでなく、その細胞質から過剰なラクトースを輸出する大腸菌の能力も消失させ(Danchin A. Cells need safety valves. Bioessays 2009, Jul;31(7):769-73)、それによって大腸菌の細胞内ラクトースプールの意図的操作を大きく促進する。
【0119】
特定の態様において、機能的なラクトースパーミアーゼ遺伝子が、細菌内に存在する。様々な態様において、ラクトースパーミアーゼ遺伝子は、内因性ラクトースパーミアーゼ遺伝子または外因性ラクトースパーミアーゼ遺伝子である。例えば、ラクトースパーミアーゼ遺伝子は、大腸菌lacY遺伝子(例えば、参照により本明細書に組み入れられるGenBankアクセッション番号V00295(GI:41897))を含み得る。多くの細菌は、(例えば、バチルス・リケニフォルミスにおいて見いだされる)大腸菌ラクトースパーミアーゼのホモログである輸送タンパク質または(例えば、ラクトバチルス・カゼイおよびラクトバチルス・ラムノサスにおいて見いだされる)ユビキタスPTS糖輸送ファミリーのメンバーであるトランスポーターを利用することによって、ラクトースを成長培地から細胞に輸送する固有の能力を有する。細胞外ラクトースを細胞の細胞質に輸送する固有の能力を欠く細菌の場合、この能力は、組み換えDNA構築物上に提供される、およびプラスミド発現ベクター上または宿主染色体に組み込まれた外因性遺伝子のいずれかで供給される外因性ラクトーストランスポーター遺伝子(例えば、大腸菌lacY)によって付与され得る。
【0120】
本明細書に記載される場合、いくつかの態様において、宿主細菌は、好ましくは、減少したレベルのβ-ガラクトシダーゼ活性を有する。細菌が内因性β-ガラクトシダーゼ遺伝子の欠失によって特徴づけられる態様において、外因性β-ガラクトシダーゼ遺伝子が細菌に導入され得る。例えば、外因性β-ガラクトシダーゼ遺伝子を発現するプラスミドは、細菌に導入され得る、または宿主ゲノムに組み換えもしくは組み込まれ得る。例えば、外因性β-ガラクトシダーゼ遺伝子は、宿主細菌において不活性化される遺伝子、例えばlon遺伝子に挿入され得る。
【0121】
いくつかの態様において、外因性β-ガラクトシダーゼ遺伝子は、いかなる遺伝的操作もなされていない野生型細菌におけるβ-ガラクトシダーゼ活性と比較して減少したまたは低いレベルのβ-ガラクトシダーゼ活性により特徴づけられる機能的なβ-ガラクトシダーゼ遺伝子である。例示的なβ-ガラクトシダーゼ遺伝子は、単糖へのβ-ガラクトシドの加水分解を触媒する大腸菌lacZおよび多くの他の生物のいずれか由来のβ-ガラクトシダーゼ遺伝子(例えば、クルイベロマイセス・ラクティスのlac4遺伝子(例えば、参照により本明細書に組み入れられるGenBankアクセッション番号M84410(GI:173304)))を含む。野生型大腸菌におけるβ-ガラクトシダーゼ活性のレベルは、例えば、1,000単位である(例えば、細菌がラクトースの存在下で培養されたとき)。したがって、本発明の改変された宿主細菌に含まれる減少したβ-ガラクトシダーゼ活性レベルは、1,000単位未満、900単位未満、800単位未満、700単位未満、600単位未満、500単位未満、400単位未満、300単位未満、200単位未満、100単位未満または50単位未満を含む(例えば、細菌がラクトースの存在下で培養されたとき)。いくつかの態様において、β-ガラクトシダーゼの低い機能的なレベルは、0.05~1,000単位のβ-ガラクトシダーゼ活性レベル、例えば0.05~750単位、0.05~500単位、0.05~400単位、0.05~300単位、0.05~200単位、0.05~100単位、0.05~50単位、0.05~10単位、0.05~5単位、0.05~4単位、0.05~3単位または0.05~2単位のβ-ガラクトシダーゼ活性を含む(例えば、細菌がラクトースの存在下で培養されたとき)。特定の態様において、β-ガラクトシダーゼの低い機能的なレベルは、1~1,000単位のβ-ガラクトシダーゼ活性レベル、例えば、1~750単位、1~500単位、1~400単位、1~300単位、1~200単位、1~100単位、1~50単位、1~10単位、1~5単位、1~4単位、1~3単位または1~2単位のβ-ガラクトシダーゼ活性を含む(例えば、細菌がラクトースの存在下で培養されたとき)。単位の定義およびβ-ガラクトシダーゼ活性を決定するためのアッセイについては、Miller JH, Laboratory CSH. Experiments in molecular genetics. Cold Spring Harbor Laboratory Cold Spring Harbor, NY; 1972を参照のこと(参照により本明細書に組み入れられる)。この低レベルの細胞質β-ガラクトシダーゼ活性は、細胞内ラクトースプールを大きく減少させるほど十分高くない。低レベルのβ-ガラクトシダーゼ活性は、発酵終了時の望ましくない残留ラクトースの容易な除去に非常に有用である。
【0122】
任意で、細菌は、不活性化されたthyA遺伝子を有する。様々な態様において、宿主細菌内のthyA遺伝子の変異は、選択マーカー遺伝子としてthyAを保持するプラスミドの維持を可能にする。例示的な代替の選択マーカーは、抗生物質耐性遺伝子、例えばBLA(ベータ-ラクタマーゼ)またはproBA遺伝子(proAB宿主株プロリン栄養性を補完する)またはpurA(purA宿主株アデニン栄養性を補完する)を含む。
【0123】
いくつかの態様において、精製されたオリゴ糖、例えば、3'-SL、6'-SL、3'-S3FL、SLNT a、SLNT b、DSLNT、SLNFP IIまたはSLNT cは、重量で所望のオリゴ糖の少なくとも85%、90%、95%、98%、99%または100%(w/w)であるものである。純度は、任意の公知の方法、例えば、薄層クロマトグラフィーまたは当技術分野で公知の他のクロマトグラフィー技術によって評価され得る。本明細書に記載される遺伝子操作された細菌により生産されるシアル化オリゴ糖を精製する方法が、本明細書に含まれ、この方法は、所望のシアル化オリゴ糖を、細菌の細菌細胞溶解産物または細菌細胞培養上清中の混入物質から分離する工程を含む。いくつかの態様において、シアル化オリゴ糖は、組成物中のシアル化オリゴ糖のレベルを増加させるよう、食品または飲料組成物に添加され得る。いくつかの例において、シアル化オリゴ糖は、乾燥または粉末ミルクまたは乳製品、例えば幼児用配合物に添加される。いくつかの態様において、それは液体ミルクに添加される。他の態様において、それは乳成分非含有製品、例えばヨーグルトまたはケフィアに添加される。様々な態様において、本明細書に提供される組成物は、ミルクでない。特定の態様において、本明細書に提供される組成物は、ミルクを含まない。
【0124】
様々な態様において、シアル化オリゴ糖は、精製され、ヒトならびに動物、例えばコンパニオン動物(イヌ、ネコ)および家畜(ウシ、ウマ、ヒツジ、ヤギまたはブタ動物、および家禽)が消費する多くの製品において使用される。例えば、食品、飲料、栄養補助製品または医薬組成物は、精製された3'-SL、6'-SL、3'-S3FL、SLNT a、SLNT b、DSLNT、SLNFP IIまたはSLNT cを含み得る。いくつかの態様において、組成物は、経口投与に適した賦形剤を含む。
【0125】
特定の態様において、精製されたヒトミルクオリゴ糖(HMOS)(例えば、ヒト母乳中に存在するシアル化オリゴ糖)を含む薬学的組成物を製造する方法は、本明細書に記載される細菌を培養し、細菌により生産されるHMOSを精製し、そしてHMOSと賦形剤または担体を組み合わせて経口投与用の栄養補助製品を生成することによって実施され得る。これらの組成物は、幼児および成体の腸および/または呼吸器疾患を予防または処置する方法において有用である。したがって、組成物は、そのような疾患に罹患したまたはそのような疾患を発症する危険がある対象に投与される。
【0126】
対象において感染を処置する、予防するまたはその危険を減らす方法であって、精製された組み換えヒトミルクオリゴ糖を含む組成物を対象に投与する工程を含み、HMOSが病原体に結合し、対象がその病原体に感染しているまたは感染する危険がある方法が、本発明に包含される。いくつかの態様において、感染は、ノーウォーク様ウイルスまたはカンピロバクター・ジェジュニにより引き起こされる。特定の態様において、対象は哺乳類である。様々な態様において、哺乳類は、例えば、任意の哺乳類、例えば、ヒト、霊長類、マウス、ラット、イヌ、ネコ、ウシ、ウマまたはブタである。いくつかの態様において、哺乳類はヒトである。特定の態様において、組成物は、コンパニオン動物、例えばイヌまたはネコ、ならびに家畜または食用動物、例えばウシ、ヒツジ、ブタ、ニワトリおよびヤギ用の動物飼料(例えば、ペレット、キブル、マッシュ)または動物栄養補助製品に配合される。様々な態様において、精製されたHMOSは、粉末(例えば、各々摂取する前に水もしくはジュース等の液体と混合される、幼児用粉末配合物もしくは成体用栄養補助粉末)にまたはタブレット、カプセルもしくはペーストの形態で配合される、または乳製品、例えばミルク、クリーム、チーズ、ヨーグルトもしくはケフィア中の成分としてもしくは任意の飲料中の成分として組み込まれる、またはプロバイオティクスとして機能することが意図されている生きた微生物の培養物を含む調製物に、もしくはインビトロもしくはインビボのいずれかで善玉微生物の成長を促進するプレバイオティクス調製物に混合される。
【0127】
本明細書に記載される少なくとも1つのラクトース利用性シアリルトランスフェラーゼ酵素またはその変種もしくはフラグメントをコードする核酸を含む核酸構築物または発現ベクター(例えば、ウイルスベクターもしくはプラスミド)が、本発明に包含される。ベクターはさらに、1つまたは複数の調節エレメント、例えば異種プロモーターを含み得る。「異種」は、その制御配列とタンパク質コード配列が異なる供給源由来であることを意味する。例えば、供給源は、異なる細菌株または種であり得る。調節エレメントは、タンパク質をコードする遺伝子、融合タンパク質遺伝子をコードする遺伝子構築物、または融合タンパク質を発現するようオペロン内で連結された一連の遺伝子に機能的に連結され得る。上記の核酸分子またはベクターを含む単離された組み換え細胞、例えば細菌細胞も、本明細書に提供される。核酸は、任意で、宿主細菌のゲノムに組み込まれる。いくつかの態様において、核酸構築物はまた、ラクトース利用性シアリルトランスフェラーゼ酵素でない1つまたは複数の酵素をさらに含む。
【0128】
本明細書で使用される場合、「発現ベクター」は、1つまたは複数のポリヌクレオチドを発現させることができるDNAまたはRNAベクターである。好ましくは、発現ベクターはまた、宿主細胞内で複製することができる。発現ベクターは、原核生物系または真核生物系のいずれかであり得、典型的に、プラスミドを含む。本発明の発現ベクターは、本明細書に記載される原核生物または真核生物細胞、例えばグラム陽性、グラム陰性、病原性、非病原性、共生、球菌、細菌またはらせん状細菌細胞;古細菌細胞;または原生動物、藻類、真菌、酵母、植物、動物、脊椎動物、無脊椎動物、節足動物、哺乳類、げっ歯類、霊長類またはヒト細胞の1つを含む、本発明の宿主細胞において機能する(すなわち、遺伝子発現を指示する)任意のベクターを含む。本発明の発現ベクターは、調節配列、例えば転写制御配列、翻訳制御配列、複製起点および宿主細胞と適合しポリヌクレオチドの発現を制御する他の調節配列を含む。特に、本発明の発現ベクターは、転写制御配列を含む。転写制御配列は、転写の開始、伸長および終結を制御する配列である。特に重要な転写制御配列は、転写開始を制御するもの、例えばプロモーター、エンハンサー、オペレーターおよびレプレッサー配列である。適当な転写制御配列は、本発明の細胞の少なくとも1つにおいて機能し得る任意の転写制御配列を含む。様々なそのような転写制御配列は、当業者に公知である。
【0129】
「異種プロモーター」は、自然界でその遺伝子または核酸配列が機能的に連結されているプロモーターとは異なるプロモーターである。
【0130】
「過剰発現する」または「過剰発現」という用語は、同じ条件下で野生型細胞によるものよりも多くの因子が遺伝的に変更された細胞によって発現される状況を表す。同様に、変更されていない細胞がある因子を発現せず、それが生成するよう遺伝的に変更される場合、(「過剰発現」と区別される)「発現」という用語が使用され、これは野生型細胞が遺伝子操作前にその因子を全く発現しなかったことを示す。
【0131】
ポリペプチドまたはポリペプチドのクラスは、参照アミノ酸配列に対するそのアミノ酸配列の同一性の程度(%同一性)によって、または1つの参照アミノ酸配列に対して別のものよりも高い%同一性を有することによって定義され得る。本明細書に開示される遺伝子または遺伝子産物のいずれかの変種は、例えば、本明細書に記載される核酸またはアミノ酸配列に対して50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%または99%の配列同一性を有し得る。2つまたはそれ以上の核酸またはポリペプチド配列との関係で、「%同一性」という用語は、配列比較アルゴリズムを用いてまたは目視検査によって測定される場合に、最大一致となるよう比較およびアラインメントをおこなったとき、同じであるまたは同じであるアミノ酸残基もしくはヌクレオチドを一定比率有する、2つまたはそれ以上の配列または部分配列を表す。例えば、%同一性は、比較される配列のコード領域の全体、またはその特定のフラグメントもしくは機能的ドメインに対するものである。本明細書に開示される変種はまた、本明細書に記載される遺伝子または遺伝子産物のホモログ、オルトログまたはパラログを含む。いくつかの態様において、変種は、生物学的機能にとって重要な保存されたドメインに対して、例えば、機能的ドメイン、例えば触媒ドメインにおいて、一定比率の相同性または同一性、例えば、少なくとも約50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%または99%の同一性を示し得る。
【0132】
配列比較において、1つの配列が参照配列として使用され、それに対して試験配列が比較される。配列比較アルゴリズムを使用する場合、試験および参照配列がコンピュータに入力され、必要に応じて、部分配列の座標が設定され、そして配列アルゴリズムプログラムのパラメータが設定される。ついで、配列比較アルゴリズムは、設定されたプログラムパラメータに基づき、参照配列に対する試験配列のパーセント配列同一性を算出する。パーセント同一性は、BLASTを用いて決定される。BLAST調査の場合、以下のパラメータが用いられる:(1)期待値は10;(2)ギャップコストは存在:11および伸長:1;(3)使用する行列はBLOSUM62;(4)低複雑性領域フィルターは「オン」。
【0133】
本明細書で使用される場合、数値または範囲に関する「約」という用語は、文脈がより限定された範囲を必要としない限り、示されているまたは請求されている数値または範囲の±10%を意味する。
【0134】
上記の説明においておよび特許請求の範囲において、「少なくとも1つ」または「1つまたは複数」等のフレーズが、要素または特徴の関連するリストの後で使用され得る。「および/または」という用語もまた、2つまたはそれ以上の要素または特徴のリストの中で使用され得る。暗示的にまたは明示的にそれが使用される文脈と相反しない限り、そのようなフレーズは、列挙されている要素もしくは特徴のいずれかを個別にまたは示されている要素もしくは特徴のいずれかと他の示されている要素もしくは特徴のいずれかの組み合わせを意味することが意図されている。例えば、「AおよびBの少なくとも1つ」、「AおよびBの1つまたは複数」ならびに「Aおよび/またはB」というフレーズは各々、「Aのみ、Bのみ、またはAおよびBの両方」を意味することが意図されている。3つまたはそれ以上の項目を含むリストについても、同様の解釈が意図されている。例えば、「A、BおよびCの少なくとも1つ」、「A、BおよびCの1つまたは複数」、ならびに「A、Bおよび/またはC」というフレーズは各々、「Aのみ、Bのみ、Cのみ、AおよびBの両方、AおよびCの両方、BおよびCの両方、またはAおよびBおよびCのすべて」を意味することが意図されている。加えて、上記および特許請求の範囲における「~に基づく」という用語の使用は、示されていない特徴または要素も許容されるよう「~に少なくとも部分的に基づく」を意味することが意図されている。
【0135】
パラメータ範囲が提供される場合、その範囲内のすべての整数およびそれらの10分の1の数値もまた本発明によって提供されることが理解される。例えば、「0.2~5 mg」は、最大 5.0 mgであり5.0 mgを含む、0.2 mg、0.3 mg、0.4 mg、0.5 mg、0.6 mg等の開示である。
【0136】
本明細書で使用される場合、「単離」または「精製」された核酸分子、ポリヌクレオチド、ポリペプチドまたはタンパク質は、組み換え技術または化学的に合成される場合は化学的前駆体もしくは他の化合物によって生成されたとき、他の細胞物質または培養培地を実質的に含まない。精製された化合物は、重量(乾燥重量)で少なくとも60%が関心対象の化合物である。好ましくは、調製物は、重量で少なくとも75%、より好ましくは少なくとも90%、最も好ましくは少なくとも99%が関心対象の化合物である。例えば、精製された化合物は、重量で少なくとも90%、91%、92%、93%、94%、95%、98%、99%または100%(w/w)が所望の化合物である。純度は、任意の適当な標準的方法によって、例えば、カラムクロマトグラフィー、薄層クロマトグラフィーまたは高速液体クロマトグラフィー(HPLC)分析によって測定される。精製または単離されたポリヌクレオチド(リボ核酸(RNA)またはデオキシリボ核酸(DNA))は、その天然状態でそれに隣接する遺伝子/核酸または配列/アミノ酸を含まない。精製されたはまた、ヒト対象への投与に関して安全である滅菌性の程度、例えば、感染性または毒性因子の欠如を定義する。
【0137】
同様に、「実質的に純粋」は、ヌクレオチドまたはポリペプチドを参照する場合、自然界でそれに付随する成分から分離されたものを意味する。典型的に、ヌクレオチドおよびポリペプチドは、それらが自然界で付随するタンパク質および天然有機分子を重量で少なくとも60%、70%、80%、90%、95%さらには99%含まない場合、実質的に純粋である。
【0138】
いくつかの態様において、特定の組成物に関する「実質的に純粋」または「実質的に含まない」という用語は、シアル化オリゴ糖を含む組成物が、他の物質を重量で50%未満、40%未満、30%未満、20%未満、15%未満、10%未満、5%未満または1%未満含むことを意味する。いくつかの態様において、「実質的に純粋」または「実質的に含まない」は、不純物を含む他の物質を含まない物質を表す。不純物は、例えば、副産物、混入物質、分解産物、水および溶媒を含み得る。
【0139】
「含む(including)」、「含む(containing)」または「~により特徴づけられる」と同義である「含む(comprising)」という転換語は、内包的またはオープンエンド型であり、追加の、示されていない要素または方法の工程を排除しない。対照的に、「からなる」という転換語は、その請求項において示されていないあらゆる要素、工程または成分を排除する。「から本質的になる」という転換語は、請求の範囲を、示されている物質または工程「および請求の範囲に記載の発明の基本的かつ新規の特徴に実質的に影響しないそれら」に限定する。
【0140】
本明細書で使用される場合、「対象」は、シアル化オリゴ糖が投与され得る任意の生物を表す。対象は、ヒトまたは非ヒト動物であり得る。対象は哺乳類であり得る。哺乳類は霊長類または非霊長類であり得る。哺乳類は、霊長類、例えばヒト;非霊長類、例えばイヌ、ネコ、ウマ、ウシ、ブタ、マウス、ラット、ラクダ、ラマ、ヤギ、ウサギ、ヒツジ、ハムスターおよびモルモット;または非ヒト霊長類、例えばサル、チンパンジー、ゴリラ、オランウータンおよびギボンであり得る。対象は、任意の年齢または発生段階のもの、例えば成体、青年期、幼児であり得る。好ましい態様において、対象は、2歳未満のヒト個体、老齢対象(例えば、65歳以上)、免疫不全対象(例えば、自己免疫障害に罹患した、移植に付随する免疫抑制治療を受けている、または癌を有すると診断され化学療法を受けている対象)、栄養失調の個体、(例えば、抗生物質を用いた処置後の腸内細菌の)腸内毒素症から回復段階にある個体、または健康な腸内細菌の確立または再確立から利益を得る任意の個体である。
【0141】
本明細書で使用される場合、「処置する」および「処置」という用語は、異常な状態、障害または疾患に罹患した臨床症状を示す個体に、症状の重篤度および/もしくは頻度の低下、症状および/もしくはそれらの根底にある原因の消滅をもたらすならびに/または損傷の改善もしくは修復を促進するよう薬剤または配合物を投与することを表す。「予防する」および「予防」という用語は、特定の有害な状態、障害または疾患に罹患しやすい臨床的に無症状の個体に薬剤または組成物を投与することを表し、したがって症状および/またはそれらの根底にある原因が発症するのを防ぐことに関連する。
【0142】
配合物または配合成分の「有効量」および「治療有効量」という用語は、非毒性であるが、配合物または成分が所望の効果を提供するのに十分である量を意味する。
【0143】
本明細書で使用される場合、単数形である「a」、「an」および「the」は、文脈がそうでないことを明確に示していない限り、複数の参照を包含する。したがって、例えば、「疾患(a disease)」、「オリゴヌクレオチド(an oligonucleotide)」または「核酸(a nucleic acid)」の参照は、1つまたは複数のそのような態様の参照であり、当業者に公知のそれらの等価物等を包含する。
【0144】
本明細書で使用される場合、「薬学的に許容される」担体または賦形剤は、合理的な利益/危険比に見合った、過度の有害な副作用(例えば、毒性、刺激およびアレルギー反応)がない、ヒトおよび/または動物における使用に適した担体または賦形剤を表す。それは、例えば、対象に本発明の化合物を送達するための薬学的に許容される溶媒、懸濁剤またはビヒクルであり得る。
【0145】
文脈がそうでないことを必要としない限り、「ポリペプチド」および「タンパク質」という用語は、言い換え可能に使用される。
【0146】
本明細書に開示される例示的な配列は、以下を含む:
【実施例0147】
実施例1:改変された細菌宿主におけるシアリルオリゴ糖の合成のための新しいシアリルトランスフェラーゼ(ST)の同定
フォトバクテリウム種JT-ISH-224株由来のPst6-224を用いた新しいSTの同定
原核生物および真核生物の両方から同定されたシアリルトランスフェラーゼは、5つの異なる配列ファミリー(GT29、GT38、GT42、GT52およびGT80)に分類され、少なくとも2つの構造的フォールド(GT-AおよびGT-B)を有する(Audry, M., et al. (2011). Glycobiology 21, 716-726)。真核生物シアリルトランスフェラーゼ(GT29ファミリーおよびGT-Aフォールド)は、分泌経路において見い出される膜貫通分子であり、したがってそれらは本明細書に記載される改変微生物の細胞質内でのそれらの使用に関して異種発現問題を引き起こす。この理由から、このファミリーにおける新しい実施例は追求されなかった。代わりに、細菌GT80ファミリー(およびGT-Bフォールド)の新しいシアリルトランスフェラーゼ(ST)が、改変された宿主細胞におけるシアリルオリゴ糖の合成において有用であることが同定された。
【0148】
この目的で、DNA配列データベースの配列スクリーニングを行った。最初に、フォトバクテリウム種JT-ISH-224株由来の1つの公知のラクトース受容性α(2,6)シアリルトランスフェラーゼであるPst6-224の配列(Drouillard, S., et al. (2010). Carbohydr Res 345, 1394-99 SEQ ID NO: 1)を用いて公開データベースを検索し、さらなるラクトース受容性STであり得る1つのホモログを発見した。配列ホモログを同定するために、Pst6-224のアミノ酸配列を、検索アルゴリズムPSI-BLAST(Position Specific Iterated Basic Local Alignment Search Tool)におけるクエリーとして使用した。特定のクエリータンパク質配列を用いて、PSI-BLASTプログラムは、データベースの相同性検索に基づき関係の近いタンパク質配列のリストを生成する。これらのタンパク質ホモログヒットは、その後、プログラムにより、元のクエリーに対するそれらの配列類似性を反映するプロフィールを生成するために使用される。このプロフィールは、その後、アルゴリズムにより、拡張されたホモログタンパク質グループを同定するために使用され、そしてこのプロセスが、各反復後に得られるさらなる新しい候補の数が減少するまで数回反復される(Altschul, S.F., et al. (1990) J. Mol. Biol 215, 403-410; Altschul, S.F., et al. (1997) Nucleic Acids Res 25, 3389-3402)。
【0149】
Pst6-224のアミノ酸配列を、PSI-BLAST検索アルゴリズムの6回反復におけるクエリーとして使用した。このアプローチにより、その多く(117個)がPst6-224に高度に関連する(50~90%の範囲のアミノ酸同一性を共有する)、Pst6-224に対する類似性の程度が相違する特有の433個の候補のグループ、およびより関係の遠い(50%未満のアミノ酸同一性を共有する)グループを得た。Pst6-224は、6'-SLの収率が最適でなく、代謝的に改変された大腸菌産生株において使用されたときに望ましくない副産物を生成する傾向があることに留意されたい(Drouillard et al., 2010)。加えて、Pst6-224の生産の増加は、本発明で使用するのに好ましい株を含む特定の大腸菌生産株において軽度に毒性であるようであった。したがって、さらなる分析のための候補は、意図的に(かつある程度直感に反して)PSI-BLAST検索を通じて同定されたより関係の遠い(Pst6-224に対して250超の残基にわたって30%未満のアミノ酸同一性を共有する)グループから選出した(表1)。
【0150】
(表1)Pst6-224に対して30%未満の配列同一性を有するさらに分析された候補
【0151】
この候補グループは、それらがすべて同じPfamタンパク質ファミリーに属するという観察から推測されるように、主に各タンパク質の触媒ドメイン領域内で一定の類似性を共有していたが、それらのタンパク質ドメイン構成の類似性を共有しているとは限らなかった。「シアリルトランスフェラーゼ」Pfamドメインの存在は、比活性、触媒速度、基質特異性および生産物の詳細の点でこのタンパク質の実際の触媒能力に関して何かを明らかにするものでないこと、ならびにそれらの所望の特性に関して候補遺伝子を検証するために実際の実験を必要とすることに留意されなければならない。この候補グループは、Pst6-224と比較して類似の、より優れたまたは別個のα(2,6)-ST活性を含み得るが、それらは、生産株において発現されたPst6-224で観察される不可解な毒性および他の機能的欠点(例えば、乏しい特異性)を回避する程度にアミノ酸レベルで十分相違する。
【0152】
シアル酸をそれらの細胞表面グリカン構造に組み込み得るまたは組み込むことが知られている細菌種に由来する候補STを同定するために、これらのより関係の遠い(Pst6-224に対して30%未満の配列同一性の)候補STをさらにスクリーニングした。これらのタイプの生物由来の候補STは、それらの表面炭水化物構造におけるシアル酸の存在から、糖ヌクレオチドドナー基質としてCMP-N-アセチルノイラミン酸(CMP-Neu5Ac)を利用する可能性が高いと考えられる。共生生物または病原体由来の候補STもまた同定された。そのような生物は、ときどき、それらの細胞表面上に、シアル酸を含む炭水化物構造を示す。これらのタイプの生物由来の候補STもまた、ドナー基質としてCMP-Neu5Aを利用し、また有用なアクセプターオリゴ糖へのシアル酸の連結を触媒する可能性が高いと考えられる。
【0153】
これらの基準に基づき、アミノ酸レベルで8.9~26.1%の範囲のPst6-224に対する同一性を有する6つの候補STをPSI-BLASTスクリーニングから選択した(表1)。これらのタンパク質は、しばしば、データベース上で「仮想タンパク質」と注釈されており、割り当てられた名称を有さない。記載の簡略化のために、これらのタンパク質をコードする遺伝子を、細菌シアリルトランスフェラーゼ(bacterial sialyltransferase)からのbstとそれに続くそれらを個別に識別する文字で命名した。
【0154】
検索プローブとしてヘリコバクター・アシノニキス由来のHAC1268(ラクトース利用性α(2,6)ST)を用いたデータベーススクリーニング
第2の配列データベーススクリーニングを、検索プローブとして第2のラクトース利用性α(2,6)ST(ヘリコバクター・アシノニキス由来のHAC1268(Schur, M.J., et al. (2012). Glycobiology 22, 997-1006, SEQ ID NO: 8))を用いて行った。HAC1268は、GT42シアリルトランスフェラーゼファミリーのメンバーであり、(上記のように、第1のデータベーススクリーニングにおいてプローブとして使用した)Pst6-224 ST配列と異なる推定の構造的フォールド(GT-Aフォールド)を有している。
【0155】
アミノ酸レベルで70.6%および52.9%のHAC1268に対する同一性を有する2つの候補ST(表2)を、さらなる評価のために選択した。図2は、2つのα(2,6)STプローブ配列および8つの同定されたST候補の間のペアワイズ%アミノ酸配列同一性比較を示している。これらの候補の合成bst遺伝子を設計し、当技術分野で公知の標準的なバイオインフォマティクスアルゴリズムを用いてインシリコで大腸菌発現のためにコドン最適化し、そして修飾されたリボソーム結合部位を用いて、翻訳を大腸菌内での適切なレベルに調整するよう改変した。
【0156】
(表2)さらなる評価のために同定および分析された候補
【0157】
bstCによってコードされるアミノ酸配列の最初の20残基は、大腸菌においてそのタンパク質を分泌経路に導くシグナル配列を有していると推測され、したがって、これらの残基を欠くbstCの派生体(Δ20bstCと命名)を設計および試験した(SEQ ID NO:18)ことに留意されたい。
【0158】
また、Pst6-224のアミノ酸配列の最初の16残基もまた、シグナル配列を有すると推測され、したがってこれらの残基を欠くPst6-224をコードする遺伝子の派生体(Δ16Pst6-224と命名)を設計および試験したことに留意されたい。合成bst遺伝子を、合成性「gBlock」オリゴヌクレオチド(Integrated DNA Technologiesから入手した)を用いてインビトロでGibson Assembly法によって合成し、標準的な分子生物学技術を用いて大腸菌発現プラスミドにクローニングした。
【0159】
シアリルラクトース(SL)の生成のための発現および形質転換
発現ベクター
候補bst遺伝子を発現させるため、およびシアリルラクトースを生成するそれらの能力を試験するために使用した発現ベクターは、異種遺伝子の発現を駆動する強バクテリオファージλ pLプロモーターを有するp15A originベースのプラスミドである。加えて、このプラスミドは、(研究室内での利便性から)アンピシリン選択を用いてプラスミドを宿主株内で維持するためのβ-ラクタマーゼ(bla)遺伝子を有し、さらに、thyAマイナス宿主内での代替選択手段としてネイティブ大腸菌thyA(チミジル酸シンターゼ)遺伝子を有する。このプラスミドはまた、pLプロモーターの下流および候補bst遺伝子の下流のオペロン構造内に、カンピロバクター・ジェジュニ由来の3つの異種生合成遺伝子(N-アセチルノイラミン酸シンターゼ、UDP-N-アセチルグルコサミン2-エピメラーゼおよびN-アセチルノイラミン酸シチジリルトランスフェラーゼをコードする、それぞれ、neuB、neuCおよびneuA)を有する。これらの酵素は、大腸菌に、UDP-GlcNAcをCMP-Neu5Acに変化する能力を付与する。CMP-Neu5Acは、その後、候補シアリルトランスフェラーゼが細胞内ラクトースをシアリルラクトースに変換する際に利用するドナー基質として利用可能である。図3は、候補ST遺伝子の1つであるbstNを有するこの発現ベクターのマップである(プラスミドpG543、SEQ ID NO:11)。
【0160】
宿主株の構築
候補シアリルトランスフェラーゼ遺伝子発現プラスミドで、シアリルラクトース(SL)の生産に有用な宿主株を形質転換する。SLの生合成は、ラクトースおよびCMP-Neu5Acの両方の拡張された細胞プールの生成を必要とする(図4は、改変された大腸菌におけるSL生合成のスキームを概説している)。シアリルラクトース生産を触媒する候補の能力を試験する宿主バックグラウンドを改変する出発点として、野生型大腸菌K12原栄養株W3110を選択した(Bachmann, B.J. (1972). PBacteriol Rev 36, 525-557)。使用した具体的なW3110派生株は、GI724として知られる大腸菌株を生成する、トリプトファン誘導性PtrpB cI+レプレッサーカセットの(ampC座への)導入により以前に改変されたものであった(LaVallie et al., 2000)。
【0161】
GI724の他の特徴は、lacIqおよびlacPL8プロモーター変異を含む。大腸菌株GI724は、低レベルの外因性トリプトファンを用いた誘導後にファージλ PLプロモーターからの組み換えタンパク質の経済的な生成をもたらす(LaVallie, E.R., et al. (1993). Biotechnology (NY) 11, 187-193; Mieschendahl, Petri, and Hanggi (1986). Bio/Technology 4, 802-08)。SLの生合成を促進するために、さらなる遺伝的変更がこの菌株に行われた。これは、GI724株において、λRed組み換え(Court, D.L., et al. (2002). Annu Rev Genet 36, 361-388)および汎用P1ファージ形質導入(Li, X.T., et al. (2013). Nucleic Acids Res 41, e204)を用いた染色体の複数の操作を通じて達成された。
【0162】
第1:細胞内ラクトースを蓄積する大腸菌宿主株の能力を、内因性β-ガラクトシダーゼ遺伝子(lacZ)の欠失によって改変した。このようにして改変された菌株は、(ラクトースパーミアーゼであるLacYを通じて)培養培地からラクトースを輸送する能力を維持しているが、ラクトース異化を担うlacZ遺伝子の野生型コピーが欠失される。細胞内ラクトースプールは、したがって、この改変株が外因性ラクトースの存在下で培養されたときに形成される。加えて、強化された細胞内ラクトースプールからのアセチル-ラクトースの生産を排除するため、lacA遺伝子を欠失させた。この菌株の派生物において、強化された構成性lacIqプロモーターがラクトースパーミアーゼ遺伝子lacYのすぐ上流に配置されるよう、lacZおよびlacI遺伝子を同時に欠失させた。
【0163】
第2:i)N-アセチルノイラミン酸シンターゼ(NeuB)、ii)UDP-N-アセチルグルコサミン2-エピメラーゼ(NeuC)およびiii)N-アセチルノイラミン酸シチジリルトランスフェラーゼ(NeuA)をコードするカンピロバクター・ジェジュニATCC43484(上記参照)由来の3つの遺伝子の共発現により、糖ヌクレオチドドナーCMP-Neu5Acのプールを細胞の細胞質に生成させた。neuBCA遺伝子産物は、内因性UDP-GlcNAcからCMP-Neu5Acへの酵素変換において共同して機能する。neuBCA遺伝子は、プラスミド発現ベクター上のbst遺伝子の下流から、pLプロモーターから駆動されるよう、オペロン内で共発現される。加えて、CMP-Neu5Acを生成するために使用されるNeu5Acの分解を防ぐため、シアル酸分解に関与する酵素をコードする内因性宿主細胞遺伝子を、λred組み換えを用いて個別に欠失させた。大腸菌におけるシアル酸異化経路は、nanRATEK遺伝子からなるnanオペロンによってコードされる(Hopkins, A.P., et al. (2013). FEMS Microbiol Lett 347, 14-22)。特に、細胞内のCMP-Neu5Acプールを安定化させるため、nanATE遺伝子を欠失させた。
【0164】
SL生産株の他の態様において、thyA(チミジル酸シンターゼ)変異を、このthyA遺伝子をほぼすべて欠失させ、それを、弱リボソーム結合部位を有する、挿入された、機能的な野生型であるがプロモーターを有さない大腸菌lacZ+遺伝子で置き換えることによって、菌株に導入した(ΔthyA::0.8RBS lacZ+)。この染色体改変は、λred組み換えを用いて行った。外因性チミジンの非存在下で、thyA株は、DNAを生成することができず、死滅する。この欠陥は、多コピープラスミド上の野生型thyA遺伝子を供給することによってイントランスで補完され得る(Belfort, M., et al. (1983). Proc Natl Acad Sci U S A 80, 1858-861)。この補完スキームを、プラスミド維持の手段として使用した。
【0165】
さらに、挿入された0.8RBS lacZ+カセットは、thyAをノックアウトするだけでなく、lacZ-宿主をlacZ+遺伝子型および表現型の両方に戻すよう変換する。改変株は、バイオリアクタ生成過程でシアリルラクトース生産にほとんど影響を有さないが、この過程の終了時に残留ラクトースを除去するのに、およびP1ファージ形質導入による他のlacZ-大腸菌株へのthyA領域の移動における容易にスコア付け可能な表現型マーカーとして有用である、最小(であるがそれでもなお容易に検出可能な)レベルのβ-ガラクトシダーゼ活性(0.3単位)を示した。
【0166】
ST候補遺伝子を試験するのに使用した最終株(E1406)は、以下の遺伝子型:
PlacIq-lacY, Δ(lacI-lacZ), ΔlacA, ΔthyA::(0.8RBS lacZ+), ampC::(Ptrp M13g8 RBS-λcI+, CAT), ΔnanATE::scar
を有していた。
【0167】
異なるST(bst)候補発現プラスミドを有するこの菌株の形質転換体を、以下の配合の6 mLのIMC培地(「Induction Medium Casamino acids」)(その全内容が参照により本明細書に組み入れられるLaVallie, E.R., DiBlasio, E.A., Kovacic, S., Grant, K.L., Schendel, P.F., and McCoy, J.M. (1993) A thioredoxin gene fusion expression system that circumvents inclusion body formation in the E. coli cytoplasm. Biotechnology (NY) 11, 187-193)を含む20x150mm試験管においてシアリルラクトースを合成する能力について評価した:
Na2HPO4 = 6g/L
KH2PO4 = 3g/L
NaCl = 0.5g/L
NH4Cl = 1g/L
1mM MgSO4
0.1mM CaCl2
0.5%グルコースw/v
0.4%カザミノ酸(Difco technical)。
【0168】
いくつかの態様において、グルコースおよび/またはカザミノ酸濃度を、0.05~1%範囲で変更した。
【0169】
細胞成長発現および特徴づけ
個々の候補bst+neuBCA発現プラスミドで形質転換されたE1406を含む菌株を試験管に0.1 OD600/mLになるよう接種し、ついでローラードラムで継続的なエアレーションを行いつつ、30℃で120分間インキュベートした。ついで、培養物に200μg/mLの濃度までトリプトファンを添加してbst遺伝子およびneuBCAオペロン発現を誘導し、同時にアクセプター糖としてラクトースを1%w/vの濃度まで添加した。この培養物を、ローラードラムでエアレーションを行いつつ、30℃で22時間置いた。この期間の最後に、各培養物からの20 OD600の細胞を遠心分離(14,000 x g、1分間)によりペレット化し、200μlの水で再懸濁し、10分間、98℃に加熱して細胞質の糖を放出させた。遠心分離により懸濁物を浄化した後、2μlのアリコートを10x20cmアルミニウム裏張りシリカ薄層クロマトグラフィープレート(Machery-Nagel#818163)にアプライした。クロマトグラムをn-ブタノール/酢酸/水(2:1:1)中で現像し、12%H2SO4/80%エタノール/8%水中3% w/v α-ナフトールを噴霧した後に加熱により可視化させた。図5は、その結果を示している。
【0170】
細胞内ラクトースプールに対応する濃いスポットが、対照株(bst+neuBCA発現プラスミドを含まない、E1406)において観察され、またすべてのbst候補培養物においても観察された。E1406対照は、シアリルラクトースに対応するスポットを示さず、一方すべての他の培養物は、6'-SLおよび3'-SLの混合物を含むシアリルラクトース標準と平行移動するスポットを示した(これらの種は、このTLCシステムにおいて相互から分解されなかった)。候補遺伝子bstDおよびbstJを発現する培養物は示されていない。これらのいずれも、検出可能なシアリルラクトースを生産せず、したがってこれらの遺伝子は、データベーススクリーニングにおける「偽陽性ヒット」である可能性が非常に高い。
【0171】
候補のいくつかにおいて、シアリルラクトースよりも上まで進んだスポットが存在することが、図5において注目される。このスポットは、KDO-ラクトースに対応し、本明細書に記載されるCMP-Neu5Acの改変されたプールの代わりにCMP-KDOの内因性大腸菌プールを利用する個々のbst酵素により示される弛緩した基質特異性の結果としての、大腸菌リポ多糖前駆体2-ケト-3デオキシオクツロソン酸(KDO)とラクトースの連結から生じたものである。図5で観察できるように、(Drouillard, S., et al. (2010). Carbohydr Res 345, 1394-99の文献から予想されるように)Pst6-224は、望まれないKDO-ラクトース産物を生成した。しかし、bst候補のいくつかは、同じ培養条件下で、存在したとしてもわずかなKDO-ラクトースしか生産せず(例えば、BstE、BstM、BstN)、これによりシアリルオリゴ糖のより純粋な調製物の生産におけるこれらの酵素の有用性が強調される。
【0172】
シアリル-アクセプター糖結合特異性の同定
HPLCを通じた特徴づけおよび同定
そのアミノ酸配列をデータベーススクリーニング用のプローブとして使用したST酵素Pst6-224およびHAC1268は、以前に生化学的に特徴づけられており、α2,6シアリルトランスフェラーゼであることが公知となっている(Drouillard, S., et al. (2010). Carbohydr Res 345, 1394-99, Schur, M.J., et al. (2012). Glycobiology 22, 997-1006)。しかし、本発明の候補bst酵素のシアリル-アクセプター糖結合特異性(すなわち、α(2,3)またはα(2,6))は未知であった。それらのシアリル-アクセプター糖結合特異性を見出すために、上記のTLCにより分析された同じ細胞質抽出物(図5)を、6'-SLと3'-SLを分解することができるHPLCシステムを利用しても分析した。熱抽出サンプル(上記)は、リン酸カリウム(pH 4)中15 mMおよびアセトニトリル中60%とした。ついでそれらをTSKgel Amide-80カラム(5μm粒子サイズ、4.6x250 mm)にアプライし、67%アセトニトリル/15 mMリン酸カリウム、pH 4.0、1 mL/分、60℃の無勾配条件下で溶出させつつ、210 nmでUV検出を行った。図6A、6Bおよび6Cは、様々な熱抽出物についてのHPLC実施からのUVトレースを示している。このシステムにおいて、3'-SLは、約8.8分で溶出し、6'-SLは約10.1分で溶出した。データを表3に示す。
【0173】
(表3)新しいbst酵素で見いだされたシアリル-アクセプター糖結合特異性の概要
【0174】
NMRを通じた特徴づけおよび同定
BstMおよびBstN酵素を用いて生産されたSL(6'-SL)の構造に関して、NMR(核磁気共鳴)分光法を通じた二次的確認を行った。
【0175】
SLの大規模生産
この目的で、および分析のために十分なSLを生産するため、それぞれBstMまたはBstN発現プラスミド(すなわち、pG549、SEQ ID NO:12またはpG543、SEQ ID NO:11)のいずれかを有するE1406株の派生株において2L発酵を行った。菌株を、種培養物を生成するよう初期指数関数期までFerm4aミネラル培地中で成長させた。
【0176】
Ferm4a培地の組成物は以下を含む(リットルあたり)
4g (NH4)2HPO4
10g KH2PO4
0.25g MgSO4・7H2O
0.4g NaOH
17gグルコース
(必要に応じて追加のNaOHによりpH6.8に調整)
【0177】
ついで、この種培養物の一部を、900 mLの同じ培地(しかし追加の0.75 g/L MgSO4・7H2O、1mLのDF204消泡剤および10mLの微量金属溶液を含む)を含む2Lバイオリアクタに接種した。
【0178】
微量金属溶液は以下を含む(リットルあたり)
13.4g NTA(ニトリロ三酢酸)
5g FeSO4・7H2O
0.85g MnCl2・4H2O
0.9g ZnSO4・7H2O
0.14g CoCl2・6H2O
0.085g CuCl2・2H2O
0.17g H3BO3
0.09g Na2MoO4・2H2O
【0179】
接種後の発酵容器内での細胞の光学密度は、600 nm(OD600)で0.006であった。
【0180】
菌株を、30℃、pH 6.8へのpH制御(7.4M NH4OHの添加により自動調節)の下、およそ16時間、バッチモードで発酵槽内で成長させ、この時点で、溶解酸素レベルの増加および撹拌速度の低下により示されるように、グルコースの枯渇が起こった。その後、培養物が炭素制限下で維持されるよう、フェドバッチ連続グルコース供給レジメンを開始した(9.1 gの50%w/vグルコース供給溶液/時間)。2時間後、45.5gの11.4% w/vラクトース溶液のボーラスを添加し、2.2g/hの同じ溶液の連続ラクトース供給を開始した。同時に、bst発現を開始させるため、41.2gの2% w/vトリプトファン溶液のボーラスを添加した。このボーラスを、さらに70時間継続した後続のフェドバッチ発酵期の間に、24時間間隔で2回以上繰り返し、この間、最初に毎分0.18標準リットルの通気を行う空気増加カスケードへの撹拌を用いて溶解酸素の50%飽和を維持した。光学密度は、発酵終了時に約120 OD600であった。収集時、1M CaCl2ストック溶液の添加により、総発酵ブロスを80 mM CaCl2に調節し、4℃で一晩静置した後、4,000xgで1時間の遠心分離により浄化した。
【0181】
NMR分析
ついで、浄化された培養上清の一部を、以下のプロトコルを用いるNMR分析用のシアリルラクトースサンプルの精製に使用した:
1. pH 2に達する浄化したCaCl2処理ブロスへの固形Amberlite IR120[H+型]の添加によりカチオンを除去した(かつタンパク質を沈降させた)。
2. 処理した上清を遠心分離により浄化した。その後、pH6に達するまでDowex 66樹脂[遊離塩基型]を添加することにより、強酸を除去した。再度、遠心分離により浄化した。
3. Dowex 1x4、200~400メッシュカラム[HCO3 -型]に投入した。SLはこのカラムに結合する。
4. カラムを水で洗浄した。
5. 0.1M NaHCO3を用いてカラムからSLを溶出させた。
6. pH 3に達するようAmberlite IR120[H+型]を添加することによりシアリルラクトース溶出液からNa+を除去した。
7. NaOHを用いてSL溶液をpH 6に調整し、ロータリーエバポレートし、その後に凍結乾燥により乾燥させた。
【0182】
図7は、Dowex 1x4カラムからの画分の典型的な薄層クロマトグラムを示している。典型的に、画分3が最も純粋な画分であり、脱塩後、NMR分析に適するものであった。
【0183】
BstM(BstM-SL)およびBstN(BstN-SL)によって生産されたSLサンプルの1D 1H NMRスペクトル(それぞれ、図8および図9)は、3つのアノマーシグナル:両方とも還元末端Glcpに起因する、δ5.22(A)、δ4.66(B)、およびβGalp残基に割り当てられたδ4.42(C)、を示した(表4)。異核間多結合相関(HMBC)スペクトルにおいて、δH4.42/δc80.8で観察された交差ピークは、βGalp(C)が還元末端Glcp(A、B)の4位に連結されることを示した。異核種単一量子コヒーレンス(HSQC)スペクトルにおいて、β-GalpのC-6(δ64.7)について観察された低磁場シフトは、残基Cが6置換されていることを示した。HMBCスペクトルにおいて、(β-GalのH-6およびα-Neu5NAcのC-2の間の)δH3.59、3.96/δc101.5で観察された交差ピークは、末端αNeu5NAc(D)がβ-Gal(C)の6位に連結されることを示した。
【0184】
(表4)6'-シアリルラクトースおよび6'KDOラクトースの化学シフトの割当て
【0185】
2D NMRデータを考慮すると、両方のサンプルに存在する主な化合物は、6'-シアリルラクトースであった。両方のサンプルにおいて微量レベルのKDO-ラクトースも見いだされた。
【0186】
α(2,3)からα(2,6)選択性にBstCおよびBstEの位置選択性を変更する酵素の改変
酵素BstC、BstE、BstHおよびBstIを含む、上記スクリーニングから選択および試験したbst候補のいくつかは、α(2,6)選択性ではなくα(2,3)選択性であった。α(2,3)からα(2,6)選択性にBstCおよびBstEの位置選択性を変更する酵素可変戦略を調査した(Schmolzer, K., et al. (2015). Chem Commun (Camb) 51, 3083-86; Schmolzer, K., et al. (2013). Glycobiology 23, 1293-1304)。パスツレラ・ダグマティス(Pasteurella dagmatis)由来のシアリルトランスフェラーゼ(PdST、アクセッション番号WP005762792.1、SEQ ID NO:13)は、精製されそしてラクトースおよびCMP-Neu5Ac前駆体からのSL形成を触媒するようインビトロで使用されたとき、α(2,3)選択的活性を示すことが示された(Schmolzer, K., et al. (2015). Chem Commun (Camb) 51, 3083-86)。同じグループによるその後の研究は、PdSTのアクセプター結合部位内の特定のアミノ酸の構造を誘導する置換がこの酵素の位置選択性をα(2,3)選択性からα(2,6)選択性に完全に切り替えることを示した。詳細に、PdST配列におけるP7HおよびM117Aの二重変異は、インビトロでPdSTをα(2,3)選択的STからα(2,6)選択的STに変換する効果を有した(Schmolzer, K., et al. (2013). Glycobiology 23, 1293-1304)。
【0187】
何らかの科学的学説に拘束されるものではないが、本発明においてbst酵素のアクセプター結合部位に導入された構造的に等価な変異は、位置選択性に関して同様の切り替えをもたらし得る。2つの候補Δ20BstCおよびBstEを、このアプローチの調査のために選択した。この目的で、適当なコドン変化を組み込んだΔ20bstCおよびbstE合成遺伝子(本明細書中以降、Δ20bstC*およびbstE*と称される)を、インビトロでgBlockオリゴヌクレオチドからGibson Assembly法によって合成し、標準的な分子生物学技術によって大腸菌発現プラスミドにクローニングした。図10は、野生型PdST、Δ20BstCおよびBstE Δα(2,3)シアリルトランスフェラーゼのアラインメントである。PdST*(SEQ ID NO:14、位置選択性がα(2,3)からα(2,6)に切り替えられたことが公知の公開された変異体)、本明細書において設計および試験された変異体であるΔ20BstC*(SEQ ID NO:15)およびBstE*(SEQ ID NO:16)と命名された3つの酵素の変異形態も、このアラインメントに示されている。変異領域は、このアラインメントにおいて、黒色の星により示され、変異残基は、小文字で示されている。詳細に、アミノ酸置換Y7HおよびG122AをΔ20BstC配列に導入してΔ20BstC*を生成し、Y13HおよびE128AをBstE配列に導入してBstE*を生成した。
【0188】
Δ20bstC*(pG544、SEQ ID NO:17)およびbstE*発現プラスミドにより、改変された大腸菌生産宿主を形質転換した。菌株を30℃で初期指数関数期までIMC培地中で成長させ、その後にトリプトファン(200 mg/mL)およびラクトース(1%)を同時に添加し、SL生合成を開始させた。合成期間(24時間)の最後に、等しいOD600単位の各菌株を収集し、細胞内SLを放出する98℃で10分間の加熱および遠心分離によって細胞溶解産物を調製した。その後、改変されたΔ20BstC*またはBstE*が3'-SLではなく6'-SLの合成を触媒することができるかどうかを分析するため、合成されたSLを含む溶解産物を、シアリダーゼS(α(2,3)連結Neu5Acに特異的)またはシアリダーゼC(α(2,3)またはα(2,6)連結Neu5Acの両方に対して作用する)で処理した。
【0189】
図11に示されるように、BstE*産生細胞により合成されたSLは、シアリダーゼSおよびシアリダーゼCの両方により効率的にラクトースに変換された。この結果は、BstE*が依然としてもっぱらα(2,3)選択的である活性を有していること、および予想されたように、導入された変異がこの酵素の位置選択性を変更しなかったことを示している。しかし、全く対照的に、Δ20BstC*によって合成されたSLは、シアリダーゼCによる消化に対する感受性を維持していたが、シアリダーゼS処理に対しては高い耐性を有するようであった。この結果は、Δ20BstC*の位置選択性がα(2,3)からα(2,6)に首尾よく変更されたこと、および改変された酵素が生産株において主として3'-SLではなく6'-SL合成を触媒したことを示している。
【0190】
ついで、Δ20BstC*発現株によって合成されたSLを精製し、その正体および純度を確認するため、NMR分光分析に供した。図12は、Δ20BstC*によって生産されたSLの1DプロトンNMRスペクトルを示している。このスペクトルの独特の特徴は、4つの別個のアノマーピークおよびシアル酸のアキシャルおよびエクアトリアルH-3の高磁場シグナルであった。後者は、約5:1の比の2つの別個のシグナルの対からなるものであった。拡張2D NMR分析(図13)は、大きい方のシグナルが6'-シアリルラクトースに属し、小さい方が混在する3'-シアリルラクトースの一部であったことを示した。これらの2つの成分の化学シフトの割当てが表5に示されている。この分析は、Δ20BstC*によって合成されたSLが84%の6'-SLおよび16%の3'-SLの混合物から構成されていたことを明らかにした。したがって、Δ20BstC*アクセプター結合部位へのY7H-G122A変異の導入は、この酵素の位置選択性を、α(2,6)Neu5Ac結合の形成へと強く傾け、Δ20BstC*を生産する株が、主として3'-SLではなく6'-SLを合成できるようにした。
【0191】
驚くべきことに、改変されたΔ20BstC*変異タンパク質は、大腸菌においてシアリルラクトースを生産するために使用されたとき、その野生型の親であるΔ20BstCよりもずっと少ないKDO-ラクトースを生成する(図5を参照のこと)。Δ20BstC*を生成するようΔ20BstCに導入された活性部位変異Y7HおよびG122Aは、α(2,3)からα(2,6)への位置特異性性の切り替えをもたらすだけでなく、基質としてCMP-KDOを利用するこの酵素の能力を低下させ、それによってより純粋なシアリルラクトース生産プロフィールをもたらす。
【0192】
Δ20BstC * のα(2,6)位置選択性をさらに改善する酵素の改変
新しい酵素変種Δ20BstC*の位置選択性を改善するため、さらなる酵素改変戦略を調査した(Guo, Y. et al (2015) Enzyme and Microbial Technology 78, 54-62; McArthur, B. et al. (2017) Organic & Biomolecular Chemistry 15, 1700-1709)。パスツレラ・マルトシダ(Pasteurella multocida)由来のシアリルトランスフェラーゼの二重変異体P34H/M144L(PmST1、アクセッション番号AAY89061)は、この酵素の位置選択性を、3.9%から98.7%α(2,6)選択的に増加させることが見い出された。Δ20BstC*のアミノ酸配列の122位における構造的に等価なアミノ酸置換は、この酵素のα(2,6)位置選択性を改善するであろう。詳細に、アミノ酸置換A122V、A122L、A122MおよびA122FをΔ20BstC*に導入し、それぞれ、Δ20BstC*2(SEQ ID NO:27)、Δ20BstC*3(SEQ ID NO:28)、Δ20BstC*4(SEQ ID NO:29)およびΔ20BstC*5(SEQ ID NO:30)を生成した。
【0193】
Δ20BstC*2、Δ20BstC*3、Δ20BstC*4およびΔ20BstC*5発現プラスミドにより、改変された大腸菌生産宿主を形質転換した。菌株を30℃で初期指数関数期までFerm 4a培地中で成長させ、その後にトリプトファン(200 mg/mL)およびラクトース(1%)を同時に添加し、SL生合成を開始させた。合成期間(24時間)の最後に、等しいOD600単位の各菌株を収集し、細胞内SLを放出させる98℃で10分間の加熱および遠心分離によって細胞溶解産物を調製した。この熱抽出物のTLC分析は、SLの合成を示し、また同様に、Δ20BstC*で観察されたような減少したまたは無視できる程度のKDO-ラクトース生産を示し、これは、ネイティブ野生型酵素Δ20BstCで観察されたKDO-ラクトース合成のレベルと対照的であった(図5)。
【0194】
6'SL対3'SL比を決定するため、様々な変異Δ20BstC*株を収集し、70%アセトニトリル中5 mMリン酸カリウム(pH 4.0)を用いて抽出し、6'-SLと3'-SLを分解することができるHPLCシステムを用いて分析した。(上記の)抽出されたサンプルをTSKgel Amide-80カラム(5μm粒子サイズ、4.6x250 mm)にアプライし、70%アセトニトリル中5 mMリン酸カリウム(pH 4.0)、1 mL/分、室温での無勾配条件下で溶出させつつ、210 nmでUV検出を行った。
【0195】
図16は、様々な抽出物についていの例示的なHPLCを示している。このシステムにおいて、3'SLは約15.5分で溶出し、6'SLは約18.3分で溶出した。データを表5に示す。この分析は、A122F、A122M、A122LおよびA122Vの変異が、Δ20BstC*と比較して、α(2,6)位置選択性を、それぞれ、約2%、4%、6%および8%増加させたことを明らかにした。
【0196】
表5は、Δ20BstC*変異体の位置選択性のHPLC分析を示している。
【0197】
(表5)
【0198】
シアル化オリゴ糖の生産に使用するためのシアリルトランスフェラーゼ
まとめると、野生型Δ20BstCは、本明細書に記載される改変された大腸菌株において3'-SLを生産したラクトース利用性α(2,3)シアリルトランスフェラーゼである。この酵素は、各々変更された位置選択性を有する新しい酵素変種である、6'-SL:3'-SLの85:15、94:6、92:8、90:10および89:9混合物を合成する、それぞれ、Δ20BstC*、Δ20BstC*2、Δ20BstC*3、Δ20BstC*4およびΔ20BstC*5を生成する2つの特定の活性部位変異を導入することによって改変された。これらの酵素変種は、ヒトミルクの主要なシアル化hMOS(Bao, Y., Zhu, L., and Newburg, D.S. (2007) Anal Biochem 370, 206-214)の2つを予想可能な比で生産しつつ、減少した量のKDO-ラクトースを生成する能力を有していた。1回の生物発酵過程で2つのシアリルラクトース種を生産する能力は、2つの別々の発酵よりも製造時間および費用の点で大きな利点を提供し得る。
【0199】
配列情報
SEQUENCE LISTING
<110> Glycosyn LLC
<120> SIALYLTRANSFERASES AND USES THEREOF
<150> US 62/599,481
<151> 2017-12-15
<160> 30
<170> PatentIn version 3.5

<210> 1
<211> 514
<212> PRT
<213> Photobacterium sp.
<400> 1
Met Lys Asn Phe Leu Leu Leu Thr Leu Ile Leu Leu Thr Ala Cys Asn
1 5 10 15
Asn Ser Glu Glu Asn Thr Gln Ser Ile Ile Lys Asn Asp Ile Asn Lys
20 25 30
Thr Ile Ile Asp Glu Glu Tyr Val Asn Leu Glu Pro Ile Asn Gln Ser
35 40 45
Asn Ile Ser Phe Thr Lys His Ser Trp Val Gln Thr Cys Gly Thr Gln
50 55 60
Gln Leu Leu Thr Glu Gln Asn Lys Glu Ser Ile Ser Leu Ser Val Val
65 70 75 80
Ala Pro Arg Leu Asp Asp Asp Glu Lys Tyr Cys Phe Asp Phe Asn Gly
85 90 95
Val Ser Asn Lys Gly Glu Lys Tyr Ile Thr Lys Val Thr Leu Asn Val
100 105 110
Val Ala Pro Ser Leu Glu Val Tyr Val Asp His Ala Ser Leu Pro Thr
115 120 125
Leu Gln Gln Leu Met Asp Ile Ile Lys Ser Glu Glu Glu Asn Pro Thr
130 135 140
Ala Gln Arg Tyr Ile Ala Trp Gly Arg Ile Val Pro Thr Asp Glu Gln
145 150 155 160
Met Lys Glu Leu Asn Ile Thr Ser Phe Ala Leu Ile Asn Asn His Thr
165 170 175
Pro Ala Asp Leu Val Gln Glu Ile Val Lys Gln Ala Gln Thr Lys His
180 185 190
Arg Leu Asn Val Lys Leu Ser Ser Asn Thr Ala His Ser Phe Asp Asn
195 200 205
Leu Val Pro Ile Leu Lys Glu Leu Asn Ser Phe Asn Asn Val Thr Val
210 215 220
Thr Asn Ile Asp Leu Tyr Asp Asp Gly Ser Ala Glu Tyr Val Asn Leu
225 230 235 240
Tyr Asn Trp Arg Asp Thr Leu Asn Lys Thr Asp Asn Leu Lys Ile Gly
245 250 255
Lys Asp Tyr Leu Glu Asp Val Ile Asn Gly Ile Asn Glu Asp Thr Ser
260 265 270
Asn Thr Gly Thr Ser Ser Val Tyr Asn Trp Gln Lys Leu Tyr Pro Ala
275 280 285
Asn Tyr His Phe Leu Arg Lys Asp Tyr Leu Thr Leu Glu Pro Ser Leu
290 295 300
His Glu Leu Arg Asp Tyr Ile Gly Asp Ser Leu Lys Gln Met Gln Trp
305 310 315 320
Asp Gly Phe Lys Lys Phe Asn Ser Lys Gln Gln Glu Leu Phe Leu Ser
325 330 335
Ile Val Asn Phe Asp Lys Gln Lys Leu Gln Asn Glu Tyr Asn Ser Ser
340 345 350
Asn Leu Pro Asn Phe Val Phe Thr Gly Thr Thr Val Trp Ala Gly Asn
355 360 365
His Glu Arg Glu Tyr Tyr Ala Lys Gln Gln Ile Asn Val Ile Asn Asn
370 375 380
Ala Ile Asn Glu Ser Ser Pro His Tyr Leu Gly Asn Ser Tyr Asp Leu
385 390 395 400
Phe Phe Lys Gly His Pro Gly Gly Gly Ile Ile Asn Thr Leu Ile Met
405 410 415
Gln Asn Tyr Pro Ser Met Val Asp Ile Pro Ser Lys Ile Ser Phe Glu
420 425 430
Val Leu Met Met Thr Asp Met Leu Pro Asp Ala Val Ala Gly Ile Ala
435 440 445
Ser Ser Leu Tyr Phe Thr Ile Pro Ala Glu Lys Ile Lys Phe Ile Val
450 455 460
Phe Thr Ser Thr Glu Thr Ile Thr Asp Arg Glu Thr Ala Leu Arg Ser
465 470 475 480
Pro Leu Val Gln Val Met Ile Lys Leu Gly Ile Val Lys Glu Glu Asn
485 490 495
Val Leu Phe Trp Ala Asp Leu Pro Asn Cys Glu Thr Gly Val Cys Ile
500 505 510
Ala Val

<210> 2
<211> 417
<212> PRT
<213> Avibacterium paragallinarum
<400> 2
Met Arg Lys Ile Ile Thr Phe Phe Ser Leu Phe Phe Ser Ile Ser Ala
1 5 10 15
Trp Cys Gln Lys Met Glu Ile Tyr Leu Asp Tyr Ala Ser Leu Pro Ser
20 25 30
Leu Asn Met Ile Leu Asn Leu Val Glu Asn Lys Asn Asn Glu Lys Val
35 40 45
Glu Arg Ile Ile Gly Phe Glu Arg Phe Asp Phe Asn Lys Glu Ile Leu
50 55 60
Asn Ser Phe Ser Lys Glu Arg Ile Glu Phe Ser Lys Val Ser Ile Leu
65 70 75 80
Asp Ile Lys Glu Phe Ser Asp Lys Leu Tyr Leu Asn Ile Glu Lys Ser
85 90 95
Asp Thr Pro Val Asp Leu Ile Ile His Thr Asn Leu Asp His Ser Val
100 105 110
Arg Ser Leu Leu Ser Ile Phe Lys Thr Leu Ser Pro Leu Phe His Lys
115 120 125
Ile Asn Ile Glu Lys Leu Tyr Leu Tyr Asp Asp Gly Ser Gly Asn Tyr
130 135 140
Val Asp Leu Tyr Gln His Arg Gln Glu Asn Ile Ser Ala Ile Leu Ile
145 150 155 160
Glu Ala Gln Lys Lys Leu Lys Asp Ala Leu Glu Asn Arg Glu Thr Asp
165 170 175
Thr Asp Lys Leu His Ser Leu Thr Arg Tyr Thr Trp His Lys Ile Phe
180 185 190
Pro Thr Glu Tyr Ile Leu Leu Arg Pro Asp Tyr Leu Asp Ile Asp Glu
195 200 205
Lys Met Gln Pro Leu Lys His Phe Leu Ser Asp Thr Ile Val Ser Met
210 215 220
Asp Leu Ser Arg Phe Ser His Phe Ser Lys Asn Gln Lys Glu Leu Phe
225 230 235 240
Leu Lys Ile Thr His Phe Asp Gln Asn Ile Phe Asn Glu Leu Asn Ile
245 250 255
Gly Thr Lys Asn Lys Glu Tyr Lys Thr Phe Ile Phe Thr Gly Thr Thr
260 265 270
Thr Trp Glu Lys Asp Lys Lys Lys Arg Leu Asn Asn Ala Lys Leu Gln
275 280 285
Thr Glu Ile Leu Glu Ser Phe Ile Lys Pro Asn Gly Lys Phe Tyr Leu
290 295 300
Gly Asn Asp Ile Lys Ile Phe Phe Lys Gly His Pro Lys Gly Asp Asp
305 310 315 320
Ile Asn Asp Tyr Ile Ile Arg Lys Thr Gly Ala Glu Lys Ile Pro Ala
325 330 335
Asn Ile Pro Phe Glu Val Leu Met Met Thr Asn Ser Leu Pro Asp Tyr
340 345 350
Val Gly Gly Ile Met Ser Thr Val Tyr Phe Ser Leu Pro Pro Lys Asn
355 360 365
Ile Asp Lys Val Val Phe Leu Gly Ser Glu Lys Ile Lys Asn Glu Asn
370 375 380
Asp Ala Lys Ser Gln Thr Leu Ser Lys Leu Met Leu Met Leu Asn Val
385 390 395 400
Ile Thr Pro Glu Gln Ile Phe Phe Glu Glu Met Pro Asn Pro Ile Asn
405 410 415
Phe

<210> 3
<211> 264
<212> PRT
<213> Actinobacillus ureae
<400> 3
Met Phe Lys Ile Lys Ser Tyr Gly Lys Asn Pro Gln Leu Gln Ala Val
1 5 10 15
Asp Ile Tyr Ile Asp Phe Ala Thr Ile Pro Ser Leu Ser Tyr Phe Leu
20 25 30
His Phe Leu Lys His Lys His Asp His Gln Arg Leu Arg Leu Phe Ser
35 40 45
Leu Ala Arg Phe Glu Met Pro Gln Thr Val Ile Glu Gln Tyr Glu Gly
50 55 60
Ile Ile Gln Phe Ser Arg Asn Val Glu His Asn Val Glu Pro Leu Leu
65 70 75 80
Glu Gln Leu Gln Thr Ile Leu Ser Gln Glu Gly Lys Gln Phe Glu Leu
85 90 95
His Leu His Leu Asn Leu Phe His Ser Phe Glu Met Phe Leu Asn Leu
100 105 110
Ser Pro Thr Tyr Thr Lys Tyr Lys Glu Lys Ile Ser Lys Ile Val Leu
115 120 125
His Leu Tyr Asp Asp Gly Ser Glu Gly Val Met Lys Gln Tyr Gln Leu
130 135 140
Gln Lys Ser Ser Ser Leu Val Gln Asp Leu Ala Ala Thr Lys Ala Ser
145 150 155 160
Leu Val Ser Leu Phe Glu Asn Gly Glu Gly Ser Phe Ser Gln Ile Asp
165 170 175
Leu Ile Arg Tyr Val Trp Asn Ala Val Leu Glu Thr His Tyr Tyr Leu
180 185 190
Leu Ser Asp His Phe Leu Leu Asp Glu Lys Leu Gln Pro Leu Lys Ala
195 200 205
Glu Leu Gly His Tyr Gln Leu Leu Asn Leu Ser Thr Tyr Gln Tyr Leu
210 215 220
Ser Ser Glu Asp Leu Leu Trp Leu Lys Gln Ile Leu Lys Ile Asp Ala
225 230 235 240
Glu Leu Glu Ser Leu Met Gln Lys Leu Thr Ala Gln Pro Val Tyr Phe
245 250 255
Phe Ser Gly Thr Thr Phe Leu Gly
260

<210> 4
<211> 399
<212> PRT
<213> Haemophilus ducreyi
<400> 4
Met Leu Ile Gln Gln Asn Leu Glu Ile Tyr Leu Asp Tyr Ala Thr Ile
1 5 10 15
Pro Ser Leu Ala Cys Phe Met His Phe Ile Gln His Lys Asp Asp Val
20 25 30
Asp Ser Ile Arg Leu Phe Gly Leu Ala Arg Phe Asp Ile Pro Gln Ser
35 40 45
Ile Ile Asp Arg Tyr Pro Ala Asn His Leu Phe Tyr His Asn Ile Asp
50 55 60
Asn Arg Asp Leu Thr Ala Val Leu Asn Gln Leu Ala Asp Ile Leu Ala
65 70 75 80
Gln Glu Asn Lys Arg Phe Gln Ile Asn Leu His Leu Asn Leu Phe His
85 90 95
Ser Ile Asp Leu Phe Phe Ala Ile Tyr Pro Ile Tyr Gln Gln Tyr Gln
100 105 110
His Lys Ile Ser Thr Ile Gln Leu Gln Leu Tyr Asp Asp Gly Ser Glu
115 120 125
Gly Ile Val Thr Gln His Ser Leu Cys Lys Ile Ala Asp Leu Glu Gln
130 135 140
Leu Ile Leu Gln His Lys Asn Val Leu Leu Glu Leu Leu Thr Lys Gly
145 150 155 160
Thr Ala Asn Val Pro Asn Pro Thr Leu Leu Arg Tyr Leu Trp Asn Asn
165 170 175
Ile Ile Asp Ser Gln Phe His Leu Ile Ser Asp His Phe Leu Gln His
180 185 190
Pro Lys Leu Gln Pro Leu Lys Arg Leu Leu Lys Arg Tyr Thr Ile Leu
195 200 205
Asp Phe Thr Cys Tyr Pro Arg Phe Asn Ala Glu Gln Lys Gln Leu Leu
210 215 220
Lys Glu Ile Leu His Ile Ser Asn Glu Leu Glu Asn Leu Leu Lys Leu
225 230 235 240
Leu Lys Gln His Asn Thr Phe Leu Phe Thr Gly Thr Thr Ala Phe Asn
245 250 255
Leu Asp Gln Glu Lys Leu Asp Leu Leu Thr Gln Leu His Ile Leu Leu
260 265 270
Leu Asn Glu His Gln Asn Pro His Ser Thr His Tyr Ile Gly Asn Asn
275 280 285
Tyr Leu Leu Leu Ile Lys Gly His Ala Asn Ser Pro Ala Leu Asn His
290 295 300
Thr Leu Ala Leu His Phe Pro Asp Ala Ile Phe Leu Pro Ala Asn Ile
305 310 315 320
Pro Phe Glu Ile Phe Ala Met Leu Gly Phe Thr Pro Asn Lys Met Gly
325 330 335
Gly Phe Ala Ser Thr Ser Tyr Ile Asn Tyr Pro Thr Glu Asn Ile Asn
340 345 350
His Leu Phe Phe Leu Thr Ser Asp Gln Pro Ser Ile Arg Thr Lys Trp
355 360 365
Leu Asp Tyr Glu Lys Gln Phe Gly Leu Met Tyr Ser Leu Leu Ala Met
370 375 380
Gln Lys Ile Asn Glu Asp Gln Ala Phe Met Cys Thr Ile His Asn
385 390 395

<210> 5
<211> 498
<212> PRT
<213> Alistipes (multi species)
<400> 5
Met Lys Arg Leu Phe Arg Leu Phe Leu Cys Leu Ala Leu Leu Ser Gly
1 5 10 15
Thr Ala Ala Cys Ser Asp Asp Glu Val Ser Gln Asn Leu Ile Val Ile
20 25 30
Asn Gly Gly Glu His Phe Leu Ser Leu Asp Gly Leu Ala Arg Ala Gly
35 40 45
Lys Ile Ser Val Leu Ala Pro Ala Pro Trp Arg Val Thr Lys Ala Ala
50 55 60
Gly Asp Thr Trp Phe Arg Leu Ser Ala Thr Glu Gly Pro Ala Gly Tyr
65 70 75 80
Ser Glu Val Glu Leu Ser Leu Asp Glu Asn Pro Gly Ala Ala Arg Ser
85 90 95
Ala Gln Leu Ala Phe Ala Cys Gly Asp Ala Ile Val Pro Phe Arg Leu
100 105 110
Ser Gln Gly Ala Leu Ser Ala Gly Tyr Asp Ser Pro Asp Tyr Tyr Phe
115 120 125
Tyr Val Thr Phe Gly Thr Met Pro Thr Leu Tyr Ala Gly Ile His Leu
130 135 140
Leu Ser His Asp Lys Pro Gly Tyr Val Phe Tyr Ser Arg Ser Lys Thr
145 150 155 160
Phe Asp Pro Ala Glu Phe Pro Ala Arg Ala Glu Val Thr Thr Ala Ala
165 170 175
Asp Arg Thr Ala Asp Ala Thr Gln Ala Glu Met Glu Ala Met Ala Arg
180 185 190
Glu Met Lys Arg Arg Ile Leu Glu Ile Asn Ser Ala Asp Pro Thr Ala
195 200 205
Val Phe Gly Leu Tyr Val Asp Asp Leu Arg Cys Arg Ile Gly Tyr Asp
210 215 220
Trp Phe Val Ala Gln Gly Ile Asp Ser Ala Arg Val Lys Val Ser Met
225 230 235 240
Leu Ser Asp Gly Thr Gly Thr Tyr Asn Asn Phe Tyr Asn Tyr Phe Gly
245 250 255
Asp Ala Ala Thr Ala Glu Gln Asn Trp Glu Ser Tyr Ala Ser Glu Val
260 265 270
Glu Ala Leu Asp Trp Asn His Gly Gly Arg Tyr Pro Glu Thr Arg Ser
275 280 285
Leu Pro Glu Phe Glu Ser Tyr Thr Trp Pro Tyr Tyr Leu Ser Thr Arg
290 295 300
Pro Asp Tyr Arg Leu Val Val Gln Asp Gly Ser Leu Leu Glu Ser Ser
305 310 315 320
Cys Pro Phe Ile Thr Glu Lys Leu Gly Glu Met Glu Ile Glu Ser Ile
325 330 335
Gln Pro Tyr Glu Met Leu Ser Ala Leu Pro Glu Ser Ser Arg Lys Arg
340 345 350
Phe Tyr Asp Met Ala Gly Phe Asp Tyr Asp Lys Phe Ala Ala Leu Phe
355 360 365
Asp Ala Ser Pro Lys Lys Asn Leu Ile Ile Ile Gly Thr Ser His Ala
370 375 380
Asp Asp Ala Ser Ala Arg Leu Gln Arg Asp Tyr Val Ala Arg Ile Met
385 390 395 400
Glu Gln Tyr Gly Ala Gln Tyr Asp Val Phe Phe Lys Pro His Pro Ala
405 410 415
Asp Thr Thr Ser Ala Gly Tyr Glu Thr Glu Phe Pro Gly Leu Thr Leu
420 425 430
Leu Pro Gly Gln Met Pro Phe Glu Ile Phe Val Trp Ser Leu Ile Asp
435 440 445
Arg Val Asp Met Ile Gly Gly Tyr Pro Ser Thr Val Phe Leu Thr Val
450 455 460
Pro Val Asp Lys Val Arg Phe Ile Phe Ala Ala Asp Ala Ala Ser Leu
465 470 475 480
Val Arg Pro Leu Asn Ile Leu Phe Arg Asp Ala Thr Asp Val Glu Trp
485 490 495
Met Gln

<210> 6
<211> 410
<212> PRT
<213> Bibersteinia trealosi
<400> 6
Met Glu Phe Cys Lys Met Ala Thr Thr Gln Lys Ile Cys Val Tyr Leu
1 5 10 15
Asp Tyr Ala Thr Ile Pro Ser Leu Asn Tyr Ile Leu His Phe Ala Gln
20 25 30
His Phe Glu Asp Gln Glu Thr Ile Arg Leu Phe Gly Leu Ser Arg Phe
35 40 45
His Ile Pro Glu Ser Val Ile Gln Arg Tyr Pro Lys Gly Val Val Gln
50 55 60
Phe Tyr Pro Asn Gln Glu Lys Asp Phe Ser Ala Leu Leu Leu Ala Leu
65 70 75 80
Lys Asn Ile Leu Ile Glu Val Lys Gln Gln Gln Arg Lys Cys Glu Ile
85 90 95
Glu Leu His Leu Asn Leu Phe His Tyr Gln Leu Leu Leu Leu Pro Phe
100 105 110
Leu Ser Leu Tyr Leu Asp Thr Gln Asp Tyr Cys His Leu Thr Leu Lys
115 120 125
Phe Tyr Asp Asp Gly Ser Glu Ala Ile Ser Ala Leu Gln Glu Leu Ala
130 135 140
Leu Ala Pro Asp Leu Ala Ala Gln Ile Gln Phe Glu Lys Gln Gln Phe
145 150 155 160
Asp Glu Leu Val Val Lys Lys Ser Phe Lys Leu Ser Leu Leu Ser Arg
165 170 175
Tyr Phe Trp Gly Lys Leu Phe Glu Ser Glu Tyr Ile Trp Phe Asn Gln
180 185 190
Ala Ile Leu Gln Lys Ala Glu Leu Gln Ile Leu Lys Gln Glu Ile Ser
195 200 205
Ser Ser Arg Gln Met Asp Phe Ala Ile Tyr Gln Gln Met Ser Asp Glu
210 215 220
Gln Lys Gln Leu Val Leu Glu Ile Leu Asn Ile Asp Leu Asn Lys Val
225 230 235 240
Ala Tyr Leu Lys Gln Leu Met Glu Asn Gln Pro Ser Phe Leu Phe Leu
245 250 255
Gly Thr Thr Leu Phe Asn Ile Thr Gln Glu Thr Lys Thr Trp Leu Met
260 265 270
Gln Met His Val Asp Leu Ile Gln Gln Tyr Cys Leu Pro Ser Gly Gln
275 280 285
Phe Phe Asn Asn Lys Ala Gly Tyr Leu Cys Phe Tyr Lys Gly His Pro
290 295 300
Asn Glu Lys Glu Met Asn Gln Met Ile Leu Ser Gln Phe Lys Asn Leu
305 310 315 320
Ile Ala Leu Pro Asp Asp Ile Pro Leu Glu Ile Leu Leu Leu Leu Gly
325 330 335
Val Ile Pro Ser Lys Val Gly Gly Phe Ala Ser Ser Ala Leu Phe Asn
340 345 350
Phe Thr Pro Ala Gln Ile Glu Asn Ile Ile Phe Phe Thr Pro Arg Tyr
355 360 365
Phe Glu Lys Asp Asn Arg Leu His Ala Thr Gln Tyr Arg Leu Met Gln
370 375 380
Gly Leu Ile Glu Leu Gly Tyr Leu Asp Ala Glu Lys Ser Val Thr His
385 390 395 400
Phe Glu Ile Met Gln Leu Leu Thr Lys Glu
405 410

<210> 7
<211> 367
<212> PRT
<213> Shewanella piezotolerans
<400> 7
Met Leu Val Asn Asn Gln Ser His Asn Pro Lys Leu Ile Cys Trp Gln
1 5 10 15
Arg His Pro Val Asn Asp Glu Ala Leu Leu Gln Gly Ile Asn Ala Ala
20 25 30
Ser Phe Val Ser Ile Ala Ser Leu Cys Gln His Ala Ala Thr Leu Leu
35 40 45
Ala Gly His Pro His Ser His Ile Thr Ile Tyr Gly Asn Thr Tyr Trp
50 55 60
Ser Lys Asp Leu Ala Arg Leu Ile Arg Tyr Leu Thr Arg Ile Ser Gly
65 70 75 80
Val Glu Ile Lys Lys Leu Glu Leu Ile Asp Asp Gly Ser Ser Glu Tyr
85 90 95
Gln Lys Met Phe Tyr Trp Gln Arg Leu Ser Ser Glu Glu Gln Thr Arg
100 105 110
Asp Leu Ala Thr Gly Leu Lys Asn Leu Lys Ser Tyr Leu Ser Gly Asn
115 120 125
Asp Asn Lys Leu Leu Arg Leu Leu Thr Gly His Ser Asn Lys Leu Pro
130 135 140
Arg Arg Leu Ser Ser Phe Met Asn Trp His Gln Leu Phe Pro Thr Thr
145 150 155 160
Tyr His Met Leu Arg Met Asp Tyr Leu Asp Lys Pro Glu Leu His Gln
165 170 175
Leu Lys Gln Tyr Leu Gly Asn Asn Ala Gln Gln Ile Arg Trp Asn Tyr
180 185 190
Ile Ala Asp Asn Leu Phe Asp Asp Glu Gln Gln Ser Leu Phe Tyr Gln
195 200 205
Leu Leu Gly Ile Ser Leu Ala Glu Gln Lys Gln Leu Arg Ala Gly Arg
210 215 220
Gln Gln Leu His Asp Phe Met Phe Ile Gly Val Asp Ser Ser Asn Ala
225 230 235 240
Ser Ser Lys Leu Gln Ile Asn Val Ile Ala Asp Ser Arg Gln Glu Ser
245 250 255
Gly Ile Ile Pro Thr Ile Thr Ala Lys Lys Met Leu Phe Lys Gly His
260 265 270
Pro Phe Ala Asn Phe Asn Gln Thr Ile Val Asp Ala His Gln Met Gly
275 280 285
Glu Met Pro Ala Met Ile Pro Phe Glu Thr Leu Ile Met Thr Gly Asn
290 295 300
Leu Pro Gln Lys Val Gly Gly Met Ala Ser Ser Leu Tyr Phe Ser Leu
305 310 315 320
Pro Asn Asn Tyr His Ile Glu Tyr Ile Val Phe Ser Gly Ser Lys Lys
325 330 335
Asp Leu Glu Gln His Ala Leu Leu Gln Ile Met Leu Tyr Leu Lys Val
340 345 350
Ile Ser Pro Glu Arg Val Tyr Phe Ser Glu Gln Phe Lys Ser Cys
355 360 365

<210> 8
<211> 422
<212> PRT
<213> Helicobacter acinonychis
<400> 8
Met Gly Thr Ile Lys Lys Pro Leu Ile Ile Ala Gly Asn Gly Pro Ser
1 5 10 15
Ile Lys Asp Leu Asp Tyr Ala Leu Phe Pro Lys Asp Phe Asp Val Phe
20 25 30
Arg Cys Asn Gln Phe Tyr Phe Glu Asp Lys Tyr Tyr Leu Gly Arg Glu
35 40 45
Ile Lys Gly Val Phe Phe Asn Pro Cys Val Leu Ser Ser Gln Met Gln
50 55 60
Thr Val Gln Tyr Leu Met Asp Asn Gly Glu Tyr Ser Ile Glu Arg Phe
65 70 75 80
Phe Cys Ser Val Ser Thr Asp Arg His Asp Phe Asp Gly Asp Tyr Gln
85 90 95
Thr Ile Leu Pro Val Asp Gly Tyr Leu Lys Ala His Tyr Pro Phe Val
100 105 110
Cys Asp Thr Phe Ser Leu Phe Lys Gly His Glu Glu Ile Leu Lys His
115 120 125
Val Lys Tyr His Leu Lys Thr Tyr Ser Lys Glu Leu Ser Ala Gly Val
130 135 140
Leu Met Leu Leu Ser Ala Val Val Leu Gly Tyr Lys Glu Ile Tyr Leu
145 150 155 160
Val Gly Ile Asp Phe Gly Ala Ser Ser Trp Gly His Phe Tyr Asp Glu
165 170 175
Ser Gln Ser Gln His Phe Ser Asn His Met Ala Asp Cys His Asn Ile
180 185 190
Tyr Tyr Asp Met Leu Thr Ile Cys Leu Cys Gln Lys Tyr Ala Lys Leu
195 200 205
Tyr Ala Leu Ala Pro Asn Ser Pro Leu Ser His Leu Leu Thr Leu Asn
210 215 220
Pro Gln Ala Lys Tyr Pro Phe Glu Leu Leu Asp Lys Pro Ile Gly Tyr
225 230 235 240
Thr Ser Asp Leu Ile Ile Ser Ser Pro Leu Glu Glu Lys Leu Leu Glu
245 250 255
Phe Lys Asn Ile Glu Glu Lys Leu Leu Glu Phe Lys Asn Ile Glu Glu
260 265 270
Lys Leu Leu Glu Phe Lys Asn Ile Glu Glu Lys Leu Leu Glu Phe Lys
275 280 285
Asn Ile Glu Glu Lys Leu Leu Glu Phe Lys Asn Ile Glu Glu Lys Leu
290 295 300
Leu Glu Phe Lys Asn Ile Glu Glu Lys Leu Leu Glu Phe Lys Asn Ile
305 310 315 320
Glu Glu Lys Leu Leu Glu Phe Lys Asn Ile Glu Glu Lys Leu Leu Glu
325 330 335
Phe Lys Asn Ile Glu Glu Lys Leu Leu Glu Phe Lys Asn Ile Glu Glu
340 345 350
Lys Leu Leu Glu Phe Lys Asn Ile Glu Glu Lys Leu Leu Glu Phe Lys
355 360 365
Asn Ile Glu Glu Lys Leu Leu Glu Phe Lys Asn Ile Glu Glu Lys Leu
370 375 380
Leu Ala Ser Arg Leu Asn Asn Ile Leu Arg Lys Ile Lys Arg Lys Ile
385 390 395 400
Leu Pro Phe Phe Trp Gly Gly Gly Val Thr Pro Thr Leu Lys Val Ser
405 410 415
Phe Arg Trp Gly Ala Ala
420

<210> 9
<211> 318
<212> PRT
<213> Helicobacter pylori
<400> 9
Met Lys Lys Pro Leu Ile Ile Ala Gly Asn Gly Pro Ser Ile Lys Asp
1 5 10 15
Leu Asp Tyr Ser Leu Phe Pro Lys Asp Phe Glu Val Phe Arg Cys Asn
20 25 30
Gln Phe Tyr Phe Glu Asp Lys Tyr Tyr Leu Gly Arg Glu Ile Lys Gly
35 40 45
Val Phe Phe Asn Pro Cys Val Leu Ser Ser Gln Met Gln Thr Ala Gln
50 55 60
Tyr Leu Met Asp Asn Gly Glu Tyr Ser Ile Glu Arg Phe Phe Cys Ser
65 70 75 80
Val Ser Thr Asp Arg His Asp Phe Asp Gly Asp Tyr Gln Thr Ile Leu
85 90 95
Pro Val Glu Gly Tyr Leu Lys Ala His Tyr Pro Phe Val Cys Asp Thr
100 105 110
Phe Ser Leu Phe Lys Gly His Glu Glu Ile Leu Arg His Val Lys Tyr
115 120 125
His Leu Lys Thr Tyr Ser Lys Glu Leu Ser Ala Gly Val Leu Met Leu
130 135 140
Leu Ser Ala Val Val Leu Gly Tyr Lys Glu Ile Tyr Leu Val Gly Ile
145 150 155 160
Asp Phe Gly Ala Ser Ser Trp Gly His Phe Tyr Asp Glu Ser Gln Ser
165 170 175
Gln His Phe Ser Asn His Met Ala Asp Cys His Asn Ile Tyr Tyr Asp
180 185 190
Met Phe Thr Ile Cys Leu Cys Gln Lys Tyr Ala Lys Leu Tyr Ala Leu
195 200 205
Ala Pro Asn Ser Pro Leu Arg His Ile Leu Ala Leu Asn Pro Gln Ala
210 215 220
Lys Tyr His Phe Glu Leu Leu Asp Lys Pro Ile Gly Tyr Thr Ser Asp
225 230 235 240
Leu Ile Val Ser Leu Pro Leu Glu Glu Lys Leu Leu Glu Phe Lys Asn
245 250 255
Ile Glu Glu Lys Leu Leu Glu Phe Lys Asn Ile Glu Glu Lys Leu Leu
260 265 270
Glu Phe Lys Asn Ile Glu Glu Lys Leu Leu Val Asn Arg Leu Lys Asn
275 280 285
Ile Leu Arg Lys Ile Lys Arg Lys Ile Leu Pro Phe Trp Gly Gly Gly
290 295 300
Gly Asn Thr His Leu Lys Val Ser Phe Arg Trp Gly Val Ala
305 310 315

<210> 10
<211> 314
<212> PRT
<213> Helicobacter cetorum
<400> 10
Met Ser Glu Lys Ile Phe Ser Gln Val Asp Glu Lys Asn Gln Lys Lys
1 5 10 15
Pro Leu Ile Ile Ala Gly Asn Gly Pro Ser Ile Lys Asp Leu Asp Tyr
20 25 30
Ser Leu Phe Pro Lys Asp Phe Asp Val Phe Arg Cys Asn Gln Phe Tyr
35 40 45
Phe Glu Asp Lys Tyr Tyr Leu Gly Lys Glu Val Lys Gly Val Phe Phe
50 55 60
Asn Pro Cys Val Phe His Asn Gln Met Asn Thr Ala Lys His Leu Ile
65 70 75 80
Asp Asn Asn Glu Tyr Tyr Ile Glu Gln Phe Phe Cys Ser Val Ser Lys
85 90 95
Glu Gln His Asp Phe Asn Gly Asp Tyr Gln Thr Ile Leu Ser Val Asp
100 105 110
Glu Tyr Leu Arg Ala Asn Tyr Pro Phe Val Arg Asp Thr Phe Ser Leu
115 120 125
Phe Gly Glu His Glu Glu Ile Leu Asn His Val Lys Tyr His Leu Lys
130 135 140
Thr Tyr Ser Lys Glu Leu Ser Ala Gly Val Leu Met Leu Leu Ser Ala
145 150 155 160
Ile Val Leu Gly Tyr Lys Glu Ile Tyr Leu Val Gly Val Asp Phe Gly
165 170 175
Ala Asn Ser Trp Gly His Phe Tyr Asp Asp Asn Gln Ser Gln His Phe
180 185 190
Ile Asn His Met Ala Asp Cys His Asn Ile Tyr Tyr Asp Met Leu Thr
195 200 205
Ile Tyr Leu Cys Gln Lys Tyr Ala Lys Leu Tyr Ala Leu Val Pro Asn
210 215 220
Ser Pro Leu Asn His Leu Leu Pro Leu Asn Leu Gln Ala Asn His Val
225 230 235 240
Phe Glu Leu Leu Asp Lys Pro Ile Gly Tyr Thr Ser Asp Leu Ile Val
245 250 255
Ser Ser Pro Leu Glu Glu Lys Leu Leu Glu Ser Lys Asn Ile Asp Glu
260 265 270
Arg Phe Ser Gln Asn Lys Ser Phe Lys Asn Tyr Leu Gln Arg Leu Lys
275 280 285
Asp Lys Phe Leu Gln Met Ile Phe Arg Gly Gly Gly Val Ile Thr Ile
290 295 300
Pro Arg Val Ile Phe Lys Gly Lys Phe Ala
305 310

<210> 11
<211> 8184
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 11
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatatg cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggcg 240
cctcctcaac ctgtatattc gtaaaccacg cccaatggga gctgtctcag gtttgttcct 300
gattggttac ggcgcgtttc gcatcattgt tgagtttttc cgccagcccg acgcgcagtt 360
taccggtgcc tgggtgcagt acatcagcat ggggcaaatt ctttccatcc cgatgattgt 420
cgcgggtgtg atcatgatgg tctgggcata tcgtcgcagc ccacagcaac acgtttcctg 480
aggaaccatg aaacagtatt tagaactgat gcaaaaagtg ctcgacgaag gcacacagaa 540
aaacgaccgt accggaaccg gaacgctttc catttttggt catcagatgc gttttaacct 600
gcaagatgga ttcccgctgg tgacaactaa acgttgccac ctgcgttcca tcatccatga 660
actgctgtgg tttctgcagg gcgacactaa cattgcttat ctacacgaaa acaatgtcac 720
catctgggac gaatgggccg atgaaaacgg cgacctcggg ccagtgtatg gtaaacagtg 780
gcgcgcctgg ccaacgccag atggtcgtca tattgaccag atcactacgg tactgaacca 840
gctgaaaaac gacccggatt cgcgccgcat tattgtttca gcgtggaacg taggcgaact 900
ggataaaatg gcgctggcac cgtgccatgc attcttccag ttctatgtgg cagacggcaa 960
actctcttgc cagctttatc agcgctcctg tgacgtcttc ctcggcctgc cgttcaacat 1020
tgccagctac gcgttattgg tgcatatgat ggcgcagcag tgcgatctgg aagtgggtga 1080
ttttgtctgg accggtggcg acacgcatct gtacagcaac catatggatc aaactcatct 1140
gcaattaagc cgcgaaccgc gtccgctgcc gaagttgatt atcaaacgta aacccgaatc 1200
catcttcgac taccgtttcg aagactttga gattgaaggc tacgatccgc atccgggcat 1260
taaagcgccg gtggctatct aattacgaaa catcctgcca gagccgacgc cagtgtgcgt 1320
cggttttttt accctccgtt aaattcttcg agacgccttc ccgaaggcgc cattcgccat 1380
tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc 1440
tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg ttttcccagt 1500
cacgacgttg taaaacgacg gccagtgcca agcttactgc tcacaagaaa aaaggcacgt 1560
catctgacgt gcctttttta tttgtactac cctgtacgat tactgcaggt cgacttattt 1620
tttccatatc tgttcaacct tttttaaatc ctccaaacag tcaatatcta aacttgagct 1680
ttcgtccatt aaaaaatgct tggttttgct ttgtaaaaag ctaggattgt ttaaaaattc 1740
ttttatcttt aaaatataaa ttgcaccatt gctcatataa gttttaggca atttttgcct 1800
tggcataaaa ggatattcat cattacaaat ccctgctaaa tcgccacaat cattacaaac 1860
aaaggctttt agaattttat tatcacattc gcttacgcta attagggcat ttgcattgct 1920
atttttataa agattaaaag cttcattaat atgaatattt gttcttagcg gtgaagtggg 1980
ttgtaaaaaa actacatctt cataatcttt ataaaatttt agagcatgta acagcacttt 2040
atcgcttgtg gtatcatctt gtgcaaggct aattgggcgt tttaaaatat caacattttg 2100
actttttgca taatttaaaa tttcatcact atcactgctt acaacaactt tactaatgct 2160
tttagcattt agtgcagctt tgatcgtgta gtaaattaaa ggtttattgt ttaataaaac 2220
caaattttta tttttaatac cctttgagcc accacgagca gggattattg ctaagctcat 2280
tttatatcct taaaaacttt ttgtgtgctg agtttaaaaa aatctccgct ttgtaaatat 2340
tcaaaaaata attttgagct atctaaaatc tctaacttag cgctaaataa atcttgtttt 2400
ttatgaatag tgttaatagc ttttagtatt tcatcactat ttgcattaac ttttagtgta 2460
ttttcattgc caagtcttcc attttgtctt gagccaacta aaatccctgc tgtttttaag 2520
tataaggcct cttttaaaat acaacttgaa ttacctatta taaaatcagc attttttaac 2580
aaagttataa aatactcaaa tctaagcgat ggaaaaagct taaatctagg gttattttta 2640
aactcttcat agctttgcaa gattaattca aaacctaaat cattatttgg ataaataaca 2700
atataatttt tattactttg tatcagtgct tttactaaat tgtctgcttg atttttaatg 2760
ctagtaattt cagttgtaac aggatgaaac ataagcaaag cgtagttttc ataatttata 2820
tcataatatt tttttgcttc gctaagtgaa attttattat cgtttaaaag ttctaaatca 2880
ggcgaaccta tgataaaaat agatttttca tcttctccaa gctgcattaa acgccttttt 2940
gcaaactcat catttactaa atgaatatga gctagttttg atatagcgtg gcgtaagcta 3000
tcgtcaatag ttcctgaaat ctctccgcct tcaatatgcg ctactaagat attatttaat 3060
gctccaacaa tagctgctgc taaaggctca attctatctc catgtactac gattaaatca 3120
ggttttagct catttgcata ccttgaaaat ccatcaattg tagtagctaa agccttatca 3180
gtttgataat atttatcata atttataaat tcataaatat ttttaaagcc atttttataa 3240
agttctttaa ctgtatagcc aaaattttta cttaagtgca ttcctgttgc aaagatgtaa 3300
agttcaaatt cgcttgagtt ttgcaccctg tacattaaag atttaatctt agaataatca 3360
gccctagagc ctgttataaa aaggattttt ttcacgcaaa atcctcatag cttaactgag 3420
catcattttc tatatctctt aatgcttttt tgcctaaaat attttcaaat tcagccgcac 3480
taattccacc aagtccaggt cttttaaccc aaatattatc catagataaa acttcgcctt 3540
ttttaatatc tttaatgcta actacacttg caaaggcaaa atcaattgta acttgttctt 3600
gtttagccgc ttttttactt tcattatttc ctcttattat agccatttgc tcactttgta 3660
taattagctc ttttaaagcc tttgtatcca tagaacaaac tatatcaggg ccacttctat 3720
gcatactatc agtaaaatgt ctttcaagca cacaagctcc aagtacaact gcacctaaac 3780
acgcaagatt atctgttgtg tggtcgctta agcctaccat acaagaaaat tcttttttta 3840
actcaagcat agcgtttaat cttacaagat tatgcggggt tgggtaaaga ttggtcgtgt 3900
gcattaaaac aaaaggaatt tcattgtcta ataagatttt tacagttggt tttatacttt 3960
caatactatt cattcctgtg ctaactatca taggcttttt aaaggctgct atgtgtttaa 4020
taagcggata attattacac tcacctgaac caatcttaaa agcactaact cccatatctt 4080
ctaagcggtt cgcacctgca cgagaaaaag gtgtgctaag ataaacaaga cctaattttt 4140
ctgtgtattc tttaagtgct agctcatctt tataatccaa agcacatttt tgcataatct 4200
cataaatgct tatttttgca ttaccaggaa ttactttttt agcggcctta ctcatctcat 4260
cttcaacaat atgagtttga tgctttataa tcttagcacc tgcgctaaag gctgcatcta 4320
ccataatttt agctagttct aaactgccat tatgattaat gcctatttca ggtacgacta 4380
agggtgcttt ttcttcactt atgattatat tttgtatttt tatttctttc atttattttc 4440
ctccttagtc gacggtaccc ttaagcgaat tttcctttaa agatcacgcg gggaattgta 4500
atgactccac ccccacggaa gatcatttga agaaacttat ctttaagacg ttgaagatag 4560
tttttgaagg acttattctg agagaagcgc tcgtcgatgt tcttcgactc taacagtttt 4620
tcttctaaag gggagctaac gattaaatcc gacgtgtagc cgatgggctt atcaagcagc 4680
tcaaatacat ggtttgcctg taagttcaac ggtaaaagat ggttcagagg actgttaggt 4740
actaaagcat ataatttggc gtatttttga caaaggtaaa tagtcaacat gtcataataa 4800
atgttatggc agtcagccat gtggttaata aagtgctgac tctggttgtc atcgtaaaaa 4860
tgtccccagc tatttgcgcc aaaatcgaca ccgactaagt agatttcctt gtatcctaaa 4920
acaattgcgc tcaacaacat aaggaccccc gcagataatt cttttgaata tgtcttcaga 4980
tggtatttga catggtttaa gatttcctca tgctccccaa acaagctaaa ggtgtcacgt 5040
acaaacgggt agtttgcacg aaggtattcg tccaccgata agatggtctg gtaatcaccg 5100
ttaaaatcgt gttgttcttt cgacacacta caaaagaact gctcgatgta gtattcgttg 5160
ttgtcaatta aatgcttcgc ggtattcatt tgattatgga agacgcacgg attaaagaat 5220
acacctttga cctctttgcc caagtaatac ttatcttcga aatagaattg gttacagcgg 5280
aaaacgtcga aatcttttgg gaacaacgaa tagtcaaggt ctttgattga tggtccgttg 5340
cccgcgataa tcaagggctt tttttggttc ttctcgtcaa cctggctgaa gattttttcc 5400
gacatatgta tatctccttc ttgaattcta acaattgatt gaatgtatgc aaataaatgc 5460
atacaccata ggtgtggttt aatttgatgc cctttttcag ggctggaatg tgtaagagcg 5520
gggttattta tgctgttgtt tttttgttac tcgggaaggg ctttacctct tccgcataaa 5580
cgcttccatc agcgtttata gttaaaaaaa tctttcggaa ctggttttgc gcttacccca 5640
accaacaggg gatttgctgc tttccattga gcctgtttct ctgcgcgacg ttcgcggcgg 5700
cgtgtttgtg catccatctg gattctcctg tcagttagct ttggtggtgt gtggcagttg 5760
tagtcctgaa cgaaaacccc ccgcgattgg cacattggca gctaatccgg aatcgcactt 5820
acggccaatg cttcgtttcg tatcacacac cccaaagcct tctgctttga atgctgccct 5880
tcttcagggc ttaattttta agagcgtcac cttcatggtg gtcagtgcgt cctgctgatg 5940
tgctcagtat caccgccagt ggtatttatg tcaacaccgc cagagataat ttatcaccgc 6000
agatggttat ctgtatgttt tttatatgaa tttatttttt gcaggggggc attgtttggt 6060
aggtgagaga tcaattctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg 6120
tattgggcgc tcttccgctg ctagcggagt gtatactggc ttactatgtt ggcactgatg 6180
agggtgtcag tgaagtgctt catgtggcag gagaaaaaag gctgcaccgg tgcgtcagca 6240
gaatatgtga tacaggatat attccgcttc ctcgctcact gactcgctac gctcggtcgt 6300
tcgactgcgg cgagcggaaa tggcttacga acggggcgga gatttcctgg aagatgccag 6360
gaagatactt aacagggaag tgagagggcc gcggcaaagc cgtttttcca taggctccgc 6420
ccccctgaca agcatcacga aatctgacgc tcaaatcagt ggtggcgaaa cccgacagga 6480
ctataaagat accaggcgtt tccccctggc ggctccctcg tgcgctctcc tgttcctgcc 6540
tttcggttta ccggtgtcat tccgctgtta tggccgcgtt tgtctcattc cacgcctgac 6600
actcagttcc gggtaggcag ttcgctccaa gctggactgt atgcacgaac cccccgttca 6660
gtccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg aaagacatgc 6720
aaaagcacca ctggcagcag ccactggtaa ttgatttaga ggagttagtc ttgaagtcat 6780
gcgccggtta aggctaaact gaaaggacaa gttttggtga ctgcgctcct ccaagccagt 6840
tacctcggtt caaagagttg gtagctcaga gaaccttcga aaaaccgccc tgcaaggcgg 6900
ttttttcgtt ttcagagcaa gagattacgc gcagaccaaa acgatctcaa gaagatcatc 6960
ttattaatca gataaaatat ttctaggcgg ccgcgaacga aaactcacgt taagggattt 7020
tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt 7080
ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca 7140
gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg 7200
tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac 7260
cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg 7320
ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc 7380
gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta 7440
caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac 7500
gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc 7560
ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac 7620
tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact 7680
caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa 7740
tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt 7800
cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca 7860
ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa 7920
aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac 7980
tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg 8040
gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc 8100
gaaaagtgcc acctgacgtc taagaaacca ttattatcat gacattaacc tataaaaata 8160
ggcgtatcac gaggcccttt cgtc 8184

<210> 12
<211> 8196
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 12
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatatg cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggcg 240
cctcctcaac ctgtatattc gtaaaccacg cccaatggga gctgtctcag gtttgttcct 300
gattggttac ggcgcgtttc gcatcattgt tgagtttttc cgccagcccg acgcgcagtt 360
taccggtgcc tgggtgcagt acatcagcat ggggcaaatt ctttccatcc cgatgattgt 420
cgcgggtgtg atcatgatgg tctgggcata tcgtcgcagc ccacagcaac acgtttcctg 480
aggaaccatg aaacagtatt tagaactgat gcaaaaagtg ctcgacgaag gcacacagaa 540
aaacgaccgt accggaaccg gaacgctttc catttttggt catcagatgc gttttaacct 600
gcaagatgga ttcccgctgg tgacaactaa acgttgccac ctgcgttcca tcatccatga 660
actgctgtgg tttctgcagg gcgacactaa cattgcttat ctacacgaaa acaatgtcac 720
catctgggac gaatgggccg atgaaaacgg cgacctcggg ccagtgtatg gtaaacagtg 780
gcgcgcctgg ccaacgccag atggtcgtca tattgaccag atcactacgg tactgaacca 840
gctgaaaaac gacccggatt cgcgccgcat tattgtttca gcgtggaacg taggcgaact 900
ggataaaatg gcgctggcac cgtgccatgc attcttccag ttctatgtgg cagacggcaa 960
actctcttgc cagctttatc agcgctcctg tgacgtcttc ctcggcctgc cgttcaacat 1020
tgccagctac gcgttattgg tgcatatgat ggcgcagcag tgcgatctgg aagtgggtga 1080
ttttgtctgg accggtggcg acacgcatct gtacagcaac catatggatc aaactcatct 1140
gcaattaagc cgcgaaccgc gtccgctgcc gaagttgatt atcaaacgta aacccgaatc 1200
catcttcgac taccgtttcg aagactttga gattgaaggc tacgatccgc atccgggcat 1260
taaagcgccg gtggctatct aattacgaaa catcctgcca gagccgacgc cagtgtgcgt 1320
cggttttttt accctccgtt aaattcttcg agacgccttc ccgaaggcgc cattcgccat 1380
tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc 1440
tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg ttttcccagt 1500
cacgacgttg taaaacgacg gccagtgcca agcttactgc tcacaagaaa aaaggcacgt 1560
catctgacgt gcctttttta tttgtactac cctgtacgat tactgcaggt cgacttattt 1620
tttccatatc tgttcaacct tttttaaatc ctccaaacag tcaatatcta aacttgagct 1680
ttcgtccatt aaaaaatgct tggttttgct ttgtaaaaag ctaggattgt ttaaaaattc 1740
ttttatcttt aaaatataaa ttgcaccatt gctcatataa gttttaggca atttttgcct 1800
tggcataaaa ggatattcat cattacaaat ccctgctaaa tcgccacaat cattacaaac 1860
aaaggctttt agaattttat tatcacattc gcttacgcta attagggcat ttgcattgct 1920
atttttataa agattaaaag cttcattaat atgaatattt gttcttagcg gtgaagtggg 1980
ttgtaaaaaa actacatctt cataatcttt ataaaatttt agagcatgta acagcacttt 2040
atcgcttgtg gtatcatctt gtgcaaggct aattgggcgt tttaaaatat caacattttg 2100
actttttgca taatttaaaa tttcatcact atcactgctt acaacaactt tactaatgct 2160
tttagcattt agtgcagctt tgatcgtgta gtaaattaaa ggtttattgt ttaataaaac 2220
caaattttta tttttaatac cctttgagcc accacgagca gggattattg ctaagctcat 2280
tttatatcct taaaaacttt ttgtgtgctg agtttaaaaa aatctccgct ttgtaaatat 2340
tcaaaaaata attttgagct atctaaaatc tctaacttag cgctaaataa atcttgtttt 2400
ttatgaatag tgttaatagc ttttagtatt tcatcactat ttgcattaac ttttagtgta 2460
ttttcattgc caagtcttcc attttgtctt gagccaacta aaatccctgc tgtttttaag 2520
tataaggcct cttttaaaat acaacttgaa ttacctatta taaaatcagc attttttaac 2580
aaagttataa aatactcaaa tctaagcgat ggaaaaagct taaatctagg gttattttta 2640
aactcttcat agctttgcaa gattaattca aaacctaaat cattatttgg ataaataaca 2700
atataatttt tattactttg tatcagtgct tttactaaat tgtctgcttg atttttaatg 2760
ctagtaattt cagttgtaac aggatgaaac ataagcaaag cgtagttttc ataatttata 2820
tcataatatt tttttgcttc gctaagtgaa attttattat cgtttaaaag ttctaaatca 2880
ggcgaaccta tgataaaaat agatttttca tcttctccaa gctgcattaa acgccttttt 2940
gcaaactcat catttactaa atgaatatga gctagttttg atatagcgtg gcgtaagcta 3000
tcgtcaatag ttcctgaaat ctctccgcct tcaatatgcg ctactaagat attatttaat 3060
gctccaacaa tagctgctgc taaaggctca attctatctc catgtactac gattaaatca 3120
ggttttagct catttgcata ccttgaaaat ccatcaattg tagtagctaa agccttatca 3180
gtttgataat atttatcata atttataaat tcataaatat ttttaaagcc atttttataa 3240
agttctttaa ctgtatagcc aaaattttta cttaagtgca ttcctgttgc aaagatgtaa 3300
agttcaaatt cgcttgagtt ttgcaccctg tacattaaag atttaatctt agaataatca 3360
gccctagagc ctgttataaa aaggattttt ttcacgcaaa atcctcatag cttaactgag 3420
catcattttc tatatctctt aatgcttttt tgcctaaaat attttcaaat tcagccgcac 3480
taattccacc aagtccaggt cttttaaccc aaatattatc catagataaa acttcgcctt 3540
ttttaatatc tttaatgcta actacacttg caaaggcaaa atcaattgta acttgttctt 3600
gtttagccgc ttttttactt tcattatttc ctcttattat agccatttgc tcactttgta 3660
taattagctc ttttaaagcc tttgtatcca tagaacaaac tatatcaggg ccacttctat 3720
gcatactatc agtaaaatgt ctttcaagca cacaagctcc aagtacaact gcacctaaac 3780
acgcaagatt atctgttgtg tggtcgctta agcctaccat acaagaaaat tcttttttta 3840
actcaagcat agcgtttaat cttacaagat tatgcggggt tgggtaaaga ttggtcgtgt 3900
gcattaaaac aaaaggaatt tcattgtcta ataagatttt tacagttggt tttatacttt 3960
caatactatt cattcctgtg ctaactatca taggcttttt aaaggctgct atgtgtttaa 4020
taagcggata attattacac tcacctgaac caatcttaaa agcactaact cccatatctt 4080
ctaagcggtt cgcacctgca cgagaaaaag gtgtgctaag ataaacaaga cctaattttt 4140
ctgtgtattc tttaagtgct agctcatctt tataatccaa agcacatttt tgcataatct 4200
cataaatgct tatttttgca ttaccaggaa ttactttttt agcggcctta ctcatctcat 4260
cttcaacaat atgagtttga tgctttataa tcttagcacc tgcgctaaag gctgcatcta 4320
ccataatttt agctagttct aaactgccat tatgattaat gcctatttca ggtacgacta 4380
agggtgcttt ttcttcactt atgattatat tttgtatttt tatttctttc atttattttc 4440
ctccttagtc gacggtaccc ttaagccacc ccccagcgga acgacacttt aagatgcgta 4500
ttgccgccac ccccccaaaa cggcaggatc ttacgtttga tcttacgcag gatgttctta 4560
agacgattca caagaagctt ctcttcaata ttcttgaact caagcaactt ttcctcgata 4620
tttttgaact ctaaaagttt ctcctcgatg tttttaaatt ccagaagctt ctcctcaagg 4680
ggaagcgata caatcaggtc acttgtatag ccgatcggtt tatcaagcaa ctcgaagtgg 4740
tattttgctt gcgggttcag tgccaggatg tgacgaagcg gagagttcgg tgctaaggcg 4800
taaagttttg catacttttg acacaggcag attgtgaaca tgtcatagta aatgttgtgg 4860
caatcggcca tgtgattgct gaagtgctgg gactgactct catcgtagaa gtggccccag 4920
cttgacgcac caaagtcaat cccgaccaag taaatctcct tataccccaa aaccacggcc 4980
gacaacagca ttaagactcc ggcactcaat tctttactat aagtttttaa gtggtacttc 5040
acatggcgaa ggatttcctc atggccctta aaaaggctga atgtgtcaca aacaaatggg 5100
tagtgggcct tcaaataacc ctccaccgga aggatcgtct gataatcgcc gtcgaagtca 5160
tggcggtctg tcgagacact gcagaagaag cgttcgatgg aatattcacc gttgtccatc 5220
agatattgag ctgtttgcat ttgagaagat aacacacagg gattgaagaa tacgccttta 5280
atctcacgtc caaggtaata cttatcctcg aaataaaact gattacagcg aaagacttcg 5340
aaatccttgg gaaataaact atagtccagg tctttgatgg atggcccgtt ccccgcaata 5400
attaagggtt tcttcatatg tatatctcct tcttgaattc taacaattga ttgaatgtat 5460
gcaaataaat gcatacacca taggtgtggt ttaatttgat gccctttttc agggctggaa 5520
tgtgtaagag cggggttatt tatgctgttg tttttttgtt actcgggaag ggctttacct 5580
cttccgcata aacgcttcca tcagcgttta tagttaaaaa aatctttcgg aactggtttt 5640
gcgcttaccc caaccaacag gggatttgct gctttccatt gagcctgttt ctctgcgcga 5700
cgttcgcggc ggcgtgtttg tgcatccatc tggattctcc tgtcagttag ctttggtggt 5760
gtgtggcagt tgtagtcctg aacgaaaacc ccccgcgatt ggcacattgg cagctaatcc 5820
ggaatcgcac ttacggccaa tgcttcgttt cgtatcacac accccaaagc cttctgcttt 5880
gaatgctgcc cttcttcagg gcttaatttt taagagcgtc accttcatgg tggtcagtgc 5940
gtcctgctga tgtgctcagt atcaccgcca gtggtattta tgtcaacacc gccagagata 6000
atttatcacc gcagatggtt atctgtatgt tttttatatg aatttatttt ttgcaggggg 6060
gcattgtttg gtaggtgaga gatcaattct gcattaatga atcggccaac gcgcggggag 6120
aggcggtttg cgtattgggc gctcttccgc tgctagcgga gtgtatactg gcttactatg 6180
ttggcactga tgagggtgtc agtgaagtgc ttcatgtggc aggagaaaaa aggctgcacc 6240
ggtgcgtcag cagaatatgt gatacaggat atattccgct tcctcgctca ctgactcgct 6300
acgctcggtc gttcgactgc ggcgagcgga aatggcttac gaacggggcg gagatttcct 6360
ggaagatgcc aggaagatac ttaacaggga agtgagaggg ccgcggcaaa gccgtttttc 6420
cataggctcc gcccccctga caagcatcac gaaatctgac gctcaaatca gtggtggcga 6480
aacccgacag gactataaag ataccaggcg tttccccctg gcggctccct cgtgcgctct 6540
cctgttcctg cctttcggtt taccggtgtc attccgctgt tatggccgcg tttgtctcat 6600
tccacgcctg acactcagtt ccgggtaggc agttcgctcc aagctggact gtatgcacga 6660
accccccgtt cagtccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 6720
ggaaagacat gcaaaagcac cactggcagc agccactggt aattgattta gaggagttag 6780
tcttgaagtc atgcgccggt taaggctaaa ctgaaaggac aagttttggt gactgcgctc 6840
ctccaagcca gttacctcgg ttcaaagagt tggtagctca gagaaccttc gaaaaaccgc 6900
cctgcaaggc ggttttttcg ttttcagagc aagagattac gcgcagacca aaacgatctc 6960
aagaagatca tcttattaat cagataaaat atttctaggc ggccgcgaac gaaaactcac 7020
gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt 7080
aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc 7140
aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg 7200
cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg 7260
ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc 7320
cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta 7380
ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg 7440
ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct 7500
ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta 7560
gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg 7620
ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga 7680
ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt 7740
gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca 7800
ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt 7860
cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt 7920
ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga 7980
aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat cagggttatt 8040
gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc 8100
gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac cattattatc atgacattaa 8160
cctataaaaa taggcgtatc acgaggccct ttcgtc 8196

<210> 13
<211> 385
<212> PRT
<213> Pasteurella dagmatis
<400> 13
Met Thr Ile Tyr Leu Asp Pro Ala Ser Leu Pro Thr Leu Asn Gln Leu
1 5 10 15
Met His Phe Thr Lys Glu Ser Glu Asp Lys Glu Thr Ala Arg Ile Phe
20 25 30
Gly Phe Ser Arg Phe Lys Leu Pro Glu Lys Ile Thr Glu Gln Tyr Asn
35 40 45
Asn Ile His Phe Val Glu Ile Lys Asn Asn Arg Pro Thr Glu Asp Ile
50 55 60
Phe Thr Ile Leu Asp Gln Tyr Pro Glu Lys Leu Glu Leu Asp Leu His
65 70 75 80
Leu Asn Ile Ala His Ser Ile Gln Leu Phe His Pro Ile Leu Gln Tyr
85 90 95
Arg Phe Lys His Pro Asp Arg Ile Ser Ile Lys Ser Leu Asn Leu Tyr
100 105 110
Asp Asp Gly Thr Met Glu Tyr Val Asp Leu Glu Lys Glu Glu Asn Lys
115 120 125
Asp Ile Lys Ser Ala Ile Lys Lys Ala Glu Lys Gln Leu Ser Asp Tyr
130 135 140
Leu Leu Thr Gly Lys Ile Asn Phe Asp Asn Pro Thr Leu Ala Arg Tyr
145 150 155 160
Val Trp Gln Ser Gln Tyr Pro Val Lys Tyr His Phe Leu Ser Thr Glu
165 170 175
Tyr Phe Glu Lys Ala Glu Phe Leu Gln Pro Leu Lys Thr Tyr Leu Ala
180 185 190
Gly Lys Tyr Gln Lys Met Asp Trp Ser Ala Tyr Glu Lys Leu Ser Pro
195 200 205
Glu Gln Gln Thr Phe Tyr Leu Lys Leu Val Gly Phe Ser Asp Glu Thr
210 215 220
Lys Gln Leu Phe His Thr Glu Gln Thr Lys Phe Ile Phe Thr Gly Thr
225 230 235 240
Thr Thr Trp Glu Gly Asn Thr Asp Ile Arg Glu Tyr Tyr Ala Lys Gln
245 250 255
Gln Leu Asn Leu Leu Lys His Phe Thr His Ser Glu Gly Asp Leu Phe
260 265 270
Ile Gly Asp Gln Tyr Lys Ile Tyr Phe Lys Gly His Pro Arg Gly Gly
275 280 285
Asp Ile Asn Asp Tyr Ile Leu Lys His Ala Lys Asp Ile Thr Asn Ile
290 295 300
Pro Ala Asn Ile Ser Phe Glu Ile Leu Met Met Thr Gly Leu Leu Pro
305 310 315 320
Asp Lys Val Gly Gly Val Ala Ser Ser Leu Tyr Phe Ser Leu Pro Lys
325 330 335
Glu Lys Ile Ser His Ile Ile Phe Thr Ser Asn Lys Lys Ile Lys Asn
340 345 350
Lys Glu Asp Ala Leu Asn Asp Pro Tyr Val Arg Val Met Leu Arg Leu
355 360 365
Gly Met Ile Asp Lys Ser Gln Ile Ile Phe Trp Asp Ser Leu Lys Gln
370 375 380
Leu
385

<210> 14
<211> 385
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant form of PdST.
<400> 14
Met Thr Ile Tyr Leu Asp His Ala Ser Leu Pro Thr Leu Asn Gln Leu
1 5 10 15
Met His Phe Thr Lys Glu Ser Glu Asp Lys Glu Thr Ala Arg Ile Phe
20 25 30
Gly Phe Ser Arg Phe Lys Leu Pro Glu Lys Ile Thr Glu Gln Tyr Asn
35 40 45
Asn Ile His Phe Val Glu Ile Lys Asn Asn Arg Pro Thr Glu Asp Ile
50 55 60
Phe Thr Ile Leu Asp Gln Tyr Pro Glu Lys Leu Glu Leu Asp Leu His
65 70 75 80
Leu Asn Ile Ala His Ser Ile Gln Leu Phe His Pro Ile Leu Gln Tyr
85 90 95
Arg Phe Lys His Pro Asp Arg Ile Ser Ile Lys Ser Leu Asn Leu Tyr
100 105 110
Asp Asp Gly Thr Ala Glu Tyr Val Asp Leu Glu Lys Glu Glu Asn Lys
115 120 125
Asp Ile Lys Ser Ala Ile Lys Lys Ala Glu Lys Gln Leu Ser Asp Tyr
130 135 140
Leu Leu Thr Gly Lys Ile Asn Phe Asp Asn Pro Thr Leu Ala Arg Tyr
145 150 155 160
Val Trp Gln Ser Gln Tyr Pro Val Lys Tyr His Phe Leu Ser Thr Glu
165 170 175
Tyr Phe Glu Lys Ala Glu Phe Leu Gln Pro Leu Lys Thr Tyr Leu Ala
180 185 190
Gly Lys Tyr Gln Lys Met Asp Trp Ser Ala Tyr Glu Lys Leu Ser Pro
195 200 205
Glu Gln Gln Thr Phe Tyr Leu Lys Leu Val Gly Phe Ser Asp Glu Thr
210 215 220
Lys Gln Leu Phe His Thr Glu Gln Thr Lys Phe Ile Phe Thr Gly Thr
225 230 235 240
Thr Thr Trp Glu Gly Asn Thr Asp Ile Arg Glu Tyr Tyr Ala Lys Gln
245 250 255
Gln Leu Asn Leu Leu Lys His Phe Thr His Ser Glu Gly Asp Leu Phe
260 265 270
Ile Gly Asp Gln Tyr Lys Ile Tyr Phe Lys Gly His Pro Arg Gly Gly
275 280 285
Asp Ile Asn Asp Tyr Ile Leu Lys His Ala Lys Asp Ile Thr Asn Ile
290 295 300
Pro Ala Asn Ile Ser Phe Glu Ile Leu Met Met Thr Gly Leu Leu Pro
305 310 315 320
Asp Lys Val Gly Gly Val Ala Ser Ser Leu Tyr Phe Ser Leu Pro Lys
325 330 335
Glu Lys Ile Ser His Ile Ile Phe Thr Ser Asn Lys Lys Ile Lys Asn
340 345 350
Lys Glu Asp Ala Leu Asn Asp Pro Tyr Val Arg Val Met Leu Arg Leu
355 360 365
Gly Met Ile Asp Lys Ser Gln Ile Ile Phe Trp Asp Ser Leu Lys Gln
370 375 380
Leu
385

<210> 15
<211> 397
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant form of PdST
<400> 15
Met Glu Ile Tyr Leu Asp His Ala Ser Leu Pro Ser Leu Asn Met Ile
1 5 10 15
Leu Asn Leu Val Glu Asn Lys Asn Asn Glu Lys Val Glu Arg Ile Ile
20 25 30
Gly Phe Glu Arg Phe Asp Phe Asn Lys Glu Ile Leu Asn Ser Phe Ser
35 40 45
Lys Glu Arg Ile Glu Phe Ser Lys Val Ser Ile Leu Asp Ile Lys Glu
50 55 60
Phe Ser Asp Lys Leu Tyr Leu Asn Ile Glu Lys Ser Asp Thr Pro Val
65 70 75 80
Asp Leu Ile Ile His Thr Asn Leu Asp His Ser Val Arg Ser Leu Leu
85 90 95
Ser Ile Phe Lys Thr Leu Ser Pro Leu Phe His Lys Ile Asn Ile Glu
100 105 110
Lys Leu Tyr Leu Tyr Asp Asp Gly Ser Ala Asn Tyr Val Asp Leu Tyr
115 120 125
Gln His Arg Gln Glu Asn Ile Ser Ala Ile Leu Ile Glu Ala Gln Lys
130 135 140
Lys Leu Lys Asp Ala Leu Glu Asn Arg Glu Thr Asp Thr Asp Lys Leu
145 150 155 160
His Ser Leu Thr Arg Tyr Thr Trp His Lys Ile Phe Pro Thr Glu Tyr
165 170 175
Ile Leu Leu Arg Pro Asp Tyr Leu Asp Ile Asp Glu Lys Met Gln Pro
180 185 190
Leu Lys His Phe Leu Ser Asp Thr Ile Val Ser Met Asp Leu Ser Arg
195 200 205
Phe Ser His Phe Ser Lys Asn Gln Lys Glu Leu Phe Leu Lys Ile Thr
210 215 220
His Phe Asp Gln Asn Ile Phe Asn Glu Leu Asn Ile Gly Thr Lys Asn
225 230 235 240
Lys Glu Tyr Lys Thr Phe Ile Phe Thr Gly Thr Thr Thr Trp Glu Lys
245 250 255
Asp Lys Lys Lys Arg Leu Asn Asn Ala Lys Leu Gln Thr Glu Ile Leu
260 265 270
Glu Ser Phe Ile Lys Pro Asn Gly Lys Phe Tyr Leu Gly Asn Asp Ile
275 280 285
Lys Ile Phe Phe Lys Gly His Pro Lys Gly Asp Asp Ile Asn Asp Tyr
290 295 300
Ile Ile Arg Lys Thr Gly Ala Glu Lys Ile Pro Ala Asn Ile Pro Phe
305 310 315 320
Glu Val Leu Met Met Thr Asn Ser Leu Pro Asp Tyr Val Gly Gly Ile
325 330 335
Met Ser Thr Val Tyr Phe Ser Leu Pro Pro Lys Asn Ile Asp Lys Val
340 345 350
Val Phe Leu Gly Ser Glu Lys Ile Lys Asn Glu Asn Asp Ala Lys Ser
355 360 365
Gln Thr Leu Ser Lys Leu Met Leu Met Leu Asn Val Ile Thr Pro Glu
370 375 380
Gln Ile Phe Phe Glu Glu Met Pro Asn Pro Ile Asn Phe
385 390 395

<210> 16
<211> 399
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant form of BstE
<400> 16
Met Leu Ile Gln Gln Asn Leu Glu Ile Tyr Leu Asp His Ala Thr Ile
1 5 10 15
Pro Ser Leu Ala Cys Phe Met His Phe Ile Gln His Lys Asp Asp Val
20 25 30
Asp Ser Ile Arg Leu Phe Gly Leu Ala Arg Phe Asp Ile Pro Gln Ser
35 40 45
Ile Ile Asp Arg Tyr Pro Ala Asn His Leu Phe Tyr His Asn Ile Asp
50 55 60
Asn Arg Asp Leu Thr Ala Val Leu Asn Gln Leu Ala Asp Ile Leu Ala
65 70 75 80
Gln Glu Asn Lys Arg Phe Gln Ile Asn Leu His Leu Asn Leu Phe His
85 90 95
Ser Ile Asp Leu Phe Phe Ala Ile Tyr Pro Ile Tyr Gln Gln Tyr Gln
100 105 110
His Lys Ile Ser Thr Ile Gln Leu Gln Leu Tyr Asp Asp Gly Ser Ala
115 120 125
Gly Ile Val Thr Gln His Ser Leu Cys Lys Ile Ala Asp Leu Glu Gln
130 135 140
Leu Ile Leu Gln His Lys Asn Val Leu Leu Glu Leu Leu Thr Lys Gly
145 150 155 160
Thr Ala Asn Val Pro Asn Pro Thr Leu Leu Arg Tyr Leu Trp Asn Asn
165 170 175
Ile Ile Asp Ser Gln Phe His Leu Ile Ser Asp His Phe Leu Gln His
180 185 190
Pro Lys Leu Gln Pro Leu Lys Arg Leu Leu Lys Arg Tyr Thr Ile Leu
195 200 205
Asp Phe Thr Cys Tyr Pro Arg Phe Asn Ala Glu Gln Lys Gln Leu Leu
210 215 220
Lys Glu Ile Leu His Ile Ser Asn Glu Leu Glu Asn Leu Leu Lys Leu
225 230 235 240
Leu Lys Gln His Asn Thr Phe Leu Phe Thr Gly Thr Thr Ala Phe Asn
245 250 255
Leu Asp Gln Glu Lys Leu Asp Leu Leu Thr Gln Leu His Ile Leu Leu
260 265 270
Leu Asn Glu His Gln Asn Pro His Ser Thr His Tyr Ile Gly Asn Asn
275 280 285
Tyr Leu Leu Leu Ile Lys Gly His Ala Asn Ser Pro Ala Leu Asn His
290 295 300
Thr Leu Ala Leu His Phe Pro Asp Ala Ile Phe Leu Pro Ala Asn Ile
305 310 315 320
Pro Phe Glu Ile Phe Ala Met Leu Gly Phe Thr Pro Asn Lys Met Gly
325 330 335
Gly Phe Ala Ser Thr Ser Tyr Ile Asn Tyr Pro Thr Glu Asn Ile Asn
340 345 350
His Leu Phe Phe Leu Thr Ser Asp Gln Pro Ser Ile Arg Thr Lys Trp
355 360 365
Leu Asp Tyr Glu Lys Gln Phe Gly Leu Met Tyr Ser Leu Leu Ala Met
370 375 380
Gln Lys Ile Asn Glu Asp Gln Ala Phe Met Cys Thr Ile His Asn
385 390 395

<210> 17
<211> 8433
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 17
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatatg cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggcg 240
cctcctcaac ctgtatattc gtaaaccacg cccaatggga gctgtctcag gtttgttcct 300
gattggttac ggcgcgtttc gcatcattgt tgagtttttc cgccagcccg acgcgcagtt 360
taccggtgcc tgggtgcagt acatcagcat ggggcaaatt ctttccatcc cgatgattgt 420
cgcgggtgtg atcatgatgg tctgggcata tcgtcgcagc ccacagcaac acgtttcctg 480
aggaaccatg aaacagtatt tagaactgat gcaaaaagtg ctcgacgaag gcacacagaa 540
aaacgaccgt accggaaccg gaacgctttc catttttggt catcagatgc gttttaacct 600
gcaagatgga ttcccgctgg tgacaactaa acgttgccac ctgcgttcca tcatccatga 660
actgctgtgg tttctgcagg gcgacactaa cattgcttat ctacacgaaa acaatgtcac 720
catctgggac gaatgggccg atgaaaacgg cgacctcggg ccagtgtatg gtaaacagtg 780
gcgcgcctgg ccaacgccag atggtcgtca tattgaccag atcactacgg tactgaacca 840
gctgaaaaac gacccggatt cgcgccgcat tattgtttca gcgtggaacg taggcgaact 900
ggataaaatg gcgctggcac cgtgccatgc attcttccag ttctatgtgg cagacggcaa 960
actctcttgc cagctttatc agcgctcctg tgacgtcttc ctcggcctgc cgttcaacat 1020
tgccagctac gcgttattgg tgcatatgat ggcgcagcag tgcgatctgg aagtgggtga 1080
ttttgtctgg accggtggcg acacgcatct gtacagcaac catatggatc aaactcatct 1140
gcaattaagc cgcgaaccgc gtccgctgcc gaagttgatt atcaaacgta aacccgaatc 1200
catcttcgac taccgtttcg aagactttga gattgaaggc tacgatccgc atccgggcat 1260
taaagcgccg gtggctatct aattacgaaa catcctgcca gagccgacgc cagtgtgcgt 1320
cggttttttt accctccgtt aaattcttcg agacgccttc ccgaaggcgc cattcgccat 1380
tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc 1440
tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg ttttcccagt 1500
cacgacgttg taaaacgacg gccagtgcca agcttactgc tcacaagaaa aaaggcacgt 1560
catctgacgt gcctttttta tttgtactac cctgtacgat tactgcaggt cgacttattt 1620
tttccatatc tgttcaacct tttttaaatc ctccaaacag tcaatatcta aacttgagct 1680
ttcgtccatt aaaaaatgct tggttttgct ttgtaaaaag ctaggattgt ttaaaaattc 1740
ttttatcttt aaaatataaa ttgcaccatt gctcatataa gttttaggca atttttgcct 1800
tggcataaaa ggatattcat cattacaaat ccctgctaaa tcgccacaat cattacaaac 1860
aaaggctttt agaattttat tatcacattc gcttacgcta attagggcat ttgcattgct 1920
atttttataa agattaaaag cttcattaat atgaatattt gttcttagcg gtgaagtggg 1980
ttgtaaaaaa actacatctt cataatcttt ataaaatttt agagcatgta acagcacttt 2040
atcgcttgtg gtatcatctt gtgcaaggct aattgggcgt tttaaaatat caacattttg 2100
actttttgca taatttaaaa tttcatcact atcactgctt acaacaactt tactaatgct 2160
tttagcattt agtgcagctt tgatcgtgta gtaaattaaa ggtttattgt ttaataaaac 2220
caaattttta tttttaatac cctttgagcc accacgagca gggattattg ctaagctcat 2280
tttatatcct taaaaacttt ttgtgtgctg agtttaaaaa aatctccgct ttgtaaatat 2340
tcaaaaaata attttgagct atctaaaatc tctaacttag cgctaaataa atcttgtttt 2400
ttatgaatag tgttaatagc ttttagtatt tcatcactat ttgcattaac ttttagtgta 2460
ttttcattgc caagtcttcc attttgtctt gagccaacta aaatccctgc tgtttttaag 2520
tataaggcct cttttaaaat acaacttgaa ttacctatta taaaatcagc attttttaac 2580
aaagttataa aatactcaaa tctaagcgat ggaaaaagct taaatctagg gttattttta 2640
aactcttcat agctttgcaa gattaattca aaacctaaat cattatttgg ataaataaca 2700
atataatttt tattactttg tatcagtgct tttactaaat tgtctgcttg atttttaatg 2760
ctagtaattt cagttgtaac aggatgaaac ataagcaaag cgtagttttc ataatttata 2820
tcataatatt tttttgcttc gctaagtgaa attttattat cgtttaaaag ttctaaatca 2880
ggcgaaccta tgataaaaat agatttttca tcttctccaa gctgcattaa acgccttttt 2940
gcaaactcat catttactaa atgaatatga gctagttttg atatagcgtg gcgtaagcta 3000
tcgtcaatag ttcctgaaat ctctccgcct tcaatatgcg ctactaagat attatttaat 3060
gctccaacaa tagctgctgc taaaggctca attctatctc catgtactac gattaaatca 3120
ggttttagct catttgcata ccttgaaaat ccatcaattg tagtagctaa agccttatca 3180
gtttgataat atttatcata atttataaat tcataaatat ttttaaagcc atttttataa 3240
agttctttaa ctgtatagcc aaaattttta cttaagtgca ttcctgttgc aaagatgtaa 3300
agttcaaatt cgcttgagtt ttgcaccctg tacattaaag atttaatctt agaataatca 3360
gccctagagc ctgttataaa aaggattttt ttcacgcaaa atcctcatag cttaactgag 3420
catcattttc tatatctctt aatgcttttt tgcctaaaat attttcaaat tcagccgcac 3480
taattccacc aagtccaggt cttttaaccc aaatattatc catagataaa acttcgcctt 3540
ttttaatatc tttaatgcta actacacttg caaaggcaaa atcaattgta acttgttctt 3600
gtttagccgc ttttttactt tcattatttc ctcttattat agccatttgc tcactttgta 3660
taattagctc ttttaaagcc tttgtatcca tagaacaaac tatatcaggg ccacttctat 3720
gcatactatc agtaaaatgt ctttcaagca cacaagctcc aagtacaact gcacctaaac 3780
acgcaagatt atctgttgtg tggtcgctta agcctaccat acaagaaaat tcttttttta 3840
actcaagcat agcgtttaat cttacaagat tatgcggggt tgggtaaaga ttggtcgtgt 3900
gcattaaaac aaaaggaatt tcattgtcta ataagatttt tacagttggt tttatacttt 3960
caatactatt cattcctgtg ctaactatca taggcttttt aaaggctgct atgtgtttaa 4020
taagcggata attattacac tcacctgaac caatcttaaa agcactaact cccatatctt 4080
ctaagcggtt cgcacctgca cgagaaaaag gtgtgctaag ataaacaaga cctaattttt 4140
ctgtgtattc tttaagtgct agctcatctt tataatccaa agcacatttt tgcataatct 4200
cataaatgct tatttttgca ttaccaggaa ttactttttt agcggcctta ctcatctcat 4260
cttcaacaat atgagtttga tgctttataa tcttagcacc tgcgctaaag gctgcatcta 4320
ccataatttt agctagttct aaactgccat tatgattaat gcctatttca ggtacgacta 4380
agggtgcttt ttcttcactt atgattatat tttgtatttt tatttctttc atttattttc 4440
ctccttagtc gacggtacac ttaaaagttg atcggattcg gcatttcttc aaaaaaaatc 4500
tgttccggag taataacgtt cagcatcagc atcagtttgc tcagggtctg ggatttggca 4560
tcgttttcat ttttgatttt ttcggagccc aggaatacta ctttatcgat gtttttcggt 4620
ggcaggctaa agtacacggt agacatgatg ccacctacat agtccggcag agagttggtc 4680
atcatcagaa cttcgaacgg gatgttggcc gggatttttt ccgcaccggt tttgcggata 4740
atatagtcgt tgatatcgtc gcctttcggg tggcctttga agaagatttt aatgtcgtta 4800
cccagataga atttgccgtt cggtttgata aaggattcca ggatttccgt ctgcagtttc 4860
gcgttgttca gacgtttttt tttatctttc tcccaggtgg tggtaccggt gaagatgaaa 4920
gttttatatt ctttgttttt ggtaccaatg ttcagttcgt tgaagatgtt ctgatcaaag 4980
tgagtaattt tcaggaacag ttctttctgg ttcttagaga agtgagaaaa gcggctcaga 5040
tccatgctaa caatggtgtc agacaggaaa tgcttcagcg gctgcatctt ttcgtcgata 5100
tccagatagt ccgggcgcag cagaatgtat tcggtcggaa aaatcttgtg ccaagtgtaa 5160
cgggtcagag aatgcagttt gtcggtatca gtttcacggt tctccagtgc gtccttcagc 5220
tttttctgtg cttcgatcag gattgcgctg atgttttcct gacgatgctg atacagatct 5280
acgtagttac cagagccgtc gtcgtacaga tacagctttt cgatgttgat cttgtggaac 5340
agcggggaca gggttttgaa aatagacagc agagaacgaa cagaatgatc caggttagtg 5400
tgaataatca ggtccaccgg ggtatcgctt ttttcgatgt tcaggtacag tttgtcgctg 5460
aactccttaa tgtccagaat gctcactttg gagaactcga tgcgctcttt ggagaaagag 5520
ttcagaattt ctttgttgaa atcgaagcgt tcaaaaccga tgatacgttc cactttctca 5580
ttatttttgt tttcaaccag attcaggatc atgttcaggc taggcaggga tgcgtagtcc 5640
aggtaaattt ccatatgtat atctccttct tgaattctaa caattgattg aatgtatgca 5700
aataaatgca tacaccatag gtgtggttta atttgatgcc ctttttcagg gctggaatgt 5760
gtaagagcgg ggttatttat gctgttgttt ttttgttact cgggaagggc tttacctctt 5820
ccgcataaac gcttccatca gcgtttatag ttaaaaaaat ctttcggaac tggttttgcg 5880
cttaccccaa ccaacagggg atttgctgct ttccattgag cctgtttctc tgcgcgacgt 5940
tcgcggcggc gtgtttgtgc atccatctgg attctcctgt cagttagctt tggtggtgtg 6000
tggcagttgt agtcctgaac gaaaaccccc cgcgattggc acattggcag ctaatccgga 6060
atcgcactta cggccaatgc ttcgtttcgt atcacacacc ccaaagcctt ctgctttgaa 6120
tgctgccctt cttcagggct taatttttaa gagcgtcacc ttcatggtgg tcagtgcgtc 6180
ctgctgatgt gctcagtatc accgccagtg gtatttatgt caacaccgcc agagataatt 6240
tatcaccgca gatggttatc tgtatgtttt ttatatgaat ttattttttg caggggggca 6300
ttgtttggta ggtgagagat caattctgca ttaatgaatc ggccaacgcg cggggagagg 6360
cggtttgcgt attgggcgct cttccgctgc tagcggagtg tatactggct tactatgttg 6420
gcactgatga gggtgtcagt gaagtgcttc atgtggcagg agaaaaaagg ctgcaccggt 6480
gcgtcagcag aatatgtgat acaggatata ttccgcttcc tcgctcactg actcgctacg 6540
ctcggtcgtt cgactgcggc gagcggaaat ggcttacgaa cggggcggag atttcctgga 6600
agatgccagg aagatactta acagggaagt gagagggccg cggcaaagcc gtttttccat 6660
aggctccgcc cccctgacaa gcatcacgaa atctgacgct caaatcagtg gtggcgaaac 6720
ccgacaggac tataaagata ccaggcgttt ccccctggcg gctccctcgt gcgctctcct 6780
gttcctgcct ttcggtttac cggtgtcatt ccgctgttat ggccgcgttt gtctcattcc 6840
acgcctgaca ctcagttccg ggtaggcagt tcgctccaag ctggactgta tgcacgaacc 6900
ccccgttcag tccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccgga 6960
aagacatgca aaagcaccac tggcagcagc cactggtaat tgatttagag gagttagtct 7020
tgaagtcatg cgccggttaa ggctaaactg aaaggacaag ttttggtgac tgcgctcctc 7080
caagccagtt acctcggttc aaagagttgg tagctcagag aaccttcgaa aaaccgccct 7140
gcaaggcggt tttttcgttt tcagagcaag agattacgcg cagaccaaaa cgatctcaag 7200
aagatcatct tattaatcag ataaaatatt tctaggcggc cgcgaacgaa aactcacgtt 7260
aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 7320
aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 7380
gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 7440
gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg 7500
caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag 7560
ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta 7620
attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg 7680
ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg 7740
gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct 7800
ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta 7860
tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg 7920
gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc 7980
cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 8040
gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 8100
tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 8160
ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 8220
gttgaatact catactcttc ctttttcaat attattgaag catttatcag ggttattgtc 8280
tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca 8340
catttccccg aaaagtgcca cctgacgtct aagaaaccat tattatcatg acattaacct 8400
ataaaaatag gcgtatcacg aggccctttc gtc 8433

<210> 18
<211> 397
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant version of BstC
<400> 18
Met Glu Ile Tyr Leu Asp Tyr Ala Ser Leu Pro Ser Leu Asn Met Ile
1 5 10 15
Leu Asn Leu Val Glu Asn Lys Asn Asn Glu Lys Val Glu Arg Ile Ile
20 25 30
Gly Phe Glu Arg Phe Asp Phe Asn Lys Glu Ile Leu Asn Ser Phe Ser
35 40 45
Lys Glu Arg Ile Glu Phe Ser Lys Val Ser Ile Leu Asp Ile Lys Glu
50 55 60
Phe Ser Asp Lys Leu Tyr Leu Asn Ile Glu Lys Ser Asp Thr Pro Val
65 70 75 80
Asp Leu Ile Ile His Thr Asn Leu Asp His Ser Val Arg Ser Leu Leu
85 90 95
Ser Ile Phe Lys Thr Leu Ser Pro Leu Phe His Lys Ile Asn Ile Glu
100 105 110
Lys Leu Tyr Leu Tyr Asp Asp Gly Ser Gly Asn Tyr Val Asp Leu Tyr
115 120 125
Gln His Arg Gln Glu Asn Ile Ser Ala Ile Leu Ile Glu Ala Gln Lys
130 135 140
Lys Leu Lys Asp Ala Leu Glu Asn Arg Glu Thr Asp Thr Asp Lys Leu
145 150 155 160
His Ser Leu Thr Arg Tyr Thr Trp His Lys Ile Phe Pro Thr Glu Tyr
165 170 175
Ile Leu Leu Arg Pro Asp Tyr Leu Asp Ile Asp Glu Lys Met Gln Pro
180 185 190
Leu Lys His Phe Leu Ser Asp Thr Ile Val Ser Met Asp Leu Ser Arg
195 200 205
Phe Ser His Phe Ser Lys Asn Gln Lys Glu Leu Phe Leu Lys Ile Thr
210 215 220
His Phe Asp Gln Asn Ile Phe Asn Glu Leu Asn Ile Gly Thr Lys Asn
225 230 235 240
Lys Glu Tyr Lys Thr Phe Ile Phe Thr Gly Thr Thr Thr Trp Glu Lys
245 250 255
Asp Lys Lys Lys Arg Leu Asn Asn Ala Lys Leu Gln Thr Glu Ile Leu
260 265 270
Glu Ser Phe Ile Lys Pro Asn Gly Lys Phe Tyr Leu Gly Asn Asp Ile
275 280 285
Lys Ile Phe Phe Lys Gly His Pro Lys Gly Asp Asp Ile Asn Asp Tyr
290 295 300
Ile Ile Arg Lys Thr Gly Ala Glu Lys Ile Pro Ala Asn Ile Pro Phe
305 310 315 320
Glu Val Leu Met Met Thr Asn Ser Leu Pro Asp Tyr Val Gly Gly Ile
325 330 335
Met Ser Thr Val Tyr Phe Ser Leu Pro Pro Lys Asn Ile Asp Lys Val
340 345 350
Val Phe Leu Gly Ser Glu Lys Ile Lys Asn Glu Asn Asp Ala Lys Ser
355 360 365
Gln Thr Leu Ser Lys Leu Met Leu Met Leu Asn Val Ile Thr Pro Glu
370 375 380
Gln Ile Phe Phe Glu Glu Met Pro Asn Pro Ile Asn Phe
385 390 395

<210> 19
<211> 417
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant version of BstC
<400> 19
Met Arg Lys Ile Ile Thr Phe Phe Ser Leu Phe Phe Ser Ile Ser Ala
1 5 10 15
Trp Cys Gln Lys Met Glu Ile Tyr Leu Asp Tyr His Ser Leu Pro Ser
20 25 30
Leu Asn Met Ile Leu Asn Leu Val Glu Asn Lys Asn Asn Glu Lys Val
35 40 45
Glu Arg Ile Ile Gly Phe Glu Arg Phe Asp Phe Asn Lys Glu Ile Leu
50 55 60
Asn Ser Phe Ser Lys Glu Arg Ile Glu Phe Ser Lys Val Ser Ile Leu
65 70 75 80
Asp Ile Lys Glu Phe Ser Asp Lys Leu Tyr Leu Asn Ile Glu Lys Ser
85 90 95
Asp Thr Pro Val Asp Leu Ile Ile His Thr Asn Leu Asp His Ser Val
100 105 110
Arg Ser Leu Leu Ser Ile Phe Lys Thr Leu Ser Pro Leu Phe His Lys
115 120 125
Ile Asn Ile Glu Lys Leu Tyr Leu Tyr Asp Asp Gly Ser Ala Asn Tyr
130 135 140
Val Asp Leu Tyr Gln His Arg Gln Glu Asn Ile Ser Ala Ile Leu Ile
145 150 155 160
Glu Ala Gln Lys Lys Leu Lys Asp Ala Leu Glu Asn Arg Glu Thr Asp
165 170 175
Thr Asp Lys Leu His Ser Leu Thr Arg Tyr Thr Trp His Lys Ile Phe
180 185 190
Pro Thr Glu Tyr Ile Leu Leu Arg Pro Asp Tyr Leu Asp Ile Asp Glu
195 200 205
Lys Met Gln Pro Leu Lys His Phe Leu Ser Asp Thr Ile Val Ser Met
210 215 220
Asp Leu Ser Arg Phe Ser His Phe Ser Lys Asn Gln Lys Glu Leu Phe
225 230 235 240
Leu Lys Ile Thr His Phe Asp Gln Asn Ile Phe Asn Glu Leu Asn Ile
245 250 255
Gly Thr Lys Asn Lys Glu Tyr Lys Thr Phe Ile Phe Thr Gly Thr Thr
260 265 270
Thr Trp Glu Lys Asp Lys Lys Lys Arg Leu Asn Asn Ala Lys Leu Gln
275 280 285
Thr Glu Ile Leu Glu Ser Phe Ile Lys Pro Asn Gly Lys Phe Tyr Leu
290 295 300
Gly Asn Asp Ile Lys Ile Phe Phe Lys Gly His Pro Lys Gly Asp Asp
305 310 315 320
Ile Asn Asp Tyr Ile Ile Arg Lys Thr Gly Ala Glu Lys Ile Pro Ala
325 330 335
Asn Ile Pro Phe Glu Val Leu Met Met Thr Asn Ser Leu Pro Asp Tyr
340 345 350
Val Gly Gly Ile Met Ser Thr Val Tyr Phe Ser Leu Pro Pro Lys Asn
355 360 365
Ile Asp Lys Val Val Phe Leu Gly Ser Glu Lys Ile Lys Asn Glu Asn
370 375 380
Asp Ala Lys Ser Gln Thr Leu Ser Lys Leu Met Leu Met Leu Asn Val
385 390 395 400
Ile Thr Pro Glu Gln Ile Phe Phe Glu Glu Met Pro Asn Pro Ile Asn
405 410 415
Phe

<210> 20
<211> 264
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant version of BstD
<400> 20
Met Phe Lys Ile Lys Ser Tyr Gly Lys Asn Pro Gln Leu Gln Ala Val
1 5 10 15
Asp Ile Tyr Ile Asp His Ala Thr Ile Pro Ser Leu Ser Tyr Phe Leu
20 25 30
His Phe Leu Lys His Lys His Asp His Gln Arg Leu Arg Leu Phe Ser
35 40 45
Leu Ala Arg Phe Glu Met Pro Gln Thr Val Ile Glu Gln Tyr Glu Gly
50 55 60
Ile Ile Gln Phe Ser Arg Asn Val Glu His Asn Val Glu Pro Leu Leu
65 70 75 80
Glu Gln Leu Gln Thr Ile Leu Ser Gln Glu Gly Lys Gln Phe Glu Leu
85 90 95
His Leu His Leu Asn Leu Phe His Ser Phe Glu Met Phe Leu Asn Leu
100 105 110
Ser Pro Thr Tyr Thr Lys Tyr Lys Glu Lys Ile Ser Lys Ile Val Leu
115 120 125
His Leu Tyr Asp Asp Gly Ser Ala Gly Val Met Lys Gln Tyr Gln Leu
130 135 140
Gln Lys Ser Ser Ser Leu Val Gln Asp Leu Ala Ala Thr Lys Ala Ser
145 150 155 160
Leu Val Ser Leu Phe Glu Asn Gly Glu Gly Ser Phe Ser Gln Ile Asp
165 170 175
Leu Ile Arg Tyr Val Trp Asn Ala Val Leu Glu Thr His Tyr Tyr Leu
180 185 190
Leu Ser Asp His Phe Leu Leu Asp Glu Lys Leu Gln Pro Leu Lys Ala
195 200 205
Glu Leu Gly His Tyr Gln Leu Leu Asn Leu Ser Thr Tyr Gln Tyr Leu
210 215 220
Ser Ser Glu Asp Leu Leu Trp Leu Lys Gln Ile Leu Lys Ile Asp Ala
225 230 235 240
Glu Leu Glu Ser Leu Met Gln Lys Leu Thr Ala Gln Pro Val Tyr Phe
245 250 255
Phe Ser Gly Thr Thr Phe Leu Gly
260

<210> 21
<211> 399
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant version of BstE
<400> 21
Met Leu Ile Gln Gln Asn Leu Glu Ile Tyr Leu Asp His Ala Thr Ile
1 5 10 15
Pro Ser Leu Ala Cys Phe Met His Phe Ile Gln His Lys Asp Asp Val
20 25 30
Asp Ser Ile Arg Leu Phe Gly Leu Ala Arg Phe Asp Ile Pro Gln Ser
35 40 45
Ile Ile Asp Arg Tyr Pro Ala Asn His Leu Phe Tyr His Asn Ile Asp
50 55 60
Asn Arg Asp Leu Thr Ala Val Leu Asn Gln Leu Ala Asp Ile Leu Ala
65 70 75 80
Gln Glu Asn Lys Arg Phe Gln Ile Asn Leu His Leu Asn Leu Phe His
85 90 95
Ser Ile Asp Leu Phe Phe Ala Ile Tyr Pro Ile Tyr Gln Gln Tyr Gln
100 105 110
His Lys Ile Ser Thr Ile Gln Leu Gln Leu Tyr Asp Asp Gly Ser Ala
115 120 125
Gly Ile Val Thr Gln His Ser Leu Cys Lys Ile Ala Asp Leu Glu Gln
130 135 140
Leu Ile Leu Gln His Lys Asn Val Leu Leu Glu Leu Leu Thr Lys Gly
145 150 155 160
Thr Ala Asn Val Pro Asn Pro Thr Leu Leu Arg Tyr Leu Trp Asn Asn
165 170 175
Ile Ile Asp Ser Gln Phe His Leu Ile Ser Asp His Phe Leu Gln His
180 185 190
Pro Lys Leu Gln Pro Leu Lys Arg Leu Leu Lys Arg Tyr Thr Ile Leu
195 200 205
Asp Phe Thr Cys Tyr Pro Arg Phe Asn Ala Glu Gln Lys Gln Leu Leu
210 215 220
Lys Glu Ile Leu His Ile Ser Asn Glu Leu Glu Asn Leu Leu Lys Leu
225 230 235 240
Leu Lys Gln His Asn Thr Phe Leu Phe Thr Gly Thr Thr Ala Phe Asn
245 250 255
Leu Asp Gln Glu Lys Leu Asp Leu Leu Thr Gln Leu His Ile Leu Leu
260 265 270
Leu Asn Glu His Gln Asn Pro His Ser Thr His Tyr Ile Gly Asn Asn
275 280 285
Tyr Leu Leu Leu Ile Lys Gly His Ala Asn Ser Pro Ala Leu Asn His
290 295 300
Thr Leu Ala Leu His Phe Pro Asp Ala Ile Phe Leu Pro Ala Asn Ile
305 310 315 320
Pro Phe Glu Ile Phe Ala Met Leu Gly Phe Thr Pro Asn Lys Met Gly
325 330 335
Gly Phe Ala Ser Thr Ser Tyr Ile Asn Tyr Pro Thr Glu Asn Ile Asn
340 345 350
His Leu Phe Phe Leu Thr Ser Asp Gln Pro Ser Ile Arg Thr Lys Trp
355 360 365
Leu Asp Tyr Glu Lys Gln Phe Gly Leu Met Tyr Ser Leu Leu Ala Met
370 375 380
Gln Lys Ile Asn Glu Asp Gln Ala Phe Met Cys Thr Ile His Asn
385 390 395

<210> 22
<211> 498
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant version of BstH
<400> 22
Met Lys Arg Leu Phe Arg Leu Phe Leu Cys Leu Ala Leu Leu Ser Gly
1 5 10 15
Thr Ala Ala Cys Ser Asp Asp Glu Val Ser Gln Asn Leu Ile Val Ile
20 25 30
Asn Gly Gly Glu His Phe Leu Ser Leu Asp Gly Leu Ala Arg Ala Gly
35 40 45
Lys Ile Ser Val Leu Ala Pro Ala Pro Trp Arg Val Thr Lys Ala Ala
50 55 60
Gly Asp Thr Trp Phe Arg Leu Ser Ala Thr Glu Gly Pro Ala Gly Tyr
65 70 75 80
Ser Glu Val Glu Leu Ser Leu Asp Glu Asn Pro Gly Ala Ala Arg Ser
85 90 95
Ala Gln Leu Ala Phe Ala Cys Gly Asp Ala Ile Val Pro Phe Arg Leu
100 105 110
Ser Gln Gly Ala Leu Ser Ala Gly Tyr Asp Ser Pro Asp Tyr Tyr Phe
115 120 125
Tyr Val Thr His Gly Thr Met Pro Thr Leu Tyr Ala Gly Ile His Leu
130 135 140
Leu Ser His Asp Lys Pro Gly Tyr Val Phe Tyr Ser Arg Ser Lys Thr
145 150 155 160
Phe Asp Pro Ala Glu Phe Pro Ala Arg Ala Glu Val Thr Thr Ala Ala
165 170 175
Asp Arg Thr Ala Asp Ala Thr Gln Ala Glu Met Glu Ala Met Ala Arg
180 185 190
Glu Met Lys Arg Arg Ile Leu Glu Ile Asn Ser Ala Asp Pro Thr Ala
195 200 205
Val Phe Gly Leu Tyr Val Asp Asp Leu Arg Cys Arg Ile Gly Tyr Asp
210 215 220
Trp Phe Val Ala Gln Gly Ile Asp Ser Ala Arg Val Lys Val Ser Met
225 230 235 240
Leu Ser Asp Gly Thr Gly Thr Tyr Asn Ala Phe Tyr Asn Tyr Phe Gly
245 250 255
Asp Ala Ala Thr Ala Glu Gln Asn Trp Glu Ser Tyr Ala Ser Glu Val
260 265 270
Glu Ala Leu Asp Trp Asn His Gly Gly Arg Tyr Pro Glu Thr Arg Ser
275 280 285
Leu Pro Glu Phe Glu Ser Tyr Thr Trp Pro Tyr Tyr Leu Ser Thr Arg
290 295 300
Pro Asp Tyr Arg Leu Val Val Gln Asp Gly Ser Leu Leu Glu Ser Ser
305 310 315 320
Cys Pro Phe Ile Thr Glu Lys Leu Gly Glu Met Glu Ile Glu Ser Ile
325 330 335
Gln Pro Tyr Glu Met Leu Ser Ala Leu Pro Glu Ser Ser Arg Lys Arg
340 345 350
Phe Tyr Asp Met Ala Gly Phe Asp Tyr Asp Lys Phe Ala Ala Leu Phe
355 360 365
Asp Ala Ser Pro Lys Lys Asn Leu Ile Ile Ile Gly Thr Ser His Ala
370 375 380
Asp Asp Ala Ser Ala Arg Leu Gln Arg Asp Tyr Val Ala Arg Ile Met
385 390 395 400
Glu Gln Tyr Gly Ala Gln Tyr Asp Val Phe Phe Lys Pro His Pro Ala
405 410 415
Asp Thr Thr Ser Ala Gly Tyr Glu Thr Glu Phe Pro Gly Leu Thr Leu
420 425 430
Leu Pro Gly Gln Met Pro Phe Glu Ile Phe Val Trp Ser Leu Ile Asp
435 440 445
Arg Val Asp Met Ile Gly Gly Tyr Pro Ser Thr Val Phe Leu Thr Val
450 455 460
Pro Val Asp Lys Val Arg Phe Ile Phe Ala Ala Asp Ala Ala Ser Leu
465 470 475 480
Val Arg Pro Leu Asn Ile Leu Phe Arg Asp Ala Thr Asp Val Glu Trp
485 490 495
Met Gln

<210> 23
<211> 410
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant version of BstI
<400> 23
Met Glu Phe Cys Lys Met Ala Thr Thr Gln Lys Ile Cys Val Tyr Leu
1 5 10 15
Asp His Ala Thr Ile Pro Ser Leu Asn Tyr Ile Leu His Phe Ala Gln
20 25 30
His Phe Glu Asp Gln Glu Thr Ile Arg Leu Phe Gly Leu Ser Arg Phe
35 40 45
His Ile Pro Glu Ser Val Ile Gln Arg Tyr Pro Lys Gly Val Val Gln
50 55 60
Phe Tyr Pro Asn Gln Glu Lys Asp Phe Ser Ala Leu Leu Leu Ala Leu
65 70 75 80
Lys Asn Ile Leu Ile Glu Val Lys Gln Gln Gln Arg Lys Cys Glu Ile
85 90 95
Glu Leu His Leu Asn Leu Phe His Tyr Gln Leu Leu Leu Leu Pro Phe
100 105 110
Leu Ser Leu Tyr Leu Asp Thr Gln Asp Tyr Cys His Leu Thr Leu Lys
115 120 125
Phe Tyr Asp Asp Gly Ser Ala Ala Ile Ser Ala Leu Gln Glu Leu Ala
130 135 140
Leu Ala Pro Asp Leu Ala Ala Gln Ile Gln Phe Glu Lys Gln Gln Phe
145 150 155 160
Asp Glu Leu Val Val Lys Lys Ser Phe Lys Leu Ser Leu Leu Ser Arg
165 170 175
Tyr Phe Trp Gly Lys Leu Phe Glu Ser Glu Tyr Ile Trp Phe Asn Gln
180 185 190
Ala Ile Leu Gln Lys Ala Glu Leu Gln Ile Leu Lys Gln Glu Ile Ser
195 200 205
Ser Ser Arg Gln Met Asp Phe Ala Ile Tyr Gln Gln Met Ser Asp Glu
210 215 220
Gln Lys Gln Leu Val Leu Glu Ile Leu Asn Ile Asp Leu Asn Lys Val
225 230 235 240
Ala Tyr Leu Lys Gln Leu Met Glu Asn Gln Pro Ser Phe Leu Phe Leu
245 250 255
Gly Thr Thr Leu Phe Asn Ile Thr Gln Glu Thr Lys Thr Trp Leu Met
260 265 270
Gln Met His Val Asp Leu Ile Gln Gln Tyr Cys Leu Pro Ser Gly Gln
275 280 285
Phe Phe Asn Asn Lys Ala Gly Tyr Leu Cys Phe Tyr Lys Gly His Pro
290 295 300
Asn Glu Lys Glu Met Asn Gln Met Ile Leu Ser Gln Phe Lys Asn Leu
305 310 315 320
Ile Ala Leu Pro Asp Asp Ile Pro Leu Glu Ile Leu Leu Leu Leu Gly
325 330 335
Val Ile Pro Ser Lys Val Gly Gly Phe Ala Ser Ser Ala Leu Phe Asn
340 345 350
Phe Thr Pro Ala Gln Ile Glu Asn Ile Ile Phe Phe Thr Pro Arg Tyr
355 360 365
Phe Glu Lys Asp Asn Arg Leu His Ala Thr Gln Tyr Arg Leu Met Gln
370 375 380
Gly Leu Ile Glu Leu Gly Tyr Leu Asp Ala Glu Lys Ser Val Thr His
385 390 395 400
Phe Glu Ile Met Gln Leu Leu Thr Lys Glu
405 410

<210> 24
<211> 367
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant version of BstJ
<400> 24
Met Leu Val Asn Asn Gln Ser His Asn Pro Lys Leu Ile Cys Trp Gln
1 5 10 15
Arg His Pro Val Asn Asp Glu Ala Leu Leu Gln Gly Ile Asn Ala Ala
20 25 30
Ser Phe Val Ser Ile Ala Ser Leu Cys Gln His Ala Ala Thr Leu Leu
35 40 45
Ala Gly His Pro His Ser His Ile Thr Ile Tyr Gly Asn Thr Tyr Trp
50 55 60
Ser Lys Asp Leu Ala Arg Leu Ile Arg Tyr Leu Thr Arg Ile Ser Gly
65 70 75 80
Val Glu Ile Lys Lys Leu Glu Leu Ile Asp Asp Gly Ser Ser Glu Tyr
85 90 95
Gln Lys Met Phe Tyr Trp Gln Arg Leu His Ser Glu Glu Gln Thr Arg
100 105 110
Asp Leu Ala Thr Gly Leu Lys Asn Leu Lys Ser Tyr Leu Ser Gly Asn
115 120 125
Asp Asn Lys Leu Leu Arg Leu Leu Thr Gly His Ser Asn Lys Leu Pro
130 135 140
Arg Arg Leu Ser Ser Phe Met Asn Trp His Gln Leu Phe Pro Thr Thr
145 150 155 160
Tyr His Met Leu Arg Met Asp Tyr Leu Asp Lys Pro Glu Leu His Gln
165 170 175
Leu Lys Gln Tyr Leu Gly Asn Asn Ala Gln Gln Ile Arg Trp Asn Tyr
180 185 190
Ile Ala Asp Asn Leu Phe Asp Asp Glu Gln Gln Ser Leu Phe Tyr Gln
195 200 205
Leu Leu Gly Ile Ser Leu Ala Glu Gln Lys Gln Leu Arg Ala Gly Arg
210 215 220
Gln Gln Leu His Asp Phe Met Phe Ile Gly Val Asp Ser Ser Asn Ala
225 230 235 240
Ser Ser Lys Leu Gln Ile Asn Val Ile Ala Asp Ser Arg Gln Glu Ser
245 250 255
Gly Ile Ile Pro Thr Ile Thr Ala Lys Lys Met Leu Phe Lys Gly His
260 265 270
Pro Phe Ala Asn Phe Asn Gln Thr Ile Val Asp Ala His Gln Met Gly
275 280 285
Glu Met Pro Ala Met Ile Pro Phe Glu Thr Leu Ile Met Thr Gly Asn
290 295 300
Leu Pro Gln Lys Val Gly Gly Met Ala Ser Ser Leu Tyr Phe Ser Leu
305 310 315 320
Pro Asn Asn Tyr His Ile Glu Tyr Ile Val Phe Ser Gly Ser Lys Lys
325 330 335
Asp Leu Glu Gln His Ala Leu Leu Gln Ile Met Leu Tyr Leu Lys Val
340 345 350
Ile Ser Pro Glu Arg Val Tyr Phe Ser Glu Gln Phe Lys Ser Cys
355 360 365

<210> 25
<211> 318
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant version of BstM
<400> 25
Met Lys Lys Pro Leu Ile Ile Ala Gly Asn Gly Pro Ser Ile Lys Asp
1 5 10 15
Leu Asp Tyr Ser Leu Phe Pro Lys Asp Phe Glu Val Phe Arg Cys Asn
20 25 30
Gln Phe Tyr Phe Glu Asp Lys Tyr Tyr Leu Gly Arg Glu Ile Lys Gly
35 40 45
Val Phe Phe Asn Pro Cys Val Leu Ser Ser Gln Met Gln Thr Ala Gln
50 55 60
Tyr Leu Met Asp Asn Gly Glu Tyr Ser Ile Glu Arg Phe Phe Cys Ser
65 70 75 80
Val Ser Thr Asp Arg His Asp Phe Asp Gly Asp Tyr Gln Thr Ile Leu
85 90 95
Pro Val Glu Gly Tyr Leu His Ala His Tyr Pro Phe Val Cys Asp Thr
100 105 110
Phe Ser Leu Phe Lys Gly His Glu Glu Ile Leu Arg His Val Lys Tyr
115 120 125
His Leu Lys Thr Tyr Ser Lys Glu Leu Ser Ala Gly Val Leu Met Leu
130 135 140
Leu Ser Ala Val Val Leu Gly Tyr Lys Glu Ile Tyr Leu Val Gly Ile
145 150 155 160
Asp Phe Gly Ala Ser Ser Trp Gly His Phe Tyr Asp Glu Ser Gln Ser
165 170 175
Gln His Phe Ser Asn His Met Ala Asp Cys His Asn Ile Tyr Tyr Asp
180 185 190
Met Phe Thr Ile Cys Leu Cys Gln Lys Tyr Ala Lys Leu Tyr Ala Leu
195 200 205
Ala Pro Asn Ser Pro Leu Arg His Ile Leu Ala Leu Asn Pro Ala Ala
210 215 220
Lys Tyr His Phe Glu Leu Leu Asp Lys Pro Ile Gly Tyr Thr Ser Asp
225 230 235 240
Leu Ile Val Ser Leu Pro Leu Glu Glu Lys Leu Leu Glu Phe Lys Asn
245 250 255
Ile Glu Glu Lys Leu Leu Glu Phe Lys Asn Ile Glu Glu Lys Leu Leu
260 265 270
Glu Phe Lys Asn Ile Glu Glu Lys Leu Leu Val Asn Arg Leu Lys Asn
275 280 285
Ile Leu Arg Lys Ile Lys Arg Lys Ile Leu Pro Phe Trp Gly Gly Gly
290 295 300
Gly Asn Thr His Leu Lys Val Ser Phe Arg Trp Gly Val Ala
305 310 315

<210> 26
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant version of BstN
<400> 26
Met Ser Glu Lys Ile Phe Ser Gln Val Asp Glu Lys Asn Gln Lys Lys
1 5 10 15
Pro Leu Ile Ile Ala Gly Asn Gly Pro Ser Ile Lys Asp Leu Asp Tyr
20 25 30
Ser Leu Phe Pro Lys Asp Phe Asp Val Phe Arg Cys Asn Gln Phe Tyr
35 40 45
Phe Glu Asp Lys Tyr Tyr Leu Gly Lys Glu Val Lys Gly Val Phe Phe
50 55 60
Asn Pro Cys Val Phe His Asn Gln Met Asn Thr Ala Lys His Leu Ile
65 70 75 80
Asp Asn Asn Glu Tyr Tyr Ile Glu Gln Phe Phe Cys Ser Val Ser Lys
85 90 95
Glu Gln His Asp Phe Asn Gly Asp Tyr Gln Thr Ile Leu Ser Val Asp
100 105 110
Glu Tyr Leu His Ala Asn Tyr Pro Phe Val Arg Asp Thr Phe Ser Leu
115 120 125
Phe Gly Glu His Glu Glu Ile Leu Asn His Val Lys Tyr His Leu Lys
130 135 140
Thr Tyr Ser Lys Glu Leu Ser Ala Gly Val Leu Met Leu Leu Ser Ala
145 150 155 160
Ile Val Leu Gly Tyr Lys Glu Ile Tyr Leu Val Gly Val Asp Phe Gly
165 170 175
Ala Asn Ser Trp Gly His Phe Tyr Asp Asp Asn Gln Ser Gln His Phe
180 185 190
Ile Asn His Met Ala Asp Cys His Asn Ile Tyr Tyr Asp Met Leu Thr
195 200 205
Ile Tyr Leu Cys Gln Lys Tyr Ala Lys Leu Tyr Ala Leu Val Pro Asn
210 215 220
Ser Pro Leu Asn His Leu Leu Pro Leu Asn Leu Ala Ala Asn His Val
225 230 235 240
Phe Glu Leu Leu Asp Lys Pro Ile Gly Tyr Thr Ser Asp Leu Ile Val
245 250 255
Ser Ser Pro Leu Glu Glu Lys Leu Leu Glu Ser Lys Asn Ile Asp Glu
260 265 270
Arg Phe Ser Gln Asn Lys Ser Phe Lys Asn Tyr Leu Gln Arg Leu Lys
275 280 285
Asp Lys Phe Leu Gln Met Ile Phe Arg Gly Gly Gly Val Ile Thr Ile
290 295 300
Pro Arg Val Ile Phe Lys Gly Lys Phe Ala
305 310

<210> 27
<211> 397
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant version of BstC
<400> 27
Met Glu Ile Tyr Leu Asp His Ala Ser Leu Pro Ser Leu Asn Met Ile
1 5 10 15
Leu Asn Leu Val Glu Asn Lys Asn Asn Glu Lys Val Glu Arg Ile Ile
20 25 30
Gly Phe Glu Arg Phe Asp Phe Asn Lys Glu Ile Leu Asn Ser Phe Ser
35 40 45
Lys Glu Arg Ile Glu Phe Ser Lys Val Ser Ile Leu Asp Ile Lys Glu
50 55 60
Phe Ser Asp Lys Leu Tyr Leu Asn Ile Glu Lys Ser Asp Thr Pro Val
65 70 75 80
Asp Leu Ile Ile His Thr Asn Leu Asp His Ser Val Arg Ser Leu Leu
85 90 95
Ser Ile Phe Lys Thr Leu Ser Pro Leu Phe His Lys Ile Asn Ile Glu
100 105 110
Lys Leu Tyr Leu Tyr Asp Asp Gly Ser Val Asn Tyr Val Asp Leu Tyr
115 120 125
Gln His Arg Gln Glu Asn Ile Ser Ala Ile Leu Ile Glu Ala Gln Lys
130 135 140
Lys Leu Lys Asp Ala Leu Glu Asn Arg Glu Thr Asp Thr Asp Lys Leu
145 150 155 160
His Ser Leu Thr Arg Tyr Thr Trp His Lys Ile Phe Pro Thr Glu Tyr
165 170 175
Ile Leu Leu Arg Pro Asp Tyr Leu Asp Ile Asp Glu Lys Met Gln Pro
180 185 190
Leu Lys His Phe Leu Ser Asp Thr Ile Val Ser Met Asp Leu Ser Arg
195 200 205
Phe Ser His Phe Ser Lys Asn Gln Lys Glu Leu Phe Leu Lys Ile Thr
210 215 220
His Phe Asp Gln Asn Ile Phe Asn Glu Leu Asn Ile Gly Thr Lys Asn
225 230 235 240
Lys Glu Tyr Lys Thr Phe Ile Phe Thr Gly Thr Thr Thr Trp Glu Lys
245 250 255
Asp Lys Lys Lys Arg Leu Asn Asn Ala Lys Leu Gln Thr Glu Ile Leu
260 265 270
Glu Ser Phe Ile Lys Pro Asn Gly Lys Phe Tyr Leu Gly Asn Asp Ile
275 280 285
Lys Ile Phe Phe Lys Gly His Pro Lys Gly Asp Asp Ile Asn Asp Tyr
290 295 300
Ile Ile Arg Lys Thr Gly Ala Glu Lys Ile Pro Ala Asn Ile Pro Phe
305 310 315 320
Glu Val Leu Met Met Thr Asn Ser Leu Pro Asp Tyr Val Gly Gly Ile
325 330 335
Met Ser Thr Val Tyr Phe Ser Leu Pro Pro Lys Asn Ile Asp Lys Val
340 345 350
Val Phe Leu Gly Ser Glu Lys Ile Lys Asn Glu Asn Asp Ala Lys Ser
355 360 365
Gln Thr Leu Ser Lys Leu Met Leu Met Leu Asn Val Ile Thr Pro Glu
370 375 380
Gln Ile Phe Phe Glu Glu Met Pro Asn Pro Ile Asn Phe
385 390 395

<210> 28
<211> 397
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant version of BstC
<400> 28
Met Glu Ile Tyr Leu Asp His Ala Ser Leu Pro Ser Leu Asn Met Ile
1 5 10 15
Leu Asn Leu Val Glu Asn Lys Asn Asn Glu Lys Val Glu Arg Ile Ile
20 25 30
Gly Phe Glu Arg Phe Asp Phe Asn Lys Glu Ile Leu Asn Ser Phe Ser
35 40 45
Lys Glu Arg Ile Glu Phe Ser Lys Val Ser Ile Leu Asp Ile Lys Glu
50 55 60
Phe Ser Asp Lys Leu Tyr Leu Asn Ile Glu Lys Ser Asp Thr Pro Val
65 70 75 80
Asp Leu Ile Ile His Thr Asn Leu Asp His Ser Val Arg Ser Leu Leu
85 90 95
Ser Ile Phe Lys Thr Leu Ser Pro Leu Phe His Lys Ile Asn Ile Glu
100 105 110
Lys Leu Tyr Leu Tyr Asp Asp Gly Ser Leu Asn Tyr Val Asp Leu Tyr
115 120 125
Gln His Arg Gln Glu Asn Ile Ser Ala Ile Leu Ile Glu Ala Gln Lys
130 135 140
Lys Leu Lys Asp Ala Leu Glu Asn Arg Glu Thr Asp Thr Asp Lys Leu
145 150 155 160
His Ser Leu Thr Arg Tyr Thr Trp His Lys Ile Phe Pro Thr Glu Tyr
165 170 175
Ile Leu Leu Arg Pro Asp Tyr Leu Asp Ile Asp Glu Lys Met Gln Pro
180 185 190
Leu Lys His Phe Leu Ser Asp Thr Ile Val Ser Met Asp Leu Ser Arg
195 200 205
Phe Ser His Phe Ser Lys Asn Gln Lys Glu Leu Phe Leu Lys Ile Thr
210 215 220
His Phe Asp Gln Asn Ile Phe Asn Glu Leu Asn Ile Gly Thr Lys Asn
225 230 235 240
Lys Glu Tyr Lys Thr Phe Ile Phe Thr Gly Thr Thr Thr Trp Glu Lys
245 250 255
Asp Lys Lys Lys Arg Leu Asn Asn Ala Lys Leu Gln Thr Glu Ile Leu
260 265 270
Glu Ser Phe Ile Lys Pro Asn Gly Lys Phe Tyr Leu Gly Asn Asp Ile
275 280 285
Lys Ile Phe Phe Lys Gly His Pro Lys Gly Asp Asp Ile Asn Asp Tyr
290 295 300
Ile Ile Arg Lys Thr Gly Ala Glu Lys Ile Pro Ala Asn Ile Pro Phe
305 310 315 320
Glu Val Leu Met Met Thr Asn Ser Leu Pro Asp Tyr Val Gly Gly Ile
325 330 335
Met Ser Thr Val Tyr Phe Ser Leu Pro Pro Lys Asn Ile Asp Lys Val
340 345 350
Val Phe Leu Gly Ser Glu Lys Ile Lys Asn Glu Asn Asp Ala Lys Ser
355 360 365
Gln Thr Leu Ser Lys Leu Met Leu Met Leu Asn Val Ile Thr Pro Glu
370 375 380
Gln Ile Phe Phe Glu Glu Met Pro Asn Pro Ile Asn Phe
385 390 395

<210> 29
<211> 397
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant version of BstC
<400> 29
Met Glu Ile Tyr Leu Asp His Ala Ser Leu Pro Ser Leu Asn Met Ile
1 5 10 15
Leu Asn Leu Val Glu Asn Lys Asn Asn Glu Lys Val Glu Arg Ile Ile
20 25 30
Gly Phe Glu Arg Phe Asp Phe Asn Lys Glu Ile Leu Asn Ser Phe Ser
35 40 45
Lys Glu Arg Ile Glu Phe Ser Lys Val Ser Ile Leu Asp Ile Lys Glu
50 55 60
Phe Ser Asp Lys Leu Tyr Leu Asn Ile Glu Lys Ser Asp Thr Pro Val
65 70 75 80
Asp Leu Ile Ile His Thr Asn Leu Asp His Ser Val Arg Ser Leu Leu
85 90 95
Ser Ile Phe Lys Thr Leu Ser Pro Leu Phe His Lys Ile Asn Ile Glu
100 105 110
Lys Leu Tyr Leu Tyr Asp Asp Gly Ser Met Asn Tyr Val Asp Leu Tyr
115 120 125
Gln His Arg Gln Glu Asn Ile Ser Ala Ile Leu Ile Glu Ala Gln Lys
130 135 140
Lys Leu Lys Asp Ala Leu Glu Asn Arg Glu Thr Asp Thr Asp Lys Leu
145 150 155 160
His Ser Leu Thr Arg Tyr Thr Trp His Lys Ile Phe Pro Thr Glu Tyr
165 170 175
Ile Leu Leu Arg Pro Asp Tyr Leu Asp Ile Asp Glu Lys Met Gln Pro
180 185 190
Leu Lys His Phe Leu Ser Asp Thr Ile Val Ser Met Asp Leu Ser Arg
195 200 205
Phe Ser His Phe Ser Lys Asn Gln Lys Glu Leu Phe Leu Lys Ile Thr
210 215 220
His Phe Asp Gln Asn Ile Phe Asn Glu Leu Asn Ile Gly Thr Lys Asn
225 230 235 240
Lys Glu Tyr Lys Thr Phe Ile Phe Thr Gly Thr Thr Thr Trp Glu Lys
245 250 255
Asp Lys Lys Lys Arg Leu Asn Asn Ala Lys Leu Gln Thr Glu Ile Leu
260 265 270
Glu Ser Phe Ile Lys Pro Asn Gly Lys Phe Tyr Leu Gly Asn Asp Ile
275 280 285
Lys Ile Phe Phe Lys Gly His Pro Lys Gly Asp Asp Ile Asn Asp Tyr
290 295 300
Ile Ile Arg Lys Thr Gly Ala Glu Lys Ile Pro Ala Asn Ile Pro Phe
305 310 315 320
Glu Val Leu Met Met Thr Asn Ser Leu Pro Asp Tyr Val Gly Gly Ile
325 330 335
Met Ser Thr Val Tyr Phe Ser Leu Pro Pro Lys Asn Ile Asp Lys Val
340 345 350
Val Phe Leu Gly Ser Glu Lys Ile Lys Asn Glu Asn Asp Ala Lys Ser
355 360 365
Gln Thr Leu Ser Lys Leu Met Leu Met Leu Asn Val Ile Thr Pro Glu
370 375 380
Gln Ile Phe Phe Glu Glu Met Pro Asn Pro Ile Asn Phe
385 390 395

<210> 30
<211> 397
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant version of BstC
<400> 30
Met Glu Ile Tyr Leu Asp His Ala Ser Leu Pro Ser Leu Asn Met Ile
1 5 10 15
Leu Asn Leu Val Glu Asn Lys Asn Asn Glu Lys Val Glu Arg Ile Ile
20 25 30
Gly Phe Glu Arg Phe Asp Phe Asn Lys Glu Ile Leu Asn Ser Phe Ser
35 40 45
Lys Glu Arg Ile Glu Phe Ser Lys Val Ser Ile Leu Asp Ile Lys Glu
50 55 60
Phe Ser Asp Lys Leu Tyr Leu Asn Ile Glu Lys Ser Asp Thr Pro Val
65 70 75 80
Asp Leu Ile Ile His Thr Asn Leu Asp His Ser Val Arg Ser Leu Leu
85 90 95
Ser Ile Phe Lys Thr Leu Ser Pro Leu Phe His Lys Ile Asn Ile Glu
100 105 110
Lys Leu Tyr Leu Tyr Asp Asp Gly Ser Phe Asn Tyr Val Asp Leu Tyr
115 120 125
Gln His Arg Gln Glu Asn Ile Ser Ala Ile Leu Ile Glu Ala Gln Lys
130 135 140
Lys Leu Lys Asp Ala Leu Glu Asn Arg Glu Thr Asp Thr Asp Lys Leu
145 150 155 160
His Ser Leu Thr Arg Tyr Thr Trp His Lys Ile Phe Pro Thr Glu Tyr
165 170 175
Ile Leu Leu Arg Pro Asp Tyr Leu Asp Ile Asp Glu Lys Met Gln Pro
180 185 190
Leu Lys His Phe Leu Ser Asp Thr Ile Val Ser Met Asp Leu Ser Arg
195 200 205
Phe Ser His Phe Ser Lys Asn Gln Lys Glu Leu Phe Leu Lys Ile Thr
210 215 220
His Phe Asp Gln Asn Ile Phe Asn Glu Leu Asn Ile Gly Thr Lys Asn
225 230 235 240
Lys Glu Tyr Lys Thr Phe Ile Phe Thr Gly Thr Thr Thr Trp Glu Lys
245 250 255
Asp Lys Lys Lys Arg Leu Asn Asn Ala Lys Leu Gln Thr Glu Ile Leu
260 265 270
Glu Ser Phe Ile Lys Pro Asn Gly Lys Phe Tyr Leu Gly Asn Asp Ile
275 280 285
Lys Ile Phe Phe Lys Gly His Pro Lys Gly Asp Asp Ile Asn Asp Tyr
290 295 300
Ile Ile Arg Lys Thr Gly Ala Glu Lys Ile Pro Ala Asn Ile Pro Phe
305 310 315 320
Glu Val Leu Met Met Thr Asn Ser Leu Pro Asp Tyr Val Gly Gly Ile
325 330 335
Met Ser Thr Val Tyr Phe Ser Leu Pro Pro Lys Asn Ile Asp Lys Val
340 345 350
Val Phe Leu Gly Ser Glu Lys Ile Lys Asn Glu Asn Asp Ala Lys Ser
355 360 365
Gln Thr Leu Ser Lys Leu Met Leu Met Leu Asn Val Ile Thr Pro Glu
370 375 380
Gln Ile Phe Phe Glu Glu Met Pro Asn Pro Ile Asn Phe
385 390 395
図1
図2
図3
図4
図5
図6A
図6B
図6C
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
【配列表】
2023110032000001.app
【手続補正書】
【提出日】2023-07-03
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
細菌においてシアル化オリゴ糖を生産するための方法であって、外因性ラクトース利用性シアリルトランスフェラーゼ酵素を含む細菌を提供する工程を含み、該酵素が、Δ20BstC*2 (SEQ ID NO:27)、Δ20BstC (SEQ ID NO: 18)、Δ20BstC* (SEQ ID NO: 15)、BstN (SEQ ID NO:10)、BstC (SEQ ID NO: 2)、BstD (SEQ ID NO: 3)、BstE (SEQ ID NO: 4)、BstE* (SEQ ID NO: 16)、BstH (SEQ ID NO: 5)、BstI (SEQ ID NO: 6)、BstJ (SEQ ID NO: 7)、またはBstM (SEQ ID NO: 9)のうちの1つまたは複数のアミノ酸配列に対し少なくとも90%の同一性を有するアミノ酸配列を含む、方法。
【請求項2】
前記酵素が、天然に存在するα(2,3)シアリルトランスフェラーゼよりも高いα(2,6)選択性を前記酵素に与えるアミノ酸配列を含む、請求項1記載の方法。
【請求項3】
前記酵素が、α(2,6)シアリルトランスフェラーゼを含む、請求項1記載の方法。
【請求項4】
シアル化オリゴ糖がシアリルラクトースを含む、請求項1記載の方法。
【請求項5】
シアル化オリゴ糖が、3'-シアリルラクトース(3'-SL)、6'-シアリルラクトース(6'-SL)、3'-シアリル-3-フコシルラクトース(3'-S3FL)、シアリルラクト-N-テトラオースa(SLNT a)、シアリルラクト-N-テトラオースb(SLNT b)、ジシアリルラクト-N-テトラオース(DSLNT)、シアリルラクト-N-フコペンタオースII(SLNFP II)またはシアリルラクト-N-テトラオースc(SLNT c)を含む、請求項1記載の方法。
【請求項6】
前記細菌が、外因性もしくは内因性ラクトース利用性α(1,3)フコシルトランスフェラーゼ酵素、外因性もしくは内因性ラクトース利用性α(1,4)フコシルトランスフェラーゼ酵素、外因性もしくは内因性β(1,3)ガラクトシルトランスフェラーゼ酵素、外因性もしくは内因性β(1,4)ガラクトシルトランスフェラーゼ酵素、外因性もしくは内因性β-1,3-N-アセチルグルコサミニルトランスフェラーゼ、またはそれらの任意の組み合わせをさらに含む、請求項1記載の方法。
【請求項7】
前記細菌が、外因性もしくは内因性N-アセチルノイラミン酸シンターゼ、外因性もしくは内因性UDP-N-アセチルグルコサミン2-エピメラーゼ、外因性もしくは内因性N-アセチルノイラミン酸シチジリルトランスフェラーゼ、またはそれらの任意の組み合わせをさらに含む、請求項1記載の方法。
【請求項8】
前記細菌が、β-ガラクトシドトランスアセチラーゼを発現しない、請求項1記載の方法。
【請求項9】
前記細菌がlacA変異を含む、請求項8記載の方法。
【請求項10】
前記細菌が、外因性ラクトースの存在下で細胞内ラクトースを蓄積する、請求項1記載の方法。
【請求項11】
前記細菌が大腸菌(Escherichia coli;E. coli)である、請求項1記載の方法。
【請求項12】
前記細菌が、以下の遺伝子型:
PlacIq-lacY, Δ(lacI-lacZ), ΔlacA, ΔthyA::(0.8RBS lacZ+), ampC::(Ptrp M13g8 RBS-λcI+, CAT), ΔnanATE::scar
を含む、請求項1記載の方法。
【請求項13】
前記酵素が、SEQ ID NO:27、15、16、20、21、22、23、24、25、26、28、29または30に示されるアミノ酸配列を含む、請求項1記載の方法。
【請求項14】
SEQ ID NO: 27、15、16、20、21、22、23、24、25、26、28、29または30に示される配列内のアミノ酸を含む変異酵素をコードする、核酸。
【請求項15】
SEQ ID NO: 27、15、16、20、21、22、23、24、25、26、28、29または30に示される配列内のアミノ酸を含む、ラクトース利用性シアリルトランスフェラーゼ酵素。
【請求項16】
外因性ラクトース利用性シアリルトランスフェラーゼ酵素を含む単離された細菌であって、該酵素が、Δ20BstC*2 (SEQ ID NO:27)、Δ20BstC (SEQ ID NO: 18)、Δ20BstC* (SEQ ID NO: 15)、BstN (SEQ ID NO:10)、BstC (SEQ ID NO: 2)、BstD (SEQ ID NO: 3)、BstE (SEQ ID NO: 4)、BstE* (SEQ ID NO: 16)、BstH (SEQ ID NO: 5)、BstI (SEQ ID NO: 6)、BstJ (SEQ ID NO: 7)、またはBstM (SEQ ID NO: 9)のうちの1つまたは複数のアミノ酸配列に対し少なくとも90同一性を有するアミノ酸配列を含む、細菌。
【請求項17】
アリルラクトースおよび5%未満のKDO-ラクトースを含む、細菌細胞培養上清であって、請求項16記載の単離された細菌の培養物からのものである、細菌細胞培養上清
【請求項18】
前記酵素が、Δ20BstC * (SEQ ID NO:15)のアミノ酸配列の122位におけるアミノ酸置換を含む、請求項1記載の方法。
【請求項19】
前記酵素が、アミノ酸置換A122V、A122L、A122MまたはA122Fを含む、請求項18記載の方法。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0068
【補正方法】変更
【補正の内容】
【0068】
[本発明1001]
細菌においてシアル化オリゴ糖を生産するための方法であって、外因性ラクトース利用性シアリルトランスフェラーゼ酵素を含む細菌を提供する工程を含み、該酵素が、
(i)少なくとも250アミノ酸のストレッチにわたってPst6-224のアミノ酸配列(SEQ ID NO:1)と5%~30%同一、または
(ii)少なくとも250アミノ酸のストレッチにわたってHAC1268のアミノ酸配列(SEQ ID NO:8)と45%~75%同一
であるアミノ酸配列を含む、方法。
[本発明1002]
前記酵素が、BstN(SEQ ID NO:10)、BstC(SEQ ID NO:2)、Δ20BstC * 2(SEQ ID NO:27)、BstD(SEQ ID NO:3)、Δ20BstC * (SEQ ID NO:15)、Δ20BstC(SEQ ID NO:18)、BstE(SEQ ID NO:4)、BstE * (SEQ ID NO:16)、BstH(SEQ ID NO:5)、BstI(SEQ ID NO:6)、BstJ(SEQ ID NO:7)、またはBstM(SEQ ID NO:9)のうちの1つまたは複数のアミノ酸配列と5%~100%同一であるアミノ酸配列を含む、本発明1001の方法。
[本発明1003]
前記酵素のアミノ酸配列が、BstN(SEQ ID NO:10)、BstC(SEQ ID NO:2)、ΔBstC * 2(SEQ ID NO:27)、BstD(SEQ ID NO:3)、Δ20BstC(SEQ ID NO:18)、Δ20BstC * (SEQ ID NO:15)、BstE(SEQ ID NO:4)、BstE * (SEQ ID NO:16)、BstH(SEQ ID NO:5)、BstI(SEQ ID NO:6)、BstJ(SEQ ID NO:7)、またはBstM(SEQ ID NO:9)のアミノ酸配列と100%未満同一である、本発明1001の方法。
[本発明1004]
前記酵素が、BstN(SEQ ID NO:10)、BstC(SEQ ID NO:2)、ΔBstC * 2(SEQ ID NO:27)、BstD(SEQ ID NO:3)、Δ20BstC(SEQ ID NO:18)、Δ20BstC * (SEQ ID NO:15)、BstE(SEQ ID NO:4)、BstE * (SEQ ID NO:16)、BstH(SEQ ID NO:5)、BstI(SEQ ID NO:6)、BstJ(SEQ ID NO:7)、またはBstM(SEQ ID NO:9)と比較して欠失または挿入を含まない、本発明1001の方法。
[本発明1005]
前記酵素のアミノ酸配列とBstN(SEQ ID NO:10)、BstC(SEQ ID NO:2)、Δ20BstC * 2(SEQ ID NO:27)、BstD(SEQ ID NO:3)、Δ20BstC(SEQ ID NO:18)、Δ20BstC * (SEQ ID NO:15)、BstE(SEQ ID NO:4)、BstE * (SEQ ID NO:16)、BstH(SEQ ID NO:5)、BstI(SEQ ID NO:6)、BstJ(SEQ ID NO:7)、またはBstM(SEQ ID NO:9)のアミノ酸配列との間の相違が、1つまたは複数の保存的アミノ酸置換からなる、本発明1004の方法。
[本発明1006]
前記酵素が、天然に存在する酵素と5%~100%同一であるアミノ酸配列を含む、本発明1001の方法。
[本発明1007]
天然に存在する酵素が、細菌GT80ファミリーのシアリルトランスフェラーゼである、本発明1006の方法。
[本発明1008]
細菌GT80ファミリーのシアリルトランスフェラーゼが、GT-B構造的フォールドを含む、本発明1007の方法。
[本発明1009]
天然に存在する酵素が、微生物によって生産される、本発明1006の方法。
[本発明1010]
微生物が、哺乳類の胃腸管に天然に存在している細菌である、本発明1009の方法。
[本発明1011]
微生物が、フォトバクテリウム(Photobacterium)属、アビバクテリウム(Avibacterium)属、シュワネラ(Shewanella)属、ビベルシュタイニア(Bibersteinia)属、ヘモフィルス(Haemophilus)属、アリステペス(Alistepes)属、アクチノバチルス(Actinobacillus)属またはヘリコバクター(Helicobacter)属の細菌である、本発明1010の方法。
[本発明1012]
シアリルトランスフェラーゼが、α(2,3)シアリルトランスフェラーゼまたはα(2,6)シアリルトランスフェラーゼを含む、本発明1001の方法。
[本発明1013]
前記酵素が、天然に存在するα(2,3)シアリルトランスフェラーゼと比較して変異を含む、本発明1001の方法。
[本発明1014]
前記酵素のアミノ酸配列とBstE * のアミノ酸配列を整列させたとき、該酵素が、BstE * のアミノ酸配列(SEQ ID NO:16)の13位と整列する位置に変異を含んでいる、本発明1013の方法。
[本発明1015]
前記酵素が、BstE * のアミノ酸配列(SEQ ID NO:16)の13位と整列する位置に非保存的変異を含んでいる、本発明1014の方法。
[本発明1016]
前記酵素が、BstE * のアミノ酸配列(SEQ ID NO:16)の13位と整列する位置にヒスチジンまたはアラニンを含んでいる、本発明1015の方法。
[本発明1017]
前記酵素のアミノ酸配列とBstE * のアミノ酸配列を整列させたとき、該酵素が、BstE * のアミノ酸配列(SEQ ID NO:16)の130位と整列する位置に変異を含んでいる、本発明1013の方法。
[本発明1018]
前記酵素が、BstE * のアミノ酸配列(SEQ ID NO:16)の130位と整列する位置に非保存的変異を含んでいる、本発明1017の方法。
[本発明1019]
前記酵素が、BstE * のアミノ酸配列(SEQ ID NO:16)の130位と整列する位置にヒスチジンまたはアラニンを含んでいる、本発明1018の方法。
[本発明1020]
前記変異が、天然に存在するα(2,3)シアリルトランスフェラーゼよりも高いα(2,6)選択性を前記酵素に与える、本発明1001の方法。
[本発明1021]
前記酵素が、α(2,6)シアリルトランスフェラーゼを含む、本発明1001の方法。
[本発明1022]
前記酵素の骨格と天然に存在するシアリルトランスフェラーゼの骨格との間のC α 平均二乗偏差(RMSD)が3Å未満である、本発明1001の方法。
[本発明1023]
天然に存在するシアリルトランスフェラーゼが、Pst6-224、BstC、BstD、BstE、BstH、BstI、BstJ、HAC1268、BstMまたはBstNである、本発明1001の方法。
[本発明1024]
前記細菌が、培養培地中に存在する、本発明1001の方法。
[本発明1025]
前記細菌が、バイオ発酵装置中で培養される、本発明1001の方法。
[本発明1026]
前記細菌からまたは該細菌の培養上清からシアル化オリゴ糖を回収する工程をさらに含む、本発明1001の方法。
[本発明1027]
シアル化オリゴ糖がシアリルラクトースを含む、本発明1001の方法。
[本発明1028]
シアル化オリゴ糖が、3'-シアリルラクトース(3'-SL)、6'-シアリルラクトース(6'-SL)、3'-シアリル-3-フコシルラクトース(3'-S3FL)、シアリルラクト-N-テトラオースa(SLNT a)、シアリルラクト-N-テトラオースb(SLNT b)、ジシアリルラクト-N-テトラオース(DSLNT)、シアリルラクト-N-フコペンタオースII(SLNFP II)またはシアリルラクト-N-テトラオースc(SLNT c)を含む、本発明1001の方法。
[本発明1029]
前記細菌が、外因性もしくは内因性ラクトース利用性α(1,3)フコシルトランスフェラーゼ酵素、外因性もしくは内因性ラクトース利用性α(1,4)フコシルトランスフェラーゼ酵素、外因性もしくは内因性β(1,3)ガラクトシルトランスフェラーゼ酵素、外因性もしくは内因性β(1,4)ガラクトシルトランスフェラーゼ酵素、外因性もしくは内因性β-1,3-N-アセチルグルコサミニルトランスフェラーゼ、またはそれらの任意の組み合わせをさらに含む、本発明1001の方法。
[本発明1030]
前記細菌が、外因性もしくは内因性N-アセチルノイラミン酸シンターゼ、外因性もしくは内因性UDP-N-アセチルグルコサミン2-エピメラーゼ、外因性もしくは内因性N-アセチルノイラミン酸シチジリルトランスフェラーゼ、またはそれらの任意の組み合わせをさらに含む、本発明1001の方法。
[本発明1031]
前記細菌が、カンピロバクター・ジェジュニ(Campylobacter jejuni)由来の外因性N-アセチルノイラミン酸シンターゼ、UDP-N-アセチルグルコサミン2-エピメラーゼおよびN-アセチルノイラミン酸シチジリルトランスフェラーゼを含む、本発明1030の方法。
[本発明1032]
前記細菌が、対応する野生型細菌と比較して低下したレベルのβ-ガラクトシダーゼ活性を含む、本発明1001の方法。
[本発明1033]
低下したレベルのβ-ガラクトシダーゼ活性が、β-ガラクトシダーゼ遺伝子の低下した発現または低下したβ-ガラクトシダーゼ酵素活性を含む、本発明1032の方法。
[本発明1034]
低下したレベルが、ラクトースの存在下での対応する野生型細菌のレベルの10%未満である、本発明1032の方法。
[本発明1035]
前記細菌が、欠失したまたは不活性化された内因性β-ガラクトシダーゼ遺伝子を含む、本発明1032の方法。
[本発明1036]
前記細菌が、欠失したもしくは不活性化された内因性lacZ遺伝子および/または欠失したもしくは不活性化された内因性lacI遺伝子を含む、本発明1032の方法。
[本発明1037]
前記細菌が内因性β-ガラクトシダーゼ遺伝子を含み、該内因性β-ガラクトシダーゼ遺伝子のプロモーターの少なくとも一部が欠失している、本発明1032の方法。
[本発明1038]
前記細菌が、対応する野生型細菌の内因性β-ガラクトシダーゼ酵素と比較して低下した酵素活性を有する外因性β-ガラクトシダーゼ酵素を含む、本発明1032の方法。
[本発明1039]
前記細菌が、対応する野生型細菌内の内因性β-ガラクトシダーゼ遺伝子よりも低いレベルで発現される外因性β-ガラクトシダーゼ遺伝子を含む、本発明1032の方法。
[本発明1040]
前記細菌が、ラクトースの存在下で培養されたときに、50単位未満のβ-ガラクトシダーゼ活性を含む、本発明1039の方法。
[本発明1041]
前記細菌が、ラクトースパーミアーゼ遺伝子を含む、本発明1001の方法。
[本発明1042]
前記細菌が、thyA遺伝子内に変異をさらに含む、本発明1001の方法。
[本発明1043]
前記細菌が、β-ガラクトシドトランスアセチラーゼを発現しない、本発明1001の方法。
[本発明1044]
前記細菌がlacA変異を含む、本発明1043の方法。
[本発明1045]
前記細菌が、外因性ラクトースの存在下で細胞内ラクトースを蓄積する、本発明1001の方法。
[本発明1046]
前記細菌が大腸菌(Escherichia coli;E. coli)である、本発明1001の方法。
[本発明1047]
前記細菌が、バチルス(Bacillus)属、パントエア(Pantoea)属、ラクトバチルス(Lactobacillus)属、ラクトコッカス(Lactococcus)属、ストレプトコッカス(Streptococcus)属、プロピオニバクテリウム(Proprionibacterium)属、エンテロコッカス(Enterococcus)属、ビフィドバクテリウム(Bifidobacterium)属、スポロラクトバチルス(Sporolactobacillus)属、ミクロモノスポラ(Micromomospora)属、ミクロコッカス(Micrococcus)属、ロドコッカス(Rhodococcus)属またはシュードモナス(Pseudomonas)属のメンバーである、本発明1001の方法。
[本発明1048]
前記細菌が、バチルス・リケニフォルミス(Bacillus licheniformis)、バチルス・サブティリス(Bacillus subtilis)、バチルス・コアグランス(Bacillus coagulans)、バチルス・サーモフィルス(Bacillus thermophilus)、バチルス・ラテロスポルス(Bacillus laterosporus)、バチルス・メガテリウム(Bacillus megaterium)、バチルス・ミコイデス(Bacillus mycoides)、バチルス・プミルス(Bacillus pumilus)、バチルス・レンタス(Bacillus lentus)、バチルス・セレウス(Bacillus cereus)およびバチルス・サーキュランス(Bacillus circulans)、エルビニア・ヘルビコーラ(Erwinia herbicola)(パントエア・アグロメランス(Pantoea agglomerans))、シトロバクター・フロインディー(Citrobacter freundii)、パントエア・シトレア(Pantoea citrea)、ペクトバクテリウム・カロトボラム(Pectobacterium carotovorum)、キサントモナス・カンペストリス(Xanthomonas campestris)、ラクトバチルス・アシドフィルス(Lactobacillus acidophilus)、ラクトバチルス・サリバリウス(Lactobacillus salivarius)、ラクトバチルス・プランタルム(Lactobacillus plantarum)、ラクトバチルス・ヘルベティカス(Lactobacillus helveticus)、ラクトバチルス・デルブルエッキイー(Lactobacillus delbrueckii)、ラクトバチルス・ラムノサス(Lactobacillus rhamnosus)、ラクトバチルス・ブルガリカス(Lactobacillus bulgaricus)、ラクトバチルス・クリスパタス(Lactobacillus crispatus)、ラクトバチルス・ガセリ(Lactobacillus gasseri)、ラクトバチルス・カゼイ(Lactobacillus casei)、ラクトバチルス・ロイテリ(Lactobacillus reuteri)、ラクトバチルス・ジェンセニイ(Lactobacillus jensenii)、ラクトコッカス・ラクティス(Lactococcus lactis)、ストレプトコッカス・サーモフィラス(Streptococcus thermophiles)、プロピオニバクテリウム・フロイデンライシー(Proprionibacterium freudenreichii)、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロコッカス・サーモフィラス(Enterococcus thermophiles)、ビフィドバクテリウム・ロングム(Bifidobacterium longum)、ビフィドバクテリウム・インファンティス(Bifidobacterium infantis)、ビフィドバクテリウム・ビフィダム(Bifidobacterium bifidum)、シュードモナス・フルオレッセンス(Pseudomonas fluorescens)またはシュードモナス・エルギノーサ(Pseudomonas aeruginosa)細菌である、本発明1001の方法。
[本発明1049]
大腸菌が、GI724株細菌である、本発明1046の方法。
[本発明1050]
前記細菌が、lacIqまたはlacPL8プロモーター変異を含む、本発明1049の方法。
[本発明1051]
前記細菌が、ラクトース利用性シアリルトランスフェラーゼ酵素をコードする単離された核酸を含む核酸構築物を含む、本発明1001の方法。
[本発明1052]
前記細菌の染色体が、ラクトース利用性シアリルトランスフェラーゼ酵素をコードする単離された核酸を含む核酸構築物を含む、本発明1001の方法。
[本発明1053]
前記核酸が、前記細菌内で前記酵素の生産を指示する異種制御配列に機能的に連結されている、本発明1051の方法。
[本発明1054]
異種制御配列が、細菌プロモーター、細菌オペレーター、細菌リボソーム結合部位、細菌転写ターミネーターまたはプラスミド選択マーカーを含む、本発明1053の方法。
[本発明1055]
前記細菌が、以下の遺伝子型:
PlacIq-lacY, Δ(lacI-lacZ), ΔlacA, ΔthyA::(0.8RBS lacZ+), ampC::(Ptrp M13g8 RBS-λcI+, CAT), ΔnanATE::scar
を含む、本発明1001の方法。
[本発明1056]
前記酵素が、SEQ ID NO:15、16、20、21、22、23、24、25、26、27、28、29または30に示されるアミノ酸配列を含む、本発明1002の方法。
[本発明1057]
SEQ ID NO:15、16、20、21、22、23、24、25、26、27、28、29または30に示される配列内のアミノ酸を含む変異酵素をコードする、核酸。
[本発明1058]
SEQ ID NO:15、16、20、21、22、23、24、25、26、27、28、29または30に示される配列内のアミノ酸を含む、ラクトース利用性シアリルトランスフェラーゼ酵素。
[本発明1059]
外因性ラクトース利用性シアリルトランスフェラーゼ酵素を含む単離された細菌であって、該酵素が、
(i)少なくとも250アミノ酸のストレッチにわたってPst6-224のアミノ酸配列(SEQ ID NO:1)と5%~30%同一、または
(ii)少なくとも250アミノ酸のストレッチにわたってHAC1268のアミノ酸配列(SEQ ID NO:8)と45%~75%同一
であるアミノ酸配列を含む、細菌。
[本発明1060]
実質的に純粋なシアリルラクトースおよび5%未満のKDO-ラクトースを含む、組成物。
本発明の他の特徴および利点は、以下のその好ましい態様の記載から、および特許請求の範囲から明らかとなるであろう。それ以外の定義がなされていない限り、本明細書で使用されるすべての技術および科学用語は、本発明の属する技術の分野における通常の知識を有する者によって広く理解されているのと同じ意味を有する。本発明の実施または試験においては本明細書に記載されているのと同様または同等の方法および材料を使用することができるが、以下では適当な方法および材料を説明する。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】配列表
【補正方法】変更
【補正の内容】
【配列表】
2023110032000001.xml