(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-08
(45)【発行日】2024-11-18
(54)【発明の名称】微細藻類における異種ポリペプチド、微細藻類細胞外体、組成物の産生、ならびにそれらの作製および使用の方法
(51)【国際特許分類】
C12P 21/02 20060101AFI20241111BHJP
C12N 15/33 20060101ALI20241111BHJP
C12N 15/44 20060101ALI20241111BHJP
A61K 39/145 20060101ALI20241111BHJP
A61P 37/04 20060101ALI20241111BHJP
C07K 14/11 20060101ALI20241111BHJP
C12N 1/13 20060101ALN20241111BHJP
【FI】
C12P21/02 Z ZNA
C12N15/33
C12N15/44
A61K39/145
A61P37/04
C07K14/11
C12N1/13
(21)【出願番号】P 2023072538
(22)【出願日】2023-04-26
(62)【分割の表示】P 2020027762の分割
【原出願日】2010-12-28
【審査請求日】2023-05-25
(32)【優先日】2010-11-12
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2009-12-28
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2009-12-28
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】515281994
【氏名又は名称】サノフィ ワクチン テクノロジーズ エス.エー.エス.
(74)【代理人】
【識別番号】100102978
【氏名又は名称】清水 初志
(74)【代理人】
【識別番号】100205707
【氏名又は名称】小寺 秀紀
(74)【代理人】
【識別番号】100160923
【氏名又は名称】山口 裕孝
(74)【代理人】
【識別番号】100119507
【氏名又は名称】刑部 俊
(74)【代理人】
【識別番号】100142929
【氏名又は名称】井上 隆一
(74)【代理人】
【識別番号】100148699
【氏名又は名称】佐藤 利光
(74)【代理人】
【識別番号】100188433
【氏名又は名称】梅村 幸輔
(74)【代理人】
【識別番号】100128048
【氏名又は名称】新見 浩一
(74)【代理人】
【識別番号】100129506
【氏名又は名称】小林 智彦
(74)【代理人】
【識別番号】100114340
【氏名又は名称】大関 雅人
(74)【代理人】
【識別番号】100214396
【氏名又は名称】塩田 真紀
(74)【代理人】
【識別番号】100121072
【氏名又は名称】川本 和弥
(74)【代理人】
【識別番号】100221741
【氏名又は名称】酒井 直子
(74)【代理人】
【識別番号】100114926
【氏名又は名称】枝松 義恵
(72)【発明者】
【氏名】バイン アン-セシル ブイ.
(72)【発明者】
【氏名】リップマイアー ジェイムズ ケーシー
(72)【発明者】
【氏名】アプト カーク エミル
(72)【発明者】
【氏名】ザークレ ロス エリック
【審査官】坂崎 恵美子
(56)【参考文献】
【文献】国際公開第2006/013572(WO,A2)
【文献】国際公開第2009/101160(WO,A1)
【文献】特表2005-503125(JP,A)
【文献】特表2007-534295(JP,A)
【文献】国際公開第2005/047501(WO,A1)
【文献】国際公開第2008/024844(WO,A2)
【文献】国際公開第2009/009876(WO,A1)
【文献】植物科学最前線,2017年,Vol.8,p.160-168
【文献】Biotechnology Letters,2003年,Vol.25,p.1087-1092
【文献】Molecular Diagnosis of Infectious Disease,2004年,Vol.94,p.191-195
【文献】Plant Cell Reports,2005年,Vol.24,p.629-641
(58)【調査した分野】(Int.Cl.,DB名)
C12P 21/02
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
以下を含む、ウイルスタンパク質の組み合わせの産生のための方法:
組み換え微細藻類細胞を
、培地中で培養する段階;
ここで、該組み換え微細藻類細胞は以下を含む:
(a)
血球凝集素(HA
)膜ドメインおよび活性な調節制御要素を含むウイルスHAタンパク質、および
、ノイラミニダーゼ(NA)膜ドメインおよび活性な調節制御要素を含むウイルスNAタンパク質
をコードするポリヌクレオチド配列を含む核酸分子; または
(b)
HA膜ドメインおよび活性な調節制御要素を含むウイルスHAタンパク質をコードする少なくとも1つのポリヌクレオチド配列を含む少なくとも1つの核酸分子、および、NA膜ドメインおよび活性な調節制御要素を含むウイルスNAタンパク質
をコードする少なくとも1つのポリヌクレオチド配列を含む少なくとも1つの核酸分子;
ここで、該HAタンパク質および
該NAタンパク質
は培地中へ分泌され
; および
分泌された組み換えウイルスHAタンパク質およびウイルスNAタンパク質を培地から回収する段階
、ここで、該組み換え微細藻類細胞はシゾキトリウム属(Schizochytrium)またはヤブレツボカビ属(Thraustochytrium)である。
【請求項2】
前記組み換えウイルスHAタンパク質が、全長ウイルスHAタンパク質である、請求項1記載の方法。
【請求項3】
前記組み換えウイルスNAタンパク質が、全長ウイルスNAタンパク質である、請求項1記載の方法。
【請求項4】
前記組み換えウイルスHAタンパク質が、インフルエンザHAタンパク質である、請求項1記載の方法。
【請求項5】
前記組み換えウイルスNAタンパク質が、インフルエンザNAタンパク質である、請求項1記載の方法。
【請求項6】
前記インフルエンザHAタンパク質が、インフルエンザHAタンパク質型H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15、およびH16から選択される、請求項4記載の方法。
【請求項7】
前記インフルエンザHAタンパク質が、インフルエンザHAタンパク質型H1、H2、H3、H5、H6、H7、およびH9から選択される、請求項4記載の方法。
【請求項8】
前記組み換えウイルスHAタンパク質が、全長インフルエンザHAタンパク質である、請求項1記載の方法。
【請求項9】
前記組み換えウイルスNAタンパク質が、全長インフルエンザNAタンパク質である、請求項1記載の方法。
【請求項10】
前記組み換えウイルスHAタンパク質がSEQ ID NO: 77と少なくとも90%同一である、請求項1記載の方法。
【請求項11】
前記組み換えウイルスNAタンパク質がSEQ ID NO: 100によってコードされるアミノ酸配列と少なくとも90%同一である、請求項1記載の方法。
【請求項12】
前記組み換えウイルスHAタンパク質がSEQ ID NO: 77のアミノ酸配列を有する、請求項1記載の方法。
【請求項13】
前記組み換えウイルスNAタンパク質がSEQ ID NO: 100によってコードされるアミノ酸配列を有する、請求項1記載の方法。
【請求項14】
前記組み換えウイルスHAタンパク質が切断され、外因性プロテアーゼの非存在下で前記培地中でHA1およびHA2断片を産生する、請求項1記載の方法。
【請求項15】
以下を含む、ワクチン組成物を作製する方法:
請求項1~
14のいずれか一項記載の方法に
より、組み換えウイルスHAタンパク質および組み換えウイルスNAタンパク質を提供する段階;および
前記組み換えウイルスHAタンパク質および前記組み換えウイルスNAタンパク質を、筋肉内、静脈内、皮下、肺内、気管内、経皮、眼内、鼻内、吸入、腔内、管内、および実質内投与から選択される少なくとも1つの経路で投与するためのワクチン組成物として製剤化する段階。
【発明の詳細な説明】
【技術分野】
【0001】
発明の分野
本発明は、組み換え微細藻類細胞および異種ポリペプチドの産生におけるその使用、微細藻類細胞外体における異種ポリペプチドの産生の方法、異種ポリペプチドを含む微細藻類細胞外体、ならびにそれらを含む組成物に関する。
【背景技術】
【0002】
以前には多くがヒトおよび他の動物の組織、血液または尿からの抽出によってのみ利用可能であった、微生物細胞、植物細胞および動物細胞でのタンパク質の産生が、生物工学および分子生物学の進歩により可能になった。今日、市販されている生物製剤は典型的に、チャイニーズハムスター卵巣(CHO)細胞のような哺乳類細胞において、または酵母もしくは大腸菌(E. coli)細胞株のような微生物細胞において製造される。
【0003】
微生物の発酵によるタンパク質の産生は、植物および動物細胞培養のような既存の系に比べていくつかの利点をもたらす。例えば、微生物の発酵に基づく工程は、以下を与えることができる:(i)高濃度のタンパク質の迅速産生;(ii)無菌の、十分に制御された産生条件(医薬品最適製造基準(Good Manufacturing Practice; GMP)条件のような)を使用できること;(iii)より単純な発酵およびより少ない不純物を可能にする単純で化学的に定義された増殖培地を使用できること;(iv)夾雑しているヒトまたは動物病原体が存在しないこと; および(v)タンパク質の回収(例えば、発酵培地からの単離による)が容易であること。さらに、発酵施設は典型的に、細胞培養施設よりも建設するのに費用がかからない。
【0004】
微細藻類、例えばラビリンチュラ菌門(Labyrinthulomycota)のヤブレツボカビ科生物(thraustochytrid)などは、標準的な発酵装置を用いて、非常に短い培養サイクル(例えば、1~5日)、安価な限定培地、およびあったとしても最小限の精製により、増殖させることができる。さらに、ある種の微細藻類、例えば、シゾキトリウム属(Schizochytrium)は、バイオマスおよびそれに由来する脂質の両方の食品用途に関して実証された安全性の歴史を有する。例えば、この微生物由来のDHAに富むトリグリセリド油は、米国食品医薬品局からGRAS(安全食品認定)の地位を受けている。
【0005】
微細藻類は、組み換えタンパク質を発現できることが示されている。例えば、米国特許第7,001,772号(特許文献1)では、シゾキトリウム属の成員を含む、ヤブレツボカビ科生物を形質転換するのに適した最初の組み換え構築体が開示された。この刊行物では、とりわけ、アセト乳酸合成酵素、アセト乳酸合成酵素プロモーターおよびターミネーター領域、α-チューブリンプロモーター、ポリケチド合成酵素(PKS)系由来のプロモーター、ならびに脂肪酸不飽和化酵素プロモーターに対するシゾキトリウム属の核酸およびアミノ酸配列が開示された。ともに参照により全体が本明細書に組み入れられる、米国特許出願公開第2006/0275904号(特許文献2)および同第2006/0286650号(特許文献3)では、その後、アクチン、伸長因子1アルファ(ef1α)、ならびにグリセルアルデヒド3-リン酸脱水素酵素(gapdh)プロモーターおよびターミネーターに対するシゾキトリウム属の配列が開示された。
【0006】
微細藻類において異種ポリペプチドを発現するための方法および治療的用途のための代替組成物の特定が継続的に必要とされている。
【先行技術文献】
【特許文献】
【0007】
【文献】米国特許第7,001,772号
【文献】米国特許出願公開第2006/0275904号
【文献】米国特許出願公開第2006/0286650号
【発明の概要】
【0008】
本発明は、培地中で組み換え微細藻類細胞を培養する段階を含む、血球凝集素(HA)タンパク質、ノイラミニダーゼ(NA)タンパク質、融合(F)タンパク質、糖タンパク質(G)タンパク質、エンベロープ(E)タンパク質、120 kDaの糖タンパク質(gp120)、41 kDaの糖タンパク質(gp41)、マトリックスタンパク質およびそれらの組み合わせからなる群より選択されるウイルスタンパク質の産生のための方法を対象とし、該組み換え微細藻類細胞は、ウイルスタンパク質を産生するために、ウイルスタンパク質をコードするポリヌクレオチド配列を含んだ核酸分子を含む。いくつかの態様において、ウイルスタンパク質は分泌される。いくつかの態様において、ウイルスタンパク質は培地から回収される。いくつかの態様において、ウイルスタンパク質は微細藻類細胞中に蓄積する。いくつかの態様において、ウイルスタンパク質は微細藻類細胞の膜中に蓄積する。いくつかの態様において、ウイルスタンパク質はHAタンパク質である。いくつかの態様において、HAタンパク質はSEQ ID NO: 77と少なくとも90%同一である。いくつかの態様において、微細藻類細胞は外因性プロテアーゼの非存在下でHA1およびHA2ポリペプチドを産生するためにHAタンパク質の翻訳後プロセッシングの能力がある。いくつかの態様において、ウイルスタンパク質はNAタンパク質である。いくつかの態様において、NAタンパク質はSEQ ID NO: 100と少なくとも90%同一である。いくつかの態様において、ウイルスタンパク質はFタンパク質である。いくつかの態様において、Fタンパク質はSEQ ID NO: 102と少なくとも90%同一である。いくつかの態様において、ウイルスタンパク質はGタンパク質である。いくつかの態様において、Gタンパク質はSEQ ID NO: 103と少なくとも90%同一である。いくつかの態様において、微細藻類細胞はヤブレツボカビ目(Thraustochytriales)の一員である。いくつかの態様において、微細藻類細胞はシゾキトリウム属またはヤブレツボカビ属(Thraustochytrium)である。いくつかの態様において、ウイルスタンパク質をコードするポリヌクレオチド配列はHA膜ドメインをさらに含む。いくつかの態様において、核酸分子は、SEQ ID NO: 2、SEQ ID NO: 3、SEQ ID NO: 4、SEQ ID NO: 38、SEQ ID NO: 42、SEQ ID NO: 43、SEQ ID NO: 44、SEQ ID NO: 45、SEQ ID NO: 46およびそれらの組み合わせからなる群より選択されるポリヌクレオチド配列をさらに含む。
【0009】
本発明は、上記の方法のいずれかによって産生される単離されたウイルスタンパク質を対象とする。
【0010】
本発明は、血球凝集素(HA)タンパク質、ノイラミニダーゼ(NA)タンパク質、融合(F)タンパク質、糖タンパク質(G)タンパク質、エンベロープ(E)タンパク質、120 kDaの糖タンパク質(gp120)、41 kDaの糖タンパク質(gp41)、マトリックスタンパク質およびそれらの組み合わせからなる群より選択されるウイルスタンパク質をコードするポリヌクレオチド配列を含んだ核酸分子を含む組み換え微細藻類細胞を対象とする。いくつかの態様において、ウイルスタンパク質はHAタンパク質である。いくつかの態様において、HAタンパク質はSEQ ID NO: 77と少なくとも90%同一である。いくつかの態様において、微細藻類細胞は外因性プロテアーゼの非存在下でHA1およびHA2ポリペプチドを産生するためにHAタンパク質の翻訳後プロセッシングの能力がある。いくつかの態様において、ウイルスタンパク質はNAタンパク質である。いくつかの態様において、NAタンパク質はSEQ ID NO: 100と少なくとも90%同一である。いくつかの態様において、ウイルスタンパク質はFタンパク質である。いくつかの態様において、Fタンパク質はSEQ ID NO: 102と少なくとも90%同一である。いくつかの態様において、ウイルスタンパク質はGタンパク質である。いくつかの態様において、Gタンパク質はSEQ ID NO: 103と少なくとも90%同一である。いくつかの態様において、微細藻類細胞はヤブレツボカビ目(Thraustochytriales)の一員である。いくつかの態様において、微細藻類細胞はシゾキトリウム属またはヤブレツボカビ属である。いくつかの態様において、ウイルスタンパク質をコードするポリヌクレオチド配列はHA膜ドメインをさらに含む。いくつかの態様において、核酸分子は、SEQ ID NO: 2、SEQ ID NO: 3、SEQ ID NO: 4、SEQ ID NO: 38、SEQ ID NO: 42、SEQ ID NO: 43、SEQ ID NO: 44、SEQ ID NO: 45、SEQ ID NO: 46およびそれらの組み合わせからなる群より選択されるポリヌクレオチド配列をさらに含む。
【0011】
本発明は、異種ポリペプチドを含む微細藻類細胞外体を産生する方法を対象とし、本方法は、(a)膜ドメインを含む異種ポリペプチドを、微細藻類宿主細胞において発現させる段階、および(b)宿主細胞の原形質膜と不連続な異種ポリペプチドを含む細胞外体を産生するのに十分な条件の下で、微細藻類宿主細胞を培養する段階を含む。
【0012】
本発明は、微細藻類細胞外体および異種ポリペプチドを含む組成物を産生する方法を対象とし、本方法は、(a)膜ドメインを含む異種ポリペプチドを、微細藻類宿主細胞において発現させる段階、および(b)宿主細胞の原形質膜と不連続な異種ポリペプチドを含む細胞外体を産生するのに十分な条件の下で、微細藻類宿主細胞を培養する段階を含み、該組成物は、細胞外体を含む培養上清として産生される。いくつかの態様において、本方法は、組成物から培養上清を取り出す段階および細胞外体を水性液体担体に再懸濁する段階をさらに含む。本発明は、本方法によって産生される組成物を対象とする。
【0013】
いくつかの態様において、微細藻類細胞外体および異種ポリペプチドを産生する方法、または微細藻類細胞外体および異種ポリペプチドを含む組成物を産生する方法は、ラビリンチュラ菌門の宿主細胞である宿主細胞を含む。いくつかの態様において、宿主細胞はシゾキトリウム属またはヤブレツボカビ属の宿主細胞である。
【0014】
本発明は、微細藻類細胞の原形質膜と不連続な異種ポリペプチドを含む微細藻類細胞外体を対象とする。いくつかの態様において、細胞外体は小胞、ミセル、膜断片、膜凝集体、またはそれらの混合物である。いくつかの態様において、細胞外体は小胞および膜断片の混合物である。いくつかの態様において、細胞外体は小胞である。いくつかの態様において、異種ポリペプチドは膜ドメインを含む。いくつかの態様において、異種ポリペプチドは糖タンパク質である。いくつかの態様において、糖タンパク質は高マンノースオリゴ糖を含む。いくつかの態様において、糖タンパク質はシアル酸を実質的に含まない。
【0015】
本発明は、上記の主張のいずれかの細胞外体および水性液体担体を含む組成物を対象とする。いくつかの態様において、水性液体担体は培養上清である。
[1] 培地中で組み換え微細藻類細胞を培養する段階を含む、血球凝集素(HA)タンパク質、ノイラミニダーゼ(NA)タンパク質、融合(F)タンパク質、糖タンパク質(G)タンパク質、エンベロープ(E)タンパク質、120 kDaの糖タンパク質(gp120)、41 kDaの糖タンパク質(gp41)、マトリックスタンパク質、およびそれらの組み合わせからなる群より選択されるウイルスタンパク質の産生のための方法であって、該組み換え微細藻類細胞が、ウイルスタンパク質を産生するために、ウイルスタンパク質をコードするポリヌクレオチド配列を含んだ核酸分子を含む、前記方法。
[2] ウイルスタンパク質が分泌される、[1]記載の方法。
[3] ウイルスタンパク質を培地から回収する段階をさらに含む、[1]または[2]記載の方法。
[4] ウイルスタンパク質が微細藻類細胞中に蓄積する、[1]記載の方法。
[5] ウイルスタンパク質が微細藻類細胞の膜中に蓄積する、[1]~[4]のいずれか一項記載の方法。
[6] ウイルスタンパク質がHAタンパク質である、[1]~[5]のいずれか一項記載の方法。
[7] HAタンパク質がSEQ ID NO: 77と少なくとも90%同一である、[6]記載の方法。
[8] 微細藻類細胞が、外因性プロテアーゼの非存在下でHA1およびHA2断片を産生するためのHAタンパク質の翻訳後プロセッシングの能力をもつ、[6]または[7]記載の方法。
[9] ウイルスタンパク質がNAタンパク質である、[1]~[5]のいずれか一項記載の方法。
[10] NAタンパク質がSEQ ID NO: 100と少なくとも90%同一である、[9]記載の方法。
[11] ウイルスタンパク質がFタンパク質である、[1]~[5]のいずれか一項記載の方法。
[12] Fタンパク質がSEQ ID NO: 102と少なくとも90%同一である、[11]記載の方法。
[13] ウイルスタンパク質がGタンパク質である、[1]~[5]のいずれか一項記載の方法。
[14] Gタンパク質がSEQ ID NO: 103と少なくとも90%同一である、[13]記載の方法。
[15] 微細藻類細胞がヤブレツボカビ目(Thraustochytriales)の一員である、[1]~[14]のいずれか一項記載の方法。
[16] 微細藻類細胞がシゾキトリウム属(Schizochytrium)またはヤブレツボカビ属(Thraustochytrium)である、[1]~[15]のいずれか一項記載の方法。
[17] ウイルスタンパク質をコードするポリヌクレオチド配列がHA膜ドメインをさらに含む、[1]~[16]のいずれか一項記載の方法。
[18] 核酸分子が、SEQ ID NO: 2、SEQ ID NO: 3、SEQ ID NO: 4、SEQ ID NO: 38、SEQ ID NO: 42、SEQ ID NO: 43、SEQ ID NO: 44、SEQ ID NO: 45、SEQ ID NO: 46、およびそれらの組み合わせからなる群より選択されるポリヌクレオチド配列をさらに含む、[1]~[17]のいずれか一項記載の方法。
[19] [1]~[18]のいずれか一項記載の方法によって産生される、単離されたウイルスタンパク質。
[20] 血球凝集素(HA)タンパク質、ノイラミニダーゼ(NA)タンパク質、融合(F)タンパク質、糖タンパク質(G)タンパク質、エンベロープ(E)タンパク質、120 kDaの糖タンパク質(gp120)、41 kDaの糖タンパク質(gp41)、マトリックスタンパク質、およびそれらの組み合わせからなる群より選択されるウイルスタンパク質をコードするポリヌクレオチド配列を含んだ核酸分子を含む、組み換え微細藻類細胞。
[21] 膜ドメインを含む異種ポリペプチドを、微細藻類宿主細胞において発現させる段階と、
異種ポリペプチドを含む細胞外体を産生するのに十分な条件下で微細藻類宿主細胞を培養する段階であって、該細胞外体が宿主細胞の原形質膜と不連続である、段階と
を含む、異種ポリペプチドを含む微細藻類細胞外体を産生する方法。
[22] 膜ドメインを含む異種ポリペプチドを、微細藻類宿主細胞において発現させる段階と、
異種ポリペプチドを含む微細藻類細胞外体を産生するのに十分な条件下で微細藻類宿主細胞を培養する段階であって、該細胞外体が宿主細胞の原形質膜と不連続である、段階と
を含む、微細藻類細胞外体と異種ポリペプチドとを含む組成物を産生する方法であって、
該組成物が、細胞外体を含む培養上清として産生される、前記方法。
[23] 前記組成物から培養上清を取り出す段階および細胞外体を水性液体担体に再懸濁する段階をさらに含む、[22]記載の方法。
[24] 宿主細胞がラビリンチュラ菌門(Labyrinthulomycota)の宿主細胞である、[21]~[23]のいずれか一項記載の方法。
[25] 宿主細胞がシゾキトリウム属またはヤブレツボカビ属の宿主細胞である、[21]~[24]のいずれか一項記載の方法。
[26] [21]記載の方法によって産生される細胞外体。
[27] [22]記載の方法によって産生される組成物。
[28] 異種ポリペプチドを含む微細藻類細胞外体であって、微細藻類細胞の原形質膜と不連続な微細藻類細胞外体。
[29] 小胞、ミセル、膜断片、膜凝集体、またはそれらの混合物である、[28]記載の細胞外体。
[30] 小胞および膜断片の混合物である、[28]または[29]記載の細胞外体。
[31] 小胞である、[28]または[29]記載の細胞外体。
[32] 異種ポリペプチドが膜ドメインを含む、[28]~[31]のいずれか一項記載の細胞外体。
[33] 異種ポリペプチドが糖タンパク質である、[28]~[32]のいずれか一項記載の細胞外体。
[34] 糖タンパク質が高マンノースオリゴ糖を含む、[33]記載の細胞外体。
[35] 糖タンパク質がシアル酸を実質的に含まない、[33]または[34]記載の細胞外体。
[36] [28]~[35]のいずれか一項記載の細胞外体と水性液体担体とを含む、組成物。
[37] 水性液体担体が培養上清である、[36]記載の組成物。
【図面の簡単な説明】
【0016】
【
図1】シゾキトリウム種ATCC 20888での発現のためにコドン最適化された、A型インフルエンザウイルス(A/プエルトリコ/8/34/マウントサイナイ(H1N1))の血球凝集素(HA)タンパク質をコードするポリヌクレオチド配列(SEQ ID NO: 76)を示す。
【
図3】CL0143-9クローンの分析に用いた手順を示す。
【
図4】遺伝子導入シゾキトリウム属CL0143-9(「E」)によるHAタンパク質の分泌を示す。
図4A: さまざまな温度(25℃、27℃、29℃)およびpH(5.5、6.0、6.5、7.0)での培養物の低速上清(すなわち、無細胞上清(「CFS」))から回収された組み換えHAタンパク質(矢印で示した通りの)を抗-H1N1免疫ブロットにおいて示す。
図4B: 非還元条件または還元条件下での60%スクロース画分から回収された組み換えHAタンパク質をクマシー染色ゲル(「クマシー」)および抗-H1N1免疫ブロット(「IB: 抗-H1N1」)において示す。
【
図5】遺伝子導入シゾキトリウム属CL0143-9(「E」)由来の組み換えHAタンパク質の血球凝集活性を示す。
図5A: 無細胞上清(「CFS」)における血球凝集活性を示す。
図5B: 可溶性(「US」)および不溶性(「UP」)画分における血球凝集活性を示す。「[タンパク質]」は、サンプルの希釈の増大とともに左から右に減少していく、タンパク質の濃度を指す。「-」は、HAを欠く陰性対照を指す。「+」はインフルエンザ血球凝集素の陽性対照を指す。「C」はシゾキトリウム種ATCC 20888の陰性対照の野生型株を指す。「HAU」は、左から右へのサンプルの倍希釈に基づく血球凝集活性単位を指す。「2」は最初のウェルにおけるサンプルの2倍希釈を指し; 左から右へとその後のウェルは前のウェルに対して2倍希釈に相当し、その結果、左から右へと最初から最後のウェルまでの倍希釈は2、4、8、16、32、64、128、256、512、1024、2048、および4096となった。
【
図6】遺伝子導入シゾキトリウム属CL0143-9(「E」)に対する60%スクロース画分に存在するHAタンパク質の発現および血球凝集活性を示す。
図6A: 60%スクロース画分から回収された組み換えHAタンパク質(矢印で示した通りの)がクマシー染色ゲル(「クマシー」)および抗-H1N1免疫ブロット(「IB: 抗-H1N1」)において示されることを示す。
図6B: 対応する血球凝集活性を示す。「-」は、HAを欠く陰性対照を指す。「+」はインフルエンザHAタンパク質の陽性対照を指す。「C」はシゾキトリウム種ATCC 20888の陰性対照の野生型株を指す。「HAU」は、サンプルの倍希釈に基づく血球凝集活性単位を指す。
【
図7】全HAタンパク質配列(SEQ ID NO: 77)の42%を網羅している、計27ペプチド(ペプチドと関連するアミノ酸は太字体で強調されている)により特定された、回収組み換えHAタンパク質に対するペプチド配列分析を示す。HA1ポリペプチドは計17ペプチドにより特定され、HA2ポリペプチドは計9ペプチドにより特定された。
【
図8】シゾキトリウム属におけるHAタンパク質グリコシル化を例証するクマシー染色ゲル(「クマシー」)および抗-H1N1免疫ブロット(「IB: 抗-H1N1」)を示す。「EndoH」および「PNGase F」は、各酵素による遺伝子導入シゾキトリウム属CL0143-9の60%スクロース画分の酵素処理を指す。「NT」は、酵素なしで、しかしEndoHおよびPNGase F処理と同じ条件の下でインキュベートされた遺伝子導入シゾキトリウム属CL0143-9を指す。
【
図9】経時(時間)的な全シゾキトリウム種ATCC 20888培養上清タンパク質(g/L)を示す。
【
図10】レーン11~15における全シゾキトリウム種ATCC 20888培養上清タンパク質のSDS-PAGEを示し、ここで上清は37~68時間の間の
図9に示した、52時間を除く、6つの時点のうちの5つの時点で回収された。アクチンおよびゲルゾリンとして(質量分析ペプチド配列決定により)特定されたバンドには矢印を付けてある。レーン11には総タンパク質2.4 μgをロードし; 残りのウェルには総タンパク質5 μgをロードした。
【
図11】シゾキトリウム種ATCC 20888(「C: 20888」)および遺伝子導入シゾキトリウム属CL0143-9(「E: CL0143-9」)由来の陰性染色された小胞を示す。
【
図12】シゾキトリウム種ATCC 20888(「C: 20888」)および遺伝子導入シゾキトリウム属CL0143-9(「E: CL0143-9」)由来の抗-H1N1免疫金標識小胞を示す。
【
図13】SignalPアルゴリズムの使用に基づくシゾキトリウム属に固有の推定シグナルアンカー配列を示す。例えば、Bendsten et al., J, Mol. Biol. 340: 783-795(2004); Nielsen, H. and Krogh, A. Proc. Int. Conf. Intell. Syst. Mol. Biol. 6:122-130(1998); Nielsen, H., et al., Protein Engineering 12: 3-9(1999); Emanuelsson, O. et al., Nature Protocols 2: 953-971(2007)を参照されたい。
【
図14】他の生物由来の公知のI型膜タンパク質との相同性を有する、かつタンパク質の最C末端領域において膜貫通領域を有する遺伝子に対するゲノムおよびEST DNAシゾキトリウム属データベースのBLAST検索に基づいたシゾキトリウム属における推定のI型膜タンパク質を示す。推定上の膜貫通領域は太字体で示されている。
【
図15】pCL0120のプラスミドマップを示す。
【
図16】シゾキトリウム属に対するコドン使用頻度表を示す。
【
図17】pCL0130のプラスミドマップを示す。
【
図18】pCL0131のプラスミドマップを示す。
【
図19】pCL0121のプラスミドマップを示す。
【
図20】pCL0122のプラスミドマップを示す。
【
図21】シゾキトリウム種ATCC 20888での発現のために最適化された、GenBankアクセッション番号CAB76571に対応する、ピロマイセス(Piromyces)種E2キシロースイソメラーゼタンパク質「XylA」をコードするポリヌクレオチド配列(SEQ ID NO: 92)を示す。
【
図22】シゾキトリウム種ATCC 20888での発現のために最適化された、GenBankアクセッション番号AJ249910に対応する、ピロマイセス種E2キシルロースキナーゼタンパク質「XylB」をコードするポリヌクレオチド配列(SEQ ID NO: 93)を示す。
【
図23】pCL0132のプラスミドマップを示す。
【
図24】pCL0136のプラスミドマップを示す。
【
図25】
図25A: pCL0140のプラスミドマップを示す、および
図25B: pCL0149のプラスミドマップを示す。
【
図26】
図26A: シゾキトリウム種ATCC 20888での発現のために最適化された、A型インフルエンザウイルス(A/プエルトリコ/8/34/マウントサイナイ(H1N1))のノイラミニダーゼ(NA)タンパク質をコードするポリヌクレオチド配列(SEQ ID NO: 100)を示す。
図26B: シゾキトリウム種ATCC 20888での発現のために最適化された、A型インフルエンザウイルス(A/プエルトリコ/8/34/マウントサイナイ(H1N1))のNAタンパク質、それに続くV5タグおよびポリヒスチジンタグをコードするポリヌクレオチド配列(SEQ ID NO: 101)を示す。
【
図27】CL0140およびCL0149クローンの分析に用いた手順のスキームを示す。
【
図28】遺伝子導入シゾキトリウム属株CL0140-16、-17、-20、-21、-22、-23、-24、-26、-28由来の組み換えNAのノイラミニダーゼ活性を示す。活性は、シアリダーゼによる4-メチルウンベリフェリル)-α-D-N-アセチルノイラミン酸(4-MUNANA)の加水分解の後に生じる4-メチルウンベリフェロンの蛍光を測定することによって判定される(励起(Exc): 365 nm、発光(Em): 450 nm)。活性は、濃縮された無細胞上清(cCFS、各クローンについて最も左の棒線)および無細胞抽出物(CFE、各クローンについて最も右の棒線)におけるタンパク質1 μgあたりの相対蛍光単位(RFU)として表されている。遺伝子導入株と同じように増殖かつ調製された、シゾキトリウム種ATCC 20888の野生型株(「-」)およびpCL0140で形質転換されたシゾキトリウム属のPCR陰性株(「27」)を陰性対照として用いた。
【
図29】遺伝子導入シゾキトリウム属株CL0140-26由来の組み換えNAタンパク質の部分的精製を示す。さまざまな画分のノイラミニダーゼ活性を
図29Aに示す。「cCFS」は濃縮された無細胞上清を指す。「D」は洗浄用緩衝液で希釈されたcCFSを指し、「FT」は素通り画分を指し、「W」は洗浄液を指し、「E」は溶出液を指し、かつ「cE」は濃縮された溶出液画分を指す。各画分12.5 μLのクマシー染色ゲル(「クマシー」)を
図29Bに示す。矢印は、NAタンパク質と特定されたバンドを指し示す。SDS-PAGEを用い、MOPS SDS泳動用緩衝液でNuPAGE(登録商標)Novex(登録商標)12%ビス-トリスゲル上にてタンパク質を分離した。
【
図30】タンパク質配列(SEQ ID NO: 100)の25%を網羅している、計9ペプチド(太字赤で強調されている)により特定された、回収組み換えNAタンパク質に対するペプチド配列分析を示す。
【
図31】遺伝子導入シゾキトリウム属株CL0149-10、-11、-12のノイラミニダーゼ活性ならびに対応するクマシー染色ゲル(「クマシー」)および抗-V5免疫ブロット(「免疫ブロット: 抗-V5」)を示す。
図31A: シアリダーゼによる4-MUNANAの加水分解の後に生じる4-メチルウンベリフェロンの蛍光を測定することによって判定される、ノイラミニダーゼ活性(Exc: 365 nm、Em: 450 nm)を示す。活性は、無細胞上清(CFS)におけるタンパク質1 μgあたりの相対蛍光単位(RFU)として表されている。遺伝子導入株と同じように増殖かつ調製された、シゾキトリウム種ATCC 20888の野生型株(「-」)を陰性対照として用いた。
図31B: 3つの遺伝子導入シゾキトリウム属CL0149株(「10」、「11」および「12」)に対するCFS 12.5 μLに対するクマシー染色ゲルおよび対応する抗-V5免疫ブロットを示す。Positope(商標)抗体対照タンパク質を陽性対照(「+」)として用いた。遺伝子導入株と同じように増殖かつ調製された、シゾキトリウム種ATCC 20888の野生型株(「-」)を陰性対照として用いた。
【
図32】CL0140およびCL0143で同時に形質転換された遺伝子導入シゾキトリウム属の無細胞上清におけるインフルエンザHAおよびNAの酵素活性を示す。データはクローンCL0140-143-1、-3、-7、-13、-14、-15、-16、-17、-18、-19、-20について提示されている。
図32A: シアリダーゼによる4-MUNANAの加水分解の後に生じる4-メチルウンベリフェロンの蛍光を測定することによって判定される、ノイラミニダーゼ活性(Exc: 365 nm、Em: 450 nm)を示す。活性は、CFS 25 μLにおける相対蛍光単位(RFU)として表されている。遺伝子導入株と同じように増殖かつ調製された、シゾキトリウム種ATCC 20888の野生型株(「-」)を陰性対照として用いた。
図32B: 血球凝集活性を示す。「-」は、HAを欠く陰性対照を指す。「+」はインフルエンザHA陽性対照を指す。「HAU」は、サンプルの倍希釈に基づく血球凝集活性単位を指す。
【発明を実施するための形態】
【0017】
発明の詳細な説明
本発明は、微細藻類宿主細胞において異種ポリペプチドを産生するための方法を対象とする。本発明は同様に、本方法によって産生される異種ポリペプチドを対象とし、異種ポリペプチドを含む微細藻類細胞を対象とし、および異種ポリペプチドを含む組成物を対象とする。本発明は同様に、宿主細胞の原形質膜と不連続な微細藻類細胞外体と結び付いている異種ポリペプチドの、微細藻類宿主細胞における産生を対象とする。本発明は同様に、異種ポリペプチドを含む微細藻類細胞外体の産生、およびそれを含む組成物の産生を対象とする。本発明はさらに、異種ポリペプチドを含む微細藻類細胞外体、組成物、およびその使用を対象とする。
【0018】
微細藻類宿主細胞
微小藻類としても知られる微細藻類は、淡水および海洋系において見られることが多い。微細藻類は単細胞であるが、しかし鎖および群で増殖することもできる。個々の細胞はサイズが数マイクロメートルから数百マイクロメートルに及ぶ。それらの細胞は水性懸濁液中で増殖できるので、栄養素および水性環境に効率的にアクセスできる。
【0019】
いくつかの態様において、微細藻類宿主細胞は不等毛藻またはストラメノパイルである。
【0020】
いくつかの態様において、微細藻類宿主細胞はラビリンチュラ菌門の一員である。いくつかの態様において、ラビリンチュラ菌門宿主細胞はヤブレツボカビ目またはラビリンチュラ目(Labyrinthulales)の一員である。本発明によれば、「ヤブレツボカビ科生物」という用語は、ヤブレツボカビ科(Thraustochytriaceae)を含む、ヤブレツボカビ目の任意の成員を指し、「ラビリンチュラ科生物(labyrinthulid)」という用語は、ラビリンチュラ科(Labyrinthulaceae)を含む、ラビリンチュラ目の任意の成員を指す。ラビリンチュラ科の成員は一時、ヤブレツボカビ目の成員であると考えられていたが、そのような生物の分類法のさらに最近の改訂により、ラビリンチュラ科は現在ではラビリンチュラ目の成員であると考えられている。ラビリンチュラ目およびヤブレツボカビ目は両方ともラビリンチュラ菌門の成員であると考えられている。分類学の理論家は現在は一般に、これらの微生物群の両方を、ストラメノパイルの系譜に属する藻類または藻類様原生生物に位置づけている。ヤブレツボカビ科生物およびラビリンチュラ科生物の現在の分類法上の位置付けは以下のようにまとめることができる。
界: ストラメノパイル(クロミスタ)
門: ラビリンチュラ菌門(不等毛藻)
網: ラビリンチュラ網(Labyrinthulomycetes)ラビリンチュラ網(Labyrinthulae)
目: ラビリンチュラ目
科: ラビリンチュラ科
目: ヤブレツボカビ目
科: ヤブレツボカビ科
【0021】
本発明の目的のために、ヤブレツボカビ科生物として記載した株には、以下の生物が含まれる: 目: ヤブレツボカビ目; 科: ヤブレツボカビ科; 属: ヤブレツボカビ属(種:アルヂメンタレ(arudimentale)、アウレウム(aureum)、ベンチコラ(benthicola)、グロボサム(globosum)、キネイ(kinnei)、モチバム(motivum)、マルチルジメンテール(multirudimentale)、パキデルマム(pachydermum)、プロリフェルム(proliferum)、ローゼウム(roseum)、ストリアツム(striatum))、ウルケニア属(Ulkenia)(種: アメーボイデア(amoeboidea)、ケルゲレンシス(kerguelensis)、ミヌタ(minuta)、プロファンダ(profunda)、ラジアタ(radiata)、サイレンス(sailens)、サルカリアナ(sarkariana)、シゾキトロプス(schizochytrops)、ビスルゲンシス(visurgensis)、ヨーケンシス(yorkensis))、シゾキトリウム属(種: アグレガツム(aggregatum)、リムナセウム(limnaceum)、マングロベイ(mangrovei)、ミヌツム(minutum)、オクトスポルム(octosporum))、ジャポノキトリウム属(Japonochytrium)(種: マリナム(marinum))、アプラノキトリウム属(Aplanochytrium)(種: ハリオチディス(haliotidis)、ケルグエレンシス(kerguelensis)、プロファンダ(profunda)、ストッキノイ(stocchinoi))、アルトルニア属(Althornia)(種: クロウキイ(crouchii))、またはエリナ属(Elina)(種: マリサルバ(marisalba)、シノリフィカ(sinorifica))。本発明の目的のために、ウルケニア属のなかに記載された種は、ヤブレツボカビ属の成員であるとみなされる。オーランチオキトリウム属(Aurantiochytrium)、オブロンギキトリウム属(Oblongichytrium)、ボトリオキトリウム属(Botryochytrium)、パリエチキトリウム属(Parietichytrium)、およびサイコイドキトリウム属(Sicyoidochytrium)は、本発明においてラビリンチュラ菌門により包含されるさらなる属である。
【0022】
本発明においてラビリンチュラ科生物として記載した株には、以下の生物が含まれる: 目: ラビリンチュラ目、科: ラビリンチュラ科、属: ラビリンチュラ属(Labyrinthula)(種: アルジェリエンシス(algeriensis)、コエノシスチス(coenocystis)、シャトニイ(chattonii)、マクロシスチス(macrocystis)、マクロシスチス・アトランティカ(macrocystis atlantica)、マクロシスチス・マクロシスチス(macrocystis macrocystis)、マリナ(marina)、ミヌタ(minuta)、ロスコフェンシス(roscoffensis)、バルカノビイ(valkanovii)、ビテリナ(vitellina)、ビテリナ・パシフィカ(vitellina pacifica)、ビテリナ・ビテリナ(vitellina vitellina)、ゾプフィイ(zopfii))、ラビリンチュロイデス属(Labyrinthuloides)(種: ハロチディス(haliotidis)、ヨルケンシス(yorkensis))、ラビリントミキサ属(Labyrinthomyxa)(種: マリナ(marina))、ディプロフリス属(Diplophrys)(種: アーケリ(archeri))、ピロソラス属(Pyrrhosorus)(種: マリヌス(marinus))、ソロジプロフリス属(Sorodiplophrys)(種: ステルコレア(stercorea))またはクラミドミクサ属(Chlamydomyxa)(種: ラビリンチュロイデス(labyrinthuloides)、モンタナ(montana))(しかし、ピロソラス属、ソロジプロフリス属またはクラミドミクサ属の正確な分類法上の位置付けについては現時点で合意は得られていない)。
【0023】
ラビリンチュラ菌門の微細藻類細胞には、寄託株PTA-10212、PTA-10213、PTA-10214、PTA-10215、PTA-9695、PTA-9696、PTA-9697、PTA-9698、PTA-10208、PTA-10209、PTA-10210、PTA-10211、SAM2179として寄託された微生物(寄託者によって「Ulkenia SAM2179」と名付けられた)、任意のヤブレツボカビ種(U.ビスルゲンシス、U.アモエボイダ(U. amoeboida)、U.サルカリアナ、U.プロファンダ、U.ラジアタ、U.ミヌタおよびウルケニア種BP-5601のような元ウルケニア種を含む)、およびトラウストキトリウム・ストリアツム(Thraustochytrium striatum)、トラウストキトリウム・アウレウム(Thraustochytrium aureum)、トラウストキトリウム・ロゼウム(Thraustochytrium roseum)など; ならびに任意のジャポノキトリウム種が含まれるが、これらに限定されることはない。ヤブレツボカビ目の株には、ヤブレツボカビ種(23B)(ATCC 20891); トラウストキトリウム・ストリアツム(Schneider)(ATCC 24473); スラウストキトリウム・アウレウム(Goldstein)(ATCC 34304); トラウストキトリウム・ロゼウム(Goldstein)(ATCC 28210);およびジャポノキトリウム種(L1)(ATCC 28207)が含まれるが、これらに限定されることはない。シゾキトリウム属には、シゾキトリウム・アグレガツム(Schizochytrium aggregatum)、シゾキトリウム・リマシヌム(Schizochytrium limacinum)、シゾキトリウム種(S31)(ATCC 20888)、シゾキトリウム種(S8)(ATCC 20889)、シゾキトリウム種(LC-RM)(ATCC 18915)、シゾキトリウム種(SR21)、寄託株ATCC 28209、および寄託されたシゾキトリウム・リマシヌム株IFO 32693が含まれるが、これらに限定されることはない。いくつかの態様において、細胞はシゾキトリウム属またはヤブレツボカビ属である。シゾキトリウム属は連続的な二分裂によっても、遊走子を最終的には放出する胞子嚢を形成することによっても複製することができる。しかしながら、ヤブレツボカビ属は、胞子嚢を形成し、これが次いで遊走子を放出することによってのみ複製する。
【0024】
いくつかの態様において、微細藻類宿主細胞は、ラビリンチュラ網(Labyrinthulae)(Labyrinthulomycetesとも呼ばれる)である。ラビリンチュラ網は「外質ネット」と呼ばれる特異構造を産生する。これらの構造は、原形質膜の表面積の増大に大きく寄与する原形質膜の枝分かれ、管状突起である。例えばPerkins, Arch. Mikrobiol. 84:95-118(1972); Perkins, Can. J. Bot. 51:485-491(1973)を参照されたい。外質ネットは、サゲノソーム(sagenosome)またはボスロソーム(bothrosome)といわれる特異な細胞構造から形成される。外質ネットは、ラビリンチュラ網の細胞を表面に付着させ、表面を貫通させる能力がある。例えば、それぞれ、Coleman and Vestal, Can. J. Microbiol. 33:841-843(1987)、およびPorter, Mycologia 84:298-299(1992)を参照されたい。例えば、シゾキトリウム種ATCC 20888は、固体培地上で増殖させた場合に寒天へと伸びる外質ネットを産生することが観察されている(データは示されていない)。そのような場合の外質ネットは偽仮根(pseudorhizoid)として働くように見える。さらに、アクチンフィラメントは、ある種の外質ネット膜突起のなかに豊富にあることが分かっている。例えば、Preston, J. Eukaryot. Microbiol. 52:461-475(2005)を参照されたい。他の生物における細胞骨格構造内のアクチンフィラメントの重要性に基づき、アクチンのような細胞骨格要素が、外質ネット膜突起の形成および/または完全性に関与していることが予想される。
【0025】
偽仮根突起を産生するさらなる生物には、ツボカビと呼ばれる生物が含まれ、これは、ツボカビ門(Chytridiomycota)またはヒゲカビ(Phycomyces)を含むさまざまな群に分類法上、分類される。属の例としては、ツボカビ属(Chytrdium)、ツボカビ属(Chytrimyces)、クラドキトリウム属(Cladochytium)、エダツボカビ属(Lacustromyces)、ポット属(Rhizophydium)、ポット属(Rhisophyctidaceae)、ロゼラ属(Rozella)、オルピディウム属(Olpidium)、およびロブロマイセス属(Lobulomyces)が挙げられる。
【0026】
いくつかの態様において、微細藻類宿主細胞は膜突起を含む。いくつかの態様において、微細藻類宿主細胞は偽仮根を含む。いくつかの態様において、微細藻類宿主細胞は外質ネットを含む。いくつかの態様において、微細藻類宿主細胞はサゲノソームまたはボスロソームを含む。
【0027】
いくつかの態様において、微細藻類宿主細胞はヤブレツボカビ科生物である。いくつかの態様において、微細藻類宿主細胞はシゾキトリウム属またはヤブレツボカビ属の細胞である。
【0028】
いくつかの態様において、微細藻類宿主細胞はラビリンチュラ科生物である。
【0029】
いくつかの態様において、微細藻類宿主細胞は、シゾキトリウム属、ヤブレツボカビ属、および他のヤブレツボカビ科生物を含む、ラビリンチュラ菌門の成員のような、従来の分泌経路を通じてポリペプチドをプロセッシングできる真核生物である。例えば、ラビリンチュラ菌門の成員はCHO細胞よりも少ない大量分泌タンパク質を産生し、例えば、CHO細胞に比べて、シゾキトリウム属を用いることの利点をもたらすことが認識されている。さらに、大腸菌とは異なり、シゾキトリウム属のような、ラビリンチュラ菌門の成員は、ある種のタンパク質の生物学的活性に必要とされる、N-結合型グリコシル化のような、タンパク質グリコシル化を行う。シゾキトリウム属のようなヤブレツボカビ科生物によって示されるN-結合型グリコシル化は、酵母のグリコシル化よりも哺乳類のグリコシル化パターンによく似ていることが確認されている。
【0030】
本発明の宿主細胞に有効な培養条件は、タンパク質の産生および/または組み換えを可能にする有効な培地、バイオリアクタ、温度、pH、および酸素条件を含むが、これらに限定されることはない。有効な培地とは、ヤブレツボカビ目の細胞、例えばシゾキトリウム属の宿主細胞のような微細藻類細胞が、典型的に培養される任意の培地を指す。そのような培地は典型的に、同化可能な炭素、窒素、およびリン酸塩の供給源、ならびに適切な塩、鉱物、金属、および他の栄養素、例えばビタミンを有する水性培地を含む。適当な培地および培養条件の非限定的な例は、実施例の項に開示されている。ヤブレツボカビ目の微生物に適した非限定的な培養条件はまた、全体が参照により本明細書に組み入れられる、米国特許第5,340,742号に記載されている。本発明の細胞は従来の発酵バイオリアクタ、振盪フラスコ、試験管、マイクロタイターディッシュ、およびペトリ皿において培養することができる。培養は組み換え細胞に適した温度、pH、および酸素含量で行うことができる。
【0031】
いくつかの態様において、本発明の微細藻類宿主細胞は、選択マーカーをコードする核酸配列を含んだ組み換えベクターを含む。いくつかの態様において、選択マーカーは形質転換された微生物の選択を可能にする。優勢な選択マーカーの例には、SEQ ID NO: 5によって表される「ブレオマイシン結合タンパク質」をコードする、例えば、ストレプトアロテイクス・ヒンダスタヌス(Steptoalloteichus hindustanus)由来のSh ble遺伝子のような、抗生物質活性または抗真菌活性を有する化合物を分解する酵素が含まれる。優勢な選択マーカーの別の例には、SEQ ID NO: 6のポリヌクレオチド配列の変異型のようなヤブレツボカビ科生物のアセト乳酸合成酵素配列が含まれる。アセト乳酸合成酵素は、スルホニル尿素化合物、イミダゾリノンクラスの阻害剤、および/またはピリミジニルオキシ安息香酸による阻害に耐性であるように修飾されても、変異されても、または別の方法で選択されてもよい。ヤブレツボカビ科生物のアセト乳酸合成酵素配列の代表例には、SEQ ID NO: 7、SEQ ID NO: 8、SEQ ID NO: 9、SEQ ID NO: 10のようなアミノ酸配列、または以下の位置: 116G、117A、192P、200A、251K、358M、383D、592V、595Wもしくは599Fの1つもしくは複数でのアミノ酸の欠失、挿入もしくは置換によってSEQ ID NO: 7とは異なるアミノ酸配列、およびSEQ ID NO: 11、SEQ ID NO: 12またはSEQ ID NO: 13のようなポリヌクレオチド配列、ならびに代表的な配列のいずれかと少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%または少なくとも99%の同一性を有する配列が含まれるが、これらに限定されることはない。微細藻類細胞の形質転換のために組み換えベクターに含まれてもよい選択マーカーのさらなる例には、ZEOCIN(商標)、パロモマイシン、ハイグロマイシン、ブラストサイジン、または任意の他の適切な耐性マーカーが含まれる。
【0032】
「形質転換」という用語は、外因性核酸分子(すなわち、組み換え核酸分子)を微生物細胞に挿入できる任意の方法を指すように用いられる。微生物系において、「形質転換」という用語は、微生物による外因性核酸の獲得に起因する遺伝性変化を記載するために用いられ、「トランスフェクション」という用語と本質的に同義である。外因性核酸分子を微細藻類宿主細胞に導入するのに適した形質転換技法には、粒子衝撃、エレクトロポレーション、マイクロインジェクション、リポフェクション、吸着、感染およびプロトプラスト融合が含まれるが、これらに限定されることはない。例えば、組み換えベクターを含む外因性核酸分子は、指数増殖期の間の、または微細藻類が600 nmで1.5~2の光学密度に達した時の、静止期にある微細藻類に導入することができる。微細藻類宿主細胞はまた、エレクトロポレーションによる宿主細胞への核酸分子の導入の前にプロテアーゼ活性を有する酵素で前処理することもできる。
【0033】
いくつかの態様において、宿主細胞を遺伝的に改変して、グリコシル化に関わるものを含む、糖質の輸送および/または合成と関連した生合成経路に関与する遺伝子を導入または欠失することができる。例えば、宿主細胞を、内因性グリコシル化遺伝子を欠失させることにより、および/またはヒトもしくは動物グリコシル化遺伝子を挿入することにより改変して、ヒトのものにさらによく似ているグリコシル化パターンを可能にすることができる。酵母におけるグリコシル化の改変は、例えば、米国特許第7,029,872号、ならびに米国特許出願公開第2004/0171826号、同第2004/0230042号、同第2006/0257399号、同第2006/0029604号および同第2006/0040353号のなかで見出すことができる。本発明の宿主細胞はまた、遺伝子発現を増大または調節するためにRNAウイルス要素が利用されている細胞を含む。
【0034】
発現系
微細藻類宿主細胞における異種ポリペプチドの発現のために使われる発現系は、微細藻類細胞において活性な調節制御要素を含む。いくつかの態様において、発現系は、ラビリンチュラ菌門の細胞において活性な調節制御要素を含む。いくつかの態様において、発現系は、ヤブレツボカビ科生物において活性な調節制御要素を含む。いくつかの態様において、発現系は、シゾキトリウム属またはヤブレツボカビ属において活性な調節制御要素を含む。さまざまなプロモーターを含む多くの調節制御要素が、いくつかの多様な種において活性である。それゆえ、調節配列は、それらが単離された細胞と同一な細胞種において利用されてもよく、またはそれらが単離された細胞とは異なる細胞種において利用されてもよい。そのような発現カセットのデザインおよび構築では、当業者に公知の標準的な分子生物学技法を用いる。例えば、Sambrook et al., 2001, Molecular Cloning: A Laboratory Manual, 3rd editionを参照されたい。
【0035】
いくつかの態様において、微細藻類細胞における異種ポリペプチドの産生に使われる発現系は、ラビリンチュラ菌門の配列に由来する調節要素を含む。いくつかの態様において、微細藻類細胞において異種ポリペプチドを産生するために使われる発現系は、ラビリンチュラ菌門以外の藻類配列に由来する配列を含む、ラビリンチュラ菌門以外の配列に由来する調節要素を含む。いくつかの態様において、発現系は、異種ポリペプチドをコードするポリヌクレオチド配列を含み、このポリヌクレオチド配列は、微細藻類宿主細胞において機能的な、任意のプロモーター配列、任意のターミネーター配列、および/または任意の他の調節配列と関連している。誘導性の配列または構成的に活性な配列を用いることができる。適当な調節制御要素はまた、本明細書に記載する核酸分子と関連している調節制御要素のいずれかを含む。
【0036】
本発明は同様に、微細藻類宿主細胞における異種ポリペプチドの発現のための発現カセットを対象とする。本発明は同様に、宿主細胞における異種ポリペプチドの発現のための発現カセットを含む上記の宿主細胞のいずれかを対象とする。いくつかの態様において、発現系は、宿主細胞において機能するように機能的に連結されている、少なくともプロモーター、コード配列、およびターミネーター領域のような、遺伝要素を含んだ発現カセットを含む。いくつかの態様において、発現カセットは、本明細書に記載する本発明の単離された核酸分子の少なくとも1つを含む。いくつかの態様において、発現カセットの遺伝要素のすべてが、単離された核酸分子と関連している配列である。いくつかの態様において、制御配列は誘導性の配列である。いくつかの態様において、異種ポリペプチドをコードする核酸配列は、宿主細胞のゲノムに組み込まれる。いくつかの態様において、異種ポリペプチドをコードする核酸配列は、宿主細胞のゲノムに安定的に組み込まれる。
【0037】
いくつかの態様において、発現させようとする異種ポリペプチドをコードする単離された核酸配列は、プロモーター配列および/またはターミネーター配列に機能的に連結され、その両方が宿主細胞において機能的である。発現させようとする異種ポリペプチドをコードする単離された核酸配列が機能的に連結されるプロモーターおよび/またはターミネーター配列は、本明細書において開示される核酸配列、米国特許第7,001,772号に開示されている調節配列、米国特許出願公開第2006/0275904号および同第2006/0286650号に開示されている調節配列、米国特許出願公開第2010/0233760号および国際公開公報第2010/107709号に開示されている調節配列、または異種ポリペプチドをコードする単離されたポリヌクレオチド配列に機能的に連結されて、形質転換される宿主細胞において機能的な他の調節配列を含むが、これらに限定されない、任意のプロモーターおよび/またはターミネーター配列を含むことができる。いくつかの態様において、異種ポリペプチドをコードする核酸配列は、翻訳効率を最大化するために特定の微細藻類宿主細胞に向けてコドン最適化される。
【0038】
本発明は同様に、本発明の発現カセットを含む組み換えベクターを対象とする。組み換えベクターはプラスミド、ファージおよびウイルスを含むが、これらに限定されることはない。いくつかの態様において、組み換えベクターは線状化されたベクターである。いくつかの態様において、組み換えベクターは発現ベクターである。本明細書で用いる場合、「発現ベクター」という語句はコードされる産物(例えば、関心対象のタンパク質)の産生に適したベクターを指す。いくつかの態様において、産生させようとする産物をコードする核酸配列は、組み換え核酸分子を産生するための組み換えベクターに挿入される。産生させようとする異種ポリペプチドをコードする核酸配列は、その核酸配列を、組み換え微生物内での核酸配列の転写および翻訳を可能にするベクター中の調節配列(例えば、ヤブレツボカビ目プロモーター)と機能的に連結させる形で、ベクターに挿入される。いくつかの態様において、本明細書に記載する選択可能なマーカーのいずれかを含む、選択可能なマーカーは、本発明の組み換え核酸分子が成功裏に産生されている組み換え微生物の選択を可能にする。
【0039】
いくつかの態様において、本発明の宿主細胞により産生される異種ポリペプチドは、商業規模で産生される。商業規模は、≧100 L、≧1,000 L、≧10,000 Lまたは≧100,000 Lのサイズの通気発酵槽中で増殖された微生物由来の異種ポリペプチドの産生を含む。いくつかの態様において、商業規模の産生は撹拌しながら通気発酵槽中で行われる。
【0040】
いくつかの態様において、本発明の宿主細胞により産生される異種ポリペプチドは、細胞内に蓄積する場合があり、または例えば可溶性異種ポリペプチドとして、細胞から培地の中に分泌される場合がある。
【0041】
いくつかの態様において、本発明により産生される異種ポリペプチドは、細胞から、細胞が増殖される培地または発酵培地から回収される。いくつかの態様において、異種ポリペプチドは、可溶性異種ポリペプチドとして培地から回収される分泌異種ポリペプチドである。いくつかの態様において、異種ポリペプチドは、シグナルペプチドを含む分泌タンパク質である。
【0042】
いくつかの態様において、本発明により産生される異種ポリペプチドは、小胞体にそれを留めるよう指令する標的化シグナル、その細胞外シグナルを指令する標的化シグナル、またはそれを他の細胞小器官もしくは細胞区画へ向かわせる標的化シグナルを含む。いくつかの態様において、異種ポリペプチドはシグナルペプチドを含む。いくつかの態様において、異種ポリペプチドはNa/Pi-IIb2輸送体シグナルペプチドまたはSec1輸送タンパク質を含む。いくつかの態様において、シグナルペプチドはSEQ ID NO: 1またはSEQ ID NO: 37のアミノ酸配列を含む。いくつかの態様において、SEQ ID NO: 1またはSEQ ID NO: 37のアミノ酸配列を有するシグナルペプチドを含む異種ポリペプチドは、培地中に分泌される。いくつかの態様において、シグナルペプチドは分泌過程の間にタンパク質から切断され、タンパク質の成熟型を生ずる。
【0043】
いくつかの態様において、本発明の宿主細胞により産生される異種ポリペプチドは、グリコシル化される。いくつかの態様において、本発明により産生される異種ポリペプチドのグリコシル化パターンは、酵母または大腸菌において産生されるタンパク質よりも哺乳類のグリコシル化パターンによく似ている。いくつかの態様において、本発明の微細藻類宿主細胞により産生される異種ポリペプチドは、N-結合型グリコシル化パターンを含む。治療目的に使われるグリコシル化タンパク質は、そのグリコシル化パターンが、対象の生物において見られるグリコシル化パターンと似ている場合に抗糖型の免疫反応を促進する可能性が低い。逆に、対象の生物に特有ではない結合または糖を有するグリコシル化タンパク質は、抗原性である可能性が高い。特定の糖型によってエフェクタ機能が調節されることもある。例えばIgGは、炎症促進性反応または抗炎症性反応を、Fc領域の糖型の末端シアル酸の非存在または存在と、それぞれ相関して媒介しうる(Kaneko et al., Science 313:670-3(2006))。
【0044】
本発明はさらに、組み換え異種ポリペプチドを産生する方法を対象とし、本方法は、異種ポリペプチドをコードするポリヌクレオチド配列を発現させるのに十分な条件の下で本発明の組み換え微細藻類宿主細胞を培養する段階を含む。いくつかの態様において、組み換え異種ポリペプチドは宿主細胞から分泌され、培地から回収される。いくつかの態様において、細胞から分泌される異種ポリペプチドは、分泌シグナルペプチドを含む。産生のために用いられるベクターおよび宿主系に依り、本発明の組み換え異種ポリペプチドは組み換え細胞内に残存してもよく、発酵培地の中に分泌されてもよく、2つの細胞膜間の空間の中に分泌されてもよく、または細胞膜の外表面に保持されてもよい。本明細書で用いる場合、「タンパク質を回収する段階」という語句は、タンパク質を含有する発酵培地を収集することを指し、分離または精製のさらなる段階という意味を含む必要はない。本発明の方法により産生される異種ポリペプチドは、限定されるものではないが、アフィニティークロマトグラフィー、イオン交換クロマトグラフィー、ろ過、電気泳動、疎水性相互作用クロマトグラフィー、ゲルろ過クロマトグラフィー、逆相クロマトグラフィー、コンカナバリンAクロマトグラフィー、クロマト分画、および示差的可溶化のような、種々の標準的タンパク質精製技法を用いて精製することができる。いくつかの態様において、本発明の方法により産生される異種ポリペプチドは、「実質的に純粋な」形態で単離される。本明細書で用いる場合、「実質的に純粋な」とは、市販製品としての異種ポリペプチドの効果的な使用を可能にする純度を指す。いくつかの態様において、組み換え異種ポリペプチドは細胞内に蓄積し、細胞から回収される。いくつかの態様において、本方法の宿主細胞はヤブレツボカビ科生物である。いくつかの態様において、本方法の宿主細胞はシゾキトリウム属またはヤブレツボカビ属である。いくつかの態様において、組み換え異種ポリペプチドは治療用タンパク質、食品用酵素、または工業用酵素である。いくつかの態様において、組み換え微細藻類宿主細胞はシゾキトリウム属であり、組み換え異種ポリペプチドは、分泌シグナル配列を含む治療用タンパク質である。
【0045】
いくつかの態様において、本発明の組み換えベクターは標的化ベクターである。本明細書で用いる場合、「標的化ベクター」という語句は、特定の核酸分子を組み換え細胞に送達するために用いられるベクターを指し、この核酸分子は、宿主細胞内で内因性遺伝子を欠失させるかまたは不活性化させるために用いられる(すなわち、標的化された遺伝子破壊またはノックアウト技法のために用いられる)。そのようなベクターは「ノックアウト」ベクターとしても公知である。いくつかの態様において、標的化ベクターの一部分は、宿主細胞における標的遺伝子(すなわち、欠失または不活性化されるように標的化される遺伝子)の核酸配列と相同な核酸配列を有する。いくつかの態様において、ベクター中に挿入される核酸分子(すなわち、挿入断片)は標的遺伝子と相同である。いくつかの態様において、ベクター挿入断片の核酸配列は、標的遺伝子に結合して標的遺伝子と挿入断片が相同組み換えを行い、それによって、内因性標的遺伝子が欠失され、不活性化され、または減弱化されるようにデザインされる(すなわち、内因性標的遺伝子の少なくとも一部分が突然変異または欠失されることによる)。
【0046】
単離された核酸分子
本発明によれば、単離された核酸分子はその自然環境から取り出された(すなわち、人的操作に供された)核酸分子であり、その自然環境はその核酸分子が本来見出されるゲノムまたは染色体である。したがって、「単離された」とは、必ずしも、その核酸分子が精製されたという程度までを反映しているとは限らず、その核酸分子が本来見出されるゲノム全体または染色体全体をその分子が含んでいないことを示す。単離された核酸分子は、DNA、RNA(例えば、mRNA)、またはDNAもしくはRNAのいずれかの誘導体(例えば、cDNA)を含みうる。「核酸分子」という語句はそもそも物質的な核酸分子を指し、「核酸配列」または「ポリヌクレオチド配列」という語句はそもそも核酸分子上のヌクレオチドの配列を指すが、これらの語句は、異種ポリペプチドをコードする能力がある核酸分子、ポリヌクレオチド配列、または核酸配列については特に、互換的に用いられる。いくつかの態様において、本発明の単離された核酸分子は、組み換えDNA技術(例えば、ポリメラーゼ連鎖反応(PCR)増幅、クローニング)または化学的合成を用いて産生される。単離された核酸分子は、改変によってコードされる異種ポリペプチドの配列、機能および/または生物学的活性に望ましい効果を与えるような形でヌクレオチドが挿入、欠失、置換および/または反転されている改変された核酸分子ならびに天然の対立遺伝子の変種を含むが、これらに限定されない、天然の核酸分子およびその相同体を含む。
【0047】
プロモーター配列、ターミネーター配列、シグナルペプチド配列、または任意の他の配列の核酸配列相補体は、プロモーター配列、ターミネーター配列、シグナルペプチド配列、または任意の他の配列を有する鎖と相補的な核酸鎖の核酸配列を指す。二本鎖DNAは、一本鎖DNAと、この一本鎖DNAに対して相補体である配列を有するその相補鎖とを含むことが理解されよう。したがって、核酸分子は、二本鎖または一本鎖のいずれであってもよく、「ストリンジェントな」ハイブリダイゼーション条件の下で本発明の配列と、および/または本発明の配列の相補体と、安定なハイブリッドを形成する核酸分子を含む。相補配列を推定するための方法は、当業者に公知である。
【0048】
「ポリペプチド」という用語は、単鎖ポリペプチド分子だけでなく、個々の構成ポリペプチドが共有結合または非共有結合的手段により連結している多ポリペプチド複合体も含む。本発明によれば、単離されたポリペプチドは、その自然環境から取り出された(すなわち、人的操作に供された)ポリペプチドであり、例えば、精製されたタンパク質、精製されたペプチド、部分的に精製されたタンパク質、部分的に精製されたペプチド、組み換えにより産生されたタンパク質またはペプチド、および合成により産生されたタンパク質またはペプチドを含むことができる。
【0049】
本明細書で用いる場合、組み換え微生物は、組み換え技術を用いてその通常の(すなわち、野生型または天然の)形態から改変され(すなわち、突然変異されまたは変えられ)ているゲノムを有する。本発明による組み換え微生物は、そのような改変が微生物内で所望の効果をもたらすような形で、核酸分子が挿入、欠失、または改変されている(すなわち、例えば、ヌクレオチドの挿入、欠失、置換、および/または反転により、突然変異されている)微生物を含むことができる。本明細書で用いる場合、遺伝子発現の低下、遺伝子の機能の低下、または遺伝子産物(すなわち、遺伝子によりコードされるタンパク質)の機能の低下をもたらす遺伝的改変は、遺伝子の不活性化(完全もしくは部分的)、欠失、中断、妨害または下方制御ということができる。例えば、そのような遺伝子によりコードされるタンパク質の機能の低下をもたらす遺伝子における遺伝的改変は、遺伝子の完全な欠失(すなわち、遺伝子が組み換え微生物に存在せず、それゆえにタンパク質が組み換え微生物に存在しない)、タンパク質の不完全な翻訳をもたらすもしくは翻訳をもたらさない(例えば、タンパク質が発現されない)遺伝子における突然変異、またはタンパク質の本来の機能を低下させるもしくは消失させる(例えば、活性(例えば、酵素活性もしくは作用)が低下したまたは活性がないタンパク質が発現される)遺伝子における突然変異の結果でありうる。遺伝子発現または機能の増加をもたらす遺伝的改変は、遺伝子の増幅、過剰産生、過剰発現、活性化、増強、付加、または上方制御を指すことができる。
【0050】
プロモーター
プロモーターは、関連しているコード領域の転写を指令するDNAの領域である。
【0051】
いくつかの態様において、プロモーターはラビリンチュラ菌門の微生物由来である。いくつかの態様において、プロモーターは、SAM2179として寄託された微生物(寄託者によって「Ulkenia SAM2179」と名付けられた)、ウルケニア属もしくはヤブレツボカビ属、またはシゾキトリウム属の微生物を含むが、これらに限定されない、ヤブレツボカビ科生物由来である。シゾキトリウム属には、シゾキトリウム・アグレガツム、シゾキトリウム・リマシヌム、シゾキトリウム種(S31)(ATCC 20888)、シゾキトリウム種(S8)(ATCC 20889)、シゾキトリウム種(LC-RM)(ATCC 18915)、シゾキトリウム種(SR21)、寄託されたシゾキトリウム株ATCC 28209、および寄託されたシゾキトリウム株IFO 32693が含まれるが、これらに限定されることはない。
【0052】
プロモーターは、少なくともヤブレツボカビ科生物においてプロモーター活性を持つことができ、全長プロモーター配列およびその機能的断片、融合配列、ならびに天然プロモーターの相同体を含む。プロモーターの相同体は、少なくとも1つ、2つ、3つ、またはいくつかのヌクレオチドが欠失され、挿入され、反転され、置換され、および/または誘導体化されているという点で、天然プロモーターとは異なる。プロモーターの相同体は、少なくともヤブレツボカビ科生物において、プロモーターとしての活性を保持しうるが、その活性はある種の刺激に依って増加され、減少され、または産生されうる。プロモーターは、発生的および組織特異的な調節制御または発現を付与する1つまたは複数の配列要素を含むことができる。
【0053】
いくつかの態様において、本明細書において記載の単離された核酸分子は、例えばSEQ ID NO: 3によって表されるポリヌクレオチド配列のようなPUFA PKS OrfCプロモーター(「PKS OrfCプロモーター」; PFA3プロモーターとしても公知)を含む。PKS OrfCプロモーターは、天然PKS OrfCプロモーター配列と十分に類似しているPKS OrfCプロモーター相同体を含み、この相同体の核酸配列は、例えば、SEQ ID NO: 3のような天然PKS OrfCプロモーターまたはATCCアクセッション番号PTA-9615に寄託されているpCL0001のOrfCプロモーターの核酸配列の相補体と、中等度の、高度の、または非常に高度のストリンジェンシー条件の下でハイブリダイズできる。
【0054】
いくつかの態様において、本発明の単離された核酸分子は、例えば、SEQ ID NO: 42によって表されるEF1ショートプロモーターまたはSEQ ID NO: 43によって表されるEF1ロングプロモーターのような、EF1ショートプロモーター(「EF1ショート」もしくは「EF1-S」プロモーター)またはEF1ロングプロモーター(「EF1ロング」もしくは「EF1-L」プロモーター)を含む。EF1ショートまたはEF1ロングプロモーターは、相同体の核酸配列が、それぞれ、例えば、SEQ ID NO: 42および/もしくはSEQ ID NO: 43のような天然EF1ショートおよび/もしくはロングプロモーター、またはATCCアクセッション番号PTA-9616に寄託されているpAB0018のEF1ロングプロモーターの核酸配列の相補体と、中等度の、高度の、または非常に高度のストリンジェンシー条件の下でハイブリダイズできる、それぞれ、天然EF1ショートおよび/またはロングプロモーター配列と十分に類似しているEF1ショートまたはロングプロモーター相同体を含む。
【0055】
いくつかの態様において、本発明の単離された核酸分子は、例えば、SEQ ID NO: 44によって表される60SショートプロモーターまたはSEQ ID NO: 45によって表されるポリヌクレオチド配列を有する60Sロングプロモーターのような、60Sショートプロモーター(「60Sショート」もしくは「60S-S」プロモーター)または60Sロングプロモーター(「60Sロング」もしくは「60S-L」プロモーター)を含む。いくつかの態様において、60Sショートまたは60Sロングプロモーターは、それぞれ、天然60Sショートまたは60Sロングプロモーター配列と十分に類似している60Sショートまたは60Sロングプロモーター相同体を含み、その相同体の核酸配列は、それぞれ、例えば、SEQ ID NO: 44および/もしくはSEQ ID NO: 45のような天然60Sショートおよび/もしくは60SロングプロモーターまたはATCCアクセッション番号PTA-9614に寄託されているpAB0011の60Sロングプロモーターの核酸配列の相補体と、中等度、高度、または非常に高度のストリンジェンシー条件の下でハイブリダイズできる。
【0056】
いくつかの態様において、単離された核酸分子は、例えばSEQ ID NO: 46によって表されるポリヌクレオチド配列のようなSec1プロモーター(「Sec1プロモーター」)を含む。いくつかの態様において、Sec1プロモーターは、天然Sec1プロモーター配列と十分に類似しているSec1プロモーター相同体を含み、その相同体の核酸配列は、例えば、SEQ ID NO: 46のような天然Sec1プロモーターまたはATCCアクセッション番号PTA-9613に寄託されているpAB0022のSec1プロモーターの核酸配列の相補体と、中等度、高度、または非常に高度のストリンジェンシー条件の下でハイブリダイズできる。
【0057】
ターミネーター
ターミネーター領域は、転写のためにゲノムDNA中の遺伝子配列の末端に印を付ける遺伝子配列の部分である。
【0058】
いくつかの態様において、ターミネーター領域は、ラビリンチュラ菌門の微生物由来である。いくつかの態様において、ターミネーター領域はヤブレツボカビ科生物由来である。いくつかの態様において、ターミネーター領域はシゾキトリウム属またはヤブレツボカビ属由来である。シゾキトリウム属には、シゾキトリウム・アグレガツム、シゾキトリウム・リマシヌム、シゾキトリウム種(S31)(ATCC 20888)、シゾキトリウム種(S8)(ATCC 20889)、シゾキトリウム種(LC-RM)(ATCC 18915)、シゾキトリウム種(SR21)、寄託株ATCC 28209、および寄託株IFO 32693が含まれるが、これらに限定されることはない。いくつかの態様において、ターミネーター領域は、例えば、異種SV40ターミネーター領域のような、異種ターミネーター領域である。
【0059】
ターミネーター領域は、少なくともヤブレツボカビ科生物においてターミネーター活性を持つことができ、全長ターミネーター配列およびその機能的断片、融合配列、ならびに天然ターミネーター領域の相同体を含む。ターミネーターの相同体は、1個または数個に限定されないが、少なくとも1個または数個のヌクレオチドが欠失され、挿入され、反転され、置換され、および/または誘導体化されているという点で、天然ターミネーターとは異なる。いくつかの態様において、ターミネーターの相同体は、少なくともヤブレツボカビ科生物においてターミネーター領域としての活性を保持しうるが、ある種の刺激に依って、その活性を増加させる、減少させる、または生じさせることができる。
【0060】
いくつかの態様において、単離された核酸分子は、例えば、SEQ ID NO: 4によって表されるポリヌクレオチド配列のようなPUFA PKS OrfC遺伝子のターミネーター領域(PFA3ターミネーターとしても公知の「PKS OrfCターミネーター領域」)を含むことができる。SEQ ID NO: 4において開示されるターミネーター領域は、ヤブレツボカビ科生物の微生物由来の天然(野生型)ターミネーター配列であり、具体的には、シゾキトリウム属PKS OrfCターミネーター領域であり、「OrfCターミネーター要素1」と呼ばれる。いくつかの態様において、PKS OrfCターミネーター領域は、天然PUFA PKS OrfCターミネーター領域と十分に類似しているPKS OrfCターミネーター領域相同体を含み、その相同体の核酸配列は、例えば、SEQ ID NO: 4のような天然PKS OrfCターミネーター領域またはATCCアクセッション番号PTA-9614に寄託されているpAB0011のOrfCターミネーター領域の核酸配列の相補体と、中等度、高度、または非常に高度のストリンジェンシー条件の下でハイブリダイズできる。
【0061】
シグナルペプチド
いくつかの態様において、単離された核酸分子は、ラビリンチュラ菌門の微生物からの分泌タンパク質のシグナルペプチドをコードするポリヌクレオチド配列を含むことができる。いくつかの態様において、微生物はヤブレツボカビ科生物である。いくつかの態様において、微生物はシゾキトリウム属またはヤブレツボカビ属である。
【0062】
シグナルペプチドは、ヤブレツボカビ科生物において分泌シグナル活性を持つことができ、全長ペプチドおよびその機能的断片、融合配列、ならびに天然シグナルペプチドの相同体を含む。シグナルペプチドの相同体は、1個または数個に限定されないが、少なくとも1個または数個のアミノ酸が欠失され(例えば、ペプチドまたは断片のような、タンパク質の切断型)、挿入され、反転され、置換され、および/または誘導体化されている(例えば、グリコシル化、リン酸化、アセチル化、ミリストイル化、プレニル化、パルミチン酸化、アミド化、および/またはグリコシルホスファチジルイノシトールの付加により)という点で、天然シグナルペプチドとは異なる。いくつかの態様において、シグナルペプチドの相同体は、少なくともヤブレツボカビ科生物においてシグナルとしての活性を保持するが、ある種の刺激に依って、その活性を増加させる、減少させる、または生じさせることができる。
【0063】
いくつかの態様において、単離された核酸分子は、Na/Pi-IIb2輸送体タンパク質シグナルペプチドをコードするポリヌクレオチド配列を含む。Na/Pi-IIb2輸送体タンパク質シグナルペプチドは、少なくともヤブレツボカビ科生物において少なくともNa/Pi-IIb2輸送体タンパク質に対するシグナル標的化活性を持つことができ、全長ペプチドおよびその機能的断片、融合ペプチド、ならびに天然Na/Pi-IIb2輸送体タンパク質シグナルペプチドの相同体を含む。いくつかの態様において、Na/Pi-IIb2輸送体タンパク質シグナルペプチドは、SEQ ID NO: 1によって表されるアミノ酸配列を有する。いくつかの態様において、Na/Pi-IIb2輸送体タンパク質シグナルペプチドは、SEQ ID NO: 15によって表されるアミノ酸配列を有する。いくつかの態様において、単離された核酸分子は、少なくともヤブレツボカビ科生物において、少なくともNa/Pi-IIb2輸送体タンパク質に対するシグナルペプチドとして機能するSEQ ID NO: 1またはSEQ ID NO: 15の機能的断片を含む単離されたアミノ酸配列をコードするポリヌクレオチド配列を含む。いくつかの態様において、単離された核酸分子は、SEQ ID NO: 2を含む。
【0064】
本発明は同様に、Na/Pi-IIb2輸送体シグナルペプチドのアミノ酸配列を含む単離されたポリペプチドを対象とする。
【0065】
いくつかの態様において、単離された核酸分子は、α-1,6-マンノシルトランスフェラーゼ(ALG12)シグナルペプチドをコードするポリヌクレオチド配列を含む。ALG12シグナルペプチドは少なくともヤブレツボカビ科生物において、少なくともALG12タンパク質に対するシグナル標的化活性を持つことができ、全長ペプチドおよびその機能的断片、融合ペプチド、ならびに天然ALG12シグナルペプチドの相同体を含む。いくつかの態様において、ALG12シグナルペプチドはSEQ ID NO: 59によって表されるアミノ酸配列を有する。いくつかの態様において、単離された核酸分子は、少なくともヤブレツボカビ科生物において、少なくともALG12に対するシグナルペプチドとして機能するSEQ ID NO: 59の機能的断片を含む単離されたアミノ酸配列をコードするポリヌクレオチド配列を含む。いくつかの態様において、単離された核酸分子は、SEQ ID NO: 60を含む。
【0066】
本発明は同様に、ALG12シグナルペプチドのアミノ酸配列を含む単離されたポリペプチドを対象とする。
【0067】
いくつかの態様において、単離された核酸分子は、結合免疫グロブリンタンパク質(BiP)シグナルペプチドをコードするポリヌクレオチド配列を含む。BiPシグナルペプチドは少なくともヤブレツボカビ科生物において、少なくともBiPタンパク質に対するシグナル標的化活性を持つことができ、全長ペプチドおよびその機能的断片、融合ペプチド、ならびに天然BiPシグナルペプチドの相同体を含む。いくつかの態様において、BiPシグナルペプチドはSEQ ID NO: 61によって表されるアミノ酸配列を有する。いくつかの態様において、単離された核酸分子は、少なくともヤブレツボカビ科生物において、少なくともBiPタンパク質に対するシグナルペプチドとして機能するSEQ ID NO: 61の機能的断片を含む単離されたアミノ酸配列をコードするポリヌクレオチド配列を含む。いくつかの態様において、単離された核酸分子は、SEQ ID NO: 62を含む。
【0068】
本発明は同様に、BiPシグナルペプチドのアミノ酸配列を含む単離されたポリペプチドを対象とする。
【0069】
いくつかの態様において、単離された核酸分子は、α-1,3-グルコシダーゼ(GLS2)シグナルペプチドをコードするポリヌクレオチド配列を含む。GLS2シグナルペプチドは少なくともヤブレツボカビ科生物において、少なくともGLS2タンパク質に対するシグナル標的化活性を持つことができ、全長ペプチドおよびその機能的断片、融合ペプチド、ならびに天然GLS2シグナルペプチドの相同体を含む。いくつかの態様において、GLS2シグナルペプチドはSEQ ID NO: 63によって表されるアミノ酸配列を有する。いくつかの態様において、単離された核酸分子は、少なくともヤブレツボカビ科生物において、少なくともGLS2タンパク質に対するシグナルペプチドとして機能するSEQ ID NO: 63の機能的断片を含む単離されたアミノ酸配列をコードするポリヌクレオチド配列を含む。いくつかの態様において、単離された核酸分子は、SEQ ID NO: 64を含む。
【0070】
本発明は同様に、GLS2シグナルペプチドのアミノ酸配列を含む単離されたポリペプチドを対象とする。
【0071】
いくつかの態様において、単離された核酸分子は、α-1,3-1,6-マンノシダーゼ様シグナルペプチドをコードするポリヌクレオチド配列を含む。α-1,3-1,6-マンノシダーゼ様シグナルペプチドは少なくともヤブレツボカビ科生物において、少なくともα-1,3-1,6-マンノシダーゼ様タンパク質に対するシグナル標的化活性を持つことができ、全長ペプチドおよびその機能的断片、融合ペプチド、ならびに天然α-1,3-1,6-マンノシダーゼ様シグナルペプチドの相同体を含む。いくつかの態様において、α-1,3-1,6-マンノシダーゼ様シグナルペプチドはSEQ ID NO: 65によって表されるアミノ酸配列を有する。いくつかの態様において、単離された核酸分子は、少なくともヤブレツボカビ科生物において、少なくともα-1,3-1,6-マンノシダーゼ様タンパク質に対するシグナルペプチドとして機能するSEQ ID NO: 65の機能的断片を含む単離されたアミノ酸配列をコードするポリヌクレオチド配列を含む。いくつかの態様において、単離された核酸分子は、SEQ ID NO: 66を含む。
【0072】
本発明は同様に、α-1,3-1,6-マンノシダーゼ様シグナルペプチドのアミノ酸配列を含む単離されたポリペプチドを対象とする。
【0073】
いくつかの態様において、単離された核酸分子は、α-1,3-1,6-マンノシダーゼ様#1シグナルペプチドをコードするポリヌクレオチド配列を含む。α-1,3-1,6-マンノシダーゼ様#1シグナルペプチドは少なくともヤブレツボカビ科生物において、少なくともα-1,3-1,6-マンノシダーゼ様#1タンパク質に対するシグナル標的化活性を持つことができ、全長ペプチドおよびその機能的断片、融合ペプチド、ならびに天然α-1,3-1,6-マンノシダーゼ様#1シグナルペプチドの相同体を含む。いくつかの態様において、α-1,3-1,6-マンノシダーゼ様#1シグナルペプチドはSEQ ID NO: 67によって表されるアミノ酸配列を有する。いくつかの態様において、単離された核酸分子は、少なくともヤブレツボカビ科生物において、少なくともα-1,3-1,6-マンノシダーゼ様#1タンパク質に対するシグナルペプチドとして機能するSEQ ID NO: 67の機能的断片を含む単離されたアミノ酸配列をコードするポリヌクレオチド配列を含む。いくつかの態様において、単離された核酸分子は、SEQ ID NO: 68を含む。
【0074】
本発明は同様に、α-1,3-1,6-マンノシダーゼ様#1シグナルペプチドのアミノ酸配列を含む単離されたポリペプチドを対象とする。
【0075】
いくつかの態様において、単離された核酸分子は、α-1,2-マンノシダーゼ様シグナルペプチドをコードするポリヌクレオチド配列を含む。α-1,2-マンノシダーゼ様シグナルペプチドは少なくともヤブレツボカビ科生物において、少なくともα-1,2-マンノシダーゼ様タンパク質に対するシグナル標的化活性を持つことができ、全長ペプチドおよびその機能的断片、融合ペプチド、ならびに天然α-1,2-マンノシダーゼ様シグナルペプチドの相同体を含む。いくつかの態様において、α-1,2-マンノシダーゼ様シグナルペプチドはSEQ ID NO: 69によって表されるアミノ酸配列を有する。いくつかの態様において、単離された核酸分子は、少なくともヤブレツボカビ科生物において、少なくともα-1,2-マンノシダーゼ様タンパク質に対するシグナルペプチドとして機能するSEQ ID NO: 69の機能的断片を含む単離されたアミノ酸配列をコードするポリヌクレオチド配列を含む。いくつかの態様において、単離された核酸分子は、SEQ ID NO: 70を含む。
【0076】
本発明は同様に、α-1,2-マンノシダーゼ様シグナルペプチドのアミノ酸配列を含む単離されたポリペプチドを対象とする。
【0077】
いくつかの態様において、単離された核酸分子は、β-キシロシダーゼ様シグナルペプチドをコードするポリヌクレオチド配列を含む。β-キシロシダーゼ様シグナルペプチドは少なくともヤブレツボカビ科生物において、少なくともβ-キシロシダーゼ様タンパク質に対するシグナル標的化活性を持つことができ、全長ペプチドおよびその機能的断片、融合ペプチド、ならびに天然β-キシロシダーゼ様シグナルペプチドの相同体を含む。いくつかの態様において、β-キシロシダーゼ様シグナルペプチドはSEQ ID NO: 71によって表されるアミノ酸配列を有する。いくつかの態様において、単離された核酸分子は、少なくともヤブレツボカビ科生物において、少なくともβ-キシロシダーゼ様タンパク質に対するシグナルペプチドとして機能するSEQ ID NO: 71の機能的断片を含む単離されたアミノ酸配列をコードするポリヌクレオチド配列を含む。いくつかの態様において、単離された核酸分子は、SEQ ID NO: 72を含む。
【0078】
本発明は同様に、β-キシロシダーゼ様シグナルペプチドのアミノ酸配列を含む単離されたポリペプチドを対象とする。
【0079】
いくつかの態様において、単離された核酸分子は、カロテン合成酵素シグナルペプチドをコードするポリヌクレオチド配列を含む。カロテン合成酵素シグナルペプチドは少なくともヤブレツボカビ科生物において、少なくともカロテン合成酵素タンパク質に対するシグナル標的化活性を持つことができ、全長ペプチドおよびその機能的断片、融合ペプチド、ならびに天然カロテン合成酵素シグナルペプチドの相同体を含む。いくつかの態様において、カロテン合成酵素シグナルペプチドはSEQ ID NO: 73によって表されるアミノ酸配列を有する。いくつかの態様において、単離された核酸分子は、少なくともヤブレツボカビ科生物において、少なくともカロテン合成酵素タンパク質に対するシグナルペプチドとして機能するSEQ ID NO: 73の機能的断片を含む単離されたアミノ酸配列をコードするポリヌクレオチド配列を含む。いくつかの態様において、単離された核酸分子は、SEQ ID NO: 74を含む。
【0080】
本発明は同様に、カロテン合成酵素シグナルペプチドのアミノ酸配列を含む単離されたポリペプチドを対象とする。
【0081】
いくつかの態様において、単離された核酸分子は、Sec1タンパク質(「Sec1」)シグナルペプチドをコードするポリヌクレオチド配列を含む。Sec1シグナルペプチドは少なくともヤブレツボカビ科生物において、少なくともSec1タンパク質に対する分泌シグナル活性を持つことができ、全長ペプチドおよびその機能的断片、融合ペプチド、ならびに天然Sec1シグナルペプチドの相同体を含む。いくつかの態様において、Sec1シグナルペプチドはSEQ ID NO: 37によって表される。いくつかの態様において、単離された核酸分子は、少なくともヤブレツボカビ科生物において、少なくともSec1タンパク質に対するシグナルペプチドとして機能するSEQ ID NO: 37の機能的断片を含む単離されたアミノ酸配列をコードするポリヌクレオチド配列を含む。いくつかの態様において、単離された核酸分子は、SEQ ID NO: 38を含む。
【0082】
本発明は同様に、Sec1シグナルペプチドのアミノ酸配列を含む単離されたポリペプチドを対象とする。
【0083】
いくつかの態様において、単離された核酸分子は、本明細書に記載するプロモーター、ターミネーター、および/またはシグナルペプチド配列のいずれかと、少なくとも90%、95%、96%、97%、98%または99%同一であるプロモーター配列、ターミネーター配列、および/またはシグナルペプチド配列を含むことができる。
【0084】
いくつかの態様において、単離された核酸分子は、異種ポリペプチドをコードする核酸配列の5'末端に機能的に連結されているOrfCプロモーター、EF1ショートプロモーター、EF1ロングプロモーター、60Sショートプロモーター、60Sロングプロモーター、Sec1プロモーター、PKS OrfCターミネーター領域、Na/Pi-IIb2輸送体タンパク質シグナルペプチドをコードする配列、またはSec1輸送体タンパク質シグナルペプチドをコードする配列を含む。組み換えベクター(発現ベクターを含むがこれに限定されない)、発現カセット、および宿主細胞は同様に、異種ポリペプチドをコードする核酸配列の5'末端に機能的に連結されているOrfCプロモーター、EF1ショートプロモーター、EF1ロングプロモーター、60Sショートプロモーター、60Sロングプロモーター、Sec1プロモーター、PKS OrfCターミネーター領域、Na/Pi-IIb2輸送体タンパク質シグナルペプチドをコードする配列、またはSec1輸送体タンパク質シグナルペプチドをコードする配列を含むことができる。
【0085】
本明細書で用いる場合、別に明記されない限り、同一性の割合(%)(%同一)への言及は、以下のものを用いて行われる相同性の評価を指す。(1)アミノ酸検索についてはblastpおよび核酸検索についてはblastnを標準デフォルトパラメータで用いるBLAST2.0ベーシック(Basic)BLAST相同性検索、ここで問合せ配列はデフォルトにより複雑性の低い領域についてフィルタリングされる(例えば、全体が参照により本明細書に組み入れられる、Altschul, S., et al., Nucleic Acids Res. 25:3389-3402(1997)を参照のこと);(2)下記のパラメータを用いるBLAST2アライメント;および/または(3)標準デフォルトパラメータでのPSI-BLAST(位置特異的反復BLAST)。BLAST2.0ベーシック(Basic)BLASTとBLAST2間の標準パラメータにおけるいくらかの相違のせいで、2つの特定の配列がBLAST2プログラムを用いて有意な相同性をもつとして認識され得たとしても、問合せ配列としてその配列のうちの1つを用いるBLAST2.0ベーシック(Basic)BLASTにおいて行われた検索では二番目の配列を最上位の一致において同定しない場合があることを留意すべきである。さらに、PSI-BLASTは、「プロファイル」検索の自動化した使いやすいバージョンを提供しており、配列相同体を捜すための感度の高い方法である。そのプログラムは、まず、ギャップド(gapped)BLASTデータベース検索を行う。PSI-BLASTプログラムは、位置特異的スコアマトリックスを構成するために戻された任意の有意なアライメントからの情報も使用し、データベース検索の次のラウンドのためにその問合せ配列を取り換える。それゆえ、これらのプログラムのいずれか1つを使用することにより、同一性の割合を決定できることが理解されるはずである。
【0086】
2つの特定の配列は、例えば、全体が参照により本明細書に組み入れられる、Tatusova and Madden, FEMS Microbiol. Lett. 174:247-250(1999)に記載されているように、BLAST2を用いて互いに整列させることができる。BLAST2配列アライメントは、その結果生じるアライメントにギャップの導入(欠失および挿入)を許してその2つの配列間でギャップドBLAST検索(BLAST2.0)を行うBLAST2.0アルゴリズムを用いるblastpまたはblastnにおいて行われる。いくつかの態様において、BLAST2配列アライメントは、以下の標準デフォルトパラメータを用いて行われる。
blastnの場合、以下の0 BLOSUM62マトリックスを用いる。
一致についての報酬 = 1
不一致についてのペナルティ = -2
オープンギャップ(5)および伸長ギャップ(2)ペナルティ
ギャップx_ドロップオフ(50)期待(10)ワードサイズ(11)フィルタ(オン)
blastpの場合、以下の0 BLOSUM62マトリックスを用いる。
オープンギャップ(11)および伸長ギャップ(1)ペナルティ
ギャップx_ドロップオフ(50)期待(10)ワードサイズ(3)フィルタ(オン)
【0087】
本明細書で用いる場合、ハイブリダイゼーション条件とは、類似した核酸分子を同定するために核酸分子が用いられる標準的なハイブリダイゼーション条件のことを指す。例えば、全体が参照により本明細書に組み入れられる、Sambrook J. and Russell D.(2001)Molecular cloning: A laboratory manual, 3rd ed. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New Yorkを参照されたい。さらに、ヌクレオチドのミスマッチの程度を変えることを可能にするハイブリダイゼーションを達成するための適切なハイブリダイゼーションおよび洗浄の条件を計算する式が、例えば、全体が参照により本明細書に組み入れられる、Meinkoth et al., Anal. Biochem. 138:267-284(1984)に開示されている。当業者は、例えば、ヌクレオチドミスマッチの特定のレベルを達成するための適切なハイブリダイゼーションおよび洗浄の条件を計算するために、Meinkothらの式を使用することができる。そのような条件は、DNA:RNAまたはDNA:DNAのハイブリッドのいずれが形成されるかに応じて異なると考えられる。DNA:DNAハイブリッドに関して計算される融解温度は、DNA:RNAハイブリッドに関してよりも10℃低い。特定の態様では、DNA:DNAハイブリッドに関するストリンジェントなハイブリダイゼーション条件は、6X SSC(0.9 M Na+)のイオン強度で、20℃~35℃の間の温度(低度のストリンジェンシー)、28℃~40℃の間の温度(よりストリンジェント)、および35℃~45℃の間の温度(さらによりストリンジェント)でのハイブリダイゼーションを、適切な洗浄条件とともに含む。特定の態様では、DNA:RNAハイブリッドに関するストリンジェントなハイブリダイゼーション条件は、6X SSC(0.9 M Na+)のイオン強度で、30℃~45℃の間の温度、38℃~50℃の間の温度、および45℃~55℃の間の温度でのハイブリダイゼーションを、同様にストリンジェントな洗浄条件とともに含む。これらの値は、約100ヌクレオチドよりも大きい分子、0%ホルムアミドおよび約40%のG+C含有量についての融解温度の計算に基づいている。または、Tmを、Sambrookらに示されているように経験的に計算することもできる。一般に、洗浄条件は、可能な限りストリンジェントであるべきであり、選択されたハイブリダイゼーション条件に対して適切であるべきである。例えば、ハイブリダイゼーション条件は、特定のハイブリッドの算出Tmよりも約20℃~約25℃低い塩および温度条件の組み合わせを含むことができ、洗浄条件は典型的には、その特定のハイブリッドの算出Tmよりも約12℃~約20℃低い塩および温度条件の組み合わせを含む。DNA:DNAハイブリッドでの使用に適するハイブリダイゼーション条件の1つの例は、42℃で6X SSC(50%ホルムアミド)中での2時間~24時間のハイブリダイゼーション、続いて室温で2X SSC中での1回またはそれ以上の洗浄を含む洗浄段階、続いてより高い温度およびより低いイオン強度での追加の洗浄(例えば、37℃で0.1X~0.5X SSC中での少なくとも1回の洗浄、続いて68℃で0.1X~0.5X SSC中での少なくとも1回の洗浄)を含む。
【0088】
異種ポリペプチド
本明細書で用いる「異種」という用語は、微細藻類宿主細胞において天然には見られない配列を指す。いくつかの態様において、本発明の組み換え宿主細胞により産生される異種ポリペプチドは、治療用タンパク質を含むが、これに限定されることはない。本明細書で用いる「治療用タンパク質」は、動物およびヒトにおける疾患、病態または障害の処置または予防に有用なタンパク質を含む。
【0089】
ある種の態様において、治療用タンパク質は、生物学的に活性なタンパク質、例えば、酵素、抗体または抗原タンパク質を含むが、これらに限定されることはない。
【0090】
いくつかの態様において、本発明の組み換え宿主細胞により産生される異種ポリペプチドは、工業用酵素を含むが、これに限定されることはない。工業用酵素は、食品、医薬品、化学品、機械製品、および他の工業製品を含む、製品の製造、調製、保存、栄養動員、または加工処理において用いられる酵素を含むが、これに限定されることはない。
【0091】
いくつかの態様において、本発明の組み換え宿主細胞により産生される異種ポリペプチドは、栄養要求性マーカー、優性選択マーカー(例えば、抗生物質活性を低下させる酵素のような)または形質転換選択に関わる別のタンパク質、レポーターとして機能するタンパク質、タンパク質グリコシル化に関わる酵素、および細胞代謝に関わる酵素を含む。
【0092】
いくつかの態様において、本発明の組み換え宿主細胞により産生される異種ポリペプチドは、HまたはHA(血球凝集素)タンパク質、NまたはNA(ノイラミニダーゼ)タンパク質、F(融合)タンパク質、G(糖タンパク質)タンパク質、Eまたはenv(エンベロープ)タンパク質、gp120(120 kDaの糖タンパク質)、およびgp41(41 kDaの糖タンパク質)からなる群より選択されるウイルスタンパク質を含む。いくつかの態様において、本発明の組み換え宿主細胞により産生される異種ポリペプチドは、ウイルスマトリックスタンパク質である。いくつかの態様において、本発明の組み換え宿主細胞により産生される異種ポリペプチドは、M1、M2(膜チャネルタンパク質)、Gagおよびそれらの組み合わせからなる群より選択されるウイルスマトリックスタンパク質である。いくつかの態様において、HA、NA、F、G、E、gp120、gp41またはマトリックスタンパク質は、ウイルス源、例えばインフルエンザウイルスまたは麻疹ウイルス由来である。
【0093】
インフルエンザは、呼吸器系ウイルスに起因するヒトにおける主な死亡原因である。一般的な症状は熱、咽頭炎、息切れおよび筋肉痛を特に含む。インフルエンザウイルスは、感染した哺乳類および鳥類細胞の原形質膜から出芽するエンベロープウイルスである。それらは、存在する核タンパク質およびマトリックスタンパク質抗原に基づいてA型、B型またはC型へと分類される。インフルエンザA型ウイルスは、表面の糖タンパク質が提示するHAおよびNAの組み合わせにしたがって亜型へとさらに分類することができる。HAは、抗原糖タンパク質であり、感染している細胞にウイルスを結合させるのに関与している。NAは宿主細胞およびウイルス表面タンパク質上のグリカン鎖から末端シアル酸残基を除去し、それによりウイルス凝集を妨害し、ウイルス移動性を促進する。
【0094】
インフルエンザウイルスHAタンパク質は、各単量体の球状頭部に受容体結合ポケットを有するホモ三量体であり、インフルエンザウイルスNAタンパク質は、各単量体の頭部に酵素活性部位を有する四量体である。現在、16種のHA(H1~H16)および9種のNA(N1~N9)亜型が認識されている。各A型インフルエンザウイルスは一種類のHAおよび一種類のNA糖タンパク質を提示する。一般的には、各亜型は種特異性を示し、例えば、すべてのHAおよびNA亜型は鳥類に感染することが公知であるが、亜型H1、H2、H3、H5、H7、H9、H10、N1、N2、N3およびN7のみがヒトに感染することが示されている。インフルエンザウイルスは、保有するHAおよびNAの種類、例えば、H1N1、H5N1、H1N2、H1N3、H2N2、H3N2、H4N6、H5N2、H5N3、H5N8、H6N1、H7N7、H8N4、H9N2、H10N3、H11N2、H11N9、H12N5、H13N8、H15N8、H16N3などによって特徴付けられる。亜型は株へとさらに分類され; 各遺伝的に異なるウイルス分離株は別個の株、例えば、A型インフルエンザ/プエルトリコ/8/34/マウントサイナイ(H1N1)およびA型インフルエンザ/ベトナム/1203/2004(H5N1)であるものと通常考えられる。本発明のある種の態様において、HAはインフルエンザウイルス由来であり、例えば、HAはA型インフルエンザ、B型インフルエンザ由来であり、またはH1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15、およびH16からなる群より選択される、A型インフルエンザの亜型である。別の態様において、HAは、H1、H2、H3、H5、H6、H7およびH9からなる群より選択される、A型インフルエンザ由来である。1つの態様において、HAはインフルエンザ亜型H1N1由来である。
【0095】
インフルエンザウイルスHAタンパク質は単一のタンパク質として細胞内で翻訳され、これはシグナルペプチドの切断後、HA0(すなわち、血球凝集素前駆体タンパク質)といわれるおよそ62 kDaのタンパク質(概念的翻訳により)となる。ウイルス活性化のためには、血球凝集素前駆体タンパク質(HA0)は、タンパク質のHA1ポリペプチドとHA2ポリペプチドとの間の単一の塩基性アミノ酸(通常はアルギニン)により通常コードされる特定の部位で、トリプシン様セリンエンドプロテアーゼにより切断されなければならない。A/プエルトリコ/8/34株の具体例では、この切断はアミノ酸番号343のアルギニンとアミノ酸番号344のグリシンとの間で起こる。切断後、この二つのジスルフィド結合タンパク質ポリペプチドは、融合およびしたがってウイルス感染性に必要な立体構造変化の前提条件としてタンパク質サブユニットの成熟型を産生する。
【0096】
いくつかの態様において、本発明のHAタンパク質は切断され、例えば、本発明のHA0タンパク質はHA1およびHA2へ切断される。いくつかの態様において、シゾキトリウム属のような微細藻類宿主細胞におけるHAタンパク質の発現は、外因性プロテアーゼの添加なしに、機能的なHA1ポリペプチドおよびHA2ポリペプチドへのHA0タンパク質の適切な切断を引き起こす。外因性プロテアーゼの添加なしでの無脊椎動物発現系における血球凝集素のそのような切断は、これまでに実証されていない。
【0097】
ウイルスFタンパク質は、C末端の近くに1回膜貫通ドメインを含み得る。Fタンパク質はフリン切断部位(アミノ酸番号109)で二つのペプチドに分けることができる。F2と名付けられたタンパク質の最初の部分は、完全なFタンパク質のN末端部分を含む。Fタンパク質のC末端部分を含むウイルスFタンパク質の残部は、F1と名付けられている。F1および/またはF2領域が、例えば、異種シグナルペプチドをコードする配列のような異種配列に、個別に融合されてもよい。ウイルスFタンパク質のF1およびF2部分を含むベクターが、個別にまたは組み合わせで発現されてもよい。完全なFタンパク質を発現するベクターが、フリン切断部位でタンパク質を切断するフリン酵素と同時発現されてもよい。あるいは、Fタンパク質のフリン切断部位をコードする配列が、異なるプロテアーゼにより認識かつ切断される別のプロテアーゼ切断部位をコードする配列と置き換えられてもよい。別のプロテアーゼ切断部位を含むFタンパク質が、この別のプロテアーゼ切断部位を認識かつ切断する対応のプロテアーゼと同時発現されてもよい。
【0098】
いくつかの態様において、HA、NA、F、G、E、gp120、gp41またはマトリックスタンパク質は、全長タンパク質、その断片、変種、誘導体、または類似体である。いくつかの態様において、HA、NA、F、G、E、gp120、gp41またはマトリックスタンパク質は、各ウイルスタンパク質に対する公知の配列と少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、もしくは100%同一のアミノ酸配列を含んだポリペプチドまたはそのアミノ酸配列を含んだポリペプチドをコードするポリヌクレオチドであり、ここでポリペプチドは、該公知の配列に特異的に結合する抗体によって認識できる。HA配列は、例えば、細胞外(ECD)ドメイン、膜貫通(TM)ドメイン、および細胞質(CYT)ドメインから本質的になる全長HAタンパク質; または、例えば、全HAの切断によって産生される、HA1ポリペプチドおよびHA2ポリペプチドから本質的になる全HAタンパク質の断片; またはHA1ポリペプチド、HA2ポリペプチド、およびTMドメインから本質的になる全HAタンパク質の断片; またはCYTドメインから本質的になる全HAタンパク質の断片; またはTMドメインから本質的になる全HAタンパク質の断片; またはHA1ポリペプチドから本質的になる全HAタンパク質の断片; またはHA2ポリペプチドから本質的になる全HAタンパク質の断片でありうる。HA配列はHA1/HA2切断部位を含むこともできる。HA1/HA2切断部位はHA1ポリペプチドとHA2ポリペプチドとの間にあってもよいが、ポリヌクレオチドまたはポリペプチド構築体の他の配列に対して任意の順序で並べられてもよい。ウイルスタンパク質は病原性ウイルス株由来であってもよい。
【0099】
いくつかの態様において、本発明の異種ポリペプチドは、全長HA、NA、F、G、E、gp120、gp41もしくはマトリックスタンパク質、またはその断片、変種、誘導体もしくは類似体を含む融合ポリペプチドである。
【0100】
いくつかの態様において、異種ポリペプチドは、HA0ポリペプチド、HA1ポリペプチド、HA2ポリペプチド、TMドメイン、それらの断片、およびそれらの組み合わせを含む融合ポリペプチドである。いくつかの態様において、異種ポリペプチドは、インフルエンザウイルスの異なる亜型または株由来など、ウイルスの異なる亜型または異なる株由来のHA1ポリペプチド、HA2ポリペプチド、TMドメイン、またはそれらの断片の2つまたはそれ以上の組み合わせを含む。いくつかの態様において、異種ポリペプチドは、インフルエンザウイルスおよび麻疹ウイルス由来など、異なるウイルス由来のHA1ポリペプチド、HA2ポリペプチド、TMドメイン、またはそれらの断片の2つまたはそれ以上の組み合わせを含む。
【0101】
血球凝集活性は赤血球の凝集を測定することによって判定することができる。赤血球の凝集およびその後の沈殿は、赤血球の表面上に吸着されている血球凝集素から生じる。血球凝集の間に積み重なり(heaps)、塊(lumps)、および/または凝集塊(clumps)として肉眼で識別可能な赤血球の塊が形成される。血球凝集は、赤血球に存在する凝集原と、凝集素を含有する血漿との相互作用によって引き起こされる。各凝集原は対応する凝集素を有する。血球凝集反応は、例えば、ウイルスの抗血清活性または種類を判定するために、用いられる。赤血球に及ぼす作用物質の直接作用によって引き起こされる能動血球凝集と、赤血球によってあらかじめ吸着された抗原に対する特異的な抗血清によって引き起こされる受動血球凝集とは区別される。サンプルにおける血球凝集活性の量は、例えば、血球凝集活性単位(HAU)で測定することができる。血球凝集は、例えば、結核、ペストおよび野兎病の病原細菌の多糖により、大腸菌(colon bacillus)の多糖により、ならびに白マウスのインフルエンザ、流行性耳下腺炎、肺炎、ブタおよびウマインフルエンザ、天然痘ワクチン、黄熱病および他の血球凝集誘導性の疾患のウイルスにより引き起こされうる。
【0102】
微細藻類細胞外体
本発明は同様に、原形質膜と不連続な微細藻類細胞外体を対象とする。「原形質膜と不連続な」とは、微細藻類細胞外体が宿主細胞の原形質膜とつながっていないことを意味する。いくつかの態様において、細胞外体は膜である。いくつかの態様において、細胞外体は小胞、ミセル、膜断片、膜凝集体、またはそれらの混合物である。本明細書で用いる「小胞」という用語は、脂質二重層(単位膜)を含む閉構造、例えば、細胞膜によって形成された泡様構造を指す。本明細書で用いる「膜凝集体」という用語は、単一の塊として結び付くようになる膜構造の任意の集まりを指す。膜凝集体は、限定されるものではないが、膜小胞の集まりのような単一種の膜構造の集まりであり得、または限定されるものではないが、小胞、ミセル、もしくは膜断片の少なくとも2つの集まりのような、単一種を超える膜構造の集まりであり得る。本明細書で用いる「膜断片」という用語は、本明細書に記載する異種ポリペプチドを含みうる膜の任意の部分を指す。いくつかの態様において、膜断片は膜シートである。いくつかの態様において、細胞外体は小胞および膜断片の混合物である。いくつかの態様において、細胞外体は小胞である。いくつかの態様において、小胞は崩壊した小胞である。いくつかの態様において、小胞はウイルス様粒子である。いくつかの態様において、細胞外体は、宿主細胞により産生される天然ポリペプチドおよび異種ポリペプチドを含む生物材料の凝集体である。いくつかの態様において、細胞外体は天然ポリペプチドおよび異種ポリペプチドの凝集体である。いくつかの態様において、細胞外体は異種ポリペプチドの凝集体である。
【0103】
いくつかの態様において、微細藻類宿主細胞の外質ネットは微細藻類宿主細胞の培養中に断片になり、微細藻類細胞外体の形成を引き起こす。いくつかの態様において、微細藻類細胞外体は、外質ネット膜突起を物理的に剪断する撹拌培地における流体力の結果として微細藻類宿主細胞の外質ネットの断片化により形成される。
【0104】
いくつかの態様において、微細藻類細胞外体は、限定されるものではないが、微細藻類膜の押し出し、例えば原形質膜、外質ネット、偽仮根、またはそれらの組み合わせの押し出しよって形成され、ここで押出膜は原形質膜から分離されるようになる。
【0105】
いくつかの態様において、微細藻類細胞外体は、異なる直径を有する小胞もしくはミセル、異なる長さを有する膜断片、またはそれらの組み合わせである。
【0106】
いくつかの態様において、細胞外体は、10 nm~2500 nm、10 nm~2000 nm、10 nm~1500 nm、10 nm~1000 nm、10 nm~500 nm、10 nm~300 nm、10 nm~200 nm、10 nm~100 nm、10 nm~50 nm、20 nm~2500 nm、20 nm~2000 nm、20 nm~1500 nm、20 nm~1000 nm、20 nm~500 nm、20 nm~300 nm、20 nm~200 nm、20 nm~100 nm、50 nm~2500 nm、50 nm~2000 nm、50 nm~1500 nm、50 nm~1000 nm、50 nm~500 nm、50 nm~300 nm、50 nm~200 nm、50 nm~100 nm、100 nm~2500 nm、100 nm~2000 nm、100 nm~1500 nm、100 nm~1000 nm、100 nm~500 nm、100 nm~300 nm、100 nm~200 nm、500 nm~2500 nm、500 nm~2000 nm、500 nm~1500 nm、500 nm~1000 nm、2000 nmもしくはそれ以下、1500 nmもしくはそれ以下、1000 nmもしくはそれ以下、500 nmもしくはそれ以下、400 nmもしくはそれ以下、300 nmもしくはそれ以下、200 nmもしくはそれ以下、100 nmもしくはそれ以下、または50 nmもしくはそれ以下の直径を有する小胞である。
【0107】
ヤブレツボカビ科生物の宿主細胞から微細藻類細胞外体を産生するための非限定的な発酵条件を以下、表1に示す。
【0108】
【0109】
微細藻類細胞外体を産生するための一般的な培養条件は、以下を含む。
pH: 5.5~9.5、6.5~8.0、または6.3~7.3
温度: 15℃~45℃、18℃~35℃、または20℃~30℃
溶存酸素: 0.1%~100%飽和、5%~50%飽和、または10%~30%飽和
グルコース制御: 5 g/L~100 g/L、10 g/L~40 g/L、または15 g/L~35 g/L
【0110】
いくつかの態様において、微細藻類細胞外体はラビリンチュラ菌門の宿主細胞から産生される。いくつかの態様において、微細藻類細胞外体はラビリンチュラ網の宿主細胞から産生される。いくつかの態様において、微細藻類細胞外体はヤブレツボカビ科生物の宿主細胞から産生される。いくつかの態様において、微細藻類細胞外体はシゾキトリウム属またはヤブレツボカビ属から産生される。
【0111】
本発明は同様に、微細藻類宿主細胞の原形質膜と不連続な異種ポリペプチドを含む微細藻類細胞外体を対象とする。
【0112】
いくつかの態様において、本発明の微細藻類細胞外体は、また、微細藻類宿主細胞の原形質膜と結び付いているポリペプチドを含む。いくつかの態様において、微細藻類宿主細胞の原形質膜と結び付いているポリペプチドは、天然の膜ポリペプチド、異種ポリペプチド、およびその組み合わせを含む。
【0113】
いくつかの態様において、異種ポリペプチドは微細藻類細胞外体のなかに含まれる。
【0114】
いくつかの態様において、異種ポリペプチドは膜ドメインを含む。本明細書で用いる「膜ドメイン」という用語は、ポリペプチドを膜に標的化するおよび/またはポリペプチドに膜との結合を維持させるポリペプチド内の任意のドメインを指し、膜貫通ドメイン(例えば、単一のもしくは複数の膜貫通領域)、一回膜貫通型(integral monotopic)ドメイン、シグナルアンカー配列、ERシグナル配列、N末端または内部またはC末端輸送停止シグナル、グリコシルホスファチジルイノシトールアンカー、およびそれらの組み合わせを含むが、これらに限定されることはない。膜ドメインは、ポリペプチドのN末端、C末端または中央を含めて、ポリペプチドにおける任意の位置にあることができる。膜ドメインは、膜とポリペプチドとの永続的または一時的付着で結び付くことができる。いくつかの態様において、膜ドメインは、膜タンパク質から切断されうる。いくつかの態様において、膜ドメインはシグナルアンカー配列である。いくつかの態様において、膜ドメインは、
図13に示されるシグナルアンカー配列のいずれか、またはそれに由来するアンカー配列である。いくつかの態様において、膜ドメインはウイルスシグナルアンカー配列である。
【0115】
いくつかの態様において、異種ポリペプチドは、膜ドメインを天然に含むポリペプチドである。いくつかの態様において、異種ポリペプチドは、膜ドメインを天然に含むのではなく、組み換えにより膜ドメインに融合されている。いくつかの態様において、異種ポリペプチドは、膜ドメインに融合されている普通なら可溶性のタンパク質である。
【0116】
いくつかの態様において、膜ドメインは微細藻類の膜ドメインである。いくつかの態様において、膜ドメインはラビリンチュラ菌門の膜ドメインである。いくつかの態様において、膜ドメインはヤブレツボカビ科生物の膜ドメインである。いくつかの態様において、膜ドメインはシゾキトリウム属またはヤブレツボカビ属の膜ドメインである。いくつかの態様において、膜ドメインは、シゾキトリウム属α-1,3-マンノシル-β-1,2-GlcNac-トランスフェラーゼ-I-様タンパク質#1(SEQ ID NO: 78)、シゾキトリウム属β-1,2-キシロシルトランスフェラーゼ-様タンパク質#1(SEQ ID NO: 80)、シゾキトリウム属β-1,4-キシロシダーゼ-様タンパク質(SEQ ID NO: 82)、またはシゾキトリウム属ガラクトシルトランスフェラーゼ-様タンパク質#5(SEQ ID NO: 84)由来のシグナルアンカー配列を含む。
【0117】
いくつかの態様において、異種ポリペプチドは膜タンパク質である。本明細書で用いる「膜タンパク質」という用語は、細胞膜と結び付いたまたは細胞膜に結合した任意のタンパク質を指す。例えば、Chou and Elrod, Proteins: Structure, Function and Genetics 34:137-153(1999)によって記載されているように、膜タンパク質はさまざまな一般型に分類することができる。
1)1型膜タンパク質: これらのタンパク質は成熟タンパク質において単一膜貫通ドメインを有する。N末端は細胞外にあり、C末端は細胞質にある。タンパク質のN末端は、ERへの移入に向けてタンパク質を指令する古典的なシグナルペプチド配列を特徴的に有する。このタンパク質はIa型(切断可能なシグナル配列を含む)およびIb型(切断可能なシグナル配列がない)に細分される。I型膜タンパク質の例としては、インフルエンザHA、インスリン受容体、グリコホリン、LDL受容体、およびウイルスGタンパク質が挙げられるが、これらに限定されることはない。
2)II型膜タンパク質: これらの単一膜ドメインタンパク質の場合、C末端は細胞外にあり、N末端は細胞質にある。N末端はシグナルアンカー配列を持ちうる。このタンパク質種の例としては、インフルエンザノイラミニダーゼ、ゴルジガラクトシルトランスフェラーゼ、ゴルジシアリルトランスフェラーゼ、スクラーゼ・イソマルターゼ前駆体、アシアロ糖タンパク質受容体、およびトランスフェリン受容体が挙げられるが、これらに限定されることはない。
3)複数回膜貫通タンパク質: I型およびII型膜タンパク質では、ポリペプチドは脂質二重層を一回横断するが、複数回貫通膜タンパク質では、ポリペプチドは膜を複数回横断する。複数回膜貫通タンパク質はまた、IIIa型およびIIIb型に細分される。IIIa型タンパク質は切断可能なシグナル配列を有する。IIIb型タンパク質は、そのアミノ末端が膜の外面に曝露されているが、切断可能なシグナル配列を持たない。IIIa型タンパク質は、光反応中心のMおよびLペプチドを含むが、これらに限定されることはない。IIIb型タンパク質は、チトクロムP450および大腸菌のリーダーペプチダーゼを含むが、これらに限定されることはない。複数回膜貫通タンパク質のさらなる例は、膜輸送体、例えば糖輸送体(グルコース、キシロース)およびイオン輸送体である。
4)脂質鎖アンカー膜タンパク質: これらのタンパク質は、1つもしくは複数の共有結合している脂肪酸鎖またはプレニル基と呼ばれる他の種類の脂肪鎖によって、膜二重層と結び付いている。
5)GPIアンカー膜タンパク質: これらのタンパク質は、グリコシルホスファチジルイノシトール(GPI)アンカーによって膜に結合される。
6)表在性膜タンパク質: これらのタンパク質は、他の膜タンパク質との非共有相互作用によって間接的に膜に結合される。
【0118】
いくつかの態様において、膜ドメインはHAタンパク質の膜ドメインである。
【0119】
いくつかの態様において、異種ポリペプチドは、異種ポリペプチドに対応する野生型ポリペプチド由来の天然シグナルアンカー配列または天然膜ドメインを含む。いくつかの態様において、異種ポリペプチドは、天然シグナルアンカー配列または天然膜ドメインとは異なる異種シグナルアンカー配列または異種膜ドメインに融合される。いくつかの態様において、異種ポリペプチドは、異種シグナルアンカー配列または異種膜ドメインを含み、一方で異種ポリペプチドに対応する野生型ポリペプチドはいずれのシグナルアンカー配列または膜ドメインも含まない。いくつかの態様において、異種ポリペプチドは、シゾキトリウム属のシグナルアンカー配列を含む。いくつかの態様において、異種ポリペプチドは、HA膜ドメインを含む。いくつかの態様において、異種ポリペプチドは、治療用ポリペプチドである。
【0120】
いくつかの態様において、膜ドメインは、
図14に示されるI型膜タンパク質のいずれか由来の膜ドメイン、またはそれに由来する膜ドメインである。いくつかの態様において、本発明の異種ポリペプチドは、
図14に示される膜タンパク質のいずれかのC末端における膜貫通領域を含んだ融合ポリペプチドである。いくつかの態様において、膜貫通領域のC末端側は、ウイルスタンパク質由来の類似の領域との置換によってさらに改変される。
【0121】
いくつかの態様において、異種ポリペプチドは糖タンパク質である。いくつかの態様において、異種ポリペプチドは、ラビリンチュラ菌門の細胞における発現に特徴的なグリコシル化パターンを有する。いくつかの態様において、異種ポリペプチドは、ヤブレツボカビ科生物の細胞における発現に特徴的なグリコシル化パターンを有する。いくつかの態様において、微細藻類宿主細胞において発現される異種ポリペプチドは、酵母または大腸菌において産生されるタンパク質よりも哺乳類のグリコシル化パターンによく似ているグリコシル化パターンを持つ糖タンパク質である。いくつかの態様において、グリコシル化パターンはN-結合型グリコシル化パターンを含む。いくつかの態様において、糖タンパク質は高マンノースオリゴ糖を含む。いくつかの態様において、糖タンパク質はシアル酸を実質的に含まない。本明細書で用いる「シアル酸を実質的に含まない」という用語は、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、または1%未満のシアル酸を意味する。いくつかの態様において、シアル酸は糖タンパク質が欠けている。
【0122】
いくつかの態様において、異種ポリペプチドを含む本発明の微細藻類細胞外体は、商業規模または工業規模で産生される。
【0123】
本発明は同様に、本明細書に記載する本発明の微細藻類細胞外体のいずれかおよび水性液体担体を含む組成物を対象とする。
【0124】
いくつかの態様において、異種ポリペプチドを含む本発明の微細藻類細胞外体は、微細藻類宿主細胞が増殖される培養培地または発酵培地から回収される。いくつかの態様において、本発明の微細藻類細胞外体は「実質的に純粋な」形態で単離されうる。本明細書で用いる場合、「実質的に純粋な」とは、市販製品または工業製品としての微細藻類細胞外体の効果的な使用を可能にする純度を指す。
【0125】
本発明は同様に、異種ポリペプチドを含む微細藻類細胞外体を産生する方法を対象とし、本方法は、(a)膜ドメインを含む異種ポリペプチドを、微細藻類宿主細胞において発現させる段階、および(b)宿主細胞の原形質膜と不連続な異種ポリペプチドを含む微細藻類細胞外体を産生するのに十分な培養条件の下で、宿主細胞を培養する段階を含む。
【0126】
本発明は同様に、微細藻類細胞外体および異種ポリペプチドを含む組成物を産生する方法を対象とし、本方法は、(a)膜ドメインを含む異種ポリペプチドを、微細藻類宿主細胞において発現させる段階、および(b)宿主細胞の原形質膜と不連続な異種ポリペプチドを含む微細藻類細胞外体を産生するのに十分な培養条件の下で、宿主細胞を培養する段階を含み、該組成物は、細胞外体を含む培養上清として産生される。いくつかの態様において、本方法は、培養上清を取り出す段階および細胞外体を水性液体担体に再懸濁する段階をさらに含む。いくつかの態様において、組成物はワクチンとして用いられる。
【0127】
ウイルスポリペプチドを含む微細藻類細胞外体
ウイルスエンベロープタンパク質は、ウイルス粒子の外層を形成する膜タンパク質である。これらのタンパク質の合成では、タンパク質を原形質膜に向けるために、細胞標的化シグナルのような膜ドメインを利用する。エンベロープコートタンパク質は、いくつかの主要な群に分類され、これにはHまたはHA(血球凝集素)タンパク質、NまたはNA(ノイラミニダーゼ)タンパク質、F(融合)タンパク質、G(糖タンパク質)タンパク質、Eまたはenv(エンベロープ)タンパク質、gp120(120 kDaの糖タンパク質)、およびgp41(41 kDaの糖タンパク質)が含まれるが、これらに限定されることはない。「マトリックス」タンパク質とよくいわれる構造タンパク質は、ウイルスの安定化を補助する働きをする。マトリックスタンパク質はM1、M2(膜チャネルタンパク質)、およびGagを含むが、これらに限定されることはない。エンベロープもマトリックスタンパク質もウイルスの組織化および機能に関与しうる。例えば、単独でのまたはウイルスマトリックスタンパク質との関連でのウイルスエンベロープコートタンパク質の発現は、ウイルス様粒子(VLP)の形成をもたらしうる。
【0128】
ウイルスワクチンは、予防を目的とする疾患に対応するウイルス培養物の不活化されまたは弱毒化された調製物から作出されることが多く、ウイルス遺伝物質のような遺伝物質を通常保持している。一般的に、ウイルスは、野生で感染しうるのと同じまたは似た細胞種から培養される。そのような細胞培養は費用がかかり、規模の調整が困難であることが多い。この問題に取り組むため、その代わりに、遺伝子導入宿主によってある種の特異的なウイルスタンパク質抗原が発現されており、この遺伝子導入宿主は培養するのにあまり費用がかからず、規模の調整にいっそう適しうる。しかしながら、ウイルスタンパク質は、通常、ウイルスエンベロープに存在する内在性膜タンパク質である。膜タンパク質は大量に産生することが非常に困難であるため、これらのウイルスタンパク質は、通常、タンパク質の可溶型を作出するように改変される。これらのウイルスエンベロープタンパク質は宿主免疫の樹立に重要であるが、それらの全部または一部を異種系で発現させる多くの試みは、おそらく、タンパク質が十分に免疫原性であるためにはウイルスエンベロープ膜との関連で免疫系に提示されなければならないために、大した成果を得ていない。したがって、拡大縮小でき、所望のウイルス抗原以外のウイルス遺伝物質のような、関連するウイルス物質を含まないまたは実質的に含まないウイルス抗原を提示できる、本発明のもののような新たな異種発現系が必要である。本明細書で用いる「関連するウイルス物質を実質的に含まない」という用語は、10%未満、9%未満、8%未満、7%未満、5%未満、4%未満、3%未満、2%未満、または1%未満の関連するウイルス物質を意味する。
【0129】
いくつかの態様において、微細藻類細胞外体は、HまたはHA(血球凝集素)タンパク質、NまたはNA(ノイラミニダーゼ)タンパク質、F(融合)タンパク質、G(糖タンパク質)タンパク質、Eまたはenv(エンベロープ)タンパク質、gp120(120 kDaの糖タンパク質)、gp41(41 kDaの糖タンパク質)、およびそれらの組み合わせからなる群より選択されるウイルス糖タンパク質である異種ポリペプチドを含む。いくつかの態様において、微細藻類細胞外体は、ウイルスマトリックスタンパク質である異種ポリペプチドを含む。いくつかの態様において、微細藻類細胞外体は、M1、M2(膜チャネルタンパク質)、Gag、およびそれらの組み合わせからなる群より選択されるウイルスマトリックスタンパク質を含む。いくつかの態様において、微細藻類細胞外体は、HまたはHA(血球凝集素)タンパク質、NまたはNA(ノイラミニダーゼ)タンパク質、F(融合)タンパク質、G(糖タンパク質)タンパク質、Eまたはenv(エンベロープ)タンパク質、gp120(120 kDaの糖タンパク質)、gp41(41 kDaの糖タンパク質)、およびウイルスマトリックスタンパク質からなる群より選択される2種またはそれ以上のウイルスタンパク質の組み合わせを含む。
【0130】
いくつかの態様において、本発明の微細藻類細胞外体は、タンパク質の蓄積または機能を普通なら妨害しうるシアル酸を欠いたウイルス糖タンパク質を含む。
【0131】
いくつかの態様において、微細藻類細胞外体はVLPである。
【0132】
本明細書で用いる「VLP」という用語は、ウイルスタンパク質が過剰発現される場合にウイルスタンパク質の自発的な自己組織化によって形成されうる感染性ウイルスに形態学的に類似した粒子を指す。VLPは酵母、昆虫、および哺乳類細胞において産生されており、それらは感染性遺伝物質を含むことなしにウイルス粒子の全体構造を模倣しているので、効果的かつさらに安全な種のサブユニットワクチンであるものと思われる。この種のワクチン送達系は、細胞性および体液性応答の刺激において成功を収めている。
【0133】
パラミクソウイルスに関する研究は、複数のウイルスタンパク質が同時に発現された場合に、産生されたVLPはサイズおよび密度が本物のウイルス粒子と非常に似通っていたことを明らかにした。マトリックスタンパク質(M)だけの発現でVLPの形成には必要かつ十分であった。パラミクソウイルスにおいて、HNだけの発現は非常に低効率のVLP形成をもたらした。他のタンパク質だけではNDV出芽に十分ではなかった。HNは、四量体のスパイクとしてウイルス粒子および感染細胞表面に存在するII型膜糖タンパク質である。例えば、Collins PL and Mottet G, J. Virol.(65:2362-2371(1991); Mirza AM et al., J. Biol. Chem. 268:21425-21431(1993); およびNg D et al., J. Cell. Biol. 109:3273-3289(1989)を参照されたい。Mタンパク質との相互作用はVLPへのタンパク質HNおよびNPの取り込みに関与していた。例えば、Pantua et. al., J. Virology 80:11062-11073(2006)を参照されたい。
【0134】
B型肝炎ウイルス(HBV)またはヒトパピローマウイルス(HPV)VLPは、無エンベロープでありかつ1つまたは2つのキャプシドタンパク質を発現させることにより産生される単純なVLPである。より複雑な無エンベロープVLPは、ブルータング病のために開発されたVLPのような粒子を含む。その場合には、ブルータングウイルス(BTV、レオウイルス科)由来の主要な構造タンパク質のうちの4つが昆虫細胞において同時に発現された。脂質エンベロープを有するウイルス由来のVLPも産生されている(例えば、C型肝炎およびA型インフルエンザ)。抗原エピトープを繰り返し呈しうる自己組織化ポリペプチドナノ粒子(SAPN)のようなVLP様構造も存在している。これらは潜在的なマラリアワクチンをデザインするために使われている。例えばKaba SA et al., J. Immunol. 183(11):7268-7277(2009)を参照されたい。
【0135】
VLPは、生菌弱毒化または不活化ウイルスに匹敵する免疫を生み出す可能性を有するという点で重要な利点を有し、その粒子特性のため、およびそれらが表面エピトープを高密度に繰り返し並べて呈するため、免疫原性が極めて高いものと考えられる。例えば、B細胞は外来として50オングストローム~100オングストロームのエピトープ間隔で粒子状抗原を特異的に認識すると仮定されている。Bachman et al., Science 262:1448(1993)を参照されたい。VLPはまた、樹状細胞およびマクロファージによる取り込みを大いに促進するものと考えられる粒子サイズを有する。さらに、20 nm~200 nmの粒子はリンパ節へ自由に拡散するが、500~2000 nmの粒子はそうではない。ヒトでは少なくとも2つの承認済みVLPワクチン、つまりB型肝炎ワクチン(HBV)およびヒトパピローマウイルス(HPV)が存在している。しかしながら、バキュロウイルスに基づくVLPのようなウイルスに基づくVLPは、VLPからのさらなる精製を要する大量のウイルス物質を含むことが多い。
【0136】
いくつかの態様において、微細藻類細胞外体は、HまたはHA(血球凝集素)タンパク質、NまたはNA(ノイラミニダーゼ)タンパク質、F(融合)タンパク質、G(糖タンパク質)タンパク質、Eまたはenv(エンベロープ)タンパク質、gp120(120 kDaの糖タンパク質)、gp41(41 kDaの糖タンパク質)、およびそれらの組み合わせからなる群より選択されるウイルス糖タンパク質を含むVLPである。いくつかの態様において、微細藻類細胞外体は、ウイルスマトリックスタンパク質を含むVLPである。いくつかの態様において、微細藻類細胞外体は、M1、M2(膜チャネルタンパク質)、Gagおよびそれらの組み合わせからなる群より選択されるウイルスマトリックスタンパク質を含むVLPである。いくつかの態様において、微細藻類細胞外体は、HまたはHA(血球凝集素)タンパク質、NまたはNA(ノイラミニダーゼ)タンパク質、F(融合)タンパク質、G(糖タンパク質)タンパク質、Eまたはenv(エンベロープ)タンパク質、gp120(120 kDaの糖タンパク質)、gp41(41 kDaの糖タンパク質)、およびウイルスマトリックスタンパク質からなる群より選択される2種またはそれ以上のウイルスタンパク質の組み合わせを含むVLPである。
【0137】
微細藻類細胞外体を使用する方法
いくつかの態様において、本発明の微細藻類細胞外体は、タンパク質活性または機能のための媒体として有用である。いくつかの態様において、タンパク質活性または機能は細胞外体中にまたは細胞外体上に存在する異種ポリペプチドと関連している。いくつかの態様において、異種ポリペプチドは膜タンパク質である。いくつかの態様において、タンパク質活性または機能は、細胞外体中に存在する膜タンパク質に結合するポリペプチドと関連している。いくつかの態様において、タンパク質は、可溶性の場合に機能的ではないが、本発明の細胞外体の一部の場合に機能的である。いくつかの態様において、糖輸送体(例えば、キシロース、スクロース、またはグルコース輸送体のような)を含んだ微細藻類細胞外体を用いて、ろ過または遠心分離を含むさまざまな方法によって分離できる小胞内に糖を捕捉することにより、糖または他の低分子量溶質の混合物を含有する培地から微量の糖を枯渇させることができる。
【0138】
本発明は同様に、疾患に対する予防的処置に及ぶ動物またはヒトでの治療的用途のための、異種ポリペプチドを含む本発明の微細藻類細胞外体およびその組成物のいずれかの使用を含む。
【0139】
「処置する」および「処置」という用語は、治療的処置と予防的(prophylactic)または予防的(preventative)措置の両方を指し、ここでこの目的は望ましくない生理学的状態、疾患もしくは障害を予防することもしくは減速させる(減少させる)こと、または有益なもしくは望ましい臨床結果を得ることである。本発明の目的のために、有益なまたは望ましい臨床結果は、病態、疾患もしくは障害と関連する症状もしくは症候の緩和もしくは除去; 病態、疾患もしくは障害の程度の縮小; 病態、疾患もしくは障害の安定化(すなわち、この場合に病態、疾患もしくは障害は悪化していない); 病態、疾患もしくは障害の発症もしくは進行の遅延; 病態、疾患もしくは障害の改善; 病態、疾患もしくは障害の(部分的か全体的かに関わらず、および検出可能か検出不能かに関わらず)寛解; または病態、疾患もしくは障害の向上または改善を含むが、これらに限定されることはない。処置は過度の副作用なしに臨床的に有意な応答を誘発することを含む。処置はまた、処置を受けていない場合に予想される生存期間と比べて生存期間を延長させることを含む。
【0140】
いくつかの態様において、異種ポリペプチドを含む本発明の微細藻類細胞外体のいずれも、動物またはヒト用ワクチンとしての直接的な使用のために培養上清中で回収される。
【0141】
いくつかの態様において、異種ポリペプチドを含む微細藻類細胞外体は、関心対象の使用の要件、例えばワクチンとしての投与にしたがって精製される。典型的なヒト用ワクチン適用の場合、低速上清には濃縮(例えば、接線流ろ過に引き続いて限外ろ過)、クロマトグラフィー分離(例えば、陰イオン交換クロマトグラフィー)、サイズ排除クロマトグラフィー、および滅菌(例えば、0.2 μmろ過)による初期精製が行われるであろう。いくつかの態様において、本発明のワクチンには、例えば、卵タンパク質のような潜在的にアレルギー誘発性の持込みタンパク質がない。いくつかの態様において、本発明の細胞外体を含むワクチンには、細胞外体と結び付いているウイルスポリペプチド以外のいずれのウイルス物質も含まれない。
【0142】
開示した方法にしたがって、異種ポリペプチドを含む微細藻類細胞外体またはその組成物は、例えば、筋肉内(i.m.)、静脈内(i.v.)、皮下(s.c.)、または肺内経路により投与することができる。他の適当な投与経路には、気管内、経皮、眼内、鼻内、吸入、腔内、管内(例えば、膵臓への)、および実質内(例えば、任意の組織への)投与が含まれるが、これらに限定されることはない。経皮送達には、皮内(例えば、真皮または表皮への)、経皮(例えば、経皮的)および経粘膜(例えば、皮膚または粘膜組織への、またはそれを経由した)投与が含まれるが、これらに限定されることはない。腔内投与には、口、膣、直腸、鼻、腹膜および腸腔への投与、ならびにくも膜下腔内(例えば、脊柱管への)、室内(例えば、脳室または心室への)、心房内(例えば、心房への)、およびくも膜下(例えば、脳のくも膜下腔への)投与が含まれるが、これらに限定されることはない。
【0143】
いくつかの態様において、本発明は、異種ポリペプチドを含む微細藻類細胞外体を含んだ組成物を含む。いくつかの態様において、組成物は水性液体担体を含む。さらなる態様において、水性液体担体は培養上清である。いくつかの態様において、本発明の組成物は、当技術分野において公知の従来の薬学的に許容される賦形剤、例えば、限定されるものではないが、ヒト血清アルブミン、イオン交換体、アルミナ、レシチン、緩衝物質、例えばリン酸塩、グリシン、ソルビン酸、ソルビン酸カリウム、および塩または電解質、例えば硫酸プロタミン、ならびに、例えば、Remington: The Science and Practice of Pharmacy, 21st ed.(2005)に記載されている賦形剤を含む。
【0144】
あるいは、微細藻類細胞外体を対象とする本明細書において記載の態様のいずれも、ツボカビ細胞外体を対象とすることができる。
【0145】
本発明の組成物のために最も効果的な投与方法および投与量計画は、疾患の重症度および経過、対象の健康状態および処置に対する応答ならびに処置に当たる医師の判断に依る。したがって、組成物の投与量は個々の対象に対して滴定されるべきである。そうではあるが、本発明の組成物の有効用量は1 mg/kg~2000 mg/kg、1 mg/kg~1500 mg/kg、1 mg/kg~1000 mg/kg、1 mg/kg~500 mg/kg、1 mg/kg~250 mg/kg、1 mg/kg~100 mg/kg、1 mg/kg~50 mg/kg、1 mg/kg~25 mg/kg、1 mg/kg~10 mg/kg、500 mg/kg~2000 mg/kg、500 mg/kg~1500 mg/kg、500 mg/kg~1000 mg/kg、100 mg/kg~2000 mg/kg、100 mg/kg~1500 mg/kg、100 mg/kg~1000 mg/kg、または100 mg/kg~500 mg/kgの範囲内でありうる。
【0146】
本発明について一般的に記載してきたが、本明細書において提供される実施例を参照することによってさらなる理解を得ることができる。これらの実施例は例示の目的のためだけであり、限定することを意図していない。
【実施例】
【0147】
実施例1
pCL0143発現ベクターの構築
pCL0143発現ベクター(
図2)を合成し、DNA 2.0(Menlo Park, CA)によるSanger配列決定によりその配列を検証した。pCL0143ベクターは、HA導入遺伝子の発現を推進するためのシゾキトリウム属伸長因子-1遺伝子(EF1)由来のプロモーター、HA導入遺伝子の後のOrfCターミネーター(PFA3ターミネーターとしても公知)、および抗生物質パロモマイシンに対する耐性を与える選択マーカーカセットを含む。
【0148】
SEQ ID NO: 76(
図1)は、A型インフルエンザウイルス(A/プエルトリコ/8/34/マウントサイナイ(H1N1))のHAタンパク質をコードする。このタンパク質配列はGenBankアクセッション番号AAM75158のそれに適合する。SEQ ID NO: 76の特異的核酸配列を、シゾキトリウム属での発現のために、
図16に示されるシゾキトリウム属コドン使用頻度表によってガイドされるように、DNA 2.0によって、コドン最適化し、合成した。代わりのシグナルペプチドを用いて、SEQ ID NO: 76のシグナルペプチド(最初の51ヌクレオチド)を除去し、シゾキトリウム属Sec1シグナルペプチドをコードするポリヌクレオチド配列(SEQ ID NO: 38)に置換した構築体も作出した。
【0149】
実施例2
シゾキトリウム属において産生されたHAタンパク質の発現および特徴付け
Biolistic(商標)パーティクルボンバーダー(BioRad, Hercules, CA)を用いたベクターpCL0143による形質転換用の宿主細胞としてシゾキトリウム種ATCC 20888を用いた。手短に言えば、シゾキトリウム種ATCC番号20888の培養物を、10 g/Lグルコース、0.8 g/L(NH4)2SO4、5 g/L Na2SO4、2 g/L MgS04・7H2O、0.5 g/L KH2PO4、0.5 g/L KCl、0.1 g/L CaCl2・2H2O、0.1 M MES(pH 6.0)、0.1% PB26金属、および0.1% PB26ビタミン(v/v)からなるM2B培地中で増殖させた。PB26ビタミンは50 mg/mLビタミンB12、100 μg/mLチアミン、および100 μg/mLパントテン酸Caからなった。PB26金属はpH 4.5に調整され、3 g/L FeSO4・7H2O、1 g/L MnCl2・4H2O、800 mg/mL ZnSO4・7H2O、20 mg/mL CoCl2・6H2O、10 mg/mL Na2MoO4・2H2O、600 mg/mL CuSO4・5H2O、および800 mg/mL NiSO4・6H2Oからなった。PB26ストック溶液を別々にろ過滅菌し、加圧滅菌後に培養液に添加した。グルコース、KH2PO4、およびCaCl2・2H2Oはそれぞれ、塩沈殿および糖質のカラメル化反応を防ぐため、混合する前に培養液の成分の残りとは別に加圧滅菌した。全ての培地成分はSigma Chemical(St. Louis, MO)から購入した。シゾキトリウム属の培養物を対数期まで増殖させ、Biolistic(商標)パーティクルボンバーダー(BioRad, Hercules, CA)を用いて形質転換した。Biolistic(商標)形質転換手順は過去に記載されているのと本質的に同じものであった(Apt et al., J. Cell. Sci. 115(Pt 21):4061-9(1996)および米国特許第7,001,772号を参照のこと)。一次形質転換体を、27℃で2~6日のインキュベーションの後に20 g/L寒天(VWR, West Chester, PA)、10 μg/mLスルホメツロンメチル(SMM)(Chem Service, Westchester, PA)を含有する固形M2B培地上で選択した。
【0150】
pCL0143の一次形質転換体由来のgDNAを抽出し、精製し、導入遺伝子の存在を調べるためにPCRの鋳型として用いた。
【0151】
シゾキトリウム属のためのゲノムDNA抽出プロトコル
シゾキトリウム属形質転換体を培地50 ml中で増殖させた。培養物25 mlを50 mlのコニカルバイアルの中へ無菌的にピペッティングし、3000×gで4分間遠心分離してペレットを形成させた。上清を除去し、ペレットを使用まで-80℃で貯蔵した。ペレットを50 mlのコニカルバイアル中の、20 mM Tris pH 8、10 mM EDTA、50 mM NaCl、0.5% SDSおよび100 μg/mlのプロテイナーゼKからなる溶液およそ4~5容量に再懸濁した。1時間穏やかに揺らしながらペレットを50℃でインキュベートした。溶解したら、100 μg/mlのRNase Aを添加し、溶液を37℃で10分間揺り動かした。次に、2容量のフェノール:クロロホルム:イソアミルアルコールを添加し、溶液を1時間室温で揺り動かし、その後、15分間8000×gで遠心分離した。上清をきれいな試験管の中に移し入れた。再度、2容量のフェノール:クロロホルム:イソアミルアルコールを添加し、溶液を1時間室温で揺り動かし、その後、15分間8000×gで遠心分離し、上清をきれいな試験管の中に移し入れた。得られた上清に等量のクロロホルムを添加し、溶液を30分間室温で揺り動かした。溶液を15分間8000×gで遠心分離し、上清をきれいな試験管の中に移し入れた。得られた上清に等量のクロロホルムを添加し、溶液を30分間室温で揺り動かした。溶液を15分間8000×gで遠心分離し、上清をきれいな試験管の中に移し入れた。0.3容量の3 M NaOAcおよび2容量の100% EtOHを上清に添加し、これを数分間穏やかに揺り動かした。DNAを無菌のガラス棒で巻き取り、1~2分間70% EtOHの中に浸した。DNAを1.7 mlの微量遠心管の中に移し入れ、10分間風乾させた。最大で0.5 mlまでの予洗されたEBをDNAに添加し、これを終夜4℃に置いた。
【0152】
遺伝子導入シゾキトリウム属(pCL0143で形質転換された)の冷凍保存ストックをコンフルエントまでM50-20の中で増殖させ、その後、50 mLのバッフル付き振盪フラスコ中48時間(h)、27℃、200 rpmにて、他に指定のない限り、以下(1リットルあたり)を含有する培地中で繁殖させた。
【0153】
容量を脱イオンH2Oで900 mLにし、他に指定のない限り、35分間加圧滅菌する前に、pHを6.5に調整した。ろ過滅菌したグルコース(50 g/L)、ビタミン(2 mL/L)、および微量金属(2 mL/L)を次いで培地に添加し、容量を1リットルに調整した。ビタミン溶液は0.16 g/LビタミンB12、9.75 g/Lチアミン、および3.33 g/Lパントテン酸Caを含有していた。微量金属溶液(pH 2.5)は、1.00 g/Lクエン酸、5.15 g/L FeSO4.7H2O、1.55 g/L MnCl2.4H2O、1.55 g/L ZnSO4.7H2O、0.02 g/L CoCl2.6H2O、0.02 g/L Na2MoO4.2H2O、1.035 g/L CuSO4.5H2O、および1.035 g/L NiSO4.6H2Oを含有していた。
【0154】
シゾキトリウム属の培養物を50 mlのコニカル試験管に移し入れ、15分間3000×gまたは4500×gで遠心分離した。
図3を参照されたい。「無細胞上清」(CFS)と呼ばれるこの遠心分離から得られた上清を、免疫ブロット分析および血球凝集活性のアッセイに用いた。
【0155】
無細胞上清(CFS)を1時間100,000×gでさらに超遠心分離した。
図3を参照されたい。HAタンパク質を含有する得られたペレット(不溶性画分または「UP」)を、PBS、pH 7.4に再懸濁した。この懸濁液を、15~60%のスクロース溶液を含有する不連続スクロース密度勾配にて遠心分離(120,000×g、18時間、4℃)した。
図3を参照されたい。HAタンパク質を含有する60%スクロースの画分を、ペプチド配列分析、グリコシル化分析、および電子顕微鏡分析に用いた。
【0156】
免疫ブロット分析
遺伝子導入シゾキトリウム属CL0143-9(「E」)由来の組み換えHAタンパク質の発現を、標準的な免疫ブロッティング手順にしたがって、免疫ブロット分析により検証した。無細胞上清(CFS)由来のタンパク質を、他に指定のない限り、MOPS SDS泳動用緩衝液を用いた還元条件の下、NuPAGE(登録商標)Novex(登録商標)12%ビス-トリスゲル(Invitrogen, Carlsbad, CA)上にてドデシル硫酸ナトリウム-ポリアクリルアミドゲル電気泳動(SDS-PAGE)によって分離した。タンパク質を次に、クマシーブルー(SimplyBlue Safe Stain, Invitrogen, Carlsbad, CA)で染色するか、またはポリフッ化ビニリデン膜上に転写し、ウサギ由来の抗インフルエンザA/プエルトリコ/8/34(H1N1)ウイルス抗血清(1000分の1希釈、Dr. Albert D.M.E. Osterhausからの寄贈; Fouchier R.A.M. et al., J. Virol. 79:2814-2822(2005))と、その後、アルカリホスファターゼと結合している抗ウサギIgG(Fc)二次抗体(2000分の1希釈、#S3731、Promega Corporation. Madison, WI)でHAタンパク質の存在を探索した。この膜を次に、5-ブロモ-4-クロロ-3-インドリル-リン酸/ニトロブルーテトラゾリウム溶液(BCIP/NBT)で製造元の使用説明書(KPL, Gaithersburg, MD)にしたがって処理した。さまざまなpH(5.5、6.0、6.5および7.0)ならびにさまざまな温度(25℃、27℃、29℃)で増殖させた遺伝子導入シゾキトリウム属CL0143-9(「E」)に対する抗H1N1免疫ブロットを
図4Aに示す。陰性対照(「C」)はシゾキトリウム種ATCC 20888の野生型株であった。組み換えHAタンパク質はpH 6.5にて無細胞上清中で検出され(
図4A)、検出された血球凝集活性はpH 6.5, 27℃で最も高かった(
図4A)。pH 6.5, 27℃で増殖させたCL0143-9(「E」)に対するクマシーブルー染色ゲル(「クマシー」)および対応する抗H1N1免疫ブロット(「IB: 抗-H1N1」)を、非還元条件および還元条件の下で、
図4Bに示す。陰性対照(「C」)は、シゾキトリウム種ATCC 20888の野生型株であった。
【0157】
HA活性
シゾキトリウム属において産生されたHAタンパク質の活性を血球凝集活性のアッセイにより評価した。機能的HAタンパク質は、標準的な血球凝集活性のアッセイによって容易に検出される血球凝集活性を示す。手短に言えば、低速上清のPBS 2倍希釈液50 μLを96ウェルマイクロタイタープレート中で調製した。PBS, pH 7.4中およそ1%のニワトリ赤血球溶液(Fitzgerald Industries, Acton, MA)の等量を次に、各ウェルに添加し、その後、30分間室温でのインキュベーションを行った。凝集度を次いで、視覚的に分析した。血球凝集活性単位(HAU)は、ウェル中で可視的な血球凝集を引き起こす最も高い希釈度と定義される。
【0158】
典型的な活性は、遺伝子導入シゾキトリウム属CL0143-9(「E」)無細胞上清中、ほぼ512 HAU程度であることが分かった(
図5A)。PBS(「-」)または遺伝子導入株と同じように増殖させて調製したシゾキトリウム種ATCC 20888の野生型株(「C」)を、陰性対照として用い、それらは何らの血球凝集活性も示さなかった。A型インフルエンザ/ベトナム/1203/2004(H5N1)由来の組み換えHAタンパク質(Protein Sciences Corporation, Meriden, CT, 希釈はPBS中で1000分の1)を陽性対照(「+」)として用いた。
【0159】
血球凝集アッセイによる遺伝子導入シゾキトリウム属CL0143-9株の無細胞上清の可溶性および不溶性画分の分析から、HAタンパク質が不溶性画分において主に見られることが示唆された(
図5B)。典型的な活性は、可溶性画分(「US」)においてほぼ16HAU程度および不溶性画分(「UP」)においてほぼ256HAU程度であることが分かった。
【0160】
2 L培養物でのHAタンパク質の活性レベルは、6.5の一定pHにて同じ培地中で培養時の振盪フラスコ培養物と類似の活性を示した。
【0161】
別の実験では、HAの天然シグナルペプチドを除去し、シゾキトリウム属Sec1シグナルペプチド(SEQ ID NO: 38によってコードされる、SEQ ID NO: 37)に置き換えた。この代替の構築体で得られた遺伝子導入シゾキトリウム属は、pCL0143構築体を含有する遺伝子導入シゾキトリウム属で観察されたのと類似の血球凝集活性および組み換えタンパク質分布を示した(データは示されていない)。
【0162】
ペプチド配列分析
無細胞上清の100,000×gの遠心分離から得られた不溶性画分(「UP」)をスクロース密度勾配に対してさらに分画し、血球凝集活性のアッセイ(
図6B)によって示されるように、HAタンパク質を含有する画分を、上記のように、SDS-PAGEによって分離し、クマシーブルーで染色するかまたはPVDFに転写し、ウサギ由来の抗H1N1抗血清で免疫ブロットした(
図6A)。免疫ブロットにおいて交差反応に対応するバンド(HA1およびHA2)をクマシーブルー染色ゲルから切り出し、ペプチド配列分析を行った。手短に言えば、関心対象のバンドを洗浄し/50%エタノール、5%酢酸中で脱染した。ゲル片を次いで、アセトニトリル中で脱水し、SpeedVac(登録商標)(Thermo Fisher Scientific, Inc., Waltham, MA)中で乾燥させ、50 mM重炭酸アンモニウム中10 ng/μLのトリプシン5 μLを添加して室温で終夜インキュベートすることにより、トリプシンで消化した。形成されたペプチドを、ポリアクリルアミドから、5%ギ酸を含む50%アセトニトリル30 μLの2アリコット中に抽出した。これらの抽出物を混ぜ合わせ、SpeedVac(登録商標)中で10 μL未満まで蒸発させ、次に1%酢酸中に再懸濁してLC-MS分析用におよそ30 μLの終容量とした。LC-MSシステムは、FinniganTM LTQTM直線イオントラップ質量分析計(Linear Ion Trap Mass Spectrometer)(Thermo Electron Corporation, Waltham, MA)であった。HPLCカラムは、自己充填性の9 cm×75 μm Phenomenex JupiterTM C18逆相キャピラリークロマトグラフィーカラム(Phenomenex, Torrance, CA)であった。次いで、抽出物のμL容量を注入し、ペプチドを、0.25 μL/分の流速でアセトニトリル/0.1%ギ酸の勾配によってカラムから溶出し、オンラインの質量分析計の供給源へ導入した。マイクロエレクトロスプレイイオン源を2.5 kVで操作した。質量分析計によってLC実験の全過程にわたり一連のm/z比が細分化される選択反応(SRM)実験を用いて、消化物を分析した。次に関心対象のペプチドの断片化パターンを用いて、クロマトグラムを生成した。各ペプチドに対するピーク面積を決定し、内部標準物質に対して規準化した。この分析において用いた内部標準物質は、試験されているサンプル間で不変の存在量を有するタンパク質であった。2つのシステム間の最終の比較は、各ペプチドに対して規準化されたピーク比を比較することによって決定された。衝突誘起解離スペクトルを次に、NCBIデータベースに対して探索した。HAタンパク質は、タンパク質配列の42%を網羅する計27ペプチドによって特定された。配列決定された特異的ペプチドは
図7に太字体で強調されている。より具体的には、HA1は計17ペプチドにより特定され、HA2は計9ペプチドにより特定された。これは、397位の前で切断されているHA N末端ポリペプチドと一致する。HA1およびHA2に対して特定されたペプチドの配置は、HAタンパク質の全アミノ酸配列内に示されている。HA内の推定切断部位はアミノ酸番号343と344の間に位置している(R^Gとして示されている)。アミノ酸番号402の位置で始まるイタリック体のペプチド配列はHA2ポリペプチドと関連しているが、HA1において特定されたペプチドで見られ、これはおそらく、HA1に対して切り出されたバンドにおけるHA2ペプチドの微量の持込みに起因する。例えば、Wright et al., BMC Genomics 10:61(2009)の
図3を参照されたい。
【0163】
グリコシル化分析
HAタンパク質上のグリカンの存在を酵素処理によって評価した。遺伝子導入シゾキトリウム属「CL0143-9」の60%スクロース画分をEndoHまたはPNGase Fにより製造元の使用説明書(New England Biolabs, Ipswich, MA)にしたがって消化した。次いで、MOPS SDS泳動用緩衝液を用いたNuPAGE(登録商標)Novex(登録商標)12%ビス-トリスゲル(Invitrogen, Carlsbad, CA)上でのSDS-PAGEによりタンパク質を分離し、その後、クマシーブルー(「クマシー」)での染色を行うかまたは抗H1N1抗血清(「IB: 抗-H1N1」)での免疫ブロッティングを行った場合に予想される移動度の変化によって、グリカンの除去を特定した(
図8)。酵素処理に対する陰性対照は、酵素なしでインキュベートされた(「NT」= 無処理)遺伝子導入シゾキトリウム属「CL0143-9」であった。少なくとも5つの異なる種を免疫ブロット上でHA1の位置に特定することができ、2つの異なる種を免疫ブロット上でHA2の位置に特定することができる。これは、文献において報告されているように、HA1上の複数のグリコシル化部位およびHA2上の単一のグリコシル化部位と一致している。
【0164】
実施例3
シゾキトリウム属培養上清由来のタンパク質の特徴付け
シゾキトリウム種ATCC 20888を上記のように典型的な発酵条件の下で増殖させた。培養上清のサンプルを培養20時間から52時間まで4時間の間隔で収集し、68時間の時点で最後の収集を行った。
【0165】
各サンプルに基づく培養上清中の総タンパク質を標準的なBradford Assayによって決定した。
図9を参照されたい。
【0166】
図3の方法を用いて37時間、40時間、44時間、48時間、および68時間の時点で培養上清のサンプルからタンパク質を単離した。タンパク質のSDS-PAGEゲルを
図10に示す。レーン11には総タンパク質2.4 μgをロードし、残りのレーンには総タンパク質5 μgをロードした。アクチンまたはゲルゾリンと(質量分析ペプチド配列決定によって)特定された豊富なバンドは、
図10中の矢印で示す。
【0167】
実施例4
培養上清材料の陰性染色および電子顕微鏡検査
シゾキトリウム種ATCC 20888(対照)および遺伝子導入シゾキトリウム属CL0143-9(実験)を上記のように典型的なフラスコ条件の下で増殖させた。培養物を50 mLのコニカル試験管に移し入れ、15分間3000×gまたは4500×gで遠心分離した。この無細胞上清を1時間100,000×gでさらに超遠心分離し、得られたペレットをPBS, pH 7.4に再懸濁した。この懸濁液を不連続の15%~60%スクロース勾配にて遠心分離し(120,000×g、18時間、4℃)、60%の画分を陰性染色および電子顕微鏡法による検査に用いた。
【0168】
対照材料の陰性染色材料の電子顕微鏡観察では、直径が数百ナノメートルから<50 nmに及ぶ膜断片、膜凝集体、および小胞(まとめて「細胞外体」)の混合物が含まれていた。
図11を参照されたい。小胞の形状は環状から細長(管状)にまで及び、小胞の縁は滑らかまたは不規則であった。小胞の内部はうっすらと染まっているように見え、有機材料が存在していることを示唆していた。より大きな小胞は肥厚した膜を有し、小胞の端が調製中に重なり合ったことを示唆していた。膜凝集体および断片は形状およびサイズがかなり不規則であった。超遠心分離によって精製された膜におけるアクチンとの強い相関関係によって示されるように、膜材料は外質ネットが起源であった可能性が高い。
【0169】
同様に、異種タンパク質を発現する遺伝子導入シゾキトリウム属CL0143-9の培養物の無細胞上清からの陰性染色材料の電子顕微鏡観察によって、この材料は直径が数百ナノメートルから<50 nmに及ぶ膜断片、膜凝集体、および小胞の混合物であることが示唆された。
図11を参照されたい。
【0170】
また、実施例22のなかで免疫ブロット分析について記載したH1N1抗血清および12 nmの金粒子を用いて、Perkins et al., J. Virol. 82:7201-7211(2008)に記載のように、この物質に関して免疫学的局在決定を行った。遺伝子導入シゾキトリウム属CL0143-9から単離された細胞外膜体は、抗血清に付着されている金粒子によってかなり装飾され(
図12)、抗体が、細胞外体に存在するHAタンパク質を認識することを示唆していた。膜材料のない領域では最小のバックグラウンドが観察された。対照材料から単離された細胞外体に結合している金粒子は、ほとんどまたは全くなかった(
図12)。
【0171】
実施例5
キシロース輸送体、キシロースイソメラーゼ、およびキシルロースキナーゼ発現ベクターの構築
ベクターpAB0018(ATCCアクセッション番号PTA-9616)をHindIIIで消化し、マングビーンヌクレアーゼで処理し、精製し、その後、KpnIでさらに消化して、さまざまなサイズの4つの断片を作出した。2552 bpの断片を、寒天ゲル中での標準的な電気泳動技法によって単離し、市販のDNA精製キットを用いて精製した。次いでPmeIおよびKpnによるpAB0018の2回目の消化を行った。6732 bpの断片を単離し、この消化物から精製し、2552 bpの断片に核酸連結した。次に核酸連結産物を用いて、製造元のプロトコルによりコンピテントなDH5-α大腸菌細胞(Invitrogen)の市販株を形質転換した。アンピシリン耐性クローン由来のプラスミドを繁殖させ、精製し、その後、制限消化またはPCRによりスクリーニングして、予想されるプラスミド構造が核酸連結により作出されたことを確認した。検証されたプラスミドの1つをpCL0120と名付けた。
図15を参照されたい。
【0172】
カンジダインターメディア(Candida intermedia)キシロース輸送体タンパク質GXS1(GenBankアクセッション番号AJ875406)およびシロイヌナズナ(Arabidopsis thaliana)キシロース輸送体タンパク質At5g17010(GenBankアクセッション番号BT015128)をコードする配列を、
図16に示されるシゾキトリウム属コドン使用頻度表によってガイドされるようにコドン最適化し、合成した(Blue Heron Biotechnology, Bothell, WA)。SEQ ID NO: 94はGSX1のコドン最適化された核酸配列であり、一方でSEQ ID NO: 95はAt5g17010のコドン最適化された核酸配列である。
【0173】
SEQ ID NO: 94およびSEQ ID NO: 95をそれぞれ、標準的な技法による挿入および核酸連結のために5'および3'制限部位BamHIおよびNdeIを用いてpCL0120にクローニングした。得られたベクターpCL0130およびpCL0131のマップをそれぞれ、
図17および
図18に示す。
【0174】
ベクターpCL0121およびpCL0122は、HindIIIおよびKpnIでの消化によりpCL0120から遊離された5095 bpの断片を、ゼオシンまたはパロモマイシンのいずれかに対する耐性を付与するようにデザインされた選択可能な合成マーカーカセットに核酸連結することによって作出された。これらのカセットは、sh ble遺伝子(ゼオシンの場合)またはnpt遺伝子(パロモマイシンの場合)のいずれかの発現を推進するためのαチューブリンプロモーターから構成された。両方の選択可能なマーカー遺伝子の転写産物は、SV40ターミネーターによって終結された。ベクターpCL0121およびpCL0122の全配列は、それぞれ、SEQ ID NO: 90およびSEQ ID NO: 91として提供されている。ベクターpCL0121およびpCL0122のマップは、それぞれ、
図19および
図20に示されている。
【0175】
ピロマイセス種E2キシロースイソメラーゼ(CAB76571)およびピロマイセス種E2キシルロースキナーゼ(AJ249910)をコードする配列を、
図16に示されるシゾキトリウム属コドン使用頻度表によってガイドされるようにコドン最適化し、合成した(Blue Heron Biotechnology, Bothell, WA)。「XylA」(SEQ ID NO: 92)はCAB76571のコドン最適化された核酸配列(
図21)であり、一方で「XylB」(SEQ ID NO: 93)はAJ249910のコドン最適化された核酸配列(
図22)である。
【0176】
SEQ ID NO: 92をベクターpCL0121にクローニングすることで、pCL0132と名付けられたベクター(
図23)が得られ、SEQ ID NO: 21をBamHIおよびNdeI部位への挿入によってベクターpCL0122にクローニングすることで、pCL0136と名付けられたベクター(
図24)が得られた。
【0177】
実施例6
シゾキトリウム属において産生されたキシロース輸送体、キシロースイソメラーゼ、およびキシルロースキナーゼタンパク質の発現および特徴付け
シゾキトリウム種ATCC 20888を、ベクターpCL0130、pCL0131、pCL0132またはpCL0136個々での形質転換用の宿主細胞として用いた。
【0178】
酵素前処理によるエレクトロポレーション
細胞をM50-20培地(米国特許出願公開第2008/0022422号を参照のこと)50 mL中にて、振盪機上200 rpmで30℃にて2日間増殖させた。細胞をM2B培地(次の段落を参照のこと)の中に100分の1で希釈し、終夜(16~24時間)増殖させ、対数増殖中期の増殖(OD600 1.5~2.5)に達するように試みた。細胞を50 mlのコニカル試験管の中で3000×gにて5分間遠心分離した。上清を除去し、細胞を1 Mマンニトール、pH 5.5の適当な容量の中に再懸濁し、2 OD600単位の終濃度に到達させた。細胞5 mLを25 mLの振盪フラスコ中に分注し、10 mM CaCl2(1.0 Mストック液、ろ過滅菌済み)および0.25 mg/mLのプロテアーゼXIV(10 mg/mLのストック液、ろ過滅菌済み; Sigma-Aldrich, St. Louis, MO)で改変した。フラスコを振盪機上100 rpmおよび30℃で4時間インキュベートした。細胞を顕微鏡下でモニタリングし、プロトプラスト化の程度を、単細胞を所望として、判定した。細胞を丸底試験管(すなわち、14 mLのFalcon(商標)試験管、BD Biosciences, San Jose, CA)の中で2500×gにて5分間遠心分離した。上清を除去し、細胞を氷冷10%グリセロール5 mLで穏やかに再懸濁した。細胞を丸底試験管の中で2500×gにて5分間、再び遠心分離した。上清を除去し、細胞を大孔径ピペットチップにより、氷冷10%グリセロール500 μLで穏やかに再懸濁した。細胞90 μLを、予冷したエレクトロキュベット(Gene Pulser(登録商標)キュベット - 0.2 cmのギャップ, Bio-Rad, Hercules, CA)の中に分注した。DNA 1 μg~5 μg(容量10 μL以下で)をキュベットに添加し、ピペットチップで穏やかに混合し、5分間氷上に置いた。細胞を200オーム(抵抗)、25 μF(電気容量)、および500 Vでエレクトロポレーションした。M50-20培地0.5 mLをキュベットに速やかに添加した。次いで細胞を25 mLの振盪フラスコ中のM50-20培地4.5 mLに移し、振盪機上100 rpmおよび30℃で2~3時間インキュベートした。細胞を丸底試験管の中で2500×gにて5分間遠心分離した。上清を除去し、細胞ペレットをM50-20培地0.5 mLに再懸濁した。細胞を適切な選択により(必要なら)適切な数(2~5枚)のM2Bプレート上にプレーティングし、30℃でインキュベートした。
【0179】
M2B培地は、10 g/Lグルコース、0.8 g/L(NH4)2SO4、5 g/L Na2SO4、2 g/L MgSO4・7H2O、0.5 g/L KH2PO4、0.5 g/L KCl、0.1 g/L CaCl2・2H2O、0.1 M MES(pH 6.0)、0.1% PB26金属、および0.1% PB26ビタミン(v/v)から構成された。PB26ビタミンは、50 mg/mLビタミンB12、100 μg/mLチアミン、および100 μg/mLパントテン酸Caから構成された。PB26金属は、pH 4.5に調整され、3 g/L FeSO4・7H2O、1 g/L MnCl2・4H2O、800 mg/mL ZnSO4・7H2O、20 mg/mL CoCl2・6H2O、10 mg/mL Na2MoO4・2H2O、600 mg/mL CuSO4・5H2O、および800 mg/mL NiSO4・6H2Oから構成された。PB26ストック溶液を別々にろ過滅菌し、加圧滅菌後に培養液に添加した。グルコース、KH2PO4、およびCaCl2・2H2Oはそれぞれ、塩沈殿および糖質のカラメル化反応を防ぐため、混合する前に培養液の成分の残りとは別に加圧滅菌した。全ての培地成分はSigma Chemical(St. Louis, MO)から購入した。
【0180】
適切な抗生物質を含有する固体培地上での増殖について形質転換体を選択した。各ベクターの一次形質転換体20~100個を、単一炭素源としてグルコースの代わりにキシロースを含有することを除きSSFM(下記)と同じものである「キシロース-SSFM」固体培地に再プレーティングし、抗生物質は添加しなかった。これらの条件下ではいずれのクローンについても増殖は認められなかった。
【0181】
SSFM培地: 50 g/Lグルコース、13.6 g/L Na2SO4、0.7 g/L K2SO4、0.36 g/L KCl、2.3 g/L MgSO4・7H2O、0.1 M MES(pH 6.0)、1.2 g/L (NH4)2SO4、0.13 g/Lグルタミン酸ナトリウム、0.056 g/L KH2PO4、および0.2 g/L CaCl2・2H2O。ビタミンは、0.16 g/LビタミンB12、9.7 g/Lチアミン、および3.3 g/Lパントテン酸Caからなるストック液から1 mL/Lで添加した。pH 2.5に調整された、1 g/Lクエン酸、5.2 g/L FeSO4・7H2O、1.5 g/L MnCl2・4H2O、1.5 g/L ZnSO4・7H2O、0.02 g/L CaCl2・6H2O、0.02 g/L Na2MoO4・2H2O、1.0 g/L CuSO4・5H2O、および1.0 g/L NiSO4・6H2Oからなるストック液から、微量金属を2 mL/Lで添加した。
【0182】
pCL0130およびpCL0131の一次形質転換体由来のgDNAを抽出し、精製し、導入遺伝子の存在を確かめるためのPCRの鋳型として用いた。
【0183】
ゲノムDNA抽出は実施例2に記載されているように行った。
【0184】
あるいは、RNase Aインキュベーションの後、Qiagen Genomicチップ500/Gカラム(Qiagen, Inc USA, Valencia, CA)を、製造元のプロトコルにしたがって用い、DNAをさらに精製した。
【0185】
PCR - GXS1導入遺伝子を検出するために用いたプライマーは
であった。At5g17010導入遺伝子を検出するために用いたプライマーは
であった。
【0186】
pCL0130、pCL0132、およびpCL0136(「pCL01310系列」)を一緒に組み合わせるかまたはpCL0131、pCL0132、およびpCL0136(「pCL0131系列」)を一緒に組み合わせて、シゾキトリウム属野生型株(ATCC 20888)の同時形質転換に用いた。形質転換体を固体キシロースSSFM培地上に直接プレーティングし、3~5週後に、コロニーを選別し、液体キシロース-SSFM中でさらに繁殖させた。キシロースを含有する液体培地中での数ラウンドの連続移入によって、形質転換体の増殖率が改善された。pCL0130系列またはpCL0131系列の同時形質転換体をまた、SMM、ゼオシン、またはパロモマイシンのいずれかを含有する固体SSFM培地にプレーティングした。これらの培地にプレーティングされた全ての形質転換体は、試験した各抗生物質に対して耐性であったことから、形質転換体がそれらの各ベクターの3つ全てを持っていることが示唆された。キシロース輸送体、キシロースイソメラーゼ、およびキシルロースキナーゼで形質転換されたシゾキトリウム属は、単一炭素源としてキシロースを含有する培地中で増殖することができた。
【0187】
今後の実験では、選択したSMM耐性形質転換体クローン(pCL0130もしくはpCL0131形質転換体のみ、またはpCL0130系列の同時形質転換体、またはpCL0131系列の同時形質転換体)の振盪フラスコ培養物からの無細胞抽出物および無細胞上清の両方のウエスタンブロットを行い、両輸送体が両画分において発現および見出されることを示し、これらの膜結合タンパク質が、本明細書において記載された他の膜タンパク質で観察されたのと同じように細胞外小胞と結び付いていることを示す。あるいは、ウエスタンブロットを行い、これにより、キシロースイソメラーゼおよびキシルロースキナーゼの発現は、その存在が予想される全てのクローンの無細胞抽出物において示される。キシロース輸送体を含有する小胞のような細胞外体を用いて、ろ過または遠心分離を含むさまざまな方法によって分離できる小胞内に糖を捕捉することにより、糖または他の低分子量溶質の混合物を含有する培地から微量のキシロースを枯渇させることができる。
【0188】
実施例7
pCL0140およびpCL0149発現ベクターの構築
ベクターpCL0120をBamHIおよびNdeIで消化し、長さが837塩基対(bp)および8454 bpの2つの断片を生み出した。8454 bpの断片を、寒天ゲル中での標準的な電気泳動技法によって分画し、市販のDNA精製キットを用いて精製し、BamHIおよびNdeIで同様に予め消化されていた合成配列(SEQ ID NO: 100またはSEQ ID NO: 101;
図26を参照のこと)に核酸連結した。SEQ ID NO: 100(
図26)はA型インフルエンザウイルス(A/プエルトリコ/8/34/マウントサイナイ(H1N1))のNAタンパク質をコードする。タンパク質配列はGenBankアクセッション番号NP_040981のそれと適合する。SEQ ID NO: 100の特異的核酸配列を、シゾキトリウム属での発現のためにDNA 2.0によって、
図16に示されるシゾキトリウム属コドン使用頻度表によってガイドされるようにコドン最適化し、合成した。SEQ ID NO: 101(
図26)は、SEQ ID NO: 100と同じNAタンパク質をコードするが、コード領域のC末端にV5タグ配列およびポリヒスチジン配列を含む。
【0189】
次に核酸連結産物を用いて、製造元のプロトコルによりコンピテントなDH5-α大腸菌細胞(Invitrogen, Carlsbad, CA)の市販株を形質転換した。次にこれらのプラスミドを制限消化またはPCRによりスクリーニングして、核酸連結により、予想されるプラスミド構造が作出されたことを確認した。この手順から得られたプラスミドベクターを、DNA 2.0(Menlo Park, CA)によりSanger配列決定を用いて検証し、SEQ ID NO: 100を含むpCL0140(
図25A)、およびSEQ ID NO: 101を含むpCL0149(
図25B)と名付けた。pCL0140およびpCL0149ベクターは、NA導入遺伝子の発現を推進するためのシゾキトリウム属伸長因子-1遺伝子(EF1)由来のプロモーター、NA導入遺伝子の後のOrfCターミネーター(PFA3ターミネーターとしても公知)、およびスルホメツロンメチルに対する耐性を与える選択マーカーカセットを含む。
【0190】
実施例8
シゾキトリウム属において産生されたNAタンパク質の発現および特徴付け
実施例2に記載のように、Biolistic(商標)パーティクルボンバーダー(BioRad, Hercules, CA)を用いたベクターpCL0140およびpCL0149による形質転換用の宿主細胞としてシゾキトリウム種ATCC 20888を用いた。適切な抗生物質を含有する固体培地上での増殖について形質転換体を選択した。前述(実施例2)のように、一次形質転換体由来のgDNAを抽出し、精製し、導入遺伝子の存在を調べるためにPCRの鋳型として用いた。
【0191】
実施例2に記載されているように遺伝子導入シゾキトリウム属(pCL0140およびpCL0149で形質転換された)の冷凍保存ストックをコンフルエントまでM50-20の中で増殖させ、その後、50 mLのバッフル付き振盪フラスコ中で繁殖させた。
【0192】
シゾキトリウム属の培養物を50 mlのコニカル試験管に移し入れ、15分間3000×gで遠心分離した。
図27を参照されたい。この遠心分離から得られた上清を、「無細胞上清」(CFS)と呼んだ。このCFS画分を、Centriprep(商標)重力式濃縮機(Millipore, Billerica, MA)を用いて50~100倍濃縮し、「濃縮無細胞上清」(cCFS)と呼んだ。遠心分離から得られた細胞ペレットを水中で洗浄し、液体窒素中で凍結し、その後、2倍のペレット重量の溶解用緩衝液(50 mMリン酸ナトリウム(pH 7.4)、1 mM EDTA、5%グリセロール、および1 mM新鮮フッ化フェニルメチルスルホニルからなる)ならびに2倍のペレット重量の0.5 mmガラスビーズ(Sigma, St. Louis, MO))に再懸濁した。細胞ペレット混合物を次に、マルチチューブ・ボルテクサ(VWR, Westchester, PA)中、最大速度にて3時間4℃でボルテックスすることにより溶解した。得られた細胞溶解物を次に、4℃にて10分間5500×gで遠心分離した。得られた上清を保持し、4℃にて10分間5500×gで再び遠心分離した。得られた上清は本明細書において「無細胞抽出物」(CFE)と定義される。標準的なBradfordアッセイ(Bio-Rad, Hercules, CA)によりcCFSおよびCFEにおいてタンパク質濃度を決定した。これらの画分をノイラミニダーゼ活性のアッセイおよび免疫ブロット分析のために用いた。
【0193】
機能的なインフルエンザNAタンパク質は、365 nmでの励起に続き450 nmでの蛍光放射を有する遊離4-メチルウンベリフェロンを生ずる(4-メチルウンベリフェリル)-α-D-N-アセチルノイラミン酸ナトリウム(4-MUNANA)基質(Sigma-Aldrich, St. Louis, MO)のシアリダーゼによる加水分解に基づき、標準的な蛍光定量的NA活性のアッセイにより検出できるノイラミニダーゼ活性を示す。手短に言えば、遺伝子導入シゾキトリウム属株のCFS、cCFS、またはCFEを、CFS 25 μLおよび40 μM 4-MUNANA 75 μLまたは対照の場合にはddH2O 75 μLを用いて、Potier et al., Anal. Biochem. 94:287-296(1979)により記載されている手順にしたがってアッセイした。反応液を37℃で30分間インキュベートし、蛍光をFLUOstar Omega多モードマイクロプレートリーダー(BMG LABTECH, Offenburg, Germany)で測定した。
【0194】
CL0140で形質転換されたシゾキトリウム属の遺伝子導入株9株由来の濃縮無細胞上清(cCFS)および無細胞抽出物(CFE)において観察された典型的な活性を
図28に提示する。シゾキトリウム種ATCC 20888の野生型株(「-」)と、遺伝子導入株と同じようにpCL0140で形質転換し増殖させて調製したシゾキトリウム属のPCR陰性株(「27」)とを、陰性対照として用いた。活性の大部分が濃縮無細胞上清において見出され、シゾキトリウム属による外部環境への機能的なインフルエンザノイラミニダーゼの発現および分泌の成功を示唆していた。
【0195】
ペプチド配列分析
遺伝子導入シゾキトリウム属株CL0140-26をインフルエンザNAタンパク質の部分的精製に用いて、その発現および分泌の成功をペプチド配列分析により確認した。精製手順はTarigan et al., JITV 14(1):75-82(2008)から適合し、続いて、上記のように、NA活性を測定することによって行った(
図29A)。手短に言えば、遺伝子導入株CL0140-26の無細胞上清を4℃にて1時間100,000×gでさらに遠心分離した。得られた上清を、Centriprep(商標)重力式濃縮機(Millipore, Billerica, MA)を用いて100倍濃縮し(
図29A中の画分「cCFS」)、0.1% Triton X-100を含有する0.1 M重炭酸ナトリウム緩衝液(pH 9.1)で元の容量に希釈し戻した(
図29A中の画分「D」)。この希釈サンプルをアフィニティークロマトグラフィーによる精製に用いた。0.1% Triton X-100を含有する0.1 M重炭酸ナトリウム緩衝液(pH 9.1)6カラム容量(CV)と、その後0.1% Triton X-100を含有する0.05 M酢酸ナトリウム緩衝液pH 5.5 5 CVとで洗浄することにより活性化された、PD-10カラム(BioRad, Hercules, CA)の中に、N-(p-アミノフェニル)オキサミド酸アガロース(Sigma-Aldrich, St. Louis, MO)を充填した。希釈サンプル(画分「D」)をカラムにロードした; 0.1% Triton X-100を含有する0.15 M酢酸ナトリウム緩衝液10 CVでカラムを洗浄することにより、未結合の材料を除去した(
図29A中の画分「W」)。0.1% Triton X-100および2 mM CaCl2を含有する0.1 M重炭酸ナトリウム緩衝液5 CVで、カラムから結合したNAを溶出させた(
図29A中の画分「E」)。NAに富む画分Eの溶液を、10 kDaの分子カットオフのスピン濃縮器を用いて元の容量の約10%にまで濃縮し、画分cEをもたらした。
【0196】
各画分由来のタンパク質を、MOPS SDS泳動用緩衝液を用いた還元条件の下、NuPAGE(登録商標)Novex(登録商標)12%ビス-トリスゲル(Invitrogen, Carlsbad, CA)上にてドデシル硫酸ナトリウム-ポリアクリルアミドゲル電気泳動(SDS-PAGE)により分離した。これらのタンパク質を次に、クマシーブルー(SimplyBlue Safe Stain, Invitrogen, Carlsbad, CA)で染色した。レーン「cE」において可視的なタンパク質のバンド(
図29B)をクマシーブルー染色ゲルから切り出し、ペプチド配列分析を実施例2に記載のように行った。NAタンパク質を含有するタンパク質のバンド(レーン「cE」において矢印で示した)を、タンパク質配列の25%を網羅する計9ペプチド(113アミノ酸)によって特定した。配列決定された特異的ペプチドは、
図30において太字体で強調されている。
【0197】
免疫ブロット分析
遺伝子導入シゾキトリウム属CL0149(クローン10、11、12)由来の組み換えNAタンパク質の発現を、標準的な免疫ブロッティング手順にしたがって、免疫ブロット分析により試験した(
図31B)。無細胞上清(CFS)由来のタンパク質を、MOPS SDS泳動用緩衝液を用いた還元条件の下、NuPAGE(登録商標)Novex(登録商標)12%ビス-トリスゲル(Invitrogen, Carlsbad, CA)上にて、ドデシル硫酸ナトリウム-ポリアクリルアミドゲル電気泳動(SDS-PAGE)により分離した。これらのタンパク質を次に、クマシーブルー(SimplyBlue Safe Stain, Invitrogen, Carlsbad, CA)で染色するかまたはポリフッ化ビニリデン膜上に転写し、抗V5-AP結合マウスモノクローナル抗体(1000分の1希釈, #962-25, Invitrogen, Carlsbad, CA)で、NAタンパク質の存在を探索した。次に製造元の使用説明書(KPL, Gaithersburg, MD)にしたがって、5-ブロモ-4-クロロ-3-インドリル-リン酸/ニトロブルーテトラゾリウム溶液(BCIP/NBT)で、この膜を処理した。クローン11の無細胞上清において、組み換えNAタンパク質が検出された(
図31B)。陰性対照(「-」)は、シゾキトリウム種ATCC 20888の野生型株であった。陽性対照(「+」)は、Positope(商標)抗体対照タンパク質(#R900-50, Invitrogen, Carlsbad, CA)であった。対応するノイラミニダーゼ活性を
図31Aに提示する。
【0198】
実施例9
シゾキトリウム属におけるインフルエンザHAおよびNAの同時発現
実施例2に記載のように、Biolistic(商標)パーティクルボンバーダー(BioRad, Hercules, CA)を用いたベクターpCL0140(
図25A)およびpCL0143(
図2)による同時形質転換用の宿主細胞として、シゾキトリウム種ATCC 20888を用いた。
【0199】
遺伝子導入シゾキトリウム属(pCL0140およびpCL0143で形質転換された)の冷凍保存ストックを、実施例2に記載のように培養し、加工処理した。血球凝集およびノイラミニダーゼ活性を、それぞれ、実施例2および7に記載のように測定した。これらを
図32に示す。pCL0140およびpCL0143で形質転換された遺伝子導入シゾキトリウム属は、HAおよびNAと関連する活性を示した。
【0200】
実施例10
シゾキトリウム属において産生されたパラインフルエンザFタンパク質を含む細胞外体の発現および特徴付け
ヒトパラインフルエンザ3ウイルス株NIH 47885のFタンパク質(GenBankアクセッション番号P06828)をコードする配列を含むベクターによる形質転換用の宿主細胞として、シゾキトリウム種ATCC 20888を用いる。Fタンパク質の代表的な配列はSEQ ID NO: 102として提供されている。一部の細胞は、Fタンパク質に付随する天然シグナルペプチド配列をコードする配列を含んだベクターで形質転換する。他の細胞は、Fタンパク質が異種シグナルペプチド配列とともに発現されるように、Fタンパク質をコードする配列に融合されている異なるシグナルペプチド配列(例えば、シゾキトリウム属シグナルアンカー配列のような)をコードする配列を含んだベクターで形質転換する。他の細胞は、Fタンパク質が異種膜ドメインとともに発現されるように、Fタンパク質をコードする配列に融合されている異なる膜ドメイン(例えば、HA膜ドメインのような)をコードする配列を含んだベクターで形質転換する。Fタンパク質はC末端の近くに1回膜貫通ドメインを含む。Fタンパク質は、フリン切断部位(アミノ酸番号109)で二つのペプチドに分けることができる。F2と名付けられたタンパク質の最初の部分は、完全なFタンパク質のN末端部分を含む。F2領域が、異種シグナルペプチドをコードする配列に個別に融合されてもよい。Fタンパク質のC末端部分を含むウイルスFタンパク質の残部は、F1と名付けられている。F1領域が、異種シグナルペプチドをコードする配列に個別に融合されてもよい。ウイルスFタンパク質のF1およびF2部分を含むベクターが、個別にまたは組み合わせで発現されてもよい。完全なFタンパク質を発現するベクターが、フリン切断部位でタンパク質を切断するフリン酵素と同時発現されてもよい。あるいは、Fタンパク質のフリン切断部位をコードする配列が、異なるプロテアーゼにより認識かつ切断される別のプロテアーゼ切断部位をコードする配列と置き換えられてもよい。別のプロテアーゼ切断部位を含むFタンパク質が、この別のプロテアーゼ切断部位を認識かつ切断する対応のプロテアーゼと同時発現されてもよい。
【0201】
形質転換を行い、本明細書において記載した方法のいずれかにしたがって、冷凍保存ストックを増殖させ繁殖させる。シゾキトリウム属の培養物を50 mLのコニカル試験管に移し入れ、15分間3000×gまたは4500×gで遠心分離して低速上清を得る。低速上清を1時間100,000×gでさらに超遠心分離した。
図3を参照されたい。得られたFタンパク質を含有する不溶性画分のペレットを、リン酸緩衝生理食塩水(PBS)に再懸濁し、実施例2に記載のようにペプチド配列分析およびグリコシル化分析に用いる。
【0202】
遺伝子導入シゾキトリウム属由来のFタンパク質の発現を、抗F抗血清および二次抗体を適切な希釈度で用いて、実施例2に記載のように標準的な免疫ブロッティング手順にしたがって免疫ブロット分析により検証する。低速上清および不溶性画分において、組み換えFタンパク質を検出する。さらに、Fタンパク質を発現する遺伝子導入シゾキトリウム属由来の無細胞抽出物において、組み換えFタンパク質を検出する。
【0203】
シゾキトリウム属において産生されたFタンパク質の活性を、F活性アッセイにより評価する。機能的なFタンパク質は、標準的なF活性アッセイによって容易に検出されるF活性を示す。
【0204】
実施例4にしたがって作製された陰性染色材料を用い、電子顕微鏡検査を行って、細胞外体の存在を確認する。免疫金標識を行って、細胞外膜体とのタンパク質の結合を確認する。
【0205】
実施例11
シゾキトリウム属において産生された水疱性口炎(G Vesicular Stomatitus)ウイルスGタンパク質を含む細胞外体の発現および特徴付け
シゾキトリウム種ATCC 20888を、水疱性口炎ウイルスG(VSV-G)タンパク質をコードする配列を含むベクターでの形質転換用の宿主細胞として用いる。VSV-Gタンパク質の代表的な配列は、SEQ ID NO: 103(GenBankアクセッション番号M35214由来)として提供されている。一部の細胞は、VSV-Gタンパク質に付随する天然シグナルペプチド配列をコードする配列を含んだベクターで形質転換する。他の細胞は、VSV-Gタンパク質が異種シグナルペプチド配列とともに発現されるように、VSV-Gタンパク質をコードする配列に融合されている異なるシグナルペプチド配列(例えば、シゾキトリウム属シグナルアンカー配列のような)をコードする配列を含んだベクターで形質転換する。他の細胞は、VSV-Gタンパク質が異種膜ドメインとともに発現されるように、VSV-Gタンパク質をコードする配列に融合されている異なる膜ドメイン(例えば、HA膜ドメインのような)をコードする配列を含んだベクターで形質転換する。形質転換を行い、本明細書において記載した方法のいずれかにしたがって、冷凍保存ストックを増殖させ繁殖させる。シゾキトリウム属の培養物を50 mLのコニカル試験管に移し入れ、15分間3000×gまたは4500×gで遠心分離して低速上清を得る。低速上清を1時間100,000×gでさらに超遠心分離する。
図3を参照されたい。得られた、VSV-Gタンパク質を含有する不溶性画分のペレットをリン酸緩衝生理食塩水(PBS)に再懸濁し、実施例2に記載のようにペプチド配列分析およびグリコシル化分析に用いる。
【0206】
遺伝子導入シゾキトリウム属由来のVSV-Gタンパク質の発現を、抗VSV-G抗血清および二次抗体を適切な希釈度で用いて、実施例2に記載のように標準的な免疫ブロッティング手順にしたがって免疫ブロット分析により検証する。低速上清および不溶性画分において組み換えVSV-Gタンパク質を検出する。さらに、VSV-Gタンパク質を発現する遺伝子導入シゾキトリウム属由来の無細胞抽出物において、組み換えVSV-Gタンパク質を検出する。
【0207】
シゾキトリウム属において産生されたVSV-Gタンパク質の活性を、VSV-G活性アッセイにより評価する。機能的なVSV-Gタンパク質は、標準的なVSV-G活性アッセイによって容易に検出されるVSV-G活性を示す。
【0208】
実施例4にしたがって作製された陰性染色材料を用い、電子顕微鏡検査を行って、細胞外体の存在を確認する。免疫金標識を行って、細胞外膜体とのタンパク質の結合を確認する。
【0209】
実施例12
シゾキトリウム属において産生されたeGFP融合タンパク質を含む細胞外体の発現および特徴付け
eGFPをコードするポリヌクレオチド配列を含むベクターによるシゾキトリウム種ATCC 20888の形質転換および形質転換されたシゾキトリウム属におけるeGFPの発現が記載されてきた。参照により全体が本明細書に組み入れられる、米国特許出願公開第2010/0233760号およびWO 2010/107709を参照されたい。
【0210】
今後の実験では、例えば、シゾキトリウム属由来の膜ドメインまたはHA膜ドメインのようなウイルス膜ドメインなどの膜ドメインとeGFPとの間に融合タンパク質をコードする配列を含んだベクターによる形質転換用の宿主細胞として、シゾキトリウム種ATCC 20888を用いる。代表的なシゾキトリウム属膜ドメインは
図13および
図14に提供されている。形質転換を行い、冷凍保存ストックを本明細書において記載した方法のいずれかにしたがって増殖させ繁殖させる。シゾキトリウム属の培養物を50 mLのコニカル試験管に移し入れ、15分間3000×gまたは4500×gで遠心分離して低速上清を得る。低速上清を1時間100,000×gでさらに超遠心分離する。
図3を参照されたい。得られた、遺伝子導入シゾキトリウム属由来のeGFP融合タンパク質を含有する不溶性画分のペレットを、リン酸緩衝生理食塩水(PBS)に再懸濁し、実施例2に記載のようにペプチド配列分析およびグリコシル化分析に用いる。
【0211】
遺伝子導入シゾキトリウム属由来のeGFP融合タンパク質の発現を、抗eGFP融合タンパク質抗血清および二次抗体を適切な希釈度で用いて、実施例2に記載のように標準的な免疫ブロッティング手順にしたがって免疫ブロット分析により検証する。低速上清および不溶性画分において、組み換えeGFP融合タンパク質を検出する。さらに、eGFP融合タンパク質を発現する遺伝子導入シゾキトリウム属由来の無細胞抽出物において、組み換えeGFP融合タンパク質を検出する。
【0212】
シゾキトリウム属において産生されたeGFP融合タンパク質の活性を、eGFP融合タンパク質活性アッセイにより評価する。機能的なeGFP融合タンパク質は、標準的なeGFP融合タンパク質活性アッセイによって容易に検出されるeGFP融合タンパク質活性を示す。
【0213】
実施例4にしたがって作製された陰性染色材料を用い、電子顕微鏡検査を行って、細胞外体の存在を確認する。免疫金標識を行って、細胞外膜体とのタンパク質の結合を確認する。
【0214】
実施例13
ヤブレツボカビ科生物の培養物において産生された異種ポリペプチドの検出
適切な発酵条件の下で発酵槽中にて、少なくとも1種の異種ポリペプチドを含むヤブレツボカビ科生物の宿主細胞の培養物を調製する。発酵槽は、例えば、炭素(グルコース)、窒素、リン、塩、微量金属、およびビタミンを含有する培地でバッチ処理する。発酵槽に典型的な種培養物を接種し、その後、70~120時間培養し、炭素(例えば、グルコース)原料を供給する。炭素原料は発酵の間中、供給され消費される。72~120時間後、発酵槽を回収し、ブロスを遠心分離して上清からバイオマスを分離する。
【0215】
BradfordまたはBCAなどの標準的なアッセイ法により、バイオマスおよび無細胞上清についてタンパク質含量を決定する。タンパク質を標準的なSDS-PAGEおよびウエスタンブロッティングによりさらに分析し、各バイオマスおよび無細胞上清画分における異種ポリペプチドの発現について決定する。膜ドメインを含む異種ポリペプチドは、日常の染色手順(例えば、陰性染色および免疫金標識)とその後の電子顕微鏡観察によって微細藻類細胞外体と結び付いていることが示される。
【0216】
実施例14
微細藻類培養物からのウイルス様粒子の調製
1つまたは複数のウイルスエンベロープポリペプチドが、上記の条件下で微細藻類宿主細胞において異種発現され、そのためウイルスポリペプチドは培養条件の下で産生される微細藻類細胞外体に局在化される。適切な培養条件および調節制御要素を用いて過剰発現されると、微細藻類細胞外体におけるウイルスエンベロープポリペプチドは、感染性ウイルスに形態学的に類似している粒子へ自発的に自己組織化する。
【0217】
同様に、1つまたは複数のウイルスエンベロープポリペプチドおよび1つまたは複数のウイルスマトリックスポリペプチドが、上記の条件の下で微細藻類宿主細胞において異種発現され、そのためウイルスポリペプチドは培養条件の下で産生される微細藻類細胞外体に局在化される。適切な培養条件および調節制御要素を用いて過剰発現されると、微細藻類細胞外体におけるウイルスポリペプチドは、感染性ウイルスに形態学的に類似している粒子へ自発的に自己組織化する。
【0218】
本明細書に記載するさまざまな局面、態様および選択肢の全てをありとあらゆるバリエーションで組み合わせることができる。
【0219】
本明細書において言及された全ての刊行物、特許、および特許出願は、各個々の刊行物、特許、または特許出願が参照により組み入れられるよう具体的かつ個別的に示されるのと同じ程度に、参照により本明細書に組み入れられる。
【0220】
配列情報
SEQUENCE LISTING
<110> SANOFI VACCINE TECHNOLOGIES, S.A.S.
<120> Production of Heterologous Polypeptides in Microalgae, Microalgal
Extracellular Bodies, Compositions, and Methods of Making and
Uses Thereof
<150> US 61/413,353
<151> 2010-11-12
<150> US 61/290,469
<151> 2009-12-28
<150> US 61/290,441
<151> 2009-12-28
<160> 103
<170> PatentIn version 3.5
<210> 1
<211> 35
<212> PRT
<213> Schizochytrium
<400> 1
Met Ala Asn Ile Met Ala Asn Val Thr Pro Gln Gly Val Ala Lys Gly
1 5 10 15
Phe Gly Leu Phe Val Gly Val Leu Phe Phe Leu Tyr Trp Phe Leu Val
20 25 30
Gly Leu Ala
35
<210> 2
<211> 105
<212> DNA
<213> Schizochytrium
<400> 2
atggccaaca tcatggccaa cgtcacgccc cagggcgtcg ccaagggctt tggcctcttt 60
gtcggcgtgc tcttctttct ctactggttc cttgtcggcc tcgcc 105
<210> 3
<211> 1999
<212> DNA
<213> Schizochytrium
<400> 3
ccgcgaatca agaaggtagg cgcgctgcga ggcgcggcgg cggagcggag cgagggagag 60
ggagagggag agagagggag ggagacgtcg ccgcggcggg gcctggcctg gcctggtttg 120
gcttggtcag cgcggccttg tccgagcgtg cagctggagt tgggtggatt catttggatt 180
ttcttttgtt tttgtttttc tctctttccc ggaaagtgtt ggccggtcgg tgttctttgt 240
tttgatttct tcaaaagttt tggtggttgg ttctctctct tggctctctg tcaggcggtc 300
cggtccacgc cccggcctct cctctcctct cctctcctct cctctccgtg cgtatacgta 360
cgtacgtttg tatacgtaca tacatcccgc ccgccgtgcc ggcgagggtt tgctcagcct 420
ggagcaatgc gatgcgatgc gatgcgatgc gacgcgacgc gacgcgagtc actggttcgc 480
gctgtggctg tggcttgctt gcttacttgc tttcgagctc tcccgctttc ttctttcctt 540
ctcacgccac caccaacgaa agaagatcgg ccccggcacg ccgctgagaa gggctggcgg 600
cgatgacggc acgcgcgccc gctgccacgt tggcgctcgc tgctgctgct gctgctgctg 660
ctgctgctgc tgctgctgct gctgctgctt ctgcgcgcag gctttgccac gaggccggcg 720
tgctggccgc tgccgcttcc agtccgcgtg gagagatcga atgagagata aactggatgg 780
attcatcgag ggatgaatga acgatggttg gatgcctttt tcctttttca ggtccacagc 840
gggaagcagg agcgcgtgaa tctgccgcca tccgcatacg tctgcatcgc atcgcatcgc 900
atgcacgcat cgctcgccgg gagccacaga cgggcgacag ggcggccagc cagccaggca 960
gccagccagg caggcaccag agggccagag agcgcgcctc acgcacgcgc cgcagtgcgc 1020
gcatcgctcg cagtgcagac cttgattccc cgcgcggatc tccgcgagcc cgaaacgaag 1080
agcgccgtac gggcccatcc tagcgtcgcc tcgcaccgca tcgcatcgca tcgcgttccc 1140
tagagagtag tactcgacga aggcaccatt tccgcgctcc tcttcggcgc gatcgaggcc 1200
cccggcgccg cgacgatcgc ggcggccgcg gcgctggcgg cggccctggc gctcgcgctg 1260
gcggccgccg cgggcgtctg gccctggcgc gcgcgggcgc cgcaggagga gcggcagcgg 1320
ctgctcgccg ccagagaagg agcgcgccgg gcccggggag ggacggggag gagaaggaga 1380
aggcgcgcaa ggcggccccg aaagagaaga ccctggactt gaacgcgaag aagaagaaga 1440
aggagaagaa gttgaagaag aagaagaaga aggagaggaa gttgaagaag acgaggagca 1500
ggcgcgttcc aaggcgcgtt ctcttccgga ggcgcgttcc agctgcggcg gcggggcggg 1560
ctgcggggcg ggcgcgggcg cgggtgcggg cagaggggac gcgcgcgcgg aggcggaggg 1620
ggccgagcgg gagcccctgc tgctgcgggg cgcccgggcc gcaggtgtgg cgcgcgcgac 1680
gacggaggcg acgacgccag cggccgcgac gacaaggccg gcggcgtcgg cgggcggaag 1740
gccccgcgcg gagcaggggc gggagcagga caaggcgcag gagcaggagc agggccggga 1800
gcgggagcgg gagcgggcgg cggagcccga ggcagaaccc aatcgagatc cagagcgagc 1860
agaggccggc cgcgagcccg agcccgcgcc gcagatcact agtaccgctg cggaatcaca 1920
gcagcagcag cagcagcagc agcagcagca gcagcagcag cagccacgag agggagataa 1980
agaaaaagcg gcagagacg 1999
<210> 4
<211> 325
<212> DNA
<213> Schizochytrium
<400> 4
gatccgaaag tgaaccttgt cctaacccga cagcgaatgg cgggaggggg cgggctaaaa 60
gatcgtatta catagtattt ttcccctact ctttgtgttt gtcttttttt ttttttgaac 120
gcattcaagc cacttgtctt ggtttacttg tttgtttgct tgcttgcttg cttgcttgcc 180
tgcttcttgg tcagacggcc caaaaaaggg aaaaaattca ttcatggcac agataagaaa 240
aagaaaaagt ttgtcgacca ccgtcatcag aaagcaagag aagagaaaca ctcgcgctca 300
cattctcgct cgcgtaagaa tctta 325
<210> 5
<211> 372
<212> DNA
<213> Streptoalloteichus hindustanus
<400> 5
atggccaagt tgaccagtgc cgttccggtg ctcaccgcgc gcgacgtcgc cggagcggtc 60
gagttctgga ccgaccggct cgggttctcc cgggacttcg tggaggacga cttcgccggt 120
gtggtccggg acgacgtgac cctgttcatc agcgcggtcc aggaccaggt ggtgccggac 180
aacaccctgg cctgggtgtg ggtgcgcggc ctggacgagc tgtacgccga gtggtcggag 240
gtcgtgtcca cgaacttccg ggacgcctcc gggccggcca tgaccgagat cggcgagcag 300
ccgtgggggc gggagttcgc cctgcgcgac ccggccggca actgcgtgca cttcgtggcc 360
gaggagcagg ac 372
<210> 6
<211> 2055
<212> DNA
<213> Schizochytrium
<400> 6
atgagcgcga cccgcgcggc gacgaggaca gcggcggcgc tgtcctcggc gctgacgacg 60
cctgtaaagc agcagcagca gcagcagctg cgcgtaggcg cggcgtcggc acggctggcg 120
gccgcggcgt tctcgtccgg cacgggcgga gacgcggcca agaaggcggc cgcggcgagg 180
gcgttctcca cgggacgcgg ccccaacgcg acacgcgaga agagctcgct ggccacggtc 240
caggcggcga cggacgatgc gcgcttcgtc ggcctgaccg gcgcccaaat ctttcatgag 300
ctcatgcgcg agcaccaggt ggacaccatc tttggctacc ctggcggcgc cattctgccc 360
gtttttgatg ccatttttga gagtgacgcc ttcaagttca ttctcgctcg ccacgagcag 420
ggcgccggcc acatggccga gggctacgcg cgcgccacgg gcaagcccgg cgttgtcctc 480
gtcacctcgg gccctggagc caccaacacc atcaccccga tcatggatgc ttacatggac 540
ggtacgccgc tgctcgtgtt caccggccag gtgcccacct ctgctgtcgg cacggacgct 600
ttccaggagt gtgacattgt tggcatcagc cgcgcgtgca ccaagtggaa cgtcatggtc 660
aaggacgtga aggagctccc gcgccgcatc aatgaggcct ttgagattgc catgagcggc 720
cgcccgggtc ccgtgctcgt cgatcttcct aaggatgtga ccgccgttga gctcaaggaa 780
atgcccgaca gctcccccca ggttgctgtg cgccagaagc aaaaggtcga gcttttccac 840
aaggagcgca ttggcgctcc tggcacggcc gacttcaagc tcattgccga gatgatcaac 900
cgtgcggagc gacccgtcat ctatgctggc cagggtgtca tgcagagccc gttgaatggc 960
ccggctgtgc tcaaggagtt cgcggagaag gccaacattc ccgtgaccac caccatgcag 1020
ggtctcggcg gctttgacga gcgtagtccc ctctccctca agatgctcgg catgcacggc 1080
tctgcctacg ccaactactc gatgcagaac gccgatctta tcctggcgct cggtgcccgc 1140
tttgatgatc gtgtgacggg ccgcgttgac gcctttgctc cggaggctcg ccgtgccgag 1200
cgcgagggcc gcggtggcat cgttcacttt gagatttccc ccaagaacct ccacaaggtc 1260
gtccagccca ccgtcgcggt cctcggcgac gtggtcgaga acctcgccaa cgtcacgccc 1320
cacgtgcagc gccaggagcg cgagccgtgg tttgcgcaga tcgccgattg gaaggagaag 1380
cacccttttc tgctcgagtc tgttgattcg gacgacaagg ttctcaagcc gcagcaggtc 1440
ctcacggagc ttaacaagca gattctcgag attcaggaga aggacgccga ccaggaggtc 1500
tacatcacca cgggcgtcgg aagccaccag atgcaggcag cgcagttcct tacctggacc 1560
aagccgcgcc agtggatctc ctcgggtggc gccggcacta tgggctacgg ccttccctcg 1620
gccattggcg ccaagattgc caagcccgat gctattgtta ttgacatcga tggtgatgct 1680
tcttattcga tgaccggtat ggaattgatc acagcagccg aattcaaggt tggcgtgaag 1740
attcttcttt tgcagaacaa ctttcagggc atggtcaaga actggcagga tctcttttac 1800
gacaagcgct actcgggcac cgccatgttc aacccgcgct tcgacaaggt cgccgatgcg 1860
atgcgtgcca agggtctcta ctgcgcgaaa cagtcggagc tcaaggacaa gatcaaggag 1920
tttctcgagt acgatgaggg tcccgtcctc ctcgaggttt tcgtggacaa ggacacgctc 1980
gtcttgccca tggtccccgc tggctttccg ctccacgaga tggtcctcga gcctcctaag 2040
cccaaggacg cctaa 2055
<210> 7
<211> 684
<212> PRT
<213> Schizochytrium
<400> 7
Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser
1 5 10 15
Ala Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val
20 25 30
Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr
35 40 45
Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr
50 55 60
Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val
65 70 75 80
Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln
85 90 95
Ile Phe His Glu Leu Met Arg Glu His Gln Val Asp Thr Ile Phe Gly
100 105 110
Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser
115 120 125
Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His
130 135 140
Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu
145 150 155 160
Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp
165 170 175
Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Pro
180 185 190
Thr Ser Ala Val Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly
195 200 205
Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys
210 215 220
Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly
225 230 235 240
Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val
245 250 255
Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln
260 265 270
Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly
275 280 285
Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg
290 295 300
Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asn Gly
305 310 315 320
Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr
325 330 335
Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser
340 345 350
Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met
355 360 365
Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg
370 375 380
Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu
385 390 395 400
Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu Ile Ser Pro Lys Asn
405 410 415
Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val
420 425 430
Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu
435 440 445
Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu
450 455 460
Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val
465 470 475 480
Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala
485 490 495
Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln
500 505 510
Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser
515 520 525
Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala
530 535 540
Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala
545 550 555 560
Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys
565 570 575
Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val
580 585 590
Lys Asn Trp Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala
595 600 605
Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys
610 615 620
Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu
625 630 635 640
Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp
645 650 655
Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His
660 665 670
Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala
675 680
<210> 8
<211> 684
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutated ALS 1
<400> 8
Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser
1 5 10 15
Ala Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val
20 25 30
Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr
35 40 45
Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr
50 55 60
Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val
65 70 75 80
Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln
85 90 95
Ile Phe His Glu Leu Met Arg Glu His Gln Val Asp Thr Ile Phe Gly
100 105 110
Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser
115 120 125
Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His
130 135 140
Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu
145 150 155 160
Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp
165 170 175
Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Pro
180 185 190
Thr Ser Ala Val Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly
195 200 205
Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys
210 215 220
Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly
225 230 235 240
Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val
245 250 255
Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln
260 265 270
Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly
275 280 285
Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg
290 295 300
Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asn Gly
305 310 315 320
Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr
325 330 335
Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser
340 345 350
Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met
355 360 365
Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg
370 375 380
Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu
385 390 395 400
Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu Ile Ser Pro Lys Asn
405 410 415
Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val
420 425 430
Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu
435 440 445
Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu
450 455 460
Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val
465 470 475 480
Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala
485 490 495
Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln
500 505 510
Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser
515 520 525
Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala
530 535 540
Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala
545 550 555 560
Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys
565 570 575
Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val
580 585 590
Lys Asn Val Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala
595 600 605
Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys
610 615 620
Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu
625 630 635 640
Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp
645 650 655
Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His
660 665 670
Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala
675 680
<210> 9
<211> 684
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutated ALS 2
<400> 9
Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser
1 5 10 15
Ala Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val
20 25 30
Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr
35 40 45
Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr
50 55 60
Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val
65 70 75 80
Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln
85 90 95
Ile Phe His Glu Leu Met Arg Glu His Gln Val Asp Thr Ile Phe Gly
100 105 110
Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser
115 120 125
Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His
130 135 140
Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu
145 150 155 160
Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp
165 170 175
Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Gln
180 185 190
Thr Ser Ala Val Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly
195 200 205
Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys
210 215 220
Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly
225 230 235 240
Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val
245 250 255
Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln
260 265 270
Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly
275 280 285
Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg
290 295 300
Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asn Gly
305 310 315 320
Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr
325 330 335
Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser
340 345 350
Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met
355 360 365
Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg
370 375 380
Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu
385 390 395 400
Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu Ile Ser Pro Lys Asn
405 410 415
Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val
420 425 430
Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu
435 440 445
Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu
450 455 460
Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val
465 470 475 480
Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala
485 490 495
Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln
500 505 510
Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser
515 520 525
Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala
530 535 540
Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala
545 550 555 560
Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys
565 570 575
Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val
580 585 590
Lys Asn Trp Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala
595 600 605
Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys
610 615 620
Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu
625 630 635 640
Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp
645 650 655
Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His
660 665 670
Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala
675 680
<210> 10
<211> 684
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutated ALS 3
<400> 10
Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser
1 5 10 15
Ala Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val
20 25 30
Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr
35 40 45
Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr
50 55 60
Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val
65 70 75 80
Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln
85 90 95
Ile Phe His Glu Leu Met Arg Glu His Gln Val Asp Thr Ile Phe Gly
100 105 110
Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser
115 120 125
Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His
130 135 140
Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu
145 150 155 160
Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp
165 170 175
Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Gln
180 185 190
Thr Ser Ala Val Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly
195 200 205
Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys
210 215 220
Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly
225 230 235 240
Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val
245 250 255
Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln
260 265 270
Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly
275 280 285
Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg
290 295 300
Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asn Gly
305 310 315 320
Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr
325 330 335
Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser
340 345 350
Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met
355 360 365
Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg
370 375 380
Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu
385 390 395 400
Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu Ile Ser Pro Lys Asn
405 410 415
Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val
420 425 430
Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu
435 440 445
Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu
450 455 460
Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val
465 470 475 480
Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala
485 490 495
Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln
500 505 510
Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser
515 520 525
Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala
530 535 540
Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala
545 550 555 560
Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys
565 570 575
Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val
580 585 590
Lys Asn Val Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala
595 600 605
Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys
610 615 620
Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu
625 630 635 640
Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp
645 650 655
Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His
660 665 670
Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala
675 680
<210> 11
<211> 2052
<212> DNA
<213> Artificial Sequence
<220>
<223> Mutated ALS 1
<400> 11
atgagcgcga cccgcgcggc gacgaggaca gcggcggcgc tgtcctcggc gctgacgacg 60
cctgtaaagc agcagcagca gcagcagctg cgcgtaggcg cggcgtcggc acggctggcg 120
gccgcggcgt tctcgtccgg cacgggcgga gacgcggcca agaaggcggc cgcggcgagg 180
gcgttctcca cgggacgcgg ccccaacgcg acacgcgaga agagctcgct ggccacggtc 240
caggcggcga cggacgatgc gcgcttcgtc ggcctgaccg gcgcccaaat ctttcatgag 300
ctcatgcgcg agcaccaggt ggacaccatc tttggctacc ctggcggcgc cattctgccc 360
gtttttgatg ccatttttga gagtgacgcc ttcaagttca ttctcgctcg ccacgagcag 420
ggcgccggcc acatggccga gggctacgcg cgcgccacgg gcaagcccgg cgttgtcctc 480
gtcacctcgg gccctggagc caccaacacc atcaccccga tcatggatgc ttacatggac 540
ggtacgccgc tgctcgtgtt caccggccag gtgcccacct ctgctgtcgg cacggacgct 600
ttccaggagt gtgacattgt tggcatcagc cgcgcgtgca ccaagtggaa cgtcatggtc 660
aaggacgtga aggagctccc gcgccgcatc aatgaggcct ttgagattgc catgagcggc 720
cgcccgggtc ccgtgctcgt cgatcttcct aaggatgtga ccgccgttga gctcaaggaa 780
atgcccgaca gctcccccca ggttgctgtg cgccagaagc aaaaggtcga gcttttccac 840
aaggagcgca ttggcgctcc tggcacggcc gacttcaagc tcattgccga gatgatcaac 900
cgtgcggagc gacccgtcat ctatgctggc cagggtgtca tgcagagccc gttgaatggc 960
ccggctgtgc tcaaggagtt cgcggagaag gccaacattc ccgtgaccac caccatgcag 1020
ggtctcggcg gctttgacga gcgtagtccc ctctccctca agatgctcgg catgcacggc 1080
tctgcctacg ccaactactc gatgcagaac gccgatctta tcctggcgct cggtgcccgc 1140
tttgatgatc gtgtgacggg ccgcgttgac gcctttgctc cggaggctcg ccgtgccgag 1200
cgcgagggcc gcggtggcat cgttcacttt gagatttccc ccaagaacct ccacaaggtc 1260
gtccagccca ccgtcgcggt cctcggcgac gtggtcgaga acctcgccaa cgtcacgccc 1320
cacgtgcagc gccaggagcg cgagccgtgg tttgcgcaga tcgccgattg gaaggagaag 1380
cacccttttc tgctcgagtc tgttgattcg gacgacaagg ttctcaagcc gcagcaggtc 1440
ctcacggagc ttaacaagca gattctcgag attcaggaga aggacgccga ccaggaggtc 1500
tacatcacca cgggcgtcgg aagccaccag atgcaggcag cgcagttcct tacctggacc 1560
aagccgcgcc agtggatctc ctcgggtggc gccggcacta tgggctacgg ccttccctcg 1620
gccattggcg ccaagattgc caagcccgat gctattgtta ttgacatcga tggtgatgct 1680
tcttattcga tgaccggtat ggaattgatc acagcagccg aattcaaggt tggcgtgaag 1740
attcttcttt tgcagaacaa ctttcagggc atggtcaaga acgttcagga tctcttttac 1800
gacaagcgct actcgggcac cgccatgttc aacccgcgct tcgacaaggt cgccgatgcg 1860
atgcgtgcca agggtctcta ctgcgcgaaa cagtcggagc tcaaggacaa gatcaaggag 1920
tttctcgagt acgatgaggg tcccgtcctc ctcgaggttt tcgtggacaa ggacacgctc 1980
gtcttgccca tggtccccgc tggctttccg ctccacgaga tggtcctcga gcctcctaag 2040
cccaaggacg cc 2052
<210> 12
<211> 2052
<212> DNA
<213> Artificial Sequence
<220>
<223> Mutated ALS 2
<400> 12
atgagcgcga cccgcgcggc gacgaggaca gcggcggcgc tgtcctcggc gctgacgacg 60
cctgtaaagc agcagcagca gcagcagctg cgcgtaggcg cggcgtcggc acggctggcg 120
gccgcggcgt tctcgtccgg cacgggcgga gacgcggcca agaaggcggc cgcggcgagg 180
gcgttctcca cgggacgcgg ccccaacgcg acacgcgaga agagctcgct ggccacggtc 240
caggcggcga cggacgatgc gcgcttcgtc ggcctgaccg gcgcccaaat ctttcatgag 300
ctcatgcgcg agcaccaggt ggacaccatc tttggctacc ctggcggcgc cattctgccc 360
gtttttgatg ccatttttga gagtgacgcc ttcaagttca ttctcgctcg ccacgagcag 420
ggcgccggcc acatggccga gggctacgcg cgcgccacgg gcaagcccgg cgttgtcctc 480
gtcacctcgg gccctggagc caccaacacc atcaccccga tcatggatgc ttacatggac 540
ggtacgccgc tgctcgtgtt caccggccag gtgcagacct ctgctgtcgg cacggacgct 600
ttccaggagt gtgacattgt tggcatcagc cgcgcgtgca ccaagtggaa cgtcatggtc 660
aaggacgtga aggagctccc gcgccgcatc aatgaggcct ttgagattgc catgagcggc 720
cgcccgggtc ccgtgctcgt cgatcttcct aaggatgtga ccgccgttga gctcaaggaa 780
atgcccgaca gctcccccca ggttgctgtg cgccagaagc aaaaggtcga gcttttccac 840
aaggagcgca ttggcgctcc tggcacggcc gacttcaagc tcattgccga gatgatcaac 900
cgtgcggagc gacccgtcat ctatgctggc cagggtgtca tgcagagccc gttgaatggc 960
ccggctgtgc tcaaggagtt cgcggagaag gccaacattc ccgtgaccac caccatgcag 1020
ggtctcggcg gctttgacga gcgtagtccc ctctccctca agatgctcgg catgcacggc 1080
tctgcctacg ccaactactc gatgcagaac gccgatctta tcctggcgct cggtgcccgc 1140
tttgatgatc gtgtgacggg ccgcgttgac gcctttgctc cggaggctcg ccgtgccgag 1200
cgcgagggcc gcggtggcat cgttcacttt gagatttccc ccaagaacct ccacaaggtc 1260
gtccagccca ccgtcgcggt cctcggcgac gtggtcgaga acctcgccaa cgtcacgccc 1320
cacgtgcagc gccaggagcg cgagccgtgg tttgcgcaga tcgccgattg gaaggagaag 1380
cacccttttc tgctcgagtc tgttgattcg gacgacaagg ttctcaagcc gcagcaggtc 1440
ctcacggagc ttaacaagca gattctcgag attcaggaga aggacgccga ccaggaggtc 1500
tacatcacca cgggcgtcgg aagccaccag atgcaggcag cgcagttcct tacctggacc 1560
aagccgcgcc agtggatctc ctcgggtggc gccggcacta tgggctacgg ccttccctcg 1620
gccattggcg ccaagattgc caagcccgat gctattgtta ttgacatcga tggtgatgct 1680
tcttattcga tgaccggtat ggaattgatc acagcagccg aattcaaggt tggcgtgaag 1740
attcttcttt tgcagaacaa ctttcagggc atggtcaaga actggcagga tctcttttac 1800
gacaagcgct actcgggcac cgccatgttc aacccgcgct tcgacaaggt cgccgatgcg 1860
atgcgtgcca agggtctcta ctgcgcgaaa cagtcggagc tcaaggacaa gatcaaggag 1920
tttctcgagt acgatgaggg tcccgtcctc ctcgaggttt tcgtggacaa ggacacgctc 1980
gtcttgccca tggtccccgc tggctttccg ctccacgaga tggtcctcga gcctcctaag 2040
cccaaggacg cc 2052
<210> 13
<211> 2055
<212> DNA
<213> Artificial Sequence
<220>
<223> Mutated ALS 3
<400> 13
atgagcgcga cccgcgcggc gacgaggaca gcggcggcgc tgtcctcggc gctgacgacg 60
cctgtaaagc agcagcagca gcagcagctg cgcgtaggcg cggcgtcggc acggctggcg 120
gccgcggcgt tctcgtccgg cacgggcgga gacgcggcca agaaggcggc cgcggcgagg 180
gcgttctcca cgggacgcgg ccccaacgcg acacgcgaga agagctcgct ggccacggtc 240
caggcggcga cggacgatgc gcgcttcgtc ggcctgaccg gcgcccaaat ctttcatgag 300
ctcatgcgcg agcaccaggt ggacaccatc tttggctacc ctggcggcgc cattctgccc 360
gtttttgatg ccatttttga gagtgacgcc ttcaagttca ttctcgctcg ccacgagcag 420
ggcgccggcc acatggccga gggctacgcg cgcgccacgg gcaagcccgg cgttgtcctc 480
gtcacctcgg gccctggagc caccaacacc atcaccccga tcatggatgc ttacatggac 540
ggtacgccgc tgctcgtgtt caccggccag gtgcagacct ctgctgtcgg cacggacgct 600
ttccaggagt gtgacattgt tggcatcagc cgcgcgtgca ccaagtggaa cgtcatggtc 660
aaggacgtga aggagctccc gcgccgcatc aatgaggcct ttgagattgc catgagcggc 720
cgcccgggtc ccgtgctcgt cgatcttcct aaggatgtga ccgccgttga gctcaaggaa 780
atgcccgaca gctcccccca ggttgctgtg cgccagaagc aaaaggtcga gcttttccac 840
aaggagcgca ttggcgctcc tggcacggcc gacttcaagc tcattgccga gatgatcaac 900
cgtgcggagc gacccgtcat ctatgctggc cagggtgtca tgcagagccc gttgaatggc 960
ccggctgtgc tcaaggagtt cgcggagaag gccaacattc ccgtgaccac caccatgcag 1020
ggtctcggcg gctttgacga gcgtagtccc ctctccctca agatgctcgg catgcacggc 1080
tctgcctacg ccaactactc gatgcagaac gccgatctta tcctggcgct cggtgcccgc 1140
tttgatgatc gtgtgacggg ccgcgttgac gcctttgctc cggaggctcg ccgtgccgag 1200
cgcgagggcc gcggtggcat cgttcacttt gagatttccc ccaagaacct ccacaaggtc 1260
gtccagccca ccgtcgcggt cctcggcgac gtggtcgaga acctcgccaa cgtcacgccc 1320
cacgtgcagc gccaggagcg cgagccgtgg tttgcgcaga tcgccgattg gaaggagaag 1380
cacccttttc tgctcgagtc tgttgattcg gacgacaagg ttctcaagcc gcagcaggtc 1440
ctcacggagc ttaacaagca gattctcgag attcaggaga aggacgccga ccaggaggtc 1500
tacatcacca cgggcgtcgg aagccaccag atgcaggcag cgcagttcct tacctggacc 1560
aagccgcgcc agtggatctc ctcgggtggc gccggcacta tgggctacgg ccttccctcg 1620
gccattggcg ccaagattgc caagcccgat gctattgtta ttgacatcga tggtgatgct 1680
tcttattcga tgaccggtat ggaattgatc acagcagccg aattcaaggt tggcgtgaag 1740
attcttcttt tgcagaacaa ctttcagggc atggtcaaga acgttcagga tctcttttac 1800
gacaagcgct actcgggcac cgccatgttc aacccgcgct tcgacaaggt cgccgatgcg 1860
atgcgtgcca agggtctcta ctgcgcgaaa cagtcggagc tcaaggacaa gatcaaggag 1920
tttctcgagt acgatgaggg tcccgtcctc ctcgaggttt tcgtggacaa ggacacgctc 1980
gtcttgccca tggtccccgc tggctttccg ctccacgaga tggtcctcga gcctcctaag 2040
cccaaggacg cctaa 2055
<210> 14
<211> 12
<212> DNA
<213> Schizochytrium
<400> 14
cacgacgagt tg 12
<210> 15
<211> 53
<212> PRT
<213> Schizochytrium
<400> 15
Met Ala Asn Ile Met Ala Asn Val Thr Pro Gln Gly Val Ala Lys Gly
1 5 10 15
Phe Gly Leu Phe Val Gly Val Leu Phe Phe Leu Tyr Trp Phe Leu Val
20 25 30
Gly Leu Ala Leu Leu Gly Asp Gly Phe Lys Val Ile Ala Gly Asp Ser
35 40 45
Ala Gly Thr Leu Phe
50
<210> 16
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer S4termF
<400> 16
gatcccatgg cacgtgctac g 21
<210> 17
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer S4termR
<400> 17
ggcaacatgt atgataagat ac 22
<210> 18
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer C2mcsSmaF
<400> 18
gatccccggg ttaagcttgg t 21
<210> 19
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer C2mcsSmaR
<400> 19
actggggccc gtttaaactc 20
<210> 20
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer 5'tubMCS_BglI
<400> 20
gactagatct caattttagg ccccccactg accg 34
<210> 21
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer 3'SV40MCS_Sal
<400> 21
gactgtcgac catgtatgat aagatacatt gatg 34
<210> 22
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer 5'ALSproNde3
<400> 22
gactcatatg gcccaggcct actttcac 28
<210> 23
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer 3'ALStermBglII
<400> 23
gactagatct gggtcaaggc agaagaattc cgcc 34
<210> 24
<211> 97
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer sec.Gfp5'1b
<400> 24
tactggttcc ttgtcggcct cgcccttctc ggcgatggct tcaaggtcat cgccggtgac 60
tccgccggta cgctcttcat ggtgagcaag ggcgagg 97
<210> 25
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer sec.Gfp3'Spe
<400> 25
gatcggtacc ggtgttcttt gttttgattt ct 32
<210> 26
<211> 105
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer sec.Gfp5'Bam
<400> 26
taatggatcc atggccaaca tcatggccaa cgtcacgccc cagggcgtcg ccaagggctt 60
tggcctcttt gtcggcgtgc tcttctttct ctactggttc cttgt 105
<210> 27
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer ss.eGfpHELD3'RV
<400> 27
cctgatatct tacaactcgt cgtggttgta cagctcgtcc 40
<210> 28
<211> 105
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer sec.Gfp5'Bam2
<400> 28
taatggatcc atggccaaca tcatggccaa cgtcacgccc cagggcgtcg ccaagggctt 60
tggcctcttt gtcggcgtgc tcttctttct ctactggttc cttgt 105
<210> 29
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer prREZ15
<400> 29
cggtacccgc gaatcaagaa ggtaggc 27
<210> 30
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer prREZ16
<400> 30
cggatcccgt ctctgccgct ttttctt 27
<210> 31
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer prREZ17
<400> 31
cggatccgaa agtgaacctt gtcctaaccc 30
<210> 32
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer prREZ18
<400> 32
ctctagacag atccgcacca tcggccg 27
<210> 33
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer 5'eGFP_kpn
<400> 33
gactggtacc atggtgaagc aagggcgagg ag 32
<210> 34
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer 3'eGFP_xba
<400> 34
gacttctaga ttacttgtac agctcgtcca tgcc 34
<210> 35
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer 5'ORFCproKpn-2
<400> 35
gatcggtacc ggtgttcttt gttttgattt ct 32
<210> 36
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer 3'ORFCproKpn-2
<400> 36
gatcggtacc gtctctgccg ctttttcttt a 31
<210> 37
<211> 20
<212> PRT
<213> Schizochytrium
<400> 37
Met Lys Phe Ala Thr Ser Val Ala Ile Leu Leu Val Ala Asn Ile Ala
1 5 10 15
Thr Ala Leu Ala
20
<210> 38
<211> 60
<212> DNA
<213> Schizochytrium
<400> 38
atgaagttcg cgacctcggt cgcaattttg cttgtggcca acatagccac cgccctcgcg 60
<210> 39
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer 5'ss-X Bgl long
<400> 39
gactagatct atgaagttcg cgacctcg 28
<210> 40
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer 3'ritx_kap_bh_Bgl
<400> 40
gactagatct tcagcactca ccgcggttaa agg 33
<210> 41
<211> 702
<212> DNA
<213> Artificial Sequence
<220>
<223> Optimized Sec1
<400> 41
atgaagttcg cgacctcggt cgcaattttg cttgtggcca acatagccac cgccctcgcg 60
cagatcgtcc tcagccagtc ccccgccatc ctttccgctt cccccggtga gaaggtgacc 120
atgacctgcc gcgctagctc ctccgtctcg tacatccact ggttccagca gaagcccggc 180
tcgtccccca agccctggat ctacgccacc tccaacctcg cctccggtgt tcccgttcgt 240
ttttccggtt ccggttccgg cacctcctac tccctcacca tctcccgcgt cgaggccgag 300
gatgccgcca cctactactg ccagcagtgg accagcaacc cccccacctt cggcggtggt 360
acgaagctcg agattaagcg caccgtcgcc gccccctccg tcttcatttt tcccccctcc 420
gatgagcagc tcaagtccgg taccgcctcc gtcgtttgcc tcctcaacaa cttctacccc 480
cgtgaggcca aggtccagtg gaaggtcgac aacgcgcttc agtccggtaa ctcccaggag 540
tccgtcaccg agcaggattc gaaggacagc acctactccc tctcctccac cctcaccctc 600
tccaaggccg actacgagaa gcacaaggtc tacgcctgcg aggtcacgca ccagggtctt 660
tcctcccccg tcacgaagtc ctttaaccgc ggtgagtgct ga 702
<210> 42
<211> 853
<212> DNA
<213> Schizochytrium
<400> 42
ctccatcgat cgtgcggtca aaaagaaagg aagaagaaag gaaaaagaaa ggcgtgcgca 60
cccgagtgcg cgctgagcgc ccgctcgcgg ccccgcggag cctccgcgtt agtccccgcc 120
ccgcgccgcg cagtcccccg ggaggcatcg cgcacctctc gccgccccct cgcgcctcgc 180
cgattccccg cctccccttt tccgcttctt cgccgcctcc gctcgcggcc gcgtcgcccg 240
cgccccgctc cctatctgct ccccaggggg gcactccgca ccttttgcgc ccgctgccgc 300
cgccgcggcc gccccgccgc cctggtttcc cccgcgagcg cggccgcgtc gccgcgcaaa 360
gactcgccgc gtgccgcccc gagcaacggg tggcggcggc gcggcggcgg gcggggcgcg 420
gcggcgcgta ggcggggcta ggcgccggct aggcgaaacg ccgcccccgg gcgccgccgc 480
cgcccgctcc agagcagtcg ccgcgccaga ccgccaacgc agagaccgag accgaggtac 540
gtcgcgcccg agcacgccgc gacgcgcggc agggacgagg agcacgacgc cgcgccgcgc 600
cgcgcggggg gggggaggga gaggcaggac gcgggagcga gcgtgcatgt ttccgcgcga 660
gacgacgccg cgcgcgctgg agaggagata aggcgcttgg atcgcgagag ggccagccag 720
gctggaggcg aaaatgggtg gagaggatag tatcttgcgt gcttggacga ggagactgac 780
gaggaggacg gatacgtcga tgatgatgtg cacagagaag aagcagttcg aaagcgacta 840
ctagcaagca agg 853
<210> 43
<211> 1064
<212> DNA
<213> Schizochytrium
<400> 43
ctcttatctg cctcgcgccg ttgaccgccg cttgactctt ggcgcttgcc gctcgcatcc 60
tgcctcgctc gcgcaggcgg gcgggcgagt gggtgggtcc gcagccttcc gcgctcgccc 120
gctagctcgc tcgcgccgtg ctgcagccag cagggcagca ccgcacggca ggcaggtccc 180
ggcgcggatc gatcgatcca tcgatccatc gatccatcga tcgtgcggtc aaaaagaaag 240
gaagaagaaa ggaaaaagaa aggcgtgcgc acccgagtgc gcgctgagcg cccgctcgcg 300
gtcccgcgga gcctccgcgt tagtccccgc cccgcgccgc gcagtccccc gggaggcatc 360
gcgcacctct cgccgccccc tcgcgcctcg ccgattcccc gcctcccctt ttccgcttct 420
tcgccgcctc cgctcgcggc cgcgtcgccc gcgccccgct ccctatctgc tccccagggg 480
ggcactccgc accttttgcg cccgctgccg ccgccgcggc cgccccgccg ccctggtttc 540
ccccgcgagc gcggccgcgt cgccgcgcaa agactcgccg cgtgccgccc cgagcaacgg 600
gtggcggcgg cgcggcggcg ggcggggcgc ggcggcgcgt aggcggggct aggcgccggc 660
taggcgaaac gccgcccccg ggcgccgccg ccgcccgctc cagagcagtc gccgcgccag 720
accgccaacg cagagaccga gaccgaggta cgtcgcgccc gagcacgccg cgacgcgcgg 780
cagggacgag gagcacgacg ccgcgccgcg ccgcgcgggg ggggggaggg agaggcagga 840
cgcgggagcg agcgtgcatg tttccgcgcg agacgacgcc gcgcgcgctg gagaggagat 900
aaggcgcttg gatcgcgaga gggccagcca ggctggaggc gaaaatgggt ggagaggata 960
gtatcttgcg tgcttggacg aggagactga cgaggaggac ggatacgtcg atgatgatgt 1020
gcacagagaa gaagcagttc gaaagcgact actagcaagc aagg 1064
<210> 44
<211> 837
<212> DNA
<213> Schizochytrium
<400> 44
cttcgctttc tcaacctatc tggacagcaa tccgccactt gccttgatcc ccttccgcgc 60
ctcaatcact cgctccacgt ccctcttccc cctcctcatc tccgtgcttt ctctgccccc 120
cccccccccg ccgcggcgtg cgcgcgcgtg gcgccgcggc cgcgacacct tccatactat 180
cctcgctccc aaaatgggtt gcgctatagg gcccggctag gcgaaagtct agcaggcact 240
tgcttggcgc agagccgccg cggccgctcg ttgccgcgga tggagaggga gagagagccc 300
gcctcgataa gcagagacag acagtgcgac tgacagacag acagagagac tggcagaccg 360
gaatacctcg aggtgagtgc ggcgcgggcg agcgggcggg agcgggagcg caagagggac 420
ggcgcggcgc ggcggccctg cgcgacgccg cggcgtattc tcgtgcgcag cgccgagcag 480
cgggacgggc ggctggctga tggttgaagc ggggcggggt gaaatgttag atgagatgat 540
catcgacgac ggtccgtgcg tcttggctgg cttggctggc ttggctggcg ggcctgccgt 600
gtttgcgaga aagaggatga ggagagcgac gaggaaggac gagaagactg acgtgtaggg 660
cgcgcgatgg atgatcgatt gattgattga ttgattggtt gattggctgt gtggtcgatg 720
aacgtgtaga ctcagggagc gtggttaaat tgttcttgcg ccagacgcga ggactccacc 780
cccttctttc gcctttacac agcctttttg tgaagcaaca agaaagaaaa agccaag 837
<210> 45
<211> 1020
<212> DNA
<213> Schizochytrium
<400> 45
ctttttccgc tctgcataat cctaaaagaa agactatacc ctagtcactg tacaaatggg 60
acatttctct cccgagcgat agctaaggat ttttgcttcg tgtgcactgt gtgctctggc 120
cgcgcatcga aagtccagga tcttactgtt tctctttcct ttcctttatt tcctgttctc 180
ttcttcgctt tctcaaccta tctggacagc aatccgccac ttgccttgat ccccttccgc 240
gcctcaatca ctcgctccac gtccctcttc cccctcctca tctccgtgct ttctctcgcc 300
cccccccccc ccgccgcggc gtgcgcgcgc gtggcgccgc ggccgcgaca ccttccatac 360
tatcctcgct cccaaaatgg gttgcgctat agggcccggc taggcgaaag tctagcaggc 420
acttgcttgg cgcagagccg ccgcggccgc tcgttgccgc ggatggagag ggagagagag 480
cccgcctcga taagcagaga cagacagtgc gactgacaga cagacagaga gactggcaga 540
ccggaatacc tcgaggtgag tgcggcgcgg gcgagcgggc gggagcggga gcgcaagagg 600
gacggcgcgg cgcggcggcc ctgcgcgacg ccgcggcgta ttctcgtgcg cagcgccgag 660
cagcgggacg ggcggctggc tgatggttga agcggggcgg ggtgaaatgt tagatgagat 720
gatcatcgac gacggtccgt gcgtcttggc tggcttggct ggcttggctg gcgggcctgc 780
cgtgtttgcg agaaagagga tgaggagagc gacgaggaag gacgagaaga ctgacgtgta 840
gggcgcgcga tggatgatcg attgattgat tgattgattg gttgattggc tgtgtggtcg 900
atgaacgtgt agactcaggg agcgtggtta aattgttctt gcgccagacg cgaggactcc 960
acccccttct ttcgccttta cacagccttt ttgtgaagca acaagaaaga aaaagccaag 1020
<210> 46
<211> 1416
<212> DNA
<213> Schizochytrium
<400> 46
cccgtccttg acgccttcgc ttccggcgcg gccatcgatt caattcaccc atccgatacg 60
ttccgccccc tcacgtccgt ctgcgcacga cccctgcacg accacgccaa ggccaacgcg 120
ccgctcagct cagcttgtcg acgagtcgca cgtcacatat ctcagatgca ttgcctgcct 180
gcctgcctgc ctgcctgcct gcctgcctgc ctgcctgcct cagcctctct ttgctctctc 240
tgcggcggcc gctgcgacgc gctgtacagg agaatgactc caggaagtgc ggctgggata 300
cgcgctggcg tcggccgtga tgcgcgtgac gggcggcggg cacggccggc acgggttgag 360
cagaggacga agcgaggcga gacgagacag gccaggcgcg gggagcgctc gctgccgtga 420
gcagcagacc agggcgcagg aatgtacttt tcttgcggga gcggagacga ggctgccggc 480
tgctggctgc cggttgctct gcacgcgccg cccgacttgg cgtagcgtgg acgcgcggcg 540
gcggccgccg tctcgtcgcg gtcggctttg ccgtgtatcg acgctgcggg cttgacacgg 600
gatggcggaa gttcagcatc gctgcgatcc ctcgcgccgc agaacgagga gagcgcaggc 660
cggcttcaag tttgaaagga gaggaaggca ggcaaggagc tggaagcttg ccgcggaagg 720
cgcaggcatg cgtcacgtga aaaaaaggga tttcaagagt agtaagtagg tatggtctac 780
aagtccccta ttcttacttc gcggaacgtg ggctgctcgt gcgggcgtcc atcttgtttt 840
tgtttttttt tccgctaggc gcgtgcattg cttgatgagt ctcagcgttc gtctgcagcg 900
agggcaggaa aataagcggc ccgtgccgtc gagcgcacag gacgtgcaag cgccttgcga 960
gcgcagcatc cttgcacggc gagcatagag accgcggccg atggactcca gcgaggaatt 1020
ttcgaccctc tctatcaagc tgcgcttgac agccgggaat ggcagcctga ggagagaggg 1080
gcgaaggaag ggacttggag aaaagaggta aggcaccctc aatcacggcg cgtgaaagcc 1140
agtcatccct cgcaaagaaa agacaaaagc gggttttttg tttcgatggg aaagaatttc 1200
ttagaggaag aagcggcaca cagactcgcg ccatgcagat ttctgcgcag ctcgcgatca 1260
aaccaggaac gtggtcgctg cgcgccacta tcaggggtag cgcacgaata ccaaacgcat 1320
tactagctac gcgcctgtga cccgaggatc gggccacaga cgttgtctct tgccatccca 1380
cgacctggca gcgagaagat cgtccattac tcatcg 1416
<210> 47
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer 5'60S-807
<400> 47
tcgatttgcg gatacttgct caca 24
<210> 48
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer 3'60S-2821
<400> 48
gacgacctcg cccttggaca c 21
<210> 49
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer 5'60Sp-1302-Kpn
<400> 49
gactggtacc tttttccgct ctgcataatc ctaa 34
<210> 50
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer 3'60Sp-Bam
<400> 50
gactggatcc ttggcttttt ctttcttgtt gc 32
<210> 51
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer 5'EF1-68
<400> 51
cgccgttgac cgccgcttga ctct 24
<210> 52
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer 3'EF1-2312
<400> 52
cgggggtagc ctcggggatg gact 24
<210> 53
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer 5'EF1-54-Kpn
<400> 53
gactggtacc tcttatctgc ctcgcgccgt tgac 34
<210> 54
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer 5'EF1-1114-Bam
<400> 54
gactggatcc cttgcttgct agtagtcgct ttcgaac 37
<210> 55
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer 5'Sec1P-kpn
<400> 55
gactggtacc ccgtccttga cgccttcgc 29
<210> 56
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer 3'Sec1P-ba
<400> 56
gactggatcc gatgagtaat ggacgatctt c 31
<210> 57
<211> 1614
<212> DNA
<213> Artificial sequence
<220>
<223> Secretion signal
<400> 57
ggatccatga agttcgcgac ctcggtcgca attttgcttg tggccaacat agccaccgcc 60
ctcgcgtcga tgaccaacga gacctcggac cgccctctcg tgcactttac ccccaacaag 120
ggttggatga acgatcccaa cggcctctgg tacgacgaga aggatgctaa gtggcacctt 180
tactttcagt acaaccctaa cgacaccgtc tggggcaccc cgctcttctg gggccacgcc 240
acctccgacg acctcaccaa ctgggaggac cagcccattg ctatcgcccc caagcgcaac 300
gactcgggag ctttttccgg ttccatggtt gtggactaca acaacacctc cggttttttt 360
aacgacacca ttgacccccg ccagcgctgc gtcgccatct ggacctacaa cacgcccgag 420
agcgaggagc agtacatcag ctacagcctt gatggaggct acacctttac cgagtaccag 480
aagaaccctg tcctcgccgc caactccacc cagttccgcg accctaaggt tttttggtac 540
gagccttccc agaagtggat tatgaccgcc gctaagtcgc aggattacaa gatcgagatc 600
tacagcagcg acgacctcaa gtcctggaag cttgagtccg cctttgccaa cgagggtttt 660
ctcggatacc agtacgagtg ccccggtctc atcgaggtcc ccaccgagca ggacccgtcc 720
aagtcctact gggtcatgtt tatttccatc aaccctggcg cccctgccgg cggcagcttc 780
aaccagtact tcgtcggctc ctttaacggc acgcattttg aggccttcga caaccagtcc 840
cgcgtcgtcg acttcggcaa ggactactac gccctccaga ccttctttaa caccgacccc 900
acctacggca gcgccctcgg tattgcttgg gcctccaact gggagtactc cgctttcgtc 960
cccactaacc cctggcgcag ctcgatgtcc ctcgtccgca agttttcgct taacaccgag 1020
taccaggcca accccgagac cgagcttatt aacctgaagg ccgagcctat tctcaacatc 1080
tccaacgctg gcccctggtc ccgctttgct actaacacta ccctcaccaa ggccaactcc 1140
tacaacgtcg atctctccaa ctccaccggt actcttgagt ttgagctcgt ctacgccgtc 1200
aacaccaccc agaccatctc caagtccgtc ttcgccgacc tctccctctg gttcaagggc 1260
cttgaggacc ccgaggagta cctgcgcatg ggttttgagg tctccgcctc ctccttcttc 1320
ctcgatcgcg gtaactccaa ggttaagttt gtcaaggaga acccctactt tactaaccgt 1380
atgagcgtca acaaccagcc ctttaagtcc gagaacgatc ttagctacta caaggtttac 1440
ggcctcctcg accagaacat tctcgagctc tactttaacg acggagatgt cgtcagcacc 1500
aacacctact ttatgaccac tggaaacgcc ctcggcagcg tgaacatgac caccggagtc 1560
gacaacctct tttacattga caagtttcag gttcgcgagg ttaagtaaca tatg 1614
<210> 58
<211> 11495
<212> DNA
<213> Artificial sequence
<220>
<223> pCL0076
<400> 58
ctcttatctg cctcgcgccg ttgaccgccg cttgactctt ggcgcttgcc gctcgcatcc 60
tgcctcgctc gcgcaggcgg gcgggcgagt gggtgggtcc gcagccttcc gcgctcgccc 120
gctagctcgc tcgcgccgtg ctgcagccag cagggcagca ccgcacggca ggcaggtccc 180
ggcgcggatc gatcgatcca tcgatccatc gatccatcga tcgtgcggtc aaaaagaaag 240
gaagaagaaa ggaaaaagaa aggcgtgcgc acccgagtgc gcgctgagcg cccgctcgcg 300
gtcccgcgga gcctccgcgt tagtccccgc cccgcgccgc gcagtccccc gggaggcatc 360
gcgcacctct cgccgccccc tcgcgcctcg ccgattcccc gcctcccctt ttccgcttct 420
tcgccgcctc cgctcgcggc cgcgtcgccc gcgccccgct ccctatctgc tccccagggg 480
ggcactccgc accttttgcg cccgctgccg ccgccgcggc cgccccgccg ccctggtttc 540
ccccgcgagc gcggccgcgt cgccgcgcaa agactcgccg cgtgccgccc cgagcaacgg 600
gtggcggcgg cgcggcggcg ggcggggcgc ggcggcgcgt aggcggggct aggcgccggc 660
taggcgaaac gccgcccccg ggcgccgccg ccgcccgctc cagagcagtc gccgcgccag 720
accgccaacg cagagaccga gaccgaggta cgtcgcgccc gagcacgccg cgacgcgcgg 780
cagggacgag gagcacgacg ccgcgccgcg ccgcgcgggg ggggggaggg agaggcagga 840
cgcgggagcg agcgtgcatg tttccgcgcg agacgacgcc gcgcgcgctg gagaggagat 900
aaggcgcttg gatcgcgaga gggccagcca ggctggaggc gaaaatgggt ggagaggata 960
gtatcttgcg tgcttggacg aggagactga cgaggaggac ggatacgtcg atgatgatgt 1020
gcacagagaa gaagcagttc gaaagcgact actagcaagc aagggatcca tgaagttcgc 1080
gacctcggtc gcaattttgc ttgtggccaa catagccacc gccctcgcgt cgatgaccaa 1140
cgagacctcg gaccgccctc tcgtgcactt tacccccaac aagggttgga tgaacgatcc 1200
caacggcctc tggtacgacg agaaggatgc taagtggcac ctttactttc agtacaaccc 1260
taacgacacc gtctggggca ccccgctctt ctggggccac gccacctccg acgacctcac 1320
caactgggag gaccagccca ttgctatcgc ccccaagcgc aacgactcgg gagctttttc 1380
cggttccatg gttgtggact acaacaacac ctccggtttt tttaacgaca ccattgaccc 1440
ccgccagcgc tgcgtcgcca tctggaccta caacacgccc gagagcgagg agcagtacat 1500
cagctacagc cttgatggag gctacacctt taccgagtac cagaagaacc ctgtcctcgc 1560
cgccaactcc acccagttcc gcgaccctaa ggttttttgg tacgagcctt cccagaagtg 1620
gattatgacc gccgctaagt cgcaggatta caagatcgag atctacagca gcgacgacct 1680
caagtcctgg aagcttgagt ccgcctttgc caacgagggt tttctcggat accagtacga 1740
gtgccccggt ctcatcgagg tccccaccga gcaggacccg tccaagtcct actgggtcat 1800
gtttatttcc atcaaccctg gcgcccctgc cggcggcagc ttcaaccagt acttcgtcgg 1860
ctcctttaac ggcacgcatt ttgaggcctt cgacaaccag tcccgcgtcg tcgacttcgg 1920
caaggactac tacgccctcc agaccttctt taacaccgac cccacctacg gcagcgccct 1980
cggtattgct tgggcctcca actgggagta ctccgctttc gtccccacta acccctggcg 2040
cagctcgatg tccctcgtcc gcaagttttc gcttaacacc gagtaccagg ccaaccccga 2100
gaccgagctt attaacctga aggccgagcc tattctcaac atctccaacg ctggcccctg 2160
gtcccgcttt gctactaaca ctaccctcac caaggccaac tcctacaacg tcgatctctc 2220
caactccacc ggtactcttg agtttgagct cgtctacgcc gtcaacacca cccagaccat 2280
ctccaagtcc gtcttcgccg acctctccct ctggttcaag ggccttgagg accccgagga 2340
gtacctgcgc atgggttttg aggtctccgc ctcctccttc ttcctcgatc gcggtaactc 2400
caaggttaag tttgtcaagg agaaccccta ctttactaac cgtatgagcg tcaacaacca 2460
gccctttaag tccgagaacg atcttagcta ctacaaggtt tacggcctcc tcgaccagaa 2520
cattctcgag ctctacttta acgacggaga tgtcgtcagc accaacacct actttatgac 2580
cactggaaac gccctcggca gcgtgaacat gaccaccgga gtcgacaacc tcttttacat 2640
tgacaagttt caggttcgcg aggttaagta acatatgtta tgagagatcc gaaagtgaac 2700
cttgtcctaa cccgacagcg aatggcggga gggggcgggc taaaagatcg tattacatag 2760
tatttttccc ctactctttg tgtttgtctt tttttttttt ttgaacgcat tcaagccact 2820
tgtctgggtt tacttgtttg tttgcttgct tgcttgcttg cttgcctgct tcttggtcag 2880
acggcccaaa aaagggaaaa aattcattca tggcacagat aagaaaaaga aaaagtttgt 2940
cgaccaccgt catcagaaag caagagaaga gaaacactcg cgctcacatt ctcgctcgcg 3000
taagaatctt agccacgcat acgaagtaat ttgtccatct ggcgaatctt tacatgagcg 3060
ttttcaagct ggagcgtgag atcatacctt tcttgatcgt aatgttccaa ccttgcatag 3120
gcctcgttgc gatccgctag caatgcgtcg tactcccgtt gcaactgcgc catcgcctca 3180
ttgtgacgtg agttcagatt cttctcgaga ccttcgagcg ctgctaattt cgcctgacgc 3240
tccttctttt gtgcttccat gacacgccgc ttcaccgtgc gttccacttc ttcctcagac 3300
atgcccttgg ctgcctcgac ctgctcggta agcttcgtcg taatctcctc gatctcggaa 3360
ttcttcttgc cctccatcca ctcggcacca tacttggcag cctgttcaac acgctcattg 3420
aaaaactttt cattctcttc cagctccgca acccgcgctc gaagctcatt cacttccgcc 3480
accacggctt cggcatcgag cgccgaatca gtcgccgaac tttccgaaag atacaccacg 3540
gcccctccgc tgctgctgcg cagcgtcatc atcagtcgcg tgttatcttc gcgcagattc 3600
tccacctgct ccgtaagcag cttcacggtg gcctcttgat tctgagggct cacgtcgtgg 3660
attagcgctt gcagctcttg cagctccgtc agcttggaag agctcgtaat catggctttg 3720
cacttgtcca gacgtcgcag agcgttcgag agccgcttcg cgttatctgc catggacgct 3780
tctgcgctcg cggcctccct gacgacagtc tcttgcagtt tcactagatc atgtccaatc 3840
agcttgcggt gcagctctcc aatcacgttc tgcatcttgt ttgtgtgtcc gggccgcgcc 3900
tcgtcttgcg atttgcgaat ttcctcctcg agctcgcgtt cgagctccag ggcgccttta 3960
agtagctcga agtcagccgc cgttagcccc agctccgtcg ccgcgttcag acagtcggtt 4020
agcttgattc gattccgctt ttccatggca agtttaagat cctggcccag ctgcacctcc 4080
tgcgccttgc gcatcatgcg cggttccgcc tggcgcaaaa gcttcgagtc gtatcctgcc 4140
tgccatgcca gcgcaatggc acgcacgagc gacttgagtt gccaactatt catcgccgag 4200
atgagcagca ttttgatctg catgaacacc tcgtcagagt cgtcatcctc tgcctcctcc 4260
agctctgcgg gcgagcgacg ctctccttgc agatgaagcg agggccgcag gcctccgaag 4320
agcacctctt gcgcgagatc ctcctccgtc gtcgccctcc gcaggattgc ggtcgtgtcc 4380
gccatcttgc cgccacagca gcttttgctc gctctgcacc ttcaatttct ggtgccgctg 4440
gtgccgctgg tgccgcttgt gctggtgctg gtgctggtgc tggtgctggt gccttgtgct 4500
ggtgctgcca cagacaccgc cgctcctgct gctgctcttc cggccccctc gccgccgccg 4560
cgagcccccg ccgcgcgccg tgcctgggct ctccgcgctc tccgcgggct cctcggcctc 4620
ggcctcgccg tccgcgacga cgtctgcgcg gccgatggtg cggatctgct ctagagggcc 4680
cttcgaaggt aagcctatcc ctaaccctct cctcggtctc gattctacgc gtaccggtca 4740
tcatcaccat caccattgag tttaaacggg ccccagcacg tgctacgaga tttcgattcc 4800
accgccgcct tctatgaaag gttgggcttc ggaatcgttt tccgggacgc cggctggatg 4860
atcctccagc gcggggatct catgctggag ttcttcgccc accccaactt gtttattgca 4920
gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt 4980
tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tacatggtcg 5040
acctgcagga acctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt 5100
gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga 5160
gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca 5220
ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg 5280
ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt 5340
cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc 5400
ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct 5460
tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc 5520
gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta 5580
tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca 5640
gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag 5700
tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag 5760
ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt 5820
agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa 5880
gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg 5940
attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga 6000
agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta 6060
atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc 6120
cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg 6180
ataccgcgag acccacgctc accggctcca gatttatcag caataaacca gccagccgga 6240
agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt 6300
tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt 6360
gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc 6420
caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc 6480
ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca 6540
gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag 6600
tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg 6660
tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa 6720
cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa 6780
cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga 6840
gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga 6900
atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg 6960
agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt 7020
ccccgaaaag tgccacctga cgtctaagaa accattatta tcatgacatt aacctataaa 7080
aataggcgta tcacgaggcc ctttcgtctc gcgcgtttcg gtgatgacgg tgaaaacctc 7140
tgacacatgc agctcccgga gacggtcaca gcttgtctgt aagcggatgc cgggagcaga 7200
caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc ggggctggct taactatgcg 7260
gcatcagagc agattgtact gagagtgcac caagctttgc ctcaacgcaa ctaggcccag 7320
gcctactttc actgtgtctt gtcttgcctt tcacaccgac cgagtgtgca caaccgtgtt 7380
ttgcacaaag cgcaagatgc tcactcgact gtgaagcaaa ggttgcgcgc aagcgactgc 7440
gactgcgagg atgaggatga ctggcagcct gttcaaaaac tgaaaatccg cgatgggtca 7500
gctgccattc gcgcatgacg cctgcgagag acaagttaac tcgtgtcact ggcatgtcct 7560
agcatcttta cgcgagcaaa attcaatcgc tttatttttt cagtttcgta accttctcgc 7620
aaccgcgaat cgccgtttca gcctgactaa tctgcagctg cgtggcactg tcagtcagtc 7680
agtcagtcgt gcgcgctgtt ccagcaccga ggtcgcgcgt cgccgcgcct ggaccgctgc 7740
tgctactgct agtggcacgg caggtaggag cttgttgccg gaacaccagc agccgccagt 7800
cgacgccagc caggggaaag tccggcgtcg aagggagagg aaggcggcgt gtgcaaacta 7860
acgttgacca ctggcgcccg ccgacacgag caggaagcag gcagctgcag agcgcagcgc 7920
gcaagtgcag aatgcgcgaa agatccactt gcgcgcggcg ggcgcgcact tgcgggcgcg 7980
gcgcggaaca gtgcggaaag gagcggtgca gacggcgcgc agtgacagtg ggcgcaaagc 8040
cgcgcagtaa gcagcggcgg ggaacggtat acgcagtgcc gcgggccgcc gcacacagaa 8100
gtatacgcgg gccgaagtgg ggcgtcgcgc gcgggaagtg cggaatggcg ggcaaggaaa 8160
ggaggagacg gaaagagggc gggaaagaga gagagagaga gtgaaaaaag aaagaaagaa 8220
agaaagaaag aaagaaagct cggagccacg ccgcggggag agagagaaat gaaagcacgg 8280
cacggcaaag caaagcaaag cagacccagc cagacccagc cgagggagga gcgcgcgcag 8340
gacccgcgcg gcgagcgagc gagcacggcg cgcgagcgag cgagcgagcg agcgcgcgag 8400
cgagcaaggc ttgctgcgag cgatcgagcg agcgagcggg aaggatgagc gcgacccgcg 8460
cggcgacgag gacagcggcg gcgctgtcct cggcgctgac gacgcctgta aagcagcagc 8520
agcagcagca gctgcgcgta ggcgcggcgt cggcacggct ggcggccgcg gcgttctcgt 8580
ccggcacggg cggagacgcg gccaagaagg cggccgcggc gagggcgttc tccacgggac 8640
gcggccccaa cgcgacacgc gagaagagct cgctggccac ggtccaggcg gcgacggacg 8700
atgcgcgctt cgtcggcctg accggcgccc aaatctttca tgagctcatg cgcgagcacc 8760
aggtggacac catctttggc taccctggcg gcgccattct gcccgttttt gatgccattt 8820
ttgagagtga cgcgcttcaa gttcattctc gctcgccacg agcagggcgc cggccacatg 8880
gccgagggct acgcgcgcgc cacgggcaag cccggcgttg tcctcgtcac ctcgggccct 8940
ggagccacca acaccatcac cccgatcatg gatgcttaca tggacggtac gccgctgctc 9000
gtgttcaccg gccaggtgca gacctctgct gtcggcacgg acgctttcca ggagtgtgac 9060
attgttggca tcagccgcgc gtgcaccaag tggaacgtca tggtcaagga cgtgaaggag 9120
ctcccgcgcc gcatcaatga ggcctttgag attgccatga gcggccgccc gggtcccgtg 9180
ctcgtcgatc ttcctaagga tgtgaccgcc gttgagctca aggaaatgcc cgacagctcc 9240
ccccaggttg ctgtgcgcca gaagcaaaag gtcgagcttt tccacaagga gcgcattggc 9300
gctcctggca cggccgactt caagctcatt gccgagatga tcaaccgtgc ggagcgaccc 9360
gtcatctatg ctggccaggg tgtcatgcag agcccgttga atggcccggc tgtgctcaag 9420
gagttcgcgg agaaggccaa cattcccgtg accaccacca tgcagggtct cggcggcttt 9480
gacgagcgta gtcccctctc cctcaagatg ctcggcatgc acggctctgc ctacgccaac 9540
tactcgatgc agaacgccga tcttatcctg gcgctcggtg cccgctttga tgatcgtgtg 9600
acgggccgcg ttgacgcctt tgctccggag gctcgccgtg ccgagcgcga gggccgcggt 9660
ggcatcgttc actttgagat ttcccccaag aacctccaca aggtcgtcca gcccaccgtc 9720
gcggtcctcg gcgacgtggt cgagaacctc gccaacgtca cgccccacgt gcagcgccag 9780
gagcgcgagc cgtggtttgc gcagatcgcc gattggaagg agaagcaccc ttttctgctc 9840
gagtctgttg attcggacga caaggttctc aagccgcagc aggtcctcac ggagcttaac 9900
aagcagattc tcgagattca ggagaaggac gccgaccagg aggtctacat caccacgggc 9960
gtcggaagcc accagatgca ggcagcgcag ttccttacct ggaccaagcc gcgccagtgg 10020
atctcctcgg gtggcgccgg cactatgggc tacggccttc cctcggccat tggcgccaag 10080
attgccaagc ccgatgctat tgttattgac atcgatggtg atgcttctta ttcgatgacc 10140
ggtatggaat tgatcacagc agccgaattc aaggttggcg tgaagattct tcttttgcag 10200
aacaactttc agggcatggt caagaacgtt caggatctct tttacgacaa gcgctactcg 10260
ggccaccgcc atgttcaacc cgcgcttcga caaggtcgcc gatgcgatgc gtgccaaggg 10320
tctctactgc gcgaaacagt cggagctcaa ggacaagatc aaggagtttc tcgagtacga 10380
tgagggtccc gtcctcctcg aggttttcgt ggacaaggac acgctcgtct tgcccatggt 10440
ccccgctggc tttccgctcc acgagatggt cctcgagcct cctaagccca aggacgccta 10500
agttcttttt tccatggcgg gcgagcgagc gagcgcgcga gcgcgcaagt gcgcaagcgc 10560
cttgccttgc tttgcttcgc ttcgctttgc tttgcttcac acaacctaag tatgaattca 10620
agttttcttg cttgtcggcg atgcctgcct gccaaccagc cagccatccg gccggccgtc 10680
cttgacgcct tcgcttccgg cgcggccatc gattcaattc acccatccga tacgttccgc 10740
cccctcacgt ccgtctgcgc acgacccctg cacgaccacg ccaaggccaa cgcgccgctc 10800
agctcagctt gtcgacgagt cgcacgtcac atatctcaga tgcatttgga ctgtgagtgt 10860
tattatgcca ctagcacgca acgatcttcg gggtcctcgc tcattgcatc cgttcgggcc 10920
ctgcaggcgt ggacgcgagt cgccgccgag acgctgcagc aggccgctcc gacgcgaggg 10980
ctcgagctcg ccgcgcccgc gcgatgtctg cctggcgccg actgatctct ggagcgcaag 11040
gaagacacgg cgacgcgagg aggaccgaag agagacgctg gggtatgcag gatatacccg 11100
gggcgggaca ttcgttccgc atacactccc ccattcgagc ttgctcgtcc ttggcagagc 11160
cgagcgcgaa cggttccgaa cgcggcaagg attttggctc tggtgggtgg actccgatcg 11220
aggcgcaggt tctccgcagg ttctcgcagg ccggcagtgg tcgttagaaa tagggagtgc 11280
cggagtcttg acgcgcctta gctcactctc cgcccacgcg cgcatcgccg ccatgccgcc 11340
gtcccgtctg tcgctgcgct ggccgcgacc ggctgcgcca gagtacgaca gtgggacaga 11400
gctcgaggcg acgcgaatcg ctcgggttgt aagggtttca agggtcgggc gtcgtcgcgt 11460
gccaaagtga aaatagtagg gggggggggg ggtac 11495
<210> 59
<211> 32
<212> PRT
<213> Schizochytrium
<400> 59
Met Arg Thr Val Arg Gly Pro Gln Thr Ala Ala Leu Ala Ala Leu Leu
1 5 10 15
Ala Leu Ala Ala Thr His Val Ala Val Ser Pro Phe Thr Lys Val Glu
20 25 30
<210> 60
<211> 96
<212> DNA
<213> Schizochytrium
<400> 60
atgcgcacgg tgagggggcc gcaaacggcg gcactcgccg cccttctggc acttgccgcg 60
acgcacgtgg ctgtgagccc gttcaccaag gtggag 96
<210> 61
<211> 30
<212> PRT
<213> Schizochytrium
<400> 61
Met Gly Arg Leu Ala Lys Ser Leu Val Leu Leu Thr Ala Val Leu Ala
1 5 10 15
Val Ile Gly Gly Val Arg Ala Glu Glu Asp Lys Ser Glu Ala
20 25 30
<210> 62
<211> 90
<212> DNA
<213> Schizochytrium
<400> 62
atgggccgcc tcgcgaagtc gcttgtgctg ctgacggccg tgctggccgt gatcggaggc 60
gtccgcgccg aagaggacaa gtccgaggcc 90
<210> 63
<211> 38
<212> PRT
<213> Schizochytrium
<400> 63
Met Thr Ser Thr Ala Arg Ala Leu Ala Leu Val Arg Ala Leu Val Leu
1 5 10 15
Ala Leu Ala Val Leu Ala Leu Leu Ala Ser Gln Ser Val Ala Val Asp
20 25 30
Arg Lys Lys Phe Arg Thr
35
<210> 64
<211> 114
<212> DNA
<213> Schizochytrium
<400> 64
atgacgtcaa cggcgcgcgc gctcgcgctc gtgcgtgctt tggtgctcgc tctggctgtc 60
ttggcgctgc tagcgagcca aagcgtggcc gtggaccgca aaaagttcag gacc 114
<210> 65
<211> 34
<212> PRT
<213> Schizochytrium
<400> 65
Met Leu Arg Leu Lys Pro Leu Leu Leu Leu Phe Leu Cys Ser Leu Ile
1 5 10 15
Ala Ser Pro Val Val Ala Trp Ala Arg Gly Gly Glu Gly Pro Ser Thr
20 25 30
Ser Glu
<210> 66
<211> 102
<212> DNA
<213> Schizochytrium
<400> 66
atgttgcggc tcaagccact tttactcctc ttcctctgct cgttgattgc ttcgcctgtg 60
gttgcctggg caagaggagg agaagggccg tccacgagcg aa 102
<210> 67
<211> 29
<212> PRT
<213> Schizochytrium
<400> 67
Met Ala Lys Ile Leu Arg Ser Leu Leu Leu Ala Ala Val Leu Val Val
1 5 10 15
Thr Pro Gln Ser Leu Arg Ala His Ser Thr Arg Asp Ala
20 25
<210> 68
<211> 87
<212> DNA
<213> Schizochytrium
<400> 68
atggccaaga tcttgcgcag tttgctcctg gcggccgtgc tcgtggtgac tcctcaatca 60
ctgcgtgctc attcgacgcg ggacgca 87
<210> 69
<211> 36
<212> PRT
<213> Schizochytrium
<400> 69
Met Val Phe Arg Arg Val Pro Trp His Gly Ala Ala Thr Leu Ala Ala
1 5 10 15
Leu Val Val Ala Cys Ala Thr Cys Leu Gly Leu Gly Leu Asp Ser Glu
20 25 30
Glu Ala Thr Tyr
35
<210> 70
<211> 108
<212> DNA
<213> Schizochytrium
<400> 70
atggtgtttc ggcgcgtgcc atggcacggc gcggcgacgc tggcggcctt ggtcgtggcc 60
tgcgcgacgt gtttaggcct gggactggac tcggaggagg ccacgtac 108
<210> 71
<211> 30
<212> PRT
<213> Schizochytrium
<400> 71
Met Thr Ala Asn Ser Val Lys Ile Ser Ile Val Ala Val Leu Val Ala
1 5 10 15
Ala Leu Ala Trp Glu Thr Cys Ala Lys Ala Asn Tyr Gln Trp
20 25 30
<210> 72
<211> 90
<212> DNA
<213> Schizochytrium
<400> 72
atgacagcta actcggtgaa aataagcatc gtggctgtgc tggtcgcggc actggcttgg 60
gaaacatgcg caaaagctaa ctatcagtgg 90
<210> 73
<211> 35
<212> PRT
<213> Schizochytrium
<400> 73
Met Ala Arg Arg Ala Ser Arg Leu Gly Ala Ala Val Val Val Val Leu
1 5 10 15
Val Val Val Ala Ser Ala Cys Cys Trp Gln Ala Ala Ala Asp Val Val
20 25 30
Asp Ala Gln
35
<210> 74
<211> 105
<212> DNA
<213> Schizochytrium
<400> 74
atggcgcgca gggcgtcgcg cctcggcgcc gccgtcgtcg tcgtcctcgt cgtcgtcgcc 60
tccgcctgct gctggcaagc cgctgcggac gtcgtggacg cgcag 105
<210> 75
<211> 1785
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimized nucleic acid sequence
<400> 75
atgaagttcg cgacctcggt cgcaattttg cttgtggcca acatagccac cgccctcgcg 60
gcctccccct cgatgcagac ccgtgcctcc gtcgtcattg attacaacgt cgctcctcct 120
aacctctcca ccctcccgaa cggcagcctc tttgagacct ggcgtcctcg cgcccacgtt 180
cttcccccta acggtcagat tggcgatccc tgcctccact acaccgatcc ctcgactggc 240
ctctttcacg tcggctttct ccacgatggc tccggcattt cctccgccac tactgacgac 300
ctcgctacct acaaggatct caaccagggc aaccaggtca tcgtccccgg cggtatcaac 360
gaccctgtcg ctgttttcga cggctccgtc attccttccg gcattaacgg cctccctacc 420
ctcctctaca cctccgtcag ctacctcccc attcactggt ccatccccta cacccgcggt 480
tccgagacgc agagcctggc tgtctccagc gatggtggct ccaactttac taagctcgac 540
cagggccccg ttattcctgg cccccccttt gcctacaacg tcaccgcctt ccgcgacccc 600
tacgtctttc agaaccccac cctcgactcc ctcctccact ccaagaacaa cacctggtac 660
accgtcattt cgggtggcct ccacggcaag ggccccgccc agtttcttta ccgtcagtac 720
gaccccgact ttcagtactg ggagttcctc ggccagtggt ggcacgagcc taccaactcc 780
acctggggca acggcacctg ggccggccgc tgggccttca acttcgagac cggcaacgtc 840
ttttcgcttg acgagtacgg ctacaacccc cacggccaga tcttctccac cattggcacc 900
gagggctccg accagcccgt tgtcccccag ctcacctcca tccacgatat gctttgggtc 960
tccggtaacg tttcgcgcaa cggatcggtt tccttcactc ccaacatggc cggcttcctc 1020
gactggggtt tctcgtccta cgccgccgcg ggtaaggttc ttccttccac gtcgctcccc 1080
tccaccaagt ccggtgcccc cgatcgcttc atttcgtacg tttggctctc cggcgacctc 1140
tttgagcagg ctgagggctt tcctaccaac cagcagaact ggaccggcac cctcctcctc 1200
ccccgtgagc tccgcgtcct ttacatcccc aacgtggttg ataacgccct tgcgcgcgag 1260
tccggcgctt cctggcaggt cgtctcctcc gatagctcgg ccggtactgt ggagctccag 1320
accctcggca tttccatcgc ccgcgagacc aaggccgccc tcctgtccgg cacctcgttc 1380
actgagtccg accgcactct taactcctcc ggcgtcgttc cctttaagcg ttccccctcc 1440
gagaagtttt tcgtcctctc cgcccagctc tccttccccg cctccgcccg cggctcgggc 1500
ctcaagtccg gcttccagat tctttcctcc gagctcgagt ccaccacggt ctactaccag 1560
tttagcaacg agtccatcat cgtcgaccgc agcaacacca gcgccgccgc ccgtactacc 1620
gacggtatcg actcctccgc cgaggccggc aagctccgcc tctttgacgt cctcaacggc 1680
ggcgagcagg ctattgagac cctcgacctt accctcgtcg ttgataactc cgtgctcgag 1740
atttacgcca acggtcgttt cgcgctttcc acctgggttc gctaa 1785
<210> 76
<211> 1682
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon Optimized HA
<400> 76
atgaaggcta acctcctcgt tcttctttcc gctctcgctg ctgcggatgc cgacaccatc 60
tgcattggct accacgctaa caacagcacg gacaccgtcg atactgtcct ggagaagaac 120
gttaccgcac ccattcggtc aacctcctgg aggacagcca caacggcaag ctctgccgtc 180
ttaagggcat cgcccccctc cagctcggca agtgcaacat cgccggctgg ctcctcggca 240
acccggagtg cgatccctcc tccccgttcg ctcctggtcg tacattgtgg agactccgaa 300
cagcgagaac ggtatctgct accccggcga ttttatcgac tacgaggagc tccgcgagca 360
gctctcctcc gtgtccagct tgagcgtttc gagatttttc cgaaggagtc ctcgtggccc 420
aaccacaaca ccaacggcgt caccgccgcc tgctcccacg agggcaagtc gagcttttac 480
cgcaacctgc tttggctcac cgagaagggg gttcgtaccc taagctcaag aactcgtacg 540
tcaacaagaa gggcaaggag gtcctcgtcc tctggggcat ccaccatccc ccgaacagca 600
aggagcagca gaacatctac cagaacgaga acgccacgtt tcggtggtca cgtcgaacta 660
caaccgccgc ttcactcctg agatcgccga gcgccccaag gtgcgcgacc aggctggccg 720
catgaactac tactggaccc tccttaagcc cggtgacacg atatctttga ggccaacggc 780
aaccttatcg cgcccatgta cgcgttcgcc ctctcccgcg gctttggtag cggcatcatt 840
accagcaacg ccagcatgca cgagtgcaac acgaagtgcc agaccccgcc ggtgccatca 900
acagcagcct gccttaccag aacatccacc ccgtcaccat cggtgagtgc ccgaagtacg 960
tgcgctcggc caagctccgc atggtcacgg gcctccgcaa cactccttcg atccagcccg 1020
cggcctcttc ggcgccattg ccggtttcat cgagggcggc tggacgggca tgatcgacgg 1080
ctggtacggc taccaccacc agaacgagca gggctccggt tacgccgcgg accagaagtc 1140
caccagaacg ccatcaacgg cattactaac aaggtcaaca cggtcatcga gaagatgaac 1200
attcagttta ccgctgtcgg caaggagttc aacaagctgg agaagcgcat ggagaacctc 1260
aacaagaagg ggacgatggt ttcctggaca tttggaccta caacgccgag ctcctcgtgc 1320
tccttgagaa cgagcgtacc ctcgacttcc acgactccaa cgtcaagaac ctctacgaga 1380
aggtcaagtc gcagctcaga acaacgccaa ggagattggc aacggttgct tcgagtttta 1440
ccacaagtgc gacaacgagt gcatggagtc cgtccgcaac ggcacctacg actacccgaa 1500
gtactccgag gagtcgaagc tgaacgcgag aaggtggacg gcgtgaagct ggagtccatg 1560
ggcatctacc agatcctcgc catttactcg acggttgcct cgtcgctcgt cctccttgtc 1620
tccctcggtg cgatttcgtt ctggatgtgc tgaacggcag ccttcagtgc cgcatctgca 1680
tc 1682
<210> 77
<211> 565
<212> PRT
<213> Influenza A virus
<400> 77
Met Lys Ala Asn Leu Leu Val Leu Leu Ser Ala Leu Ala Ala Ala Asp
1 5 10 15
Ala Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr
20 25 30
Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn
35 40 45
Leu Leu Glu Asp Ser His Asn Gly Lys Leu Cys Arg Leu Lys Gly Ile
50 55 60
Ala Pro Leu Gln Leu Gly Lys Cys Asn Ile Ala Gly Trp Leu Leu Gly
65 70 75 80
Asn Pro Glu Cys Asp Pro Leu Leu Pro Val Arg Ser Trp Ser Tyr Ile
85 90 95
Val Glu Thr Pro Asn Ser Glu Asn Gly Ile Cys Tyr Pro Gly Asp Phe
100 105 110
Ile Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe
115 120 125
Glu Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Asn
130 135 140
Thr Asn Gly Val Thr Ala Ala Cys Ser His Glu Gly Lys Ser Ser Phe
145 150 155 160
Tyr Arg Asn Leu Leu Trp Leu Thr Glu Lys Glu Gly Ser Tyr Pro Lys
165 170 175
Leu Lys Asn Ser Tyr Val Asn Lys Lys Gly Lys Glu Val Leu Val Leu
180 185 190
Trp Gly Ile His His Pro Pro Asn Ser Lys Glu Gln Gln Asn Ile Tyr
195 200 205
Gln Asn Glu Asn Ala Tyr Val Ser Val Val Thr Ser Asn Tyr Asn Arg
210 215 220
Arg Phe Thr Pro Glu Ile Ala Glu Arg Pro Lys Val Arg Asp Gln Ala
225 230 235 240
Gly Arg Met Asn Tyr Tyr Trp Thr Leu Leu Lys Pro Gly Asp Thr Ile
245 250 255
Ile Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Met Tyr Ala Phe Ala
260 265 270
Leu Ser Arg Gly Phe Gly Ser Gly Ile Ile Thr Ser Asn Ala Ser Met
275 280 285
His Glu Cys Asn Thr Lys Cys Gln Thr Pro Leu Gly Ala Ile Asn Ser
290 295 300
Ser Leu Pro Tyr Gln Asn Ile His Pro Val Thr Ile Gly Glu Cys Pro
305 310 315 320
Lys Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn
325 330 335
Thr Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe
340 345 350
Ile Glu Gly Gly Trp Thr Gly Met Ile Asp Gly Trp Tyr Gly Tyr His
355 360 365
His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr
370 375 380
Gln Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Thr Val Ile Glu
385 390 395 400
Lys Met Asn Ile Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu
405 410 415
Glu Lys Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu
420 425 430
Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu
435 440 445
Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys
450 455 460
Val Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys
465 470 475 480
Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu Ser Val Arg
485 490 495
Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn
500 505 510
Arg Glu Lys Val Asp Gly Val Lys Leu Glu Ser Met Gly Ile Tyr Gln
515 520 525
Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val
530 535 540
Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln
545 550 555 560
Cys Arg Ile Cys Ile
565
<210> 78
<211> 51
<212> PRT
<213> Schizochytrium
<220>
<223> GlcNac-transferase-I-like protein
<400> 78
Met Arg Gly Pro Gly Met Val Gly Leu Ser Arg Val Asp Arg Glu His
1 5 10 15
Leu Arg Arg Arg Gln Gln Gln Ala Ala Ser Glu Trp Arg Arg Trp Gly
20 25 30
Phe Phe Val Ala Thr Ala Val Val Leu Leu Val Phe Leu Thr Val Tyr
35 40 45
Pro Asn Val
50
<210> 79
<211> 153
<212> DNA
<213> Schizochytrium
<220>
<223> signal anchor sequence
<400> 79
atgcgcggcc cgggcatggt cggcctcagc cgcgtggacc gcgagcacct gcggcggcgg 60
cagcagcagg cggcgagcga atggcggcgc tgggggttct tcgtcgcgac ggccgtcgtc 120
ctgctcgtct ttctcaccgt atacccgaac gta 153
<210> 80
<211> 66
<212> PRT
<213> Schizochytrium
<220>
<223> beta-1,2- xylosyltransferase-like protein
<400> 80
Met Arg Thr Arg Gly Ala Ala Tyr Val Arg Pro Gly Gln His Glu Ala
1 5 10 15
Lys Ala Leu Ser Ser Arg Ser Ser Asp Glu Gly Tyr Thr Thr Val Asn
20 25 30
Val Val Arg Thr Lys Arg Lys Arg Thr Thr Val Ala Ala Leu Val Ala
35 40 45
Ala Ala Leu Leu Val Thr Gly Phe Ile Val Val Val Val Phe Val Val
50 55 60
Val Val
65
<210> 81
<211> 198
<212> DNA
<213> Schizochytrium
<220>
<223> signal anchor sequence
<400> 81
atgcgcacgc ggggcgcggc gtacgtgcgg ccgggacagc acgaggcgaa ggcgctctcg 60
tcaaggagca gcgacgaggg atatacgacg gtcaacgttg tcaggaccaa gcgaaagagg 120
accactgtag ccgcgcttgt agccgcggcg ctgctggtga cgggctttat cgtcgtcgtc 180
gtcttcgtcg tcgttgtt 198
<210> 82
<211> 64
<212> PRT
<213> Schizochytrium
<220>
<223> beta-1,4-xylosidase-like protein
<400> 82
Met Glu Ala Leu Arg Glu Pro Leu Ala Ala Pro Pro Thr Ser Ala Arg
1 5 10 15
Ser Ser Val Pro Ala Pro Leu Ala Lys Glu Glu Gly Glu Glu Glu Asp
20 25 30
Gly Glu Lys Gly Thr Phe Gly Ala Gly Val Leu Gly Val Val Ala Val
35 40 45
Leu Val Ile Val Val Phe Ala Ile Val Ala Gly Gly Gly Gly Asp Ile
50 55 60
<210> 83
<211> 192
<212> DNA
<213> Schizochytrium
<220>
<223> signal anchor sequence
<400> 83
atggaggccc tgcgcgagcc cttggctgcg ccgccaacgt cggcgcgatc gtcggtgcca 60
gcgccgctcg cgaaggagga gggggaggag gaggacgggg aaaaagggac gtttggggcg 120
ggggtcctcg gtgtcgtggc ggtgctcgtc atcgtggtgt ttgcgatcgt ggcgggaggc 180
ggaggcgata tt 192
<210> 84
<211> 73
<212> PRT
<213> Schizochytrium
<220>
<223> galactosyltransferase-like protein
<400> 84
Met Leu Ser Val Ala Gln Val Ala Gly Ser Ala His Ser Arg Pro Arg
1 5 10 15
Arg Gly Gly Glu Arg Met Gln Asp Val Leu Ala Leu Glu Glu Ser Ser
20 25 30
Arg Asp Arg Lys Arg Ala Thr Ala Arg Pro Gly Leu Tyr Arg Ala Leu
35 40 45
Ala Ile Leu Gly Leu Pro Leu Ile Val Phe Ile Val Trp Gln Met Thr
50 55 60
Ser Ser Leu Thr Thr Ala Pro Ser Ala
65 70
<210> 85
<211> 219
<212> DNA
<213> Schizochytrium
<220>
<223> signal anchor sequence
<400> 85
atgttgagcg tagcacaagt cgcggggtcg gcccactcgc ggccgagacg aggtggtgag 60
cggatgcaag acgtgctggc cctggaggaa agcagcagag atcgaaaacg agcaacagca 120
aggcccgggc tatatcgcgc acttgcgatt ctggggctgc cgctcatcgt attcatcgta 180
tggcaaatga ctagctccct cacgactgcc ccgagcgcc 219
<210> 86
<211> 997
<212> PRT
<213> Schizochytrium
<220>
<223> EMC1
<400> 86
Met Gly Thr Thr Thr Ala Arg Met Ala Val Ala Val Leu Ala Ala Ala
1 5 10 15
Val Ser Val Ala His Gly Leu His Glu Asp Gln Ala Gly Val Asn Asp
20 25 30
Trp Thr Val Arg Asn Leu Gly Ala Tyr Ala His Gly Val Phe Leu Asp
35 40 45
Asp Asp Leu Ala Leu Val Ala Thr Thr Gln Ala Thr Val Gly Ala Val
50 55 60
Arg Met Thr Asp Gly Glu Val Val Trp Arg Glu Thr Leu Pro Thr Ala
65 70 75 80
Arg Ser Ala Pro Leu Ala Ser Gln Val Lys His Glu Leu Phe Ala Thr
85 90 95
Ala Ser Ala Asp Ala Cys Val Ile Glu Leu Trp Ala Thr Pro Ser Gly
100 105 110
Asp Val Met Thr Ser Asp Ser Arg Gln Ala Gly Leu Glu Trp Asp Ala
115 120 125
Lys Ile Cys Asp Asn Thr Asp Ala Asp Ala Thr Gly Val Leu Glu Leu
130 135 140
Leu Asp Asn Asp Phe Asn Asn Asp Gly Thr Pro Asp Val Ala Ala Leu
145 150 155 160
Thr Pro Phe Gln Phe Val Ile Leu Asp Gly Val Ser Gly Arg Val Leu
165 170 175
His Glu Val Asp Leu Asp Lys Thr Ile Ala Trp Gln Gly Leu Val Glu
180 185 190
Ala Ala Gly Ser Ala Thr Gly Gly Lys Arg Lys Arg Pro Ser Ile Met
195 200 205
Ala Tyr Gly Val Asp Ile Lys Thr Gly Lys Leu Glu Val Arg Lys Leu
210 215 220
Ala Asn Ser Gly Ala Thr Leu Asp Pro Val Ser Gly Leu Glu Gly Val
225 230 235 240
Ser Ala Asp Glu Ile Thr Val Leu Lys Ser Gly Val Ala Lys Val Gly
245 250 255
Ser Ala Leu Leu Phe Val Arg Lys Glu Ser Gly Ala Leu Val Ala Phe
260 265 270
Asp Cys Val Ala Asn Gln Leu Gln Glu Leu Thr Asn Ala Pro Ser Ile
275 280 285
Lys Gly Ser Val Gln Ser Leu Gly Ser Ala Arg Phe Phe Ala Thr Asp
290 295 300
Ala Gly Val Ile Tyr Ala Val Asp Gly Glu Leu Lys Ile Ala Glu Thr
305 310 315 320
Leu Lys Gly Val Glu Ala Ala Ala Ile Gly Val Ser Gly Ala Ser Val
325 330 335
Ile Ala Ala Val Gln Ser Ser Thr Ala Ser Gly Thr Gly Asp Glu Ala
340 345 350
Gln Cys Gly Pro Ile Ser Arg Val Leu Val Gln Ser Ala Ser Gly Val
355 360 365
Thr Glu Ile Ala Phe Pro Glu Gln Gln Gly Gln Ser Gly Ala Arg Gly
370 375 380
Leu Val Glu Lys Ile Ile Val Gly Asp Ser Ser Thr Gly Thr Arg Ala
385 390 395 400
Ile Phe Val Phe Glu Asp Ala Ser Ala Val Gly Ile Glu Ile Glu Ser
405 410 415
Gly Ala Ser Glu Ala Ser Thr Leu Phe Val Arg Glu Glu Ala Leu Ala
420 425 430
Asn Val Val Glu Ala Val Ala Val Asp Leu Pro Pro Thr Asp Glu Val
435 440 445
Gly Ser Leu Gly Asp Glu Ala Ala His Val Phe Ala His Gly Ser His
450 455 460
Ala Ser Ile Phe Met Phe Arg Leu Lys Asp Gln Val Arg Thr Val Gln
465 470 475 480
Arg Phe Val Gln Ser Leu Phe Gly Ala Ala Thr Gln His Leu Ser Glu
485 490 495
Phe Val Ala Ser Gln Gly Lys Thr Leu Val Gln Ala Ile Arg Gly Glu
500 505 510
Leu Pro Arg Ala Glu Ser Leu Ser Gln Ser Glu Met Phe Ser Phe Gly
515 520 525
Phe Arg Arg Val Leu Val Leu Arg Ser Ala Ser Gly Lys Val Phe Gly
530 535 540
Leu Asn Ser Ala Asp Gly Ser Leu Leu Trp Ala Ala Gln Ser Pro Gly
545 550 555 560
Ser Arg Leu Phe Val Thr Arg Ala Arg Glu Ala Gly Leu Asp His Pro
565 570 575
Ala Glu Val Ala Ile Val Asp Glu Ala His Gly Arg Val Thr Trp Arg
580 585 590
Asn Ala Ile Thr Gly Ala Val Thr Arg Val Glu Asp Ile Asp Thr Pro
595 600 605
Leu Ala Gln Ile Ala Val Leu Pro Gly Asp Ile Phe Pro Ser Thr Ala
610 615 620
Ser Ser Glu Glu Asp Val Ser Pro Ala Ala Val Leu Ile Ala Leu Asp
625 630 635 640
His Ala Gln Arg Val His Ile Leu Pro Ser Ser Arg Thr Glu Ser Val
645 650 655
Leu Gln Leu Glu Asp Leu Leu Arg Ala Leu His Phe Val Val Tyr Ser
660 665 670
Asn Glu Thr Gly Ala Leu Thr Gly Tyr Ala Val Asp Pro Ser Gln Arg
675 680 685
Ala Gly Val Glu Leu Trp Ser Met Ile Val Pro Ala Ser Gln Thr Leu
690 695 700
Leu Ala Val Glu Gly Gln Ser Gly Gly Ala Leu Asn Asn Pro Gly Ile
705 710 715 720
Lys Arg Gly Asp Gly Ala Val Leu Val Lys Phe Val Asp Pro His Leu
725 730 735
Leu Met Val Ala Thr Gln Ser Gly Pro His Leu Gln Val Ser Ile Leu
740 745 750
Asn Gly Ile Ser Gly Arg Val Ile Ser Arg Phe Thr His Lys Lys Ser
755 760 765
Thr Gly Pro Val His Ala Val Leu Ala Asp Asn Thr Val Thr Tyr Ser
770 775 780
Phe Trp Asn Gln Val Lys Ser Arg Gln Glu Val Ser Val Val Gly Leu
785 790 795 800
Phe Glu Gly Glu Ile Gly Pro Arg Glu Leu Asn Met Trp Ser Ser Arg
805 810 815
Pro Asn Met Gly Ser Gly Lys Ala Met Ser Ala Phe Asp Asp Ser Met
820 825 830
Met Pro Asn Val Gln Gln Lys Thr Phe Tyr Thr Glu Arg Ala Ile Ala
835 840 845
Ala Leu Gly Val Thr Lys Thr Arg Phe Gly Ile Ala Asp Arg Arg Val
850 855 860
Leu Ile Gly Thr Ala Asn Gly Ala Val Asn Met Gln Val Pro Gln Ile
865 870 875 880
Leu Ser Pro Arg Arg Pro Val Gly Lys Leu Ser Asp Met Glu Lys Glu
885 890 895
Glu Gly Leu Met Leu Tyr Ala Pro Glu Leu Pro Leu Ile Pro Thr Gln
900 905 910
Thr Ile Thr Tyr Tyr Glu Ser Ile Pro Gln Leu Arg Leu Ile Arg Ser
915 920 925
Phe Ala Thr Arg Leu Glu Ser Thr Ser Leu Val Leu Ala Ala Gly Leu
930 935 940
Asp Ile Phe Tyr Thr Arg Val Met Pro Ser Arg Gly Phe Asp Val Leu
945 950 955 960
Asp Glu Asp Phe Ala Ser Gly Leu Leu Leu Ala Leu Ile Ala Ala Leu
965 970 975
Leu Ala Leu Thr Ile Tyr Leu Ser Lys Ala Val Gly Lys Ser Thr Leu
980 985 990
Asp Glu Thr Trp Lys
995
<210> 87
<211> 731
<212> PRT
<213> Schizochytrium
<220>
<223> Nicastrin-like
<400> 87
Met Gly Ala Ala Arg Arg Ser Met Gly Ala Ala Arg Lys Ala Leu Ala
1 5 10 15
Ala Ser Ala Thr Leu Ala Ala Leu Ala Leu Ala Gly Leu Gln Pro Ala
20 25 30
Arg Ala Glu Val Asn Gly Val Asn Ala Met Thr Glu Ala Met Leu Thr
35 40 45
Glu Tyr Ala Ser Leu Pro Cys Val Arg Ser Ile Ala Arg Asp Gly Ala
50 55 60
Val Gly Cys Gly Ser Pro Ser Asp Arg Ser Val Ala Glu Gly Gly Ala
65 70 75 80
Leu Phe Leu Val Glu Ser Val Glu Asp Val Thr Gly Leu Ile Glu Asn
85 90 95
Ala Gln Gly Leu Asp Ala Val Ala Leu Val Val Asp Asp Ala Leu Leu
100 105 110
His Gly Asp Ser Leu Arg Ala Met Gln Asp Leu Ala Lys Lys Ile Arg
115 120 125
Val Thr Ala Val Ile Val Thr Val Glu Glu Asp Gly Ser Pro Gln Glu
130 135 140
Pro Pro Arg Ser Ser Ala Ala Pro Thr Thr Trp Ile Pro Ser Gly Asp
145 150 155 160
Gly Leu Leu Asn Glu Thr Val Ser Phe Val Val Thr Arg Leu Arg Asn
165 170 175
Ala Thr Gln Ser Glu Glu Ile Arg Ala Leu Ala Ala Ser Asn Arg Asp
180 185 190
Arg Gly Tyr Val Asp Ala Val Phe Gln His Ser Ala Arg Tyr Gln Phe
195 200 205
Tyr Leu Gly Lys Glu Thr Ala Thr Ser Leu Ser Cys Leu Ala Ser Gly
210 215 220
Arg Cys Asp Pro Leu Gly Gly Leu Ser Val Trp Ala Ser Ala Gly Pro
225 230 235 240
Val Pro Val Asn Ser Ala Lys Glu Thr Val Leu Leu Thr Ala Asn Leu
245 250 255
Asp Ala Ala Ser Phe Phe His Asp Val Val Pro Ala Arg Asp Thr Thr
260 265 270
Ala Ser Gly Val Ala Ala Val Leu Leu Ala Ala Lys Ala Leu Ala Ser
275 280 285
Val Asp Glu Ser Val Leu Glu Ala Leu Ser Lys Gln Ile Ala Val Ala
290 295 300
Leu Phe Asn Gly Glu Val Trp Ser Arg Ala Gly Ser Arg Arg Phe Val
305 310 315 320
His Asp Val Ala Leu Gly Glu Cys Leu Ser Pro Gln Thr Ala Ser Pro
325 330 335
Tyr Asn Glu Ser Thr Cys Ala Asn Pro Pro Val Tyr Ala Leu Ala Trp
340 345 350
Thr Ser Leu Gly Leu Asp Asn Ile Thr Asp Val Val Ser Val Asn Asn
355 360 365
Val Ala Gly Ser Glu Ser Gly Ala Phe Tyr Val His Thr Ala Ala Gly
370 375 380
Thr Ala Ser Ala Asn Ala Ala Ala Ala Leu Gln Ser Val Ala Ser Ser
385 390 395 400
Ser Thr Asp Val Asp Val Ser Ile Thr Gly Ala Thr Thr Ser Gly Val
405 410 415
Val Pro Pro Ser Pro Leu Asp Ser Phe Leu Ala Ala Glu Met Glu Thr
420 425 430
Asp Val Ser Phe Ser Gly Ala Gly Leu Val Val Ser Gly Phe Asp Ala
435 440 445
Ala Ile Thr Asp Ala Asn Pro Arg Tyr Ser Ser Arg Tyr Asp Arg Arg
450 455 460
Asp Lys Gly Pro Glu Ala Asp Asp Ala Glu Ala Leu Thr Ala Ala Arg
465 470 475 480
Ile Ala Asp Val Ala Thr Leu Leu Ala Arg His Ala Phe Val Gln Ala
485 490 495
Gly Gly Ser Ile Ser Asp Ala Val Asn Phe Val Leu Val Asp Gly Thr
500 505 510
His Ala Ala Glu Leu Trp Asp Cys Leu Thr Lys Asp Phe Ala Cys Thr
515 520 525
Leu Val Ala Asp Val Ile Gly Ala Glu Asp Thr Thr Ala Val Ala Asp
530 535 540
Phe Met Gly Ser Thr Leu Leu Ala Ala Ser Glu Gly Val Ala Gly Gly
545 550 555 560
Ala Pro Asn Phe Phe Ser Gly Ile Tyr Ser Pro Phe Pro Val Glu Asn
565 570 575
Asn Val Met Arg Pro Val Pro Leu Phe Val Arg Asp Tyr Leu Ala Gln
580 585 590
Tyr Gly Arg Asn Ala Ser Leu Ile Glu Lys Val Thr Glu Ser Ala Lys
595 600 605
Tyr Ala Cys Ala Gln Asp Leu Asp Cys Met Val Met Thr Glu Pro Pro
610 615 620
Ala Cys Glu Leu Gly Arg Ser Ala Leu Ala Cys Leu Arg Gly Gly Cys
625 630 635 640
Val Cys Ser Asn Ala Tyr Phe His Asp Ala Val Ser Pro Ala Leu Val
645 650 655
Tyr Glu Asp Gly Ala Phe Ser Val Asp Ala Gln Lys Leu Thr Asp Asp
660 665 670
Asp Gly Leu Trp Thr Glu Pro Arg Trp Ser Asp Gly Thr Leu Thr Leu
675 680 685
Tyr Thr Ser Ala Asn Ser Ala Ser Thr Thr Ile Ala Leu Leu Val Cys
690 695 700
Gly Ile Leu Leu Thr Ile Gly Cys Val Phe Ala Leu Arg Lys Ala Gln
705 710 715 720
Gly Met Leu Asp Asn Thr Lys Tyr Lys Leu Asn
725 730
<210> 88
<211> 232
<212> PRT
<213> Schizochytrium
<220>
<223> Emp24
<400> 88
Met Ala Thr Thr Glu Asn Glu Ala Arg Leu Pro Pro Gly Lys Gln Arg
1 5 10 15
Leu Gly Arg Arg Arg Arg Gly Arg Val Ser Lys Ala Ser Gly Trp Gly
20 25 30
Thr Thr Leu Ala Leu Ala Ala Ala Val Leu Val Phe Ser Val Asp Arg
35 40 45
Ala Ser Gly Val Arg Phe Glu Val Ala Ser Thr Glu Glu Arg Cys Ile
50 55 60
Phe Asp Val Leu Arg Lys Asp Gln Leu Val Thr Gly Glu Phe Glu Val
65 70 75 80
His Ala Asp Gly Asp Asp Val Asn Met Asp Ile His Val Thr Gly Pro
85 90 95
Leu Gly Glu Glu Val Phe Ser Lys Gln Asn Ser Lys Met Ala Lys Phe
100 105 110
Gly Phe Thr Ala Glu Ala Ala Gly Glu His Val Leu Cys Leu Arg Asn
115 120 125
Asn Asp Met Ile Met Arg Glu Val Gln Val Lys Leu Arg Ser Gly Val
130 135 140
Glu Ala Lys Asp Leu Thr Glu Val Val Gln Arg His His Leu Lys Pro
145 150 155 160
Leu Ser Ala Glu Val Ile Arg Ile Gln Glu Thr Ile Arg Asp Val Arg
165 170 175
His Glu Leu Thr Ala Leu Lys Gln Arg Glu Ala Glu Met Arg Asp Met
180 185 190
Asn Glu Ser Ile Asn Thr Arg Val Ser Leu Phe Ser Phe Phe Ser Ile
195 200 205
Ala Val Val Gly Ser Leu Gly Ala Trp Gln Ile Met Tyr Leu Lys Ser
210 215 220
Tyr Phe Gln Arg Lys Lys Leu Ile
225 230
<210> 89
<211> 550
<212> PRT
<213> Schizochytrium
<220>
<223> Calnexin-like
<400> 89
Met Arg Thr Thr Phe Val Ala Ala Tyr Ala Ala Val Ala Ala Leu Ala
1 5 10 15
Leu Gly Gln Cys Glu Ala Ile Asn Phe Arg Glu Ser Phe Glu Gly Ala
20 25 30
Asn Val Glu Lys Glu Trp Val Lys Ser Ala Ser Asp Arg Tyr Ala Gly
35 40 45
Ser Glu Trp Ala Phe Asp Thr Ser Lys Asp Thr Gly Asp Val Gly Leu
50 55 60
Gln Thr Val Lys Pro His Lys Phe Tyr Gly Ile Ser Arg Lys Phe Glu
65 70 75 80
Asn Pro Ile Pro Val Gly Asp Gly Glu Lys Pro Phe Val Ala Gln Tyr
85 90 95
Glu Val Lys Phe Thr Glu Gly Val Ser Cys Ser Gly Ala Tyr Leu Lys
100 105 110
Leu Leu Glu Gln Asp Asp Ala Phe Thr Pro Lys Asp Leu Val Glu Ser
115 120 125
Ser Pro Tyr Ser Ile Met Phe Gly Pro Asp Asn Cys Gly Ala Asn Asn
130 135 140
Lys Val His Leu Ile Phe Arg Gln Glu Asn Pro Val Thr Lys Glu Tyr
145 150 155 160
Glu Glu Lys His Met Thr Lys Lys Val Thr Ser Val Arg Asp Arg Thr
165 170 175
Ser His Val Tyr Thr Leu Glu Val His Pro Asp Asn Thr Phe Lys Val
180 185 190
Lys Val Asp Gly Lys Val Glu Ala Glu Gly Ser Leu Thr Asp Asp Glu
195 200 205
Ala Phe Ser Pro Pro Phe Gln Gln Pro Lys Glu Ile Asp Asp Pro Asn
210 215 220
Asp Glu Lys Pro Asp Asp Trp Val Asp Gln Ala Lys Ile Pro Asp Pro
225 230 235 240
Glu Ala Ser Lys Pro Asp Asp Trp Asp Glu Asp Ala Pro Lys Arg Ile
245 250 255
Ala Asp Pro Asp Ala Val Lys Pro Glu Gly Trp Leu Asp Asp Glu Pro
260 265 270
Asp Gln Val Pro Asp Pro Ala Ala Ser Glu Pro Glu Asp Trp Asp Glu
275 280 285
Glu Asp Asp Gly Ile Trp Glu Ala Pro Leu Val Ala Asn Pro Lys Cys
290 295 300
Thr Ala Gly Pro Gly Cys Gly Glu Trp Asn Ala Pro Met Ile Glu Asn
305 310 315 320
Pro Asn Tyr Lys Gly Lys Trp Ser Ala Pro Met Ile Asp Asn Pro Glu
325 330 335
Tyr Lys Gly Val Trp Lys Pro Arg Arg Ile Glu Asn Pro Ala Tyr Phe
340 345 350
Glu Glu Ser Ser Pro Val Thr Thr Ile Lys Pro Ile Gly Ala Val Ala
355 360 365
Ile Glu Ile Leu Ala Asn Asp Lys Gly Ile Arg Phe Asp Asn Ile Ile
370 375 380
Ile Gly Asn Asp Val Lys Glu Ala Ala Glu Phe Ile Asp Lys Glu Phe
385 390 395 400
Leu Ala Lys Gln Ala Asp Glu Lys Ala Lys Val Lys Glu Glu Ala Ala
405 410 415
Gln Ala Ala Gln Asn Ser Arg Trp Glu Glu Tyr Lys Lys Gly Ser Ile
420 425 430
Gln Gly Tyr Val Met Trp Tyr Ala Gly Asp Tyr Ile Asp Tyr Val Met
435 440 445
Glu Leu Tyr Glu Ala Ser Pro Ile Ala Val Gly Val Gly Ala Ala Ala
450 455 460
Ala Gly Leu Ala Val Leu Val Ala Leu Met Val Met Cys Met Ser Gly
465 470 475 480
Ala Pro Glu Glu Tyr Asp Asp Asp Val Ala Leu His Lys Lys Asp Asp
485 490 495
Asp Ala Ala Ala Gly Asp Asp Asp Glu Ala Glu Ala Glu Ala Glu Asn
500 505 510
Asp Ala Ala Asp Glu Asp Glu Asp Glu Glu Asp Asp Asp Asp Glu Glu
515 520 525
Asp Glu Asp Glu Glu Glu Asp Glu Asp Glu Ala Thr Gly Pro Arg Arg
530 535 540
Arg Val Asn Arg Ala Asn
545 550
<210> 90
<211> 6175
<212> DNA
<213> Artificial
<220>
<223> pCL0121
<400> 90
ctcttatctg cctcgcgccg ttgaccgccg cttgactctt ggcgcttgcc gctcgcatcc 60
tgcctcgctc gcgcaggcgg gcgggcgagt gggtgggtcc gcagccttcc gcgctcgccc 120
gctagctcgc tcgcgccgtg ctgcagccag cagggcagca ccgcacggca ggcaggtccc 180
ggcgcggatc gatcgatcca tcgatccatc gatccatcga tcgtgcggtc aaaaagaaag 240
gaagaagaaa ggaaaaagaa aggcgtgcgc acccgagtgc gcgctgagcg cccgctcgcg 300
gtcccgcgga gcctccgcgt tagtccccgc cccgcgccgc gcagtccccc gggaggcatc 360
gcgcacctct cgccgccccc tcgcgcctcg ccgattcccc gcctcccctt ttccgcttct 420
tcgccgcctc cgctcgcggc cgcgtcgccc gcgccccgct ccctatctgc tccccagggg 480
ggcactccgc accttttgcg cccgctgccg ccgccgcggc cgccccgccg ccctggtttc 540
ccccgcgagc gcggccgcgt cgccgcgcaa agactcgccg cgtgccgccc cgagcaacgg 600
gtggcggcgg cgcggcggcg ggcggggcgc ggcggcgcgt aggcggggct aggcgccggc 660
taggcgaaac gccgcccccg ggcgccgccg ccgcccgctc cagagcagtc gccgcgccag 720
accgccaacg cagagaccga gaccgaggta cgtcgcgccc gagcacgccg cgacgcgcgg 780
cagggacgag gagcacgacg ccgcgccgcg ccgcgcgggg ggggggaggg agaggcagga 840
cgcgggagcg agcgtgcatg tttccgcgcg agacgacgcc gcgcgcgctg gagaggagat 900
aaggcgcttg gatcgcgaga gggccagcca ggctggaggc gaaaatgggt ggagaggata 960
gtatcttgcg tgcttggacg aggagactga cgaggaggac ggatacgtcg atgatgatgt 1020
gcacagagaa gaagcagttc gaaagcgact actagcaagc aagggatcca tgaagttcgc 1080
gacctcggtc gcaattttgc ttgtggccaa catagccacc gccctcgcgc agagcgatgg 1140
ctgcaccccc accgaccaga cgatggtgag caagggcgag gagctgttca ccggggtggt 1200
gcccatcctg gtcgagctgg acggcgacgt aaacggccac aagttcagcg tgtccggcga 1260
gggcgagggc gatgccacct acggcaagct gaccctgaag ttcatctgca ccaccggcaa 1320
gctgcccgtg ccctggccca ccctcgtgac caccctgacc tacggcgtgc agtgcttcag 1380
ccgctacccc gaccacatga agcagcacga cttcttcaag tccgccatgc ccgaaggcta 1440
cgtccaggag cgcaccatct tcttcaagga cgacggcaac tacaagaccc gcgccgaggt 1500
gaagttcgag ggcgacaccc tggtgaaccg catcgagctg aagggcatcg acttcaagga 1560
ggacggcaac atcctgggac acaagctgga gtacaactac aacagccaca acgtctatat 1620
catggccgac aagcagaaga acggcatcaa ggtgaacttc aagatccgcc acaacatcga 1680
ggacggcagc gtgcagctcg ccgaccacta ccagcagaac acccccatcg gcgacggccc 1740
cgtgctgctg cccgacaacc actacctgag cacccagtcc gccctgagca aagaccccaa 1800
cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc gccgccggga tcactctcgg 1860
catggacgag ctgtacaagc accaccatca ccaccactaa catatgagtt atgagatccg 1920
aaagtgaacc ttgtcctaac ccgacagcga atggcgggag ggggcgggct aaaagatcgt 1980
attacatagt atttttcccc tactctttgt gtttgtcttt tttttttttt tgaacgcatt 2040
caagccactt gtctgggttt acttgtttgt ttgcttgctt gcttgcttgc ttgcctgctt 2100
cttggtcaga cggcccaaaa aagggaaaaa attcattcat ggcacagata agaaaaagaa 2160
aaagtttgtc gaccaccgtc atcagaaagc aagagaagag aaacactcgc gctcacattc 2220
tcgctcgcgt aagaatctta gccacgcata cgaagtaatt tgtccatctg gcgaatcttt 2280
acatgagcgt tttcaagctg gagcgtgaga tcataccttt cttgatcgta atgttccaac 2340
cttgcatagg cctcgttgcg atccgctagc aatgcgtcgt actcccgttg caactgcgcc 2400
atcgcctcat tgtgacgtga gttcagattc ttctcgagac cttcgagcgc tgctaatttc 2460
gcctgacgct ccttcttttg tgcttccatg acacgccgct tcaccgtgcg ttccacttct 2520
tcctcagaca tgcccttggc tgcctcgacc tgctcggtaa aacgggcccc agcacgtgct 2580
acgagatttc gattccaccg ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg 2640
ggacgccggc tggatgatcc tccagcgcgg ggatctcatg ctggagttct tcgcccaccc 2700
caacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac 2760
aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc 2820
ttatcataca tggtcgacct gcaggaacct gcattaatga atcggccaac gcgcggggag 2880
aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 2940
cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 3000
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 3060
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 3120
aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 3180
tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 3240
gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 3300
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 3360
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 3420
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 3480
tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 3540
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 3600
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 3660
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 3720
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 3780
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 3840
cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 3900
catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 3960
ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat 4020
aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 4080
ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 4140
caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 4200
attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 4260
agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 4320
actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 4380
ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 4440
ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 4500
gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 4560
atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 4620
cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 4680
gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca 4740
gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 4800
ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc taagaaacca ttattatcat 4860
gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtctcgcgc gtttcggtga 4920
tgacggtgaa aacctctgac acatgcagct cccggagacg gtcacagctt gtctgtaagc 4980
ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg ggtgtcgggg 5040
ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccaag cttccaattt 5100
taggcccccc actgaccgag gtctgtcgat aatccacttt tccattgatt ttccaggttt 5160
cgttaactca tgccactgag caaaacttcg gtctttccta acaaaagctc tcctcacaaa 5220
gcatggcgcg gcaacggacg tgtcctcata ctccactgcc acacaaggtc gataaactaa 5280
gctcctcaca aatagaggag aattccactg acaactgaaa acaatgtatg agagacgatc 5340
accactggag cggcgcggcg gttgggcgcg gaggtcggca gcaaaaacaa gcgactcgcc 5400
gagcaaaccc gaatcagcct tcagacggtc gtgcctaaca acacgccgtt ctaccccgcc 5460
ttcttcgcgc cccttcgcgt ccaagcatcc ttcaagttta tctctctagt tcaacttcaa 5520
gaagaacaac accaccaaca ccatggccaa gttgaccagt gccgttccgg tgctcaccgc 5580
gcgcgacgtc gccggagcgg tcgagttctg gaccgaccgg ctcgggttct cccgggactt 5640
cgtggaggac gacttcgccg gtgtggtccg ggacgacgtg accctgttca tcagcgcggt 5700
ccaggaccag gtggtgccgg acaacaccct ggcctgggtg tgggtgcgcg gcctggacga 5760
gctgtacgcc gagtggtcgg aggtcgtgtc cacgaacttc cgggacgcct ccgggccggc 5820
catgaccgag atcggcgagc agccgtgggg gcgggagttc gccctgcgcg acccggccgg 5880
caactgcgtg cacttcgtgg ccgaggagca ggactgacac gtgctacgag atttcgattc 5940
caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt ttccgggacg ccggctggat 6000
gatcctccag cgcggggatc tcatgctgga gttcttcgcc caccccaact tgtttattgc 6060
agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 6120
ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc ggtac 6175
<210> 91
<211> 6611
<212> DNA
<213> Artificial
<220>
<223> pCL0122
<400> 91
ctcttatctg cctcgcgccg ttgaccgccg cttgactctt ggcgcttgcc gctcgcatcc 60
tgcctcgctc gcgcaggcgg gcgggcgagt gggtgggtcc gcagccttcc gcgctcgccc 120
gctagctcgc tcgcgccgtg ctgcagccag cagggcagca ccgcacggca ggcaggtccc 180
ggcgcggatc gatcgatcca tcgatccatc gatccatcga tcgtgcggtc aaaaagaaag 240
gaagaagaaa ggaaaaagaa aggcgtgcgc acccgagtgc gcgctgagcg cccgctcgcg 300
gtcccgcgga gcctccgcgt tagtccccgc cccgcgccgc gcagtccccc gggaggcatc 360
gcgcacctct cgccgccccc tcgcgcctcg ccgattcccc gcctcccctt ttccgcttct 420
tcgccgcctc cgctcgcggc cgcgtcgccc gcgccccgct ccctatctgc tccccagggg 480
ggcactccgc accttttgcg cccgctgccg ccgccgcggc cgccccgccg ccctggtttc 540
ccccgcgagc gcggccgcgt cgccgcgcaa agactcgccg cgtgccgccc cgagcaacgg 600
gtggcggcgg cgcggcggcg ggcggggcgc ggcggcgcgt aggcggggct aggcgccggc 660
taggcgaaac gccgcccccg ggcgccgccg ccgcccgctc cagagcagtc gccgcgccag 720
accgccaacg cagagaccga gaccgaggta cgtcgcgccc gagcacgccg cgacgcgcgg 780
cagggacgag gagcacgacg ccgcgccgcg ccgcgcgggg ggggggaggg agaggcagga 840
cgcgggagcg agcgtgcatg tttccgcgcg agacgacgcc gcgcgcgctg gagaggagat 900
aaggcgcttg gatcgcgaga gggccagcca ggctggaggc gaaaatgggt ggagaggata 960
gtatcttgcg tgcttggacg aggagactga cgaggaggac ggatacgtcg atgatgatgt 1020
gcacagagaa gaagcagttc gaaagcgact actagcaagc aagggatcca tgaagttcgc 1080
gacctcggtc gcaattttgc ttgtggccaa catagccacc gccctcgcgc agagcgatgg 1140
ctgcaccccc accgaccaga cgatggtgag caagggcgag gagctgttca ccggggtggt 1200
gcccatcctg gtcgagctgg acggcgacgt aaacggccac aagttcagcg tgtccggcga 1260
gggcgagggc gatgccacct acggcaagct gaccctgaag ttcatctgca ccaccggcaa 1320
gctgcccgtg ccctggccca ccctcgtgac caccctgacc tacggcgtgc agtgcttcag 1380
ccgctacccc gaccacatga agcagcacga cttcttcaag tccgccatgc ccgaaggcta 1440
cgtccaggag cgcaccatct tcttcaagga cgacggcaac tacaagaccc gcgccgaggt 1500
gaagttcgag ggcgacaccc tggtgaaccg catcgagctg aagggcatcg acttcaagga 1560
ggacggcaac atcctgggac acaagctgga gtacaactac aacagccaca acgtctatat 1620
catggccgac aagcagaaga acggcatcaa ggtgaacttc aagatccgcc acaacatcga 1680
ggacggcagc gtgcagctcg ccgaccacta ccagcagaac acccccatcg gcgacggccc 1740
cgtgctgctg cccgacaacc actacctgag cacccagtcc gccctgagca aagaccccaa 1800
cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc gccgccggga tcactctcgg 1860
catggacgag ctgtacaagc accaccatca ccaccactaa catatgagtt atgagatccg 1920
aaagtgaacc ttgtcctaac ccgacagcga atggcgggag ggggcgggct aaaagatcgt 1980
attacatagt atttttcccc tactctttgt gtttgtcttt tttttttttt tgaacgcatt 2040
caagccactt gtctgggttt acttgtttgt ttgcttgctt gcttgcttgc ttgcctgctt 2100
cttggtcaga cggcccaaaa aagggaaaaa attcattcat ggcacagata agaaaaagaa 2160
aaagtttgtc gaccaccgtc atcagaaagc aagagaagag aaacactcgc gctcacattc 2220
tcgctcgcgt aagaatctta gccacgcata cgaagtaatt tgtccatctg gcgaatcttt 2280
acatgagcgt tttcaagctg gagcgtgaga tcataccttt cttgatcgta atgttccaac 2340
cttgcatagg cctcgttgcg atccgctagc aatgcgtcgt actcccgttg caactgcgcc 2400
atcgcctcat tgtgacgtga gttcagattc ttctcgagac cttcgagcgc tgctaatttc 2460
gcctgacgct ccttcttttg tgcttccatg acacgccgct tcaccgtgcg ttccacttct 2520
tcctcagaca tgcccttggc tgcctcgacc tgctcggtaa aacgggcccc agcacgtgct 2580
acgagatttc gattccaccg ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg 2640
ggacgccggc tggatgatcc tccagcgcgg ggatctcatg ctggagttct tcgcccaccc 2700
caacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac 2760
aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc 2820
ttatcataca tggtcgacct gcaggaacct gcattaatga atcggccaac gcgcggggag 2880
aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 2940
cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 3000
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 3060
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 3120
aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 3180
tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 3240
gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 3300
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 3360
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 3420
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 3480
tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 3540
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 3600
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 3660
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 3720
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 3780
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 3840
cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 3900
catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 3960
ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat 4020
aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 4080
ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 4140
caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 4200
attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 4260
agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 4320
actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 4380
ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 4440
ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 4500
gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 4560
atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 4620
cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 4680
gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca 4740
gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 4800
ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc taagaaacca ttattatcat 4860
gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtctcgcgc gtttcggtga 4920
tgacggtgaa aacctctgac acatgcagct cccggagacg gtcacagctt gtctgtaagc 4980
ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg ggtgtcgggg 5040
ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccaag cttccaattt 5100
taggcccccc actgaccgag gtctgtcgat aatccacttt tccattgatt ttccaggttt 5160
cgttaactca tgccactgag caaaacttcg gtctttccta acaaaagctc tcctcacaaa 5220
gcatggcgcg gcaacggacg tgtcctcata ctccactgcc acacaaggtc gataaactaa 5280
gctcctcaca aatagaggag aattccactg acaactgaaa acaatgtatg agagacgatc 5340
accactggag cggcgcggcg gttgggcgcg gaggtcggca gcaaaaacaa gcgactcgcc 5400
gagcaaaccc gaatcagcct tcagacggtc gtgcctaaca acacgccgtt ctaccccgcc 5460
ttcttcgcgc cccttcgcgt ccaagcatcc ttcaagttta tctctctagt tcaacttcaa 5520
gaagaacaac accaccaaca ccatgattga acaagatgga ttgcacgcag gttctccggc 5580
cgcttgggtg gagaggctat tcggctatga ctgggcacaa cagacaatcg gctgctctga 5640
tgccgccgtg ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca agaccgacct 5700
gtccggtgcc ctgaatgaac tgcaggacga ggcagcgcgg ctatcgtggc tggccacgac 5760
gggcgttcct tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg actggctgct 5820
attgggcgaa gtgccggggc aggatctcct gtcatctcac cttgctcctg ccgagaaagt 5880
atccatcatg gctgatgcaa tgcggcggct gcatacgctt gatccggcta cctgcccatt 5940
cgaccaccaa gcgaaacatc gcatcgagcg agcacgtact cggatggaag ccggtcttgt 6000
cgatcaggat gatctggacg aagagcatca ggggctcgcg ccagccgaac tgttcgccag 6060
gctcaaggcg cgcatgcccg acggcgatga tctcgtcgtg acccatggcg atgcctgctt 6120
gccgaatatc atggtggaaa atggccgctt ttctggattc atcgactgtg gccggctggg 6180
tgtggcggac cgctatcagg acatagcgtt ggctacccgt gatattgctg aagagcttgg 6240
cggcgaatgg gctgaccgct tcctcgtgct ttacggtatc gccgctcccg attcgcagcg 6300
catcgccttc tatcgccttc ttgacgagtt cttctgacac gtgctacgag atttcgattc 6360
caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt ttccgggacg ccggctggat 6420
gatcctccag cgcggggatc tcatgctgga gttcttcgcc caccccaact tgtttattgc 6480
agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 6540
ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctgaat 6600
tcccggggta c 6611
<210> 92
<211> 1314
<212> DNA
<213> Artificial
<220>
<223> Codon optimized Isomerase
<400> 92
atggctaagg agtacttccc ccagatccag aagattaagt tcgagggtaa ggacagcaag 60
aacccgctcg cctttcatta ctacgacgcc gagaaggagg tgatgggcaa gaagatgaag 120
gactggcttc gctttgctat ggcttggtgg cacactctct gcgctgaggg cgcggaccag 180
tttggcggcg gtacgaagag ctttccgtgg aacgagggca ctgacgctat tgagattgct 240
aagcagaagg ttgacgctgg tttcgagatt atgcagaagc tcggtattcc gtactactgc 300
tttcacgatg tcgacctcgt ttccgagggc aactcgatcg aggagtacga gtcgaacctc 360
aaggctgtgg ttgcctacct caaggagaag cagaaggaga ccggaatcaa gctcctctgg 420
agcaccgcca acgttttcgg ccacaagcgc tacatgaacg gcgcctccac caaccctgac 480
ttcgatgttg ttgcccgcgc tattgtccag attaagaacg ccatcgacgc tggtatcgag 540
ctcggagccg agaactacgt tttttggggc ggacgcgagg gttacatgtc cctcctcaac 600
accgaccaga agcgtgagaa ggagcacatg gccactatgc ttaccatggc ccgcgactac 660
gcccgcagca agggttttaa gggtactttt ctcattgagc cgaagcccat ggagccgacc 720
aagcaccagt acgacgtcga caccgagacc gccattggct tccttaaggc ccacaacctt 780
gacaaggatt ttaaggtgaa catcgaggtt aaccacgcta cgcttgccgg ccacaccttt 840
gagcatgagc tcgcctgcgc tgttgacgcc ggaatgcttg gttccattga cgccaaccgc 900
ggcgactacc agaacggctg ggacaccgac cagtttccga ttgaccagta cgagctcgtc 960
caggcctgga tggagatcat ccgtggtgga ggctttgtta ccggtggtac gaacttcgac 1020
gccaagacgc gccgtaacag cacggacctc gaggacatca tcattgctca tgtgtcgggc 1080
atggacgcca tggctcgcgc ccttgagaac gctgctaagc tcctccagga gagcccctac 1140
acgaagatga agaaggagcg ctacgcgtcg tttgacagcg gaatcggtaa ggacttcgag 1200
gatggcaagc tcaccctgga gcaggtgtac gagtacggta agaagaacgg cgagccgaag 1260
cagaccagcg gcaagcagga gctctacgag gccattgtcg ccatgtacca gtag 1314
<210> 93
<211> 1485
<212> DNA
<213> Artificial
<220>
<223> Codon optimized Kinase
<400> 93
atgaagaccg tcgccggcat cgatcttgga acccagtcca tgaaggttgt catttacgac 60
tacgagaaga aggagatcat cgagtccgcc tcgtgcccta tggagctcat tagcgagtcg 120
gacggaaccc gcgagcagac gactgagtgg tttgacaagg gtctcgaggt gtgctttgga 180
aagctctccg ctgataacaa gaagaccatt gaggcgattg gcatctccgg ccagctccac 240
ggcttcgtcc ctctcgatgc gaacggaaag gcgctctaca acatcaagct ctggtgcgac 300
accgccactg tggaggagtg caagatcatt actgacgccg ccggcggcga caaggctgtc 360
atcgacgcgc tcggcaacct catgctcacc ggattcaccg ccccgaagat tctctggctc 420
aagcgcaaca agcccgaggc ctttgctaac ctcaagtaca ttatgctgcc ccacgattac 480
ctcaactgga agctgactgg agactacgtc atggagtacg gcgacgcctc cggcaccgcc 540
ctttttgatt cgaagaaccg ctgctggtcg aagaagattt gcgacattat tgatcctaag 600
ctgctcgacc ttctccctaa gctcattgag ccctcggccc ccgccggtaa ggtcaacgac 660
gaggccgcca aggcgtacgg cattcccgcc ggaatccccg tttccgctgg cggcggtgat 720
aacatgatgg gtgcggtcgg tactggcacc gtcgctgacg gattcctcac gatgagcatg 780
ggcacctccg gaactcttta cggctactcg gacaagccta tttccgaccc ggctaacggc 840
ctcagcggct tctgcagctc cacgggcggc tggcttcccc tcctttgcac catgaactgc 900
accgtcgcca ccgagttcgt ccgcaacctt tttcagatgg atatcaagga gctgaacgtc 960
gaggctgcta agtccccctg cggcagcgag ggcgttcttg tcattccttt cttcaacggc 1020
gagcgcaccc cgaacctccc caacggccgc gcctcgatta ccggcctcac ctccgcgaac 1080
acgtcccgcg ccaacatcgc tcgcgcctcc tttgagtcgg ccgtctttgc catgcgcggt 1140
ggcctcgatg cgtttcgtaa gctcggattc cagcccaagg agattcgcct catcggcggt 1200
ggttcgaagt ccgacctctg gcgccagatc gctgctgaca ttatgaacct tcccatccgt 1260
gtcccccttc tcgaggaggc cgccgccctc ggcggagctg tccaggccct ttggtgcctt 1320
aagaaccagt ccggtaagtg cgacatcgtc gagctttgca aggagcatat caagattgac 1380
gagtccaaga acgccaaccc gattgccgag aacgtcgccg tgtacgataa ggcctacgat 1440
gagtactgca aggtcgttaa cacgctcagc cctctgtacg cctaa 1485
<210> 94
<211> 1569
<212> DNA
<213> Artificial
<220>
<223> Codon optimized transporter
<400> 94
atgggcctcg aggataaccg catggttaag cgctttgtca acgtgggcga gaagaaggcc 60
ggtagcaccg ccatggccat cattgttggc ctcttcgcgg cctcgggcgg cgtcctcttc 120
ggctacgaca ccggcactat ctcgggcgtc atgactatgg actacgttct cgcccgctac 180
ccctccaaca agcactcctt caccgctgac gagtcgtcgc tcatcgtttc cattctttcg 240
gtcggcacct tcttcggcgc cctctgcgcc ccgttcctca acgataccct cggccgccgc 300
tggtgcctca tcctcagcgc cctcattgtc tttaacatcg gcgccatcct ccaggtcatt 360
tccaccgcca tccccctgct ctgcgcgggc cgcgttatcg ccggtttcgg tgtcggcctc 420
atttccgcca ccatcccgct ctaccagtcc gagactgctc cgaagtggat tcgcggcgcc 480
atcgtttcct gctaccagtg ggccatcact atcggacttt tcctcgcttc ctgcgtcaac 540
aagggcaccg agcacatgac caactccggt tcgtaccgta ttcctctggc catccagtgc 600
ctctggggcc tcatccttgg tattggcatg attttcctcc ctgagacccc ccgcttctgg 660
atttcgaagg gcaaccagga gaaggccgcc gagtccctcg cccgtctccg caagctcccc 720
atcgaccatc ctgatagcct tgaggagctt cgcgatatta ctgccgccta cgagttcgag 780
accgtctacg gtaagtccag ctggtcccag gtcttttccc acaagaacca tcagctcaag 840
cgcctcttta ccggcgttgc cattcaggcc tttcagcagc tcaccggagt taactttatc 900
ttttactacg gcaccacctt ttttaagcgc gccggagtca acggattcac catcagcctt 960
gccaccaaca tcgttaacgt cggcagcact attcccggca ttcttctcat ggaggtcctc 1020
ggccgccgca acatgctcat gggcggtgcc accggcatgt cgctgtcgca gcttatcgtc 1080
gccattgtcg gagttgccac gtcggagaac aacaagtcga gccagtcggt cctcgtcgct 1140
ttctcgtgca tctttatcgc tttttttgcc gccacctggg gtccctgcgc ctgggtcgtc 1200
gtcggcgagc tctttcccct tcgcactcgc gctaagtccg tttccctctg caccgcgtcc 1260
aactggctct ggaactgggg cattgcttac gccaccccct acatggtcga cgaggataag 1320
ggtaacctcg gcagcaacgt tttttttatt tggggaggct tcaacctcgc ttgcgtcttt 1380
ttcgcgtggt acttcattta cgagaccaag ggcctttccc tcgagcaggt tgatgagctc 1440
tacgagcatg tttcgaaggc gtggaagtcc aagggttttg tcccgtccaa gcactccttt 1500
cgcgagcagg tcgaccagca gatggactcc aagaccgagg ccattatgag cgaggaggcg 1560
tcggtttaa 1569
<210> 95
<211> 1512
<212> DNA
<213> Artificial
<220>
<223> Codon optimized transporter
<400> 95
atggccctcg accctgagca gcagcagccc atttcctccg tgtcgcgcga gtttggtaag 60
tcgtccggtg agatctcccc cgagcgtgag cctctcatta aggagaacca cgtccccgag 120
aactactccg ttgttgccgc catcctcccc ttcctcttcc cggccctggg tggcctcctt 180
tacggttacg agattggcgc tacgtcgtgc gctacgattt cccttcagtc cccctccctc 240
tccggcatct cctggtacaa cctctcctcc gtcgatgttg gcctcgtcac ttccggttcc 300
ctctacggtg ctctgtttgg ctccattgtt gccttcacca ttgccgacgt tattggccgt 360
cgcaaggagc ttatcctcgc tgctctcctc tacctcgtcg gtgccctcgt taccgctctc 420
gcccctacgt actccgttct catcatcggc cgtgtcattt acggtgtttc cgtcggtctt 480
gccatgcatg ctgcccctat gtacatcgcg gagaccgccc cgtcccccat ccgcggccag 540
ctcgtttccc tcaaggagtt tttcatcgtt ctcggtatgg tcggcggata cggcattggt 600
tccctcaccg tcaacgtcca ctccggttgg cgctacatgt acgctacctc cgttcccctc 660
gctgtgatca tgggcattgg catgtggtgg cttcctgcct ccccccgttg gctcctcctc 720
cgcgtcattc agggtaaggg taacgttgag aaccagcgcg aggctgccat taagtccctc 780
tgctgcctcc gtggtcctgc cttcgtcgac tcggccgccg agcaggtcaa cgagattctc 840
gccgagctta ccttcgttgg cgaggataag gaggtcacct tcggcgagct cttccaggga 900
aagtgcctca aggccctcat tatcggcggc ggccttgttc tctttcagca gatcaccggt 960
cagccttcgg tcctctacta cgccccctcg atcctccaga ctgcgggctt ctccgccgcc 1020
ggcgatgcta cccgcgtttc cattcttctc ggcctcctca agctcattat gaccggtgtc 1080
gccgtcgtcg ttatcgatcg tctcggccgt cgccctctcc tcctcggcgg agtcggtggt 1140
atggttgttt cgctctttct ccttggctcg tactaccttt tcttcagcgc ttcccccgtc 1200
gtcgccgttg tcgccctcct tctctacgtg ggttgctacc agctctcctt tggccccatt 1260
ggctggctta tgatttccga gatttttccc ctcaagctcc gtggtcgcgg actctccctt 1320
gccgtgcttg tcaactttgg tgccaacgcc ctcgtcacct ttgccttttc ccctctcaag 1380
gagctcctcg gcgccggcat cctgttttgc ggctttggcg ttatctgcgt tctctccctt 1440
gtttttatct tttttatcgt cccggagact aagggcctca cgctcgagga gatcgaggcg 1500
aagtgcctct aa 1512
<210> 96
<211> 19
<212> DNA
<213> Artificial
<220>
<223> Primer 5' CL0130
<400> 96
cctcgggcgg cgtcctctt 19
<210> 97
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Primer 3' CL0130
<400> 97
ggcggccttc tcctggttgc 20
<210> 98
<211> 24
<212> DNA
<213> Artificial
<220>
<223> Primer 5' CL0131
<400> 98
ctactccgtt gttgccgcca tcct 24
<210> 99
<211> 22
<212> DNA
<213> Artificial
<220>
<223> Primer 3' CL0131
<400> 99
ccgccgacca taccgagaac ga 22
<210> 100
<211> 1362
<212> DNA
<213> Artificial
<220>
<223> Codon Optimized NA
<400> 100
atgaacccca accagaagat tactactatc ggtagcattt gcctcgtcgt tggacttatc 60
tcccttattc ttcagattgg taacattatc tccatttgga tctcgcatag cattcagacc 120
ggctcccaga accacaccgg catttgcaac cagaacatta ttacttacaa gaactccact 180
tgggtcaagg acactactag cgttattctt accggtaact cgtcgctttg ccctattcgc 240
ggctgggcta tttacagcaa ggacaactcg atccgcatcg gtagcaaggg cgacgttttt 300
gtcatccgtg agccttttat ttcctgcagc cacctcgagt gccgtacttt ttttctgact 360
cagggcgctc tcctcaacga taagcattcc aacggcactg tcaaggatcg cagcccctac 420
cgcgccctta tgtcctgccc tgtcggcgag gctcccagcc cctacaactc ccgttttgag 480
tccgttgcct ggtccgccag cgcctgccac gacggaatgg gatggctcac tattggtatt 540
tccggccctg ataacggcgc tgtcgccgtc cttaagtaca acggcattat caccgagacc 600
atcaagtcct ggcgtaagaa gatcctccgc acccaggagt ccgagtgcgc ctgcgtcaac 660
ggcagctgct tcacgattat gaccgacggc ccctccgacg gcctcgcttc ctacaagatt 720
tttaagattg agaagggtaa ggtcacgaag tccatcgagc ttaacgcccc gaactcccac 780
tacgaggagt gctcctgcta ccctgacact ggcaaggtga tgtgcgtctg ccgcgataac 840
tggcatggct ccaaccgccc ctgggttagc ttcgatcaga accttgacta ccagattgga 900
tacatttgct ccggtgtttt tggcgacaac ccgcgccccg aggatggaac tggttcgtgc 960
ggtcctgttt acgttgacgg cgccaacggc gttaagggtt tttcctaccg ttacggtaac 1020
ggagtctgga tcggccgcac caagtcgcac agctcgcgcc acggatttga gatgatctgg 1080
gaccccaacg gatggactga gaccgattcc aagtttagcg ttcgccagga tgtcgttgct 1140
atgaccgatt ggtcgggata ctccggttcc tttgtgcagc accctgagct caccggcctt 1200
gactgcatgc gcccttgctt ttgggtcgag ctcattcgcg gtcgccctaa ggagaagact 1260
atttggacct ccgccagcag catttccttt tgcggcgtta actccgacac cgtcgactgg 1320
tcgtggcccg atggcgccga gcttcccttt tccattgata ag 1362
<210> 101
<211> 1431
<212> DNA
<213> Artificial
<220>
<223> Codon Optimized NA with V5 tag and a polyhistidine tag
<400> 101
atgaacccca accagaagat tactactatc ggtagcattt gcctcgtcgt tggacttatc 60
tcccttattc ttcagattgg taacattatc tccatttgga tctcgcatag cattcagacc 120
ggctcccaga accacaccgg catttgcaac cagaacatta ttacttacaa gaactccact 180
tgggtcaagg acactactag cgttattctt accggtaact cgtcgctttg ccctattcgc 240
ggctgggcta tttacagcaa ggacaactcg atccgcatcg gtagcaaggg cgacgttttt 300
gtcatccgtg agccttttat ttcctgcagc cacctcgagt gccgtacttt ttttctgact 360
cagggcgctc tcctcaacga taagcattcc aacggcactg tcaaggatcg cagcccctac 420
cgcgccctta tgtcctgccc tgtcggcgag gctcccagcc cctacaactc ccgttttgag 480
tccgttgcct ggtccgccag cgcctgccac gacggaatgg gatggctcac tattggtatt 540
tccggccctg ataacggcgc tgtcgccgtc cttaagtaca acggcattat caccgagacc 600
atcaagtcct ggcgtaagaa gatcctccgc acccaggagt ccgagtgcgc ctgcgtcaac 660
ggcagctgct tcacgattat gaccgacggc ccctccgacg gcctcgcttc ctacaagatt 720
tttaagattg agaagggtaa ggtcacgaag tccatcgagc ttaacgcccc gaactcccac 780
tacgaggagt gctcctgcta ccctgacact ggcaaggtga tgtgcgtctg ccgcgataac 840
tggcatggct ccaaccgccc ctgggttagc ttcgatcaga accttgacta ccagattgga 900
tacatttgct ccggtgtttt tggcgacaac ccgcgccccg aggatggaac tggttcgtgc 960
ggtcctgttt acgttgacgg cgccaacggc gttaagggtt tttcctaccg ttacggtaac 1020
ggagtctgga tcggccgcac caagtcgcac agctcgcgcc acggatttga gatgatctgg 1080
gaccccaacg gatggactga gaccgattcc aagtttagcg ttcgccagga tgtcgttgct 1140
atgaccgatt ggtcgggata ctccggttcc tttgtgcagc accctgagct caccggcctt 1200
gactgcatgc gcccttgctt ttgggtcgag ctcattcgcg gtcgccctaa ggagaagact 1260
atttggacct ccgccagcag catttccttt tgcggcgtta actccgacac cgtcgactgg 1320
tcgtggcccg atggcgccga gcttcccttt tccattgata agggtaagcc tatccctaac 1380
cctctcctcg gtctcgattc tacgcgtacc ggtcatcatc accatcacca t 1431
<210> 102
<211> 539
<212> PRT
<213> Human parainfluenza 3 virus
<400> 102
Met Pro Thr Ser Ile Leu Leu Ile Ile Thr Thr Met Ile Met Ala Ser
1 5 10 15
Phe Cys Gln Ile Asp Ile Thr Lys Leu Gln His Val Gly Val Leu Val
20 25 30
Asn Ser Pro Lys Gly Met Lys Ile Ser Gln Asn Phe Glu Thr Arg Tyr
35 40 45
Leu Ile Leu Ser Leu Ile Pro Lys Ile Glu Asp Ser Asn Ser Cys Gly
50 55 60
Asp Gln Gln Ile Lys Gln Tyr Lys Arg Leu Leu Asp Arg Leu Ile Ile
65 70 75 80
Pro Leu Tyr Asp Gly Leu Arg Leu Gln Lys Asp Val Ile Val Ser Asn
85 90 95
Gln Glu Ser Asn Glu Asn Thr Asp Pro Arg Thr Lys Arg Phe Phe Gly
100 105 110
Gly Val Ile Gly Thr Ile Ala Leu Gly Val Ala Thr Ser Ala Gln Ile
115 120 125
Thr Ala Ala Val Ala Leu Val Glu Ala Lys Gln Ala Arg Ser Asp Ile
130 135 140
Glu Lys Leu Lys Glu Ala Ile Arg Asp Thr Asn Lys Ala Val Gln Ser
145 150 155 160
Val Gln Ser Ser Ile Gly Asn Leu Ile Val Ala Ile Lys Ser Val Gln
165 170 175
Asp Tyr Val Asn Lys Glu Ile Val Pro Ser Ile Ala Arg Leu Gly Cys
180 185 190
Glu Ala Ala Gly Leu Gln Leu Gly Ile Ala Leu Thr Gln His Tyr Ser
195 200 205
Glu Leu Thr Asn Ile Phe Gly Asp Asn Ile Gly Ser Leu Gln Glu Lys
210 215 220
Gly Ile Lys Leu Gln Gly Ile Ala Ser Leu Tyr Arg Thr Asn Ile Thr
225 230 235 240
Glu Ile Phe Thr Thr Ser Thr Val Asp Lys Tyr Asp Ile Tyr Asp Leu
245 250 255
Leu Phe Thr Glu Ser Ile Lys Val Arg Val Ile Asp Val Asp Leu Asn
260 265 270
Asp Tyr Ser Ile Thr Leu Gln Val Arg Leu Pro Leu Leu Thr Arg Leu
275 280 285
Leu Asn Thr Gln Ile Tyr Arg Val Asp Ser Ile Ser Tyr Asn Ile Gln
290 295 300
Asn Arg Glu Trp Tyr Ile Pro Leu Pro Ser His Ile Met Thr Lys Gly
305 310 315 320
Ala Phe Leu Gly Gly Ala Asp Val Lys Glu Cys Ile Glu Ala Phe Ser
325 330 335
Ser Tyr Ile Cys Pro Ser Asp Pro Gly Phe Val Leu Asn His Glu Met
340 345 350
Glu Ser Cys Leu Ser Gly Asn Ile Ser Gln Cys Pro Arg Thr Val Val
355 360 365
Lys Ser Asp Ile Val Pro Arg Tyr Ala Phe Val Asn Gly Gly Val Val
370 375 380
Ala Asn Cys Ile Thr Thr Thr Cys Thr Cys Asn Gly Ile Gly Asn Arg
385 390 395 400
Ile Asn Gln Pro Pro Asp Gln Gly Val Lys Ile Ile Thr His Lys Glu
405 410 415
Cys Asn Thr Ile Gly Ile Asn Gly Met Leu Phe Asn Thr Asn Lys Glu
420 425 430
Gly Thr Leu Ala Phe Tyr Thr Pro Asn Asp Ile Thr Leu Asn Asn Ser
435 440 445
Val Ala Leu Asp Pro Ile Asp Ile Ser Ile Glu Leu Asn Lys Ala Lys
450 455 460
Ser Asp Leu Glu Glu Ser Lys Glu Trp Ile Arg Arg Ser Asn Gln Lys
465 470 475 480
Leu Asp Ser Ile Gly Asn Trp His Gln Ser Ser Thr Thr Ile Ile Ile
485 490 495
Val Leu Ile Met Ile Ile Ile Leu Phe Ile Ile Asn Val Thr Ile Ile
500 505 510
Ile Ile Ala Val Lys Tyr Tyr Arg Ile Gln Lys Arg Asn Arg Val Asp
515 520 525
Gln Asn Asp Lys Pro Tyr Val Leu Thr Asn Lys
530 535
<210> 103
<211> 511
<212> PRT
<213> Vesicular stomatitis Indiana virus
<400> 103
Met Lys Cys Leu Leu Tyr Leu Ala Phe Leu Phe Ile Gly Val Asn Cys
1 5 10 15
Lys Phe Thr Ile Val Phe Pro His Asn Gln Lys Gly Asn Trp Lys Asn
20 25 30
Val Pro Ser Asn Tyr His Tyr Cys Pro Ser Ser Ser Asp Leu Asn Trp
35 40 45
His Asn Asp Leu Val Gly Thr Ala Leu Gln Val Lys Met Pro Lys Ser
50 55 60
His Lys Ala Ile Gln Ala Asp Gly Trp Met Cys His Ala Ser Lys Trp
65 70 75 80
Val Thr Thr Cys Asp Phe Arg Trp Tyr Gly Pro Lys Tyr Ile Thr His
85 90 95
Ser Ile Arg Ser Phe Thr Pro Ser Val Glu Gln Cys Lys Glu Ser Ile
100 105 110
Glu Gln Thr Lys Gln Gly Thr Trp Leu Asn Pro Gly Phe Pro Pro Gln
115 120 125
Ser Cys Gly Tyr Ala Thr Val Thr Asp Ala Glu Ala Ala Ile Val Gln
130 135 140
Val Thr Pro His His Val Leu Val Asp Glu Tyr Thr Gly Glu Trp Val
145 150 155 160
Asp Ser Gln Phe Ile Asn Gly Lys Cys Ser Asn Asp Ile Cys Pro Thr
165 170 175
Val His Asn Ser Thr Thr Trp His Ser Asp Tyr Lys Val Lys Gly Leu
180 185 190
Cys Asp Ser Asn Leu Ile Ser Met Asp Ile Thr Phe Phe Ser Glu Asp
195 200 205
Gly Glu Leu Ser Ser Leu Gly Lys Lys Gly Thr Gly Phe Arg Ser Asn
210 215 220
Tyr Phe Ala Tyr Glu Thr Gly Asp Lys Ala Cys Lys Met Gln Tyr Cys
225 230 235 240
Lys His Trp Gly Val Arg Leu Pro Ser Gly Val Trp Phe Glu Met Ala
245 250 255
Asp Lys Asp Leu Phe Ala Ala Ala Arg Phe Pro Glu Cys Pro Glu Gly
260 265 270
Ser Ser Ile Ser Ala Pro Ser Gln Thr Ser Val Asp Val Ser Leu Ile
275 280 285
Gln Asp Val Glu Arg Ile Leu Asp Tyr Ser Leu Cys Gln Glu Thr Trp
290 295 300
Ser Lys Ile Arg Ala Gly Leu Pro Ile Ser Pro Val Asp Leu Ser Tyr
305 310 315 320
Leu Ala Pro Lys Asn Pro Gly Thr Gly Pro Val Phe Thr Ile Ile Asn
325 330 335
Gly Thr Leu Lys Tyr Phe Glu Thr Arg Tyr Ile Arg Val Asp Ile Ala
340 345 350
Ala Pro Ile Leu Ser Arg Met Val Gly Met Ile Ser Gly Thr Thr Thr
355 360 365
Glu Arg Val Leu Trp Asp Asp Trp Ala Pro Tyr Glu Asp Val Gly Ile
370 375 380
Gly Pro Asn Gly Val Leu Arg Thr Ser Ser Gly Tyr Lys Phe Pro Leu
385 390 395 400
Tyr Met Ile Gly His Gly Met Leu Asp Ser Asp Leu His Leu Ser Ser
405 410 415
Lys Ala Gln Val Phe Glu His Pro His Ile Gln Asp Ala Ala Ser Gln
420 425 430
Leu Pro Asp Gly Glu Thr Leu Phe Phe Gly Asp Thr Gly Leu Ser Lys
435 440 445
Asn Pro Ile Glu Phe Val Glu Gly Trp Phe Ser Ser Trp Lys Ser Ser
450 455 460
Ile Ala Ser Phe Phe Phe Thr Ile Gly Leu Ile Ile Gly Leu Phe Leu
465 470 475 480
Val Leu Arg Val Gly Ile Tyr Leu Cys Ile Lys Leu Lys His Thr Lys
485 490 495
Lys Arg Gln Ile Tyr Thr Asp Ile Glu Met Asn Arg Leu Gly Thr
500 505 510
【配列表】