(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023153268
(43)【公開日】2023-10-17
(54)【発明の名称】産生細胞株エンハンサー
(51)【国際特許分類】
C12N 15/12 20060101AFI20231005BHJP
C12N 15/13 20060101ALI20231005BHJP
C12N 5/10 20060101ALI20231005BHJP
C12P 21/08 20060101ALN20231005BHJP
【FI】
C12N15/12 ZNA
C12N15/13
C12N5/10
C12P21/08
【審査請求】有
【請求項の数】1
【出願形態】OL
(21)【出願番号】P 2023134346
(22)【出願日】2023-08-22
(62)【分割の表示】P 2021212131の分割
【原出願日】2013-05-29
(31)【優先権主張番号】61/652,549
(32)【優先日】2012-05-29
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】13/904,587
(32)【優先日】2013-05-29
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】507302748
【氏名又は名称】リジェネロン・ファーマシューティカルズ・インコーポレイテッド
(74)【代理人】
【識別番号】100102978
【弁理士】
【氏名又は名称】清水 初志
(74)【代理人】
【識別番号】100205707
【弁理士】
【氏名又は名称】小寺 秀紀
(74)【代理人】
【識別番号】100160923
【弁理士】
【氏名又は名称】山口 裕孝
(74)【代理人】
【識別番号】100119507
【弁理士】
【氏名又は名称】刑部 俊
(74)【代理人】
【識別番号】100142929
【弁理士】
【氏名又は名称】井上 隆一
(74)【代理人】
【識別番号】100148699
【弁理士】
【氏名又は名称】佐藤 利光
(74)【代理人】
【識別番号】100188433
【弁理士】
【氏名又は名称】梅村 幸輔
(74)【代理人】
【識別番号】100128048
【弁理士】
【氏名又は名称】新見 浩一
(74)【代理人】
【識別番号】100129506
【弁理士】
【氏名又は名称】小林 智彦
(74)【代理人】
【識別番号】100114340
【弁理士】
【氏名又は名称】大関 雅人
(74)【代理人】
【識別番号】100214396
【弁理士】
【氏名又は名称】塩田 真紀
(74)【代理人】
【識別番号】100121072
【弁理士】
【氏名又は名称】川本 和弥
(72)【発明者】
【氏名】チェン ギャング
(72)【発明者】
【氏名】ブラコフ ダリア
(72)【発明者】
【氏名】デシュパンデ ジパーリ
(57)【要約】
【課題】有用な多サブユニットタンパク質の収量を改善するための方法の提供。
【解決手段】小胞体分解促進性αマンノシダーゼ様タンパク質2(EDEM2)をコードする組換えポリヌクレオチドを含有する、標準的な生物製剤産生哺乳動物細胞のCHO細胞などの産生細胞株を提供する。また、EDEM2をコードするポリヌクレオチドとXBP1をコードするポリヌクレオチドの両方を含有する産生細胞。これらの細胞株により産生された抗体の力価の向上、ならびに、培養中のこれらの細胞により達成された細胞密度の向上。
【選択図】なし
【特許請求の範囲】
【請求項1】
ストレス誘導性マンノース結合レクチンをコードする組換えポリヌクレオチドと、多サブユニットタンパク質をコードするポリヌクレオチドとを含む、細胞。
【請求項2】
前記ストレス誘導性マンノース結合レクチンが小胞体分解促進性αマンノシダーゼ様タンパク質2(EDEM2)である、請求項1に記載の細胞。
【請求項3】
前記EDEM2が、SEQ ID NO:8のアミノ酸配列を含む、請求項2に記載の細胞。
【請求項4】
前記EDEM2が、SEQ ID NO:1と少なくとも92%同一であるアミノ酸配列を含む、請求項2に記載の細胞。
【請求項5】
前記多サブユニットタンパク質が抗体である、請求項1~4のいずれか一項に記載の細胞。
【請求項6】
前記抗体が、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、およびSEQ ID NO:46のアミノ酸配列を含む、請求項5に記載の細胞。
【請求項7】
EDEM2の上流ではたらく小胞体ストレス応答転写因子をコードするポリヌクレオチドを含む、請求項1~6のいずれか一項に記載の細胞。
【請求項8】
前記転写因子が、XBP-1のスプライスされた形態である、請求項7に記載の細胞。
【請求項9】
前記XBP-1が、SEQ ID NO:13のアミノ酸配列を含む、請求項8に記載の細胞。
【請求項10】
前記XBP-1が、SEQ ID NO:9と少なくとも86%同一であるアミノ酸配列を含む、請求項8に記載の細胞。
【請求項11】
哺乳動物細胞である、請求項1~10のいずれか一項に記載の細胞。
【請求項12】
CHO細胞である、請求項1~11のいずれか一項に記載の細胞。
【請求項13】
請求項1~12のいずれか一項に記載の細胞に由来する、細胞株。
【請求項14】
少なくとも3g/Lの力価で前記タンパク質を産生する、請求項13に記載の細胞株。
【請求項15】
少なくとも5g/Lの力価で前記タンパク質を産生する、請求項13または請求項14に記載の細胞株。
【請求項16】
少なくとも8g/Lの力価で前記タンパク質を産生する、請求項13~15のいずれか一項に記載の細胞株。
【請求項17】
前記ストレス誘導性マンノース結合レクチンをコードする組換えポリヌクレオチドを含まない細胞株の積分細胞密度と比べて、少なくとも約30%大きい積分細胞密度を有する、請求項13~16のいずれか一項に記載の細胞株。
【請求項18】
前記ストレス誘導性マンノース結合レクチンをコードする組換えポリヌクレオチドを含まない細胞株の積分細胞密度と比べて、少なくとも約50%大きい積分細胞密度を有する、請求項13~17のいずれか一項に記載の細胞株。
【請求項19】
前記ストレス誘導性マンノース結合レクチンをコードする組換えポリヌクレオチドを含まない細胞株の積分細胞密度と比べて、少なくとも約60%大きい積分細胞密度を有する、請求項13~18のいずれか一項に記載の細胞株。
【請求項20】
前記ストレス誘導性マンノース結合レクチンをコードする組換えポリヌクレオチドを含まない細胞株の積分細胞密度と比べて、少なくとも約90%大きい積分細胞密度を有する、請求項13~19のいずれか一項に記載の細胞株。
【請求項21】
EDEM2をコードするヌクレオチド配列を含み、該ヌクレオチド配列が哺乳動物ユビキチンCプロモーターに機能的に連結されている、単離されたポリヌクレオチド。
【請求項22】
前記EDEM2が、SEQ ID NO:8のアミノ酸配列を含む、請求項21に記載の単離されたポリヌクレオチド。
【請求項23】
前記EDEM2が、SEQ ID NO:8のアミノ酸配列からなる、請求項21または請求項22に記載の単離されたポリヌクレオチド。
【請求項24】
前記EDEM2が、SEQ ID NO:1と少なくとも92%同一であるアミノ酸配列を含む、請求項21~23のいずれか一項に記載の単離されたポリヌクレオチド。
【請求項25】
前記EDEM2が、SEQ ID NO:1と少なくとも92%同一であるアミノ酸配列からなる、請求項21~24のいずれか一項に記載の単離されたポリヌクレオチド。
【請求項26】
前記EDEM2が、SEQ ID NO:1のアミノ酸配列を含む、請求項21~25のいずれか一項に記載の単離されたポリヌクレオチド。
【請求項27】
前記EDEM2が、SEQ ID NO:1のアミノ酸配列からなる、請求項21~26のいずれか一項に記載の単離されたポリヌクレオチド。
【請求項28】
SEQ ID NO:16のヌクレオチド配列を含む、請求項21~27のいずれか一項に記載のポリヌクレオチド。
【請求項29】
SEQ ID NO:14またはSEQ ID NO:15のヌクレオチド配列を含む、請求項21~28のいずれか一項に記載のポリヌクレオチド。
【請求項30】
SEQ ID NO:14またはSEQ ID NO:15のヌクレオチド配列から本質的になる、請求項21~29のいずれか一項に記載のポリヌクレオチド。
【請求項31】
Xbp-1タンパク質をコードするヌクレオチド配列を含み、該ヌクレオチド配列が哺乳動物ユビキチンCプロモーターに機能的に連結されている、単離されたポリヌクレオチド。
【請求項32】
前記Xbp-1タンパク質が、SEQ ID NO:13のアミノ酸配列を含む、請求項31に記載の単離されたポリヌクレオチド。
【請求項33】
前記Xbp-1タンパク質が、SEQ ID NO:13のアミノ酸配列からなる、請求項31または請求項32に記載の単離されたポリヌクレオチド。
【請求項34】
前記Xbp-1タンパク質が、SEQ ID NO:9と少なくとも86%同一であるアミノ酸配列を含む、請求項31~33のいずれか一項に記載の単離されたポリヌクレオチド。
【請求項35】
前記Xbp-1タンパク質が、SEQ ID NO:9と少なくとも86%同一であるアミノ酸配列からなる、請求項31~34のいずれか一項に記載の単離されたポリヌクレオチド。
【請求項36】
前記Xbp-1タンパク質が、SEQ ID NO:9のアミノ酸配列を含む、請求項31~35のいずれか一項に記載の単離されたポリヌクレオチド。
【請求項37】
前記Xbp-1タンパク質が、SEQ ID NO:9のアミノ酸配列からなる、請求項31~36のいずれか一項に記載の単離されたポリヌクレオチド。
【請求項38】
SEQ ID NO:18のヌクレオチド配列を含む、請求項31~37のいずれか一項に記載のポリヌクレオチド。
【請求項39】
SEQ ID NO:17のヌクレオチド配列を含む、請求項31~38のいずれか一項に記載のポリヌクレオチド。
【請求項40】
SEQ ID NO:17のヌクレオチド配列から本質的になる、請求項31~39のいずれか一項に記載のポリヌクレオチド。
【請求項41】
抗GDF8抗体重鎖をコードするヌクレオチド配列を含み、該ヌクレオチド配列が哺乳動物ユビキチンCプロモーターまたはヒトCMV-IEプロモーターに機能的に連結されている、単離されたポリヌクレオチド。
【請求項42】
前記抗GDF8抗体重鎖が、SEQ ID NO:20のアミノ酸配列を含む、請求項41に記載の単離されたポリヌクレオチド。
【請求項43】
前記抗GDF8抗体重鎖が、SEQ ID NO:19のアミノ酸配列を含む、請求項41または請求項42に記載の単離されたポリヌクレオチド。
【請求項44】
前記抗GDF8抗体重鎖が、SEQ ID NO:19のアミノ酸配列からなる、請求項41~43のいずれか一項に記載の単離されたポリヌクレオチド。
【請求項45】
SEQ ID NO:23のヌクレオチド配列を含む、請求項41~44のいずれか一項に記載のポリヌクレオチド。
【請求項46】
SEQ ID NO:24のヌクレオチド配列を含む、請求項41~45のいずれか一項に記載のポリヌクレオチド。
【請求項47】
SEQ ID NO:24のヌクレオチド配列から本質的になる、請求項41~46のいずれか一項に記載のポリヌクレオチド。
【請求項48】
抗GDF8抗体軽鎖をコードするヌクレオチド配列を含み、該ヌクレオチド配列が哺乳動物ユビキチンCプロモーターまたはヒトCMV-IEプロモーターに機能的に連結されている、単離されたポリヌクレオチド。
【請求項49】
前記抗GDF8抗体軽鎖が、SEQ ID NO:22のアミノ酸配列を含む、請求項48に記載の単離されたポリヌクレオチド。
【請求項50】
前記抗GDF8抗体軽鎖が、SEQ ID NO:21のアミノ酸配列を含む、請求項48または請求項49に記載の単離されたポリヌクレオチド。
【請求項51】
前記抗GDF8抗体軽鎖が、SEQ ID NO:21のアミノ酸配列からなる、請求項48~50のいずれか一項に記載の単離されたポリヌクレオチド。
【請求項52】
SEQ ID NO:25のヌクレオチド配列を含む、請求項48~51のいずれか一項に記載のポリヌクレオチド。
【請求項53】
SEQ ID NO:26のヌクレオチド配列を含む、請求項48~52のいずれか一項に記載のポリヌクレオチド。
【請求項54】
SEQ ID NO:26のヌクレオチド配列から本質的になる、請求項48~53のいずれか一項に記載のポリヌクレオチド。
【請求項55】
抗ANG2抗体重鎖をコードするヌクレオチド配列を含み、該ヌクレオチド配列が哺乳動物ユビキチンCプロモーターまたはヒトCMV-IEプロモーターに機能的に連結されている、単離されたポリヌクレオチド。
【請求項56】
前記抗ANG2抗体重鎖が、SEQ ID NO:28のアミノ酸配列を含む、請求項55に記載の単離されたポリヌクレオチド。
【請求項57】
前記抗ANG2抗体重鎖が、SEQ ID NO:27のアミノ酸配列を含む、請求項55または請求項56に記載の単離されたポリヌクレオチド。
【請求項58】
前記抗ANG2抗体重鎖が、SEQ ID NO:27のアミノ酸配列からなる、請求項55~57のいずれか一項に記載の単離されたポリヌクレオチド。
【請求項59】
SEQ ID NO:31のヌクレオチド配列を含む、請求項55~58のいずれか一項に記載のポリヌクレオチド。
【請求項60】
SEQ ID NO:32のヌクレオチド配列を含む、請求項55~59のいずれか一項に記載のポリヌクレオチド。
【請求項61】
SEQ ID NO:32のヌクレオチド配列から本質的になる、請求項55~60のいずれか一項に記載のポリヌクレオチド。
【請求項62】
抗ANG2抗体軽鎖をコードするヌクレオチド配列を含み、該ヌクレオチド配列が哺乳動物ユビキチンCプロモーターまたはヒトCMV-IEプロモーターに機能的に連結されている、単離されたポリヌクレオチド。
【請求項63】
前記抗ANG2抗体軽鎖が、SEQ ID NO:30のアミノ酸配列を含む、請求項62に記載の単離されたポリヌクレオチド。
【請求項64】
前記抗ANG2抗体軽鎖が、SEQ ID NO:29のアミノ酸配列を含む、請求項62または請求項63に記載の単離されたポリヌクレオチド。
【請求項65】
前記抗ANG2抗体軽鎖が、SEQ ID NO:29のアミノ酸配列からなる、請求項62~64のいずれか一項に記載の単離されたポリヌクレオチド。
【請求項66】
SEQ ID NO:33のヌクレオチド配列を含む、請求項62~65のいずれか一項に記載のポリヌクレオチド。
【請求項67】
SEQ ID NO:34のヌクレオチド配列を含む、請求項62~66のいずれか一項に記載のポリヌクレオチド。
【請求項68】
SEQ ID NO:34のヌクレオチド配列から本質的になる、請求項62~67のいずれか一項に記載のポリヌクレオチド。
【請求項69】
抗AngPtl4抗体重鎖をコードするヌクレオチド配列を含み、該ヌクレオチド配列が哺乳動物ユビキチンCプロモーターまたはヒトCMV-IEプロモーターに機能的に連結されている、単離されたポリヌクレオチド。
【請求項70】
前記抗AngPtl4抗体重鎖が、SEQ ID NO:36のアミノ酸配列を含む、請求項69に記載の単離されたポリヌクレオチド。
【請求項71】
前記抗AngPtl4抗体重鎖が、SEQ ID NO:35のアミノ酸配列を含む、請求項69または請求項70に記載の単離されたポリヌクレオチド。
【請求項72】
前記抗AngPtl4抗体重鎖が、SEQ ID NO:35のアミノ酸配列からなる、請求項69~71のいずれか一項に記載の単離されたポリヌクレオチド。
【請求項73】
SEQ ID NO:39のヌクレオチド配列を含む、請求項69~72のいずれか一項に記載のポリヌクレオチド。
【請求項74】
SEQ ID NO:40のヌクレオチド配列を含む、請求項69~73のいずれか一項に記載のポリヌクレオチド。
【請求項75】
SEQ ID NO:40のヌクレオチド配列から本質的になる、請求項69~74のいずれか一項に記載のポリヌクレオチド。
【請求項76】
抗AngPtl4抗体軽鎖をコードするヌクレオチド配列を含み、該ヌクレオチド配列が哺乳動物ユビキチンCプロモーターまたはヒトCMV-IEプロモーターに機能的に連結されている、単離されたポリヌクレオチド。
【請求項77】
前記抗AngPtl4抗体軽鎖が、SEQ ID NO:38のアミノ酸配列を含む、請求項76に記載の単離されたポリヌクレオチド。
【請求項78】
前記抗AngPtl4抗体軽鎖が、SEQ ID NO:37のアミノ酸配列を含む、請求項76または請求項77に記載の単離されたポリヌクレオチド。
【請求項79】
前記抗AngPtl4抗体軽鎖が、SEQ ID NO:37のアミノ酸配列からなる、請求項76~78のいずれか一項に記載の単離されたポリヌクレオチド。
【請求項80】
SEQ ID NO:41のヌクレオチド配列を含む、請求項76~79のいずれか一項に記載のポリヌクレオチド。
【請求項81】
SEQ ID NO:42のヌクレオチド配列を含む、請求項76~80のいずれか一項に記載のポリヌクレオチド。
【請求項82】
SEQ ID NO:42のヌクレオチド配列から本質的になる、請求項76~81のいずれか一項に記載のポリヌクレオチド。
【請求項83】
SEQ ID NO:43のアミノ酸配列を含むポリペプチドをコードする、単離されたポリヌクレオチド。
【請求項84】
SEQ ID NO:44のアミノ酸配列を含むポリペプチドをコードする、単離されたポリヌクレオチド。
【請求項85】
SEQ ID NO:43およびSEQ ID NO:44のアミノ酸配列を含むポリペプチドをコードする、単離されたポリヌクレオチド。
【請求項86】
SEQ ID NO:45のアミノ酸配列を含むポリペプチドをコードする、単離されたポリヌクレオチド。
【請求項87】
SEQ ID NO:46のアミノ酸配列を含むポリペプチドをコードする、単離されたポリヌクレオチド。
【請求項88】
SEQ ID NO:45およびSEQ ID NO:46のアミノ酸配列を含むポリペプチドをコードする、単離されたポリヌクレオチド。
【請求項89】
請求項21~30のいずれか一項に記載の単離されたポリヌクレオチドと、(b)多サブユニットタンパク質をコードするポリヌクレオチドとを含む、細胞。
【請求項90】
前記多サブユニットタンパク質が抗体である、請求項89に記載の細胞。
【請求項91】
前記抗体が、請求項83~88のいずれか一項に記載のアミノ酸配列を含む、請求項90に記載の細胞。
【請求項92】
前記抗体が、請求項85および88に記載のアミノ酸配列を含む、請求項91に記載の細胞。
【請求項93】
請求項31~40のいずれか一項に記載のポリヌクレオチドをさらに含む、請求項89~92のいずれか一項に記載の細胞。
【請求項94】
請求項41~47のいずれか一項に記載のポリヌクレオチドと請求項48~54のいずれか一項に記載のポリヌクレオチドとを含む、請求項89~93のいずれか一項に記載の細胞。
【請求項95】
請求項55~61のいずれか一項に記載のポリヌクレオチドと請求項62~68のいずれか一項に記載のポリヌクレオチドとを含む、請求項89~93のいずれか一項に記載の細胞。
【請求項96】
請求項69~75のいずれか一項に記載のポリヌクレオチドと請求項76~82のいずれか一項に記載のポリヌクレオチドとを含む、請求項89~93のいずれか一項に記載の細胞。
【請求項97】
チャイニーズハムスター卵巣(CHO)細胞である、請求項89~96のいずれか一項に記載の細胞。
【請求項98】
請求項89~97のいずれか一項に記載の細胞を培地中で培養する段階を含む、多サブユニットタンパク質を生成する方法であって、該多サブユニットタンパク質が該細胞によって該培地に分泌される、方法。
【請求項99】
分泌された前記多サブユニットタンパク質が、少なくとも約3g/Lの培地中力価に達する、請求項98に記載の方法。
【請求項100】
前記分泌された多サブユニットタンパク質が、少なくとも約5g/Lの培地中力価に達する、請求項98または請求項99に記載の方法。
【請求項101】
前記分泌された多サブユニットタンパク質が、少なくとも約6g/Lの培地中力価に達する、請求項89~91のいずれか一項に記載の方法。
【請求項102】
前記分泌された多サブユニットタンパク質が、少なくとも約8g/Lの培地中力価に達する、請求項89~92のいずれか一項に記載の方法。
【請求項103】
前記細胞が、前記培地中で少なくとも約5×107細胞-日/mLの積分細胞密度まで分裂する、請求項89~93のいずれか一項に記載の方法。
【請求項104】
前記細胞が、前記培地中で分裂して、少なくとも約1×108細胞-日/mLの積分細胞密度をもたらす、請求項89~94のいずれか一項に記載の方法。
【請求項105】
前記細胞が、前記培地中で分裂して、少なくとも約1.5×108細胞-日/mLの積分細胞密度をもたらす、請求項89~95のいずれか一項に記載の方法。
【請求項106】
前記分泌された多サブユニットタンパク質を前記培地から精製する段階をさらに含む、請求項89~96のいずれか一項に記載の方法。
【請求項107】
請求項98~106のいずれか一項に記載の方法により産生された、多サブユニットタンパク質。
【請求項108】
抗体である、請求項107に記載の多サブユニットタンパク質。
【請求項109】
前記抗体が、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、およびSEQ ID NO:46のアミノ酸配列を含む、請求項108に記載の多サブユニットタンパク質。
【請求項110】
前記抗体が抗GDF8抗体である、請求項109に記載の多サブユニットタンパク質。
【請求項111】
前記抗体が、SEQ ID NO:20およびSEQ ID NO:22のアミノ酸配列を含む、請求項110に記載の多サブユニットタンパク質。
【請求項112】
前記抗体が抗ANG2抗体である、請求項109に記載の多サブユニットタンパク質。
【請求項113】
前記抗体が、SEQ ID NO:28およびSEQ ID NO:30のアミノ酸配列を含む、請求項112に記載の多サブユニットタンパク質。
【請求項114】
前記抗体が抗AngPtl4抗体である、請求項109に記載の多サブユニットタンパク質。
【請求項115】
前記抗体が、SEQ ID NO:36およびSEQ ID NO:38のアミノ酸配列を含む、請求項114に記載の多サブユニットタンパク質。
【請求項116】
SEQ ID NO:16の核酸配列を含むポリヌクレオチドを含有する、エクスビボ哺乳動物細胞。
【請求項117】
(a)SEQ ID NO:16の核酸配列を含むポリヌクレオチドと、(b)SEQ ID NO:18の核酸配列を含むポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
【請求項118】
(a)SEQ ID NO:16の核酸配列を含むポリヌクレオチドと、(b)SEQ ID NO:43およびSEQ ID NO:44のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドと、(c)SEQ ID NO:45およびSEQ ID NO:46のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
【請求項119】
(a)SEQ ID NO:16の核酸配列を含むポリヌクレオチドと、(b)SEQ ID NO:23の核酸配列を含むポリヌクレオチドと、(c)SEQ ID NO:25の核酸配列を含むポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
【請求項120】
(a)SEQ ID NO:16の核酸配列を含むポリヌクレオチドと、(b)SEQ ID NO:31の核酸配列を含むポリヌクレオチドと、(c)SEQ ID NO:33の核酸配列を含むポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
【請求項121】
(a)SEQ ID NO:16の核酸配列を含むポリヌクレオチドと、(b)SEQ ID NO:39の核酸配列を含むポリヌクレオチドと、(c)SEQ ID NO:41の核酸配列を含むポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
【請求項122】
(a)SEQ ID NO:16の核酸配列を含むポリヌクレオチドと、(b)SEQ ID NO:18の核酸配列を含むポリヌクレオチドと、(c)SEQ ID NO:43およびSEQ ID NO:44のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドと、(d)SEQ ID NO:45およびSEQ ID NO:46のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
【請求項123】
(a)SEQ ID NO:16の核酸配列を含むポリヌクレオチドと、(b)SEQ ID NO:18の核酸配列を含むポリヌクレオチドと、(c)SEQ ID NO:23の核酸配列を含むポリヌクレオチドと、(d)SEQ ID NO:25の核酸配列を含むポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
【請求項124】
(a)SEQ ID NO:16の核酸配列を含むポリヌクレオチドと、(b)SEQ ID NO:18の核酸配列を含むポリヌクレオチドと、(c)SEQ ID NO:31の核酸配列を含むポリヌクレオチドと、(d)SEQ ID NO:33の核酸配列を含むポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
【請求項125】
(a)SEQ ID NO:16の核酸配列を含むポリヌクレオチドと、(b)SEQ ID NO:18の核酸配列を含むポリヌクレオチドと、(c)SEQ ID NO:39の核酸配列を含むポリヌクレオチドと、(d)SEQ ID NO:41の核酸配列を含むポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
【請求項126】
SEQ ID NO:14または15の核酸配列からなるポリヌクレオチドを含有する、エクスビボ哺乳動物細胞。
【請求項127】
(a)SEQ ID NO:14または15の核酸配列からなるポリヌクレオチドと、(b)SEQ ID NO:17の核酸配列からなるポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
【請求項128】
(a)SEQ ID NO:14または15の核酸配列からなるポリヌクレオチドと、(b)SEQ ID NO:43およびSEQ ID NO:44のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドと、(c)SEQ ID NO:45およびSEQ ID NO:46のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
【請求項129】
(a)SEQ ID NO:14または15の核酸配列からなるポリヌクレオチドと、(b)SEQ ID NO:24の核酸配列からなるポリヌクレオチドと、(c)SEQ ID NO:26の核酸配列からなるポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
【請求項130】
(a)SEQ ID NO:14または15の核酸配列からなるポリヌクレオチドと、(b)SEQ ID NO:32の核酸配列からなるポリヌクレオチドと、(c)SEQ ID NO:4の核酸配列からなるポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
【請求項131】
(a)SEQ ID NO:14または15の核酸配列からなるポリヌクレオチドと、(b)SEQ ID NO:40の核酸配列からなるポリヌクレオチドと、(c)SEQ ID NO:42の核酸配列からなるポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
【請求項132】
(a)SEQ ID NO:14または15の核酸配列からなるポリヌクレオチドと、(b)SEQ ID NO:17の核酸配列からなるポリヌクレオチドと、(c)SEQ ID NO:43およびSEQ ID NO:44のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドと、(d)SEQ ID NO:45およびSEQ ID NO:46のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
【請求項133】
(a)SEQ ID NO:14または15の核酸配列からなるポリヌクレオチドと、(b)SEQ ID NO:17の核酸配列からなるポリヌクレオチドと、(c)SEQ ID NO:24の核酸配列からなるポリヌクレオチドと、(d)SEQ ID NO:26の核酸配列からなるポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
【請求項134】
(a)SEQ ID NO:14または15の核酸配列からなるポリヌクレオチドと、(b)SEQ ID NO:17の核酸配列からなるポリヌクレオチドと、(c)SEQ ID NO:32の核酸配列からなるポリヌクレオチドと、(d)SEQ ID NO:34の核酸配列からなるポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
【請求項135】
(a)SEQ ID NO:14または15の核酸配列からなるポリヌクレオチドと、(b)SEQ ID NO:17の核酸配列からなるポリヌクレオチドと、(c)SEQ ID NO:40の核酸配列からなるポリヌクレオチドと、(d)SEQ ID NO:42の核酸配列からなるポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2012年5月29日に出願された米国仮特許出願第61/652,549号に対する米国特許法第119条(e)の下での恩典を主張するものであり、この出願はその全体が参照により本明細書に組み入れられる。
【0002】
分野
本発明は、多サブユニットタンパク質の産生を改善するための、組換えストレス応答レクチンを発現する1個の細胞または複数の細胞に関する。具体的には、本発明は、EDEM2をコードする遺伝子を含み、かつ高力価の抗体を産生する哺乳動物細胞、およびそれに由来する細胞株を提供する。
【背景技術】
【0003】
背景
治療的に活性なタンパク質の製造は、分泌に先立って適切なフォールディングとプロセッシングを必要とする。適切なフォールディングは、分泌前に適切に組み立てられる必要がある複数のサブユニットから構成される、抗体などのタンパク質に特に直接的に関連する。真核細胞は、タンパク質の適切なフォールディングと、分泌経路からのミスフォールドしたタンパク質の除去とを確実にするシステムに適応している。このシステムは小胞体ストレス応答(unfolded protein response)(UPR)経路と呼ばれており、それは小胞体(ER)におけるミスフォールドしたタンパク質の蓄積によって誘発される。
【0004】
UPRの初期イベントは転写因子Xbp1の活性化であり、これが次に、小胞体関連分解(ERAD)経路のメンバーである小胞体分解促進性αマンノシダーゼ様タンパク質2(EDEM2)の転写を活性化する。EDEM2はミスフォールドしたタンパク質の除去を容易にする。ERAD経路は5つの段階を含む:(1)変質したタンパク質のシャペロン介在性認識;(2)EDEM2を含む、逆行輸送(retrotranslocation)機構またはE3リガーゼへの変質したタンパク質のターゲティング;(3)逆行輸送の開始;(4)ユビキチン化およびさらなる逆行輸送;ならびに(5)プロテオソームターゲティングおよび分解。
【0005】
抗体は、2本の重鎖と2本の軽鎖を含む多サブユニットタンパク質であり、機能的なヘテロ四量体を形成するためには適切に折りたたまれて結合されねばならない。機能的な抗体ヘテロ四量体の収量または力価を向上させるために、重鎖と軽鎖の効率的かつ正確なプロセッシングの何らかの改善が望まれている。
【発明の概要】
【0006】
概要
本出願人らは、タンパク質産生細胞株におけるEDEM2の異所性発現が、細胞あたりのタンパク質の平均出力を増加させ、培地に分泌されるタンパク質の力価を増加させ、産生細胞株の積分細胞密度を増加させる、という驚くべき発見をした。
【0007】
したがって、一局面において、本発明は、(a)ストレス誘導性マンノース結合レクチンをコードする組換えポリヌクレオチドと、(b)多サブユニットタンパク質をコードするポリヌクレオチドとを含有する、細胞を提供する。いくつかの態様では、ストレス誘導性マンノース結合レクチンはEDEM2タンパク質であり、その非限定的な例が表1に提供され、かつ多サブユニットタンパク質は抗体である。他の態様では、該細胞はまた、XBP1のスプライスされた活性形態をコードするポリヌクレオチドを含有し、その非限定的な例が表2に提供される。一態様では、該細胞は、生物製剤の製造に使用されるCHO細胞などの哺乳動物細胞である。
【0008】
別の局面において、本発明は、前述の局面で説明した細胞に由来する細胞株を提供する。「~に由来する」とは、それが意味するものは、個々の細胞からのクローン的な子孫であり、かついくつかの優れた性質、例えば、活性タンパク質を既定の力価で産生する能力、または特定の密度に増殖する能力などを有する、細胞の集団のことである。いくつかの態様では、細胞株は、ストレス誘導性マンノース結合レクチンをコードする組換えポリヌクレオチドおよび多サブユニットタンパク質をコードするポリヌクレオチドを保有する細胞に由来するものであり、多サブユニットタンパク質を培地1リットルあたり少なくとも3グラム(g/L)、少なくとも5g/L、または少なくとも8g/Lの力価で産生することが可能である。いくつかの態様では、細胞株は、本質的に同じ細胞であるものに由来するがストレス誘導性マンノース結合レクチンをコードする組換えポリヌクレオチドを含まない細胞株によって達成される積分細胞密度よりも、少なくとも30%大きい、少なくとも50%大きい、少なくとも60%大きい、または少なくとも90%大きい積分細胞密度(integrated cell density)(ICD)を達成することができる。
【0009】
別の局面において、本発明は、EDEM2タンパク質をコードする核酸配列を含み、該核酸配列が、ユビキチンCプロモーターなどの普遍的に発現される構成的な哺乳動物プロモーターに(シスで)機能的に連結されている、単離されたまたは組換えポリヌクレオチドを提供する。いくつかの態様では、EDEM2タンパク質は、SEQ ID NO:8のアミノ酸、またはSEQ ID NO:1~7のいずれかと少なくとも92%同一であるアミノ酸配列を有する。いくつかの態様では、ポリヌクレオチドはSEQ ID NO:16の核酸配列を含む。ある特定の態様では、ポリヌクレオチドはSEQ ID NO:14の核酸配列からなり;別の特定の態様では、SEQ ID NO:15の核酸配列からなる。
【0010】
別の局面において、本発明は、XBP1タンパク質をコードする核酸配列を含み、該核酸配列が、ユビキチンCプロモーターなどの普遍的に発現される構成的な哺乳動物プロモーターに(シスで)機能的に連結されている、単離されたまたは組換えポリヌクレオチドを提供する。いくつかの態様では、XBP1タンパク質は、SEQ ID NO:13のアミノ酸、またはSEQ ID NO:9~12のいずれかと少なくとも86%同一であるアミノ酸配列を有する。いくつかの態様では、ポリヌクレオチドはSEQ ID NO:18の核酸配列を含む。ある特定の態様では、ポリヌクレオチドはSEQ ID NO:17の核酸配列からなる。
【0011】
別の局面において、本発明は、前述の局面で説明したような、EDEM2をコードするポリヌクレオチドと、抗体などの多サブユニットタンパク質をコードするポリヌクレオチドとを含有する細胞を提供する。いくつかの態様では、細胞はまた、前述の局面で説明したような、XBP1をコードするポリヌクレオチドを含有する。一態様では、多サブユニットタンパク質は抗体であり、抗体の重鎖はSEQ ID NO:43およびSEQ ID NO:44のアミノ酸配列を含み、抗体の軽鎖はSEQ ID NO:45およびSEQ ID NO:46のアミノ酸配列を含む。このいくつかの態様では、多サブユニットタンパク質の各ポリペプチドサブユニットは、別々のポリヌクレオチドによりコードされる。こうして、例えば、抗体をコードするポリヌクレオチドは、重鎖をコードするポリヌクレオチドと軽鎖をコードするポリヌクレオチド、それゆえに2つのサブユニットを含むことができる。いくつかの態様では、細胞はチャイニーズハムスター卵巣(CHO)細胞である。
【0012】
一態様では、コードされる多サブユニットタンパク質は、SEQ ID NO:20の重鎖可変領域アミノ酸配列およびSEQ ID NO:22の軽鎖可変領域アミノ酸配列を有する抗GDF8抗体である。一態様では、抗GDF8抗体は、SEQ ID NO:19のアミノ酸配列を有する重鎖およびSEQ ID NO:21のアミノ酸配列を有する軽鎖を含む。一態様では、抗GDF8抗体の重鎖をコードするポリヌクレオチドはSEQ ID NO:23の核酸配列を含み;抗GDF8抗体の軽鎖をコードするポリヌクレオチドはSEQ ID NO:25の核酸配列を含む。一態様では、抗GDF8抗体の重鎖をコードするポリヌクレオチドはSEQ ID NO:24の核酸配列からなり;抗GDF8抗体の軽鎖をコードするポリヌクレオチドはSEQ ID NO:25の核酸配列からなる。
【0013】
別の態様では、コードされる多サブユニットタンパク質は、SEQ ID NO:28の重鎖可変領域アミノ酸配列およびSEQ ID NO:30の軽鎖可変領域アミノ酸配列を有する抗ANG2抗体である。一態様では、抗ANG2抗体は、SEQ ID NO:27のアミノ酸配列を有する重鎖およびSEQ ID NO:29のアミノ酸配列を有する軽鎖を含む。一態様では、抗ANG2抗体の重鎖をコードするポリヌクレオチドはSEQ ID NO:31の核酸配列を含み;抗ANG2抗体の軽鎖をコードするポリヌクレオチドはSEQ ID NO:33の核酸配列を含む。一態様では、抗ANG2抗体の重鎖をコードするポリヌクレオチドはSEQ ID NO:32の核酸配列からなり;抗ANG2抗体の軽鎖をコードするポリヌクレオチドはSEQ ID NO:34の核酸配列からなる。
【0014】
別の態様では、コードされる多サブユニットタンパク質は、SEQ ID NO:36の重鎖可変領域アミノ酸配列およびSEQ ID NO:38の軽鎖可変領域アミノ酸配列を有する抗ANGPTL4抗体である。一態様では、抗ANGPTL4抗体は、SEQ ID NO:35のアミノ酸配列を有する重鎖およびSEQ ID NO:37のアミノ酸配列を有する軽鎖を含む。一態様では、抗ANGPTL4抗体の重鎖をコードするポリヌクレオチドはSEQ ID NO:39の核酸配列を含み;抗ANGPTL4抗体の軽鎖をコードするポリヌクレオチドはSEQ ID NO:41の核酸配列を含む。一態様では、抗ANGPTL4抗体の重鎖をコードするポリヌクレオチドはSEQ ID NO:40の核酸配列からなり;抗ANGPTL4抗体の軽鎖をコードするポリヌクレオチドはSEQ ID NO:42の核酸配列からなる。
【0015】
別の局面において、本発明は、前述の局面の細胞を培地で培養することによって、多サブユニットタンパク質を製造する方法を提供し、多サブユニットタンパク質は該細胞内で合成され、続いて培地中に分泌される。いくつかの態様では、多サブユニットタンパク質は抗体であり、例えば、抗GDF8、抗ANG2、抗ANGPTL4、またはSEQ ID NO:43および44の重鎖配列とSEQ ID NO:45および46の軽鎖配列を有する抗体である。いくつかの態様では、多サブユニットタンパク質は、少なくとも3g/L、少なくとも5g/L、少なくとも6g/L、または少なくとも8g/Lの力価に達する。いくつかの態様では、細胞は、培地中で増殖し、約≧5×107細胞-日/mL、約≧1×108細胞-日/mL、または約≧1.5×108細胞-日/mLの積分細胞密度を確立する。
【0016】
別の局面において、本発明は、前述の局面で説明した方法に従って製造される、多サブユニットタンパク質を提供する。一態様では、製造されるタンパク質は抗体である。いくつかの態様では、抗体は、SEQ ID NO:43およびSEQ ID NO:44のアミノ酸配列を含む重鎖と、SEQ ID NO:45およびSEQ ID NO:46のアミノ酸配列を含む軽鎖からなる。ある特定の態様では、製造される多サブユニットタンパク質は、SEQ ID NO:20の重鎖可変領域アミノ酸配列およびSEQ ID NO:22の軽鎖可変領域アミノ酸配列を有する抗GDF8抗体である。別の特定の態様では、製造される多サブユニットタンパク質は、SEQ ID NO:28の重鎖可変領域アミノ酸配列およびSEQ ID NO:30の軽鎖可変領域アミノ酸配列を有する抗ANG2抗体である。さらに別の特定の態様では、製造される多サブユニットタンパク質は、SEQ ID NO:36の重鎖可変領域アミノ酸配列およびSEQ ID NO:38の軽鎖可変領域アミノ酸配列を有する抗ANGPTL4抗体である。
[本発明1001]
ストレス誘導性マンノース結合レクチンをコードする組換えポリヌクレオチドと、多サブユニットタンパク質をコードするポリヌクレオチドとを含む、細胞。
[本発明1002]
前記ストレス誘導性マンノース結合レクチンが小胞体分解促進性αマンノシダーゼ様タンパク質2(EDEM2)である、本発明1001の細胞。
[本発明1003]
前記EDEM2が、SEQ ID NO:8のアミノ酸配列を含む、本発明1002の細胞。
[本発明1004]
前記EDEM2が、SEQ ID NO:1と少なくとも92%同一であるアミノ酸配列を含む、本発明1002の細胞。
[本発明1005]
前記多サブユニットタンパク質が抗体である、本発明1001~1004のいずれかの細胞。
[本発明1006]
前記抗体が、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、およびSEQ ID NO:46のアミノ酸配列を含む、本発明1005の細胞。
[本発明1007]
EDEM2の上流ではたらく小胞体ストレス応答転写因子をコードするポリヌクレオチドを含む、本発明1001~1006のいずれかの細胞。
[本発明1008]
前記転写因子が、XBP-1のスプライスされた形態である、本発明1007の細胞。
[本発明1009]
前記XBP-1が、SEQ ID NO:13のアミノ酸配列を含む、本発明1008の細胞。
[本発明1010]
前記XBP-1が、SEQ ID NO:9と少なくとも86%同一であるアミノ酸配列を含む、本発明1008の細胞。
[本発明1011]
哺乳動物細胞である、本発明1001~1010のいずれかの細胞。
[本発明1012]
CHO細胞である、本発明1001~1011のいずれかの細胞。
[本発明1013]
本発明1001~1012のいずれかの細胞に由来する、細胞株。
[本発明1014]
少なくとも3g/Lの力価で前記タンパク質を産生する、本発明1013の細胞株。
[本発明1015]
少なくとも5g/Lの力価で前記タンパク質を産生する、本発明1013または本発明1014の細胞株。
[本発明1016]
少なくとも8g/Lの力価で前記タンパク質を産生する、本発明1013~1015のいずれかの細胞株。
[本発明1017]
前記ストレス誘導性マンノース結合レクチンをコードする組換えポリヌクレオチドを含まない細胞株の積分細胞密度と比べて、少なくとも約30%大きい積分細胞密度を有する、本発明1013~1016のいずれかの細胞株。
[本発明1018]
前記ストレス誘導性マンノース結合レクチンをコードする組換えポリヌクレオチドを含まない細胞株の積分細胞密度と比べて、少なくとも約50%大きい積分細胞密度を有する、本発明1013~1017のいずれかの細胞株。
[本発明1019]
前記ストレス誘導性マンノース結合レクチンをコードする組換えポリヌクレオチドを含まない細胞株の積分細胞密度と比べて、少なくとも約60%大きい積分細胞密度を有する、本発明1013~1018のいずれかの細胞株。
[本発明1020]
前記ストレス誘導性マンノース結合レクチンをコードする組換えポリヌクレオチドを含まない細胞株の積分細胞密度と比べて、少なくとも約90%大きい積分細胞密度を有する、本発明1013~1019のいずれかの細胞株。
[本発明1021]
EDEM2をコードするヌクレオチド配列を含み、該ヌクレオチド配列が哺乳動物ユビキチンCプロモーターに機能的に連結されている、単離されたポリヌクレオチド。
[本発明1022]
前記EDEM2が、SEQ ID NO:8のアミノ酸配列を含む、本発明1021の単離されたポリヌクレオチド。
[本発明1023]
前記EDEM2が、SEQ ID NO:8のアミノ酸配列からなる、本発明1021または本発明1022の単離されたポリヌクレオチド。
[本発明1024]
前記EDEM2が、SEQ ID NO:1と少なくとも92%同一であるアミノ酸配列を含む、本発明1021~1023のいずれかの単離されたポリヌクレオチド。
[本発明1025]
前記EDEM2が、SEQ ID NO:1と少なくとも92%同一であるアミノ酸配列からなる、本発明1021~1024のいずれかの単離されたポリヌクレオチド。
[本発明1026]
前記EDEM2が、SEQ ID NO:1のアミノ酸配列を含む、本発明1021~1025のいずれかの単離されたポリヌクレオチド。
[本発明1027]
前記EDEM2が、SEQ ID NO:1のアミノ酸配列からなる、本発明1021~1026のいずれかの単離されたポリヌクレオチド。
[本発明1028]
SEQ ID NO:16のヌクレオチド配列を含む、本発明1021~1027のいずれかのポリヌクレオチド。
[本発明1029]
SEQ ID NO:14またはSEQ ID NO:15のヌクレオチド配列を含む、本発明1021~1028のいずれかのポリヌクレオチド。
[本発明1030]
SEQ ID NO:14またはSEQ ID NO:15のヌクレオチド配列から本質的になる、本発明1021~1029のいずれかのポリヌクレオチド。
[本発明1031]
Xbp-1タンパク質をコードするヌクレオチド配列を含み、該ヌクレオチド配列が哺乳動物ユビキチンCプロモーターに機能的に連結されている、単離されたポリヌクレオチド。
[本発明1032]
前記Xbp-1タンパク質が、SEQ ID NO:13のアミノ酸配列を含む、本発明1031の単離されたポリヌクレオチド。
[本発明1033]
前記Xbp-1タンパク質が、SEQ ID NO:13のアミノ酸配列からなる、本発明1031または本発明1032の単離されたポリヌクレオチド。
[本発明1034]
前記Xbp-1タンパク質が、SEQ ID NO:9と少なくとも86%同一であるアミノ酸配列を含む、本発明1031~1033のいずれかの単離されたポリヌクレオチド。
[本発明1035]
前記Xbp-1タンパク質が、SEQ ID NO:9と少なくとも86%同一であるアミノ酸配列からなる、本発明1031~1034のいずれかの単離されたポリヌクレオチド。
[本発明1036]
前記Xbp-1タンパク質が、SEQ ID NO:9のアミノ酸配列を含む、本発明1031~1035のいずれかの単離されたポリヌクレオチド。
[本発明1037]
前記Xbp-1タンパク質が、SEQ ID NO:9のアミノ酸配列からなる、本発明1031~1036のいずれかの単離されたポリヌクレオチド。
[本発明1038]
SEQ ID NO:18のヌクレオチド配列を含む、本発明1031~1037のいずれかのポリヌクレオチド。
[本発明1039]
SEQ ID NO:17のヌクレオチド配列を含む、本発明1031~1038のいずれかのポリヌクレオチド。
[本発明1040]
SEQ ID NO:17のヌクレオチド配列から本質的になる、本発明1031~1039のいずれかのポリヌクレオチド。
[本発明1041]
抗GDF8抗体重鎖をコードするヌクレオチド配列を含み、該ヌクレオチド配列が哺乳動物ユビキチンCプロモーターまたはヒトCMV-IEプロモーターに機能的に連結されている、単離されたポリヌクレオチド。
[本発明1042]
前記抗GDF8抗体重鎖が、SEQ ID NO:20のアミノ酸配列を含む、本発明1041の単離されたポリヌクレオチド。
[本発明1043]
前記抗GDF8抗体重鎖が、SEQ ID NO:19のアミノ酸配列を含む、本発明1041または本発明1042の単離されたポリヌクレオチド。
[本発明1044]
前記抗GDF8抗体重鎖が、SEQ ID NO:19のアミノ酸配列からなる、本発明1041~1043のいずれかの単離されたポリヌクレオチド。
[本発明1045]
SEQ ID NO:23のヌクレオチド配列を含む、本発明1041~1044のいずれかのポリヌクレオチド。
[本発明1046]
SEQ ID NO:24のヌクレオチド配列を含む、本発明1041~1045のいずれかのポリヌクレオチド。
[本発明1047]
SEQ ID NO:24のヌクレオチド配列から本質的になる、本発明1041~1046のいずれかのポリヌクレオチド。
[本発明1048]
抗GDF8抗体軽鎖をコードするヌクレオチド配列を含み、該ヌクレオチド配列が哺乳動物ユビキチンCプロモーターまたはヒトCMV-IEプロモーターに機能的に連結されている、単離されたポリヌクレオチド。
[本発明1049]
前記抗GDF8抗体軽鎖が、SEQ ID NO:22のアミノ酸配列を含む、本発明1048の単離されたポリヌクレオチド。
[本発明1050]
前記抗GDF8抗体軽鎖が、SEQ ID NO:21のアミノ酸配列を含む、本発明1048または本発明1049の単離されたポリヌクレオチド。
[本発明1051]
前記抗GDF8抗体軽鎖が、SEQ ID NO:21のアミノ酸配列からなる、本発明1048~1050のいずれかの単離されたポリヌクレオチド。
[本発明1052]
SEQ ID NO:25のヌクレオチド配列を含む、本発明1048~1051のいずれかのポリヌクレオチド。
[本発明1053]
SEQ ID NO:26のヌクレオチド配列を含む、本発明1048~1052のいずれかのポリヌクレオチド。
[本発明1054]
SEQ ID NO:26のヌクレオチド配列から本質的になる、本発明1048~1053のいずれかのポリヌクレオチド。
[本発明1055]
抗ANG2抗体重鎖をコードするヌクレオチド配列を含み、該ヌクレオチド配列が哺乳動物ユビキチンCプロモーターまたはヒトCMV-IEプロモーターに機能的に連結されている、単離されたポリヌクレオチド。
[本発明1056]
前記抗ANG2抗体重鎖が、SEQ ID NO:28のアミノ酸配列を含む、本発明1055の単離されたポリヌクレオチド。
[本発明1057]
前記抗ANG2抗体重鎖が、SEQ ID NO:27のアミノ酸配列を含む、本発明1055または本発明1056の単離されたポリヌクレオチド。
[本発明1058]
前記抗ANG2抗体重鎖が、SEQ ID NO:27のアミノ酸配列からなる、本発明1055~1057のいずれかの単離されたポリヌクレオチド。
[本発明1059]
SEQ ID NO:31のヌクレオチド配列を含む、本発明1055~1058のいずれかのポリヌクレオチド。
[本発明1060]
SEQ ID NO:32のヌクレオチド配列を含む、本発明1055~1059のいずれかのポリヌクレオチド。
[本発明1061]
SEQ ID NO:32のヌクレオチド配列から本質的になる、本発明1055~1060のいずれかのポリヌクレオチド。
[本発明1062]
抗ANG2抗体軽鎖をコードするヌクレオチド配列を含み、該ヌクレオチド配列が哺乳動物ユビキチンCプロモーターまたはヒトCMV-IEプロモーターに機能的に連結されている、単離されたポリヌクレオチド。
[本発明1063]
前記抗ANG2抗体軽鎖が、SEQ ID NO:30のアミノ酸配列を含む、本発明1062の単離されたポリヌクレオチド。
[本発明1064]
前記抗ANG2抗体軽鎖が、SEQ ID NO:29のアミノ酸配列を含む、本発明1062または本発明1063の単離されたポリヌクレオチド。
[本発明1065]
前記抗ANG2抗体軽鎖が、SEQ ID NO:29のアミノ酸配列からなる、本発明1062~1064のいずれかの単離されたポリヌクレオチド。
[本発明1066]
SEQ ID NO:33のヌクレオチド配列を含む、本発明1062~1065のいずれかのポリヌクレオチド。
[本発明1067]
SEQ ID NO:34のヌクレオチド配列を含む、本発明1062~1066のいずれかのポリヌクレオチド。
[本発明1068]
SEQ ID NO:34のヌクレオチド配列から本質的になる、本発明1062~1067のいずれかのポリヌクレオチド。
[本発明1069]
抗AngPtl4抗体重鎖をコードするヌクレオチド配列を含み、該ヌクレオチド配列が哺乳動物ユビキチンCプロモーターまたはヒトCMV-IEプロモーターに機能的に連結されている、単離されたポリヌクレオチド。
[本発明1070]
前記抗AngPtl4抗体重鎖が、SEQ ID NO:36のアミノ酸配列を含む、本発明1069の単離されたポリヌクレオチド。
[本発明1071]
前記抗AngPtl4抗体重鎖が、SEQ ID NO:35のアミノ酸配列を含む、本発明1069または本発明1070の単離されたポリヌクレオチド。
[本発明1072]
前記抗AngPtl4抗体重鎖が、SEQ ID NO:35のアミノ酸配列からなる、本発明1069~1071のいずれかの単離されたポリヌクレオチド。
[本発明1073]
SEQ ID NO:39のヌクレオチド配列を含む、本発明1069~1072のいずれかのポリヌクレオチド。
[本発明1074]
SEQ ID NO:40のヌクレオチド配列を含む、本発明1069~1073のいずれかのポリヌクレオチド。
[本発明1075]
SEQ ID NO:40のヌクレオチド配列から本質的になる、本発明1069~1074のいずれかのポリヌクレオチド。
[本発明1076]
抗AngPtl4抗体軽鎖をコードするヌクレオチド配列を含み、該ヌクレオチド配列が哺乳動物ユビキチンCプロモーターまたはヒトCMV-IEプロモーターに機能的に連結されている、単離されたポリヌクレオチド。
[本発明1077]
前記抗AngPtl4抗体軽鎖が、SEQ ID NO:38のアミノ酸配列を含む、本発明1076の単離されたポリヌクレオチド。
[本発明1078]
前記抗AngPtl4抗体軽鎖が、SEQ ID NO:37のアミノ酸配列を含む、本発明1076または本発明1077の単離されたポリヌクレオチド。
[本発明1079]
前記抗AngPtl4抗体軽鎖が、SEQ ID NO:37のアミノ酸配列からなる、本発明1076~1078のいずれかの単離されたポリヌクレオチド。
[本発明1080]
SEQ ID NO:41のヌクレオチド配列を含む、本発明1076~1079のいずれかのポリヌクレオチド。
[本発明1081]
SEQ ID NO:42のヌクレオチド配列を含む、本発明1076~1080のいずれかのポリヌクレオチド。
[本発明1082]
SEQ ID NO:42のヌクレオチド配列から本質的になる、本発明1076~1081のいずれかのポリヌクレオチド。
[本発明1083]
SEQ ID NO:43のアミノ酸配列を含むポリペプチドをコードする、単離されたポリヌクレオチド。
[本発明1084]
SEQ ID NO:44のアミノ酸配列を含むポリペプチドをコードする、単離されたポリヌクレオチド。
[本発明1085]
SEQ ID NO:43およびSEQ ID NO:44のアミノ酸配列を含むポリペプチドをコードする、単離されたポリヌクレオチド。
[本発明1086]
SEQ ID NO:45のアミノ酸配列を含むポリペプチドをコードする、単離されたポリヌクレオチド。
[本発明1087]
SEQ ID NO:46のアミノ酸配列を含むポリペプチドをコードする、単離されたポリヌクレオチド。
[本発明1088]
SEQ ID NO:45およびSEQ ID NO:46のアミノ酸配列を含むポリペプチドをコードする、単離されたポリヌクレオチド。
[本発明1089]
本発明1021~1030のいずれかの単離されたポリヌクレオチドと、(b)多サブユニットタンパク質をコードするポリヌクレオチドとを含む、細胞。
[本発明1090]
前記多サブユニットタンパク質が抗体である、本発明1089の細胞。
[本発明1091]
前記抗体が、本発明1083~1088のいずれかのアミノ酸配列を含む、本発明1090の細胞。
[本発明1092]
前記抗体が、本発明1085および1088のアミノ酸配列を含む、本発明1091の細胞。
[本発明1093]
本発明1031~1040のいずれかのポリヌクレオチドをさらに含む、本発明1089~1092のいずれかの細胞。
[本発明1094]
本発明1041~1047のいずれかのポリヌクレオチドと本発明1048~1054のいずれかのポリヌクレオチドとを含む、本発明1089~1093のいずれかの細胞。
[本発明1095]
本発明1055~1061のいずれかのポリヌクレオチドと本発明1062~1068のいずれかのポリヌクレオチドとを含む、本発明1089~1093のいずれかの細胞。
[本発明1096]
本発明1069~1075のいずれかのポリヌクレオチドと本発明1076~1082のいずれかのポリヌクレオチドとを含む、本発明1089~1093のいずれかの細胞。
[本発明1097]
チャイニーズハムスター卵巣(CHO)細胞である、本発明1089~1096のいずれかの細胞。
[本発明1098]
本発明1089~1097のいずれかの細胞を培地中で培養する段階を含む、多サブユニットタンパク質を生成する方法であって、該多サブユニットタンパク質が該細胞によって該培地に分泌される、方法。
[本発明1099]
分泌された前記多サブユニットタンパク質が、少なくとも約3g/Lの培地中力価に達する、本発明1098の方法。
[本発明1100]
前記分泌された多サブユニットタンパク質が、少なくとも約5g/Lの培地中力価に達する、本発明1098または本発明1099の方法。
[本発明1101]
前記分泌された多サブユニットタンパク質が、少なくとも約6g/Lの培地中力価に達する、本発明1089~1091のいずれかの方法。
[本発明1102]
前記分泌された多サブユニットタンパク質が、少なくとも約8g/Lの培地中力価に達する、本発明1089~1092のいずれかの方法。
[本発明1103]
前記細胞が、前記培地中で少なくとも約5×107細胞-日/mLの積分細胞密度まで分裂する、本発明1089~1093のいずれかの方法。
[本発明1104]
前記細胞が、前記培地中で分裂して、少なくとも約1×108細胞-日/mLの積分細胞密度をもたらす、本発明1089~1094のいずれかの方法。
[本発明1105]
前記細胞が、前記培地中で分裂して、少なくとも約1.5×108細胞-日/mLの積分細胞密度をもたらす、本発明1089~1095のいずれかの方法。
[本発明1106]
前記分泌された多サブユニットタンパク質を前記培地から精製する段階をさらに含む、本発明1089~1096のいずれかの方法。
[本発明1107]
本発明1098~1106のいずれかの方法により産生された、多サブユニットタンパク質。
[本発明1108]
抗体である、本発明1107の多サブユニットタンパク質。
[本発明1109]
前記抗体が、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、およびSEQ ID NO:46のアミノ酸配列を含む、本発明1108の多サブユニットタンパク質。
[本発明1110]
前記抗体が抗GDF8抗体である、本発明1109の多サブユニットタンパク質。
[本発明1111]
前記抗体が、SEQ ID NO:20およびSEQ ID NO:22のアミノ酸配列を含む、本発明1110の多サブユニットタンパク質。
[本発明1112]
前記抗体が抗ANG2抗体である、本発明1109の多サブユニットタンパク質。
[本発明1113]
前記抗体が、SEQ ID NO:28およびSEQ ID NO:30のアミノ酸配列を含む、本発明1112の多サブユニットタンパク質。
[本発明1114]
前記抗体が抗AngPtl4抗体である、本発明1109の多サブユニットタンパク質。
[本発明1115]
前記抗体が、SEQ ID NO:36およびSEQ ID NO:38のアミノ酸配列を含む、本発明1114の多サブユニットタンパク質。
[本発明1116]
SEQ ID NO:16の核酸配列を含むポリヌクレオチドを含有する、エクスビボ哺乳動物細胞。
[本発明1117]
(a)SEQ ID NO:16の核酸配列を含むポリヌクレオチドと、(b)SEQ ID NO:18の核酸配列を含むポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
[本発明1118]
(a)SEQ ID NO:16の核酸配列を含むポリヌクレオチドと、(b)SEQ ID NO:43およびSEQ ID NO:44のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドと、(c)SEQ ID NO:45およびSEQ ID NO:46のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
[本発明1119]
(a)SEQ ID NO:16の核酸配列を含むポリヌクレオチドと、(b)SEQ ID NO:23の核酸配列を含むポリヌクレオチドと、(c)SEQ ID NO:25の核酸配列を含むポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
[本発明1120]
(a)SEQ ID NO:16の核酸配列を含むポリヌクレオチドと、(b)SEQ ID NO:31の核酸配列を含むポリヌクレオチドと、(c)SEQ ID NO:33の核酸配列を含むポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
[本発明1121]
(a)SEQ ID NO:16の核酸配列を含むポリヌクレオチドと、(b)SEQ ID NO:39の核酸配列を含むポリヌクレオチドと、(c)SEQ ID NO:41の核酸配列を含むポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
[本発明1122]
(a)SEQ ID NO:16の核酸配列を含むポリヌクレオチドと、(b)SEQ ID NO:18の核酸配列を含むポリヌクレオチドと、(c)SEQ ID NO:43およびSEQ ID NO:44のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドと、(d)SEQ ID NO:45およびSEQ ID NO:46のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
[本発明1123]
(a)SEQ ID NO:16の核酸配列を含むポリヌクレオチドと、(b)SEQ ID NO:18の核酸配列を含むポリヌクレオチドと、(c)SEQ ID NO:23の核酸配列を含むポリヌクレオチドと、(d)SEQ ID NO:25の核酸配列を含むポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
[本発明1124]
(a)SEQ ID NO:16の核酸配列を含むポリヌクレオチドと、(b)SEQ ID NO:18の核酸配列を含むポリヌクレオチドと、(c)SEQ ID NO:31の核酸配列を含むポリヌクレオチドと、(d)SEQ ID NO:33の核酸配列を含むポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
[本発明1125]
(a)SEQ ID NO:16の核酸配列を含むポリヌクレオチドと、(b)SEQ ID NO:18の核酸配列を含むポリヌクレオチドと、(c)SEQ ID NO:39の核酸配列を含むポリヌクレオチドと、(d)SEQ ID NO:41の核酸配列を含むポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
[本発明1126]
SEQ ID NO:14または15の核酸配列からなるポリヌクレオチドを含有する、エクスビボ哺乳動物細胞。
[本発明1127]
(a)SEQ ID NO:14または15の核酸配列からなるポリヌクレオチドと、(b)SEQ ID NO:17の核酸配列からなるポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
[本発明1128]
(a)SEQ ID NO:14または15の核酸配列からなるポリヌクレオチドと、(b)SEQ ID NO:43およびSEQ ID NO:44のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドと、(c)SEQ ID NO:45およびSEQ ID NO:46のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
[本発明1129]
(a)SEQ ID NO:14または15の核酸配列からなるポリヌクレオチドと、(b)SEQ ID NO:24の核酸配列からなるポリヌクレオチドと、(c)SEQ ID NO:26の核酸配列からなるポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
[本発明1130]
(a)SEQ ID NO:14または15の核酸配列からなるポリヌクレオチドと、(b)SEQ ID NO:32の核酸配列からなるポリヌクレオチドと、(c)SEQ ID NO:4の核酸配列からなるポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
[本発明1131]
(a)SEQ ID NO:14または15の核酸配列からなるポリヌクレオチドと、(b)SEQ ID NO:40の核酸配列からなるポリヌクレオチドと、(c)SEQ ID NO:42の核酸配列からなるポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
[本発明1132]
(a)SEQ ID NO:14または15の核酸配列からなるポリヌクレオチドと、(b)SEQ ID NO:17の核酸配列からなるポリヌクレオチドと、(c)SEQ ID NO:43およびSEQ ID NO:44のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドと、(d)SEQ ID NO:45およびSEQ ID NO:46のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
[本発明1133]
(a)SEQ ID NO:14または15の核酸配列からなるポリヌクレオチドと、(b)SEQ ID NO:17の核酸配列からなるポリヌクレオチドと、(c)SEQ ID NO:24の核酸配列からなるポリヌクレオチドと、(d)SEQ ID NO:26の核酸配列からなるポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
[本発明1134]
(a)SEQ ID NO:14または15の核酸配列からなるポリヌクレオチドと、(b)SEQ ID NO:17の核酸配列からなるポリヌクレオチドと、(c)SEQ ID NO:32の核酸配列からなるポリヌクレオチドと、(d)SEQ ID NO:34の核酸配列からなるポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
[本発明1135]
(a)SEQ ID NO:14または15の核酸配列からなるポリヌクレオチドと、(b)SEQ ID NO:17の核酸配列からなるポリヌクレオチドと、(c)SEQ ID NO:40の核酸配列からなるポリヌクレオチドと、(d)SEQ ID NO:42の核酸配列からなるポリヌクレオチドとを含有する、エクスビボ哺乳動物細胞。
【発明を実施するための形態】
【0017】
説明
本発明を説明する前に、本発明は記載された特定の方法および実験条件に限定されるものではなく、このような方法および条件は変わることがあることを理解すべきである。また、本明細書で使用される用語は、特定の態様のみを説明する目的のためであり、限定するものではなく、本発明の範囲は添付の特許請求の範囲によってのみ限定されることを理解すべきである。
【0018】
別段の定義がない限り、本明細書で使用されるすべての技術用語および科学用語は、本発明が属する技術分野の当業者によって一般的に理解されている意味と同じ意味を有する。本明細書で使用される「約」という用語は、記載された特定の数値または数値の範囲に関して使用される場合、記載された値とその値が1%ほどしか異ならないことがあることを意味する。例えば、本明細書で使用される「約100」という表現は、99および101、ならびにその間のすべての値(例えば、99.1、99.2、99.3、99.4など)を包含する。
【0019】
本明細書に記載のものと類似または同等の方法および材料はどれも本発明の実施または試験に用いることができるが、好ましい方法および材料が以下に記載される。本明細書で言及したすべての刊行物は、その全体が参照により本明細書に組み入れられる。
【0020】
本明細書で使用される場合、「単離されたポリヌクレオチド」と交換可能に使用される「組換えポリヌクレオチド」という用語は、遺伝子工学的操作によって生じる、一本鎖または二本鎖のいずれかのリボ核酸またはデオキシリボ核酸などの核酸ポリマーを意味する。組換えポリヌクレオチドは、インビトロで存在するかまたは細胞内でエピソームとして存在する、環状プラスミドまたは線状構築物であり得る。組換えポリヌクレオチドは、線状または環状染色体などの、より大きなポリヌクレオチド分子内または超分子構造内に組み込まれた構築物であり得る。より大きなポリヌクレオチド分子または超分子構造は細胞内にあってもまたは細胞の核内にあってもよい。したがって、組換えポリヌクレオチドは細胞の染色体内に組み込まれてもよい。
【0021】
本明細書で使用される「ストレス誘導性マンノース結合レクチン」という用語は、マンノース結合タンパク質を指し、これは、マンノース、マンノース-6-リン酸などのマンノースの誘導体、または、グリコカリックス中にマンノースもしくはマンノース誘導体を発現する糖タンパク質を結合させるかまたは結合させることが可能であり、かつ、その活性がストレスの間に上方制御される、タンパク質を意味する。細胞ストレスには、とりわけ、飢餓、DNA損傷、低酸素症、中毒、せん断応力および他の機械的ストレス、腫瘍ストレス、ならびに小胞体におけるミスフォールドしたタンパク質の蓄積が含まれる。例示的なストレス誘導性マンノース結合レクチンとしては、EDEMタンパク質EDEM1、EDEM2およびEDEM3、Yos 9、OS9、ならびにXTP3-Bが挙げられる(Vembar and Brodsky, Nat. Rev. Mol. Cell. Biol. 9(12): 944-957, 2008およびそこに引用された文献を参照されたい)。
【0022】
本明細書で使用される「EDEM2」という用語は、小胞体分解促進性αマンノシダーゼ様タンパク質の任意のオルソログ、相同体、または保存的に置換された変異体を意味する。EDEM2タンパク質は、小胞体関連分解(ERAD)に関与することが当技術分野で一般に知られており、Xbp-1により上方制御されて、除去のためにカルネキシンサイクルからのミスフォールドした糖タンパク質の抽出を容易にする。(Mast et al., Glycobiology 15(4): 421-436, 2004; Olivari and Molinari, FEBS Lett. 581: 3658-3664, 2007; Olivari et al., J. Biol. Chem. 280(4): 2424-2428, 2005; およびVembar and Brodsky 2008を参照されたい;これらは参照により本明細書に組み入れられる。)例示的なEDEM2配列は、配列表と相互参照される表1に示される。
【0023】
【0024】
本明細書で使用される「Xbp1」という用語は、XBP1またはXボックス結合タンパク質1の別名でも知られており、Xbp1の任意のオルソログ、相同体、または保存的に置換された変異体を意味する。Xbp1はUPRの転写因子および機能的エレメントである。ERストレスは、(1)後でXbp1 mRNAの転写を上方制御する転写因子ATF6と、(2)活性Xbp1を生成するために前駆体Xbp1 mRNAのスプライシングを媒介するER膜タンパク質IRE1との両方を活性化する。上述したように、活性化されたXbp1は次にEDEM2の活性を上方制御する。(Yoshida et al., Cell Structure and Function 31(2): 117-125, 2006; およびOlivari, 2005を参照されたい。)例示的なXbp1アミノ酸配列は、配列表と相互参照される表2に示される。
【0025】
【0026】
本明細書で使用される「抗体」という用語は、一般に、4本のポリペプチド鎖、すなわちジスルフィド結合により相互接続された2本の重(H)鎖と2本の軽(L)鎖を含む免疫グロブリン分子、ならびにその多量体(例えばIgM)を指すことが意図されるが;しかしながら、重鎖のみからなる(すなわち、軽鎖を欠いている)免疫グロブリン分子もまた、「抗体」という用語の定義内に包含される。各重鎖は、重鎖可変領域(本明細書ではHCVRまたはVHと略記される)および重鎖定常領域を含む。重鎖定常領域は3つのドメイン、CH1、CH2、およびCH3を含む。各軽鎖は、軽鎖可変領域(本明細書ではLCVRまたはVLと略記される)および軽鎖定常領域を含む。軽鎖定常領域は1つのドメイン(CL1)を含む。VH領域およびVL領域は、フレームワーク領域(FR)と呼ばれる、より保存された領域が介在する、相補性決定領域(CDR)と呼ばれる超可変の領域にさらに細分することができる。各VHおよびVLは、3つのCDRと4つのFRから構成されており、アミノ末端からカルボキシ末端へ次の順序で配置される:FR1、CDR1、FR2、CDR2、FR3、CDR3、FR4。「単離された抗体」または「精製された抗体」は、他の細胞物質または化学物質を実質的に含んでいない。
【0027】
「特異的に結合させる」という用語または同様の用語は、生理学的条件下で比較的安定している、抗原との複合体を、抗体またはその抗原結合断片が形成することを意味する。特異的結合は、少なくとも約1×10-6Mまたはそれ以上の解離定数を特徴とすることができる。2つの分子が特異的に結合させるか否かを判定するための方法は、当技術分野でよく知られており、例えば、平衡透析、表面プラズモン共鳴などが含まれる。しかし、ヒトGDF8(例として)を特異的に結合させる、単離された抗体は、他の種由来のGDF8分子(オルソログ)などの他の抗原に対する交差反応性を有していてもよい。
【0028】
種々の抗体は、ストレス誘導性マンノース結合レクチンをコードするポリヌクレオチドを保有する細胞によって分泌される、多サブユニットタンパク質の例として使用される。これらの例として、抗GDF8、抗ANG2、および抗ANGPTL4抗体が挙げられる。これらおよび同様の抗体は、それぞれ米国特許出願第20110293630号、同第20110027286号、および同第20110159015号に記載されており、これらは参照により本明細書に組み入れられる。
【0029】
本明細書で使用される「細胞」という用語は、DNAを複製すること、RNAを転写すること、ポリペプチドを翻訳すること、およびタンパク質を分泌することが可能な原核または真核細胞を指す。細胞には、生物学的産物の商業生産に用いられる動物細胞が含まれ、例えば、昆虫細胞(例えば、Schneider細胞、Sf9細胞、Sf21細胞、Tn-368細胞、BTI-TN-5B1-4細胞;Jarvis, Methods Enzymol. 463: 191-222, 2009; およびPotter et al., Int. Rev. Immunol. 10(2-3): 103-112, 1993参照)、および哺乳動物細胞(例えば、CHOまたはCHO-K1細胞、COSまたはCOS-7細胞、HEK293細胞、PC12細胞、HeLa細胞、ハイブリドーマ細胞;Trill et al., Curr. Opin. Biotechnol. 6(5): 553-560, 1995; Kipriyanov and Little, Mo. Biotechnol. 12(2): 173-201, 1999)である。一態様では、細胞は、記載したUPR経路のポリヌクレオチドを含有するCHO-K1細胞である。CHO-K1細胞については、Kao et al., Proc. Nat'l. Acad. Sci. USA 60: 1275-1281, 1968をも参照されたい。
【0030】
本明細書で使用される「プロモーター」という用語は、タンパク質コード配列の上流に位置しかつタンパク質コード配列の転写を容易にする、一般的にはシスでの遺伝子配列を意味する。プロモーターは調節可能であっても(発生、組織特異的、もしくは誘導性(化学物質、温度))または構成的に活性であってもよい。特定の態様では、タンパク質をコードするポリヌクレオチドは、構成的プロモーターに機能的に連結されている。「機能的に連結」とは、それが意味することは、タンパク質をコードするポリヌクレオチドが、プロモーターの3'側(下流)にシスでかつプロモーターの制御下に配置されることである。特定の態様では、プロモーターは構成的哺乳動物プロモーターであり、例えば、ユビキチンCプロモーター(Schorpp et al., Nucl. Acids Res. 24(9): 1787-1788, 1996; Byun et al., Biochem. Biophys. Res. Comm. 332(2): 518-523, 2005参照)、またはCMV-IEプロモーター(Addison et al., J. Gen. Virol. 78(7): 1653-1661, 1997; Hunninghake et al., J. Virol. 63(7): 3026-3033, 1989)、またはhCMV-IEプロモーター(ヒトサイトメガロウイルス前初期遺伝子プロモーター)(Stinski and Roehr, J. Virol. 55(2): 431-441, 1985; Hunninghake et al., J. Virol. 63(7): 3026-3033, 1989参照)である。
【0031】
本明細書で使用される「積分細胞密度」または「ICD」という語句は、細胞-日/mLとして表される、ある期間にわたって積分としてとられた培地中の細胞の密度を意味する。いくつかの態様では、ICDは培養中の細胞の12日目ごろに測定される。
【0032】
本明細書で使用される「培養物/培養(culture)」という用語は、(1)細胞、培地、および分泌された多サブユニットタンパク質を含む、組成物と、(2)細胞が活発に分裂しているかどうかに関係なく細胞を培地中でインキュベートする行為との両方を意味する。細胞は、25mLフラスコもしくはそれより小さい容器で、または10,000リットルまたは10,000リットル超の商業的バイオリアクターほどに大きい容器で培養することができる。「培地」は、細胞の成長、増殖、または維持を可能にし、かつ細胞による多サブユニットタンパク質の産生を可能にするための、とりわけ、栄養素、脂質、アミノ酸、核酸、緩衝剤、および微量元素を含む培養培地を指す。細胞培養培地には、血清を含まないおよび加水分解物を含まない規定培地、ならびに血清(例えば、ウシ胎児血清(FBS))またはタンパク質加水分解物を添加した培地が含まれる。商業的に入手することができる培地の非限定的な例としては、RPMI培地1640、ダルベッコ改変イーグル培地(DMEM)、DMEM/F12混合物、F10栄養混合物、HamのF12栄養混合物、および最小必須培地(MEM)が挙げられる。
【0033】
本明細書で使用される場合、ポリペプチドに適用される際の「保存的に置換された変異体」という語句は、1つまたはそれ以上の保存的アミノ酸置換を含むアミノ酸配列を有するポリペプチドを意味する。「保存的アミノ酸置換」は、あるアミノ酸残基が類似の化学的特性(例えば、電荷または疎水性)を有する側鎖(R基)をもつ別のアミノ酸残基で置換されることである。一般的に、保存的アミノ酸置換はタンパク質の機能特性を実質的に変化させないと考えられる。2つまたはそれ以上のアミノ酸配列が保存的置換で互いに異なる場合には、類似性のパーセントまたは程度は、置換の保存的性質を補正するために上方に調整され得る。この調整を行うための手段は当業者に周知である。例えば、Pearson (1994) Methods Mol. Biol. 24: 307-331を参照されたく;これは参照により本明細書に組み入れられる。類似の化学的特性を有する側鎖をもつアミノ酸のグループの例には、以下が含まれる:(1)脂肪族側鎖:グリシン、アラニン、バリン、ロイシンおよびイソロイシン;(2)脂肪族-ヒドロキシル側鎖:セリンおよびトレオニン;(3)アミド含有側鎖:アスパラギンおよびグルタミン;(4)芳香族側鎖:フェニルアラニン、チロシン、およびトリプトファン;(5)塩基性側鎖:リシン、アルギニン、およびヒスチジン;(6)酸性側鎖:アスパラギン酸およびグルタミン酸;ならびに(7)硫黄含有側鎖:システインおよびメチオニン。好ましい保存的アミノ酸置換グループは、バリン-ロイシン-イソロイシン、フェニルアラニン-チロシン、リシン-アルギニン、アラニン-バリン、グルタミン酸-アスパラギン酸、およびアスパラギン-グルタミンである。あるいは、保存的置換は、参照により本明細書に組み入れられるGonnet et al. (1992) Science 256: 1443-45に開示された、PAM250対数尤度行列(log-likelihood matrix)において正の値を有するいずれかの変化である。「中程度に保存的な」置換は、PAM250対数尤度行列において負でない値を有するいずれかの変化である。
【0034】
態様 - 細胞
一局面において、本発明は、治療的有用性または研究有用性があるタンパク質の生成に有用な細胞を提供する。いくつかの態様では、該タンパク質は複数のサブユニットからなり、これらのサブユニットは、十分な量の活性タンパク質を生成するために正しく折りたたまれ、かつ組み立てられる必要がある。抗体は、治療的有用性または研究有用性がある多サブユニットタンパク質の一例である。いくつかの態様では、細胞は、多サブユニットタンパク質の個々のサブユニットの1つまたはそれ以上をコードする組換え遺伝子構築物(すなわち、ポリヌクレオチド)を保有する。他の態様では、個々のポリペプチドサブユニットをコードする遺伝子構築物は、天然に存在しており、例えば、B細胞中の抗体のサブユニットをコードする核酸配列などである。
【0035】
多サブユニットタンパク質の適切な組み立ておよび分泌を容易にするために、細胞は、いくつかの態様ではERADの構成要素である、ストレス誘導性マンノース結合レクチンをコードする組換えポリヌクレオチドを含有する。いくつかの態様では、ストレス誘導性マンノース結合レクチンは、小胞体分解促進性αマンノシダーゼ様タンパク質2(EDEM2)である。コードされたEDEM2またはその保存的に置換された変異体はどれも、本発明において成功裏に使用され得ることが想定される。表1は、脊椎動物EDEM2タンパク質のいくつかの例を示す。これらのタンパク質配列の多重ペアワイズ比較は、Thompson et al., Nucl. Acids Rev. 22(22): 4673-80, 1994に記載のClustal Wプログラムを用いて行ったところ(Yuan et al., Bioinformatics 15(10): 862-3, 1999も参照)、開示されたEDEM2ポリヌクレオチド配列の各々が他のそれぞれのEDEM2配列と少なくとも69%同一であることを明らかにした。開示された哺乳動物EDEM2配列のClustal W比較は、各配列が他の配列と少なくとも92%同一であることを明らかにした。したがって、いくつかの態様では、細胞は、哺乳動物EDEM2のいずれかと少なくとも92%同一である配列を有するEDEM2ポリペプチドをコードするポリヌクレオチドを含有する。コンセンサスEDEM2アミノ酸配列は、マウス、ラット、ハムスター、チンパンジー、およびヒトEDEM2ポリペプチドのアミノ酸配列をアライメントすることによって構築された。そのコンセンサス配列はSEQ ID NO:8として示される。かくして、いくつかの態様では、細胞は、SEQ ID NO:8のアミノ酸配列を有するEDEM2ポリペプチドをコードするポリヌクレオチドを含有する。
【0036】
さまざまな態様において、細胞は、マウスEDEM2(mEDEM2)アミノ酸配列と少なくとも92%同一であるアミノ酸配列を有するEDEM2ポリペプチドをコードする組換えポリヌクレオチドを含んでおり;特定の態様では、該ポリペプチドはmEDEM2またはその保存的に置換された変異体である。
【0037】
いくつかの態様では、多サブユニットタンパク質は抗体であり、細胞はSEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、およびSEQ ID NO:46のアミノ酸配列を含むポリペプチドのいずれか1つまたはそれ以上をコードするポリヌクレオチドを含んでいる。SEQ ID NO:43および44はそれぞれ、特定の抗体重鎖のおおよそN末端部分およびC末端部分それぞれのコンセンサス配列を表す。こうして、一態様では、タンパク質サブユニットをコードするポリヌクレオチドは、SEQ ID NO:43およびSEQ ID NO:44の両方を含むポリペプチドをコードする。SEQ ID NO:45および46はそれぞれ、特定の抗体軽鎖のおおよそN末端部分およびC末端部分それぞれのコンセンサス配列を表す。こうして、一態様では、タンパク質サブユニットをコードするポリヌクレオチドは、SEQ ID NO:45およびSEQ ID NO:46の両方を含むポリペプチドをコードする。いくつかの態様では、EDEM2タンパク質をコードする組換えポリヌクレオチドに加えて、細胞は、それぞれが多サブユニットタンパク質の特定のサブユニットをコードする、少なくとも2つのポリヌクレオチドを含んでいる。例えば、以下で例示するように、細胞は、SEQ ID NO:43およびSEQ ID NO:44のアミノ酸配列を含む抗体重鎖をコードするポリヌクレオチドと、SEQ ID NO:45およびSEQ ID NO:46のアミノ酸配列を含む抗体軽鎖をコードする別のポリヌクレオチドとを含有する。
【0038】
いくつかの態様では、細胞は、上記のように、ストレス応答ポリヌクレオチドおよびポリペプチドサブユニットをコードする1つまたはそれ以上のポリヌクレオチドを含むことに加えて、EDEM2の上流ではたらく小胞体ストレス応答転写因子をコードするポリヌクレオチドをも含有する。この上流の転写因子は、場合によってはXBP1のスプライスされた形態である。コードされたXBP1はどれも、本発明において成功裏に使用され得ると想定される。表2は、脊椎動物XBP1のスプライスされた形態のポリペプチドの配列のいくつかの例を示す。これらのポリペプチド配列の多重ペアワイズ比較は、Clustal W(Thompson 1994; Yuan 1999)を用いて行ったところ、開示されたスプライス型XBP1ポリヌクレオチド配列の各々が他のそれぞれのXBP1配列と少なくとも48%同一であることを明らかにした。開示された哺乳動物XBP1配列のClustal W比較は、各配列が他の配列と少なくとも86%同一であることを明らかにした。こうして、いくつかの態様では、細胞は、哺乳動物スプライス型XBP1のいずれかと少なくとも86%同一である配列を有するXBP1ポリペプチドのスプライスされた形態をコードするポリヌクレオチドを含有する。コンセンサスXBP1アミノ酸配列は、マウス、ハムスター、およびヒトXBP1のアミノ酸配列をアライメントすることによって構築された。そのコンセンサス配列はSEQ ID NO:13として示される。かくして、いくつかの態様では、細胞は、SEQ ID NO:13のアミノ酸配列を有するXBP1ポリペプチドをコードするポリヌクレオチドを含有する。
【0039】
さまざまな態様において、細胞は、マウスXBP1(mXBP1)アミノ酸配列(SEQ ID NO:9)と少なくとも86%同一であるアミノ酸配列を有するXBP1ポリペプチドをコードするポリヌクレオチドを含んでおり;特定の態様では、該ポリペプチドはmXBP1またはその保存的に置換された変異体である。
【0040】
本発明は、適切に折りたたまれた活性多サブユニットタンパク質の産生のための、レクチンをコードするポリペプチドを保有させるために、任意の細胞が使用され得ることを想定している。このような細胞には、以下のような周知のタンパク質産生細胞が含まれる:大腸菌(Escherichia coli)および同様の原核細胞、酵母ピキア・パストリス(Pichia pastoris)と他のピキアおよび非ピキア酵母、植物細胞外植片、例えばタバコ属(Nicotiana)のもの、昆虫細胞、例えばSchneider 2細胞、Sf9およびSf21、キンウワバ(Trichoplusia ni)由来のHigh Five細胞、ならびにバイオ生産に一般的に用いられる哺乳動物細胞、例えばCHO、CHO-K1、COS、HeLa、HEK293、Jurkat、およびPC12細胞。いくつかの態様では、細胞はCHO-K1または改変されたCHO-K1細胞、例えば、米国特許第7,435,553号、同第7,514,545号、および同第7,771,997号、ならびに米国特許出願公開第US 2010-0304436 A1号に教示されるものであり、それぞれはその全体が参照により本明細書に組み入れられる。
【0041】
いくつかの特定の態様では、本発明は、(1)SEQ ID NO:16のヌクレオチド配列を含む、mEDEM2をコードするポリヌクレオチドと、(2)SEQ ID NO:18のヌクレオチド配列を含む、XBP1をコードするポリヌクレオチドと、(3)SEQ ID NO:43および44のアミノ酸配列を含むポリペプチドをコードするヌクレオチド配列を含む、抗体重鎖をコードするポリヌクレオチドと、(4)SEQ ID NO:45および46のアミノ酸配列を含むポリペプチドをコードするヌクレオチド配列を含む、抗体軽鎖をコードするポリヌクレオチドとを含有する、エクスビボCHO-K1細胞を提供する。
【0042】
ある特定の態様では、本発明は、(1)SEQ ID NO:16のヌクレオチド配列を含む、mEDEM2をコードするポリヌクレオチドと、(2)SEQ ID NO:18のヌクレオチド配列を含む、XBP1をコードするポリヌクレオチドと、(3)SEQ ID NO:23のヌクレオチド配列を含む、抗体重鎖をコードするポリヌクレオチドと、(4)SEQ ID NO:25のヌクレオチド配列を含む、抗体軽鎖をコードするポリヌクレオチドとを含有する、エクスビボCHO-K1細胞を提供する。
【0043】
別の特定の態様では、本発明は、(1)SEQ ID NO:16のヌクレオチド配列を含む、mEDEM2をコードするポリヌクレオチドと、(2)SEQ ID NO:18のヌクレオチド配列を含む、XBP1をコードするポリヌクレオチドと、(3)SEQ ID NO:31のヌクレオチド配列を含む、抗体重鎖をコードするポリヌクレオチドと、(4)SEQ ID NO:33のヌクレオチド配列を含む、抗体軽鎖をコードするポリヌクレオチドとを含有する、エクスビボCHO-K1細胞を提供する。
【0044】
さらに別の特定の態様では、本発明は、(1)SEQ ID NO:16のヌクレオチド配列を含む、mEDEM2をコードするポリヌクレオチドと、(2)SEQ ID NO:18のヌクレオチド配列を含む、XBP1をコードするポリヌクレオチドと、(3)SEQ ID NO:39のヌクレオチド配列を含む、抗体重鎖をコードするポリヌクレオチドと、(4)SEQ ID NO:41のヌクレオチド配列を含む、抗体軽鎖をコードするポリヌクレオチドとを含有する、エクスビボCHO-K1細胞を提供する。
【0045】
細胞株
別の局面において、本発明は、上記の細胞由来のクローン増殖による子孫である複数の細胞を含む、細胞株を提供する。この細胞株の構成細胞の少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または約100%は、いくつかの態様ではERADの構成要素である、ストレス誘導性マンノース結合レクチンをコードする組換えポリヌクレオチドを含有する。いくつかの態様では、ストレス誘導性マンノース結合レクチンは、小胞体分解促進性αマンノシダーゼ様タンパク質2(EDEM2)である。コードされたEDEM2またはその保存的に置換された変異体はどれも、本発明において成功裏に使用され得ることが想定される。表1は、前のセクションで述べたように、脊椎動物EDEM2タンパク質のいくつかの例を示す。いくつかの態様では、構成細胞は、任意の哺乳動物EDEM2と少なくとも92%同一である配列を有するEDEM2ポリペプチドをコードするポリヌクレオチドを含有する。いくつかの態様では、構成細胞は、SEQ ID NO:8の哺乳動物コンセンサスアミノ酸配列を有するEDEM2ポリペプチドをコードするポリヌクレオチドを含有する。いくつかの態様では、構成細胞は、SEQ ID NO:1の組換えポリヌクレオチドまたはその保存的に置換された変異体を含んでいる。
【0046】
いくつかの態様では、前記細胞株により産生される多サブユニットタンパク質は抗体であり、該細胞株の構成細胞は、SEQ ID NO:43およびSEQ ID NO:44(特定の抗体重鎖のN末端部分およびC末端部分それぞれのコンセンサス配列を表す)、ならびにSEQ ID NO:45およびSEQ ID NO:46(特定の抗体軽鎖のN末端部分およびC末端部分それぞれのコンセンサス配列を表す)のアミノ酸配列を含むポリペプチドのいずれか1つまたはそれ以上をコードするポリヌクレオチドを含有する。いくつかの態様では、EDEM2タンパク質をコードする組換えポリヌクレオチドに加えて、該細胞株の構成細胞は、それぞれが多サブユニットタンパク質の特定のサブユニットをコードする、少なくとも2つのポリヌクレオチドを含有する。例えば、構成細胞は、SEQ ID NO:43およびSEQ ID NO:44のアミノ酸配列を含む抗体重鎖をコードするポリヌクレオチドと、SEQ ID NO:45およびSEQ ID NO:46のアミノ酸配列を含む抗体軽鎖をコードする別のポリヌクレオチドとを含有する。
【0047】
いくつかの態様では、構成細胞は、上記のように、ストレス応答ポリヌクレオチドおよびポリペプチドサブユニットをコードする1つまたはそれ以上のポリヌクレオチドを含むことに加えて、XBP1のスプライスされた形態などの、EDEM2の上流ではたらく小胞体ストレス応答転写因子をコードするポリヌクレオチドをも含有する。コードされたXBP1はどれも、本発明において成功裏に使用され得ると想定される。表2は、前のセクションで述べたように、脊椎動物XBP1のスプライスされた形態のポリペプチドの配列のいくつかの例を示す。これらの配列のClustal W解析は、開示されたスプライス型XBP1ポリヌクレオチド配列の各々が他のそれぞれのXBP1配列と少なくとも48%同一であることを明らかにした。哺乳動物XBP1配列の比較は、各配列が他の配列と少なくとも86%同一であることを明らかにした。こうして、いくつかの態様では、細胞株の構成細胞は、哺乳動物スプライス型XBP1のいずれかと少なくとも86%同一である配列を有する、XBP1ポリペプチドのスプライスされた形態をコードするポリヌクレオチドを含有する。いくつかの態様では、構成細胞は、SEQ ID NO:13のコンセンサスアミノ酸配列を有するXBP1ポリペプチドをコードするポリヌクレオチドを含有する。
【0048】
さまざまな態様において、前記細胞は、マウスXBP1(mXBP1)アミノ酸配列(SEQ ID NO:9)と少なくとも86%同一であるアミノ酸配列を有するXBP1ポリペプチドをコードするポリヌクレオチドを含んでおり;特定の態様では、該ポリペプチドはSEQ ID NO:9のmXBP1またはその保存的に置換された変異体である。
【0049】
本発明は、細胞株を構成する細胞の親が、以下のような周知のタンパク質産生細胞のリストから選択されることを想定している:大腸菌および同様の原核細胞、酵母ピキア・パストリスと他のピキアおよび非ピキア酵母、植物細胞外植片、例えばタバコ属のもの、昆虫細胞、例えばSchneider 2細胞、Sf9およびSf21、キンウワバ由来のHigh Five細胞、ならびにバイオ生産に一般的に用いられる哺乳動物細胞、例えばCHO、CHO-K1、COS、HeLa、HEK293、Jurkat、およびPC12細胞。いくつかの態様では、該細胞はCHO-K1または改変されたCHO-K1細胞、例えば、米国特許第7,435,553号、同第7,514,545号、および同第7,771,997号、ならびに米国特許出願公開第US 2010-0304436 A1号に教示されるものである。
【0050】
いくつかの態様では、培地で培養される前記細胞株は、多サブユニットタンパク質を産生すること、および適切に組み立てられた多サブユニットタンパク質を少なくとも3g/L、少なくとも5g/L、または少なくとも8g/Lの力価で培地中に分泌することが可能である。
【0051】
さらに、前記細胞株の構成細胞は、ストレス誘導性マンノース結合レクチンをコードする組換えポリヌクレオチドを含まない細胞株の積分細胞密度と比べて、約30%大きい積分細胞密度を達成するような程度に、培養中に増殖することが可能である。場合によっては、該細胞株は、ストレス誘導性マンノース結合レクチンをコードする組換えポリヌクレオチドを含まない細胞株の積分細胞密度と比べて、少なくとも約50%大きいか、少なくとも60%大きいか、または少なくとも90%大きい積分細胞密度を達成することができる。いくつかの態様では、細胞株の積分細胞密度は培養の約12日後に評価される。
【0052】
いくつかの特定の態様において、本発明は、クローンに由来する構成細胞を含む細胞株を提供し、該構成細胞は、(1)SEQ ID NO:16のヌクレオチド配列を含む、mEDEM2をコードするポリヌクレオチドと、(2)SEQ ID NO:18のヌクレオチド配列を含む、XBP1をコードするポリヌクレオチドと、(3)SEQ ID NO:43および44のアミノ酸配列を含むポリペプチドをコードするヌクレオチド配列を含む、抗体重鎖をコードするポリヌクレオチドと、(4)抗体軽鎖をコードしSEQ ID NO:45および46のアミノ酸配列を含むポリペプチドをコードするヌクレオチド配列を含む、ポリヌクレオチドとを含有する、CHO-K1細胞である。
【0053】
ある特定の態様では、本発明は、クローンに由来する構成細胞を含む細胞株を提供し、該構成細胞は、(1)SEQ ID NO:16のヌクレオチド配列を含む、mEDEM2をコードするポリヌクレオチドと、(2)SEQ ID NO:18のヌクレオチド配列を含む、XBP1をコードするポリヌクレオチドと、(3)SEQ ID NO:23のヌクレオチド配列を含む、抗体重鎖をコードするポリヌクレオチドと、(4)抗体軽鎖をコードしSEQ ID NO:25のヌクレオチド配列を含む、ポリヌクレオチドとを含有する、CHO-K1細胞である。
【0054】
別の特定の態様では、本発明は、クローンに由来する構成細胞を含む細胞株を提供し、該構成細胞は、(1)SEQ ID NO:16のヌクレオチド配列を含む、mEDEM2をコードするポリヌクレオチドと、(2)SEQ ID NO:18のヌクレオチド配列を含む、XBP1をコードするポリヌクレオチドと、(3)SEQ ID NO:31のヌクレオチド配列を含む、抗体重鎖をコードするポリヌクレオチドと、(4)抗体軽鎖をコードしSEQ ID NO:33のヌクレオチド配列を含む、ポリヌクレオチドとを含有する、CHO-K1細胞である。
【0055】
さらに別の特定の態様では、本発明は、クローンに由来する構成細胞を含む細胞株を提供し、該構成細胞は、(1)SEQ ID NO:16のヌクレオチド配列を含む、mEDEM2をコードするポリヌクレオチドと、(2)SEQ ID NO:18のヌクレオチド配列を含む、XBP1をコードするポリヌクレオチドと、(3)SEQ ID NO:39のヌクレオチド配列を含む、抗体重鎖をコードするポリヌクレオチドと、(4)抗体軽鎖をコードしSEQ ID NO:41のヌクレオチド配列を含む、ポリヌクレオチドとを含有する、CHO-K1細胞である。
【0056】
EDEM2ポリヌクレオチド
別の局面において、本発明は、EDEM2タンパク質をコードするポリヌクレオチドを提供する。EDEM2をコードするポリヌクレオチドは組換え型であり、インビトロで、例えば試験管内もしくはインビトロ翻訳系において、またはインビボで、例えば細胞培養のようなエクスビボもしくは生物のようなインビボであり得る細胞内において、製造、貯蔵、使用、または発現され得る。いくつかの態様では、EDEM2をコードするポリヌクレオチドは遺伝子内にあり、すなわち、それはプロモーターの制御下にあり、プロモーターの下流に、かつポリアデニル化部位の上流にある。EDEM2をコードするポリヌクレオチドまたは遺伝子は、プラスミドまたは他の環状もしくは線状ベクター内にあり得る。EDEM2をコードするポリヌクレオチドまたは遺伝子は、エピソームとして細胞内にあってもよいか、または細胞ゲノムに組み込まれてもよい、環状または線状DNA構築物内にあり得る。
【0057】
上述したように、EDEM2をコードするポリヌクレオチドは、表1の任意のオルソログ、相同体もしくは保存的に置換されたEDEM2ポリペプチド、またはSEQ ID NO:8の哺乳動物コンセンサス配列を含めて、SEQ ID NO:1~5および8のいずれかと少なくとも92%同一であるアミノ酸配列を有するEDEM2ポリペプチドをコードしている。
【0058】
場合によっては、EDEM2をコードする組換えまたは単離されたポリヌクレオチドは、哺乳動物プロモーターに機能的に連結されている。プロモーターは任意のプロモーターとすることができるが、場合によっては、それは、例えばユビキチンCプロモーターなどの哺乳動物プロモーターである。
【0059】
特定の態様では、EDEM2をコードするポリヌクレオチドは、5'から3'へ、プロモーター、例えばユビキチンCプロモーター、続いて任意のイントロン、例えばβグロビンイントロン、続いてEDEM2コード配列、その後ポリアデニル化配列、例えばSV40pA配列から本質的になる。このようなEDEM2をコードするポリヌクレオチドの具体例は、これもまた特定の態様であるが、SEQ ID NO:16により記載される。その配列の保存された変異体も本発明の態様であると考えられる。
【0060】
場合によっては、EDEM2をコードする組換えポリヌクレオチドは、プラスミドの一部であり、該プラスミドは線状、環状、エピソーム、組込み型、静止DNA構築物、またはEDEM2遺伝子を送達するもしくはEDEM2タンパク質を発現するためのベクターであり得る。ある特定の態様では、プラスミドは、(1)ユビキチンCプロモーターの制御下にありかつSV40ポリアデニル化シグナルで終止するEDEM2遺伝子と、(2)SV40プロモーターなどのプロモーターの制御下にあり、PGK pA配列などのポリアデニル化配列で終止する選択マーカー、例えばゼオシンに対する耐性を付与するポリペプチドをコードするポリヌクレオチド、またはネオマイシンに対する耐性を付与するポリペプチドをコードするポリヌクレオチドとを含有する。ある特定の態様では、プラスミドは、5'から3'の方向へ向かう環状フォーマットで、ユビキチンCプロモーター、βグロビンイントロン、EDEM2コード配列、SV40 pA配列、SV40プロモーター、ネオマイシン耐性コード配列、およびPGK pA配列を含んでいる。この態様の具体例は、SEQ ID NO:14の配列を有するプラスミドにより例示される。別の特定の態様では、プラスミドは、5'から3'の方向へ向かう環状フォーマットで、ユビキチンCプロモーター、βグロビンイントロン、EDEM2コード配列、SV40 pA配列、SV40プロモーター、ゼオシン耐性コード配列、およびPGK pA配列を含んでいる。この態様の具体例は、SEQ ID NO:15の配列を有するプラスミドにより例示される。
【0061】
XBP1ポリヌクレオチド
別の局面において、本発明は、XBP1タンパク質をコードするポリヌクレオチドを提供する。XBP1をコードするポリヌクレオチドは組換え型であり、インビトロで、例えば試験管内もしくはインビトロ翻訳系において、またはインビボで、例えば細胞培養のようなエクスビボもしくは生物のようなインビボであり得る細胞内において、製造、貯蔵、使用、または発現され得る。いくつかの態様では、XBP1をコードするポリヌクレオチドは遺伝子内にあり、すなわち、それはプロモーターの制御下にあり、プロモーターの下流で、かつポリアデニル化部位の上流にある。XBP1をコードするポリヌクレオチドは、プラスミドまたは他の環状もしくは線状ベクター内にあり得る。XBP1をコードするポリヌクレオチドまたは遺伝子は、エピソームとして細胞内にあってもよいか、または細胞ゲノムに組み込まれてもよい、環状または線状DNA構築物内にあり得る。
【0062】
上述したように、XBP1をコードするポリヌクレオチドは、表2の任意のオルソログ、相同体もしくは保存的に置換されたXBP1ポリペプチド、またはSEQ ID NO:13の哺乳動物コンセンサス配列を含めて、SEQ ID NO:9、10および11のいずれかと少なくとも86%同一であるアミノ酸配列を有するXBP1ポリペプチドをコードしている。
【0063】
場合によっては、XBP1をコードする組換えまたは単離されたポリヌクレオチドは、哺乳動物プロモーターに機能的に連結されている。プロモーターは任意のプロモーターとすることができるが、場合によっては、それは、例えばユビキチンCプロモーターなどの哺乳動物プロモーターである。
【0064】
特定の態様では、XBP1をコードするポリヌクレオチドは、5'から3'へ、プロモーター、例えばユビキチンCプロモーター、続いて任意のイントロン、例えばβグロビンイントロン、続いてXBP1コード配列、その後ポリアデニル化配列、例えばSV40 pA配列から本質的になる。SEQ ID NO:18は、XBP1をコードするポリヌクレオチドの例を記載する。この例示的な配列の保存された変異体も本発明の態様であると考えられる。
【0065】
場合によっては、XBP1をコードする組換えポリヌクレオチドは、プラスミドの一部であり、該プラスミドは線状、環状、エピソーム、組込み型、静止DNA構築物、またはXBP1遺伝子を送達するもしくはスプライスされた活性XBP1タンパク質を発現するためのベクターであり得る。ある特定の態様では、プラスミドは、(1)ユビキチンCプロモーターの制御下にありかつSV40ポリアデニル化シグナルで終止するXBP1遺伝子と、(2)SV40プロモーターなどのプロモーターの制御下にあり、PGK pA配列などのポリアデニル化配列で終止する選択マーカー、例えばゼオシンに対する耐性を付与するポリペプチドをコードするポリヌクレオチド、またはネオマイシンに対する耐性を付与するポリペプチドをコードするポリヌクレオチドとを含有する。ある特定の態様では、プラスミドは、5'から3'の方向へ向かう環状フォーマットで、ユビキチンCプロモーター、βグロビンイントロン、XBP1コード配列、SV40 pA配列、SV40プロモーター、ゼオシン耐性コード配列、およびPGK pA配列を含んでいる。この態様の具体例は、SEQ ID NO:17の配列を有する環状プラスミドにより例示される。
【0066】
抗体の重鎖および軽鎖をコードするポリヌクレオチド
別の局面において、本発明は、抗体重鎖ポリペプチド(HC)をコードするポリヌクレオチドを提供する。HCをコードするポリヌクレオチドは組換え型であり、インビトロで、例えば試験管内もしくはインビトロ翻訳系において、またはインビボで、例えば細胞培養のようなエクスビボもしくは生物のようなインビボであり得る細胞内において、製造、貯蔵、使用、または発現され得る。いくつかの態様では、HCをコードするポリヌクレオチドは遺伝子内にあり、すなわち、それはプロモーターの制御下にあり、プロモーターの下流で、かつポリアデニル化部位の上流にある。HCをコードするポリヌクレオチドは、プラスミドまたは他の環状もしくは線状ベクター内にあり得る。HCをコードするポリヌクレオチドまたは遺伝子は、エピソームとして細胞内にあってもよいか、または細胞ゲノムに組み込まれてもよい、環状または線状DNA構築物内にあり得る。
【0067】
場合によっては、HCをコードする組換えまたは単離されたポリヌクレオチドは、哺乳動物プロモーターに機能的に連結されている。プロモーターは任意のプロモーターとすることができるが、場合によって、それは、例えばユビキチンCプロモーターまたはhCMV-IEプロモーターなどの哺乳動物プロモーターである。
【0068】
特定の態様では、HCをコードするポリヌクレオチドはHC遺伝子であり、該遺伝子は、5'から3'へ、プロモーター、例えばhCMV-IEプロモーター、続いて任意のイントロン、例えばβグロビンイントロン、続いて重鎖コード配列、例えばSEQ ID NO:43および44、SEQ ID NO:19、SEQ ID NO:27、またはSEQ ID NO:35のアミノ酸配列をコードする配列、その後ポリアデニル化配列、例えばSV40 pA配列を本質的に含んでいる。HC遺伝子の具体例は、SEQ ID NO:23、SEQ ID NO:31、またはSEQ ID NO:39により記載される。これらの配列のいずれかの保存された変異体も本発明の態様であると考えられる。
【0069】
場合によっては、HCをコードする組換えポリヌクレオチドは、プラスミドの一部であり、該プラスミドは線状、環状、エピソーム、組込み型、静止DNA構築物、または重鎖遺伝子を送達するもしくは重鎖サブユニットを発現するためのベクターであり得る。ある特定の態様では、プラスミドは、(1)hCMV-IEプロモーターの制御下にありかつSV40ポリアデニル化シグナルで終止するHC遺伝子と、(2)SV40プロモーターなどのプロモーターの制御下にあり、PGK pA配列などのポリアデニル化配列で終止する選択マーカー、例えば、ハイグロマイシンに対する耐性を付与するポリペプチドをコードするポリヌクレオチドとを含有する。ある特定の態様では、プラスミドは、5'から3'の方向へ向かう環状フォーマットで、hCMV-IEプロモーター、βグロビンイントロン、抗体重鎖コード配列(SEQ ID NO:43および44、SEQ ID NO:19、SEQ ID NO:27、またはSEQ ID NO:35のアミノ酸配列を有するHCをコードする)、SV40 pA配列、SV40プロモーター、ハイグロマイシン耐性コード配列、およびPGK pA配列を含んでいる。このようなHC遺伝子を含むプラスミドの具体例および特定の態様は、SEQ ID NO:24、SEQ ID NO:32、またはSEQ ID NO:40により記載される。これらの配列のいずれかの保存された変異体も本発明の態様であると考えられる。
【0070】
別の局面において、本発明は、抗体軽鎖ポリペプチド(LC)をコードするポリヌクレオチドを提供する。LCをコードするポリヌクレオチドは組換え型であり、インビトロで、例えば試験管内もしくはインビトロ翻訳系において、またはインビボで、例えば細胞培養のようなエクスビボもしくは生物のようなインビボであり得る細胞内において、製造、貯蔵、使用、または発現され得る。いくつかの態様では、LCをコードするポリヌクレオチドは遺伝子内にあり、すなわち、それはプロモーターの制御下にあり、プロモーターの下流で、かつポリアデニル化部位の上流にある。LCをコードするポリヌクレオチドまたは遺伝子は、プラスミドまたは他の環状もしくは線状ベクター内にあり得る。LCをコードするポリヌクレオチドまたは遺伝子は、エピソームとして細胞内にあってもよいか、または細胞ゲノムに組み込まれてもよい、環状または線状DNA構築物内にあり得る。
【0071】
場合によっては、LCをコードする組換えまたは単離されたポリヌクレオチドは、哺乳動物プロモーターに機能的に連結されている。プロモーターは任意のプロモーターとすることができるが、場合によって、それは、例えばユビキチンCプロモーターまたはhCMV-IEプロモーターなどの哺乳動物プロモーターである。
【0072】
特定の態様では、LCをコードするポリヌクレオチドはLC遺伝子であり、該遺伝子は、5'から3'へ、プロモーター、例えばhCMV-IEプロモーター、続いて任意のイントロン、例えばβグロビンイントロン、続いて軽鎖コード配列、例えばSEQ ID NO:45および46、SEQ ID NO:21、SEQ ID NO:29、またはSEQ ID NO:37のアミノ酸配列をコードする配列、その後にポリアデニル化配列、例えばSV40 pA配列を本質的に含んでいる。このようなLC遺伝子の具体例および特定の態様は、SEQ ID NO:25、SEQ ID NO:33、またはSEQ ID NO:41により記載される。これらの配列のいずれかの保存された変異体も本発明の態様であると考えられる。
【0073】
場合によっては、LCをコードする組換えポリヌクレオチドは、プラスミドの一部であり、該プラスミドは線状、環状、エピソーム、組込み型、静止DNA構築物、または軽鎖遺伝子を送達するもしくは軽鎖サブユニットを発現するためのベクターであり得る。ある特定の態様では、プラスミドは、(1)hCMV-IEプロモーターの制御下にありかつSV40ポリアデニル化シグナルで終止するLC遺伝子と、(2)SV40プロモーターなどのプロモーターの制御下にあり、PGK pA配列などのポリアデニル化配列で終止する選択マーカー、例えばハイグロマイシンに対する耐性を付与するポリペプチドをコードするポリヌクレオチドとを含有する。ある特定の態様では、プラスミドは、5'から3'の方向へ向かう環状フォーマットで、hCMV-IEプロモーター、βグロビンイントロン、抗体軽鎖コード配列(SEQ ID NO:45および46、SEQ ID NO:21、SEQ ID NO:29、またはSEQ ID NO:37のアミノ酸配列を有するLCをコードする)、SV40 pA配列、SV40プロモーター、ハイグロマイシン耐性コード配列、およびPGK pA配列を含んでいる。このようなLC遺伝子を含むプラスミドの具体例および特定の態様は、SEQ ID NO:26、SEQ ID NO:34、またはSEQ ID NO:42により記載される。これらの配列のいずれかの保存された変異体も本発明の態様であると考えられる。
【0074】
多サブユニットタンパク質を製造する方法
別の局面において、本発明は、適切に組み立てられた多サブユニットタンパク質を比較的多量に産生して分泌することができる細胞、または細胞株の構成細胞を、培地中で培養することによって、多サブユニットタンパク質を製造するための方法を提供し、この方法では、多サブユニット成分が比較的高い力価で培地中に分泌される。この製造方法で用いられる細胞は、本明細書に記載のERADレクチンをコードするポリヌクレオチドを含有する、前述の局面で説明した細胞である。
【0075】
有用な組換えタンパク質を産生する目的で、細胞、特に哺乳動物細胞を培養する方法は、当技術分野で周知である(例えば、De Jesus and Wurm, Eur. J. Pharm. Biopharm. 78:184-188, 2011、およびそこに引用された文献を参照されたい)。簡単に述べると、記載されたポリヌクレオチドを含む細胞は、培地中で培養されるが、該培地は、血清もしくは加水分解物を含んでいてもよいか、または、化学的に規定されてタンパク質産生用に最適化されたものでもよい。培養は、流加培養、または、ケモスタットにおけるような連続培養であり得る。細胞は、実験室ベンチサイズのフラスコ(約25mL)、生産スケールアップのバイオリアクター(1~5L)、または工業規模のバイオリアクター(5,000~25,000L)内で培養することができる。生産ランは数週間から1ヶ月間続けることができ、その期間中多サブユニットタンパク質は培地中に分泌される。
【0076】
対象となる細胞は、適切に組み立てられた多サブユニットタンパク質を産生して分泌する能力が向上している。いくつかの態様では、多サブユニットタンパク質、例えば抗体は、培地中に、少なくとも94ρg/細胞/日、少なくとも37ρg/細胞/日、または少なくとも39ρg/細胞/日の割合で分泌される。いくつかの態様では、多サブユニットタンパク質は、培養の約12日後に少なくとも3g/L、少なくとも5g/L、少なくとも6g/L、または少なくとも8g/Lの力価に達する。
【0077】
さらに、対象となる細胞は、増殖して比較的高い細胞密度を達成する能力に優れており、生産性をさらに最適化する。いくつかの態様では、細胞または細胞株シードトレイン(seed train)は、少なくとも5×107細胞-日/mL、少なくとも1×108細胞-日/mL、または少なくとも1.5×108細胞-日/mLの培養中積分細胞密度を達成する。
【0078】
任意で、分泌された多サブユニットタンパク質は、その後、それが分泌された培地から精製される。タンパク質の精製方法は当技術分野で周知である(例えば、Kelley, mAbs 1(5):443-452を参照されたい)。いくつかの態様では、該タンパク質は、液体培地上清から細胞を取り除くための遠心分離、その後の、とりわけウイルスおよび他の汚染物または不純物を除去するための種々のクロマトグラフィー工程およびろ過工程によって回収される。いくつかの態様では、クロマトグラフィー工程は、陽イオン交換または陰イオン交換などのイオン交換工程を含む。各種のアフィニティークロマトグラフ媒体を用いることもでき、例えば、抗体精製用のプロテインAクロマトグラフィーなどがある。
【0079】
任意で、前記製造方法は、細胞を作製するための先行段階を含むことができる。かくして、いくつかの態様では、多サブユニットタンパク質を製造する方法は、上述したように、ストレス誘導性マンノース結合レクチンをコードするベクターで細胞をトランスフェクトし、続いてそれらの安定した組込み体を選択する段階を含む。ベクターの非限定的な例には、SEQ ID NO:1~8のいずれかのアミノ酸配列、SEQ ID NO:1~8のいずれかと少なくとも92%同一であるアミノ酸配列、またはSEQ ID NO:1~8の保存的に置換された変異体のいずれか、を有するEDEM2をコードするポリヌクレオチドを含有する遺伝子構築物が含まれる。有用なベクターにはまた、例えば、SEQ ID NO:16の遺伝子を保有するプラスミド、SEQ ID NO:15のプラスミド、およびSEQ ID NO:14のプラスミドが含まれる。プラスミドの配列(例えば、SEQ ID NO:14、15、17、24、26、32、34、40、および42)は、配列表では直線的に記載されている環状の配列であることに留意すべきである。したがって、これらの場合では、記載された配列の最も3'側のヌクレオチドは、記載された配列の最も5'側のヌクレオチドのすぐ5'側にあると考えることができる。SEQ ID NO:14のプラスミドの例では、形質転換体はネオマイシンに対する耐性を介して選択され;SEQ ID NO:15では、ゼオシン耐性を介した選択による。
【0080】
ポリヌクレオチドおよびそれを含むベクターの構築のための詳細な方法は、参照により本明細書に組み入れられる米国特許第7,435,553号および同第7,771,997号、ならびに、例えば、Zwarthoff et al., J. Gen. Virol. 66(4):685-91, 1985; Mory et al., DNA. 5(3):181-93, 1986; およびPichler et al., Biotechnol. Bioeng. 108(2):386-94, 2011に記載されている。
【0081】
ストレス誘導性マンノース結合レクチンをコードするベクターが配置される出発細胞は、多サブユニットタンパク質のサブユニット、またはXBP1を用いる態様ではXBP1、をコードするかまたはその発現を調節する構築物または遺伝要素をすでに含んでいてよい。あるいは、ストレス誘導性マンノース結合レクチンをコードするベクターを最初に細胞の内部に入れて、その後で他の構築物を入れてもよい。
【0082】
前記方法により製造された多サブユニットタンパク質
別の局面において、本発明は、本明細書に開示された方法に従って生成される多サブユニットタンパク質を提供する。抗体などの多サブユニットタンパク質の適切なフォールディング、組み立て、および翻訳後修飾を容易にする1つまたはそれ以上の要素を含めるならば、当業者は当然、そうしたタンパク質が特有の構造的および機能的品質を有することを期待するであろう。例えば、開示された方法により製造される抗体は、当然、特定のグリコシル化パターンおよび量的に高い割合の非凝集ヘテロ四量体を有すると考えられる。
【実施例0083】
以下の実施例は、本発明の方法および組成物をいかにして作製し使用するかの完全な開示と説明を当業者に提供するために提示されており、本発明者らが本発明と見なしているものの範囲を限定するものではない。用いる数字(例えば、量、温度など)に関して正確さを確保するための努力がなされているが、若干の実験誤差および偏差が考慮されるべきである。特に明記しない限り、部はモル部であり、分子量は平均分子量であり、パーセント濃度(%)は、ミリリットル単位の溶液の体積で割ったグラム単位の溶質の質量の100倍%を意味し(例えば、10%物質Xは、溶液のミリリットルあたり0.1グラムの物質Xを意味する)、温度は摂氏であり、圧力は大気圧またはその付近である。
【0084】
実施例1:細胞株
CHO-K1由来の宿主細胞株を、ヒト抗体の重鎖および軽鎖をコードする2つのプラスミドでトランスフェクトした。両方のプラスミドには、ハイグロマイシンBに対する耐性を付与するhph遺伝子が含まれている(Asselbergs and Pronk, 1992, Mol. Biol. Rep., 17(1):61-70)。細胞はリポフェクタミン試薬(Invitrogen社カタログ#18324020)を用いてトランスフェクトした。簡単に述べると、トランスフェクションの1日前に、350万個の細胞を、10cmプレート上で10%ウシ胎児血清(FBS)(Invitrogen社カタログ#10100)を含有する完全F12(Invitrogen社カタログ#11765)中にまいた。トランスフェクション当日、細胞を1回洗浄し、培地を(Invitrogen社カタログ#31985)からのOPTIMEMと交換した。DNA/リポフェクタミン複合体をOPTIMEM培地中で調製し、その後細胞に加えた。6時間後、培地を、10%FBSを含む完全F12に再び交換した。プラスミドの安定な組込みは、400μg/mlのハイグロマイシンB選択剤を用いて選択した。クローン性抗体を発現する細胞株はFASTR技術(参照により本明細書に組み入れられる米国特許第6,919,183号に記載される)を用いて単離した。
【0085】
次に、抗体を発現する株を、EDEM2をコードするプラスミドで再トランスフェクトした。EDEM2プラスミドは、G418またはゼオシンに対する耐性を付与するために、それぞれネオマイシンホスホトランスフェラーゼ遺伝子(「p3」と指定されたプラスミド構築物)またはsh ble遺伝子(プラスミド「p7」)のいずれかを含んでいた。同じトランスフェクション法を用いた。選択マーカーに応じて、細胞は、それぞれ400μg/mlまたは250μg/mlのG418またはゼオシンのいずれかを用いて選択した。その後、クローン細胞株はFASTR技術を用いて単離した。
【0086】
【0087】
実施例2:
抗体産生は、振とうフラスコを用いるスケールダウンした12日間の流加プロセスにおいて評価した。この方法では、細胞を、産生培地(高アミノ酸を含む規定培地)中80万個/mLの細胞密度で振とうフラスコに播種した。この培養物を約12日間維持し、グルコースならびに供給物を3回補充した。生細胞密度および抗体価はバッチを通してモニターされた。
【0088】
タンパク質の産生向上に及ぼすmEDEM2の効果を判定するために、mEDEM2とmXBP1を含むCHO細胞株によるタンパク質の産生を、mXBP1を含むがmEDEM2を含まない対照細胞による産生と比較した。タンパク質力価は、mEDEM2を発現しない細胞株と比べて、mEDEM2を発現する細胞株において高かった。
【0089】
【0090】
実施例3:積分細胞日数
積分細胞日数(integrated Cell Days)(ICD)は、流加プロセスを通して培養物の増殖を記載するために用いられる語句である。12日間の産生アッセイ法の過程で、我々は0、3、5、7、10、および12日目に生細胞密度をモニターした。次にこのデータを時間に対してプロットした。ICDは、細胞密度の曲線下面積として算出された、生細胞密度の積分である。EDEM2トランスフェクト株は、12日間の流加プロセスにおいてより高いICDを有する(表5参照)。
【0091】
【0092】
実施例4:抗GDF8抗体の産生
SEQ ID NO:19の重鎖配列とSEQ ID NO:21の軽鎖配列を有する抗GDF8抗体の産生に及ぼすEDEM2、XBP1、またはこれらの両方の異所性発現の効果を調べた。個々の細胞株を力価および積分細胞密度について調べて、「ビン」または値域(ranges of values)に入れた。EDEM2の異所性発現は、5~6g/Lの力価範囲の抗体を発現する細胞株の数を著しく増加させた。XBP1とEDEM2の組み合わせは、高力価細胞株の増加に向けて相加効果を上回る効果を示した。抗体分泌細胞におけるEDEM2の発現はまた、高いICDを達成する細胞株の数を著しく増加させた(表6参照)。
【0093】
【0094】
配列情報
SEQUENCE LISTING
<110> Regeneron Pharmaceuticals, Inc.
<120> Production Cell Line Enhancers
<150> US 61/652,549
<151> 2012-05-29
<150> US 13/904,587
<151> 2013-05-29
<160> 46
<170> PatentIn version 3.5
<210> 1
<211> 577
<212> PRT
<213> Mus musculus
<400> 1
Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Val Cys Val Leu Leu
1 5 10 15
Pro Leu His His Gly Ala Pro Gly Pro Asp Gly Thr Ala Pro Asp Pro
20 25 30
Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp
35 40 45
Ser Tyr Leu Glu Asn Ala Phe Pro Tyr Asp Glu Leu Arg Pro Leu Thr
50 55 60
Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp
65 70 75 80
Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Thr Ser Glu Phe Gln Arg
85 90 95
Val Val Glu Val Leu Gln Asp Asn Val Asp Phe Asp Ile Asp Val Asn
100 105 110
Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser
115 120 125
Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp
130 135 140
Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys
145 150 155 160
Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val
165 170 175
Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr
180 185 190
Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu
195 200 205
Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Val Ala Leu Met Arg
210 215 220
Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp
225 230 235 240
Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly
245 250 255
Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln
260 265 270
Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Lys Ala Ile Arg
275 280 285
Asn Tyr Thr His Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys
290 295 300
Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro
305 310 315 320
Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe
325 330 335
Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe
340 345 350
Tyr Asn Ile Pro Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro
355 360 365
Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr
370 375 380
Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile
385 390 395 400
Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu
405 410 415
Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu
420 425 430
Thr Val Lys Tyr Leu Tyr Leu Leu Phe His Pro Asn Asn Phe Ile His
435 440 445
Asn Asn Gly Ser Thr Phe Asp Ser Val Met Thr Pro His Gly Glu Cys
450 455 460
Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile
465 470 475 480
Asp Pro Ala Ala Leu His Cys Cys Arg Arg Leu Lys Glu Glu Gln Trp
485 490 495
Glu Val Glu Asp Leu Ile Lys Glu Phe Tyr Ser Leu Lys Gln Ser Arg
500 505 510
Pro Lys Arg Ala Gln Arg Lys Thr Val Arg Ser Gly Pro Trp Glu Pro
515 520 525
Gln Ser Gly Pro Ala Thr Leu Ser Ser Pro Ala Asn Gln Pro Arg Glu
530 535 540
Lys Gln Pro Ala Gln Gln Arg Thr Pro Leu Leu Ser Cys Pro Ser Gln
545 550 555 560
Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp Ser
565 570 575
Ser
<210> 2
<211> 576
<212> PRT
<213> Rattus norvegicus
<400> 2
Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Val Cys Val Leu Leu
1 5 10 15
Pro Leu His His Gly Ala Pro Gly Pro Glu Gly Thr Ala Pro Asp Pro
20 25 30
Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp
35 40 45
Ser Tyr Leu Glu Asn Ala Phe Pro Tyr Asp Glu Leu Arg Pro Leu Thr
50 55 60
Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp
65 70 75 80
Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Thr Ser Glu Phe Gln Arg
85 90 95
Val Val Glu Val Leu Gln Asp Asn Val Asp Phe Asp Ile Asp Val Asn
100 105 110
Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser
115 120 125
Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp
130 135 140
Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys
145 150 155 160
Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val
165 170 175
Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr
180 185 190
Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu
195 200 205
Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Val Ala Leu Met Arg
210 215 220
Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp
225 230 235 240
Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly
245 250 255
Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln
260 265 270
Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Lys Ala Ile Arg
275 280 285
Asn Tyr Thr His Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys
290 295 300
Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro
305 310 315 320
Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe
325 330 335
Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe
340 345 350
Tyr Asn Ile Pro Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro
355 360 365
Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr
370 375 380
Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile
385 390 395 400
Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu
405 410 415
Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu
420 425 430
Thr Val Lys Tyr Leu Tyr Leu Leu Phe His Pro Asn Asn Phe Ile His
435 440 445
Asn Asn Gly Ser Thr Phe Asp Ser Val Met Thr Pro His Gly Glu Cys
450 455 460
Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile
465 470 475 480
Asp Pro Ala Ala Leu His Cys Cys Arg Arg Leu Lys Glu Glu Gln Trp
485 490 495
Glu Val Glu Asp Leu Ile Lys Glu Phe Tyr Ser Leu Arg Gln Ser Arg
500 505 510
Ser Arg Ala Gln Arg Lys Thr Val Ser Ser Gly Pro Trp Glu Pro Pro
515 520 525
Ala Gly Pro Gly Thr Leu Ser Ser Pro Glu Asn Gln Pro Arg Glu Lys
530 535 540
Gln Pro Ala Arg Gln Arg Ala Pro Leu Leu Ser Cys Pro Ser Gln Pro
545 550 555 560
Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp Ser Ser
565 570 575
<210> 3
<211> 578
<212> PRT
<213> Cricetulus griseus
<400> 3
Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Val Cys Val Phe Leu
1 5 10 15
Pro Leu His His Gly Ala Pro Gly Pro Asp Gly Thr Ala Pro Asp Pro
20 25 30
Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp
35 40 45
Ser Tyr Leu Glu Asn Ala Phe Pro Tyr Asp Glu Leu Arg Pro Leu Thr
50 55 60
Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp
65 70 75 80
Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Thr Ser Glu Phe Gln Arg
85 90 95
Val Val Glu Val Leu Gln Asp Asn Val Asp Phe Asp Ile Asp Val Asn
100 105 110
Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser
115 120 125
Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp
130 135 140
Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys
145 150 155 160
Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val
165 170 175
Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr
180 185 190
Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu
195 200 205
Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Leu Ala Leu Met Arg
210 215 220
Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp
225 230 235 240
Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly
245 250 255
Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln
260 265 270
Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Arg Ala Ile Arg
275 280 285
Asn Tyr Thr His Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys
290 295 300
Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro
305 310 315 320
Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe
325 330 335
Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe
340 345 350
Tyr Asn Ile Ala Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro
355 360 365
Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr
370 375 380
Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile
385 390 395 400
Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu
405 410 415
Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu
420 425 430
Thr Val Lys Tyr Leu Tyr Leu Leu Phe His Pro Asn Asn Phe Ile His
435 440 445
Asn Asn Gly Ser Thr Phe Asp Ser Val Met Thr Pro His Gly Glu Cys
450 455 460
Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile
465 470 475 480
Asp Pro Ala Ala Leu His Cys Cys Arg Arg Leu Lys Glu Glu Gln Trp
485 490 495
Glu Val Glu Asp Leu Met Arg Glu Leu His Ser Leu Lys Gln Ser Arg
500 505 510
Ser Arg Ala Gln Arg Lys Thr Thr Ser Ser Gly Pro Trp Glu Pro Pro
515 520 525
Ala Gly Pro Gly Ser Pro Ser Ala Pro Gly Lys Gln Asp Gln Pro Arg
530 535 540
Glu Lys Gln Pro Ala Lys Gln Arg Thr Pro Leu Leu Ser Cys Pro Ser
545 550 555 560
Gln Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp
565 570 575
Ser Ser
<210> 4
<211> 578
<212> PRT
<213> Homo sapiens
<400> 4
Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Leu Cys Ala Leu Leu
1 5 10 15
Pro Gln His His Gly Ala Pro Gly Pro Asp Gly Ser Ala Pro Asp Pro
20 25 30
Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp
35 40 45
Ser Tyr Leu Glu Asn Ala Phe Pro Phe Asp Glu Leu Arg Pro Leu Thr
50 55 60
Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp
65 70 75 80
Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Val Ser Glu Phe Gln Arg
85 90 95
Val Val Glu Val Leu Gln Asp Ser Val Asp Phe Asp Ile Asp Val Asn
100 105 110
Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser
115 120 125
Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp
130 135 140
Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys
145 150 155 160
Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val
165 170 175
Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr
180 185 190
Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu
195 200 205
Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Val Ala Leu Met Arg
210 215 220
Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp
225 230 235 240
Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly
245 250 255
Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln
260 265 270
Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Lys Ala Ile Arg
275 280 285
Asn Tyr Thr Arg Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys
290 295 300
Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro
305 310 315 320
Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe
325 330 335
Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe
340 345 350
Tyr Asn Ile Pro Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro
355 360 365
Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr
370 375 380
Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile
385 390 395 400
Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu
405 410 415
Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu
420 425 430
Thr Val Lys Tyr Leu Tyr Leu Leu Phe Asp Pro Thr Asn Phe Ile His
435 440 445
Asn Asn Gly Ser Thr Phe Asp Thr Val Ile Thr Pro Tyr Gly Glu Cys
450 455 460
Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile
465 470 475 480
Asp Pro Ala Ala Leu His Cys Cys Gln Arg Leu Lys Glu Glu Gln Trp
485 490 495
Glu Val Glu Asp Leu Met Arg Glu Phe Tyr Ser Leu Lys Arg Ser Arg
500 505 510
Ser Lys Phe Gln Lys Asn Thr Val Ser Ser Gly Pro Trp Glu Pro Pro
515 520 525
Ala Arg Pro Gly Thr Leu Phe Ser Pro Glu Asn His Asp Gln Ala Arg
530 535 540
Glu Arg Lys Pro Ala Lys Gln Lys Val Pro Leu Leu Ser Cys Pro Ser
545 550 555 560
Gln Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp
565 570 575
Ser Ser
<210> 5
<211> 578
<212> PRT
<213> Pan troglodytes
<400> 5
Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Leu Cys Ala Leu Leu
1 5 10 15
Pro Leu His His Gly Ala Pro Gly Pro Asp Gly Ser Ala Pro Asp Pro
20 25 30
Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp
35 40 45
Ser Tyr Leu Glu Asn Ala Phe Pro Phe Asp Glu Leu Arg Pro Leu Thr
50 55 60
Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp
65 70 75 80
Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Val Ser Glu Phe Gln Arg
85 90 95
Val Val Glu Val Leu Gln Asp Ser Val Asp Phe Asp Ile Asp Val Asn
100 105 110
Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser
115 120 125
Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp
130 135 140
Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys
145 150 155 160
Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val
165 170 175
Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr
180 185 190
Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu
195 200 205
Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Val Ala Leu Met Arg
210 215 220
Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp
225 230 235 240
Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly
245 250 255
Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln
260 265 270
Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Lys Ala Ile Arg
275 280 285
Asn Tyr Thr Arg Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys
290 295 300
Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro
305 310 315 320
Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe
325 330 335
Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe
340 345 350
Tyr Asn Ile Pro Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro
355 360 365
Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr
370 375 380
Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile
385 390 395 400
Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu
405 410 415
Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu
420 425 430
Thr Val Lys Tyr Leu Tyr Leu Leu Phe Asp Pro Thr Asn Phe Ile His
435 440 445
Asn Asn Gly Ser Thr Phe Asp Ala Val Ile Thr Pro Tyr Gly Glu Cys
450 455 460
Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile
465 470 475 480
Asp Pro Ala Ala Leu His Cys Cys Gln Arg Leu Lys Glu Glu Gln Trp
485 490 495
Glu Val Glu Asp Leu Met Arg Glu Phe Tyr Ser Leu Lys Arg Ser Arg
500 505 510
Ser Lys Phe Gln Lys Lys Thr Val Ser Ser Gly Pro Trp Glu Pro Pro
515 520 525
Ala Arg Pro Gly Thr Leu Phe Ser Pro Glu Asn His Asp Gln Ala Arg
530 535 540
Glu Arg Lys Pro Ala Lys Gln Lys Val Pro Leu Leu Ser Cys Pro Ser
545 550 555 560
Gln Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp
565 570 575
Ser Ser
<210> 6
<211> 513
<212> PRT
<213> Pongo pygmaeus
<400> 6
Met Asn Thr Leu Ser Cys Ser Leu Phe Ser Leu Thr Leu Ile Asp Ala
1 5 10 15
Leu Asp Thr Leu Leu Ile Leu Gly Asn Val Ser Glu Phe Gln Arg Val
20 25 30
Val Glu Val Leu Gln Asp Asn Val Asp Phe Asp Ile Asp Val Asn Ala
35 40 45
Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser Ala
50 55 60
His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp Pro
65 70 75 80
Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys Leu
85 90 95
Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val Asn
100 105 110
Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr Ala
115 120 125
Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu Thr
130 135 140
Gly Asp Pro Val Phe Glu Asp Val Ala Arg Val Ala Leu Met Arg Leu
145 150 155 160
Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp Val
165 170 175
Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly Val
180 185 190
Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln Asp
195 200 205
Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Lys Ala Ile Arg Asn
210 215 220
Tyr Thr Arg Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys Gly
225 230 235 240
Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro Gly
245 250 255
Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe Leu
260 265 270
Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe Tyr
275 280 285
Asn Ile Pro Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro Leu
290 295 300
Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr Gly
305 310 315 320
Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile Glu
325 330 335
Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu Arg
340 345 350
Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu Thr
355 360 365
Val Lys Tyr Leu Tyr Leu Leu Phe Asp Pro Thr Asn Phe Ile His Asn
370 375 380
Asn Gly Ser Thr Phe Asp Ala Val Ile Thr Pro Tyr Gly Glu Cys Ile
385 390 395 400
Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile Asp
405 410 415
Pro Ala Ala Leu His Cys Cys Gln Arg Leu Lys Glu Glu Gln Trp Glu
420 425 430
Val Glu Asp Leu Met Arg Glu Phe Tyr Ser Leu Lys Arg Asn Arg Ser
435 440 445
Lys Phe Gln Lys Lys Thr Val Ser Ser Gly Pro Trp Glu Pro Pro Ala
450 455 460
Arg Pro Gly Thr Leu Phe Ser Pro Glu Asn His Asp Gln Ala Arg Gly
465 470 475 480
Arg Lys Pro Ala Lys Gln Lys Val Pro Leu Leu Ser Cys Pro Ser Gln
485 490 495
Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp Ser
500 505 510
Ser
<210> 7
<211> 572
<212> PRT
<213> Danio rerio
<400> 7
Leu Tyr Tyr Leu Pro Leu Phe Thr Ser Arg Tyr Phe Met Leu Thr Phe
1 5 10 15
Leu Phe Ser Ala Ile Phe Cys Ala Ala Tyr Leu Ser Pro Ile Ile Ser
20 25 30
His Val Lys Gly Arg Asp Phe Thr Glu Gln Glu Met Ser His Tyr Arg
35 40 45
Asp Arg Val Lys Ser Met Phe Tyr His Ala Tyr Asn Ser Tyr Leu Asp
50 55 60
Asn Ala Tyr Pro Tyr Asp Glu Leu Arg Pro Leu Thr Cys Asp Gly Gln
65 70 75 80
Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp Ala Leu Asp Thr
85 90 95
Leu Leu Ile Leu Gly Asn His Thr Glu Phe Gln Arg Val Ala Thr Leu
100 105 110
Leu Gln Asp Thr Val Asp Phe Asp Ile Asp Val Asn Ala Ser Val Phe
115 120 125
Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser Ala His Leu Leu
130 135 140
Ser Lys Arg Ala Gly Met Lys Val Glu Glu Gly Trp Pro Cys Ser Gly
145 150 155 160
Pro Leu Leu Arg Met Ala Glu Asp Ala Ala Arg Lys Leu Leu Pro Ala
165 170 175
Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val Asn Leu Leu Arg
180 185 190
Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr Ala Gly Val Gly
195 200 205
Thr Phe Ile Leu Glu Phe Ser Thr Leu Ser Arg Leu Thr Gly Asp Pro
210 215 220
Val Phe Glu Asn Val Ala Arg Lys Ala Leu Arg Ala Leu Trp Arg Thr
225 230 235 240
Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp Val Ile Thr Ser
245 250 255
Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly Val Asp Ser Tyr
260 265 270
Phe Glu Tyr Leu Val Arg Gly Ala Ile Met Leu Gln Asp Glu Glu Leu
275 280 285
Leu Thr Met Phe Tyr Glu Phe Asp Lys Ser Ile Lys Asn Tyr Thr Lys
290 295 300
Phe Asp Asp Trp Tyr Leu Trp Val Gln Met His Lys Gly Thr Val Ser
305 310 315 320
Met Pro Val Phe Gln Ser Leu Glu Ala Phe Trp Pro Gly Met Gln Ser
325 330 335
Leu Ile Gly Asp Ile Ser Ser Ala Thr Lys Ser Phe His Asn Tyr Tyr
340 345 350
Ser Val Trp Arg Gln Phe Gly Gly Leu Pro Glu Phe Tyr Ser Ile Pro
355 360 365
Gln Gly Tyr Thr Val Asp Lys Arg Glu Gly Tyr Pro Leu Arg Pro Glu
370 375 380
Leu Ile Glu Ser Ala Met Tyr Leu Tyr Lys Ala Thr Gly Asp Pro Ser
385 390 395 400
Phe Ile Gln Leu Gly Arg Asp Ala Val Glu Ser Ile Asp Arg Ile Ser
405 410 415
Arg Val Asn Cys Gly Phe Ala Thr Val Lys Asp Val Arg Asp His Lys
420 425 430
Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu Thr Ile Lys Tyr
435 440 445
Leu Tyr Leu Leu Phe Asp Pro Asp Asn Phe Leu His Asn Thr Gly Thr
450 455 460
Glu Phe Glu Leu Gly Gly Leu Arg Gly Asp Cys Ile Leu Ser Ala Gly
465 470 475 480
Gly Tyr Val Phe Asn Thr Glu Ala His Pro Leu Asp Pro Ala Ala Leu
485 490 495
His Cys Cys Ser Arg Glu Gln Gln Asp Arg Arg Glu Ile Gln Asp Ile
500 505 510
Leu Leu Ser Phe Ser Gln Pro His Thr Glu Glu Pro Ser Arg Asp Gln
515 520 525
Ser Ala Gly Gly Ser Pro Glu Ser Ile Ala Leu Lys Pro Gly Glu Gln
530 535 540
Arg Lys Ala Pro Val Leu Ser Cys Pro Thr Gln Pro Phe Ser Ala Lys
545 550 555 560
Leu Ala Val Met Gly Gln Val Phe Ser Asp Asn Ser
565 570
<210> 8
<211> 577
<212> PRT
<213> Artificial
<220>
<223> Consensus sequence
<220>
<221> MISC_FEATURE
<222> (12)..(12)
<223> V or L
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> V or A
<220>
<221> MISC_FEATURE
<222> (15)..(15)
<223> L or F
<220>
<221> MISC_FEATURE
<222> (26)..(26)
<223> D or E
<220>
<221> MISC_FEATURE
<222> (28)..(28)
<223> T or S
<220>
<221> MISC_FEATURE
<222> (57)..(57)
<223> Y or F
<220>
<221> MISC_FEATURE
<222> (91)..(91)
<223> T or V
<220>
<221> MISC_FEATURE
<222> (104)..(104)
<223> N or S
<220>
<221> MISC_FEATURE
<222> (220)..(220)
<223> V or L
<220>
<221> MISC_FEATURE
<222> (285)..(285)
<223> K or R
<220>
<221> MISC_FEATURE
<222> (292)..(292)
<223> H or R
<220>
<221> MISC_FEATURE
<222> (356)..(356)
<223> P or A
<220>
<221> MISC_FEATURE
<222> (442)..(442)
<223> H or D
<220>
<221> MISC_FEATURE
<222> (444)..(444)
<223> N or T
<220>
<221> MISC_FEATURE
<222> (456)..(456)
<223> S, T, or A
<220>
<221> MISC_FEATURE
<222> (458)..(458)
<223> M or I
<220>
<221> MISC_FEATURE
<222> (461)..(461)
<223> H or Y
<220>
<221> MISC_FEATURE
<222> (489)..(489)
<223> R or Q
<220>
<221> MISC_FEATURE
<222> (502)..(502)
<223> I or M
<220>
<221> MISC_FEATURE
<222> (503)..(503)
<223> K or R
<220>
<221> MISC_FEATURE
<222> (505)..(505)
<223> F or L
<220>
<221> MISC_FEATURE
<222> (506)..(506)
<223> Y or H
<220>
<221> MISC_FEATURE
<222> (509)..(509)
<223> K or R
<220>
<221> MISC_FEATURE
<222> (510)..(510)
<223> Q or R
<220>
<221> MISC_FEATURE
<222> (513)..(513)
<223> P or S
<220>
<221> MISC_FEATURE
<222> (514)..(516)
<223> KRA, RA, or KF
<220>
<221> MISC_FEATURE
<222> (518)..(518)
<223> R or K
<220>
<221> MISC_FEATURE
<222> (519)..(519)
<223> K or N
<220>
<221> MISC_FEATURE
<222> (522)..(522)
<223> R or S
<220>
<221> MISC_FEATURE
<222> (529)..(529)
<223> Q or P
<220>
<221> MISC_FEATURE
<222> (530)..(530)
<223> S or A
<220>
<221> MISC_FEATURE
<222> (531)..(531)
<223> G or R
<220>
<221> MISC_FEATURE
<222> (533)..(533)
<223> A or G
<220>
<221> MISC_FEATURE
<222> (534)..(534)
<223> T or S
<220>
<221> MISC_FEATURE
<222> (535)..(535)
<223> L or P
<220>
<221> MISC_FEATURE
<222> (536)..(536)
<223> S or F
<220>
<221> MISC_FEATURE
<222> (537)..(537)
<223> S or A
<220>
<221> MISC_FEATURE
<222> (539)..(540)
<223> AN, EN, GKQD, or ENHD
<220>
<221> MISC_FEATURE
<222> (542)..(542)
<223> P or A
<220>
<221> MISC_FEATURE
<222> (545)..(545)
<223> K or R
<220>
<221> MISC_FEATURE
<222> (546)..(546)
<223> Q or K
<220>
<221> MISC_FEATURE
<222> (549)..(549)
<223> Q, R, or K
<220>
<221> MISC_FEATURE
<222> (551)..(551)
<223> R or K
<220>
<221> MISC_FEATURE
<222> (552)..(552)
<223> T, A, or V
<400> 8
Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Xaa Cys Xaa Xaa Leu
1 5 10 15
Pro Leu His His Gly Ala Pro Gly Pro Xaa Gly Xaa Ala Pro Asp Pro
20 25 30
Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp
35 40 45
Ser Tyr Leu Glu Asn Ala Phe Pro Xaa Asp Glu Leu Arg Pro Leu Thr
50 55 60
Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp
65 70 75 80
Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Xaa Ser Glu Phe Gln Arg
85 90 95
Val Val Glu Val Leu Gln Asp Xaa Val Asp Phe Asp Ile Asp Val Asn
100 105 110
Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser
115 120 125
Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp
130 135 140
Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys
145 150 155 160
Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val
165 170 175
Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr
180 185 190
Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu
195 200 205
Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Xaa Ala Leu Met Arg
210 215 220
Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp
225 230 235 240
Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly
245 250 255
Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln
260 265 270
Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Xaa Ala Ile Arg
275 280 285
Asn Tyr Thr Xaa Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys
290 295 300
Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro
305 310 315 320
Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe
325 330 335
Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe
340 345 350
Tyr Asn Ile Xaa Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro
355 360 365
Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr
370 375 380
Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile
385 390 395 400
Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu
405 410 415
Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu
420 425 430
Thr Val Lys Tyr Leu Tyr Leu Leu Phe Xaa Pro Xaa Asn Phe Ile His
435 440 445
Asn Asn Gly Ser Thr Phe Asp Xaa Val Xaa Thr Pro Xaa Gly Glu Cys
450 455 460
Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile
465 470 475 480
Asp Pro Ala Ala Leu His Cys Cys Xaa Arg Leu Lys Glu Glu Gln Trp
485 490 495
Glu Val Glu Asp Leu Xaa Xaa Glu Xaa Xaa Ser Leu Xaa Xaa Ser Arg
500 505 510
Xaa Xaa Xaa Xaa Gln Xaa Xaa Thr Val Xaa Ser Gly Pro Trp Glu Pro
515 520 525
Xaa Xaa Xaa Pro Xaa Xaa Xaa Xaa Xaa Pro Xaa Xaa Gln Xaa Arg Glu
530 535 540
Xaa Xaa Pro Ala Xaa Gln Xaa Xaa Pro Leu Leu Ser Cys Pro Ser Gln
545 550 555 560
Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp Ser
565 570 575
Ser
<210> 9
<211> 371
<212> PRT
<213> Mus musculus
<400> 9
Met Val Val Val Ala Ala Ala Pro Ser Ala Ala Thr Ala Ala Pro Lys
1 5 10 15
Val Leu Leu Leu Ser Gly Gln Pro Ala Ser Gly Gly Arg Ala Leu Pro
20 25 30
Leu Met Val Pro Gly Pro Arg Ala Ala Gly Ser Glu Ala Ser Gly Thr
35 40 45
Pro Gln Ala Arg Lys Arg Gln Arg Leu Thr His Leu Ser Pro Glu Glu
50 55 60
Lys Ala Leu Arg Arg Lys Leu Lys Asn Arg Val Ala Ala Gln Thr Ala
65 70 75 80
Arg Asp Arg Lys Lys Ala Arg Met Ser Glu Leu Glu Gln Gln Val Val
85 90 95
Asp Leu Glu Glu Glu Asn His Lys Leu Gln Leu Glu Asn Gln Leu Leu
100 105 110
Arg Glu Lys Thr His Gly Leu Val Val Glu Asn Gln Glu Leu Arg Thr
115 120 125
Arg Leu Gly Met Asp Thr Leu Asp Pro Asp Glu Val Pro Glu Val Glu
130 135 140
Ala Lys Gly Ser Gly Val Arg Leu Val Ala Gly Ser Ala Glu Ser Ala
145 150 155 160
Ala Gly Ala Gly Pro Val Val Thr Ser Pro Glu His Leu Pro Met Asp
165 170 175
Ser Asp Thr Val Ala Ser Ser Asp Ser Glu Ser Asp Ile Leu Leu Gly
180 185 190
Ile Leu Asp Lys Leu Asp Pro Val Met Phe Phe Lys Cys Pro Ser Pro
195 200 205
Glu Ser Ala Ser Leu Glu Glu Leu Pro Glu Val Tyr Pro Glu Gly Pro
210 215 220
Ser Ser Leu Pro Ala Ser Leu Ser Leu Ser Val Gly Thr Ser Ser Ala
225 230 235 240
Lys Leu Glu Ala Ile Asn Glu Leu Ile Arg Phe Asp His Val Tyr Thr
245 250 255
Lys Pro Leu Val Leu Glu Ile Pro Ser Glu Thr Glu Ser Gln Thr Asn
260 265 270
Val Val Val Lys Ile Glu Glu Ala Pro Leu Ser Ser Ser Glu Glu Asp
275 280 285
His Pro Glu Phe Ile Val Ser Val Lys Lys Glu Pro Leu Glu Asp Asp
290 295 300
Phe Ile Pro Glu Leu Gly Ile Ser Asn Leu Leu Ser Ser Ser His Cys
305 310 315 320
Leu Arg Pro Pro Ser Cys Leu Leu Asp Ala His Ser Asp Cys Gly Tyr
325 330 335
Glu Gly Ser Pro Ser Pro Phe Ser Asp Met Ser Ser Pro Leu Gly Thr
340 345 350
Asp His Ser Trp Glu Asp Thr Phe Ala Asn Glu Leu Phe Pro Gln Leu
355 360 365
Ile Ser Val
370
<210> 10
<211> 369
<212> PRT
<213> Cricetulus griseus
<400> 10
Met Val Val Val Ala Ala Ser Pro Ser Ala Ala Thr Ala Ala Pro Lys
1 5 10 15
Val Leu Leu Leu Ser Gly Gln Pro Ala Ala Asp Gly Arg Ala Leu Pro
20 25 30
Leu Met Val Pro Gly Ser Arg Ala Ala Gly Ser Glu Ala Asn Gly Ala
35 40 45
Pro Gln Ala Arg Lys Arg Gln Arg Leu Thr His Leu Ser Pro Glu Glu
50 55 60
Lys Ala Leu Arg Arg Lys Leu Lys Asn Arg Val Ala Ala Gln Thr Ala
65 70 75 80
Arg Asp Arg Lys Lys Ala Arg Met Ser Glu Leu Glu Gln Gln Val Val
85 90 95
Asp Leu Glu Glu Glu Asn Gln Lys Leu Leu Leu Glu Asn Gln Leu Leu
100 105 110
Arg Glu Lys Thr His Gly Leu Val Ile Glu Asn Gln Glu Leu Arg Thr
115 120 125
Arg Leu Gly Met Asp Val Leu Thr Thr Glu Glu Ala Pro Glu Thr Glu
130 135 140
Ser Lys Gly Asn Gly Val Arg Pro Val Ala Gly Ser Ala Glu Ser Ala
145 150 155 160
Ala Gly Ala Gly Pro Val Val Thr Ser Pro Glu His Leu Pro Met Asp
165 170 175
Ser Asp Thr Val Asp Ser Ser Asp Ser Glu Ser Asp Ile Leu Leu Gly
180 185 190
Ile Leu Asp Lys Leu Asp Pro Val Met Phe Phe Lys Cys Pro Ser Pro
195 200 205
Glu Ser Ala Asn Leu Glu Glu Leu Pro Glu Val Tyr Pro Gly Pro Ser
210 215 220
Ser Leu Pro Ala Ser Leu Ser Leu Ser Val Gly Thr Ser Ser Ala Lys
225 230 235 240
Leu Glu Ala Ile Asn Glu Leu Ile Arg Phe Asp His Val Tyr Thr Lys
245 250 255
Pro Leu Val Leu Glu Ile Pro Ser Glu Thr Glu Ser Gln Thr Asn Val
260 265 270
Val Val Lys Ile Glu Glu Ala Pro Leu Ser Ser Ser Glu Glu Asp His
275 280 285
Pro Glu Phe Ile Val Ser Val Lys Lys Glu Pro Glu Glu Asp Phe Ile
290 295 300
Pro Glu Pro Gly Ile Ser Asn Leu Leu Ser Ser Ser His Cys Leu Lys
305 310 315 320
Pro Ser Ser Cys Leu Leu Asp Ala Tyr Ser Asp Cys Gly Tyr Glu Gly
325 330 335
Ser Pro Ser Pro Phe Ser Asp Met Ser Ser Pro Leu Gly Ile Asp His
340 345 350
Ser Trp Glu Asp Thr Phe Ala Asn Glu Leu Phe Pro Gln Leu Ile Ser
355 360 365
Val
<210> 11
<211> 376
<212> PRT
<213> Homo sapiens
<400> 11
Met Val Val Val Ala Ala Ala Pro Asn Pro Ala Asp Gly Thr Pro Lys
1 5 10 15
Val Leu Leu Leu Ser Gly Gln Pro Ala Ser Ala Ala Gly Ala Pro Ala
20 25 30
Gly Gln Ala Leu Pro Leu Met Val Pro Ala Gln Arg Gly Ala Ser Pro
35 40 45
Glu Ala Ala Ser Gly Gly Leu Pro Gln Ala Arg Lys Arg Gln Arg Leu
50 55 60
Thr His Leu Ser Pro Glu Glu Lys Ala Leu Arg Arg Lys Leu Lys Asn
65 70 75 80
Arg Val Ala Ala Gln Thr Ala Arg Asp Arg Lys Lys Ala Arg Met Ser
85 90 95
Glu Leu Glu Gln Gln Val Val Asp Leu Glu Glu Glu Asn Gln Lys Leu
100 105 110
Leu Leu Glu Asn Gln Leu Leu Arg Glu Lys Thr His Gly Leu Val Val
115 120 125
Glu Asn Gln Glu Leu Arg Gln Arg Leu Gly Met Asp Ala Leu Val Ala
130 135 140
Glu Glu Glu Ala Glu Ala Lys Gly Asn Glu Val Arg Pro Val Ala Gly
145 150 155 160
Ser Ala Glu Ser Ala Ala Gly Ala Gly Pro Val Val Thr Pro Pro Glu
165 170 175
His Leu Pro Met Asp Ser Gly Gly Ile Asp Ser Ser Asp Ser Glu Ser
180 185 190
Asp Ile Leu Leu Gly Ile Leu Asp Asn Leu Asp Pro Val Met Phe Phe
195 200 205
Lys Cys Pro Ser Pro Glu Pro Ala Ser Leu Glu Glu Leu Pro Glu Val
210 215 220
Tyr Pro Glu Gly Pro Ser Ser Leu Pro Ala Ser Leu Ser Leu Ser Val
225 230 235 240
Gly Thr Ser Ser Ala Lys Leu Glu Ala Ile Asn Glu Leu Ile Arg Phe
245 250 255
Asp His Ile Tyr Thr Lys Pro Leu Val Leu Glu Ile Pro Ser Glu Thr
260 265 270
Glu Ser Gln Ala Asn Val Val Val Lys Ile Glu Glu Ala Pro Leu Ser
275 280 285
Pro Ser Glu Asn Asp His Pro Glu Phe Ile Val Ser Val Lys Glu Glu
290 295 300
Pro Val Glu Asp Asp Leu Val Pro Glu Leu Gly Ile Ser Asn Leu Leu
305 310 315 320
Ser Ser Ser His Cys Pro Lys Pro Ser Ser Cys Leu Leu Asp Ala Tyr
325 330 335
Ser Asp Cys Gly Tyr Gly Gly Ser Leu Ser Pro Phe Ser Asp Met Ser
340 345 350
Ser Leu Leu Gly Val Asn His Ser Trp Glu Asp Thr Phe Ala Asn Glu
355 360 365
Leu Phe Pro Gln Leu Ile Ser Val
370 375
<210> 12
<211> 383
<212> PRT
<213> Danio rerio
<400> 12
Met Val Val Val Thr Ala Gly Thr Gly Gly Ala His Lys Val Leu Leu
1 5 10 15
Ile Ser Gly Lys Gln Ser Ala Ser Thr Gly Ala Thr Gln Gly Gly Tyr
20 25 30
Ser Arg Ser Ile Ser Val Met Ile Pro Asn Gln Ala Ser Ser Asp Ser
35 40 45
Asp Ser Thr Thr Ser Gly Pro Pro Leu Arg Lys Arg Gln Arg Leu Thr
50 55 60
His Leu Ser Pro Glu Glu Lys Ala Leu Arg Arg Lys Leu Lys Asn Arg
65 70 75 80
Val Ala Ala Gln Thr Ala Arg Asp Arg Lys Lys Ala Lys Met Gly Glu
85 90 95
Leu Glu Gln Gln Val Leu Glu Leu Glu Leu Glu Asn Gln Lys Leu His
100 105 110
Val Glu Asn Arg Leu Leu Arg Asp Lys Thr Ser Asp Leu Leu Ser Glu
115 120 125
Asn Glu Glu Leu Arg Gln Arg Leu Gly Leu Asp Thr Leu Glu Thr Lys
130 135 140
Glu Gln Val Gln Val Leu Glu Ser Ala Val Ser Asp Leu Gly Leu Val
145 150 155 160
Thr Gly Ser Ser Glu Ser Ala Ala Gly Ala Gly Pro Ala Val Pro Lys
165 170 175
Ser Glu Asp Phe Thr Met Asp Thr His Ser Pro Gly Pro Ala Asp Ser
180 185 190
Glu Ser Asp Leu Leu Leu Gly Ile Leu Asp Ile Leu Asp Pro Glu Leu
195 200 205
Phe Leu Lys Thr Asp Leu Pro Glu Ala Gln Glu Pro Gln Gln Glu Leu
210 215 220
Val Leu Val Gly Gly Ala Gly Glu Gln Val Pro Ser Ser Ala Pro Ala
225 230 235 240
Ala Leu Gly Pro Ala Pro Val Lys Leu Glu Ala Leu Asn Glu Leu Ile
245 250 255
His Phe Asp His Ile Tyr Thr Lys Pro Ala Glu Val Leu Val Ser Glu
260 265 270
Glu Ser Ile Cys Glu Val Lys Ala Glu Asp Ser Val Ala Phe Ser Glu
275 280 285
Thr Glu Glu Glu Ile Gln Val Glu Asp Gln Thr Val Ser Val Lys Asp
290 295 300
Glu Pro Glu Glu Val Val Ile Pro Ala Glu Asn Gln Asn Pro Asp Ala
305 310 315 320
Ala Asp Asp Phe Leu Ser Asp Thr Ser Phe Gly Gly Tyr Glu Lys Ala
325 330 335
Ser Tyr Leu Thr Asp Ala Tyr Ser Asp Ser Gly Tyr Glu Arg Ser Pro
340 345 350
Ser Pro Phe Ser Asn Ile Ser Ser Pro Leu Cys Ser Glu Gly Ser Trp
355 360 365
Asp Asp Met Phe Ala Ser Glu Leu Phe Pro Gln Leu Ile Ser Val
370 375 380
<210> 13
<211> 371
<212> PRT
<213> Artificial
<220>
<223> consensus sequence
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> A or S
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> S or N
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> A or P
<220>
<221> MISC_FEATURE
<222> (12)..(12)
<223> T or D
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> A or G
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> A or T
<220>
<221> MISC_FEATURE
<222> (26)..(26)
<223> S or A
<220>
<221> misc_feature
<222> (27)..(27)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (29)..(29)
<223> R or Q
<220>
<221> MISC_FEATURE
<222> (37)..(37)
<223> G or A
<220>
<221> misc_feature
<222> (38)..(38)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (40)..(40)
<223> A or G
<220>
<221> MISC_FEATURE
<222> (46)..(46)
<223> S or N, or ASG
<220>
<221> MISC_FEATURE
<222> (48)..(48)
<223> T, A, or L
<220>
<221> MISC_FEATURE
<222> (103)..(103)
<223> H or Q
<220>
<221> MISC_FEATURE
<222> (106)..(106)
<223> Q or L
<220>
<221> MISC_FEATURE
<222> (121)..(121)
<223> V or I
<220>
<221> MISC_FEATURE
<222> (128)..(128)
<223> T or Q
<220>
<221> MISC_FEATURE
<222> (134)..(134)
<223> T, V, or A
<220>
<221> MISC_FEATURE
<222> (136)..(136)
<223> D, T, or V
<220>
<221> MISC_FEATURE
<222> (137)..(137)
<223> P, T, or A
<220>
<221> MISC_FEATURE
<222> (138)..(138)
<223> D or E
<220>
<221> MISC_FEATURE
<222> (140)..(140)
<223> V, A, or none
<220>
<221> MISC_FEATURE
<222> (141)..(141)
<223> P or none
<220>
<221> MISC_FEATURE
<222> (143)..(143)
<223> V, T, or A
<220>
<221> MISC_FEATURE
<222> (145)..(145)
<223> A or S
<220>
<221> MISC_FEATURE
<222> (148)..(148)
<223> S or N
<220>
<221> MISC_FEATURE
<222> (149)..(149)
<223> G or E
<220>
<221> MISC_FEATURE
<222> (152)..(152)
<223> L or P
<220>
<221> MISC_FEATURE
<222> (169)..(169)
<223> S or P
<220>
<221> MISC_FEATURE
<222> (178)..(178)
<223> D or G
<220>
<221> MISC_FEATURE
<222> (179)..(179)
<223> T or G
<220>
<221> MISC_FEATURE
<222> (180)..(180)
<223> V or I
<220>
<221> MISC_FEATURE
<222> (181)..(181)
<223> A or D
<220>
<221> MISC_FEATURE
<222> (196)..(196)
<223> K or N
<220>
<221> MISC_FEATURE
<222> (210)..(210)
<223> S or P
<220>
<221> MISC_FEATURE
<222> (212)..(212)
<223> S or N
<220>
<221> MISC_FEATURE
<222> (222)..(222)
<223> E or none
<220>
<221> MISC_FEATURE
<222> (254)..(254)
<223> V or I
<220>
<221> MISC_FEATURE
<222> (271)..(271)
<223> T or A
<220>
<221> MISC_FEATURE
<222> (284)..(284)
<223> S or P
<220>
<221> MISC_FEATURE
<222> (287)..(287)
<223> E or N
<220>
<221> MISC_FEATURE
<222> (298)..(298)
<223> K or E
<220>
<221> MISC_FEATURE
<222> (301)..(301)
<223> L, V, or none
<220>
<221> MISC_FEATURE
<222> (303)..(303)
<223> D or E
<220>
<221> MISC_FEATURE
<222> (305)..(305)
<223> F or L
<220>
<221> MISC_FEATURE
<222> (306)..(306)
<223> I or V
<220>
<221> MISC_FEATURE
<222> (309)..(309)
<223> L or P
<220>
<221> MISC_FEATURE
<222> (321)..(321)
<223> L or P
<220>
<221> MISC_FEATURE
<222> (322)..(322)
<223> R or K
<220>
<221> MISC_FEATURE
<222> (324)..(324)
<223> P or S
<220>
<221> MISC_FEATURE
<222> (331)..(331)
<223> H or Y
<220>
<221> MISC_FEATURE
<222> (337)..(337)
<223> E or G
<220>
<221> MISC_FEATURE
<222> (340)..(340)
<223> P or L
<220>
<221> MISC_FEATURE
<222> (349)..(349)
<223> P or L
<220>
<221> MISC_FEATURE
<222> (352)..(352)
<223> T, I, or V
<220>
<221> MISC_FEATURE
<222> (353)..(353)
<223> D or N
<400> 13
Met Val Val Val Ala Ala Xaa Pro Xaa Xaa Ala Xaa Xaa Xaa Pro Lys
1 5 10 15
Val Leu Leu Leu Ser Gly Gln Pro Ala Xaa Xaa Gly Arg Ala Leu Pro
20 25 30
Leu Met Val Pro Xaa Xaa Arg Xaa Ala Gly Ser Glu Ala Xaa Gly Xaa
35 40 45
Pro Gln Ala Arg Lys Arg Gln Arg Leu Thr His Leu Ser Pro Glu Glu
50 55 60
Lys Ala Leu Arg Arg Lys Leu Lys Asn Arg Val Ala Ala Gln Thr Ala
65 70 75 80
Arg Asp Arg Lys Lys Ala Arg Met Ser Glu Leu Glu Gln Gln Val Val
85 90 95
Asp Leu Glu Glu Glu Asn Xaa Lys Leu Xaa Leu Glu Asn Gln Leu Leu
100 105 110
Arg Glu Lys Thr His Gly Leu Val Xaa Glu Asn Gln Glu Leu Arg Xaa
115 120 125
Arg Leu Gly Met Asp Xaa Leu Asp Xaa Xaa Glu Xaa Xaa Glu Xaa Glu
130 135 140
Xaa Lys Gly Xaa Xaa Val Arg Xaa Val Ala Gly Ser Ala Glu Ser Ala
145 150 155 160
Ala Gly Ala Gly Pro Val Val Thr Xaa Pro Glu His Leu Pro Met Asp
165 170 175
Ser Xaa Xaa Xaa Xaa Ser Ser Asp Ser Glu Ser Asp Ile Leu Leu Gly
180 185 190
Ile Leu Asp Xaa Leu Asp Pro Val Met Phe Phe Lys Cys Pro Ser Pro
195 200 205
Glu Xaa Ala Xaa Leu Glu Glu Leu Pro Glu Val Tyr Pro Xaa Gly Pro
210 215 220
Ser Ser Leu Pro Ala Ser Leu Ser Leu Ser Val Gly Thr Ser Ser Ala
225 230 235 240
Lys Leu Glu Ala Ile Asn Glu Leu Ile Arg Phe Asp His Xaa Tyr Thr
245 250 255
Lys Pro Leu Val Leu Glu Ile Pro Ser Glu Thr Glu Ser Gln Xaa Asn
260 265 270
Val Val Val Lys Ile Glu Glu Ala Pro Leu Ser Xaa Ser Glu Xaa Asp
275 280 285
His Pro Glu Phe Ile Val Ser Val Lys Xaa Glu Pro Xaa Glu Xaa Asp
290 295 300
Xaa Xaa Pro Glu Xaa Gly Ile Ser Asn Leu Leu Ser Ser Ser His Cys
305 310 315 320
Xaa Xaa Pro Xaa Ser Cys Leu Leu Asp Ala Xaa Ser Asp Cys Gly Tyr
325 330 335
Xaa Gly Ser Xaa Ser Pro Phe Ser Asp Met Ser Ser Xaa Leu Gly Xaa
340 345 350
Xaa His Ser Trp Glu Asp Thr Phe Ala Asn Glu Leu Phe Pro Gln Leu
355 360 365
Ile Ser Val
370
<210> 14
<211> 7686
<212> DNA
<213> Artificial
<220>
<223> Synthetic plasmid
<400> 14
aagcttatac tcgagctcta gattgggaac ccgggtctct cgaattcgat gccttttaga 60
ctcctgatac cattgggtct tgtttgcgtt ctcctccctc tccatcacgg cgccccaggt 120
ccagacggta ccgcacctga tcctgcccat taccgcgaac gcgttaaagc catgttctac 180
cacgcctatg actcctatct ggaaaatgca ttcccctatg atgagctccg accccttacc 240
tgcgatggtc atgatacttg gggctctttt tcccttaccc ttattgacgc tctggacaca 300
ctccttatcc tcggaaacac cagcgaattt caaagagtag ttgaagtact tcaggacaat 360
gtcgactttg acatcgatgt gaacgcatca gttttcgaaa caaatataag agtcgttgga 420
ggtctgctct ccgcccacct tctctctaaa aaagccggag tagaagttga agctggctgg 480
ccctgctccg gacccctcct tcgtatggct gaagaagctg cccgcaaact ccttcccgct 540
tttcagaccc caaccggtat gccctatggt actgttaacc tcctgcacgg agtaaatccc 600
ggcgaaaccc ccgtcacatg tacagccgga attggaacct ttattgtgga atttgcaacc 660
cttagcagcc tgaccggaga tcctgtattc gaagacgtgg ctcgggttgc cctgatgcga 720
ctgtgggaat ccaggtctga tatcggtctg gtcggtaacc atatagacgt actcactggt 780
aaatgggttg cacaagacgc tggaattggg gcaggcgtgg attcttattt tgaatatctc 840
gtaaaagggg ccatactctt gcaggacaaa aaacttatgg ctatgttcct ggaatataac 900
aaagctatta ggaactacac acacttcgat gattggtatt tgtgggtcca aatgtataaa 960
ggaaccgttt ctatgcctgt ctttcagtca ctggaggctt attggcctgg tctgcaatcc 1020
ctgatcggag acattgacaa tgcaatgagg acattcctta attattacac tgtttggaag 1080
cagttcggcg gattgcccga attttacaac attcctcaag gctatacagt tgaaaaaaga 1140
gaaggatatc ccctgcgccc cgagcttatt gaaagcgcta tgtatctgta tcgtgcaaca 1200
ggtgatccaa ccctgcttga actgggacga gacgccgtcg aatcaatcga gaaaatttca 1260
aaagtggaat gcggctttgc aacaattaaa gatcttagag accacaaact ggataatcgc 1320
atggagtcat tctttttggc tgagaccgtc aagtatctgt atctgctttt tcatcccaac 1380
aacttcatcc ataataacgg gtccaccttc gattcagtca tgacccctca cggtgaatgc 1440
atactcggag ctggaggcta tatttttaac actgaagctc acccaattga cccagctgcc 1500
cttcattgtt gtcgacgtct gaaagaagaa caatgggagg ttgaagattt gatcaaagaa 1560
ttttactcac ttaaacaaag tcgacctaaa cgcgcacaga gaaaaactgt aagatctggt 1620
ccttgggaac ctcagtccgg cccagcaact ctttcatccc ccgccaacca accacgagaa 1680
aaacaaccag cccaacagag aacccccctg ctcagctgcc cctctcagcc cttcacttca 1740
aaactcgccc tgcttggaca ggtgtttctg gactcctctt gatttaaaca cgcggccgct 1800
aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc cacacctccc 1860
cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta ttgcagctta 1920
taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat ttttttcact 1980
gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct accggtaggg 2040
cccctctctt catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 2100
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 2160
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 2220
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 2280
cttcgggaag cgtggcgctt tctcaatgct cacgctgtag gtatctcagt tcggtgtagg 2340
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 2400
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 2460
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 2520
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 2580
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 2640
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 2700
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 2760
ggattttggt catgggcgcg cctcatactc ctgcaggcat gagattatca aaaaggatct 2820
tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 2880
aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 2940
tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 3000
gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 3060
atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 3120
tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 3180
ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 3240
ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 3300
tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 3360
ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 3420
ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 3480
tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 3540
gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 3600
taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 3660
cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 3720
agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 3780
gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 3840
ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtcaggtacc 3900
aagcctaggc ctccaaaaaa gcctcctcac tacttctgga atagctcaga ggcagaggcg 3960
gcctcggcct ctgcataaat aaaaaaaatt agtcagccat ggggcggaga atgggcggaa 4020
ctgggcggag ttaggggcgg gatgggcgga gttaggggcg ggactatggt tgctgactaa 4080
ttgagatgca tgctttgcat acttctgcct gctggggagc ctggggactt tccacacctg 4140
gttgctgact aattgagatg catgctttgc atacttctgc ctgctgggga gcctggggac 4200
tttccacacc ggatccacca tgggatcggc cattgaacaa gatggattgc acgcaggttc 4260
tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg 4320
ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac 4380
cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc 4440
cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg 4500
gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga 4560
gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg 4620
cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg 4680
tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt 4740
cgccaggctc aaggcgcgca tgcccgacgg cgatgatctc gtcgtgaccc atggcgatgc 4800
ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg 4860
gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga 4920
gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc 4980
gcagcgcatc gccttctatc gccttcttga cgagttcttc tgaacgcgtg ctgtaagtct 5040
gcagaaattg atgatctatt aaacaataaa gatgtccact aaaatggaag tttttcctgt 5100
catactttgt taagaagggt gagaacagag tacctacatt ttgaatggaa ggattggagc 5160
tacgggggtg ggggtggggt gggattagat aaatgcctgc tctttactga aggctcttta 5220
ctattgcttt atgataatgt ttcatagttg gatatcataa tttaaacaag caaaaccaaa 5280
ttaagggcca gctcattcct cccactcatg atctatggat ctatagatct ctcgtgcagc 5340
tggggctcta gggggtatcc ccacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg 5400
gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct 5460
ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg 5520
ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag 5580
ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg 5640
gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc 5700
tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat 5760
gagctgattt aacaaaaatt taacgcgaat taattctgtg gaatgtgtgt cagttagtcg 5820
cgaggcctcc gcgccgggtt ttggcgcctc ccgcgggcgc ccccctcctc acggcgagcg 5880
ctgccacgtc agacgaaggg cgcagcgagc gtcctgatcc ttccgcccgg acgctcagga 5940
cagcggcccg ctgctcataa gactcggcct tagaacccca gtatcagcag aaggacattt 6000
taggacggga cttgggtgac tctagggcac tggttttctt tccagagagc ggaacaggcg 6060
aggaaaagta gtcccttctc ggcgattctg cggagggatc tccgtggggc ggtgaacgcc 6120
gatgattata taaggacgcg ccgggtgtgg cacagctagt tccgtcgcag ccgggatttg 6180
ggtcgcggtt cttgtttgtg gatcgctgtg atcgtcactt ggtgagtagc gggctgctgg 6240
gctggccggg gctttcgtgg ccgccgggcc gctcggtggg acggaagcgt gtggagagac 6300
cgccaagggc tgtagtctgg gtccgcgagc aaggttgccc tgaactgggg gttgggggga 6360
gcgcagcaaa atggcggctg ttcccgagtc ttgaatggaa gacgcttgtg aggcgggctg 6420
tgaggtcgtt gaaacaaggt ggggggcatg gtgggcggca agaacccaag gtcttgaggc 6480
cttcgctaat gcgggaaagc tcttattcgg gtgagatggg ctggggcacc atctggggac 6540
cctgacgtga agtttgtcac tgactggaga actcggtttg tcgtctgttg cgggggcggc 6600
agttatggcg gtgccgttgg gcagtgcacc cgtacctttg ggagcgcgcg ccctcgtcgt 6660
gtcgtgacgt cacccgttct gttggcttat aatgcagggt ggggccacct gccggtaggt 6720
gtgcggtagg cttttctccg tcgcaggacg cagggttcgg gcctagggta ggctctcctg 6780
aatcgacagg cgccggacct ctggtgaggg gagggataag tgaggcgtca gtttctttgg 6840
tcggttttat gtacctatct tcttaagtag ctgaagctcc ggttttgaac tatgcgctcg 6900
gggttggcga gtgtgttttg tgaagttttt taggcacctt ttgaaatgta atcatttggg 6960
tcaatatgta attttcagtg ttagactagt aaattgtccg ctaaattctg gccgtttttg 7020
gcttttttgt tagacgtcga ccgatcctga gaacttcagg gtgagtttgg ggacccttga 7080
ttgttctttc tttttcgcta ttgtaaaatt catgttatat ggagggggca aagttttcag 7140
ggtgttgttt agaatgggaa gatgtccctt gtatcaccat ggaccctcat gataattttg 7200
tttctttcac tttctactct gttgacaacc attgtctcct cttattttct tttcattttc 7260
tgtaactttt tcgttaaact ttagcttgca tttgtaacga atttttaaat tcacttttgt 7320
ttatttgtca gattgtaagt actttctcta atcacttttt tttcaaggca atcagggtat 7380
attatattgt acttcagcac agttttagag aacaattgtt ataattaaat gataaggtag 7440
aatatttctg catataaatt ctggctggcg tggaaatatt cttattggta gaaacaacta 7500
caccctggtc atcatcctgc ctttctcttt atggttacaa tgatatacac tgtttgagat 7560
gaggataaaa tactctgagt ccaaaccggg cccctctgct aaccatgttc atgccttctt 7620
ctctttccta cagctcctgg gcaacgtgct ggttgttgtg ctgtctcatc attttggcaa 7680
agaatt 7686
<210> 15
<211> 7257
<212> DNA
<213> Artificial
<220>
<223> Synthetic plasmid
<400> 15
aagcttatac tcgagctcta gattgggaac ccgggtctct cgaattcgat gccttttaga 60
ctcctgatac cattgggtct tgtttgcgtt ctcctccctc tccatcacgg cgccccaggt 120
ccagacggta ccgcacctga tcctgcccat taccgcgaac gcgttaaagc catgttctac 180
cacgcctatg actcctatct ggaaaatgca ttcccctatg atgagctccg accccttacc 240
tgcgatggtc atgatacttg gggctctttt tcccttaccc ttattgacgc tctggacaca 300
ctccttatcc tcggaaacac cagcgaattt caaagagtag ttgaagtact tcaggacaat 360
gtcgactttg acatcgatgt gaacgcatca gttttcgaaa caaatataag agtcgttgga 420
ggtctgctct ccgcccacct tctctctaaa aaagccggag tagaagttga agctggctgg 480
ccctgctccg gacccctcct tcgtatggct gaagaagctg cccgcaaact ccttcccgct 540
tttcagaccc caaccggtat gccctatggt actgttaacc tcctgcacgg agtaaatccc 600
ggcgaaaccc ccgtcacatg tacagccgga attggaacct ttattgtgga atttgcaacc 660
cttagcagcc tgaccggaga tcctgtattc gaagacgtgg ctcgggttgc cctgatgcga 720
ctgtgggaat ccaggtctga tatcggtctg gtcggtaacc atatagacgt actcactggt 780
aaatgggttg cacaagacgc tggaattggg gcaggcgtgg attcttattt tgaatatctc 840
gtaaaagggg ccatactctt gcaggacaaa aaacttatgg ctatgttcct ggaatataac 900
aaagctatta ggaactacac acacttcgat gattggtatt tgtgggtcca aatgtataaa 960
ggaaccgttt ctatgcctgt ctttcagtca ctggaggctt attggcctgg tctgcaatcc 1020
ctgatcggag acattgacaa tgcaatgagg acattcctta attattacac tgtttggaag 1080
cagttcggcg gattgcccga attttacaac attcctcaag gctatacagt tgaaaaaaga 1140
gaaggatatc ccctgcgccc cgagcttatt gaaagcgcta tgtatctgta tcgtgcaaca 1200
ggtgatccaa ccctgcttga actgggacga gacgccgtcg aatcaatcga gaaaatttca 1260
aaagtggaat gcggctttgc aacaattaaa gatcttagag accacaaact ggataatcgc 1320
atggagtcat tctttttggc tgagaccgtc aagtatctgt atctgctttt tcatcccaac 1380
aacttcatcc ataataacgg gtccaccttc gattcagtca tgacccctca cggtgaatgc 1440
atactcggag ctggaggcta tatttttaac actgaagctc acccaattga cccagctgcc 1500
cttcattgtt gtcgacgtct gaaagaagaa caatgggagg ttgaagattt gatcaaagaa 1560
ttttactcac ttaaacaaag tcgacctaaa cgcgcacaga gaaaaactgt aagatctggt 1620
ccttgggaac ctcagtccgg cccagcaact ctttcatccc ccgccaacca accacgagaa 1680
aaacaaccag cccaacagag aacccccctg ctcagctgcc cctctcagcc cttcacttca 1740
aaactcgccc tgcttggaca ggtgtttctg gactcctctt gatttaaaca cgcggccgct 1800
aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc cacacctccc 1860
cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta ttgcagctta 1920
taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat ttttttcact 1980
gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct accggtaggg 2040
cccctctctt catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 2100
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 2160
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 2220
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 2280
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 2340
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 2400
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 2460
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 2520
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 2580
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 2640
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 2700
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 2760
ggattttggt catgggcgcg cctcatactc ctgcaggcat gagattatca aaaaggatct 2820
tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 2880
aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 2940
tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 3000
gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 3060
atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 3120
tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 3180
ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 3240
ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 3300
tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 3360
ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 3420
ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 3480
tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 3540
gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 3600
taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 3660
cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 3720
agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 3780
gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 3840
ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtcaggtacc 3900
aagcctaggc ctccaaaaaa gcctcctcac tacttctgga atagctcaga ggcagaggcg 3960
gcctcggcct ctgcataaat aaaaaaaatt agtcagccat ggggcggaga atgggcggaa 4020
ctgggcggag ttaggggcgg gatgggcgga gttaggggcg ggactatggt tgctgactaa 4080
ttgagatgca tgctttgcat acttctgcct gctggggagc ctggggactt tccacacctg 4140
gttgctgact aattgagatg catgctttgc atacttctgc ctgctgggga gcctggggac 4200
tttccacacc ggatccacca tggccaagtt gaccagtgcc gttccggtgc tcaccgcgcg 4260
cgacgtcgcc ggagcggtcg agttctggac cgaccggctc gggttctccc gggacttcgt 4320
ggaggacgac ttcgccggtg tggtccggga cgacgtgacc ctgttcatca gcgcggtcca 4380
ggaccaggtg gtgccggaca acaccctggc ctgggtgtgg gtgcgcggcc tggacgagct 4440
gtacgccgag tggtcggagg tcgtgtccac gaacttccgg gacgcctccg ggccggccat 4500
gaccgagatc ggcgagcagc cgtgggggcg ggagttcgcc ctgcgcgacc cggccggcaa 4560
ctgcgtgcac ttcgtggccg aggagcagga ctgaacgcgt gctgtaagtc tgcagaaatt 4620
gatgatctat taaacaataa agatgtccac taaaatggaa gtttttcctg tcatactttg 4680
ttaagaaggg tgagaacaga gtacctacat tttgaatgga aggattggag ctacgggggt 4740
gggggtgggg tgggattaga taaatgcctg ctctttactg aaggctcttt actattgctt 4800
tatgataatg tttcatagtt ggatatcata atttaaacaa gcaaaaccaa attaagggcc 4860
agctcattcc tcccactcat gatctatgga tctatagatc tctcgtgcag ctggggctct 4920
agggggtatc cccacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 4980
cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 5040
tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 5100
gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 5160
tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 5220
ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 5280
tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 5340
taacaaaaat ttaacgcgaa ttaattctgt ggaatgtgtg tcagttagtc gcgaggcctc 5400
cgcgccgggt tttggcgcct cccgcgggcg cccccctcct cacggcgagc gctgccacgt 5460
cagacgaagg gcgcagcgag cgtcctgatc cttccgcccg gacgctcagg acagcggccc 5520
gctgctcata agactcggcc ttagaacccc agtatcagca gaaggacatt ttaggacggg 5580
acttgggtga ctctagggca ctggttttct ttccagagag cggaacaggc gaggaaaagt 5640
agtcccttct cggcgattct gcggagggat ctccgtgggg cggtgaacgc cgatgattat 5700
ataaggacgc gccgggtgtg gcacagctag ttccgtcgca gccgggattt gggtcgcggt 5760
tcttgtttgt ggatcgctgt gatcgtcact tggtgagtag cgggctgctg ggctggccgg 5820
ggctttcgtg gccgccgggc cgctcggtgg gacggaagcg tgtggagaga ccgccaaggg 5880
ctgtagtctg ggtccgcgag caaggttgcc ctgaactggg ggttgggggg agcgcagcaa 5940
aatggcggct gttcccgagt cttgaatgga agacgcttgt gaggcgggct gtgaggtcgt 6000
tgaaacaagg tggggggcat ggtgggcggc aagaacccaa ggtcttgagg ccttcgctaa 6060
tgcgggaaag ctcttattcg ggtgagatgg gctggggcac catctgggga ccctgacgtg 6120
aagtttgtca ctgactggag aactcggttt gtcgtctgtt gcgggggcgg cagttatggc 6180
ggtgccgttg ggcagtgcac ccgtaccttt gggagcgcgc gccctcgtcg tgtcgtgacg 6240
tcacccgttc tgttggctta taatgcaggg tggggccacc tgccggtagg tgtgcggtag 6300
gcttttctcc gtcgcaggac gcagggttcg ggcctagggt aggctctcct gaatcgacag 6360
gcgccggacc tctggtgagg ggagggataa gtgaggcgtc agtttctttg gtcggtttta 6420
tgtacctatc ttcttaagta gctgaagctc cggttttgaa ctatgcgctc ggggttggcg 6480
agtgtgtttt gtgaagtttt ttaggcacct tttgaaatgt aatcatttgg gtcaatatgt 6540
aattttcagt gttagactag taaattgtcc gctaaattct ggccgttttt ggcttttttg 6600
ttagacgtcg accgatcctg agaacttcag ggtgagtttg gggacccttg attgttcttt 6660
ctttttcgct attgtaaaat tcatgttata tggagggggc aaagttttca gggtgttgtt 6720
tagaatggga agatgtccct tgtatcacca tggaccctca tgataatttt gtttctttca 6780
ctttctactc tgttgacaac cattgtctcc tcttattttc ttttcatttt ctgtaacttt 6840
ttcgttaaac tttagcttgc atttgtaacg aatttttaaa ttcacttttg tttatttgtc 6900
agattgtaag tactttctct aatcactttt ttttcaaggc aatcagggta tattatattg 6960
tacttcagca cagttttaga gaacaattgt tataattaaa tgataaggta gaatatttct 7020
gcatataaat tctggctggc gtggaaatat tcttattggt agaaacaact acaccctggt 7080
catcatcctg cctttctctt tatggttaca atgatataca ctgtttgaga tgaggataaa 7140
atactctgag tccaaaccgg gcccctctgc taaccatgtt catgccttct tctctttcct 7200
acagctcctg ggcaacgtgc tggttgttgt gctgtctcat cattttggca aagaatt 7257
<210> 16
<211> 3892
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 16
aggcctccgc gccgggtttt ggcgcctccc gcgggcgccc ccctcctcac ggcgagcgct 60
gccacgtcag acgaagggcg cagcgagcgt cctgatcctt ccgcccggac gctcaggaca 120
gcggcccgct gctcataaga ctcggcctta gaaccccagt atcagcagaa ggacatttta 180
ggacgggact tgggtgactc tagggcactg gttttctttc cagagagcgg aacaggcgag 240
gaaaagtagt cccttctcgg cgattctgcg gagggatctc cgtggggcgg tgaacgccga 300
tgattatata aggacgcgcc gggtgtggca cagctagttc cgtcgcagcc gggatttggg 360
tcgcggttct tgtttgtgga tcgctgtgat cgtcacttgg tgagtagcgg gctgctgggc 420
tggccggggc tttcgtggcc gccgggccgc tcggtgggac ggaagcgtgt ggagagaccg 480
ccaagggctg tagtctgggt ccgcgagcaa ggttgccctg aactgggggt tggggggagc 540
gcagcaaaat ggcggctgtt cccgagtctt gaatggaaga cgcttgtgag gcgggctgtg 600
aggtcgttga aacaaggtgg ggggcatggt gggcggcaag aacccaaggt cttgaggcct 660
tcgctaatgc gggaaagctc ttattcgggt gagatgggct ggggcaccat ctggggaccc 720
tgacgtgaag tttgtcactg actggagaac tcggtttgtc gtctgttgcg ggggcggcag 780
ttatggcggt gccgttgggc agtgcacccg tacctttggg agcgcgcgcc ctcgtcgtgt 840
cgtgacgtca cccgttctgt tggcttataa tgcagggtgg ggccacctgc cggtaggtgt 900
gcggtaggct tttctccgtc gcaggacgca gggttcgggc ctagggtagg ctctcctgaa 960
tcgacaggcg ccggacctct ggtgagggga gggataagtg aggcgtcagt ttctttggtc 1020
ggttttatgt acctatcttc ttaagtagct gaagctccgg ttttgaacta tgcgctcggg 1080
gttggcgagt gtgttttgtg aagtttttta ggcacctttt gaaatgtaat catttgggtc 1140
aatatgtaat tttcagtgtt agactagtaa attgtccgct aaattctggc cgtttttggc 1200
ttttttgtta gacgtcgacc gatcctgaga acttcagggt gagtttgggg acccttgatt 1260
gttctttctt tttcgctatt gtaaaattca tgttatatgg agggggcaaa gttttcaggg 1320
tgttgtttag aatgggaaga tgtcccttgt atcaccatgg accctcatga taattttgtt 1380
tctttcactt tctactctgt tgacaaccat tgtctcctct tattttcttt tcattttctg 1440
taactttttc gttaaacttt agcttgcatt tgtaacgaat ttttaaattc acttttgttt 1500
atttgtcaga ttgtaagtac tttctctaat cacttttttt tcaaggcaat cagggtatat 1560
tatattgtac ttcagcacag ttttagagaa caattgttat aattaaatga taaggtagaa 1620
tatttctgca tataaattct ggctggcgtg gaaatattct tattggtaga aacaactaca 1680
ccctggtcat catcctgcct ttctctttat ggttacaatg atatacactg tttgagatga 1740
ggataaaata ctctgagtcc aaaccgggcc cctctgctaa ccatgttcat gccttcttct 1800
ctttcctaca gctcctgggc aacgtgctgg ttgttgtgct gtctcatcat tttggcaaag 1860
aattaagctt atactcgagc tctagattgg gaacccgggt ctctcgaatt cgatgccttt 1920
tagactcctg ataccattgg gtcttgtttg cgttctcctc cctctccatc acggcgcccc 1980
aggtccagac ggtaccgcac ctgatcctgc ccattaccgc gaacgcgtta aagccatgtt 2040
ctaccacgcc tatgactcct atctggaaaa tgcattcccc tatgatgagc tccgacccct 2100
tacctgcgat ggtcatgata cttggggctc tttttccctt acccttattg acgctctgga 2160
cacactcctt atcctcggaa acaccagcga atttcaaaga gtagttgaag tacttcagga 2220
caatgtcgac tttgacatcg atgtgaacgc atcagttttc gaaacaaata taagagtcgt 2280
tggaggtctg ctctccgccc accttctctc taaaaaagcc ggagtagaag ttgaagctgg 2340
ctggccctgc tccggacccc tccttcgtat ggctgaagaa gctgcccgca aactccttcc 2400
cgcttttcag accccaaccg gtatgcccta tggtactgtt aacctcctgc acggagtaaa 2460
tcccggcgaa acccccgtca catgtacagc cggaattgga acctttattg tggaatttgc 2520
aacccttagc agcctgaccg gagatcctgt attcgaagac gtggctcggg ttgccctgat 2580
gcgactgtgg gaatccaggt ctgatatcgg tctggtcggt aaccatatag acgtactcac 2640
tggtaaatgg gttgcacaag acgctggaat tggggcaggc gtggattctt attttgaata 2700
tctcgtaaaa ggggccatac tcttgcagga caaaaaactt atggctatgt tcctggaata 2760
taacaaagct attaggaact acacacactt cgatgattgg tatttgtggg tccaaatgta 2820
taaaggaacc gtttctatgc ctgtctttca gtcactggag gcttattggc ctggtctgca 2880
atccctgatc ggagacattg acaatgcaat gaggacattc cttaattatt acactgtttg 2940
gaagcagttc ggcggattgc ccgaatttta caacattcct caaggctata cagttgaaaa 3000
aagagaagga tatcccctgc gccccgagct tattgaaagc gctatgtatc tgtatcgtgc 3060
aacaggtgat ccaaccctgc ttgaactggg acgagacgcc gtcgaatcaa tcgagaaaat 3120
ttcaaaagtg gaatgcggct ttgcaacaat taaagatctt agagaccaca aactggataa 3180
tcgcatggag tcattctttt tggctgagac cgtcaagtat ctgtatctgc tttttcatcc 3240
caacaacttc atccataata acgggtccac cttcgattca gtcatgaccc ctcacggtga 3300
atgcatactc ggagctggag gctatatttt taacactgaa gctcacccaa ttgacccagc 3360
tgcccttcat tgttgtcgac gtctgaaaga agaacaatgg gaggttgaag atttgatcaa 3420
agaattttac tcacttaaac aaagtcgacc taaacgcgca cagagaaaaa ctgtaagatc 3480
tggtccttgg gaacctcagt ccggcccagc aactctttca tcccccgcca accaaccacg 3540
agaaaaacaa ccagcccaac agagaacccc cctgctcagc tgcccctctc agcccttcac 3600
ttcaaaactc gccctgcttg gacaggtgtt tctggactcc tcttgattta aacacgcggc 3660
cgctaatcag ccataccaca tttgtagagg ttttacttgc tttaaaaaac ctcccacacc 3720
tccccctgaa cctgaaacat aaaatgaatg caattgttgt tgttaacttg tttattgcag 3780
cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 3840
cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gt 3892
<210> 17
<211> 6629
<212> DNA
<213> Artificial
<220>
<223> Synthetic plasmid
<400> 17
aagcttatac tcgagctcta gattgggaac ccgggtctct cgaattcatg gtggtggtgg 60
ctgctgctcc ttctgctgct acagctgctc ctaaggtgct gctgctgtct ggacagcctg 120
cttctggagg aagagctctg cctctgatgg tgcctggacc tagagctgct ggatctgagg 180
cttctggaac acctcaggct agaaagagac agagactgac acatctgtct cctgaagaaa 240
aggctctgag aagaaagctg aagaatagag tggctgctca gacagctaga gatagaaaga 300
aggctagaat gtctgaactg gaacagcagg tggtggatct ggaagaagaa aatcataagc 360
tgcagctgga aaatcagctg ctgagagaaa agacacatgg actggtggtg gaaaatcagg 420
aactgagaac aagactggga atggatacac tggatcctga tgaagtgcct gaagtggaag 480
ctaagggatc tggagtgaga ctggtggctg gatctgctga atctgctgct ggagctggac 540
ctgtggtgac atctcctgaa catctgccta tggattctga tacagtggct tcttctgatt 600
ctgaatctga tatcctgctg ggaatcctgg ataagctgga tcctgtgatg ttttttaagt 660
gtccttctcc tgaatctgct tctctggaag aactgcctga agtgtatcct gaaggacctt 720
cttctctgcc tgcttctctg tctctgtctg tgggaacatc ttctgctaag ctggaagcta 780
tcaatgaact gatcagattt gatcatgtgt atacaaagcc tctggtgctg gaaatccctt 840
ctgaaacaga atctcagaca aatgtggtgg tgaagatcga agaagctcct ctgtcttctt 900
ctgaagaaga tcatcctgaa tttatcgtgt ctgtgaagaa ggaacctctg gaagatgatt 960
ttatccctga actgggaatc tctaatctgc tgtcttcttc tcattgtctg agacctcctt 1020
cttgtctgct ggatgctcat tctgattgtg gatatgaagg atctccttct cctttttctg 1080
atatgtcttc tcctctggga acagatcatt cttgggaaga tacatttgct aatgaactgt 1140
ttcctcagct gatctctgtg tgagcggccg ctaatcagcc ataccacatt tgtagaggtt 1200
ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa aatgaatgca 1260
attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc 1320
acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc 1380
atcaatgtat cttatcatgt ctaccggtag ggcccctctc ttcatgtgag caaaaggcca 1440
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 1500
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 1560
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 1620
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 1680
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 1740
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 1800
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 1860
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 1920
aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 1980
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 2040
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 2100
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgggcg cgcctcatac 2160
tcctgcaggc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg 2220
aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 2280
aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 2340
ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 2400
gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 2460
aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 2520
ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 2580
tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 2640
ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt 2700
cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 2760
agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 2820
gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 2880
gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 2940
acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 3000
acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 3060
agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 3120
aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 3180
gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 3240
tccccgaaaa gtgccacctg acgtcaggta ccaagcctag gcctccaaaa aagcctcctc 3300
actacttctg gaatagctca gaggcagagg cggcctcggc ctctgcataa ataaaaaaaa 3360
ttagtcagcc atggggcgga gaatgggcgg aactgggcgg agttaggggc gggatgggcg 3420
gagttagggg cgggactatg gttgctgact aattgagatg catgctttgc atacttctgc 3480
ctgctgggga gcctggggac tttccacacc tggttgctga ctaattgaga tgcatgcttt 3540
gcatacttct gcctgctggg gagcctgggg actttccaca ccggatccac catggccaag 3600
ttgaccagtg ccgttccggt gctcaccgcg cgcgacgtcg ccggagcggt cgagttctgg 3660
accgaccggc tcgggttctc ccgggacttc gtggaggacg acttcgccgg tgtggtccgg 3720
gacgacgtga ccctgttcat cagcgcggtc caggaccagg tggtgccgga caacaccctg 3780
gcctgggtgt gggtgcgcgg cctggacgag ctgtacgccg agtggtcgga ggtcgtgtcc 3840
acgaacttcc gggacgcctc cgggccggcc atgaccgaga tcggcgagca gccgtggggg 3900
cgggagttcg ccctgcgcga cccggccggc aactgcgtgc acttcgtggc cgaggagcag 3960
gactgaacgc gtgctgtaag tctgcagaaa ttgatgatct attaaacaat aaagatgtcc 4020
actaaaatgg aagtttttcc tgtcatactt tgttaagaag ggtgagaaca gagtacctac 4080
attttgaatg gaaggattgg agctacgggg gtgggggtgg ggtgggatta gataaatgcc 4140
tgctctttac tgaaggctct ttactattgc tttatgataa tgtttcatag ttggatatca 4200
taatttaaac aagcaaaacc aaattaaggg ccagctcatt cctcccactc atgatctatg 4260
gatctataga tctctcgtgc agctggggct ctagggggta tccccacgcg ccctgtagcg 4320
gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg 4380
ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc 4440
cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc 4500
tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga 4560
cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa 4620
ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg attttgccga 4680
tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattaattct 4740
gtggaatgtg tgtcagttag tcgcgaggcc tccgcgccgg gttttggcgc ctcccgcggg 4800
cgcccccctc ctcacggcga gcgctgccac gtcagacgaa gggcgcagcg agcgtcctga 4860
tccttccgcc cggacgctca ggacagcggc ccgctgctca taagactcgg ccttagaacc 4920
ccagtatcag cagaaggaca ttttaggacg ggacttgggt gactctaggg cactggtttt 4980
ctttccagag agcggaacag gcgaggaaaa gtagtccctt ctcggcgatt ctgcggaggg 5040
atctccgtgg ggcggtgaac gccgatgatt atataaggac gcgccgggtg tggcacagct 5100
agttccgtcg cagccgggat ttgggtcgcg gttcttgttt gtggatcgct gtgatcgtca 5160
cttggtgagt agcgggctgc tgggctggcc ggggctttcg tggccgccgg gccgctcggt 5220
gggacggaag cgtgtggaga gaccgccaag ggctgtagtc tgggtccgcg agcaaggttg 5280
ccctgaactg ggggttgggg ggagcgcagc aaaatggcgg ctgttcccga gtcttgaatg 5340
gaagacgctt gtgaggcggg ctgtgaggtc gttgaaacaa ggtggggggc atggtgggcg 5400
gcaagaaccc aaggtcttga ggccttcgct aatgcgggaa agctcttatt cgggtgagat 5460
gggctggggc accatctggg gaccctgacg tgaagtttgt cactgactgg agaactcggt 5520
ttgtcgtctg ttgcgggggc ggcagttatg gcggtgccgt tgggcagtgc acccgtacct 5580
ttgggagcgc gcgccctcgt cgtgtcgtga cgtcacccgt tctgttggct tataatgcag 5640
ggtggggcca cctgccggta ggtgtgcggt aggcttttct ccgtcgcagg acgcagggtt 5700
cgggcctagg gtaggctctc ctgaatcgac aggcgccgga cctctggtga ggggagggat 5760
aagtgaggcg tcagtttctt tggtcggttt tatgtaccta tcttcttaag tagctgaagc 5820
tccggttttg aactatgcgc tcggggttgg cgagtgtgtt ttgtgaagtt ttttaggcac 5880
cttttgaaat gtaatcattt gggtcaatat gtaattttca gtgttagact agtaaattgt 5940
ccgctaaatt ctggccgttt ttggcttttt tgttagacgt cgaccgatcc tgagaacttc 6000
agggtgagtt tggggaccct tgattgttct ttctttttcg ctattgtaaa attcatgtta 6060
tatggagggg gcaaagtttt cagggtgttg tttagaatgg gaagatgtcc cttgtatcac 6120
catggaccct catgataatt ttgtttcttt cactttctac tctgttgaca accattgtct 6180
cctcttattt tcttttcatt ttctgtaact ttttcgttaa actttagctt gcatttgtaa 6240
cgaattttta aattcacttt tgtttatttg tcagattgta agtactttct ctaatcactt 6300
ttttttcaag gcaatcaggg tatattatat tgtacttcag cacagtttta gagaacaatt 6360
gttataatta aatgataagg tagaatattt ctgcatataa attctggctg gcgtggaaat 6420
attcttattg gtagaaacaa ctacaccctg gtcatcatcc tgcctttctc tttatggtta 6480
caatgatata cactgtttga gatgaggata aaatactctg agtccaaacc gggcccctct 6540
gctaaccatg ttcatgcctt cttctctttc ctacagctcc tgggcaacgt gctggttgtt 6600
gtgctgtctc atcattttgg caaagaatt 6629
<210> 18
<211> 3264
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 18
ggcctccgcg ccgggttttg gcgcctcccg cgggcgcccc cctcctcacg gcgagcgctg 60
ccacgtcaga cgaagggcgc agcgagcgtc ctgatccttc cgcccggacg ctcaggacag 120
cggcccgctg ctcataagac tcggccttag aaccccagta tcagcagaag gacattttag 180
gacgggactt gggtgactct agggcactgg ttttctttcc agagagcgga acaggcgagg 240
aaaagtagtc ccttctcggc gattctgcgg agggatctcc gtggggcggt gaacgccgat 300
gattatataa ggacgcgccg ggtgtggcac agctagttcc gtcgcagccg ggatttgggt 360
cgcggttctt gtttgtggat cgctgtgatc gtcacttggt gagtagcggg ctgctgggct 420
ggccggggct ttcgtggccg ccgggccgct cggtgggacg gaagcgtgtg gagagaccgc 480
caagggctgt agtctgggtc cgcgagcaag gttgccctga actgggggtt ggggggagcg 540
cagcaaaatg gcggctgttc ccgagtcttg aatggaagac gcttgtgagg cgggctgtga 600
ggtcgttgaa acaaggtggg gggcatggtg ggcggcaaga acccaaggtc ttgaggcctt 660
cgctaatgcg ggaaagctct tattcgggtg agatgggctg gggcaccatc tggggaccct 720
gacgtgaagt ttgtcactga ctggagaact cggtttgtcg tctgttgcgg gggcggcagt 780
tatggcggtg ccgttgggca gtgcacccgt acctttggga gcgcgcgccc tcgtcgtgtc 840
gtgacgtcac ccgttctgtt ggcttataat gcagggtggg gccacctgcc ggtaggtgtg 900
cggtaggctt ttctccgtcg caggacgcag ggttcgggcc tagggtaggc tctcctgaat 960
cgacaggcgc cggacctctg gtgaggggag ggataagtga ggcgtcagtt tctttggtcg 1020
gttttatgta cctatcttct taagtagctg aagctccggt tttgaactat gcgctcgggg 1080
ttggcgagtg tgttttgtga agttttttag gcaccttttg aaatgtaatc atttgggtca 1140
atatgtaatt ttcagtgtta gactagtaaa ttgtccgcta aattctggcc gtttttggct 1200
tttttgttag acgtcgaccg atcctgagaa cttcagggtg agtttgggga cccttgattg 1260
ttctttcttt ttcgctattg taaaattcat gttatatgga gggggcaaag ttttcagggt 1320
gttgtttaga atgggaagat gtcccttgta tcaccatgga ccctcatgat aattttgttt 1380
ctttcacttt ctactctgtt gacaaccatt gtctcctctt attttctttt cattttctgt 1440
aactttttcg ttaaacttta gcttgcattt gtaacgaatt tttaaattca cttttgttta 1500
tttgtcagat tgtaagtact ttctctaatc actttttttt caaggcaatc agggtatatt 1560
atattgtact tcagcacagt tttagagaac aattgttata attaaatgat aaggtagaat 1620
atttctgcat ataaattctg gctggcgtgg aaatattctt attggtagaa acaactacac 1680
cctggtcatc atcctgcctt tctctttatg gttacaatga tatacactgt ttgagatgag 1740
gataaaatac tctgagtcca aaccgggccc ctctgctaac catgttcatg ccttcttctc 1800
tttcctacag ctcctgggca acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga 1860
attaagctta tactcgagct ctagattggg aacccgggtc tctcgaattc atggtggtgg 1920
tggctgctgc tccttctgct gctacagctg ctcctaaggt gctgctgctg tctggacagc 1980
ctgcttctgg aggaagagct ctgcctctga tggtgcctgg acctagagct gctggatctg 2040
aggcttctgg aacacctcag gctagaaaga gacagagact gacacatctg tctcctgaag 2100
aaaaggctct gagaagaaag ctgaagaata gagtggctgc tcagacagct agagatagaa 2160
agaaggctag aatgtctgaa ctggaacagc aggtggtgga tctggaagaa gaaaatcata 2220
agctgcagct ggaaaatcag ctgctgagag aaaagacaca tggactggtg gtggaaaatc 2280
aggaactgag aacaagactg ggaatggata cactggatcc tgatgaagtg cctgaagtgg 2340
aagctaaggg atctggagtg agactggtgg ctggatctgc tgaatctgct gctggagctg 2400
gacctgtggt gacatctcct gaacatctgc ctatggattc tgatacagtg gcttcttctg 2460
attctgaatc tgatatcctg ctgggaatcc tggataagct ggatcctgtg atgtttttta 2520
agtgtccttc tcctgaatct gcttctctgg aagaactgcc tgaagtgtat cctgaaggac 2580
cttcttctct gcctgcttct ctgtctctgt ctgtgggaac atcttctgct aagctggaag 2640
ctatcaatga actgatcaga tttgatcatg tgtatacaaa gcctctggtg ctggaaatcc 2700
cttctgaaac agaatctcag acaaatgtgg tggtgaagat cgaagaagct cctctgtctt 2760
cttctgaaga agatcatcct gaatttatcg tgtctgtgaa gaaggaacct ctggaagatg 2820
attttatccc tgaactggga atctctaatc tgctgtcttc ttctcattgt ctgagacctc 2880
cttcttgtct gctggatgct cattctgatt gtggatatga aggatctcct tctccttttt 2940
ctgatatgtc ttctcctctg ggaacagatc attcttggga agatacattt gctaatgaac 3000
tgtttcctca gctgatctct gtgtgagcgg ccgctaatca gccataccac atttgtagag 3060
gttttacttg ctttaaaaaa cctcccacac ctccccctga acctgaaaca taaaatgaat 3120
gcaattgttg ttgttaactt gtttattgca gcttataatg gttacaaata aagcaatagc 3180
atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa 3240
ctcatcaatg tatcttatca tgtc 3264
<210> 19
<211> 447
<212> PRT
<213> Homo sapiens
<400> 19
Glu Val Gln Val Leu Glu Ser Gly Gly Asp Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Ala Tyr
20 25 30
Ala Met Thr Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ser Ala Ile Ser Gly Ser Gly Gly Ser Ala Tyr Tyr Ala Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Val Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Lys Asp Gly Ala Trp Lys Met Ser Gly Leu Asp Val Trp Gly Gln
100 105 110
Gly Thr Thr Val Ile Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val
115 120 125
Phe Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr Ala Ala
130 135 140
Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser
145 150 155 160
Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val
165 170 175
Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro
180 185 190
Ser Ser Ser Leu Gly Thr Lys Thr Tyr Thr Cys Asn Val Asp His Lys
195 200 205
Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu Ser Lys Tyr Gly Pro
210 215 220
Pro Cys Pro Pro Cys Pro Ala Pro Glu Phe Leu Gly Gly Pro Ser Val
225 230 235 240
Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr
245 250 255
Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Pro Glu
260 265 270
Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys
275 280 285
Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val Val Ser
290 295 300
Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys
305 310 315 320
Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys Thr Ile
325 330 335
Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro
340 345 350
Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu
355 360 365
Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn
370 375 380
Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser
385 390 395 400
Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys Ser Arg
405 410 415
Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu
420 425 430
His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Gly Lys
435 440 445
<210> 20
<211> 110
<212> PRT
<213> Homo sapiens
<400> 20
Glu Ser Gly Gly Asp Leu Val Gln Pro Gly Gly Ser Leu Arg Leu Ser
1 5 10 15
Cys Ala Ala Ser Gly Phe Thr Phe Ser Ala Tyr Ala Met Thr Trp Val
20 25 30
Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val Ser Ala Ile Ser Gly
35 40 45
Ser Gly Gly Ser Ala Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr
50 55 60
Ile Ser Arg Asp Asn Ser Lys Asn Thr Val Tyr Leu Gln Met Asn Ser
65 70 75 80
Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Ala Lys Asp Gly Ala
85 90 95
Trp Lys Met Ser Gly Leu Asp Val Trp Gly Gln Gly Thr Thr
100 105 110
<210> 21
<211> 214
<212> PRT
<213> Homo sapiens
<400> 21
Asp Ile Gln Met Thr Gln Ser Pro Ala Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Asp Ile Ser Asp Tyr
20 25 30
Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ile Pro Arg Leu Leu Ile
35 40 45
Tyr Thr Thr Ser Thr Leu Gln Ser Gly Val Pro Ser Arg Phe Arg Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 80
Glu Asp Val Ala Thr Tyr Tyr Cys Gln Lys Tyr Asp Ser Ala Pro Leu
85 90 95
Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala
100 105 110
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
115 120 125
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
130 135 140
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
145 150 155 160
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
165 170 175
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
180 185 190
Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser
195 200 205
Phe Asn Arg Gly Glu Cys
210
<210> 22
<211> 100
<212> PRT
<213> Homo sapiens
<400> 22
Gln Ser Pro Ala Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile
1 5 10 15
Thr Cys Arg Ala Ser Gln Asp Ile Ser Asp Tyr Leu Ala Trp Tyr Gln
20 25 30
Gln Lys Pro Gly Lys Ile Pro Arg Leu Leu Ile Tyr Thr Thr Ser Thr
35 40 45
Leu Gln Ser Gly Val Pro Ser Arg Phe Arg Gly Ser Gly Ser Gly Thr
50 55 60
Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Val Ala Thr
65 70 75 80
Tyr Tyr Cys Gln Lys Tyr Asp Ser Ala Pro Leu Thr Phe Gly Gly Gly
85 90 95
Thr Lys Val Glu
100
<210> 23
<211> 2971
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 23
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600
atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660
taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720
gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780
gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840
gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900
ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960
tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020
gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080
tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140
aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200
acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260
ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320
cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380
gctgatgcag aggtgcaggt gttggagtct gggggagact tggtacagcc tggggggtcc 1440
ctgagactct cctgtgcagc ctctggattc acctttagtg cctatgccat gacctgggtc 1500
cgccaggctc cagggaaggg gctggagtgg gtctcagcta ttagtggtag tggtggtagc 1560
gcatactacg cagactccgt gaagggccgg ttcaccatct ccagagacaa ttccaagaac 1620
acggtatatc tgcagatgaa cagcctgaga gccgaggaca cggccgtata ttactgtgcg 1680
aaagatgggg cctggaaaat gtccggtttg gacgtctggg gccaagggac cacggtcatc 1740
gtctcctcag cctccaccaa gggcccatcg gtcttccccc tggcgccctg ctccaggagc 1800
acctccgaga gcacagccgc cctgggctgc ctggtcaagg actacttccc cgaaccggtg 1860
acggtgtcgt ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta 1920
cagtcctcag gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc 1980
acgaagacct acacctgcaa cgtagatcac aagcccagca acaccaaggt ggacaagaga 2040
gttgagtcca aatatggtcc cccatgccca ccctgcccag cacctgagtt cctgggggga 2100
ccatcagtct tcctgttccc cccaaaaccc aaggacactc tcatgatctc ccggacccct 2160
gaggtcacgt gcgtggtggt ggacgtgagc caggaagacc ccgaggtcca gttcaactgg 2220
tacgtggatg gcgtggaggt gcataatgcc aagacaaagc cgcgggagga gcagttcaac 2280
agcacgtacc gtgtggtcag cgtcctcacc gtcctgcacc aggactggct gaacggcaag 2340
gagtacaagt gcaaggtctc caacaaaggc ctcccgtcct ccatcgagaa aaccatctcc 2400
aaagccaaag ggcagccccg agagccacag gtgtacaccc tgcccccatc ccaggaggag 2460
atgaccaaga accaggtcag cctgacctgc ctggtcaaag gcttctaccc cagcgacatc 2520
gccgtggagt gggagagcaa tgggcagccg gagaacaact acaagaccac gcctcccgtg 2580
ctggactccg acggctcctt cttcctctac agcaggctca ccgtggacaa gagcaggtgg 2640
caggagggga atgtcttctc atgctccgtg atgcatgagg ctctgcacaa ccactacaca 2700
cagaagtccc tctccctgtc tctgggtaaa tgagcggccg ctaatcagcc ataccacatt 2760
tgtagaggtt ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa 2820
aatgaatgca attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag 2880
caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 2940
gtccaaactc atcaatgtat cttatcatgt c 2971
<210> 24
<211> 7013
<212> DNA
<213> Artificial
<220>
<223> Synthetic plasmid
<400> 24
tcgcgatgtg tgactagtta gttattaata gtaatcaatt acggggtcat tagttcatag 60
cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 120
caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 180
gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 240
tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 300
ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 360
attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata 420
gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt 480
ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca 540
aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agagctcatg atagaagcac 600
tctactattc gtcgaccgat cctgagaact tcagggtgag tttggggacc cttgattgtt 660
ctttcttttt cgctattgta aaattcatgt tatatggagg gggcaaagtt ttcagggtgt 720
tgtttagaat gggaagatgt cccttgtatc accatggacc ctcatgataa ttttgtttct 780
ttcactttct actctgttga caaccattgt ctcctcttat tttcttttca ttttctgtaa 840
ctttttcgtt aaactttagc ttgcatttgt aacgaatttt taaattcact tttgtttatt 900
tgtcagattg taagtacttt ctctaatcac ttttttttca aggcaatcag ggtatattat 960
attgtacttc agcacagttt tagagaacaa ttgttataat taaatgataa ggtagaatat 1020
ttctgcatat aaattctggc tggcgtggaa atattcttat tggtagaaac aactacaccc 1080
tggtcatcat cctgcctttc tctttatggt tacaatgata tacactgttt gagatgagga 1140
taaaatactc tgagtccaaa ccgggcccct ctgctaacca tgttcatgcc ttcttctctt 1200
tcctacagct cctgggcaac gtgctggttg ttgtgctgtc tcatcatttt ggcaaagaat 1260
taagcttata ctcgagctct agattgggaa cccgggtctc tcgaattcga gatctccacc 1320
atgcacagac ctagacgtcg tggaactcgt ccacctccac tggcactgct cgctgctctc 1380
ctcctggctg cacgtggtgc tgatgcagag gtgcaggtgt tggagtctgg gggagacttg 1440
gtacagcctg gggggtccct gagactctcc tgtgcagcct ctggattcac ctttagtgcc 1500
tatgccatga cctgggtccg ccaggctcca gggaaggggc tggagtgggt ctcagctatt 1560
agtggtagtg gtggtagcgc atactacgca gactccgtga agggccggtt caccatctcc 1620
agagacaatt ccaagaacac ggtatatctg cagatgaaca gcctgagagc cgaggacacg 1680
gccgtatatt actgtgcgaa agatggggcc tggaaaatgt ccggtttgga cgtctggggc 1740
caagggacca cggtcatcgt ctcctcagcc tccaccaagg gcccatcggt cttccccctg 1800
gcgccctgct ccaggagcac ctccgagagc acagccgccc tgggctgcct ggtcaaggac 1860
tacttccccg aaccggtgac ggtgtcgtgg aactcaggcg ccctgaccag cggcgtgcac 1920
accttcccgg ctgtcctaca gtcctcagga ctctactccc tcagcagcgt ggtgaccgtg 1980
ccctccagca gcttgggcac gaagacctac acctgcaacg tagatcacaa gcccagcaac 2040
accaaggtgg acaagagagt tgagtccaaa tatggtcccc catgcccacc ctgcccagca 2100
cctgagttcc tggggggacc atcagtcttc ctgttccccc caaaacccaa ggacactctc 2160
atgatctccc ggacccctga ggtcacgtgc gtggtggtgg acgtgagcca ggaagacccc 2220
gaggtccagt tcaactggta cgtggatggc gtggaggtgc ataatgccaa gacaaagccg 2280
cgggaggagc agttcaacag cacgtaccgt gtggtcagcg tcctcaccgt cctgcaccag 2340
gactggctga acggcaagga gtacaagtgc aaggtctcca acaaaggcct cccgtcctcc 2400
atcgagaaaa ccatctccaa agccaaaggg cagccccgag agccacaggt gtacaccctg 2460
cccccatccc aggaggagat gaccaagaac caggtcagcc tgacctgcct ggtcaaaggc 2520
ttctacccca gcgacatcgc cgtggagtgg gagagcaatg ggcagccgga gaacaactac 2580
aagaccacgc ctcccgtgct ggactccgac ggctccttct tcctctacag caggctcacc 2640
gtggacaaga gcaggtggca ggaggggaat gtcttctcat gctccgtgat gcatgaggct 2700
ctgcacaacc actacacaca gaagtccctc tccctgtctc tgggtaaatg agcggccgct 2760
aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc cacacctccc 2820
cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta ttgcagctta 2880
taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat ttttttcact 2940
gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct accggtcctg 3000
cagggcccct ctcttcatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 3060
cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 3120
ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 3180
aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 3240
tctcccttcg ggaagcgtgg cgctttctca atgctcacgc tgtaggtatc tcagttcggt 3300
gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 3360
cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 3420
ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 3480
cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct 3540
gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 3600
cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 3660
tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg 3720
ttaagggatt ttggtcatgg gcgcgcctca tactcctgca ggcatgagat tatcaaaaag 3780
gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 3840
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 3900
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 3960
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 4020
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 4080
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 4140
gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 4200
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 4260
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 4320
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 4380
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 4440
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 4500
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 4560
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 4620
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 4680
aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 4740
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 4800
gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcag 4860
gtaccaagcc taggcctcca aaaaagcctc ctcactactt ctggaatagc tcagaggcag 4920
aggcggcctc ggcctctgca taaataaaaa aaattagtca gccatggggc ggagaatggg 4980
cggaactggg cggagttagg ggcgggatgg gcggagttag gggcgggact atggttgctg 5040
actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 5100
acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 5160
gggactttcc acaccggatc caccatggat agatccggaa agcctgaact caccgcgacg 5220
tctgtcgaga agtttctgat cgaaaagttc gacagcgtct ccgacctgat gcagctctcg 5280
gagggcgaag aatctcgtgc tttcagcttc gatgtaggag ggcgtggata tgtcctgcgg 5340
gtaaatagct gcgccgatgg tttctacaaa gatcgttatg tttatcggca ctttgcatcg 5400
gccgcgctcc cgattccgga agtgcttgac attggggagt tcagcgagag cctgacctat 5460
tgcatctccc gccgtgcaca gggtgtcacg ttgcaagacc tgcctgaaac cgaactgccc 5520
gctgttctgc agccggtcgc ggaggccatg gatgcgatcg ctgcggccga tcttagccag 5580
acgagcgggt tcggcccatt cggaccgcaa ggaatcggtc aatacactac atggcgtgat 5640
ttcatatgcg cgattgctga tccccatgtg tatcactggc aaactgtgat ggacgacacc 5700
gtcagtgcgt ccgtcgcgca ggctctcgat gagctgatgc tttgggccga ggactgcccc 5760
gaagtccggc acctcgtgca cgcggatttc ggctccaaca atgtcctgac ggacaatggc 5820
cgcataacag cggtcattga ctggagcgag gcgatgttcg gggattccca atacgaggtc 5880
gccaacatct tcttctggag gccgtggttg gcttgtatgg agcagcagac gcgctacttc 5940
gagcggaggc atccggagct tgcaggatcg ccgcggctcc gggcgtatat gctccgcatt 6000
ggtcttgacc aactctatca gagcttggtt gacggcaatt tcgatgatgc agcttgggcg 6060
cagggtcgat gcgacgcaat cgtccgatcc ggagccggga ctgtcgggcg tacacaaatc 6120
gcccgcagaa gcgcggccgt ctggaccgat ggctgtgtag aagtactcgc cgatagtgga 6180
aaccgacgcc ccagcactcg tccgagggca aaggaataga cgcgtgctgt aagtctgcag 6240
aaattgatga tctattaaac aataaagatg tccactaaaa tggaagtttt tcctgtcata 6300
ctttgttaag aagggtgaga acagagtacc tacattttga atggaaggat tggagctacg 6360
ggggtggggg tggggtggga ttagataaat gcctgctctt tactgaaggc tctttactat 6420
tgctttatga taatgtttca tagttggata tcataattta aacaagcaaa accaaattaa 6480
gggccagctc attcctccca ctcatgatct atggatctat agatctctcg tgcagctggg 6540
gctctagggg gtatccccac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 6600
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 6660
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 6720
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 6780
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 6840
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 6900
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 6960
tgatttaaca aaaatttaac gcgaattaat tctgtggaat gtgtgtcagt tag 7013
<210> 25
<211> 2272
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 25
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600
atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660
taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720
gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780
gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840
gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900
ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960
tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020
gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080
tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140
aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200
acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260
ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320
cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380
gctgatgcag acatccagat gacccagtct ccagcctccc tgtctgcatc tgttggagac 1440
agagtcacca tcacttgtcg ggcgagtcag gacattagcg attatttagc ctggtatcag 1500
cagaaaccag ggaaaattcc taggctcctg atctatacta catccacttt gcaatcaggg 1560
gtcccatctc ggttccgtgg cagtgggtct gggacagatt tcactctcac catcagcagc 1620
ctgcagcctg aagatgttgc aacttattac tgtcagaagt atgacagtgc cccgctcact 1680
ttcggcggag ggaccaaggt ggagatcaaa cgaactgtgg ctgcaccatc tgtcttcatc 1740
ttcccgccat ctgatgagca gttgaaatct ggaactgcct ctgttgtgtg cctgctgaat 1800
aacttctatc ccagagaggc caaagtacag tggaaggtgg ataacgccct ccaatcgggt 1860
aactcccagg agagtgtcac agagcaggac agcaaggaca gcacctacag cctcagcagc 1920
accctgacgc tgagcaaagc agactacgag aaacacaaag tctacgcctg cgaagtcacc 1980
catcagggcc tgagctcgcc cgtcacaaag agcttcaaca ggggagagtg ttaggcggcc 2040
gctaatcagc cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct 2100
ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc 2160
ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 2220
actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tc 2272
<210> 26
<211> 6335
<212> DNA
<213> Artificial
<220>
<223> Synthetic plasmid
<400> 26
tcgagctcta gattgggaac ccgggtctct cgaattcgag atctccacca tgcacagacc 60
tagacgtcgt ggaactcgtc cacctccact ggcactgctc gctgctctcc tcctggctgc 120
acgtggtgct gatgcagaca tccagatgac ccagtctcca gcctccctgt ctgcatctgt 180
tggagacaga gtcaccatca cttgtcgggc gagtcaggac attagcgatt atttagcctg 240
gtatcagcag aaaccaggga aaattcctag gctcctgatc tatactacat ccactttgca 300
atcaggggtc ccatctcggt tccgtggcag tgggtctggg acagatttca ctctcaccat 360
cagcagcctg cagcctgaag atgttgcaac ttattactgt cagaagtatg acagtgcccc 420
gctcactttc ggcggaggga ccaaggtgga gatcaaacga actgtggctg caccatctgt 480
cttcatcttc ccgccatctg atgagcagtt gaaatctgga actgcctctg ttgtgtgcct 540
gctgaataac ttctatccca gagaggccaa agtacagtgg aaggtggata acgccctcca 600
atcgggtaac tcccaggaga gtgtcacaga gcaggacagc aaggacagca cctacagcct 660
cagcagcacc ctgacgctga gcaaagcaga ctacgagaaa cacaaagtct acgcctgcga 720
agtcacccat cagggcctga gctcgcccgt cacaaagagc ttcaacaggg gagagtgtta 780
ggcggccgct aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc 840
cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta 900
ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 960
ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 1020
accggtaggg cccctctctt catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 1080
aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 1140
cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 1200
cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 1260
gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag gtatctcagt 1320
tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 1380
cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 1440
ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 1500
gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc 1560
gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 1620
accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 1680
ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 1740
tcacgttaag ggattttggt catgggcgcg ggcatgagat tatcaaaaag gatcttcacc 1800
tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 1860
tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 1920
cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta 1980
ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta 2040
tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc 2100
gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat 2160
agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt 2220
atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg 2280
tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca 2340
gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta 2400
agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg 2460
cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact 2520
ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg 2580
ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt 2640
actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga 2700
ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc 2760
atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa 2820
caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcag gtacacttag 2880
gcgcgccatt agagttcctg caggctacat ggtaccaagc ctaggcctcc aaaaaagcct 2940
cctcactact tctggaatag ctcagaggca gaggcggcct cggcctctgc ataaataaaa 3000
aaaattagtc agccatgggg cggagaatgg gcggaactgg gcggagttag gggcgggatg 3060
ggcggagtta ggggcgggac tatggttgct gactaattga gatgcatgct ttgcatactt 3120
ctgcctgctg gggagcctgg ggactttcca cacctggttg ctgactaatt gagatgcatg 3180
ctttgcatac ttctgcctgc tggggagcct ggggactttc cacaccggat ccaccatgga 3240
tagatccgga aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt 3300
cgacagcgtc tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt 3360
cgatgtagga gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa 3420
agatcgttat gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga 3480
cattggggag ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac 3540
gttgcaagac ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat 3600
ggatgcgatc gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca 3660
aggaatcggt caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt 3720
gtatcactgg caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga 3780
tgagctgatg ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt 3840
cggctccaac aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga 3900
ggcgatgttc ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt 3960
ggcttgtatg gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc 4020
gccgcggctc cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt 4080
tgacggcaat ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc 4140
cggagccggg actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga 4200
tggctgtgta gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc 4260
aaaggaatag acgcgtgctg taagtctgca gaaattgatg atctattaaa caataaagat 4320
gtccactaaa atggaagttt ttcctgtcat actttgttaa gaagggtgag aacagagtac 4380
ctacattttg aatggaagga ttggagctac gggggtgggg gtggggtggg attagataaa 4440
tgcctgctct ttactgaagg ctctttacta ttgctttatg ataatgtttc atagttggat 4500
atcataattt aaacaagcaa aaccaaatta agggccagct cattcctccc actcatgatc 4560
tatggatcta tagatctctc gtgcagctgg ggctctaggg ggtatcccca cgcgccctgt 4620
agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc 4680
agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc 4740
tttccccgtc aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg 4800
cacctcgacc ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga 4860
tagacggttt ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc 4920
caaactggaa caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg 4980
ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaattaa 5040
ttctgtggaa tgtgtgtcag ttagtcgcga tgtgtgacta gttagttatt aatagtaatc 5100
aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt 5160
aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta 5220
tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg 5280
gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga 5340
cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt 5400
tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg 5460
gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc 5520
cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg 5580
taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat 5640
aagcagagct catgatagaa gcactctact attcgtcgac cgatcctgag aacttcaggg 5700
tgagtttggg gacccttgat tgttctttct ttttcgctat tgtaaaattc atgttatatg 5760
gagggggcaa agttttcagg gtgttgttta gaatgggaag atgtcccttg tatcaccatg 5820
gaccctcatg ataattttgt ttctttcact ttctactctg ttgacaacca ttgtctcctc 5880
ttattttctt ttcattttct gtaacttttt cgttaaactt tagcttgcat ttgtaacgaa 5940
tttttaaatt cacttttgtt tatttgtcag attgtaagta ctttctctaa tcactttttt 6000
ttcaaggcaa tcagggtata ttatattgta cttcagcaca gttttagaga acaattgtta 6060
taattaaatg ataaggtaga atatttctgc atataaattc tggctggcgt ggaaatattc 6120
ttattggtag aaacaactac accctggtca tcatcctgcc tttctcttta tggttacaat 6180
gatatacact gtttgagatg aggataaaat actctgagtc caaaccgggc ccctctgcta 6240
accatgttca tgccttcttc tctttcctac agctcctggg caacgtgctg gttgttgtgc 6300
tgtctcatca ttttggcaaa gaattaagct tatac 6335
<210> 27
<211> 452
<212> PRT
<213> Homo sapiens
<400> 27
Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Ser Tyr
20 25 30
Asp Ile His Trp Val Arg Gln Ala Thr Gly Lys Gly Leu Glu Trp Val
35 40 45
Ser Ala Ile Gly Pro Ala Gly Asp Thr Tyr Tyr Pro Gly Ser Val Lys
50 55 60
Gly Arg Phe Thr Ile Ser Arg Glu Asn Ala Lys Asn Ser Leu Tyr Leu
65 70 75 80
Gln Met Asn Ser Leu Arg Ala Gly Asp Thr Ala Val Tyr Tyr Cys Ala
85 90 95
Arg Gly Leu Ile Thr Phe Gly Gly Leu Ile Ala Pro Phe Asp Tyr Trp
100 105 110
Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro
115 120 125
Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr
130 135 140
Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr
145 150 155 160
Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro
165 170 175
Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr
180 185 190
Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn
195 200 205
His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser
210 215 220
Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu
225 230 235 240
Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu
245 250 255
Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser
260 265 270
His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu
275 280 285
Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr
290 295 300
Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn
305 310 315 320
Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro
325 330 335
Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln
340 345 350
Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val
355 360 365
Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val
370 375 380
Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro
385 390 395 400
Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr
405 410 415
Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val
420 425 430
Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu
435 440 445
Ser Pro Gly Lys
450
<210> 28
<211> 112
<212> PRT
<213> Homo sapiens
<400> 28
Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly Ser Leu Arg Leu Ser
1 5 10 15
Cys Ala Ala Ser Gly Phe Thr Phe Ser Ser Tyr Asp Ile His Trp Val
20 25 30
Arg Gln Ala Thr Gly Lys Gly Leu Glu Trp Val Ser Ala Ile Gly Pro
35 40 45
Ala Gly Asp Thr Tyr Tyr Pro Gly Ser Val Lys Gly Arg Phe Thr Ile
50 55 60
Ser Arg Glu Asn Ala Lys Asn Ser Leu Tyr Leu Gln Met Asn Ser Leu
65 70 75 80
Arg Ala Gly Asp Thr Ala Val Tyr Tyr Cys Ala Arg Gly Leu Ile Thr
85 90 95
Phe Gly Gly Leu Ile Ala Pro Phe Asp Tyr Trp Gly Gln Gly Thr Leu
100 105 110
<210> 29
<211> 214
<212> PRT
<213> Homo sapiens
<400> 29
Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly
1 5 10 15
Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Thr
20 25 30
Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu
35 40 45
Ile Tyr Gly Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser
50 55 60
Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu
65 70 75 80
Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln His Tyr Asp Asn Ser Gln
85 90 95
Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala
100 105 110
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
115 120 125
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
130 135 140
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
145 150 155 160
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
165 170 175
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
180 185 190
Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser
195 200 205
Phe Asn Arg Gly Glu Cys
210
<210> 30
<211> 107
<212> PRT
<213> Homo sapiens
<400> 30
Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu
1 5 10 15
Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Thr Tyr
20 25 30
Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile
35 40 45
Tyr Gly Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu Pro
65 70 75 80
Glu Asp Phe Ala Val Tyr Tyr Cys Gln His Tyr Asp Asn Ser Gln Thr
85 90 95
Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg
100 105
<210> 31
<211> 2986
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 31
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600
atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660
taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720
gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780
gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840
gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900
ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960
tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020
gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080
tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140
aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200
acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260
ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320
cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380
gctgatgcag aggtgcagct ggtggagtct gggggaggct tggtacagcc gggggggtcc 1440
ctgagactct cctgtgcagc ctctggattc accttcagta gctacgacat acactgggtc 1500
cgtcaagcta caggaaaagg tctggagtgg gtctcagcta ttggtcctgc tggtgacaca 1560
tactatccag gctccgtgaa gggccgattc accatctcca gagaaaatgc caagaactcc 1620
ttgtatcttc aaatgaacag cctgagagcc ggggacacgg ctgtgtatta ctgtgcaaga 1680
ggtttgatta cgtttggggg gcttatcgcc ccgtttgact actggggcca gggaaccctg 1740
gtcaccgtct cctcagcctc caccaagggc ccatcggtct tccccctggc accctcctcc 1800
aagagcacct ctgggggcac agcggccctg ggctgcctgg tcaaggacta cttccccgaa 1860
ccggtgacgg tgtcgtggaa ctcaggcgcc ctgaccagcg gcgtgcacac cttcccggct 1920
gtcctacagt cctcaggact ctactccctc agcagcgtgg tgaccgtgcc ctccagcagc 1980
ttgggcaccc agacctacat ctgcaacgtg aatcacaagc ccagcaacac caaggtggac 2040
aagaaagttg agcccaaatc ttgtgacaaa actcacacat gcccaccgtg cccagcacct 2100
gaactcctgg ggggaccgtc agtcttcctc ttccccccaa aacccaagga caccctcatg 2160
atctcccgga cccctgaggt cacatgcgtg gtggtggacg tgagccacga agaccctgag 2220
gtcaagttca actggtacgt ggacggcgtg gaggtgcata atgccaagac aaagccgcgg 2280
gaggagcagt acaacagcac gtaccgtgtg gtcagcgtcc tcaccgtcct gcaccaggac 2340
tggctgaatg gcaaggagta caagtgcaag gtctccaaca aagccctccc agcccccatc 2400
gagaaaacca tctccaaagc caaagggcag ccccgagaac cacaggtgta caccctgccc 2460
ccatcccggg atgagctgac caagaaccag gtcagcctga cctgcctggt caaaggcttc 2520
tatcccagcg acatcgccgt ggagtgggag agcaatgggc agccggagaa caactacaag 2580
accacgcctc ccgtgctgga ctccgacggc tccttcttcc tctacagcaa gctcaccgtg 2640
gacaagagca ggtggcagca ggggaacgtc ttctcatgct ccgtgatgca tgaggctctg 2700
cacaaccact acacgcagaa gtccctctcc ctgtctccgg gtaaatgagc ggccgctaat 2760
cagccatacc acatttgtag aggttttact tgctttaaaa aacctcccac acctccccct 2820
gaacctgaaa cataaaatga atgcaattgt tgttgttaac ttgtttattg cagcttataa 2880
tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca 2940
ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catgtc 2986
<210> 32
<211> 7028
<212> DNA
<213> Artificial
<220>
<223> Synthetic plasmid
<400> 32
tcgcgatgtg tgactagtta gttattaata gtaatcaatt acggggtcat tagttcatag 60
cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 120
caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 180
gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 240
tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 300
ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 360
attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata 420
gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt 480
ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca 540
aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agagctcatg atagaagcac 600
tctactattc gtcgaccgat cctgagaact tcagggtgag tttggggacc cttgattgtt 660
ctttcttttt cgctattgta aaattcatgt tatatggagg gggcaaagtt ttcagggtgt 720
tgtttagaat gggaagatgt cccttgtatc accatggacc ctcatgataa ttttgtttct 780
ttcactttct actctgttga caaccattgt ctcctcttat tttcttttca ttttctgtaa 840
ctttttcgtt aaactttagc ttgcatttgt aacgaatttt taaattcact tttgtttatt 900
tgtcagattg taagtacttt ctctaatcac ttttttttca aggcaatcag ggtatattat 960
attgtacttc agcacagttt tagagaacaa ttgttataat taaatgataa ggtagaatat 1020
ttctgcatat aaattctggc tggcgtggaa atattcttat tggtagaaac aactacaccc 1080
tggtcatcat cctgcctttc tctttatggt tacaatgata tacactgttt gagatgagga 1140
taaaatactc tgagtccaaa ccgggcccct ctgctaacca tgttcatgcc ttcttctctt 1200
tcctacagct cctgggcaac gtgctggttg ttgtgctgtc tcatcatttt ggcaaagaat 1260
taagcttata ctcgagctct agattgggaa cccgggtctc tcgaattcga gatctccacc 1320
atgcacagac ctagacgtcg tggaactcgt ccacctccac tggcactgct cgctgctctc 1380
ctcctggctg cacgtggtgc tgatgcagag gtgcagctgg tggagtctgg gggaggcttg 1440
gtacagccgg gggggtccct gagactctcc tgtgcagcct ctggattcac cttcagtagc 1500
tacgacatac actgggtccg tcaagctaca ggaaaaggtc tggagtgggt ctcagctatt 1560
ggtcctgctg gtgacacata ctatccaggc tccgtgaagg gccgattcac catctccaga 1620
gaaaatgcca agaactcctt gtatcttcaa atgaacagcc tgagagccgg ggacacggct 1680
gtgtattact gtgcaagagg tttgattacg tttggggggc ttatcgcccc gtttgactac 1740
tggggccagg gaaccctggt caccgtctcc tcagcctcca ccaagggccc atcggtcttc 1800
cccctggcac cctcctccaa gagcacctct gggggcacag cggccctggg ctgcctggtc 1860
aaggactact tccccgaacc ggtgacggtg tcgtggaact caggcgccct gaccagcggc 1920
gtgcacacct tcccggctgt cctacagtcc tcaggactct actccctcag cagcgtggtg 1980
accgtgccct ccagcagctt gggcacccag acctacatct gcaacgtgaa tcacaagccc 2040
agcaacacca aggtggacaa gaaagttgag cccaaatctt gtgacaaaac tcacacatgc 2100
ccaccgtgcc cagcacctga actcctgggg ggaccgtcag tcttcctctt ccccccaaaa 2160
cccaaggaca ccctcatgat ctcccggacc cctgaggtca catgcgtggt ggtggacgtg 2220
agccacgaag accctgaggt caagttcaac tggtacgtgg acggcgtgga ggtgcataat 2280
gccaagacaa agccgcggga ggagcagtac aacagcacgt accgtgtggt cagcgtcctc 2340
accgtcctgc accaggactg gctgaatggc aaggagtaca agtgcaaggt ctccaacaaa 2400
gccctcccag cccccatcga gaaaaccatc tccaaagcca aagggcagcc ccgagaacca 2460
caggtgtaca ccctgccccc atcccgggat gagctgacca agaaccaggt cagcctgacc 2520
tgcctggtca aaggcttcta tcccagcgac atcgccgtgg agtgggagag caatgggcag 2580
ccggagaaca actacaagac cacgcctccc gtgctggact ccgacggctc cttcttcctc 2640
tacagcaagc tcaccgtgga caagagcagg tggcagcagg ggaacgtctt ctcatgctcc 2700
gtgatgcatg aggctctgca caaccactac acgcagaagt ccctctccct gtctccgggt 2760
aaatgagcgg ccgctaatca gccataccac atttgtagag gttttacttg ctttaaaaaa 2820
cctcccacac ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt 2880
gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa 2940
agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca 3000
tgtctaccgg tcctgcaggg cccctctctt catgtgagca aaaggccagc aaaaggccag 3060
gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 3120
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 3180
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 3240
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag 3300
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 3360
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 3420
cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 3480
cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt 3540
tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 3600
cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 3660
cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 3720
gaacgaaaac tcacgttaag ggattttggt catgggcgcg cctcatactc ctgcaggcat 3780
gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc 3840
aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc 3900
acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta 3960
gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga 4020
cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg 4080
cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc 4140
tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat 4200
cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag 4260
gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat 4320
cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa 4380
ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa 4440
gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga 4500
taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg 4560
gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc 4620
acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg 4680
aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact 4740
cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat 4800
atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt 4860
gccacctgac gtcaggtacc aagcctaggc ctccaaaaaa gcctcctcac tacttctgga 4920
atagctcaga ggcagaggcg gcctcggcct ctgcataaat aaaaaaaatt agtcagccat 4980
ggggcggaga atgggcggaa ctgggcggag ttaggggcgg gatgggcgga gttaggggcg 5040
ggactatggt tgctgactaa ttgagatgca tgctttgcat acttctgcct gctggggagc 5100
ctggggactt tccacacctg gttgctgact aattgagatg catgctttgc atacttctgc 5160
ctgctgggga gcctggggac tttccacacc ggatccacca tggatagatc cggaaagcct 5220
gaactcaccg cgacgtctgt cgagaagttt ctgatcgaaa agttcgacag cgtctccgac 5280
ctgatgcagc tctcggaggg cgaagaatct cgtgctttca gcttcgatgt aggagggcgt 5340
ggatatgtcc tgcgggtaaa tagctgcgcc gatggtttct acaaagatcg ttatgtttat 5400
cggcactttg catcggccgc gctcccgatt ccggaagtgc ttgacattgg ggagttcagc 5460
gagagcctga cctattgcat ctcccgccgt gcacagggtg tcacgttgca agacctgcct 5520
gaaaccgaac tgcccgctgt tctgcagccg gtcgcggagg ccatggatgc gatcgctgcg 5580
gccgatctta gccagacgag cgggttcggc ccattcggac cgcaaggaat cggtcaatac 5640
actacatggc gtgatttcat atgcgcgatt gctgatcccc atgtgtatca ctggcaaact 5700
gtgatggacg acaccgtcag tgcgtccgtc gcgcaggctc tcgatgagct gatgctttgg 5760
gccgaggact gccccgaagt ccggcacctc gtgcacgcgg atttcggctc caacaatgtc 5820
ctgacggaca atggccgcat aacagcggtc attgactgga gcgaggcgat gttcggggat 5880
tcccaatacg aggtcgccaa catcttcttc tggaggccgt ggttggcttg tatggagcag 5940
cagacgcgct acttcgagcg gaggcatccg gagcttgcag gatcgccgcg gctccgggcg 6000
tatatgctcc gcattggtct tgaccaactc tatcagagct tggttgacgg caatttcgat 6060
gatgcagctt gggcgcaggg tcgatgcgac gcaatcgtcc gatccggagc cgggactgtc 6120
gggcgtacac aaatcgcccg cagaagcgcg gccgtctgga ccgatggctg tgtagaagta 6180
ctcgccgata gtggaaaccg acgccccagc actcgtccga gggcaaagga atagacgcgt 6240
gctgtaagtc tgcagaaatt gatgatctat taaacaataa agatgtccac taaaatggaa 6300
gtttttcctg tcatactttg ttaagaaggg tgagaacaga gtacctacat tttgaatgga 6360
aggattggag ctacgggggt gggggtgggg tgggattaga taaatgcctg ctctttactg 6420
aaggctcttt actattgctt tatgataatg tttcatagtt ggatatcata atttaaacaa 6480
gcaaaaccaa attaagggcc agctcattcc tcccactcat gatctatgga tctatagatc 6540
tctcgtgcag ctggggctct agggggtatc cccacgcgcc ctgtagcggc gcattaagcg 6600
cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 6660
ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 6720
taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 6780
aacttgatta gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 6840
ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 6900
tcaaccctat ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt 6960
ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttaattctgt ggaatgtgtg 7020
tcagttag 7028
<210> 33
<211> 2272
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 33
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600
atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660
taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720
gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780
gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840
gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900
ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960
tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020
gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080
tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140
aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200
acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260
ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320
cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380
gctgatgcag aaattgtgtt gacgcagtct ccaggcaccc tgtctttgtc tccaggggaa 1440
agagccaccc tctcctgcag ggccagtcag agtgttagca gcacctactt agcctggtac 1500
cagcagaaac ctggccaggc tcccaggctc ctcatctatg gtgcatccag cagggccact 1560
ggcatcccag acaggttcag tggcagtggg tctgggacag acttcactct caccatcagc 1620
agactggagc ctgaagattt tgcagtgtat tactgtcagc attatgataa ctcacaaacg 1680
ttcggccaag ggaccaaggt ggagatcaaa cgaactgtgg ctgcaccatc tgtcttcatc 1740
ttcccgccat ctgatgagca gttgaaatct ggaactgcct ctgttgtgtg cctgctgaat 1800
aacttctatc ccagagaggc caaagtacag tggaaggtgg ataacgccct ccaatcgggt 1860
aactcccagg agagtgtcac agagcaggac agcaaggaca gcacctacag cctcagcagc 1920
accctgacgc tgagcaaagc agactacgag aaacacaaag tctacgcctg cgaagtcacc 1980
catcagggcc tgagctcgcc cgtcacaaag agcttcaaca ggggagagtg ttaggcggcc 2040
gctaatcagc cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct 2100
ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc 2160
ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 2220
actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tc 2272
<210> 34
<211> 6335
<212> DNA
<213> Artificial
<220>
<223> Synthetic plasmid
<400> 34
tcgagctcta gattgggaac ccgggtctct cgaattcgag atctccacca tgcacagacc 60
tagacgtcgt ggaactcgtc cacctccact ggcactgctc gctgctctcc tcctggctgc 120
acgtggtgct gatgcagaaa ttgtgttgac gcagtctcca ggcaccctgt ctttgtctcc 180
aggggaaaga gccaccctct cctgcagggc cagtcagagt gttagcagca cctacttagc 240
ctggtaccag cagaaacctg gccaggctcc caggctcctc atctatggtg catccagcag 300
ggccactggc atcccagaca ggttcagtgg cagtgggtct gggacagact tcactctcac 360
catcagcaga ctggagcctg aagattttgc agtgtattac tgtcagcatt atgataactc 420
acaaacgttc ggccaaggga ccaaggtgga gatcaaacga actgtggctg caccatctgt 480
cttcatcttc ccgccatctg atgagcagtt gaaatctgga actgcctctg ttgtgtgcct 540
gctgaataac ttctatccca gagaggccaa agtacagtgg aaggtggata acgccctcca 600
atcgggtaac tcccaggaga gtgtcacaga gcaggacagc aaggacagca cctacagcct 660
cagcagcacc ctgacgctga gcaaagcaga ctacgagaaa cacaaagtct acgcctgcga 720
agtcacccat cagggcctga gctcgcccgt cacaaagagc ttcaacaggg gagagtgtta 780
ggcggccgct aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc 840
cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta 900
ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 960
ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 1020
accggtaggg cccctctctt catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 1080
aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 1140
cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 1200
cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 1260
gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag gtatctcagt 1320
tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 1380
cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 1440
ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 1500
gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc 1560
gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 1620
accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 1680
ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 1740
tcacgttaag ggattttggt catgggcgcg ggcatgagat tatcaaaaag gatcttcacc 1800
tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 1860
tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 1920
cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta 1980
ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta 2040
tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc 2100
gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat 2160
agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt 2220
atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg 2280
tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca 2340
gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta 2400
agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg 2460
cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact 2520
ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg 2580
ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt 2640
actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga 2700
ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc 2760
atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa 2820
caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcag gtacacttag 2880
gcgcgccatt agagttcctg caggctacat ggtaccaagc ctaggcctcc aaaaaagcct 2940
cctcactact tctggaatag ctcagaggca gaggcggcct cggcctctgc ataaataaaa 3000
aaaattagtc agccatgggg cggagaatgg gcggaactgg gcggagttag gggcgggatg 3060
ggcggagtta ggggcgggac tatggttgct gactaattga gatgcatgct ttgcatactt 3120
ctgcctgctg gggagcctgg ggactttcca cacctggttg ctgactaatt gagatgcatg 3180
ctttgcatac ttctgcctgc tggggagcct ggggactttc cacaccggat ccaccatgga 3240
tagatccgga aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt 3300
cgacagcgtc tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt 3360
cgatgtagga gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa 3420
agatcgttat gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga 3480
cattggggag ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac 3540
gttgcaagac ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat 3600
ggatgcgatc gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca 3660
aggaatcggt caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt 3720
gtatcactgg caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga 3780
tgagctgatg ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt 3840
cggctccaac aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga 3900
ggcgatgttc ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt 3960
ggcttgtatg gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc 4020
gccgcggctc cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt 4080
tgacggcaat ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc 4140
cggagccggg actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga 4200
tggctgtgta gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc 4260
aaaggaatag acgcgtgctg taagtctgca gaaattgatg atctattaaa caataaagat 4320
gtccactaaa atggaagttt ttcctgtcat actttgttaa gaagggtgag aacagagtac 4380
ctacattttg aatggaagga ttggagctac gggggtgggg gtggggtggg attagataaa 4440
tgcctgctct ttactgaagg ctctttacta ttgctttatg ataatgtttc atagttggat 4500
atcataattt aaacaagcaa aaccaaatta agggccagct cattcctccc actcatgatc 4560
tatggatcta tagatctctc gtgcagctgg ggctctaggg ggtatcccca cgcgccctgt 4620
agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc 4680
agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc 4740
tttccccgtc aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg 4800
cacctcgacc ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga 4860
tagacggttt ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc 4920
caaactggaa caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg 4980
ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaattaa 5040
ttctgtggaa tgtgtgtcag ttagtcgcga tgtgtgacta gttagttatt aatagtaatc 5100
aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt 5160
aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta 5220
tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg 5280
gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga 5340
cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt 5400
tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg 5460
gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc 5520
cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg 5580
taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat 5640
aagcagagct catgatagaa gcactctact attcgtcgac cgatcctgag aacttcaggg 5700
tgagtttggg gacccttgat tgttctttct ttttcgctat tgtaaaattc atgttatatg 5760
gagggggcaa agttttcagg gtgttgttta gaatgggaag atgtcccttg tatcaccatg 5820
gaccctcatg ataattttgt ttctttcact ttctactctg ttgacaacca ttgtctcctc 5880
ttattttctt ttcattttct gtaacttttt cgttaaactt tagcttgcat ttgtaacgaa 5940
tttttaaatt cacttttgtt tatttgtcag attgtaagta ctttctctaa tcactttttt 6000
ttcaaggcaa tcagggtata ttatattgta cttcagcaca gttttagaga acaattgtta 6060
taattaaatg ataaggtaga atatttctgc atataaattc tggctggcgt ggaaatattc 6120
ttattggtag aaacaactac accctggtca tcatcctgcc tttctcttta tggttacaat 6180
gatatacact gtttgagatg aggataaaat actctgagtc caaaccgggc ccctctgcta 6240
accatgttca tgccttcttc tctttcctac agctcctggg caacgtgctg gttgttgtgc 6300
tgtctcatca ttttggcaaa gaattaagct tatac 6335
<210> 35
<211> 449
<212> PRT
<213> Homo sapiens
<400> 35
Gln Val Gln Leu Gln Gln Ser Gly Ala Gly Leu Leu Lys Pro Ser Glu
1 5 10 15
Thr Leu Ser Leu Thr Cys Thr Val Tyr Gly Gly Ser Phe Ser Ile His
20 25 30
His Trp Thr Trp Ile Arg His Pro Pro Gly Lys Gly Leu Glu Trp Ile
35 40 45
Gly Glu Ile Asn His Arg Gly Ser Thr Asn Tyr Asn Pro Ser Leu Lys
50 55 60
Ser Arg Val Thr Ile Ser Ile Asp Thr Ser Lys Asn Gln Phe Ser Leu
65 70 75 80
Lys Leu Ser Ala Val Thr Ala Ala Asp Thr Ala Val Tyr Tyr Cys Ala
85 90 95
Arg Gly Leu Arg Phe Leu Asp Trp Leu Ser Ser Tyr Phe Asp Tyr Trp
100 105 110
Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro
115 120 125
Ser Val Phe Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr
130 135 140
Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr
145 150 155 160
Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro
165 170 175
Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr
180 185 190
Val Pro Ser Ser Ser Leu Gly Thr Lys Thr Tyr Thr Cys Asn Val Asp
195 200 205
His Lys Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu Ser Lys Tyr
210 215 220
Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Phe Leu Gly Gly Pro
225 230 235 240
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
245 250 255
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp
260 265 270
Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
275 280 285
Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val
290 295 300
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
305 310 315 320
Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys
325 330 335
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr
340 345 350
Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr
355 360 365
Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
370 375 380
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu
385 390 395 400
Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys
405 410 415
Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Glu
420 425 430
Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Gly
435 440 445
Lys
<210> 36
<211> 103
<212> PRT
<213> Homo sapiens
<400> 36
Gln Ser Gly Ala Gly Leu Leu Lys Pro Ser Glu Thr Leu Ser Leu Thr
1 5 10 15
Cys Thr Val Tyr Gly Gly Ser Phe Ser Ile His His Trp Thr Trp Ile
20 25 30
Arg His Pro Pro Gly Lys Gly Leu Glu Trp Ile Gly Glu Ile Asn His
35 40 45
Arg Gly Ser Thr Asn Tyr Asn Pro Ser Leu Lys Ser Arg Val Thr Ile
50 55 60
Ser Ile Asp Thr Ser Lys Asn Gln Phe Ser Leu Lys Leu Ser Ala Val
65 70 75 80
Thr Ala Ala Asp Thr Ala Val Tyr Tyr Cys Ala Arg Gly Leu Arg Phe
85 90 95
Leu Asp Trp Leu Ser Ser Tyr
100
<210> 37
<211> 214
<212> PRT
<213> Homo sapiens
<400> 37
Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Ser Asp Tyr
20 25 30
Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Val Pro Asn Leu Leu Ile
35 40 45
Tyr Ala Ala Ser Ala Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 80
Glu Asp Val Ala Thr Tyr Tyr Cys Gln Asn Tyr Asn Thr Ala Pro Leu
85 90 95
Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala
100 105 110
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
115 120 125
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
130 135 140
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
145 150 155 160
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
165 170 175
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
180 185 190
Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser
195 200 205
Phe Asn Arg Gly Glu Cys
210
<210> 38
<211> 107
<212> PRT
<213> Homo sapiens
<400> 38
Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly Asp
1 5 10 15
Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Ser Asp Tyr Leu
20 25 30
Ala Trp Tyr Gln Gln Lys Pro Gly Lys Val Pro Asn Leu Leu Ile Tyr
35 40 45
Ala Ala Ser Ala Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly Ser
50 55 60
Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu
65 70 75 80
Asp Val Ala Thr Tyr Tyr Cys Gln Asn Tyr Asn Thr Ala Pro Leu Thr
85 90 95
Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg
100 105
<210> 39
<211> 2977
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 39
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600
atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660
taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720
gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780
gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840
gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900
ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960
tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020
gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080
tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140
aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200
acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260
ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320
cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380
gctgatgcac aggtacagct gcagcagtcg ggcgcaggac tgttgaagcc ttcggagacc 1440
ctgtccctca cctgcactgt ctatggtgga tccttcagta ttcatcactg gacctggatc 1500
cgccatcccc cagggaaggg gctggagtgg attggggaga tcaatcatcg tggaagcacc 1560
aactacaacc cgtccctcaa gagtcgagtc accatatcaa tagacacgtc caagaaccag 1620
ttctccctga agctgagcgc tgtgaccgcc gcggacacgg ctgtatatta ctgtgcgaga 1680
ggcttacgat ttttggactg gttatcgtcc tactttgact actggggcca gggaaccctg 1740
gtcaccgtct cctcagcctc caccaagggc ccatcggtct tccccctggc gccctgctcc 1800
aggagcacct ccgagagcac agccgccctg ggctgcctgg tcaaggacta cttccccgaa 1860
ccggtgacgg tgtcgtggaa ctcaggcgcc ctgaccagcg gcgtgcacac cttcccggct 1920
gtcctacagt cctcaggact ctactccctc agcagcgtgg tgaccgtgcc ctccagcagc 1980
ttgggcacga agacctacac ctgcaacgta gatcacaagc ccagcaacac caaggtggac 2040
aagagagttg agtccaaata tggtccccca tgcccaccct gcccagcacc tgagttcctg 2100
gggggaccat cagtcttcct gttcccccca aaacccaagg acactctcat gatctcccgg 2160
acccctgagg tcacgtgcgt ggtggtggac gtgagccagg aagaccccga ggtccagttc 2220
aactggtacg tggatggcgt ggaggtgcat aatgccaaga caaagccgcg ggaggagcag 2280
ttcaacagca cgtaccgtgt ggtcagcgtc ctcaccgtcc tgcaccagga ctggctgaac 2340
ggcaaggagt acaagtgcaa ggtctccaac aaaggcctcc cgtcctccat cgagaaaacc 2400
atctccaaag ccaaagggca gccccgagag ccacaggtgt acaccctgcc cccatcccag 2460
gaggagatga ccaagaacca ggtcagcctg acctgcctgg tcaaaggctt ctaccccagc 2520
gacatcgccg tggagtggga gagcaatggg cagccggaga acaactacaa gaccacgcct 2580
cccgtgctgg actccgacgg ctccttcttc ctctacagca ggctcaccgt ggacaagagc 2640
aggtggcagg aggggaatgt cttctcatgc tccgtgatgc atgaggctct gcacaaccac 2700
tacacacaga agtccctctc cctgtctctg ggtaaatgag cggccgctaa tcagccatac 2760
cacatttgta gaggttttac ttgctttaaa aaacctccca cacctccccc tgaacctgaa 2820
acataaaatg aatgcaattg ttgttgttaa cttgtttatt gcagcttata atggttacaa 2880
ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc attctagttg 2940
tggtttgtcc aaactcatca atgtatctta tcatgtc 2977
<210> 40
<211> 7019
<212> DNA
<213> Artificial
<220>
<223> Synthetic plasmid
<400> 40
tcgcgatgtg tgactagtta gttattaata gtaatcaatt acggggtcat tagttcatag 60
cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 120
caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 180
gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 240
tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 300
ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 360
attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata 420
gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt 480
ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca 540
aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agagctcatg atagaagcac 600
tctactattc gtcgaccgat cctgagaact tcagggtgag tttggggacc cttgattgtt 660
ctttcttttt cgctattgta aaattcatgt tatatggagg gggcaaagtt ttcagggtgt 720
tgtttagaat gggaagatgt cccttgtatc accatggacc ctcatgataa ttttgtttct 780
ttcactttct actctgttga caaccattgt ctcctcttat tttcttttca ttttctgtaa 840
ctttttcgtt aaactttagc ttgcatttgt aacgaatttt taaattcact tttgtttatt 900
tgtcagattg taagtacttt ctctaatcac ttttttttca aggcaatcag ggtatattat 960
attgtacttc agcacagttt tagagaacaa ttgttataat taaatgataa ggtagaatat 1020
ttctgcatat aaattctggc tggcgtggaa atattcttat tggtagaaac aactacaccc 1080
tggtcatcat cctgcctttc tctttatggt tacaatgata tacactgttt gagatgagga 1140
taaaatactc tgagtccaaa ccgggcccct ctgctaacca tgttcatgcc ttcttctctt 1200
tcctacagct cctgggcaac gtgctggttg ttgtgctgtc tcatcatttt ggcaaagaat 1260
taagcttata ctcgagctct agattgggaa cccgggtctc tcgaattcga gatctccacc 1320
atgcacagac ctagacgtcg tggaactcgt ccacctccac tggcactgct cgctgctctc 1380
ctcctggctg cacgtggtgc tgatgcacag gtacagctgc agcagtcggg cgcaggactg 1440
ttgaagcctt cggagaccct gtccctcacc tgcactgtct atggtggatc cttcagtatt 1500
catcactgga cctggatccg ccatccccca gggaaggggc tggagtggat tggggagatc 1560
aatcatcgtg gaagcaccaa ctacaacccg tccctcaaga gtcgagtcac catatcaata 1620
gacacgtcca agaaccagtt ctccctgaag ctgagcgctg tgaccgccgc ggacacggct 1680
gtatattact gtgcgagagg cttacgattt ttggactggt tatcgtccta ctttgactac 1740
tggggccagg gaaccctggt caccgtctcc tcagcctcca ccaagggccc atcggtcttc 1800
cccctggcgc cctgctccag gagcacctcc gagagcacag ccgccctggg ctgcctggtc 1860
aaggactact tccccgaacc ggtgacggtg tcgtggaact caggcgccct gaccagcggc 1920
gtgcacacct tcccggctgt cctacagtcc tcaggactct actccctcag cagcgtggtg 1980
accgtgccct ccagcagctt gggcacgaag acctacacct gcaacgtaga tcacaagccc 2040
agcaacacca aggtggacaa gagagttgag tccaaatatg gtcccccatg cccaccctgc 2100
ccagcacctg agttcctggg gggaccatca gtcttcctgt tccccccaaa acccaaggac 2160
actctcatga tctcccggac ccctgaggtc acgtgcgtgg tggtggacgt gagccaggaa 2220
gaccccgagg tccagttcaa ctggtacgtg gatggcgtgg aggtgcataa tgccaagaca 2280
aagccgcggg aggagcagtt caacagcacg taccgtgtgg tcagcgtcct caccgtcctg 2340
caccaggact ggctgaacgg caaggagtac aagtgcaagg tctccaacaa aggcctcccg 2400
tcctccatcg agaaaaccat ctccaaagcc aaagggcagc cccgagagcc acaggtgtac 2460
accctgcccc catcccagga ggagatgacc aagaaccagg tcagcctgac ctgcctggtc 2520
aaaggcttct accccagcga catcgccgtg gagtgggaga gcaatgggca gccggagaac 2580
aactacaaga ccacgcctcc cgtgctggac tccgacggct ccttcttcct ctacagcagg 2640
ctcaccgtgg acaagagcag gtggcaggag gggaatgtct tctcatgctc cgtgatgcat 2700
gaggctctgc acaaccacta cacacagaag tccctctccc tgtctctggg taaatgagcg 2760
gccgctaatc agccatacca catttgtaga ggttttactt gctttaaaaa acctcccaca 2820
cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc 2880
agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 2940
ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctaccg 3000
gtcctgcagg gcccctctct tcatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 3060
aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 3120
tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 3180
ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 3240
cgcctttctc ccttcgggaa gcgtggcgct ttctcaatgc tcacgctgta ggtatctcag 3300
ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 3360
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 3420
gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 3480
agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg 3540
cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 3600
aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 3660
aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 3720
ctcacgttaa gggattttgg tcatgggcgc gcctcatact cctgcaggca tgagattatc 3780
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 3840
tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 3900
agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 3960
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 4020
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 4080
tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 4140
tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 4200
acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 4260
atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 4320
aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 4380
tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 4440
agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 4500
gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 4560
ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 4620
atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 4680
tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 4740
tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 4800
tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 4860
cgtcaggtac caagcctagg cctccaaaaa agcctcctca ctacttctgg aatagctcag 4920
aggcagaggc ggcctcggcc tctgcataaa taaaaaaaat tagtcagcca tggggcggag 4980
aatgggcgga actgggcgga gttaggggcg ggatgggcgg agttaggggc gggactatgg 5040
ttgctgacta attgagatgc atgctttgca tacttctgcc tgctggggag cctggggact 5100
ttccacacct ggttgctgac taattgagat gcatgctttg catacttctg cctgctgggg 5160
agcctgggga ctttccacac cggatccacc atggatagat ccggaaagcc tgaactcacc 5220
gcgacgtctg tcgagaagtt tctgatcgaa aagttcgaca gcgtctccga cctgatgcag 5280
ctctcggagg gcgaagaatc tcgtgctttc agcttcgatg taggagggcg tggatatgtc 5340
ctgcgggtaa atagctgcgc cgatggtttc tacaaagatc gttatgttta tcggcacttt 5400
gcatcggccg cgctcccgat tccggaagtg cttgacattg gggagttcag cgagagcctg 5460
acctattgca tctcccgccg tgcacagggt gtcacgttgc aagacctgcc tgaaaccgaa 5520
ctgcccgctg ttctgcagcc ggtcgcggag gccatggatg cgatcgctgc ggccgatctt 5580
agccagacga gcgggttcgg cccattcgga ccgcaaggaa tcggtcaata cactacatgg 5640
cgtgatttca tatgcgcgat tgctgatccc catgtgtatc actggcaaac tgtgatggac 5700
gacaccgtca gtgcgtccgt cgcgcaggct ctcgatgagc tgatgctttg ggccgaggac 5760
tgccccgaag tccggcacct cgtgcacgcg gatttcggct ccaacaatgt cctgacggac 5820
aatggccgca taacagcggt cattgactgg agcgaggcga tgttcgggga ttcccaatac 5880
gaggtcgcca acatcttctt ctggaggccg tggttggctt gtatggagca gcagacgcgc 5940
tacttcgagc ggaggcatcc ggagcttgca ggatcgccgc ggctccgggc gtatatgctc 6000
cgcattggtc ttgaccaact ctatcagagc ttggttgacg gcaatttcga tgatgcagct 6060
tgggcgcagg gtcgatgcga cgcaatcgtc cgatccggag ccgggactgt cgggcgtaca 6120
caaatcgccc gcagaagcgc ggccgtctgg accgatggct gtgtagaagt actcgccgat 6180
agtggaaacc gacgccccag cactcgtccg agggcaaagg aatagacgcg tgctgtaagt 6240
ctgcagaaat tgatgatcta ttaaacaata aagatgtcca ctaaaatgga agtttttcct 6300
gtcatacttt gttaagaagg gtgagaacag agtacctaca ttttgaatgg aaggattgga 6360
gctacggggg tgggggtggg gtgggattag ataaatgcct gctctttact gaaggctctt 6420
tactattgct ttatgataat gtttcatagt tggatatcat aatttaaaca agcaaaacca 6480
aattaagggc cagctcattc ctcccactca tgatctatgg atctatagat ctctcgtgca 6540
gctggggctc tagggggtat ccccacgcgc cctgtagcgg cgcattaagc gcggcgggtg 6600
tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg 6660
ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg 6720
ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt 6780
agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt 6840
tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta 6900
tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa 6960
atgagctgat ttaacaaaaa tttaacgcga attaattctg tggaatgtgt gtcagttag 7019
<210> 41
<211> 2272
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 41
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600
atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660
taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720
gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780
gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840
gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900
ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960
tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020
gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080
tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140
aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200
acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260
ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320
cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380
gctgatgcag acatccagat gacccagtct ccatcctccc tgtctgcatc tgtaggagac 1440
agagtcacca tcacttgccg ggcgagtcag ggcattagcg attatttagc ctggtatcag 1500
cagaaaccag ggaaagttcc taacctcctg atctatgctg cgtccgcttt acaatcaggg 1560
gtcccatctc gtttcagtgg cagtggatct gggacagatt tcactctcac catcagcagc 1620
ctgcagcctg aggatgttgc aacttattac tgtcaaaatt ataacactgc cccgctcact 1680
ttcggcgggg ggaccaaggt ggaaatcaaa cgaactgtgg ctgcaccatc tgtcttcatc 1740
ttcccgccat ctgatgagca gttgaaatct ggaactgcct ctgttgtgtg cctgctgaat 1800
aacttctatc ccagagaggc caaagtacag tggaaggtgg ataacgccct ccaatcgggt 1860
aactcccagg agagtgtcac agagcaggac agcaaggaca gcacctacag cctcagcagc 1920
accctgacgc tgagcaaagc agactacgag aaacacaaag tctacgcctg cgaagtcacc 1980
catcagggcc tgagctcgcc cgtcacaaag agcttcaaca ggggagagtg ttaggcggcc 2040
gctaatcagc cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct 2100
ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc 2160
ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 2220
actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tc 2272
<210> 42
<211> 6335
<212> DNA
<213> Artificial
<220>
<223> Synthetic plasmid
<400> 42
tcgagctcta gattgggaac ccgggtctct cgaattcgag atctccacca tgcacagacc 60
tagacgtcgt ggaactcgtc cacctccact ggcactgctc gctgctctcc tcctggctgc 120
acgtggtgct gatgcagaca tccagatgac ccagtctcca tcctccctgt ctgcatctgt 180
aggagacaga gtcaccatca cttgccgggc gagtcagggc attagcgatt atttagcctg 240
gtatcagcag aaaccaggga aagttcctaa cctcctgatc tatgctgcgt ccgctttaca 300
atcaggggtc ccatctcgtt tcagtggcag tggatctggg acagatttca ctctcaccat 360
cagcagcctg cagcctgagg atgttgcaac ttattactgt caaaattata acactgcccc 420
gctcactttc ggcgggggga ccaaggtgga aatcaaacga actgtggctg caccatctgt 480
cttcatcttc ccgccatctg atgagcagtt gaaatctgga actgcctctg ttgtgtgcct 540
gctgaataac ttctatccca gagaggccaa agtacagtgg aaggtggata acgccctcca 600
atcgggtaac tcccaggaga gtgtcacaga gcaggacagc aaggacagca cctacagcct 660
cagcagcacc ctgacgctga gcaaagcaga ctacgagaaa cacaaagtct acgcctgcga 720
agtcacccat cagggcctga gctcgcccgt cacaaagagc ttcaacaggg gagagtgtta 780
ggcggccgct aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc 840
cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta 900
ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 960
ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 1020
accggtaggg cccctctctt catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 1080
aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 1140
cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 1200
cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 1260
gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag gtatctcagt 1320
tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 1380
cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 1440
ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 1500
gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc 1560
gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 1620
accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 1680
ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 1740
tcacgttaag ggattttggt catgggcgcg ggcatgagat tatcaaaaag gatcttcacc 1800
tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 1860
tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 1920
cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta 1980
ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta 2040
tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc 2100
gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat 2160
agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt 2220
atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg 2280
tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca 2340
gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta 2400
agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg 2460
cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact 2520
ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg 2580
ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt 2640
actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga 2700
ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc 2760
atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa 2820
caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcag gtacacttag 2880
gcgcgccatt agagttcctg caggctacat ggtaccaagc ctaggcctcc aaaaaagcct 2940
cctcactact tctggaatag ctcagaggca gaggcggcct cggcctctgc ataaataaaa 3000
aaaattagtc agccatgggg cggagaatgg gcggaactgg gcggagttag gggcgggatg 3060
ggcggagtta ggggcgggac tatggttgct gactaattga gatgcatgct ttgcatactt 3120
ctgcctgctg gggagcctgg ggactttcca cacctggttg ctgactaatt gagatgcatg 3180
ctttgcatac ttctgcctgc tggggagcct ggggactttc cacaccggat ccaccatgga 3240
tagatccgga aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt 3300
cgacagcgtc tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt 3360
cgatgtagga gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa 3420
agatcgttat gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga 3480
cattggggag ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac 3540
gttgcaagac ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat 3600
ggatgcgatc gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca 3660
aggaatcggt caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt 3720
gtatcactgg caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga 3780
tgagctgatg ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt 3840
cggctccaac aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga 3900
ggcgatgttc ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt 3960
ggcttgtatg gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc 4020
gccgcggctc cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt 4080
tgacggcaat ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc 4140
cggagccggg actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga 4200
tggctgtgta gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc 4260
aaaggaatag acgcgtgctg taagtctgca gaaattgatg atctattaaa caataaagat 4320
gtccactaaa atggaagttt ttcctgtcat actttgttaa gaagggtgag aacagagtac 4380
ctacattttg aatggaagga ttggagctac gggggtgggg gtggggtggg attagataaa 4440
tgcctgctct ttactgaagg ctctttacta ttgctttatg ataatgtttc atagttggat 4500
atcataattt aaacaagcaa aaccaaatta agggccagct cattcctccc actcatgatc 4560
tatggatcta tagatctctc gtgcagctgg ggctctaggg ggtatcccca cgcgccctgt 4620
agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc 4680
agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc 4740
tttccccgtc aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg 4800
cacctcgacc ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga 4860
tagacggttt ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc 4920
caaactggaa caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg 4980
ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaattaa 5040
ttctgtggaa tgtgtgtcag ttagtcgcga tgtgtgacta gttagttatt aatagtaatc 5100
aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt 5160
aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta 5220
tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg 5280
gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga 5340
cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt 5400
tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg 5460
gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc 5520
cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg 5580
taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat 5640
aagcagagct catgatagaa gcactctact attcgtcgac cgatcctgag aacttcaggg 5700
tgagtttggg gacccttgat tgttctttct ttttcgctat tgtaaaattc atgttatatg 5760
gagggggcaa agttttcagg gtgttgttta gaatgggaag atgtcccttg tatcaccatg 5820
gaccctcatg ataattttgt ttctttcact ttctactctg ttgacaacca ttgtctcctc 5880
ttattttctt ttcattttct gtaacttttt cgttaaactt tagcttgcat ttgtaacgaa 5940
tttttaaatt cacttttgtt tatttgtcag attgtaagta ctttctctaa tcactttttt 6000
ttcaaggcaa tcagggtata ttatattgta cttcagcaca gttttagaga acaattgtta 6060
taattaaatg ataaggtaga atatttctgc atataaattc tggctggcgt ggaaatattc 6120
ttattggtag aaacaactac accctggtca tcatcctgcc tttctcttta tggttacaat 6180
gatatacact gtttgagatg aggataaaat actctgagtc caaaccgggc ccctctgcta 6240
accatgttca tgccttcttc tctttcctac agctcctggg caacgtgctg gttgttgtgc 6300
tgtctcatca ttttggcaaa gaattaagct tatac 6335
<210> 43
<211> 115
<212> PRT
<213> Artificial
<220>
<223> consensus sequence
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (28)..(28)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (30)..(30)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (34)..(35)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (93)..(93)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (93)..(93)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (96)..(96)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (100)..(100)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (111)..(111)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (114)..(114)
<223> Xaa can be any naturally occurring amino acid
<400> 43
Xaa Asp Val Trp Gly Gln Gly Thr Thr Val Xaa Val Ser Ser Ala Ser
1 5 10 15
Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Xaa Ser Xaa Ser Thr
20 25 30
Ser Xaa Xaa Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro
35 40 45
Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val
50 55 60
His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser
65 70 75 80
Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Xaa Thr Tyr Xaa
85 90 95
Cys Asn Val Xaa His Lys Pro Ser Asn Thr Lys Val Asp Lys Xaa Val
100 105 110
Glu Xaa Lys
115
<210> 44
<211> 225
<212> PRT
<213> Artificial
<220>
<223> consensus sequence
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (47)..(47)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (53)..(53)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (75)..(75)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (106)..(106)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (109)..(110)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (134)..(135)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (137)..(137)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (188)..(188)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (198)..(198)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (224)..(224)
<223> Xaa can be any naturally occurring amino acid
<400> 44
Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Xaa Leu Gly Gly
1 5 10 15
Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile
20 25 30
Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Xaa Glu
35 40 45
Asp Pro Glu Val Xaa Phe Asn Trp Tyr Val Asp Gly Val Glu Val His
50 55 60
Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Xaa Asn Ser Thr Tyr Arg
65 70 75 80
Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys
85 90 95
Glu Tyr Lys Cys Lys Val Ser Asn Lys Xaa Leu Pro Xaa Xaa Ile Glu
100 105 110
Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr
115 120 125
Thr Leu Pro Pro Ser Xaa Xaa Glu Xaa Thr Lys Asn Gln Val Ser Leu
130 135 140
Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp
145 150 155 160
Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val
165 170 175
Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Xaa Leu Thr Val Asp
180 185 190
Lys Ser Arg Trp Gln Xaa Gly Asn Val Phe Ser Cys Ser Val Met His
195 200 205
Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Xaa
210 215 220
Gly
225
<210> 45
<211> 60
<212> PRT
<213> Artificial
<220>
<223> consensus sequence
<220>
<221> MISC_FEATURE
<222> (13)..(14)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (16)..(16)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (21)..(22)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (24)..(27)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (31)..(31)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (34)..(34)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (48)..(48)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (50)..(50)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (54)..(54)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (56)..(56)
<223> Xaa can be any naturally occurring amino acid
<400> 45
Ser Asp Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Xaa Xaa Pro Xaa
1 5 10 15
Leu Leu Ile Tyr Xaa Xaa Ser Xaa Xaa Xaa Xaa Gly Val Pro Xaa Arg
20 25 30
Phe Xaa Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Xaa
35 40 45
Leu Xaa Pro Glu Asp Xaa Ala Xaa Tyr Tyr Cys Gln
50 55 60
<210> 46
<211> 118
<212> PRT
<213> Artificial
<220>
<223> consensus sequence
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa can be any naturally occurring amino acid
<400> 46
Thr Phe Gly Xaa Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala
1 5 10 15
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
20 25 30
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
35 40 45
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
50 55 60
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
65 70 75 80
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
85 90 95
Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser
100 105 110
Phe Asn Arg Gly Glu Cys
115