IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ クリスタル バイオテック インコーポレイテッドの特許一覧

特開2024-63082皮膚疾患の治療のための組成物及び方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024063082
(43)【公開日】2024-05-10
(54)【発明の名称】皮膚疾患の治療のための組成物及び方法
(51)【国際特許分類】
   C12N 15/38 20060101AFI20240501BHJP
   C12N 15/12 20060101ALI20240501BHJP
   C12N 7/01 20060101ALI20240501BHJP
   C12N 15/869 20060101ALI20240501BHJP
   C12N 7/04 20060101ALI20240501BHJP
   C12N 5/10 20060101ALI20240501BHJP
   C12N 5/071 20100101ALI20240501BHJP
   A61K 31/7088 20060101ALI20240501BHJP
   A61K 35/76 20150101ALI20240501BHJP
   A61K 9/72 20060101ALI20240501BHJP
   A61K 47/38 20060101ALI20240501BHJP
   A61K 47/02 20060101ALI20240501BHJP
   A61K 47/10 20170101ALI20240501BHJP
   A61P 43/00 20060101ALI20240501BHJP
   A61P 17/00 20060101ALI20240501BHJP
   A61P 17/02 20060101ALI20240501BHJP
   A61P 1/02 20060101ALI20240501BHJP
   A61P 17/14 20060101ALI20240501BHJP
   A61P 11/00 20060101ALI20240501BHJP
   A61K 9/51 20060101ALI20240501BHJP
   A61P 7/06 20060101ALI20240501BHJP
【FI】
C12N15/38 ZNA
C12N15/12
C12N7/01
C12N15/869 Z
C12N7/04
C12N5/10
C12N5/071
A61K31/7088
A61K35/76
A61K9/72
A61K47/38
A61K47/02
A61K47/10
A61P43/00 105
A61P17/00
A61P17/02
A61P1/02
A61P17/14
A61P11/00
A61K9/51
A61P7/06
【審査請求】有
【請求項の数】19
【出願形態】OL
(21)【出願番号】P 2024027283
(22)【出願日】2024-02-27
(62)【分割の表示】P 2021516991の分割
【原出願日】2019-09-25
(31)【優先権主張番号】62/737,009
(32)【優先日】2018-09-26
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/744,531
(32)【優先日】2018-10-11
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】520417056
【氏名又は名称】クリスタル バイオテック インコーポレイテッド
(74)【代理人】
【識別番号】100102978
【弁理士】
【氏名又は名称】清水 初志
(74)【代理人】
【識別番号】100205707
【弁理士】
【氏名又は名称】小寺 秀紀
(74)【代理人】
【識別番号】100160923
【弁理士】
【氏名又は名称】山口 裕孝
(74)【代理人】
【識別番号】100119507
【弁理士】
【氏名又は名称】刑部 俊
(74)【代理人】
【識別番号】100142929
【弁理士】
【氏名又は名称】井上 隆一
(74)【代理人】
【識別番号】100148699
【弁理士】
【氏名又は名称】佐藤 利光
(74)【代理人】
【識別番号】100128048
【弁理士】
【氏名又は名称】新見 浩一
(74)【代理人】
【識別番号】100129506
【弁理士】
【氏名又は名称】小林 智彦
(74)【代理人】
【識別番号】100114340
【弁理士】
【氏名又は名称】大関 雅人
(74)【代理人】
【識別番号】100121072
【弁理士】
【氏名又は名称】川本 和弥
(72)【発明者】
【氏名】クリシュナン スマ
(72)【発明者】
【氏名】アガーワル プージャ
(72)【発明者】
【氏名】パリー トレバー
(57)【要約】      (修正有)
【課題】ラミニン欠乏症を治療するのに有用なウイルス、及び薬学的組成物を提供する。
【解決手段】ラミニンポリペプチド(例えば、ヒトラミニンポリペプチド)及び/またはフィラグリンポリペプチド(例えば、ヒトフィラグリンポリペプチド)をコードする1つ以上のポリヌクレオチドを含む組換え核酸、その組換え核酸を含むウイルス、その組換え核酸及び/またはウイルスを含む組成物及び製剤、それらの使用方法(例えば、接合部型表皮水疱症の治療のための)、ならびにそれらの製品またはキットを提供する。

【選択図】なし
【特許請求の範囲】
【請求項1】
ラミニンポリペプチドをコードする1つ以上のポリヌクレオチドを含む、組換えヘルペスウイルスゲノム。
【請求項2】
ラミニンポリペプチドをコードする2つ以上のポリヌクレオチドを含む、請求項1に記載の組換えヘルペスウイルスゲノム。
【請求項3】
複製可能である、請求項1または請求項2に記載の組換えヘルペスウイルスゲノム。
【請求項4】
複製欠損である、請求項1または請求項2に記載の組換えヘルペスウイルスゲノム。
【請求項5】
組換え単純ヘルペスウイルスゲノム、組換え水痘帯状疱疹ウイルスゲノム、組換えヒトサイトメガロウイルスゲノム、組換えヘルペスウイルス6Aゲノム、組換えヘルペスウイルス6Bゲノム、組換えヘルペスウイルス7ゲノム、組換えカポジ肉腫関連ヘルペスウイルスゲノム、及びそれらの任意の派生物からなる群から選択される、請求項1~4のいずれか1項に記載の組換えヘルペスウイルスゲノム。
【請求項6】
組換え単純ヘルペスウイルスゲノムである、請求項1~5のいずれか1項に記載の組換えヘルペスウイルスゲノム。
【請求項7】
前記組換え単純ヘルペスウイルスゲノムが、組換え単純ヘルペスウイルス1型(HSV-1)ゲノム、組換え単純ヘルペスウイルス2型(HSV-2)ゲノム、またはそれらの任意の派生物である、請求項6に記載の組換えヘルペスウイルスゲノム。
【請求項8】
前記組換え単純ヘルペスウイルスゲノムが組換えHSV-1ゲノムである、請求項6または請求項7に記載の組換えヘルペスウイルスゲノム。
【請求項9】
前記組換え単純ヘルペスウイルスゲノムが不活性化変異を含む、請求項6~8のいずれか1項に記載の組換えヘルペスウイルスゲノム。
【請求項10】
前記不活性化変異が単純ヘルペスウイルス遺伝子に存在する、請求項9に記載の組換えヘルペスウイルスゲノム。
【請求項11】
前記不活性化変異が、前記単純ヘルペスウイルス遺伝子のコード配列の一部または全部の欠失である、請求項10に記載の組換えヘルペスウイルスゲノム。
【請求項12】
前記単純ヘルペスウイルス遺伝子が、感染細胞タンパク質(ICP)0、ICP4、ICP22、ICP27、ICP47、チミジンキナーゼ(tk)、ロングユニーク領域(UL)41、及びUL55からなる群から選択される、請求項10または請求項11に記載の組換えヘルペスウイルスゲノム。
【請求項13】
前記組換え単純ヘルペスウイルスゲノムが、ICP4遺伝子の一方または両方のコピーに不活性化変異を含む、請求項12に記載の組換えヘルペスウイルスゲノム。
【請求項14】
前記組換え単純ヘルペスウイルスゲノムが、ICP22遺伝子に不活性化変異を含む、請求項12または請求項13に記載の組換えヘルペスウイルスゲノム。
【請求項15】
前記組換え単純ヘルペスウイルスゲノムが、UL41遺伝子に不活性化変異を含む、請求項12~14のいずれか1項に記載の組換えヘルペスウイルスゲノム。
【請求項16】
前記組換え単純ヘルペスウイルスゲノムが、ICP0遺伝子の一方または両方のコピーに不活性化変異を含む、請求項12~15のいずれか1項に記載の組換えヘルペスウイルスゲノム。
【請求項17】
前記組換え単純ヘルペスウイルスゲノムが、ICP27遺伝子に不活性化変異を含む、請求項12~16のいずれか1項に記載の組換えヘルペスウイルスゲノム。
【請求項18】
前記組換え単純ヘルペスウイルスゲノムが、ラミニンポリペプチドをコードする前記1つ以上のポリヌクレオチドを、1つ以上のウイルス遺伝子座に含む、請求項6~17のいずれか1項に記載の組換えヘルペスウイルスゲノム。
【請求項19】
前記ラミニンポリペプチドがヒトラミニン(Lam)ポリペプチドである、請求項1~18のいずれか1項に記載の組換えヘルペスウイルスゲノム。
【請求項20】
前記ヒトラミニン(Lam)ポリペプチドが、ヒトLamA1ポリペプチド、ヒトLamA2ポリペプチド、ヒトLamA3ポリペプチド、ヒトLamA4ポリペプチド、ヒトLamA5ポリペプチド、ヒトLamB1ポリペプチド、ヒトLamB2ポリペプチド、ヒトLamB3ポリペプチド、ヒトLamC1ポリペプチド、ヒトLamC2ポリペプチド、ヒトLamC3ポリペプチド、及びそれらの任意のキメラポリペプチドからなる群から選択される、請求項19に記載の組換えヘルペスウイルスゲノム。
【請求項21】
前記ヒトラミニン(Lam)ポリペプチドが、ヒトLamA3ポリペプチド、ヒトLamB3ポリペプチド、及びヒトLamC2ポリペプチドからなる群から選択される、請求項19または請求項20に記載の組換えヘルペスウイルスゲノム。
【請求項22】
前記ラミニンポリペプチドが、配列番号7~9または32~35からなる群から選択されるアミノ酸配列に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む、請求項1~21のいずれか1項に記載の組換えヘルペスウイルスゲノム。
【請求項23】
標的細胞に導入された場合に、対応する野生型ヘルペスウイルスゲノムと比較して減少した細胞毒性を有する、請求項1~22のいずれか1項に記載の組換えヘルペスウイルスゲノム。
【請求項24】
前記標的細胞がヒト細胞である、請求項23に記載の組換えヘルペスウイルスゲノム。
【請求項25】
前記標的細胞が表皮細胞及び/または真皮細胞である、請求項23または請求項24に記載の組換えヘルペスウイルスゲノム。
【請求項26】
前記標的細胞がケラチノサイトまたは線維芽細胞である、請求項23~25のいずれか1項に記載の組換えヘルペスウイルスゲノム。
【請求項27】
請求項1~26のいずれか1項に記載の組換えヘルペスウイルスゲノムを含む、ヘルペスウイルス。
【請求項28】
複製可能である、請求項27に記載のヘルペスウイルス。
【請求項29】
複製欠損である、請求項27に記載のヘルペスウイルス。
【請求項30】
対応する野生型ヘルペスウイルスと比較して減少した細胞毒性を有する、請求項27~29のいずれか1項に記載のヘルペスウイルス。
【請求項31】
単純ヘルペスウイルス、水痘帯状疱疹ウイルス、ヒトサイトメガロウイルス、ヘルペスウイルス6A、ヘルペスウイルス6B、ヘルペスウイルス7、カポジ肉腫関連ヘルペスウイルス、及びそれらの任意の派生物からなる群から選択される、請求項27~30のいずれか1項に記載のヘルペスウイルス。
【請求項32】
単純ヘルペスウイルスである、請求項27~31のいずれか1項に記載のヘルペスウイルス。
【請求項33】
前記単純ヘルペスウイルスが、HSV-1、HSV-2、またはそれらの任意の派生物である、請求項31または請求項32に記載のヘルペスウイルス。
【請求項34】
前記単純ヘルペスウイルスがHSV-1である、請求項31~33のいずれか1項に記載のヘルペスウイルス。
【請求項35】
請求項1~26のいずれか1項に記載の組換えヘルペスウイルスゲノムまたは請求項27~34のいずれか1項に記載のヘルペスウイルスと、薬学的に許容される賦形剤とを含む、薬学的組成物。
【請求項36】
局所、経皮、皮下、皮内、経口、舌下、口腔、直腸、膣内、吸入、静脈内、動脈内、筋肉内、心臓内、骨内、腹腔内、経粘膜、硝子体内、網膜下、関節内、関節周囲、局部、または皮膚上(epicutaneous)投与に好適である、請求項35に記載の薬学的組成物。
【請求項37】
局所、経皮、皮下、皮内、または経粘膜投与に好適である、請求項35または請求項36に記載の薬学的組成物。
【請求項38】
局所、経皮、または皮内投与に好適である、請求項35~37のいずれか1項に記載の薬学的組成物。
【請求項39】
局所投与に好適である、請求項35~38のいずれか1項に記載の薬学的組成物。
【請求項40】
皮内投与に好適である、請求項35~38のいずれか1項に記載の薬学的組成物。
【請求項41】
経口または吸入投与に好適である、請求項35または請求項36に記載の薬学的組成物。
【請求項42】
メチルセルロースゲルを含む、請求項35~41のいずれか1項に記載の薬学的組成物。
【請求項43】
リン酸緩衝液を含む、請求項35~42のいずれか1項に記載の薬学的組成物。
【請求項44】
グリセロールを含む、請求項35~43のいずれか1項に記載の薬学的組成物。
【請求項45】
脂質担体を含む、請求項35~44のいずれか1項に記載の薬学的組成物。
【請求項46】
ナノ粒子担体を含む、請求項35~45のいずれか1項に記載の薬学的組成物。
【請求項47】
薬剤としての使用のための、請求項27~34のいずれか1項に記載のヘルペスウイルスまたは請求項35~46のいずれか1項に記載の薬学的組成物。
【請求項48】
療法における使用のための、請求項27~34のいずれか1項に記載のヘルペスウイルスまたは請求項35~46のいずれか1項に記載の薬学的組成物。
【請求項49】
接合部型表皮水疱症の1つ以上の兆候または症状を治療するための薬剤の製造における、請求項27~34のいずれか1項に記載のヘルペスウイルスまたは請求項35~46のいずれか1項に記載の薬学的組成物の、使用。
【請求項50】
対象の1つ以上の細胞におけるラミニンポリペプチドレベルを強化する、増加させる、増強する、及び/または補充する方法であって、前記対象に、請求項27~34のいずれか1項に記載のヘルペスウイルスまたは請求項35~46のいずれか1項に記載の薬学的組成物の有効量を投与することを含む、前記方法。
【請求項51】
対象の皮膚における1つ以上の細胞の細胞接着を強化する、増加させる、増強する、及び/または補充する方法であって、前記対象に、請求項27~34のいずれか1項に記載のヘルペスウイルスまたは請求項35~46のいずれか1項に記載の薬学的組成物の有効量を投与することを含む、前記方法。
【請求項52】
前記細胞接着がインテグリン媒介性細胞接着である、請求項51に記載の方法。
【請求項53】
対象の透明帯を強化する、増加させる、増強する、及び/または補充する方法であって、前記対象に、請求項27~34のいずれか1項に記載のヘルペスウイルスまたは請求項35~46のいずれか1項に記載の薬学的組成物の有効量を投与することを含む、前記方法。
【請求項54】
対象の上皮基底膜集合、上皮基底膜組織化、及び/または上皮基底接着を強化する、増加させる、増強する、及び/または補充する方法であって、前記対象に、請求項27~34のいずれか1項に記載のヘルペスウイルスまたは請求項35~46のいずれか1項に記載の薬学的組成物の有効量を投与することを含む、前記方法。
【請求項55】
その必要がある対象において接合部型表皮水疱症(JEB)の1つ以上の兆候または症状に対する予防的、姑息的、または治療的緩和を提供する方法であって、前記対象に、請求項27~34のいずれか1項に記載のヘルペスウイルスまたは請求項35~46のいずれか1項に記載の薬学的組成物の有効量を投与することを含む、前記方法。
【請求項56】
JEBの前記1つ以上の兆候または症状が、皮膚の水疱形成、創傷形成、及び/または瘢痕化、肉芽組織、皮膚びらん、手指の爪及び/または足指の爪の変形、手指及び/または足指の癒着、皮膚のひきつれ及び/または菲薄化、拘縮、粘膜の水疱形成及び/または瘢痕化、呼吸困難、ホースクライ(horse cry)、感染症に対する易罹患性の増加、脱水症、体液喪失、電解質不均衡、胃腸管及び/または胃尿管(gastrourinary tract)の水疱形成及び/または瘢痕化、虫歯及び/またはエナメル質形成不全、抜け毛、栄養失調、発育遅延、貧血症、ならびにそれらの任意の組み合わせからなる群から選択される、請求項55に記載の方法。
【請求項57】
前記対象がヒトである、請求項50~56のいずれか1項に記載の方法。
【請求項58】
前記対象のゲノムが、ラミニン遺伝子に機能喪失変異を含む、請求項50~57のいずれか1項に記載の方法。
【請求項59】
前記ヘルペスウイルスまたは前記薬学的組成物が、前記対象に、局所、経皮、皮下、皮膚上、皮内、経口、舌下、口腔、直腸、膣内、静脈内、動脈内、筋肉内、骨内、心臓内、腹腔内、経粘膜、硝子体内、網膜下、関節内、関節周囲、局部投与、または吸入により投与される、請求項50~58のいずれか1項に記載の方法。
【請求項60】
前記ヘルペスウイルスまたは前記薬学的組成物が、前記対象に、局所、経皮、皮下、皮内、または経粘膜投与される、請求項50~59のいずれか1項に記載の方法。
【請求項61】
前記ヘルペスウイルスまたは前記薬学的組成物が、前記対象に、局所、経皮、または皮内投与される、請求項50~60のいずれか1項に記載の方法。
【請求項62】
前記ヘルペスウイルスまたは前記薬学的組成物が、前記対象に局所投与される、請求項50~61のいずれか1項に記載の方法。
【請求項63】
前記ヘルペスウイルスまたは前記薬学的組成物が、前記対象に皮内投与される、請求項50~61のいずれか1項に記載の方法。
【請求項64】
前記対象の皮膚が、投与前に擦過される、請求項50~63のいずれか1項に記載の方法。
【請求項65】
前記ヘルペスウイルスまたは前記薬学的組成物が、経口投与または吸入により投与される、請求項50~59のいずれか1項に記載の方法。
【請求項66】
フィラグリンポリペプチドをコードする1つ以上のポリヌクレオチドを含む、組換えヘルペスウイルスゲノム。
【請求項67】
前記フィラグリンポリペプチドがヒトフィラグリンポリペプチドである、請求項66に記載の組換えヘルペスウイルスゲノム。
【請求項68】
前記フィラグリンポリペプチドがヒトフィラグリンポリペプチドまたはヒトフィラグリン-2ポリペプチドである、請求項66または請求項67に記載の組換えヘルペスウイルスゲノム。
【請求項69】
前記フィラグリンポリペプチドが、配列番号39~50からなる群から選択されるアミノ酸配列に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む、請求項66~68のいずれか1項に記載の組換えヘルペスウイルスゲノム。
【請求項70】
請求項66~69のいずれか1項に記載の組換えヘルペスウイルスゲノムを含む、ヘルペスウイルス。
【請求項71】
請求項66~69のいずれか1項に記載の組換えヘルペスウイルスゲノムまたは請求項70に記載のヘルペスウイルスと、薬学的に許容される賦形剤とを含む、薬学的組成物。
【請求項72】
その必要がある対象において皮膚疾患の1つ以上の兆候または症状の予防的、姑息的、または治療的緩和を提供する方法であって、前記対象に、請求項70に記載のヘルペスウイルスまたは請求項71に記載の薬学的組成物の有効量を投与することを含む、前記方法。
【請求項73】
前記皮膚疾患が、アトピー性皮膚炎、尋常性魚鱗癬、及び皮膚剥離症候群からなる群から選択される、請求項72に記載の方法。
【請求項74】
薬剤としての使用のための、請求項70に記載のヘルペスウイルスまたは請求項71に記載の薬学的組成物。
【請求項75】
療法における使用のための、請求項70に記載のヘルペスウイルスまたは請求項71に記載の薬学的組成物。
【請求項76】
アトピー性皮膚炎、尋常性魚鱗癬、及び/または皮膚剥離症候群の1つ以上の兆候または症状を治療するための薬剤の製造における、請求項70に記載のヘルペスウイルスまたは請求項71に記載の薬学的組成物の、使用。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、各々参照により全体が本明細書に組み込まれる、2018年9月26日に出願された米国仮出願第62/737,009号及び2018年10月11日に出願された米国仮出願第62/744,531号の優先権の利益を主張する。
【0002】
ASCIIテキストファイルでの配列表の提出
ASCIIテキストファイルでの以下の提出物の内容は、参照によりその全体が本明細書に組み込まれる:配列表のコンピュータ可読形式(CRF)(ファイル名:761342000940SEQLIST.txt、記録日:2019年9月23日、サイズ:376KB)。
【0003】
発明の分野
本開示は、部分的には、ラミニンポリペプチド(例えば、ヒトラミニンポリペプチド)及び/またはフィラグリンポリペプチド(例えば、ヒトフィラグリンポリペプチド)をコードする1つ以上のポリヌクレオチドを含む組換え核酸、それを含むウイルス、その薬学的組成物、製剤、及び薬剤、ならびにその使用方法(例えば、接合部型表皮水疱症の治療のための)に関する。
【背景技術】
【0004】
背景
接合部型表皮水疱症(JEB)は、皮膚を非常に脆弱にする遺伝性状態の一群である表皮水疱症の主要な形態の1つである。JEBに罹患している個体において、皮膚及び粘膜に水疱が形成され、軽度の損傷または摩擦に応答してびらんを起こす。この疾患は、典型的には、2つの主なタイプ:接合部型ヘルリッツ表皮水疱症(JEB-H)及び接合部型非ヘルリッツ表皮水疱症(JEB-nH)に分類される。JEB-Hは、JEBのより重度の形態であり、多くの場合、抗し難い感染症、栄養失調、電解質不均衡、または呼吸器、胃腸管、もしくは尿生殖路の水疱形成に起因する合併症により、乳児期の死亡に至る。JEB-nHは、重症度が低く、出生時または出生直後に明らかになり得る全身性水疱及び粘膜の関与を特徴とする。これらのタイプの重症度が異なるが、それらの特徴は著しく重複しており、同じ遺伝子(複数可)の根底にある変異によって引き起こされる可能性がある。
【0005】
ラミニンは、3つのジスルフィド結合ポリペプチド、α鎖、β鎖、及びγ鎖の集合によって構成されるより高分子量の糖タンパク質である。ヒトゲノムは11個の遺伝的に異なるラミニン鎖をコードし、ラミニンファミリーの様々なメンバーは共通機能及び固有機能の両方を有する。具体的には、ラミニンは、基底膜のアーキテクチャ及び生理学を決定するのみならず、細胞内区画と細胞外区画を物理的に架橋し、かつ細胞挙動に重要なシグナルを伝えることによって細胞ネットワークにおいて中心的役割も果たす、細胞外ポリマーの不可欠な構成要素である。
【0006】
JEBは、ヒトラミニン遺伝子LAMA3、LAMB3、またはLAMC2の変異に起因するが、LAMB3変異が最も一般的であり、全てのJEB症例の80%超を引き起こす。LAMA3、LAMB3、及びLAMC2の遺伝子産物は各々、ラミニン332と呼ばれるタンパク質巨大分子のサブユニットであり、これは、皮膚(表皮)の上層を下層に付着させるのを助けることによって皮膚を強化する及び安定化する際に重要な役割を果たす。ラミニン332のサブユニットをコードする3つの遺伝子のうちのいずれかにおける変異は、このタンパク質巨大分子の欠損バリアントまたは非機能的バリアントの産生をもたらし、表皮内の細胞が脆弱になり、容易に損傷され、摩擦または他の軽度の外傷後に皮膚層が分離する原因となる。
【0007】
JEBの管理は、生涯にわたる努力である。残念ながら、JEBの分子的原因を標的とする利用可能なFDA承認の療法は存在せず、JEB患者の治療選択肢は限定されている。疼痛及び掻痒を制御するための薬剤の提供、皮膚及び粘膜上の開放創に起因する感染症を防ぐための抗生物質の投与、ならびに瘢痕化及び変形に対処するための外科的戦略を含む疾患管理は、通常、対症的である。したがって、この感受性患者集団において観察されるラミニンタンパク質の欠乏に対処することができるJEBのための新規の低侵襲的または非侵襲的治療選択肢が明らかに必要とされている。
【0008】
特許出願、特許刊行物、非特許文献、及びNCBI/UniProtKB/Swiss-Prot受入番号を含む本明細書で引用される全ての参考文献は、個々の参考文献が各々参照により組み込まれると明確かつ個別に示されるかのように、参照によりそれらの全体が本明細書に組み込まれる。
【発明の概要】
【0009】
簡単な概要
いくつかの実施形態では、これら及び他の必要性を満たすために、その必要がある対象においてラミニン欠乏症を治療するのに有用なウイルス(例えば、ヘルペスウイルス)、薬学的組成物及び製剤、薬剤、及び/または方法に使用するための、及び/またはラミニン関連障害を有するか、またはそれを発症するリスクのある個体を治療する(例えば、JEBの1つ以上の兆候または症状を有するか、またはそれを発症するリスクのある対象における皮膚の創傷、障害、または疾患の予防的、姑息的、または治療的緩和を提供する)ための、ラミニンポリペプチド(例えば、ヒトラミニンポリペプチド)をコードする組換え核酸(例えば、組換え単純ヘルペスウイルスゲノム)が本明細書に提供される。
【0010】
本発明人らは、本明細書に記載の組換えウイルスが、哺乳類細胞(ヒト皮膚細胞を含む)を効果的に形質導入することができ、かつそれらのコードされた外因性ヒトラミニン(mRNA及びタンパク質)を首尾よく発現することができたことを示した(例えば、実施例1を参照のこと)。さらに、本発明人らは、野生型バリアント及びコドン最適化バリアントの両方として複数の異なるラミニンタンパク質が本明細書に記載のウイルスによって送達され得ることを示した(例えば、実施例1を参照のこと)。さらに、本発明人らは、本明細書に記載のウイルスが、ラミニンタンパク質が皮膚の適切な領域に局在する関連性のあるラミニン欠損動物モデルにおいてインビボでヒトラミニンを発現するように首尾よく操作され得ることを示した(例えば、実施例2を参照のこと)。理論に拘束されることを望むことなく、本明細書に記載の組換え核酸、ウイルス、組成物、及び/または薬剤のうちの1つ以上を投与することによって、その必要がある対象の1つ以上の細胞におけるヒトラミニンレベルを増加させる、増強する、及び/または補充することにより、対象における機能的ラミニンの産生の増加が可能になるであろうと考えられる。加えて、理論に拘束されることを望むことなく、本明細書に記載の組換え核酸、ウイルス、組成物、及び/または薬剤のうちの1つ以上を投与することによって個体の1つ以上の細胞におけるヒトラミニンレベルを増加させる、増強する、及び/または補充することにより、治療された個体の皮膚における細胞接着の増加、透明帯の分離の減少、及び基底膜の安定化がもたらされるであろうとさらに考えられる。理論に拘束されることを望むことなく、本明細書に記載の組換え核酸、ウイルス、組成物、薬剤、及び方法が、ラミニン欠乏症(例えば、JEB)に罹患している個体における既存の皮膚異常の治療、ならびに治療された対象における創傷または他の皮膚もしくは粘膜異常の再形成の予防または遅延を助けるであろうと考えられる。
【0011】
したがって、本開示のある特定の態様は、ラミニンポリペプチドをコードする1つ以上のポリヌクレオチドを含む組換えヘルペスウイルスゲノムに関する。いくつかの実施形態では、組換えヘルペスウイルスゲノムは、ラミニンポリペプチドをコードする2つ以上のポリヌクレオチドを含む。いくつかの実施形態では、組換えヘルペスウイルスゲノムは、複製可能である。いくつかの実施形態では、組換えヘルペスウイルスゲノムは、複製欠損である。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、組換えヘルペスウイルスゲノムは、ラミニンポリペプチドをコードする1つ以上のポリヌクレオチドを、1つ以上のウイルス遺伝子座内に含む。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、組換えヘルペスウイルスゲノムは、組換え単純ヘルペスウイルスゲノム、組換え水痘帯状疱疹ウイルスゲノム、組換えヒトサイトメガロウイルスゲノム、組換えヘルペスウイルス6Aゲノム、組換えヘルペスウイルス6Bゲノム、組換えヘルペスウイルス7ゲノム、組換えカポジ肉腫関連ヘルペスウイルスゲノム、及びそれらの任意の組み合わせまたは派生物から選択される。
【0012】
前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、組換えヘルペスウイルスゲノムは、組換え単純ヘルペスウイルスゲノムである。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、組換え単純ヘルペスウイルス1型(HSV-1)ゲノム、組換え単純ヘルペスウイルス2型(HSV-2)ゲノム、またはそれらの任意の派生物である。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、組換えHSV-1ゲノムである。
【0013】
前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、不活性化変異を含む。いくつかの実施形態では、不活性化変異は、単純ヘルペスウイルス遺伝子に存在する。いくつかの実施形態では、不活性化変異は、単純ヘルペスウイルス遺伝子のコード配列の欠失である。いくつかの実施形態では、単純ヘルペスウイルス遺伝子は、感染細胞タンパク質(ICP)0(一方または両方のコピー)、ICP4(一方または両方のコピー)、ICP22、ICP27、ICP47、チミジンキナーゼ(tk)、ロングユニーク領域(UL)41、及びUL55から選択される。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP4遺伝子の一方または両方のコピーに不活性化変異を含む。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP22遺伝子に不活性化変異を含む。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、UL41遺伝子に不活性化変異を含む。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP0遺伝子の一方または両方のコピーに不活性化変異を含む。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP27遺伝子に不活性化変異を含む。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、UL55遺伝子に不活性化変異を含む。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、連結領域に不活性化変異を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、連結領域の欠失を含む。
【0014】
前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ラミニンポリペプチドをコードする1つ以上のポリヌクレオチドを、1つ以上のウイルス遺伝子座内に含む。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP4ウイルス遺伝子座の一方または両方内にラミニンポリペプチドをコードする1つ以上のポリヌクレオチドを含む。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP22ウイルス遺伝子座内にラミニンポリペプチドをコードする1つ以上のポリヌクレオチドを含む。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、UL41ウイルス遺伝子座内にラミニンポリペプチドをコードする1つ以上のポリヌクレオチドを含む。
【0015】
前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、ラミニンポリペプチドは、ヒトラミニンポリペプチドである。いくつかの実施形態では、ヒトラミニン(Lam)ポリペプチドは、ヒトLamA1ポリペプチド、ヒトLamA2ポリペプチド、ヒトLamA3ポリペプチド、ヒトLamA4ポリペプチド、ヒトLamA5ポリペプチド、ヒトLamB1ポリペプチド、ヒトLamB2ポリペプチド、ヒトLamB3ポリペプチド、ヒトLamC1ポリペプチド、ヒトLamC2ポリペプチド、ヒトLamC3ポリペプチド、及びそれらの任意のキメラポリペプチドから選択される。いくつかの実施形態では、ヒトラミニン(Lam)ポリペプチドは、ヒトLamA3ポリペプチド、ヒトLamB3ポリペプチド、及びヒトLamC2ポリペプチドから選択される。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、ラミニンポリペプチドは、配列番号7~9または32~35から選択されるアミノ酸配列に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、ラミニンポリペプチドは、配列番号7~9から選択されるアミノ酸配列に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。
【0016】
前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、組換えヘルペスウイルスゲノムは、標的細胞に導入された場合に、対応する野生型ヘルペスウイルスゲノムと比較して減少した細胞毒性を有する。いくつかの実施形態では、標的細胞は、ヒト細胞である。いくつかの実施形態では、標的細胞は、表皮細胞及び/または真皮細胞である。いくつかの実施形態では、標的細胞は、ケラチノサイトまたは線維芽細胞である。
【0017】
本開示の他の態様は、本明細書に記載の組換えヘルペスウイルスゲノムのうちのいずれかを含むヘルペスウイルスに関する。いくつかの実施形態では、ヘルペスウイルスは、複製可能である。いくつかの実施形態では、ヘルペスウイルスは、複製欠損である。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、ヘルペスウイルスは、対応する野生型ヘルペスウイルスと比較して減少した細胞毒性を有する。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、ヘルペスウイルスは、単純ヘルペスウイルス、水痘帯状疱疹ウイルス、ヒトサイトメガロウイルス、ヘルペスウイルス6A、ヘルペスウイルス6B、ヘルペスウイルス7、カポジ肉腫関連ヘルペスウイルス、及びそれらの任意の組み合わせまたは派生物から選択される。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、ヘルペスウイルスは、単純ヘルペスウイルスである。いくつかの実施形態では、単純ヘルペスウイルスは、HSV-1、HSV-2、またはそれらの任意の派生物である。いくつかの実施形態では、単純ヘルペスウイルスは、HSV-1である。
【0018】
本開示の他の態様は、本明細書に記載の組換えヘルペスウイルスゲノムのうちのいずれか及び/または本明細書に記載のヘルペスウイルスのうちのいずれかと、薬学的に許容される賦形剤とを含む薬学的組成物に関する。いくつかの実施形態では、薬学的組成物は、局所、経皮、皮下、皮内、経口、舌下、口腔、直腸、膣内、吸入、静脈内、動脈内、筋肉内、心臓内、骨内、腹腔内、経粘膜、硝子体内、網膜下、関節内、関節周囲、局部、皮膚上(epicutaneous)投与、またはそれらの任意の組み合わせに好適である。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、薬学的組成物は、局所、経皮、皮下、皮内、または経粘膜投与に好適である。いくつかの実施形態では、薬学的組成物は、局所、経皮、及び/または皮内投与に好適である。いくつかの実施形態では、薬学的組成物は、局所投与に好適である。いくつかの実施形態では、薬学的組成物は、皮内投与に好適である。いくつかの実施形態では、薬学的組成物は、経口または吸入投与に好適である。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、薬学的組成物は、メチルセルロースゲル(例えば、カルボキシメチルセルロースゲル、ヒドロキシプロピルメチルセルロースゲル等)を含む。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、薬学的組成物は、リン酸緩衝液を含む。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、薬学的組成物は、グリセロールを含む。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、薬学的組成物は、脂質担体を含む。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、薬学的組成物は、ナノ粒子担体を含む。
【0019】
本開示の他の態様は、本明細書に記載の組換え核酸、ヘルペスウイルス、及び/または薬学的組成物のうちのいずれかの薬剤としての使用に関する。
【0020】
本開示の他の態様は、本明細書に記載の組換え核酸、ヘルペスウイルス、及び/または薬学的組成物のうちのいずれかの療法における使用に関する。
【0021】
本開示の他の態様は、本明細書に記載の組換え核酸、ヘルペスウイルス、及び/または薬学的組成物のうちのいずれかの、(例えば、JEB患者における)ラミニン欠乏症の1つ以上の兆候または症状を治療するための薬剤の生産または製造における使用に関する。
【0022】
本開示の他の態様は、対象の1つ以上の細胞におけるラミニンポリペプチドレベルを強化する、増加させる、増強する、及び/または補充する方法であって、対象に、本明細書に記載のヘルペスウイルスのうちのいずれか及び/または本明細書に記載の薬学的組成物のうちのいずれかの有効量を投与することを含む、方法に関する。いくつかの実施形態では、対象は、ヒトである。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、対象のゲノムは、ラミニン遺伝子に機能喪失変異を含む。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、ヘルペスウイルス及び/または薬学的組成物は、対象に、局所、経皮、皮下、皮膚上、皮内、経口、舌下、口腔、直腸、膣内、静脈内、動脈内、筋肉内、骨内、心臓内、腹腔内、経粘膜、硝子体内、網膜下、関節内、関節周囲、局部投与、または吸入により投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に、局所、経皮、皮下、皮内、または経粘膜投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に、局所、経皮、皮下、または皮内投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に、局所、経皮、または皮内投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に局所投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に皮内投与される。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、対象の皮膚は、投与前に擦過される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、経口投与または吸入により投与される。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、ウイルス及び/または薬学的組成物は、1日1回、2回、3回、4回、5回、またはそれ以上投与される。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象の1つ以上の罹患領域及び/または非罹患領域に投与される。いくつかの実施形態では、対象は、接合部型ヘルリッツ表皮水疱症(JEB-H)に罹患している。いくつかの実施形態では、対象は、接合部型非ヘルリッツ表皮水疱症(JEB-nH)に罹患している。
【0023】
本開示の他の態様は、対象の皮膚の1つ以上の細胞の細胞接着を強化する、増加させる、増強する、及び/または補充する方法であって、対象に、本明細書に記載のヘルペスウイルスのうちのいずれか及び/または本明細書に記載の薬学的組成物のうちのいずれかの有効量を投与することを含む、方法に関する。いくつかの実施形態では、細胞接着は、インテグリン媒介性細胞接着である。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、対象は、ヒトである。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、対象のゲノムは、ラミニン遺伝子に機能喪失変異を含む。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、ヘルペスウイルス及び/または薬学的組成物は、対象に、局所、経皮、皮下、皮膚上、皮内、経口、舌下、口腔、直腸、膣内、静脈内、動脈内、筋肉内、骨内、心臓内、腹腔内、経粘膜、硝子体内、網膜下、関節内、関節周囲、局部投与、または吸入により投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に、局所、経皮、皮下、皮内、または経粘膜投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に、局所、経皮、皮下、または皮内投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に、局所、経皮、または皮内投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に局所投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に皮内投与される。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、対象の皮膚は、投与前に擦過される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、経口投与または吸入により投与される。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、ウイルス及び/または薬学的組成物は、1日1回、2回、3回、4回、5回、またはそれ以上投与される。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象の1つ以上の罹患領域及び/または非罹患領域に投与される。いくつかの実施形態では、対象は、接合部型ヘルリッツ表皮水疱症(JEB-H)に罹患している。いくつかの実施形態では、対象は、接合部型非ヘルリッツ表皮水疱症(JEB-nH)に罹患している。
【0024】
本開示の他の態様は、対象の透明帯を強化する、増加させる、増強する、及び/または補充する方法であって、対象に、本明細書に記載のヘルペスウイルスのうちのいずれか及び/または本明細書に記載の薬学的組成物のうちのいずれかの有効量を投与することを含む、方法に関する。いくつかの実施形態では、対象は、ヒトである。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、対象のゲノムは、ラミニン遺伝子に機能喪失変異を含む。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、ヘルペスウイルス及び/または薬学的組成物は、対象に、局所、経皮、皮下、皮膚上、皮内、経口、舌下、口腔、直腸、膣内、静脈内、動脈内、筋肉内、骨内、心臓内、腹腔内、経粘膜、硝子体内、網膜下、関節内、関節周囲、局部投与、または吸入により投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に、局所、経皮、皮下、皮内、または経粘膜投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に、局所、経皮、皮下、または皮内投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に、局所、経皮、または皮内投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に局所投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に皮内投与される。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、対象の皮膚は、投与前に擦過される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、経口投与または吸入により投与される。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、ウイルス及び/または薬学的組成物は、1日1回、2回、3回、4回、5回、またはそれ以上投与される。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象の1つ以上の罹患領域及び/または非罹患領域に投与される。いくつかの実施形態では、対象は、接合部型ヘルリッツ表皮水疱症(JEB-H)に罹患している。いくつかの実施形態では、対象は、接合部型非ヘルリッツ表皮水疱症(JEB-nH)に罹患している。
【0025】
本開示の他の態様は、対象の上皮基底膜集合、上皮基底膜組織化、及び/または上皮基底接着を強化する、増加させる、増強する、及び/または補充する方法であって、対象に、本明細書に記載のヘルペスウイルスのうちのいずれか及び/または本明細書に記載の薬学的組成物のうちのいずれかの有効量を投与することを含む、方法に関する。いくつかの実施形態では、対象は、ヒトである。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、対象のゲノムは、ラミニン遺伝子に機能喪失変異を含む。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、ヘルペスウイルス及び/または薬学的組成物は、対象に、局所、経皮、皮下、皮膚上、皮内、経口、舌下、口腔、直腸、膣内、静脈内、動脈内、筋肉内、骨内、心臓内、腹腔内、経粘膜、硝子体内、網膜下、関節内、関節周囲、局部投与、または吸入により投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に、局所、経皮、皮下、皮内、または経粘膜投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に、局所、経皮、皮下、または皮内投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に、局所、経皮、または皮内投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に局所投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に皮内投与される。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、対象の皮膚は、投与前に擦過される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、経口投与または吸入により投与される。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、ウイルス及び/または薬学的組成物は、1日1回、2回、3回、4回、5回、またはそれ以上投与される。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象の1つ以上の罹患領域及び/または非罹患領域に投与される。いくつかの実施形態では、対象は、接合部型ヘルリッツ表皮水疱症(JEB-H)に罹患している。いくつかの実施形態では、対象は、接合部型非ヘルリッツ表皮水疱症(JEB-nH)に罹患している。
【0026】
本開示の他の態様は、その必要がある対象において接合部型表皮溶解症(JEB)の1つ以上の兆候または症状に対する予防的、姑息的、または治療的緩和を提供する方法であって、対象に、本明細書に記載のヘルペスウイルスのうちのいずれか及び/または本明細書に記載の薬学的組成物のうちのいずれかの有効量を投与することを含む、方法に関する。いくつかの実施形態では、JEBの1つ以上の兆候または症状は、皮膚の水疱形成、創傷形成、及び/または瘢痕化、肉芽組織、皮膚びらん、手指の爪及び/または足指の爪の変形、手指及び/または足指の癒着、皮膚のひきつれ及び/または菲薄化、拘縮、粘膜の水疱形成及び/または瘢痕化、呼吸困難、ホースクライ(horse cry)、感染症に対する易罹患性の増加、脱水症、体液喪失、電解質不均衡、胃腸管及び/または胃尿管(gastrourinary tract)の水疱形成及び/または瘢痕化、虫歯及び/またはエナメル質形成不全、抜け毛、栄養失調、発育遅延、貧血症、ならびにそれらの任意の組み合わせから選択される。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、対象は、ヒトである。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、対象のゲノムは、ラミニン遺伝子に機能喪失変異を含む。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、ヘルペスウイルス及び/または薬学的組成物は、対象に、局所、経皮、皮下、皮膚上、皮内、経口、舌下、口腔、直腸、膣内、静脈内、動脈内、筋肉内、骨内、心臓内、腹腔内、経粘膜、硝子体内、網膜下、関節内、関節周囲、局部投与、または吸入により投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に、局所、経皮、皮下、皮内、または経粘膜投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に、局所、経皮、皮下、または皮内投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に、局所、経皮、または皮内投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に局所投与される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象に皮内投与される。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、対象の皮膚は、投与前に擦過される。いくつかの実施形態では、ウイルス及び/または薬学的組成物は、経口投与または吸入により投与される。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、ウイルス及び/または薬学的組成物は、1日1回、2回、3回、4回、5回、またはそれ以上投与される。前述の実施形態のうちのいずれかと組み合わせられ得るいくつかの実施形態では、ウイルス及び/または薬学的組成物は、対象の1つ以上の罹患領域及び/または非罹患領域に投与される。いくつかの実施形態では、対象は、接合部型ヘルリッツ表皮水疱症(JEB-H)に罹患している。いくつかの実施形態では、対象は、接合部型非ヘルリッツ表皮水疱症(JEB-nH)に罹患している。
【0027】
本開示の他の態様は、本明細書に記載の組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤のうちのいずれかと、その投与に関する指示とを含む製品またはキットに関する。
[本発明1001]
ラミニンポリペプチドをコードする1つ以上のポリヌクレオチドを含む、組換えヘルペスウイルスゲノム。
[本発明1002]
ラミニンポリペプチドをコードする2つ以上のポリヌクレオチドを含む、本発明1001の組換えヘルペスウイルスゲノム。
[本発明1003]
複製可能である、本発明1001または本発明1002の組換えヘルペスウイルスゲノム。
[本発明1004]
複製欠損である、本発明1001または本発明1002の組換えヘルペスウイルスゲノム。
[本発明1005]
組換え単純ヘルペスウイルスゲノム、組換え水痘帯状疱疹ウイルスゲノム、組換えヒトサイトメガロウイルスゲノム、組換えヘルペスウイルス6Aゲノム、組換えヘルペスウイルス6Bゲノム、組換えヘルペスウイルス7ゲノム、組換えカポジ肉腫関連ヘルペスウイルスゲノム、及びそれらの任意の派生物からなる群から選択される、本発明1001~1004のいずれかの組換えヘルペスウイルスゲノム。
[本発明1006]
組換え単純ヘルペスウイルスゲノムである、本発明1001~1005のいずれかの組換えヘルペスウイルスゲノム。
[本発明1007]
前記組換え単純ヘルペスウイルスゲノムが、組換え単純ヘルペスウイルス1型(HSV-1)ゲノム、組換え単純ヘルペスウイルス2型(HSV-2)ゲノム、またはそれらの任意の派生物である、本発明1006の組換えヘルペスウイルスゲノム。
[本発明1008]
前記組換え単純ヘルペスウイルスゲノムが組換えHSV-1ゲノムである、本発明1006または本発明1007の組換えヘルペスウイルスゲノム。
[本発明1009]
前記組換え単純ヘルペスウイルスゲノムが不活性化変異を含む、本発明1006~1008のいずれかの組換えヘルペスウイルスゲノム。
[本発明1010]
前記不活性化変異が単純ヘルペスウイルス遺伝子に存在する、本発明1009の組換えヘルペスウイルスゲノム。
[本発明1011]
前記不活性化変異が、前記単純ヘルペスウイルス遺伝子のコード配列の一部または全部の欠失である、本発明1010の組換えヘルペスウイルスゲノム。
[本発明1012]
前記単純ヘルペスウイルス遺伝子が、感染細胞タンパク質(ICP)0、ICP4、ICP22、ICP27、ICP47、チミジンキナーゼ(tk)、ロングユニーク領域(UL)41、及びUL55からなる群から選択される、本発明1010または本発明1011の組換えヘルペスウイルスゲノム。
[本発明1013]
前記組換え単純ヘルペスウイルスゲノムが、ICP4遺伝子の一方または両方のコピーに不活性化変異を含む、本発明1012の組換えヘルペスウイルスゲノム。
[本発明1014]
前記組換え単純ヘルペスウイルスゲノムが、ICP22遺伝子に不活性化変異を含む、本発明1012または本発明1013の組換えヘルペスウイルスゲノム。
[本発明1015]
前記組換え単純ヘルペスウイルスゲノムが、UL41遺伝子に不活性化変異を含む、本発明1012~1014のいずれかの組換えヘルペスウイルスゲノム。
[本発明1016]
前記組換え単純ヘルペスウイルスゲノムが、ICP0遺伝子の一方または両方のコピーに不活性化変異を含む、本発明1012~1015のいずれかの組換えヘルペスウイルスゲノム。
[本発明1017]
前記組換え単純ヘルペスウイルスゲノムが、ICP27遺伝子に不活性化変異を含む、本発明1012~1016のいずれかの組換えヘルペスウイルスゲノム。
[本発明1018]
前記組換え単純ヘルペスウイルスゲノムが、ラミニンポリペプチドをコードする前記1つ以上のポリヌクレオチドを、1つ以上のウイルス遺伝子座に含む、本発明1006~1017のいずれかの組換えヘルペスウイルスゲノム。
[本発明1019]
前記ラミニンポリペプチドがヒトラミニン(Lam)ポリペプチドである、本発明1001~1018のいずれかの組換えヘルペスウイルスゲノム。
[本発明1020]
前記ヒトラミニン(Lam)ポリペプチドが、ヒトLamA1ポリペプチド、ヒトLamA2ポリペプチド、ヒトLamA3ポリペプチド、ヒトLamA4ポリペプチド、ヒトLamA5ポリペプチド、ヒトLamB1ポリペプチド、ヒトLamB2ポリペプチド、ヒトLamB3ポリペプチド、ヒトLamC1ポリペプチド、ヒトLamC2ポリペプチド、ヒトLamC3ポリペプチド、及びそれらの任意のキメラポリペプチドからなる群から選択される、本発明1019の組換えヘルペスウイルスゲノム。
[本発明1021]
前記ヒトラミニン(Lam)ポリペプチドが、ヒトLamA3ポリペプチド、ヒトLamB3ポリペプチド、及びヒトLamC2ポリペプチドからなる群から選択される、本発明1019または本発明1020の組換えヘルペスウイルスゲノム。
[本発明1022]
前記ラミニンポリペプチドが、配列番号7~9または32~35からなる群から選択されるアミノ酸配列に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む、本発明1001~1021のいずれかの組換えヘルペスウイルスゲノム。
[本発明1023]
標的細胞に導入された場合に、対応する野生型ヘルペスウイルスゲノムと比較して減少した細胞毒性を有する、本発明1001~1022のいずれかの組換えヘルペスウイルスゲノム。
[本発明1024]
前記標的細胞がヒト細胞である、本発明1023の組換えヘルペスウイルスゲノム。
[本発明1025]
前記標的細胞が表皮細胞及び/または真皮細胞である、本発明1023または本発明1024の組換えヘルペスウイルスゲノム。
[本発明1026]
前記標的細胞がケラチノサイトまたは線維芽細胞である、本発明1023~1025のいずれかの組換えヘルペスウイルスゲノム。
[本発明1027]
本発明1001~1026のいずれかの組換えヘルペスウイルスゲノムを含む、ヘルペスウイルス。
[本発明1028]
複製可能である、本発明1027のヘルペスウイルス。
[本発明1029]
複製欠損である、本発明1027のヘルペスウイルス。
[本発明1030]
対応する野生型ヘルペスウイルスと比較して減少した細胞毒性を有する、本発明1027~1029のいずれかのヘルペスウイルス。
[本発明1031]
単純ヘルペスウイルス、水痘帯状疱疹ウイルス、ヒトサイトメガロウイルス、ヘルペスウイルス6A、ヘルペスウイルス6B、ヘルペスウイルス7、カポジ肉腫関連ヘルペスウイルス、及びそれらの任意の派生物からなる群から選択される、本発明1027~1030のいずれかのヘルペスウイルス。
[本発明1032]
単純ヘルペスウイルスである、本発明1027~1031のいずれかのヘルペスウイルス。
[本発明1033]
前記単純ヘルペスウイルスが、HSV-1、HSV-2、またはそれらの任意の派生物である、本発明1031または本発明1032のヘルペスウイルス。
[本発明1034]
前記単純ヘルペスウイルスがHSV-1である、本発明1031~1033のいずれかのヘルペスウイルス。
[本発明1035]
本発明1001~1026のいずれかの組換えヘルペスウイルスゲノムまたは本発明1027~1034のいずれかのヘルペスウイルスと、薬学的に許容される賦形剤とを含む、薬学的組成物。
[本発明1036]
局所、経皮、皮下、皮内、経口、舌下、口腔、直腸、膣内、吸入、静脈内、動脈内、筋肉内、心臓内、骨内、腹腔内、経粘膜、硝子体内、網膜下、関節内、関節周囲、局部、または皮膚上(epicutaneous)投与に好適である、本発明1035の薬学的組成物。
[本発明1037]
局所、経皮、皮下、皮内、または経粘膜投与に好適である、本発明1035または本発明1036の薬学的組成物。
[本発明1038]
局所、経皮、または皮内投与に好適である、本発明1035~1037のいずれかの薬学的組成物。
[本発明1039]
局所投与に好適である、本発明1035~1038のいずれかの薬学的組成物。
[本発明1040]
皮内投与に好適である、本発明1035~1038のいずれかの薬学的組成物。
[本発明1041]
経口または吸入投与に好適である、本発明1035または本発明1036の薬学的組成物。
[本発明1042]
メチルセルロースゲルを含む、本発明1035~1041のいずれかの薬学的組成物。
[本発明1043]
リン酸緩衝液を含む、本発明1035~1042のいずれかの薬学的組成物。
[本発明1044]
グリセロールを含む、本発明1035~1043のいずれかの薬学的組成物。
[本発明1045]
脂質担体を含む、本発明1035~1044のいずれかの薬学的組成物。
[本発明1046]
ナノ粒子担体を含む、本発明1035~1045のいずれかの薬学的組成物。
[本発明1047]
薬剤としての使用のための、本発明1027~1034のいずれかのヘルペスウイルスまたは本発明1035~1046のいずれかの薬学的組成物。
[本発明1048]
療法における使用のための、本発明1027~1034のいずれかのヘルペスウイルスまたは本発明1035~1046のいずれかの薬学的組成物。
[本発明1049]
接合部型表皮水疱症の1つ以上の兆候または症状を治療するための薬剤の製造における、本発明1027~1034のいずれかのヘルペスウイルスまたは本発明1035~1046のいずれかの薬学的組成物の、使用。
[本発明1050]
対象の1つ以上の細胞におけるラミニンポリペプチドレベルを強化する、増加させる、増強する、及び/または補充する方法であって、前記対象に、本発明1027~1034のいずれかのヘルペスウイルスまたは本発明1035~1046のいずれかの薬学的組成物の有効量を投与することを含む、前記方法。
[本発明1051]
対象の皮膚における1つ以上の細胞の細胞接着を強化する、増加させる、増強する、及び/または補充する方法であって、前記対象に、本発明1027~1034のいずれかのヘルペスウイルスまたは本発明1035~1046のいずれかの薬学的組成物の有効量を投与することを含む、前記方法。
[本発明1052]
前記細胞接着がインテグリン媒介性細胞接着である、本発明1051の方法。
[本発明1053]
対象の透明帯を強化する、増加させる、増強する、及び/または補充する方法であって、前記対象に、本発明1027~1034のいずれかのヘルペスウイルスまたは本発明1035~1046のいずれかの薬学的組成物の有効量を投与することを含む、前記方法。
[本発明1054]
対象の上皮基底膜集合、上皮基底膜組織化、及び/または上皮基底接着を強化する、増加させる、増強する、及び/または補充する方法であって、前記対象に、本発明1027~1034のいずれかのヘルペスウイルスまたは本発明1035~1046のいずれかの薬学的組成物の有効量を投与することを含む、前記方法。
[本発明1055]
その必要がある対象において接合部型表皮水疱症(JEB)の1つ以上の兆候または症状に対する予防的、姑息的、または治療的緩和を提供する方法であって、前記対象に、本発明1027~1034のいずれかのヘルペスウイルスまたは本発明1035~1046のいずれかの薬学的組成物の有効量を投与することを含む、前記方法。
[本発明1056]
JEBの前記1つ以上の兆候または症状が、皮膚の水疱形成、創傷形成、及び/または瘢痕化、肉芽組織、皮膚びらん、手指の爪及び/または足指の爪の変形、手指及び/または足指の癒着、皮膚のひきつれ及び/または菲薄化、拘縮、粘膜の水疱形成及び/または瘢痕化、呼吸困難、ホースクライ(horse cry)、感染症に対する易罹患性の増加、脱水症、体液喪失、電解質不均衡、胃腸管及び/または胃尿管(gastrourinary tract)の水疱形成及び/または瘢痕化、虫歯及び/またはエナメル質形成不全、抜け毛、栄養失調、発育遅延、貧血症、ならびにそれらの任意の組み合わせからなる群から選択される、本発明1055の方法。
[本発明1057]
前記対象がヒトである、本発明1050~1056のいずれかの方法。
[本発明1058]
前記対象のゲノムが、ラミニン遺伝子に機能喪失変異を含む、本発明1050~1057のいずれかの方法。
[本発明1059]
前記ヘルペスウイルスまたは前記薬学的組成物が、前記対象に、局所、経皮、皮下、皮膚上、皮内、経口、舌下、口腔、直腸、膣内、静脈内、動脈内、筋肉内、骨内、心臓内、腹腔内、経粘膜、硝子体内、網膜下、関節内、関節周囲、局部投与、または吸入により投与される、本発明1050~1058のいずれかの方法。
[本発明1060]
前記ヘルペスウイルスまたは前記薬学的組成物が、前記対象に、局所、経皮、皮下、皮内、または経粘膜投与される、本発明1050~1059のいずれかの方法。
[本発明1061]
前記ヘルペスウイルスまたは前記薬学的組成物が、前記対象に、局所、経皮、または皮内投与される、本発明1050~1060のいずれかの方法。
[本発明1062]
前記ヘルペスウイルスまたは前記薬学的組成物が、前記対象に局所投与される、本発明1050~1061のいずれかの方法。
[本発明1063]
前記ヘルペスウイルスまたは前記薬学的組成物が、前記対象に皮内投与される、本発明1050~1061のいずれかの方法。
[本発明1064]
前記対象の皮膚が、投与前に擦過される、本発明1050~1063のいずれかの方法。
[本発明1065]
前記ヘルペスウイルスまたは前記薬学的組成物が、経口投与または吸入により投与される、本発明1050~1059のいずれかの方法。
[本発明1066]
フィラグリンポリペプチドをコードする1つ以上のポリヌクレオチドを含む、組換えヘルペスウイルスゲノム。
[本発明1067]
前記フィラグリンポリペプチドがヒトフィラグリンポリペプチドである、本発明1066の組換えヘルペスウイルスゲノム。
[本発明1068]
前記フィラグリンポリペプチドがヒトフィラグリンポリペプチドまたはヒトフィラグリン-2ポリペプチドである、本発明1066または本発明1067の組換えヘルペスウイルスゲノム。
[本発明1069]
前記フィラグリンポリペプチドが、配列番号39~50からなる群から選択されるアミノ酸配列に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む、本発明1066~1068のいずれかの組換えヘルペスウイルスゲノム。
[本発明1070]
本発明1066~1069のいずれかの組換えヘルペスウイルスゲノムを含む、ヘルペスウイルス。
[本発明1071]
本発明1066~1069のいずれかの組換えヘルペスウイルスゲノムまたは本発明1070のヘルペスウイルスと、薬学的に許容される賦形剤とを含む、薬学的組成物。
[本発明1072]
その必要がある対象において皮膚疾患の1つ以上の兆候または症状の予防的、姑息的、または治療的緩和を提供する方法であって、前記対象に、本発明1070のヘルペスウイルスまたは本発明1071の薬学的組成物の有効量を投与することを含む、前記方法。
[本発明1073]
前記皮膚疾患が、アトピー性皮膚炎、尋常性魚鱗癬、及び皮膚剥離症候群からなる群から選択される、本発明1072の方法。
[本発明1074]
薬剤としての使用のための、本発明1070のヘルペスウイルスまたは本発明1071の薬学的組成物。
[本発明1075]
療法における使用のための、本発明1070のヘルペスウイルスまたは本発明1071の薬学的組成物。
[本発明1076]
アトピー性皮膚炎、尋常性魚鱗癬、及び/または皮膚剥離症候群の1つ以上の兆候または症状を治療するための薬剤の製造における、本発明1070のヘルペスウイルスまたは本発明1071の薬学的組成物の、使用。
【図面の簡単な説明】
【0028】
図1-1】図1A~Eは、野生型単純ヘルペスウイルスゲノム及び修飾された単純ヘルペスウイルスゲノムの概略図を示す。図1Aは、野生型単純ヘルペスウイルスゲノムを示す。図1Bは、ヒトLAMB3の野生型コード配列を含む発現カセットがICP4遺伝子座の各々に組み込まれている、ICP4(両方のコピー)及びICP22のコード配列の欠失を含む修飾された単純ヘルペスウイルスゲノムを示す。図1Cは、ヒトLAMB3のコドン最適化コード配列を含む発現カセットがICP4遺伝子座の各々に組み込まれている、ICP4(両方のコピー)及びICP22のコード配列の欠失を含む修飾された単純ヘルペスウイルスゲノムを示す。図1Dは、ヒトLAMC2の野生型コード配列を含む発現カセットがICP4遺伝子座の各々に組み込まれている、ICP4(両方のコピー)及びICP22のコード配列の欠失を含む修飾された単純ヘルペスウイルスゲノムを示す。図1Eは、ヒトLAMC2のコドン最適化コード配列を含む発現カセットがICP4遺伝子座の各々に組み込まれている、ICP4(両方のコピー)及びICP22のコード配列の欠失を含む修飾された単純ヘルペスウイルスゲノムを示す。
図1-2】図1-1の説明を参照のこと。
図1-3】図1-1の説明を参照のこと。
図2図2A~Bは、指示されたウイルス分離株に感染したVero細胞における野生型(WT)ヒトLamB3の発現を示す。図2Aは、qRT-PCR分析によって評価される、感染Vero細胞における野生型ヒトLAMB3の発現を示す。図2Bは、ウエスタンブロットによって評価される、感染Vero細胞における野生型ヒトLamB3タンパク質の発現を示す。
図3】ウエスタンブロットによって評価される、指示されたウイルス分離株に感染したVero細胞における野生型(WT)またはコドン最適化(CO)ヒトLamB3タンパク質の発現を示す。非感染Vero細胞を陰性対照として使用した。
図4】ウエスタンブロットによって評価される、指示されたウイルス分離株に感染した初代ヒトケラチノサイトにおける野生型(WT)またはコドン最適化(CO)ヒトLamB3タンパク質の発現を示す。非感染初代ケラチノサイトを陰性対照として使用し、GAPDHを負荷対照として使用した。
図5図5A~Cは、指示されたウイルス分離株に感染したVero細胞における野生型(WT)及びコドン最適化(CO)ヒトLamC2の発現を示す。図5Aは、qRT-PCR分析によって評価される、感染Vero細胞における野生型ヒトLAMC2の発現を示す。図5Bは、qRT-PCR分析によって評価される、感染Vero細胞におけるコドン最適化ヒトLAMC2の発現を示す。図5Cは、ウエスタンブロットによって評価される、感染Vero細胞における野生型及びコドン最適化ヒトLamC2タンパク質の発現を示す。非感染Vero細胞を陰性対照として使用した。コドン最適化LamC2を発現するウイルス分離株「LGA」を追加の実験のために選択した。
図6A図6A~Cは、指示された感染多重度(MOI)で感染した不死化初代ヒトケラチノサイト中のウイルス分離株「LGA」から発現されたヒトLAMC2を示す。図6Aは、qPCR分析によって評価される、指示されたMOIでのウイルス分離株「LGA」による感染後の初代不死化ヒトケラチノサイト中のウイルスゲノムコピー数を示す。
図6B図6A~Cは、指示された感染多重度(MOI)で感染した不死化初代ヒトケラチノサイト中のウイルス分離株「LGA」から発現されたヒトLAMC2を示す。図6Bは、qRT-PCR分析によって評価される、指示されたMOIでのウイルス分離株「LGA」による感染後に初代不死化ヒトケラチノサイトで発現されたコドン最適化LAMC2の転写物レベルを示す。qPCR分析及びqRT-PCR分析について、データを、2つの複製物の平均±標準誤差として提示する。
図6C図6A~Cは、指示された感染多重度(MOI)で感染した不死化初代ヒトケラチノサイト中のウイルス分離株「LGA」から発現されたヒトLAMC2を示す。図6Cは、ウエスタンブロットによって評価される、指示されたMOIでのウイルス分離株「LGA」による感染後の初代不死化ヒトケラチノサイトにおけるヒトLamC2タンパク質の発現を示す。GAPDHを負荷対照として使用した。各分析について、非感染初代ケラチノサイト、ならびにmCherryコードHSVベクター(mCherry)に感染した初代ケラチノサイトを陰性対照として使用した。
図7A図7A~Dは、HSV分離株「LGA」またはビヒクル対照のLAMC2-/--hLAMC2tet-onマウス(ドキシサイクリン15日間中断(doxy-))への皮内注射の72時間後に採取した皮膚生検におけるLamC2核酸及びタンパク質分析を示す。図7Aは、処理した動物上の皮内注射部位の概略図を示す。
図7B図7A~Dは、HSV分離株「LGA」またはビヒクル対照のLAMC2-/--hLAMC2tet-onマウス(ドキシサイクリン15日間中断(doxy-))への皮内注射の72時間後に採取した皮膚生検におけるLamC2核酸及びタンパク質分析を示す。図7Bは、qPCR分析によって評価される、LGAまたはビヒクル対照の皮内投与後に皮膚生検に存在するヒトLAMC2 DNAレベルを示す。
図7C図7A~Dは、HSV分離株「LGA」またはビヒクル対照のLAMC2-/--hLAMC2tet-onマウス(ドキシサイクリン15日間中断(doxy-))への皮内注射の72時間後に採取した皮膚生検におけるLamC2核酸及びタンパク質分析を示す。図7Cは、qRT-PCR分析によって評価される、LGAまたはビヒクル対照の皮内投与後に皮膚生検に存在するヒトLAMC2転写物レベルを示す。qPCR分析及びqRT-PCR分析における各条件について、データを、2つの複製物の平均±標準誤差として提示する。
図7D図7A~Dは、HSV分離株「LGA」またはビヒクル対照のLAMC2-/--hLAMC2tet-onマウス(ドキシサイクリン15日間中断(doxy-))への皮内注射の72時間後に採取した皮膚生検におけるLamC2核酸及びタンパク質分析を示す。図7Dは、LGAまたはビヒクル対照の皮内投与後の皮膚生検におけるヒトLamC2タンパク質発現の代表的な免疫蛍光画像を示す。DAPI染色を使用して核を可視化し、pKal染色を使用してマウスラミニン-332を可視化した。
図8-1】図8A~Fは、野生型単純ヘルペスウイルスゲノム及び修飾された単純ヘルペスウイルスゲノムの概略図を示す。図8Aは、野生型単純ヘルペスウイルスゲノムを示す。図8Bは、ヒトフィラグリンポリペプチドをコードする核酸を含む発現カセットがICP4遺伝子座の各々に組み込まれている、ICP4(両方のコピー)のコード配列の欠失を含む修飾された単純ヘルペスウイルスゲノムを示す。図8Cは、ヒトフィラグリンポリペプチドをコードする核酸を含む発現カセットがICP4遺伝子座の各々に組み込まれている、ICP4(両方のコピー)及びICP22のコード配列の欠失を含む修飾された単純ヘルペスウイルスゲノムを示す。図8Dは、ヒトフィラグリンポリペプチドをコードする核酸を含む発現カセットがICP22遺伝子座に組み込まれている、ICP4(両方のコピー)及びICP22のコード配列の欠失を含む修飾された単純ヘルペスウイルスゲノムを示す。図8Eは、ヒトフィラグリンポリペプチドをコードする核酸を含む発現カセットがUL41遺伝子座に組み込まれている、ICP4(両方のコピー)及びUL41のコード配列の欠失を含む修飾された単純ヘルペスウイルスゲノムを示す。図8Fは、ヒトフィラグリンポリペプチドをコードする核酸を含む発現カセットがUL41遺伝子座に組み込まれている、ICP4(両方のコピー)、ICP22、及びUL41のコード配列の欠失を含む修飾された単純ヘルペスウイルスゲノムを示す。
図8-2】図8-1の説明を参照のこと。
図8-3】図8-1の説明を参照のこと。
【発明を実施するための形態】
【0029】
詳細な説明
いくつかの実施形態では、本開示は、ラミニンポリペプチド(例えば、ヒトラミニンポリペプチド)をコードする1つ以上のポリヌクレオチドを含む組換え核酸(例えば、組換えヘルペスウイルスゲノム)、及び/または(例えば、ゲノムがラミニン遺伝子の機能喪失変異及び/または病原性バリアントを有する対象における)ラミニンタンパク質レベルを補充する及び/またはラミニン遺伝子欠乏症を治療する、及び/または医学的介入を、それを必要とする対象に提供する(例えば、ラミニン欠乏症(例えば、JEB)に起因する1つ以上の疾患または障害に対して予防的、姑息的、及び/または治療的緩和を提供する)ための、ウイルス(例えば、ヘルペスウイルス)、組成物、製剤、薬剤、及び/または方法における組換え核酸の使用に関する。理論に拘束されることを望むことなく、本明細書に記載の組換え核酸、ウイルス、組成物、製剤、薬剤、及び/または方法が、ラミニン欠乏症に罹患している個体(例えば、JEB患者)における既存の皮膚及び/または粘膜異常の治療、ならびに治療された対象におけるかかる皮膚及び/または粘膜異常の再形成の防止または遅延を助けるであろうと考えられる。
【0030】
いくつかの実施形態では、本開示は、フィラグリンポリペプチド(例えば、ヒトフィラグリンポリペプチド)をコードする1つ以上のポリヌクレオチドを含む組換え核酸(例えば、組換えヘルペスウイルスゲノム)、及び/または(例えば、ゲノムがFLG及び/またはFLG2遺伝子の機能喪失変異及び/または病原性バリアントを有する対象における)フィラグリンタンパク質レベルを補充する及び/またはフィラグリン遺伝子欠乏症を治療する、及び/または医学的介入を、それを必要とする対象に提供する(例えば、フィラグリン欠乏症(例えば、アトピー性皮膚炎、尋常性魚鱗癬等)に起因する1つ以上の疾患または障害に対して予防的、姑息的、及び/または治療的緩和を提供する)ための、ウイルス(例えば、ヘルペスウイルス)、組成物、製剤、薬剤、及び/または方法における組換え核酸の使用に関する。理論に拘束されることを望むことなく、本明細書に記載の組換え核酸、ウイルス、組成物、製剤、薬剤、及び/または方法が、フィラグリン欠乏症に罹患している個体(例えば、アトピー性皮膚炎及び/または尋常性魚鱗癬患者)における既存の皮膚異常の治療、ならびに治療された対象におけるかかる皮膚異常の再形成の防止または遅延を助けるであろうと考えられる。
【0031】
以下の記述は、例示的な方法及びパラメータ等を説明する。しかしながら、かかる記述が本開示の範囲を限定するようには意図されておらず、代わりに、例示的な実施形態の記述として提供されることを認識されたい。
【0032】
I.一般的な技法
本明細書に記載または参照される技術及び手順は、当業者によって一般に十分に理解されており、従来の方法論、例えば、Sambrook et al.,Molecular Cloning:A Laboratory Manual 3d edition(2001)Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.、Current Protocols in Molecular Biology(F.M.Ausubel,et al.eds.,(2003))、the series Methods in Enzymology(Academic Press,Inc.):PCR 2:A Practical Approach(M.J.MacPherson,B.D.Hames and G.R.Taylor eds.(1995)),Harlow and Lane,eds.(1988)、Oligonucleotide Synthesis(M.J.Gait,ed.,1984)、Methods in Molecular Biology,Humana Press、Cell Biology:A Laboratory Notebook (J.E.Cellis,ed.,1998)Academic Press、Animal Cell Culture(R.I.Freshney),ed.,1987)、Introduction to Cell and Tissue Culture(J.P.Mather and P.E.Roberts,1998)Plenum Press、Cell and Tissue Culture:Laboratory Procedures(A.Doyle,J.B.Griffiths,and D.G.Newell,eds.,1993-8)J.Wiley and Sons、Gene Transfer Vectors for Mammalian Cells(J.M.Miller and M.P.Calos,eds.,1987)、PCR:The Polymerase Chain Reaction(Mullis et al.,eds.,1994)、Short Protocols in Molecular Biology(Wiley and Sons,1999)に記載の広く利用されている方法論を使用して一般的に用いられている。
【0033】
II.定義
本開示を詳細に説明する前に、本開示が特定の組成物または生物学的系に限定されず、これらが言うまでもなく変化し得ることを理解されたい。本明細書で使用される専門用語が特定の実施形態を説明することのみを目的とし、限定するようには意図されていないことも理解されたい。
【0034】
本明細書で使用される場合、単数形「1つの(a)」、「1つの(an)」、及び「その(the)」は、内容がそうではないと明らかに指示しない限り、複数の指示対象を含む。したがって、例えば、「分子(a molecule)」への言及は、2つ以上のかかる分子の組み合わせを任意に含むといった具合である。
【0035】
本明細書で使用される場合、「及び/または」という用語は、関連する列記される項目のうちの1つ以上のありとあらゆる組み合わせを含み得る。例えば、「a及び/またはb」という用語は、「aのみ」、「bのみ」、「aまたはb」、または「a及びb」を指し得、「a、b、及び/またはc」という用語は、「aのみ」、「bのみ」、「cのみ」、「aまたはb」、「aまたはc」、「bまたはc」、「a、b、またはc」、「a及びb」、「a及びc」、「b及びc」、または「a、b、及びc」を指し得るといった具合である。
【0036】
本明細書で使用される場合、「約」という用語は、当業者に容易に知られているそれぞれの値の通常の誤差範囲を指す。本明細書における「約」値またはパラメータへの言及は、その値またはパラメータ自体を対象とする実施形態を含む(かつ説明する)。
【0037】
本開示の態様及び実施形態が、態様及び実施形態を「含む」、「からなる」、及び「から本質的になる」ことを含むことが理解される。
【0038】
本明細書で使用される場合、「ポリヌクレオチド」、「核酸配列」、「核酸」という用語、及びそれらの変形は、ポリマーが、DNA及びRNAに見られるように、塩基対合及び塩基スタッキングを可能にする立体配置で核酸塩基を含むという条件で、ポリデオキシリボヌクレオチド(2-デオキシ-D-リボースを含む)、ポリリボヌクレオチド(D-リボースを含む)、プリンまたはピリミジン塩基のN-グリコシドである任意の他のタイプのポリヌクレオチド、及び非ヌクレオチド骨格を含む他のポリマーに対して包括的であるものとする。したがって、これらの用語には、既知のタイプの核酸配列修飾、例えば、天然に存在するヌクレオチドのうちの1つ以上の類似体での置換、及びヌクレオチド間修飾が含まれる。
【0039】
本明細書で使用される場合、核酸は、それが別の核酸配列と機能的関係に置かれている場合、「作動的に連結されている」または「作動可能に連結されている」。例えば、プロモーターまたはエンハンサーは、コード配列の転写に影響を及ぼす場合、コード配列に作動可能に連結されており、リボソーム結合部位は、翻訳を促進するように位置付けされている場合、コード配列に作動可能に連結されている。一般に、「作動的に連結されている」または「作動可能に連結されている」とは、連結されているDNA配列が連続していることを意味する。
【0040】
本明細書で使用される場合、「ベクター」という用語は、異種核酸の発現または複製のいずれかのためにそれを細胞に導入するために使用される別個の要素を指す。発現ベクターには、かかる核酸の発現をもたらすことができるプロモーター領域等の調節配列と作動的に連結された核酸を発現することができるベクターが含まれる。したがって、発現ベクターは、適切な宿主細胞に導入されたときに核酸の発現をもたらす、プラスミド、ファージ、組換えウイルス、または他のベクター等のDNAまたはRNA構築物を指し得る。適切な発現ベクターは当業者に周知であり、真核細胞で複製可能なもの、及びエピソームのままであるか、または宿主細胞ゲノムに組み込まれるものを含む。
【0041】
本明細書で使用される場合、「オープンリーディングフレーム」または「ORF」とは、タンパク質またはポリペプチドをコードするDNAまたはRNAのいずれかの連続した伸長を指す。典型的には、核酸は、ATGまたはAUG等の翻訳開始シグナルまたは開始コドン及び終止コドンを含む。
【0042】
本明細書で使用される場合、「非翻訳領域」または「UTR」とは、オープンリーディングフレームの5’末端及び/または3’末端における非翻訳核酸を指す。1つ以上のUTRをポリヌクレオチドに含めることにより、転写後制御、mRNA安定性、及び/またはポリヌクレオチドの翻訳に影響が及ぼされ得る。
【0043】
本明細書で使用される場合、「導入遺伝子」という用語は、細胞に導入された後に、RNAに転写され、適切な条件下で翻訳及び/または発現されることができるポリヌクレオチドを指す。いくつかの実施形態では、これは、それが導入された細胞に所望の特性を付与するか、またはさもなければ所望の治療結果または診断結果をもたらす。
【0044】
本明細書で使用される場合、「ポリペプチド」、「タンパク質」、及び「ペプチド」という用語は、互換的に使用され、2つ以上のアミノ酸のポリマーを指し得る。
【0045】
本明細書で使用される場合、「対象」、「宿主」、または「個体」とは、ヒト、家畜及び農場動物、ならびに動物園、スポーツ、またはペット動物、例えば、イヌ、ウマ、ネコ、ウシ、ならびに研究で使用される動物、例えば、マウス、ラット、ハムスター、ウサギ、及び非ヒト霊長類等を含む、哺乳動物として分類される任意の動物を指す。いくつかの実施形態では、哺乳動物は、ヒトである。
【0046】
本明細書で使用される場合、「薬学的製剤」または「薬学的組成物」という用語は、活性成分(複数可)の生物学的活性が有効になることを可能にするような形態であり、組成物または製剤が投与される対象に対して許容し難いほどに毒性の追加の成分を含まない調製物を指す。「薬学的に許容される」賦形剤(例えば、ビヒクル、添加物)は、用いられる活性成分(複数可)の有効用量を提供するために対象哺乳動物に適度に投与され得るものである。
【0047】
本明細書で使用される場合、「有効量」とは、特定の障害の1つ以上の症状の測定可能な改善または予防に影響を及ぼすのに必要な少なくとも最低限の量である。「有効量」は、患者の疾患状態、年齢、性別、及び体重等の要因に応じて変化し得る。有効量は、治療の任意の毒性または有害効果を治療上有益な効果が上回る量でもある。予防的使用の場合、有益なまたは所望の結果には、疾患、その合併症、及び疾患の発症中に提示される中間病理学的表現型のリスクの排除または低下、その重症度の軽減、またはその発症の遅延等の結果が含まれる。治療的使用の場合、有益なまたは所望の結果には、疾患に起因する1つ以上の症状の軽減、疾患に罹患している者の生活の質の向上、疾患の症状を治療するために使用される他の薬剤の用量の減少、疾患の進行の遅延、及び/または生存期間の延長等の臨床結果が含まれる。有効量は、1回以上の投与で投与され得る。本開示の目的のために、組換え核酸、ウイルス、及び/または薬学的組成物の有効量は、直接または間接的のいずれかで予防的または治療的治療を達成するのに十分な量である。臨床状況で理解されるように、組換え核酸、ウイルス、及び/または薬学的組成物の有効量は、別の薬物、化合物、または薬学的組成物と併せて達成される場合も達成されない場合もある。したがって、「有効量」は、1つ以上の治療剤を投与する状況で考慮され得、1つ以上の他の薬剤と併せて望ましい結果が達成され得るまたは達成された場合、単一の薬剤が有効量で与えられたとみなされ得る。
【0048】
本明細書で使用される場合、「治療」とは、臨床病理学の過程において治療される個体または細胞の自然経過を変化させるように設計された臨床的介入を指す。治療の望ましい効果には、疾患/障害/欠損症の進行速度の低下、疾患/障害/欠損症状態の改善または緩和、及び寛解または予後の改善が含まれる。例えば、皮膚または粘膜上の1つ以上の創傷の減少または除去を含む、JEBに関連する1つ以上の症状が軽減または除去された場合、個体は首尾よく「治療」される。
【0049】
本明細書で使用される場合、疾患/障害/欠損症の「進行を遅延させる」という用語は、疾患/障害/欠損症の発症を引き延ばす、妨げる、遅延させる、遅らせる、安定化する、及び/または延期することを指す。この遅延は、疾患/障害/欠損症及び/または治療される個体の病歴に応じて、様々な長さまたは時間であり得る。当業者には明らかであるように、十分なまたは有意な遅延は、個体が疾患を発症しないという点で、実際には予防を包含し得る。
【0050】
III.組換え核酸
本開示のある特定の態様は、ラミニンポリペプチド(例えば、ヒトラミニンポリペプチド)をコードする1つ以上(例えば、1つ以上、2つ以上、3つ以上、4つ以上、5つ以上、10以上等)のポリヌクレオチドを含む組換え核酸(例えば、単離された組換え核酸)に関する。いくつかの実施形態では、組換え核酸は、ラミニンポリペプチドをコードする1つのポリヌクレオチドを含む。いくつかの実施形態では、組換え核酸は、ラミニンポリペプチドをコードする2つのポリヌクレオチドを含む。いくつかの実施形態では、ラミニンポリペプチドは、ヒトラミニンポリペプチドである。いくつかの実施形態では、ラミニンポリペプチドは、ラミニンサブユニットアルファ-3(LamA3)ポリペプチド、ラミニンサブユニットベータ-3(LamB3)ポリペプチド、またはラミニンサブユニットガンマ-2(LamC2)ポリペプチドである。いくつかの実施形態では、ラミニンポリペプチドは、ヒトLamA3ポリペプチド、ヒトLamB3ポリペプチド、またはヒトLamC2ポリペプチドである。
【0051】
本開示の他の態様は、フィラグリンポリペプチド(例えば、ヒトフィラグリンポリペプチド)をコードする1つ以上(例えば、1つ以上、2つ以上、3つ以上、4つ以上、5つ以上、10以上等)のポリヌクレオチドを含む組換え核酸(例えば、単離された組換え核酸)に関する。いくつかの実施形態では、組換え核酸は、フィラグリンポリペプチドをコードする1つのポリヌクレオチドを含む。いくつかの実施形態では、組換え核酸は、フィラグリンポリペプチドをコードする2つのポリヌクレオチドを含む。いくつかの実施形態では、組換え核酸は、フィラグリンポリペプチドをコードする3つのポリヌクレオチドを含む。いくつかの実施形態では、フィラグリンポリペプチドは、全長プロフィラグリンポリペプチドである。いくつかの実施形態では、フィラグリンポリペプチドは、フィラグリンモノマー(例えば、全長プロフィラグリンポリペプチドのタンパク質分解切断から(例えば、セリンプロテアーゼ切断により)生じるフィラグリンモノマー)である。
【0052】
いくつかの実施形態では、組換え核酸は、ベクターである。いくつかの実施形態では、組換え核酸は、ウイルスベクターである。いくつかの実施形態では、組換え核酸は、ヘルペスウイルスベクターである。いくつかの実施形態では、組換え核酸は、単純ヘルペスウイルスアンプリコンである。いくつかの実施形態では、組換え核酸は、組換えヘルペスウイルスゲノムである。いくつかの実施形態では、組換え核酸は、組換え単純ヘルペスウイルスゲノムである。いくつかの実施形態では、組換え核酸は、組換え単純ヘルペスウイルスタイプ1(HSV-1)ゲノムである。
【0053】
ラミニンポリペプチドをコードするポリヌクレオチド
いくつかの実施形態では、本開示は、ラミニン遺伝子(例えば、ヒトラミニン遺伝子)のコード配列を含む1つ以上のポリヌクレオチドを含む組換え核酸、またはその一部に関する。例えば、LAMA1遺伝子(例えば、NCBI遺伝子ID:284217を参照のこと)、LAMA2遺伝子(例えば、NCBI遺伝子ID:3908を参照のこと)、LAMA3遺伝子(例えば、NCBI遺伝子ID:3909を参照のこと)、LAMA4遺伝子(例えば、NCBI遺伝子ID:3910を参照のこと)、LAMA5遺伝子(例えば、NCBI遺伝子ID:3911を参照のこと)、LAMB1遺伝子(例えば、NCBI遺伝子ID:3912を参照のこと)、LAMB2遺伝子(例えば、NCBI遺伝子ID:3913を参照のこと)、LAMB3遺伝子(例えば、NCBI遺伝子ID:3914を参照のこと)、LAMC1遺伝子(例えば、NCBI遺伝子ID:3915を参照のこと)、LAMC2遺伝子(例えば、NCBI遺伝子ID:3918を参照のこと)、LAMC3遺伝子(例えば、NCBI遺伝子ID:10319を参照のこと)等を含む、当該技術分野で既知の任意の好適なラミニン遺伝子(その任意のアイソフォームを含む)が、本開示のポリヌクレオチドによってコードされ得る。いくつかの実施形態では、1つ以上のポリヌクレオチドは、LAMB3遺伝子をコードしない。非ヒトラミニン遺伝子の例には、例えば、マウスラミニン(例えば、NCBI遺伝子ID:16774、16780、及び16782を参照のこと)、ラットラミニン(例えば、NCBI遺伝子ID:307582、305078、及び192362を参照のこと)、チンパンジーラミニン(例えば、NCBI遺伝子ID:455339、469668、及び457571を参照のこと)等が挙げられる。いくつかの実施形態では、本開示のポリヌクレオチドは、本明細書に記載のまたは当該技術分野で既知のラミニン遺伝子(及び/またはそのコード配列)のうちのいずれかのコード配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。例えば、BLAST(登録商標)blastn suite等の核酸配列アラインメントプログラムの使用を含む、追加の種由来のラミニン遺伝子ホモログ/オルソログを特定する方法は、当業者に既知である。いくつかの実施形態では、本開示の1つ以上のポリヌクレオチドは、ヒトラミニン遺伝子のコード配列を含む。
【0054】
いくつかの実施形態では、本開示のポリヌクレオチドは、本明細書に記載のまたは当該技術分野で既知のラミニン遺伝子のうちのいずれかのコドン最適化バリアントを含む。いくつかの実施形態では、ラミニン遺伝子のコドン最適化バリアント(例えば、ヒトラミニン遺伝子のコドン最適化バリアント)の使用により、対応する非コドン最適化野生型配列の異種発現の安定性及び/または収率と比較して、標的細胞(例えば、ヒトケラチノサイトまたは線維芽細胞等の標的ヒト細胞)におけるコードされたラミニンの異種発現(RNA及び/またはタンパク質)の安定性及び/または収率が増加する。例えば、Fath et al.(PLoS One.2011 Mar 3;6(3):e17596)によって説明される方法を含む、1つ以上の標的細胞(例えば、1つ以上のヒト細胞)における発現のための配列のコドン最適化を行うための当該技術分野で既知の任意の好適な方法が使用され得る。
【0055】
いくつかの実施形態では、本開示の1つ以上のポリヌクレオチドは、ヒトLAMA3遺伝子(またはそのコドン最適化バリアント)のコード配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号1~2または24~29から選択される配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号1~2または24~29から選択される配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号2、25、27、または29から選択される配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号1の配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号2の配列を含む。
【0056】
いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号1または配列番号2の配列の5’切断、3’切断、または断片を含む。いくつかの実施形態では、配列番号1または配列番号2の配列の5’切断、3’切断、または断片は、配列番号1または配列番号2の少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも125、少なくとも150、少なくとも175、少なくとも200、少なくとも250、少なくとも300、または少なくとも350、少なくとも400、少なくとも450、少なくとも500、少なくとも750、少なくとも1000、少なくとも1500、少なくとも2000、少なくとも2500、少なくとも3000、少なくとも3500、少なくとも4000、少なくとも4500、または少なくとも5000個であるが、5175個未満の連続するヌクレオチドを有するポリヌクレオチドである。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号1または配列番号2の核酸1~5172の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号1または配列番号2の核酸1~5172の配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号1または配列番号2の核酸82~5172の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号1または配列番号2の核酸82~5172の配列を含む。
【0057】
いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号24または配列番号25の配列の5’切断、3’切断、または断片を含む。いくつかの実施形態では、配列番号24または配列番号25の配列の5’切断、3’切断、または断片は、配列番号24または配列番号25の少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも125、少なくとも150、少なくとも175、少なくとも200、少なくとも250、少なくとも300、または少なくとも350、少なくとも400、少なくとも450、少なくとも500、少なくとも750、少なくとも1000、少なくとも1500、少なくとも2000、少なくとも2500、少なくとも3000、少なくとも3500、少なくとも4000、少なくとも4500、少なくとも5000、少なくとも5500、少なくとも6000、少なくとも6500、少なくとも7000、少なくとも7500、少なくとも8000、少なくとも8500、少なくとも9000、少なくとも9500、少なくとも10000個であるが、10002個未満の連続するヌクレオチドを有するポリヌクレオチドである。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号24または配列番号25の核酸1~9999の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号24または配列番号25の核酸1~9999の配列を含む。
【0058】
いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号26または配列番号27の配列の5’切断、3’切断、または断片を含む。いくつかの実施形態では、配列番号26または配列番号27の配列の5’切断、3’切断、または断片は、配列番号26または配列番号27の配列の少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも125、少なくとも150、少なくとも175、少なくとも200、少なくとも250、少なくとも300、または少なくとも350、少なくとも400、少なくとも450、少なくとも500、少なくとも750、少なくとも1000、少なくとも1500、少なくとも2000、少なくとも2500、少なくとも3000、少なくとも3500、少なくとも4000、少なくとも4500、少なくとも5000、少なくとも5500、少なくとも6000、少なくとも6500、少なくとも7000、少なくとも7500、少なくとも8000、少なくとも8500、少なくとも9000、少なくとも9500個であるが、9834個未満の連続するヌクレオチドを有するポリヌクレオチドである。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号26または配列番号27の核酸1~9831の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号26または配列番号27の核酸1~9831の配列を含む。
【0059】
いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号28または配列番号29の配列の5’切断、3’切断、または断片を含む。いくつかの実施形態では、配列番号28または配列番号29の配列の5’切断、3’切断、または断片は、配列番号28または配列番号29の少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも125、少なくとも150、少なくとも175、少なくとも200、少なくとも250、少なくとも300、または少なくとも350、少なくとも400、少なくとも450、少なくとも500、少なくとも750、少なくとも1000、少なくとも1500、少なくとも2000、少なくとも2500、少なくとも3000、少なくとも3500、少なくとも4000、少なくとも4500、少なくとも5000、であるが、5007個未満の連続するヌクレオチドを有するポリヌクレオチドである。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号28または配列番号29の核酸1~5004の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号28または配列番号29の核酸1~5004の配列を含む。
【0060】
いくつかの実施形態では、本開示の1つ以上のポリヌクレオチドは、ヒトLAMB3遺伝子(またはそのコドン最適化バリアント)のコード配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号3または配列番号4の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号3または配列番号4の配列を含む。
【0061】
いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号3または配列番号4の配列の5’切断、3’切断、または断片を含む。いくつかの実施形態では、配列番号3または配列番号4の配列の5’切断、3’切断、または断片は、配列番号3または配列番号4の少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも125、少なくとも150、少なくとも175、少なくとも200、少なくとも250、少なくとも300、または少なくとも350、少なくとも400、少なくとも450、少なくとも500、少なくとも750、少なくとも1000、少なくとも1250、少なくとも1500、少なくとも1750、少なくとも2000、2250、少なくとも2500、少なくとも2750、少なくとも3000、少なくとも3250、少なくとも3500個であるが、3519個未満の連続するヌクレオチドを有するポリヌクレオチドである。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号3または配列番号4の核酸1~3516の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号3または配列番号4の核酸1~3516の配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号3または配列番号4の核酸55~3516の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号3または配列番号4の核酸55~3516の配列を含む。
【0062】
いくつかの実施形態では、本開示の1つ以上のポリヌクレオチドは、ヒトLAMC2遺伝子(またはそのコドン最適化バリアント)のコード配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号5~6または30~31から選択される配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号5~6または30~31から選択される配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号5または配列番号6の配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号6または配列番号31の配列を含む。
【0063】
いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号5または配列番号6の配列の5’切断、3’切断、または断片を含む。いくつかの実施形態では、配列番号5または配列番号6の配列の5’切断、3’切断、または断片は、配列番号5または配列番号6の少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも125、少なくとも150、少なくとも175、少なくとも200、少なくとも250、少なくとも300、または少なくとも350、少なくとも400、少なくとも450、少なくとも500、少なくとも750、少なくとも1000、少なくとも1250、少なくとも1500、少なくとも1750、少なくとも2000、少なくとも2250、少なくとも2500、少なくとも2750、少なくとも3000、少なくとも3250、少なくとも3500個であるが、3582個未満の連続するヌクレオチドを有するポリヌクレオチドである。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号5または配列番号6の核酸1~3579の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号5または配列番号6の核酸1~3579の配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号5または配列番号6の核酸67~3579の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号5または配列番号6の核酸67~3579の配列を含む。
【0064】
いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号30または配列番号31の配列の5’切断、3’切断、または断片を含む。いくつかの実施形態では、配列番号30または配列番号31の配列の5’切断、3’切断、または断片は、配列番号30または配列番号31の少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも125、少なくとも150、少なくとも175、少なくとも200、少なくとも250、少なくとも300、または少なくとも350、少なくとも400、少なくとも450、少なくとも500、少なくとも750、少なくとも1000、少なくとも1250、少なくとも1500、少なくとも1750、少なくとも2000、2250、少なくとも2500、少なくとも2750、少なくとも3000、少なくとも3250個であるが、3336個未満の連続するヌクレオチドを有するポリヌクレオチドである。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号30または配列番号31の核酸1~3333の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号30または配列番号31の核酸1~3333の配列を含む。
【0065】
フィラグリンポリペプチドをコードするポリヌクレオチド
いくつかの実施形態では、本開示は、フィラグリン遺伝子のコード配列(例えば、プロフィラグリンポリペプチドのコード配列)またはその一部分(例えば、プロフィラグリンポリペプチドのタンパク質分解切断から(例えば、セリンプロテアーゼ切断により)生じる1つ以上のフィラグリンモノマーに対応するコード配列)を含む1つ以上のポリヌクレオチドを含む組換え核酸に関する。例えば、ヒトFLG遺伝子(例えば、NCBI遺伝子ID:2312を参照のこと)、ヒトFLG2遺伝子(例えば、NCBI遺伝子ID:388698を参照のこと)、チンパンジーFLG遺伝子(例えば、NCBI遺伝子ID:104002779を参照のこと)、チンパンジーFLG2遺伝子(例えば、NCBI遺伝子ID:100614947を参照のこと)、マウスFLG遺伝子(例えば、NCBI遺伝子ID:14246を参照のこと)、マウスFLG2遺伝子(例えば、NCBI遺伝子ID:229574を参照のこと)、ラットFLG遺伝子(例えば、NCBI遺伝子ID:24641を参照のこと)、ラットFLG2遺伝子(例えば、NCBI遺伝子ID:310586を参照のこと)、イヌFLG遺伝子(例えば、NCBI遺伝子ID:102157111を参照のこと)、イヌFLG2遺伝子(例えば、NCBI遺伝子ID:483211を参照のこと)、ウサギFLG遺伝子(例えば、NCBI遺伝子ID:100351762を参照のこと)、ウサギFLG2遺伝子(例えば、NCBI遺伝子ID:100344953を参照のこと)、ウシFLG遺伝子(例えば、NCBI遺伝子ID:788551を参照のこと)、ウシFLG2遺伝子(例えば、NCBI遺伝子ID:101909133を参照のこと)、アカゲザルFLG遺伝子(例えば、NCBI遺伝子ID:102138001、NCBI遺伝子ID:712658を参照のこと)、アカゲザルFLG2遺伝子(例えば、NCBI遺伝子ID:102140950、NCBI遺伝子ID:714566を参照のこと)等を含む、当該技術分野で既知の任意の好適なフィラグリン遺伝子(その任意のアイソフォームを含む)が、本開示のポリヌクレオチドによってコードされ得る。いくつかの実施形態では、本開示のポリヌクレオチドは、本明細書に記載のまたは当該技術分野で既知のフィラグリン遺伝子(例えば、FLG遺伝子、FLG2遺伝子)のうちのいずれかの配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、本明細書に記載のまたは当該技術分野で既知のフィラグリン遺伝子(例えば、FLG遺伝子、FLG2遺伝子)産物のタンパク質分解切断から(例えば、セリンプロテアーゼ切断により)生じる1つ以上のフィラグリンモノマーに対応するコード配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。例えば、BLAST(登録商標)blastn suite等の核酸配列アラインメントプログラムの使用を含む、追加の種由来のフィラグリン遺伝子ホモログ/オルソログを特定する方法は、当業者に既知である。
【0066】
いくつかの実施形態では、本開示のポリヌクレオチドは、本明細書に記載のまたは当該技術分野で既知のフィラグリン遺伝子のうちのいずれかのコドン最適化バリアントを含む。いくつかの実施形態では、フィラグリン遺伝子のコドン最適化バリアントの使用により、対応する非コドン最適化野生型配列の異種発現の安定性及び/または収率と比較して、標的細胞(例えば、ヒトケラチノサイトまたは線維芽細胞等の標的ヒト細胞)におけるコードされたフィラグリンポリペプチドの異種発現(RNA及び/またはタンパク質)の安定性及び/または収率が増加する。例えば、Fath et al.(PLoS One.2011 Mar 3;6(3):e17596)によって説明される方法を含む、1つ以上の標的細胞(例えば、1つ以上のヒト細胞)における発現のための配列のコドン最適化を行うための当該技術分野で既知の任意の好適な方法が使用され得る。
【0067】
いくつかの実施形態では、本開示の1つ以上のポリヌクレオチドは、ヒトフィラグリン遺伝子のコード配列を含む。いくつかの実施形態では、ヒトフィラグリン遺伝子は、ヒトFLG遺伝子、ヒトFLG2遺伝子、またはそれらの任意の派生物である。いくつかの実施形態では、本開示の1つ以上のポリヌクレオチドは、ヒトフィラグリン遺伝子のタンパク質分解切断から(例えば、セリンプロテアーゼ切断により)生じる1つ以上のフィラグリンモノマーのコード配列を含む。いくつかの実施形態では、1つ以上のフィラグリンモノマーは、ヒトFLG遺伝子及び/またはヒトFLG2遺伝子に由来するモノマーである。
【0068】
いくつかの実施形態では、本開示のポリヌクレオチドは、ヒトFLG遺伝子(またはそのコドン最適化バリアント)のコード配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の配列を含む。
【0069】
いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の配列の5’切断、3’切断、または断片を含む。いくつかの実施形態では、配列番号36または配列番号37の配列の5’切断、3’切断、または断片は、配列番号36または配列番号37の少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも125、少なくとも150、少なくとも175、少なくとも200、少なくとも250、少なくとも300、または少なくとも350、少なくとも400、少なくとも450、少なくとも500、少なくとも750、少なくとも1000、少なくとも2000、少なくとも3000、少なくとも4000、少なくとも5000、少なくとも6000、少なくとも7000、少なくとも8000、少なくとも9000、少なくとも10000、少なくとも11000、少なくとも12000個であるが、12186個未満の連続するヌクレオチドを有するポリヌクレオチドである。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸1~12183の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸1~12183の配列を含む。
【0070】
いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸1411~2385の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸1411~2385の配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸1441~2385の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸1441~2385の配列を含む。
【0071】
いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸2386~3357の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸2386~3357の配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸2416~3357の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸2416~3357の配列を含む。
【0072】
いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸3358~4329の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸3358~4329の配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸3388~4329の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸3388~4329の配列を含む。
【0073】
いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸4330~5301の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸4330~5301の配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸4360~5301の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸4360~5301の配列を含む。
【0074】
いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸5302~6276の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸5302~6276の配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸5332~6276の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸5332~6276の配列を含む。
【0075】
いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸6277~7248の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸6277~7248の配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸6307~7248の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸6307~7248の配列を含む。
【0076】
いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸7249~8220の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸7249~8220の配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸7279~8220の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸7279~8220の配列を含む。
【0077】
いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸8221~9192の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸8221~9192の配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸8251~9192の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸8251~9192の配列を含む。
【0078】
いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸9193~10164の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸9193~10164の配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸9223~10164の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸9223~10164の配列を含む。
【0079】
いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸10165~11136の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸10165~11136の配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸10195~11136の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号36または配列番号37の核酸10195~11136の配列を含む。
【0080】
いくつかの実施形態では、本開示のポリヌクレオチドは、ヒトFLG2遺伝子(またはそのコドン最適化バリアント)のコード配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号38の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号38の配列を含む。
【0081】
いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号38の配列の5’切断、3’切断、または断片を含む。いくつかの実施形態では、配列番号38の配列の5’切断、3’切断、または断片は、配列番号38の少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも125、少なくとも150、少なくとも175、少なくとも200、少なくとも250、少なくとも300、または少なくとも350、少なくとも400、少なくとも450、少なくとも500、少なくとも750、少なくとも1000、少なくとも2000、少なくとも3000、少なくとも4000、少なくとも5000、少なくとも6000、少なくとも7000個であるが、7176個未満の連続するヌクレオチドを有するポリヌクレオチドである。いくつかの実施形態では、本開示のポリヌクレオチドは、配列番号38の核酸1~7173の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。
【0082】
本開示の(例えば、ラミニンポリペプチドをコードする)ポリヌクレオチドは、追加のコード配列及び非コード配列をさらにコードし得る。追加のコード配列及び非コード配列の例には、追加のポリペプチドタグをコードする配列(例えば、融合タンパク質を産生するためにラミニンまたはフィラグリンポリペプチドとインフレームでコードされる)、イントロン(例えば、天然、修飾、または異種イントロン)、5’UTR及び/または3’UTR(例えば、天然、修飾、または異種5’UTR及び/または3’UTR)等が挙げられるが、これらに限定されない。好適なポリペプチドタグの例には、精製タグ、例えば、hisタグ、flagタグ、マルトース結合タンパク質及びグルタチオン-S-トランスフェラーゼタグ、検出タグ、例えば、測光的に検出され得るタグ(例えば、緑色蛍光タンパク質、赤色蛍光タンパク質等)及び検出可能な酵素活性を有するタグ(例えば、アルカリホスファターゼ等)、分泌配列、シグナル配列、リーダー配列、及び/または安定化配列、プロテアーゼ切断部位(例えば、フラン切断部位、TEV切断部位、トロンビン切断部位等)等を含むタグの任意の組み合わせが挙げられるが、これらに限定されない。いくつかの実施形態では、5’UTR及び/または3’UTRは、ポリヌクレオチドの安定性、局在化、及び/または翻訳効率を増加させる。いくつかの実施形態では、5’UTR及び/または3’UTRは、タンパク質発現レベル及び/または持続時間を改善する。いくつかの実施形態では、5’UTR及び/または3’UTRは、オフターゲット発現を遮断し得るまたは減少させ得る(例えば、特定の細胞型(例えば、神経細胞)における発現を、細胞周期の特定の時点で、特定の発達段階で阻害する)エレメント(例えば、1つ以上のmiRNA結合部位等)を含む。いくつかの実施形態では、5’UTR及び/または3’UTRは、特定の細胞型(ヒトケラチノサイト及び/または線維芽細胞等)におけるエフェクタータンパク質発現を強化し得るエレメント(例えば、1つ以上のmiRNA結合部位等)を含む。
【0083】
いくつかの実施形態では、本開示のポリヌクレオチドは、コードされたタンパク質(例えば、コードされたラミニンポリペプチド)のN末端のリーダー配列、シグナル配列、及び/または分泌配列を(インフレームで)コードする。例えば、天然ラミニンシグナル配列、天然フィラグリンシグナル配列、または異種もしくは合成シグナル配列を含む、当該技術分野で既知の任意のリーダー配列、シグナル配列、及び/または分泌配列が、本開示のポリヌクレオチドによってコードされ得る(例えば、von Heijne G.(1983)Patterns of amino acids near signal-sequence cleavage sites.Eur J Biochem 133(1)17-21、Martoglio B.and Dobberstein B.(1998)Signal sequences:More than just greasy peptides.Trends Cell Biol 8(10),410-5、Hegde R.S. and Bernstein H.D.(2006)The surprising complexity of signal sequences.Trends Biochem Sci 31(10),563-71、Kapp K.,Schrempf S.,Lemberg M.K.and Dobberstein B.(2009)Post-Targeting Functions of Signal Peptides.Chapter in:Protein Transport into the Endoplasmic Reticulum,Landes Bioscience、及びwww.signalpeptide.deに開示されている配列を参照のこと)。
【0084】
いくつかの実施形態では、本開示のポリヌクレオチドは、1つ以上(例えば、1つ以上、2つ以上、3つ以上、4つ以上、5つ以上、10以上等)の調節配列に作動可能に連結されている。「調節配列」という用語は、エンハンサー、インシュレーター、プロモーター、及び他の発現制御エレメント(例えば、ポリアデニル化シグナル)を含み得る。例えば、哺乳類遺伝子(例えば、グロビン、エラスターゼ、アルブミン、α-フェトタンパク質、インスリン等)由来のエンハンサー配列、真核細胞ウイルス由来のエンハンサー配列(例えば、複製起点の後半側(bp100~270)のSV40エンハンサー、サイトメガロウイルス初期プロモーターエンハンサー、複製起点の後半側のポリオーマエンハンサー、アデノウイルスエンハンサー等)、及びそれらの任意の組み合わせを含む、当該技術分野で既知の任意の好適なエンハンサー(複数可)が使用され得る。例えば、ヒトインターフェロンベータ遺伝子(IFNB1)由来の単純ヘルペスウイルス(HSV)クロマチン境界(CTRL/CTCF結合/インシュレーター)エレメントCTRL1及び/またはCTRL2、ニワトリ高感受性部位4インシュレーター(cHS4)、ヒトHNRPA2B1-CBX3ユビキタスクロマチンオープニングエレメント(UCOE)、足場/マトリックス結合領域(S/MAR)、及びそれらの任意の組み合わせを含む、当該技術分野で既知の任意の好適なインシュレーター(複数可)が使用され得る。例えば、ウイルス(例えば、ポリオーマウイルス、鶏痘ウイルス、アデノウイルス(アデノウイルス2等)、ウシ乳頭腫ウイルス、鳥肉腫ウイルス、サイトメガロウイルス、レトロウイルス、B型肝炎ウイルス、シミアンウイルス40(SV40)等)のゲノムから得られるプロモーター、異種哺乳類遺伝子由来のプロモーター(例えば、アクチンプロモーター(例えば、β-アクチンプロモーター)、ユビキチンプロモーター(例えば、ユビキチンC(UbC)プロモーター)、ホスホグリセリン酸キナーゼ(PGK)プロモーター、免疫グロブリンプロモーター、熱ショックタンパク質プロモーター等)、天然及び/または相同哺乳類遺伝子由来のプロモーター(例えば、ヒトラミニン遺伝子プロモーター、ヒトフィリン遺伝子プロモーター)、合成プロモーター(例えば、CAGGプロモーター等)、及びそれらの任意の組み合わせを含む、当該技術分野で既知の任意の好適なプロモーター(例えば、哺乳類宿主細胞での転写に好適なプロモーター)が使用され得る。調節配列は、核酸、ならびに組織特異的調節配列及び/または誘導性もしくは抑制性配列の構成的発現を指示する配列を含み得る。
【0085】
いくつかの実施形態では、本開示のポリヌクレオチドは、1つ以上の異種プロモーターに作動可能に連結されている。いくつかの実施形態では、1つ以上の異種プロモーターは、構成的プロモーター、組織特異的プロモーター、時間的プロモーター、空間的プロモーター、誘導性プロモーター、及び抑制性プロモーターのうちの1つ以上である。いくつかの実施形態では、1つ以上の異種プロモーターは、ヒトサイトメガロウイルス(HCMV)前初期プロモーター、ヒト伸長因子-1(EF1)プロモーター、ヒトβ-アクチンプロモーター、ヒトUbCプロモーター、ヒトPGKプロモーター、合成CAGGプロモーター、及びそれらの任意の組み合わせのうちの1つ以上である。いくつかの実施形態では、本開示のポリヌクレオチドは、HCMVプロモーターに作動可能に連結されている。
【0086】
いくつかの実施形態では、本開示の組換え核酸は、複数の発現カセットを含み、これらの発現カセットは各々、ポリペプチド(例えば、ラミニンポリペプチド)をコードするポリヌクレオチドを含む。いくつかの実施形態では、本開示の組換え核酸は、内部リボソーム進入部位(IRES)をコードする核酸によって連結されたポリペプチド(例えば、ラミニンポリペプチド)をコードする2つ以上のポリヌクレオチドを含む。いくつかの実施形態では、本開示の組換え核酸は、リンカーポリペプチド(例えば、切断可能なリンカーポリペプチド)をコードする核酸によって連結されたポリペプチド(例えば、ラミニンポリペプチド)をコードする2つ以上のポリヌクレオチドを含む。
【0087】
複数の発現カセットを含む組換え核酸
いくつかの実施形態では、本開示の組換え核酸は、2つ以上(例えば、2つ以上、3つ以上等)の発現カセットを含み、これらの発現カセットは各々、本開示のポリペプチド(例えば、本明細書に記載のラミニンポリペプチドのうちのいずれか)をコードするポリヌクレオチドを含む。いくつかの実施形態では、これらの発現カセットは各々、それら自身の独立した調節配列(例えば、プロモーター、エンハンサー、ポリアデニル化シグナル等)を含む。
【0088】
いくつかの実施形態では、組換え核酸は、ラミニンポリペプチドをコードするポリヌクレオチドを各々含む2つの発現カセットを含む。いくつかの実施形態では、これらの2つの発現カセットは、同一のラミニンポリペプチドをコードするポリヌクレオチドを含む。いくつかの実施形態では、これらの発現カセットは各々、LamA3ポリペプチドをコードするポリヌクレオチドを含む。いくつかの実施形態では、これらの発現カセットは各々、LamB3ポリペプチドをコードするポリヌクレオチドを含む。いくつかの実施形態では、これらの発現カセットは各々、LamC2ポリペプチドをコードするポリヌクレオチドを含む。いくつかの実施形態では、これらの2つの発現カセットは、異なるラミニンポリペプチドをコードするポリヌクレオチドを含む(例えば、第1の発現カセットが第1のラミニンポリペプチドをコードするポリヌクレオチドを含み、第2の発現カセットが第2のラミニンポリペプチドをコードするポリヌクレオチドを含む)。いくつかの実施形態では、第1の発現カセットがLamA3ポリペプチドをコードするポリヌクレオチドを含み、第2の発現カセットがLamB3ポリペプチドをコードするポリヌクレオチドを含む。いくつかの実施形態では、第1の発現カセットがLamA3ポリペプチドをコードするポリヌクレオチドを含み、第2の発現カセットがLamC2ポリペプチドをコードするポリヌクレオチドを含む。いくつかの実施形態では、第1の発現カセットがLamB3ポリペプチドをコードするポリヌクレオチドを含み、第2の発現カセットがLamC2ポリペプチドをコードするポリヌクレオチドを含む。
【0089】
いくつかの実施形態では、第1の発現カセットと第2の発現カセットは、DNA内で同じ配向である。いくつかの実施形態では、第1の発現カセットと第2の発現カセットは、DNA内で互いに反対の配向である。理論に拘束されることを望むことなく、2つの発現カセットをアンチセンス配向(DNAの反対側の鎖)で組み込むことにより、リードスルーを回避し、各カセットの適切な発現を確実にする助けとなり得る。
【0090】
いくつかの実施形態では、組換え核酸は、ラミニンポリペプチド(例えば、本明細書に記載のラミニンポリペプチドのうちのいずれか)をコードするポリヌクレオチドを各々含む3つの発現カセットを含む。いくつかの実施形態では、これらの3つの発現カセットは、同一のラミニンポリペプチドをコードするポリヌクレオチドを含む。いくつかの実施形態では、これらの発現カセットは各々、LamA3ポリペプチドをコードするポリヌクレオチドを含む。いくつかの実施形態では、これらの発現カセットは各々、LamB3ポリペプチドをコードするポリヌクレオチドを含む。いくつかの実施形態では、これらの発現カセットは各々、LamC2ポリペプチドをコードするポリヌクレオチドを含む。いくつかの実施形態では、第1の発現カセット及び第2の発現カセットが各々、同じラミニンポリペプチドをコードするポリヌクレオチドを含み、第3の発現カセットが異なるラミニンポリペプチドをコードするポリヌクレオチドを含む。いくつかの実施形態では、第1の発現カセット及び第2の発現カセットが各々、LamA3ポリペプチドをコードするポリヌクレオチドを含み、第3の発現カセットがLamB3ポリペプチドをコードするポリヌクレオチドを含む。いくつかの実施形態では、第1の発現カセット及び第2の発現カセットが各々、LamA3ポリペプチドをコードするポリヌクレオチドを含み、第3の発現カセットがLamC2ポリペプチドをコードするポリヌクレオチドを含む。いくつかの実施形態では、第1の発現カセット及び第2の発現カセットがLamB3ポリペプチドをコードするポリヌクレオチドを含み、第3の発現カセットがLamA3ポリペプチドをコードするポリヌクレオチドを含む。いくつかの実施形態では、第1の発現カセット及び第2の発現カセットが各々、LamB3ポリペプチドをコードするポリヌクレオチドを含み、第3の発現カセットがLamC2ポリペプチドをコードするポリヌクレオチドを含む。いくつかの実施形態では、第1の発現カセット及び第2の発現カセットが各々、LamC2ポリペプチドをコードするポリヌクレオチドを含み、第3の発現カセットがLamA3ポリペプチドをコードするポリヌクレオチドを含む。いくつかの実施形態では、第1の発現カセット及び第2の発現カセットが各々、LamC2ポリペプチドをコードするポリヌクレオチドを含み、第3の発現カセットがLamB3ポリペプチドをコードするポリヌクレオチドを含む。いくつかの実施形態では、これらの3つの発現カセットは、異なるラミニンポリペプチドをコードするポリヌクレオチドを含む(例えば、第1の発現カセットが第1のラミニンポリペプチドをコードする第1のポリヌクレオチドを含み、第2の発現カセットが第2のラミニンポリペプチドをコードする第2のポリヌクレオチドを含み、第3の発現カセットが第3のラミニンポリペプチドをコードする第3のポリヌクレオチドを含む)。いくつかの実施形態では、第1の発現カセットがLamA3ポリペプチドをコードする第1のポリヌクレオチドを含み、第2の発現カセットがLamB3ポリペプチドをコードする第2のポリヌクレオチドを含み、第3の発現カセットがLamC2ポリペプチドをコードする第3のポリヌクレオチドを含む。
【0091】
いくつかの実施形態では、第1の発現カセットと第2の発現カセットは、DNA内で同じ配向である。いくつかの実施形態では、第1の発現カセットと第2の発現カセットは、DNA内で互いに反対の配向である。いくつかの実施形態では、第1の発現カセットと第3の発現カセットは、DNA内で同じ配向である。いくつかの実施形態では、第1の発現カセットと第3の発現カセットは、DNA内で互いに反対の配向である。いくつかの実施形態では、第2の発現カセットと第3の発現カセットは、DNA内で同じ配向である。いくつかの実施形態では、第2の発現カセットと第3の発現カセットは、DNA内で互いに反対の配向である。
【0092】
ポリシストロニックmRNAをコードする組換え核酸
いくつかの実施形態では、本開示の組換え核酸は、IRESをコードする核酸(すなわち、少なくとも1つのポリシストロニックmRNAをコードする組換え核酸)によって連結された本開示のポリペプチド(例えば、本明細書に記載のラミニンポリペプチドのうちのいずれか)をコードする2つ以上(例えば、2つ以上、3つ以上等)のポリヌクレオチドを含む。
【0093】
いくつかの実施形態では、組換え核酸は、(a)第1のポリペプチド(例えば、第1のラミニンポリペプチド)をコードする第1のポリヌクレオチド、(b)第2のポリペプチド(例えば、第2のラミニンポリペプチド)をコードする第2のポリヌクレオチド、及び(c)(a)を(b)に連結するIRESをコードする核酸を含む。いくつかの実施形態では、第1のポリペプチドと第2のポリペプチドは同一である(例えば、第1のラミニンポリペプチド及び第2のラミニンポリペプチドはLamA3ポリペプチドである)。いくつかの実施形態では、第1のポリペプチドと第2のポリペプチドは異なる(例えば、第1のラミニンポリペプチドがLamA3ポリペプチドであり、第2のラミニンポリペプチドがLamB3ポリペプチドである)。
【0094】
いくつかの実施形態では、組換え核酸は、(a)第1のポリペプチド(例えば、第1のラミニンポリペプチド)をコードする第1のポリヌクレオチド、(b)第2のポリペプチド(例えば、第2のラミニンポリペプチド)をコードする第2のポリヌクレオチド、(c)第3のポリペプチド(例えば、第3のラミニンポリペプチド)をコードする第3のポリヌクレオチド、(d)(a)を(b)に連結する第1のIRESをコードする第1の核酸、及び(e)(b)を(c)に連結する第2のIRESをコードする第2の核酸を含む。いくつかの実施形態では、第1のポリペプチド、第2のポリペプチド、及び第3のポリペプチドは同一である(例えば、第1のラミニンポリペプチド、第2のラミニンポリペプチド、及び第3のラミニンポリペプチドはLamA3ポリペプチドである)。いくつかの実施形態では、第1のポリペプチドと第2のポリペプチドは同一であり(例えば、第1のラミニンポリペプチドと第2のラミニンポリペプチドはLamA3ポリペプチドであり)、第3のポリペプチドは異なる(例えば、第3のラミニンポリペプチドはLamB3ポリペプチドである)。いくつかの実施形態では、第1のポリペプチドと第3のポリペプチドは同一であり(例えば、第1のラミニンポリペプチドと第3のラミニンポリペプチドはLamA3ポリペプチドであり)、第2のポリペプチドは異なる(例えば、第2のラミニンポリペプチドはLamB3ポリペプチドである)。いくつかの実施形態では、第2のポリペプチドと第3のポリペプチドは同一であり(例えば、第2のラミニンポリペプチドと第3のラミニンポリペプチドはLamA3ポリペプチドであり)、第1のポリペプチドは異なる(例えば、第1のラミニンポリペプチドはLamB3ポリペプチドである)。いくつかの実施形態では、第1のポリペプチド、第2のポリペプチド、及び第3のポリペプチドは異なる(例えば、第1のラミニンポリペプチドはLamA3ポリペプチドであり、第2のラミニンポリペプチドはLamB3ポリペプチドであり、第3のラミニンポリペプチドはLamC2ポリペプチドである)。いくつかの実施形態では、第1のIRESと第2のIRESは同じである。いくつかの実施形態では、第1のIRESと第2のIRESは異なる。
【0095】
例えば、ウイルス由来IRES(例えば、ポリオウイルス、ライノウイルス、脳心筋炎ウイルス(EMCV)、口蹄疫ウイルス、C型肝炎ウイルス、古典的ブタ熱ウイルス、ラウス肉腫ウイルス、ヒト免疫不全ウイルス、クリケット麻痺ウイルス、カポジ肉腫関連ヘルペスウイルス等に由来するIRES)、細胞mRNA由来IRES(例えば、線維芽細胞増殖因子2、血小板由来増殖因子B、及び血管内皮増殖因子等の増殖因子mRNAに由来するIRES、アンテナペディア、ウルトラビソラックス、及びNF-κB抑制因子等の転写因子RNAに由来するIRES、c-myc、pim-1、及びタンパク質キナーゼp58PITSLRE等のがん遺伝子mRNAに由来するIRES)、合成IRES(例えば、CP148 IRES)、及び他のIRES(例えば、Mokrejs et al.(2007)A Bioinformatical Approach to the Analysis of Viral and Cellular Internal Ribosome Entry Sites.Columbus F editors.New Messenger RNA Research Communications.Hauppauge,NY:Nova Science Publishers;pp.133-166を参照されたく、Mokrejs et al.(2006)Nucleic Acids Res 1;34(Database issue):D125-30も参照されたい)を含む、当該技術分野で既知の任意の好適なIRESが、本開示のポリシストロニックmRNAに使用され得る。
【0096】
いくつかの実施形態では、IRESは、CP148 IRESである。CP148 IRESをコードする例示的な核酸配列は、配列番号10として提供される。いくつかの実施形態では、IRESは、EMCV IRESである。EMCV IRESをコードする例示的な核酸配列は、配列番号11として提供される。
【0097】
いくつかの実施形態では、IRESをコードする核酸配列は、配列番号10または配列番号11から選択される核酸配列に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する。いくつかの実施形態では、IRESをコードする核酸配列は、配列番号10または配列番号11の配列を有する。
【0098】
5’から3’方向に、1)第1のラミニンポリペプチドをコードする第1のポリヌクレオチド、2)IRES、及び3)第2のラミニンポリペプチドをコードする第2のポリヌクレオチドを含むポリシストロニックmRNAをコードする例示的な核酸配列は、配列番号12として提供される。5’から3’方向に、1)第1のラミニンポリペプチドをコードする第1のポリヌクレオチド、2)第1のIRES、3)第2のラミニンポリペプチドをコードする第2のポリヌクレオチド、4)第2のIRES、及び5)第3のラミニンポリペプチドをコードする第3のポリヌクレオチドを含むポリシストロニックmRNAをコードする例示的な核酸配列は、配列番号13として提供される。
【0099】
キメラポリペプチドをコードする組換え核酸
いくつかの実施形態では、本開示の組換え核酸は、リンカーポリペプチドをコードする核酸(すなわち、キメラポリペプチドをコードする組換え核酸)によって連結された本開示のポリペプチド(例えば、本明細書に記載のラミニンポリペプチドのうちのいずれか)をコードする2つ以上のポリヌクレオチドを含む。いくつかの実施形態では、リンカーポリペプチドは、切断可能なリンカーポリペプチドである。
【0100】
いくつかの実施形態では、組換え核酸は、(a)第1のポリペプチド(例えば、第1のラミニンポリペプチド)をコードする第1のポリヌクレオチド、(b)第2のポリペプチド(例えば、第2のラミニンポリペプチド)をコードする第2のポリヌクレオチド、及び(c)(a)を(b)に連結するリンカーポリペプチドをコードする核酸を含む。いくつかの実施形態では、第1のポリペプチドと第2のポリペプチドは同一である(例えば、第1のラミニンポリペプチド及び第2のラミニンポリペプチドはLamA3ポリペプチドである)。いくつかの実施形態では、第1のポリペプチドと第2のポリペプチドは異なる(例えば、第1のラミニンポリペプチドがLamA3ポリペプチドであり、第2のラミニンポリペプチドがLamB3ポリペプチドである)。いくつかの実施形態では、リンカーポリペプチドは、切断可能なリンカーポリペプチドである。
【0101】
いくつかの実施形態では、組換え核酸は、(a)第1のポリペプチド(例えば、第1のラミニンポリペプチド)をコードする第1のポリヌクレオチド、(b)第2のポリペプチド(例えば、第2のラミニンポリペプチド)をコードする第2のポリヌクレオチド、(c)第3のポリペプチド(例えば、第3のラミニンポリペプチド)をコードする第3のポリヌクレオチド、(d)(a)を(b)に連結する第1のリンカーポリペプチドをコードする第1の核酸、及び(e)(b)を(c)に連結する第2のリンカーポリペプチドをコードする第2の核酸を含む。いくつかの実施形態では、第1のポリペプチド、第2のポリペプチド、及び第3のポリペプチドは同一である(例えば、第1のラミニンポリペプチド、第2のラミニンポリペプチド、及び第3のラミニンポリペプチドはLamA3ポリペプチドである)。いくつかの実施形態では、第1のポリペプチドと第2のポリペプチドは同一であり(例えば、第1のラミニンポリペプチドと第2のラミニンポリペプチドはLamA3ポリペプチドであり)、第3のポリペプチドは異なる(例えば、第3のラミニンポリペプチドはLamB3ポリペプチドである)。いくつかの実施形態では、第1のポリペプチドと第3のポリペプチドは同一であり(例えば、第1のラミニンポリペプチドと第3のラミニンポリペプチドはLamA3ポリペプチドであり)、第2のポリペプチドは異なる(例えば、第2のラミニンポリペプチドはLamB3ポリペプチドである)。いくつかの実施形態では、第2のポリペプチドと第3のポリペプチドは同一であり(例えば、第2のラミニンポリペプチドと第3のラミニンポリペプチドはLamA3ポリペプチドであり)、第1のポリペプチドは異なる(例えば、第1のラミニンポリペプチドはLamB3ポリペプチドである)。いくつかの実施形態では、第1のポリペプチド、第2のポリペプチド、及び第3のポリペプチドは異なる(例えば、第1のラミニンポリペプチドはLamA3ポリペプチドであり、第2のラミニンポリペプチドはLamB3ポリペプチドであり、第3のラミニンポリペプチドはLamC2ポリペプチドである)。いくつかの実施形態では、第1のリンカーポリペプチドと第2のリンカーポリペプチドは同じである。いくつかの実施形態では、第1のリンカーポリペプチドと第2のリンカーポリペプチドは異なる。
【0102】
例えば、T2Aリンカー、P2Aリンカー、E2Aリンカー、F2Aリンカー等の切断可能なリンカーポリペプチドを含む、当該技術分野で既知の任意のリンカーポリペプチドが、本開示のキメラポリペプチドに使用され得る。T2Aリンカーポリペプチドをコードする例示的な核酸配列は、配列番号14として提供される。T2Aリンカーポリペプチドの例示的なアミノ酸配列は、配列番号18として提供される。いくつかの実施形態では、リンカーポリペプチドは、P2Aリンカーポリペプチドである。P2Aリンカーポリペプチドをコードする例示的な核酸配列は、配列番号15として提供される。P2Aリンカーポリペプチドの例示的なアミノ酸配列は、配列番号19として提供される。いくつかの実施形態では、リンカーポリペプチドは、E2Aリンカーポリペプチドである。E2Aリンカーポリペプチドをコードする例示的な核酸配列は、配列番号16として提供される。E2Aリンカーポリペプチドの例示的なアミノ酸配列は、配列番号20として提供される。いくつかの実施形態では、リンカーポリペプチドは、F2Aリンカーポリペプチドである。F2Aリンカーポリペプチドをコードする例示的な核酸配列は、配列番号17として提供される。F2Aリンカーポリペプチドの例示的なアミノ酸配列は、配列番号21として提供される。
【0103】
いくつかの実施形態では、リンカーポリペプチドは、配列番号18~21から選択されるアミノ酸配列に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、リンカーポリペプチドは、配列番号18~21から選択される配列を含む。
【0104】
5’から3’方向に、1)第1のラミニンポリペプチドをコードする第1のポリヌクレオチド、2)リンカーポリペプチドをコードする核酸、及び3)第2のラミニンポリペプチドをコードする第2のポリヌクレオチドを含む(キメラポリペプチドをコードする)例示的な核酸配列は、配列番号22として提供される。5’から3’方向に、1)第1のラミニンポリペプチドをコードする第1のポリヌクレオチド、2)第1のリンカーポリペプチドをコードする第1の核酸、3)第2のラミニンポリペプチドをコードする第2のポリヌクレオチド、4)第2のリンカーポリペプチドをコードする第2の核酸、及び5)第3のラミニンポリペプチドをコードする第3のポリヌクレオチドを含む(キメラポリペプチドをコードする)例示的な核酸配列は、配列番号23として提供される。
【0105】
いくつかの実施形態では、本開示の組換え核酸は、コラーゲンアルファ-1(VII)鎖ポリペプチド(COL7)(例えば、それをコードする導入遺伝子)のコード配列を含むポリヌクレオチドを含まない。いくつかの実施形態では、本開示の組換え核酸は、リシルヒドロキシラーゼ3ポリペプチド(LH3)(例えば、それをコードする導入遺伝子)のコード配列を含むポリヌクレオチドを含まない。いくつかの実施形態では、本開示の組換え核酸は、ケラチンI型細胞骨格17ポリペプチド(KRT17)(例えば、それをコードする導入遺伝子)のコード配列を含むポリヌクレオチドを含まない。いくつかの実施形態では、本開示の組換え核酸は、トランスグルタミナーゼ(TGM)ポリペプチド(例えば、ヒトTGM1ポリペプチド等のヒトトランスグルタミナーゼポリペプチド)(例えば、それをコードする導入遺伝子)のコード配列を含むポリヌクレオチドを含まない。いくつかの実施形態では、本開示の組換え核酸は、美容タンパク質、コラーゲンタンパク質、フィブロネクチン、エラスチン、ルミカン、ビトロネクチン/ビトロネクチン受容体、神経調節物質、フィブリリン、追加の皮膚細胞外マトリックスタンパク質等(例えば、それをコードする導入遺伝子)のコード配列を含むポリヌクレオチドを含まない。いくつかの実施形態では、本開示の組換え核酸は、抗体(例えば、全長抗体、抗体断片等)(例えば、それをコードする導入遺伝子)のコード配列を含むポリヌクレオチドを含まない。いくつかの実施形態では、本開示の組換え核酸は、フィラグリンポリペプチド(例えば、それをコードする導入遺伝子)のコード配列を含むポリヌクレオチドを含まない。いくつかの実施形態では、本開示の組換え核酸は、セリンプロテアーゼインヒビターKazal型(SPINK)ポリペプチド(例えば、ヒトSPINK5ポリペプチド等のヒトSPINKポリペプチド)(例えば、それをコードする導入遺伝子)のコード配列を含むポリヌクレオチドを含まない。いくつかの実施形態では、本開示の組換え核酸は、コラーゲンアルファ-1(VII)鎖ポリペプチド、リシルヒドロキシラーゼ3ポリペプチド、ケラチンI型細胞骨格17ポリペプチド、及び/またはそれらの任意のキメラポリペプチド(例えば、それをコードする導入遺伝子)のコード配列を含むポリヌクレオチドを含まない。いくつかの実施形態では、本開示の組換え核酸は、コラーゲンアルファ-1(VII)鎖ポリペプチド、リシルヒドロキシラーゼ3ポリペプチド、ケラチンI型細胞骨格17ポリペプチド、トランスグルタミナーゼ(TGM)ポリペプチド、抗体、SPINKポリペプチド、及び/またはそれらの任意のキメラポリペプチド(例えば、それをコードする導入遺伝子)のコード配列を含むポリヌクレオチドを含まない。
【0106】
ラミニンポリペプチド
いくつかの実施形態では、本開示は、ラミニン(Lam)ポリペプチド(例えば、ヒトラミニンポリペプチド)またはその任意の一部分をコードする1つ以上のポリヌクレオチドに関する。例えば、ラミニンサブユニットアルファ-1(LamA1)ポリペプチド(例えば、UniProt受入番号P25391を参照のこと)、ラミニンサブユニットアルファ-2(LamA2)ポリペプチド(例えば、UniProt受入番号P24043を参照のこと)、ラミニンサブユニットアルファ-3(LamA3)ポリペプチド(例えば、UniProt受入番号Q16787を参照のこと)、ラミニンサブユニットアルファ-4(LamA4)ポリペプチド(例えば、UniProt受入番号Q16363を参照のこと)、ラミニンサブユニットアルファ-5(LamA5)ポリペプチド(例えば、UniProt受入番号O15230を参照のこと)、ラミニンサブユニットベータ-1(LamB1)ポリペプチド(例えば、UniProt受入番号P07942を参照のこと)、ラミニンサブユニットベータ-2(LamB2)ポリペプチド(例えば、UniProt受入番号P55268を参照のこと)、ラミニンサブユニットベータ-3(LamB3)ポリペプチド(例えば、UniProt受入番号Q13751を参照のこと)、ラミニンサブユニットガンマ-1(LamC1)ポリペプチド(例えば、UniProt受入番号P11047を参照のこと)、ラミニンサブユニットガンマ-2(LamC2)ポリペプチド(例えば、UniProt受入番号Q13753を参照のこと)、ラミニンサブユニットガンマ-3(LamC3)ポリペプチド(例えば、UniProt受入番号Q9Y6N6を参照のこと)等を含む、当該技術分野で既知の任意の好適なラミニンポリヌクレオチドが、本開示のポリヌクレオチドによってコードされ得る。いくつかの実施形態では、ラミニンポリペプチドは、LamB3ポリペプチドではない。非ヒトラミニンポリペプチドの例には、例えば、マウスラミニン(例えば、UniProt受入番号Q61789、Q61087、及びQ61092を参照のこと)、ラットラミニン(例えば、UniProt受入番号D3ZN05、F1LPI5、及びF1LRH4を参照のこと)、チンパンジーラミニン(例えば、UniProt受入番号H2QEC7、H2R041、及びH2Q0R2を参照のこと)等が挙げられる。いくつかの実施形態では、本開示のラミニンポリペプチドは、本明細書に記載のまたは当該技術分野で既知の任意のラミニンポリペプチドのアミノ酸配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。例えば、BLAST(登録商標)blastp suiteまたはOrthoDB等のアミノ酸配列アラインメントプログラムの使用を含む、追加の種由来のラミニンポリペプチドホモログ/オルソログを特定する方法は、当業者に既知である。
【0107】
いくつかの実施形態では、本開示のラミニンポリペプチドは、配列番号7~9または32~35から選択されるアミノ酸配列に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含むか、それらから本質的になるか、またはそれらからなる。いくつかの実施形態では、本開示のラミニンポリペプチドは、配列番号7~9または32~35から選択される配列を含むか、それから本質的になるか、またはそれからなる。
【0108】
いくつかの実施形態では、ラミニンポリペプチドは、ヒトラミニンポリペプチドである。いくつかの実施形態では、ヒトラミニンポリペプチドをコードするポリヌクレオチドは、配列番号7~9または32~35から選択される配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有するアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、ヒトラミニンポリペプチドをコードするポリヌクレオチドは、配列番号7~9または32~35から選択されるアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドである。
【0109】
いくつかの実施形態では、ヒトラミニンポリペプチドは、ヒトLamA3ポリペプチド(例えば、配列番号7)、ヒトLamB3ポリペプチド(例えば、配列番号8)、ヒトLamC2ポリペプチド(例えば、配列番号9)、またはそれらの任意の派生物である。
【0110】
いくつかの実施形態では、本開示のポリヌクレオチドは、ヒトLamA3ポリペプチドをコードする。いくつかの実施形態では、LamA3ポリペプチドをコードするポリヌクレオチドは、配列番号7または32~34から選択される配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有するアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、ヒトLAMA3ポリペプチドをコードするポリヌクレオチドは、配列番号7または32~34から選択されるアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドである。
【0111】
いくつかの実施形態では、LamA3ポリペプチドをコードするポリヌクレオチドは、配列または配列番号7と少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有するアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、ヒトLamA3ポリペプチドをコードするポリヌクレオチドは、配列番号7のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドである。
【0112】
いくつかの実施形態では、LamA3ポリペプチドをコードするポリヌクレオチドは、配列番号7のアミノ酸配列のN末端切断、C末端切断、または断片をコードするポリヌクレオチドである。N末端切断、C末端切断、または断片は、配列番号7の少なくとも10、少なくとも12、少なくとも14、少なくとも16、少なくとも18、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも75、少なくとも100、少なくとも200、少なくとも300、少なくとも400、少なくとも500、少なくとも750、少なくとも1000、少なくとも1250、少なくとも1500個であるが、1724個未満の連続するアミノ酸を含み得る。いくつかの実施形態では、LamA3ポリペプチドをコードするポリヌクレオチドは、配列番号7のアミノ酸28~1724の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有するアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、ヒトLamA3ポリペプチドをコードするポリヌクレオチドは、配列番号7のアミノ酸28~1724を含むポリペプチドをコードするポリヌクレオチドである。
【0113】
いくつかの実施形態では、LamA3ポリペプチドをコードするポリヌクレオチドは、配列または配列番号32と少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有するアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、ヒトLamA3ポリペプチドをコードするポリヌクレオチドは、配列番号32のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドである。
【0114】
いくつかの実施形態では、LamA3ポリペプチドをコードするポリヌクレオチドは、配列番号32のアミノ酸配列のN末端切断、C末端切断、または断片をコードするポリヌクレオチドである。N末端切断、C末端切断、または断片は、配列番号32の少なくとも10、少なくとも12、少なくとも14、少なくとも16、少なくとも18、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも75、少なくとも100、少なくとも200、少なくとも300、少なくとも400、少なくとも500、少なくとも750、少なくとも1000、少なくとも1250、少なくとも1500、少なくとも1750、少なくとも2000、少なくとも2250、少なくとも2500、少なくとも2750、少なくとも3000、少なくとも3250個であるが、3333個未満の連続するアミノ酸を含み得る。
【0115】
いくつかの実施形態では、LamA3ポリペプチドをコードするポリヌクレオチドは、配列または配列番号33と少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有するアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、ヒトLamA3ポリペプチドをコードするポリヌクレオチドは、配列番号33のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドである。
【0116】
いくつかの実施形態では、LamA3ポリペプチドをコードするポリヌクレオチドは、配列番号33のアミノ酸配列のN末端切断、C末端切断、または断片をコードするポリヌクレオチドである。N末端切断、C末端切断、または断片は、配列番号33の少なくとも10、少なくとも12、少なくとも14、少なくとも16、少なくとも18、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも75、少なくとも100、少なくとも200、少なくとも300、少なくとも400、少なくとも500、少なくとも750、少なくとも1000、少なくとも1250、少なくとも1500、少なくとも1750、少なくとも2000、少なくとも2250、少なくとも2500、少なくとも2750、少なくとも3000、少なくとも3250個であるが、3277個未満の連続するアミノ酸を含み得る。
【0117】
いくつかの実施形態では、LamA3ポリペプチドをコードするポリヌクレオチドは、配列または配列番号34と少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有するアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、ヒトLamA3ポリペプチドをコードするポリヌクレオチドは、配列番号34のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドである。
【0118】
いくつかの実施形態では、LamA3ポリペプチドをコードするポリヌクレオチドは、配列番号34のアミノ酸配列のN末端切断、C末端切断、または断片をコードするポリヌクレオチドである。N末端切断、C末端切断、または断片は、配列番号34の少なくとも10、少なくとも12、少なくとも14、少なくとも16、少なくとも18、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも75、少なくとも100、少なくとも200、少なくとも300、少なくとも400、少なくとも500、少なくとも750、少なくとも1000、少なくとも1250、少なくとも1500個であるが、1668個未満の連続するアミノ酸を含み得る。
【0119】
いくつかの実施形態では、本開示のポリヌクレオチドは、ヒトLamB3ポリペプチドをコードする。いくつかの実施形態では、LamB3ポリペプチドをコードするポリヌクレオチドは、配列番号8の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有するアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、ヒトLamB3ポリペプチドをコードするポリヌクレオチドは、配列番号8のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドである。
【0120】
いくつかの実施形態では、LamB3ポリペプチドをコードするポリヌクレオチドは、配列番号8のアミノ酸配列のN末端切断、C末端切断、または断片をコードするポリヌクレオチドである。N末端切断、C末端切断、または断片は、配列番号8の少なくとも10、少なくとも12、少なくとも14、少なくとも16、少なくとも18、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも75、少なくとも100、少なくとも200、少なくとも300、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100個であるが、1172個未満の連続するアミノ酸を含み得る。いくつかの実施形態では、LamB3ポリペプチドをコードするポリヌクレオチドは、配列番号8のアミノ酸18~1172の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有するアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、ヒトLamB3ポリペプチドをコードするポリヌクレオチドは、配列番号8のアミノ酸18~1172を含むポリペプチドをコードするポリヌクレオチドである。
【0121】
いくつかの実施形態では、本開示のポリヌクレオチドは、ヒトLamC2ポリペプチドをコードする。いくつかの実施形態では、LamC2ポリペプチドをコードするポリヌクレオチドは、配列番号9または配列番号35の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有するアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、ヒトLAMC2ポリペプチドをコードするポリヌクレオチドは、配列番号9または配列番号35のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドである。
【0122】
いくつかの実施形態では、LamC2ポリペプチドをコードするポリヌクレオチドは、配列番号9のアミノ酸配列のN末端切断、C末端切断、または断片をコードするポリヌクレオチドである。N末端切断、C末端切断、または断片は、配列番号9の少なくとも10、少なくとも12、少なくとも14、少なくとも16、少なくとも18、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも75、少なくとも100、少なくとも200、少なくとも300、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100個であるが、1193個未満の連続するアミノ酸を含み得る。いくつかの実施形態では、LamC2ポリペプチドをコードするポリヌクレオチドは、配列番号9のアミノ酸22~1193の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有するアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、ヒトLamC2ポリペプチドをコードするポリヌクレオチドは、配列番号9のアミノ酸22~1193を含むポリペプチドをコードするポリヌクレオチドである。
【0123】
いくつかの実施形態では、LamC2ポリペプチドをコードするポリヌクレオチドは、配列番号35のアミノ酸配列のN末端切断、C末端切断、または断片をコードするポリヌクレオチドである。N末端切断、C末端切断、または断片は、配列番号35の少なくとも10、少なくとも12、少なくとも14、少なくとも16、少なくとも18、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも75、少なくとも100、少なくとも200、少なくとも300、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100個であるが、1111個未満の連続するアミノ酸を含み得る。
【0124】
いくつかの実施形態では、ラミニンポリペプチド(例えば、ヒトラミニンポリペプチド)をコードする本開示のポリヌクレオチドは、ポリヌクレオチドが対象の1つ以上の標的細胞(例えば、1つ以上の皮膚及び/または粘膜細胞)に送達されると、ラミニンポリペプチドを発現する。いくつかの実施形態では、ラミニンポリペプチドは、(例えば、外因性ラミニンポリペプチドの発現前と比較して)対象の1つ以上の標的細胞におけるラミニンポリペプチドのレベル、機能、及び/または活性を強化する、増加させる、増強する、及び/または補充する。いくつかの実施形態では、ラミニンポリペプチドの発現は、対象の皮膚及び/または粘膜中の1つ以上の細胞の細胞接着を強化する、増加させる、増強する、及び/または補充する。いくつかの実施形態では、ラミニンポリペプチドの発現は、対象の透明帯を強化する、増加させる、増強する、及び/または補充する。いくつかの実施形態では、ラミニンポリペプチドの発現は、対象における上皮基底膜集合、組織化、及び/または接着を強化する、増加させる、増強する、及び/または補充する。
【0125】
フィラグリンポリペプチド
いくつかの実施形態では、本開示は、フィラグリンポリペプチド(例えば、全長プロフィラグリンポリペプチド)またはその一部分(例えば、全長プロフィラグリンポリペプチドのタンパク質分解切断から(例えば、セリンプロテアーゼ切断により)生じる1つ以上のフィラグリンモノマーのアミノ酸配列)をコードする1つ以上のポリヌクレオチドに関する。例えば、ヒトフィラグリンポリペプチド(例えば、UniProt受入番号P20930を参照のこと)、ヒトフィラグリン-2ポリペプチド(例えば、UniProt受入番号Q5D862を参照のこと)、チンパンジーフィラグリンポリペプチド(例えば、UniProt受入番号H2R8N0、UniProt受入番号A0A2J8JJv8を参照のこと)、チンパンジーフィラグリン-2ポリペプチド(例えば、UniProt受入番号H2Q003を参照のこと)、マウスフィラグリンポリペプチド(例えば、UniProt受入番号P11088を参照のこと)、マウスフィラグリン-2ポリペプチド(例えば、UniProt受入番号Q2VIS4を参照のこと)、ラットフィラグリンポリペプチド(例えば、UniProt受入番号Q8CIU0を参照のこと)、ラットフィラグリン-2ポリペプチド(例えば、UniProt受入番号M0RBW0を参照のこと)、ウサギフィラグリン-2ポリペプチド(例えば、UniProt受入番号G1T229を参照のこと)、アカゲザルフィラグリンポリペプチド(例えば、UniProt受入番号A0A0U4MFE5を参照のこと)、アカゲザルフィラグリン-2ポリペプチド(例えば、UniProt受入番号F6Q6L1、UniProt受入番号A0A2K5W550を参照のこと)等を含む、当該技術分野で既知の任意の好適なフィラグリンポリペプチドが、本開示のポリヌクレオチドによってコードされ得る。いくつかの実施形態では、本開示のフィラグリンポリペプチドは、本明細書に記載のまたは当該技術分野で既知のフィラグリンポリペプチドのうちのいずれかのアミノ酸配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示のフィラグリンポリペプチドは、本明細書に記載のまたは当該技術分野で既知の全長フィラグリンポリペプチドのうちのいずれかのタンパク質分解切断から(例えば、セリンプロテアーゼ切断により)生じる1つ以上のフィラグリンモノマーに対応するアミノ酸配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む。例えば、BLAST(登録商標)blastp suiteまたはOrthoDB等のアミノ酸配列アラインメントプログラムの使用を含む、追加の種由来のフィラグリンポリペプチドホモログ/オルソログを特定する方法は、当業者に既知である。
【0126】
いくつかの実施形態では、本開示のフィラグリンポリペプチドは、ヒトフィラグリンポリペプチドである。いくつかの実施形態では、ヒトフィラグリンポリペプチドは、ヒトフィラグリンポリペプチド(例えば、配列番号39)、ヒトフィラグリン-2ポリペプチド(例えば、配列番号50)、またはそれらの任意の派生物である。
【0127】
いくつかの実施形態では、本開示のポリヌクレオチドは、ヒトフィラグリンポリペプチドをコードする。いくつかの実施形態では、フィラグリンポリペプチドをコードするポリヌクレオチドは、配列番号39の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、ヒトフィラグリンポリペプチドをコードするポリヌクレオチドは、配列番号39のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドである。
【0128】
いくつかの実施形態では、ヒトフィラグリンポリペプチドをコードするポリヌクレオチドは、配列番号39のアミノ酸配列のN末端切断、C末端切断、または断片をコードするポリヌクレオチドである。N末端切断、C末端切断、または断片は、配列番号39の少なくとも10、少なくとも12、少なくとも14、少なくとも16、少なくとも18、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも75、少なくとも100、少なくとも200、少なくとも300、少なくとも400、少なくとも500、少なくとも1000、少なくとも2000、少なくとも3000、少なくとも4000個であるが、4061個未満の連続するアミノ酸を含み得る。
【0129】
いくつかの実施形態では、本開示のポリヌクレオチドは、ヒトフィラグリン-2ポリペプチドをコードする。いくつかの実施形態では、フィラグリン-2ポリペプチドをコードするポリヌクレオチドは、配列番号50の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、ヒトフィラグリン-2ポリペプチドをコードするポリヌクレオチドは、配列番号50のアミノ酸配列を含むポリペプチドをコードするポリヌクレオチドである。
【0130】
いくつかの実施形態では、ヒトフィラグリン-2ポリペプチドをコードするポリヌクレオチドは、配列番号50のアミノ酸配列のN末端切断、C末端切断、または断片をコードするポリヌクレオチドである。N末端切断、C末端切断、または断片は、配列番号50の少なくとも10、少なくとも12、少なくとも14、少なくとも16、少なくとも18、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも75、少なくとも100、少なくとも200、少なくとも300、少なくとも400、少なくとも500、少なくとも1000、少なくとも1500、少なくとも2000、少なくとも2100、少なくとも2200、少なくとも2300個であるが、2391個未満の連続するアミノ酸であり得る。
【0131】
いくつかの実施形態では、本開示のフィラグリンポリペプチドは、全長ヒトフィラグリンポリペプチドのタンパク質分解切断から(例えば、セリンプロテアーゼ切断により)生じる1つ以上のフィラグリンモノマーのアミノ酸配列を含むか、それから本質的になるか、またはそれからなる。いくつかの実施形態では、1つ以上のフィラグリンモノマーは、全長ヒトフィラグリンポリペプチド(例えば、配列番号39)または全長ヒトフィラグリン-2ポリペプチド(例えば、配列番号50)に由来するモノマーである。
【0132】
いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号40の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号40のアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号40のアミノ酸11~325と少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号40のアミノ酸11~325を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。
【0133】
いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号41の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号41のアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号41のアミノ酸11~324と少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号41のアミノ酸11~324を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。
【0134】
いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号42の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号42のアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号42のアミノ酸11~324と少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号42のアミノ酸11~324を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。
【0135】
いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号43の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号43のアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号43のアミノ酸11~324と少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号43のアミノ酸11~324を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。
【0136】
いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号44の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号44のアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号44のアミノ酸11~325と少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号44のアミノ酸11~325を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。
【0137】
いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号45の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号45のアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号45のアミノ酸11~324と少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号45のアミノ酸11~324を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。
【0138】
いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号46の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、配列番号46のアミノ酸配列を含むか、またはそれからなるフィラグリンモノマーをコードするポリヌクレオチド。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号46のアミノ酸11~324と少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号46のアミノ酸11~324を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。
【0139】
いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号47の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号47のアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号47のアミノ酸11~324と少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号47のアミノ酸11~324を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。
【0140】
いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号48の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号48のアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号48のアミノ酸11~324と少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号48のアミノ酸11~324を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。
【0141】
いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号49の配列に対して少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号49のアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号49のアミノ酸11~324と少なくとも75%、少なくとも80%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の同一性を有するアミノ酸配列を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンモノマーをコードするポリヌクレオチドは、配列番号49のアミノ酸11~324を含むか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。
【0142】
いくつかの実施形態では、フィラグリンポリペプチドをコードする本開示のポリヌクレオチドは、配列番号39~50から選択されるアミノ酸配列に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含むか、それから本質的になるか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。いくつかの実施形態では、フィラグリンポリペプチドをコードする本開示のポリヌクレオチドは、配列番号39~50から選択される配列を含むか、それから本質的になるか、またはそれからなるポリペプチドをコードするポリヌクレオチドである。
【0143】
いくつかの実施形態では、フィラグリンポリペプチド(例えば、ヒトフィラグリンポリペプチド)をコードする本開示のポリヌクレオチドは、ポリヌクレオチドが対象の1つ以上の標的細胞に送達されると、フィラグリンポリペプチドを発現する。いくつかの実施形態では、フィラグリンポリペプチド(例えば、ヒトフィラグリンポリペプチド)の発現は、(例えば、フィラグリンポリペプチドの発現前と比較して)対象の1つ以上の標的細胞におけるフィラグリンポリペプチドのレベル、機能、及び/または活性を強化する、増加させる、増強する、及び/または補充する。いくつかの実施形態では、フィラグリンポリペプチド(例えば、ヒトフィラグリンポリペプチド)の発現は、(例えば、フィラグリンポリペプチドの発現前と比較して)対象の皮膚の角質層の生成を強化する及び/または皮膚の角質層を安定化する。いくつかの実施形態では、フィラグリンポリペプチド(例えば、ヒトフィラグリンポリペプチド)の発現は、(例えば、フィラグリンポリペプチドの発現前と比較して)対象における皮膚バリア機能欠損(例えば、TEWL)を軽減するまたは治療する。いくつかの実施形態では、フィラグリンポリペプチド(例えば、ヒトフィラグリンポリペプチド)の発現は、(例えば、フィラグリンポリペプチドの発現前と比較して)対象におけるアレルゲンの経皮移入を減少させるまたは阻害する。いくつかの実施形態では、フィラグリンポリペプチド(例えば、ヒトフィラグリンポリペプチド)の発現は、(例えば、フィラグリンポリペプチドの発現前と比較して)対象における皮膚障害(例えば、アトピー性皮膚炎)の予防的、姑息的、または治療的緩和を提供する。
【0144】
組換え核酸
いくつかの実施形態では、本開示は、本明細書に記載のポリヌクレオチドのうちのいずれか1つ以上を含む組換え核酸に関する。いくつかの実施形態では、組換え核酸は、ベクター(例えば、発現ベクター、ディスプレイベクター等)である。いくつかの実施形態では、ベクターは、DNAベクターまたはRNAベクターである。一般に、ポリヌクレオチドを維持する、増殖させる、及び/または発現して、対象において1つ以上のポリペプチドを産生するのに好適なベクターが使用され得る。好適なベクターの例には、例えば、プラスミド、コスミド、エピソーム、トランスポゾン、及びウイルスベクター(例えば、アデノウイルスベクター、アデノ随伴ウイルスベクター、ワクシニアウイルスベクター、シンドビスウイルスベクター、麻疹ベクター、ヘルペスウイルスベクター、レンチウイルスベクター、レトロウイルスベクター等)が挙げられ得る。いくつかの実施形態では、ベクターは、ヘルペスウイルスベクターである。いくつかの実施形態では、ベクターは、宿主細胞内で自己複製することができる。いくつかの実施形態では、ベクターは、宿主細胞内で自己複製することができない。いくつかの実施形態では、ベクターは、宿主DNAに組み込むことができる。いくつかの実施形態では、ベクターは、宿主DNAに組み込むことができない(例えば、エピソーム性である)。例えば、化学合成または核酸の単離されたセグメントの人為的操作(例えば、遺伝子操作技法)等による、目的とする1つ以上のポリヌクレオチドを含むベクターを作製する方法は、当業者に周知である。
【0145】
いくつかの実施形態では、本開示の組換え核酸は、単純ヘルペスウイルス(HSV)アンプリコンである。構造的特徴を含むヘルペスウイルスアンプリコン及びそれを作製する方法は、当業者に一般に既知である(例えば、de Silva S.and Bowers W.“Herpes Virus Amplicon Vectors”.Viruses 2009,1,594-629を参照のこと)。いくつかの実施形態では、単純ヘルペスウイルスアンプリコンは、HSV-1アンプリコンである。いくつかの実施形態では、単純ヘルペスウイルスアンプリコンは、HSV-1ハイブリッドアンプリコンである。HSV-1ハイブリッドアンプリコンの例には、HSV/AAVハイブリッドアンプリコン、HSV/EBVハイブリッドアンプリコン、HSV/EBV/RVハイブリッドアンプリコン、及び/またはHSV/スリーピングビューティーハイブリッドアンプリコンが挙げられ得るが、これらに限定されない。いくつかの実施形態では、アンプリコンは、HSV/AAVハイブリッドアンプリコンである。いくつかの実施形態では、アンプリコンは、HSV/スリーピングビューティーハイブリッドアンプリコンである。
【0146】
いくつかの実施形態では、本開示の組換え核酸は、組換えヘルペスウイルスゲノムである。例えば、組換え単純ヘルペスウイルスゲノム、組換え水痘帯状疱疹ウイルスゲノム、組換えヒトサイトメガロウイルスゲノム、組換えヘルペスウイルス6Aゲノム、組換えヘルペスウイルス6Bゲノム、組換えヘルペスウイルス7ゲノム、組換えカポジ肉腫関連ヘルペスウイルスゲノム、及びそれらの任意の組み合わせまたは派生物を含む、組換えヘルペスウイルスゲノムは、当該技術分野で既知のDNAウイルスのヘルペスウイルス科ファミリーの任意のメンバー由来の組換えゲノムであり得る。いくつかの実施形態では、組換えヘルペスウイルスゲノムは、1つ以上(例えば、1つ以上、2つ以上、3つ以上、4つ以上、5つ以上、6つ以上、7つ以上、8つ以上、9つ以上、10以上等)の不活性化変異を含む。いくつかの実施形態では、1つ以上の不活性化変異は、1つ以上(例えば、1つ以上、2つ以上、3つ以上、4つ以上、5つ以上、6つ以上、7つ以上、8つ以上、9つ以上、10以上等)のヘルペスウイルス遺伝子に存在する。いくつかの実施形態では、組換えヘルペスウイルスゲノムは、(例えば、対応する野生型ヘルペスウイルスゲノムと比較して)弱毒化されている。いくつかの実施形態では、組換えヘルペスウイルスゲノムは、複製可能である。いくつかの実施形態では、組換えヘルペスウイルスゲノムは、複製欠損である。
【0147】
いくつかの実施形態では、組換え核酸は、組換え単純ヘルペスウイルス(HSV)ゲノムである。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、組換え単純ヘルペスウイルス1型(HSV-1)ゲノム、組換え単純ヘルペスウイルス2型(HSV-2)ゲノム、またはそれらの任意の派生物である。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、組換えHSV-1ゲノムである。いくつかの実施形態では、組換えHSV-1ゲノムは、例えば、株17、Ty25、R62、S25、Ku86、S23、R11、Ty148、Ku47、H166syn、1319-2005、F-13、M-12、90237、F-17、KOS、3083-2008、F12g、L2、CD38、H193、M-15、India 2011、0116209、F-11I、66-207、2762、369-2007、3355、MacIntyre、McKrae、7862、7-hse、HF10、1394,2005、270-2007、OD4、SC16、M-19、4J1037、5J1060、J1060、KOS79、132-1988、160-1982、H166、2158-2007、RE、78326、F18g、F11、172-2010、H129、F、E4、CJ994、F14g、E03、E22、E10、E06、E11、E25、E23、E35、E15、E07、E12、E14、E08、E19、E13、ATCC 2011等を含む、当該技術分野で既知の任意のHSV-1株由来であり得る(例えば、Bowen et al.J Virol.2019 Apr 3;93(8)を参照のこと)。いくつかの実施形態では、組換えHSV-1ゲノムは、KOS株由来である。いくつかの実施形態では、組換えHSV-1ゲノムは、McKrae株由来ではない。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、弱毒化されている。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、複製可能である。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、複製欠損である。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、1つ以上(例えば、1つ以上、2つ以上、3つ以上、4つ以上、5つ以上、6つ以上、7つ以上、8つ以上、9つ以上、10以上等)の不活性化変異を含む。いくつかの実施形態では、1つ以上の不活性化変異は、1つ以上(例えば、1つ以上、2つ以上、3つ以上、4つ以上、5つ以上、6つ以上、7つ以上、8つ以上、9つ以上、10以上等)の単純ヘルペスウイルス遺伝子に存在する。本明細書で使用される場合、「不活性化変異」とは、(例えば、不活性化変異を欠く対応する配列と比較して)低下した、検出不能な、または排除された量及び/または機能を有する遺伝子またはレギュロン産物(RNAまたはタンパク質)をもたらす任意の変異を指し得る。不活性化変異の例には、欠失、挿入、点変異、ならびに所与の遺伝子もしくはレギュロンの転写制御配列(プロモーター、エンハンサー、インシュレーター等)及び/またはコード配列の再編成が挙げられ得るが、これらに限定されない。例えば、qPCR、ノーザンブロット、RNAseq、ウエスタンブロット、ELISA等を含む、当該技術分野で既知の遺伝子またはレギュロン産物の量を測定する任意の好適な方法が使用され得る。
【0148】
いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、感染細胞タンパク質(または感染細胞ポリペプチド)(ICP)0、ICP4、ICP22、ICP27、ICP47、チミジンキナーゼ(tk)、ロングユニーク領域(UL)41、及び/またはUL55単純ヘルペスウイルス遺伝子のうちの少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、または8つ全てに不活性化変異を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP34.5(一方または両方のコピー)単純ヘルペスウイルス遺伝子及び/またはICP47単純ヘルペスウイルス遺伝子に不活性化変異を含まない(例えば、免疫刺激ウイルスの産生を回避するために)。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP34.5(一方または両方のコピー)単純ヘルペスウイルス遺伝子に不活性化変異を含まない。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP47単純ヘルペスウイルス遺伝子に不活性化変異を含まない。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP34.5(一方または両方のコピー)単純ヘルペスウイルス遺伝子及びICP47単純ヘルペスウイルス遺伝子に不活性化変異を含まない。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、腫瘍溶解性ではない。
【0149】
いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP0遺伝子(一方または両方のコピー)に不活性化変異を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP0遺伝子(一方または両方のコピー)に不活性化変異を含み、ICP4(一方または両方のコピー)、ICP22、ICP27、ICP47、UL41、及び/またはUL55遺伝子に不活性化変異をさらに含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP0遺伝子(一方または両方のコピー)に不活性化変異を含み、ICP4遺伝子(一方または両方のコピー)に不活性化変異を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP0遺伝子(一方または両方のコピー)に不活性化変異を含み、ICP22遺伝子に不活性化変異を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP0遺伝子(一方または両方のコピー)に不活性化変異を含み、UL41遺伝子に不活性化変異を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP0遺伝子(一方または両方のコピー)に不活性化変異を含み、ICP4遺伝子(一方または両方のコピー)に不活性化変異を含み、ICP22遺伝子に不活性化変異を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP0遺伝子(一方または両方のコピー)に不活性化変異を含み、ICP4遺伝子(一方または両方のコピー)に不活性化変異を含み、UL41遺伝子に不活性化変異を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP0遺伝子(一方または両方のコピー)に不活性化変異を含み、ICP22遺伝子に不活性化変異を含み、UL41遺伝子に不活性化変異を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP0遺伝子(一方または両方のコピー)に不活性化変異を含み、ICP4遺伝子(一方または両方のコピー)に不活性化変異を含み、ICP22遺伝子に不活性化変異を含み、UL41遺伝子に不活性化変異を含む。いくつかの実施形態では、不活性化変異は、ICP0(一方または両方のコピー)、ICP4(一方または両方のコピー)、ICP22、及び/またはUL41遺伝子のコード配列の欠失である。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP27、ICP47、及び/またはUL55遺伝子に不活性化変異をさらに含む。
【0150】
いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP4遺伝子(一方または両方のコピー)に不活性化変異を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP4遺伝子(一方または両方のコピー)に不活性化変異を含み、ICP0(一方または両方のコピー)、ICP22、ICP27、ICP47、UL41、及び/またはUL55遺伝子に不活性化変異をさらに含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP4遺伝子(一方または両方のコピー)に不活性化変異を含み、ICP22遺伝子に不活性化変異を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP4遺伝子(一方または両方のコピー)に不活性化変異を含み、UL41遺伝子に不活性化変異を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP4遺伝子(一方または両方のコピー)に不活性化変異を含み、ICP22遺伝子に不活性化変異を含み、UL41遺伝子に不活性化変異を含む。いくつかの実施形態では、不活性化変異は、ICP4(一方または両方のコピー)、ICP22、及び/またはUL41遺伝子のコード配列の欠失である。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP0(一方または両方のコピー)、ICP27、ICP47、及び/またはUL55遺伝子に不活性化変異をさらに含む。
【0151】
いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP22遺伝子に不活性化変異を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP22遺伝子に不活性化変異を含み、ICP0(一方または両方のコピー)、ICP4(一方または両方のコピー)、ICP27、ICP47、UL41、及び/またはUL55遺伝子に不活性化変異をさらに含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP22遺伝子に不活性化変異を含み、UL41遺伝子に不活性化変異を含む。いくつかの実施形態では、不活性化変異は、ICP22及び/またはUL41遺伝子のコード配列の欠失である。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP0(一方または両方のコピー)、ICP4(一方または両方のコピー)、ICP27、ICP47、及び/またはUL55遺伝子に不活性化変異をさらに含む。
【0152】
いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP27遺伝子に不活性化変異を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP27遺伝子に不活性化変異を含み、ICP0(一方または両方のコピー)、ICP4(一方または両方のコピー)、ICP22、ICP47、UL41、及び/またはUL55遺伝子に不活性化変異をさらに含む。いくつかの実施形態では、不活性化変異は、ICP27遺伝子のコード配列の欠失である。
【0153】
いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP47遺伝子に不活性化変異を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP47遺伝子に不活性化変異を含み、ICP0(一方または両方のコピー)、ICP4(一方または両方のコピー)、ICP22、ICP27、UL41、及び/またはUL55遺伝子に不活性化変異をさらに含む。いくつかの実施形態では、不活性化変異は、ICP47遺伝子のコード配列の欠失である。
【0154】
いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、UL41遺伝子に不活性化変異を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、UL41遺伝子に不活性化変異を含み、ICP0(一方または両方のコピー)、ICP4(一方または両方のコピー)、ICP22、ICP27、ICP47、及び/またはUL55遺伝子に不活性化変異をさらに含む。いくつかの実施形態では、不活性化変異は、UL41遺伝子のコード配列の欠失である。
【0155】
いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、UL55遺伝子に不活性化変異を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、UL55遺伝子に不活性化変異を含み、ICP0(一方または両方のコピー)、ICP4(一方または両方のコピー)、ICP22、ICP27、ICP47、及び/またはUL41遺伝子に不活性化変異をさらに含む。いくつかの実施形態では、不活性化変異は、UL55遺伝子のコード配列の欠失である。
【0156】
いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、内部リピートロング(IR)領域及び内部リピートショート(IR)領域を含む内部リピート(ジョイント)領域に不活性化変異(例えば、その欠失)を含む。いくつかの実施形態では、ジョイント領域の不活性化(例えば、欠失)は、ICP4遺伝子及びICP0遺伝子の各々1つのコピーを除去する。いくつかの実施形態では、ジョイント領域の不活性化(例えば、欠失)は、ICP22遺伝子及びICP47遺伝子のプロモーターをさらに不活性化する(例えば、欠失させる)。所望の場合、これらの遺伝子の一方または両方の発現は、組換え単純ヘルペスウイルスゲノムへの前初期プロモーターの挿入によって回復し得る(例えば、Hill et al.(1995).Nature 375(6530):411-415、Goldsmith et al.(1998).J Exp Med 187(3):341-348を参照のこと)。理論に拘束されることを望むことなく、ジョイント領域の不活性化(例えば、欠失)が、組換え単純ヘルペスウイルスゲノムの安定性に寄与し得る、及び/または組換え単純ヘルペスウイルスゲノムがより多くの及び/またはより大きい導入遺伝子を収容することを可能にすると考えられる。
【0157】
いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP4(一方または両方のコピー)、ICP22、及びICP27遺伝子に不活性化変異を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP4(一方または両方のコピー)、ICP27、及びUL55遺伝子に不活性化変異を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP4(一方または両方のコピー)、ICP22、ICP27、ICP47、及びUL55遺伝子に不活性化変異を含む。いくつかの実施形態では、ICP4(一方または両方のコピー)、ICP27、及び/またはUL55遺伝子における不活性化変異は、ICP4(一方または両方のコピー)、ICP27、及び/またはUL55遺伝子のコード配列の欠失である。いくつかの実施形態では、ICP22遺伝子及びICP47遺伝子における不活性化変異は、ICP22遺伝子及びICP47遺伝子のプロモーター領域の欠失である(例えば、ICP22コード配列及びICP47コード配列はインタクトであるが、転写的に活性ではない)。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP4(一方または両方のコピー)、ICP27、及びUL55遺伝子のコード配列の欠失、ならびにICP22遺伝子及びICP47遺伝子のプロモーター領域の欠失を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP0遺伝子(1つまたは両方のコピー)及び/またはUL41遺伝子に不活性化変異をさらに含む。
【0158】
いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP0(一方または両方のコピー)及びICP4(一方または両方のコピー)遺伝子に不活性化変異を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP0(一方または両方のコピー)、ICP4(一方または両方のコピー)、及びICP22遺伝子に不活性化変異を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP0(一方または両方のコピー)、ICP4(一方または両方のコピー)、ICP22、及びICP27遺伝子に不活性化変異を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP0(一方または両方のコピー)、ICP4(一方または両方のコピー)、ICP22、ICP27、及びUL55遺伝子に不活性化変異を含む。いくつかの実施形態では、ICP0(一方または両方のコピー)、ICP4(一方または両方のコピー)、ICP22、ICP27、及び/またはUL55遺伝子における不活性化変異は、ICP0(一方または両方のコピー)、ICP4(一方または両方のコピー)、ICP22、ICP27、及び/またはUL55遺伝子のコード配列の欠失を含む。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ICP47遺伝子及び/またはUL41遺伝子に不活性化変異をさらに含む。
【0159】
いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、1、2、3、4、5、6、7、またはそれ以上のウイルス遺伝子座内に本開示の1つ以上のポリヌクレオチドを含む。好適なウイルス遺伝子座の例には、ICP0(一方または両方のコピー)、ICP4(一方または両方のコピー)、ICP22、ICP27、ICP47、tk、UL41、及び/またはUL55単純ヘルペスウイルス遺伝子座が挙げられ得るが、これらに限定されない。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ウイルスICP4遺伝子座の一方または両方内に本開示の1つ以上のポリヌクレオチドを含む(例えば、ICP4遺伝子座の一方または両方内にラミニンポリペプチドをコードするポリヌクレオチドを含む組換えウイルス、ICP4遺伝子座の一方または両方内にポリシストロニックmRNAをコードする核酸を含む組換えウイルス、ICP4遺伝子座の一方または両方内にキメラポリペプチドをコードする核酸を含む組換えウイルス等)。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ウイルスICP22遺伝子座内に本開示の1つ以上のポリヌクレオチドを含む(例えば、ICP22遺伝子座内にラミニンポリペプチドをコードするポリヌクレオチドを含む組換えウイルス、ICP22遺伝子座内にポリシストロニックmRNAをコードする核酸を含む組換えウイルス、ICP22遺伝子座内にキメラポリペプチドをコードする核酸を含む組換えウイルス等)。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ウイルスUL41遺伝子座内に本開示の1つ以上のポリヌクレオチドを含む(例えば、UL41遺伝子座内にラミニンポリペプチドをコードするポリヌクレオチドを含む組換えウイルス、UL41遺伝子座内にポリシストロニックmRNAをコードする核酸を含む組換えウイルス、UL41遺伝子座内にキメラポリペプチドをコードする核酸を含む組換えウイルス等)。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ウイルスICP27遺伝子座内に本開示の1つ以上のポリヌクレオチドを含む(例えば、ICP27遺伝子座内にラミニンポリペプチドをコードするポリヌクレオチドを含む組換えウイルス、ICP27遺伝子座内にポリシストロニックmRNAをコードする核酸を含む組換えウイルス、ICP27遺伝子座内にキメラポリペプチドをコードする核酸を含む組換えウイルス等)。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ウイルスICP47遺伝子座内に本開示の1つ以上のポリヌクレオチドを含む(例えば、ICP47遺伝子座内にラミニンポリペプチドをコードするポリヌクレオチドを含む組換えウイルス、ICP47遺伝子座内にポリシストロニックmRNAをコードする核酸を含む組換えウイルス、ICP47遺伝子座内にキメラポリペプチドをコードする核酸を含む組換えウイルス等)。
【0160】
いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ウイルスICP4遺伝子座の一方または両方内に本開示の1つ以上のポリヌクレオチドを含み、ウイルスICP22遺伝子座内に本開示の1つ以上のポリヌクレオチドを含む(例えば、ICP4遺伝子座の一方または両方に第1のラミニンポリペプチドをコードするポリヌクレオチド及びICP22遺伝子座に第2のラミニンポリペプチドをコードするポリヌクレオチドを含む組換えウイルス等)。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ウイルスICP4遺伝子座の一方または両方内に本開示の1つ以上のポリヌクレオチドを含み、ウイルスUL41遺伝子座内に本開示の1つ以上のポリヌクレオチドを含む(例えば、ICP4遺伝子座の一方または両方に第1のラミニンポリペプチドをコードするポリヌクレオチド及びUL41遺伝子座に第2のラミニンポリペプチドをコードするポリヌクレオチドを含む組換えウイルス等)。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ウイルスUL41遺伝子座内に本開示の1つ以上のポリヌクレオチドを含み、ウイルスICP22遺伝子座内に本開示の1つ以上のポリヌクレオチドを含む(例えば、UL41遺伝子座に第1のラミニンポリペプチドをコードするポリヌクレオチド及びICP22遺伝子座に第2のラミニンポリペプチドをコードするポリヌクレオチドを含む組換えウイルス等)。いくつかの実施形態では、組換え単純ヘルペスウイルスゲノムは、ウイルスICP4遺伝子座の一方または両方内に本開示の1つ以上のポリヌクレオチドを含み、ウイルスICP22遺伝子座内に本開示の1つ以上のポリヌクレオチドを含み、ウイルスUL41遺伝子座内に本開示の1つ以上のポリヌクレオチドを含む(例えば、ICP4遺伝子座の一方または両方に第1のラミニンポリペプチドをコードするポリヌクレオチド、ICP22遺伝子座に第2のラミニンポリペプチドをコードするポリヌクレオチド、及びUL41遺伝子座に第3のラミニンポリペプチドをコードするポリヌクレオチドを含む組換えウイルス等)。
【0161】
いくつかの実施形態では、組換えヘルペスウイルスゲノム(例えば、組換え単純ヘルペスウイルスゲノム)は、HSV ICP0遺伝子の一方または両方のコピー、HSV ICP4遺伝子の一方または両方のコピー、HSV ICP22遺伝子、HSV UL41遺伝子、HSV ICP27遺伝子等の1つ以上のヘルペスウイルス遺伝子(例えば、1つ以上の毒性ヘルペスウイルス遺伝子)の発現を減少させるまたは排除するように操作されている。いくつかの実施形態では、組換えヘルペスウイルスゲノム(例えば、組換え単純ヘルペスウイルスゲノム)は、(例えば、標的細胞に導入された場合)対応する野生型ヘルペスウイルスゲノム(例えば、野生型単純ヘルペスウイルスゲノム)と比較して組換えゲノムの細胞毒性を減少させるように操作されている。いくつかの実施形態では、標的細胞は、ヒト細胞である。いくつかの実施形態では、標的細胞は、表皮細胞及び/または真皮細胞(例えば、ヒト表皮細胞及び/またはヒト真皮細胞)である。いくつかの実施形態では、標的細胞は、ケラチノサイトまたは線維芽細胞(例えば、ヒトケラチノサイトまたはヒト線維芽細胞)である。いくつかの実施形態では、標的細胞は、粘膜細胞である。いくつかの実施形態では、組換えヘルペスウイルスゲノム(例えば、組換え単純ヘルペスウイルスゲノム)の(例えば、ヒトケラチノサイト及び/または線維芽細胞における)細胞毒性は、対応する野生型ヘルペスウイルスゲノムと比較して、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、または少なくとも約99%減少する(例えば、ヒトケラチノサイトまたは線維芽細胞(初代細胞または細胞株)における野生型単純ヘルペスウイルスゲノムに対する組換えΔICP4(一方または両方のコピー)単純ヘルペスウイルスゲノムの相対的細胞毒性の測定、ヒトケラチノサイトまたは線維芽細胞(初代細胞または細胞株)における野生型単純ヘルペスウイルスゲノムに対する組換えΔICP4(一方または両方のコピー)/ΔICP22単純ヘルペスウイルスゲノムの相対的細胞毒性の測定等)。いくつかの実施形態では、組換えヘルペスウイルスゲノム(例えば、組換え単純ヘルペスウイルスゲノム)の(例えば、ヒトケラチノサイト及び/または線維芽細胞における)細胞毒性は、対応する野生型ヘルペスウイルスゲノムと比較して、少なくとも約1.5倍、少なくとも約2倍、少なくとも約3倍、少なくとも約4倍、少なくとも約5倍、少なくとも約6倍、少なくとも約7倍、少なくとも約8倍、少なくとも約9倍、少なくとも約10倍、少なくとも約15倍、少なくとも約20倍、少なくとも約25倍、少なくとも約50倍、少なくとも約75倍、少なくとも約100倍、少なくとも約250倍、少なくとも約500倍、少なくとも約750倍、少なくとも約1000倍、またはそれ以上減少する(例えば、ヒトケラチノサイトまたは線維芽細胞(初代細胞または細胞株)における野生型単純ヘルペスウイルスゲノムに対する組換えΔICP4(一方または両方のコピー)単純ヘルペスウイルスゲノムの相対的細胞毒性の測定、ヒトケラチノサイトまたは線維芽細胞(初代細胞または細胞株)における野生型単純ヘルペスウイルスゲノムに対する組換えΔICP4(一方または両方のコピー)/ΔICP22単純ヘルペスウイルスゲノムの相対的細胞毒性の測定等)。例えば、生体色素(ホルマザン色素)、プロテアーゼバイオマーカー、MTTアッセイ(またはXTT、MTS、水溶性テトラゾリウム塩等の関連テトラゾリウム塩を使用するアッセイ)の使用、ATP含有量の測定等を含む、細胞毒性を測定する方法は、当業者に既知である。
【0162】
いくつかの実施形態では、組換えヘルペスウイルスゲノム(例えば、組換え単純ヘルペスウイルスゲノム)は、対応する野生型ヘルペスウイルスゲノム(例えば、野生型単純ヘルペスウイルスゲノム)と比較して、標的細胞の組換えゲノムへの曝露後の宿主細胞増殖に対するその影響を低減するように操作されている。いくつかの実施形態では、標的細胞は、ヒト細胞である。いくつかの実施形態では、標的細胞は、表皮細胞及び/または真皮細胞(例えば、ヒト表皮細胞及び/またはヒト真皮細胞)である。いくつかの実施形態では、標的細胞は、ケラチノサイトまたは線維芽細胞(例えば、ヒトケラチノサイトまたはヒト線維芽細胞)である。いくつかの実施形態では、組換えゲノムへの曝露後の宿主細胞増殖(例えば、ヒトケラチノサイト及び/または線維芽細胞)は、対応する野生型ヘルペスウイルスゲノムへの曝露後の宿主細胞増殖と比較して、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、または少なくとも約99%速い(例えば、ヒトケラチノサイトまたは線維芽細胞(初代細胞または細胞株)における野生型単純ヘルペスウイルスゲノムへの曝露後の細胞増殖に対する組換えΔICP4(一方または両方のコピー)単純ヘルペスウイルスゲノムへの曝露後の相対的細胞増殖の測定、ヒトケラチノサイトまたは線維芽細胞(初代細胞または細胞株)における野生型単純ヘルペスウイルスゲノムへの曝露後の細胞増殖に対する組換えΔICP4(一方または両方のコピー)/ΔICP22単純ヘルペスウイルスゲノムへの曝露後の相対的細胞増殖の測定等)。いくつかの実施形態では、組換えゲノムへの曝露後の宿主細胞増殖(例えば、ヒトケラチノサイト及び/または線維芽細胞)は、対応する野生型ヘルペスウイルスゲノムへの曝露後の宿主細胞増殖と比較して、少なくとも約1.5倍、少なくとも約2倍、少なくとも約3倍、少なくとも約4倍、少なくとも約5倍、少なくとも約6倍、少なくとも約7倍、少なくとも約8倍、少なくとも約9倍、少なくとも約10倍、少なくとも約15倍、少なくとも約20倍、少なくとも約25倍、少なくとも約50倍、少なくとも約75倍、少なくとも約100倍、少なくとも約250倍、少なくとも約500倍、少なくとも約750倍、または少なくとも約1000倍速い(例えば、ヒトケラチノサイトまたは線維芽細胞(初代細胞または細胞株)における野生型単純ヘルペスウイルスゲノムへの曝露後の細胞増殖に対する組換えΔICP4(一方または両方のコピー)単純ヘルペスウイルスゲノムへの曝露後の相対的細胞増殖の測定、ヒトケラチノサイトまたは線維芽細胞(初代細胞または細胞株)における野生型単純ヘルペスウイルスゲノムへの曝露後の細胞増殖に対する組換えΔICP4(一方または両方のコピー)/ΔICP22単純ヘルペスウイルスゲノムへの曝露後の相対的細胞増殖の測定等)。例えば、Ki67細胞増殖アッセイ、BrdU細胞増殖アッセイ等の使用を含む、細胞増殖を測定する方法は、当業者に既知である。
【0163】
ベクター(例えば、ヘルペスウイルスベクター)は、宿主細胞におけるポリヌクレオチドの発現に好適な形態で本開示の1つ以上のポリヌクレオチドを含み得る。ベクターは、(例えば、上述のように)発現されるポリヌクレオチドに作動的に連結された1つ以上の調節配列を含み得る。
【0164】
いくつかの実施形態では、本開示の組換え核酸(例えば、組換え単純ヘルペスウイルスゲノム等の組換えヘルペスウイルスゲノム)は、組換え核酸に任意の配向で挿入された本明細書に記載のポリヌクレオチドのうちの1つ以上を含む。組換え核酸が本明細書に記載の2つ以上(例えば、2つ以上、3つ以上等)のポリヌクレオチドを含む場合、これらのポリヌクレオチドは、同じ配向でまたは互いに反対の配向で挿入され得る。理論に拘束されることを望むことなく、2つのポリヌクレオチド(例えば、2つの導入遺伝子)をアンチセンス配向で組換え核酸(例えば、ベクター)に組み込むことにより、リードスルーを回避し、各ポリヌクレオチドの適切な発現を確実にする助けとなり得る。
【0165】
いくつかの実施形態では、本開示は、本明細書に記載の組換え核酸のうちのいずれかを含む1つ以上の異種ポリヌクレオチド(例えば、細菌人工染色体(BAC))に関する。
【0166】
IV.ウイルス
本開示のある特定の態様は、本明細書に記載のポリヌクレオチド及び/または組換え核酸のうちのいずれかを含むウイルスに関する。いくつかの実施形態では、ウイルスは、対象(例えば、ヒト)の1つ以上の標的細胞に感染することができる。いくつかの実施形態では、ウイルスは、ポリヌクレオチド及び/または組換え核酸を対象(例えば、ヒト)の1つ以上の標的細胞に送達するのに好適である。いくつかの実施形態では、本開示は、本明細書に記載のポリヌクレオチド及び/または組換え核酸のうちのいずれかを含む1つ以上のウイルス粒子に関する。いくつかの実施形態では、1つ以上の標的細胞は、1つ以上のヒト細胞である。いくつかの実施形態では、1つ以上の標的細胞は、ラミニン欠乏症を有する1つ以上の細胞(例えば、LAMA3、LAMB3、またはLAMC2遺伝子等の天然ラミニン遺伝子における機能喪失変異、またはその病原性バリアントを含む1つ以上の細胞)である。いくつかの実施形態では、1つ以上の標的細胞は、フィラグリン欠乏症を有する1つ以上の細胞(例えば、天然FLGまたはFLG2遺伝子における機能喪失変異、またはその病原性バリアントを含む1つ以上の細胞)である。いくつかの実施形態では、1つ以上の標的細胞は、1つ以上の粘膜細胞である。いくつかの実施形態では、1つ以上の標的細胞は、1つ以上の皮膚細胞(例えば、1つ以上の表皮細胞、真皮細胞、及び/または皮下細胞)である。いくつかの実施形態では、1つ以上の標的細胞は、表皮細胞及び/または真皮細胞(例えば、ヒト表皮細胞及び/または真皮細胞)である。いくつかの実施形態では、1つ以上の標的細胞は、ケラチノサイト、メラノサイト、ランゲルハンス細胞、メルケル細胞、マスト細胞、線維芽細胞、及び/または脂肪細胞から選択される。いくつかの実施形態では、1つ以上の標的細胞は、ケラチノサイトである。いくつかの実施形態では、1つ以上の標的細胞は、角質層、顆粒層、有棘層、基底層、及び/または基底膜に存在する。いくつかの実施形態では、1つ以上の標的細胞は、1つ以上の表皮細胞である。いくつかの実施形態では、1つ以上の標的細胞は、1つ以上の真皮細胞である。
【0167】
例えば、アデノウイルス、アデノ随伴ウイルス、レトロウイルス、レンチウイルス、センダイウイルス、パピローマウイルス、ヘルペスウイルス(例えば、単純ヘルペスウイルス)、ワクシニアウイルス、及び/またはそれらの任意のハイブリッドもしくは派生物ウイルスを含む、当該技術分野で既知の任意の好適なウイルスが使用され得る。いくつかの実施形態では、ウイルスは、弱毒化されている。いくつかの実施形態では、ウイルスは、複製欠損である。いくつかの実施形態では、ウイルスは、複製可能である。いくつかの実施形態では、ウイルスは、対応する修飾されていない野生型ウイルスの組織向性と比較してその組織向性を改変するように修飾されている。いくつかの実施形態では、ウイルスは、対応する野生型ウイルスと比較して減少した細胞毒性を有する。組換え核酸を含むウイルスを産生する方法は、当業者に周知である。
【0168】
いくつかの実施形態では、ウイルスは、例えば、単純ヘルペスウイルス、水痘帯状疱疹ウイルス、ヒトサイトメガロウイルス、ヘルペスウイルス6A、ヘルペスウイルス6B、ヘルペスウイルス7、及びカポジ肉腫関連ヘルペスウイルス等を含む、DNAウイルスのヘルペスウイルス科ファミリーのメンバーである。いくつかの実施形態では、ヘルペスウイルスは、弱毒化されている。いくつかの実施形態では、ヘルペスウイルスは、複製可能である。いくつかの実施形態では、ヘルペスウイルスは、複製欠損である。いくつかの実施形態では、ヘルペスウイルスは、対応する野生型ヘルペスウイルスと比較して減少した細胞毒性を有する。いくつかの実施形態では、ヘルペスウイルスは、腫瘍溶解性ではない。
【0169】
いくつかの実施形態では、ヘルペスウイルスは、単純ヘルペスウイルスである。組換え核酸を含む単純ヘルペスウイルスは、例えば、WO2015/009952及び/またはWO2017/176336に開示されるプロセスによって産生され得る。いくつかの実施形態では、単純ヘルペスウイルスは、弱毒化されている。いくつかの実施形態では、単純ヘルペスウイルスは、複製可能である。いくつかの実施形態では、単純ヘルペスウイルスは、複製欠損である。いくつかの実施形態では、単純ヘルペスウイルスは、単純ヘルペスウイルス1型(HSV-1)、単純ヘルペスウイルス2型(HSV-2)、またはそれらの任意の派生物である。いくつかの実施形態では、単純ヘルペスウイルスは、単純ヘルペスウイルス1型(HSV-1)である。いくつかの実施形態では、HSV-1は、弱毒化されている。いくつかの実施形態では、HSV-1は、複製可能である。いくつかの実施形態では、HSV-1は、複製欠損である。いくつかの実施形態では、単純ヘルペスウイルス(例えば、HSV-1)は、対応する野生型単純ヘルペスウイルス(例えば、野生型HSV-1)と比較して減少した細胞毒性を有する。いくつかの実施形態では、単純ヘルペスウイルス(例えば、HSV-1)は、腫瘍溶解性ではない。
【0170】
いくつかの実施形態では、単純ヘルペスウイルスは、修飾されていない野生型単純ヘルペスウイルスの組織向性と比較してその組織向性を改変するように修飾されている。いくつかの実施形態では、単純ヘルペスウイルスは、修飾されたエンベロープを含む。いくつかの実施形態では、修飾されたエンベロープは、1つ以上(例えば、1つ以上、2つ以上、3つ以上、4つ以上等)の変異単純ヘルペスウイルス糖タンパク質を含む。単純ヘルペスウイルス糖タンパク質の例には、糖タンパク質gB、gC、gD、gH、及びgLが挙げられ得るが、これらに限定されない。いくつかの実施形態では、修飾されたエンベロープは、野生型単純ヘルペスウイルスと比較して単純ヘルペスウイルス組織向性を改変する。
【0171】
いくつかの実施形態では、1つ以上の標的細胞(例えば、1つ以上のヒトケラチノサイト及び/または線維芽細胞)に対する本開示のウイルス(例えば、単純ヘルペスウイルス等のヘルペスウイルス)の形質導入効率(インビトロ及び/またはインビボ)は、少なくとも約25%である。例えば、1つ以上の標的細胞に対するウイルスの形質導入効率は、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%、少なくとも約99.5%、またはそれ以上であり得る。いくつかの実施形態では、ウイルスは、単純ヘルペスウイルスであり、1つ以上の標的細胞(例えば、1つ以上のヒトケラチノサイト及び/または線維芽細胞)に対するウイルスの形質導入効率は、約85%~約100%である。いくつかの実施形態では、ウイルスは、単純ヘルペスウイルスであり、1つ以上の標的細胞(例えば、1つ以上のヒトケラチノサイト)に対するウイルスの形質導入効率は、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、または100%である。例えば、qPCR分析、ディープシーケンシング、ウエスタンブロッティング、蛍光定量分析(蛍光インサイツハイブリダイゼーション(FISH)、蛍光レポーター遺伝子発現、免疫蛍光、FACS等)等を含む、ウイルス形質導入効率をインビトロまたはインビボで測定する方法は、当業者に周知である。
【0172】
V.薬学的組成物及び製剤
本開示のある特定の態様は、本明細書に記載の組換え核酸(例えば、組換えヘルペスウイルスゲノム)及び/またはウイルス(例えば、組換えゲノムを含むヘルペスウイルス(組換え単純ヘルペスウイルスゲノムを含む単純ヘルペスウイルス等)のうちのいずれかと、賦形剤または担体(例えば、薬学的に許容される賦形剤または担体)とを含む組成物及び製剤(例えば、薬学的組成物または製剤)に関する。
【0173】
いくつかの実施形態では、薬学的組成物または製剤は、本明細書に記載のウイルス(例えば、ヘルペスウイルス)のうちのいずれか1つ以上を含む。いくつかの実施形態では、薬学的組成物または製剤は、約10~約1012プラーク形成単位(PFU)/mLのウイルスを含む。例えば、薬学的組成物または製剤は、約10~約1012、約10~約1012、約10~約1012、約10~約1012、約10~約1012、約10~約1012、約1010~約1012、約1011~約1012、約10~約1011、約10~約1011、約10~約1011、約10~約1011、約10~約1011、約10~約1011、約1010~約1011、約10~約1010、約10~約1010、約10~約1010、約10~約1010、約10~約1010、約10~約1010、約10~約10、約10~約10、約10~約10、約10~約10、約10~約10、約10~約10、約10~約10、約10~約108、約10~約10、約10~約10、約10~約10、約10~約10、約10~約10、約10~約10、または約10~約10PFU/mLのウイルスを含み得る。いくつかの実施形態では、薬学的組成物または製剤は、約10、約10、約10、約10、約10、約10、約1010、約1011、または約1012PFU/mLのウイルスを含む。
【0174】
薬学的組成物及び製剤は、所望の純度を有する活性成分(複数可)(組換え核酸及び/またはウイルス等)を1つ以上の薬学的に許容される担体または賦形剤と混合することによって調製され得る。薬学的に許容される担体または賦形剤は、一般に、用いられる投薬量及び濃度でレシピエントに対して非毒性であり、緩衝液(リン酸、クエン酸、酢酸、及び他の有機酸等)、抗酸化剤(アスコルビン酸及びメチオニン等)、保存料(オクタデシルジメチルベンジルアンモニウムクロリド、ベンザルコニウムクロリド、ベンゼトニウムクロリド、フェノール、ブチルアルコールまたはベンジルアルコール、アルキルパラベン、カテコール、レゾルシノール、シクロヘキサノール、3-ペンタノール、及びm-クレゾール等)、アミノ酸(グリシン、グルタミン、アスパラギン、ヒスチジン、アルギニン、またはリジン等)、低分子量(約10残基未満)ポリペプチド、タンパク質(血清アルブミン、ゼラチン、または免疫グロブリン等)、ポリオール(グリセロール等、例えば、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%等のグリセロールを含む製剤)、親水性ポリマー(ポリビニルピロリドン等)、単糖、二糖、及び他の炭水化物(グルコース、マンノース、またはデキストリンを含む)、キレート剤(EDTA等)、糖(スクロース、マンニトール、トレハロース、またはソルビトール等)、塩形成対イオン(ナトリウム等)、金属錯体(Zn-タンパク質錯体等)、及び/または非イオン性界面活性剤(ポリエチレングリコール(PEG)等)を含み得る。薬学的に許容される担体の詳細な考察は、REMINGTON’S PHARMACEUTICAL SCIENCES(Mack Pub.Co.,N.J.1991)で入手可能である。
【0175】
いくつかの実施形態では、薬学的組成物または製剤は、1つ以上の脂質(例えば、カチオン性脂質)担体を含む。いくつかの実施形態では、薬学的組成物または製剤は、1つ以上のナノ粒子担体を含む。ナノ粒子は、迅速放出または制御放出のためのカプセル化された薬物(合成小分子、タンパク質、ペプチド、細胞、ウイルス、及び核酸ベースの生物学的治療薬等)を運ぶことができるサブミクロン(約1000nm未満)のサイズの薬物送達ビヒクルである。様々な分子(例えば、タンパク質、ペプチド、組換え核酸等)は、当該技術分野で周知のプロセスを使用してナノ粒子中に効率的にカプセル化され得る。いくつかの実施形態では、ナノ粒子中に「カプセル化」された分子とは、ナノ粒子中に含まれているか、ナノ粒子の表面に付着している及び/またはそれと会合しているか、またはそれらの任意の組み合わせである分子(ウイルス等)を指し得る。本明細書に記載の組成物または製剤に使用するためのナノ粒子は、例えば、ポリ(乳酸)、ポリ(グリコール酸)、PLGA、PLA、PGA、及びそれらの任意の組み合わせを含むナノ粒子を含む、当該技術分野で既知の任意のタイプの生体適合性ナノ粒子であり得る(例えば、Vauthier et al.Adv Drug Del Rev.(2003)55:519-48、US2007/0148074、US2007/0092575、US2006/0246139、US5753234、US7081483、及びWO2006/052285を参照のこと)。
【0176】
いくつかの実施形態では、薬学的に許容される担体または賦形剤は、例えば、静脈内、筋肉内、皮下、皮膚、経口、経鼻、気管内、舌下、頬、局所、経皮内、皮内、腹腔内、眼窩内、網膜下、硝子体内、経粘膜、関節内、埋め込みによる、吸入による、髄腔内、脳室内、及び/または鼻腔内投与を含む、当該技術分野で既知の任意の投与経路に適合され得るか、またはそれらに好適であり得る。いくつかの実施形態では、薬学的組成物または製剤は、例えば、静脈内、筋肉内、皮下、皮膚、経口、経鼻、気管内、舌下、口腔内、局所、経皮、皮内、腹腔内、眼窩内、硝子体内、網膜下、経粘膜、関節内、埋め込みによる、吸入による、髄腔内、脳室内、及び/または鼻腔内投与を含む、当該技術分野で既知の任意の投与経路に適合されるか、またはそれらに好適である。いくつかの実施形態では、薬学的に許容される担体または賦形剤は、局所、経皮、皮下、皮内、及び/または経粘膜投与に適合されるか、またはそれらに好適である。いくつかの実施形態では、薬学的組成物または製剤は、局所、経皮、皮下、皮内、及び/または経粘膜投与に適合されるか、またはそれらに好適である。いくつかの実施形態では、薬学的に許容される担体または賦形剤は、局所、経皮、皮下、及び/または皮内投与に適合されるか、またはそれらに好適である。いくつかの実施形態では、薬学的組成物または製剤は、局所、経皮、皮下、及び/または皮内投与に適合されるか、またはそれらに好適である。いくつかの実施形態では、薬学的に許容される担体または賦形剤は、局所、経皮、及び/または皮内投与に適合されるか、またはそれらに好適である。いくつかの実施形態では、薬学的組成物または製剤は、局所、経皮、及び/または皮内投与に適合されるか、またはそれらに好適である。いくつかの実施形態では、薬学的に許容される担体または賦形剤は、局所投与に適合されるか、またはそれに好適である。いくつかの実施形態では、薬学的組成物または製剤は、局所投与に適合されるか、またはそれに好適である。いくつかの実施形態では、薬学的に許容される担体または賦形剤は、経口、舌下、経鼻、もしくは口腔投与、または吸入による投与に適合されるか、またはそれらに好適である。いくつかの実施形態では、薬学的組成物または製剤は、経口、舌下、経鼻、もしくは口腔投与、または吸入による投与に適合されるか、またはそれらに好適である。いくつかの実施形態では、薬学的に許容される担体または賦形剤は、局所(眼)、硝子体内、網膜下、または眼窩内投与に適合されるか、またはそれらに好適である。いくつかの実施形態では、薬学的組成物または製剤は、局所(眼)、硝子体内、網膜下、または眼窩内投与に適合されるか、またはそれらに好適である。
【0177】
本開示の薬学的組成物または製剤における使用に適合されたまたはそれに好適な担体または賦形剤の例には、軟膏、油、ペースト、クリーム、エアロゾル、懸濁液、乳剤、脂肪性軟膏、ゲル(例えば、カルボキシメチルセルロース、ヒドロキシプロピルメチルセルロース等のメチルセルロースゲル)、粉末、液体、ローション、溶液、スプレー、パッチ(例えば、経皮パッチまたはマイクロニードルパッチ)、接着ストリップ、マイクロニードルまたはマイクロニードルアレイ、及び吸入剤が挙げられ得るが、これらに限定されない。いくつかの実施形態では、担体または賦形剤(例えば、薬学的に許容される担体または賦形剤)は、軟膏、油、ペースト、クリーム、エアロゾル、懸濁液、乳剤、脂肪性軟膏、ゲル、粉末、液体、ローション、溶液、スプレー、パッチ、接着ストリップ、及び吸入剤のうちの1つ以上(例えば、1つ以上、2つ以上、3つ以上、4つ以上、5つ以上等)を含む。いくつかの実施形態では、担体は、経皮パッチまたはマイクロニードルパッチ等のパッチ(例えば、皮膚に付着するパッチ)を含む。いくつかの実施形態では、担体は、マイクロニードルまたはマイクロニードルアレイを含む。組成物の送達に好適なマイクロニードルアレイを作製及び使用するための方法は、当該技術分野で一般に既知である(例えば、Kim Y.et al.“Microneedles for drug and vaccine delivery”.Advanced Drug Delivery Reviews 2012,64(14):1547-68を参照のこと)。
【0178】
いくつかの実施形態では、薬学的組成物または製剤は、1つ以上の追加の成分をさらに含む。追加の成分の例には、結合剤(例えば、アルファ化トウモロコシデンプン、ポリビニルピロリドン、またはヒドロキシプロピルメチルセルロース等)、充填剤(例えば、ラクトース及び他の糖、微結晶性セルロース、ペクチン、ゼラチン、硫酸カルシウム、エチルセルロース、ポリアクリレート、またはリン酸水素カルシウム等)、滑沢剤(例えば、ステアリン酸マグネシウム、タルク、シリカ、コロイド状二酸化ケイ素、ステアリン酸、金属ステアリン酸塩、水素化植物油、トウモロコシデンプン、ポリエチレングリコール、安息香酸ナトリウム、酢酸ナトリウム等)、崩壊剤(例えば、デンプン、デンプングリコール酸ナトリウム等)、湿潤剤(例えば、ラウリル硫酸ナトリウム等)、塩溶液、アルコール、ポリエチレングリコール、ゼラチン、ラクトース、アミラーゼ、ステアリン酸マグネシウム、タルク、ケイ酸、粘性パラフィン、メチルセルロース、ポリビニルピロリドン、甘味料、香味料、香料、着色剤、保湿剤、日焼け防止剤、抗菌剤、ポリヌクレオチドを安定化するか、またはそれらの分解を阻止することができる薬剤等が挙げられ得るが、これらに限定されない。いくつかの実施形態では、薬学的組成物または製剤は、メチルセルロースゲル、例えば、カルボキシメチルセルロースゲル、ヒドロキシプロピルメチルセルロースゲル等を(例えば、約0.5%、約1%、約1.5%、約2%、約2.5%、約3%、約3.5%、約4%、約4.5%、約5%、約5.5%、約6%、約6.5%、約7%、約7.5%、約8%、約8.5%、約9%、約9.5%、約10%、約10.5%、約11%、約11.5%、約12%等)含む。いくつかの実施形態では、薬学的組成物または製剤は、リン酸緩衝液を含む。いくつかの実施形態では、薬学的組成物または製剤は、グリセロールを(例えば、約1%、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約11%、約12%、約13%、約14%、約15%等)含む。いくつかの実施形態では、薬学的組成物または製剤は、メチルセルロースゲル(カルボキシメチルセルロースゲル、ヒドロキシプロピルメチルセルロースゲル等)、リン酸緩衝液、及び/またはグリセロールを含む。
【0179】
インビボ投与のために使用される組成物及び製剤(例えば、薬学的組成物及び製剤)は、一般に、滅菌である。滅菌は、例えば、滅菌濾過膜を通す濾過によって、容易に達成され得る。
【0180】
いくつかの実施形態では、本明細書に記載の組換え核酸、ウイルス、及び/または薬学的組成物もしくは製剤のうちのいずれも、ラミニンポリペプチドをコードする1つ以上のポリヌクレオチドを対象の1つ以上の細胞(例えば、1つ以上のラミニン欠損細胞、ラミニン遺伝子変異を有する1つ以上の細胞等)に送達するために使用され得る。いくつかの実施形態では、組換え核酸、ウイルス、及び/または薬学的組成物もしくは製剤のうちのいずれも、療法に使用され得る。いくつかの実施形態では、本明細書に記載の組換え核酸、ウイルス、及び/または薬学的組成物もしくは製剤のうちのいずれも、ラミニンポリペプチドの発現から利益を得るであろう疾患または状態(例えば、ラミニン欠乏症に関連する疾患/障害/欠損症、及び/またはラミニン遺伝子変異に関連する疾患(例えば、JEB))の治療に使用され得る。いくつかの実施形態では、本明細書に記載の組換え核酸、ウイルス、及び/または薬学的組成物もしくは製剤のうちのいずれも、ラミニン欠乏症の1つ以上の兆候または症状の治療に使用され得る。ラミニン欠乏症の兆候及び症状には、皮膚の水疱形成、創傷形成、及び/または瘢痕化、肉芽組織、皮膚びらん、手指の爪及び/または足指の爪の変形、手指及び/または足指の癒着、皮膚のひきつれ及び/または菲薄化、拘縮、粘膜の水疱形成及び/または瘢痕化、呼吸困難、ホースクライ、感染症に対する易罹患性の増加、脱水症、体液喪失、電解質不均衡、胃腸管及び/または胃尿管の水疱形成及び/または瘢痕化、虫歯、エナメル質形成不全、及び/または他の口腔もしくは歯の欠損、抜け毛、栄養失調、発育遅延、貧血症、ならびにそれらの任意の組み合わせが含まれるが、これらに限定されない。いくつかの実施形態では、本明細書に記載の組換え核酸、ウイルス、及び/または薬学的組成物もしくは製剤のうちのいずれも、接合部型表皮水疱症の1つ以上の兆候または症状に対する予防的、姑息的、または治療的緩和を提供するために使用され得る。
【0181】
いくつかの実施形態では、本明細書に記載の組換え核酸、ウイルス、及び/または薬学的組成物もしくは製剤のうちのいずれも、薬剤の調製または製造に使用され得る。いくつかの実施形態では、本明細書に記載の組換え核酸、ウイルス、及び/または薬学的組成物もしくは製剤のうちのいずれも、ラミニンポリペプチドをコードする1つ以上のポリヌクレオチドを対象の1つ以上の細胞(例えば、1つ以上のラミニン欠損細胞、ラミニン遺伝子変異を有する1つ以上の細胞等)に送達するのに有用な薬剤の調製または製造に使用され得る。いくつかの実施形態では、本明細書に記載の組換え核酸、ウイルス、及び/または薬学的組成物もしくは製剤のうちのいずれも、ラミニンポリペプチドの発現から利益を得るであろう疾患または状態(例えば、ラミニン欠乏症に関連する疾患/障害/欠損症、及び/またはラミニン遺伝子変異に関連する疾患(例えば、JEB))の治療に有用な薬剤の調製または製造に使用され得る。いくつかの実施形態では、本明細書に記載の組換え核酸、ウイルス、及び/または薬学的組成物もしくは製剤のうちのいずれも、ラミニン欠乏症の1つ以上の兆候または症状の治療に有用な薬剤の調製または製造に使用され得る。ラミニン欠乏症の兆候及び症状には、皮膚の水疱形成、創傷形成、及び/または瘢痕化、肉芽組織、皮膚びらん、手指の爪及び/または足指の爪の変形、手指及び/または足指の癒着、皮膚のひきつれ及び/または菲薄化、拘縮、粘膜の水疱形成及び/または瘢痕化、呼吸困難、ホースクライ、感染症に対する易罹患性の増加、脱水症、体液喪失、電解質不均衡、胃腸管及び/または胃尿管の水疱形成及び/または瘢痕化、虫歯、エナメル質形成不全、及び/または他の口腔もしくは歯の欠損、抜け毛、栄養失調、発育遅延、貧血症、ならびにそれらの任意の組み合わせが含まれるが、これらに限定されない。いくつかの実施形態では、本明細書に記載の組換え核酸、ウイルス、及び/または薬学的組成物もしくは製剤のうちのいずれも、接合部型表皮水疱症の治療に有用な薬剤の調製または製造に使用され得る。
【0182】
いくつかの実施形態では、本明細書に記載の組換え核酸、ウイルス、及び/または薬学的組成物もしくは製剤のうちのいずれも、フィラグリンポリペプチドをコードする1つ以上のポリヌクレオチドを対象の1つ以上の細胞(例えば、1つ以上のフィラグリン欠損細胞、FLGまたはFLG2遺伝子変異を有する1つ以上の細胞等)に送達するために使用され得る。いくつかの実施形態では、組換え核酸、ウイルス、及び/または薬学的組成物もしくは製剤のうちのいずれも、療法に使用され得る。いくつかの実施形態では、本明細書に記載の組換え核酸、ウイルス、及び/または薬学的組成物もしくは製剤のうちのいずれも、フィラグリンポリペプチドの発現から利益を得るであろう疾患または状態(例えば、フィラグリン欠乏症に関連する疾患/障害/欠損症、及び/またはFLGもしくはFLG2遺伝子変異に関連する疾患(例えば、アトピー性皮膚炎、魚鱗癬、皮膚剥離症候群等)の治療に使用され得る。いくつかの実施形態では、本明細書に記載の組換え核酸、ウイルス、及び/または薬学的組成物もしくは製剤のうちのいずれも、フィラグリン欠乏症の1つ以上の兆候または症状の治療に使用され得る。フィラグリン欠乏症の兆候及び症状には、乾燥皮膚、特に夜間に重度になる可能性のある掻痒、特に手、足、足首、手首、首、上部胸部、眼瞼、肘及び膝の屈曲部の内側、ならびに乳児では顔及び頭皮上の赤色~茶色がかった灰色の斑点、湿潤性である可能性のある皮膚における小さい隆起した突出物、皮膚感染症、眼瞼皮膚炎、白内障、IgEレベルの上昇、肥厚した、ひび割れした、または鱗状の皮膚、引っ掻きにより皮が剥けて敏感になった腫れた皮膚、及びにそれらの任意の組み合わせが含まれるが、これらに限定されない。いくつかの実施形態では、本明細書に記載の組換え核酸、ウイルス、及び/または薬学的組成物もしくは製剤のうちのいずれも、アトピー性皮膚炎の1つ以上の兆候または症状に対する予防的、姑息的、または治療的緩和を提供するために使用され得る。
【0183】
いくつかの実施形態では、本明細書に記載の組換え核酸、ウイルス、及び/または薬学的組成物もしくは製剤のうちのいずれも、薬剤の調製または製造に使用され得る。いくつかの実施形態では、本明細書に記載の組換え核酸、ウイルス、及び/または薬学的組成物もしくは製剤のうちのいずれも、フィラグリンポリペプチドをコードする1つ以上のポリヌクレオチドを対象の1つ以上の細胞(例えば、1つ以上のフィラグリン欠損細胞、FLGまたはFLG2遺伝子変異を有する1つ以上の細胞等)に送達するのに有用な薬剤の調製または製造に使用され得る。いくつかの実施形態では、本明細書に記載の組換え核酸、ウイルス、及び/または薬学的組成物もしくは製剤のうちのいずれも、フィラグリンポリペプチドの発現から利益を得るであろう疾患または状態(例えば、フィラグリン欠乏症に関連する疾患/障害/欠損症、及び/またはFLGもしくはFLG2遺伝子変異に関連する疾患(例えば、アトピー性皮膚炎、尋常性魚鱗癬、皮膚剥離症候群等))の治療に有用な薬剤の調製または製造に使用され得る。いくつかの実施形態では、本明細書に記載の組換え核酸、ウイルス、及び/または薬学的組成物もしくは製剤のうちのいずれも、フィラグリン欠乏症の1つ以上の兆候または症状の治療に有用な薬剤の調製または製造に使用され得る。フィラグリン欠乏症の兆候及び症状には、乾燥皮膚、特に夜間に重度になる可能性のある掻痒、特に手、足、足首、手首、首、上部胸部、眼瞼、肘及び膝の屈曲部の内側、ならびに乳児では顔及び頭皮上の赤色~茶色がかった灰色の斑点、湿潤性である可能性のある皮膚における小さい隆起した突出物、皮膚感染症、眼瞼皮膚炎、白内障、IgEレベルの上昇、肥厚した、ひび割れした、または鱗状の皮膚、引っ掻きにより皮が剥けて敏感になった腫れた皮膚、及びにそれらの任意の組み合わせが含まれるが、これらに限定されない。いくつかの実施形態では、本明細書に記載の組換え核酸、ウイルス、及び/または薬学的組成物もしくは製剤のうちのいずれも、アトピー性皮膚炎の治療に有用な薬剤の調製または製造に使用され得る。
【0184】
VI.方法
本開示のある特定の態様は、対象の1つ以上の細胞及び/または細胞外マトリックスにおける1つ以上のラミニンポリペプチド(例えば、1つ以上のヒトラミニンポリペプチド)のレベルを強化する、増加させる、増強する、及び/または補充することに関し、対象に、本明細書に記載の組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤のうちのいずれかの有効量を投与することを含む。いくつかの実施形態では、対象は、ヒトである。いくつかの実施形態では、対象のゲノムは、内因性ラミニン遺伝子(例えば、LAMA3、LAMB3、及び/またはLAMC2遺伝子)に変異(例えば、機能喪失変異、病原性バリアント)を含む。いくつかの実施形態では、対象は、接合部型表皮水疱症(JEB)に罹患している。いくつかの実施形態では、JEBは、ヘルリッツ型JEB(JEB-H)である。いくつかの実施形態では、JEBは、非ヘルリッツ型JEBである。
【0185】
いくつかの実施形態では、対象への組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤の投与は、対象の1つ以上の対応する未処理細胞における内因性ラミニンレベルと比較して、対象の1つ以上の接触細胞または処理細胞におけるラミニンレベル(転写物またはタンパク質レベル)を少なくとも約25%増加させる。いくつかの実施形態では、対象への組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤の投与は、対象の1つ以上の対応する未処理細胞における内因性ラミニンレベルと比較して、対象の1つ以上の接触細胞または処理細胞におけるラミニンレベル(転写物またはタンパク質レベル)を少なくとも約25%、少なくとも約30%、少なくとも約40%、少なくとも約50%、少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、少なくとも約95%、少なくとも約99%、またはそれ以上増加させる。いくつかの実施形態では、対象への組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤の投与は、対象の1つ以上の対応する未処理細胞における内因性ラミニンレベルと比較して、対象の1つ以上の接触細胞または処理細胞におけるラミニンレベル(転写物またはタンパク質レベル)を少なくとも約2倍増加させる。例えば、組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤の投与は、対象の1つ以上の対応する未処理細胞における内因性ラミニンレベルと比較して、対象の1つ以上の接触細胞または処理細胞におけるラミニンレベル(転写物またはタンパク質レベル)を少なくとも約2倍、少なくとも約3倍、少なくとも約4倍、少なくとも約5倍、少なくとも約6倍、少なくとも約7倍、少なくとも約8倍、少なくとも約9倍、少なくとも約10倍、少なくとも約15倍、少なくとも約20倍、少なくとも約25倍、少なくとも約50倍、少なくとも約75倍、少なくとも約100倍、少なくとも約250倍、少なくとも約500倍、少なくとも約750倍、少なくとも約1000倍、またはそれ以上増加させ得る。いくつかの実施形態では、1つ以上の接触細胞または処理細胞は、1つ以上の表皮細胞、真皮細胞、及び/または粘膜細胞である。例えば、qPCR、ウエスタンブロット、質量分析等を含む、試料から転写物またはタンパク質レベルを測定する方法は、当業者に周知である。
【0186】
本開示の他の態様は、対象の1つ以上の細胞の細胞接着を強化する、増加させる、増強する、及び/または補充することに関し、対象に、本明細書に記載の組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤のうちのいずれかを投与することを含む。いくつかの実施形態では、強化された、増加した、増強された、または補充された細胞接着は、本明細書に記載の組換え核酸、ウイルス、薬剤、及び/または薬学的組成物と接触していないか、またはそれが投与されていない対応する細胞の細胞接着レベルとの比較である。いくつかの実施形態では、1つ以上の細胞は、1つ以上の表皮細胞、真皮細胞、及び/または粘膜細胞である。いくつかの実施形態では、1つ以上の細胞は、対象の1つ以上の皮膚細胞である。いくつかの実施形態では、細胞接着は、インテグリン媒介性細胞接着である。細胞接着を測定する方法は、当業者に既知である(例えば、Boettiger D.Methods Enzymol.2007;426:1-25を参照のこと)。いくつかの実施形態では、対象は、ヒトである。いくつかの実施形態では、対象のゲノムは、内因性ラミニン遺伝子(例えば、LAMA3、LAMB3、及び/またはLAMC2遺伝子)に変異(例えば、機能喪失変異、病原性バリアント)を含む。いくつかの実施形態では、対象は、接合部型表皮水疱症(JEB)に罹患している。いくつかの実施形態では、JEBは、ヘルリッツ型JEB(JEB-H)である。いくつかの実施形態では、JEBは、非ヘルリッツ型JEBである。
【0187】
本開示の他の態様は、1)対象の透明帯を強化すること、増加させること、増強すること、及び/または補充することと、2)対象の透明帯を安定化することと、3)対象の透明帯内の水疱の形成を阻害すること、遅延させること、予防すること、及び/または改善することと、4)対象の透明帯における皮膚分離を予防することとに関し、対象に、本明細書に記載の組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤のうちのいずれかを投与することを含む。いくつかの実施形態では、透明帯の構造または安定性に対する1つ以上の有益な効果は、本明細書に記載の組換え核酸、ウイルス、薬剤、及び/または薬学的組成物の投与前の対象における透明帯の構造及び/または安定性との比較(または対象の未処理領域における透明帯の構造及び/または安定性との比較)である。例えば、微視的評価を含む、透明帯の構造及び/または安定性の変化/改善を監視する方法は、当該技術分野で既知である。いくつかの実施形態では、対象は、ヒトである。いくつかの実施形態では、対象のゲノムは、内因性ラミニン遺伝子(例えば、LAMA3、LAMB3、及び/またはLAMC2遺伝子)に変異(例えば、機能喪失変異、病原性バリアント)を含む。いくつかの実施形態では、対象は、接合部型表皮水疱症(JEB)に罹患している。いくつかの実施形態では、JEBは、ヘルリッツ型JEB(JEB-H)である。いくつかの実施形態では、JEBは、非ヘルリッツ型JEBである。
【0188】
本開示の他の態様は、対象における上皮基底膜集合、上皮基底膜組織化、上皮基底膜接着、及び/または真皮表皮接合部完全性を強化すること、増加させること、増強すること、及び/または補充することに関し、対象に、本明細書に記載の組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤のうちのいずれかを投与することを含む。いくつかの実施形態では、上皮基底膜及び/または真皮表皮接合部の集合、組織化、接着、及び/または完全性に対する1つ以上の有益な効果は、本明細書に記載の組換え核酸、ウイルス、薬剤、及び/または薬学的組成物の投与前の対象の基底膜及び/または真皮表皮接合部の集合、組織化、接着、及び/または完全性との比較(または対象の未処理領域における基底膜及び/または真皮表皮接合部の集合、組織化、接着、及び/または完全性との比較)である。例えば、微視的評価を含む、基底膜及び/または真皮表皮接合部の集合、組織化、接着、及び/または完全性の変化/改善を監視する方法は、当該技術分野で既知である。いくつかの実施形態では、対象は、ヒトである。いくつかの実施形態では、対象のゲノムは、内因性ラミニン遺伝子(例えば、LAMA3、LAMB3、及び/またはLAMC2遺伝子)に変異(例えば、機能喪失変異、病原性バリアント)を含む。いくつかの実施形態では、対象は、接合部型表皮水疱症(JEB)に罹患している。いくつかの実施形態では、JEBは、ヘルリッツ型JEB(JEB-H)である。いくつかの実施形態では、JEBは、非ヘルリッツ型JEBである。
【0189】
本開示の他の態様は、その必要がある対象において接合部型表皮水疱症(JEB)の1つ以上の兆候または症状に対する予防的、姑息的、または治療的緩和を提供することに関し、対象に、本明細書に記載の組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤のうちのいずれかを投与することを含む。いくつかの実施形態では、対象は、ヒトである。いくつかの実施形態では、対象のゲノムは、内因性ラミニン遺伝子(例えば、LAMA3、LAMB3、及び/またはLAMC2遺伝子)に変異(例えば、機能喪失変異、病原性バリアント)を含む。いくつかの実施形態では、対象は、JEBを有するか、またはJEBを発症する危険性がある。いくつかの実施形態では、JEBは、ヘルリッツ型JEB(JEB-H)である。いくつかの実施形態では、JEBは、非ヘルリッツ型JEBである。JEBの兆候及び/または症状には、皮膚の水疱形成、創傷形成、及び/または瘢痕化、肉芽組織の存在または発生、皮膚びらん、手指の爪及び/または足指の爪の変形、手指及び/または足指の癒着、皮膚のひきつれ及び/または菲薄化、拘縮、粘膜の水疱形成及び/または瘢痕化、呼吸困難、ホースクライ、感染症に対する易罹患性の増加、脱水症、体液喪失、電解質不均衡、胃腸管及び/または胃尿管の水疱形成及び/または瘢痕化、虫歯及び/またはエナメル質形成不全、抜け毛、脱毛症、栄養失調、発育遅延、貧血症、ならびにそれらの任意の組み合わせが含まれ得るが、これらに限定されない。
【0190】
いくつかの実施形態では、組換え核酸は、組換え核酸が対象の1つ以上の標的細胞に送達されると、コードされたラミニンタンパク質(複数可)(例えば、ヒトLamA3、LamB3、及び/またはLamC2タンパク質)を発現する。いくつかの実施形態では、ラミニンタンパク質(複数可)(例えば、ヒトLamA3、LamB3、及び/またはLamC2タンパク質)の発現は、1つ以上の標的細胞におけるラミニンレベルを強化する、増加させる、増強する、及び/または補充する。いくつかの実施形態では、ラミニンタンパク質(複数可)(例えば、ヒトLamA3、LamB3、及び/またはLamC2タンパク質)の発現は、1つ以上の標的細胞によって分泌されるラミニンレベルを強化する、増加させる、増強する、及び/または補充する。いくつかの実施形態では、ラミニンタンパク質(複数可)(例えば、ヒトLamA3、LamB3、及び/またはLamC2タンパク質)の発現は、対象における細胞外マトリックスの安定性を強化する、増加させる、強化する、及び/または補充する。いくつかの実施形態では、ラミニンタンパク質(複数可)(例えば、ヒトLamA3、LamB3、及び/またはLamC2タンパク質)の発現は、対象における透明帯、基底膜、及び/または真皮表皮接合部を強化する、増強する、及び/または補充する。いくつかの実施形態では、ラミニンタンパク質(複数可)(例えば、ヒトLamA3、LamB3、及び/またはLamC2タンパク質)の発現は、JEB患者におけるラミニン欠乏症を治療する。いくつかの実施形態では、ラミニンタンパク質(複数可)(例えば、ヒトLamA3、LamB3、及び/またはLamC2タンパク質)の発現は、JEB患者における1つ以上の兆候または症状(例えば、水疱形成)の予防的、姑息的、または治療的緩和を提供する。
【0191】
本開示の他の態様は、対象の1つ以上の細胞におけるフィラグリンポリペプチドのレベルを強化する、増加させる、増強する、及び/または補充することに関し、対象に、本明細書に記載の組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤のうちのいずれかを投与することを含む。いくつかの実施形態では、対象は、ヒトである。いくつかの実施形態では、対象のゲノムは、内因性FLG及び/またはFLG2遺伝子に変異(例えば、機能喪失変異)を含む。いくつかの実施形態では、対象は、例えば、アトピー性皮膚炎、尋常性魚鱗癬、皮膚剥離症候群等を含む、皮膚疾患に罹患している。いくつかの実施形態では、対象は、アトピー性皮膚炎に罹患している。いくつかの実施形態では、対象の皮膚の1つ以上の部分は、治療前に擦過されるか、またはより透過性にされる。
【0192】
いくつかの実施形態では、対象への組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤の投与は、対象における1つ以上の対応する未処理細胞における内因性フィラグリンレベルと比較して、対象の1つ以上の接触細胞または処理細胞におけるフィラグリンレベル(転写物またはタンパク質レベル)を少なくとも約2倍増加させる。例えば、組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤の投与は、対象における1つ以上の対応する未処理細胞における内因性フィラグリンレベルと比較して、対象の1つ以上の接触細胞または処理細胞におけるフィラグリンレベル(転写物またはタンパク質レベル)を少なくとも約2倍、少なくとも約3倍、少なくとも約4倍、少なくとも約5倍、少なくとも約6倍、少なくとも約7倍、少なくとも約8倍、少なくとも約9倍、少なくとも約10倍、少なくとも約15倍、少なくとも約20倍、少なくとも約25倍、少なくとも約50倍、少なくとも約75倍、少なくとも約100倍、少なくとも約250倍、少なくとも約500倍、少なくとも約750倍、少なくとも約1000倍、またはそれ以上増加させ得る。いくつかの実施形態では、1つ以上の接触細胞または処理細胞は、1つ以上の表皮細胞及び/または真皮細胞(例えば、ケラチノサイトまたは線維芽細胞)である。例えば、qPCR、ウエスタンブロット、質量分析等を含む、試料から転写物またはタンパク質レベルを測定する方法は、当業者に周知である。
【0193】
本開示の他の態様は、その必要がある対象の皮膚の角質層の生成を強化する及び/または皮膚の角質層を安定化することに関し、対象に、本明細書に記載の組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤のうちのいずれかを投与することを含む。いくつかの実施形態では、対象は、ヒトである。いくつかの実施形態では、対象のゲノムは、内因性FLG及び/またはFLG2遺伝子に変異(例えば、機能喪失変異)を含む。いくつかの実施形態では、対象は、例えば、アトピー性皮膚炎、尋常性魚鱗癬、皮膚剥離症候群等を含む、皮膚疾患に罹患している。いくつかの実施形態では、対象は、アトピー性皮膚炎に罹患している。いくつかの実施形態では、対象の皮膚の1つ以上の部分は、治療前に擦過されるか、またはより透過性にされる。例えば、微視的評価を含む、角質層の生成及び/または安定化の変化/改善を監視する方法は、当業者に既知である。
【0194】
本開示の他の態様は、その必要がある対象において皮膚バリア機能欠損を軽減または治療する方法であって、対象に、本明細書に記載の組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤のうちのいずれかを投与することを含む、方法に関する。いくつかの実施形態では、バリア機能欠損は、経表皮水分喪失(TEWL)である。いくつかの実施形態では、本開示の方法は、その必要がある対象において経表皮水分喪失を軽減する。いくつかの実施形態では、対象は、ヒトである。いくつかの実施形態では、対象のゲノムは、内因性FLG及び/またはFLG2遺伝子に変異(例えば、機能喪失変異)を含む。いくつかの実施形態では、対象は、例えば、アトピー性皮膚炎、尋常性魚鱗癬、皮膚剥離症候群等を含む、皮膚疾患に罹患している。いくつかの実施形態では、対象は、アトピー性皮膚炎に罹患している。いくつかの実施形態では、対象の皮膚の1つ以上の部分は、治療前に擦過されるか、またはより透過性にされる。例えば、Antonov et al.(Curr Probl Dermatol.2016;49:61-70)によって説明された方法のうちのいずれかを含む、TEWLを含むバリア機能を測定する方法は、当業者に周知である。
【0195】
本開示の他の態様は、その必要がある対象においてアレルゲンの経皮移入を減少させるまたは阻害する方法であって、対象に、本明細書に記載の組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤のうちのいずれかを投与することを含む、方法に関する。いくつかの実施形態では、対象は、ヒトである。いくつかの実施形態では、対象のゲノムは、内因性FLG及び/またはFLG2遺伝子に変異(例えば、機能喪失変異)を含む。いくつかの実施形態では、対象は、例えば、アトピー性皮膚炎、尋常性魚鱗癬、皮膚剥離症候群等を含む、皮膚疾患に罹患している。いくつかの実施形態では、対象は、アトピー性皮膚炎に罹患している。いくつかの実施形態では、対象の皮膚の1つ以上の部分は、治療前に擦過されるか、またはより透過性にされる。例えば、Shtessel et al.(Ann Allergy Asthma Immunol.2018 Jan;120(1):80-83)によって説明された方法を含む、アレルゲンの経皮移入を測定する方法は、当業者に周知である。
【0196】
本開示の他の態様は、その必要がある対象において皮膚疾患の1つ以上の兆候または症状の予防的、姑息的、または治療的緩和を提供する方法であって、対象に、本明細書に記載の組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤のうちのいずれかを投与することを含む、方法に関する。いくつかの実施形態では、対象は、ヒトである。いくつかの実施形態では、対象のゲノムは、内因性FLG及び/またはFLG2遺伝子に変異(例えば、機能喪失変異)を含む。いくつかの実施形態では、皮膚疾患は、アトピー性皮膚炎、尋常性魚鱗癬、及び皮膚剥離症候群(例えば、非炎症性A型皮膚剥離症候群、炎症性B型皮膚剥離症候群、末端皮膚剥離症候群等)から選択される。いくつかの実施形態では、対象は、アトピー性皮膚炎に罹患している。いくつかの実施形態では、対象の皮膚の1つ以上の部分は、治療前に擦過されるか、またはより透過性にされる。いくつかの実施形態では、組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤は、対象の1つ以上の罹患領域及び/または非罹患領域に投与される。
【0197】
本開示の他の態様は、その必要がある対象においてアトピー性皮膚炎の1つ以上の兆候または症状の予防的、姑息的、または治療的緩和を提供する方法であって、対象に、本明細書に記載の組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤のうちのいずれかを投与することを含む、方法に関する。いくつかの実施形態では、対象は、ヒトである。いくつかの実施形態では、対象のゲノムは、内因性FLG及び/またはFLG2遺伝子に変異(例えば、機能喪失変異)を含む。いくつかの実施形態では、対象の皮膚の1つ以上の部分は、治療前に擦過されるか、またはより透過性にされる。いくつかの実施形態では、組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤は、対象の1つ以上の罹患領域及び/または非罹患領域に投与される。
【0198】
アトピー性皮膚炎の兆候及び症状には、乾燥皮膚、特に夜間に重度になる可能性のある掻痒、特に手、足、足首、手首、首、上部胸部、眼瞼、肘及び膝の屈曲部の内側、ならびに乳児では顔及び頭皮上の赤色~茶色がかった灰色の斑点、湿潤性である可能性のある皮膚における小さい隆起した突出物、皮膚感染症、眼瞼皮膚炎、白内障、IgEレベルの上昇、肥厚した、ひび割れした、または鱗状の皮膚、引っ掻きにより皮が剥けて敏感になった腫れた皮膚が含まれ得るが、これらに限定されない。
【0199】
本開示の他の態様は、その必要がある対象において尋常性水疱症の1つ以上の兆候または症状の予防的、姑息的、または治療的緩和を提供する方法であって、対象に、本明細書に記載の組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤のうちのいずれかを投与することを含む、方法に関する。いくつかの実施形態では、対象は、ヒトである。いくつかの実施形態では、対象のゲノムは、内因性FLG及び/またはFLG2遺伝子に変異(例えば、機能喪失変異)を含む。いくつかの実施形態では、対象の皮膚の1つ以上の部分は、治療前に擦過されるか、またはより透過性にされる。いくつかの実施形態では、組換え核酸、ウイルス、及び/または薬学的組成物は、対象の1つ以上の罹患領域及び/または非罹患領域に投与される。
【0200】
尋常性魚鱗癬の兆候及び症状には、頭皮の剥離、皮膚の掻痒、皮膚の多角形またはタイル状鱗屑、茶色、灰色、または白色の鱗屑、重度に乾燥した皮膚、皮膚の有痛性ひび割れ、及び肥厚した皮膚が含まれ得るが、これらに限定されない。
【0201】
本開示の他の態様は、その必要がある対象において皮膚剥離症候群(例えば、非炎症性A型皮膚剥離症候群、炎症性B型皮膚剥離症候群、末端皮膚剥離症候群等)の1つ以上の兆候または症状の予防的、姑息的、または治療的緩和を提供する方法であって、本明細書に記載の組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤のうちのいずれかを投与することを含む、方法に関する。いくつかの実施形態では、対象は、ヒトである。いくつかの実施形態では、対象のゲノムは、内因性FLG及び/またはFLG2遺伝子に変異(例えば、機能喪失変異)を含む。いくつかの実施形態では、対象の皮膚の1つ以上の部分は、治療前に擦過されるか、またはより透過性にされる。いくつかの実施形態では、組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤は、対象の1つ以上の罹患領域及び/または非罹患領域に投与される。
【0202】
皮膚剥離症候群の兆候及び症状には、皮膚の異常な水疱形成、アミノ酸尿症、乾燥皮膚、魚鱗癬、複数のカフェオレ斑、脆弱毛髪、紅斑、IgEレベルの上昇、爪甲離床症、及び皮膚の鱗屑化が含まれ得るが、これらに限定されない。
【0203】
本明細書に記載の組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤は、経口投与、舌下投与、口腔投与、局所投与、直腸投与、吸入による投与、経皮投与、皮下注射、皮内注射、静脈内注射、動脈内注射、筋肉内注射、心臓内注射、骨内注射、腹腔内注射、経粘膜投与、膣内投与、硝子体内投与、眼窩内投与、網膜下投与、結膜下投与(例えば、結膜下デポの使用)、脈絡膜上投与、関節内投与、関節周囲投与、局部投与、皮膚上投与、またはそれらの任意の組み合わせを含むが、これらに限定されない、当該技術分野で既知の任意の好適な方法または経路によって投与され得る。したがって、本開示は、本明細書に記載の組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤のうちのいずれかを個体(またはその特定の部位もしくは組織)に送達する方法を包含する。
【0204】
いくつかの実施形態では、本開示の方法で使用される組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤は、対象に、皮膚、局所、経皮、皮下、皮内、経粘膜、舌下、経鼻、口腔、硝子体内、網膜下、結膜下、脈絡膜上、関節内投与、または吸入により投与される。いくつかの実施形態では、組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤は、対象に、局所、経皮、皮下、皮内、または経粘膜投与される。いくつかの実施形態では、組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤は、対象に、局所、経皮、または皮内投与される。いくつかの実施形態では、組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤は、対象に局所投与される。いくつかの実施形態では、組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤は、対象に皮内投与される。いくつかの実施形態では、組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤は、対象に、経口、舌下、口腔、経鼻投与、または吸入により投与される。いくつかの実施形態では、組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤は、対象に、経口投与または吸入により投与される。いくつかの実施形態では、組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤は、対象の眼窩内、硝子体内、網膜下、結膜下、脈絡膜上、または局所(眼に)投与される。
【0205】
いくつかの実施形態では、組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤は、対象に1回投与される。いくつかの実施形態では、組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤は、対象に少なくとも2回(例えば、少なくとも2回、少なくとも3回、少なくとも4回、少なくとも5回、少なくとも10回等)投与される。いくつかの実施形態では、投与間(例えば、第1の投与と第2の投与との間、第2の投与と第3の投与との間等)で、少なくとも1時間(例えば、少なくとも約1時間、少なくとも約6時間、少なくとも約12時間、少なくとも約18時間、少なくとも約1日間、少なくとも約2日間、少なくとも約3日間、少なくとも約4日間、少なくとも約5日間、少なくとも約6日間、少なくとも約7日間、少なくとも約15日間、少なくとも約20日間、少なくとも約30日間、少なくとも約40日間、少なくとも約50日間、少なくとも約60日間、少なくとも約70日間、少なくとも約80日間、少なくとも約90日間、少なくとも約100日間、少なくとも約120日間等)が経過している。いくつかの実施形態では、組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤は、対象に1日1回、2回、3回、4回、5回、またはそれ以上投与される。いくつかの実施形態では、組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤は、対象の1つ以上の罹患領域(例えば、JEBの1つ以上の兆候もしくは症状を呈する1つ以上の領域)及び/または非罹患領域に投与される。
【0206】
いくつかの実施形態では、対象の皮膚の1つ以上の部分は、本明細書に記載の組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤での治療前に擦過されるか、またはより透過性にされる。例えば、皮膚ローラーの使用、皮膚細胞層を除去するための接着ストリップの繰り返しの使用(テープ剥離)、メスまたはブレードでの掻爬、サンドペーパーの使用、化学的透過促進剤または電気エネルギーの使用、音波エネルギーまたは超音波エネルギーの使用、光(例えば、レーザー)エネルギーの使用、表皮を完全に貫通しないが、突き刺すのに好適な長さを有するミクロンサイズの針またはブレードの使用等を含む、皮膚を擦過するか、または皮膚の透過性を増加させる任意の好適な方法が使用され得る。
【0207】
VII.宿主細胞
本開示のある特定の態様は、本明細書に記載の組換え核酸のうちのいずれかを含む1つ以上の宿主細胞に関する。例えば、真正細菌を含む原核細胞、例えば、グラム陰性またはグラム陽性生物、例えば、エシェリキア(Escherichia)(例えば、大腸菌(E.coli))、エンテロバクター(Enterobacter)、エルミニア(Erminia)、クレブシエラ(Klebsiella)、プロテウス(Proteus)、サルモネラ(Salmonella)(例えば、ネズミチフス菌(S.typhimurium))、セラチア(Serratia)(例えば、霊菌(S.marcescans))、及びシゲラ(Shigella)等の腸内細菌科(Enterobacteriaceae)、ならびに枯草菌(B.subtilis)及びB.リケニフォルミス(B.licheniformis)等のバチルス(Bacilli)、真菌細胞(例えば、S.セレビシエ(S.cerevisiae))、昆虫細胞(例えば、S2細胞等)、及び哺乳類細胞(例えば、SV40によって形質転換されたサル腎臓CV1株(COS-7、ATCC CRL 1651)、ヒト胚腎臓株(懸濁培養液中での増殖のためにサブクローニングされた293または293細胞)、ベビーハムスター腎細胞(BHK、ATCC CCL 10)、マウスセルトリ細胞(TM4)、サル腎細胞(CV1 ATCC CCL 70)、アフリカミドリザル腎細胞(VERO-76、ATCC CRL-1587)、ヒト子宮頸癌細胞(HELA、ATCC CCL 2)、イヌ腎細胞(MDCK、ATCC CCL 34)、バッファローラット肝細胞(BRL 3A、ATCC CRL 1442)、ヒト肺細胞(W138、ATCC CCL 75)、ヒト肝細胞(Hep G2、HB 8065)、マウス乳房腫瘍(MMT 060562、ATCC CCL51)、TRI細胞、MRC5細胞、FS4細胞、ヒトヘパトーマ(Hep G2)、チャイニーズハムスター卵巣(CHO)細胞(例えば、DHFR’’CHO細胞)、ならびにNS0及びSp2/0等の骨髄腫細胞株)を含む、当該技術分野で既知の任意の好適な宿主細胞(原核細胞または真核細胞)が使用され得る。いくつかの実施形態では、宿主細胞は、ヒトまたは非ヒト霊長類細胞である。いくつかの実施形態では、宿主細胞は、細胞株由来の細胞である。好適な宿主細胞または細胞株の例には、293、HeLa、SH-Sy5y、Hep G2、CACO-2、A549、L929、3T3、K562、CHO-K1、MDCK、HUVEC、Vero、N20、COS-7、PSN1、VCaP、CHO細胞等が挙げられ得るが、これらに限定されない。
【0208】
いくつかの実施形態では、組換え核酸は、単純ヘルペスウイルスベクターである。いくつかの実施形態では、組換え核酸は、単純ヘルペスウイルスアンプリコンである。いくつかの実施形態では、組換え核酸は、HSV-1アンプリコンまたはHSV-1ハイブリッドアンプリコンである。いくつかの実施形態では、ヘルパーウイルスを含む宿主細胞は、本明細書に記載のHSV-1アンプリコンまたはHSV-1ハイブリッドアンプリコンと接触し、本明細書に記載の1つ以上の組換え核酸を含むウイルスの産生をもたらす。いくつかの実施形態では、ウイルスは、接触した宿主細胞の上清から収集される。ヘルパーウイルスを含む宿主細胞をHSV-1アンプリコンまたはHSV-1ハイブリッドアンプリコンと接触させることによってウイルスを生成する方法は、当該技術分野で既知である。
【0209】
いくつかの実施形態では、宿主細胞は、補完宿主細胞である。いくつかの実施形態では、補完宿主細胞は、本明細書に記載のウイルスベクターのうちのいずれかにおいて不活性化される1つ以上の遺伝子を発現する。いくつかの実施形態では、補完宿主細胞は、本明細書に記載の組換えヘルペスウイルスゲノム(例えば、組換え単純ヘルペスウイルスゲノム)と接触する。いくつかの実施形態では、補完宿主細胞を組換えヘルペスウイルスゲノムと接触させることにより、本明細書に記載の1つ以上の組換え核酸を含むヘルペスウイルスの産生がもたらされる。いくつかの実施形態では、ウイルスは、接触した宿主細胞の上清から収集される。補完宿主細胞を組換え単純ヘルペスウイルスと接触させることによってウイルスを生成する方法は、概して、WO2015/009952及び/またはWO2017/176336に記載されている。
【0210】
VIII.製品またはキット
本開示のある特定の態様は、本明細書に記載の組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤のうちのいずれかを含む製品またはキットに関する。いくつかの実施形態では、製品またはキットは、(例えば、LAMA3、LAMB3、及び/またはLAMC2遺伝子変異等のラミニン遺伝子変異を有する対象において)ラミニン欠乏症を治療するための及び/またはその必要がある対象においてラミニン欠乏症に関連する疾患または障害(JEB等)の1つ以上の兆候または症状の予防的、姑息的、もしくは治療的緩和を提供するための組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤の投与に関する指示を含む添付文書を含む。いくつかの実施形態では、製品またはキットは、(例えば、FLGまたはFLG2遺伝子変異を有する対象において)フィラグリン欠乏症を治療するための及び/またはその必要がある対象においてフィラグリン欠乏症に関連する疾患もしくは障害(アトピー性皮膚炎、尋常性魚鱗癬、皮膚剥離症候群等)の1つ以上の兆候または症状の予防的、姑息的、または治療的緩和を提供するための組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤の投与に関する指示を含む添付文書を含む。
【0211】
組換え核酸、ウイルス、薬剤、及び/または薬学的組成物もしくは製剤に好適な容器には、例えば、ボトル、バイアル、バッグ、チューブ、及びシリンジが含まれ得る。容器は、ガラス、プラスチック(ポリ塩化ビニルもしくはポリオレフィン等)、または金属合金(ステンレス鋼もしくはハステロイ等)等の様々な材料から形成され得る。いくつかの実施形態では、容器は、容器上にラベルを含むか、または容器に関連するラベルを含み、ラベルは、使用に関する指示を示す。製品またはキットは、他の緩衝液、希釈剤、フィルター、針、シリンジ、添付文書等を含む、商業的観点及び使用者の観点から望ましい他の材料をさらに含み得る。
【0212】
IX.列挙される実施形態
実施形態1:ラミニンポリペプチドをコードする1つ以上のポリヌクレオチドを含む、組換えヘルペスウイルスゲノム。
【0213】
実施形態2:複製可能である、実施形態1に記載の組換えヘルペスウイルスゲノム。
【0214】
実施形態3:複製欠損である、実施形態1に記載の組換えヘルペスウイルスゲノム。
【0215】
実施形態4:前記組換え単純ヘルペスウイルスゲノムが、ラミニンポリペプチドをコードする前記1つ以上のポリヌクレオチドを、1つ以上のウイルス遺伝子座内に含む、実施形態1~3のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0216】
実施形態5:組換え単純ヘルペスウイルスゲノム、組換え水痘帯状疱疹ウイルスゲノム、組換えヒトサイトメガロウイルスゲノム、組換えヘルペスウイルス6Aゲノム、組換えヘルペスウイルス6Bゲノム、組換えヘルペスウイルス7ゲノム、組換えカポジ肉腫関連ヘルペスウイルスゲノム、及びそれらの任意の派生物からなる群から選択される、実施形態1~4のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0217】
実施形態6:前記ラミニンポリペプチドがヒトラミニン(Lam)ポリペプチドである、実施形態1~5のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0218】
実施形態7:前記ヒトラミニン(Lam)ポリペプチドが、ヒトLamA1ポリペプチド、ヒトLamA2ポリペプチド、ヒトLamA3ポリペプチド、ヒトLamA4ポリペプチド、ヒトLamA5ポリペプチド、ヒトLamB1ポリペプチド、ヒトLamB2ポリペプチド、ヒトLamB3ポリペプチド、ヒトLamC1ポリペプチド、ヒトLamC2ポリペプチド、ヒトLamC3ポリペプチド、及びそれらの任意のキメラポリペプチドからなる群から選択される、実施形態6に記載の組換えヘルペスウイルスゲノム。
【0219】
実施形態8:前記ヒトラミニン(Lam)ポリペプチドが、ヒトLamA3ポリペプチド、ヒトLamB3ポリペプチド、及びヒトLamC2ポリペプチドからなる群から選択される、実施形態6または7に記載の組換えヘルペスウイルスゲノム。
【0220】
実施形態9:前記ラミニンポリペプチドが、配列番号7~9からなる群から選択されるアミノ酸配列に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む、実施形態1~8のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0221】
実施形態10:組換え単純ヘルペスウイルスゲノムである、実施形態1~9のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0222】
実施形態11:前記組換え単純ヘルペスウイルスゲノムが、組換え単純ヘルペスウイルス1型(HSV-1)ゲノム、組換え単純ヘルペスウイルス2型(HSV-2)ゲノム、またはそれらの任意の派生物である、実施形態10に記載の組換えヘルペスウイルスゲノム。
【0223】
実施形態12:前記組換え単純ヘルペスウイルスゲノムが不活性化変異を含む、実施形態10または11に記載の組換えヘルペスウイルスゲノム。
【0224】
実施形態13:前記不活性化変異が単純ヘルペスウイルス遺伝子に存在する、実施形態12に記載の組換えヘルペスウイルスゲノム。
【0225】
実施形態14:前記不活性化変異が、前記単純ヘルペスウイルス遺伝子のコード配列の欠失である、実施形態13に記載の組換えヘルペスウイルスゲノム。
【0226】
実施形態15:前記単純ヘルペスウイルス遺伝子が、感染細胞タンパク質(ICP)0、ICP4、ICP22、ICP27、ICP47、チミジンキナーゼ(tk)、ロングユニーク領域(UL)41、及びUL55からなる群から選択される、実施形態13または14に記載の組換えヘルペスウイルスゲノム。
【0227】
実施形態16:前記組換え単純ヘルペスウイルスゲノムが、ICP4遺伝子の一方または両方のコピーに不活性化変異を含む、実施形態15に記載の組換えヘルペスウイルスゲノム。
【0228】
実施形態17:前記組換え単純ヘルペスウイルスゲノムが、ICP22遺伝子に不活性化変異を含む、実施形態15または16に記載の組換えヘルペスウイルスゲノム。
【0229】
実施形態18:前記組換え単純ヘルペスウイルスゲノムが、UL41遺伝子に不活性化変異を含む、実施形態15~17のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0230】
実施形態19:前記組換え単純ヘルペスウイルスゲノムが、ICP0遺伝子の一方または両方のコピーに不活性化変異を含む、実施形態15~18のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0231】
実施形態20:前記組換え単純ヘルペスウイルスゲノムが、ICP27遺伝子に不活性化変異を含む、実施形態15~19のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0232】
実施形態21:前記組換え単純ヘルペスウイルスゲノムが、ICP4ウイルス遺伝子座の一方または両方内に前記ラミニンポリペプチドをコードする前記1つ以上のポリヌクレオチドを含む、実施形態10~20のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0233】
実施形態22:前記組換え単純ヘルペスウイルスゲノムが、ICP22ウイルス遺伝子座内に前記ラミニンポリペプチドをコードする前記1つ以上のポリヌクレオチドを含む、実施形態10~21のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0234】
実施形態23:前記組換え単純ヘルペスウイルスゲノムが、UL41ウイルス遺伝子座内に前記ラミニンポリペプチドをコードする前記1つ以上のポリヌクレオチドを含む、実施形態10~22のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0235】
実施形態24:標的細胞に導入された場合に、対応する野生型ヘルペスウイルスゲノムと比較して減少した細胞毒性を有する、実施形態1~23のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0236】
実施形態25:前記標的細胞がヒト細胞である、実施形態24に記載の組換えヘルペスウイルスゲノム。
【0237】
実施形態26:前記標的細胞が表皮細胞及び/または真皮細胞である、実施形態24または25に記載の組換えヘルペスウイルスゲノム。
【0238】
実施形態27:前記標的細胞がケラチノサイトまたは線維芽細胞である、実施形態24~26のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0239】
実施形態28:実施形態1~27のいずれか1つに記載の組換えヘルペスウイルスゲノムを含む、ヘルペスウイルス。
【0240】
実施形態29:複製可能である、実施形態28に記載のヘルペスウイルス。
【0241】
実施形態30:複製欠損である、実施形態28に記載のヘルペスウイルス。
【0242】
実施形態31:対応する野生型ヘルペスウイルスと比較して減少した細胞毒性を有する、実施形態28~30のいずれか1つに記載のヘルペスウイルス。
【0243】
実施形態32:単純ヘルペスウイルス、水痘帯状疱疹ウイルス、ヒトサイトメガロウイルス、ヘルペスウイルス6A、ヘルペスウイルス6B、ヘルペスウイルス7、カポジ肉腫関連ヘルペスウイルス、及びそれらの任意の派生物からなる群から選択される、実施形態28~31のいずれか1つに記載のヘルペスウイルス。
【0244】
実施形態33:単純ヘルペスウイルスである、実施形態28~32のいずれか1つに記載のヘルペスウイルス。
【0245】
実施形態34:前記単純ヘルペスウイルスが、単純ヘルペスウイルス1型(HSV-1)、単純ヘルペスウイルス2型(HSV-2)、またはそれらの任意の派生物である、実施形態32または33に記載のヘルペスウイルス。
【0246】
実施形態35:実施形態1~27のいずれか1つに記載の組換えヘルペスウイルスゲノムまたは実施形態28~34のいずれか1つに記載のヘルペスウイルスと、薬学的に許容される賦形剤とを含む、薬学的組成物。
【0247】
実施形態36:局所、経皮、皮下、皮内、経口、舌下、口腔、直腸、膣内、吸入、静脈内、動脈内、筋肉内、心臓内、骨内、腹腔内、経粘膜、硝子体内、網膜下、関節内、関節周囲、局部、または皮膚上投与に好適である、実施形態35に記載の薬学的組成物。
【0248】
実施形態37:局所、経皮、皮下、皮内、または経粘膜投与に好適である、実施形態35または36に記載の薬学的組成物。
【0249】
実施形態38:局所投与に好適である、実施形態35~37のいずれか1つに記載の薬学的組成物。
【0250】
実施形態39:経口または吸入投与に好適である、実施形態35または36に記載の薬学的組成物。
【0251】
実施形態40:ヒドロキシプロピルメチルセルロースゲルを含む、実施形態35~39のいずれか1つに記載の薬学的組成物。
【0252】
実施形態41:リン酸緩衝液を含む、実施形態35~40のいずれか1つに記載の薬学的組成物。
【0253】
実施形態42:グリセロールを含む、実施形態35~41のいずれか1つに記載の薬学的組成物。
【0254】
実施形態43:脂質担体を含む、実施形態35~42のいずれか1つに記載の薬学的組成物。
【0255】
実施形態44:ナノ粒子担体を含む、実施形態35~43のいずれか1つに記載の薬学的組成物。
【0256】
実施形態45:対象の1つ以上の細胞におけるラミニンポリペプチドのレベルを強化する、増加させる、増強する、及び/または補充する方法であって、前記対象に、実施形態28~34のいずれか1つに記載のヘルペスウイルスまたは実施形態35~44のいずれか1つに記載の薬学的組成物の有効量を投与することを含む、前記方法。
【0257】
実施形態46:対象の皮膚における1つ以上の細胞の細胞接着を強化する、増加させる、増強する、及び/または補充する方法であって、前記対象に、実施形態28~34のいずれか1つに記載のヘルペスウイルスまたは実施形態35~44のいずれか1つに記載の薬学的組成物の有効量を投与することを含む、前記方法。
【0258】
実施形態47:前記細胞接着がインテグリン媒介性細胞接着である、実施形態46に記載の方法。
【0259】
実施形態48:対象の透明帯を強化する、増加させる、増強する、及び/または補充する方法であって、前記対象に、実施形態28~34のいずれか1つに記載のヘルペスウイルスまたは実施形態35~44のいずれか1つに記載の薬学的組成物の有効量を投与することを含む、前記方法。
【0260】
実施形態49:対象の上皮基底膜集合、上皮基底膜組織化、及び/または上皮基底接着を強化する、増加させる、増強する、及び/または補充する方法であって、前記対象に、実施形態28~34のいずれか1つに記載のヘルペスウイルスまたは実施形態35~44のいずれか1つに記載の薬学的組成物の有効量を投与することを含む、前記方法。
【0261】
実施形態50:その必要がある対象において接合部型表皮水疱症(JEB)の1つ以上の兆候または症状に対する予防的、姑息的、または治療的緩和を提供する方法であって、前記対象に、実施形態28~34のいずれか1つに記載のヘルペスウイルスまたは実施形態35~44のいずれか1つに記載の薬学的組成物の有効量を投与することを含む、前記方法。
【0262】
実施形態51:前記対象がヒトである、実施形態45~50のいずれか1つに記載の方法。
【0263】
実施形態52:前記対象のゲノムが、ラミニン遺伝子に機能喪失変異を含む、実施形態45~51のいずれか1つに記載の方法。
【0264】
実施形態53:前記ヘルペスウイルスまたは前記薬学的組成物が、前記対象に、局所、経皮、皮下、皮膚上、皮内、経口、舌下、口腔、直腸、膣内、静脈内、動脈内、筋肉内、骨内、心臓内、腹腔内、経粘膜、硝子体内、網膜下、関節内、関節周囲、局部投与、または吸入により投与される、実施形態45~52のいずれか1つに記載の方法。
【0265】
実施形態54:前記ヘルペスウイルスまたは前記薬学的組成物が、前記対象に、局所、経皮、または皮内投与される、実施形態45~53のいずれか1つに記載の方法。
【0266】
実施形態55:前記ヘルペスウイルスまたは前記薬学的組成物が、前記対象に局所投与される、実施形態45~54のいずれか1つに記載の方法。
【0267】
実施形態56:前記ヘルペスウイルスまたは前記薬学的組成物が、前記対象に皮内投与される、実施形態45~54のいずれか1つに記載の方法。
【0268】
実施形態57:前記対象の皮膚が、投与前に擦過される、実施形態45~56のいずれか1つに記載の方法。
【0269】
実施形態58:前記ヘルペスウイルスまたは前記薬学的組成物が、経口投与または吸入により投与される、実施形態45~53のいずれか1つに記載の方法。
【0270】
実施形態59:前記ヘルペスウイルスまたは前記薬学的組成物が、1日1回、2回、3回、4回、5回、または以上投与される、実施形態45~58のいずれか1つに記載の方法。
【0271】
実施形態60:前記ヘルペスウイルスまたは前記薬学的組成物が、前記対象の1つ以上の罹患領域及び/または非罹患領域に投与される、実施形態45~59のいずれか1つに記載の方法。
【0272】
実施形態61:JEBの前記1つ以上の兆候または症状が、皮膚の水疱形成、創傷形成、及び/または瘢痕化、肉芽組織、皮膚びらん、手指の爪及び/または足指の爪の変形、手指及び/または足指の癒着、皮膚のひきつれ及び/または菲薄化、拘縮、粘膜の水疱形成及び/または瘢痕化、呼吸困難、ホースクライ(horse cry)、感染症に対する易罹患性の増加、脱水症、体液喪失、電解質不均衡、胃腸管及び/または胃尿管の水疱形成及び/または瘢痕化、虫歯及び/またはエナメル質形成不全、抜け毛、栄養失調、発育遅延、貧血症、ならびにそれらの任意の組み合わせから選択される、実施形態50~60のいずれか1つに記載の方法。
【0273】
実施形態62:前記対象が接合部型ヘルリッツ表皮水疱症(JEB-H)に罹患している、実施形態50~61のいずれか1つに記載の方法。
【0274】
実施形態63:前記対象が接合部型非ヘルリッツ表皮水疱症(JEB-nH)に罹患している、実施形態50~61のいずれか1つに記載の方法。
【0275】
実施形態64:フィラグリンポリペプチドをコードする1つ以上のポリヌクレオチドを含む、組換えヘルペスウイルスゲノム。
【0276】
実施形態65:複製可能である、実施形態64に記載の組換えヘルペスウイルスゲノム。
【0277】
実施形態66:複製欠損である、実施形態64に記載の組換えヘルペスウイルスゲノム。
【0278】
実施形態67:前記フィラグリンポリペプチドをコードする前記1つ以上のポリヌクレオチドを、1つ以上のウイルス遺伝子座内に含む、実施形態64~66のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0279】
実施形態68:組換え単純ヘルペスウイルスゲノム、組換え水痘帯状疱疹ウイルスゲノム、組換えヒトサイトメガロウイルスゲノム、組換えヘルペスウイルス6Aゲノム、組換えヘルペスウイルス6Bゲノム、組換えヘルペスウイルス7ゲノム、組換えカポジ肉腫関連ヘルペスウイルスゲノム、及びそれらの任意の派生物からなる群から選択される、実施形態64~67のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0280】
実施形態69:前記フィラグリンポリペプチドがヒトフィラグリンポリペプチドまたはヒトフィラグリン-2ポリペプチドである、実施形態64~68のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0281】
実施形態70:前記フィラグリンポリペプチドが、配列番号39~50からなる群から選択されるアミノ酸配列に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む、実施形態64~69のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0282】
実施形態71:前記フィラグリンポリペプチドが、配列番号39のアミノ酸配列に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む、実施形態64~70のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0283】
実施形態72:組換え単純ヘルペスウイルスゲノムである、実施形態64~71のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0284】
実施形態73:前記組換え単純ヘルペスウイルスゲノムが、組換えHSV-1ゲノム、組換えHSV-2ゲノム、またはそれらの任意の派生物である、実施形態72に記載の組換え単純ヘルペスウイルスゲノム。
【0285】
実施形態74:前記組換え単純ヘルペスウイルスゲノムが不活性化変異を含む、実施形態72または73に記載の組換えヘルペスウイルス。
【0286】
実施形態75:前記不活性化変異が単純ヘルペスウイルス遺伝子に存在する、実施形態74に記載の組換えヘルペスウイルス。
【0287】
実施形態76:前記不活性化変異が、前記単純ヘルペスウイルス遺伝子のコード配列の欠失である、実施形態75に記載の組換えヘルペスウイルスゲノム。
【0288】
実施形態77:前記単純ヘルペスウイルス遺伝子が、感染細胞タンパク質(ICP)0、ICP4、ICP22、ICP27、ICP47、チミジンキナーゼ(tk)、ロングユニーク領域(UL)41、及びUL55からなる群から選択される、実施形態75または76に記載の組換えヘルペスウイルスゲノム。
【0289】
実施形態78:前記組換え単純ヘルペスウイルスゲノムが、ICP4遺伝子の一方または両方のコピーに不活性化変異を含む、実施形態77の組換えヘルペスウイルスゲノム。
【0290】
実施形態79:前記組換え単純ヘルペスウイルスゲノムが、ICP22遺伝子に不活性化変異を含む、実施形態77または78に記載の組換えヘルペスウイルスゲノム。
【0291】
実施形態80:前記組換え単純ヘルペスウイルスゲノムが、UL41遺伝子に不活性化変異を含む、実施形態77~79のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0292】
実施形態81:前記組換え単純ヘルペスウイルスゲノムが、ICP0遺伝子の一方または両方のコピーに不活性化変異を含む、実施形態77~80のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0293】
実施形態82:前記組換え単純ヘルペスウイルスゲノムが、ICP27遺伝子に不活性化変異を含む、実施形態77~81のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0294】
実施形態83:前記組換え単純ヘルペスウイルスゲノムが、ICP4ウイルス遺伝子座の一方または両方内に前記フィラグリンポリペプチドをコードする前記1つ以上を含む、実施形態72~82のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0295】
実施形態84:前記組換え単純ヘルペスウイルスゲノムが、ICP22ウイルス遺伝子座内に前記フィラグリンポリペプチドをコードする前記1つ以上のポリヌクレオチドを含む、実施形態72~83のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0296】
実施形態85:前記組換え単純ヘルペスウイルスゲノムが、UL41ウイルス遺伝子座内に前記フィラグリンポリペプチドをコードする前記1つ以上のポリヌクレオチドを含む、実施形態72~84のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0297】
実施形態86:標的細胞に導入された場合に、対応する野生型ヘルペスウイルスゲノムと比較して減少した細胞毒性を有する、実施形態64~85のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0298】
実施形態87:標的細胞がヒト細胞である、実施形態86に記載の組換えヘルペスウイルスゲノム。
【0299】
実施形態88:前記標的細胞が表皮細胞及び/または真皮細胞である、実施形態86または87に記載の組換えヘルペスウイルスゲノム。
【0300】
実施形態89:前記標的細胞がケラチノサイトまたは線維芽細胞である、実施形態86~88のいずれか1つに記載の組換えヘルペスウイルスゲノム。
【0301】
実施形態90:実施形態64~89のいずれか1つに記載の組換えヘルペスウイルスゲノムを含む、ヘルペスウイルス。
【0302】
実施形態91:複製可能である、実施形態90に記載のヘルペスウイルス。
【0303】
実施形態92:複製欠損である、実施形態90に記載のヘルペスウイルス。
【0304】
実施形態93:対応する野生型ヘルペスウイルスと比較して減少した細胞毒性を有する、実施形態90~92のいずれか1つに記載のヘルペスウイルス。
【0305】
実施形態94:単純ヘルペスウイルス、水痘帯状疱疹ウイルス、ヒトサイトメガロウイルス、ヘルペスウイルス6A、ヘルペスウイルス6B、ヘルペスウイルス7、及びカポジ肉腫関連ヘルペスウイルスからなる群から選択される、実施形態90~93のいずれか1つに記載のヘルペスウイルス。
【0306】
実施形態95:単純ヘルペスウイルスである、実施形態90~94のいずれか1つに記載のヘルペスウイルス。
【0307】
実施形態96:前記単純ヘルペスウイルスが、単純ヘルペスウイルス1型(HSV-1)、単純ヘルペスウイルス2型(HSV-2)、またはそれらの任意の派生物である、実施形態94または95に記載のヘルペスウイルス。
【0308】
実施形態97:実施形態64~89のいずれか1つに記載の組換えヘルペスウイルスゲノムまたは実施形態90~96のいずれか1つに記載のヘルペスウイルスと、薬学的に許容される賦形剤とを含む、薬学的組成物。
【0309】
実施形態98:局所、経皮、皮下、皮内、経口、舌下、口腔、直腸、膣内、吸入、静脈内、動脈内、筋肉内、心臓内、骨内、腹腔内、経粘膜、硝子体内、網膜下、関節内、関節周囲、局部、または皮膚上投与に好適である、実施形態97に記載の薬学的組成物。
【0310】
実施形態99:局所、経皮、皮下、皮内、または経粘膜投与に好適である、実施形態97または98に記載の薬学的組成物。
【0311】
実施形態100:局所投与に好適である、実施形態97~99のいずれか1つに記載の薬学的組成物。
【0312】
実施形態101:ヒドロキシプロピルメチルセルロースゲルを含む、実施形態97~100のいずれか1つに記載の薬学的組成物。
【0313】
実施形態102:リン酸緩衝液を含む、実施形態97~101のいずれか1つに記載の薬学的組成物。
【0314】
実施形態103:グリセロールを含む、実施形態97~102のいずれか1つに記載の薬学的組成物。
【0315】
実施形態104:脂質担体を含む、実施形態97~103のいずれか1つに記載の薬学的組成物。
【0316】
実施形態105:ナノ粒子担体を含む、実施形態97~104のいずれか1つに記載の薬学的組成物。
【0317】
実施形態106:対象の1つ以上の細胞におけるフィラグリンポリペプチドのレベルを強化する、増加させる、増強する、及び/または補充する方法であって、前記対象に、実施形態90~96のいずれか1つに記載のヘルペスウイルスまたは実施形態97~105のいずれか1つに記載の薬学的組成物の有効量を投与することを含む、前記方法。
【0318】
実施形態107:その必要がある対象の皮膚の角質層の生成を強化する及び/または角質層を安定化する方法であって、前記対象に、実施形態90~96のいずれか1つに記載のヘルペスウイルスまたは実施形態97~105のいずれか1つに記載の薬学的組成物の有効量を投与することを含む、前記方法。
【0319】
実施形態108:その必要がある対象において皮膚バリア機能欠損を軽減または治療する方法であって、前記対象に、実施形態90~96のいずれか1つに記載のヘルペスウイルスまたは実施形態97~105のいずれか1つに記載の薬学的組成物の有効量を投与することを含む、前記方法。
【0320】
実施形態109:前記皮膚バリア欠損が経上皮水分喪失(TEWL)である、実施形態108に記載の方法。
【0321】
実施形態110:その必要がある対象においてアレルゲンの経皮移入を減少させるまたは阻害する方法であって、前記対象に、実施形態90~96のいずれか1つに記載のヘルペスウイルスまたは実施形態97~105のいずれか1つに記載の薬学的組成物の有効量を投与することを含む、前記方法。
【0322】
実施形態111:その必要がある対象において皮膚疾患の1つ以上の兆候または症状の予防的、姑息的、または治療的緩和を提供する方法であって、前記対象に、実施形態90~96のいずれか1つに記載のヘルペスウイルスまたは実施形態97~105のいずれか1つに記載の薬学的組成物の有効量を投与することを含む、前記方法。
【0323】
実施形態112:前記皮膚疾患が、アトピー性皮膚炎、尋常性魚鱗癬、及び皮膚剥離症候群からなる群から選択される、実施形態111に記載の方法。
【0324】
実施形態113:その必要がある対象においてアトピー性皮膚炎の1つ以上の兆候または症状の予防的、姑息的、または治療的緩和を提供する方法であって、前記対象に、実施形態90~96のいずれか1つに記載のヘルペスウイルスまたは実施形態97~105のいずれか1つに記載の薬学的組成物の有効量を投与することを含む、前記方法。
【0325】
実施形態114:アトピー性皮膚炎の前記1つ以上の兆候または症状が、皮膚の掻痒、乾燥皮膚、皮膚における赤色~茶色がかった灰色の斑点、皮膚における小さい隆起した突出物、肥厚した皮膚、ひび割れした皮膚、鱗状の皮膚、腫れた皮膚、湿潤性ただれ(weeping sore)、皮膚感染症、眼瞼皮膚炎、白内障、及びそれらの任意の組み合わせからなる群から選択される、実施形態113に記載の方法。
【0326】
実施形態115:その必要がある対象において尋常性魚鱗癬の1つ以上の兆候または症状の予防的、姑息的、または治療的緩和を提供する方法であって、前記対象に、実施形態90~96のいずれか1つに記載のヘルペスウイルスまたは実施形態97~105のいずれか1つに記載の薬学的組成物の有効量を投与することを含む、前記方法。
【0327】
実施形態116:尋常性魚鱗癬の前記1つ以上の兆候または症状が、頭皮の剥離、皮膚の掻痒、皮膚の多角形またはタイル状鱗屑、茶色、灰色、または白色の鱗屑、重度に乾燥した皮膚、皮膚の有痛性ひび割れ、肥厚した皮膚、及びそれらの任意の組み合わせからなる群から選択される、実施形態115に記載の方法。
【0328】
実施形態117:前記対象がヒトである、実施形態106~116のいずれか1つに記載の方法。
【0329】
実施形態118:前記対象のゲノムが、FLG遺伝子及び/またはFLG2遺伝子に機能喪失変異を含む、実施形態106~117のいずれか1つに記載の方法。
【0330】
実施形態119:前記ヘルペスウイルスまたは前記薬学的組成物が、前記対象に、局所、経皮、皮下、皮膚上、皮内、経口、舌下、口腔、直腸、膣内、静脈内、動脈内、筋肉内、骨内、心臓内、腹腔内、経粘膜、硝子体内、網膜下、関節内、関節周囲、局部投与、または吸入により投与される、実施形態106~118のいずれか1つに記載の方法。
【0331】
実施形態120:前記ヘルペスウイルスまたは前記薬学的組成物が、前記対象に、局所、経皮、皮下、皮内、または経粘膜投与される、実施形態106~119のいずれか1つに記載の方法。
【0332】
実施形態121:前記ヘルペスウイルスまたは前記薬学的組成物が、前記対象に局所投与される、実施形態106~120のいずれか1つに記載の方法。
【0333】
実施形態122:前記対象の皮膚が、投与前に擦過される、実施形態106~121のいずれか1つに記載の方法。
【0334】
本明細書は、当業者が本開示を実施することを可能にするのに十分であると考えられる。本明細書に示され、かつ記載される修正に加えて、本開示の様々な修正は、前述の記述から当業者に明らかになり、添付の特許請求の範囲内に入るであろう。
【実施例0335】
本開示は、以下の実施例を参照することにより、より完全に理解されるであろう。しかしながら、それが本開示の範囲を限定するものと解釈されるべきではない。本明細書に記載の実施例及び実施形態が例証のみを目的としており、それに照らして様々な修正または変更が当業者に提案され、本出願の趣旨及び範囲ならびに添付の特許請求の範囲内に含まれることを理解されたい。
【0336】
実施例1:ヒトラミニンをコードする修飾された単純ヘルペスウイルスベクターの生成
以下の実施例は、ヒトラミニンタンパク質を発現するように修飾された組換え単純ヘルペスウイルス1型の構築を説明する。
【0337】
野生型単純ヘルペスウイルスゲノム(図1A)を、最初にウイルスICP4遺伝子の両方のコピー及びICP22遺伝子の単一のコピーのコード配列を欠失させることによって修飾した(4/22)。4/22ウイルスゲノムを、ICP4遺伝子座の各々にmCherry発現カセットも含むように操作した。その後、ウイルスゲノムを、野生型またはコドン最適化ヒトLAMB3またはLAMC2をコードするようにさらに修飾した。簡潔には、ICP4の上流(US)領域及び下流(DS)領域に隣接する(hCMVプロモーターの制御下の)野生型またはコドン最適化ヒトLAMB3またはLAMC2を含むプラスミドを、ヘルペスウイルスICP4遺伝子を発現するように修飾されたVero細胞にトランスフェクトした。その後、これらのトランスフェクト細胞を上述の修飾されたmCherry発現ウイルスに感染させた。ラミニン遺伝子に隣接するUS及びDS ICP4領域は、mCherry遺伝子座の各々の二重交差及び置換を可能にした。その後、mCherry蛍光の不在についての目視スクリーニングを使用して、組換えウイルスを含む細胞を特定した。これらの弱毒化した組換えウイルス構築物の4つのバリアント:1)各ICP4遺伝子座に組み込まれた異種プロモーターの制御下の野生型ヒトLAMB3(配列番号3)を含む発現カセットを含む組換えΔICP4/ΔICP22修飾HSV-1ゲノム(図1B)、2)各ICP4遺伝子座に組み込まれた異種プロモーターの制御下のコドン最適化ヒトLAMB3(配列番号4)を含む発現カセットを含む組換えΔICP4/ΔICP22修飾HSV-1ゲノム(図1C)、3)各ICP4遺伝子座に組み込まれた異種プロモーターの制御下の野生型ヒトLAMC2(配列番号5)を含む発現カセットを含む組換えΔICP4/ΔICP22修飾HSV-1ゲノム (図1D)、及び4)各ICP4遺伝子座に組み込まれた異種プロモーターの制御下のコドン最適化ヒトLAMC2(配列番号6)を含む発現カセットを含む組換えΔICP4/ΔICP22修飾HSV-1ゲノム(図1E)を、この方法を用いて作製した。修飾されたウイルスの各々の複数の分離株を、さらなる検証のために収集した。
【0338】
これらの分離株がコードされた野生型ヒトLamB3タンパク質を発現することができるかを試験するために、ICP4補完Vero細胞を6ウェルプレートにプレーティングし、感染が完了するまで野生型LamB3コードウイルスの12個の非力価化ウイルス分離株に感染させた。感染後、RNAを収集し、cDNAを生成し、各分離株由来の野生型LAMB3の発現をqRT-PCRにより決定した(図2A)。12個全ての分離株が、形質導入Vero細胞において様々なレベルで野生型ヒトLAMB3を発現することができた。これらの分離株のうちの10個のヒトLamB3を発現する能力も、ウエスタンブロットにより試験した。ICP4補完Vero細胞を6ウェルプレートにプレーティングし、感染が完了するまで野生型LamB3発現ウイルスの10個の非力価化ウイルス分離株に感染させた。Vero細胞のウェルを陽性対照としてLamB3発現プラスミドでトランスフェクトした。感染後、細胞を穏やかに掻爬して収集し、遠心分離して細胞ペレットを収集し、培養培地を吸引し、細胞ペレットをPBSで1回洗浄した。洗浄後、各細胞ペレットを、プロテアーゼインヒビターを含有する200μLのRIPA緩衝液中に再懸濁し、再懸濁液を5分毎に穏やかに撹拌しながら4℃で20分間インキュベートした。インキュベートした後、試料を17,000×gで5分間遠心分離し、上清を除去し、5%2-メルカプトメタノールを含有する4倍LDS還元試料緩衝液を各精製上清に添加した。その後、試料を10分間沸騰させた後、4~20%トリス-グリシンポリアクリルアミドゲルにロードした。電気泳動後、タンパク質をPVDF膜に移し、膜を5%乳/TBS中で30分間ブロックした。一次ウサギ抗LamB3抗体(Abcam、カタログ番号ab128864)を、5%乳/TBS中1:1000希釈でPVDF膜に添加し、室温で一晩(約16時間)インキュベートした。その後、ブロットをTBSで3回(各5分間)洗浄し、次いで、5%乳/TBS中APコンジュゲートヤギ抗ウサギIgG抗体(Sigma、カタログ番号A3687)で、室温で1時間染色した。その後、膜をTBSで3回(各5分間)洗浄し、BCIP/NBTを添加し、ブロットを室温で約10分間展開した。qRT-PCRデータと一致して、10個全てのウイルス分離株が、コードされた野生型ヒトLamB3タンパク質を様々なレベルで発現することができた(図2B)。
【0339】
ヒトLamB3のコドン最適化バリアントをコードするウイルスも、ウエスタンブロット分析により、Vero細胞においてそれらのカーゴを発現するそれらの能力について試験した。簡潔には、上述のように、コドン最適化(CO)LamB3コードウイルスの10個の非力価化ウイルス分離株を使用してVero細胞を感染させ、細胞ペレットを収集し、各ペレットを、プロテアーゼインヒビターを含有するRIPA緩衝液中に再懸濁し、これらの細胞溶解物を使用してウエスタンブロットを行った。10個全てのウイルス分離株が、Vero細胞においてコードされたコドン最適化ヒトLamB3を発現することができた(図3)。
【0340】
次に、野生型LAMB3またはコドン最適化LAMB3のいずれかをコードする4つのウイルス分離株を、初代ヒト細胞を形質導入し、かつそれらのカーゴを発現するそれらの能力について試験した。不死化初代正常ケラチノサイトを感染多重度(MOI)1.0で48時間感染させた。非感染細胞を陰性対照として使用した。その後、感染ヒトケラチノサイトにおけるLamB3の発現をウエスタンブロットにより試験した。一次ウサギ抗LamB3抗体(Abcam、カタログ番号ab128864)を使用して、ウエスタンブロットを上述のように行った。Vero細胞を使用して生成されたデータと一致して、野生型LamB3及びコドン最適化LamB3のいずれかを発現するウイルス分離株が、初代ヒトケラチノサイトを効果的に形質導入し、かつそれらのコードされた構築物を適切なレベルで発現することが確認された(図4)。
【0341】
LamC2含有分離株が、コードされた野生型またはコドン最適化ヒトLAMC2を発現することができるかを試験するために、ICP4補完Vero細胞を6ウェルプレートにプレーティングし、感染が完了するまでいくつかの非力価化野生型またはコドン最適化LAMC2発現ウイルス分離株に感染させた。感染後、RNAを収集し、cDNAを生成し、各分離株由来の野生型LAMC2(図5A)またはコドン最適化LAMC2(図5B)の発現をqRT-PCRにより決定した。12個の分離株のうちの8つが、形質導入Vero細胞において野生型ヒトLAMC2を様々なレベルで発現することができた一方で、7つの分離株のうちの3つは、コドン最適化ヒトLAMC2を発現することができた。
【0342】
次に、ヒトLamC2タンパク質を発現するある特定の野生型分離株及びコドン最適化分離株の能力をウエスタンブロットにより試験した。ICP4補完Vero細胞を6ウェルプレートにプレーティングし、感染が完了するまで非力価化ウイルス分離株に感染させた。Vero細胞のウェルを陰性対照として非感染のままにした。感染後、細胞を穏やかに掻爬して収集し、遠心分離して細胞ペレットを収集し、培養培地を吸引し、細胞ペレットをPBSで1回洗浄した。洗浄後、各細胞ペレットを、プロテアーゼインヒビターを含有する200μLのRIPA緩衝液中に再懸濁し、再懸濁液を5分毎に穏やかに撹拌しながら4℃で20分間インキュベートした。インキュベートした後、試料を17,000×gで5分間遠心分離し、上清を除去し、5%2-メルカプトメタノールを含有する4倍LDS還元試料緩衝液を各精製上清に添加した。その後、試料を10分間沸騰させた後、4~20%トリス-グリシンポリアクリルアミドゲルにロードした。電気泳動後、タンパク質をPVDF膜に移し、膜を5%乳/TBS中で30分間ブロックした。その後、一次ウサギ抗LamC2抗体(Abcam、カタログ番号ab96327)を、5%乳/TBS中1:1000希釈でPVDF膜に添加し、室温で一晩(約16時間)インキュベートした。その後、ブロットをTBSで3回(各5分間)洗浄し、次いで、5%乳/TBS中APコンジュゲートヤギ抗ウサギIgG抗体(Sigma、カタログ番号A3687)で、室温で1時間染色した。その後、膜をTBSで3回(各5分間)洗浄し、BCIP/NBTを添加し、ブロットを室温で約10分間展開した。qRT-PCRデータと一致して、9つ全ての試験したウイルス分離株も、コードされたヒトLamC2を発現することができた(図5C)。
【0343】
コドン最適化LamC2発現ウイルス分離株「LGA」を、ヒト細胞におけるさらなる試験のために選択した。不死化初代正常ケラチノサイトを、LGA分離株に感染多重度(MOI)0.3、1.0、または3.0で48時間感染させた。非感染細胞(対照)及びmCherry発現ウイルス感染細胞を陰性対照として使用した。感染の48時間後にDNA及びRNAを不死化ケラチノサイトから抽出し、qPCR/qRT-PCRを行った(図6A~B)。DNA50ng当たり検出されたウイルスゲノムコピーによって評価されるように、不死化ケラチノサイトにおけるLGA分離株において良好な用量応答が観察された(図6A)。興味深いことに、MOIを0.3から1.0に増加させた場合、用量応答が転写物レベルで観察された一方で、MOIを1.0から3.0に増加させた場合、転写物レベルのさらなる増加は観察されなかった(図6B)。感染ヒトケラチノサイトにおけるLamC2タンパク質の発現も、ウエスタンブロットにより試験した。上述のようにウエスタンブロットを行った(一次ウサギ抗LamC2抗体(Abcam、カタログ番号ab96327)を使用した)。転写物分析と一致して、MOIを0.3から1.0に増加させた場合、用量応答がタンパク質レベルで観察されたが、1.0から3.0に増加させた場合には観察されなかった(図6C)。
【0344】
まとめると、このデータは、複数のヒトラミニンタンパク質(野生型及びコドン最適化核酸配列由来)が組換え複製欠損HSV-1ウイルスからの発現に成功することができたことを示唆する。
【0345】
実施例2:ヒトLAMC2をコードする修飾された単純ヘルペスウイルスベクターのインビボ分析
ラミニンの機能を研究するためのノックアウト動物モデルの使用は、マウスにおけるラミニンサブユニットの標的欠失がLAMB3またはLAMC2のいずれかの場合に新生児死亡を含む重度の発育障害をもたらすという事実によって複雑になる。したがって、内因性マウスLAMC2及びドキシサイクリン誘導性(tet-on)野生型ヒトLAMC2発現構築物(LAMC2-/--hLAMC2tet-onマウス)のホモ接合性欠失を有するトランスジェニック免疫担当マウスモデルを用いてインビボ研究を行った。これらのマウスを、ヒトLAMC2がテトラサイクリントランス活性化因子(hLAMC2tet-on)の制御下にあったため、ドキシサイクリンの存在下でのこのヒト構築物の発現により内因性LAMC2のノックアウトをレスキューすることによって、LAMC2ノックアウト動物において観察される新生児死亡を防止するように生成した。これらの動物の食餌からドキシサイクリンを除去することにより、(体重の減少及び呼吸困難によって決定される)機能的ラミニン-332の喪失に関連する症状の同時増加を伴うヒトLamC2タンパク質レベルの緩徐な減少が引き起こされる。これらのラミニン欠損(doxy-)動物を、ヒトラミニン発現を回復させるウイルス分離株「LGA」の能力について試験した。
【0346】
具体的には、インビボヒトLAMC2発現を、LGAの皮内注射後に、qPCR、qRT-PCR、及び免疫蛍光により評価した。被験物質での処理前にラミニン-332欠乏症を誘発するために、ドキシサイクリンをLGA投与前にマウスから15日間中止した(doxy-)。1×10プラーク形成単位(PFU)の製剤化LGAを、2匹のマウスの背側皮膚及び足蹠に皮内注射した。等価体積のビヒクルのみを1匹のマウスの背側皮膚に皮内投与し、陰性対照としての役割を果たした。本研究で処理したこれらの2匹の動物の注射部位の概略図を図7Aに提供する。
【0347】
投与の72時間後に、全厚8mmの生検を各処理部位から採取し、半分に分けた。各切片の半分を液体窒素中で急速凍結し、その後、qPCR分析及びqRT-PCR分析のために処理して、背側皮膚におけるLAMC2 DNAコピー数及び転写物レベルを定量化した。外因性LGAコードヒトLAMC2 DNA(図7B)及びRNA(図7C)を各LGA処理組織試料中で検出し、これは、操作したベクターがインビボでLAMC2欠損組織に感染したときにその導入遺伝子を発現することができたことを示す。
【0348】
各生検の残りの半分を、免疫蛍光(IF)のためにOCTに包埋した。凍結切片におけるLamC2発現を、抗ヒトLamC2抗体(Abcam、カタログ番号ab96327)を使用した免疫蛍光分析により決定した。ドキシサイクリンに連続的に曝露されたマウス(doxy+)から生検された背側皮膚の領域を試験して、ドキシサイクリン除去前にトランスジェニックマウスで発現されたヒトLamC2タンパク質のベースラインレベルも決定した。さらに、LGAから発現されたヒトLamC2が、天然ラミニン-332が見られる皮膚の領域に正しく局在したことを確認するために、背側皮膚試料をマウスラミニン-332で対比染色(pKal)した。LGAの皮内投与により、マウス皮膚の形質導入の成功がもたらされ、コードされたヒト導入遺伝子を表皮の正しい層にロバストに発現させた(図7D)。生検の組織学的評価は、処理部位で炎症性浸潤を示さず、この療法の安全性を実証した。
【0349】
まとめると、この実施例に示されるデータは、(1)HSVベースの遺伝子療法ベクターが関連性のある免疫担当動物モデルにおいてインビボでヒトラミニン-332サブユニットを首尾よく送達することができ、かつ(2)組換えヒトラミニン-332サブユニットが処理動物の表皮の適切な領域に局在したことを示す。理論に拘束されることを望むことなく、これらの前臨床研究が、ラミニン欠乏症(例えば、JEB患者におけるLAMB3欠乏症)の直接分子補正のための便利かつ安全で有効な遺伝子療法ベクターとしての操作されたHSVの使用を十分に支持すると考えられる。
【0350】
実施例3:ヒトフィラグリンをコードする修飾された単純ヘルペスウイルスベクターの生成
フィラグリンモノマーは、ケラチノサイトによって産生されるプロフィラグリン由来のタンパク質であり、ケラトヒアリン顆粒の主成分である。プロフィラグリンのフィラグリンモノマーへの変換は、セリンプロテアーゼによる脱リン酸化及びタンパク質分解により生じ、複数(典型的には10~12個)の活性フィラグリンモノマーを放出する。皮膚におけるプロフィラグリン/フィラグリン及び/またはプロフィラグリン-2/フィラグリン-2の発現の減少、ならびにフィラグリン(FLG)またはフィラグリン-2(FLG2)遺伝子における機能喪失変異等の皮膚バリアタンパク質の変化は、広範囲にわたるしばしば破壊的な効果を有する。FLG変異を有する患者において観察される皮膚透過性の増加により、アレルゲンへの経皮曝露が強化される。さらに、FLG変異は、増加したIgE血清レベル、減少した角質層水和、増幅された経表皮水分喪失(TEWL)、より高い皮膚pH、及び増加した皮膚炎症に関連する。実際には、機能喪失FLGまたはFLG2変異を有する患者は、皮膚疾患(例えば、アトピー性皮膚炎、尋常性魚鱗癬、及び皮膚剥離症候群)及びアレルギー(例えば、鼻炎、ある特定の食物アレルギー、及びアレルギー性喘息)を発症するリスクがより高い。したがって、これらの感受性患者において観察されるフィラグリンまたはフィラグリン-2欠乏症の分子補正を目標とする新規の治療選択肢が明らかに必要とされている。
【0351】
いくつかの実施形態では、これら及び他の必要性を満たすために、その必要がある対象においてフィラグリン欠乏症を治療するのに有用なウイルス(例えば、ヘルペスウイルス)、薬学的組成物及び製剤、薬剤、及び/または方法における使用のための1つ以上のフィラグリンポリペプチドをコードする組換え核酸(例えば、組換えヘルペスウイルスゲノム)が本明細書に提供される。理論に拘束されることを望むことなく、本明細書に記載の組換え核酸、ウイルス、及び/または組成物のうちの1つ以上を投与することによって、その必要がある個体の1つ以上の細胞におけるフィラグリンレベルを増加させること、増強すること、及び/または補充することが、1)角質層を安定化する、及び/またはその産生を強化する、2)TEWLを減少させる、3)アレルゲンの経皮移入を阻害する、4)皮膚バリア欠損を軽減または治療する、及び/または5)皮膚疾患(例えば、アトピー性皮膚炎、尋常性魚鱗癬、皮膚剥離症候群等)の1つ以上の兆候または症状の予防的、姑息的、または治療的緩和を提供すると考えられる。
【0352】
標的哺乳類細胞(ヒトケラチノサイトまたは線維芽細胞等)においてフィラグリンポリペプチドを発現することができる修飾された単純ヘルペスウイルスベクターを作製するために、単純ヘルペスウイルスゲノム(図8A)を、最初に1つ以上の単純ヘルペスウイルス遺伝子を不活性化するように修飾する。かかる修飾は、哺乳類細胞におけるゲノムの毒性を減少させ得る。次に、これらの修飾/弱毒化された組換えウイルス構築物のバリアントを、それらが所望のフィラグリンポリペプチドをコードする1つ以上のポリヌクレオチドを有するように生成する。これらのバリアントには、1)各ICP4遺伝子座に組み込まれた異種プロモーターの制御下のヒトフィラグリンポリペプチド(配列番号39)のコード配列(配列番号37)を含む発現カセットを含む組換えΔICP4修飾HSV-1ゲノム(図8B)、2)各ICP4遺伝子座に組み込まれた異種プロモーターの制御下のヒトフィラグリンポリペプチド(配列番号39)のコード配列(配列番号37)を含む発現カセットを含む組換えΔICP4/ΔICP22修飾HSV-1ゲノム(図8C)、3)ICP22遺伝子座に組み込まれた異種プロモーターの制御下のヒトフィラグリンポリペプチド(配列番号39)のコード配列(配列番号37)を含む発現カセットを含む組換えΔICP4/ΔICP22修飾HSV-1ゲノム(図8D)、4)UL41遺伝子座に組み込まれた異種プロモーターの制御下のヒトフィラグリンポリペプチド(配列番号39)のコード配列(配列番号37)を含む発現カセットを含む組換えΔICP4/ΔUL41修飾HSV-1ゲノム(図8E)、及び5)UL41遺伝子座に組み込まれた異種プロモーターの制御下のヒトフィラグリンポリペプチド(配列番号39)のコード配列(配列番号37)を含む発現カセットを含む組換えΔICP4/ΔICP22/ΔUL41修飾HSV-1ゲノム(図8F)が含まれる。
【0353】
これらの修飾された単純ヘルペスウイルスゲノムベクターを、1つ以上のヘルペスウイルス遺伝子を発現するように修飾された操作されたVero細胞にトランスフェクトする。これらの操作されたVero細胞は、修飾されたゲノムを内部にパッケージングした複製欠損単純ヘルペスウイルスを細胞培養物の上清に分泌する。その後、上清を収集し、濃縮し、5μmフィルターに通して滅菌濾過する。
【0354】
配列情報
SEQUENCE LISTING
<110> Krystal Biotech, Inc.
<120> COMPOSITIONS AND METHODS FOR THE
TREATMENT OF SKIN DISEASES
<150> US 62/737,009
<151> 2018-09-26
<150> US 62/744,531
<151> 2018-10-11
<160> 50
<170> FastSEQ for Windows Version 4.0

<210> 1
<211> 5175
<212> DNA
<213> Homo sapiens
<400> 1
atgcctccag cagtgaggcg gtcagcctgc agcatgggat ggctgtggat ctttggggca 60
gccctggggc agtgtctggg ctacagttca cagcagcaaa gggtgccatt tcttcagcct 120
cccggtcaaa gtcaactgca agcgagttat gtggagttta gacccagcca gggttgtagc 180
cctggatact atcgggatca taaaggcttg tataccggac ggtgtgttcc ctgcaattgc 240
aacggacatt caaatcaatg ccaggatggc tcaggcatat gtgttaactg tcagcacaac 300
accgcgggag agcactgtga acgctgccag gagggctact atggcaacgc cgtccacgga 360
tcctgcaggg cctgcccatg tcctcacact aacagctttg ccactggctg tgtggtgaat 420
gggggagacg tgcggtgctc ctgcaaagct gggtacacag gaacacagtg tgaaaggtgt 480
gcaccgggat atttcgggaa tccccagaaa ttcggaggta gctgccaacc atgcagttgt 540
aacagcaatg gccagctggg cagctgtcat cccctgactg gagactgcat aaaccaagaa 600
cccaaagata gcagccctgc agaagaatgt gatgattgcg acagctgtgt gatgaccctc 660
ctgaacgacc tggccaccat gggcgagcag ctccgcctgg tcaagtctca gctgcagggc 720
ctgagtgcca gcgcagggct tctggagcag atgaggcaca tggagaccca ggccaaggac 780
ctgaggaatc agttgctcaa ctaccgttct gccatttcaa atcatggatc aaaaatagaa 840
ggcctggaaa gagaactgac tgatttgaat caagaatttg agactttgca agaaaaggct 900
caagtaaatt ccagaaaagc acaaacatta aacaacaatg ttaatcgggc aacacaaagc 960
gcaaaagaac tggatgtgaa gattaaaaat gtcatccgga atgtgcacat tcttttaaag 1020
cagatctctg ggacagatgg agagggaaac aacgtgcctt caggtgactt ttccagagag 1080
tgggctgaag cccagcgcat gatgagggaa ctgcggaaca ggaactttgg aaagcacctc 1140
agagaagcag aagctgataa aagggagtcg cagctcttgc tgaaccggat aaggacctgg 1200
cagaaaaccc accaggggga gaacaatggg cttgctaaca gtatccggga ttctttaaat 1260
gaatacgaag ccaaactcag tgaccttcgt gctcggctgc aggaggcagc tgcccaagcc 1320
aagcaggcaa atggcttgaa ccaagaaaac gagagagctt tgggagccat tcagagacaa 1380
gtgaaagaaa taaattccct gcagagtgat ttcaccaagt atctaaccac tgcagactca 1440
tctttgttgc aaaccaacat tgcgctgcag ctgatggaga aaagccagaa ggaatatgaa 1500
aaattagctg ccagtttaaa tgaagcaaga caagaactaa gtgacaaagt aagagaactt 1560
tccagatctg ctggcaaaac atcccttgtg gaggaggcag aaaagcacgc gcggtcctta 1620
caagagctgg caaagcagct ggaagagatc aagagaaacg ccagcgggga tgagctggtg 1680
cgctgtgctg tggatgccgc caccgcctac gagaacatcc tcaatgccat caaagcggcc 1740
gaggacgcag ccaacagggc tgccagtgca tctgaatctg ccctccagac agtgataaag 1800
gaagatctgc caagaaaagc taaaaccctg agttccaaca gtgataaact gttaaatgaa 1860
gccaagatga cacaaaagaa gctaaagcaa gaagtcagtc cagctctcaa caacctacag 1920
caaaccctga atattgtgac agttcagaaa gaagtgatag acaccaatct cacaactctc 1980
cgagatggtc ttcatgggat acagagaggt gatattgatg ctatgatcag tagtgcaaag 2040
agcatggtca gaaaggccaa cgacatcaca gatgaggttc tggatgggct caaccccatc 2100
cagacagatg tggaaagaat taaggacacc tatgggagga cacagaacga agacttcaaa 2160
aaggctctga ctgatgcaga taactcggtg aataagttaa ccaacaaact acctgatctt 2220
tggcgcaaga ttgaaagtat caaccaacag ctgttgccct tgggaaacat ctctgacaac 2280
atggacagaa tacgagaact aattcagcag gccagagatg ctgccagtaa ggttgctgtc 2340
cccatgaggt tcaatggtaa atctggagtc gaagtccgac tgccaaatga cctggaagat 2400
ttgaaaggat atacatctct gtccttgttt ctccaaaggc ccaactcaag agaaaatggg 2460
ggtactgaga atatgtttgt gatgtacctt ggaaataaag atgcctcccg ggactacatc 2520
ggcatggcag ttgtggatgg ccagctcacc tgtgtctaca acctggggga ccgtgaggct 2580
gaactccaag tggaccagat cttgaccaag agtgagacta aggaggcagt tatggatcgg 2640
gtgaaatttc agagaattta tcagtttgca aggcttaatt acaccaaagg agccacatcc 2700
agtaaaccag aaacacccgg agtctatgac atggatggta gaaatagcaa tacactcctt 2760
aatttggatc ctgaaaatgt tgtattttat gttggaggtt acccacctga ttttaaactt 2820
cccagtcgac taagtttccc tccatacaaa ggttgtattg aattagatga cctcaatgaa 2880
aatgttctga gcttgtacaa cttcaaaaaa acattcaatc tcaacacaac tgaagtggag 2940
ccttgtagaa ggaggaagga agagtcagac aaaaattatt ttgaaggtac gggctatgct 3000
cgagttccaa ctcaaccaca tgctcccatc ccaacctttg gacagacaat tcagaccacc 3060
gtggatagag gcttgctgtt ctttgcagaa aacggggatc gcttcatatc tctaaatata 3120
gaagatggca agctcatggt gagatacaaa ctgaattcag agctaccaaa agagagagga 3180
gttggagacg ccataaacaa cggcagagac cattcgattc agatcaaaat tggaaaactc 3240
caaaagcgta tgtggataaa tgtggacgtt caaaacacta taattgatgg tgaagtattt 3300
gatttcagca catattatct gggaggaatt ccaattgcaa tcagggaaag atttaacatt 3360
tctacgcctg ctttccgagg ctgcatgaaa aatttgaaga aaaccagtgg tgtcgttaga 3420
ttgaatgata ctgtgggagt aaccaaaaag tgctcggaag actggaagct tgtgcgatct 3480
gcctcattct ccagaggagg acaattgagt ttcactgatt tgggcttacc acctactgac 3540
cacctccagg cctcatttgg atttcagacc tttcaaccca gtggcatatt attagatcat 3600
cagacatgga caaggaacct gcaggtcact ctggaagatg gttacattga attgagcacc 3660
agcgatagcg gcggcccaat ttttaaatct ccacagacgt atatggatgg tttactgcat 3720
tatgtatctg taataagcga caactctgga ctacggcttc tcatcgatga ccagcttctg 3780
agaaatagca aaaggctaaa acacatttca agttcccggc agtctctgcg tctgggcggg 3840
agcaattttg agggttgtat tagcaatgtt tttgtccaga ggttatcact gagtcctgaa 3900
gtcctagatt tgaccagtaa ctctctcaag agagatgtgt ccctgggagg ctgcagttta 3960
aacaaaccac cttttctaat gttgcttaaa ggttctacca ggtttaacaa gaccaagact 4020
tttcgtatca accagctgtt gcaggacaca ccagtggcct ccccaaggag cgtgaaggtg 4080
tggcaagatg cttgctcacc acttcccaag acccaggcca atcatggagc cctccagttt 4140
ggggacattc ccaccagcca cttgctattc aagcttcctc aggagctgct gaaacccagg 4200
tcacagtttg ctgtggacat gcagacaaca tcctccagag gactggtgtt tcacacgggc 4260
actaagaact cctttatggc tctttatctt tcaaaaggac gtctggtctt tgcactgggg 4320
acagatggga aaaaattgag gatcaaaagc aaggagaaat gcaatgatgg gaaatggcac 4380
acggtggtgt ttggccatga tggggaaaag gggcgcttgg ttgtggatgg actgagggcc 4440
cgggagggaa gtttgcctgg aaactccacc atcagcatca gagcgccagt ttacctggga 4500
tcacctccat cagggaaacc aaagagcctc cccacaaaca gctttgtggg atgcctgaag 4560
aactttcagc tggattcaaa acccttgtat accccttctt caagcttcgg ggtgtcttcc 4620
tgcttgggtg gtcctttgga gaaaggcatt tatttctctg aagaaggagg tcatgtcgtc 4680
ttggctcact ctgtattgtt ggggccagaa tttaagcttg ttttcagcat ccgcccaaga 4740
agtctcactg ggatcctaat acacatcgga agtcagcccg ggaagcactt atgtgtttac 4800
ctggaggcag gaaaggtcac ggcctctatg gacagtgggg caggtgggac ctcaacgtcg 4860
gtcacaccaa agcagtctct gtgtgatgga cagtggcact cggtggcagt caccataaaa 4920
caacacatcc tgcacctgga actggacaca gacagtagct acacagctgg acagatcccc 4980
ttcccacctg ccagcactca agagccacta caccttggag gtgctccagc caatttgacg 5040
acactgagga tccctgtgtg gaaatcattc tttggctgtc tgaggaatat tcatgtcaat 5100
cacatccctg tccctgtcac tgaagccttg gaagtccagg ggcctgtcag tctgaatggt 5160
tgtcctgacc agtaa 5175

<210> 2
<211> 5175
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 2
atgcctcctg ctgtgcggag aagcgcctgt tctatgggat ggctgtggat ctttggcgcc 60
gctctgggac agtgtctggg ctactcttct cagcagcagc gggtgccatt tctgcagcca 120
cctggacagt ctcagctgca ggccagctac gtggaattca gacctagcca gggctgtagc 180
cccggctact acagagatca caagggcctg tacaccggca gatgcgtgcc ctgcaactgt 240
aacggccaca gcaaccagtg tcaggacggc tctggcatct gcgtgaactg ccagcataat 300
actgccggcg agcactgcga gagatgccaa gagggctact acggcaatgc cgtgcatggc 360
agctgtcggg cttgtccttg tcctcacacc aacagctttg ccaccggctg cgttgtgaac 420
ggcggagatg ttcggtgttc ttgcaaggcc ggctacacag gcacacagtg cgaaagatgt 480
gcccctggct actttggcaa ccctcagaag tttggcggct cctgccagcc ttgctcctgc 540
aattctaatg gccagctggg ctcttgtcac cctctgaccg gcgactgcat caatcaagag 600
cctaaggaca gcagccctgc cgaggaatgc gacgattgcg atagctgcgt gatgaccctg 660
ctgaacgacc tggccacaat gggagaacag ctgcggctgg ttaagagcca gctccaggga 720
ctgtctgcct ctgctggact gctggaacag atgcggcaca tggaaaccca ggccaaggac 780
ctgagaaacc agctgctgaa ctacagaagc gccatctcca accacggcag caagatcgaa 840
ggcctggaaa gagagctgac cgacctgaat caagagttcg agacactgca agagaaggcc 900
caagtgaaca gccggaaggc ccagactctg aacaacaacg tgaaccgggc cacacagtcc 960
gccaaagaac tggacgtgaa gatcaagaac gtgatccgga acgtgcacat cctgctgaag 1020
cagatcagcg gcacagatgg cgagggcaac aatgtgccta gcggcgactt tagcagagag 1080
tgggccgaag ctcagcggat gatgagagag ctgcggaacc ggaacttcgg caagcacctg 1140
agagaagccg aggccgacaa gagagagagc caactgctgc tcaaccggat cagaacctgg 1200
cagaaaaccc accagggcga gaacaacggc ctggccaaca gcatcagaga cagcctgaat 1260
gagtacgagg ccaagctgag cgatctgcgg gccagacttc aagaagctgc cgctcaggcc 1320
aagcaggcca acggccttaa tcaagagaac gagagagccc tgggcgccat ccagagacaa 1380
gtgaaagaga tcaacagcct gcagagcgac ttcaccaagt acctgaccac cgccgatagc 1440
agcctgctgc agacaaatat cgccctgcag ctcatggaaa agagccagaa agagtacgaa 1500
aagctggccg ccagcctgaa cgaggccagg caagaactgt ctgacaaagt gcgcgagctg 1560
agcagatccg ccggcaagac atctctggtg gaagaggccg agaagcacgc cagatctctg 1620
caagagctgg ccaaacagct ggaagagatt aagcggaacg ccagcggcga cgaactcgtc 1680
agatgtgcag tggatgccgc caccgcctac gagaacatcc tgaatgccat caaggccgcc 1740
gaggacgccg ctaatagagc cgcttctgct tctgagtctg ccctgcagac cgtgatcaaa 1800
gaggacctgc ctagaaaggc caagacactg agcagcaaca gcgacaaact gctgaatgag 1860
gccaagatga cccagaagaa actgaagcaa gaggtgtccc ctgcactgaa caacctgcag 1920
cagaccctga acatcgtgac cgtgcagaaa gaagtgatcg acaccaacct gacaaccctg 1980
agagatggcc tgcacggaat ccagagaggc gacatcgacg ccatgatcag cagcgccaag 2040
agcatggttc gaaaagccaa cgacatcacc gacgaggtgc tggacggcct gaatcctatc 2100
cagaccgacg tggaacggat caaggacacc tacggcagaa cccagaacga ggatttcaag 2160
aaggccctga ccgacgccga caactccgtg aacaagctga ccaacaagct gcccgatctg 2220
tggcggaaga tcgagagcat caaccagcaa ctgctccctc tgggcaacat cagcgacaac 2280
atggacagaa tccgggaact gatccagcag gccagagatg ccgcctccaa agtggctgtg 2340
cccatgagat tcaacggcaa gagcggagtg gaagtgcggc tgcccaacga tctggaagat 2400
ctgaagggct ataccagcct gagcctgttc ctgcagaggc ccaacagcag agagaatggc 2460
ggcaccgaga atatgttcgt gatgtacctg ggaaacaagg acgccagccg ggactatatc 2520
ggaatggccg ttgtggacgg ccagctgacc tgcgtgtaca acctgggaga cagagaagct 2580
gaactgcagg tcgaccagat cctgaccaag agcgagacaa aagaggccgt gatggacaga 2640
gtgaagttcc agcggatcta ccagttcgcc cggctgaatt acaccaaggg cgccacaagc 2700
agcaagcccg aaacacctgg cgtgtacgac atggacggcc ggaactctaa cactctgctg 2760
aatctggacc ccgagaacgt ggtgttttac gtcggcggct accctcctga cttcaagctg 2820
cctagcagac tgagcttccc accttacaag ggctgcatcg agctggatga cctgaacgaa 2880
aacgtgctgt ccctgtacaa cttcaaaaag accttcaacc tgaacaccac cgaggtggaa 2940
ccctgcaggc gcagaaaaga ggaatccgac aagaactact tcgaaggcac cggctacgcc 3000
agagtgccta cacaacctca cgctcccatt cctaccttcg gccagaccat ccagacaacc 3060
gtggatagag gcctgctgtt cttcgccgag aacggcgaca gattcatctc cctgaatatc 3120
gaggatggca agctgatggt ccgatacaag ctgaatagcg agctgcccaa agaaagaggc 3180
gtgggcgacg ccatcaacaa cggcagggat cacagcatcc agatcaagat cggcaaactg 3240
cagaaacgga tgtggatcaa cgtggacgtg cagaacacca tcatcgacgg cgaggtgttc 3300
gacttcagca cctactatct cggcggaatc cctatcgcca tcagagagcg gttcaatatc 3360
agcacccctg ccttccgggg ctgcatgaag aacctgaaaa agaccagcgg cgtcgtgcgg 3420
ctgaatgata cagtgggcgt gaccaagaag tgcagcgagg actggaagct tgtgcggagc 3480
gccagttttt ctagaggcgg acagctgagc tttaccgacc tgggactgcc tcctaccgat 3540
catctgcagg caagcttcgg attccagacc ttccagccaa gcggaatcct gctggaccac 3600
cagacctgga ccagaaacct gcaagtgacc ctggaagatg gctacatcga actgagcacc 3660
agcgactctg gcggccctat ctttaagagc cctcagacct acatggatgg gctgctgcac 3720
tacgtgtccg tgatcagcga taacagcggc ctgagactgc tgatcgacga ccagctcctg 3780
cggaacagca agcggctgaa gcacatctcc agcagcagac agagtctgag actcggcggc 3840
agcaatttcg agggctgtat cagcaacgtg ttcgtgcagc gcctgagtct gtctccagaa 3900
gtgctggacc tgaccagcaa tagcctgaag agggatgtgt ctctcggcgg ctgctccctg 3960
aacaaacctc ctttcctgat gctgctgaag ggcagcaccc ggttcaacaa gaccaagacc 4020
tttcggatca atcagctgct ccaggacacc cctgtggcta gccctagaag cgtgaaagtg 4080
tggcaggacg cctgcagtcc cctgcctaaa acacaggcca atcacggggc tctgcagttc 4140
ggcgatatcc ccacaagcca tctgctgttt aagctgcccc aagagctgct caagcctcgg 4200
agccagttcg ctgtggatat gcagaccacc tcctccagag gactggtgtt tcacaccggc 4260
accaagaaca gcttcatggc cctgtacctg agcaaaggca ggctggtgtt tgccctgggc 4320
accgacggaa agaaactgcg gatcaagagc aaagagaagt gcaacgacgg caagtggcac 4380
accgtggtgt tcggacacga tggcgagaaa ggcagactcg tggtggatgg cctgagagcc 4440
agagagggat ctctgcctgg caactccacc atctccatca gagcccctgt gtatctgggc 4500
agccctccta gcggaaagcc taagagcctg cctaccaact ccttcgtggg ctgtctgaag 4560
aactttcagc tggacagcaa gcctctgtac acccctagca gcagctttgg cgtgtcctcc 4620
tgtctcggag gccctctgga aaagggcatc tacttctctg aggaaggcgg ccacgttgtc 4680
ctggctcatt ctgttctgct gggccccgag ttcaagctgg tgttctctat ccggcctaga 4740
agcctgaccg gcatcctgat tcacatcggc agccagcctg ggaagcacct gtgtgtgtat 4800
ctcgaggccg gcaaagtgac cgccagcatg gattctggtg ctggcggcac aagcacctcc 4860
gtgacaccta agcagagcct gtgtgatggc cagtggcaca gtgtggccgt gacaatcaag 4920
cagcacattc tgcacctgga actggacacc gacagcagct ataccgccgg acagatccca 4980
tttcctccag ccagcacaca agagcctctg caccttggag gcgcccctgc caatctgacc 5040
acactgagaa tccccgtgtg gaagtccttc ttcggctgcc tgcggaatat ccatgtgaac 5100
cacattccag tgcctgtgac agaggccctg gaagtgcagg gacccgtgtc tctgaatgga 5160
tgccccgatc agtga 5175

<210> 3
<211> 3519
<212> DNA
<213> Homo sapiens
<400> 3
atgagaccat tcttcctctt gtgttttgcc ctgcctggcc tcctgcatgc ccaacaagcc 60
tgctcccgtg gggcctgcta tccacctgtt ggggacctgc ttgttgggag gacccggttt 120
ctccgagctt catctacctg tggactgacc aagcctgaga cctactgcac ccagtatggc 180
gagtggcaga tgaaatgctg caagtgtgac tccaggcagc ctcacaacta ctacagtcac 240
cgagtagaga atgtggcttc atcctccggc cccatgcgct ggtggcagtc acagaatgat 300
gtgaaccctg tctctctgca gctggacctg gacaggagat tccagcttca agaagtcatg 360
atggagttcc aggggcccat gcccgccggc atgctgattg agcgctcctc agacttcggt 420
aagacctggc gagtgtacca gtacctggct gccgactgca cctccacctt ccctcgggtc 480
cgccagggtc ggcctcagag ctggcaggat gttcggtgcc agtccctgcc tcagaggcct 540
aatgcacgcc taaatggggg gaaggtccaa cttaacctta tggatttagt gtctgggatt 600
ccagcaactc aaagtcaaaa aattcaagag gtgggggaga tcacaaactt gagagtcaat 660
ttcaccaggc tggcccctgt gccccaaagg ggctaccacc ctcccagcgc ctactatgct 720
gtgtcccagc tccgtctgca ggggagctgc ttctgtcacg gccatgctga tcgctgcgca 780
cccaagcctg gggcctctgc aggcccctcc accgctgtgc aggtccacga tgtctgtgtc 840
tgccagcaca acactgccgg cccaaattgt gagcgctgtg cacccttcta caacaaccgg 900
ccctggagac cggcggaggg ccaggacgcc catgaatgcc aaaggtgcga ctgcaatggg 960
cactcagaga catgtcactt tgaccccgct gtgtttgccg ccagccaggg ggcatatgga 1020
ggtgtgtgtg acaattgccg ggaccacacc gaaggcaaga actgtgagcg gtgtcagctg 1080
cactatttcc ggaaccggcg cccgggagct tccattcagg agacctgcat ctcctgcgag 1140
tgtgatccgg atggggcagt gccaggggct ccctgtgacc cagtgaccgg gcagtgtgtg 1200
tgcaaggagc atgtgcaggg agagcgctgt gacctatgca agccgggctt cactggactc 1260
acctacgcca acccgcaggg ctgccaccgc tgtgactgca acatcctggg gtcccggagg 1320
gacatgccgt gtgacgagga gagtgggcgc tgcctttgtc tgcccaacgt ggtgggtccc 1380
aaatgtgacc agtgtgctcc ctaccactgg aagctggcca gtggccaggg ctgtgaaccg 1440
tgtgcctgcg acccgcacaa ctccctcagc ccacagtgca accagttcac agggcagtgc 1500
ccctgtcggg aaggctttgg tggcctgatg tgcagcgctg cagccatccg ccagtgtcca 1560
gaccggacct atggagacgt ggccacagga tgccgagcct gtgactgtga tttccgggga 1620
acagagggcc cgggctgcga caaggcatca ggccgctgcc tctgccgccc tggcttgacc 1680
gggccccgct gtgaccagtg ccagcgaggc tactgtaatc gctacccggt gtgcgtggcc 1740
tgccaccctt gcttccagac ctatgatgcg gacctccggg agcaggccct gcgctttggt 1800
agactccgca atgccaccgc cagcctgtgg tcagggcctg ggctggagga ccgtggcctg 1860
gcctcccgga tcctagatgc aaagagtaag attgagcaga tccgagcagt tctcagcagc 1920
cccgcagtca cagagcagga ggtggctcag gtggccagtg ccatcctctc cctcaggcga 1980
actctccagg gcctgcagct ggatctgccc ctggaggagg agacgttgtc ccttccgaga 2040
gacctggaga gtcttgacag aagcttcaat ggtctcctta ctatgtatca gaggaagagg 2100
gagcagtttg aaaaaataag cagtgctgat ccttcaggag ccttccggat gctgagcaca 2160
gcctacgagc agtcagccca ggctgctcag caggtctccg acagctcgcg ccttttggac 2220
cagctcaggg acagccggag agaggcagag aggctggtgc ggcaggcggg aggaggagga 2280
ggcaccggca gccccaagct tgtggccctg aggctggaga tgtcttcgtt gcctgacctg 2340
acacccacct tcaacaagct ctgtggcaac tccaggcaga tggcttgcac cccaatatca 2400
tgccctggtg agctatgtcc ccaagacaat ggcacagcct gtggctcccg ctgcaggggt 2460
gtccttccca gggccggtgg ggccttcttg atggcggggc aggtggctga gcagctgcgg 2520
ggcttcaatg cccagctcca gcggaccagg cagatgatta gggcagccga ggaatctgcc 2580
tcacagattc aatccagtgc ccagcgcttg gagacccagg tgagcgccag ccgctcccag 2640
atggaggaag atgtcagacg cacacggctc ctaatccagc aggtccggga cttcctaaca 2700
gaccccgaca ctgatgcagc cactatccag gaggtcagcg aggccgtgct ggccctgtgg 2760
ctgcccacag actcagctac tgttctgcag aagatgaatg agatccaggc cattgcagcc 2820
aggctcccca acgtggactt ggtgctgtcc cagaccaagc aggacattgc gcgtgcccgc 2880
cggttgcagg ctgaggctga ggaagccagg agccgagccc atgcagtgga gggccaggtg 2940
gaagatgtgg ttgggaacct gcggcagggg acagtggcac tgcaggaagc tcaggacacc 3000
atgcaaggca ccagccgctc ccttcggctt atccaggaca gggttgctga ggttcagcag 3060
gtactgcggc cagcagaaaa gctggtgaca agcatgacca agcagctggg tgacttctgg 3120
acacggatgg aggagctccg ccaccaagcc cggcagcagg gggcagaggc agtccaggcc 3180
cagcagcttg cggaaggtgc cagcgagcag gcattgagtg cccaagaggg atttgagaga 3240
ataaaacaaa agtatgctga gttgaaggac cggttgggtc agagttccat gctgggtgag 3300
cagggtgccc ggatccagag tgtgaagaca gaggcagagg agctgtttgg ggagaccatg 3360
gagatgatgg acaggatgaa agacatggag ttggagctgc tgcggggcag ccaggccatc 3420
atgctgcgct cagcggacct gacaggactg gagaagcgtg tggagcagat ccgtgaccac 3480
atcaatgggc gcgtgctcta ctatgccacc tgcaagtga 3519

<210> 4
<211> 3519
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 4
atgaggccct tcttcctgct gtgctttgcc ctgcctggac tgctgcatgc tcagcaggct 60
tgtagcagag gcgcctgcta tcctcctgtg ggcgatctgc ttgtgggcag aaccagattc 120
ctgcgggcca gctctacatg cggcctgaca aagcctgaga catactgcac ccagtacggc 180
gagtggcaga tgaagtgctg caagtgcgac agcagacagc cccacaacta ctacagccac 240
agagtggaaa acgtggccag cagcagcggc cctatgagat ggtggcagag ccagaacgac 300
gtgaaccccg ttagcctgca gctggacctg gacagacggt ttcagctgca agaagtgatg 360
atggaatttc agggccccat gcctgccggc atgctgatcg agagaagcag cgatttcggc 420
aagacctggc gggtgtacca gtatctggcc gccgattgca ccagcacatt ccccagagtt 480
agacagggca gaccccagag ctggcaggat gttcgttgtc agtctctgcc ccagcggcct 540
aacgctagac tgaatggcgg aaaggtgcag ctcaacctga tggacctggt gtctggcatc 600
cctgccacac agtcccagaa aatccaagaa gtgggcgaga tcaccaacct gagagtgaac 660
ttcacccggc tggctcccgt tcctcagaga ggatatcatc ctcctagcgc ctactacgcc 720
gtgtctcagc ttagactgca gggcagctgc ttctgtcacg gccacgctga tagatgcgcc 780
cctaaacctg gtgcctctgc cggaccttct acagccgtgc aagtgcacga tgtgtgcgtg 840
tgccagcaca ataccgccgg acctaactgc gagagatgtg cccctttcta caacaaccgg 900
ccttggaggc ctgccgaagg acaggatgct cacgagtgcc agagatgcga ctgcaacggc 960
cacagcgaga catgccactt tgaccctgcc gtgtttgccg cttctcaggg cgcttatggc 1020
ggcgtgtgtg acaactgcag agatcacacc gagggcaaga actgcgagcg ctgtcagctg 1080
cactacttcc ggaatagaag gccaggcgcc agcatccaag agacatgcat cagctgcgag 1140
tgcgatcccg atggtgctgt tcctggcgct ccttgtgatc ctgtgacagg ccagtgcgtg 1200
tgtaaagaac acgtgcaggg cgaaagatgc gacctgtgca agcctggctt taccggcctg 1260
acctacgcca atcctcaggg ctgccacaga tgtgattgca acatcctggg cagcagacgg 1320
gacatgccct gtgatgaaga gtctggcaga tgcctgtgcc tgcctaatgt cgtgggcccc 1380
aagtgcgatc agtgtgcccc atatcactgg aagctggcct ctggccaggg atgcgaacct 1440
tgtgcctgcg atccccacaa cagcctgtct ccacagtgca accagttcac cggccagtgt 1500
ccttgcagag aaggctttgg cggcctgatg tgttctgccg ccgctatcag acagtgcccc 1560
gatagaacat atggcgacgt ggccacaggc tgcagagcct gcgattgtga cttccgggga 1620
acagaaggac ccggctgcga taaggccagc ggaagatgtc tgtgtcggcc tggactcaca 1680
ggccccagat gtgaccagtg tcagcggggc tactgcaaca gataccctgt gtgtgtggcc 1740
tgccatcctt gcttccagac ctacgacgcc gacctgagag aacaggccct gagattcggc 1800
agactgagaa atgccaccgc cagcctttgg agcggacctg gccttgaaga tagaggcctg 1860
gcctccagaa tcctggacgc caagtctaag atcgagcaga tcagagccgt gctgtctagc 1920
ccagccgtga ccgaacaaga ggtggcccaa gtggctagcg ccatcctgag cctgagaaga 1980
actctgcagg gactgcagct cgatctgccc ctggaagagg aaacactgag cctgcctaga 2040
gatctggaaa gcctggatcg gagcttcaac ggcctgctga caatgtacca gagaaagaga 2100
gagcagttcg agaagatcag cagcgccgat cctagcggcg ccttcagaat gctgagcaca 2160
gcctatgagc agagcgccca ggctgctcag caagtgtccg atagcagcag actgctggac 2220
cagctgcggg actctagaag agaagccgaa agacttgtgc ggcaggcagg cggcggaggt 2280
ggaacaggat ctcctaaact ggtggccctg cggctggaaa tgtcctctct gcctgatctg 2340
acccctacct tcaacaagct gtgcggcaac agccggcaga tggcctgcac acctattagc 2400
tgtcctggcg agctgtgccc tcaggataat ggaaccgcct gcggctccag atgtagaggc 2460
gttttgccaa gagccggcgg agcctttctg atggctggac aagttgccga gcagctgaga 2520
ggcttcaacg ctcagctgca gcggaccaga cagatgatta gagccgccga ggaaagcgcc 2580
agccagattc aatctagcgc ccagagactg gaaacccagg tgtccgccag cagatcccag 2640
atggaagaag atgtgcggcg gacaagactg ctgatccagc aagtgcggga cttcctgacc 2700
gatcctgata ccgatgccgc cacaatccaa gaggtgtccg aagctgttct ggcactgtgg 2760
ctgcctaccg atagcgctac agtgctgcag aagatgaacg agatccaggc aatcgccgcc 2820
agactgccca atgtggatct ggtgctgagc cagaccaagc aggatatcgc cagagctaga 2880
aggctgcagg ccgaggccga agaggcaaga tctagagccc atgccgtgga aggccaagtc 2940
gaggacgttg tgggcaatct gagacaggga accgtggctc tgcaagaggc ccaggataca 3000
atgcagggca ccagcagaag cctgcgcctg atccaggata gagtggccga agtgcagcag 3060
gtcctgaggc cagccgaaaa gctggtcacc agcatgacca aacagctggg cgatttctgg 3120
acgcgcatgg aagaactgag gcatcaggca agacagcagg gcgctgaagc agtgcaggct 3180
caacaacttg ccgagggcgc ttctgaacag gctctgtctg cccaagaggg cttcgagcgg 3240
atcaagcaga agtacgccga gctgaaggac agactgggcc agagttctat gctgggcgaa 3300
cagggcgcca gaattcagag cgtgaaaaca gaggccgagg aactgttcgg cgagacaatg 3360
gaaatgatgg accggatgaa ggacatggaa ctggaactgc tgaggggcag ccaggccatc 3420
atgctgagaa gtgccgatct gacaggcctg gaaaagagag tggaacagat ccgggaccac 3480
atcaacggcc gggtgctgta ctacgccaca tgcaagtaa 3519

<210> 5
<211> 3582
<212> DNA
<213> Homo sapiens
<400> 5
atgcctgcgc tctggctggg ctgctgcctc tgcttctcgc tcctcctgcc cgcagcccgg 60
gccacctcca ggagggaagt ctgtgattgc aatgggaagt ccaggcagtg tatctttgat 120
cgggaacttc acagacaaac tggtaatgga ttccgctgcc tcaactgcaa tgacaacact 180
gatggcattc actgcgagaa gtgcaagaat ggcttttacc ggcacagaga aagggaccgc 240
tgtttgccct gcaattgtaa ctccaaaggt tctcttagtg ctcgatgtga caactccgga 300
cggtgcagct gtaaaccagg tgtgacagga gccagatgcg accgatgtct gccaggcttc 360
cacatgctca cggatgcggg gtgcacccaa gaccagagac tgctagactc caagtgtgac 420
tgtgacccag ctggcatcgc agggccctgt gacgcgggcc gctgtgtctg caagccagct 480
gtcactggag aacgctgtga taggtgtcga tcaggttact ataatctgga tggggggaac 540
cctgagggct gtacccagtg tttctgctat gggcattcag ccagctgccg cagctctgca 600
gaatacagtg tccataagat cacctctacc tttcatcaag atgttgatgg ctggaaggct 660
gtccaacgaa atgggtctcc tgcaaagctc caatggtcac agcgccatca agatgtgttt 720
agctcagccc aacgactaga ccctgtctat tttgtggctc ctgccaaatt tcttgggaat 780
caacaggtga gctatggtca aagcctgtcc tttgactacc gtgtggacag aggaggcaga 840
cacccatctg cccatgatgt gattctggaa ggtgctggtc tacggatcac agctcccttg 900
atgccacttg gcaagacact gccttgtggg ctcaccaaga cttacacatt caggttaaat 960
gagcatccaa gcaataattg gagcccccag ctgagttact ttgagtatcg aaggttactg 1020
cggaatctca cagccctccg catccgagct acatatggag aatacagtac tgggtacatt 1080
gacaatgtga ccctgatttc agcccgccct gtctctggag ccccagcacc ctgggttgaa 1140
cagtgtatat gtcctgttgg gtacaagggg caattctgcc aggattgtgc ttctggctac 1200
aagagagatt cagcgagact ggggcctttt ggcacctgta ttccttgtaa ctgtcaaggg 1260
ggaggggcct gtgatccaga cacaggagat tgttattcag gggatgagaa tcctgacatt 1320
gagtgtgctg actgcccaat tggtttctac aacgatccgc acgacccccg cagctgcaag 1380
ccatgtccct gtcataacgg gttcagctgc tcagtgatgc cggagacgga ggaggtggtg 1440
tgcaataact gccctcccgg ggtcaccggt gcccgctgtg agctctgtgc tgatggctac 1500
tttggggacc cctttggtga acatggccca gtgaggcctt gtcagccctg tcaatgcaac 1560
aacaatgtgg accccagtgc ctctgggaat tgtgaccggc tgacaggcag gtgtttgaag 1620
tgtatccaca acacagccgg catctactgc gaccagtgca aagcaggcta cttcggggac 1680
ccattggctc ccaacccagc agacaagtgt cgagcttgca actgtaaccc catgggctca 1740
gagcctgtag gatgtcgaag tgatggcacc tgtgtttgca agccaggatt tggtggcccc 1800
aactgtgagc atggagcatt cagctgtcca gcttgctata atcaagtgaa gattcagatg 1860
gatcagttta tgcagcagct tcagagaatg gaggccctga tttcaaaggc tcagggtggt 1920
gatggagtag tacctgatac agagctggaa ggcaggatgc agcaggctga gcaggccctt 1980
caggacattc tgagagatgc ccagatttca gaaggtgcta gcagatccct tggtctccag 2040
ttggccaagg tgaggagcca agagaacagc taccagagcc gcctggatga cctcaagatg 2100
actgtggaaa gagttcgggc tctgggaagt cagtaccaga accgagttcg ggatactcac 2160
aggctcatca ctcagatgca gctgagcctg gcagaaagtg aagcttcctt gggaaacact 2220
aacattcctg cctcagacca ctacgtgggg ccaaatggct ttaaaagtct ggctcaggag 2280
gccacaagat tagcagaaag ccacgttgag tcagccagta acatggagca actgacaagg 2340
gaaactgagg actattccaa acaagccctc tcactggtgc gcaaggccct gcatgaagga 2400
gtcggaagcg gaagcggtag cccggacggt gctgtggtgc aagggcttgt ggaaaaattg 2460
gagaaaacca agtccctggc ccagcagttg acaagggagg ccactcaagc ggaaattgaa 2520
gcagataggt cttatcagca cagtctccgc ctcctggatt cagtgtctcg gcttcaggga 2580
gtcagtgatc agtcctttca ggtggaagaa gcaaagagga tcaaacaaaa agcggattca 2640
ctctcaagcc tggtaaccag gcatatggat gagttcaagc gtacacagaa gaatctggga 2700
aactggaaag aagaagcaca gcagctctta cagaatggaa aaagtgggag agagaaatca 2760
gatcagctgc tttcccgtgc caatcttgct aaaagcagag cacaagaagc actgagtatg 2820
ggcaatgcca ctttttatga agttgagagc atccttaaaa acctcagaga gtttgacctg 2880
caggtggaca acagaaaagc agaagctgaa gaagccatga agagactctc ctacatcagc 2940
cagaaggttt cagatgccag tgacaagacc cagcaagcag aaagagccct ggggagcgct 3000
gctgctgatg cacagagggc aaagaatggg gccggggagg ccctggaaat ctccagtgag 3060
attgaacagg agattgggag tctgaacttg gaagccaatg tgacagcaga tggagccttg 3120
gccatggaaa agggactggc ctctctgaag agtgagatga gggaagtgga aggagagctg 3180
gaaaggaagg agctggagtt tgacacgaat atggatgcag tacagatggt gattacagaa 3240
gcccagaagg ttgataccag agccaagaac gctggggtta caatccaaga cacactcaac 3300
acattagacg gcctcctgca tctgatggac cagcctctca gtgtagatga agaggggctg 3360
gtcttactgg agcagaagct ttcccgagcc aagacccaga tcaacagcca actgcggccc 3420
atgatgtcag agctggaaga gagggcacgt cagcagaggg gccacctcca tttgctggag 3480
acaagcatag atgggattct ggctgatgtg aagaacttgg agaacattag ggacaacctg 3540
cccccaggct gctacaatac ccaggctctt gagcaacagt ga 3582

<210> 6
<211> 3582
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 6
atgcctgctc tgtggctggg ctgctgcctg tgttttagtc tgctgctgcc agccgccaga 60
gccacatcta gaagagaagt gtgcgactgc aacggcaaga gccggcagtg catcttcgac 120
agagagctgc acagacagac cggcaacggc ttcagatgcc tgaactgcaa cgacaacacc 180
gacggcatcc actgcgagaa gtgcaagaac ggcttctacc ggcaccgcga gagggataga 240
tgcctgcctt gcaactgcaa ctccaagggc agcctgagcg ccagatgcga caatagcggc 300
agatgtagct gcaagcctgg cgtgacaggc gctagatgcg atagatgtct ccccggcttc 360
cacatgctga ccgatgccgg atgtacccag gaccagagac tgctggacag caagtgcgat 420
tgcgaccctg ccggaattgc cggaccttgt gatgccggaa gatgcgtgtg taaacctgcc 480
gtgaccggcg agagatgtga cagatgtaga agcggctact acaacctgga cggcggcaat 540
cctgaaggct gcacccagtg cttttgctac ggccacagcg ccagctgtag aagcagcgcc 600
gaatactccg tgcacaagat caccagcacc ttccaccagg atgtggacgg atggaaggcc 660
gtgcagagaa atggctctcc tgccaagctg cagtggtccc agagacacca ggacgtgttc 720
agcagcgctc agagactgga ccccgtgtac tttgtggccc ctgccaagtt cctgggcaac 780
cagcaagtgt cttacggcca gagcctgagc ttcgactaca gagtggatag aggcggcaga 840
caccccagcg ctcacgatgt gattcttgaa ggcgccggac tgcggatcac agcccctctt 900
atgcctctgg gcaagaccct gccttgtggc ctgaccaaga cctacacctt ccggctgaat 960
gagcacccca gcaacaactg gtccccacag ctgagctact tcgagtacag acggctgctg 1020
cggaacctga cagccctgag aatcagagcc acctacggcg agtacagcac cggctacatc 1080
gacaacgtga ccctgatcag cgccagacct gtttctggtg ctcctgctcc ttgggtcgag 1140
cagtgtatct gtcccgtggg ctacaagggc cagttctgcc aggattgtgc cagcggctac 1200
aagagagact ctgccagact gggccccttc ggcacatgca tcccttgtaa ttgtcaaggc 1260
ggcggagcct gcgatcccga tacaggcgat tgctacagcg gcgacgagaa ccccgatatc 1320
gagtgcgccg attgtcccat cggcttttac aacgaccctc acgaccccag atcctgcaag 1380
ccatgtcctt gccacaatgg cttcagctgc agcgtgatgc ccgaaaccga agaggtcgtg 1440
tgcaacaatt gcccaccagg cgttacaggg gccagatgtg aactgtgtgc cgacggctac 1500
ttcggcgatc cttttggaga acacggaccc gtgcgacctt gccagccttg tcagtgcaac 1560
aacaacgtgg acccaagcgc cagcggcaac tgcgatagac tgacaggcag atgtctgaag 1620
tgcatccaca ataccgccgg gatctactgt gaccagtgca aggccggcta ttttggcgac 1680
cctctggctc ccaatcctgc cgataagtgc agagcctgca actgtaaccc tatgggctct 1740
gagcctgtgg gctgcagatc tgatggaacc tgcgtgtgca agccaggctt tggcggacct 1800
aattgtgaac acggcgcctt tagctgcccc gcctgctaca atcaagtgaa gatccagatg 1860
gaccagttca tgcagcagct gcagaggatg gaagccctga tctctaaagc ccaaggcgga 1920
gatggcgtgg tgcctgatac agagctggaa ggcagaatgc agcaggccga acaggccctg 1980
caggacattc tgagagatgc ccagattagc gagggcgcct ctagaagtct gggactgcag 2040
ctggctaaag tgcggagcca agagaacagc taccagagca gactggacga cctgaagatg 2100
accgtggaaa gagtcagagc cctgggcagc cagtaccaga acagagtgcg ggatacccac 2160
cggctgatca cccagatgca actgtctctg gccgagagcg aagccagcct gggcaatacc 2220
aatattcccg ccagcgacca ctacgtgggc cccaacggtt ttaagagcct ggctcaagag 2280
gccaccagac tggccgaaag ccatgtggaa agcgcctcca acatggaaca gctgacccgg 2340
gaaaccgagg actactctaa gcaggccctg agcctcgtca gaaaagccct gcatgaaggc 2400
gtcggcagcg gctctggatc tcctgatggt gctgtggtgc agggactcgt ggaaaagctg 2460
gaaaagacca aatctctggc ccagcagctg accagagaag ccacacaggc cgagatcgag 2520
gccgacagaa gctaccagca ctcactgagg ctgctggact ccgtgtctag actgcagggc 2580
gtgtccgacc agagcttcca ggtggaagag gccaagcgga tcaagcagaa ggccgatagc 2640
ctgagcagcc tggtcaccag acacatggac gagttcaagc ggacccagaa gaacctcggc 2700
aactggaaag aggaagccca gcaactgctg cagaacggca agtctggaag agagaagtct 2760
gaccagctgc tgagcagagc caacctggcc aagtctagag cccaagaggc cctgtctatg 2820
ggcaacgcca ccttctacga ggtggaatcc atcctgaaga acctgcgcga gttcgacctg 2880
caagtggaca acagaaaggc cgaggccgag gaagccatga agagactgag ctacatcagc 2940
cagaaagtgt ccgacgcctc cgacaagaca cagcaggcag aaagagcact gggatctgcc 3000
gcagccgatg ctcagagagc taaaaacggc gctggcgagg ccctggaaat cagctctgag 3060
atcgagcaag agatcggctc cctgaatctg gaagccaatg tgacagccga tggcgccctg 3120
gccatggaaa aaggactggc ctctctgaag tccgagatga gagaggtgga aggcgagctg 3180
gaacggaaag aactggaatt cgacaccaat atggacgctg tgcagatggt catcacagag 3240
gcccagaagg tggacaccag agccaaaaat gccggcgtga ccatccagga caccctgaat 3300
actctggacg gactgctgca cctgatggat cagcctctga gcgtggacga ggaaggactg 3360
gttctgctgg aacagaagct gagccgggcc aagactcaga tcaacagcca gctgaggccc 3420
atgatgagcg aactggaaga acgggccaga cagcagaggg gccatctgca tctgctcgaa 3480
accagcatcg atggcatcct ggccgacgtg aagaatctcg agaacatccg ggacaacctg 3540
ccacctggct gctacaacac acaggcactg gaacagcagt ga 3582

<210> 7
<211> 1724
<212> PRT
<213> Homo sapiens
<400> 7
Met Pro Pro Ala Val Arg Arg Ser Ala Cys Ser Met Gly Trp Leu Trp
1 5 10 15
Ile Phe Gly Ala Ala Leu Gly Gln Cys Leu Gly Tyr Ser Ser Gln Gln
20 25 30
Gln Arg Val Pro Phe Leu Gln Pro Pro Gly Gln Ser Gln Leu Gln Ala
35 40 45
Ser Tyr Val Glu Phe Arg Pro Ser Gln Gly Cys Ser Pro Gly Tyr Tyr
50 55 60
Arg Asp His Lys Gly Leu Tyr Thr Gly Arg Cys Val Pro Cys Asn Cys
65 70 75 80
Asn Gly His Ser Asn Gln Cys Gln Asp Gly Ser Gly Ile Cys Val Asn
85 90 95
Cys Gln His Asn Thr Ala Gly Glu His Cys Glu Arg Cys Gln Glu Gly
100 105 110
Tyr Tyr Gly Asn Ala Val His Gly Ser Cys Arg Ala Cys Pro Cys Pro
115 120 125
His Thr Asn Ser Phe Ala Thr Gly Cys Val Val Asn Gly Gly Asp Val
130 135 140
Arg Cys Ser Cys Lys Ala Gly Tyr Thr Gly Thr Gln Cys Glu Arg Cys
145 150 155 160
Ala Pro Gly Tyr Phe Gly Asn Pro Gln Lys Phe Gly Gly Ser Cys Gln
165 170 175
Pro Cys Ser Cys Asn Ser Asn Gly Gln Leu Gly Ser Cys His Pro Leu
180 185 190
Thr Gly Asp Cys Ile Asn Gln Glu Pro Lys Asp Ser Ser Pro Ala Glu
195 200 205
Glu Cys Asp Asp Cys Asp Ser Cys Val Met Thr Leu Leu Asn Asp Leu
210 215 220
Ala Thr Met Gly Glu Gln Leu Arg Leu Val Lys Ser Gln Leu Gln Gly
225 230 235 240
Leu Ser Ala Ser Ala Gly Leu Leu Glu Gln Met Arg His Met Glu Thr
245 250 255
Gln Ala Lys Asp Leu Arg Asn Gln Leu Leu Asn Tyr Arg Ser Ala Ile
260 265 270
Ser Asn His Gly Ser Lys Ile Glu Gly Leu Glu Arg Glu Leu Thr Asp
275 280 285
Leu Asn Gln Glu Phe Glu Thr Leu Gln Glu Lys Ala Gln Val Asn Ser
290 295 300
Arg Lys Ala Gln Thr Leu Asn Asn Asn Val Asn Arg Ala Thr Gln Ser
305 310 315 320
Ala Lys Glu Leu Asp Val Lys Ile Lys Asn Val Ile Arg Asn Val His
325 330 335
Ile Leu Leu Lys Gln Ile Ser Gly Thr Asp Gly Glu Gly Asn Asn Val
340 345 350
Pro Ser Gly Asp Phe Ser Arg Glu Trp Ala Glu Ala Gln Arg Met Met
355 360 365
Arg Glu Leu Arg Asn Arg Asn Phe Gly Lys His Leu Arg Glu Ala Glu
370 375 380
Ala Asp Lys Arg Glu Ser Gln Leu Leu Leu Asn Arg Ile Arg Thr Trp
385 390 395 400
Gln Lys Thr His Gln Gly Glu Asn Asn Gly Leu Ala Asn Ser Ile Arg
405 410 415
Asp Ser Leu Asn Glu Tyr Glu Ala Lys Leu Ser Asp Leu Arg Ala Arg
420 425 430
Leu Gln Glu Ala Ala Ala Gln Ala Lys Gln Ala Asn Gly Leu Asn Gln
435 440 445
Glu Asn Glu Arg Ala Leu Gly Ala Ile Gln Arg Gln Val Lys Glu Ile
450 455 460
Asn Ser Leu Gln Ser Asp Phe Thr Lys Tyr Leu Thr Thr Ala Asp Ser
465 470 475 480
Ser Leu Leu Gln Thr Asn Ile Ala Leu Gln Leu Met Glu Lys Ser Gln
485 490 495
Lys Glu Tyr Glu Lys Leu Ala Ala Ser Leu Asn Glu Ala Arg Gln Glu
500 505 510
Leu Ser Asp Lys Val Arg Glu Leu Ser Arg Ser Ala Gly Lys Thr Ser
515 520 525
Leu Val Glu Glu Ala Glu Lys His Ala Arg Ser Leu Gln Glu Leu Ala
530 535 540
Lys Gln Leu Glu Glu Ile Lys Arg Asn Ala Ser Gly Asp Glu Leu Val
545 550 555 560
Arg Cys Ala Val Asp Ala Ala Thr Ala Tyr Glu Asn Ile Leu Asn Ala
565 570 575
Ile Lys Ala Ala Glu Asp Ala Ala Asn Arg Ala Ala Ser Ala Ser Glu
580 585 590
Ser Ala Leu Gln Thr Val Ile Lys Glu Asp Leu Pro Arg Lys Ala Lys
595 600 605
Thr Leu Ser Ser Asn Ser Asp Lys Leu Leu Asn Glu Ala Lys Met Thr
610 615 620
Gln Lys Lys Leu Lys Gln Glu Val Ser Pro Ala Leu Asn Asn Leu Gln
625 630 635 640
Gln Thr Leu Asn Ile Val Thr Val Gln Lys Glu Val Ile Asp Thr Asn
645 650 655
Leu Thr Thr Leu Arg Asp Gly Leu His Gly Ile Gln Arg Gly Asp Ile
660 665 670
Asp Ala Met Ile Ser Ser Ala Lys Ser Met Val Arg Lys Ala Asn Asp
675 680 685
Ile Thr Asp Glu Val Leu Asp Gly Leu Asn Pro Ile Gln Thr Asp Val
690 695 700
Glu Arg Ile Lys Asp Thr Tyr Gly Arg Thr Gln Asn Glu Asp Phe Lys
705 710 715 720
Lys Ala Leu Thr Asp Ala Asp Asn Ser Val Asn Lys Leu Thr Asn Lys
725 730 735
Leu Pro Asp Leu Trp Arg Lys Ile Glu Ser Ile Asn Gln Gln Leu Leu
740 745 750
Pro Leu Gly Asn Ile Ser Asp Asn Met Asp Arg Ile Arg Glu Leu Ile
755 760 765
Gln Gln Ala Arg Asp Ala Ala Ser Lys Val Ala Val Pro Met Arg Phe
770 775 780
Asn Gly Lys Ser Gly Val Glu Val Arg Leu Pro Asn Asp Leu Glu Asp
785 790 795 800
Leu Lys Gly Tyr Thr Ser Leu Ser Leu Phe Leu Gln Arg Pro Asn Ser
805 810 815
Arg Glu Asn Gly Gly Thr Glu Asn Met Phe Val Met Tyr Leu Gly Asn
820 825 830
Lys Asp Ala Ser Arg Asp Tyr Ile Gly Met Ala Val Val Asp Gly Gln
835 840 845
Leu Thr Cys Val Tyr Asn Leu Gly Asp Arg Glu Ala Glu Leu Gln Val
850 855 860
Asp Gln Ile Leu Thr Lys Ser Glu Thr Lys Glu Ala Val Met Asp Arg
865 870 875 880
Val Lys Phe Gln Arg Ile Tyr Gln Phe Ala Arg Leu Asn Tyr Thr Lys
885 890 895
Gly Ala Thr Ser Ser Lys Pro Glu Thr Pro Gly Val Tyr Asp Met Asp
900 905 910
Gly Arg Asn Ser Asn Thr Leu Leu Asn Leu Asp Pro Glu Asn Val Val
915 920 925
Phe Tyr Val Gly Gly Tyr Pro Pro Asp Phe Lys Leu Pro Ser Arg Leu
930 935 940
Ser Phe Pro Pro Tyr Lys Gly Cys Ile Glu Leu Asp Asp Leu Asn Glu
945 950 955 960
Asn Val Leu Ser Leu Tyr Asn Phe Lys Lys Thr Phe Asn Leu Asn Thr
965 970 975
Thr Glu Val Glu Pro Cys Arg Arg Arg Lys Glu Glu Ser Asp Lys Asn
980 985 990
Tyr Phe Glu Gly Thr Gly Tyr Ala Arg Val Pro Thr Gln Pro His Ala
995 1000 1005
Pro Ile Pro Thr Phe Gly Gln Thr Ile Gln Thr Thr Val Asp Arg Gly
1010 1015 1020
Leu Leu Phe Phe Ala Glu Asn Gly Asp Arg Phe Ile Ser Leu Asn Ile
1025 1030 1035 1040
Glu Asp Gly Lys Leu Met Val Arg Tyr Lys Leu Asn Ser Glu Leu Pro
1045 1050 1055
Lys Glu Arg Gly Val Gly Asp Ala Ile Asn Asn Gly Arg Asp His Ser
1060 1065 1070
Ile Gln Ile Lys Ile Gly Lys Leu Gln Lys Arg Met Trp Ile Asn Val
1075 1080 1085
Asp Val Gln Asn Thr Ile Ile Asp Gly Glu Val Phe Asp Phe Ser Thr
1090 1095 1100
Tyr Tyr Leu Gly Gly Ile Pro Ile Ala Ile Arg Glu Arg Phe Asn Ile
1105 1110 1115 1120
Ser Thr Pro Ala Phe Arg Gly Cys Met Lys Asn Leu Lys Lys Thr Ser
1125 1130 1135
Gly Val Val Arg Leu Asn Asp Thr Val Gly Val Thr Lys Lys Cys Ser
1140 1145 1150
Glu Asp Trp Lys Leu Val Arg Ser Ala Ser Phe Ser Arg Gly Gly Gln
1155 1160 1165
Leu Ser Phe Thr Asp Leu Gly Leu Pro Pro Thr Asp His Leu Gln Ala
1170 1175 1180
Ser Phe Gly Phe Gln Thr Phe Gln Pro Ser Gly Ile Leu Leu Asp His
1185 1190 1195 1200
Gln Thr Trp Thr Arg Asn Leu Gln Val Thr Leu Glu Asp Gly Tyr Ile
1205 1210 1215
Glu Leu Ser Thr Ser Asp Ser Gly Gly Pro Ile Phe Lys Ser Pro Gln
1220 1225 1230
Thr Tyr Met Asp Gly Leu Leu His Tyr Val Ser Val Ile Ser Asp Asn
1235 1240 1245
Ser Gly Leu Arg Leu Leu Ile Asp Asp Gln Leu Leu Arg Asn Ser Lys
1250 1255 1260
Arg Leu Lys His Ile Ser Ser Ser Arg Gln Ser Leu Arg Leu Gly Gly
1265 1270 1275 1280
Ser Asn Phe Glu Gly Cys Ile Ser Asn Val Phe Val Gln Arg Leu Ser
1285 1290 1295
Leu Ser Pro Glu Val Leu Asp Leu Thr Ser Asn Ser Leu Lys Arg Asp
1300 1305 1310
Val Ser Leu Gly Gly Cys Ser Leu Asn Lys Pro Pro Phe Leu Met Leu
1315 1320 1325
Leu Lys Gly Ser Thr Arg Phe Asn Lys Thr Lys Thr Phe Arg Ile Asn
1330 1335 1340
Gln Leu Leu Gln Asp Thr Pro Val Ala Ser Pro Arg Ser Val Lys Val
1345 1350 1355 1360
Trp Gln Asp Ala Cys Ser Pro Leu Pro Lys Thr Gln Ala Asn His Gly
1365 1370 1375
Ala Leu Gln Phe Gly Asp Ile Pro Thr Ser His Leu Leu Phe Lys Leu
1380 1385 1390
Pro Gln Glu Leu Leu Lys Pro Arg Ser Gln Phe Ala Val Asp Met Gln
1395 1400 1405
Thr Thr Ser Ser Arg Gly Leu Val Phe His Thr Gly Thr Lys Asn Ser
1410 1415 1420
Phe Met Ala Leu Tyr Leu Ser Lys Gly Arg Leu Val Phe Ala Leu Gly
1425 1430 1435 1440
Thr Asp Gly Lys Lys Leu Arg Ile Lys Ser Lys Glu Lys Cys Asn Asp
1445 1450 1455
Gly Lys Trp His Thr Val Val Phe Gly His Asp Gly Glu Lys Gly Arg
1460 1465 1470
Leu Val Val Asp Gly Leu Arg Ala Arg Glu Gly Ser Leu Pro Gly Asn
1475 1480 1485
Ser Thr Ile Ser Ile Arg Ala Pro Val Tyr Leu Gly Ser Pro Pro Ser
1490 1495 1500
Gly Lys Pro Lys Ser Leu Pro Thr Asn Ser Phe Val Gly Cys Leu Lys
1505 1510 1515 1520
Asn Phe Gln Leu Asp Ser Lys Pro Leu Tyr Thr Pro Ser Ser Ser Phe
1525 1530 1535
Gly Val Ser Ser Cys Leu Gly Gly Pro Leu Glu Lys Gly Ile Tyr Phe
1540 1545 1550
Ser Glu Glu Gly Gly His Val Val Leu Ala His Ser Val Leu Leu Gly
1555 1560 1565
Pro Glu Phe Lys Leu Val Phe Ser Ile Arg Pro Arg Ser Leu Thr Gly
1570 1575 1580
Ile Leu Ile His Ile Gly Ser Gln Pro Gly Lys His Leu Cys Val Tyr
1585 1590 1595 1600
Leu Glu Ala Gly Lys Val Thr Ala Ser Met Asp Ser Gly Ala Gly Gly
1605 1610 1615
Thr Ser Thr Ser Val Thr Pro Lys Gln Ser Leu Cys Asp Gly Gln Trp
1620 1625 1630
His Ser Val Ala Val Thr Ile Lys Gln His Ile Leu His Leu Glu Leu
1635 1640 1645
Asp Thr Asp Ser Ser Tyr Thr Ala Gly Gln Ile Pro Phe Pro Pro Ala
1650 1655 1660
Ser Thr Gln Glu Pro Leu His Leu Gly Gly Ala Pro Ala Asn Leu Thr
1665 1670 1675 1680
Thr Leu Arg Ile Pro Val Trp Lys Ser Phe Phe Gly Cys Leu Arg Asn
1685 1690 1695
Ile His Val Asn His Ile Pro Val Pro Val Thr Glu Ala Leu Glu Val
1700 1705 1710
Gln Gly Pro Val Ser Leu Asn Gly Cys Pro Asp Gln
1715 1720

<210> 8
<211> 1172
<212> PRT
<213> Homo sapiens
<400> 8
Met Arg Pro Phe Phe Leu Leu Cys Phe Ala Leu Pro Gly Leu Leu His
1 5 10 15
Ala Gln Gln Ala Cys Ser Arg Gly Ala Cys Tyr Pro Pro Val Gly Asp
20 25 30
Leu Leu Val Gly Arg Thr Arg Phe Leu Arg Ala Ser Ser Thr Cys Gly
35 40 45
Leu Thr Lys Pro Glu Thr Tyr Cys Thr Gln Tyr Gly Glu Trp Gln Met
50 55 60
Lys Cys Cys Lys Cys Asp Ser Arg Gln Pro His Asn Tyr Tyr Ser His
65 70 75 80
Arg Val Glu Asn Val Ala Ser Ser Ser Gly Pro Met Arg Trp Trp Gln
85 90 95
Ser Gln Asn Asp Val Asn Pro Val Ser Leu Gln Leu Asp Leu Asp Arg
100 105 110
Arg Phe Gln Leu Gln Glu Val Met Met Glu Phe Gln Gly Pro Met Pro
115 120 125
Ala Gly Met Leu Ile Glu Arg Ser Ser Asp Phe Gly Lys Thr Trp Arg
130 135 140
Val Tyr Gln Tyr Leu Ala Ala Asp Cys Thr Ser Thr Phe Pro Arg Val
145 150 155 160
Arg Gln Gly Arg Pro Gln Ser Trp Gln Asp Val Arg Cys Gln Ser Leu
165 170 175
Pro Gln Arg Pro Asn Ala Arg Leu Asn Gly Gly Lys Val Gln Leu Asn
180 185 190
Leu Met Asp Leu Val Ser Gly Ile Pro Ala Thr Gln Ser Gln Lys Ile
195 200 205
Gln Glu Val Gly Glu Ile Thr Asn Leu Arg Val Asn Phe Thr Arg Leu
210 215 220
Ala Pro Val Pro Gln Arg Gly Tyr His Pro Pro Ser Ala Tyr Tyr Ala
225 230 235 240
Val Ser Gln Leu Arg Leu Gln Gly Ser Cys Phe Cys His Gly His Ala
245 250 255
Asp Arg Cys Ala Pro Lys Pro Gly Ala Ser Ala Gly Pro Ser Thr Ala
260 265 270
Val Gln Val His Asp Val Cys Val Cys Gln His Asn Thr Ala Gly Pro
275 280 285
Asn Cys Glu Arg Cys Ala Pro Phe Tyr Asn Asn Arg Pro Trp Arg Pro
290 295 300
Ala Glu Gly Gln Asp Ala His Glu Cys Gln Arg Cys Asp Cys Asn Gly
305 310 315 320
His Ser Glu Thr Cys His Phe Asp Pro Ala Val Phe Ala Ala Ser Gln
325 330 335
Gly Ala Tyr Gly Gly Val Cys Asp Asn Cys Arg Asp His Thr Glu Gly
340 345 350
Lys Asn Cys Glu Arg Cys Gln Leu His Tyr Phe Arg Asn Arg Arg Pro
355 360 365
Gly Ala Ser Ile Gln Glu Thr Cys Ile Ser Cys Glu Cys Asp Pro Asp
370 375 380
Gly Ala Val Pro Gly Ala Pro Cys Asp Pro Val Thr Gly Gln Cys Val
385 390 395 400
Cys Lys Glu His Val Gln Gly Glu Arg Cys Asp Leu Cys Lys Pro Gly
405 410 415
Phe Thr Gly Leu Thr Tyr Ala Asn Pro Gln Gly Cys His Arg Cys Asp
420 425 430
Cys Asn Ile Leu Gly Ser Arg Arg Asp Met Pro Cys Asp Glu Glu Ser
435 440 445
Gly Arg Cys Leu Cys Leu Pro Asn Val Val Gly Pro Lys Cys Asp Gln
450 455 460
Cys Ala Pro Tyr His Trp Lys Leu Ala Ser Gly Gln Gly Cys Glu Pro
465 470 475 480
Cys Ala Cys Asp Pro His Asn Ser Leu Ser Pro Gln Cys Asn Gln Phe
485 490 495
Thr Gly Gln Cys Pro Cys Arg Glu Gly Phe Gly Gly Leu Met Cys Ser
500 505 510
Ala Ala Ala Ile Arg Gln Cys Pro Asp Arg Thr Tyr Gly Asp Val Ala
515 520 525
Thr Gly Cys Arg Ala Cys Asp Cys Asp Phe Arg Gly Thr Glu Gly Pro
530 535 540
Gly Cys Asp Lys Ala Ser Gly Arg Cys Leu Cys Arg Pro Gly Leu Thr
545 550 555 560
Gly Pro Arg Cys Asp Gln Cys Gln Arg Gly Tyr Cys Asn Arg Tyr Pro
565 570 575
Val Cys Val Ala Cys His Pro Cys Phe Gln Thr Tyr Asp Ala Asp Leu
580 585 590
Arg Glu Gln Ala Leu Arg Phe Gly Arg Leu Arg Asn Ala Thr Ala Ser
595 600 605
Leu Trp Ser Gly Pro Gly Leu Glu Asp Arg Gly Leu Ala Ser Arg Ile
610 615 620
Leu Asp Ala Lys Ser Lys Ile Glu Gln Ile Arg Ala Val Leu Ser Ser
625 630 635 640
Pro Ala Val Thr Glu Gln Glu Val Ala Gln Val Ala Ser Ala Ile Leu
645 650 655
Ser Leu Arg Arg Thr Leu Gln Gly Leu Gln Leu Asp Leu Pro Leu Glu
660 665 670
Glu Glu Thr Leu Ser Leu Pro Arg Asp Leu Glu Ser Leu Asp Arg Ser
675 680 685
Phe Asn Gly Leu Leu Thr Met Tyr Gln Arg Lys Arg Glu Gln Phe Glu
690 695 700
Lys Ile Ser Ser Ala Asp Pro Ser Gly Ala Phe Arg Met Leu Ser Thr
705 710 715 720
Ala Tyr Glu Gln Ser Ala Gln Ala Ala Gln Gln Val Ser Asp Ser Ser
725 730 735
Arg Leu Leu Asp Gln Leu Arg Asp Ser Arg Arg Glu Ala Glu Arg Leu
740 745 750
Val Arg Gln Ala Gly Gly Gly Gly Gly Thr Gly Ser Pro Lys Leu Val
755 760 765
Ala Leu Arg Leu Glu Met Ser Ser Leu Pro Asp Leu Thr Pro Thr Phe
770 775 780
Asn Lys Leu Cys Gly Asn Ser Arg Gln Met Ala Cys Thr Pro Ile Ser
785 790 795 800
Cys Pro Gly Glu Leu Cys Pro Gln Asp Asn Gly Thr Ala Cys Gly Ser
805 810 815
Arg Cys Arg Gly Val Leu Pro Arg Ala Gly Gly Ala Phe Leu Met Ala
820 825 830
Gly Gln Val Ala Glu Gln Leu Arg Gly Phe Asn Ala Gln Leu Gln Arg
835 840 845
Thr Arg Gln Met Ile Arg Ala Ala Glu Glu Ser Ala Ser Gln Ile Gln
850 855 860
Ser Ser Ala Gln Arg Leu Glu Thr Gln Val Ser Ala Ser Arg Ser Gln
865 870 875 880
Met Glu Glu Asp Val Arg Arg Thr Arg Leu Leu Ile Gln Gln Val Arg
885 890 895
Asp Phe Leu Thr Asp Pro Asp Thr Asp Ala Ala Thr Ile Gln Glu Val
900 905 910
Ser Glu Ala Val Leu Ala Leu Trp Leu Pro Thr Asp Ser Ala Thr Val
915 920 925
Leu Gln Lys Met Asn Glu Ile Gln Ala Ile Ala Ala Arg Leu Pro Asn
930 935 940
Val Asp Leu Val Leu Ser Gln Thr Lys Gln Asp Ile Ala Arg Ala Arg
945 950 955 960
Arg Leu Gln Ala Glu Ala Glu Glu Ala Arg Ser Arg Ala His Ala Val
965 970 975
Glu Gly Gln Val Glu Asp Val Val Gly Asn Leu Arg Gln Gly Thr Val
980 985 990
Ala Leu Gln Glu Ala Gln Asp Thr Met Gln Gly Thr Ser Arg Ser Leu
995 1000 1005
Arg Leu Ile Gln Asp Arg Val Ala Glu Val Gln Gln Val Leu Arg Pro
1010 1015 1020
Ala Glu Lys Leu Val Thr Ser Met Thr Lys Gln Leu Gly Asp Phe Trp
1025 1030 1035 1040
Thr Arg Met Glu Glu Leu Arg His Gln Ala Arg Gln Gln Gly Ala Glu
1045 1050 1055
Ala Val Gln Ala Gln Gln Leu Ala Glu Gly Ala Ser Glu Gln Ala Leu
1060 1065 1070
Ser Ala Gln Glu Gly Phe Glu Arg Ile Lys Gln Lys Tyr Ala Glu Leu
1075 1080 1085
Lys Asp Arg Leu Gly Gln Ser Ser Met Leu Gly Glu Gln Gly Ala Arg
1090 1095 1100
Ile Gln Ser Val Lys Thr Glu Ala Glu Glu Leu Phe Gly Glu Thr Met
1105 1110 1115 1120
Glu Met Met Asp Arg Met Lys Asp Met Glu Leu Glu Leu Leu Arg Gly
1125 1130 1135
Ser Gln Ala Ile Met Leu Arg Ser Ala Asp Leu Thr Gly Leu Glu Lys
1140 1145 1150
Arg Val Glu Gln Ile Arg Asp His Ile Asn Gly Arg Val Leu Tyr Tyr
1155 1160 1165
Ala Thr Cys Lys
1170

<210> 9
<211> 1193
<212> PRT
<213> Homo sapiens
<400> 9
Met Pro Ala Leu Trp Leu Gly Cys Cys Leu Cys Phe Ser Leu Leu Leu
1 5 10 15
Pro Ala Ala Arg Ala Thr Ser Arg Arg Glu Val Cys Asp Cys Asn Gly
20 25 30
Lys Ser Arg Gln Cys Ile Phe Asp Arg Glu Leu His Arg Gln Thr Gly
35 40 45
Asn Gly Phe Arg Cys Leu Asn Cys Asn Asp Asn Thr Asp Gly Ile His
50 55 60
Cys Glu Lys Cys Lys Asn Gly Phe Tyr Arg His Arg Glu Arg Asp Arg
65 70 75 80
Cys Leu Pro Cys Asn Cys Asn Ser Lys Gly Ser Leu Ser Ala Arg Cys
85 90 95
Asp Asn Ser Gly Arg Cys Ser Cys Lys Pro Gly Val Thr Gly Ala Arg
100 105 110
Cys Asp Arg Cys Leu Pro Gly Phe His Met Leu Thr Asp Ala Gly Cys
115 120 125
Thr Gln Asp Gln Arg Leu Leu Asp Ser Lys Cys Asp Cys Asp Pro Ala
130 135 140
Gly Ile Ala Gly Pro Cys Asp Ala Gly Arg Cys Val Cys Lys Pro Ala
145 150 155 160
Val Thr Gly Glu Arg Cys Asp Arg Cys Arg Ser Gly Tyr Tyr Asn Leu
165 170 175
Asp Gly Gly Asn Pro Glu Gly Cys Thr Gln Cys Phe Cys Tyr Gly His
180 185 190
Ser Ala Ser Cys Arg Ser Ser Ala Glu Tyr Ser Val His Lys Ile Thr
195 200 205
Ser Thr Phe His Gln Asp Val Asp Gly Trp Lys Ala Val Gln Arg Asn
210 215 220
Gly Ser Pro Ala Lys Leu Gln Trp Ser Gln Arg His Gln Asp Val Phe
225 230 235 240
Ser Ser Ala Gln Arg Leu Asp Pro Val Tyr Phe Val Ala Pro Ala Lys
245 250 255
Phe Leu Gly Asn Gln Gln Val Ser Tyr Gly Gln Ser Leu Ser Phe Asp
260 265 270
Tyr Arg Val Asp Arg Gly Gly Arg His Pro Ser Ala His Asp Val Ile
275 280 285
Leu Glu Gly Ala Gly Leu Arg Ile Thr Ala Pro Leu Met Pro Leu Gly
290 295 300
Lys Thr Leu Pro Cys Gly Leu Thr Lys Thr Tyr Thr Phe Arg Leu Asn
305 310 315 320
Glu His Pro Ser Asn Asn Trp Ser Pro Gln Leu Ser Tyr Phe Glu Tyr
325 330 335
Arg Arg Leu Leu Arg Asn Leu Thr Ala Leu Arg Ile Arg Ala Thr Tyr
340 345 350
Gly Glu Tyr Ser Thr Gly Tyr Ile Asp Asn Val Thr Leu Ile Ser Ala
355 360 365
Arg Pro Val Ser Gly Ala Pro Ala Pro Trp Val Glu Gln Cys Ile Cys
370 375 380
Pro Val Gly Tyr Lys Gly Gln Phe Cys Gln Asp Cys Ala Ser Gly Tyr
385 390 395 400
Lys Arg Asp Ser Ala Arg Leu Gly Pro Phe Gly Thr Cys Ile Pro Cys
405 410 415
Asn Cys Gln Gly Gly Gly Ala Cys Asp Pro Asp Thr Gly Asp Cys Tyr
420 425 430
Ser Gly Asp Glu Asn Pro Asp Ile Glu Cys Ala Asp Cys Pro Ile Gly
435 440 445
Phe Tyr Asn Asp Pro His Asp Pro Arg Ser Cys Lys Pro Cys Pro Cys
450 455 460
His Asn Gly Phe Ser Cys Ser Val Met Pro Glu Thr Glu Glu Val Val
465 470 475 480
Cys Asn Asn Cys Pro Pro Gly Val Thr Gly Ala Arg Cys Glu Leu Cys
485 490 495
Ala Asp Gly Tyr Phe Gly Asp Pro Phe Gly Glu His Gly Pro Val Arg
500 505 510
Pro Cys Gln Pro Cys Gln Cys Asn Asn Asn Val Asp Pro Ser Ala Ser
515 520 525
Gly Asn Cys Asp Arg Leu Thr Gly Arg Cys Leu Lys Cys Ile His Asn
530 535 540
Thr Ala Gly Ile Tyr Cys Asp Gln Cys Lys Ala Gly Tyr Phe Gly Asp
545 550 555 560
Pro Leu Ala Pro Asn Pro Ala Asp Lys Cys Arg Ala Cys Asn Cys Asn
565 570 575
Pro Met Gly Ser Glu Pro Val Gly Cys Arg Ser Asp Gly Thr Cys Val
580 585 590
Cys Lys Pro Gly Phe Gly Gly Pro Asn Cys Glu His Gly Ala Phe Ser
595 600 605
Cys Pro Ala Cys Tyr Asn Gln Val Lys Ile Gln Met Asp Gln Phe Met
610 615 620
Gln Gln Leu Gln Arg Met Glu Ala Leu Ile Ser Lys Ala Gln Gly Gly
625 630 635 640
Asp Gly Val Val Pro Asp Thr Glu Leu Glu Gly Arg Met Gln Gln Ala
645 650 655
Glu Gln Ala Leu Gln Asp Ile Leu Arg Asp Ala Gln Ile Ser Glu Gly
660 665 670
Ala Ser Arg Ser Leu Gly Leu Gln Leu Ala Lys Val Arg Ser Gln Glu
675 680 685
Asn Ser Tyr Gln Ser Arg Leu Asp Asp Leu Lys Met Thr Val Glu Arg
690 695 700
Val Arg Ala Leu Gly Ser Gln Tyr Gln Asn Arg Val Arg Asp Thr His
705 710 715 720
Arg Leu Ile Thr Gln Met Gln Leu Ser Leu Ala Glu Ser Glu Ala Ser
725 730 735
Leu Gly Asn Thr Asn Ile Pro Ala Ser Asp His Tyr Val Gly Pro Asn
740 745 750
Gly Phe Lys Ser Leu Ala Gln Glu Ala Thr Arg Leu Ala Glu Ser His
755 760 765
Val Glu Ser Ala Ser Asn Met Glu Gln Leu Thr Arg Glu Thr Glu Asp
770 775 780
Tyr Ser Lys Gln Ala Leu Ser Leu Val Arg Lys Ala Leu His Glu Gly
785 790 795 800
Val Gly Ser Gly Ser Gly Ser Pro Asp Gly Ala Val Val Gln Gly Leu
805 810 815
Val Glu Lys Leu Glu Lys Thr Lys Ser Leu Ala Gln Gln Leu Thr Arg
820 825 830
Glu Ala Thr Gln Ala Glu Ile Glu Ala Asp Arg Ser Tyr Gln His Ser
835 840 845
Leu Arg Leu Leu Asp Ser Val Ser Arg Leu Gln Gly Val Ser Asp Gln
850 855 860
Ser Phe Gln Val Glu Glu Ala Lys Arg Ile Lys Gln Lys Ala Asp Ser
865 870 875 880
Leu Ser Ser Leu Val Thr Arg His Met Asp Glu Phe Lys Arg Thr Gln
885 890 895
Lys Asn Leu Gly Asn Trp Lys Glu Glu Ala Gln Gln Leu Leu Gln Asn
900 905 910
Gly Lys Ser Gly Arg Glu Lys Ser Asp Gln Leu Leu Ser Arg Ala Asn
915 920 925
Leu Ala Lys Ser Arg Ala Gln Glu Ala Leu Ser Met Gly Asn Ala Thr
930 935 940
Phe Tyr Glu Val Glu Ser Ile Leu Lys Asn Leu Arg Glu Phe Asp Leu
945 950 955 960
Gln Val Asp Asn Arg Lys Ala Glu Ala Glu Glu Ala Met Lys Arg Leu
965 970 975
Ser Tyr Ile Ser Gln Lys Val Ser Asp Ala Ser Asp Lys Thr Gln Gln
980 985 990
Ala Glu Arg Ala Leu Gly Ser Ala Ala Ala Asp Ala Gln Arg Ala Lys
995 1000 1005
Asn Gly Ala Gly Glu Ala Leu Glu Ile Ser Ser Glu Ile Glu Gln Glu
1010 1015 1020
Ile Gly Ser Leu Asn Leu Glu Ala Asn Val Thr Ala Asp Gly Ala Leu
1025 1030 1035 1040
Ala Met Glu Lys Gly Leu Ala Ser Leu Lys Ser Glu Met Arg Glu Val
1045 1050 1055
Glu Gly Glu Leu Glu Arg Lys Glu Leu Glu Phe Asp Thr Asn Met Asp
1060 1065 1070
Ala Val Gln Met Val Ile Thr Glu Ala Gln Lys Val Asp Thr Arg Ala
1075 1080 1085
Lys Asn Ala Gly Val Thr Ile Gln Asp Thr Leu Asn Thr Leu Asp Gly
1090 1095 1100
Leu Leu His Leu Met Asp Gln Pro Leu Ser Val Asp Glu Glu Gly Leu
1105 1110 1115 1120
Val Leu Leu Glu Gln Lys Leu Ser Arg Ala Lys Thr Gln Ile Asn Ser
1125 1130 1135
Gln Leu Arg Pro Met Met Ser Glu Leu Glu Glu Arg Ala Arg Gln Gln
1140 1145 1150
Arg Gly His Leu His Leu Leu Glu Thr Ser Ile Asp Gly Ile Leu Ala
1155 1160 1165
Asp Val Lys Asn Leu Glu Asn Ile Arg Asp Asn Leu Pro Pro Gly Cys
1170 1175 1180
Tyr Asn Thr Gln Ala Leu Glu Gln Gln
1185 1190

<210> 10
<211> 148
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 10
gaattcgtcg attcggttgc agcatttaaa gcggttgaca actttaaaag aaggaaaaag 60
aaggttgaag aaaagggtgt agtaagtaag tataagtaca gaccggagaa gtacgccggt 120
cctgattcgt ttaatttgaa agaagaaa 148

<210> 11
<211> 491
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 11
gttattttcc accatattgc cgtcttttgg caatgtgagg gcccggaaac ctggccctgt 60
cttcttgacg agcattccta ggggtctttc ccctctcgcc aaaggaatgc aaggtctgtt 120
gaatgtcgtg aaggaagcag ttcctctgga agcttcttga agacaaacaa cgtctgtagc 180
gaccctttgc aggcagcgga accccccacc tggcgacagg tgcctctgcg gccaaaagcc 240
acgtgtataa gatacacctg caaaggcggc acaaccccag tgccacgttg tgagttggat 300
agttgtggaa agagtcaaat ggctcacctc aagcgtattc aacaaggggc tgaaggatgc 360
ccagaaggta ccccattgta tgggatctga tctggggcct cggtgcacat gctttacatg 420
tgtttagtcg aggttaaaaa gcgtctaggc cccccgaacc acggggacgt ggttttcctt 480
tgaaaaacac g 491

<210> 12
<211> 8842
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 12
atgcctcctg ctgtgcggag aagcgcctgt tctatgggat ggctgtggat ctttggcgcc 60
gctctgggac agtgtctggg ctactcttct cagcagcagc gggtgccatt tctgcagcca 120
cctggacagt ctcagctgca ggccagctac gtggaattca gacctagcca gggctgtagc 180
cccggctact acagagatca caagggcctg tacaccggca gatgcgtgcc ctgcaactgt 240
aacggccaca gcaaccagtg tcaggacggc tctggcatct gcgtgaactg ccagcataat 300
actgccggcg agcactgcga gagatgccaa gagggctact acggcaatgc cgtgcatggc 360
agctgtcggg cttgtccttg tcctcacacc aacagctttg ccaccggctg cgttgtgaac 420
ggcggagatg ttcggtgttc ttgcaaggcc ggctacacag gcacacagtg cgaaagatgt 480
gcccctggct actttggcaa ccctcagaag tttggcggct cctgccagcc ttgctcctgc 540
aattctaatg gccagctggg ctcttgtcac cctctgaccg gcgactgcat caatcaagag 600
cctaaggaca gcagccctgc cgaggaatgc gacgattgcg atagctgcgt gatgaccctg 660
ctgaacgacc tggccacaat gggagaacag ctgcggctgg ttaagagcca gctccaggga 720
ctgtctgcct ctgctggact gctggaacag atgcggcaca tggaaaccca ggccaaggac 780
ctgagaaacc agctgctgaa ctacagaagc gccatctcca accacggcag caagatcgaa 840
ggcctggaaa gagagctgac cgacctgaat caagagttcg agacactgca agagaaggcc 900
caagtgaaca gccggaaggc ccagactctg aacaacaacg tgaaccgggc cacacagtcc 960
gccaaagaac tggacgtgaa gatcaagaac gtgatccgga acgtgcacat cctgctgaag 1020
cagatcagcg gcacagatgg cgagggcaac aatgtgccta gcggcgactt tagcagagag 1080
tgggccgaag ctcagcggat gatgagagag ctgcggaacc ggaacttcgg caagcacctg 1140
agagaagccg aggccgacaa gagagagagc caactgctgc tcaaccggat cagaacctgg 1200
cagaaaaccc accagggcga gaacaacggc ctggccaaca gcatcagaga cagcctgaat 1260
gagtacgagg ccaagctgag cgatctgcgg gccagacttc aagaagctgc cgctcaggcc 1320
aagcaggcca acggccttaa tcaagagaac gagagagccc tgggcgccat ccagagacaa 1380
gtgaaagaga tcaacagcct gcagagcgac ttcaccaagt acctgaccac cgccgatagc 1440
agcctgctgc agacaaatat cgccctgcag ctcatggaaa agagccagaa agagtacgaa 1500
aagctggccg ccagcctgaa cgaggccagg caagaactgt ctgacaaagt gcgcgagctg 1560
agcagatccg ccggcaagac atctctggtg gaagaggccg agaagcacgc cagatctctg 1620
caagagctgg ccaaacagct ggaagagatt aagcggaacg ccagcggcga cgaactcgtc 1680
agatgtgcag tggatgccgc caccgcctac gagaacatcc tgaatgccat caaggccgcc 1740
gaggacgccg ctaatagagc cgcttctgct tctgagtctg ccctgcagac cgtgatcaaa 1800
gaggacctgc ctagaaaggc caagacactg agcagcaaca gcgacaaact gctgaatgag 1860
gccaagatga cccagaagaa actgaagcaa gaggtgtccc ctgcactgaa caacctgcag 1920
cagaccctga acatcgtgac cgtgcagaaa gaagtgatcg acaccaacct gacaaccctg 1980
agagatggcc tgcacggaat ccagagaggc gacatcgacg ccatgatcag cagcgccaag 2040
agcatggttc gaaaagccaa cgacatcacc gacgaggtgc tggacggcct gaatcctatc 2100
cagaccgacg tggaacggat caaggacacc tacggcagaa cccagaacga ggatttcaag 2160
aaggccctga ccgacgccga caactccgtg aacaagctga ccaacaagct gcccgatctg 2220
tggcggaaga tcgagagcat caaccagcaa ctgctccctc tgggcaacat cagcgacaac 2280
atggacagaa tccgggaact gatccagcag gccagagatg ccgcctccaa agtggctgtg 2340
cccatgagat tcaacggcaa gagcggagtg gaagtgcggc tgcccaacga tctggaagat 2400
ctgaagggct ataccagcct gagcctgttc ctgcagaggc ccaacagcag agagaatggc 2460
ggcaccgaga atatgttcgt gatgtacctg ggaaacaagg acgccagccg ggactatatc 2520
ggaatggccg ttgtggacgg ccagctgacc tgcgtgtaca acctgggaga cagagaagct 2580
gaactgcagg tcgaccagat cctgaccaag agcgagacaa aagaggccgt gatggacaga 2640
gtgaagttcc agcggatcta ccagttcgcc cggctgaatt acaccaaggg cgccacaagc 2700
agcaagcccg aaacacctgg cgtgtacgac atggacggcc ggaactctaa cactctgctg 2760
aatctggacc ccgagaacgt ggtgttttac gtcggcggct accctcctga cttcaagctg 2820
cctagcagac tgagcttccc accttacaag ggctgcatcg agctggatga cctgaacgaa 2880
aacgtgctgt ccctgtacaa cttcaaaaag accttcaacc tgaacaccac cgaggtggaa 2940
ccctgcaggc gcagaaaaga ggaatccgac aagaactact tcgaaggcac cggctacgcc 3000
agagtgccta cacaacctca cgctcccatt cctaccttcg gccagaccat ccagacaacc 3060
gtggatagag gcctgctgtt cttcgccgag aacggcgaca gattcatctc cctgaatatc 3120
gaggatggca agctgatggt ccgatacaag ctgaatagcg agctgcccaa agaaagaggc 3180
gtgggcgacg ccatcaacaa cggcagggat cacagcatcc agatcaagat cggcaaactg 3240
cagaaacgga tgtggatcaa cgtggacgtg cagaacacca tcatcgacgg cgaggtgttc 3300
gacttcagca cctactatct cggcggaatc cctatcgcca tcagagagcg gttcaatatc 3360
agcacccctg ccttccgggg ctgcatgaag aacctgaaaa agaccagcgg cgtcgtgcgg 3420
ctgaatgata cagtgggcgt gaccaagaag tgcagcgagg actggaagct tgtgcggagc 3480
gccagttttt ctagaggcgg acagctgagc tttaccgacc tgggactgcc tcctaccgat 3540
catctgcagg caagcttcgg attccagacc ttccagccaa gcggaatcct gctggaccac 3600
cagacctgga ccagaaacct gcaagtgacc ctggaagatg gctacatcga actgagcacc 3660
agcgactctg gcggccctat ctttaagagc cctcagacct acatggatgg gctgctgcac 3720
tacgtgtccg tgatcagcga taacagcggc ctgagactgc tgatcgacga ccagctcctg 3780
cggaacagca agcggctgaa gcacatctcc agcagcagac agagtctgag actcggcggc 3840
agcaatttcg agggctgtat cagcaacgtg ttcgtgcagc gcctgagtct gtctccagaa 3900
gtgctggacc tgaccagcaa tagcctgaag agggatgtgt ctctcggcgg ctgctccctg 3960
aacaaacctc ctttcctgat gctgctgaag ggcagcaccc ggttcaacaa gaccaagacc 4020
tttcggatca atcagctgct ccaggacacc cctgtggcta gccctagaag cgtgaaagtg 4080
tggcaggacg cctgcagtcc cctgcctaaa acacaggcca atcacggggc tctgcagttc 4140
ggcgatatcc ccacaagcca tctgctgttt aagctgcccc aagagctgct caagcctcgg 4200
agccagttcg ctgtggatat gcagaccacc tcctccagag gactggtgtt tcacaccggc 4260
accaagaaca gcttcatggc cctgtacctg agcaaaggca ggctggtgtt tgccctgggc 4320
accgacggaa agaaactgcg gatcaagagc aaagagaagt gcaacgacgg caagtggcac 4380
accgtggtgt tcggacacga tggcgagaaa ggcagactcg tggtggatgg cctgagagcc 4440
agagagggat ctctgcctgg caactccacc atctccatca gagcccctgt gtatctgggc 4500
agccctccta gcggaaagcc taagagcctg cctaccaact ccttcgtggg ctgtctgaag 4560
aactttcagc tggacagcaa gcctctgtac acccctagca gcagctttgg cgtgtcctcc 4620
tgtctcggag gccctctgga aaagggcatc tacttctctg aggaaggcgg ccacgttgtc 4680
ctggctcatt ctgttctgct gggccccgag ttcaagctgg tgttctctat ccggcctaga 4740
agcctgaccg gcatcctgat tcacatcggc agccagcctg ggaagcacct gtgtgtgtat 4800
ctcgaggccg gcaaagtgac cgccagcatg gattctggtg ctggcggcac aagcacctcc 4860
gtgacaccta agcagagcct gtgtgatggc cagtggcaca gtgtggccgt gacaatcaag 4920
cagcacattc tgcacctgga actggacacc gacagcagct ataccgccgg acagatccca 4980
tttcctccag ccagcacaca agagcctctg caccttggag gcgcccctgc caatctgacc 5040
acactgagaa tccccgtgtg gaagtccttc ttcggctgcc tgcggaatat ccatgtgaac 5100
cacattccag tgcctgtgac agaggccctg gaagtgcagg gacccgtgtc tctgaatgga 5160
tgccccgatc agtgagaatt cgtcgattcg gttgcagcat ttaaagcggt tgacaacttt 5220
aaaagaagga aaaagaaggt tgaagaaaag ggtgtagtaa gtaagtataa gtacagaccg 5280
gagaagtacg ccggtcctga ttcgtttaat ttgaaagaag aaaatgaggc ccttcttcct 5340
gctgtgcttt gccctgcctg gactgctgca tgctcagcag gcttgtagca gaggcgcctg 5400
ctatcctcct gtgggcgatc tgcttgtggg cagaaccaga ttcctgcggg ccagctctac 5460
atgcggcctg acaaagcctg agacatactg cacccagtac ggcgagtggc agatgaagtg 5520
ctgcaagtgc gacagcagac agccccacaa ctactacagc cacagagtgg aaaacgtggc 5580
cagcagcagc ggccctatga gatggtggca gagccagaac gacgtgaacc ccgttagcct 5640
gcagctggac ctggacagac ggtttcagct gcaagaagtg atgatggaat ttcagggccc 5700
catgcctgcc ggcatgctga tcgagagaag cagcgatttc ggcaagacct ggcgggtgta 5760
ccagtatctg gccgccgatt gcaccagcac attccccaga gttagacagg gcagacccca 5820
gagctggcag gatgttcgtt gtcagtctct gccccagcgg cctaacgcta gactgaatgg 5880
cggaaaggtg cagctcaacc tgatggacct ggtgtctggc atccctgcca cacagtccca 5940
gaaaatccaa gaagtgggcg agatcaccaa cctgagagtg aacttcaccc ggctggctcc 6000
cgttcctcag agaggatatc atcctcctag cgcctactac gccgtgtctc agcttagact 6060
gcagggcagc tgcttctgtc acggccacgc tgatagatgc gcccctaaac ctggtgcctc 6120
tgccggacct tctacagccg tgcaagtgca cgatgtgtgc gtgtgccagc acaataccgc 6180
cggacctaac tgcgagagat gtgccccttt ctacaacaac cggccttgga ggcctgccga 6240
aggacaggat gctcacgagt gccagagatg cgactgcaac ggccacagcg agacatgcca 6300
ctttgaccct gccgtgtttg ccgcttctca gggcgcttat ggcggcgtgt gtgacaactg 6360
cagagatcac accgagggca agaactgcga gcgctgtcag ctgcactact tccggaatag 6420
aaggccaggc gccagcatcc aagagacatg catcagctgc gagtgcgatc ccgatggtgc 6480
tgttcctggc gctccttgtg atcctgtgac aggccagtgc gtgtgtaaag aacacgtgca 6540
gggcgaaaga tgcgacctgt gcaagcctgg ctttaccggc ctgacctacg ccaatcctca 6600
gggctgccac agatgtgatt gcaacatcct gggcagcaga cgggacatgc cctgtgatga 6660
agagtctggc agatgcctgt gcctgcctaa tgtcgtgggc cccaagtgcg atcagtgtgc 6720
cccatatcac tggaagctgg cctctggcca gggatgcgaa ccttgtgcct gcgatcccca 6780
caacagcctg tctccacagt gcaaccagtt caccggccag tgtccttgca gagaaggctt 6840
tggcggcctg atgtgttctg ccgccgctat cagacagtgc cccgatagaa catatggcga 6900
cgtggccaca ggctgcagag cctgcgattg tgacttccgg ggaacagaag gacccggctg 6960
cgataaggcc agcggaagat gtctgtgtcg gcctggactc acaggcccca gatgtgacca 7020
gtgtcagcgg ggctactgca acagataccc tgtgtgtgtg gcctgccatc cttgcttcca 7080
gacctacgac gccgacctga gagaacaggc cctgagattc ggcagactga gaaatgccac 7140
cgccagcctt tggagcggac ctggccttga agatagaggc ctggcctcca gaatcctgga 7200
cgccaagtct aagatcgagc agatcagagc cgtgctgtct agcccagccg tgaccgaaca 7260
agaggtggcc caagtggcta gcgccatcct gagcctgaga agaactctgc agggactgca 7320
gctcgatctg cccctggaag aggaaacact gagcctgcct agagatctgg aaagcctgga 7380
tcggagcttc aacggcctgc tgacaatgta ccagagaaag agagagcagt tcgagaagat 7440
cagcagcgcc gatcctagcg gcgccttcag aatgctgagc acagcctatg agcagagcgc 7500
ccaggctgct cagcaagtgt ccgatagcag cagactgctg gaccagctgc gggactctag 7560
aagagaagcc gaaagacttg tgcggcaggc aggcggcgga ggtggaacag gatctcctaa 7620
actggtggcc ctgcggctgg aaatgtcctc tctgcctgat ctgaccccta ccttcaacaa 7680
gctgtgcggc aacagccggc agatggcctg cacacctatt agctgtcctg gcgagctgtg 7740
ccctcaggat aatggaaccg cctgcggctc cagatgtaga ggcgttttgc caagagccgg 7800
cggagccttt ctgatggctg gacaagttgc cgagcagctg agaggcttca acgctcagct 7860
gcagcggacc agacagatga ttagagccgc cgaggaaagc gccagccaga ttcaatctag 7920
cgcccagaga ctggaaaccc aggtgtccgc cagcagatcc cagatggaag aagatgtgcg 7980
gcggacaaga ctgctgatcc agcaagtgcg ggacttcctg accgatcctg ataccgatgc 8040
cgccacaatc caagaggtgt ccgaagctgt tctggcactg tggctgccta ccgatagcgc 8100
tacagtgctg cagaagatga acgagatcca ggcaatcgcc gccagactgc ccaatgtgga 8160
tctggtgctg agccagacca agcaggatat cgccagagct agaaggctgc aggccgaggc 8220
cgaagaggca agatctagag cccatgccgt ggaaggccaa gtcgaggacg ttgtgggcaa 8280
tctgagacag ggaaccgtgg ctctgcaaga ggcccaggat acaatgcagg gcaccagcag 8340
aagcctgcgc ctgatccagg atagagtggc cgaagtgcag caggtcctga ggccagccga 8400
aaagctggtc accagcatga ccaaacagct gggcgatttc tggacgcgca tggaagaact 8460
gaggcatcag gcaagacagc agggcgctga agcagtgcag gctcaacaac ttgccgaggg 8520
cgcttctgaa caggctctgt ctgcccaaga gggcttcgag cggatcaagc agaagtacgc 8580
cgagctgaag gacagactgg gccagagttc tatgctgggc gaacagggcg ccagaattca 8640
gagcgtgaaa acagaggccg aggaactgtt cggcgagaca atggaaatga tggaccggat 8700
gaaggacatg gaactggaac tgctgagggg cagccaggcc atcatgctga gaagtgccga 8760
tctgacaggc ctggaaaaga gagtggaaca gatccgggac cacatcaacg gccgggtgct 8820
gtactacgcc acatgcaagt aa 8842

<210> 13
<211> 12572
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 13
atgcctcctg ctgtgcggag aagcgcctgt tctatgggat ggctgtggat ctttggcgcc 60
gctctgggac agtgtctggg ctactcttct cagcagcagc gggtgccatt tctgcagcca 120
cctggacagt ctcagctgca ggccagctac gtggaattca gacctagcca gggctgtagc 180
cccggctact acagagatca caagggcctg tacaccggca gatgcgtgcc ctgcaactgt 240
aacggccaca gcaaccagtg tcaggacggc tctggcatct gcgtgaactg ccagcataat 300
actgccggcg agcactgcga gagatgccaa gagggctact acggcaatgc cgtgcatggc 360
agctgtcggg cttgtccttg tcctcacacc aacagctttg ccaccggctg cgttgtgaac 420
ggcggagatg ttcggtgttc ttgcaaggcc ggctacacag gcacacagtg cgaaagatgt 480
gcccctggct actttggcaa ccctcagaag tttggcggct cctgccagcc ttgctcctgc 540
aattctaatg gccagctggg ctcttgtcac cctctgaccg gcgactgcat caatcaagag 600
cctaaggaca gcagccctgc cgaggaatgc gacgattgcg atagctgcgt gatgaccctg 660
ctgaacgacc tggccacaat gggagaacag ctgcggctgg ttaagagcca gctccaggga 720
ctgtctgcct ctgctggact gctggaacag atgcggcaca tggaaaccca ggccaaggac 780
ctgagaaacc agctgctgaa ctacagaagc gccatctcca accacggcag caagatcgaa 840
ggcctggaaa gagagctgac cgacctgaat caagagttcg agacactgca agagaaggcc 900
caagtgaaca gccggaaggc ccagactctg aacaacaacg tgaaccgggc cacacagtcc 960
gccaaagaac tggacgtgaa gatcaagaac gtgatccgga acgtgcacat cctgctgaag 1020
cagatcagcg gcacagatgg cgagggcaac aatgtgccta gcggcgactt tagcagagag 1080
tgggccgaag ctcagcggat gatgagagag ctgcggaacc ggaacttcgg caagcacctg 1140
agagaagccg aggccgacaa gagagagagc caactgctgc tcaaccggat cagaacctgg 1200
cagaaaaccc accagggcga gaacaacggc ctggccaaca gcatcagaga cagcctgaat 1260
gagtacgagg ccaagctgag cgatctgcgg gccagacttc aagaagctgc cgctcaggcc 1320
aagcaggcca acggccttaa tcaagagaac gagagagccc tgggcgccat ccagagacaa 1380
gtgaaagaga tcaacagcct gcagagcgac ttcaccaagt acctgaccac cgccgatagc 1440
agcctgctgc agacaaatat cgccctgcag ctcatggaaa agagccagaa agagtacgaa 1500
aagctggccg ccagcctgaa cgaggccagg caagaactgt ctgacaaagt gcgcgagctg 1560
agcagatccg ccggcaagac atctctggtg gaagaggccg agaagcacgc cagatctctg 1620
caagagctgg ccaaacagct ggaagagatt aagcggaacg ccagcggcga cgaactcgtc 1680
agatgtgcag tggatgccgc caccgcctac gagaacatcc tgaatgccat caaggccgcc 1740
gaggacgccg ctaatagagc cgcttctgct tctgagtctg ccctgcagac cgtgatcaaa 1800
gaggacctgc ctagaaaggc caagacactg agcagcaaca gcgacaaact gctgaatgag 1860
gccaagatga cccagaagaa actgaagcaa gaggtgtccc ctgcactgaa caacctgcag 1920
cagaccctga acatcgtgac cgtgcagaaa gaagtgatcg acaccaacct gacaaccctg 1980
agagatggcc tgcacggaat ccagagaggc gacatcgacg ccatgatcag cagcgccaag 2040
agcatggttc gaaaagccaa cgacatcacc gacgaggtgc tggacggcct gaatcctatc 2100
cagaccgacg tggaacggat caaggacacc tacggcagaa cccagaacga ggatttcaag 2160
aaggccctga ccgacgccga caactccgtg aacaagctga ccaacaagct gcccgatctg 2220
tggcggaaga tcgagagcat caaccagcaa ctgctccctc tgggcaacat cagcgacaac 2280
atggacagaa tccgggaact gatccagcag gccagagatg ccgcctccaa agtggctgtg 2340
cccatgagat tcaacggcaa gagcggagtg gaagtgcggc tgcccaacga tctggaagat 2400
ctgaagggct ataccagcct gagcctgttc ctgcagaggc ccaacagcag agagaatggc 2460
ggcaccgaga atatgttcgt gatgtacctg ggaaacaagg acgccagccg ggactatatc 2520
ggaatggccg ttgtggacgg ccagctgacc tgcgtgtaca acctgggaga cagagaagct 2580
gaactgcagg tcgaccagat cctgaccaag agcgagacaa aagaggccgt gatggacaga 2640
gtgaagttcc agcggatcta ccagttcgcc cggctgaatt acaccaaggg cgccacaagc 2700
agcaagcccg aaacacctgg cgtgtacgac atggacggcc ggaactctaa cactctgctg 2760
aatctggacc ccgagaacgt ggtgttttac gtcggcggct accctcctga cttcaagctg 2820
cctagcagac tgagcttccc accttacaag ggctgcatcg agctggatga cctgaacgaa 2880
aacgtgctgt ccctgtacaa cttcaaaaag accttcaacc tgaacaccac cgaggtggaa 2940
ccctgcaggc gcagaaaaga ggaatccgac aagaactact tcgaaggcac cggctacgcc 3000
agagtgccta cacaacctca cgctcccatt cctaccttcg gccagaccat ccagacaacc 3060
gtggatagag gcctgctgtt cttcgccgag aacggcgaca gattcatctc cctgaatatc 3120
gaggatggca agctgatggt ccgatacaag ctgaatagcg agctgcccaa agaaagaggc 3180
gtgggcgacg ccatcaacaa cggcagggat cacagcatcc agatcaagat cggcaaactg 3240
cagaaacgga tgtggatcaa cgtggacgtg cagaacacca tcatcgacgg cgaggtgttc 3300
gacttcagca cctactatct cggcggaatc cctatcgcca tcagagagcg gttcaatatc 3360
agcacccctg ccttccgggg ctgcatgaag aacctgaaaa agaccagcgg cgtcgtgcgg 3420
ctgaatgata cagtgggcgt gaccaagaag tgcagcgagg actggaagct tgtgcggagc 3480
gccagttttt ctagaggcgg acagctgagc tttaccgacc tgggactgcc tcctaccgat 3540
catctgcagg caagcttcgg attccagacc ttccagccaa gcggaatcct gctggaccac 3600
cagacctgga ccagaaacct gcaagtgacc ctggaagatg gctacatcga actgagcacc 3660
agcgactctg gcggccctat ctttaagagc cctcagacct acatggatgg gctgctgcac 3720
tacgtgtccg tgatcagcga taacagcggc ctgagactgc tgatcgacga ccagctcctg 3780
cggaacagca agcggctgaa gcacatctcc agcagcagac agagtctgag actcggcggc 3840
agcaatttcg agggctgtat cagcaacgtg ttcgtgcagc gcctgagtct gtctccagaa 3900
gtgctggacc tgaccagcaa tagcctgaag agggatgtgt ctctcggcgg ctgctccctg 3960
aacaaacctc ctttcctgat gctgctgaag ggcagcaccc ggttcaacaa gaccaagacc 4020
tttcggatca atcagctgct ccaggacacc cctgtggcta gccctagaag cgtgaaagtg 4080
tggcaggacg cctgcagtcc cctgcctaaa acacaggcca atcacggggc tctgcagttc 4140
ggcgatatcc ccacaagcca tctgctgttt aagctgcccc aagagctgct caagcctcgg 4200
agccagttcg ctgtggatat gcagaccacc tcctccagag gactggtgtt tcacaccggc 4260
accaagaaca gcttcatggc cctgtacctg agcaaaggca ggctggtgtt tgccctgggc 4320
accgacggaa agaaactgcg gatcaagagc aaagagaagt gcaacgacgg caagtggcac 4380
accgtggtgt tcggacacga tggcgagaaa ggcagactcg tggtggatgg cctgagagcc 4440
agagagggat ctctgcctgg caactccacc atctccatca gagcccctgt gtatctgggc 4500
agccctccta gcggaaagcc taagagcctg cctaccaact ccttcgtggg ctgtctgaag 4560
aactttcagc tggacagcaa gcctctgtac acccctagca gcagctttgg cgtgtcctcc 4620
tgtctcggag gccctctgga aaagggcatc tacttctctg aggaaggcgg ccacgttgtc 4680
ctggctcatt ctgttctgct gggccccgag ttcaagctgg tgttctctat ccggcctaga 4740
agcctgaccg gcatcctgat tcacatcggc agccagcctg ggaagcacct gtgtgtgtat 4800
ctcgaggccg gcaaagtgac cgccagcatg gattctggtg ctggcggcac aagcacctcc 4860
gtgacaccta agcagagcct gtgtgatggc cagtggcaca gtgtggccgt gacaatcaag 4920
cagcacattc tgcacctgga actggacacc gacagcagct ataccgccgg acagatccca 4980
tttcctccag ccagcacaca agagcctctg caccttggag gcgcccctgc caatctgacc 5040
acactgagaa tccccgtgtg gaagtccttc ttcggctgcc tgcggaatat ccatgtgaac 5100
cacattccag tgcctgtgac agaggccctg gaagtgcagg gacccgtgtc tctgaatgga 5160
tgccccgatc agtgagaatt cgtcgattcg gttgcagcat ttaaagcggt tgacaacttt 5220
aaaagaagga aaaagaaggt tgaagaaaag ggtgtagtaa gtaagtataa gtacagaccg 5280
gagaagtacg ccggtcctga ttcgtttaat ttgaaagaag aaaatgaggc ccttcttcct 5340
gctgtgcttt gccctgcctg gactgctgca tgctcagcag gcttgtagca gaggcgcctg 5400
ctatcctcct gtgggcgatc tgcttgtggg cagaaccaga ttcctgcggg ccagctctac 5460
atgcggcctg acaaagcctg agacatactg cacccagtac ggcgagtggc agatgaagtg 5520
ctgcaagtgc gacagcagac agccccacaa ctactacagc cacagagtgg aaaacgtggc 5580
cagcagcagc ggccctatga gatggtggca gagccagaac gacgtgaacc ccgttagcct 5640
gcagctggac ctggacagac ggtttcagct gcaagaagtg atgatggaat ttcagggccc 5700
catgcctgcc ggcatgctga tcgagagaag cagcgatttc ggcaagacct ggcgggtgta 5760
ccagtatctg gccgccgatt gcaccagcac attccccaga gttagacagg gcagacccca 5820
gagctggcag gatgttcgtt gtcagtctct gccccagcgg cctaacgcta gactgaatgg 5880
cggaaaggtg cagctcaacc tgatggacct ggtgtctggc atccctgcca cacagtccca 5940
gaaaatccaa gaagtgggcg agatcaccaa cctgagagtg aacttcaccc ggctggctcc 6000
cgttcctcag agaggatatc atcctcctag cgcctactac gccgtgtctc agcttagact 6060
gcagggcagc tgcttctgtc acggccacgc tgatagatgc gcccctaaac ctggtgcctc 6120
tgccggacct tctacagccg tgcaagtgca cgatgtgtgc gtgtgccagc acaataccgc 6180
cggacctaac tgcgagagat gtgccccttt ctacaacaac cggccttgga ggcctgccga 6240
aggacaggat gctcacgagt gccagagatg cgactgcaac ggccacagcg agacatgcca 6300
ctttgaccct gccgtgtttg ccgcttctca gggcgcttat ggcggcgtgt gtgacaactg 6360
cagagatcac accgagggca agaactgcga gcgctgtcag ctgcactact tccggaatag 6420
aaggccaggc gccagcatcc aagagacatg catcagctgc gagtgcgatc ccgatggtgc 6480
tgttcctggc gctccttgtg atcctgtgac aggccagtgc gtgtgtaaag aacacgtgca 6540
gggcgaaaga tgcgacctgt gcaagcctgg ctttaccggc ctgacctacg ccaatcctca 6600
gggctgccac agatgtgatt gcaacatcct gggcagcaga cgggacatgc cctgtgatga 6660
agagtctggc agatgcctgt gcctgcctaa tgtcgtgggc cccaagtgcg atcagtgtgc 6720
cccatatcac tggaagctgg cctctggcca gggatgcgaa ccttgtgcct gcgatcccca 6780
caacagcctg tctccacagt gcaaccagtt caccggccag tgtccttgca gagaaggctt 6840
tggcggcctg atgtgttctg ccgccgctat cagacagtgc cccgatagaa catatggcga 6900
cgtggccaca ggctgcagag cctgcgattg tgacttccgg ggaacagaag gacccggctg 6960
cgataaggcc agcggaagat gtctgtgtcg gcctggactc acaggcccca gatgtgacca 7020
gtgtcagcgg ggctactgca acagataccc tgtgtgtgtg gcctgccatc cttgcttcca 7080
gacctacgac gccgacctga gagaacaggc cctgagattc ggcagactga gaaatgccac 7140
cgccagcctt tggagcggac ctggccttga agatagaggc ctggcctcca gaatcctgga 7200
cgccaagtct aagatcgagc agatcagagc cgtgctgtct agcccagccg tgaccgaaca 7260
agaggtggcc caagtggcta gcgccatcct gagcctgaga agaactctgc agggactgca 7320
gctcgatctg cccctggaag aggaaacact gagcctgcct agagatctgg aaagcctgga 7380
tcggagcttc aacggcctgc tgacaatgta ccagagaaag agagagcagt tcgagaagat 7440
cagcagcgcc gatcctagcg gcgccttcag aatgctgagc acagcctatg agcagagcgc 7500
ccaggctgct cagcaagtgt ccgatagcag cagactgctg gaccagctgc gggactctag 7560
aagagaagcc gaaagacttg tgcggcaggc aggcggcgga ggtggaacag gatctcctaa 7620
actggtggcc ctgcggctgg aaatgtcctc tctgcctgat ctgaccccta ccttcaacaa 7680
gctgtgcggc aacagccggc agatggcctg cacacctatt agctgtcctg gcgagctgtg 7740
ccctcaggat aatggaaccg cctgcggctc cagatgtaga ggcgttttgc caagagccgg 7800
cggagccttt ctgatggctg gacaagttgc cgagcagctg agaggcttca acgctcagct 7860
gcagcggacc agacagatga ttagagccgc cgaggaaagc gccagccaga ttcaatctag 7920
cgcccagaga ctggaaaccc aggtgtccgc cagcagatcc cagatggaag aagatgtgcg 7980
gcggacaaga ctgctgatcc agcaagtgcg ggacttcctg accgatcctg ataccgatgc 8040
cgccacaatc caagaggtgt ccgaagctgt tctggcactg tggctgccta ccgatagcgc 8100
tacagtgctg cagaagatga acgagatcca ggcaatcgcc gccagactgc ccaatgtgga 8160
tctggtgctg agccagacca agcaggatat cgccagagct agaaggctgc aggccgaggc 8220
cgaagaggca agatctagag cccatgccgt ggaaggccaa gtcgaggacg ttgtgggcaa 8280
tctgagacag ggaaccgtgg ctctgcaaga ggcccaggat acaatgcagg gcaccagcag 8340
aagcctgcgc ctgatccagg atagagtggc cgaagtgcag caggtcctga ggccagccga 8400
aaagctggtc accagcatga ccaaacagct gggcgatttc tggacgcgca tggaagaact 8460
gaggcatcag gcaagacagc agggcgctga agcagtgcag gctcaacaac ttgccgaggg 8520
cgcttctgaa caggctctgt ctgcccaaga gggcttcgag cggatcaagc agaagtacgc 8580
cgagctgaag gacagactgg gccagagttc tatgctgggc gaacagggcg ccagaattca 8640
gagcgtgaaa acagaggccg aggaactgtt cggcgagaca atggaaatga tggaccggat 8700
gaaggacatg gaactggaac tgctgagggg cagccaggcc atcatgctga gaagtgccga 8760
tctgacaggc ctggaaaaga gagtggaaca gatccgggac cacatcaacg gccgggtgct 8820
gtactacgcc acatgcaagt aagaattcgt cgattcggtt gcagcattta aagcggttga 8880
caactttaaa agaaggaaaa agaaggttga agaaaagggt gtagtaagta agtataagta 8940
cagaccggag aagtacgccg gtcctgattc gtttaatttg aaagaagaaa atgcctgctc 9000
tgtggctggg ctgctgcctg tgttttagtc tgctgctgcc agccgccaga gccacatcta 9060
gaagagaagt gtgcgactgc aacggcaaga gccggcagtg catcttcgac agagagctgc 9120
acagacagac cggcaacggc ttcagatgcc tgaactgcaa cgacaacacc gacggcatcc 9180
actgcgagaa gtgcaagaac ggcttctacc ggcaccgcga gagggataga tgcctgcctt 9240
gcaactgcaa ctccaagggc agcctgagcg ccagatgcga caatagcggc agatgtagct 9300
gcaagcctgg cgtgacaggc gctagatgcg atagatgtct ccccggcttc cacatgctga 9360
ccgatgccgg atgtacccag gaccagagac tgctggacag caagtgcgat tgcgaccctg 9420
ccggaattgc cggaccttgt gatgccggaa gatgcgtgtg taaacctgcc gtgaccggcg 9480
agagatgtga cagatgtaga agcggctact acaacctgga cggcggcaat cctgaaggct 9540
gcacccagtg cttttgctac ggccacagcg ccagctgtag aagcagcgcc gaatactccg 9600
tgcacaagat caccagcacc ttccaccagg atgtggacgg atggaaggcc gtgcagagaa 9660
atggctctcc tgccaagctg cagtggtccc agagacacca ggacgtgttc agcagcgctc 9720
agagactgga ccccgtgtac tttgtggccc ctgccaagtt cctgggcaac cagcaagtgt 9780
cttacggcca gagcctgagc ttcgactaca gagtggatag aggcggcaga caccccagcg 9840
ctcacgatgt gattcttgaa ggcgccggac tgcggatcac agcccctctt atgcctctgg 9900
gcaagaccct gccttgtggc ctgaccaaga cctacacctt ccggctgaat gagcacccca 9960
gcaacaactg gtccccacag ctgagctact tcgagtacag acggctgctg cggaacctga 10020
cagccctgag aatcagagcc acctacggcg agtacagcac cggctacatc gacaacgtga 10080
ccctgatcag cgccagacct gtttctggtg ctcctgctcc ttgggtcgag cagtgtatct 10140
gtcccgtggg ctacaagggc cagttctgcc aggattgtgc cagcggctac aagagagact 10200
ctgccagact gggccccttc ggcacatgca tcccttgtaa ttgtcaaggc ggcggagcct 10260
gcgatcccga tacaggcgat tgctacagcg gcgacgagaa ccccgatatc gagtgcgccg 10320
attgtcccat cggcttttac aacgaccctc acgaccccag atcctgcaag ccatgtcctt 10380
gccacaatgg cttcagctgc agcgtgatgc ccgaaaccga agaggtcgtg tgcaacaatt 10440
gcccaccagg cgttacaggg gccagatgtg aactgtgtgc cgacggctac ttcggcgatc 10500
cttttggaga acacggaccc gtgcgacctt gccagccttg tcagtgcaac aacaacgtgg 10560
acccaagcgc cagcggcaac tgcgatagac tgacaggcag atgtctgaag tgcatccaca 10620
ataccgccgg gatctactgt gaccagtgca aggccggcta ttttggcgac cctctggctc 10680
ccaatcctgc cgataagtgc agagcctgca actgtaaccc tatgggctct gagcctgtgg 10740
gctgcagatc tgatggaacc tgcgtgtgca agccaggctt tggcggacct aattgtgaac 10800
acggcgcctt tagctgcccc gcctgctaca atcaagtgaa gatccagatg gaccagttca 10860
tgcagcagct gcagaggatg gaagccctga tctctaaagc ccaaggcgga gatggcgtgg 10920
tgcctgatac agagctggaa ggcagaatgc agcaggccga acaggccctg caggacattc 10980
tgagagatgc ccagattagc gagggcgcct ctagaagtct gggactgcag ctggctaaag 11040
tgcggagcca agagaacagc taccagagca gactggacga cctgaagatg accgtggaaa 11100
gagtcagagc cctgggcagc cagtaccaga acagagtgcg ggatacccac cggctgatca 11160
cccagatgca actgtctctg gccgagagcg aagccagcct gggcaatacc aatattcccg 11220
ccagcgacca ctacgtgggc cccaacggtt ttaagagcct ggctcaagag gccaccagac 11280
tggccgaaag ccatgtggaa agcgcctcca acatggaaca gctgacccgg gaaaccgagg 11340
actactctaa gcaggccctg agcctcgtca gaaaagccct gcatgaaggc gtcggcagcg 11400
gctctggatc tcctgatggt gctgtggtgc agggactcgt ggaaaagctg gaaaagacca 11460
aatctctggc ccagcagctg accagagaag ccacacaggc cgagatcgag gccgacagaa 11520
gctaccagca ctcactgagg ctgctggact ccgtgtctag actgcagggc gtgtccgacc 11580
agagcttcca ggtggaagag gccaagcgga tcaagcagaa ggccgatagc ctgagcagcc 11640
tggtcaccag acacatggac gagttcaagc ggacccagaa gaacctcggc aactggaaag 11700
aggaagccca gcaactgctg cagaacggca agtctggaag agagaagtct gaccagctgc 11760
tgagcagagc caacctggcc aagtctagag cccaagaggc cctgtctatg ggcaacgcca 11820
ccttctacga ggtggaatcc atcctgaaga acctgcgcga gttcgacctg caagtggaca 11880
acagaaaggc cgaggccgag gaagccatga agagactgag ctacatcagc cagaaagtgt 11940
ccgacgcctc cgacaagaca cagcaggcag aaagagcact gggatctgcc gcagccgatg 12000
ctcagagagc taaaaacggc gctggcgagg ccctggaaat cagctctgag atcgagcaag 12060
agatcggctc cctgaatctg gaagccaatg tgacagccga tggcgccctg gccatggaaa 12120
aaggactggc ctctctgaag tccgagatga gagaggtgga aggcgagctg gaacggaaag 12180
aactggaatt cgacaccaat atggacgctg tgcagatggt catcacagag gcccagaagg 12240
tggacaccag agccaaaaat gccggcgtga ccatccagga caccctgaat actctggacg 12300
gactgctgca cctgatggat cagcctctga gcgtggacga ggaaggactg gttctgctgg 12360
aacagaagct gagccgggcc aagactcaga tcaacagcca gctgaggccc atgatgagcg 12420
aactggaaga acgggccaga cagcagaggg gccatctgca tctgctcgaa accagcatcg 12480
atggcatcct ggccgacgtg aagaatctcg agaacatccg ggacaacctg ccacctggct 12540
gctacaacac acaggcactg gaacagcagt ga 12572

<210> 14
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 14
agggccaaga ggggcagcgg cgagggcagg ggcagcctgc tgacctgcgg cgacgtggag 60
gagaaccccg gcccc 75

<210> 15
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 15
ggaagcggag ctactaactt cagcctgctg aagcaggctg gagacgtgga ggagaaccct 60
ggacct 66

<210> 16
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 16
ggaagcggac agtgtactaa ttatgctctc ttgaaattgg ctggagatgt tgagagcaac 60
cctggacct 69

<210> 17
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 17
ggaagcggag tgaaacagac tttgaatttt gaccttctca agttggcggg agacgtggag 60
tccaaccctg gacct 75

<210> 18
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 18
Arg Ala Lys Arg Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys
1 5 10 15
Gly Asp Val Glu Glu Asn Pro Gly Pro
20 25

<210> 19
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 19
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
1 5 10 15
Glu Glu Asn Pro Gly Pro
20

<210> 20
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 20
Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp
1 5 10 15
Val Glu Ser Asn Pro Gly Pro
20

<210> 21
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 21
Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala
1 5 10 15
Gly Asp Val Glu Ser Asn Pro Gly Pro
20 25

<210> 22
<211> 8766
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 22
atgcctcctg ctgtgcggag aagcgcctgt tctatgggat ggctgtggat ctttggcgcc 60
gctctgggac agtgtctggg ctactcttct cagcagcagc gggtgccatt tctgcagcca 120
cctggacagt ctcagctgca ggccagctac gtggaattca gacctagcca gggctgtagc 180
cccggctact acagagatca caagggcctg tacaccggca gatgcgtgcc ctgcaactgt 240
aacggccaca gcaaccagtg tcaggacggc tctggcatct gcgtgaactg ccagcataat 300
actgccggcg agcactgcga gagatgccaa gagggctact acggcaatgc cgtgcatggc 360
agctgtcggg cttgtccttg tcctcacacc aacagctttg ccaccggctg cgttgtgaac 420
ggcggagatg ttcggtgttc ttgcaaggcc ggctacacag gcacacagtg cgaaagatgt 480
gcccctggct actttggcaa ccctcagaag tttggcggct cctgccagcc ttgctcctgc 540
aattctaatg gccagctggg ctcttgtcac cctctgaccg gcgactgcat caatcaagag 600
cctaaggaca gcagccctgc cgaggaatgc gacgattgcg atagctgcgt gatgaccctg 660
ctgaacgacc tggccacaat gggagaacag ctgcggctgg ttaagagcca gctccaggga 720
ctgtctgcct ctgctggact gctggaacag atgcggcaca tggaaaccca ggccaaggac 780
ctgagaaacc agctgctgaa ctacagaagc gccatctcca accacggcag caagatcgaa 840
ggcctggaaa gagagctgac cgacctgaat caagagttcg agacactgca agagaaggcc 900
caagtgaaca gccggaaggc ccagactctg aacaacaacg tgaaccgggc cacacagtcc 960
gccaaagaac tggacgtgaa gatcaagaac gtgatccgga acgtgcacat cctgctgaag 1020
cagatcagcg gcacagatgg cgagggcaac aatgtgccta gcggcgactt tagcagagag 1080
tgggccgaag ctcagcggat gatgagagag ctgcggaacc ggaacttcgg caagcacctg 1140
agagaagccg aggccgacaa gagagagagc caactgctgc tcaaccggat cagaacctgg 1200
cagaaaaccc accagggcga gaacaacggc ctggccaaca gcatcagaga cagcctgaat 1260
gagtacgagg ccaagctgag cgatctgcgg gccagacttc aagaagctgc cgctcaggcc 1320
aagcaggcca acggccttaa tcaagagaac gagagagccc tgggcgccat ccagagacaa 1380
gtgaaagaga tcaacagcct gcagagcgac ttcaccaagt acctgaccac cgccgatagc 1440
agcctgctgc agacaaatat cgccctgcag ctcatggaaa agagccagaa agagtacgaa 1500
aagctggccg ccagcctgaa cgaggccagg caagaactgt ctgacaaagt gcgcgagctg 1560
agcagatccg ccggcaagac atctctggtg gaagaggccg agaagcacgc cagatctctg 1620
caagagctgg ccaaacagct ggaagagatt aagcggaacg ccagcggcga cgaactcgtc 1680
agatgtgcag tggatgccgc caccgcctac gagaacatcc tgaatgccat caaggccgcc 1740
gaggacgccg ctaatagagc cgcttctgct tctgagtctg ccctgcagac cgtgatcaaa 1800
gaggacctgc ctagaaaggc caagacactg agcagcaaca gcgacaaact gctgaatgag 1860
gccaagatga cccagaagaa actgaagcaa gaggtgtccc ctgcactgaa caacctgcag 1920
cagaccctga acatcgtgac cgtgcagaaa gaagtgatcg acaccaacct gacaaccctg 1980
agagatggcc tgcacggaat ccagagaggc gacatcgacg ccatgatcag cagcgccaag 2040
agcatggttc gaaaagccaa cgacatcacc gacgaggtgc tggacggcct gaatcctatc 2100
cagaccgacg tggaacggat caaggacacc tacggcagaa cccagaacga ggatttcaag 2160
aaggccctga ccgacgccga caactccgtg aacaagctga ccaacaagct gcccgatctg 2220
tggcggaaga tcgagagcat caaccagcaa ctgctccctc tgggcaacat cagcgacaac 2280
atggacagaa tccgggaact gatccagcag gccagagatg ccgcctccaa agtggctgtg 2340
cccatgagat tcaacggcaa gagcggagtg gaagtgcggc tgcccaacga tctggaagat 2400
ctgaagggct ataccagcct gagcctgttc ctgcagaggc ccaacagcag agagaatggc 2460
ggcaccgaga atatgttcgt gatgtacctg ggaaacaagg acgccagccg ggactatatc 2520
ggaatggccg ttgtggacgg ccagctgacc tgcgtgtaca acctgggaga cagagaagct 2580
gaactgcagg tcgaccagat cctgaccaag agcgagacaa aagaggccgt gatggacaga 2640
gtgaagttcc agcggatcta ccagttcgcc cggctgaatt acaccaaggg cgccacaagc 2700
agcaagcccg aaacacctgg cgtgtacgac atggacggcc ggaactctaa cactctgctg 2760
aatctggacc ccgagaacgt ggtgttttac gtcggcggct accctcctga cttcaagctg 2820
cctagcagac tgagcttccc accttacaag ggctgcatcg agctggatga cctgaacgaa 2880
aacgtgctgt ccctgtacaa cttcaaaaag accttcaacc tgaacaccac cgaggtggaa 2940
ccctgcaggc gcagaaaaga ggaatccgac aagaactact tcgaaggcac cggctacgcc 3000
agagtgccta cacaacctca cgctcccatt cctaccttcg gccagaccat ccagacaacc 3060
gtggatagag gcctgctgtt cttcgccgag aacggcgaca gattcatctc cctgaatatc 3120
gaggatggca agctgatggt ccgatacaag ctgaatagcg agctgcccaa agaaagaggc 3180
gtgggcgacg ccatcaacaa cggcagggat cacagcatcc agatcaagat cggcaaactg 3240
cagaaacgga tgtggatcaa cgtggacgtg cagaacacca tcatcgacgg cgaggtgttc 3300
gacttcagca cctactatct cggcggaatc cctatcgcca tcagagagcg gttcaatatc 3360
agcacccctg ccttccgggg ctgcatgaag aacctgaaaa agaccagcgg cgtcgtgcgg 3420
ctgaatgata cagtgggcgt gaccaagaag tgcagcgagg actggaagct tgtgcggagc 3480
gccagttttt ctagaggcgg acagctgagc tttaccgacc tgggactgcc tcctaccgat 3540
catctgcagg caagcttcgg attccagacc ttccagccaa gcggaatcct gctggaccac 3600
cagacctgga ccagaaacct gcaagtgacc ctggaagatg gctacatcga actgagcacc 3660
agcgactctg gcggccctat ctttaagagc cctcagacct acatggatgg gctgctgcac 3720
tacgtgtccg tgatcagcga taacagcggc ctgagactgc tgatcgacga ccagctcctg 3780
cggaacagca agcggctgaa gcacatctcc agcagcagac agagtctgag actcggcggc 3840
agcaatttcg agggctgtat cagcaacgtg ttcgtgcagc gcctgagtct gtctccagaa 3900
gtgctggacc tgaccagcaa tagcctgaag agggatgtgt ctctcggcgg ctgctccctg 3960
aacaaacctc ctttcctgat gctgctgaag ggcagcaccc ggttcaacaa gaccaagacc 4020
tttcggatca atcagctgct ccaggacacc cctgtggcta gccctagaag cgtgaaagtg 4080
tggcaggacg cctgcagtcc cctgcctaaa acacaggcca atcacggggc tctgcagttc 4140
ggcgatatcc ccacaagcca tctgctgttt aagctgcccc aagagctgct caagcctcgg 4200
agccagttcg ctgtggatat gcagaccacc tcctccagag gactggtgtt tcacaccggc 4260
accaagaaca gcttcatggc cctgtacctg agcaaaggca ggctggtgtt tgccctgggc 4320
accgacggaa agaaactgcg gatcaagagc aaagagaagt gcaacgacgg caagtggcac 4380
accgtggtgt tcggacacga tggcgagaaa ggcagactcg tggtggatgg cctgagagcc 4440
agagagggat ctctgcctgg caactccacc atctccatca gagcccctgt gtatctgggc 4500
agccctccta gcggaaagcc taagagcctg cctaccaact ccttcgtggg ctgtctgaag 4560
aactttcagc tggacagcaa gcctctgtac acccctagca gcagctttgg cgtgtcctcc 4620
tgtctcggag gccctctgga aaagggcatc tacttctctg aggaaggcgg ccacgttgtc 4680
ctggctcatt ctgttctgct gggccccgag ttcaagctgg tgttctctat ccggcctaga 4740
agcctgaccg gcatcctgat tcacatcggc agccagcctg ggaagcacct gtgtgtgtat 4800
ctcgaggccg gcaaagtgac cgccagcatg gattctggtg ctggcggcac aagcacctcc 4860
gtgacaccta agcagagcct gtgtgatggc cagtggcaca gtgtggccgt gacaatcaag 4920
cagcacattc tgcacctgga actggacacc gacagcagct ataccgccgg acagatccca 4980
tttcctccag ccagcacaca agagcctctg caccttggag gcgcccctgc caatctgacc 5040
acactgagaa tccccgtgtg gaagtccttc ttcggctgcc tgcggaatat ccatgtgaac 5100
cacattccag tgcctgtgac agaggccctg gaagtgcagg gacccgtgtc tctgaatgga 5160
tgccccgatc agagggccaa gaggggcagc ggcgagggca ggggcagcct gctgacctgc 5220
ggcgacgtgg aggagaaccc cggccccatg aggcccttct tcctgctgtg ctttgccctg 5280
cctggactgc tgcatgctca gcaggcttgt agcagaggcg cctgctatcc tcctgtgggc 5340
gatctgcttg tgggcagaac cagattcctg cgggccagct ctacatgcgg cctgacaaag 5400
cctgagacat actgcaccca gtacggcgag tggcagatga agtgctgcaa gtgcgacagc 5460
agacagcccc acaactacta cagccacaga gtggaaaacg tggccagcag cagcggccct 5520
atgagatggt ggcagagcca gaacgacgtg aaccccgtta gcctgcagct ggacctggac 5580
agacggtttc agctgcaaga agtgatgatg gaatttcagg gccccatgcc tgccggcatg 5640
ctgatcgaga gaagcagcga tttcggcaag acctggcggg tgtaccagta tctggccgcc 5700
gattgcacca gcacattccc cagagttaga cagggcagac cccagagctg gcaggatgtt 5760
cgttgtcagt ctctgcccca gcggcctaac gctagactga atggcggaaa ggtgcagctc 5820
aacctgatgg acctggtgtc tggcatccct gccacacagt cccagaaaat ccaagaagtg 5880
ggcgagatca ccaacctgag agtgaacttc acccggctgg ctcccgttcc tcagagagga 5940
tatcatcctc ctagcgccta ctacgccgtg tctcagctta gactgcaggg cagctgcttc 6000
tgtcacggcc acgctgatag atgcgcccct aaacctggtg cctctgccgg accttctaca 6060
gccgtgcaag tgcacgatgt gtgcgtgtgc cagcacaata ccgccggacc taactgcgag 6120
agatgtgccc ctttctacaa caaccggcct tggaggcctg ccgaaggaca ggatgctcac 6180
gagtgccaga gatgcgactg caacggccac agcgagacat gccactttga ccctgccgtg 6240
tttgccgctt ctcagggcgc ttatggcggc gtgtgtgaca actgcagaga tcacaccgag 6300
ggcaagaact gcgagcgctg tcagctgcac tacttccgga atagaaggcc aggcgccagc 6360
atccaagaga catgcatcag ctgcgagtgc gatcccgatg gtgctgttcc tggcgctcct 6420
tgtgatcctg tgacaggcca gtgcgtgtgt aaagaacacg tgcagggcga aagatgcgac 6480
ctgtgcaagc ctggctttac cggcctgacc tacgccaatc ctcagggctg ccacagatgt 6540
gattgcaaca tcctgggcag cagacgggac atgccctgtg atgaagagtc tggcagatgc 6600
ctgtgcctgc ctaatgtcgt gggccccaag tgcgatcagt gtgccccata tcactggaag 6660
ctggcctctg gccagggatg cgaaccttgt gcctgcgatc cccacaacag cctgtctcca 6720
cagtgcaacc agttcaccgg ccagtgtcct tgcagagaag gctttggcgg cctgatgtgt 6780
tctgccgccg ctatcagaca gtgccccgat agaacatatg gcgacgtggc cacaggctgc 6840
agagcctgcg attgtgactt ccggggaaca gaaggacccg gctgcgataa ggccagcgga 6900
agatgtctgt gtcggcctgg actcacaggc cccagatgtg accagtgtca gcggggctac 6960
tgcaacagat accctgtgtg tgtggcctgc catccttgct tccagaccta cgacgccgac 7020
ctgagagaac aggccctgag attcggcaga ctgagaaatg ccaccgccag cctttggagc 7080
ggacctggcc ttgaagatag aggcctggcc tccagaatcc tggacgccaa gtctaagatc 7140
gagcagatca gagccgtgct gtctagccca gccgtgaccg aacaagaggt ggcccaagtg 7200
gctagcgcca tcctgagcct gagaagaact ctgcagggac tgcagctcga tctgcccctg 7260
gaagaggaaa cactgagcct gcctagagat ctggaaagcc tggatcggag cttcaacggc 7320
ctgctgacaa tgtaccagag aaagagagag cagttcgaga agatcagcag cgccgatcct 7380
agcggcgcct tcagaatgct gagcacagcc tatgagcaga gcgcccaggc tgctcagcaa 7440
gtgtccgata gcagcagact gctggaccag ctgcgggact ctagaagaga agccgaaaga 7500
cttgtgcggc aggcaggcgg cggaggtgga acaggatctc ctaaactggt ggccctgcgg 7560
ctggaaatgt cctctctgcc tgatctgacc cctaccttca acaagctgtg cggcaacagc 7620
cggcagatgg cctgcacacc tattagctgt cctggcgagc tgtgccctca ggataatgga 7680
accgcctgcg gctccagatg tagaggcgtt ttgccaagag ccggcggagc ctttctgatg 7740
gctggacaag ttgccgagca gctgagaggc ttcaacgctc agctgcagcg gaccagacag 7800
atgattagag ccgccgagga aagcgccagc cagattcaat ctagcgccca gagactggaa 7860
acccaggtgt ccgccagcag atcccagatg gaagaagatg tgcggcggac aagactgctg 7920
atccagcaag tgcgggactt cctgaccgat cctgataccg atgccgccac aatccaagag 7980
gtgtccgaag ctgttctggc actgtggctg cctaccgata gcgctacagt gctgcagaag 8040
atgaacgaga tccaggcaat cgccgccaga ctgcccaatg tggatctggt gctgagccag 8100
accaagcagg atatcgccag agctagaagg ctgcaggccg aggccgaaga ggcaagatct 8160
agagcccatg ccgtggaagg ccaagtcgag gacgttgtgg gcaatctgag acagggaacc 8220
gtggctctgc aagaggccca ggatacaatg cagggcacca gcagaagcct gcgcctgatc 8280
caggatagag tggccgaagt gcagcaggtc ctgaggccag ccgaaaagct ggtcaccagc 8340
atgaccaaac agctgggcga tttctggacg cgcatggaag aactgaggca tcaggcaaga 8400
cagcagggcg ctgaagcagt gcaggctcaa caacttgccg agggcgcttc tgaacaggct 8460
ctgtctgccc aagagggctt cgagcggatc aagcagaagt acgccgagct gaaggacaga 8520
ctgggccaga gttctatgct gggcgaacag ggcgccagaa ttcagagcgt gaaaacagag 8580
gccgaggaac tgttcggcga gacaatggaa atgatggacc ggatgaagga catggaactg 8640
gaactgctga ggggcagcca ggccatcatg ctgagaagtg ccgatctgac aggcctggaa 8700
aagagagtgg aacagatccg ggaccacatc aacggccggg tgctgtacta cgccacatgc 8760
aagtaa 8766

<210> 23
<211> 12420
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 23
atgcctcctg ctgtgcggag aagcgcctgt tctatgggat ggctgtggat ctttggcgcc 60
gctctgggac agtgtctggg ctactcttct cagcagcagc gggtgccatt tctgcagcca 120
cctggacagt ctcagctgca ggccagctac gtggaattca gacctagcca gggctgtagc 180
cccggctact acagagatca caagggcctg tacaccggca gatgcgtgcc ctgcaactgt 240
aacggccaca gcaaccagtg tcaggacggc tctggcatct gcgtgaactg ccagcataat 300
actgccggcg agcactgcga gagatgccaa gagggctact acggcaatgc cgtgcatggc 360
agctgtcggg cttgtccttg tcctcacacc aacagctttg ccaccggctg cgttgtgaac 420
ggcggagatg ttcggtgttc ttgcaaggcc ggctacacag gcacacagtg cgaaagatgt 480
gcccctggct actttggcaa ccctcagaag tttggcggct cctgccagcc ttgctcctgc 540
aattctaatg gccagctggg ctcttgtcac cctctgaccg gcgactgcat caatcaagag 600
cctaaggaca gcagccctgc cgaggaatgc gacgattgcg atagctgcgt gatgaccctg 660
ctgaacgacc tggccacaat gggagaacag ctgcggctgg ttaagagcca gctccaggga 720
ctgtctgcct ctgctggact gctggaacag atgcggcaca tggaaaccca ggccaaggac 780
ctgagaaacc agctgctgaa ctacagaagc gccatctcca accacggcag caagatcgaa 840
ggcctggaaa gagagctgac cgacctgaat caagagttcg agacactgca agagaaggcc 900
caagtgaaca gccggaaggc ccagactctg aacaacaacg tgaaccgggc cacacagtcc 960
gccaaagaac tggacgtgaa gatcaagaac gtgatccgga acgtgcacat cctgctgaag 1020
cagatcagcg gcacagatgg cgagggcaac aatgtgccta gcggcgactt tagcagagag 1080
tgggccgaag ctcagcggat gatgagagag ctgcggaacc ggaacttcgg caagcacctg 1140
agagaagccg aggccgacaa gagagagagc caactgctgc tcaaccggat cagaacctgg 1200
cagaaaaccc accagggcga gaacaacggc ctggccaaca gcatcagaga cagcctgaat 1260
gagtacgagg ccaagctgag cgatctgcgg gccagacttc aagaagctgc cgctcaggcc 1320
aagcaggcca acggccttaa tcaagagaac gagagagccc tgggcgccat ccagagacaa 1380
gtgaaagaga tcaacagcct gcagagcgac ttcaccaagt acctgaccac cgccgatagc 1440
agcctgctgc agacaaatat cgccctgcag ctcatggaaa agagccagaa agagtacgaa 1500
aagctggccg ccagcctgaa cgaggccagg caagaactgt ctgacaaagt gcgcgagctg 1560
agcagatccg ccggcaagac atctctggtg gaagaggccg agaagcacgc cagatctctg 1620
caagagctgg ccaaacagct ggaagagatt aagcggaacg ccagcggcga cgaactcgtc 1680
agatgtgcag tggatgccgc caccgcctac gagaacatcc tgaatgccat caaggccgcc 1740
gaggacgccg ctaatagagc cgcttctgct tctgagtctg ccctgcagac cgtgatcaaa 1800
gaggacctgc ctagaaaggc caagacactg agcagcaaca gcgacaaact gctgaatgag 1860
gccaagatga cccagaagaa actgaagcaa gaggtgtccc ctgcactgaa caacctgcag 1920
cagaccctga acatcgtgac cgtgcagaaa gaagtgatcg acaccaacct gacaaccctg 1980
agagatggcc tgcacggaat ccagagaggc gacatcgacg ccatgatcag cagcgccaag 2040
agcatggttc gaaaagccaa cgacatcacc gacgaggtgc tggacggcct gaatcctatc 2100
cagaccgacg tggaacggat caaggacacc tacggcagaa cccagaacga ggatttcaag 2160
aaggccctga ccgacgccga caactccgtg aacaagctga ccaacaagct gcccgatctg 2220
tggcggaaga tcgagagcat caaccagcaa ctgctccctc tgggcaacat cagcgacaac 2280
atggacagaa tccgggaact gatccagcag gccagagatg ccgcctccaa agtggctgtg 2340
cccatgagat tcaacggcaa gagcggagtg gaagtgcggc tgcccaacga tctggaagat 2400
ctgaagggct ataccagcct gagcctgttc ctgcagaggc ccaacagcag agagaatggc 2460
ggcaccgaga atatgttcgt gatgtacctg ggaaacaagg acgccagccg ggactatatc 2520
ggaatggccg ttgtggacgg ccagctgacc tgcgtgtaca acctgggaga cagagaagct 2580
gaactgcagg tcgaccagat cctgaccaag agcgagacaa aagaggccgt gatggacaga 2640
gtgaagttcc agcggatcta ccagttcgcc cggctgaatt acaccaaggg cgccacaagc 2700
agcaagcccg aaacacctgg cgtgtacgac atggacggcc ggaactctaa cactctgctg 2760
aatctggacc ccgagaacgt ggtgttttac gtcggcggct accctcctga cttcaagctg 2820
cctagcagac tgagcttccc accttacaag ggctgcatcg agctggatga cctgaacgaa 2880
aacgtgctgt ccctgtacaa cttcaaaaag accttcaacc tgaacaccac cgaggtggaa 2940
ccctgcaggc gcagaaaaga ggaatccgac aagaactact tcgaaggcac cggctacgcc 3000
agagtgccta cacaacctca cgctcccatt cctaccttcg gccagaccat ccagacaacc 3060
gtggatagag gcctgctgtt cttcgccgag aacggcgaca gattcatctc cctgaatatc 3120
gaggatggca agctgatggt ccgatacaag ctgaatagcg agctgcccaa agaaagaggc 3180
gtgggcgacg ccatcaacaa cggcagggat cacagcatcc agatcaagat cggcaaactg 3240
cagaaacgga tgtggatcaa cgtggacgtg cagaacacca tcatcgacgg cgaggtgttc 3300
gacttcagca cctactatct cggcggaatc cctatcgcca tcagagagcg gttcaatatc 3360
agcacccctg ccttccgggg ctgcatgaag aacctgaaaa agaccagcgg cgtcgtgcgg 3420
ctgaatgata cagtgggcgt gaccaagaag tgcagcgagg actggaagct tgtgcggagc 3480
gccagttttt ctagaggcgg acagctgagc tttaccgacc tgggactgcc tcctaccgat 3540
catctgcagg caagcttcgg attccagacc ttccagccaa gcggaatcct gctggaccac 3600
cagacctgga ccagaaacct gcaagtgacc ctggaagatg gctacatcga actgagcacc 3660
agcgactctg gcggccctat ctttaagagc cctcagacct acatggatgg gctgctgcac 3720
tacgtgtccg tgatcagcga taacagcggc ctgagactgc tgatcgacga ccagctcctg 3780
cggaacagca agcggctgaa gcacatctcc agcagcagac agagtctgag actcggcggc 3840
agcaatttcg agggctgtat cagcaacgtg ttcgtgcagc gcctgagtct gtctccagaa 3900
gtgctggacc tgaccagcaa tagcctgaag agggatgtgt ctctcggcgg ctgctccctg 3960
aacaaacctc ctttcctgat gctgctgaag ggcagcaccc ggttcaacaa gaccaagacc 4020
tttcggatca atcagctgct ccaggacacc cctgtggcta gccctagaag cgtgaaagtg 4080
tggcaggacg cctgcagtcc cctgcctaaa acacaggcca atcacggggc tctgcagttc 4140
ggcgatatcc ccacaagcca tctgctgttt aagctgcccc aagagctgct caagcctcgg 4200
agccagttcg ctgtggatat gcagaccacc tcctccagag gactggtgtt tcacaccggc 4260
accaagaaca gcttcatggc cctgtacctg agcaaaggca ggctggtgtt tgccctgggc 4320
accgacggaa agaaactgcg gatcaagagc aaagagaagt gcaacgacgg caagtggcac 4380
accgtggtgt tcggacacga tggcgagaaa ggcagactcg tggtggatgg cctgagagcc 4440
agagagggat ctctgcctgg caactccacc atctccatca gagcccctgt gtatctgggc 4500
agccctccta gcggaaagcc taagagcctg cctaccaact ccttcgtggg ctgtctgaag 4560
aactttcagc tggacagcaa gcctctgtac acccctagca gcagctttgg cgtgtcctcc 4620
tgtctcggag gccctctgga aaagggcatc tacttctctg aggaaggcgg ccacgttgtc 4680
ctggctcatt ctgttctgct gggccccgag ttcaagctgg tgttctctat ccggcctaga 4740
agcctgaccg gcatcctgat tcacatcggc agccagcctg ggaagcacct gtgtgtgtat 4800
ctcgaggccg gcaaagtgac cgccagcatg gattctggtg ctggcggcac aagcacctcc 4860
gtgacaccta agcagagcct gtgtgatggc cagtggcaca gtgtggccgt gacaatcaag 4920
cagcacattc tgcacctgga actggacacc gacagcagct ataccgccgg acagatccca 4980
tttcctccag ccagcacaca agagcctctg caccttggag gcgcccctgc caatctgacc 5040
acactgagaa tccccgtgtg gaagtccttc ttcggctgcc tgcggaatat ccatgtgaac 5100
cacattccag tgcctgtgac agaggccctg gaagtgcagg gacccgtgtc tctgaatgga 5160
tgccccgatc agagggccaa gaggggcagc ggcgagggca ggggcagcct gctgacctgc 5220
ggcgacgtgg aggagaaccc cggccccatg aggcccttct tcctgctgtg ctttgccctg 5280
cctggactgc tgcatgctca gcaggcttgt agcagaggcg cctgctatcc tcctgtgggc 5340
gatctgcttg tgggcagaac cagattcctg cgggccagct ctacatgcgg cctgacaaag 5400
cctgagacat actgcaccca gtacggcgag tggcagatga agtgctgcaa gtgcgacagc 5460
agacagcccc acaactacta cagccacaga gtggaaaacg tggccagcag cagcggccct 5520
atgagatggt ggcagagcca gaacgacgtg aaccccgtta gcctgcagct ggacctggac 5580
agacggtttc agctgcaaga agtgatgatg gaatttcagg gccccatgcc tgccggcatg 5640
ctgatcgaga gaagcagcga tttcggcaag acctggcggg tgtaccagta tctggccgcc 5700
gattgcacca gcacattccc cagagttaga cagggcagac cccagagctg gcaggatgtt 5760
cgttgtcagt ctctgcccca gcggcctaac gctagactga atggcggaaa ggtgcagctc 5820
aacctgatgg acctggtgtc tggcatccct gccacacagt cccagaaaat ccaagaagtg 5880
ggcgagatca ccaacctgag agtgaacttc acccggctgg ctcccgttcc tcagagagga 5940
tatcatcctc ctagcgccta ctacgccgtg tctcagctta gactgcaggg cagctgcttc 6000
tgtcacggcc acgctgatag atgcgcccct aaacctggtg cctctgccgg accttctaca 6060
gccgtgcaag tgcacgatgt gtgcgtgtgc cagcacaata ccgccggacc taactgcgag 6120
agatgtgccc ctttctacaa caaccggcct tggaggcctg ccgaaggaca ggatgctcac 6180
gagtgccaga gatgcgactg caacggccac agcgagacat gccactttga ccctgccgtg 6240
tttgccgctt ctcagggcgc ttatggcggc gtgtgtgaca actgcagaga tcacaccgag 6300
ggcaagaact gcgagcgctg tcagctgcac tacttccgga atagaaggcc aggcgccagc 6360
atccaagaga catgcatcag ctgcgagtgc gatcccgatg gtgctgttcc tggcgctcct 6420
tgtgatcctg tgacaggcca gtgcgtgtgt aaagaacacg tgcagggcga aagatgcgac 6480
ctgtgcaagc ctggctttac cggcctgacc tacgccaatc ctcagggctg ccacagatgt 6540
gattgcaaca tcctgggcag cagacgggac atgccctgtg atgaagagtc tggcagatgc 6600
ctgtgcctgc ctaatgtcgt gggccccaag tgcgatcagt gtgccccata tcactggaag 6660
ctggcctctg gccagggatg cgaaccttgt gcctgcgatc cccacaacag cctgtctcca 6720
cagtgcaacc agttcaccgg ccagtgtcct tgcagagaag gctttggcgg cctgatgtgt 6780
tctgccgccg ctatcagaca gtgccccgat agaacatatg gcgacgtggc cacaggctgc 6840
agagcctgcg attgtgactt ccggggaaca gaaggacccg gctgcgataa ggccagcgga 6900
agatgtctgt gtcggcctgg actcacaggc cccagatgtg accagtgtca gcggggctac 6960
tgcaacagat accctgtgtg tgtggcctgc catccttgct tccagaccta cgacgccgac 7020
ctgagagaac aggccctgag attcggcaga ctgagaaatg ccaccgccag cctttggagc 7080
ggacctggcc ttgaagatag aggcctggcc tccagaatcc tggacgccaa gtctaagatc 7140
gagcagatca gagccgtgct gtctagccca gccgtgaccg aacaagaggt ggcccaagtg 7200
gctagcgcca tcctgagcct gagaagaact ctgcagggac tgcagctcga tctgcccctg 7260
gaagaggaaa cactgagcct gcctagagat ctggaaagcc tggatcggag cttcaacggc 7320
ctgctgacaa tgtaccagag aaagagagag cagttcgaga agatcagcag cgccgatcct 7380
agcggcgcct tcagaatgct gagcacagcc tatgagcaga gcgcccaggc tgctcagcaa 7440
gtgtccgata gcagcagact gctggaccag ctgcgggact ctagaagaga agccgaaaga 7500
cttgtgcggc aggcaggcgg cggaggtgga acaggatctc ctaaactggt ggccctgcgg 7560
ctggaaatgt cctctctgcc tgatctgacc cctaccttca acaagctgtg cggcaacagc 7620
cggcagatgg cctgcacacc tattagctgt cctggcgagc tgtgccctca ggataatgga 7680
accgcctgcg gctccagatg tagaggcgtt ttgccaagag ccggcggagc ctttctgatg 7740
gctggacaag ttgccgagca gctgagaggc ttcaacgctc agctgcagcg gaccagacag 7800
atgattagag ccgccgagga aagcgccagc cagattcaat ctagcgccca gagactggaa 7860
acccaggtgt ccgccagcag atcccagatg gaagaagatg tgcggcggac aagactgctg 7920
atccagcaag tgcgggactt cctgaccgat cctgataccg atgccgccac aatccaagag 7980
gtgtccgaag ctgttctggc actgtggctg cctaccgata gcgctacagt gctgcagaag 8040
atgaacgaga tccaggcaat cgccgccaga ctgcccaatg tggatctggt gctgagccag 8100
accaagcagg atatcgccag agctagaagg ctgcaggccg aggccgaaga ggcaagatct 8160
agagcccatg ccgtggaagg ccaagtcgag gacgttgtgg gcaatctgag acagggaacc 8220
gtggctctgc aagaggccca ggatacaatg cagggcacca gcagaagcct gcgcctgatc 8280
caggatagag tggccgaagt gcagcaggtc ctgaggccag ccgaaaagct ggtcaccagc 8340
atgaccaaac agctgggcga tttctggacg cgcatggaag aactgaggca tcaggcaaga 8400
cagcagggcg ctgaagcagt gcaggctcaa caacttgccg agggcgcttc tgaacaggct 8460
ctgtctgccc aagagggctt cgagcggatc aagcagaagt acgccgagct gaaggacaga 8520
ctgggccaga gttctatgct gggcgaacag ggcgccagaa ttcagagcgt gaaaacagag 8580
gccgaggaac tgttcggcga gacaatggaa atgatggacc ggatgaagga catggaactg 8640
gaactgctga ggggcagcca ggccatcatg ctgagaagtg ccgatctgac aggcctggaa 8700
aagagagtgg aacagatccg ggaccacatc aacggccggg tgctgtacta cgccacatgc 8760
aagagggcca agaggggcag cggcgagggc aggggcagcc tgctgacctg cggcgacgtg 8820
gaggagaacc ccggccccat gcctgctctg tggctgggct gctgcctgtg ttttagtctg 8880
ctgctgccag ccgccagagc cacatctaga agagaagtgt gcgactgcaa cggcaagagc 8940
cggcagtgca tcttcgacag agagctgcac agacagaccg gcaacggctt cagatgcctg 9000
aactgcaacg acaacaccga cggcatccac tgcgagaagt gcaagaacgg cttctaccgg 9060
caccgcgaga gggatagatg cctgccttgc aactgcaact ccaagggcag cctgagcgcc 9120
agatgcgaca atagcggcag atgtagctgc aagcctggcg tgacaggcgc tagatgcgat 9180
agatgtctcc ccggcttcca catgctgacc gatgccggat gtacccagga ccagagactg 9240
ctggacagca agtgcgattg cgaccctgcc ggaattgccg gaccttgtga tgccggaaga 9300
tgcgtgtgta aacctgccgt gaccggcgag agatgtgaca gatgtagaag cggctactac 9360
aacctggacg gcggcaatcc tgaaggctgc acccagtgct tttgctacgg ccacagcgcc 9420
agctgtagaa gcagcgccga atactccgtg cacaagatca ccagcacctt ccaccaggat 9480
gtggacggat ggaaggccgt gcagagaaat ggctctcctg ccaagctgca gtggtcccag 9540
agacaccagg acgtgttcag cagcgctcag agactggacc ccgtgtactt tgtggcccct 9600
gccaagttcc tgggcaacca gcaagtgtct tacggccaga gcctgagctt cgactacaga 9660
gtggatagag gcggcagaca ccccagcgct cacgatgtga ttcttgaagg cgccggactg 9720
cggatcacag cccctcttat gcctctgggc aagaccctgc cttgtggcct gaccaagacc 9780
tacaccttcc ggctgaatga gcaccccagc aacaactggt ccccacagct gagctacttc 9840
gagtacagac ggctgctgcg gaacctgaca gccctgagaa tcagagccac ctacggcgag 9900
tacagcaccg gctacatcga caacgtgacc ctgatcagcg ccagacctgt ttctggtgct 9960
cctgctcctt gggtcgagca gtgtatctgt cccgtgggct acaagggcca gttctgccag 10020
gattgtgcca gcggctacaa gagagactct gccagactgg gccccttcgg cacatgcatc 10080
ccttgtaatt gtcaaggcgg cggagcctgc gatcccgata caggcgattg ctacagcggc 10140
gacgagaacc ccgatatcga gtgcgccgat tgtcccatcg gcttttacaa cgaccctcac 10200
gaccccagat cctgcaagcc atgtccttgc cacaatggct tcagctgcag cgtgatgccc 10260
gaaaccgaag aggtcgtgtg caacaattgc ccaccaggcg ttacaggggc cagatgtgaa 10320
ctgtgtgccg acggctactt cggcgatcct tttggagaac acggacccgt gcgaccttgc 10380
cagccttgtc agtgcaacaa caacgtggac ccaagcgcca gcggcaactg cgatagactg 10440
acaggcagat gtctgaagtg catccacaat accgccggga tctactgtga ccagtgcaag 10500
gccggctatt ttggcgaccc tctggctccc aatcctgccg ataagtgcag agcctgcaac 10560
tgtaacccta tgggctctga gcctgtgggc tgcagatctg atggaacctg cgtgtgcaag 10620
ccaggctttg gcggacctaa ttgtgaacac ggcgccttta gctgccccgc ctgctacaat 10680
caagtgaaga tccagatgga ccagttcatg cagcagctgc agaggatgga agccctgatc 10740
tctaaagccc aaggcggaga tggcgtggtg cctgatacag agctggaagg cagaatgcag 10800
caggccgaac aggccctgca ggacattctg agagatgccc agattagcga gggcgcctct 10860
agaagtctgg gactgcagct ggctaaagtg cggagccaag agaacagcta ccagagcaga 10920
ctggacgacc tgaagatgac cgtggaaaga gtcagagccc tgggcagcca gtaccagaac 10980
agagtgcggg atacccaccg gctgatcacc cagatgcaac tgtctctggc cgagagcgaa 11040
gccagcctgg gcaataccaa tattcccgcc agcgaccact acgtgggccc caacggtttt 11100
aagagcctgg ctcaagaggc caccagactg gccgaaagcc atgtggaaag cgcctccaac 11160
atggaacagc tgacccggga aaccgaggac tactctaagc aggccctgag cctcgtcaga 11220
aaagccctgc atgaaggcgt cggcagcggc tctggatctc ctgatggtgc tgtggtgcag 11280
ggactcgtgg aaaagctgga aaagaccaaa tctctggccc agcagctgac cagagaagcc 11340
acacaggccg agatcgaggc cgacagaagc taccagcact cactgaggct gctggactcc 11400
gtgtctagac tgcagggcgt gtccgaccag agcttccagg tggaagaggc caagcggatc 11460
aagcagaagg ccgatagcct gagcagcctg gtcaccagac acatggacga gttcaagcgg 11520
acccagaaga acctcggcaa ctggaaagag gaagcccagc aactgctgca gaacggcaag 11580
tctggaagag agaagtctga ccagctgctg agcagagcca acctggccaa gtctagagcc 11640
caagaggccc tgtctatggg caacgccacc ttctacgagg tggaatccat cctgaagaac 11700
ctgcgcgagt tcgacctgca agtggacaac agaaaggccg aggccgagga agccatgaag 11760
agactgagct acatcagcca gaaagtgtcc gacgcctccg acaagacaca gcaggcagaa 11820
agagcactgg gatctgccgc agccgatgct cagagagcta aaaacggcgc tggcgaggcc 11880
ctggaaatca gctctgagat cgagcaagag atcggctccc tgaatctgga agccaatgtg 11940
acagccgatg gcgccctggc catggaaaaa ggactggcct ctctgaagtc cgagatgaga 12000
gaggtggaag gcgagctgga acggaaagaa ctggaattcg acaccaatat ggacgctgtg 12060
cagatggtca tcacagaggc ccagaaggtg gacaccagag ccaaaaatgc cggcgtgacc 12120
atccaggaca ccctgaatac tctggacgga ctgctgcacc tgatggatca gcctctgagc 12180
gtggacgagg aaggactggt tctgctggaa cagaagctga gccgggccaa gactcagatc 12240
aacagccagc tgaggcccat gatgagcgaa ctggaagaac gggccagaca gcagaggggc 12300
catctgcatc tgctcgaaac cagcatcgat ggcatcctgg ccgacgtgaa gaatctcgag 12360
aacatccggg acaacctgcc acctggctgc tacaacacac aggcactgga acagcagtga 12420

<210> 24
<211> 10002
<212> DNA
<213> Homo sapiens
<400> 24
atggcggcgg ccgcgcggcc tcggggtcgg gcactggggc cagtactgcc gccgacgccg 60
ctgctcctgc tggtactgcg ggtgctgcca gcctgcgggg cgaccgctcg ggatcccggg 120
gccgcggccg ggctcagcct tcacccgact tacttcaacc tggccgaggc ggcgaggatt 180
tgggccaccg ccacctgcgg ggagagggga cccggcgagg ggaggcccca gcccgagctc 240
tactgcaagt tggtcggggg ccccaccgcc ccaggcagcg gccacaccat ccagggccag 300
ttctgtgact attgcaattc tgaagacccc aggaaagcac atcctgtcac caatgccatc 360
gatggatctg aacgttggtg gcaaagccct cccctgtcct caggcacaca gtacaacaga 420
gtcaacctca ccttggatct ggggcagctc ttccatgtgg cctatatttt aatcaaattt 480
gcaaattctc ctcgccctga tctttgggtc ttggaaagat ctgtagactt tggaagcacc 540
tactcaccat ggcaatattt tgctcattct aaagtagact gtttaaaaga atttgggcgg 600
gaggcaaata tggctgtcac ccgggatgat gatgtacttt gtgttactga atattcccgt 660
attgtacctt tggaaaatgg tgaggttgtg gtgtccttga taaacggtcg tccaggtgca 720
aaaaatttta ctttctctca caccctgagg gagtttacca aggcaacaaa catccgcttg 780
cgttttctta gaaccaatac gcttcttgga cacctcatct ccaaagccca gcgagatcca 840
actgtcactc ggcggtatta ttacagcata aaggacatca gcattggtgg gcagtgtgtt 900
tgcaatggcc atgctgaagt gtgcaatata aacaatcctg aaaaactgtt tcggtgtgaa 960
tgccagcacc acacctgtgg ggagacgtgt gatcgctgct gcacagggta caatcagagg 1020
cgctggcggc ccgccgcttg ggagcagagc cacgagtgtg aagcatgcaa ctgccacggc 1080
catgccagca actgttacta tgatccagat gttgagcggc agcaggcaag cttgaatacc 1140
cagggcatct atgctggtgg aggggtctgc attaactgtc agcacaacac agctggagta 1200
aactgtgaac agtgtgctaa gggctattac cgcccttatg gggttccagt ggatgcccct 1260
gatggctgca tcccctgcag ctgtgaccct gagcatgcgg atggctgtga acagggttca 1320
ggccgctgtc actgcaagcc aaatttccac ggagacaact gtgagaagtg tgcaattgga 1380
tactacaatt tcccattttg cttgagaatt cccatttttc ctgtttctac accaagttca 1440
gaagatccag tagctggaga tataaaaggg tgtgactgta atctggaagg tgttctccct 1500
gaaatatgtg atgcccacgg acggtgcctg tgccgccctg gggttgaggg ccctcgatgt 1560
gatacctgcc gctctggttt ctactcattc cctatttgcc aagcctgctg gtgttcagcc 1620
cttggatcct accagatgcc ctgcagctca gtgactggac agtgtgaatg tcggccagga 1680
gttacaggac agcggtgtga caggtgtctc tcaggagctt atgatttccc ccactgccaa 1740
ggttccagca gtgcttgtga cccagctggt accatcaact ccaatttggg gtattgccaa 1800
tgcaagcttc atgttgaagg tcctacttgt agccgctgca aactgttata ttggaatctg 1860
gacaaagaaa accccagtgg atgttcagaa tgcaagtgcc ataaggcggg aacagtgagt 1920
ggaactggag agtgtaggca gggagatggt gactgtcact gcaagtccca tgtgggtggc 1980
gattcctgcg acacctgtga agatggatat tttgctttgg aaaagagcaa ttactttggg 2040
tgtcaagggt gtcagtgtga cattggtggg gcattgtcct ccatgtgcag tgggccctcg 2100
ggagtgtgcc agtgccgaga gcatgtcgtg ggaaaggtgt gccagcggcc tgaaaacaac 2160
tactatttcc cagatttgca tcatatgaag tatgagattg aagacggcag cacacctaat 2220
gggagagacc ttcgatttgg atttgatccg ctggcatttc ctgagtttag ctggagagga 2280
tatgcccaaa tgacctcagt acagaatgat gtaagaataa cattgaatgt agggaagtca 2340
agtggctcct tgtttcgtgt tattctgaga tacgttaacc ctggaactga agcagtatct 2400
ggccatataa ctatttatcc atcctggggt gctgctcaaa gcaaagagat catcttcctg 2460
ccgagtaagg agccagcctt tgtcactgtc cctggaaatg gttttgcaga cccattttca 2520
atcacaccag gaatatgggt tgcttgtatt aaggcagaag gagtccttct ggattacctg 2580
gtgctgctcc ccagggacta ctatgaagcc tctgtactgc agctgccagt cacagaacca 2640
tgtgcctacg caggacctcc ccaagaaaat tgcttactct accagcattt gccagtgacc 2700
agattcccct gtaccctggc ttgtgaggcc agacacttcc tgcttgatgg ggagccaaga 2760
cccgtggcag tgaggcagcc cacacctgca caccctgtca tggtggacct cagcgggaga 2820
gaggtggaat tgcatctgcg gctgcgcatc ccacaggttg gccactacgt ggttgtggtc 2880
gagtattcca cggaggcagc tcagctgttt gtggttgatg tgaatgtgaa gagctccggg 2940
tctgttctgg caggccaggt gaacatttac agctgcaact acagtgttct ctgccggagt 3000
gctgtgattg atcacatgag ccgcatcgcc atgtatgagc tattggcaga tgcagacatt 3060
cagctcaagg gacacatggc ccgattcctt ctgcatcaag tttgtatcat acctattgaa 3120
gaattctcag ctgagtatgt gagaccacaa gtccactgca ttgccagtta tgggcgattt 3180
gtcaatcaaa gtgccacctg tgtctccttg gcccatgaaa ctcctccaac agcattaatt 3240
ttggatgttc taagtggcag gcctttccct cacctgcccc agcagtcgtc accttctgtt 3300
gatgttcttc ctggggtcac cttgaaggca ccgcagaatc aagtgaccct gagaggacgt 3360
gtaccacacc tgggccgata cgtctttgtc atccattttt accaagcagc gcacccgacg 3420
tttcccgcgc aggtgtcggt ggatggcggg tggccacggg caggctcctt ccatgcctct 3480
ttttgccccc atgtgcttgg ctgccgggat caagtgattg ccgaaggcca gattgagttt 3540
gacatctcag agcctgaagt ggccgcaact gtgaaggttc cagaaggaaa gtccttggtt 3600
ttggtccgtg ttctagtggt gcctgcagaa aactatgact accaaatact tcacaaaaaa 3660
tccatggaca agtcactcga gtttatcacc aattgtggaa aaaacagctt ttaccttgac 3720
ccccagacag cctccagatt ctgtaagaat tccgccaggt ccctggtggc cttttaccac 3780
aagggcgccc tgccttgtga gtgccacccc actggggcca ccggccctca ctgcagccct 3840
gagggtgggc agtgcccatg ccagcccaac gtcatcgggc ggcagtgcac ccgctgtgca 3900
acaggccact acggattccc acgctgcaag ccgtgcagct gtggtcggcg cctttgtgaa 3960
gagatgacgg ggcagtgccg ctgccctccc cgcacggtca ggccccagtg tgaggtgtgt 4020
gagacacact cattcagctt ccaccccatg gccggctgcg aaggctgcaa ctgttccagg 4080
aggggcacca tcgaggctgc catgccggag tgtgaccggg acagcgggca gtgcagatgc 4140
aagcccagaa tcacagggcg gcagtgtgac cgatgtgctt ccgggtttta ccgctttcct 4200
gagtgtgttc cctgcaattg caacagagat gggactgagc caggagtgtg tgacccaggg 4260
accggggctt gcctctgcaa ggaaaatgta gaaggcacag agtgtaatgt gtgtcgagaa 4320
ggctcattcc atttggaccc agccaatctc aagggttgta ccagctgttt ctgttttgga 4380
gtaaataatc aatgtcacag ctcacataag cgaaggacta agtttgtgga tatgctgggc 4440
tggcacctgg agacagcaga cagagtggac atccctgtct ctttcaaccc aggcagcaac 4500
agtatggtgg cggatctcca ggagctgccc gcaaccatcc acagcgcgtc ctgggtcgca 4560
cccacctcct acctggggga caaggtttct tcatatggtg gttacctcac ttaccaagcc 4620
aagtcctttg gcttgcctgg cgacatggtt cttctggaaa agaagccgga tgtacagctc 4680
actggtcagc acatgtccat catctatgag gagacaaaca ccccacggcc agaccggctg 4740
catcatggac gagtgcacgt ggtcgaggga aacttcagac atgccagcag ccgtgcccca 4800
gtgtctaggg aggagctgat gacagtgctg tctagactgg cagatgtgcg catccaaggc 4860
ctctacttca cagagactca aaggctcacc ctgagcgagg tggggctaga ggaagcctct 4920
gacacaggaa gtgggcgcat agcacttgct gtggaaatct gtgcctgccc ccctgcctac 4980
gctggtgact cttgtcaggg ttgtagccct ggatactatc gggatcataa aggcttgtat 5040
accggacggt gtgttccctg caattgcaac ggacattcaa atcaatgcca ggatggctca 5100
ggcatatgtg ttaactgtca gcacaacacc gcgggagagc actgtgaacg ctgccaggag 5160
ggctactatg gcaacgccgt ccacggatcc tgcagggcct gcccatgtcc tcacactaac 5220
agctttgcca ctggctgtgt ggtgaatggg ggagacgtgc ggtgctcctg caaagctggg 5280
tacacaggaa cacagtgtga aaggtgtgca ccgggatatt tcgggaatcc ccagaaattc 5340
ggaggtagct gccaaccatg cagttgtaac agcaatggcc agctgggcag ctgtcatccc 5400
ctgactggag actgcataaa ccaagaaccc aaagatagca gccctgcaga agaatgtgat 5460
gattgcgaca gctgtgtgat gaccctcctg aacgacctgg ccaccatggg cgagcagctc 5520
cgcctggtca agtctcagct gcagggcctg agtgccagcg cagggcttct ggagcagatg 5580
aggcacatgg agacccaggc caaggacctg aggaatcagt tgctcaacta ccgttctgcc 5640
atttcaaatc atggatcaaa aatagaaggc ctggaaagag aactgactga tttgaatcaa 5700
gaatttgaga ctttgcaaga aaaggctcaa gtaaattcca gaaaagcaca aacattaaac 5760
aacaatgtta atcgggcaac acaaagcgca aaagaactgg atgtgaagat taaaaatgtc 5820
atccggaatg tgcacattct tttaaagcag atctctggga cagatggaga gggaaacaac 5880
gtgccttcag gtgacttttc cagagagtgg gctgaagccc agcgcatgat gagggaactg 5940
cggaacagga actttggaaa gcacctcaga gaagcagaag ctgataaaag ggagtcgcag 6000
ctcttgctga accggataag gacctggcag aaaacccacc agggggagaa caatgggctt 6060
gctaacagta tccgggattc tttaaatgaa tacgaagcca aactcagtga ccttcgtgct 6120
cggctgcagg aggcagctgc ccaagccaag caggcaaatg gcttgaacca agaaaacgag 6180
agagctttgg gagccattca gagacaagtg aaagaaataa attccctgca gagtgatttc 6240
accaagtatc taaccactgc agactcatct ttgttgcaaa ccaacattgc gctgcagctg 6300
atggagaaaa gccagaagga atatgaaaaa ttagctgcca gtttaaatga agcaagacaa 6360
gaactaagtg acaaagtaag agaactttcc agatctgctg gcaaaacatc ccttgtggag 6420
gaggcagaaa agcacgcgcg gtccttacaa gagctggcaa agcagctgga agagatcaag 6480
agaaacgcca gcggggatga gctggtgcgc tgtgctgtgg atgccgccac cgcctacgag 6540
aacatcctca atgccatcaa agcggccgag gacgcagcca acagggctgc cagtgcatct 6600
gaatctgccc tccagacagt gataaaggaa gatctgccaa gaaaagctaa aaccctgagt 6660
tccaacagtg ataaactgtt aaatgaagcc aagatgacac aaaagaagct aaagcaagaa 6720
gtcagtccag ctctcaacaa cctacagcaa accctgaata ttgtgacagt tcagaaagaa 6780
gtgatagaca ccaatctcac aactctccga gatggtcttc atgggataca gagaggtgat 6840
attgatgcta tgatcagtag tgcaaagagc atggtcagaa aggccaacga catcacagat 6900
gaggttctgg atgggctcaa ccccatccag acagatgtgg aaagaattaa ggacacctat 6960
gggaggacac agaacgaaga cttcaaaaag gctctgactg atgcagataa ctcggtgaat 7020
aagttaacca acaaactacc tgatctttgg cgcaagattg aaagtatcaa ccaacagctg 7080
ttgcccttgg gaaacatctc tgacaacatg gacagaatac gagaactaat tcagcaggcc 7140
agagatgctg ccagtaaggt tgctgtcccc atgaggttca atggtaaatc tggagtcgaa 7200
gtccgactgc caaatgacct ggaagatttg aaaggatata catctctgtc cttgtttctc 7260
caaaggccca actcaagaga aaatgggggt actgagaata tgtttgtgat gtaccttgga 7320
aataaagatg cctcccggga ctacatcggc atggcagttg tggatggcca gctcacctgt 7380
gtctacaacc tgggggaccg tgaggctgaa ctccaagtgg accagatctt gaccaagagt 7440
gagactaagg aggcagttat ggatcgggtg aaatttcaga gaatttatca gtttgcaagg 7500
cttaattaca ccaaaggagc cacatccagt aaaccagaaa cacccggagt ctatgacatg 7560
gatggtagaa atagcaatac actccttaat ttggatcctg aaaatgttgt attttatgtt 7620
ggaggttacc cacctgattt taaacttccc agtcgactaa gtttccctcc atacaaaggt 7680
tgtattgaat tagatgacct caatgaaaat gttctgagct tgtacaactt caaaaaaaca 7740
ttcaatctca acacaactga agtggagcct tgtagaagga ggaaggaaga gtcagacaaa 7800
aattattttg aaggtacggg ctatgctcga gttccaactc aaccacatgc tcccatccca 7860
acctttggac agacaattca gaccaccgtg gatagaggct tgctgttctt tgcagaaaac 7920
ggggatcgct tcatatctct aaatatagaa gatggcaagc tcatggtgag atacaaactg 7980
aattcagagc taccaaaaga gagaggagtt ggagacgcca taaacaacgg cagagaccat 8040
tcgattcaga tcaaaattgg aaaactccaa aagcgtatgt ggataaatgt ggacgttcaa 8100
aacactataa ttgatggtga agtatttgat ttcagcacat attatctggg aggaattcca 8160
attgcaatca gggaaagatt taacatttct acgcctgctt tccgaggctg catgaaaaat 8220
ttgaagaaaa ccagtggtgt cgttagattg aatgatactg tgggagtaac caaaaagtgc 8280
tcggaagact ggaagcttgt gcgatctgcc tcattctcca gaggaggaca attgagtttc 8340
actgatttgg gcttaccacc tactgaccac ctccaggcct catttggatt tcagaccttt 8400
caacccagtg gcatattatt agatcatcag acatggacaa ggaacctgca ggtcactctg 8460
gaagatggtt acattgaatt gagcaccagc gatagcggcg gcccaatttt taaatctcca 8520
cagacgtata tggatggttt actgcattat gtatctgtaa taagcgacaa ctctggacta 8580
cggcttctca tcgatgacca gcttctgaga aatagcaaaa ggctaaaaca catttcaagt 8640
tcccggcagt ctctgcgtct gggcgggagc aattttgagg gttgtattag caatgttttt 8700
gtccagaggt tatcactgag tcctgaagtc ctagatttga ccagtaactc tctcaagaga 8760
gatgtgtccc tgggaggctg cagtttaaac aaaccacctt ttctaatgtt gcttaaaggt 8820
tctaccaggt ttaacaagac caagactttt cgtatcaacc agctgttgca ggacacacca 8880
gtggcctccc caaggagcgt gaaggtgtgg caagatgctt gctcaccact tcccaagacc 8940
caggccaatc atggagccct ccagtttggg gacattccca ccagccactt gctattcaag 9000
cttcctcagg agctgctgaa acccaggtca cagtttgctg tggacatgca gacaacatcc 9060
tccagaggac tggtgtttca cacgggcact aagaactcct ttatggctct ttatctttca 9120
aaaggacgtc tggtctttgc actggggaca gatgggaaaa aattgaggat caaaagcaag 9180
gagaaatgca atgatgggaa atggcacacg gtggtgtttg gccatgatgg ggaaaagggg 9240
cgcttggttg tggatggact gagggcccgg gagggaagtt tgcctggaaa ctccaccatc 9300
agcatcagag cgccagttta cctgggatca cctccatcag ggaaaccaaa gagcctcccc 9360
acaaacagct ttgtgggatg cctgaagaac tttcagctgg attcaaaacc cttgtatacc 9420
ccttcttcaa gcttcggggt gtcttcctgc ttgggtggtc ctttggagaa aggcatttat 9480
ttctctgaag aaggaggtca tgtcgtcttg gctcactctg tattgttggg gccagaattt 9540
aagcttgttt tcagcatccg cccaagaagt ctcactggga tcctaataca catcggaagt 9600
cagcccggga agcacttatg tgtttacctg gaggcaggaa aggtcacggc ctctatggac 9660
agtggggcag gtgggacctc aacgtcggtc acaccaaagc agtctctgtg tgatggacag 9720
tggcactcgg tggcagtcac cataaaacaa cacatcctgc acctggaact ggacacagac 9780
agtagctaca cagctggaca gatccccttc ccacctgcca gcactcaaga gccactacac 9840
cttggaggtg ctccagccaa tttgacgaca ctgaggatcc ctgtgtggaa atcattcttt 9900
ggctgtctga ggaatattca tgtcaatcac atccctgtcc ctgtcactga agccttggaa 9960
gtccaggggc ctgtcagtct gaatggttgt cctgaccagt aa 10002

<210> 25
<211> 10002
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 25
atggctgctg ccgctagacc tagaggtaga gcactgggac ctgtgctgcc tcctacacct 60
ctgctgctgc tggtgctgag agtgcttcct gcttgtggcg ctaccgctag agatcctggt 120
gctgctgcag gactgtctct gcaccccacc tacttcaatc tggccgaggc cgccagaatc 180
tgggccacag ctacatgtgg cgaaagaggc cctggcgaag gcagacctca gcctgagctg 240
tattgcaagc tcgttggcgg ccctacagct cctggatctg gacacacaat ccagggccag 300
ttctgcgact actgcaacag cgaggacccc agaaaggccc atcctgtgac caatgccatc 360
gacggctctg agagatggtg gcagtctcct ccactgagca gcggcaccca gtacaacaga 420
gtgaatctga ccctggacct gggccagctg tttcacgtgg cctacatcct gatcaagttc 480
gccaactctc cccggcctga tctgtgggtg ctcgagagat ctgtggactt cggcagcaca 540
tacagcccct ggcagtactt cgcccacagc aaggtggact gcctgaaaga gttcggccgc 600
gaggccaata tggccgtgac cagagatgac gacgtgctgt gcgtgaccga gtacagcaga 660
atcgtgcccc tggaaaacgg cgaggtggtg gtgtccctga tcaatggtag acctggcgcc 720
aagaacttca ccttcagcca cacactgaga gagttcacca aggccaccaa tatccggctg 780
cggttcctgc ggacaaatac cctgctgggc cacctgatct ctaaggccca aagggacccc 840
accgtgacac ggcggtacta ctacagcatc aaggacatca gcatcggcgg ccagtgcgtg 900
tgtaatggac atgccgaagt gtgcaacatc aacaaccccg agaagctgtt cagatgcgag 960
tgccagcacc acacctgtgg cgagacatgc gatagatgct gcaccggcta caaccagaga 1020
agatggcgac ctgccgcctg ggagcagtct catgaatgcg aggcctgcaa ttgccacggc 1080
cacgccagca actgctacta cgaccccgat gtggaaagac agcaggccag cctgaatacc 1140
cagggcatct atgctggtgg cggcgtgtgc atcaactgtc agcataatac tgccggcgtg 1200
aactgcgagc agtgcgccaa gggctactac agaccttatg gcgtgccagt ggatgcccct 1260
gatggctgca tcccttgcag ctgtgatcct gagcatgccg acggctgtga acaaggctct 1320
ggcagatgtc actgcaagcc caacttccac ggcgacaatt gcgagaagtg tgctatcggg 1380
tactacaact tcccattctg cctgcgcatc cctatcttcc ccgtgtctac acccagctct 1440
gaagatcctg tggccggcga tatcaagggc tgcgactgta atctggaagg cgtgctgcct 1500
gagatctgcg acgcccatgg aagatgcctg tgtagaccag gcgtggaagg ccccagatgc 1560
gatacctgta gatccggctt ctacagcttc cctatctgtc aggcctgctg gtgttctgcc 1620
ctgggcagct atcagatgcc ttgctctagc gtgaccggac agtgcgaatg cagacccggt 1680
gttaccggcc agagatgtga cagatgtctg agcggcgcct acgacttccc acactgtcag 1740
ggaagcagca gcgcctgtga tccagccggc accatcaata gcaacctggg ctactgccag 1800
tgcaagctgc acgtggaagg acctacctgc tctcggtgca aactgctgta ttggaacctg 1860
gacaaagaga accccagcgg ctgcagcgag tgcaagtgtc acaaagccgg cacagtgtct 1920
ggcaccggcg aatgtagaca aggcgacggc gattgccact gcaagtctca cgttggcgga 1980
gacagctgcg acacatgcga ggatggctac ttcgctctgg aaaagtccaa ctacttcgga 2040
tgccagggct gccagtgtga tattggcgga gccctgagca gcatgtgttc tggacctagc 2100
ggagtgtgcc agtgccggga acacgttgtg ggcaaagtct gtcagcggcc cgagaacaac 2160
tactacttcc ccgacctgca ccacatgaag tacgagatcg aggacggcag cacccctaac 2220
ggcagagatc tgagattcgg cttcgaccct ctggcctttc ctgagttctc ttggagaggc 2280
tacgcccaga tgaccagcgt gcagaacgat gtgcggatca ccctgaacgt gggcaagagc 2340
agcggaagcc tgtttagagt gattctgaga tacgtgaacc ccggcaccga ggccgtgtct 2400
ggccacatca caatctaccc tagctggggc gctgcccaga gcaaagagat catcttcctg 2460
cctagcaaag aacccgcctt cgtgaccgtg cctggcaacg gatttgccga tcctttcagc 2520
atcaccccag gcatctgggt cgcctgtatt aaggccgaag gcgtcctgct ggactacctg 2580
gttctgctcc ccagagacta ctacgaggcc tctgttctgc agctgcccgt gacagagcca 2640
tgtgcctatg ctggacctcc tcaagagaat tgcctgctgt accagcatct gcctgtgaca 2700
agattcccct gcacactggc ctgcgaagcc aggcactttc tgctggatgg cgagcctaga 2760
ccagtggccg ttagacagcc tacaccagct caccccgtga tggtggatct gtctggcaga 2820
gaggtggaac tgcacctgag actgagaatc cctcaagtgg gccactacgt ggtggtggtc 2880
gagtactcta cagaggccgc tcagctgttc gtggtggacg tgaacgtgaa gtccagcggc 2940
tctgtgctgg ccggacaagt gaacatctac tcttgcaact actccgtgct gtgtcggagc 3000
gccgtgatcg accacatgag ccggatcgct atgtacgagc tgctggccga tgccgacatc 3060
cagctgaagg gacacatggc cagatttctg ctgcaccaag tgtgcattat ccccatcgaa 3120
gagttcagcg ccgagtacgt cagaccccag gtgcactgta tcgccagcta cggcagattc 3180
gtgaaccaga gcgccacctg tgtgtctctg gcccacgaaa cacctccaac cgctctgatc 3240
ctggacgtgt tgagcggcag accatttcct catctgcccc agcagagcag cccttccgtt 3300
gatgttctgc ctggcgtgac cctgaaggca ccccagaatc aagtgacact gaggggcaga 3360
gtgccccacc tgggcagata tgtgttcgtg atccacttct accaggctgc ccatcctaca 3420
ttccccgctc aagtgtcagt ggatggcgga tggcctagag ccggaagctt tcacgccagc 3480
ttttgccctc acgtgctggg ctgccgcgat caagtgattg ccgagggcca gatcgagttc 3540
gacatcagcg aacctgaagt ggccgccacc gtgaaagtgc ccgagggaaa atctctggtg 3600
ctcgtcagag tgctggtggt gcccgccgag aactacgact atcagatcct gcacaaaaag 3660
agcatggaca agagcctcga gttcatcacc aactgcggca agaactcctt ctatctggac 3720
cctcagaccg ccagccggtt ctgcaagaat agcgctagaa gcctggtggc tttctaccac 3780
aaaggcgccc tgccttgcga gtgtcatcca acaggtgcca ccggacctca ctgtagtcct 3840
gaaggtggcc agtgtccttg ccagcctaac gtgatcggca ggcagtgtac cagatgtgcc 3900
acaggccact atggcttccc tagatgcaag ccctgtagct gcggtagaag gctgtgcgaa 3960
gagatgaccg gccagtgtag gtgccctcct agaaccgtta gaccccagtg tgaagtgtgc 4020
gaaacccaca gcttcagctt tcaccctatg gccggctgcg agggctgtaa ctgtagcaga 4080
agaggcacca tcgaggccgc tatgcccgag tgcgatagag acagcggaca gtgtcggtgc 4140
aagcctagaa tcaccggccg tcagtgcgac agatgcgcca gcggctttta cagatttccc 4200
gagtgtgtgc cctgcaactg caatcgcgac ggaacagaac ctggcgtgtg cgatcctgga 4260
acaggcgctt gcctgtgcaa agaaaatgtg gaaggcaccg agtgtaacgt gtgcagagag 4320
ggcagcttcc atctcgaccc cgccaatctg aagggctgta cctcctgctt ctgcttcgga 4380
gtgaacaacc agtgccacag cagccacaag cggcggacca agttcgtgga tatgctcggc 4440
tggcacctgg aaaccgccga cagagtggat atccctgtgt ccttcaatcc cggcagcaac 4500
agcatggtgg ccgatctgca agagctgcca gccacaattc acagcgcctc ttgggtcgcc 4560
cctacaagct atctgggcga caaggtgtcc tcctacggcg gctacctgac ataccaggcc 4620
aagtcctttg gactgcccgg cgacatggtc ctgctcgaga agaaacctga tgtgcagctg 4680
acaggacagc acatgagcat catctacgag gaaacaaaca cccctcggcc tgaccggctg 4740
catcacggaa gagtgcatgt ggtggaaggg aacttccggc acgcctcttc tagagcccct 4800
gtgtctcggg aagaactgat gaccgtgctg agcagactgg ccgacgttcg gattcagggc 4860
ctgtacttca ccgagactca gcggctgacc ctgtctgaag ttggactgga agaggccagc 4920
gataccggca gcggtagaat tgctctggcc gtggaaatct gcgcctgtcc tccagcttat 4980
gccggcgatt cttgtcaggg atgtagccca ggctactaca gagatcacaa gggcctgtac 5040
accggcagat gcgtgccctg caactgtaac ggccacagca accagtgtca ggacggctct 5100
ggcatctgcg tgaactgcca gcataatact gccggcgagc actgcgagag atgccaagag 5160
ggctactacg gcaatgccgt gcatggcagc tgtcgggctt gtccttgtcc tcacaccaac 5220
agctttgcca ccggctgcgt tgtgaacggc ggagatgttc ggtgttcttg caaggccggc 5280
tacacaggca cacagtgcga aagatgtgcc cctggctact ttggcaaccc tcagaagttt 5340
ggcggctcct gccagccttg ctcctgcaat tctaatggcc agctgggctc ttgtcaccct 5400
ctgaccggcg actgcatcaa tcaagagcct aaggacagca gccctgccga ggaatgcgac 5460
gattgcgata gctgcgtgat gaccctgctg aacgacctgg ccacaatggg cgaacagctg 5520
agactggtca agtcccagct gcagggactg tctgcttctg ccggactgct ggaacagatg 5580
cggcacatgg aaacccaggc caaggacctg agaaaccagc tgctgaacta cagaagcgcc 5640
atctccaacc acggcagcaa gatcgaaggc ctggaaagag agctgaccga cctgaatcaa 5700
gagttcgaga cactgcaaga gaaggcccaa gtgaacagcc ggaaggccca gacactgaac 5760
aacaacgtga accgggccac acagagcgcc aaagaactgg acgtgaagat caagaacgtg 5820
atccggaacg tgcacatcct gctgaagcag atcagcggca cagatggcga gggcaacaat 5880
gtgcctagcg gcgactttag cagagagtgg gccgaagctc agcggatgat gagagagctg 5940
cggaaccgga acttcggcaa gcacctgaga gaagccgagg ccgacaagag agaatctcag 6000
ctgctgctga atcggatcag gacctggcag aaaacccacc agggcgagaa caacggcctg 6060
gccaacagca tcagagacag cctgaatgag tacgaggcca agctgagcga tctgcgggcc 6120
agacttcaag aagctgccgc tcaggccaag caggccaacg gccttaatca agagaacgag 6180
agagccctgg gcgccatcca gagacaagtg aaagagatca acagcctgca gagcgacttc 6240
accaagtacc tgaccaccgc cgatagcagc ctgctgcaga caaatatcgc actgcagctg 6300
atggaaaaga gccagaaaga gtacgaaaag ctggccgcca gcctgaacga ggccaggcaa 6360
gaactgtctg acaaagtgcg cgagctgagc agatccgccg gcaagacatc tctggtggaa 6420
gaggccgaga agcacgccag atctctgcaa gagctggcca aacagctgga agagattaag 6480
cggaacgcca gcggcgacga actcgtcaga tgtgctgtgg atgccgccac cgcctacgag 6540
aacatcctga atgccatcaa ggccgccgag gacgccgcta atagagccgc ttctgcctct 6600
gaaagcgccc tgcagaccgt gatcaaagag gacctgccta gaaaggccaa gactctgagc 6660
agcaacagcg acaaactgct gaatgaggcc aagatgaccc agaagaaact gaagcaagag 6720
gtgtcccctg ctctgaacaa cctgcagcag accctgaaca tcgtgaccgt gcagaaagaa 6780
gtgatcgaca ccaacctgac aaccctgaga gatggcctgc acggaatcca gagaggcgac 6840
atcgacgcca tgatcagcag cgccaagagc atggttcgaa aagccaacga catcaccgac 6900
gaggtgctgg acggcctgaa tcctatccag accgacgtgg aacggatcaa ggacacctac 6960
ggcagaaccc agaacgagga tttcaagaag gccctgaccg acgccgacaa ctccgtgaac 7020
aagctgacca acaagctgcc cgatctgtgg cggaagatcg agagcatcaa ccagcaactg 7080
ctgcccctgg gcaacatcag cgacaacatg gaccggatca gggaactgat ccagcaggcc 7140
agagatgccg cctccaaagt ggctgtgccc atgagattca acggcaagag cggagtggaa 7200
gtgcggctgc ccaacgatct ggaagatctg aagggctata ccagcctgag cctgttcctg 7260
cagaggccca acagcagaga gaatggcggc accgagaata tgttcgtgat gtacctggga 7320
aacaaggacg ccagccggga ctatatcgga atggccgttg tggacggcca gctgacctgc 7380
gtgtacaacc tgggagacag agaagctgag ctgcaggtcg accagatcct gaccaagagc 7440
gagacaaaag aggccgtgat ggacagagtg aagttccagc ggatctacca gttcgcccgg 7500
ctgaattaca ccaagggcgc cacaagcagc aagcccgaaa cacctggcgt gtacgacatg 7560
gacggccgga actctaacac cctgctcaat ctggaccccg agaacgtggt gttttacgtc 7620
ggcggctacc ctcctgactt caagctgcct agcagactga gcttcccacc ttacaagggc 7680
tgcatcgagc tggatgacct gaacgaaaac gtgctgtccc tgtacaactt caaaaagacc 7740
ttcaacctga acaccaccga ggtggaaccc tgcaggcgca gaaaagagga atccgacaag 7800
aactacttcg aaggcaccgg ctacgccaga gtgcctacac aacctcacgc tcccattcct 7860
accttcggcc agaccatcca gacaaccgtg gatagaggcc tgctgttctt cgccgagaac 7920
ggcgacagat tcatctccct gaatatcgag gatggcaagc tgatggtccg atacaagctg 7980
aactccgagc tgcccaaaga aagaggcgtg ggcgacgcca tcaacaacgg cagggatcac 8040
agcatccaga tcaagatcgg caagctgcag aaacggatgt ggatcaacgt ggacgtgcag 8100
aacaccatca tcgacggcga ggtgttcgac ttcagcacct actatctcgg cggaatccct 8160
atcgccatca gagagcggtt caatatcagc acccctgcct tccggggctg catgaagaac 8220
ctgaaaaaga ccagcggcgt cgtgcggctg aatgatacag tgggcgtgac caagaagtgc 8280
agcgaggact ggaagcttgt gcggagcgcc agtttttcta gaggcgggca gctgagcttt 8340
accgacctgg gattgcctcc taccgaccat ctgcaggcaa gcttcggatt ccagaccttc 8400
cagccaagcg gaatcctgct ggaccaccag acctggacca gaaacctgca agtgaccctg 8460
gaagatggct acatcgaact gagcaccagc gactctggcg gccctatctt taagagccct 8520
cagacctaca tggatgggct gctgcactac gtgtccgtga tcagcgataa cagcggcctg 8580
agactgctga tcgacgacca gcttctgcgg aacagcaagc ggctgaagca catctccagc 8640
agcagacaga gtctgagact cggcggcagc aatttcgagg gctgtatcag caacgtgttc 8700
gtgcagcgcc tgagtctgtc tccagaagtg ctggacctga ccagcaatag cctgaagagg 8760
gatgtgtctc tcggcggctg ctccctgaac aaacctcctt tcctgatgct gctcaagggc 8820
tccaccagat tcaacaagac caagaccttt cggatcaatc agctgctcca ggacacccct 8880
gtggctagcc ctagaagcgt gaaagtgtgg caggacgcct gcagtcccct gcctaaaaca 8940
caggccaatc atggggccct gcagttcggc gatatcccca caagccatct gctgtttaag 9000
ctgccccaag agctgctcaa acctcggagc cagtttgccg tggatatgca gaccaccagc 9060
tccagaggac tggtgtttca caccggcacc aagaacagct tcatggccct gtacctgagc 9120
aagggccgcc tggtttttgc cctgggaacc gacggcaaga aactgcggat caagagcaaa 9180
gagaagtgca acgacggaaa gtggcacacc gtggtgttcg gacacgatgg cgagaaaggc 9240
agactggtgg tggatggcct gagagccaga gagggatctc tgcctggcaa ctccaccatc 9300
tccatcagag cccctgtgta tctgggcagc cctcctagcg gaaagcctaa gagcctgcct 9360
accaactcct tcgtgggctg tctgaagaac tttcagctgg acagcaagcc tctgtacacc 9420
cctagctcca gctttggcgt gtcctcctgt ctcggaggcc ctctggaaaa gggcatctac 9480
ttctctgagg aaggcggcca cgttgtcctg gctcattctg ttttgctggg ccccgagttc 9540
aagctggtgt tctccattag gcccagaagc ctgaccggca tcctgattca catcggcagc 9600
cagcctggca aacacctgtg tgtgtatctc gaggccggca aagtgaccgc cagcatggat 9660
tctggtgctg gcggcacaag cacctccgtg acacctaagc agagcctgtg tgatggccag 9720
tggcacagtg tggccgtgac aatcaagcag cacattctgc acctggaact ggacaccgac 9780
agcagctata ccgccggaca gatcccattt cctccagcca gcacacaaga gcctctgcac 9840
cttggaggcg ccccagccaa tctgaccaca ctgagaatcc ccgtgtggaa gtccttcttc 9900
ggctgcctgc ggaatatcca tgtgaaccac attccagtgc ctgtgacaga ggccctggaa 9960
gtgcagggac ccgtgtctct gaatggatgc cccgatcagt ga 10002

<210> 26
<211> 9834
<212> DNA
<213> Homo sapiens
<400> 26
atggcggcgg ccgcgcggcc tcggggtcgg gcactggggc cagtactgcc gccgacgccg 60
ctgctcctgc tggtactgcg ggtgctgcca gcctgcgggg cgaccgctcg ggatcccggg 120
gccgcggccg ggctcagcct tcacccgact tacttcaacc tggccgaggc ggcgaggatt 180
tgggccaccg ccacctgcgg ggagagggga cccggcgagg ggaggcccca gcccgagctc 240
tactgcaagt tggtcggggg ccccaccgcc ccaggcagcg gccacaccat ccagggccag 300
ttctgtgact attgcaattc tgaagacccc aggaaagcac atcctgtcac caatgccatc 360
gatggatctg aacgttggtg gcaaagccct cccctgtcct caggcacaca gtacaacaga 420
gtcaacctca ccttggatct ggggcagctc ttccatgtgg cctatatttt aatcaaattt 480
gcaaattctc ctcgccctga tctttgggtc ttggaaagat ctgtagactt tggaagcacc 540
tactcaccat ggcaatattt tgctcattct aaagtagact gtttaaaaga atttgggcgg 600
gaggcaaata tggctgtcac ccgggatgat gatgtacttt gtgttactga atattcccgt 660
attgtacctt tggaaaatgg tgaggttgtg gtgtccttga taaacggtcg tccaggtgca 720
aaaaatttta ctttctctca caccctgagg gagtttacca aggcaacaaa catccgcttg 780
cgttttctta gaaccaatac gcttcttgga cacctcatct ccaaagccca gcgagatcca 840
actgtcactc ggcggtatta ttacagcata aaggacatca gcattggtgg gcagtgtgtt 900
tgcaatggcc atgctgaagt gtgcaatata aacaatcctg aaaaactgtt tcggtgtgaa 960
tgccagcacc acacctgtgg ggagacgtgt gatcgctgct gcacagggta caatcagagg 1020
cgctggcggc ccgccgcttg ggagcagagc cacgagtgtg aagcatgcaa ctgccacggc 1080
catgccagca actgttacta tgatccagat gttgagcggc agcaggcaag cttgaatacc 1140
cagggcatct atgctggtgg aggggtctgc attaactgtc agcacaacac agctggagta 1200
aactgtgaac agtgtgctaa gggctattac cgcccttatg gggttccagt ggatgcccct 1260
gatggctgca tcccctgcag ctgtgaccct gagcatgcgg atggctgtga acagggttca 1320
ggccgctgtc actgcaagcc aaatttccac ggagacaact gtgagaagtg tgcaattgga 1380
tactacaatt tcccattttg cttgagaatt cccatttttc ctgtttctac accaagttca 1440
gaagatccag tagctggaga tataaaaggg tgtgactgta atctggaagg tgttctccct 1500
gaaatatgtg atgcccacgg acggtgcctg tgccgccctg gggttgaggg ccctcgatgt 1560
gatacctgcc gctctggttt ctactcattc cctatttgcc aagcctgctg gtgttcagcc 1620
cttggatcct accagatgcc ctgcagctca gtgactggac agtgtgaatg tcggccagga 1680
gttacaggac agcggtgtga caggtgtctc tcaggagctt atgatttccc ccactgccaa 1740
ggttccagca gtgcttgtga cccagctggt accatcaact ccaatttggg gtattgccaa 1800
tgcaagcttc atgttgaagg tcctacttgt agccgctgca aactgttata ttggaatctg 1860
gacaaagaaa accccagtgg atgttcagaa tgcaagtgcc ataaggcggg aacagtgagt 1920
ggaactggag agtgtaggca gggagatggt gactgtcact gcaagtccca tgtgggtggc 1980
gattcctgcg acacctgtga agatggatat tttgctttgg aaaagagcaa ttactttggg 2040
tgtcaagggt gtcagtgtga cattggtggg gcattgtcct ccatgtgcag tgggccctcg 2100
ggagtgtgcc agtgccgaga gcatgtcgtg ggaaaggtgt gccagcggcc tgaaaacaac 2160
tactatttcc cagatttgca tcatatgaag tatgagattg aagacggcag cacacctaat 2220
gggagagacc ttcgatttgg atttgatccg ctggcatttc ctgagtttag ctggagagga 2280
tatgcccaaa tgacctcagt acagaatgat gtaagaataa cattgaatgt agggaagtca 2340
agtggctcct tgtttcgtgt tattctgaga tacgttaacc ctggaactga agcagtatct 2400
ggccatataa ctatttatcc atcctggggt gctgctcaaa gcaaagagat catcttcctg 2460
ccgagtaagg agccagcctt tgtcactgtc cctggaaatg gttttgcaga cccattttca 2520
atcacaccag gaatatgggt tgcttgtatt aaggcagaag gagtccttct ggattacctg 2580
gtgctgctcc ccagggacta ctatgaagcc tctgtactgc agctgccagt cacagaacca 2640
tgtgcctacg caggacctcc ccaagaaaat tgcttactct accagcattt gccagtgacc 2700
agattcccct gtaccctggc ttgtgaggcc agacacttcc tgcttgatgg ggagccaaga 2760
cccgtggcag tgaggcagcc cacacctgca caccctgtca tggtggacct cagcgggaga 2820
gaggtggaat tgcatctgcg gctgcgcatc ccacaggttg gccactacgt ggttgtggtc 2880
gagtattcca cggaggcagc tcagctgttt gtggttgatg tgaatgtgaa gagctccggg 2940
tctgttctgg caggccaggt gaacatttac agctgcaact acagtgttct ctgccggagt 3000
gctgtgattg atcacatgag ccgcatcgcc atgtatgagc tattggcaga tgcagacatt 3060
cagctcaagg gacacatggc ccgattcctt ctgcatcaag tttgtatcat acctattgaa 3120
gaattctcag ctgagtatgt gagaccacaa gtccactgca ttgccagtta tgggcgattt 3180
gtcaatcaaa gtgccacctg tgtctccttg gcccatgaaa ctcctccaac agcattaatt 3240
ttggatgttc taagtggcag gcctttccct cacctgcccc agcagtcgtc accttctgtt 3300
gatgttcttc ctggggtcac cttgaaggca ccgcagaatc aagtgaccct gagaggacgt 3360
gtaccacacc tgggccgata cgtctttgtc atccattttt accaagcagc gcacccgacg 3420
tttcccgcgc aggtgtcggt ggatggcggg tggccacggg caggctcctt ccatgcctct 3480
ttttgccccc atgtgcttgg ctgccgggat caagtgattg ccgaaggcca gattgagttt 3540
gacatctcag agcctgaagt ggccgcaact gtgaaggttc cagaaggaaa gtccttggtt 3600
ttggtccgtg ttctagtggt gcctgcagaa aactatgact accaaatact tcacaaaaaa 3660
tccatggaca agtcactcga gtttatcacc aattgtggaa aaaacagctt ttaccttgac 3720
ccccagacag cctccagatt ctgtaagaat tccgccaggt ccctggtggc cttttaccac 3780
aagggcgccc tgccttgtga gtgccacccc actggggcca ccggccctca ctgcagccct 3840
gagggtgggc agtgcccatg ccagcccaac gtcatcgggc ggcagtgcac ccgctgtgca 3900
acaggccact acggattccc acgctgcaag ccgtgcagct gtggtcggcg cctttgtgaa 3960
gagatgacgg ggcagtgccg ctgccctccc cgcacggtca ggccccagtg tgaggtgtgt 4020
gagacacact cattcagctt ccaccccatg gccggctgcg aaggctgcaa ctgttccagg 4080
aggggcacca tcgaggctgc catgccggag tgtgaccggg acagcgggca gtgcagatgc 4140
aagcccagaa tcacagggcg gcagtgtgac cgatgtgctt ccgggtttta ccgctttcct 4200
gagtgtgttc cctgcaattg caacagagat gggactgagc caggagtgtg tgacccaggg 4260
accggggctt gcctctgcaa ggaaaatgta gaaggcacag agtgtaatgt gtgtcgagaa 4320
ggctcattcc atttggaccc agccaatctc aagggttgta ccagctgttt ctgttttgga 4380
gtaaataatc aatgtcacag ctcacataag cgaaggacta agtttgtgga tatgctgggc 4440
tggcacctgg agacagcaga cagagtggac atccctgtct ctttcaaccc aggcagcaac 4500
agtatggtgg cggatctcca ggagctgccc gcaaccatcc acagcgcgtc ctgggtcgca 4560
cccacctcct acctggggga caaggtttct tcatatggtg gttacctcac ttaccaagcc 4620
aagtcctttg gcttgcctgg cgacatggtt cttctggaaa agaagccgga tgtacagctc 4680
actggtcagc acatgtccat catctatgag gagacaaaca ccccacggcc agaccggctg 4740
catcatggac gagtgcacgt ggtcgaggga aacttcagac atgccagcag ccgtgcccca 4800
gtgtctaggg aggagctgat gacagtgctg tctagactgg cagatgtgcg catccaaggc 4860
ctctacttca cagagactca aaggctcacc ctgagcgagg tggggctaga ggaagcctct 4920
gacacaggaa gtgggcgcat agcacttgct gtggaaatct gtgcctgccc ccctgcctac 4980
gctggtgact cttgtcaggg ttgtagccct ggatactatc gggatcataa aggcttgtat 5040
accggacggt gtgttccctg caattgcaac ggacattcaa atcaatgcca ggatggctca 5100
ggcatatgtg ttaactgtca gcacaacacc gcgggagagc actgtgaacg ctgccaggag 5160
ggctactatg gcaacgccgt ccacggatcc tgcagggcct gcccatgtcc tcacactaac 5220
agctttgcca ctggctgtgt ggtgaatggg ggagacgtgc ggtgctcctg caaagctggg 5280
tacacaggaa cacagtgtga aaggtgtgca ccgggatatt tcgggaatcc ccagaaattc 5340
ggaggtagct gccaaccatg cagttgtaac agcaatggcc agctgggcag ctgtcatccc 5400
ctgactggag actgcataaa ccaagaaccc aaagatagca gccctgcaga agaatgtgat 5460
gattgcgaca gctgtgtgat gaccctcctg aacgacctgg ccaccatggg cgagcagctc 5520
cgcctggtca agtctcagct gcagggcctg agtgccagcg cagggcttct ggagcagatg 5580
aggcacatgg agacccaggc caaggacctg aggaatcagt tgctcaacta ccgttctgcc 5640
atttcaaatc atggatcaaa aatagaaggc ctggaaagag aactgactga tttgaatcaa 5700
gaatttgaga ctttgcaaga aaaggctcaa gtaaattcca gaaaagcaca aacattaaac 5760
aacaatgtta atcgggcaac acaaagcgca aaagaactgg atgtgaagat taaaaatgtc 5820
atccggaatg tgcacatgct gaaccggata aggacctggc agaaaaccca ccagggggag 5880
aacaatgggc ttgctaacag tatccgggat tctttaaatg aatacgaagc caaactcagt 5940
gaccttcgtg ctcggctgca ggaggcagct gcccaagcca agcaggcaaa tggcttgaac 6000
caagaaaacg agagagcttt gggagccatt cagagacaag tgaaagaaat aaattccctg 6060
cagagtgatt tcaccaagta tctaaccact gcagactcat ctttgttgca aaccaacatt 6120
gcgctgcagc tgatggagaa aagccagaag gaatatgaaa aattagctgc cagtttaaat 6180
gaagcaagac aagaactaag tgacaaagta agagaacttt ccagatctgc tggcaaaaca 6240
tcccttgtgg aggaggcaga aaagcacgcg cggtccttac aagagctggc aaagcagctg 6300
gaagagatca agagaaacgc cagcggggat gagctggtgc gctgtgctgt ggatgccgcc 6360
accgcctacg agaacatcct caatgccatc aaagcggccg aggacgcagc caacagggct 6420
gccagtgcat ctgaatctgc cctccagaca gtgataaagg aagatctgcc aagaaaagct 6480
aaaaccctga gttccaacag tgataaactg ttaaatgaag ccaagatgac acaaaagaag 6540
ctaaagcaag aagtcagtcc agctctcaac aacctacagc aaaccctgaa tattgtgaca 6600
gttcagaaag aagtgataga caccaatctc acaactctcc gagatggtct tcatgggata 6660
cagagaggtg atattgatgc tatgatcagt agtgcaaaga gcatggtcag aaaggccaac 6720
gacatcacag atgaggttct ggatgggctc aaccccatcc agacagatgt ggaaagaatt 6780
aaggacacct atgggaggac acagaacgaa gacttcaaaa aggctctgac tgatgcagat 6840
aactcggtga ataagttaac caacaaacta cctgatcttt ggcgcaagat tgaaagtatc 6900
aaccaacagc tgttgccctt gggaaacatc tctgacaaca tggacagaat acgagaacta 6960
attcagcagg ccagagatgc tgccagtaag gttgctgtcc ccatgaggtt caatggtaaa 7020
tctggagtcg aagtccgact gccaaatgac ctggaagatt tgaaaggata tacatctctg 7080
tccttgtttc tccaaaggcc caactcaaga gaaaatgggg gtactgagaa tatgtttgtg 7140
atgtaccttg gaaataaaga tgcctcccgg gactacatcg gcatggcagt tgtggatggc 7200
cagctcacct gtgtctacaa cctgggggac cgtgaggctg aactccaagt ggaccagatc 7260
ttgaccaaga gtgagactaa ggaggcagtt atggatcggg tgaaatttca gagaatttat 7320
cagtttgcaa ggcttaatta caccaaagga gccacatcca gtaaaccaga aacacccgga 7380
gtctatgaca tggatggtag aaatagcaat acactcctta atttggatcc tgaaaatgtt 7440
gtattttatg ttggaggtta cccacctgat tttaaacttc ccagtcgact aagtttccct 7500
ccatacaaag gttgtattga attagatgac ctcaatgaaa atgttctgag cttgtacaac 7560
ttcaaaaaaa cattcaatct caacacaact gaagtggagc cttgtagaag gaggaaggaa 7620
gagtcagaca aaaattattt tgaaggtacg ggctatgctc gagttccaac tcaaccacat 7680
gctcccatcc caacctttgg acagacaatt cagaccaccg tggatagagg cttgctgttc 7740
tttgcagaaa acggggatcg cttcatatct ctaaatatag aagatggcaa gctcatggtg 7800
agatacaaac tgaattcaga gctaccaaaa gagagaggag ttggagacgc cataaacaac 7860
ggcagagacc attcgattca gatcaaaatt ggaaaactcc aaaagcgtat gtggataaat 7920
gtggacgttc aaaacactat aattgatggt gaagtatttg atttcagcac atattatctg 7980
ggaggaattc caattgcaat cagggaaaga tttaacattt ctacgcctgc tttccgaggc 8040
tgcatgaaaa atttgaagaa aaccagtggt gtcgttagat tgaatgatac tgtgggagta 8100
accaaaaagt gctcggaaga ctggaagctt gtgcgatctg cctcattctc cagaggagga 8160
caattgagtt tcactgattt gggcttacca cctactgacc acctccaggc ctcatttgga 8220
tttcagacct ttcaacccag tggcatatta ttagatcatc agacatggac aaggaacctg 8280
caggtcactc tggaagatgg ttacattgaa ttgagcacca gcgatagcgg cggcccaatt 8340
tttaaatctc cacagacgta tatggatggt ttactgcatt atgtatctgt aataagcgac 8400
aactctggac tacggcttct catcgatgac cagcttctga gaaatagcaa aaggctaaaa 8460
cacatttcaa gttcccggca gtctctgcgt ctgggcggga gcaattttga gggttgtatt 8520
agcaatgttt ttgtccagag gttatcactg agtcctgaag tcctagattt gaccagtaac 8580
tctctcaaga gagatgtgtc cctgggaggc tgcagtttaa acaaaccacc ttttctaatg 8640
ttgcttaaag gttctaccag gtttaacaag accaagactt ttcgtatcaa ccagctgttg 8700
caggacacac cagtggcctc cccaaggagc gtgaaggtgt ggcaagatgc ttgctcacca 8760
cttcccaaga cccaggccaa tcatggagcc ctccagtttg gggacattcc caccagccac 8820
ttgctattca agcttcctca ggagctgctg aaacccaggt cacagtttgc tgtggacatg 8880
cagacaacat cctccagagg actggtgttt cacacgggca ctaagaactc ctttatggct 8940
ctttatcttt caaaaggacg tctggtcttt gcactgggga cagatgggaa aaaattgagg 9000
atcaaaagca aggagaaatg caatgatggg aaatggcaca cggtggtgtt tggccatgat 9060
ggggaaaagg ggcgcttggt tgtggatgga ctgagggccc gggagggaag tttgcctgga 9120
aactccacca tcagcatcag agcgccagtt tacctgggat cacctccatc agggaaacca 9180
aagagcctcc ccacaaacag ctttgtggga tgcctgaaga actttcagct ggattcaaaa 9240
cccttgtata ccccttcttc aagcttcggg gtgtcttcct gcttgggtgg tcctttggag 9300
aaaggcattt atttctctga agaaggaggt catgtcgtct tggctcactc tgtattgttg 9360
gggccagaat ttaagcttgt tttcagcatc cgcccaagaa gtctcactgg gatcctaata 9420
cacatcggaa gtcagcccgg gaagcactta tgtgtttacc tggaggcagg aaaggtcacg 9480
gcctctatgg acagtggggc aggtgggacc tcaacgtcgg tcacaccaaa gcagtctctg 9540
tgtgatggac agtggcactc ggtggcagtc accataaaac aacacatcct gcacctggaa 9600
ctggacacag acagtagcta cacagctgga cagatcccct tcccacctgc cagcactcaa 9660
gagccactac accttggagg tgctccagcc aatttgacga cactgaggat ccctgtgtgg 9720
aaatcattct ttggctgtct gaggaatatt catgtcaatc acatccctgt ccctgtcact 9780
gaagccttgg aagtccaggg gcctgtcagt ctgaatggtt gtcctgacca gtaa 9834

<210> 27
<211> 9834
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 27
atggctgctg ccgctagacc tagaggtaga gcactgggac ctgtgctgcc tcctacacct 60
ctgctgctgc tggtgctgag agtgcttcct gcttgtggcg ctaccgctag agatcctggt 120
gctgctgcag gactgtctct gcaccccacc tacttcaatc tggccgaggc cgccagaatc 180
tgggccacag ctacatgtgg cgaaagaggc cctggcgaag gcagacctca gcctgagctg 240
tattgcaagc tcgttggcgg ccctacagct cctggatctg gacacacaat ccagggccag 300
ttctgcgact actgcaacag cgaggacccc agaaaggccc atcctgtgac caatgccatc 360
gacggctctg agagatggtg gcagtctcct ccactgagca gcggcaccca gtacaacaga 420
gtgaatctga ccctggacct gggccagctg tttcacgtgg cctacatcct gatcaagttc 480
gccaactctc cccggcctga tctgtgggtg ctcgagagat ctgtggactt cggcagcaca 540
tacagcccct ggcagtactt cgcccacagc aaggtggact gcctgaaaga gttcggccgc 600
gaggccaata tggccgtgac cagagatgac gacgtgctgt gcgtgaccga gtacagcaga 660
atcgtgcccc tggaaaacgg cgaggtggtg gtgtccctga tcaatggtag acctggcgcc 720
aagaacttca ccttcagcca cacactgaga gagttcacca aggccaccaa tatccggctg 780
cggttcctgc ggacaaatac cctgctgggc cacctgatct ctaaggccca aagggacccc 840
accgtgacac ggcggtacta ctacagcatc aaggacatca gcatcggcgg ccagtgcgtg 900
tgtaatggac atgccgaagt gtgcaacatc aacaaccccg agaagctgtt cagatgcgag 960
tgccagcacc acacctgtgg cgagacatgc gatagatgct gcaccggcta caaccagaga 1020
agatggcgac ctgccgcctg ggagcagtct catgaatgcg aggcctgcaa ttgccacggc 1080
cacgccagca actgctacta cgaccccgat gtggaaagac agcaggccag cctgaatacc 1140
cagggcatct atgctggtgg cggcgtgtgc atcaactgtc agcataatac tgccggcgtg 1200
aactgcgagc agtgcgccaa gggctactac agaccttatg gcgtgccagt ggatgcccct 1260
gatggctgca tcccttgcag ctgtgatcct gagcatgccg acggctgtga acaaggctct 1320
ggcagatgtc actgcaagcc caacttccac ggcgacaatt gcgagaagtg tgctatcggg 1380
tactacaact tcccattctg cctgcgcatc cctatcttcc ccgtgtctac acccagctct 1440
gaagatcctg tggccggcga tatcaagggc tgcgactgta atctggaagg cgtgctgcct 1500
gagatctgcg acgcccatgg aagatgcctg tgtagaccag gcgtggaagg ccccagatgc 1560
gatacctgta gatccggctt ctacagcttc cctatctgtc aggcctgctg gtgttctgcc 1620
ctgggcagct atcagatgcc ttgctctagc gtgaccggac agtgcgaatg cagacccggt 1680
gttaccggcc agagatgtga cagatgtctg agcggcgcct acgacttccc acactgtcag 1740
ggaagcagca gcgcctgtga tccagccggc accatcaata gcaacctggg ctactgccag 1800
tgcaagctgc acgtggaagg acctacctgc tctcggtgca aactgctgta ttggaacctg 1860
gacaaagaga accccagcgg ctgcagcgag tgcaagtgtc acaaagccgg cacagtgtct 1920
ggcaccggcg aatgtagaca aggcgacggc gattgccact gcaagtctca cgttggcgga 1980
gacagctgcg acacatgcga ggatggctac ttcgctctgg aaaagtccaa ctacttcgga 2040
tgccagggct gccagtgtga tattggcgga gccctgagca gcatgtgttc tggacctagc 2100
ggagtgtgcc agtgccggga acacgttgtg ggcaaagtct gtcagcggcc cgagaacaac 2160
tactacttcc ccgacctgca ccacatgaag tacgagatcg aggacggcag cacccctaac 2220
ggcagagatc tgagattcgg cttcgaccct ctggcctttc ctgagttctc ttggagaggc 2280
tacgcccaga tgaccagcgt gcagaacgat gtgcggatca ccctgaacgt gggcaagagc 2340
agcggaagcc tgtttagagt gattctgaga tacgtgaacc ccggcaccga ggccgtgtct 2400
ggccacatca caatctaccc tagctggggc gctgcccaga gcaaagagat catcttcctg 2460
cctagcaaag aacccgcctt cgtgaccgtg cctggcaacg gatttgccga tcctttcagc 2520
atcaccccag gcatctgggt cgcctgtatt aaggccgaag gcgtcctgct ggactacctg 2580
gttctgctcc ccagagacta ctacgaggcc tctgttctgc agctgcccgt gacagagcca 2640
tgtgcctatg ctggacctcc tcaagagaat tgcctgctgt accagcatct gcctgtgaca 2700
agattcccct gcacactggc ctgcgaagcc aggcactttc tgctggatgg cgagcctaga 2760
ccagtggccg ttagacagcc tacaccagct caccccgtga tggtggatct gtctggcaga 2820
gaggtggaac tgcacctgag actgagaatc cctcaagtgg gccactacgt ggtggtggtc 2880
gagtactcta cagaggccgc tcagctgttc gtggtggacg tgaacgtgaa gtccagcggc 2940
tctgtgctgg ccggacaagt gaacatctac tcttgcaact actccgtgct gtgtcggagc 3000
gccgtgatcg accacatgag ccggatcgct atgtacgagc tgctggccga tgccgacatc 3060
cagctgaagg gacacatggc cagatttctg ctgcaccaag tgtgcattat ccccatcgaa 3120
gagttcagcg ccgagtacgt cagaccccag gtgcactgta tcgccagcta cggcagattc 3180
gtgaaccaga gcgccacctg tgtgtctctg gcccacgaaa cacctccaac cgctctgatc 3240
ctggacgtgt tgagcggcag accatttcct catctgcccc agcagagcag cccttccgtt 3300
gatgttctgc ctggcgtgac cctgaaggca ccccagaatc aagtgacact gaggggcaga 3360
gtgccccacc tgggcagata tgtgttcgtg atccacttct accaggctgc ccatcctaca 3420
ttccccgctc aagtgtcagt ggatggcgga tggcctagag ccggaagctt tcacgccagc 3480
ttttgccctc acgtgctggg ctgccgcgat caagtgattg ccgagggcca gatcgagttc 3540
gacatcagcg aacctgaagt ggccgccacc gtgaaagtgc ccgagggaaa atctctggtg 3600
ctcgtcagag tgctggtggt gcccgccgag aactacgact atcagatcct gcacaaaaag 3660
agcatggaca agagcctcga gttcatcacc aactgcggca agaactcctt ctatctggac 3720
cctcagaccg ccagccggtt ctgcaagaat agcgctagaa gcctggtggc tttctaccac 3780
aaaggcgccc tgccttgcga gtgtcatcca acaggtgcca ccggacctca ctgtagtcct 3840
gaaggtggcc agtgtccttg ccagcctaac gtgatcggca ggcagtgtac cagatgtgcc 3900
acaggccact atggcttccc tagatgcaag ccctgtagct gcggtagaag gctgtgcgaa 3960
gagatgaccg gccagtgtag gtgccctcct agaaccgtta gaccccagtg tgaagtgtgc 4020
gaaacccaca gcttcagctt tcaccctatg gccggctgcg agggctgtaa ctgtagcaga 4080
agaggcacca tcgaggccgc tatgcccgag tgcgatagag acagcggaca gtgtcggtgc 4140
aagcctagaa tcaccggccg tcagtgcgac agatgcgcca gcggctttta cagatttccc 4200
gagtgtgtgc cctgcaactg caatcgcgac ggaacagaac ctggcgtgtg cgatcctgga 4260
acaggcgctt gcctgtgcaa agaaaatgtg gaaggcaccg agtgtaacgt gtgcagagag 4320
ggcagcttcc atctcgaccc cgccaatctg aagggctgta cctcctgctt ctgcttcgga 4380
gtgaacaacc agtgccacag cagccacaag cggcggacca agttcgtgga tatgctcggc 4440
tggcacctgg aaaccgccga cagagtggat atccctgtgt ccttcaatcc cggcagcaac 4500
agcatggtgg ccgatctgca agagctgcca gccacaattc acagcgcctc ttgggtcgcc 4560
cctacaagct atctgggcga caaggtgtcc tcctacggcg gctacctgac ataccaggcc 4620
aagtcctttg gactgcccgg cgacatggtc ctgctcgaga agaaacctga tgtgcagctg 4680
acaggacagc acatgagcat catctacgag gaaacaaaca cccctcggcc tgaccggctg 4740
catcacggaa gagtgcatgt ggtggaaggg aacttccggc acgcctcttc tagagcccct 4800
gtgtctcggg aagaactgat gaccgtgctg agcagactgg ccgacgttcg gattcagggc 4860
ctgtacttca ccgagactca gcggctgacc ctgtctgaag ttggactgga agaggccagc 4920
gataccggca gcggtagaat tgctctggcc gtggaaatct gcgcctgtcc tccagcttat 4980
gccggcgatt cttgtcaggg atgtagccca ggctactaca gagatcacaa gggcctgtac 5040
accggcagat gcgtgccctg caactgtaac ggccacagca accagtgtca ggacggctct 5100
ggcatctgcg tgaactgcca gcataatact gccggcgagc actgcgagag atgccaagag 5160
ggctactacg gcaatgccgt gcatggcagc tgtcgggctt gtccttgtcc tcacaccaac 5220
agctttgcca ccggctgcgt tgtgaacggc ggagatgttc ggtgttcttg caaggccggc 5280
tacacaggca cacagtgcga aagatgtgcc cctggctact ttggcaaccc tcagaagttt 5340
ggcggctcct gccagccttg ctcctgcaat tctaatggcc agctgggctc ttgtcaccct 5400
ctgaccggcg actgcatcaa tcaagagcct aaggacagca gccctgccga ggaatgcgac 5460
gattgcgata gctgcgtgat gaccctgctg aacgacctgg ccacaatggg cgaacagctg 5520
agactggtca agtcccagct gcagggactg tctgcttctg ccggactgct ggaacagatg 5580
cggcacatgg aaacccaggc caaggacctg agaaaccagc tgctgaacta cagaagcgcc 5640
atctccaacc acggcagcaa gatcgaaggc ctggaaagag agctgaccga cctgaatcaa 5700
gagttcgaga cactgcaaga gaaggcccaa gtgaacagcc ggaaggccca gacactgaac 5760
aacaacgtga accgggccac acagagcgcc aaagaactgg acgtgaagat caagaacgtg 5820
atccggaacg tgcacatgct gaaccggatc agaacctggc agaaaaccca ccagggcgag 5880
aacaacggcc tggccaacag catcagagac agcctgaatg agtacgaggc caagctgagc 5940
gatctgcggg ccagacttca agaagctgcc gctcaggcca agcaggccaa cggccttaat 6000
caagagaacg agagagccct gggcgccatc cagagacaag tgaaagagat caacagcctg 6060
cagagcgact tcaccaagta cctgaccacc gccgatagca gcctgctgca gacaaatatc 6120
gcactgcagc tgatggaaaa gagccagaaa gagtacgaaa agctggccgc cagcctgaac 6180
gaggccagac aagagctgtc tgacaaagtg cgcgagctgt ctagaagcgc cggcaagaca 6240
tctctggtgg aagaggccga gaagcacgcc agatctctgc aagagctggc caaacagctg 6300
gaagagatta agcggaacgc cagcggcgac gaactcgtca gatgtgctgt ggatgccgcc 6360
accgcctacg agaacatcct gaatgccatc aaggccgccg aggacgccgc taatagagcc 6420
gcttctgcct ctgaaagcgc cctgcagacc gtgatcaaag aggacctgcc tagaaaggcc 6480
aagactctga gcagcaacag cgacaaactg ctgaatgagg ccaagatgac ccagaagaaa 6540
ctgaagcaag aggtgtcccc tgctctgaac aacctgcagc agaccctgaa catcgtgacc 6600
gtgcagaaag aagtgatcga caccaacctg acaaccctga gagatggcct gcacggaatc 6660
cagagaggcg acatcgacgc catgatcagc agcgccaaga gcatggttcg aaaagccaac 6720
gacatcaccg acgaggtgct ggacggcctg aatcctatcc agaccgacgt ggaacggatc 6780
aaggacacct acggcagaac ccagaacgag gatttcaaga aggccctgac cgacgccgac 6840
aactccgtga acaagctgac caacaagctg cccgatctgt ggcggaagat cgagagcatc 6900
aaccagcaac tgctgcccct gggcaacatc agcgacaaca tggacagaat ccgcgagctg 6960
atccagcagg ccagagatgc cgcctctaaa gtggccgtgc ctatgcggtt caatggcaag 7020
tctggcgtgg aagtgcggct gcccaacgat ctggaagatc tgaagggcta taccagcctg 7080
agcctgttcc tgcagaggcc caacagcaga gagaatggcg gcaccgagaa tatgttcgtg 7140
atgtacctgg gaaacaagga cgccagccgg gactatatcg gaatggccgt tgtggacggc 7200
cagctgacct gcgtgtacaa cctgggagat agagaagccg agctgcaggt cgaccagatc 7260
ctgaccaaga gcgagacaaa agaggccgtg atggacagag tgaagttcca gcggatctac 7320
cagttcgccc ggctgaatta caccaagggc gccacaagca gcaagcccga aacacctggc 7380
gtgtacgaca tggacggccg gaactctaac actctgctga atctggaccc cgagaacgtg 7440
gtgttttacg tcggcggcta ccctcctgac ttcaagctgc ctagcagact gagcttccca 7500
ccttacaagg gctgcatcga gctggatgac ctgaacgaaa acgtgctgtc cctgtacaac 7560
ttcaaaaaga ccttcaacct gaacaccacc gaggtggaac cctgcaggcg cagaaaagag 7620
gaatccgaca agaactactt cgaaggcacc ggctacgcca gagtgcctac acaacctcac 7680
gctcccattc ctaccttcgg ccagaccatc cagacaaccg tggatagagg cctgctgttc 7740
ttcgccgaga acggcgacag attcatctcc ctgaatatcg aggatggcaa gctgatggtc 7800
cgatacaagc tgaactccga gctgcccaaa gaaagaggcg tgggcgacgc catcaacaac 7860
ggcagggatc acagcatcca gatcaagatc ggcaagctgc agaaacggat gtggatcaac 7920
gtggacgtgc agaacaccat catcgacggc gaggtgttcg acttcagcac ctactatctc 7980
ggcggaatcc ctatcgccat cagagagcgg tttaacatca gcacccctgc cttccggggc 8040
tgcatgaaga acctgaaaaa gaccagcggc gtcgtgcggc tgaatgatac agtgggcgtg 8100
accaagaagt gcagcgagga ctggaagctt gtgcggagcg cctcttttag cagaggcggg 8160
cagctgagct ttaccgatct gggactgcct cctaccgacc atctgcaggc aagcttcgga 8220
ttccagacct tccagcctag cggcatcctg ctggaccacc agacctggac cagaaacctg 8280
caagtgaccc tggaagatgg ctatatcgag ctgagcacca gcgactctgg cggccctatc 8340
tttaagagcc ctcagaccta catggatggg ctgctgcact acgtgtccgt gatcagcgat 8400
aacagcggcc tgagactgct gatcgacgac cagcttctgc ggaacagcaa gcggctgaag 8460
cacatcagca gcagcaggca gagtctgaga ctcggcggca gcaatttcga gggctgtatc 8520
agcaacgtgt tcgtgcagcg cctgagtctg tctcccgaag tgctggacct gaccagcaat 8580
agcctgaaga gggatgtgtc tctcggcggc tgctccctga acaaacctcc tttcctgatg 8640
ctgctcaagg gctccaccag attcaacaag accaagacct ttcggatcaa tcagctgctc 8700
caggacaccc ctgtggctag ccctagaagc gtgaaagtgt ggcaggacgc ctgcagtccc 8760
ctgcctaaaa cacaggccaa tcatggggcc ctgcagttcg gcgatatccc cacaagccat 8820
ctgctgttta agctgcccca agagctgctc aaacctcgga gccagtttgc cgtggatatg 8880
cagaccacca gctccagagg actggtgttt cacaccggca ccaagaacag cttcatggcc 8940
ctgtacctga gcaagggccg cctggttttt gccctgggca cagacggcaa gaaactgcgg 9000
atcaagagca aagagaagtg caacgacggc aagtggcaca ccgtggtgtt cggacacgat 9060
ggcgagaaag gcagactggt ggtggatggc ctgagagcca gagagggatc tctgcctggc 9120
aactccacca tctccatcag agcccctgtg tatctgggca gccctcctag cggaaagcct 9180
aagagcctgc ctaccaactc cttcgtgggc tgtctgaaga actttcagct ggacagcaag 9240
cctctgtaca cccctagcag cagctttggc gtgtcctcct gtctcggagg ccctctggaa 9300
aagggcatct acttctctga ggaaggcggc cacgttgtcc tggctcattc tgttttgctg 9360
ggccccgagt tcaagctggt gttctccatt aggcccagaa gcctgacagg catcctgatt 9420
cacatcggca gccagcctgg caagcacctg tgtgtgtatc tcgaggccgg caaagtgacc 9480
gccagcatgg attctggtgc cggcggaaca agcacaagcg tgacacctaa gcagagcctg 9540
tgcgacggac agtggcatag tgtggccgtg accatcaagc agcacatcct gcacctggaa 9600
ctggacaccg acagcagcta taccgccgga cagatcccat ttcctccagc cagcacacaa 9660
gagcctctgc accttggagg cgcccctgcc aatctgacca cactgagaat ccccgtgtgg 9720
aagtccttct tcggctgcct gcggaatatc catgtgaacc acattccagt gcctgtgaca 9780
gaggccctgg aagtgcaggg acccgtgtct ctgaatggat gccccgatca gtga 9834

<210> 28
<211> 5007
<212> DNA
<213> Homo sapiens
<400> 28
atgcctccag cagtgaggcg gtcagcctgc agcatgggat ggctgtggat ctttggggca 60
gccctggggc agtgtctggg ctacagttca cagcagcaaa gggtgccatt tcttcagcct 120
cccggtcaaa gtcaactgca agcgagttat gtggagttta gacccagcca gggttgtagc 180
cctggatact atcgggatca taaaggcttg tataccggac ggtgtgttcc ctgcaattgc 240
aacggacatt caaatcaatg ccaggatggc tcaggcatat gtgttaactg tcagcacaac 300
accgcgggag agcactgtga acgctgccag gagggctact atggcaacgc cgtccacgga 360
tcctgcaggg cctgcccatg tcctcacact aacagctttg ccactggctg tgtggtgaat 420
gggggagacg tgcggtgctc ctgcaaagct gggtacacag gaacacagtg tgaaaggtgt 480
gcaccgggat atttcgggaa tccccagaaa ttcggaggta gctgccaacc atgcagttgt 540
aacagcaatg gccagctggg cagctgtcat cccctgactg gagactgcat aaaccaagaa 600
cccaaagata gcagccctgc agaagaatgt gatgattgcg acagctgtgt gatgaccctc 660
ctgaacgacc tggccaccat gggcgagcag ctccgcctgg tcaagtctca gctgcagggc 720
ctgagtgcca gcgcagggct tctggagcag atgaggcaca tggagaccca ggccaaggac 780
ctgaggaatc agttgctcaa ctaccgttct gccatttcaa atcatggatc aaaaatagaa 840
ggcctggaaa gagaactgac tgatttgaat caagaatttg agactttgca agaaaaggct 900
caagtaaatt ccagaaaagc acaaacatta aacaacaatg ttaatcgggc aacacaaagc 960
gcaaaagaac tggatgtgaa gattaaaaat gtcatccgga atgtgcacat gctgaaccgg 1020
ataaggacct ggcagaaaac ccaccagggg gagaacaatg ggcttgctaa cagtatccgg 1080
gattctttaa atgaatacga agccaaactc agtgaccttc gtgctcggct gcaggaggca 1140
gctgcccaag ccaagcaggc aaatggcttg aaccaagaaa acgagagagc tttgggagcc 1200
attcagagac aagtgaaaga aataaattcc ctgcagagtg atttcaccaa gtatctaacc 1260
actgcagact catctttgtt gcaaaccaac attgcgctgc agctgatgga gaaaagccag 1320
aaggaatatg aaaaattagc tgccagttta aatgaagcaa gacaagaact aagtgacaaa 1380
gtaagagaac tttccagatc tgctggcaaa acatcccttg tggaggaggc agaaaagcac 1440
gcgcggtcct tacaagagct ggcaaagcag ctggaagaga tcaagagaaa cgccagcggg 1500
gatgagctgg tgcgctgtgc tgtggatgcc gccaccgcct acgagaacat cctcaatgcc 1560
atcaaagcgg ccgaggacgc agccaacagg gctgccagtg catctgaatc tgccctccag 1620
acagtgataa aggaagatct gccaagaaaa gctaaaaccc tgagttccaa cagtgataaa 1680
ctgttaaatg aagccaagat gacacaaaag aagctaaagc aagaagtcag tccagctctc 1740
aacaacctac agcaaaccct gaatattgtg acagttcaga aagaagtgat agacaccaat 1800
ctcacaactc tccgagatgg tcttcatggg atacagagag gtgatattga tgctatgatc 1860
agtagtgcaa agagcatggt cagaaaggcc aacgacatca cagatgaggt tctggatggg 1920
ctcaacccca tccagacaga tgtggaaaga attaaggaca cctatgggag gacacagaac 1980
gaagacttca aaaaggctct gactgatgca gataactcgg tgaataagtt aaccaacaaa 2040
ctacctgatc tttggcgcaa gattgaaagt atcaaccaac agctgttgcc cttgggaaac 2100
atctctgaca acatggacag aatacgagaa ctaattcagc aggccagaga tgctgccagt 2160
aaggttgctg tccccatgag gttcaatggt aaatctggag tcgaagtccg actgccaaat 2220
gacctggaag atttgaaagg atatacatct ctgtccttgt ttctccaaag gcccaactca 2280
agagaaaatg ggggtactga gaatatgttt gtgatgtacc ttggaaataa agatgcctcc 2340
cgggactaca tcggcatggc agttgtggat ggccagctca cctgtgtcta caacctgggg 2400
gaccgtgagg ctgaactcca agtggaccag atcttgacca agagtgagac taaggaggca 2460
gttatggatc gggtgaaatt tcagagaatt tatcagtttg caaggcttaa ttacaccaaa 2520
ggagccacat ccagtaaacc agaaacaccc ggagtctatg acatggatgg tagaaatagc 2580
aatacactcc ttaatttgga tcctgaaaat gttgtatttt atgttggagg ttacccacct 2640
gattttaaac ttcccagtcg actaagtttc cctccataca aaggttgtat tgaattagat 2700
gacctcaatg aaaatgttct gagcttgtac aacttcaaaa aaacattcaa tctcaacaca 2760
actgaagtgg agccttgtag aaggaggaag gaagagtcag acaaaaatta ttttgaaggt 2820
acgggctatg ctcgagttcc aactcaacca catgctccca tcccaacctt tggacagaca 2880
attcagacca ccgtggatag aggcttgctg ttctttgcag aaaacgggga tcgcttcata 2940
tctctaaata tagaagatgg caagctcatg gtgagataca aactgaattc agagctacca 3000
aaagagagag gagttggaga cgccataaac aacggcagag accattcgat tcagatcaaa 3060
attggaaaac tccaaaagcg tatgtggata aatgtggacg ttcaaaacac tataattgat 3120
ggtgaagtat ttgatttcag cacatattat ctgggaggaa ttccaattgc aatcagggaa 3180
agatttaaca tttctacgcc tgctttccga ggctgcatga aaaatttgaa gaaaaccagt 3240
ggtgtcgtta gattgaatga tactgtggga gtaaccaaaa agtgctcgga agactggaag 3300
cttgtgcgat ctgcctcatt ctccagagga ggacaattga gtttcactga tttgggctta 3360
ccacctactg accacctcca ggcctcattt ggatttcaga cctttcaacc cagtggcata 3420
ttattagatc atcagacatg gacaaggaac ctgcaggtca ctctggaaga tggttacatt 3480
gaattgagca ccagcgatag cggcggccca atttttaaat ctccacagac gtatatggat 3540
ggtttactgc attatgtatc tgtaataagc gacaactctg gactacggct tctcatcgat 3600
gaccagcttc tgagaaatag caaaaggcta aaacacattt caagttcccg gcagtctctg 3660
cgtctgggcg ggagcaattt tgagggttgt attagcaatg tttttgtcca gaggttatca 3720
ctgagtcctg aagtcctaga tttgaccagt aactctctca agagagatgt gtccctggga 3780
ggctgcagtt taaacaaacc accttttcta atgttgctta aaggttctac caggtttaac 3840
aagaccaaga cttttcgtat caaccagctg ttgcaggaca caccagtggc ctccccaagg 3900
agcgtgaagg tgtggcaaga tgcttgctca ccacttccca agacccaggc caatcatgga 3960
gccctccagt ttggggacat tcccaccagc cacttgctat tcaagcttcc tcaggagctg 4020
ctgaaaccca ggtcacagtt tgctgtggac atgcagacaa catcctccag aggactggtg 4080
tttcacacgg gcactaagaa ctcctttatg gctctttatc tttcaaaagg acgtctggtc 4140
tttgcactgg ggacagatgg gaaaaaattg aggatcaaaa gcaaggagaa atgcaatgat 4200
gggaaatggc acacggtggt gtttggccat gatggggaaa aggggcgctt ggttgtggat 4260
ggactgaggg cccgggaggg aagtttgcct ggaaactcca ccatcagcat cagagcgcca 4320
gtttacctgg gatcacctcc atcagggaaa ccaaagagcc tccccacaaa cagctttgtg 4380
ggatgcctga agaactttca gctggattca aaacccttgt ataccccttc ttcaagcttc 4440
ggggtgtctt cctgcttggg tggtcctttg gagaaaggca tttatttctc tgaagaagga 4500
ggtcatgtcg tcttggctca ctctgtattg ttggggccag aatttaagct tgttttcagc 4560
atccgcccaa gaagtctcac tgggatccta atacacatcg gaagtcagcc cgggaagcac 4620
ttatgtgttt acctggaggc aggaaaggtc acggcctcta tggacagtgg ggcaggtggg 4680
acctcaacgt cggtcacacc aaagcagtct ctgtgtgatg gacagtggca ctcggtggca 4740
gtcaccataa aacaacacat cctgcacctg gaactggaca cagacagtag ctacacagct 4800
ggacagatcc ccttcccacc tgccagcact caagagccac tacaccttgg aggtgctcca 4860
gccaatttga cgacactgag gatccctgtg tggaaatcat tctttggctg tctgaggaat 4920
attcatgtca atcacatccc tgtccctgtc actgaagcct tggaagtcca ggggcctgtc 4980
agtctgaatg gttgtcctga ccagtaa 5007

<210> 29
<211> 5007
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 29
atgcctcctg ctgtgcggag aagcgcctgt tctatgggat ggctgtggat ctttggcgcc 60
gctctgggac agtgtctggg ctactcttct cagcagcagc gggtgccatt tctgcagcca 120
cctggacagt ctcagctgca ggccagctac gtggaatttc ggcctagcca gggatgcagc 180
ccaggctact acagagatca caagggcctg tacaccggca gatgcgtgcc ctgcaactgt 240
aacggccaca gcaaccagtg tcaggacggc tctggcatct gcgtgaactg ccagcataat 300
actgccggcg agcactgcga gagatgccaa gagggctact acggcaatgc cgtgcatggc 360
agctgtcggg cttgtccttg tcctcacacc aacagctttg ccaccggctg cgttgtgaac 420
ggcggagatg ttcggtgttc ttgcaaggcc ggctacacag gcacacagtg cgaaagatgt 480
gcccctggct actttggcaa ccctcagaag tttggcggct cctgccagcc ttgctcctgc 540
aattctaatg gccagctggg ctcttgtcac cctctgaccg gcgactgcat caatcaagag 600
cctaaggaca gcagccctgc cgaggaatgc gacgattgcg atagctgcgt gatgaccctg 660
ctgaacgacc tggccacaat gggagaacag ctgcggctgg ttaagagcca gctccaggga 720
ctgtctgcct ctgctggact gctggaacag atgcggcaca tggaaaccca ggccaaggac 780
ctgagaaacc agctgctgaa ctacagaagc gccatctcca accacggcag caagatcgaa 840
ggcctggaaa gagagctgac cgacctgaat caagagttcg agacactgca agagaaggcc 900
caagtgaaca gccggaaggc ccagactctg aacaacaacg tgaaccgggc cacacagtcc 960
gccaaagaac tggacgtgaa gatcaagaac gtgatccgga acgtgcacat gctgaaccgg 1020
atcagaacct ggcagaaaac ccaccagggc gagaacaacg gcctggccaa cagcatcaga 1080
gacagcctga atgagtacga ggccaagctg agcgatctgc gggccagact tcaagaagct 1140
gccgctcagg ccaagcaggc caacggcctt aatcaagaga acgagagagc cctgggcgcc 1200
atccagagac aagtgaaaga gatcaacagc ctgcagagcg acttcaccaa gtacctgacc 1260
accgccgata gcagcctgct gcagacaaat atcgccctgc agctcatgga aaagagccag 1320
aaagagtacg aaaagctggc cgccagcctg aacgaggcca gacaagagct gtctgacaaa 1380
gtgcgcgagc tgtctagaag cgccggcaag acatctctgg tggaagaggc cgagaagcac 1440
gccagatctc tgcaagagct ggccaaacag ctggaagaga ttaagcggaa cgccagcggc 1500
gacgaactcg tcagatgtgc agtggatgcc gccaccgcct acgagaacat cctgaatgcc 1560
atcaaggccg ccgaggacgc cgctaataga gccgcttctg cttctgagtc tgccctgcag 1620
accgtgatca aagaggacct gcctagaaag gccaagacac tgagcagcaa cagcgacaaa 1680
ctgctgaatg aggccaagat gacccagaag aaactgaagc aagaggtgtc ccctgcactg 1740
aacaacctgc agcagaccct gaacatcgtg accgtgcaga aagaagtgat cgacaccaac 1800
ctgacaaccc tgagagatgg cctgcacgga atccagagag gcgacatcga cgccatgatc 1860
agcagcgcca agagcatggt tcgaaaagcc aacgacatca ccgacgaggt gctggacggc 1920
ctgaatccta tccagaccga cgtggaacgg atcaaggaca cctacggcag aacccagaac 1980
gaggatttca agaaggccct gaccgacgcc gacaactccg tgaacaagct gaccaacaag 2040
ctgcccgatc tgtggcggaa gatcgagagc atcaaccagc aactgctgcc cctgggcaac 2100
atcagcgaca acatggacag aatccgcgag ctgatccagc aggccagaga tgccgcctct 2160
aaagtggccg tgcctatgcg gttcaatggc aagtctggcg tggaagtgcg gctgcccaac 2220
gatctggaag atctgaaggg ctataccagc ctgagcctgt tcctgcagag gcccaacagc 2280
agagagaatg gcggcaccga gaatatgttc gtgatgtacc tgggaaacaa ggacgccagc 2340
cgggactata tcggaatggc cgttgtggac ggccagctga cctgcgtgta caacctggga 2400
gatagagaag ccgaactgca ggtcgaccag atcctgacca agagcgagac aaaagaggcc 2460
gtgatggaca gagtgaagtt ccagcggatc taccagttcg cccggctgaa ttacaccaag 2520
ggcgccacaa gcagcaagcc cgaaacacct ggcgtgtacg acatggacgg ccggaactct 2580
aacactctgc tgaatctgga ccccgagaac gtggtgtttt acgtcggcgg ctaccctcct 2640
gacttcaagc tgcctagcag actgagcttc ccaccttaca agggctgtat cgagctggat 2700
gacctgaacg aaaacgtgct gtccctgtac aacttcaaaa agaccttcaa cctgaacacc 2760
accgaggtgg aaccctgcag gcgcagaaaa gaggaatccg acaagaacta cttcgaaggc 2820
accggctacg ccagagtgcc tacacaacct cacgctccca ttcctacctt cggccagacc 2880
atccagacaa ccgtggatag aggcctgctg ttcttcgccg agaacggcga cagattcatc 2940
tccctgaata tcgaggatgg caagctgatg gtccgataca agctgaactc cgagctgccc 3000
aaagaaagag gcgtgggcga cgccatcaac aacggcaggg atcacagcat ccagatcaag 3060
atcggcaaac tgcagaaacg gatgtggatc aacgtggacg tgcagaacac catcatcgac 3120
ggcgaggtgt tcgacttcag cacctactat ctcggcggaa tccctatcgc catcagagag 3180
cggtttaaca tcagcacccc tgccttccgg ggctgcatga agaacctgaa aaagaccagc 3240
ggcgtcgtgc ggctgaatga tacagtgggc gtgaccaaga agtgcagcga ggactggaag 3300
cttgtgcgga gcgcctcttt tagtagaggc ggacagctga gcttcaccga cctgggattg 3360
cctccaaccg atcatctgca ggcaagcttc ggattccaga ccttccagcc tagcggcatc 3420
ctgctggacc accagacctg gaccagaaac ctgcaagtga ccctggaaga tggctacatc 3480
gagctgagca ccagcgattc tggcggccct atcttcaaga gccctcagac ctacatggat 3540
gggctgctgc actacgtgtc cgtgatcagc gataacagcg gcctgagact gctgatcgac 3600
gaccagcttc tgcggaacag caagcggctg aagcacatca gctccagcag acagagtctg 3660
agactcggcg gcagcaattt cgagggatgc atcagcaacg tgttcgtgca gcgcctgtct 3720
ctgtctcccg aagtgctgga cctgaccagc aatagcctga agagggatgt gtctctcggc 3780
ggctgctccc tgaacaaacc tcctttcctg atgctgctga agggcagcac ccggttcaac 3840
aagaccaaga cctttcggat caatcagctg ctccaggaca cccctgtggc tagccctaga 3900
agcgtgaaag tgtggcagga cgcctgcagt cccctgccta aaacacaggc caatcacggg 3960
gccctccagt tcggcgatat ccctacaagc catctgctgt ttaagctgcc ccaagagctg 4020
ctcaagcctc ggagccagtt cgctgtggat atgcagacca cctcctccag aggactggtg 4080
tttcacaccg gcaccaagaa cagcttcatg gccctgtacc tgagcaaagg caggctggtg 4140
tttgccctgg gcaccgacgg aaagaaactg cggatcaaga gcaaagagaa gtgcaacgac 4200
ggcaagtggc acaccgtggt gttcggacac gatggcgaga aaggcagact cgtggtggat 4260
ggcctgagag ccagagaggg atctctgcct ggcaactcca ccatctccat cagagcccct 4320
gtgtatctgg gcagccctcc tagcggaaag cctaagagcc tgcctaccaa ctccttcgtg 4380
ggctgtctga agaactttca gctggacagc aagcctctgt acacccctag cagcagcttt 4440
ggcgtgtcct cctgtctcgg aggccctctg gaaaagggca tctacttctc tgaggaaggc 4500
ggccacgttg tcctggctca ttctgttttg ctgggccccg agttcaagct ggtgttctcc 4560
attaggccca gaagcctgac aggcatcctg attcacatcg gcagccagcc tggcaagcac 4620
ctgtgtgtgt atctcgaggc cggcaaagtg accgccagca tggatagcgg agctggcggc 4680
acaagcacat ccgtgacacc taagcagagc ctgtgcgacg gacagtggca tagtgtggcc 4740
gtgaccatca agcagcacat tctgcacctg gaactggaca ccgacagcag ctataccgcc 4800
ggacagatcc catttcctcc agccagcaca caagagcctc tgcaccttgg aggcgcccct 4860
gccaatctga ccacactgag aatccccgtg tggaagtcct tcttcggctg cctgcggaat 4920
atccatgtga accacattcc agtgcctgtg acagaggccc tggaagtgca gggacccgtg 4980
tctctgaatg gatgccccga tcagtga 5007

<210> 30
<211> 3336
<212> DNA
<213> Homo sapiens
<400> 30
atgcctgcgc tctggctggg ctgctgcctc tgcttctcgc tcctcctgcc cgcagcccgg 60
gccacctcca ggagggaagt ctgtgattgc aatgggaagt ccaggcagtg tatctttgat 120
cgggaacttc acagacaaac tggtaatgga ttccgctgcc tcaactgcaa tgacaacact 180
gatggcattc actgcgagaa gtgcaagaat ggcttttacc ggcacagaga aagggaccgc 240
tgtttgccct gcaattgtaa ctccaaaggt tctcttagtg ctcgatgtga caactccgga 300
cggtgcagct gtaaaccagg tgtgacagga gccagatgcg accgatgtct gccaggcttc 360
cacatgctca cggatgcggg gtgcacccaa gaccagagac tgctagactc caagtgtgac 420
tgtgacccag ctggcatcgc agggccctgt gacgcgggcc gctgtgtctg caagccagct 480
gtcactggag aacgctgtga taggtgtcga tcaggttact ataatctgga tggggggaac 540
cctgagggct gtacccagtg tttctgctat gggcattcag ccagctgccg cagctctgca 600
gaatacagtg tccataagat cacctctacc tttcatcaag atgttgatgg ctggaaggct 660
gtccaacgaa atgggtctcc tgcaaagctc caatggtcac agcgccatca agatgtgttt 720
agctcagccc aacgactaga ccctgtctat tttgtggctc ctgccaaatt tcttgggaat 780
caacaggtga gctatggtca aagcctgtcc tttgactacc gtgtggacag aggaggcaga 840
cacccatctg cccatgatgt gattctggaa ggtgctggtc tacggatcac agctcccttg 900
atgccacttg gcaagacact gccttgtggg ctcaccaaga cttacacatt caggttaaat 960
gagcatccaa gcaataattg gagcccccag ctgagttact ttgagtatcg aaggttactg 1020
cggaatctca cagccctccg catccgagct acatatggag aatacagtac tgggtacatt 1080
gacaatgtga ccctgatttc agcccgccct gtctctggag ccccagcacc ctgggttgaa 1140
cagtgtatat gtcctgttgg gtacaagggg caattctgcc aggattgtgc ttctggctac 1200
aagagagatt cagcgagact ggggcctttt ggcacctgta ttccttgtaa ctgtcaaggg 1260
ggaggggcct gtgatccaga cacaggagat tgttattcag gggatgagaa tcctgacatt 1320
gagtgtgctg actgcccaat tggtttctac aacgatccgc acgacccccg cagctgcaag 1380
ccatgtccct gtcataacgg gttcagctgc tcagtgatgc cggagacgga ggaggtggtg 1440
tgcaataact gccctcccgg ggtcaccggt gcccgctgtg agctctgtgc tgatggctac 1500
tttggggacc cctttggtga acatggccca gtgaggcctt gtcagccctg tcaatgcaac 1560
aacaatgtgg accccagtgc ctctgggaat tgtgaccggc tgacaggcag gtgtttgaag 1620
tgtatccaca acacagccgg catctactgc gaccagtgca aagcaggcta cttcggggac 1680
ccattggctc ccaacccagc agacaagtgt cgagcttgca actgtaaccc catgggctca 1740
gagcctgtag gatgtcgaag tgatggcacc tgtgtttgca agccaggatt tggtggcccc 1800
aactgtgagc atggagcatt cagctgtcca gcttgctata atcaagtgaa gattcagatg 1860
gatcagttta tgcagcagct tcagagaatg gaggccctga tttcaaaggc tcagggtggt 1920
gatggagtag tacctgatac agagctggaa ggcaggatgc agcaggctga gcaggccctt 1980
caggacattc tgagagatgc ccagatttca gaaggtgcta gcagatccct tggtctccag 2040
ttggccaagg tgaggagcca agagaacagc taccagagcc gcctggatga cctcaagatg 2100
actgtggaaa gagttcgggc tctgggaagt cagtaccaga accgagttcg ggatactcac 2160
aggctcatca ctcagatgca gctgagcctg gcagaaagtg aagcttcctt gggaaacact 2220
aacattcctg cctcagacca ctacgtgggg ccaaatggct ttaaaagtct ggctcaggag 2280
gccacaagat tagcagaaag ccacgttgag tcagccagta acatggagca actgacaagg 2340
gaaactgagg actattccaa acaagccctc tcactggtgc gcaaggccct gcatgaagga 2400
gtcggaagcg gaagcggtag cccggacggt gctgtggtgc aagggcttgt ggaaaaattg 2460
gagaaaacca agtccctggc ccagcagttg acaagggagg ccactcaagc ggaaattgaa 2520
gcagataggt cttatcagca cagtctccgc ctcctggatt cagtgtctcg gcttcaggga 2580
gtcagtgatc agtcctttca ggtggaagaa gcaaagagga tcaaacaaaa agcggattca 2640
ctctcaagcc tggtaaccag gcatatggat gagttcaagc gtacacagaa gaatctggga 2700
aactggaaag aagaagcaca gcagctctta cagaatggaa aaagtgggag agagaaatca 2760
gatcagctgc tttcccgtgc caatcttgct aaaagcagag cacaagaagc actgagtatg 2820
ggcaatgcca ctttttatga agttgagagc atccttaaaa acctcagaga gtttgacctg 2880
caggtggaca acagaaaagc agaagctgaa gaagccatga agagactctc ctacatcagc 2940
cagaaggttt cagatgccag tgacaagacc cagcaagcag aaagagccct ggggagcgct 3000
gctgctgatg cacagagggc aaagaatggg gccggggagg ccctggaaat ctccagtgag 3060
attgaacagg agattgggag tctgaacttg gaagccaatg tgacagcaga tggagccttg 3120
gccatggaaa agggactggc ctctctgaag agtgagatga gggaagtgga aggagagctg 3180
gaaaggaagg agctggagtt tgacacgaat atggatgcag tacagatggt gattacagaa 3240
gcccagaagg ttgataccag agccaagaac gctggggtta caatccaaga cacactcaac 3300
acattagacg gcctcctgca tctgatgggt atgtga 3336

<210> 31
<211> 3336
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 31
atgcctgctc tgtggctggg ctgctgcctg tgttttagtc tgctgctgcc agccgccaga 60
gccacatcta gaagagaagt gtgcgactgc aacggcaaga gccggcagtg catcttcgac 120
agagagctgc acagacagac cggcaacggc ttcagatgcc tgaactgcaa cgacaacacc 180
gacggcatcc actgcgagaa gtgcaagaac ggcttctacc ggcaccgcga gagggataga 240
tgcctgcctt gcaactgcaa ctccaagggc agcctgagcg ccagatgcga caatagcggc 300
agatgtagct gcaagcctgg cgtgacaggc gctagatgcg atagatgtct ccccggcttc 360
cacatgctga ccgatgccgg atgtacccag gaccagagac tgctggacag caagtgcgat 420
tgcgaccctg ccggaattgc cggaccttgt gatgccggaa gatgcgtgtg taaacctgcc 480
gtgaccggcg agagatgtga cagatgtaga agcggctact acaacctgga cggcggcaat 540
cctgaaggct gcacccagtg cttttgctac ggccacagcg ccagctgtag aagcagcgcc 600
gaatactccg tgcacaagat caccagcacc ttccaccagg atgtggacgg atggaaggcc 660
gtgcagagaa atggctctcc tgccaagctg cagtggtccc agagacacca ggacgtgttc 720
agcagcgctc agagactgga ccccgtgtac tttgtggccc ctgccaagtt cctgggcaac 780
cagcaagtgt cttacggcca gagcctgagc ttcgactaca gagtggatag aggcggcaga 840
caccccagcg ctcacgatgt gattcttgaa ggcgccggac tgcggatcac agcccctctt 900
atgcctctgg gcaagaccct gccttgtggc ctgaccaaga cctacacctt ccggctgaat 960
gagcacccca gcaacaactg gtccccacag ctgagctact tcgagtacag acggctgctg 1020
cggaacctga cagccctgag aatcagagcc acctacggcg agtacagcac cggctacatc 1080
gacaacgtga ccctgatcag cgccagacct gtttctggtg ctcctgctcc ttgggtcgag 1140
cagtgtatct gtcccgtggg ctacaagggc cagttctgcc aggattgtgc cagcggctac 1200
aagagagact ctgccagact gggccccttc ggcacatgca tcccttgtaa ttgtcaaggc 1260
ggcggagcct gcgatcccga tacaggcgat tgctacagcg gcgacgagaa ccccgatatc 1320
gagtgcgccg attgtcccat cggcttttac aacgaccctc acgaccccag atcctgcaag 1380
ccatgtcctt gccacaatgg cttcagctgc agcgtgatgc ccgaaaccga agaggtcgtg 1440
tgcaacaatt gcccaccagg cgttacaggg gccagatgtg aactgtgtgc cgacggctac 1500
ttcggcgatc cttttggaga acacggaccc gtgcgacctt gccagccttg tcagtgcaac 1560
aacaacgtgg acccaagcgc cagcggcaac tgcgatagac tgacaggcag atgtctgaag 1620
tgcatccaca ataccgccgg gatctactgt gaccagtgca aggccggcta ttttggcgac 1680
cctctggctc ccaatcctgc cgataagtgc agagcctgca actgtaaccc tatgggctct 1740
gagcctgtgg gctgcagatc tgatggaacc tgcgtgtgca agccaggctt tggcggacct 1800
aattgtgaac acggcgcctt tagctgcccc gcctgctaca atcaagtgaa gatccagatg 1860
gaccagttca tgcagcagct gcagaggatg gaagccctga tctctaaagc ccaaggcgga 1920
gatggcgtgg tgcctgatac agagctggaa ggcagaatgc agcaggccga acaggccctg 1980
caggacattc tgagagatgc ccagattagc gagggcgcct ctagaagtct gggactgcag 2040
ctggctaaag tgcggagcca agagaacagc taccagagca gactggacga cctgaagatg 2100
accgtggaaa gagtcagagc cctgggcagc cagtaccaga acagagtgcg ggatacccac 2160
cggctgatca cccagatgca actgtctctg gccgagagcg aagccagcct gggcaatacc 2220
aatattcccg ccagcgacca ctacgtgggc cccaacggtt ttaagagcct ggctcaagag 2280
gccaccagac tggccgaaag ccatgtggaa agcgcctcca acatggaaca gctgacccgg 2340
gaaaccgagg actactctaa gcaggccctg agcctcgtca gaaaagccct gcatgaaggc 2400
gtcggcagcg gctctggatc tcctgatggt gctgtggtgc agggactcgt ggaaaagctg 2460
gaaaagacca aatctctggc ccagcagctg accagagaag ccacacaggc cgagatcgag 2520
gccgacagaa gctaccagca ctcactgagg ctgctggact ccgtgtctag actgcagggc 2580
gtgtccgacc agagcttcca ggtggaagag gccaagcgga tcaagcagaa ggccgatagc 2640
ctgagcagcc tggtcaccag acacatggac gagttcaagc ggacccagaa gaacctcggc 2700
aactggaaag aggaagccca gcaactgctg cagaacggca agtctggaag agagaagtct 2760
gaccagctgc tgagcagagc caacctggcc aagtctagag cccaagaggc cctgtctatg 2820
ggcaacgcca ccttctacga ggtggaatcc atcctgaaga acctgcgcga gttcgacctg 2880
caagtggaca acagaaaggc cgaggccgag gaagccatga agagactgag ctacatcagc 2940
cagaaagtgt ccgacgcctc cgacaagaca cagcaggcag aaagagcact gggatctgcc 3000
gcagccgatg ctcagagagc taaaaacggc gctggcgagg ccctggaaat cagctctgag 3060
atcgagcaag agatcggctc cctgaatctg gaagccaatg tgacagccga tggcgccctg 3120
gccatggaaa aaggactggc ctctctgaag tccgagatga gagaggtgga aggcgagctg 3180
gaacggaaag aactggaatt cgacaccaat atggacgctg tgcagatggt catcacagag 3240
gcccagaagg tggacaccag agccaaaaat gccggcgtga ccatccagga caccctgaat 3300
actctggacg gactgctgca cctgatgggc atgtaa 3336

<210> 32
<211> 3333
<212> PRT
<213> Homo sapiens
<400> 32
Met Ala Ala Ala Ala Arg Pro Arg Gly Arg Ala Leu Gly Pro Val Leu
1 5 10 15
Pro Pro Thr Pro Leu Leu Leu Leu Val Leu Arg Val Leu Pro Ala Cys
20 25 30
Gly Ala Thr Ala Arg Asp Pro Gly Ala Ala Ala Gly Leu Ser Leu His
35 40 45
Pro Thr Tyr Phe Asn Leu Ala Glu Ala Ala Arg Ile Trp Ala Thr Ala
50 55 60
Thr Cys Gly Glu Arg Gly Pro Gly Glu Gly Arg Pro Gln Pro Glu Leu
65 70 75 80
Tyr Cys Lys Leu Val Gly Gly Pro Thr Ala Pro Gly Ser Gly His Thr
85 90 95
Ile Gln Gly Gln Phe Cys Asp Tyr Cys Asn Ser Glu Asp Pro Arg Lys
100 105 110
Ala His Pro Val Thr Asn Ala Ile Asp Gly Ser Glu Arg Trp Trp Gln
115 120 125
Ser Pro Pro Leu Ser Ser Gly Thr Gln Tyr Asn Arg Val Asn Leu Thr
130 135 140
Leu Asp Leu Gly Gln Leu Phe His Val Ala Tyr Ile Leu Ile Lys Phe
145 150 155 160
Ala Asn Ser Pro Arg Pro Asp Leu Trp Val Leu Glu Arg Ser Val Asp
165 170 175
Phe Gly Ser Thr Tyr Ser Pro Trp Gln Tyr Phe Ala His Ser Lys Val
180 185 190
Asp Cys Leu Lys Glu Phe Gly Arg Glu Ala Asn Met Ala Val Thr Arg
195 200 205
Asp Asp Asp Val Leu Cys Val Thr Glu Tyr Ser Arg Ile Val Pro Leu
210 215 220
Glu Asn Gly Glu Val Val Val Ser Leu Ile Asn Gly Arg Pro Gly Ala
225 230 235 240
Lys Asn Phe Thr Phe Ser His Thr Leu Arg Glu Phe Thr Lys Ala Thr
245 250 255
Asn Ile Arg Leu Arg Phe Leu Arg Thr Asn Thr Leu Leu Gly His Leu
260 265 270
Ile Ser Lys Ala Gln Arg Asp Pro Thr Val Thr Arg Arg Tyr Tyr Tyr
275 280 285
Ser Ile Lys Asp Ile Ser Ile Gly Gly Gln Cys Val Cys Asn Gly His
290 295 300
Ala Glu Val Cys Asn Ile Asn Asn Pro Glu Lys Leu Phe Arg Cys Glu
305 310 315 320
Cys Gln His His Thr Cys Gly Glu Thr Cys Asp Arg Cys Cys Thr Gly
325 330 335
Tyr Asn Gln Arg Arg Trp Arg Pro Ala Ala Trp Glu Gln Ser His Glu
340 345 350
Cys Glu Ala Cys Asn Cys His Gly His Ala Ser Asn Cys Tyr Tyr Asp
355 360 365
Pro Asp Val Glu Arg Gln Gln Ala Ser Leu Asn Thr Gln Gly Ile Tyr
370 375 380
Ala Gly Gly Gly Val Cys Ile Asn Cys Gln His Asn Thr Ala Gly Val
385 390 395 400
Asn Cys Glu Gln Cys Ala Lys Gly Tyr Tyr Arg Pro Tyr Gly Val Pro
405 410 415
Val Asp Ala Pro Asp Gly Cys Ile Pro Cys Ser Cys Asp Pro Glu His
420 425 430
Ala Asp Gly Cys Glu Gln Gly Ser Gly Arg Cys His Cys Lys Pro Asn
435 440 445
Phe His Gly Asp Asn Cys Glu Lys Cys Ala Ile Gly Tyr Tyr Asn Phe
450 455 460
Pro Phe Cys Leu Arg Ile Pro Ile Phe Pro Val Ser Thr Pro Ser Ser
465 470 475 480
Glu Asp Pro Val Ala Gly Asp Ile Lys Gly Cys Asp Cys Asn Leu Glu
485 490 495
Gly Val Leu Pro Glu Ile Cys Asp Ala His Gly Arg Cys Leu Cys Arg
500 505 510
Pro Gly Val Glu Gly Pro Arg Cys Asp Thr Cys Arg Ser Gly Phe Tyr
515 520 525
Ser Phe Pro Ile Cys Gln Ala Cys Trp Cys Ser Ala Leu Gly Ser Tyr
530 535 540
Gln Met Pro Cys Ser Ser Val Thr Gly Gln Cys Glu Cys Arg Pro Gly
545 550 555 560
Val Thr Gly Gln Arg Cys Asp Arg Cys Leu Ser Gly Ala Tyr Asp Phe
565 570 575
Pro His Cys Gln Gly Ser Ser Ser Ala Cys Asp Pro Ala Gly Thr Ile
580 585 590
Asn Ser Asn Leu Gly Tyr Cys Gln Cys Lys Leu His Val Glu Gly Pro
595 600 605
Thr Cys Ser Arg Cys Lys Leu Leu Tyr Trp Asn Leu Asp Lys Glu Asn
610 615 620
Pro Ser Gly Cys Ser Glu Cys Lys Cys His Lys Ala Gly Thr Val Ser
625 630 635 640
Gly Thr Gly Glu Cys Arg Gln Gly Asp Gly Asp Cys His Cys Lys Ser
645 650 655
His Val Gly Gly Asp Ser Cys Asp Thr Cys Glu Asp Gly Tyr Phe Ala
660 665 670
Leu Glu Lys Ser Asn Tyr Phe Gly Cys Gln Gly Cys Gln Cys Asp Ile
675 680 685
Gly Gly Ala Leu Ser Ser Met Cys Ser Gly Pro Ser Gly Val Cys Gln
690 695 700
Cys Arg Glu His Val Val Gly Lys Val Cys Gln Arg Pro Glu Asn Asn
705 710 715 720
Tyr Tyr Phe Pro Asp Leu His His Met Lys Tyr Glu Ile Glu Asp Gly
725 730 735
Ser Thr Pro Asn Gly Arg Asp Leu Arg Phe Gly Phe Asp Pro Leu Ala
740 745 750
Phe Pro Glu Phe Ser Trp Arg Gly Tyr Ala Gln Met Thr Ser Val Gln
755 760 765
Asn Asp Val Arg Ile Thr Leu Asn Val Gly Lys Ser Ser Gly Ser Leu
770 775 780
Phe Arg Val Ile Leu Arg Tyr Val Asn Pro Gly Thr Glu Ala Val Ser
785 790 795 800
Gly His Ile Thr Ile Tyr Pro Ser Trp Gly Ala Ala Gln Ser Lys Glu
805 810 815
Ile Ile Phe Leu Pro Ser Lys Glu Pro Ala Phe Val Thr Val Pro Gly
820 825 830
Asn Gly Phe Ala Asp Pro Phe Ser Ile Thr Pro Gly Ile Trp Val Ala
835 840 845
Cys Ile Lys Ala Glu Gly Val Leu Leu Asp Tyr Leu Val Leu Leu Pro
850 855 860
Arg Asp Tyr Tyr Glu Ala Ser Val Leu Gln Leu Pro Val Thr Glu Pro
865 870 875 880
Cys Ala Tyr Ala Gly Pro Pro Gln Glu Asn Cys Leu Leu Tyr Gln His
885 890 895
Leu Pro Val Thr Arg Phe Pro Cys Thr Leu Ala Cys Glu Ala Arg His
900 905 910
Phe Leu Leu Asp Gly Glu Pro Arg Pro Val Ala Val Arg Gln Pro Thr
915 920 925
Pro Ala His Pro Val Met Val Asp Leu Ser Gly Arg Glu Val Glu Leu
930 935 940
His Leu Arg Leu Arg Ile Pro Gln Val Gly His Tyr Val Val Val Val
945 950 955 960
Glu Tyr Ser Thr Glu Ala Ala Gln Leu Phe Val Val Asp Val Asn Val
965 970 975
Lys Ser Ser Gly Ser Val Leu Ala Gly Gln Val Asn Ile Tyr Ser Cys
980 985 990
Asn Tyr Ser Val Leu Cys Arg Ser Ala Val Ile Asp His Met Ser Arg
995 1000 1005
Ile Ala Met Tyr Glu Leu Leu Ala Asp Ala Asp Ile Gln Leu Lys Gly
1010 1015 1020
His Met Ala Arg Phe Leu Leu His Gln Val Cys Ile Ile Pro Ile Glu
1025 1030 1035 1040
Glu Phe Ser Ala Glu Tyr Val Arg Pro Gln Val His Cys Ile Ala Ser
1045 1050 1055
Tyr Gly Arg Phe Val Asn Gln Ser Ala Thr Cys Val Ser Leu Ala His
1060 1065 1070
Glu Thr Pro Pro Thr Ala Leu Ile Leu Asp Val Leu Ser Gly Arg Pro
1075 1080 1085
Phe Pro His Leu Pro Gln Gln Ser Ser Pro Ser Val Asp Val Leu Pro
1090 1095 1100
Gly Val Thr Leu Lys Ala Pro Gln Asn Gln Val Thr Leu Arg Gly Arg
1105 1110 1115 1120
Val Pro His Leu Gly Arg Tyr Val Phe Val Ile His Phe Tyr Gln Ala
1125 1130 1135
Ala His Pro Thr Phe Pro Ala Gln Val Ser Val Asp Gly Gly Trp Pro
1140 1145 1150
Arg Ala Gly Ser Phe His Ala Ser Phe Cys Pro His Val Leu Gly Cys
1155 1160 1165
Arg Asp Gln Val Ile Ala Glu Gly Gln Ile Glu Phe Asp Ile Ser Glu
1170 1175 1180
Pro Glu Val Ala Ala Thr Val Lys Val Pro Glu Gly Lys Ser Leu Val
1185 1190 1195 1200
Leu Val Arg Val Leu Val Val Pro Ala Glu Asn Tyr Asp Tyr Gln Ile
1205 1210 1215
Leu His Lys Lys Ser Met Asp Lys Ser Leu Glu Phe Ile Thr Asn Cys
1220 1225 1230
Gly Lys Asn Ser Phe Tyr Leu Asp Pro Gln Thr Ala Ser Arg Phe Cys
1235 1240 1245
Lys Asn Ser Ala Arg Ser Leu Val Ala Phe Tyr His Lys Gly Ala Leu
1250 1255 1260
Pro Cys Glu Cys His Pro Thr Gly Ala Thr Gly Pro His Cys Ser Pro
1265 1270 1275 1280
Glu Gly Gly Gln Cys Pro Cys Gln Pro Asn Val Ile Gly Arg Gln Cys
1285 1290 1295
Thr Arg Cys Ala Thr Gly His Tyr Gly Phe Pro Arg Cys Lys Pro Cys
1300 1305 1310
Ser Cys Gly Arg Arg Leu Cys Glu Glu Met Thr Gly Gln Cys Arg Cys
1315 1320 1325
Pro Pro Arg Thr Val Arg Pro Gln Cys Glu Val Cys Glu Thr His Ser
1330 1335 1340
Phe Ser Phe His Pro Met Ala Gly Cys Glu Gly Cys Asn Cys Ser Arg
1345 1350 1355 1360
Arg Gly Thr Ile Glu Ala Ala Met Pro Glu Cys Asp Arg Asp Ser Gly
1365 1370 1375
Gln Cys Arg Cys Lys Pro Arg Ile Thr Gly Arg Gln Cys Asp Arg Cys
1380 1385 1390
Ala Ser Gly Phe Tyr Arg Phe Pro Glu Cys Val Pro Cys Asn Cys Asn
1395 1400 1405
Arg Asp Gly Thr Glu Pro Gly Val Cys Asp Pro Gly Thr Gly Ala Cys
1410 1415 1420
Leu Cys Lys Glu Asn Val Glu Gly Thr Glu Cys Asn Val Cys Arg Glu
1425 1430 1435 1440
Gly Ser Phe His Leu Asp Pro Ala Asn Leu Lys Gly Cys Thr Ser Cys
1445 1450 1455
Phe Cys Phe Gly Val Asn Asn Gln Cys His Ser Ser His Lys Arg Arg
1460 1465 1470
Thr Lys Phe Val Asp Met Leu Gly Trp His Leu Glu Thr Ala Asp Arg
1475 1480 1485
Val Asp Ile Pro Val Ser Phe Asn Pro Gly Ser Asn Ser Met Val Ala
1490 1495 1500
Asp Leu Gln Glu Leu Pro Ala Thr Ile His Ser Ala Ser Trp Val Ala
1505 1510 1515 1520
Pro Thr Ser Tyr Leu Gly Asp Lys Val Ser Ser Tyr Gly Gly Tyr Leu
1525 1530 1535
Thr Tyr Gln Ala Lys Ser Phe Gly Leu Pro Gly Asp Met Val Leu Leu
1540 1545 1550
Glu Lys Lys Pro Asp Val Gln Leu Thr Gly Gln His Met Ser Ile Ile
1555 1560 1565
Tyr Glu Glu Thr Asn Thr Pro Arg Pro Asp Arg Leu His His Gly Arg
1570 1575 1580
Val His Val Val Glu Gly Asn Phe Arg His Ala Ser Ser Arg Ala Pro
1585 1590 1595 1600
Val Ser Arg Glu Glu Leu Met Thr Val Leu Ser Arg Leu Ala Asp Val
1605 1610 1615
Arg Ile Gln Gly Leu Tyr Phe Thr Glu Thr Gln Arg Leu Thr Leu Ser
1620 1625 1630
Glu Val Gly Leu Glu Glu Ala Ser Asp Thr Gly Ser Gly Arg Ile Ala
1635 1640 1645
Leu Ala Val Glu Ile Cys Ala Cys Pro Pro Ala Tyr Ala Gly Asp Ser
1650 1655 1660
Cys Gln Gly Cys Ser Pro Gly Tyr Tyr Arg Asp His Lys Gly Leu Tyr
1665 1670 1675 1680
Thr Gly Arg Cys Val Pro Cys Asn Cys Asn Gly His Ser Asn Gln Cys
1685 1690 1695
Gln Asp Gly Ser Gly Ile Cys Val Asn Cys Gln His Asn Thr Ala Gly
1700 1705 1710
Glu His Cys Glu Arg Cys Gln Glu Gly Tyr Tyr Gly Asn Ala Val His
1715 1720 1725
Gly Ser Cys Arg Ala Cys Pro Cys Pro His Thr Asn Ser Phe Ala Thr
1730 1735 1740
Gly Cys Val Val Asn Gly Gly Asp Val Arg Cys Ser Cys Lys Ala Gly
1745 1750 1755 1760
Tyr Thr Gly Thr Gln Cys Glu Arg Cys Ala Pro Gly Tyr Phe Gly Asn
1765 1770 1775
Pro Gln Lys Phe Gly Gly Ser Cys Gln Pro Cys Ser Cys Asn Ser Asn
1780 1785 1790
Gly Gln Leu Gly Ser Cys His Pro Leu Thr Gly Asp Cys Ile Asn Gln
1795 1800 1805
Glu Pro Lys Asp Ser Ser Pro Ala Glu Glu Cys Asp Asp Cys Asp Ser
1810 1815 1820
Cys Val Met Thr Leu Leu Asn Asp Leu Ala Thr Met Gly Glu Gln Leu
1825 1830 1835 1840
Arg Leu Val Lys Ser Gln Leu Gln Gly Leu Ser Ala Ser Ala Gly Leu
1845 1850 1855
Leu Glu Gln Met Arg His Met Glu Thr Gln Ala Lys Asp Leu Arg Asn
1860 1865 1870
Gln Leu Leu Asn Tyr Arg Ser Ala Ile Ser Asn His Gly Ser Lys Ile
1875 1880 1885
Glu Gly Leu Glu Arg Glu Leu Thr Asp Leu Asn Gln Glu Phe Glu Thr
1890 1895 1900
Leu Gln Glu Lys Ala Gln Val Asn Ser Arg Lys Ala Gln Thr Leu Asn
1905 1910 1915 1920
Asn Asn Val Asn Arg Ala Thr Gln Ser Ala Lys Glu Leu Asp Val Lys
1925 1930 1935
Ile Lys Asn Val Ile Arg Asn Val His Ile Leu Leu Lys Gln Ile Ser
1940 1945 1950
Gly Thr Asp Gly Glu Gly Asn Asn Val Pro Ser Gly Asp Phe Ser Arg
1955 1960 1965
Glu Trp Ala Glu Ala Gln Arg Met Met Arg Glu Leu Arg Asn Arg Asn
1970 1975 1980
Phe Gly Lys His Leu Arg Glu Ala Glu Ala Asp Lys Arg Glu Ser Gln
1985 1990 1995 2000
Leu Leu Leu Asn Arg Ile Arg Thr Trp Gln Lys Thr His Gln Gly Glu
2005 2010 2015
Asn Asn Gly Leu Ala Asn Ser Ile Arg Asp Ser Leu Asn Glu Tyr Glu
2020 2025 2030
Ala Lys Leu Ser Asp Leu Arg Ala Arg Leu Gln Glu Ala Ala Ala Gln
2035 2040 2045
Ala Lys Gln Ala Asn Gly Leu Asn Gln Glu Asn Glu Arg Ala Leu Gly
2050 2055 2060
Ala Ile Gln Arg Gln Val Lys Glu Ile Asn Ser Leu Gln Ser Asp Phe
2065 2070 2075 2080
Thr Lys Tyr Leu Thr Thr Ala Asp Ser Ser Leu Leu Gln Thr Asn Ile
2085 2090 2095
Ala Leu Gln Leu Met Glu Lys Ser Gln Lys Glu Tyr Glu Lys Leu Ala
2100 2105 2110
Ala Ser Leu Asn Glu Ala Arg Gln Glu Leu Ser Asp Lys Val Arg Glu
2115 2120 2125
Leu Ser Arg Ser Ala Gly Lys Thr Ser Leu Val Glu Glu Ala Glu Lys
2130 2135 2140
His Ala Arg Ser Leu Gln Glu Leu Ala Lys Gln Leu Glu Glu Ile Lys
2145 2150 2155 2160
Arg Asn Ala Ser Gly Asp Glu Leu Val Arg Cys Ala Val Asp Ala Ala
2165 2170 2175
Thr Ala Tyr Glu Asn Ile Leu Asn Ala Ile Lys Ala Ala Glu Asp Ala
2180 2185 2190
Ala Asn Arg Ala Ala Ser Ala Ser Glu Ser Ala Leu Gln Thr Val Ile
2195 2200 2205
Lys Glu Asp Leu Pro Arg Lys Ala Lys Thr Leu Ser Ser Asn Ser Asp
2210 2215 2220
Lys Leu Leu Asn Glu Ala Lys Met Thr Gln Lys Lys Leu Lys Gln Glu
2225 2230 2235 2240
Val Ser Pro Ala Leu Asn Asn Leu Gln Gln Thr Leu Asn Ile Val Thr
2245 2250 2255
Val Gln Lys Glu Val Ile Asp Thr Asn Leu Thr Thr Leu Arg Asp Gly
2260 2265 2270
Leu His Gly Ile Gln Arg Gly Asp Ile Asp Ala Met Ile Ser Ser Ala
2275 2280 2285
Lys Ser Met Val Arg Lys Ala Asn Asp Ile Thr Asp Glu Val Leu Asp
2290 2295 2300
Gly Leu Asn Pro Ile Gln Thr Asp Val Glu Arg Ile Lys Asp Thr Tyr
2305 2310 2315 2320
Gly Arg Thr Gln Asn Glu Asp Phe Lys Lys Ala Leu Thr Asp Ala Asp
2325 2330 2335
Asn Ser Val Asn Lys Leu Thr Asn Lys Leu Pro Asp Leu Trp Arg Lys
2340 2345 2350
Ile Glu Ser Ile Asn Gln Gln Leu Leu Pro Leu Gly Asn Ile Ser Asp
2355 2360 2365
Asn Met Asp Arg Ile Arg Glu Leu Ile Gln Gln Ala Arg Asp Ala Ala
2370 2375 2380
Ser Lys Val Ala Val Pro Met Arg Phe Asn Gly Lys Ser Gly Val Glu
2385 2390 2395 2400
Val Arg Leu Pro Asn Asp Leu Glu Asp Leu Lys Gly Tyr Thr Ser Leu
2405 2410 2415
Ser Leu Phe Leu Gln Arg Pro Asn Ser Arg Glu Asn Gly Gly Thr Glu
2420 2425 2430
Asn Met Phe Val Met Tyr Leu Gly Asn Lys Asp Ala Ser Arg Asp Tyr
2435 2440 2445
Ile Gly Met Ala Val Val Asp Gly Gln Leu Thr Cys Val Tyr Asn Leu
2450 2455 2460
Gly Asp Arg Glu Ala Glu Leu Gln Val Asp Gln Ile Leu Thr Lys Ser
2465 2470 2475 2480
Glu Thr Lys Glu Ala Val Met Asp Arg Val Lys Phe Gln Arg Ile Tyr
2485 2490 2495
Gln Phe Ala Arg Leu Asn Tyr Thr Lys Gly Ala Thr Ser Ser Lys Pro
2500 2505 2510
Glu Thr Pro Gly Val Tyr Asp Met Asp Gly Arg Asn Ser Asn Thr Leu
2515 2520 2525
Leu Asn Leu Asp Pro Glu Asn Val Val Phe Tyr Val Gly Gly Tyr Pro
2530 2535 2540
Pro Asp Phe Lys Leu Pro Ser Arg Leu Ser Phe Pro Pro Tyr Lys Gly
2545 2550 2555 2560
Cys Ile Glu Leu Asp Asp Leu Asn Glu Asn Val Leu Ser Leu Tyr Asn
2565 2570 2575
Phe Lys Lys Thr Phe Asn Leu Asn Thr Thr Glu Val Glu Pro Cys Arg
2580 2585 2590
Arg Arg Lys Glu Glu Ser Asp Lys Asn Tyr Phe Glu Gly Thr Gly Tyr
2595 2600 2605
Ala Arg Val Pro Thr Gln Pro His Ala Pro Ile Pro Thr Phe Gly Gln
2610 2615 2620
Thr Ile Gln Thr Thr Val Asp Arg Gly Leu Leu Phe Phe Ala Glu Asn
2625 2630 2635 2640
Gly Asp Arg Phe Ile Ser Leu Asn Ile Glu Asp Gly Lys Leu Met Val
2645 2650 2655
Arg Tyr Lys Leu Asn Ser Glu Leu Pro Lys Glu Arg Gly Val Gly Asp
2660 2665 2670
Ala Ile Asn Asn Gly Arg Asp His Ser Ile Gln Ile Lys Ile Gly Lys
2675 2680 2685
Leu Gln Lys Arg Met Trp Ile Asn Val Asp Val Gln Asn Thr Ile Ile
2690 2695 2700
Asp Gly Glu Val Phe Asp Phe Ser Thr Tyr Tyr Leu Gly Gly Ile Pro
2705 2710 2715 2720
Ile Ala Ile Arg Glu Arg Phe Asn Ile Ser Thr Pro Ala Phe Arg Gly
2725 2730 2735
Cys Met Lys Asn Leu Lys Lys Thr Ser Gly Val Val Arg Leu Asn Asp
2740 2745 2750
Thr Val Gly Val Thr Lys Lys Cys Ser Glu Asp Trp Lys Leu Val Arg
2755 2760 2765
Ser Ala Ser Phe Ser Arg Gly Gly Gln Leu Ser Phe Thr Asp Leu Gly
2770 2775 2780
Leu Pro Pro Thr Asp His Leu Gln Ala Ser Phe Gly Phe Gln Thr Phe
2785 2790 2795 2800
Gln Pro Ser Gly Ile Leu Leu Asp His Gln Thr Trp Thr Arg Asn Leu
2805 2810 2815
Gln Val Thr Leu Glu Asp Gly Tyr Ile Glu Leu Ser Thr Ser Asp Ser
2820 2825 2830
Gly Gly Pro Ile Phe Lys Ser Pro Gln Thr Tyr Met Asp Gly Leu Leu
2835 2840 2845
His Tyr Val Ser Val Ile Ser Asp Asn Ser Gly Leu Arg Leu Leu Ile
2850 2855 2860
Asp Asp Gln Leu Leu Arg Asn Ser Lys Arg Leu Lys His Ile Ser Ser
2865 2870 2875 2880
Ser Arg Gln Ser Leu Arg Leu Gly Gly Ser Asn Phe Glu Gly Cys Ile
2885 2890 2895
Ser Asn Val Phe Val Gln Arg Leu Ser Leu Ser Pro Glu Val Leu Asp
2900 2905 2910
Leu Thr Ser Asn Ser Leu Lys Arg Asp Val Ser Leu Gly Gly Cys Ser
2915 2920 2925
Leu Asn Lys Pro Pro Phe Leu Met Leu Leu Lys Gly Ser Thr Arg Phe
2930 2935 2940
Asn Lys Thr Lys Thr Phe Arg Ile Asn Gln Leu Leu Gln Asp Thr Pro
2945 2950 2955 2960
Val Ala Ser Pro Arg Ser Val Lys Val Trp Gln Asp Ala Cys Ser Pro
2965 2970 2975
Leu Pro Lys Thr Gln Ala Asn His Gly Ala Leu Gln Phe Gly Asp Ile
2980 2985 2990
Pro Thr Ser His Leu Leu Phe Lys Leu Pro Gln Glu Leu Leu Lys Pro
2995 3000 3005
Arg Ser Gln Phe Ala Val Asp Met Gln Thr Thr Ser Ser Arg Gly Leu
3010 3015 3020
Val Phe His Thr Gly Thr Lys Asn Ser Phe Met Ala Leu Tyr Leu Ser
3025 3030 3035 3040
Lys Gly Arg Leu Val Phe Ala Leu Gly Thr Asp Gly Lys Lys Leu Arg
3045 3050 3055
Ile Lys Ser Lys Glu Lys Cys Asn Asp Gly Lys Trp His Thr Val Val
3060 3065 3070
Phe Gly His Asp Gly Glu Lys Gly Arg Leu Val Val Asp Gly Leu Arg
3075 3080 3085
Ala Arg Glu Gly Ser Leu Pro Gly Asn Ser Thr Ile Ser Ile Arg Ala
3090 3095 3100
Pro Val Tyr Leu Gly Ser Pro Pro Ser Gly Lys Pro Lys Ser Leu Pro
3105 3110 3115 3120
Thr Asn Ser Phe Val Gly Cys Leu Lys Asn Phe Gln Leu Asp Ser Lys
3125 3130 3135
Pro Leu Tyr Thr Pro Ser Ser Ser Phe Gly Val Ser Ser Cys Leu Gly
3140 3145 3150
Gly Pro Leu Glu Lys Gly Ile Tyr Phe Ser Glu Glu Gly Gly His Val
3155 3160 3165
Val Leu Ala His Ser Val Leu Leu Gly Pro Glu Phe Lys Leu Val Phe
3170 3175 3180
Ser Ile Arg Pro Arg Ser Leu Thr Gly Ile Leu Ile His Ile Gly Ser
3185 3190 3195 3200
Gln Pro Gly Lys His Leu Cys Val Tyr Leu Glu Ala Gly Lys Val Thr
3205 3210 3215
Ala Ser Met Asp Ser Gly Ala Gly Gly Thr Ser Thr Ser Val Thr Pro
3220 3225 3230
Lys Gln Ser Leu Cys Asp Gly Gln Trp His Ser Val Ala Val Thr Ile
3235 3240 3245
Lys Gln His Ile Leu His Leu Glu Leu Asp Thr Asp Ser Ser Tyr Thr
3250 3255 3260
Ala Gly Gln Ile Pro Phe Pro Pro Ala Ser Thr Gln Glu Pro Leu His
3265 3270 3275 3280
Leu Gly Gly Ala Pro Ala Asn Leu Thr Thr Leu Arg Ile Pro Val Trp
3285 3290 3295
Lys Ser Phe Phe Gly Cys Leu Arg Asn Ile His Val Asn His Ile Pro
3300 3305 3310
Val Pro Val Thr Glu Ala Leu Glu Val Gln Gly Pro Val Ser Leu Asn
3315 3320 3325
Gly Cys Pro Asp Gln
3330

<210> 33
<211> 3277
<212> PRT
<213> Homo sapiens
<400> 33
Met Ala Ala Ala Ala Arg Pro Arg Gly Arg Ala Leu Gly Pro Val Leu
1 5 10 15
Pro Pro Thr Pro Leu Leu Leu Leu Val Leu Arg Val Leu Pro Ala Cys
20 25 30
Gly Ala Thr Ala Arg Asp Pro Gly Ala Ala Ala Gly Leu Ser Leu His
35 40 45
Pro Thr Tyr Phe Asn Leu Ala Glu Ala Ala Arg Ile Trp Ala Thr Ala
50 55 60
Thr Cys Gly Glu Arg Gly Pro Gly Glu Gly Arg Pro Gln Pro Glu Leu
65 70 75 80
Tyr Cys Lys Leu Val Gly Gly Pro Thr Ala Pro Gly Ser Gly His Thr
85 90 95
Ile Gln Gly Gln Phe Cys Asp Tyr Cys Asn Ser Glu Asp Pro Arg Lys
100 105 110
Ala His Pro Val Thr Asn Ala Ile Asp Gly Ser Glu Arg Trp Trp Gln
115 120 125
Ser Pro Pro Leu Ser Ser Gly Thr Gln Tyr Asn Arg Val Asn Leu Thr
130 135 140
Leu Asp Leu Gly Gln Leu Phe His Val Ala Tyr Ile Leu Ile Lys Phe
145 150 155 160
Ala Asn Ser Pro Arg Pro Asp Leu Trp Val Leu Glu Arg Ser Val Asp
165 170 175
Phe Gly Ser Thr Tyr Ser Pro Trp Gln Tyr Phe Ala His Ser Lys Val
180 185 190
Asp Cys Leu Lys Glu Phe Gly Arg Glu Ala Asn Met Ala Val Thr Arg
195 200 205
Asp Asp Asp Val Leu Cys Val Thr Glu Tyr Ser Arg Ile Val Pro Leu
210 215 220
Glu Asn Gly Glu Val Val Val Ser Leu Ile Asn Gly Arg Pro Gly Ala
225 230 235 240
Lys Asn Phe Thr Phe Ser His Thr Leu Arg Glu Phe Thr Lys Ala Thr
245 250 255
Asn Ile Arg Leu Arg Phe Leu Arg Thr Asn Thr Leu Leu Gly His Leu
260 265 270
Ile Ser Lys Ala Gln Arg Asp Pro Thr Val Thr Arg Arg Tyr Tyr Tyr
275 280 285
Ser Ile Lys Asp Ile Ser Ile Gly Gly Gln Cys Val Cys Asn Gly His
290 295 300
Ala Glu Val Cys Asn Ile Asn Asn Pro Glu Lys Leu Phe Arg Cys Glu
305 310 315 320
Cys Gln His His Thr Cys Gly Glu Thr Cys Asp Arg Cys Cys Thr Gly
325 330 335
Tyr Asn Gln Arg Arg Trp Arg Pro Ala Ala Trp Glu Gln Ser His Glu
340 345 350
Cys Glu Ala Cys Asn Cys His Gly His Ala Ser Asn Cys Tyr Tyr Asp
355 360 365
Pro Asp Val Glu Arg Gln Gln Ala Ser Leu Asn Thr Gln Gly Ile Tyr
370 375 380
Ala Gly Gly Gly Val Cys Ile Asn Cys Gln His Asn Thr Ala Gly Val
385 390 395 400
Asn Cys Glu Gln Cys Ala Lys Gly Tyr Tyr Arg Pro Tyr Gly Val Pro
405 410 415
Val Asp Ala Pro Asp Gly Cys Ile Pro Cys Ser Cys Asp Pro Glu His
420 425 430
Ala Asp Gly Cys Glu Gln Gly Ser Gly Arg Cys His Cys Lys Pro Asn
435 440 445
Phe His Gly Asp Asn Cys Glu Lys Cys Ala Ile Gly Tyr Tyr Asn Phe
450 455 460
Pro Phe Cys Leu Arg Ile Pro Ile Phe Pro Val Ser Thr Pro Ser Ser
465 470 475 480
Glu Asp Pro Val Ala Gly Asp Ile Lys Gly Cys Asp Cys Asn Leu Glu
485 490 495
Gly Val Leu Pro Glu Ile Cys Asp Ala His Gly Arg Cys Leu Cys Arg
500 505 510
Pro Gly Val Glu Gly Pro Arg Cys Asp Thr Cys Arg Ser Gly Phe Tyr
515 520 525
Ser Phe Pro Ile Cys Gln Ala Cys Trp Cys Ser Ala Leu Gly Ser Tyr
530 535 540
Gln Met Pro Cys Ser Ser Val Thr Gly Gln Cys Glu Cys Arg Pro Gly
545 550 555 560
Val Thr Gly Gln Arg Cys Asp Arg Cys Leu Ser Gly Ala Tyr Asp Phe
565 570 575
Pro His Cys Gln Gly Ser Ser Ser Ala Cys Asp Pro Ala Gly Thr Ile
580 585 590
Asn Ser Asn Leu Gly Tyr Cys Gln Cys Lys Leu His Val Glu Gly Pro
595 600 605
Thr Cys Ser Arg Cys Lys Leu Leu Tyr Trp Asn Leu Asp Lys Glu Asn
610 615 620
Pro Ser Gly Cys Ser Glu Cys Lys Cys His Lys Ala Gly Thr Val Ser
625 630 635 640
Gly Thr Gly Glu Cys Arg Gln Gly Asp Gly Asp Cys His Cys Lys Ser
645 650 655
His Val Gly Gly Asp Ser Cys Asp Thr Cys Glu Asp Gly Tyr Phe Ala
660 665 670
Leu Glu Lys Ser Asn Tyr Phe Gly Cys Gln Gly Cys Gln Cys Asp Ile
675 680 685
Gly Gly Ala Leu Ser Ser Met Cys Ser Gly Pro Ser Gly Val Cys Gln
690 695 700
Cys Arg Glu His Val Val Gly Lys Val Cys Gln Arg Pro Glu Asn Asn
705 710 715 720
Tyr Tyr Phe Pro Asp Leu His His Met Lys Tyr Glu Ile Glu Asp Gly
725 730 735
Ser Thr Pro Asn Gly Arg Asp Leu Arg Phe Gly Phe Asp Pro Leu Ala
740 745 750
Phe Pro Glu Phe Ser Trp Arg Gly Tyr Ala Gln Met Thr Ser Val Gln
755 760 765
Asn Asp Val Arg Ile Thr Leu Asn Val Gly Lys Ser Ser Gly Ser Leu
770 775 780
Phe Arg Val Ile Leu Arg Tyr Val Asn Pro Gly Thr Glu Ala Val Ser
785 790 795 800
Gly His Ile Thr Ile Tyr Pro Ser Trp Gly Ala Ala Gln Ser Lys Glu
805 810 815
Ile Ile Phe Leu Pro Ser Lys Glu Pro Ala Phe Val Thr Val Pro Gly
820 825 830
Asn Gly Phe Ala Asp Pro Phe Ser Ile Thr Pro Gly Ile Trp Val Ala
835 840 845
Cys Ile Lys Ala Glu Gly Val Leu Leu Asp Tyr Leu Val Leu Leu Pro
850 855 860
Arg Asp Tyr Tyr Glu Ala Ser Val Leu Gln Leu Pro Val Thr Glu Pro
865 870 875 880
Cys Ala Tyr Ala Gly Pro Pro Gln Glu Asn Cys Leu Leu Tyr Gln His
885 890 895
Leu Pro Val Thr Arg Phe Pro Cys Thr Leu Ala Cys Glu Ala Arg His
900 905 910
Phe Leu Leu Asp Gly Glu Pro Arg Pro Val Ala Val Arg Gln Pro Thr
915 920 925
Pro Ala His Pro Val Met Val Asp Leu Ser Gly Arg Glu Val Glu Leu
930 935 940
His Leu Arg Leu Arg Ile Pro Gln Val Gly His Tyr Val Val Val Val
945 950 955 960
Glu Tyr Ser Thr Glu Ala Ala Gln Leu Phe Val Val Asp Val Asn Val
965 970 975
Lys Ser Ser Gly Ser Val Leu Ala Gly Gln Val Asn Ile Tyr Ser Cys
980 985 990
Asn Tyr Ser Val Leu Cys Arg Ser Ala Val Ile Asp His Met Ser Arg
995 1000 1005
Ile Ala Met Tyr Glu Leu Leu Ala Asp Ala Asp Ile Gln Leu Lys Gly
1010 1015 1020
His Met Ala Arg Phe Leu Leu His Gln Val Cys Ile Ile Pro Ile Glu
1025 1030 1035 1040
Glu Phe Ser Ala Glu Tyr Val Arg Pro Gln Val His Cys Ile Ala Ser
1045 1050 1055
Tyr Gly Arg Phe Val Asn Gln Ser Ala Thr Cys Val Ser Leu Ala His
1060 1065 1070
Glu Thr Pro Pro Thr Ala Leu Ile Leu Asp Val Leu Ser Gly Arg Pro
1075 1080 1085
Phe Pro His Leu Pro Gln Gln Ser Ser Pro Ser Val Asp Val Leu Pro
1090 1095 1100
Gly Val Thr Leu Lys Ala Pro Gln Asn Gln Val Thr Leu Arg Gly Arg
1105 1110 1115 1120
Val Pro His Leu Gly Arg Tyr Val Phe Val Ile His Phe Tyr Gln Ala
1125 1130 1135
Ala His Pro Thr Phe Pro Ala Gln Val Ser Val Asp Gly Gly Trp Pro
1140 1145 1150
Arg Ala Gly Ser Phe His Ala Ser Phe Cys Pro His Val Leu Gly Cys
1155 1160 1165
Arg Asp Gln Val Ile Ala Glu Gly Gln Ile Glu Phe Asp Ile Ser Glu
1170 1175 1180
Pro Glu Val Ala Ala Thr Val Lys Val Pro Glu Gly Lys Ser Leu Val
1185 1190 1195 1200
Leu Val Arg Val Leu Val Val Pro Ala Glu Asn Tyr Asp Tyr Gln Ile
1205 1210 1215
Leu His Lys Lys Ser Met Asp Lys Ser Leu Glu Phe Ile Thr Asn Cys
1220 1225 1230
Gly Lys Asn Ser Phe Tyr Leu Asp Pro Gln Thr Ala Ser Arg Phe Cys
1235 1240 1245
Lys Asn Ser Ala Arg Ser Leu Val Ala Phe Tyr His Lys Gly Ala Leu
1250 1255 1260
Pro Cys Glu Cys His Pro Thr Gly Ala Thr Gly Pro His Cys Ser Pro
1265 1270 1275 1280
Glu Gly Gly Gln Cys Pro Cys Gln Pro Asn Val Ile Gly Arg Gln Cys
1285 1290 1295
Thr Arg Cys Ala Thr Gly His Tyr Gly Phe Pro Arg Cys Lys Pro Cys
1300 1305 1310
Ser Cys Gly Arg Arg Leu Cys Glu Glu Met Thr Gly Gln Cys Arg Cys
1315 1320 1325
Pro Pro Arg Thr Val Arg Pro Gln Cys Glu Val Cys Glu Thr His Ser
1330 1335 1340
Phe Ser Phe His Pro Met Ala Gly Cys Glu Gly Cys Asn Cys Ser Arg
1345 1350 1355 1360
Arg Gly Thr Ile Glu Ala Ala Met Pro Glu Cys Asp Arg Asp Ser Gly
1365 1370 1375
Gln Cys Arg Cys Lys Pro Arg Ile Thr Gly Arg Gln Cys Asp Arg Cys
1380 1385 1390
Ala Ser Gly Phe Tyr Arg Phe Pro Glu Cys Val Pro Cys Asn Cys Asn
1395 1400 1405
Arg Asp Gly Thr Glu Pro Gly Val Cys Asp Pro Gly Thr Gly Ala Cys
1410 1415 1420
Leu Cys Lys Glu Asn Val Glu Gly Thr Glu Cys Asn Val Cys Arg Glu
1425 1430 1435 1440
Gly Ser Phe His Leu Asp Pro Ala Asn Leu Lys Gly Cys Thr Ser Cys
1445 1450 1455
Phe Cys Phe Gly Val Asn Asn Gln Cys His Ser Ser His Lys Arg Arg
1460 1465 1470
Thr Lys Phe Val Asp Met Leu Gly Trp His Leu Glu Thr Ala Asp Arg
1475 1480 1485
Val Asp Ile Pro Val Ser Phe Asn Pro Gly Ser Asn Ser Met Val Ala
1490 1495 1500
Asp Leu Gln Glu Leu Pro Ala Thr Ile His Ser Ala Ser Trp Val Ala
1505 1510 1515 1520
Pro Thr Ser Tyr Leu Gly Asp Lys Val Ser Ser Tyr Gly Gly Tyr Leu
1525 1530 1535
Thr Tyr Gln Ala Lys Ser Phe Gly Leu Pro Gly Asp Met Val Leu Leu
1540 1545 1550
Glu Lys Lys Pro Asp Val Gln Leu Thr Gly Gln His Met Ser Ile Ile
1555 1560 1565
Tyr Glu Glu Thr Asn Thr Pro Arg Pro Asp Arg Leu His His Gly Arg
1570 1575 1580
Val His Val Val Glu Gly Asn Phe Arg His Ala Ser Ser Arg Ala Pro
1585 1590 1595 1600
Val Ser Arg Glu Glu Leu Met Thr Val Leu Ser Arg Leu Ala Asp Val
1605 1610 1615
Arg Ile Gln Gly Leu Tyr Phe Thr Glu Thr Gln Arg Leu Thr Leu Ser
1620 1625 1630
Glu Val Gly Leu Glu Glu Ala Ser Asp Thr Gly Ser Gly Arg Ile Ala
1635 1640 1645
Leu Ala Val Glu Ile Cys Ala Cys Pro Pro Ala Tyr Ala Gly Asp Ser
1650 1655 1660
Cys Gln Gly Cys Ser Pro Gly Tyr Tyr Arg Asp His Lys Gly Leu Tyr
1665 1670 1675 1680
Thr Gly Arg Cys Val Pro Cys Asn Cys Asn Gly His Ser Asn Gln Cys
1685 1690 1695
Gln Asp Gly Ser Gly Ile Cys Val Asn Cys Gln His Asn Thr Ala Gly
1700 1705 1710
Glu His Cys Glu Arg Cys Gln Glu Gly Tyr Tyr Gly Asn Ala Val His
1715 1720 1725
Gly Ser Cys Arg Ala Cys Pro Cys Pro His Thr Asn Ser Phe Ala Thr
1730 1735 1740
Gly Cys Val Val Asn Gly Gly Asp Val Arg Cys Ser Cys Lys Ala Gly
1745 1750 1755 1760
Tyr Thr Gly Thr Gln Cys Glu Arg Cys Ala Pro Gly Tyr Phe Gly Asn
1765 1770 1775
Pro Gln Lys Phe Gly Gly Ser Cys Gln Pro Cys Ser Cys Asn Ser Asn
1780 1785 1790
Gly Gln Leu Gly Ser Cys His Pro Leu Thr Gly Asp Cys Ile Asn Gln
1795 1800 1805
Glu Pro Lys Asp Ser Ser Pro Ala Glu Glu Cys Asp Asp Cys Asp Ser
1810 1815 1820
Cys Val Met Thr Leu Leu Asn Asp Leu Ala Thr Met Gly Glu Gln Leu
1825 1830 1835 1840
Arg Leu Val Lys Ser Gln Leu Gln Gly Leu Ser Ala Ser Ala Gly Leu
1845 1850 1855
Leu Glu Gln Met Arg His Met Glu Thr Gln Ala Lys Asp Leu Arg Asn
1860 1865 1870
Gln Leu Leu Asn Tyr Arg Ser Ala Ile Ser Asn His Gly Ser Lys Ile
1875 1880 1885
Glu Gly Leu Glu Arg Glu Leu Thr Asp Leu Asn Gln Glu Phe Glu Thr
1890 1895 1900
Leu Gln Glu Lys Ala Gln Val Asn Ser Arg Lys Ala Gln Thr Leu Asn
1905 1910 1915 1920
Asn Asn Val Asn Arg Ala Thr Gln Ser Ala Lys Glu Leu Asp Val Lys
1925 1930 1935
Ile Lys Asn Val Ile Arg Asn Val His Met Leu Asn Arg Ile Arg Thr
1940 1945 1950
Trp Gln Lys Thr His Gln Gly Glu Asn Asn Gly Leu Ala Asn Ser Ile
1955 1960 1965
Arg Asp Ser Leu Asn Glu Tyr Glu Ala Lys Leu Ser Asp Leu Arg Ala
1970 1975 1980
Arg Leu Gln Glu Ala Ala Ala Gln Ala Lys Gln Ala Asn Gly Leu Asn
1985 1990 1995 2000
Gln Glu Asn Glu Arg Ala Leu Gly Ala Ile Gln Arg Gln Val Lys Glu
2005 2010 2015
Ile Asn Ser Leu Gln Ser Asp Phe Thr Lys Tyr Leu Thr Thr Ala Asp
2020 2025 2030
Ser Ser Leu Leu Gln Thr Asn Ile Ala Leu Gln Leu Met Glu Lys Ser
2035 2040 2045
Gln Lys Glu Tyr Glu Lys Leu Ala Ala Ser Leu Asn Glu Ala Arg Gln
2050 2055 2060
Glu Leu Ser Asp Lys Val Arg Glu Leu Ser Arg Ser Ala Gly Lys Thr
2065 2070 2075 2080
Ser Leu Val Glu Glu Ala Glu Lys His Ala Arg Ser Leu Gln Glu Leu
2085 2090 2095
Ala Lys Gln Leu Glu Glu Ile Lys Arg Asn Ala Ser Gly Asp Glu Leu
2100 2105 2110
Val Arg Cys Ala Val Asp Ala Ala Thr Ala Tyr Glu Asn Ile Leu Asn
2115 2120 2125
Ala Ile Lys Ala Ala Glu Asp Ala Ala Asn Arg Ala Ala Ser Ala Ser
2130 2135 2140
Glu Ser Ala Leu Gln Thr Val Ile Lys Glu Asp Leu Pro Arg Lys Ala
2145 2150 2155 2160
Lys Thr Leu Ser Ser Asn Ser Asp Lys Leu Leu Asn Glu Ala Lys Met
2165 2170 2175
Thr Gln Lys Lys Leu Lys Gln Glu Val Ser Pro Ala Leu Asn Asn Leu
2180 2185 2190
Gln Gln Thr Leu Asn Ile Val Thr Val Gln Lys Glu Val Ile Asp Thr
2195 2200 2205
Asn Leu Thr Thr Leu Arg Asp Gly Leu His Gly Ile Gln Arg Gly Asp
2210 2215 2220
Ile Asp Ala Met Ile Ser Ser Ala Lys Ser Met Val Arg Lys Ala Asn
2225 2230 2235 2240
Asp Ile Thr Asp Glu Val Leu Asp Gly Leu Asn Pro Ile Gln Thr Asp
2245 2250 2255
Val Glu Arg Ile Lys Asp Thr Tyr Gly Arg Thr Gln Asn Glu Asp Phe
2260 2265 2270
Lys Lys Ala Leu Thr Asp Ala Asp Asn Ser Val Asn Lys Leu Thr Asn
2275 2280 2285
Lys Leu Pro Asp Leu Trp Arg Lys Ile Glu Ser Ile Asn Gln Gln Leu
2290 2295 2300
Leu Pro Leu Gly Asn Ile Ser Asp Asn Met Asp Arg Ile Arg Glu Leu
2305 2310 2315 2320
Ile Gln Gln Ala Arg Asp Ala Ala Ser Lys Val Ala Val Pro Met Arg
2325 2330 2335
Phe Asn Gly Lys Ser Gly Val Glu Val Arg Leu Pro Asn Asp Leu Glu
2340 2345 2350
Asp Leu Lys Gly Tyr Thr Ser Leu Ser Leu Phe Leu Gln Arg Pro Asn
2355 2360 2365
Ser Arg Glu Asn Gly Gly Thr Glu Asn Met Phe Val Met Tyr Leu Gly
2370 2375 2380
Asn Lys Asp Ala Ser Arg Asp Tyr Ile Gly Met Ala Val Val Asp Gly
2385 2390 2395 2400
Gln Leu Thr Cys Val Tyr Asn Leu Gly Asp Arg Glu Ala Glu Leu Gln
2405 2410 2415
Val Asp Gln Ile Leu Thr Lys Ser Glu Thr Lys Glu Ala Val Met Asp
2420 2425 2430
Arg Val Lys Phe Gln Arg Ile Tyr Gln Phe Ala Arg Leu Asn Tyr Thr
2435 2440 2445
Lys Gly Ala Thr Ser Ser Lys Pro Glu Thr Pro Gly Val Tyr Asp Met
2450 2455 2460
Asp Gly Arg Asn Ser Asn Thr Leu Leu Asn Leu Asp Pro Glu Asn Val
2465 2470 2475 2480
Val Phe Tyr Val Gly Gly Tyr Pro Pro Asp Phe Lys Leu Pro Ser Arg
2485 2490 2495
Leu Ser Phe Pro Pro Tyr Lys Gly Cys Ile Glu Leu Asp Asp Leu Asn
2500 2505 2510
Glu Asn Val Leu Ser Leu Tyr Asn Phe Lys Lys Thr Phe Asn Leu Asn
2515 2520 2525
Thr Thr Glu Val Glu Pro Cys Arg Arg Arg Lys Glu Glu Ser Asp Lys
2530 2535 2540
Asn Tyr Phe Glu Gly Thr Gly Tyr Ala Arg Val Pro Thr Gln Pro His
2545 2550 2555 2560
Ala Pro Ile Pro Thr Phe Gly Gln Thr Ile Gln Thr Thr Val Asp Arg
2565 2570 2575
Gly Leu Leu Phe Phe Ala Glu Asn Gly Asp Arg Phe Ile Ser Leu Asn
2580 2585 2590
Ile Glu Asp Gly Lys Leu Met Val Arg Tyr Lys Leu Asn Ser Glu Leu
2595 2600 2605
Pro Lys Glu Arg Gly Val Gly Asp Ala Ile Asn Asn Gly Arg Asp His
2610 2615 2620
Ser Ile Gln Ile Lys Ile Gly Lys Leu Gln Lys Arg Met Trp Ile Asn
2625 2630 2635 2640
Val Asp Val Gln Asn Thr Ile Ile Asp Gly Glu Val Phe Asp Phe Ser
2645 2650 2655
Thr Tyr Tyr Leu Gly Gly Ile Pro Ile Ala Ile Arg Glu Arg Phe Asn
2660 2665 2670
Ile Ser Thr Pro Ala Phe Arg Gly Cys Met Lys Asn Leu Lys Lys Thr
2675 2680 2685
Ser Gly Val Val Arg Leu Asn Asp Thr Val Gly Val Thr Lys Lys Cys
2690 2695 2700
Ser Glu Asp Trp Lys Leu Val Arg Ser Ala Ser Phe Ser Arg Gly Gly
2705 2710 2715 2720
Gln Leu Ser Phe Thr Asp Leu Gly Leu Pro Pro Thr Asp His Leu Gln
2725 2730 2735
Ala Ser Phe Gly Phe Gln Thr Phe Gln Pro Ser Gly Ile Leu Leu Asp
2740 2745 2750
His Gln Thr Trp Thr Arg Asn Leu Gln Val Thr Leu Glu Asp Gly Tyr
2755 2760 2765
Ile Glu Leu Ser Thr Ser Asp Ser Gly Gly Pro Ile Phe Lys Ser Pro
2770 2775 2780
Gln Thr Tyr Met Asp Gly Leu Leu His Tyr Val Ser Val Ile Ser Asp
2785 2790 2795 2800
Asn Ser Gly Leu Arg Leu Leu Ile Asp Asp Gln Leu Leu Arg Asn Ser
2805 2810 2815
Lys Arg Leu Lys His Ile Ser Ser Ser Arg Gln Ser Leu Arg Leu Gly
2820 2825 2830
Gly Ser Asn Phe Glu Gly Cys Ile Ser Asn Val Phe Val Gln Arg Leu
2835 2840 2845
Ser Leu Ser Pro Glu Val Leu Asp Leu Thr Ser Asn Ser Leu Lys Arg
2850 2855 2860
Asp Val Ser Leu Gly Gly Cys Ser Leu Asn Lys Pro Pro Phe Leu Met
2865 2870 2875 2880
Leu Leu Lys Gly Ser Thr Arg Phe Asn Lys Thr Lys Thr Phe Arg Ile
2885 2890 2895
Asn Gln Leu Leu Gln Asp Thr Pro Val Ala Ser Pro Arg Ser Val Lys
2900 2905 2910
Val Trp Gln Asp Ala Cys Ser Pro Leu Pro Lys Thr Gln Ala Asn His
2915 2920 2925
Gly Ala Leu Gln Phe Gly Asp Ile Pro Thr Ser His Leu Leu Phe Lys
2930 2935 2940
Leu Pro Gln Glu Leu Leu Lys Pro Arg Ser Gln Phe Ala Val Asp Met
2945 2950 2955 2960
Gln Thr Thr Ser Ser Arg Gly Leu Val Phe His Thr Gly Thr Lys Asn
2965 2970 2975
Ser Phe Met Ala Leu Tyr Leu Ser Lys Gly Arg Leu Val Phe Ala Leu
2980 2985 2990
Gly Thr Asp Gly Lys Lys Leu Arg Ile Lys Ser Lys Glu Lys Cys Asn
2995 3000 3005
Asp Gly Lys Trp His Thr Val Val Phe Gly His Asp Gly Glu Lys Gly
3010 3015 3020
Arg Leu Val Val Asp Gly Leu Arg Ala Arg Glu Gly Ser Leu Pro Gly
3025 3030 3035 3040
Asn Ser Thr Ile Ser Ile Arg Ala Pro Val Tyr Leu Gly Ser Pro Pro
3045 3050 3055
Ser Gly Lys Pro Lys Ser Leu Pro Thr Asn Ser Phe Val Gly Cys Leu
3060 3065 3070
Lys Asn Phe Gln Leu Asp Ser Lys Pro Leu Tyr Thr Pro Ser Ser Ser
3075 3080 3085
Phe Gly Val Ser Ser Cys Leu Gly Gly Pro Leu Glu Lys Gly Ile Tyr
3090 3095 3100
Phe Ser Glu Glu Gly Gly His Val Val Leu Ala His Ser Val Leu Leu
3105 3110 3115 3120
Gly Pro Glu Phe Lys Leu Val Phe Ser Ile Arg Pro Arg Ser Leu Thr
3125 3130 3135
Gly Ile Leu Ile His Ile Gly Ser Gln Pro Gly Lys His Leu Cys Val
3140 3145 3150
Tyr Leu Glu Ala Gly Lys Val Thr Ala Ser Met Asp Ser Gly Ala Gly
3155 3160 3165
Gly Thr Ser Thr Ser Val Thr Pro Lys Gln Ser Leu Cys Asp Gly Gln
3170 3175 3180
Trp His Ser Val Ala Val Thr Ile Lys Gln His Ile Leu His Leu Glu
3185 3190 3195 3200
Leu Asp Thr Asp Ser Ser Tyr Thr Ala Gly Gln Ile Pro Phe Pro Pro
3205 3210 3215
Ala Ser Thr Gln Glu Pro Leu His Leu Gly Gly Ala Pro Ala Asn Leu
3220 3225 3230
Thr Thr Leu Arg Ile Pro Val Trp Lys Ser Phe Phe Gly Cys Leu Arg
3235 3240 3245
Asn Ile His Val Asn His Ile Pro Val Pro Val Thr Glu Ala Leu Glu
3250 3255 3260
Val Gln Gly Pro Val Ser Leu Asn Gly Cys Pro Asp Gln
3265 3270 3275

<210> 34
<211> 1668
<212> PRT
<213> Homo sapiens
<400> 34
Met Pro Pro Ala Val Arg Arg Ser Ala Cys Ser Met Gly Trp Leu Trp
1 5 10 15
Ile Phe Gly Ala Ala Leu Gly Gln Cys Leu Gly Tyr Ser Ser Gln Gln
20 25 30
Gln Arg Val Pro Phe Leu Gln Pro Pro Gly Gln Ser Gln Leu Gln Ala
35 40 45
Ser Tyr Val Glu Phe Arg Pro Ser Gln Gly Cys Ser Pro Gly Tyr Tyr
50 55 60
Arg Asp His Lys Gly Leu Tyr Thr Gly Arg Cys Val Pro Cys Asn Cys
65 70 75 80
Asn Gly His Ser Asn Gln Cys Gln Asp Gly Ser Gly Ile Cys Val Asn
85 90 95
Cys Gln His Asn Thr Ala Gly Glu His Cys Glu Arg Cys Gln Glu Gly
100 105 110
Tyr Tyr Gly Asn Ala Val His Gly Ser Cys Arg Ala Cys Pro Cys Pro
115 120 125
His Thr Asn Ser Phe Ala Thr Gly Cys Val Val Asn Gly Gly Asp Val
130 135 140
Arg Cys Ser Cys Lys Ala Gly Tyr Thr Gly Thr Gln Cys Glu Arg Cys
145 150 155 160
Ala Pro Gly Tyr Phe Gly Asn Pro Gln Lys Phe Gly Gly Ser Cys Gln
165 170 175
Pro Cys Ser Cys Asn Ser Asn Gly Gln Leu Gly Ser Cys His Pro Leu
180 185 190
Thr Gly Asp Cys Ile Asn Gln Glu Pro Lys Asp Ser Ser Pro Ala Glu
195 200 205
Glu Cys Asp Asp Cys Asp Ser Cys Val Met Thr Leu Leu Asn Asp Leu
210 215 220
Ala Thr Met Gly Glu Gln Leu Arg Leu Val Lys Ser Gln Leu Gln Gly
225 230 235 240
Leu Ser Ala Ser Ala Gly Leu Leu Glu Gln Met Arg His Met Glu Thr
245 250 255
Gln Ala Lys Asp Leu Arg Asn Gln Leu Leu Asn Tyr Arg Ser Ala Ile
260 265 270
Ser Asn His Gly Ser Lys Ile Glu Gly Leu Glu Arg Glu Leu Thr Asp
275 280 285
Leu Asn Gln Glu Phe Glu Thr Leu Gln Glu Lys Ala Gln Val Asn Ser
290 295 300
Arg Lys Ala Gln Thr Leu Asn Asn Asn Val Asn Arg Ala Thr Gln Ser
305 310 315 320
Ala Lys Glu Leu Asp Val Lys Ile Lys Asn Val Ile Arg Asn Val His
325 330 335
Met Leu Asn Arg Ile Arg Thr Trp Gln Lys Thr His Gln Gly Glu Asn
340 345 350
Asn Gly Leu Ala Asn Ser Ile Arg Asp Ser Leu Asn Glu Tyr Glu Ala
355 360 365
Lys Leu Ser Asp Leu Arg Ala Arg Leu Gln Glu Ala Ala Ala Gln Ala
370 375 380
Lys Gln Ala Asn Gly Leu Asn Gln Glu Asn Glu Arg Ala Leu Gly Ala
385 390 395 400
Ile Gln Arg Gln Val Lys Glu Ile Asn Ser Leu Gln Ser Asp Phe Thr
405 410 415
Lys Tyr Leu Thr Thr Ala Asp Ser Ser Leu Leu Gln Thr Asn Ile Ala
420 425 430
Leu Gln Leu Met Glu Lys Ser Gln Lys Glu Tyr Glu Lys Leu Ala Ala
435 440 445
Ser Leu Asn Glu Ala Arg Gln Glu Leu Ser Asp Lys Val Arg Glu Leu
450 455 460
Ser Arg Ser Ala Gly Lys Thr Ser Leu Val Glu Glu Ala Glu Lys His
465 470 475 480
Ala Arg Ser Leu Gln Glu Leu Ala Lys Gln Leu Glu Glu Ile Lys Arg
485 490 495
Asn Ala Ser Gly Asp Glu Leu Val Arg Cys Ala Val Asp Ala Ala Thr
500 505 510
Ala Tyr Glu Asn Ile Leu Asn Ala Ile Lys Ala Ala Glu Asp Ala Ala
515 520 525
Asn Arg Ala Ala Ser Ala Ser Glu Ser Ala Leu Gln Thr Val Ile Lys
530 535 540
Glu Asp Leu Pro Arg Lys Ala Lys Thr Leu Ser Ser Asn Ser Asp Lys
545 550 555 560
Leu Leu Asn Glu Ala Lys Met Thr Gln Lys Lys Leu Lys Gln Glu Val
565 570 575
Ser Pro Ala Leu Asn Asn Leu Gln Gln Thr Leu Asn Ile Val Thr Val
580 585 590
Gln Lys Glu Val Ile Asp Thr Asn Leu Thr Thr Leu Arg Asp Gly Leu
595 600 605
His Gly Ile Gln Arg Gly Asp Ile Asp Ala Met Ile Ser Ser Ala Lys
610 615 620
Ser Met Val Arg Lys Ala Asn Asp Ile Thr Asp Glu Val Leu Asp Gly
625 630 635 640
Leu Asn Pro Ile Gln Thr Asp Val Glu Arg Ile Lys Asp Thr Tyr Gly
645 650 655
Arg Thr Gln Asn Glu Asp Phe Lys Lys Ala Leu Thr Asp Ala Asp Asn
660 665 670
Ser Val Asn Lys Leu Thr Asn Lys Leu Pro Asp Leu Trp Arg Lys Ile
675 680 685
Glu Ser Ile Asn Gln Gln Leu Leu Pro Leu Gly Asn Ile Ser Asp Asn
690 695 700
Met Asp Arg Ile Arg Glu Leu Ile Gln Gln Ala Arg Asp Ala Ala Ser
705 710 715 720
Lys Val Ala Val Pro Met Arg Phe Asn Gly Lys Ser Gly Val Glu Val
725 730 735
Arg Leu Pro Asn Asp Leu Glu Asp Leu Lys Gly Tyr Thr Ser Leu Ser
740 745 750
Leu Phe Leu Gln Arg Pro Asn Ser Arg Glu Asn Gly Gly Thr Glu Asn
755 760 765
Met Phe Val Met Tyr Leu Gly Asn Lys Asp Ala Ser Arg Asp Tyr Ile
770 775 780
Gly Met Ala Val Val Asp Gly Gln Leu Thr Cys Val Tyr Asn Leu Gly
785 790 795 800
Asp Arg Glu Ala Glu Leu Gln Val Asp Gln Ile Leu Thr Lys Ser Glu
805 810 815
Thr Lys Glu Ala Val Met Asp Arg Val Lys Phe Gln Arg Ile Tyr Gln
820 825 830
Phe Ala Arg Leu Asn Tyr Thr Lys Gly Ala Thr Ser Ser Lys Pro Glu
835 840 845
Thr Pro Gly Val Tyr Asp Met Asp Gly Arg Asn Ser Asn Thr Leu Leu
850 855 860
Asn Leu Asp Pro Glu Asn Val Val Phe Tyr Val Gly Gly Tyr Pro Pro
865 870 875 880
Asp Phe Lys Leu Pro Ser Arg Leu Ser Phe Pro Pro Tyr Lys Gly Cys
885 890 895
Ile Glu Leu Asp Asp Leu Asn Glu Asn Val Leu Ser Leu Tyr Asn Phe
900 905 910
Lys Lys Thr Phe Asn Leu Asn Thr Thr Glu Val Glu Pro Cys Arg Arg
915 920 925
Arg Lys Glu Glu Ser Asp Lys Asn Tyr Phe Glu Gly Thr Gly Tyr Ala
930 935 940
Arg Val Pro Thr Gln Pro His Ala Pro Ile Pro Thr Phe Gly Gln Thr
945 950 955 960
Ile Gln Thr Thr Val Asp Arg Gly Leu Leu Phe Phe Ala Glu Asn Gly
965 970 975
Asp Arg Phe Ile Ser Leu Asn Ile Glu Asp Gly Lys Leu Met Val Arg
980 985 990
Tyr Lys Leu Asn Ser Glu Leu Pro Lys Glu Arg Gly Val Gly Asp Ala
995 1000 1005
Ile Asn Asn Gly Arg Asp His Ser Ile Gln Ile Lys Ile Gly Lys Leu
1010 1015 1020
Gln Lys Arg Met Trp Ile Asn Val Asp Val Gln Asn Thr Ile Ile Asp
1025 1030 1035 1040
Gly Glu Val Phe Asp Phe Ser Thr Tyr Tyr Leu Gly Gly Ile Pro Ile
1045 1050 1055
Ala Ile Arg Glu Arg Phe Asn Ile Ser Thr Pro Ala Phe Arg Gly Cys
1060 1065 1070
Met Lys Asn Leu Lys Lys Thr Ser Gly Val Val Arg Leu Asn Asp Thr
1075 1080 1085
Val Gly Val Thr Lys Lys Cys Ser Glu Asp Trp Lys Leu Val Arg Ser
1090 1095 1100
Ala Ser Phe Ser Arg Gly Gly Gln Leu Ser Phe Thr Asp Leu Gly Leu
1105 1110 1115 1120
Pro Pro Thr Asp His Leu Gln Ala Ser Phe Gly Phe Gln Thr Phe Gln
1125 1130 1135
Pro Ser Gly Ile Leu Leu Asp His Gln Thr Trp Thr Arg Asn Leu Gln
1140 1145 1150
Val Thr Leu Glu Asp Gly Tyr Ile Glu Leu Ser Thr Ser Asp Ser Gly
1155 1160 1165
Gly Pro Ile Phe Lys Ser Pro Gln Thr Tyr Met Asp Gly Leu Leu His
1170 1175 1180
Tyr Val Ser Val Ile Ser Asp Asn Ser Gly Leu Arg Leu Leu Ile Asp
1185 1190 1195 1200
Asp Gln Leu Leu Arg Asn Ser Lys Arg Leu Lys His Ile Ser Ser Ser
1205 1210 1215
Arg Gln Ser Leu Arg Leu Gly Gly Ser Asn Phe Glu Gly Cys Ile Ser
1220 1225 1230
Asn Val Phe Val Gln Arg Leu Ser Leu Ser Pro Glu Val Leu Asp Leu
1235 1240 1245
Thr Ser Asn Ser Leu Lys Arg Asp Val Ser Leu Gly Gly Cys Ser Leu
1250 1255 1260
Asn Lys Pro Pro Phe Leu Met Leu Leu Lys Gly Ser Thr Arg Phe Asn
1265 1270 1275 1280
Lys Thr Lys Thr Phe Arg Ile Asn Gln Leu Leu Gln Asp Thr Pro Val
1285 1290 1295
Ala Ser Pro Arg Ser Val Lys Val Trp Gln Asp Ala Cys Ser Pro Leu
1300 1305 1310
Pro Lys Thr Gln Ala Asn His Gly Ala Leu Gln Phe Gly Asp Ile Pro
1315 1320 1325
Thr Ser His Leu Leu Phe Lys Leu Pro Gln Glu Leu Leu Lys Pro Arg
1330 1335 1340
Ser Gln Phe Ala Val Asp Met Gln Thr Thr Ser Ser Arg Gly Leu Val
1345 1350 1355 1360
Phe His Thr Gly Thr Lys Asn Ser Phe Met Ala Leu Tyr Leu Ser Lys
1365 1370 1375
Gly Arg Leu Val Phe Ala Leu Gly Thr Asp Gly Lys Lys Leu Arg Ile
1380 1385 1390
Lys Ser Lys Glu Lys Cys Asn Asp Gly Lys Trp His Thr Val Val Phe
1395 1400 1405
Gly His Asp Gly Glu Lys Gly Arg Leu Val Val Asp Gly Leu Arg Ala
1410 1415 1420
Arg Glu Gly Ser Leu Pro Gly Asn Ser Thr Ile Ser Ile Arg Ala Pro
1425 1430 1435 1440
Val Tyr Leu Gly Ser Pro Pro Ser Gly Lys Pro Lys Ser Leu Pro Thr
1445 1450 1455
Asn Ser Phe Val Gly Cys Leu Lys Asn Phe Gln Leu Asp Ser Lys Pro
1460 1465 1470
Leu Tyr Thr Pro Ser Ser Ser Phe Gly Val Ser Ser Cys Leu Gly Gly
1475 1480 1485
Pro Leu Glu Lys Gly Ile Tyr Phe Ser Glu Glu Gly Gly His Val Val
1490 1495 1500
Leu Ala His Ser Val Leu Leu Gly Pro Glu Phe Lys Leu Val Phe Ser
1505 1510 1515 1520
Ile Arg Pro Arg Ser Leu Thr Gly Ile Leu Ile His Ile Gly Ser Gln
1525 1530 1535
Pro Gly Lys His Leu Cys Val Tyr Leu Glu Ala Gly Lys Val Thr Ala
1540 1545 1550
Ser Met Asp Ser Gly Ala Gly Gly Thr Ser Thr Ser Val Thr Pro Lys
1555 1560 1565
Gln Ser Leu Cys Asp Gly Gln Trp His Ser Val Ala Val Thr Ile Lys
1570 1575 1580
Gln His Ile Leu His Leu Glu Leu Asp Thr Asp Ser Ser Tyr Thr Ala
1585 1590 1595 1600
Gly Gln Ile Pro Phe Pro Pro Ala Ser Thr Gln Glu Pro Leu His Leu
1605 1610 1615
Gly Gly Ala Pro Ala Asn Leu Thr Thr Leu Arg Ile Pro Val Trp Lys
1620 1625 1630
Ser Phe Phe Gly Cys Leu Arg Asn Ile His Val Asn His Ile Pro Val
1635 1640 1645
Pro Val Thr Glu Ala Leu Glu Val Gln Gly Pro Val Ser Leu Asn Gly
1650 1655 1660
Cys Pro Asp Gln
1665

<210> 35
<211> 1111
<212> PRT
<213> Homo sapiens
<400> 35
Met Pro Ala Leu Trp Leu Gly Cys Cys Leu Cys Phe Ser Leu Leu Leu
1 5 10 15
Pro Ala Ala Arg Ala Thr Ser Arg Arg Glu Val Cys Asp Cys Asn Gly
20 25 30
Lys Ser Arg Gln Cys Ile Phe Asp Arg Glu Leu His Arg Gln Thr Gly
35 40 45
Asn Gly Phe Arg Cys Leu Asn Cys Asn Asp Asn Thr Asp Gly Ile His
50 55 60
Cys Glu Lys Cys Lys Asn Gly Phe Tyr Arg His Arg Glu Arg Asp Arg
65 70 75 80
Cys Leu Pro Cys Asn Cys Asn Ser Lys Gly Ser Leu Ser Ala Arg Cys
85 90 95
Asp Asn Ser Gly Arg Cys Ser Cys Lys Pro Gly Val Thr Gly Ala Arg
100 105 110
Cys Asp Arg Cys Leu Pro Gly Phe His Met Leu Thr Asp Ala Gly Cys
115 120 125
Thr Gln Asp Gln Arg Leu Leu Asp Ser Lys Cys Asp Cys Asp Pro Ala
130 135 140
Gly Ile Ala Gly Pro Cys Asp Ala Gly Arg Cys Val Cys Lys Pro Ala
145 150 155 160
Val Thr Gly Glu Arg Cys Asp Arg Cys Arg Ser Gly Tyr Tyr Asn Leu
165 170 175
Asp Gly Gly Asn Pro Glu Gly Cys Thr Gln Cys Phe Cys Tyr Gly His
180 185 190
Ser Ala Ser Cys Arg Ser Ser Ala Glu Tyr Ser Val His Lys Ile Thr
195 200 205
Ser Thr Phe His Gln Asp Val Asp Gly Trp Lys Ala Val Gln Arg Asn
210 215 220
Gly Ser Pro Ala Lys Leu Gln Trp Ser Gln Arg His Gln Asp Val Phe
225 230 235 240
Ser Ser Ala Gln Arg Leu Asp Pro Val Tyr Phe Val Ala Pro Ala Lys
245 250 255
Phe Leu Gly Asn Gln Gln Val Ser Tyr Gly Gln Ser Leu Ser Phe Asp
260 265 270
Tyr Arg Val Asp Arg Gly Gly Arg His Pro Ser Ala His Asp Val Ile
275 280 285
Leu Glu Gly Ala Gly Leu Arg Ile Thr Ala Pro Leu Met Pro Leu Gly
290 295 300
Lys Thr Leu Pro Cys Gly Leu Thr Lys Thr Tyr Thr Phe Arg Leu Asn
305 310 315 320
Glu His Pro Ser Asn Asn Trp Ser Pro Gln Leu Ser Tyr Phe Glu Tyr
325 330 335
Arg Arg Leu Leu Arg Asn Leu Thr Ala Leu Arg Ile Arg Ala Thr Tyr
340 345 350
Gly Glu Tyr Ser Thr Gly Tyr Ile Asp Asn Val Thr Leu Ile Ser Ala
355 360 365
Arg Pro Val Ser Gly Ala Pro Ala Pro Trp Val Glu Gln Cys Ile Cys
370 375 380
Pro Val Gly Tyr Lys Gly Gln Phe Cys Gln Asp Cys Ala Ser Gly Tyr
385 390 395 400
Lys Arg Asp Ser Ala Arg Leu Gly Pro Phe Gly Thr Cys Ile Pro Cys
405 410 415
Asn Cys Gln Gly Gly Gly Ala Cys Asp Pro Asp Thr Gly Asp Cys Tyr
420 425 430
Ser Gly Asp Glu Asn Pro Asp Ile Glu Cys Ala Asp Cys Pro Ile Gly
435 440 445
Phe Tyr Asn Asp Pro His Asp Pro Arg Ser Cys Lys Pro Cys Pro Cys
450 455 460
His Asn Gly Phe Ser Cys Ser Val Met Pro Glu Thr Glu Glu Val Val
465 470 475 480
Cys Asn Asn Cys Pro Pro Gly Val Thr Gly Ala Arg Cys Glu Leu Cys
485 490 495
Ala Asp Gly Tyr Phe Gly Asp Pro Phe Gly Glu His Gly Pro Val Arg
500 505 510
Pro Cys Gln Pro Cys Gln Cys Asn Asn Asn Val Asp Pro Ser Ala Ser
515 520 525
Gly Asn Cys Asp Arg Leu Thr Gly Arg Cys Leu Lys Cys Ile His Asn
530 535 540
Thr Ala Gly Ile Tyr Cys Asp Gln Cys Lys Ala Gly Tyr Phe Gly Asp
545 550 555 560
Pro Leu Ala Pro Asn Pro Ala Asp Lys Cys Arg Ala Cys Asn Cys Asn
565 570 575
Pro Met Gly Ser Glu Pro Val Gly Cys Arg Ser Asp Gly Thr Cys Val
580 585 590
Cys Lys Pro Gly Phe Gly Gly Pro Asn Cys Glu His Gly Ala Phe Ser
595 600 605
Cys Pro Ala Cys Tyr Asn Gln Val Lys Ile Gln Met Asp Gln Phe Met
610 615 620
Gln Gln Leu Gln Arg Met Glu Ala Leu Ile Ser Lys Ala Gln Gly Gly
625 630 635 640
Asp Gly Val Val Pro Asp Thr Glu Leu Glu Gly Arg Met Gln Gln Ala
645 650 655
Glu Gln Ala Leu Gln Asp Ile Leu Arg Asp Ala Gln Ile Ser Glu Gly
660 665 670
Ala Ser Arg Ser Leu Gly Leu Gln Leu Ala Lys Val Arg Ser Gln Glu
675 680 685
Asn Ser Tyr Gln Ser Arg Leu Asp Asp Leu Lys Met Thr Val Glu Arg
690 695 700
Val Arg Ala Leu Gly Ser Gln Tyr Gln Asn Arg Val Arg Asp Thr His
705 710 715 720
Arg Leu Ile Thr Gln Met Gln Leu Ser Leu Ala Glu Ser Glu Ala Ser
725 730 735
Leu Gly Asn Thr Asn Ile Pro Ala Ser Asp His Tyr Val Gly Pro Asn
740 745 750
Gly Phe Lys Ser Leu Ala Gln Glu Ala Thr Arg Leu Ala Glu Ser His
755 760 765
Val Glu Ser Ala Ser Asn Met Glu Gln Leu Thr Arg Glu Thr Glu Asp
770 775 780
Tyr Ser Lys Gln Ala Leu Ser Leu Val Arg Lys Ala Leu His Glu Gly
785 790 795 800
Val Gly Ser Gly Ser Gly Ser Pro Asp Gly Ala Val Val Gln Gly Leu
805 810 815
Val Glu Lys Leu Glu Lys Thr Lys Ser Leu Ala Gln Gln Leu Thr Arg
820 825 830
Glu Ala Thr Gln Ala Glu Ile Glu Ala Asp Arg Ser Tyr Gln His Ser
835 840 845
Leu Arg Leu Leu Asp Ser Val Ser Arg Leu Gln Gly Val Ser Asp Gln
850 855 860
Ser Phe Gln Val Glu Glu Ala Lys Arg Ile Lys Gln Lys Ala Asp Ser
865 870 875 880
Leu Ser Ser Leu Val Thr Arg His Met Asp Glu Phe Lys Arg Thr Gln
885 890 895
Lys Asn Leu Gly Asn Trp Lys Glu Glu Ala Gln Gln Leu Leu Gln Asn
900 905 910
Gly Lys Ser Gly Arg Glu Lys Ser Asp Gln Leu Leu Ser Arg Ala Asn
915 920 925
Leu Ala Lys Ser Arg Ala Gln Glu Ala Leu Ser Met Gly Asn Ala Thr
930 935 940
Phe Tyr Glu Val Glu Ser Ile Leu Lys Asn Leu Arg Glu Phe Asp Leu
945 950 955 960
Gln Val Asp Asn Arg Lys Ala Glu Ala Glu Glu Ala Met Lys Arg Leu
965 970 975
Ser Tyr Ile Ser Gln Lys Val Ser Asp Ala Ser Asp Lys Thr Gln Gln
980 985 990
Ala Glu Arg Ala Leu Gly Ser Ala Ala Ala Asp Ala Gln Arg Ala Lys
995 1000 1005
Asn Gly Ala Gly Glu Ala Leu Glu Ile Ser Ser Glu Ile Glu Gln Glu
1010 1015 1020
Ile Gly Ser Leu Asn Leu Glu Ala Asn Val Thr Ala Asp Gly Ala Leu
1025 1030 1035 1040
Ala Met Glu Lys Gly Leu Ala Ser Leu Lys Ser Glu Met Arg Glu Val
1045 1050 1055
Glu Gly Glu Leu Glu Arg Lys Glu Leu Glu Phe Asp Thr Asn Met Asp
1060 1065 1070
Ala Val Gln Met Val Ile Thr Glu Ala Gln Lys Val Asp Thr Arg Ala
1075 1080 1085
Lys Asn Ala Gly Val Thr Ile Gln Asp Thr Leu Asn Thr Leu Asp Gly
1090 1095 1100
Leu Leu His Leu Met Gly Met
1105 1110

<210> 36
<211> 12186
<212> DNA
<213> Homo sapiens
<400> 36
atgtctactc tcctggaaaa catctttgcc ataattaatc ttttcaagca atattcaaaa 60
aaagataaaa acactgacac attgagtaaa aaagagctga aggaacttct ggaaaaggaa 120
tttcggcaaa tcctgaagaa tccagatgac ccagatatgg ttgatgtctt catggatcac 180
ttggatatag accacaacaa gaaaattgac ttcactgagt ttcttctgat ggtattcaag 240
ttggctcaag catattatga gtctaccaga aaagagaatt taccgatatc aggacacaag 300
cacagaaagc acagtcatca tgataaacat gaagataata aacaggaaga aaacaaagaa 360
aacagaaaaa gaccctcaag tctggaaaga agaaacaata gaaaagggaa taagggaaga 420
tccaagagcc caagagaaac aggggggaaa aggcatgaat ctagttctga aaaaaaagaa 480
agaaaaggat attcacctac tcatagagaa gaagaatatg gaaaaaacca tcataactca 540
agtaaaaaag agaaaaacaa gactgaaaat actagattag gagacaatag gaagaggcta 600
agtgaaagac ttgaagagaa agaagacaat gaagaaggag tatatgatta tgaaaataca 660
ggaagaatga ctcaaaaatg gatacaatca ggccatattg ccacatatta cacaatccag 720
gatgaagcct atgacaccac tgatagtcta ttagaagaaa acaaaatata tgaaagatca 780
aggtcatctg atggcaaatc atcatctcaa gtgaacaggt caagacatga aaatacaagc 840
caggtaccat tgcaggagtc caggacaaga aagcgtaggg gatccagagt tagccaggac 900
agggacagtg agggacactc agaagactct gagaggcact ctgggtcggc ttccagaaac 960
catcatggat ctgcgtggga gcagtcaaga gatggctcca gacaccccag gtcccatgat 1020
gaagacagag ccagtcatgg gcactctgca gacagctcca gacaatcagg cactcgtcac 1080
gcagagactt cctctcgtgg acagactgca tcatcccatg aacaggcaag atcaagtcca 1140
ggagaaagac atggatccgg ccaccagcag tcagcagaca gctccagaca ctcagccact 1200
gggcgcgggc aagcttcatc tgcagtcagc gatcgtggac accgggggtc tagcggtagt 1260
caggccagtg acagtgaggg acattcagaa aactcagaca cacaatcagt gtcaggccac 1320
ggaaaggctg ggctgagaca gcagagccac caagagtcca cacgtggccg gtcaggggaa 1380
cggtctggac gttcagggtc ttccctctac caggtgagca ctcatgaaca gcctgactct 1440
gcccatggac ggaccgggac cagcactgga ggaagacaag gatcgcacca cgagcaggca 1500
cgagacagct ccaggcattc agcgtcccaa gagggtcagg acaccattcg tggacacccg 1560
gggtcaagca gaggaggaag gcagggatcc caccacgagc aatcggtaaa taggtctgga 1620
cactcaggtt cccatcacag ccacaccaca tcccagggaa ggtctgatgc ctcccatggg 1680
cagtcaggat ccagaagtgc aagcagacaa acacgaaatg aggaacaatc aggagacggc 1740
accaggcact cagggtcacg tcatcatgaa gcttcctctc aggctgacag ctctagacac 1800
tcacaggtgg gccagggaca atcatcgggg cccaggacaa gtaggaacca gggatccagt 1860
gttagccagg acagtgacag tcagggacac tcagaagact ctgagaggtg gtctgggtct 1920
gcttccagaa accatcatgg atctgctcag gagcagtcaa gagatggctc cagacacccc 1980
aggtcccatc acgaagacag agctggtcat gggcactctg cagacagctc cagaaaatca 2040
ggcactcgtc acacacagaa ttcctctagt ggacaggctg cgtcatccca tgaacaggca 2100
agatcaagtg caggagaaag acatggatcc cgccaccagc tccagtcagc agacagctcc 2160
agacactcag gcactgggca cggacaagct tcatctgcag tcagagacag tggacaccga 2220
gggtccagtg gtagtcaggc cactgacagt gagggacatt cagaagactc agacacacag 2280
tcagtgtcag gccatggaca ggctggtcac catcagcaga gccaccaaga gtccgcacgt 2340
gaccggtcag gggaaaggtc tcgacgttca gggtctttcc tctaccaggt gagcactcat 2400
aaacagtctg agtcctccca tggatggaca gggcccagca ctggagtaag acaaggatcc 2460
caccatgagc aggcacgaga caactccagg cactcagcat cccaagatgg tcaggacacc 2520
attcgtggac acccggggtc aagcagaaga ggaaggcagg ggtcccacca cgagcaatcg 2580
gtagataggt ctggacactc agggtcccat cacagccaca ccacatccca gggaaggtct 2640
gatgcctccc gtgggcagtc aggatccaga agtgcaagca gaacaacacg taatgaggaa 2700
caatcaagag acggctccag gcactcaggg tcacgtcacc atgaagcttc ctctcatgcc 2760
gacatctcta gacactcaca ggcaggccag ggacaatcag aggggtccag gacaagcagg 2820
cgccagggat ccagtgttag ccaggacagt gacagtgagg gacattcaga agactctgag 2880
aggtggtctg ggtctgcttc cagaaaccat cgtggatctg ctcaggagca gtcaagacat 2940
ggctccagac accccaggtc ccatcacgaa gacagagccg gtcacgggca ctctgcagac 3000
agctccagac aatcaggaac tcctcacgca gagacttcct ctggtggaca ggctgcgtca 3060
tcccatgaac aggcaagatc aagtccagga gaaagacacg gatcccgcca ccagcagtca 3120
gcagacagct ccagacactc aggcattccg cgcagacaag cttcatctgc agtcagagac 3180
agtggacact gggggtccag tggtagtcag gccagtgata gtgagggaca ttcagaggag 3240
tcagacacac agtcagtgtc aggccatgga caggatgggc cccatcagca gagccaccaa 3300
gagtccgcac gtgactggtc agggggaagg tctggacgtt cagggtcttt catctaccag 3360
gtgagcactc atgaacagtc tgagtctgcc catgggcgga ccaggaccag cactggacga 3420
agacaaggat cccaccacga gcaggcacga gacagctcca ggcactcagc gtcccaagag 3480
ggtcaggaca ccattcgtgc acacccgggg tcaaggagag gaggaaggca gggatcccac 3540
catgagcaat cggtagatag atctggacac tcagggtccc atcacagcca caccacatcc 3600
cagggaaggt ctgatgcctc ccatgggcag tcaggatcca gaagtgcaag cagacaaact 3660
cgtaaggaca aacaatcagg agacggctcc aggcactcag ggtcacgtca ccatgaagct 3720
gcctcttggg ctgacagctc tagacactca caggtgggac aggaacaatc atcggggtcc 3780
aggacaagca ggcaccaggg atccagtgtt agccaggaca gtgacagtga gagacactca 3840
gacgactccg agaggttgtc tgggtctgct tccagaaacc atcatggatc ttctcgggag 3900
cagtcaagag atggctccag acaccctggg ttccatcaag aagacagagc cagtcacggg 3960
cactctgcag acagctccag acaatcaggc actcatcaca cagagtcttc ctctcatgga 4020
caggctgtgt catcccatga acaggcaaga tcaagtccag gagaaagaca tggatcccgc 4080
caccagcagt cagcagacag ctccagacac tcaggcattg ggcacagaca agcttcatct 4140
gcagtcagag acagtggaca ccgagggtcc agtggtagtc aggtcactaa cagtgaggga 4200
cattcagaag actcagacac acagtcagtg tcagcccacg gacaagctgg gccccatcag 4260
cagagccaca aagagtccgc acgtggccag tcaggggaaa gctctggacg ttcaaggtct 4320
ttcctctacc aggtgagctc tcatgaacag tctgagtcca cacacggaca gactgcaccc 4380
agcactggag gaagacaagg atcccgccat gagcaggcac gaaacagctc taggcactca 4440
gcatcccaag acggtcagga caccattcgt ggacacccgg ggtcaagcag aggaggaagg 4500
cagggatcct accacgagca atcagtagat aggtctggac actcagggta ccatcacagc 4560
cacaccacac cccagggaag gtctgatgcc tcccatgggc agtcaggacc cagaagtgca 4620
agcaggcaaa caagaaatga ggaacaatca ggagacggct ccaggcactc agggtcacgt 4680
caccatgaac cttccactcg ggccggcagc tctagacact cacaggtggg ccagggagaa 4740
tcagcggggt ccaagacaag caggcgccag ggatccagtg ttagtcagga cagggacagt 4800
gagggacact cagaagactc tgagaggcgg tctgagtcgg cttccagaaa ccattatgga 4860
tctgctcggg agcagtcaag acatggctcc aggaacccca ggtcccatca agaagataga 4920
gccagtcatg ggcactctgc agagagctcc agacaatcag gcactcgtca tgcagagact 4980
tcctctggtg gacaggctgc atcatcccag gaacaggcaa ggtcaagtcc aggagaaaga 5040
catggatccc gccaccagca gtcagcagac agctccacag actcaggcac tgggcgcaga 5100
caagattcat ctgtagtcgg agacagtgga aaccgagggt ccagtggtag ccaggccagt 5160
gacagcgagg gacactcaga agagtcagac acacagtcag tgtcagccca cggacaggct 5220
gggccccatc agcagagcca ccaagagtcc acacgtggcc agtcagggga aaggtctgga 5280
cgttcagggt ctttcctcta ccaggtgagc actcatgaac agtctgagtc cgcccatgga 5340
cgcacagggc ccagcactgg aggaagacaa agatcccgcc acgagcaggc acgagacagc 5400
tccaggcact cagcgtccca agagggtcag gacaccattc gtggacaccc agggtcaagc 5460
agaggaggaa ggcagggatc ccactatgag caatcggtag atagttctgg acactcaggg 5520
tctcatcaca gccacaccac gtcccaggaa aggtctgatg tctcccgtgg gcagtcagga 5580
tccagaagtg tcagcagaca aacacgtaat gagaaacaat caggagacgg ctccaggcac 5640
tcagggtcgc gtcaccatga agcttcctct cgggccgaca gctctagaca ctcgcaggtg 5700
ggccagggac aatcatcagg gcccaggaca agcaggaacc agggatccag tgttagccag 5760
gacagtgaca gtcagggaca ctcagaagac tctgagaggt ggtctgggtc tgcttccaga 5820
aaccatcttg gatctgcttg ggagcagtca agagatggct ccagacaccc tgggtcccat 5880
cacgaagaca gagccggtca cgggcactct gcagacagct ccagacaatc aggcactcgt 5940
cacacagagt cttcctctcg tggacaggct gcgtcatccc atgaacaggc aagatcaagt 6000
gcaggagaaa gacatggatc ccaccaccag ctccagtcag cagacagctc cagacactca 6060
ggcattgggc atggacaagc ttcatctgca gtcagagaca gtggacaccg agggtacagt 6120
ggtagtcagg ccagtgacag tgagggacat tcagaagact cagacacaca gtcagtgtca 6180
gcacagggaa aagctgggcc ccatcagcag agccacaaag agtccgcacg tggccagtca 6240
ggggaaagct ctggacgttc agggtctttc ctctaccagg tgagcactca tgaacagtct 6300
gagtccaccc atggacagtc tgcgcccagc actggaggaa gacaaggatc ccattatgat 6360
caggcacaag acagctccag gcactcagca tcccaagagg gtcaggacac cattcgtgga 6420
cacccggggc caagcagagg aggaagacag gggtcccacc aagagcaatc ggtagatagg 6480
tctggacact cagggtctca tcacagccac accacatccc agggaaggtc tgatgcctcc 6540
cgtgggcagt caggatccag aagtgcaagc agaaaaacat atgacaagga acaatcagga 6600
gatggctcta ggcactcagg gtcgcatcat catgaagctt cctcttgggc cgacagctct 6660
agacactcac tggtgggcca gggacaatca tcagggccca ggacaagcag gccccgggga 6720
tccagtgtta gccaggacag tgacagtgag ggacactcag aagattctga gaggcggtct 6780
gggtctgcgt ccagaaacca tcatggatct gctcaggagc agtcaagaga tggctccaga 6840
caccccaggt cccatcacga agacagagcc ggtcatgggc actctgcaga gagctccaga 6900
caatcaggca ctcatcatgc agagaattcc tctggtggac aggctgcatc atcccatgaa 6960
caggcaagat caagtgcagg agagagacac ggatcccacc accagcagtc agcagacagc 7020
tccagacact caggcattgg gcacggacaa gcttcatctg cagtcagaga cagtggacac 7080
cgagggtcca gtggtagtca ggccagtgac agtgagggac attcagaaga ctcagacaca 7140
cagtcagtgt cagcccacgg acaggctggg ccccatcagc agagccacca agagtccaca 7200
cgtggccggt cagcaggaag gtctggacgt tcagggtctt tcctctacca ggtgagcact 7260
catgaacagt ctgagtccgc ccatggacgg accgggacca gcactggagg aagacaagga 7320
tcccaccaca agcaggcacg agacagctcc aggcactcaa cgtcccaaga gggtcaggac 7380
accattcatg gacacccggg gtcaagcagt ggaggaaggc agggatccca ctacgagcaa 7440
ttggtagata gatctggaca ctcagggtct catcacagcc acaccacatc ccagggaagg 7500
tctgatgcct cccatgggca ctcaggatcc agaagtgcaa gcagacaaac tcgtaacgat 7560
gaacaatcag gagacggctc caggcactca gggtcgcgtc accatgaagc ttcctctcgg 7620
gccgacagct ctggacactc gcaggtgggc cagggacaat cagaggggcc caggacaagc 7680
aggaactggg gatccagttt tagccaggac agtgacagtc agggacactc agaagactct 7740
gagaggtggt ctgggtctgc ttccagaaac catcatggat ctgctcagga gcagctaaga 7800
gatggctcca gacaccccag gtcccatcaa gaagacagag ctggtcatgg gcactctgca 7860
gacagctcca gacaatcagg cactcgtcac acacagactt cctctggtgg acaggctgca 7920
tcatcccatg aacaggcaag atcaagtgca ggagaaagac atggatccca ccaccagcag 7980
tcagcagaca gctccagaca ctcaggcatt gggcacggac aagcttcatc tgcagtcaga 8040
gacagtggac accgagggta cagtggtagt caggccagtg acaatgaggg acattcagaa 8100
gactcagaca cacagtcagt gtcagcccac ggacaggctg ggtcccatca gcagagccac 8160
caagagtccg cacgtggccg gtcaggggaa acgtctggac attcaggatc tttcctctac 8220
caggtgagca ctcatgaaca gtctgagtcc tcccatggat ggacggggcc cagcactaga 8280
ggaagacaag gatcccgcca tgagcaggca caagacagct ccaggcactc agcatcccaa 8340
gacggtcagg acaccattcg tggacacccg gggtcaagca gaggaggaag gcaggggtac 8400
caccacgagc attcggtaga tagctctgga cactcagggt cccatcacag ccacaccaca 8460
tcccagggaa ggtctgatgc ctcccgtggg cagtcaggat ccagaagtgc aagcagaaca 8520
acacgtaatg aggaacaatc aggagacggc tccaggcact cagggtcgcg tcaccatgaa 8580
gcttccactc atgccgacat ctctagacac tcacaggcag tccagggaca atcagagggg 8640
tccaggagaa gcaggcgcca gggatccagt gtgagccagg acagtgacag tgagggacat 8700
tcagaagact ctgagaggtg gtctgggtct gcttccagaa accatcatgg atctgctcag 8760
gagcagctaa gagatggctc cagacacccc aggtcccatc aagaagacag agctggtcat 8820
gggcactctg cagacagctc cagacaatca ggcactcgtc acacacagac ttcctctggt 8880
ggacaggctg catcatccca tgaacaggca agatcaagtg caggagaaag acatggatcc 8940
caccaccagc agtcagcaga cagctccaga cactcaggca ttgggcacgg acaagcttca 9000
tctgcagtca gagacagtgg acaccgaggg tacagtggta gtcaggccag tgacaatgag 9060
ggacattcag aagactcaga cacacagtca gtgtcagccc acggacaggc tgggtcccat 9120
cagcagagcc accaagagtc cgcacgtggc cggtcagggg aaacgtctgg acattcagga 9180
tctttcctct accaggtgag cactcatgaa cagtctgagt cctcccatgg atggacgggg 9240
cccagcacta gaggaagaca aggatcccgc catgagcagg cacaagacag ctccaggcac 9300
tcagcatccc aatacggtca ggacaccatt cgtggacacc cggggtcaag cagaggagga 9360
aggcaggggt accaccacga gcattcggta gatagctctg gacactcagg gtcccatcac 9420
agccacacca catcccaggg aaggtctgat gcctcccgtg ggcagtcagg atccagaagt 9480
gcaagcagaa caacacgtaa tgaggaacaa tcaggagaca gctccaggca ctcagtgtca 9540
cgtcaccatg aagcttccac tcatgccgac atctctagac actcacaggc agtccaggga 9600
caatcagagg ggtccaggag aagcaggcgc cagggatcca gtgtgagcca ggacagtgac 9660
agtgagggac attcagaaga ctctgagagg tggtctgggt ctgcttccag aaaccatcgt 9720
ggatctgttc aggagcagtc aaggcacggc tccagacacc ccaggtccca tcacgaagac 9780
agagccggtc acgggcactc tgcagaccgc tccagacaat caggcactcg tcacgcagag 9840
acttcctctg gtggacaggc tgcatcatcc catgaacagg caagatcaag tccaggagag 9900
agacacggat cccgccacca gcagtcagca gacagctcca gacactcagg cattccgcgt 9960
ggacaagctt catctgcagt cagagacagt agacactggg ggtccagtgg tagtcaggcc 10020
agtgatagtg agggacattc agaagagtca gacacacagt cagtgtcagg ccatggacag 10080
gctgggcccc atcagcagag ccaccaagag tccgcacgtg accggtcagg gggaaggtct 10140
ggacgttcag ggtctttcct ctaccaggtg agcactcatg aacagtctga gtctgcccat 10200
gggcggacca ggaccagcac tggacgaaga caaggatccc accacgagca ggcacgagac 10260
agctccaggc actcagcgtc ccaagagggt caggacacca ttcgtggaca cccggggtca 10320
agcagaagag gaaggcaggg atcccactac gagcaatcgg tagataggtc tggacactca 10380
gggtcccatc acagccacac cacatcccag ggaaggtctg atgcctcccg tgggcagtca 10440
ggatccagaa gtgccagcag acaaactcgt aatgacgaac aatcaggaga tggctccagg 10500
cactcatggt cgcatcacca tgaagcttcc actcaggcgg acagctctag acactcacag 10560
tccggccagg gacaatcagc ggggcccagg acaagcagga accagggatc cagtgttagc 10620
caggacagtg acagtcaggg acactcagaa gactctgaga ggtggtctgg gtctgcttcc 10680
agaaaccatc gtggatctgc tcaggagcag tcaagagatg gctccagaca ccccacgtcc 10740
catcacgaag acagagccgg tcacgggcac tctgcagaga gctccagaca atcaggcact 10800
catcatgcag agaattcctc tggtggacag gctgcatcat cccatgaaca ggcaagatca 10860
agtgcaggag agagacatgg atcccaccac cagcagtcag cagacagctc cagacactca 10920
ggcattgggc acggacaagc ttcatctgca gtcagagaca gtggacaccg agggtccagt 10980
ggtagtcagg ccagtgacag tgagggacat tcagaagact cagacacaca gtcagtgtca 11040
gcccacggac aggctgggcc ccatcagcag agccaccaag agtccacacg tggccggtca 11100
gcaggaaggt ctggacgttc agggtctttc ctctaccagg tgagcactca tgaacagtct 11160
gagtctgccc atggacgggc tgggcccagt actggaggaa gacaaggatc ccgccacgag 11220
caggcacgag acagctccag gcactcagcg tcccaagagg gtcaggacac cattcgtgga 11280
cacccggggt caaggagagg aggaagacag ggatcctacc acgagcaatc ggtagatagg 11340
tctggacact cagggtccca tcacagccac accacatccc agggaaggtc tgatgcctcc 11400
catgggcagt caggatccag aagtgcaagc agagaaacac gtaatgagga acagtcagga 11460
gacggctcca ggcactcagg gtcgcgtcac catgaagctt ccactcaggc tgacagctct 11520
agacactcac agtccggcca gggtgaatca gcggggtcca ggagaagcag gcgccaggga 11580
tccagtgtta gccaggacag tgacagtgag gcatacccag aggactctga gaggcgatct 11640
gagtctgctt ccagaaacca tcatggatct tctcgggagc agtcaagaga tggctccaga 11700
caccccggat cctctcaccg cgatacagcc agtcatgtac agtcttcacc tgtacagtca 11760
gactctagta ccgctaagga acatggtcac tttagtagtc tttcacaaga ttctgcgtat 11820
cactcaggaa tacagtcacg tggcagtcct cacagttcta gttcttatca ttatcaatct 11880
gagggcactg aaaggcaaaa aggtcaatca ggtttagttt ggagacatgg cagctatggt 11940
agtgcagatt atgattatgg tgaatccggg tttagacact ctcagcacgg aagtgttagt 12000
tacaattcca atcctgttgt tttcaaggaa agatctgata tctgtaaagc aagtgcgttt 12060
ggtaaagatc atccaaggta ttatgcaacg tatattaata aggacccagg tttatgtggc 12120
cattctagtg atatatcgaa acaactggga tttagtcagt cacagagata ctattactat 12180
gagtaa 12186

<210> 37
<211> 12186
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 37
atgtctacac tgctggaaaa catcttcgcc atcatcaacc tgttcaagca gtacagcaag 60
aaggacaaga acaccgacac actgagcaag aaagagctga aagaactgct cgagaaagag 120
ttccggcaga tcctgaagaa ccccgacgat cccgatatgg tggacgtgtt catggaccac 180
ctggacatcg accacaacaa gaagatcgac ttcaccgagt ttctgctgat ggtgttcaag 240
ctggcccagg cctactacga gagcaccaga aaagagaacc tgcctatcag cggccacaag 300
cacagaaagc acagccacca cgacaagcac gaggacaaca agcaagaaga gaacaaagag 360
aatcggaagc ggcccagcag cctggaaaga cggaacaaca gaaagggcaa caagggcaga 420
agcaagagcc ctagagagac aggcggcaag agacacgaga gcagctccga gaagaaagag 480
agaaagggct acagccccac acacagagag gaagagtacg gcaagaacca ccacaacagc 540
agcaaaaaag agaagaacaa gaccgagaac acccggctgg gcgacaatag aaagagactg 600
agcgagcggc tggaagagaa agaggacaac gaggaaggcg tgtacgacta cgagaatacc 660
ggccggatga cccagaagtg gattcagtct ggccacattg ccacctacta caccatccag 720
gacgaggcct acgacaccac cgatagcctg ctggaagaaa acaagatcta cgagcggagc 780
agaagcagcg acggcaagag cagcagccaa gtgaacagaa gccggcacga gaacacaagc 840
caggtgccac tgcaagagag ccggacaaga aagcggagag gcagcagagt gtcccaggat 900
agagatagcg agggccacag cgaggatagc gagagacatt ctggcagcgc cagcagaaat 960
caccacggat ctgcctggga gcagagcaga gatggctcta gacaccctag aagccacgac 1020
gaggatagag cctctcacgg ccactctgcc gattctagca gacagtctgg caccagacac 1080
gccgagacaa gctctagagg acagacagcc agctctcacg agcaggctag atcttcccca 1140
ggcgaaagac acggctctgg acatcagcag tctgccgata gttctagaca cagcgccaca 1200
ggcagaggac aggcctcttc tgctgtgtcc gatagaggcc acagaggcag ctctggaagc 1260
caggcctctg attctgaggg ccactccgag aacagcgata cccagtctgt gtctggacac 1320
ggcaaagccg gactgagaca gcagagccac caagagagca ctagaggcag aagcggcgag 1380
agaagcggca gatctggcag ctctctgtac caggtgtcca cacacgaaca gcctgatagc 1440
gcccacggca gaactggaac atctactggt ggcagacagg gctctcacca cgaacaggcc 1500
agagattctt ccagacactc cgccagccaa gaaggccagg ataccattag aggacacccc 1560
ggatctagca gaggcggaag gcagggatct catcatgagc agtccgtgaa cagatccggc 1620
catagcggaa gccaccacag ccacacaaca tcccagggaa gatccgatgc cagccacggc 1680
caatctggaa gcagaagcgc ctccagacag accagaaatg aggaacagag cggcgacggc 1740
acaaggcaca gcggatctag acatcacgaa gccagcagcc aggccgatag cagcagacac 1800
tctcaagttg gccagggcca gtctagcggc cccagaacat ctagaaatca gggcagctcc 1860
gtgtctcagg actccgatag tcagggccat tctgaggatt ctgagcgttg gagcggcagc 1920
gcctctagaa accatcatgg ctctgcccaa gagcagtctc gcgacggaag cagacatcca 1980
cgcagccacc atgaagatag agccggccat ggacatagcg ccgacagctc tagaaagagc 2040
ggaaccagac acacccagaa ctcctctagc ggacaggccg catcttcaca tgagcaggca 2100
agaagctctg ccggcgaaag gcatggttcc agacatcagc tgcagagcgc cgactcttct 2160
agacattccg gaacaggaca tggccaggcc agcagcgctg ttagagattc tggccataga 2220
ggctcaagcg gctctcaggc caccgattcc gaaggacact ccgaagattc tgacacccag 2280
agtgtctctg gccacggaca ggcaggacat caccagcagt ctcaccaaga gtccgccaga 2340
gatagatctg gcgagagatc cagaagatcc ggcagcttcc tgtatcaagt ctctacccac 2400
aagcagagcg agtctagcca cggctggaca ggaccttcta caggcgttag acagggcagt 2460
caccatgagc aagcccggga caattctagg catagcgcct ctcaggacgg ccaggacact 2520
ataagaggcc atcctggctc tagccgcaga ggtagacagg gaagccatca cgaacagtct 2580
gtggatagaa gcggccattc cggcagccat cactctcaca caactagcca ggggagatct 2640
gacgcatcta gaggccagtc tggatctaga agcgccagcc ggaccactag gaacgaggaa 2700
cagtctagag atggcagcag gcactccggc agtagacatc atgaggcctc tagccatgcc 2760
gacatctcaa gacattctca ggccggacag ggccagagcg aaggctctag aacatctcgg 2820
agacagggat ctagcgtcag ccaggacagc gacagcgagg ggcattctga agatagcgaa 2880
cgttggagtg gctccgcctc tcggaatcat agaggaagcg cccaagaaca gagcagacac 2940
ggatcaaggc accctcgctc acaccatgag gaccgtgctg gtcatggaca ttccgctgat 3000
tcctctaggc agagcggcac acctcacgcc gaaacatcta gcggaggaca agccgctagc 3060
agccatgaac aagctagaag ctctcctggg gagagacatg gaagtagaca ccagcagagc 3120
gctgatagca gccggcattc tggaatccct agaaggcagg ctagctccgc cgtcagagat 3180
tccggacatt ggggttctag tggttcccag gctagcgact ctgaagggca cagcgaagag 3240
tccgatacac agagcgttag cggacatgga caggatggac ctcaccaaca aagccatcaa 3300
gaatctgcta gagattggag cggaggaaga tctgggagaa gcggaagctt catctaccaa 3360
gtttcaaccc acgagcaatc cgagtccgct cacggaagaa ccagaacaag caccggcaga 3420
aggcaaggtt cccatcacga gcaagccaga gactctagcc ggcactctgc ctctcaagag 3480
ggccaagata caatcagggc tcaccccggt agtagaagag gcggtcgaca ggggtcacat 3540
catgaacaaa gcgtggacag atctggacac agcggctccc accactctca taccacatct 3600
caaggccgct ccgacgcctc tcatggtcaa tctgggtcta gatctgccag caggcagacc 3660
cggaaagata agcaatctgg cgacggctcc agacatagtg gaagcaggca tcatgaagcc 3720
gccagctggg ctgatagctc taggcattct caagtgggac aagagcaaag ctccggcagc 3780
aggacaagca gacaccaggg aagctctgtg tcccaagaca gcgattccga gcggcattcc 3840
gatgactctg agagactgtc cggaagcgca tcccggaatc accatggaag cagccgggaa 3900
caaagtcgcg acggttcaag acacccaggc ttccatcaag aggatagggc tagtcacggt 3960
cacagcgctg attctagtag gcagtccgga actcaccaca ccgaatctag cagtcacggc 4020
caggctgtgt cctctcatga acaggctcgt tctagccctg gcgaacggca cggatctcga 4080
caccaacaat cagccgactc cagcagacat agcggcattg gacacagaca ggcatcctct 4140
gccgttagag acagcggaca tagagggtcc tctggctccc aagtgacaaa ctcagagggg 4200
cactcagagg attccgacac acagtcagtg tctgcccatg gccaagctgg accacaccag 4260
caatcccaca aagaaagtgc caggggacag agcggagagt ccagcggcag gtctagaagt 4320
ttcctttacc aagtgtccag tcatgagcaa tctgagagca cccacggcca gacagcccct 4380
tctaccggcg gcagacaagg gtctagacac gaacaagccc ggaactcctc aaggcattct 4440
gctagccagg acggacaaga cacaatccgg ggacatcctg gtagttcacg cggaggcagg 4500
caggggtcct accatgaaca atcagtggat cggagcggac acagtggcta ccatcatagc 4560
catacaaccc ctcagggacg ctctgatgct tctcatgggc agtcaggccc aagaagtgct 4620
tcccggcaga ctcggaatga agaacaaagc ggagatggct cccggcacag tggatcacgc 4680
catcatgaac catctaccag agccggcagc tccaggcata gccaagttgg acaaggcgag 4740
agcgccggct ccaaaaccag tcgtagacaa ggctccagcg tttcccagga tcgggacagt 4800
gaaggccact ctgaggactc cgagagaaga agcgagtccg cctcaagaaa tcattacggc 4860
agcgctagag agcagtcccg gcacggttct aggaacccca gaagtcacca agaggacaga 4920
gccagtcatg gccacagtgc tgaaagttct cgccagtccg gcactaggca tgccgaaacc 4980
agtagtggtg gacaggctgc aagtagtcaa gaacaggcaa gatcaagccc aggcgagcgc 5040
catggttcta ggcaccaaca gtctgctgac agcagcacag atagcggaac aggcagacgg 5100
caggatagct ctgttgtcgg cgatagcggc aataggggca gtagtggatc tcaggcttct 5160
gacagcgaag gccatagcga agaaagcgac actcagagcg tgtccgcaca cggtcaagca 5220
ggccctcatc aacaatcaca ccaagaatcc acacggggac agtccgggga acgtagcgga 5280
cgttctggga gttttctcta tcaagtgtca acgcatgaac agtccgagag tgcccatgga 5340
agaaccggac ctagtactgg tggaaggcag aggtccagac atgaacaggc cagggacagc 5400
agcagacatt cagcctctca agaaggacag gacacgattc gcggccatcc gggaagtagt 5460
cgaggtggac gccaaggctc tcactatgag cagagcgttg acagctccgg gcactctggt 5520
tctcaccatt ctcacactac aagccaagaa agatccgacg tgtccagggg ccaaagtggc 5580
agtagatctg tgtcaaggca gacgagaaac gagaagcagt caggcgacgg atctcggcac 5640
tcaggttcaa ggcaccatga agctagcagc agagccgatt cctccaggca ctcacaagtc 5700
ggacagggac aaagcagcgg ccctaggact tccagaaacc agggatcatc cgttagccaa 5760
gacagtgact cccaggggca tagtgaagat tccgaacgtt ggagcggatc tgcctccaga 5820
aatcacctgg gaagcgcttg ggagcaatca agagatggtt ctcggcatcc cggctctcat 5880
cacgaggaca gagcaggaca tggacactcc gcagatagct ccagacagag cggcactaga 5940
cataccgaga gcagttcaag aggccaggcc gcaagttcac acgaacaggc taggtcctct 6000
gcaggcgaga gacatggcag ccaccatcaa ctgcagtccg ctgactcatc ccgccactct 6060
ggaattggac atggtcaagc ctccagcgca gtccgcgatt ctgggcacag aggatattct 6120
ggctcacaag cctccgactc agagggacat agcgaggact ctgatacaca gtctgtcagc 6180
gcccagggaa aagctgggcc acatcaacag agtcacaaag agtctgctcg cgggcagtct 6240
ggcgaaagta gcggaagaag tgggagcttt ctgtaccaag tttctacaca tgagcagagt 6300
gaaagcacac acggacagtc agctcctagc actggcggtc gtcaaggctc ccattatgat 6360
caggcccagg actcttctcg gcacagcgct tcacaagagg ggcaagacac tattagggga 6420
caccctggac catccagagg tggccggcaa ggatcacatc aagagcaatc agtggacaga 6480
agcgggcact caggcagtca ccacagccat acgacaagcc aaggcagatc tgatgcctcc 6540
agagggcaga gcggctctag aagtgccagc agaaagacct acgacaaaga acagtccggc 6600
gacggtagta gacattcagg ctcacaccac cacgaagcct ctagctgggc cgacagtagt 6660
aggcactctc ttgtcggcca aggacagtcc tccggaccaa gaacctctag accaagaggg 6720
tcaagtgtct cccaagactc tgactccgaa gggcattccg aggacagcga aagaagatct 6780
ggctctgcca gtaggaacca ccacggaagt gcacaagaac aatcccgaga tgggagcaga 6840
caccctcgga gtcatcacga agatcgcgcc ggacacggac attctgccga atcatccagg 6900
caaagtggaa cccaccacgc tgagaatagt tctggcggcc aggcagcaag tagccatgag 6960
caagcaagat ccagtgctgg cgagcgtcac gggtcccatc atcagcaaag tgcagacagc 7020
agtcgtcaca gcggaatcgg acacgggcaa gcaagttcag cagttagaga ctccggccac 7080
cgaggtagta gtggtagcca agctagcgat agtgaaggcc attcagaaga ttcagatacc 7140
caaagcgtca gtgctcatgg acaggccggt ccacatcagc aatctcatca agagagtacc 7200
cggggcagat cagctgggag atccggtcgc tctggatcat tcttgtacca agtctccacg 7260
cacgagcagt cagaaagcgc tcatggcagg acaggcactt caaccggtgg acggcagggc 7320
tcccatcaca aacaagcacg cgatagtagc aggcacagca cgagccaaga gggacaagat 7380
accatccacg gacaccctgg aagctctagc ggaggcagac agggtagcca ttatgagcag 7440
ctggtggatc gctctggtca ctcagggtca caccatagcc acactacttc tcaggggaga 7500
agcgacgctt cccacgggca ttctgggagt agatccgcaa gccgccagac aagaaatgat 7560
gagcaaagtg gcgacggaag tcgccattct ggctcaagac atcacgaggc tagctctagg 7620
gccgatagct ctggacatag tcaagtcggc caggggcaat ccgagggacc tagaacaagc 7680
agaaattggg gcagcagctt cagccaagac tcagattctc agggtcacag cgaggactcc 7740
gaacgttgga gcggcagtgc cagcagaaat catcatggaa gcgcccaaga gcagctgaga 7800
gatggcagta gacaccccag atcacaccaa gaggatcgcg caggacatgg gcacagtgcc 7860
gattcctcta gacagtccgg gactagacac acacagacat cttcaggcgg ccaagccgca 7920
tcaagtcatg agcaagctag gtctagcgca ggcgagaggc acggttctca tcatcaacag 7980
agcgccgatt caagccggca cagcggtata ggccatggac aggcttctag cgcagtcaga 8040
gatagcggcc acaggggcta ttccggatca caggcaagcg acaatgaggg tcatagcgaa 8100
gatagtgata cccagtccgt ttctgctcac ggacaggctg gaagccacca acagtcccat 8160
caagaaagcg ccagaggaag atcaggcgaa acctctggcc acagcggttc attcctctat 8220
caagtttcca ctcacgaaca aagcgaaagc agccacggat ggactggccc atccacaaga 8280
ggcagacaag gcagcaggca tgagcaggct caggattcaa gcagacacag cgcatcccag 8340
gatggacagg ataccatacg gggccatcca ggctcaagta gaggcggccg tcagggatat 8400
caccacgagc acagtgttga ttcttccggg catagtggct cacatcactc ccatacaact 8460
tcccaaggcc gaagcgacgc cagtagagga caaagtggtt caagatccgc ctccaggacc 8520
acacgcaacg aggaacaatc aggcgacggg tctagacact ccggctctag acaccacgaa 8580
gcttctaccc acgccgacat cagtagacat agtcaggccg tgcagggaca gtctgaaggc 8640
agtagaagat cacgcaggca aggctcctca gttagtcaag attcagacag cgagggacac 8700
agtgaagatt ctgagcgttg gagtggctca gccagccgca atcatcacgg ctccgctcaa 8760
gaacaacttc gagatggtag tcggcacccg agaagtcatc aagaagatag agctggacac 8820
ggccactccg ctgacagtag tagacagtct ggaacacggc acacccagac aagtagtggc 8880
ggacaagcag catcatccca cgagcaagct agaagttcag ccggcgagcg gcatggatca 8940
caccaccagc aatctgctga ctcctcaaga cacagtggaa ttggtcacgg ccaagccagt 9000
agtgccgtcc gagatagtgg acatagggga tacagcggta gccaggcatc cgataacgag 9060
ggacactcag aagatagcga cacccaaagc gtttcagccc atggccaggc aggatctcac 9120
caacagagtc accaagaaag cgctcggggc agatctgggg agacatctgg ccattccgga 9180
tcatttctct accaagtgtc tacccacgaa cagtctgaaa gctctcacgg ctggaccggg 9240
ccaagcacaa gaggacgtca aggatcaaga cacgagcagg cccaggatag ctcaagacat 9300
agcgccagcc agtatggcca ggacacaatt cgagggcacc ctggttcctc aagaggcgga 9360
cgacaaggct accaccacga acactctgtc gattccagcg gccactccgg atctcatcac 9420
agccacacca ccagtcaggg gcgatctgat gctagtagag gccaatcagg ctcccgcagc 9480
gcttccagaa ccaccagaaa cgaagaacaa tctggggata gctcacggca cagcgtgtca 9540
agacaccatg aggccagcac acacgccgac atttccagac atagccaggc agttcagggg 9600
caaagcgaag gttccagaag gtctagacga caggggagtt cagttagcca ggattccgat 9660
tcagagggcc attccgagga ctccgaacgt tggagcggaa gcgcctctcg caatcatagg 9720
ggctctgtgc aagaacagtc aaggcatggc tctcggcacc cacgatctca ccatgaggat 9780
agagcaggac acggtcattc agccgacaga agcagacaaa gcggaaccag gcatgccgag 9840
acatcatccg gtggacaggc cgcttcaagc catgaacagg cacgatcttc acctggcgag 9900
cgacatggta gcagacatca acagtccgca gacagctctc gccacagtgg tatccctagg 9960
ggccaagcct cttcagccgt tcgtgacagt aggcattggg gctcatcagg ctctcaagca 10020
agtgatagcg aggggcactc cgaagaatcc gatactcaat ctgttagcgg ccacggccag 10080
gccggtcctc accaacaatc ccaccaagag agcgctcgag atagatccgg cggcagaagt 10140
ggacgatctg gttcatttct gtatcaagtc tcaacacacg aacaatcaga atctgcccac 10200
ggccgcacca gaacctcaac tggtcgtcgg caaggcagcc atcatgaaca ggcaagagat 10260
agctcccgcc acagcgctag ccaagaaggc caagacacta tcagagggca ccccggaagt 10320
tccagaagag gaaggcaagg cagtcactac gagcagagtg tggatagatc agggcattca 10380
gggtcccatc actcccacac cacctcacaa ggccgcagtg atgcatctag gggacaatct 10440
ggcagtcgga gtgcatctag acaaacccgg aacgacgagc agagcggaga tggaagcaga 10500
cactcttgga gccaccatca cgaggcctcc acacaggctg actcttcacg ccattctcag 10560
tctggtcaag gccaaagcgc tggccccagg accagtagaa atcaaggttc tagtgtcagt 10620
caggactcag acagccaagg ccactccgag gatagtgaac gttggagcgg ttccgcaagc 10680
agaaatcaca gaggctccgc acaagagcag tccagagatg gctccaggca tcctacctca 10740
caccacgagg atagagctgg tcacgggcat agcgccgaaa gttccagaca atctggaact 10800
catcacgccg agaattccag cggaggccag gctgcatctt cccacgaaca agcaagatca 10860
tccgctggcg agaggcatgg aagtcatcac cagcaatcag cagatagcag tcgccactca 10920
ggcatcggtc acggacaagc ttcatctgcc gtcagagact caggccacag gggatctagc 10980
ggttctcagg caagcgatag cgaaggacat tctgaggact cagacacaca gagcgtttcc 11040
gctcatgggc aagctggtcc ccatcaacag tcacatcaag agtctaccag aggccgcagc 11100
gccggaagaa gtggtagatc tggaagcttt ctttatcaag tgtctactca cgagcaatcc 11160
gaaagtgccc atggcagagc aggaccatca acaggtggtc gccaggggtc tagacatgag 11220
caggctagag actcctctag gcactctgct tcccaagaag gccaggacac aatccgtgga 11280
cacccaggct ctcgaagagg tggtagacaa ggatcttacc acgagcagtc cgtcgataga 11340
tcaggccaca gtggcagtca tcattcccat accaccagcc agggacgtag cgacgctagt 11400
cacggacaaa gtggcagcag aagcgctagc agagagactc gcaacgaaga acagtctggc 11460
gacggctcaa ggcactctgg atcaaggcat cacgaagcct ctactcaggc cgatagctcc 11520
cgacattctc agagcggtca aggcgaatcc gctggatcac gacgatctag acggcaaggg 11580
tccagtgtgt cacaggattc agactctgag gcttaccctg aggacagtga acgcagatcc 11640
gagagcgcaa gtcggaacca ccatggctcc agccgcgagc aaagtcgaga tggatctcgt 11700
cacccaggca gctcccacag agatacagct agccatgtgc agtctagccc cgtgcagagc 11760
gactcttcca cagccaaaga gcacggacac ttctccagtc tgagtcagga ttctgcctac 11820
cacagcggca tccagagtag aggatctccc cacagcagct cctcttatca ctaccagtcc 11880
gagggcactg agcggcagaa aggacaatcc ggacttgtgt ggcggcacgg ctcttatggc 11940
agcgctgact acgattacgg cgagtctggc tttaggcaca gccagcatgg cagcgtgtcc 12000
tacaacagca accccgtggt gtttaaagag cgcagcgata tctgcaaggc ctccgccttt 12060
ggaaaggatc accctcggta ctacgccacc tacatcaaca aggaccctgg actgtgtggc 12120
cactcctccg atatcagcaa gcagctggga ttttcccaga gccagcggta ctactactac 12180
gaatga 12186

<210> 38
<211> 7176
<212> DNA
<213> Homo sapiens
<400> 38
atgaccgacc tcttgagaag tgttgtcacc gtaattgatg ttttctacaa atacaccaag 60
caagatgggg agtgtggcac actgagcaag ggtgaactaa aggaacttct ggagaaagag 120
cttcatccag ttctgaagaa cccagatgat ccagacacag tggatgtcat catgcatatg 180
ctggatcgag atcatgacag aagattggac tttactgagt ttcttttgat gatattcaag 240
ctgactatgg cctgcaacaa ggtcctcagc aaagaatact gcaaagcttc agggtcaaag 300
aagcataggc gtggtcaccg acaccaagaa gaagaaagtg aaacagaaga ggatgaagag 360
gatacaccag gacataaatc aggttacaga cattcaagtt ggagtgaggg agaggagcat 420
ggatatagtt ctgggcactc aaggggaact gtgaaatgta gacatgggtc caactccagg 480
aggctaggaa gacaaggtaa tttatccagc tctgggaacc aagagggatc tcagaaaaga 540
taccacaggt ccagctgtgg tcattcatgg agtggtggca aagacagaca tggttccagc 600
tctgtagaac tgagagaaag aataaacaag tcacacatta gcccttctag ggaatctggg 660
gaggagtatg aatctggatc tggatcaaac agttgggaaa ggaaaggtca tggtggtctg 720
tcatgtggat tggagactag tgggcatgaa tcaaactcta ctcagtcaag aattagagaa 780
caaaagcttg ggtctagctg ttcaggttca ggagacagtg ggaggcgaag tcatgcatgt 840
ggttatagca attcaagtgg gtgtggaagg ccacaaaatg cttcaagttc ttgtcagtca 900
catagatttg gagggcaagg aaatcaattt agctatattc agtcaggctg tcagtcagga 960
attaagggag gacaaggcca tggctgtgtc tcaggaggtc agccctctgg atgtggtcaa 1020
cctgagtcta acccctgtag tcagtcctat agtcagagag gatatggagc tagagaaaat 1080
ggtcaaccac agaactgtgg aggacaatgg agaacaggct caagtcagtc ctcttgctgt 1140
ggacaatatg ggtctggagg tagccagtct tgtagtaatg gtcaacatga atatggttcc 1200
tgtggccgct tttcaaactc ttctagttca aatgaatttt ccaaatgtga tcaatatggg 1260
tctggttcaa gtcagtctac tagctttgaa caacatggaa caggcttgag tcagtcctct 1320
gggttcgaac aacatgtatg tggctcaggt caaacttgtg gccagcatga gtctacatca 1380
agtcaatcct tgggctatga ccagcatggg tctagctcag gtaagacatc tggctttgga 1440
caacatgggt ctggctcagg tcagtcctct ggctttggac aatgtgggtc aggctcaggt 1500
cagtcctctg gctttggaca gcatgggtct gtctcaggac aatcctctgg ttttggacag 1560
catgggtctg tctcaggaca atcctctggt tttggacaac atgagtctag atcacgtcag 1620
tctagctatg gccaacatgg ttctggctca agtcaatcat ctggctatgg ccaatatggg 1680
tctagagaga catctggctt tggacaacat gggttgggct caggtcaatc cactggcttt 1740
ggccaatatg gatcgggctc aggtcagtcc tctggctttg gacaacatgg gtctggctca 1800
ggacaatcct ctggctttgg acaacatgag tctagatcag gtcagtctag ttatggccaa 1860
cacagttctg gctcaagtca gtcatctggc tatggccaac atgggtctag acagacatct 1920
ggctttggac aacatgggtc aggctcaagt caatccactg gctttggcca atatggatca 1980
ggctcaggtc agtcctctgg ctttggacaa catgtttctg gctcaggaca atcctctggt 2040
tttggacaac atgagtctag atcaggtcat tctagctatg gccaacatgg ttttggctca 2100
agtcaatcat ctggctatgg tcaacatggg tcaagttcag gacagacatc tggatttgga 2160
caacacgagt taagctcagg tcagtcttcc agctttggcc aacatggatc aggctcaggt 2220
cagtcctctg gctttggaca acatgggtct ggctcaggac aatcctctgg ctttggacaa 2280
catgagtcta gatcaggtca gtctagctat ggccaacaca gttctggctc aagtcagtca 2340
tctggctatg gccaacatgg gtctagacag acatctggct ttggacaaca tgggtcaggc 2400
tcaagtcaat ccactggctt tggccaatat ggatcaggct caggtcagtc cgctggcttt 2460
ggacaacatg ggtctggctc aggacaatcc tctggctttg gacagcatga gtctagatca 2520
catcagtcca gctatggcca acatggttct ggctcaagtc aatcatctgg ctatggtcaa 2580
catgggtcaa gttcgggaca gacatctggc tttggacaac acaggtcaag ctcaggtcaa 2640
tactctggct ttggacaaca tggatcaggc tcaggtcagt ccagtggctt tggacaacat 2700
gggactggct caggacaata ctctggtttt ggacaacatg agtctagatc acatcagtct 2760
agctatggcc aacatggttc tggctcaagt cagtcatctg gctatggtca acatgggtca 2820
agttcaggac agacttttgg atttggacaa cacaggtcag gctcaggtca atcctctggc 2880
tttggccaac atggatcagg ctcaggtcag tcctctggct ttggacaaca tgagtcaggc 2940
tcaggaaaat cctctggctt tggacagcat gagtctagat caagtcagtc taattatggc 3000
caacatggtt ctggctcaag tcagtcatct ggctatggtc aacatgggtc tagttcagga 3060
cagacaactg gctttggaca acacaggtca agctcaggcc aatactcagg ctttggacaa 3120
catggatcag gctcagatca gtcctctggc tttggacaac atgggactgg ttcaggacaa 3180
tcctctggtt ttggacaata tgagtctaga tcacgtcagt ctagctatgg ccaacatggt 3240
tctggctcaa gtcaatcatc tggctatggt caacatgggt caaattcagg acagacatct 3300
ggatttggac aacacaggcc aggctcaggt cagtcctctg gctttggcca atatggatcg 3360
ggctcaggtc agtcttctgg ctttggacaa catgggtcag gcacaggtaa atcctctggc 3420
tttgcacagc atgagtacag atcaggtcag tctagctatg gccaacatgg tactggctcc 3480
agtcaatcat ctggctgtgg ccaacatgag tctggctcag gtccaaccac aagttttgga 3540
cagcatgtgt ctggctcaga caatttctct agttctggac aacatatatc tgactcaggt 3600
cagtccactg gatttggcca atatggttca ggctcaggtc aatcaactgg cttgggccag 3660
ggtgaatctc aacaagtaga gtcaggatcc acagttcatg ggagacagga aactactcat 3720
ggtcagacaa taaataccac tagacatagc cagtctggtc aaggacaatc cacacagaca 3780
gggtccaggg taactagaag acgaagatct agccaaagtg agaacagtga cagtgaagtg 3840
cactcaaagg tctcacacag acattcagaa cacattcaca cacaagctgg atctcactac 3900
ccaaagtcag gatccacagt tcgcagaaga caaggaacta ctcatggaca gagaggagat 3960
accactagac atggccattc tggtcatgga cagtctacac agacaggttc cagaacatct 4020
ggaagacaga gatttagcca cagtgatgcc actgacagtg aagtgcactc aggggtctca 4080
catagaccac actcacaaga acaaactcac agccaagctg gatctcaaca tggagagtca 4140
gaatccacag ttcatgagag acatgaaact acttatggac agacaggaga ggccactgga 4200
catggccact ctggtcatgg acagtccaca cagagagggt ccaggacaac tggaagaagg 4260
ggatctggcc atagtgagtc cagtgacagt gaagtgcact cagggggctc acacagacca 4320
caatcacaag aacaaactca tggccaagcc ggatctcaac atggagagtc aggatccaca 4380
gttcatggga gacacggaac tactcatgga cagacaggag ataccactag acatgcccac 4440
tatcatcatg gaaaatccac acagagaggg tccagtacaa ctggaagaag gggatctggc 4500
cacagtgagt ccagtgacag tgaagtgcac tcagggggct cgcacacaca ttcaggacac 4560
actcacggcc aaagtggatc tcaacatgga gagtcagaat ccataattca tgacagacac 4620
agaattactc atggacagac aggagatacc actagacatt cctactctgg tcatgaacaa 4680
accacacaga cagggtccag gacaactgga agacagagaa ctagccacag tgagtccact 4740
gacagtgaag tgcactcagg gggctcacac agaccacact cacgagaaca cacttacggc 4800
caagccggat ctcaacatga agagccagaa ttcacagttc atgagagaca cggaactact 4860
catggacaga taggagatac cactggacat tcccactctg gtcatggaca gtccacacag 4920
agagggtcca ggacaactgg aagacagaga tctagccaca gtgagtccag tgacagtgaa 4980
gtgcactcag gggtctcaca cacacataca ggacacactc atggtcaagc tggatctcaa 5040
catggacagt cagaatccat agttcctgag agacatggaa ctactcatgg acagacagga 5100
gataccacta gacatgccca ctatcatcat ggattaacca cacagacagg gtccaggact 5160
actggaagaa ggggatctgg ccacagtgag tacagtgaca gtgaagggta ctcaggagtc 5220
tcacatacac attcaggaca cactcatggc caagccagat ctcaacatgg agagtcagaa 5280
tccatagttc atgagagaca tggaactata catggacaga caggcgatac caccagacat 5340
gcccactctg gtcatggaca gtccacacag acagggtcca ggaccactgg aagaaggtca 5400
tctggccaca gtgagtacag tgacagtgaa gggcactcag ggttctcaca aagaccacac 5460
tcacgaggac acactcacgg ccaggctgga tctcaacatg gagagtcaga atccatagtt 5520
gacgagagac atggaactac tcatggacag acaggagata ccagtggaca ttctcaatct 5580
ggtcatggac agtccacaca gtcaggatcc agtacaactg gaagaaggag atctggccac 5640
agtgagtcca gtgacagtga agtgcactca gggggctcac atacacattc aggacacaca 5700
cacagccaag ccaggtctca acatggagag tcagaatcca cagttcacaa gagacaccaa 5760
actactcatg gacagacagg agataccact gaacatggcc accctagtca tggacaaacc 5820
atacagacag ggtccaggac aactggaaga aggggatctg gccacagtga gtacagtgac 5880
agtgaagggc cctcaggggt ctcacacaca cattcaggac acactcacgg tcaagctgga 5940
tctcactatc cagagtcagg atcctcagtt catgagagac acggaactac tcatggacaa 6000
acagcagata ccactagaca tggccactct ggtcatggac agtccacaca gagagggtcc 6060
aggacaactg gaagaagggc atctggccac agtgagtaca gtgacagtga agggcactca 6120
ggggtctcac acacacattc aggacacgct catggccaag ccggatctca acatggagag 6180
tcaggatcct cagttcatga gagacacgga actactcatg gacagacagg agataccact 6240
agacatgctc actctggtca tggacagtcc acacagagag ggtcaaggac agctggaaga 6300
aggggatctg gccacagtga gtccagtgac agtgaagtgc actcaggggt ctcacacaca 6360
cattcaggac acacttatgg ccaagccaga tctcaacatg gagagtcagg atctgccatt 6420
cacgggagac agggaactat acatggacag acaggagata ccactagaca tggccagtct 6480
ggtcatggac agtccacaca gacaggttcc aggacaactg gaagacaaag atctagtcac 6540
agtgagtcca gtgatagtga agtgcactca gaggcctcac ccacacattc aggacacact 6600
cacagccaag ccggatctcg acatggacag tcaggatcct caggtcatgg gagacaggga 6660
actactcatg gacagacagg agataccact agacatgccc actatggtta tggacaatcc 6720
acacagagag ggtccaggac aactggaaga aggggatctg gccacagtga gtccagtgac 6780
agtgaagtgc actcatgggg ctcacacaca cattcaggac acattcaggg ccaagctgga 6840
tctcaacaaa gacagccagg atccacagtt catgggagac tggaaactac tcatggacag 6900
acaggagata ccactagaca tggccattct ggttatggac aatccacaca gacaggttcc 6960
agatctagta gagcaagtca ttttcagtca catagtagtg aaaggcaaag gcatggatca 7020
agtcaggttt ggaaacatgg cagctatgga cctgcagaat atgactatgg gcacactggg 7080
tatgggcctt ctggtggcag cagaaaaagc atcagtaatt ctcacctttc atggtcaaca 7140
gacagcactg caaacaagca actgtctaga cattga 7176

<210> 39
<211> 4061
<212> PRT
<213> Homo sapiens
<400> 39
Met Ser Thr Leu Leu Glu Asn Ile Phe Ala Ile Ile Asn Leu Phe Lys
1 5 10 15
Gln Tyr Ser Lys Lys Asp Lys Asn Thr Asp Thr Leu Ser Lys Lys Glu
20 25 30
Leu Lys Glu Leu Leu Glu Lys Glu Phe Arg Gln Ile Leu Lys Asn Pro
35 40 45
Asp Asp Pro Asp Met Val Asp Val Phe Met Asp His Leu Asp Ile Asp
50 55 60
His Asn Lys Lys Ile Asp Phe Thr Glu Phe Leu Leu Met Val Phe Lys
65 70 75 80
Leu Ala Gln Ala Tyr Tyr Glu Ser Thr Arg Lys Glu Asn Leu Pro Ile
85 90 95
Ser Gly His Lys His Arg Lys His Ser His His Asp Lys His Glu Asp
100 105 110
Asn Lys Gln Glu Glu Asn Lys Glu Asn Arg Lys Arg Pro Ser Ser Leu
115 120 125
Glu Arg Arg Asn Asn Arg Lys Gly Asn Lys Gly Arg Ser Lys Ser Pro
130 135 140
Arg Glu Thr Gly Gly Lys Arg His Glu Ser Ser Ser Glu Lys Lys Glu
145 150 155 160
Arg Lys Gly Tyr Ser Pro Thr His Arg Glu Glu Glu Tyr Gly Lys Asn
165 170 175
His His Asn Ser Ser Lys Lys Glu Lys Asn Lys Thr Glu Asn Thr Arg
180 185 190
Leu Gly Asp Asn Arg Lys Arg Leu Ser Glu Arg Leu Glu Glu Lys Glu
195 200 205
Asp Asn Glu Glu Gly Val Tyr Asp Tyr Glu Asn Thr Gly Arg Met Thr
210 215 220
Gln Lys Trp Ile Gln Ser Gly His Ile Ala Thr Tyr Tyr Thr Ile Gln
225 230 235 240
Asp Glu Ala Tyr Asp Thr Thr Asp Ser Leu Leu Glu Glu Asn Lys Ile
245 250 255
Tyr Glu Arg Ser Arg Ser Ser Asp Gly Lys Ser Ser Ser Gln Val Asn
260 265 270
Arg Ser Arg His Glu Asn Thr Ser Gln Val Pro Leu Gln Glu Ser Arg
275 280 285
Thr Arg Lys Arg Arg Gly Ser Arg Val Ser Gln Asp Arg Asp Ser Glu
290 295 300
Gly His Ser Glu Asp Ser Glu Arg His Ser Gly Ser Ala Ser Arg Asn
305 310 315 320
His His Gly Ser Ala Trp Glu Gln Ser Arg Asp Gly Ser Arg His Pro
325 330 335
Arg Ser His Asp Glu Asp Arg Ala Ser His Gly His Ser Ala Asp Ser
340 345 350
Ser Arg Gln Ser Gly Thr Arg His Ala Glu Thr Ser Ser Arg Gly Gln
355 360 365
Thr Ala Ser Ser His Glu Gln Ala Arg Ser Ser Pro Gly Glu Arg His
370 375 380
Gly Ser Gly His Gln Gln Ser Ala Asp Ser Ser Arg His Ser Ala Thr
385 390 395 400
Gly Arg Gly Gln Ala Ser Ser Ala Val Ser Asp Arg Gly His Arg Gly
405 410 415
Ser Ser Gly Ser Gln Ala Ser Asp Ser Glu Gly His Ser Glu Asn Ser
420 425 430
Asp Thr Gln Ser Val Ser Gly His Gly Lys Ala Gly Leu Arg Gln Gln
435 440 445
Ser His Gln Glu Ser Thr Arg Gly Arg Ser Gly Glu Arg Ser Gly Arg
450 455 460
Ser Gly Ser Ser Leu Tyr Gln Val Ser Thr His Glu Gln Pro Asp Ser
465 470 475 480
Ala His Gly Arg Thr Gly Thr Ser Thr Gly Gly Arg Gln Gly Ser His
485 490 495
His Glu Gln Ala Arg Asp Ser Ser Arg His Ser Ala Ser Gln Glu Gly
500 505 510
Gln Asp Thr Ile Arg Gly His Pro Gly Ser Ser Arg Gly Gly Arg Gln
515 520 525
Gly Ser His His Glu Gln Ser Val Asn Arg Ser Gly His Ser Gly Ser
530 535 540
His His Ser His Thr Thr Ser Gln Gly Arg Ser Asp Ala Ser His Gly
545 550 555 560
Gln Ser Gly Ser Arg Ser Ala Ser Arg Gln Thr Arg Asn Glu Glu Gln
565 570 575
Ser Gly Asp Gly Thr Arg His Ser Gly Ser Arg His His Glu Ala Ser
580 585 590
Ser Gln Ala Asp Ser Ser Arg His Ser Gln Val Gly Gln Gly Gln Ser
595 600 605
Ser Gly Pro Arg Thr Ser Arg Asn Gln Gly Ser Ser Val Ser Gln Asp
610 615 620
Ser Asp Ser Gln Gly His Ser Glu Asp Ser Glu Arg Trp Ser Gly Ser
625 630 635 640
Ala Ser Arg Asn His His Gly Ser Ala Gln Glu Gln Ser Arg Asp Gly
645 650 655
Ser Arg His Pro Arg Ser His His Glu Asp Arg Ala Gly His Gly His
660 665 670
Ser Ala Asp Ser Ser Arg Lys Ser Gly Thr Arg His Thr Gln Asn Ser
675 680 685
Ser Ser Gly Gln Ala Ala Ser Ser His Glu Gln Ala Arg Ser Ser Ala
690 695 700
Gly Glu Arg His Gly Ser Arg His Gln Leu Gln Ser Ala Asp Ser Ser
705 710 715 720
Arg His Ser Gly Thr Gly His Gly Gln Ala Ser Ser Ala Val Arg Asp
725 730 735
Ser Gly His Arg Gly Ser Ser Gly Ser Gln Ala Thr Asp Ser Glu Gly
740 745 750
His Ser Glu Asp Ser Asp Thr Gln Ser Val Ser Gly His Gly Gln Ala
755 760 765
Gly His His Gln Gln Ser His Gln Glu Ser Ala Arg Asp Arg Ser Gly
770 775 780
Glu Arg Ser Arg Arg Ser Gly Ser Phe Leu Tyr Gln Val Ser Thr His
785 790 795 800
Lys Gln Ser Glu Ser Ser His Gly Trp Thr Gly Pro Ser Thr Gly Val
805 810 815
Arg Gln Gly Ser His His Glu Gln Ala Arg Asp Asn Ser Arg His Ser
820 825 830
Ala Ser Gln Asp Gly Gln Asp Thr Ile Arg Gly His Pro Gly Ser Ser
835 840 845
Arg Arg Gly Arg Gln Gly Ser His His Glu Gln Ser Val Asp Arg Ser
850 855 860
Gly His Ser Gly Ser His His Ser His Thr Thr Ser Gln Gly Arg Ser
865 870 875 880
Asp Ala Ser Arg Gly Gln Ser Gly Ser Arg Ser Ala Ser Arg Thr Thr
885 890 895
Arg Asn Glu Glu Gln Ser Arg Asp Gly Ser Arg His Ser Gly Ser Arg
900 905 910
His His Glu Ala Ser Ser His Ala Asp Ile Ser Arg His Ser Gln Ala
915 920 925
Gly Gln Gly Gln Ser Glu Gly Ser Arg Thr Ser Arg Arg Gln Gly Ser
930 935 940
Ser Val Ser Gln Asp Ser Asp Ser Glu Gly His Ser Glu Asp Ser Glu
945 950 955 960
Arg Trp Ser Gly Ser Ala Ser Arg Asn His Arg Gly Ser Ala Gln Glu
965 970 975
Gln Ser Arg His Gly Ser Arg His Pro Arg Ser His His Glu Asp Arg
980 985 990
Ala Gly His Gly His Ser Ala Asp Ser Ser Arg Gln Ser Gly Thr Pro
995 1000 1005
His Ala Glu Thr Ser Ser Gly Gly Gln Ala Ala Ser Ser His Glu Gln
1010 1015 1020
Ala Arg Ser Ser Pro Gly Glu Arg His Gly Ser Arg His Gln Gln Ser
1025 1030 1035 1040
Ala Asp Ser Ser Arg His Ser Gly Ile Pro Arg Arg Gln Ala Ser Ser
1045 1050 1055
Ala Val Arg Asp Ser Gly His Trp Gly Ser Ser Gly Ser Gln Ala Ser
1060 1065 1070
Asp Ser Glu Gly His Ser Glu Glu Ser Asp Thr Gln Ser Val Ser Gly
1075 1080 1085
His Gly Gln Asp Gly Pro His Gln Gln Ser His Gln Glu Ser Ala Arg
1090 1095 1100
Asp Trp Ser Gly Gly Arg Ser Gly Arg Ser Gly Ser Phe Ile Tyr Gln
1105 1110 1115 1120
Val Ser Thr His Glu Gln Ser Glu Ser Ala His Gly Arg Thr Arg Thr
1125 1130 1135
Ser Thr Gly Arg Arg Gln Gly Ser His His Glu Gln Ala Arg Asp Ser
1140 1145 1150
Ser Arg His Ser Ala Ser Gln Glu Gly Gln Asp Thr Ile Arg Ala His
1155 1160 1165
Pro Gly Ser Arg Arg Gly Gly Arg Gln Gly Ser His His Glu Gln Ser
1170 1175 1180
Val Asp Arg Ser Gly His Ser Gly Ser His His Ser His Thr Thr Ser
1185 1190 1195 1200
Gln Gly Arg Ser Asp Ala Ser His Gly Gln Ser Gly Ser Arg Ser Ala
1205 1210 1215
Ser Arg Gln Thr Arg Lys Asp Lys Gln Ser Gly Asp Gly Ser Arg His
1220 1225 1230
Ser Gly Ser Arg His His Glu Ala Ala Ser Trp Ala Asp Ser Ser Arg
1235 1240 1245
His Ser Gln Val Gly Gln Glu Gln Ser Ser Gly Ser Arg Thr Ser Arg
1250 1255 1260
His Gln Gly Ser Ser Val Ser Gln Asp Ser Asp Ser Glu Arg His Ser
1265 1270 1275 1280
Asp Asp Ser Glu Arg Leu Ser Gly Ser Ala Ser Arg Asn His His Gly
1285 1290 1295
Ser Ser Arg Glu Gln Ser Arg Asp Gly Ser Arg His Pro Gly Phe His
1300 1305 1310
Gln Glu Asp Arg Ala Ser His Gly His Ser Ala Asp Ser Ser Arg Gln
1315 1320 1325
Ser Gly Thr His His Thr Glu Ser Ser Ser His Gly Gln Ala Val Ser
1330 1335 1340
Ser His Glu Gln Ala Arg Ser Ser Pro Gly Glu Arg His Gly Ser Arg
1345 1350 1355 1360
His Gln Gln Ser Ala Asp Ser Ser Arg His Ser Gly Ile Gly His Arg
1365 1370 1375
Gln Ala Ser Ser Ala Val Arg Asp Ser Gly His Arg Gly Ser Ser Gly
1380 1385 1390
Ser Gln Val Thr Asn Ser Glu Gly His Ser Glu Asp Ser Asp Thr Gln
1395 1400 1405
Ser Val Ser Ala His Gly Gln Ala Gly Pro His Gln Gln Ser His Lys
1410 1415 1420
Glu Ser Ala Arg Gly Gln Ser Gly Glu Ser Ser Gly Arg Ser Arg Ser
1425 1430 1435 1440
Phe Leu Tyr Gln Val Ser Ser His Glu Gln Ser Glu Ser Thr His Gly
1445 1450 1455
Gln Thr Ala Pro Ser Thr Gly Gly Arg Gln Gly Ser Arg His Glu Gln
1460 1465 1470
Ala Arg Asn Ser Ser Arg His Ser Ala Ser Gln Asp Gly Gln Asp Thr
1475 1480 1485
Ile Arg Gly His Pro Gly Ser Ser Arg Gly Gly Arg Gln Gly Ser Tyr
1490 1495 1500
His Glu Gln Ser Val Asp Arg Ser Gly His Ser Gly Tyr His His Ser
1505 1510 1515 1520
His Thr Thr Pro Gln Gly Arg Ser Asp Ala Ser His Gly Gln Ser Gly
1525 1530 1535
Pro Arg Ser Ala Ser Arg Gln Thr Arg Asn Glu Glu Gln Ser Gly Asp
1540 1545 1550
Gly Ser Arg His Ser Gly Ser Arg His His Glu Pro Ser Thr Arg Ala
1555 1560 1565
Gly Ser Ser Arg His Ser Gln Val Gly Gln Gly Glu Ser Ala Gly Ser
1570 1575 1580
Lys Thr Ser Arg Arg Gln Gly Ser Ser Val Ser Gln Asp Arg Asp Ser
1585 1590 1595 1600
Glu Gly His Ser Glu Asp Ser Glu Arg Arg Ser Glu Ser Ala Ser Arg
1605 1610 1615
Asn His Tyr Gly Ser Ala Arg Glu Gln Ser Arg His Gly Ser Arg Asn
1620 1625 1630
Pro Arg Ser His Gln Glu Asp Arg Ala Ser His Gly His Ser Ala Glu
1635 1640 1645
Ser Ser Arg Gln Ser Gly Thr Arg His Ala Glu Thr Ser Ser Gly Gly
1650 1655 1660
Gln Ala Ala Ser Ser Gln Glu Gln Ala Arg Ser Ser Pro Gly Glu Arg
1665 1670 1675 1680
His Gly Ser Arg His Gln Gln Ser Ala Asp Ser Ser Thr Asp Ser Gly
1685 1690 1695
Thr Gly Arg Arg Gln Asp Ser Ser Val Val Gly Asp Ser Gly Asn Arg
1700 1705 1710
Gly Ser Ser Gly Ser Gln Ala Ser Asp Ser Glu Gly His Ser Glu Glu
1715 1720 1725
Ser Asp Thr Gln Ser Val Ser Ala His Gly Gln Ala Gly Pro His Gln
1730 1735 1740
Gln Ser His Gln Glu Ser Thr Arg Gly Gln Ser Gly Glu Arg Ser Gly
1745 1750 1755 1760
Arg Ser Gly Ser Phe Leu Tyr Gln Val Ser Thr His Glu Gln Ser Glu
1765 1770 1775
Ser Ala His Gly Arg Thr Gly Pro Ser Thr Gly Gly Arg Gln Arg Ser
1780 1785 1790
Arg His Glu Gln Ala Arg Asp Ser Ser Arg His Ser Ala Ser Gln Glu
1795 1800 1805
Gly Gln Asp Thr Ile Arg Gly His Pro Gly Ser Ser Arg Gly Gly Arg
1810 1815 1820
Gln Gly Ser His Tyr Glu Gln Ser Val Asp Ser Ser Gly His Ser Gly
1825 1830 1835 1840
Ser His His Ser His Thr Thr Ser Gln Glu Arg Ser Asp Val Ser Arg
1845 1850 1855
Gly Gln Ser Gly Ser Arg Ser Val Ser Arg Gln Thr Arg Asn Glu Lys
1860 1865 1870
Gln Ser Gly Asp Gly Ser Arg His Ser Gly Ser Arg His His Glu Ala
1875 1880 1885
Ser Ser Arg Ala Asp Ser Ser Arg His Ser Gln Val Gly Gln Gly Gln
1890 1895 1900
Ser Ser Gly Pro Arg Thr Ser Arg Asn Gln Gly Ser Ser Val Ser Gln
1905 1910 1915 1920
Asp Ser Asp Ser Gln Gly His Ser Glu Asp Ser Glu Arg Trp Ser Gly
1925 1930 1935
Ser Ala Ser Arg Asn His Leu Gly Ser Ala Trp Glu Gln Ser Arg Asp
1940 1945 1950
Gly Ser Arg His Pro Gly Ser His His Glu Asp Arg Ala Gly His Gly
1955 1960 1965
His Ser Ala Asp Ser Ser Arg Gln Ser Gly Thr Arg His Thr Glu Ser
1970 1975 1980
Ser Ser Arg Gly Gln Ala Ala Ser Ser His Glu Gln Ala Arg Ser Ser
1985 1990 1995 2000
Ala Gly Glu Arg His Gly Ser His His Gln Leu Gln Ser Ala Asp Ser
2005 2010 2015
Ser Arg His Ser Gly Ile Gly His Gly Gln Ala Ser Ser Ala Val Arg
2020 2025 2030
Asp Ser Gly His Arg Gly Tyr Ser Gly Ser Gln Ala Ser Asp Ser Glu
2035 2040 2045
Gly His Ser Glu Asp Ser Asp Thr Gln Ser Val Ser Ala Gln Gly Lys
2050 2055 2060
Ala Gly Pro His Gln Gln Ser His Lys Glu Ser Ala Arg Gly Gln Ser
2065 2070 2075 2080
Gly Glu Ser Ser Gly Arg Ser Gly Ser Phe Leu Tyr Gln Val Ser Thr
2085 2090 2095
His Glu Gln Ser Glu Ser Thr His Gly Gln Ser Ala Pro Ser Thr Gly
2100 2105 2110
Gly Arg Gln Gly Ser His Tyr Asp Gln Ala Gln Asp Ser Ser Arg His
2115 2120 2125
Ser Ala Ser Gln Glu Gly Gln Asp Thr Ile Arg Gly His Pro Gly Pro
2130 2135 2140
Ser Arg Gly Gly Arg Gln Gly Ser His Gln Glu Gln Ser Val Asp Arg
2145 2150 2155 2160
Ser Gly His Ser Gly Ser His His Ser His Thr Thr Ser Gln Gly Arg
2165 2170 2175
Ser Asp Ala Ser Arg Gly Gln Ser Gly Ser Arg Ser Ala Ser Arg Lys
2180 2185 2190
Thr Tyr Asp Lys Glu Gln Ser Gly Asp Gly Ser Arg His Ser Gly Ser
2195 2200 2205
His His His Glu Ala Ser Ser Trp Ala Asp Ser Ser Arg His Ser Leu
2210 2215 2220
Val Gly Gln Gly Gln Ser Ser Gly Pro Arg Thr Ser Arg Pro Arg Gly
2225 2230 2235 2240
Ser Ser Val Ser Gln Asp Ser Asp Ser Glu Gly His Ser Glu Asp Ser
2245 2250 2255
Glu Arg Arg Ser Gly Ser Ala Ser Arg Asn His His Gly Ser Ala Gln
2260 2265 2270
Glu Gln Ser Arg Asp Gly Ser Arg His Pro Arg Ser His His Glu Asp
2275 2280 2285
Arg Ala Gly His Gly His Ser Ala Glu Ser Ser Arg Gln Ser Gly Thr
2290 2295 2300
His His Ala Glu Asn Ser Ser Gly Gly Gln Ala Ala Ser Ser His Glu
2305 2310 2315 2320
Gln Ala Arg Ser Ser Ala Gly Glu Arg His Gly Ser His His Gln Gln
2325 2330 2335
Ser Ala Asp Ser Ser Arg His Ser Gly Ile Gly His Gly Gln Ala Ser
2340 2345 2350
Ser Ala Val Arg Asp Ser Gly His Arg Gly Ser Ser Gly Ser Gln Ala
2355 2360 2365
Ser Asp Ser Glu Gly His Ser Glu Asp Ser Asp Thr Gln Ser Val Ser
2370 2375 2380
Ala His Gly Gln Ala Gly Pro His Gln Gln Ser His Gln Glu Ser Thr
2385 2390 2395 2400
Arg Gly Arg Ser Ala Gly Arg Ser Gly Arg Ser Gly Ser Phe Leu Tyr
2405 2410 2415
Gln Val Ser Thr His Glu Gln Ser Glu Ser Ala His Gly Arg Thr Gly
2420 2425 2430
Thr Ser Thr Gly Gly Arg Gln Gly Ser His His Lys Gln Ala Arg Asp
2435 2440 2445
Ser Ser Arg His Ser Thr Ser Gln Glu Gly Gln Asp Thr Ile His Gly
2450 2455 2460
His Pro Gly Ser Ser Ser Gly Gly Arg Gln Gly Ser His Tyr Glu Gln
2465 2470 2475 2480
Leu Val Asp Arg Ser Gly His Ser Gly Ser His His Ser His Thr Thr
2485 2490 2495
Ser Gln Gly Arg Ser Asp Ala Ser His Gly His Ser Gly Ser Arg Ser
2500 2505 2510
Ala Ser Arg Gln Thr Arg Asn Asp Glu Gln Ser Gly Asp Gly Ser Arg
2515 2520 2525
His Ser Gly Ser Arg His His Glu Ala Ser Ser Arg Ala Asp Ser Ser
2530 2535 2540
Gly His Ser Gln Val Gly Gln Gly Gln Ser Glu Gly Pro Arg Thr Ser
2545 2550 2555 2560
Arg Asn Trp Gly Ser Ser Phe Ser Gln Asp Ser Asp Ser Gln Gly His
2565 2570 2575
Ser Glu Asp Ser Glu Arg Trp Ser Gly Ser Ala Ser Arg Asn His His
2580 2585 2590
Gly Ser Ala Gln Glu Gln Leu Arg Asp Gly Ser Arg His Pro Arg Ser
2595 2600 2605
His Gln Glu Asp Arg Ala Gly His Gly His Ser Ala Asp Ser Ser Arg
2610 2615 2620
Gln Ser Gly Thr Arg His Thr Gln Thr Ser Ser Gly Gly Gln Ala Ala
2625 2630 2635 2640
Ser Ser His Glu Gln Ala Arg Ser Ser Ala Gly Glu Arg His Gly Ser
2645 2650 2655
His His Gln Gln Ser Ala Asp Ser Ser Arg His Ser Gly Ile Gly His
2660 2665 2670
Gly Gln Ala Ser Ser Ala Val Arg Asp Ser Gly His Arg Gly Tyr Ser
2675 2680 2685
Gly Ser Gln Ala Ser Asp Asn Glu Gly His Ser Glu Asp Ser Asp Thr
2690 2695 2700
Gln Ser Val Ser Ala His Gly Gln Ala Gly Ser His Gln Gln Ser His
2705 2710 2715 2720
Gln Glu Ser Ala Arg Gly Arg Ser Gly Glu Thr Ser Gly His Ser Gly
2725 2730 2735
Ser Phe Leu Tyr Gln Val Ser Thr His Glu Gln Ser Glu Ser Ser His
2740 2745 2750
Gly Trp Thr Gly Pro Ser Thr Arg Gly Arg Gln Gly Ser Arg His Glu
2755 2760 2765
Gln Ala Gln Asp Ser Ser Arg His Ser Ala Ser Gln Asp Gly Gln Asp
2770 2775 2780
Thr Ile Arg Gly His Pro Gly Ser Ser Arg Gly Gly Arg Gln Gly Tyr
2785 2790 2795 2800
His His Glu His Ser Val Asp Ser Ser Gly His Ser Gly Ser His His
2805 2810 2815
Ser His Thr Thr Ser Gln Gly Arg Ser Asp Ala Ser Arg Gly Gln Ser
2820 2825 2830
Gly Ser Arg Ser Ala Ser Arg Thr Thr Arg Asn Glu Glu Gln Ser Gly
2835 2840 2845
Asp Gly Ser Arg His Ser Gly Ser Arg His His Glu Ala Ser Thr His
2850 2855 2860
Ala Asp Ile Ser Arg His Ser Gln Ala Val Gln Gly Gln Ser Glu Gly
2865 2870 2875 2880
Ser Arg Arg Ser Arg Arg Gln Gly Ser Ser Val Ser Gln Asp Ser Asp
2885 2890 2895
Ser Glu Gly His Ser Glu Asp Ser Glu Arg Trp Ser Gly Ser Ala Ser
2900 2905 2910
Arg Asn His His Gly Ser Ala Gln Glu Gln Leu Arg Asp Gly Ser Arg
2915 2920 2925
His Pro Arg Ser His Gln Glu Asp Arg Ala Gly His Gly His Ser Ala
2930 2935 2940
Asp Ser Ser Arg Gln Ser Gly Thr Arg His Thr Gln Thr Ser Ser Gly
2945 2950 2955 2960
Gly Gln Ala Ala Ser Ser His Glu Gln Ala Arg Ser Ser Ala Gly Glu
2965 2970 2975
Arg His Gly Ser His His Gln Gln Ser Ala Asp Ser Ser Arg His Ser
2980 2985 2990
Gly Ile Gly His Gly Gln Ala Ser Ser Ala Val Arg Asp Ser Gly His
2995 3000 3005
Arg Gly Tyr Ser Gly Ser Gln Ala Ser Asp Asn Glu Gly His Ser Glu
3010 3015 3020
Asp Ser Asp Thr Gln Ser Val Ser Ala His Gly Gln Ala Gly Ser His
3025 3030 3035 3040
Gln Gln Ser His Gln Glu Ser Ala Arg Gly Arg Ser Gly Glu Thr Ser
3045 3050 3055
Gly His Ser Gly Ser Phe Leu Tyr Gln Val Ser Thr His Glu Gln Ser
3060 3065 3070
Glu Ser Ser His Gly Trp Thr Gly Pro Ser Thr Arg Gly Arg Gln Gly
3075 3080 3085
Ser Arg His Glu Gln Ala Gln Asp Ser Ser Arg His Ser Ala Ser Gln
3090 3095 3100
Tyr Gly Gln Asp Thr Ile Arg Gly His Pro Gly Ser Ser Arg Gly Gly
3105 3110 3115 3120
Arg Gln Gly Tyr His His Glu His Ser Val Asp Ser Ser Gly His Ser
3125 3130 3135
Gly Ser His His Ser His Thr Thr Ser Gln Gly Arg Ser Asp Ala Ser
3140 3145 3150
Arg Gly Gln Ser Gly Ser Arg Ser Ala Ser Arg Thr Thr Arg Asn Glu
3155 3160 3165
Glu Gln Ser Gly Asp Ser Ser Arg His Ser Val Ser Arg His His Glu
3170 3175 3180
Ala Ser Thr His Ala Asp Ile Ser Arg His Ser Gln Ala Val Gln Gly
3185 3190 3195 3200
Gln Ser Glu Gly Ser Arg Arg Ser Arg Arg Gln Gly Ser Ser Val Ser
3205 3210 3215
Gln Asp Ser Asp Ser Glu Gly His Ser Glu Asp Ser Glu Arg Trp Ser
3220 3225 3230
Gly Ser Ala Ser Arg Asn His Arg Gly Ser Val Gln Glu Gln Ser Arg
3235 3240 3245
His Gly Ser Arg His Pro Arg Ser His His Glu Asp Arg Ala Gly His
3250 3255 3260
Gly His Ser Ala Asp Arg Ser Arg Gln Ser Gly Thr Arg His Ala Glu
3265 3270 3275 3280
Thr Ser Ser Gly Gly Gln Ala Ala Ser Ser His Glu Gln Ala Arg Ser
3285 3290 3295
Ser Pro Gly Glu Arg His Gly Ser Arg His Gln Gln Ser Ala Asp Ser
3300 3305 3310
Ser Arg His Ser Gly Ile Pro Arg Gly Gln Ala Ser Ser Ala Val Arg
3315 3320 3325
Asp Ser Arg His Trp Gly Ser Ser Gly Ser Gln Ala Ser Asp Ser Glu
3330 3335 3340
Gly His Ser Glu Glu Ser Asp Thr Gln Ser Val Ser Gly His Gly Gln
3345 3350 3355 3360
Ala Gly Pro His Gln Gln Ser His Gln Glu Ser Ala Arg Asp Arg Ser
3365 3370 3375
Gly Gly Arg Ser Gly Arg Ser Gly Ser Phe Leu Tyr Gln Val Ser Thr
3380 3385 3390
His Glu Gln Ser Glu Ser Ala His Gly Arg Thr Arg Thr Ser Thr Gly
3395 3400 3405
Arg Arg Gln Gly Ser His His Glu Gln Ala Arg Asp Ser Ser Arg His
3410 3415 3420
Ser Ala Ser Gln Glu Gly Gln Asp Thr Ile Arg Gly His Pro Gly Ser
3425 3430 3435 3440
Ser Arg Arg Gly Arg Gln Gly Ser His Tyr Glu Gln Ser Val Asp Arg
3445 3450 3455
Ser Gly His Ser Gly Ser His His Ser His Thr Thr Ser Gln Gly Arg
3460 3465 3470
Ser Asp Ala Ser Arg Gly Gln Ser Gly Ser Arg Ser Ala Ser Arg Gln
3475 3480 3485
Thr Arg Asn Asp Glu Gln Ser Gly Asp Gly Ser Arg His Ser Trp Ser
3490 3495 3500
His His His Glu Ala Ser Thr Gln Ala Asp Ser Ser Arg His Ser Gln
3505 3510 3515 3520
Ser Gly Gln Gly Gln Ser Ala Gly Pro Arg Thr Ser Arg Asn Gln Gly
3525 3530 3535
Ser Ser Val Ser Gln Asp Ser Asp Ser Gln Gly His Ser Glu Asp Ser
3540 3545 3550
Glu Arg Trp Ser Gly Ser Ala Ser Arg Asn His Arg Gly Ser Ala Gln
3555 3560 3565
Glu Gln Ser Arg Asp Gly Ser Arg His Pro Thr Ser His His Glu Asp
3570 3575 3580
Arg Ala Gly His Gly His Ser Ala Glu Ser Ser Arg Gln Ser Gly Thr
3585 3590 3595 3600
His His Ala Glu Asn Ser Ser Gly Gly Gln Ala Ala Ser Ser His Glu
3605 3610 3615
Gln Ala Arg Ser Ser Ala Gly Glu Arg His Gly Ser His His Gln Gln
3620 3625 3630
Ser Ala Asp Ser Ser Arg His Ser Gly Ile Gly His Gly Gln Ala Ser
3635 3640 3645
Ser Ala Val Arg Asp Ser Gly His Arg Gly Ser Ser Gly Ser Gln Ala
3650 3655 3660
Ser Asp Ser Glu Gly His Ser Glu Asp Ser Asp Thr Gln Ser Val Ser
3665 3670 3675 3680
Ala His Gly Gln Ala Gly Pro His Gln Gln Ser His Gln Glu Ser Thr
3685 3690 3695
Arg Gly Arg Ser Ala Gly Arg Ser Gly Arg Ser Gly Ser Phe Leu Tyr
3700 3705 3710
Gln Val Ser Thr His Glu Gln Ser Glu Ser Ala His Gly Arg Ala Gly
3715 3720 3725
Pro Ser Thr Gly Gly Arg Gln Gly Ser Arg His Glu Gln Ala Arg Asp
3730 3735 3740
Ser Ser Arg His Ser Ala Ser Gln Glu Gly Gln Asp Thr Ile Arg Gly
3745 3750 3755 3760
His Pro Gly Ser Arg Arg Gly Gly Arg Gln Gly Ser Tyr His Glu Gln
3765 3770 3775
Ser Val Asp Arg Ser Gly His Ser Gly Ser His His Ser His Thr Thr
3780 3785 3790
Ser Gln Gly Arg Ser Asp Ala Ser His Gly Gln Ser Gly Ser Arg Ser
3795 3800 3805
Ala Ser Arg Glu Thr Arg Asn Glu Glu Gln Ser Gly Asp Gly Ser Arg
3810 3815 3820
His Ser Gly Ser Arg His His Glu Ala Ser Thr Gln Ala Asp Ser Ser
3825 3830 3835 3840
Arg His Ser Gln Ser Gly Gln Gly Glu Ser Ala Gly Ser Arg Arg Ser
3845 3850 3855
Arg Arg Gln Gly Ser Ser Val Ser Gln Asp Ser Asp Ser Glu Ala Tyr
3860 3865 3870
Pro Glu Asp Ser Glu Arg Arg Ser Glu Ser Ala Ser Arg Asn His His
3875 3880 3885
Gly Ser Ser Arg Glu Gln Ser Arg Asp Gly Ser Arg His Pro Gly Ser
3890 3895 3900
Ser His Arg Asp Thr Ala Ser His Val Gln Ser Ser Pro Val Gln Ser
3905 3910 3915 3920
Asp Ser Ser Thr Ala Lys Glu His Gly His Phe Ser Ser Leu Ser Gln
3925 3930 3935
Asp Ser Ala Tyr His Ser Gly Ile Gln Ser Arg Gly Ser Pro His Ser
3940 3945 3950
Ser Ser Ser Tyr His Tyr Gln Ser Glu Gly Thr Glu Arg Gln Lys Gly
3955 3960 3965
Gln Ser Gly Leu Val Trp Arg His Gly Ser Tyr Gly Ser Ala Asp Tyr
3970 3975 3980
Asp Tyr Gly Glu Ser Gly Phe Arg His Ser Gln His Gly Ser Val Ser
3985 3990 3995 4000
Tyr Asn Ser Asn Pro Val Val Phe Lys Glu Arg Ser Asp Ile Cys Lys
4005 4010 4015
Ala Ser Ala Phe Gly Lys Asp His Pro Arg Tyr Tyr Ala Thr Tyr Ile
4020 4025 4030
Asn Lys Asp Pro Gly Leu Cys Gly His Ser Ser Asp Ile Ser Lys Gln
4035 4040 4045
Leu Gly Phe Ser Gln Ser Gln Arg Tyr Tyr Tyr Tyr Glu
4050 4055 4060

<210> 40
<211> 325
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 40
Gln Val Ser Thr His Glu Gln Pro Asp Ser Ala His Gly Arg Thr Gly
1 5 10 15
Thr Ser Thr Gly Gly Arg Gln Gly Ser His His Glu Gln Ala Arg Asp
20 25 30
Ser Ser Arg His Ser Ala Ser Gln Glu Gly Gln Asp Thr Ile Arg Gly
35 40 45
His Pro Gly Ser Ser Arg Gly Gly Arg Gln Gly Ser His His Glu Gln
50 55 60
Ser Val Asn Arg Ser Gly His Ser Gly Ser His His Ser His Thr Thr
65 70 75 80
Ser Gln Gly Arg Ser Asp Ala Ser His Gly Gln Ser Gly Ser Arg Ser
85 90 95
Ala Ser Arg Gln Thr Arg Asn Glu Glu Gln Ser Gly Asp Gly Thr Arg
100 105 110
His Ser Gly Ser Arg His His Glu Ala Ser Ser Gln Ala Asp Ser Ser
115 120 125
Arg His Ser Gln Val Gly Gln Gly Gln Ser Ser Gly Pro Arg Thr Ser
130 135 140
Arg Asn Gln Gly Ser Ser Val Ser Gln Asp Ser Asp Ser Gln Gly His
145 150 155 160
Ser Glu Asp Ser Glu Arg Trp Ser Gly Ser Ala Ser Arg Asn His His
165 170 175
Gly Ser Ala Gln Glu Gln Ser Arg Asp Gly Ser Arg His Pro Arg Ser
180 185 190
His His Glu Asp Arg Ala Gly His Gly His Ser Ala Asp Ser Ser Arg
195 200 205
Lys Ser Gly Thr Arg His Thr Gln Asn Ser Ser Ser Gly Gln Ala Ala
210 215 220
Ser Ser His Glu Gln Ala Arg Ser Ser Ala Gly Glu Arg His Gly Ser
225 230 235 240
Arg His Gln Leu Gln Ser Ala Asp Ser Ser Arg His Ser Gly Thr Gly
245 250 255
His Gly Gln Ala Ser Ser Ala Val Arg Asp Ser Gly His Arg Gly Ser
260 265 270
Ser Gly Ser Gln Ala Thr Asp Ser Glu Gly His Ser Glu Asp Ser Asp
275 280 285
Thr Gln Ser Val Ser Gly His Gly Gln Ala Gly His His Gln Gln Ser
290 295 300
His Gln Glu Ser Ala Arg Asp Arg Ser Gly Glu Arg Ser Arg Arg Ser
305 310 315 320
Gly Ser Phe Leu Tyr
325

<210> 41
<211> 324
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 41
Gln Val Ser Thr His Lys Gln Ser Glu Ser Ser His Gly Trp Thr Gly
1 5 10 15
Pro Ser Thr Gly Val Arg Gln Gly Ser His His Glu Gln Ala Arg Asp
20 25 30
Asn Ser Arg His Ser Ala Ser Gln Asp Gly Gln Asp Thr Ile Arg Gly
35 40 45
His Pro Gly Ser Ser Arg Arg Gly Arg Gln Gly Ser His His Glu Gln
50 55 60
Ser Val Asp Arg Ser Gly His Ser Gly Ser His His Ser His Thr Thr
65 70 75 80
Ser Gln Gly Arg Ser Asp Ala Ser Arg Gly Gln Ser Gly Ser Arg Ser
85 90 95
Ala Ser Arg Thr Thr Arg Asn Glu Glu Gln Ser Arg Asp Gly Ser Arg
100 105 110
His Ser Gly Ser Arg His His Glu Ala Ser Ser His Ala Asp Ile Ser
115 120 125
Arg His Ser Gln Ala Gly Gln Gly Gln Ser Glu Gly Ser Arg Thr Ser
130 135 140
Arg Arg Gln Gly Ser Ser Val Ser Gln Asp Ser Asp Ser Glu Gly His
145 150 155 160
Ser Glu Asp Ser Glu Arg Trp Ser Gly Ser Ala Ser Arg Asn His Arg
165 170 175
Gly Ser Ala Gln Glu Gln Ser Arg His Gly Ser Arg His Pro Arg Ser
180 185 190
His His Glu Asp Arg Ala Gly His Gly His Ser Ala Asp Ser Ser Arg
195 200 205
Gln Ser Gly Thr Pro His Ala Glu Thr Ser Ser Gly Gly Gln Ala Ala
210 215 220
Ser Ser His Glu Gln Ala Arg Ser Ser Pro Gly Glu Arg His Gly Ser
225 230 235 240
Arg His Gln Gln Ser Ala Asp Ser Ser Arg His Ser Gly Ile Pro Arg
245 250 255
Arg Gln Ala Ser Ser Ala Val Arg Asp Ser Gly His Trp Gly Ser Ser
260 265 270
Gly Ser Gln Ala Ser Asp Ser Glu Gly His Ser Glu Glu Ser Asp Thr
275 280 285
Gln Ser Val Ser Gly His Gly Gln Asp Gly Pro His Gln Gln Ser His
290 295 300
Gln Glu Ser Ala Arg Asp Trp Ser Gly Gly Arg Ser Gly Arg Ser Gly
305 310 315 320
Ser Phe Ile Tyr

<210> 42
<211> 324
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 42
Gln Val Ser Thr His Glu Gln Ser Glu Ser Ala His Gly Arg Thr Arg
1 5 10 15
Thr Ser Thr Gly Arg Arg Gln Gly Ser His His Glu Gln Ala Arg Asp
20 25 30
Ser Ser Arg His Ser Ala Ser Gln Glu Gly Gln Asp Thr Ile Arg Ala
35 40 45
His Pro Gly Ser Arg Arg Gly Gly Arg Gln Gly Ser His His Glu Gln
50 55 60
Ser Val Asp Arg Ser Gly His Ser Gly Ser His His Ser His Thr Thr
65 70 75 80
Ser Gln Gly Arg Ser Asp Ala Ser His Gly Gln Ser Gly Ser Arg Ser
85 90 95
Ala Ser Arg Gln Thr Arg Lys Asp Lys Gln Ser Gly Asp Gly Ser Arg
100 105 110
His Ser Gly Ser Arg His His Glu Ala Ala Ser Trp Ala Asp Ser Ser
115 120 125
Arg His Ser Gln Val Gly Gln Glu Gln Ser Ser Gly Ser Arg Thr Ser
130 135 140
Arg His Gln Gly Ser Ser Val Ser Gln Asp Ser Asp Ser Glu Arg His
145 150 155 160
Ser Asp Asp Ser Glu Arg Leu Ser Gly Ser Ala Ser Arg Asn His His
165 170 175
Gly Ser Ser Arg Glu Gln Ser Arg Asp Gly Ser Arg His Pro Gly Phe
180 185 190
His Gln Glu Asp Arg Ala Ser His Gly His Ser Ala Asp Ser Ser Arg
195 200 205
Gln Ser Gly Thr His His Thr Glu Ser Ser Ser His Gly Gln Ala Val
210 215 220
Ser Ser His Glu Gln Ala Arg Ser Ser Pro Gly Glu Arg His Gly Ser
225 230 235 240
Arg His Gln Gln Ser Ala Asp Ser Ser Arg His Ser Gly Ile Gly His
245 250 255
Arg Gln Ala Ser Ser Ala Val Arg Asp Ser Gly His Arg Gly Ser Ser
260 265 270
Gly Ser Gln Val Thr Asn Ser Glu Gly His Ser Glu Asp Ser Asp Thr
275 280 285
Gln Ser Val Ser Ala His Gly Gln Ala Gly Pro His Gln Gln Ser His
290 295 300
Lys Glu Ser Ala Arg Gly Gln Ser Gly Glu Ser Ser Gly Arg Ser Arg
305 310 315 320
Ser Phe Leu Tyr

<210> 43
<211> 324
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 43
Gln Val Ser Ser His Glu Gln Ser Glu Ser Thr His Gly Gln Thr Ala
1 5 10 15
Pro Ser Thr Gly Gly Arg Gln Gly Ser Arg His Glu Gln Ala Arg Asn
20 25 30
Ser Ser Arg His Ser Ala Ser Gln Asp Gly Gln Asp Thr Ile Arg Gly
35 40 45
His Pro Gly Ser Ser Arg Gly Gly Arg Gln Gly Ser Tyr His Glu Gln
50 55 60
Ser Val Asp Arg Ser Gly His Ser Gly Tyr His His Ser His Thr Thr
65 70 75 80
Pro Gln Gly Arg Ser Asp Ala Ser His Gly Gln Ser Gly Pro Arg Ser
85 90 95
Ala Ser Arg Gln Thr Arg Asn Glu Glu Gln Ser Gly Asp Gly Ser Arg
100 105 110
His Ser Gly Ser Arg His His Glu Pro Ser Thr Arg Ala Gly Ser Ser
115 120 125
Arg His Ser Gln Val Gly Gln Gly Glu Ser Ala Gly Ser Lys Thr Ser
130 135 140
Arg Arg Gln Gly Ser Ser Val Ser Gln Asp Arg Asp Ser Glu Gly His
145 150 155 160
Ser Glu Asp Ser Glu Arg Arg Ser Glu Ser Ala Ser Arg Asn His Tyr
165 170 175
Gly Ser Ala Arg Glu Gln Ser Arg His Gly Ser Arg Asn Pro Arg Ser
180 185 190
His Gln Glu Asp Arg Ala Ser His Gly His Ser Ala Glu Ser Ser Arg
195 200 205
Gln Ser Gly Thr Arg His Ala Glu Thr Ser Ser Gly Gly Gln Ala Ala
210 215 220
Ser Ser Gln Glu Gln Ala Arg Ser Ser Pro Gly Glu Arg His Gly Ser
225 230 235 240
Arg His Gln Gln Ser Ala Asp Ser Ser Thr Asp Ser Gly Thr Gly Arg
245 250 255
Arg Gln Asp Ser Ser Val Val Gly Asp Ser Gly Asn Arg Gly Ser Ser
260 265 270
Gly Ser Gln Ala Ser Asp Ser Glu Gly His Ser Glu Glu Ser Asp Thr
275 280 285
Gln Ser Val Ser Ala His Gly Gln Ala Gly Pro His Gln Gln Ser His
290 295 300
Gln Glu Ser Thr Arg Gly Gln Ser Gly Glu Arg Ser Gly Arg Ser Gly
305 310 315 320
Ser Phe Leu Tyr

<210> 44
<211> 325
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 44
Gln Val Ser Thr His Glu Gln Ser Glu Ser Ala His Gly Arg Thr Gly
1 5 10 15
Pro Ser Thr Gly Gly Arg Gln Arg Ser Arg His Glu Gln Ala Arg Asp
20 25 30
Ser Ser Arg His Ser Ala Ser Gln Glu Gly Gln Asp Thr Ile Arg Gly
35 40 45
His Pro Gly Ser Ser Arg Gly Gly Arg Gln Gly Ser His Tyr Glu Gln
50 55 60
Ser Val Asp Ser Ser Gly His Ser Gly Ser His His Ser His Thr Thr
65 70 75 80
Ser Gln Glu Arg Ser Asp Val Ser Arg Gly Gln Ser Gly Ser Arg Ser
85 90 95
Val Ser Arg Gln Thr Arg Asn Glu Lys Gln Ser Gly Asp Gly Ser Arg
100 105 110
His Ser Gly Ser Arg His His Glu Ala Ser Ser Arg Ala Asp Ser Ser
115 120 125
Arg His Ser Gln Val Gly Gln Gly Gln Ser Ser Gly Pro Arg Thr Ser
130 135 140
Arg Asn Gln Gly Ser Ser Val Ser Gln Asp Ser Asp Ser Gln Gly His
145 150 155 160
Ser Glu Asp Ser Glu Arg Trp Ser Gly Ser Ala Ser Arg Asn His Leu
165 170 175
Gly Ser Ala Trp Glu Gln Ser Arg Asp Gly Ser Arg His Pro Gly Ser
180 185 190
His His Glu Asp Arg Ala Gly His Gly His Ser Ala Asp Ser Ser Arg
195 200 205
Gln Ser Gly Thr Arg His Thr Glu Ser Ser Ser Arg Gly Gln Ala Ala
210 215 220
Ser Ser His Glu Gln Ala Arg Ser Ser Ala Gly Glu Arg His Gly Ser
225 230 235 240
His His Gln Leu Gln Ser Ala Asp Ser Ser Arg His Ser Gly Ile Gly
245 250 255
His Gly Gln Ala Ser Ser Ala Val Arg Asp Ser Gly His Arg Gly Tyr
260 265 270
Ser Gly Ser Gln Ala Ser Asp Ser Glu Gly His Ser Glu Asp Ser Asp
275 280 285
Thr Gln Ser Val Ser Ala Gln Gly Lys Ala Gly Pro His Gln Gln Ser
290 295 300
His Lys Glu Ser Ala Arg Gly Gln Ser Gly Glu Ser Ser Gly Arg Ser
305 310 315 320
Gly Ser Phe Leu Tyr
325

<210> 45
<211> 324
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 45
Gln Val Ser Thr His Glu Gln Ser Glu Ser Thr His Gly Gln Ser Ala
1 5 10 15
Pro Ser Thr Gly Gly Arg Gln Gly Ser His Tyr Asp Gln Ala Gln Asp
20 25 30
Ser Ser Arg His Ser Ala Ser Gln Glu Gly Gln Asp Thr Ile Arg Gly
35 40 45
His Pro Gly Pro Ser Arg Gly Gly Arg Gln Gly Ser His Gln Glu Gln
50 55 60
Ser Val Asp Arg Ser Gly His Ser Gly Ser His His Ser His Thr Thr
65 70 75 80
Ser Gln Gly Arg Ser Asp Ala Ser Arg Gly Gln Ser Gly Ser Arg Ser
85 90 95
Ala Ser Arg Lys Thr Tyr Asp Lys Glu Gln Ser Gly Asp Gly Ser Arg
100 105 110
His Ser Gly Ser His His His Glu Ala Ser Ser Trp Ala Asp Ser Ser
115 120 125
Arg His Ser Leu Val Gly Gln Gly Gln Ser Ser Gly Pro Arg Thr Ser
130 135 140
Arg Pro Arg Gly Ser Ser Val Ser Gln Asp Ser Asp Ser Glu Gly His
145 150 155 160
Ser Glu Asp Ser Glu Arg Arg Ser Gly Ser Ala Ser Arg Asn His His
165 170 175
Gly Ser Ala Gln Glu Gln Ser Arg Asp Gly Ser Arg His Pro Arg Ser
180 185 190
His His Glu Asp Arg Ala Gly His Gly His Ser Ala Glu Ser Ser Arg
195 200 205
Gln Ser Gly Thr His His Ala Glu Asn Ser Ser Gly Gly Gln Ala Ala
210 215 220
Ser Ser His Glu Gln Ala Arg Ser Ser Ala Gly Glu Arg His Gly Ser
225 230 235 240
His His Gln Gln Ser Ala Asp Ser Ser Arg His Ser Gly Ile Gly His
245 250 255
Gly Gln Ala Ser Ser Ala Val Arg Asp Ser Gly His Arg Gly Ser Ser
260 265 270
Gly Ser Gln Ala Ser Asp Ser Glu Gly His Ser Glu Asp Ser Asp Thr
275 280 285
Gln Ser Val Ser Ala His Gly Gln Ala Gly Pro His Gln Gln Ser His
290 295 300
Gln Glu Ser Thr Arg Gly Arg Ser Ala Gly Arg Ser Gly Arg Ser Gly
305 310 315 320
Ser Phe Leu Tyr

<210> 46
<211> 324
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 46
Gln Val Ser Thr His Glu Gln Ser Glu Ser Ala His Gly Arg Thr Gly
1 5 10 15
Thr Ser Thr Gly Gly Arg Gln Gly Ser His His Lys Gln Ala Arg Asp
20 25 30
Ser Ser Arg His Ser Thr Ser Gln Glu Gly Gln Asp Thr Ile His Gly
35 40 45
His Pro Gly Ser Ser Ser Gly Gly Arg Gln Gly Ser His Tyr Glu Gln
50 55 60
Leu Val Asp Arg Ser Gly His Ser Gly Ser His His Ser His Thr Thr
65 70 75 80
Ser Gln Gly Arg Ser Asp Ala Ser His Gly His Ser Gly Ser Arg Ser
85 90 95
Ala Ser Arg Gln Thr Arg Asn Asp Glu Gln Ser Gly Asp Gly Ser Arg
100 105 110
His Ser Gly Ser Arg His His Glu Ala Ser Ser Arg Ala Asp Ser Ser
115 120 125
Gly His Ser Gln Val Gly Gln Gly Gln Ser Glu Gly Pro Arg Thr Ser
130 135 140
Arg Asn Trp Gly Ser Ser Phe Ser Gln Asp Ser Asp Ser Gln Gly His
145 150 155 160
Ser Glu Asp Ser Glu Arg Trp Ser Gly Ser Ala Ser Arg Asn His His
165 170 175
Gly Ser Ala Gln Glu Gln Leu Arg Asp Gly Ser Arg His Pro Arg Ser
180 185 190
His Gln Glu Asp Arg Ala Gly His Gly His Ser Ala Asp Ser Ser Arg
195 200 205
Gln Ser Gly Thr Arg His Thr Gln Thr Ser Ser Gly Gly Gln Ala Ala
210 215 220
Ser Ser His Glu Gln Ala Arg Ser Ser Ala Gly Glu Arg His Gly Ser
225 230 235 240
His His Gln Gln Ser Ala Asp Ser Ser Arg His Ser Gly Ile Gly His
245 250 255
Gly Gln Ala Ser Ser Ala Val Arg Asp Ser Gly His Arg Gly Tyr Ser
260 265 270
Gly Ser Gln Ala Ser Asp Asn Glu Gly His Ser Glu Asp Ser Asp Thr
275 280 285
Gln Ser Val Ser Ala His Gly Gln Ala Gly Ser His Gln Gln Ser His
290 295 300
Gln Glu Ser Ala Arg Gly Arg Ser Gly Glu Thr Ser Gly His Ser Gly
305 310 315 320
Ser Phe Leu Tyr

<210> 47
<211> 324
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 47
Gln Val Ser Thr His Glu Gln Ser Glu Ser Ser His Gly Trp Thr Gly
1 5 10 15
Pro Ser Thr Arg Gly Arg Gln Gly Ser Arg His Glu Gln Ala Gln Asp
20 25 30
Ser Ser Arg His Ser Ala Ser Gln Asp Gly Gln Asp Thr Ile Arg Gly
35 40 45
His Pro Gly Ser Ser Arg Gly Gly Arg Gln Gly Tyr His His Glu His
50 55 60
Ser Val Asp Ser Ser Gly His Ser Gly Ser His His Ser His Thr Thr
65 70 75 80
Ser Gln Gly Arg Ser Asp Ala Ser Arg Gly Gln Ser Gly Ser Arg Ser
85 90 95
Ala Ser Arg Thr Thr Arg Asn Glu Glu Gln Ser Gly Asp Gly Ser Arg
100 105 110
His Ser Gly Ser Arg His His Glu Ala Ser Thr His Ala Asp Ile Ser
115 120 125
Arg His Ser Gln Ala Val Gln Gly Gln Ser Glu Gly Ser Arg Arg Ser
130 135 140
Arg Arg Gln Gly Ser Ser Val Ser Gln Asp Ser Asp Ser Glu Gly His
145 150 155 160
Ser Glu Asp Ser Glu Arg Trp Ser Gly Ser Ala Ser Arg Asn His His
165 170 175
Gly Ser Ala Gln Glu Gln Leu Arg Asp Gly Ser Arg His Pro Arg Ser
180 185 190
His Gln Glu Asp Arg Ala Gly His Gly His Ser Ala Asp Ser Ser Arg
195 200 205
Gln Ser Gly Thr Arg His Thr Gln Thr Ser Ser Gly Gly Gln Ala Ala
210 215 220
Ser Ser His Glu Gln Ala Arg Ser Ser Ala Gly Glu Arg His Gly Ser
225 230 235 240
His His Gln Gln Ser Ala Asp Ser Ser Arg His Ser Gly Ile Gly His
245 250 255
Gly Gln Ala Ser Ser Ala Val Arg Asp Ser Gly His Arg Gly Tyr Ser
260 265 270
Gly Ser Gln Ala Ser Asp Asn Glu Gly His Ser Glu Asp Ser Asp Thr
275 280 285
Gln Ser Val Ser Ala His Gly Gln Ala Gly Ser His Gln Gln Ser His
290 295 300
Gln Glu Ser Ala Arg Gly Arg Ser Gly Glu Thr Ser Gly His Ser Gly
305 310 315 320
Ser Phe Leu Tyr

<210> 48
<211> 324
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 48
Gln Val Ser Thr His Glu Gln Ser Glu Ser Ser His Gly Trp Thr Gly
1 5 10 15
Pro Ser Thr Arg Gly Arg Gln Gly Ser Arg His Glu Gln Ala Gln Asp
20 25 30
Ser Ser Arg His Ser Ala Ser Gln Tyr Gly Gln Asp Thr Ile Arg Gly
35 40 45
His Pro Gly Ser Ser Arg Gly Gly Arg Gln Gly Tyr His His Glu His
50 55 60
Ser Val Asp Ser Ser Gly His Ser Gly Ser His His Ser His Thr Thr
65 70 75 80
Ser Gln Gly Arg Ser Asp Ala Ser Arg Gly Gln Ser Gly Ser Arg Ser
85 90 95
Ala Ser Arg Thr Thr Arg Asn Glu Glu Gln Ser Gly Asp Ser Ser Arg
100 105 110
His Ser Val Ser Arg His His Glu Ala Ser Thr His Ala Asp Ile Ser
115 120 125
Arg His Ser Gln Ala Val Gln Gly Gln Ser Glu Gly Ser Arg Arg Ser
130 135 140
Arg Arg Gln Gly Ser Ser Val Ser Gln Asp Ser Asp Ser Glu Gly His
145 150 155 160
Ser Glu Asp Ser Glu Arg Trp Ser Gly Ser Ala Ser Arg Asn His Arg
165 170 175
Gly Ser Val Gln Glu Gln Ser Arg His Gly Ser Arg His Pro Arg Ser
180 185 190
His His Glu Asp Arg Ala Gly His Gly His Ser Ala Asp Arg Ser Arg
195 200 205
Gln Ser Gly Thr Arg His Ala Glu Thr Ser Ser Gly Gly Gln Ala Ala
210 215 220
Ser Ser His Glu Gln Ala Arg Ser Ser Pro Gly Glu Arg His Gly Ser
225 230 235 240
Arg His Gln Gln Ser Ala Asp Ser Ser Arg His Ser Gly Ile Pro Arg
245 250 255
Gly Gln Ala Ser Ser Ala Val Arg Asp Ser Arg His Trp Gly Ser Ser
260 265 270
Gly Ser Gln Ala Ser Asp Ser Glu Gly His Ser Glu Glu Ser Asp Thr
275 280 285
Gln Ser Val Ser Gly His Gly Gln Ala Gly Pro His Gln Gln Ser His
290 295 300
Gln Glu Ser Ala Arg Asp Arg Ser Gly Gly Arg Ser Gly Arg Ser Gly
305 310 315 320
Ser Phe Leu Tyr

<210> 49
<211> 324
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 49
Gln Val Ser Thr His Glu Gln Ser Glu Ser Ala His Gly Arg Thr Arg
1 5 10 15
Thr Ser Thr Gly Arg Arg Gln Gly Ser His His Glu Gln Ala Arg Asp
20 25 30
Ser Ser Arg His Ser Ala Ser Gln Glu Gly Gln Asp Thr Ile Arg Gly
35 40 45
His Pro Gly Ser Ser Arg Arg Gly Arg Gln Gly Ser His Tyr Glu Gln
50 55 60
Ser Val Asp Arg Ser Gly His Ser Gly Ser His His Ser His Thr Thr
65 70 75 80
Ser Gln Gly Arg Ser Asp Ala Ser Arg Gly Gln Ser Gly Ser Arg Ser
85 90 95
Ala Ser Arg Gln Thr Arg Asn Asp Glu Gln Ser Gly Asp Gly Ser Arg
100 105 110
His Ser Trp Ser His His His Glu Ala Ser Thr Gln Ala Asp Ser Ser
115 120 125
Arg His Ser Gln Ser Gly Gln Gly Gln Ser Ala Gly Pro Arg Thr Ser
130 135 140
Arg Asn Gln Gly Ser Ser Val Ser Gln Asp Ser Asp Ser Gln Gly His
145 150 155 160
Ser Glu Asp Ser Glu Arg Trp Ser Gly Ser Ala Ser Arg Asn His Arg
165 170 175
Gly Ser Ala Gln Glu Gln Ser Arg Asp Gly Ser Arg His Pro Thr Ser
180 185 190
His His Glu Asp Arg Ala Gly His Gly His Ser Ala Glu Ser Ser Arg
195 200 205
Gln Ser Gly Thr His His Ala Glu Asn Ser Ser Gly Gly Gln Ala Ala
210 215 220
Ser Ser His Glu Gln Ala Arg Ser Ser Ala Gly Glu Arg His Gly Ser
225 230 235 240
His His Gln Gln Ser Ala Asp Ser Ser Arg His Ser Gly Ile Gly His
245 250 255
Gly Gln Ala Ser Ser Ala Val Arg Asp Ser Gly His Arg Gly Ser Ser
260 265 270
Gly Ser Gln Ala Ser Asp Ser Glu Gly His Ser Glu Asp Ser Asp Thr
275 280 285
Gln Ser Val Ser Ala His Gly Gln Ala Gly Pro His Gln Gln Ser His
290 295 300
Gln Glu Ser Thr Arg Gly Arg Ser Ala Gly Arg Ser Gly Arg Ser Gly
305 310 315 320
Ser Phe Leu Tyr

<210> 50
<211> 2391
<212> PRT
<213> Homo sapiens
<400> 50
Met Thr Asp Leu Leu Arg Ser Val Val Thr Val Ile Asp Val Phe Tyr
1 5 10 15
Lys Tyr Thr Lys Gln Asp Gly Glu Cys Gly Thr Leu Ser Lys Gly Glu
20 25 30
Leu Lys Glu Leu Leu Glu Lys Glu Leu His Pro Val Leu Lys Asn Pro
35 40 45
Asp Asp Pro Asp Thr Val Asp Val Ile Met His Met Leu Asp Arg Asp
50 55 60
His Asp Arg Arg Leu Asp Phe Thr Glu Phe Leu Leu Met Ile Phe Lys
65 70 75 80
Leu Thr Met Ala Cys Asn Lys Val Leu Ser Lys Glu Tyr Cys Lys Ala
85 90 95
Ser Gly Ser Lys Lys His Arg Arg Gly His Arg His Gln Glu Glu Glu
100 105 110
Ser Glu Thr Glu Glu Asp Glu Glu Asp Thr Pro Gly His Lys Ser Gly
115 120 125
Tyr Arg His Ser Ser Trp Ser Glu Gly Glu Glu His Gly Tyr Ser Ser
130 135 140
Gly His Ser Arg Gly Thr Val Lys Cys Arg His Gly Ser Asn Ser Arg
145 150 155 160
Arg Leu Gly Arg Gln Gly Asn Leu Ser Ser Ser Gly Asn Gln Glu Gly
165 170 175
Ser Gln Lys Arg Tyr His Arg Ser Ser Cys Gly His Ser Trp Ser Gly
180 185 190
Gly Lys Asp Arg His Gly Ser Ser Ser Val Glu Leu Arg Glu Arg Ile
195 200 205
Asn Lys Ser His Ile Ser Pro Ser Arg Glu Ser Gly Glu Glu Tyr Glu
210 215 220
Ser Gly Ser Gly Ser Asn Ser Trp Glu Arg Lys Gly His Gly Gly Leu
225 230 235 240
Ser Cys Gly Leu Glu Thr Ser Gly His Glu Ser Asn Ser Thr Gln Ser
245 250 255
Arg Ile Arg Glu Gln Lys Leu Gly Ser Ser Cys Ser Gly Ser Gly Asp
260 265 270
Ser Gly Arg Arg Ser His Ala Cys Gly Tyr Ser Asn Ser Ser Gly Cys
275 280 285
Gly Arg Pro Gln Asn Ala Ser Ser Ser Cys Gln Ser His Arg Phe Gly
290 295 300
Gly Gln Gly Asn Gln Phe Ser Tyr Ile Gln Ser Gly Cys Gln Ser Gly
305 310 315 320
Ile Lys Gly Gly Gln Gly His Gly Cys Val Ser Gly Gly Gln Pro Ser
325 330 335
Gly Cys Gly Gln Pro Glu Ser Asn Pro Cys Ser Gln Ser Tyr Ser Gln
340 345 350
Arg Gly Tyr Gly Ala Arg Glu Asn Gly Gln Pro Gln Asn Cys Gly Gly
355 360 365
Gln Trp Arg Thr Gly Ser Ser Gln Ser Ser Cys Cys Gly Gln Tyr Gly
370 375 380
Ser Gly Gly Ser Gln Ser Cys Ser Asn Gly Gln His Glu Tyr Gly Ser
385 390 395 400
Cys Gly Arg Phe Ser Asn Ser Ser Ser Ser Asn Glu Phe Ser Lys Cys
405 410 415
Asp Gln Tyr Gly Ser Gly Ser Ser Gln Ser Thr Ser Phe Glu Gln His
420 425 430
Gly Thr Gly Leu Ser Gln Ser Ser Gly Phe Glu Gln His Val Cys Gly
435 440 445
Ser Gly Gln Thr Cys Gly Gln His Glu Ser Thr Ser Ser Gln Ser Leu
450 455 460
Gly Tyr Asp Gln His Gly Ser Ser Ser Gly Lys Thr Ser Gly Phe Gly
465 470 475 480
Gln His Gly Ser Gly Ser Gly Gln Ser Ser Gly Phe Gly Gln Cys Gly
485 490 495
Ser Gly Ser Gly Gln Ser Ser Gly Phe Gly Gln His Gly Ser Val Ser
500 505 510
Gly Gln Ser Ser Gly Phe Gly Gln His Gly Ser Val Ser Gly Gln Ser
515 520 525
Ser Gly Phe Gly Gln His Glu Ser Arg Ser Arg Gln Ser Ser Tyr Gly
530 535 540
Gln His Gly Ser Gly Ser Ser Gln Ser Ser Gly Tyr Gly Gln Tyr Gly
545 550 555 560
Ser Arg Glu Thr Ser Gly Phe Gly Gln His Gly Leu Gly Ser Gly Gln
565 570 575
Ser Thr Gly Phe Gly Gln Tyr Gly Ser Gly Ser Gly Gln Ser Ser Gly
580 585 590
Phe Gly Gln His Gly Ser Gly Ser Gly Gln Ser Ser Gly Phe Gly Gln
595 600 605
His Glu Ser Arg Ser Gly Gln Ser Ser Tyr Gly Gln His Ser Ser Gly
610 615 620
Ser Ser Gln Ser Ser Gly Tyr Gly Gln His Gly Ser Arg Gln Thr Ser
625 630 635 640
Gly Phe Gly Gln His Gly Ser Gly Ser Ser Gln Ser Thr Gly Phe Gly
645 650 655
Gln Tyr Gly Ser Gly Ser Gly Gln Ser Ser Gly Phe Gly Gln His Val
660 665 670
Ser Gly Ser Gly Gln Ser Ser Gly Phe Gly Gln His Glu Ser Arg Ser
675 680 685
Gly His Ser Ser Tyr Gly Gln His Gly Phe Gly Ser Ser Gln Ser Ser
690 695 700
Gly Tyr Gly Gln His Gly Ser Ser Ser Gly Gln Thr Ser Gly Phe Gly
705 710 715 720
Gln His Glu Leu Ser Ser Gly Gln Ser Ser Ser Phe Gly Gln His Gly
725 730 735
Ser Gly Ser Gly Gln Ser Ser Gly Phe Gly Gln His Gly Ser Gly Ser
740 745 750
Gly Gln Ser Ser Gly Phe Gly Gln His Glu Ser Arg Ser Gly Gln Ser
755 760 765
Ser Tyr Gly Gln His Ser Ser Gly Ser Ser Gln Ser Ser Gly Tyr Gly
770 775 780
Gln His Gly Ser Arg Gln Thr Ser Gly Phe Gly Gln His Gly Ser Gly
785 790 795 800
Ser Ser Gln Ser Thr Gly Phe Gly Gln Tyr Gly Ser Gly Ser Gly Gln
805 810 815
Ser Ala Gly Phe Gly Gln His Gly Ser Gly Ser Gly Gln Ser Ser Gly
820 825 830
Phe Gly Gln His Glu Ser Arg Ser His Gln Ser Ser Tyr Gly Gln His
835 840 845
Gly Ser Gly Ser Ser Gln Ser Ser Gly Tyr Gly Gln His Gly Ser Ser
850 855 860
Ser Gly Gln Thr Ser Gly Phe Gly Gln His Arg Ser Ser Ser Gly Gln
865 870 875 880
Tyr Ser Gly Phe Gly Gln His Gly Ser Gly Ser Gly Gln Ser Ser Gly
885 890 895
Phe Gly Gln His Gly Thr Gly Ser Gly Gln Tyr Ser Gly Phe Gly Gln
900 905 910
His Glu Ser Arg Ser His Gln Ser Ser Tyr Gly Gln His Gly Ser Gly
915 920 925
Ser Ser Gln Ser Ser Gly Tyr Gly Gln His Gly Ser Ser Ser Gly Gln
930 935 940
Thr Phe Gly Phe Gly Gln His Arg Ser Gly Ser Gly Gln Ser Ser Gly
945 950 955 960
Phe Gly Gln His Gly Ser Gly Ser Gly Gln Ser Ser Gly Phe Gly Gln
965 970 975
His Glu Ser Gly Ser Gly Lys Ser Ser Gly Phe Gly Gln His Glu Ser
980 985 990
Arg Ser Ser Gln Ser Asn Tyr Gly Gln His Gly Ser Gly Ser Ser Gln
995 1000 1005
Ser Ser Gly Tyr Gly Gln His Gly Ser Ser Ser Gly Gln Thr Thr Gly
1010 1015 1020
Phe Gly Gln His Arg Ser Ser Ser Gly Gln Tyr Ser Gly Phe Gly Gln
1025 1030 1035 1040
His Gly Ser Gly Ser Asp Gln Ser Ser Gly Phe Gly Gln His Gly Thr
1045 1050 1055
Gly Ser Gly Gln Ser Ser Gly Phe Gly Gln Tyr Glu Ser Arg Ser Arg
1060 1065 1070
Gln Ser Ser Tyr Gly Gln His Gly Ser Gly Ser Ser Gln Ser Ser Gly
1075 1080 1085
Tyr Gly Gln His Gly Ser Asn Ser Gly Gln Thr Ser Gly Phe Gly Gln
1090 1095 1100
His Arg Pro Gly Ser Gly Gln Ser Ser Gly Phe Gly Gln Tyr Gly Ser
1105 1110 1115 1120
Gly Ser Gly Gln Ser Ser Gly Phe Gly Gln His Gly Ser Gly Thr Gly
1125 1130 1135
Lys Ser Ser Gly Phe Ala Gln His Glu Tyr Arg Ser Gly Gln Ser Ser
1140 1145 1150
Tyr Gly Gln His Gly Thr Gly Ser Ser Gln Ser Ser Gly Cys Gly Gln
1155 1160 1165
His Glu Ser Gly Ser Gly Pro Thr Thr Ser Phe Gly Gln His Val Ser
1170 1175 1180
Gly Ser Asp Asn Phe Ser Ser Ser Gly Gln His Ile Ser Asp Ser Gly
1185 1190 1195 1200
Gln Ser Thr Gly Phe Gly Gln Tyr Gly Ser Gly Ser Gly Gln Ser Thr
1205 1210 1215
Gly Leu Gly Gln Gly Glu Ser Gln Gln Val Glu Ser Gly Ser Thr Val
1220 1225 1230
His Gly Arg Gln Glu Thr Thr His Gly Gln Thr Ile Asn Thr Thr Arg
1235 1240 1245
His Ser Gln Ser Gly Gln Gly Gln Ser Thr Gln Thr Gly Ser Arg Val
1250 1255 1260
Thr Arg Arg Arg Arg Ser Ser Gln Ser Glu Asn Ser Asp Ser Glu Val
1265 1270 1275 1280
His Ser Lys Val Ser His Arg His Ser Glu His Ile His Thr Gln Ala
1285 1290 1295
Gly Ser His Tyr Pro Lys Ser Gly Ser Thr Val Arg Arg Arg Gln Gly
1300 1305 1310
Thr Thr His Gly Gln Arg Gly Asp Thr Thr Arg His Gly His Ser Gly
1315 1320 1325
His Gly Gln Ser Thr Gln Thr Gly Ser Arg Thr Ser Gly Arg Gln Arg
1330 1335 1340
Phe Ser His Ser Asp Ala Thr Asp Ser Glu Val His Ser Gly Val Ser
1345 1350 1355 1360
His Arg Pro His Ser Gln Glu Gln Thr His Ser Gln Ala Gly Ser Gln
1365 1370 1375
His Gly Glu Ser Glu Ser Thr Val His Glu Arg His Glu Thr Thr Tyr
1380 1385 1390
Gly Gln Thr Gly Glu Ala Thr Gly His Gly His Ser Gly His Gly Gln
1395 1400 1405
Ser Thr Gln Arg Gly Ser Arg Thr Thr Gly Arg Arg Gly Ser Gly His
1410 1415 1420
Ser Glu Ser Ser Asp Ser Glu Val His Ser Gly Gly Ser His Arg Pro
1425 1430 1435 1440
Gln Ser Gln Glu Gln Thr His Gly Gln Ala Gly Ser Gln His Gly Glu
1445 1450 1455
Ser Gly Ser Thr Val His Gly Arg His Gly Thr Thr His Gly Gln Thr
1460 1465 1470
Gly Asp Thr Thr Arg His Ala His Tyr His His Gly Lys Ser Thr Gln
1475 1480 1485
Arg Gly Ser Ser Thr Thr Gly Arg Arg Gly Ser Gly His Ser Glu Ser
1490 1495 1500
Ser Asp Ser Glu Val His Ser Gly Gly Ser His Thr His Ser Gly His
1505 1510 1515 1520
Thr His Gly Gln Ser Gly Ser Gln His Gly Glu Ser Glu Ser Ile Ile
1525 1530 1535
His Asp Arg His Arg Ile Thr His Gly Gln Thr Gly Asp Thr Thr Arg
1540 1545 1550
His Ser Tyr Ser Gly His Glu Gln Thr Thr Gln Thr Gly Ser Arg Thr
1555 1560 1565
Thr Gly Arg Gln Arg Thr Ser His Ser Glu Ser Thr Asp Ser Glu Val
1570 1575 1580
His Ser Gly Gly Ser His Arg Pro His Ser Arg Glu His Thr Tyr Gly
1585 1590 1595 1600
Gln Ala Gly Ser Gln His Glu Glu Pro Glu Phe Thr Val His Glu Arg
1605 1610 1615
His Gly Thr Thr His Gly Gln Ile Gly Asp Thr Thr Gly His Ser His
1620 1625 1630
Ser Gly His Gly Gln Ser Thr Gln Arg Gly Ser Arg Thr Thr Gly Arg
1635 1640 1645
Gln Arg Ser Ser His Ser Glu Ser Ser Asp Ser Glu Val His Ser Gly
1650 1655 1660
Val Ser His Thr His Thr Gly His Thr His Gly Gln Ala Gly Ser Gln
1665 1670 1675 1680
His Gly Gln Ser Glu Ser Ile Val Pro Glu Arg His Gly Thr Thr His
1685 1690 1695
Gly Gln Thr Gly Asp Thr Thr Arg His Ala His Tyr His His Gly Leu
1700 1705 1710
Thr Thr Gln Thr Gly Ser Arg Thr Thr Gly Arg Arg Gly Ser Gly His
1715 1720 1725
Ser Glu Tyr Ser Asp Ser Glu Gly Tyr Ser Gly Val Ser His Thr His
1730 1735 1740
Ser Gly His Thr His Gly Gln Ala Arg Ser Gln His Gly Glu Ser Glu
1745 1750 1755 1760
Ser Ile Val His Glu Arg His Gly Thr Ile His Gly Gln Thr Gly Asp
1765 1770 1775
Thr Thr Arg His Ala His Ser Gly His Gly Gln Ser Thr Gln Thr Gly
1780 1785 1790
Ser Arg Thr Thr Gly Arg Arg Ser Ser Gly His Ser Glu Tyr Ser Asp
1795 1800 1805
Ser Glu Gly His Ser Gly Phe Ser Gln Arg Pro His Ser Arg Gly His
1810 1815 1820
Thr His Gly Gln Ala Gly Ser Gln His Gly Glu Ser Glu Ser Ile Val
1825 1830 1835 1840
Asp Glu Arg His Gly Thr Thr His Gly Gln Thr Gly Asp Thr Ser Gly
1845 1850 1855
His Ser Gln Ser Gly His Gly Gln Ser Thr Gln Ser Gly Ser Ser Thr
1860 1865 1870
Thr Gly Arg Arg Arg Ser Gly His Ser Glu Ser Ser Asp Ser Glu Val
1875 1880 1885
His Ser Gly Gly Ser His Thr His Ser Gly His Thr His Ser Gln Ala
1890 1895 1900
Arg Ser Gln His Gly Glu Ser Glu Ser Thr Val His Lys Arg His Gln
1905 1910 1915 1920
Thr Thr His Gly Gln Thr Gly Asp Thr Thr Glu His Gly His Pro Ser
1925 1930 1935
His Gly Gln Thr Ile Gln Thr Gly Ser Arg Thr Thr Gly Arg Arg Gly
1940 1945 1950
Ser Gly His Ser Glu Tyr Ser Asp Ser Glu Gly Pro Ser Gly Val Ser
1955 1960 1965
His Thr His Ser Gly His Thr His Gly Gln Ala Gly Ser His Tyr Pro
1970 1975 1980
Glu Ser Gly Ser Ser Val His Glu Arg His Gly Thr Thr His Gly Gln
1985 1990 1995 2000
Thr Ala Asp Thr Thr Arg His Gly His Ser Gly His Gly Gln Ser Thr
2005 2010 2015
Gln Arg Gly Ser Arg Thr Thr Gly Arg Arg Ala Ser Gly His Ser Glu
2020 2025 2030
Tyr Ser Asp Ser Glu Gly His Ser Gly Val Ser His Thr His Ser Gly
2035 2040 2045
His Ala His Gly Gln Ala Gly Ser Gln His Gly Glu Ser Gly Ser Ser
2050 2055 2060
Val His Glu Arg His Gly Thr Thr His Gly Gln Thr Gly Asp Thr Thr
2065 2070 2075 2080
Arg His Ala His Ser Gly His Gly Gln Ser Thr Gln Arg Gly Ser Arg
2085 2090 2095
Thr Ala Gly Arg Arg Gly Ser Gly His Ser Glu Ser Ser Asp Ser Glu
2100 2105 2110
Val His Ser Gly Val Ser His Thr His Ser Gly His Thr Tyr Gly Gln
2115 2120 2125
Ala Arg Ser Gln His Gly Glu Ser Gly Ser Ala Ile His Gly Arg Gln
2130 2135 2140
Gly Thr Ile His Gly Gln Thr Gly Asp Thr Thr Arg His Gly Gln Ser
2145 2150 2155 2160
Gly His Gly Gln Ser Thr Gln Thr Gly Ser Arg Thr Thr Gly Arg Gln
2165 2170 2175
Arg Ser Ser His Ser Glu Ser Ser Asp Ser Glu Val His Ser Glu Ala
2180 2185 2190
Ser Pro Thr His Ser Gly His Thr His Ser Gln Ala Gly Ser Arg His
2195 2200 2205
Gly Gln Ser Gly Ser Ser Gly His Gly Arg Gln Gly Thr Thr His Gly
2210 2215 2220
Gln Thr Gly Asp Thr Thr Arg His Ala His Tyr Gly Tyr Gly Gln Ser
2225 2230 2235 2240
Thr Gln Arg Gly Ser Arg Thr Thr Gly Arg Arg Gly Ser Gly His Ser
2245 2250 2255
Glu Ser Ser Asp Ser Glu Val His Ser Trp Gly Ser His Thr His Ser
2260 2265 2270
Gly His Ile Gln Gly Gln Ala Gly Ser Gln Gln Arg Gln Pro Gly Ser
2275 2280 2285
Thr Val His Gly Arg Leu Glu Thr Thr His Gly Gln Thr Gly Asp Thr
2290 2295 2300
Thr Arg His Gly His Ser Gly Tyr Gly Gln Ser Thr Gln Thr Gly Ser
2305 2310 2315 2320
Arg Ser Ser Arg Ala Ser His Phe Gln Ser His Ser Ser Glu Arg Gln
2325 2330 2335
Arg His Gly Ser Ser Gln Val Trp Lys His Gly Ser Tyr Gly Pro Ala
2340 2345 2350
Glu Tyr Asp Tyr Gly His Thr Gly Tyr Gly Pro Ser Gly Gly Ser Arg
2355 2360 2365
Lys Ser Ile Ser Asn Ser His Leu Ser Trp Ser Thr Asp Ser Thr Ala
2370 2375 2380
Asn Lys Gln Leu Ser Arg His
2385 2390
図1-1】
図1-2】
図1-3】
図2
図3
図4
図5
図6A
図6B
図6C
図7A
図7B
図7C
図7D
図8-1】
図8-2】
図8-3】
【配列表】
2024063082000001.app
【手続補正書】
【提出日】2024-03-22
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
フィラグリンポリペプチドをコードする1つ以上のポリヌクレオチドを含む、組換えヘルペスウイルスゲノム。
【請求項2】
フィラグリンポリペプチドをコードする2つ以上のポリヌクレオチドを含む、請求項1に記載の組換えヘルペスウイルスゲノム。
【請求項3】
組換え単純ヘルペスウイルスゲノムである、任意で、前記組換え単純ヘルペスウイルスゲノムが組換え単純ヘルペスウイルス1型(HSV-1)ゲノムである、請求項1または2に記載の組換えヘルペスウイルスゲノム。
【請求項4】
前記組換え単純ヘルペスウイルスゲノムが不活性化変異を含み、任意で、前記不活性化変異が、感染細胞タンパク質(ICP)0、ICP4、ICP22、ICP27、ICP47、チミジンキナーゼ(tk)、ロングユニーク領域(UL)41、及びUL55からなる群から選択される単純ヘルペスウイルス遺伝子に存在する、請求項3に記載の組換えヘルペスウイルスゲノム。
【請求項5】
前記組換え単純ヘルペスウイルスゲノムが、ICP4遺伝子の一方または両方のコピーに不活性化変異を含む、または、前記組換え単純ヘルペスウイルスゲノムが、ICP22遺伝子に不活性化変異を含む、請求項4に記載の組換えヘルペスウイルスゲノム。
【請求項6】
前記フィラグリンポリペプチドがヒトフィラグリンポリペプチドである、請求項1~5のいずれか1項に記載の組換えヘルペスウイルスゲノム。
【請求項7】
前記フィラグリンポリペプチドが、配列番号39~50からなる群から選択されるアミノ酸配列に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む、請求項に記載の組換えヘルペスウイルスゲノム。
【請求項8】
コラーゲンアルファ-1(VII)鎖ポリペプチド、リシルヒドロキシラーゼ3ポリペプチド、またはケラチンI型細胞骨格17ポリペプチドをコードするポリヌクレオチドを含まない、請求項1~7のいずれか1項に記載の組換えヘルペスウイルスゲノム。
【請求項9】
請求項のいずれか1項に記載の組換えヘルペスウイルスゲノムを含む、ヘルペスウイルス。
【請求項10】
複製可能である、請求項9に記載のヘルペスウイルス。
【請求項11】
複製欠損である、請求項9に記載のヘルペスウイルス。
【請求項12】
対応する野生型ヘルペスウイルスと比較して減少した細胞毒性を有する、請求項9~11のいずれか1項に記載のヘルペスウイルス。
【請求項13】
単純ヘルペスウイルスである、任意で、前記単純ヘルペスウイルスがHSV-1である、請求項9~12のいずれか1項に記載のヘルペスウイルス。
【請求項14】
請求項のいずれか1項に記載の組換えヘルペスウイルスゲノムまたは請求項13のいずれか1項に記載のヘルペスウイルスと、薬学的に許容される賦形剤とを含む、薬学的組成物。
【請求項15】
局所、経皮、皮下、皮内、経口、舌下、口腔、直腸、膣内、吸入、静脈内、動脈内、筋肉内、心臓内、骨内、腹腔内、経粘膜、硝子体内、網膜下、関節内、関節周囲、局部、または皮膚上(epicutaneous)投与のための、請求項14に記載の薬学的組成物。
【請求項16】
メチルセルロースゲル、リン酸緩衝液、グリセロール、脂質担体、またはナノ粒子担体を含む、請求項14または15に記載の薬学的組成物。
【請求項17】
皮膚疾患の1つ以上の兆候または症状の予防的、姑息的、または治療的緩和を提供するための薬剤の製造における、請求項9~13のいずれか1項に記載のヘルペスウイルスまたは請求項14~16のいずれか1項に記載の薬学的組成物の、使用。
【請求項18】
その必要がある対象において皮膚疾患の1つ以上の兆候または症状の予防的、姑息的、または治療的緩和を提供するための薬学的組成物であって、請求項9~13のいずれか1項に記載のヘルペスウイルスを含むか、または請求項14~16のいずれか1項に記載の薬学的組成物である、前記薬学的組成物。
【請求項19】
前記皮膚疾患が、アトピー性皮膚炎、尋常性魚鱗癬、及び皮膚剥離症候群からなる群から選択される、請求項18に記載の薬学的組成物
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】配列表
【補正方法】変更
【補正の内容】
【配列表】
2024063082000001.xml