(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025032149
(43)【公開日】2025-03-11
(54)【発明の名称】ポンペ病を処置するための治療用アデノ随伴ウイルス
(51)【国際特許分類】
C12N 15/864 20060101AFI20250304BHJP
C12N 15/62 20060101ALI20250304BHJP
C12N 15/56 20060101ALI20250304BHJP
C12N 15/16 20060101ALI20250304BHJP
C12N 15/11 20060101ALI20250304BHJP
A61K 35/76 20150101ALI20250304BHJP
A61K 48/00 20060101ALI20250304BHJP
A61P 3/08 20060101ALI20250304BHJP
A61P 21/00 20060101ALI20250304BHJP
【FI】
C12N15/864 100Z
C12N15/62 Z ZNA
C12N15/56
C12N15/16
C12N15/11 Z
A61K35/76
A61K48/00
A61P3/08
A61P21/00
C12N15/62 Z
【審査請求】有
【請求項の数】1
【出願形態】OL
(21)【出願番号】P 2024204356
(22)【出願日】2024-11-25
(62)【分割の表示】P 2021526800の分割
【原出願日】2019-11-15
(31)【優先権主張番号】62/768,449
(32)【優先日】2018-11-16
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/769,702
(32)【優先日】2018-11-20
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】520375033
【氏名又は名称】アスクバイオ インコーポレイテッド
(74)【代理人】
【識別番号】100102978
【弁理士】
【氏名又は名称】清水 初志
(74)【代理人】
【識別番号】100205707
【弁理士】
【氏名又は名称】小寺 秀紀
(74)【代理人】
【識別番号】100160923
【弁理士】
【氏名又は名称】山口 裕孝
(74)【代理人】
【識別番号】100119507
【弁理士】
【氏名又は名称】刑部 俊
(74)【代理人】
【識別番号】100142929
【弁理士】
【氏名又は名称】井上 隆一
(74)【代理人】
【識別番号】100148699
【弁理士】
【氏名又は名称】佐藤 利光
(74)【代理人】
【識別番号】100128048
【弁理士】
【氏名又は名称】新見 浩一
(74)【代理人】
【識別番号】100129506
【弁理士】
【氏名又は名称】小林 智彦
(74)【代理人】
【識別番号】100114340
【弁理士】
【氏名又は名称】大関 雅人
(74)【代理人】
【識別番号】100121072
【弁理士】
【氏名又は名称】川本 和弥
(72)【発明者】
【氏名】オキャラハン マイケル ダブリュー.
(72)【発明者】
【氏名】フランソワ アシル
(57)【要約】 (修正有)
【課題】ポンペ病の処置のための遺伝子治療構築物、方法、および組成物を提供する。
【解決手段】酸性αグルコシダーゼ(GAA)ポリペプチドと融合したシグナルペプチドと任意でIGF-2配列とをコードする異種核酸を含む組換えAAV(rAVV)ゲノムを含み、該GAAポリペプチドが肝臓から分泌されかつリソソームへターゲティングされることを可能にする、rAAVベクターが提供される。具体的な態様は、GAAポリペプチドをコードするrAAVベクターに関し、該rAAVベクターが、肝臓分泌シグナルペプチド、およびヒトカチオン非依存性マンノース-6-リン酸受容体(CI-MPR)またはIGF2受容体と結合するターゲティングIGF2配列を有し、リソソームへの該GAAポリペプチドの適切な細胞内局在を可能にする。
【選択図】なし
【特許請求の範囲】
【請求項1】
そのゲノム内に
(a)5'および3'AAV末端逆位配列(ITR)、ならびに
(b)5'ITRと3'ITRとの間に位置する、分泌シグナルペプチドとαグルコシダーゼ(GAA)ポリペプチドとを含む融合ポリペプチドをコードする異種核酸配列であって、該異種核酸がプロモーターと機能的に連結されている、該異種核酸配列
を含む、組換えアデノ随伴ウイルス(AAV)ベクター。
【請求項2】
融合ポリペプチドをコードする前記異種核酸配列が、前記分泌シグナルペプチドと前記αグルコシダーゼ(GAA)ポリペプチドとの間に位置するIGF-2配列をさらに含む、請求項1記載の組換えAAVベクター。
【請求項3】
前記AAVのゲノムが、5'から3'への方向に、
(a)5'ITR、
(b)プロモーター配列、
(c)イントロン配列、
(d)分泌シグナルペプチドをコードする核酸、
(e)IGF-2配列をコードする核酸、
(f)αグルコシダーゼ(GAA)ポリペプチドをコードする核酸、
(g)ポリA配列、および
(h)3'ITR
を含む、請求項2記載の組換えAAVベクター。
【請求項4】
前記分泌シグナルペプチドが、AATシグナルペプチド、フィブロネクチンシグナルペプチド(FN)、GAAシグナルペプチド、または、分泌シグナル活性を有するそれらの活性断片より選択される、請求項1~3のいずれか一項記載の組換えAAVベクター。
【請求項5】
IGF-2リーダー配列が、ヒトカチオン非依存性マンノース-6-リン酸受容体(CI-MPR)またはIGF-2受容体と結合する、請求項1~3のいずれか一項記載の組換えAAVベクター。
【請求項6】
前記IGF-2配列が、SEQ ID NO:5を含むか、または前記IGF-2受容体と結合するSEQ ID NO:5において少なくとも1つのアミノ修飾を含む、請求項5記載の組換えAAVベクター。
【請求項7】
SEQ ID NO:5における前記少なくとも1つのアミノ修飾が、V43Mアミノ酸修飾(SEQ ID NO:8もしくはSEQ ID NO:9)またはΔ2-7(SEQ ID NO:6)またはΔ1-7(SEQ ID NO:7)である、請求項6記載の組換えAAVベクター。
【請求項8】
前記プロモーターが構成性、細胞特異的、または誘導性である、請求項1~3のいずれか一項記載の組換えAAVベクター。
【請求項9】
前記プロモーターが肝臓特異的プロモーターである、請求項1~3のいずれか一項記載の組換えAAVベクター。
【請求項10】
前記肝臓特異的プロモーターが、トランスサイレチンプロモーター(TTR)、LSPプロモーター(LSP)、合成肝臓特異的プロモーターのいずれかより選択される、請求項9記載の組換えAAVベクター。
【請求項11】
前記核酸配列が、野生型GAAポリペプチドまたは修飾型GAAポリペプチドをコードする、請求項1または2記載の組換えAAVベクター。
【請求項12】
前記GAAポリペプチドをコードする核酸配列が、ヒトGAA遺伝子またはヒトコドン最適化GAA遺伝子(coGAA)または修飾型GAA核酸配列である、請求項1~3のいずれか一項記載の組換えAAVベクター。
【請求項13】
前記GAAポリペプチドをコードする核酸配列が、インビボでの発現の増強のためにコドン最適化されている、請求項1~3または請求項12のいずれか一項記載の組換えAAVベクター。
【請求項14】
前記GAAポリペプチドをコードする核酸配列が、CpGアイランドを減少させるようにコドン最適化されている、請求項1~3または請求項12のいずれか一項記載の組換えAAVベクター。
【請求項15】
前記GAAポリペプチドをコードする核酸配列が、自然免疫応答を低下させるようにコドン最適化されている、請求項1~3または請求項12のいずれか一項記載の組換えAAVベクター。
【請求項16】
前記GAAポリペプチドをコードする核酸配列が、CpGアイランドを減少させかつ自然免疫応答を低下させるようにコドン最適化されている、請求項1~3または請求項12のいずれか一項記載の組換えAAVベクター。
【請求項17】
コードされた前記融合ポリペプチドが、前記GAAポリペプチドのアミノ末端側かつ前記IGF-2配列のC末端側に位置する少なくとも1アミノ酸に対するヌクレオチド配列を含むスペーサーをさらに含む、請求項1~3のいずれか一項記載の組換えAAVベクター。
【請求項18】
前記IGF-2配列をコードする核酸と前記GAAポリペプチドをコードする核酸との間に位置する、少なくとも1アミノ酸のスペーサーをコードする核酸をさらに含む、請求項3記載の組換えAAVベクター。
【請求項19】
前記GAA遺伝子をコードする核酸の3'側かつ前記3'ITR配列の5'側に位置する少なくとも1つのポリA配列をさらに含む、請求項1~3のいずれか一項記載の組換えAAVベクター。
【請求項20】
前記異種核酸配列が、前記GAAポリペプチドをコードする核酸の3'側かつ前記3'ITR配列の5'側に位置するコラーゲン安定性(CS)配列をさらに含む、請求項1~3のいずれか一項記載の組換えAAVベクター。
【請求項21】
前記GAAポリペプチドをコードする核酸と前記ポリA配列との間に位置するコラーゲン安定性(CS)配列をコードする核酸をさらに含む、請求項3または20記載の組換えAAVベクター。
【請求項22】
前記分泌シグナルペプチドをコードする配列の5'側かつ前記プロモーターの3'側に位置するイントロン配列をさらに含む、請求項1~3のいずれか一項記載の組換えAAVベクター。
【請求項23】
前記イントロン配列がMVM配列またはHBB2配列を含む、請求項22記載の組換えAAVベクター。
【請求項24】
前記ITR配列が挿入、欠失、または置換を含む、請求項1~3のいずれか一項記載の組換えAAVベクター。
【請求項25】
前記ITR内の1つまたは複数のCpGアイランドが除去されている、請求項24記載の組換えAAVベクター。
【請求項26】
前記分泌シグナルペプチドが、フィブロネクチンシグナルペプチド(FN1)、または分泌シグナル活性を有するその活性断片であり、かつ前記IGF-2配列が、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、またはSEQ ID NO:9のいずれかより選択される、請求項1~3のいずれか一項記載の組換えAAVベクター。
【請求項27】
コードされた前記分泌シグナルペプチドが、AATシグナルペプチド、または分泌シグナル活性を有するその活性断片であり、かつ前記IGF-2配列が、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、またはSEQ ID NO:9のいずれかより選択される、請求項1~3のいずれか一項記載の組換えAAVベクター。
【請求項28】
前記IGF-2配列がSEQ ID NO:8またはSEQ ID NO:9である、請求項26または27記載の組換えAAVベクター。
【請求項29】
キメラAAVベクター、ハプロイドAAVベクター、ハイブリッドAAVベクター、またはポリプロイドAAVベクターである、請求項1~3のいずれか一項記載の組換えAAVベクター。
【請求項30】
表1にリストされたものおよびそれらの任意の組み合わせからなる群における任意のAAV血清型より選択されるカプシドタンパク質を含む、請求項1~3のいずれか一項記載の組換えAAVベクター。
【請求項31】
前記血清型がAAV3bである、請求項30記載の組換えAAVベクター。
【請求項32】
AAV3b血清型が、265D、549A、Q263Yのいずれかより選択されるカプシドタンパク質において1つまたは複数の変異を含む、請求項31記載の組換えAAVベクター。
【請求項33】
AAV3b血清型が、AAV3b265D、AAV3b265D549A、AAV3b549A、またはAAV3bQ263Y、またはAAV3bSASTGのいずれかより選択される、請求項31記載の組換えAAVベクター。
【請求項34】
そのゲノム内に
(a)5'および3'AAV末端逆位配列(ITR)、ならびに
(b)5'ITRと3'ITRとの間に位置する、αグルコシダーゼ(GAA)ポリペプチドを含む融合ポリペプチドをコードする異種核酸配列であって、該異種核酸が肝臓特異的プロモーターと機能的に連結されている、該異種核酸配列
を含み、
AAV3b血清型のカプシドタンパク質を含む、
組換えアデノ随伴ウイルス(AAV)ベクター。
【請求項35】
前記融合ポリペプチドが、前記GAAポリペプチドのN末端側に位置する分泌シグナルペプチドをさらに含む、請求項34記載の組換えAAVベクター。
【請求項36】
融合ポリペプチドをコードする前記異種核酸配列が、前記分泌シグナルペプチドと前記αグルコシダーゼ(GAA)ポリペプチドとの間に位置するIGF-2配列をさらに含む、請求項34記載の組換えAAVベクター。
【請求項37】
前記AAVのゲノムが、5'から3'への方向に、
(a)5'ITR、
(b)肝臓特異的プロモーター配列、
(c)イントロン配列、
(d)分泌シグナルペプチドをコードする核酸、
(e)IGF-2配列をコードする核酸、
(f)αグルコシダーゼ(GAA)ポリペプチドをコードする核酸、
(g)ポリA配列、および
(h)3'ITR
を含む、請求項34記載の組換えAAVベクター。
【請求項38】
前記分泌シグナルペプチドが、AATシグナルペプチド、フィブロネクチンシグナルペプチド(FN)、GAAシグナルペプチド、または、分泌シグナル活性を有するそれらの活性断片より選択される、請求項34~37のいずれか一項記載の組換えAAVベクター。
【請求項39】
IGF-2リーダー配列が、ヒトカチオン非依存性マンノース-6-リン酸受容体(CI-MPR)またはIGF-2受容体と結合する、請求項34~37のいずれか一項記載の組換えAAVベクター。
【請求項40】
前記IGF-2配列が、SEQ ID NO:5を含むか、または、SEQ ID NO:5において、前記IGF-2受容体との結合に影響を与える少なくとも1つのアミノ修飾を含む、請求項39記載の組換えAAVベクター。
【請求項41】
SEQ ID NO:5における前記少なくとも1つのアミノ修飾が、V43Mアミノ酸修飾(SEQ ID NO:8もしくはSEQ ID NO:9)またはΔ2-7(SEQ ID NO:6)またはΔ1-7(SEQ ID NO:7)である、請求項40記載の組換えAAVベクター。
【請求項42】
前記肝臓特異的プロモーターが、トランスサイレチンプロモーター(TTR)、LSPプロモーター(LSP)、合成肝臓特異的プロモーターのいずれかより選択される、請求項34~41のいずれか一項記載の組換えAAVベクター。
【請求項43】
前記核酸配列が、野生型GAAポリペプチドまたは修飾型GAAポリペプチドをコードする、請求項34~42のいずれか一項記載の組換えAAVベクター。
【請求項44】
前記GAAポリペプチドをコードする核酸配列が、ヒトGAA遺伝子またはヒトコドン最適化GAA遺伝子(coGAA)または修飾型GAA核酸配列である、請求項34~43のいずれか一項記載の組換えAAVベクター。
【請求項45】
前記GAAポリペプチドをコードする核酸配列が、インビボでの発現の増強のためにコドン最適化されている、請求項34~44のいずれか一項記載の組換えAAVベクター。
【請求項46】
前記GAAポリペプチドをコードする核酸配列が、CpGアイランドを減少させるようにコドン最適化されている、請求項34~44のいずれか一項記載の組換えAAVベクター。
【請求項47】
前記GAAポリペプチドをコードする核酸配列が、自然免疫応答を低下させるようにコドン最適化されている、請求項34~44のいずれか一項記載の組換えAAVベクター。
【請求項48】
前記GAAポリペプチドをコードする核酸配列が、CpGアイランドを減少させかつ自然免疫応答を低下させるようにコドン最適化されている、請求項34~44のいずれか一項記載の組換えAAVベクター。
【請求項49】
前記イントロン配列がMVM配列またはHBB2配列を含む、請求項34~49のいずれか一項記載の組換えAAVベクター。
【請求項50】
前記ITRが挿入、欠失、または置換を含む、請求項34~49のいずれか一項記載の組換えAAVベクター。
【請求項51】
前記ITR内の1つまたは複数のCpGアイランドが除去されている、請求項40記載の組換えAAVベクター。
【請求項52】
前記分泌シグナルペプチドが、フィブロネクチンシグナルペプチド(FN1)、または分泌シグナル活性を有するその活性断片であり、かつ前記IGF-2配列が、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、またはSEQ ID NO:9のいずれかより選択される、請求項34~49のいずれか一項記載の組換えAAVベクター。
【請求項53】
コードされた前記分泌シグナルペプチドが、AATシグナルペプチド、または分泌シグナル活性を有するその活性断片であり、かつ前記IGF-2配列が、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、またはSEQ ID NO:9のいずれかより選択される、請求項34~49のいずれか一項記載の組換えAAVベクター。
【請求項54】
前記IGF-2配列がSEQ ID NO:8またはSEQ ID NO:9である、請求項34~49のいずれか一項記載の組換えAAVベクター。
【請求項55】
前記請求項のいずれか一項記載の組換えAAVベクターと薬学的に許容される担体とを含む薬学的組成物。
【請求項56】
核酸配列と機能的に連結された肝臓特異的プロモーターであって、該核酸配列が、以下の順に、分泌シグナルペプチドをコードする核酸、IGF-2配列をコードする核酸、GAAポリペプチドをコードする核酸を含む、該肝臓特異的プロモーター
を含む、核酸配列。
【請求項57】
(a)5'および3'AAV末端逆位配列(ITR)核酸配列、ならびに
(b)5'ITR配列と3'ITR配列との間に位置する、分泌シグナルペプチドとαグルコシダーゼ(GAA)ポリペプチドとを含む融合ポリペプチドをコードする異種核酸配列であって、該異種核酸がプロモーターと機能的に連結されている、該異種核酸配列
を含む、組換えアデノ随伴ウイルス(rAAV)ベクターゲノムに関する核酸配列。
【請求項58】
融合ポリペプチドをコードする前記異種核酸配列が、前記分泌シグナルペプチドと前記αグルコシダーゼ(GAA)ポリペプチドとの間に位置するIGF-2配列をさらに含む、請求項57記載の核酸配列。
【請求項59】
前記分泌シグナルをコードする核酸が、SEQ ID NO:17、22~26、またはそれらとの少なくとも約85%の配列同一性を有する核酸のいずれかより選択される、請求項56または57記載の核酸配列。
【請求項60】
前記IGF-2配列をコードする核酸が、SEQ ID NO:2(IGF2-Δ2-7)、SEQ ID NO:3(IGF2-Δ1-7)、もしくはSEQ ID NO:4(IGF2 V43M)、またはそれらとの少なくとも約85%の配列同一性を有する核酸のいずれかより選択される、請求項59記載の核酸配列。
【請求項61】
前記GAAポリペプチドをコードする核酸配列が、ヒトGAA遺伝子またはヒトコドン最適化GAA遺伝子(coGAA)または修飾型GAA核酸配列である、請求項56または57記載の核酸配列。
【請求項62】
前記GAAポリペプチドをコードする核酸配列が、インビボでの発現の増強のためにコドン最適化されている、請求項56または57記載の核酸配列。
【請求項63】
前記GAAポリペプチドをコードする核酸配列が、CpGアイランドを減少させるようにコドン最適化されている、請求項56または57記載の核酸配列。
【請求項64】
前記GAAポリペプチドをコードする核酸配列が、自然免疫応答を低下させるようにコドン最適化されている、請求項56または57記載の核酸配列。
【請求項65】
前記GAAポリペプチドをコードする核酸配列が、CpGアイランドを減少させかつ自然免疫応答を低下させるようにコドン最適化されている、請求項56または57記載の核酸配列。
【請求項66】
前記GAAポリペプチドをコードする核酸が、SEQ ID NO:11(全長hGAA)、SEQ ID NO:55(ドワイト(Dwight)cDNA)、SEQ ID NO 56(hGAAΔ1-66)のいずれかより選択される、請求項56または57記載の核酸配列。
【請求項67】
前記GAAポリペプチドをコードする核酸が、SEQ ID NO:74(コドン最適化1)、SEQ ID NO:75(コドン最適化2)、およびSEQ ID NO:76(コドン最適化3)のいずれかより選択される、請求項56または57記載の核酸配列。
【請求項68】
SEQ ID NO:57(AAT-V43M-wtGAA(デルタ1-69aa));SEQ ID NO:58(ラットFN1-IGF2V43M-wtGAA(デルタ1-69aa));SEQ ID NO:59(hFN1-IGF2V43M-wtGAA(デルタ1-69aa));SEQ ID NO:60(ATT-IGF2Δ2-7-wtGAA(デルタ1-69));SEQ ID NO:61(FN1ラット-IGFΔ2-7-wtGAA(デルタ1-69));SEQ ID NO:62(hFN1-IGFΔ2-7-wtGAA(デルタ1-69))、SEQ ID NO:79(AAT_hIGF2-V43M_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:80(FIBラット_hIGF2-V43M_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:81(FIBhum_hIGF2-V43M_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:82(AAT_GILT_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:83(FIBラット_GILT_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:84(FIBhum_GILT_wtGAA_del1-69_スタッファー.V02)、またはそれらとの少なくとも80%、85%、90%、95%、もしくは98%の同一性を有する核酸配列のいずれかより選択される、請求項56または57記載の核酸配列。
【請求項69】
前記請求項のいずれか一項記載の組換えAAVベクターまたはrAAVゲノムまたは核酸配列のいずれかを、糖原貯蔵症II型(GSD II、ポンペ病、酸性マルターゼ欠損症)を有する対象またはαグルコシダーゼ(GAA)ポリペプチドの欠損を有する対象へ投与する工程を含む、該対象を処置するための方法。
【請求項70】
GAAポリペプチドが前記対象の肝臓から分泌され、かつ骨格筋組織、心筋組織、横隔膜筋組織、またはそれらの組み合わせによる分泌されたGAAの取り込みがあり、ここで、分泌された該GAAの取り込みが該組織内のリソソームグリコーゲン貯蔵の低下をもたらす、請求項69記載の方法。
【請求項71】
前記対象への投与が、筋肉内投与、皮下投与、脊髄内投与、大槽内投与、くも膜下腔内投与、静脈内投与のいずれかより選択される、請求項69記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本発明は、2018年11月16日に出願された米国特許仮出願第62/768,449号、および2018年11月20日に出願された米国特許仮出願第62/769,702号に基づく、35 U.S.C.§119(e)による恩典を主張するものであり、各々の内容は、参照によってその全体が本明細書中に組み入れられる。
【0002】
配列表
本願は、参照によってその全体が本明細書中に組み入れられる、ASCIIフォーマットで電子的に提出された配列表を含有する。2019年11月15日に作成された該ASCIIコピーは、046192-093900WOPT_SL.txtという名称であり、189,408バイトのサイズである。
【0003】
発明の分野
本発明は、αグルコシダーゼ(GAA)ポリペプチドの標的特異的な移行のためのアデノ随伴ウイルス(AAV)粒子、ビリオン、およびベクター、ならびにポンペ病の処置のための使用方法に関する。
【背景技術】
【0004】
背景
酸性αグルコシダーゼ(GAA)は、マルトースおよびその他の直鎖状オリゴ糖、例えば、グリコーゲンの外側の分枝において、α1-4結合を加水分解し、それによって、リソソーム内の過剰のグリコーゲンを分解するリソソーム酵素である(Hirschhorn et al.(2001)in The Metabolic and Molecular Basis of Inherited Disease(非特許文献1)、Scriver,et al.,eds.(2001),McGraw-Hill:New York,p.3389-3420(非特許文献2))。他の哺乳動物リソソーム酵素と同様に、GAAは、サイトゾルにおいて合成され、ERを通過し、そこで、N結合型高マンノース型炭水化物によってグリコシル化される。ゴルジにおいて、リソソームタンパク質上の高マンノース型炭水化物は、マンノース-6-リン酸(M6P)の付加によって修飾され、それによって、これらのタンパク質はリソソームへターゲティングされる。M6P修飾型タンパク質は、2つのM6P受容体のいずれか一方との相互作用を介して、リソソームへ送達される。修飾の最も有利な型は、2つのM6Pが高マンノース型炭水化物に付加された時である。
【0005】
リソソームにおける不十分なGAA活性は、酸性マルターゼ欠損症(AMD)、糖原貯蔵症II型(GSDII)、糖原病II型、またはGAA欠損症としても公知の疾患、ポンペ病をもたらす。酵素活性の低減は、GAAをコードする遺伝子における多様なミスセンス変異およびナンセンス変異によって起こる。従って、ポンペ病を有する患者においては、全ての細胞のリソソームにグリコーゲンが蓄積する。具体的には、グリコーゲン蓄積は、心筋および骨格筋、肝臓、ならびにその他の組織のリソソームにおいて最も顕著である。蓄積したグリコーゲンは、最終的に、筋肉の機能を損なう。ポンペ病の最も重度の型においては、心肺機能不全のため、2歳未満で死亡が起こる。
【0006】
ポンペ病の有効な処置が必要とされている。ポンペのための酵素補充治療は、組換えGAAタンパク質が投与され、対象の筋細胞および肝細胞によって取り込まれ、その後、M6P依存的にそれらの細胞のリソソームへ輸送されることを必要とする。即ち、露出したM6Pを有する組換えGAAタンパク質が、トランスゴルジにおいてM6P受容体と結合し、エンドソームへ輸送され、次いで、リソソームへ輸送される。しかしながら、酵素補充治療のために使用される組換えGAAタンパク質の主要な起源のうちの2つ;改変型CHO細胞またはトランスジェニックウサギの乳中に産生される組換えGAAは、タンパク質をリソソームへターゲティングするために必要とされるM6Pを極めてわずかにしか含有しない(Van Hove et al.(1996)Proc Natl Acad Sci USA,93(1):65-70(非特許文献3);および米国特許第6,537,785号(特許文献1))。従って、組換えGAAタンパク質のリソソームへのM6P依存的な送達は、効率的でなく、高い投薬量および高頻度の注入の両方を必要とする。
【0007】
従って、酵素治療は、重度の乳児GSD IIのため、合理的な効力を示しているが、高頻度の注入の必要性、および組換えhGAAタンパク質に対する阻害剤または中和抗体の対象における発達のため、GAA酵素治療の利益は限定されている(Amalfitano,A.,et al.(2001)Genet.In Med.3:132-138(非特許文献4))。
【0008】
ウイルスを使用した遺伝子治療は、遺伝性障害を治癒させるのみならず、後天性の変性疾患の長期的な非侵襲的な処置も容易にする可能性を有する。1つの遺伝子治療ベクターは、アデノ随伴ウイルス(AAV)である。AAV自体は、効率的な複製のためにヘルパーウイルスを必要とする非病原性の依存性パルボウイルスである。AAVは、その安全性および単純性のため、遺伝子治療のためのウイルスベクターとして用いられている。AAVは、分裂細胞および非分裂細胞の両方を形質導入することができる、広い宿主および細胞型向性を有する。現在までに、12種類のAAV血清型および100種類を超えるバリアントが同定されている。異なるAAV血清型は、インビボまたはインビトロのいずれか一方での種々の組織の細胞を感染させる異なる能力を有し、感染性のこれらの差は、各AAV血清型の細胞表面に位置する特定の受容体および共受容体に関係している可能性が高いか、または細胞内交通経路自体に関係している可能性があることが示されている。
【0009】
従って、酵素治療の代替または補助として、GSD-IIを処置するための遺伝子治療アプローチの実行可能性が調査されている(Amalfitano,A.,et al.,(1999)Proc.Natl.Acad.Sci.USA 96:8861-8866(非特許文献5)、Ding,E.,et al.(2002)Mol.Ther.5:436-446(非特許文献6)、Fraites,T.J.,et al.,(2002)Mol.Ther.5:571-578(非特許文献7)、Tsujino,S.,et al.(1998)Hum.Gene Ther.9:1609-1616(非特許文献8))。
【0010】
しかしながら、GAAポリペプチドのAAV送達は、肝臓における十分な発現および/またはリソソームへの送達の達成に関して、いくつかの課題を有し、糖血症を経験した患者が報告されている。インビボ研究において、GAA-KOマウスモデルにおけるマウス肝臓へターゲティングされたhGAAをコードするアデノウイルス(Ad)ベクターの使用が、肝臓からのhGAAの分泌および他の組織における取り込みを通して、12日以内に、骨格筋および心筋におけるグリコーゲン蓄積を逆転させることが報告された(Amalfitano,A.,et al.,(1999)Proc.Natl.Acad.Sci.USA 96:8861-8866(非特許文献5))。GAAをコードするアデノ随伴ウイルス2(AAV2)ベクターの導入は、注射された骨格筋および注射された心筋においてGAA活性を正常化し、改善された筋肉形質導入を有するAAV1シュードタイプベクターが投与された時には、筋肉におけるグリコーゲン含量が正常化された(Fraites,T.J.,et al.(2002)Mol.Ther.5:571-578(非特許文献7))。筋肉にターゲティングされたAdベクターによる遺伝子治療が、ニホンウズラモデルにおいて試みられたが、ベクター注射の部位におけるグリコーゲン蓄積の限局的な逆転のみが達成された(Tsujino,S.,et al.(1998)Hum.Gene Ther.9:1609-1616(非特許文献8))。
【0011】
しかしながら、ヒト対象においては、GAAポリペプチドをコードするrAAVベクターの投与によって、多数の患者が、細胞での非特異的な取り込みのため、低血糖症を経験するかまたは高血糖症になっている(例えば、Byrne et al.,A study on the safety and efficacy of Reveglucosidease alfa in patients with late-onset Pompe disease;Orphanet J.of Rare diseases;2017;12:144(非特許文献9)を参照すること)。
【0012】
従って、例えば、リソソームポリペプチド欠損症を処置するため、インビトロおよびインビボで、GAAのようなリソソームポリペプチドを作製する改善された方法が、当技術分野において必要とされている。さらに、GAAポリペプチドの過剰発現による副作用の低下および低血糖症のリスクの低下を助けるため、肝臓からの分泌の改善が必要とされ、GAAのリソソームへのターゲティングの改善も必要とされている。さらに、GAAおよびその他のリソソームポリペプチドの、影響を受けた組織および器官への全身送達をもたらす方法が、必要とされている。特に、可能性のある副作用を低下させながら、GAAタンパク質を対象へ投与し、GAAタンパク質を患者のリソソームへターゲティングするための、より効率的な方法が、必要とされたままである。
【先行技術文献】
【特許文献】
【0013】
【非特許文献】
【0014】
【非特許文献1】Hirschhorn et al.(2001),The Metabolic and Molecular Basis of Inherited Disease
【非特許文献2】Scriver,et al.,eds.(2001),McGraw-Hill:New York,p.3389-3420
【非特許文献3】Van Hove et al.(1996)Proc Natl Acad Sci USA,93(1):65-70
【非特許文献4】Amalfitano,A.,et al.(2001)Genet.In Med.3:132-138
【非特許文献5】Amalfitano,A.,et al.,(1999)Proc.Natl.Acad.Sci.USA 96:8861-8866
【非特許文献6】Ding,E.,et al.(2002)Mol.Ther.5:436-446
【非特許文献7】Fraites,T.J.,et al.,(2002)Mol.Ther.5:571-578
【非特許文献8】Tsujino,S.,et al.(1998)Hum.Gene Ther.9:1609-1616
【非特許文献9】Byrne et al.,A study on the safety and efficacy of Reveglucosidease alfa in patients with late-onset Pompe disease;Orphanet J.of Rare diseases;2017;12:144
【発明の概要】
【0015】
本明細書中に記載された技術は、一般に、ポンペ病の処置のための遺伝子治療構築物、方法、および組成物に関する。より具体的には、本技術は、GAAポリペプチドを対象へ送達するために構成されたアデノ随伴(AAV)ビリオンに関する。従って、ポンペ病を処置するために使用するための、末端逆位配列(ITR)、プロモーター、異種遺伝子、ポリAテールを含有し、その他の制御要素を含有してもよいヌクレオチド配列を含むrAAVベクターが、本明細書中に記載され、ここで、異種遺伝子は、酸性αグルコシダーゼ(GAA)タンパク質をコードし、GAAタンパク質を発現するrAAVは、ポンペ病を有する対象の処置のため、GAAタンパク質をコードする異種遺伝子の発現のため、適切な組織および/または器官へ送達される治療的に有効な用量で、患者へ投与され得る。
【0016】
従って、本明細書中に記載された技術は、一般に、rAAVベクターを使用して、肝臓においてGAAタンパク質を発現させ、発現されたGAAタンパク質を哺乳動物細胞、例えば、ヒト心筋細胞および骨格筋細胞のリソソームへ効果的にターゲティングする手段に関する。シグナルペプチドと融合したリソソームポリペプチド(例えば、GAA)をコードするrAAVベクター、rAAVゲノム、および単離された核酸組成物が、本明細書中に記載され、ここで、シグナルペプチドは、GAAポリペプチドの分泌経路へのターゲティングを増強し、GAAポリペプチドは、任意で、リソソームへの取り込みを補助するためのターゲティング配列とも融合している。従って、方法および組成物は、細胞、例えば、肝細胞からのGAAポリペプチドの分泌、および筋肉のリソソームへのGAAタンパク質のリソソームターゲティングを可能にする。GAAタンパク質のリソソームターゲティングは、多数の利点を提供する。例えば、GAAポリペプチドをコードするrAAVベクターの投与によって、多数の患者が、細胞への非特異的取り込みのため、低血糖症を経験するか、または高血糖症になっている(例えば、Byrne et al.,A study on the safety and efficacy of Reveglucosidease alfa in patients with late-onset Pompe disease;Orphanet J.of Rare diseases;2017;12:144を参照すること)。GAAの肝臓からの分泌の最適化または改善、およびリソソームへのターゲティングの改善は、GAAがより低いレベルで発現されることを可能にし、GAAポリペプチドの過剰発現による副作用の低下、例えば、低血糖症のリスクの低下を助けるであろう。
【0017】
従って、本発明者らはrAAVベクターを本明細書中に記載し、該rAAVベクターはそのゲノム内に、ネイティブシグナルペプチド切断部位または適切な下流部位においてGAAポリペプチドのN末端に融合したIGF2配列(例えば、ターゲティングペプチドまたはTP)と機能的に連結された分泌シグナルペプチド(SS)をコードするキメラ遺伝子をコードする異種核酸を含む。そのようなキメラ遺伝子の発現は、高レベルに分泌され、M6P/IGF2受容体の高親和性リガンドを含有する組換えGAA融合タンパク質の産生を指図すると考えられる。
【0018】
本明細書中に記載された組成物および方法のいくつかの態様において、本明細書中に開示されたrAAVベクターはそのゲノム内に、5'および3'AAV末端逆位配列(ITR)、ならびに、5'ITRと3'ITRとの間に位置する(i)分泌シグナルペプチドと(ii)IGF2配列と(iii)αグルコシダーゼ(GAA)ポリペプチドとを含む融合ポリペプチドをコードする異種核酸配列を含み、ここで、異種核酸は、プロモーター、例えば、限定されるわけではないが、肝臓特異的プロモーターと機能的に連結されている。いくつかの態様において、本明細書中に開示されたrAAVベクターはそのゲノム内に、5'および3'AAV末端逆位配列(ITR)、ならびに、5'ITRと3'ITRとの間に位置する(i)分泌シグナルペプチドと(ii)αグルコシダーゼ(GAA)ポリペプチドとを含む融合ポリペプチドをコードする異種核酸配列を含み、ここで、異種核酸は、プロモーター、肝臓特異的プロモーターと機能的に連結されている。
【0019】
本明細書中に記載された組成物および方法のいくつかの態様において、分泌シグナルペプチドは、AATシグナルペプチド、フィブロネクチンシグナルペプチド(FN1)、GAAシグナルペプチド、または、分泌シグナル活性を有するそれらの活性断片のいずれかより選択される。
【0020】
本明細書中に記載された組成物および方法のいくつかの態様において、αグルコシダーゼ(GAA)ポリペプチドは、GAAポリペプチドのN末端においてIGF2配列に連結されている。いくつかの態様において、IGF2配列は、ヒト酸性αグルコシダーゼ(GAA)ポリペプチド(SEQ ID NO:10)のアミノ酸70においてN末端に連結されている(即ち、ヒト酸性αグルコシダーゼ(GAA)ポリペプチドの残基70-952のN末端に連結されている)。別の態様において、IGF2配列は、ヒト酸性αグルコシダーゼ(GAA)ポリペプチド(SEQ ID NO:10)のアミノ酸40においてN末端に連結されている(即ち、ヒト酸性αグルコシダーゼ(GAA)ポリペプチドの残基40-952のN末端に連結されている)。本明細書中に記載された組成物および方法のいくつかの態様において、GAAポリペプチドは、野生型GAA核酸配列(例えば、SEQ ID NO:11もしくはSEQ ID NO:72)によってコードされるか、または、例えば、インビボでの発現の増大、CpGアイランドの減少、および/もしくは対象における自然免疫応答の低下のうちのいずれか1つのためにコドン最適化されたGAA核酸配列であってもよい。例示的なコドン最適化GAA核酸配列には、SEQ ID NO;73、SEQ ID NO:74、SEQ ID NO:75、およびSEQ ID NO:76が含まれるが、これらに限定されるわけではない。
【0021】
本明細書中に記載された組成物および方法のいくつかの態様において、IGF2配列は、SEQ ID NO:5の野生型成熟ヒトインスリン様増殖因子II(IGF2)の残基8-67が後続する残基1(即ち、SEQ ID NO:6に対応するIGF2-デルタ2-7もしくはIGF2Δ2-7);SEQ ID NO:5の野生型成熟ヒトインスリン様増殖因子II(IGF2)の残基8-67(即ち、SEQ ID NO:7に対応するIGF2-デルタ1-7もしくはIGF2Δ1-7)、またはSEQ ID NO:5の野生型成熟ヒトインスリン様増殖因子II(IGF2)の残基43-67(即ち、SEQ ID NO:8に対応するIGF2デルタ1-42もしくはIGF2Δ1-42)のいずれかをコードする核酸配列である。本明細書中に記載された組成物および方法のいくつかの態様において、IGF2配列は、アミノ酸残基43の修飾、例えば、開始コドンへ修飾された残基43、例えば、(SEQ ID NO:9に対応する)IGF2-V43Mを有する核酸配列である。
【0022】
本明細書中に記載された組成物および方法のいくつかの態様において、IGF2配列は、SEQ ID NO:2(即ち、IGF2-デルタ2-7);SEQ ID NO:3(即ち、IGF2-デルタ1-7)、またはSEQ ID NO:4(即ち、IGF2-V43M)のいずれかを含む核酸配列である。
【0023】
本明細書中に記載された組成物および方法のいくつかの態様において、GAAポリペプチドおよびIGF2配列を含む融合タンパク質は、野生型成熟ヒトインスリン様増殖因子II(IGF2)(SEQ ID NO:5)の残基8-67が後続する残基1を含む(即ち、成熟ヒトIGF2(SEQ ID NO:5)の残基2-7が存在しない)IGF2配列に付着した、ヒト酸性αグルコシダーゼ(GAA)ポリペプチド(SEQ ID NO:10)のアミノ酸残基40-952または残基70-952を含み、ここで、IGF2配列は、ヒトGAA(SEQ ID NO:10)のアミノ酸残基70に連結されている。
【0024】
本明細書中に記載された組成物および方法のいくつかの態様において、GAAポリペプチドおよびIGF2配列を含む融合タンパク質は、野生型成熟ヒトインスリン様増殖因子II(IGF2)(SEQ ID NO:5)の残基8-67を含む(即ち、成熟ヒトIGF2の残基1-7(即ち、Y R P S E T;SEQ ID NO:63)が存在しない)IGF2配列に付着した、ヒト酸性αグルコシダーゼ(GAA)ポリペプチド(SEQ ID NO:10)のアミノ酸残基40-952または残基70-952を含み、ここで、IGF2配列は、ヒトGAA(SEQ ID NO:10)のアミノ酸残基70に連結されている。
【0025】
本明細書中に記載された組成物および方法のいくつかの態様において、GAAポリペプチドおよびIGF2配列を含む融合タンパク質は、野生型成熟ヒトインスリン様増殖因子II(IGF2)(SEQ ID NO:5)の残基43-67を含む(成熟ヒトIGF2(SEQ ID NO:5)の残基1-42が存在しない)修飾型IGF2配列に付着した、ヒト酸性αグルコシダーゼ(GAA)ポリペプチド(SEQ ID NO:10)のアミノ酸残基40-952または残基70-952を含み、ここで、IGF2配列は、ヒトGAA(SEQ ID NO:10)のアミノ酸残基70に連結されている。
【0026】
本明細書中に記載された組成物および方法のいくつかの態様において、IGF2配列(即ち、本明細書中に開示されるデルタ1-7、デルタ2-7、またはデルタ1-42)は、カチオン非依存性マンノース-6-リン酸受容体(CI-MPR)と結合する。一つの態様において、IGF2配列は、直接、GAAポリペプチドのN末端またはC末端と融合している。別の態様において、IGF2配列は、スペーサーによって、GAAポリペプチドのN末端またはC末端と融合している。一つの具体的な態様において、IGF2配列は、10~25アミノ酸のスペーサーによって、GAAポリペプチドと融合している。別の具体的な態様において、IGF2配列は、グリシン残基を含むスペーサーによって、GAAポリペプチドと融合している。別の具体的な態様において、IGF2配列は、ヘリックス構造を含むスペーサーによって、GAAポリペプチドと融合している。別の具体的な態様において、IGF2配列は、配列GGGTVGDDDDK(SEQ ID NO:35)と少なくとも50%同一のスペーサーによって、GAAポリペプチドと融合している。
【0027】
本明細書中に記載された組成物および方法のいくつかの態様において、分泌シグナルは、融合ポリペプチド、例えば、肝細胞から血中へのIGF2配列-GAA融合ポリペプチドの分泌を支援するという一般的な目的のために役立ち、融合ポリペプチドは、本明細書中に記載されるように、哺乳動物細胞、例えば、ヒトの心筋細胞および骨格筋細胞のリソソームへ移動し、ターゲティングされ得る。いくつかの態様において、分泌シグナルは、AATシグナルペプチド、フィブロネクチンシグナルペプチド(FN1)、GAAシグナルペプチド、または分泌シグナル活性を有するAAT、FN1、もしくはGAAシグナルペプチドの活性断片のいずれかより選択される。
【0028】
本明細書中に開示された技術の組成物および方法の全ての局面を、以下に記述する。
【0029】
いくつかの態様において、本技術は、組換えアデノ随伴ウイルス(AAV)ベクター組成物およびその使用方法に関し、rAAVベクターはそのゲノム内に、(a)5'および3'AAV末端逆位配列(ITR)、ならびに(b)5'ITRと3'ITRとの間に位置する、分泌シグナルペプチドとαグルコシダーゼ(GAA)ポリペプチドとを含む融合ポリペプチドをコードする異種核酸配列を含み、異種核酸は、プロモーターと機能的に連結されている。本明細書中に開示された方法および組成物のいくつかの態様において、rAAVベクターは、分泌シグナルペプチドとαグルコシダーゼ(GAA)ポリペプチドとの間に位置するIGF-2配列をさらに含む融合ポリペプチドをコードする異種核酸配列を含む。本明細書中に開示された方法および組成物のいくつかの態様において、rAAV組成物は、5'から3'への方向に、(a)5'ITR、(b)プロモーター配列、(c)イントロン配列、(d)分泌シグナルペプチドをコードする核酸、(e)IGF-2配列をコードする核酸、αグルコシダーゼ(GAA)ポリペプチドをコードする核酸、(f)ポリA配列、および(g)3'ITRを含むAAVゲノムを含む。
【0030】
いくつかの態様において、本技術は、組換えアデノ随伴ウイルス(AAV)ベクター組成物およびその使用方法に関し、ここで、組換えAAV(rAAV)ベクターはそのゲノム内に、(a)5'および3'AAV末端逆位配列(ITR)、ならびに(b)5'ITRと3'ITRとの間に位置する、αグルコシダーゼ(GAA)ポリペプチドを含む融合ポリペプチドをコードする異種核酸配列を含み、異種核酸は、肝臓特異的プロモーターと機能的に連結されており、組換えAAVベクターは、AAV3b血清型のカプシドタンパク質を含む。そのような態様において、融合ポリペプチドは、GAAポリペプチドのN末端に位置する分泌シグナルペプチドをさらに含む。本明細書中に開示された方法および組成物のいくつかの態様において、そのような組換えAAVベクターは、分泌シグナルペプチドとαグルコシダーゼ(GAA)ポリペプチドとの間に位置するIGF-2配列をさらに含む融合ポリペプチドをコードする異種核酸配列を含む。
【0031】
本明細書中に開示された方法および組成物のいくつかの態様において、組換えAAVベクターは、そのゲノム内に5'から3'への方向に、(a)5'ITR、(b)肝臓特異的プロモーター配列、(c)イントロン配列、(d)分泌シグナルペプチドをコードする核酸、(e)IGF-2配列をコードする核酸、(f)αグルコシダーゼ(GAA)ポリペプチドをコードする核酸、(g)ポリA配列、および(h)3'ITRを含む。
【0032】
本明細書中に開示された方法および組成物のいくつかの態様において、rAAVベクター組成物は、分泌シグナルペプチドをコードする、例えば、AATシグナルペプチド(例えば、SEQ ID NO:17)、フィブロネクチンシグナルペプチド(FN)(例えば、SEQ ID NO:18~21)、GAAシグナルペプチド、hIGF2シグナルペプチド(例えば、SEQ ID NO:22)、または、分泌シグナル活性を有するそれらの活性断片より選択される分泌シグナルペプチドをコードする核酸、例えば、SEQ ID NO:17~22との少なくとも約75%または80%または85%または90%または95%または98%もしくは99%の配列同一性を有するアミノ酸配列をコードする核酸を含む。本明細書中に開示された方法および組成物のいくつかの態様において、組換えAAVベクターは、ヒトカチオン非依存性マンノース-6-リン酸受容体(CI-MPR)またはIGF-2受容体と結合するIGF-2リーダー配列をコードする異種核酸配列を含み、例えば、異種核酸配列は、SEQ ID NO:5のアミノ酸配列を有するか、またはIGF-2受容体と結合するSEQ ID NO:5において少なくとも1つのアミノ修飾を含むIGF-2配列をコードする。いくつかの態様において、組換えAAVベクターは、V43Mアミノ酸修飾(SEQ ID NO:8もしくはSEQ ID NO:9)もしくはΔ2-7(SEQ ID NO:6)もしくはΔ1-7(SEQ ID NO:7)であるSEQ ID NO:5において少なくとも1つのアミノ修飾を有するIGF-2リーダー配列、またはSEQ ID NO:5~9との少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有するIGF2ペプチドをコードする異種核酸配列を含む。
【0033】
本明細書中に開示された方法および組成物のいくつかの態様において、組換えAAVベクターは、構成性、細胞特異的、または誘導性であるプロモーターを含む。本明細書中に開示された方法および組成物のいくつかの態様において、組換えAAVベクターは、肝臓特異的プロモーターを含み、例えば、限定されるわけではないが、肝臓特異的プロモーターは、トランスサイレチンプロモーター(TTR)、LSPプロモーター(LSP)、合成肝臓特異的プロモーターのいずれかより選択される。
【0034】
本明細書中に開示された方法および組成物のいくつかの態様において、組換えAAVベクターは、野生型GAAポリペプチド(wtGAA)または修飾型GAAポリペプチドをコードする異種核酸配列を含む。本明細書中に開示された方法および組成物のいくつかの態様において、組換えAAVベクターは、ヒトGAA遺伝子またはヒトコドン最適化GAA遺伝子(coGAA)または修飾型GAA核酸配列である、GAAポリペプチドをコードする異種核酸配列を含む。本明細書中に開示された方法および組成物の全ての局面において、GAAポリペプチドをコードする核酸配列は、インビボでの発現の増強、CpGアイランドの減少、または自然免疫応答の低下のうちの1つまたは複数のためにコドン最適化されている。本明細書中に開示される方法および組成物の全ての局面において、GAAポリペプチドをコードする核酸配列は、CpGアイランドを減少させるように、かつ自然免疫応答を低下させるように、コドン最適化されている。
【0035】
本明細書中に開示された方法および組成物のいくつかの態様において、組換えAAVベクターは、異種核酸配列を含み、ここで、コードされた融合ポリペプチドは、GAAポリペプチドのアミノ末端側かつIGF-2配列のC末端側に位置する少なくとも1アミノ酸に対するヌクレオチド配列を含むスペーサーをさらに含む。本明細書中に開示された方法および組成物のいくつかの態様において、組換えAAVベクターは異種核酸を含み、該異種核酸配列は、IGF-2配列をコードする核酸とGAAポリペプチドをコードする核酸との間に位置する、少なくとも1アミノ酸のスペーサーをコードする核酸を含む。
【0036】
本明細書中に開示された方法および組成物のいくつかの態様において、組換えAAVベクターは、GAA遺伝子をコードする核酸の3'側、かつ3'ITR配列の5'側に位置する少なくとも1つのポリA配列を含む。
【0037】
本明細書中に開示された方法および組成物のいくつかの態様において、組換えAAVベクターは、GAAポリペプチドをコードする核酸の3'側、かつ3'ITR配列の5'側に位置するコラーゲン安定性(CS)配列をさらに含む異種核酸配列を含む。本明細書中に開示された方法および組成物のいくつかの態様において、組換えAAVベクターは、GAAポリペプチドをコードする核酸とポリA配列との間に位置するコラーゲン安定性(CS)配列をコードする核酸をさらに含む。
【0038】
本明細書中に開示された方法および組成物のいくつかの態様において、組換えAAVベクターは、分泌シグナルペプチドをコードする配列の5'側、かつプロモーターの3'側に位置するイントロン配列をさらに含む異種核酸配列を含む。いくつかの態様において、イントロン配列は、MVM配列またはHBB2配列を含み、ここで、MVN配列は、SEQ ID NO:13の核酸配列、またはSEQ ID NO:13との少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有する核酸配列を含み、かつHBB2配列は、SEQ ID NO:14の核酸配列、またはSEQ ID NO:14との少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有する核酸配列を含む。
【0039】
本明細書中に開示された方法および組成物のいくつかの態様において、組換えAAVベクターは、挿入、欠失、または置換を含むITR配列を含む。本明細書中に開示された方法および組成物のいくつかの態様において、組換えAAVベクターは、ITR内の1つまたは複数のCpGアイランドが除去されている少なくとも1つのITR配列を含む。
【0040】
本明細書中に開示された方法および組成物のいくつかの態様において、組換えAAVベクターは、フィブロネクチンシグナルペプチド(FN1)または分泌シグナル活性を有するその活性断片(例えば、FN1シグナルペプチドは、SEQ ID NO:18~21、またはSEQ ID NO:18~21のいずれかとの少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有するアミノ酸配列のうちのいずれかの配列を有する)である分泌シグナル配列をコードする異種核酸配列を含み、かつ異種核酸配列は、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、もしくはSEQ ID NO:9、またはSEQ ID NO:5~9との少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有するIGF2ペプチドのいずれかより選択されるIGF-2配列をコードする。本明細書中に開示された方法および組成物のいくつかの態様において、組換えAAVベクターは、AATシグナルペプチドまたは分泌シグナル活性を有するその活性断片(例えば、AATシグナルペプチドは、SEQ ID NO:17の配列、またはSEQ ID NO:17との少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有するアミノ酸配列を有する)である分泌シグナル配列をコードする異種核酸配列を含み、異種核酸配列は、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、もしくはSEQ ID NO:9、またはSEQ ID NO:5~9との少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有するIGF2ペプチドのいずれかより選択されるIGF-2配列をコードする。
【0041】
本明細書中に開示された方法および組成物のいくつかの態様において、組換えAAVベクターは、IGF2ペプチドをコードする異種核酸配列を含み、ここで、IGF2ペプチド配列は、SEQ ID NO:8もしくはSEQ ID NO:9、またはSEQ ID NO:8もしくは9との少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有するIGF2ペプチドである。
【0042】
本明細書中に開示された方法および組成物のいくつかの態様において、組換えAAVベクターは、キメラAAVベクター、ハプロイドAAVベクター、ハイブリッドAAVベクター、またはポリプロイドAAVベクターであり、例えば、限定されるわけではないが、組換えAAVベクターは、表1にリストされたものおよびそれらの任意の組み合わせからなる群における任意のAAV血清型より選択されるカプシドタンパク質を含む。本明細書中に開示された方法および組成物のいくつかの態様において、組換えAAVベクターは、血清型AAV3bである。本明細書中に開示された方法および組成物のいくつかの態様において、組換えAAVベクターは、265D、549A、Q263Yのいずれかより選択されるカプシドタンパク質において1つまたは複数の変異を含むAAV3b血清型である。本明細書中に開示された方法および組成物のいくつかの態様において、組換えAAVベクターは、AAV3b265D、AAV3b265D549A、AAV3b549A、またはAAV3bQ263Y、またはAAV3bSASTGのいずれかより選択されるAAV3b血清型である。
【0043】
本明細書中の技術の別の局面は、本明細書中に開示された組換えAAVベクター組成物のいずれかと薬学的に許容される担体とを含む薬学的組成物に関する。
【0044】
本明細書中の技術の別の局面は、核酸配列と機能的に連結された肝臓特異的プロモーターであって、該核酸配列が、以下の順に、(a)分泌シグナルペプチドをコードする核酸、(b)IGF-2配列をコードする核酸、および(c)GAAポリペプチドをコードする核酸を含む、該肝臓特異的プロモーターを含む核酸配列を含む組成物に関する。
【0045】
本明細書中の技術の別の局面は、組換えアデノ随伴ウイルス(rAAV)ベクターゲノムに関する核酸配列を含む組成物に関し、ここで、核酸配列は、(a)5'および3'AAV末端逆位配列(ITR)核酸配列、ならびに、(b)5'ITR配列と3'ITR配列との間に位置する、分泌シグナルペプチドとαグルコシダーゼ(GAA)ポリペプチドとを含む融合ポリペプチドをコードする異種核酸配列を含み、異種核酸は、プロモーターと機能的に連結されている。
【0046】
本明細書中に開示された方法および組成物のいくつかの態様において、核酸配列は、分泌シグナルペプチドとαグルコシダーゼ(GAA)ポリペプチドとの間に位置するIGF-2配列をさらに含む融合ポリペプチドをコードする異種核酸配列を含む。本明細書中に開示された方法および組成物のいくつかの態様において、核酸配列は、SEQ ID NO:17、22~26、またはSEQ ID NO:17もしくは22~26のいずれかとの少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有する核酸配列のいずれかより選択される分泌シグナルをコードする核酸を含む。
【0047】
本明細書中に開示された方法および組成物のいくつかの態様において、核酸配列は、SEQ ID NO:2(IGF2-Δ2-7)、SEQ ID NO:3(IGF2-Δ1-7)、もしくはSEQ ID NO:4(IGF2 V43M)、またはSEQ ID NO:2、3、もしくは4のいずれかとの少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有する核酸配列のいずれかより選択される、IGF-2配列をコードする異種核酸配列を含む。
【0048】
本明細書中に開示された方法および組成物のいくつかの態様において、核酸配列は、GAAポリペプチドをコードする異種核酸配列を含み、ここで、核酸配列は、ヒトGAA遺伝子またはヒトコドン最適化GAA遺伝子(coGAA)または修飾型GAA核酸配列である。本明細書中に開示された方法および組成物のいくつかの態様において、核酸配列は、インビボでの発現の増強、CpGアイランドの減少、または自然免疫応答の低下のうちの1つまたは複数のためにコドン最適化された(coGAA)GAA遺伝子である異種核酸配列を含む。本明細書中に開示された方法および組成物のいくつかの態様において、核酸配列は、CpGアイランドを減少させるように、かつ自然免疫応答を低下させるようにコドン最適化された(coGAA)GAA遺伝子である異種核酸配列を含む。
【0049】
本明細書中に開示された方法および組成物のいくつかの態様において、核酸配列は、SEQ ID NO:11(全長hGAA)、SEQ ID NO:55(ドワイト(Dwight)cDNA)、SEQ ID NO:56(hGAAΔ1-66)、またはSEQ ID NO:11、55、もしくは56のいずれかとの少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有する核酸配列のいずれかより選択されるGAAポリペプチドをコードする異種核酸配列を含む。
【0050】
本明細書中に開示された方法および組成物のいくつかの態様において、核酸配列は、GAAポリペプチドをコードする異種核酸配列を含み、ここで、GAAポリペプチドをコードする異種核酸配列は、SEQ ID NO:74(コドン最適化1)、SEQ ID NO:75(コドン最適化2)、およびSEQ ID NO:76(コドン最適化3)のいずれか、またはSEQ ID NO:74、75、もしくは76のいずれかとの少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有する核酸配列より選択される。
【0051】
本明細書中に開示された方法および組成物のいくつかの態様において、核酸配列は、SEQ ID NO:57(AAT-V43M-wtGAA(デルタ1-69aa));SEQ ID NO:58(ラットFN1-IGF2V43M-wtGAA(デルタ1-69aa));SEQ ID NO:59(hFN1-IGF2V43M-wtGAA(デルタ1-69aa));SEQ ID NO:60(ATT-IGF2Δ2-7-wtGAA(デルタ1-69));SEQ ID NO:61(FN1ラット-IGFΔ2-7-wtGAA(デルタ1-69));SEQ ID NO:62(hFN1-IGFΔ2-7-wtGAA(デルタ1-69))、SEQ ID NO:79(AAT_hIGF2-V43M_wtGAA_del1-69_スタッファー(Stuffer).V02);SEQ ID NO:80(FIBラット_hIGF2-V43M_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:81(FIBhum_hIGF2-V43M_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:82(AAT_GILT_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:83(FIBラット_GILT_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:84(FIBhum_GILT_wtGAA_del1-69_スタッファー.V02)、またはSEQ ID NO:57、58、59、60、61、62、79、80、81、82、83、もしくは84との少なくとも80%、85%、90%、95%、もしくは98%の同一性を有する核酸配列のいずれかより選択される。
【0052】
本明細書中に開示された方法および組成物のいくつかの態様において、rAAVベクターは、SEQ ID NO:57(AAT-V43M-wtGAA(デルタ1-69aa));SEQ ID NO:58(ラットFN1-IGF2V43M-wtGAA(デルタ1-69aa));SEQ ID NO:59(hFN1-IGF2V43M-wtGAA(デルタ1-69aa));SEQ ID NO:60(ATT-IGF2Δ2-7-wtGAA(デルタ1-69));SEQ ID NO:61(FN1ラット-IGFΔ2-7-wtGAA(デルタ1-69));SEQ ID NO:62(hFN1-IGFΔ2-7-wtGAA(デルタ1-69))、SEQ ID NO:79(AAT_hIGF2-V43M_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:80(FIBラット_hIGF2-V43M_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:81(FIBhum_hIGF2-V43M_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:82(AAT_GILT_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:83(FIBラット_GILT_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:84(FIBhum_GILT_wtGAA_del1-69_スタッファー.V02)、またはSEQ ID NO:57、58、59、60、61、62、79、80、81、82、83、もしくは84との少なくとも80%、85%、90%、95%、もしくは98%の同一性を有する核酸配列のいずれかより選択される核酸配列を含む。
【0053】
本明細書中の技術の別の局面は、疾患を処置するための方法における、本明細書中に開示されたrAAV組成物および核酸組成物の使用に関する。具体的には、本明細書中の技術の一つの局面は、糖原貯蔵症II型(GSD II、ポンペ病、酸性マルターゼ欠損症)を有する対象またはαグルコシダーゼ(GAA)ポリペプチドの欠損を有する対象を処置するための方法における、本明細書中に開示されたrAAVベクター組成物および核酸組成物の使用に関し、該方法は、本明細書中に開示された組換えAAVベクターまたはrAAVゲノムまたは核酸配列のいずれかを対象へ投与する工程を含む。本明細書中に開示された方法のいくつかの態様において、発現されたGAAポリペプチドが対象の肝臓から分泌され、かつ骨格筋組織、心筋組織、横隔膜筋組織、またはそれらの組み合わせによる分泌されたGAAの取り込みがあり、ここで、分泌されたGAAの取り込みが組織内のリソソームグリコーゲン貯蔵の低下をもたらす。開示された方法におけるいくつかの態様において、組換えAAVベクターまたはrAAVゲノムまたは核酸配列は、任意の適切な投与方法、例えば、限定されるわけではないが、筋肉内投与、皮下投与、脊髄内投与、大槽内投与、くも膜下腔内投与、静脈内投与のいずれかより選択される投与方法によって、対象へ投与される。いくつかの態様において、本明細書中に開示された薬学的組成物は、本明細書中に開示された方法において使用され得る。
【0054】
本明細書中の技術の別の局面は、本明細書中に開示されるrAAV組成物、rAAVゲノム組成物、または核酸組成物のうちの1つまたは複数を含む細胞に関する。いくつかの態様において、細胞は、ヒト細胞または非ヒト細胞哺乳動物細胞または昆虫細胞である。
【0055】
本明細書中の技術の別の局面は、本明細書中に開示されるrAAV組成物、rAAVゲノム組成物、または核酸組成物のうちの1つまたは複数を含む宿主動物に関する。いくつかの態様において、宿主動物は、哺乳動物、非ヒト哺乳動物、またはヒトである。
【0056】
本明細書中の技術の別の局面は、本明細書中に開示されるrAAV組成物、rAAVゲノム組成物、または核酸組成物のうちの1つまたは複数を含む少なくとも1つの細胞を含む宿主動物に関する。いくつかの態様において、そのような修飾型細胞を含む宿主動物は、哺乳動物、非ヒト哺乳動物、またはヒトである。
【0057】
本発明の局面は、下記の例示的な利点を生じる、構築および使用におけるある種の利益を教示する。
【0058】
いくつかの態様において、本明細書中に開示されるrAAVベクター、rAAVゲノムをコードする核酸と、薬学的に許容される担体とを含む薬学的製剤が、本明細書中に開示される。
【0059】
[本発明1001]
そのゲノム内に
(a)5'および3'AAV末端逆位配列(ITR)、ならびに
(b)5'ITRと3'ITRとの間に位置する、分泌シグナルペプチドとαグルコシダーゼ(GAA)ポリペプチドとを含む融合ポリペプチドをコードする異種核酸配列であって、該異種核酸がプロモーターと機能的に連結されている、該異種核酸配列
を含む、組換えアデノ随伴ウイルス(AAV)ベクター。
[本発明1002]
融合ポリペプチドをコードする前記異種核酸配列が、前記分泌シグナルペプチドと前記αグルコシダーゼ(GAA)ポリペプチドとの間に位置するIGF-2配列をさらに含む、本発明1001の組換えAAVベクター。
[本発明1003]
前記AAVのゲノムが、5'から3'への方向に、
(a)5'ITR、
(b)プロモーター配列、
(c)イントロン配列、
(d)分泌シグナルペプチドをコードする核酸、
(e)IGF-2配列をコードする核酸、
(f)αグルコシダーゼ(GAA)ポリペプチドをコードする核酸、
(g)ポリA配列、および
(h)3'ITR
を含む、本発明1002の組換えAAVベクター。
[本発明1004]
前記分泌シグナルペプチドが、AATシグナルペプチド、フィブロネクチンシグナルペプチド(FN)、GAAシグナルペプチド、または、分泌シグナル活性を有するそれらの活性断片より選択される、本発明1001~1003のいずれかの組換えAAVベクター。
[本発明1005]
IGF-2リーダー配列が、ヒトカチオン非依存性マンノース-6-リン酸受容体(CI-MPR)またはIGF-2受容体と結合する、本発明1001~1003のいずれかの組換えAAVベクター。
[本発明1006]
前記IGF-2配列が、SEQ ID NO:5を含むか、または前記IGF-2受容体と結合するSEQ ID NO:5において少なくとも1つのアミノ修飾を含む、本発明1005の組換えAAVベクター。
[本発明1007]
SEQ ID NO:5における前記少なくとも1つのアミノ修飾が、V43Mアミノ酸修飾(SEQ ID NO:8もしくはSEQ ID NO:9)またはΔ2-7(SEQ ID NO:6)またはΔ1-7(SEQ ID NO:7)である、本発明1006の組換えAAVベクター。
[本発明1008]
前記プロモーターが構成性、細胞特異的、または誘導性である、本発明1001~1003のいずれかの組換えAAVベクター。
[本発明1009]
前記プロモーターが肝臓特異的プロモーターである、本発明1001~1003のいずれかの組換えAAVベクター。
[本発明1010]
前記肝臓特異的プロモーターが、トランスサイレチンプロモーター(TTR)、LSPプロモーター(LSP)、合成肝臓特異的プロモーターのいずれかより選択される、本発明1009の組換えAAVベクター。
[本発明1011]
前記核酸配列が、野生型GAAポリペプチドまたは修飾型GAAポリペプチドをコードする、本発明1001または1002の組換えAAVベクター。
[本発明1012]
前記GAAポリペプチドをコードする核酸配列が、ヒトGAA遺伝子またはヒトコドン最適化GAA遺伝子(coGAA)または修飾型GAA核酸配列である、本発明1001~1003のいずれかの組換えAAVベクター。
[本発明1013]
前記GAAポリペプチドをコードする核酸配列が、インビボでの発現の増強のためにコドン最適化されている、本発明1001~1003または本発明1012のいずれかの組換えAAVベクター。
[本発明1014]
前記GAAポリペプチドをコードする核酸配列が、CpGアイランドを減少させるようにコドン最適化されている、本発明1001~1003または本発明1012のいずれかの組換えAAVベクター。
[本発明1015]
前記GAAポリペプチドをコードする核酸配列が、自然免疫応答を低下させるようにコドン最適化されている、本発明1001~1003または本発明1012のいずれかの組換えAAVベクター。
[本発明1016]
前記GAAポリペプチドをコードする核酸配列が、CpGアイランドを減少させかつ自然免疫応答を低下させるようにコドン最適化されている、本発明1001~1003または本発明1012のいずれかの組換えAAVベクター。
[本発明1017]
コードされた前記融合ポリペプチドが、前記GAAポリペプチドのアミノ末端側かつ前記IGF-2配列のC末端側に位置する少なくとも1アミノ酸に対するヌクレオチド配列を含むスペーサーをさらに含む、本発明1001~1003のいずれかの組換えAAVベクター。
[本発明1018]
前記IGF-2配列をコードする核酸と前記GAAポリペプチドをコードする核酸との間に位置する、少なくとも1アミノ酸のスペーサーをコードする核酸をさらに含む、本発明1003の組換えAAVベクター。
[本発明1019]
前記GAA遺伝子をコードする核酸の3'側かつ前記3'ITR配列の5'側に位置する少なくとも1つのポリA配列をさらに含む、本発明1001~1003のいずれかの組換えAAVベクター。
[本発明1020]
前記異種核酸配列が、前記GAAポリペプチドをコードする核酸の3'側かつ前記3'ITR配列の5'側に位置するコラーゲン安定性(CS)配列をさらに含む、本発明1001~1003のいずれかの組換えAAVベクター。
[本発明1021]
前記GAAポリペプチドをコードする核酸と前記ポリA配列との間に位置するコラーゲン安定性(CS)配列をコードする核酸をさらに含む、本発明1003または1020の組換えAAVベクター。
[本発明1022]
前記分泌シグナルペプチドをコードする配列の5'側かつ前記プロモーターの3'側に位置するイントロン配列をさらに含む、本発明1001~1003のいずれかの組換えAAVベクター。
[本発明1023]
前記イントロン配列がMVM配列またはHBB2配列を含む、本発明1022の組換えAAVベクター。
[本発明1024]
前記ITR配列が挿入、欠失、または置換を含む、本発明1001~1003のいずれかの組換えAAVベクター。
[本発明1025]
前記ITR内の1つまたは複数のCpGアイランドが除去されている、本発明1024の組換えAAVベクター。
[本発明1026]
前記分泌シグナルペプチドが、フィブロネクチンシグナルペプチド(FN1)、または分泌シグナル活性を有するその活性断片であり、かつ前記IGF-2配列が、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、またはSEQ ID NO:9のいずれかより選択される、本発明1001~1003のいずれかの組換えAAVベクター。
[本発明1027]
コードされた前記分泌シグナルペプチドが、AATシグナルペプチド、または分泌シグナル活性を有するその活性断片であり、かつ前記IGF-2配列が、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、またはSEQ ID NO:9のいずれかより選択される、本発明1001~1003のいずれかの組換えAAVベクター。
[本発明1028]
前記IGF-2配列がSEQ ID NO:8またはSEQ ID NO:9である、本発明1026または1027の組換えAAVベクター。
[本発明1029]
キメラAAVベクター、ハプロイドAAVベクター、ハイブリッドAAVベクター、またはポリプロイドAAVベクターである、本発明1001~1003のいずれかの組換えAAVベクター。
[本発明1030]
表1にリストされたものおよびそれらの任意の組み合わせからなる群における任意のAAV血清型より選択されるカプシドタンパク質を含む、本発明1001~1003のいずれかの組換えAAVベクター。
[本発明1031]
前記血清型がAAV3bである、本発明1030の組換えAAVベクター。
[本発明1032]
AAV3b血清型が、265D、549A、Q263Yのいずれかより選択されるカプシドタンパク質において1つまたは複数の変異を含む、本発明1031の組換えAAVベクター。
[本発明1033]
AAV3b血清型が、AAV3b265D、AAV3b265D549A、AAV3b549A、またはAAV3bQ263Y、またはAAV3bSASTGのいずれかより選択される、本発明1031の組換えAAVベクター。
[本発明1034]
そのゲノム内に
(a)5'および3'AAV末端逆位配列(ITR)、ならびに
(b)5'ITRと3'ITRとの間に位置する、αグルコシダーゼ(GAA)ポリペプチドを含む融合ポリペプチドをコードする異種核酸配列であって、該異種核酸が肝臓特異的プロモーターと機能的に連結されている、該異種核酸配列
を含み、
AAV3b血清型のカプシドタンパク質を含む、
組換えアデノ随伴ウイルス(AAV)ベクター。
[本発明1035]
前記融合ポリペプチドが、前記GAAポリペプチドのN末端側に位置する分泌シグナルペプチドをさらに含む、本発明1034の組換えAAVベクター。
[本発明1036]
融合ポリペプチドをコードする前記異種核酸配列が、前記分泌シグナルペプチドと前記αグルコシダーゼ(GAA)ポリペプチドとの間に位置するIGF-2配列をさらに含む、本発明1034の組換えAAVベクター。
[本発明1037]
前記AAVのゲノムが、5'から3'への方向に、
(a)5'ITR、
(b)肝臓特異的プロモーター配列、
(c)イントロン配列、
(d)分泌シグナルペプチドをコードする核酸、
(e)IGF-2配列をコードする核酸、
(f)αグルコシダーゼ(GAA)ポリペプチドをコードする核酸、
(g)ポリA配列、および
(h)3'ITR
を含む、本発明1034の組換えAAVベクター。
[本発明1038]
前記分泌シグナルペプチドが、AATシグナルペプチド、フィブロネクチンシグナルペプチド(FN)、GAAシグナルペプチド、または、分泌シグナル活性を有するそれらの活性断片より選択される、本発明1034~1037のいずれかの組換えAAVベクター。
[本発明1039]
IGF-2リーダー配列が、ヒトカチオン非依存性マンノース-6-リン酸受容体(CI-MPR)またはIGF-2受容体と結合する、本発明1034~1037のいずれかの組換えAAVベクター。
[本発明1040]
前記IGF-2配列が、SEQ ID NO:5を含むか、または、SEQ ID NO:5において、前記IGF-2受容体との結合に影響を与える少なくとも1つのアミノ修飾を含む、本発明1039の組換えAAVベクター。
[本発明1041]
SEQ ID NO:5における前記少なくとも1つのアミノ修飾が、V43Mアミノ酸修飾(SEQ ID NO:8もしくはSEQ ID NO:9)またはΔ2-7(SEQ ID NO:6)またはΔ1-7(SEQ ID NO:7)である、本発明1040の組換えAAVベクター。
[本発明1042]
前記肝臓特異的プロモーターが、トランスサイレチンプロモーター(TTR)、LSPプロモーター(LSP)、合成肝臓特異的プロモーターのいずれかより選択される、本発明1034~1041のいずれかの組換えAAVベクター。
[本発明1043]
前記核酸配列が、野生型GAAポリペプチドまたは修飾型GAAポリペプチドをコードする、本発明1034~1042のいずれかの組換えAAVベクター。
[本発明1044]
前記GAAポリペプチドをコードする核酸配列が、ヒトGAA遺伝子またはヒトコドン最適化GAA遺伝子(coGAA)または修飾型GAA核酸配列である、本発明1034~1043のいずれかの組換えAAVベクター。
[本発明1045]
前記GAAポリペプチドをコードする核酸配列が、インビボでの発現の増強のためにコドン最適化されている、本発明1034~1044のいずれかの組換えAAVベクター。
[本発明1046]
前記GAAポリペプチドをコードする核酸配列が、CpGアイランドを減少させるようにコドン最適化されている、本発明1034~1044のいずれかの組換えAAVベクター。
[本発明1047]
前記GAAポリペプチドをコードする核酸配列が、自然免疫応答を低下させるようにコドン最適化されている、本発明1034~1044のいずれかの組換えAAVベクター。
[本発明1048]
前記GAAポリペプチドをコードする核酸配列が、CpGアイランドを減少させかつ自然免疫応答を低下させるようにコドン最適化されている、本発明1034~1044のいずれかの組換えAAVベクター。
[本発明1049]
前記イントロン配列がMVM配列またはHBB2配列を含む、本発明1034~1049のいずれかの組換えAAVベクター。
[本発明1050]
前記ITRが挿入、欠失、または置換を含む、本発明1034~1049のいずれかの組換えAAVベクター。
[本発明1051]
前記ITR内の1つまたは複数のCpGアイランドが除去されている、本発明1040の組換えAAVベクター。
[本発明1052]
前記分泌シグナルペプチドが、フィブロネクチンシグナルペプチド(FN1)、または分泌シグナル活性を有するその活性断片であり、かつ前記IGF-2配列が、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、またはSEQ ID NO:9のいずれかより選択される、本発明1034~1049のいずれかの組換えAAVベクター。
[本発明1053]
コードされた前記分泌シグナルペプチドが、AATシグナルペプチド、または分泌シグナル活性を有するその活性断片であり、かつ前記IGF-2配列が、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、またはSEQ ID NO:9のいずれかより選択される、本発明1034~1049のいずれかの組換えAAVベクター。
[本発明1054]
前記IGF-2配列がSEQ ID NO:8またはSEQ ID NO:9である、本発明1034~1049のいずれかの組換えAAVベクター。
[本発明1055]
前記本発明のいずれかの組換えAAVベクターと薬学的に許容される担体とを含む薬学的組成物。
[本発明1056]
核酸配列と機能的に連結された肝臓特異的プロモーターであって、該核酸配列が、以下の順に、分泌シグナルペプチドをコードする核酸、IGF-2配列をコードする核酸、GAAポリペプチドをコードする核酸を含む、該肝臓特異的プロモーター
を含む、核酸配列。
[本発明1057]
(a)5'および3'AAV末端逆位配列(ITR)核酸配列、ならびに
(b)5'ITR配列と3'ITR配列との間に位置する、分泌シグナルペプチドとαグルコシダーゼ(GAA)ポリペプチドとを含む融合ポリペプチドをコードする異種核酸配列であって、該異種核酸がプロモーターと機能的に連結されている、該異種核酸配列
を含む、組換えアデノ随伴ウイルス(rAAV)ベクターゲノムに関する核酸配列。
[本発明1058]
融合ポリペプチドをコードする前記異種核酸配列が、前記分泌シグナルペプチドと前記αグルコシダーゼ(GAA)ポリペプチドとの間に位置するIGF-2配列をさらに含む、本発明1057の核酸配列。
[本発明1059]
前記分泌シグナルをコードする核酸が、SEQ ID NO:17、22~26、またはそれらとの少なくとも約85%の配列同一性を有する核酸のいずれかより選択される、本発明1056または1057の核酸配列。
[本発明1060]
前記IGF-2配列をコードする核酸が、SEQ ID NO:2(IGF2-Δ2-7)、SEQ ID NO:3(IGF2-Δ1-7)、もしくはSEQ ID NO:4(IGF2 V43M)、またはそれらとの少なくとも約85%の配列同一性を有する核酸のいずれかより選択される、本発明1059の核酸配列。
[本発明1061]
前記GAAポリペプチドをコードする核酸配列が、ヒトGAA遺伝子またはヒトコドン最適化GAA遺伝子(coGAA)または修飾型GAA核酸配列である、本発明1056または1057の核酸配列。
[本発明1062]
前記GAAポリペプチドをコードする核酸配列が、インビボでの発現の増強のためにコドン最適化されている、本発明1056または1057の核酸配列。
[本発明1063]
前記GAAポリペプチドをコードする核酸配列が、CpGアイランドを減少させるようにコドン最適化されている、本発明1056または1057の核酸配列。
[本発明1064]
前記GAAポリペプチドをコードする核酸配列が、自然免疫応答を低下させるようにコドン最適化されている、本発明1056または1057の核酸配列。
[本発明1065]
前記GAAポリペプチドをコードする核酸配列が、CpGアイランドを減少させかつ自然免疫応答を低下させるようにコドン最適化されている、本発明1056または1057の核酸配列。
[本発明1066]
前記GAAポリペプチドをコードする核酸が、SEQ ID NO:11(全長hGAA)、SEQ ID NO:55(ドワイト(Dwight)cDNA)、SEQ ID NO 56(hGAAΔ1-66)のいずれかより選択される、本発明1056または1057の核酸配列。
[本発明1067]
前記GAAポリペプチドをコードする核酸が、SEQ ID NO:74(コドン最適化1)、SEQ ID NO:75(コドン最適化2)、およびSEQ ID NO:76(コドン最適化3)のいずれかより選択される、本発明1056または1057の核酸配列。
[本発明1068]
SEQ ID NO:57(AAT-V43M-wtGAA(デルタ1-69aa));SEQ ID NO:58(ラットFN1-IGF2V43M-wtGAA(デルタ1-69aa));SEQ ID NO:59(hFN1-IGF2V43M-wtGAA(デルタ1-69aa));SEQ ID NO:60(ATT-IGF2Δ2-7-wtGAA(デルタ1-69));SEQ ID NO:61(FN1ラット-IGFΔ2-7-wtGAA(デルタ1-69));SEQ ID NO:62(hFN1-IGFΔ2-7-wtGAA(デルタ1-69))、SEQ ID NO:79(AAT_hIGF2-V43M_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:80(FIBラット_hIGF2-V43M_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:81(FIBhum_hIGF2-V43M_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:82(AAT_GILT_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:83(FIBラット_GILT_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:84(FIBhum_GILT_wtGAA_del1-69_スタッファー.V02)、またはそれらとの少なくとも80%、85%、90%、95%、もしくは98%の同一性を有する核酸配列のいずれかより選択される、本発明1056または1057の核酸配列。
[本発明1069]
前記本発明のいずれかの組換えAAVベクターまたはrAAVゲノムまたは核酸配列のいずれかを、糖原貯蔵症II型(GSD II、ポンペ病、酸性マルターゼ欠損症)を有する対象またはαグルコシダーゼ(GAA)ポリペプチドの欠損を有する対象へ投与する工程を含む、該対象を処置するための方法。
[本発明1070]
GAAポリペプチドが前記対象の肝臓から分泌され、かつ骨格筋組織、心筋組織、横隔膜筋組織、またはそれらの組み合わせによる分泌されたGAAの取り込みがあり、ここで、分泌された該GAAの取り込みが該組織内のリソソームグリコーゲン貯蔵の低下をもたらす、本発明1069の方法。
[本発明1071]
前記対象への投与が、筋肉内投与、皮下投与、脊髄内投与、大槽内投与、くも膜下腔内投与、静脈内投与のいずれかより選択される、本発明1069の方法。
本発明の局面の他の特色および利点は、例として、本発明の局面の原理を例示する、添付の図面と共に理解される、以下のより詳細な説明から明らかになるであろう。
【図面の簡単な説明】
【0060】
本出願ファイルは、カラーで作成された少なくとも1つの図面を含有する。カラーの図面を含むこの特許出願公報のコピーは、請求および必要手数料の支払いによって、当局によって提供されるであろう。添付の図面は、本発明の局面を例示する。そのような図面において、以下の通りである。
【
図1】少なくとも一つの態様による、全血において測定された、ディプロイドゲノム1つ当たりのベクターゲノム数のy軸、ならびに異なるAAV血清型、AAV3b、AAV3ST、AAV8、およびAAV9のx軸を例示するグラフである。
【
図2】少なくとも一つの態様による、肝臓の左葉、中葉、および右葉において測定された、ディプロイドゲノム1つ当たりのベクターゲノム数のy軸、ならびに異なるAAV血清型、AAV3b、AAV3ST、AAV8、およびAAV9のx軸を例示するグラフである。
【
図3】少なくとも一つの態様による、アデノ随伴ウイルスベクタープラスミドのプラスミドマップの例示である。
【
図4】少なくとも一つの態様による、pAAV-LSPhGAAプラスミドのプラスミドマップの例示である。
【
図5-1】本明細書中に開示されるrAAVゲノムについての例示的な核酸構築物の例示である。
図5Aは、5'ITR、プロモーター、それらと機能的に連結された、分泌シグナルペプチド(SS)、ターゲティングペプチド、およびヒトGAAポリペプチドをコードする核酸、ならびに3'ITRを含むrAAVゲノムについての核酸構築物を示す。
図5A、5'ITR、プロモーター、それらと機能的に連結された、分泌シグナルペプチド(SS)、ターゲティングペプチド(TP)、およびヒトGAA(hGAA)ポリペプチドをコードする核酸、ならびに3'ITRを含むrAAVゲノムについての核酸構築物。
図5Bは、
図5Aと同一の要素を含み、hGAAポリペプチドの3'側かつ'-ITRの5'側に、少なくとも1つのポリAシグナルを付加的に含む、本明細書中に開示されるrAAVゲノムについての例示的な核酸構築物を示す。
図5Cは、プロモーターの3'側にイントロン配列を含むことを除き、
図5Bと同一の要素を含む、本明細書中に開示されるrAAVゲノムについての例示的な核酸構築物を示す。
図5Dは、hGAAポリペプチド核酸配列の3'側かつポリA配列の前に位置するコラーゲン安定性(CS)配列を含むことを除き、
図5Cと同一の要素を含む、本明細書中に開示されるrAAVゲノムについての例示的な核酸構築物を示す。
【
図5-2】本明細書中に開示されるrAAVゲノムについての例示的な核酸構築物の例示である。
図5Eは、hGAAポリペプチドをコードする核酸と、ターゲティングペプチド(TP)、例えば、IGF2配列をコードする核酸との間に位置する、少なくとも1アミノ酸のスペーサーをコードする核酸も含むことを除き、
図5Dと同一の要素を含む、本明細書中に開示されるrAAVゲノムについての例示的な核酸構築物を示す。
図5Fは、プロモーターが肝臓プロモーターであり、イントロン配列がMVMまたはHBB2イントロン配列より選択され、分泌シグナルペプチドがFN1シグナルペプチド(例えば、hFN1、ラットFN1)、AATシグナルペプチド、またはhGAAシグナルペプチドのいずれかより選択され;ターゲティングペプチドが本明細書中に開示されるIGF2配列であり、少なくともポリA配列がhGHpAまたはsynPAポリA配列より選択される、
図5Eと同一の要素を含む、本明細書中に開示されるrAAVゲノムについての例示的な核酸構築物を示す。
図5Gは、IGF2配列がSEQ ID NO:2(IGF2Δ2-7)、SEQ ID NO:3(IGF2Δ1-7)、またはSEQ ID NO:4(IGF2 V43M)より選択される核酸配列であることを除き、
図5Fと同一の要素を含む、本明細書中に開示されるrAAVゲノムについての例示的な核酸構築物を示す。
【
図6】5'ITR、肝臓特異的プロモーター、それらと機能的に連結された、イントロン配列(例えば、MVMまたはHBB2イントロン配列)、FN1、ATT、またはGAAシグナルペプチドのいずれかより選択されるシグナル分泌ペプチドをコードする核酸、ヒトGAAポリペプチドをコードする核酸、コラーゲン安定性(CS)配列、少なくとも1つのポリA配列(例えば、hGHpAおよび/またはsynPAポリA配列)、ならびに3'ITRを含むrAAVゲノムについての例示的な核酸構築物を示す。
【
図7】本明細書中に開示されるrAAVゲノムを生成するためのギブソン(Gibson)クローニング法の例示を示す。具体的には、核酸配列の3つのブロックを共にライゲートするため、3重ライゲーションが実施され、次いで、それが、rAAVゲノムを生成するため、プロモーター、例えば、肝臓特異的プロモーター、ならびに5'および3'ITRと共にベクターにクローニングされ得る。ギブソンクローニング方法論を、以下のrAAVゲノムを生成するために使用した:SEQ ID NO:57(AAT-V43M-wtGAA(デルタ1-69aa));SEQ ID NO:58(ラットFN1-IGF2V43M-wtGAA(デルタ1-69aa));SEQ ID NO:59(hFN1-IGF2V43M-wtGAA(デルタ1-69aa));SEQ ID NO:60(ATT-IGF2Δ2-7-wtGAA(デルタ1-69));SEQ ID NO:61(FN1ラット-IGFΔ2-7-wtGAA(デルタ1-69));SEQ ID NO:62(hFN1-IGFΔ2-7-wtGAA(デルタ1-69))。
【
図8】核酸配列ブロック(1、2、および3)のギブソンクローニングを使用した、AAT-V43M-wtGAA(デルタ1-69aa)を含むSEQ ID NO:57の例示的なrAAVゲノムの生成を示す。AAT-V43M-wtGAA(デルタ1-69aa)ベクターにおいて、IGF(V42M)ターゲティングペプチドをコードする核酸配列の3'側、かつwtGAA(Δ1-69)酵素をコードする核酸の5'側に位置する(SEQ ID NO:31としての例示的な3aa配列「G-A-P」を示す)3アミノ酸(3aa)スペーサー核酸配列と、ポリA配列の3'側、かつ3'ITR配列の5'側に位置する(
図8において「スペーサー」配列と呼ばれる)スタッファー核酸配列との位置も示される。
【
図9】核酸配列ブロック(4、2、および3)のギブソンクローニングを使用した、ラットFN1-IGF2V43M-wtGAA(デルタ1-69aa)を含むSEQ ID NO:58の例示的なrAAVゲノムの生成を示す。ラットFN1-IGF2V43M-wtGAA(デルタ1-69aa)ベクターにおいて、IGF(V42M)ターゲティングペプチドをコードする核酸配列の3'側、かつwtGAA(Δ1-69)酵素をコードする核酸の5'側に位置する(SEQ ID NO:31としての例示的な3aa配列「G-A-P」を示す)3アミノ酸(3aa)スペーサー核酸配列と、ポリA配列の3'側、かつ3'ITR配列の5'側に位置する(
図9において「スペーサー」配列と呼ばれる)スタッファー核酸配列との位置も示される。
【
図10】核酸配列ブロック(5、2、および3)のギブソンクローニングを使用した、hFN1-IGF2V43M-wtGAA(デルタ1-69aa)を含むSEQ ID NO:59の例示的なrAAVゲノムの生成を示す。hFN1-IGF2V43M-wtGAA(デルタ1-69aa)ベクターにおいて、IGF(V42M)ターゲティングペプチドをコードする核酸配列の3'側、かつwtGAA(Δ1-69)酵素をコードする核酸の5'側に位置する(SEQ ID NO:31としての例示的な3aa配列「G-A-P」を示す)3アミノ酸(3aa)スペーサー核酸配列と、ポリA配列の3'側、かつ3'ITR配列の5'側に位置する(
図10において「スペーサー」配列と呼ばれる)スタッファー核酸配列との位置も示される。
【
図11】核酸配列ブロック(6、2、および3)のギブソンクローニングを使用した、ATT-IGF2Δ2-7-wtGAA(デルタ1-69)を含むSEQ ID NO:60の例示的なrAAVゲノムの生成を示す。ATT-IGF2Δ2-7-wtGAA(デルタ1-69)ベクターにおいて、IGF2Δ2-7ターゲティングペプチドをコードする核酸配列の3'側、かつwtGAA(Δ1-69)酵素をコードする核酸の5'側に位置する(SEQ ID NO:31としての例示的な3aa配列「G-A-P」を示す)3アミノ酸(3aa)スペーサー核酸配列と、ポリA配列の3'側、かつ3'ITR配列の5'側に位置する(
図11において「スペーサー」配列と呼ばれる)スタッファー核酸配列との位置も示される。
【
図12】核酸配列ブロック(7、2、および3)のギブソンクローニングを使用した、FN1ラット-IGFΔ2-7-wtGAA(デルタ1-69)を含むSEQ ID NO:61のrAAVゲノムの生成を示す。FN1ラット-IGFΔ2-7-wtGAA(デルタ1-69)ベクターにおいて、IGFΔ2-7ターゲティングペプチドをコードする核酸配列の3'側、かつwtGAA(Δ1-69)酵素をコードする核酸の5'側に位置する(SEQ ID NO:31としての例示的な3aa配列「G-A-P」を示す)3アミノ酸(3aa)スペーサー核酸配列と、ポリA配列の3'側、かつ3'ITR配列の5'側に位置する(
図12において「スペーサー」配列と呼ばれる)スタッファー核酸配列との位置も示される。
【
図13】核酸配列ブロック(8、2、および3)のギブソンクローニングを使用した、hFN1-IGFΔ2-7-wtGAA(デルタ1-69)を含むSEQ ID NO:62のrAAVゲノムの生成を示す。hFN1-IGFΔ2-7-wtGAA(デルタ1-69)ベクターにおいて、IGFΔ2-7ターゲティングペプチドをコードする核酸配列の3'側、かつwtGAA(Δ1-69)酵素をコードする核酸の5'側に位置する(SEQ ID NO:31としての例示的な3aa配列「G-A-P」を示す)3アミノ酸(3aa)スペーサー核酸配列と、ポリA配列の3'側、かつ3'ITR配列の5'側に位置する(
図13において「スペーサー」配列と呼ばれる)スタッファー核酸配列との位置も示される。
【
図14A】野生型GAAを発現するrAAVゲノムの例示的な構築物の模式図を示す。
図14Aは、候補1_AAT_hIGF2-V43M_wtGAA_del1-69_スタッファー.V02(SEQ ID NO:79)の例示的なrAAVゲノム構築物の模式図を示す。
【
図14B】野生型GAAを発現するrAAVゲノムの例示的な構築物の模式図を示す。
図14Bは、候補2_FIBラット_hIGF2-V43M_wtGAA_del1-69_スタッファー.V02(SEQ ID NO:80)の例示的なrAAVゲノム構築物の模式図を示す。
【
図14C】野生型GAAを発現するrAAVゲノムの例示的な構築物の模式図を示す。
図14Cは、候補3_FIBhum_hIGF2-V43M_wtGAA_del1-69_スタッファー.V02(SEQ ID NO:81)の例示的なrAAVゲノム構築物の模式図を示す。
【
図14D】野生型GAAを発現するrAAVゲノムの例示的な構築物の模式図を示す。
図14Dは、候補4_AAT_GILT_wtGAA_del1-69_スタッファー.V02(SEQ ID NO:82)の例示的なrAAVゲノム構築物の模式図を示す。
【
図14E】野生型GAAを発現するrAAVゲノムの例示的な構築物の模式図を示す。
図14Eは、候補5_FIBラット_GILT_wtGAA_del1-69_スタッファー.V02(SEQ ID NO:83)の例示的なrAAVゲノム構築物の模式図を示す。
【
図14F】野生型GAAを発現するrAAVゲノムの例示的な構築物の模式図を示す。
図14Fは、候補6_FIBhum_GILT_wtGAA_del1-69_スタッファー.V02(SEQ ID NO:84)の例示的なrAAVゲノム構築物の模式図を示す。
【発明を実施するための形態】
【0061】
前記の図面は、以下の説明においてさらに詳細に定義される例示的な態様のうちの少なくとも一つにおける本発明の局面を例示する。異なる図面において同一の数字によって参照される本発明の特色、要素、および局面は、一つまたは複数の態様による、同一の、等価な、または類似した特色、要素、または局面を表す。
【0062】
詳細な説明
本明細書中に記載された本開示は、一般に、GAAポリペプチドを対象へ送達するための、遺伝子治療のためのrAAVゲノムのための組換えAAV(rAAV)ベクターおよび構築物に関する。具体的には、本明細書中に記載された技術は、一般に、肝臓において発現され、哺乳動物細胞、例えば、ヒトの心筋細胞および骨格筋細胞のリソソームへ効果的にターゲティングされるGAAポリペプチドを作製するためのrAAVベクターまたはrAAVゲノムに関する。例えば、本技術は、肝細胞を形質導入するためのrAAVベクターに関し、ここで、形質導入された肝細胞は、GAAポリペプチドを分泌し、分泌されたGAAポリペプチドは、骨格筋組織、心筋組織、横隔膜筋組織、またはそれらの組み合わせにおいてリソソームへターゲティングされる。
【0063】
従って、本明細書中に記載された技術の一つの局面は、細胞、例えば、肝細胞からより効果的に分泌され、次いで、哺乳動物細胞、例えば、ヒトの心筋細胞および骨格筋細胞のリソソームへターゲティングされるGAAを作製するために使用され得るrAAVゲノムを含むrAAVベクターを提供する。
【0064】
具体的には、いくつかの態様において、GAAポリペプチドは、肝臓からのGAAポリペプチドの分泌を促進するシグナルペプチドを少なくとも含む融合タンパク質として発現される。いくつかの態様において、GAAポリペプチドは、肝臓からのGAAポリペプチドの分泌を促進するシグナルペプチド、ならびに哺乳動物細胞、例えば、筋細胞、例えば、ヒトの心筋細胞および骨格筋細胞のリソソームへの効果的なターゲティングを可能にするターゲティング配列を少なくとも含む融合タンパク質として発現される。いくつかの態様において、ターゲティングペプチドは、本明細書中に記載されたIGF2配列である。
【0065】
本明細書中に記載された技術の一つの局面は、ポンペ病のような疾患を処置するために使用するための、さらに、ポンペ病の処置のための、末端逆位配列(ITR)、プロモーター、異種遺伝子、ポリAテールを含有し、その他の制御要素を含有してもよいヌクレオチド配列を含むrAAVベクターに関し、ここで、異種遺伝子はGAAであり、rAAV GAAは、異種遺伝子の発現および疾患の処置のため、適切な組織および/または器官へ送達される治療的に有効な用量で、患者へ投与され得る。
【0066】
本明細書中に記載された技術の一つの局面はrAAVベクターに関し、該rAAVベクターはそのゲノム内に、5'から3'への方向に、5'および3'AAV末端逆位配列(ITR)、ならびに5'ITRと3'ITRとの間に位置する、(i)分泌シグナルペプチド(SS)と(ii)IGF2配列と(iii)αグルコシダーゼ(GAA)ポリペプチドとを含む融合ポリペプチドをコードする異種核酸配列を含み、ここで、異種核酸は、プロモーターと機能的に連結されている。本明細書中に開示される方法および組成物のいくつかの態様において、分泌シグナルペプチドは、AATシグナルペプチド、フィブロネクチンシグナルペプチド(FN1)、GAAシグナルペプチド、または、分泌シグナル活性を有するそれらの活性断片のいずれかより選択される。
【0067】
いくつかの態様において、本明細書中に記載されたrAAVベクターは、任意の血清型に由来する。いくつかの態様において、rAAVベクターは、AAV3b265Dビリオン、AAV3b265D549Aビリオン、AAV3b549Aビリオン、AAV3bQ263Yビリオン、またはAAV3bSASTGビリオン(即ち、Q263A/T265変異を含むAAV3bカプシドを含むビリオン)を含むが、これらに限定されるわけではないAAV3b血清型である。
【0068】
本技術の局面は、薬学的に許容される担体に含まれる本明細書中に開示されるrAAVベクターを、治療的に有効な量、対象へ投与する工程を含む、対象におけるGAAポリペプチドの欠損を処置する方法における、本明細書中に記載されたrAAVベクターの使用に関する。いくつかの態様において、rAAVベクターは、(2型糖原貯蔵症またはGSD IIとしても公知の)ポンペ病の処置または予防において使用するためのものである。いくつかの態様において、対象は、哺乳動物であり、哺乳動物は、ヒト、霊長類、イヌ、ウマ、ウシ、ネコである。
【0069】
いくつかの態様において、rAAVベクターは、N末端分泌シグナルペプチドを少なくとも含むGAAポリペプチドをコードする核酸を含み、ここで、rAAVベクターによって形質導入された肝細胞は、GAAポリペプチドおよびN末端分泌ペプチドを発現し、GAAポリペプチドを分泌する。さらに、分泌されるGAAポリペプチドは、骨格筋組織、心筋組織、横隔膜筋組織、筋肉組織を刺激する神経細胞、またはそれらの組み合わせにおける、GAAポリペプチドの取り込みおよびリソソームへのターゲティングを増強するため、GAAポリペプチドのN末端またはC末端に付着したターゲティング配列、例えば、IGF2配列も、任意で含み得る。さらに、一態様において、分泌されたGAAポリペプチドの筋細胞への取り込みは、組織内のリソソームグリコーゲン貯蔵の低下、およびポンペ病に関連した症状の低下または排除をもたらす。
【0070】
一態様において、rAAVベクターは、カプシドを含み、カプシド内には、「rAAVベクターゲノム」と本明細書において呼ばれるヌクレオチド配列が存在する。rAAVベクターゲノムは、2つの末端逆位配列(ITR、例えば、5'-ITRおよび3'-ITR)、ならびにITR間に位置する、プロモーター、異種遺伝子、およびポリAテールを含む付加的な要素を含むが、これらに限定されるわけではない複数の要素を含む。さらなる態様において、付加的な要素、例えば、miRNAまたはshRNA配列の結合のためのシード領域配列が、ITR間に存在してもよい。
【0071】
I. 定義
以下の用語が、本明細書中の説明および添付の特許請求の範囲において使用される。
【0072】
本発明の説明に関して(特に、以下の特許請求の範囲に関して)使用される「1つの(a)」、「1つの(an)」、「その(the)」という用語、ならびに類似した言及は、その他のことが本明細書中に示されるかまたは前後関係によって明白に否定されない限り、単数および複数の両方をカバーすると解釈されるべきである。さらに、同定された要素についての「第1」、「第2」、「第3」等のような順序を示す語は、要素を区別するために使用され、そのような要素の必要とされるかまたは限定される数を示すかまたは意味するものではなく、その他のことが具体的に明記されない限り、そのような要素の具体的な位置または順序を示すものではない。その他のことが本明細書中に示されるかまたは前後関係によって明白に否定されない限り、本明細書中に記載された全ての方法が、任意の適切な順序で実施され得る。本明細書中に提供された任意の全ての例または例示的な言語(例えば、「のような」)の使用は、本発明の理解をより容易にするためのものに過ぎず、特許請求の範囲に記載される本発明の範囲を制限するものではない。本明細書中のいかなる言語も、本発明の実施のために必須の特許請求の範囲に記載されない要素を示すものとして解釈されるべきではない。
【0073】
さらに、「約」という用語は、本明細書において使用されるように、ポリヌクレオチドまたはポリペプチドの配列の長さ、用量、時間、温度等の量のような測定可能な値をさす時、指定された量の±20%、±10%、±5%、±1%、±0.5%、またはさらには±0.1%の変動を包含するものとする。
【0074】
また、本明細書において使用されるように、「および/または」とは、関連付けられたリストされた項目のうちの1つまたは複数の任意の全ての可能な組み合わせのみならず、代替的に解釈された時の組み合わせの欠如(「または」)もさし、包含する。
【0075】
本明細書において使用されるように、「から本質的になる」という移行句は、特許請求の範囲の範囲が、特許請求の範囲に記載された指定された材料または工程、および特許請求の範囲に記載された本発明の「基本的かつ新規の特徴に実質的に影響を与えないもの」を包含すると解釈されるべきであることを意味する。In re Herz,537 F.2d 549,551-52,190 USPQ 461,463(CCPA 1976)(強調は原文通り)を参照すること;MPEP§2111.03も参照すること。従って、「から本質的になる」という用語は、本発明の特許請求の範囲において使用される時、「を含む」と等価であると解釈されないものとする。前後関係がその他のことを示さない限り、特に、本明細書中に記載された本発明の様々な特色は、任意の組み合わせで使用され得るものとする。
【0076】
さらに、本発明は、本発明のいくつかの態様において、本明細書中に示される任意の特色または特色の組み合わせが、除外されるかまたは省略されてもよいことも企図する。
【0077】
さらに例示するため、例えば、本明細書が、特定のアミノ酸がA、G、I、L、および/またはVより選択され得ることを示す場合、この言語は、これらのアミノ酸の任意のサブセット、例えば、A、G、I、またはL;A、G、I、またはV;AまたはG;Lのみ;等が、各々、特別に本明細書中に示されたかのごとく、そのような部分的組み合わせよりアミノ酸が選択され得ることも示す。さらに、そのような言語は、指定されたアミノ酸のうちの1つまたは複数が(例えば、否定的な条件付けによって)放棄され得ることも示す。例えば、具体的な態様において、A、GまたはIではない;Aではない;GまたはVではない;等のような可能な放棄が各々特別に本明細書中に示されたかのごとく、アミノ酸が放棄される。
【0078】
「パルボウイルス」という用語は、本明細書において使用されるように、自律複製性のパルボウイルスおよびディペンドウイルスを含むパルボウイルス(Parvoviridae)科を包含する。自律性パルボウイルスには、パルボウイルス(Parvovirus)属、エリスロウイルス(Erythrovirus)属、デンソウイルス(Densovirus)属、イテラウイルス(Iteravirus)属、およびコントラウイルス(Contravirus)属のメンバーが含まれる。例示的な自律性パルボウイルスには、マウス微小ウイルス、ウシパルボウイルス、イヌパルボウイルス、ニワトリパルボウイルス、ネコ汎白血球減少症ウイルス、ネコパルボウイルス、ガチョウパルボウイルス、H1パルボウイルス、ノバリケン(Muscovy duck)パルボウイルス、B19ウイルス、および現在公知であるかまたは後に発見されるその他の自律性パルボウイルスが含まれるが、これらに限定されるわけではない。その他の自律性パルボウイルスは、当業者に公知である。例えば、BERNARD N.FIELDS et al.,VIROLOGY,volume 2,chapter 69(4th ed.,Lippincott-Raven Publishers)を参照すること。
【0079】
本明細書において使用されるように、「アデノ随伴ウイルス」(AAV)という用語には、1型AAV、2型AAV、3型AAV(3A型および3B型を含む)、4型AAV、5型AAV、6型AAV 、7型AAV 、8型AAV、9型AAV、10型AAV、11型AAV、トリAAV、ウシAAV、イヌAAV、ウマAAV、ヒツジAAV、および現在公知であるかまたは後に発見されるその他のAAVが含まれるが、これらに限定されるわけではない。例えば、BERNARD N.FIELDS et al.,VIROLOGY,volume 2,chapter 69(4th ed.,Lippincott-Raven Publishers)を参照すること。多数の比較的新しいAAV血清型およびクレードが同定されている(例えば、Gao et al.,(2004)J.Virology 78:6381-6388;Moris et al.,(2004)Virology 33-:375-383;および表1を参照すること)。
【0080】
AAVおよび自律性パルボウイルスの様々な血清型のゲノム配列も、ネイティブ末端逆位配列(ITR)、Repタンパク質、およびカプシドサブユニットの配列も、当技術分野において公知である。そのような配列は、文献またはGenBankのような公のデータベースに見出され得る。例えば、GenBankアクセッション番号NC_002077、NC_001401、NC_001729、NC_001863、NC_001829、NC_001862、NC_000883、NC_001701、NC_001510、NC_006152、NC_006261、AF063497、U89790、AF043303、AF028705、AF028704、J02275、J01901、J02275、X01457、AF288061、AH009962、AY028226、AY028223、NC_001358、NC_001540、AF513851、AF513852、AY530579(これらの開示は、パルボウイルスならびにAAVの核酸配列およびアミノ酸配列を教示するため、参照によって本明細書中に組み入れられる)を参照すること。例えば、Srivistava et al.,(1983)J Virology 45:555;Chiarini et al.,(1998)J.Virology 71:6823;Chiarini et al.,(1999)J.Virology 73:1309;Bantel-Schaal et al.,(1999)J.Virology 73:939;Xiao et al.,(1999)J.Virology 73:3994;Muramatsu et al.,(1996)Virology 221:208;Shade et al.,(1986)J.Viral.58:921;Gao et al.,(2002)Proc.Nat.Acad.Sci.USA 99:11854;Morris et al.,(2004)Virology 33-:375-383;国際特許公報WO 00/28061、WO 99/61601、WO 98/11244;および米国特許第6,156,303号(これらの開示は、パルボウイルスならびにAAVの核酸配列およびアミノ酸配列を教示するため、参照によって本明細書中に組み入れられる)も参照すること。本明細書中に開示された表1および5も参照すること。
【0081】
自律性パルボウイルスおよびAAVのカプシド構造は、BERNARD N.FIELDS et al.,VIROLOGY,volume 2,chapters 69 & 70(4th ed.,Lippincott-Raven Publishers)に、より詳細に記載されている。AAV2(Xie et al.,(2002)Proc.Nat.Acad.Sci.99:10405-10)、AAV4(Padron et al.,(2005)J.Viral.79:5047-58)、AAV5(Walters et al.,(2004)J.Viral.78:3361-71)、ならびにCPV(Xie et al.,(1996)J.Mal.Biol.6:497-520およびTsao et al.,(1991)Science 251:1456-64)の結晶構造の記載も参照すること。
【0082】
「向性」という用語は、本明細書において使用されるように、ウイルスが特定の細胞または組織へ優先的に侵入し、任意で、その後、細胞において、ウイルスゲノムが保持する配列の発現(例えば、転写、および、任意で、翻訳)、例えば、組換えウイルスの場合、関心対象の異種核酸の発現が起こることをさす。
【0083】
本明細書において使用されるように、「全身向性」および「全身形質導入」(および等価な用語)は、本発明のウイルスカプシドまたはウイルスベクターが、全身の組織(例えば、脳、肺、骨格筋、心臓、肝臓、腎臓、および/もしくは膵臓)への向性を示し、かつ/またはそれらを形質導入することを示す。本発明の態様において、中枢神経系(例えば、脳、ニューロン細胞等)の全身形質導入が観察される。他の態様において、心筋組織の全身形質導入が達成される。
【0084】
本明細書において使用されるように、「選択的向性」または「特異的向性」とは、特定の標的細胞および/もしくは特定の組織へのウイルスベクターの送達、ならびに/またはそれらの特異的な形質導入を意味する。
【0085】
本発明のいくつかの態様において、本発明のカプシドを含むAAV粒子は、30の特定の組織/細胞の効率的な形質導入、および形質導入が望ましくない特定の組織/細胞の極めて低レベルの形質導入(例えば、低下した形質導入)という複数の表現型を示し得る。
【0086】
本明細書において使用されるように、その他のことが示されない限り、「ポリペプチド」という用語には、ペプチドおよびタンパク質の両方が包含される。
【0087】
「ポリヌクレオチド」とは、ヌクレオチド塩基の配列であり、(天然に存在するヌクレオチドおよび天然に存在しないヌクレオチドの両方を含む)RNA、DNA、またはDNA-RNAハイブリッド配列であり得るが、代表的な態様において、一本鎖または二本鎖のいずれか一方のDNA配列である。
【0088】
「キメラ核酸」は、融合ポリペプチドをコードするため、共有結合的に共に連結された2つまたはそれ以上の核酸配列を含む。核酸は、DNA、RNA、またはそれらのハイブリッドであり得る。
【0089】
「融合ポリペプチド」という用語は、共有結合的に、典型的には、ペプチド結合によって共に連結された2つまたはそれ以上のポリペプチドを含む。
【0090】
本明細書において使用されるように、「単離された」ポリヌクレオチド(例えば、「単離されたDNA」または「単離されたRNA」)とは、天然に存在する生物またはウイルスの他の成分、例えば、ポリヌクレオチドに関連して一般的に見出される細胞またはウイルスの構造成分またはその他のポリペプチドもしくは核酸の少なくとも一部から少なくとも部分的に分離されたポリヌクレオチドを意味する。代表的な態様において、「単離された」ヌクレオチドは、出発材料と比較して、少なくとも約10倍、100’倍、1000倍、10,000倍、またはそれ以上、濃縮されている。
【0091】
同様に、「単離された」ポリペプチドとは、天然に存在する生物またはウイルスの他の成分、例えば、ポリペプチドに関連して一般的に見出される細胞またはウイルスの構造成分またはその他のポリペプチドもしくは核酸の少なくとも一部から少なくとも部分的に分離されたポリペプチドを意味する。代表的な態様において、「単離された」ポリペプチドは、出発材料と比較して、少なくとも約10倍、100倍、1000倍、10,000倍、またはそれ以上、濃縮されている。
【0092】
「単離された細胞」とは、天然状態において通常関連している他の成分から分離されている細胞をさす。例えば、単離された細胞は、培養培地中の細胞および/または本発明の薬学的に許容される担体中の細胞であり得る。従って、単離された細胞は、対象へ送達され、かつ/または導入され得る。いくつかの態様において、単離された細胞は、対象から取り出され、エクスビボで本明細書中に記載されるように操作され、次いで、対象へ戻された細胞であり得る。
【0093】
本明細書において使用されるように、ウイルスベクターまたはウイルス粒子またはウイルス粒子の集団を「単離する」または「精製する」(または文法上の等価物)とは、ウイルスベクターまたはウイルス粒子またはウイルス粒子の集団が、出発材料中の他の成分の少なくとも一部から少なくとも部分的に分離されることを意味する。代表的な態様において、「単離された」または「精製された」ウイルスベクターまたはウイルス粒子またはウイルス粒子の集団は、出発材料と比較して、少なくとも約10倍、100倍、1000倍、10,000倍、またはそれ以上、濃縮されている。
【0094】
その他のことが示されない限り、「効率的な形質導入」または「効率的な向性」または類似した用語は、適切な対照を基準として決定され得る(例えば、それぞれ、対照の形質導入または向性の少なくとも約10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、125%、150%、175%、200%、250%、300%、350%、400%、500%、またはそれ以上)。具体的な態様において、ウイルスベクターは、ニューロン細胞および心筋細胞を効率的に形質導入するか、またはそれらに対する効率的な向性を有する。適切な対照は、所望の向性および/または形質導入のプロファイルを含む多様な因子に依るであろう。
【0095】
「治療用ポリペプチド」とは、細胞または対象におけるタンパク質の欠如または欠陥に起因する症状を緩和し、低下させ、防止し、遅延させ、かつ/もしくは安定化するポリペプチドであり、かつ/またはその他の利益、例えば、疾患の症状を低下させるかもしくは排除するための酵素補充、もしくは移植片生存可能性の改善、もしくは免疫応答の誘導を、対象へ付与するポリペプチドである。
【0096】
「を処置する」、「を処置すること」、または「の処置」という用語(およびそれらの文法上のバリエーション)は、対象の状態の重症度が、低下するか、少なくとも部分的に改善されるか、もしくは安定化されること、および/または少なくとも1つの臨床症状のいくらかの緩和、軽減、減少、もしくは安定化が達成されること、および/または疾患もしくは障害の進行の遅延が起こることを意味する。
【0097】
「を防止する」、「を防止すること」、および「防止」という用語(ならびにそれらの文法上のバリエーション)は、対象における疾患、障害、および/もしくは臨床症状の発症の防止および/もしくは遅延、ならびに/または本発明の方法の非存在下で起こるものと比べた、疾患、障害、および/もしくは臨床症状の発症の重症度の低下をさす。防止は、完全なもの、例えば、疾患、障害、および/または臨床症状の全くの欠如であり得る。防止は、対象における疾患、障害、および/または臨床症状の発生が、本発明の非存在下で起こるものより実質的に少ないような、部分的なものであってもよい。
【0098】
「処置に有効な」量とは、本明細書において使用されるように、いくらかの改善または利益を対象に提供するために十分な量である。換言すると、「処置に有効な」量とは、対象における少なくとも1つの臨床症状のいくらかの緩和、軽減、減少、または安定化を提供する量である。いくらかの利益が対象に提供される限り、治療効果は完全または治癒的でなくてもよいことを、当業者は認識するであろう。
【0099】
「防止に有効な」量とは、本明細書において使用されるように、対象における疾患、障害、および/もしくは臨床症状の発症を防止し、かつ/もしくは遅延させるため、かつ/または本発明の方法の非存在下で起こるものと比べて、対象における疾患、障害、および/もしくは臨床症状の発症の重症度を低下させ、かつ/もしくは遅延させるために十分な量である。いくらかの予防的利益が対象に提供される限り、防止のレベルは完全でなくてもよいことを、当業者は認識するであろう。
【0100】
「異種ヌクレオチド配列」および「異種核酸分子」という用語は、本明細書において交換可能に使用され、ウイルスに天然に存在しない核酸配列をさす。一般に、異種核酸分子または異種ヌクレオチド配列は、(例えば、細胞および/または対象へ送達するための)関心対象のポリペプチドおよび/または非翻訳RNA、例えば、GAAポリペプチドをコードするオープンリーディングフレームを含む。
【0101】
本明細書において使用されるように、「ウイルスベクター」、「ベクター」、または「遺伝子送達ベクター」という用語は、核酸送達媒体として機能し、ビリオン内にパッケージングされたベクターゲノム(例えば、ウイルスDNA[vDNA])を含むウイルス(例えば、AAV)粒子をさす。あるいは、いくつかの状況において、「ベクター」という用語は、単独のベクターゲノム/vDNAをさすために使用され得る。
【0102】
「rAAVベクターゲノム」または「rAAVゲノム」とは、1つまたは複数の異種核酸配列を含むAAVゲノム(即ち、vDNA)である。rAAVベクターは、一般に、ウイルスを生成するため、末端逆位配列(TR)のみをシスに必要とする。他のウイルス配列は全て、不可欠ではなく、トランスに供給され得る(Muzyczka,(1992)Curr.Topics Microbial.Immunol.158:97)。典型的には、rAAVベクターゲノムは、ベクターによって効率的にパッケージングされ得るトランスジーンのサイズを最大限にするため、1つまたは複数のTR配列のみを保持するであろう。構造タンパク質および非構造タンパク質をコードする配列は、(例えば、プラスミドのようなベクターから、またはパッケージングング細胞への配列の安定的な組み込みによって)トランスに供給され得る。本発明の態様において、rAAVベクターゲノムは、少なくとも1つのITR配列(例えば、AAV TR配列)を含み、任意で、2つのITR(例えば、2つのAAV TR)を含み、それらは、典型的には、ベクターゲノムの5'および3'末端において存在し、異種核酸に隣接しているが、連続していなくてもよい。TRは、相互に同一であってもよいかまたは異なっていてもよい。
【0103】
「末端反復」または「TR」という用語には、ヘアピン構造を形成し、末端逆位配列(即ち、複製、ウイルスパッケージングング、組み込み、および/またはプロウイルス救済等のような所望の機能を媒介するITR)として機能する任意のウイルス末端反復または合成配列が含まれる。TRは、AAV TRまたは非AAV TRであり得る。例えば、他のパルボウイルス(例えば、イヌパルボウイルス(CPV)、マウスパルボウイルス(MVM)、ヒトパルボウイルスB-19)のもの、またはその他の適切なウイルス配列(例えば、SV40複製開始点として役立つSV40ヘアピン)のような非AAV TR配列が、TRとして使用され得、それらは、短縮、置換、欠失、挿入、および/または付加によってさらに修飾されてもよい。さらに、TRは、Samulskiらの米国特許第5,478,745号に記載される「ダブルD配列」のような、部分的にまたは完全に合成のものであってもよい。
【0104】
「AAV末端反復」または「AAV TR」、例えば、「AAV末端逆位配列」または「AAV ITR」は、血清型1、2、3、4、5、6、7、8、9、10、11、もしくは12、または現在公知であるかもしくは後に発見される任意のその他のAAVを含むが、これらに限定されるわけではない、任意のAAVに由来し得る(例えば、表3を参照すること)。AAV末端反復は、所望の機能、例えば、複製、ウイルスパッケージングング、組み込み、および/またはプロウイルス救済等を媒介する限り、ネイティブ末端反復配列を有していなくてもよい(例えば、ネイティブAAV TRまたはAAV ITR配列が、挿入、欠失、短縮、および/またはミスセンス変異によって変更されてもよい)。
【0105】
AAVタンパク質VP1、VP2、およびVP3は、正二十面体対称のAAVカプシドを形成するため、共に相互作用するカプシドタンパク質である。VP1.5は、米国特許出願公開第2014/0037585号に記載されたAAVカプシドタンパク質である。
【0106】
本発明のウイルスベクターは、さらに、(例えば、定方向の向性を有する)「標的特異的」ウイルスベクター、ならびに/または国際特許公報WO 00/28004およびChao et al.,(2000)Molecular Therapy 2:619に記載されるような「ハイブリッド」(即ち、ウイルスTRおよびウイルスカプシドが異なるパルボウイルスに由来する)パルボウイルスであってもよい。
【0107】
本発明のウイルスベクターは、さらに、国際特許公報WO O1/92551(この開示は参照によってその全体が本明細書中に組み入れられる)に記載されるような二重鎖パルボウイルス粒子であってもよい。従って、いくつかの態様において、二本鎖(二重鎖)ゲノムが、本発明のウイルスカプシドにパッケージングされ得る。
【0108】
さらに、ウイルスカプシドまたはゲノム要素は、挿入、欠失、および/または置換を含むその他の修飾を含有してもよい。
【0109】
「キメラ」カプシドタンパク質とは、本明細書において使用されるように、野生型と比べて、カプシドタンパク質のアミノ酸配列内の1つまたは複数(例えば、2、3、4、5、6、7、8、9、10個等)のアミノ酸残基の置換によって修飾されたAAVカプシドタンパク質、ならびに野生型と比べて、アミノ酸配列内の1つまたは複数(例えば、2、3、4、5、6、7、8、9、10個等)のアミノ酸残基の挿入および/または欠失によって修飾されたAAVカプシドタンパク質を意味する。いくつかの態様において、本発明のキメラカプシドタンパク質を作製するため、任意の組み合わせで、あるAAV血清型に由来する完全なまたは部分的なドメイン、機能的領域、およびエピトープ等を、異なるAAV血清型の対応する野生型のドメイン、機能的領域、およびエピトープ等と交換することができる。キメラカプシドタンパク質の作製は、当技術分野において周知のプロトコールに従って実施され得、本発明のカプシドに含まれ得る、相当数のキメラカプシドタンパク質が、文献および本明細書中に記載されている。
【0110】
本明細書において使用されるように、「ハプロイドAAV」という用語は、本明細書中に組み入れられるPCT/US18/22725に記載されるようなAAVを意味するものとする。
【0111】
「ハイブリッド」AAVベクターまたはパルボウイルスという用語は、ウイルスのTRまたはITRおよびウイルスカプシドが異なるパルボウイルスに由来するrAAVベクターをさす。ハイブリッドベクターは、国際特許公報WO 00/28004およびChao et al.,(2000)Molecular Therapy 2:619に記載されている。例えば、ハイブリッドAAVベクターは、典型的には、アデノウイルスの複製およびパッケージングのために十分なアデノウイルス5'および3'シスITR配列(即ち、アデノウイルス末端反復およびPAC配列)を含む。
【0112】
「ポリプロイドAAV」という用語は、例えば、2つまたはそれ以上のAAV血清型に由来するカプシドから構成され、より高い形質導入のため、個々の血清型を活用することができるが、ある種の態様においては、親に由来する向性を排除するAAVベクターをさす。
【0113】
「GAA」または「GAAポリペプチド」という用語には、本明細書において使用されるように、成熟型GAA(およそ76またはおよそ67kDa)および前駆体GAA(例えば、およそ110kDa)が包含され、生物学的機能を保持する(即ち、前記定義のようなネイティブGAAタンパク質の少なくとも1つの生物学的活性を有し、例えば、グリコーゲンを加水分解することができる)修飾された(例えば、短縮された、または挿入、欠失、および/もしくは置換によって変異させられた)GAAタンパク質またはそれらの断片、ならびにGAAバリアント(例えば、Kunita et al.,(1997)Biochemica et Biophysica Acta 1362:269によって記載されるようなGAA II;GAA多形およびSNPは、各々その全体が参照によって本明細書中に組み入れられるHirschhorn,R.and Reuser,A.J .(2001)in The Metabolic and Molecular Basis for Inherited Disease(Scriver,C.R.,Beaudet.A.L.,Sly,W.S.& Valle,D.Eds.),pp.3389-3419,McGraw-Hill,New York(3403~3405頁を参照すること)によって記載される)も包含される。当技術分野において公知の任意のGAAコード配列が使用され得、例えば、
図8および9のコード配列;GenBankアクセッション番号NM_00152およびHoefsloot et al.,(1988)EMBO J.7:1697およびVan Hove et al.,(1996)Proc.Natl.Acad.Sci.USA 93:65(ヒト)、GenBankアクセッション番号NM_008064(マウス)、ならびにKunita et al.,(1997)Biochemica et Biophysics Acta 1362:269(ウズラ)(これらの開示は、GAAのコード配列および非コード配列の教示のため、参照によって本明細書中に組み入れられる)を参照すること。
【0114】
「ターゲティング配列」とも呼ばれる「ターゲティングペプチド」という用語は、本明細書において使用されるように、特定の細胞内コンパートメント、例えば、哺乳動物リソソームを標的とするペプチドをさすものとする。本発明において使用するために包含されるターゲティングペプチドは、マンノース-6-リン酸非依存性のリソソームターゲティングペプチドである。
【0115】
「IGF2リーダー配列」および「IGF-2リーダー配列」と共に使用される「IGF2配列」または「IGF-2配列」という用語は、本明細書において交換可能に使用され、細胞の表面上のCI-MBRと結合するIGF2ポリペプチドの配列をさす。具体的には、IGF2配列は、SEQ ID NO:5のIGF-2取り込み配列の一部を含むか、またはSEQ ID NO:5のアミノ酸の修飾を含むペプチドである。IGF2配列とは、ヒトカチオン非依存性マンノース-6-リン酸受容体(CI-MPRまたはCA-M6P受容体)のリピート11-12、リピート11、またはアミノ酸1508-1566から本質的になる受容体ドメインと結合するペプチド配列をさす。
【0116】
「分泌シグナル配列」または「シグナル配列」という用語およびそれらのバリエーションは、本明細書において交換可能に使用され、機能的に連結されたポリペプチド、例えば、GAAまたはGAA融合タンパク質の細胞からの分泌を、ネイティブポリペプチドで見られる分泌のレベルと比較して、(前記定義のように)増強するために機能するアミノ酸配列をさすものとする。前記定義のように、「増強された」分泌とは、細胞によって合成されたリソソームポリペプチドの、細胞から分泌される相対的な割合が増加することを意味し;分泌されるタンパク質の絶対量も増加する必要はない。本発明の具体的な態様において、本質的に全部(即ち、少なくとも95%、97%、98%、99%、またはそれ以上)のGAAポリペプチドが、分泌される。しかしながら、分泌のレベルがネイティブGAAポリペプチドと比較して増強される限り、GAAポリペプチドの本質的に全部またはさらには大部分が分泌されなくてもよい。
【0117】
本明細書において使用されるように、「アミノ酸」という用語には、任意の天然に存在するアミノ酸、それらの修飾型、および合成アミノ酸が包含される。
【0118】
AAV、またはAAVの局面、例えば、発現させたい関心対象の遺伝子を含むDNAベクターに関係しているか、それらを開示するか、またはそれらを記載する、参考のために本明細書中に組み入れられる付加的な特許は、米国特許第6,491,907号;同第7,229,823号;同第7,790,154号;同第7,201898号;同第7,071,172号;同第7,892,809号;同第7,867,484号;同第8,889,641号;同第9,169,494号;同第9,169,492号;同第9,441,206号;同第9,409,953号;および同第9,447,433号;同第9,592,247号;および同第9,737,618号である。
【0119】
II. rAAVゲノム要素
本明細書中に開示されるように、本技術の一つの局面は、カプシド、およびカプシド内の「rAAVベクターゲノム」と呼ばれるヌクレオチド配列を含むrAAVベクターに関する。(「rAAVゲノム」とも呼ばれる)rAAVベクターゲノムは、2つの末端逆位配列(ITR、例えば、5'-ITRおよび3'-ITR)、ならびにITR間に位置する、プロモーター、異種遺伝子、およびポリAテールを含む付加的な要素を含むが、これらに限定されるわけではない、複数の要素を含む。
【0120】
いくつかの態様において、本明細書中に開示されたrAAVゲノムは、5'ITRおよび3'ITR配列、ならびに5'ITRと3'ITRとの間に位置する、αグルコシダーゼ(GAA)ポリペプチドをコードする核酸をコードする異種核酸と機能的に連結されたプロモーター、例えば肝臓特異的プロモーター配列を含み、ここで、異種核酸配列は、以下の要素のうちの1つまたは複数をさらに含み得る:イントロン配列、分泌シグナルペプチドをコードする核酸、IGF2配列をコードする核酸、およびポリA配列。
【0121】
いくつかの態様において、本明細書中に開示されたrAAVゲノムは、5'ITRおよび3'ITR配列、ならびに、5'ITRと3'ITRとの間に位置する、分泌ペプチドをコードする異種核酸とおよびαグルコシダーゼ(GAA)ポリペプチドをコードする核酸(即ち、異種核酸は、シグナルペプチド-GAAポリペプチドを含むGAA融合ポリペプチドをコードする)と機能的に連結されたプロモーターを含み、ここで、rAAVゲノムは、任意で、イントロン配列、コラーゲン安定性(CS)配列、ポリAテール、および少なくとも1アミノ酸のスペーサーをコードする核酸のうちの1つまたは複数をさらに含む。いくつかの態様において、本明細書中に開示されたrAAVゲノムは、5'ITRおよび3'ITR配列、ならびに、5'ITRと3'ITRとの間に位置する、分泌ペプチド(例えば、FIV、ATT、またはGAAシグナルペプチド)をコードする異種核酸とおよびαグルコシダーゼ(GAA)ポリペプチドをコードする核酸と機能的に連結された肝臓プロモーターを含み、ここで、rAAVゲノムは、任意で、イントロン配列(例えば、MVMまたはHBB2イントロン配列)、コラーゲン安定性(CS)配列、ポリAテール、および、少なくとも1アミノ酸のスペーサーをコードする核酸のうちの1つまたは複数をさらに含む。
【0122】
いくつかの態様において、本明細書中に開示されたrAAVゲノムは、5'ITRおよび3'ITR配列、ならびに、5'ITRと3'ITRとの間に位置する、分泌ペプチドとターゲティングペプチドとGAAポリペプチドとをコードする異種核酸(即ち、異種核酸は、シグナルペプチド-ターゲティング配列-GAAポリペプチドを含むGAA融合ポリペプチドをコードする)と機能的に連結されたプロモーターを含み、ここで、ターゲティングペプチドは、本明細書中に記載されるIGF2配列であり、rAAVゲノムは、任意で、イントロン配列、コラーゲン安定性(CS)配列、ポリAテール、および、少なくとも1アミノ酸のスペーサーをコードする核酸のうちの1つまたは複数をさらに含む。
【0123】
rAAVゲノム内の要素の各々は本明細書中に記述される。
【0124】
A. αグルコシダーゼ(GAA)ポリペプチド
αグルコシダーゼ(GAA)ポリペプチドは、糖質加水分解酵素ファミリー31のメンバーである。ヒトGAAは、110kDalの前駆体として合成される(Wisselaar et al.(1993)J.Biol.Chem.268(3):2223-31)。酵素の成熟型は、70および76kDalのモノマーの混合物である(Wisselaar et al.(1993)J.Biol.Chem.268(3):2223-31)。前駆体酵素は、7つの可能性のあるグリコシル化部位を有し、これらのうちの4つが、成熟型酵素において保持される(Wisselaar et al.(1993)J.Biol.Chem.268(3):2223-31)。成熟型酵素を産生するタンパク質分解切断イベントは、後期エンドソームまたはリソソームにおいて起こる(Wisselaar et al.(1993)J.Biol.Chem.268(3):2223-31)。
【0125】
rAAVベクターゲノムは、例えば、ヒトGAAのアミノ酸残基40-952もしくは70-952、またはアミノ酸残基40-790もしくは70-790のようなより小さい一部分を含み得るGAAポリペプチドをコードし得る。
【0126】
一つの態様において、IGF2配列は、アミノ酸40、またはアミノ酸70、またはアミノ酸40もしくは70の1つまたは2つの位置のアミノ酸と融合させられる。いくつかの態様において、IGF2配列は、細胞外受容体のためのリガンドであり、例えば、IGF2配列は、ヒトカチオン非依存性マンノース-6-リン酸受容体(CI-MPR)またはIGF2受容体と結合する。
【0127】
ヒトGAAポリペプチドの最初の27アミノ酸は、リソソームタンパク質および分泌タンパク質のシグナルペプチドに典型的なものである。GAAは、ホスホマンノシル受容体を介して、かつ/またはシグナルペプチドの遅延した切断に関連した配列によって、リソソームへターゲティングされ得る(Hirschhorn,R.and Reuser,A.J.(2001),in The Metabolic and Molecular Basis for Inherited Disease,(eds,Scriver,C.R.et al.)pages 3389-3419(McGraw-Hill,New York)。酵素の膜結合型(即ち、未切断のシグナルペプチドによって固定された)前駆体型は、小胞体の内腔に同定されている(例えば、Wisselaar et al.,(1993)J.Biol.Chem.268:2223-31を参照すること)。
【0128】
C末端160アミノ酸は、70および76kDalの成熟型GAAポリペプチド種に存在しない。しかしながら、GAA活性の完全な喪失をもたらすある種のポンペ対立遺伝子、例えば、Val949Aspは、この領域にマッピングされている(Becker et al.(1998)J.Hum.Genet.62:991)。この変異体の表現型は、タンパク質のC末端部分が、70または76kDal種には含まれないが、タンパク質の機能において重要な役割を果たすことを示す。タンパク質のC末端部分は、プロセシング中にタンパク質の残りから切断されるが、主要な種に関連し続けることも報告された(Moreland et al.(Nov.1,2004)J.Biol.Chem.,Manuscript 404008200)。従って、C末端残基は、タンパク質の触媒作用において直接的な役割を果たし得、かつ/またはタンパク質のN末端部分の適切な折り畳みの促進に関与している可能性がある。
【0129】
ネイティブGAA遺伝子は、シグナル配列および近接した推定膜貫通ドメイン、3つのジスルフィド結合を含有する約45アミノ酸のシステインリッチドメインであるトレフォイルドメイン(PFAM PF00088)(Thim(1989)FEBS Lett.250:85)、成熟型70/76kDalポリペプチドによって定義されるドメイン、およびC末端ドメインを保有する前駆体ポリペプチドをコードする。トレフォイルドメインおよびC末端ドメインの両方が、機能性GAAの産生のために必要とされること、C末端ドメインがタンパク質折り畳み中にトレフォイルドメインと相互作用し、恐らく、トレフォイルドメインにおける適切なジスルフィド結合形成を容易にする可能性があることが報告された。
【0130】
GAAポリペプチドは、参照によってその全体が本明細書中に組み入れられる米国特許5,962,313号および同第6,537,785号に記載されている。当業者は、分泌シグナルペプチド(SS)あるいはターゲティングペプチド(例えば、IGF2配列)を融合させることができるGAAの特定の位置を認識し得る。従って、一つの局面において、本発明は、SPまたはIGF2配列がヒトGAAまたはその一部分のアミノ酸40、68、69、70、71、72、779、787、789、790、791、792、793、または796と融合しているGAA融合タンパク質に関する。
【0131】
本明細書中に開示される方法および組成物のいくつかの態様において、AAVによって発現されるヒトGAAタンパク質は、SEQ ID NO:10のアミノ酸、またはその断片、例えば、SEQ ID NO:10の残基40、68、69、70、71、72、779、787、789、790、791、792、793、もしくは796から開始するヒトGAAタンパク質を含む。本明細書中に開示される方法および組成物のいくつかの態様において、AAVによって発現されるヒトGAAタンパク質は、SEQ ID NO:10のアミノ酸、またはSEQ ID NO:10と少なくとも60%もしくは70%もしくは80%、85%もしくは90%もしくは95%もしくは98%もしくは99%同一のタンパク質を含む。本明細書中に開示される方法および組成物のいくつかの態様において、AAVによって発現されるヒトGAAタンパク質は、SEQ ID NO:10の残基40、68、69、70、71、72、779、787、789、790、791、792、793、もしくは796から開始するヒトGAAタンパク質、またはそれらと少なくとも60%もしくは70%もしくは80%、85%もしくは90%もしくは95%もしくは98%もしくは99%同一のタンパク質であるアミノ酸を含む。
【0132】
いくつかの態様において、当業者は、分泌シグナルペプチド(SS)あるいはターゲティングペプチド(例えば、IGF2配列)を融合させることができるGAAの特定の位置を認識し得る。例えば、その全体が本明細書中に組み入れられる国際特許出願WO2018046774A1は、分泌シグナルペプチド(SS)あるいはターゲティングペプチド(例えば、IGF2配列)を付着させることができる短縮型GAAポリペプチドを開示しており、以下のような短縮型GAAポリペプチドバリアントを開示している:Δ1、Δ2、Δ3、Δ4、Δ5、Δ6、Δ7、Δ8、Δ9、Δ10、Δ11、Δ12、Δ13、Δ14、Δ15、Δ16、Δ17、Δ18、Δ19、Δ20、Δ21、Δ22、Δ23、Δ24、Δ25、Δ26、Δ27、Δ28、Δ29、Δ30、Δ31、Δ32、Δ33、Δ34、Δ35、Δ36、Δ37、Δ38、Δ39、Δ40、Δ41、Δ42、Δ43、Δ44、Δ45、Δ46、Δ47、Δ48、Δ49、Δ50、Δ51、Δ52、Δ53、Δ54、Δ55、Δ56、Δ57、Δ58、Δ59、Δ60、Δ61、Δ62、Δ63、Δ64、Δ65、Δ66、Δ67、Δ68、Δ69、Δ70、Δ71、Δ72、Δ73、Δ74、またはΔ75 GAA短縮型。
【0133】
いくつかの態様において、本明細書中に記載されるrAAVゲノムによってコードされたGAA融合ポリペプチドは、例えば、ヒトGAAのアミノ酸残基40-952もしくは残基70-952、またはアミノ酸残基40-790もしくは70-790のようなより小さい一部分を含み得る。一つの態様において、分泌シグナルペプチド(SS)またはターゲティングペプチド、例えば、IGF2配列は、アミノ酸40、またはアミノ酸70、またはアミノ酸40もしくは70の1つもしくは2つの位置のアミノ酸と融合している。
【0134】
いくつかの態様において、分泌シグナルペプチド(SS)とGAAポリペプチドと任意でIGF2配列とを含む融合タンパク質(即ち、SS-GAA融合ポリペプチドまたはSS-IGF2-GAA融合タンパク質)は、ヒト酸性αグルコシダーゼ(GAA)(SEQ ID NO:10)のアミノ酸残基40-952または残基70-952を含む。いくつかの態様において、GAAポリペプチドのN末端は、SSのC末端に付着しており、いくつかの態様において、GAAポリペプチドのN末端は、IGF2配列のC末端に付着しており、IGF2配列のN末端は、分泌シグナルペプチドのC末端に付着している。
【0135】
一つの態様において、rAAVゲノムは、GAAポリペプチド全体(例えば、N末端/触媒ドメインおよびC末端ドメイン)をコードするGAA核酸配列の3'末端とインフレームに融合した、分泌シグナルペプチドまたはIGF2配列をコードする異種核酸配列を含む。例えば、分泌シグナルペプチドまたはIGF2配列をコードする異種核酸配列は、70kDaおよび76kDa GAAポリペプチドをコードするGAA核酸配列の3'末端とインフレームに融合しており、rAAVベクターが哺乳動物細胞を形質導入する時、そのような両方のポリペプチドがrAAVゲノムから発現される。いくつかの態様において、GAA核酸の発現は、rAAVゲノム内の2つのプロモーターによって、または2シストロン構築物の発現を駆動する1つのプロモーターによって駆動され得る。
【0136】
本明細書中に開示される方法および組成物のいくつかの態様において、rAAVベクターは、野生型GAA核酸配列、例えば、SEQ ID NO:11またはSEQ ID NO:72である、GAAタンパク質をコードする核酸配列を含む。本明細書中に開示される方法および組成物のいくつかの態様において、rAAVベクターは、インビボでの発現の増強のために、かつ/またはCpGアイランドを減少させるように、かつ/または自然免疫応答を低下させるようにコドン最適化されたGAA核酸配列である、GAAタンパク質をコードする核酸配列を含む。本明細書中に開示される方法およびrAAV組成物において使用するために包含される例示的なコドン最適化GAA核酸配列は、SEQ ID NO:73、SEQ ID NO:74、SEQ ID NO:75、およびSEQ ID NO:76、またはSEQ ID NO:73、SEQ ID NO:74、SEQ ID NO:75、およびSEQ ID NO:76との少なくとも60%もしくは70%もしくは80%、85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有する核酸配列のいずれかより選択され得る。
【0137】
GAAのC末端ドメインは、活性GAAを生成するため、70/76kDal種と共にトランスに機能する。触媒ドメインとC末端ドメインとの間の境界は、ファミリー31加水分解酵素の大部分のメンバーに存在せず、GAAにおいては4つの連続するプロリン残基を含有する18アミノ酸未満の短い領域における、その存在に基づき、およそアミノ酸残基791であるようである。成熟種に関連したC末端ドメインは、アミノ酸残基792において開始することが報告されている(Moreland et al.(Nov.1,2004)J.Biol.Chem.,Manuscript 404008200)。従って、いくつかの態様において、GAA核酸配列は、C末端ドメインを除くGAAポリペプチド全体をコードする。従って、そのような態様において、rAAVベクターは、別のポリペプチドとしてGAAのC末端ドメインを発現する哺乳動物細胞を形質導入するために使用され得る。
【0138】
さらに、ポンペまたはGSDを有する患者は、GAAの最適化された型の投与から利益を得ることができる。例えば、GAAの投与は、糖原貯蔵症III型(GSD III)患者に由来する初代筋芽細胞においてグリコーゲンを低下させることが示されている(Sun et al.(2013)Mol Genet Metab 108(2):145;WO2010/005565)。
【0139】
B. 分泌シグナルペプチド
ネイティブGAAシグナルペプチドは、ERにおいて切断されず、従って、ネイティブGAAポリペプチドはERにおいて膜に結合している(Tsuji et al.(1987)Biochem.Int.15(5):945-952)。いくつかの細胞型において、GAAポリペプチドは、恐らく、シグナルペプチドを切断することができないため、ERの膜トポロジーを保持した状態で、細胞膜に結合して見出され得る(Hirschhorn et al.,in The Metabolic and Molecular Basis of Inherited Disease,Valle,ed.,2001,McGraw-Hill:New York,pp.3389-3420)。
【0140】
GAAの膜会合の破壊は、内在性GAAシグナルペプチド(および、任意で、近接配列)を、GAAのための別のシグナルペプチドに交換することによって達成され得る。
【0141】
従って、本明細書中に開示されたrAAVゲノムは、分泌シグナルペプチドをコードする異種核酸配列を含む。代表的な態様において、本明細書中に開示されるrAAVベクターおよびrAAVゲノムは、標的細胞へ移入されるGAAポリペプチドをコードする異種核酸をさらに含む。異種核酸は、転写および翻訳によって、GAAポリペプチドと機能的に会合した(例えば、その分泌を指図する)分泌シグナル配列を含有する融合ポリペプチドが産生されるよう、分泌シグナルペプチドをコードするセグメントと機能的に会合している。
【0142】
いくつかの態様において、分泌シグナルペプチドは、関心対象のポリペプチドに対して異種(即ち、外来性または外因性)である。例えば、分泌シグナルペプチドがフィブロネクチン分泌シグナルペプチドである場合、関心対象のポリペプチドは、フィブロネクチンではない。いくつかの態様において、分泌シグナルペプチドは、AATシグナルペプチド、フィブロネクチンシグナルペプチド(FN1)、または分泌シグナル活性を有するAAT、FN1、もしくはGAAシグナルペプチドの活性断片のいずれかより選択される。別の態様において、分泌シグナルペプチドは、GAAに対して異種ではなく、即ち、シグナルペプチドは、GAAシグナルペプチド(即ち、ネイティブGAAポリペプチドの残基1-27)である。
【0143】
一般に、分泌シグナルペプチドは、融合ポリペプチドのアミノ末端(N末端)において存在する(即ち、本明細書中に開示されるrAAVベクターまたはrAAVゲノムにおいて、分泌シグナルペプチドをコードする核酸セグメントは、GAAペプチドまたはGAA融合ペプチドをコードする異種核酸の5'側において存在する)。あるいは、分泌シグナルが、関心対象のGAAポリペプチドまたはGAA融合ポリペプチドと機能的に会合しており、細胞からの(GAAポリペプチドからのシグナルペプチドの切断による、または切断なしの)それらの分泌を指図する限り、分泌シグナルは、カルボキシ末端において存在してもよいか、またはGAAポリペプチドもしくはGAA融合ポリペプチド(例えば、IGF2-GAA融合ポリペプチド)の内部に埋め込まれていてもよい。
【0144】
分泌シグナルは、GAAポリペプチドまたはGAA融合ポリペプチドが分泌経路へターゲティングされるよう、関心対象のポリペプチドと機能的に会合している。換言すると、分泌シグナルは、分泌シグナルペプチドの非存在下より高いレベルで(即ち、より多量に)細胞からGAAポリペプチドまたはGAA融合ポリペプチドが分泌されるよう、GAAポリペプチドと機能的に会合している。分泌シグナルペプチドがGAAポリペプチドまたはGAA融合ポリペプチドの分泌を指図する程度は、それがGAAポリペプチドの分泌の所望のレベルおよび/または発現の制御を提供する限り、重要ではない。分泌タンパク質が過剰発現される時には、しばしば、細胞分泌機序が飽和し、細胞内に保持されることを、当業者は認識するであろう。一般に、典型的には、(単独のおよび/またはシグナルペプチドと融合した)GAAポリペプチドまたはIGF2-GAA融合ポリペプチドの少なくとも約20%、30%、40%、50%、70%、80%、85%、90%、95%、またはそれ以上が、細胞から分泌される。他の態様において、(単独のおよび/または融合ポリペプチドの形態の)検出可能なポリペプチドの本質的に全てが、細胞から分泌される。
【0145】
「細胞から分泌される」という語句によって、ポリペプチドは、間質空間、血液、リンパ液、脳脊髄液、尿細管、気道(例えば、肺胞、細気管支、気管支、鼻腔等)、胃腸管(例えば、食道、胃、小腸、結腸等)、眼の硝子体液、および蝸牛内リンパ液等を含むが、これらに限定されるわけではない、細胞外の任意のコンパートメント(例えば、体液または空間)へ分泌され得る。
【0146】
一つの態様において、rAAVゲノムは、GAAポリペプチドと融合した分泌シグナルペプチド(SP)をコードする異種核酸を含む。別の態様において、rAAVゲノムは、GAA融合ポリペプチドと融合した分泌シグナルペプチド(SP)をコードする異種核酸を含み、ここで、GAA融合ポリペプチドは、GAAポリペプチドと融合したターゲティングペプチド(例えば、IGF2配列)を含む。従って、本明細書中に開示されたシグナルペプチドは、本明細書中に記載されるように、rAAVベクターによって形質導入された、またはrAAVゲノムを含む細胞からの、GAAポリペプチドまたはIGF2-GAA融合ポリペプチドの分泌の効力を増大させる。
【0147】
従って、いくつかの態様において、本明細書中に開示されたrAAVゲノムは、5'ITRおよび3'ITR配列、ならびに、5'ITRと3'ITRとの間に位置する、分泌ペプチドをコードする異種核酸とおよびαグルコシダーゼ(GAA)ポリペプチドをコードする核酸(即ち、異種核酸は、シグナルペプチド-GAAポリペプチドを含むGAA融合ポリペプチドをコードする)と機能的に連結されたプロモーターを含む。
【0148】
別の態様において、本明細書中に開示されたrAAVゲノムは、5'ITRおよび3'ITR配列、ならびに5'ITRと3'ITRとの間に位置する、分泌ペプチドをコードする異種核酸とおよびαグルコシダーゼ(GAA)融合ポリペプチドをコードする核酸と機能的に連結されたプロモーターを含み、ここで、融合タンパク質は、IGF2配列およびGAAポリペプチドを含む(即ち、異種核酸は、シグナルペプチド-IGF2-GAAポリペプチドを含むGAA融合ポリペプチドをコードする)。
【0149】
いくつかの態様において、(シグナルペプチドとも呼ばれる)分泌シグナルペプチドは、GAAポリペプチドまたはGAA融合ポリペプチドの少なくとも約50%、60%、75%、85%、90%、95%、98%、またはそれ以上の、細胞からの分泌をもたらす。rAAVゲノムから発現されたGAAポリペプチド(例えば、シグナルペプチド-GAA(SP-GAA)を含む融合ポリペプチド、またはシグナルペプチド-ターゲティングペプチド-GAAを含む融合タンパク質、例えば、SP-IGF2-GAA融合ポリペプチド)の、細胞から分泌される相対的な割合は、当技術分野において公知の方法によって慣習的に、実施例に記載されるように、例えば、上清中のGAA活性を測定することによって、決定され得る。分泌されたタンパク質は、細胞培養培地、血清、乳等において、(例えば、ウエスタンブロットによって)タンパク質自体を直接測定することによって、またはタンパク質活性アッセイ(例えば、酵素アッセイ)によって検出され得る。
【0150】
一般に、分泌シグナルペプチドは、小胞体内で切断され、いくつかの態様において、分泌シグナルペプチドは、分泌前にGAAポリペプチドから切断される。しかしながら、細胞からのGAAポリペプチドまたはIGF2-GAA融合ポリペプチドの分泌が増強され、GAAポリペプチドが機能性である限り、分泌シグナルペプチドが切断されることは必要でない。従って、いくつかの態様において、分泌シグナルペプチドは、部分的にまたは完全に保持される。
【0151】
いくつかの態様において、本明細書中に開示されるrAAVゲノムまたは単離された核酸は、分泌シグナルペプチドと機能的に連結されたGAAポリペプチドを含むキメラポリペプチドをコードする核酸を含み、キメラポリペプチドは、rAAVベクターによって形質導入された細胞から発現され、産生され、GAAポリペプチドは、細胞から分泌される。GAAポリペプチドまたはGAA融合ポリペプチド(例えば、IGF2-GAA融合ポリペプチド)は、分泌シグナルペプチドの全部または一部の切断の後に分泌され得る。あるいは、GAAポリペプチドまたはGAA融合ポリペプチド(例えば、IGF2-GAA融合ポリペプチド)は、分泌シグナルペプチドを保持していてもよい(即ち、分泌シグナルは切断されない)。従って、この状況において、「GAAポリペプチドまたはGAA融合ポリペプチド」は、分泌ペプチドを含むキメラポリペプチドであり得る。
【0152】
キメラポリペプチドが、例えば、制限部位の付加のような核酸構築物の操作の結果として、付加的なアミノ酸を含有することが、これらの付加的なアミノ酸が、分泌シグナル配列またはGAAポリペプチドまたはGAA融合ポリペプチド(例えば、IGF2-GAA融合ポリペプチド)を非機能性にしない限り、可能であることを、当業者はさらに理解するであろう。付加的なアミノ酸は、切断されてもよいか、または保持が非機能性のGAAポリペプチドをもたらさない限り、成熟GAAポリペプチドに保持されてもよい。
【0153】
代表的な態様において、分泌シグナルペプチドは、ネイティブGAAポリペプチドに見出される配列の大部分、本質的に全部、または全部を交換する。具体的な態様において、GAAポリペプチドまたはGAA融合ポリペプチド(例えば、IGF2-GAA融合ポリペプチド)の分泌が増強され、成熟型GAAポリペプチドが機能性である限り、GAAのネイティブ配列の大部分または全部が保持される。
【0154】
理論に制限されることは望まないが、分泌シグナル配列は、新生ポリペプチドの小胞体への挿入を指図し、新生ポリペプチドはそこからゴルジへ輸送され、次いで、それが、細胞からポリペプチドを分泌するため、細胞膜と融合すると、一般に考えられている。典型的には、分泌シグナルは、プロセシング中にポリペプチドから切断されるが、それは小胞体において起こると考えられている。本発明の融合ポリペプチドのケースにおいて、キメラGAAポリペプチドまたはキメラIGF2-GAA融合ポリペプチドから分泌シグナルペプチドが完全にまたは全て切断される必要はない。いくつかの態様において、分泌シグナルペプチドは、本質的に完全に切断されてもよいか;あるいは、いくつかの細胞において、不完全な切断が起こってもよいか、または本質的に全く切断が起こらなくてもよい。特定の理論に制限されることは望まないが、いくつかの態様において、分泌シグナルペプチドの一部または全部の保持(即ち、非切断)は、得られるキメラGAAポリペプチドまたはキメラIGF2-GAA融合ポリペプチドを安定化するようである。
【0155】
いくつかの態様において、分泌シグナルペプチドは、ポリペプチドから部分的にのみ除去され、即ち、少なくとも約1、2、3、4、5、6、7、8、9、10、12、もしくはさらには15個、またはそれ以上のアミノ酸残基が、分泌されるポリペプチドに保持される。例示的な目的のためにのみ、フィブロネクチンシグナルペプチドを例示的なシグナルペプチドとして使用すると、SEQ ID NO:18のアミノ酸22(Val)-32(Arg)、23(Arg)-32(Arg)、24(Cys)-32(Arg)、25(Thr)-32(Arg)、または26(Glu)-32(Arg)が、分泌されるポリペプチドに保持され得る。
【0156】
本明細書中に開示されるrAAVゲノムにおいて使用するために包含される分泌シグナルペプチドは、その全部もしくは一部が分泌型ポリペプチド(即ち、前駆体)の分泌シグナルに由来してよく、かつ/またはその全部もしくは一部が合成であってよい。当業者が認識するように、分泌シグナル配列は、一般に、異種間で機能する。従って、分泌シグナルペプチドは、動物(例えば、トリ、ならびにヒト、サルおよびその他の非ヒト霊長類、ウシ、ヒツジ、ヤギ、ウマ、ブタ、イヌ、ネコ、ラット、マウス、ウサギのような哺乳動物)、植物、酵母、細菌、原虫、または真菌を含む、任意の起源の種に由来し得る。分泌シグナル配列の長さは、重要ではなく;一般に、公知の分泌シグナル配列は、約10~15アミノ酸長から50~60アミノ酸長までである。さらに、分泌型ポリペプチドに由来する公知の分泌シグナルは、得られる分泌シグナル配列が、機能的に連結されたGAAポリペプチドまたはGAA融合ポリペプチド(例えば、IGF2-GAA融合ポリペプチド)の分泌を増強するために機能する限り、(例えば、アミノ酸の置換、欠失、短縮、または挿入によって)変更または修飾されてもよい。
【0157】
本発明の分泌シグナル配列は、関心対象のポリペプチドを分泌経路へ差し向ける限り、特定の長さに限定されない。代表的な態様において、シグナルペプチドは、少なくとも約6、8、10、12、15、20、25、30、もしくは35アミノ酸長から最大約40、50、60、75、もしくは100アミノ酸長またはそれ以上である。
【0158】
本明細書中に開示されるrAAVゲノムによって、rAAVベクターにおいてコードされる分泌シグナルペプチドは、天然に存在する分泌シグナル配列またはその修飾を含むこと、それらから本質的になること、またはそれらからなることができる。多数の分泌型タンパク質および細胞からの分泌を指図する配列が、当技術分野において公知である。例示的な分泌型タンパク質(およびそれらの分泌シグナル)には、エリスロポエチン、凝固第IX因子、シスタチン、ラクトトランスフェリン、血漿プロテアーゼC1インヒビター、アポリポタンパク質(例えば、APO A、C、E)、MCP-1、α-2-HS-糖タンパク質、α-1-ミクログロブリン、補体(例えば、C1Q、C3)、ビトロネクチン、リンホトキシンα、アズロシジン、VIP、メタロプロテイナーゼインヒビター2、グリピカン1、膵臓ホルモン、クラスタリン、肝細胞増殖因子、インスリン、α1-アンチキモトリプシン、成長ホルモン、IV型コラゲナーゼ、グアニリン、プロパージン、プロエンケファリンA、インヒビンβ(例えば、A鎖)、プレアルブミン、アンジオセニン(angiocenin)、ルトロピン(例えば、β鎖)、インスリン様増殖因子結合タンパク質1および2、プロアクチベーター(proactivator)ポリペプチド、フィブリノーゲン(例えば、β鎖)、胃トリアシルグリセロールリパーゼ、ミッドカイン、好中球デフェンシン1、2、および3、α-1-アンチトリプシン、マトリックスgla-タンパク質、αトリプターゼ、胆汁酸塩活性化(bile-salt-activated)リパーゼ、キモトリプシノーゲンB、エラスチン、IGラムダ鎖V領域、血小板因子4バリアント、クロモグラニンA、WNT-1癌原遺伝子タンパク質、オンコスタチンM、βネオエンドルフィン-ダイノルフィン、フォンビルブラント因子、血漿セリンプロテアーゼインヒビター、血清アミロイドAタンパク質、ナイドジェン、フィブロネクチン、レンニン、オステオネクチン、ヒスタチン3、ホスホリパーゼA2、軟骨基質タンパク質、GM-CSF、マトリライシン、神経内分泌タンパク質7B2、胎盤タンパク質11、ゲルゾリン、M-CSF、トランスコバラミンI、ラクターゼ-フロリジンヒドロラーゼ、エラスターゼ2B、ペプシノーゲンA、MIP 1β、プロラクチン、トリプシノーゲンII、ガストリン放出ペプチドII、心房性ナトリウム利尿因子、分泌型アルカリホスファターゼ、膵臓αアミラーゼ、セクレトグラニンI、βカゼイン、セロトランスフェリン(serotransferrin)、組織因子経路インヒビター、フォリトロピンβ鎖、凝固第XII因子、成長ホルモン放出因子、前立腺精漿タンパク質、インターロイキン(例えば、2、3、4、5、9、11)、インヒビン(例えば、α鎖)、アンジオテンシノーゲン、チログロブリン、IG重鎖または軽鎖、プラスミノーゲン活性化因子インヒビター1、リゾチームC、プラスミノーゲン活性化因子、アンチロイコプロテイナーゼ(antileukoproteinase)1、スタテリン(statherin)、フィブリン1、アイソフォームB、ウロモジュリン、チロキシン結合グロブリン、アキソニン-1、子宮内膜α-2グロブリン、インターフェロン(例えば、α、β、γ)、β-2-ミクログロブリン、プロコレシストキニン、プロガストリクシン(progastricsin)、前立腺酸性ホスファターゼ、骨シアロタンパク質II、コリパーゼ、アルツハイマー病アミロイドA4タンパク質、PDGF(例えば、AまたはB鎖)、凝固第V因子、トリアシルグリセロールリパーゼ、ハプトグロビン-2、コルチコステロイド結合グロブリン、トリアシルグリセロールリパーゼ、プロリラキシンH2、フォリスタチン1および2、血小板糖タンパク質IX、GCSF、VEGF、ヘパリンコファクターII、アンチトロンビン-III、白血病抑制因子、間質コラゲナーゼ、プレイオトロフィン、小誘導性(small inducible)サイトカインA1、メラニン凝集ホルモン、アンジオテンシン変換酵素、膵臓トリプシンインヒビター、凝固第VIII因子、αフェトプロテイン、αラクトアルブミン、セノゲリン(senogelin)II、κカゼイン、グルカゴン、甲状腺刺激ホルモンβ鎖、トランスコバラミンII、トロンボスポンジン1、副甲状腺ホルモン、バソプレシンコペプチン、組織因子、モチリン、MPIF-1、キニノーゲン、神経内分泌コンバターゼ2、幹細胞因子プロコラーゲンα1鎖、血漿カリクレイン、ケラチノサイト増殖因子、ならびに任意のその他の分泌型ホルモン、増殖因子、サイトカイン、酵素、凝固因子、乳タンパク質、免疫グロブリン鎖等が含まれるが、これらに限定されるわけではない。
【0159】
いくつかの態様において、本明細書中に開示されるrAAVゲノムによって、rAAVベクターにおいてコードされるその他の分泌シグナルペプチドは、プレプロカテプシンL(例えば、GenBankアクセッション番号KHRTL、NP_037288;NP_034114、AAB81616、AAA39984、P07154、CAA68691;これらの開示は参照によってその全体が本明細書中に組み入れられる)およびプレプロα2型コラーゲン(例えば、GenBankアクセッション番号CAA98969、CAA26320、CGHU2S、NP_000080、BAA25383、P08123;これらの開示は参照によってその全体が本明細書中に組み入れられる)、ならびに(前記のフィブロネクチン分泌シグナル配列に関して記述されたような)それらの対立遺伝子バリエーション、修飾、および機能的断片より選択され得るが、これらに限定されるわけではない。例示的な分泌シグナル配列には、プレプロカテプシンLのもの(ラッツス・ノルベギクス(Rattus norvegicus)、
;アクセッション番号CAA68691)、およびプレプロα2型コラーゲンのもの(ホモ・サピエンス(Homo sapiens)、
;アクセッション番号CAA98969)が含まれる。プレプロカテプシンLおよびプレプロα2型コラーゲンに由来する全長分泌シグナル配列、または(前記のフィブロネクチン分泌シグナル配列に関して記述されたような)それらの機能的断片を含むより長いアミノ酸配列も、包含される。
【0160】
いくつかの態様において、分泌シグナルペプチドは、肝細胞によって産生される分泌型ポリペプチドにその一部または全部が由来する。いくつかの態様において、分泌シグナルペプチドは、さらに、その全部または一部が合成または人工であってもよい。合成または人工の分泌シグナルペプチドは、当技術分野において公知であり、例えば、Barash et al.,"Human secretory signal peptide description by hidden Markov model and generation of a strong artificial signal peptide for secreted protein expression," Biochem.Biophys.Res.Comm.294:835-42(2002)(この開示はその全体が本明細書中に組み入れられる)を参照すること。具体的な態様において、分泌シグナルペプチドは、人工分泌シグナル:
または1、2、3、4、もしくは5つのアミノ酸置換(任意で、保存的アミノ酸置換、保存的アミノ酸置換は当技術分野において公知である)を有するそのバリエーションを含む、それから本質的になる、またはそれからなる。
【0161】
フィブロネクチン分泌シグナルペプチド:
いくつかの態様において、分泌シグナルペプチドは、フィブロネクチン分泌シグナルペプチドであり、この用語には、(以下により詳細に記載されるような)天然に存在する配列の修飾が含まれる。
【0162】
いくつかの態様において、分泌シグナルペプチドは、フィブロネクチンシグナルペプチド、例えば、ヒトフィブロネクチンのシグナル配列またはラットフィブロネクチン由来のシグナル配列である。本明細書中に記載されたrAAVゲノムおよびrAAVベクターにおいて使用するために包含されるフィブロネクチン(FN1)シグナル配列および修飾型FN1シグナルペプチドは、参照によってその全体が本明細書中に組み入れられる米国特許第7,071,172号に開示されている。
【0163】
従って、本発明のフィブロネクチン分泌シグナル配列は、トリ(例えば、ニワトリ、アヒル、シチメンチョウ、ウズラ等)、哺乳動物(例えば、ヒト、サル、マウス、ラット、ウシ、ヒツジ、ヤギ、ウマ、ブタ、ウサギ、ネコ、イヌ等)、ならびに線虫(Caenorhabditis elegans)、アフリカツメガエル(Xenopus laevis)、およびゼブラフィッシュ(Danio rerio)を含むその他の動物を含むが、これらに限定されるわけではない、任意の種に由来し得る。例示的なフィブロネクチン分泌シグナル配列の例には、参照によってその全体が本明細書中に組み入れられる米国特許第7,071,172号の表1にリストされたものが含まれるが、これらに限定されるわけではない。
【0164】
(表3)例示的なフィブロネクチン(FN1)分泌シグナルペプチド
【0165】
ラッツス・ノルベギクスのフィブロネクチン分泌シグナル配列をコードする例示的なヌクレオチド配列は、GenBankアクセッション番号X15906(この開示は参照によって本明細書中に組み入れられる)に見出される。さらに別の例示的な配列として、ヒトフィブロネクチン1転写物バリアント1の分泌シグナルペプチドをコードするヌクレオチド配列(アクセッション番号NM_002026、ヌクレオチド268-345;アクセッション番号NM_002026の開示は参照によってその全体が本明細書中に組み入れられる)。別の例示的な分泌シグナル配列は、アフリカツメガエルフィブロネクチンタンパク質の分泌シグナルペプチドをコードするヌクレオチド配列によってコードされる(アクセッション番号M77820、ヌクレオチド98-190;アクセッション番号M77820の開示は参照によってその全体が本明細書中に組み入れられる)。
【0166】
別の態様において、フィブロネクチンシグナル配列(FN1、ヌクレオチド208-303、
)は、ラットフィブロネクチンmRNA配列(Genbankアクセッション#X15906)に由来し、以下のペプチドシグナル配列をコードする:Met Leu Arg Gly Pro Gly Pro Gly Arg Leu Leu Leu Leu Ala Val Leu Cys Leu Gly Thr Ser Val Arg Cys Thr Glu Thr Gly Lys Ser Lys Arg(SEQ ID NO:18)。
【0167】
いくつかの態様において、ラットフィブロネクチンシグナルペプチドをコードする核酸配列は、切断部位の3'側に存在する(即ち、切断部位のC末端側のアミノ酸をコードする)ヌクレオチド配列を含まない。当業者が認識するように、フィブロネクチン分泌シグナルペプチドは、典型的には、細胞内ペプチダーゼの切断作用によってフィブロネクチン前駆体から切断される。
【0168】
当業者は、分泌シグナル配列が、(↑によって同定される)ペプチダーゼ切断部位のC末端側のアミノ酸のうちの1、2、3、4、5、もしくは6個全て、またはそれ以上をコードし得ることを認識するであろう(例えば、表3中のSEQ ID NO:19および24を参照すること)。当業者は、切断部位のカルボキシ末端側の付加的なアミノ酸(例えば、1、2、3、4、5、6個、またはそれ以上のアミノ酸)が、分泌シグナル配列に含まれてもよいことを認識するであろう。
【0169】
いくつかの態様において、rAAVゲノムは、本明細書中に具体的に開示されたもの以外の種に由来するフィブロネクチン分泌シグナルペプチドをコードしてもよく、分泌シグナル活性を保持する(例えば、分泌シグナルペプチドの非存在下で観察されるより大きい会合したポリペプチドの分泌のレベル[即ち、量]を付与する、換言すると、本明細書中に具体的に開示された分泌シグナルペプチドの分泌シグナル活性の少なくとも50%、70%、80%、もしくは90%、もしくはそれ以上を有するか、またはさらにはより大きい分泌シグナル活性のレベルを有する)それらの対立遺伝子バリエーションおよび修飾をコードしてもよい。例示的な目的のみのため、本明細書中に開示されるrAAVゲノムにおいてコードされるフィブロネクチン分泌シグナルペプチドには、全長分泌シグナルペプチドの機能的な一部分または断片(例えば、表3に示されるアミノ酸配列(フィブロネクチンシグナル配列)の機能性断片)も含まれ得る。分泌シグナル活性を有する(例えば、分泌シグナルペプチドの非存在下で観察されるより大きい会合したポリペプチドの分泌のレベル[即ち、量]を付与する)限り、断片の長さは重要ではない。例示的な断片は、全長分泌シグナルペプチドの少なくとも10、12、15、18、20、25、または27個の連続するアミノ酸を含む(例えば、表3に示されるアミノ酸配列の断片、即ち、それぞれ、SEQ ID NO:23、24、25、および26の核酸によってコードされるSEQ ID NO:18、19、20、22のFN1シグナルペプチド)。
【0170】
本発明の態様において、機能性断片は、本明細書中に具体的に開示された配列と比較して、少なくとも約50%、70%、80%、90%、もしくはそれ以上の分泌シグナル活性を有するか、またはさらにはより大きい分泌シグナル活性のレベルを有する。
【0171】
同様に、当業者は、全長フィブロネクチン分泌シグナル(または分泌シグナル活性を有するその断片)を含む、より長いアミノ酸配列(およびそれをコードするヌクレオチド配列)が、本発明による「フィブロネクチンシグナル配列」という用語に包含されることを認識するであろう。付加的なアミノ酸(例えば、1、2、4、6、8、10、15個、またはさらにそれ以上のアミノ酸)が、分泌シグナル活性に過度に影響を与えることなく、フィブロネクチン分泌シグナル配列に付加され得る(例えば、分泌シグナルペプチドの非存在下で観察されるより大きい会合したポリペプチドの分泌のレベル[即ち、量]を付与する、換言すると、本明細書中に具体的に開示された配列と比較して、少なくとも約50%、70%、80%、90%、もしくはそれ以上の分泌シグナル活性を有するか、またはさらにはより大きい分泌シグナル活性のレベルを有する)。例えば、(前記の)ペプチド切断部位または制限酵素部位が、典型的には、分泌シグナル配列のいずれか一方の末端において、付加され得ることを、当業者は認識するであろう。他の機能を有する付加的な配列(例えば、ポリペプチドの精製を容易にするFLAG配列もしくはポリHisテールをコードする配列、またはスペーサー配列)を、フィブロネクチン分泌シグナル配列と融合させることもできる。さらに、関心対象のポリペプチドの安定性を増強するポリペプチドをコードする配列、例えば、マルトース結合タンパク質(MBP)またはグルタチオン-Sトランスフェラーゼをコードする配列を付加することもできる。
【0172】
分泌シグナル配列は、さらに、前記のフィブロネクチン分泌シグナル配列に関して記載されたような任意の種に由来し得る。フィブロネクチン分泌シグナル配列のカテプシンLおよびα2型コラーゲン前駆体に由来する分泌シグナル配列との比較は、コアまたは標準アミノ酸配列:LLLLAVLCLGT(SEQ ID NO:64)の同定をもたらした。従って、いくつかの態様において、rAAVゲノムは、LLLLAVLCLGT(SEQ ID NO:64)の標準アミノ酸配列を含むキメラ核酸配列を含む。
【0173】
同様に、当業者は、本明細書中に具体的に開示された分泌シグナル配列が、典型的には、アミノ酸配列の置換を許容し、分泌シグナル活性(例えば、本明細書中に具体的に開示された分泌シグナルペプチドの分泌シグナル活性の少なくとも50%、70%、80%、90%、95%、またはそれ以上)を保持することを認識するであろう。本明細書中に具体的に開示されたもの以外の本発明の分泌シグナルペプチドを同定するためのアミノ酸置換は、アミノ酸側鎖置換基、例えば、それらの疎水性、親水性、電荷、サイズ等の相対的な類似性または相違性を含む、当技術分野において公知の任意の特徴に基づき得る。
【0174】
ペプチダーゼ切断部位
いくつかの態様において、1つまたは複数の外因性ペプチダーゼ切断部位が、分泌シグナルペプチド-GAA融合ポリペプチドに、例えば、分泌シグナルペプチドとGAAポリペプチドとの間に挿入され得る。具体的な態様において、自己プロテアーゼ(例えば、口蹄疫ウイルス2A自己プロテアーゼ)が、分泌シグナルペプチドとGAAポリペプチドまたはIGF2-GAA融合ポリペプチドとの間に挿入される。他の態様において、外因性プロテアーゼの添加によって調節され得るプロテアーゼ認識部位(例えば、トリプシンのためのLys-Arg認識部位、アスペルギルス(Aspergillus)KEX2様プロテアーゼのLys-Arg認識部位、メタロプロテアーゼのための認識部位、およびセリンプロテアーゼのための認識部位等)が用いられる。
【0175】
いくつかの態様において、シグナルペプチドには、シグナルペプチドが除去され得るよう、ペプチダーゼ切断部位が隣接している。従って、いくつかの態様において、rAAVゲノムは、N末端もしくはC末端の切断部位、またはN末端およびC末端の切断部位を有するシグナルペプチドをコードする核酸を含む。いくつかの態様において、N末端切断部位は、C末端切断部位と同一の酵素によって切断され、いくつかの態様において、N末端切断部位およびC末端切断部位は、異なる酵素によって切断される。
【0176】
必ずではないが、本発明の具体的な態様において、rAAVゲノムのGAAポリペプチドをコードする異種核酸は、成熟型の(例えば、ポリペプチドのプロセシング中に通常除去される前駆体配列を除外する)GAAポリペプチドをコードする。同様に、GAAポリペプチド配列は、ネイティブのターゲティングシグナルまたはプロセシングシグナルを欠失させるか、または不活化するため、修飾されてもよい(例えば、それらが、本発明によるポリペプチドの分泌の所望のレベルに干渉する場合)。
【0177】
C. IGF2配列
一つの態様において、rAAVゲノムは、GAAポリペプチドと融合したターゲティングペプチドをコードする異種核酸を含む。いくつかの態様において、ターゲティングペプチドは、細胞外受容体のためのリガンドである。いくつかの態様において、ターゲティングペプチドは、標的細胞の表面上の受容体の細胞外ドメインと結合し、受容体の内部移行によって、ヒトリソソームへのポリペプチドの局在を可能にするターゲティングドメインである。一つの態様において、ターゲティングペプチドには、カチオン非依存性マンノース-6-リン酸受容体と結合することができるウロキナーゼ型プラスミノーゲン受容体部分が含まれる。いくつかの態様において、ターゲティングペプチドには、IGF2配列の1つまたは複数のアミノ酸配列が組み入れられる。
【0178】
IGF2は、別名;11番染色体オープンリーディングフレーム43、インスリン様増殖因子2、IGF-II、FLJ44734;IGF2、ソマトメジンA、およびプレプチン(preptin)によっても公知である。野生型ヒトIGF2配列のmRNAは、
に対応する。(IGF2リーダー配列を含む)全長IGF2タンパク質は、NM_000612.6の核酸配列によってコードされ、全長IGF2タンパク質NP_000603.1をコードする。
【0179】
ヒトIGF2のコード配列は、参照によってその全体が本明細書中に組み入れられる米国特許第8,492,388号(例えば、
図2を参照すること)に開示される。IGF2タンパク質は、アミノ末端の24アミノ酸シグナルペプチドおよび89アミノ酸カルボキシ末端領域を含むプレプロタンパク質として合成され、その両方が翻訳後に除去される(O'Dell et al.(1998)Int.J.Biochem Cell Biol.30(7):767-71に概説される)。成熟型タンパク質は67アミノ酸である。成熟型IGF2のリーシュマニア(Leishmania)コドン最適化バージョンは、米国特許第8,492,388号(例えば、8,492,388の
図3を参照すること)に開示されている(Langford et al.(1992)Exp.Parasitol.74(3):360-1を参照すること)。成熟ポリペプチドのアミノ酸1-7の欠失(Δ1-7)、残基27のチロシンからロイシンへの変更(Y27L)、または両方の変異(Δ1-7、Y27L)を含有する付加的なカセットが、下記のように、所望の受容体のみに対する特異性を有するIGF-IIカセットを作製するため、作成された。野生型、IGF2バリアントY27L、Δ1-7、およびY27LΔ1-7 は、本発明において使用するため、包含される。
【0180】
【0181】
いくつかの態様において、多様な細胞型によって取り込まれ、リソソームへ輸送される、成熟型IGF2ポリペプチド(SEQ ID NO:5)またはIGF2配列バリアント(例えば、SEQ ID NO:6(IGF2-Δ2-7);SEQ ID NO:7(IGF2-Δ1-7);SEQ ID NO:8(IGF2-Δ1-42)、SEQ ID NO:9(IGF2-V43M))、もしくはSEQ ID NO:5~9との少なくとも85%もしくは90%もしくは95%の配列同一性を有する配列をコードする核酸が、GAAタンパク質、融合タンパク質(例えば、IGF2-GAA融合ポリペプチド)をコードする核酸の5'末端と融合している、融合タンパク質をコードする核酸を含むrAAVゲノムが、作出される。あるいは、前駆体IGF2ポリペプチドをコードする核酸が、GAA遺伝子の3'末端と融合していてよく;前駆体は、成熟型IGF2ポリペプチドを与えるため、哺乳動物細胞において切断されるカルボキシ末端部分を含むが、IGF2シグナルペプチドは、好ましくは、省略される(またはGAA遺伝子の5'末端に移される)。この方法は、タンパク質が単離された後のさらなる修飾が不要になるため、グリコシル化を含む方法と比べて、単純性および対費用効果を含む、多数の利点を有する。
【0182】
rAAVゲノムは、CI-MPRを標的とするため、IGF2に由来するターゲティングペプチドをコードすることができる。あるいは、いくつかの態様において、筋管の表面上の受容体と優先的に結合するターゲティングペプチドが用いられ得る。そのようなペプチドは、記載されている(Samoylova et al.(1999)Muscle and Nerve 22:460;米国特許第6,329,501号)。Fc受容体、LDL受容体、またはトランスフェリン受容体のような他の細胞表面受容体も、適切な標的であり、GAAのターゲティングを促進することができる。
【0183】
いくつかの態様において、本発明において使用するために包含されるIGF2配列は、参照によってその全体が各々本明細書中に組み入れられる米国特許第7,785,856号および同第9,873,868号に記載されている。
【0184】
IGF2の欠失変異株:
いくつかの態様において、IGF配列は、M6P/IGF2受容体と高い親和性で結合することができるIGF2の最小領域を含む。IGF2のM6P/IGF2受容体との結合に関連付けられている残基は、主として、IGF2の1つの面においてクラスターをなしている(Terasawa et al.(1994)EMBO J.13(23):5590-7)。IGF2の三次構造は、通常、3つの分子内ジスルフィド結合によって維持されているが、IGF2のM6P/IGF2受容体結合表面のアミノ酸配列が組み入れられたペプチドを、適切に折り畳まれ、結合活性を有するよう設計することができる。そのような最小結合ペプチドは、高度に好ましいターゲティング部分である。アミノ酸48-55の周辺の領域に基づき設計されたペプチドを、M6P/IGF2受容体との結合について試験することができる。あるいは、ペプチドのランダムライブラリーを、酵母ツーハイブリッドアッセイまたはファージディスプレイ型アッセイのいずれか一方を介して、M6P/IGF2受容体と結合する能力についてスクリーニングすることができる。
【0185】
いくつかの態様において、IGF2配列は、M6P/IGF2受容体と高い親和性で結合することができるIGF2の最小領域である。IGF2のM6P/IGF2受容体との結合に関連付けられている残基は、主として、IGF2の1つの面においてクラスターをなしている(Terasawa et al.(1994)EMBO J.13(23):5590-7)。IGF2の三次構造は、通常、3つの分子内ジスルフィド結合によって維持されているが、IGF2のM6P/IGF2受容体結合表面のアミノ酸配列が組み入れられたペプチドを、適切に折り畳まれ、結合活性を有するよう設計することができる。そのような最小結合ペプチドは、本明細書において、高度に好ましいIGF2配列である。アミノ酸43-55または48-55の周辺の領域に基づき設計されたペプチドを、M6P/IGF2受容体との結合について試験することができる。
【0186】
具体的な態様において、IGF2配列は、バリン43における修飾を含み、ここで、バリンは、翻訳開始がアミノ酸43から始まるよう、metに修飾される(V43M)。ターゲティングペプチドまたはIGF2配列として本発明において使用するために包含されるV43Mの修飾を有するIGF2配列は、カチオン非依存性マンノース-6-リン酸受容体と結合する。別の態様において、IGF2配列は、Metに変化したV43を有するIGF2のデルタ1-42(即ち、IGF2-Δ1-42(SEQ ID NO:8)またはIGF2-V43M(SEQ ID NO:9))である。
【0187】
IGF-Iおよびカチオン非依存性M6P受容体のための結合表面は、IGF2の別々の面上に存在し、ヒトIGF2より実質的に小さい機能性のカチオン非依存性M6P結合ドメインを構築することができる。例えば、ヒトIGF2タンパク質のアミノ末端アミノ酸2-7もしくは1-7、および/またはカルボキシ末端残基62-67を、欠失させるか、または交換することができる。さらに、任意で、ポリペプチドの残りの折り畳みまたはカチオン非依存性M6P受容体との結合を変更することなく、アミノ酸29-40を排除するか、または交換することができる。従って、いくつかの態様において、GAAポリペプチドと融合させるためのIGF2配列には、IGF2のアミノ酸8-28および41-61が含まれ得る。いくつかの態様において、アミノ酸のこれらのストレッチは、直接接合されていてもよいか、またはリンカーによって分離されていてもよい。あるいは、アミノ酸8-28および41-61は、別々のポリペプチド鎖に提供され得る。いくつかの態様において、IGF2のアミノ酸8-28またはその保存的置換バリアントは、rAVVベクターからIGF2-GAA融合タンパク質を発現させるため、GAAポリペプチドと融合していてもよく、かつ別のrAAVベクターは、IGF2アミノ酸41-61またはその保存的置換バリアントを発現してもよい。
【0188】
IGF2配列の適切な提示および折り畳みを容易にするため、IGF2タンパク質のより長い一部分を使用することができる。例えば、アミノ酸残基1-67、1-87、または前駆体型全体を含むIGF2タグを使用することができる。
【0189】
いくつかの態様において、IGF2配列は、以下のうちのいずれかのIGF2ターゲティングペプチドをコードする核酸配列である:SEQ ID NO:5の野生型成熟ヒトインスリン様増殖因子II(IGF2)の残基8-67が後続する残基1(即ち、SEQ ID NO:6;即ち、IGF2-デルタ2-7);SEQ ID NO:5の野生型成熟ヒトインスリン様増殖因子II(IGF2)の残基8-67(即ち、SEQ ID NO:7;IGF2-デルタ1-7)、またはSEQ ID NO:5の野生型成熟ヒトインスリン様増殖因子II(IGF2)の残基43-67(即ち、IGF2-V43M(SEQ ID NO:9)もしくはIGF-デルタ1-42(SEQ ID NO:8))。
【0190】
本明細書中に開示される方法および組成物のいくつかの態様において、IGF2配列は、SEQ ID NO:2(即ち、IGF2-デルタ2-7);SEQ ID NO:3(即ち、IGF2-デルタ1-7)、もしくはSEQ ID NO:4(即ち、IGF2-V43M)、またはそれらとの少なくとも85%、90%、95%、96%、97%、98%、もしくは99%の配列同一性を有する配列のいずれかを含む任意の核酸配列より選択される核酸配列である。
【0191】
SEQ ID NO:2(即ち、IGF2-デルタ2-7)は、以下:
の通りである。
【0192】
SEQ ID NO:3(即ち、IGF2-デルタ1-7)は、以下:
の通りである。
【0193】
SEQ ID NO:4(即ち、IGF2-V43M)は、以下:
の通りである。
【0194】
いくつかの態様において、IGF2配列の適切な提示および折り畳みを容易にするため、IGF2タンパク質のより長い一部分を使用することができる。例えば、アミノ酸残基1-67、1-87、または前駆体型全体を含むIGF2配列を使用することができる。
【0195】
修飾型IGF2配列およびIGF2相同体
いくつかの態様において、IGFBPに対する親和性を低減させ、かつ/またはIGF-I受容体との結合の親和性を減少させ、それによって、融合したGAA-ポリペプチドのリソソームへのターゲティングを向上させ、生物学的利用能を増大させるため、IGF2をコードする核酸を、修飾することができる。
【0196】
IGF2配列は、好ましくは、M6P受容体へ特異的にターゲティングされる。特に有用であるのは、CI-MPR/M6P受容体とは高い親和性で結合するが、他の2つの受容体とは認識できる親和性で結合しないタンパク質をもたらす変異をIGF2ポリペプチド内に有するIGF2配列である。
【0197】
IGF2配列は、IGF2構築物の隔離を回避するため、血清IGF結合タンパク質(IGFBP)(Baxter(2000)Am.J.Physiol Endocrinol Metab.278(6):967-76)およびIGF-I受容体との結合を最小化するため、修飾され得る。多数の研究が、IGF結合タンパク質との結合のために必要なIGF-1およびIGF2の残基を突き止めた。これらの残基における変異を含む構築物を、M6P/IGF2受容体との高親和性結合の保持、およびIGF結合タンパク質に対する親和性の低下についてスクリーニングすることができる。例えば、IGF2のPhe 26のSerへの交換は、IGF2のIGFBP-1およびIGFBP-6に対する親和性を低下させ、M6P/IGF2受容体との結合に対しては効果を及ばさないことが報告されている(Bach et al.(1993)J.Biol.Chem.268(13):9246-54)。Phe 19のためのSerおよびGlu 9のためのLysのようなその他の置換も、有利であり得る。IGF2と高度に保存されているIGF-Iの領域における類似した変異は、別々に、または組み合わせられて、IGF-BP結合の大きい減少をもたらす(Magee et al.(1999)Biochemistry 38(48):15863-70)。
【0198】
IGF2は、比較的高い親和性でIGF2/M6P受容体およびIGF-I受容体と結合し、より低い親和性でインスリン受容体と結合する。IGF2残基48-50(Phe Arg Ser)の、インスリン由来の対応する残基(Thr Ser Ile)との置換、または残基54-55(Ala Leu)の、IGF-I由来の対応する残基(Arg Arg)との置換は、IGF2/M6P受容体との結合を低減させるが、IGF-I受容体およびインスリン受容体との結合は保持される(Sakano et al.(1991)J.Biol.Chem.266(31):20626-35)。
【0199】
IGF2は、カチオン非依存性M6P受容体のリピート11と結合する。実際、カチオン非依存性M6P受容体の膜貫通ドメインおよび細胞質ドメインにリピート11のみが融合しているミニ受容体は、(全長受容体の親和性のおよそ10分の1の親和性で)IGF2と結合し、IGF2の内部移行およびリソソームへの送達を媒介することができる(Grimme et al.(2000)J.Biol.Chem.275(43):33697-33703)。M6P受容体のドメイン11の構造は公知である(Protein Data Base entries 1GP0および1GP3;Brown et al.(2002)EMBO J.21(5):1054-1062)。推定IGF2結合部位は、IGF2の疎水性アミノ酸と相互作用すると考えられている疎水性ポケットであり;IGF2の候補アミノ酸には、ロイシン8、フェニルアラニン48、アラニン54、およびロイシン55が含まれる。リピート11は、IGF2結合のために十分であるが、カチオン非依存性M6P受容体のより大きい一部分(例えば、リピート10-13または1-15)を含む構築物は、一般に、より大きい親和性および増加したpH依存性でIGF2と結合する(例えば、Linnell et al.(2001)J.Biol.Chem.276(26):23986-23991を参照すること)。
【0200】
IGF2残基Tyr 27のLeuへの置換、またはSer 26のPheへの置換は、それぞれ、94倍、56倍、および4倍、IGF2のIGF-I受容体に対する親和性を低減させる(Torres et al.(1995)J.Mol.Biol.248(2):385-401)。ヒトIGF2の残基1-7の欠失は、ヒトIGF-I受容体に対する親和性の30倍の減少をもたらし、同時に、ラットIGF2受容体に対する親和性の12倍の増加をもたらした(Hashimoto et al.(1995)J.Biol.Chem.270(30):18013-8)。IGF2のC末端(残基62-67)の短縮も、IGF2のIGF-I受容体に対する親和性を5倍低下させるようである(Roth et al.(1991)Biochem.Biophys.Res.Commun.181(2):907-14)。
【0201】
IGF2残基フェニルアラニン26のセリンへの置換は、IGFBP1-5との結合を5~75倍低下させる(Bach et al.(1993)J.Biol.Chem.268(13):9246-54)。IGF2残基48-50のトレオニン-セリン-イソロイシンへの交換は、IGFBPの大部分との結合を100倍超低下させる(Bach et al.(1993)J.Biol.Chem.268(13):9246-54);しかしながら、これらの残基は、カチオン非依存性マンノース-6-リン酸受容体との結合にも重要である。IGF-I受容体との結合を破壊するY27L置換は、IGFBP3および酸不安定サブユニットとの三重複合体の形成に干渉する(Hashimoto et al.(1997)J.Biol.Chem.272(44):27936-42);この三重複合体は、循環中のIGF2の大部分を占める(Yu et al.(1999)J.Clin.Lab Anal.13(4):166-72)。IGF2の最初の6残基の欠失も、IGFBP結合に干渉する(Luthi et al.(1992)Eur.J.Biochem.205(2):483-90)。
【0202】
IGF-IのIGFBPとの相互作用に関する研究は、さらに、フェニルアラニン16のセリンへの置換が、二次構造には影響しないが、IGFBP結合を40~300倍減少させることを明らかにした(Magee et al.(1999)Biochemistry 38(48):15863-70)。グルタミン酸9のリジンへの変化も、IGFBP結合の有意な減少をもたらした。さらに、二重変異体リジン9/セリン16は、IGFBPに対する最低の親和性を示した。IGF-IとIGF2との間のこの領域の配列の保存は、類似した変異がIGF2において作成された時、類似した効果が観察されることを示唆する(グルタミン酸12リジン/フェニルアラニン19セリン)。
【0203】
いくつかの態様において、IGF2配列は、少なくともアミノ酸48-55;少なくともアミノ酸8-28および41-61;もしくは少なくともアミノ酸8-87、またはカチオン非依存性マンノース-6-リン酸受容体と結合するそれらの配列バリアント(例えば、R68A)もしくはそれらの短縮型(例えば、62位からC末端が短縮されたもの)を含む。
【0204】
IGF2配列のIGF-I受容体との結合を減少させる: IGF2残基Tyr 27のLeuへの置換、またはSer 26のPheへの置換は、それぞれ、94倍、56倍、および4倍、IGF2のIGF-I受容体に対する親和性を低減させる(Torres et al.(1995)J.Mol.Biol.248(2):385-401)。ヒトIGF2の残基1-7の欠失は、ヒトIGF-I受容体に対する親和性の30倍の減少をもたらし、同時に、ラットIGF2受容体に対する親和性の12倍の増加をもたらした(Hashimoto et al.(1995)J.Biol.Chem.270(30):18013-8)。IGF2のNMR構造は、Thr 7が、残基48 Pheおよび50 Serの近くに位置し、9 Cys-47 Cysジスルフィド架橋の近くにも位置することを示す。Thr 7のこれらの残基との相互作用は、IGF-I受容体結合のために必要とされる可動性のN末端ヘキサペプチドを安定化することができると考えられる(Terasawa et al.(1994)EMBO J.13(23)5590-7)。同時に、この相互作用は、IGF2受容体との結合をモジュレートすることができる。IGF2のC末端(残基62-67)の短縮も、IGF2のIGF-I受容体に対する親和性を5倍低下させるようである(Roth et al.(1991)Biochem.Biophys.Res.Commun.181(2):907-14)。
【0205】
いくつかの態様において、本発明において使用するために包含されるターゲティングペプチド(例えば、IGF2配列)は、μM以下の解離定数でCI-MPRと結合する。概して、より低い解離定数(例えば、10-7M未満、10-8M未満、または10-9M未満)が好ましい。解離定数の決定は、当業者によって、例えば、Linnell et al.(2001)J.Biol.Chem.276(26):23986-23991に記載されるような表面プラズモン共鳴によって決定され得る。いくつかの態様において、ターゲティングペプチド(例えば、IGF2配列)のCI-MPRと結合する能力の評価は、アビジン-ビオチン相互作用を通してチップに固定化されたCI-MPRの細胞外ドメインの可溶型(例えば、カチオン非依存性M6P受容体のリピート1-15)を含むアッセイを使用して決定され得る。ターゲティングペプチド(例えば、IGF2配列)をチップ上に通過させ、チップ表面に会合した質量の変化を測定することによって、動力学的定数および平衡定数を検出し、計算する。
【0206】
本発明の別の態様において、ターゲティングペプチド(例えば、IGF2配列)をコードするrAAVゲノムは、成熟型70/76kDalポリペプチドとC末端ドメインとの接合部、例えば、791位において、ネイティブGAAコード配列に挿入される。これは単一のキメラポリペプチドを作出する。ターゲティングペプチド(例えば、IGF2配列)は、この配置においては同族受容体と結合することができないため、プロテアーゼ切断部位が、ターゲティングペプチド(例えば、IGF2配列)の直ぐ下流に挿入され得る。タンパク質が正確な折り畳み形態で産生された後、C末端ドメインが、プロテアーゼ処理によって切断され得る。
【0207】
ヒト血清中に通常見出されるプロテアーゼが作用するプロテアーゼ切断部位を用いることが、望ましい場合がある。このように、ターゲティングペプチド(例えば、IGF2配列)タグ付きGAAが、プロドラッグ型で血流へ導入され、血清中に常在するプロテアーゼによって、取り込みのため活性化され得る。これは、酵素の分布を改善し得る。以前と同様に、ペプチドタグは、IGF2配列タグまたは筋肉特異的タグであり得る。
【0208】
本発明の別の態様において、ターゲティングペプチド(例えば、IGF2配列)は、酵素活性が保持されるよう、GAAのN末端において融合させられる。N末端融合のケースにおいては、ネイティブGAAシグナルペプチドを異種シグナルペプチドに置換することによって、酵素の分泌レベルに影響を与えることが可能である。
【0209】
いくつかの態様において、ターゲティングペプチド(例えば、IGF2配列)をコードするrAAVゲノムは、成熟70/76kDalポリペプチドとC末端ドメインとの接合部、例えば、791位において、ネイティブGAAコード配列に挿入される。これは単一の融合(またはキメラ)ポリペプチドを作成する。ターゲティングペプチド(例えば、IGF2配列)は、この配置においては、同族受容体と結合することができないため、プロテアーゼ切断部位は、ターゲティングペプチド(例えば、IGF2配列)の直ぐ下流に挿入され得る。GAAポリペプチドが正確な折り畳み型で産生された後、C末端ドメインが、プロテアーゼ処理によって切断され得る。
【0210】
従って、いくつかの態様において、ヒト血清中に通常見出されるプロテアーゼが作用するプロテアーゼ切断部位を用いることが、望ましい場合がある。このように、GAAポリペプチドと融合したターゲティングペプチド(例えば、IGF2配列)が、プロドラッグ型で血流へ導入され、血清中に常在するプロテアーゼによって、取り込みのため活性化され得る。これは、GAAポリペプチドの分布を改善し得る。以前と同様に、ターゲティングペプチドは、本明細書中に開示されるIGF2配列または筋肉特異的配列である。
【0211】
本発明の別の態様において、ターゲティングペプチド(例えば、IGF2配列)は、酵素活性が保持されるよう、GAAのN末端において融合させられる(例えば、GAA活性を測定するためのアッセイを記載する実施例を参照すること)。N末端融合のケースにおいては、ネイティブGAAシグナルペプチドを本明細書中に記載される異種シグナルペプチドに置換することによって、GAAの分泌のレベルを増加させることが可能である。
【0212】
一つの態様において、本明細書において定義されるターゲティングペプチド、例えば、IGF2配列は、GAAポリペプチドのN末端またはC末端と直接融合させられる。別の態様において、IGF2配列は、スペーサーによって、GAAポリペプチドのN末端またはC末端と融合させられる。一つの具体的な態様において、IGF2配列は、10~25アミノ酸のスペーサーによって、GAAポリペプチドと融合させられる。別の態様において、IGF2配列はグリシン残基を含むスペーサーによって、GAAポリペプチドと融合させられる。
【0213】
いくつかの態様において、IGF2配列は、少なくとも1、2、または3アミノ酸のスペーサーによってGAAポリペプチドと融合させられる。いくつかの態様において、スペーサーは、アミノ酸GAPもしくはGly-Ala-Pro(SEQ ID NO:31)、またはそれらと少なくとも50%同一のアミノ酸配列を含む。いくつかの態様において、スペーサーは、GGGもしくはGAもしくはAPもしくはGP、またはそれらのバリアントである。いくつかの態様において、スペーサーは、核酸ggc gcg ccg(SEQ ID NO:30)によってコードされる。
【0214】
いくつかの態様において、IGF2配列は、ヘリックス構造を含むスペーサーによってGAAポリペプチドと融合させられる。別の具体的な態様において、IGF2配列は、配列
と少なくとも50%同一のスペーサーによって、GAAポリペプチドと融合させられる。本明細書中に開示される方法および組成物のいくつかの態様において、スペーサーは、(SEQ ID NO:30の核酸によってコードされる)SEQ ID NO:31である。本明細書中に開示される方法および組成物のいくつかの態様において、スペーサーは、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、もしくはSEQ ID NO:35、またはそれらとの少なくとも85%、90%、95%、96%、97%、98%、もしくは99%の配列同一性を有する配列のいずれかより選択される。
【0215】
カチオン非依存性M6P受容体
いくつかの態様において、ターゲティングペプチドは、マンノース-6-リン酸非依存的にカチオン非依存性M6P/IGF2受容体(CI-MPR)と結合するリソソームターゲティングペプチドもしくはタンパク質またはその他の部分である。有利に、この態様は、LSDタンパク質の取り込みのための通常の生物学的機序を模倣するが、マンノース-6-リン酸非依存的にそれを行う。
【0216】
カチオン非依存性M6P受容体は、哺乳動物組織において広範に発現されている275kDa単鎖膜貫通型糖タンパク質である。それは、M6Pと結合する2つの哺乳動物受容体のうちの1つであり、第2のものは、カチオン依存性M6P受容体と呼ばれる。カチオン依存性M6P受容体は、M6P結合のため、2価カチオンを必要とし;カチオン非依存性M6P受容体は、それを必要としない。これらの受容体は、リソソーム酵素上の高マンノース型炭水化物上のM6P部分の認識を通して、リソソーム酵素の交通において重要な役割を果たす。カチオン非依存性M6P受容体の細胞外ドメインは、受容体上の分離した位置に、リガンドの多様な群と結合する15の相同ドメイン(「リピート」)を含有する。
【0217】
カチオン非依存性M6P受容体(CI-MPR)は、M6Pのための2つの結合部位を含有し、一方はリピート1-3に位置し、他方はリピート7-9に位置する。受容体は、μM範囲の解離定数で1価M6Pリガンドと結合するが、恐らく、受容体オリゴマー化のため、2価M6PリガンドとはnM範囲の解離定数で結合する。CI-MPRによるIGF2の取り込みは、リソソーム酵素のような多価M6Pリガンドの受容体との同時結合によって増強される。
【0218】
CI-MPRは、ターゲティングペプチドとして使用され得る少なくとも3つの異なるリガンドのための結合部位を含有する。本明細書中に開示されるように、IGF2リガンドは、主として、リピート11との相互作用を通して、7.4または約7.4のpHで、約14nMの解離定数で、CI-MPRと結合する。IGF2をリソソームへターゲティングする機能と一致して、解離定数は、5.5または約5.5のpHで、およそ100倍増加し、酸性の後期エンドソームにおけるIGF2の解離を促進する。CI-MPRは、高分子量O-グリコシル化IGF2型と結合することができる。従って、いくつかの態様において、IGF2配列はO-グリコシル化を含む。
【0219】
別の態様において、CI-MPRと結合するターゲティングペプチドは、レチノイン酸である。レチノイン酸は、2.5nMの解離定数で受容体と結合する。レチノイン酸によるカチオン非依存性M6P受容体のアフィニティ光標識は、IGF2またはM6Pの受容体との結合に干渉せず、このことは、レチノイン酸が受容体上の異なる部位と結合することを示している。レチノイン酸の受容体との結合は、細胞質小胞内の受容体のより大きい蓄積により、受容体の細胞内分布を変更し、M6P修飾型βグルクロニダーゼの取り込みも増強する。レチノイン酸は、カチオン非依存性M6P受容体と結合する能力に干渉することなく、それを治療剤に連結するために使用され得る光活性化可能部分を有する。
【0220】
ウロキナーゼ型プラスミノーゲン受容体(uPAR)も、9μMの解離定数でCI-MPRと結合する。uPARは、大部分の細胞型の表面上にあるGPIによって固定された受容体であり、接着分子として機能し、プラスミノーゲンおよびTGFβのタンパク質分解による活性化において機能する。uPARのCI-M6P受容体との結合は、それをリソソームへターゲティングし、それによって、その活性をモジュレートする。uPARの細胞外ドメイン、またはカチオン非依存性M6P受容体と結合することができるその一部分を治療剤と融合させることによって、薬剤のリソソームへのターゲティングが可能になる。
【0221】
いくつかの態様において、IGF2配列は、フューリン抵抗性、即ち、Arg-X-X-Arg切断部位を認識するフューリンプロテアーゼによる分解に対して抵抗性となるよう修飾される。そのようなIGF2配列は、参照によってその全体が本明細書中に組み入れられる米国特許出願第22012/0213762号に開示されている。いくつかの態様において、本明細書中に記載されるrAAVゲノムにおいて使用するためのフューリン抵抗性IGF2配列は、SEQ ID NO:5(wt IGF2配列)のアミノ酸30-40(例えば、31-40、32-40、33-40、34-40、30-39、31-39、32-39、34-37、32-39、33-39、34-39、35-39、36-39、37-40、34-40)に対応する領域に、他のアミノ酸への置換または欠失であり得る変異を含有する。例えば、位置34における置換は、第1の切断部位のフューリンによる認識に影響を与え得る。各認識部位における1つまたは複数の付加的なアミノ酸の挿入は、一方または両方のフューリン切断部位を消失させ得る。縮重位置における残基のうちの1つまたは複数の欠失も、両方のフューリン切断部位を消失させ得る。
【0222】
いくつかの態様において、フューリン抵抗性IGF2配列は、SEQ ID NO:5のArg37(R37)またはArg40(R40)に対応する位置にアミノ酸置換を含有する。いくつかの態様において、フューリン抵抗性IGF2配列は、SEQ ID NO:5の位置Arg37またはArg40にLys(K)またはAla(A)の置換を含有する。37位および40位の両方におけるLysおよび/またはAla変異の組み合わせ、またはLys(K)もしくはAla(A)以外のアミノ酸の置換を含む、その他の置換も可能である。いくつかの態様において、本明細書中に開示されるrAVVゲノムにおいて使用するために包含されるIGF2配列は、IGFΔ2-7-K37またはIGFΔ2-7-K40またはIGFΔ1-7-K37またはIGFΔ1-7-K40であり、これらは、それぞれ、IGF2配列が、aa2-7または1-7の欠失、および37位のArg(R)残基のリジンへの修飾(即ち、R37K修飾)またはR40Kを有することを示す。いくつかの態様において、本明細書中に開示されるrAVVゲノムにおいて使用するために包含されるIGF2配列は、IGFΔ2-7-K37-K40またはIGFΔ1-7-R37K-R40Kであり、これらは、IGF2配列が、残基2-7または残基1-7の欠失、ならびに37位および40位のR残基のリジンへの修飾(R37KおよびR40K)を有することを示す。いくつかの態様において、本明細書中に開示されるrAVVゲノムにおいて使用するために包含されるIGF2配列は、IGFΔ2-7-R37AまたはIGFΔ2-7-R40AまたはIGFΔ1-7-R37AまたはIGFΔ1-7-R40A、IGFΔ2-7-R37A-R40AまたはIGFΔ1-7-R37A-R40Aのいずれかより選択される。本明細書中に開示されるrAVVゲノムにおいて使用するために包含されるIGF2配列のための例示的な構築物は、参照によってその全体が本明細書中に組み入れられる米国特許出願2012/0213762号に開示される。
【0223】
いくつかの態様において、本発明のために適切なフューリン抵抗性IGF-2配列は、付加的な変異を含有してもよい。例えば、SEQ ID NO:5の残基の30%までまたはそれ以上が、変化させられ得る(例えば、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%まで、またはそれ以上の残基が変化させられ得る)。従って、本発明のために適切なフューリン抵抗性IGF2ムテインは、SEQ ID NO:5と少なくとも70%、例えば、少なくとも70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99%同一のアミノ酸配列を有し得る。
【0224】
さらに、本明細書中に開示されるIGF2配列の使用は、リソソームを標的とする部分としてのM6PがIGF2配列に交換されるため、当技術分野において、グリコシル化非依存性リソソームターゲティング(GILT)とも呼ばれる。GILT技術の詳細は、米国特許出願公開第2003/0082176号、同2004/0006008号、同2004/0005309号、同2003/0072761号、同2005/0281805号、同2005/0244400号、および国際公報WO 03/032913、WO 03/032727、WO 02/087510、WO 03/102583、WO 2005/078077に記載されており、これらの全ての開示は参照によって本明細書中に組み入れられる。
【0225】
D. GAAポリペプチドのスペーサーおよび融合接合部
GAAが分泌シグナルペプチドとの融合タンパク質(例えば、SS-GAAポリペプチド)、またはターゲティングペプチドとの融合タンパク質(即ち、SS-IGF2-GAAポリペプチド二重融合ポリペプチド)として発現される場合、シグナルペプチドまたはIGF2配列は、直接的にGAAポリペプチドと融合していてもよいか、またはリンカーによってGAAポリペプチドから分離されていてもよい。(本明細書において「スペーサー」とも呼ばれる)アミノ酸リンカーには、天然タンパク質のその位置に出現するもの以外の1つまたは複数のアミノ酸が組み入れられる。スペーサーは、一般に、可動性であるよう設計されてもよいか、または2つのタンパク質部分の間にa-ヘリックスのような構造を挿入するため、設計されてもよい。
【0226】
いくつかの態様において、スペーサーまたはリンカーは、比較的短く、例えば、少なくとも1、2、3、4、もしくは5アミノ酸、もしくは配列Gly-Ala-Pro(SEQ ID NO:31)もしくはGly-Gly-Gly-Gly-Gly-Pro(SEQ ID NO:32)であってもよいか、またはより長く、例えば、5~10アミノ酸長もしくは10~25アミノ酸長であってもよい。例えば、配列(GGGGS(SEQ ID NO:33))の3~4コピーの可動性反復リンカー、および配列(EAAAK(SEQ ID NO:34))の2~5コピーのa-ヘリックス反復リンカーが、記載されている(Arai et al.(2004)Proteins:Structure,Function and Bioinformatics 57:829-838)。
【0227】
別のリンカーであるGGGTVGDDDDK(SEQ ID NO:35)の使用も、IGF2融合タンパク質に関して報告されており(DiFalco et al.(1997)Biochem.J.326:407-413)、使用するために包含される。ヒト血清タンパク質のa-ヘリックス部分が組み入れられたリンカーは、リンカー領域の免疫原性を最小化するため、使用され得る。
【0228】
いくつかの態様において、スペーサーは、アミノ酸GAPまたはGly-Ala-Pro(SEQ ID NO:31)を含むアミノ酸スペーサーをコードする核酸ggc gcg ccg(SEQ ID NO:30)によってコードされる。
【0229】
(SS-GAA融合タンパク質を生成するための)シグナルペプチドまたは(例えば、SP-IGF2-GAA二重融合ポリペプチドを生成するための)ターゲティングペプチドのいずれか一方と融合させるためのGAAポリペプチド内の融合接合部の部位は、融合タンパク質内の各ポリペプチドの適切な折り畳みおよび活性を促進し、GAAポリペプチドからのシグナルペプチドの早熟分離を防止するため、注意して選択されるべきである。
【0230】
いくつかの態様において、IGF2配列は、ヘリックス構造を含むスペーサーによってGAAポリペプチドと融合させられる。別の具体的な態様において、IGF2配列は、配列GGGTVGDDDDK(SEQ ID NO:35)と少なくとも50%同一のスペーサーによって、GAAポリペプチドと融合させられる。本明細書中に開示される方法および組成物のいくつかの態様において、スペーサーは、(SEQ ID NO:30の核酸によってコードされる)SEQ ID NO:31である。本明細書中に開示される方法および組成物のいくつかの態様において、スペーサーは、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、またはSEQ ID NO:35のいずれかより選択される。
【0231】
GF2-GAA融合タンパク質を作出するための4つの例示的な戦略が生成され得、以下の通りである。
1. GAAのアミノ末端におけるIGF2配列の融合。
2. トレフォイルドメインとGAAの成熟領域との間のIGF2配列の挿入。
3. GAAの成熟領域とGAAのC末端ドメインとの間のIGF2配列の挿入。
4. 短縮型GAAポリペプチドのC末端とのIGF2配列の融合およびC末端ドメインの同時発現。
【0232】
例えば、ターゲティングペプチド(例えば、IGF2配列)は、本明細書中の実施例に記載されるように、タンパク質の発現、GAAタンパク質の触媒活性、およびIGF2配列による適切なターゲティングを可能にする位置であるGAAのアミノ酸40またはアミノ酸70と、直接またはスペーサーによって融合させられ得る。あるいは、ターゲティングペプチド(例えば、IGF2配列)は、成熟型ポリペプチドからGAAのC末端ドメインを分離する切断部位において、またはその近くにおいて融合させられ得る。これは、切断部位の配置に依って、ターゲティングドメインから成熟型ポリペプチドまたはC末端ドメインを遊離させるため、任意で切断され得る、内部ターゲティングペプチド(例えば、IGF2配列)を含むGAAタンパク質の合成を可能にする。あるいは、成熟型ポリペプチドは、発現構築物のオープンリーディングフレームにC末端配列を組み入れることなく、約791位における融合タンパク質として合成され得る。
【0233】
IGF2配列の折り畳みを容易にするため、融合接合部と近接したGAAアミノ酸残基を修飾することができる。例えば、GAAシスチン残基は、ターゲティングペプチド(例えば、IGF2配列)の適切な折り畳みに干渉し得るため、末端GAAシスチン952を、C末端ターゲティングペプチド(例えば、IGF2配列)が適合するよう、欠失させるかまたはセリンに置換することができる。ターゲティングペプチド(例えば、IGF2配列)を、最後のCys952の直前で融合させることもできる。最後のCys952をセリンへ変異させると共に、最後から2番目のcys938をプロリンに変化させることができる。
【0234】
E. CS配列
いくつかの態様において、本明細書中に開示されたrAAVゲノムは、GAA遺伝子の3'側かつポリAシグナルの5'側に位置付けられたコラーゲン安定性配列(CSまたはCSS)を任意で含んでいてもよい異種核酸配列を含む。例示的なコラーゲン安定性配列は、
、またはそれとの少なくとも85%、90%、95%、96%、97%、98%、もしくは99%の配列同一性を有する配列を含む。例示的なコラーゲン安定性配列は、P S P L F P(SEQ ID NO:66)のアミノ酸配列、またはそれとの少なくとも85%、90%、95%、96%、97%、98%、もしくは99%の配列同一性を有するアミノ酸配列を有し得る。CS配列は、参照によってその全体が本明細書中に組み入れられるHolick and Liebhaber,Proc.Nat.Acad.Sci.94:2410-2414,1997(例えば、
図3、5205頁を参照すること)に開示されている。
【0235】
いくつかの態様において、本明細書中に開示されたrAAVゲノムは、任意で、コラーゲン安定性配列(CS)の代わりに、別の安定性配列を含んでいてもよい異種核酸配列を含む。他の安定性配列は、当業者に公知であり、本明細書中に開示されたコラーゲン安定性配列の代わりに、またはそれに加えて、rAAVゲノムにおいて使用するために包含される。
【0236】
F. プロモーター
いくつかの態様において、適切なレベルのGAA発現を達成するため、rAAV遺伝子型はプロモーターを含む。適切なプロモーターは、当業者に公知の多数のプロモーターのいずれかより選択され得る。いくつかの態様において、プロモーターは、細胞型特異的プロモーターである。さらなる態様において、プロモーターは、誘導性プロモーターである。一態様において、プロモーターは、上流、5'に位置し、異種核酸配列と機能的に連結されている。いくつかの態様において、プロモーターは、肝細胞型特異的プロモーター、心筋細胞型特異的プロモーター、ニューロン細胞型特異的プロモーター、神経細胞型特異的プロモーター、筋細胞型特異的プロモーター、または別の細胞型特異的プロモーターである。
【0237】
いくつかの態様において、構成性プロモーターは、異なる強度および組織特異性を有する構成性プロモーターの群より選択され得る。これらのプロモーターのいくつかの例は、表4に示される。rAAVベクターゲノムは、一般に転写促進活性を有するウイルスプロモーターまたは哺乳動物遺伝子由来のプロモーターのような、1つまたは複数の構成性プロモーターを含むことができる。構成性ウイルスプロモーターの例は、単純ヘルペスウイルス(HSV)プロモーター、チミジンキナーゼ(TK)プロモーター、ラウス肉腫ウイルス(RSV)プロモーター、サルウイルス40(SV40)プロモーター、マウス乳癌ウイルス(MMTV)プロモーター、Ad EIAプロモーター、およびサイトメガロウイルス(CMV)プロモーターである。構成性哺乳動物プロモーターの例には、βアクチンプロモーターおよびニワトリβアクチン(CB)プロモーターによって例示されるような、様々なハウスキーピング遺伝子プロモーターが含まれ、CBプロモーターは、GAAを発現させるために特に有用な構成性プロモーターであることが判明している。
【0238】
一態様において、プロモーターは、組織特異的プロモーターである。本発明のrAAVベクターゲノムと共に使用され得る組織特異的プロモーターの例には、クレアチンキナーゼプロモーター、ミオゲニンプロモーター、αミオシン重鎖プロモーター、筋細胞特異的エンハンサー因子2(MEF2)プロモーター、myoDエンハンサー要素、アルブミン、α-1-アンチトリプシンプロモーター、およびB型肝炎ウイルスコアタンパク質プロモーターが含まれ、ここで、B型肝炎ウイルスコアタンパク質プロモーターは肝細胞に特異的である。
【0239】
一態様において、プロモーターは誘導性プロモーターである。適切な誘導性プロモーターの例には、シトクロムP450遺伝子、熱ショックタンパク質遺伝子、メタロチオネイン遺伝子、およびホルモン誘導性遺伝子のような遺伝子に由来するもの、例えば、エストロゲン遺伝子プロモーターが含まれる。誘導性プロモーターの別の例は、テトラサイクリンに対して応答性であるtetVP16プロモーターである。
【0240】
本明細書中の開示によるrAAVゲノム内のプロモーターには、シナプシン1(SYN)プロモーターのようなニューロン特異的プロモーター;筋肉クレアチンキナーゼ(MCK)プロモーター;およびデスミン(DES)プロモーターが含まれるが、これらに限定されるわけではない。一つの態様において、(ヒトGAAのような)異種核酸のAAVによって媒介される発現は、シナプシンプロモーターを介してニューロンにおいて、またはMCKプロモーターを介して骨格筋において、達成され得る。使用され得る他のプロモーターには、EF、B19p6、CAG、ニューロン特異的エノラーゼ遺伝子プロモーター;ニワトリβアクチン/CMVハイブリッドプロモーター;血小板由来増殖因子遺伝子プロモーター;bGH、EF1a、CamKIIa、GFAP、RPE、ALB、TBG、MBP、MCK、TNT、aMHC、GFP、RFP、mCherry、CFP、およびYFPプロモーターが含まれる。
【0241】
【0242】
肝臓特異的プロモーター
本明細書中に開示される方法および組成物のいくつかの態様において、プロモーターは、肝臓特異的プロモーターであり、トランスサイレチンプロモーター(TTR)、例えば、5,863,541に開示されたような(TTRプロモーター)、肝臓特異的プロモーター(LSP)、またはLSPプロモーター(PNAS;96:3906-3910,1999、例えば、3906頁、Materials and Methods,rAAV constructionを参照すること)、合成肝臓プロモーターを含むが、これらに限定されるわけではない、任意の肝臓特異的プロモーターより選択され得、これらの参照は参照によってその全体が本明細書中に組み入れられる。他の肝臓プロモーター、例えば、合成肝臓プロモーターも、使用され得る。
【0243】
いくつかの態様において、TTRプロモーターは、例えば、SEQ ID NO:12を含むか、またはそれとの少なくとも85%、90%、95%、96%、97%、98%、もしくは99%のヌクレオチド配列同一性の配列を少なくとも有するバリアントを含む、短縮型TTRプロモーターである。
【0244】
他の肝臓特異的プロモーターには、LDL受容体、第VIII因子、第IX因子、フェニルアラニンヒドロキシラーゼ(PAH)、オルニチントランスカルバミラーゼ(OTC)、およびα1アンチトリプシン(hAAT)のためのプロモーター、ならびにHCBプロモーターが含まれるが、これらに限定されるわけではない。他の肝臓特異的プロモーターには、EP特許公報0 415 731に開示されるようなAFP(α胎児タンパク質)遺伝子プロモーターおよびアルブミン遺伝子プロモーター、Rettenger,Proc.Natl.Acad.Sci.91(1994)1460-1464に開示されるようなα1アンチトリプシン遺伝子プロモーター、フィブリノーゲン遺伝子プロモーター、APO-A1(アポリポタンパク質A1)遺伝子プロモーター、ならびに、例えば、SGOT、SGPT、およびγグルタミルトランスフェラーゼのような肝臓転移酵素のためのプロモーター遺伝子が含まれる。参照によってその全体が本明細書中に組み入れられる2001/0051611ならびにPCT特許公報WO 90/07936およびWO 91/02805も参照すること。いくつかの態様において、肝臓特異的プロモーターは、例えば、参照によってその全体が本明細書中に組み入れられるUS20170326256A1に開示されるような組換え肝臓特異的プロモーターである。
【0245】
いくつかの態様において、肝臓特異的プロモーターは、B型肝炎X遺伝子プロモーターおよびB型肝炎コアタンパク質プロモーターである。いくつかの態様において、肝臓特異的プロモーターは、それぞれのエンハンサーと共に使用され得る。エンハンサー要素は、GAAポリペプチドをコードする核酸の5'または3'末端のいずれか一方において連結され得る。B型肝炎X遺伝子プロモーターおよびそのエンハンサーは、Twu,J Virol.61(1987)3448-3453に記載された方法を用いて、332塩基対EcoRV-NcoI DNA断片としてウイルスゲノムから得られてよい。B型肝炎コアタンパク質プロモーターは、Gerlach,Virol 189(1992)59-66に記載された方法を用いて、584塩基対BamHI-BgIII DNA断片としてウイルスゲノムから得られてよい。挿入前にBamHI-BgIII断片内の負の制御配列を除去する必要がある場合がある。
【0246】
G. イントロン配列
いくつかの態様において、rAAV遺伝子型は、プロモーター配列の3'側かつ分泌シグナルペプチドの5'側に位置するイントロン配列を含む。イントロン配列は、mRNA安定性、核外へのmRNA輸送、ならびに/または発現されたGAA融合ポリペプチド(例えば、SS-GAA融合ポリペプチドもしくはSS-IGF2-GAAポリペプチド)の発現および/もしくは制御のうちの1つまたは複数を増大させるため、役立つ。
【0247】
いくつかの態様において、イントロン配列は、MVMイントロン配列、例えば、SEQ ID NO:13のイントロン配列、またはそれとの少なくとも80%、85%、90%、95%、96%、97%、98%、もしくは99%のヌクレオチド配列同一性を有する核酸配列であるが、これらに限定されるわけではない。
【0248】
いくつかの態様において、イントロン配列は、HBB2イントロン配列、例えば、SEQ ID NO:14のイントロン配列、またはそれとの少なくとも80%、85%、90%、95%、96%、97%、98%、もしくは99%のヌクレオチド配列同一性を有する核酸配列であるが、これらに限定されるわけではない。
【0249】
いくつかの態様において、rAAV遺伝子型は、ヒトβグロビンb2(またはHBB2)イントロン、FIXイントロン、ニワトリβグロビンイントロン、およびSV40イントロンからなる群において選択されるイントロン配列を含む。いくつかの態様において、イントロンは、任意で、修飾型HBB2イントロン(例えば、WO2018046774A1のSEQ ID NO:17を参照すること):修飾型FIXイントロン(例えば、WO2018046774A1のSEQ ID NO:19を参照すること)、もしくは修飾型ニワトリβグロビンイントロン(例えば、WO2018046774A1のSEQ ID NO:21を参照すること)、または参照によってその全体が本明細書中に組み入れられるWO2015/162302に開示された修飾型のHBB2もしくはFIXイントロンのような修飾型イントロンである。
【0250】
H. ポリA
いくつかの態様において、rAAVベクターゲノムは、異種核酸遺伝子の3'側かつ下流に位置する少なくとも1つのポリAテールを含み、異種核酸遺伝子は、一つの態様において、GAA融合ポリペプチド(例えば、SS-GAA融合ポリペプチドまたはSS-IGF2-GAAポリペプチド)をコードする。いくつかの態様において、ポリAシグナルは、本明細書中に定義される安定性配列またはCS配列の3'側に存在する。hGHポリA、synpAポリA等を含むが、これらに限定されるわけではない、任意のポリA配列が使用され得る。いくつかの態様において、ポリAは、合成ポリA配列である。いくつかの態様において、rAAVベクターゲノムは、2つのポリAテール、例えば、hGHポリA配列および別のポリA配列を含み、2つのポリA配列の間にスペーサー核酸配列が位置している。いくつかの態様において、rAAVゲノムは、GAA融合ポリペプチド(例えば、SS-GAA融合ポリペプチドまたはSS-IGF2-GAAポリペプチド)をコードする核酸の3'側、あるいはCS配列の3'側に、以下の要素を含む;第1のポリA配列、(100~400bpまたは約250bpの)スペーサー核酸配列、第2のポリA配列、スペーサー核酸配列、および3'ITR。いくつかの態様において、第1および第2のポリA配列は、hGHポリA配列であり、いくつかの態様において、第1および第2のポリA配列は、合成ポリA配列である。いくつかの態様において、第1のポリA配列がhGHポリA配列であり、第2のポリA配列が合成配列であるか、またはその逆であり、即ち、別の態様において、第1のポリA配列が合成ポリA配列であり、第2のポリA配列がhGHポリA配列である。例示的なポリA配列は、例えば、SEQ ID NO:15(hGHポリA配列)、またはSEQ ID NO:15との少なくとも80%、85%、90%、95%、96%、97%、98%、もしくは99%のヌクレオチド配列同一性を有するポリA核酸配列である。いくつかの態様において、使用するために包含されるhGHポリ配列は、参照によってその全体が本明細書中に組み入れられるAnderson et al.J.Biol.Chem 264(14);8222-8229,1989(例えば、8223頁、第2カラム、第1パラグラフを参照すること)に記載されている。
【0251】
いくつかの態様において、ポリAテールは、rAAVベクターゲノムから転写されるRNA転写物、例えば、一つの態様において、GAAである、異種遺伝子の転写物を安定化するため、改変され得、別の態様において、ポリAテールは、不安定化要素を含むよう改変され得る。
【0252】
一態様において、ポリAテールは、ポリAテールの長さを変更することによって不安定化要素になるよう改変され得る。一態様において、ポリAテールは、延長されるか、または短縮されてもよい。さらなる態様において、異種遺伝子、一つの態様において、GAAと、ポリAテールとの間に存在する3'非翻訳領域は、異種遺伝子の発現レベルを変更するため、または産生される最終ポリペプチドを変更するため、延長されるか、または短縮されてもよい。いくつかの態様において、3'非翻訳領域は、GAA 3'UTR(SEQ ID NO:85)を含む。
【0253】
別の態様において、不安定化要素は、異種遺伝子をコードする、miRNAが結合するRNA転写物のサイレンシングを生じる(翻訳を抑制し、分解を促進する)能力を有するマイクロRNA(miRNA)である。異種遺伝子、一つの態様において、GAAの発現のモジュレーションは、miRNAが結合するポリA内のシード領域の修飾、付加、または欠失によって行われ得る。一態様において、ポリAテール内のシード領域の付加または欠失は、rAAVベクターゲノム内の異種遺伝子によってコードされたタンパク質、一つの態様において、GAAの発現を増大させるか、または減少させることができる。さらなる態様において、シード領域の付加または欠失の結果として起こる、そのような発現の増大または減少は、rAAVベクターゲノムを含有するAAVによって形質導入された細胞型に依存する。例えば、筋細胞および心細胞において発現され、肝細胞には見出されない、miRNAに特異的なシード領域が、異種遺伝子によってコードされたポリペプチド、一つの態様において、GAAが、肝細胞において産生され、筋細胞または心細胞においては産生されないことを可能にするため、使用され得る。
【0254】
別の態様において、シード領域は、異種遺伝子とポリAテールとの間に位置する3'非翻訳領域において改変されてもよい。さらなる態様において、不安定化剤は、siRNAであり得る。siRNAのコード領域が、rAAVベクターゲノムに含まれていてよく、一般に、ポリAテールの下流、3'側に位置する。一態様において、異種遺伝子、一つの態様において、GAAの発現は、rAAVカセットに、例えば、ポリAテールの下流、3'側に、siRNAのコード領域を含めることによって行われ得る。さらなる態様において、異種遺伝子、一つの態様において、GAAの発現が望まれない組織においては、siRNAのサイレンシングが起こり、異種遺伝子、一つの態様において、GAAの発現が望まれる組織においては、siRNA発現が起こらないよう、siRNAの発現を誘導するプロモーターは、組織特異的であり得る。
【0255】
本明細書中に開示される方法および組成物の全ての局面において、rAAVゲノムは、スタッファーDNA核酸配列も含み得る。例示的なスタッファーDNA配列は、SEQ ID NO:71、またはそれとの少なくとも80%、85%、90%、95%、96%、97%、98%、もしくは99%のヌクレオチド配列同一性を有する核酸配列である。
図8~13および
図14A~14Eに示されるように、スタッファー配列は、例えば、ポリAテールの3側に位置し、'3 ITR配列の5'側に位置する。いくつかの態様において、スタッファーDNA配列は、逆方向の合成ポリアデニル化シグナルを含む。
【0256】
いくつかの態様において、スタッファー核酸配列(「スペーサー」核酸断片とも呼ばれる、
図8~14を参照すること)は、ポリA配列と3'ITRとの間に位置してよい(即ち、スタッファー核酸配列は、ポリA配列の3'側、かつ3'ITRの5'側に位置する)(例えば、
図8~10を参照すること)。そのようなスタッファー核酸配列は、約30bp、50pb、75bp、100bp、150bp、200bp、250bp、300bp、または300bp超であり得る。本明細書中に開示される方法および組成物のいくつかの態様において、スタッファー核酸断片は、20~50bp、50~100bp、100~200bp、200~300bp、300~500bp、または20~500bpの任意の整数である。例示的なスタッファー(またはスペーサー)核酸配列には、SEQ ID NO:16、SEQ ID NO:71、もしくはSEQ ID NO:78、またはSEQ ID NO:16もしくはSEQ ID NO:71もしくはSEQ ID NO:78と少なくとも約70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99%程度同一の核酸配列が含まれる。
【0257】
I. AAV ITR
望ましい特徴を有し、かつITRが組み入れられたベクターの活性およびそれに対する細胞応答をモジュレートするために設計され得る、AAV ITRを、本明細書中に開示されるrAAVゲノムは含む。別の態様において、AAV ITRは、参照によって本明細書中に組み入れられる米国特許第9,447,433号に示されるような、望ましい特徴を有し、1つまたは2つの合成ITRを含むベクターの活性およびそれに対する細胞応答を操作するために設計され得る合成AAV ITRである。
【0258】
本明細書中に開示されるrAAVゲノムにおいて使用するためのAAV ITRは、特定の適用のために適切な任意の血清型のものであり得る。いくつかの態様において、AAVベクターゲノムには、AAV ITRが隣接している。いくつかの態様において、rAAVベクターゲノムには、AAV ITRが隣接しており、ここで、ITRには、全長ITR配列、除去されたCPGアイランドを含む配列を含むITR、付加されたCPG配列を含む配列を含むITR、短縮型ITR配列、ITR内の1つもしくは複数の欠失を含むITR配列、ITR内の1つもしくは複数の付加を含むITR配列、またはハイブリッドITRを形成するために共に連結された前記のITRの任意の一部分を含む組み合わせが含まれる。
【0259】
長期発現を容易にするため、一態様において、GAAをコードするポリヌクレオチドは、AAV末端逆位配列(ITR)(例えば、第1の5'AAV ITRおよび第2の3'AAV ITR)の間に置かれてよい。AAV ITRは、WT rAAVベクターゲノムの両端に見出され、DNA複製の開始点およびプライマーとして役立つ。ITRは、AAV DNA複製のためにも、原核生物プラスミドからの救済または切り出しのためにも、シスに必要とされる。一態様において、rAAVゲノムの核酸内に含有されるAAV ITR配列は、任意のAAV血清型(例えば、1、2、3、3b、4、5、6、7、8、9、および10)に由来してよいか、または複数の血清型に由来してもよく、例えば、ITRを構築するための2つまたはそれ以上のAAV血清型の一部分の組み合わせを含んでいてもよい。一態様において、rAAVベクターゲノムを含むrAAVベクターにおいて使用するため、第1および第2のITRは、パッケージングおよび複製のために必要なWTまたは改変型ITRの最小部分を少なくとも含むべきである。いくつかの態様において、rAAVベクターゲノムには、AAV ITRが隣接している。
【0260】
いくつかの態様において、rAAVベクターゲノムは、少なくとも1つのAAV ITRを含み、ここで、ITRは、(a)AAV rep結合要素;(b)AAV末端分離(terminal resolution)配列;および(c)AAV RBE(Rep結合要素)を含み、から本質的になり、またはからなり;ITRは、他のAAV ITR配列を含まない。別の態様において、要素(a)、(b)、および(c)は、AAV2 ITRに由来し、ITRは、他のAAV2 ITR配列を含まない。さらなる態様において、要素(a)、(b)、および(c)は、AAV2、AAV8、およびAAV9を含むが、これらに限定されるわけではない、任意のAAV ITRに由来する。いくつかの態様において、ポリヌクレオチドは、同一であってもよいかまたは異なっていてもよい、2つの合成ITRを含む。
【0261】
いくつかの態様において、rAAVベクターゲノムを含むrAAVベクター内のポリヌクレオチドは、同一であってもよいかまたは異なっていてもよい、2つのITRを含む。ITR内の3つの要素が、ITR機能のために十分であると決定されている。この最小の機能性ITRは、AAVベクターの作製および形質導入の全ての局面において使用され得る。付加的な欠失は、さらに小さい最小の機能性ITRを定義し得る。より短い長さは、有利に、より大きいトランスジェニックカセットのパッケージングングおよび形質導入を可能にする。
【0262】
別の態様において、合成ITRに存在する要素の各々は、天然に存在するAAV ITR(WT配列)に存在する正確な配列であってもよいか、または、AAV ITRの要素の機能性が、天然に存在するAAV ITRに存在するのと同一のこれらの要素の機能性と実質的に異ならないために十分なレベルで機能し続ける限り、わずかに異なっていてもよい(例えば、1、2、3、4、5個、もしくはそれ以上のヌクレオチドの付加、欠失、および/もしくは置換によって異なっていてもよい)。
【0263】
さらなる態様において、rAAVベクターゲノムを含むrAAVベクターは、ITR間に、1つまたは複数の付加的な非AAVシス要素、例えば、転写を開始する要素、エンハンサー機能を媒介する要素、有糸分裂時の複製および対称分布を可能にする要素、または形質導入されたゲノムの持続性およびプロセシングを変更する要素を含み得る。そのような要素は、当技術分野において周知であり、非限定的に、プロモーター、エンハンサー、クロマチン接着配列、テロメア配列、シス作用性マイクロRNA(miRNA)、およびそれらの組み合わせを含む。
【0264】
別の態様において、ITRは、天然に存在するITR、例えば、AAV2由来のITR2と比べて、修飾された転写活性を示す。ITR2配列は、本質的に、プロモーター活性を有することが公知である。それは、本質的に、ポリ(A)配列に類似している終結活性も有する。本発明の最小の機能性ITRは、ITR2と比べて低減したレベルであるが、実施例に示されるように、転写活性を示す。従って、いくつかの態様において、ITRは、転写について機能性である。他の態様において、ITRは、転写について欠陥を有する。ある種の態様において、ITRは、転写インスレーターとして作用し、例えば、ベクターが宿主染色体へ組み込まれた時、ベクターに存在するトランスジェニックカセットの転写を防止することができる。
【0265】
本発明の一つの局面は、ITR内の1つまたは複数の転写因子結合部位のヌクレオチド配列が、ITR2のような天然に存在するAAV ITRの配列と比べて、欠失し、かつ/または置換されている少なくとも1つの合成AAV ITRを含むrAAVベクターゲノムに関する。いくつかの態様において、それは、1つまたは複数の転写因子結合部位が欠失し、かつ/または置換されている最小の機能性ITRである。いくつかの態様において、少なくとも1つの転写因子結合部位、例えば、少なくとも5個もしくはそれ以上または10個もしくはそれ以上の転写因子結合部位、例えば、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、または21個の転写因子結合部位が、欠失し、かつ/または置換されている。
【0266】
別の態様において、本明細書中に記載されるrAAVベクターゲノムを含むrAAVベクターは、少なくとも1つの合成AAV ITRを含むポリヌクレオチドを含み、ここで、ITR内の転写開始部位またはその近くに典型的に存在する1つまたは複数のCpGアイランド(シトシン塩基の直後にグアニン塩基が続いたもの(CpG)、そのような配置において、シトシンはメチル化される傾向を有する)が、欠失し、かつ/または置換されている。一態様において、CpGアイランドの欠失または数の低下は、rAAVベクターの免疫原性を低下させることができる。これは、CpGアイランドにおいて起こる、TLR-9のrAAVベクターDNA配列との結合の低下または完全な阻害に起因する。CpGモチーフのメチル化が転写サイレンシングをもたらすことも周知である。ITR内のCpGモチーフの除去は、TLR-9認識の減少および/またはメチル化の減少をもたらし、従って、トランスジーンサイレンシングの減少をもたらすと予想される。いくつかの態様において、それは、1つまたは複数のCpGアイランドが欠失し、かつ/または置換されている最小の機能性ITRである。一態様において、AAV ITR2は、16個のCpGアイランドを含有することが公知であり、そのうちの1つもしくは複数、または16個全てを欠失させることができる。
【0267】
いくつかの態様において、少なくとも1つのCpGモチーフ、例えば、少なくとも4個もしくはそれ以上または8個もしくはそれ以上のCpGモチーフ、例えば、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、または16個のCpGモチーフが、欠失し、かつ/または置換されている。「欠失し、かつ/または置換されている」という語句は、本明細書において使用されるように、CpGモチーフ内の一方または両方のヌクレオチドが、欠失していること、異なるヌクレオチドに置換されていること、または欠失および置換の任意の組み合わせを意味する。
【0268】
別の態様において、合成ITRは、以下にリストされるヌクレオチド配列のうちの1つを含む、それから本質的になる、またはそれからなる。他の態様において、合成ITRは、以下にリストされるヌクレオチド配列のうちの1つと少なくとも80%同一、例えば、少なくとも85%、90%、95%、96%、97%、98%、または99%同一のヌクレオチド配列を含む、それから本質的になる、またはそれからなる。
【0269】
ある種の態様において、本明細書中に記載されるrAAVベクターゲノムは、宿主細胞を形質導入することができるAAVウイルス粒子を産生することができる合成ITRを含む。そのようなITRは、例えば、異種核酸のウイルス送達のため、使用され得る。そのようなITRの例には、前記のリストされたMH-257、MH-258、およびMHデルタ258が含まれる。
【0270】
別の態様において、合成ITRを含有する本明細書中に記載されるrAAVベクターゲノムは、AAVウイルス粒子を産生することができない。そのようなITRは、例えば、異種核酸の非ウイルス移入のため、使用され得る。そのようなITRの例には、前記のリストされたMHテロメア-1、MHテロメア-2、およびMH Pol II 258が含まれる。
【0271】
さらなる態様において、本発明の合成ITRを含む本明細書中に記載されるrAAVベクターゲノムは、第1のITRと同一であってもよいかまたは異なっていてもよい第2のITRをさらに含む。一つの態様において、rAAVベクターゲノムは、異種核酸、例えば、タンパク質または機能性RNAをコードする配列をさらに含む。付加的な態様において、第2のITRは、Repタンパク質によって分離され得ず、即ち、二本鎖ウイルスDNAをもたらす。
【0272】
一態様において、rAAVベクターゲノムは、本発明の合成ITRを含むポリヌクレオチドを含む。さらなる態様において、ウイルスベクターは、パルボウイルスベクター、例えば、AAVベクターであり得る。別の態様において、組換えパルボウイルス粒子(例えば、組換えAAV粒子)は、合成ITRを含む。
【0273】
本発明の別の態様は、少なくとも1つの合成AAV ITRを含むrAAVベクターゲノムを生成する工程を含む、AAVカプシドのトランスジェニックDNAパッケージングング能力を増大させる方法に関し、ここで、ITRは、(a)AAV rep結合要素;(b)AAV末端分解配列;および(c)AAV RBE要素を含み;ITRは、他のAAV ITR配列を含まない。
【0274】
本発明のさらなる態様は、少なくとも1つの合成ITRを含むrAAVベクターゲノムを生成する工程を含む、rAAVベクターゲノムによる感染に対する細胞応答を変更する方法に関し、ここで、ITR内の1つまたは複数の転写因子結合部位のヌクレオチド配列は、欠失し、かつ/または置換されており、さらに、rAAVベクターゲノムは、感染に対する細胞応答を変更する少なくとも1つの合成ITRを含む。
【0275】
本発明の付加的な態様は、少なくとも1つの合成ITRを含むrAAVベクターゲノムを生成する工程を含む、rAAVベクターゲノムによる感染に対する細胞応答を変更する方法に関し、ここで、ITR内の1つまたは複数のCpGモチーフは、欠失し、かつ/または置換されており、少なくとも1つの合成ITRを含むベクターは、感染に対する変更された細胞応答を生じる。
【0276】
III. ベクターおよびビリオン
一つの態様において、本明細書中に開示される(rAAVビリオンとも呼ばれる)rAAVベクターは、カプシドタンパク質、およびカプシドタンパク質内のrAAVゲノムを含む。ポンペ病を処置するために使用されるrAAVビリオンのrAAVカプシドは、表1にリストされたもののいずれか、またはそれらの任意の組み合わせである。
【0277】
(表1)AAV血清型および例示的な公開された対応するカプシド配列
【0278】
表2は、本明細書中に記載されたrAAVベクターにおいてAAVカプシドとして、または野生型カプシドタンパク質および/もしくは現在公知であるかもしくは後に同定される他のキメラもしくはバリアントのカプシドタンパク質との任意の組み合わせによって、使用され得る、例示的なキメラまたはバリアントのカプシドタンパク質を記載し、各々が、本明細書中に組み入れられる。いくつかの態様において、使用するために包含されるrAAVベクターは、例えば、参照によってその全体が本明細書中に組み入れられる9,012,224およびUS 7,892,809に開示されるような、キメラベクターである。
【0279】
いくつかの態様において、rAAVベクターは、PCT/US18/22725に開示されるようなハプロイドrAAVベクター、または、例えば、各々参照によってその全体が本明細書中に組み入れられる2018年7月31日に出願されたPCT/US2018/044632および米国特許出願第16/151,110号に開示されるようなポリプロイドrAAVベクターである。いくつかの態様において、rAAVベクターは、参照によってその全体が本明細書中に組み入れられる9,012,224およびWO 2017/106236に開示されるようなrAAV3ベクターである。
【0280】
(表2)例示的なキメラカプシドおよびrAAVバリアントカプシド
【0281】
一つの態様において、本明細書中に開示されるrAAVベクターは、野生型カプシドタンパク質および/または現在公知であるかもしくは後に同定される他のキメラもしくはバリアントのカプシドタンパク質との任意の組み合わせによって、本発明のAAVカプシドに組み入れられ得るキメラまたはバリアントのカプシドタンパク質を記載している、USPTOによって発行された特許および公開された出願の包袋にリストされた以下の生物学的配列ファイルのいずれかに関連したカプシドタンパク質を含む(例として、11486254は米国特許出願第11/486,254号に対応し、その他の生物学的配列ファイルも同様に読み取られるべきである):11486254.raw、11932017.raw、12172121.raw、12302206.raw、12308959.raw、12679144.raw、13036343.raw、13121532.raw、13172915.raw、13583920.raw、13668120.raw、13673351.raw、13679684.raw、14006954.raw、14149953.raw、14192101.raw、14194538.raw、14225821.raw、14468108.raw、14516544.raw、14603469.raw、14680836.raw、14695644.raw、14878703.raw、14956934.raw、15191357.raw、15284164.raw、15368570.raw、15371188.raw、15493744.raw、15503120.raw、15660906.raw、および15675677.raw。
【0282】
一態様において、本発明のAAVカプシドタンパク質およびウイルスカプシドは、例えば、参照によって組み入れられる国際特許公報WO 00/28004に記載されたように、他のウイルスに由来し、任意で他のパルボウイルスまたはAAVに由来するカプシドサブユニットの全部または一部を含み得るという点で、キメラであり得る。
【0283】
いくつかの態様において、rAAVベクターゲノムは、本明細書中に組み入れられる米国特許第8,784,799号に記載されるように、一本鎖または単量体二重鎖である。
【0284】
さらなる態様として、本発明のAAVカプシドタンパク質およびウイルスカプシドは、参照によって組み入れられるPCT/US18/22725に記載されるように、単一AAVカプシド内にVP1、VP2、およびVP3 AAV血清型の異なる組み合わせを含み得るという点で、(ハプロイドとも呼ばれる)ポリプロイドであり得る。
【0285】
一態様において、本明細書中に開示されるポンペ病の処置において有用なrAAVベクターは、AAV3bカプシドである。使用するために包含されるAAV3bカプシドは、参照によってその全体が本明細書中に組み入れられる2017/106236および9,012,224および7,892,809に記載されている。
【0286】
いくつかの態様において、AAV3bカプシドは、SEQ ID NO:44を含む。一態様において、ポンペ病の処置において使用されるAAVカプシドは、その全部または一部がSEQ ID NO:44に示されるAAVカプシドに由来する修飾型AAVカプシドであり得る。いくつかの態様において、SEQ ID NO:44に示されるAAV3bカプシドに由来するアミノ酸は、異なるAAV血清型の別のカプシドに由来するアミノ酸と置換され得、または置換されており、ここで、置換されたアミノ酸および/または挿入されたアミノ酸は、任意のAAV血清型に由来してよく、天然に存在するか、または部分的にもしくは完全に合成のアミノ酸を含み得る。
【0287】
別の態様において、ポンペ病の処置において使用されるAAVカプシドは、AAV3b265Dカプシドである。この具体的な態様において、AAV3b265Dカプシドは、AAV3bカプシドのアミノ酸G265のD265への交換を介した、AAV3bカプシドの2フォールド軸ループのアミノ酸配列の修飾を含む。いくつかの態様において、AAV3b265Dカプシドは、SEQ ID NO:46を含む。しかしながら、本発明の修飾型ウイルスカプシドは、SEQ ID NO:46に示されるAAVカプシドに限定されるわけではない。いくつかの態様において、SEQ ID NO.46に示されるAAV3b265Dに由来するアミノ酸は、異なる血清型のAAVに由来するカプシドに由来するアミノ酸に置換され得、または置換されており、ここで、置換されたアミノ酸および/または挿入されたアミノ酸は、任意のAAV血清型に由来してよく、天然に存在するか、または部分的にもしくは完全に合成のアミノ酸を含み得る。
【0288】
別の態様において、本明細書中に開示されるポンペ病の処置において有用なrAAVベクターは、AAV3b265D549Aカプシドである。この具体的な態様において、AAV3b265D549Aカプシドは、AAV3bカプシドのアミノ酸G265のD265への交換、およびAAV3bカプシドのアミノ酸T549のA549への交換を介した、AAV3bカプシドの2フォールド軸ループのアミノ酸配列の修飾を含む。いくつかの態様において、AAV3b265D549Aカプシドは、SEQ ID NO:50を含む。しかしながら、本発明の修飾型ウイルスカプシドは、SEQ ID NO:50に示されるAAVカプシドに限定されるわけではない。いくつかの態様において、SEQ ID NO:50に示されるAAV3b265D549Aに由来するアミノ酸は、異なる血清型のAAVに由来するカプシドに由来するアミノ酸に置換され得、または置換されており、ここで、置換されたアミノ酸および/または挿入されたアミノ酸は、任意のAAV血清型に由来してよく、天然に存在するか、または部分的にもしくは完全に合成のアミノ酸を含み得る。いくつかの態様において、AAV3bSASTG(即ち、Q263A/T265変異を含むAAV3bカプシド)に由来するアミノ酸は、異なる血清型のAAVに由来するカプシドに由来するアミノ酸に置換され得、または置換されており、ここで、置換されたアミノ酸および/または挿入されたアミノ酸は、任意のAAV血清型に由来してよく、天然に存在するか、または部分的にもしくは完全に合成のアミノ酸を含み得る。
【0289】
別の態様において、本明細書中に開示されるポンペ病の処置において有用なrAAVベクターは、AAV3b549Aカプシドである。この具体的な態様において、AAV3b549Aカプシドは、AAV3bカプシドのアミノ酸T549のA549への交換を介した、AAV3bカプシドの2フォールド軸ループのアミノ酸配列の修飾を含む。いくつかの態様において、AAV3b549Aカプシドは、SEQ ID NO:52を含む。しかしながら、本発明の修飾型ウイルスカプシドは、SEQ ID NO:52に示されるAAVカプシドに限定されるわけではない。いくつかの態様において、SEQ ID NO:52に示されるAAV3b549Aに由来するアミノ酸は、異なる血清型のAAVに由来するカプシドに由来するアミノ酸に置換され得、または置換されており、ここで、置換されたアミノ酸および/または挿入されたアミノ酸は、任意のAAV血清型に由来してよく、天然に存在するか、または部分的にもしくは完全に合成のアミノ酸を含み得る。
【0290】
別の態様において、本明細書中に開示されるポンペ病の処置において有用なrAAVベクターは、AAV3bQ263Yカプシドである。この具体的な態様において、AAV3bQ263Yカプシドは、AAV3bカプシドのアミノ酸Q263のY263への交換を介した、AAV3bカプシドの2フォールド軸ループのアミノ酸配列の修飾を含む。いくつかの態様において、AAV3b549Aカプシドは、SEQ ID NO:54を含む。しかしながら、本発明の修飾型ウイルスカプシドは、SEQ ID NO:54に示されるAAVカプシドに限定されるわけではない。いくつかの態様において、SEQ ID NO:54に示されるAAV3bQ263Yに由来するアミノ酸は、異なる血清型のAAVに由来するカプシドに由来するアミノ酸に置換され得、または置換されており、ここで、置換されたアミノ酸および/または挿入されたアミノ酸は、任意のAAV血清型に由来してよく、天然に存在するか、または部分的にもしくは完全に合成のアミノ酸を含み得る。
【0291】
別の態様において、本明細書中に開示されるポンペ病の処置において有用なrAAVベクターは、AAV3bSASTG血清型であるか、またはAAV3bSASTGカプシドを含む。この具体的な態様において、AAV3bSASTGカプシドは、SASTG変異を含めるためのアミノ酸配列の修飾を含み、具体的には、AAV3bカプシドは、AAV2 Q263A/T265サブバリアントに類似するよう、(両方とも参照によってその全体が本明細書中に組み入れられる、Messina EL,et al.,Adeno-associated viral vectors based on serotype 3b use components of the fibroblast growth factor receptor signaling complex for efficient transduction.Hum.Gene Ther.2012 Oct:23(10):1031-4、Piacentino III,Valentino,et al."X-linked inhibitor of apoptosis protein-mediated attenuation of apoptosis,using a novel cardiac-enhanced adeno-associated viral vector." Human gene therapy 23.6(2012):635-646に開示されたように)AAV3bカプシド内の類似した位置にこれらの修飾を導入することによって、修飾された。従って、いくつかの態様において、本明細書中に開示されるポンペ病の処置において有用なrAAVベクターは、AAV3bSASTG血清型であるか、またはAAV3b Q263A/T265カプシドを含むAAV3bSASTGカプシドを含む。いくつかの態様において、AAV3bSASTGに由来するアミノ酸は、異なる血清型のAAVに由来するカプシドに由来するアミノ酸に置換され得、または置換されており、ここで、置換されたアミノ酸および/または挿入されたアミノ酸は、任意のAAV血清型に由来してよく、天然に存在するか、または部分的にもしくは完全に合成のアミノ酸を含み得る。
【0292】
細胞への導入を容易にするため、本発明において有用なrAAVベクターゲノムは、(1)発現させるべき異種配列(一つの態様において、GAAポリペプチドをコードするポリヌクレオチド)、および(2)異種遺伝子の組み込みおよび発現を容易にするウイルス配列要素を含む組換え核酸構築物である。ウイルス配列要素には、DNAの複製およびAAVカプシドへのパッケージングングのため、シスに必要とされるAAVベクターゲノムの配列(例えば、機能性ITR)が含まれ得る。一態様において、異種遺伝子は、ポンペ病に罹患した患者におけるGAA欠損症の矯正のために有用であるGAAをコードする。一態様において、そのようなrAAVベクターゲノムは、マーカーまたはレポーター遺伝子も含有し得る。一態様において、rAAVベクターゲノムは、その全部または一部が交換されているか、または欠失しているAAV3b野生型(WT)シス遺伝子のうちの1つまたは複数を有するが、機能性の隣接ITR配列を保持していてもよい。
【0293】
一つの態様において、ポンペ病の処置において有用な本明細書中に開示されるrAAVベクターは、AAV3bカプシドによって被包された本明細書中に開示されるrAAVゲノムを含む。いくつかの態様において、ポンペ病の処置において有用な本明細書中に開示されるrAAVベクターは、AAV3bカプシド(SEQ ID NO:44);AAV3b265Dカプシド(SEQ ID NO:46)、AAV3b ST(S663V+T492V)カプシド(SEQ ID NO:48)、AAV3b265D549Aカプシド(SEQ ID NO:50);AAV3b549Aカプシド(SEQ ID NO:52);AAV3bQ263Yカプシド(SEQ ID NO:54)、またはAAV3bSASTG(即ち、Q263A/T265)カプシドより選択される任意のAAV3bカプシドによって被包された本明細書中に開示されるrAAVゲノムを含む。
【0294】
本明細書中に開示される方法および組成物のいくつかの態様において、本明細書中に開示されるrAAVベクターは、SEQ ID NO:57(AAT-V43M-wtGAA(デルタ1-69aa));SEQ ID NO:58(ラットFN1-IGF2V43M-wtGAA(デルタ1-69aa));SEQ ID NO:59(hFN1-IGF2V43M-wtGAA(デルタ1-69aa));SEQ ID NO:60(ATT-IGF2Δ2-7-wtGAA(デルタ1-69));SEQ ID NO:61(FN1ラット-IGFΔ2-7-wtGAA(デルタ1-69));SEQ ID NO:62(hFN1-IGFΔ2-7-wtGAA(デルタ1-69))、またはそれらとの少なくとも80%、85%、90%、95%、もしくは98%の同一性を有する核酸配列のうちのいずれかの核酸配列を含む。本明細書中に開示される方法および組成物のいくつかの態様において、rAAVベクターは、AAT_hIGF2-V43M_wtGAA_del1-69_スタッファー.V02(SEQ ID NO:79);FIBラット_hIGF2-V43M_wtGAA_del1-69_スタッファー.V02(SEQ ID NO:80);FIBhum_hIGF2-V43M_wtGAA_del1-69_スタッファー.V02(SEQ ID NO:81);AAT_GILT_wtGAA_del1-69_スタッファー.V02(SEQ ID NO:82);FIBラット_GILT_wtGAA_del1-69_スタッファー.V02(SEQ ID NO:83);FIBhum_GILT_wtGAA_del1-69_スタッファー.V02(SEQ ID NO:84)、またはそれらとの少なくとも80%、85%、90%、95%、もしくは98%の同一性を有する核酸配列のうちのいずれかの核酸配列を含む。
【0295】
IV. 最適化されたrAAVベクターゲノム
本明細書中に開示される方法および組成物のいくつかの態様において、最適化されたrAAVベクターゲノムは、本明細書中に開示される要素のいずれかより作出され、任意の組み合わせで、プロモーターをコードする核酸配列、ITR、ポリAテール、異種遺伝子の発現を増大させるかまたは減少させることができる要素を含み、一つの態様において、インビボでのGAAタンパク質の発現のためにコドン最適化された核酸配列(即ち、coGAA)を含み、任意で、免疫原性を低下させるための1つまたは複数の要素を含む。そのような最適化されたrAAVベクターゲノムは、rAAVベクターゲノムが形質導入され発現されるべき組織および細胞への向性を有する任意のAAVカプシドと共に使用され得る。
【0296】
AAV3bカプシド修飾
本明細書中に開示される方法および組成物のいくつかの態様において、本明細書中に開示されるrAAVベクターにおいて使用するためのAAV3bカプシドは、AAV3bカプシド(SEQ ID NO:44);AAV3b265Dカプシド(SEQ ID NO:46)、AAV3b ST(S663V+T492V)カプシド(SEQ ID NO:48)、AAV3b265D549Aカプシド(SEQ ID NO:50);AAV3b549Aカプシド(SEQ ID NO:52);AAV3bQ263Yカプシド(SEQ ID NO:54)、またはNienaber et al.,Hum.Gen Ther,2012,23(10);1031-42およびPiacentino III,Valentino,et al."X-linked inhibitor of apoptosis protein-mediated attenuation of apoptosis,using a novel cardiac-enhanced adeno-associated viral vector." Human gene therapy 23.6(2012):635-646(両方とも参照によってその全体が本明細書中に組み入れられる)に開示されたAAV3bSASTGカプシド(即ち、Q263A/T265変異を含むAAV3bカプシド)のいずれかとの、例えば、約75%~約100%、約80%~約100%、約85%~約100%、約90%~約100%、約95%~約100%、約75%~約99%、約80%~約99%、約85%~約99%、約90%~約99%、約95%~約99%、約75%~約97%、約80%~約97%、約85%~約97%、約90%~約97%、または約95%~約97%の範囲のアミノ酸同一性を有する。この態様のさらに他の局面において、AAV3bに由来するAAVは、AAV3bカプシド(SEQ ID NO:44);AAV3b265Dカプシド(SEQ ID NO:46)、AAV3b ST(S663V+T492V)カプシド(SEQ ID NO:48)、AAV3b265D549Aカプシド(SEQ ID NO:50);AAV3b549Aカプシド(SEQ ID NO:52);AAV3bQ263Yカプシド(SEQ ID NO:54)、またはNienaber et al.,Hum.Gen Ther,2012,23(10);1031-42およびPiacentino III,Valentino,et al."X-linked inhibitor of apoptosis protein-mediated attenuation of apoptosis,using a novel cardiac-enhanced adeno-associated viral vector." Human gene therapy 23.6(2012):635-646に開示されたAAV3bSASTGカプシド(即ち、Q263A/T265変異を含むAAV3bカプシド)のいずれかとの、例えば、約75%~約100%、約80%~約100%、約85%~約100%、約90%~約100%、約95%~約100%、約75%~約99%、約80%~約99%、約85%~約99%、約90%~約99%、約95%~約99%、約75%~約97%、約80%~約97%、約85%~約97%、約90%~約97%、または約95%~約97%の範囲のアミノ酸同一性を有するが、カプシドは依然として機能的活性を有するAAVタンパク質である。
【0297】
本明細書中に開示される方法および組成物のいくつかの態様において、AAV血清型(例えば、AAV3b)は、参照によってその全体が本明細書中に組み入れられるMessina EL,et al.,Adeno-associated viral vectors based on serotype 3b use components of the fibroblast growth factor receptor signaling complex for efficient transduction.Hum.Gene Ther.2012 Oct:23(10):1031-42に記載されるようなSASTG変異を含む。
【0298】
本明細書中に開示される方法および組成物のいくつかの態様において、本明細書中に開示されるrAAVベクターにおいて使用するためのAAV3bカプシドは、例えば、AAV3bカプシド(SEQ ID NO:44);AAV3b265Dカプシド(SEQ ID NO:46)、AAV3b ST(S663V+T492V)カプシド(SEQ ID NO:48)、AAV3b265D549Aカプシド(SEQ ID NO:50);AAV3b549Aカプシド(SEQ ID NO:52);AAV3bQ263Yカプシド(SEQ ID NO:54)、もしくは(Nienaber et al.,Hum.Gen Ther,2012,23(10);1031-42に開示されたような)AAV3bSASTGカプシド(即ち、Q263A/T265変異を含むAAV3bカプシド)のアミノ酸配列のいずれかと比べた、少なくとも1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、もしくは50個の連続するアミノ酸の欠失、付加、および/もしくは置換;またはAAV3bカプシド(SEQ ID NO:44);AAV3b265Dカプシド(SEQ ID NO:46)、AAV3b ST(S663V+T492V)カプシド(SEQ ID NO:48)、AAV3b265D549Aカプシド(SEQ ID NO:50);AAV3b549Aカプシド(SEQ ID NO:52);AAV3bQ263Yカプシド(SEQ ID NO:54)、(Nienaber et al.,Hum.Gen Ther,2012,23(10);1031-42に開示されたような)AAV3bSASTGカプシド(即ち、Q263A/T265変異を含むAAV3bカプシド)のアミノ酸配列のいずれかと比べた、高々1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、もしくは50個の連続するアミノ酸の欠失、付加、および/もしくは置換を有する。さらに別の態様において、本明細書中に開示されるrAAVベクターにおいて使用するためのAAV3bカプシドは、例えば、AAV3bカプシド(SEQ ID NO:44);AAV3b265Dカプシド(SEQ ID NO:46)、AAV3b ST(S663V+T492V)カプシド(SEQ ID NO:48)、AAV3b265D549Aカプシド(SEQ ID NO:50);AAV3b549Aカプシド(SEQ ID NO:52);AAV3bQ263Yカプシド(SEQ ID NO:54)、もしくは(Nienaber et al.,Hum.Gen Ther,2012,23(10);1031-42に開示されたような)AAV3bSASTGカプシド(即ち、Q263A/T265変異を含むAAV3bカプシド)のアミノ酸配列のいずれかと比べた、少なくとも1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、もしくは50個の連続するアミノ酸の欠失、付加、および/もしくは置換;またはAAV3bカプシド(SEQ ID NO:44);AAV3b265Dカプシド(SEQ ID NO:46)、AAV3b ST(S663V+T492V)カプシド(SEQ ID NO:48)、AAV3b265D549Aカプシド(SEQ ID NO:50);AAV3b549Aカプシド(SEQ ID NO:52);AAV3bQ263Yカプシド(SEQ ID NO:54)、(Nienaber et al.,Hum.Gen Ther,2012,23(10);1031-42に開示されたような)AAV3bSASTGカプシド(即ち、Q263A/T265変異を含むAAV3bカプシド)のアミノ酸配列のいずれかと比べた、高々1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、もしくは50個の連続するアミノ酸の欠失、付加、および/もしくは置換を有するが、依然として、機能的活性を有するAAVである。
【0299】
本明細書中に開示される方法および組成物のいくつかの態様において、本明細書中に開示されるrAAVベクターにおいて使用するためのAAV3bカプシドは、例えば、AAV3bカプシド(SEQ ID NO:44);AAV3b265Dカプシド(SEQ ID NO:46)、AAV3b ST(S663V+T492V)カプシド(SEQ ID NO:48)、AAV3b265D549Aカプシド(SEQ ID NO:50);AAV3b549Aカプシド(SEQ ID NO:52);AAV3bQ263Yカプシド(SEQ ID NO:54)、(Nienaber et al.,Hum.Gen Ther,2012,23(10);1031-42に開示されたような)AAV3bSASTGカプシド(即ち、Q263A/T265変異を含むAAV3bカプシド)のアミノ酸配列のいずれかとの約75%~約100%、約80%~約100%、約85%~約100%、約90%~約100%、約95%~約100%、約75%~約99%、約80%~約99%、約85%~約99%、約90%~約99%、約95%~約99%、約75%~約97%、約80%~約97%、約85%~約97%、約90%~約97%、または約95%~約97%の範囲のアミノ酸同一性を有する。さらなる態様において、本明細書中に開示されるrAAVベクターにおいて使用するためのAAV3bカプシドは、例えば、AAV3bカプシド(SEQ ID NO:44);AAV3b265Dカプシド(SEQ ID NO:46)、AAV3b ST(S663V+T492V)カプシド(SEQ ID NO:48)、AAV3b265D549Aカプシド(SEQ ID NO:50);AAV3b549Aカプシド(SEQ ID NO:52);AAV3bQ263Yカプシド(SEQ ID NO:54)、(Nienaber et al.,Hum.Gen Ther,2012,23(10);1031-42に開示されたような)AAV3bSASTGカプシド(即ち、Q263A/T265変異を含むAAV3bカプシド)のアミノ酸配列のいずれかとの約75%~約100%、約80%~約100%、約85%~約100%、約90%~約100%、約95%~約100%、約75%~約99%、約80%~約99%、約85%~約99%、約90%~約99%、約95%~約99%、約75%~約97%、約80%~約97%、約85%~約97%、約90%~約97%、または約95%~約97%の範囲のアミノ酸同一性を有するが、依然として、機能的活性を有するAAVである。
【0300】
V. 処置の方法
A. ポンペ病
ポンペ病は、エネルギーのために使用される糖の貯蔵形態、グリコーゲンを分解するために必要される酵素、酸性αグルコシダーゼ(GAA)の欠損によって引き起こされる稀な遺伝性障害である。ポンペ病は、糖原貯蔵症II型、GSD II、II型糖原貯蔵症、糖原病II型、酸性マルターゼ欠損症、α-1,4-グルコシダーゼ欠損症、びまん性糖原性心臓肥大、および全身性糖原病の心臓型としても公知である。グリコーゲンの集積は、全身の進行性の筋力低下(ミオパチー)を引き起こし、様々な身体組織、特に、心臓、骨格筋、肝臓、呼吸、および神経系に影響を与える。
【0301】
ポンペ病の主要な臨床的徴候は、疾患発症の年齢および残存するGAA活性に依って広く変動し得る。残存するGAA活性は、グリコーゲン蓄積の量および組織分布と相関し、疾患の重症度とも相関する。乳児発症ポンペ病(正常なGAA活性の1%未満)は、最も重度の型であり、筋緊張低下、全身筋力低下、および肥大型心筋症、ならびに心臓およびその他の筋肉組織における大量のグリコーゲン蓄積を特徴とする。一般的には、心肺機能不全によって、生後1年以内に死亡が起こる。Hirschhorn et al.(2001)"Glycogen Storage Disease Type II:Acid Alpha-glucosidase(Acid Maltase)Deficiency,"in Scriver et al.,eds.,The Metabolic and Molecular Basis of Inherited Disease,8th Ed.,New York:McGraw-Hill,3389-3420。若年発症(正常なGAA活性の1~10%)および成人発症(正常なGAA活性の10~40%)のポンペ病は、臨床的により不均一であり、発症の年齢、臨床的症候、および疾患進行の変動がより大きい。若年発症および成人発症のポンペ病は、一般に、重度の心臓関与の欠如、より遅い発症の年齢、およびより遅い疾患進行を特徴とするが、結果としての呼吸器または四肢の筋肉の関与は、有意な罹患率および死亡率をもたらす。平均余命は変動し得るが、一般には、呼吸不全によって死亡が起こる。Hirschhorn et al.(2001)"Glycogen Storage Disease Type II:Acid Alpha-glucosidase(Acid Maltase)Deficiency," in Scriver et al.,eds.,The Metabolic and Molecular Basis of Inherited Disease,8th Ed.,New York:McGraw-Hill,3389-3420。
【0302】
本明細書中に開示される方法および組成物の任意の態様において、ポンペ病を処置するための適切なGAA酵素には、野生型ヒトGAA、または直鎖状のオリゴ糖のα1-4結合を切断する能力を保持するその断片もしくは配列バリアントが含まれる。本明細書中に開示される方法および組成物のいくつかの態様において、GAAタンパク質は、野生型GAA核酸配列、例えば、SEQ ID NO:11またはSEQ ID NO:72によってコードされる。本明細書中に開示される方法および組成物のいくつかの態様において、GAAタンパク質は、例えば、(1)インビボでの発現の増強、(2)CpGアイランドの減少、または(3)自然免疫応答の低下のうちの1つまたは複数のためにコドン最適化されたGAA核酸配列によってコードされる。本明細書中に開示される方法および組成物のいくつかの態様において、GAAタンパク質は、コドン最適化GAA核酸配列、例えば、SEQ ID NO:73、SEQ ID NO:74、SEQ ID NO:75、およびSEQ ID NO:76、またはSEQ ID NO:73、SEQ ID NO:74、SEQ ID NO:75、およびSEQ ID NO:76との少なくとも60%もしくは70%もしくは80%、85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有する核酸配列のいずれかより選択される任意の核酸配列によってコードされる。
【0303】
本明細書中に開示される方法および組成物のいくつかの態様において、本明細書中に記載されるrAAVベクターは、対象の肝臓を形質導入し、hGAAポリペプチドを、患者の組織を灌流する血液中へ分泌し、組織においては、hGAAポリペプチドが、融合したIGF2配列の支援によって、細胞に取り込まれ、リソソームへ輸送され、そこで、酵素欠損によってリソソームに蓄積した材料を排除するため、酵素が作用する。リソソーム酵素補充治療が有効であるためには、蓄積欠陥が顕在している組織において、適切な細胞のリソソームへ治療用酵素が送達されなければならない。
【0304】
「カチオン非依存性マンノース-6-リン酸受容体(CI-MPR)」、「M6P/IGF-II受容体」、「CI-MPR/IGF-II受容体」、「IGF-II受容体」、もしくは「IGF2受容体」という用語、またはそれらの略語は、本明細書において交換可能に使用され、M6PおよびIGF-IIの両方と結合する細胞受容体をさす。
【0305】
B. エクスビボでの細胞におけるGAAレベルのモジュレーション
本明細書中に記載される核酸、ベクター、およびビリオンは、細胞内のGAAのレベルをモジュレートするために使用され得る。方法は、2つのAAV ITRの間に置かれたGAAをコードするポリヌクレオチドを含む核酸を含む組成物を細胞へ投与する工程を含む。細胞は、本発明の核酸を投与され得る任意の動物に由来し得る。GAA欠損症を有する対象に由来する哺乳動物細胞(例えば、ヒト、イヌ、ネコ、ブタ、ヒツジ、マウス、ラット、ウサギ、ウシ、ヤギ等)は、本発明において使用するための典型的な標的細胞である。いくつかの態様において、細胞は、肝細胞または心筋細胞(myocardial cell)、例えば、心筋細胞(myocardiocyte)である。
【0306】
一態様において、rAAVベクターによって形質導入された細胞のエクスビボ送達が、本明細書中に開示される。さらなる態様において、エクスビボ遺伝子送達は、本明細書中に開示されるrAAVベクターによって形質導入された細胞を、宿主へ戻し移植するために使用され得る。さらなる態様において、エクスビボ幹細胞(例えば、間葉系幹細胞)治療が、本明細書中に開示されるrAAVベクターによって形質導入された細胞を、細胞を宿主へ戻し移植するために使用され得る。別の態様において、適切なエクスビボプロトコールは、いくつかの工程を含み得る。
【0307】
いくつかの態様において、標的組織(例えば、筋肉、肝組織)のセグメントが、対象から採集され、GAAをコードする核酸を宿主の細胞へ形質導入するため、本明細書に記載されたrAAVベクターが使用され得る。次いで、これらの遺伝学的に修飾された細胞が、宿主へ戻し移植され得る。静脈注射、腹腔内注射、皮下注射、または標的組織へのインサイチュー注射を含むいくつかのアプローチが、細胞の宿主への再導入のために使用され得る。本明細書中に記載されるrAAVベクターによって形質導入された、または感染させられた、修飾されたエクスビボ細胞のマイクロカプセル化は、本発明において使用され得る別の技法である。自己および同種の細胞移植が、本発明に従って使用され得る。
【0308】
さらに別の態様において、薬学的に許容される担体で、治療的に有効な量、本明細書中に開示されるGAAを発現する細胞を対象へ投与する工程を含む、対象におけるGAAの欠損を処置する方法が、本明細書中に開示される。いくつかの態様において、対象はヒトである。
【0309】
C. 対象におけるGAA活性の増大
本明細書中に記載される核酸、ベクター、およびビリオンは、対象、例えば、ヒト対象、またはポンペ病を有する対象もしくはポンペ病を有するリスクを有する対象において、機能性GAAポリペプチドのレベルをモジュレートするために使用され得る。方法は、2つのAAV ITRの間に置かれたGAAをコードする異種核酸を含む本明細書中に記載されるrAAVゲノムを含むrAAVベクターを含む組成物を、対象へ投与する工程を含み、ここで、hGAAは、本明細書中に記載されるシグナルペプチドと連結されており、任意で、本明細書中に開示されるIGF-2配列と連結されている。対象は、任意の動物であり得、例えば、哺乳動物(例えば、ヒト、イヌ、ネコ、ブタ、ヒツジ、マウス、ラット、ウサギ、ウシ、ヤギ等)が、適切な対象である。本発明の方法および組成物は、具体的には、GAA欠損ヒト対象に適用可能である。
【0310】
さらに、本明細書中に記載された核酸、ベクター、およびビリオンは、任意の適切な方法によって、任意の適切な製剤で、ヒトを含む動物へ投与され得る。例えば、本明細書中に開示される方法および組成物の任意の態様において、本明細書中に開示されるrAAVベクターまたはrAAVゲノムは、所望の投与ルートおよび標的とされている組織に依って、例えば、経口、直腸、経粘膜、鼻腔内、(例えばエアロゾルを介した)吸入、頬側(例えば、舌下)、膣、くも膜下腔内、眼内、経皮、子宮内(もしくは胚内)、非経口(例えば、静脈内、皮下、皮内、筋肉内[例えば、骨格筋、横隔膜筋、および/もしくは心筋への投与]、皮内、胸膜内、脳内、および関節内)、局所(例えば、皮膚および粘膜表面、例えば、気道表面の両方、ならびに経皮投与)、リンパ内等による投与を通して動物へ直接導入されてよく、(例えば、肝臓、骨格筋、心筋、横隔膜筋、もしくは脳への)組織もしくは器官への直接注射、またはその他の非経口ルートを通して導入されてもよい。
【0311】
本明細書中に開示される方法および組成物の任意の態様において、本発明による骨格筋への投与には、四肢(例えば、上腕、前腕、大腿、および/もしくは下腿)、背部、頸部、頭部(例えば、舌)、胸部、腹部、骨盤/会陰、ならびに/または趾(指)の骨格筋への投与が含まれるが、これらに限定されるわけではない。適切な骨格筋には、(手の)小指外転筋、(足の)小趾外転筋、母趾(指)外転筋、第五中足骨外転筋(abductor ossis metatarsi quinti)、短母指外転筋、長母指外転筋、短内転筋、母趾(指)内転筋、長内転筋、大内転筋、母指内転筋、肘筋、前斜角筋、膝関節筋、上腕二頭筋、大腿二頭筋、上腕筋、腕橈骨筋、頬筋、烏口腕筋、皺眉筋、三角筋、口角下制筋、下唇下制筋、二腹筋、(手の)背側骨間筋、(足の)背側骨間筋、短橈側手根伸筋、長橈側手根伸筋、尺側手根伸筋、小指伸筋、趾(指)伸筋、短趾(指)伸筋、長趾(指)伸筋、短母趾(指)伸筋、長母趾(指)伸筋、示指伸筋、短母指伸筋、長母指伸筋、橈側手根屈筋、尺側手根屈筋、(手の)短小指屈筋、(足の)短小趾屈筋、短趾(指)屈筋、長趾(指)屈筋、深指屈筋、浅指屈筋、短母趾(指)屈筋、長母趾(指)屈筋、短母指屈筋、長母指屈筋、前頭筋、腓腹筋、おとがい舌骨筋、大殿筋、中殿筋、小殿筋、薄筋、頸腸肋筋、腰腸肋筋、胸腸肋筋、腸骨筋、下双子筋、下斜筋、下直筋、棘下筋、棘間筋、横突間筋(intertransversi)、外側翼突筋、外側直筋、広背筋、口角挙筋、上唇挙筋、上唇鼻翼挙筋、上眼瞼挙筋、肩甲挙筋、長回旋筋(long rotator)、頭最長筋、頸最長筋、胸最長筋、頭長筋、頸長筋、(手の)虫様筋、(足の)虫様筋、咬筋、内側翼突筋、内側直筋、中斜角筋、多裂筋、顎舌骨筋、下頭斜筋、上頭斜筋、外閉鎖筋、内閉鎖筋、後頭筋、肩甲舌骨筋、小指対立筋、母指対立筋、眼輪筋、口輪筋、掌側骨間筋、短掌筋、長掌筋、恥骨筋、大胸筋、小胸筋、短腓骨筋、長腓骨筋、第三腓骨筋、梨状筋、底側骨間筋、足底筋、広頸筋、膝窩筋、後斜角筋、方形回内筋、円回内筋、大腰筋、大腿方形筋、足底方形筋、前頭直筋、外側頭直筋、大後頭直筋、小後頭直筋、大腿直筋、大菱形筋、小菱形筋、笑筋、縫工筋、最小斜角筋、半膜様筋、頭半棘筋、頸半棘筋、胸半棘筋、半腱様筋、前鋸筋、短回旋筋(short rotator)、ヒラメ筋、頭棘筋、頸棘筋、胸棘筋、頭板状筋、頸板状筋、胸鎖乳突筋、胸骨舌骨筋、胸骨甲状筋、茎突舌骨筋、鎖骨下筋、肩甲下筋、上双子筋、上斜筋、上直筋、回外筋、棘上筋、側頭筋、大腿筋膜張筋(tensor fascia lata)、大円筋、小円筋、胸筋(thoracis)、甲状舌骨筋、前脛骨筋、後脛骨筋、僧帽筋、上腕三頭筋、中間広筋、外側広筋、内側広筋、大頬骨筋、および小頬骨筋、ならびに当技術分野において公知の任意のその他の適切な骨格筋が含まれるが、これらに限定されるわけではない。
【0312】
本明細書中に開示される方法および組成物の任意の態様において、心筋への投与には、左心房、右心房、左心室、右心室、および/または隔壁への投与が含まれる。ウイルスベクターおよび/またはカプシドは、静脈内投与、動脈内投与、例えば、大動脈内投与、(例えば、左心房、右心房、左心室、右心室への)直接心臓注射、および/または冠動脈灌流によって、心筋へ送達され得る。
【0313】
本明細書中に開示される方法および組成物の任意の態様において、横隔膜筋への投与は、静脈内投与、動脈内投与、および/または腹膜内投与を含む任意の適切な方法によることができる。
【0314】
本明細書中に開示される方法および組成物の任意の態様において、本明細書中に開示されるrAAVベクターおよび/またはrAAVゲノムは、対象の骨格筋、肝臓、横隔膜、肋骨、および/または心筋の細胞へ投与される。例えば、従来の注射器および針が、rAAVビリオン懸濁液を動物へ注入するために使用され得る。注射によるrAAVベクターおよび/またはrAAVゲノムの非経口投与は、例えば、ボーラス注射または連続注入によって実施され得る。注射用の製剤は、単位剤形で、例えば、アンプル、または保存剤が添加された多用量容器において提示され得る。組成物は、油性または水性の媒体による懸濁液、溶液、または乳濁液のような形態をとっていてよく、懸濁化剤、安定剤、および/または分散剤のような薬学的製剤のための薬剤を含有し得る。あるいは、本明細書中に開示されるrAAVベクターおよび/またはrAAVゲノムは、使用前に、適切な媒体、例えば、無菌の発熱物質を含まない水によって再生させるための粉末形態(例えば、凍結乾燥物)であってもよい。
【0315】
具体的な態様において、複数回の投与(例えば、2、3、4、5、6、7、8、9、10回等、またはそれ以上の投与)が、様々な間隔、例えば、時間単位、日単位、週単位、月単位、年単位等のある期間にわたり、遺伝子発現の所望のレベルを達成するため、用いられ得る。投薬は、単一の投薬量であってもよいかまたは累積的(連続投薬)であってもよく、当業者によって容易に決定され得る。例えば、疾患または障害の処置は、有効用量の本明細書中に開示された薬学的組成物ウイルスベクターの単回投与を含み得る。あるいは、疾患または障害の処置は、例えば、1日1回、1日2回、1日3回(trice daily)、2~3日に1回、または週1回、ある範囲の期間にわたって実施される、有効用量のウイルスベクターの複数回投与を含み得る。
【0316】
投与のタイミングは、個体の症状の重症度のような因子に依って、個体によって変動し得る。例えば、有効用量の本明細書中に開示されたウイルスベクターは、無期限で、または個体がもはや治療を必要としなくなるまで、6ヶ月に1回、個体へ投与され得る。処置の経過中、個体の状態をモニタリングし、それに応じて、投与される本明細書中に開示されたウイルスベクターの有効量を調整してもよいことを、当業者は認識するであろう。
【0317】
注射剤は、液状の溶液もしくは懸濁液、注射前に液体に溶解させるかもしくは懸濁させるために適切な固体の形態、または乳濁液のいずれか一方として、従来の形態で調製され得る。あるいは、全身ではなく局所的に、例えば、デポ剤または徐放性製剤で、本発明のウイルスベクターおよび/またはウイルスカプシドを投与してもよい。さらに、ウイルスベクターおよび/またはウイルスカプシドは、(例えば、米国特許出願公開第US-2004-0013645-Al号に記載されたような)外科的に植込み可能なマトリックスに付着させられて、送達されてもよい。本明細書中に開示されたウイルスベクターおよび/またはウイルスカプシドは、任意の適切な手段によって、任意で、対象によって吸入されるウイルスベクターおよび/またはウイルスカプシドから構成された吸入可能粒子のエアロゾル懸濁液を投与することによって、対象の肺へ投与されてもよい。吸入可能粒子は、液状であってもよいか、または固体であってもよい。当業者に公知であるように、ウイルスベクターおよび/またはウイルスカプシドを含む液体粒子のエアロゾルは、圧力によって駆動されるエアロゾル噴霧器または超音波噴霧器のような任意の適切な手段によって作製され得る。例えば、米国特許第4,501,729号を参照すること。ウイルスベクターおよび/またはカプシドを含む固体粒子のエアロゾルは、薬学分野において公知の技法によって、任意の固体粒子医薬エアロゾル発生器によっても、同様に作製され得る。
【0318】
いくつかの態様において、本明細書中に開示されるrAAVベクターおよび/またはrAAVゲノムは、本明細書中に開示されたrAAVベクターを溶解させるために十分な量の溶媒、乳濁液、またはその他の希釈剤によって製剤化され得る。この態様の他の局面において、本明細書中に開示されるrAAVベクターおよび/またはrAAVゲノムは、本明細書において、例えば、約90%(v/v)未満、約80%(v/v)未満、約70%(v/v)未満、約65%(v/v)未満、約60%(v/v)未満、約55%(v/v)未満、約50%(v/v)未満、約45%(v/v)未満、約40%(v/v)未満、約35%(v/v)未満、約30%(v/v)未満、約25%(v/v)未満、約20%(v/v)未満、約15%(v/v)未満、約10%(v/v)未満、約5%(v/v)未満、または約1%(v/v)未満の量の溶媒、乳濁液、またはその他の希釈剤において製剤化され得る。他の局面において、本明細書中に開示されるrAAVベクターおよび/またはrAAVゲノムは、例えば、約1%(v/v)~90%(v/v)、約1%(v/v)~70%(v/v)、約1%(v/v)~60%(v/v)、約1%(v/v)~50%(v/v)、約1%(v/v)~40%(v/v)、約1%(v/v)~30%(v/v)、約1%(v/v)~20%(v/v)、約1%(v/v)~10%(v/v)、約2%(v/v)~50%(v/v)、約2%(v/v)~40%(v/v)、約2%(v/v)~30%(v/v)、約2%(v/v)~20%(v/v)、約2%(v/v)~10%(v/v)、約4%(v/v)~50%(v/v)、約4%(v/v)~40%(v/v)、約4%(v/v)~30%(v/v)、約4%(v/v)~20%(v/v)、約4%(v/v)~10%(v/v)、約6%(v/v)~50%(v/v)、約6%(v/v)~40%(v/v)、約6%(v/v)~30%(v/v)、約6%(v/v)~20%(v/v)、約6%(v/v)~10%(v/v)、約8%(v/v)~50%(v/v)、約8%(v/v)~40%(v/v)、約8%(v/v)~30%(v/v)、約8%(v/v)~20%(v/v)、約8%(v/v)~15%(v/v)、または約8%(v/v)~12%(v/v)の範囲の量の溶媒、乳濁液、またはその他の希釈剤を含み得る。
【0319】
本明細書中に開示される方法および組成物の任意の態様において、任意の血清型の、例えば、限定されるわけではないが、AAV3bカプシド(SEQ ID NO:44);AAV3b265Dカプシド(SEQ ID NO:46)、AAV3b ST(S663V+T492V)カプシド(SEQ ID NO:48)、AAV3b265D549Aカプシド(SEQ ID NO:50);AAV3b549Aカプシド(SEQ ID NO:52);AAV3bQ263Yカプシド(SEQ ID NO:54)、またはAAV3bSASTGカプシド(即ち、Q263A/T265変異を含むAAV3bカプシド)より選択される任意のAAV3bカプシドによって被包された、本明細書中に開示されるrAAVベクターおよび/またはrAAVゲノムは、治療的に有効な量の治療用化合物を含み得る。一態様において、本明細書において使用されるように、非限定的に、「有効量」という用語は、「治療的に有効な量」、「有効用量」、または「治療的に有効な用量」と同義である。一態様において、ポンペ病を処置するための本明細書中に開示された治療用化合物の有効性は、非限定的に、ポンペ病に関連した1つまたは複数の臨床症状および/または生理学的指標に基づき、個体における改善を観察することによって決定され得る。一態様において、ポンペ病に関連した症状の改善は、同時治療の必要性の低下によって示され得る。
【0320】
例示的な投与モードには、経口、直腸、経粘膜、鼻腔内、(例えばエアロゾルを介した)吸入、頬側(例えば、舌下)、膣、くも膜下腔内、眼内、経皮、子宮内(または胚内)、非経口(例えば、静脈内、皮下、皮内、筋肉内[例えば、骨格筋、横隔膜筋、および/または心筋への投与]、皮内、胸膜内、脳内、および関節内)、局所(例えば、皮膚および粘膜表面、例えば、気道表面の両方、ならびに経皮投与)、リンパ内等が含まれ、(例えば、肝臓、骨格筋、心筋、横隔膜筋、または脳への)組織または器官への直接注射も含まれる。投与は、腫瘍へ(例えば、腫瘍もしくはリンパ節、またはそれらの近くにおいて)行われてもよい。所定の症例における最も適切なルートは、処置されかつ/または防止される状態の性質および重症度、ならびに使用される具体的なベクターの性質に依るであろう。
【0321】
本明細書中に開示されるrAAVベクターおよび/またはrAAVゲノムの送達を容易にするため、それを担体または賦形剤と混合することができる。使用され得る担体および賦形剤には、生理食塩水(具体的には、滅菌された発熱物質を含まない生理食塩水)、塩類緩衝液(例えば、クエン酸緩衝液、リン酸緩衝液、酢酸緩衝液、および炭酸水素緩衝液)、アミノ酸、尿素、アルコール、アスコルビン酸、リン脂質、タンパク質(例えば、血清アルブミン)、EDTA、塩化ナトリウム、リポソーム、マンニトール、ソルビトール、ならびにグリセロールが含まれる。USPグレードの担体および賦形剤は、ヒト対象へのビリオンの送達のため、特に有用である。
【0322】
以前に記載された製剤に加えて、本明細書中に開示されるrAAVベクターおよび/またはrAAVゲノムは、デポ調製物として製剤化されてもよい。そのような長時間作用型製剤は、植込み(例えば、皮下もしくは筋肉内)によって、またはIM注射によって投与され得る。従って、例えば、本明細書中に開示されるrAAVベクターおよび/またはrAAVゲノムは、適切なポリマー材料もしくは疎水性材料によって(例えば、許容される油による乳濁液として)、またはイオン交換樹脂によって、または難溶性誘導体として製剤化され得る。
【0323】
本明細書中に開示される方法および組成物の任意の態様において、方法は、対象におけるGAAの欠損に起因するポンペ病の処置に関し、ここで、本明細書中に開示されるrAAVベクターおよび/またはrAAVゲノムは、ポンペ病に罹患した患者へ投与され、投与後、GAAが肝臓内の細胞から分泌され、かつ骨格筋組織、心筋組織、横隔膜筋組織、またはそれらの組み合わせにおいて、分泌されたGAAの細胞による取り込みがあり、ここで、分泌されたGAAの取り込みが組織内のリソソームグリコーゲン貯蔵の低下をもたらす。いくつかの態様において、本明細書中に開示されるrAAVベクターおよび/またはrAAVゲノムは、カプシドによって被包されており、例えば、AAV3bカプシド(SEQ ID NO:44);AAV3b265Dカプシド(SEQ ID NO:46)、AAV3b ST(S663V+T492V)カプシド(SEQ ID NO:48)、AAV3b265D549Aカプシド(SEQ ID NO:50);AAV3b549Aカプシド(SEQ ID NO:52);AAV3bQ263Yカプシド(SEQ ID NO:54)より選択される任意のAAV3bカプシドによって被包されている。
【0324】
具体的な態様において、1用量当たり少なくとも約102~約108個の細胞または少なくとも約103~約106個の細胞が、薬学的に許容される担体で投与される。さらなる態様において、対象へ投与されるウイルスベクターおよび/またはカプシドの投薬量は、投与モード、処置されかつ/または防止される疾患または状態、個々の対象の状態、具体的なウイルスベクターまたはカプシド、送達すべき核酸等に依り、ルーチンに決定され得る。治療効果を達成するための例示的な用量は、少なくとも約105、106、107、108、109、1010、1011、1012、103、1014、1015形質導入単位、任意で、約108~1013形質導入単位の力価である。
【0325】
別の局面において、核酸が細胞へ導入され、GAAを産生するよう発現させられる条件の下で、細胞を、本明細書中に開示されるrAAVベクターおよび/またはrAAVゲノムと接触させる工程を含む、GAAをコードする核酸を細胞へ投与する方法が、本明細書中に開示される。いくつかの態様において、細胞は、培養細胞である。いくつかの態様において、細胞は、インビボでの細胞である。いくつかの態様において、細胞は、哺乳動物細胞である。いくつかの態様において、GAAをコードする核酸を細胞へ投与する方法は、細胞培養培地中へ分泌されたGAAを収集する工程をさらに含む。
【0326】
D. 哺乳動物における運動ニューロン機能の向上
本明細書中に開示される方法および組成物の任意の態様において、本明細書中に開示されるrAAVベクターおよび/またはrAAVゲノムは、ポンペ病および/または不十分なGAAレベルを有する哺乳動物において横隔神経活性を増大させるための組成物および方法において有用である。例えば、本明細書中に開示されるrAAVベクターおよび/またはrAAVゲノム、例えば、カプシドによって被包された、例えば、AAV3bカプシド(SEQ ID NO:44);AAV3b265Dカプシド(SEQ ID NO:46)、AAV3b ST(S663V+T492V)カプシド(SEQ ID NO:48)、AAV3b265D549Aカプシド(SEQ ID NO:50);AAV3b549Aカプシド(SEQ ID NO:52);AAV3bQ263Yカプシド(SEQ ID NO:54)より選択される任意のAAV3bカプシドによって被包されたrAAVベクターおよび/またはrAAVゲノムは、中枢神経系(例えば、ニューロン)へ投与され得る。別の態様において、GAAをコードする本明細書中に開示されるrAAVベクターおよび/またはrAAVゲノムの、横隔膜(またはその他の筋肉)から横隔神経またはその他の運動ニューロンへの逆行輸送は、ポンペ病の生化学的矯正および生理学的矯正をもたらすことができる。他の神経変性疾患にも、これらの同一の原理を適用することができる。
【0327】
一態様において、表1に記載される任意の血清型、例えば、AAV8もしくはAAV3、またはAAV3b(AAV3b血清型AAV3b265D、AAV3b265D549A、AAV3b549A、AAV3bQ263Y、AAV3bSASTG(即ち、Q263A/T265変異を含むAAV3bカプシド)血清型を含むが、これらに限定されるわけではない)のrAAV GAA構築物は、ポンペ病に罹患した患者において、患者の下肢、例えば、脚、体幹、および/または腕における脱力感を、同一の処置を受けていない患者と比較して、例えば、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、または少なくとも95%低下させることができる。この態様の他の局面において、任意の血清型のAAV GAAは、ポンペ病に罹患した患者において、患者の下肢、例えば、脚、体幹、および/または腕における脱力感を、同一の処置を受けていない患者と比較して、例えば、約10%~約100%、約20%~約100%、約30%~約100%、約40%~約100%、約50%~約100%、約60%~約100%、約70%~約100%、約80%~約100%、約10%~約90%、約20%~約90%、約30%~約90%、約40%~約90%、約50%~約90%、約60%~約90%、約70%~約90%、約10%~約80%、約20%~約80%、約30%~約80%、約40%~約80%、約50%~約80%、または約60%~約80%、約10%~約70%、約20%~約70%、約30%~約70%、約40%~約70%、または約50%~約70%低下させることができる。
【0328】
本明細書中に開示される方法および組成物の任意の態様において、表1に記載される任意の血清型、例えば、本明細書中に開示されるAAV8またはAAV3b(AAV3b血清型AAV3b265D、AAV3b265D549A、AAV3b549A、AAV3bQ263Y、およびAAV3bSASTG(即ち、Q263A/T265変異を含むAAV3bカプシド)を含むが、これらに限定されるわけではない)のrAAV GAA構築物は、ポンペ病に罹患した患者において、以下のもののうちの1つまたは複数を、同一の処置を受けていない患者と比較して、例えば、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、または少なくとも95%低下させることができる:息切れ、運動障害、肺感染症、脊椎の大きい湾曲、睡眠時呼吸困難、肝腫大、舌腫大、および/または関節拘縮。この態様の方法および組成物の他の局面において、本明細書中に開示されたAAV3bQ263Y GAAは、ポンペ病に罹患した患者において、以下のもののうちの1つまたは複数を、同一の処置を受けていない患者と比較して、例えば、約10%~約100%、約20%~約100%、約30%~約100%、約40%~約100%、約50%~約100%、約60%~約100%、約70%~約100%、約80%~約100%、約10%~約90%、約20%~約90%、約30%~約90%、約40%~約90%、約50%~約90%、約60%~約90%、約70%~約90%、約10%~約80%、約20%~約80%、約30%~約80%、約40%~約80%、約50%~約80%、または約60%~約80%、約10%~約70%、約20%~約70%、約30%~約70%、約40%~約70%、または約50%~約70%低下させることができる:息切れ、運動障害、肺感染症、脊椎の大きい湾曲、睡眠時呼吸困難、肝腫大、舌腫大、および/または関節拘縮。
【0329】
本明細書中に開示される方法および組成物の任意の態様において、本明細書中に開示された任意の血清型の本明細書中に開示されるrAAVベクターおよび/またはrAAVゲノムは、ポンペ病に罹患した患者において、以下のもののうちの1つまたは複数を、同一の処置を受けていない患者と比較して、例えば、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、または少なくとも95%低下させることができる:息切れ、運動障害、肺感染症、脊椎の大きい湾曲、睡眠時呼吸困難、肝腫大、舌腫大、および/または関節拘縮。この態様の他の局面において、任意の血清型の本明細書中に開示されるrAAVベクターおよび/またはrAAVゲノムは、ポンペ病に罹患した患者において、以下のもののうちの1つまたは複数を、同一の処置を受けていない患者と比較して、例えば、約10%~約100%、約20%~約100%、約30%~約100%、約40%~約100%、約50%~約100%、約60%~約100%、約70%~約100%、約80%~約100%、約10%~約90%、約20%~約90%、約30%~約90%、約40%~約90%、約50%~約90%、約60%~約90%、約70%~約90%、約10%~約80%、約20%~約80%、約30%~約80%、約40%~約80%、約50%~約80%、または約60%~約80%、約10%~約70%、約20%~約70%、約30%~約70%、約40%~約70%、または約50%~約70%低下させることができる:息切れ、運動障害、肺感染症、脊椎の大きい湾曲、睡眠時呼吸困難、肝腫大、舌腫大、および/または関節拘縮。
【0330】
本明細書中に開示される方法および組成物の任意の態様において、ポンペ病に関連した症状は、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、または少なくとも95%低下し、ポンペ病に関連した症状の重症度は、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、または少なくとも95%低下する。別の態様において、ポンペ病に関連した症状は、約10%~約100%、約20%~約100%、約30%~約100%、約40%~約100%、約50%~約100%、約60%~約100%、約70%~約100%、約80%~約100%、約10%~約90%、約20%~約90%、約30%~約90%、約40%~約90%、約50%~約90%、約60%~約90%、約70%~約90%、約10%~約80%、約20%~約80%、約30%~約80%、約40%~約80%、約50%~約80%、または約60%~約80%、約10%~約70%、約20%~約70%、約30%~約70%、約40%~約70%、または約50%~約70%低下する。
【0331】
一態様において、ポンペ病に関連した有害効果は、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、または少なくとも95%低下し、ポンペ病に関連した有害効果の重症度は、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、または少なくとも95%低下する。別の態様において、ポンペ病に関連した有害効果は、約10%~約100%、約20%~約100%、約30%~約100%、約40%~約100%、約50%~約100%、約60%~約100%、約70%~約100%、約80%~約100%、約10%~約90%、約20%~約90%、約30%~約90%、約40%~約90%、約50%~約90%、約60%~約90%、約70%~約90%、約10%~約80%、約20%~約80%、約30%~約80%、約40%~約80%、約50%~約80%、または約60%~約80%、約10%~約70%、約20%~約70%、約30%~約70%、約40%~約70%、または約50%~約70%低下する。
【0332】
D. マウスモデル
E. 免疫抑制
本明細書中に開示される方法および組成物の任意の態様において、本明細書中に開示されるrAAVベクターまたはrAAVゲノムを投与される対象は、免疫抑制剤を投与される。様々な方法が、AAVを投与される患者の免疫応答の免疫抑制をもたらすことが公知である。当技術分野において公知の方法には、プロテアソーム阻害剤のような免疫抑制剤の患者への投与が含まれる。例えば、両方とも参照によって本明細書中に組み入れられる米国特許第9,169,492号および米国特許出願第15/796,137号に開示されるような、当技術分野において公知の1つのそのようなプロテアソーム阻害剤は、ボルテゾミブである。別の態様において、免疫抑制剤は、抗体、例えば、ポリクローナル、モノクローナル、scfv、または、例えば、抗体産生細胞の排除もしくは抑制を通して、免疫応答を抑制することができるその他の抗体由来分子であり得る。さらなる態様において、免疫抑制要素は、短いヘアピンRNA(shRNA)であり得る。そのような態様においては、shRNAのコード領域を、rAAVカセットに含め、一般に、ポリAテールの下流、3'側に位置付ける。shRNAは、サイトカイン、(トランスフォーミング増殖因子β1およびβ2、TNF、ならびに公に公知のその他のものを含む)増殖因子のような免疫刺激剤の発現を低下させるかまたは排除するため、ターゲティングされ得る。
【0333】
V. 投与
対象へ投与される本明細書中に開示されるrAAVベクターまたはrAAVゲノムの投薬量は、投与モード、処置されかつ/または防止される疾患または状態、個々の対象の状態、具体的なウイルスベクターまたはカプシド、および送達される核酸等に依り、ルーチンに決定され得る。治療効果を達成するための例示的な用量は、少なくとも約105、106、107、108、109、1010、1011、1012、1013、1014、1015形質導入単位、任意で、約108~約1013形質導入単位の力価である。
【0334】
さらなる態様において、本明細書中に開示されるrAAVベクターまたはrAAVゲノムの対象への投与は、2時間、3時間、4時間、5時間、6時間、7時間、8時間、9時間、10時間、11時間、12時間、13時間、14時間、15時間、16時間、17時間、18時間、19時間、20時間、21時間、22時間、23時間、1日、2日、3日、4日、5日、6日、7日、1週間、2週間、3週間、4週間、1ヶ月、2ヶ月、3ヶ月、4ヶ月、またはそれ以上の循環半減期を有するGAAタンパク質の産生をもたらす。
【0335】
一態様において、本明細書中に開示されるrAAVベクターまたはrAAVゲノムの対象への投与の期間は、1日、2日、3日、4日、5日、6日、7日、8日、9日、10日、11日、12日、13日、14日、3週間、4週間、5週間、6週間、7週間、8週間、9週間、10週間、11週間、12週間、4ヶ月、5ヶ月、6ヶ月、7ヶ月、8ヶ月、9ヶ月、10ヶ月、11ヶ月、12ヶ月、またはそれ以上である。さらなる態様において、投与が中止される期間は、1日、2日、3日、4日、5日、6日、7日、8日、9日、10日、11日、12日、13日、14日、3週間、4週間、5週間、6週間、7週間、8週間、9週間、10週間、11週間、12週間、4ヶ月、5ヶ月、6ヶ月、7ヶ月、8ヶ月、9ヶ月、10ヶ月、11ヶ月、12ヶ月、またはそれ以上である。
【0336】
別の態様において、ポンペ病の処置のための本明細書中に開示されるrAAVベクターまたはrAAVゲノムの投与は、例えば、少なくとも0.5ポンド、少なくとも1ポンド、少なくとも1.5ポンド、少なくとも2ポンド、少なくとも2.5ポンド、少なくとも3ポンド、少なくとも3.5ポンド、少なくとも4ポンド、少なくとも4.5ポンド、少なくとも5ポンド、少なくとも5.5ポンド、少なくとも6ポンド、少なくとも6.5ポンド、少なくとも7ポンド、少なくとも7.5ポンド、少なくとも8ポンド、少なくとも8.5ポンド、少なくとも9ポンド、少なくとも9.5ポンド、少なくとも10ポンド、少なくとも10.5ポンド、少なくとも11ポンド、少なくとも11.5ポンド、少なくとも12ポンド、少なくとも12.5ポンド、少なくとも13ポンド、少なくとも13.5ポンド、少なくとも14ポンド、少なくとも14.5ポンド、少なくとも15ポンド、少なくとも20ポンド、少なくとも25ポンド、少なくとも30ポンド、少なくとも50ポンドの体重増加をもたらす。別の態様において、ポンペ病の処置のための本明細書中に開示される任意の血清型のAAV GAAは、例えば、0.5ポンド~50ポンド、0.5ポンド~30ポンド、0.5ポンド~25ポンド、0.5ポンド~20ポンド、0.5ポンド~15ポンド、0.5ポンド~10ポンド、0.5ポンド~7.5ポンド、0.5ポンド~5ポンド、1ポンド~15ポンド、1ポンド~10ポンド、1ポンド~7.5ポンド、1ポンド~5ポンド、2ポンド~10ポンド、2ポンド~7.5ポンドの体重増加をもたらす。
【0337】
本明細書中に開示された技術の組成物および方法の全ての局面が、以下の番号付けられた項目のうちの1つまたは複数において定義され得る。
1. そのゲノム内に
(a)5'および3'AAV末端逆位配列(ITR)、ならびに
(b)5'ITRと3'ITRとの間に位置する、分泌シグナルペプチドとαグルコシダーゼ(GAA)ポリペプチドとを含む融合ポリペプチドをコードする異種核酸配列であって、該異種核酸がプロモーターと機能的に連結されている、該異種核酸配列
を含む、組換えアデノ随伴ウイルス(AAV)ベクター。
2. 融合ポリペプチドをコードする前記異種核酸配列が、前記分泌シグナルペプチドと前記αグルコシダーゼ(GAA)ポリペプチドとの間に位置するIGF-2配列をさらに含む、項目1の組換えAAVベクター。
3. 前記AAVのゲノムが、5'から3'への方向に、
(a)5'ITR、
(b)プロモーター配列、
(c)イントロン配列、
(d)分泌シグナルペプチドをコードする核酸、
(e)IGF-2配列をコードする核酸、
(f)αグルコシダーゼ(GAA)ポリペプチドをコードする核酸、
(g)ポリA配列、および
(h)3'ITR
を含む、項目1または2の組換えAAVベクター。
4. 前記分泌シグナルペプチドが、AATシグナルペプチド、フィブロネクチンシグナルペプチド(FN)、GAAシグナルペプチド、または、分泌シグナル活性を有するそれらの活性断片より選択される、項目1~3のいずれかの組換えAAVベクター。
5. IGF-2リーダー配列が、ヒトカチオン非依存性マンノース-6-リン酸受容体(CI-MPR)またはIGF-2受容体と結合する、項目1~3のいずれかの組換えAAVベクター。
6. 前記IGF-2配列が、SEQ ID NO:5を含むか、または前記IGF-2受容体と結合するSEQ ID NO:5において少なくとも1つのアミノ修飾を含む、項目1~5の組換えAAVベクター。
7. SEQ ID NO:5における前記少なくとも1つのアミノ修飾が、V43Mアミノ酸修飾(SEQ ID NO:8もしくはSEQ ID NO:9)またはΔ2-7(SEQ ID NO:6)またはΔ1-7(SEQ ID NO:7)である、項目1~6のいずれかの組換えAAVベクター。
8. 前記プロモーターが構成性、細胞特異的、または誘導性である、項目1~7のいずれかの組換えAAVベクター。
9. 前記プロモーターが肝臓特異的プロモーターである、項目1~8のいずれかの組換えAAVベクター。
10. 前記肝臓特異的プロモーターが、トランスサイレチンプロモーター(TTR)、LSPプロモーター(LSP)、合成肝臓特異的プロモーターのいずれかより選択される、項目1~9のいずれかの組換えAAVベクター。
11. 前記核酸配列が、野生型GAAポリペプチドまたは修飾型GAAポリペプチドをコードする、項目1~10のいずれかの組換えAAVベクター。
12. 前記GAAポリペプチドをコードする核酸配列が、ヒトGAA遺伝子またはヒトコドン最適化GAA遺伝子(coGAA)または修飾型GAA核酸配列である、項目1~11のいずれかの組換えAAVベクター。
13. 前記GAAポリペプチドをコードする核酸配列が、インビボでの発現の増強のためにコドン最適化されている、項目1~12のいずれかの組換えAAVベクター。
14. 前記GAAポリペプチドをコードする核酸配列が、CpGアイランドを減少させるようにコドン最適化されている、項目1~13のいずれかの組換えAAVベクター。
15. 前記GAAポリペプチドをコードする核酸配列が、自然免疫応答を低下させるようにコドン最適化されている、項目1~14のいずれかの組換えAAVベクター。
16. 前記GAAポリペプチドをコードする核酸配列が、CpGアイランドを減少させかつ自然免疫応答を低下させるようにコドン最適化されている、項目1~15のいずれかの組換えAAVベクター。
17. コードされた前記融合ポリペプチドが、前記GAAポリペプチドのアミノ末端側かつ前記IGF-2配列のC末端側に位置する少なくとも1アミノ酸に対するヌクレオチド配列を含むスペーサーをさらに含む、項目1~16のいずれかの組換えAAVベクター。
18. 前記IGF-2配列をコードする核酸と前記GAAポリペプチドをコードする核酸との間に位置する、少なくとも1アミノ酸のスペーサーをコードする核酸をさらに含む、項目1~7のいずれかの組換えAAVベクター。
19. 前記GAA遺伝子をコードする核酸の3'側かつ前記3'ITR配列の5'側に位置する少なくとも1つのポリA配列をさらに含む、項目1~8のいずれかの組換えAAVベクター。
20. 前記異種核酸配列が、前記GAAポリペプチドをコードする核酸の3'側かつ前記3'ITR配列の5'側に位置するコラーゲン安定性(CS)配列をさらに含む、項目1~19のいずれかの組換えAAVベクター。
21. 前記GAAポリペプチドをコードする核酸と前記ポリA配列との間に位置するコラーゲン安定性(CS)配列をコードする核酸をさらに含む、項目1~20のいずれかの組換えAAVベクター。
22. 前記分泌シグナルペプチドをコードする配列の5'側かつ前記プロモーターの3'側に位置するイントロン配列をさらに含む、項目1~21のいずれかの組換えAAVベクター。
23. 前記イントロン配列がMVM配列またはHBB2配列を含み、ここで、該MVN配列が、SEQ ID NO:13の核酸配列、またはSEQ ID NO:13との少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有する核酸配列を含み、かつ該HBB2配列が、SEQ ID NO:14の核酸配列、またはSEQ ID NO:14との少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有する核酸配列を含む、項目1~22のいずれかの組換えAAVベクター。
24. 前記ITRが挿入、欠失、または置換を含む、項目1~23のいずれかの組換えAAVベクター。
25. 前記ITR内の1つまたは複数のCpGアイランドが除去されている、項目1~24のいずれかの組換えAAVベクター。
26. 前記分泌シグナルペプチドが、フィブロネクチンシグナルペプチド(FN1)、または分泌シグナル活性を有するその活性断片であり(例えば、FN1シグナルペプチドが、SEQ ID NO:18~21、またはSEQ ID NO:18~21のいずれかとの少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有するアミノ酸配列のうちのいずれかの配列を有する)、かつ前記異種核酸配列が、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、もしくはSEQ ID NO:9、またはSEQ ID NO:5~9との少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有するIGF2ペプチドのいずれかより選択されるIGF-2配列をコードする、項目1~25のいずれかの組換えAAVベクター。
27. コードされた前記分泌シグナルペプチドが、AATシグナルペプチド、または分泌シグナル活性を有するその活性断片であり(例えば、AATシグナルペプチドが、SEQ ID NO:17の配列、またはSEQ ID NO:17との少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有するアミノ酸配列を有する)、かつ前記異種核酸配列が、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、もしくはSEQ ID NO:9、またはSEQ ID NO:5~9との少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有するIGF2ペプチドのいずれかより選択されるIGF-2配列をコードする、項目1~3のいずれかの組換えAAVベクター。
28. 前記IGF-2配列が、SEQ ID NO:8もしくはSEQ ID NO:9、またはSEQ ID NO:8もしくはSEQ ID NO:9との少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有するIGF2ペプチドである、項目1~27のいずれかの組換えAAVベクター。
29. キメラAAVベクター、ハプロイドAAVベクター、ハイブリッドAAVベクター、またはポリプロイドAAVベクターである、項目1~28のいずれかの組換えAAVベクター。
30. 表1にリストされたものおよびそれらの任意の組み合わせからなる群における任意のAAV血清型より選択されるカプシドタンパク質を含む、項目1~29のいずれかの組換えAAVベクター。
31. 前記血清型がAAV3bである、項目1~30のいずれかの組換えAAVベクター。
32. AAV3b血清型が、265D、549A、Q263Yのいずれかより選択されるカプシドタンパク質において1つまたは複数の変異を含む、項目1~31のいずれかの組換えAAVベクター。
33. AAV3b血清型が、AAV3b265D、AAV3b265D549A、AAV3b549A、またはAAV3bQ263Y、またはAAV3bSASTGのいずれかより選択される、項目1~32のいずれかの組換えAAVベクター。
34. そのゲノム内に
(a)5'および3'AAV末端逆位配列(ITR)、ならびに
(b)5'ITRと3'ITRとの間に位置する、αグルコシダーゼ(GAA)ポリペプチドを含む融合ポリペプチドをコードする異種核酸配列であって、該異種核酸が肝臓特異的プロモーターと機能的に連結されている、該異種核酸配列
を含み、
AAV3b血清型のカプシドタンパク質を含む、
組換えアデノ随伴ウイルス(AAV)ベクター。
35. 前記融合ポリペプチドが、前記GAAポリペプチドのN末端側に位置する分泌シグナルペプチドをさらに含む、項目34の組換えAAVベクター。
36. 融合ポリペプチドをコードする前記異種核酸配列が、前記分泌シグナルペプチドと前記αグルコシダーゼ(GAA)ポリペプチドとの間に位置するIGF-2配列をさらに含む、項目34または35の組換えAAVベクター。
37. 前記AAVのゲノムが、5'から3'への方向に、
(a)5'ITR、
(b)肝臓特異的プロモーター配列、
(c)イントロン配列、
(d)分泌シグナルペプチドをコードする核酸、
(e)IGF-2配列をコードする核酸、
(f)αグルコシダーゼ(GAA)ポリペプチドをコードする核酸、
(g)ポリA配列、および
(h)3'ITR
を含む、項目34の組換えAAVベクター。
38. 前記分泌シグナルペプチドが、AATシグナルペプチド、フィブロネクチンシグナルペプチド(FN)、GAAシグナルペプチド、または、分泌シグナル活性を有するそれらの活性断片より選択される、項目34~37のいずれかの組換えAAVベクター。
39. IGF-2リーダー配列が、ヒトカチオン非依存性マンノース-6-リン酸受容体(CI-MPR)またはIGF-2受容体と結合する、項目34~38のいずれかの組換えAAVベクター。
40. 前記IGF-2配列が、SEQ ID NO:5を含むか、または、SEQ ID NO:5において、前記IGF-2受容体との結合に影響を与える少なくとも1つのアミノ修飾を含む、項目34~39のいずれかの組換えAAVベクター。
41. SEQ ID NO:5における前記少なくとも1つのアミノ修飾が、V43Mアミノ酸修飾(SEQ ID NO:8もしくはSEQ ID NO:9)またはΔ2-7(SEQ ID NO:6)またはΔ1-7(SEQ ID NO:7)である、項目40の組換えAAVベクター。
42. 前記肝臓特異的プロモーターが、トランスサイレチンプロモーター(TTR)、LSPプロモーター(LSP)、合成肝臓特異的プロモーターのいずれかより選択される、項目34~41のいずれかの組換えAAVベクター。
43. 前記核酸配列が、野生型GAAポリペプチドまたは修飾型GAAポリペプチドをコードする、項目34~42のいずれかの組換えAAVベクター。
44. 前記GAAポリペプチドをコードする核酸配列が、ヒトGAA遺伝子またはヒトコドン最適化GAA遺伝子(coGAA)または修飾型GAA核酸配列である、項目34~43のいずれかの組換えAAVベクター。
45. 前記GAAポリペプチドをコードする核酸配列が、インビボでの発現の増強のためにコドン最適化されている、項目34~44のいずれかの組換えAAVベクター。
46. 前記GAAポリペプチドをコードする核酸配列が、CpGアイランドを減少させるようにコドン最適化されている、項目34~44のいずれかの組換えAAVベクター。
47. 前記GAAポリペプチドをコードする核酸配列が、自然免疫応答を低下させるようにコドン最適化されている、項目34~44のいずれかの組換えAAVベクター。
48. 前記GAAポリペプチドをコードする核酸配列が、CpGアイランドを減少させかつ自然免疫応答を低下させるようにコドン最適化されている、項目34~44のいずれかの組換えAAVベクター。
49. 前記イントロン配列がMVM配列またはHBB2配列を含み、ここで、該MVN配列が、SEQ ID NO:13の核酸配列、またはSEQ ID NO:13との少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有する核酸配列を含み、かつ該HBB2配列が、SEQ ID NO:14の核酸配列、またはSEQ ID NO:14との少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有する核酸配列を含む、項目34~49のいずれかの組換えAAVベクター。
50. 前記ITRが挿入、欠失、または置換を含む、項目34~49のいずれかの組換えAAVベクター。
51. 前記ITR内の1つまたは複数のCpGアイランドが除去されている、項目40の組換えAAVベクター。
52. 前記分泌シグナルペプチドが、フィブロネクチンシグナルペプチド(FN1)、または分泌シグナル活性を有するその活性断片であり(例えば、FN1シグナルペプチドが、SEQ ID NO:18~21、またはSEQ ID NO:18~21との少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有するアミノ酸配列のうちのいずれかの配列を有する)、かつ前記異種核酸配列が、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、もしくはSEQ ID NO:9、またはSEQ ID NO:5~9との少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有するIGF2ペプチドのいずれかより選択されるIGF-2配列をコードする、項目34~49のいずれかの組換えAAVベクター。
53. コードされた前記分泌シグナルペプチドが、AATシグナルペプチド、または分泌シグナル活性を有するその活性断片であり(例えば、AATシグナルペプチドが、SEQ ID NO:17の配列、またはSEQ ID NO:17との少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有するアミノ酸配列を有する)、かつ前記異種核酸配列が、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、もしくはSEQ ID NO:9、またはSEQ ID NO:5~9との少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有するIGF2ペプチドのいずれかより選択されるIGF-2配列をコードする、項目34~49のいずれかの組換えAAVベクター。
54. 前記IGF-2配列が、SEQ ID NO:8もしくはSEQ ID NO:9、またはSEQ ID NO:8もしくはSEQ ID NO:9との少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有するIGF2ペプチドである、項目34~49のいずれかの組換えAAVベクター。
55. 前記項目のいずれかの組換えAAVベクターと薬学的に許容される担体とを含む薬学的組成物。
56. 核酸配列と機能的に連結された肝臓特異的プロモーターであって、該核酸配列が、以下の順に、分泌シグナルペプチドをコードする核酸、IGF-2配列をコードする核酸、GAAポリペプチドをコードする核酸を含む、該肝臓特異的プロモーター
を含む、核酸配列。
57. (a)5'および3'AAV末端逆位配列(ITR)核酸配列、ならびに
(b)5'ITR配列と3'ITR配列との間に位置する、分泌シグナルペプチドとαグルコシダーゼ(GAA)ポリペプチドとを含む融合ポリペプチドをコードする異種核酸配列であって、該異種核酸がプロモーターと機能的に連結されている、該異種核酸配列
を含む、組換えアデノ随伴ウイルス(rAAV)ベクターゲノムに関する核酸配列。
58. 融合ポリペプチドをコードする前記異種核酸配列が、前記分泌シグナルペプチドと前記αグルコシダーゼ(GAA)ポリペプチドとの間に位置するIGF-2配列をさらに含む、項目56または57の核酸配列。
59. 前記分泌シグナルをコードする核酸が、SEQ ID NO:17、22~26、またはSEQ ID NO:17もしくは22~26のいずれかとの少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有する核酸配列のいずれかより選択される、項目56または58の核酸配列。
60. 前記IGF-2配列をコードする核酸が、SEQ ID NO:2(IGF2-Δ2-7)、SEQ ID NO:3(IGF2-Δ1-7)、もしくはSEQ ID NO:4(IGF2 V43M)、またはSEQ ID NO:2、3、もしくは4のいずれかとの少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有する核酸配列のいずれかより選択される、項目56~59のいずれかの核酸配列。
61. 前記GAAポリペプチドをコードする核酸配列が、ヒトGAA遺伝子またはヒトコドン最適化GAA遺伝子(coGAA)または修飾型GAA核酸配列である、項目56または~60のいずれかの核酸配列。
62. 前記GAAポリペプチドをコードする核酸配列が、インビボでの発現の増強のためにコドン最適化されている、項目56~61のいずれかの核酸配列。
63. 前記GAAポリペプチドをコードする核酸配列が、CpGアイランドを減少させるようにコドン最適化されている、項目56~62のいずれかの核酸配列。
64. 前記GAAポリペプチドをコードする核酸配列が、自然免疫応答を低下させるようにコドン最適化されている、項目56~63のいずれかの核酸配列。
65. 前記GAAポリペプチドをコードする核酸配列が、CpGアイランドを減少させかつ自然免疫応答を低下させるようにコドン最適化されている、項目56~64のいずれかの核酸配列。
66. 前記GAAポリペプチドをコードする核酸が、SEQ ID NO:11(全長hGAA)、SEQ ID NO:55(ドワイト(Dwight)cDNA)、SEQ ID NO 56(hGAAΔ1-66)、またはSEQ ID NO:11、55、もしくは56のいずれかとの少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有する核酸配列のいずれかより選択される、項目56~65のいずれかの核酸配列。
67. 前記GAAポリペプチドをコードする核酸が、SEQ ID NO:74(コドン最適化1)、SEQ ID NO:75(コドン最適化2)、およびSEQ ID NO:76(コドン最適化3)のいずれかまたはSEQ ID NO:74、75、もしくは76のいずれかとの少なくとも約75%もしくは80%もしくは85%もしくは90%もしくは95%もしくは98%もしくは99%の配列同一性を有する核酸配列より選択される、項目56または57の核酸配列。
68. SEQ ID NO:57(AAT-V43M-wtGAA(デルタ1-69aa));SEQ ID NO:58(ラットFN1-IGF2V43M-wtGAA(デルタ1-69aa));SEQ ID NO:59(hFN1-IGF2V43M-wtGAA(デルタ1-69aa));SEQ ID NO:60(ATT-IGF2Δ2-7-wtGAA(デルタ1-69));SEQ ID NO:61(FN1ラット-IGFΔ2-7-wtGAA(デルタ1-69));SEQ ID NO:62(hFN1-IGFΔ2-7-wtGAA(デルタ1-69))、SEQ ID NO:79(AAT_hIGF2-V43M_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:80(FIBラット_hIGF2-V43M_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:81(FIBhum_hIGF2-V43M_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:82(AAT_GILT_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:83(FIBラット_GILT_wtGAA_del1-69_スタッファー.V02);SEQ ID NO:84(FIBhum_GILT_wtGAA_del1-69_スタッファー.V02)、またはSEQ ID NO:57、58、59、60、61、62、79、80、81、82、83、もしくは84との少なくとも80%、85%、90%、95%、もしくは98%の同一性を有する核酸配列のいずれかより選択される、項目56または57の核酸配列。
69. 前記項目1~58のいずれかの組換えAAVベクターまたはrAAVゲノムまたは核酸配列のいずれかを、糖原貯蔵症II型(GSD II、ポンペ病、酸性マルターゼ欠損症)を有する対象またはαグルコシダーゼ(GAA)ポリペプチドの欠損を有する対象へ投与する工程を含む、該対象を処置するための方法。
70. GAAポリペプチドが前記対象の肝臓から分泌され、かつ骨格筋組織、心筋組織、横隔膜筋組織、またはそれらの組み合わせによる分泌されたGAAの取り込みがあり、ここで、分泌された該GAAの取り込みが該組織内のリソソームグリコーゲン貯蔵の低下をもたらす、項目69の方法。
71. 前記対象への投与が、筋肉内投与、皮下投与、脊髄内投与、大槽内投与、くも膜下腔内投与、静脈内投与のいずれかより選択される、項目69~70のいずれかの方法。
72. 項目56~68のいずれかの核酸配列を含む細胞。
73. ヒト細胞である、項目72~73のいずれかの細胞。
74. 非ヒト細胞哺乳動物細胞である、項目72~73のいずれかの細胞。
75. 昆虫細胞である、項目72~73のいずれかの細胞。
76. 項目1~54のいずれかの組換えAAVベクターを含む細胞。
77. 項目1~54のいずれかの組換えAAVベクターを含む宿主動物。
78. 哺乳動物である、項目78の宿主動物。
79. 非ヒト哺乳動物である、項目78または79の宿主動物。
80. ヒトである、項目78の宿主動物。
81. 項目69~71のいずれかの方法において使用するための、項目55の薬学的組成物。
82. 項目72~75のいずれかの細胞を含む宿主動物。
83. 項目1~54のいずれかの組換えAAVベクターを含む宿主動物。
84. 哺乳動物である、項目78の宿主動物。
85. 非ヒト哺乳動物である、項目78または79の宿主動物。
86. ヒトである、項目78の宿主動物。
【実施例0338】
以下の非限定的な実施例は、現在企図される代表的な態様のより完全な理解を容易にするため、例示的な目的のために提供されるに過ぎない。これらの実施例は、AAVビリオンおよびrAAVベクターが用いられ得る全ての可能な状況の単なるサブセットであるものとする。従って、これらの実施例は、本明細書中に記載された態様、例えば、AAVビリオンおよびrAAVベクターならびに/またはそれらの方法および使用に関係する態様のいずれかを限定するものと解釈されるべきではない。最終的には、AAVビリオンおよびベクターは、遺伝子送達が望まれる事実上任意の状況において用いられ得る。
【0339】
実施例1: rAAVゲノムの構築
多数のrAAVゲノムを、ギブソンクローニング方法論を使用して構築した。以下のrAAVゲノムを生成した:SEQ ID NO:57(AAT-V43M-wtGAA(デルタ1-69aa));SEQ ID NO:58(ラットFN1-IGF2V43M-wtGAA(デルタ1-69aa));SEQ ID NO:59(hFN1-IGF2V43M-wtGAA(デルタ1-69aa));SEQ ID NO:60(ATT-IGF2Δ2-7-wtGAA(デルタ1-69));SEQ ID NO:61(FN1ラット-IGFΔ2-7-wtGAA(デルタ1-69));SEQ ID NO:62(hFN1-IGFΔ2-7-wtGAA(デルタ1-69))。
【0340】
ギブソンクローニングは、核酸配列のブロック(例えば、3つのブロック)を共にクローニングすることを含む。一般的なプロトコールは、以下の通りであり、以下の試薬を1チューブ反応へ組み合わせる。(i)ギブソンアセンブリマスターミックス(Gibson Assembly Master Mix)(エキソヌクレアーゼ、DNAポリメラーゼ、DNAリガーゼ、緩衝液)、(ii)15~25 bpの相同末端を有するDNAインサート(ブロック1~3)(
図7を参照すること)、(iii)最も外側のDNAインサートと相同の15~25bpの末端を有する線状化されたDNA骨格(
図7を参照すること)。反応物を50℃で15~60分間インキュベートする。反応混合物をコンピテント細胞に形質転換し、カナマイシン寒天プレート上に播種する。完全に組み立てられたプラスミドDNAのミニプレップを、制限消化および/またはコロニーPCR分析を介してスクリーニングし、DNA配列決定分析によって確認する。確認されたクローンを、マキシプレップ作製のために増殖させ、rAAVを作製するため、アデノウイルスヘルパー、XX680 Kan、および適切なRep/Capヘルパーと共に懸濁HEK293細胞に一過性トランスフェクトする。
【0341】
図8~13は、例示的なrAAVゲノムを生成するための核酸ブロックのクローニングを示す。例えば、
図8は、AAT-V43M-wtGAA(デルタ1-69aa)を含むrAAVゲノムの生成を示し;
図9は、ラットFN1-IGF2V43M-wtGAA(デルタ1-69aa)を含むrAAVゲノムの生成を示し;
図10は、hFN1-IGF2V43M-wtGAA(デルタ1-69aa)を含むrAAVゲノムの生成を示し;
図11は、ATT-IGF2Δ2-7-wtGAA(デルタ1-69)を含むrAAVゲノムの生成を示し;
図12は、FN1ラット-IGFΔ2-7-wtGAA(デルタ1-69)を含むrAAVゲノムの生成を示し、
図13は、hFN1-IGFΔ2-7-wtGAA(デルタ1-69)を含むrAAVゲノムの生成を示す。
【0342】
図8~13は、wtGAA(Δ1-69)が例示的なGAA酵素であることを示しているが、この核酸配列は、インビボでの発現の増強のために、かつ/または免疫応答を低下させるように、かつ/またはCpGアイランドを減少させるようにコドン最適化された核酸配列に、当業者によって、容易に交換され得る。また、
図8~13に例示されたクローニングブロックに示されるものは、IGF(V42M)またはIGFΔ2-7ターゲティングペプチドをコードする核酸配列の3'側と、GAA酵素をコードする核酸の5'側とに位置する3アミノ酸(3aa)スペーサー核酸配列、およびポリA配列の3'側と3'ITR配列の5'側とに位置する(
図8~10において「スペーサー」配列と呼ばれる)スタッファー核酸配列のrAAVゲノムの生成である。
【0343】
実施例2: rAAVベクターの生成
rAAV Pro10細胞株を使用して、rAAVベクターを生成するため、rAAVゲノムをカプシドにパッケージングした。rAAVベクター構築の原理証明のために過ぎないが、使用されたカプシドはAAV3bカプシドであった。
【0344】
rAAV Pro10細胞株の作成:臨床グレードのベクターを作成するためにスケールアップされ得る、懸濁HEK293細胞において、rAAVを作成するため、三重トランスフェクション法を使用した。あるいは、異なるプラスミド、例えば、(1)pXX680-adヘルパー、ならびに(2)pXR3 RepおよびCap、ならびに(3)トランスジーンプラスミド(ITR-トランスジーン-ITR)が使用されてもよい。
【0345】
参照によってその全体が本明細書中に組み入れられる米国特許第9,441,206号に記載されたように、Pro10細胞株を使用して、rAVVベクターを生成するため、実施例1において生成されたrAAVゲノムを使用する。具体的には、rAAVベクターまたはrAAVビリオンは、(a)HEK293細胞(例えば、ATTC番号PTA 13274)にAAV発現系を供給する工程;(b)AAV粒子が産生される条件の下で細胞を培養する工程;および(c)任意で、AAV粒子を単離する工程:を含む方法を使用して作製される。プラスミドの3重トランスフェクションの比およびトランスフェクションカクテル体積は、rAAVベクター作製のための最適のプラスミド比を決定するためにXX680、AAV rep/capヘルパー、およびTRプラスミドのプラスミド比を変動させることによって最適化され得る。
【0346】
いくつかの事例において、細胞は、AAV粒子が産生される条件の下で懸濁培養される。もう一つの態様において、細胞は、動物成分を含まない条件において培養される。動物成分を含まない培地は、HEK293細胞と適合性の任意の動物成分を含まない培地(例えば、無血清培地)であり得る。例には、非限定的に、SFM4Transfx-293(Hyclone)、Ex-Cell 293(JRH Biosciences)、LC-SFM(Invitrogen)、およびPro293-S(Lonza)が含まれる。AAV粒子の複製およびパッケージングングのために十分な条件は、例えば、本明細書中に記載されたrAAVゲノムの複製およびAAVカプシドによる被包のために十分なAAV配列(例えば、AAV rep配列およびAAV cap配列)、ならびにアデノウイルスおよび/またはヘルペスウイルスに由来するヘルパー配列の存在であり得る。
【0347】
実施例3: rAAVベクターの評価
全血クリアランス。
図1は、3×10
12vg/kgの異なるAAV血清型(AAV3b、AAV3ST、AAV8、AAV9)を3kgの血清陰性雄マカクに静脈内注射した実験から得られた結果を示す。マカクを、異なるAAV血清型の投与の60日後に屠殺した。ベクターゲノムを全血において検索したところ、結果は、AAV3bは、1週間以内に除去され、屠殺時に検出不可であったが、AAV8およびAAV9は、マカクが屠殺された時に全血中にまだ検出可能であったことを示した。
【0348】
肝臓特異的ベクター効力:
図2は、3×10
12vg/kgの異なるAAV血清型(AAV3b、AAV3ST、AAV8、AAV9)を3kgの血清反応陰性雄マカクに静脈内注射した実験から得られた結果を示す。マカクを、異なるAAV血清型の投与の60日後に屠殺した。ベクターゲノムを、マカクの各々に由来する3つの肝葉の各々において定量化した。定量限界は、0.002vg/dgであった。
図2に提示された結果に基づき、AAV3bは、強力な肝臓ベクターであることが見出された。AAV3bはAAV8より肝臓特異的であり、AAV9より迅速に血液から除去された。AAV3ST変異体は、有意な有益な効果を提供しなかった。
【0349】
実施例4: 上清中へのGAAの分泌の測定およびGAA取り込みアッセイ
上清中のGAAの測定
従って、実施例1において生成されたrAAVゲノムを、GAAポリペプチドの上清中への分泌について試験する。Kikuchiら(Kikuchi,Tateki,et al."Clinical and metabolic correction of Pompe disease by enzyme therapy in acid maltase-deficient quail." The Journal of clinical investigation 101.4(1998):827-833.)に記載されるように、4-メチル-ウンベリフェリル-α-D-グルコシド(4-MU)基質を使用して、上清中のGAAの測定を評価することができる(4-MUアッセイ)。
【0350】
簡単に説明すると、HEK293細胞に、rAAVゲノムSEQ ID NO:57(AAT-V43M-wtGAA(デルタ1-69aa));SEQ ID NO:58(ラットFN1-IGF2V43M-wtGAA(デルタ1-69aa));SEQ ID NO:59(hFN1-IGF2V43M-wtGAA(デルタ1-69aa));SEQ ID NO:60(ATT-IGF2Δ2-7-wtGAA(デルタ1-69));SEQ ID NO:61(FN1ラット-IGFΔ2-7-wtGAA(デルタ1-69));SEQ ID NO:62(hFN1-IGFΔ2-7-wtGAA(デルタ1-69))をトランスフェクトすることができる。GAA活性を、24時間にわたって、初期活性(t=0)に対する%に基づき、測定する。0、3、6、および24時間目に、蛍光発生基質4-MU-α-グルコースの加水分解に基づき、GAA酵素活性について試料をアッセイした。GAA活性を、初期活性に対する%、即ち、残存活性として表した。
【0351】
あるいは、採集の後、培養上清を、HICクロマトグラフィによって部分精製した。全ての試料を電気泳動前にPNGaseによって処理した。細胞によるGAAポリペプチドの発現を、SDS-PAGEおよびイムノブロッティングを使用して評価することができる。
【0352】
GAA取り込みアッセイおよび組織におけるGAAの取り込みの測定
次に、実施例1および2において生成されたrAAVゲノムを、細胞への取り込み活性の保持について試験する。例えば、HEK293細胞に、rAAVゲノム、SEQ ID NO:57(AAT-V43M-wtGAA(デルタ1-69aa));SEQ ID NO:58(ラットFN1-IGF2V43M-wtGAA(デルタ1-69aa));SEQ ID NO:59(hFN1-IGF2V43M-wtGAA(デルタ1-69aa));SEQ ID NO:60(ATT-IGF2Δ2-7-wtGAA(デルタ1-69));SEQ ID NO:61(FN1ラット-IGFΔ2-7-wtGAA(デルタ1-69));SEQ ID NO:62(hFN1-IGFΔ2-7-wtGAA(デルタ1-69))をトランスフェクトすることができる。
【0353】
哺乳動物細胞へのrhGAAの取り込みを評価するための(前記の)4-MUアッセイは、参照によってその全体が本明細書中に組み入れられる米国特許出願第US2009/0117091A1号に記載されている。実施例1および2において生成されたrAAVベクターまたはrAAVゲノムを、10mM 4-メチルウンベリフェリルα-D-グルコシダーゼ基質(Sigma、カタログ番号M-9766)を含む123mM酢酸ナトリウムpH 4.0を含有する20μlの反応混合物においてインキュベートする。反応物を37℃で1時間インキュベートし、267mM炭酸ナトリウム、427mMグリシンを含有する200μlの緩衝液、pH 10.7によって中止した。96穴マイクロタイタープレートにおいて355nmの励起および460nmのフィルタによって蛍光を測定し、4-メチルウンベリフェロン(Sigma、カタログ番号M1381)に由来する標準曲線と比較した。1 GAA 4 MU単位は、1nmole 4-メチルウンベリフェロン加水分解/時間として定義される。線維芽細胞における例示的なrAAVゲノム、例えば、SEQ ID NO:57(AAT-V43M-wtGAA(デルタ1-69aa));SEQ ID NO:58(ラットFN1-IGF2V43M-wtGAA(デルタ1-69aa));SEQ ID NO:59(hFN1-IGF2V43M-wtGAA(デルタ1-69aa));SEQ ID NO:60(ATT-IGF2Δ2-7-wtGAA(デルタ1-69));SEQ ID NO:61(FN1ラット-IGFΔ2-7-wtGAA(デルタ1-69));SEQ ID NO:62(hFN1-IGFΔ2-7-wtGAA(デルタ1-69))の特異的活性を評価する。IGF2-GAA融合ポリペプチドおよび/またはSS-IGF2-GAA二重融合ポリペプチドの酵素活性を評価し、タグなしGAA(wtGAA)と比較する。
【0354】
細胞に基づく取り込みアッセイも、IGF2タグ付きGAAまたはタグなしGAAの、標的細胞に侵入する能力を示すため、実施することができる。ラットL6筋芽細胞を、取り込みの24時間前に、24穴プレートにおいて、1ウェル当たり細胞1×105個の密度で播種する。実験の開始時に、培地を細胞から除去し、実施例1および2において生成されたrAAVベクターを含有する0.5mlの取り込み培地と交換する。取り込みの特異性を証明するため、いくつかのウェルは、競合剤M6P(5mM最終濃度)および/またはIGF-2(18μg/ml最終濃度)をさらに含有していた。18時間後に、培地を細胞から吸引し、細胞をPBSで4回洗浄する。次いで、細胞を200μlのCelLytic MTM溶解緩衝液によって溶解する。溶解物を、4 MU基質を使用して前記のようにGAA活性についてアッセイする。タンパク質を、Pierce BCATMタンパク質アッセイキットを使用して決定する。
【0355】
典型的な取り込み実験は、CHO細胞において実施されるが、その他の細胞株および筋芽細胞細胞株が使用されてもよい。ラットL6筋芽細胞へのGAAポリペプチドの取り込みは、大過剰モル濃度のM6Pの添加によって事実上影響を受けないと予想されるが、過剰のIGF-2によって、取り込みは有意に消失すると予想される。対照的に、wtGAAの取り込みは、過剰のM6Pの添加によって有意に消失するが、IGF2による競合によっては事実上影響を受けないと予想される。さらに、IGF2V43M-wtGAAおよびIGFデルタ2-7wtGAAの取り込みは、過剰のIGF-2によって有意に影響を受けないと予想される。
【0356】
実施例5 ラットL6筋芽細胞におけるGAAの半減期
ラットL6筋芽細胞において、実施例1および2において作製されたrAAVベクターを用いて、前記のように(実施例3および4を参照すること)、取り込み実験を実施した。18時間後、rAAVベクターをトランスフェクトされた細胞から培地を吸引し、細胞をPBSで4回洗浄した。この時点で、デュプリケートウェルを溶解し(時点0)、溶解物を-80で凍結させた。その後、毎日、デュプリケートウェルを溶解し、分析のために保管した。14日後に、半減期を評価するため、そして細胞内でIGF-2タグ付きGAA酵素がタグなしGAAと類似した動力学で持続するか否かを評価するため、溶解物の全てをGAA活性についてアッセイした。
【0357】
実施例6: 取り込み後のGAAのプロセシング
哺乳動物GAAは、典型的には、Moreland et al.(2005)J.Biol.Chem.,280:6780-6791およびその中に含有される参照によって記載されるように、リソソームにおいて連続的なタンパク質分解プロセシングを受ける。プロセシングを受けたタンパク質は、70kDa、20kDa、および10kDaのペプチド、ならびにいくつかのより小さいペプチドのパターンを与える。IGF2-GAA融合ポリペプチドおよび/またはSS-IGF2-GAA二重融合ポリペプチドが、タグなしGAAと類似したプロセシングを受けるか否かを決定するため、前記の取り込み実験からの溶解物のアリコートを、70kDa IGF-2ペプチドとIGF-2タグを有するより大きい中間体とを認識するモノクローナル抗体を使用したウエスタンブロットによって分析した。この実験において同定されたポリペプチドの類似したプロファイルは、細胞に侵入した後には、IGF-2配列が失われ、IGF-2-GAAポリペプチドが、タグなしGAAと類似したプロセシングを受けることを示しており、このことは、IGF-2配列が、細胞内では、GAAの挙動に対してほとんどまたは全く影響を及ぼさないことを証明している。
【0358】
実施例7: 薬物動態
rAAVベクターによって産生されたIGF2-GAA融合ポリペプチドおよび/またはSS-IGF2-GAA二重融合ポリペプチドの薬物動態を、野生型129マウスにおいて測定することができる。129マウスに、実施例1および2において生成されたrAAVベクターを注射する。血清試料を、注射前、ならびに注射の15分後、30分後、45分後、60分後、90分後、120分後、4時間後、および8時間後に採取する。次いで、動物を屠殺する。血清試料を定量的ウエスタンブロットによってアッセイする。GAAポリペプチドと融合したIGF-2が、過度に急速に循環から除去されるか否かを決定するため、IGF2-GAA融合ポリペプチドまたはSS-IGF2-GAA二重融合ポリペプチドを発現するrAAVベクターに由来するGAAの半減期を評価する。
【0359】
実施例8: GAAの組織半減期
この実験の目的は、rAAVベクターから発現されたIGF2-GAA融合ポリペプチドまたはSS-IGF2-GAA二重融合ポリペプチドが、標的組織に到達した後、GAA活性が失われる速度を決定することであった。ポンペマウスモデルにおいて、MYOZYME(登録商標)は、様々な筋肉組織において約6~7日の組織半減期を有するようである(Application Number 125141/0 to the Center for Drug Evaluation and Research and Center for Biologics Evaluation and Research,Pharmacology Reviews)。
【0360】
ポンペマウス(Raben(1998)JBC,273:19086-19092に記載されこの開示が参照によって本明細書中に組み入れられる、ポンペマウスモデル6neo/6neo)の頚静脈に、実施例1および2において生成されたrAAVベクターを注射する。次いで、マウスを、注射の1日後、5日後、10日後、および15日後に屠殺する。標準的な手法に従って、組織試料を均質化し、GAA活性を測定した。異なる組織(例えば、大腿四頭筋組織;心組織;横隔膜組織;および肝組織)における減衰曲線から、IGF2-GAA融合ポリペプチドおよび/またはSS-IGF2-GAA二重融合ポリペプチドならびにタグなしGAAからのGAA活性の組織半減期を計算し、各組織における半減期を計算した。ポンペマウスの細胞内で、本明細書中に記載されたrAAVベクターから発現されたIGF2-GAA融合ポリペプチドおよび/またはSS-IGF2-GAA二重融合ポリペプチドが、タグなしGAAと類似した動力学で持続すると考えられるか否かを決定するため、ラットL6筋芽細胞における半減期と、これを比較することができる。さらに、IGF2-GAA融合ポリペプチドおよび/またはSS-IGF2-GAA二重融合ポリペプチドの減衰動力学の知識は、適切な投薬間隔の設計を助けることができる。
【0361】
実施例9: IGF2-GAA融合ポリペプチドおよび/またはSS-IGF2-GAA二重融合ポリペプチドの、C2C12マウス筋芽細胞のリソソームへの取り込み
ポリリジンによってコーティングされたスライド(BD Biosciences)上で成長したC2C12マウス筋芽細胞を、実施例1および2において作製されたrAAVベクターによって形質導入する。次いで、細胞を洗浄した後に、細胞を1時間成長培地においてインキュベートし、次いで、D-PBSで4回洗浄した後、室温で15分間メタノールを用いて固定する。以下のインキュベーションは、全て室温で行われ、各々の間に、D-PBSでの3回の洗浄が行われた。スライドを0.1%トリトンX-100で15分間透過処理し、次いで、ブロッキング緩衝液(D-PBS中の10%熱不活化ウマ血清(Invitrogen))によってブロッキングした。スライドを、一次マウスモノクローナル抗GAA抗体3A6-1F2(ブロッキング緩衝液中1:5,000)と共にインキュベートし、次いで、AF594がコンジュゲートされた二次ウサギ抗マウスIgG抗体(Invitrogen A11032、ブロッキング緩衝液中1:200)と共にインキュベートした。次いで、FITCがコンジュゲートされたラット抗マウスLAMP-1(BD Pharmingen 553793、ブロッキング緩衝液中1:50)をインキュベートする。スライドを、DAPIを含有する封入溶液(Invitrogen)で封入し、フルオレセインイソチオシアネート、テキサスレッド、およびDAPIのフィルタ(Chroma Technology)が装備されたNikon Eclipse 80i顕微鏡で観察する。MetaMorphソフトウェア(Universal Imaging)によってコントロールされた測光Cascadeカメラによって画像を捕獲し、Photoshopソフトウェア(Adobe)を使用してマージすることができる。抗GAA抗体によって検出されたシグナルの、リソソームマーカーLAMP1に対する抗体によって検出されたシグナルとの共局在を、IGF2タグ付きGAAがリソソームに送達されることを証明するため、評価することができる。
【0362】
実施例10: ポンペマウスモデルにおけるrAAVベクターの処置とポンペ病態の逆転との評価
実施例1において生成されたrAAVベクターを、例えば、参照によってその全体が本明細書中に組み入れられるPeng et al.,."Reveglucosidase alfa(BMN 701),an IGF2-Tagged rhAcid α-Glucosidase,Improves Respiratory Functional Parameters in a Murine Model of Pompe Disease." Journal of Pharmacology and Experimental Therapeutics 360.2(2017):313-323に記載された方法に従って、ポンペマウスモデルにおいて評価することができる。
【0363】
ポンペ病の処置におけるrAAVベクターの効果を評価するため、任意のポンペマウスモデルを使用することができる。1つのポンペマウスモデルは、GAA破壊マウスモデルを記載しているRaben et al.,JBC,1998;273(30);19086-19092に記載されており、乳児型および成人型の両方の疾患の重要な特色を再現する。他の事例において、ポンペマウスモデル(Sidman et al.,2008)が使用されてもよく、破壊された酸性αグルコシダーゼ遺伝子を有するマウスの系統(B6;129-GAAtm1Rabn/J;Pompe)(Jackson Laboratory,Bar Harbor,ME)が使用されてもよい。ポンペマウスは、ヒト成人ポンペ病と同一の細胞特徴および臨床的特徴を発症する(Raben et al.,1998)。動物は、12時間明/暗周期で維持され、新鮮な水および標準的なげっ歯類用飼料を自由供給される。
【0364】
4.5~5ヶ月齢ポンペマウスに、本明細書中に記載されたrAAVベクターを投与し、投与後のグリコーゲンクリアランスについて4週間またはそれ以上調べることができる。肉眼的評価の後、心臓(左室)、大腿四頭筋、横隔膜、腰筋、およびヒラメ筋を収集し、計量し、液体窒素中で急速凍結させ、-60~-90℃で保管した後、グリコーゲンに由来するグルコースの定量分析を行った。筋肉を、セラミックスフェアを使用して、氷上で、緩衝液(0.2M NaOAc/0.5%NP40)中で均質化した。ペルオキシダーゼ-グルコースオキシダーゼ酵素反応系(Sigma-Aldrich,St.Louis,MO)を使用した、その後の比色定量検出(430nm,SpectraMax;Molecular Devices,Sunnyvale,CA)のため、グリコーゲンをグルコースに消化するため、アミログルコシダーゼを、37℃で、清浄化された溶解物に添加した。採集時にグリコーゲン型でなかった内在性組織グルコースについて補正するため、対の試料を、アミログルコシダーゼの非存在下でも測定する。グルコース値を、6点標準曲線から外挿した。測定されたグルコース濃度(mg/ml)は、試料のグリコーゲン濃度に比例しており、均質化工程(組織1グラム当たり5μlの緩衝液の添加)について調整することによって、mgグリコーゲン/g組織に変換される。
【0365】
個々のマウス筋肉グリコーゲンレベルに対する本明細書中に記載されたrAAVベクターの効果を、Phoenix-WinNonlin classic PDモデリング(Phoenix build version 6.4;Certara,L.P.,Princeton,NJ)を使用して調べることができる。心臓、横隔膜、大腿四頭筋、腰筋、およびヒラメ筋におけるhGAAについて、結果を得ることができる。薬物動態学的分析のため、実施例1において生成されたrAAVベクターをWTマウスへ投与し、投薬前、ならびに投薬の0.083時間後、0.5時間後、1時間後、2時間後、および4時間後に、末端心臓穿刺として血液試料を収集することができる。血漿hGAA濃度を、100ng/mlのLOQで、ブリッジング電気化学発光法を使用して定量化することができる。簡単に説明すると、0.5μg/mlのルテニウムによって標識された抗rhGAA(アフィニティ精製されたヤギポリクローナル)および0.5μg/mlのビオチンによって標識された抗IGF2(MAB792;R&D Systems,Minneapolis,MN)を、緩衝液[Starting Block T20(PBS);ThermoFisher Scientific,Sunnyvale,CA]で1:10希釈されたK2EDTA血漿試料と合わせ、1時間インキュベートした後、ブロッキングされたストレプトアビジンアッセイプレート(Meso Scale Diagnostics,Rockville,MD)に移すことができる。30分間のインキュベーションの後、プレートを洗浄し、1×Read Buffer T(Meso Scale Diagnostics)を添加し、電気化学発光シグナルをSECTOR Imager 2400(Meso Scale Diagnostics)で読み取った。hGAA濃度を標準曲線から外挿することができる。
【0366】
あるいは、心臓および横隔膜の組織ホモジネートを採集し、rhGAA活性を蛍光発生基質(4-MUG)を使用して測定することができる。
【0367】
本明細書中の実施例1および2において生成されたrAAVベクターを使用して産生されたGAAポリペプチドの治療効果を、インビボで、wt GAAと比較することができる。実施例1に開示されたrAAVベクターの、ポンペマウスにおいて骨格筋組織からグリコーゲンを除去する能力を、タグなしwt GAAを発現するものと比較するため、研究を実施することができる(例えば、ポンペマウスモデル6neo/6neo動物が使用された(Raben(1998)JBC 273:19086-19092))。ポンペマウスの群(5匹/群)が、実施例1において生成されたwt GAAもしくはrAAVベクターの2用量のうちの一方、または媒体のIV注射を受容した。5匹の未処理の動物が、対照として使用され、生理食塩水溶液の週1回の注射を4回受容することができる。動物は、2回目、3回目、および4回目の注射の1時間前に、経口ジフェンヒドロミン(diphenhydromine)5mg/kgを受容する。マウスを注射の1週間後に屠殺し、組織(横隔膜、心臓、肺、肝臓、ひらめ筋、大腿四頭筋、腓腹筋、TA、EDL、舌)を、組織学的分析および生化学的分析のために採集する。標準的な手法を使用して、組織ホモジネート中のグリコーゲン含量を、クロコウジカビ(A.niger)アミログルコシダーゼおよびAmplex Red Glucoseアッセイキットを使用して測定し、異なる組織ホモジネートにおけるGAA酵素レベルを評価することができる。
【0368】
組織ホモジネート中のグリコーゲン含量は、本質的に、Zhu et al.(2005)Biochem J.,389:619-628によって記載されるように、クロコウジカビアミログルコシダーゼおよびAmplex(登録商標)Red Glucoseアッセイキット(Invitrogen)を使用して測定され得る。
【0369】
実施例1および2の方法によって作製された本明細書中に記載されるrAAVベクターss-IGF2-GAA rAAVは、wtGAA rAAVベクター(即ち、分泌シグナルもIGF2配列も含まない)および/またはMYOZYME(登録商標)より大きいと予想される、IGF-2-GAA rAAV(即ち、分泌シグナル配列を含まない)と比較して、ポンペマウスモデルにおいて、より大きい筋肉への取り込みおよびより大きい治療効果を有すると予想される。確立されたポンペモデルであるとすれば、これらの結果は、臨床に翻訳され、ポンペ病の処置のための治療効果と相関すると予想される。
【0370】
実施例11: インビボでのグリコーゲンのクリアランス
この実験の目的は、実施例1および2において作製されたIGF2-GAA融合ポリペプチドおよび/またはSS-IGF2-GAA二重融合ポリペプチドを発現するrAAVベクターの単回注射の後にポンペマウスの心組織からグリコーゲンが除去される速度を決定することである。
【0371】
ポンペマウス(Raben(1998)JBC,273:19086-19092に記載されこの開示が参照によって本明細書中に組み入れられる、ポンペマウスモデル6neo/6neo)の頚静脈に、実施例1および2において作製されたrAAVベクターを注射する。注射の1日後、5日後、10日後、および15日後にマウスを屠殺する。心組織試料を標準的な手法に従って均質化し、グリコーゲン含量について分析する。これらの組織ホモジネート中のグリコーゲン含量を、本質的に、Zhu et al.(2005)Biochem J.,389:619-628によって記載されたように、クロコウジカビアミログルコシダーゼおよびAmplex(登録商標)Red Glucoseアッセイキット(Invitrogen)を使用して測定する。マウス由来の心組織の評価は、グリコーゲン含量の小さい変化のみが最小のクリアランスを示す、本明細書中に記載されるIGF2配列および/またはSSとGAAが融合していないrAAVを投与されたマウスと比較して、実施例1および2において作製されたIGF2-GAA融合ポリペプチドおよび/またはSS-IGF2-GAA二重融合ポリペプチドを発現するrAAVベクターを投与されたマウスにおいて、グリコーゲンのほぼ完全なクリアランスが起こるか否かを決定することができる。
【0372】
最後に、本明細書中に示され記載される本発明の例示的な態様に関して、AAV(アデノ随伴ウイルス)ウイルスビリオンを含むゲノム構築物は、AAVベクターの送達のために開示され、構成されることが認識されるであろう。本発明の原理は、示され、記載されたもの以外の多数の配置で実施され得るため、本発明は、例示的な態様によって決して限定されず、AAV(アデノ随伴ウイルス)ウイルスビリオン装置を含むゲノム構築物に一般に関し、そのために、本発明の本旨および範囲を逸脱することなく、多数の形態をとり得ることが理解されるべきである。
【0373】
本発明のある種の態様、例えば、本発明を実施するための本発明者らが知る最適なモードが、本明細書中に記載される。当然、これらの記載された態様のバリエーションが、上記の説明を参照することによって、当業者に明らかになるであろう。本発明者らは、当業者がそのようなバリエーションを適宜用いることを予想し、本発明者らは、本明細書中に具体的に記載された以外の様式で本発明が実施されることを意図する。従って、本発明は、準拠法によって許容されるように、添付の特許請求の範囲に記載された主題の全ての修飾および等価物を含む。さらに、その他のことが本明細書中に示されるかまたは前後関係によって明白に否定されない限り、それらの全ての可能なバリエーションにおける前記の態様の任意の組み合わせが、本発明に包含される。
【0374】
本発明の別の態様、要素、または工程の群は、限定として解釈されるべきではない。各群メンバーは、個々に、または本明細書中に開示された他の群メンバーとの任意の組み合わせで、言及され、特許請求の範囲に記載され得る。便宜および/または特許性のため、群の1つまたは複数のメンバーが、群に組み込まれてもよいか、または群から削除されてもよいことが期待される。そのような組み込みまたは削除が起こる時、本明細書は、修飾された群を含有し、従って、添付の特許請求の範囲において使用される全てのマーカッシュ群の記述を満たすと見なされる。
【0375】
その他のことが示されない限り、本明細書および特許請求の範囲において使用される、特徴、項目、量、パラメータ、特性、用語等を表す全ての数は、全ての事例において「約」という用語によって修飾されているものとして理解されるべきである。本明細書において使用されるように、「約」という用語は、そのように修飾された特徴、項目、量、パラメータ、特性、または用語が、明示された特徴、項目、量、パラメータ、特性、または用語の値の上下+/-10パーセントを包含することを意味する。従って、反対のことが示されない限り、本明細書および添付の特許請求の範囲に示される数的パラメータは、変動し得る近似値である。少なくとも、特許請求の範囲の範囲への均等論の適用を限定する試みとしてではないが、各数的指標は、報告された有効数字の数を考慮して、通常の丸め技法の適用によって、少なくとも解釈されるべきである。本発明の広い範囲を示す数的な範囲および値は近似値であるにも関わらず、具体例において示された数的な範囲および値は、可能な限り正確に報告される。しかしながら、数的な範囲または値は、それぞれの試験測定に見出される標準偏差に必然的に起因する一定の誤差を本質的に含有する。本明細書中の数的な値の範囲の記載は、その範囲内にある別々の各数値を個々にさすための略記法として役立つためのものに過ぎない。その他のことが本明細書中に示されない限り、数的な範囲の個々の各値は、本明細書中に個々に記載されたかのごとく、本明細書中に組み入れられる。同様に、本明細書において使用されるように、反対のことが示されない限り、「実質的に」という用語は、そのように修飾された特徴、項目、量、パラメータ、特性、または用語の近似値を示すための、程度を示す用語であり、当業者によって理解され解釈され得る範囲を包含する。
【0376】
「であってよい(may)」または「ことができる(can)」という用語の使用は、態様の態様または局面に関して、「でなくてもよい(may not)」または「ことができない(cannot)」という別の意味も保持する。従って、態様または態様の局面が、本発明の主題の一部として含まれるかもしれない、または含まれてよいことを、本明細書が開示する場合、それは、否定的限定または排他的条件も明示的に意味し、即ち、態様または態様の局面は、本発明の主題の一部として含まれなくてもよいか、または含まれることができない。同様に、態様または態様の局面に関する「任意で」という用語の使用は、そのような態様または態様の局面が、本発明の主題の一部として含まれてもよいか、または本発明の主題の一部として含まれなくてもよいことを意味する。そのような否定的限定または排他的条件が適用されるか否かは、否定的限定または排他的条件が特許請求の範囲に記載された主題において記載されるか否かに基づくであろう。
【0377】
特許請求の範囲において使用された時、出願されたものであっても、または補正によって追加されたものであっても、「含む(comprising)」という非制限的な移行句は、(「含む(including)」、「含有する」、および「有する」のような等価な非制限的な移行句と共に)、単独で、または記載されていない主題と組み合わせて、特別に記載された要素、限定、工程、および/または特色を全て包含し;挙げられた要素、限定、および/または特色が必須であるが、他の挙げられていない要素、限定、および/または特色が追加されたとしても、特許請求の範囲の範囲内の構築物を形成してもよい。本明細書中に開示された具体的な態様は、さらに、「含む」の代わりに、またはその補正として、「からなる」または「から本質的になる」という制限的な移行句を使用して、特許請求の範囲において限定され得る。特許請求の範囲において使用される時、出願されたものであっても、または補正によって追加されたものであっても、「からなる」という制限的な移行句は、特許請求の範囲に特別に記載されない要素、限定、工程、または特色を除外する。「から本質的になる」という制限的な移行句は、特別に記載された要素、限定、工程、および/または特色、ならびに特許請求の範囲に記載された主題の基本的かつ新規の特徴に実質的に影響を与えない他の要素、限定、工程、および/または特色に、特許請求の範囲の範囲を限定する。従って、「含む」という非制限的な移行句の意味は、具体的に記載された要素、限定、工程、および/または特色を全て包含し、任意選択の付加的な指定されていないものも包含するものとして定義される。「からなる」という制限的な移行句の意味は、特許請求の範囲に具体的に記載された要素、限定、工程、および/または特色のみを含むものとして定義され、「から本質的になる」という制限的な移行句の意味は、特許請求の範囲に具体的に記載された要素、限定、工程、および/または特色、ならびに特許請求の範囲に記載された主題の基本的かつ新規の特徴に実質的に影響を与えない要素、限定、工程、および/または特色のみを含むものとして定義される。従って、「含む」という非制限的な移行句は(それらの等価な非制限的な移行句と共に)、「からなる」または「から本質的になる」という制限的な移行句によって指定された特許請求の範囲に記載された主題を、限定的なケースとして、その意味の中に含む。従って、「含む」という語句を用いて本明細書中に記載された態様、またはそのように主張された態様は、「から本質的になる」および「からなる」という語句のため、本明細書において、特別に、または本質的に明確に、記載され、可能にされ、支持される。
【0378】
本発明の局面は、少なくとも一つの例示的な態様に関して記載されたが、本発明はそれらに限定されないことが、当業者によって明白に理解されるべきである。むしろ、本発明の範囲は、添付の特許請求の範囲と共にのみ解釈されるべきであり、本発明者らは、特許請求の範囲に記載された主題が本発明であると考えていることが、ここで明白にされる。
【0379】
参照
特許および特許出願ならびに国際特許出願を含むが、これらに限定されるわけではない、明細書および実施例において開示された参照は、全て、参照によってその全体が本明細書中に組み入れられる。
【0380】
本明細書において参照され同定された特許、特許公報、およびその他の刊行物は、全て、例えば、本発明に関連して使用され得るそのような刊行物に記載された組成物および方法論を記載し開示する目的のため、参照によってその全体が個々に特別に本明細書中に組み入れられる。これらの刊行物は、もっぱら本願の出願日より前のそれらの開示のために提供される。これに関して、先行発明のため、またはその他の何らかの理由のため、本発明者らがそのような開示に先行している資格を有しないことの承認として解釈されるべきものは存在しない。これらの文書の日付に関する陳述または内容に関する表記は、全て、本出願人らが入手可能な情報に基づいており、これらの文書の日付または内容の正確さに関しての承認を構成するものではない。
【0381】
【0382】
配列情報
SEQUENCE LISTING
<110> ASKLEPIOS BIOPHARMACEUTICAL, INC.
<120> THERAPEUTIC ADENO-ASSOCIATED VIRUS FOR TREATING POMPE DISEASE
<150> US 62/769,702
<151> 2018-11-20
<150> US 62/768,449
<151> 2018-11-16
<160> 85
<170> PatentIn version 3.5
<210> 1
<211> 201
<212> DNA
<213> Homo sapiens
<400> 1
gcttaccgcc ccagtgagac cctgtgcggc ggggagctgg tggacaccct ccagttcgtc 60
tgtggggacc gcggcttcta cttcagcagg cccgcaagcc gtgtgagccg tcgcagccgt 120
ggcatcgttg aggagtgctg tttccgcagc tgtgacctgg ccctcctgga gacgtactgt 180
gctacccccg ccaagtccga g 201
<210> 2
<211> 183
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 2
gctctgtgcg gcggggagct ggtggacacc ctccagttcg tctgtgggga ccgcggcttc 60
tacttcagca ggcccgcaag ccgtgtgagc cgtcgcagcc gtggcatcgt tgaggagtgc 120
tgtttccgca gctgtgacct ggccctcctg gagacgtact gtgctacccc cgccaagtcc 180
gag 183
<210> 3
<211> 180
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 3
ctgtgcggcg gggagctggt ggacaccctc cagttcgtct gtggggaccg cggcttctac 60
ttcagcaggc ccgcaagccg tgtgagccgt cgcagccgtg gcatcgttga ggagtgctgt 120
ttccgcagct gtgacctggc cctcctggag acgtactgtg ctacccccgc caagtccgag 180
<210> 4
<211> 201
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 4
gcttaccgcc ccagtgagac cctgtgcggc ggggagctgg tggacaccct ccagttcgtc 60
tgtggggacc gcggcttcta cttcagcagg cccgcaagcc gtgtgagccg tcgcagccgt 120
ggcatcatgg aggagtgctg tttccgcagc tgtgacctgg ccctcctgga gacgtactgt 180
gctacccccg ccaagtccga g 201
<210> 5
<211> 67
<212> PRT
<213> Homo sapiens
<400> 5
Ala Tyr Arg Pro Ser Glu Thr Leu Cys Gly Gly Glu Leu Val Asp Thr
1 5 10 15
Leu Gln Phe Val Cys Gly Asp Arg Gly Phe Tyr Phe Ser Arg Pro Ala
20 25 30
Ser Arg Val Ser Arg Arg Ser Arg Gly Ile Val Glu Glu Cys Cys Phe
35 40 45
Arg Ser Cys Asp Leu Ala Leu Leu Glu Thr Tyr Cys Ala Thr Pro Ala
50 55 60
Lys Ser Glu
65
<210> 6
<211> 61
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 6
Ala Leu Cys Gly Gly Glu Leu Val Asp Thr Leu Gln Phe Val Cys Gly
1 5 10 15
Asp Arg Gly Phe Tyr Phe Ser Arg Pro Ala Ser Arg Val Ser Arg Arg
20 25 30
Ser Arg Gly Ile Val Glu Glu Cys Cys Phe Arg Ser Cys Asp Leu Ala
35 40 45
Leu Leu Glu Thr Tyr Cys Ala Thr Pro Ala Lys Ser Glu
50 55 60
<210> 7
<211> 60
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 7
Leu Cys Gly Gly Glu Leu Val Asp Thr Leu Gln Phe Val Cys Gly Asp
1 5 10 15
Arg Gly Phe Tyr Phe Ser Arg Pro Ala Ser Arg Val Ser Arg Arg Ser
20 25 30
Arg Gly Ile Val Glu Glu Cys Cys Phe Arg Ser Cys Asp Leu Ala Leu
35 40 45
Leu Glu Thr Tyr Cys Ala Thr Pro Ala Lys Ser Glu
50 55 60
<210> 8
<211> 24
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 8
Glu Glu Cys Cys Phe Arg Ser Cys Asp Leu Ala Leu Leu Glu Thr Tyr
1 5 10 15
Cys Ala Thr Pro Ala Lys Ser Glu
20
<210> 9
<211> 67
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 9
Ala Tyr Arg Pro Ser Glu Thr Leu Cys Gly Gly Glu Leu Val Asp Thr
1 5 10 15
Leu Gln Phe Val Cys Gly Asp Arg Gly Phe Tyr Phe Ser Arg Pro Ala
20 25 30
Ser Arg Val Ser Arg Arg Ser Arg Gly Ile Met Glu Glu Cys Cys Phe
35 40 45
Arg Ser Cys Asp Leu Ala Leu Leu Glu Thr Tyr Cys Ala Thr Pro Ala
50 55 60
Lys Ser Glu
65
<210> 10
<211> 952
<212> PRT
<213> Homo sapiens
<400> 10
Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys
1 5 10 15
Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu
20 25 30
His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val
35 40 45
Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly
50 55 60
Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr
65 70 75 80
Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys
85 90 95
Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro
100 105 110
Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe
115 120 125
Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser
130 135 140
Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe
145 150 155 160
Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu
165 170 175
Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu
180 185 190
Val Pro Leu Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu
195 200 205
Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg
210 215 220
Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe
225 230 235 240
Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr
245 250 255
Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser
260 265 270
Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly
275 280 285
Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly
290 295 300
Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val
305 310 315 320
Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile
325 330 335
Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln
340 345 350
Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly
355 360 365
Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr
370 375 380
Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val
385 390 395 400
Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe
405 410 415
Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His
420 425 430
Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser
435 440 445
Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg
450 455 460
Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val
465 470 475 480
Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu
485 490 495
Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe
500 505 510
Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly
515 520 525
Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val
530 535 540
Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser
545 550 555 560
Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly
565 570 575
Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly
580 585 590
Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg
595 600 605
Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu
610 615 620
Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro
625 630 635 640
Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu
645 650 655
Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg
660 665 670
Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser
675 680 685
Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala
690 695 700
Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly
705 710 715 720
Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser
725 730 735
Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile
740 745 750
Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro
755 760 765
Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Val Glu Ala Leu Gly
770 775 780
Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser
785 790 795 800
Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val
805 810 815
His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr
820 825 830
Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr
835 840 845
Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser
850 855 860
Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala
865 870 875 880
Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly
885 890 895
Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala
900 905 910
Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr
915 920 925
Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly
930 935 940
Glu Gln Phe Leu Val Ser Trp Cys
945 950
<210> 11
<211> 3837
<212> DNA
<213> Homo sapiens
<400> 11
gccccgcgac gagctcccgc cggtcacgtg acccgcctct gcgcgccccc gggcacgacc 60
ccggagtctc cgcgggcggc cagggcgcgc gtgcgcggag gtgagccggg ccggggctgc 120
ggggcttccc tgagcgcggg ccgggtcggt ggggcggtcg gctgcccgcg cggcctctca 180
gttgggaaag ctgaggttgt cgccggggcc gcgggtggag gtcggggatg aggcagcagg 240
taggacagtg acctcggtga cgcgaaggac cccggccacc tctaggttct cctcgtccgc 300
ccgttgttca gcgagggagg ctctgcgcgt gccgcagctg acggggaaac tgaggcacgg 360
agcgggcctg taggagctgt ccaggccatc tccaaccatg ggagtgaggc acccgccctg 420
ctcccaccgg ctcctggccg tctgcgccct cgtgtccttg gcaaccgctg cactcctggg 480
gcacatccta ctccatgatt tcctgctggt tccccgagag ctgagtggct cctccccagt 540
cctggaggag actcacccag ctcaccagca gggagccagc agaccagggc cccgggatgc 600
ccaggcacac cccggccgtc ccagagcagt gcccacacag tgcgacgtcc cccccaacag 660
ccgcttcgat tgcgcccctg acaaggccat cacccaggaa cagtgcgagg cccgcggctg 720
ttgctacatc cctgcaaagc aggggctgca gggagcccag atggggcagc cctggtgctt 780
cttcccaccc agctacccca gctacaagct ggagaacctg agctcctctg aaatgggcta 840
cacggccacc ctgacccgta ccacccccac cttcttcccc aaggacatcc tgaccctgcg 900
gctggacgtg atgatggaga ctgagaaccg cctccacttc acgatcaaag atccagctaa 960
caggcgctac gaggtgccct tggagacccc gcatgtccac agccgggcac cgtccccact 1020
ctacagcgtg gagttctccg aggagccctt cggggtgatc gtgcgccggc agctggacgg 1080
ccgcgtgctg ctgaacacga cggtggcgcc cctgttcttt gcggaccagt tccttcagct 1140
gtccacctcg ctgccctcgc agtatatcac aggcctcgcc gagcacctca gtcccctgat 1200
gctcagcacc agctggacca ggatcaccct gtggaaccgg gaccttgcgc ccacgcccgg 1260
tgcgaacctc tacgggtctc accctttcta cctggcgctg gaggacggcg ggtcggcaca 1320
cggggtgttc ctgctaaaca gcaatgccat ggatgtggtc ctgcagccga gccctgccct 1380
tagctggagg tcgacaggtg ggatcctgga tgtctacatc ttcctgggcc cagagcccaa 1440
gagcgtggtg cagcagtacc tggacgttgt gggatacccg ttcatgccgc catactgggg 1500
cctgggcttc cacctgtgcc gctggggcta ctcctccacc gctatcaccc gccaggtggt 1560
ggagaacatg accagggccc acttccccct ggacgtccag tggaacgacc tggactacat 1620
ggactcccgg agggacttca cgttcaacaa ggatggcttc cgggacttcc cggccatggt 1680
gcaggagctg caccagggcg gccggcgcta catgatgatc gtggatcctg ccatcagcag 1740
ctcgggccct gccgggagct acaggcccta cgacgagggt ctgcggaggg gggttttcat 1800
caccaacgag accggccagc cgctgattgg gaaggtatgg cccgggtcca ctgccttccc 1860
cgacttcacc aaccccacag ccctggcctg gtgggaggac atggtggctg agttccatga 1920
ccaggtgccc ttcgacggca tgtggattga catgaacgag ccttccaact tcatcagggg 1980
ctctgaggac ggctgcccca acaatgagct ggagaaccca ccctacgtgc ctggggtggt 2040
tggggggacc ctccaggcgg ccaccatctg tgcctccagc caccagtttc tctccacaca 2100
ctacaacctg cacaacctct acggcctgac cgaagccatc gcctcccaca gggcgctggt 2160
gaaggctcgg gggacacgcc catttgtgat ctcccgctcg acctttgctg gccacggccg 2220
atacgccggc cactggacgg gggacgtgtg gagctcctgg gagcagctcg cctcctccgt 2280
gccagaaatc ctgcagttta acctgctggg ggtgcctctg gtcggggccg acgtctgcgg 2340
cttcctgggc aacacctcag aggagctgtg tgtgcgctgg acccagctgg gggccttcta 2400
ccccttcatg cggaaccaca acagcctgct cagtctgccc caggagccgt acagcttcag 2460
cgagccggcc cagcaggcca tgaggaaggc cctcaccctg cgctacgcac tcctccccca 2520
cctctacaca ctgttccacc aggcccacgt cgcgggggag accgtggccc ggcccctctt 2580
cctggagttc cccaaggact ctagcacctg gactgtggac caccagctcc tgtgggggga 2640
ggccctgctc atcaccccag tgctccaggc cgggaaggcc gaagtgactg gctacttccc 2700
cttgggcaca tggtacgacc tgcagacggt gccagtagag gcccttggca gcctcccacc 2760
cccacctgca gctccccgtg agccagccat ccacagcgag gggcagtggg tgacgctgcc 2820
ggcccccctg gacaccatca acgtccacct ccgggctggg tacatcatcc ccctgcaggg 2880
ccctggcctc acaaccacag agtcccgcca gcagcccatg gccctggctg tggccctgac 2940
caagggtggg gaggcccgag gggagctgtt ctgggacgat ggagagagcc tggaagtgct 3000
ggagcgaggg gcctacacac aggtcatctt cctggccagg aataacacga tcgtgaatga 3060
gctggtacgt gtgaccagtg agggagctgg cctgcagctg cagaaggtga ctgtcctggg 3120
cgtggccacg gcgccccagc aggtcctctc caacggtgtc cctgtctcca acttcaccta 3180
cagccccgac accaaggtcc tggacatctg tgtctcgctg ttgatgggag agcagtttct 3240
cgtcagctgg tgttagccgg gcggagtgtg ttagtctctc cagagggagg ctggttcccc 3300
agggaagcag agcctgtgtg cgggcagcag ctgtgtgcgg gcctgggggt tgcatgtgtc 3360
acctggagct gggcactaac cattccaagc cgccgcatcg cttgtttcca cctcctgggc 3420
cggggctctg gcccccaacg tgtctaggag agctttctcc ctagatcgca ctgtgggccg 3480
gggccctgga gggctgctct gtgttaataa gattgtaagg tttgccctcc tcacctgttg 3540
ccggcatgcg ggtagtatta gccacccccc tccatctgtt cccagcaccg gagaaggggg 3600
tgctcaggtg gaggtgtggg gtatgcacct gagctcctgc ttcgcgcctg ctgctctgcc 3660
ccaacgcgac cgctgcccgg ctgcccagag ggctggatgc ctgccggtcc ccgagcaagc 3720
ctgggaactc aggaaaattc acaggacttg ggagattcta aatcttaagt gcaattattt 3780
ttaataaaag gggcatttgg aatcagcaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 3837
<210> 12
<211> 349
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
TTR Promoter (trunc) sequence
<400> 12
tcgagcttgg gctgcaggtc gagggcactg ggaggatgtt gagtaagatg gaaaactact 60
gatgaccctt gcagagacag agtattagga catgtttgaa caggggccgg gcgatcagca 120
ggtagctcta gaggatcccc gtctgtctgc acatttcgta gagcgagtgt tccgatactc 180
taatctccct aggcaaggtt catatttgtg taggttactt attctccttt tgttgactaa 240
gtcaataatc agaatcagca ggtttggagt cagcttggca gggatcagca gcctgggttg 300
gaaggagggg gtataaaagc cccttcacca ggagaagccg tcacacaga 349
<210> 13
<211> 85
<212> DNA
<213> Mouse parvovirus
<400> 13
ctagccctaa ggtaagttgg cgccgtttaa gggatggttg gttggtgggg tattaatgtt 60
taattacctt ttttacaggc ctgaa 85
<210> 14
<211> 441
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 14
gtacacatat tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt 60
cttttaatat acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca 120
gggcaataat gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata 180
atttctgggt taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt 240
aactgatgta agaggtttca tattgctaat agcagctaca atccagctac cattctgctt 300
ttattttctg gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa 360
tcttgttcat acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc 420
tggcccatca ctttggcaaa g 441
<210> 15
<211> 196
<212> DNA
<213> Homo sapiens
<400> 15
gatctgtggc ttctagctgc ccgggtggca tccctgtgac ccctccccag tgcctctcct 60
ggccctggaa gttgccactc cagtgcccac cagccttgtc ctaataaaat taagttgcat 120
cattttgtct gactaggtgt ccttctataa tattatgggg tggagggggg tggtatggag 180
caaggggcaa gttggg 196
<210> 16
<211> 251
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 16
aaggccgacc cgcgaatagt agatcccgcg agggcttgaa tctatcacct agagtacacc 60
ctagagaata gctagctctc aatgactaag gactaaactt ggtatttcga ctgaagcctg 120
tcccctcact gttggcgcta ggaggagagt tcgtagaaag gatagtacga tttaagtatc 180
tctaagcctt gtgaagcact aaggttgcgt acagacgtgc ttgaattacg gataattcgg 240
gaaccttggg a 251
<210> 17
<211> 72
<212> DNA
<213> Homo sapiens
<400> 17
atgccgtctt ctgtctcgtg gggcatcctc ctgctggcag gcctgtgctg cctggtccct 60
gtctccctgg ct 72
<210> 18
<211> 32
<212> PRT
<213> Rattus norvegicus
<400> 18
Met Leu Arg Gly Pro Gly Pro Gly Arg Leu Leu Leu Leu Ala Val Leu
1 5 10 15
Cys Leu Gly Thr Ser Val Arg Cys Thr Glu Thr Gly Lys Ser Lys Arg
20 25 30
<210> 19
<211> 38
<212> PRT
<213> Rattus norvegicus
<400> 19
Met Leu Arg Gly Pro Gly Pro Gly Arg Leu Leu Leu Leu Ala Val Leu
1 5 10 15
Cys Leu Gly Thr Ser Val Arg Cys Thr Glu Thr Gly Lys Ser Lys Arg
20 25 30
Leu Ala Leu Gln Ile Val
35
<210> 20
<211> 26
<212> PRT
<213> Homo sapiens
<400> 20
Met Leu Arg Gly Pro Gly Pro Gly Leu Leu Leu Leu Ala Val Gln Cys
1 5 10 15
Leu Gly Thr Ala Val Pro Ser Thr Gly Ala
20 25
<210> 21
<211> 31
<212> PRT
<213> Xenopus laevis
<400> 21
Met Arg Arg Gly Ala Leu Thr Gly Leu Leu Leu Val Leu Cys Leu Ser
1 5 10 15
Val Val Leu Arg Ala Ala Pro Ser Ala Thr Ser Lys Lys Arg Arg
20 25 30
<210> 22
<211> 72
<212> DNA
<213> Homo sapiens
<400> 22
atgggaatcc caatggggaa gtcgatgctg gtgcttctca ccttcttggc cttcgcctcg 60
tgctgcattg ct 72
<210> 23
<211> 96
<212> DNA
<213> Rattus norvegicus
<400> 23
atgctcaggg gtccgggacc cgggcggctg ctgctgctag cagtcctgtg cctggggaca 60
tcggtgcgct gcaccgaaac cgggaagagc aagagg 96
<210> 24
<211> 114
<212> DNA
<213> Rattus norvegicus
<400> 24
atgctcaggg gtccgggacc cgggcggctg ctgctgctag cagtcctgtg cctggggaca 60
tcggtgcgct gcaccgaaac cgggaagagc aagaggcagg ctcagcaaat cgtg 114
<210> 25
<211> 78
<212> DNA
<213> Homo sapiens
<400> 25
atgcttaggg gtccggggcc cgggctgctg ctgctggccg tccagtgcct ggggacagcg 60
gtgccctcca cgggagcc 78
<210> 26
<211> 93
<212> DNA
<213> Xenopus laevis
<400> 26
atgcgccggg gggccctgac cgggctgctc ctggtcctgt gcctgagtgt tgtgctacgt 60
gcagccccct ctgcaacaag caagaagcgc agg 93
<210> 27
<211> 17
<212> PRT
<213> Rattus norvegicus
<400> 27
Met Thr Pro Leu Leu Leu Leu Ala Val Leu Cys Leu Gly Thr Ala Leu
1 5 10 15
Ala
<210> 28
<211> 22
<212> PRT
<213> Homo sapiens
<400> 28
Met Leu Ser Phe Val Asp Thr Arg Thr Leu Leu Leu Leu Ala Val Thr
1 5 10 15
Leu Cys Leu Ala Thr Cys
20
<210> 29
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 29
Met Trp Trp Arg Leu Trp Trp Leu Leu Leu Leu Leu Leu Leu Leu Trp
1 5 10 15
Pro Met Val Trp Ala
20
<210> 30
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 30
ggcgcgccg 9
<210> 31
<211> 3
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 31
Gly Ala Pro
1
<210> 32
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 32
Gly Gly Gly Gly Gly Pro
1 5
<210> 33
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 33
Gly Gly Gly Gly Ser
1 5
<210> 34
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 34
Glu Ala Ala Ala Lys
1 5
<210> 35
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 35
Gly Gly Gly Thr Val Gly Asp Asp Asp Asp Lys
1 5 10
<210> 36
<211> 167
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 36
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
caatttgata aaaatcgtca aattataaac aggctttgcc tgtttagcct cagtgagcga 120
gcgagcgcgc agagagggag tggccaactc catcactagg ggttcct 167
<210> 37
<211> 143
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 37
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
gataaaaatc caggctttgc ctgcctcagt gagcgagcga gcgcgcagag agggagtggc 120
caactccatc actaggggtt cct 143
<210> 38
<211> 143
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 38
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
gataaaaatc caggctttgc ctgcctcagt gagcgagcga gcgcgcagag agggagtggc 120
caactccatc actaggggtt cct 143
<210> 39
<211> 208
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 39
aggaacccct agtgatggag ttggccactc cctctctggg attgggattg cgcgctcgct 60
cgcgggattg ggattgggat tgggattggg attgggattg ataaaaatca atcccaatcc 120
caatcccaat cccaatccca atcccgcgag cgagcgcgca atcccaatcc cagagaggga 180
gtggccaact ccatcactag gggttcct 208
<210> 40
<211> 199
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 40
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcgggattg 60
ggattgggat tgggattggg attgggattg ataaaaatca atcccaatcc caatcccaat 120
cccaatccca atcccgcgag cgagcgcgca ggagagggag tggccaactc catcactagg 180
ggttcctaag cttattata 199
<210> 41
<211> 154
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 41
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
gcgcctataa agataaaaat ccaggctttg cctgcctcag ttagcgagcg agcgcgcaga 120
gagggagtgg ccaactccat cactaggggt tcct 154
<210> 42
<211> 127
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 42
ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga gggataaaaa 60
tccaggcttt gcctgcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120
tcactag 127
<210> 43
<211> 2208
<212> DNA
<213> Adeno-associated virus 3B
<400> 43
atggctgctg acggttatct tccagattgg ctcgaggaca acctttctga aggcattcgt 60
gagtggtggg ctctgaaacc tggagtccct caacccaaag cgaaccaaca acaccaggac 120
aaccgtcggg gtcttgtgct tccgggttac aaatacctcg gacccggtaa cggactcgac 180
aaaggagagc cggtcaacga ggcggacgcg gcagccctcg aacacgacaa agcttacgac 240
cagcagctca aggccggtga caacccgtac ctcaagtaca accacgccga cgccgagttt 300
caggagcgtc ttcaagaaga tacgtctttt gggggcaacc ttggcagagc agtcttccag 360
gccaaaaaga ggatccttga gcctcttggt ctggttgagg aagcagctaa aacggctcct 420
ggaaagaaga ggcctgtaga tcagtctcct caggaaccgg actcatcatc tggtgttggc 480
aaatcgggca aacagcctgc cagaaaaaga ctaaatttcg gtcagactgg cgactcagag 540
tcagtcccag accctcaacc tctcggagaa ccaccagcag cccccacaag tttgggatct 600
aatacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaggg tgccgatgga 660
gtgggtaatt cctcaggaaa ttggcattgc gattcccaat ggctgggcga cagagtcatc 720
accaccagca ccagaacctg ggccctgccc acttacaaca accatctcta caagcaaatc 780
tccagccaat caggagcttc aaacgacaac cactactttg gctacagcac cccttggggg 840
tattttgact ttaacagatt ccactgccac ttctcaccac gtgactggca gcgactcatt 900
aacaacaact ggggattccg gcccaagaaa ctcagcttca agctcttcaa catccaagtt 960
aaagaggtca cgcagaacga tggcacgacg actattgcca ataaccttac cagcacggtt 1020
caagtgttta cggactcgga gtatcagctc ccgtacgtgc tcgggtcggc gcaccaaggc 1080
tgtctcccgc cgtttccagc ggacgtcttc atggtccctc agtatggata cctcaccctg 1140
aacaacggaa gtcaagcggt gggacgctca tccttttact gcctggagta cttcccttcg 1200
cagatgctaa ggactggaaa taacttccaa ttcagctata ccttcgagga tgtacctttt 1260
cacagcagct acgctcacag ccagagtttg gatcgcttga tgaatcctct tattgatcag 1320
tatctgtact acctgaacag aacgcaagga acaacctctg gaacaaccaa ccaatcacgg 1380
ctgcttttta gccaggctgg gcctcagtct atgtctttgc aggccagaaa ttggctacct 1440
gggccctgct accggcaaca gagactttca aagactgcta acgacaacaa caacagtaac 1500
tttccttgga cagcggccag caaatatcat ctcaatggcc gcgactcgct ggtgaatcca 1560
ggaccagcta tggccagtca caaggacgat gaagaaaaat ttttccctat gcacggcaat 1620
ctaatatttg gcaaagaagg gacaacggca agtaacgcag aattagataa tgtaatgatt 1680
acggatgaag aagagattcg taccaccaat cctgtggcaa cagagcagta tggaactgtg 1740
gcaaataact tgcagagctc aaatacagct cccacgacta gaactgtcaa tgatcagggg 1800
gccttacctg gcatggtgtg gcaagatcgt gacgtgtacc ttcaaggacc tatctgggca 1860
aagattcctc acacggatgg acactttcat ccttctcctc tgatgggagg ctttggactg 1920
aaacatccgc ctcctcaaat catgatcaaa aatactccgg taccggcaaa tcctccgacg 1980
actttcagcc cggccaagtt tgcttcattt atcactcagt actccactgg acaggtcagc 2040
gtggaaattg agtgggagct acagaaagaa aacagcaaac gttggaatcc agagattcag 2100
tacacttcca actacaacaa gtctgttaat gtggacttta ctgtagacac taatggtgtt 2160
tatagtgaac ctcgccctat tggaacccgg tatctcacac gaaacttg 2208
<210> 44
<211> 736
<212> PRT
<213> Adeno-associated virus 3B
<400> 44
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 45
<211> 2208
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 45
atggctgctg acggttatct tccagattgg ctcgaggaca acctttctga aggcattcgt 60
gagtggtggg ctctgaaacc tggagtccct caacccaaag cgaaccaaca acaccaggac 120
aaccgtcggg gtcttgtgct tccgggttac aaatacctcg gacccggtaa cggactcgac 180
aaaggagagc cggtcaacga ggcggacgcg gcagccctcg aacacgacaa agcttacgac 240
cagcagctca aggccggtga caacccgtac ctcaagtaca accacgccga cgccgagttt 300
caggagcgtc ttcaagaaga tacgtctttt gggggcaacc ttggcagagc agtcttccag 360
gccaaaaaga ggatccttga gcctcttggt ctggttgagg aagcagctaa aacggctcct 420
ggaaagaaga ggcctgtaga tcagtctcct caggaaccgg actcatcatc tggtgttggc 480
aaatcgggca aacagcctgc cagaaaaaga ctaaatttcg gtcagactgg cgactcagag 540
tcagtcccag accctcaacc tctcggagaa ccaccagcag cccccacaag tttgggatct 600
aatacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaggg tgccgatgga 660
gtgggtaatt cctcaggaaa ttggcattgc gattcccaat ggctgggcga cagagtcatc 720
accaccagca ccagaacctg ggccctgccc acttacaaca accatctcta caagcaaatc 780
tccagccaat cagatgcttc aaacgacaac cactactttg gctacagcac cccttggggg 840
tattttgact ttaacagatt ccactgccac ttctcaccac gtgactggca gcgactcatt 900
aacaacaact ggggattccg gcccaagaaa ctcagcttca agctcttcaa catccaagtt 960
aaagaggtca cgcagaacga tggcacgacg actattgcca ataaccttac cagcacggtt 1020
caagtgttta cggactcgga gtatcagctc ccgtacgtgc tcgggtcggc gcaccaaggc 1080
tgtctcccgc cgtttccagc ggacgtcttc atggtccctc agtatggata cctcaccctg 1140
aacaacggaa gtcaagcggt gggacgctca tccttttact gcctggagta cttcccttcg 1200
cagatgctaa ggactggaaa taacttccaa ttcagctata ccttcgagga tgtacctttt 1260
cacagcagct acgctcacag ccagagtttg gatcgcttga tgaatcctct tattgatcag 1320
tatctgtact acctgaacag aacgcaagga acaacctctg gaacaaccaa ccaatcacgg 1380
ctgcttttta gccaggctgg gcctcagtct atgtctttgc aggccagaaa ttggctacct 1440
gggccctgct accggcaaca gagactttca aagactgcta acgacaacaa caacagtaac 1500
tttccttgga cagcggccag caaatatcat ctcaatggcc gcgactcgct ggtgaatcca 1560
ggaccagcta tggccagtca caaggacgat gaagaaaaat ttttccctat gcacggcaat 1620
ctaatatttg gcaaagaagg gacaacggca agtaacgcag aattagataa tgtaatgatt 1680
acggatgaag aagagattcg taccaccaat cctgtggcaa cagagcagta tggaactgtg 1740
gcaaataact tgcagagctc aaatacagct cccacgacta gaactgtcaa tgatcagggg 1800
gccttacctg gcatggtgtg gcaagatcgt gacgtgtacc ttcaaggacc tatctgggca 1860
aagattcctc acacggatgg acactttcat ccttctcctc tgatgggagg ctttggactg 1920
aaacatccgc ctcctcaaat catgatcaaa aatactccgg taccggcaaa tcctccgacg 1980
actttcagcc cggccaagtt tgcttcattt atcactcagt actccactgg acaggtcagc 2040
gtggaaattg agtgggagct acagaaagaa aacagcaaac gttggaatcc agagattcag 2100
tacacttcca actacaacaa gtctgttaat gtggacttta ctgtagacac taatggtgtt 2160
tatagtgaac ctcgccctat tggaacccgg tatctcacac gaaacttg 2208
<210> 46
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 46
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Asp Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 47
<211> 2208
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 47
atggctgctg acggttatct tccagattgg ctcgaggaca acctttctga aggcattcgt 60
gagtggtggg ctctgaaacc tggagtccct caacccaaag cgaaccaaca acaccaggac 120
aaccgtcggg gtcttgtgct tccgggttac aaatacctcg gacccggtaa cggactcgac 180
aaaggagagc cggtcaacga ggcggacgcg gcagccctcg aacacgacaa agcttacgac 240
cagcagctca aggccggtga caacccgtac ctcaagtaca accacgccga cgccgagttt 300
caggagcgtc ttcaagaaga tacgtctttt gggggcaacc ttggcagagc agtcttccag 360
gccaaaaaga ggatccttga gcctcttggt ctggttgagg aagcagctaa aacggctcct 420
ggaaagaaga ggcctgtaga tcagtctcct caggaaccgg actcatcatc tggtgttggc 480
aaatcgggca aacagcctgc cagaaaaaga ctaaatttcg gtcagactgg cgactcagag 540
tcagtcccag accctcaacc tctcggagaa ccaccagcag cccccacaag tttgggatct 600
aatacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaggg tgccgatgga 660
gtgggtaatt cctcaggaaa ttggcattgc gattcccaat ggctgggcga cagagtcatc 720
accaccagca ccagaacctg ggccctgccc acttacaaca accatctcta caagcaaatc 780
tccagccaat cagatgcttc aaacgacaac cactactttg gctacagcac cccttggggg 840
tattttgact ttaacagatt ccactgccac ttctcaccac gtgactggca gcgactcatt 900
aacaacaact ggggattccg gcccaagaaa ctcagcttca agctcttcaa catccaagtt 960
aaagaggtca cgcagaacga tggcacgacg actattgcca ataaccttac cagcacggtt 1020
caagtgttta cggactcgga gtatcagctc ccgtacgtgc tcgggtcggc gcaccaaggc 1080
tgtctcccgc cgtttccagc ggacgtcttc atggtccctc agtatggata cctcaccctg 1140
aacaacggaa gtcaagcggt gggacgctca tccttttact gcctggagta cttcccttcg 1200
cagatgctaa ggactggaaa taacttccaa ttcagctata ccttcgagga tgtacctttt 1260
cacagcagct acgctcacag ccagagtttg gatcgcttga tgaatcctct tattgatcag 1320
tatctgtact acctgaacag aacgcaagga acaacctctg gaacaaccaa ccaatcacgg 1380
ctgcttttta gccaggctgg gcctcagtct atgtctttgc aggccagaaa ttggctacct 1440
gggccctgct accggcaaca gagactttca aaggtagcta acgacaacaa caacagtaac 1500
tttccttgga cagcggccag caaatatcat ctcaatggcc gcgactcgct ggtgaatcca 1560
ggaccagcta tggccagtca caaggacgat gaagaaaaat ttttccctat gcacggcaat 1620
ctaatatttg gcaaagaagg gacaacggca agtaacgcag aattagataa tgtaatgatt 1680
acggatgaag aagagattcg taccaccaat cctgtggcaa cagagcagta tggaactgtg 1740
gcaaataact tgcagagctc aaatacagct cccacgacta gaactgtcaa tgatcagggg 1800
gccttacctg gcatggtgtg gcaagatcgt gacgtgtacc ttcaaggacc tatctgggca 1860
aagattcctc acacggatgg acactttcat ccttctcctc tgatgggagg ctttggactg 1920
aaacatccgc ctcctcaaat catgatcaaa aatactccgg taccggcaaa tcctccgacg 1980
actttcgtac cggccaagtt tgcttcattt atcactcagt actccactgg acaggtcagc 2040
gtggaaattg agtgggagct acagaaagaa aacagcaaac gttggaatcc agagattcag 2100
tacacttcca actacaacaa gtctgttaat gtggacttta ctgtagacac taatggtgtt 2160
tatagtgaac ctcgccctat tggaacccgg tatctcacac gaaacttg 2208
<210> 48
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 48
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Val Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Val Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 49
<211> 2134
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 49
gaaacctgga gtccctcaac ccaaagcgaa ccaacaacac caggacaacc gtcggggtct 60
tgtgcttccg ggttacaaat acctcggacc cggtaacgga ctcgacaaag gagagccggt 120
caacgaggcg gacgcggcag ccctcgaaca cgacaaagct tacgaccagc agctcaaggc 180
cggtgacaac ccgtacctca agtacaacca cgccgacgcc gagtttcagg agcgtcttca 240
agaagatacg tcttttgggg gcaaccttgg cagagcagtc ttccaggcca aaaagaggat 300
ccttgagcct cttggtctgg ttgaggaagc agctaaaacg gctcctggaa agaagaggcc 360
tgtagatcag tctcctcagg aaccggactc atcatctggt gttggcaaat cgggcaaaca 420
gcctgccaga aaaagactaa atttcggtca gactggcgac tcagagtcag tcccagaccc 480
tcaacctctc ggagaaccac cagcagcccc cacaagtttg ggatctaata caatggcttc 540
aggcggtggc gcaccaatgg cagacaataa cgagggtgcc gatggagtgg gtaattcctc 600
aggaaattgg cattgcgatt cccaatggct gggcgacaga gtcatcacca ccagcaccag 660
aacctgggcc ctgcccactt acaacaacca tctctacaag caaatctcca gccaatcagg 720
agcttcaaac gacaaccact actttggcta cagcacccct tgggggtatt ttgactttaa 780
cagattccac tgccacttct caccacgtga ctggcagcga ctcattaaca acaactgggg 840
attccggccc aagaaactca gcttcaagct cttcaacatc caagttaaag aggtcacgca 900
gaacgatggc acgacgacta ttgccaataa ccttaccagc acggttcaag tgtttacgga 960
ctcggagtat cagctcccgt acgtgctcgg gtcggcgcac caaggctgtc tcccgccgtt 1020
tccagcggac gtcttcatgg tccctcagta tggatacctc accctgaaca acggaagtca 1080
agcggtggga cgctcatcct tttactgcct ggagtacttc ccttcgcaga tgctaaggac 1140
tggaaataac ttccaattca gctatacctt cgaggatgta ccttttcaca gcagctacgc 1200
tcacagccag agtttggatc gcttgatgaa tcctcttatt gatcagtatc tgtactacct 1260
gaacagaacg caaggaacaa cctctggaac aaccaaccaa tcacggctgc tttttagcca 1320
ggctgggcct cagtctatgt ctttgcaggc cagaaattgg ctacctgggc cctgctaccg 1380
gcaacagaga ctttcaaaga ctgctaacga caacaacaac agtaactttc cttggacagc 1440
ggccagcaaa tatcatctca atggccgcga ctcgctggtg aatccaggac cagctatggc 1500
cagtcacaag gacgatgaag aaaaattttt ccctatgcac ggcaatctaa tatttggcaa 1560
agaagggaca acggcaagta acgcagaatt agataatgta atgattacgg atgaagaaga 1620
gattcgtacc accaatcctg tggcaacaga gcagtatgga actgtggcaa ataacttgca 1680
gagctcaaat acagctccca cgactagaac tgtcaatgat cagggggcct tacctggcat 1740
ggtgtggcaa gatcgtgacg tgtaccttca aggacctatc tgggcaaaga ttcctcacac 1800
ggatggacac tttcatcctt ctcctctgat gggaggcttt ggactgaaac atccgcctcc 1860
tcaaatcatg atcaaaaata ctccggtacc ggcaaatcct ccgacgactt tcagcccggc 1920
caagtttgct tcatttatca ctcagtactc cactggacag gtcagcgtgg aaattgagtg 1980
ggagctacag aaagaaaaca gcaaacgttg gaatccagag attcagtaca cttccaacta 2040
caacaagtct gttaatgtgg actttactgt agacactaat ggtgtttata gtgaacctcg 2100
ccctattgga acccggtatc tcacacgaaa cttg 2134
<210> 50
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 50
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Asp Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Ala Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 51
<211> 2208
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 51
atggctgctg acggttatct tccagattgg ctcgaggaca acctttctga aggcattcgt 60
gagtggtggg ctctgaaacc tggagtccct caacccaaag cgaaccaaca acaccaggac 120
aaccgtcggg gtcttgtgct tccgggttac aaatacctcg gacccggtaa cggactcgac 180
aaaggagagc cggtcaacga ggcggacgcg gcagccctcg aacacgacaa agcttacgac 240
cagcagctca aggccggtga caacccgtac ctcaagtaca accacgccga cgccgagttt 300
caggagcgtc ttcaagaaga tacgtctttt gggggcaacc ttggcagagc agtcttccag 360
gccaaaaaga ggatccttga gcctcttggt ctggttgagg aagcagctaa aacggctcct 420
ggaaagaaga ggcctgtaga tcagtctcct caggaaccgg actcatcatc tggtgttggc 480
aaatcgggca aacagcctgc cagaaaaaga ctaaatttcg gtcagactgg cgactcagag 540
tcagtcccag accctcaacc tctcggagaa ccaccagcag cccccacaag tttgggatct 600
aatacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaggg tgccgatgga 660
gtgggtaatt cctcaggaaa ttggcattgc gattcccaat ggctgggcga cagagtcatc 720
accaccagca ccagaacctg ggccctgccc acttacaaca accatctcta caagcaaatc 780
tccagccaat caggagcttc aaacgacaac cactactttg gctacagcac cccttggggg 840
tattttgact ttaacagatt ccactgccac ttctcaccac gtgactggca gcgactcatt 900
aacaacaact ggggattccg gcccaagaaa ctcagcttca agctcttcaa catccaagtt 960
aaagaggtca cgcagaacga tggcacgacg actattgcca ataaccttac cagcacggtt 1020
caagtgttta cggactcgga gtatcagctc ccgtacgtgc tcgggtcggc gcaccaaggc 1080
tgtctcccgc cgtttccagc ggacgtcttc atggtccctc agtatggata cctcaccctg 1140
aacaacggaa gtcaagcggt gggacgctca tccttttact gcctggagta cttcccttcg 1200
cagatgctaa ggactggaaa taacttccaa ttcagctata ccttcgagga tgtacctttt 1260
cacagcagct acgctcacag ccagagtttg gatcgcttga tgaatcctct tattgatcag 1320
tatctgtact acctgaacag aacgcaagga acaacctctg gaacaaccaa ccaatcacgg 1380
ctgcttttta gccaggctgg gcctcagtct atgtctttgc aggccagaaa ttggctacct 1440
gggccctgct accggcaaca gagactttca aagactgcta acgacaacaa caacagtaac 1500
tttccttgga cagcggccag caaatatcat ctcaatggcc gcgactcgct ggtgaatcca 1560
ggaccagcta tggccagtca caaggacgat gaagaaaaat ttttccctat gcacggcaat 1620
ctaatatttg gcaaagaagg gacaacggca agtaacgcag aattagataa tgtaatgatt 1680
acggatgaag aagagattcg taccaccaat cctgtggcaa cagagcagta tggaactgtg 1740
gcaaataact tgcagagctc aaatacagct cccacgacta gaactgtcaa tgatcagggg 1800
gccttacctg gcatggtgtg gcaagatcgt gacgtgtacc ttcaaggacc tatctgggca 1860
aagattcctc acacggatgg acactttcat ccttctcctc tgatgggagg ctttggactg 1920
aaacatccgc ctcctcaaat catgatcaaa aatactccgg taccggcaaa tcctccgacg 1980
actttcagcc cggccaagtt tgcttcattt atcactcagt actccactgg acaggtcagc 2040
gtggaaattg agtgggagct acagaaagaa aacagcaaac gttggaatcc agagattcag 2100
tacacttcca actacaacaa gtctgttaat gtggacttta ctgtagacac taatggtgtt 2160
tatagtgaac ctcgccctat tggaacccgg tatctcacac gaaacttg 2208
<210> 52
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 52
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Ala Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 53
<211> 2208
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 53
atggctgctg acggttatct tccagattgg ctcgaggaca acctttctga aggcattcgt 60
gagtggtggg ctctgaaacc tggagtccct caacccaaag cgaaccaaca acaccaggac 120
aaccgtcggg gtcttgtgct tccgggttac aaatacctcg gacccggtaa cggactcgac 180
aaaggagagc cggtcaacga ggcggacgcg gcagccctcg aacacgacaa agcttacgac 240
cagcagctca aggccggtga caacccgtac ctcaagtaca accacgccga cgccgagttt 300
caggagcgtc ttcaagaaga tacgtctttt gggggcaacc ttggcagagc agtcttccag 360
gccaaaaaga ggatccttga gcctcttggt ctggttgagg aagcagctaa aacggctcct 420
ggaaagaaga ggcctgtaga tcagtctcct caggaaccgg actcatcatc tggtgttggc 480
aaatcgggca aacagcctgc cagaaaaaga ctaaatttcg gtcagactgg cgactcagag 540
tcagtcccag accctcaacc tctcggagaa ccaccagcag cccccacaag tttgggatct 600
aatacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaggg tgccgatgga 660
gtgggtaatt cctcaggaaa ttggcattgc gattcccaat ggctgggcga cagagtcatc 720
accaccagca ccagaacctg ggccctgccc acttacaaca accatctcta caagcaaatc 780
tccagccaat caggagcttc aaacgacaac cactactttg gctacagcac cccttggggg 840
tattttgact ttaacagatt ccactgccac ttctcaccac gtgactggca gcgactcatt 900
aacaacaact ggggattccg gcccaagaaa ctcagcttca agctcttcaa catccaagtt 960
aaagaggtca cgcagaacga tggcacgacg actattgcca ataaccttac cagcacggtt 1020
caagtgttta cggactcgga gtatcagctc ccgtacgtgc tcgggtcggc gcaccaaggc 1080
tgtctcccgc cgtttccagc ggacgtcttc atggtccctc agtatggata cctcaccctg 1140
aacaacggaa gtcaagcggt gggacgctca tccttttact gcctggagta cttcccttcg 1200
cagatgctaa ggactggaaa taacttccaa ttcagctata ccttcgagga tgtacctttt 1260
cacagcagct acgctcacag ccagagtttg gatcgcttga tgaatcctct tattgatcag 1320
tatctgtact acctgaacag aacgcaagga acaacctctg gaacaaccaa ccaatcacgg 1380
ctgcttttta gccaggctgg gcctcagtct atgtctttgc aggccagaaa ttggctacct 1440
gggccctgct accggcaaca gagactttca aagactgcta acgacaacaa caacagtaac 1500
tttccttgga cagcggccag caaatatcat ctcaatggcc gcgactcgct ggtgaatcca 1560
ggaccagcta tggccagtca caaggacgat gaagaaaaat ttttccctat gcacggcaat 1620
ctaatatttg gcaaagaagg gacaacggca agtaacgcag aattagataa tgtaatgatt 1680
acggatgaag aagagattcg taccaccaat cctgtggcaa cagagcagta tggaactgtg 1740
gcaaataact tgcagagctc aaatacagct cccacgacta gaactgtcaa tgatcagggg 1800
gccttacctg gcatggtgtg gcaagatcgt gacgtgtacc ttcaaggacc tatctgggca 1860
aagattcctc acacggatgg acactttcat ccttctcctc tgatgggagg ctttggactg 1920
aaacatccgc ctcctcaaat catgatcaaa aatactccgg taccggcaaa tcctccgacg 1980
actttcagcc cggccaagtt tgcttcattt atcactcagt actccactgg acaggtcagc 2040
gtggaaattg agtgggagct acagaaagaa aacagcaaac gttggaatcc agagattcag 2100
tacacttcca actacaacaa gtctgttaat gtggacttta ctgtagacac taatggtgtt 2160
tatagtgaac ctcgccctat tggaacccgg tatctcacac gaaacttg 2208
<210> 54
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 54
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Tyr Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 55
<211> 2859
<212> DNA
<213> Homo sapiens
<400> 55
atgggagtga ggcacccgcc ctgctcccac cggctcctgg ccgtctgcgc cctcgtgtcc 60
ttggcaaccg ctgcactcct ggggcacatc ctactccatg atttcctgct ggttccccga 120
gagctgagtg gctcctcccc agtcctggag gagactcacc cagctcacca gcagggagcc 180
agcagaccag ggccccggga tgcccaggca caccccggcc gtcccagagc agtgcccaca 240
cagtgcgacg tcccccccaa cagccgcttc gattgcgccc ctgacaaggc catcacccag 300
gaacagtgcg aggcccgcgg ctgctgctac atccctgcaa agcaggggct gcagggagcc 360
cagatggggc agccctggtg cttcttccca cccagctacc ccagctacaa gctggagaac 420
ctgagctcct ctgaaatggg ctacacggcc accctgaccc gtaccacccc caccttcttc 480
cccaaggaca tcctgaccct gcggctggac gtgatgatgg agactgagaa ccgcctccac 540
ttcacgatca aagatccagc taacaggcgc tacgaggtgc ccttggagac cccgcgtgtc 600
cacagccggg caccgtcccc actctacagc gtggagttct ccgaggagcc cttcggggtg 660
atcgtgcacc ggcagctgga cggccgcgtg ctgctgaaca cgacggtggc gcccctgttc 720
tttgcggacc agttccttca gctgtccacc tcgctgccct cgcagtatat cacaggcctc 780
gccgagcacc tcagtcccct gatgctcagc accagctgga ccaggatcac cctgtggaac 840
cgggaccttg cgcccacgcc cggtgcgaac ctctacgggt ctcacccttt ctacctggcg 900
ctggaggacg gcgggtcggc acacggggtg ttcctgctaa acagcaatgc catggatgtg 960
gtcctgcagc cgagccctgc ccttagctgg aggtcgacag gtgggatcct ggatgtctac 1020
atcttcctgg gcccagagcc caagagcgtg gtgcagcagt acctggacgt tgtgggatac 1080
ccgttcatgc cgccatactg gggcctgggc ttccacctgt gccgctgggg ctactcctcc 1140
accgctatca cccgccaggt ggtggagaac atgaccaggg cccacttccc cctggacgtc 1200
caatggaacg acctggacta catggactcc cggagggact tcacgttcaa caaggatggc 1260
ttccgggact tcccggccat ggtgcaggag ctgcaccagg gcggccggcg ctacatgatg 1320
atcgtggatc ctgccatcag cagctcgggc cctgccggga gctacaggcc ctacgacgag 1380
ggtctgcgga ggggggtttt catcaccaac gagaccggcc agccgctgat tgggaaggta 1440
tggcccgggt ccactgcctt ccccgacttc accaacccca cagccctggc ctggtgggag 1500
gacatggtgg ctgagttcca tgaccaggtg cccttcgacg gcatgtggat tgacatgaac 1560
gagccttcca acttcatcag aggctctgag gacggctgcc ccaacaatga gctggagaac 1620
ccaccctacg tgcctggggt ggttgggggg accctccagg cggccaccat ctgtgcctcc 1680
agccaccagt ttctctccac acactacaac ctgcacaacc tctacggcct gaccgaagcc 1740
atcgcctccc acagggcgct ggtgaaggct cgggggacac gcccatttgt gatctcccgc 1800
tcgacctttg ctggccacgg ccgatacgcc ggccactgga cgggggacgt gtggagctcc 1860
tgggagcagc tcgcctcctc cgtgccagaa atcctgcagt ttaacctgct gggggtgcct 1920
ctggtcgggg ccgacgtctg cggcttcctg ggcaacacct cagaggagct gtgtgtgcgc 1980
tggacccagc tgggggcctt ctaccccttc atgcggaacc acaacagcct gctcagtctg 2040
ccccaggagc cgtacagctt cagcgagccg gcccagcagg ccatgaggaa ggccctcacc 2100
ctgcgctacg cactcctccc ccacctctac acactgttcc accaggccca cgtcgcgggg 2160
gagaccgtgg cccggcccct cttcctggag ttccccaagg actctagcac ctggactgtg 2220
gaccaccagc tcctgtgggg ggaggccctg ctcatcaccc cagtgctcca ggccgggaag 2280
gccgaagtga ctggctactt ccccttgggc acatggtacg acctgcagac ggtgccaata 2340
gaggcccttg gcagcctccc acccccacct gcagctcccc gtgagccagc catccacagc 2400
gaggggcagt gggtgacgct gccggccccc ctggacacca tcaacgtcca cctccgggct 2460
gggtacatca tccccctgca gggccctggc ctcacaacca cagagtcccg ccagcagccc 2520
atggccctgg ctgtggccct gaccaagggt ggagaggccc gaggggagct gttctgggac 2580
gatggagaga gcctggaagt gctggagcga ggggcctaca cacaggtcat cttcctggcc 2640
aggaataaca cgatcgtgaa tgagctggta cgtgtgacca gtgagggagc tggcctgcag 2700
ctgcagaagg tgactgtcct gggcgtggcc acggcgcccc agcaggtcct ctccaacggt 2760
gtccctgtct ccaacttcac ctacagcccc gacaccaagg tcctggacat ctgtgtctcg 2820
ctgttgatgg gagagcagtt tctcgtcagc tggtgttag 2859
<210> 56
<211> 2652
<212> DNA
<213> Homo sapiens
<400> 56
gcacaccccg gccgtcccag agcagtgccc acacagtgcg acgtcccccc caacagccgc 60
ttcgattgcg cccctgacaa ggccatcacc caggaacagt gcgaggcccg cggctgctgc 120
tacatccctg caaagcaggg gctgcaggga gcccagatgg ggcagccctg gtgcttcttc 180
ccacccagct accccagcta caagctggag aacctgagct cctctgaaat gggctacacg 240
gccaccctga cccgtaccac ccccaccttc ttccccaagg acatcctgac cctgcggctg 300
gacgtgatga tggagactga gaaccgcctc cacttcacga tcaaagatcc agctaacagg 360
cgctacgagg tgcccttgga gaccccgcgt gtccacagcc gggcaccgtc cccactctac 420
agcgtggagt tctccgagga gcccttcggg gtgatcgtgc accggcagct ggacggccgc 480
gtgctgctga acacgacggt ggcgcccctg ttctttgcgg accagttcct tcagctgtcc 540
acctcgctgc cctcgcagta tatcacaggc ctcgccgagc acctcagtcc cctgatgctc 600
agcaccagct ggaccaggat caccctgtgg aaccgggacc ttgcgcccac gcccggtgcg 660
aacctctacg ggtctcaccc tttctacctg gcgctggagg acggcgggtc ggcacacggg 720
gtgttcctgc taaacagcaa tgccatggat gtggtcctgc agccgagccc tgcccttagc 780
tggaggtcga caggtgggat cctggatgtc tacatcttcc tgggcccaga gcccaagagc 840
gtggtgcagc agtacctgga cgttgtggga tacccgttca tgccgccata ctggggcctg 900
ggcttccacc tgtgccgctg gggctactcc tccaccgcta tcacccgcca ggtggtggag 960
aacatgacca gggcccactt ccccctggac gtccaatgga acgacctgga ctacatggac 1020
tcccggaggg acttcacgtt caacaaggat ggcttccggg acttcccggc catggtgcag 1080
gagctgcacc agggcggccg gcgctacatg atgatcgtgg atcctgccat cagcagctcg 1140
ggccctgccg ggagctacag gccctacgac gagggtctgc ggaggggggt tttcatcacc 1200
aacgagaccg gccagccgct gattgggaag gtatggcccg ggtccactgc cttccccgac 1260
ttcaccaacc ccacagccct ggcctggtgg gaggacatgg tggctgagtt ccatgaccag 1320
gtgcccttcg acggcatgtg gattgacatg aacgagcctt ccaacttcat cagaggctct 1380
gaggacggct gccccaacaa tgagctggag aacccaccct acgtgcctgg ggtggttggg 1440
gggaccctcc aggcggccac catctgtgcc tccagccacc agtttctctc cacacactac 1500
aacctgcaca acctctacgg cctgaccgaa gccatcgcct cccacagggc gctggtgaag 1560
gctcggggga cacgcccatt tgtgatctcc cgctcgacct ttgctggcca cggccgatac 1620
gccggccact ggacggggga cgtgtggagc tcctgggagc agctcgcctc ctccgtgcca 1680
gaaatcctgc agtttaacct gctgggggtg cctctggtcg gggccgacgt ctgcggcttc 1740
ctgggcaaca cctcagagga gctgtgtgtg cgctggaccc agctgggggc cttctacccc 1800
ttcatgcgga accacaacag cctgctcagt ctgccccagg agccgtacag cttcagcgag 1860
ccggcccagc aggccatgag gaaggccctc accctgcgct acgcactcct cccccacctc 1920
tacacactgt tccaccaggc ccacgtcgcg ggggagaccg tggcccggcc cctcttcctg 1980
gagttcccca aggactctag cacctggact gtggaccacc agctcctgtg gggggaggcc 2040
ctgctcatca ccccagtgct ccaggccggg aaggccgaag tgactggcta cttccccttg 2100
ggcacatggt acgacctgca gacggtgcca atagaggccc ttggcagcct cccaccccca 2160
cctgcagctc cccgtgagcc agccatccac agcgaggggc agtgggtgac gctgccggcc 2220
cccctggaca ccatcaacgt ccacctccgg gctgggtaca tcatccccct gcagggccct 2280
ggcctcacaa ccacagagtc ccgccagcag cccatggccc tggctgtggc cctgaccaag 2340
ggtggagagg cccgagggga gctgttctgg gacgatggag agagcctgga agtgctggag 2400
cgaggggcct acacacaggt catcttcctg gccaggaata acacgatcgt gaatgagctg 2460
gtacgtgtga ccagtgaggg agctggcctg cagctgcaga aggtgactgt cctgggcgtg 2520
gccacggcgc cccagcaggt cctctccaac ggtgtccctg tctccaactt cacctacagc 2580
cccgacacca aggtcctgga catctgtgtc tcgctgttga tgggagagca gtttctcgtc 2640
agctggtgtt ag 2652
<210> 57
<211> 4573
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 57
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctgagtt taaacttcgt cgacgattcg agcttgggct 180
gcaggtcgag ggcactggga ggatgttgag taagatggaa aactactgat gacccttgca 240
gagacagagt attaggacat gtttgaacag gggccgggcg atcagcaggt agctctagag 300
gatccccgtc tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg 360
caaggttcat atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga 420
atcagcaggt ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta 480
taaaagcccc ttcaccagga gaagccgtca cacagactag ccctaaggta agttggcgcc 540
gtttaaggga tggttggttg gtggggtatt aatgtttaat tacctttttt acaggcctga 600
actaggcgcg ccaccgccac catgccgtct tctgtctcgt ggggcatcct cctgctggca 660
ggcctgtgct gcctggtccc tgtctccctg gctgcttacc gccccagtga gaccctgtgc 720
ggcggggagc tggtggacac cctccagttc gtctgtgggg accgcggctt ctacttcagc 780
aggcccgcaa gccgtgtgag ccgtcgcagc cgtggcatca tggaggagtg ctgtttccgc 840
agctgtgacc tggccctcct ggagacgtac tgtgctaccc ccgccaagtc cgagggcgcg 900
ccggcacacc ccggccgtcc cagagcagtg cccacacagt gcgacgtccc ccccaacagc 960
cgcttcgatt gcgcccctga caaggccatc acccaggaac agtgcgaggc ccgcggctgc 1020
tgctacatcc ctgcaaagca ggggctgcag ggagcccaga tggggcagcc ctggtgcttc 1080
ttcccaccca gctaccccag ctacaagctg gagaacctga gctcctctga aatgggctac 1140
acggccaccc tgacccgtac cacccccacc ttcttcccca aggacatcct gaccctgcgg 1200
ctggacgtga tgatggagac tgagaaccgc ctccacttca cgatcaaaga tccagctaac 1260
aggcgctacg aggtgccctt ggagaccccg cgtgtccaca gccgggcacc gtccccactc 1320
tacagcgtgg agttctccga ggagcccttc ggggtgatcg tgcaccggca gctggacggc 1380
cgcgtgctgc tgaacacgac ggtggcgccc ctgttctttg cggaccagtt ccttcagctg 1440
tccacctcgc tgccctcgca gtatatcaca ggcctcgccg agcacctcag tcccctgatg 1500
ctcagcacca gctggaccag gatcaccctg tggaaccggg accttgcgcc cacgcccggt 1560
gcgaacctct acgggtctca ccctttctac ctggcgctgg aggacggcgg gtcggcacac 1620
ggggtgttcc tgctaaacag caatgccatg gatgtggtcc tgcagccgag ccctgccctt 1680
agctggaggt cgacaggtgg gatcctggat gtctacatct tcctgggccc agagcccaag 1740
agcgtggtgc agcagtacct ggacgttgtg ggatacccgt tcatgccgcc atactggggc 1800
ctgggcttcc acctgtgccg ctggggctac tcctccaccg ctatcacccg ccaggtggtg 1860
gagaacatga ccagggccca cttccccctg gacgtccaat ggaacgacct ggactacatg 1920
gactcccgga gggacttcac gttcaacaag gatggcttcc gggacttccc ggccatggtg 1980
caggagctgc accagggcgg ccggcgctac atgatgatcg tggatcctgc catcagcagc 2040
tcgggccctg ccgggagcta caggccctac gacgagggtc tgcggagggg ggttttcatc 2100
accaacgaga ccggccagcc gctgattggg aaggtatggc ccgggtccac tgccttcccc 2160
gacttcacca accccacagc cctggcctgg tgggaggaca tggtggctga gttccatgac 2220
caggtgccct tcgacggcat gtggattgac atgaacgagc cttccaactt catcagaggc 2280
tctgaggacg gctgccccaa caatgagctg gagaacccac cctacgtgcc tggggtggtt 2340
ggggggaccc tccaggcggc caccatctgt gcctccagcc accagtttct ctccacacac 2400
tacaacctgc acaacctcta cggcctgacc gaagccatcg cctcccacag ggcgctggtg 2460
aaggctcggg ggacacgccc atttgtgatc tcccgctcga cctttgctgg ccacggccga 2520
tacgccggcc actggacggg ggacgtgtgg agctcctggg agcagctcgc ctcctccgtg 2580
ccagaaatcc tgcagtttaa cctgctgggg gtgcctctgg tcggggccga cgtctgcggc 2640
ttcctgggca acacctcaga ggagctgtgt gtgcgctgga cccagctggg ggccttctac 2700
cccttcatgc ggaaccacaa cagcctgctc agtctgcccc aggagccgta cagcttcagc 2760
gagccggccc agcaggccat gaggaaggcc ctcaccctgc gctacgcact cctcccccac 2820
ctctacacac tgttccacca ggcccacgtc gcgggggaga ccgtggcccg gcccctcttc 2880
ctggagttcc ccaaggactc tagcacctgg actgtggacc accagctcct gtggggggag 2940
gccctgctca tcaccccagt gctccaggcc gggaaggccg aagtgactgg ctacttcccc 3000
ttgggcacat ggtacgacct gcagacggtg ccaatagagg cccttggcag cctcccaccc 3060
ccacctgcag ctccccgtga gccagccatc cacagcgagg ggcagtgggt gacgctgccg 3120
gcccccctgg acaccatcaa cgtccacctc cgggctgggt acatcatccc cctgcagggc 3180
cctggcctca caaccacaga gtcccgccag cagcccatgg ccctggctgt ggccctgacc 3240
aagggtggag aggcccgagg ggagctgttc tgggacgatg gagagagcct ggaagtgctg 3300
gagcgagggg cctacacaca ggtcatcttc ctggccagga ataacacgat cgtgaatgag 3360
ctggtacgtg tgaccagtga gggagctggc ctgcagctgc agaaggtgac tgtcctgggc 3420
gtggccacgg cgccccagca ggtcctctcc aacggtgtcc ctgtctccaa cttcacctac 3480
agccccgaca ccaaggtcct ggacatctgt gtctcgctgt tgatgggaga gcagtttctc 3540
gtcagctggt gttagcgagc ggccgctctt agtagcagta tcgatcccag cccacttttc 3600
cccaatacga ctacgagatc tgtggcttct agctgcccgg gtggcatccc tgtgacccct 3660
ccccagtgcc tctcctggcc ctggaagttg ccactccagt gcccaccagc cttgtcctaa 3720
taaaattaag ttgcatcatt ttgtctgact aggtgtcctt ctataatatt atggggtgga 3780
ggggggtggt atggagcaag gggcaagttg ggaaggccga cccgcgaata gtagatcccg 3840
cgagggcttg aatctatcac ctagagtaca ccctagagaa tagctagctc tcaatgacta 3900
aggactaaac ttggtatttc gactgaagcc tgtcccctca ctgttggcgc taggaggaga 3960
gttcgtagaa aggatagtac gatttaagta tctctaagcc ttgtgaagca ctaaggttgc 4020
gtacagacgt gcttgaatta cggataattc gggaaccttg ggacacacaa aaaaccaaca 4080
cacagatcta atgaaaataa agatctttta tttaggcgcc tctgacttcc tggggattga 4140
cctgagttct actctagcgt ttgctggttc ggtgaactaa tctgtgagat ccccaactct 4200
ccgtttggga tctccactct ctggtgtcct aaccttggtg ccccactgtc tactgctagt 4260
gagaccttac gcgctgagaa acgtggcgtt actctaacta agcgacgcgc acttgcactc 4320
tgaatacttc taccgtaact aaccccggac ctcagaactc agacggatct acgctgtcca 4380
tcaacaccag acttagatta cctctgttaa gtttaattaa gctcgcgaag gaacccctag 4440
tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa 4500
aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcagag 4560
agggagtggc caa 4573
<210> 58
<211> 4597
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 58
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctgagtt taaacttcgt cgacgattcg agcttgggct 180
gcaggtcgag ggcactggga ggatgttgag taagatggaa aactactgat gacccttgca 240
gagacagagt attaggacat gtttgaacag gggccgggcg atcagcaggt agctctagag 300
gatccccgtc tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg 360
caaggttcat atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga 420
atcagcaggt ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta 480
taaaagcccc ttcaccagga gaagccgtca cacagactag ccctaaggta agttggcgcc 540
gtttaaggga tggttggttg gtggggtatt aatgtttaat tacctttttt acaggcctga 600
actaggcgcg ccaccgccac catgctcagg ggtccgggac ccgggcggct gctgctgcta 660
gcagtcctgt gcctggggac atcggtgcgc tgcaccgaaa ccgggaagag caagagggct 720
taccgcccca gtgagaccct gtgcggcggg gagctggtgg acaccctcca gttcgtctgt 780
ggggaccgcg gcttctactt cagcaggccc gcaagccgtg tgagccgtcg cagccgtggc 840
atcatggagg agtgctgttt ccgcagctgt gacctggccc tcctggagac gtactgtgct 900
acccccgcca agtccgaggg cgcgccggca caccccggcc gtcccagagc agtgcccaca 960
cagtgcgacg tcccccccaa cagccgcttc gattgcgccc ctgacaaggc catcacccag 1020
gaacagtgcg aggcccgcgg ctgctgctac atccctgcaa agcaggggct gcagggagcc 1080
cagatggggc agccctggtg cttcttccca cccagctacc ccagctacaa gctggagaac 1140
ctgagctcct ctgaaatggg ctacacggcc accctgaccc gtaccacccc caccttcttc 1200
cccaaggaca tcctgaccct gcggctggac gtgatgatgg agactgagaa ccgcctccac 1260
ttcacgatca aagatccagc taacaggcgc tacgaggtgc ccttggagac cccgcgtgtc 1320
cacagccggg caccgtcccc actctacagc gtggagttct ccgaggagcc cttcggggtg 1380
atcgtgcacc ggcagctgga cggccgcgtg ctgctgaaca cgacggtggc gcccctgttc 1440
tttgcggacc agttccttca gctgtccacc tcgctgccct cgcagtatat cacaggcctc 1500
gccgagcacc tcagtcccct gatgctcagc accagctgga ccaggatcac cctgtggaac 1560
cgggaccttg cgcccacgcc cggtgcgaac ctctacgggt ctcacccttt ctacctggcg 1620
ctggaggacg gcgggtcggc acacggggtg ttcctgctaa acagcaatgc catggatgtg 1680
gtcctgcagc cgagccctgc ccttagctgg aggtcgacag gtgggatcct ggatgtctac 1740
atcttcctgg gcccagagcc caagagcgtg gtgcagcagt acctggacgt tgtgggatac 1800
ccgttcatgc cgccatactg gggcctgggc ttccacctgt gccgctgggg ctactcctcc 1860
accgctatca cccgccaggt ggtggagaac atgaccaggg cccacttccc cctggacgtc 1920
caatggaacg acctggacta catggactcc cggagggact tcacgttcaa caaggatggc 1980
ttccgggact tcccggccat ggtgcaggag ctgcaccagg gcggccggcg ctacatgatg 2040
atcgtggatc ctgccatcag cagctcgggc cctgccggga gctacaggcc ctacgacgag 2100
ggtctgcgga ggggggtttt catcaccaac gagaccggcc agccgctgat tgggaaggta 2160
tggcccgggt ccactgcctt ccccgacttc accaacccca cagccctggc ctggtgggag 2220
gacatggtgg ctgagttcca tgaccaggtg cccttcgacg gcatgtggat tgacatgaac 2280
gagccttcca acttcatcag aggctctgag gacggctgcc ccaacaatga gctggagaac 2340
ccaccctacg tgcctggggt ggttgggggg accctccagg cggccaccat ctgtgcctcc 2400
agccaccagt ttctctccac acactacaac ctgcacaacc tctacggcct gaccgaagcc 2460
atcgcctccc acagggcgct ggtgaaggct cgggggacac gcccatttgt gatctcccgc 2520
tcgacctttg ctggccacgg ccgatacgcc ggccactgga cgggggacgt gtggagctcc 2580
tgggagcagc tcgcctcctc cgtgccagaa atcctgcagt ttaacctgct gggggtgcct 2640
ctggtcgggg ccgacgtctg cggcttcctg ggcaacacct cagaggagct gtgtgtgcgc 2700
tggacccagc tgggggcctt ctaccccttc atgcggaacc acaacagcct gctcagtctg 2760
ccccaggagc cgtacagctt cagcgagccg gcccagcagg ccatgaggaa ggccctcacc 2820
ctgcgctacg cactcctccc ccacctctac acactgttcc accaggccca cgtcgcgggg 2880
gagaccgtgg cccggcccct cttcctggag ttccccaagg actctagcac ctggactgtg 2940
gaccaccagc tcctgtgggg ggaggccctg ctcatcaccc cagtgctcca ggccgggaag 3000
gccgaagtga ctggctactt ccccttgggc acatggtacg acctgcagac ggtgccaata 3060
gaggcccttg gcagcctccc acccccacct gcagctcccc gtgagccagc catccacagc 3120
gaggggcagt gggtgacgct gccggccccc ctggacacca tcaacgtcca cctccgggct 3180
gggtacatca tccccctgca gggccctggc ctcacaacca cagagtcccg ccagcagccc 3240
atggccctgg ctgtggccct gaccaagggt ggagaggccc gaggggagct gttctgggac 3300
gatggagaga gcctggaagt gctggagcga ggggcctaca cacaggtcat cttcctggcc 3360
aggaataaca cgatcgtgaa tgagctggta cgtgtgacca gtgagggagc tggcctgcag 3420
ctgcagaagg tgactgtcct gggcgtggcc acggcgcccc agcaggtcct ctccaacggt 3480
gtccctgtct ccaacttcac ctacagcccc gacaccaagg tcctggacat ctgtgtctcg 3540
ctgttgatgg gagagcagtt tctcgtcagc tggtgttagc gagcggccgc tcttagtagc 3600
agtatcgatc ccagcccact tttccccaat acgactacga gatctgtggc ttctagctgc 3660
ccgggtggca tccctgtgac ccctccccag tgcctctcct ggccctggaa gttgccactc 3720
cagtgcccac cagccttgtc ctaataaaat taagttgcat cattttgtct gactaggtgt 3780
ccttctataa tattatgggg tggagggggg tggtatggag caaggggcaa gttgggaagg 3840
ccgacccgcg aatagtagat cccgcgaggg cttgaatcta tcacctagag tacaccctag 3900
agaatagcta gctctcaatg actaaggact aaacttggta tttcgactga agcctgtccc 3960
ctcactgttg gcgctaggag gagagttcgt agaaaggata gtacgattta agtatctcta 4020
agccttgtga agcactaagg ttgcgtacag acgtgcttga attacggata attcgggaac 4080
cttgggacac acaaaaaacc aacacacaga tctaatgaaa ataaagatct tttatttagg 4140
cgcctctgac ttcctgggga ttgacctgag ttctactcta gcgtttgctg gttcggtgaa 4200
ctaatctgtg agatccccaa ctctccgttt gggatctcca ctctctggtg tcctaacctt 4260
ggtgccccac tgtctactgc tagtgagacc ttacgcgctg agaaacgtgg cgttactcta 4320
actaagcgac gcgcacttgc actctgaata cttctaccgt aactaacccc ggacctcaga 4380
actcagacgg atctacgctg tccatcaaca ccagacttag attacctctg ttaagtttaa 4440
ttaagctcgc gaaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 4500
cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 4560
cagtgagcga gcgagcgcgc agagagggag tggccaa 4597
<210> 59
<211> 4594
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 59
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctgagtt taaacttcgt cgacgattcg agcttgggct 180
gcaggtcgag ggcactggga ggatgttgag taagatggaa aactactgat gacccttgca 240
gagacagagt attaggacat gtttgaacag gggccgggcg atcagcaggt agctctagag 300
gatccccgtc tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg 360
caaggttcat atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga 420
atcagcaggt ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta 480
taaaagcccc ttcaccagga gaagccgtca cacagactag ccctaaggta agttggcgcc 540
gtttaaggga tggttggttg gtggggtatt aatgtttaat tacctttttt acaggcctga 600
actaggcgcg ccaccgccac catgcttagg ggtccggggc ccgggctgct gctgctggcc 660
gtccagtgcc tggggacagc ggtgccctcc acgggagcct cgaagagcaa gagggcttac 720
cgccccagtg agaccctgtg cggcggggag ctggtggaca ccctccagtt cgtctgtggg 780
gaccgcggct tctacttcag caggcccgca agccgtgtga gccgtcgcag ccgtggcatc 840
atggaggagt gctgtttccg cagctgtgac ctggccctcc tggagacgta ctgtgctacc 900
cccgccaagt ccgagggcgc gccggcacac cccggccgtc ccagagcagt gcccacacag 960
tgcgacgtcc cccccaacag ccgcttcgat tgcgcccctg acaaggccat cacccaggaa 1020
cagtgcgagg cccgcggctg ctgctacatc cctgcaaagc aggggctgca gggagcccag 1080
atggggcagc cctggtgctt cttcccaccc agctacccca gctacaagct ggagaacctg 1140
agctcctctg aaatgggcta cacggccacc ctgacccgta ccacccccac cttcttcccc 1200
aaggacatcc tgaccctgcg gctggacgtg atgatggaga ctgagaaccg cctccacttc 1260
acgatcaaag atccagctaa caggcgctac gaggtgccct tggagacccc gcgtgtccac 1320
agccgggcac cgtccccact ctacagcgtg gagttctccg aggagccctt cggggtgatc 1380
gtgcaccggc agctggacgg ccgcgtgctg ctgaacacga cggtggcgcc cctgttcttt 1440
gcggaccagt tccttcagct gtccacctcg ctgccctcgc agtatatcac aggcctcgcc 1500
gagcacctca gtcccctgat gctcagcacc agctggacca ggatcaccct gtggaaccgg 1560
gaccttgcgc ccacgcccgg tgcgaacctc tacgggtctc accctttcta cctggcgctg 1620
gaggacggcg ggtcggcaca cggggtgttc ctgctaaaca gcaatgccat ggatgtggtc 1680
ctgcagccga gccctgccct tagctggagg tcgacaggtg ggatcctgga tgtctacatc 1740
ttcctgggcc cagagcccaa gagcgtggtg cagcagtacc tggacgttgt gggatacccg 1800
ttcatgccgc catactgggg cctgggcttc cacctgtgcc gctggggcta ctcctccacc 1860
gctatcaccc gccaggtggt ggagaacatg accagggccc acttccccct ggacgtccaa 1920
tggaacgacc tggactacat ggactcccgg agggacttca cgttcaacaa ggatggcttc 1980
cgggacttcc cggccatggt gcaggagctg caccagggcg gccggcgcta catgatgatc 2040
gtggatcctg ccatcagcag ctcgggccct gccgggagct acaggcccta cgacgagggt 2100
ctgcggaggg gggttttcat caccaacgag accggccagc cgctgattgg gaaggtatgg 2160
cccgggtcca ctgccttccc cgacttcacc aaccccacag ccctggcctg gtgggaggac 2220
atggtggctg agttccatga ccaggtgccc ttcgacggca tgtggattga catgaacgag 2280
ccttccaact tcatcagagg ctctgaggac ggctgcccca acaatgagct ggagaaccca 2340
ccctacgtgc ctggggtggt tggggggacc ctccaggcgg ccaccatctg tgcctccagc 2400
caccagtttc tctccacaca ctacaacctg cacaacctct acggcctgac cgaagccatc 2460
gcctcccaca gggcgctggt gaaggctcgg gggacacgcc catttgtgat ctcccgctcg 2520
acctttgctg gccacggccg atacgccggc cactggacgg gggacgtgtg gagctcctgg 2580
gagcagctcg cctcctccgt gccagaaatc ctgcagttta acctgctggg ggtgcctctg 2640
gtcggggccg acgtctgcgg cttcctgggc aacacctcag aggagctgtg tgtgcgctgg 2700
acccagctgg gggccttcta ccccttcatg cggaaccaca acagcctgct cagtctgccc 2760
caggagccgt acagcttcag cgagccggcc cagcaggcca tgaggaaggc cctcaccctg 2820
cgctacgcac tcctccccca cctctacaca ctgttccacc aggcccacgt cgcgggggag 2880
accgtggccc ggcccctctt cctggagttc cccaaggact ctagcacctg gactgtggac 2940
caccagctcc tgtgggggga ggccctgctc atcaccccag tgctccaggc cgggaaggcc 3000
gaagtgactg gctacttccc cttgggcaca tggtacgacc tgcagacggt gccaatagag 3060
gcccttggca gcctcccacc cccacctgca gctccccgtg agccagccat ccacagcgag 3120
gggcagtggg tgacgctgcc ggcccccctg gacaccatca acgtccacct ccgggctggg 3180
tacatcatcc ccctgcaggg ccctggcctc acaaccacag agtcccgcca gcagcccatg 3240
gccctggctg tggccctgac caagggtgga gaggcccgag gggagctgtt ctgggacgat 3300
ggagagagcc tggaagtgct ggagcgaggg gcctacacac aggtcatctt cctggccagg 3360
aataacacga tcgtgaatga gctggtacgt gtgaccagtg agggagctgg cctgcagctg 3420
cagaaggtga ctgtcctggg cgtggccacg gcgccccagc aggtcctctc caacggtgtc 3480
cctgtctcca acttcaccta cagccccgac accaaggtcc tggacatctg tgtctcgctg 3540
ttgatgggag agcagtttct cgtcagctgg tgttagcgag cggccgctct tagtagcagt 3600
atcgatccca gcccactttt ccccaatacg actacgagat ctgtggcttc tagctgcccg 3660
ggtggcatcc ctgtgacccc tccccagtgc ctctcctggc cctggaagtt gccactccag 3720
tgcccaccag ccttgtccta ataaaattaa gttgcatcat tttgtctgac taggtgtcct 3780
tctataatat tatggggtgg aggggggtgg tatggagcaa ggggcaagtt gggaaggccg 3840
acccgcgaat agtagatccc gcgagggctt gaatctatca cctagagtac accctagaga 3900
atagctagct ctcaatgact aaggactaaa cttggtattt cgactgaagc ctgtcccctc 3960
actgttggcg ctaggaggag agttcgtaga aaggatagta cgatttaagt atctctaagc 4020
cttgtgaagc actaaggttg cgtacagacg tgcttgaatt acggataatt cgggaacctt 4080
gggacacaca aaaaaccaac acacagatct aatgaaaata aagatctttt atttaggcgc 4140
ctctgacttc ctggggattg acctgagttc tactctagcg tttgctggtt cggtgaacta 4200
atctgtgaga tccccaactc tccgtttggg atctccactc tctggtgtcc taaccttggt 4260
gccccactgt ctactgctag tgagacctta cgcgctgaga aacgtggcgt tactctaact 4320
aagcgacgcg cacttgcact ctgaatactt ctaccgtaac taaccccgga cctcagaact 4380
cagacggatc tacgctgtcc atcaacacca gacttagatt acctctgtta agtttaatta 4440
agctcgcgaa ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc 4500
tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag 4560
tgagcgagcg agcgcgcaga gagggagtgg ccaa 4594
<210> 60
<211> 4555
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 60
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctgagtt taaacttcgt cgacgattcg agcttgggct 180
gcaggtcgag ggcactggga ggatgttgag taagatggaa aactactgat gacccttgca 240
gagacagagt attaggacat gtttgaacag gggccgggcg atcagcaggt agctctagag 300
gatccccgtc tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg 360
caaggttcat atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga 420
atcagcaggt ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta 480
taaaagcccc ttcaccagga gaagccgtca cacagactag ccctaaggta agttggcgcc 540
gtttaaggga tggttggttg gtggggtatt aatgtttaat tacctttttt acaggcctga 600
actaggcgcg ccaccgccac catgccgtct tctgtctcgt ggggcatcct cctgctggca 660
ggcctgtgct gcctggtccc tgtctccctg gctgctctgt gcggcgggga gctggtggac 720
accctccagt tcgtctgtgg ggaccgcggc ttctacttca gcaggcccgc aagccgtgtg 780
agccgtcgca gccgtggcat cgttgaggag tgctgtttcc gcagctgtga cctggccctc 840
ctggagacgt actgtgctac ccccgccaag tccgagggcg cgccggcaca ccccggccgt 900
cccagagcag tgcccacaca gtgcgacgtc ccccccaaca gccgcttcga ttgcgcccct 960
gacaaggcca tcacccagga acagtgcgag gcccgcggct gctgctacat ccctgcaaag 1020
caggggctgc agggagccca gatggggcag ccctggtgct tcttcccacc cagctacccc 1080
agctacaagc tggagaacct gagctcctct gaaatgggct acacggccac cctgacccgt 1140
accaccccca ccttcttccc caaggacatc ctgaccctgc ggctggacgt gatgatggag 1200
actgagaacc gcctccactt cacgatcaaa gatccagcta acaggcgcta cgaggtgccc 1260
ttggagaccc cgcgtgtcca cagccgggca ccgtccccac tctacagcgt ggagttctcc 1320
gaggagccct tcggggtgat cgtgcaccgg cagctggacg gccgcgtgct gctgaacacg 1380
acggtggcgc ccctgttctt tgcggaccag ttccttcagc tgtccacctc gctgccctcg 1440
cagtatatca caggcctcgc cgagcacctc agtcccctga tgctcagcac cagctggacc 1500
aggatcaccc tgtggaaccg ggaccttgcg cccacgcccg gtgcgaacct ctacgggtct 1560
caccctttct acctggcgct ggaggacggc gggtcggcac acggggtgtt cctgctaaac 1620
agcaatgcca tggatgtggt cctgcagccg agccctgccc ttagctggag gtcgacaggt 1680
gggatcctgg atgtctacat cttcctgggc ccagagccca agagcgtggt gcagcagtac 1740
ctggacgttg tgggataccc gttcatgccg ccatactggg gcctgggctt ccacctgtgc 1800
cgctggggct actcctccac cgctatcacc cgccaggtgg tggagaacat gaccagggcc 1860
cacttccccc tggacgtcca atggaacgac ctggactaca tggactcccg gagggacttc 1920
acgttcaaca aggatggctt ccgggacttc ccggccatgg tgcaggagct gcaccagggc 1980
ggccggcgct acatgatgat cgtggatcct gccatcagca gctcgggccc tgccgggagc 2040
tacaggccct acgacgaggg tctgcggagg ggggttttca tcaccaacga gaccggccag 2100
ccgctgattg ggaaggtatg gcccgggtcc actgccttcc ccgacttcac caaccccaca 2160
gccctggcct ggtgggagga catggtggct gagttccatg accaggtgcc cttcgacggc 2220
atgtggattg acatgaacga gccttccaac ttcatcagag gctctgagga cggctgcccc 2280
aacaatgagc tggagaaccc accctacgtg cctggggtgg ttggggggac cctccaggcg 2340
gccaccatct gtgcctccag ccaccagttt ctctccacac actacaacct gcacaacctc 2400
tacggcctga ccgaagccat cgcctcccac agggcgctgg tgaaggctcg ggggacacgc 2460
ccatttgtga tctcccgctc gacctttgct ggccacggcc gatacgccgg ccactggacg 2520
ggggacgtgt ggagctcctg ggagcagctc gcctcctccg tgccagaaat cctgcagttt 2580
aacctgctgg gggtgcctct ggtcggggcc gacgtctgcg gcttcctggg caacacctca 2640
gaggagctgt gtgtgcgctg gacccagctg ggggccttct accccttcat gcggaaccac 2700
aacagcctgc tcagtctgcc ccaggagccg tacagcttca gcgagccggc ccagcaggcc 2760
atgaggaagg ccctcaccct gcgctacgca ctcctccccc acctctacac actgttccac 2820
caggcccacg tcgcggggga gaccgtggcc cggcccctct tcctggagtt ccccaaggac 2880
tctagcacct ggactgtgga ccaccagctc ctgtgggggg aggccctgct catcacccca 2940
gtgctccagg ccgggaaggc cgaagtgact ggctacttcc ccttgggcac atggtacgac 3000
ctgcagacgg tgccaataga ggcccttggc agcctcccac ccccacctgc agctccccgt 3060
gagccagcca tccacagcga ggggcagtgg gtgacgctgc cggcccccct ggacaccatc 3120
aacgtccacc tccgggctgg gtacatcatc cccctgcagg gccctggcct cacaaccaca 3180
gagtcccgcc agcagcccat ggccctggct gtggccctga ccaagggtgg agaggcccga 3240
ggggagctgt tctgggacga tggagagagc ctggaagtgc tggagcgagg ggcctacaca 3300
caggtcatct tcctggccag gaataacacg atcgtgaatg agctggtacg tgtgaccagt 3360
gagggagctg gcctgcagct gcagaaggtg actgtcctgg gcgtggccac ggcgccccag 3420
caggtcctct ccaacggtgt ccctgtctcc aacttcacct acagccccga caccaaggtc 3480
ctggacatct gtgtctcgct gttgatggga gagcagtttc tcgtcagctg gtgttagcga 3540
gcggccgctc ttagtagcag tatcgatccc agcccacttt tccccaatac gactacgaga 3600
tctgtggctt ctagctgccc gggtggcatc cctgtgaccc ctccccagtg cctctcctgg 3660
ccctggaagt tgccactcca gtgcccacca gccttgtcct aataaaatta agttgcatca 3720
ttttgtctga ctaggtgtcc ttctataata ttatggggtg gaggggggtg gtatggagca 3780
aggggcaagt tgggaaggcc gacccgcgaa tagtagatcc cgcgagggct tgaatctatc 3840
acctagagta caccctagag aatagctagc tctcaatgac taaggactaa acttggtatt 3900
tcgactgaag cctgtcccct cactgttggc gctaggagga gagttcgtag aaaggatagt 3960
acgatttaag tatctctaag ccttgtgaag cactaaggtt gcgtacagac gtgcttgaat 4020
tacggataat tcgggaacct tgggacacac aaaaaaccaa cacacagatc taatgaaaat 4080
aaagatcttt tatttaggcg cctctgactt cctggggatt gacctgagtt ctactctagc 4140
gtttgctggt tcggtgaact aatctgtgag atccccaact ctccgtttgg gatctccact 4200
ctctggtgtc ctaaccttgg tgccccactg tctactgcta gtgagacctt acgcgctgag 4260
aaacgtggcg ttactctaac taagcgacgc gcacttgcac tctgaatact tctaccgtaa 4320
ctaaccccgg acctcagaac tcagacggat ctacgctgtc catcaacacc agacttagat 4380
tacctctgtt aagtttaatt aagctcgcga aggaacccct agtgatggag ttggccactc 4440
cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 4500
gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg gccaa 4555
<210> 61
<211> 4579
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 61
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctgagtt taaacttcgt cgacgattcg agcttgggct 180
gcaggtcgag ggcactggga ggatgttgag taagatggaa aactactgat gacccttgca 240
gagacagagt attaggacat gtttgaacag gggccgggcg atcagcaggt agctctagag 300
gatccccgtc tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg 360
caaggttcat atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga 420
atcagcaggt ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta 480
taaaagcccc ttcaccagga gaagccgtca cacagactag ccctaaggta agttggcgcc 540
gtttaaggga tggttggttg gtggggtatt aatgtttaat tacctttttt acaggcctga 600
actaggcgcg ccaccgccac catgctcagg ggtccgggac ccgggcggct gctgctgcta 660
gcagtcctgt gcctggggac atcggtgcgc tgcaccgaaa ccgggaagag caagagggct 720
ctgtgcggcg gggagctggt ggacaccctc cagttcgtct gtggggaccg cggcttctac 780
ttcagcaggc ccgcaagccg tgtgagccgt cgcagccgtg gcatcgttga ggagtgctgt 840
ttccgcagct gtgacctggc cctcctggag acgtactgtg ctacccccgc caagtccgag 900
ggcgcgccgg cacaccccgg ccgtcccaga gcagtgccca cacagtgcga cgtccccccc 960
aacagccgct tcgattgcgc ccctgacaag gccatcaccc aggaacagtg cgaggcccgc 1020
ggctgctgct acatccctgc aaagcagggg ctgcagggag cccagatggg gcagccctgg 1080
tgcttcttcc cacccagcta ccccagctac aagctggaga acctgagctc ctctgaaatg 1140
ggctacacgg ccaccctgac ccgtaccacc cccaccttct tccccaagga catcctgacc 1200
ctgcggctgg acgtgatgat ggagactgag aaccgcctcc acttcacgat caaagatcca 1260
gctaacaggc gctacgaggt gcccttggag accccgcgtg tccacagccg ggcaccgtcc 1320
ccactctaca gcgtggagtt ctccgaggag cccttcgggg tgatcgtgca ccggcagctg 1380
gacggccgcg tgctgctgaa cacgacggtg gcgcccctgt tctttgcgga ccagttcctt 1440
cagctgtcca cctcgctgcc ctcgcagtat atcacaggcc tcgccgagca cctcagtccc 1500
ctgatgctca gcaccagctg gaccaggatc accctgtgga accgggacct tgcgcccacg 1560
cccggtgcga acctctacgg gtctcaccct ttctacctgg cgctggagga cggcgggtcg 1620
gcacacgggg tgttcctgct aaacagcaat gccatggatg tggtcctgca gccgagccct 1680
gcccttagct ggaggtcgac aggtgggatc ctggatgtct acatcttcct gggcccagag 1740
cccaagagcg tggtgcagca gtacctggac gttgtgggat acccgttcat gccgccatac 1800
tggggcctgg gcttccacct gtgccgctgg ggctactcct ccaccgctat cacccgccag 1860
gtggtggaga acatgaccag ggcccacttc cccctggacg tccaatggaa cgacctggac 1920
tacatggact cccggaggga cttcacgttc aacaaggatg gcttccggga cttcccggcc 1980
atggtgcagg agctgcacca gggcggccgg cgctacatga tgatcgtgga tcctgccatc 2040
agcagctcgg gccctgccgg gagctacagg ccctacgacg agggtctgcg gaggggggtt 2100
ttcatcacca acgagaccgg ccagccgctg attgggaagg tatggcccgg gtccactgcc 2160
ttccccgact tcaccaaccc cacagccctg gcctggtggg aggacatggt ggctgagttc 2220
catgaccagg tgcccttcga cggcatgtgg attgacatga acgagccttc caacttcatc 2280
agaggctctg aggacggctg ccccaacaat gagctggaga acccacccta cgtgcctggg 2340
gtggttgggg ggaccctcca ggcggccacc atctgtgcct ccagccacca gtttctctcc 2400
acacactaca acctgcacaa cctctacggc ctgaccgaag ccatcgcctc ccacagggcg 2460
ctggtgaagg ctcgggggac acgcccattt gtgatctccc gctcgacctt tgctggccac 2520
ggccgatacg ccggccactg gacgggggac gtgtggagct cctgggagca gctcgcctcc 2580
tccgtgccag aaatcctgca gtttaacctg ctgggggtgc ctctggtcgg ggccgacgtc 2640
tgcggcttcc tgggcaacac ctcagaggag ctgtgtgtgc gctggaccca gctgggggcc 2700
ttctacccct tcatgcggaa ccacaacagc ctgctcagtc tgccccagga gccgtacagc 2760
ttcagcgagc cggcccagca ggccatgagg aaggccctca ccctgcgcta cgcactcctc 2820
ccccacctct acacactgtt ccaccaggcc cacgtcgcgg gggagaccgt ggcccggccc 2880
ctcttcctgg agttccccaa ggactctagc acctggactg tggaccacca gctcctgtgg 2940
ggggaggccc tgctcatcac cccagtgctc caggccggga aggccgaagt gactggctac 3000
ttccccttgg gcacatggta cgacctgcag acggtgccaa tagaggccct tggcagcctc 3060
ccacccccac ctgcagctcc ccgtgagcca gccatccaca gcgaggggca gtgggtgacg 3120
ctgccggccc ccctggacac catcaacgtc cacctccggg ctgggtacat catccccctg 3180
cagggccctg gcctcacaac cacagagtcc cgccagcagc ccatggccct ggctgtggcc 3240
ctgaccaagg gtggagaggc ccgaggggag ctgttctggg acgatggaga gagcctggaa 3300
gtgctggagc gaggggccta cacacaggtc atcttcctgg ccaggaataa cacgatcgtg 3360
aatgagctgg tacgtgtgac cagtgaggga gctggcctgc agctgcagaa ggtgactgtc 3420
ctgggcgtgg ccacggcgcc ccagcaggtc ctctccaacg gtgtccctgt ctccaacttc 3480
acctacagcc ccgacaccaa ggtcctggac atctgtgtct cgctgttgat gggagagcag 3540
tttctcgtca gctggtgtta gcgagcggcc gctcttagta gcagtatcga tcccagccca 3600
cttttcccca atacgactac gagatctgtg gcttctagct gcccgggtgg catccctgtg 3660
acccctcccc agtgcctctc ctggccctgg aagttgccac tccagtgccc accagccttg 3720
tcctaataaa attaagttgc atcattttgt ctgactaggt gtccttctat aatattatgg 3780
ggtggagggg ggtggtatgg agcaaggggc aagttgggaa ggccgacccg cgaatagtag 3840
atcccgcgag ggcttgaatc tatcacctag agtacaccct agagaatagc tagctctcaa 3900
tgactaagga ctaaacttgg tatttcgact gaagcctgtc ccctcactgt tggcgctagg 3960
aggagagttc gtagaaagga tagtacgatt taagtatctc taagccttgt gaagcactaa 4020
ggttgcgtac agacgtgctt gaattacgga taattcggga accttgggac acacaaaaaa 4080
ccaacacaca gatctaatga aaataaagat cttttattta ggcgcctctg acttcctggg 4140
gattgacctg agttctactc tagcgtttgc tggttcggtg aactaatctg tgagatcccc 4200
aactctccgt ttgggatctc cactctctgg tgtcctaacc ttggtgcccc actgtctact 4260
gctagtgaga ccttacgcgc tgagaaacgt ggcgttactc taactaagcg acgcgcactt 4320
gcactctgaa tacttctacc gtaactaacc ccggacctca gaactcagac ggatctacgc 4380
tgtccatcaa caccagactt agattacctc tgttaagttt aattaagctc gcgaaggaac 4440
ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact gaggccgggc 4500
gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc 4560
gcagagaggg agtggccaa 4579
<210> 62
<211> 4576
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 62
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctgagtt taaacttcgt cgacgattcg agcttgggct 180
gcaggtcgag ggcactggga ggatgttgag taagatggaa aactactgat gacccttgca 240
gagacagagt attaggacat gtttgaacag gggccgggcg atcagcaggt agctctagag 300
gatccccgtc tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg 360
caaggttcat atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga 420
atcagcaggt ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta 480
taaaagcccc ttcaccagga gaagccgtca cacagactag ccctaaggta agttggcgcc 540
gtttaaggga tggttggttg gtggggtatt aatgtttaat tacctttttt acaggcctga 600
actaggcgcg ccaccgccac catgcttagg ggtccggggc ccgggctgct gctgctggcc 660
gtccagtgcc tggggacagc ggtgccctcc acgggagcct cgaagagcaa gagggctctg 720
tgcggcgggg agctggtgga caccctccag ttcgtctgtg gggaccgcgg cttctacttc 780
agcaggcccg caagccgtgt gagccgtcgc agccgtggca tcgttgagga gtgctgtttc 840
cgcagctgtg acctggccct cctggagacg tactgtgcta cccccgccaa gtccgagggc 900
gcgccggcac accccggccg tcccagagca gtgcccacac agtgcgacgt cccccccaac 960
agccgcttcg attgcgcccc tgacaaggcc atcacccagg aacagtgcga ggcccgcggc 1020
tgctgctaca tccctgcaaa gcaggggctg cagggagccc agatggggca gccctggtgc 1080
ttcttcccac ccagctaccc cagctacaag ctggagaacc tgagctcctc tgaaatgggc 1140
tacacggcca ccctgacccg taccaccccc accttcttcc ccaaggacat cctgaccctg 1200
cggctggacg tgatgatgga gactgagaac cgcctccact tcacgatcaa agatccagct 1260
aacaggcgct acgaggtgcc cttggagacc ccgcgtgtcc acagccgggc accgtcccca 1320
ctctacagcg tggagttctc cgaggagccc ttcggggtga tcgtgcaccg gcagctggac 1380
ggccgcgtgc tgctgaacac gacggtggcg cccctgttct ttgcggacca gttccttcag 1440
ctgtccacct cgctgccctc gcagtatatc acaggcctcg ccgagcacct cagtcccctg 1500
atgctcagca ccagctggac caggatcacc ctgtggaacc gggaccttgc gcccacgccc 1560
ggtgcgaacc tctacgggtc tcaccctttc tacctggcgc tggaggacgg cgggtcggca 1620
cacggggtgt tcctgctaaa cagcaatgcc atggatgtgg tcctgcagcc gagccctgcc 1680
cttagctgga ggtcgacagg tgggatcctg gatgtctaca tcttcctggg cccagagccc 1740
aagagcgtgg tgcagcagta cctggacgtt gtgggatacc cgttcatgcc gccatactgg 1800
ggcctgggct tccacctgtg ccgctggggc tactcctcca ccgctatcac ccgccaggtg 1860
gtggagaaca tgaccagggc ccacttcccc ctggacgtcc aatggaacga cctggactac 1920
atggactccc ggagggactt cacgttcaac aaggatggct tccgggactt cccggccatg 1980
gtgcaggagc tgcaccaggg cggccggcgc tacatgatga tcgtggatcc tgccatcagc 2040
agctcgggcc ctgccgggag ctacaggccc tacgacgagg gtctgcggag gggggttttc 2100
atcaccaacg agaccggcca gccgctgatt gggaaggtat ggcccgggtc cactgccttc 2160
cccgacttca ccaaccccac agccctggcc tggtgggagg acatggtggc tgagttccat 2220
gaccaggtgc ccttcgacgg catgtggatt gacatgaacg agccttccaa cttcatcaga 2280
ggctctgagg acggctgccc caacaatgag ctggagaacc caccctacgt gcctggggtg 2340
gttgggggga ccctccaggc ggccaccatc tgtgcctcca gccaccagtt tctctccaca 2400
cactacaacc tgcacaacct ctacggcctg accgaagcca tcgcctccca cagggcgctg 2460
gtgaaggctc gggggacacg cccatttgtg atctcccgct cgacctttgc tggccacggc 2520
cgatacgccg gccactggac gggggacgtg tggagctcct gggagcagct cgcctcctcc 2580
gtgccagaaa tcctgcagtt taacctgctg ggggtgcctc tggtcggggc cgacgtctgc 2640
ggcttcctgg gcaacacctc agaggagctg tgtgtgcgct ggacccagct gggggccttc 2700
taccccttca tgcggaacca caacagcctg ctcagtctgc cccaggagcc gtacagcttc 2760
agcgagccgg cccagcaggc catgaggaag gccctcaccc tgcgctacgc actcctcccc 2820
cacctctaca cactgttcca ccaggcccac gtcgcggggg agaccgtggc ccggcccctc 2880
ttcctggagt tccccaagga ctctagcacc tggactgtgg accaccagct cctgtggggg 2940
gaggccctgc tcatcacccc agtgctccag gccgggaagg ccgaagtgac tggctacttc 3000
cccttgggca catggtacga cctgcagacg gtgccaatag aggcccttgg cagcctccca 3060
cccccacctg cagctccccg tgagccagcc atccacagcg aggggcagtg ggtgacgctg 3120
ccggcccccc tggacaccat caacgtccac ctccgggctg ggtacatcat ccccctgcag 3180
ggccctggcc tcacaaccac agagtcccgc cagcagccca tggccctggc tgtggccctg 3240
accaagggtg gagaggcccg aggggagctg ttctgggacg atggagagag cctggaagtg 3300
ctggagcgag gggcctacac acaggtcatc ttcctggcca ggaataacac gatcgtgaat 3360
gagctggtac gtgtgaccag tgagggagct ggcctgcagc tgcagaaggt gactgtcctg 3420
ggcgtggcca cggcgcccca gcaggtcctc tccaacggtg tccctgtctc caacttcacc 3480
tacagccccg acaccaaggt cctggacatc tgtgtctcgc tgttgatggg agagcagttt 3540
ctcgtcagct ggtgttagcg agcggccgct cttagtagca gtatcgatcc cagcccactt 3600
ttccccaata cgactacgag atctgtggct tctagctgcc cgggtggcat ccctgtgacc 3660
cctccccagt gcctctcctg gccctggaag ttgccactcc agtgcccacc agccttgtcc 3720
taataaaatt aagttgcatc attttgtctg actaggtgtc cttctataat attatggggt 3780
ggaggggggt ggtatggagc aaggggcaag ttgggaaggc cgacccgcga atagtagatc 3840
ccgcgagggc ttgaatctat cacctagagt acaccctaga gaatagctag ctctcaatga 3900
ctaaggacta aacttggtat ttcgactgaa gcctgtcccc tcactgttgg cgctaggagg 3960
agagttcgta gaaaggatag tacgatttaa gtatctctaa gccttgtgaa gcactaaggt 4020
tgcgtacaga cgtgcttgaa ttacggataa ttcgggaacc ttgggacaca caaaaaacca 4080
acacacagat ctaatgaaaa taaagatctt ttatttaggc gcctctgact tcctggggat 4140
tgacctgagt tctactctag cgtttgctgg ttcggtgaac taatctgtga gatccccaac 4200
tctccgtttg ggatctccac tctctggtgt cctaaccttg gtgccccact gtctactgct 4260
agtgagacct tacgcgctga gaaacgtggc gttactctaa ctaagcgacg cgcacttgca 4320
ctctgaatac ttctaccgta actaaccccg gacctcagaa ctcagacgga tctacgctgt 4380
ccatcaacac cagacttaga ttacctctgt taagtttaat taagctcgcg aaggaacccc 4440
tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac 4500
caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca 4560
gagagggagt ggccaa 4576
<210> 63
<211> 6
<212> PRT
<213> Homo sapiens
<400> 63
Tyr Arg Pro Ser Glu Thr
1 5
<210> 64
<211> 11
<212> PRT
<213> Rattus norvegicus
<400> 64
Leu Leu Leu Leu Ala Val Leu Cys Leu Gly Thr
1 5 10
<210> 65
<211> 20
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Collagen Stability (CS) sequence
<400> 65
cccagcccac ttttccccaa 20
<210> 66
<211> 6
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Collagen Stability (CS) sequence
<400> 66
Pro Ser Pro Leu Phe Pro
1 5
<210> 67
<211> 192
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 67
gctctgtgcg gcggggagct ggtggacacc ctccagttcg tctgtgggga ccgcggcttc 60
tacttcagca ggcccgcaag ccgtgtgagc cgtcgcagcc gtggcatcgt tgaggagtgc 120
tgtttccgca gctgtgacct ggccctcctg gagacgtact gtgctacccc cgccaagtcc 180
gagggcgcgc cg 192
<210> 68
<211> 189
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 68
ctgtgcggcg gggagctggt ggacaccctc cagttcgtct gtggggaccg cggcttctac 60
ttcagcaggc ccgcaagccg tgtgagccgt cgcagccgtg gcatcgttga ggagtgctgt 120
ttccgcagct gtgacctggc cctcctggag acgtactgtg ctacccccgc caagtccgag 180
ggcgcgccg 189
<210> 69
<211> 210
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 69
gcttaccgcc ccagtgagac cctgtgcggc ggggagctgg tggacaccct ccagttcgtc 60
tgtggggacc gcggcttcta cttcagcagg cccgcaagcc gtgtgagccg tcgcagccgt 120
ggcatcatgg aggagtgctg tttccgcagc tgtgacctgg ccctcctgga gacgtactgt 180
gctacccccg ccaagtccga gggcgcgccg 210
<210> 70
<211> 264
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 70
atgggaatcc caatggggaa gtcgatgctg gtgcttctca ccttcttggc cttcgcctcg 60
tgctgcattg ctgctctgtg cggcggggag ctggtggaca ccctccagtt cgtctgtggg 120
gaccgcggct tctacttcag caggcccgca agccgtgtga gccgtcgcag ccgtggcatc 180
gttgaggagt gctgtttccg cagctgtgac ctggccctcc tggagacgta ctgtgctacc 240
cccgccaagt ccgagggcgc gccg 264
<210> 71
<211> 300
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 71
taggcgcctc tgacttcctg gggattgacc tgagttctac tctagcgttt gctggttcgg 60
tgaactaatc tgtgagatcc ccaactctcc gtttgggatc tccactctct ggtgtcctaa 120
ccttggtgcc ccactgtcta ctgctagtga gaccttacgc gctgagaaac gtggcgttac 180
tctaactaag cgacgcgcac ttgcactctg aatacttcta ccgtaactaa ccccggacct 240
cagaactcag acggatctac gctgtccatc aacaccagac ttagattacc tctgttaagt 300
<210> 72
<211> 2859
<212> DNA
<213> Homo sapiens
<400> 72
atgggagtga ggcacccgcc ctgctcccac cggctcctgg ccgtctgcgc cctcgtgtcc 60
ttggcaaccg ctgcactcct ggggcacatc ctactccatg atttcctgct ggttccccga 120
gagctgagtg gctcctcccc agtcctggag gagactcacc cagctcacca gcagggagcc 180
agcagaccag ggccccggga tgcccaggca caccccggcc gtcccagagc agtgcccaca 240
cagtgcgacg tcccccccaa cagccgcttc gattgcgccc ctgacaaggc catcacccag 300
gaacagtgcg aggcccgcgg ctgttgctac atccctgcaa agcaggggct gcagggagcc 360
cagatggggc agccctggtg cttcttccca cccagctacc ccagctacaa gctggagaac 420
ctgagctcct ctgaaatggg ctacacggcc accctgaccc gtaccacccc caccttcttc 480
cccaaggaca tcctgaccct gcggctggac gtgatgatgg agactgagaa ccgcctccac 540
ttcacgatca aagatccagc taacaggcgc tacgaggtgc ccttggagac cccgcatgtc 600
cacagccggg caccgtcccc actctacagc gtggagttct ccgaggagcc cttcggggtg 660
atcgtgcgcc ggcagctgga cggccgcgtg ctgctgaaca cgacggtggc gcccctgttc 720
tttgcggacc agttccttca gctgtccacc tcgctgccct cgcagtatat cacaggcctc 780
gccgagcacc tcagtcccct gatgctcagc accagctgga ccaggatcac cctgtggaac 840
cgggaccttg cgcccacgcc cggtgcgaac ctctacgggt ctcacccttt ctacctggcg 900
ctggaggacg gcgggtcggc acacggggtg ttcctgctaa acagcaatgc catggatgtg 960
gtcctgcagc cgagccctgc ccttagctgg aggtcgacag gtgggatcct ggatgtctac 1020
atcttcctgg gcccagagcc caagagcgtg gtgcagcagt acctggacgt tgtgggatac 1080
ccgttcatgc cgccatactg gggcctgggc ttccacctgt gccgctgggg ctactcctcc 1140
accgctatca cccgccaggt ggtggagaac atgaccaggg cccacttccc cctggacgtc 1200
cagtggaacg acctggacta catggactcc cggagggact tcacgttcaa caaggatggc 1260
ttccgggact tcccggccat ggtgcaggag ctgcaccagg gcggccggcg ctacatgatg 1320
atcgtggatc ctgccatcag cagctcgggc cctgccggga gctacaggcc ctacgacgag 1380
ggtctgcgga ggggggtttt catcaccaac gagaccggcc agccgctgat tgggaaggta 1440
tggcccgggt ccactgcctt ccccgacttc accaacccca cagccctggc ctggtgggag 1500
gacatggtgg ctgagttcca tgaccaggtg cccttcgacg gcatgtggat tgacatgaac 1560
gagccttcca acttcatcag gggctctgag gacggctgcc ccaacaatga gctggagaac 1620
ccaccctacg tgcctggggt ggttgggggg accctccagg cggccaccat ctgtgcctcc 1680
agccaccagt ttctctccac acactacaac ctgcacaacc tctacggcct gaccgaagcc 1740
atcgcctccc acagggcgct ggtgaaggct cgggggacac gcccatttgt gatctcccgc 1800
tcgacctttg ctggccacgg ccgatacgcc ggccactgga cgggggacgt gtggagctcc 1860
tgggagcagc tcgcctcctc cgtgccagaa atcctgcagt ttaacctgct gggggtgcct 1920
ctggtcgggg ccgacgtctg cggcttcctg ggcaacacct cagaggagct gtgtgtgcgc 1980
tggacccagc tgggggcctt ctaccccttc atgcggaacc acaacagcct gctcagtctg 2040
ccccaggagc cgtacagctt cagcgagccg gcccagcagg ccatgaggaa ggccctcacc 2100
ctgcgctacg cactcctccc ccacctctac acactgttcc accaggccca cgtcgcgggg 2160
gagaccgtgg cccggcccct cttcctggag ttccccaagg actctagcac ctggactgtg 2220
gaccaccagc tcctgtgggg ggaggccctg ctcatcaccc cagtgctcca ggccgggaag 2280
gccgaagtga ctggctactt ccccttgggc acatggtacg acctgcagac ggtgccagta 2340
gaggcccttg gcagcctccc acccccacct gcagctcccc gtgagccagc catccacagc 2400
gaggggcagt gggtgacgct gccggccccc ctggacacca tcaacgtcca cctccgggct 2460
gggtacatca tccccctgca gggccctggc ctcacaacca cagagtcccg ccagcagccc 2520
atggccctgg ctgtggccct gaccaagggt ggggaggccc gaggggagct gttctgggac 2580
gatggagaga gcctggaagt gctggagcga ggggcctaca cacaggtcat cttcctggcc 2640
aggaataaca cgatcgtgaa tgagctggta cgtgtgacca gtgagggagc tggcctgcag 2700
ctgcagaagg tgactgtcct gggcgtggcc acggcgcccc agcaggtcct ctccaacggt 2760
gtccctgtct ccaacttcac ctacagcccc gacaccaagg tcctggacat ctgtgtctcg 2820
ctgttgatgg gagagcagtt tctcgtcagc tggtgttag 2859
<210> 73
<211> 2859
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 73
atgggagtga ggcacccgcc ctgctcccac cggctcctgg ccgtctgcgc cctcgtgtcc 60
ttggcaaccg ctgcactcct ggggcacatc ctactccatg atttcctgct ggttccccga 120
gagctgagtg gctcctcccc agtcctggag gagactcacc cagctcacca gcagggagcc 180
agcagaccag ggccccggga tgcccaggca caccccggcc gtcccagagc agtgcccaca 240
cagtgcgacg tcccccccaa cagccgcttc gattgcgccc ctgacaaggc catcacccag 300
gaacagtgcg aggcccgcgg ctgctgctac atccctgcaa agcaggggct gcagggagcc 360
cagatggggc agccctggtg cttcttccca cccagctacc ccagctacaa gctggagaac 420
ctgagctcct ctgaaatggg ctacacggcc accctgaccc gtaccacccc caccttcttc 480
cccaaggaca tcctgaccct gcggctggac gtgatgatgg agactgagaa ccgcctccac 540
ttcacgatca aagatccagc taacaggcgc tacgaggtgc ccttggagac cccgcgtgtc 600
cacagccggg caccgtcccc actctacagc gtggagttct ccgaggagcc cttcggggtg 660
atcgtgcacc ggcagctgga cggccgcgtg ctgctgaaca cgacggtggc gcccctgttc 720
tttgcggacc agttccttca gctgtccacc tcgctgccct cgcagtatat cacaggcctc 780
gccgagcacc tcagtcccct gatgctcagc accagctgga ccaggatcac cctgtggaac 840
cgggaccttg cgcccacgcc cggtgcgaac ctctacgggt ctcacccttt ctacctggcg 900
ctggaggacg gcgggtcggc acacggggtg ttcctgctaa acagcaatgc catggatgtg 960
gtcctgcagc cgagccctgc ccttagctgg aggtcgacag gtgggatcct ggatgtctac 1020
atcttcctgg gcccagagcc caagagcgtg gtgcagcagt acctggacgt tgtgggatac 1080
ccgttcatgc cgccatactg gggcctgggc ttccacctgt gccgctgggg ctactcctcc 1140
accgctatca cccgccaggt ggtggagaac atgaccaggg cccacttccc cctggacgtc 1200
caatggaacg acctggacta catggactcc cggagggact tcacgttcaa caaggatggc 1260
ttccgggact tcccggccat ggtgcaggag ctgcaccagg gcggccggcg ctacatgatg 1320
atcgtggatc ctgccatcag cagctcgggc cctgccggga gctacaggcc ctacgacgag 1380
ggtctgcgga ggggggtttt catcaccaac gagaccggcc agccgctgat tgggaaggta 1440
tggcccgggt ccactgcctt ccccgacttc accaacccca cagccctggc ctggtgggag 1500
gacatggtgg ctgagttcca tgaccaggtg cccttcgacg gcatgtggat tgacatgaac 1560
gagccttcca acttcatcag aggctctgag gacggctgcc ccaacaatga gctggagaac 1620
ccaccctacg tgcctggggt ggttgggggg accctccagg cggccaccat ctgtgcctcc 1680
agccaccagt ttctctccac acactacaac ctgcacaacc tctacggcct gaccgaagcc 1740
atcgcctccc acagggcgct ggtgaaggct cgggggacac gcccatttgt gatctcccgc 1800
tcgacctttg ctggccacgg ccgatacgcc ggccactgga cgggggacgt gtggagctcc 1860
tgggagcagc tcgcctcctc cgtgccagaa atcctgcagt ttaacctgct gggggtgcct 1920
ctggtcgggg ccgacgtctg cggcttcctg ggcaacacct cagaggagct gtgtgtgcgc 1980
tggacccagc tgggggcctt ctaccccttc atgcggaacc acaacagcct gctcagtctg 2040
ccccaggagc cgtacagctt cagcgagccg gcccagcagg ccatgaggaa ggccctcacc 2100
ctgcgctacg cactcctccc ccacctctac acactgttcc accaggccca cgtcgcgggg 2160
gagaccgtgg cccggcccct cttcctggag ttccccaagg actctagcac ctggactgtg 2220
gaccaccagc tcctgtgggg ggaggccctg ctcatcaccc cagtgctcca ggccgggaag 2280
gccgaagtga ctggctactt ccccttgggc acatggtacg acctgcagac ggtgccaata 2340
gaggcccttg gcagcctccc acccccacct gcagctcccc gtgagccagc catccacagc 2400
gaggggcagt gggtgacgct gccggccccc ctggacacca tcaacgtcca cctccgggct 2460
gggtacatca tccccctgca gggccctggc ctcacaacca cagagtcccg ccagcagccc 2520
atggccctgg ctgtggccct gaccaagggt ggagaggccc gaggggagct gttctgggac 2580
gatggagaga gcctggaagt gctggagcga ggggcctaca cacaggtcat cttcctggcc 2640
aggaataaca cgatcgtgaa tgagctggta cgtgtgacca gtgagggagc tggcctgcag 2700
ctgcagaagg tgactgtcct gggcgtggcc acggcgcccc agcaggtcct ctccaacggt 2760
gtccctgtct ccaacttcac ctacagcccc gacaccaagg tcctggacat ctgtgtctcg 2820
ctgttgatgg gagagcagtt tctcgtcagc tggtgttag 2859
<210> 74
<211> 2859
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 74
atgggagtaa ggcatccacc atgctctcat aggctcctcg ccgtatgcgc gttggtcagc 60
cttgcgaccg cagcccttct gggccacatt ctgctgcacg attttctcct cgttccgcga 120
gagttgtctg gaagctctcc agtactcgag gaaacgcatc cagcgcacca gcagggcgca 180
tctcggcccg gtccaagaga cgcacaagca caccccgggc ggccaagggc tgttccaact 240
cagtgcgatg ttccgcccaa ttcaagattc gattgcgcac ccgataaagc tattacgcaa 300
gagcagtgcg aagctcgcgg ctgctgttat atcccggcaa agcagggcct tcagggcgct 360
caaatgggac agccgtggtg tttttttcca ccgtcatatc catcctacaa gcttgagaac 420
ctgtcctcat ctgagatggg atacacggct accctgacac ggacaacgcc aaccttcttc 480
cccaaagaca ttcttacact gcgactggac gtgatgatgg aaacagagaa tcgactgcat 540
tttactataa aggacccggc taacaggcgg tacgaggttc ccctggagac ccctcgcgta 600
cattctcgag ctcctagccc gctctactcc gtggaatttt ccgaagagcc gtttggtgta 660
atagtgcatc gccaacttga cggtcgcgta ctgctcaaca ccacggtggc acctctgttc 720
tttgcggacc aattcttgca gctctctact tctctccctt cacaatatat aaccgggctc 780
gcagagcatc tgtccccgtt gatgttgtct acgtcatgga caagaatcac gctttggaac 840
cgagacctgg cccctacgcc gggagctaat ctgtacgggt cacatccatt ctatttggct 900
ctggaggatg gcggtagtgc acacggggta tttctgctta actctaatgc gatggatgtc 960
gtgctgcagc catcccctgc gctgtcttgg cgaagcaccg gcggcattct ggacgtgtat 1020
atctttcttg gacccgagcc aaagagcgtc gtacaacagt acctcgacgt agtggggtat 1080
cccttcatgc ccccctattg ggggctcggt ttccatttgt gcagatgggg ctactcatcc 1140
actgcaataa cacgccaggt agtagaaaat atgacccggg ctcactttcc tcttgacgtg 1200
cagtggaatg accttgacta catggatagt cgccgcgatt tcaccttcaa caaggacggt 1260
ttcagagatt tccctgctat ggtgcaagag ctgcaccaag ggggccgccg gtatatgatg 1320
atcgtagatc cggccatatc tagctctggc cctgccgggt cttatagacc gtatgatgaa 1380
ggtctgaggc gcggtgtctt catcacaaac gaaactggtc aaccactcat cggcaaggtc 1440
tggcccgggt caacggcgtt tcctgatttc actaatccga cggcgctggc ttggtgggaa 1500
gatatggttg ccgagtttca cgatcaagtt ccgtttgacg gaatgtggat tgatatgaat 1560
gagccatcta actttatacg cggtagtgaa gatggttgcc ctaataatga gttggaaaac 1620
ccaccctatg tacccggtgt cgtcggcggc acgcttcagg ccgctaccat atgcgctagc 1680
agtcaccaat tccttagtac gcactataac ctccataatt tgtacggact tactgaggcg 1740
attgctagtc atcgagcgct cgtaaaagct cgcggtaccc ggcccttcgt gattagtagg 1800
agtacattcg ccgggcatgg tcgatatgcg ggccactgga ctggggatgt ctggtccagc 1860
tgggagcagt tggcttcctc agtccctgaa attttgcaat ttaacctgct tggtgtgccg 1920
cttgttggcg cggacgtttg cgggtttttg ggtaatacca gtgaagaact gtgtgttagg 1980
tggacacagc ttggggcatt ctatcctttc atgcggaatc acaacagtct tctgtcattg 2040
ccgcaggaac cgtactcttt cagtgagcct gcccagcagg cgatgcggaa ggccctcaca 2100
ttgcgatacg cacttctccc gcatctttat acgcttttcc accaggccca tgttgcgggc 2160
gagacagtcg ccaggccact cttccttgag tttccgaaag acagcagcac ctggacggtt 2220
gaccatcagc tcctctgggg tgaagctttg ttgattaccc ccgtgctgca ggcgggcaag 2280
gcggaagtaa caggctactt cccgctggga acctggtatg accttcagac agtgccgatc 2340
gaagctcttg gctcactgcc accacctccg gcagccccgc gggaaccagc gattcactcc 2400
gagggccaat gggttacgct tccggctcca cttgacacca tcaatgtcca tcttcgcgcg 2460
ggatacatta tcccgcttca gggacctggc ttgactacta cagagtctcg ccaacagccg 2520
atggcactcg cagtagctct gactaaagga ggtgaggcgc ggggtgaact cttttgggat 2580
gatggggaat ccctggaggt tttggagagg ggtgcgtaca cgcaagtaat ctttctcgct 2640
cgaaacaata cgatcgtcaa tgagctcgtc agggtaacgt ctgagggggc cggtttgcaa 2700
cttcagaaag tcactgtact tggcgtagcc actgctcctc aacaagtcct ttcaaacggg 2760
gttcctgtgt caaactttac ctattcaccc gataccaagg ttttggacat atgcgtgtct 2820
ttgttgatgg gcgaacaatt tctggtttct tggtgctag 2859
<210> 75
<211> 2859
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 75
atgggcgtta gacaccctcc atgctctcat agactgctgg ccgtgtgtgc tctggtgtct 60
cttgctacag ctgccctgct gggacatatc ctgctgcacg attttctgct ggtgcccaga 120
gagctgtctg gcagctctcc agtgctggaa gaaacacacc ctgcacatca gcagggcgcc 180
tctagacctg gacctagaga tgctcaagcc catcctggca gacctagagc cgtgcctaca 240
cagtgtgacg tgccacctaa cagcagattc gactgcgccc ctgacaaggc catcacacaa 300
gagcagtgtg aagccagagg ctgctgctac attcctgcca aacaaggact gcagggcgct 360
cagatgggac agccttggtg cttcttccca ccatcttacc ccagctacaa gctggaaaac 420
ctgagcagca gcgagatggg ctacaccgcc acactgacca gaaccacacc tacattcttc 480
ccaaaggaca tcctgacact gcggctggac gtgatgatgg aaaccgagaa ccggctgcac 540
ttcaccatca aggaccccgc caatagaaga tacgaggtgc ccctggaaac ccctagagtg 600
cattctagag ccccatctcc actgtacagc gtggaattca gcgaggaacc cttcggcgtg 660
atcgtgcaca gacagctgga tggcagagtg ctgctgaata ccacagtggc ccctctgttc 720
ttcgccgacc agtttctgca gctgagcaca agcctgccta gccagtatat cacaggcctg 780
gccgaacacc tgtctccact gatgctgagc accagctgga ccagaatcac cctgtggaac 840
agagatctgg cccctacacc tggcgccaat ctgtacggct ctcacccttt ttatctggcc 900
ctggaagatg gcggaagcgc ccacggtgtc tttctgctga acagcaacgc catggacgtg 960
gtgctgcaac catctcctgc tctgtcttgg agaagcaccg gcggcatcct ggacgtgtac 1020
atctttctgg gccctgagcc taagagcgtg gtgcagcagt atctggatgt cgtgggctac 1080
cccttcatgc ctccttattg gggcctgggc ttccacctgt gtagatgggg atacagctcc 1140
accgccatca ccagacaggt ggtggaaaac atgacccggg ctcacttccc actggatgtg 1200
cagtggaacg acctggacta catggacagc agacgggact tcaccttcaa caaggacggc 1260
ttcagagact tccccgccat ggtgcaagaa ctgcatcaag gcggcagacg gtacatgatg 1320
atcgtggatc ctgccatctc ttctagcggc cctgccggct cttacagacc ttatgatgag 1380
ggcctgagaa gaggcgtgtt catcaccaat gagacaggcc agcctctgat cggcaaagtg 1440
tggcctggat ccaccgcctt tccagacttc accaatccta ccgctctggc ttggtgggaa 1500
gatatggtgg ccgagtttca cgatcaggtg cccttcgacg gcatgtggat cgacatgaac 1560
gagcccagca acttcatcag aggcagcgag gacggctgcc ccaacaacga actggaaaat 1620
cctccttacg tgccaggcgt tgtcggagga acactgcagg ccgccacaat ttgtgccagc 1680
agccatcagt ttctgagcac ccactacaac ctgcacaacc tgtacggcct gaccgaggcc 1740
attgcttctc acagagccct ggttaaggcc agaggcacca gacctttcgt gatcagcaga 1800
agcacattcg ccggccacgg cagatatgct ggacattgga caggcgacgt gtggtctagt 1860
tgggagcagc tggctagctc tgtgcccgag atcctgcagt ttaatctgct gggagtgcct 1920
ctcgtgggcg ccgatgtttg tggctttctg ggaaacacct ccgaggaact gtgtgtgcgt 1980
tggacacagc tgggcgcctt ctatcccttc atgagaaacc acaacagcct gctgagcctg 2040
cctcaagagc cttacagctt tagcgaaccc gcacagcagg ccatgagaaa ggccctgact 2100
ctgagatacg ctctgctgcc ccacctgtac accctgtttc atcaggctca tgtggccggg 2160
gaaacagtgg ctagacccct gttcctggaa ttccccaagg atagcagcac ctggaccgtg 2220
gatcatcagc tgctttgggg cgaagctctg ctgattacac ctgtgctgca ggctggcaag 2280
gccgaagtga caggctattt tcccctcggc acttggtacg acctgcagac agtgcctatt 2340
gaggccctgg gatctcttcc tccacctcct gctgctccta gagagcctgc cattcactct 2400
gaaggccagt gggttacact gcccgctcct ctggacacca tcaatgtgca cctgagagcc 2460
ggctacatca tccctctgca aggccctgga ctgaccacaa ccgaaagcag acagcagcca 2520
atggctctgg ccgtggcact gacaaaaggc ggagaagcta gaggcgagct gttctgggat 2580
gatggcgagt ctctggaagt gctcgagaga ggcgcctaca cacaagtgat ctttctcgcc 2640
cggaacaaca ccatcgtgaa cgaactcgtc agagtgacca gtgaaggtgc cggactgcag 2700
ctccagaaag tgacagtgct tggagtggcc acagctcctc agcaggttct gtctaatggc 2760
gtgcccgtgt ccaacttcac atacagccct gacaccaagg tgctggatat ctgcgtgtca 2820
ctgctgatgg gcgagcagtt cctggtgtcc tggtgttga 2859
<210> 76
<211> 2859
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 76
atgggcgtga ggcacccacc ttgctctcac aggctgctgg ccgtgtgcgc actggtgagc 60
ctggcaaccg ccgccctgct gggccacatc ctgctgcacg acttcctgct ggtgccaagg 120
gagctgtccg gaagctcccc agtgctggag gagacccacc cagcacacca gcagggagca 180
tctaggccag gccccagaga tgcacaggca cacccaggca gacccagagc agtgccaacc 240
cagtgcgacg tgccaccaaa cagccggttt gactgtgccc ccgataaggc catcacacag 300
gagcagtgcg aggccagagg ctgctgttat atccctgcaa agcagggact gcagggagca 360
cagatgggac agccatggtg tttctttcct ccatcttacc ccagctataa gctggagaat 420
ctgtctagct ccgagatggg ctacacagcc accctgacaa gaaccacacc aacattcttt 480
cccaaggata tcctgaccct gcggctggac gtgatgatgg agacagagaa cagactgcac 540
ttcaccatca aggatcccgc caatcggaga tatgaggtgc ctctggagac cccaagggtg 600
cactctaggg cacctagccc actgtactcc gtggagttct ctgaggagcc atttggcgtg 660
atcgtgcacc ggcagctgga tggcagagtg ctgctgaaca ccacagtggc ccccctgttc 720
tttgccgacc agttcctgca gctgagcaca tccctgccct cccagtatat caccggcctg 780
gccgagcacc tgtctcctct gatgctgtct accagctgga caaggatcac cctgtggaac 840
agggacctgg caccaacccc tggagcaaat ctgtacggca gccacccctt ctatctggcc 900
ctggaggatg gaggatccgc ccacggcgtg tttctgctga actctaatgc catggacgtg 960
gtgctgcagc caagccccgc cctgtcctgg aggtctaccg gaggcatcct ggacgtgtac 1020
atcttcctgg gccctgagcc aaagtccgtg gtgcagcagt acctggacgt ggtgggctat 1080
cctttcatgc ccccttactg gggactggga tttcacctgt gcagatgggg ctattctagc 1140
acagccatca cccggcaggt ggtggagaac atgaccagag cccactttcc actggatgtg 1200
cagtggaatg acctggatta catggactcc aggcgcgact tcaccttcaa caaggacggc 1260
ttccgggatt ttcccgccat ggtgcaggag ctgcaccagg gaggccggag atacatgatg 1320
atcgtggatc ctgcaatctc ctctagcgga cctgcaggaa gctacagacc atatgacgag 1380
ggcctgaggc gcggcgtgtt catcacaaac gagaccggcc agcctctgat cggcaaggtc 1440
tggccaggct ccaccgcctt cccagacttc accaatccaa ccgccctggc atggtgggag 1500
gacatggtgg ccgagttcca cgaccaggtg ccttttgatg gcatgtggat cgacatgaac 1560
gagccatcta atttcatcag gggaagcgag gacggatgcc caaacaatga gctggagaat 1620
ccaccatatg tgcctggagt ggtgggaggc acactgcagg cagcaaccat ctgtgcctcc 1680
tctcaccagt ttctgtctac acactataac ctgcacaatc tgtacggact gaccgaggca 1740
atcgcaagcc acagagccct ggtgaaggca aggggaacaa ggcctttcgt gatctccagg 1800
tctacctttg ccggacacgg ccgctacgca ggacactgga ccggcgacgt gtggagctcc 1860
tgggagcagc tggcctctag cgtgccagag atcctgcagt tcaacctgct gggagtgcca 1920
ctggtgggag cagacgtgtg cggctttctg ggcaatacaa gcgaggagct gtgcgtgcgg 1980
tggacccagc tgggagcctt ctatcccttt atgagaaacc acaatagcct gctgtccctg 2040
cctcaggagc catacagctt ctccgagcct gcacagcagg caatgaggaa ggccctgaca 2100
ctgagatatg ccctgctgcc acacctgtac accctgtttc accaggcaca cgtggcagga 2160
gagacagtgg ccaggcccct gttcctggag tttcctaagg attcctctac ctggacagtg 2220
gaccaccagc tgctgtgggg agaggccctg ctgatcaccc ccgtgctgca ggcaggcaag 2280
gcagaggtga caggctattt ccctctgggc acatggtacg atctgcagac cgtgccaatc 2340
gaggccctgg gaagcctgcc tccaccacct gcagcaccaa gggagcctgc catccactcc 2400
gagggacagt gggtgacact gccagcacct ctggacacca tcaacgtgca cctgagggcc 2460
ggctatatca tcccactgca gggacctgga ctgaccacaa ccgagagcag gcagcagcca 2520
atggcactgg cagtggccct gaccaaggga ggcgaggcca ggggcgagct gttctgggac 2580
gatggagagt ccctggaggt gctggagagg ggagcctaca cacaggtcat cttcctggcc 2640
aggaacaata caatcgtgaa tgagctggtg cgcgtgacct ctgagggagc aggactgcag 2700
ctgcagaagg tgacagtgct gggagtggca accgcaccac agcaggtgct gtccaacggc 2760
gtgcccgtga gcaatttcac atactcccct gataccaagg tgctggacat ctgcgtgagc 2820
ctgctgatgg gcgagcagtt tctggtgtcc tggtgttga 2859
<210> 77
<400> 77
000
<210> 78
<211> 2032
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 78
aagtgccgac ccgtctgaat agtagatccc gtcgagggct tgaatctatc accatagagt 60
acacccatag agaatagcta gctctcaatt gactaaggac taaacttggt atttcgactg 120
aagcctgtca ctcctcactg ttggcgctag tgaggagagt tcgtagaaag gatagtacga 180
tttaagtatc tctaagcctt gtgaagcact aaggttgcgt acagacgtgc ttgaattacg 240
gataattcgt ggaaccttgg gatagtgcgc ctctgacttc tctgtgggta ttgacctgag 300
ttctactcta gcgtttgctg gttcgtgtga actaatctgt gagatcctca caactctccg 360
tttgggatct ccactctctg gtgtcctaac acttggtgcc acacactgtc tactgctagt 420
gagaccttat ctgtctgctg agaaactgtg tgctgttact ctaactaagc gatctgtctg 480
cacttgcact ctgaatactt ctaccgtaac taactctcac ggactctcag aactcagacg 540
gatctactgc tgtctcaaat caacaccaga cttagattac tctctgttaa gttgaaagac 600
tctctacaaa tccacactgt ggtctagttg aacaagcttg agagagtatc tgtctgcata 660
tcaagagtga gagtgtctct ggatttggag tagttgagaa gtggaaccat agcgagtcta 720
ctgcctgtgt caacttcaat tagagtgttg aatagaggac tgactctcga attgaagtat 780
cctgccaact gtctcaactt aattcaaacg ctattttcgt taactgtctc aactctcgtc 840
aagttgagag gaagagtaga gccatagttt gaagcctgat aagagttcgt ctgaggacgt 900
attgtgtgtc aagacgaact gaaggatttc aacaaataga gaagcttgac actgtccttc 960
aactgtctga actgtagcac tctggatagc tagctagcgt ttgtagatag tttcaaggat 1020
agcaaccaac aacacgatag tttagaaatt gttctagatc ttctgctact actcgagaga 1080
tagttgactt ctagaagact ctggatagag agcttcctgt ggtttctatt tcaacacttc 1140
tgagcgattt agatagaggc gtcaattgag aacaaaaact ggacacctgt ttctagaaca 1200
ctagtgctag tcttctcaag gcttgatact gtcctgccac tcaagagaaa tgttctggca 1260
cctgcacttg cactggggac agcctatttt gctagtttgt tttgtttcgt tttgttttga 1320
tggagagcgt atgttagtac tatcgattca cacaaaaaac caacacacag atgtaatgaa 1380
aataaagata ttttattaga gagcgagtgg atagtttaga gtcgcttgag acttatcctg 1440
tgtccaacta gccaagagta gagagagagt gactaggtgg atcgagagat cgtcgtctat 1500
ttgactgcta gcctgtgttc tcgtcgtagt ccaaatcttc aatactctgg cgactagtaa 1560
cttgaatctg tgtatctaac acgacaaggc tactcctttg agtttctagt gataagtgcg 1620
actggatcta gctagttgag tttctagaaa ctactgtcca aagctactag cactaaggtc 1680
tctctgtgaa agagtggtct acttttgagg agaagaaagt tctagcgtag tagcaattcc 1740
tttggtggaa gaggctatcg agagtcaact ctgccttcaa gtagcttcca aaagtaaaca 1800
actgtggatc gtttctaatc tcaagacgct tgaaagagca agagcttgta ttgatcgagg 1860
tggtattgag atagttaaga ctgtccaaga attacgacta ccaaagatct tcgttagcaa 1920
cgaaacttga gaacgtttct aagcctgtga cttaaactct cctgcttggt gcctgccttt 1980
gaatctggac tcgtagagca cgaggaagag aagtcgattt ctagagcctg ct 2032
<210> 79
<211> 4256
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 79
tcgagcttgg gctgcaggtc gagggcactg ggaggatgtt gagtaagatg gaaaactact 60
gatgaccctt gcagagacag agtattagga catgtttgaa caggggccgg gcgatcagca 120
ggtagctcta gaggatcccc gtctgtctgc acatttcgta gagcgagtgt tccgatactc 180
taatctccct aggcaaggtt catatttgtg taggttactt attctccttt tgttgactaa 240
gtcaataatc agaatcagca ggtttggagt cagcttggca gggatcagca gcctgggttg 300
gaaggagggg gtataaaagc cccttcacca ggagaagccg tcacacagac tagccctaag 360
gtaagttggc gccgtttaag ggatggttgg ttggtggggt attaatgttt aattaccttt 420
tttacaggcc tgaactaggc gcgccaccgc caccatgccg tcttctgtct cgtggggcat 480
cctcctgctg gcaggcctgt gctgcctggt ccctgtctcc ctggctgctt accgccccag 540
tgagaccctg tgcggcgggg agctggtgga caccctccag ttcgtctgtg gggaccgcgg 600
cttctacttc agcaggcccg caagccgtgt gagccgtcgc agccgtggca tcatggagga 660
gtgctgtttc cgcagctgtg acctggccct cctggagacg tactgtgcta cccccgccaa 720
gtccgagggc gcgccggcac accccggccg tcccagagca gtgcccacac agtgcgacgt 780
cccccccaac agccgcttcg attgcgcccc tgacaaggcc atcacccagg aacagtgcga 840
ggcccgcggc tgctgctaca tccctgcaaa gcaggggctg cagggagccc agatggggca 900
gccctggtgc ttcttcccac ccagctaccc cagctacaag ctggagaacc tgagctcctc 960
tgaaatgggc tacacggcca ccctgacccg taccaccccc accttcttcc ccaaggacat 1020
cctgaccctg cggctggacg tgatgatgga gactgagaac cgcctccact tcacgatcaa 1080
agatccagct aacaggcgct acgaggtgcc cttggagacc ccgcgtgtcc acagccgggc 1140
accgtcccca ctctacagcg tggagttctc cgaggagccc ttcggggtga tcgtgcaccg 1200
gcagctggac ggccgcgtgc tgctgaacac gacggtggcg cccctgttct ttgcggacca 1260
gttccttcag ctgtccacct cgctgccctc gcagtatatc acaggcctcg ccgagcacct 1320
cagtcccctg atgctcagca ccagctggac caggatcacc ctgtggaacc gggaccttgc 1380
gcccacgccc ggtgcgaacc tctacgggtc tcaccctttc tacctggcgc tggaggacgg 1440
cgggtcggca cacggggtgt tcctgctaaa cagcaatgcc atggatgtgg tcctgcagcc 1500
gagccctgcc cttagctgga ggtcgacagg tgggatcctg gatgtctaca tcttcctggg 1560
cccagagccc aagagcgtgg tgcagcagta cctggacgtt gtgggatacc cgttcatgcc 1620
gccatactgg ggcctgggct tccacctgtg ccgctggggc tactcctcca ccgctatcac 1680
ccgccaggtg gtggagaaca tgaccagggc ccacttcccc ctggacgtcc aatggaacga 1740
cctggactac atggactccc ggagggactt cacgttcaac aaggatggct tccgggactt 1800
cccggccatg gtgcaggagc tgcaccaggg cggccggcgc tacatgatga tcgtggatcc 1860
tgccatcagc agctcgggcc ctgccgggag ctacaggccc tacgacgagg gtctgcggag 1920
gggggttttc atcaccaacg agaccggcca gccgctgatt gggaaggtat ggcccgggtc 1980
cactgccttc cccgacttca ccaaccccac agccctggcc tggtgggagg acatggtggc 2040
tgagttccat gaccaggtgc ccttcgacgg catgtggatt gacatgaacg agccttccaa 2100
cttcatcaga ggctctgagg acggctgccc caacaatgag ctggagaacc caccctacgt 2160
gcctggggtg gttgggggga ccctccaggc ggccaccatc tgtgcctcca gccaccagtt 2220
tctctccaca cactacaacc tgcacaacct ctacggcctg accgaagcca tcgcctccca 2280
cagggcgctg gtgaaggctc gggggacacg cccatttgtg atctcccgct cgacctttgc 2340
tggccacggc cgatacgccg gccactggac gggggacgtg tggagctcct gggagcagct 2400
cgcctcctcc gtgccagaaa tcctgcagtt taacctgctg ggggtgcctc tggtcggggc 2460
cgacgtctgc ggcttcctgg gcaacacctc agaggagctg tgtgtgcgct ggacccagct 2520
gggggccttc taccccttca tgcggaacca caacagcctg ctcagtctgc cccaggagcc 2580
gtacagcttc agcgagccgg cccagcaggc catgaggaag gccctcaccc tgcgctacgc 2640
actcctcccc cacctctaca cactgttcca ccaggcccac gtcgcggggg agaccgtggc 2700
ccggcccctc ttcctggagt tccccaagga ctctagcacc tggactgtgg accaccagct 2760
cctgtggggg gaggccctgc tcatcacccc agtgctccag gccgggaagg ccgaagtgac 2820
tggctacttc cccttgggca catggtacga cctgcagacg gtgccaatag aggcccttgg 2880
cagcctccca cccccacctg cagctccccg tgagccagcc atccacagcg aggggcagtg 2940
ggtgacgctg ccggcccccc tggacaccat caacgtccac ctccgggctg ggtacatcat 3000
ccccctgcag ggccctggcc tcacaaccac agagtcccgc cagcagccca tggccctggc 3060
tgtggccctg accaagggtg gagaggcccg aggggagctg ttctgggacg atggagagag 3120
cctggaagtg ctggagcgag gggcctacac acaggtcatc ttcctggcca ggaataacac 3180
gatcgtgaat gagctggtac gtgtgaccag tgagggagct ggcctgcagc tgcagaaggt 3240
gactgtcctg ggcgtggcca cggcgcccca gcaggtcctc tccaacggtg tccctgtctc 3300
caacttcacc tacagccccg acaccaaggt cctggacatc tgtgtctcgc tgttgatggg 3360
agagcagttt ctcgtcagct ggtgttagcg agcggccgct cttagtagca gtatcgatcc 3420
cagcccactt ttccccaata cgactacgag atctgtggct tctagctgcc cgggtggcat 3480
ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc agtgcccacc 3540
agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc cttctataat 3600
attatggggt ggaggggggt ggtatggagc aaggggcaag ttggggtcct tcaacgtcga 3660
actgtagcac tctggatagc tagctagcgt ttgtagatag tttcaaggat agcaaccaac 3720
aacacgatag tttagaaatt gttctagatc ttctgctact actcgagaga tagttgactt 3780
ctagaagact ctggatagag agcttcctgt ggtttctatt tcaacacttc gagcgattta 3840
gatagaggcg tcaattgaga acaaaaactg gacacctgtt tctagaacac tagtgctagt 3900
cttctcaagg cttgatacgt cctgccactc acacacaaaa aaccaacaca cagattaatg 3960
aaaataaaga tcttttatta gagagcgagt ggatagttta gagtcgcttg agacttatcc 4020
tgtgtccaac tagccaagag tagagagaga gtgactaggt ggatcgagag atcgtcgtct 4080
atttgactgc tagcctgtgt tctcgtcgta gtccaaatct tcaatactct ggcgactagt 4140
aacttgaatc tgtgtatcta acacgacaag gctactcctt tgagtttcta gtgataagtg 4200
cgactggatc tagctagttg agtttctaga aactacgtcc aaagctacta gcacta 4256
<210> 80
<211> 4280
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 80
tcgagcttgg gctgcaggtc gagggcactg ggaggatgtt gagtaagatg gaaaactact 60
gatgaccctt gcagagacag agtattagga catgtttgaa caggggccgg gcgatcagca 120
ggtagctcta gaggatcccc gtctgtctgc acatttcgta gagcgagtgt tccgatactc 180
taatctccct aggcaaggtt catatttgtg taggttactt attctccttt tgttgactaa 240
gtcaataatc agaatcagca ggtttggagt cagcttggca gggatcagca gcctgggttg 300
gaaggagggg gtataaaagc cccttcacca ggagaagccg tcacacagac tagccctaag 360
gtaagttggc gccgtttaag ggatggttgg ttggtggggt attaatgttt aattaccttt 420
tttacaggcc tgaactaggc gcgccaccgc caccatgctc aggggtccgg gacccgggcg 480
gctgctgctg ctagcagtcc tgtgcctggg gacatcggtg cgctgcaccg aaaccgggaa 540
gagcaagagg gcttaccgcc ccagtgagac cctgtgcggc ggggagctgg tggacaccct 600
ccagttcgtc tgtggggacc gcggcttcta cttcagcagg cccgcaagcc gtgtgagccg 660
tcgcagccgt ggcatcatgg aggagtgctg tttccgcagc tgtgacctgg ccctcctgga 720
gacgtactgt gctacccccg ccaagtccga gggcgcgccg gcacaccccg gccgtcccag 780
agcagtgccc acacagtgcg acgtcccccc caacagccgc ttcgattgcg cccctgacaa 840
ggccatcacc caggaacagt gcgaggcccg cggctgctgc tacatccctg caaagcaggg 900
gctgcaggga gcccagatgg ggcagccctg gtgcttcttc ccacccagct accccagcta 960
caagctggag aacctgagct cctctgaaat gggctacacg gccaccctga cccgtaccac 1020
ccccaccttc ttccccaagg acatcctgac cctgcggctg gacgtgatga tggagactga 1080
gaaccgcctc cacttcacga tcaaagatcc agctaacagg cgctacgagg tgcccttgga 1140
gaccccgcgt gtccacagcc gggcaccgtc cccactctac agcgtggagt tctccgagga 1200
gcccttcggg gtgatcgtgc accggcagct ggacggccgc gtgctgctga acacgacggt 1260
ggcgcccctg ttctttgcgg accagttcct tcagctgtcc acctcgctgc cctcgcagta 1320
tatcacaggc ctcgccgagc acctcagtcc cctgatgctc agcaccagct ggaccaggat 1380
caccctgtgg aaccgggacc ttgcgcccac gcccggtgcg aacctctacg ggtctcaccc 1440
tttctacctg gcgctggagg acggcgggtc ggcacacggg gtgttcctgc taaacagcaa 1500
tgccatggat gtggtcctgc agccgagccc tgcccttagc tggaggtcga caggtgggat 1560
cctggatgtc tacatcttcc tgggcccaga gcccaagagc gtggtgcagc agtacctgga 1620
cgttgtggga tacccgttca tgccgccata ctggggcctg ggcttccacc tgtgccgctg 1680
gggctactcc tccaccgcta tcacccgcca ggtggtggag aacatgacca gggcccactt 1740
ccccctggac gtccaatgga acgacctgga ctacatggac tcccggaggg acttcacgtt 1800
caacaaggat ggcttccggg acttcccggc catggtgcag gagctgcacc agggcggccg 1860
gcgctacatg atgatcgtgg atcctgccat cagcagctcg ggccctgccg ggagctacag 1920
gccctacgac gagggtctgc ggaggggggt tttcatcacc aacgagaccg gccagccgct 1980
gattgggaag gtatggcccg ggtccactgc cttccccgac ttcaccaacc ccacagccct 2040
ggcctggtgg gaggacatgg tggctgagtt ccatgaccag gtgcccttcg acggcatgtg 2100
gattgacatg aacgagcctt ccaacttcat cagaggctct gaggacggct gccccaacaa 2160
tgagctggag aacccaccct acgtgcctgg ggtggttggg gggaccctcc aggcggccac 2220
catctgtgcc tccagccacc agtttctctc cacacactac aacctgcaca acctctacgg 2280
cctgaccgaa gccatcgcct cccacagggc gctggtgaag gctcggggga cacgcccatt 2340
tgtgatctcc cgctcgacct ttgctggcca cggccgatac gccggccact ggacggggga 2400
cgtgtggagc tcctgggagc agctcgcctc ctccgtgcca gaaatcctgc agtttaacct 2460
gctgggggtg cctctggtcg gggccgacgt ctgcggcttc ctgggcaaca cctcagagga 2520
gctgtgtgtg cgctggaccc agctgggggc cttctacccc ttcatgcgga accacaacag 2580
cctgctcagt ctgccccagg agccgtacag cttcagcgag ccggcccagc aggccatgag 2640
gaaggccctc accctgcgct acgcactcct cccccacctc tacacactgt tccaccaggc 2700
ccacgtcgcg ggggagaccg tggcccggcc cctcttcctg gagttcccca aggactctag 2760
cacctggact gtggaccacc agctcctgtg gggggaggcc ctgctcatca ccccagtgct 2820
ccaggccggg aaggccgaag tgactggcta cttccccttg ggcacatggt acgacctgca 2880
gacggtgcca atagaggccc ttggcagcct cccaccccca cctgcagctc cccgtgagcc 2940
agccatccac agcgaggggc agtgggtgac gctgccggcc cccctggaca ccatcaacgt 3000
ccacctccgg gctgggtaca tcatccccct gcagggccct ggcctcacaa ccacagagtc 3060
ccgccagcag cccatggccc tggctgtggc cctgaccaag ggtggagagg cccgagggga 3120
gctgttctgg gacgatggag agagcctgga agtgctggag cgaggggcct acacacaggt 3180
catcttcctg gccaggaata acacgatcgt gaatgagctg gtacgtgtga ccagtgaggg 3240
agctggcctg cagctgcaga aggtgactgt cctgggcgtg gccacggcgc cccagcaggt 3300
cctctccaac ggtgtccctg tctccaactt cacctacagc cccgacacca aggtcctgga 3360
catctgtgtc tcgctgttga tgggagagca gtttctcgtc agctggtgtt agcgagcggc 3420
cgctcttagt agcagtatcg atcccagccc acttttcccc aatacgacta cgagatctgt 3480
ggcttctagc tgcccgggtg gcatccctgt gacccctccc cagtgcctct cctggccctg 3540
gaagttgcca ctccagtgcc caccagcctt gtcctaataa aattaagttg catcattttg 3600
tctgactagg tgtccttcta taatattatg gggtggaggg gggtggtatg gagcaagggg 3660
caagttgggg tccttcaacg tcgaactgta gcactctgga tagctagcta gcgtttgtag 3720
atagtttcaa ggatagcaac caacaacacg atagtttaga aattgttcta gatcttctgc 3780
tactactcga gagatagttg acttctagaa gactctggat agagagcttc ctgtggtttc 3840
tatttcaaca cttcgagcga tttagataga ggcgtcaatt gagaacaaaa actggacacc 3900
tgtttctaga acactagtgc tagtcttctc aaggcttgat acgtcctgcc actcacacac 3960
aaaaaaccaa cacacagatt aatgaaaata aagatctttt attagagagc gagtggatag 4020
tttagagtcg cttgagactt atcctgtgtc caactagcca agagtagaga gagagtgact 4080
aggtggatcg agagatcgtc gtctatttga ctgctagcct gtgttctcgt cgtagtccaa 4140
atcttcaata ctctggcgac tagtaacttg aatctgtgta tctaacacga caaggctact 4200
cctttgagtt tctagtgata agtgcgactg gatctagcta gttgagtttc tagaaactac 4260
gtccaaagct actagcacta 4280
<210> 81
<211> 4277
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 81
tcgagcttgg gctgcaggtc gagggcactg ggaggatgtt gagtaagatg gaaaactact 60
gatgaccctt gcagagacag agtattagga catgtttgaa caggggccgg gcgatcagca 120
ggtagctcta gaggatcccc gtctgtctgc acatttcgta gagcgagtgt tccgatactc 180
taatctccct aggcaaggtt catatttgtg taggttactt attctccttt tgttgactaa 240
gtcaataatc agaatcagca ggtttggagt cagcttggca gggatcagca gcctgggttg 300
gaaggagggg gtataaaagc cccttcacca ggagaagccg tcacacagac tagccctaag 360
gtaagttggc gccgtttaag ggatggttgg ttggtggggt attaatgttt aattaccttt 420
tttacaggcc tgaactaggc gcgccaccgc caccatgctt aggggtccgg ggcccgggct 480
gctgctgctg gccgtccagt gcctggggac agcggtgccc tccacgggag cctcgaagag 540
caagagggct taccgcccca gtgagaccct gtgcggcggg gagctggtgg acaccctcca 600
gttcgtctgt ggggaccgcg gcttctactt cagcaggccc gcaagccgtg tgagccgtcg 660
cagccgtggc atcatggagg agtgctgttt ccgcagctgt gacctggccc tcctggagac 720
gtactgtgct acccccgcca agtccgaggg cgcgccggca caccccggcc gtcccagagc 780
agtgcccaca cagtgcgacg tcccccccaa cagccgcttc gattgcgccc ctgacaaggc 840
catcacccag gaacagtgcg aggcccgcgg ctgctgctac atccctgcaa agcaggggct 900
gcagggagcc cagatggggc agccctggtg cttcttccca cccagctacc ccagctacaa 960
gctggagaac ctgagctcct ctgaaatggg ctacacggcc accctgaccc gtaccacccc 1020
caccttcttc cccaaggaca tcctgaccct gcggctggac gtgatgatgg agactgagaa 1080
ccgcctccac ttcacgatca aagatccagc taacaggcgc tacgaggtgc ccttggagac 1140
cccgcgtgtc cacagccggg caccgtcccc actctacagc gtggagttct ccgaggagcc 1200
cttcggggtg atcgtgcacc ggcagctgga cggccgcgtg ctgctgaaca cgacggtggc 1260
gcccctgttc tttgcggacc agttccttca gctgtccacc tcgctgccct cgcagtatat 1320
cacaggcctc gccgagcacc tcagtcccct gatgctcagc accagctgga ccaggatcac 1380
cctgtggaac cgggaccttg cgcccacgcc cggtgcgaac ctctacgggt ctcacccttt 1440
ctacctggcg ctggaggacg gcgggtcggc acacggggtg ttcctgctaa acagcaatgc 1500
catggatgtg gtcctgcagc cgagccctgc ccttagctgg aggtcgacag gtgggatcct 1560
ggatgtctac atcttcctgg gcccagagcc caagagcgtg gtgcagcagt acctggacgt 1620
tgtgggatac ccgttcatgc cgccatactg gggcctgggc ttccacctgt gccgctgggg 1680
ctactcctcc accgctatca cccgccaggt ggtggagaac atgaccaggg cccacttccc 1740
cctggacgtc caatggaacg acctggacta catggactcc cggagggact tcacgttcaa 1800
caaggatggc ttccgggact tcccggccat ggtgcaggag ctgcaccagg gcggccggcg 1860
ctacatgatg atcgtggatc ctgccatcag cagctcgggc cctgccggga gctacaggcc 1920
ctacgacgag ggtctgcgga ggggggtttt catcaccaac gagaccggcc agccgctgat 1980
tgggaaggta tggcccgggt ccactgcctt ccccgacttc accaacccca cagccctggc 2040
ctggtgggag gacatggtgg ctgagttcca tgaccaggtg cccttcgacg gcatgtggat 2100
tgacatgaac gagccttcca acttcatcag aggctctgag gacggctgcc ccaacaatga 2160
gctggagaac ccaccctacg tgcctggggt ggttgggggg accctccagg cggccaccat 2220
ctgtgcctcc agccaccagt ttctctccac acactacaac ctgcacaacc tctacggcct 2280
gaccgaagcc atcgcctccc acagggcgct ggtgaaggct cgggggacac gcccatttgt 2340
gatctcccgc tcgacctttg ctggccacgg ccgatacgcc ggccactgga cgggggacgt 2400
gtggagctcc tgggagcagc tcgcctcctc cgtgccagaa atcctgcagt ttaacctgct 2460
gggggtgcct ctggtcgggg ccgacgtctg cggcttcctg ggcaacacct cagaggagct 2520
gtgtgtgcgc tggacccagc tgggggcctt ctaccccttc atgcggaacc acaacagcct 2580
gctcagtctg ccccaggagc cgtacagctt cagcgagccg gcccagcagg ccatgaggaa 2640
ggccctcacc ctgcgctacg cactcctccc ccacctctac acactgttcc accaggccca 2700
cgtcgcgggg gagaccgtgg cccggcccct cttcctggag ttccccaagg actctagcac 2760
ctggactgtg gaccaccagc tcctgtgggg ggaggccctg ctcatcaccc cagtgctcca 2820
ggccgggaag gccgaagtga ctggctactt ccccttgggc acatggtacg acctgcagac 2880
ggtgccaata gaggcccttg gcagcctccc acccccacct gcagctcccc gtgagccagc 2940
catccacagc gaggggcagt gggtgacgct gccggccccc ctggacacca tcaacgtcca 3000
cctccgggct gggtacatca tccccctgca gggccctggc ctcacaacca cagagtcccg 3060
ccagcagccc atggccctgg ctgtggccct gaccaagggt ggagaggccc gaggggagct 3120
gttctgggac gatggagaga gcctggaagt gctggagcga ggggcctaca cacaggtcat 3180
cttcctggcc aggaataaca cgatcgtgaa tgagctggta cgtgtgacca gtgagggagc 3240
tggcctgcag ctgcagaagg tgactgtcct gggcgtggcc acggcgcccc agcaggtcct 3300
ctccaacggt gtccctgtct ccaacttcac ctacagcccc gacaccaagg tcctggacat 3360
ctgtgtctcg ctgttgatgg gagagcagtt tctcgtcagc tggtgttagc gagcggccgc 3420
tcttagtagc agtatcgatc ccagcccact tttccccaat acgactacga gatctgtggc 3480
ttctagctgc ccgggtggca tccctgtgac ccctccccag tgcctctcct ggccctggaa 3540
gttgccactc cagtgcccac cagccttgtc ctaataaaat taagttgcat cattttgtct 3600
gactaggtgt ccttctataa tattatgggg tggagggggg tggtatggag caaggggcaa 3660
gttggggtcc ttcaacgtcg aactgtagca ctctggatag ctagctagcg tttgtagata 3720
gtttcaagga tagcaaccaa caacacgata gtttagaaat tgttctagat cttctgctac 3780
tactcgagag atagttgact tctagaagac tctggataga gagcttcctg tggtttctat 3840
ttcaacactt cgagcgattt agatagaggc gtcaattgag aacaaaaact ggacacctgt 3900
ttctagaaca ctagtgctag tcttctcaag gcttgatacg tcctgccact cacacacaaa 3960
aaaccaacac acagattaat gaaaataaag atcttttatt agagagcgag tggatagttt 4020
agagtcgctt gagacttatc ctgtgtccaa ctagccaaga gtagagagag agtgactagg 4080
tggatcgaga gatcgtcgtc tatttgactg ctagcctgtg ttctcgtcgt agtccaaatc 4140
ttcaatactc tggcgactag taacttgaat ctgtgtatct aacacgacaa ggctactcct 4200
ttgagtttct agtgataagt gcgactggat ctagctagtt gagtttctag aaactacgtc 4260
caaagctact agcacta 4277
<210> 82
<211> 4238
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 82
tcgagcttgg gctgcaggtc gagggcactg ggaggatgtt gagtaagatg gaaaactact 60
gatgaccctt gcagagacag agtattagga catgtttgaa caggggccgg gcgatcagca 120
ggtagctcta gaggatcccc gtctgtctgc acatttcgta gagcgagtgt tccgatactc 180
taatctccct aggcaaggtt catatttgtg taggttactt attctccttt tgttgactaa 240
gtcaataatc agaatcagca ggtttggagt cagcttggca gggatcagca gcctgggttg 300
gaaggagggg gtataaaagc cccttcacca ggagaagccg tcacacagac tagccctaag 360
gtaagttggc gccgtttaag ggatggttgg ttggtggggt attaatgttt aattaccttt 420
tttacaggcc tgaactaggc gcgccaccgc caccatgccg tcttctgtct cgtggggcat 480
cctcctgctg gcaggcctgt gctgcctggt ccctgtctcc ctggctgctc tgtgcggcgg 540
ggagctggtg gacaccctcc agttcgtctg tggggaccgc ggcttctact tcagcaggcc 600
cgcaagccgt gtgagccgtc gcagccgtgg catcgttgag gagtgctgtt tccgcagctg 660
tgacctggcc ctcctggaga cgtactgtgc tacccccgcc aagtccgagg gcgcgccggc 720
acaccccggc cgtcccagag cagtgcccac acagtgcgac gtccccccca acagccgctt 780
cgattgcgcc cctgacaagg ccatcaccca ggaacagtgc gaggcccgcg gctgctgcta 840
catccctgca aagcaggggc tgcagggagc ccagatgggg cagccctggt gcttcttccc 900
acccagctac cccagctaca agctggagaa cctgagctcc tctgaaatgg gctacacggc 960
caccctgacc cgtaccaccc ccaccttctt ccccaaggac atcctgaccc tgcggctgga 1020
cgtgatgatg gagactgaga accgcctcca cttcacgatc aaagatccag ctaacaggcg 1080
ctacgaggtg cccttggaga ccccgcgtgt ccacagccgg gcaccgtccc cactctacag 1140
cgtggagttc tccgaggagc ccttcggggt gatcgtgcac cggcagctgg acggccgcgt 1200
gctgctgaac acgacggtgg cgcccctgtt ctttgcggac cagttccttc agctgtccac 1260
ctcgctgccc tcgcagtata tcacaggcct cgccgagcac ctcagtcccc tgatgctcag 1320
caccagctgg accaggatca ccctgtggaa ccgggacctt gcgcccacgc ccggtgcgaa 1380
cctctacggg tctcaccctt tctacctggc gctggaggac ggcgggtcgg cacacggggt 1440
gttcctgcta aacagcaatg ccatggatgt ggtcctgcag ccgagccctg cccttagctg 1500
gaggtcgaca ggtgggatcc tggatgtcta catcttcctg ggcccagagc ccaagagcgt 1560
ggtgcagcag tacctggacg ttgtgggata cccgttcatg ccgccatact ggggcctggg 1620
cttccacctg tgccgctggg gctactcctc caccgctatc acccgccagg tggtggagaa 1680
catgaccagg gcccacttcc ccctggacgt ccaatggaac gacctggact acatggactc 1740
ccggagggac ttcacgttca acaaggatgg cttccgggac ttcccggcca tggtgcagga 1800
gctgcaccag ggcggccggc gctacatgat gatcgtggat cctgccatca gcagctcggg 1860
ccctgccggg agctacaggc cctacgacga gggtctgcgg aggggggttt tcatcaccaa 1920
cgagaccggc cagccgctga ttgggaaggt atggcccggg tccactgcct tccccgactt 1980
caccaacccc acagccctgg cctggtggga ggacatggtg gctgagttcc atgaccaggt 2040
gcccttcgac ggcatgtgga ttgacatgaa cgagccttcc aacttcatca gaggctctga 2100
ggacggctgc cccaacaatg agctggagaa cccaccctac gtgcctgggg tggttggggg 2160
gaccctccag gcggccacca tctgtgcctc cagccaccag tttctctcca cacactacaa 2220
cctgcacaac ctctacggcc tgaccgaagc catcgcctcc cacagggcgc tggtgaaggc 2280
tcgggggaca cgcccatttg tgatctcccg ctcgaccttt gctggccacg gccgatacgc 2340
cggccactgg acgggggacg tgtggagctc ctgggagcag ctcgcctcct ccgtgccaga 2400
aatcctgcag tttaacctgc tgggggtgcc tctggtcggg gccgacgtct gcggcttcct 2460
gggcaacacc tcagaggagc tgtgtgtgcg ctggacccag ctgggggcct tctacccctt 2520
catgcggaac cacaacagcc tgctcagtct gccccaggag ccgtacagct tcagcgagcc 2580
ggcccagcag gccatgagga aggccctcac cctgcgctac gcactcctcc cccacctcta 2640
cacactgttc caccaggccc acgtcgcggg ggagaccgtg gcccggcccc tcttcctgga 2700
gttccccaag gactctagca cctggactgt ggaccaccag ctcctgtggg gggaggccct 2760
gctcatcacc ccagtgctcc aggccgggaa ggccgaagtg actggctact tccccttggg 2820
cacatggtac gacctgcaga cggtgccaat agaggccctt ggcagcctcc cacccccacc 2880
tgcagctccc cgtgagccag ccatccacag cgaggggcag tgggtgacgc tgccggcccc 2940
cctggacacc atcaacgtcc acctccgggc tgggtacatc atccccctgc agggccctgg 3000
cctcacaacc acagagtccc gccagcagcc catggccctg gctgtggccc tgaccaaggg 3060
tggagaggcc cgaggggagc tgttctggga cgatggagag agcctggaag tgctggagcg 3120
aggggcctac acacaggtca tcttcctggc caggaataac acgatcgtga atgagctggt 3180
acgtgtgacc agtgagggag ctggcctgca gctgcagaag gtgactgtcc tgggcgtggc 3240
cacggcgccc cagcaggtcc tctccaacgg tgtccctgtc tccaacttca cctacagccc 3300
cgacaccaag gtcctggaca tctgtgtctc gctgttgatg ggagagcagt ttctcgtcag 3360
ctggtgttag cgagcggccg ctcttagtag cagtatcgat cccagcccac ttttccccaa 3420
tacgactacg agatctgtgg cttctagctg cccgggtggc atccctgtga cccctcccca 3480
gtgcctctcc tggccctgga agttgccact ccagtgccca ccagccttgt cctaataaaa 3540
ttaagttgca tcattttgtc tgactaggtg tccttctata atattatggg gtggaggggg 3600
gtggtatgga gcaaggggca agttggggtc cttcaacgtc gaactgtagc actctggata 3660
gctagctagc gtttgtagat agtttcaagg atagcaacca acaacacgat agtttagaaa 3720
ttgttctaga tcttctgcta ctactcgaga gatagttgac ttctagaaga ctctggatag 3780
agagcttcct gtggtttcta tttcaacact tcgagcgatt tagatagagg cgtcaattga 3840
gaacaaaaac tggacacctg tttctagaac actagtgcta gtcttctcaa ggcttgatac 3900
gtcctgccac tcacacacaa aaaaccaaca cacagattaa tgaaaataaa gatcttttat 3960
tagagagcga gtggatagtt tagagtcgct tgagacttat cctgtgtcca actagccaag 4020
agtagagaga gagtgactag gtggatcgag agatcgtcgt ctatttgact gctagcctgt 4080
gttctcgtcg tagtccaaat cttcaatact ctggcgacta gtaacttgaa tctgtgtatc 4140
taacacgaca aggctactcc tttgagtttc tagtgataag tgcgactgga tctagctagt 4200
tgagtttcta gaaactacgt ccaaagctac tagcacta 4238
<210> 83
<211> 4262
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 83
tcgagcttgg gctgcaggtc gagggcactg ggaggatgtt gagtaagatg gaaaactact 60
gatgaccctt gcagagacag agtattagga catgtttgaa caggggccgg gcgatcagca 120
ggtagctcta gaggatcccc gtctgtctgc acatttcgta gagcgagtgt tccgatactc 180
taatctccct aggcaaggtt catatttgtg taggttactt attctccttt tgttgactaa 240
gtcaataatc agaatcagca ggtttggagt cagcttggca gggatcagca gcctgggttg 300
gaaggagggg gtataaaagc cccttcacca ggagaagccg tcacacagac tagccctaag 360
gtaagttggc gccgtttaag ggatggttgg ttggtggggt attaatgttt aattaccttt 420
tttacaggcc tgaactaggc gcgccaccgc caccatgctc aggggtccgg gacccgggcg 480
gctgctgctg ctagcagtcc tgtgcctggg gacatcggtg cgctgcaccg aaaccgggaa 540
gagcaagagg gctctgtgcg gcggggagct ggtggacacc ctccagttcg tctgtgggga 600
ccgcggcttc tacttcagca ggcccgcaag ccgtgtgagc cgtcgcagcc gtggcatcgt 660
tgaggagtgc tgtttccgca gctgtgacct ggccctcctg gagacgtact gtgctacccc 720
cgccaagtcc gagggcgcgc cggcacaccc cggccgtccc agagcagtgc ccacacagtg 780
cgacgtcccc cccaacagcc gcttcgattg cgcccctgac aaggccatca cccaggaaca 840
gtgcgaggcc cgcggctgct gctacatccc tgcaaagcag gggctgcagg gagcccagat 900
ggggcagccc tggtgcttct tcccacccag ctaccccagc tacaagctgg agaacctgag 960
ctcctctgaa atgggctaca cggccaccct gacccgtacc acccccacct tcttccccaa 1020
ggacatcctg accctgcggc tggacgtgat gatggagact gagaaccgcc tccacttcac 1080
gatcaaagat ccagctaaca ggcgctacga ggtgcccttg gagaccccgc gtgtccacag 1140
ccgggcaccg tccccactct acagcgtgga gttctccgag gagcccttcg gggtgatcgt 1200
gcaccggcag ctggacggcc gcgtgctgct gaacacgacg gtggcgcccc tgttctttgc 1260
ggaccagttc cttcagctgt ccacctcgct gccctcgcag tatatcacag gcctcgccga 1320
gcacctcagt cccctgatgc tcagcaccag ctggaccagg atcaccctgt ggaaccggga 1380
ccttgcgccc acgcccggtg cgaacctcta cgggtctcac cctttctacc tggcgctgga 1440
ggacggcggg tcggcacacg gggtgttcct gctaaacagc aatgccatgg atgtggtcct 1500
gcagccgagc cctgccctta gctggaggtc gacaggtggg atcctggatg tctacatctt 1560
cctgggccca gagcccaaga gcgtggtgca gcagtacctg gacgttgtgg gatacccgtt 1620
catgccgcca tactggggcc tgggcttcca cctgtgccgc tggggctact cctccaccgc 1680
tatcacccgc caggtggtgg agaacatgac cagggcccac ttccccctgg acgtccaatg 1740
gaacgacctg gactacatgg actcccggag ggacttcacg ttcaacaagg atggcttccg 1800
ggacttcccg gccatggtgc aggagctgca ccagggcggc cggcgctaca tgatgatcgt 1860
ggatcctgcc atcagcagct cgggccctgc cgggagctac aggccctacg acgagggtct 1920
gcggaggggg gttttcatca ccaacgagac cggccagccg ctgattggga aggtatggcc 1980
cgggtccact gccttccccg acttcaccaa ccccacagcc ctggcctggt gggaggacat 2040
ggtggctgag ttccatgacc aggtgccctt cgacggcatg tggattgaca tgaacgagcc 2100
ttccaacttc atcagaggct ctgaggacgg ctgccccaac aatgagctgg agaacccacc 2160
ctacgtgcct ggggtggttg gggggaccct ccaggcggcc accatctgtg cctccagcca 2220
ccagtttctc tccacacact acaacctgca caacctctac ggcctgaccg aagccatcgc 2280
ctcccacagg gcgctggtga aggctcgggg gacacgccca tttgtgatct cccgctcgac 2340
ctttgctggc cacggccgat acgccggcca ctggacgggg gacgtgtgga gctcctggga 2400
gcagctcgcc tcctccgtgc cagaaatcct gcagtttaac ctgctggggg tgcctctggt 2460
cggggccgac gtctgcggct tcctgggcaa cacctcagag gagctgtgtg tgcgctggac 2520
ccagctgggg gccttctacc ccttcatgcg gaaccacaac agcctgctca gtctgcccca 2580
ggagccgtac agcttcagcg agccggccca gcaggccatg aggaaggccc tcaccctgcg 2640
ctacgcactc ctcccccacc tctacacact gttccaccag gcccacgtcg cgggggagac 2700
cgtggcccgg cccctcttcc tggagttccc caaggactct agcacctgga ctgtggacca 2760
ccagctcctg tggggggagg ccctgctcat caccccagtg ctccaggccg ggaaggccga 2820
agtgactggc tacttcccct tgggcacatg gtacgacctg cagacggtgc caatagaggc 2880
ccttggcagc ctcccacccc cacctgcagc tccccgtgag ccagccatcc acagcgaggg 2940
gcagtgggtg acgctgccgg cccccctgga caccatcaac gtccacctcc gggctgggta 3000
catcatcccc ctgcagggcc ctggcctcac aaccacagag tcccgccagc agcccatggc 3060
cctggctgtg gccctgacca agggtggaga ggcccgaggg gagctgttct gggacgatgg 3120
agagagcctg gaagtgctgg agcgaggggc ctacacacag gtcatcttcc tggccaggaa 3180
taacacgatc gtgaatgagc tggtacgtgt gaccagtgag ggagctggcc tgcagctgca 3240
gaaggtgact gtcctgggcg tggccacggc gccccagcag gtcctctcca acggtgtccc 3300
tgtctccaac ttcacctaca gccccgacac caaggtcctg gacatctgtg tctcgctgtt 3360
gatgggagag cagtttctcg tcagctggtg ttagcgagcg gccgctctta gtagcagtat 3420
cgatcccagc ccacttttcc ccaatacgac tacgagatct gtggcttcta gctgcccggg 3480
tggcatccct gtgacccctc cccagtgcct ctcctggccc tggaagttgc cactccagtg 3540
cccaccagcc ttgtcctaat aaaattaagt tgcatcattt tgtctgacta ggtgtccttc 3600
tataatatta tggggtggag gggggtggta tggagcaagg ggcaagttgg ggtccttcaa 3660
cgtcgaactg tagcactctg gatagctagc tagcgtttgt agatagtttc aaggatagca 3720
accaacaaca cgatagttta gaaattgttc tagatcttct gctactactc gagagatagt 3780
tgacttctag aagactctgg atagagagct tcctgtggtt tctatttcaa cacttcgagc 3840
gatttagata gaggcgtcaa ttgagaacaa aaactggaca cctgtttcta gaacactagt 3900
gctagtcttc tcaaggcttg atacgtcctg ccactcacac acaaaaaacc aacacacaga 3960
ttaatgaaaa taaagatctt ttattagaga gcgagtggat agtttagagt cgcttgagac 4020
ttatcctgtg tccaactagc caagagtaga gagagagtga ctaggtggat cgagagatcg 4080
tcgtctattt gactgctagc ctgtgttctc gtcgtagtcc aaatcttcaa tactctggcg 4140
actagtaact tgaatctgtg tatctaacac gacaaggcta ctcctttgag tttctagtga 4200
taagtgcgac tggatctagc tagttgagtt tctagaaact acgtccaaag ctactagcac 4260
ta 4262
<210> 84
<211> 4259
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 84
tcgagcttgg gctgcaggtc gagggcactg ggaggatgtt gagtaagatg gaaaactact 60
gatgaccctt gcagagacag agtattagga catgtttgaa caggggccgg gcgatcagca 120
ggtagctcta gaggatcccc gtctgtctgc acatttcgta gagcgagtgt tccgatactc 180
taatctccct aggcaaggtt catatttgtg taggttactt attctccttt tgttgactaa 240
gtcaataatc agaatcagca ggtttggagt cagcttggca gggatcagca gcctgggttg 300
gaaggagggg gtataaaagc cccttcacca ggagaagccg tcacacagac tagccctaag 360
gtaagttggc gccgtttaag ggatggttgg ttggtggggt attaatgttt aattaccttt 420
tttacaggcc tgaactaggc gcgccaccgc caccatgctt aggggtccgg ggcccgggct 480
gctgctgctg gccgtccagt gcctggggac agcggtgccc tccacgggag cctcgaagag 540
caagagggct ctgtgcggcg gggagctggt ggacaccctc cagttcgtct gtggggaccg 600
cggcttctac ttcagcaggc ccgcaagccg tgtgagccgt cgcagccgtg gcatcgttga 660
ggagtgctgt ttccgcagct gtgacctggc cctcctggag acgtactgtg ctacccccgc 720
caagtccgag ggcgcgccgg cacaccccgg ccgtcccaga gcagtgccca cacagtgcga 780
cgtccccccc aacagccgct tcgattgcgc ccctgacaag gccatcaccc aggaacagtg 840
cgaggcccgc ggctgctgct acatccctgc aaagcagggg ctgcagggag cccagatggg 900
gcagccctgg tgcttcttcc cacccagcta ccccagctac aagctggaga acctgagctc 960
ctctgaaatg ggctacacgg ccaccctgac ccgtaccacc cccaccttct tccccaagga 1020
catcctgacc ctgcggctgg acgtgatgat ggagactgag aaccgcctcc acttcacgat 1080
caaagatcca gctaacaggc gctacgaggt gcccttggag accccgcgtg tccacagccg 1140
ggcaccgtcc ccactctaca gcgtggagtt ctccgaggag cccttcgggg tgatcgtgca 1200
ccggcagctg gacggccgcg tgctgctgaa cacgacggtg gcgcccctgt tctttgcgga 1260
ccagttcctt cagctgtcca cctcgctgcc ctcgcagtat atcacaggcc tcgccgagca 1320
cctcagtccc ctgatgctca gcaccagctg gaccaggatc accctgtgga accgggacct 1380
tgcgcccacg cccggtgcga acctctacgg gtctcaccct ttctacctgg cgctggagga 1440
cggcgggtcg gcacacgggg tgttcctgct aaacagcaat gccatggatg tggtcctgca 1500
gccgagccct gcccttagct ggaggtcgac aggtgggatc ctggatgtct acatcttcct 1560
gggcccagag cccaagagcg tggtgcagca gtacctggac gttgtgggat acccgttcat 1620
gccgccatac tggggcctgg gcttccacct gtgccgctgg ggctactcct ccaccgctat 1680
cacccgccag gtggtggaga acatgaccag ggcccacttc cccctggacg tccaatggaa 1740
cgacctggac tacatggact cccggaggga cttcacgttc aacaaggatg gcttccggga 1800
cttcccggcc atggtgcagg agctgcacca gggcggccgg cgctacatga tgatcgtgga 1860
tcctgccatc agcagctcgg gccctgccgg gagctacagg ccctacgacg agggtctgcg 1920
gaggggggtt ttcatcacca acgagaccgg ccagccgctg attgggaagg tatggcccgg 1980
gtccactgcc ttccccgact tcaccaaccc cacagccctg gcctggtggg aggacatggt 2040
ggctgagttc catgaccagg tgcccttcga cggcatgtgg attgacatga acgagccttc 2100
caacttcatc agaggctctg aggacggctg ccccaacaat gagctggaga acccacccta 2160
cgtgcctggg gtggttgggg ggaccctcca ggcggccacc atctgtgcct ccagccacca 2220
gtttctctcc acacactaca acctgcacaa cctctacggc ctgaccgaag ccatcgcctc 2280
ccacagggcg ctggtgaagg ctcgggggac acgcccattt gtgatctccc gctcgacctt 2340
tgctggccac ggccgatacg ccggccactg gacgggggac gtgtggagct cctgggagca 2400
gctcgcctcc tccgtgccag aaatcctgca gtttaacctg ctgggggtgc ctctggtcgg 2460
ggccgacgtc tgcggcttcc tgggcaacac ctcagaggag ctgtgtgtgc gctggaccca 2520
gctgggggcc ttctacccct tcatgcggaa ccacaacagc ctgctcagtc tgccccagga 2580
gccgtacagc ttcagcgagc cggcccagca ggccatgagg aaggccctca ccctgcgcta 2640
cgcactcctc ccccacctct acacactgtt ccaccaggcc cacgtcgcgg gggagaccgt 2700
ggcccggccc ctcttcctgg agttccccaa ggactctagc acctggactg tggaccacca 2760
gctcctgtgg ggggaggccc tgctcatcac cccagtgctc caggccggga aggccgaagt 2820
gactggctac ttccccttgg gcacatggta cgacctgcag acggtgccaa tagaggccct 2880
tggcagcctc ccacccccac ctgcagctcc ccgtgagcca gccatccaca gcgaggggca 2940
gtgggtgacg ctgccggccc ccctggacac catcaacgtc cacctccggg ctgggtacat 3000
catccccctg cagggccctg gcctcacaac cacagagtcc cgccagcagc ccatggccct 3060
ggctgtggcc ctgaccaagg gtggagaggc ccgaggggag ctgttctggg acgatggaga 3120
gagcctggaa gtgctggagc gaggggccta cacacaggtc atcttcctgg ccaggaataa 3180
cacgatcgtg aatgagctgg tacgtgtgac cagtgaggga gctggcctgc agctgcagaa 3240
ggtgactgtc ctgggcgtgg ccacggcgcc ccagcaggtc ctctccaacg gtgtccctgt 3300
ctccaacttc acctacagcc ccgacaccaa ggtcctggac atctgtgtct cgctgttgat 3360
gggagagcag tttctcgtca gctggtgtta gcgagcggcc gctcttagta gcagtatcga 3420
tcccagccca cttttcccca atacgactac gagatctgtg gcttctagct gcccgggtgg 3480
catccctgtg acccctcccc agtgcctctc ctggccctgg aagttgccac tccagtgccc 3540
accagccttg tcctaataaa attaagttgc atcattttgt ctgactaggt gtccttctat 3600
aatattatgg ggtggagggg ggtggtatgg agcaaggggc aagttggggt ccttcaacgt 3660
cgaactgtag cactctggat agctagctag cgtttgtaga tagtttcaag gatagcaacc 3720
aacaacacga tagtttagaa attgttctag atcttctgct actactcgag agatagttga 3780
cttctagaag actctggata gagagcttcc tgtggtttct atttcaacac ttcgagcgat 3840
ttagatagag gcgtcaattg agaacaaaaa ctggacacct gtttctagaa cactagtgct 3900
agtcttctca aggcttgata cgtcctgcca ctcacacaca aaaaaccaac acacagatta 3960
atgaaaataa agatctttta ttagagagcg agtggatagt ttagagtcgc ttgagactta 4020
tcctgtgtcc aactagccaa gagtagagag agagtgacta ggtggatcga gagatcgtcg 4080
tctatttgac tgctagcctg tgttctcgtc gtagtccaaa tcttcaatac tctggcgact 4140
agtaacttga atctgtgtat ctaacacgac aaggctactc ctttgagttt ctagtgataa 4200
gtgcgactgg atctagctag ttgagtttct agaaactacg tccaaagcta ctagcacta 4259
<210> 85
<211> 165
<212> DNA
<213> Homo sapiens
<400> 85
ccgggcggag tgtgttagtc tctccagagg gaggctggtt ccccagggaa gcagagcctg 60
tgtgcgggca gcagctgtgt gcgggcctgg gggttgttaa gtgcaattat ttttaataaa 120
aggggcattt ggaaaaaaaa aaaaaaggta gcagtcgaca gatga 165