(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024133642
(43)【公開日】2024-10-02
(54)【発明の名称】活性DNAトランスポゾンシステム及びその使用方法
(51)【国際特許分類】
C12N 15/11 20060101AFI20240925BHJP
C12N 15/63 20060101ALI20240925BHJP
C12N 15/09 20060101ALI20240925BHJP
C12N 15/113 20100101ALI20240925BHJP
C12N 15/52 20060101ALN20240925BHJP
C12N 9/00 20060101ALN20240925BHJP
【FI】
C12N15/11 Z ZNA
C12N15/63 Z
C12N15/09 100
C12N15/113 Z
C12N15/11 Z
C12N15/52 Z
C12N9/00
【審査請求】有
【請求項の数】15
【出願形態】OL
(21)【出願番号】P 2024109264
(22)【出願日】2024-07-05
(62)【分割の表示】P 2022560171の分割
【原出願日】2021-03-30
(31)【優先権主張番号】PCT/CN2020/082087
(32)【優先日】2020-03-30
(33)【優先権主張国・地域又は機関】CN
(71)【出願人】
【識別番号】520176566
【氏名又は名称】中国科学院動物研究所
【氏名又は名称原語表記】INSTITUTE OF ZOOLOGY,CHINESE ACADEMY OF SCIENCES
【住所又は居所原語表記】No.5, 1 Beichen West Road, Chaoyang District, Beijing 100101, China
(74)【代理人】
【識別番号】100136629
【弁理士】
【氏名又は名称】鎌田 光宜
(74)【代理人】
【識別番号】100080791
【弁理士】
【氏名又は名称】高島 一
(74)【代理人】
【識別番号】100125070
【弁理士】
【氏名又は名称】土井 京子
(74)【代理人】
【識別番号】100121212
【弁理士】
【氏名又は名称】田村 弥栄子
(74)【代理人】
【識別番号】100174296
【弁理士】
【氏名又は名称】當麻 博文
(74)【代理人】
【識別番号】100137729
【弁理士】
【氏名又は名称】赤井 厚子
(74)【代理人】
【識別番号】100152308
【弁理士】
【氏名又は名称】中 正道
(74)【代理人】
【識別番号】100201558
【弁理士】
【氏名又は名称】亀井 恵二郎
(72)【発明者】
【氏名】王皓毅
(72)【発明者】
【氏名】張勇
(72)【発明者】
【氏名】譚生軍
(72)【発明者】
【氏名】張童童
(57)【要約】 (修正有)
【課題】インビトロ又は細胞内で標的核酸に異種核酸を挿入するのに有用な、操作された転移因子、前記操作された転移因子を含む遺伝子導入システム、及びこれらを用いる方法とキットを提供する。
【解決手段】操作された転移因子であって、5’から3’への順に、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、前記5’TRおよび前記3’TRは、それぞれ特定の配列と少なくとも約90%の配列同一性を有する核酸配列を含む、転移因子が提供される。
【選択図】なし
【特許請求の範囲】
【請求項1】
操作された転移因子であって、5’から3’への順に、
5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、
前記5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、
前記3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、
異種核酸の細胞DNAへの挿入を可能とする転移活性を示す操作された転移因子。
【請求項2】
前記5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を含み、及び/又は前記3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を含む請求項1に記載の転移因子。
【請求項3】
前記5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列を含み、及び/又は前記3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列を含む請求項2に記載の転移因子。
【請求項4】
前記5’TRの5’側に連結される5’標的部位反復配列(TSD)又は前記3’TRの3’側に連結される3’TSDをさらに含み、前記5’TSDはSEQ ID NO:
191~206から選択される核酸配列、その変異体又はそのフラグメントを含み、前記3’TSDはSEQ ID NO: 191~206から選択される核酸配列、その変異体又はそのフラグメントを含む請求項1~3のいずれか1項に記載の転移因子。
【請求項5】
前記5’TRはSEQ ID NO: 3、8、11、12、13、16、22、23、79及び82から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を含み、前記3’TRはSEQ ID NO: 29、34、37、38、39、42、48、49、91及び94から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列である請求項1~4のいずれか1項に記載の転移因子。
【請求項6】
(a) 前記5’TRはSEQ ID NO: 3の核酸配列を含み、前記3’TRはSEQ ID NO: 29の核酸配列を含み、
(b) 前記5’TRはSEQ ID NO: 8の核酸配列を含み、前記3’TRはSEQ ID NO: 34の核酸配列を含み、
(c) 前記5’TRはSEQ ID NO: 11の核酸配列を含み、前記3’TRはSEQ ID NO: 37の核酸配列を含み、
(d) 前記5’TRはSEQ ID NO: 12の核酸配列を含み、前記3’TRはSEQ ID NO: 38の核酸配列を含み、又は
(e) 前記5’TRはSEQ ID NO: 16の核酸配列を含み、前記3’TRはSEQ ID NO: 42の核酸配列を含む請求項5に記載の転移因子。
【請求項7】
前記異種核酸はコード配列を含む請求項1~6のいずれか1項に記載の転移因子。
【請求項8】
前記異種核酸は前記コード配列に作動可能に連結されるプロモータをさらに含む請求項7に記載の転移因子。
【請求項9】
前記転移因子の転移活性はpiggyBac(PB)トランスポゾン、Sleeping Beauty(SB)トランスポゾン及び/又はTcBuster(TB)トランスポゾンの転移活性よりも高い請求項1~8のいずれか1項に記載の転移因子。
【請求項10】
前記細胞は動物細胞、植物細胞、藻類細胞、真菌細胞、酵母細胞又は細菌細胞である請求項1~9のいずれか1項に記載の転移因子。
【請求項11】
前記細胞は哺乳類細胞である請求項1~10のいずれか1項に記載の転移因子。
【請求項12】
前記哺乳類細胞は免疫細胞、肝臓細胞、腫瘍細胞、幹細胞、受精卵、筋細胞及び皮膚細胞から選択される請求項11に記載の転移因子。
【請求項13】
前記細胞はヒト細胞である請求項11又は12に記載の転移因子。
【請求項14】
ヒト胚腎293T(293T)細胞での転移活性がHeLa細胞での転移活性よりも高い請求項1~13のいずれか1項に記載の転移因子。
【請求項15】
ベクターに存在する請求項1~14のいずれか1項に記載の転移因子。
【請求項16】
前記ベクターはプラスミドベクター又はウイルスベクターである請求項15に記載の転移因子。
【請求項17】
1)請求項1~16のいずれか1項に記載の操作された転移因子と、2)トランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システム。
【請求項18】
前記トランスポザーゼはSEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む請求項17に記載の遺伝子導入システム。
【請求項19】
1)操作された転移因子と、2)トランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含み、前記転移因子は、5’から3’へ、
5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、
前記転移因子は異種核酸の細胞DNAへの挿入を可能とする転移活性を示し、
前記トランスポザーゼはSEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む、遺伝子導入システム。
【請求項20】
前記5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、前記3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含む請求項19に記載の遺伝子導入システム。
【請求項21】
(a) 前記5’TRはSEQ ID NO: 3の核酸配列を含み、前記3’TRはSEQ ID NO: 29の核酸配列を含み、前記トランスポザーゼはSEQ ID NO: 55のアミノ酸配列を含み、
(b) 前記5’TRはSEQ ID NO: 8の核酸配列を含み、前記3’TRはSEQ ID NO: 34の核酸配列を含み、前記トランスポザーゼはSEQ ID NO: 60のアミノ酸配列を含み、
(c) 前記5’TRはSEQ ID NO: 11の核酸配列を含み、前記3’TRはSEQ ID NO: 37の核酸配列を含み、前記トランスポザーゼはSEQ ID
NO: 63のアミノ酸配列を含み、
(d) 前記5’TRはSEQ ID NO: 12の核酸配列を含み、前記3’TRはSEQ ID NO: 38の核酸配列を含み、前記トランスポザーゼはSEQ ID
NO: 64のアミノ酸配列を含み、又は
(e) 前記5’TRはSEQ ID NO: 16の核酸配列を含み、前記3’TR
はSEQ ID NO: 42の核酸配列を含み、前記トランスポザーゼはSEQ ID
NO: 68のアミノ酸配列を含む請求項20に記載の遺伝子導入システム。
【請求項22】
前記トランスポザーゼをコードする核酸を含む請求項17~21のいずれか1項に記載の遺伝子導入システム。
【請求項23】
前記転移因子及び前記トランスポザーゼをコードする核酸は異なるベクターにある請求項22に記載の遺伝子導入システム。
【請求項24】
前記転移因子及び前記トランスポザーゼをコードする核酸は同一ベクターにある請求項22に記載の遺伝子導入システム。
【請求項25】
標的核酸に異種核酸を挿入する方法であって、
前記標的核酸と、請求項1~16のいずれか1項に記載の転移因子又は請求項17~24のいずれか1項に記載の遺伝子導入システムとを接触させることで、前記異種核酸を前記標的核酸に挿入することを含む方法。
【請求項26】
インビトロで行われる請求項25に記載の方法。
【請求項27】
前記標的核酸は細胞内にある請求項25に記載の方法。
【請求項28】
前記標的核酸はゲノムDNAである請求項27に記載の方法。
【請求項29】
前記細胞は動物細胞、植物細胞、藻類細胞、真菌細胞、酵母細胞又は細菌細胞である請求項27又は28に記載の方法。
【請求項30】
前記細胞は哺乳類細胞である請求項29に記載の方法。
【請求項31】
前記哺乳類細胞は免疫細胞、肝臓細胞、腫瘍細胞、幹細胞、受精卵、筋細胞及び皮膚細胞から選択される請求項30に記載の方法。
【請求項32】
前記異種核酸の挿入により前記細胞の遺伝子を不活化させる請求項28~31のいずれか1項に記載の方法。
【請求項33】
前記異種核酸はタンパク質をコードする請求項25~32のいずれか1項に記載の方法。
【請求項34】
前記タンパク質は、レポータータンパク質、操作された受容体、サイトカイン、抗生物質耐性タンパク質、抗原及び治療的タンパク質からなる群から選択される請求項33に記載の方法。
【請求項35】
前記異種核酸はRNAをコードする請求項25~32のいずれか1項に記載の方法。
【請求項36】
前記RNAは、治療的RNA、低分子干渉RNA(siRNA)、微小RNA、ショートヘアピンRNA(shRNA)、ロングノンコードRNA(lincRNA)及びガイドRNA(gRNA)からなる群から選択される請求項35に記載の方法。
【請求項37】
前記異種核酸の長さが約2kb~約300kbである請求項25~36のいずれか1項に記載の方法。
【請求項38】
前記挿入はランダムである請求項25~37のいずれか1項に記載の方法。
【請求項39】
異種核酸を標的核酸に挿入する請求項1~16のいずれか1項に記載の操作された転移因子、又は請求項17~24のいずれか1項に記載の遺伝子導入システム及びプロトコールを含むキット。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本願は2020年3月30日に提出された国際特許出願番号PCT/CN2020 /082087の優先権を主張しており、その内容は引用により全体としてここに組み込まれる。
【0002】
WIPO標準ST.25準拠の配列表の参照
原出願において提出された以下のASCIIテキストファイルの内容は、本明細書の末尾において引用することにより全体としてここに組み込まれる。配列表のコンピュータ読み取り可能な形式(CRF)(ファイル名:182452000641SEQLIST.txt、記録日:2021年3月29日、サイズ:244kb)。
【0003】
技術分野
本願は一般に遺伝学の分野に関する。より具体的には、本願は転移因子及びその使用に関する。
【背景技術】
【0004】
DNAを細胞に導入する典型的な方法は、リン酸カルシウム、ポリエチレングリコールなどのDNA凝集剤、リポソーム、多層小胞などの脂質含有試薬、及びウイルス媒介性戦略を含む。しかし、そのような方法には限界がある。例えば、DNA凝集剤及びウイルス媒介性戦略に関連するサイズ制限が存在する。さらに、細胞にトランスフェクション可能な核酸の量は、ウイルス戦略において制限される。全ての方法は送達された核酸を細胞の核酸に挿入することに有利であるわけではなく、DNA凝集法や脂質含有試薬の調製は比較的容易であるが、ウイルスベクターに核酸を挿入するのは手間がかかる。ウイルス媒介性戦略は、細胞タイプ又は組織タイプに特異的なものであってもよく、ウイルス媒介性戦略を使用してインビボで使用すると、免疫学的な問題が生じる。
【0005】
これらの問題を克服するための適切なツールの1つは、転移因子を介することである。転移因子(トランスポゾン・エレメント)(TE、トランスポゾン、又はジャンピング遺伝子)は、核酸中のその位置を変化させることで、突然変異を生成又は逆転させ、ゲノム中の配列を変化させることができるDNA配列である。転移因子は多くの真核ゲノムの大部を表している。例えば、ヒトゲノムの約50%は転移因子配列に由来するが、植物などの他のゲノムは、転移因子由来のDNAの割合が高い。転移因子は通常、クラス1とクラス2の2つに分類される。クラス1の代表は、レトロトランスポゾンであり、1)内因性レトロウイルス(ERV)のような長鎖末端反復配列(LTR)レトロトランスポゾン、及び2)長鎖散在反復配列(LINE)及び短鎖散在反復配列(SINE)のような非LTRレトロトランスポゾンを含む。クラス2 TEは、1)末端反復配列(TR、末端逆向き反復配列TIRとも呼ばれる)を特徴とし、トランスポザーゼによって移動可能な「切り貼り」DNAトランスポゾン、及び2)例えば、ヘリトロン及びポリントンを含むような非「切り貼り」DNAトランスポゾンを含む。クラス2 TEは多くの真核生物に広く存在し活性を有するが、これらの全てのTEが転移活性を有するわけではない。最近の活性転移因子の例には、過去数百万年の間に移動の兆候を示したhAT及びpiggyBaスーパーファミリーのメンバーが含まれている。しかしながら、現在のところ、遺伝子発現研究や遺伝子治療に利用できる活性転移因子は限られている。
【0006】
したがって、DNAを細胞内に導入するのに適した新規な転移因子、及びこの転移因子を介して異なるサイズの異種配列を細胞の核酸に、又はDNAを細胞のゲノムに効率的に
挿入するための方法及びシステムが必要である。
【発明の概要】
【発明が解決しようとする課題】
【0007】
本願は、操作された転移因子、前記操作された転移因子を含む遺伝子導入システム、及びこれらを用いた方法とキットを提供する。また、インビトロ又は細胞内で異種核酸を標的核酸に挿入する方法を提供する。本明細書の前記組成物、システム及び方法は、タグ化、ゲノム工学及び遺伝子発現の研究など、様々な用途に有用である。
【課題を解決するための手段】
【0008】
一態様では、本願は、5’から3’への順に、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、前記転移因子は異種核酸の細胞DNAへの挿入を可能とする転移活性を示す操作された転移因子を提供する。いくつかの実施形態では、前記5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を含む。いくつかの実施形態では、前記5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列を含む。いくつかの実施形態では、前記3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を含む。いくつかの更なる実施形態では、前記3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列を含む。
【0009】
上記操作された転移因子の何れかに係る実施形態では、前記転移因子は、5’TRの5’側に連結される5’標的部位反復配列(TSD)又は3’TRの3’側に連結される3’TSDをさらに含む。いくつかの実施形態では、前記5’TSDと3’TSDの核酸配列は同一の配列である。いくつかの実施形態では、前記5’TSDはSEQ ID NO: 191~206から選択される核酸配列、その変異体又はそのフラグメントを含み、前記3’TSDはSEQ ID NO: 191~206から選択される核酸配列、その変異体又はそのフラグメントを含む。
【0010】
上記操作された転移因子の何れかに係る実施形態では、前記5’TRはSEQ ID NO: 3、8、11、12、13、16、22、23、29及び82から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を含み、前記3’TRはSEQ ID NO: 29、34、37、38、39、42、48、49、91及び94から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を含む。
【0011】
上記操作された転移因子の何れかに係る実施形態では、前記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt、Tc1-1_AG、Tc1-1_PM、Tc1-4_Xt、Tc1-15_Xt、Mariner-6_AMi又はMariner-3_Crpに由来する。いくつかの実施形態では、前記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。いくつかの実施形態では、前記5’TRはSEQ ID NO: 3の核酸配列を含み、前記3’TRはSEQ ID NO: 29の核酸配列を含む。いくつかの実施形態では、前記5’TRはSEQ ID NO: 8の核酸配列を含み、前記3’TRはSEQ ID NO: 34の核酸配列を含む。いくつかの実施形態では、前記5’TRはSEQ ID NO: 11の核酸配列を含み、前記3’TRはSEQ ID NO: 37の核酸配列を含む。いくつかの実施形態では、前記5’TRはSEQ ID NO: 12の核酸配列を含み、前記3
’TRはSEQ ID NO: 38の核酸配列を含む。いくつかの実施形態では、前記5’TRはSEQ ID NO: 16の核酸配列を含み、前記3’TRはSEQ ID
NO: 42の核酸配列を含む。
【0012】
上記操作された転移因子の何れかに係る実施形態では、前記異種核酸はコード配列を含む。いくつかの更なる実施形態では、前記異種核酸は前記コード配列に作動可能に連結されるプロモータをさらに含む。
【0013】
上記操作された転移因子の何れかに係る実施形態では、前記転移因子の転移活性がpiggyBac(PB)トランスポゾン、Sleeping Beauty(SB)トランスポゾン及び/又はTcBusterトランスポゾンの転移活性よりも高い。
【0014】
上記操作された転移因子の何れかに係る実施形態では、前記細胞は動物細胞、植物細胞、藻類細胞、真菌細胞、酵母細胞又は細菌細胞である。いくつかの実施形態では、前記細胞は哺乳類細胞である。いくつかの実施形態では、前記哺乳類細胞は免疫細胞(例えば、T細胞)、肝臓細胞、腫瘍細胞、幹細胞、受精卵、筋細胞及び皮膚細胞から選択される。いくつかの実施形態では、前記細胞はヒト細胞である。いくつかの実施形態では、前記転移因子はヒト胚腎293T(293T)細胞での転移活性がHeLa細胞での転移活性よりも高い。
【0015】
上記操作された転移因子の何れかに係る実施形態では、前記転移因子はベクターに存在する。いくつかの更なる実施形態では、前記ベクターはプラスミドベクター又はウイルスベクターである。
【0016】
本願の別の態様は、1)上記の転移因子の何れかに係る操作された転移因子と、2)トランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システムを提供する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む。
【0017】
更なる態様では、本願は、1)操作された転移因子と、2)トランスポザーゼ又はトランスポザーゼをコードする核酸と、を含み、前記転移因子は、5’から3’への順に、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、前記転移因子は異種核酸の細胞DNAへの挿入を可能とする転移活性を示し、前記トランスポザーゼはSEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む遺伝子導入システムを提供する。いくつかの実施形態では、前記5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含む。
【0018】
上記遺伝子導入システムの何れかに係るいくつかの実施形態では、前記転移因子は、SEQ ID NO: 3、8、11、12、13、16、22、23、29及び82から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を有する5’TRを含み、前記3’TRはSEQ ID NO: 29、34、37、38、39、42、48、49、91及び94から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を含む。いくつかの実施形態では、前記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt、Tc1-1_AG、Tc1-1_PM、Tc1-4_Xt、Tc1-15_Xt、Mariner-6_AMi又はMariner-3_Crpに由来する。いくつかの実施形態では、前記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。いくつかの実施形態では、前記
5’TRはSEQ ID NO: 3の核酸配列を含み、前記3’TRはSEQ ID NO: 29の核酸配列を含み、前記トランスポザーゼはSEQ ID NO: 55のアミノ酸配列を含む。いくつかの実施形態では、前記5’TRはSEQ ID NO: 8の核酸配列を含み、前記3’TRはSEQ ID NO: 34の核酸配列を含み、前記トランスポザーゼはSEQ ID NO: 60のアミノ酸配列を含む。いくつかの実施形態では、前記5’TRはSEQ ID NO: 11の核酸配列を含み、前記3’TRはSEQ ID NO: 37の核酸配列を含み、前記トランスポザーゼはSEQ ID NO: 63のアミノ酸配列を含む。いくつかの実施形態では、前記5’TRはSEQ ID NO: 12の核酸配列を含み、前記3’TRはSEQ ID NO: 38の核酸配列を含み、前記トランスポザーゼはSEQ ID NO: 64のアミノ酸配列を含む。いくつかの実施形態では、前記5’TRはSEQ ID NO: 16の核酸配列を含み、前記3’TRはSEQ ID NO: 42の核酸配列を含み、前記トランスポザーゼはSEQ ID NO: 68のアミノ酸配列を含む。
【0019】
上記遺伝子導入システムの何れかに係るいくつかの実施形態では、前記遺伝子導入システムはトランスポザーゼをコードする核酸を含む。いくつかの更なる実施形態では、前記転移因子とトランスポザーゼをコードする核酸は異なるベクターにある。いくつかの更なる特定実施形態では、前記転移因子とトランスポザーゼをコードする核酸は同一ベクターにある。
【0020】
更なる態様では、本願は、標的核酸と、上記操作された転移因子の何れかに係る転移因子又は上記遺伝子導入システムの何れかに係る遺伝子導入システムとを接触させることを含む標的核酸に異種核酸を挿入する方法を提供する。いくつかの実施形態では、該方法はインビトロで行われる。いくつかの実施形態では、前記標的核酸は細胞内にある。いくつかの実施形態では、前記標的核酸はゲノムDNAである。
【0021】
上記方法の何れかに係るいくつかの実施形態では、前記標的核酸は細胞内にあり、該細胞は動物細胞、植物細胞、藻類細胞、真菌細胞、酵母細胞又は細菌細胞である。いくつかの実施形態では、前記細胞は哺乳類細胞である。いくつかの実施形態では、前記哺乳類細胞は免疫細胞(例えば、T細胞)、肝臓細胞、腫瘍細胞、幹細胞、受精卵、筋細胞及び皮膚細胞から選択される。いくつかの実施形態では、前記異種核酸の挿入により細胞の遺伝子が不活性化する。
【0022】
上記方法の何れかに係るいくつかの実施形態では、前記異種核酸はタンパク質をコードする。いくつかの実施形態では、前記タンパク質はレポータータンパク質、操作された受容体、サイトカイン、抗生物質耐性タンパク質、抗原及び治療的タンパク質から選択される。
【0023】
上記方法の何れかに係るいくつかの実施形態では、前記異種核酸はRNAをコードする。いくつかの実施形態では、前記RNAは治療的RNA、低分子干渉RNA(siRNA)、微小RNA(マイクロRNA)、ショートヘアピンRNA(shRNA)、ロングノンコードRNA(lincRNA)及びガイドRNA(gRNA)から選択される。いくつかの実施形態では、前記異種核酸は1種以上の分子をコードする。
【0024】
上記方法の何れかに係るいくつかの実施形態では、前記異種核酸の長さが約300,0
00塩基(kb)以下、例えば、約10kb~約300kb、又は約100塩基対(bp)~約10kb、又は約100 bp~約5kb、又は約100 bp~約2kb、又は約2kb~約300kbである。
【0025】
上記方法の何れかに係るいくつかの実施例では、前記挿入はランダムである。
【0026】
更なる態様では、本願は、上記操作された転移因子の何れかに係る転移因子、又は上記遺伝子導入システムの何れかに係る遺伝子導入システム、及び異種核酸を標的核酸に挿入するプロトコールを含むキットを提供する。
【図面の簡単な説明】
【0027】
【
図1】活性転移因子(TE)の同定を説明する図を示す。
【
図2】同定された131個の転移因子(TE)の要約を示し、これらの転移因子(TE)は長さ300アミノ酸(aa)以上のオープンリーディングフレーム(ORF)、トランスポザーゼ(Tn)ドメイン及び25%以下の平均差を有する。円グラフは同定された131個のTEの5つのスーパーファミリーの分布を説明する。
【
図3】活性転移因子をスクリーニングするための例示的な二元構築体を示す。上段の構築体はトランスポザーゼが発現する補助構築体であり、5’から3’への順に、サイトメガロウイルス(CMV)プロモータ、トランスポザーゼ(Tn)遺伝子及びpolyA(pA)シグナルを含む。下段の構築体はドナー構築体であり、5’から3’への順に、ホスホグリセリン酸キナーゼ(PGK)プロモータ、5’標的部位反復(5’TSD)配列、5’末端反復(5’TR)配列、ピューロマイシン-耐性増強型GFP融合タンパク質(Puro-eGFP)をコードする配列、3’末端反復(3’TR)配列、3’標的部位反復(3’TSD)配列及びpolyA(pA)シグナルを含む。
【
図4】
図4A~4Bは、HEK293T(293T)及びHeLa細胞内で、piggyBac、Hyper piggyBac及びSB100Xを含む対照TEと比較した、5%以下の差を有する同定された転移因子の転移活性を示す。
図4AはHEK293T(293T)及びHeLa細胞内で、piggyBac、Hyper piggyBac、SB100X、TcBuster(TB)を含む対照TE及び陰性対照(NC)と比較した、以下の同定された転移因子の転移活性を示す:1_hAT-2_AG、2_AgaP12、 3_P3_AG、4_HAT2_CI、5_HAT5_CI、6_hAT-6_DR、7_Chaplin1_DR、8_Harbinger-4_XT、9_HAT1_AG、10_AgaP15、11_IS4EU-1_DR、12_POGO、14_Tc1-8B_DR、15_HOBO、17_hAT -6_PM、18_MARISP1、19_hAT-7_XT、20_BARI_DM、21_Mariner-3_PM、22_hAT-3_XT、23_P1_AG、24_IS4EU-2_DR、25_Tc1-3_Xt、26_Mariner-1_PM、27_P2_AG、28_hAT-5_DR、29_Tc1-3_FR、30_Mariner-4_XT、32_Tc1-5_Xt、33_Tc1-10_Xt及び34_hAT-1_D。
図4Bは、HEK293T(293T)及びHeLa細胞内で、piggyBac、Hyper piggyBac、SB100X、TcBuster(TB)を含む対照TE及び陰性対照(NC)と比較した、以下の同定された転移因子の転移活性を示す:35_Mariner2_AG、36_Tc1-1_Xt、37_Tc1-1_AG、38_Mariner-1_XT、39_Tc1DR3_Xt、40_hAT-1B_PM、41_hAT-3_PM、42_hAT-6B_PM、43_Tc1-1_PM、44_TC1_XL、45_Mariner-4_AMi、46_Myotis_hAT1 、47_hAT-7_PM、48_TC1_FR4、49_hAT-8_PM、50_piggyBac1_Mm、51_Tc1-11_Xt、52_Tc1~16_Xt、53_TC1-2_DM、54_Tc1-4_Xt、55_TC1_DM、56_Tc1-15_Xt、59_TC1_FR2、60_Mariner-6B_AMi、61_Tc1-9_Xt、63_hAT-9_XT、64_Mariner-5_XT、65_S2_DM、67_PROTOP、68_Tc1-8_Xt及び69_Tc1-12_Xt。
【
図5】
図5A~5Bは、HEK293T(293T)において5%よりも大きい差を有する同定された転移因子の転移活性を示す。
図5AはHEK293T(293T)における以下の同定された転移因子の転移活性を示す:70_Mariner-6_AMi、71_hAT-3_Gav、72_piggyBac2_Mm、73_Mariner-2_XT、74_hAT-4_Crp、75_OposCharlie2、76_hAT-1_AMi、77_Mariner-2_AMi、78_hAT-13_AMi、80_hAT-12_AMi、81_Mariner-7_Croc、82_piggyBac-2_XT、83_Mariner-3_AMi、84_piggyBac1_CI、86_piggyBac-1_AMi、87_Mariner-5_AMi、89_Mariner-6_Crp、90_Mariner-3_Crp、91_hAT-3_AMi、92_TC1_FR1、93_hAT-5_Croc、94_hAT-8_AMi、95_PARIS、96_Mariner-2_PM、97_piggyBac-1_XT、98_Tigger1、99_Mariner-1_Crp、101_S_DM、102_hAT-12_Crp、103_hAT-1_PM、104_Senkusha1、105_Tc1-2_PM、106_Harbinger-2_AMi、108_hAT-2_Gav及び110_Tigger2T。
図5BはHEK293T(293T)における以下の同定された転移因子の転移活性を示す:111_TC1-4_DR、116_TIGGER17、117_TIGGE3、118_HAT-14_CRP、119_MARINER-9_CRP、124_HAT-111_AMI、126_MARINER-1_AMI、126_MARINER-10_CRP、139_hAT-17_Croc、140_hAT-4_AMi、142_Tigger4、144_Tigger7、156_Tigger2、180_hAT-19_Crp、183_hAT-17B_Croc、188_Tc1-13_Xt、197_hAT-19B_Croc、199_MarsTigger8、212_Tigger5、222_hAT-10_XT、237_hAT-6_AMi、245_MarsTigger1c、246_Tigger17c、258_Harbinger-1_AMi、260_Tc1-14_Xt、271_Kanga1、275_Arthur1、295_Harbinger-1_Crp、314_Zaphod3、320_Joey1、331_Zaphod、342_Harbinger-3_AMi、348_Harbinger-1B_Crp、349_MARWOLEN1及び351_Zaphod2。
【
図6】
図6A~6Bは対照TE piggyBac、hyperpiggyBac及びSB100Xと比較した、各種の同定されたTEの転移(即ち導入)効率を示す。
図6AはHEK293T(293T)細胞内で、対照TE piggyBac、hyperpiggyBac及びSB100Xと比較した、各種の同定されたTEの転移(導入)効率を示す。
図6BはHeLa細胞内で、対照TE piggyBac、hyperpiggyBac及びSB100Xと比較した、各種の同定されたTEの転移(導入)効率を示す。
【
図7】
図7A~7Cは、異なるスーパーファミリーに属する同定されたトランスポザーゼとその対照TEとの間の系統発生関係を説明する系統樹を示す。
図7Aは以下の14個の同定されたhATスーパーファミリートランスポザーゼと対照TE TcBusterとの間の系統発生関係を説明する系統樹を示す:103_hAT-1_PM、17_hAT-6_PM、46_Myotis_hAT1、28_hAT-5_DR、22_hAT-3_XT、41_hAT-3_PM、47_hAT-7_PM、180_hAT-19_Crp、1_hAT-2_AG、9_HAT1_AG、139_hAT-17_Croc、183_hAT-17B_Croc、63_hAT-9_XT、222_hAT-10_XT。
図7Bは、2個の同定されたpiggyBacスーパーファミリートランスポザーゼ82_piggyBac-2_XT、86_piggyBac-1_AMiと対照TE TcBusterとの間の系統発生関係を説明する系統樹を示す。
図7Cは、22個の同定されたTcMarinerスーパーファミリートランスポザーゼと対照TE SB100Xとの間の系統発生関係を説明する系統樹を示す。
【
図8】
図8A~8BはHEK293T(293T)細胞及びHeLa細胞内で、piggyBac、hyperpiggyBac及びSB100Xを含む対照TE及び陰性対照(NC)と比較した、同定された転移因子及び131個の候補のうち活性の最も高い5個のTEの転移活性を示す。
図8Aは293T細胞内で、piggyBac、hyperpiggyBac及びSB100Xを含む対照TE及び陰性対照(NC)と比較した、各種の同定されたTEの転移(導入)効率を示す。
図8BはHeLa細胞内で、piggyBac、hyperpiggyBac及びSB100Xを含む対照TE及び陰性対照(NC)と比較した、各種の同定されたTEの転移(導入)効率を示す。
【
図9】
図9A~9BはHct116及びK562細胞内で、piggyBac、hyperpiggyBac及びSB100Xを含む対照TE及び陰性対照(NC)と比較した、同定された転移因子及び131個の候補のうち活性の最も高い5個のTEの転移活性を示す。
図9AはHct116細胞内で、piggyBac、hyperpiggyBac及びSB100Xを含む対照TE及び陰性対照(NC)と比較した、各種の同定されたTEの転移(導入)効率を示す。
図9BはK562細胞内で、piggyBac、hyperpiggyBac及びSB100Xを含む対照TE及び陰性対照(NC)と比較した、各種の同定されたTEの転移(導入)効率を示す。
【
図10】
図10A~10Bは初代T細胞内で、対照TE SB100Xと比較した、同定された転移因子14-Tc1-8B_DR、29-Tc1-3_FR、35-Mariner2_AG、36-Tc1-1_Xt、37-Tc1-1_AG、43-Tc1-1_PM、52-Tc1~16_Xt、54-Tc1-4_Xt及び56-Tc1-15_Xtの転移活性を示す。
図10AはEF1αプロモータとCopGFP遺伝子を含有するプラスミドでトランスフェクションされた初代T細胞の転移測定結果を示し、ここで、GFP陽性T細胞の存在は細胞内の転移の成功を表す。
図10BはEF1αプロモータと019CAR-P2A-eGFP遺伝子を含有するプラスミドでトランスフェクションされた初代T細胞の転移測定結果を示し、ここで、GFP陽性T細胞の存在は細胞内の転移の成功を表す。
【
図11】
図11A~11Bは293T細胞及びHeLa細胞内で、対照TE piggyBac及び陰性対照(NC)と比較した、ヘルパープラスミド及び転移因子プラスミドに基づく各割合を示し、同定された転移因子SB100X及び131個の候補のうち活性の最も高い5個のTEの転移活性を示す。
図11Aは293T細胞内で、対照TE SB100X及び陰性対照(NC)と比較した、各種の同定されたTEの転移(導入)効率を示す。
図11BはHeLa細胞内で、対照TE SB100X及び陰性対照(NC)と比較した、各種の同定されたTEの転移(導入)効率を示す。
【
図12】
図12は293T細胞内で、対照TE piggyBac、piggyBac、hyperpiggy Bac、SB100Xと比較した、同定された転移因子SB100X及び131個の候補のうち活性の最も高い5個のTEの負荷能力を示す。
図12は対照TE piggyBac、piggyBac、hyperpiggyBac、SB100Xと比較した、各種の同定されたTEの転移(導入)効率を示す。
【
図13】TE原始種及び安定転移K562細胞株由来のゲノムの標的部位の周囲の40 bpウィンドウにおけるゲノム挿入遺伝子座の共通配列を示す。
【
図14】
図14A~14Bは、piggyBac、hyperpiggyBac、SB100X及び131個の候補のうち活性の最も高い5個のTEを含む、距離の最も近い遺伝子の同定された転移因子の挿入頻度を示し、
図14Aは0bp~1Mbウィンドウ内の挿入頻度、
図14Bは50kbウィンドウ内のランダム挿入に対する濃縮倍数を示す。
【
図15】
図15は遺伝子体の5’末端から3’末端への相対位置において、piggyBac、hyperpiggy Bac、SB100X及び131個の候補のうち活性の最も高い5個のTEを含む、同定された転移因子のランダム挿入に対する濃縮倍数を示す。
【
図16】
図16は様々な発現レベルの遺伝子において、piggyBac、hyperpiggyBac、SB100X及び131個の候補のうち活性の最も高い5個のTEを含む、同定された転移因子のランダム挿入に対する濃縮倍数を示し、レベル7は最高発現、レベル0は最低発現を表す。
【
図17】
図17は5kbウィンドウ内の転写開始部位(TSS)の周囲において、piggyBac、hyperpiggy Bac、SB100X及び131個の候補のうち活性の最も高い5個のTEを含む、同定された転移因子のランダム挿入に対する濃縮倍数を示す。
【
図18】
図18は様々なクロマチン状態において、piggyBac、hyperpiggyBac、SB100X及び131個の候補のうち活性の最も高い5個のTEを含む、同定された転移因子のランダム挿入に対する濃縮倍数を示す。
【発明を実施するための形態】
【0028】
本願は、操作された転移因子、操作された転移因子を含む遺伝子導入システム、及びそれらを用いた方法とキットを提供する。本願は、少なくとも部分的に、汎ゲノムバイオインフォマティクスにより解析された広範な種からの新規転移因子の同定(例えば、表2)、及び同定された多くの転移因子がヒト細胞内で効率的に転移することができるという驚くべき結果に基づいている。開示された組成物、システム及び方法は、異種DNAを細胞のゲノムに導入することを含む、標的核酸に異種核酸を挿入するのに有用である。本明細書の上記転移因子及び遺伝子導入システムは、遺伝子治療や遺伝子発見研究など、さまざまな用途に有用である。
【0029】
したがって、一態様では、本願は、5’から3’への順に、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、上記転移因子は異種核酸の細胞D
NAへの挿入を可能とする転移活性を示す操作された転移因子を提供する。
【0030】
別の態様では、本願は、1)操作された転移因子と、2)トランスポザーゼ又はトランスポザーゼをコードする核酸と、を含み、上記転移因子は、5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、上記転移因子は異種核酸の細胞DNAへの挿入を可能とする転移活性を示す遺伝子導入システムを提供する。いくつかの実施形態では、上記転移因子は操作された転移因子である。いくつかの実施形態では、上記トランスポザーゼはSEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む。
【0031】
I.定義
本明細書で使用される場合、「トランスポゾン」、「転移因子」、又は「TE」という用語は、第1核酸(すなわち、ベクターのようなドナー核酸)から切断され、標的部位(例えば、細胞内の第2核酸、ゲノム又は染色体外DNA)に組み込まれ得るポリヌクレオチドを意味する。少なくとも1つのシス作用核酸配列が核酸配列の5’に位置し、かつ少なくとも1つのシス作用核酸配列が核酸配列の3’に位置する場合、トランスポゾンは、転移因子の末端のシス作用核酸配列側に連結される核酸配列を含む。シス作用核酸配列は、トランスポザーゼが結合する転移因子の各末端に、少なくとも1つの末端反復配列(TR、逆末端反復配列(ITR)又は末端逆反復配列(TIR)とも呼ばれる)を含む。本明細書の上記転移因子は、トランスポザーゼをコードするオープンリーディングフレーム(ORF)を含んでも含まなくてもよい。
【0032】
本明細書で使用される場合、「転移」という用語は、転移因子が第1核酸(例えば、ベクター)の位置から変更して標的部位(例えば、細胞内の第2核酸、又はゲノム又は染色体外DNA)に組み込まれることを意味する。
【0033】
本明細書で使用される場合、「末端反復」又は「TR」という用語は、転移因子の両端に位置し、転移因子の第2核酸配列側に連結される核酸配列を意味する。第2核酸配列の5’(上流)に位置するTRを5’TRと呼び、第2核酸配列の3’(下流)に位置するTRを3’TRと呼ぶ。クラス2の転移因子では、TRは互いに相補的である。
【0034】
本明細書で使用される場合、「標的部位反復」又は「TSD」という用語は、転移因子の挿入部位に出現する核酸配列を意味する。TSDは、標的DNA二本鎖体のトランスポザーゼによる互い違いの切断に起因する粘性末端のDNA修復により発現する可能性がある。TSDは、転移因子内のTR側に連結されている。5’TRの5’に位置するTSDは5’TSDである。3’TRの3’に位置するTSDは3’TSDである。
【0035】
本明細書で使用される場合、「トランスポザーゼ」という用語は、トランスポゾンが第1核酸(例えば、ベクター)から切断され、標的部位(例えば、細胞内の第2核酸、又はゲノム又は染色体外DNA)に組み込まれることを触媒するポリペプチドを意味する。いくつかの実施形態では、トランスポザーゼは、1つ又は2つの末端反復配列に結合する。
【0036】
本明細書で使用される場合、「左トランスポゾンフラグメント」又は「LTF」は、天然に存在する転移因子における5’TSDからトランスポザーゼORF配列の開始コドンまでのフラグメントを意味する。本明細書で使用される場合、「右トランスポゾンフラグメント」又は「RTF」とは、天然に存在する転移因子におけるトランスポザーゼORF配列の終止コドンから3’TSDまでのフラグメントを意味する。
【0037】
「核酸」、「ポリヌクレオチド」及び「核酸配列」という用語は、デオキシリボヌクレオチド、リボヌクレオチド、それらの組み合わせ及びそれらの類似体を含む、任意の長さ
のヌクレオチドの重合形態を指し、交換して使用することができる。「オリゴヌクレオチド」及び「オリゴ(oligo)」は、交換して使用することができ、約50個以下のヌクレオチドを有する短いポリヌクレオチドを指す。
【0038】
本明細書で使用される場合、「異種核酸」とは、参照核酸配列とは異なる由来のDNA又はRNA配列を意味する。例えば、転移因子の場合、上記異種核酸は、末端反復配列とは異なるソースに由来する。例えば、末端反復配列とは異なる生体から単離された核酸配列は、上記末端反復配列に対する異種核酸であると考えられる。
【0039】
本明細書で使用される場合、「動作可能に連結される」という用語は、他の核酸配列と機能的な関係にある核酸配列を意味する。例えば、コード配列がプロモータ配列に動作可能に連結されている場合、通常、プロモータがコード配列の転写を促進できることを意味する。動作可能に連結されるとは、連結対象のDNA配列が通常連続しており、2つのタンパク質コード領域を連結しなければならない場合、連続しており、リーディングフレーム内にあることを意味する。エンハンサーは、プロモータから数千塩基離れた位置で機能し、イントロン配列が可変長であるので、いくつかの核酸配列は動作可能に連結されているが、不連続であることがある。
【0040】
核酸配列についての「配列同一性の百分率(%)」とは、配列をアライメントした後に特定の核酸配列のヌクレオチドと同一の候補配列のヌクレオチドの百分率として定義され、必要に応じて、配列同一性の百分率が最大となるようにキャップを設けてもよい。ペプチド、ポリペプチド又はタンパク質の配列についての「配列相同性の百分率(%)」は、配列をアライメントした後、特定のペプチド又はアミノ酸配列中のアミノ酸残基と同じ置換を有する候補配列中のアミノ酸残基の百分率であり、必要に応じて、配列相同性の百分率が最大となるようにキャップを設けてもよい。アミノ酸配列の同一性百分率を決定するためのアライメントは、例えばBLAST、BLAST-2、ALIGN又はMEGALIGNTM(DNASTAR)ソフトウェアなどの一般的に利用可能なコンピュータソフトウェアのような、当該分野の技術範囲内の様々な方法で実施することができる。当業者は、比較される配列の全長にわたって最大のアライメントを達成するために必要な任意のアルゴリズムを含む、測定アライメントをするための適切なパラメータを決定することができる。
【0041】
本明細書で使用される場合、「ベクター」という用語は、それに連結された別の核酸分子を輸送することができる核酸分子を意味する。ベクターの例としては、細菌、プラスミド、ファージ、コスミド、エピソーム(episomes)、ウイルス、及び挿入可能なDNAフラグメント、すなわち相同組換えによって宿主細胞ゲノムに挿入可能なフラグメントが含まれるが、これらに限定されない。
【0042】
本明細書で使用される場合、「プラスミド」という用語は、外来DNAフラグメントを受け入れることができ、原核細胞又は真核細胞で複製することができる環状二本鎖DNAを意味する。
【0043】
「ポリペプチド」及び「ペプチド」という用語は、交換して使用することができ、任意の長さのアミノ酸ポリマーを指す。したがって、例えば、ペプチド、オリゴペプチド、タンパク質、抗体、及び酵素という用語は、ポリペプチドの定義に含まれる。ポリマーは、直鎖又は分岐鎖であってもよく、修飾アミノ酸を含んでいてもよく、非アミノ酸によって切断されていてもよい。タンパク質は、1つ又は複数のポリペプチドを有していてもよい。この用語には、修飾アミノ酸ポリマーも含まれる。例えば、ジスルフィド結合形成、グリコシル化、脂質化、アセチル化、リン酸化、又は標識成分との結合のような他の任意の操作が可能である。
【0044】
本明細書で使用される場合、「変異体」は、参照ポリヌクレオチド又はポリペプチドとは異なるが、基本的な特性を保持するポリヌクレオチド又はポリペプチドと解釈される。ポリヌクレオチドの典型的な変異体は、他の参照ポリヌクレオチドの核酸配列とは異なる。変異体の核酸配列変化は、参照ポリヌクレオチドによってコードされるポリペプチドのアミノ酸配列を変化させてもよいし、変化させなくてもよい。以下で説明するように、ヌクレオチドの変化は、参照配列によってコードされるポリペプチド中のアミノ酸の置換、付加、欠失、融合、及び切断をもたらすことができる。ポリペプチドの典型的な変異体は、他の参照ポリペプチドのアミノ酸配列とは異なる。通常、相違は限定されており、したがって、参照ポリペプチド及び変異体の配列は、全体的に非常に類似しており、多くの領域において同一である。変異体及び参照ポリペプチドのアミノ酸配列は、1つ又は複数の置換、付加、欠失の任意の組み合わせの形態によって異なってもよい。置換又は挿入されたアミノ酸残基は、遺伝暗号によりコードされたアミノ酸残基であってもよいし、そうでなくてもよい。ポリヌクレオチド又はポリペプチドの変異体は、アリル変異体のように天然に存在していてもよく、又は天然に存在しない変異体であってもよい。ポリヌクレオチド及びポリペプチドの天然に存在しない変異体は、突然変異誘発技術、直接合成、及び当業者に知られている他の組換え方法によって調製することができる。
【0045】
本明細書で使用される場合、配列の「フラグメント」は、配列の一部を意味する。例えば、核酸配列のフラグメントは核酸配列の一部を意味し、アミノ酸配列のフラグメントはアミノ酸配列の一部を意味する。
【0046】
本明細書で使用される場合、「遺伝子回路」、「生体回路」、又は「合成回路」という用語は、論理機能を実行するように設計された生体構成要素のセットを意味する。一般に、遺伝子回路を活性化するために入力が必要であり、遺伝子回路は入力に応じて出力を生成する。
【0047】
本明細書で使用される場合、「操作された」という用語は、ポリヌクレオチド又はポリペプチドに検出可能な変化を生じさせる任意の操作を意味し、この操作は、ポリヌクレオチド又はアミノ酸配列の一部の挿入、削除及び置換を含むが、これらに限定されない。
【0048】
本明細書で使用される場合、「転移効率」という用語は、転移因子が標的細胞群に異種核酸を挿入する効率を意味する。例えば、転移効率は、レポーター遺伝子又は選択マーカーをコードする遺伝子、例えば抗生物質耐性遺伝子(例えば、ピューロマイシン)を含む転移因子を含むプラスミドを標的細胞群にトランスフェクションし、レポーター遺伝子又は選択マーカーによってコードされる遺伝子産物を発現する細胞の数を、例えば抗生物質耐性を有する細胞の数を測定することによって決定することによって決定されてもよい。
【0049】
本明細書で使用される場合、「トランスフェクションされた」、「形質転換された」、又は「形質導入された」という用語は、外来核酸を宿主細胞に転移又は導入するプロセスを意味する。「トランスフェクションされた」、「形質転換された」、又は「形質導入された」細胞は、外来核酸でトランスフェクション、形質転換、又は形質導入された細胞である。本明細書で使用される場合、「形質導入」及び「トランスフェクション」という用語は、感染因子(例えば、ウイルス)又は他の方法を使用して目的のタンパク質又は分子を発現させるためにDNAを細胞に導入する当該分野で知られている全ての方法を含む。ウイルス又はウイルス様制剤に加えて、リン酸カルシウム、デンドリマー、リポソーム又はカチオン性ポリマー(例えば、DEAE-グルカン又はポリエチレンイミン)を使用する方法のような化学的トランスフェクション方法;電気穿孔、細胞スクイズ、音響穿孔、光トランスフェクション、穿刺トランスフェクション、プロトプラスト融合、プラスミド又はトランスポゾン送達などの非化学的方法;遺伝子銃、磁気トランスフェクション又は
磁気補助トランスフェクション、粒子衝撃の使用などの粒子ベースの方法;核トランスフェクションなどの混合方法もある。
【0050】
「インビボ」という用語は、細胞を取得する生物の体内でのことである。「エクスビボ」又は「インビトロ」とは、細胞を取得する生物の体外でのことである。
【0051】
なお、本明細書に記載された本発明の実施形態は、「からなる」及び/又は「実質的にからなる」実施形態を含む。
【0052】
本明細書では、「約」が言及された数値又はパラメータが、当該数値又はパラメータ自体に対する変化を含む(説明している)。例えば、「約X」が言及された説明には、「X」の記載が含まれる。
【0053】
本明細書で使用される場合、「そうでない」が言及された数値又はパラメータは、通常、数値又はパラメータと「異なる」ことを表し、説明する。例えば、該方法がX型癌の治療に使用されないということは、X型以外の癌の治療に使用されることを意味する。
【0054】
本明細書で使用される用語「約X~Y」は、「約Xから約Y」と同じ意味を有する。
【0055】
本明細書及び添付の特許請求の範囲で使用される場合、単数形「1種」、「1つ」、及び「上記」は、文脈で別段の規定がない限り、複数形も含む。
【0056】
II.操作された転移因子
本願の一態様は、5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含む操作された転移因子を提供する。いくつかの実施形態では、上記転移因子は異種核酸の標的核酸(例えば、DNA)へのインビトロ挿入を可能とする転移活性を示す。いくつかの実施形態では、上記操作された転移因子は異種核酸の細胞内の標的核酸(例えば哺乳類又は細胞植物のDNA)への挿入を可能とする転移活性を示す。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
【0057】
いくつかの実施形態では、上記操作された転移因子は、5’から3’へ、5’標的部位反復配列(5’TSD)、5’TR、異種核酸、3’TR及び3’TSDを含む。いくつかの実施形態では、上記転移因子は異種核酸の標的核酸(例えば、DNA)へのインビトロ挿入を可能とする転移活性を示す。いくつかの実施形態では、上記操作された転移因子は異種核酸の細胞内の標的核酸(例えば哺乳類又は細胞植物のDNA)への挿入を可能とする転移活性を示す。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。
【0058】
いくつかの実施形態では、本願は、ヒト細胞内で効率的に転移できる広範な種由来の新規な転移因子を提供する。本明細書の上記転移因子は天然活性を有する哺乳類の切り貼りDNAトランスポゾンのための直接的な実験証拠を提供する。
【0059】
例示的な転移因子のリスト及びこれに対応する左末端フラグメント(LTF)、右末端フラグメント(RTF)、トランスポザーゼ、5’末端反復(TR)、3’TR、5’標的部位反復(TSD)及び3’TSD配列は1~2及び配列表に記載される。表1は本願で開示されたバイオインフォマティクス分析により同定された131個のTEを示し、この131個のTEは11個のTE(TE ID: 4、5、7、12、18、20、22
、25、26、28及び30)を含み、その長さが3000 bp以下、MITEコピー数が10を超え、平均差が1%小さいことを満たし、高効率ゲノム工学に適用できる。表2はヒト細胞株HEK293T及びHelaにおいて転移分析実験を使用して検証された活性TEを示す。
【0060】
いくつかの実施形態では、上記転移因子はクラス2の転移因子である。クラス2の転移因子は、末端反復(TR)と、組み込む過程で生じたTR側に連結された標的部位反復(TSD)の長さとを含む、トランスポザーゼの相関性及び共有する構造的特徴によってスーパーファミリーとして分類されてもよい。本願の転移因子は各種の適切なTEスーパーファミリー及び/又はファミリーに由来し得ると想定する。いくつかの実施形態では、上記転移因子はhATスーパーファミリーに由来する。いくつかの実施形態では、上記転移因子はPスーパーファミリーに由来する。いくつかの実施形態では、上記転移因子はPIF-Harbingerスーパーファミリーに由来する。いくつかの実施形態では、上記転移因子はpiggyBacスーパーファミリーに由来する。いくつかの実施形態では、上記転移因子はTcMarinerスーパーファミリーに由来する。いくつかの実施形態では、上記5’TRは3’TRの逆相補である。いくつかの実施形態では、上記5’TRは3’TRの逆相補ではない。
【0061】
いくつかの実施形態では、上記操作された転移因子は、hAT、P、PIF-Harbinger、piggyBac及びTcMarinerから選択されるスーパーファミリーの転移因子の5’TRと少なくとも約50%、60%、70%、80%、90%、95%、99%又は100%の配列同一性を有する核酸配列を含む5’TRを含む。いくつかの実施形態では、上記操作された転移因子は、hAT、P、PIF-Harbinger、piggyBac及びTcMarinerから選択されるスーパーファミリーの転移因子の3’TRと少なくとも約50%、60%、70%、80%、90%、95%、99%又は100%の配列同一性を有する核酸配列を含む3’TRを含む。
【0062】
いくつかの実施形態では、上記操作された転移因子は5’TRと3’TRを含み、上記5’TRはhAT、P、PIF-Harbinger、piggyBac及びTcMarinerから選択されるスーパーファミリーの転移因子の5’TRと少なくとも約50%、60%、70%、80%、90%、95%、99%又は100%の配列同一性を有する核酸配列を含み、上記3’TRはhAT、P、PIF-Harbinger、piggyBac及びTcMarinerから選択されるスーパーファミリーの転移因子の3’TRと少なくとも約50%、60%、70%、80%、90%、95%、99%又は100%の配列同一性を有する核酸配列を含む。
【0063】
いくつかの実施形態では、上記操作された転移因子は、表1のいずれか1つのTE由来の5’TR、3’TR、LTF、RTF、トランスポザーゼ、5’TSD及び/又は3’TSDを含む。いくつかの実施形態では、上記操作された転移因子は表2のいずれか1つのTE由来の5’TR、3’TR、LTF、RTF、トランスポザーゼ、5’TSD及び/又は3’TSDを含む。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt、Tc1-1_AG、Tc1-1_PM、Tc1-4_Xt、Tc1-15_Xt、Mariner-6_AMi、又はMariner-3_Crpに由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0064】
いくつかの実施形態では、上記操作された転移因子はSEQ ID NO: 115~140及び167~178から選択される核酸配列、その変異体又はそのフラグメントを含むLTFを含む。
【0065】
いくつかの実施形態では、上記操作された転移因子はSEQ ID NO: 141~190から選択される核酸配列、その変異体又はそのフラグメントを含むRTFを含む。
【0066】
いくつかの実施形態では、上記操作された転移因子はLTFとRTFを含み、上記LTFはSEQ ID NO: 115~140及び167~178から選択される核酸配列と少なくとも約80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれかの配列同一性を有し、上記RTFはSEQ
ID NO: 141~190から選択される核酸配列と少なくとも約80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれかの配列同一性を有する。いくつかの実施形態では、上記操作された転移因子はSEQ ID NO:115~140及び167~178から選択される核酸配列を含むLTFと、SEQ ID NO:141~190から選択される核酸配列を含むRTFと、を含む。
【0067】
いくつかの実施形態では、上記操作された転移因子はLTFの5’TRを含み、上記LTFはSEQ ID NO: 115~140及び167~178から選択される核酸配列を含む。いくつかの実施形態では、上記操作された転移因子はRTFの3’TRを含み、上記RTFはSEQ ID NO: 141~190から選択される核酸配列を含む。
【0068】
いくつかの実施形態では、上記操作された転移因子はLTFの5’TR、5’TRの変異体又は5’TRのフラグメントを含み、上記LTFはSEQ ID NO: 115~140及び167~178から選択される核酸配列と、RTFの3’TR、3’TRの変異体又は3’TRのフラグメントと、を含み、上記RTFはSEQ ID NO: 141~190から選択される核酸配列を含む。
【0069】
いくつかの実施形態では、上記操作された転移因子は、SEQ ID NO: 1~26及び79~90から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を有する5’TRを含む。いくつかの実施形態では、本願の操作された転移因子はSEQ ID NO: 1~26及び79~90から選択される核酸配列と少なくとも約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれかの配列同一性を有する5’TRを含む。いくつかの実施形態では、上記5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列を含む。いくつかの実施形態では、上記操作された転移因子は5’TRとしての相補的配列を有する3’TRを含む。
【0070】
いくつかの実施形態では、上記操作された転移因子はSEQ ID NO: 27~52及び91~102から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を有する3’TRを含む。いくつかの実施形態では、上記操作された転移因子はSEQ ID NO: 27~52及び91~102から選択される核酸配列と少なくとも約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれかの配列同一性を有する3’TRを含む。いくつかの実施形態では、上記3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列を含む。いくつかの実施形態では、上記操作された転移因子は3’TRとしての相補的配列を有する5’TRを含む。
【0071】
いくつかの実施形態では、上記操作された転移因子は、1)SEQ ID NO: 1~26及び79~90から選択される核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する5’TRと、2)SEQ ID NO: 27~52及
び91~102から選択される核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する3’TRと、を含む。
【0072】
いくつかの実施形態では、上記操作された転移因子は、1)SEQ ID NO: 1~26から選択される核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する5’TRと、2)SEQ ID NO: 27~52から選択される核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する3’TRと、を含む。
【0073】
いくつかの実施形態では、上記操作された転移因子は、1)SEQ ID NO: 79~90から選択される核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する5’TRと、2)SEQ ID NO: 91~102から選択される核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する3’TRと、を含む。
【0074】
本明細書では、本明細書の例えば表1及び2に記載の5’TR及び/又は3’TR、又はLTF及び/又はRTFのいずれか1つの変異体又はフラグメントを含む操作された転移因子も考慮される。いくつかの実施形態では、上記変異体は約50、40、35、30、25、20、15、10、9、8、7、6、5、4、3、2又は1個以下のいずれかのヌクレオチドの置換を含む。いくつかの実施形態では、上記フラグメントは少なくとも約5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100 、150、200、250、300、350、400、450又は500個のいずれかのヌクレオチドを含む。
【0075】
いくつかの実施形態では、上記操作された転移因子は5’TSDを含む。いくつかの実施形態では、上記操作された転移因子は3’TSDを含む。いくつかの実施形態では、上記操作された転移因子は5’TSDと3’TSDを含む。いくつかの実施形態では、上記操作された転移因子は5’TSDを含まない。いくつかの実施形態では、上記操作された転移因子は3’TSDを含まない。いくつかの実施形態では、上記操作された転移因子は5’TSD又は3’TSDを含まない。いくつかの実施形態では、上記5’TSDは3’TSDと同じである。いくつかの実施形態では、上記5’TSDは3’TSDと異なる。
【0076】
いくつかの実施形態では、上記操作された転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記操作された転移因子はトランスポザーゼをコードする核酸配列を含まない。いくつかの実施形態では、トランスポザーゼは5’TR及び3’TR配列と同じ種に由来する。いくつかの実施形態では、トランスポザーゼは5’TR及び3’TR配列に対する天然トランスポザーゼである。いくつかの実施形態では、トランスポザーゼは5’TR及び3’TR配列に対する天然トランスポザーゼに基づく操作されたトランスポザーゼである。
【0077】
トランスポザーゼは、ドナーポリヌクレオチド(例えば、ベクター)からトランスポゾンを切断してから、トランスポゾンを標的核酸、例えば標的細胞のゲノム又は染色体外DNAに組み込むことを触媒する。いくつかの実施形態では、トランスポザーゼは転移因子の末端反復に結合する。
【0078】
いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列、その変異体又はそのフラグメントを含む。
【0079】
本願のいくつかの実施形態では、表1~2及び配列表に記載のトランスポザーゼの変異体が考慮される。トランスポザーゼ変異体の表現は、参照トランスポザーゼポリペプチド(例えば天然に存在するトランスポザーゼポリペプチド)とは少なくとも1つのアミノ酸残基の付加、欠失、切断及び/又は置換が異なるが、転移活性を保持するトランスポザーゼポリペプチドを指す。いくつかの実施形態では、トランスポザーゼポリペプチド変異体は参照トランスポザーゼポリペプチドとは1つ又は複数の置換が異なり、本分野に知られるように、上記置換は保存的又は非保存的であってもよい。いくつかの実施形態では、変異体トランスポザーゼは参照トランスポザーゼに対応する配列と少なくとも約80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれかの配列同一性又は類似性を有するアミノ酸配列を含む。いくつかの実施形態では、変異体トランスポザーゼは約50、40、35、30、25、20、15、10、9、8、7、6、5、4、3、2又は1個以下のアミノ酸置換を含む。
【0080】
本明細書の上記トランスポザーゼのアミノ酸欠失を有する機能性フラグメント又はアミノ酸付加を有する変異体も考慮される。いくつかの実施形態では、トランスポザーゼフラグメントの長さは少なくとも約50、60、70、80、90、100、150、200、250、300、350、400、450、500、600、700個以上のいずれかのアミノ酸残基である。いくつかの実施形態では、アミノ酸付加又は欠失は参照トランスポザーゼのC末端及び/又はN末端で起こる。いくつかの実施形態では、アミノ酸付加又は欠失は内部位置、例えば参照トランスポザーゼの可撓性ループで起こる。いくつかの実施形態では、アミノ酸欠失(例えば、N末端及び/又はC末端のトゥランケイション(truncation))は約1、約2、約3、約4、約5、約6、約7、約8、約9、約10、約15、約20、約25、約30、約35、約40、約45、50、約55、約60、約65、約70、約75、約80、約85、約90、約95、約100、約105、約110、約115、約120、約125、約130、約135、約140、約145、約150、約155、約160、約165、約170、約175個以上のアミノ酸を含み、これらの値の間の全ての及び範囲が含まれる。いくつかの実施形態では、変異体トランスポザーゼはN末端又はC末端精製タグ、選択マーカー(例えば、抗生物質耐性遺伝子)又はレポーター遺伝子(例えば、蛍光レポーター遺伝子)を含む。
【0081】
上記の通り、本発明のトランスポザーゼポリペプチドは、アミノ酸置換、欠失、切断や挿入などの多くの手段で変改されてもよい。このような操作の方法は通常本分野に知られているものである。例えば、参照ポリペプチドのアミノ酸配列変異体はDNAの突然変異によって製造されてもよい。突然変異誘発及び核酸配列改変の方法は本分野に知られているものである。例えば、Kunkel (1985, Proc. Natl. Acad. Sci. USA. 82: 488-492)、Kunkel et al., (1987, Methods in Enzymol, 154: 367-382)、U.S. Pat. No. 4,873,192、Watson, J. D. et al., (Molecular Biology of the Gene, Fourth Edition, Benjamin/Cummings, Menlo Park, Calif., 1987)及びそれに引用される参照文献を参照する。目的タンパク質の生物学的活性に影響しない適切なアミノ酸の替代の指導はDayhoff et al., (1978) Atlas of Protein Sequence and Structure (Natl. Biomed. Res. Found., Washington, D.C.)のモデルに記載される。
【0082】
いくつかの実施形態では、参照トランスポザーゼと比較して、トランスポザーゼはコドンが最適化される。いくつかの実施形態では、トランスポザーゼは哺乳類細胞例えばヒト細胞内で発現するようにコドンが最適化される。いくつかの実施形態では、トランスポザーゼは植物細胞内で発現するようにコドンが最適化される。
【0083】
いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91% 、92%、93%、94%、95%、96%、97%、98%、99%以上)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列を含む。
【0084】
いくつかの実施形態では、上記転移因子は以下を含む。1)LTFの5’TRであって、LTFはSEQ ID NO: 115の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 141の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)TAGGC(SEQ ID NO: 1)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)GCCTA(SEQ ID NO: 27)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 1の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 27の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 1の核酸配列を含む5’TRと、2)SEQ ID NO: 27の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、GTATGGAC(SEQ ID NO: 191)の核酸配列を含む5’TSDと、SEQ ID NO: 191の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID
NO: 115の核酸配列の配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 141の核酸配列の配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 53のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 53のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 53(hAT-2_AGのトランスポザーゼ)
MASNVATSSSIWDHFTRNGTKAKCRYCYNEIAFTKGSTSNLKRHMKAKHPSISLERQHLASTTSPSTQNSEPGPSCSSRPPNLISNFFKQPMNSETKRKLDMMLLKLICKDCLPLSIVESEAFKTFVGCLNQNYDLPTRKNVSNALLPSIYNEILVKVQGEVRNATSIALTTDGWTNVNNTSFLGLTAHFIDNDYKLRSCLLECSEISLSHSGQNIAAWIKEVIIKYEIQDKIVGIVTDNAANMKSAARELEFNHVTCFAHSLHLIVKDAIKKSIISTVDEVKRIVMYFKKSPKATNELADTQSKFNLPNLKLKQDVPTRWNSTYDMLNRFYKNKIAIVACADKLNTLDPIKIDWAILEHSLNALKIFDVATNMVSAEKNITVSHVGLLSKMIIRKLNETDYTIPELGNLVTHLKEGVKKRLEIYSNNQIIAKSMLLDPRIKKQGFHEEPLKYRETYELIIQELIPFQTPSMNAQEPHNIDNEANLLLGEFITWVNNAECEIESPIELAKNELNSFLKIRNIDIKNDPLEWWRIHSSKYPSIYALAKTIICIPGTSVPCERLFSKAGQIYSDKRSRLHPKKFKEIIFIQQNVDKF
【0085】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 116の核酸配列を含む。2)RTFの3’TR
であって、上記RTFはSEQ ID NO: 142の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)TAG(SEQ ID NO: 2)核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)CTA(SEQ ID NO: 28)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 2の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 28の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 2の核酸配列を含む5’TRt、2)SEQ ID NO: 28の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、ATGTGAAC(SEQ ID NO: 192)の核酸配列を含む5’TSDと、SEQ ID NO: 192の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 116の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 142の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 54のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 54のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 54(HAT1_AGのトランスポザーゼ)
MMAPTNATTSPVWDHFSPVETGAKCLYCLKVFKYTKGTTSNLKRHLNLVHKTVPYLKQKQPIPQTINIDDEAGPSAVNFQPSNQYFNSNMSIQGYLKKPINSETKKVLDRMLLDLICKECLPFNLVESEIFKKFVYTLNPNYIMPTRKSLSNALLPSVYNQEFEKAKEKLSTAKAIAITSDGWTNLNQISFFALTGHYIDENCKLSSILIECSEFENPHSGRNIANWIQGTLNKFDIEDKIVAMVTDNASNMKAASTELNFCHIPCFAHTLNLIVRDAIKKSVLPVVEEVKRVVMLFKKSPKASQMLADTQKKLNLDQLKMIQEVSTRWNSGYDMLNRFYKNKIALLSCADSLKMKISLESHDWEAIEQIVRVLKYFYSATNIVSAQKYITISHVGLLCNVLLTKTSQFRNDEDIAENIQNLVALLIEGLQNKLKIYRSNEQILKSMILDPRIKQLGFQDDVEKFKNICESIISELLPLQKPAVEVEKVVKKVSKDVDMLFGDLLKNKGAQNYKTPRQIAENELHQYLSVENIDLENDPLLWWKEHQVLYPSLYTLAMSTLCIPGTSVPCERLFSKAGQIYSEKRSRLAPKKLQEILFIQQNA
【0086】
いくつかの実施形態では、上記転移因子は以下を含む。1)LTFの5’TRであって、上記LTFはSEQ ID NO: 117の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 143の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 3の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 29の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 3の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 29の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配
列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 3の核酸配列を含む5’TRと、2)SEQ ID NO: 29の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、TA(SEQ ID NO: 193)の核酸配列を含む 5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 117の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 143の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 55のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 55のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 3(Tc1-8B_DRの5'TR)
CAGCGGGGAAAATAAGTATTTGACACATCAGCATTTTTATCAGTAAGGGGATTTCTAAGTGGGCTACTGACACAAAATTCCTACCAGATGTAGCCATCAAGCCAAATATTGAATTCATACAAAGAAATCAGAACATTTAAGTATACAAGTTGAGTCATAATAAATAAAGTGAAATGACACAGGGAATAAGTATTGAACACA
SEQ ID NO: 29(Tc1-8B_DRの3'TR)
TGTGTTCAATACTTATTCCCTGTGTCATTTCACTTTATTTATTATGACTCAACTTGTATACTTAAATGTTCTGATTTCTTTGTATGAATTCAATATTTGGCTTGATGGCTACATCTGGTAGGAATTTTGTGTCAGTAGCCCACTTAGAAATCCCCTTACTGATAAAAATGCTGATGTGTCAAATACTTATTTTCCCCGCTG
SEQ ID NO: 55(Tc1-8B_DRのトランスポザーゼ)
MMGKNKELSQDLRSLIVEKHFDGNGYRRISRMLNVPVSTVGAIIRKWKKHKFTINRPRSGAPRKIPVRGVQRIIRRVLQEPRTTRAELQEDLASAGTIVSKKTISNALNHHGIHARSPRKTPLLNKKHVEARLKFAKQHLEKPVDYWETIVWSDESKIELFGSHSTHHVWRRNGTAHHPKNTIPTVKFGGGSIMVWGCFSARGTGRLHIIEGRMNGEMYRDILDKNLLPSTRKLKMKRGWTFQQDNDPKHKAKETMKWFQRKKIKLLEWPSQSPDLNPIENLWRELKIKVHKRGPRNLQDLKTVCVEEWARITPEQCRRLVSPYKRRLEAVITNKGFSTKY
【0087】
いくつかの実施形態では、上記転移因子は以下を含む。1)LTFの5’TRであって、上記LTFはSEQ ID NO: 118の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 144の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 4の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 30の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 4の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 30の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 4の核酸配列を含む5’TRと、2)SEQ
ID NO: 30の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、TTAGAG(SEQ ID NO: 195)の核酸配列を含む5’TSDと、SEQ ID NO: 195の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 118の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 144の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 56のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 56のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%、99%以上)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 56(hAT-6_PMのトランスポザーゼ)
MAKRKKDDEYRTFQDEWTEEFAFVERAGSAVCLICNDKITSLKRSNVKRHFDTRHATFASKYPAGDSRKKACQELLSRVQASQQQLRVWTRQGDYNSASFAGSLAIVRNGKPFTDGEYAKTFMLDVANELFDDLPNKDKIIKRIQDMPLSARTVHDRTIVMANKVEETQVKDINAAPFFSLALDESTDVSHLSQFSVIARYAVGDTLREESLAVLPLKGSTRGEDLFKSFMEFAQEKSLPMDKLLSVCTDGAPCMVGKNKGFVALLREHENRPILSFHCIIHQEALCAQMCDRQFGEVMSLVIRVINFIVARALNDRQFKTLLDEVVNNYPGLLLHSNVRWLSRGKVLSRFAACLNEIRTFLEMKGVGHPELADTEWLLKFYYLVDLTEHLNQLNVKMQGIGNTVLSLQQAVFAFENKLELFITDLETGRLLHFEKLSQFKDACTASEPIQNLDLHQLAGCTSSLLQSFKARFGEFREHTRLFKFITHPNECSLNTADLNYIPGVSVRDFEAEVADLKASDMWVNKFKSLNEDLERITRQKAELASKHMWTEMKKLQPEDQLILKTWNALPVTYHTLQRVSIAVLTMFGSTYACEQSFSHLKNIKSNLRSRLTDESLNACMKLNLTKYQPDYKDISKSMQHQKSH
【0088】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 119の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 145の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CAGGGG(SEQ ID NO: 5)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 31の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 5の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 31の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98 %、99%以上)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 5の核酸配列を含む5’TRと、2)CCCCTG(SEQ ID NO: 31)を含む核酸配列の3’TRと、を含む。いくつかの実施形態では、上記転移因子は、CTGTATAG(SEQ ID NO: 196)の核酸配列を含む5’TSDと、SEQ ID NO: 196の核酸配列を含む3’TSDと、をさらに含む。転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 119の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 145の核酸配列と少なくとも約90%(
例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 57のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼは、SEQ ID NO: 57のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%、99%以上)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 57(hAT-3_XTのトランスポザーゼ)
MTSSQPAVKRKIDDEHRQFQEKWEMQYFFVEHRGIPTCLICAEKVAVHKEYNLKRHYSTKHAEECAKYQGDERAKRVASLKACLMRQQDFFKKATKENVASVQASYMVSEMIAKAGKPFTEGEFVKKCMLQVASIICPEKKGQFSKISLSANTVAERISDMSSDIYHQLCEKAKCFDAYSVALDESTDITGTAQLTIYVRGVDCNFELTEELLTIIPMHGQTTANEIFHHLCDAIENAGLPWKRFVGIITDGAPSMTGRKNGLVALVKKKLEEEGIEEEAIALHCIIHQQALCSKCLPCDNVMSVVVKCVNQIRSRGLTHRRFRAFLEEMGSEYGDVLYFTEVRWLSRGNVLKRFFELREEVKAFMEKNGKAVSELSDHKWLMDLAFLVDITQRLNVLNKMLQGQGQLVSAAYDNVRAFSTKLVLWKSQLSQTNLCHFPACKELVDAGIPFSGEKYVDAIFKLEKEFDHRFADFKTHRATFQIFVDPFSFDVQDAPPVLQMELIDLQCNSDIKAKFREMSGKADTHVQFLRELPPSFPELSRMFKRTMCLFGSTYLCEK
【0089】
いくつかの実施形態では、上記転移因子は以下を含む。1)LTFの5’TRであって、上記LTFはSEQ ID NO: 120の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 146の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 6の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 32の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 6の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 32の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 6の核酸配列を含む5’TRと、2)SEQ ID NO: 32の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 120の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 146の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 58のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 58のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードす
る核酸配列を含まない。
SEQ ID NO: 6(Tc1-3_Xtの5'TR)
CAGTGGAGGAAATAATTATTTGACCCCTCACTGATTTTGTAAGTTTGTCCAATGACAAAGAAATGAAAAGTCTCAGAACAGTATCATTTCAATGGTAGGTTTATTTTAACAGTGGCAGATAGCACATCAAAAGGAAAATCGAAAAAATAACTTTAAATAAAAGATAGCAACTGATTTGCATTTCATTGAGTGAAATAAGTTTTTGAACCC
SEQ ID NO: 32(Tc1-3_Xtの3'TR)
GGGTTCAAAAACTTATTTCACTCAATGAAATGCAAATCAGTTGCTATCTTTTATTTAAAGTTATTTTTTCGATTTTCCTTTTGATGTGCTATCTGCCACTGTTAAAATAAACCTACCATTGAAATGATACTGTTCTGAGACTTTTCATTTCTTTGTCATTGGACAAACTTACAAAATCAGTGAGGGGTCAAATAATTATTTCCTCCACTG
SEQ ID NO: 58(Tc1-3_Xtのトランスポザーゼ)
MGKTKELSKDVRDKIVDLHKAGMGYKTISKKLGEKVTTVGAIVRKWKEHKMTINRPRSGAPRKISPRGVSMILRKVKKHPRTTREELVNDLKLAGTTVTKKTIGNTLHRNGLKSCRARKVPLLKKAHVQARLKFANEHLNDSVSDWEKVLWSDETKIELFGINSTRCVWRKKNAAYDPQNTVPTVKHGGGNILLWGCFSAKGTGQLIRINGKMDGAMYREILNDNLLPSARKLKMGRGWVFQHDNDPKHTAKATKEWLKKKHIKVMEWPSQSPDLNPIENLWRELKLRVAQRQPRNLRDLEMICKEEWTNIPPKMCANLVINYKKRLTSVLANKGFSTKY
【0090】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 121の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 147の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CAGGGGTGGCGAACC(SEQ ID NO: 7)核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)GGTTCGCCACCCCTG(SEQ ID NO: 33)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 7の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 33の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 7の核酸配列を含む5’TRと、2)SEQ ID NO: 33の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、GTCTATAC(SEQ ID NO: 194)の核酸配列を含む5’TSDと、SEQ ID NO: 194の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 121の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 147の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 59のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 59のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 59(hAT-5_DRのトランスポザーゼ)
MAESGKRTAKRKYEDERRTFLSEWEDLYFFVERNGKPFCLICQTSLSHFKASNLERHFTSLHSAVAREFPKGSELRKHKVKTLKGQAEKQTQLFRKFTKHSETVTLASYQLAWNIARAKKPYLEGEFVKKCLSDAVAILCPENENLKRSVKDLQLSRHTVEQRISDIDNSVETHLLSDLQKCQYFSIALDESCDVQDKPQLAIFVRFVSEDCTIREELLDIVPLKDRTRGIDLKETLMTVVEKANLQLSKLTAIVTDGAPAMLGSERGLVGLCKADDRFPAFWTFHCIIHQEHLVSKKLNLDHIMKPVLEIVNFVRTHALNHRQFKNLIDELDEDLPSDLLFHCAVRWLSRGHVLSRFFELLNPVKLFLAEKHKEYPELHDPQWISDLAFLVDVLHYLNGLNVDLQGKLKMLPDLVQSVFAFVNKLKLFKTHLQKRDYTHFPTLLKASGQEAEVVKGSTARYATLLENLEQSFEERFSNLRQKRQQITFLINPFTAESGCLKAPLVEDEAASQLEMIELSEDDRLKSVLREGTVEFWKIVPVERYPNVKQAALKLLSMFGSTYVCESLFSTLKLVKSKHRSVLTDTHVKELLRVATTEYEPDLKKIVETKECQVSH
【0091】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 122の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 148の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 8の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 34の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 8の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 34の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 8の核酸配列を含む5’TRと、2)SEQ ID NO: 34の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TRと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 122の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 148の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 60のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 60のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 8 (Tc1-3_FRの5'TR)
CAGTGAGAGTAAAAAGTATTTGATCCCTTGCTGATTTTGTTGGTTTGTCCACTAATAAAGACATGATCATTCTATACTTTTAATGGTAGATGTATTCTAACATGGAGAGACAGAATATCAAAAAGAAAATC
SEQ ID NO: 34 (Tc1-3_FRの3'TR)
GATTTTCTTTTTGATATTCTGTCTCTCCATGTTAGAATACATCTACCATTAAAAGTATAGAATGATCATGTCTTTATTAGTGGACAAACCAACAAAATCAGCAAGGGATCAAATACTTTTTACTCTCACTG
SEQ ID NO: 60 (Tc1-3_FRのトランスポザーゼ)
MGKTKELSQDLRDRIVDLHKSGMGYKNISKLLGIKVTTIGAIVRKFKKYNMTINRPRSGAPQKISPRGVAMIMRTVRNRPATTQQELVNDLQAAGTKVTRKTIGNTLRRNGLKSCSARKVPLLKKAHVEARLKYANDHLKDAQSDWEKVLWSDETKIE
LFGLNSTRHVWRKKNAAYDPRNTVPTVKHGGGNIMFWGCFSAKGTGLLHRITGKMDGAMYRAVLRDNLLPSARKLKMGRGWVFQHDNDPKHTAKATKEWLKKNHIKVMEWPSQSPDLNPIENLWRELKVRVAKRQPTNLNDLERICKEEWAKIPPDMCANLVVNYNKRLTAVLANNGFATKY
【0092】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 123の核酸配列を含む。 2)RTFの3’TRであって、上記RTFはSEQ ID NO: 149の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 9の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 35の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 9の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ
ID NO: 35の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 9の核酸配列を含む5’TRと、2)SEQ
ID NO: 35の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ
ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 123の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 149の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 61のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 61のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 9 (Tc1-5_Xtの5'TR)
CAAACCGGATTCCAAAAAAGTTGGGACACTAAACAAATTGTGAATAAAAACTGAACGCAATGATGTGGAGGTGCCAACTTCTAATATTTTATTCAGAATAGAACATAAATCACGGAACAAAAGTTTAAACTGAGAAAATGTACCATTTTAAGGGAAAAATATGTTGATTCAGAATTTCATGGTGTCAACAAATCCCAAAAAAGTTGGGACAAG
SEQ ID NO: 35 (Tc1-5_Xtの3'TR)
CTTGTCCCAACTTTTTTGGGATTTGTTGACACCATGAAATTCTGAATCAACATATTTTTCCCTTAAAATGGTACATTTTCTCAGTTTAAACTTTTGTTCCGTGATTTATGTTCTATTCTGAATAAAATATTAGAAGTTGGCACCTCCACATCATTGCGTTCAGTTTTTATTCACAATTTGTTTAGTGTCCCAACTTTTTTGGAATCCGGGTTG
SEQ ID NO: 61 (Tc1-5_Xtのトランスポザーゼ)
MIGYKKSFSEWQCLSEAKMGRGSPIPTMLRRKIVEQYQKGVTQRKIAKILHLSSSTVHNIIRRFRESGTISVRKGQGRKTILDARDLRALKRHCTTNRNATVKEITEWAQEYFQKPLSVNTIHRAIRRCQLKLYSAKKKPFLSKIHKLRRFHWARDHLKWSVAKWKTVLWSDESRFEVLFGNLGRHVIRTKEDKDNPSCYQRSVQKPASLMVWGCMSACGMGSLHVWKGSINAEKYIQVLEQHMLPSRRHLFQGRPCIFQQDNARPHSASITTSWLRRRRIRVLKWPVCSPDLSPIENIWRIIKRKVRQRRPKTIEQLEACIRQEWESIPIPKLEKLVSSVPRRLLSVVRRRGDATQW
【0093】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 124の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 150の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 10の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 36の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 10の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 36の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 10の核酸配列を含む5’TRと、和2)SEQ ID NO: 36の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 124の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 150の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 62のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 62のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 10 (c1-10_Xtの5'TRT)
CAGTGGCTTGCAAAAGTATTCGGCCCCCTTGAACTTTTCCACATTTTGTCACATTACAGCCACAAACATGAATCAATTTTATTGGAATTCCACGTGAAAGACCAATACAAAGTGGTGTACACGTGAGAAGTGGAACGAAAATCATACATGATTCCAAACATTTTTTACAAATAAATAACTGCAAAGTGGGGTGTGCGTAATTATTCAGCCCCCT
SEQ ID NO: 36 (c1-10_Xtの3'TR T)
AGGGGGCTGAATAATTACGCACACCCCACTTTGCAGTTATTTATTTGTAAAAAATGTTTGGAATCATGTATGATTTTCGTTCCACTTCTCACGTGTACACCACTTTGTATTGGTCTTTCACGTGGAATTCCAATAAAATTGATTCATGTTTGTGGCTGTAATGTGACAAAATGTGGAAAAGTTCAAGGGGGCCGAATACTTTTGCAAGCCACTG
SEQ ID NO: 62 (Tc1-10_Xのトランスポザーゼ t)
MKSKEHTRQVRDKVIEKFKAGLGYKKISKALNIPRSTVQAIIQKWKEYGTTVNLPRQGRPPKLTGRTRRALIRNAAKRPMVTLDELQRSTAQVGESVHRTTISRALHKVGLYGRVARRKPLLTENHKKSRLQFATSHVGDTANMWKKVLWSDETKMELFGQNAKRYVWRKTNTAHHSEHTIPTVKYGGGSIMLWGCFSSAGTGKLVRVDGKMDGAKYRAILEENLLESAKDLRLGRRFTFQQDNDPKHKARATMEWFKTKHIHVLEWPSQSPDLNPIENLWQDLKTAVHKRCPSNLTELELFCKEEWARISVSRCAKLVETYPKRLAAVIAAKGGSTKY
【0094】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 125の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 151の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)TACAGTGTCGGACAAATC(SEQ I
D NO: 11)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)GATTTGTCCGACACTGTA(SEQ ID NO: 37)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 11の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 37の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 11の核酸配列を含む5’TRと、2)SEQ ID NO: 37の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 125の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 151の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 63のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 63のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 63 (Mariner2_AGのトランスポザーゼ)
MGRSAHSTQQQRLDIKRLSAAGYSQRKIAEILGRSKTFVYNALHSTGTKIPTGRPRKTSARDDARMTRLCKADPFKSARAIRDELQLSVSDRTVQRRLFENNLVGRNPRKVPLLRRCHVQARLQFAREHYDWAGENLNKWRNVLWSDESKVNLVGSDGKRFVRRPKNTAYRPQYTLKTVKHGGGNIMVWACFSWYGVGPIFWIKDIMDQHRYLNIIQTVMLPHAEWEMPLKWQFMHDNDPKHTAKAVKKWFVDQKIDVMNWPAQSPDLNPIENLWKIVKAKLPPAGSRTKEKLWKHIENAWYSIPPSTCKSLVESMPKRMRAVIRNNGHATKY
【0095】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 126の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 152の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 12の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 38の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 12の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 38の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 12の核酸配列を含む5’TRと、2)SEQ ID NO: 38の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、S
EQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 126の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 152の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 64のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 64のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 12 (Tc1-1_Xtの5'TR)
CAGTGGTGTGAAAAACTATTTGCCCCCTTCCTGATTTCTTATTCTTTTGCATGTTTGTCACAC
SEQ ID NO: 38 (Tc1-1_Xtの3'TR)
GTGTGACAAACATGCAAAAGAATAAGAAATCAGGAAGGGGGCAAATAGTTTTTCACACCACTG
SEQ ID NO: 64 (Tc1-1_Xtのトランスポザーゼ)
MPRSKEIQEQMRTKVIEIYQSGKGYKAISKALGLQRTTVRAIIHKWQKHGTVVNLPRSGRPTKITPRAQRQLIREATKDPRTTSKELQASLASIKVSVHDSTIRKRLGKNGLHGRFPRRKPLLSKKNIKARLNFAKKHLNDCQDFWENTLWTDETKVELFGRCVSRYIWRKSNTAFQKKNIIPTVKYGGGSVMVWGCFAASGPGRLAVIDGTMNSTVYQKILKENVRPSVRQLKLKRSWVLQQDNDPKHTSKSTSEWLKKNKMKTLEWPSQSPDLNPIEMLWHDLKKAVHARKPSNKAELQQFCKDEWAKIPPERCKRLVASYRKRLIAVIAAKGGPTSY
【0096】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 127の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 153の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CACTGGTGGACAT(SEQ ID NO:
13)核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)ATGTCCACCAGTG(SEQ ID NO: 39)の核酸配列、その変異体又はそのフラグメントを含み3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 13の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 39の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 13の核酸配列を含む5’TRと、2)SEQ ID NO: 39の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 127の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有するLTFと、2)SEQ ID NO: 153の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配
列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 65のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 65のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 65 (Tc1-1_AGのトランスポザーゼ)
MGRGKHCTPEERKHIQGLYRENVPIKTICKAFGRSRTFVDNAIRSEATGKSTGRPRKTTADVDAQIVEMIRADPFKTCTRIKQELGLQVSAKTVSRRLHAAGFCARRPRKVRKLLPHHVEARIRFAEEHLAASIFWWSKIIFSDESRINLDGSDGIKYVWRFPNQAYHPKNTIKTLSHGGGHVMVWGCFSWHGTGPLFRINGTLNSEGYRKILSRKMLPYARQQFGDEEHYIFQHDNDSKHTSRTVKCYLANQDVQVLPWPALSPDLNPIENLWSTLKRQLKNQPARSADDLWTRCKVMWERIPRSECRNLIGDMAKRCQEVIANNGHQIDR
【0097】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 128の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 154の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)ATATACAC(SEQ ID NO: 14)核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)GTGTATAT(SEQ ID NO: 40)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 14の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 40の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 14の核酸配列を含む5’TRと、2)SEQ ID NO: 40の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、AT(SEQ ID NO: 198)の核酸配列を含む5’TSDと、SEQ ID NO: 198の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 128の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 154の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 66のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 66のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 66 (Tc1DR3_Xtのトランスポザーゼ)
MGKKGDLSNFERGMVVGARRAGLSISQSAQLLGFSRTTISRVYKEWCEKGKTSSMRQSCGRKCLVDARGQRRMGRLIQADRRATLTEITTRYNRGMQQSICEATTRTTLRRMGYNSRRPHRVPLISTTNRKKRLQFAQAHQNWTVEDWKNVAWSDESR
FLLRHSNGRVRIWRKQNENMDPSCLVTTVQAGGGGVMVWGMFSWHTLGPLVPIGHRLNATAYLSIVSDHVHPFMTTMYPSSDGYFQQDNAPCHKARIISNWFLEHDNEFTVLKWPPQSPDLNPIEHLWDVVERELRALDVHPTNLHQLQDAILSIWANISKECFQHLVESMPRRIKAVLKAKGGQTPY
【0098】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 129の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 155の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CAGGGGTCACCAAACT(SEQ ID NO: 15)核酸配列その変異体又はそのフラグメントを含む5’TRと、2)SEQ
ID NO: 41の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 15の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 41の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 15の核酸配列を含む5TRと、2)AGTTTGGTGACCCCTG(SEQ
ID NO: 41)の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、CTCTAGAC(SEQ ID NO: 199)の核酸配列を含む5’TSDと、SEQ ID NO: 199の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 129の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 155の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 67のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 67のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 67 (hAT-3_PMのトランスポザーゼ)
MATKKRKVDAECRVFNEEWGVKYFFVETKDQKASCVICSESVAVLKEYNLRRHYETKHLSTYSKFSGKLRSEKYESMKRGLETQRNLFTRKFAENESVTRTSYKIVHKMAERGKPFTDGNFIKECMMEAANDLCPERADLFGSISLSASSVVRRTEELGENIVLQIREKARNLLWYSLALDESTDLSSTSQLLVFIRGVNLDFQITEELASVCSMHGTTTGKDIFMEVQKTLQDYNLQWNQLRGVTVDGGKNMAGVRKGLVGQIRTQLEDLQIPGALFIHCIIHQQALCGKDLDISCVLKPVVSAVNFIRGHALNHRQFQAFLEEMDSDFCDLPYHTAVRWLSCGKVLFRFYKLRNEIDVFLTEKDRADPQLSDPTWLSKLSFLVDITSHMNELNLKLQGKDNLVCDLYRIIKGFRRKLSLFEAQLEGENFSHFHCFKEFCATIAEDVNLDFPKKIIRDLKKHFLKRFSDLDRIESDILLFQNPFDCNLDDVPVELQLELIDLQANDLLKEKHREGKLVEFYRCLPDVEFPKLKKFAAGMASVFGTTYVCEQTFSKMKYVKSTHRTRLTDEHLKAILLIGCSNSKPNIDDILKAKRQFHKSH
【0099】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 130の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 156の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CAGGGGTCACCAAACT(SEQ ID
NO: 16)核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)AGTTTGGTGACCCCTG(SEQ ID NO: 42)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 16の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 42の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 16の核酸配列を含む5’TRと、2)SEQ ID
NO: 42の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDとSEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 130の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 156の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 68のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 68のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 68 (Tc1-1_PMのトランスポザーゼ)
MATKKRKVDAECRVFNEEWGVKYFFVETKDQKASCVICSESVAVLKEYNLRRHYETKHLSTYSKFSGKLRSEKYESMKRGLETQRNLFTRKFAENESVTRTSYKIVHKMAERGKPFTDGNFIKECMMEAANDLCPERADLFGSISLSASSVVRRTEELGENIVLQIREKARNLLWYSLALDESTDLSSTSQLLVFIRGVNLDFQITEELASVCSMHGTTTGKDIFMEVQKTLQDYNLQWNQLRGVTVDGGKNMAGVRKGLVGQIRTQLEDLQIPGALFIHCIIHQQALCGKDLDISCVLKPVVSAVNFIRGHALNHRQFQAFLEEMDSDFCDLPYHTAVRWLSCGKVLFRFYKLRNEIDVFLTEKDRADPQLSDPTWLSKLSFLVDITSHMNELNLKLQGKDNLVCDLYRIIKGFRRKLSLFEAQLEGENFSHFHCFKEFCATIAEDVNLDFPKKIIRDLKKHFLKRFSDLDRIESDILLFQNPFDCNLDDVPVELQLELIDLQANDLLKEKHREGKLVEFYRCLPDVEFPKLKKFAAGMASVFGTTYVCEQTFSKMKYVKSTHRTRLTDEHLKAILLIGCSNSKPNIDDILKAKRQFHKSH
【0100】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 131の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 157の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CAGGC(SEQ ID NO: 17)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)GCCTG(SEQ ID
NO: 43)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 17の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 43の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含
む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 17の核酸配列を含む5’TRと、2)SEQ ID NO: 43の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 131の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 157の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO:
69のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 69のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 69 (Mariner-4_AMiのトランスポザーゼ)
MSAKRKSMTSPGGSAKKQRKAIDLEMKMKIINDYEAGKKVKAIARDLELAHSTISTILKDKDRVKEAVQASTGFKAIITRQRKGLIHEMEKLLAIWFDDQIQKRMPMSLLIIQAKARSIFETLKAREGEESTETFTASRGWFQRFRRRFNVHNRSISGEAASADVEAAEKFVDQFDEIIEKGGYRPEQIFNVDETGLFWKKMPERSYIHKEAKAMPGFKAFKDRVTLLLGGNVAGFKLKPFLIHRSENPRALKQVSKHTLPVYYRANSKAWMTQALFEDWFINCFIPSVKHYCLEKGVPFKIILLLDNAPGHPQHLDDLHPDVKVVYLPKNTTAILQPMDQGAIATFKVYYLRATFSKAVAATESDEVTLRDFWKSYNILHCIKNIESAWEGVTEKCMQGIWKKCLKVFVNNFEGFDKDEHVDVINKKIVELANVLNLDVEVKDIEELVEYVEGELTNEDLIELEAQQHLEEEEEEEEERMEEVQKKFTVNGLAGVFSKVNAAILELEGMDPNVERFTKVERQMNELLRCYCEIYEEKKKKKRKLQSRPH
【0101】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 132の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 158の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CAGTGATGGCGAACCT(SEQ ID NO: 18)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)AGGTTCGCCATCACTG(SEQ ID NO: 44)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 18の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID
NO: 44の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 18の核酸配列を含む5’TRと、2)SEQ ID NO: 44の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、GTCTAGAG(SEQ ID NO: 197)の核酸配列を含む5’TSDと、SEQ ID NO: 197の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 132の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 158の核酸配列と少なくとも約90%
(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 70のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 70のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 70 (Myotis_hAT1のトランスポザーゼ)
MENQKNKKARLNDKGSGSSSSRPFQDIWTEMYGIVDRNNRSLCILCNETVVSRTWNVKRHFETNHCQLLKKSIDERKEYISRQLHLYKSQSNSIIKFVRCSTNLTSASYCIAHSIAQHGKALSDGEFIKETFLRCAPALFHDMKNKDDIIKRISELPLSRNTIKDRIIDLNKNVQHQLKKDLNSCKYFSISLDETTDVTSNARLAIIARYSDGLTMREELIKLESVPISTSGNEICKVVIKTFSDLNIDISKIVSVTTDGAPNMVGKNVGFLKLFMEAIRHPLVPFHCIIHQEVLCAKSGFSELNDLMSVVTKIVNFIASRPLHKREFSALLQEVDSTYSGLLMFNNVRWLSRGKVLERFVECFEEITVFIENKDLANFPQINDHKWVSNLMFFTDLSVHMNELNLKLQGFGKSIDVMFGYIKSFESKLKIFKRDIETKTYKYFPRIKKYFEKATTTSVMESILMYQNIVNSLFEQFSERFDQFRSLEQTIKIIKYPDVVVYSTLELKDFQWMQIDDLEMQLADFQGSIWTHVFVDLRSKLENLERNRLNNEEECNYEQEILSAWNRVPDTFSDIKNLAMALLTIFSSTYFCETLFSALNNIKTNKRNRLTDEVSGACLALKCTKYEPAIEELADKLQHQKSH
【0102】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 133の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 159の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CAG(SEQ ID NO: 19) 核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)CTG(SEQ ID NO:
45)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 19の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 45の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 19の核酸配列を含む5’TRと、2)SEQ ID NO: 45の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、GTCTAGAC(SEQ ID NO: 200)の核酸配列を含む5’TSDと、SEQ ID NO: 200の核酸配列を含む3’TSDとをさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID
NO: 133の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 159の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 71のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 71のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、
上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 71 (hAT-7_PMのトランスポザーゼ)
MSGSRKRKVDNECRVFNTEWTTKYFFTEVQSKAVCLICRETVAVFKEYNISRHFATKHANYASKQSTQERAATAQRLAANLQTQQHFFHRQTAIQESTTKASFLVAFEIAKASKPFSEGEFVKECMVQTADILCPEIKSKFEKVSLSRRTVTRRVELIDENIASQLNKKSDSFELYSLALDESTDVKDTAQLLIFIRGIDDSFAITEEFLTMESLKGTTRGEDLYNQVSAVIERMKLPWSKLVNVTTDGSPNLTGKNVGLLKRIQNKVKEENPDQDLIFLHCIIHQESLCKSVLQLNHVVNPAVKLVNFIRARGLQHRQFITFLEETDADHQDLLYHSRVRWLSLGKVLQRVWELKEDIIAFLELMGKSDEFPELSDKNWLSDFAFAVDIFSHMNELNVKLQGKDQFVHDMYKHVKAFKSKLTLFSRQIANKSFAHFPTLAMQEEAPRNAKKYSKSLEDLHGEFCRRFSDFENIEQSLQLVSCPLSQDSETAPQELQLELIDLQSDSVLKEKFNSVKLNDFYASLNRATFPNLRRTAQKMLTLFGSTYVCEQTFSVMNANKARHRSKLTDQHLRSILRIATTKITPDLDALAKMGDQQHCSH
【0103】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 134の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 160の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 20の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 46の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 20の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 46の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 20の核酸配列を含む5’TRと、2)SEQ ID NO: 46の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 134の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 160の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 72のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 72のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 20 (Tc1-11_Xtの5'TR)
CAGTGGATATAAAAAGTCTACACACCCCTGGTAAAATGTCAGGTTCCTGTGCTGTACAAAAATGAGACAAAGATAAATCATTTCAGAACTTTTTCCACCTTTAATGTGACCTATAAACTGTACCACTCAATTGAAAAACAAACTGAAATCTTTTAGG
SEQ ID NO: 46 (Tc1-11_Xtの3'TR)
CCTAAAAGATTTCAGTTTGTTTTTCAATTGAGTGGTACAGTTTATAGGTCACATTAAAGGTGGAAAAAGTTCTGAAATGATTTATCTTTGTCTCATTTTTGTACAGCACAGGAACCTGACATTTTACCAGGGGTGTGTAGACTTTTTATATCCACTG
SEQ ID NO: 72 (Tc1-11_Xtのトランスポザーゼ)
MVHRELPKHQRDLIVKRYQSGEGYKRISKALDIPWNTVKTVIIKWRKYGTTVTLPRTGRPSKIDEKTRRKLVREATKRPTATLKELQEYLASTGCVVHVTTISRILHMSGLWGRVARRKPFLTKKNIQARLHFAKTHLKSPKSMWEKVLWSDETKVELFGHNSKKYVWRKNNTAHHQKNTIPTVKHGGGSIMLWGCFSSAGTGALVKIEGIMNSSKYQSILAQNLQASARKLNMRRNFIFQHDNDPKHTSKSTKEWLHRKKIKVLEWPSQSPDLNPIENLWGDLKRAVHRRCPRNLTDLECFCKEEWANLAKSKCAMLIDSYPKRLSAVIKSKGASTKY
【0104】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 135の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 161の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 21の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 47の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 21の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 47の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 21の核酸配列を含む5’TRと、2)SEQ ID NO: 47の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 135の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 161の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 73のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 73のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 21 (Tc1-16_Xtの5'TR)
CAGTCATGGCCAAAATTGTTGGCACCCCAGAAATTTTTCCAGAAAATCAAGTATTTCTCACAGAAAAGTATTGCAGTAACACATGTTTTGCTATACACATGTTTATTCCCTTTGTGTGTATTGGAACAGAACAAAAAAGGGAGGAAAAAAAGCAAATTGGACATAATGTCACACAAAACTCCAAAAATGGGCTGGACAAAATTATTGGCACCCTT
SEQ ID NO: 47 (Tc1-16_Xtの3'TR)
AAGGGTGCCAATAATTTTGTCCAGCCCATTTTTGGAGTTTTGTGTGACATTATGTCCAATTTGCTTTTTTTCCTCCCTTTTTTGTTCTGTTCCAATACACACAAAGGGAATAAACATGTGTATAGCAAAACATGTGTTACTGCAATACTTTTCTGTGAGAAATACTTGATTTTCTGGAAAAATTTCTGGGGTGCCAACAATTTTGGCCATGACTG
SEQ ID NO: 73 (Tc1-16_Xtのトランスポザーゼ)
MDNRKRRRELSEDLRTKIVEKYQQSQGYKSISRDLDLPLSTVRNIIKKFATHGTVANLPGRGRKRKIDERLQRRIVRMVDKQPQTSSKEIQAVLQAQGASVSARTIRRHLNEMKRYGRRPRRTPLLTQRHKKARLQFAKMYLSKPQSFWENVLWTDETKIELFGKAHHSTVYRKRNEAYKEKNTVPTVKYGGGSMMFWGCFAASGTGCLECVQGIMKSEDYQRILGRTVEPSVRKLGLRPRSWVFQQDNDPKHTSKSTQKWMATKRWRVLKWPAMSPDLNPIEHLWRDLKIAVGKRRPSNKRDLEQFAKEEWSKIPGERCKKLIDGYRKRLISVIFSKGCATKY
【0105】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 136の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 162の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 22の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 48の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 22の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 48の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 22の核酸配列を含む5’TRと、2)SEQ ID NO: 48の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 136の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 162の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 74のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 74のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 22 (Tc1-4_Xtの5'TR)
CAGTGAGGAACATAAGTATTTGAACACCCTGCGATTTTGCAAGTTCTCCCACTTAGAAATCATGGAGGGGTCTGAAATTCACATTGTAGGTGCATTCCCACTGTGAGAGACAGCATTTAAAAAAAAAATTCAGGAAATCACATTGTATGATTTTTAAAGAATGTATTTGTATTGCACTGCTGCACATAAGTATTTGAACACCTG
SEQ ID NO: 48 (Tc1-4_Xtの3'TR)
CAGGTGTTCAAATACTTATGTGCAGCAGTGCAATACAAATACATTCTTTAAAAATCATACAATGTGATTTCCTGAATTTTTTTTTTAAATGCTGTCTCTCACAGTGGGAATGCACCTACAATGTGAATTTCAGACCCCTCCATGATTTCTAAGTGGGAGAACTTGCAAAATCGCAGGGTGTTCAAATACTTATGTTCCTCACTG
SEQ ID NO: 74 (Tc1-4_Xtのトランスポザーゼ)
MGKTKELSKDTRDKIVDLHKAGKGYGAIAKQLGENRSTVGAIVRKWKRLKTTVSLPRTGAPCKISPRGVSLMIRKVRNQPRTTREELVNDMKRAGTTVSKVTVGRTLRRHGFKSCIARKVPLLKSSHVQARLKFANDHLDDPEEAWEKVMWSDETKVE
LFGLNFTRRVWRKNKDELHPKNTIPTVKHGGGNIMLWGCFSAKGTGRLHCIKERMNGAMYCEILSNNLLPSVRALKMGRGWVFQHDNDPKHTARITKEWLRKRHIKVLEWPSQSPDLNPIENLWRELKLRVAQRQPRNLTDLEEICVEEWAKIPVAVCANLVKNYRKRLTSVIANKGFCTKY
【0106】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 137の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 163の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CACTGCTCAAAAAAATAAAGGGAACAC(SEQ ID NO: 23)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)GTGTTCCCTTTATTTTTTTTGAGCAGTG(SEQ ID NO: 49)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 23の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 49の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 23の核酸配列を含む5’TRと、2)SEQ ID NO: 49の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 49の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 137の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 163の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 75のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 75のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 75 (Tc1-15_Xtのトランスポザーゼ)
MRRSLQPTQMAQVVQLIQDGTSMRAVARRFAVSVSVVSRAWRRYQETGQYIRRRGGGRRRATTQQQDRYLRLCARRNRRSTARALQNDLQRATNVHVSAQTVRNRLHEGGMRARRPQVGVVLTAQHRAGRLAFAREHQDWQIRHWRPVLFTDESRFTLSTCDRRDRVWRRRGERSAACNILQHDRFGSGSVMVWGGISLGGRTALHVLARGSLTAIRYRDEILRPLVRPYAGAVGPGFLLMQDNARPHVAGVCQQFLQDEGIDAMDWPARSPDLNPIEHIWDIMSRSIHQRHVAPQTVQELVDALVQVWEEIPQETIRHLIRSMPRRCREVIQARGGHTHY
【0107】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 138の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 164の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CACTGCTCAAAAAAATTAGAGGAACACTT(SEQ ID NO: 24)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)AAGTGTTTCCTCTAATTTTTTTTGAGCAGTG(SEQ ID NO: 50)の核酸配列、その変異体又はそのフラグメントを
含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID
NO: 24の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 50の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID
NO: 24の核酸配列を含む5’TRと、2)SEQ ID NO: 50の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID
NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 138の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 164の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 76のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 76のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 76(TC1_FR2のトランスポザーゼ)
MVRYLDATEVAQVVQLLQDGTSIRAVARRFAVSPSTVSRAWRRFQETGSYSRRAGQGRRRSLNPQQDRYLLLCARRNRMSTARALQNDLQQATGVNVSDQTIRNRLHEGGLRARRPVVGPVLTARHRRARLAFAIDHQNWQLRHWRPVLFTDESRFNLSTCDRRERVWRCRGERYAACNIIQHDRFGGGSVMVWGGISLEGRTDLYRLDNGTLTAIRYRDEILGPIVRTYAGAVGPGFLLVHDNARPHVARVCRQFLEDEGIDTIDWPPRSPDLNPIEHLWDIMFRSIRRRQVDPQTVQELSDALVQIWEEIPQDTIRRLIRSMPRRCQACVQARGGHTNY
【0108】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 139の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 165の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)TAG(SEQ ID NO: 25)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)CTA(SEQ ID NO:
51)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 25の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 51の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 25の核酸配列を含む5’TRと、2)SEQ ID NO: 51の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、ATCATCAT(SEQ ID NO: 201)の核酸配列を含む5’TSDと、SEQ ID NO: 201の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ I
D NO: 139の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 165の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 77のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 77のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 77(hAT-9_XTのトランスポザーゼ)
MPGKGRPPRRGTRGRAAMISCGPRKLPSFPKALTLNSQNAEEVVDWLTQHTPSSTVSNFATTSSSSSAMGTPRTTSSTTAAPSSLESEELFTHEFVELSDAQPLLPEEDEGDEDVTPDIIIQAGNTTEMDIRCDEVPAAAVFCELSEEIDASEENDDEEIDILWVPTRREQEEDSSDGETESQRGRRRIRLRRSRDSSQGTVGQQHESAPVVSQPTHPPTSTVTARKPTSKGSAVWHFFNVCASDKSAVICNECSQKLSLGKPNTHLGTTAMRRHMNAKHKALWEQHLKGSSQTLSHPPSAPASYCSTSAVLDPSQPPSTPPSTLTTSSCSSAPSQVSVRAMFERKKPMPPSHPLARRLTAGLSALLARQLLPYQLVDSEAFHQFVAIGTPQWKVPSRNFFSQKGIPHLYQHVQSQVTASLSFSVGAKVHMTTDTWSSKHGQGRYVTYTAHWVNLVMAGKQGMRGSTTVELVSPPRVACGSATTSTPPLLSNSSSKSSSNSSSNLASSSASSSSAAVSSSTPVHPQLHIGYSTCQVRRCHAVLGMTCLESRNHTGSALLSSLHSQADRWLTPHQLKIGKVVCDNGSNLLAALRLGNLTHVPCMAHVLNLIVQRFVSKYPGLQDILRQSRKVSGHFRRSYTAMARLADIQRRHNLPVRRLICDSQTRWNSTLMMFERLLQQQRAVNEYLFELGGRTGSAELGIFFPRYWVLMRDACRLMRPFDEVTNMVSRTEGTISDLIPFAFFLERAVRRVTDDAVDQRDQEHDFWAESPERSQAPAATQGEVSEVESEEEGGFVEAEDQQEQASRGACGHLLWSPGLVRGWGEETVVDEDVVLDNEEGEMDTSASNLVRMGSFMLSCLLKDPRIKRLKEKDLYWVATLLDPRYKHKVAEMLPTYHKSERMLHFQTSLQNMLYNAFKGDVTPHSRGRGAGNPPTSTPARTMHFGHSVTSDMQSFFSPRQRQDPSGSTLRERLDRQVADYLALTADIDTLRSDEPLDYWVRRLDLWPELSQFAINLLSCPASSVLSERTFSAAGGIVTEKRTRLGHKSVDYLTFIKMNEAWISEGYCTPEDLF
【0109】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 140の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 168の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CCGTATTTTCCGCACTATAAGGCGCACC(SEQ ID NO: 26)の核酸配列、その変異体又はそのフラグメントを含む5’TRt、2)GGTGCGCCTTATAGTGCGGAAAATACGG(SEQ ID NO: 52)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO:
26の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 52の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO:
26の核酸配列を含む5’TRと、2)SEQ ID NO: 52の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO:
193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 140の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか
)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 168の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 78のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 78のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 78(Mariner-5_XTのトランスポザーゼ)
MAPKKRHAYEAQFKLQAASYAVVNGNRAAAKEFNINESMVRKWRKQENELRQVKKTKQSFRGNKARWPQLEDQLEQWVIEQRTAGRSVSTVTIRLKATTIAQDLEIEHFQGGPSWCFRFMKRRHLSIRARTTVAQQLPADYKEKMAIFRTYCSNKITDKKIQPNHITNMDEVPLTFDIPVNHTVEIKGTSTVSIRTTGHEKSAFTVVLSCHGNGQKLPPMVIFKRKTLPKEKFPAGVIVKANQKGWMDEEKMREWLREVYVKRPDGFFHTSPSLLICDSMRAHLTATVKKQVKQMNSELAIIPGGLTKELQPLDVGVNRAFKVKLRTAWERWMTDGEHTFTKTGKQRRASYATICEWIVDAWAKVSAITVVRAFAKTGIIAEQPPGNDTGNETDSDNDEREPGMFDGEIAQLFNSDTEDEDFDGFVGED
【0110】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 167の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 179の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CCGTATTTTCTC(SEQ ID NO: 79)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)GAGAAAATACGG(SEQ ID NO: 91)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 79の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 91の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 79の核酸配列を含む5’TRと、2)SEQ ID NO: 91の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はSEQ
ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 167の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 179の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 103のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 103のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まな
い。
SEQ ID NO: 103(Mariner-6_AMiのトランスポザーゼ)
MPKRKSYTFDFKLSVIDYAKKHGNRAAGREFSVDEKSVREWRKEEDILKTLNPRKRARRGKHCKWPTLEANLKEWVVAQRESNKVVSTIAIRQKARVMANEMKITDFGGGCNWVHKFMHRNNLAVRSRTTVGQKLPDDWEEKLTKFRDFVRKECRVHNLCPADIINMDEVPISFDVPATRTVDQRGKKTIAISTTGHERTNFTVVLACTASGVKLKPMVIFKRVTMPREKIPNGVAVICNKKGWMNEDIMKEWTERCFRTRQGGFFAPKSLLIFDAMAAHKHSSVQKQINKAGAHIAVIPGGLTCKLQPLDISVNHSFKCFMRKEWEKWMSQGVHSFTPSGKQRRATYTEVCNWIVAAWRAVKPSSIINGFFKAGILDGASGEESDYTDSEDYADELDDAAFVDAYFGESSYDTDFEGFPASEKEEAPNWV
【0111】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 168の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 180の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CCCTTT(SEQ ID NO: 80)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)AAAGGG(SEQ ID NO: 92)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 80の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 92の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 80の核酸配列を含む5’TRと、2)SEQ ID NO: 92の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はTTAA(SEQ ID NO:
202)の核酸配列を含む5’TSDと、SEQ ID NO: 202の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 168の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 180の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ
ID NO: 104のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 104のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 104(piggyBac-2_XTのトランスポザーゼ)
MAKRFYSAEEAAAHCMASSSEEFSGSDSEYVPPASESDSSTEESWCSSSTVSALEEPMEVDEDVDDLEDQEAGDRADAAAGGEPAWGPPCNFPPEIPPFTTVPGVKVDTSNFEPINFFQLFMTEAILQDMVLYTNVYAEQYLTQNPLPRYARAHAWHPTDIAEMKRFVGLTLAMGLIKANSLESYWDTTTVLSIPVFSATMSRNRYQLLLRFLHFNNNATAVPPDQPGHDRLHKLRPLIDSLSERFAAVYTPCQNICIDESLLLFKGRLQFRQYIPSKRARYGIKFYKLCESSSGYTSYFLIYEGKDSKLDPPGCPPDLTVSGKIVWELISPLLGQGFHLYVDNFYSSIPLFTALYCLDTPACGTINRNRKGLPRALLDKKLNRGETYALRKNELLAIKFFDKKNVFMLTSIHDESVIREQRVGRPPKNKPLCSKEYSKYMGGVDRTDQLQHYYNATRKTRAWYKKVGIYLIQMALRNSYIVYKAAVPGPKLSYYKYQLQILPALLFGGVEEQTVPEMPPSDNVARLIGKHFIDTLPPTPGKQRPQKGCKVCRKRGIRRDTRYYCPKCPRNPGLCFKPCFEIYHTQLHY
【0112】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 169の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 181の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CCTTCATACG TTCCCATG(SEQ ID NO: 81)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)CATGAGAACG GATGAGGG(SEQ ID NO: 93)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 81の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 93の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 81の核酸配列を含む5’TRと、2)SEQ ID NO: 93の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 202の核酸配列を含む5’TSDと、SEQ ID NO: 202の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 169の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 181の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 105のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 105のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 105(piggyBac-1_AMiのトランスポザーゼ)
MRRQRIFSAEACLAQVTGDDSDTSTDEILSQGSEDADFVPDMGDCSEQEDHASTEASSSSDEEELVPQAEVMPTLPVGKGRGPARGRRGRPRRATAGRGAEPLPPPPENIADDDTFRGRNGRVWGKSPQLIHHRRTAKDIVHESAGPTRESNKDTVVETFHLFLSQDILTVIIRETNREAERRFREWNDSHPENRKEWKKLDETELKAYIGLLLLSGLYHGGHEALEELWEQRTGRPCFRATMSLKRFRQITNYLRFDNKLTREERRAVDKLAAFRDIWTQFVEQLRKWYIPGIHLTVDEQLIAFRGRCPFRQYMPSKPAKYGLKIWWCCDAATSFPLSGDIYLGKQPEAPRQGNLGTQVIEKLVHPWYKTGRNIVGDNFFTSTDLAERLLQQDLTYVGTIRKNKADIPNEMQANRRRETFSSIFAFDGELTLVSYVPKKSKVVLLLSSMHHDLSVGGEQRKPDIIHDYNKNKGGVDNLDHLVRMTTCRRKINRWPMTLFFNMLDVAAIASLIIWLGHNANWKQRSHLRRRRFFLQELGEQLIDGQIKRRMMDTRNLSKSVKSGMTALNYKLPQRTPVEPSASMSGRCAFCPRTDDRKTRKRCEDCKRFACVHHSTSLLLCEECNI
【0113】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 170の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 182の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CAGTAGAACC CCG(SEQ ID NO: 82)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)CGGGGTTCTACTG(SEQ ID NO: 94)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 82の核酸配列と少なくとも約90%(例えば、少なくとも約
91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 94の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 82の核酸配列を含む5’TRと、2)SEQ ID NO:
94の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 170の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 182の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 106のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 106のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 106(Mariner-3_Crpのトランスポザーゼ)
MRRPSQMELRAAWVPKQDSGFSLSVAIVFKMSASNTDSTSASASTRKRKAITLEEKLEVVKRYERGEKTKEIRCATGLSESTLRTIRDNAEKIKESCKSATRLSTARVSLTRSAIMEKMERMLTTWIEHQNQEHVPLSTQVIQAKARSIYEVLKRDDPEAKPFNASAGWFDRFKARHGFHNLKLTGEAAAADKSAADKFPSILQAAIEEGSYDPRQVFNLDETGLFWKRMPSRTFISVEERTAPGFKAAKDRCTLLLGANAAGDFKLKPLMVYHAENPRALKGYAKGHLPVYWRANRKGWVTGSLFEDYFSSLLHLELRAYCDRQNLPFKILLLLDNAPGHPPSLGDLSENIKVLFLPPNTTSLIQPMDQGVIRAFKSYYLRRTFKKLINETESKEKANVKEFWKAFNIKMAIDIIGDAWNDVTQQCLNGVWKNIWPAVVNDFRGFAADEFISDARHEIVEMAKSVGFEQVDEENVAELLDSHREELSNEDLLELDRERHEEEEPMEENERPSPRVLTMKGMADAFKLLDGYLAFFDENDPNRERSAKVARLMKEANACYTELYREKRRCSVQSSLDKFFRKRDSTISTQSTDSQPSTSGGEPATSGGEISPPSFDVFDLDEDSAPH
【0114】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 171の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 183の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CAGTGGTTCT TAACCT(SEQ ID
NO: 83)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)AGGTTAAGAA CCACTG(SEQ ID NO: 95)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 83の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 95の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 83の核酸配列を含む5’TRと、2)SEQ
ID NO: 95の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はCTCTAGAG(SEQ ID NO: 203)の核酸配列を含む5
’TSDと、SEQ ID NO: 203の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 171の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 183の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 107のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 107のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 107(hAT-1_PMのトランスポザーゼ)
MSGKRRKWSDEYVQHGFSCITERDGSERPICMICNAKLSNSSLAPAKLKEHFLKLHGDGEYKNTTLAEFRVKRARFDERATLPALGFVPVNKPILTASYEVAYLIAKQGKPHTIGETLVKPAALKMANLILGTAAEGKLSQIPLSNDTVSDRIEDMSKDILAQVVADLISSPAKFSLQLDETTDVSDLSQLAVFVRYVKDDMIKEEFLFCKPLTTTTKAADVKKLVDDFFRDNNLSWDMVSAVCTDGAPVMLGRKSGFGALVKADAPHIIVTHCILHRHALATKTLPPKMAEVLKTVVECVNYVRKSALRHRIFSELCKEMGSEFEVLLLHSNIRWLSRGQVLNRVFAMRVELALFLQEHQHCHADCFKNPEFILILAYMADIFAALNHLNQQMQGGGVNIMEAEEHLKAFQKKLPLWKRRTENNNFANFPLLDDCASKIEDVSGIGDISVSTELKQTIATHLDELAKSLDGYFPTRESYPAWVRQPFTFAVETADVNDEFLDEIIEIQQSQVQQQLFRTTTLSTFWCRQMNKYPVIAKKALDFFIPFVTTYLCEQSFSRMLDIKTKKRNRLCCENDMRVALAKVKPRISELISQRQQQKSH
【0115】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 172の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 184の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)TAGGGCTGTG CGAAA(SEQ ID NO: 84) の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)TTTCGCACAG CCCTA(SEQ ID NO: 96)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 84の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 96の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 84の核酸配列を含む5’TRと、2)SEQ ID NO: 96の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 196の核酸配列を含む5’TSDと、SEQ ID NO: 96の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 172の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 184の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形
態では、上記転移因子はSEQ ID NO: 108のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ
ID NO: 108のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 108(hAT-17_Crocのトランスポザーゼ)
MTVSSTPISLPMLSLPVPEEELELDLDLSAIAREILGKEGESSEFVLHTPQVSPRARSPSPEGTSEEAEVEVAEASGSAESAPPVAVPLPAEEGEKAASAHAPAPQKRAGSVVWDHFELADDPTYAICLHCRAKTSRGKGTKHMSTTGMLMHLRRHHPLALAPPQPGTSGSVPKGKSPSRSKAPVPPKQRQATLEQWGKGGQKGGRVARASEITQSIGEMLAVDGQPFSLVERPGFRRLMALVAPSYQVPARTTFSRTVVPSLYEACREYLREELRKAGPQVALHFTSDIWSSRGGDHAYLSLTGHWCDQSGRRWALLQAEVMDESHTATEIMGAMNRLVQGWLVGQGELTRGFMVTDNGANMVKAVRDANFVGIRCVAHKFHLIVRDALEGDRAAGDGASTTSKLISKCRKVAGYFHRSIKGGKMLRDKQAELNIPQHKIMQDVETRWNSTYLMLERLVEQQKAIHEMALLGEIGISGPLNRAEWDTISQILVVLKPFLEATETLSAGDALLSQVIPVVRELQSQMESFQGINVPGWGKPLSPDVQALVRRLKEGIRKRLDPLRSSTVHVLAATCDPRVKGSVCGSQSLNQWTEVLVKRVREAERRRRGDVEEGDPLSRASTPSTSQSPPPPQALPMWAKGMASMVGSRGTRPHHQAGSAQALVAAYLAEDVEPLLCDPLAYWASRSQMWPDLATVAREHLSCPPTSVPSERVFSIAGDVVTPHRTSLDPGLVEQLVFLKVNLPLLGFPKLQVQTE
【0116】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 173の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 185の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CAGGTTGAG(SEQ ID NO: 85)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)CTCAACCTG(SEQ ID NO: 97)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 85の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 97の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 85の核酸配列を含む5’TRと、2)SEQ ID NO: 97の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDとをさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 173の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 185の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 109のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 109のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形
態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 109(Tigger4のトランスポザーゼ)
MSKRPADTPMGNSDKKKRKHLCLSIAQKVKLLEKLDSGVSVKRLTEEYGVGMTTIYDLKKQKDKLLKFYAESDEQKLMKNRKTLHKAKNEDLDRVLKEWIRQRRSEHMPLNGMLIMKQAKIYHDELKIEGNCEYSTGWLQKFKKRHGIKFLKICGDKASADHEAAEKFIDEFAKVIADENLTPEQVYNADETSLFWRYCPRKTLTTADETAPTGIKDAKDRITVLGCANAAGTHKCKLAVIGKSLRPRCFQGVNFLPVHYYANKKAWITRDIFSDWFHKHFVPAARAHCREAGLDDDCKILLFLDNCSAHPPAEILIKNNVYAMYFPPNVTSLIQPCDQGILRSMKSKYKNTFLNSMLAAVNRGVGVEGFQKEFSMKDAIYAVANAWNTVTKDTVVHAWHNLWPATMFSDDDEQGGDFEGFRMSSEKKMMSDLLTYAKNIPSESVSKLEEVDIEEVFNIDNEAPVVHSLTDGEIAEMVLNQGDRDNSDDEDDVVNTAEKVPIDDMVKMCDGLIEGLEQRAFITEQEIMSVYKIKERLLRQKPLLMRQMTLEETF
【0117】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 173の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 185の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CAGTAGTCCC CCCTTATCCG CGG(SEQ ID NO : 86)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)CCGCGGATAA GGGGGGACTA CTG(SEQ ID NO: 98)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 86の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 98の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 86の核酸配列を含む5’TRと、;和2)SEQ ID NO: 98の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDとをさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO:
173の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 185の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 110のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 110のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 110(Tigger7のトランスポザーゼ)
MAPKRKSSDAGNSDMPKRSRKVLPLSEKVKVLDLIRKEKKSYAEVAKIYGKNESSIREIVKKEKEIRASFAVAPQTAKVTATVRDKCLVKMEKALNLWVEDMNRKRVPIDGNVLRQKALSLYEDFSKGSPETSDTKPFTASKGWLHRFRNRFGLKNIKITGEAASANEEAAATFPAELKKLIKEKGYHPKQVFNCDETGLFWKKMPNRTYIHKSAKEAPGHKTWKDRLTLVLCGNAAGHMIKPGVVYRAKNPRALKNKNKNYLPVFWQHNQKAWVTAILFMEWFHQCFIPEVKKYLEEEGLEFKVLLIIDNAPGHPESVCYENENVEVVFLPPNTTSLLQPLDQGIIRFVKATYTRLVFDRIRSAIDADPNLDIMQCWKSFTIADAITFIKAAMDELKPETVNACWKNLWSEVVNDFKGFPGIDGEVRKIIHAARQVGGEGFADMLDEEVEEHIEGHREVLTNEELEELVESSTEEEEDEEETEAEPAMWTLPKFAEVFRIAQTLKDKIMEYDPRMERSIKVTRMITEGLQPLQQHFDELKRKRQQLPITMFFQKISA
KNLQLSRIPNHRHRLLLTSNHRHRHGSMIQDHPKQMILLLTYRQKVNSSLTLRHNAYVIHLTSSHHVGIVSSHIITRRRVSTVQ
【0118】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 175の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 187の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)TAGGG(SEQ ID NO: 87)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)CCCTA(SEQ ID
NO: 99)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 87の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 99の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 87の核酸配列を含む5’TRと、2)SEQ ID NO: 99の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はTTTATAAT(SEQ ID NO: 204)の核酸配列を含む5’TSDと、SEQ ID NO: 204の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 175の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 187の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 111のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 111のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 111(hAT-19_Crpのトランスポザーゼ)
MNAKKSSKTAKYVSALDRARQYPAGTLHADGGRLFCTSCNVTLDVSRKTSIDRHLESEAHMKRKAAAEAEGQSKKQATVSSLFKRTTESSLARREAAFSLVEAFAAANIPLEKLDHPKLRDYLNQNVPNAGSFPRANKLRQDYLPAVIASHVQSTKAALAEYHSFSIVADEATDPQDNYVLHILFVPGSWTDRDLPVFQTEPVHLTSVNFSTVSQAIVKVIVSYGVDFNKISAFLSDNAMYMCKAFSDVLQGMLPNAVHVTCNAHILSLVSDIWRTQFPEVDSLVSSFKKAFKHCPGRKVRYRESVASQSGDSHGTVPLPPEPVLTRWNSWFNAVRYHAKHMQHYQQFVSEELEITPSTQCMLKLRDLLGRGDIQDQVTFVADNATRFMELLTWFEGRQAVIHHAHNKLMDLISWVEDRASQELSSCPRENQRRRDLFQAIAVKLNQYYRYDPSLPPRFRQPAAPFLSAVRILDPNQVPLLSCDPQLLKAIPGWGKEHDNERAAYVNFVKECQMPVPVPVFWDSVCDRFPHLYALARRCLTIPTNSVDAERAISVYGQVFTPQRQRMSPATAAGCSMLAFNT
【0119】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 176の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 188の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)TAGG(SEQ ID NO: 88)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)CCTA(SEQ ID NO: 100)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む
。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 88の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 100の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 88の核酸配列を含む5’TRと、2)SEQ ID NO: 100の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はCTATATAG(SEQ ID NO: 205)の核酸配列を含む5’TSDと、SEQ ID NO: 205の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 176の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 188の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 112のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 112のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 112(hAT-17B_Crocのトランスポザーゼ)
MTVSSTPISSPSVSLPVPEEELDLEAGDLSALAKEILGTEGESEFVLHTPQSSPRARSPSPEGTSEEVEVVEASGSAESAPPVVVPLPAEEGDKAGSPPSTQKRGGSVVWDHFEVADDPKYAICQHCRRQISRGKEVKHFTTTAMLLHLRRQHPLALAPPQPGTSGSVPKGKSPSRSKAPVPTKQRQATLERWGKAADKGGRVARASEVTQSIGEMLALDGQPFSLVERPGFRRLMALVAPSYQVPARTTFSRTVVPSLYEACREYLREELRKAGPQVALHFTSDIWSSRGGDHAYLSLTGHWCDQSGRRWALLQAEVMDESHTAREIMVAMNRMVQGWLVGQGELTRGFMVTDNGANMVKAVRDANFVGIRCVAHKLHLIVRDALEGDRAAGDGAVTTTQLISKCRKVAGYFHRSIKGGKMLRDKQAELSVPQHKIMQDVETRWNSTYLMLERLVEQQKAIHEMALLGEIGISGPLNKAEWDTISQILVVLKPFLEATETLSAGDALLSQVIPVVRELENQMEKFQGIDVPGWGKPLSPEVQALVKRLKEGIKKWLDPLRSSTVHVLAGMCDPRVKGSMCTGSTKTLDHWTEVLVNRVREAEGQRRGDVEEGDPLSRASTPSTSQSPPRQPLPMWAKGMASMLGSRRTRPQPRAGSAEASVATYLAEDVEPLDCDPLAYWATRSQMWQDLATVAREHLSCPPTSVPSERVFSIAGDVVTPHRTSLDPGLVEQLVFLKVNLPLLGFPELHLQTE
【0120】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 177の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 189の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 89の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 101の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 89の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 101の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 89の核酸配列を含む5’TRと、2
)SEQ ID NO: 101の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はATTAATAG(SEQ ID NO: 206)の核酸配列を含む5’TSDと、SEQ ID NO: 206の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 177の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 189の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 113のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 113のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 113(hAT-10_XTのトランスポザーゼ)
MTGRGRGRKGGMGGKGGEGGRKGGVGGEGGRKGGVGGEGGVGGKGGLGGRSRGAGCGQEPSTRAMPSLGNIGQQPQQQSQQQQQQLQQQQVAGRSGATGSRKTLPDFFATTSRPIQSQQAEAVMDWLTQATSSAADSSEQQEVASPASSVIRGMLSPLLFDPEVDFSPDTQDLFDDQTGMGGAFLSDEEEVYVAQHTTSAVGDVGQGPLMAGQQADEPDVDVDAGSDLGEDVEDDGDRSWVPAQEDNSSSSEGELCVVVSDADEEPAPKKQKTPPTTARGGRQQGSTAPGSTGSGRMGRDLQPSGPQPSTAGKVVARTSAVWAFFTCQSQDPSVAVCHLCRQKVRRGQTGSHMGTSALSSHMKRHHRMTWEQHQSGRAPGGSGASCPPPPIPQGTGASSPIPVAREEDSEAHSWRRPLCSSASSAAPSVSSSSLLPSAQPLSRQVSLPQFLGRKAPLSSSHPQVQRLNACLAKLLAVQLLPYQLVDAAPFRQLMACAAPNWRIPSRHYFARKAVPALHQQVVDNVSLSLDYAVGGRVHCTTDTWTSRHGQGRYISYTAHWVTLMSAGEGAGSRTPLRLEVPPRGVKGKPHTATSSSSSSTMDEPPLKRPRSYASVQYKRCQAVLQLLCLGERSHTAPELHAAFQTQVQRWFTPRQLQAGNVVCDNGRNLLAALHLGRLTHVPCFAHVLNLVVQHFLKSYTGLGVVLEKARRVCGHFRRSPTASASLSRMQRQHSLPPHRLICDLPTRWNSTLHMVERLVEQRWAVSNYLLEHSARGTQGANLGYFSTEQWQQMRQLCRVLAPFEQATRFVSRDNACVSDIIPLVFLLKRTLDGLLEEGDVPEEEECRPRRQVEGAARHDEEDMPNEEDEGEEDWVPAEQGEQGPRHPTTPAVVRGWEDTEQGEEAGDDLLHLQGSQEEVGRGHLFYMAAHMQTCLRSDSRICAIKDREDYWVATMIDPRYKEKMAQFLVPSQRERRVGQLKRALCAKLMEAFPQPDTQASTTPHIQQRQESSSSSSSAARGGGNLMDVWRSFFEPRQAAAGLVSTQSHHQQRLDNMVADYMGSVSVQDAMHTDDDPMNFWVSRLDQWPELAQYALEVLACPPASVLSERVFSAAGGVVTEKRTRLSTGSVDRLSFIKMNEAWISGDIHVPIADIRD
【0121】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 178の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 190の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 90の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 102の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 90の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 102の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRvと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 90の核酸配列を含む5’TRと、2)SEQ ID NO: 102の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 193の核酸配列を含む5’TSD
と、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 178の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 190の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 114のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 114のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 90(MARWOLEN1の5'TR)
TACAGTGGCGAGCAAAACTGAGTGCATGTTCACAACTCTCACTTTGGCCATCAATAAAAACACAACCGCTTATGCAAATTCAATAATTTTTTTTATATTATTAATCTTAATTAATTTATAACTTATTTTATGAGAAAAAACAAATTTAGCATATATATTCAAAGACTTAGAATAAAAAAACTAAATAAACTCACATAAACTCAATTTTGCACGTTT
SEQ ID NO: 102(MARWOLEN1の3'TR)
AAACGTGCAAAATTGAGTTTATGTGAGTTTATTTAGTTTTTTTATTCTAAGTCTTTGAATATATATGCTAAATTTGTTTTTTCTCATAAAATAAGTTATAAATTAATTAAGATTAATAATATAAAAAAAATTATTGAATTTGCATAAGCGGTTGTGTTTTTATTGATGGCCAAAGTGAGAGTTGTGAACATGCACTCAGTTTTGCTCGCCACTGTA
SEQ ID NO: 114(MARWOLEN1のトランスポザーゼ)
MRKLSGEIQNNIVSLTESGNSTRQIAERLGISQSAVVSIQKRRKLTPKPQVSGRKKLLKDSDARLMMSEMRKNKNLTPKGACLAINKNVSEWTARRALQDIGYMSIVKKNKPALSDKNVKARLKFAKDHKNWTIDDWKRVVWSDESKFNRFQSDGKQYCWIRPGDRVQRHHVKQTVKHGGGNIMVWGCFTWWHIGPLQLVEGIMKKEDYLRILQTNLPNYFDKCAYPEKDIIFQQDGDPKHTAKIVKEWIGKQHFQLMEWPAQSPDLNPIENLWSIVKRRLGQYDSAPKNMGDLWERVAVEWSRIPQDILRNLVESMPKRVTEVIVNKGLWTKY
【0122】
異種核酸
本明細書に記載された操作された転移因子は、種々の異種核酸の転移に適している。いくつかの実施形態では、上記異種核酸はDNAである。いくつかの実施形態では、上記異種核酸は二本鎖である。いくつかの実施形態では、上記異種核酸は、1つ又は複数の修飾ヌクレオチドを含む。いくつかの実施形態では、上記異種核酸は修飾されていない。
【0123】
転移因子中の異種核酸は、種々の適切な長さを有し得る。いくつかの実施形態では、上記異種核酸の長さは、少なくとも約1kb、2kb、10kb、20kb、30kb、40kb、50kb、60kb、70kb、80kb、90kb、100kb、150kb、200kb、250kb、300kb、350kb、400kb、450kb、500kb、600kb、700kb、800kb、900kb、1000kb又はそれ以上のいずれかである。いくつかの実施形態では、上記異種核酸の長さは、1000kb、900kb、800kb、700kb、600kb、500kb、450kb、400kb、350kb、300kb、250kb、200kb、150kb、100kb、90kb、80kb、70kb、60kb、50kb、40kb、30kb、20kb、10kb、5kb、2kb又は1kbのいずれかを超えない。いくつかの実施形態では、上記異種核酸の長さは、約100bpから約1kb、約1kbから約2kb、約2kbから約5k
b、約5kbから約10kb、約100bpから約5kb、約100bpから約2kb、約2kbから約10kb、約1kbから約10kb、約10kbから約20kb、約20kbから約50kb、約50kbから約100kb、約1kbから約100kb、約150kbから約200kb、約200kbから約300kb、約300kbから約400kb、約400kbから約500kb、約500kbから約600kb、約600kbから約700kb、約700kbから約80kb、約800kbから約900kb、約900kbから約1000kb、約10kbから約100kb、約100kbから約500kb、約500kbから約1000kb、或約10kbから約500kbである。いくつかの実施形態では、上記異種核酸の長さは、約10kbから約300kbヌクレオチドである。いくつかの実施形態では、上記異種核酸の長さは、約100bpから約300kbヌクレオチドである。
【0124】
異種核酸は、1、2、3、4、5、6、10又はそれ以上のいずれかのコード配列を含む1つ又は複数のコード配列を含んでもよい。本願では、任意の適切なコード配列を使用してもよく、コード配列は任意の適切な目的生物産物をコードすることができる。いくつかの実施形態では、上記コード配列は、RNA分子をコードする。いくつかの実施形態では、上記コード配列は、タンパク質などのポリペプチドをコードする。いくつかの実施形態では、上記異種核酸は、第1タンパク質をコードする第1コード配列と、第2タンパク質をコードする第2コード配列とを含む。いくつかの実施形態では、上記異種核酸は、第1RNAをコードする第1コード配列と、第2RNAをコードする第2コード配列とを含む。いくつかの実施形態では、上記異種核酸は、タンパク質をコードする第1コード配列と、RNAをコードする第2コード配列とを含む。
【0125】
いくつかの実施形態では、上記コード配列は、治療的タンパク質をコードする。いくつかの実施形態では、上記コード配列は、モノクローナル抗体、多特異性抗体、及び抗体フラグメントを含む治療的抗体をコードする。いくつかの実施形態では、上記コード配列はサイトカインをコードする。いくつかの実施形態では、上記コード配列は抗原をコードする。いくつかの実施形態では、上記コード配列は、遺伝子治療に有用な治療薬をコードする。遺伝子治療に有用な例示的な治療的タンパク質は、アデノシンデアミナーゼ、リソソーム蓄積症で影響を受ける酵素、アポリポタンパク質E、脳由来神経栄養因子(BDNF)、骨形態形成タンパク質2(BMP-2)、骨形態形成タンパク質6(BMP-6)、骨形態形成タンパク質7(BMP-7)、心筋栄養因子1(CT-1)、CD22、CD40、毛様体栄養因子(CNTF)、CCL1-CCL28、CXCL1-CXCL17、CXCL1、CXCL2、CX3CL1、血管内皮細胞増殖因子(VEGF)、ドーパミン、エリスロポエチン、因子IX、因子VIII、上皮成長因子(EGF)、エストロゲン、FAS-リガンド、線維芽細胞増殖因子1(FGF-1)、線維芽細胞増殖因子2(FGF-2)、線維芽細胞増殖因子4(FGF-4)、線維芽細胞増殖因子5(FGF-5)、線維芽細胞増殖因子6(FGF-6)、線維芽細胞増殖因子7(FGF-7)、線維芽細胞増殖因子10(FGF-10)、Flt-3、顆粒球コロニー刺激因子(G-CSF)、顆粒球マクロファージ刺激因子(GM-CSF)、成長ホルモン、肝臓細胞増殖因子(HGF)、インターフェロンα(IFN-a)、インターフェロンβ(IFN-b)、インターフェロンγ(IFNg)、インスリン、グルカゴン、インスリン様増殖因子1(IGF-1)、インスリン様増殖因子2(IGF-2)、インターロイキン1(IL-1)、インターロイキン2(IL-2)、インターロイキン3(IL-3)、インターロイキン4(IL-4)、インターロイキン 5(IL-5)、インターロイキン6(IL-6)、インターロイキン7(IL-7)、インターロイキン8(IL-8)、インターロイキン9(IL-9)、インターロイキン10(IL-10)、インターロイキン11(IL-11)、インターロイキン12(IL-12)、インターロイキン13(IL-13)、インターロイキン15(IL-15)、インターロイキン17(IL-17)、インターロイキン19(IL-19)、マクロファージコロニー刺激因子(M-CS
F)、単球走化タンパク質1(MCP-1)、マクロファージ炎症性タンパク質3a(MIP-3a)、マクロファージ炎症タンパク質3b(MIP-3b)、神経成長因子(NGF)、神経栄養因子3(NT-3)、神経栄養因子4(NT-4)、副甲状腺ホルモン、血小板由来成長因子AA(PDGF-AA)、血小板由来成長因子AB(PDGF-AB)、血小板由来成長因子BB(PDGF-BB)、血小板由来成長因子CC(PDGF-CC)、血小板由来成長因子DD(PDGF-DD)、RANTES、幹細胞因子(SCF)、ストローマ細胞由来成長因子1(SDF-1)、形質転換成長因子α(TGF-a)、形質転換成長因子β(TGF-b)、腫瘍壊死因子α(TNF-a)、Wnt1、Wnt2、Wnt2b/13、Wnt3、Wnt3a、Wnt4、Wnt5a、Wnt5b、Wnt6、Wnt7a、Wnt7b、Wnt7c、Wnt8、Wnt8a、Wnt8b、Wnt8c、Wnt10a、Wnt10b、Wnt11、Wnt14、Wnt15又はWnt16、ソニック・ヘッジホッグ、デザートヘッジホッグ、及びインディアンヘッジホッグを含むが、これらに限定されない。
【0126】
いくつかの実施形態では、上記コード配列は、キメラ抗原受容体(CAR)又は操作されたT細胞受容体(TCR)のような操作された受容体をコードする。
【0127】
本明細書で使用される場合、「キメラ抗原受容体」又は「CAR」は、1つ又は複数の抗原をT細胞などの細胞に特異的に移植する操作された受容体を意味する。CARは「人工T細胞受容体」、「キメラT細胞受容体」や「キメラ免疫受容体」とも呼ばれる。いくつかの実施形態では、CARは、腫瘍抗原に特異的な抗体の細胞外可変ドメインと、T細胞又は他の受容体の細胞内シグナル伝達ドメイン、例えば1つ又は複数の共刺激ドメインと、を含む。「CAR-T」とはCARを発現するT細胞のことである。
【0128】
いくつかの特定実施形態では、上記コード配列は、キメラ抗原受容体(CAR)をコードする。多くのキメラ抗原受容体は当業者に知られており、本願に適用することができる。また、例えば抗体分子の抗原結合フラグメントや抗体可変ドメインを利用することにより、いかなる細胞表面マーカーに対しても特異性を有するCARを構築することができる。本明細書では、CARを生成する任意の方法を使用することができる。例えば、US6,410,319、US7,446、191、US7,514,537、US9765342B2、WO 2002/077029、WO2015/142675、US2010/065818、US 2010/025177、US 2007/059298及びBerger C. et al., J. Clinical Investigation 118: 1 294-308 (2008)を参照し、これらは参照によって本明細書に組み込まれる。
【0129】
本明細書で使用される場合、「T細胞受容体」又は「TCR」は、MHC分子に結合した特定の抗原ペプチドに結合する細胞外抗原結合ドメインを含む内因性又は組換えT細胞受容体を意味する。いくつかの実施形態では、TCRは、TCRαポリペプチド鎖及びTCRβポリペプチド鎖を含む。いくつかの実施形態では、TCRは腫瘍抗原に特異的に結合する。「TCR-T」とは、組換えTCRを発現するT細胞を指す。「組換え体」という用語は、(1)天然に存在する環境から除去された、(2)自然界にその遺伝子が発見されたポリヌクレオチドの全部又は一部と関連しない、(3)自然界に関連しないポリヌクレオチドに作動可能に連結されている、又は(4)自然に存在しない、遺伝子又はタンパク質などの生体分子を指す。「組換え体」という用語は、クローニングされたDNA単離体、化学的に合成されたポリヌクレオチド類似体、又は異種系統によって生合成されたポリヌクレオチド類似体、及びそのような核酸によってコードされるタンパク質及び/又はmRNAを指すために使用され得る。
【0130】
いくつかの特定実施形態では、上記コード配列は、操作されたT細胞受容体(TCR)をコードする。いくつかの実施形態では、操作されたに改変されたTCRは、腫瘍抗原に対して特異的である。 いくつかの実施形態では、腫瘍抗原は、腫瘍細胞の細胞内タンパ
ク質に由来する。腫瘍抗原(腫瘍関連抗原を含む)に特異的な多くのTCRが記載されており、例えば、NY-ESO-1癌-精巣抗原、p53腫瘍阻害抗原、メラノーマにおける腫瘍抗原のTCR(例えば、MARTI、gp100)、白血病(例えば、WT1、マイナー組織適合抗原)、及び乳癌(例えば、HER2、NY-BR1)を含む。当分野で知られている任意のTCRを本願に使用することができる。いくつかの実施形態では、TCRは腫瘍抗原に対して増強された親和性を有する。例示的なTCR及びTCRを製造する方法は、例えばUS5830755及びKessels et al.Immunotherapy through TCR gene transfer. Nat. Immunol. 2, 957-961 (2001)に記載されている。
【0131】
いくつかの実施形態では、上記コード配列は選択マーカーをコードする。「選択マーカー」は、検出可能な表現型を生成するように発現し、標的核酸(例えば、ゲノムDNA)に挿入された選択マーカーをコードする異種核酸を有する宿主細胞の検出を容易にする遺伝子である。いくつかの実施形態では、選択マーカーは、ピューロマイシンなどの抗生物質に対する耐性を与える。選択マーカーの他の非限定的な例としては、薬剤耐性遺伝子及び栄養マーカーが含まれる。例えば、選択マーカーは、アンピシリン、カナマイシン、エリスロマイシン、クロラムフェニコール、ゲンタマイシン、カスガマイシン、リファンピシン、スペクチノマイシン、D-サイクロセリン、ナリジキシン酸、ストレプトマイシン、テトラサイクリンからなる群から選択される抗生物質耐性を付与する遺伝子であってもよい。選択マーカーの他の非限定的な例としては、アデノシルデアミナーゼ、アミノグリコシドホスホトランスフェラーゼ、ジヒドロ葉酸還元酵素、ハイグロマイシン-B-ホスホトランスフェラーゼ、チミジンキナーゼ、及びキサンチン-グアニンホスホリボシルトランスフェラーゼが含まれる。哺乳類細胞に適した選択マーカーの例としては、DHFR、チミジンキナーゼ、メタロチオネイン-I及び-II、好ましくは霊長類メタロチオネイン遺伝子、アデノシンデアミナーゼ、オルニチンデカルボキシラーゼなどが含まれる。いくつかの特定実施形態では、上記異種核酸は、ピューロマイシン耐性遺伝子のコード配列を含む。
【0132】
いくつかの実施形態では、上記コード配列はレポーター遺伝子である。「レポーター遺伝子」は、検出可能な産物をコードする遺伝子であるため、レポーター遺伝子産物の検出は、標的核酸の機能の評価に利用することができる。レポーター遺伝子は、任意の適切な標的核酸(例えば、プロモータ、標的遺伝子、選択マーカー、及び/又は転移因子の末端反復)と融合して、標的核酸が所与の条件下で発現又は変化した(例えば、トランスポザーゼによって切断された)か否かを検出することを可能にすることができる。レポーター遺伝子の非限定的な例としては、3-ガラクトシダーゼ、3-グルクロニダーゼ、グルタチオン-S-トランスフェラーゼ(GST)、ワサビペルオキシダーゼ(HRP)、ルシフェラーゼ、クロラムフェニコールアセチルトランスフェラーゼ(CAT)、分泌型アルカリホスファターゼ(SEAP)、緑色蛍光タンパク質(GFP、例えばeGFP)、赤色蛍光タンパク質(RFP)、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)、カテコール2,3-オキシゲナーゼ(xylE)、
及びブルー蛍光タンパク質(BFP)を含む自家蛍光タンパク質が含まれる。いくつかの実施形態では、上記異種核酸は、増強型緑色蛍光タンパク質(eGFP)をコードするコード配列を含む。 いくつかの実施形態では、上記コード配列は、複数の生物産物をコードするか、又は、融合タンパク質をコードすることができる。いくつかの実施形態では、本願の異種核酸は、ピューロマイシン耐性増強型緑色蛍光タンパク質(eGFP)融合タンパク質をコードするコード配列を含む。
【0133】
いくつかの実施形態では、上記コード配列はトランスポザーゼをコードする。
【0134】
いくつかの実施形態では、上記コード配列は、ゲノム編集に有用なポリペプチドをコードする。ゲノム編集は、ゲノム中の所望の位置に特定の二本鎖切断(DSB)を生成し、
細胞の内在性機構を利用して、相同指向性修復(HDR)(例えば相同組換え)又は非相同末端結合(NHEJ)によって誘導された切断を修復するヌクレアーゼを使用することによって達成され得る。CRISPR関連タンパク質(Cas、例えば、Cas9)ヌクレアーゼ、ジンクフィンガーヌクレアーゼ(ZFN、例えば、FokI)、転写活性化因子様エフェクターヌクレアーゼ(TALEN、例えば、TALE)、ホーミングエンドヌクレアーゼ、及びこれらの変異体を含むがこれに限定されない、任意の適切なヌクレアーゼを細胞に導入して、標的DNA配列のゲノム編集を誘導することができる(Shukla et al. (2009) Nature 459: 437- 441; Townsend et al (2009) Nature 459: 442-445)。いくつかの実施形態では、上記コード配列はCas9ポリペプチドをコードする。
【0135】
いくつかの実施形態では、上記コード配列はRNA分子をコードする。RNA分子は、メッセンジャーRNA(mRNA)のようなタンパク質コードRNA、又はトランスポーターRNA(tRNA)及びリボソームRNA(rRNA)、微小RNA(miRNA)、低分子干渉RNA(siRNA)のようなスモールRNA、ショートヘアピンRNA(shRNA)又はpiwi相互作用RNA(piRNA)、及び長鎖ノンコーディングRNA(lincRNA)を含むがこれらに限定されない非タンパク質コードRNAであってもよい。微小RNAやsiRNAなど小RNAはRNA干渉(RNAi)の過程で重要である。RNAiは、転写後の分解や翻訳の阻害により小RNAを干渉し、本来正常に発現している標的遺伝子の発現を阻害する遺伝子調節プロセスである。RNAi技術の詳細な説明については、例えば、U.S. Pat. No. 6,326,527;6,452,067;6,573,099;6,753,139;及び6,777,588を参照する。いくつかの実施形態では、上記コード配列は制御性RN
Aをコードする。いくつかの実施形態では、上記コード配列はRNAi分子をコードする。いくつかの実施形態では、上記コード配列はshRNAをコードする。いくつかの実施形態では、上記コード配列はmiRNAをコードする。
【0136】
いくつかの実施形態では、上記コード配列は、ゲノム編集に有用なRNA分子をコードすることができる。このようなRNA分子の例としては、CRISPR RNA(crRNA)、トランス活性化crRNA(tracrRNA)、ガイドRNA(gRNA)、及びシングルガイドRNA(sgRNA)が含まれるが、これらに限定されない。
【0137】
いくつかの実施形態では、上記異種核酸は、コード配列の発現を調節する1つ又は複数の調節要素をさらに含む。調節要素は、本明細書に記載された方法及び構築体と共に使用されることが想定される。「調節要素」という用語は、プロモータ、エンハンサー、内部リボソーム進入部位(IRES)、及び他の発現制御要素(例えば、ポリアデニル化(poly-A)シグナル及びpoly-U配列のような転写終了シグナル)を含むことが意図されている。このような調節要素は、例えば、Goeddel, Gene Expression Technology:
Methods in Enzymology 185, Academic Press, San Diego, Calif. (1990)に記載される。
【0138】
プロモータはコード配列の発現パターンを導く重要な制御要素である。いくつかの実施形態では、上記異種核酸は、コード配列に作動可能に連結されたプロモータを含む。本願では、任意の適切なプロモータを使用することができる。いくつかの実施形態では、プロモータは内在性プロモータである。いくつかの実施形態では、プロモータは異種プロモータである。哺乳類細胞における遺伝子発現のための複数のプロモータが探索されており、当分野で知られている任意のプロモータは本願に使用することができる。プロモータは、構成性プロモータ又は誘導性プロモータのような調節性プロモータに大別できる。いくつかの実施形態では、上記異種核酸は、構成性プロモータに動作可能に連結されたコード配列(例えば、トランスポザーゼコード配列)を含む。いくつかの実施形態では、上記異種核酸は、誘導性プロモータに動作可能に連結されたコード配列(例えば、トランスポザーゼコード配列)を含む。
【0139】
構成性プロモータは、異種核酸を宿主細胞において構成的に発現させることを可能にする。本明細書で考慮される例示的な構成性プロモータは、サイトメガロウイルス(CMV)プロモータ、ヒト伸長因子-1α(hEF1α)、ユビキチンCプロモータ(UbiC)、ホスホグリセリンキナーゼプロモータ(PGK)、サルウイルス40初期プロモータ(SV40)、及びCMV初期エンハンサー(CAGG)に結合したニワトリβアクチンプロモータを含むが、これらに限定されない。このような構成性プロモータはトランスジーン発現(transgene expression)を駆動する面での効率が多くの研究で広範に比較されている。例えば、Michael C.Miloneらは、ヒト初代T細胞におけるキメラ抗原受容体の発現を駆動するCMV、hEF1α、UbiC、PGKの効率を比較し、hEF1αプロモータが最高レベルのトランスジェニック発現を誘導するだけでなく、CD4及びCD8ヒトT細胞においても理想的に維持されていると結論づけている(Molecular Therapy, 17(8): 1453-1464 (2009))。いくつかの実施形態では、上記異種核酸中のプロモータはCAGプロモータである。
図3に、構成性プロモータによって駆動されるトランスポザーゼ又は選択マーカー/レポーター遺伝子をコードする異種核酸配列を含む例示的な操作された転移因子が示されている。ここで、プロモータはCMVプロモータ又はPGKプロモータである。
【0140】
いくつかの用途では、いくつかの遺伝子治療において、強発現プロモータ(例えば、CMVプロモータ)の代わりに、コード配列の中程度又は弱発現パターンを有するプロモータを使用することが、過剰生産阻害(OPI)と総称されるトランスポザーゼに基づく自動調節イベントを回避又は低減するために必要であることが想定される。
【0141】
誘導性プロモータのような調節性プロモータは、特定の発達段階、特定の組織タイプ又は亜細胞位置などの場合に異種核酸の発現を可能にする。当該分野では、誘導性、組織特異性、細胞タイプ特異性、細胞周期特異性を含む様々なタイプの調節性プロモータが知られており、例えSambrook and Russell, 2001を参照する。誘導性プロモータは調節性プロモータのカテゴリに入る。誘導性プロモータは、物理的条件、操作された哺乳類細胞の微小環境、又は操作された哺乳類細胞の生理学的状態、インデューサー(すなわち、誘導剤)、又はそれらの組み合わせのような1つ又は複数の条件によって誘導され得る。
【0142】
いくつかの実施形態では、プロモータを使用してコード配列を発現させることは、細胞タイプ、細胞系譜(cell lineages)、又は組織のサブセットにおいてのみ、又は特定の
発達段階においてのみ望ましい。その例としては、B29プロモータ(B細胞発現)、低転写因子(CBFa2)プロモータ(幹細胞発現)、CD14プロモータ(単球発現)、CD43プロモータ(白血球と血小板発現)、CD45プロモータ(造血細胞発現)、CD68プロモータ(マクロファージ発現)、内皮糖タンパク質プロモータ(内皮細胞発現)、fms関連チロシンキナーゼ1(FLT1)プロモータ(内皮細胞発現)、インテグリン、α2b(ITGA2B)プロモータ(巨核球発現)、細胞内接着分子2(ICAM-2)プロモータ(内皮細胞発現)、インターフェロンβ(IFN-β)プロモータ(造血細胞発現)、β-グロビンLCR(赤血球発現)、グロビンプロモータ(赤血球発現)、β-グロビンプロモータ(赤血球発現)、α-グロビンHS40エンハンサー(赤血球発現)、アンキリン-1プロモータ(赤血球発現)、ビスコットアルドリッチ症候群タンパク質(WASP)プロモータ(ヘモグロビントポロジー細胞発現)が含まれるが、これらに限定されない。
【0143】
本明細書で説明される方法の態様はターミネータ配列を利用することができる。ターミネータ配列は、転写中に遺伝子又はオペロンの末端を標識する核酸配列のセグメントを含む。この配列は、転写複合体からmRNAを放出するプロセスをトリガするシグナルを新たに合成されたmRNAに提供することによって転写終止を媒介する。これらのプロセス
は、mRNA二次構造と複合体との直接的な相互作用及び/又は募集された終止因子の間接的な活動を含む。転写複合体の放出は、RNAポリメラーゼ及び関連する転写機構を解放し、新しいmRNAの転写を開始する。ターミネータ配列は、当該分野で知られているものを含む。本願のいくつかの実施形態では、ターミネータ配列はポリアデニル化(poly-A)シグナルである。
【0144】
いくつかの実施形態では、上記異種核酸は、少なくとも1つの制限エンドヌクレアーゼ認識部位、例えば制限部位を含み、外来核酸を挿入する部位として使用される。当該分野では、HindIII、PstI、SalI、AccI、HincII、XbaI、BamHI、SmaI、XmaI、KpnI、SacI、EcoRIなどを含むがこれに限定されない様々な制限部位が知られている。いくつかの実施形態では、制限部位は、マルチクローニング部位(MCS、マルチリンカーとも呼ばれる)、すなわち、複数の異なる制限エンドヌクレアーゼ(例えば、上記のもの)によって識別される密に配列されたシリーズ又は部位のアレイである。他の実施形態では、本願の異種核酸は、Cre、Flp及びPhiC31組換え酵素によってそれぞれ認識されるLoxP、FRT又はAttB/AttP部位のような組換え酵素認識部位を含む。
【0145】
いくつかの実施形態では、上記異種核酸はタグ配列を含む。タグ配列は、分子を同定するために、又は例えばハイブリダイゼーションによって分子を捕捉するための部位を提供するために使用され得る。
【0146】
いくつかの実施形態では、上記異種核酸はバーコード配列を含む。「バーコード配列」とは、この核酸バーコードに結合された1つ又は複数の第1分子と1つ又は複数の第2分子とを識別及び/又は区別するのに有用な配列を有する核酸を意味する。核酸バーコード配列は、通常、非常に短く、例えば、長さが約5~20塩基であり、1つ又は複数の目的の標的分子又はその増幅産物と結合することができる。核酸バーコード配列は、一本鎖又は二本鎖であってもよい。
【0147】
いくつかの実施形態では、上記異種核酸は一意の分子識別子(UMI)を含む。本明細書で使用される場合、「一意の分子識別子」又は「UMI」という用語は、UMIに結合される1つ又は複数の第1分子と1つ又は複数の第2分子とを識別及び/又は区別するために使用され得る核酸配列を意味する。UMIは一般的に短く、例えば、長さが約5~20塩基であり、1つ又は複数の目的の標的分子又はその増幅産物と結合することができる。UMIは、1本鎖又は2本鎖であってもよい。いくつかの実施形態では、核酸バーコード配列及びUMIの両方が、核酸標的分子又はその増幅産物に組み込まれる。通常、UMIは集団又はグループ内の類似タイプの分子を区別するために使用され、核酸バーコード配列は分子の集団又はグループを区別するために使用される。UMIと核酸バーコード配列とを併用するいくつかの実施形態では、UMIの配列長は核酸バーコード配列よりも短い。いくつかの実施形態では、UMIと核酸バーコード配列とを併用する場合、UMIは核酸バーコード配列に組み込まれる前に、標的核酸又はその増幅産物に組み込まれる。いくつかの実施形態では、UMIと核酸バーコード配列とを併用する場合、UMIは標的核酸又はその増幅産物に組み込まれた後、核酸バーコード配列はUMI又はその増幅産物に組み込まれる。
【0148】
転移活性
いくつかの実施形態では、本願の転移因子は、インビトロ又は細胞内で転移活性を示す。
【0149】
転移活性は、当業者に知られている多くの技術によって検出されてもよい。ベクターからの転移因子の切除、細胞のゲノム又は染色体外DNAへの転移因子の組み込み、及び逆
反復配列へのトランスポザーゼの結合能力を測定するための例は、例えば、Ivies et al.
Cell, 91, 501-510 (1997), WO 98/40510 (Hackett et al.), WO 99/25817 (Hackett et
al.), and WO00/68399 (Mclvor et al.)を参照する。
【0150】
いくつかの実施形態では、転移測定は、転移因子システムにおける2つの成分のトランス相補性に基づいており、1つの成分は、側部連結末端反復の選択マーカー/レポーター遺伝子(ドナー)を含み、もう1つの成分は、トランスポザーゼを発現し、転移(ヘルパー)を実行するために末端反復を識別、結合する。例えば、
図3は、活性転移因子をスクリーニングするための例示的な二元構築体を示している。上の構築体は、5’から3’へ、サイトメガロウイルス(CMV)プロモータ、トランスポザーゼ(Tn)遺伝子、及びpoly(A)シグナルを含むトランスポザーゼ発現補助構築体である。下の構築体はドナー構築体であり、5’から3’へ、ホスホグリセリン酸キナーゼ(PGK)プロモータ、5’標的部位反復(TSD)配列、5’末端反復(5’TR)配列、ピューロマイシン及び増強型GFP融合(Puro-eGFP)をコードする配列、3’末端反復(3’TR)配列、3’標的部位反復(TSD)配列、及びポリ(A)シグナルを含む。転移測定において、培養哺乳類細胞(例えば、ヒト293T、HeLa又はHct116細胞)へのドナープラスミドと補助プラスミド又は対照プラスミドとの共トランスフェクションでは、染色体の組み込み及びピューロマイシン耐性遺伝子の発現に起因してピューロマイシン耐性を発現する細胞クローンの数を遺伝子導入効率の指標とし、メチレンブルー染色によって表す。K562や初代T細胞などの懸濁細胞については、電気穿孔後のGFPレポーター遺伝子陽性細胞から転移活性を評価することができる。
図4A~6Bは転移測定に基づくメチレンブルー染色結果のコロニーカウントを示し、対照と比較して評価したTEの転移測定効率を示す。このような測定における転移効率は「導入効率」とも呼ばれる。
【0151】
いくつかの実施形態では、上記操作された転移因子の導入効率は、少なくとも約0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%又はそれ以上のいずれかである。いくつかの実施形態では、上記操作された転移因子の導入効率は、ヒト293T、HeLa、Hct116、K562、又は初代T細胞のようなヒト細胞において測定される。
【0152】
いくつかの実施形態では、上記操作された転移因子の転移活性は、piggyBac(PB)トランスポゾン、Sleeping Beauty(SB)トランスポゾン、及び/又はTcBuster(TB)トランスポゾンの転移活性よりも高い。いくつかの実施形態では、上記操作された転移因子の転移活性は、レポーター遺伝子に基づく転移測定(例えば、実施例2で説明したように)によって哺乳類細胞において決定されるように、piggyBac(PB)トランスポゾンの転移活性よりも、例えば、約10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、2x、3x、5x、10x又はそれ以上のいずれか高い。いくつかの実施形態では、上記操作された転移因子の転移活性は、レポーター遺伝子に基づく転移測定(例えば、実施例2で説明したように、)によって哺乳類細胞において決定されるように、Sleeping Beauty(SB)トランスポゾンの転移活性よりも、例えば、約10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、2x、3x、5x、10x又はそれ以上のいずれか高い。いくつかの実施形態では、上記操作された転移因子の転移活性は、レポーター遺伝子に基づく転移測定(例えば、実施形態2で説明したように)によって哺乳類細胞において決定されるように、TcBuster(TB)トランスポゾンの転移活性よりも、例えば、少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、2x、3x、5x、10x、又はそれ以上のいずれか高い。いくつかの実施形態では、上記操作された転移因子の転移活性は、PBトランスポゾン及びSBトランスポゾンの転移活性よりも高
い。いくつかの実施形態では、上記操作された転移因子の転移活性は、PBトランスポゾン及びTBトランスポゾンの転移活性よりも高い。いくつかの実施形態では、上記操作された転移因子の転移活性は、TBトランスポゾン及びSBトランスポゾンの転移活性よりも高い。いくつかの実施形態では、上記操作された転移因子の転移活性は、PBトランスポゾン、SBトランスポゾン、及びTBトランスポゾンの転移活性よりも高い。
【0153】
いくつかの実施形態では、上記この操作された転移因子の転移活性は、哺乳類細胞において評価される。いくつかの実施形態では、上記哺乳類細胞はHeLa細胞である。いくつかの実施形態では、上記哺乳類細胞はヒト胚腎293T(293T)である。いくつかの実施形態では、上記哺乳類細胞はK562細胞である。いくつかの実施形態では、上記哺乳類細胞はHct116細胞である。いくつかの実施形態では、上記哺乳類細胞はヒトT細胞、例えばドナー由来の初代T細胞である。いくつかの実施形態では、上記操作された転移因子は、293T細胞においてHeLa細胞よりも高い転移活性を有し、例えば293T細胞における転移活性は、HeLa細胞における転移活性よりも、少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、2x、3x、5x、10x又はそれ以上のいずれか高い。
【0154】
細胞
本明細書に記載の操作された転移因子は、様々な細胞において転移活性を有し、任意の適切な細胞の標的核酸に異種核酸を挿入するために使用され得る。
【0155】
いくつかの実施形態では、上記細胞は単離された細胞である。いくつかの実施形態では、上記細胞は細胞培養物中にある。いくつかの実施形態では、上記細胞はエクスビボのものである。いくつかの実施形態では、上記細胞は生きた生物から得られ、細胞培養物中に維持される。いくつかの実施形態では、上記細胞は単細胞生物である。細胞は細胞の由来、由来組織、形態、機能、組織学的マーカー、発現プロファイルなどに基づいて異なるタイプに分類することができる。
【0156】
いくつかの実施形態では、上記細胞は原核細胞である。いくつかの実施形態では、上記細胞は細菌細胞であるか、又は細菌細胞由来である。いくつかの実施形態では、上記細胞は古細菌細胞であるか、又は古細菌細胞由来である。いくつかの実施形態では、上記細胞は真核細胞である。いくつかの実施形態では、上記細胞は植物細胞であるか、又は植物細胞由来である。いくつかの実施形態では、上記細胞は真菌細胞であるか、又は真菌細胞由来である。いくつかの実施形態では、上記細胞は動物細胞であるか、又は動物細胞由来である。いくつかの実施形態では、銭細胞は無脊椎動物細胞であるか、無脊椎動物細胞由来である。いくつかの実施形態では、上記細胞は脊椎動物細胞であるか、又は脊椎動物細胞由来である。いくつかの実施形態では、上記細胞は哺乳類細胞であるか、又は哺乳類細胞由来である。いくつかの実施形態では、上記細胞はヒト細胞である。いくつかの実施形態では、上記細胞はゼブラフィッシュ(D. rerio)細胞である。いくつかの実施形態では、上記細胞はげっ歯類細胞である。いくつかの実施形態では、上記細胞は合成手段により製造され、人工細胞と呼ばれることもある。いくつかの実施形態では、上記細胞は、5’TR、3’TR及び/又はトランスポザーゼ由来の動物種に関連する。いくつかの実施形態では、上記細胞は、5’TR、3’TR及び/又はトランスポザーゼ由来の動物種とは無関係である。
【0157】
いくつかの実施形態では、上記細胞は、細菌、酵母細胞、真菌細胞、藻類細胞、植物細胞又は動物細胞である。いくつかの実施形態では、上記細胞は、組織生検のような天然由来から単離された細胞である。いくつかの実施形態では、上記細胞はインビトロで培養された細胞株から単離された細胞である。いくつかの実施形態では、上記細胞は遺伝子操作された細胞である。いくつかの実施形態では、上記細胞は、核内で増殖、分化、又はその
両方を経験する種子細胞である。
【0158】
いくつかの実施形態では、上記細胞は、ウシ、ヒツジ、ヤギ、ウマ、ブタ、シカ、ニワトリ、アヒル、ガチョウ、ウサギ及び魚から選択される生物由来の動物細胞である。
【0159】
いくつかの実施形態では、上記細胞は、トウモロコシ、小麦、大麦、オーツ麦、イネ、大豆、アブラヤシ、ベニバナ、ゴマ、タバコ、亜麻、綿、ヒマワリ、トウジンビエ、アワ、モロコシ、アブラナ、大麻、野菜作物、飼料作物、経済作物、木本作物及びバイオマス作物から選択される生物由来の植物細胞である。
【0160】
いくつかの実施形態では、上記細胞は、ヒト、飼養動物及び農場動物、動物園、運動場、又は犬(C.familiaris)、ウマ、ネコ、ウシなどのペット由来の細胞を含む哺乳類細胞である。いくつかの実施形態では、上記細胞はヒト細胞である。いくつかの実施形態では、ヒト細胞はヒト胚腎293T(HEK293T又は293T)細胞又はHeLa細胞である。
【0161】
いくつかの実施形態では、上記細胞は初代細胞に由来する。例えば、初代細胞の培養物を0回、1回、2回、4回、5回、10回、15回以上継代することができる。いくつかの実施形態では、いずれかの公知の方法によって個体から初代細胞が得られる。例えば、血液成分置換、白血球分離術、密度勾配分離などにより白血球を採取することができる。皮膚、筋、骨髄、脾臓、肝臓、膵臓、肺、腸、胃などの組織由来の細胞を生検により採取することができる。適切な溶液は、採取された細胞を分散又は懸濁させるために使用することができる。このような溶液は、一般的に平衡塩溶液(例えば、生理食塩水、リン酸緩衝塩水(PBS)、ハンクス平衡塩溶液など)であり、許容可能な低濃度緩衝液とともに、子ウシ血清又は他の天然に存在する因子を容易に補充することができる。緩衝液は、HEPES、リン酸緩衝液、乳酸緩衝液などを含んでもよい。細胞はすぐに使用することも、(例えば、冷凍することで)保存することもできる。凍結細胞は解凍可能であり、再利用可能である。細胞は、DMSO、血清、培地系緩衝液(例えば、10%DMSO、50%血清、40%緩衝培地)、及び/又は凍結温度で細胞を保存するために使用される他のこのような一般的な溶液で凍結され得る。
【0162】
いくつかの実施形態では、上記細胞は細胞株に由来する。当該分野では、種々の細胞株が知られている。細胞株の例としては、293T、MF7、K562、HeLa及びこれらのトランスジェニック品種が含まれるが、これらに限定されない。細胞株は、当業者に知られている様々なソースから入手することができる(例えば、米国典型培養物寄託センター(ATCC)(Manassus,Va.)を参照)。
【0163】
いくつかの実施形態では、上記細胞は接着細胞を含む。いくつかの実施形態では、上記細胞は分化した接着細胞を含む。いくつかの実施形態では、上記細胞は未分化接着細胞を含む。いくつかの実施形態では、上記細胞は多能性幹細胞を含む。いくつかの実施形態では、上記細胞は非接着細胞を含む。
【0164】
いくつかの実施形態では、上記細胞は、上皮組織、筋組織、神経組織、結合組織、又はそれらの任意の組み合わせに由来する。いくつかの実施形態では、上記細胞は、肝臓、胃腸管、膵臓、腎臓、肺、気管、血管、骨格筋、心臓、皮膚、平滑筋、結合組織、角膜、泌尿器生殖系、乳腺、生殖、内皮、上皮、線維芽細胞、神経、シュワン細胞(Schwann)、脂肪、骨、骨髄、軟骨、周皮細胞(pericyte)、中皮、内分泌、基質、リンパ、血液、内胚葉、外胚葉、中胚葉及びそれらの組み合わせから選択される組織に由来する。いくつかの実施形態では、上記細胞は、結合組織(例えば、疎性結合組織、密性結合組織、弾性組織、網状結合組織及び脂肪組織)、筋組織(例えば、骨格筋、平滑筋及び
心筋)、泌尿器生殖組織、胃腸組織、肺組織、骨組織、神経組織及び上皮組織(例えば、単層上皮及び複層上皮)、内胚葉由来の組織、中胚葉由来の組織及び外胚葉由来の組織、又はこれらの任意の組み合わせから選択される組織に由来する。いくつかの実施形態では、上記細胞は腫瘍由来である。
【0165】
いくつかの実施形態では、上記細胞は、肝臓細胞、胃腸細胞、膵臓細胞、腎臓細胞、肺細胞、気管細胞、血管細胞、骨格筋細胞、心筋細胞、皮膚細胞、平滑筋細胞、結合組織細胞、角膜細胞、泌尿器生殖細胞、乳腺細胞、生殖細胞、内皮細胞、上皮細胞、線維芽細胞、神経細胞、シュワン細胞、脂肪細胞、骨細胞、骨髄細胞、軟骨細胞、周皮細胞、中皮細胞、内分泌組織由来の細胞、間質細胞、幹細胞、前駆細胞、リンパ球、血球、内胚葉由来の細胞、外胚葉由来の細胞、中胚葉由来の細胞、未分化細胞(例えば幹細胞や前駆細胞)、腫瘍細胞、iPS細胞及びそれらの組み合わせから選択される。
【0166】
いくつかの実施形態では、上記細胞は、T細胞、B細胞、ナチュラルキラー(NK)細胞、樹状細胞(DC)及びマクロファージなどの免疫細胞である。いくつかの実施形態では、上記細胞は、患者又はドナーから得られたヒトT細胞である。いくつかの実施形態では、上記細胞は、細胞傷害性T細胞、ヘルパーT細胞、ナチュラルキラー(NK)T細胞、iNK-T細胞、NK-T様細胞、αβT細胞、αγδT細胞、腫瘍浸潤性T細胞、及び樹状細胞(DC)活性化T細胞から選択される免疫細胞である。いくつかの実施形態では、上記細胞は、本願の操作された転移因子又は遺伝子導入システムを使用して修飾された免疫細胞である。いくつかの実施形態では、修飾された免疫細胞はCAR-T細胞である。いくつかの実施形態では、修飾された免疫細胞はTCR-T細胞である。
【0167】
いくつかの実施形態では、本願の細胞は哺乳類細胞である。 いくつかの実施形態では、前記哺乳類細胞は、ヒトHKT293細胞又はHeLa細胞である。さらにいくつかの実施形態では、293T細胞における前記転移因子の転移活性は、HeLa細胞における転移活性よりも高い。いくつかの実施形態では、前記哺乳類細胞は、免疫細胞、肝臓細胞、腫瘍細胞、幹細胞、受精卵、筋細胞及び皮膚細胞から選択される。
【0168】
いくつかの実施形態では、上記細胞は幹細胞又は前駆細胞である。細胞は、幹細胞(例えば、成体幹細胞、胚性幹細胞、iPS細胞)及び前駆細胞(例えば、心臓前駆細胞、神経前駆細胞など)を含んでもよい。細胞は、齧歯動物幹細胞、齧歯動物前駆細胞、ヒト幹細胞、ヒト前駆細胞など、哺乳類幹細胞及び前駆細胞を含んでもよい。
【0169】
いくつかの実施形態では、上記細胞は罹患細胞である。罹患細胞は、代謝、遺伝子発現及び/又は形態的特徴が変化している場合がある。罹患細胞は、癌細胞、糖尿病細胞及びアポトーシス細胞であってもよい。罹患細胞は、罹患対象由来の細胞であってもよい。
【0170】
いくつかの実施形態では、本願の細胞は、遺伝子治療に有用な標的細胞タイプに属する。標的細胞タイプの例としては、造血幹細胞、造血前駆細胞、骨髄前駆細胞、リンパ球前駆細胞、血小板産生前駆細胞、赤血球前駆細胞、顆粒球産生前駆細胞、単球前駆細胞、巨核球、巨核芽球、巨核球、血液凝固細胞/血小板、前赤芽球、好塩基性赤芽球、多染性赤芽球、正染性赤芽球、多染性赤血球、赤血球(赤血球又はRBC)、好塩基性前骨髄球、好塩基性骨髄細胞、好塩基性後骨髄細胞、好塩基球、中性前骨髄細胞、中性後骨髄細胞、中性後骨髄細胞、好中球、好酸性前骨髄細胞、好酸性骨髄細胞、マクロファージ、樹状細胞、リンパ芽球、幼若リンパ球、ナチュラルキラー(NK)細胞、小リンパ球、Tリンパ球、Bリンパ球、形質細胞、及びリンパ樹状細胞が含まれる。好ましい実施形態では、標的細胞タイプは、1つ又は複数の赤血球、例えば、前赤芽球、好塩基性赤血球、多染色赤血球、正染色赤血球、多染色赤血球、及び赤血球(RBC)である。好ましい実施形態では、標的細胞タイプは、1つ又は複数の赤血球、例えば、前赤芽球、好塩基性赤芽球、多
染性赤芽球、正染色赤芽球、多染性赤血球、及び赤血球(RBC)である。
【0171】
ベクター
いくつかの実施形態では、上記操作された転移因子及び/又はトランスポザーゼをコードする核酸配列は、1つ又は複数のベクターに存在する。
【0172】
本願では、様々な適切なベクターを使用することができる。いくつかの実施形態では、ベクターは、プラスミドベクター、コスミドベクター、人工染色体(例えば、細菌人工染色体、酵母人工染色体又は哺乳類人工染色体)、ファージ、バキュロウイルス、レトロウイルス、レンチウイルス、アデノウイルス、牛痘ウイルス、セムリキフォレストウイルス、アデノ随伴ウイルス(AAV)ベクターなどのウイルスベクターであり、これらは全て公知であり、市販品として購入することができる。通常、適切なベクターは、少なくとも1つの生物において機能を有する複製開始点、プロモータ配列、都合のよい制限エンドヌクレアーゼ部位、及び1つ又は複数の選択マーカーを含む。
【0173】
いくつかの実施形態では、上記ベクターはプラスミドである。いくつかの実施形態では、プラスミドは、貯蔵又は増幅のために細菌に形質転換されてもよく、哺乳類細胞にトランスフェクションされてもよい。
【0174】
このベクターを哺乳類細胞に導入する方法は、当該分野において知られている。このベクターは、物理的、化学的及び/又は生物学的方法によって宿主細胞に導入することができる。本願では、様々なベクタータイプ及びベクター送達方法を単独で又は組み合わせて使用することができることが予想される。
【0175】
ベクターを宿主細胞に導入するための物理的方法は、リン酸カルシウム沈殿、脂質トランスフェクション、粒子衝撃、マイクロインジェクション、電気穿孔などを含む。ベクター及び/又は外来核酸を含む細胞を製造する方法は当該分野に公知である。例えば、Sambrook et al. (2001) Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, New Yorkを参照する。いくつかの実施形態では、ベクターは、電気穿孔によって細胞内に導入される。
【0176】
異種核酸を宿主細胞に導入するための生物学的方法は、DNA及びRNAベクターを使用することを含む。ウイルスベクターは、哺乳類(例えばヒトの細胞)に遺伝子を挿入するために最も広く使用されている方法となっている。
【0177】
ベクターを宿主細胞に導入するための化学的方法は、高分子複合体、ナノカプセル、マイクロスフェア、ビーズ、及び水中油型エマルジョン、ミセル、混合ミセル及びリポソームを含む脂質系のようなコロイド分散系を含む。インビトロ送達ベクターとして使用されるコロイド系の例は、リポソーム(例えば、人工膜小胞)である。
【0178】
いくつかの実施形態では、上記ベクターはウイルスベクターである。ウイルスベクターの例としては、アデノウイルスベクター、アデノ随伴ウイルス(AAV)ベクター、レンチウイルスベクター、レトロウイルスベクター、牛痘ベクター、単純ヘルペスウイルスベクター及びそれらの誘導体が含まれるが、これらに限定されない。ウイルスベクター技術は、当該分野において公知であり、例えば、Sambrook et al. (2001, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, New York)、及び他のウイル
ス学や分子生物学マニュアルに記載されている。いくつかの実施形態では、ウイルスベクターの効率的な遺伝子送達と、転移因子によって達成される遺伝子発現の安定性とが組み合わされた遺伝子治療において、ウイルスベクター送達転移因子を使用することができる。例えば、Yant, Stephen R., et al. “Transposition from a gutless adeno-transpos
on vector stabilizes transgene expression in vivo.” Nature biotechnology 20.10 (2002): 999-1005。を参照する。
【0179】
III.遺伝子導入システム
本願の別の態様は、1)操作された転移因子(例えば、本明細書に記載されたいずれかの転移因子)と、2)トランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システムを提供する。
【0180】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)トランスポザーゼと、を含む遺伝子導入システムを提供する。いくつかの実施形態では、上記転移因子は異種核酸の細胞(例えば哺乳類細胞又は植物細胞)のDNAへの挿入を可能とする転移活性を示す。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれか1種に由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0181】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)トランスポザーゼをコードする核酸(例えばDNA又はRNA)とを含む遺伝子導入システムを提供する。いくつかの実施形態では、上記転移因子は異種核酸の細胞(例えば哺乳類細胞又は植物細胞)のDNAへの挿入を可能とする転移活性を示す。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれか1種に由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0182】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含む操作された転移因子と、2)SEQ ID
NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含むトランスポザーゼと、を含む遺伝子導入システムを提供する。いくつかの実施形態では、上記転移因子は異種核酸の細胞(例えば哺乳類細胞又は植物細胞)のDNAへの挿入を可能とする転移活性を示す。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれか1種に由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0183】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含む操作された転移因子と、2)SEQ ID
NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含むトランスポザーゼをコードする核酸(例えばDNA又はRNA)と、を含む遺伝子導入システムを提供する。いくつかの実施形態では、上記転移因子は異種核酸の細胞(例えば哺乳類細胞又は植物細胞)のDNAへの挿入を可能とする転移活性を示す。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれか1種に由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、
Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0184】
いくつかの実施形態では、1)操作された転移因子と、2)トランスポザーゼとを含み、上記転移因子は、5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、上記トランスポザーゼはSEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む遺伝子導入システムを提供する。いくつかの実施形態では、上記転移因子は異種核酸の細胞(例えば哺乳類細胞又は植物細胞)のDNAへの挿入を可能とする転移活性を示す。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれか1種に由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0185】
いくつかの実施形態では、1)操作された転移因子と、2)トランスポザーゼをコードする核酸(例えばDNA又はRNA)と、を含み、上記転移因子は、5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、上記トランスポザーゼは、SEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む遺伝子導入システムを提供する。いくつかの実施形態では、上記転移因子は異種核酸の細胞(例えば哺乳類細胞又は植物細胞)のDNAへの挿入を可能とする転移活性を示す。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれか1種に由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0186】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 3の核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 29の核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)SEQ ID NO: 55のアミノ酸配列を含むトランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システムを提供する。
【0187】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 8の核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 34の核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)SEQ ID NO: 60のアミノ酸配列を含むトランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システムを提供する。
【0188】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 11の核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO:
37の核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)SEQ ID NO: 63のアミノ酸配列を含むトランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システムを提供する。
【0189】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 12の核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO:
38の核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)SEQ ID NO: 64のアミノ酸配列を含むトランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システムを提供する。
【0190】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 13の核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO:
39の核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)SEQ ID NO: 65のアミノ酸配列を含むトランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システムを提供する。
【0191】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 16の核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO:
42の核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)SEQ ID NO: 68のアミノ酸配列を含むトランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システムを提供する。
【0192】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 22の核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO:
48の核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)SEQ ID NO: 74のアミノ酸配列を含むトランスポザーゼ、又はトランスポザーゼをコードする核酸とを含む遺伝子導入システムを提供する。
【0193】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 23の核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO:
49の核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)SEQ ID NO: 75のアミノ酸配列を含むトランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システムを提供する。
【0194】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 79の核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO:
91の核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)SEQ ID NO: 103のアミノ酸配列を含むトランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システムを提供する。
【0195】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 82の核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO:
94の核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)SEQ ID NO: 106のアミノ酸配列を含むトランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システムを提供する。
【0196】
本明細書の上記遺伝子導入システムはトランスポザーゼを含む。トランスポザーゼはポ
リペプチドとして存在してもよい。或いは、トランスポザーゼはトランスポザーゼをコードするコード配列を含むポリヌクレオチドの形態として存在してもよい。ポリヌクレオチドはRNA、例えばトランスポザーゼをコードするmRNA、又はDNA、例えばトランスポザーゼをコードするコード配列であってもよい。トランスポザーゼがトランスポザーゼをコードするコード配列として存在する場合、いくつかの実施形態では、上記コード配列は転移因子を含む同一のベクターに存在してもよく、すなわち、シス式である。いくつかの実施形態では、上記遺伝子導入システムは操作された転移因子を含む第1ベクターと、トランスポザーゼコード配列を含む第2ベクターとを含み、すなわち、トランス式である。
【0197】
いくつかの実施形態では、上記遺伝子導入システムは、1)操作された転移因子(本明細書の上記操作された転移因子のいずれか)を含むベクターと、2)トランスポザーゼと、を含む。
【0198】
いくつかの実施形態では、上記遺伝子導入システムは、1)操作された転移因子(本明細書の上記操作された転移因子のいずれか)と、2)トランスポザーゼをコードする核酸とを含み、上記核酸はDNAである。いくつかの実施形態では、上記操作された転移因子及び核酸は同一のベクターに存在する。いくつかの実施形態では、上記操作された転移因子及び核酸は個別のベクターに存在する。
【0199】
いくつかの実施形態では、上記遺伝子導入システムは、1)操作された転移因子(本明細書の上記操作された転移因子のいずれか)と、2)トランスポザーゼをコードする核酸とを含み、上記核酸はRNAである。いくつかの実施形態では、上記操作された転移因子及び核酸は、同一のベクターに存在する。いくつかの実施形態では、上記操作された転移因子及び核酸は個別のベクターに存在する。
【0200】
本明細書の前記遺伝子導入システムでは、操作された転移因子及びトランスポザーゼ又はトランスポザーゼをコードする核酸について、多くの潜在的かつ適切な細胞内送達方法の組み合わせが存在する。トランスポザーゼは、DNA、RNA又はタンパク質として送達され得る。操作された転移因子及びトランスポザーゼは、一緒に又は別々に送達することができる。例えば、トランスポゾン遺伝子とトランスポザーゼ遺伝子は、同じ組換えウイルスゲノムに一緒に含めることができ、単一感染送達系の2つの部分は、トランスポザーゼの発現が、後に細胞染色体に組み込むために、組換えウイルスゲノムからトランスポゾンを切断することを指示するようにする。別の例では、トランスポザーゼ及び転移因子は、ウイルス及び/又は脂質含有試薬のような非ウイルス系の組み合わせによって別々に送達され得る。これらの場合、上記転移因子及び/又はトランスポザーゼ遺伝子は、組換えウイルスを介して送達され得る。いくつかの実施形態では、トランスポザーゼは、標的位置に組み込むために、そのドナーDNAから転移因子を放出するように指示する。
【0201】
トランスポザーゼは、タンパク質又はトランスポザーゼタンパク質をコードする核酸として細胞に提供することができる。トランスポザーゼタンパク質をコードする核酸は、DNA又はRNAの形態をとることができる。タンパク質は、細胞内に単独で導入されてもよいし、プラスミド又はウイルスベクターのようなベクターに導入されてもよい。さらに、トランスポザーゼタンパク質をコードする核酸は、トランスポザーゼタンパク質の細胞内での一時的又は延長的な発現を促進するように、細胞のゲノムに安定的に又は瞬間的に組み込まれてもよい。さらに、プロモータ又は他の発現制御領域は、トランスポザーゼタンパク質をコードする核酸に作動可能に連結されて、このタンパク質の発現を定量的に又は組織特異的に調節することができる。いくつかの実施形態では、トランスポザーゼタンパク質は、DNA結合ドメイン、触媒ドメイン(トランスポザーゼ活性を有する)、及び/又は核局在シグナル(NLS)を含む。
【0202】
したがって、本願の遺伝子導入システムを細胞に送達するために、様々な方法及び材料を使用することができる。
【0203】
例えば、1つの方法は、プラスミドベクターを使用して遺伝子導入システムを送達することである。例えば、このシステムは、トランスポザーゼ発現カセットを担持したヘルパープラスミドと、転移因子を担持したドナープラスミドとの2種類のプラスミドから構成され得る。トランスフェクション後、両方のプラスミドは細胞核に向けられ、ヘルパープラスミドからトランスポザーゼコードRNAの産生を可能にし、次いで、核に導入されたトランスポザーゼサブユニットによって促進されるドナープラスミドからの転移因子の切除を行う。このような方法は単一のプラスミドにトランスポザーゼ遺伝子と転移因子を配置することによってさらに改良されてもよく、このプラスミドは、本来はヘルパー独立転移因子-トランスポザーゼベクターと呼ばれる。あるいは、トランスフェクションされたインビトロ転写mRNAは、トランスポザーゼの豊富な供給源として働くことができ、これにより、トランスポザーゼの発現が延長された細胞を産生するリスクを排除する。
【0204】
したがって、いくつかの実施形態では、上記転移因子は第1ベクター(ドナーベクター)に存在し、トランスポザーゼをコードする核酸は第2ベクター(補助ベクター)に存在する。いくつかの実施形態では、第1ベクター及び第2ベクターは、転移のために細胞を共トランスフェクションするために使用される。
【0205】
別の方法は、ウイルスベクターを使用して遺伝子導入システムを送達することである。ウイルスベクターは免疫原性又は発がん性の問題があるかもしれないが、いくつかの用途では、高い送達効率が必要とされることがある。遺伝子導入システムの構成要素はウイルスキャプシドによって担持、伝達されてもよく、それにより、アデノウイルス又は単純ヘルペスウイルスベクターのような他の付加的ベクターに、遺伝子を組み込み、長期的なトランスジェニック発現を確立する能力を付与する。ウイルスキャプシドはベクターの安定性、組織特異的転移因子送達、及び細胞膜間輸送を提供することができ、転移因子は、転移因子の特徴的な組み込みスペクトルに従ってウイルスベクターの組み込みを促進する。ウイルスベクターに基づく送達方法及び技術は当該分野に知られている。例えば、Sleeping Beautyトランスポゾンシステムのウイルスベクターに基づく転移が、アデノウイルスベクターを持つマウスの肝臓で最初に確認され、最近の研究では、大型動物へのこの方法の適用性が証明されている。アデノ随伴ウイルスベクターは、Sleeping Beautyシステムのベクターとしても好適である。例えば、Yant, Stephen R., et al. “Transposition from a gutless adeno-transposon vector stabilizes transgene expression in vivo.” Nature biotechnology 20.10 (2002): 999-1005,Hausl, Martin A., et al. “Hyperactive sleeping beauty transposase enables persistent phenotypic correction in mice and a canine model for hemophilia B.” Molecular Therapy 18.11 (2010): 1896-1906,及びZhang, Wenli, et al. “Hybrid adeno-associated
viral vectors utilizing transposase-mediated somatic integration for stable transgene expression in human cells.” PloS one 8.10 (2013)を参照する。
【0206】
上述したように、本願の遺伝子導入システムは、物理的、化学的、生物学的、又はそれらの組み合わせによって宿主細胞に送達され得る。様々な送達ベクター及び方法は、いくつかの用途の所望の結果を達成するために、単独で又は組み合わせて本願に使用されることが想定される。したがって、当業者は、遺伝子治療などの想定される特定の用途に適合するために、種々の改変を有する種々の送達方法及び技術を最も好適に利用することができる。遺伝子治療を確実に実行できるようにするためには、長期的で費用対効果のある治療を提供するために、罹患組織のゲノムに治療的トランスジェニック遺伝子の安定した組み込みを実現すべきである。例えば、患者体内への効率的で免疫原性の低い遺伝子導入を
実現するために、合成化合物とプラスミドとを組み合わせて使用して、DNAを細胞に送達することができる。リポソームやその他のナノ粒子は、この任務を達成するのに十分である。例えば、2つのプラスミドを患者に送達することができ、1つはトランスポザーゼの発現を提供するもの(ヘルパープラスミド)であり、もう1つは治療的トランスジェニック遺伝子を含む転移因子を提供するもの(ドナープラスミド)である。これらのDNAは、リポソームと複合化され、胃腸外注射により投与されてもよい。細胞に入ると、トランスポザーゼはドナープラスミドの転移因子に結合し、それを切除してゲノムに組み込むことができる。この挿入は安定して永続的になる。ヘルパープラスミド及びドナープラスミドは、最終的には細胞及び宿主防御機構によって失われる可能性があるが、治療的トランスジェニック遺伝子を含むゲノム組み込み転移因子は、全て安定かつ永続的な修飾となる。また、これらのプラスミドの一過性は過剰な転移を減少させ、発がんリスクを最小限に抑える。
【0207】
より詳細で例示的な転移因子の送達方法及び技術は、例えば、Skipper, Kristian Alsbjerg, et al. “DNA transposon-based gene vehicles-scenes from an evolutionary drive.” Journal of biomedical science 20.1 (2013): 92に記載される。
【0208】
IV.方法
本願はさらに、標的核酸を操作された転移因子又は遺伝子導入システムと接触させることを含み、上記操作された転移因子は本明細書の上記操作された転移因子のいずれかに係る異種核酸を含み、上記遺伝子導入システムは本明細書の上記記遺伝子導入システムのいずれかに係る異種核酸を含む、標的核酸に異種核酸を挿入する方法を提供する。この方法は、インビトロ又は細胞内で行われる。
【0209】
インビトロ方法
いくつかの実施形態では、標的核酸を操作された転移因子と接触させることを含み、上記操作された転移因子は、1)操作された転移因子と、2)トランスポザーゼと、を含み、上記転移因子は、5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、上記トランスポザーゼはSEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む、標的核酸に異種核酸をインビトロで挿入する方法を提供する。いくつかの実施形態では、上記標的核酸は環状DNAである。いくつかの実施形態では、上記標的核酸は線状DNAである。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれかに由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0210】
本明細書の上記方法は無細胞システムを含め、インビトロ転移に用いられてもよい。例えば、Goryshin, Igor Yu, and William S. Reznikoff. 「Tn5 in vitrotransposition.
」 Journal of Biological Chemistry 273.13 (1998): 7367-7374を参照する。インビト
ロ転移活性を示す転移因子は第2世代配列決定(NGS)ライブラリーの構築、例えばタグ付加方法に有用である。
【0211】
いくつかの実施形態では、標的核酸を操作された転移因子と接触させることを含み、上記操作された転移因子は、1)操作された転移因子と、2)トランスポザーゼと、を含み、上記転移因子は、5’から3’へ、5’末端反復配列(5’TR)、バーコード配列を含む異種核酸及び3’末端反復配列(3’TR)を含み、5’TRは、SEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメン
トを含み、3’TRは、SEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、上記トランスポザーゼは、SEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含み、これにより、複数のバーコード化核酸を提供する、標的核酸から複数のバーコード化核酸を製造する方法を提供する。いくつかの実施形態では、上記標的核酸はゲノムDNAである。いくつかの実施形態では、上記標的核酸はcDNAである。いくつかの実施形態では、上記標的核酸は増幅されたDNAである。いくつかの実施形態では、上記異種核酸はプライマー配列をさらに含む。いくつかの実施形態では、該方法は、複数のバーコード化核酸を増幅して核酸配列決定ライブラリーを提供することをさらに含む。いくつかの実施形態では、該方法は核酸配列決定ライブラリーについて配列決定を行うことをさらに含む。いくつかの実施形態では、該方法は標的核酸を複数の操作された転移因子と接触させることを含み、各操作された転移因子は個別のバーコード配列を含む。いくつかの実施形態では、本明細書の上記インビトロ方法を用いて製造される核酸配列決定ライブラリーは標的核酸配列中の隣接情報を保持している。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれかに由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0212】
いくつかの実施形態では、本明細書の上記トランスポザーゼ及び/又はTR配列のいずれかを用いてタグ付加方法を提供する。Tn5トランスポゾンを用いたタグ付加方法は当該分野に知られており、例えばUS9080211B2の通りであり、これは引用により全体として本明細書に組み込まれる。本明細書の上記タグ付加方法はトランスポソーム複合体組成物を用いる。
【0213】
いくつかの実施形態では、SEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含むトランスポザーゼと、1つ又は2つのTR配列とタグ配列を含む異種核酸と、を含むトランスポソーム複合体組成物を提供する。いくつかの実施形態では、トランスポソーム複合体はヘアピンを形成する単一の異種核酸を含む。いくつかの実施形態では、ヘアピンは切断可能な部位を含む。
【0214】
いくつかの実施形態では、トランスポソーム複合体は2種類の異種核酸に結合する2種類のトランスポザーゼを含む。いくつかの実施形態では、5’TR配列と第1タグ配列を含む第1異種核酸に結合する第1トランスポザーゼと、3’TR配列と第2タグ配列を含む第2異種核酸に結合する第2トランスポザーゼと、を含むトランスポソーム複合体組成物を提供する。いくつかの実施形態では、上記5’TRは、SEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRは、SEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含む。いくつかの実施形態では、第1タグ配列は第2タグ配列と異なる。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれかに由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0215】
いくつかの実施形態では、標的核酸を複数のトランスポソーム複合体と接触させることを含み、上記トランスポソーム複合体は、(1)第1トランスポザーゼとTR配列及び第1タグ配列を含む第1異種核酸とを含む第1トランスポソーム複合体と、(2)第2トランスポザーゼとTR配列及び第2タグ配列を含む第2異種核酸とを含む第2トランスポソーム複合体と、を含み、第1タグ配列は第2タグ配列と異なり、上記トランスポザーゼは、SEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含み、第1異種核酸及び第2異種核酸は標的核酸に挿入され、標的核酸は
フラグメント化されて複数の核酸フラグメントになり、上記核酸フラグメントは核酸フラグメントの各5’末端に連結される第1又は第2核酸のうちの1つを含み、これにより、核酸フラグメントのライブラリーを提供する、標的核酸用の第1タグ配列及び第2タグ配列を有する核酸(例えば、DNA)フラグメントライブラリーの製造方法を提供する。いくつかの実施形態では、(1)におけるトランスポソーム複合体は2つの第1異種核酸を含み、(2)におけるトランスポソーム複合体は2つの第2異種核酸を含む。いくつかの実施形態では、上記5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含む。いくつかの実施形態では、該方法は核酸フラグメントを増幅することをさらに含む。いくつかの実施形態では、該方法は核酸フラグメント又はそのアンプリコンについて配列決定を行うことをさらに含む。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれかに由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0216】
いくつかの実施形態では、上記操作された転移因子又はトランスポソーム複合体は標的核酸にランダムに、すなわち、特定の配列基序に偏らないように挿入される。いくつかの実施形態では、上記操作された転移因子又はトランスポソーム複合体はPB、SB又はTBトランスポゾンよりもランダムに標的核酸に挿入される。
【0217】
いくつかの実施形態では、上記操作された転移因子又はトランスポソーム複合体は開放クロマチン領域、核小体又は他のDNA結合タンパク質に結合しない領域など、標的核酸の空間自由領域に優先的に挿入される。したがって、本明細書の上記インビトロ方法を使用して、エピゲノミクスを研究するための測定用の核酸配列ライブラリーを製造することができる(例えば、クロマチンのリモデリング又はDNAメチル化)。これには、クロマチントランスポザーゼの接近可能性配列決定(ATAC-seq)、標的及びタグ下の切断(CUT&TAG)、トランスポザーゼの接近可能性クロマチン及びDNAのメチル化測定(ATAC-Me)、及びトランスポザーゼを介したクロマチンの環化測定(Trac-looping)が含まれるが、これらに限定されない。Tn5トランスポゾンを使用したATAC-seq、CUT&TAG、ATAC-Me及びTrac-looping測定は、例えばBuenrostro, Jason D., et al. 「Transposition of native chromatin
for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position.」 Nature methods (2013) 10(2): 1213;Kaya-Okur HS, et al., 「CUT&Tag for efficient epigenomic profiling of small samples and single
cells.」 Nature Communications (2019), 10(1):1-10;Barnett KR et al. 「ATAC-Me Captures Prolonged DNA Methylation of Dynamic Chromatin Accessibility Loci during
Cell Fate Transitions.」 Molecular Cell, 2020; and Lai B. et al. 「Trac-looping
measures genome structure and chromatin accessibility,」 Nature methods, 2018, 15(9): 741に記載されており、これは全体として引用により本明細書に組み込まれる。いくつかの実施形態では、配列決定ライブラリー製造物はクロマチントランスポザーゼ接近可能性配列決定(ATAC-seq)に用いられる。
【0218】
いくつかの実施形態では、上記操作された転移因子又はトランスポソーム複合体は空間的に接近する標的核酸(例えば、ゲノムDNA)の領域へのタグ付加に有用である。空間的に互いに接近する2つの領域は末端に同じタグ配列対を含むことがある。したがって、本明細書の上記インビトロ方法は蛍光標識プローブを製造することに用いられ、該プローブはゲノムDNA中のクロマチン相互作用境界とインサイチュハイブリダイゼーション、例えばトランスポザーゼに基づく蛍光インサイチュハイブリダイゼーション(FISH)を行うことに用いられる。Tn5に基づくFISH方法は例えば、Zhang X. et al. 「Im
aging chromatin interactions at sub-kilobase resolution via Tn5-FISH,」 bioRxiv,
2019:601690に記載されており、その全文は引用により本明細書に組み込まれる。
【0219】
細胞内の方法
いくつかの実施形態では、標的核酸を操作された転移因子と接触させることを含み、上記操作された転移因子は、1)操作された転移因子と、2)トランスポザーゼと、を含み、上記転移因子は、5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRは、SEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、上記トランスポザーゼは、SEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む、細胞内の標的核酸に異種核酸を挿入する方法を提供する。いくつかの実施形態では、上記標的核酸はゲノムDNAである。いくつかの実施形態では、上記標的核酸は染色体内DNAである。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれかに由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0220】
いくつかの実施形態では、標的核酸を操作された転移因子と接触させることを含み、上記操作された転移因子は、1)操作された転移因子と、2)トランスポザーゼと、を含み、上記転移因子は、5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRは、SEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRは、SEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、上記トランスポザーゼは、SEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む、哺乳類細胞内の標的核酸に異種核酸を挿入する方法を提供する。いくつかの実施形態では、上記哺乳類細胞はヒト細胞である。いくつかの実施形態では、上記哺乳類細胞は動物細胞、例えば齧歯動物細胞である。いくつかの実施形態では、上記哺乳類細胞は免疫細胞、例えばT細胞である。いくつかの実施形態では、該方法はエクスビボで行われる。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれかに由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0221】
いくつかの実施形態では、標的核酸を操作された転移因子と接触させることを含み、上記操作された転移因子は、1)操作された転移因子と、2)トランスポザーゼと、を含み、上記転移因子は、5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRは、SEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRは、SEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、上記トランスポザーゼは、SEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む、植物細胞内の標的核酸に異種核酸を挿入する方法を提供する。いくつかの実施形態では、植物細胞は農作物の細胞である。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれかに由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0222】
本明細書の上記転移因子又は遺伝子導入システムは、当該分野に知られている種々の技術のいずれかを使用して、1つ又は複数の細胞に導入することができ、例えば、マイクロ
インジェクション、脂質小胞(例えばカチオン性脂質小胞)への核酸フラグメントの結合、粒子衝撃、電気穿孔、DNA凝集試薬(例えばリン酸カルシウム、ポリリジン、ポリエチレンイミン)、又はウイルスベクターに核酸フラグメントを組込み、ウイルスベクターと細胞とを接触させることなどが含まれるが、これらに限定されない。ウイルスベクターが使用される場合、ウイルスベクターは、レトロウイルスベクター、アデノウイルスベクター又はアデノ随伴ウイルス(AAV)ベクターから選択されるウイルスベクターを含む、当該分野に知られている複数のウイルスベクターのいずれかを含んでもよい。
【0223】
異種核酸は複数のオペロンを含むことができ、又は異種核酸は複数の生物産物をコードすることができることが想定される。いくつかの実施形態では、上記異種核酸は遺伝子回路をコードする。例示的な遺伝子回路は、それぞれmRNA又はタンパク質を生成するために転写及び/又は翻訳されるエレメントの集合(各エレメントの「出力」)である。エレメント出力は、他の部分と相互作用することができ(例えば、転写又は翻訳を調節する)、又は細胞内の他の分子(例えば、細胞環境内に存在する小分子、DNA、RNA、又はタンパク質)と相互作用することができる。例えば、回路は、代謝経路又は遺伝子カスケードであってもよく、それは、天然又は非天然に存在し、人工的に工学化されていてもよい。回路内の各エレメントは、プロモータ、リボソーム結合部位(RBS)、コード配列(CDS)、及び/又はターミネータなどの構成要素又は遺伝子モジュールを含んでもよい。これらの構成要素は、異なるエレメントを実現するために異なる方法で相互接続又は組み立てられてもよく、最終的なエレメントは、異なる回路又は経路を作成するために異なる方法で組み合わされてもよい。これらのエレメントに加えて、回路は、細胞内に存在するか、又は構成要素と相互作用する細胞環境内に存在する他の種類の分子を含んでもよい。
【0224】
したがって、いくつかの実施形態では、細胞を操作された転移因子と接触させることを含み、上記操作された転移因子は、1)操作された転移因子と、2)トランスポザーゼと、を含み、上記転移因子は、5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRは、SEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRは、SEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、上記トランスポザーゼは、SEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含み、異種核酸は遺伝子回路をコードする、細胞内の標的核酸に異種核酸を挿入する方法を提供する。いくつかの実施形態では、上記標的核酸はゲノムDNAである。いくつかの実施形態では、上記標的核酸は染色体内DNAである。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれかに由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0225】
遺伝子回路は遺伝子治療に用いられる。遺伝子回路の設計使用方法及び技術は当該分野で知られている。さらに、例えばBrophy, Jennifer AN, and Christopher A. Voigt. "Principles of genetic circuit design." Nature methods 11.5 (2014): 508を参照することができる。
【0226】
該方法は任意の適切な細胞タイプに適用することができる。いくつかの実施形態では、上記細胞は、細菌、酵母細胞、真菌細胞、藻類細胞、植物細胞又は動物細胞である。いくつかの実施形態では、上記細胞は、組織生検のような天然由来から単離された細胞である。いくつかの実施形態では、上記細胞は、インビトロで培養された細胞株から単離された細胞である。いくつかの実施形態では、上記細胞は遺伝子操作された細胞である。いくつかの実施形態では、上記細胞は、核内で増殖、分化、又はその両方を経験する種子細胞で
ある。
【0227】
いくつかの実施形態では、上記細胞は、ウシ、ヒツジ、ヤギ、ウマ、ブタ、シカ、ニワトリ、アヒル、ガチョウ、ウサギ及び魚から選択される生物由来の動物細胞である。
【0228】
いくつかの実施形態では、上記細胞は、トウモロコシ、小麦、大麦、オーツ麦、イネ、大豆、アブラヤシ、ベニバナ、ゴマ、タバコ、亜麻、綿、ヒマワリ、トウジンビエ、アワ、モロコシ、アブラナ、大麻、野菜作物、飼料作物、経済作物、木本作物及びバイオマス作物から選択される生物由来の植物細胞である。
【0229】
いくつかの実施形態では、上記細胞は哺乳類細胞である。いくつかの実施形態では、上記細胞はヒト細胞である。いくつかの実施形態では、ヒト細胞はヒト胚腎293T(HEK293T又は293T)細胞又はHeLa細胞である。いくつかの実施形態では、上記哺乳類細胞は、免疫細胞、肝臓細胞、腫瘍細胞、幹細胞、受精卵、筋細胞及び皮膚細胞から選択される。
【0230】
いくつかの実施形態では、上記細胞は、細胞傷害性T細胞、ヘルパーT細胞、ナチュラルキラー(NK)T細胞、iNK-T細胞、NK-T様細胞、αγδT細胞、腫瘍浸潤性T細胞、及び樹状細胞(DC)活性化T細胞からなる群から選択される免疫細胞である。いくつかの実施形態では、この方法は、CAR-T細胞又はTCR-T細胞のような修飾免疫細胞を生成する。
【0231】
いくつかの実施形態では、上記異種核酸は、細胞のゲノムに挿入される。さらにいくつかの実施形態では、上記異種核酸の挿入は細胞の遺伝子を不活性化する。いくつかの実施形態では、上記異種核酸はタンパク質又はRNAi分子をコードする。
【0232】
さらに、上記異種核酸は、ゲノム編集に有用なRNA分子をコードすることができる。このようなRNA分子の例としては、CRISPR RNA(crRNA)、トランス活性化crRNA(tracrRNA)、ガイドRNA(gRNA)、及びシングルガイドRNA(sgRNA)が含まれるが、これらに限定されない。
【0233】
いくつかの実施形態では、上記異種核酸は、レポータータンパク質、抗原特異的受容体、治療的タンパク質、抗生物質耐性タンパク質、RNAi分子、サイトカイン、キナーゼ、抗原、抗原特異的受容体、サイトカイン受容体、及び自殺ポリペプチドからなる群から選択される生物産物をコードする。例えば、上記異種核酸は、腫瘍関連抗原に特異的な受容体をコードすることができる。この方法により操作されたT細胞は、腫瘍関連抗原を発現する腫瘍細胞を認識し、特異的に殺傷することができる。別の例では、上記異種核酸は、ハイグロマイシン耐性タンパク質をコードし、ハイグロマイシン耐性細胞株を樹立することができる。あるいは、上記異種核酸は、生物学的機能を有さず、それ自体を必須遺伝子に挿入することにより、他の遺伝子の機能を遮断し、その機能を遮断することにも利用可能である。
【0234】
いくつかの特定実施形態において、上記異種核酸は、遺伝子治療に有用な治療的タンパク質をコードする。いくつかの実施形態では、上記異種核酸は治療的抗体をコードする。いくつかの実施形態では、上記異種核酸は、キメラ抗原受容体(CAR)又は操作されたTCRのような操作された受容体をコードする。
【0235】
いくつかの実施形態では、上記異種核酸は、標的ポリヌクレオチド(「貨物遺伝子」)の挿入を促進するために、1つ又は複数のマルチクリーニング部位(MCS)を含む。
【0236】
いくつかの実施形態では、この方法はエクスビボで行われる。いくつかの実施形態では、形質導入又はトランスフェクションされた細胞(例えば、哺乳類細胞)は、異種核酸を細胞に導入した後、エクスビボで増殖する。いくつかの実施形態では、形質導入又はトランスフェクションされた細胞は、増殖のために少なくとも約1日、2日、3日、4日、5日、6日、7日、10日、12日、又は14日のいずれか培養される。いくつかの実施形態では、形質導入又はトランスフェクションされた細胞は、約1日、2日、3日、4日、5日、6日、7日、10日、12日、又は14日のいずれかを超えないように培養される。いくつかの実施形態では、形質導入又はトランスフェクトされた細胞をさらに評価又はスクリーニングして、操作された細胞を選択する。
【0237】
レポーター遺伝子又は選択マーカーは、潜在的にトランスフェクションされた細胞を同定するため、及び調節配列の機能を評価するために使用され得る。一般に、レポーター遺伝子は、受容体生物又は組織に存在しないか、又は受容体生物又は組織によって発現されない遺伝子であり、そのコードするポリペプチドの発現が酵素活性のような容易に検出可能ないくつかの特性によって証明される。レポーター遺伝子の発現を、DNAを受容体細胞に導入した後、適切なタイミングで測定する。適切なレポーター遺伝子は、ルシフェラーゼ、β-ガラクトシダーゼ、クロラムフェニコールアセチルトランスフェラーゼ、分泌型アルカリホスファターゼ、又は緑色蛍光タンパク質遺伝子(例えば、Ui-Tei et al. FEBS Letters 479: 79-82 (2000))をコードする遺伝子を含んでもよい。適切な表現システムは公知であり、公知の技術を用いて作成又は商業的に入手することができる。
【0238】
細胞内の異種核酸の存在を確認する他の方法としては、例えば、当業者によく知られている、Southernブロット法、Northernブロット法、RT-PCR、PCRなど、分子生物学的アッセイ;例えば免疫学的方法(例えばELISAやプロテインブロット法)による特定のペプチドの存在の有無の検出などの生化学的アッセイが含まれる。
【0239】
本願は、遺伝的変異を研究するために哺乳類細胞の準同質遺伝子系統を生成する方法を想定している。本願はまた、生物医学的、農業的及び産業的に有用な生成物を生成するための微生物、細胞、植物、動物又は合成生物のゲノム修飾も考慮する。これらの方法は、遺伝子ノックアウト又はノックイン研究のような、ゲノムを理解するための生物学的研究ツールとして使用することができる。
【0240】
本明細書に記載のいずれかの方法を使用して異種核酸によって修飾された細胞、及びそのような細胞を含むか又はそのような細胞から産生される生物(例えば、動物、植物又は真菌)も提供される。
【0241】
標的核酸
本明細書の上記方法は、種々の標的核酸に異種核酸を挿入するのに適している。いくつかの実施形態では、上記標的核酸はDNAである。いくつかの実施形態では、上記標的核酸は一本鎖である。いくつかの実施形態では、上記標的核酸は二本鎖である。いくつかの実施形態では、上記標的核酸は、一本鎖領域及び二本鎖領域を含む。いくつかの実施形態では、上記標的核酸は線状である。いくつかの実施形態では、上記標的核酸は環状である。いくつかの実施形態では、上記標的核酸は、メチル化ヌクレオチド、損傷ヌクレオチド、又はヌクレオチドアナログのような1つ又は複数の修飾ヌクレオチドを含む。いくつかの実施形態では、上記標的核酸は修飾されていない。いくつかの実施形態では、上記標的核酸は、核小体のような1つ又は複数のタンパク質に結合する。
【0242】
標的核酸は、任意の長さ、例えば、約100bp、200bp、500bp、1000bp、2000bp、5000bp、10kb、20kb、50kb、100kb、200kb、500kb、1Mb以上の少なくともいずれかであってもよい。いくつかの実施
形態では、上記標的核酸は、約500kb、200kb、100kb、50kb、40kb、30kb、20kb、10kb、5kb、2kb、1kb、500bp、200bp以下のいずれかを超えない。いくつかの実施形態では、上記標的核酸は、約100bp~500bp、500bp~1kb、100bp~1kb、1kb~2kb、100bp~5kb、100bp~10kb、100bp~20kb、1kb~5kb、1kb~10kb、1kb~20kb、20kb~100kb、100kb~1Mbのいずれかである。標的核酸はまた、任意の配列を含んでいてもよい。いくつかの実施形態では、上記標的核酸は、本明細書の上記操作された転移因子又は遺伝子送達システムの転移のホットスポットである特定の配列を濃縮する。いくつかの実施形態では、上記標的核酸は、ATを濃縮し、例えば、少なくとも約40%、45%、50%、55%、60%、65%又はそれ以上のAT含有量のいずれかを有する。いくつかの実施形態では、上記標的核酸はATを濃縮しない。いくつかの実施形態では、本明細書に記載された操作された転移因子又は遺伝子送達システムは、特定の配列又は配列モチーフに異種核酸を挿入することを好まないので、標的核酸は特定のホットスポット配列を濃縮しない。いくつかの実施形態では、上記標的核酸は、1つ又は複数の二次構造又はより高次構造を有する。いくつかの実施形態では、上記標的核酸はクロマチン中のように凝集状態ではない。
【0243】
いくつかの実施形態では、上記標的核酸は細胞内に存在する。いくつかの実施形態では、上記標的核酸は細胞核内に存在する。いくつかの実施形態では、上記標的核酸は細胞に対して内因性である。いくつかの実施形態では、上記標的核酸はゲノムDNAである。いくつかの実施形態では、上記標的核酸は染色体DNAである。いくつかの実施形態では、上記標的核酸は、タンパク質コード遺伝子又はその機能領域、例えばコード領域、又はプロモータ、エンハンサー、5’又は3’非翻訳領域などの制御要素である。いくつかの実施形態では、上記標的核酸は、トランスポゾン、miRNA、tRNA、リボソームRNA、リボザイム又はlincRNAなどの非コード遺伝子である。いくつかの実施形態では、上記標的核酸はプラスミドである。
【0244】
いくつかの実施形態では、上記標的核酸は細胞に対して外因性である。いくつかの実施形態では、上記標的核酸は、ウイルスDNAなどのウイルス核酸である。いくつかの実施形態では、上記標的核酸は水平に転移するプラスミドである。いくつかの実施形態では、上記標的核酸は、細胞のゲノムに組み込まれる。いくつかの実施形態では、上記標的核酸は細胞のゲノムに組み込まれていない。いくつかの実施形態では、上記標的核酸は細胞内のプラスミドである。いくつかの実施形態では、上記標的核酸は染色体外アレイ中に存在する。
【0245】
いくつかの実施形態では、上記標的核酸は、単離されたDNAのような単離された核酸である。いくつかの実施形態では、上記標的核酸は無細胞環境中に存在する。いくつかの実施形態では、上記標的核酸は、プラスミドなどの単離されたベクターである。いくつかの実施形態では、上記標的核酸は単離された線状DNAフラグメントである。
【0246】
V.キット及び物品
本願はまた、本明細書に記載されたいずれかの転移因子又は遺伝子導入システムを含むキット及び物品を提供する。いくつかの実施形態では、キットは、標的核酸に異種核酸を挿入するためのプロトコールを含む(例えば、本明細書に記載のいずれかの方法を使用する)。いくつかの実施形態では、キットは、標的核酸に異種核酸をインビトロで挿入するために使用される。いくつかの実施形態では、キットは、哺乳類細胞又は植物細胞などの細胞内の標的核酸に異種核酸を挿入するために使用される。本明細書の上記キット及び物品は、インビトロ又はエクスボ、遺伝的研究及び遺伝子治療において標的核酸を修飾するために有用である。
【0247】
いくつかの実施形態では、操作された転移因子を含むキットを提供し、上記操作された転移因子は、5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRは、SEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRは、SEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、上記転移因子は異種核酸の細胞(例えば哺乳類細胞又は植物細胞)のDNAへの挿入を可能とする転移活性を示す。いくつかの実施形態では、上記異種核酸は、目的ポリヌクレオチド(「貨物遺伝子」)の挿入を促進するために1つ又は複数のマルチクローニング部位(MCS)を含む。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれかに由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0248】
いくつかの実施形態では、遺伝子導入システムを含むキットを提供し、上記遺伝子導入システムは、1)操作された転移因子と、2)トランスポザーゼ又はトランスポザーゼをコードする核酸と、を含む、上記転移因子は、5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、上記トランスポザーゼは、SEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列、又はその変異体を含み、上記転移因子は異種核酸の細胞(例えば哺乳類細胞又は植物細胞)のDNAへの挿入を可能とする転移活性を示す。いくつかの実施形態では、上記異種核酸は、目的ポリヌクレオチド(「貨物遺伝子」)の挿入を促進するために1つ又は複数のマルチクローニング(MCS)を含む。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれかに由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0249】
いくつかの実施形態では、キットは、本明細書の上記方法のいずれかで使用される1つ又は複数の試薬を含む。試薬は任意の適切な容器で提供してもよい。例えば、キットは、1つ又は複数の反応性又は貯蔵性緩衝液を提供してもよい。試薬は、特定のアッセイに使用し得る形態で提供するか、又は使用前に1つ又は複数の他の成分を添加することが必要な形態(例えば、濃縮液又は凍結乾燥形態)で提供してもよい。緩衝液は、炭酸ナトリウム緩衝液、炭酸水素ナトリウム緩衝液、ホウ酸塩緩衝液、トリス緩衝液、MOPS緩衝液、HEPES緩衝液、及びこれらの組み合わせを含むが、これらに限定されない任意の緩衝液であってもよい。いくつかの実施形態では、キットは、本明細書の上記操作された転移因子又は遺伝子導入システムを使用して修飾された細胞の増殖又は誘導を可能にするための培地、緩衝液、試薬などを含む。いくつかの実施形態では、キットは、本明細書の上記操作された転移因子又は遺伝子導入システムを使用して修飾された標的核酸を単離及び/又は製造するための緩衝液、試薬などを含む。いくつかの実施形態では、キットは、本明細書の上記操作された転移因子又は遺伝子導入システムを使用して配列決定ライブラリーを製造するためのプライマー及び試薬を含む。
【0250】
キットは、適切な包装を採用する。適切な包装には、バイアル、ボトル、広口ボトル、軟包装(例えば、密封ポリエステルフィルム袋又はビニール袋)などが含まれるが、これらに限定されない。キットは、緩衝液及び説明情報のような追加の成分を選択的に提供してもよい。したがって、本願は、バイアル(例えば、密封バイアル)、ボトル、広口ボトル、軟包装などを含む物品も提供する。
【0251】
実施例
以下の実施例は、単に本発明を例示することを目的とするものであり、本発明を如何なる態様でも限定するものとは考えられない。以下の実施例及び詳細な説明は、限定ではなく、説明的に提供される。
【0252】
実施例1:候補活性転移因子の同定
本実施例は、種間の候補活性転移因子(TE、トランスポゾン)のコンピュータ同定を記載する。トランスポゾンは様々な種に大量に存在する。しかしながら、哺乳類細胞において転移活性を示すトランスポゾンは少数である。したがって、ゲノム工学及び遺伝子治療のための試薬として有用な候補活性トランスポゾンを系統的に同定する方法が必要である。この実施例は、末端逆反復配列(TIR、末端反復TRとも呼ばれる)を有するトランスポゾンを同定することに集中しているが、この方法は、任意の他のタイプのトランスポゾンを同定することに使用されてもよい。
【0253】
材料及び方法
Repbaseは最も一般的なトランスポゾンデータベースで、さまざまな真核種から38,000個のトランスポゾン配列が含まれている(Bao, W., K.K. Kojima, and O. Kohany, Repbase Update, a database of repetitive elements in eukaryotic genomes. Mob DNA, 2015. 6:p.11)。これらのプロトタイプ配列の多くは共通配列であり、それぞれのトランスポゾンファミリーを再構成し、その祖先の活性化状態を近似する配列である。したがって、共通配列は、Sleeping Beauty (Ivics, Z., et al., Molecular reconstruction of Sleeping Beauty, a Tc1-like transposon from fish, and its transposition in
human cells. Cell, 1997. 91(4): p. 501-10)のような、トランスジェニック及び遺伝
子治療のための活性トランスポゾンの実験的再構築に有用である。このプロジェクトの最初のステップとして、候補トランスポゾンスクリーニング用に、全ての共通配列がRepbase(バージョンRebase24.02)からダウンロードされる。
共通配列は必ずしも完全なトランスポザーゼ遺伝子を含んでいるとは限らないからである(特に高度に退化した古いトランスポゾンの場合)。他のシステム(例えば哺乳類の細胞)では、活性トランスポゾンとして機能しないので、その原始種における同定されたTE転移活性を、トランスポザーゼによってコードされる重要なドメイン、共通及びファミリーメンバー間の平均配列差、コピー数、保存的末端逆反復(TR)配列、及びTE側に連結される保存的標的部位反復(TSD)を含むいくつかのパラメータを使用して評価した。上記の情報を得るために、UCSC Genome Browserから100種類の動物のゲノム配列(Haeussler, M., et al., The UCSC Genome Browser database: 2019
update. Nucleic Acids Res, 2019. 47(D1): p. D853-D858)をダウンロードする。ゲノ
ム配列は、Repbaseからの共通配列を使用して繰り返しマスキングされる。活性トランスポゾンは次のように定義される:1)候補トランスポゾンは最初から最後まで共通配列にマッチングする。及び2)候補トランスポゾンの長さは、トランスポゾン内に明らかな欠損がないことを確実にするために、共通トランスポゾンの長さの90%に達する。
【0254】
結果
図1は、バイオインフォマティクスパイプラインのフローチャートと、パイプラインの各段階における候補活性転移因子の数を示している。
合計100個の動物ゲノムから26,853,019個のDNAトランスポゾンのコピー(主にTIRトランスポゾン)が同定された。大量のコピーは活性トランスポゾンから退化したフラグメントである。全長DNAトランスポゾンのコピー総数は1,895,466であり、Repbase内の1,577個の共通DNAトランスポゾンにマッピングされ
ている。
次に、これらのトランスポゾンを調べて、トランスポザーゼ遺伝子が含まれているか否かを調べた。ORFfinderはオープンリーディングフレーム(ORF)を検出する
ものであり、長さカットオフ値が300アミノ酸に設定される。次いで、このタンパク質配列は、PfamHMMライブラリーに対するPfamScanによる重要ドメインの探索に使用される(Madeira, F., et al., The EMBL-EBI search and sequence analysis tools APIs in 2019. Nucleic Acids Res, 2019. 47(W1): p. W636-W641)。このフィルタリングステップの後、Tnドメインを有する131個のトランスポゾンがパイプラインに残る。
次に、RepeatMaskerを使用して、トランスポゾンごとのコピー数を決定する(Smit, AFA, Hubley, R & Green, P. RepeatMasker Open-4.0.2013-2015)。各種の共通トランスポゾンとそのファミリーメンバーとの間の平均配列差値を計算し、この差値は、異なる種において0~24.4%の範囲である。表1に示すように、62個の同定されたTEの平均差値は5%以下であり、69個の同定されたTEの平均差値は5%以上であった。これら131個の活性トランスポゾンが5つのスーパーファミリーに分布していることがわかった(
図2)
表1で同定された62個のトランスポゾンのうち、合計11個のトランスポゾンが以下のより厳格な基準を満たしていることを発見し、それらはゲノム工学に非常に適している:1)トランスポゾンの長さは3000bp未満である。2)トランスポゾン内のミニチュア逆方向反復転移因子(MITE)の数が10個を超える。3)トランスポゾンの平均差値は1%未満である(TE IDs:4、5、7、12、18、20、22、25、26、28及び30、表1参照)。
要約すると、これらのデータは100個のゲノムの汎ゲノムバイオインフォマティクス解析によって同定された131個の候補活性トランスポゾンを示している。したがって、この実施例は、候補活性転移因子を同定するための強力なバイオインフォマティクスパイプラインの開発の成功を示している。
【0255】
実施例2:候補活性転移因子の検証
本実施例は、実施例1で同定された候補活性転移因子の実験的検証を説明する。
【0256】
材料及び方法
DNA合成及びプラスミド構築
EcoRI及びNotIが側部に連結された哺乳類コドン最適化トランスポザーゼORFを合成し、CMV-hyPBaseベクターにクローニングする(K. Yusa, et al., A hyperactive piggyBac transposase for mammalian applications. Proc Natl Acad Sci U S A, 2011. 108(4): p. 1531-6)。これらのベクターは、ヒトCMVプロモータの下で
トランスポザーゼ発現を助けるためのヘルパープラスミドである。トランスポゾンドナープラスミドは、抗生物質耐性遺伝子の両側に位置する左右のトランスポゾンフラグメントを含む。本明細書で使用される場合、左トランスポゾンフラグメント(LTF)は、5’TSDからTE配列までのトランスポゾンORF配列の開始コドンのフラグメントを指す。本明細書で使用される場合、右転移因子フラグメント(RTF)は、トランスポザーゼORF配列の終止コドンからTE配列の3’TSDまでのフラグメントを意味する。通常、TR配列は、左右トランスポゾンフラグメント内に位置する。例えば、前記5’TR配列はLTF配列内にあり、前記3’TR配列はRTF配列内にある。本実験で使用されるLTF及びRTF配列は、青蘭生物技術社(Qinglan Biotechnology Inc.,)により合成され、pMVベクターにクローニングされた。貨物遺伝子クローニングのためのトランスポゾンフラグメントにおいて、5’及び3’マルチクリーニング部位(MCS)も合成された。TSD配列は最も外側に位置する。哺乳類細胞における転移スクリーニングのためのドナープラスミドは、P2A結合ピューロマイシン耐性遺伝子と、PGKプロモータにより発現される増強型GFP遺伝子とを担持する。
図3は、活性転移因子を検証するための一組の例示的な補助体及びドナー構築体を示している。
【0257】
哺乳類細胞における転移
4つの哺乳類細胞株HEK293T(293Tとも呼ばれる)、HeLa、Hct116及びK562は活性トランスポゾンのスクリーニングに用いられる。293TとHeLa細胞株をDMEM培地に維持し、10%のウシ胎児血清と1%のペニシリン/ストレプトマイシンを補充した。Hct116とK562細胞株をRPMI 1640培地に維持し、10%のウシ胎児血清と1%のペニシリン/ストレプトマイシンを補充した。これらの細胞株に加えて、EasySep Human T Cell Enrichmentキットを用いてCD3+T細胞を単離し、その後、histopaque-1077(Sigma-Aldrich)勾配分離により単球を収集して、CD3+T細胞を5%(v/v)熱不活化ウシ胎児血清、2mM L-グルタミン、及び1mMピルビン酸ナトリウムを補充したX-Vivo 15培地(Lonza)に培養した。
転移測定では、トランスフェクション18時間前に、1.2×105個のHEK293T細胞、0.7×105個のHeLa細胞又は1.0×105個のHct116細胞を24ウェルプレートの各ウェルに接種した。Lipo3000を使用して、200ngのヘルパープラスミドと100ngのドナープラスミド、又は100ngのドナープラスミドだけを個々の細胞株に送達した。トランスフェクション2日後、細胞数を計算し、FACSによりトランスフェクション効率を測定した。次に、1/100thトランスフェクション後のHEK293T、1/100thトランスフェクション後のHeLa細胞又は1/100thトランスフェクション後のHct116細胞を100-mmプレートに移して、ピューロマイシン(0.5μg/ml)を用いて10日間(HEK-293T細胞株)又は14日間(HeLa細胞株及びHct116細胞株)選択した。
ピューロマイシンスクリーニング後、冷たいPBS 5mlで細胞を1回洗浄し、4%PFAで15分間固定化した後、0.2%メチレンブルー(PBS中)で1時間染色した(Wu et al., piggyBac is a flexible and highly active transposon as compared to Sleeping Beauty, Tol2, and Mos1 in mammalian cells. PNAS, 2006. 103: p. 15008-15013)。最後に、残った非特異的に染色したものをPBSで洗い流した。Image Jソフトウェアにより単一染色コロニーをカウントした。先に算出したトランスフェクション細胞の総数とトランスフェクション効率とに基づいて、転移効率を算出した。
K562細胞株やCD3+T細胞などの懸濁細胞については、プラスミドをごくわずかな割合に希釈した電気穿孔後14日目のGFP陽性細胞の割合に基づいて転移活性を評価した。
【0258】
TE挿入ライブラリーの構築及びバイオインフォマティクス分析
DNeasy血液及び組織キット(Qiagen,Germany)を用いて安定な転
移K562細胞からゲノムDNAを単離し、Covaris M220超音波発生器(Covaris,USA)を用いて平均長さ600bpまで切断した。DNAサンプルに対
して末端修復を行い、ネストPCRによりリンカーライゲーションおよび増幅を行い、Illumina HiSeqシーケンサー上で精製と配列決定を行った。次いで、TE組込み部位とベクター組込み部位の側に連結される1次配列の上流及び下流領域におけるランダム挿入部位について、最も近い遺伝子及びTSSまでの距離、及び異なるクロマチン状態を比較した。
【0259】
結果
検証項目には3回の実験が含まれる。
1回目では、まず、1%未満の差値及び10より大きいMITEコピー数を有する11個のTE(すなわち、TE ID:4、5、7、12、18、20、22、25、26、28及び30)を検証した。いかなる理論にも縛られることは望ましくないが、低い差値と高いMITEコピー数は、転移因子が最近ある種で活性である可能性が高いことを示していると仮定する(R. Mitra, et al., Functional characterization of piggyBat from the bat Myotis lucifugus unveils an active mammalian DNA transposon. Proc Natl Acad Sci U S A, 2013. 110(1): p. 234-9参照)。
プラスミド構築中に、異なるソースからの2つのトランスポゾンTR配列が利用可能であることを発見した。1つはデータベースが提供する共通配列からものであり、もう1つは自律配列とMITE配列とのアライメントによるものである。異なるTR配列のソースが測定結果に影響を及ぼすか否かをテストするために、異なるソースからのTR配列をそれぞれ使用して、転写測定のために2組のドナープラスミドを設計した。
その結果、初期検証でテストした11個の候補TEでは、3つのTEが活性であることがわかった。Tc1-3_Xt(TE ID25)はHEK293T細胞とHeLa細胞の両方で活性であることを見出し、HEK293T細胞では、導入効率が約9.6%、HeLa細胞では、導入効率が約3.6%であり、piggyBacの約半分(HEK293T細胞では18.4%、HeLa細胞では8.3%)に相当する。2つのTEは、テストされた2つの細胞株のうちの1つにおいてのみ活性であることが見出された:hAT-3_XT(TE ID 22)はHeLa細胞における活性が約1%であり、hAT-5_DR(TE ID 28)はHEK-293T細胞における活性が約2%である。異なるソースのTR配列を有する2つのドナープラスミド群間で転移効率に有意な差が認められなかったため、その後の実験はデータベースの共通配列からのTR配列のみに依存した。
次の実験では、表1から選ばれた48個の候補TEについて、293T細胞株とHeLa細胞株における転移活性を評価した(そのうち、293T細胞のみで16個のTEをテストした)。驚くほど高い成功率で、テストした48個の候補TEの中から22個のTEが活性であることを発見した。このうち、Tc1-8B_DR (TE ID 14)、Tc1-3_FR (TE ID 29)、Mariner2_AG (TE ID 35)、Tc1-1_Xt (TE ID 36)、Tc1-1_AG(TE ID 37)、Tc1-1_PM(TE ID 43)、Tc1-4_Xt(TE ID 54)及びTc1-15_Xt(TE ID 56)の8つのTEは、piggyBacと同等以上の転移効率を有する。参照として、piggyBacは293T細胞では17.44%、HeLa細胞では10.25%の導入効率であった。
いくつかの活性TEについては、転位効率が予想よりもはるかに高いため、上記細胞の標準希釈度は、個々のコロニーを正確にカウントするために、生存コロニーを測定プレート上で分離したままにするのに十分ではない。その結果、画像ソフトがカウントした染色コロニー数は過小評価されていた。これらのTEについては、検出プレートの染色がより高い導入効率を明確に示していたとしても、過小評価されたコロニーカウントに基づいて算出された導入効率は、実際の導入効率を過小評価したにすぎなかった。
つまり、2回の実験から59個の候補TEの転移活性を評価した。
図4A~5Bは、対照TEと比較して評価されたTEの転移効率を示している。合計25個のTEがヒト細胞株において活性であることを見出した。
25個の活性TEのうち、9個のTEはhATスーパーファミリーに属し、16個のTEはTcMarinerスーパーファミリーに属していた。8個の活性TEの転移活性はpiggyBacと同程度以上であった。この8個の高効率な活性TEは全てTcMarinerスーパーファミリーに属し、このスーパーファミリーの中にもっと多くの活性トランスポゾンが分布していることを示した。さらに、25個の活性TEのうち9個がネッタイツメガエル由来であった。また、TEの転移活性と差値やMITEコピー数には有意な関係は認められなかった。
3回目の実験では、表1から選ばれた残り72個の候補TEについて、293T細胞株及びHeLa細胞株における転移活性を評価した。候補TEのうち、293T細胞で5%よりも大きい差値を持つ69個のTEのみをテストした。テストされた72個の候補TEのうち13個のTEが活性であることがわかった。結果を
図6A~6Bに示す。
表2は、293T細胞株とHeLa細胞株の両方又は両方の細胞株の一方のみで活性が検証された合計38個のTEを含む、上記実験の経験による活性TEをまとめたものである。トランスポザーゼ配列に基づいて同定された異なるスーパーファミリーに属するTEの系統樹を
図7A~7Cに示す。各スーパーファミリー内の種々のトランスポザーゼ間の
配列類似性の百分率を表3~5に示す。
なお、5個のDNA TE(Tc1-8B_DR (TE ID 14)、Tc1-3_FR (TE ID 29)、Mariner2_AG (TE ID 35)、Tc1-1_Xt (TE ID 36)、Tc1-1_PM (TE ID 43)は、複数回最適化されたSB100Xよりも高い転移活性を示す。活性が最も高い5つのTEは、HEK293T細胞、Hela細胞、HCT116細胞においてもより高い転移活性を有しており(
図8A~9B)、
図10A~10Bは、初代T細胞におけるTEの転移活性を示している。3つのTE(Tc1-8B_DR (TE ID 14)、Tc1-3_FR (TE ID 29)、Tc1-1_PM (TE ID 43))では、過剰生産阻害(OPI)と呼ばれる現象は発生していない。
図11A~11Bは、トランスポザーゼをコードするヘルパープラスミドとトランスポゾンプラスミドの比率が最適化されるにつれて、転移活性が増加することを示している。
図12は同定した対照TE、piggyBAC、hyperPiggyBac及びSB100Xと比較して、活性が最も高い5つのTEの貨物(カーゴ)容量を示し、2 kb、5 kb、10 kb及び20 kbの遺伝子長を含む。
131個の候補TEのうち、活性TEと不活性TEを比較すると、活性TEは低い平均多様性、やや長い予測TIR配列、及び有意に増加した自律TEの数を示した。これらの差は、予備的及び大規模なスクリーニング設定を含む、活性TEを同定するためにバイオインフォマティクスパイプラインで使用できる特徴を識別するのに役立つ。
トランスポゾン組み込み部位で検索された組み込み部位は、最も活性の高い5つのTEの高度に好ましいTA標的部位ジヌクレオチドを明らかにする(
図13)。TEの標的部位ジヌクレオチドはTc/Marinerスーパーファミリーに属し、非常に保存的である。
図14A~18は、コンピュータで生成されたランダムデータと対照TE、piggyBACを比較することで、遺伝子と転写開始部位(TSS)までの距離、異なるクロマチン状態を含むゲノムの特徴に組み込まれた頻度を示している。データによると、最も活性の高い5つのTEは全て、遺伝子配列付近の組み込みに対する選好度が非常に低く、遺伝子とTSSの上下流配列に対する選好度がなかった。遺伝子発現レベルとクロマチン状態についても、活性の最も高い5つのTEはほぼランダムな組み込みパターンを示し、過剰な活性の発現領域に挿入されないことが多い。
【0260】
要約すると、これらのデータは、候補活性転移因子を識別するための確実なバイオインフォマティクスパイプラインの確立に成功したことと、同定されたTEの実験的検証に成功したことを示している。様々なTEの転移効率及び組み込みパターンは、これらのTEがゲノム工学的応用及び遺伝子治療に有用である可能性を示唆している。
【0261】
【0262】
【0263】
【0264】
【0265】
【0266】
【0267】
【0268】
【0269】
【0270】
【0271】
【0272】
【0273】
【0274】
【0275】
【0276】
【0277】
【0278】
【0279】
【0280】
【0281】
【0282】
【0283】
【0284】
【0285】
【0286】
【0287】
【0288】
【0289】
【0290】
【0291】
【0292】
【0293】
【0294】
【0295】
【0296】
[配列表]
SEQUENCE LISTING
<110> Institute of Zoology, Chinese Academy of Sciences
<120> ACTIVE DNA TRANSPOSON SYSTEMS AND METHODS FOR USE THEREOF
<130> 18245-20006.41
<150> PCT/CN2020/082087
<151> 2020-03-30
<160> 206
<170> FastSEQ for Windows Version 4.0
<210> 1
<211> 5
<212> DNA
<213> Anopheles gambiae
<400> 1
taggc 5
<210> 2
<211> 3
<212> DNA
<213> Anopheles gambiae
<400> 2
tag 3
<210> 3
<211> 201
<212> DNA
<213> Danio rerio
<400> 3
cagcggggaa aataagtatt tgacacatca gcatttttat cagtaagggg atttctaagt 60
gggctactga cacaaaattc ctaccagatg tagccatcaa gccaaatatt gaattcatac 120
aaagaaatca gaacatttaa gtatacaagt tgagtcataa taaataaagt gaaatgacac 180
agggaataag tattgaacac a 201
<210> 4
<400> 4
000
<210> 5
<211> 6
<212> DNA
<213> Xenopus tropicalis
<400> 5
cagggg 6
<210> 6
<211> 210
<212> DNA
<213> Xenopus tropicalis
<400> 6
cagtggagga aataattatt tgacccctca ctgattttgt aagtttgtcc aatgacaaag 60
aaatgaaaag tctcagaaca gtatcatttc aatggtaggt ttattttaac agtggcagat 120
agcacatcaa aaggaaaatc gaaaaaataa ctttaaataa aagatagcaa ctgatttgca 180
tttcattgag tgaaataagt ttttgaaccc 210
<210> 7
<211> 15
<212> DNA
<213> Danio rerio
<400> 7
caggggtggc gaacc 15
<210> 8
<211> 131
<212> DNA
<213> Takifugu rubripes
<400> 8
cagtgagagt aaaaagtatt tgatcccttg ctgattttgt tggtttgtcc actaataaag 60
acatgatcat tctatacttt taatggtaga tgtattctaa catggagaga cagaatatca 120
aaaagaaaat c 131
<210> 9
<211> 213
<212> DNA
<213> Xenopus tropicalis
<400> 9
caaaccggat tccaaaaaag ttgggacact aaacaaattg tgaataaaaa ctgaacgcaa 60
tgatgtggag gtgccaactt ctaatatttt attcagaata gaacataaat cacggaacaa 120
aagtttaaac tgagaaaatg taccatttta agggaaaaat atgttgattc agaatttcat 180
ggtgtcaaca aatcccaaaa aagttgggac aag 213
<210> 10
<211> 214
<212> DNA
<213> Xenopus tropicalis
<400> 10
cagtggcttg caaaagtatt cggccccctt gaacttttcc acattttgtc acattacagc 60
cacaaacatg aatcaatttt attggaattc cacgtgaaag accaatacaa agtggtgtac 120
acgtgagaag tggaacgaaa atcatacatg attccaaaca ttttttacaa ataaataact 180
gcaaagtggg gtgtgcgtaa ttattcagcc ccct 214
<210> 11
<211> 18
<212> DNA
<213> Anopheles gambiae
<400> 11
tacagtgtcg gacaaatc 18
<210> 12
<211> 63
<212> DNA
<213> Xenopus laevis
<400> 12
cagtggtgtg aaaaactatt tgcccccttc ctgatttctt attcttttgc atgtttgtca 60
cac 63
<210> 13
<211> 13
<212> DNA
<213> Anopheles gambiae
<400> 13
cactggtgga cat 13
<210> 14
<211> 8
<212> DNA
<213> Xenopus tropicalis
<400> 14
atatacac 8
<210> 15
<211> 16
<212> DNA
<213> Petromyzon marinus
<400> 15
caggggtcac caaact 16
<210> 16
<211> 129
<212> DNA
<213> Petromyzon marinus
<400> 16
cagtgaggga aaaaagtatt tgatcccctg ctgattttgt acgtttgccc actgacaaag 60
aaatgatcag tctataattt taatggtagg tttatttgaa cagtgagaga cagaataaca 120
acaacaaaa 129
<210> 17
<211> 5
<212> DNA
<213> Alligator mississippiensis
<400> 17
caggc 5
<210> 18
<211> 16
<212> DNA
<213> Myotis lucifugus
<400> 18
cagtgatggc gaacct 16
<210> 19
<211> 3
<212> DNA
<213> Petromyzon marinus
<400> 19
cag 3
<210> 20
<211> 157
<212> DNA
<213> Xenopus tropicalis
<400> 20
cagtggatat aaaaagtcta cacacccctg gtaaaatgtc aggttcctgt gctgtacaaa 60
aatgagacaa agataaatca tttcagaact ttttccacct ttaatgtgac ctataaactg 120
taccactcaa ttgaaaaaca aactgaaatc ttttagg 157
<210> 21
<211> 215
<212> DNA
<213> Xenopus tropicalis
<400> 21
cagtcatggc caaaattgtt ggcaccccag aaatttttcc agaaaatcaa gtatttctca 60
cagaaaagta ttgcagtaac acatgttttg ctatacacat gtttattccc tttgtgtgta 120
ttggaacaga acaaaaaagg gaggaaaaaa agcaaattgg acataatgtc acacaaaact 180
ccaaaaatgg gctggacaaa attattggca ccctt 215
<210> 22
<211> 204
<212> DNA
<213> Xenopus tropicalis
<400> 22
cagtgaggaa cataagtatt tgaacaccct gcgattttgc aagttctccc acttagaaat 60
catggagggg tctgaaattc acattgtagg tgcattccca ctgtgagaga cagcatttaa 120
aaaaaaaatt caggaaatca cattgtatga tttttaaaga atgtatttgt attgcactgc 180
tgcacataag tatttgaaca cctg 204
<210> 23
<211> 27
<212> DNA
<213> Xenopus tropicalis
<400> 23
cactgctcaa aaaaataaag ggaacac 27
<210> 24
<211> 29
<212> DNA
<213> Takifugu rubripes
<400> 24
cactgctcaa aaaaattaga ggaacactt 29
<210> 25
<211> 3
<212> DNA
<213> Xenopus tropicalis
<400> 25
tag 3
<210> 26
<211> 28
<212> DNA
<213> Xenopus tropicalis
<400> 26
ccgtattttc cgcactataa ggcgcacc 28
<210> 27
<211> 5
<212> DNA
<213> Anopheles gambiae
<400> 27
gccta 5
<210> 28
<211> 3
<212> DNA
<213> Anopheles gambiae
<400> 28
cta 3
<210> 29
<211> 201
<212> DNA
<213> Danio rerio
<400> 29
tgtgttcaat acttattccc tgtgtcattt cactttattt attatgactc aacttgtata 60
cttaaatgtt ctgatttctt tgtatgaatt caatatttgg cttgatggct acatctggta 120
ggaattttgt gtcagtagcc cacttagaaa tccccttact gataaaaatg ctgatgtgtc 180
aaatacttat tttccccgct g 201
<210> 30
<400> 30
000
<210> 31
<211> 6
<212> DNA
<213> Xenopus tropicalis
<400> 31
cccctg 6
<210> 32
<211> 210
<212> DNA
<213> Xenopus tropicalis
<400> 32
gggttcaaaa acttatttca ctcaatgaaa tgcaaatcag ttgctatctt ttatttaaag 60
ttattttttc gattttcctt ttgatgtgct atctgccact gttaaaataa acctaccatt 120
gaaatgatac tgttctgaga cttttcattt ctttgtcatt ggacaaactt acaaaatcag 180
tgaggggtca aataattatt tcctccactg 210
<210> 33
<211> 15
<212> DNA
<213> Danio rerio
<400> 33
ggttcgccac ccctg 15
<210> 34
<211> 131
<212> DNA
<213> Takifugu rubripes
<400> 34
gattttcttt ttgatattct gtctctccat gttagaatac atctaccatt aaaagtatag 60
aatgatcatg tctttattag tggacaaacc aacaaaatca gcaagggatc aaatactttt 120
tactctcact g 131
<210> 35
<211> 213
<212> DNA
<213> Xenopus tropicalis
<400> 35
cttgtcccaa cttttttggg atttgttgac accatgaaat tctgaatcaa catatttttc 60
ccttaaaatg gtacattttc tcagtttaaa cttttgttcc gtgatttatg ttctattctg 120
aataaaatat tagaagttgg cacctccaca tcattgcgtt cagtttttat tcacaatttg 180
tttagtgtcc caactttttt ggaatccggg ttg 213
<210> 36
<211> 214
<212> DNA
<213> Xenopus tropicalis
<400> 36
agggggctga ataattacgc acaccccact ttgcagttat ttatttgtaa aaaatgtttg 60
gaatcatgta tgattttcgt tccacttctc acgtgtacac cactttgtat tggtctttca 120
cgtggaattc caataaaatt gattcatgtt tgtggctgta atgtgacaaa atgtggaaaa 180
gttcaagggg gccgaatact tttgcaagcc actg 214
<210> 37
<211> 18
<212> DNA
<213> Anopheles gambiae
<400> 37
gatttgtccg acactgta 18
<210> 38
<211> 63
<212> DNA
<213> Xenopus laevis
<400> 38
gtgtgacaaa catgcaaaag aataagaaat caggaagggg gcaaatagtt tttcacacca 60
ctg 63
<210> 39
<211> 13
<212> DNA
<213> Anopheles gambiae
<400> 39
atgtccacca gtg 13
<210> 40
<211> 8
<212> DNA
<213> Xenopus tropicalis
<400> 40
gtgtatat 8
<210> 41
<211> 16
<212> DNA
<213> Petromyzon marinus
<400> 41
agtttggtga cccctg 16
<210> 42
<211> 129
<212> DNA
<213> Petromyzon marinus
<400> 42
ttttgttgtt gttattctgt ctctcactgt tcaaataaac ctaccattaa aattatagac 60
tgatcatttc tttgtcagtg ggcaaacgta caaaatcagc aggggatcaa atactttttt 120
ccctcactg 129
<210> 43
<211> 5
<212> DNA
<213> Alligator mississippiensis
<400> 43
gcctg 5
<210> 44
<211> 16
<212> DNA
<213> Myotis lucifugus
<400> 44
aggttcgcca tcactg 16
<210> 45
<211> 3
<212> DNA
<213> Petromyzon marinus
<400> 45
ctg 3
<210> 46
<211> 157
<212> DNA
<213> Xenopus tropicalis
<400> 46
cctaaaagat ttcagtttgt ttttcaattg agtggtacag tttataggtc acattaaagg 60
tggaaaaagt tctgaaatga tttatctttg tctcattttt gtacagcaca ggaacctgac 120
attttaccag gggtgtgtag actttttata tccactg 157
<210> 47
<211> 215
<212> DNA
<213> Xenopus tropicalis
<400> 47
aagggtgcca ataattttgt ccagcccatt tttggagttt tgtgtgacat tatgtccaat 60
ttgctttttt tcctcccttt tttgttctgt tccaatacac acaaagggaa taaacatgtg 120
tatagcaaaa catgtgttac tgcaatactt ttctgtgaga aatacttgat tttctggaaa 180
aatttctggg gtgccaacaa ttttggccat gactg 215
<210> 48
<211> 204
<212> DNA
<213> Xenopus tropicalis
<400> 48
caggtgttca aatacttatg tgcagcagtg caatacaaat acattcttta aaaatcatac 60
aatgtgattt cctgaatttt ttttttaaat gctgtctctc acagtgggaa tgcacctaca 120
atgtgaattt cagacccctc catgatttct aagtgggaga acttgcaaaa tcgcagggtg 180
ttcaaatact tatgttcctc actg 204
<210> 49
<211> 27
<212> DNA
<213> Xenopus tropicalis
<400> 49
gtgttccctt tatttttttg agcagtg 27
<210> 50
<211> 29
<212> DNA
<213> Takifugu rubripes
<400> 50
aagtgttcct ctaatttttt tgagcagtg 29
<210> 51
<211> 3
<212> DNA
<213> Xenopus tropicalis
<400> 51
cta 3
<210> 52
<211> 28
<212> DNA
<213> Xenopus tropicalis
<400> 52
ggtgcgcctt atagtgcgga aaatacgg 28
<210> 53
<211> 595
<212> PRT
<213> Anopheles gambiae
<400> 53
Met Ala Ser Asn Val Ala Thr Ser Ser Ser Ile Trp Asp His Phe Thr
1 5 10 15
Arg Asn Gly Thr Lys Ala Lys Cys Arg Tyr Cys Tyr Asn Glu Ile Ala
20 25 30
Phe Thr Lys Gly Ser Thr Ser Asn Leu Lys Arg His Met Lys Ala Lys
35 40 45
His Pro Ser Ile Ser Leu Glu Arg Gln His Leu Ala Ser Thr Thr Ser
50 55 60
Pro Ser Thr Gln Asn Ser Glu Pro Gly Pro Ser Cys Ser Ser Arg Pro
65 70 75 80
Pro Asn Leu Ile Ser Asn Phe Phe Lys Gln Pro Met Asn Ser Glu Thr
85 90 95
Lys Arg Lys Leu Asp Met Met Leu Leu Lys Leu Ile Cys Lys Asp Cys
100 105 110
Leu Pro Leu Ser Ile Val Glu Ser Glu Ala Phe Lys Thr Phe Val Gly
115 120 125
Cys Leu Asn Gln Asn Tyr Asp Leu Pro Thr Arg Lys Asn Val Ser Asn
130 135 140
Ala Leu Leu Pro Ser Ile Tyr Asn Glu Ile Leu Val Lys Val Gln Gly
145 150 155 160
Glu Val Arg Asn Ala Thr Ser Ile Ala Leu Thr Thr Asp Gly Trp Thr
165 170 175
Asn Val Asn Asn Thr Ser Phe Leu Gly Leu Thr Ala His Phe Ile Asp
180 185 190
Asn Asp Tyr Lys Leu Arg Ser Cys Leu Leu Glu Cys Ser Glu Ile Ser
195 200 205
Leu Ser His Ser Gly Gln Asn Ile Ala Ala Trp Ile Lys Glu Val Ile
210 215 220
Ile Lys Tyr Glu Ile Gln Asp Lys Ile Val Gly Ile Val Thr Asp Asn
225 230 235 240
Ala Ala Asn Met Lys Ser Ala Ala Arg Glu Leu Glu Phe Asn His Val
245 250 255
Thr Cys Phe Ala His Ser Leu His Leu Ile Val Lys Asp Ala Ile Lys
260 265 270
Lys Ser Ile Ile Ser Thr Val Asp Glu Val Lys Arg Ile Val Met Tyr
275 280 285
Phe Lys Lys Ser Pro Lys Ala Thr Asn Glu Leu Ala Asp Thr Gln Ser
290 295 300
Lys Phe Asn Leu Pro Asn Leu Lys Leu Lys Gln Asp Val Pro Thr Arg
305 310 315 320
Trp Asn Ser Thr Tyr Asp Met Leu Asn Arg Phe Tyr Lys Asn Lys Ile
325 330 335
Ala Ile Val Ala Cys Ala Asp Lys Leu Asn Thr Leu Asp Pro Ile Lys
340 345 350
Ile Asp Trp Ala Ile Leu Glu His Ser Leu Asn Ala Leu Lys Ile Phe
355 360 365
Asp Val Ala Thr Asn Met Val Ser Ala Glu Lys Asn Ile Thr Val Ser
370 375 380
His Val Gly Leu Leu Ser Lys Met Ile Ile Arg Lys Leu Asn Glu Thr
385 390 395 400
Asp Tyr Thr Ile Pro Glu Leu Gly Asn Leu Val Thr His Leu Lys Glu
405 410 415
Gly Val Lys Lys Arg Leu Glu Ile Tyr Ser Asn Asn Gln Ile Ile Ala
420 425 430
Lys Ser Met Leu Leu Asp Pro Arg Ile Lys Lys Gln Gly Phe His Glu
435 440 445
Glu Pro Leu Lys Tyr Arg Glu Thr Tyr Glu Leu Ile Ile Gln Glu Leu
450 455 460
Ile Pro Phe Gln Thr Pro Ser Met Asn Ala Gln Glu Pro His Asn Ile
465 470 475 480
Asp Asn Glu Ala Asn Leu Leu Leu Gly Glu Phe Ile Thr Trp Val Asn
485 490 495
Asn Ala Glu Cys Glu Ile Glu Ser Pro Ile Glu Leu Ala Lys Asn Glu
500 505 510
Leu Asn Ser Phe Leu Lys Ile Arg Asn Ile Asp Ile Lys Asn Asp Pro
515 520 525
Leu Glu Trp Trp Arg Ile His Ser Ser Lys Tyr Pro Ser Ile Tyr Ala
530 535 540
Leu Ala Lys Thr Ile Ile Cys Ile Pro Gly Thr Ser Val Pro Cys Glu
545 550 555 560
Arg Leu Phe Ser Lys Ala Gly Gln Ile Tyr Ser Asp Lys Arg Ser Arg
565 570 575
Leu His Pro Lys Lys Phe Lys Glu Ile Ile Phe Ile Gln Gln Asn Val
580 585 590
Asp Lys Phe
595
<210> 54
<211> 603
<212> PRT
<213> Anopheles gambiae
<400> 54
Met Met Ala Pro Thr Asn Ala Thr Thr Ser Pro Val Trp Asp His Phe
1 5 10 15
Ser Pro Val Glu Thr Gly Ala Lys Cys Leu Tyr Cys Leu Lys Val Phe
20 25 30
Lys Tyr Thr Lys Gly Thr Thr Ser Asn Leu Lys Arg His Leu Asn Leu
35 40 45
Val His Lys Thr Val Pro Tyr Leu Lys Gln Lys Gln Pro Ile Pro Gln
50 55 60
Thr Ile Asn Ile Asp Asp Glu Ala Gly Pro Ser Ala Val Asn Phe Gln
65 70 75 80
Pro Ser Asn Gln Tyr Phe Asn Ser Asn Met Ser Ile Gln Gly Tyr Leu
85 90 95
Lys Lys Pro Ile Asn Ser Glu Thr Lys Lys Val Leu Asp Arg Met Leu
100 105 110
Leu Asp Leu Ile Cys Lys Glu Cys Leu Pro Phe Asn Leu Val Glu Ser
115 120 125
Glu Ile Phe Lys Lys Phe Val Tyr Thr Leu Asn Pro Asn Tyr Ile Met
130 135 140
Pro Thr Arg Lys Ser Leu Ser Asn Ala Leu Leu Pro Ser Val Tyr Asn
145 150 155 160
Gln Glu Phe Glu Lys Ala Lys Glu Lys Leu Ser Thr Ala Lys Ala Ile
165 170 175
Ala Ile Thr Ser Asp Gly Trp Thr Asn Leu Asn Gln Ile Ser Phe Phe
180 185 190
Ala Leu Thr Gly His Tyr Ile Asp Glu Asn Cys Lys Leu Ser Ser Ile
195 200 205
Leu Ile Glu Cys Ser Glu Phe Glu Asn Pro His Ser Gly Arg Asn Ile
210 215 220
Ala Asn Trp Ile Gln Gly Thr Leu Asn Lys Phe Asp Ile Glu Asp Lys
225 230 235 240
Ile Val Ala Met Val Thr Asp Asn Ala Ser Asn Met Lys Ala Ala Ser
245 250 255
Thr Glu Leu Asn Phe Cys His Ile Pro Cys Phe Ala His Thr Leu Asn
260 265 270
Leu Ile Val Arg Asp Ala Ile Lys Lys Ser Val Leu Pro Val Val Glu
275 280 285
Glu Val Lys Arg Val Val Met Leu Phe Lys Lys Ser Pro Lys Ala Ser
290 295 300
Gln Met Leu Ala Asp Thr Gln Lys Lys Leu Asn Leu Asp Gln Leu Lys
305 310 315 320
Met Ile Gln Glu Val Ser Thr Arg Trp Asn Ser Gly Tyr Asp Met Leu
325 330 335
Asn Arg Phe Tyr Lys Asn Lys Ile Ala Leu Leu Ser Cys Ala Asp Ser
340 345 350
Leu Lys Met Lys Ile Ser Leu Glu Ser His Asp Trp Glu Ala Ile Glu
355 360 365
Gln Ile Val Arg Val Leu Lys Tyr Phe Tyr Ser Ala Thr Asn Ile Val
370 375 380
Ser Ala Gln Lys Tyr Ile Thr Ile Ser His Val Gly Leu Leu Cys Asn
385 390 395 400
Val Leu Leu Thr Lys Thr Ser Gln Phe Arg Asn Asp Glu Asp Ile Ala
405 410 415
Glu Asn Ile Gln Asn Leu Val Ala Leu Leu Ile Glu Gly Leu Gln Asn
420 425 430
Lys Leu Lys Ile Tyr Arg Ser Asn Glu Gln Ile Leu Lys Ser Met Ile
435 440 445
Leu Asp Pro Arg Ile Lys Gln Leu Gly Phe Gln Asp Asp Val Glu Lys
450 455 460
Phe Lys Asn Ile Cys Glu Ser Ile Ile Ser Glu Leu Leu Pro Leu Gln
465 470 475 480
Lys Pro Ala Val Glu Val Glu Lys Val Val Lys Lys Val Ser Lys Asp
485 490 495
Val Asp Met Leu Phe Gly Asp Leu Leu Lys Asn Lys Gly Ala Gln Asn
500 505 510
Tyr Lys Thr Pro Arg Gln Ile Ala Glu Asn Glu Leu His Gln Tyr Leu
515 520 525
Ser Val Glu Asn Ile Asp Leu Glu Asn Asp Pro Leu Leu Trp Trp Lys
530 535 540
Glu His Gln Val Leu Tyr Pro Ser Leu Tyr Thr Leu Ala Met Ser Thr
545 550 555 560
Leu Cys Ile Pro Gly Thr Ser Val Pro Cys Glu Arg Leu Phe Ser Lys
565 570 575
Ala Gly Gln Ile Tyr Ser Glu Lys Arg Ser Arg Leu Ala Pro Lys Lys
580 585 590
Leu Gln Glu Ile Leu Phe Ile Gln Gln Asn Ala
595 600
<210> 55
<211> 341
<212> PRT
<213> Danio rerio
<400> 55
Met Met Gly Lys Asn Lys Glu Leu Ser Gln Asp Leu Arg Ser Leu Ile
1 5 10 15
Val Glu Lys His Phe Asp Gly Asn Gly Tyr Arg Arg Ile Ser Arg Met
20 25 30
Leu Asn Val Pro Val Ser Thr Val Gly Ala Ile Ile Arg Lys Trp Lys
35 40 45
Lys His Lys Phe Thr Ile Asn Arg Pro Arg Ser Gly Ala Pro Arg Lys
50 55 60
Ile Pro Val Arg Gly Val Gln Arg Ile Ile Arg Arg Val Leu Gln Glu
65 70 75 80
Pro Arg Thr Thr Arg Ala Glu Leu Gln Glu Asp Leu Ala Ser Ala Gly
85 90 95
Thr Ile Val Ser Lys Lys Thr Ile Ser Asn Ala Leu Asn His His Gly
100 105 110
Ile His Ala Arg Ser Pro Arg Lys Thr Pro Leu Leu Asn Lys Lys His
115 120 125
Val Glu Ala Arg Leu Lys Phe Ala Lys Gln His Leu Glu Lys Pro Val
130 135 140
Asp Tyr Trp Glu Thr Ile Val Trp Ser Asp Glu Ser Lys Ile Glu Leu
145 150 155 160
Phe Gly Ser His Ser Thr His His Val Trp Arg Arg Asn Gly Thr Ala
165 170 175
His His Pro Lys Asn Thr Ile Pro Thr Val Lys Phe Gly Gly Gly Ser
180 185 190
Ile Met Val Trp Gly Cys Phe Ser Ala Arg Gly Thr Gly Arg Leu His
195 200 205
Ile Ile Glu Gly Arg Met Asn Gly Glu Met Tyr Arg Asp Ile Leu Asp
210 215 220
Lys Asn Leu Leu Pro Ser Thr Arg Lys Leu Lys Met Lys Arg Gly Trp
225 230 235 240
Thr Phe Gln Gln Asp Asn Asp Pro Lys His Lys Ala Lys Glu Thr Met
245 250 255
Lys Trp Phe Gln Arg Lys Lys Ile Lys Leu Leu Glu Trp Pro Ser Gln
260 265 270
Ser Pro Asp Leu Asn Pro Ile Glu Asn Leu Trp Arg Glu Leu Lys Ile
275 280 285
Lys Val His Lys Arg Gly Pro Arg Asn Leu Gln Asp Leu Lys Thr Val
290 295 300
Cys Val Glu Glu Trp Ala Arg Ile Thr Pro Glu Gln Cys Arg Arg Leu
305 310 315 320
Val Ser Pro Tyr Lys Arg Arg Leu Glu Ala Val Ile Thr Asn Lys Gly
325 330 335
Phe Ser Thr Lys Tyr
340
<210> 56
<211> 645
<212> PRT
<213> Petromyzon marinus
<400> 56
Met Ala Lys Arg Lys Lys Asp Asp Glu Tyr Arg Thr Phe Gln Asp Glu
1 5 10 15
Trp Thr Glu Glu Phe Ala Phe Val Glu Arg Ala Gly Ser Ala Val Cys
20 25 30
Leu Ile Cys Asn Asp Lys Ile Thr Ser Leu Lys Arg Ser Asn Val Lys
35 40 45
Arg His Phe Asp Thr Arg His Ala Thr Phe Ala Ser Lys Tyr Pro Ala
50 55 60
Gly Asp Ser Arg Lys Lys Ala Cys Gln Glu Leu Leu Ser Arg Val Gln
65 70 75 80
Ala Ser Gln Gln Gln Leu Arg Val Trp Thr Arg Gln Gly Asp Tyr Asn
85 90 95
Ser Ala Ser Phe Ala Gly Ser Leu Ala Ile Val Arg Asn Gly Lys Pro
100 105 110
Phe Thr Asp Gly Glu Tyr Ala Lys Thr Phe Met Leu Asp Val Ala Asn
115 120 125
Glu Leu Phe Asp Asp Leu Pro Asn Lys Asp Lys Ile Ile Lys Arg Ile
130 135 140
Gln Asp Met Pro Leu Ser Ala Arg Thr Val His Asp Arg Thr Ile Val
145 150 155 160
Met Ala Asn Lys Val Glu Glu Thr Gln Val Lys Asp Ile Asn Ala Ala
165 170 175
Pro Phe Phe Ser Leu Ala Leu Asp Glu Ser Thr Asp Val Ser His Leu
180 185 190
Ser Gln Phe Ser Val Ile Ala Arg Tyr Ala Val Gly Asp Thr Leu Arg
195 200 205
Glu Glu Ser Leu Ala Val Leu Pro Leu Lys Gly Ser Thr Arg Gly Glu
210 215 220
Asp Leu Phe Lys Ser Phe Met Glu Phe Ala Gln Glu Lys Ser Leu Pro
225 230 235 240
Met Asp Lys Leu Leu Ser Val Cys Thr Asp Gly Ala Pro Cys Met Val
245 250 255
Gly Lys Asn Lys Gly Phe Val Ala Leu Leu Arg Glu His Glu Asn Arg
260 265 270
Pro Ile Leu Ser Phe His Cys Ile Ile His Gln Glu Ala Leu Cys Ala
275 280 285
Gln Met Cys Asp Arg Gln Phe Gly Glu Val Met Ser Leu Val Ile Arg
290 295 300
Val Ile Asn Phe Ile Val Ala Arg Ala Leu Asn Asp Arg Gln Phe Lys
305 310 315 320
Thr Leu Leu Asp Glu Val Val Asn Asn Tyr Pro Gly Leu Leu Leu His
325 330 335
Ser Asn Val Arg Trp Leu Ser Arg Gly Lys Val Leu Ser Arg Phe Ala
340 345 350
Ala Cys Leu Asn Glu Ile Arg Thr Phe Leu Glu Met Lys Gly Val Gly
355 360 365
His Pro Glu Leu Ala Asp Thr Glu Trp Leu Leu Lys Phe Tyr Tyr Leu
370 375 380
Val Asp Leu Thr Glu His Leu Asn Gln Leu Asn Val Lys Met Gln Gly
385 390 395 400
Ile Gly Asn Thr Val Leu Ser Leu Gln Gln Ala Val Phe Ala Phe Glu
405 410 415
Asn Lys Leu Glu Leu Phe Ile Thr Asp Leu Glu Thr Gly Arg Leu Leu
420 425 430
His Phe Glu Lys Leu Ser Gln Phe Lys Asp Ala Cys Thr Ala Ser Glu
435 440 445
Pro Ile Gln Asn Leu Asp Leu His Gln Leu Ala Gly Cys Thr Ser Ser
450 455 460
Leu Leu Gln Ser Phe Lys Ala Arg Phe Gly Glu Phe Arg Glu His Thr
465 470 475 480
Arg Leu Phe Lys Phe Ile Thr His Pro Asn Glu Cys Ser Leu Asn Thr
485 490 495
Ala Asp Leu Asn Tyr Ile Pro Gly Val Ser Val Arg Asp Phe Glu Ala
500 505 510
Glu Val Ala Asp Leu Lys Ala Ser Asp Met Trp Val Asn Lys Phe Lys
515 520 525
Ser Leu Asn Glu Asp Leu Glu Arg Ile Thr Arg Gln Lys Ala Glu Leu
530 535 540
Ala Ser Lys His Met Trp Thr Glu Met Lys Lys Leu Gln Pro Glu Asp
545 550 555 560
Gln Leu Ile Leu Lys Thr Trp Asn Ala Leu Pro Val Thr Tyr His Thr
565 570 575
Leu Gln Arg Val Ser Ile Ala Val Leu Thr Met Phe Gly Ser Thr Tyr
580 585 590
Ala Cys Glu Gln Ser Phe Ser His Leu Lys Asn Ile Lys Ser Asn Leu
595 600 605
Arg Ser Arg Leu Thr Asp Glu Ser Leu Asn Ala Cys Met Lys Leu Asn
610 615 620
Leu Thr Lys Tyr Gln Pro Asp Tyr Lys Asp Ile Ser Lys Ser Met Gln
625 630 635 640
His Gln Lys Ser His
645
<210> 57
<211> 612
<212> PRT
<213> Xenopus tropicalis
<400> 57
Met Thr Ser Ser Gln Pro Ala Val Lys Arg Lys Ile Asp Asp Glu His
1 5 10 15
Arg Gln Phe Gln Glu Lys Trp Glu Met Gln Tyr Phe Phe Val Glu His
20 25 30
Arg Gly Ile Pro Thr Cys Leu Ile Cys Ala Glu Lys Val Ala Val His
35 40 45
Lys Glu Tyr Asn Leu Lys Arg His Tyr Ser Thr Lys His Ala Glu Glu
50 55 60
Cys Ala Lys Tyr Gln Gly Asp Glu Arg Ala Lys Arg Val Ala Ser Leu
65 70 75 80
Lys Ala Cys Leu Met Arg Gln Gln Asp Phe Phe Lys Lys Ala Thr Lys
85 90 95
Glu Asn Val Ala Ser Val Gln Ala Ser Tyr Met Val Ser Glu Met Ile
100 105 110
Ala Lys Ala Gly Lys Pro Phe Thr Glu Gly Glu Phe Val Lys Lys Cys
115 120 125
Met Leu Gln Val Ala Ser Ile Ile Cys Pro Glu Lys Lys Gly Gln Phe
130 135 140
Ser Lys Ile Ser Leu Ser Ala Asn Thr Val Ala Glu Arg Ile Ser Asp
145 150 155 160
Met Ser Ser Asp Ile Tyr His Gln Leu Cys Glu Lys Ala Lys Cys Phe
165 170 175
Asp Ala Tyr Ser Val Ala Leu Asp Glu Ser Thr Asp Ile Thr Gly Thr
180 185 190
Ala Gln Leu Thr Ile Tyr Val Arg Gly Val Asp Cys Asn Phe Glu Leu
195 200 205
Thr Glu Glu Leu Leu Thr Ile Ile Pro Met His Gly Gln Thr Thr Ala
210 215 220
Asn Glu Ile Phe His His Leu Cys Asp Ala Ile Glu Asn Ala Gly Leu
225 230 235 240
Pro Trp Lys Arg Phe Val Gly Ile Ile Thr Asp Gly Ala Pro Ser Met
245 250 255
Thr Gly Arg Lys Asn Gly Leu Val Ala Leu Val Lys Lys Lys Leu Glu
260 265 270
Glu Glu Gly Ile Glu Glu Glu Ala Ile Ala Leu His Cys Ile Ile His
275 280 285
Gln Gln Ala Leu Cys Ser Lys Cys Leu Pro Cys Asp Asn Val Met Ser
290 295 300
Val Val Val Lys Cys Val Asn Gln Ile Arg Ser Arg Gly Leu Thr His
305 310 315 320
Arg Arg Phe Arg Ala Phe Leu Glu Glu Met Gly Ser Glu Tyr Gly Asp
325 330 335
Val Leu Tyr Phe Thr Glu Val Arg Trp Leu Ser Arg Gly Asn Val Leu
340 345 350
Lys Arg Phe Phe Glu Leu Arg Glu Glu Val Lys Ala Phe Met Glu Lys
355 360 365
Asn Gly Lys Ala Val Ser Glu Leu Ser Asp His Lys Trp Leu Met Asp
370 375 380
Leu Ala Phe Leu Val Asp Ile Thr Gln Arg Leu Asn Val Leu Asn Lys
385 390 395 400
Met Leu Gln Gly Gln Gly Gln Leu Val Ser Ala Ala Tyr Asp Asn Val
405 410 415
Arg Ala Phe Ser Thr Lys Leu Val Leu Trp Lys Ser Gln Leu Ser Gln
420 425 430
Thr Asn Leu Cys His Phe Pro Ala Cys Lys Glu Leu Val Asp Ala Gly
435 440 445
Ile Pro Phe Ser Gly Glu Lys Tyr Val Asp Ala Ile Phe Lys Leu Glu
450 455 460
Lys Glu Phe Asp His Arg Phe Ala Asp Phe Lys Thr His Arg Ala Thr
465 470 475 480
Phe Gln Ile Phe Val Asp Pro Phe Ser Phe Asp Val Gln Asp Ala Pro
485 490 495
Pro Val Leu Gln Met Glu Leu Ile Asp Leu Gln Cys Asn Ser Asp Ile
500 505 510
Lys Ala Lys Phe Arg Glu Met Ser Gly Lys Ala Asp Thr His Val Gln
515 520 525
Phe Leu Arg Glu Leu Pro Pro Ser Phe Pro Glu Leu Ser Arg Met Phe
530 535 540
Lys Arg Thr Met Cys Leu Phe Gly Ser Thr Tyr Leu Cys Glu Lys Leu
545 550 555 560
Phe Ser Thr Leu Asn Phe Asn Lys Ser Lys Tyr Arg Ser Arg Leu Asn
565 570 575
Asp Asp His Leu Gln Ala Ile Leu Arg Val Ser Thr Ala Ser Ser Leu
580 585 590
Lys Pro Asn Val Val Gln Ile Cys Glu Lys Lys Arg Cys Gln Val Ser
595 600 605
Gly Ser Lys Glu
610
<210> 58
<211> 340
<212> PRT
<213> Xenopus tropicalis
<400> 58
Met Gly Lys Thr Lys Glu Leu Ser Lys Asp Val Arg Asp Lys Ile Val
1 5 10 15
Asp Leu His Lys Ala Gly Met Gly Tyr Lys Thr Ile Ser Lys Lys Leu
20 25 30
Gly Glu Lys Val Thr Thr Val Gly Ala Ile Val Arg Lys Trp Lys Glu
35 40 45
His Lys Met Thr Ile Asn Arg Pro Arg Ser Gly Ala Pro Arg Lys Ile
50 55 60
Ser Pro Arg Gly Val Ser Met Ile Leu Arg Lys Val Lys Lys His Pro
65 70 75 80
Arg Thr Thr Arg Glu Glu Leu Val Asn Asp Leu Lys Leu Ala Gly Thr
85 90 95
Thr Val Thr Lys Lys Thr Ile Gly Asn Thr Leu His Arg Asn Gly Leu
100 105 110
Lys Ser Cys Arg Ala Arg Lys Val Pro Leu Leu Lys Lys Ala His Val
115 120 125
Gln Ala Arg Leu Lys Phe Ala Asn Glu His Leu Asn Asp Ser Val Ser
130 135 140
Asp Trp Glu Lys Val Leu Trp Ser Asp Glu Thr Lys Ile Glu Leu Phe
145 150 155 160
Gly Ile Asn Ser Thr Arg Cys Val Trp Arg Lys Lys Asn Ala Ala Tyr
165 170 175
Asp Pro Gln Asn Thr Val Pro Thr Val Lys His Gly Gly Gly Asn Ile
180 185 190
Leu Leu Trp Gly Cys Phe Ser Ala Lys Gly Thr Gly Gln Leu Ile Arg
195 200 205
Ile Asn Gly Lys Met Asp Gly Ala Met Tyr Arg Glu Ile Leu Asn Asp
210 215 220
Asn Leu Leu Pro Ser Ala Arg Lys Leu Lys Met Gly Arg Gly Trp Val
225 230 235 240
Phe Gln His Asp Asn Asp Pro Lys His Thr Ala Lys Ala Thr Lys Glu
245 250 255
Trp Leu Lys Lys Lys His Ile Lys Val Met Glu Trp Pro Ser Gln Ser
260 265 270
Pro Asp Leu Asn Pro Ile Glu Asn Leu Trp Arg Glu Leu Lys Leu Arg
275 280 285
Val Ala Gln Arg Gln Pro Arg Asn Leu Arg Asp Leu Glu Met Ile Cys
290 295 300
Lys Glu Glu Trp Thr Asn Ile Pro Pro Lys Met Cys Ala Asn Leu Val
305 310 315 320
Ile Asn Tyr Lys Lys Arg Leu Thr Ser Val Leu Ala Asn Lys Gly Phe
325 330 335
Ser Thr Lys Tyr
340
<210> 59
<211> 616
<212> PRT
<213> Danio rerio
<400> 59
Met Ala Glu Ser Gly Lys Arg Thr Ala Lys Arg Lys Tyr Glu Asp Glu
1 5 10 15
Arg Arg Thr Phe Leu Ser Glu Trp Glu Asp Leu Tyr Phe Phe Val Glu
20 25 30
Arg Asn Gly Lys Pro Phe Cys Leu Ile Cys Gln Thr Ser Leu Ser His
35 40 45
Phe Lys Ala Ser Asn Leu Glu Arg His Phe Thr Ser Leu His Ser Ala
50 55 60
Val Ala Arg Glu Phe Pro Lys Gly Ser Glu Leu Arg Lys His Lys Val
65 70 75 80
Lys Thr Leu Lys Gly Gln Ala Glu Lys Gln Thr Gln Leu Phe Arg Lys
85 90 95
Phe Thr Lys His Ser Glu Thr Val Thr Leu Ala Ser Tyr Gln Leu Ala
100 105 110
Trp Asn Ile Ala Arg Ala Lys Lys Pro Tyr Leu Glu Gly Glu Phe Val
115 120 125
Lys Lys Cys Leu Ser Asp Ala Val Ala Ile Leu Cys Pro Glu Asn Glu
130 135 140
Asn Leu Lys Arg Ser Val Lys Asp Leu Gln Leu Ser Arg His Thr Val
145 150 155 160
Glu Gln Arg Ile Ser Asp Ile Asp Asn Ser Val Glu Thr His Leu Leu
165 170 175
Ser Asp Leu Gln Lys Cys Gln Tyr Phe Ser Ile Ala Leu Asp Glu Ser
180 185 190
Cys Asp Val Gln Asp Lys Pro Gln Leu Ala Ile Phe Val Arg Phe Val
195 200 205
Ser Glu Asp Cys Thr Ile Arg Glu Glu Leu Leu Asp Ile Val Pro Leu
210 215 220
Lys Asp Arg Thr Arg Gly Ile Asp Leu Lys Glu Thr Leu Met Thr Val
225 230 235 240
Val Glu Lys Ala Asn Leu Gln Leu Ser Lys Leu Thr Ala Ile Val Thr
245 250 255
Asp Gly Ala Pro Ala Met Leu Gly Ser Glu Arg Gly Leu Val Gly Leu
260 265 270
Cys Lys Ala Asp Asp Arg Phe Pro Ala Phe Trp Thr Phe His Cys Ile
275 280 285
Ile His Gln Glu His Leu Val Ser Lys Lys Leu Asn Leu Asp His Ile
290 295 300
Met Lys Pro Val Leu Glu Ile Val Asn Phe Val Arg Thr His Ala Leu
305 310 315 320
Asn His Arg Gln Phe Lys Asn Leu Ile Asp Glu Leu Asp Glu Asp Leu
325 330 335
Pro Ser Asp Leu Leu Phe His Cys Ala Val Arg Trp Leu Ser Arg Gly
340 345 350
His Val Leu Ser Arg Phe Phe Glu Leu Leu Asn Pro Val Lys Leu Phe
355 360 365
Leu Ala Glu Lys His Lys Glu Tyr Pro Glu Leu His Asp Pro Gln Trp
370 375 380
Ile Ser Asp Leu Ala Phe Leu Val Asp Val Leu His Tyr Leu Asn Gly
385 390 395 400
Leu Asn Val Asp Leu Gln Gly Lys Leu Lys Met Leu Pro Asp Leu Val
405 410 415
Gln Ser Val Phe Ala Phe Val Asn Lys Leu Lys Leu Phe Lys Thr His
420 425 430
Leu Gln Lys Arg Asp Tyr Thr His Phe Pro Thr Leu Leu Lys Ala Ser
435 440 445
Gly Gln Glu Ala Glu Val Val Lys Gly Ser Thr Ala Arg Tyr Ala Thr
450 455 460
Leu Leu Glu Asn Leu Glu Gln Ser Phe Glu Glu Arg Phe Ser Asn Leu
465 470 475 480
Arg Gln Lys Arg Gln Gln Ile Thr Phe Leu Ile Asn Pro Phe Thr Ala
485 490 495
Glu Ser Gly Cys Leu Lys Ala Pro Leu Val Glu Asp Glu Ala Ala Ser
500 505 510
Gln Leu Glu Met Ile Glu Leu Ser Glu Asp Asp Arg Leu Lys Ser Val
515 520 525
Leu Arg Glu Gly Thr Val Glu Phe Trp Lys Ile Val Pro Val Glu Arg
530 535 540
Tyr Pro Asn Val Lys Gln Ala Ala Leu Lys Leu Leu Ser Met Phe Gly
545 550 555 560
Ser Thr Tyr Val Cys Glu Ser Leu Phe Ser Thr Leu Lys Leu Val Lys
565 570 575
Ser Lys His Arg Ser Val Leu Thr Asp Thr His Val Lys Glu Leu Leu
580 585 590
Arg Val Ala Thr Thr Glu Tyr Glu Pro Asp Leu Lys Lys Ile Val Glu
595 600 605
Thr Lys Glu Cys Gln Val Ser His
610 615
<210> 60
<211> 340
<212> PRT
<213> Takifugu rubripes
<400> 60
Met Gly Lys Thr Lys Glu Leu Ser Gln Asp Leu Arg Asp Arg Ile Val
1 5 10 15
Asp Leu His Lys Ser Gly Met Gly Tyr Lys Asn Ile Ser Lys Leu Leu
20 25 30
Gly Ile Lys Val Thr Thr Ile Gly Ala Ile Val Arg Lys Phe Lys Lys
35 40 45
Tyr Asn Met Thr Ile Asn Arg Pro Arg Ser Gly Ala Pro Gln Lys Ile
50 55 60
Ser Pro Arg Gly Val Ala Met Ile Met Arg Thr Val Arg Asn Arg Pro
65 70 75 80
Ala Thr Thr Gln Gln Glu Leu Val Asn Asp Leu Gln Ala Ala Gly Thr
85 90 95
Lys Val Thr Arg Lys Thr Ile Gly Asn Thr Leu Arg Arg Asn Gly Leu
100 105 110
Lys Ser Cys Ser Ala Arg Lys Val Pro Leu Leu Lys Lys Ala His Val
115 120 125
Glu Ala Arg Leu Lys Tyr Ala Asn Asp His Leu Lys Asp Ala Gln Ser
130 135 140
Asp Trp Glu Lys Val Leu Trp Ser Asp Glu Thr Lys Ile Glu Leu Phe
145 150 155 160
Gly Leu Asn Ser Thr Arg His Val Trp Arg Lys Lys Asn Ala Ala Tyr
165 170 175
Asp Pro Arg Asn Thr Val Pro Thr Val Lys His Gly Gly Gly Asn Ile
180 185 190
Met Phe Trp Gly Cys Phe Ser Ala Lys Gly Thr Gly Leu Leu His Arg
195 200 205
Ile Thr Gly Lys Met Asp Gly Ala Met Tyr Arg Ala Val Leu Arg Asp
210 215 220
Asn Leu Leu Pro Ser Ala Arg Lys Leu Lys Met Gly Arg Gly Trp Val
225 230 235 240
Phe Gln His Asp Asn Asp Pro Lys His Thr Ala Lys Ala Thr Lys Glu
245 250 255
Trp Leu Lys Lys Asn His Ile Lys Val Met Glu Trp Pro Ser Gln Ser
260 265 270
Pro Asp Leu Asn Pro Ile Glu Asn Leu Trp Arg Glu Leu Lys Val Arg
275 280 285
Val Ala Lys Arg Gln Pro Thr Asn Leu Asn Asp Leu Glu Arg Ile Cys
290 295 300
Lys Glu Glu Trp Ala Lys Ile Pro Pro Asp Met Cys Ala Asn Leu Val
305 310 315 320
Val Asn Tyr Asn Lys Arg Leu Thr Ala Val Leu Ala Asn Asn Gly Phe
325 330 335
Ala Thr Lys Tyr
340
<210> 61
<211> 358
<212> PRT
<213> Xenopus tropicalis
<400> 61
Met Ile Gly Tyr Lys Lys Ser Phe Ser Glu Trp Gln Cys Leu Ser Glu
1 5 10 15
Ala Lys Met Gly Arg Gly Ser Pro Ile Pro Thr Met Leu Arg Arg Lys
20 25 30
Ile Val Glu Gln Tyr Gln Lys Gly Val Thr Gln Arg Lys Ile Ala Lys
35 40 45
Ile Leu His Leu Ser Ser Ser Thr Val His Asn Ile Ile Arg Arg Phe
50 55 60
Arg Glu Ser Gly Thr Ile Ser Val Arg Lys Gly Gln Gly Arg Lys Thr
65 70 75 80
Ile Leu Asp Ala Arg Asp Leu Arg Ala Leu Lys Arg His Cys Thr Thr
85 90 95
Asn Arg Asn Ala Thr Val Lys Glu Ile Thr Glu Trp Ala Gln Glu Tyr
100 105 110
Phe Gln Lys Pro Leu Ser Val Asn Thr Ile His Arg Ala Ile Arg Arg
115 120 125
Cys Gln Leu Lys Leu Tyr Ser Ala Lys Lys Lys Pro Phe Leu Ser Lys
130 135 140
Ile His Lys Leu Arg Arg Phe His Trp Ala Arg Asp His Leu Lys Trp
145 150 155 160
Ser Val Ala Lys Trp Lys Thr Val Leu Trp Ser Asp Glu Ser Arg Phe
165 170 175
Glu Val Leu Phe Gly Asn Leu Gly Arg His Val Ile Arg Thr Lys Glu
180 185 190
Asp Lys Asp Asn Pro Ser Cys Tyr Gln Arg Ser Val Gln Lys Pro Ala
195 200 205
Ser Leu Met Val Trp Gly Cys Met Ser Ala Cys Gly Met Gly Ser Leu
210 215 220
His Val Trp Lys Gly Ser Ile Asn Ala Glu Lys Tyr Ile Gln Val Leu
225 230 235 240
Glu Gln His Met Leu Pro Ser Arg Arg His Leu Phe Gln Gly Arg Pro
245 250 255
Cys Ile Phe Gln Gln Asp Asn Ala Arg Pro His Ser Ala Ser Ile Thr
260 265 270
Thr Ser Trp Leu Arg Arg Arg Arg Ile Arg Val Leu Lys Trp Pro Val
275 280 285
Cys Ser Pro Asp Leu Ser Pro Ile Glu Asn Ile Trp Arg Ile Ile Lys
290 295 300
Arg Lys Val Arg Gln Arg Arg Pro Lys Thr Ile Glu Gln Leu Glu Ala
305 310 315 320
Cys Ile Arg Gln Glu Trp Glu Ser Ile Pro Ile Pro Lys Leu Glu Lys
325 330 335
Leu Val Ser Ser Val Pro Arg Arg Leu Leu Ser Val Val Arg Arg Arg
340 345 350
Gly Asp Ala Thr Gln Trp
355
<210> 62
<211> 339
<212> PRT
<213> Xenopus tropicalis
<400> 62
Met Lys Ser Lys Glu His Thr Arg Gln Val Arg Asp Lys Val Ile Glu
1 5 10 15
Lys Phe Lys Ala Gly Leu Gly Tyr Lys Lys Ile Ser Lys Ala Leu Asn
20 25 30
Ile Pro Arg Ser Thr Val Gln Ala Ile Ile Gln Lys Trp Lys Glu Tyr
35 40 45
Gly Thr Thr Val Asn Leu Pro Arg Gln Gly Arg Pro Pro Lys Leu Thr
50 55 60
Gly Arg Thr Arg Arg Ala Leu Ile Arg Asn Ala Ala Lys Arg Pro Met
65 70 75 80
Val Thr Leu Asp Glu Leu Gln Arg Ser Thr Ala Gln Val Gly Glu Ser
85 90 95
Val His Arg Thr Thr Ile Ser Arg Ala Leu His Lys Val Gly Leu Tyr
100 105 110
Gly Arg Val Ala Arg Arg Lys Pro Leu Leu Thr Glu Asn His Lys Lys
115 120 125
Ser Arg Leu Gln Phe Ala Thr Ser His Val Gly Asp Thr Ala Asn Met
130 135 140
Trp Lys Lys Val Leu Trp Ser Asp Glu Thr Lys Met Glu Leu Phe Gly
145 150 155 160
Gln Asn Ala Lys Arg Tyr Val Trp Arg Lys Thr Asn Thr Ala His His
165 170 175
Ser Glu His Thr Ile Pro Thr Val Lys Tyr Gly Gly Gly Ser Ile Met
180 185 190
Leu Trp Gly Cys Phe Ser Ser Ala Gly Thr Gly Lys Leu Val Arg Val
195 200 205
Asp Gly Lys Met Asp Gly Ala Lys Tyr Arg Ala Ile Leu Glu Glu Asn
210 215 220
Leu Leu Glu Ser Ala Lys Asp Leu Arg Leu Gly Arg Arg Phe Thr Phe
225 230 235 240
Gln Gln Asp Asn Asp Pro Lys His Lys Ala Arg Ala Thr Met Glu Trp
245 250 255
Phe Lys Thr Lys His Ile His Val Leu Glu Trp Pro Ser Gln Ser Pro
260 265 270
Asp Leu Asn Pro Ile Glu Asn Leu Trp Gln Asp Leu Lys Thr Ala Val
275 280 285
His Lys Arg Cys Pro Ser Asn Leu Thr Glu Leu Glu Leu Phe Cys Lys
290 295 300
Glu Glu Trp Ala Arg Ile Ser Val Ser Arg Cys Ala Lys Leu Val Glu
305 310 315 320
Thr Tyr Pro Lys Arg Leu Ala Ala Val Ile Ala Ala Lys Gly Gly Ser
325 330 335
Thr Lys Tyr
<210> 63
<211> 333
<212> PRT
<213> Anopheles gambiae
<400> 63
Met Gly Arg Ser Ala His Ser Thr Gln Gln Gln Arg Leu Asp Ile Lys
1 5 10 15
Arg Leu Ser Ala Ala Gly Tyr Ser Gln Arg Lys Ile Ala Glu Ile Leu
20 25 30
Gly Arg Ser Lys Thr Phe Val Tyr Asn Ala Leu His Ser Thr Gly Thr
35 40 45
Lys Ile Pro Thr Gly Arg Pro Arg Lys Thr Ser Ala Arg Asp Asp Ala
50 55 60
Arg Met Thr Arg Leu Cys Lys Ala Asp Pro Phe Lys Ser Ala Arg Ala
65 70 75 80
Ile Arg Asp Glu Leu Gln Leu Ser Val Ser Asp Arg Thr Val Gln Arg
85 90 95
Arg Leu Phe Glu Asn Asn Leu Val Gly Arg Asn Pro Arg Lys Val Pro
100 105 110
Leu Leu Arg Arg Cys His Val Gln Ala Arg Leu Gln Phe Ala Arg Glu
115 120 125
His Tyr Asp Trp Ala Gly Glu Asn Leu Asn Lys Trp Arg Asn Val Leu
130 135 140
Trp Ser Asp Glu Ser Lys Val Asn Leu Val Gly Ser Asp Gly Lys Arg
145 150 155 160
Phe Val Arg Arg Pro Lys Asn Thr Ala Tyr Arg Pro Gln Tyr Thr Leu
165 170 175
Lys Thr Val Lys His Gly Gly Gly Asn Ile Met Val Trp Ala Cys Phe
180 185 190
Ser Trp Tyr Gly Val Gly Pro Ile Phe Trp Ile Lys Asp Ile Met Asp
195 200 205
Gln His Arg Tyr Leu Asn Ile Ile Gln Thr Val Met Leu Pro His Ala
210 215 220
Glu Trp Glu Met Pro Leu Lys Trp Gln Phe Met His Asp Asn Asp Pro
225 230 235 240
Lys His Thr Ala Lys Ala Val Lys Lys Trp Phe Val Asp Gln Lys Ile
245 250 255
Asp Val Met Asn Trp Pro Ala Gln Ser Pro Asp Leu Asn Pro Ile Glu
260 265 270
Asn Leu Trp Lys Ile Val Lys Ala Lys Leu Pro Pro Ala Gly Ser Arg
275 280 285
Thr Lys Glu Lys Leu Trp Lys His Ile Glu Asn Ala Trp Tyr Ser Ile
290 295 300
Pro Pro Ser Thr Cys Lys Ser Leu Val Glu Ser Met Pro Lys Arg Met
305 310 315 320
Arg Ala Val Ile Arg Asn Asn Gly His Ala Thr Lys Tyr
325 330
<210> 64
<211> 340
<212> PRT
<213> Xenopus laevis
<400> 64
Met Pro Arg Ser Lys Glu Ile Gln Glu Gln Met Arg Thr Lys Val Ile
1 5 10 15
Glu Ile Tyr Gln Ser Gly Lys Gly Tyr Lys Ala Ile Ser Lys Ala Leu
20 25 30
Gly Leu Gln Arg Thr Thr Val Arg Ala Ile Ile His Lys Trp Gln Lys
35 40 45
His Gly Thr Val Val Asn Leu Pro Arg Ser Gly Arg Pro Thr Lys Ile
50 55 60
Thr Pro Arg Ala Gln Arg Gln Leu Ile Arg Glu Ala Thr Lys Asp Pro
65 70 75 80
Arg Thr Thr Ser Lys Glu Leu Gln Ala Ser Leu Ala Ser Ile Lys Val
85 90 95
Ser Val His Asp Ser Thr Ile Arg Lys Arg Leu Gly Lys Asn Gly Leu
100 105 110
His Gly Arg Phe Pro Arg Arg Lys Pro Leu Leu Ser Lys Lys Asn Ile
115 120 125
Lys Ala Arg Leu Asn Phe Ala Lys Lys His Leu Asn Asp Cys Gln Asp
130 135 140
Phe Trp Glu Asn Thr Leu Trp Thr Asp Glu Thr Lys Val Glu Leu Phe
145 150 155 160
Gly Arg Cys Val Ser Arg Tyr Ile Trp Arg Lys Ser Asn Thr Ala Phe
165 170 175
Gln Lys Lys Asn Ile Ile Pro Thr Val Lys Tyr Gly Gly Gly Ser Val
180 185 190
Met Val Trp Gly Cys Phe Ala Ala Ser Gly Pro Gly Arg Leu Ala Val
195 200 205
Ile Asp Gly Thr Met Asn Ser Thr Val Tyr Gln Lys Ile Leu Lys Glu
210 215 220
Asn Val Arg Pro Ser Val Arg Gln Leu Lys Leu Lys Arg Ser Trp Val
225 230 235 240
Leu Gln Gln Asp Asn Asp Pro Lys His Thr Ser Lys Ser Thr Ser Glu
245 250 255
Trp Leu Lys Lys Asn Lys Met Lys Thr Leu Glu Trp Pro Ser Gln Ser
260 265 270
Pro Asp Leu Asn Pro Ile Glu Met Leu Trp His Asp Leu Lys Lys Ala
275 280 285
Val His Ala Arg Lys Pro Ser Asn Lys Ala Glu Leu Gln Gln Phe Cys
290 295 300
Lys Asp Glu Trp Ala Lys Ile Pro Pro Glu Arg Cys Lys Arg Leu Val
305 310 315 320
Ala Ser Tyr Arg Lys Arg Leu Ile Ala Val Ile Ala Ala Lys Gly Gly
325 330 335
Pro Thr Ser Tyr
340
<210> 65
<211> 332
<212> PRT
<213> Anopheles gambiae
<400> 65
Met Gly Arg Gly Lys His Cys Thr Pro Glu Glu Arg Lys His Ile Gln
1 5 10 15
Gly Leu Tyr Arg Glu Asn Val Pro Ile Lys Thr Ile Cys Lys Ala Phe
20 25 30
Gly Arg Ser Arg Thr Phe Val Asp Asn Ala Ile Arg Ser Glu Ala Thr
35 40 45
Gly Lys Ser Thr Gly Arg Pro Arg Lys Thr Thr Ala Asp Val Asp Ala
50 55 60
Gln Ile Val Glu Met Ile Arg Ala Asp Pro Phe Lys Thr Cys Thr Arg
65 70 75 80
Ile Lys Gln Glu Leu Gly Leu Gln Val Ser Ala Lys Thr Val Ser Arg
85 90 95
Arg Leu His Ala Ala Gly Phe Cys Ala Arg Arg Pro Arg Lys Val Arg
100 105 110
Lys Leu Leu Pro His His Val Glu Ala Arg Ile Arg Phe Ala Glu Glu
115 120 125
His Leu Ala Ala Ser Ile Phe Trp Trp Ser Lys Ile Ile Phe Ser Asp
130 135 140
Glu Ser Arg Ile Asn Leu Asp Gly Ser Asp Gly Ile Lys Tyr Val Trp
145 150 155 160
Arg Phe Pro Asn Gln Ala Tyr His Pro Lys Asn Thr Ile Lys Thr Leu
165 170 175
Ser His Gly Gly Gly His Val Met Val Trp Gly Cys Phe Ser Trp His
180 185 190
Gly Thr Gly Pro Leu Phe Arg Ile Asn Gly Thr Leu Asn Ser Glu Gly
195 200 205
Tyr Arg Lys Ile Leu Ser Arg Lys Met Leu Pro Tyr Ala Arg Gln Gln
210 215 220
Phe Gly Asp Glu Glu His Tyr Ile Phe Gln His Asp Asn Asp Ser Lys
225 230 235 240
His Thr Ser Arg Thr Val Lys Cys Tyr Leu Ala Asn Gln Asp Val Gln
245 250 255
Val Leu Pro Trp Pro Ala Leu Ser Pro Asp Leu Asn Pro Ile Glu Asn
260 265 270
Leu Trp Ser Thr Leu Lys Arg Gln Leu Lys Asn Gln Pro Ala Arg Ser
275 280 285
Ala Asp Asp Leu Trp Thr Arg Cys Lys Val Met Trp Glu Arg Ile Pro
290 295 300
Arg Ser Glu Cys Arg Asn Leu Ile Gly Asp Met Ala Lys Arg Cys Gln
305 310 315 320
Glu Val Ile Ala Asn Asn Gly His Gln Ile Asp Arg
325 330
<210> 66
<211> 346
<212> PRT
<213> Xenopus tropicalis
<400> 66
Met Gly Lys Lys Gly Asp Leu Ser Asn Phe Glu Arg Gly Met Val Val
1 5 10 15
Gly Ala Arg Arg Ala Gly Leu Ser Ile Ser Gln Ser Ala Gln Leu Leu
20 25 30
Gly Phe Ser Arg Thr Thr Ile Ser Arg Val Tyr Lys Glu Trp Cys Glu
35 40 45
Lys Gly Lys Thr Ser Ser Met Arg Gln Ser Cys Gly Arg Lys Cys Leu
50 55 60
Val Asp Ala Arg Gly Gln Arg Arg Met Gly Arg Leu Ile Gln Ala Asp
65 70 75 80
Arg Arg Ala Thr Leu Thr Glu Ile Thr Thr Arg Tyr Asn Arg Gly Met
85 90 95
Gln Gln Ser Ile Cys Glu Ala Thr Thr Arg Thr Thr Leu Arg Arg Met
100 105 110
Gly Tyr Asn Ser Arg Arg Pro His Arg Val Pro Leu Ile Ser Thr Thr
115 120 125
Asn Arg Lys Lys Arg Leu Gln Phe Ala Gln Ala His Gln Asn Trp Thr
130 135 140
Val Glu Asp Trp Lys Asn Val Ala Trp Ser Asp Glu Ser Arg Phe Leu
145 150 155 160
Leu Arg His Ser Asn Gly Arg Val Arg Ile Trp Arg Lys Gln Asn Glu
165 170 175
Asn Met Asp Pro Ser Cys Leu Val Thr Thr Val Gln Ala Gly Gly Gly
180 185 190
Gly Val Met Val Trp Gly Met Phe Ser Trp His Thr Leu Gly Pro Leu
195 200 205
Val Pro Ile Gly His Arg Leu Asn Ala Thr Ala Tyr Leu Ser Ile Val
210 215 220
Ser Asp His Val His Pro Phe Met Thr Thr Met Tyr Pro Ser Ser Asp
225 230 235 240
Gly Tyr Phe Gln Gln Asp Asn Ala Pro Cys His Lys Ala Arg Ile Ile
245 250 255
Ser Asn Trp Phe Leu Glu His Asp Asn Glu Phe Thr Val Leu Lys Trp
260 265 270
Pro Pro Gln Ser Pro Asp Leu Asn Pro Ile Glu His Leu Trp Asp Val
275 280 285
Val Glu Arg Glu Leu Arg Ala Leu Asp Val His Pro Thr Asn Leu His
290 295 300
Gln Leu Gln Asp Ala Ile Leu Ser Ile Trp Ala Asn Ile Ser Lys Glu
305 310 315 320
Cys Phe Gln His Leu Val Glu Ser Met Pro Arg Arg Ile Lys Ala Val
325 330 335
Leu Lys Ala Lys Gly Gly Gln Thr Pro Tyr
340 345
<210> 67
<211> 602
<212> PRT
<213> Petromyzon marinus
<400> 67
Met Ala Thr Lys Lys Arg Lys Val Asp Ala Glu Cys Arg Val Phe Asn
1 5 10 15
Glu Glu Trp Gly Val Lys Tyr Phe Phe Val Glu Thr Lys Asp Gln Lys
20 25 30
Ala Ser Cys Val Ile Cys Ser Glu Ser Val Ala Val Leu Lys Glu Tyr
35 40 45
Asn Leu Arg Arg His Tyr Glu Thr Lys His Leu Ser Thr Tyr Ser Lys
50 55 60
Phe Ser Gly Lys Leu Arg Ser Glu Lys Tyr Glu Ser Met Lys Arg Gly
65 70 75 80
Leu Glu Thr Gln Arg Asn Leu Phe Thr Arg Lys Phe Ala Glu Asn Glu
85 90 95
Ser Val Thr Arg Thr Ser Tyr Lys Ile Val His Lys Met Ala Glu Arg
100 105 110
Gly Lys Pro Phe Thr Asp Gly Asn Phe Ile Lys Glu Cys Met Met Glu
115 120 125
Ala Ala Asn Asp Leu Cys Pro Glu Arg Ala Asp Leu Phe Gly Ser Ile
130 135 140
Ser Leu Ser Ala Ser Ser Val Val Arg Arg Thr Glu Glu Leu Gly Glu
145 150 155 160
Asn Ile Val Leu Gln Ile Arg Glu Lys Ala Arg Asn Leu Leu Trp Tyr
165 170 175
Ser Leu Ala Leu Asp Glu Ser Thr Asp Leu Ser Ser Thr Ser Gln Leu
180 185 190
Leu Val Phe Ile Arg Gly Val Asn Leu Asp Phe Gln Ile Thr Glu Glu
195 200 205
Leu Ala Ser Val Cys Ser Met His Gly Thr Thr Thr Gly Lys Asp Ile
210 215 220
Phe Met Glu Val Gln Lys Thr Leu Gln Asp Tyr Asn Leu Gln Trp Asn
225 230 235 240
Gln Leu Arg Gly Val Thr Val Asp Gly Gly Lys Asn Met Ala Gly Val
245 250 255
Arg Lys Gly Leu Val Gly Gln Ile Arg Thr Gln Leu Glu Asp Leu Gln
260 265 270
Ile Pro Gly Ala Leu Phe Ile His Cys Ile Ile His Gln Gln Ala Leu
275 280 285
Cys Gly Lys Asp Leu Asp Ile Ser Cys Val Leu Lys Pro Val Val Ser
290 295 300
Ala Val Asn Phe Ile Arg Gly His Ala Leu Asn His Arg Gln Phe Gln
305 310 315 320
Ala Phe Leu Glu Glu Met Asp Ser Asp Phe Cys Asp Leu Pro Tyr His
325 330 335
Thr Ala Val Arg Trp Leu Ser Cys Gly Lys Val Leu Phe Arg Phe Tyr
340 345 350
Lys Leu Arg Asn Glu Ile Asp Val Phe Leu Thr Glu Lys Asp Arg Ala
355 360 365
Asp Pro Gln Leu Ser Asp Pro Thr Trp Leu Ser Lys Leu Ser Phe Leu
370 375 380
Val Asp Ile Thr Ser His Met Asn Glu Leu Asn Leu Lys Leu Gln Gly
385 390 395 400
Lys Asp Asn Leu Val Cys Asp Leu Tyr Arg Ile Ile Lys Gly Phe Arg
405 410 415
Arg Lys Leu Ser Leu Phe Glu Ala Gln Leu Glu Gly Glu Asn Phe Ser
420 425 430
His Phe His Cys Phe Lys Glu Phe Cys Ala Thr Ile Ala Glu Asp Val
435 440 445
Asn Leu Asp Phe Pro Lys Lys Ile Ile Arg Asp Leu Lys Lys His Phe
450 455 460
Leu Lys Arg Phe Ser Asp Leu Asp Arg Ile Glu Ser Asp Ile Leu Leu
465 470 475 480
Phe Gln Asn Pro Phe Asp Cys Asn Leu Asp Asp Val Pro Val Glu Leu
485 490 495
Gln Leu Glu Leu Ile Asp Leu Gln Ala Asn Asp Leu Leu Lys Glu Lys
500 505 510
His Arg Glu Gly Lys Leu Val Glu Phe Tyr Arg Cys Leu Pro Asp Val
515 520 525
Glu Phe Pro Lys Leu Lys Lys Phe Ala Ala Gly Met Ala Ser Val Phe
530 535 540
Gly Thr Thr Tyr Val Cys Glu Gln Thr Phe Ser Lys Met Lys Tyr Val
545 550 555 560
Lys Ser Thr His Arg Thr Arg Leu Thr Asp Glu His Leu Lys Ala Ile
565 570 575
Leu Leu Ile Gly Cys Ser Asn Ser Lys Pro Asn Ile Asp Asp Ile Leu
580 585 590
Lys Ala Lys Arg Gln Phe His Lys Ser His
595 600
<210> 68
<211> 340
<212> PRT
<213> Petromyzon marinus
<400> 68
Met Ala Lys Thr Lys Glu Leu Ser Lys Asp Val Arg Asp Lys Ile Val
1 5 10 15
Asp Leu His Lys Ala Gly Met Gly Tyr Lys Thr Ile Ala Lys Gln Leu
20 25 30
Gly Glu Lys Val Thr Thr Val Gly Ala Ile Ile Arg Lys Trp Lys Lys
35 40 45
His Lys Arg Thr Val Asn Leu Pro Arg Pro Gly Ala Pro Cys Lys Ile
50 55 60
Ser Pro Arg Gly Val Ala Met Ile Met Arg Thr Val Arg Asn Gln Pro
65 70 75 80
Arg Thr Thr Arg Glu Asp Leu Val Asn Asp Leu Lys Ala Ala Gly Thr
85 90 95
Ile Val Thr Lys Lys Thr Ile Gly Asn Thr Leu Arg Arg Glu Gly Leu
100 105 110
Lys Ser Cys Ser Ala Arg Lys Val Pro Leu Leu Lys Lys Ala His Ile
115 120 125
His Ala Arg Leu Lys Phe Ala Asn Glu His Leu Asn Asp Ser Glu Asp
130 135 140
Asn Trp Val Lys Val Leu Trp Ser Asp Glu Thr Lys Met Glu Leu Phe
145 150 155 160
Gly Ile Asn Ser Thr Arg Arg Val Trp Arg Arg Arg Asn Ala Ala Tyr
165 170 175
Asp Pro Lys Asn Thr Ile Pro Thr Val Lys His Gly Gly Gly Asn Ile
180 185 190
Met Leu Trp Gly Cys Phe Ser Ala Lys Gly Thr Gly Gln Leu His Arg
195 200 205
Ile Lys Gly Thr Met Asp Gly Ala Met Tyr Arg Gln Ile Leu Gly Glu
210 215 220
Asn Leu Leu Pro Ser Ala Arg Ala Leu Lys Met Gly Arg Gly Trp Val
225 230 235 240
Phe Gln His Asp Asn Asp Pro Lys His Thr Ala Lys Ala Thr Lys Glu
245 250 255
Trp Leu Lys Lys Lys His Ile Lys Val Leu Glu Trp Pro Ser Gln Ser
260 265 270
Pro Asp Leu Asn Pro Ile Glu Asn Leu Trp Arg Glu Leu Lys Val Arg
275 280 285
Val Ala Lys Arg Gln Pro Arg Asn Leu Asn Asp Leu Glu Lys Ile Cys
290 295 300
Lys Glu Glu Trp Asp Lys Ile Pro Pro Glu Met Cys Ala Asn Leu Val
305 310 315 320
Ala Asn Tyr Lys Lys Arg Leu Thr Ser Val Ile Ala Asn Lys Gly Phe
325 330 335
Ala Thr Lys Tyr
340
<210> 69
<211> 550
<212> PRT
<213> Alligator mississippiensis
<400> 69
Met Ser Ala Lys Arg Lys Ser Met Thr Ser Pro Gly Gly Ser Ala Lys
1 5 10 15
Lys Gln Arg Lys Ala Ile Asp Leu Glu Met Lys Met Lys Ile Ile Asn
20 25 30
Asp Tyr Glu Ala Gly Lys Lys Val Lys Ala Ile Ala Arg Asp Leu Glu
35 40 45
Leu Ala His Ser Thr Ile Ser Thr Ile Leu Lys Asp Lys Asp Arg Val
50 55 60
Lys Glu Ala Val Gln Ala Ser Thr Gly Phe Lys Ala Ile Ile Thr Arg
65 70 75 80
Gln Arg Lys Gly Leu Ile His Glu Met Glu Lys Leu Leu Ala Ile Trp
85 90 95
Phe Asp Asp Gln Ile Gln Lys Arg Met Pro Met Ser Leu Leu Ile Ile
100 105 110
Gln Ala Lys Ala Arg Ser Ile Phe Glu Thr Leu Lys Ala Arg Glu Gly
115 120 125
Glu Glu Ser Thr Glu Thr Phe Thr Ala Ser Arg Gly Trp Phe Gln Arg
130 135 140
Phe Arg Arg Arg Phe Asn Val His Asn Arg Ser Ile Ser Gly Glu Ala
145 150 155 160
Ala Ser Ala Asp Val Glu Ala Ala Glu Lys Phe Val Asp Gln Phe Asp
165 170 175
Glu Ile Ile Glu Lys Gly Gly Tyr Arg Pro Glu Gln Ile Phe Asn Val
180 185 190
Asp Glu Thr Gly Leu Phe Trp Lys Lys Met Pro Glu Arg Ser Tyr Ile
195 200 205
His Lys Glu Ala Lys Ala Met Pro Gly Phe Lys Ala Phe Lys Asp Arg
210 215 220
Val Thr Leu Leu Leu Gly Gly Asn Val Ala Gly Phe Lys Leu Lys Pro
225 230 235 240
Phe Leu Ile His Arg Ser Glu Asn Pro Arg Ala Leu Lys Gln Val Ser
245 250 255
Lys His Thr Leu Pro Val Tyr Tyr Arg Ala Asn Ser Lys Ala Trp Met
260 265 270
Thr Gln Ala Leu Phe Glu Asp Trp Phe Ile Asn Cys Phe Ile Pro Ser
275 280 285
Val Lys His Tyr Cys Leu Glu Lys Gly Val Pro Phe Lys Ile Ile Leu
290 295 300
Leu Leu Asp Asn Ala Pro Gly His Pro Gln His Leu Asp Asp Leu His
305 310 315 320
Pro Asp Val Lys Val Val Tyr Leu Pro Lys Asn Thr Thr Ala Ile Leu
325 330 335
Gln Pro Met Asp Gln Gly Ala Ile Ala Thr Phe Lys Val Tyr Tyr Leu
340 345 350
Arg Ala Thr Phe Ser Lys Ala Val Ala Ala Thr Glu Ser Asp Glu Val
355 360 365
Thr Leu Arg Asp Phe Trp Lys Ser Tyr Asn Ile Leu His Cys Ile Lys
370 375 380
Asn Ile Glu Ser Ala Trp Glu Gly Val Thr Glu Lys Cys Met Gln Gly
385 390 395 400
Ile Trp Lys Lys Cys Leu Lys Val Phe Val Asn Asn Phe Glu Gly Phe
405 410 415
Asp Lys Asp Glu His Val Asp Val Ile Asn Lys Lys Ile Val Glu Leu
420 425 430
Ala Asn Val Leu Asn Leu Asp Val Glu Val Lys Asp Ile Glu Glu Leu
435 440 445
Val Glu Tyr Val Glu Gly Glu Leu Thr Asn Glu Asp Leu Ile Glu Leu
450 455 460
Glu Ala Gln Gln His Leu Glu Glu Glu Glu Glu Glu Glu Glu Glu Arg
465 470 475 480
Met Glu Glu Val Gln Lys Lys Phe Thr Val Asn Gly Leu Ala Gly Val
485 490 495
Phe Ser Lys Val Asn Ala Ala Ile Leu Glu Leu Glu Gly Met Asp Pro
500 505 510
Asn Val Glu Arg Phe Thr Lys Val Glu Arg Gln Met Asn Glu Leu Leu
515 520 525
Arg Cys Tyr Cys Glu Ile Tyr Glu Glu Lys Lys Lys Lys Lys Arg Lys
530 535 540
Leu Gln Ser Arg Pro His
545 550
<210> 70
<211> 643
<212> PRT
<213> Myotis lucifugus
<400> 70
Met Glu Asn Gln Lys Asn Lys Lys Ala Arg Leu Asn Asp Lys Gly Ser
1 5 10 15
Gly Ser Ser Ser Ser Arg Pro Phe Gln Asp Ile Trp Thr Glu Met Tyr
20 25 30
Gly Ile Val Asp Arg Asn Asn Arg Ser Leu Cys Ile Leu Cys Asn Glu
35 40 45
Thr Val Val Ser Arg Thr Trp Asn Val Lys Arg His Phe Glu Thr Asn
50 55 60
His Cys Gln Leu Leu Lys Lys Ser Ile Asp Glu Arg Lys Glu Tyr Ile
65 70 75 80
Ser Arg Gln Leu His Leu Tyr Lys Ser Gln Ser Asn Ser Ile Ile Lys
85 90 95
Phe Val Arg Cys Ser Thr Asn Leu Thr Ser Ala Ser Tyr Cys Ile Ala
100 105 110
His Ser Ile Ala Gln His Gly Lys Ala Leu Ser Asp Gly Glu Phe Ile
115 120 125
Lys Glu Thr Phe Leu Arg Cys Ala Pro Ala Leu Phe His Asp Met Lys
130 135 140
Asn Lys Asp Asp Ile Ile Lys Arg Ile Ser Glu Leu Pro Leu Ser Arg
145 150 155 160
Asn Thr Ile Lys Asp Arg Ile Ile Asp Leu Asn Lys Asn Val Gln His
165 170 175
Gln Leu Lys Lys Asp Leu Asn Ser Cys Lys Tyr Phe Ser Ile Ser Leu
180 185 190
Asp Glu Thr Thr Asp Val Thr Ser Asn Ala Arg Leu Ala Ile Ile Ala
195 200 205
Arg Tyr Ser Asp Gly Leu Thr Met Arg Glu Glu Leu Ile Lys Leu Glu
210 215 220
Ser Val Pro Ile Ser Thr Ser Gly Asn Glu Ile Cys Lys Val Val Ile
225 230 235 240
Lys Thr Phe Ser Asp Leu Asn Ile Asp Ile Ser Lys Ile Val Ser Val
245 250 255
Thr Thr Asp Gly Ala Pro Asn Met Val Gly Lys Asn Val Gly Phe Leu
260 265 270
Lys Leu Phe Met Glu Ala Ile Arg His Pro Leu Val Pro Phe His Cys
275 280 285
Ile Ile His Gln Glu Val Leu Cys Ala Lys Ser Gly Phe Ser Glu Leu
290 295 300
Asn Asp Leu Met Ser Val Val Thr Lys Ile Val Asn Phe Ile Ala Ser
305 310 315 320
Arg Pro Leu His Lys Arg Glu Phe Ser Ala Leu Leu Gln Glu Val Asp
325 330 335
Ser Thr Tyr Ser Gly Leu Leu Met Phe Asn Asn Val Arg Trp Leu Ser
340 345 350
Arg Gly Lys Val Leu Glu Arg Phe Val Glu Cys Phe Glu Glu Ile Thr
355 360 365
Val Phe Ile Glu Asn Lys Asp Leu Ala Asn Phe Pro Gln Ile Asn Asp
370 375 380
His Lys Trp Val Ser Asn Leu Met Phe Phe Thr Asp Leu Ser Val His
385 390 395 400
Met Asn Glu Leu Asn Leu Lys Leu Gln Gly Phe Gly Lys Ser Ile Asp
405 410 415
Val Met Phe Gly Tyr Ile Lys Ser Phe Glu Ser Lys Leu Lys Ile Phe
420 425 430
Lys Arg Asp Ile Glu Thr Lys Thr Tyr Lys Tyr Phe Pro Arg Ile Lys
435 440 445
Lys Tyr Phe Glu Lys Ala Thr Thr Thr Ser Val Met Glu Ser Ile Leu
450 455 460
Met Tyr Gln Asn Ile Val Asn Ser Leu Phe Glu Gln Phe Ser Glu Arg
465 470 475 480
Phe Asp Gln Phe Arg Ser Leu Glu Gln Thr Ile Lys Ile Ile Lys Tyr
485 490 495
Pro Asp Val Val Val Tyr Ser Thr Leu Glu Leu Lys Asp Phe Gln Trp
500 505 510
Met Gln Ile Asp Asp Leu Glu Met Gln Leu Ala Asp Phe Gln Gly Ser
515 520 525
Ile Trp Thr His Val Phe Val Asp Leu Arg Ser Lys Leu Glu Asn Leu
530 535 540
Glu Arg Asn Arg Leu Asn Asn Glu Glu Glu Cys Asn Tyr Glu Gln Glu
545 550 555 560
Ile Leu Ser Ala Trp Asn Arg Val Pro Asp Thr Phe Ser Asp Ile Lys
565 570 575
Asn Leu Ala Met Ala Leu Leu Thr Ile Phe Ser Ser Thr Tyr Phe Cys
580 585 590
Glu Thr Leu Phe Ser Ala Leu Asn Asn Ile Lys Thr Asn Lys Arg Asn
595 600 605
Arg Leu Thr Asp Glu Val Ser Gly Ala Cys Leu Ala Leu Lys Cys Thr
610 615 620
Lys Tyr Glu Pro Ala Ile Glu Glu Leu Ala Asp Lys Leu Gln His Gln
625 630 635 640
Lys Ser His
<210> 71
<211> 602
<212> PRT
<213> Petromyzon marinus
<400> 71
Met Ser Gly Ser Arg Lys Arg Lys Val Asp Asn Glu Cys Arg Val Phe
1 5 10 15
Asn Thr Glu Trp Thr Thr Lys Tyr Phe Phe Thr Glu Val Gln Ser Lys
20 25 30
Ala Val Cys Leu Ile Cys Arg Glu Thr Val Ala Val Phe Lys Glu Tyr
35 40 45
Asn Ile Ser Arg His Phe Ala Thr Lys His Ala Asn Tyr Ala Ser Lys
50 55 60
Gln Ser Thr Gln Glu Arg Ala Ala Thr Ala Gln Arg Leu Ala Ala Asn
65 70 75 80
Leu Gln Thr Gln Gln His Phe Phe His Arg Gln Thr Ala Ile Gln Glu
85 90 95
Ser Thr Thr Lys Ala Ser Phe Leu Val Ala Phe Glu Ile Ala Lys Ala
100 105 110
Ser Lys Pro Phe Ser Glu Gly Glu Phe Val Lys Glu Cys Met Val Gln
115 120 125
Thr Ala Asp Ile Leu Cys Pro Glu Ile Lys Ser Lys Phe Glu Lys Val
130 135 140
Ser Leu Ser Arg Arg Thr Val Thr Arg Arg Val Glu Leu Ile Asp Glu
145 150 155 160
Asn Ile Ala Ser Gln Leu Asn Lys Lys Ser Asp Ser Phe Glu Leu Tyr
165 170 175
Ser Leu Ala Leu Asp Glu Ser Thr Asp Val Lys Asp Thr Ala Gln Leu
180 185 190
Leu Ile Phe Ile Arg Gly Ile Asp Asp Ser Phe Ala Ile Thr Glu Glu
195 200 205
Phe Leu Thr Met Glu Ser Leu Lys Gly Thr Thr Arg Gly Glu Asp Leu
210 215 220
Tyr Asn Gln Val Ser Ala Val Ile Glu Arg Met Lys Leu Pro Trp Ser
225 230 235 240
Lys Leu Val Asn Val Thr Thr Asp Gly Ser Pro Asn Leu Thr Gly Lys
245 250 255
Asn Val Gly Leu Leu Lys Arg Ile Gln Asn Lys Val Lys Glu Glu Asn
260 265 270
Pro Asp Gln Asp Leu Ile Phe Leu His Cys Ile Ile His Gln Glu Ser
275 280 285
Leu Cys Lys Ser Val Leu Gln Leu Asn His Val Val Asn Pro Ala Val
290 295 300
Lys Leu Val Asn Phe Ile Arg Ala Arg Gly Leu Gln His Arg Gln Phe
305 310 315 320
Ile Thr Phe Leu Glu Glu Thr Asp Ala Asp His Gln Asp Leu Leu Tyr
325 330 335
His Ser Arg Val Arg Trp Leu Ser Leu Gly Lys Val Leu Gln Arg Val
340 345 350
Trp Glu Leu Lys Glu Asp Ile Ile Ala Phe Leu Glu Leu Met Gly Lys
355 360 365
Ser Asp Glu Phe Pro Glu Leu Ser Asp Lys Asn Trp Leu Ser Asp Phe
370 375 380
Ala Phe Ala Val Asp Ile Phe Ser His Met Asn Glu Leu Asn Val Lys
385 390 395 400
Leu Gln Gly Lys Asp Gln Phe Val His Asp Met Tyr Lys His Val Lys
405 410 415
Ala Phe Lys Ser Lys Leu Thr Leu Phe Ser Arg Gln Ile Ala Asn Lys
420 425 430
Ser Phe Ala His Phe Pro Thr Leu Ala Met Gln Glu Glu Ala Pro Arg
435 440 445
Asn Ala Lys Lys Tyr Ser Lys Ser Leu Glu Asp Leu His Gly Glu Phe
450 455 460
Cys Arg Arg Phe Ser Asp Phe Glu Asn Ile Glu Gln Ser Leu Gln Leu
465 470 475 480
Val Ser Cys Pro Leu Ser Gln Asp Ser Glu Thr Ala Pro Gln Glu Leu
485 490 495
Gln Leu Glu Leu Ile Asp Leu Gln Ser Asp Ser Val Leu Lys Glu Lys
500 505 510
Phe Asn Ser Val Lys Leu Asn Asp Phe Tyr Ala Ser Leu Asn Arg Ala
515 520 525
Thr Phe Pro Asn Leu Arg Arg Thr Ala Gln Lys Met Leu Thr Leu Phe
530 535 540
Gly Ser Thr Tyr Val Cys Glu Gln Thr Phe Ser Val Met Asn Ala Asn
545 550 555 560
Lys Ala Arg His Arg Ser Lys Leu Thr Asp Gln His Leu Arg Ser Ile
565 570 575
Leu Arg Ile Ala Thr Thr Lys Ile Thr Pro Asp Leu Asp Ala Leu Ala
580 585 590
Lys Met Gly Asp Gln Gln His Cys Ser His
595 600
<210> 72
<211> 339
<212> PRT
<213> Xenopus tropicalis
<400> 72
Met Val His Arg Glu Leu Pro Lys His Gln Arg Asp Leu Ile Val Lys
1 5 10 15
Arg Tyr Gln Ser Gly Glu Gly Tyr Lys Arg Ile Ser Lys Ala Leu Asp
20 25 30
Ile Pro Trp Asn Thr Val Lys Thr Val Ile Ile Lys Trp Arg Lys Tyr
35 40 45
Gly Thr Thr Val Thr Leu Pro Arg Thr Gly Arg Pro Ser Lys Ile Asp
50 55 60
Glu Lys Thr Arg Arg Lys Leu Val Arg Glu Ala Thr Lys Arg Pro Thr
65 70 75 80
Ala Thr Leu Lys Glu Leu Gln Glu Tyr Leu Ala Ser Thr Gly Cys Val
85 90 95
Val His Val Thr Thr Ile Ser Arg Ile Leu His Met Ser Gly Leu Trp
100 105 110
Gly Arg Val Ala Arg Arg Lys Pro Phe Leu Thr Lys Lys Asn Ile Gln
115 120 125
Ala Arg Leu His Phe Ala Lys Thr His Leu Lys Ser Pro Lys Ser Met
130 135 140
Trp Glu Lys Val Leu Trp Ser Asp Glu Thr Lys Val Glu Leu Phe Gly
145 150 155 160
His Asn Ser Lys Lys Tyr Val Trp Arg Lys Asn Asn Thr Ala His His
165 170 175
Gln Lys Asn Thr Ile Pro Thr Val Lys His Gly Gly Gly Ser Ile Met
180 185 190
Leu Trp Gly Cys Phe Ser Ser Ala Gly Thr Gly Ala Leu Val Lys Ile
195 200 205
Glu Gly Ile Met Asn Ser Ser Lys Tyr Gln Ser Ile Leu Ala Gln Asn
210 215 220
Leu Gln Ala Ser Ala Arg Lys Leu Asn Met Arg Arg Asn Phe Ile Phe
225 230 235 240
Gln His Asp Asn Asp Pro Lys His Thr Ser Lys Ser Thr Lys Glu Trp
245 250 255
Leu His Arg Lys Lys Ile Lys Val Leu Glu Trp Pro Ser Gln Ser Pro
260 265 270
Asp Leu Asn Pro Ile Glu Asn Leu Trp Gly Asp Leu Lys Arg Ala Val
275 280 285
His Arg Arg Cys Pro Arg Asn Leu Thr Asp Leu Glu Cys Phe Cys Lys
290 295 300
Glu Glu Trp Ala Asn Leu Ala Lys Ser Lys Cys Ala Met Leu Ile Asp
305 310 315 320
Ser Tyr Pro Lys Arg Leu Ser Ala Val Ile Lys Ser Lys Gly Ala Ser
325 330 335
Thr Lys Tyr
<210> 73
<211> 344
<212> PRT
<213> Xenopus tropicalis
<400> 73
Met Asp Asn Arg Lys Arg Arg Arg Glu Leu Ser Glu Asp Leu Arg Thr
1 5 10 15
Lys Ile Val Glu Lys Tyr Gln Gln Ser Gln Gly Tyr Lys Ser Ile Ser
20 25 30
Arg Asp Leu Asp Leu Pro Leu Ser Thr Val Arg Asn Ile Ile Lys Lys
35 40 45
Phe Ala Thr His Gly Thr Val Ala Asn Leu Pro Gly Arg Gly Arg Lys
50 55 60
Arg Lys Ile Asp Glu Arg Leu Gln Arg Arg Ile Val Arg Met Val Asp
65 70 75 80
Lys Gln Pro Gln Thr Ser Ser Lys Glu Ile Gln Ala Val Leu Gln Ala
85 90 95
Gln Gly Ala Ser Val Ser Ala Arg Thr Ile Arg Arg His Leu Asn Glu
100 105 110
Met Lys Arg Tyr Gly Arg Arg Pro Arg Arg Thr Pro Leu Leu Thr Gln
115 120 125
Arg His Lys Lys Ala Arg Leu Gln Phe Ala Lys Met Tyr Leu Ser Lys
130 135 140
Pro Gln Ser Phe Trp Glu Asn Val Leu Trp Thr Asp Glu Thr Lys Ile
145 150 155 160
Glu Leu Phe Gly Lys Ala His His Ser Thr Val Tyr Arg Lys Arg Asn
165 170 175
Glu Ala Tyr Lys Glu Lys Asn Thr Val Pro Thr Val Lys Tyr Gly Gly
180 185 190
Gly Ser Met Met Phe Trp Gly Cys Phe Ala Ala Ser Gly Thr Gly Cys
195 200 205
Leu Glu Cys Val Gln Gly Ile Met Lys Ser Glu Asp Tyr Gln Arg Ile
210 215 220
Leu Gly Arg Thr Val Glu Pro Ser Val Arg Lys Leu Gly Leu Arg Pro
225 230 235 240
Arg Ser Trp Val Phe Gln Gln Asp Asn Asp Pro Lys His Thr Ser Lys
245 250 255
Ser Thr Gln Lys Trp Met Ala Thr Lys Arg Trp Arg Val Leu Lys Trp
260 265 270
Pro Ala Met Ser Pro Asp Leu Asn Pro Ile Glu His Leu Trp Arg Asp
275 280 285
Leu Lys Ile Ala Val Gly Lys Arg Arg Pro Ser Asn Lys Arg Asp Leu
290 295 300
Glu Gln Phe Ala Lys Glu Glu Trp Ser Lys Ile Pro Gly Glu Arg Cys
305 310 315 320
Lys Lys Leu Ile Asp Gly Tyr Arg Lys Arg Leu Ile Ser Val Ile Phe
325 330 335
Ser Lys Gly Cys Ala Thr Lys Tyr
340
<210> 74
<211> 340
<212> PRT
<213> Xenopus tropicalis
<400> 74
Met Gly Lys Thr Lys Glu Leu Ser Lys Asp Thr Arg Asp Lys Ile Val
1 5 10 15
Asp Leu His Lys Ala Gly Lys Gly Tyr Gly Ala Ile Ala Lys Gln Leu
20 25 30
Gly Glu Asn Arg Ser Thr Val Gly Ala Ile Val Arg Lys Trp Lys Arg
35 40 45
Leu Lys Thr Thr Val Ser Leu Pro Arg Thr Gly Ala Pro Cys Lys Ile
50 55 60
Ser Pro Arg Gly Val Ser Leu Met Ile Arg Lys Val Arg Asn Gln Pro
65 70 75 80
Arg Thr Thr Arg Glu Glu Leu Val Asn Asp Met Lys Arg Ala Gly Thr
85 90 95
Thr Val Ser Lys Val Thr Val Gly Arg Thr Leu Arg Arg His Gly Phe
100 105 110
Lys Ser Cys Ile Ala Arg Lys Val Pro Leu Leu Lys Ser Ser His Val
115 120 125
Gln Ala Arg Leu Lys Phe Ala Asn Asp His Leu Asp Asp Pro Glu Glu
130 135 140
Ala Trp Glu Lys Val Met Trp Ser Asp Glu Thr Lys Val Glu Leu Phe
145 150 155 160
Gly Leu Asn Phe Thr Arg Arg Val Trp Arg Lys Asn Lys Asp Glu Leu
165 170 175
His Pro Lys Asn Thr Ile Pro Thr Val Lys His Gly Gly Gly Asn Ile
180 185 190
Met Leu Trp Gly Cys Phe Ser Ala Lys Gly Thr Gly Arg Leu His Cys
195 200 205
Ile Lys Glu Arg Met Asn Gly Ala Met Tyr Cys Glu Ile Leu Ser Asn
210 215 220
Asn Leu Leu Pro Ser Val Arg Ala Leu Lys Met Gly Arg Gly Trp Val
225 230 235 240
Phe Gln His Asp Asn Asp Pro Lys His Thr Ala Arg Ile Thr Lys Glu
245 250 255
Trp Leu Arg Lys Arg His Ile Lys Val Leu Glu Trp Pro Ser Gln Ser
260 265 270
Pro Asp Leu Asn Pro Ile Glu Asn Leu Trp Arg Glu Leu Lys Leu Arg
275 280 285
Val Ala Gln Arg Gln Pro Arg Asn Leu Thr Asp Leu Glu Glu Ile Cys
290 295 300
Val Glu Glu Trp Ala Lys Ile Pro Val Ala Val Cys Ala Asn Leu Val
305 310 315 320
Lys Asn Tyr Arg Lys Arg Leu Thr Ser Val Ile Ala Asn Lys Gly Phe
325 330 335
Cys Thr Lys Tyr
340
<210> 75
<211> 341
<212> PRT
<213> Xenopus tropicalis
<400> 75
Met Arg Arg Ser Leu Gln Pro Thr Gln Met Ala Gln Val Val Gln Leu
1 5 10 15
Ile Gln Asp Gly Thr Ser Met Arg Ala Val Ala Arg Arg Phe Ala Val
20 25 30
Ser Val Ser Val Val Ser Arg Ala Trp Arg Arg Tyr Gln Glu Thr Gly
35 40 45
Gln Tyr Ile Arg Arg Arg Gly Gly Gly Arg Arg Arg Ala Thr Thr Gln
50 55 60
Gln Gln Asp Arg Tyr Leu Arg Leu Cys Ala Arg Arg Asn Arg Arg Ser
65 70 75 80
Thr Ala Arg Ala Leu Gln Asn Asp Leu Gln Arg Ala Thr Asn Val His
85 90 95
Val Ser Ala Gln Thr Val Arg Asn Arg Leu His Glu Gly Gly Met Arg
100 105 110
Ala Arg Arg Pro Gln Val Gly Val Val Leu Thr Ala Gln His Arg Ala
115 120 125
Gly Arg Leu Ala Phe Ala Arg Glu His Gln Asp Trp Gln Ile Arg His
130 135 140
Trp Arg Pro Val Leu Phe Thr Asp Glu Ser Arg Phe Thr Leu Ser Thr
145 150 155 160
Cys Asp Arg Arg Asp Arg Val Trp Arg Arg Arg Gly Glu Arg Ser Ala
165 170 175
Ala Cys Asn Ile Leu Gln His Asp Arg Phe Gly Ser Gly Ser Val Met
180 185 190
Val Trp Gly Gly Ile Ser Leu Gly Gly Arg Thr Ala Leu His Val Leu
195 200 205
Ala Arg Gly Ser Leu Thr Ala Ile Arg Tyr Arg Asp Glu Ile Leu Arg
210 215 220
Pro Leu Val Arg Pro Tyr Ala Gly Ala Val Gly Pro Gly Phe Leu Leu
225 230 235 240
Met Gln Asp Asn Ala Arg Pro His Val Ala Gly Val Cys Gln Gln Phe
245 250 255
Leu Gln Asp Glu Gly Ile Asp Ala Met Asp Trp Pro Ala Arg Ser Pro
260 265 270
Asp Leu Asn Pro Ile Glu His Ile Trp Asp Ile Met Ser Arg Ser Ile
275 280 285
His Gln Arg His Val Ala Pro Gln Thr Val Gln Glu Leu Val Asp Ala
290 295 300
Leu Val Gln Val Trp Glu Glu Ile Pro Gln Glu Thr Ile Arg His Leu
305 310 315 320
Ile Arg Ser Met Pro Arg Arg Cys Arg Glu Val Ile Gln Ala Arg Gly
325 330 335
Gly His Thr His Tyr
340
<210> 76
<211> 341
<212> PRT
<213> Takifugu rubripes
<400> 76
Met Val Arg Tyr Leu Asp Ala Thr Glu Val Ala Gln Val Val Gln Leu
1 5 10 15
Leu Gln Asp Gly Thr Ser Ile Arg Ala Val Ala Arg Arg Phe Ala Val
20 25 30
Ser Pro Ser Thr Val Ser Arg Ala Trp Arg Arg Phe Gln Glu Thr Gly
35 40 45
Ser Tyr Ser Arg Arg Ala Gly Gln Gly Arg Arg Arg Ser Leu Asn Pro
50 55 60
Gln Gln Asp Arg Tyr Leu Leu Leu Cys Ala Arg Arg Asn Arg Met Ser
65 70 75 80
Thr Ala Arg Ala Leu Gln Asn Asp Leu Gln Gln Ala Thr Gly Val Asn
85 90 95
Val Ser Asp Gln Thr Ile Arg Asn Arg Leu His Glu Gly Gly Leu Arg
100 105 110
Ala Arg Arg Pro Val Val Gly Pro Val Leu Thr Ala Arg His Arg Arg
115 120 125
Ala Arg Leu Ala Phe Ala Ile Asp His Gln Asn Trp Gln Leu Arg His
130 135 140
Trp Arg Pro Val Leu Phe Thr Asp Glu Ser Arg Phe Asn Leu Ser Thr
145 150 155 160
Cys Asp Arg Arg Glu Arg Val Trp Arg Cys Arg Gly Glu Arg Tyr Ala
165 170 175
Ala Cys Asn Ile Ile Gln His Asp Arg Phe Gly Gly Gly Ser Val Met
180 185 190
Val Trp Gly Gly Ile Ser Leu Glu Gly Arg Thr Asp Leu Tyr Arg Leu
195 200 205
Asp Asn Gly Thr Leu Thr Ala Ile Arg Tyr Arg Asp Glu Ile Leu Gly
210 215 220
Pro Ile Val Arg Thr Tyr Ala Gly Ala Val Gly Pro Gly Phe Leu Leu
225 230 235 240
Val His Asp Asn Ala Arg Pro His Val Ala Arg Val Cys Arg Gln Phe
245 250 255
Leu Glu Asp Glu Gly Ile Asp Thr Ile Asp Trp Pro Pro Arg Ser Pro
260 265 270
Asp Leu Asn Pro Ile Glu His Leu Trp Asp Ile Met Phe Arg Ser Ile
275 280 285
Arg Arg Arg Gln Val Asp Pro Gln Thr Val Gln Glu Leu Ser Asp Ala
290 295 300
Leu Val Gln Ile Trp Glu Glu Ile Pro Gln Asp Thr Ile Arg Arg Leu
305 310 315 320
Ile Arg Ser Met Pro Arg Arg Cys Gln Ala Cys Val Gln Ala Arg Gly
325 330 335
Gly His Thr Asn Tyr
340
<210> 77
<211> 1073
<212> PRT
<213> Xenopus tropicalis
<400> 77
Met Pro Gly Lys Gly Arg Pro Pro Arg Arg Gly Thr Arg Gly Arg Ala
1 5 10 15
Ala Met Ile Ser Cys Gly Pro Arg Lys Leu Pro Ser Phe Pro Lys Ala
20 25 30
Leu Thr Leu Asn Ser Gln Asn Ala Glu Glu Val Val Asp Trp Leu Thr
35 40 45
Gln His Thr Pro Ser Ser Thr Val Ser Asn Phe Ala Thr Thr Ser Ser
50 55 60
Ser Ser Ser Ala Met Gly Thr Pro Arg Thr Thr Ser Ser Thr Thr Ala
65 70 75 80
Ala Pro Ser Ser Leu Glu Ser Glu Glu Leu Phe Thr His Glu Phe Val
85 90 95
Glu Leu Ser Asp Ala Gln Pro Leu Leu Pro Glu Glu Asp Glu Gly Asp
100 105 110
Glu Asp Val Thr Pro Asp Ile Ile Ile Gln Ala Gly Asn Thr Thr Glu
115 120 125
Met Asp Ile Arg Cys Asp Glu Val Pro Ala Ala Ala Val Phe Cys Glu
130 135 140
Leu Ser Glu Glu Ile Asp Ala Ser Glu Glu Asn Asp Asp Glu Glu Ile
145 150 155 160
Asp Ile Leu Trp Val Pro Thr Arg Arg Glu Gln Glu Glu Asp Ser Ser
165 170 175
Asp Gly Glu Thr Glu Ser Gln Arg Gly Arg Arg Arg Ile Arg Leu Arg
180 185 190
Arg Ser Arg Asp Ser Ser Gln Gly Thr Val Gly Gln Gln His Glu Ser
195 200 205
Ala Pro Val Val Ser Gln Pro Thr His Pro Pro Thr Ser Thr Val Thr
210 215 220
Ala Arg Lys Pro Thr Ser Lys Gly Ser Ala Val Trp His Phe Phe Asn
225 230 235 240
Val Cys Ala Ser Asp Lys Ser Ala Val Ile Cys Asn Glu Cys Ser Gln
245 250 255
Lys Leu Ser Leu Gly Lys Pro Asn Thr His Leu Gly Thr Thr Ala Met
260 265 270
Arg Arg His Met Asn Ala Lys His Lys Ala Leu Trp Glu Gln His Leu
275 280 285
Lys Gly Ser Ser Gln Thr Leu Ser His Pro Pro Ser Ala Pro Ala Ser
290 295 300
Tyr Cys Ser Thr Ser Ala Val Leu Asp Pro Ser Gln Pro Pro Ser Thr
305 310 315 320
Pro Pro Ser Thr Leu Thr Thr Ser Ser Cys Ser Ser Ala Pro Ser Gln
325 330 335
Val Ser Val Arg Ala Met Phe Glu Arg Lys Lys Pro Met Pro Pro Ser
340 345 350
His Pro Leu Ala Arg Arg Leu Thr Ala Gly Leu Ser Ala Leu Leu Ala
355 360 365
Arg Gln Leu Leu Pro Tyr Gln Leu Val Asp Ser Glu Ala Phe His Gln
370 375 380
Phe Val Ala Ile Gly Thr Pro Gln Trp Lys Val Pro Ser Arg Asn Phe
385 390 395 400
Phe Ser Gln Lys Gly Ile Pro His Leu Tyr Gln His Val Gln Ser Gln
405 410 415
Val Thr Ala Ser Leu Ser Phe Ser Val Gly Ala Lys Val His Met Thr
420 425 430
Thr Asp Thr Trp Ser Ser Lys His Gly Gln Gly Arg Tyr Val Thr Tyr
435 440 445
Thr Ala His Trp Val Asn Leu Val Met Ala Gly Lys Gln Gly Met Arg
450 455 460
Gly Ser Thr Thr Val Glu Leu Val Ser Pro Pro Arg Val Ala Cys Gly
465 470 475 480
Ser Ala Thr Thr Ser Thr Pro Pro Leu Leu Ser Asn Ser Ser Ser Lys
485 490 495
Ser Ser Ser Asn Ser Ser Ser Asn Leu Ala Ser Ser Ser Ala Ser Ser
500 505 510
Ser Ser Ala Ala Val Ser Ser Ser Thr Pro Val His Pro Gln Leu His
515 520 525
Ile Gly Tyr Ser Thr Cys Gln Val Arg Arg Cys His Ala Val Leu Gly
530 535 540
Met Thr Cys Leu Glu Ser Arg Asn His Thr Gly Ser Ala Leu Leu Ser
545 550 555 560
Ser Leu His Ser Gln Ala Asp Arg Trp Leu Thr Pro His Gln Leu Lys
565 570 575
Ile Gly Lys Val Val Cys Asp Asn Gly Ser Asn Leu Leu Ala Ala Leu
580 585 590
Arg Leu Gly Asn Leu Thr His Val Pro Cys Met Ala His Val Leu Asn
595 600 605
Leu Ile Val Gln Arg Phe Val Ser Lys Tyr Pro Gly Leu Gln Asp Ile
610 615 620
Leu Arg Gln Ser Arg Lys Val Ser Gly His Phe Arg Arg Ser Tyr Thr
625 630 635 640
Ala Met Ala Arg Leu Ala Asp Ile Gln Arg Arg His Asn Leu Pro Val
645 650 655
Arg Arg Leu Ile Cys Asp Ser Gln Thr Arg Trp Asn Ser Thr Leu Met
660 665 670
Met Phe Glu Arg Leu Leu Gln Gln Gln Arg Ala Val Asn Glu Tyr Leu
675 680 685
Phe Glu Leu Gly Gly Arg Thr Gly Ser Ala Glu Leu Gly Ile Phe Phe
690 695 700
Pro Arg Tyr Trp Val Leu Met Arg Asp Ala Cys Arg Leu Met Arg Pro
705 710 715 720
Phe Asp Glu Val Thr Asn Met Val Ser Arg Thr Glu Gly Thr Ile Ser
725 730 735
Asp Leu Ile Pro Phe Ala Phe Phe Leu Glu Arg Ala Val Arg Arg Val
740 745 750
Thr Asp Asp Ala Val Asp Gln Arg Asp Gln Glu His Asp Phe Trp Ala
755 760 765
Glu Ser Pro Glu Arg Ser Gln Ala Pro Ala Ala Thr Gln Gly Glu Val
770 775 780
Ser Glu Val Glu Ser Glu Glu Glu Gly Gly Phe Val Glu Ala Glu Asp
785 790 795 800
Gln Gln Glu Gln Ala Ser Arg Gly Ala Cys Gly His Leu Leu Trp Ser
805 810 815
Pro Gly Leu Val Arg Gly Trp Gly Glu Glu Thr Val Val Asp Glu Asp
820 825 830
Val Val Leu Asp Asn Glu Glu Gly Glu Met Asp Thr Ser Ala Ser Asn
835 840 845
Leu Val Arg Met Gly Ser Phe Met Leu Ser Cys Leu Leu Lys Asp Pro
850 855 860
Arg Ile Lys Arg Leu Lys Glu Lys Asp Leu Tyr Trp Val Ala Thr Leu
865 870 875 880
Leu Asp Pro Arg Tyr Lys His Lys Val Ala Glu Met Leu Pro Thr Tyr
885 890 895
His Lys Ser Glu Arg Met Leu His Phe Gln Thr Ser Leu Gln Asn Met
900 905 910
Leu Tyr Asn Ala Phe Lys Gly Asp Val Thr Pro His Ser Arg Gly Arg
915 920 925
Gly Ala Gly Asn Pro Pro Thr Ser Thr Pro Ala Arg Thr Met His Phe
930 935 940
Gly His Ser Val Thr Ser Asp Met Gln Ser Phe Phe Ser Pro Arg Gln
945 950 955 960
Arg Gln Asp Pro Ser Gly Ser Thr Leu Arg Glu Arg Leu Asp Arg Gln
965 970 975
Val Ala Asp Tyr Leu Ala Leu Thr Ala Asp Ile Asp Thr Leu Arg Ser
980 985 990
Asp Glu Pro Leu Asp Tyr Trp Val Arg Arg Leu Asp Leu Trp Pro Glu
995 1000 1005
Leu Ser Gln Phe Ala Ile Asn Leu Leu Ser Cys Pro Ala Ser Ser Val
1010 1015 1020
Leu Ser Glu Arg Thr Phe Ser Ala Ala Gly Gly Ile Val Thr Glu Lys
1025 1030 1035 1040
Arg Thr Arg Leu Gly His Lys Ser Val Asp Tyr Leu Thr Phe Ile Lys
1045 1050 1055
Met Asn Glu Ala Trp Ile Ser Glu Gly Tyr Cys Thr Pro Glu Asp Leu
1060 1065 1070
Phe
<210> 78
<211> 429
<212> PRT
<213> Xenopus tropicalis
<400> 78
Met Ala Pro Lys Lys Arg His Ala Tyr Glu Ala Gln Phe Lys Leu Gln
1 5 10 15
Ala Ala Ser Tyr Ala Val Val Asn Gly Asn Arg Ala Ala Ala Lys Glu
20 25 30
Phe Asn Ile Asn Glu Ser Met Val Arg Lys Trp Arg Lys Gln Glu Asn
35 40 45
Glu Leu Arg Gln Val Lys Lys Thr Lys Gln Ser Phe Arg Gly Asn Lys
50 55 60
Ala Arg Trp Pro Gln Leu Glu Asp Gln Leu Glu Gln Trp Val Ile Glu
65 70 75 80
Gln Arg Thr Ala Gly Arg Ser Val Ser Thr Val Thr Ile Arg Leu Lys
85 90 95
Ala Thr Thr Ile Ala Gln Asp Leu Glu Ile Glu His Phe Gln Gly Gly
100 105 110
Pro Ser Trp Cys Phe Arg Phe Met Lys Arg Arg His Leu Ser Ile Arg
115 120 125
Ala Arg Thr Thr Val Ala Gln Gln Leu Pro Ala Asp Tyr Lys Glu Lys
130 135 140
Met Ala Ile Phe Arg Thr Tyr Cys Ser Asn Lys Ile Thr Asp Lys Lys
145 150 155 160
Ile Gln Pro Asn His Ile Thr Asn Met Asp Glu Val Pro Leu Thr Phe
165 170 175
Asp Ile Pro Val Asn His Thr Val Glu Ile Lys Gly Thr Ser Thr Val
180 185 190
Ser Ile Arg Thr Thr Gly His Glu Lys Ser Ala Phe Thr Val Val Leu
195 200 205
Ser Cys His Gly Asn Gly Gln Lys Leu Pro Pro Met Val Ile Phe Lys
210 215 220
Arg Lys Thr Leu Pro Lys Glu Lys Phe Pro Ala Gly Val Ile Val Lys
225 230 235 240
Ala Asn Gln Lys Gly Trp Met Asp Glu Glu Lys Met Arg Glu Trp Leu
245 250 255
Arg Glu Val Tyr Val Lys Arg Pro Asp Gly Phe Phe His Thr Ser Pro
260 265 270
Ser Leu Leu Ile Cys Asp Ser Met Arg Ala His Leu Thr Ala Thr Val
275 280 285
Lys Lys Gln Val Lys Gln Met Asn Ser Glu Leu Ala Ile Ile Pro Gly
290 295 300
Gly Leu Thr Lys Glu Leu Gln Pro Leu Asp Val Gly Val Asn Arg Ala
305 310 315 320
Phe Lys Val Lys Leu Arg Thr Ala Trp Glu Arg Trp Met Thr Asp Gly
325 330 335
Glu His Thr Phe Thr Lys Thr Gly Lys Gln Arg Arg Ala Ser Tyr Ala
340 345 350
Thr Ile Cys Glu Trp Ile Val Asp Ala Trp Ala Lys Val Ser Ala Ile
355 360 365
Thr Val Val Arg Ala Phe Ala Lys Thr Gly Ile Ile Ala Glu Gln Pro
370 375 380
Pro Gly Asn Asp Thr Gly Asn Glu Thr Asp Ser Asp Asn Asp Glu Arg
385 390 395 400
Glu Pro Gly Met Phe Asp Gly Glu Ile Ala Gln Leu Phe Asn Ser Asp
405 410 415
Thr Glu Asp Glu Asp Phe Asp Gly Phe Val Gly Glu Asp
420 425
<210> 79
<211> 12
<212> DNA
<213> Alligator mississippiensis
<400> 79
ccgtattttc tc 12
<210> 80
<211> 6
<212> DNA
<213> Xenopus tropicalis
<400> 80
cccttt 6
<210> 81
<211> 18
<212> DNA
<213> Alligator mississippiensis
<400> 81
ccttcatacg ttcccatg 18
<210> 82
<211> 13
<212> DNA
<213> Alligator mississippiensis
<400> 82
cagtagaacc ccg 13
<210> 83
<211> 16
<212> DNA
<213> Petromyzon marinus
<400> 83
cagtggttct taacct 16
<210> 84
<211> 15
<212> DNA
<213> Alligator mississippiensis
<400> 84
tagggctgtg cgaaa 15
<210> 85
<211> 9
<212> DNA
<213> Microcebus murinus
<400> 85
caggttgag 9
<210> 86
<211> 23
<212> DNA
<213> Trichechus manatus
<400> 86
cagtagtccc cccttatccg cgg 23
<210> 87
<211> 5
<212> DNA
<213> Alligator mississippiensis
<400> 87
taggg 5
<210> 88
<211> 4
<212> DNA
<213> Alligator mississippiensis
<400> 88
tagg 4
<210> 89
<400> 89
000
<210> 90
<211> 216
<212> DNA
<213> Drosophila yakuba
<400> 90
tacagtggcg agcaaaactg agtgcatgtt cacaactctc actttggcca tcaataaaaa 60
cacaaccgct tatgcaaatt caataatttt ttttatatta ttaatcttaa ttaatttata 120
acttatttta tgagaaaaaa caaatttagc atatatattc aaagacttag aataaaaaaa 180
ctaaataaac tcacataaac tcaattttgc acgttt 216
<210> 91
<211> 12
<212> DNA
<213> Alligator mississippiensis
<400> 91
gagaaaatac gg 12
<210> 92
<211> 6
<212> DNA
<213> Xenopus tropicalis
<400> 92
aaaggg 6
<210> 93
<211> 18
<212> DNA
<213> Alligator mississippiensis
<400> 93
catgagaacg gatgaggg 18
<210> 94
<211> 13
<212> DNA
<213> Alligator mississippiensis
<400> 94
cggggttcta ctg 13
<210> 95
<211> 16
<212> DNA
<213> Petromyzon marinus
<400> 95
aggttaagaa ccactg 16
<210> 96
<211> 15
<212> DNA
<213> Alligator mississippiensis
<400> 96
tttcgcacag cccta 15
<210> 97
<211> 9
<212> DNA
<213> Microcebus murinus
<400> 97
ctcaacctg 9
<210> 98
<211> 23
<212> DNA
<213> Trichechus manatus
<400> 98
ccgcggataa ggggggacta ctg 23
<210> 99
<211> 5
<212> DNA
<213> Alligator mississippiensis
<400> 99
cccta 5
<210> 100
<211> 4
<212> DNA
<213> Alligator mississippiensis
<400> 100
ccta 4
<210> 101
<400> 101
000
<210> 102
<211> 216
<212> DNA
<213> Drosophila yakuba
<400> 102
aaacgtgcaa aattgagttt atgtgagttt atttagtttt tttattctaa gtctttgaat 60
atatatgcta aatttgtttt ttctcataaa ataagttata aattaattaa gattaataat 120
ataaaaaaaa ttattgaatt tgcataagcg gttgtgtttt tattgatggc caaagtgaga 180
gttgtgaaca tgcactcagt tttgctcgcc actgta 216
<210> 103
<211> 431
<212> PRT
<213> Alligator mississippiensis
<400> 103
Met Pro Lys Arg Lys Ser Tyr Thr Phe Asp Phe Lys Leu Ser Val Ile
1 5 10 15
Asp Tyr Ala Lys Lys His Gly Asn Arg Ala Ala Gly Arg Glu Phe Ser
20 25 30
Val Asp Glu Lys Ser Val Arg Glu Trp Arg Lys Glu Glu Asp Ile Leu
35 40 45
Lys Thr Leu Asn Pro Arg Lys Arg Ala Arg Arg Gly Lys His Cys Lys
50 55 60
Trp Pro Thr Leu Glu Ala Asn Leu Lys Glu Trp Val Val Ala Gln Arg
65 70 75 80
Glu Ser Asn Lys Val Val Ser Thr Ile Ala Ile Arg Gln Lys Ala Arg
85 90 95
Val Met Ala Asn Glu Met Lys Ile Thr Asp Phe Gly Gly Gly Cys Asn
100 105 110
Trp Val His Lys Phe Met His Arg Asn Asn Leu Ala Val Arg Ser Arg
115 120 125
Thr Thr Val Gly Gln Lys Leu Pro Asp Asp Trp Glu Glu Lys Leu Thr
130 135 140
Lys Phe Arg Asp Phe Val Arg Lys Glu Cys Arg Val His Asn Leu Cys
145 150 155 160
Pro Ala Asp Ile Ile Asn Met Asp Glu Val Pro Ile Ser Phe Asp Val
165 170 175
Pro Ala Thr Arg Thr Val Asp Gln Arg Gly Lys Lys Thr Ile Ala Ile
180 185 190
Ser Thr Thr Gly His Glu Arg Thr Asn Phe Thr Val Val Leu Ala Cys
195 200 205
Thr Ala Ser Gly Val Lys Leu Lys Pro Met Val Ile Phe Lys Arg Val
210 215 220
Thr Met Pro Arg Glu Lys Ile Pro Asn Gly Val Ala Val Ile Cys Asn
225 230 235 240
Lys Lys Gly Trp Met Asn Glu Asp Ile Met Lys Glu Trp Thr Glu Arg
245 250 255
Cys Phe Arg Thr Arg Gln Gly Gly Phe Phe Ala Pro Lys Ser Leu Leu
260 265 270
Ile Phe Asp Ala Met Ala Ala His Lys His Ser Ser Val Gln Lys Gln
275 280 285
Ile Asn Lys Ala Gly Ala His Ile Ala Val Ile Pro Gly Gly Leu Thr
290 295 300
Cys Lys Leu Gln Pro Leu Asp Ile Ser Val Asn His Ser Phe Lys Cys
305 310 315 320
Phe Met Arg Lys Glu Trp Glu Lys Trp Met Ser Gln Gly Val His Ser
325 330 335
Phe Thr Pro Ser Gly Lys Gln Arg Arg Ala Thr Tyr Thr Glu Val Cys
340 345 350
Asn Trp Ile Val Ala Ala Trp Arg Ala Val Lys Pro Ser Ser Ile Ile
355 360 365
Asn Gly Phe Phe Lys Ala Gly Ile Leu Asp Gly Ala Ser Gly Glu Glu
370 375 380
Ser Asp Tyr Thr Asp Ser Glu Asp Tyr Ala Asp Glu Leu Asp Asp Ala
385 390 395 400
Ala Phe Val Asp Ala Tyr Phe Gly Glu Ser Ser Tyr Asp Thr Asp Phe
405 410 415
Glu Gly Phe Pro Ala Ser Glu Lys Glu Glu Ala Pro Asn Trp Val
420 425 430
<210> 104
<211> 589
<212> PRT
<213> Xenopus tropicalis
<400> 104
Met Ala Lys Arg Phe Tyr Ser Ala Glu Glu Ala Ala Ala His Cys Met
1 5 10 15
Ala Ser Ser Ser Glu Glu Phe Ser Gly Ser Asp Ser Glu Tyr Val Pro
20 25 30
Pro Ala Ser Glu Ser Asp Ser Ser Thr Glu Glu Ser Trp Cys Ser Ser
35 40 45
Ser Thr Val Ser Ala Leu Glu Glu Pro Met Glu Val Asp Glu Asp Val
50 55 60
Asp Asp Leu Glu Asp Gln Glu Ala Gly Asp Arg Ala Asp Ala Ala Ala
65 70 75 80
Gly Gly Glu Pro Ala Trp Gly Pro Pro Cys Asn Phe Pro Pro Glu Ile
85 90 95
Pro Pro Phe Thr Thr Val Pro Gly Val Lys Val Asp Thr Ser Asn Phe
100 105 110
Glu Pro Ile Asn Phe Phe Gln Leu Phe Met Thr Glu Ala Ile Leu Gln
115 120 125
Asp Met Val Leu Tyr Thr Asn Val Tyr Ala Glu Gln Tyr Leu Thr Gln
130 135 140
Asn Pro Leu Pro Arg Tyr Ala Arg Ala His Ala Trp His Pro Thr Asp
145 150 155 160
Ile Ala Glu Met Lys Arg Phe Val Gly Leu Thr Leu Ala Met Gly Leu
165 170 175
Ile Lys Ala Asn Ser Leu Glu Ser Tyr Trp Asp Thr Thr Thr Val Leu
180 185 190
Ser Ile Pro Val Phe Ser Ala Thr Met Ser Arg Asn Arg Tyr Gln Leu
195 200 205
Leu Leu Arg Phe Leu His Phe Asn Asn Asn Ala Thr Ala Val Pro Pro
210 215 220
Asp Gln Pro Gly His Asp Arg Leu His Lys Leu Arg Pro Leu Ile Asp
225 230 235 240
Ser Leu Ser Glu Arg Phe Ala Ala Val Tyr Thr Pro Cys Gln Asn Ile
245 250 255
Cys Ile Asp Glu Ser Leu Leu Leu Phe Lys Gly Arg Leu Gln Phe Arg
260 265 270
Gln Tyr Ile Pro Ser Lys Arg Ala Arg Tyr Gly Ile Lys Phe Tyr Lys
275 280 285
Leu Cys Glu Ser Ser Ser Gly Tyr Thr Ser Tyr Phe Leu Ile Tyr Glu
290 295 300
Gly Lys Asp Ser Lys Leu Asp Pro Pro Gly Cys Pro Pro Asp Leu Thr
305 310 315 320
Val Ser Gly Lys Ile Val Trp Glu Leu Ile Ser Pro Leu Leu Gly Gln
325 330 335
Gly Phe His Leu Tyr Val Asp Asn Phe Tyr Ser Ser Ile Pro Leu Phe
340 345 350
Thr Ala Leu Tyr Cys Leu Asp Thr Pro Ala Cys Gly Thr Ile Asn Arg
355 360 365
Asn Arg Lys Gly Leu Pro Arg Ala Leu Leu Asp Lys Lys Leu Asn Arg
370 375 380
Gly Glu Thr Tyr Ala Leu Arg Lys Asn Glu Leu Leu Ala Ile Lys Phe
385 390 395 400
Phe Asp Lys Lys Asn Val Phe Met Leu Thr Ser Ile His Asp Glu Ser
405 410 415
Val Ile Arg Glu Gln Arg Val Gly Arg Pro Pro Lys Asn Lys Pro Leu
420 425 430
Cys Ser Lys Glu Tyr Ser Lys Tyr Met Gly Gly Val Asp Arg Thr Asp
435 440 445
Gln Leu Gln His Tyr Tyr Asn Ala Thr Arg Lys Thr Arg Ala Trp Tyr
450 455 460
Lys Lys Val Gly Ile Tyr Leu Ile Gln Met Ala Leu Arg Asn Ser Tyr
465 470 475 480
Ile Val Tyr Lys Ala Ala Val Pro Gly Pro Lys Leu Ser Tyr Tyr Lys
485 490 495
Tyr Gln Leu Gln Ile Leu Pro Ala Leu Leu Phe Gly Gly Val Glu Glu
500 505 510
Gln Thr Val Pro Glu Met Pro Pro Ser Asp Asn Val Ala Arg Leu Ile
515 520 525
Gly Lys His Phe Ile Asp Thr Leu Pro Pro Thr Pro Gly Lys Gln Arg
530 535 540
Pro Gln Lys Gly Cys Lys Val Cys Arg Lys Arg Gly Ile Arg Arg Asp
545 550 555 560
Thr Arg Tyr Tyr Cys Pro Lys Cys Pro Arg Asn Pro Gly Leu Cys Phe
565 570 575
Lys Pro Cys Phe Glu Ile Tyr His Thr Gln Leu His Tyr
580 585
<210> 105
<211> 626
<212> PRT
<213> Alligator mississippiensis
<400> 105
Met Arg Arg Gln Arg Ile Phe Ser Ala Glu Ala Cys Leu Ala Gln Val
1 5 10 15
Thr Gly Asp Asp Ser Asp Thr Ser Thr Asp Glu Ile Leu Ser Gln Gly
20 25 30
Ser Glu Asp Ala Asp Phe Val Pro Asp Met Gly Asp Cys Ser Glu Gln
35 40 45
Glu Asp His Ala Ser Thr Glu Ala Ser Ser Ser Ser Asp Glu Glu Glu
50 55 60
Leu Val Pro Gln Ala Glu Val Met Pro Thr Leu Pro Val Gly Lys Gly
65 70 75 80
Arg Gly Pro Ala Arg Gly Arg Arg Gly Arg Pro Arg Arg Ala Thr Ala
85 90 95
Gly Arg Gly Ala Glu Pro Leu Pro Pro Pro Pro Glu Asn Ile Ala Asp
100 105 110
Asp Asp Thr Phe Arg Gly Arg Asn Gly Arg Val Trp Gly Lys Ser Pro
115 120 125
Gln Leu Ile His His Arg Arg Thr Ala Lys Asp Ile Val His Glu Ser
130 135 140
Ala Gly Pro Thr Arg Glu Ser Asn Lys Asp Thr Val Val Glu Thr Phe
145 150 155 160
His Leu Phe Leu Ser Gln Asp Ile Leu Thr Val Ile Ile Arg Glu Thr
165 170 175
Asn Arg Glu Ala Glu Arg Arg Phe Arg Glu Trp Asn Asp Ser His Pro
180 185 190
Glu Asn Arg Lys Glu Trp Lys Lys Leu Asp Glu Thr Glu Leu Lys Ala
195 200 205
Tyr Ile Gly Leu Leu Leu Leu Ser Gly Leu Tyr His Gly Gly His Glu
210 215 220
Ala Leu Glu Glu Leu Trp Glu Gln Arg Thr Gly Arg Pro Cys Phe Arg
225 230 235 240
Ala Thr Met Ser Leu Lys Arg Phe Arg Gln Ile Thr Asn Tyr Leu Arg
245 250 255
Phe Asp Asn Lys Leu Thr Arg Glu Glu Arg Arg Ala Val Asp Lys Leu
260 265 270
Ala Ala Phe Arg Asp Ile Trp Thr Gln Phe Val Glu Gln Leu Arg Lys
275 280 285
Trp Tyr Ile Pro Gly Ile His Leu Thr Val Asp Glu Gln Leu Ile Ala
290 295 300
Phe Arg Gly Arg Cys Pro Phe Arg Gln Tyr Met Pro Ser Lys Pro Ala
305 310 315 320
Lys Tyr Gly Leu Lys Ile Trp Trp Cys Cys Asp Ala Ala Thr Ser Phe
325 330 335
Pro Leu Ser Gly Asp Ile Tyr Leu Gly Lys Gln Pro Glu Ala Pro Arg
340 345 350
Gln Gly Asn Leu Gly Thr Gln Val Ile Glu Lys Leu Val His Pro Trp
355 360 365
Tyr Lys Thr Gly Arg Asn Ile Val Gly Asp Asn Phe Phe Thr Ser Thr
370 375 380
Asp Leu Ala Glu Arg Leu Leu Gln Gln Asp Leu Thr Tyr Val Gly Thr
385 390 395 400
Ile Arg Lys Asn Lys Ala Asp Ile Pro Asn Glu Met Gln Ala Asn Arg
405 410 415
Arg Arg Glu Thr Phe Ser Ser Ile Phe Ala Phe Asp Gly Glu Leu Thr
420 425 430
Leu Val Ser Tyr Val Pro Lys Lys Ser Lys Val Val Leu Leu Leu Ser
435 440 445
Ser Met His His Asp Leu Ser Val Gly Gly Glu Gln Arg Lys Pro Asp
450 455 460
Ile Ile His Asp Tyr Asn Lys Asn Lys Gly Gly Val Asp Asn Leu Asp
465 470 475 480
His Leu Val Arg Met Thr Thr Cys Arg Arg Lys Ile Asn Arg Trp Pro
485 490 495
Met Thr Leu Phe Phe Asn Met Leu Asp Val Ala Ala Ile Ala Ser Leu
500 505 510
Ile Ile Trp Leu Gly His Asn Ala Asn Trp Lys Gln Arg Ser His Leu
515 520 525
Arg Arg Arg Arg Phe Phe Leu Gln Glu Leu Gly Glu Gln Leu Ile Asp
530 535 540
Gly Gln Ile Lys Arg Arg Met Met Asp Thr Arg Asn Leu Ser Lys Ser
545 550 555 560
Val Lys Ser Gly Met Thr Ala Leu Asn Tyr Lys Leu Pro Gln Arg Thr
565 570 575
Pro Val Glu Pro Ser Ala Ser Met Ser Gly Arg Cys Ala Phe Cys Pro
580 585 590
Arg Thr Asp Asp Arg Lys Thr Arg Lys Arg Cys Glu Asp Cys Lys Arg
595 600 605
Phe Ala Cys Val His His Ser Thr Ser Leu Leu Leu Cys Glu Glu Cys
610 615 620
Asn Ile
625
<210> 106
<211> 627
<212> PRT
<213> Alligator mississippiensis
<400> 106
Met Arg Arg Pro Ser Gln Met Glu Leu Arg Ala Ala Trp Val Pro Lys
1 5 10 15
Gln Asp Ser Gly Phe Ser Leu Ser Val Ala Ile Val Phe Lys Met Ser
20 25 30
Ala Ser Asn Thr Asp Ser Thr Ser Ala Ser Ala Ser Thr Arg Lys Arg
35 40 45
Lys Ala Ile Thr Leu Glu Glu Lys Leu Glu Val Val Lys Arg Tyr Glu
50 55 60
Arg Gly Glu Lys Thr Lys Glu Ile Arg Cys Ala Thr Gly Leu Ser Glu
65 70 75 80
Ser Thr Leu Arg Thr Ile Arg Asp Asn Ala Glu Lys Ile Lys Glu Ser
85 90 95
Cys Lys Ser Ala Thr Arg Leu Ser Thr Ala Arg Val Ser Leu Thr Arg
100 105 110
Ser Ala Ile Met Glu Lys Met Glu Arg Met Leu Thr Thr Trp Ile Glu
115 120 125
His Gln Asn Gln Glu His Val Pro Leu Ser Thr Gln Val Ile Gln Ala
130 135 140
Lys Ala Arg Ser Ile Tyr Glu Val Leu Lys Arg Asp Asp Pro Glu Ala
145 150 155 160
Lys Pro Phe Asn Ala Ser Ala Gly Trp Phe Asp Arg Phe Lys Ala Arg
165 170 175
His Gly Phe His Asn Leu Lys Leu Thr Gly Glu Ala Ala Ala Ala Asp
180 185 190
Lys Ser Ala Ala Asp Lys Phe Pro Ser Ile Leu Gln Ala Ala Ile Glu
195 200 205
Glu Gly Ser Tyr Asp Pro Arg Gln Val Phe Asn Leu Asp Glu Thr Gly
210 215 220
Leu Phe Trp Lys Arg Met Pro Ser Arg Thr Phe Ile Ser Val Glu Glu
225 230 235 240
Arg Thr Ala Pro Gly Phe Lys Ala Ala Lys Asp Arg Cys Thr Leu Leu
245 250 255
Leu Gly Ala Asn Ala Ala Gly Asp Phe Lys Leu Lys Pro Leu Met Val
260 265 270
Tyr His Ala Glu Asn Pro Arg Ala Leu Lys Gly Tyr Ala Lys Gly His
275 280 285
Leu Pro Val Tyr Trp Arg Ala Asn Arg Lys Gly Trp Val Thr Gly Ser
290 295 300
Leu Phe Glu Asp Tyr Phe Ser Ser Leu Leu His Leu Glu Leu Arg Ala
305 310 315 320
Tyr Cys Asp Arg Gln Asn Leu Pro Phe Lys Ile Leu Leu Leu Leu Asp
325 330 335
Asn Ala Pro Gly His Pro Pro Ser Leu Gly Asp Leu Ser Glu Asn Ile
340 345 350
Lys Val Leu Phe Leu Pro Pro Asn Thr Thr Ser Leu Ile Gln Pro Met
355 360 365
Asp Gln Gly Val Ile Arg Ala Phe Lys Ser Tyr Tyr Leu Arg Arg Thr
370 375 380
Phe Lys Lys Leu Ile Asn Glu Thr Glu Ser Lys Glu Lys Ala Asn Val
385 390 395 400
Lys Glu Phe Trp Lys Ala Phe Asn Ile Lys Met Ala Ile Asp Ile Ile
405 410 415
Gly Asp Ala Trp Asn Asp Val Thr Gln Gln Cys Leu Asn Gly Val Trp
420 425 430
Lys Asn Ile Trp Pro Ala Val Val Asn Asp Phe Arg Gly Phe Ala Ala
435 440 445
Asp Glu Phe Ile Ser Asp Ala Arg His Glu Ile Val Glu Met Ala Lys
450 455 460
Ser Val Gly Phe Glu Gln Val Asp Glu Glu Asn Val Ala Glu Leu Leu
465 470 475 480
Asp Ser His Arg Glu Glu Leu Ser Asn Glu Asp Leu Leu Glu Leu Asp
485 490 495
Arg Glu Arg His Glu Glu Glu Glu Pro Met Glu Glu Asn Glu Arg Pro
500 505 510
Ser Pro Arg Val Leu Thr Met Lys Gly Met Ala Asp Ala Phe Lys Leu
515 520 525
Leu Asp Gly Tyr Leu Ala Phe Phe Asp Glu Asn Asp Pro Asn Arg Glu
530 535 540
Arg Ser Ala Lys Val Ala Arg Leu Met Lys Glu Ala Asn Ala Cys Tyr
545 550 555 560
Thr Glu Leu Tyr Arg Glu Lys Arg Arg Cys Ser Val Gln Ser Ser Leu
565 570 575
Asp Lys Phe Phe Arg Lys Arg Asp Ser Thr Ile Ser Thr Gln Ser Thr
580 585 590
Asp Ser Gln Pro Ser Thr Ser Gly Gly Glu Pro Ala Thr Ser Gly Gly
595 600 605
Glu Ile Ser Pro Pro Ser Phe Asp Val Phe Asp Leu Asp Glu Asp Ser
610 615 620
Ala Pro His
625
<210> 107
<211> 602
<212> PRT
<213> Petromyzon marinus
<400> 107
Met Ser Gly Lys Arg Arg Lys Trp Ser Asp Glu Tyr Val Gln His Gly
1 5 10 15
Phe Ser Cys Ile Thr Glu Arg Asp Gly Ser Glu Arg Pro Ile Cys Met
20 25 30
Ile Cys Asn Ala Lys Leu Ser Asn Ser Ser Leu Ala Pro Ala Lys Leu
35 40 45
Lys Glu His Phe Leu Lys Leu His Gly Asp Gly Glu Tyr Lys Asn Thr
50 55 60
Thr Leu Ala Glu Phe Arg Val Lys Arg Ala Arg Phe Asp Glu Arg Ala
65 70 75 80
Thr Leu Pro Ala Leu Gly Phe Val Pro Val Asn Lys Pro Ile Leu Thr
85 90 95
Ala Ser Tyr Glu Val Ala Tyr Leu Ile Ala Lys Gln Gly Lys Pro His
100 105 110
Thr Ile Gly Glu Thr Leu Val Lys Pro Ala Ala Leu Lys Met Ala Asn
115 120 125
Leu Ile Leu Gly Thr Ala Ala Glu Gly Lys Leu Ser Gln Ile Pro Leu
130 135 140
Ser Asn Asp Thr Val Ser Asp Arg Ile Glu Asp Met Ser Lys Asp Ile
145 150 155 160
Leu Ala Gln Val Val Ala Asp Leu Ile Ser Ser Pro Ala Lys Phe Ser
165 170 175
Leu Gln Leu Asp Glu Thr Thr Asp Val Ser Asp Leu Ser Gln Leu Ala
180 185 190
Val Phe Val Arg Tyr Val Lys Asp Asp Met Ile Lys Glu Glu Phe Leu
195 200 205
Phe Cys Lys Pro Leu Thr Thr Thr Thr Lys Ala Ala Asp Val Lys Lys
210 215 220
Leu Val Asp Asp Phe Phe Arg Asp Asn Asn Leu Ser Trp Asp Met Val
225 230 235 240
Ser Ala Val Cys Thr Asp Gly Ala Pro Val Met Leu Gly Arg Lys Ser
245 250 255
Gly Phe Gly Ala Leu Val Lys Ala Asp Ala Pro His Ile Ile Val Thr
260 265 270
His Cys Ile Leu His Arg His Ala Leu Ala Thr Lys Thr Leu Pro Pro
275 280 285
Lys Met Ala Glu Val Leu Lys Thr Val Val Glu Cys Val Asn Tyr Val
290 295 300
Arg Lys Ser Ala Leu Arg His Arg Ile Phe Ser Glu Leu Cys Lys Glu
305 310 315 320
Met Gly Ser Glu Phe Glu Val Leu Leu Leu His Ser Asn Ile Arg Trp
325 330 335
Leu Ser Arg Gly Gln Val Leu Asn Arg Val Phe Ala Met Arg Val Glu
340 345 350
Leu Ala Leu Phe Leu Gln Glu His Gln His Cys His Ala Asp Cys Phe
355 360 365
Lys Asn Pro Glu Phe Ile Leu Ile Leu Ala Tyr Met Ala Asp Ile Phe
370 375 380
Ala Ala Leu Asn His Leu Asn Gln Gln Met Gln Gly Gly Gly Val Asn
385 390 395 400
Ile Met Glu Ala Glu Glu His Leu Lys Ala Phe Gln Lys Lys Leu Pro
405 410 415
Leu Trp Lys Arg Arg Thr Glu Asn Asn Asn Phe Ala Asn Phe Pro Leu
420 425 430
Leu Asp Asp Cys Ala Ser Lys Ile Glu Asp Val Ser Gly Ile Gly Asp
435 440 445
Ile Ser Val Ser Thr Glu Leu Lys Gln Thr Ile Ala Thr His Leu Asp
450 455 460
Glu Leu Ala Lys Ser Leu Asp Gly Tyr Phe Pro Thr Arg Glu Ser Tyr
465 470 475 480
Pro Ala Trp Val Arg Gln Pro Phe Thr Phe Ala Val Glu Thr Ala Asp
485 490 495
Val Asn Asp Glu Phe Leu Asp Glu Ile Ile Glu Ile Gln Gln Ser Gln
500 505 510
Val Gln Gln Gln Leu Phe Arg Thr Thr Thr Leu Ser Thr Phe Trp Cys
515 520 525
Arg Gln Met Asn Lys Tyr Pro Val Ile Ala Lys Lys Ala Leu Asp Phe
530 535 540
Phe Ile Pro Phe Val Thr Thr Tyr Leu Cys Glu Gln Ser Phe Ser Arg
545 550 555 560
Met Leu Asp Ile Lys Thr Lys Lys Arg Asn Arg Leu Cys Cys Glu Asn
565 570 575
Asp Met Arg Val Ala Leu Ala Lys Val Lys Pro Arg Ile Ser Glu Leu
580 585 590
Ile Ser Gln Arg Gln Gln Gln Lys Ser His
595 600
<210> 108
<211> 757
<212> PRT
<213> Alligator mississippiensis
<400> 108
Met Thr Val Ser Ser Thr Pro Ile Ser Leu Pro Met Leu Ser Leu Pro
1 5 10 15
Val Pro Glu Glu Glu Leu Glu Leu Asp Leu Asp Leu Ser Ala Ile Ala
20 25 30
Arg Glu Ile Leu Gly Lys Glu Gly Glu Ser Ser Glu Phe Val Leu His
35 40 45
Thr Pro Gln Val Ser Pro Arg Ala Arg Ser Pro Ser Pro Glu Gly Thr
50 55 60
Ser Glu Glu Ala Glu Val Glu Val Ala Glu Ala Ser Gly Ser Ala Glu
65 70 75 80
Ser Ala Pro Pro Val Ala Val Pro Leu Pro Ala Glu Glu Gly Glu Lys
85 90 95
Ala Ala Ser Ala His Ala Pro Ala Pro Gln Lys Arg Ala Gly Ser Val
100 105 110
Val Trp Asp His Phe Glu Leu Ala Asp Asp Pro Thr Tyr Ala Ile Cys
115 120 125
Leu His Cys Arg Ala Lys Thr Ser Arg Gly Lys Gly Thr Lys His Met
130 135 140
Ser Thr Thr Gly Met Leu Met His Leu Arg Arg His His Pro Leu Ala
145 150 155 160
Leu Ala Pro Pro Gln Pro Gly Thr Ser Gly Ser Val Pro Lys Gly Lys
165 170 175
Ser Pro Ser Arg Ser Lys Ala Pro Val Pro Pro Lys Gln Arg Gln Ala
180 185 190
Thr Leu Glu Gln Trp Gly Lys Gly Gly Gln Lys Gly Gly Arg Val Ala
195 200 205
Arg Ala Ser Glu Ile Thr Gln Ser Ile Gly Glu Met Leu Ala Val Asp
210 215 220
Gly Gln Pro Phe Ser Leu Val Glu Arg Pro Gly Phe Arg Arg Leu Met
225 230 235 240
Ala Leu Val Ala Pro Ser Tyr Gln Val Pro Ala Arg Thr Thr Phe Ser
245 250 255
Arg Thr Val Val Pro Ser Leu Tyr Glu Ala Cys Arg Glu Tyr Leu Arg
260 265 270
Glu Glu Leu Arg Lys Ala Gly Pro Gln Val Ala Leu His Phe Thr Ser
275 280 285
Asp Ile Trp Ser Ser Arg Gly Gly Asp His Ala Tyr Leu Ser Leu Thr
290 295 300
Gly His Trp Cys Asp Gln Ser Gly Arg Arg Trp Ala Leu Leu Gln Ala
305 310 315 320
Glu Val Met Asp Glu Ser His Thr Ala Thr Glu Ile Met Gly Ala Met
325 330 335
Asn Arg Leu Val Gln Gly Trp Leu Val Gly Gln Gly Glu Leu Thr Arg
340 345 350
Gly Phe Met Val Thr Asp Asn Gly Ala Asn Met Val Lys Ala Val Arg
355 360 365
Asp Ala Asn Phe Val Gly Ile Arg Cys Val Ala His Lys Phe His Leu
370 375 380
Ile Val Arg Asp Ala Leu Glu Gly Asp Arg Ala Ala Gly Asp Gly Ala
385 390 395 400
Ser Thr Thr Ser Lys Leu Ile Ser Lys Cys Arg Lys Val Ala Gly Tyr
405 410 415
Phe His Arg Ser Ile Lys Gly Gly Lys Met Leu Arg Asp Lys Gln Ala
420 425 430
Glu Leu Asn Ile Pro Gln His Lys Ile Met Gln Asp Val Glu Thr Arg
435 440 445
Trp Asn Ser Thr Tyr Leu Met Leu Glu Arg Leu Val Glu Gln Gln Lys
450 455 460
Ala Ile His Glu Met Ala Leu Leu Gly Glu Ile Gly Ile Ser Gly Pro
465 470 475 480
Leu Asn Arg Ala Glu Trp Asp Thr Ile Ser Gln Ile Leu Val Val Leu
485 490 495
Lys Pro Phe Leu Glu Ala Thr Glu Thr Leu Ser Ala Gly Asp Ala Leu
500 505 510
Leu Ser Gln Val Ile Pro Val Val Arg Glu Leu Gln Ser Gln Met Glu
515 520 525
Ser Phe Gln Gly Ile Asn Val Pro Gly Trp Gly Lys Pro Leu Ser Pro
530 535 540
Asp Val Gln Ala Leu Val Arg Arg Leu Lys Glu Gly Ile Arg Lys Arg
545 550 555 560
Leu Asp Pro Leu Arg Ser Ser Thr Val His Val Leu Ala Ala Thr Cys
565 570 575
Asp Pro Arg Val Lys Gly Ser Val Cys Gly Ser Gln Ser Leu Asn Gln
580 585 590
Trp Thr Glu Val Leu Val Lys Arg Val Arg Glu Ala Glu Arg Arg Arg
595 600 605
Arg Gly Asp Val Glu Glu Gly Asp Pro Leu Ser Arg Ala Ser Thr Pro
610 615 620
Ser Thr Ser Gln Ser Pro Pro Pro Pro Gln Ala Leu Pro Met Trp Ala
625 630 635 640
Lys Gly Met Ala Ser Met Val Gly Ser Arg Gly Thr Arg Pro His His
645 650 655
Gln Ala Gly Ser Ala Gln Ala Leu Val Ala Ala Tyr Leu Ala Glu Asp
660 665 670
Val Glu Pro Leu Leu Cys Asp Pro Leu Ala Tyr Trp Ala Ser Arg Ser
675 680 685
Gln Met Trp Pro Asp Leu Ala Thr Val Ala Arg Glu His Leu Ser Cys
690 695 700
Pro Pro Thr Ser Val Pro Ser Glu Arg Val Phe Ser Ile Ala Gly Asp
705 710 715 720
Val Val Thr Pro His Arg Thr Ser Leu Asp Pro Gly Leu Val Glu Gln
725 730 735
Leu Val Phe Leu Lys Val Asn Leu Pro Leu Leu Gly Phe Pro Lys Leu
740 745 750
Gln Val Gln Thr Glu
755
<210> 109
<211> 554
<212> PRT
<213> Microcebus murinus
<400> 109
Met Ser Lys Arg Pro Ala Asp Thr Pro Met Gly Asn Ser Asp Lys Lys
1 5 10 15
Lys Arg Lys His Leu Cys Leu Ser Ile Ala Gln Lys Val Lys Leu Leu
20 25 30
Glu Lys Leu Asp Ser Gly Val Ser Val Lys Arg Leu Thr Glu Glu Tyr
35 40 45
Gly Val Gly Met Thr Thr Ile Tyr Asp Leu Lys Lys Gln Lys Asp Lys
50 55 60
Leu Leu Lys Phe Tyr Ala Glu Ser Asp Glu Gln Lys Leu Met Lys Asn
65 70 75 80
Arg Lys Thr Leu His Lys Ala Lys Asn Glu Asp Leu Asp Arg Val Leu
85 90 95
Lys Glu Trp Ile Arg Gln Arg Arg Ser Glu His Met Pro Leu Asn Gly
100 105 110
Met Leu Ile Met Lys Gln Ala Lys Ile Tyr His Asp Glu Leu Lys Ile
115 120 125
Glu Gly Asn Cys Glu Tyr Ser Thr Gly Trp Leu Gln Lys Phe Lys Lys
130 135 140
Arg His Gly Ile Lys Phe Leu Lys Ile Cys Gly Asp Lys Ala Ser Ala
145 150 155 160
Asp His Glu Ala Ala Glu Lys Phe Ile Asp Glu Phe Ala Lys Val Ile
165 170 175
Ala Asp Glu Asn Leu Thr Pro Glu Gln Val Tyr Asn Ala Asp Glu Thr
180 185 190
Ser Leu Phe Trp Arg Tyr Cys Pro Arg Lys Thr Leu Thr Thr Ala Asp
195 200 205
Glu Thr Ala Pro Thr Gly Ile Lys Asp Ala Lys Asp Arg Ile Thr Val
210 215 220
Leu Gly Cys Ala Asn Ala Ala Gly Thr His Lys Cys Lys Leu Ala Val
225 230 235 240
Ile Gly Lys Ser Leu Arg Pro Arg Cys Phe Gln Gly Val Asn Phe Leu
245 250 255
Pro Val His Tyr Tyr Ala Asn Lys Lys Ala Trp Ile Thr Arg Asp Ile
260 265 270
Phe Ser Asp Trp Phe His Lys His Phe Val Pro Ala Ala Arg Ala His
275 280 285
Cys Arg Glu Ala Gly Leu Asp Asp Asp Cys Lys Ile Leu Leu Phe Leu
290 295 300
Asp Asn Cys Ser Ala His Pro Pro Ala Glu Ile Leu Ile Lys Asn Asn
305 310 315 320
Val Tyr Ala Met Tyr Phe Pro Pro Asn Val Thr Ser Leu Ile Gln Pro
325 330 335
Cys Asp Gln Gly Ile Leu Arg Ser Met Lys Ser Lys Tyr Lys Asn Thr
340 345 350
Phe Leu Asn Ser Met Leu Ala Ala Val Asn Arg Gly Val Gly Val Glu
355 360 365
Gly Phe Gln Lys Glu Phe Ser Met Lys Asp Ala Ile Tyr Ala Val Ala
370 375 380
Asn Ala Trp Asn Thr Val Thr Lys Asp Thr Val Val His Ala Trp His
385 390 395 400
Asn Leu Trp Pro Ala Thr Met Phe Ser Asp Asp Asp Glu Gln Gly Gly
405 410 415
Asp Phe Glu Gly Phe Arg Met Ser Ser Glu Lys Lys Met Met Ser Asp
420 425 430
Leu Leu Thr Tyr Ala Lys Asn Ile Pro Ser Glu Ser Val Ser Lys Leu
435 440 445
Glu Glu Val Asp Ile Glu Glu Val Phe Asn Ile Asp Asn Glu Ala Pro
450 455 460
Val Val His Ser Leu Thr Asp Gly Glu Ile Ala Glu Met Val Leu Asn
465 470 475 480
Gln Gly Asp Arg Asp Asn Ser Asp Asp Glu Asp Asp Val Val Asn Thr
485 490 495
Ala Glu Lys Val Pro Ile Asp Asp Met Val Lys Met Cys Asp Gly Leu
500 505 510
Ile Glu Gly Leu Glu Gln Arg Ala Phe Ile Thr Glu Gln Glu Ile Met
515 520 525
Ser Val Tyr Lys Ile Lys Glu Arg Leu Leu Arg Gln Lys Pro Leu Leu
530 535 540
Met Arg Gln Met Thr Leu Glu Glu Thr Phe
545 550
<210> 110
<211> 642
<212> PRT
<213> Trichechus manatus
<400> 110
Met Ala Pro Lys Arg Lys Ser Ser Asp Ala Gly Asn Ser Asp Met Pro
1 5 10 15
Lys Arg Ser Arg Lys Val Leu Pro Leu Ser Glu Lys Val Lys Val Leu
20 25 30
Asp Leu Ile Arg Lys Glu Lys Lys Ser Tyr Ala Glu Val Ala Lys Ile
35 40 45
Tyr Gly Lys Asn Glu Ser Ser Ile Arg Glu Ile Val Lys Lys Glu Lys
50 55 60
Glu Ile Arg Ala Ser Phe Ala Val Ala Pro Gln Thr Ala Lys Val Thr
65 70 75 80
Ala Thr Val Arg Asp Lys Cys Leu Val Lys Met Glu Lys Ala Leu Asn
85 90 95
Leu Trp Val Glu Asp Met Asn Arg Lys Arg Val Pro Ile Asp Gly Asn
100 105 110
Val Leu Arg Gln Lys Ala Leu Ser Leu Tyr Glu Asp Phe Ser Lys Gly
115 120 125
Ser Pro Glu Thr Ser Asp Thr Lys Pro Phe Thr Ala Ser Lys Gly Trp
130 135 140
Leu His Arg Phe Arg Asn Arg Phe Gly Leu Lys Asn Ile Lys Ile Thr
145 150 155 160
Gly Glu Ala Ala Ser Ala Asn Glu Glu Ala Ala Ala Thr Phe Pro Ala
165 170 175
Glu Leu Lys Lys Leu Ile Lys Glu Lys Gly Tyr His Pro Lys Gln Val
180 185 190
Phe Asn Cys Asp Glu Thr Gly Leu Phe Trp Lys Lys Met Pro Asn Arg
195 200 205
Thr Tyr Ile His Lys Ser Ala Lys Glu Ala Pro Gly His Lys Thr Trp
210 215 220
Lys Asp Arg Leu Thr Leu Val Leu Cys Gly Asn Ala Ala Gly His Met
225 230 235 240
Ile Lys Pro Gly Val Val Tyr Arg Ala Lys Asn Pro Arg Ala Leu Lys
245 250 255
Asn Lys Asn Lys Asn Tyr Leu Pro Val Phe Trp Gln His Asn Gln Lys
260 265 270
Ala Trp Val Thr Ala Ile Leu Phe Met Glu Trp Phe His Gln Cys Phe
275 280 285
Ile Pro Glu Val Lys Lys Tyr Leu Glu Glu Glu Gly Leu Glu Phe Lys
290 295 300
Val Leu Leu Ile Ile Asp Asn Ala Pro Gly His Pro Glu Ser Val Cys
305 310 315 320
Tyr Glu Asn Glu Asn Val Glu Val Val Phe Leu Pro Pro Asn Thr Thr
325 330 335
Ser Leu Leu Gln Pro Leu Asp Gln Gly Ile Ile Arg Phe Val Lys Ala
340 345 350
Thr Tyr Thr Arg Leu Val Phe Asp Arg Ile Arg Ser Ala Ile Asp Ala
355 360 365
Asp Pro Asn Leu Asp Ile Met Gln Cys Trp Lys Ser Phe Thr Ile Ala
370 375 380
Asp Ala Ile Thr Phe Ile Lys Ala Ala Met Asp Glu Leu Lys Pro Glu
385 390 395 400
Thr Val Asn Ala Cys Trp Lys Asn Leu Trp Ser Glu Val Val Asn Asp
405 410 415
Phe Lys Gly Phe Pro Gly Ile Asp Gly Glu Val Arg Lys Ile Ile His
420 425 430
Ala Ala Arg Gln Val Gly Gly Glu Gly Phe Ala Asp Met Leu Asp Glu
435 440 445
Glu Val Glu Glu His Ile Glu Gly His Arg Glu Val Leu Thr Asn Glu
450 455 460
Glu Leu Glu Glu Leu Val Glu Ser Ser Thr Glu Glu Glu Glu Asp Glu
465 470 475 480
Glu Glu Thr Glu Ala Glu Pro Ala Met Trp Thr Leu Pro Lys Phe Ala
485 490 495
Glu Val Phe Arg Ile Ala Gln Thr Leu Lys Asp Lys Ile Met Glu Tyr
500 505 510
Asp Pro Arg Met Glu Arg Ser Ile Lys Val Thr Arg Met Ile Thr Glu
515 520 525
Gly Leu Gln Pro Leu Gln Gln His Phe Asp Glu Leu Lys Arg Lys Arg
530 535 540
Gln Gln Leu Pro Ile Thr Met Phe Phe Gln Lys Ile Ser Ala Lys Asn
545 550 555 560
Leu Gln Leu Ser Arg Ile Pro Asn His Arg His Arg Leu Leu Leu Thr
565 570 575
Ser Asn His Arg His Arg His Gly Ser Met Ile Gln Asp His Pro Lys
580 585 590
Gln Met Ile Leu Leu Leu Thr Tyr Arg Gln Lys Val Asn Ser Ser Leu
595 600 605
Thr Leu Arg His Asn Ala Tyr Val Ile His Leu Thr Ser Ser His His
610 615 620
Val Gly Ile Val Ser Ser His Ile Ile Thr Arg Arg Arg Val Ser Thr
625 630 635 640
Val Gln
<210> 111
<211> 582
<212> PRT
<213> Alligator mississippiensis
<400> 111
Met Asn Ala Lys Lys Ser Ser Lys Thr Ala Lys Tyr Val Ser Ala Leu
1 5 10 15
Asp Arg Ala Arg Gln Tyr Pro Ala Gly Thr Leu His Ala Asp Gly Gly
20 25 30
Arg Leu Phe Cys Thr Ser Cys Asn Val Thr Leu Asp Val Ser Arg Lys
35 40 45
Thr Ser Ile Asp Arg His Leu Glu Ser Glu Ala His Met Lys Arg Lys
50 55 60
Ala Ala Ala Glu Ala Glu Gly Gln Ser Lys Lys Gln Ala Thr Val Ser
65 70 75 80
Ser Leu Phe Lys Arg Thr Thr Glu Ser Ser Leu Ala Arg Arg Glu Ala
85 90 95
Ala Phe Ser Leu Val Glu Ala Phe Ala Ala Ala Asn Ile Pro Leu Glu
100 105 110
Lys Leu Asp His Pro Lys Leu Arg Asp Tyr Leu Asn Gln Asn Val Pro
115 120 125
Asn Ala Gly Ser Phe Pro Arg Ala Asn Lys Leu Arg Gln Asp Tyr Leu
130 135 140
Pro Ala Val Ile Ala Ser His Val Gln Ser Thr Lys Ala Ala Leu Ala
145 150 155 160
Glu Tyr His Ser Phe Ser Ile Val Ala Asp Glu Ala Thr Asp Pro Gln
165 170 175
Asp Asn Tyr Val Leu His Ile Leu Phe Val Pro Gly Ser Trp Thr Asp
180 185 190
Arg Asp Leu Pro Val Phe Gln Thr Glu Pro Val His Leu Thr Ser Val
195 200 205
Asn Phe Ser Thr Val Ser Gln Ala Ile Val Lys Val Ile Val Ser Tyr
210 215 220
Gly Val Asp Phe Asn Lys Ile Ser Ala Phe Leu Ser Asp Asn Ala Met
225 230 235 240
Tyr Met Cys Lys Ala Phe Ser Asp Val Leu Gln Gly Met Leu Pro Asn
245 250 255
Ala Val His Val Thr Cys Asn Ala His Ile Leu Ser Leu Val Ser Asp
260 265 270
Ile Trp Arg Thr Gln Phe Pro Glu Val Asp Ser Leu Val Ser Ser Phe
275 280 285
Lys Lys Ala Phe Lys His Cys Pro Gly Arg Lys Val Arg Tyr Arg Glu
290 295 300
Ser Val Ala Ser Gln Ser Gly Asp Ser His Gly Thr Val Pro Leu Pro
305 310 315 320
Pro Glu Pro Val Leu Thr Arg Trp Asn Ser Trp Phe Asn Ala Val Arg
325 330 335
Tyr His Ala Lys His Met Gln His Tyr Gln Gln Phe Val Ser Glu Glu
340 345 350
Leu Glu Ile Thr Pro Ser Thr Gln Cys Met Leu Lys Leu Arg Asp Leu
355 360 365
Leu Gly Arg Gly Asp Ile Gln Asp Gln Val Thr Phe Val Ala Asp Asn
370 375 380
Ala Thr Arg Phe Met Glu Leu Leu Thr Trp Phe Glu Gly Arg Gln Ala
385 390 395 400
Val Ile His His Ala His Asn Lys Leu Met Asp Leu Ile Ser Trp Val
405 410 415
Glu Asp Arg Ala Ser Gln Glu Leu Ser Ser Cys Pro Arg Glu Asn Gln
420 425 430
Arg Arg Arg Asp Leu Phe Gln Ala Ile Ala Val Lys Leu Asn Gln Tyr
435 440 445
Tyr Arg Tyr Asp Pro Ser Leu Pro Pro Arg Phe Arg Gln Pro Ala Ala
450 455 460
Pro Phe Leu Ser Ala Val Arg Ile Leu Asp Pro Asn Gln Val Pro Leu
465 470 475 480
Leu Ser Cys Asp Pro Gln Leu Leu Lys Ala Ile Pro Gly Trp Gly Lys
485 490 495
Glu His Asp Asn Glu Arg Ala Ala Tyr Val Asn Phe Val Lys Glu Cys
500 505 510
Gln Met Pro Val Pro Val Pro Val Phe Trp Asp Ser Val Cys Asp Arg
515 520 525
Phe Pro His Leu Tyr Ala Leu Ala Arg Arg Cys Leu Thr Ile Pro Thr
530 535 540
Asn Ser Val Asp Ala Glu Arg Ala Ile Ser Val Tyr Gly Gln Val Phe
545 550 555 560
Thr Pro Gln Arg Gln Arg Met Ser Pro Ala Thr Ala Ala Gly Cys Ser
565 570 575
Met Leu Ala Phe Asn Thr
580
<210> 112
<211> 754
<212> PRT
<213> Alligator mississippiensis
<400> 112
Met Thr Val Ser Ser Thr Pro Ile Ser Ser Pro Ser Val Ser Leu Pro
1 5 10 15
Val Pro Glu Glu Glu Leu Asp Leu Glu Ala Gly Asp Leu Ser Ala Leu
20 25 30
Ala Lys Glu Ile Leu Gly Thr Glu Gly Glu Ser Glu Phe Val Leu His
35 40 45
Thr Pro Gln Ser Ser Pro Arg Ala Arg Ser Pro Ser Pro Glu Gly Thr
50 55 60
Ser Glu Glu Val Glu Val Val Glu Ala Ser Gly Ser Ala Glu Ser Ala
65 70 75 80
Pro Pro Val Val Val Pro Leu Pro Ala Glu Glu Gly Asp Lys Ala Gly
85 90 95
Ser Pro Pro Ser Thr Gln Lys Arg Gly Gly Ser Val Val Trp Asp His
100 105 110
Phe Glu Val Ala Asp Asp Pro Lys Tyr Ala Ile Cys Gln His Cys Arg
115 120 125
Arg Gln Ile Ser Arg Gly Lys Glu Val Lys His Phe Thr Thr Thr Ala
130 135 140
Met Leu Leu His Leu Arg Arg Gln His Pro Leu Ala Leu Ala Pro Pro
145 150 155 160
Gln Pro Gly Thr Ser Gly Ser Val Pro Lys Gly Lys Ser Pro Ser Arg
165 170 175
Ser Lys Ala Pro Val Pro Thr Lys Gln Arg Gln Ala Thr Leu Glu Arg
180 185 190
Trp Gly Lys Ala Ala Asp Lys Gly Gly Arg Val Ala Arg Ala Ser Glu
195 200 205
Val Thr Gln Ser Ile Gly Glu Met Leu Ala Leu Asp Gly Gln Pro Phe
210 215 220
Ser Leu Val Glu Arg Pro Gly Phe Arg Arg Leu Met Ala Leu Val Ala
225 230 235 240
Pro Ser Tyr Gln Val Pro Ala Arg Thr Thr Phe Ser Arg Thr Val Val
245 250 255
Pro Ser Leu Tyr Glu Ala Cys Arg Glu Tyr Leu Arg Glu Glu Leu Arg
260 265 270
Lys Ala Gly Pro Gln Val Ala Leu His Phe Thr Ser Asp Ile Trp Ser
275 280 285
Ser Arg Gly Gly Asp His Ala Tyr Leu Ser Leu Thr Gly His Trp Cys
290 295 300
Asp Gln Ser Gly Arg Arg Trp Ala Leu Leu Gln Ala Glu Val Met Asp
305 310 315 320
Glu Ser His Thr Ala Arg Glu Ile Met Val Ala Met Asn Arg Met Val
325 330 335
Gln Gly Trp Leu Val Gly Gln Gly Glu Leu Thr Arg Gly Phe Met Val
340 345 350
Thr Asp Asn Gly Ala Asn Met Val Lys Ala Val Arg Asp Ala Asn Phe
355 360 365
Val Gly Ile Arg Cys Val Ala His Lys Leu His Leu Ile Val Arg Asp
370 375 380
Ala Leu Glu Gly Asp Arg Ala Ala Gly Asp Gly Ala Val Thr Thr Thr
385 390 395 400
Gln Leu Ile Ser Lys Cys Arg Lys Val Ala Gly Tyr Phe His Arg Ser
405 410 415
Ile Lys Gly Gly Lys Met Leu Arg Asp Lys Gln Ala Glu Leu Ser Val
420 425 430
Pro Gln His Lys Ile Met Gln Asp Val Glu Thr Arg Trp Asn Ser Thr
435 440 445
Tyr Leu Met Leu Glu Arg Leu Val Glu Gln Gln Lys Ala Ile His Glu
450 455 460
Met Ala Leu Leu Gly Glu Ile Gly Ile Ser Gly Pro Leu Asn Lys Ala
465 470 475 480
Glu Trp Asp Thr Ile Ser Gln Ile Leu Val Val Leu Lys Pro Phe Leu
485 490 495
Glu Ala Thr Glu Thr Leu Ser Ala Gly Asp Ala Leu Leu Ser Gln Val
500 505 510
Ile Pro Val Val Arg Glu Leu Glu Asn Gln Met Glu Lys Phe Gln Gly
515 520 525
Ile Asp Val Pro Gly Trp Gly Lys Pro Leu Ser Pro Glu Val Gln Ala
530 535 540
Leu Val Lys Arg Leu Lys Glu Gly Ile Lys Lys Trp Leu Asp Pro Leu
545 550 555 560
Arg Ser Ser Thr Val His Val Leu Ala Gly Met Cys Asp Pro Arg Val
565 570 575
Lys Gly Ser Met Cys Thr Gly Ser Thr Lys Thr Leu Asp His Trp Thr
580 585 590
Glu Val Leu Val Asn Arg Val Arg Glu Ala Glu Gly Gln Arg Arg Gly
595 600 605
Asp Val Glu Glu Gly Asp Pro Leu Ser Arg Ala Ser Thr Pro Ser Thr
610 615 620
Ser Gln Ser Pro Pro Arg Gln Pro Leu Pro Met Trp Ala Lys Gly Met
625 630 635 640
Ala Ser Met Leu Gly Ser Arg Arg Thr Arg Pro Gln Pro Arg Ala Gly
645 650 655
Ser Ala Glu Ala Ser Val Ala Thr Tyr Leu Ala Glu Asp Val Glu Pro
660 665 670
Leu Asp Cys Asp Pro Leu Ala Tyr Trp Ala Thr Arg Ser Gln Met Trp
675 680 685
Gln Asp Leu Ala Thr Val Ala Arg Glu His Leu Ser Cys Pro Pro Thr
690 695 700
Ser Val Pro Ser Glu Arg Val Phe Ser Ile Ala Gly Asp Val Val Thr
705 710 715 720
Pro His Arg Thr Ser Leu Asp Pro Gly Leu Val Glu Gln Leu Val Phe
725 730 735
Leu Lys Val Asn Leu Pro Leu Leu Gly Phe Pro Glu Leu His Leu Gln
740 745 750
Thr Glu
<210> 113
<211> 1156
<212> PRT
<213> Xenopus tropicalis
<400> 113
Met Thr Gly Arg Gly Arg Gly Arg Lys Gly Gly Met Gly Gly Lys Gly
1 5 10 15
Gly Glu Gly Gly Arg Lys Gly Gly Val Gly Gly Glu Gly Gly Arg Lys
20 25 30
Gly Gly Val Gly Gly Glu Gly Gly Val Gly Gly Lys Gly Gly Leu Gly
35 40 45
Gly Arg Ser Arg Gly Ala Gly Cys Gly Gln Glu Pro Ser Thr Arg Ala
50 55 60
Met Pro Ser Leu Gly Asn Ile Gly Gln Gln Pro Gln Gln Gln Ser Gln
65 70 75 80
Gln Gln Gln Gln Gln Leu Gln Gln Gln Gln Val Ala Gly Arg Ser Gly
85 90 95
Ala Thr Gly Ser Arg Lys Thr Leu Pro Asp Phe Phe Ala Thr Thr Ser
100 105 110
Arg Pro Ile Gln Ser Gln Gln Ala Glu Ala Val Met Asp Trp Leu Thr
115 120 125
Gln Ala Thr Ser Ser Ala Ala Asp Ser Ser Glu Gln Gln Glu Val Ala
130 135 140
Ser Pro Ala Ser Ser Val Ile Arg Gly Met Leu Ser Pro Leu Leu Phe
145 150 155 160
Asp Pro Glu Val Asp Phe Ser Pro Asp Thr Gln Asp Leu Phe Asp Asp
165 170 175
Gln Thr Gly Met Gly Gly Ala Phe Leu Ser Asp Glu Glu Glu Val Tyr
180 185 190
Val Ala Gln His Thr Thr Ser Ala Val Gly Asp Val Gly Gln Gly Pro
195 200 205
Leu Met Ala Gly Gln Gln Ala Asp Glu Pro Asp Val Asp Val Asp Ala
210 215 220
Gly Ser Asp Leu Gly Glu Asp Val Glu Asp Asp Gly Asp Arg Ser Trp
225 230 235 240
Val Pro Ala Gln Glu Asp Asn Ser Ser Ser Ser Glu Gly Glu Leu Cys
245 250 255
Val Val Val Ser Asp Ala Asp Glu Glu Pro Ala Pro Lys Lys Gln Lys
260 265 270
Thr Pro Pro Thr Thr Ala Arg Gly Gly Arg Gln Gln Gly Ser Thr Ala
275 280 285
Pro Gly Ser Thr Gly Ser Gly Arg Met Gly Arg Asp Leu Gln Pro Ser
290 295 300
Gly Pro Gln Pro Ser Thr Ala Gly Lys Val Val Ala Arg Thr Ser Ala
305 310 315 320
Val Trp Ala Phe Phe Thr Cys Gln Ser Gln Asp Pro Ser Val Ala Val
325 330 335
Cys His Leu Cys Arg Gln Lys Val Arg Arg Gly Gln Thr Gly Ser His
340 345 350
Met Gly Thr Ser Ala Leu Ser Ser His Met Lys Arg His His Arg Met
355 360 365
Thr Trp Glu Gln His Gln Ser Gly Arg Ala Pro Gly Gly Ser Gly Ala
370 375 380
Ser Cys Pro Pro Pro Pro Ile Pro Gln Gly Thr Gly Ala Ser Ser Pro
385 390 395 400
Ile Pro Val Ala Arg Glu Glu Asp Ser Glu Ala His Ser Trp Arg Arg
405 410 415
Pro Leu Cys Ser Ser Ala Ser Ser Ala Ala Pro Ser Val Ser Ser Ser
420 425 430
Ser Leu Leu Pro Ser Ala Gln Pro Leu Ser Arg Gln Val Ser Leu Pro
435 440 445
Gln Phe Leu Gly Arg Lys Ala Pro Leu Ser Ser Ser His Pro Gln Val
450 455 460
Gln Arg Leu Asn Ala Cys Leu Ala Lys Leu Leu Ala Val Gln Leu Leu
465 470 475 480
Pro Tyr Gln Leu Val Asp Ala Ala Pro Phe Arg Gln Leu Met Ala Cys
485 490 495
Ala Ala Pro Asn Trp Arg Ile Pro Ser Arg His Tyr Phe Ala Arg Lys
500 505 510
Ala Val Pro Ala Leu His Gln Gln Val Val Asp Asn Val Ser Leu Ser
515 520 525
Leu Asp Tyr Ala Val Gly Gly Arg Val His Cys Thr Thr Asp Thr Trp
530 535 540
Thr Ser Arg His Gly Gln Gly Arg Tyr Ile Ser Tyr Thr Ala His Trp
545 550 555 560
Val Thr Leu Met Ser Ala Gly Glu Gly Ala Gly Ser Arg Thr Pro Leu
565 570 575
Arg Leu Glu Val Pro Pro Arg Gly Val Lys Gly Lys Pro His Thr Ala
580 585 590
Thr Ser Ser Ser Ser Ser Ser Thr Met Asp Glu Pro Pro Leu Lys Arg
595 600 605
Pro Arg Ser Tyr Ala Ser Val Gln Tyr Lys Arg Cys Gln Ala Val Leu
610 615 620
Gln Leu Leu Cys Leu Gly Glu Arg Ser His Thr Ala Pro Glu Leu His
625 630 635 640
Ala Ala Phe Gln Thr Gln Val Gln Arg Trp Phe Thr Pro Arg Gln Leu
645 650 655
Gln Ala Gly Asn Val Val Cys Asp Asn Gly Arg Asn Leu Leu Ala Ala
660 665 670
Leu His Leu Gly Arg Leu Thr His Val Pro Cys Phe Ala His Val Leu
675 680 685
Asn Leu Val Val Gln His Phe Leu Lys Ser Tyr Thr Gly Leu Gly Val
690 695 700
Val Leu Glu Lys Ala Arg Arg Val Cys Gly His Phe Arg Arg Ser Pro
705 710 715 720
Thr Ala Ser Ala Ser Leu Ser Arg Met Gln Arg Gln His Ser Leu Pro
725 730 735
Pro His Arg Leu Ile Cys Asp Leu Pro Thr Arg Trp Asn Ser Thr Leu
740 745 750
His Met Val Glu Arg Leu Val Glu Gln Arg Trp Ala Val Ser Asn Tyr
755 760 765
Leu Leu Glu His Ser Ala Arg Gly Thr Gln Gly Ala Asn Leu Gly Tyr
770 775 780
Phe Ser Thr Glu Gln Trp Gln Gln Met Arg Gln Leu Cys Arg Val Leu
785 790 795 800
Ala Pro Phe Glu Gln Ala Thr Arg Phe Val Ser Arg Asp Asn Ala Cys
805 810 815
Val Ser Asp Ile Ile Pro Leu Val Phe Leu Leu Lys Arg Thr Leu Asp
820 825 830
Gly Leu Leu Glu Glu Gly Asp Val Pro Glu Glu Glu Glu Cys Arg Pro
835 840 845
Arg Arg Gln Val Glu Gly Ala Ala Arg His Asp Glu Glu Asp Met Pro
850 855 860
Asn Glu Glu Asp Glu Gly Glu Glu Asp Trp Val Pro Ala Glu Gln Gly
865 870 875 880
Glu Gln Gly Pro Arg His Pro Thr Thr Pro Ala Val Val Arg Gly Trp
885 890 895
Glu Asp Thr Glu Gln Gly Glu Glu Ala Gly Asp Asp Leu Leu His Leu
900 905 910
Gln Gly Ser Gln Glu Glu Val Gly Arg Gly His Leu Phe Tyr Met Ala
915 920 925
Ala His Met Gln Thr Cys Leu Arg Ser Asp Ser Arg Ile Cys Ala Ile
930 935 940
Lys Asp Arg Glu Asp Tyr Trp Val Ala Thr Met Ile Asp Pro Arg Tyr
945 950 955 960
Lys Glu Lys Met Ala Gln Phe Leu Val Pro Ser Gln Arg Glu Arg Arg
965 970 975
Val Gly Gln Leu Lys Arg Ala Leu Cys Ala Lys Leu Met Glu Ala Phe
980 985 990
Pro Gln Pro Asp Thr Gln Ala Ser Thr Thr Pro His Ile Gln Gln Arg
995 1000 1005
Gln Glu Ser Ser Ser Ser Ser Ser Ser Ala Ala Arg Gly Gly Gly Asn
1010 1015 1020
Leu Met Asp Val Trp Arg Ser Phe Phe Glu Pro Arg Gln Ala Ala Ala
1025 1030 1035 1040
Gly Leu Val Ser Thr Gln Ser His His Gln Gln Arg Leu Asp Asn Met
1045 1050 1055
Val Ala Asp Tyr Met Gly Ser Val Ser Val Gln Asp Ala Met His Thr
1060 1065 1070
Asp Asp Asp Pro Met Asn Phe Trp Val Ser Arg Leu Asp Gln Trp Pro
1075 1080 1085
Glu Leu Ala Gln Tyr Ala Leu Glu Val Leu Ala Cys Pro Pro Ala Ser
1090 1095 1100
Val Leu Ser Glu Arg Val Phe Ser Ala Ala Gly Gly Val Val Thr Glu
1105 1110 1115 1120
Lys Arg Thr Arg Leu Ser Thr Gly Ser Val Asp Arg Leu Ser Phe Ile
1125 1130 1135
Lys Met Asn Glu Ala Trp Ile Ser Gly Asp Ile His Val Pro Ile Ala
1140 1145 1150
Asp Ile Arg Asp
1155
<210> 114
<211> 334
<212> PRT
<213> Drosophila yakuba
<400> 114
Met Arg Lys Leu Ser Gly Glu Ile Gln Asn Asn Ile Val Ser Leu Thr
1 5 10 15
Glu Ser Gly Asn Ser Thr Arg Gln Ile Ala Glu Arg Leu Gly Ile Ser
20 25 30
Gln Ser Ala Val Val Ser Ile Gln Lys Arg Arg Lys Leu Thr Pro Lys
35 40 45
Pro Gln Val Ser Gly Arg Lys Lys Leu Leu Lys Asp Ser Asp Ala Arg
50 55 60
Leu Met Met Ser Glu Met Arg Lys Asn Lys Asn Leu Thr Pro Lys Gly
65 70 75 80
Ala Cys Leu Ala Ile Asn Lys Asn Val Ser Glu Trp Thr Ala Arg Arg
85 90 95
Ala Leu Gln Asp Ile Gly Tyr Met Ser Ile Val Lys Lys Asn Lys Pro
100 105 110
Ala Leu Ser Asp Lys Asn Val Lys Ala Arg Leu Lys Phe Ala Lys Asp
115 120 125
His Lys Asn Trp Thr Ile Asp Asp Trp Lys Arg Val Val Trp Ser Asp
130 135 140
Glu Ser Lys Phe Asn Arg Phe Gln Ser Asp Gly Lys Gln Tyr Cys Trp
145 150 155 160
Ile Arg Pro Gly Asp Arg Val Gln Arg His His Val Lys Gln Thr Val
165 170 175
Lys His Gly Gly Gly Asn Ile Met Val Trp Gly Cys Phe Thr Trp Trp
180 185 190
His Ile Gly Pro Leu Gln Leu Val Glu Gly Ile Met Lys Lys Glu Asp
195 200 205
Tyr Leu Arg Ile Leu Gln Thr Asn Leu Pro Asn Tyr Phe Asp Lys Cys
210 215 220
Ala Tyr Pro Glu Lys Asp Ile Ile Phe Gln Gln Asp Gly Asp Pro Lys
225 230 235 240
His Thr Ala Lys Ile Val Lys Glu Trp Ile Gly Lys Gln His Phe Gln
245 250 255
Leu Met Glu Trp Pro Ala Gln Ser Pro Asp Leu Asn Pro Ile Glu Asn
260 265 270
Leu Trp Ser Ile Val Lys Arg Arg Leu Gly Gln Tyr Asp Ser Ala Pro
275 280 285
Lys Asn Met Gly Asp Leu Trp Glu Arg Val Ala Val Glu Trp Ser Arg
290 295 300
Ile Pro Gln Asp Ile Leu Arg Asn Leu Val Glu Ser Met Pro Lys Arg
305 310 315 320
Val Thr Glu Val Ile Val Asn Lys Gly Leu Trp Thr Lys Tyr
325 330
<210> 115
<211> 2687
<212> DNA
<213> Anopheles gambiae
<400> 115
taggcatggg ctaattgtgc gagacctatg ccgcacactc agttcactca agtgtgcggc 60
tgaccaccgc acgcgaaaaa gtgtacgggt aggtcttccg cacgcataag gaatgacttc 120
ggttgtgact ggttgaacga aaaaaaaaac attaatttta gtcgactgtg ttcaacagtc 180
aaataaaaaa tcgatcacac tctgagcgag aaagaatacg caaattgtta gcgtatttag 240
ttgggtcagt cgcactaaaa gaactcctgt ccaagactga catggaacga gaaatacact 300
catacccgtt gggtcagtcg cacactgccg cacgcgtgtt cagtttggtc agtcgcacac 360
acagctgcac aaaaagaaat tctgtcgcac actgccgcac gtttgctcag ttcgttcatt 420
cgcacacagc cgcacaaaaa gaacttctgg cgcacactgc cgcacgcgtg ttcagttggg 480
tcagtcgcac acagccgcac aaaaagaact tctgccgcac actgccgcac gtttgctcaa 540
ttcgttcatt cgcacacagc cgcacaaaaa gaacttctgc cgcacgctgc cgcacgtgag 600
gtcagttggg tcagtcgcac acagccgcac aaaaagaact tctgccgcac actgccgcac 660
gtttgctcaa ttcgttcatt cgcacacagc cgcacaaaaa gaacttctgc cgcacgctgc 720
cgcacgtgag gtcagttggg tcagtcgcac acagccgcac aaaaataact cacactgact 780
acgctagtaa tatgctcgtt ctctctgcgc tgtcggatca gtcgcacaca gtcatacaaa 840
gaactgctac cgcacactgt cctgatgaaa cacagggttt gatgtctttt tggttgtttc 900
ttcatttttt ggatttatct cacattttat tgcatgcttc ccaaattatt ttggactcat 960
tccacaattt attatatgtt tctcatataa ttttgtattc gttttgtgat ttattcttac 1020
catcccagtt gttttgaaac aaataattga acaaatttta tgaaacgtta aataatcgtg 1080
atccataaac cctgtaatag gagacaaaat tggtatcaat agcatcttct tccttctcat 1140
tttctgctga ttgtttttta cgtagcacca gacattctta gcgtggggaa ctgtgtggta 1200
ttgatatgta tcgaatgtaa gagcaaggag ggaaaaacgt acactaggta ttcgctagtt 1260
gaatgatttg aaatgtggat cattttttta agttgcatgg tcgatgtgag atttataaat 1320
cgatgatttt taatcttgaa atattcacca catgcaaaat caaaaaatct ccaaatcttt 1380
atattctttt gctttttatc atttaaaaaa atatgccaat tcaaaatgca atacatgtca 1440
cacattacaa tttcaattag cgagctcaaa ctgtaccatc ccacgatgtt ttattcgaac 1500
accattacta gtgaggcatg cttttcgcac actaagttga tgagtgcaat atgtatataa 1560
aagaacgtca agtattcgga aagtggctta cccattatga atgagtccct cgtttgttgg 1620
tgttgtatga ataatattgc agtaggtaac aaagtgaaat agtattgaag tgcgtttccg 1680
gtatcagagt tttagctttg cattgtcgtt gcgattccta ttttggttgt gtatcgaatc 1740
agtcgcatta aaggaaagta cccagtttga aaattcataa cgcgtaaata ctttttctgt 1800
ggaagaatcg gcagggataa cctgataact aattaaaggt aagttgcttt attattttta 1860
acttttaaca agatgagaaa aaatgacaaa tcgtcattta ttcttttttt tatttcataa 1920
aaaaaatcct agttcagtgg tcgagaaagt acggcaatcc gtttacgatt tttgccagca 1980
ttttcactcc ttaacagccc cttgctattg taggagtatt caaaatctcc cacagtttca 2040
cgccttcatc tgaaaatccg gtttggaaat ttactgacat ttgtatagaa tttagctgtc 2100
tatggcgtca agttaaccga cgtttttttt ctagttcagt ggtcagcaaa ctttgtggtg 2160
aaaagagcca aattctatga aaatgttggt agatttcgat atgaagagcc aaatttgaaa 2220
accaagcata caattgagtt aaccactgtc ctcatttgga ccttccttcc acaaatgaca 2280
ttcaaagcca aaactattca atgttttggt cacaccagtg acaactatga tcgactgact 2340
tttcatgatg actgagtaac ttttaatcga agtaatagat ttaatcatta tagtaaaatt 2400
tacatcatca attaaaaata atgatctaca atttatcaat aattaaagtt tcctcaaaat 2460
accaaagcac agtgatagta ttacgtttat tttatttgaa taatattgct ataattataa 2520
tttacaacaa ttgctgacgg gactggaact ataccaaaac gttctttaat taaaaaaaaa 2580
ctgttcgttt tagcagtcat actgttaaag ccatttaggc tgttagataa ttgaacaaat 2640
atttaaaatt ttatttttga ttaatgttgt aatatgtttt agttaag 2687
<210> 116
<211> 1472
<212> DNA
<213> Anopheles gambiae
<400> 116
tagagttgtg cctcaagaac cagaactgta cgattcattc aattcatcct aaagaacgaa 60
cgacctacgt tcatctaatc aacgttcatc gattctttat aaattataat gtattgagtt 120
gttcatgaaa ataacccggg taggaacccg tcgaaatgaa gaacgtccta gtacgccagg 180
tcgttcattc cccccataca aatatgaacg tgaatcgtat gaccaggacg ttcacgaaaa 240
gaacgtccta cccgtcgaaa taaagaacgt cctagcaagc caggtcgttc attcccccca 300
ttcaaaatga acgtgaatcg tatgaccagg acgttcacga aaagaacgtc ctacccgtcg 360
aaataaagaa cgtcctagca agtcaggtcg ttcatttttt cccatacaaa tatgaacgtg 420
aatcgtatga ccaggtcgtt cattctcctg atacaaaaat gcgctgtccc acatgataga 480
catgtgtcga tgaaacaaaa tcagcatact ttctcactca gcccaacaaa acatccgatc 540
tggcattctg cactggcttt ctgcggagag cacagtacaa gataagagag cggatagaat 600
gtttcgttga tctacatcgt tcactctctt tctgatcctc ggagacgatg ccgcttctgc 660
aatatgcgct ctctttttct tcccgctgca atactttcag ctgatagtta ccgagagaac 720
gatcacagag atagagagtc aaaaaaatga cgaggacggg gggtggtatg tgggatgagt 780
ttttttacct acttgtgagc gaggtacagt caaagttcaa taattgaacg aaattttggt 840
ttgtatattt ttcgatggat atttgatagt aggttgatag atcaactaaa aagcatgcct 900
ttatattagt gaatctaatt tcatagaaaa tcgcaaaact gtcgcctata atgaaaaaaa 960
aacttcattt attttgtgca ggaaagaacg tgaaaattta tcaccaaacg tgacactaac 1020
caaacagtga gctgccaatc gaagttcaat tagtgagttt gaactgtact agtcgttttg 1080
tttgagagag aaatgacctt ctcgcgcttt gaggaagaga ggaaaattac actaatacgt 1140
ttatggtcac taaatccata tgataaatac atagatcacg tgtgttcggt tcgttgttgt 1200
ataggtgatt ttgaccgtta tttttgaata cgttcgattt cttcaatgtg ttgtaggctt 1260
atggtaataa acattgctga aaccgtgatt gtattgataa attgatcttt gatatgccat 1320
ttgttgtgat cttttgactt gtaaaccaca aattgatcta cgctccatcg aaataagtga 1380
aaatttaata attgcacggc gatcaaaggt aacattagtc ttggtagtta aaaacaaaaa 1440
cataaagtgt tgtatgaaac atttccacag at 1472
<210> 117
<211> 364
<212> DNA
<213> Danio rerio
<400> 117
cagcggggaa aataagtatt tgacacatca gcatttttat cagtaagggg atttctaagt 60
gggctactga cacaaaattc ctaccagatg tagccatcaa gccaaatatt gaattcatac 120
aaagaaatca gaacatttaa gtatacaagt tgagtcataa taaataaagt gaaatgacac 180
agggaataag tattgaacac atgaagataa caaggtgcaa aatggcatag aaagtcagga 240
gatctgtcag tattgagaga aaaaccctgc tccctatcag tactaattga tatcagctgc 300
tttagtccta attgatggcc tataaaggct tctcattact caggaggcac acaggaaaga 360
cttc 364
<210> 118
<211> 287
<212> DNA
<213> Petromyzon marinus
<400> 118
cacaggggtc gggaacctat ggctcgcgag ccagatgtgg ctcttttgat gattgcatat 60
ggctcgcaga taaaacaaaa tattctcact tgttttaatc catccatcga tttttcactg 120
cgcatgtcct gttcagggct gcaggagcaa ttgtccatta ttttaattgg atgatactgg 180
cctacgtttg ccgttgctgg gtaaaacagg taaacgcccc cttttgaatc agtctgagac 240
tgcgtctgct cggtcattag ctcaaagcta acccttcgac gaagaag 287
<210> 119
<211> 877
<212> DNA
<213> Xenopus tropicalis
<400> 119
caggggtctc aaactcacgg cccgcgggcc atttgcggcc ctccatccaa tattttgcgg 60
cccgcaccaa ggggagctgg cgcagaagtc gggctccgtc agcagaagcg ctggcagcgg 120
cggcagaagc accccagtta ccaggggcgg cataaaaagc cgcacctggt aactttaaga 180
gccgaatttc cggtttttaa accggaaatt cggctcttct agtgcagaga gcgcaattgc 240
gctctctgca tctagcgatc tcaccgccgg cagtgtcagt cagaatgtcg ggctccatca 300
gcagaagcgc cggcagaagc gccggcggca gaagccccca gttaccaggg gcggcataaa 360
aagccgcacc tggtaacttt aagagccgaa tttccggttt ttaaaccgga aattcggctc 420
ttctagtgca gagagcgcaa ttgcgctctc tgcactagcg atctcaccgc cggcatccag 480
gagtgtcagt aaagcgcttc cgggccagcg ttgcgtccct cctaagccac gcctgctgca 540
agttttttct gttgtgggag tacagtccct gcctagcgcc aaatttggat ctgctgaatc 600
tgtccctgct gatctgtctg aagcctgtcg ttgcgttcgc ctctggtatg attcaaggga 660
ccatttctgt caaatttgag gtacgtgcct gtttcctctg tgggtgaata tcgggaatgc 720
tgggagttgt agttcggttg cagtagctcc tgcttagcag ctaattgtgc acacagaacg 780
ttgtgccttg cattatatcc cttgaaagcc aattagaatt agaacagaca caagggagag 840
aagtttagta cagaattagg ttttgtcata cttcatc 877
<210> 120
<211> 365
<212> DNA
<213> Xenopus tropicalis
<400> 120
cagtggagga aataattatt tgacccctca ctgattttgt aagtttgtcc aatgacaaag 60
aaatgaaaag tctcagaaca gtatcatttc aatggtaggt ttattttaac agtggcagat 120
agcacatcaa aaggaaaatc gaaaaaataa ctttaaataa aagatagcaa ctgatttgca 180
tttcattgag tgaaataagt ttttgaaccc ctaccaacca ttaagagttc tggctcccac 240
agagtggtta gacacttcta ctcaattagt caacctcatt aaggacacct gtcttaacta 300
gtcacctgta taaaagacac ctgtccacag aatcaatcaa tcaagcagac tccaaactct 360
ccaac 365
<210> 121
<211> 472
<212> DNA
<213> Danio rerio
<400> 121
caggggtggc gaacccgcgg ctcgcgagcc gcttgcggct cttttactgc tcttgtgcgg 60
ctcaacctct cgcgcgattt aacatacatt aaccaattga ctaacgcccc attcacacgg 120
tgcttctgcg tctctttctg cttttgtgcg gctcaacctc ttgcgcgatt taacatataa 180
taaccaattg actaatgccc cattcacacg gggcttcagc gttgctcgct gcagaagctg 240
ggagtagctc aacttttcaa gcgcttacgg acgcgttagc caatcagatc gctgtatgca 300
aatacacctg ctagacagtg gcctattgct gactgaattt tattttctga cgcttccatg 360
acgatcgttt cagctctaac ttcagacacg ccttcagtca agggttgaca ctgaagcccc 420
gtttgattgg ggcgcaacac gagtgacgtg cagttcgtta atatcaatcg tc 472
<210> 122
<211> 356
<212> DNA
<213> Takifugu rubripes
<400> 122
cagtgagagt aaaaagtatt tgatcccttg ctgattttgt tggtttgtcc actaataaag 60
acatgatcat tctatacttt taatggtaga tgtattctaa catggagaga cagaatatca 120
aaaagaaaat caagaaaata actttaaaga atttatttta atttatttgt ttttcattga 180
gggaaataag tatttgatcc cctagtatgc attaggagtt ctggctttca cagaccagtt 240
agacgctccc aaacaacttg ttacctgaat tgaagacacc aggtctaact aatcacctgt 300
atgtaagaca actgttcaca gaatcagaca atcagacaga ttccaaactc tccacc 356
<210> 123
<211> 297
<212> DNA
<213> Xenopus tropicalis
<400> 123
caaaccggat tccaaaaaag ttgggacact aaacaaattg tgaataaaaa ctgaacgcaa 60
tgatgtggag gtgccaactt ctaatatttt attcagaata gaacataaat cacggaacaa 120
aagtttaaac tgagaaaatg taccatttta agggaaaaat atgttgattc agaatttcat 180
ggtgtcaaca aatcccaaaa aagttgggac aagtagcaat aagaggctgg aaaaagtaaa 240
tttgagcata acgaagagct ggaagaccaa ataacactaa ttaggtcaat tggcaac 297
<210> 124
<211> 369
<212> DNA
<213> Xenopus tropicalis
<400> 124
cagtggcttg caaaagtatt cggccccctt gaacttttcc acattttgtc acattacagc 60
cacaaacatg aatcaatttt attggaattc cacgtgaaag accaatacaa agtggtgtac 120
acgtgagaag tggaacgaaa atcatacatg attccaaaca ttttttacaa ataaataact 180
gcaaagtggg gtgtgcgtaa ttattcagcc ccctttggtc tgagtgcagt cagttgccca 240
tagacattgc ctgatgagtg ctaatgacta aatagagtgc acctgtgtgt aatctaatgt 300
cagtacaaat acagctgctc tgtgacggcc tcagaggttg tctaagagaa tattgggagc 360
aacaacacc 369
<210> 125
<211> 623
<212> DNA
<213> Anopheles gambiae
<400> 125
tacagtgtcg gacaaatcaa taggaccact tatcaattta ttattcactt atcatatttc 60
atgacttaaa gtgaatcaat ctttaccaaa ctttcatgaa agcactatta gaatgtttac 120
tttaagaatg tttttaaagt ttggtgaaaa gttaagaaac aaaaaagtta tgataagaaa 180
tgtaaaaata acccaaaaat catgcgccaa aataatagga ccagttcaga aaattttaaa 240
ataattatca tttattattg ttaaaacaca gtttttgatg ttattgagtt gtcggataac 300
ttaacttaaa ttagtgaact aatgcgtatt catttttttt gtagaaacgc ttagcgcagt 360
ggcaattcgc tgtgtcttta attaacatgc tctaatttac taatgcaaga atattacggc 420
actcgcttaa gggttttgag ctccctttgc actgagagac gaaatagtgg tgagtacctt 480
cgtctatggg tataaaagcg cgtcacagcg ctggatcgct tacactgtgt tctaagccgt 540
tgcctagaac acttcacacg atccattagc tcgtgtattt ttgggtgcac tacttcaagc 600
gcttgattga aggaattcca acg 623
<210> 126
<211> 393
<212> DNA
<213> Xenopus laevis
<400> 126
cagtggtgtg aaaaactatt tgcccccttc ctgatttctt attcttttgc atgtttgtca 60
cacttaaatg tttctgctca tcaaaaaccg ttaactatta gtcaaagata acataattga 120
acacaaaatg cagtttttaa atgaaggttt acgttattaa gggagaaaaa aaactccaaa 180
tctacatggc cctgtgtgaa aaagtgattg ccccccttgt taaaaaataa cttaactgtg 240
gtttatcaca tttcaatttt caatttcaat atcaatttct gtagtcaccc ccaggcctga 300
ttactgccac acctgtttca atcaagaaat cacttaaata ggagctacct gacacagaga 360
agtagaccaa aagcacctca aaagctagac atc 393
<210> 127
<211> 271
<212> DNA
<213> Anopheles gambiae
<400> 127
cactggtgga cataaaaata ggaaaaaaaa attttgtgtg ttttttttgc atacactagg 60
tgtgtcatcg ccaacagttc gaggcgtact gaatttgcaa tagccgaatt ttgcctttta 120
tactctcatt tttggtgcgc tacttatctg agttttgagt gccggcagcg ttttgcggca 180
gtataaaagg agagccaaac cgtgttgtgc ttcattcttc catcagtggt caaggtgaaa 240
ggttgctatt taaaaattcc acaaaatcat c 271
<210> 128
<211> 153
<212> DNA
<213> Xenopus tropicalis
<400> 128
atatacactc accaaaagga ttattaggaa cacctgttca atttctcatt aatgcaatta 60
tctaatcaac caatcacatg gcagttgctt caatgcattt aggggtgtgg tcctggtcaa 120
gacaatctcc tgaactccaa actgaatgtc aga 153
<210> 129
<211> 872
<212> DNA
<213> Petromyzon marinus
<400> 129
caggggtcac caaactacgg cccgcgggcc gatccggccc gcgacgtcag tccatcaggc 60
ccgccgacgg tacttgaatt tggttgataa aacgtatgga acacgagacg ttgtgataca 120
atttaaattt aaatattatg tttagaatac taggagatct tcacgcgtgc ggagacctcc 180
tgactgctat gtgccttaaa tttactattt taattttaaa ttattgtatc tagattttct 240
tgtttattgt aatgtttgct tatttcgcgc catcccaagt ccttccccgg ctcgtggtag 300
ctccgcctac gctctgacgt taccatggtt tccatggcaa cgtcatggca acacgttacc 360
atggtttcca tggcaacaca cacaaacacg catctttccc gcccccagat tttccggctg 420
tcaacacagg tccgacgctc cagaaatatt tacttctttt tgcctgtcat ccattttata 480
ggtatgtaac aaggatttct ttgtttgaca gtgataggta agtgaactac aagtgtgatt 540
agaggtcata aagtaacaaa catagaataa caatgccata gaagcctcgt gttattacga 600
aaatattatc cccagctcag aaaaattccc cggtcaaggt gttaatcgag ctggtctcta 660
ggctgtttat ttaggcccgc cctatttata tattttgtaa accttattat gtgatatatt 720
ctattaccaa aggtacctat aaactttata tgtacctttg gtgagccgta gcttcaccag 780
tgacccctga atcctctgct tttcttgtgt ttcaatagga aacaattcaa tgtctttttc 840
attttcagat cccgttttct tcacccttca tt 872
<210> 130
<211> 368
<212> DNA
<213> Petromyzon marinus
<400> 130
cagtgaggga aaaaagtatt tgatcccctg ctgattttgt acgtttgccc actgacaaag 60
aaatgatcag tctataattt taatggtagg tttatttgaa cagtgagaga cagaataaca 120
acaacaaaaa tccagaaaaa cgcatgtcaa aaatgttata aattgatttg cattttaatg 180
agggaaataa gtatttgacc ccctctcaat cagaaagatt tctggctccc aggtgtcttt 240
tatacaggta acgagctgag attaggagca cactcttaaa gggagtgctc ctaatctcag 300
cttgttacct gtataaaaga cacctgtcca cagaagcaat caatcaatca gattccaaac 360
tctccacc 368
<210> 131
<211> 87
<212> DNA
<213> Alligator mississippiensis
<400> 131
caggcgctcc tcacttaacg acctacctgt ttaacgaccg cgcggactta cgaccgcgcg 60
gtcgtggaaa cggaagtact gtacaag 87
<210> 132
<211> 699
<212> DNA
<213> Myotis lucifugus
<400> 132
cagtgatggc gaacctatga cacgcgtgtc agaggtgaca cgcgaactca ttttgggtga 60
cacgcatcga cagagacaaa aaattgcata attcaaatat ttgtctctcg caacggccag 120
agttgggcat cactcgagta atattattac tcacgttact catgatcaat aatgcaattc 180
taaaaccgga tgtaaacatg tacatcggtg ttgcgtagca aagatacata gtgaaaacat 240
ccaagataca ttgttccaat attgacatta atataaaaag gttaagaatt gcactataaa 300
gagattaatc tttactcatg acattttatt tttactcgag tgacaaaatg cccaattctg 360
gaaacggcct cgttattgtc aacatgtgcc tcgggtaagc ttcccgtgcg ttcgggtgca 420
ttcggcaaac ggacgcactt gatcgccatg ttcgttagga gacaggagtg ggagggttag 480
aagaaaaaga tatacagtgc aacagtgctc gacgagacat tctgcgtgtc ggataattga 540
ttacagcacc atatatttgt tggttataca tactatcttt gaattgtttt gcaccaggag 600
tcagtgcaac aacactgcaa aaagttaata ggtaagaaac ctatcaacct tttataaaaa 660
acgccgtgat ttatatttat ttatttttgc agccttgtg 699
<210> 133
<211> 301
<212> DNA
<213> Petromyzon marinus
<400> 133
cagacatggg caaagtacgg cccccgggcc gtatacggcc cgttgggctt tttaatccgg 60
cccgccgaac ttgtccaaat attattatta aattaaattt tacctttctc ctgtaatgcc 120
cccatttccc cattagatgg cgcactttga ccgggagtgt ggtgtatagg gctcgaaagg 180
gcacatgatc tcgcaatgca ttgtgggccg tcagcgccat tttcagggtt tgtttacatt 240
gctgagttag atacggtgct cccttcactt tttcgctttg ccctgtgagc ccttctgtaa 300
a 301
<210> 134
<211> 394
<212> DNA
<213> Xenopus tropicalis
<400> 134
cagtggatat aaaaagtcta cacacccctg gtaaaatgtc aggttcctgt gctgtacaaa 60
aatgagacaa agataaatca tttcagaact ttttccacct ttaatgtgac ctataaactg 120
taccactcaa ttgaaaaaca aactgaaatc ttttaggtgg agggaagaaa accaaaaaaa 180
ctaaaataat gtggttgcat aagtgtgcac accctcttct aactggggat gtagctgtgt 240
tcagaattaa gcaatcacat tcaaaatcat gttaaatagg agtcagcata cacctgccat 300
catttaaagt gcctctgatt aaccccaaat aaagttcagc tgctctagtt ggtctttcct 360
gacatttttt tagtcgcatc ccacagcaaa agcc 394
<210> 135
<211> 382
<212> DNA
<213> Xenopus tropicalis
<400> 135
cagtcatggc caaaattgtt ggcaccccag aaatttttcc agaaaatcaa gtatttctca 60
cagaaaagta ttgcagtaac acatgttttg ctatacacat gtttattccc tttgtgtgta 120
ttggaacaga acaaaaaagg gaggaaaaaa agcaaattgg acataatgtc acacaaaact 180
ccaaaaatgg gctggacaaa attattggca ccctttcaaa attgtggata aataagattg 240
tttcaaacat gtgatgctcc tttaaactca cctggggcaa gtaacaggtg tgggcaatat 300
aaaaatcaca cctgaaagca gataaaaagg agagaagttc acttagtctt tgcattgtgt 360
gtctgtgtgt gccacactaa gc 382
<210> 136
<211> 357
<212> DNA
<213> Xenopus tropicalis
<400> 136
cagtgaggaa cataagtatt tgaacaccct gcgattttgc aagttctccc acttagaaat 60
catggagggg tctgaaattc acattgtagg tgcattccca ctgtgagaga cagcatttaa 120
aaaaaaaatt caggaaatca cattgtatga tttttaaaga atgtatttgt attgcactgc 180
tgcacataag tatttgaaca cctggcaatc agcaagaatt ctggctctca aagacctgtt 240
actctgcctt taaaaagtcc acctctactc cactcattaa tctaaattag tagcacctgt 300
ctgagctctt taaagacacc tgtccacccc acagtcagtc agactccaac tactacc 357
<210> 137
<211> 297
<212> DNA
<213> Xenopus tropicalis
<400> 137
cactgctcaa aaaaataaag ggaacactta aacaacacaa tgtaactcca agtcaatcac 60
acttctgtga aatcaaactg tccacttagg tagcaacact gattgacaat caatttcaca 120
tgctgttgtg caaatggaat agacaacagg tggaaattat aggcaattag caagacatcc 180
ccaataaagg agtggttctg caggtggtga ccacagacca cttctcagtt cctatgcttt 240
ctggctgatg ttttggtcac ttttgaatgc tggcggtgct ttcactctag tggtagc 297
<210> 138
<211> 318
<212> DNA
<213> Takifugu rubripes
<400> 138
cactgctcaa aaaaattaga ggaacacttt ttaatcagag tatagcaacc tatcagtcaa 60
acttctggga tattgatctg gtcagttaag tagcagaggg ggttgttaat cagtttctgc 120
tgctttgttg ttaatgaaat caacaacagg agcatcagag gggcaacaat gagacggccc 180
ccaaaacagg aatggctttc caggttgagg ccactgatac ttttttccct cctcatctct 240
tttggctgat tttttactga ctgactttct actgctgtag ttattcattt ggcttggatc 300
aacatctctg ttgatagc 318
<210> 139
<211> 1052
<212> DNA
<213> Xenopus tropicalis
<400> 139
tagggatgta gcgaactgtt cgccggcgaa ctaattcgcg cgaacatcgg gtgttcgcga 60
acccgcaagt tcgcgaactt ttggcgtatg ttcgccattt gggttcgcct tagctggcgc 120
caaattttga cctctcaccc cagaccagca gatacatggc agccaatcag gcagctctcc 180
ctcctgggcc accccccccc ccttggacca ctcccttcca tatataaacc gaagcccagc 240
agccatttta cattctgcct gtgtgtgctt gaagagatag tgtagggaga gagctgtgca 300
ttgatttgag ggagagttta agtaggtttt ctggctagta atctactttc tactgctctg 360
tatttgtgtg gggagaggaa gctgtgcatt gatttgaggg agagtttaag taggttttct 420
ggctagtaat ctactttcta ctgctctgta tttgtgtggg gagaggaagc tgtgcattga 480
tttgagggag agtttaagta ggttttctgg ctagtaatct acttctactg ctctgtattt 540
gtgtggggag aggagctgtg tattgatttg aggcagagtt taagtaggtt ttctggctag 600
taatctactt tctactgctc tgtatatttt gtctaaataa caatttgtct aaataacaat 660
aataattccg tgtccagaaa catcacctga gtgacggttt tccaccagca ataatatatt 720
ccgtatccac tactgtatac gttgcccttg caggccttgt tgcccggtgt ctgcaaccaa 780
gtgccaccta gctgtgtgag ctttttcaca atctgtctaa ataataataa ttccgtgtcc 840
agaaacatca cctgagtgac ggttttccac cagcaataat atattccgta tccactactg 900
tatacgttgc ccttgcaggc cttgttgccc ggtgtctgca accaagtgcc acctagctgt 960
gtgagctttt tcacaatctg tctaaataac aataataatt ccgtgtccag aaacatcacc 1020
caagttgttg ttgttttgta aaaataaaaa aa 1052
<210> 140
<211> 303
<212> DNA
<213> Xenopus tropicalis
<400> 140
ccgtattttc cgcactataa ggcgcaccca agagccttaa attttctcaa aaatcgaccg 60
tgcgcctaat aatacagtgc gccttatgtg tgcactgagt tgttgtgcga ctttggtaag 120
cgctccgctt gattgactgt cggaccattt cccgctgaca cagggacgta atacgtacac 180
tacatatgtt ggcagcgata aaccaatcag agaacattac gtaatacgtg cagtacgtac 240
gcttacctct gtcacgcctc cggtaggtat actaccagta tactgcaaaa caaccccccg 300
aaa 303
<210> 141
<211> 328
<212> DNA
<213> Anopheles gambiae
<400> 141
aaaattattt agtttttgga ttgaatttag gtaagcctaa gaatgaaata aattgttagt 60
gtgtatgata tattttttat aacttttctc ttaaactaaa aatttataaa ttagaattgt 120
aacaccatgg actaaacatc tcaacaaata cataaaagta aagttttgtt cgagcatccg 180
cattatttat ttaaaataaa agacagttca aaatttaatt ctttgtgtga ccgacagtgc 240
gactgaccta ccgcacgcgt tcagttcctc atactgaacg aactacaccg cacgcgttca 300
ctgaaaagaa tcaaattgcc caagccta 328
<210> 142
<211> 418
<212> DNA
<213> Anopheles gambiae
<400> 142
tcaaaacgtc gttgcaaaat ttgtaacatg gagtatatga aataattgtt ttgtaatgca 60
ctttttgtaa ttaagtaaga cttgaattat ctagatgtaa gtgttatttt tgtaatataa 120
aaaatgaatt caaaatggtg ttaaaatgtg ttggttgcct taatcataat agatgcatca 180
cttaataaca taattaggaa tacacgagtt ttttagttca gtgactaaga actgttatgc 240
ttattatatg aaactgttaa caaacaccca taatatgaaa ctatcgcgaa ataagatcga 300
tttaccatac tgtggttagt tgacgtgaac gattgaatcg cgattcacgc tcagttcatg 360
ttaatgaaag aaccggtaaa ttcacgttca tggtaatgaa tcgaattgcc caacccta 418
<210> 143
<211> 207
<212> DNA
<213> Danio rerio
<400> 143
gtaaagtgtg ttcaatactt attccctgtg tcatttcact ttatttatta tgactcaact 60
tgtatactta aatgttctga tttctttgta tgaattcaat atttggcttg atggctacat 120
ctggtaggaa ttttgtgtca gtagcccact tagaaatccc cttactgata aaaatgctga 180
tgtgtcaaat acttattttc cccgctg 207
<210> 144
<211> 166
<212> DNA
<213> Petromyzon marinus
<400> 144
tggtgagtgt tataacaaca ttatttaaaa gaataaattc agaggcttat tatactgaca 60
tttagttgaa ttcactttta aaatatatta tatggctctc actgaaataa atttccaaat 120
tttttgcttt catggctctc ttagtcaaaa aggttcccga cccctg 166
<210> 145
<211> 206
<212> DNA
<213> Xenopus tropicalis
<400> 145
gcaaaagatg ccatgttcag aagaactgtt catgatcttc actcaatgtt ctattcatgt 60
tcaggacact tcatgttcag aagaaataat taaaactgtt aataatgaca tttgagtact 120
tttttttgta aaatccctta tgcggcccag cctcatcctg actttgcctc ctgcggcccc 180
caggtaaatt gagtttgagc cccctg 206
<210> 146
<211> 226
<212> DNA
<213> Xenopus tropicalis
<400> 146
gtcttttttt gttagagggt tcaaaaactt atttcactca atgaaatgca aatcagttgc 60
tatcttttat ttaaagttat tttttcgatt ttccttttga tgtgctatct gccactgtta 120
aaataaacct accattgaaa tgatactgtt ctgagacttt tcatttcttt gtcattggac 180
aaacttacaa aatcagtgag gggtcaaata attatttcct ccactg 226
<210> 147
<211> 173
<212> DNA
<213> Danio rerio
<400> 147
gtcaagtaaa atgaggtagg ctaatttaaa tccatgaaaa ctattgcgtt atataattag 60
gtgtataagt tattgtgaca gatatactgt tgtttgcgca tctgttgtgt ggctctttgc 120
agtgataaag tttttttttt ggctcatcat gccaaacagg ttcgccaccc ctg 173
<210> 148
<211> 216
<212> DNA
<213> Takifugu rubripes
<400> 148
gtgcttttgg atagagggat caaatactta ttaccctcaa tgaaaaacaa ataaattaaa 60
ataaattctt taaagttatt ttctggattt tctttttgat attctgtctc tccatgttag 120
aatacatcta ccattaaaag tatagaatga tcatgtcttt attagtggac aaaccaacaa 180
aatcagcaag ggatcaaata ctttttactc tcactg 216
<210> 149
<211> 220
<212> DNA
<213> Xenopus tropicalis
<400> 149
aaatggcctt gtcccaactt ttttgggatt tgttgacacc atgaaattct gaatcaacat 60
atttttccct taaaatggta cattttctca gtttaaactt ttgttccgtg atttatgttc 120
tattctgaat aaaatattag aagttggcac ctccacatca ttgcgttcag tttttattca 180
caatttgttt agtgtcccaa cttttttgga atccgggttg 220
<210> 150
<211> 217
<212> DNA
<213> Xenopus tropicalis
<400> 150
ctcagggggc tgaataatta cgcacacccc actttgcagt tatttatttg taaaaaatgt 60
ttggaatcat gtatgatttt cgttccactt ctcacgtgta caccactttg tattggtctt 120
tcacgtggaa ttccaataaa attgattcat gtttgtggct gtaatgtgac aaaatgtgga 180
aaagttcaag ggggccgaat acttttgcaa gccactg 217
<210> 151
<211> 375
<212> DNA
<213> Anopheles gambiae
<400> 151
atgctaccaa gttagcccag gataaggctg ttttgttatt ttctttagtt tttcaaatgt 60
acgggctggc cacattgcga attaaaagcc ggagctgtaa ttatttatag gcaataatga 120
taaatggtta aaataataaa attttctata ctggtcctat tattttgtcg catgattttt 180
ggggtttttt caacatttct tataataact tttttgtttg ttaacttatc aacaaacttt 240
caaagcagac tttaagccaa catccgaaaa gtgctttcat gaaaatttgg taaatattga 300
ttcactttag gtaatgaaat gtgataagtg aataaaacat tattaagtgg tcctattgat 360
ttgtccgaca ctgta 375
<210> 152
<211> 218
<212> DNA
<213> Xenopus laevis
<400> 152
gttcaggggg caattacttt ttcacacagg gccatgtagg tttggatttt ttttctccct 60
aaataataaa aaccctcatt taaaaactgc attttgtgtt tacttgtgtt atctttgact 120
aatagttaaa tgtgtttgat gatcagaaac attttgtgtg acaaacatgc aaaagaataa 180
gaaatcagga agggggcaaa tagtttttca caccactg 218
<210> 153
<211> 143
<212> DNA
<213> Anopheles gambiae
<400> 153
aatgtgtttt cgctcagtgg aacaccgcaa cacctcctcc caacaaccac ttaaacagtc 60
cttttcaggg ctaccaaata tttctgacaa gaactatgtc tttcggtcac agaaaaaagt 120
tcctattttt atgtccacca gtg 143
<210> 154
<211> 37
<212> DNA
<213> Xenopus tropicalis
<400> 154
tatggtgttc ctaataatcc ttttggtgtg tgtatat 37
<210> 155
<211> 303
<212> DNA
<213> Petromyzon marinus
<400> 155
ccttttttgc tgcttagttt gtgagattcg gatatgtgca cactaggtct gatgtaacta 60
tctttttgct aacgtcgcct tctttgataa ctttttagta aataaatatg ttggttgtct 120
ttgttttttg tgcattgcac gccactcacc catgattaac atggaatgct aaacttagtt 180
tttcgtcttt tttccccgag ctttcgttct ggcttgcaag tattgaacag aatgattatg 240
cggcccgcgc tcgtcattct ttcagttatc cggcccactg tgaaaaaagt ttggtgaccc 300
ctg 303
<210> 156
<211> 216
<212> DNA
<213> Petromyzon marinus
<400> 156
gtcatgtttt gcagaggggt caaatactta tttccctcat taaaatgcaa atcaatttat 60
aacatttttg acatgcgttt ttctggattt tgttgttgtt attctgtctc tcactgttca 120
aataaaccta ccattaaaat tatagactga tcatttcttt gtcagtgggc aaacgtacaa 180
aatcagcagg ggatcaaata cttttttccc tcactg 216
<210> 157
<211> 381
<212> DNA
<213> Alligator mississippiensis
<400> 157
cgggattctt ctcgaaagct acacccagga atccacactt tgaaggattc gatgactaaa 60
atgttaatct gaatgtcttt ttttataact ttaatttttt tggtacatca tttttataat 120
tttcgctgat tgtattttta tgttctgtaa tatgtaagag ttatgcaaat taaaacaaag 180
ttatcgagtt ggagtttcct ttagaccttt tctttattca gaataaataa aaacgattac 240
ctgtatttac agtatgcaaa cctaagtaat gtatattaga gctgatttcc tctattcagg 300
ggcggctcct cgcttatcga ccaattcgct taacgaccta gtcgtgggaa cggaactcgg 360
tcgttaagtg aggagtgcct g 381
<210> 158
<211> 290
<212> DNA
<213> Myotis lucifugus
<400> 158
tttctagttt tcgtaccatt tgattatcat tgtttttatt attatttttt cctaaatgta 60
cattgttttt ctgtttttgt tcattttata catatttttt ggttgatttt tctttgttaa 120
atggcattta aatatataaa ataaatatca aaaatataaa tctttttttt actatggttg 180
caaatatcaa aaaaaaatta tgaatatttc tatatgtgac acggcaccag agttaagtta 240
gggtttttca aaattttgac acgccgagct caaaaggttc gccatcactg 290
<210> 159
<211> 389
<212> DNA
<213> Petromyzon marinus
<400> 159
aactgaaagt gatgatgtgt tgctgcagcg aggttggagc caaatctccg acacacagcc 60
tgcgtggctg ctctaacctg ttaatgtaga taataaagaa gttcaagtga ggtcattggt 120
ttgggcgcag gcctcagatg ttttcatgat gtttgatcag tcacgttacg acatgttttt 180
gtattgttca tgttcgtgca atttgttaaa ttgccttgca aataaatgct ttgctacctg 240
ttaaaggcca aatcctttca tgtaatgatt tttacatgtc atttatatta gttcacacaa 300
acactccatc catctgttcc tggcccggcc cctctgtcaa attttagaac ccattgtggc 360
ccgcgagtca aaaaatttgc ccacccctg 389
<210> 160
<211> 219
<212> DNA
<213> Xenopus tropicalis
<400> 160
tttaagggtg tgcacactta tgcaaccaca ttattttagt ttttttggtt ttcttccctc 60
cgcctaaaag atttcagttt gtttttcaat tgagtggtac agtttatagg tcacattaaa 120
ggtggaaaaa gttctgaaat gatttatctt tgtctcattt ttgtacagca caggaacctg 180
acattttacc aggggtgtgt agacttttta tatccactg 219
<210> 161
<211> 218
<212> DNA
<213> Xenopus tropicalis
<400> 161
gttaagggtg ccaataattt tgtccagccc atttttggag ttttgtgtga cattatgtcc 60
aatttgcttt ttttcctccc ttttttgttc tgttccaata cacacaaagg gaataaacat 120
gtgtatagca aaacatgtgt tactgcaata cttttctgtg agaaatactt gattttctgg 180
aaaaatttct ggggtgccaa caattttggc catgactg 218
<210> 162
<211> 216
<212> DNA
<213> Xenopus tropicalis
<400> 162
cactgatttt ctcaggtgtt caaatactta tgtgcagcag tgcaatacaa atacattctt 60
taaaaatcat acaatgtgat ttcctgaatt ttttttttaa atgctgtctc tcacagtggg 120
aatgcaccta caatgtgaat ttcagacccc tccatgattt ctaagtggga gaacttgcaa 180
aatcgcaggg tgttcaaata cttatgttcc tcactg 216
<210> 163
<211> 258
<212> DNA
<213> Xenopus tropicalis
<400> 163
gcctcatttt gacttgtttt aaggacatta catcaaagtt ggatcagcct gtagtgtttt 60
tttccacttt aattttgagt gtgactccaa atccagacct ccatgggttg ataaatttga 120
tttccattga taatttttgt gtgattttgt tgtcagcaca ttcaactatg taaagaacga 180
agtatttaat aagaatattt cattcattca gatctaggat gtcttatttt tgtgttccct 240
ttattttttt gagcagtg 258
<210> 164
<211> 258
<212> DNA
<213> Takifugu rubripes
<400> 164
gaatcatttt gagttgctac aatgacattt tggcaaaatg gaccagtctg ctgcatcatt 60
ttttcacttt catttttggg gtgtctttga tttcccccct ctatagggtg atcattttca 120
tttctatcaa attatgtggc atcattttgt tactaataca tcacctactt tttatcagga 180
aagatattca agatcatttt cccccccgtt tagatctgat gtgttttcga agtgttcctc 240
taattttttt gagcagtg 258
<210> 165
<211> 1442
<212> DNA
<213> Xenopus tropicalis
<400> 165
ctgcccatgc agctgtcctt ctctgcacgc cgcttgacac cacacacagc tgtcctttag 60
cgtcctcctc caccaccgta caaactaggg tgcaaatcct actggcttaa ttttaagcca 120
aactttttgg acaggtaaat cctgaatttt tctgtcttct gtgcttggca cgctatctta 180
gtttttttaa agggtttgcc tggggcatgg ttatgatacc atctatctaa gatgtttttt 240
ctgtcttctg tgcttggcac cctatcttag ttctttgaaa gggtttgcct ggggcatggt 300
tatgatacca tctagctttg atgttttttc tgtcttctgt gcttgtcacc ctatcttagt 360
tctttgaaag ggtttgcctg gggcatggtt atgataccat ctagctttga tgttttttct 420
gtcttctgtg cttggcaccc tatcttagtt ctttgaaagg gtttgcctgg ggcatggtta 480
tgataccatc tatctttgat gttttttctg tcttctgtgc ttggcacgct atcttagttt 540
tttgaaaggg ttctgcctgg ggaatggtta tgataccatc tatctaacat attttttctg 600
tcctctgtgc ttcagtggct gcgacaacaa aaatacaaac tttttcaaca tttatctaac 660
atattttttc tgtcctctgt gcttcagtgg ctgcaacaaa aaaaacataa tttttcagga 720
atgtacacat tcctgatttt tcagggttct gcaacagcgg caaaatcgta tcttttatgg 780
tcaccacagg tgatcaaaaa ggtaggacaa aactgggccc acactgcaga atcagtgttt 840
tttggttcac gtcactgtac attgaattac ctctgcctga ccgtgcacgt gcgcacaagc 900
acggtgactg ctaaacacac cactacagaa atattcccac cgacaggacg aacgtcctgg 960
aggtgacaag caactagtaa aaactattat tcgctcactt gacagtatca ttaaagcttt 1020
ttgcgttttt tttcgttgca gtaaacgcgg cgttttgtct ttgcgtgtga accggccgta 1080
acctttacac gacttgattg gcatgtagac gccggacttt ttaaagcagt ttattacata 1140
agtttaggaa tgtagtgtga tttctgccct ttacagcaca aaacgcaacg ctgtgtcaac 1200
aacgtatttt tcagagaaat ttttgccctt gatccccctc ctgcatgcca ctgtccaggt 1260
cgtggcaccc tttaaacaac tttaaaatca gttttctggc cagaaatggc ttttctaggt 1320
tttaaagttc gccttcccat tgaagtctat ggggttcgca aagttcgcaa aagttcgcac 1380
tttttggcgg aagttcgcga acgggttcgc gaactttttt tgtgaggttc gctacatctc 1440
ta 1442
<210> 166
<211> 247
<212> DNA
<213> Xenopus tropicalis
<400> 166
ttaacaaata atgtgagtgt attgttaata caaatacaaa gttcaactaa actcttgctt 60
tagttaccgt taccggtact ttttttttgt tgaataaagt tcaactaaac tcactgtttt 120
gcttccgtta ctttagcatg cgccttataa tccggtgcgc cttatatatg taataagtac 180
agaaatagac cccgtaattg agactgcgcc ttataatccg gtgcgcctta tagtgcggaa 240
aatacgg 247
<210> 167
<211> 655
<212> DNA
<213> Alligator mississippiensis
<400> 167
ccgtattttc tcacatatag cccgcacact gatataacct gcaccaatgt ataacccacg 60
gaaaattgta ttttcggaaa atagtctgtg tatagaccgc acccatgtat tccctgcacc 120
tgatagtgtc ggtaccgggg gcgattttaa gcctattaag cctgagaggt gctctgccta 180
ctacaggcct ttatacagta acgtttagtc gttaattatt accagaatgt tcgccatttg 240
agcgctaatt attactgtca atttgtaaca tctgctcaag tgtgtttaga aactccagtc 300
agtaaagacg accgactgcc tacgaattta ccccgacctc cctatctcac taatttcatg 360
tatagtttta gctacacgta gaatgtatta tagataacag catttctaac ttaattttag 420
tatagttaat ggtagaatac agtaataaaa taagcgaaat cggttgttgt ccacatgcct 480
taattagtaa gcaacatatg aagctgaaac gaatgacctt gtggtaggtt gttgtgagta 540
ttcagacttg caaaagacat gtgaagtctc ttttaaatct ggacttacgc gattcctggg 600
gtaattacac gactaccgca gggttcgatc ctacccttgc atacttcatt tgaaa 655
<210> 168
<211> 1894
<212> DNA
<213> Xenopus tropicalis
<400> 168
ccctttgcct gccaacaccg tacggcgtac gtgttggcaa ggcaatgcac tgagtgccag 60
cgacgtacct tgtacgtctt cctgcttgtg gcgatgtgga tactgatcgg cggcttcttc 120
ctctttcaaa agccgccgat cgctgcagga tcccctaggc aacgagcgct gggggctgga 180
agtgacgctg ttgcgtcaga tgaccccaag aaggacccca gagcagcggc tacgtcatag 240
acatgtgcct gctgctgggg tatttaaact cagcccccca gcgccgccct ctgcctctct 300
gctggtcctg gatgttgctg gagccctcct gctgtgtgct gctgttctcc tgcggtcctt 360
ggctgtgaga tttgctgtgc ctgccctcgg gtagtccctt tgcttttaca ttacacactc 420
actactcact tactacacac ttactacaca cttactacac atttttacat tttagtactt 480
tacattactt tttttttgca gatttacact aactacactt actaacttac atttgcactc 540
actacactta cacacataca cttacacaca tacacttaca cttacacaca tctataaaaa 600
aagctttttg tgtctttgtg tcattgtttt tgtccaaaaa aacctgttta tttggtgttg 660
tgccctttta ttcactgttt gttatttcat ttatttgttc actgttattt gttcattgcc 720
ttttattgtg attttattga ttattctttt ctgcgttgct cttttgttat atacttttgc 780
ttgttaccat catttctgat tattagtgat tttattgttt gagttttgct ttgctcttat 840
tacttgtttt tggttgtact ttgcattttc agttttatat tactgttcat tgctggttgt 900
tttgattttc agttatttta ttgaatcttg aggtttgcat tgttttttat aactggttct 960
aacttgtttt tgcttgtgct ttgaatttat agttttttat tcctaatcat tactggttct 1020
cttgttattg atttgtgata ttttgaccac tagttactac taattgcatt ttatttgatt 1080
gtaagttctt tggctagtct gatagggttt ttgttccaga aagttccaga gagttcaggg 1140
agttgaagag ttcagggggt tgagcttata gcattttttt tttcttggtc tgatttgttt 1200
atattatcag ttgggttttt ttctccagtc tctgccttgc ctgttgcagt agttttacaa 1260
gtatcccatt ttattgcttt attgctttta ttactttatt atatattttt gcttgttacc 1320
accatctcat tgttgtttga gttttgcttt gacttctgac tagttttact tctgactagt 1380
tcttgcttgt acttctagtt ttatattgct tttcattact agttcaattg attttcagtg 1440
attttatttt gaattttgag ttttgcttgg ttctaattac tgttcattgc ttgattttgc 1500
tctaattact agttgtaact tgttcttctt tgtactttgg attttcagtt ttatattgct 1560
gttcattgct cttgattttc agtgatttta ttttatcttt attttgcatt gttgttataa 1620
ctgcctctaa cttgacctct agttctttgg ctagtctgat agggtttttt gttccagaaa 1680
gttccaggga gttgggaggg agttcaaggg ggttgagctt attagcagtt ttttttttct 1740
tggtctggtt tgtttatatt atcagttggg ttttttttct ccagtctctg ccttgcctgt 1800
tgcagtagtt ttacaagcaa tctttttttc tggcttgatt gttagttctt tgtcactgag 1860
ttttagatta gcctgtacat attttgtttg caac 1894
<210> 169
<211> 992
<212> DNA
<213> Alligator mississippiensis
<400> 169
ccttcatacg ttcccatggg gtaatttcct accccagacg catattttgt gcagtatctt 60
aaagttaatt aattctaaaa aatattcttt ttaggacatt gtcactggca ccgcagtgca 120
caatatcccc aaagaacagc cagcttacat gaatggtttg ctctctgtgg atgaaaaact 180
gcccagggta acatgttacc ccaggcgtga atgtgttttt ccatatgggg taacaactta 240
ccccaagccc atgttaacgc attggggtaa cttgttaccc caatgcaatt tctgtataaa 300
tgacaggcct agacctgttt ggccactttg ggtggatgca tctgaaaggt cagcattcat 360
tcacacctca ttcatgtcca cttcaggtat ccatggtaac taatggatgg ccatcctcca 420
ctctgctttt gcagaagatg tggtaatccc ttttgctaac cactttgttt gcaggctgca 480
aggtcatcaa aacaccctgc cctttgccaa aaaaacccaa aaccctttgt cacacccaaa 540
tccacctctg ctctcttttc tcatggcaaa actccgcctc acctgcccct ttcataacat 600
acaagctagt ttgccctgcc tttgttggaa gtgaggacaa ggagcaaagg gacagcagag 660
aagaaataga acaacatcat actgcaatac agcgtacact atggagtccc cttcaacggt 720
aagggcttga caccccccat gcccctttta cctgctctca ataagcccct gcatgtgtgg 780
tttccaaaca gcatccaccc acatttggct tgcctgcaaa gggtggatgc tggtctctgg 840
cttctgtgcc caggaggaga gggtgctacc tgcgctgcca tagggcaggg cggaattgct 900
tctgtgacag cataggtgga caggcttgtc tttgattgtt atttatatgc attcagcagt 960
aatcattttt tttttttttt ctgcagtcca gg 992
<210> 170
<211> 121
<212> DNA
<213> Alligator mississippiensis
<400> 170
cagtagaacc ccgttttacg cgtattcgac ttacccgagt ctcgcgttta cgcgaattaa 60
tattagcacc caagcagaaa aatacacccc gagacgcgcg tcattcgcgt atatacgcga 120
g 121
<210> 171
<211> 281
<212> DNA
<213> Petromyzon marinus
<400> 171
cagtggttct taacctgggt tcgatcgaac cccaggggtt cggtgagtcg atctcagggg 60
ttcggcagag cccccgccac ggaggtccgg acacacttga attattgtgt aaatttgtga 120
tgacacacac ggcccgcttg gccatcactg gctgcagatg atcatgctac actgcttggc 180
caatcagcgc tgcggggaat ttagtgcgta ctcagtagtc aacgtgtgac tgttgttgtc 240
gtacgtcgtg tgatttcttt aatattttat ccatactaac t 281
<210> 172
<211> 1159
<212> DNA
<213> Alligator mississippiensis
<400> 172
tagggctgtg cgaaatttcg ccggctgttt cgtttcgacg ctgtttcgac tcgtttcgag 60
ctcgaaacag cgaaatcgaa acgaaacgaa gggcttcgaa acagcctcga aacgaaacga 120
gggcagtcga aacgtttcga aagtttcgaa acgtttcgag tttcgaagct gaagctgggc 180
ttgcttgcag ggaaacagaa agtaaggaga gggaggggga agagggggga aggactgctc 240
tgatattgac tgtgtagctg gccagtgact gtgatccttc cctgaggtcc cttccaatcc 300
cagtgctctg ggggagggat ggaaaaacag cataaaaagc agcattgttt gaactgagct 360
gctttctgcc ttggggtcag ttactgagct gtgtcttcca gcagctcagc agcgtcagac 420
aacaaaggct accattcatt tcctacttgc tagcctagca agtgggattc atcaatacct 480
tttgctttct ttctataccc ttttatttta ttattatatt cattcattat tcctttcaat 540
ttattcctcc cccaaaatcc tctttttgtt tttgttagtc tatttcgatt cttttccccc 600
agaaaagaaa tctgtgcttt ctctcacagt gtgcattcca ttcactgtgc agggaagcac 660
agcataatta tattgcatat tataatatag aatttataca ggaacacata catacattta 720
tatattttat tatttattac ataaatacat acatacatac atacatacat tacataaata 780
cacatacata tattatctac atatattaca taaatcagat tacattacag aagaacacac 840
agattttcca gcacaccaag gcaaagacaa gacactatga aacacaccat gaagcgcgct 900
ggaaaggcag ctggcaagcc ttcagggagg ggcggaagag ggggtagagg gagagctgta 960
agttcccccc ccccccccaa actgagacgc agcctctttc ctacaacaag caggcatgag 1020
gcttccacta gtacaggcag caaggagagg ggagcagtgc cagtgccact gcctgtgcct 1080
gagtctgcat cccctccaag agcaccagcc ataacccccc cccaccacca ccacgacaac 1140
aagcagcacc agcaccagc 1159
<210> 173
<211> 408
<212> DNA
<213> Microcebus murinus
<400> 173
caggttgagc atccctaatc cgaaaatccg aaatccgaaa tgctccaaaa tccgaaactt 60
tttgagcgcc gacatgacgc cacaagtgga aaattccaca cctgacctca tgtgacgggt 120
cgcagtcaaa acgcaggcgc acaacacaca gtttattcag cgtccccaag ggaaaaaaga 180
ccctcccagc ccccttcagc tgcgatatat cttttccgcg cacgcccaga ttcccccacg 240
caagcacgcc cacaaagggt aataaaatgg cacgtgtgca ggccggacgc gccaacggca 300
ggttccccac gatgccccac atggggccaa gacctacgtg cattactcac tgtgtttttt 360
ttgttttttg cttattctct gctctgtggt gtaaagatat tgttgaaa 408
<210> 174
<211> 319
<212> DNA
<213> Trichechus manatus
<400> 174
cagtagtccc cccttatccg cggtttcgct ttccgcggtt tcagttaccc gcggtcaacc 60
gcggtccgaa aatattaaat ggaaaattcc agaaataaac aattcataag ttttaaattg 120
cgcgccgttc tgagtagcgt gatgaaatct cgcgccgtcc cgctccgtcc cgcccgggac 180
gtgaatcatc cctttgtcca gcgtatccac gctgtatacg ctacccgccc gttagtcact 240
tagtagccgt ctcggttatc agatcgactg tcgcggtatc gcagtgcttg tgttcaagta 300
acccttattt tacttaata 319
<210> 175
<211> 352
<212> DNA
<213> Alligator mississippiensis
<400> 175
tagggaccta ccgaaatcgc gatttcgcga ttttcgcgga aaccgcgatt tcgggcggtc 60
tccgcgaaaa agcgcgggct ccgcgaaaaa gcgcgggctc gctgcggggg ggaaagcaaa 120
agaaagctgc aagaacagaa aagggcggga agccctggcg tcctgaagca cggggggagg 180
gaggaggggg gagagggagc aaatcggagg ctgagcccct gacgtaggct cagtccagga 240
gccagtcagg ggccagccag ggaagcggga gggttttggc gccggctttt aaagcgcccg 300
caggcatgct gctgcagcat gcatgctcgc ttccgcctga ggaagagcag gg 352
<210> 176
<211> 992
<212> DNA
<213> Alligator mississippiensis
<400> 176
tagggctgtg cgaagcttcg gttgccgttc gattcggaga agattcggcc cgattcggag 60
gccgaatcac cgaatccgaa tcgaatcggg aggccaaaaa accctccgaa tcgattcgga 120
gcctccgaaa cgattcggaa aagattcgga gattcggaag gcggtctttc aggggaacag 180
aaactgagaa gagggagggg gagcaggggg ggggaaagac tgacatctgt agctggccag 240
tgaccgtgat ctttccctga gtccccttcc aatcacagtg ctctggggga gggacgtaga 300
aacagcatat aagcctctgt ctgcagcctt tctgtccctt ttgcgagctg tttctgcctg 360
agcaacagcg tctgaaaggt actggactgg cttggcttcc tagtcagtct cctgctagtt 420
tctgttcttg gaaaggattg gatacagctt actaattacc cttgcctaga atccctatcc 480
aatccatttc tttcaactta ttcttccccc aaaaacctct tatttgttct tgttttttcc 540
cccacacttt aaaagaaagc tgtgttttcc ctggcagtgt gatccatcac tgtgcaggaa 600
agcacataca ttacacacac tcacacatac agtaaacaga gaagaagaag agatattaat 660
tattaaacac acacacacac agagaagaca caacagagaa gaaagaacac acacacacac 720
acacacacac acagacacat tttccagcac aggaaagatt aatatgaagc gtgctggaaa 780
ggcaggtgcc aggtcttctg gcaggggagg gagaggggct agagggggta gggggagagc 840
tgcaagttcc cccccccccc aaacatagac gcatcctctt tcctggcagc catgagtctt 900
ctgctgccgg tgggagcaag gaggtgggag cagtacctgt ccctgcacct gcaccacctc 960
ccctaacacc agaaatagcc accagcacca gc 992
<210> 177
<211> 729
<212> DNA
<213> Xenopus tropicalis
<400> 177
tagggatgag cgaaaaaatt cgccagcgtc ggtttcgcgg cgaacttttg cgtttcgccg 60
ccggcgaaat gtttcgcgaa acggcggcaa aaattcgccg tgcggctcgt ttcgccgcgc 120
ggcagaattt tgacgcacgt ccaaaatttt ttgtcgcgcg gttatttttg gcgcgcgcgg 180
ccaaatttgg tcgtgcgcga gcaatttttg ccgcgagcgg ccaattttag tcgcgcgcgg 240
gcaatttttg acgtgtgcgc cgatttttcc gccgtgcgac aaaaaaaaaa acgcgcgaca 300
aacggaaacg tcattttagc cttgcccatt tcttccacat cagccaatta gattggagcc 360
ctcccactgt ccatataagg aggtgcagag gcggccatta ctcagtgcgt ttttggtagt 420
ggatagagta ggagctgagg tgtgtgaggt gttgtctgtt tagctagagg taggatttgt 480
tagagctttc tgtgagtcag tgcaagtgga agttgtggat ttcagttcac tgctttccct 540
cttctgcttg cctgctcccc tgtgagaccc aagagccctt gttagggcta cgtttgtctg 600
tctttgtttg tgtgtgtgta tcccttgtgg gtgcacactt ctggggttta gtcttttatt 660
tatttatccc taccttcccc caaatatcca acccccccct attttttttt cttttttagt 720
tggtccagg 729
<210> 178
<211> 394
<212> DNA
<213> Drosophila yakuba
<400> 178
tacagtggcg agcaaaactg agtgcatgtt cacaactctc actttggcca tcaataaaaa 60
cacaaccgct tatgcaaatt caataatttt ttttatatta ttaatcttaa ttaatttata 120
acttatttta tgagaaaaaa caaatttagc atatatattc aaagacttag aataaaaaaa 180
ctaaataaac tcacataaac tcaattttgc acgttttaag tcttgtaact gtttttgatt 240
ttaacatctc ttatcagtat aaatcggcca gatttaccgt tatatttctt ttaatgctat 300
tttcggtggt cattgattag ttaaaagcgt gtttttgcag agcaaagttc tttagggtga 360
ataaatataa ataattagtg ataaaatcct taaa 394
<210> 179
<211> 528
<212> DNA
<213> Alligator mississippiensis
<400> 179
atgttattta gacatttata tgttttaatt ttcattaaag actgttttaa catttgcaat 60
aaaaaatgtg attttgtagc ataagttttt tactattaat gttgtgatag cgcaccttta 120
gccagtagtt aagcaacact tccctgcttt tcctatctgg catcttactt actttttgag 180
ctacattaac agtttaaaaa ataccagtac atttaacaat ccatatcttt tatttataaa 240
ttgaaacaaa ctatatacat ttgtatttat aattcagtca atttaatgaa tttgacttct 300
ttccatcggc gttgggtgga ccagctatag cactcatatc gtcatcgtcc agtatgtcgt 360
ataacctgga aatactattc aaacaattat taatgcactt attaacttct gctacacttg 420
tttttgcata aatggctctg catagcccgc acccttgtat agcccgcacc catccgtcat 480
gtttgtaaaa acttatataa cccgcggact atatgcgaga aaatacgg 528
<210> 180
<211> 4787
<212> DNA
<213> Xenopus tropicalis
<400> 180
aaggtttata aattgtgtat tgatttggat tggatttata gtaagcattg gtatcccact 60
ttgtgcaaaa tttatatagt atactttgat ttatgtattc agggcagttg tggttatttt 120
ggaattttca gtaccctaat atattgctta ttatggatgg cactgggggt atagccaatt 180
gaggtgtaag gtaacgcaca gggcgcctac acatttgtgg tgtgtgatga ttatgatgat 240
tcatcttgcc tgctgatgtt ttcatctccc ctgctgatgc cacaaagttt tttttctact 300
gacacctcat aagctgccct tgctatctgt ttttttggac aatatttcat attttactag 360
tttattgggt ctccctgaaa tcttgttttt tgttatgggc tccagctttt ttgtaaagtg 420
atttttgcat gtttagggtt tttgttttgc agttgtgaaa gtagttttgc tgatggtttg 480
ctgatagatg gggacagttt gcatttcaat actaatcaac tattatctac taatcaacta 540
attcaatgct aattgtagtc tttctcttta ttatggatat tagtactgag ctgaaggcat 600
aacagtgaaa ggaacaggga acttgattga caacttactg aggatatctt taattttggg 660
aagcatatat tttcttctta gtcacctagc accacaattt agcaaaaagc taaatgctta 720
catcaggggt cgtcaaactt tttaagtgct gggtccttcc gctctccgct gggtctttcc 780
gctctccgct gcgtccatct gctctccgcc tcgcatcata ttggggaaca ggtaaattat 840
cttggggggc cgtatcaagc ccaagggccg tagtttgagg atgtctggct tacatgaacc 900
gcaagcgtga tcagacttga catcacctct ttagctaatg caagctttat tgttagcatc 960
tcaaatgctc acaattcagt gaagtacaca tgaaacgaaa gggccgaaag atgctcaact 1020
aaatagataa acgtaagtag aatttatttg gggctaaatt gggcagggtg ttttagtcat 1080
tattgcaatt tcaaggagaa atctaacttt ggatcttttt ttatccttta ttttaggcta 1140
aactgcaaag ttcatcggag aactgtgtcc acaattctat atgtagggaa gcaaggatgg 1200
ttttcctgaa tagctgcagg tgagcactat caaggaacat atagtttgtg ggggtatttt 1260
ccaggtaagg ggggtgttaa gcagtaccac cgctccctat acgcagagta cacactctgc 1320
gtagggcacc aactcccagg ggggcaccca gacagtaccg ccgctcccta cgcagagtgc 1380
gcactctgcg caacaacata ccaagtcttc gccagcgcca gtcagcgcca gcggctcctt 1440
ctctcttatg ctgcggcaac aggccctttt ataaggttgc gcccgtgcgt atgacgtcac 1500
acatcagcga cgaggcgcaa ccttatagaa gtgcctgttg ccgcggcata agagagaagg 1560
aggcgccgac gatcactggt ctgttggggg tactttctgt gggggcactg tgcgggctgg 1620
ctaatgtcta tggggggtac tgtgtatgag gcaattgggg gtactgtttt tgggggcact 1680
gtttatgggg gcaattgggg gtactttgta tgggggcact ttgtgtgggg gctactgtct 1740
atggagggta ctgtttatgg gggcaattgg gggtactttc tatgggggca ctgtgtgtgg 1800
ggtctactgt ctatgggggg tactgtgtat gaggcaattg ggggcacttt gtgtgggtgc 1860
tactgtctat ggggggtact gtttatgggg gcaattggtt ctattttggc ccctatagta 1920
ggtgtttttt tttttttttt tttttctcgg taatatttgg gggagggggc accaaagtaa 1980
atttcaccca tttggccagc agcggccctg gtgttaagac tcaaaatcta gcagatatgc 2040
atttatagca tagccaccag atttagctat tgccctagtt ttagggtgtt tggtgggtgt 2100
gtcttttgat actcacatat gtggggtatc gtttgattca gaagaagctg aagattgata 2160
ttgagaaggt tttttgtagt tgtcacggca attttaggga gaattttgac tttggatctt 2220
tttttttctt catttcaggc caaaccgcaa atttctacga agaactgcgt ccacagtttt 2280
tcatgtaggg gaacaaggat ggtaccgctg aatagctgca ggtgtgcact ttcaagaaat 2340
atatggtttg tgggggctat tttacaggta gggggtgttt tgactaaaaa actgcaagga 2400
gtgcacttag agagtagccc caaactttcc agctgaaatt gctcgtatgt attgcccctg 2460
ttttggggtg tttggtggcc ccgtctttag gtgcacactt gcatgtgggg tatcgttttg 2520
ttcgggagaa tttgcagatt gatattgagc aggttttttg tagttgtcat ggcaattttg 2580
gggagaaatt taactttgga tctttttttt tcttcatttc aggccaaact gcaaacttct 2640
acgaagaact gcgtccacag tttttcatgt aggggaacaa gcatggcacc gttgaatagc 2700
tgcaggtgtg cactttcaag aaatatatgg tttgtggggg ctatttcaca ggtagggggt 2760
gttttgacta aaaaactgca aggagtgcac ttagagagta gccccaaact ttccagctga 2820
aattgctcgt atgtattgcc cctgttttgg ggtgtttggt ggccccgtct ttaggtgcac 2880
acttgcatgt ggggtatcgt tttgttcggg agaatttgca gattgatatt gagcaggttt 2940
tttgtagttg tcatggcaat tttggggaga aatttaactt tggatctttt tttttcttca 3000
tttcaggcca aactgcaaac ttctacgaag aactgcgtcc acaatttttc atgtagggga 3060
acaaggatgg caccgctgaa tagctgcagg tgtgcacttt caagaaatat atggtttgtg 3120
ggggctattt tacaggtagg gggtgttttg actaaaaaac tgcaaggagt gcacttagag 3180
agtagcccca aactttccag ctgaaattgc tcgtatgtat tgcccctgtt ttggggtgtt 3240
tggtggcccc gtctttaggt gcacacttgc atgtggggta tcgttttgtt cgggagaagt 3300
tgcagattga tattgagcag gttttttgta gttgtcatgg caattttggg gagaaattta 3360
actttggatc tttttttttc ttcatttcag gccaaactgc aaacttctac gaagaactgc 3420
gtccacaatt ttccatgtag gggaacaagg atggcaccgc tgaatagctg caggtgtgca 3480
ctttcaagaa atatatggtt tgtgggggct attttacagg tagggggtgt tttgactaaa 3540
aaactgcaag gagtgcactt agagagtagc cccaaacttt ccagctgaaa ttgctcgtat 3600
gtattgcccc tgttttgggg tgtttggtgg ccccgtcttt aggtgcacac ttgcatgtgg 3660
ggtatcgttt tgttcgggag aagttgcaga ttgatattga gcaggttttt tgtagttgtc 3720
atggcaattt tggggagaaa tttaactttg gatctttttt tttcttcatt tcaggccaaa 3780
ctgcaaactt ctatgaagaa ctgcgtccac agttttccat gtaggggaac aaggatggca 3840
ccgctgaata gctgcaggtg tgcactttca agaaatatat ggtttgtggg ggctatttca 3900
caggtagggg gtgttttgac taaaaaactg caaggagtgc acttagagag tagccccaaa 3960
ctttccagct gaaattgctc gtatgtattg cccctgtttt ggggtgtttg gtggccccgt 4020
ctttaggtgc acacttgcat gtggggtatc gttttacttg tgagaacttg ttctttcata 4080
ttttacttca tttgaaaatt tttattggat atttttttct caaattcact tttgtctctg 4140
tgactttgat ggcatttcat aaaataaaaa aaatcccaaa aagtattgtt gaatttcgta 4200
gtgatctgta tgacgccaac tgcatttaga gcaaaaaact accccagacc caaaaaccta 4260
gaggtgtgta gtttctaaaa atacctaact tatggaggtc tttcacttct atcattagat 4320
ataccatgtt aacatagaga tgcgcttatc ggttttgttt caatgtaaaa ttgtagaaaa 4380
tgttgtttta ttattggggt gtcttctggg caagaaaagt gggataccaa tacatatttg 4440
gtattggtgg attcagcaga atcggggctt ttatgaataa taaaattttt gtcagtaaat 4500
gtaatttttc ttgaaaaaaa aacacaaaat aaaaacatat ttttatttat tttatttttt 4560
ttttacatat ttcactcaaa atttttgtta catctcctga aaaagtacat ttttttttta 4620
cagtgttcaa gtccaattcg ctccggaaaa aacgatatat aatttgcctt atttcatgta 4680
ggctttcttg tcaaaaaacc taagcaaatg taatgagtgc aaaatgtctc aaaattgctt 4740
ggcagtagat gttcgctttt agggcaaatt ggctggcagt gaaaggg 4787
<210> 181
<211> 351
<212> DNA
<213> Alligator mississippiensis
<400> 181
ttaaaacagt taggaaatgt ttttggaagt aattgttagt ttgaaaacag tgtgaactgc 60
agacttagca aattgttcat tcacgttttg aaactctaaa aaaagtttaa attttgttca 120
tagttctagt taaataatat tttgggttca aatcatcata aatactcttt caaacaatct 180
gtatgtttaa taaatagttt ttggtacatt tatactgttg tcactggttc cattttgttc 240
atgcgggtgg ggtaacaagt taccccatga gaccaacaat gtcgaattgc ggggtaacaa 300
gttaccccat gagaacaaca acggttacgg tttcatgaga acggatgagg g 351
<210> 182
<211> 287
<212> DNA
<213> Alligator mississippiensis
<400> 182
tggatggatt gaagattgtt gcatgtccat tttgtatttt tttattattt tacttataat 60
gtaaatgaat aaatatgttt acaatacgtt tttgtaacat aataaataaa gtattggttg 120
aaaaaggttg tatttggtgc ctttggtgtc ataaatgtga ggtccaagga acgcaacccc 180
tcacttttct attatttcct atgggaaaat tcacctcgag ttgcgcgaat tcgacatacg 240
cgaggtttct caggaacgca atatacgcgt aagtcggggt tctactg 287
<210> 183
<211> 221
<212> DNA
<213> Petromyzon marinus
<400> 183
tttccaggta tgtaatttgt tgtgagttta tgcattgtgt tggttttatt ctttgaacaa 60
ggtaatgttc atgcacggct cattttgtgt accagtaaaa aacatatcta tgtcttgaat 120
ttgaaaaaaa tcacatttta tttttcacta aagaggggtt cggtgaatgc gcatatgaaa 180
ctggtggggt tcggtacctc caacaaggtt aagaaccact g 221
<210> 184
<211> 2237
<212> DNA
<213> Alligator mississippiensis
<400> 184
gtgccaccct cctcactccg tccgcaccta tttccttttt tcatttttta aaaaccattt 60
aatgccccgc tctcagagct ggagggggca ctcactgcat caccagccag caggggaaga 120
acatgtccct gctgagctcc cgtgccagga cgaacttgga ggtatgggct ggggctatgg 180
ggaaggagga ggccccaggt cctgggcatg accactaaaa ctgcactctg ccagggtcgg 240
gaggcctggt gggactgccg gcggcgcggc agccccagga aatgccagga ccgaggatcc 300
ccctggtgaa aggcgggtag gaggcgccat aacctccagc caccacacgc acgcacacag 360
tcctggctgg ggaaagccca gacccgtcac gtctttgaca ggcctgaggc ttgctggttg 420
cagtggagtt gtgaggctcc aggtgagctc agcttagctg cctgggatgc cagctttcgg 480
gttgaaaaac ccttcgtcag gctgaggaag cacctgcagt tggtgtgtgt gctgttcctg 540
gatggaagga atagtaaaga agccagaggc tggcatgcaa tgcaggcaag aaagccagtc 600
agtgaaaatg gaaatggagg cgtcaggggg tgagggacag gctggggtgg gggggggaag 660
ggggatgtag cagcgcaggt aaaagtggag aggtacctgg ggagtcagat gtccggcagg 720
ttgtagtgtg tcagaattcc aatgtctata ttgagtccat gagtttctgt acctaggagg 780
ttgatgaagt gcagttcata ggctcgtctg tgaaaagtgg tttgtaaatt ccctttgagg 840
atcaggcctg agagattgga gacaggtggt gttctgttct tgtctttgat agattttcgg 900
tgtgcgctca ttctggtgcg cagttgttgc ttggtgtctc ctacgtattt tccatcaggg 960
cacttggtgc cctgatggag atatgtattg tattgtgaag atatctccat actggagata 1020
ttgttggcag gttttgcgtg tcttgtcatg gcatggcctg gatccattcg gtgtgttttg 1080
ggctgtagga agttggcttc tggtgatgag gttagcgagg ttcagtgctt gtttgaattt 1140
acaaaccact tttcacagac gagcctatga actgcacttc atcaacctcc taggtacaga 1200
aactcatgga ctcaatatag acattggaat tctgacacac tacaacctgc cggacatctg 1260
actccccagg tacctctcca cttttacctg cgctgctaca tcccccttcc cccccacccc 1320
agcctgtccc tcaccccctg acgcctccat ttccattttc actgactggc tttcttgcct 1380
gcattgcatg ccagcctctg gcttctttac tattccttcc atccaggaac agcacacaca 1440
ccaactgcag gtgcttcctc agcctgacga agggtttttc aacccgaaac cttgctaaga 1500
tatatttctc taactattca gttggtctac taaaagatac cagattagat tgacccaaag 1560
aaccttgtct gccagtgcca cgtccttaga ccaacacccc tagcacctgt ccccggtcag 1620
gcgacaggcg ggcacatcta agccccaggg ctggggctgg cagggagagt tctctggcag 1680
ctgctggaga agaagctcct gcaggaaagg aaagaaaggc tctgtgacag tttggctgcc 1740
tgagatgctg ctggtgctac tgtgctgctt actattttac ctgttgttat ttaaagtggt 1800
ggaccgggct gaggctgtag gggaggagga gacctcattg gggcacacta ccgtgtcgtg 1860
tagaggcccc agcgccagtg agggcgcgcc ttaacacaca cacaaagtca cacatgtcac 1920
gagttttgct tgtcagcagc ttgaggtgca gtttcccaga aacccctgca cctatctcct 1980
tgaaacttgg caggcttcgt ggcctcagca ggggctacca tccctgctgt tttcatccga 2040
atcaggcaag aaatgacaaa gttataggca gtttcgtgat tccccattat agcctatggg 2100
cgaaacgtcg aaacagcgtc gaaacagcga aacagtttcg acgaaacgaa acggaacgaa 2160
actcgaaacg aaacactgtc ccgtcgaaac ggcgaaacgg aagtcgaaac gaaacggtgc 2220
tgtttcgcac agcccta 2237
<210> 185
<211> 658
<212> DNA
<213> Microcebus murinus
<400> 185
aaagccatcc agcagaatgc ctcctcatcc ctagaggacc cacttcctgg tccctcaact 60
gcttctgatg tttcttctca cctaaaaaat aaaatacagt gtacagtaac cttttaatca 120
aaacacagca tcgtaggtgg agactgaaag cctgccgttg tttgttgttg ctgttgttta 180
acagctgata caggtattct ggtgatgcta ctgtgctgct tagttaccct gaacacatta 240
ttttttcact gtattaatgg tatgtcatat tttttactgt taagtactta tgtgtgaata 300
agtgtaagaa aatgattgct tatcggtagc atataaattc agagtcagga atgatggtga 360
tgccaaacaa ccacagattg tccacatggg tggctgagat agtgacacct ttgctttctg 420
atggttcaat gtacacaaac tttgtttcat gcacaaaatt atttaaaata ttgtataaaa 480
ttaccttcag gctatgtgta taaggtgtat atgaaacata aatgaatttc gtgtttagac 540
ttgggtccca tccccaagat atctcattat gtatatgcaa atattccaaa atccgaaaaa 600
atccgaaatc cgaaacactt ctggtcccaa gcatttcgga taagggatac tcaacctg 658
<210> 186
<211> 244
<212> DNA
<213> Trichechus manatus
<400> 186
gatattttga gagagagacc acattcacat aacttttatt acagtatatt gttataattg 60
ttctatttta ttattagtta ttgttgttaa tctcttactg tgcctaattt ataaattaaa 120
ctttatcata ggtatgtatg tataggaaaa aacatagtat atatagggtt cggtactatc 180
cgcggtttca ggcatccact gggggtcttg gaacgtatcc cccgcggata aggggggact 240
actg 244
<210> 187
<211> 743
<212> DNA
<213> Alligator mississippiensis
<400> 187
catgaactgc ctgtctcaag gttagcattc agtttcagta aactcctttt tataatgtcc 60
tttaataaag tgtatatagt tggtattagt tacaattcat gttgtgcata gtacagcttt 120
attttcataa gatatttcag tttagagttt aattaagtgc ttagatggta ttagttaata 180
aagtgtatat agttggtatt aataaagtgt atgtagttgg tattagttaa taaagtgtat 240
atagttggta ttagttgcaa ttcatggtgt gcatagcttt attttaataa gatatttcat 300
tttagagctt aattaagtgc ttagactgct taataacgcg tcaattaatg gcttccgcgg 360
gcttaatccc ctgattaagc ccgcggaagc cattaattga cgttattatt aagcagtcta 420
ggacgcggtt aatggcttcc gcgggcttga tcaagcccgc ggaagccatt aaccgcgtct 480
tagactgctt aataacgcgt caattaatgg cttccgcggg cttaatcagg ggattaagcc 540
cgcggaagcc attaattgac gcgttagcaa gccgcggttt ggggccatct ggcaatctgc 600
ggggaggggc gggactaccg gggcccctcg gccaatcaga ggcgtggggg ggcccgccgc 660
gctcggcccg cgaaaatggc gcccggcccc gcgatctgcc cgcgaaatcg gccggcagcc 720
gcctcgagtt cggtaggccc cta 743
<210> 188
<211> 2786
<212> DNA
<213> Alligator mississippiensis
<400> 188
gtgccaccct cctcactccg tccgcaccta tttctttttt ttaaccattt aatgccccgc 60
tctcagagct ggaggcggca ctcactgcat caccagccag caggggaaga acatgtccct 120
gctgagctcc cgtgccagga cgaacttgga ggtatgggct ggggctatgg ggaaggagga 180
ggccccaggt cctgggcatg accactaaaa ctgcaccctg ccagggtcgg gaggcctggt 240
gggactgccg gcggcgcggc agccccagga aatgccagga ccgaggatct ccctggtgaa 300
aggcgggtag gaggcgcctt ataacctcca gccaccacac gcacgcacag tcctggctgg 360
ggaaagccca gacccgtaag atctttgaga ggcctgaggc ttgctggttg cagtggagtt 420
gtgaggctcc aggtgagctt agctgcctgg gatgccatct gcgaggcatg ggctttcggg 480
tttaaaaccc ttcgtcaggc tgaggaagca tctagttggt gtgtgtgtgc tcttcctgga 540
tggaaggaat agtaaagaag ccagaggctg gcatgcaatg caggcaagaa agccagtcag 600
tgaaaatgga aatggaggcg tcagggggtg agagacaggc tggggtaggg gggaaggggg 660
atgtagcagg taaaagtgga gaggtacctg ctctggggag tcagatgtca ggcaggttgt 720
agtgtgtcat aaatccaatg tctatattga gtccatgagt ttctgtatct aggaggttga 780
tgaagtgaag ttcataggcc cgtctgtgaa aagtggtttg taaattccct ttgaggatca 840
ggactgagag actggagaca gagtggtttt cttgtgagaa atgtgccccc acaggtagtt 900
gggtattctt gtctgtgata gattctggtg cgcagtttgt gggggtactg gagatacgtt 960
ggcaggtttt gcatttcttg tcatggcatg gtctggatcc attcggtgtg ttttgggctg 1020
taggaagttg gcttctggtg atgaggttag cgaggttcgg tgcttgtttg aatttacaaa 1080
ccacttttca cagacgggcc tatgaacttc acttcatcaa cctcctagat acagaaactc 1140
atggactcaa tatagacatt ggatttatga cacactacaa cctgcctgac atctgactcc 1200
ccaggtagca ggtacctctc cacttttacc tgctacatcc cccttccccc ccccacccca 1260
gcctgtctct caccccctga cgcctccatt tccattttca ctgactggct ttcttgcctg 1320
cattgcatgc cagcctctgg cttctttact attccttcca tccaggaaga gcacacacca 1380
actagatgct tcctcagcct gacgaagggt ttttaaaccc gaaagcttgc aaagaagaat 1440
ttctccaact attcagttgg tctaataaaa gatatcagat tgaccctaag aaccttgtct 1500
gggctatgtc cttagaccaa cacggctaca acctacaccc cttaacacac acaagtgaca 1560
cgagttttgc tttcagcagt ttgaggtgca gtttcacaga aacccctgca ccactctgcc 1620
tgaaacctgg caggcctccc tcatgcccgc acgaggggct atgtatgtgg caggacaggt 1680
gctaatgagg gcggccattt aatgccccgc tctcagagct ggaggcggca gtttagtttc 1740
tcaccagcca gcaggggaag aacatctccc tgctgagctc ccgtgccagg aagaacttgg 1800
aggtataagg gctggggcta tatggggagg aggaggcccc acatcatcct gggcatgacc 1860
taaaactgca ccctgccagg gtagggaggc ctgggtggga ctgccggtgg cgcggcagcc 1920
ccaggaaatg ccaggaccgc gaacctccct ggtgaaaggc gggtaggagc aggaggcacc 1980
tgataacctc cagccaccgc acagtcctgg ctggggaaag cccagacctg taagatcttt 2040
gagaggcctg aggcttactg gttgcagtgg agttgtgagg gtgagaacag gggctaccat 2100
ccctgcagtt ttcaccccgc tgcgccttaa cacacacaca aagtcacacg tcacgagttt 2160
tgcttgtcag cagcttgagg tgcagtttcc cagaaacccc tgcacctatc tccttgaaac 2220
ctggcaggct tcgtggcctc agaaggggct accatccctg cagttttcac cccgctgcgc 2280
cttaacacac acacagtcac acgtcacgag ttttgcttgt cagcagtttg aggtgcagtt 2340
tcccagaaac ccctgcacct atctccttga aacctggcag gcttcgtggc ctcagaaggg 2400
gctaccatcc ctgcagtttt caccctaatg cgccttaaca cacacacgtg acacgagttt 2460
tgcttgtcag cagcttgagg tgcagtttcc cagaaacccc tgcacctatc tccttgaaac 2520
ttggcaggct tcatgccctc agaaggggct accatctctg ccgttttcat ccgaatcagc 2580
cacaaaatga caaagttata ggtatttcag tgattcccca ttatagtcta tggccgaatc 2640
tccgaatctc tccgaatcgg cgccgaatct tccgaagccg attcggccga atcgattcgg 2700
gacagtgatc cgaatctccg aattgaatca ctgtcctccg aatcggccga atccgaatca 2760
aatacttccc tattcgcaca ggccta 2786
<210> 189
<211> 6944
<212> DNA
<213> Xenopus tropicalis
<400> 189
cctcctctcc ttcctcctct cctcccagat gtaccctcct ctctcaattg ctgccttata 60
ctcccctaat aatctagctg ctgctgctgc tgccactata tcatctcata tcatattcta 120
atttgtggcc tatcaagggt ccttacaatg ttgctactct ttcttaaatt ctaatttctt 180
ctaatttggg gtctgaaatg gctcctaatt atattgtggc tactcctgca aaatatcatc 240
tactttgggg ctggaaatgg ctcctaatta tattgtggct actcctacaa aatatcatct 300
actatggggc tggaaatggc tcctaattat atcgttgcta cttctgctaa aatatggacc 360
aatgtcttct aatttgtggt ctgttgtttt ctaataacct gctgctgctg ctgctgccac 420
agtatcatct aatttcttct aattatggcc tatcaaggct acttgcaatg ttgctacttc 480
ggcaaaatat catctactat ggggctggaa atggctccta attataccgt tgcgacttct 540
gctaaaatat ggaccaatgt cttctaattt gtggtctgtt gttttctaat aacctgctgc 600
tgctgctgcc acagtatcgt ctaatttctt ctaattatgg cctatactgg ctacttgcaa 660
tgttgctact tcggcaaaat atcatctact atggggctgg aaatggctcc taattatacc 720
gttgctactt ctgctaaaat atggaccaat gtcttctaat ttgtggtctg ttgttttcta 780
ataacctgct gctgctgctg ccacagtatc gtctaatttc ttctaattat ggcctatact 840
ggctacttgc aatgttgcta cttcggcaaa atatcatcta ctatggggcc ggaaatggct 900
cctaattata ccgttgctac ttctgctaaa atatggacca atgtcttcta atttgtggtc 960
tgttgttttc taataacctg ctgctgctgc tgccacagta tcgtctaatt tcttctaatt 1020
atggcctatc aaggctactt gcaatgttgc tatgcctgca agtatcatct actatggggc 1080
tggaaatggc tcctaattat accgttgcga cttctgctaa aatatggacc aatgtcttct 1140
aatttgtggt ctgttgtttt ctaataacct gctgctgctg cttggttggt ttgaaccaag 1200
atcagctgct ggcgataatt gccatttgaa ttctaaactt gtgctgaggt aaacatcgtt 1260
ggtctgtagg cacaagaatt ttccgtgctg caatttgcgc cgtctgatcc caaaagcctg 1320
tgctgaggta aaacagtgat ggtatatagg cacaaggttt gaaccaagat cagctgctgg 1380
cgataattgc catttgaatt ctaaacttgt gctgaggtaa acatcgttgg tctgtaggca 1440
caagaatttt ccgtgctgca atttgcgccg tctgatccca aaagcctgtg ctgaggtaaa 1500
acagtgatgg tatataggca caaggtttga accaagatca gctgctggcg ataattgcca 1560
tttgatttga aaagtgagag atctatgctg ttgtaatggg aagatctttt attagagaag 1620
cgccgtggaa ttgaaaaact tatgccgagg taaaaatcag tggtatgtag gcaaaaagct 1680
tcaattccta atatttaatt ttatgtaagc tctaattggt aatttagttt ggtcattgga 1740
tgcttttgat ttttacggag gaggtggggg agtttgatgc attggtaaac tcccttcccc 1800
ctcctcccct tttcgaatgt agaagcattg tattgccaac tgcctgtgct gaggtaaaaa 1860
cgttggtatg aaagcacaag gcataaagtg atgatattgt ctctgccttc taggtgttta 1920
gtgataactg ctgtcgatca ttttataggt gctcagtaac aggctgagat tgaccattgc 1980
ggcaggagta actgtacatt aaaagttatt tagtccctat gtagtggaca attatatgtg 2040
gaacattttg aagctaagta attgcaatat tgattgatga tggcaaataa ataaataaac 2100
aattaaaaaa agaaatcaaa taaataaata atgaaaataa tttacttcac acaagtttat 2160
tataaataaa gatatatttg gtgacatcta tagaaataca tttataatac aataataata 2220
caataattta caatccttat gttttcattc agggtgaccc cattacttct agtttggggg 2280
gtgtaagatt ggcagcagtt tcagtttccc cataaaagtc aatgggtgaa atttggctgt 2340
tgttgacttt aagtcattca acaaatgttg ctgtgtaatt cggggtgacc ccatgattat 2400
gttattcaag tttggggggt gtagcttcaa agctgtaaga gtggcagcag tttgaaaatc 2460
ttccctgtca aagtcaatgg gaaaattggg gggttcagag gggcgccaca aaaagacggg 2520
ggcgggatcg cttagaaaag cacaagcaac ctggtccgct atagggtgag gaagtgtgtg 2580
gagtttgggt gttgtatccc taaaactgta ggaggagtag cgtttagaaa atggggggcg 2640
ctaagaataa gaagaaaaag cgaaagaatc agctgatgtc gaagaacaac ccaacataat 2700
aataaagttc ctgctgctgc tgccgcaata tcatcaaatt tcgtctggtt tggggtctgt 2760
taaggctcct aataatgtac ttgtattgaa ggcttgcatt tcattataat taattgaatt 2820
atttaatgga ggtgcaagcc aaaaaagcat aatggttctg aggctcattc aatacaatag 2880
cagaatagtc aaaattgtca cttacgtgtc aaactagagg cctgtgcgta aaaattcaca 2940
cgtgcacgtc aaaatatatg cttgcgcgac caaatgtaca ttttcgcgac aaaatataac 3000
cttgcgcgac caaatgtaca atttcgcgac caaatatacg cttgcgcgac caaatgtaca 3060
cctacacgac taaatatacg cttgcgcgaa caaatgtacg tttcgcgacg aaatattcgt 3120
gcgcgcgaca agcccggagc gcgacgaatt cgtcgctcgc acggtaattt gcgcgcatgc 3180
gcgttaccgg cgcgcgcata cgtacgcggc gcgcgcgtca atagggtgtg tccctagtat 3240
aaatacctgg tgccctgccc tgtgaccagt aggactggaa aactttgcaa ggcgtggaca 3300
tggctggacc tgggaacatg aatgaggcgc agctgcggta ctttatatcc ttcctgcacc 3360
gggagggata tgacaatatc ccagcaggga ctcccgggat ccaatccctc cgcaggggga 3420
ttatcaggag actgcggcgg cgcctcagac gggatcacca ggtcaatctt agtgtccgcg 3480
tcttgcagcg tttgtggagt gacgtcaaaa gacgtcacac agagcttgtg gaagagctga 3540
ggggagaagt ggaaggtaga ttttattaaa aattaatata aagatttttc ttctaaatta 3600
ccactcactt gtttcctatt taatttgcta tttttgagca aaaatgtgtt tgtgaaaata 3660
ctttaacatt aggattggaa caatagccat aattgcagat tatttaaata gagattatct 3720
cttaatggtg tttcccatcc cataactgcc atacttatag aggccctgcc ccatacctgc 3780
catgcttata gataccctgc cccatacctt ctgtaaggtt tggacccaca catacacaga 3840
ggcttttgct ataggcttta ttttacaaac tgttaggctg ccagctctgc tcacatggct 3900
atgacaccat aatggctcac atgactgtca taccatagtg actatgatac tatctggttt 3960
gctggaaagg gcgccctcta atgtcagcag tgttgcatag cactaaacat taacaaaaca 4020
taacaaacat cttataacag ggttgctgtt gaacactaca cctgccatgc ttatagatgc 4080
cctgccccat acctgccatg cttatagatg ccctgcccca tacctgccat gcttatagat 4140
gccctgcccc atacctgcca tgcttataga tgccctgccc catacctgcc atgcttatag 4200
atgccctgcc ccatacctgc catgcttata gatgccctgc cccatacctg ccatgcttat 4260
agatgccctg ccccatacct gccatgctta tagatgccct gccccatacc tgccatgctt 4320
atagatgccc tgccccatac ctgccatgct tatagatgtc cccgccccat acctgccatg 4380
cttatagata atggttttcc tgtagttaca tgacacatct cagcctgtat catttgttcg 4440
gtacaaaagc aagtgctgta tttctcaaac tgaaattctt tcattgccag acgaatggct 4500
acaggtggat cagggtgcaa atggggcaga ggcagaggca gaggcaccac cggctcctgc 4560
acaggatccc cagcttgccg atgatgaggc agaggcagca cccccagcag caccaccagc 4620
agcgccagaa gcacccccag gagcacgtga tgctgcctcc caaacagggg ggacaaattt 4680
atttttggac ctcctacaag aggtccgcca ggaggtggcc cttatgaggg aggacatggg 4740
ccttatgagg caagacatgg cccttatggg gcaggatgtg gcccttatgc ggcaggactt 4800
aagggacatt caggaggcta tcctgtctgg ttctcctcct cctcctcctc ctcctcctcc 4860
tcctcctcct cctcctgctt ttgtgtaagt gtttatgtgc agtgcaccgt tgtgcacttt 4920
tgttccatta aaatattcat ggttttcaat cttcaacatt tgaattttat ttcatttaac 4980
tactgatcag atgatacttg aagttgtgta acattacata gtattttagt agattcatta 5040
catttacaca aaaatataca gtatattcat gttaatgtgg gatacaaagc acccagatgg 5100
tatctgttca tatttattat tagttgtggc tgtgtttgta agctagtagt aacatataaa 5160
atatagattg tacttttagg tactttttta gtgcagtagt agataccatt aactgtcaac 5220
cagaagtaat gtaaaaaatc acagacatgt ttttaagaaa ctggcaaaat gggagccttt 5280
tttcacttgg gagaaaacac ttgtagcata gcggatagga ggttctctaa caatgtaggg 5340
catgtgtgta gcaggcagta tactcagcca aactgcatgg gaattggtct tcccattgac 5400
tgcaatgcaa ttcagcgaat tttgcaacct gtttgggaat tttgccacaa agcaaaacat 5460
ggcagattaa cttaaagggt ggttcacatt taagttaatt attagcatgt agtagaatgg 5520
ccaattataa gcatagtaac atagtaagat aggttgaaaa aagacatacg tccatcacgt 5580
tcaaccttaa tacctatata taacctgcct aactggttaa ttaagagtaa ggcaaaaaac 5640
cccatctgaa gcctctctaa tttgccgcag aggggaaaca attccttcct gactccaaga 5700
tggcaatcgg accagtccct ggatcaactt gtactgagag ctatctccca taaccctgta 5760
ttccctcact tgtactgaga gctatctccc ctacccctgt attccctcac ttgtactgag 5820
agctatctcc catacccctg tattccctca cttgtactga gagctatctc ccctacccct 5880
gtattccctc acttgtactg agagctatct cccataaccc tgtagtgata ctaagcaact 5940
ttacaattgg tcttcattat ttatttgttc acagtttttg aattgtttgc catcttcttt 6000
taactgccat tccaactcta tgttagcaag cccatggttg ctaaggtaat ttggaaacta 6060
gcaaccagat aacaggaacc gcatgcgtta atttgcacat agaaataata ctaacgcatg 6120
attcacactt agacgcgcta aatatcgcat taggctatgc gaaaattaac ccctacttgg 6180
ggcaggcggt aattatagaa aagtgcagta aatgagcttt tggcaacaca atatggactt 6240
tgcagtggga tttattcaag tctgtgttgg ccccagagtg atgcagccgc cagtttgcag 6300
ggaaatgggc attttcagaa cagtagtttt ccgaaagtaa tgccgtgtat ggctaatatg 6360
gcgtgcgttt ttttgcacac ggcgactatt tgtgcgcgat gcgttgatgt gatgcgtcca 6420
atatagcacg aaaatattct tcgcgactta aataacacac acagcatcgc gataaaattt 6480
ttaacgcatg ctagaaatag cgctcgtttt aacgcactta agtgaatcgg ccctcataaa 6540
taaaaaaaat gaagaccaat tgcaaattgt ctcagaatat ctctctctac atcagctcgg 6600
gggcaacatg ctgctcacca accccttgga tgttgctctc agtgaaaaag gtgcaaccca 6660
caaacaaaac cacctgtaga atttgtgcgc tcgctgcgcg gcgaagtagc tatgtcacac 6720
ggtgaaattt tcgccgcgcg tacagttatt ttcgcgcgat ggaaaattcc gccgcgcgac 6780
gataatggtg gcgccaaatt tatttcgccg cgcgcgacaa aaattacgcc gcacaaaaat 6840
tacgctgcgc gacacattag tttcgctaat ttttcgccgt ttcgctaatt ttttcgccgt 6900
ttcgcgaata attcggcgaa acgggacaaa ttcgctcatc actg 6944
<210> 190
<211> 244
<212> DNA
<213> Drosophila yakuba
<400> 190
caataatgta gttattaagt tttgattgaa acgtgcaaaa ttgagtttat gtgagtttat 60
ttagtttttt tattctaagt ctttgaatat atatgctaaa tttgtttttt ctcataaaat 120
aagttataaa ttaattaaga ttaataatat aaaaaaaatt attgaatttg cataagcggt 180
tgtgttttta ttgatggcca aagtgagagt tgtgaacatg cactcagttt tgctcgccac 240
tgta 244
<210> 191
<211> 8
<212> DNA
<213> Anopheles gambiae
<400> 191
gtatggac 8
<210> 192
<211> 8
<212> DNA
<213> Anopheles gambiae
<400> 192
atgtgaac 8
<210> 193
<211> 2
<212> DNA
<213> Danio rerio
<400> 193
ta 2
<210> 194
<211> 8
<212> DNA
<213> Danio rerio
<400> 194
gtctatac 8
<210> 195
<211> 6
<212> DNA
<213> Petromyzon marinus
<400> 195
ttagag 6
<210> 196
<211> 8
<212> DNA
<213> Xenopus tropicalis
<400> 196
ctgtatag 8
<210> 197
<211> 8
<212> DNA
<213> Myotis lucifugus
<400> 197
gtctagag 8
<210> 198
<211> 2
<212> DNA
<213> Xenopus tropicalis
<400> 198
at 2
<210> 199
<211> 8
<212> DNA
<213> Petromyzon marinus
<400> 199
ctctagac 8
<210> 200
<211> 8
<212> DNA
<213> Petromyzon marinus
<400> 200
gtctagac 8
<210> 201
<211> 8
<212> DNA
<213> Xenopus tropicalis
<400> 201
atcatcat 8
<210> 202
<211> 4
<212> DNA
<213> Xenopus tropicalis
<400> 202
ttaa 4
<210> 203
<211> 8
<212> DNA
<213> Petromyzon marinus
<400> 203
ctctagag 8
<210> 204
<211> 8
<212> DNA
<213> Alligator mississippiensis
<400> 204
tttataat 8
<210> 205
<211> 8
<212> DNA
<213> Alligator mississippiensis
<400> 205
ctatatag 8
<210> 206
<211> 8
<212> DNA
<213> Xenopus tropicalis
<400> 206
attaatag 8
【配列表】
【手続補正書】
【提出日】2024-07-05
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
操作された転移因子であって、5’から3’への順に、
5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、
前記5’TRはSEQ ID NO: 11の核酸配列と少なくとも約90%の配列同一性を有する核酸配列を含み、
前記3’TRはSEQ ID NO: 37の核酸配列と少なくとも約90%の配列同一性を有する核酸配列を含む、
転移因子。
【請求項2】
左トランスポゾンフラグメント(LTF)及び右トランスポゾンフラグメント(RTF)をさらに含み、
前記5’TRはSEQ ID NO: 11の核酸配列を含み、前記3’TRはSEQ ID NO: 37の核酸配列を含み、
前記LTFはSEQ ID NO: 125の核酸配列を含み、前記RTFはSEQ ID NO: 151の核酸配列を含む、
請求項1に記載の転移因子。
【請求項3】
前記転移因子の転移活性はpiggyBac(PB)トランスポゾン、Sleeping Beauty(SB)トランスポゾン及び/又はTcBuster(TB)トランスポゾンの転移活性よりも高い、請求項1~2のいずれか1項に記載の転移因子であって、
特に、前記細胞は動物細胞、植物細胞、藻類細胞、真菌細胞、酵母細胞又は細菌細胞であり、
より具体的には、前記細胞は哺乳類細胞であり、より具体的には、前記哺乳類細胞は免疫細胞、肝臓細胞、腫瘍細胞、幹細胞、受精卵、筋細胞及び皮膚細胞からなる群から選択され、
さらにより具体的には、前記細胞はヒト細胞である、転移因子。
【請求項4】
ヒト胚腎293T(293T)細胞での前記転移因子の転移活性がHeLa細胞での転移活性よりも高い、請求項1~3のいずれか1項に記載の転移因子であって、
特に、前記転移因子がベクターに存在し、より具体的には、前記ベクターはプラスミドベクター又はウイルスベクターである、転移因子。
【請求項5】
1)請求項1~4のいずれか1項に記載の操作された転移因子と、2)トランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システム。
【請求項6】
前記トランスポザーゼはSEQ ID NO: 53~78及び103~114からなる群から選択されるアミノ酸配列又はその変異体を含む、請求項5に記載の遺伝子導入システム。
【請求項7】
1)操作された転移因子と、2)トランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含み、前記転移因子は、5’から3’へ、
5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、
前記転移因子は異種核酸の細胞DNAへの挿入を可能とする転移活性を示し、
前記トランスポザーゼはSEQ ID NO: 53~78及び103~114からなる群から選択されるアミノ酸配列又はその変異体を含む、遺伝子導入システム。
【請求項8】
前記5’TRはSEQ ID NO:11の核酸配列を含み、前記3’TRはSEQ ID NO:37の核酸配列を含み、SEQ ID NO: 125の核酸配列を含むLTFと、SEQ ID NO: 151の核酸配列を含むRTFとを含み、前記トランスポザーゼはSEQ ID NO: 63のアミノ酸配列を含む、請求項7に記載の遺伝子導入システム。
【請求項9】
前記遺伝子導入システムは前記トランスポザーゼをコードする核酸を含み、特に、前記転移因子及び前記トランスポザーゼをコードする核酸は異なるベクター又は同一ベクターにある、請求項6~8のいずれか1項に記載の遺伝子導入システム。
【請求項10】
標的核酸に異種核酸を挿入する方法であって、
前記標的核酸と、請求項1~4のいずれか1項に記載の転移因子又は請求項5~9のいずれか1項に記載の遺伝子導入システムとを接触させることで、前記異種核酸を前記標的核酸に挿入することを含む方法。
【請求項11】
前記方法はインビトロで行われるか、又は前記標的核酸は細胞内にあり、より具体的には、前記標的核酸はゲノムDNAである、請求項10に記載の方法。
【請求項12】
前記細胞は動物細胞、植物細胞、藻類細胞、真菌細胞、酵母細胞又は細菌細胞であり、特に、前記細胞は哺乳類細胞であり、より具体的には、前記哺乳類細胞は免疫細胞、肝臓細胞、腫瘍細胞、幹細胞、受精卵、筋細胞及び皮膚細胞からなる群から選択される、請求項10又は11に記載の方法。
【請求項13】
前記異種核酸の挿入により前記細胞の遺伝子を不活化させる請求項12に記載の方法であって、
特に、前記異種核酸はタンパク質をコードし、より具体的には、前記タンパク質は、レポータータンパク質、操作された受容体、サイトカイン、抗生物質耐性タンパク質、抗原及び治療的タンパク質からなる群から選択される;又は
前記異種核酸はRNAをコードし、特に、前記RNAは、治療的RNA、低分子干渉RNA(siRNA)、マイクロRNA、ショートヘアピンRNA(shRNA)、ロングノンコードRNA(lincRNA)及びガイドRNA(gRNA)からなる群から選択される、方法。
【請求項14】
前記異種核酸の長さが約2kb~約300kbである、及び/又は前記挿入はランダムである、請求項10~13のいずれか1項に記載の方法。
【請求項15】
請求項1~4のいずれか1項に記載の操作された転移因子、又は請求項5~9のいずれか1項に記載の遺伝子導入システム、及び異種核酸を標的核酸に挿入するプロトコールを含むキット。