IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

2023-520083活性DNAトランスポゾンシステム及びその使用方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-05-15
(54)【発明の名称】活性DNAトランスポゾンシステム及びその使用方法
(51)【国際特許分類】
   C12N 15/09 20060101AFI20230508BHJP
   C12N 15/64 20060101ALI20230508BHJP
   C12N 15/86 20060101ALI20230508BHJP
   C12N 1/15 20060101ALI20230508BHJP
   C12N 1/19 20060101ALI20230508BHJP
   C12N 1/21 20060101ALI20230508BHJP
   C12N 5/10 20060101ALI20230508BHJP
   C12N 1/13 20060101ALI20230508BHJP
   C12N 15/54 20060101ALN20230508BHJP
   C12N 9/12 20060101ALN20230508BHJP
   C12N 5/078 20100101ALN20230508BHJP
   C12N 5/077 20100101ALN20230508BHJP
   C12N 5/09 20100101ALN20230508BHJP
   C12N 15/12 20060101ALN20230508BHJP
   C12N 15/113 20100101ALN20230508BHJP
【FI】
C12N15/09 Z ZNA
C12N15/64 Z
C12N15/86 Z
C12N1/15
C12N1/19
C12N1/21
C12N5/10
C12N1/13
C12N15/09 100
C12N15/54
C12N9/12
C12N5/078
C12N5/077
C12N5/09
C12N15/12
C12N15/113 Z
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2022560171
(86)(22)【出願日】2021-03-30
(85)【翻訳文提出日】2022-11-30
(86)【国際出願番号】 CN2021084084
(87)【国際公開番号】W WO2021197342
(87)【国際公開日】2021-10-07
(31)【優先権主張番号】PCT/CN2020/082087
(32)【優先日】2020-03-30
(33)【優先権主張国・地域又は機関】CN
(81)【指定国・地域】
(71)【出願人】
【識別番号】520176566
【氏名又は名称】中国科学院動物研究所
【氏名又は名称原語表記】INSTITUTE OF ZOOLOGY,CHINESE ACADEMY OF SCIENCES
【住所又は居所原語表記】No.5, 1 Beichen West Road, Chaoyang District, Beijing 100101, China
(74)【代理人】
【識別番号】100080791
【弁理士】
【氏名又は名称】高島 一
(74)【代理人】
【識別番号】100136629
【弁理士】
【氏名又は名称】鎌田 光宜
(74)【代理人】
【識別番号】100125070
【弁理士】
【氏名又は名称】土井 京子
(74)【代理人】
【識別番号】100121212
【弁理士】
【氏名又は名称】田村 弥栄子
(74)【代理人】
【識別番号】100174296
【弁理士】
【氏名又は名称】當麻 博文
(74)【代理人】
【識別番号】100137729
【弁理士】
【氏名又は名称】赤井 厚子
(74)【代理人】
【識別番号】100151301
【弁理士】
【氏名又は名称】戸崎 富哉
(74)【代理人】
【識別番号】100152308
【弁理士】
【氏名又は名称】中 正道
(74)【代理人】
【識別番号】100201558
【弁理士】
【氏名又は名称】亀井 恵二郎
(72)【発明者】
【氏名】王皓毅
(72)【発明者】
【氏名】張勇
(72)【発明者】
【氏名】譚生軍
(72)【発明者】
【氏名】張童童
【テーマコード(参考)】
4B050
4B065
【Fターム(参考)】
4B050CC07
4B050KK07
4B050LL01
4B065AA01X
4B065AA01Y
4B065AA57X
4B065AA57Y
4B065AA72X
4B065AA72Y
4B065AA83X
4B065AA83Y
4B065AA88X
4B065AA88Y
4B065AA90X
4B065AA90Y
4B065AB01
4B065AC14
4B065BA02
4B065CA44
(57)【要約】
本願は操作された転移因子、前記操作された転移因子を含む遺伝子導入システム、及びこれらを用いる方法とキットを提供する。開示される組成物、システム及び方法はインビトロ又は細胞内で標的核酸に異種核酸を挿入するのに有用である。
【選択図】なし
【特許請求の範囲】
【請求項1】
操作された転移因子であって、5’から3’への順に、
5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、
前記5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、
前記3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、
異種核酸の細胞DNAへの挿入を可能とする転移活性を示す操作された転移因子。
【請求項2】
前記5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を含み、及び/又は前記3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を含む請求項1に記載の転移因子。
【請求項3】
前記5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列を含み、及び/又は前記3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列を含む請求項2に記載の転移因子。
【請求項4】
前記5’TRの5’側に連結される5’標的部位反復配列(TSD)又は前記3’TRの3’側に連結される3’TSDをさらに含み、前記5’TSDはSEQ ID NO: 191~206から選択される核酸配列、その変異体又はそのフラグメントを含み、前記3’TSDはSEQ ID NO: 191~206から選択される核酸配列、その変異体又はそのフラグメントを含む請求項1~3のいずれか1項に記載の転移因子。
【請求項5】
前記5’TRはSEQ ID NO: 3、8、11、12、13、16、22、23、79及び82から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を含み、前記3’TRはSEQ ID NO: 29、34、37、38、39、42、48、49、91及び94から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列である請求項1~4のいずれか1項に記載の転移因子。
【請求項6】
(a) 前記5’TRはSEQ ID NO: 3の核酸配列を含み、前記3’TRはSEQ ID NO: 29の核酸配列を含み、
(b) 前記5’TRはSEQ ID NO: 8の核酸配列を含み、前記3’TRはSEQ ID NO: 34の核酸配列を含み、
(c) 前記5’TRはSEQ ID NO: 11の核酸配列を含み、前記3’TRはSEQ ID NO: 37の核酸配列を含み、
(d) 前記5’TRはSEQ ID NO: 12の核酸配列を含み、前記3’TRはSEQ ID NO: 38の核酸配列を含み、又は
(e) 前記5’TRはSEQ ID NO: 16の核酸配列を含み、前記3’TRはSEQ ID NO: 42の核酸配列を含む請求項5に記載の転移因子。
【請求項7】
前記異種核酸はコード配列を含む請求項1~6のいずれか1項に記載の転移因子。
【請求項8】
前記異種核酸は前記コード配列に作動可能に連結されるプロモータをさらに含む請求項7に記載の転移因子。
【請求項9】
前記転移因子の転移活性はpiggyBac(PB)トランスポゾン、Sleeping Beauty(SB)トランスポゾン及び/又はTcBuster(TB)トランスポゾンの転移活性よりも高い請求項1~8のいずれか1項に記載の転移因子。
【請求項10】
前記細胞は動物細胞、植物細胞、藻類細胞、真菌細胞、酵母細胞又は細菌細胞である請求項1~9のいずれか1項に記載の転移因子。
【請求項11】
前記細胞は哺乳類細胞である請求項1~10のいずれか1項に記載の転移因子。
【請求項12】
前記哺乳類細胞は免疫細胞、肝臓細胞、腫瘍細胞、幹細胞、受精卵、筋細胞及び皮膚細胞から選択される請求項11に記載の転移因子。
【請求項13】
前記細胞はヒト細胞である請求項11又は12に記載の転移因子。
【請求項14】
ヒト胚腎293T(293T)細胞での転移活性がHeLa細胞での転移活性よりも高い請求項1~13のいずれか1項に記載の転移因子。
【請求項15】
ベクターに存在する請求項1~14のいずれか1項に記載の転移因子。
【請求項16】
前記ベクターはプラスミドベクター又はウイルスベクターである請求項15に記載の転移因子。
【請求項17】
1)請求項1~16のいずれか1項に記載の操作された転移因子と、2)トランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システム。
【請求項18】
前記トランスポザーゼはSEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む請求項17に記載の遺伝子導入システム。
【請求項19】
1)操作された転移因子と、2)トランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含み、前記転移因子は、5’から3’へ、
5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、
前記転移因子は異種核酸の細胞DNAへの挿入を可能とする転移活性を示し、
前記トランスポザーゼはSEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む、遺伝子導入システム。
【請求項20】
前記5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、前記3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含む請求項19に記載の遺伝子導入システム。
【請求項21】
(a) 前記5’TRはSEQ ID NO: 3の核酸配列を含み、前記3’TRはSEQ ID NO: 29の核酸配列を含み、前記トランスポザーゼはSEQ ID NO: 55のアミノ酸配列を含み、
(b) 前記5’TRはSEQ ID NO: 8の核酸配列を含み、前記3’TRはSEQ ID NO: 34の核酸配列を含み、前記トランスポザーゼはSEQ ID NO: 60のアミノ酸配列を含み、
(c) 前記5’TRはSEQ ID NO: 11の核酸配列を含み、前記3’TRはSEQ ID NO: 37の核酸配列を含み、前記トランスポザーゼはSEQ ID NO: 63のアミノ酸配列を含み、
(d) 前記5’TRはSEQ ID NO: 12の核酸配列を含み、前記3’TRはSEQ ID NO: 38の核酸配列を含み、前記トランスポザーゼはSEQ ID NO: 64のアミノ酸配列を含み、又は
(e) 前記5’TRはSEQ ID NO: 16の核酸配列を含み、前記3’TRはSEQ ID NO: 42の核酸配列を含み、前記トランスポザーゼはSEQ ID NO: 68のアミノ酸配列を含む請求項20に記載の遺伝子導入システム。
【請求項22】
前記トランスポザーゼをコードする核酸を含む請求項17~21のいずれか1項に記載の遺伝子導入システム。
【請求項23】
前記転移因子及び前記トランスポザーゼをコードする核酸は異なるベクターにある請求項22に記載の遺伝子導入システム。
【請求項24】
前記転移因子及び前記トランスポザーゼをコードする核酸は同一ベクターにある請求項22に記載の遺伝子導入システム。
【請求項25】
標的核酸に異種核酸を挿入する方法であって、
前記標的核酸と、請求項1~16のいずれか1項に記載の転移因子又は請求項17~24のいずれか1項に記載の遺伝子導入システムとを接触させることで、前記異種核酸を前記標的核酸に挿入することを含む方法。
【請求項26】
インビトロで行われる請求項25に記載の方法。
【請求項27】
前記標的核酸は細胞内にある請求項25に記載の方法。
【請求項28】
前記標的核酸はゲノムDNAである請求項27に記載の方法。
【請求項29】
前記細胞は動物細胞、植物細胞、藻類細胞、真菌細胞、酵母細胞又は細菌細胞である請求項27又は28に記載の方法。
【請求項30】
前記細胞は哺乳類細胞である請求項29に記載の方法。
【請求項31】
前記哺乳類細胞は免疫細胞、肝臓細胞、腫瘍細胞、幹細胞、受精卵、筋細胞及び皮膚細胞から選択される請求項30に記載の方法。
【請求項32】
前記異種核酸の挿入により前記細胞の遺伝子を不活化させる請求項28~31のいずれか1項に記載の方法。
【請求項33】
前記異種核酸はタンパク質をコードする請求項25~32のいずれか1項に記載の方法。
【請求項34】
前記タンパク質は、レポータータンパク質、操作された受容体、サイトカイン、抗生物質耐性タンパク質、抗原及び治療的タンパク質からなる群から選択される請求項33に記載の方法。
【請求項35】
前記異種核酸はRNAをコードする請求項25~32のいずれか1項に記載の方法。
【請求項36】
前記RNAは、治療的RNA、低分子干渉RNA(siRNA)、微小RNA、ショートヘアピンRNA(shRNA)、ロングノンコードRNA(lincRNA)及びガイドRNA(gRNA)からなる群から選択される請求項35に記載の方法。
【請求項37】
前記異種核酸の長さが約2kb~約300kbである請求項25~36のいずれか1項に記載の方法。
【請求項38】
前記挿入はランダムである請求項25~37のいずれか1項に記載の方法。
【請求項39】
異種核酸を標的核酸に挿入する請求項1~16のいずれか1項に記載の操作された転移因子、又は請求項17~24のいずれか1項に記載の遺伝子導入システム及びプロトコールを含むキット。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本願は2020年3月30日に提出された国際特許出願番号PCT/CN2020 /082087の優先権を主張しており、その内容は引用により全体としてここに組み込まれる。
【0002】
ASCIIテキストファイルの配列表の提出
提出された以下のASCIIテキストファイルの内容は引用により全体としてここに組み込まれる。配列表のコンピュータ読み取り可能な形式(CRF)(ファイル名:182452000641SEQLIST.txt、記録日:2021年3月29日、サイズ:244kb)。
【0003】
技術分野
本願は一般に遺伝学の分野に関する。より具体的には、本願は転移因子及びその使用に関する。
【背景技術】
【0004】
DNAを細胞に導入する典型的な方法は、リン酸カルシウム、ポリエチレングリコールなどのDNA凝集剤、リポソーム、多層小胞などの脂質含有試薬、及びウイルス媒介性戦略を含む。しかし、そのような方法には限界がある。例えば、DNA凝集剤及びウイルス媒介性戦略に関連するサイズ制限が存在する。さらに、細胞にトランスフェクション可能な核酸の量は、ウイルス戦略において制限される。全ての方法は送達された核酸を細胞の核酸に挿入することに有利であるわけではなく、DNA凝集法や脂質含有試薬の調製は比較的容易であるが、ウイルスベクターに核酸を挿入するのは手間がかかる。ウイルス媒介性戦略は、細胞タイプ又は組織タイプに特異的なものであってもよく、ウイルス媒介性戦略を使用してインビボで使用すると、免疫学的な問題が生じる。
【0005】
これらの問題を克服するための適切なツールの1つは、転移因子を介することである。転移因子(トランスポゾン・エレメント)(TE、トランスポゾン、又はジャンピング遺伝子)は、核酸中のその位置を変化させることで、突然変異を生成又は逆転させ、ゲノム中の配列を変化させることができるDNA配列である。転移因子は多くの真核ゲノムの大部を表している。例えば、ヒトゲノムの約50%は転移因子配列に由来するが、植物などの他のゲノムは、転移因子由来のDNAの割合が高い。転移因子は通常、クラス1とクラス2の2つに分類される。クラス1の代表は、レトロトランスポゾンであり、1)内因性レトロウイルス(ERV)のような長鎖末端反復配列(LTR)レトロトランスポゾン、及び2)長鎖散在反復配列(LINE)及び短鎖散在反復配列(SINE)のような非LTRレトロトランスポゾンを含む。クラス2 TEは、1)末端反復配列(TR、末端逆向き反復配列TIRとも呼ばれる)を特徴とし、トランスポザーゼによって移動可能な「切り貼り」DNAトランスポゾン、及び2)例えば、ヘリトロン及びポリントンを含むような非「切り貼り」DNAトランスポゾンを含む。クラス2 TEは多くの真核生物に広く存在し活性を有するが、これらの全てのTEが転移活性を有するわけではない。最近の活性転移因子の例には、過去数百万年の間に移動の兆候を示したhAT及びpiggyBaスーパーファミリーのメンバーが含まれている。しかしながら、現在のところ、遺伝子発現研究や遺伝子治療に利用できる活性転移因子は限られている。
【0006】
したがって、DNAを細胞内に導入するのに適した新規な転移因子、及びこの転移因子を介して異なるサイズの異種配列を細胞の核酸に、又はDNAを細胞のゲノムに効率的に挿入するための方法及びシステムが必要である。
【発明の概要】
【発明が解決しようとする課題】
【0007】
本願は、操作された転移因子、前記操作された転移因子を含む遺伝子導入システム、及びこれらを用いた方法とキットを提供する。また、インビトロ又は細胞内で異種核酸を標的核酸に挿入する方法を提供する。本明細書の前記組成物、システム及び方法は、タグ化、ゲノム工学及び遺伝子発現の研究など、様々な用途に有用である。
【課題を解決するための手段】
【0008】
一態様では、本願は、5’から3’への順に、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、前記転移因子は異種核酸の細胞DNAへの挿入を可能とする転移活性を示す操作された転移因子を提供する。いくつかの実施形態では、前記5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を含む。いくつかの実施形態では、前記5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列を含む。いくつかの実施形態では、前記3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を含む。いくつかの更なる実施形態では、前記3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列を含む。
【0009】
上記操作された転移因子の何れかに係る実施形態では、前記転移因子は、5’TRの5’側に連結される5’標的部位反復配列(TSD)又は3’TRの3’側に連結される3’TSDをさらに含む。いくつかの実施形態では、前記5’TSDと3’TSDの核酸配列は同一の配列である。いくつかの実施形態では、前記5’TSDはSEQ ID NO: 191~206から選択される核酸配列、その変異体又はそのフラグメントを含み、前記3’TSDはSEQ ID NO: 191~206から選択される核酸配列、その変異体又はそのフラグメントを含む。
【0010】
上記操作された転移因子の何れかに係る実施形態では、前記5’TRはSEQ ID NO: 3、8、11、12、13、16、22、23、29及び82から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を含み、前記3’TRはSEQ ID NO: 29、34、37、38、39、42、48、49、91及び94から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を含む。
【0011】
上記操作された転移因子の何れかに係る実施形態では、前記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt、Tc1-1_AG、Tc1-1_PM、Tc1-4_Xt、Tc1-15_Xt、Mariner-6_AMi又はMariner-3_Crpに由来する。いくつかの実施形態では、前記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。いくつかの実施形態では、前記5’TRはSEQ ID NO: 3の核酸配列を含み、前記3’TRはSEQ ID NO: 29の核酸配列を含む。いくつかの実施形態では、前記5’TRはSEQ ID NO: 8の核酸配列を含み、前記3’TRはSEQ ID NO: 34の核酸配列を含む。いくつかの実施形態では、前記5’TRはSEQ ID NO: 11の核酸配列を含み、前記3’TRはSEQ ID NO: 37の核酸配列を含む。いくつかの実施形態では、前記5’TRはSEQ ID NO: 12の核酸配列を含み、前記3’TRはSEQ ID NO: 38の核酸配列を含む。いくつかの実施形態では、前記5’TRはSEQ ID NO: 16の核酸配列を含み、前記3’TRはSEQ ID NO: 42の核酸配列を含む。
【0012】
上記操作された転移因子の何れかに係る実施形態では、前記異種核酸はコード配列を含む。いくつかの更なる実施形態では、前記異種核酸は前記コード配列に作動可能に連結されるプロモータをさらに含む。
【0013】
上記操作された転移因子の何れかに係る実施形態では、前記転移因子の転移活性がpiggyBac(PB)トランスポゾン、Sleeping Beauty(SB)トランスポゾン及び/又はTcBusterトランスポゾンの転移活性よりも高い。
【0014】
上記操作された転移因子の何れかに係る実施形態では、前記細胞は動物細胞、植物細胞、藻類細胞、真菌細胞、酵母細胞又は細菌細胞である。いくつかの実施形態では、前記細胞は哺乳類細胞である。いくつかの実施形態では、前記哺乳類細胞は免疫細胞(例えば、T細胞)、肝臓細胞、腫瘍細胞、幹細胞、受精卵、筋細胞及び皮膚細胞から選択される。いくつかの実施形態では、前記細胞はヒト細胞である。いくつかの実施形態では、前記転移因子はヒト胚腎293T(293T)細胞での転移活性がHeLa細胞での転移活性よりも高い。
【0015】
上記操作された転移因子の何れかに係る実施形態では、前記転移因子はベクターに存在する。いくつかの更なる実施形態では、前記ベクターはプラスミドベクター又はウイルスベクターである。
【0016】
本願の別の態様は、1)上記の転移因子の何れかに係る操作された転移因子と、2)トランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システムを提供する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む。
【0017】
更なる態様では、本願は、1)操作された転移因子と、2)トランスポザーゼ又はトランスポザーゼをコードする核酸と、を含み、前記転移因子は、5’から3’への順に、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、前記転移因子は異種核酸の細胞DNAへの挿入を可能とする転移活性を示し、前記トランスポザーゼはSEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む遺伝子導入システムを提供する。いくつかの実施形態では、前記5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含む。
【0018】
上記遺伝子導入システムの何れかに係るいくつかの実施形態では、前記転移因子は、SEQ ID NO: 3、8、11、12、13、16、22、23、29及び82から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を有する5’TRを含み、前記3’TRはSEQ ID NO: 29、34、37、38、39、42、48、49、91及び94から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を含む。いくつかの実施形態では、前記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt、Tc1-1_AG、Tc1-1_PM、Tc1-4_Xt、Tc1-15_Xt、Mariner-6_AMi又はMariner-3_Crpに由来する。いくつかの実施形態では、前記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。いくつかの実施形態では、前記5’TRはSEQ ID NO: 3の核酸配列を含み、前記3’TRはSEQ ID NO: 29の核酸配列を含み、前記トランスポザーゼはSEQ ID NO: 55のアミノ酸配列を含む。いくつかの実施形態では、前記5’TRはSEQ ID NO: 8の核酸配列を含み、前記3’TRはSEQ ID NO: 34の核酸配列を含み、前記トランスポザーゼはSEQ ID NO: 60のアミノ酸配列を含む。いくつかの実施形態では、前記5’TRはSEQ ID NO: 11の核酸配列を含み、前記3’TRはSEQ ID NO: 37の核酸配列を含み、前記トランスポザーゼはSEQ ID NO: 63のアミノ酸配列を含む。いくつかの実施形態では、前記5’TRはSEQ ID NO: 12の核酸配列を含み、前記3’TRはSEQ ID NO: 38の核酸配列を含み、前記トランスポザーゼはSEQ ID NO: 64のアミノ酸配列を含む。いくつかの実施形態では、前記5’TRはSEQ ID NO: 16の核酸配列を含み、前記3’TRはSEQ ID NO: 42の核酸配列を含み、前記トランスポザーゼはSEQ ID NO: 68のアミノ酸配列を含む。
【0019】
上記遺伝子導入システムの何れかに係るいくつかの実施形態では、前記遺伝子導入システムはトランスポザーゼをコードする核酸を含む。いくつかの更なる実施形態では、前記転移因子とトランスポザーゼをコードする核酸は異なるベクターにある。いくつかの更なる特定実施形態では、前記転移因子とトランスポザーゼをコードする核酸は同一ベクターにある。
【0020】
更なる態様では、本願は、標的核酸と、上記操作された転移因子の何れかに係る転移因子又は上記遺伝子導入システムの何れかに係る遺伝子導入システムとを接触させることを含む標的核酸に異種核酸を挿入する方法を提供する。いくつかの実施形態では、該方法はインビトロで行われる。いくつかの実施形態では、前記標的核酸は細胞内にある。いくつかの実施形態では、前記標的核酸はゲノムDNAである。
【0021】
上記方法の何れかに係るいくつかの実施形態では、前記標的核酸は細胞内にあり、該細胞は動物細胞、植物細胞、藻類細胞、真菌細胞、酵母細胞又は細菌細胞である。いくつかの実施形態では、前記細胞は哺乳類細胞である。いくつかの実施形態では、前記哺乳類細胞は免疫細胞(例えば、T細胞)、肝臓細胞、腫瘍細胞、幹細胞、受精卵、筋細胞及び皮膚細胞から選択される。いくつかの実施形態では、前記異種核酸の挿入により細胞の遺伝子が不活性化する。
【0022】
上記方法の何れかに係るいくつかの実施形態では、前記異種核酸はタンパク質をコードする。いくつかの実施形態では、前記タンパク質はレポータータンパク質、操作された受容体、サイトカイン、抗生物質耐性タンパク質、抗原及び治療的タンパク質から選択される。
【0023】
上記方法の何れかに係るいくつかの実施形態では、前記異種核酸はRNAをコードする。いくつかの実施形態では、前記RNAは治療的RNA、低分子干渉RNA(siRNA)、微小RNA(マイクロRNA)、ショートヘアピンRNA(shRNA)、ロングノンコードRNA(lincRNA)及びガイドRNA(gRNA)から選択される。いくつかの実施形態では、前記異種核酸は1種以上の分子をコードする。
【0024】
上記方法の何れかに係るいくつかの実施形態では、前記異種核酸の長さが約300,000塩基(kb)以下、例えば、約10kb~約300kb、又は約100塩基対(bp)~約10kb、又は約100 bp~約5kb、又は約100 bp~約2kb、又は約2kb~約300kbである。
【0025】
上記方法の何れかに係るいくつかの実施例では、前記挿入はランダムである。
【0026】
更なる態様では、本願は、上記操作された転移因子の何れかに係る転移因子、又は上記遺伝子導入システムの何れかに係る遺伝子導入システム、及び異種核酸を標的核酸に挿入するプロトコールを含むキットを提供する。
【図面の簡単な説明】
【0027】
図1】活性転移因子(TE)の同定を説明する図を示す。
図2】同定された131個の転移因子(TE)の要約を示し、これらの転移因子(TE)は長さ300アミノ酸(aa)以上のオープンリーディングフレーム(ORF)、トランスポザーゼ(Tn)ドメイン及び25%以下の平均差を有する。円グラフは同定された131個のTEの5つのスーパーファミリーの分布を説明する。
図3】活性転移因子をスクリーニングするための例示的な二元構築体を示す。上段の構築体はトランスポザーゼが発現する補助構築体であり、5’から3’への順に、サイトメガロウイルス(CMV)プロモータ、トランスポザーゼ(Tn)遺伝子及びpolyA(pA)シグナルを含む。下段の構築体はドナー構築体であり、5’から3’への順に、ホスホグリセリン酸キナーゼ(PGK)プロモータ、5’標的部位反復(5’TSD)配列、5’末端反復(5’TR)配列、ピューロマイシン-耐性増強型GFP融合タンパク質(Puro-eGFP)をコードする配列、3’末端反復(3’TR)配列、3’標的部位反復(3’TSD)配列及びpolyA(pA)シグナルを含む。
図4図4A~4Bは、HEK293T(293T)及びHeLa細胞内で、piggyBac、Hyper piggyBac及びSB100Xを含む対照TEと比較した、5%以下の差を有する同定された転移因子の転移活性を示す。図4AはHEK293T(293T)及びHeLa細胞内で、piggyBac、Hyper piggyBac、SB100X、TcBuster(TB)を含む対照TE及び陰性対照(NC)と比較した、以下の同定された転移因子の転移活性を示す:1_hAT-2_AG、2_AgaP12、 3_P3_AG、4_HAT2_CI、5_HAT5_CI、6_hAT-6_DR、7_Chaplin1_DR、8_Harbinger-4_XT、9_HAT1_AG、10_AgaP15、11_IS4EU-1_DR、12_POGO、14_Tc1-8B_DR、15_HOBO、17_hAT -6_PM、18_MARISP1、19_hAT-7_XT、20_BARI_DM、21_Mariner-3_PM、22_hAT-3_XT、23_P1_AG、24_IS4EU-2_DR、25_Tc1-3_Xt、26_Mariner-1_PM、27_P2_AG、28_hAT-5_DR、29_Tc1-3_FR、30_Mariner-4_XT、32_Tc1-5_Xt、33_Tc1-10_Xt及び34_hAT-1_D。図4Bは、HEK293T(293T)及びHeLa細胞内で、piggyBac、Hyper piggyBac、SB100X、TcBuster(TB)を含む対照TE及び陰性対照(NC)と比較した、以下の同定された転移因子の転移活性を示す:35_Mariner2_AG、36_Tc1-1_Xt、37_Tc1-1_AG、38_Mariner-1_XT、39_Tc1DR3_Xt、40_hAT-1B_PM、41_hAT-3_PM、42_hAT-6B_PM、43_Tc1-1_PM、44_TC1_XL、45_Mariner-4_AMi、46_Myotis_hAT1 、47_hAT-7_PM、48_TC1_FR4、49_hAT-8_PM、50_piggyBac1_Mm、51_Tc1-11_Xt、52_Tc1~16_Xt、53_TC1-2_DM、54_Tc1-4_Xt、55_TC1_DM、56_Tc1-15_Xt、59_TC1_FR2、60_Mariner-6B_AMi、61_Tc1-9_Xt、63_hAT-9_XT、64_Mariner-5_XT、65_S2_DM、67_PROTOP、68_Tc1-8_Xt及び69_Tc1-12_Xt。
図5図5A~5Bは、HEK293T(293T)において5%よりも大きい差を有する同定された転移因子の転移活性を示す。図5AはHEK293T(293T)における以下の同定された転移因子の転移活性を示す:70_Mariner-6_AMi、71_hAT-3_Gav、72_piggyBac2_Mm、73_Mariner-2_XT、74_hAT-4_Crp、75_OposCharlie2、76_hAT-1_AMi、77_Mariner-2_AMi、78_hAT-13_AMi、80_hAT-12_AMi、81_Mariner-7_Croc、82_piggyBac-2_XT、83_Mariner-3_AMi、84_piggyBac1_CI、86_piggyBac-1_AMi、87_Mariner-5_AMi、89_Mariner-6_Crp、90_Mariner-3_Crp、91_hAT-3_AMi、92_TC1_FR1、93_hAT-5_Croc、94_hAT-8_AMi、95_PARIS、96_Mariner-2_PM、97_piggyBac-1_XT、98_Tigger1、99_Mariner-1_Crp、101_S_DM、102_hAT-12_Crp、103_hAT-1_PM、104_Senkusha1、105_Tc1-2_PM、106_Harbinger-2_AMi、108_hAT-2_Gav及び110_Tigger2T。図5BはHEK293T(293T)における以下の同定された転移因子の転移活性を示す:111_TC1-4_DR、116_TIGGER17、117_TIGGE3、118_HAT-14_CRP、119_MARINER-9_CRP、124_HAT-111_AMI、126_MARINER-1_AMI、126_MARINER-10_CRP、139_hAT-17_Croc、140_hAT-4_AMi、142_Tigger4、144_Tigger7、156_Tigger2、180_hAT-19_Crp、183_hAT-17B_Croc、188_Tc1-13_Xt、197_hAT-19B_Croc、199_MarsTigger8、212_Tigger5、222_hAT-10_XT、237_hAT-6_AMi、245_MarsTigger1c、246_Tigger17c、258_Harbinger-1_AMi、260_Tc1-14_Xt、271_Kanga1、275_Arthur1、295_Harbinger-1_Crp、314_Zaphod3、320_Joey1、331_Zaphod、342_Harbinger-3_AMi、348_Harbinger-1B_Crp、349_MARWOLEN1及び351_Zaphod2。
図6図6A~6Bは対照TE piggyBac、hyperpiggyBac及びSB100Xと比較した、各種の同定されたTEの転移(即ち導入)効率を示す。図6AはHEK293T(293T)細胞内で、対照TE piggyBac、hyperpiggyBac及びSB100Xと比較した、各種の同定されたTEの転移(導入)効率を示す。図6BはHeLa細胞内で、対照TE piggyBac、hyperpiggyBac及びSB100Xと比較した、各種の同定されたTEの転移(導入)効率を示す。
図7図7A~7Cは、異なるスーパーファミリーに属する同定されたトランスポザーゼとその対照TEとの間の系統発生関係を説明する系統樹を示す。図7Aは以下の14個の同定されたhATスーパーファミリートランスポザーゼと対照TE TcBusterとの間の系統発生関係を説明する系統樹を示す:103_hAT-1_PM、17_hAT-6_PM、46_Myotis_hAT1、28_hAT-5_DR、22_hAT-3_XT、41_hAT-3_PM、47_hAT-7_PM、180_hAT-19_Crp、1_hAT-2_AG、9_HAT1_AG、139_hAT-17_Croc、183_hAT-17B_Croc、63_hAT-9_XT、222_hAT-10_XT。図7Bは、2個の同定されたpiggyBacスーパーファミリートランスポザーゼ82_piggyBac-2_XT、86_piggyBac-1_AMiと対照TE TcBusterとの間の系統発生関係を説明する系統樹を示す。図7Cは、22個の同定されたTcMarinerスーパーファミリートランスポザーゼと対照TE SB100Xとの間の系統発生関係を説明する系統樹を示す。
図8図8A~8BはHEK293T(293T)細胞及びHeLa細胞内で、piggyBac、hyperpiggyBac及びSB100Xを含む対照TE及び陰性対照(NC)と比較した、同定された転移因子及び131個の候補のうち活性の最も高い5個のTEの転移活性を示す。図8Aは293T細胞内で、piggyBac、hyperpiggyBac及びSB100Xを含む対照TE及び陰性対照(NC)と比較した、各種の同定されたTEの転移(導入)効率を示す。図8BはHeLa細胞内で、piggyBac、hyperpiggyBac及びSB100Xを含む対照TE及び陰性対照(NC)と比較した、各種の同定されたTEの転移(導入)効率を示す。
図9図9A~9BはHct116及びK562細胞内で、piggyBac、hyperpiggyBac及びSB100Xを含む対照TE及び陰性対照(NC)と比較した、同定された転移因子及び131個の候補のうち活性の最も高い5個のTEの転移活性を示す。図9AはHct116細胞内で、piggyBac、hyperpiggyBac及びSB100Xを含む対照TE及び陰性対照(NC)と比較した、各種の同定されたTEの転移(導入)効率を示す。図9BはK562細胞内で、piggyBac、hyperpiggyBac及びSB100Xを含む対照TE及び陰性対照(NC)と比較した、各種の同定されたTEの転移(導入)効率を示す。
図10図10A~10Bは初代T細胞内で、対照TE SB100Xと比較した、同定された転移因子14-Tc1-8B_DR、29-Tc1-3_FR、35-Mariner2_AG、36-Tc1-1_Xt、37-Tc1-1_AG、43-Tc1-1_PM、52-Tc1~16_Xt、54-Tc1-4_Xt及び56-Tc1-15_Xtの転移活性を示す。図10AはEF1αプロモータとCopGFP遺伝子を含有するプラスミドでトランスフェクションされた初代T細胞の転移測定結果を示し、ここで、GFP陽性T細胞の存在は細胞内の転移の成功を表す。図10BはEF1αプロモータと019CAR-P2A-eGFP遺伝子を含有するプラスミドでトランスフェクションされた初代T細胞の転移測定結果を示し、ここで、GFP陽性T細胞の存在は細胞内の転移の成功を表す。
図11図11A~11Bは293T細胞及びHeLa細胞内で、対照TE piggyBac及び陰性対照(NC)と比較した、ヘルパープラスミド及び転移因子プラスミドに基づく各割合を示し、同定された転移因子SB100X及び131個の候補のうち活性の最も高い5個のTEの転移活性を示す。図11Aは293T細胞内で、対照TE SB100X及び陰性対照(NC)と比較した、各種の同定されたTEの転移(導入)効率を示す。図11BはHeLa細胞内で、対照TE SB100X及び陰性対照(NC)と比較した、各種の同定されたTEの転移(導入)効率を示す。
図12図12は293T細胞内で、対照TE piggyBac、piggyBac、hyperpiggy Bac、SB100Xと比較した、同定された転移因子SB100X及び131個の候補のうち活性の最も高い5個のTEの負荷能力を示す。図12は対照TE piggyBac、piggyBac、hyperpiggyBac、SB100Xと比較した、各種の同定されたTEの転移(導入)効率を示す。
図13】TE原始種及び安定転移K562細胞株由来のゲノムの標的部位の周囲の40 bpウィンドウにおけるゲノム挿入遺伝子座の共通配列を示す。
図14図14A~14Bは、piggyBac、hyperpiggyBac、SB100X及び131個の候補のうち活性の最も高い5個のTEを含む、距離の最も近い遺伝子の同定された転移因子の挿入頻度を示し、図14Aは0bp~1Mbウィンドウ内の挿入頻度、図14Bは50kbウィンドウ内のランダム挿入に対する濃縮倍数を示す。
図15図15は遺伝子体の5’末端から3’末端への相対位置において、piggyBac、hyperpiggy Bac、SB100X及び131個の候補のうち活性の最も高い5個のTEを含む、同定された転移因子のランダム挿入に対する濃縮倍数を示す。
図16図16は様々な発現レベルの遺伝子において、piggyBac、hyperpiggyBac、SB100X及び131個の候補のうち活性の最も高い5個のTEを含む、同定された転移因子のランダム挿入に対する濃縮倍数を示し、レベル7は最高発現、レベル0は最低発現を表す。
図17図17は5kbウィンドウ内の転写開始部位(TSS)の周囲において、piggyBac、hyperpiggy Bac、SB100X及び131個の候補のうち活性の最も高い5個のTEを含む、同定された転移因子のランダム挿入に対する濃縮倍数を示す。
図18図18は様々なクロマチン状態において、piggyBac、hyperpiggyBac、SB100X及び131個の候補のうち活性の最も高い5個のTEを含む、同定された転移因子のランダム挿入に対する濃縮倍数を示す。
【発明を実施するための形態】
【0028】
本願は、操作された転移因子、操作された転移因子を含む遺伝子導入システム、及びそれらを用いた方法とキットを提供する。本願は、少なくとも部分的に、汎ゲノムバイオインフォマティクスにより解析された広範な種からの新規転移因子の同定(例えば、表2)、及び同定された多くの転移因子がヒト細胞内で効率的に転移することができるという驚くべき結果に基づいている。開示された組成物、システム及び方法は、異種DNAを細胞のゲノムに導入することを含む、標的核酸に異種核酸を挿入するのに有用である。本明細書の上記転移因子及び遺伝子導入システムは、遺伝子治療や遺伝子発見研究など、さまざまな用途に有用である。
【0029】
したがって、一態様では、本願は、5’から3’への順に、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、上記転移因子は異種核酸の細胞DNAへの挿入を可能とする転移活性を示す操作された転移因子を提供する。
【0030】
別の態様では、本願は、1)操作された転移因子と、2)トランスポザーゼ又はトランスポザーゼをコードする核酸と、を含み、上記転移因子は、5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、上記転移因子は異種核酸の細胞DNAへの挿入を可能とする転移活性を示す遺伝子導入システムを提供する。いくつかの実施形態では、上記転移因子は操作された転移因子である。いくつかの実施形態では、上記トランスポザーゼはSEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む。
【0031】
I.定義
本明細書で使用される場合、「トランスポゾン」、「転移因子」、又は「TE」という用語は、第1核酸(すなわち、ベクターのようなドナー核酸)から切断され、標的部位(例えば、細胞内の第2核酸、ゲノム又は染色体外DNA)に組み込まれ得るポリヌクレオチドを意味する。少なくとも1つのシス作用核酸配列が核酸配列の5’に位置し、かつ少なくとも1つのシス作用核酸配列が核酸配列の3’に位置する場合、トランスポゾンは、転移因子の末端のシス作用核酸配列側に連結される核酸配列を含む。シス作用核酸配列は、トランスポザーゼが結合する転移因子の各末端に、少なくとも1つの末端反復配列(TR、逆末端反復配列(ITR)又は末端逆反復配列(TIR)とも呼ばれる)を含む。本明細書の上記転移因子は、トランスポザーゼをコードするオープンリーディングフレーム(ORF)を含んでも含まなくてもよい。
【0032】
本明細書で使用される場合、「転移」という用語は、転移因子が第1核酸(例えば、ベクター)の位置から変更して標的部位(例えば、細胞内の第2核酸、又はゲノム又は染色体外DNA)に組み込まれることを意味する。
【0033】
本明細書で使用される場合、「末端反復」又は「TR」という用語は、転移因子の両端に位置し、転移因子の第2核酸配列側に連結される核酸配列を意味する。第2核酸配列の5’(上流)に位置するTRを5’TRと呼び、第2核酸配列の3’(下流)に位置するTRを3’TRと呼ぶ。クラス2の転移因子では、TRは互いに相補的である。
【0034】
本明細書で使用される場合、「標的部位反復」又は「TSD」という用語は、転移因子の挿入部位に出現する核酸配列を意味する。TSDは、標的DNA二本鎖体のトランスポザーゼによる互い違いの切断に起因する粘性末端のDNA修復により発現する可能性がある。TSDは、転移因子内のTR側に連結されている。5’TRの5’に位置するTSDは5’TSDである。3’TRの3’に位置するTSDは3’TSDである。
【0035】
本明細書で使用される場合、「トランスポザーゼ」という用語は、トランスポゾンが第1核酸(例えば、ベクター)から切断され、標的部位(例えば、細胞内の第2核酸、又はゲノム又は染色体外DNA)に組み込まれることを触媒するポリペプチドを意味する。いくつかの実施形態では、トランスポザーゼは、1つ又は2つの末端反復配列に結合する。
【0036】
本明細書で使用される場合、「左トランスポゾンフラグメント」又は「LTF」は、天然に存在する転移因子における5’TSDからトランスポザーゼORF配列の開始コドンまでのフラグメントを意味する。本明細書で使用される場合、「右トランスポゾンフラグメント」又は「RTF」とは、天然に存在する転移因子におけるトランスポザーゼORF配列の終止コドンから3’TSDまでのフラグメントを意味する。
【0037】
「核酸」、「ポリヌクレオチド」及び「核酸配列」という用語は、デオキシリボヌクレオチド、リボヌクレオチド、それらの組み合わせ及びそれらの類似体を含む、任意の長さのヌクレオチドの重合形態を指し、交換して使用することができる。「オリゴヌクレオチド」及び「オリゴ(oligo)」は、交換して使用することができ、約50個以下のヌクレオチドを有する短いポリヌクレオチドを指す。
【0038】
本明細書で使用される場合、「異種核酸」とは、参照核酸配列とは異なる由来のDNA又はRNA配列を意味する。例えば、転移因子の場合、上記異種核酸は、末端反復配列とは異なるソースに由来する。例えば、末端反復配列とは異なる生体から単離された核酸配列は、上記末端反復配列に対する異種核酸であると考えられる。
【0039】
本明細書で使用される場合、「動作可能に連結される」という用語は、他の核酸配列と機能的な関係にある核酸配列を意味する。例えば、コード配列がプロモータ配列に動作可能に連結されている場合、通常、プロモータがコード配列の転写を促進できることを意味する。動作可能に連結されるとは、連結対象のDNA配列が通常連続しており、2つのタンパク質コード領域を連結しなければならない場合、連続しており、リーディングフレーム内にあることを意味する。エンハンサーは、プロモータから数千塩基離れた位置で機能し、イントロン配列が可変長であるので、いくつかの核酸配列は動作可能に連結されているが、不連続であることがある。
【0040】
核酸配列についての「配列同一性の百分率(%)」とは、配列をアライメントした後に特定の核酸配列のヌクレオチドと同一の候補配列のヌクレオチドの百分率として定義され、必要に応じて、配列同一性の百分率が最大となるようにキャップを設けてもよい。ペプチド、ポリペプチド又はタンパク質の配列についての「配列相同性の百分率(%)」は、配列をアライメントした後、特定のペプチド又はアミノ酸配列中のアミノ酸残基と同じ置換を有する候補配列中のアミノ酸残基の百分率であり、必要に応じて、配列相同性の百分率が最大となるようにキャップを設けてもよい。アミノ酸配列の同一性百分率を決定するためのアライメントは、例えばBLAST、BLAST-2、ALIGN又はMEGALIGNTM(DNASTAR)ソフトウェアなどの一般的に利用可能なコンピュータソフトウェアのような、当該分野の技術範囲内の様々な方法で実施することができる。当業者は、比較される配列の全長にわたって最大のアライメントを達成するために必要な任意のアルゴリズムを含む、測定アライメントをするための適切なパラメータを決定することができる。
【0041】
本明細書で使用される場合、「ベクター」という用語は、それに連結された別の核酸分子を輸送することができる核酸分子を意味する。ベクターの例としては、細菌、プラスミド、ファージ、コスミド、エピソーム(episomes)、ウイルス、及び挿入可能なDNAフラグメント、すなわち相同組換えによって宿主細胞ゲノムに挿入可能なフラグメントが含まれるが、これらに限定されない。
【0042】
本明細書で使用される場合、「プラスミド」という用語は、外来DNAフラグメントを受け入れることができ、原核細胞又は真核細胞で複製することができる環状二本鎖DNAを意味する。
【0043】
「ポリペプチド」及び「ペプチド」という用語は、交換して使用することができ、任意の長さのアミノ酸ポリマーを指す。したがって、例えば、ペプチド、オリゴペプチド、タンパク質、抗体、及び酵素という用語は、ポリペプチドの定義に含まれる。ポリマーは、直鎖又は分岐鎖であってもよく、修飾アミノ酸を含んでいてもよく、非アミノ酸によって切断されていてもよい。タンパク質は、1つ又は複数のポリペプチドを有していてもよい。この用語には、修飾アミノ酸ポリマーも含まれる。例えば、ジスルフィド結合形成、グリコシル化、脂質化、アセチル化、リン酸化、又は標識成分との結合のような他の任意の操作が可能である。
【0044】
本明細書で使用される場合、「変異体」は、参照ポリヌクレオチド又はポリペプチドとは異なるが、基本的な特性を保持するポリヌクレオチド又はポリペプチドと解釈される。ポリヌクレオチドの典型的な変異体は、他の参照ポリヌクレオチドの核酸配列とは異なる。変異体の核酸配列変化は、参照ポリヌクレオチドによってコードされるポリペプチドのアミノ酸配列を変化させてもよいし、変化させなくてもよい。以下で説明するように、ヌクレオチドの変化は、参照配列によってコードされるポリペプチド中のアミノ酸の置換、付加、欠失、融合、及び切断をもたらすことができる。ポリペプチドの典型的な変異体は、他の参照ポリペプチドのアミノ酸配列とは異なる。通常、相違は限定されており、したがって、参照ポリペプチド及び変異体の配列は、全体的に非常に類似しており、多くの領域において同一である。変異体及び参照ポリペプチドのアミノ酸配列は、1つ又は複数の置換、付加、欠失の任意の組み合わせの形態によって異なってもよい。置換又は挿入されたアミノ酸残基は、遺伝暗号によりコードされたアミノ酸残基であってもよいし、そうでなくてもよい。ポリヌクレオチド又はポリペプチドの変異体は、アリル変異体のように天然に存在していてもよく、又は天然に存在しない変異体であってもよい。ポリヌクレオチド及びポリペプチドの天然に存在しない変異体は、突然変異誘発技術、直接合成、及び当業者に知られている他の組換え方法によって調製することができる。
【0045】
本明細書で使用される場合、配列の「フラグメント」は、配列の一部を意味する。例えば、核酸配列のフラグメントは核酸配列の一部を意味し、アミノ酸配列のフラグメントはアミノ酸配列の一部を意味する。
【0046】
本明細書で使用される場合、「遺伝子回路」、「生体回路」、又は「合成回路」という用語は、論理機能を実行するように設計された生体構成要素のセットを意味する。一般に、遺伝子回路を活性化するために入力が必要であり、遺伝子回路は入力に応じて出力を生成する。
【0047】
本明細書で使用される場合、「操作された」という用語は、ポリヌクレオチド又はポリペプチドに検出可能な変化を生じさせる任意の操作を意味し、この操作は、ポリヌクレオチド又はアミノ酸配列の一部の挿入、削除及び置換を含むが、これらに限定されない。
【0048】
本明細書で使用される場合、「転移効率」という用語は、転移因子が標的細胞群に異種核酸を挿入する効率を意味する。例えば、転移効率は、レポーター遺伝子又は選択マーカーをコードする遺伝子、例えば抗生物質耐性遺伝子(例えば、ピューロマイシン)を含む転移因子を含むプラスミドを標的細胞群にトランスフェクションし、レポーター遺伝子又は選択マーカーによってコードされる遺伝子産物を発現する細胞の数を、例えば抗生物質耐性を有する細胞の数を測定することによって決定することによって決定されてもよい。
【0049】
本明細書で使用される場合、「トランスフェクションされた」、「形質転換された」、又は「形質導入された」という用語は、外来核酸を宿主細胞に転移又は導入するプロセスを意味する。「トランスフェクションされた」、「形質転換された」、又は「形質導入された」細胞は、外来核酸でトランスフェクション、形質転換、又は形質導入された細胞である。本明細書で使用される場合、「形質導入」及び「トランスフェクション」という用語は、感染因子(例えば、ウイルス)又は他の方法を使用して目的のタンパク質又は分子を発現させるためにDNAを細胞に導入する当該分野で知られている全ての方法を含む。ウイルス又はウイルス様制剤に加えて、リン酸カルシウム、デンドリマー、リポソーム又はカチオン性ポリマー(例えば、DEAE-グルカン又はポリエチレンイミン)を使用する方法のような化学的トランスフェクション方法;電気穿孔、細胞スクイズ、音響穿孔、光トランスフェクション、穿刺トランスフェクション、プロトプラスト融合、プラスミド又はトランスポゾン送達などの非化学的方法;遺伝子銃、磁気トランスフェクション又は磁気補助トランスフェクション、粒子衝撃の使用などの粒子ベースの方法;核トランスフェクションなどの混合方法もある。
【0050】
「インビボ」という用語は、細胞を取得する生物の体内でのことである。「エクスビボ」又は「インビトロ」とは、細胞を取得する生物の体外でのことである。
【0051】
なお、本明細書に記載された本発明の実施形態は、「からなる」及び/又は「実質的にからなる」実施形態を含む。
【0052】
本明細書では、「約」が言及された数値又はパラメータが、当該数値又はパラメータ自体に対する変化を含む(説明している)。例えば、「約X」が言及された説明には、「X」の記載が含まれる。
【0053】
本明細書で使用される場合、「そうでない」が言及された数値又はパラメータは、通常、数値又はパラメータと「異なる」ことを表し、説明する。例えば、該方法がX型癌の治療に使用されないということは、X型以外の癌の治療に使用されることを意味する。
【0054】
本明細書で使用される用語「約X~Y」は、「約Xから約Y」と同じ意味を有する。
【0055】
本明細書及び添付の特許請求の範囲で使用される場合、単数形「1種」、「1つ」、及び「上記」は、文脈で別段の規定がない限り、複数形も含む。
【0056】
II.操作された転移因子
本願の一態様は、5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含む操作された転移因子を提供する。いくつかの実施形態では、上記転移因子は異種核酸の標的核酸(例えば、DNA)へのインビトロ挿入を可能とする転移活性を示す。いくつかの実施形態では、上記操作された転移因子は異種核酸の細胞内の標的核酸(例えば哺乳類又は細胞植物のDNA)への挿入を可能とする転移活性を示す。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
【0057】
いくつかの実施形態では、上記操作された転移因子は、5’から3’へ、5’標的部位反復配列(5’TSD)、5’TR、異種核酸、3’TR及び3’TSDを含む。いくつかの実施形態では、上記転移因子は異種核酸の標的核酸(例えば、DNA)へのインビトロ挿入を可能とする転移活性を示す。いくつかの実施形態では、上記操作された転移因子は異種核酸の細胞内の標的核酸(例えば哺乳類又は細胞植物のDNA)への挿入を可能とする転移活性を示す。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。
【0058】
いくつかの実施形態では、本願は、ヒト細胞内で効率的に転移できる広範な種由来の新規な転移因子を提供する。本明細書の上記転移因子は天然活性を有する哺乳類の切り貼りDNAトランスポゾンのための直接的な実験証拠を提供する。
【0059】
例示的な転移因子のリスト及びこれに対応する左末端フラグメント(LTF)、右末端フラグメント(RTF)、トランスポザーゼ、5’末端反復(TR)、3’TR、5’標的部位反復(TSD)及び3’TSD配列は1~2及び配列表に記載される。表1は本願で開示されたバイオインフォマティクス分析により同定された131個のTEを示し、この131個のTEは11個のTE(TE ID: 4、5、7、12、18、20、22、25、26、28及び30)を含み、その長さが3000 bp以下、MITEコピー数が10を超え、平均差が1%小さいことを満たし、高効率ゲノム工学に適用できる。表2はヒト細胞株HEK293T及びHelaにおいて転移分析実験を使用して検証された活性TEを示す。
【0060】
いくつかの実施形態では、上記転移因子はクラス2の転移因子である。クラス2の転移因子は、末端反復(TR)と、組み込む過程で生じたTR側に連結された標的部位反復(TSD)の長さとを含む、トランスポザーゼの相関性及び共有する構造的特徴によってスーパーファミリーとして分類されてもよい。本願の転移因子は各種の適切なTEスーパーファミリー及び/又はファミリーに由来し得ると想定する。いくつかの実施形態では、上記転移因子はhATスーパーファミリーに由来する。いくつかの実施形態では、上記転移因子はPスーパーファミリーに由来する。いくつかの実施形態では、上記転移因子はPIF-Harbingerスーパーファミリーに由来する。いくつかの実施形態では、上記転移因子はpiggyBacスーパーファミリーに由来する。いくつかの実施形態では、上記転移因子はTcMarinerスーパーファミリーに由来する。いくつかの実施形態では、上記5’TRは3’TRの逆相補である。いくつかの実施形態では、上記5’TRは3’TRの逆相補ではない。
【0061】
いくつかの実施形態では、上記操作された転移因子は、hAT、P、PIF-Harbinger、piggyBac及びTcMarinerから選択されるスーパーファミリーの転移因子の5’TRと少なくとも約50%、60%、70%、80%、90%、95%、99%又は100%の配列同一性を有する核酸配列を含む5’TRを含む。いくつかの実施形態では、上記操作された転移因子は、hAT、P、PIF-Harbinger、piggyBac及びTcMarinerから選択されるスーパーファミリーの転移因子の3’TRと少なくとも約50%、60%、70%、80%、90%、95%、99%又は100%の配列同一性を有する核酸配列を含む3’TRを含む。
【0062】
いくつかの実施形態では、上記操作された転移因子は5’TRと3’TRを含み、上記5’TRはhAT、P、PIF-Harbinger、piggyBac及びTcMarinerから選択されるスーパーファミリーの転移因子の5’TRと少なくとも約50%、60%、70%、80%、90%、95%、99%又は100%の配列同一性を有する核酸配列を含み、上記3’TRはhAT、P、PIF-Harbinger、piggyBac及びTcMarinerから選択されるスーパーファミリーの転移因子の3’TRと少なくとも約50%、60%、70%、80%、90%、95%、99%又は100%の配列同一性を有する核酸配列を含む。
【0063】
いくつかの実施形態では、上記操作された転移因子は、表1のいずれか1つのTE由来の5’TR、3’TR、LTF、RTF、トランスポザーゼ、5’TSD及び/又は3’TSDを含む。いくつかの実施形態では、上記操作された転移因子は表2のいずれか1つのTE由来の5’TR、3’TR、LTF、RTF、トランスポザーゼ、5’TSD及び/又は3’TSDを含む。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt、Tc1-1_AG、Tc1-1_PM、Tc1-4_Xt、Tc1-15_Xt、Mariner-6_AMi、又はMariner-3_Crpに由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0064】
いくつかの実施形態では、上記操作された転移因子はSEQ ID NO: 115~140及び167~178から選択される核酸配列、その変異体又はそのフラグメントを含むLTFを含む。
【0065】
いくつかの実施形態では、上記操作された転移因子はSEQ ID NO: 141~190から選択される核酸配列、その変異体又はそのフラグメントを含むRTFを含む。
【0066】
いくつかの実施形態では、上記操作された転移因子はLTFとRTFを含み、上記LTFはSEQ ID NO: 115~140及び167~178から選択される核酸配列と少なくとも約80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれかの配列同一性を有し、上記RTFはSEQ ID NO: 141~190から選択される核酸配列と少なくとも約80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれかの配列同一性を有する。いくつかの実施形態では、上記操作された転移因子はSEQ ID NO:115~140及び167~178から選択される核酸配列を含むLTFと、SEQ ID NO:141~190から選択される核酸配列を含むRTFと、を含む。
【0067】
いくつかの実施形態では、上記操作された転移因子はLTFの5’TRを含み、上記LTFはSEQ ID NO: 115~140及び167~178から選択される核酸配列を含む。いくつかの実施形態では、上記操作された転移因子はRTFの3’TRを含み、上記RTFはSEQ ID NO: 141~190から選択される核酸配列を含む。
【0068】
いくつかの実施形態では、上記操作された転移因子はLTFの5’TR、5’TRの変異体又は5’TRのフラグメントを含み、上記LTFはSEQ ID NO: 115~140及び167~178から選択される核酸配列と、RTFの3’TR、3’TRの変異体又は3’TRのフラグメントと、を含み、上記RTFはSEQ ID NO: 141~190から選択される核酸配列を含む。
【0069】
いくつかの実施形態では、上記操作された転移因子は、SEQ ID NO: 1~26及び79~90から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を有する5’TRを含む。いくつかの実施形態では、本願の操作された転移因子はSEQ ID NO: 1~26及び79~90から選択される核酸配列と少なくとも約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれかの配列同一性を有する5’TRを含む。いくつかの実施形態では、上記5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列を含む。いくつかの実施形態では、上記操作された転移因子は5’TRとしての相補的配列を有する3’TRを含む。
【0070】
いくつかの実施形態では、上記操作された転移因子はSEQ ID NO: 27~52及び91~102から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を有する3’TRを含む。いくつかの実施形態では、上記操作された転移因子はSEQ ID NO: 27~52及び91~102から選択される核酸配列と少なくとも約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれかの配列同一性を有する3’TRを含む。いくつかの実施形態では、上記3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列を含む。いくつかの実施形態では、上記操作された転移因子は3’TRとしての相補的配列を有する5’TRを含む。
【0071】
いくつかの実施形態では、上記操作された転移因子は、1)SEQ ID NO: 1~26及び79~90から選択される核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する5’TRと、2)SEQ ID NO: 27~52及び91~102から選択される核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する3’TRと、を含む。
【0072】
いくつかの実施形態では、上記操作された転移因子は、1)SEQ ID NO: 1~26から選択される核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する5’TRと、2)SEQ ID NO: 27~52から選択される核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する3’TRと、を含む。
【0073】
いくつかの実施形態では、上記操作された転移因子は、1)SEQ ID NO: 79~90から選択される核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する5’TRと、2)SEQ ID NO: 91~102から選択される核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する3’TRと、を含む。
【0074】
本明細書では、本明細書の例えば表1及び2に記載の5’TR及び/又は3’TR、又はLTF及び/又はRTFのいずれか1つの変異体又はフラグメントを含む操作された転移因子も考慮される。いくつかの実施形態では、上記変異体は約50、40、35、30、25、20、15、10、9、8、7、6、5、4、3、2又は1個以下のいずれかのヌクレオチドの置換を含む。いくつかの実施形態では、上記フラグメントは少なくとも約5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100 、150、200、250、300、350、400、450又は500個のいずれかのヌクレオチドを含む。
【0075】
いくつかの実施形態では、上記操作された転移因子は5’TSDを含む。いくつかの実施形態では、上記操作された転移因子は3’TSDを含む。いくつかの実施形態では、上記操作された転移因子は5’TSDと3’TSDを含む。いくつかの実施形態では、上記操作された転移因子は5’TSDを含まない。いくつかの実施形態では、上記操作された転移因子は3’TSDを含まない。いくつかの実施形態では、上記操作された転移因子は5’TSD又は3’TSDを含まない。いくつかの実施形態では、上記5’TSDは3’TSDと同じである。いくつかの実施形態では、上記5’TSDは3’TSDと異なる。
【0076】
いくつかの実施形態では、上記操作された転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記操作された転移因子はトランスポザーゼをコードする核酸配列を含まない。いくつかの実施形態では、トランスポザーゼは5’TR及び3’TR配列と同じ種に由来する。いくつかの実施形態では、トランスポザーゼは5’TR及び3’TR配列に対する天然トランスポザーゼである。いくつかの実施形態では、トランスポザーゼは5’TR及び3’TR配列に対する天然トランスポザーゼに基づく操作されたトランスポザーゼである。
【0077】
トランスポザーゼは、ドナーポリヌクレオチド(例えば、ベクター)からトランスポゾンを切断してから、トランスポゾンを標的核酸、例えば標的細胞のゲノム又は染色体外DNAに組み込むことを触媒する。いくつかの実施形態では、トランスポザーゼは転移因子の末端反復に結合する。
【0078】
いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列、その変異体又はそのフラグメントを含む。
【0079】
本願のいくつかの実施形態では、表1~2及び配列表に記載のトランスポザーゼの変異体が考慮される。トランスポザーゼ変異体の表現は、参照トランスポザーゼポリペプチド(例えば天然に存在するトランスポザーゼポリペプチド)とは少なくとも1つのアミノ酸残基の付加、欠失、切断及び/又は置換が異なるが、転移活性を保持するトランスポザーゼポリペプチドを指す。いくつかの実施形態では、トランスポザーゼポリペプチド変異体は参照トランスポザーゼポリペプチドとは1つ又は複数の置換が異なり、本分野に知られるように、上記置換は保存的又は非保存的であってもよい。いくつかの実施形態では、変異体トランスポザーゼは参照トランスポザーゼに対応する配列と少なくとも約80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれかの配列同一性又は類似性を有するアミノ酸配列を含む。いくつかの実施形態では、変異体トランスポザーゼは約50、40、35、30、25、20、15、10、9、8、7、6、5、4、3、2又は1個以下のアミノ酸置換を含む。
【0080】
本明細書の上記トランスポザーゼのアミノ酸欠失を有する機能性フラグメント又はアミノ酸付加を有する変異体も考慮される。いくつかの実施形態では、トランスポザーゼフラグメントの長さは少なくとも約50、60、70、80、90、100、150、200、250、300、350、400、450、500、600、700個以上のいずれかのアミノ酸残基である。いくつかの実施形態では、アミノ酸付加又は欠失は参照トランスポザーゼのC末端及び/又はN末端で起こる。いくつかの実施形態では、アミノ酸付加又は欠失は内部位置、例えば参照トランスポザーゼの可撓性ループで起こる。いくつかの実施形態では、アミノ酸欠失(例えば、N末端及び/又はC末端のトゥランケイション(truncation))は約1、約2、約3、約4、約5、約6、約7、約8、約9、約10、約15、約20、約25、約30、約35、約40、約45、50、約55、約60、約65、約70、約75、約80、約85、約90、約95、約100、約105、約110、約115、約120、約125、約130、約135、約140、約145、約150、約155、約160、約165、約170、約175個以上のアミノ酸を含み、これらの値の間の全ての及び範囲が含まれる。いくつかの実施形態では、変異体トランスポザーゼはN末端又はC末端精製タグ、選択マーカー(例えば、抗生物質耐性遺伝子)又はレポーター遺伝子(例えば、蛍光レポーター遺伝子)を含む。
【0081】
上記の通り、本発明のトランスポザーゼポリペプチドは、アミノ酸置換、欠失、切断や挿入などの多くの手段で変改されてもよい。このような操作の方法は通常本分野に知られているものである。例えば、参照ポリペプチドのアミノ酸配列変異体はDNAの突然変異によって製造されてもよい。突然変異誘発及び核酸配列改変の方法は本分野に知られているものである。例えば、Kunkel (1985, Proc. Natl. Acad. Sci. USA. 82: 488-492)、Kunkel et al., (1987, Methods in Enzymol, 154: 367-382)、U.S. Pat. No. 4,873,192、Watson, J. D. et al., (Molecular Biology of the Gene, Fourth Edition, Benjamin/Cummings, Menlo Park, Calif., 1987)及びそれに引用される参照文献を参照する。目的タンパク質の生物学的活性に影響しない適切なアミノ酸の替代の指導はDayhoff et al., (1978) Atlas of Protein Sequence and Structure (Natl. Biomed. Res. Found., Washington, D.C.)のモデルに記載される。
【0082】
いくつかの実施形態では、参照トランスポザーゼと比較して、トランスポザーゼはコドンが最適化される。いくつかの実施形態では、トランスポザーゼは哺乳類細胞例えばヒト細胞内で発現するようにコドンが最適化される。いくつかの実施形態では、トランスポザーゼは植物細胞内で発現するようにコドンが最適化される。
【0083】
いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91% 、92%、93%、94%、95%、96%、97%、98%、99%以上)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列を含む。
【0084】
いくつかの実施形態では、上記転移因子は以下を含む。1)LTFの5’TRであって、LTFはSEQ ID NO: 115の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 141の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)TAGGC(SEQ ID NO: 1)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)GCCTA(SEQ ID NO: 27)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 1の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 27の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 1の核酸配列を含む5’TRと、2)SEQ ID NO: 27の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、GTATGGAC(SEQ ID NO: 191)の核酸配列を含む5’TSDと、SEQ ID NO: 191の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 115の核酸配列の配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 141の核酸配列の配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 53のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 53のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 53(hAT-2_AGのトランスポザーゼ)
MASNVATSSSIWDHFTRNGTKAKCRYCYNEIAFTKGSTSNLKRHMKAKHPSISLERQHLASTTSPSTQNSEPGPSCSSRPPNLISNFFKQPMNSETKRKLDMMLLKLICKDCLPLSIVESEAFKTFVGCLNQNYDLPTRKNVSNALLPSIYNEILVKVQGEVRNATSIALTTDGWTNVNNTSFLGLTAHFIDNDYKLRSCLLECSEISLSHSGQNIAAWIKEVIIKYEIQDKIVGIVTDNAANMKSAARELEFNHVTCFAHSLHLIVKDAIKKSIISTVDEVKRIVMYFKKSPKATNELADTQSKFNLPNLKLKQDVPTRWNSTYDMLNRFYKNKIAIVACADKLNTLDPIKIDWAILEHSLNALKIFDVATNMVSAEKNITVSHVGLLSKMIIRKLNETDYTIPELGNLVTHLKEGVKKRLEIYSNNQIIAKSMLLDPRIKKQGFHEEPLKYRETYELIIQELIPFQTPSMNAQEPHNIDNEANLLLGEFITWVNNAECEIESPIELAKNELNSFLKIRNIDIKNDPLEWWRIHSSKYPSIYALAKTIICIPGTSVPCERLFSKAGQIYSDKRSRLHPKKFKEIIFIQQNVDKF
【0085】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 116の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 142の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)TAG(SEQ ID NO: 2)核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)CTA(SEQ ID NO: 28)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 2の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 28の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 2の核酸配列を含む5’TRt、2)SEQ ID NO: 28の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、ATGTGAAC(SEQ ID NO: 192)の核酸配列を含む5’TSDと、SEQ ID NO: 192の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 116の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 142の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 54のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 54のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 54(HAT1_AGのトランスポザーゼ)
MMAPTNATTSPVWDHFSPVETGAKCLYCLKVFKYTKGTTSNLKRHLNLVHKTVPYLKQKQPIPQTINIDDEAGPSAVNFQPSNQYFNSNMSIQGYLKKPINSETKKVLDRMLLDLICKECLPFNLVESEIFKKFVYTLNPNYIMPTRKSLSNALLPSVYNQEFEKAKEKLSTAKAIAITSDGWTNLNQISFFALTGHYIDENCKLSSILIECSEFENPHSGRNIANWIQGTLNKFDIEDKIVAMVTDNASNMKAASTELNFCHIPCFAHTLNLIVRDAIKKSVLPVVEEVKRVVMLFKKSPKASQMLADTQKKLNLDQLKMIQEVSTRWNSGYDMLNRFYKNKIALLSCADSLKMKISLESHDWEAIEQIVRVLKYFYSATNIVSAQKYITISHVGLLCNVLLTKTSQFRNDEDIAENIQNLVALLIEGLQNKLKIYRSNEQILKSMILDPRIKQLGFQDDVEKFKNICESIISELLPLQKPAVEVEKVVKKVSKDVDMLFGDLLKNKGAQNYKTPRQIAENELHQYLSVENIDLENDPLLWWKEHQVLYPSLYTLAMSTLCIPGTSVPCERLFSKAGQIYSEKRSRLAPKKLQEILFIQQNA
【0086】
いくつかの実施形態では、上記転移因子は以下を含む。1)LTFの5’TRであって、上記LTFはSEQ ID NO: 117の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 143の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 3の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 29の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 3の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 29の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 3の核酸配列を含む5’TRと、2)SEQ ID NO: 29の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、TA(SEQ ID NO: 193)の核酸配列を含む 5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 117の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 143の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 55のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 55のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 3(Tc1-8B_DRの5'TR)
CAGCGGGGAAAATAAGTATTTGACACATCAGCATTTTTATCAGTAAGGGGATTTCTAAGTGGGCTACTGACACAAAATTCCTACCAGATGTAGCCATCAAGCCAAATATTGAATTCATACAAAGAAATCAGAACATTTAAGTATACAAGTTGAGTCATAATAAATAAAGTGAAATGACACAGGGAATAAGTATTGAACACA

SEQ ID NO: 29(Tc1-8B_DRの3'TR)
TGTGTTCAATACTTATTCCCTGTGTCATTTCACTTTATTTATTATGACTCAACTTGTATACTTAAATGTTCTGATTTCTTTGTATGAATTCAATATTTGGCTTGATGGCTACATCTGGTAGGAATTTTGTGTCAGTAGCCCACTTAGAAATCCCCTTACTGATAAAAATGCTGATGTGTCAAATACTTATTTTCCCCGCTG

SEQ ID NO: 55(Tc1-8B_DRのトランスポザーゼ)
MMGKNKELSQDLRSLIVEKHFDGNGYRRISRMLNVPVSTVGAIIRKWKKHKFTINRPRSGAPRKIPVRGVQRIIRRVLQEPRTTRAELQEDLASAGTIVSKKTISNALNHHGIHARSPRKTPLLNKKHVEARLKFAKQHLEKPVDYWETIVWSDESKIELFGSHSTHHVWRRNGTAHHPKNTIPTVKFGGGSIMVWGCFSARGTGRLHIIEGRMNGEMYRDILDKNLLPSTRKLKMKRGWTFQQDNDPKHKAKETMKWFQRKKIKLLEWPSQSPDLNPIENLWRELKIKVHKRGPRNLQDLKTVCVEEWARITPEQCRRLVSPYKRRLEAVITNKGFSTKY
【0087】
いくつかの実施形態では、上記転移因子は以下を含む。1)LTFの5’TRであって、上記LTFはSEQ ID NO: 118の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 144の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 4の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 30の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 4の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 30の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 4の核酸配列を含む5’TRと、2)SEQ ID NO: 30の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、TTAGAG(SEQ ID NO: 195)の核酸配列を含む5’TSDと、SEQ ID NO: 195の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 118の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 144の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 56のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 56のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%、99%以上)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 56(hAT-6_PMのトランスポザーゼ)
MAKRKKDDEYRTFQDEWTEEFAFVERAGSAVCLICNDKITSLKRSNVKRHFDTRHATFASKYPAGDSRKKACQELLSRVQASQQQLRVWTRQGDYNSASFAGSLAIVRNGKPFTDGEYAKTFMLDVANELFDDLPNKDKIIKRIQDMPLSARTVHDRTIVMANKVEETQVKDINAAPFFSLALDESTDVSHLSQFSVIARYAVGDTLREESLAVLPLKGSTRGEDLFKSFMEFAQEKSLPMDKLLSVCTDGAPCMVGKNKGFVALLREHENRPILSFHCIIHQEALCAQMCDRQFGEVMSLVIRVINFIVARALNDRQFKTLLDEVVNNYPGLLLHSNVRWLSRGKVLSRFAACLNEIRTFLEMKGVGHPELADTEWLLKFYYLVDLTEHLNQLNVKMQGIGNTVLSLQQAVFAFENKLELFITDLETGRLLHFEKLSQFKDACTASEPIQNLDLHQLAGCTSSLLQSFKARFGEFREHTRLFKFITHPNECSLNTADLNYIPGVSVRDFEAEVADLKASDMWVNKFKSLNEDLERITRQKAELASKHMWTEMKKLQPEDQLILKTWNALPVTYHTLQRVSIAVLTMFGSTYACEQSFSHLKNIKSNLRSRLTDESLNACMKLNLTKYQPDYKDISKSMQHQKSH
【0088】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 119の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 145の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CAGGGG(SEQ ID NO: 5)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 31の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 5の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 31の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98 %、99%以上)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 5の核酸配列を含む5’TRと、2)CCCCTG(SEQ ID NO: 31)を含む核酸配列の3’TRと、を含む。いくつかの実施形態では、上記転移因子は、CTGTATAG(SEQ ID NO: 196)の核酸配列を含む5’TSDと、SEQ ID NO: 196の核酸配列を含む3’TSDと、をさらに含む。転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 119の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 145の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 57のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼは、SEQ ID NO: 57のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%、99%以上)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 57(hAT-3_XTのトランスポザーゼ)
MTSSQPAVKRKIDDEHRQFQEKWEMQYFFVEHRGIPTCLICAEKVAVHKEYNLKRHYSTKHAEECAKYQGDERAKRVASLKACLMRQQDFFKKATKENVASVQASYMVSEMIAKAGKPFTEGEFVKKCMLQVASIICPEKKGQFSKISLSANTVAERISDMSSDIYHQLCEKAKCFDAYSVALDESTDITGTAQLTIYVRGVDCNFELTEELLTIIPMHGQTTANEIFHHLCDAIENAGLPWKRFVGIITDGAPSMTGRKNGLVALVKKKLEEEGIEEEAIALHCIIHQQALCSKCLPCDNVMSVVVKCVNQIRSRGLTHRRFRAFLEEMGSEYGDVLYFTEVRWLSRGNVLKRFFELREEVKAFMEKNGKAVSELSDHKWLMDLAFLVDITQRLNVLNKMLQGQGQLVSAAYDNVRAFSTKLVLWKSQLSQTNLCHFPACKELVDAGIPFSGEKYVDAIFKLEKEFDHRFADFKTHRATFQIFVDPFSFDVQDAPPVLQMELIDLQCNSDIKAKFREMSGKADTHVQFLRELPPSFPELSRMFKRTMCLFGSTYLCEK
【0089】
いくつかの実施形態では、上記転移因子は以下を含む。1)LTFの5’TRであって、上記LTFはSEQ ID NO: 120の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 146の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 6の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 32の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 6の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 32の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 6の核酸配列を含む5’TRと、2)SEQ ID NO: 32の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 120の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 146の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 58のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 58のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 6(Tc1-3_Xtの5'TR)
CAGTGGAGGAAATAATTATTTGACCCCTCACTGATTTTGTAAGTTTGTCCAATGACAAAGAAATGAAAAGTCTCAGAACAGTATCATTTCAATGGTAGGTTTATTTTAACAGTGGCAGATAGCACATCAAAAGGAAAATCGAAAAAATAACTTTAAATAAAAGATAGCAACTGATTTGCATTTCATTGAGTGAAATAAGTTTTTGAACCC

SEQ ID NO: 32(Tc1-3_Xtの3'TR)
GGGTTCAAAAACTTATTTCACTCAATGAAATGCAAATCAGTTGCTATCTTTTATTTAAAGTTATTTTTTCGATTTTCCTTTTGATGTGCTATCTGCCACTGTTAAAATAAACCTACCATTGAAATGATACTGTTCTGAGACTTTTCATTTCTTTGTCATTGGACAAACTTACAAAATCAGTGAGGGGTCAAATAATTATTTCCTCCACTG

SEQ ID NO: 58(Tc1-3_Xtのトランスポザーゼ)
MGKTKELSKDVRDKIVDLHKAGMGYKTISKKLGEKVTTVGAIVRKWKEHKMTINRPRSGAPRKISPRGVSMILRKVKKHPRTTREELVNDLKLAGTTVTKKTIGNTLHRNGLKSCRARKVPLLKKAHVQARLKFANEHLNDSVSDWEKVLWSDETKIELFGINSTRCVWRKKNAAYDPQNTVPTVKHGGGNILLWGCFSAKGTGQLIRINGKMDGAMYREILNDNLLPSARKLKMGRGWVFQHDNDPKHTAKATKEWLKKKHIKVMEWPSQSPDLNPIENLWRELKLRVAQRQPRNLRDLEMICKEEWTNIPPKMCANLVINYKKRLTSVLANKGFSTKY
【0090】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 121の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 147の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CAGGGGTGGCGAACC(SEQ ID NO: 7)核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)GGTTCGCCACCCCTG(SEQ ID NO: 33)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 7の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 33の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 7の核酸配列を含む5’TRと、2)SEQ ID NO: 33の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、GTCTATAC(SEQ ID NO: 194)の核酸配列を含む5’TSDと、SEQ ID NO: 194の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 121の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 147の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 59のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 59のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 59(hAT-5_DRのトランスポザーゼ)
MAESGKRTAKRKYEDERRTFLSEWEDLYFFVERNGKPFCLICQTSLSHFKASNLERHFTSLHSAVAREFPKGSELRKHKVKTLKGQAEKQTQLFRKFTKHSETVTLASYQLAWNIARAKKPYLEGEFVKKCLSDAVAILCPENENLKRSVKDLQLSRHTVEQRISDIDNSVETHLLSDLQKCQYFSIALDESCDVQDKPQLAIFVRFVSEDCTIREELLDIVPLKDRTRGIDLKETLMTVVEKANLQLSKLTAIVTDGAPAMLGSERGLVGLCKADDRFPAFWTFHCIIHQEHLVSKKLNLDHIMKPVLEIVNFVRTHALNHRQFKNLIDELDEDLPSDLLFHCAVRWLSRGHVLSRFFELLNPVKLFLAEKHKEYPELHDPQWISDLAFLVDVLHYLNGLNVDLQGKLKMLPDLVQSVFAFVNKLKLFKTHLQKRDYTHFPTLLKASGQEAEVVKGSTARYATLLENLEQSFEERFSNLRQKRQQITFLINPFTAESGCLKAPLVEDEAASQLEMIELSEDDRLKSVLREGTVEFWKIVPVERYPNVKQAALKLLSMFGSTYVCESLFSTLKLVKSKHRSVLTDTHVKELLRVATTEYEPDLKKIVETKECQVSH
【0091】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 122の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 148の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 8の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 34の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 8の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 34の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 8の核酸配列を含む5’TRと、2)SEQ ID NO: 34の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TRと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 122の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 148の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 60のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 60のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 8 (Tc1-3_FRの5'TR)
CAGTGAGAGTAAAAAGTATTTGATCCCTTGCTGATTTTGTTGGTTTGTCCACTAATAAAGACATGATCATTCTATACTTTTAATGGTAGATGTATTCTAACATGGAGAGACAGAATATCAAAAAGAAAATC
SEQ ID NO: 34 (Tc1-3_FRの3'TR)
GATTTTCTTTTTGATATTCTGTCTCTCCATGTTAGAATACATCTACCATTAAAAGTATAGAATGATCATGTCTTTATTAGTGGACAAACCAACAAAATCAGCAAGGGATCAAATACTTTTTACTCTCACTG
SEQ ID NO: 60 (Tc1-3_FRのトランスポザーゼ)
MGKTKELSQDLRDRIVDLHKSGMGYKNISKLLGIKVTTIGAIVRKFKKYNMTINRPRSGAPQKISPRGVAMIMRTVRNRPATTQQELVNDLQAAGTKVTRKTIGNTLRRNGLKSCSARKVPLLKKAHVEARLKYANDHLKDAQSDWEKVLWSDETKIELFGLNSTRHVWRKKNAAYDPRNTVPTVKHGGGNIMFWGCFSAKGTGLLHRITGKMDGAMYRAVLRDNLLPSARKLKMGRGWVFQHDNDPKHTAKATKEWLKKNHIKVMEWPSQSPDLNPIENLWRELKVRVAKRQPTNLNDLERICKEEWAKIPPDMCANLVVNYNKRLTAVLANNGFATKY
【0092】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 123の核酸配列を含む。 2)RTFの3’TRであって、上記RTFはSEQ ID NO: 149の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 9の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 35の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 9の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 35の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 9の核酸配列を含む5’TRと、2)SEQ ID NO: 35の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 123の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 149の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 61のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 61のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 9 (Tc1-5_Xtの5'TR)
CAAACCGGATTCCAAAAAAGTTGGGACACTAAACAAATTGTGAATAAAAACTGAACGCAATGATGTGGAGGTGCCAACTTCTAATATTTTATTCAGAATAGAACATAAATCACGGAACAAAAGTTTAAACTGAGAAAATGTACCATTTTAAGGGAAAAATATGTTGATTCAGAATTTCATGGTGTCAACAAATCCCAAAAAAGTTGGGACAAG
SEQ ID NO: 35 (Tc1-5_Xtの3'TR)
CTTGTCCCAACTTTTTTGGGATTTGTTGACACCATGAAATTCTGAATCAACATATTTTTCCCTTAAAATGGTACATTTTCTCAGTTTAAACTTTTGTTCCGTGATTTATGTTCTATTCTGAATAAAATATTAGAAGTTGGCACCTCCACATCATTGCGTTCAGTTTTTATTCACAATTTGTTTAGTGTCCCAACTTTTTTGGAATCCGGGTTG
SEQ ID NO: 61 (Tc1-5_Xtのトランスポザーゼ)
MIGYKKSFSEWQCLSEAKMGRGSPIPTMLRRKIVEQYQKGVTQRKIAKILHLSSSTVHNIIRRFRESGTISVRKGQGRKTILDARDLRALKRHCTTNRNATVKEITEWAQEYFQKPLSVNTIHRAIRRCQLKLYSAKKKPFLSKIHKLRRFHWARDHLKWSVAKWKTVLWSDESRFEVLFGNLGRHVIRTKEDKDNPSCYQRSVQKPASLMVWGCMSACGMGSLHVWKGSINAEKYIQVLEQHMLPSRRHLFQGRPCIFQQDNARPHSASITTSWLRRRRIRVLKWPVCSPDLSPIENIWRIIKRKVRQRRPKTIEQLEACIRQEWESIPIPKLEKLVSSVPRRLLSVVRRRGDATQW
【0093】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 124の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 150の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 10の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 36の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 10の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 36の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 10の核酸配列を含む5’TRと、和2)SEQ ID NO: 36の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 124の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 150の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 62のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 62のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 10 (c1-10_Xtの5'TRT)
CAGTGGCTTGCAAAAGTATTCGGCCCCCTTGAACTTTTCCACATTTTGTCACATTACAGCCACAAACATGAATCAATTTTATTGGAATTCCACGTGAAAGACCAATACAAAGTGGTGTACACGTGAGAAGTGGAACGAAAATCATACATGATTCCAAACATTTTTTACAAATAAATAACTGCAAAGTGGGGTGTGCGTAATTATTCAGCCCCCT
SEQ ID NO: 36 (c1-10_Xtの3'TR T)
AGGGGGCTGAATAATTACGCACACCCCACTTTGCAGTTATTTATTTGTAAAAAATGTTTGGAATCATGTATGATTTTCGTTCCACTTCTCACGTGTACACCACTTTGTATTGGTCTTTCACGTGGAATTCCAATAAAATTGATTCATGTTTGTGGCTGTAATGTGACAAAATGTGGAAAAGTTCAAGGGGGCCGAATACTTTTGCAAGCCACTG
SEQ ID NO: 62 (Tc1-10_Xのトランスポザーゼ t)
MKSKEHTRQVRDKVIEKFKAGLGYKKISKALNIPRSTVQAIIQKWKEYGTTVNLPRQGRPPKLTGRTRRALIRNAAKRPMVTLDELQRSTAQVGESVHRTTISRALHKVGLYGRVARRKPLLTENHKKSRLQFATSHVGDTANMWKKVLWSDETKMELFGQNAKRYVWRKTNTAHHSEHTIPTVKYGGGSIMLWGCFSSAGTGKLVRVDGKMDGAKYRAILEENLLESAKDLRLGRRFTFQQDNDPKHKARATMEWFKTKHIHVLEWPSQSPDLNPIENLWQDLKTAVHKRCPSNLTELELFCKEEWARISVSRCAKLVETYPKRLAAVIAAKGGSTKY
【0094】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 125の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 151の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)TACAGTGTCGGACAAATC(SEQ ID NO: 11)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)GATTTGTCCGACACTGTA(SEQ ID NO: 37)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 11の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 37の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 11の核酸配列を含む5’TRと、2)SEQ ID NO: 37の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 125の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 151の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 63のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 63のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 63 (Mariner2_AGのトランスポザーゼ)
MGRSAHSTQQQRLDIKRLSAAGYSQRKIAEILGRSKTFVYNALHSTGTKIPTGRPRKTSARDDARMTRLCKADPFKSARAIRDELQLSVSDRTVQRRLFENNLVGRNPRKVPLLRRCHVQARLQFAREHYDWAGENLNKWRNVLWSDESKVNLVGSDGKRFVRRPKNTAYRPQYTLKTVKHGGGNIMVWACFSWYGVGPIFWIKDIMDQHRYLNIIQTVMLPHAEWEMPLKWQFMHDNDPKHTAKAVKKWFVDQKIDVMNWPAQSPDLNPIENLWKIVKAKLPPAGSRTKEKLWKHIENAWYSIPPSTCKSLVESMPKRMRAVIRNNGHATKY
【0095】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 126の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 152の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 12の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 38の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 12の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 38の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 12の核酸配列を含む5’TRと、2)SEQ ID NO: 38の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 126の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 152の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 64のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 64のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 12 (Tc1-1_Xtの5'TR)
CAGTGGTGTGAAAAACTATTTGCCCCCTTCCTGATTTCTTATTCTTTTGCATGTTTGTCACAC
SEQ ID NO: 38 (Tc1-1_Xtの3'TR)
GTGTGACAAACATGCAAAAGAATAAGAAATCAGGAAGGGGGCAAATAGTTTTTCACACCACTG
SEQ ID NO: 64 (Tc1-1_Xtのトランスポザーゼ)
MPRSKEIQEQMRTKVIEIYQSGKGYKAISKALGLQRTTVRAIIHKWQKHGTVVNLPRSGRPTKITPRAQRQLIREATKDPRTTSKELQASLASIKVSVHDSTIRKRLGKNGLHGRFPRRKPLLSKKNIKARLNFAKKHLNDCQDFWENTLWTDETKVELFGRCVSRYIWRKSNTAFQKKNIIPTVKYGGGSVMVWGCFAASGPGRLAVIDGTMNSTVYQKILKENVRPSVRQLKLKRSWVLQQDNDPKHTSKSTSEWLKKNKMKTLEWPSQSPDLNPIEMLWHDLKKAVHARKPSNKAELQQFCKDEWAKIPPERCKRLVASYRKRLIAVIAAKGGPTSY
【0096】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 127の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 153の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CACTGGTGGACAT(SEQ ID NO: 13)核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)ATGTCCACCAGTG(SEQ ID NO: 39)の核酸配列、その変異体又はそのフラグメントを含み3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 13の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 39の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 13の核酸配列を含む5’TRと、2)SEQ ID NO: 39の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 127の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有するLTFと、2)SEQ ID NO: 153の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 65のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 65のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 65 (Tc1-1_AGのトランスポザーゼ)
MGRGKHCTPEERKHIQGLYRENVPIKTICKAFGRSRTFVDNAIRSEATGKSTGRPRKTTADVDAQIVEMIRADPFKTCTRIKQELGLQVSAKTVSRRLHAAGFCARRPRKVRKLLPHHVEARIRFAEEHLAASIFWWSKIIFSDESRINLDGSDGIKYVWRFPNQAYHPKNTIKTLSHGGGHVMVWGCFSWHGTGPLFRINGTLNSEGYRKILSRKMLPYARQQFGDEEHYIFQHDNDSKHTSRTVKCYLANQDVQVLPWPALSPDLNPIENLWSTLKRQLKNQPARSADDLWTRCKVMWERIPRSECRNLIGDMAKRCQEVIANNGHQIDR
【0097】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 128の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 154の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)ATATACAC(SEQ ID NO: 14)核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)GTGTATAT(SEQ ID NO: 40)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 14の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 40の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 14の核酸配列を含む5’TRと、2)SEQ ID NO: 40の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、AT(SEQ ID NO: 198)の核酸配列を含む5’TSDと、SEQ ID NO: 198の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 128の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 154の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 66のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 66のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 66 (Tc1DR3_Xtのトランスポザーゼ)
MGKKGDLSNFERGMVVGARRAGLSISQSAQLLGFSRTTISRVYKEWCEKGKTSSMRQSCGRKCLVDARGQRRMGRLIQADRRATLTEITTRYNRGMQQSICEATTRTTLRRMGYNSRRPHRVPLISTTNRKKRLQFAQAHQNWTVEDWKNVAWSDESRFLLRHSNGRVRIWRKQNENMDPSCLVTTVQAGGGGVMVWGMFSWHTLGPLVPIGHRLNATAYLSIVSDHVHPFMTTMYPSSDGYFQQDNAPCHKARIISNWFLEHDNEFTVLKWPPQSPDLNPIEHLWDVVERELRALDVHPTNLHQLQDAILSIWANISKECFQHLVESMPRRIKAVLKAKGGQTPY
【0098】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 129の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 155の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CAGGGGTCACCAAACT(SEQ ID NO: 15)核酸配列その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 41の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 15の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 41の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 15の核酸配列を含む5TRと、2)AGTTTGGTGACCCCTG(SEQ ID NO: 41)の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、CTCTAGAC(SEQ ID NO: 199)の核酸配列を含む5’TSDと、SEQ ID NO: 199の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 129の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 155の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 67のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 67のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 67 (hAT-3_PMのトランスポザーゼ)
MATKKRKVDAECRVFNEEWGVKYFFVETKDQKASCVICSESVAVLKEYNLRRHYETKHLSTYSKFSGKLRSEKYESMKRGLETQRNLFTRKFAENESVTRTSYKIVHKMAERGKPFTDGNFIKECMMEAANDLCPERADLFGSISLSASSVVRRTEELGENIVLQIREKARNLLWYSLALDESTDLSSTSQLLVFIRGVNLDFQITEELASVCSMHGTTTGKDIFMEVQKTLQDYNLQWNQLRGVTVDGGKNMAGVRKGLVGQIRTQLEDLQIPGALFIHCIIHQQALCGKDLDISCVLKPVVSAVNFIRGHALNHRQFQAFLEEMDSDFCDLPYHTAVRWLSCGKVLFRFYKLRNEIDVFLTEKDRADPQLSDPTWLSKLSFLVDITSHMNELNLKLQGKDNLVCDLYRIIKGFRRKLSLFEAQLEGENFSHFHCFKEFCATIAEDVNLDFPKKIIRDLKKHFLKRFSDLDRIESDILLFQNPFDCNLDDVPVELQLELIDLQANDLLKEKHREGKLVEFYRCLPDVEFPKLKKFAAGMASVFGTTYVCEQTFSKMKYVKSTHRTRLTDEHLKAILLIGCSNSKPNIDDILKAKRQFHKSH
【0099】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 130の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 156の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CAGGGGTCACCAAACT(SEQ ID NO: 16)核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)AGTTTGGTGACCCCTG(SEQ ID NO: 42)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 16の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 42の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 16の核酸配列を含む5’TRと、2)SEQ ID NO: 42の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDとSEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 130の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 156の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 68のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 68のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 68 (Tc1-1_PMのトランスポザーゼ)
MATKKRKVDAECRVFNEEWGVKYFFVETKDQKASCVICSESVAVLKEYNLRRHYETKHLSTYSKFSGKLRSEKYESMKRGLETQRNLFTRKFAENESVTRTSYKIVHKMAERGKPFTDGNFIKECMMEAANDLCPERADLFGSISLSASSVVRRTEELGENIVLQIREKARNLLWYSLALDESTDLSSTSQLLVFIRGVNLDFQITEELASVCSMHGTTTGKDIFMEVQKTLQDYNLQWNQLRGVTVDGGKNMAGVRKGLVGQIRTQLEDLQIPGALFIHCIIHQQALCGKDLDISCVLKPVVSAVNFIRGHALNHRQFQAFLEEMDSDFCDLPYHTAVRWLSCGKVLFRFYKLRNEIDVFLTEKDRADPQLSDPTWLSKLSFLVDITSHMNELNLKLQGKDNLVCDLYRIIKGFRRKLSLFEAQLEGENFSHFHCFKEFCATIAEDVNLDFPKKIIRDLKKHFLKRFSDLDRIESDILLFQNPFDCNLDDVPVELQLELIDLQANDLLKEKHREGKLVEFYRCLPDVEFPKLKKFAAGMASVFGTTYVCEQTFSKMKYVKSTHRTRLTDEHLKAILLIGCSNSKPNIDDILKAKRQFHKSH
【0100】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 131の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 157の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CAGGC(SEQ ID NO: 17)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)GCCTG(SEQ ID NO: 43)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 17の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 43の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 17の核酸配列を含む5’TRと、2)SEQ ID NO: 43の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 131の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 157の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 69のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 69のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 69 (Mariner-4_AMiのトランスポザーゼ)
MSAKRKSMTSPGGSAKKQRKAIDLEMKMKIINDYEAGKKVKAIARDLELAHSTISTILKDKDRVKEAVQASTGFKAIITRQRKGLIHEMEKLLAIWFDDQIQKRMPMSLLIIQAKARSIFETLKAREGEESTETFTASRGWFQRFRRRFNVHNRSISGEAASADVEAAEKFVDQFDEIIEKGGYRPEQIFNVDETGLFWKKMPERSYIHKEAKAMPGFKAFKDRVTLLLGGNVAGFKLKPFLIHRSENPRALKQVSKHTLPVYYRANSKAWMTQALFEDWFINCFIPSVKHYCLEKGVPFKIILLLDNAPGHPQHLDDLHPDVKVVYLPKNTTAILQPMDQGAIATFKVYYLRATFSKAVAATESDEVTLRDFWKSYNILHCIKNIESAWEGVTEKCMQGIWKKCLKVFVNNFEGFDKDEHVDVINKKIVELANVLNLDVEVKDIEELVEYVEGELTNEDLIELEAQQHLEEEEEEEEERMEEVQKKFTVNGLAGVFSKVNAAILELEGMDPNVERFTKVERQMNELLRCYCEIYEEKKKKKRKLQSRPH
【0101】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 132の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 158の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CAGTGATGGCGAACCT(SEQ ID NO: 18)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)AGGTTCGCCATCACTG(SEQ ID NO: 44)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 18の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 44の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 18の核酸配列を含む5’TRと、2)SEQ ID NO: 44の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、GTCTAGAG(SEQ ID NO: 197)の核酸配列を含む5’TSDと、SEQ ID NO: 197の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 132の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 158の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 70のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 70のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 70 (Myotis_hAT1のトランスポザーゼ)
MENQKNKKARLNDKGSGSSSSRPFQDIWTEMYGIVDRNNRSLCILCNETVVSRTWNVKRHFETNHCQLLKKSIDERKEYISRQLHLYKSQSNSIIKFVRCSTNLTSASYCIAHSIAQHGKALSDGEFIKETFLRCAPALFHDMKNKDDIIKRISELPLSRNTIKDRIIDLNKNVQHQLKKDLNSCKYFSISLDETTDVTSNARLAIIARYSDGLTMREELIKLESVPISTSGNEICKVVIKTFSDLNIDISKIVSVTTDGAPNMVGKNVGFLKLFMEAIRHPLVPFHCIIHQEVLCAKSGFSELNDLMSVVTKIVNFIASRPLHKREFSALLQEVDSTYSGLLMFNNVRWLSRGKVLERFVECFEEITVFIENKDLANFPQINDHKWVSNLMFFTDLSVHMNELNLKLQGFGKSIDVMFGYIKSFESKLKIFKRDIETKTYKYFPRIKKYFEKATTTSVMESILMYQNIVNSLFEQFSERFDQFRSLEQTIKIIKYPDVVVYSTLELKDFQWMQIDDLEMQLADFQGSIWTHVFVDLRSKLENLERNRLNNEEECNYEQEILSAWNRVPDTFSDIKNLAMALLTIFSSTYFCETLFSALNNIKTNKRNRLTDEVSGACLALKCTKYEPAIEELADKLQHQKSH
【0102】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 133の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 159の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CAG(SEQ ID NO: 19) 核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)CTG(SEQ ID NO: 45)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 19の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 45の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 19の核酸配列を含む5’TRと、2)SEQ ID NO: 45の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、GTCTAGAC(SEQ ID NO: 200)の核酸配列を含む5’TSDと、SEQ ID NO: 200の核酸配列を含む3’TSDとをさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 133の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 159の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 71のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 71のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 71 (hAT-7_PMのトランスポザーゼ)
MSGSRKRKVDNECRVFNTEWTTKYFFTEVQSKAVCLICRETVAVFKEYNISRHFATKHANYASKQSTQERAATAQRLAANLQTQQHFFHRQTAIQESTTKASFLVAFEIAKASKPFSEGEFVKECMVQTADILCPEIKSKFEKVSLSRRTVTRRVELIDENIASQLNKKSDSFELYSLALDESTDVKDTAQLLIFIRGIDDSFAITEEFLTMESLKGTTRGEDLYNQVSAVIERMKLPWSKLVNVTTDGSPNLTGKNVGLLKRIQNKVKEENPDQDLIFLHCIIHQESLCKSVLQLNHVVNPAVKLVNFIRARGLQHRQFITFLEETDADHQDLLYHSRVRWLSLGKVLQRVWELKEDIIAFLELMGKSDEFPELSDKNWLSDFAFAVDIFSHMNELNVKLQGKDQFVHDMYKHVKAFKSKLTLFSRQIANKSFAHFPTLAMQEEAPRNAKKYSKSLEDLHGEFCRRFSDFENIEQSLQLVSCPLSQDSETAPQELQLELIDLQSDSVLKEKFNSVKLNDFYASLNRATFPNLRRTAQKMLTLFGSTYVCEQTFSVMNANKARHRSKLTDQHLRSILRIATTKITPDLDALAKMGDQQHCSH
【0103】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 134の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 160の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 20の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 46の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 20の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 46の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 20の核酸配列を含む5’TRと、2)SEQ ID NO: 46の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 134の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 160の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 72のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 72のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 20 (Tc1-11_Xtの5'TR)
CAGTGGATATAAAAAGTCTACACACCCCTGGTAAAATGTCAGGTTCCTGTGCTGTACAAAAATGAGACAAAGATAAATCATTTCAGAACTTTTTCCACCTTTAATGTGACCTATAAACTGTACCACTCAATTGAAAAACAAACTGAAATCTTTTAGG

SEQ ID NO: 46 (Tc1-11_Xtの3'TR)
CCTAAAAGATTTCAGTTTGTTTTTCAATTGAGTGGTACAGTTTATAGGTCACATTAAAGGTGGAAAAAGTTCTGAAATGATTTATCTTTGTCTCATTTTTGTACAGCACAGGAACCTGACATTTTACCAGGGGTGTGTAGACTTTTTATATCCACTG

SEQ ID NO: 72 (Tc1-11_Xtのトランスポザーゼ)
MVHRELPKHQRDLIVKRYQSGEGYKRISKALDIPWNTVKTVIIKWRKYGTTVTLPRTGRPSKIDEKTRRKLVREATKRPTATLKELQEYLASTGCVVHVTTISRILHMSGLWGRVARRKPFLTKKNIQARLHFAKTHLKSPKSMWEKVLWSDETKVELFGHNSKKYVWRKNNTAHHQKNTIPTVKHGGGSIMLWGCFSSAGTGALVKIEGIMNSSKYQSILAQNLQASARKLNMRRNFIFQHDNDPKHTSKSTKEWLHRKKIKVLEWPSQSPDLNPIENLWGDLKRAVHRRCPRNLTDLECFCKEEWANLAKSKCAMLIDSYPKRLSAVIKSKGASTKY
【0104】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 135の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 161の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 21の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 47の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 21の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 47の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 21の核酸配列を含む5’TRと、2)SEQ ID NO: 47の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 135の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 161の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 73のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 73のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 21 (Tc1-16_Xtの5'TR)
CAGTCATGGCCAAAATTGTTGGCACCCCAGAAATTTTTCCAGAAAATCAAGTATTTCTCACAGAAAAGTATTGCAGTAACACATGTTTTGCTATACACATGTTTATTCCCTTTGTGTGTATTGGAACAGAACAAAAAAGGGAGGAAAAAAAGCAAATTGGACATAATGTCACACAAAACTCCAAAAATGGGCTGGACAAAATTATTGGCACCCTT

SEQ ID NO: 47 (Tc1-16_Xtの3'TR)
AAGGGTGCCAATAATTTTGTCCAGCCCATTTTTGGAGTTTTGTGTGACATTATGTCCAATTTGCTTTTTTTCCTCCCTTTTTTGTTCTGTTCCAATACACACAAAGGGAATAAACATGTGTATAGCAAAACATGTGTTACTGCAATACTTTTCTGTGAGAAATACTTGATTTTCTGGAAAAATTTCTGGGGTGCCAACAATTTTGGCCATGACTG

SEQ ID NO: 73 (Tc1-16_Xtのトランスポザーゼ)
MDNRKRRRELSEDLRTKIVEKYQQSQGYKSISRDLDLPLSTVRNIIKKFATHGTVANLPGRGRKRKIDERLQRRIVRMVDKQPQTSSKEIQAVLQAQGASVSARTIRRHLNEMKRYGRRPRRTPLLTQRHKKARLQFAKMYLSKPQSFWENVLWTDETKIELFGKAHHSTVYRKRNEAYKEKNTVPTVKYGGGSMMFWGCFAASGTGCLECVQGIMKSEDYQRILGRTVEPSVRKLGLRPRSWVFQQDNDPKHTSKSTQKWMATKRWRVLKWPAMSPDLNPIEHLWRDLKIAVGKRRPSNKRDLEQFAKEEWSKIPGERCKKLIDGYRKRLISVIFSKGCATKY
【0105】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 136の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 162の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 22の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 48の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 22の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 48の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 22の核酸配列を含む5’TRと、2)SEQ ID NO: 48の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 136の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 162の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 74のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 74のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 22 (Tc1-4_Xtの5'TR)
CAGTGAGGAACATAAGTATTTGAACACCCTGCGATTTTGCAAGTTCTCCCACTTAGAAATCATGGAGGGGTCTGAAATTCACATTGTAGGTGCATTCCCACTGTGAGAGACAGCATTTAAAAAAAAAATTCAGGAAATCACATTGTATGATTTTTAAAGAATGTATTTGTATTGCACTGCTGCACATAAGTATTTGAACACCTG

SEQ ID NO: 48 (Tc1-4_Xtの3'TR)
CAGGTGTTCAAATACTTATGTGCAGCAGTGCAATACAAATACATTCTTTAAAAATCATACAATGTGATTTCCTGAATTTTTTTTTTAAATGCTGTCTCTCACAGTGGGAATGCACCTACAATGTGAATTTCAGACCCCTCCATGATTTCTAAGTGGGAGAACTTGCAAAATCGCAGGGTGTTCAAATACTTATGTTCCTCACTG

SEQ ID NO: 74 (Tc1-4_Xtのトランスポザーゼ)
MGKTKELSKDTRDKIVDLHKAGKGYGAIAKQLGENRSTVGAIVRKWKRLKTTVSLPRTGAPCKISPRGVSLMIRKVRNQPRTTREELVNDMKRAGTTVSKVTVGRTLRRHGFKSCIARKVPLLKSSHVQARLKFANDHLDDPEEAWEKVMWSDETKVELFGLNFTRRVWRKNKDELHPKNTIPTVKHGGGNIMLWGCFSAKGTGRLHCIKERMNGAMYCEILSNNLLPSVRALKMGRGWVFQHDNDPKHTARITKEWLRKRHIKVLEWPSQSPDLNPIENLWRELKLRVAQRQPRNLTDLEEICVEEWAKIPVAVCANLVKNYRKRLTSVIANKGFCTKY
【0106】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 137の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 163の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CACTGCTCAAAAAAATAAAGGGAACAC(SEQ ID NO: 23)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)GTGTTCCCTTTATTTTTTTTGAGCAGTG(SEQ ID NO: 49)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 23の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 49の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 23の核酸配列を含む5’TRと、2)SEQ ID NO: 49の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 49の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 137の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 163の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 75のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 75のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 75 (Tc1-15_Xtのトランスポザーゼ)
MRRSLQPTQMAQVVQLIQDGTSMRAVARRFAVSVSVVSRAWRRYQETGQYIRRRGGGRRRATTQQQDRYLRLCARRNRRSTARALQNDLQRATNVHVSAQTVRNRLHEGGMRARRPQVGVVLTAQHRAGRLAFAREHQDWQIRHWRPVLFTDESRFTLSTCDRRDRVWRRRGERSAACNILQHDRFGSGSVMVWGGISLGGRTALHVLARGSLTAIRYRDEILRPLVRPYAGAVGPGFLLMQDNARPHVAGVCQQFLQDEGIDAMDWPARSPDLNPIEHIWDIMSRSIHQRHVAPQTVQELVDALVQVWEEIPQETIRHLIRSMPRRCREVIQARGGHTHY
【0107】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 138の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 164の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CACTGCTCAAAAAAATTAGAGGAACACTT(SEQ ID NO: 24)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)AAGTGTTTCCTCTAATTTTTTTTGAGCAGTG(SEQ ID NO: 50)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 24の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 50の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 24の核酸配列を含む5’TRと、2)SEQ ID NO: 50の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 138の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 164の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 76のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 76のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 76(TC1_FR2のトランスポザーゼ)
MVRYLDATEVAQVVQLLQDGTSIRAVARRFAVSPSTVSRAWRRFQETGSYSRRAGQGRRRSLNPQQDRYLLLCARRNRMSTARALQNDLQQATGVNVSDQTIRNRLHEGGLRARRPVVGPVLTARHRRARLAFAIDHQNWQLRHWRPVLFTDESRFNLSTCDRRERVWRCRGERYAACNIIQHDRFGGGSVMVWGGISLEGRTDLYRLDNGTLTAIRYRDEILGPIVRTYAGAVGPGFLLVHDNARPHVARVCRQFLEDEGIDTIDWPPRSPDLNPIEHLWDIMFRSIRRRQVDPQTVQELSDALVQIWEEIPQDTIRRLIRSMPRRCQACVQARGGHTNY
【0108】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 139の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 165の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)TAG(SEQ ID NO: 25)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)CTA(SEQ ID NO: 51)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 25の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 51の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 25の核酸配列を含む5’TRと、2)SEQ ID NO: 51の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、ATCATCAT(SEQ ID NO: 201)の核酸配列を含む5’TSDと、SEQ ID NO: 201の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 139の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 165の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 77のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 77のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 77(hAT-9_XTのトランスポザーゼ)
MPGKGRPPRRGTRGRAAMISCGPRKLPSFPKALTLNSQNAEEVVDWLTQHTPSSTVSNFATTSSSSSAMGTPRTTSSTTAAPSSLESEELFTHEFVELSDAQPLLPEEDEGDEDVTPDIIIQAGNTTEMDIRCDEVPAAAVFCELSEEIDASEENDDEEIDILWVPTRREQEEDSSDGETESQRGRRRIRLRRSRDSSQGTVGQQHESAPVVSQPTHPPTSTVTARKPTSKGSAVWHFFNVCASDKSAVICNECSQKLSLGKPNTHLGTTAMRRHMNAKHKALWEQHLKGSSQTLSHPPSAPASYCSTSAVLDPSQPPSTPPSTLTTSSCSSAPSQVSVRAMFERKKPMPPSHPLARRLTAGLSALLARQLLPYQLVDSEAFHQFVAIGTPQWKVPSRNFFSQKGIPHLYQHVQSQVTASLSFSVGAKVHMTTDTWSSKHGQGRYVTYTAHWVNLVMAGKQGMRGSTTVELVSPPRVACGSATTSTPPLLSNSSSKSSSNSSSNLASSSASSSSAAVSSSTPVHPQLHIGYSTCQVRRCHAVLGMTCLESRNHTGSALLSSLHSQADRWLTPHQLKIGKVVCDNGSNLLAALRLGNLTHVPCMAHVLNLIVQRFVSKYPGLQDILRQSRKVSGHFRRSYTAMARLADIQRRHNLPVRRLICDSQTRWNSTLMMFERLLQQQRAVNEYLFELGGRTGSAELGIFFPRYWVLMRDACRLMRPFDEVTNMVSRTEGTISDLIPFAFFLERAVRRVTDDAVDQRDQEHDFWAESPERSQAPAATQGEVSEVESEEEGGFVEAEDQQEQASRGACGHLLWSPGLVRGWGEETVVDEDVVLDNEEGEMDTSASNLVRMGSFMLSCLLKDPRIKRLKEKDLYWVATLLDPRYKHKVAEMLPTYHKSERMLHFQTSLQNMLYNAFKGDVTPHSRGRGAGNPPTSTPARTMHFGHSVTSDMQSFFSPRQRQDPSGSTLRERLDRQVADYLALTADIDTLRSDEPLDYWVRRLDLWPELSQFAINLLSCPASSVLSERTFSAAGGIVTEKRTRLGHKSVDYLTFIKMNEAWISEGYCTPEDLF
【0109】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 140の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 168の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CCGTATTTTCCGCACTATAAGGCGCACC(SEQ ID NO: 26)の核酸配列、その変異体又はそのフラグメントを含む5’TRt、2)GGTGCGCCTTATAGTGCGGAAAATACGG(SEQ ID NO: 52)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 26の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 52の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 26の核酸配列を含む5’TRと、2)SEQ ID NO: 52の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 140の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 168の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 78のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 78のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 78(Mariner-5_XTのトランスポザーゼ)
MAPKKRHAYEAQFKLQAASYAVVNGNRAAAKEFNINESMVRKWRKQENELRQVKKTKQSFRGNKARWPQLEDQLEQWVIEQRTAGRSVSTVTIRLKATTIAQDLEIEHFQGGPSWCFRFMKRRHLSIRARTTVAQQLPADYKEKMAIFRTYCSNKITDKKIQPNHITNMDEVPLTFDIPVNHTVEIKGTSTVSIRTTGHEKSAFTVVLSCHGNGQKLPPMVIFKRKTLPKEKFPAGVIVKANQKGWMDEEKMREWLREVYVKRPDGFFHTSPSLLICDSMRAHLTATVKKQVKQMNSELAIIPGGLTKELQPLDVGVNRAFKVKLRTAWERWMTDGEHTFTKTGKQRRASYATICEWIVDAWAKVSAITVVRAFAKTGIIAEQPPGNDTGNETDSDNDEREPGMFDGEIAQLFNSDTEDEDFDGFVGED
【0110】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 167の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 179の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CCGTATTTTCTC(SEQ ID NO: 79)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)GAGAAAATACGG(SEQ ID NO: 91)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 79の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 91の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 79の核酸配列を含む5’TRと、2)SEQ ID NO: 91の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 167の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 179の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 103のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 103のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 103(Mariner-6_AMiのトランスポザーゼ)
MPKRKSYTFDFKLSVIDYAKKHGNRAAGREFSVDEKSVREWRKEEDILKTLNPRKRARRGKHCKWPTLEANLKEWVVAQRESNKVVSTIAIRQKARVMANEMKITDFGGGCNWVHKFMHRNNLAVRSRTTVGQKLPDDWEEKLTKFRDFVRKECRVHNLCPADIINMDEVPISFDVPATRTVDQRGKKTIAISTTGHERTNFTVVLACTASGVKLKPMVIFKRVTMPREKIPNGVAVICNKKGWMNEDIMKEWTERCFRTRQGGFFAPKSLLIFDAMAAHKHSSVQKQINKAGAHIAVIPGGLTCKLQPLDISVNHSFKCFMRKEWEKWMSQGVHSFTPSGKQRRATYTEVCNWIVAAWRAVKPSSIINGFFKAGILDGASGEESDYTDSEDYADELDDAAFVDAYFGESSYDTDFEGFPASEKEEAPNWV
【0111】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 168の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 180の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CCCTTT(SEQ ID NO: 80)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)AAAGGG(SEQ ID NO: 92)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 80の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 92の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 80の核酸配列を含む5’TRと、2)SEQ ID NO: 92の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はTTAA(SEQ ID NO: 202)の核酸配列を含む5’TSDと、SEQ ID NO: 202の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 168の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 180の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 104のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 104のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 104(piggyBac-2_XTのトランスポザーゼ)
MAKRFYSAEEAAAHCMASSSEEFSGSDSEYVPPASESDSSTEESWCSSSTVSALEEPMEVDEDVDDLEDQEAGDRADAAAGGEPAWGPPCNFPPEIPPFTTVPGVKVDTSNFEPINFFQLFMTEAILQDMVLYTNVYAEQYLTQNPLPRYARAHAWHPTDIAEMKRFVGLTLAMGLIKANSLESYWDTTTVLSIPVFSATMSRNRYQLLLRFLHFNNNATAVPPDQPGHDRLHKLRPLIDSLSERFAAVYTPCQNICIDESLLLFKGRLQFRQYIPSKRARYGIKFYKLCESSSGYTSYFLIYEGKDSKLDPPGCPPDLTVSGKIVWELISPLLGQGFHLYVDNFYSSIPLFTALYCLDTPACGTINRNRKGLPRALLDKKLNRGETYALRKNELLAIKFFDKKNVFMLTSIHDESVIREQRVGRPPKNKPLCSKEYSKYMGGVDRTDQLQHYYNATRKTRAWYKKVGIYLIQMALRNSYIVYKAAVPGPKLSYYKYQLQILPALLFGGVEEQTVPEMPPSDNVARLIGKHFIDTLPPTPGKQRPQKGCKVCRKRGIRRDTRYYCPKCPRNPGLCFKPCFEIYHTQLHY
【0112】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 169の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 181の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CCTTCATACG TTCCCATG(SEQ ID NO: 81)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)CATGAGAACG GATGAGGG(SEQ ID NO: 93)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 81の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 93の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 81の核酸配列を含む5’TRと、2)SEQ ID NO: 93の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 202の核酸配列を含む5’TSDと、SEQ ID NO: 202の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 169の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 181の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 105のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 105のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 105(piggyBac-1_AMiのトランスポザーゼ)
MRRQRIFSAEACLAQVTGDDSDTSTDEILSQGSEDADFVPDMGDCSEQEDHASTEASSSSDEEELVPQAEVMPTLPVGKGRGPARGRRGRPRRATAGRGAEPLPPPPENIADDDTFRGRNGRVWGKSPQLIHHRRTAKDIVHESAGPTRESNKDTVVETFHLFLSQDILTVIIRETNREAERRFREWNDSHPENRKEWKKLDETELKAYIGLLLLSGLYHGGHEALEELWEQRTGRPCFRATMSLKRFRQITNYLRFDNKLTREERRAVDKLAAFRDIWTQFVEQLRKWYIPGIHLTVDEQLIAFRGRCPFRQYMPSKPAKYGLKIWWCCDAATSFPLSGDIYLGKQPEAPRQGNLGTQVIEKLVHPWYKTGRNIVGDNFFTSTDLAERLLQQDLTYVGTIRKNKADIPNEMQANRRRETFSSIFAFDGELTLVSYVPKKSKVVLLLSSMHHDLSVGGEQRKPDIIHDYNKNKGGVDNLDHLVRMTTCRRKINRWPMTLFFNMLDVAAIASLIIWLGHNANWKQRSHLRRRRFFLQELGEQLIDGQIKRRMMDTRNLSKSVKSGMTALNYKLPQRTPVEPSASMSGRCAFCPRTDDRKTRKRCEDCKRFACVHHSTSLLLCEECNI
【0113】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 170の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 182の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CAGTAGAACC CCG(SEQ ID NO: 82)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)CGGGGTTCTACTG(SEQ ID NO: 94)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 82の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 94の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 82の核酸配列を含む5’TRと、2)SEQ ID NO: 94の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 170の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 182の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 106のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 106のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 106(Mariner-3_Crpのトランスポザーゼ)
MRRPSQMELRAAWVPKQDSGFSLSVAIVFKMSASNTDSTSASASTRKRKAITLEEKLEVVKRYERGEKTKEIRCATGLSESTLRTIRDNAEKIKESCKSATRLSTARVSLTRSAIMEKMERMLTTWIEHQNQEHVPLSTQVIQAKARSIYEVLKRDDPEAKPFNASAGWFDRFKARHGFHNLKLTGEAAAADKSAADKFPSILQAAIEEGSYDPRQVFNLDETGLFWKRMPSRTFISVEERTAPGFKAAKDRCTLLLGANAAGDFKLKPLMVYHAENPRALKGYAKGHLPVYWRANRKGWVTGSLFEDYFSSLLHLELRAYCDRQNLPFKILLLLDNAPGHPPSLGDLSENIKVLFLPPNTTSLIQPMDQGVIRAFKSYYLRRTFKKLINETESKEKANVKEFWKAFNIKMAIDIIGDAWNDVTQQCLNGVWKNIWPAVVNDFRGFAADEFISDARHEIVEMAKSVGFEQVDEENVAELLDSHREELSNEDLLELDRERHEEEEPMEENERPSPRVLTMKGMADAFKLLDGYLAFFDENDPNRERSAKVARLMKEANACYTELYREKRRCSVQSSLDKFFRKRDSTISTQSTDSQPSTSGGEPATSGGEISPPSFDVFDLDEDSAPH
【0114】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 171の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 183の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CAGTGGTTCT TAACCT(SEQ ID NO: 83)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)AGGTTAAGAA CCACTG(SEQ ID NO: 95)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 83の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 95の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 83の核酸配列を含む5’TRと、2)SEQ ID NO: 95の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はCTCTAGAG(SEQ ID NO: 203)の核酸配列を含む5’TSDと、SEQ ID NO: 203の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 171の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 183の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 107のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 107のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 107(hAT-1_PMのトランスポザーゼ)
MSGKRRKWSDEYVQHGFSCITERDGSERPICMICNAKLSNSSLAPAKLKEHFLKLHGDGEYKNTTLAEFRVKRARFDERATLPALGFVPVNKPILTASYEVAYLIAKQGKPHTIGETLVKPAALKMANLILGTAAEGKLSQIPLSNDTVSDRIEDMSKDILAQVVADLISSPAKFSLQLDETTDVSDLSQLAVFVRYVKDDMIKEEFLFCKPLTTTTKAADVKKLVDDFFRDNNLSWDMVSAVCTDGAPVMLGRKSGFGALVKADAPHIIVTHCILHRHALATKTLPPKMAEVLKTVVECVNYVRKSALRHRIFSELCKEMGSEFEVLLLHSNIRWLSRGQVLNRVFAMRVELALFLQEHQHCHADCFKNPEFILILAYMADIFAALNHLNQQMQGGGVNIMEAEEHLKAFQKKLPLWKRRTENNNFANFPLLDDCASKIEDVSGIGDISVSTELKQTIATHLDELAKSLDGYFPTRESYPAWVRQPFTFAVETADVNDEFLDEIIEIQQSQVQQQLFRTTTLSTFWCRQMNKYPVIAKKALDFFIPFVTTYLCEQSFSRMLDIKTKKRNRLCCENDMRVALAKVKPRISELISQRQQQKSH
【0115】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 172の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 184の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)TAGGGCTGTG CGAAA(SEQ ID NO: 84) の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)TTTCGCACAG CCCTA(SEQ ID NO: 96)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 84の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 96の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 84の核酸配列を含む5’TRと、2)SEQ ID NO: 96の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 196の核酸配列を含む5’TSDと、SEQ ID NO: 96の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 172の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 184の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 108のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 108のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 108(hAT-17_Crocのトランスポザーゼ)
MTVSSTPISLPMLSLPVPEEELELDLDLSAIAREILGKEGESSEFVLHTPQVSPRARSPSPEGTSEEAEVEVAEASGSAESAPPVAVPLPAEEGEKAASAHAPAPQKRAGSVVWDHFELADDPTYAICLHCRAKTSRGKGTKHMSTTGMLMHLRRHHPLALAPPQPGTSGSVPKGKSPSRSKAPVPPKQRQATLEQWGKGGQKGGRVARASEITQSIGEMLAVDGQPFSLVERPGFRRLMALVAPSYQVPARTTFSRTVVPSLYEACREYLREELRKAGPQVALHFTSDIWSSRGGDHAYLSLTGHWCDQSGRRWALLQAEVMDESHTATEIMGAMNRLVQGWLVGQGELTRGFMVTDNGANMVKAVRDANFVGIRCVAHKFHLIVRDALEGDRAAGDGASTTSKLISKCRKVAGYFHRSIKGGKMLRDKQAELNIPQHKIMQDVETRWNSTYLMLERLVEQQKAIHEMALLGEIGISGPLNRAEWDTISQILVVLKPFLEATETLSAGDALLSQVIPVVRELQSQMESFQGINVPGWGKPLSPDVQALVRRLKEGIRKRLDPLRSSTVHVLAATCDPRVKGSVCGSQSLNQWTEVLVKRVREAERRRRGDVEEGDPLSRASTPSTSQSPPPPQALPMWAKGMASMVGSRGTRPHHQAGSAQALVAAYLAEDVEPLLCDPLAYWASRSQMWPDLATVAREHLSCPPTSVPSERVFSIAGDVVTPHRTSLDPGLVEQLVFLKVNLPLLGFPKLQVQTE
【0116】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 173の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 185の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CAGGTTGAG(SEQ ID NO: 85)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)CTCAACCTG(SEQ ID NO: 97)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 85の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 97の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 85の核酸配列を含む5’TRと、2)SEQ ID NO: 97の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDとをさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 173の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 185の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 109のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 109のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 109(Tigger4のトランスポザーゼ)
MSKRPADTPMGNSDKKKRKHLCLSIAQKVKLLEKLDSGVSVKRLTEEYGVGMTTIYDLKKQKDKLLKFYAESDEQKLMKNRKTLHKAKNEDLDRVLKEWIRQRRSEHMPLNGMLIMKQAKIYHDELKIEGNCEYSTGWLQKFKKRHGIKFLKICGDKASADHEAAEKFIDEFAKVIADENLTPEQVYNADETSLFWRYCPRKTLTTADETAPTGIKDAKDRITVLGCANAAGTHKCKLAVIGKSLRPRCFQGVNFLPVHYYANKKAWITRDIFSDWFHKHFVPAARAHCREAGLDDDCKILLFLDNCSAHPPAEILIKNNVYAMYFPPNVTSLIQPCDQGILRSMKSKYKNTFLNSMLAAVNRGVGVEGFQKEFSMKDAIYAVANAWNTVTKDTVVHAWHNLWPATMFSDDDEQGGDFEGFRMSSEKKMMSDLLTYAKNIPSESVSKLEEVDIEEVFNIDNEAPVVHSLTDGEIAEMVLNQGDRDNSDDEDDVVNTAEKVPIDDMVKMCDGLIEGLEQRAFITEQEIMSVYKIKERLLRQKPLLMRQMTLEETF
【0117】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 173の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 185の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)CAGTAGTCCC CCCTTATCCG CGG(SEQ ID NO : 86)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)CCGCGGATAA GGGGGGACTA CTG(SEQ ID NO: 98)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 86の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 98の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 86の核酸配列を含む5’TRと、;和2)SEQ ID NO: 98の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDとをさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 173の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 185の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 110のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 110のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 110(Tigger7のトランスポザーゼ)
MAPKRKSSDAGNSDMPKRSRKVLPLSEKVKVLDLIRKEKKSYAEVAKIYGKNESSIREIVKKEKEIRASFAVAPQTAKVTATVRDKCLVKMEKALNLWVEDMNRKRVPIDGNVLRQKALSLYEDFSKGSPETSDTKPFTASKGWLHRFRNRFGLKNIKITGEAASANEEAAATFPAELKKLIKEKGYHPKQVFNCDETGLFWKKMPNRTYIHKSAKEAPGHKTWKDRLTLVLCGNAAGHMIKPGVVYRAKNPRALKNKNKNYLPVFWQHNQKAWVTAILFMEWFHQCFIPEVKKYLEEEGLEFKVLLIIDNAPGHPESVCYENENVEVVFLPPNTTSLLQPLDQGIIRFVKATYTRLVFDRIRSAIDADPNLDIMQCWKSFTIADAITFIKAAMDELKPETVNACWKNLWSEVVNDFKGFPGIDGEVRKIIHAARQVGGEGFADMLDEEVEEHIEGHREVLTNEELEELVESSTEEEEDEEETEAEPAMWTLPKFAEVFRIAQTLKDKIMEYDPRMERSIKVTRMITEGLQPLQQHFDELKRKRQQLPITMFFQKISAKNLQLSRIPNHRHRLLLTSNHRHRHGSMIQDHPKQMILLLTYRQKVNSSLTLRHNAYVIHLTSSHHVGIVSSHIITRRRVSTVQ
【0118】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 175の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 187の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)TAGGG(SEQ ID NO: 87)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)CCCTA(SEQ ID NO: 99)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 87の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 99の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 87の核酸配列を含む5’TRと、2)SEQ ID NO: 99の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はTTTATAAT(SEQ ID NO: 204)の核酸配列を含む5’TSDと、SEQ ID NO: 204の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 175の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 187の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 111のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 111のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 111(hAT-19_Crpのトランスポザーゼ)
MNAKKSSKTAKYVSALDRARQYPAGTLHADGGRLFCTSCNVTLDVSRKTSIDRHLESEAHMKRKAAAEAEGQSKKQATVSSLFKRTTESSLARREAAFSLVEAFAAANIPLEKLDHPKLRDYLNQNVPNAGSFPRANKLRQDYLPAVIASHVQSTKAALAEYHSFSIVADEATDPQDNYVLHILFVPGSWTDRDLPVFQTEPVHLTSVNFSTVSQAIVKVIVSYGVDFNKISAFLSDNAMYMCKAFSDVLQGMLPNAVHVTCNAHILSLVSDIWRTQFPEVDSLVSSFKKAFKHCPGRKVRYRESVASQSGDSHGTVPLPPEPVLTRWNSWFNAVRYHAKHMQHYQQFVSEELEITPSTQCMLKLRDLLGRGDIQDQVTFVADNATRFMELLTWFEGRQAVIHHAHNKLMDLISWVEDRASQELSSCPRENQRRRDLFQAIAVKLNQYYRYDPSLPPRFRQPAAPFLSAVRILDPNQVPLLSCDPQLLKAIPGWGKEHDNERAAYVNFVKECQMPVPVPVFWDSVCDRFPHLYALARRCLTIPTNSVDAERAISVYGQVFTPQRQRMSPATAAGCSMLAFNT
【0119】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 176の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 188の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)TAGG(SEQ ID NO: 88)の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)CCTA(SEQ ID NO: 100)の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 88の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 100の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 88の核酸配列を含む5’TRと、2)SEQ ID NO: 100の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はCTATATAG(SEQ ID NO: 205)の核酸配列を含む5’TSDと、SEQ ID NO: 205の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 176の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 188の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 112のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 112のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 112(hAT-17B_Crocのトランスポザーゼ)
MTVSSTPISSPSVSLPVPEEELDLEAGDLSALAKEILGTEGESEFVLHTPQSSPRARSPSPEGTSEEVEVVEASGSAESAPPVVVPLPAEEGDKAGSPPSTQKRGGSVVWDHFEVADDPKYAICQHCRRQISRGKEVKHFTTTAMLLHLRRQHPLALAPPQPGTSGSVPKGKSPSRSKAPVPTKQRQATLERWGKAADKGGRVARASEVTQSIGEMLALDGQPFSLVERPGFRRLMALVAPSYQVPARTTFSRTVVPSLYEACREYLREELRKAGPQVALHFTSDIWSSRGGDHAYLSLTGHWCDQSGRRWALLQAEVMDESHTAREIMVAMNRMVQGWLVGQGELTRGFMVTDNGANMVKAVRDANFVGIRCVAHKLHLIVRDALEGDRAAGDGAVTTTQLISKCRKVAGYFHRSIKGGKMLRDKQAELSVPQHKIMQDVETRWNSTYLMLERLVEQQKAIHEMALLGEIGISGPLNKAEWDTISQILVVLKPFLEATETLSAGDALLSQVIPVVRELENQMEKFQGIDVPGWGKPLSPEVQALVKRLKEGIKKWLDPLRSSTVHVLAGMCDPRVKGSMCTGSTKTLDHWTEVLVNRVREAEGQRRGDVEEGDPLSRASTPSTSQSPPRQPLPMWAKGMASMLGSRRTRPQPRAGSAEASVATYLAEDVEPLDCDPLAYWATRSQMWQDLATVAREHLSCPPTSVPSERVFSIAGDVVTPHRTSLDPGLVEQLVFLKVNLPLLGFPELHLQTE
【0120】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 177の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 189の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 89の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 101の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 89の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 101の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 89の核酸配列を含む5’TRと、2)SEQ ID NO: 101の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はATTAATAG(SEQ ID NO: 206)の核酸配列を含む5’TSDと、SEQ ID NO: 206の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 177の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 189の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 113のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 113のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 113(hAT-10_XTのトランスポザーゼ)
MTGRGRGRKGGMGGKGGEGGRKGGVGGEGGRKGGVGGEGGVGGKGGLGGRSRGAGCGQEPSTRAMPSLGNIGQQPQQQSQQQQQQLQQQQVAGRSGATGSRKTLPDFFATTSRPIQSQQAEAVMDWLTQATSSAADSSEQQEVASPASSVIRGMLSPLLFDPEVDFSPDTQDLFDDQTGMGGAFLSDEEEVYVAQHTTSAVGDVGQGPLMAGQQADEPDVDVDAGSDLGEDVEDDGDRSWVPAQEDNSSSSEGELCVVVSDADEEPAPKKQKTPPTTARGGRQQGSTAPGSTGSGRMGRDLQPSGPQPSTAGKVVARTSAVWAFFTCQSQDPSVAVCHLCRQKVRRGQTGSHMGTSALSSHMKRHHRMTWEQHQSGRAPGGSGASCPPPPIPQGTGASSPIPVAREEDSEAHSWRRPLCSSASSAAPSVSSSSLLPSAQPLSRQVSLPQFLGRKAPLSSSHPQVQRLNACLAKLLAVQLLPYQLVDAAPFRQLMACAAPNWRIPSRHYFARKAVPALHQQVVDNVSLSLDYAVGGRVHCTTDTWTSRHGQGRYISYTAHWVTLMSAGEGAGSRTPLRLEVPPRGVKGKPHTATSSSSSSTMDEPPLKRPRSYASVQYKRCQAVLQLLCLGERSHTAPELHAAFQTQVQRWFTPRQLQAGNVVCDNGRNLLAALHLGRLTHVPCFAHVLNLVVQHFLKSYTGLGVVLEKARRVCGHFRRSPTASASLSRMQRQHSLPPHRLICDLPTRWNSTLHMVERLVEQRWAVSNYLLEHSARGTQGANLGYFSTEQWQQMRQLCRVLAPFEQATRFVSRDNACVSDIIPLVFLLKRTLDGLLEEGDVPEEEECRPRRQVEGAARHDEEDMPNEEDEGEEDWVPAEQGEQGPRHPTTPAVVRGWEDTEQGEEAGDDLLHLQGSQEEVGRGHLFYMAAHMQTCLRSDSRICAIKDREDYWVATMIDPRYKEKMAQFLVPSQRERRVGQLKRALCAKLMEAFPQPDTQASTTPHIQQRQESSSSSSSAARGGGNLMDVWRSFFEPRQAAAGLVSTQSHHQQRLDNMVADYMGSVSVQDAMHTDDDPMNFWVSRLDQWPELAQYALEVLACPPASVLSERVFSAAGGVVTEKRTRLSTGSVDRLSFIKMNEAWISGDIHVPIADIRD
【0121】
いくつかの実施形態では、上記転移因子は以下を含む:1)LTFの5’TRであって、上記LTFはSEQ ID NO: 178の核酸配列を含む。2)RTFの3’TRであって、上記RTFはSEQ ID NO: 190の核酸配列を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 90の核酸配列、その変異体又はそのフラグメントを含む5’TRと、2)SEQ ID NO: 102の核酸配列、その変異体又はそのフラグメントを含む3’TRと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 90の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する5’TRと、2)SEQ ID NO: 102の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有する核酸配列を有する3’TRvと、を含む。いくつかの実施形態では、上記転移因子は、1)SEQ ID NO: 90の核酸配列を含む5’TRと、2)SEQ ID NO: 102の核酸配列を含む3’TRと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 193の核酸配列を含む5’TSDと、SEQ ID NO: 193の核酸配列を含む3’TSDと、をさらに含む。いくつかの実施形態では、上記転移因子は5’TSD及び/又は3’TSDを含まない。いくつかの実施形態では、上記転移因子は、SEQ ID NO: 178の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むLTFと、2)SEQ ID NO: 190の核酸配列と少なくとも約90%(例えば、少なくとも約91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の何れか)の配列同一性を有する核酸配列を含むRTFと、を含む。いくつかの実施形態では、上記転移因子はSEQ ID NO: 114のアミノ酸配列又はその変異体を含むトランスポザーゼに関連する。いくつかの実施形態では、トランスポザーゼはSEQ ID NO: 114のアミノ酸配列と少なくとも約80%(例えば、少なくとも約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上のいずれか)の配列同一性を有するアミノ酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、上記転移因子はトランスポザーゼをコードする核酸配列を含まない。
SEQ ID NO: 90(MARWOLEN1の5'TR)
TACAGTGGCGAGCAAAACTGAGTGCATGTTCACAACTCTCACTTTGGCCATCAATAAAAACACAACCGCTTATGCAAATTCAATAATTTTTTTTATATTATTAATCTTAATTAATTTATAACTTATTTTATGAGAAAAAACAAATTTAGCATATATATTCAAAGACTTAGAATAAAAAAACTAAATAAACTCACATAAACTCAATTTTGCACGTTT

SEQ ID NO: 102(MARWOLEN1の3'TR)
AAACGTGCAAAATTGAGTTTATGTGAGTTTATTTAGTTTTTTTATTCTAAGTCTTTGAATATATATGCTAAATTTGTTTTTTCTCATAAAATAAGTTATAAATTAATTAAGATTAATAATATAAAAAAAATTATTGAATTTGCATAAGCGGTTGTGTTTTTATTGATGGCCAAAGTGAGAGTTGTGAACATGCACTCAGTTTTGCTCGCCACTGTA

SEQ ID NO: 114(MARWOLEN1のトランスポザーゼ)
MRKLSGEIQNNIVSLTESGNSTRQIAERLGISQSAVVSIQKRRKLTPKPQVSGRKKLLKDSDARLMMSEMRKNKNLTPKGACLAINKNVSEWTARRALQDIGYMSIVKKNKPALSDKNVKARLKFAKDHKNWTIDDWKRVVWSDESKFNRFQSDGKQYCWIRPGDRVQRHHVKQTVKHGGGNIMVWGCFTWWHIGPLQLVEGIMKKEDYLRILQTNLPNYFDKCAYPEKDIIFQQDGDPKHTAKIVKEWIGKQHFQLMEWPAQSPDLNPIENLWSIVKRRLGQYDSAPKNMGDLWERVAVEWSRIPQDILRNLVESMPKRVTEVIVNKGLWTKY
【0122】
異種核酸
本明細書に記載された操作された転移因子は、種々の異種核酸の転移に適している。いくつかの実施形態では、上記異種核酸はDNAである。いくつかの実施形態では、上記異種核酸は二本鎖である。いくつかの実施形態では、上記異種核酸は、1つ又は複数の修飾ヌクレオチドを含む。いくつかの実施形態では、上記異種核酸は修飾されていない。
【0123】
転移因子中の異種核酸は、種々の適切な長さを有し得る。いくつかの実施形態では、上記異種核酸の長さは、少なくとも約1kb、2kb、10kb、20kb、30kb、40kb、50kb、60kb、70kb、80kb、90kb、100kb、150kb、200kb、250kb、300kb、350kb、400kb、450kb、500kb、600kb、700kb、800kb、900kb、1000kb又はそれ以上のいずれかである。いくつかの実施形態では、上記異種核酸の長さは、1000kb、900kb、800kb、700kb、600kb、500kb、450kb、400kb、350kb、300kb、250kb、200kb、150kb、100kb、90kb、80kb、70kb、60kb、50kb、40kb、30kb、20kb、10kb、5kb、2kb又は1kbのいずれかを超えない。いくつかの実施形態では、上記異種核酸の長さは、約100bpから約1kb、約1kbから約2kb、約2kbから約5kb、約5kbから約10kb、約100bpから約5kb、約100bpから約2kb、約2kbから約10kb、約1kbから約10kb、約10kbから約20kb、約20kbから約50kb、約50kbから約100kb、約1kbから約100kb、約150kbから約200kb、約200kbから約300kb、約300kbから約400kb、約400kbから約500kb、約500kbから約600kb、約600kbから約700kb、約700kbから約80kb、約800kbから約900kb、約900kbから約1000kb、約10kbから約100kb、約100kbから約500kb、約500kbから約1000kb、或約10kbから約500kbである。いくつかの実施形態では、上記異種核酸の長さは、約10kbから約300kbヌクレオチドである。いくつかの実施形態では、上記異種核酸の長さは、約100bpから約300kbヌクレオチドである。
【0124】
異種核酸は、1、2、3、4、5、6、10又はそれ以上のいずれかのコード配列を含む1つ又は複数のコード配列を含んでもよい。本願では、任意の適切なコード配列を使用してもよく、コード配列は任意の適切な目的生物産物をコードすることができる。いくつかの実施形態では、上記コード配列は、RNA分子をコードする。いくつかの実施形態では、上記コード配列は、タンパク質などのポリペプチドをコードする。いくつかの実施形態では、上記異種核酸は、第1タンパク質をコードする第1コード配列と、第2タンパク質をコードする第2コード配列とを含む。いくつかの実施形態では、上記異種核酸は、第1RNAをコードする第1コード配列と、第2RNAをコードする第2コード配列とを含む。いくつかの実施形態では、上記異種核酸は、タンパク質をコードする第1コード配列と、RNAをコードする第2コード配列とを含む。
【0125】
いくつかの実施形態では、上記コード配列は、治療的タンパク質をコードする。いくつかの実施形態では、上記コード配列は、モノクローナル抗体、多特異性抗体、及び抗体フラグメントを含む治療的抗体をコードする。いくつかの実施形態では、上記コード配列はサイトカインをコードする。いくつかの実施形態では、上記コード配列は抗原をコードする。いくつかの実施形態では、上記コード配列は、遺伝子治療に有用な治療薬をコードする。遺伝子治療に有用な例示的な治療的タンパク質は、アデノシンデアミナーゼ、リソソーム蓄積症で影響を受ける酵素、アポリポタンパク質E、脳由来神経栄養因子(BDNF)、骨形態形成タンパク質2(BMP-2)、骨形態形成タンパク質6(BMP-6)、骨形態形成タンパク質7(BMP-7)、心筋栄養因子1(CT-1)、CD22、CD40、毛様体栄養因子(CNTF)、CCL1-CCL28、CXCL1-CXCL17、CXCL1、CXCL2、CX3CL1、血管内皮細胞増殖因子(VEGF)、ドーパミン、エリスロポエチン、因子IX、因子VIII、上皮成長因子(EGF)、エストロゲン、FAS-リガンド、線維芽細胞増殖因子1(FGF-1)、線維芽細胞増殖因子2(FGF-2)、線維芽細胞増殖因子4(FGF-4)、線維芽細胞増殖因子5(FGF-5)、線維芽細胞増殖因子6(FGF-6)、線維芽細胞増殖因子7(FGF-7)、線維芽細胞増殖因子10(FGF-10)、Flt-3、顆粒球コロニー刺激因子(G-CSF)、顆粒球マクロファージ刺激因子(GM-CSF)、成長ホルモン、肝臓細胞増殖因子(HGF)、インターフェロンα(IFN-a)、インターフェロンβ(IFN-b)、インターフェロンγ(IFNg)、インスリン、グルカゴン、インスリン様増殖因子1(IGF-1)、インスリン様増殖因子2(IGF-2)、インターロイキン1(IL-1)、インターロイキン2(IL-2)、インターロイキン3(IL-3)、インターロイキン4(IL-4)、インターロイキン 5(IL-5)、インターロイキン6(IL-6)、インターロイキン7(IL-7)、インターロイキン8(IL-8)、インターロイキン9(IL-9)、インターロイキン10(IL-10)、インターロイキン11(IL-11)、インターロイキン12(IL-12)、インターロイキン13(IL-13)、インターロイキン15(IL-15)、インターロイキン17(IL-17)、インターロイキン19(IL-19)、マクロファージコロニー刺激因子(M-CSF)、単球走化タンパク質1(MCP-1)、マクロファージ炎症性タンパク質3a(MIP-3a)、マクロファージ炎症タンパク質3b(MIP-3b)、神経成長因子(NGF)、神経栄養因子3(NT-3)、神経栄養因子4(NT-4)、副甲状腺ホルモン、血小板由来成長因子AA(PDGF-AA)、血小板由来成長因子AB(PDGF-AB)、血小板由来成長因子BB(PDGF-BB)、血小板由来成長因子CC(PDGF-CC)、血小板由来成長因子DD(PDGF-DD)、RANTES、幹細胞因子(SCF)、ストローマ細胞由来成長因子1(SDF-1)、形質転換成長因子α(TGF-a)、形質転換成長因子β(TGF-b)、腫瘍壊死因子α(TNF-a)、Wnt1、Wnt2、Wnt2b/13、Wnt3、Wnt3a、Wnt4、Wnt5a、Wnt5b、Wnt6、Wnt7a、Wnt7b、Wnt7c、Wnt8、Wnt8a、Wnt8b、Wnt8c、Wnt10a、Wnt10b、Wnt11、Wnt14、Wnt15又はWnt16、ソニック・ヘッジホッグ、デザートヘッジホッグ、及びインディアンヘッジホッグを含むが、これらに限定されない。
【0126】
いくつかの実施形態では、上記コード配列は、キメラ抗原受容体(CAR)又は操作されたT細胞受容体(TCR)のような操作された受容体をコードする。
【0127】
本明細書で使用される場合、「キメラ抗原受容体」又は「CAR」は、1つ又は複数の抗原をT細胞などの細胞に特異的に移植する操作された受容体を意味する。CARは「人工T細胞受容体」、「キメラT細胞受容体」や「キメラ免疫受容体」とも呼ばれる。いくつかの実施形態では、CARは、腫瘍抗原に特異的な抗体の細胞外可変ドメインと、T細胞又は他の受容体の細胞内シグナル伝達ドメイン、例えば1つ又は複数の共刺激ドメインと、を含む。「CAR-T」とはCARを発現するT細胞のことである。
【0128】
いくつかの特定実施形態では、上記コード配列は、キメラ抗原受容体(CAR)をコードする。多くのキメラ抗原受容体は当業者に知られており、本願に適用することができる。また、例えば抗体分子の抗原結合フラグメントや抗体可変ドメインを利用することにより、いかなる細胞表面マーカーに対しても特異性を有するCARを構築することができる。本明細書では、CARを生成する任意の方法を使用することができる。例えば、US6,410,319、US7,446、191、US7,514,537、US9765342B2、WO 2002/077029、WO2015/142675、US2010/065818、US 2010/025177、US 2007/059298及びBerger C. et al., J. Clinical Investigation 118: 1 294-308 (2008)を参照し、これらは参照によって本明細書に組み込まれる。
【0129】
本明細書で使用される場合、「T細胞受容体」又は「TCR」は、MHC分子に結合した特定の抗原ペプチドに結合する細胞外抗原結合ドメインを含む内因性又は組換えT細胞受容体を意味する。いくつかの実施形態では、TCRは、TCRαポリペプチド鎖及びTCRβポリペプチド鎖を含む。いくつかの実施形態では、TCRは腫瘍抗原に特異的に結合する。「TCR-T」とは、組換えTCRを発現するT細胞を指す。「組換え体」という用語は、(1)天然に存在する環境から除去された、(2)自然界にその遺伝子が発見されたポリヌクレオチドの全部又は一部と関連しない、(3)自然界に関連しないポリヌクレオチドに作動可能に連結されている、又は(4)自然に存在しない、遺伝子又はタンパク質などの生体分子を指す。「組換え体」という用語は、クローニングされたDNA単離体、化学的に合成されたポリヌクレオチド類似体、又は異種系統によって生合成されたポリヌクレオチド類似体、及びそのような核酸によってコードされるタンパク質及び/又はmRNAを指すために使用され得る。
【0130】
いくつかの特定実施形態では、上記コード配列は、操作されたT細胞受容体(TCR)をコードする。いくつかの実施形態では、操作されたに改変されたTCRは、腫瘍抗原に対して特異的である。 いくつかの実施形態では、腫瘍抗原は、腫瘍細胞の細胞内タンパク質に由来する。腫瘍抗原(腫瘍関連抗原を含む)に特異的な多くのTCRが記載されており、例えば、NY-ESO-1癌-精巣抗原、p53腫瘍阻害抗原、メラノーマにおける腫瘍抗原のTCR(例えば、MARTI、gp100)、白血病(例えば、WT1、マイナー組織適合抗原)、及び乳癌(例えば、HER2、NY-BR1)を含む。当分野で知られている任意のTCRを本願に使用することができる。いくつかの実施形態では、TCRは腫瘍抗原に対して増強された親和性を有する。例示的なTCR及びTCRを製造する方法は、例えばUS5830755及びKessels et al.Immunotherapy through TCR gene transfer. Nat. Immunol. 2, 957-961 (2001)に記載されている。
【0131】
いくつかの実施形態では、上記コード配列は選択マーカーをコードする。「選択マーカー」は、検出可能な表現型を生成するように発現し、標的核酸(例えば、ゲノムDNA)に挿入された選択マーカーをコードする異種核酸を有する宿主細胞の検出を容易にする遺伝子である。いくつかの実施形態では、選択マーカーは、ピューロマイシンなどの抗生物質に対する耐性を与える。選択マーカーの他の非限定的な例としては、薬剤耐性遺伝子及び栄養マーカーが含まれる。例えば、選択マーカーは、アンピシリン、カナマイシン、エリスロマイシン、クロラムフェニコール、ゲンタマイシン、カスガマイシン、リファンピシン、スペクチノマイシン、D-サイクロセリン、ナリジキシン酸、ストレプトマイシン、テトラサイクリンからなる群から選択される抗生物質耐性を付与する遺伝子であってもよい。選択マーカーの他の非限定的な例としては、アデノシルデアミナーゼ、アミノグリコシドホスホトランスフェラーゼ、ジヒドロ葉酸還元酵素、ハイグロマイシン-B-ホスホトランスフェラーゼ、チミジンキナーゼ、及びキサンチン-グアニンホスホリボシルトランスフェラーゼが含まれる。哺乳類細胞に適した選択マーカーの例としては、DHFR、チミジンキナーゼ、メタロチオネイン-I及び-II、好ましくは霊長類メタロチオネイン遺伝子、アデノシンデアミナーゼ、オルニチンデカルボキシラーゼなどが含まれる。いくつかの特定実施形態では、上記異種核酸は、ピューロマイシン耐性遺伝子のコード配列を含む。
【0132】
いくつかの実施形態では、上記コード配列はレポーター遺伝子である。「レポーター遺伝子」は、検出可能な産物をコードする遺伝子であるため、レポーター遺伝子産物の検出は、標的核酸の機能の評価に利用することができる。レポーター遺伝子は、任意の適切な標的核酸(例えば、プロモータ、標的遺伝子、選択マーカー、及び/又は転移因子の末端反復)と融合して、標的核酸が所与の条件下で発現又は変化した(例えば、トランスポザーゼによって切断された)か否かを検出することを可能にすることができる。レポーター遺伝子の非限定的な例としては、3-ガラクトシダーゼ、3-グルクロニダーゼ、グルタチオン-S-トランスフェラーゼ(GST)、ワサビペルオキシダーゼ(HRP)、ルシフェラーゼ、クロラムフェニコールアセチルトランスフェラーゼ(CAT)、分泌型アルカリホスファターゼ(SEAP)、緑色蛍光タンパク質(GFP、例えばeGFP)、赤色蛍光タンパク質(RFP)、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)、カテコール2,3-オキシゲナーゼ(xylE)、及びブルー蛍光タンパク質(BFP)を含む自家蛍光タンパク質が含まれる。いくつかの実施形態では、上記異種核酸は、増強型緑色蛍光タンパク質(eGFP)をコードするコード配列を含む。 いくつかの実施形態では、上記コード配列は、複数の生物産物をコードするか、又は、融合タンパク質をコードすることができる。いくつかの実施形態では、本願の異種核酸は、ピューロマイシン耐性増強型緑色蛍光タンパク質(eGFP)融合タンパク質をコードするコード配列を含む。
【0133】
いくつかの実施形態では、上記コード配列はトランスポザーゼをコードする。
【0134】
いくつかの実施形態では、上記コード配列は、ゲノム編集に有用なポリペプチドをコードする。ゲノム編集は、ゲノム中の所望の位置に特定の二本鎖切断(DSB)を生成し、細胞の内在性機構を利用して、相同指向性修復(HDR)(例えば相同組換え)又は非相同末端結合(NHEJ)によって誘導された切断を修復するヌクレアーゼを使用することによって達成され得る。CRISPR関連タンパク質(Cas、例えば、Cas9)ヌクレアーゼ、ジンクフィンガーヌクレアーゼ(ZFN、例えば、FokI)、転写活性化因子様エフェクターヌクレアーゼ(TALEN、例えば、TALE)、ホーミングエンドヌクレアーゼ、及びこれらの変異体を含むがこれに限定されない、任意の適切なヌクレアーゼを細胞に導入して、標的DNA配列のゲノム編集を誘導することができる(Shukla et al. (2009) Nature 459: 437- 441; Townsend et al (2009) Nature 459: 442-445)。いくつかの実施形態では、上記コード配列はCas9ポリペプチドをコードする。
【0135】
いくつかの実施形態では、上記コード配列はRNA分子をコードする。RNA分子は、メッセンジャーRNA(mRNA)のようなタンパク質コードRNA、又はトランスポーターRNA(tRNA)及びリボソームRNA(rRNA)、微小RNA(miRNA)、低分子干渉RNA(siRNA)のようなスモールRNA、ショートヘアピンRNA(shRNA)又はpiwi相互作用RNA(piRNA)、及び長鎖ノンコーディングRNA(lincRNA)を含むがこれらに限定されない非タンパク質コードRNAであってもよい。微小RNAやsiRNAなど小RNAはRNA干渉(RNAi)の過程で重要である。RNAiは、転写後の分解や翻訳の阻害により小RNAを干渉し、本来正常に発現している標的遺伝子の発現を阻害する遺伝子調節プロセスである。RNAi技術の詳細な説明については、例えば、U.S. Pat. No. 6,326,527;6,452,067;6,573,099;6,753,139;及び6,777,588を参照する。いくつかの実施形態では、上記コード配列は制御性RNAをコードする。いくつかの実施形態では、上記コード配列はRNAi分子をコードする。いくつかの実施形態では、上記コード配列はshRNAをコードする。いくつかの実施形態では、上記コード配列はmiRNAをコードする。
【0136】
いくつかの実施形態では、上記コード配列は、ゲノム編集に有用なRNA分子をコードすることができる。このようなRNA分子の例としては、CRISPR RNA(crRNA)、トランス活性化crRNA(tracrRNA)、ガイドRNA(gRNA)、及びシングルガイドRNA(sgRNA)が含まれるが、これらに限定されない。
【0137】
いくつかの実施形態では、上記異種核酸は、コード配列の発現を調節する1つ又は複数の調節要素をさらに含む。調節要素は、本明細書に記載された方法及び構築体と共に使用されることが想定される。「調節要素」という用語は、プロモータ、エンハンサー、内部リボソーム進入部位(IRES)、及び他の発現制御要素(例えば、ポリアデニル化(poly-A)シグナル及びpoly-U配列のような転写終了シグナル)を含むことが意図されている。このような調節要素は、例えば、Goeddel, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, Calif. (1990)に記載される。
【0138】
プロモータはコード配列の発現パターンを導く重要な制御要素である。いくつかの実施形態では、上記異種核酸は、コード配列に作動可能に連結されたプロモータを含む。本願では、任意の適切なプロモータを使用することができる。いくつかの実施形態では、プロモータは内在性プロモータである。いくつかの実施形態では、プロモータは異種プロモータである。哺乳類細胞における遺伝子発現のための複数のプロモータが探索されており、当分野で知られている任意のプロモータは本願に使用することができる。プロモータは、構成性プロモータ又は誘導性プロモータのような調節性プロモータに大別できる。いくつかの実施形態では、上記異種核酸は、構成性プロモータに動作可能に連結されたコード配列(例えば、トランスポザーゼコード配列)を含む。いくつかの実施形態では、上記異種核酸は、誘導性プロモータに動作可能に連結されたコード配列(例えば、トランスポザーゼコード配列)を含む。
【0139】
構成性プロモータは、異種核酸を宿主細胞において構成的に発現させることを可能にする。本明細書で考慮される例示的な構成性プロモータは、サイトメガロウイルス(CMV)プロモータ、ヒト伸長因子-1α(hEF1α)、ユビキチンCプロモータ(UbiC)、ホスホグリセリンキナーゼプロモータ(PGK)、サルウイルス40初期プロモータ(SV40)、及びCMV初期エンハンサー(CAGG)に結合したニワトリβアクチンプロモータを含むが、これらに限定されない。このような構成性プロモータはトランスジーン発現(transgene expression)を駆動する面での効率が多くの研究で広範に比較されている。例えば、Michael C.Miloneらは、ヒト初代T細胞におけるキメラ抗原受容体の発現を駆動するCMV、hEF1α、UbiC、PGKの効率を比較し、hEF1αプロモータが最高レベルのトランスジェニック発現を誘導するだけでなく、CD4及びCD8ヒトT細胞においても理想的に維持されていると結論づけている(Molecular Therapy, 17(8): 1453-1464 (2009))。いくつかの実施形態では、上記異種核酸中のプロモータはCAGプロモータである。図3に、構成性プロモータによって駆動されるトランスポザーゼ又は選択マーカー/レポーター遺伝子をコードする異種核酸配列を含む例示的な操作された転移因子が示されている。ここで、プロモータはCMVプロモータ又はPGKプロモータである。
【0140】
いくつかの用途では、いくつかの遺伝子治療において、強発現プロモータ(例えば、CMVプロモータ)の代わりに、コード配列の中程度又は弱発現パターンを有するプロモータを使用することが、過剰生産阻害(OPI)と総称されるトランスポザーゼに基づく自動調節イベントを回避又は低減するために必要であることが想定される。
【0141】
誘導性プロモータのような調節性プロモータは、特定の発達段階、特定の組織タイプ又は亜細胞位置などの場合に異種核酸の発現を可能にする。当該分野では、誘導性、組織特異性、細胞タイプ特異性、細胞周期特異性を含む様々なタイプの調節性プロモータが知られており、例えSambrook and Russell, 2001を参照する。誘導性プロモータは調節性プロモータのカテゴリに入る。誘導性プロモータは、物理的条件、操作された哺乳類細胞の微小環境、又は操作された哺乳類細胞の生理学的状態、インデューサー(すなわち、誘導剤)、又はそれらの組み合わせのような1つ又は複数の条件によって誘導され得る。
【0142】
いくつかの実施形態では、プロモータを使用してコード配列を発現させることは、細胞タイプ、細胞系譜(cell lineages)、又は組織のサブセットにおいてのみ、又は特定の発達段階においてのみ望ましい。その例としては、B29プロモータ(B細胞発現)、低転写因子(CBFa2)プロモータ(幹細胞発現)、CD14プロモータ(単球発現)、CD43プロモータ(白血球と血小板発現)、CD45プロモータ(造血細胞発現)、CD68プロモータ(マクロファージ発現)、内皮糖タンパク質プロモータ(内皮細胞発現)、fms関連チロシンキナーゼ1(FLT1)プロモータ(内皮細胞発現)、インテグリン、α2b(ITGA2B)プロモータ(巨核球発現)、細胞内接着分子2(ICAM-2)プロモータ(内皮細胞発現)、インターフェロンβ(IFN-β)プロモータ(造血細胞発現)、β-グロビンLCR(赤血球発現)、グロビンプロモータ(赤血球発現)、β-グロビンプロモータ(赤血球発現)、α-グロビンHS40エンハンサー(赤血球発現)、アンキリン-1プロモータ(赤血球発現)、ビスコットアルドリッチ症候群タンパク質(WASP)プロモータ(ヘモグロビントポロジー細胞発現)が含まれるが、これらに限定されない。
【0143】
本明細書で説明される方法の態様はターミネータ配列を利用することができる。ターミネータ配列は、転写中に遺伝子又はオペロンの末端を標識する核酸配列のセグメントを含む。この配列は、転写複合体からmRNAを放出するプロセスをトリガするシグナルを新たに合成されたmRNAに提供することによって転写終止を媒介する。これらのプロセスは、mRNA二次構造と複合体との直接的な相互作用及び/又は募集された終止因子の間接的な活動を含む。転写複合体の放出は、RNAポリメラーゼ及び関連する転写機構を解放し、新しいmRNAの転写を開始する。ターミネータ配列は、当該分野で知られているものを含む。本願のいくつかの実施形態では、ターミネータ配列はポリアデニル化(poly-A)シグナルである。
【0144】
いくつかの実施形態では、上記異種核酸は、少なくとも1つの制限エンドヌクレアーゼ認識部位、例えば制限部位を含み、外来核酸を挿入する部位として使用される。当該分野では、HindIII、PstI、SalI、AccI、HincII、XbaI、BamHI、SmaI、XmaI、KpnI、SacI、EcoRIなどを含むがこれに限定されない様々な制限部位が知られている。いくつかの実施形態では、制限部位は、マルチクローニング部位(MCS、マルチリンカーとも呼ばれる)、すなわち、複数の異なる制限エンドヌクレアーゼ(例えば、上記のもの)によって識別される密に配列されたシリーズ又は部位のアレイである。他の実施形態では、本願の異種核酸は、Cre、Flp及びPhiC31組換え酵素によってそれぞれ認識されるLoxP、FRT又はAttB/AttP部位のような組換え酵素認識部位を含む。
【0145】
いくつかの実施形態では、上記異種核酸はタグ配列を含む。タグ配列は、分子を同定するために、又は例えばハイブリダイゼーションによって分子を捕捉するための部位を提供するために使用され得る。
【0146】
いくつかの実施形態では、上記異種核酸はバーコード配列を含む。「バーコード配列」とは、この核酸バーコードに結合された1つ又は複数の第1分子と1つ又は複数の第2分子とを識別及び/又は区別するのに有用な配列を有する核酸を意味する。核酸バーコード配列は、通常、非常に短く、例えば、長さが約5~20塩基であり、1つ又は複数の目的の標的分子又はその増幅産物と結合することができる。核酸バーコード配列は、一本鎖又は二本鎖であってもよい。
【0147】
いくつかの実施形態では、上記異種核酸は一意の分子識別子(UMI)を含む。本明細書で使用される場合、「一意の分子識別子」又は「UMI」という用語は、UMIに結合される1つ又は複数の第1分子と1つ又は複数の第2分子とを識別及び/又は区別するために使用され得る核酸配列を意味する。UMIは一般的に短く、例えば、長さが約5~20塩基であり、1つ又は複数の目的の標的分子又はその増幅産物と結合することができる。UMIは、1本鎖又は2本鎖であってもよい。いくつかの実施形態では、核酸バーコード配列及びUMIの両方が、核酸標的分子又はその増幅産物に組み込まれる。通常、UMIは集団又はグループ内の類似タイプの分子を区別するために使用され、核酸バーコード配列は分子の集団又はグループを区別するために使用される。UMIと核酸バーコード配列とを併用するいくつかの実施形態では、UMIの配列長は核酸バーコード配列よりも短い。いくつかの実施形態では、UMIと核酸バーコード配列とを併用する場合、UMIは核酸バーコード配列に組み込まれる前に、標的核酸又はその増幅産物に組み込まれる。いくつかの実施形態では、UMIと核酸バーコード配列とを併用する場合、UMIは標的核酸又はその増幅産物に組み込まれた後、核酸バーコード配列はUMI又はその増幅産物に組み込まれる。
【0148】
転移活性
いくつかの実施形態では、本願の転移因子は、インビトロ又は細胞内で転移活性を示す。
【0149】
転移活性は、当業者に知られている多くの技術によって検出されてもよい。ベクターからの転移因子の切除、細胞のゲノム又は染色体外DNAへの転移因子の組み込み、及び逆反復配列へのトランスポザーゼの結合能力を測定するための例は、例えば、Ivies et al. Cell, 91, 501-510 (1997), WO 98/40510 (Hackett et al.), WO 99/25817 (Hackett et al.), and WO00/68399 (Mclvor et al.)を参照する。
【0150】
いくつかの実施形態では、転移測定は、転移因子システムにおける2つの成分のトランス相補性に基づいており、1つの成分は、側部連結末端反復の選択マーカー/レポーター遺伝子(ドナー)を含み、もう1つの成分は、トランスポザーゼを発現し、転移(ヘルパー)を実行するために末端反復を識別、結合する。例えば、図3は、活性転移因子をスクリーニングするための例示的な二元構築体を示している。上の構築体は、5’から3’へ、サイトメガロウイルス(CMV)プロモータ、トランスポザーゼ(Tn)遺伝子、及びpoly(A)シグナルを含むトランスポザーゼ発現補助構築体である。下の構築体はドナー構築体であり、5’から3’へ、ホスホグリセリン酸キナーゼ(PGK)プロモータ、5’標的部位反復(TSD)配列、5’末端反復(5’TR)配列、ピューロマイシン及び増強型GFP融合(Puro-eGFP)をコードする配列、3’末端反復(3’TR)配列、3’標的部位反復(TSD)配列、及びポリ(A)シグナルを含む。転移測定において、培養哺乳類細胞(例えば、ヒト293T、HeLa又はHct116細胞)へのドナープラスミドと補助プラスミド又は対照プラスミドとの共トランスフェクションでは、染色体の組み込み及びピューロマイシン耐性遺伝子の発現に起因してピューロマイシン耐性を発現する細胞クローンの数を遺伝子導入効率の指標とし、メチレンブルー染色によって表す。K562や初代T細胞などの懸濁細胞については、電気穿孔後のGFPレポーター遺伝子陽性細胞から転移活性を評価することができる。図4A~6Bは転移測定に基づくメチレンブルー染色結果のコロニーカウントを示し、対照と比較して評価したTEの転移測定効率を示す。このような測定における転移効率は「導入効率」とも呼ばれる。
【0151】
いくつかの実施形態では、上記操作された転移因子の導入効率は、少なくとも約0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%又はそれ以上のいずれかである。いくつかの実施形態では、上記操作された転移因子の導入効率は、ヒト293T、HeLa、Hct116、K562、又は初代T細胞のようなヒト細胞において測定される。
【0152】
いくつかの実施形態では、上記操作された転移因子の転移活性は、piggyBac(PB)トランスポゾン、Sleeping Beauty(SB)トランスポゾン、及び/又はTcBuster(TB)トランスポゾンの転移活性よりも高い。いくつかの実施形態では、上記操作された転移因子の転移活性は、レポーター遺伝子に基づく転移測定(例えば、実施例2で説明したように)によって哺乳類細胞において決定されるように、piggyBac(PB)トランスポゾンの転移活性よりも、例えば、約10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、2x、3x、5x、10x又はそれ以上のいずれか高い。いくつかの実施形態では、上記操作された転移因子の転移活性は、レポーター遺伝子に基づく転移測定(例えば、実施例2で説明したように、)によって哺乳類細胞において決定されるように、Sleeping Beauty(SB)トランスポゾンの転移活性よりも、例えば、約10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、2x、3x、5x、10x又はそれ以上のいずれか高い。いくつかの実施形態では、上記操作された転移因子の転移活性は、レポーター遺伝子に基づく転移測定(例えば、実施形態2で説明したように)によって哺乳類細胞において決定されるように、TcBuster(TB)トランスポゾンの転移活性よりも、例えば、少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、2x、3x、5x、10x、又はそれ以上のいずれか高い。いくつかの実施形態では、上記操作された転移因子の転移活性は、PBトランスポゾン及びSBトランスポゾンの転移活性よりも高い。いくつかの実施形態では、上記操作された転移因子の転移活性は、PBトランスポゾン及びTBトランスポゾンの転移活性よりも高い。いくつかの実施形態では、上記操作された転移因子の転移活性は、TBトランスポゾン及びSBトランスポゾンの転移活性よりも高い。いくつかの実施形態では、上記操作された転移因子の転移活性は、PBトランスポゾン、SBトランスポゾン、及びTBトランスポゾンの転移活性よりも高い。
【0153】
いくつかの実施形態では、上記この操作された転移因子の転移活性は、哺乳類細胞において評価される。いくつかの実施形態では、上記哺乳類細胞はHeLa細胞である。いくつかの実施形態では、上記哺乳類細胞はヒト胚腎293T(293T)である。いくつかの実施形態では、上記哺乳類細胞はK562細胞である。いくつかの実施形態では、上記哺乳類細胞はHct116細胞である。いくつかの実施形態では、上記哺乳類細胞はヒトT細胞、例えばドナー由来の初代T細胞である。いくつかの実施形態では、上記操作された転移因子は、293T細胞においてHeLa細胞よりも高い転移活性を有し、例えば293T細胞における転移活性は、HeLa細胞における転移活性よりも、少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、2x、3x、5x、10x又はそれ以上のいずれか高い。
【0154】
細胞
本明細書に記載の操作された転移因子は、様々な細胞において転移活性を有し、任意の適切な細胞の標的核酸に異種核酸を挿入するために使用され得る。
【0155】
いくつかの実施形態では、上記細胞は単離された細胞である。いくつかの実施形態では、上記細胞は細胞培養物中にある。いくつかの実施形態では、上記細胞はエクスビボのものである。いくつかの実施形態では、上記細胞は生きた生物から得られ、細胞培養物中に維持される。いくつかの実施形態では、上記細胞は単細胞生物である。細胞は細胞の由来、由来組織、形態、機能、組織学的マーカー、発現プロファイルなどに基づいて異なるタイプに分類することができる。
【0156】
いくつかの実施形態では、上記細胞は原核細胞である。いくつかの実施形態では、上記細胞は細菌細胞であるか、又は細菌細胞由来である。いくつかの実施形態では、上記細胞は古細菌細胞であるか、又は古細菌細胞由来である。いくつかの実施形態では、上記細胞は真核細胞である。いくつかの実施形態では、上記細胞は植物細胞であるか、又は植物細胞由来である。いくつかの実施形態では、上記細胞は真菌細胞であるか、又は真菌細胞由来である。いくつかの実施形態では、上記細胞は動物細胞であるか、又は動物細胞由来である。いくつかの実施形態では、銭細胞は無脊椎動物細胞であるか、無脊椎動物細胞由来である。いくつかの実施形態では、上記細胞は脊椎動物細胞であるか、又は脊椎動物細胞由来である。いくつかの実施形態では、上記細胞は哺乳類細胞であるか、又は哺乳類細胞由来である。いくつかの実施形態では、上記細胞はヒト細胞である。いくつかの実施形態では、上記細胞はゼブラフィッシュ(D. rerio)細胞である。いくつかの実施形態では、上記細胞はげっ歯類細胞である。いくつかの実施形態では、上記細胞は合成手段により製造され、人工細胞と呼ばれることもある。いくつかの実施形態では、上記細胞は、5’TR、3’TR及び/又はトランスポザーゼ由来の動物種に関連する。いくつかの実施形態では、上記細胞は、5’TR、3’TR及び/又はトランスポザーゼ由来の動物種とは無関係である。
【0157】
いくつかの実施形態では、上記細胞は、細菌、酵母細胞、真菌細胞、藻類細胞、植物細胞又は動物細胞である。いくつかの実施形態では、上記細胞は、組織生検のような天然由来から単離された細胞である。いくつかの実施形態では、上記細胞はインビトロで培養された細胞株から単離された細胞である。いくつかの実施形態では、上記細胞は遺伝子操作された細胞である。いくつかの実施形態では、上記細胞は、核内で増殖、分化、又はその両方を経験する種子細胞である。
【0158】
いくつかの実施形態では、上記細胞は、ウシ、ヒツジ、ヤギ、ウマ、ブタ、シカ、ニワトリ、アヒル、ガチョウ、ウサギ及び魚から選択される生物由来の動物細胞である。
【0159】
いくつかの実施形態では、上記細胞は、トウモロコシ、小麦、大麦、オーツ麦、イネ、大豆、アブラヤシ、ベニバナ、ゴマ、タバコ、亜麻、綿、ヒマワリ、トウジンビエ、アワ、モロコシ、アブラナ、大麻、野菜作物、飼料作物、経済作物、木本作物及びバイオマス作物から選択される生物由来の植物細胞である。
【0160】
いくつかの実施形態では、上記細胞は、ヒト、飼養動物及び農場動物、動物園、運動場、又は犬(C.familiaris)、ウマ、ネコ、ウシなどのペット由来の細胞を含む哺乳類細胞である。いくつかの実施形態では、上記細胞はヒト細胞である。いくつかの実施形態では、ヒト細胞はヒト胚腎293T(HEK293T又は293T)細胞又はHeLa細胞である。
【0161】
いくつかの実施形態では、上記細胞は初代細胞に由来する。例えば、初代細胞の培養物を0回、1回、2回、4回、5回、10回、15回以上継代することができる。いくつかの実施形態では、いずれかの公知の方法によって個体から初代細胞が得られる。例えば、血液成分置換、白血球分離術、密度勾配分離などにより白血球を採取することができる。皮膚、筋、骨髄、脾臓、肝臓、膵臓、肺、腸、胃などの組織由来の細胞を生検により採取することができる。適切な溶液は、採取された細胞を分散又は懸濁させるために使用することができる。このような溶液は、一般的に平衡塩溶液(例えば、生理食塩水、リン酸緩衝塩水(PBS)、ハンクス平衡塩溶液など)であり、許容可能な低濃度緩衝液とともに、子ウシ血清又は他の天然に存在する因子を容易に補充することができる。緩衝液は、HEPES、リン酸緩衝液、乳酸緩衝液などを含んでもよい。細胞はすぐに使用することも、(例えば、冷凍することで)保存することもできる。凍結細胞は解凍可能であり、再利用可能である。細胞は、DMSO、血清、培地系緩衝液(例えば、10%DMSO、50%血清、40%緩衝培地)、及び/又は凍結温度で細胞を保存するために使用される他のこのような一般的な溶液で凍結され得る。
【0162】
いくつかの実施形態では、上記細胞は細胞株に由来する。当該分野では、種々の細胞株が知られている。細胞株の例としては、293T、MF7、K562、HeLa及びこれらのトランスジェニック品種が含まれるが、これらに限定されない。細胞株は、当業者に知られている様々なソースから入手することができる(例えば、米国典型培養物寄託センター(ATCC)(Manassus,Va.)を参照)。
【0163】
いくつかの実施形態では、上記細胞は接着細胞を含む。いくつかの実施形態では、上記細胞は分化した接着細胞を含む。いくつかの実施形態では、上記細胞は未分化接着細胞を含む。いくつかの実施形態では、上記細胞は多能性幹細胞を含む。いくつかの実施形態では、上記細胞は非接着細胞を含む。
【0164】
いくつかの実施形態では、上記細胞は、上皮組織、筋組織、神経組織、結合組織、又はそれらの任意の組み合わせに由来する。いくつかの実施形態では、上記細胞は、肝臓、胃腸管、膵臓、腎臓、肺、気管、血管、骨格筋、心臓、皮膚、平滑筋、結合組織、角膜、泌尿器生殖系、乳腺、生殖、内皮、上皮、線維芽細胞、神経、シュワン細胞(Schwann)、脂肪、骨、骨髄、軟骨、周皮細胞(pericyte)、中皮、内分泌、基質、リンパ、血液、内胚葉、外胚葉、中胚葉及びそれらの組み合わせから選択される組織に由来する。いくつかの実施形態では、上記細胞は、結合組織(例えば、疎性結合組織、密性結合組織、弾性組織、網状結合組織及び脂肪組織)、筋組織(例えば、骨格筋、平滑筋及び心筋)、泌尿器生殖組織、胃腸組織、肺組織、骨組織、神経組織及び上皮組織(例えば、単層上皮及び複層上皮)、内胚葉由来の組織、中胚葉由来の組織及び外胚葉由来の組織、又はこれらの任意の組み合わせから選択される組織に由来する。いくつかの実施形態では、上記細胞は腫瘍由来である。
【0165】
いくつかの実施形態では、上記細胞は、肝臓細胞、胃腸細胞、膵臓細胞、腎臓細胞、肺細胞、気管細胞、血管細胞、骨格筋細胞、心筋細胞、皮膚細胞、平滑筋細胞、結合組織細胞、角膜細胞、泌尿器生殖細胞、乳腺細胞、生殖細胞、内皮細胞、上皮細胞、線維芽細胞、神経細胞、シュワン細胞、脂肪細胞、骨細胞、骨髄細胞、軟骨細胞、周皮細胞、中皮細胞、内分泌組織由来の細胞、間質細胞、幹細胞、前駆細胞、リンパ球、血球、内胚葉由来の細胞、外胚葉由来の細胞、中胚葉由来の細胞、未分化細胞(例えば幹細胞や前駆細胞)、腫瘍細胞、iPS細胞及びそれらの組み合わせから選択される。
【0166】
いくつかの実施形態では、上記細胞は、T細胞、B細胞、ナチュラルキラー(NK)細胞、樹状細胞(DC)及びマクロファージなどの免疫細胞である。いくつかの実施形態では、上記細胞は、患者又はドナーから得られたヒトT細胞である。いくつかの実施形態では、上記細胞は、細胞傷害性T細胞、ヘルパーT細胞、ナチュラルキラー(NK)T細胞、iNK-T細胞、NK-T様細胞、αβT細胞、αγδT細胞、腫瘍浸潤性T細胞、及び樹状細胞(DC)活性化T細胞から選択される免疫細胞である。いくつかの実施形態では、上記細胞は、本願の操作された転移因子又は遺伝子導入システムを使用して修飾された免疫細胞である。いくつかの実施形態では、修飾された免疫細胞はCAR-T細胞である。いくつかの実施形態では、修飾された免疫細胞はTCR-T細胞である。
【0167】
いくつかの実施形態では、本願の細胞は哺乳類細胞である。 いくつかの実施形態では、前記哺乳類細胞は、ヒトHKT293細胞又はHeLa細胞である。さらにいくつかの実施形態では、293T細胞における前記転移因子の転移活性は、HeLa細胞における転移活性よりも高い。いくつかの実施形態では、前記哺乳類細胞は、免疫細胞、肝臓細胞、腫瘍細胞、幹細胞、受精卵、筋細胞及び皮膚細胞から選択される。
【0168】
いくつかの実施形態では、上記細胞は幹細胞又は前駆細胞である。細胞は、幹細胞(例えば、成体幹細胞、胚性幹細胞、iPS細胞)及び前駆細胞(例えば、心臓前駆細胞、神経前駆細胞など)を含んでもよい。細胞は、齧歯動物幹細胞、齧歯動物前駆細胞、ヒト幹細胞、ヒト前駆細胞など、哺乳類幹細胞及び前駆細胞を含んでもよい。
【0169】
いくつかの実施形態では、上記細胞は罹患細胞である。罹患細胞は、代謝、遺伝子発現及び/又は形態的特徴が変化している場合がある。罹患細胞は、癌細胞、糖尿病細胞及びアポトーシス細胞であってもよい。罹患細胞は、罹患対象由来の細胞であってもよい。
【0170】
いくつかの実施形態では、本願の細胞は、遺伝子治療に有用な標的細胞タイプに属する。標的細胞タイプの例としては、造血幹細胞、造血前駆細胞、骨髄前駆細胞、リンパ球前駆細胞、血小板産生前駆細胞、赤血球前駆細胞、顆粒球産生前駆細胞、単球前駆細胞、巨核球、巨核芽球、巨核球、血液凝固細胞/血小板、前赤芽球、好塩基性赤芽球、多染性赤芽球、正染性赤芽球、多染性赤血球、赤血球(赤血球又はRBC)、好塩基性前骨髄球、好塩基性骨髄細胞、好塩基性後骨髄細胞、好塩基球、中性前骨髄細胞、中性後骨髄細胞、中性後骨髄細胞、好中球、好酸性前骨髄細胞、好酸性骨髄細胞、マクロファージ、樹状細胞、リンパ芽球、幼若リンパ球、ナチュラルキラー(NK)細胞、小リンパ球、Tリンパ球、Bリンパ球、形質細胞、及びリンパ樹状細胞が含まれる。好ましい実施形態では、標的細胞タイプは、1つ又は複数の赤血球、例えば、前赤芽球、好塩基性赤血球、多染色赤血球、正染色赤血球、多染色赤血球、及び赤血球(RBC)である。好ましい実施形態では、標的細胞タイプは、1つ又は複数の赤血球、例えば、前赤芽球、好塩基性赤芽球、多染性赤芽球、正染色赤芽球、多染性赤血球、及び赤血球(RBC)である。
【0171】
ベクター
いくつかの実施形態では、上記操作された転移因子及び/又はトランスポザーゼをコードする核酸配列は、1つ又は複数のベクターに存在する。
【0172】
本願では、様々な適切なベクターを使用することができる。いくつかの実施形態では、ベクターは、プラスミドベクター、コスミドベクター、人工染色体(例えば、細菌人工染色体、酵母人工染色体又は哺乳類人工染色体)、ファージ、バキュロウイルス、レトロウイルス、レンチウイルス、アデノウイルス、牛痘ウイルス、セムリキフォレストウイルス、アデノ随伴ウイルス(AAV)ベクターなどのウイルスベクターであり、これらは全て公知であり、市販品として購入することができる。通常、適切なベクターは、少なくとも1つの生物において機能を有する複製開始点、プロモータ配列、都合のよい制限エンドヌクレアーゼ部位、及び1つ又は複数の選択マーカーを含む。
【0173】
いくつかの実施形態では、上記ベクターはプラスミドである。いくつかの実施形態では、プラスミドは、貯蔵又は増幅のために細菌に形質転換されてもよく、哺乳類細胞にトランスフェクションされてもよい。
【0174】
このベクターを哺乳類細胞に導入する方法は、当該分野において知られている。このベクターは、物理的、化学的及び/又は生物学的方法によって宿主細胞に導入することができる。本願では、様々なベクタータイプ及びベクター送達方法を単独で又は組み合わせて使用することができることが予想される。
【0175】
ベクターを宿主細胞に導入するための物理的方法は、リン酸カルシウム沈殿、脂質トランスフェクション、粒子衝撃、マイクロインジェクション、電気穿孔などを含む。ベクター及び/又は外来核酸を含む細胞を製造する方法は当該分野に公知である。例えば、Sambrook et al. (2001) Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, New Yorkを参照する。いくつかの実施形態では、ベクターは、電気穿孔によって細胞内に導入される。
【0176】
異種核酸を宿主細胞に導入するための生物学的方法は、DNA及びRNAベクターを使用することを含む。ウイルスベクターは、哺乳類(例えばヒトの細胞)に遺伝子を挿入するために最も広く使用されている方法となっている。
【0177】
ベクターを宿主細胞に導入するための化学的方法は、高分子複合体、ナノカプセル、マイクロスフェア、ビーズ、及び水中油型エマルジョン、ミセル、混合ミセル及びリポソームを含む脂質系のようなコロイド分散系を含む。インビトロ送達ベクターとして使用されるコロイド系の例は、リポソーム(例えば、人工膜小胞)である。
【0178】
いくつかの実施形態では、上記ベクターはウイルスベクターである。ウイルスベクターの例としては、アデノウイルスベクター、アデノ随伴ウイルス(AAV)ベクター、レンチウイルスベクター、レトロウイルスベクター、牛痘ベクター、単純ヘルペスウイルスベクター及びそれらの誘導体が含まれるが、これらに限定されない。ウイルスベクター技術は、当該分野において公知であり、例えば、Sambrook et al. (2001, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, New York)、及び他のウイルス学や分子生物学マニュアルに記載されている。いくつかの実施形態では、ウイルスベクターの効率的な遺伝子送達と、転移因子によって達成される遺伝子発現の安定性とが組み合わされた遺伝子治療において、ウイルスベクター送達転移因子を使用することができる。例えば、Yant, Stephen R., et al. “Transposition from a gutless adeno-transposon vector stabilizes transgene expression in vivo.” Nature biotechnology 20.10 (2002): 999-1005。を参照する。
【0179】
III.遺伝子導入システム
本願の別の態様は、1)操作された転移因子(例えば、本明細書に記載されたいずれかの転移因子)と、2)トランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システムを提供する。
【0180】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)トランスポザーゼと、を含む遺伝子導入システムを提供する。いくつかの実施形態では、上記転移因子は異種核酸の細胞(例えば哺乳類細胞又は植物細胞)のDNAへの挿入を可能とする転移活性を示す。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれか1種に由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0181】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)トランスポザーゼをコードする核酸(例えばDNA又はRNA)とを含む遺伝子導入システムを提供する。いくつかの実施形態では、上記転移因子は異種核酸の細胞(例えば哺乳類細胞又は植物細胞)のDNAへの挿入を可能とする転移活性を示す。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれか1種に由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0182】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含む操作された転移因子と、2)SEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含むトランスポザーゼと、を含む遺伝子導入システムを提供する。いくつかの実施形態では、上記転移因子は異種核酸の細胞(例えば哺乳類細胞又は植物細胞)のDNAへの挿入を可能とする転移活性を示す。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれか1種に由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0183】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含む操作された転移因子と、2)SEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含むトランスポザーゼをコードする核酸(例えばDNA又はRNA)と、を含む遺伝子導入システムを提供する。いくつかの実施形態では、上記転移因子は異種核酸の細胞(例えば哺乳類細胞又は植物細胞)のDNAへの挿入を可能とする転移活性を示す。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれか1種に由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0184】
いくつかの実施形態では、1)操作された転移因子と、2)トランスポザーゼとを含み、上記転移因子は、5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、上記トランスポザーゼはSEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む遺伝子導入システムを提供する。いくつかの実施形態では、上記転移因子は異種核酸の細胞(例えば哺乳類細胞又は植物細胞)のDNAへの挿入を可能とする転移活性を示す。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれか1種に由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0185】
いくつかの実施形態では、1)操作された転移因子と、2)トランスポザーゼをコードする核酸(例えばDNA又はRNA)と、を含み、上記転移因子は、5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、上記トランスポザーゼは、SEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む遺伝子導入システムを提供する。いくつかの実施形態では、上記転移因子は異種核酸の細胞(例えば哺乳類細胞又は植物細胞)のDNAへの挿入を可能とする転移活性を示す。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれか1種に由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0186】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 3の核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 29の核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)SEQ ID NO: 55のアミノ酸配列を含むトランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システムを提供する。
【0187】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 8の核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 34の核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)SEQ ID NO: 60のアミノ酸配列を含むトランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システムを提供する。
【0188】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 11の核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 37の核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)SEQ ID NO: 63のアミノ酸配列を含むトランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システムを提供する。
【0189】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 12の核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 38の核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)SEQ ID NO: 64のアミノ酸配列を含むトランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システムを提供する。
【0190】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 13の核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 39の核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)SEQ ID NO: 65のアミノ酸配列を含むトランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システムを提供する。
【0191】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 16の核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 42の核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)SEQ ID NO: 68のアミノ酸配列を含むトランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システムを提供する。
【0192】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 22の核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 48の核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)SEQ ID NO: 74のアミノ酸配列を含むトランスポザーゼ、又はトランスポザーゼをコードする核酸とを含む遺伝子導入システムを提供する。
【0193】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 23の核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 49の核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)SEQ ID NO: 75のアミノ酸配列を含むトランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システムを提供する。
【0194】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 79の核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 91の核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)SEQ ID NO: 103のアミノ酸配列を含むトランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システムを提供する。
【0195】
いくつかの実施形態では、1)5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 82の核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 94の核酸配列、その変異体又はそのフラグメントを含む操作された転移因子と、2)SEQ ID NO: 106のアミノ酸配列を含むトランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システムを提供する。
【0196】
本明細書の上記遺伝子導入システムはトランスポザーゼを含む。トランスポザーゼはポリペプチドとして存在してもよい。或いは、トランスポザーゼはトランスポザーゼをコードするコード配列を含むポリヌクレオチドの形態として存在してもよい。ポリヌクレオチドはRNA、例えばトランスポザーゼをコードするmRNA、又はDNA、例えばトランスポザーゼをコードするコード配列であってもよい。トランスポザーゼがトランスポザーゼをコードするコード配列として存在する場合、いくつかの実施形態では、上記コード配列は転移因子を含む同一のベクターに存在してもよく、すなわち、シス式である。いくつかの実施形態では、上記遺伝子導入システムは操作された転移因子を含む第1ベクターと、トランスポザーゼコード配列を含む第2ベクターとを含み、すなわち、トランス式である。
【0197】
いくつかの実施形態では、上記遺伝子導入システムは、1)操作された転移因子(本明細書の上記操作された転移因子のいずれか)を含むベクターと、2)トランスポザーゼと、を含む。
【0198】
いくつかの実施形態では、上記遺伝子導入システムは、1)操作された転移因子(本明細書の上記操作された転移因子のいずれか)と、2)トランスポザーゼをコードする核酸とを含み、上記核酸はDNAである。いくつかの実施形態では、上記操作された転移因子及び核酸は同一のベクターに存在する。いくつかの実施形態では、上記操作された転移因子及び核酸は個別のベクターに存在する。
【0199】
いくつかの実施形態では、上記遺伝子導入システムは、1)操作された転移因子(本明細書の上記操作された転移因子のいずれか)と、2)トランスポザーゼをコードする核酸とを含み、上記核酸はRNAである。いくつかの実施形態では、上記操作された転移因子及び核酸は、同一のベクターに存在する。いくつかの実施形態では、上記操作された転移因子及び核酸は個別のベクターに存在する。
【0200】
本明細書の前記遺伝子導入システムでは、操作された転移因子及びトランスポザーゼ又はトランスポザーゼをコードする核酸について、多くの潜在的かつ適切な細胞内送達方法の組み合わせが存在する。トランスポザーゼは、DNA、RNA又はタンパク質として送達され得る。操作された転移因子及びトランスポザーゼは、一緒に又は別々に送達することができる。例えば、トランスポゾン遺伝子とトランスポザーゼ遺伝子は、同じ組換えウイルスゲノムに一緒に含めることができ、単一感染送達系の2つの部分は、トランスポザーゼの発現が、後に細胞染色体に組み込むために、組換えウイルスゲノムからトランスポゾンを切断することを指示するようにする。別の例では、トランスポザーゼ及び転移因子は、ウイルス及び/又は脂質含有試薬のような非ウイルス系の組み合わせによって別々に送達され得る。これらの場合、上記転移因子及び/又はトランスポザーゼ遺伝子は、組換えウイルスを介して送達され得る。いくつかの実施形態では、トランスポザーゼは、標的位置に組み込むために、そのドナーDNAから転移因子を放出するように指示する。
【0201】
トランスポザーゼは、タンパク質又はトランスポザーゼタンパク質をコードする核酸として細胞に提供することができる。トランスポザーゼタンパク質をコードする核酸は、DNA又はRNAの形態をとることができる。タンパク質は、細胞内に単独で導入されてもよいし、プラスミド又はウイルスベクターのようなベクターに導入されてもよい。さらに、トランスポザーゼタンパク質をコードする核酸は、トランスポザーゼタンパク質の細胞内での一時的又は延長的な発現を促進するように、細胞のゲノムに安定的に又は瞬間的に組み込まれてもよい。さらに、プロモータ又は他の発現制御領域は、トランスポザーゼタンパク質をコードする核酸に作動可能に連結されて、このタンパク質の発現を定量的に又は組織特異的に調節することができる。いくつかの実施形態では、トランスポザーゼタンパク質は、DNA結合ドメイン、触媒ドメイン(トランスポザーゼ活性を有する)、及び/又は核局在シグナル(NLS)を含む。
【0202】
したがって、本願の遺伝子導入システムを細胞に送達するために、様々な方法及び材料を使用することができる。
【0203】
例えば、1つの方法は、プラスミドベクターを使用して遺伝子導入システムを送達することである。例えば、このシステムは、トランスポザーゼ発現カセットを担持したヘルパープラスミドと、転移因子を担持したドナープラスミドとの2種類のプラスミドから構成され得る。トランスフェクション後、両方のプラスミドは細胞核に向けられ、ヘルパープラスミドからトランスポザーゼコードRNAの産生を可能にし、次いで、核に導入されたトランスポザーゼサブユニットによって促進されるドナープラスミドからの転移因子の切除を行う。このような方法は単一のプラスミドにトランスポザーゼ遺伝子と転移因子を配置することによってさらに改良されてもよく、このプラスミドは、本来はヘルパー独立転移因子-トランスポザーゼベクターと呼ばれる。あるいは、トランスフェクションされたインビトロ転写mRNAは、トランスポザーゼの豊富な供給源として働くことができ、これにより、トランスポザーゼの発現が延長された細胞を産生するリスクを排除する。
【0204】
したがって、いくつかの実施形態では、上記転移因子は第1ベクター(ドナーベクター)に存在し、トランスポザーゼをコードする核酸は第2ベクター(補助ベクター)に存在する。いくつかの実施形態では、第1ベクター及び第2ベクターは、転移のために細胞を共トランスフェクションするために使用される。
【0205】
別の方法は、ウイルスベクターを使用して遺伝子導入システムを送達することである。ウイルスベクターは免疫原性又は発がん性の問題があるかもしれないが、いくつかの用途では、高い送達効率が必要とされることがある。遺伝子導入システムの構成要素はウイルスキャプシドによって担持、伝達されてもよく、それにより、アデノウイルス又は単純ヘルペスウイルスベクターのような他の付加的ベクターに、遺伝子を組み込み、長期的なトランスジェニック発現を確立する能力を付与する。ウイルスキャプシドはベクターの安定性、組織特異的転移因子送達、及び細胞膜間輸送を提供することができ、転移因子は、転移因子の特徴的な組み込みスペクトルに従ってウイルスベクターの組み込みを促進する。ウイルスベクターに基づく送達方法及び技術は当該分野に知られている。例えば、Sleeping Beautyトランスポゾンシステムのウイルスベクターに基づく転移が、アデノウイルスベクターを持つマウスの肝臓で最初に確認され、最近の研究では、大型動物へのこの方法の適用性が証明されている。アデノ随伴ウイルスベクターは、Sleeping Beautyシステムのベクターとしても好適である。例えば、Yant, Stephen R., et al. “Transposition from a gutless adeno-transposon vector stabilizes transgene expression in vivo.” Nature biotechnology 20.10 (2002): 999-1005,Hausl, Martin A., et al. “Hyperactive sleeping beauty transposase enables persistent phenotypic correction in mice and a canine model for hemophilia B.” Molecular Therapy 18.11 (2010): 1896-1906,及びZhang, Wenli, et al. “Hybrid adeno-associated viral vectors utilizing transposase-mediated somatic integration for stable transgene expression in human cells.” PloS one 8.10 (2013)を参照する。
【0206】
上述したように、本願の遺伝子導入システムは、物理的、化学的、生物学的、又はそれらの組み合わせによって宿主細胞に送達され得る。様々な送達ベクター及び方法は、いくつかの用途の所望の結果を達成するために、単独で又は組み合わせて本願に使用されることが想定される。したがって、当業者は、遺伝子治療などの想定される特定の用途に適合するために、種々の改変を有する種々の送達方法及び技術を最も好適に利用することができる。遺伝子治療を確実に実行できるようにするためには、長期的で費用対効果のある治療を提供するために、罹患組織のゲノムに治療的トランスジェニック遺伝子の安定した組み込みを実現すべきである。例えば、患者体内への効率的で免疫原性の低い遺伝子導入を実現するために、合成化合物とプラスミドとを組み合わせて使用して、DNAを細胞に送達することができる。リポソームやその他のナノ粒子は、この任務を達成するのに十分である。例えば、2つのプラスミドを患者に送達することができ、1つはトランスポザーゼの発現を提供するもの(ヘルパープラスミド)であり、もう1つは治療的トランスジェニック遺伝子を含む転移因子を提供するもの(ドナープラスミド)である。これらのDNAは、リポソームと複合化され、胃腸外注射により投与されてもよい。細胞に入ると、トランスポザーゼはドナープラスミドの転移因子に結合し、それを切除してゲノムに組み込むことができる。この挿入は安定して永続的になる。ヘルパープラスミド及びドナープラスミドは、最終的には細胞及び宿主防御機構によって失われる可能性があるが、治療的トランスジェニック遺伝子を含むゲノム組み込み転移因子は、全て安定かつ永続的な修飾となる。また、これらのプラスミドの一過性は過剰な転移を減少させ、発がんリスクを最小限に抑える。
【0207】
より詳細で例示的な転移因子の送達方法及び技術は、例えば、Skipper, Kristian Alsbjerg, et al. “DNA transposon-based gene vehicles-scenes from an evolutionary drive.” Journal of biomedical science 20.1 (2013): 92に記載される。
【0208】
IV.方法
本願はさらに、標的核酸を操作された転移因子又は遺伝子導入システムと接触させることを含み、上記操作された転移因子は本明細書の上記操作された転移因子のいずれかに係る異種核酸を含み、上記遺伝子導入システムは本明細書の上記記遺伝子導入システムのいずれかに係る異種核酸を含む、標的核酸に異種核酸を挿入する方法を提供する。この方法は、インビトロ又は細胞内で行われる。
【0209】
インビトロ方法
いくつかの実施形態では、標的核酸を操作された転移因子と接触させることを含み、上記操作された転移因子は、1)操作された転移因子と、2)トランスポザーゼと、を含み、上記転移因子は、5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、上記トランスポザーゼはSEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む、標的核酸に異種核酸をインビトロで挿入する方法を提供する。いくつかの実施形態では、上記標的核酸は環状DNAである。いくつかの実施形態では、上記標的核酸は線状DNAである。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれかに由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0210】
本明細書の上記方法は無細胞システムを含め、インビトロ転移に用いられてもよい。例えば、Goryshin, Igor Yu, and William S. Reznikoff. 「Tn5 in vitrotransposition.」 Journal of Biological Chemistry 273.13 (1998): 7367-7374を参照する。インビトロ転移活性を示す転移因子は第2世代配列決定(NGS)ライブラリーの構築、例えばタグ付加方法に有用である。
【0211】
いくつかの実施形態では、標的核酸を操作された転移因子と接触させることを含み、上記操作された転移因子は、1)操作された転移因子と、2)トランスポザーゼと、を含み、上記転移因子は、5’から3’へ、5’末端反復配列(5’TR)、バーコード配列を含む異種核酸及び3’末端反復配列(3’TR)を含み、5’TRは、SEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRは、SEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、上記トランスポザーゼは、SEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含み、これにより、複数のバーコード化核酸を提供する、標的核酸から複数のバーコード化核酸を製造する方法を提供する。いくつかの実施形態では、上記標的核酸はゲノムDNAである。いくつかの実施形態では、上記標的核酸はcDNAである。いくつかの実施形態では、上記標的核酸は増幅されたDNAである。いくつかの実施形態では、上記異種核酸はプライマー配列をさらに含む。いくつかの実施形態では、該方法は、複数のバーコード化核酸を増幅して核酸配列決定ライブラリーを提供することをさらに含む。いくつかの実施形態では、該方法は核酸配列決定ライブラリーについて配列決定を行うことをさらに含む。いくつかの実施形態では、該方法は標的核酸を複数の操作された転移因子と接触させることを含み、各操作された転移因子は個別のバーコード配列を含む。いくつかの実施形態では、本明細書の上記インビトロ方法を用いて製造される核酸配列決定ライブラリーは標的核酸配列中の隣接情報を保持している。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれかに由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0212】
いくつかの実施形態では、本明細書の上記トランスポザーゼ及び/又はTR配列のいずれかを用いてタグ付加方法を提供する。Tn5トランスポゾンを用いたタグ付加方法は当該分野に知られており、例えばUS9080211B2の通りであり、これは引用により全体として本明細書に組み込まれる。本明細書の上記タグ付加方法はトランスポソーム複合体組成物を用いる。
【0213】
いくつかの実施形態では、SEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含むトランスポザーゼと、1つ又は2つのTR配列とタグ配列を含む異種核酸と、を含むトランスポソーム複合体組成物を提供する。いくつかの実施形態では、トランスポソーム複合体はヘアピンを形成する単一の異種核酸を含む。いくつかの実施形態では、ヘアピンは切断可能な部位を含む。
【0214】
いくつかの実施形態では、トランスポソーム複合体は2種類の異種核酸に結合する2種類のトランスポザーゼを含む。いくつかの実施形態では、5’TR配列と第1タグ配列を含む第1異種核酸に結合する第1トランスポザーゼと、3’TR配列と第2タグ配列を含む第2異種核酸に結合する第2トランスポザーゼと、を含むトランスポソーム複合体組成物を提供する。いくつかの実施形態では、上記5’TRは、SEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRは、SEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含む。いくつかの実施形態では、第1タグ配列は第2タグ配列と異なる。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれかに由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0215】
いくつかの実施形態では、標的核酸を複数のトランスポソーム複合体と接触させることを含み、上記トランスポソーム複合体は、(1)第1トランスポザーゼとTR配列及び第1タグ配列を含む第1異種核酸とを含む第1トランスポソーム複合体と、(2)第2トランスポザーゼとTR配列及び第2タグ配列を含む第2異種核酸とを含む第2トランスポソーム複合体と、を含み、第1タグ配列は第2タグ配列と異なり、上記トランスポザーゼは、SEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含み、第1異種核酸及び第2異種核酸は標的核酸に挿入され、標的核酸はフラグメント化されて複数の核酸フラグメントになり、上記核酸フラグメントは核酸フラグメントの各5’末端に連結される第1又は第2核酸のうちの1つを含み、これにより、核酸フラグメントのライブラリーを提供する、標的核酸用の第1タグ配列及び第2タグ配列を有する核酸(例えば、DNA)フラグメントライブラリーの製造方法を提供する。いくつかの実施形態では、(1)におけるトランスポソーム複合体は2つの第1異種核酸を含み、(2)におけるトランスポソーム複合体は2つの第2異種核酸を含む。いくつかの実施形態では、上記5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含む。いくつかの実施形態では、該方法は核酸フラグメントを増幅することをさらに含む。いくつかの実施形態では、該方法は核酸フラグメント又はそのアンプリコンについて配列決定を行うことをさらに含む。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれかに由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0216】
いくつかの実施形態では、上記操作された転移因子又はトランスポソーム複合体は標的核酸にランダムに、すなわち、特定の配列基序に偏らないように挿入される。いくつかの実施形態では、上記操作された転移因子又はトランスポソーム複合体はPB、SB又はTBトランスポゾンよりもランダムに標的核酸に挿入される。
【0217】
いくつかの実施形態では、上記操作された転移因子又はトランスポソーム複合体は開放クロマチン領域、核小体又は他のDNA結合タンパク質に結合しない領域など、標的核酸の空間自由領域に優先的に挿入される。したがって、本明細書の上記インビトロ方法を使用して、エピゲノミクスを研究するための測定用の核酸配列ライブラリーを製造することができる(例えば、クロマチンのリモデリング又はDNAメチル化)。これには、クロマチントランスポザーゼの接近可能性配列決定(ATAC-seq)、標的及びタグ下の切断(CUT&TAG)、トランスポザーゼの接近可能性クロマチン及びDNAのメチル化測定(ATAC-Me)、及びトランスポザーゼを介したクロマチンの環化測定(Trac-looping)が含まれるが、これらに限定されない。Tn5トランスポゾンを使用したATAC-seq、CUT&TAG、ATAC-Me及びTrac-looping測定は、例えばBuenrostro, Jason D., et al. 「Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position.」 Nature methods (2013) 10(2): 1213;Kaya-Okur HS, et al., 「CUT&Tag for efficient epigenomic profiling of small samples and single cells.」 Nature Communications (2019), 10(1):1-10;Barnett KR et al. 「ATAC-Me Captures Prolonged DNA Methylation of Dynamic Chromatin Accessibility Loci during Cell Fate Transitions.」 Molecular Cell, 2020; and Lai B. et al. 「Trac-looping measures genome structure and chromatin accessibility,」 Nature methods, 2018, 15(9): 741に記載されており、これは全体として引用により本明細書に組み込まれる。いくつかの実施形態では、配列決定ライブラリー製造物はクロマチントランスポザーゼ接近可能性配列決定(ATAC-seq)に用いられる。
【0218】
いくつかの実施形態では、上記操作された転移因子又はトランスポソーム複合体は空間的に接近する標的核酸(例えば、ゲノムDNA)の領域へのタグ付加に有用である。空間的に互いに接近する2つの領域は末端に同じタグ配列対を含むことがある。したがって、本明細書の上記インビトロ方法は蛍光標識プローブを製造することに用いられ、該プローブはゲノムDNA中のクロマチン相互作用境界とインサイチュハイブリダイゼーション、例えばトランスポザーゼに基づく蛍光インサイチュハイブリダイゼーション(FISH)を行うことに用いられる。Tn5に基づくFISH方法は例えば、Zhang X. et al. 「Imaging chromatin interactions at sub-kilobase resolution via Tn5-FISH,」 bioRxiv, 2019:601690に記載されており、その全文は引用により本明細書に組み込まれる。
【0219】
細胞内の方法
いくつかの実施形態では、標的核酸を操作された転移因子と接触させることを含み、上記操作された転移因子は、1)操作された転移因子と、2)トランスポザーゼと、を含み、上記転移因子は、5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRは、SEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、上記トランスポザーゼは、SEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む、細胞内の標的核酸に異種核酸を挿入する方法を提供する。いくつかの実施形態では、上記標的核酸はゲノムDNAである。いくつかの実施形態では、上記標的核酸は染色体内DNAである。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれかに由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0220】
いくつかの実施形態では、標的核酸を操作された転移因子と接触させることを含み、上記操作された転移因子は、1)操作された転移因子と、2)トランスポザーゼと、を含み、上記転移因子は、5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRは、SEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRは、SEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、上記トランスポザーゼは、SEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む、哺乳類細胞内の標的核酸に異種核酸を挿入する方法を提供する。いくつかの実施形態では、上記哺乳類細胞はヒト細胞である。いくつかの実施形態では、上記哺乳類細胞は動物細胞、例えば齧歯動物細胞である。いくつかの実施形態では、上記哺乳類細胞は免疫細胞、例えばT細胞である。いくつかの実施形態では、該方法はエクスビボで行われる。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれかに由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0221】
いくつかの実施形態では、標的核酸を操作された転移因子と接触させることを含み、上記操作された転移因子は、1)操作された転移因子と、2)トランスポザーゼと、を含み、上記転移因子は、5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRは、SEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRは、SEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、上記トランスポザーゼは、SEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む、植物細胞内の標的核酸に異種核酸を挿入する方法を提供する。いくつかの実施形態では、植物細胞は農作物の細胞である。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれかに由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0222】
本明細書の上記転移因子又は遺伝子導入システムは、当該分野に知られている種々の技術のいずれかを使用して、1つ又は複数の細胞に導入することができ、例えば、マイクロインジェクション、脂質小胞(例えばカチオン性脂質小胞)への核酸フラグメントの結合、粒子衝撃、電気穿孔、DNA凝集試薬(例えばリン酸カルシウム、ポリリジン、ポリエチレンイミン)、又はウイルスベクターに核酸フラグメントを組込み、ウイルスベクターと細胞とを接触させることなどが含まれるが、これらに限定されない。ウイルスベクターが使用される場合、ウイルスベクターは、レトロウイルスベクター、アデノウイルスベクター又はアデノ随伴ウイルス(AAV)ベクターから選択されるウイルスベクターを含む、当該分野に知られている複数のウイルスベクターのいずれかを含んでもよい。
【0223】
異種核酸は複数のオペロンを含むことができ、又は異種核酸は複数の生物産物をコードすることができることが想定される。いくつかの実施形態では、上記異種核酸は遺伝子回路をコードする。例示的な遺伝子回路は、それぞれmRNA又はタンパク質を生成するために転写及び/又は翻訳されるエレメントの集合(各エレメントの「出力」)である。エレメント出力は、他の部分と相互作用することができ(例えば、転写又は翻訳を調節する)、又は細胞内の他の分子(例えば、細胞環境内に存在する小分子、DNA、RNA、又はタンパク質)と相互作用することができる。例えば、回路は、代謝経路又は遺伝子カスケードであってもよく、それは、天然又は非天然に存在し、人工的に工学化されていてもよい。回路内の各エレメントは、プロモータ、リボソーム結合部位(RBS)、コード配列(CDS)、及び/又はターミネータなどの構成要素又は遺伝子モジュールを含んでもよい。これらの構成要素は、異なるエレメントを実現するために異なる方法で相互接続又は組み立てられてもよく、最終的なエレメントは、異なる回路又は経路を作成するために異なる方法で組み合わされてもよい。これらのエレメントに加えて、回路は、細胞内に存在するか、又は構成要素と相互作用する細胞環境内に存在する他の種類の分子を含んでもよい。
【0224】
したがって、いくつかの実施形態では、細胞を操作された転移因子と接触させることを含み、上記操作された転移因子は、1)操作された転移因子と、2)トランスポザーゼと、を含み、上記転移因子は、5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRは、SEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRは、SEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、上記トランスポザーゼは、SEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含み、異種核酸は遺伝子回路をコードする、細胞内の標的核酸に異種核酸を挿入する方法を提供する。いくつかの実施形態では、上記標的核酸はゲノムDNAである。いくつかの実施形態では、上記標的核酸は染色体内DNAである。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれかに由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0225】
遺伝子回路は遺伝子治療に用いられる。遺伝子回路の設計使用方法及び技術は当該分野で知られている。さらに、例えばBrophy, Jennifer AN, and Christopher A. Voigt. "Principles of genetic circuit design." Nature methods 11.5 (2014): 508を参照することができる。
【0226】
該方法は任意の適切な細胞タイプに適用することができる。いくつかの実施形態では、上記細胞は、細菌、酵母細胞、真菌細胞、藻類細胞、植物細胞又は動物細胞である。いくつかの実施形態では、上記細胞は、組織生検のような天然由来から単離された細胞である。いくつかの実施形態では、上記細胞は、インビトロで培養された細胞株から単離された細胞である。いくつかの実施形態では、上記細胞は遺伝子操作された細胞である。いくつかの実施形態では、上記細胞は、核内で増殖、分化、又はその両方を経験する種子細胞である。
【0227】
いくつかの実施形態では、上記細胞は、ウシ、ヒツジ、ヤギ、ウマ、ブタ、シカ、ニワトリ、アヒル、ガチョウ、ウサギ及び魚から選択される生物由来の動物細胞である。
【0228】
いくつかの実施形態では、上記細胞は、トウモロコシ、小麦、大麦、オーツ麦、イネ、大豆、アブラヤシ、ベニバナ、ゴマ、タバコ、亜麻、綿、ヒマワリ、トウジンビエ、アワ、モロコシ、アブラナ、大麻、野菜作物、飼料作物、経済作物、木本作物及びバイオマス作物から選択される生物由来の植物細胞である。
【0229】
いくつかの実施形態では、上記細胞は哺乳類細胞である。いくつかの実施形態では、上記細胞はヒト細胞である。いくつかの実施形態では、ヒト細胞はヒト胚腎293T(HEK293T又は293T)細胞又はHeLa細胞である。いくつかの実施形態では、上記哺乳類細胞は、免疫細胞、肝臓細胞、腫瘍細胞、幹細胞、受精卵、筋細胞及び皮膚細胞から選択される。
【0230】
いくつかの実施形態では、上記細胞は、細胞傷害性T細胞、ヘルパーT細胞、ナチュラルキラー(NK)T細胞、iNK-T細胞、NK-T様細胞、αγδT細胞、腫瘍浸潤性T細胞、及び樹状細胞(DC)活性化T細胞からなる群から選択される免疫細胞である。いくつかの実施形態では、この方法は、CAR-T細胞又はTCR-T細胞のような修飾免疫細胞を生成する。
【0231】
いくつかの実施形態では、上記異種核酸は、細胞のゲノムに挿入される。さらにいくつかの実施形態では、上記異種核酸の挿入は細胞の遺伝子を不活性化する。いくつかの実施形態では、上記異種核酸はタンパク質又はRNAi分子をコードする。
【0232】
さらに、上記異種核酸は、ゲノム編集に有用なRNA分子をコードすることができる。このようなRNA分子の例としては、CRISPR RNA(crRNA)、トランス活性化crRNA(tracrRNA)、ガイドRNA(gRNA)、及びシングルガイドRNA(sgRNA)が含まれるが、これらに限定されない。
【0233】
いくつかの実施形態では、上記異種核酸は、レポータータンパク質、抗原特異的受容体、治療的タンパク質、抗生物質耐性タンパク質、RNAi分子、サイトカイン、キナーゼ、抗原、抗原特異的受容体、サイトカイン受容体、及び自殺ポリペプチドからなる群から選択される生物産物をコードする。例えば、上記異種核酸は、腫瘍関連抗原に特異的な受容体をコードすることができる。この方法により操作されたT細胞は、腫瘍関連抗原を発現する腫瘍細胞を認識し、特異的に殺傷することができる。別の例では、上記異種核酸は、ハイグロマイシン耐性タンパク質をコードし、ハイグロマイシン耐性細胞株を樹立することができる。あるいは、上記異種核酸は、生物学的機能を有さず、それ自体を必須遺伝子に挿入することにより、他の遺伝子の機能を遮断し、その機能を遮断することにも利用可能である。
【0234】
いくつかの特定実施形態において、上記異種核酸は、遺伝子治療に有用な治療的タンパク質をコードする。いくつかの実施形態では、上記異種核酸は治療的抗体をコードする。いくつかの実施形態では、上記異種核酸は、キメラ抗原受容体(CAR)又は操作されたTCRのような操作された受容体をコードする。
【0235】
いくつかの実施形態では、上記異種核酸は、標的ポリヌクレオチド(「貨物遺伝子」)の挿入を促進するために、1つ又は複数のマルチクリーニング部位(MCS)を含む。
【0236】
いくつかの実施形態では、この方法はエクスビボで行われる。いくつかの実施形態では、形質導入又はトランスフェクションされた細胞(例えば、哺乳類細胞)は、異種核酸を細胞に導入した後、エクスビボで増殖する。いくつかの実施形態では、形質導入又はトランスフェクションされた細胞は、増殖のために少なくとも約1日、2日、3日、4日、5日、6日、7日、10日、12日、又は14日のいずれか培養される。いくつかの実施形態では、形質導入又はトランスフェクションされた細胞は、約1日、2日、3日、4日、5日、6日、7日、10日、12日、又は14日のいずれかを超えないように培養される。いくつかの実施形態では、形質導入又はトランスフェクトされた細胞をさらに評価又はスクリーニングして、操作された細胞を選択する。
【0237】
レポーター遺伝子又は選択マーカーは、潜在的にトランスフェクションされた細胞を同定するため、及び調節配列の機能を評価するために使用され得る。一般に、レポーター遺伝子は、受容体生物又は組織に存在しないか、又は受容体生物又は組織によって発現されない遺伝子であり、そのコードするポリペプチドの発現が酵素活性のような容易に検出可能ないくつかの特性によって証明される。レポーター遺伝子の発現を、DNAを受容体細胞に導入した後、適切なタイミングで測定する。適切なレポーター遺伝子は、ルシフェラーゼ、β-ガラクトシダーゼ、クロラムフェニコールアセチルトランスフェラーゼ、分泌型アルカリホスファターゼ、又は緑色蛍光タンパク質遺伝子(例えば、Ui-Tei et al. FEBS Letters 479: 79-82 (2000))をコードする遺伝子を含んでもよい。適切な表現システムは公知であり、公知の技術を用いて作成又は商業的に入手することができる。
【0238】
細胞内の異種核酸の存在を確認する他の方法としては、例えば、当業者によく知られている、Southernブロット法、Northernブロット法、RT-PCR、PCRなど、分子生物学的アッセイ;例えば免疫学的方法(例えばELISAやプロテインブロット法)による特定のペプチドの存在の有無の検出などの生化学的アッセイが含まれる。
【0239】
本願は、遺伝的変異を研究するために哺乳類細胞の準同質遺伝子系統を生成する方法を想定している。本願はまた、生物医学的、農業的及び産業的に有用な生成物を生成するための微生物、細胞、植物、動物又は合成生物のゲノム修飾も考慮する。これらの方法は、遺伝子ノックアウト又はノックイン研究のような、ゲノムを理解するための生物学的研究ツールとして使用することができる。
【0240】
本明細書に記載のいずれかの方法を使用して異種核酸によって修飾された細胞、及びそのような細胞を含むか又はそのような細胞から産生される生物(例えば、動物、植物又は真菌)も提供される。
【0241】
標的核酸
本明細書の上記方法は、種々の標的核酸に異種核酸を挿入するのに適している。いくつかの実施形態では、上記標的核酸はDNAである。いくつかの実施形態では、上記標的核酸は一本鎖である。いくつかの実施形態では、上記標的核酸は二本鎖である。いくつかの実施形態では、上記標的核酸は、一本鎖領域及び二本鎖領域を含む。いくつかの実施形態では、上記標的核酸は線状である。いくつかの実施形態では、上記標的核酸は環状である。いくつかの実施形態では、上記標的核酸は、メチル化ヌクレオチド、損傷ヌクレオチド、又はヌクレオチドアナログのような1つ又は複数の修飾ヌクレオチドを含む。いくつかの実施形態では、上記標的核酸は修飾されていない。いくつかの実施形態では、上記標的核酸は、核小体のような1つ又は複数のタンパク質に結合する。
【0242】
標的核酸は、任意の長さ、例えば、約100bp、200bp、500bp、1000bp、2000bp、5000bp、10kb、20kb、50kb、100kb、200kb、500kb、1Mb以上の少なくともいずれかであってもよい。いくつかの実施形態では、上記標的核酸は、約500kb、200kb、100kb、50kb、40kb、30kb、20kb、10kb、5kb、2kb、1kb、500bp、200bp以下のいずれかを超えない。いくつかの実施形態では、上記標的核酸は、約100bp~500bp、500bp~1kb、100bp~1kb、1kb~2kb、100bp~5kb、100bp~10kb、100bp~20kb、1kb~5kb、1kb~10kb、1kb~20kb、20kb~100kb、100kb~1Mbのいずれかである。標的核酸はまた、任意の配列を含んでいてもよい。いくつかの実施形態では、上記標的核酸は、本明細書の上記操作された転移因子又は遺伝子送達システムの転移のホットスポットである特定の配列を濃縮する。いくつかの実施形態では、上記標的核酸は、ATを濃縮し、例えば、少なくとも約40%、45%、50%、55%、60%、65%又はそれ以上のAT含有量のいずれかを有する。いくつかの実施形態では、上記標的核酸はATを濃縮しない。いくつかの実施形態では、本明細書に記載された操作された転移因子又は遺伝子送達システムは、特定の配列又は配列モチーフに異種核酸を挿入することを好まないので、標的核酸は特定のホットスポット配列を濃縮しない。いくつかの実施形態では、上記標的核酸は、1つ又は複数の二次構造又はより高次構造を有する。いくつかの実施形態では、上記標的核酸はクロマチン中のように凝集状態ではない。
【0243】
いくつかの実施形態では、上記標的核酸は細胞内に存在する。いくつかの実施形態では、上記標的核酸は細胞核内に存在する。いくつかの実施形態では、上記標的核酸は細胞に対して内因性である。いくつかの実施形態では、上記標的核酸はゲノムDNAである。いくつかの実施形態では、上記標的核酸は染色体DNAである。いくつかの実施形態では、上記標的核酸は、タンパク質コード遺伝子又はその機能領域、例えばコード領域、又はプロモータ、エンハンサー、5’又は3’非翻訳領域などの制御要素である。いくつかの実施形態では、上記標的核酸は、トランスポゾン、miRNA、tRNA、リボソームRNA、リボザイム又はlincRNAなどの非コード遺伝子である。いくつかの実施形態では、上記標的核酸はプラスミドである。
【0244】
いくつかの実施形態では、上記標的核酸は細胞に対して外因性である。いくつかの実施形態では、上記標的核酸は、ウイルスDNAなどのウイルス核酸である。いくつかの実施形態では、上記標的核酸は水平に転移するプラスミドである。いくつかの実施形態では、上記標的核酸は、細胞のゲノムに組み込まれる。いくつかの実施形態では、上記標的核酸は細胞のゲノムに組み込まれていない。いくつかの実施形態では、上記標的核酸は細胞内のプラスミドである。いくつかの実施形態では、上記標的核酸は染色体外アレイ中に存在する。
【0245】
いくつかの実施形態では、上記標的核酸は、単離されたDNAのような単離された核酸である。いくつかの実施形態では、上記標的核酸は無細胞環境中に存在する。いくつかの実施形態では、上記標的核酸は、プラスミドなどの単離されたベクターである。いくつかの実施形態では、上記標的核酸は単離された線状DNAフラグメントである。
【0246】
V.キット及び物品
本願はまた、本明細書に記載されたいずれかの転移因子又は遺伝子導入システムを含むキット及び物品を提供する。いくつかの実施形態では、キットは、標的核酸に異種核酸を挿入するためのプロトコールを含む(例えば、本明細書に記載のいずれかの方法を使用する)。いくつかの実施形態では、キットは、標的核酸に異種核酸をインビトロで挿入するために使用される。いくつかの実施形態では、キットは、哺乳類細胞又は植物細胞などの細胞内の標的核酸に異種核酸を挿入するために使用される。本明細書の上記キット及び物品は、インビトロ又はエクスボ、遺伝的研究及び遺伝子治療において標的核酸を修飾するために有用である。
【0247】
いくつかの実施形態では、操作された転移因子を含むキットを提供し、上記操作された転移因子は、5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRは、SEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRは、SEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、上記転移因子は異種核酸の細胞(例えば哺乳類細胞又は植物細胞)のDNAへの挿入を可能とする転移活性を示す。いくつかの実施形態では、上記異種核酸は、目的ポリヌクレオチド(「貨物遺伝子」)の挿入を促進するために1つ又は複数のマルチクローニング部位(MCS)を含む。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれかに由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0248】
いくつかの実施形態では、遺伝子導入システムを含むキットを提供し、上記遺伝子導入システムは、1)操作された転移因子と、2)トランスポザーゼ又はトランスポザーゼをコードする核酸と、を含む、上記転移因子は、5’から3’へ、5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、上記トランスポザーゼは、SEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列、又はその変異体を含み、上記転移因子は異種核酸の細胞(例えば哺乳類細胞又は植物細胞)のDNAへの挿入を可能とする転移活性を示す。いくつかの実施形態では、上記異種核酸は、目的ポリヌクレオチド(「貨物遺伝子」)の挿入を促進するために1つ又は複数のマルチクローニング(MCS)を含む。いくつかの実施形態では、上記操作された転移因子は表2のTEのいずれかに由来する。いくつかの実施形態では、上記操作された転移因子はTc1-8B_DR、Tc1-3_FR、Mariner2_AG、Tc1-1_Xt又はTc1-1_PMに由来する。
【0249】
いくつかの実施形態では、キットは、本明細書の上記方法のいずれかで使用される1つ又は複数の試薬を含む。試薬は任意の適切な容器で提供してもよい。例えば、キットは、1つ又は複数の反応性又は貯蔵性緩衝液を提供してもよい。試薬は、特定のアッセイに使用し得る形態で提供するか、又は使用前に1つ又は複数の他の成分を添加することが必要な形態(例えば、濃縮液又は凍結乾燥形態)で提供してもよい。緩衝液は、炭酸ナトリウム緩衝液、炭酸水素ナトリウム緩衝液、ホウ酸塩緩衝液、トリス緩衝液、MOPS緩衝液、HEPES緩衝液、及びこれらの組み合わせを含むが、これらに限定されない任意の緩衝液であってもよい。いくつかの実施形態では、キットは、本明細書の上記操作された転移因子又は遺伝子導入システムを使用して修飾された細胞の増殖又は誘導を可能にするための培地、緩衝液、試薬などを含む。いくつかの実施形態では、キットは、本明細書の上記操作された転移因子又は遺伝子導入システムを使用して修飾された標的核酸を単離及び/又は製造するための緩衝液、試薬などを含む。いくつかの実施形態では、キットは、本明細書の上記操作された転移因子又は遺伝子導入システムを使用して配列決定ライブラリーを製造するためのプライマー及び試薬を含む。
【0250】
キットは、適切な包装を採用する。適切な包装には、バイアル、ボトル、広口ボトル、軟包装(例えば、密封ポリエステルフィルム袋又はビニール袋)などが含まれるが、これらに限定されない。キットは、緩衝液及び説明情報のような追加の成分を選択的に提供してもよい。したがって、本願は、バイアル(例えば、密封バイアル)、ボトル、広口ボトル、軟包装などを含む物品も提供する。
【0251】
実施例
以下の実施例は、単に本発明を例示することを目的とするものであり、本発明を如何なる態様でも限定するものとは考えられない。以下の実施例及び詳細な説明は、限定ではなく、説明的に提供される。
【0252】
実施例1:候補活性転移因子の同定
本実施例は、種間の候補活性転移因子(TE、トランスポゾン)のコンピュータ同定を記載する。トランスポゾンは様々な種に大量に存在する。しかしながら、哺乳類細胞において転移活性を示すトランスポゾンは少数である。したがって、ゲノム工学及び遺伝子治療のための試薬として有用な候補活性トランスポゾンを系統的に同定する方法が必要である。この実施例は、末端逆反復配列(TIR、末端反復TRとも呼ばれる)を有するトランスポゾンを同定することに集中しているが、この方法は、任意の他のタイプのトランスポゾンを同定することに使用されてもよい。
【0253】
材料及び方法
Repbaseは最も一般的なトランスポゾンデータベースで、さまざまな真核種から38,000個のトランスポゾン配列が含まれている(Bao, W., K.K. Kojima, and O. Kohany, Repbase Update, a database of repetitive elements in eukaryotic genomes. Mob DNA, 2015. 6:p.11)。これらのプロトタイプ配列の多くは共通配列であり、それぞれのトランスポゾンファミリーを再構成し、その祖先の活性化状態を近似する配列である。したがって、共通配列は、Sleeping Beauty (Ivics, Z., et al., Molecular reconstruction of Sleeping Beauty, a Tc1-like transposon from fish, and its transposition in human cells. Cell, 1997. 91(4): p. 501-10)のような、トランスジェニック及び遺伝子治療のための活性トランスポゾンの実験的再構築に有用である。このプロジェクトの最初のステップとして、候補トランスポゾンスクリーニング用に、全ての共通配列がRepbase(バージョンRebase24.02)からダウンロードされる。
共通配列は必ずしも完全なトランスポザーゼ遺伝子を含んでいるとは限らないからである(特に高度に退化した古いトランスポゾンの場合)。他のシステム(例えば哺乳類の細胞)では、活性トランスポゾンとして機能しないので、その原始種における同定されたTE転移活性を、トランスポザーゼによってコードされる重要なドメイン、共通及びファミリーメンバー間の平均配列差、コピー数、保存的末端逆反復(TR)配列、及びTE側に連結される保存的標的部位反復(TSD)を含むいくつかのパラメータを使用して評価した。上記の情報を得るために、UCSC Genome Browserから100種類の動物のゲノム配列(Haeussler, M., et al., The UCSC Genome Browser database: 2019 update. Nucleic Acids Res, 2019. 47(D1): p. D853-D858)をダウンロードする。ゲノム配列は、Repbaseからの共通配列を使用して繰り返しマスキングされる。活性トランスポゾンは次のように定義される:1)候補トランスポゾンは最初から最後まで共通配列にマッチングする。及び2)候補トランスポゾンの長さは、トランスポゾン内に明らかな欠損がないことを確実にするために、共通トランスポゾンの長さの90%に達する。
【0254】
結果
図1は、バイオインフォマティクスパイプラインのフローチャートと、パイプラインの各段階における候補活性転移因子の数を示している。
合計100個の動物ゲノムから26,853,019個のDNAトランスポゾンのコピー(主にTIRトランスポゾン)が同定された。大量のコピーは活性トランスポゾンから退化したフラグメントである。全長DNAトランスポゾンのコピー総数は1,895,466であり、Repbase内の1,577個の共通DNAトランスポゾンにマッピングされている。
次に、これらのトランスポゾンを調べて、トランスポザーゼ遺伝子が含まれているか否かを調べた。ORFfinderはオープンリーディングフレーム(ORF)を検出するものであり、長さカットオフ値が300アミノ酸に設定される。次いで、このタンパク質配列は、PfamHMMライブラリーに対するPfamScanによる重要ドメインの探索に使用される(Madeira, F., et al., The EMBL-EBI search and sequence analysis tools APIs in 2019. Nucleic Acids Res, 2019. 47(W1): p. W636-W641)。このフィルタリングステップの後、Tnドメインを有する131個のトランスポゾンがパイプラインに残る。
次に、RepeatMaskerを使用して、トランスポゾンごとのコピー数を決定する(Smit, AFA, Hubley, R & Green, P. RepeatMasker Open-4.0.2013-2015)。各種の共通トランスポゾンとそのファミリーメンバーとの間の平均配列差値を計算し、この差値は、異なる種において0~24.4%の範囲である。表1に示すように、62個の同定されたTEの平均差値は5%以下であり、69個の同定されたTEの平均差値は5%以上であった。これら131個の活性トランスポゾンが5つのスーパーファミリーに分布していることがわかった(図2
表1で同定された62個のトランスポゾンのうち、合計11個のトランスポゾンが以下のより厳格な基準を満たしていることを発見し、それらはゲノム工学に非常に適している:1)トランスポゾンの長さは3000bp未満である。2)トランスポゾン内のミニチュア逆方向反復転移因子(MITE)の数が10個を超える。3)トランスポゾンの平均差値は1%未満である(TE IDs:4、5、7、12、18、20、22、25、26、28及び30、表1参照)。
要約すると、これらのデータは100個のゲノムの汎ゲノムバイオインフォマティクス解析によって同定された131個の候補活性トランスポゾンを示している。したがって、この実施例は、候補活性転移因子を同定するための強力なバイオインフォマティクスパイプラインの開発の成功を示している。
【0255】
実施例2:候補活性転移因子の検証
本実施例は、実施例1で同定された候補活性転移因子の実験的検証を説明する。
【0256】
材料及び方法
DNA合成及びプラスミド構築
EcoRI及びNotIが側部に連結された哺乳類コドン最適化トランスポザーゼORFを合成し、CMV-hyPBaseベクターにクローニングする(K. Yusa, et al., A hyperactive piggyBac transposase for mammalian applications. Proc Natl Acad Sci U S A, 2011. 108(4): p. 1531-6)。これらのベクターは、ヒトCMVプロモータの下でトランスポザーゼ発現を助けるためのヘルパープラスミドである。トランスポゾンドナープラスミドは、抗生物質耐性遺伝子の両側に位置する左右のトランスポゾンフラグメントを含む。本明細書で使用される場合、左トランスポゾンフラグメント(LTF)は、5’TSDからTE配列までのトランスポゾンORF配列の開始コドンのフラグメントを指す。本明細書で使用される場合、右転移因子フラグメント(RTF)は、トランスポザーゼORF配列の終止コドンからTE配列の3’TSDまでのフラグメントを意味する。通常、TR配列は、左右トランスポゾンフラグメント内に位置する。例えば、前記5’TR配列はLTF配列内にあり、前記3’TR配列はRTF配列内にある。本実験で使用されるLTF及びRTF配列は、青蘭生物技術社(Qinglan Biotechnology Inc.,)により合成され、pMVベクターにクローニングされた。貨物遺伝子クローニングのためのトランスポゾンフラグメントにおいて、5’及び3’マルチクリーニング部位(MCS)も合成された。TSD配列は最も外側に位置する。哺乳類細胞における転移スクリーニングのためのドナープラスミドは、P2A結合ピューロマイシン耐性遺伝子と、PGKプロモータにより発現される増強型GFP遺伝子とを担持する。図3は、活性転移因子を検証するための一組の例示的な補助体及びドナー構築体を示している。
【0257】
哺乳類細胞における転移
4つの哺乳類細胞株HEK293T(293Tとも呼ばれる)、HeLa、Hct116及びK562は活性トランスポゾンのスクリーニングに用いられる。293TとHeLa細胞株をDMEM培地に維持し、10%のウシ胎児血清と1%のペニシリン/ストレプトマイシンを補充した。Hct116とK562細胞株をRPMI 1640培地に維持し、10%のウシ胎児血清と1%のペニシリン/ストレプトマイシンを補充した。これらの細胞株に加えて、EasySep Human T Cell Enrichmentキットを用いてCD3T細胞を単離し、その後、histopaque-1077(Sigma-Aldrich)勾配分離により単球を収集して、CD3T細胞を5%(v/v)熱不活化ウシ胎児血清、2mM L-グルタミン、及び1mMピルビン酸ナトリウムを補充したX-Vivo 15培地(Lonza)に培養した。
転移測定では、トランスフェクション18時間前に、1.2×10個のHEK293T細胞、0.7×10個のHeLa細胞又は1.0×10個のHct116細胞を24ウェルプレートの各ウェルに接種した。Lipo3000を使用して、200ngのヘルパープラスミドと100ngのドナープラスミド、又は100ngのドナープラスミドだけを個々の細胞株に送達した。トランスフェクション2日後、細胞数を計算し、FACSによりトランスフェクション効率を測定した。次に、1/100thトランスフェクション後のHEK293T、1/100thトランスフェクション後のHeLa細胞又は1/100thトランスフェクション後のHct116細胞を100-mmプレートに移して、ピューロマイシン(0.5μg/ml)を用いて10日間(HEK-293T細胞株)又は14日間(HeLa細胞株及びHct116細胞株)選択した。
ピューロマイシンスクリーニング後、冷たいPBS 5mlで細胞を1回洗浄し、4%PFAで15分間固定化した後、0.2%メチレンブルー(PBS中)で1時間染色した(Wu et al., piggyBac is a flexible and highly active transposon as compared to Sleeping Beauty, Tol2, and Mos1 in mammalian cells. PNAS, 2006. 103: p. 15008-15013)。最後に、残った非特異的に染色したものをPBSで洗い流した。Image Jソフトウェアにより単一染色コロニーをカウントした。先に算出したトランスフェクション細胞の総数とトランスフェクション効率とに基づいて、転移効率を算出した。
K562細胞株やCD3+T細胞などの懸濁細胞については、プラスミドをごくわずかな割合に希釈した電気穿孔後14日目のGFP陽性細胞の割合に基づいて転移活性を評価した。
【0258】
TE挿入ライブラリーの構築及びバイオインフォマティクス分析
DNeasy血液及び組織キット(Qiagen,Germany)を用いて安定な転移K562細胞からゲノムDNAを単離し、Covaris M220超音波発生器(Covaris,USA)を用いて平均長さ600bpまで切断した。DNAサンプルに対して末端修復を行い、ネストPCRによりリンカーライゲーションおよび増幅を行い、Illumina HiSeqシーケンサー上で精製と配列決定を行った。次いで、TE組込み部位とベクター組込み部位の側に連結される1次配列の上流及び下流領域におけるランダム挿入部位について、最も近い遺伝子及びTSSまでの距離、及び異なるクロマチン状態を比較した。
【0259】
結果
検証項目には3回の実験が含まれる。
1回目では、まず、1%未満の差値及び10より大きいMITEコピー数を有する11個のTE(すなわち、TE ID:4、5、7、12、18、20、22、25、26、28及び30)を検証した。いかなる理論にも縛られることは望ましくないが、低い差値と高いMITEコピー数は、転移因子が最近ある種で活性である可能性が高いことを示していると仮定する(R. Mitra, et al., Functional characterization of piggyBat from the bat Myotis lucifugus unveils an active mammalian DNA transposon. Proc Natl Acad Sci U S A, 2013. 110(1): p. 234-9参照)。
プラスミド構築中に、異なるソースからの2つのトランスポゾンTR配列が利用可能であることを発見した。1つはデータベースが提供する共通配列からものであり、もう1つは自律配列とMITE配列とのアライメントによるものである。異なるTR配列のソースが測定結果に影響を及ぼすか否かをテストするために、異なるソースからのTR配列をそれぞれ使用して、転写測定のために2組のドナープラスミドを設計した。
その結果、初期検証でテストした11個の候補TEでは、3つのTEが活性であることがわかった。Tc1-3_Xt(TE ID25)はHEK293T細胞とHeLa細胞の両方で活性であることを見出し、HEK293T細胞では、導入効率が約9.6%、HeLa細胞では、導入効率が約3.6%であり、piggyBacの約半分(HEK293T細胞では18.4%、HeLa細胞では8.3%)に相当する。2つのTEは、テストされた2つの細胞株のうちの1つにおいてのみ活性であることが見出された:hAT-3_XT(TE ID 22)はHeLa細胞における活性が約1%であり、hAT-5_DR(TE ID 28)はHEK-293T細胞における活性が約2%である。異なるソースのTR配列を有する2つのドナープラスミド群間で転移効率に有意な差が認められなかったため、その後の実験はデータベースの共通配列からのTR配列のみに依存した。
次の実験では、表1から選ばれた48個の候補TEについて、293T細胞株とHeLa細胞株における転移活性を評価した(そのうち、293T細胞のみで16個のTEをテストした)。驚くほど高い成功率で、テストした48個の候補TEの中から22個のTEが活性であることを発見した。このうち、Tc1-8B_DR (TE ID 14)、Tc1-3_FR (TE ID 29)、Mariner2_AG (TE ID 35)、Tc1-1_Xt (TE ID 36)、Tc1-1_AG(TE ID 37)、Tc1-1_PM(TE ID 43)、Tc1-4_Xt(TE ID 54)及びTc1-15_Xt(TE ID 56)の8つのTEは、piggyBacと同等以上の転移効率を有する。参照として、piggyBacは293T細胞では17.44%、HeLa細胞では10.25%の導入効率であった。
いくつかの活性TEについては、転位効率が予想よりもはるかに高いため、上記細胞の標準希釈度は、個々のコロニーを正確にカウントするために、生存コロニーを測定プレート上で分離したままにするのに十分ではない。その結果、画像ソフトがカウントした染色コロニー数は過小評価されていた。これらのTEについては、検出プレートの染色がより高い導入効率を明確に示していたとしても、過小評価されたコロニーカウントに基づいて算出された導入効率は、実際の導入効率を過小評価したにすぎなかった。
つまり、2回の実験から59個の候補TEの転移活性を評価した。図4A~5Bは、対照TEと比較して評価されたTEの転移効率を示している。合計25個のTEがヒト細胞株において活性であることを見出した。
25個の活性TEのうち、9個のTEはhATスーパーファミリーに属し、16個のTEはTcMarinerスーパーファミリーに属していた。8個の活性TEの転移活性はpiggyBacと同程度以上であった。この8個の高効率な活性TEは全てTcMarinerスーパーファミリーに属し、このスーパーファミリーの中にもっと多くの活性トランスポゾンが分布していることを示した。さらに、25個の活性TEのうち9個がネッタイツメガエル由来であった。また、TEの転移活性と差値やMITEコピー数には有意な関係は認められなかった。
3回目の実験では、表1から選ばれた残り72個の候補TEについて、293T細胞株及びHeLa細胞株における転移活性を評価した。候補TEのうち、293T細胞で5%よりも大きい差値を持つ69個のTEのみをテストした。テストされた72個の候補TEのうち13個のTEが活性であることがわかった。結果を図6A~6Bに示す。
表2は、293T細胞株とHeLa細胞株の両方又は両方の細胞株の一方のみで活性が検証された合計38個のTEを含む、上記実験の経験による活性TEをまとめたものである。トランスポザーゼ配列に基づいて同定された異なるスーパーファミリーに属するTEの系統樹を図7A~7Cに示す。各スーパーファミリー内の種々のトランスポザーゼ間の配列類似性の百分率を表3~5に示す。
なお、5個のDNA TE(Tc1-8B_DR (TE ID 14)、Tc1-3_FR (TE ID 29)、Mariner2_AG (TE ID 35)、Tc1-1_Xt (TE ID 36)、Tc1-1_PM (TE ID 43)は、複数回最適化されたSB100Xよりも高い転移活性を示す。活性が最も高い5つのTEは、HEK293T細胞、Hela細胞、HCT116細胞においてもより高い転移活性を有しており(図8A~9B)、図10A~10Bは、初代T細胞におけるTEの転移活性を示している。3つのTE(Tc1-8B_DR (TE ID 14)、Tc1-3_FR (TE ID 29)、Tc1-1_PM (TE ID 43))では、過剰生産阻害(OPI)と呼ばれる現象は発生していない。図11A~11Bは、トランスポザーゼをコードするヘルパープラスミドとトランスポゾンプラスミドの比率が最適化されるにつれて、転移活性が増加することを示している。図12は同定した対照TE、piggyBAC、hyperPiggyBac及びSB100Xと比較して、活性が最も高い5つのTEの貨物(カーゴ)容量を示し、2 kb、5 kb、10 kb及び20 kbの遺伝子長を含む。
131個の候補TEのうち、活性TEと不活性TEを比較すると、活性TEは低い平均多様性、やや長い予測TIR配列、及び有意に増加した自律TEの数を示した。これらの差は、予備的及び大規模なスクリーニング設定を含む、活性TEを同定するためにバイオインフォマティクスパイプラインで使用できる特徴を識別するのに役立つ。
トランスポゾン組み込み部位で検索された組み込み部位は、最も活性の高い5つのTEの高度に好ましいTA標的部位ジヌクレオチドを明らかにする(図13)。TEの標的部位ジヌクレオチドはTc/Marinerスーパーファミリーに属し、非常に保存的である。図14A~18は、コンピュータで生成されたランダムデータと対照TE、piggyBACを比較することで、遺伝子と転写開始部位(TSS)までの距離、異なるクロマチン状態を含むゲノムの特徴に組み込まれた頻度を示している。データによると、最も活性の高い5つのTEは全て、遺伝子配列付近の組み込みに対する選好度が非常に低く、遺伝子とTSSの上下流配列に対する選好度がなかった。遺伝子発現レベルとクロマチン状態についても、活性の最も高い5つのTEはほぼランダムな組み込みパターンを示し、過剰な活性の発現領域に挿入されないことが多い。
【0260】
要約すると、これらのデータは、候補活性転移因子を識別するための確実なバイオインフォマティクスパイプラインの確立に成功したことと、同定されたTEの実験的検証に成功したことを示している。様々なTEの転移効率及び組み込みパターンは、これらのTEがゲノム工学的応用及び遺伝子治療に有用である可能性を示唆している。
【0261】
【表1-1】
【0262】
【表1-2】
【0263】
【表1-3】
【0264】
【表1-4】
【0265】
【表1-5】
【0266】
【表1-6】
【0267】
【表1-7】
【0268】
【表1-8】
【0269】
【表1-9】
【0270】
【表1-10】
【0271】
【表1-11】
【0272】
【表1-12】
【0273】
【表1-13】
【0274】
【表1-14】
【0275】
【表1-15】
【0276】
【表1-16】
【0277】
【表1-17】
【0278】
【表1-18】
【0279】
【表1-19】
【0280】
【表1-20】
【0281】
【表1-21】
【0282】
【表1-22】
【0283】
【表1-23】
【0284】
【表1-24】
【0285】
【表1-25】
【0286】
【表1-26】
【0287】
【表2-1】
【0288】
【表2-2】
【0289】
【表2-3】
【0290】
【表2-4】
【0291】
【表3】
【0292】
【表4】
【0293】
【表5-1】
【0294】
【表5-2】
【0295】
【表5-3】
図1
図2
図3
図4A-B】
図5A-B】
図6A-B】
図7A-B】
図7C
図8A-B】
図9A-B】
図10A-B】
図11A-B】
図12
図13
図14A-B】
図15
図16
図17
図18
【配列表】
2023520083000001.app
【手続補正書】
【提出日】2022-11-30
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
操作された転移因子であって、5’から3’への順に、
5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、
前記5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、
前記3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、
異種核酸の細胞DNAへの挿入を可能とする転移活性を示す操作された転移因子。
【請求項2】
前記5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を含み、及び/又は前記3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を含み、好ましくは、前記5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列を含み、及び/又は前記3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列を含む請求項1に記載の転移因子。
【請求項3】
前記5’TRの5’側に連結される5’標的部位反復配列(TSD)又は前記3’TRの3’側に連結される3’TSDをさらに含み、前記5’TSDはSEQ ID NO: 191~206から選択される核酸配列、その変異体又はそのフラグメントを含み、前記3’TSDはSEQ ID NO: 191~206から選択される核酸配列、その変異体又はそのフラグメントを含む請求項1~のいずれか1項に記載の転移因子。
【請求項4】
前記5’TRはSEQ ID NO: 3、8、11、12、13、16、22、23、79及び82から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列を含み、前記3’TRはSEQ ID NO: 29、34、37、38、39、42、48、49、91及び94から選択される核酸配列と少なくとも約90%の配列同一性を有する核酸配列であり、好ましくは、
(a) 前記5’TRはSEQ ID NO: 3の核酸配列を含み、前記3’TRはSEQ ID NO: 29の核酸配列を含み、
(b) 前記5’TRはSEQ ID NO: 8の核酸配列を含み、前記3’TRはSEQ ID NO: 34の核酸配列を含み、
(c) 前記5’TRはSEQ ID NO: 11の核酸配列を含み、前記3’TRはSEQ ID NO: 37の核酸配列を含み、
(d) 前記5’TRはSEQ ID NO: 12の核酸配列を含み、前記3’TRはSEQ ID NO: 38の核酸配列を含み、又は
(e) 前記5’TRはSEQ ID NO: 16の核酸配列を含み、前記3’TRはSEQ ID NO: 42の核酸配列を含み、
更に好ましくは、前記異種核酸はコード配列を含み、
更に好ましくは、前記異種核酸は前記コード配列に作動可能に連結されるプロモータをさらに含む請求項1~のいずれか1項に記載の転移因子。
【請求項5】
前記転移因子の転移活性はpiggyBac(PB)トランスポゾン、Sleeping Beauty(SB)トランスポゾン及び/又はTcBuster(TB)トランスポゾンの転移活性よりも高く、
好ましくは、前記細胞は動物細胞、植物細胞、藻類細胞、真菌細胞、酵母細胞又は細菌細胞であり、
更に好ましくは、前記細胞は哺乳類細胞であり、
更に好ましくは、前記哺乳類細胞は免疫細胞、肝臓細胞、腫瘍細胞、幹細胞、受精卵、筋細胞及び皮膚細胞から選択され、
更に好ましくは、前記細胞はヒト細胞である請求項1~のいずれか1項に記載の転移因子。
【請求項6】
ヒト胚腎293T(293T)細胞での転移活性がHeLa細胞での転移活性よりも高く、
好ましくは、ベクターに存在し、
更に好ましくは、前記ベクターはプラスミドベクター又はウイルスベクターである請求項1~のいずれか1項に記載の転移因子。
【請求項7】
1)請求項1~のいずれか1項に記載の操作された転移因子と、2)トランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含む遺伝子導入システムであって、
好ましくは、前記トランスポザーゼはSEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む遺伝子導入システム
【請求項8】
1)操作された転移因子と、2)トランスポザーゼ、又はトランスポザーゼをコードする核酸と、を含み、前記転移因子は、5’から3’へ、
5’末端反復配列(5’TR)、異種核酸及び3’末端反復配列(3’TR)を含み、
前記転移因子は異種核酸の細胞DNAへの挿入を可能とする転移活性を示し、
前記トランスポザーゼはSEQ ID NO: 53~78及び103~114から選択されるアミノ酸配列又はその変異体を含む、遺伝子導入システム。
【請求項9】
前記5’TRはSEQ ID NO: 1~26及び79~90から選択される核酸配列、その変異体又はそのフラグメントを含み、前記3’TRはSEQ ID NO: 27~52及び91~102から選択される核酸配列、その変異体又はそのフラグメントを含み、
好ましくは、
(a) 前記5’TRはSEQ ID NO: 3の核酸配列を含み、前記3’TRはSEQ ID NO: 29の核酸配列を含み、前記トランスポザーゼはSEQ ID NO: 55のアミノ酸配列を含み、
(b) 前記5’TRはSEQ ID NO: 8の核酸配列を含み、前記3’TRはSEQ ID NO: 34の核酸配列を含み、前記トランスポザーゼはSEQ ID NO: 60のアミノ酸配列を含み、
(c) 前記5’TRはSEQ ID NO: 11の核酸配列を含み、前記3’TRはSEQ ID NO: 37の核酸配列を含み、前記トランスポザーゼはSEQ ID NO: 63のアミノ酸配列を含み、
(d) 前記5’TRはSEQ ID NO: 12の核酸配列を含み、前記3’TRはSEQ ID NO: 38の核酸配列を含み、前記トランスポザーゼはSEQ ID NO: 64のアミノ酸配列を含み、又は
(e) 前記5’TRはSEQ ID NO: 16の核酸配列を含み、前記3’TRはSEQ ID NO: 42の核酸配列を含み、前記トランスポザーゼはSEQ ID NO: 68のアミノ酸配列を含み、
更に好ましくは、前記トランスポザーゼをコードする核酸を含み、
更に好ましくは、前記転移因子及び前記トランスポザーゼをコードする核酸は異なるベクターにあるもしくは同一ベクターにある請求項に記載の遺伝子導入システム。
【請求項10】
標的核酸に異種核酸を挿入する方法であって、
前記標的核酸と、請求項1~のいずれか1項に記載の転移因子又は請求項のいずれか1項に記載の遺伝子導入システムとを接触させることで、前記異種核酸を前記標的核酸に挿入することを含む方法。
【請求項11】
インビトロで行われるもしくは、前記標的核酸は細胞内にあり、
好ましくは、前記標的核酸はゲノムDNAである、請求項10に記載の方法。
【請求項12】
前記細胞は動物細胞、植物細胞、藻類細胞、真菌細胞、酵母細胞又は細菌細胞であり、好ましくは、前記細胞は哺乳類細胞であり、更に好ましくは、前記哺乳類細胞は免疫細胞、肝臓細胞、腫瘍細胞、幹細胞、受精卵、筋細胞及び皮膚細胞から選択される請求項10又は11に記載の方法。
【請求項13】
前記異種核酸の挿入により前記細胞の遺伝子を不活化させ、好ましくは、前記異種核酸はタンパク質をコードし、更に好ましくは、前記タンパク質は、レポータータンパク質、操作された受容体、サイトカイン、抗生物質耐性タンパク質、抗原及び治療的タンパク質からなる群から選択され又は前記異種核酸はRNAをコードし、更に好ましくは、前記RNAは、治療的RNA、低分子干渉RNA(siRNA)、微小RNA、ショートヘアピンRNA(shRNA)、ロングノンコードRNA(lincRNA)及びガイドRNA(gRNA)からなる群から選択される請求項12に記載の方法。
【請求項14】
前記異種核酸の長さが約2kb~約300kbであり、及び/又は前記挿入はランダムである請求項1013のいずれか1項に記載の方法。
【請求項15】
異種核酸を標的核酸に挿入する請求項1~のいずれか1項に記載の操作された転移因子、又は請求項のいずれか1項に記載の遺伝子導入システム及びプロトコールを含むキット。
【国際調査報告】