IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ メタゲノミ,インコーポレイテッドの特許一覧

特表2024-533038カーゴヌクレオチド配列を転位するための系及び方法
<>
  • 特表-カーゴヌクレオチド配列を転位するための系及び方法 図1A
  • 特表-カーゴヌクレオチド配列を転位するための系及び方法 図1B
  • 特表-カーゴヌクレオチド配列を転位するための系及び方法 図2
  • 特表-カーゴヌクレオチド配列を転位するための系及び方法 図3
  • 特表-カーゴヌクレオチド配列を転位するための系及び方法 図4
  • 特表-カーゴヌクレオチド配列を転位するための系及び方法 図5A
  • 特表-カーゴヌクレオチド配列を転位するための系及び方法 図5B
  • 特表-カーゴヌクレオチド配列を転位するための系及び方法 図6
  • 特表-カーゴヌクレオチド配列を転位するための系及び方法 図7
  • 特表-カーゴヌクレオチド配列を転位するための系及び方法 図8
  • 特表-カーゴヌクレオチド配列を転位するための系及び方法 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-09-12
(54)【発明の名称】カーゴヌクレオチド配列を転位するための系及び方法
(51)【国際特許分類】
   C12N 9/12 20060101AFI20240905BHJP
   C12N 15/54 20060101ALI20240905BHJP
   C12N 15/63 20060101ALI20240905BHJP
   C12N 1/15 20060101ALI20240905BHJP
   C12N 1/19 20060101ALI20240905BHJP
   C12N 1/21 20060101ALI20240905BHJP
   C12N 5/10 20060101ALI20240905BHJP
   C12N 15/09 20060101ALI20240905BHJP
【FI】
C12N9/12 ZNA
C12N15/54
C12N15/63 Z
C12N1/15
C12N1/19
C12N1/21
C12N5/10
C12N15/09 100
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024506884
(86)(22)【出願日】2022-09-07
(85)【翻訳文提出日】2024-03-22
(86)【国際出願番号】 US2022076059
(87)【国際公開番号】W WO2023039436
(87)【国際公開日】2023-03-16
(31)【優先権主張番号】63/241,934
(32)【優先日】2021-09-08
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】522185863
【氏名又は名称】メタゲノミ,インク.
(74)【代理人】
【識別番号】110003797
【氏名又は名称】弁理士法人清原国際特許事務所
(72)【発明者】
【氏名】トーマス,ブライアン シー.
(72)【発明者】
【氏名】ブラウン,クリストファー
(72)【発明者】
【氏名】ゴルツマン,ダニエラ エス.エー.
(72)【発明者】
【氏名】アレクサンダー,リサ
(72)【発明者】
【氏名】ラペリエール,サラ
【テーマコード(参考)】
4B065
【Fターム(参考)】
4B065AA01X
4B065AA01Y
4B065AA57X
4B065AA72X
4B065AA88X
4B065AA90X
4B065AB01
4B065AC14
4B065BA02
4B065CA24
4B065CA60
(57)【要約】
本開示は、カーゴヌクレオチド配列を標的核酸部位に転位するための系及び方法を提供する。これらの系及び方法は、カーゴヌクレオチド配列を含む第1の二本鎖核酸であって、カーゴヌクレオチド配列がトランスポザーゼと相互作用するように構成されている、二本鎖核酸と、トランスポザーゼであって、カーゴヌクレオチド配列を標的核酸部位に転位するように構成されている、トランスポザーゼと、を含み得る。
【選択図】図2
【特許請求の範囲】
【請求項1】
操作されたトランスポザーゼ系であって、
(a)カーゴヌクレオチド配列を含む二本鎖核酸であって、前記カーゴヌクレオチド配列が、トランスポザーゼと相互作用するように構成されている、二本鎖核酸と、
(b)トランスポザーゼであって、
(i)前記カーゴヌクレオチド配列を標的核酸遺伝子座に転位するように構成され、
(ii)未培養微生物に由来する、トランスポザーゼと、を含む、操作されたトランスポザーゼ系。
【請求項2】
前記トランスポザーゼが、配列番号1~349のうちのいずれか1つと少なくとも75%の配列同一性を有する配列を含む、請求項1に記載の操作されたトランスポザーゼ系。
【請求項3】
前記トランスポザーゼが、TnpAトランスポザーゼ又はTnpBトランスポザーゼではない、請求項1又は2に記載の操作されたトランスポザーゼ系。
【請求項4】
前記トランスポザーゼが、TnpAトランスポザーゼと80%未満の配列同一性を有する、請求項1~3のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項5】
前記トランスポザーゼが、TnpBトランスポザーゼと80%未満の配列同一性を有する、請求項1~4のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項6】
前記トランスポザーゼが、配列番号1、3、5、7、9、11、13、15、及び18~19のうちのいずれか1つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の配列同一性を有する、請求項1~5のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項7】
前記トランスポザーゼが、触媒チロシン残基を含む、請求項1~6のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項8】
前記トランスポザーゼが、サブ末端回文配列を含む左側領域及びサブ末端回文配列を含む右側領域に結合するように構成されている、請求項1~7のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項9】
前記トランスポザーゼが、一本鎖デオキシリボ核酸ポリヌクレオチドとして前記カーゴヌクレオチド配列を転位するように構成されている、請求項1~8のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項10】
前記トランスポザーゼが、前記トランスポザーゼのN末端又はC末端の近位に1つ以上の核局在化配列(NLS)を含む、請求項1~9のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項11】
前記NLSが、配列番号455~470からなる群からの配列と少なくとも80%同一である配列を含む、請求項1~10のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項12】
前記配列同一性が、BLASTP、CLUSTALW、MUSCLE、MAFFT、又はSmith-Waterman相同性検索アルゴリズムのパラメーターを用いるCLUSTALWによって決定される、請求項1~11のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項13】
前記配列同一性が、3のワード長(W)、10の期待値(E)のパラメーター、及び11の存在、1の延長でギャップコストを設定しているBLOSUM62スコアリングマトリックスを使用し、条件付き組成スコアマトリックス調整を使用した、前記BLASTP相同性検索アルゴリズムによって決定される、請求項12に記載の操作されたトランスポザーゼ系。
【請求項14】
操作されたトランスポザーゼ系であって、
(a)カーゴヌクレオチド配列を含む二本鎖核酸であって、前記カーゴヌクレオチド配列が、トランスポザーゼと相互作用するように構成されている、二本鎖核酸と、
(b)トランスポザーゼであって、
(i)前記カーゴヌクレオチド配列を標的核酸遺伝子座に転位するように構成され、
(ii)配列番号1~349のうちのいずれか1つと少なくとも75%の配列同一性を有する配列を含む、トランスポザーゼと、を含む、操作されたトランスポザーゼ系。
【請求項15】
前記トランスポザーゼが、未培養微生物に由来する、請求項14に記載の操作されたトランスポザーゼ系。
【請求項16】
前記トランスポザーゼが、TnpAトランスポザーゼ又はTnpBトランスポザーゼではない、請求項14又は15に記載の操作されたトランスポザーゼ系。
【請求項17】
前記トランスポザーゼが、TnpAトランスポザーゼと80%未満の配列同一性を有する、請求項14~16のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項18】
前記トランスポザーゼが、TnpBトランスポザーゼと80%未満の配列同一性を有する、請求項14~17のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項19】
前記トランスポザーゼが、配列番号1、3、5、7、9、11、13、15、及び18~19のうちのいずれか1つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の配列同一性を有する、請求項14~18のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項20】
前記トランスポザーゼが、触媒チロシン残基を含む、請求項14~19のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項21】
前記トランスポザーゼが、サブ末端回文配列を含む左側領域及びサブ末端回文配列を含む右側領域に結合するように構成されている、請求項14~20のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項22】
前記トランスポザーゼが、左側認識配列又は右側認識配列に適合する、請求項14~20のいずれか1項に記載の操作されたトランスポザーゼ系。
【請求項23】
前記トランスポザーゼが、一本鎖デオキシリボ核酸ポリヌクレオチドとして前記カーゴヌクレオチド配列を転位するように構成されている、請求項14~22のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項24】
前記配列同一性が、BLASTP、CLUSTALW、MUSCLE、MAFFT、又はSmith-Waterman相同性検索アルゴリズムのパラメーターを用いるCLUSTALWによって決定される、請求項14~22のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項25】
前記配列同一性が、3のワード長(W)、10の期待値(E)のパラメーター、及び11の存在、1の延長でギャップコストを設定しているBLOSUM62スコアリングマトリックスを使用し、条件付き組成スコアマトリックス調整を使用した、前記BLASTP相同性検索アルゴリズムによって決定される、請求項24に記載の操作されたトランスポザーゼ系。
【請求項26】
請求項1~25のいずれか一項に記載の操作されたトランスポザーゼ系をコードする、デオキシリボ核酸ポリヌクレオチド。
【請求項27】
生物における発現に最適化された操作された核酸配列を含む核酸であって、前記核酸が、トランスポザーゼをコードし、前記トランスポザーゼが、未培養微生物に由来し、前記生物が、前記未培養微生物ではない、核酸。
【請求項28】
前記トランスポザーゼが、配列番号1~349のうちのいずれか1つと少なくとも75%の配列同一性を有するバリアントを含む、請求項27に記載の核酸。
【請求項29】
前記トランスポザーゼが、前記トランスポザーゼのN末端又はC末端の近位に1つ以上の核局在化配列(NLS)をコードする配列を含む、請求項27又は28に記載の核酸。
【請求項30】
前記NLSが、配列番号455~470から選択される配列を含む、請求項29に記載の核酸。
【請求項31】
前記NLSが、配列番号456を含む、請求項29又は30に記載の核酸。
【請求項32】
前記NLSが、前記トランスポザーゼの前記N末端の近位にある、請求項31に記載の核酸。
【請求項33】
前記NLSが、配列番号455を含む、請求項29又は30に記載の核酸。
【請求項34】
前記NLSが、前記トランスポザーゼの前記C末端の近位にある、請求項33に記載の核酸。
【請求項35】
前記生物が、原核生物、細菌、真核生物、真菌、植物、哺乳類、齧歯類、又はヒトである、請求項27~34のいずれか一項に記載の核酸。
【請求項36】
請求項27~35のいずれか一項に記載の核酸を含む、ベクター。
【請求項37】
前記トランスポザーゼと複合体を形成するように構成されたカーゴヌクレオチド配列をコードする核酸を更に含む、請求項36に記載のベクター。
【請求項38】
前記ベクターが、プラスミド、ミニサークル、CELiD、アデノ随伴ウイルス(AAV)由来ビリオン、又はレンチウイルスである、請求項36又は37に記載のベクター。
【請求項39】
請求項36~38のいずれか一項のいずれか一項に記載のベクターを含む、細胞。
【請求項40】
請求項39に記載の細胞を培養することを含む、トランスポザーゼを製造する方法。
【請求項41】
カーゴ配列を含む二本鎖デオキシリボ核酸ポリヌクレオチドを結合、ニッキング、切断、マーキング、修飾、又は転位する方法であって、
(a)前記二本鎖デオキシリボ核酸ポリヌクレオチドを、前記カーゴヌクレオチド配列を標的核酸遺伝子座に転位するように構成されたトランスポザーゼと接触させることを含み、
(b)前記トランスポザーゼが、配列番号1~349のうちのいずれか1つと少なくとも75%の配列同一性を有する配列を含む、方法。
【請求項42】
前記トランスポザーゼが、未培養微生物に由来する、請求項41に記載の方法。
【請求項43】
前記トランスポザーゼが、TnpAトランスポザーゼ又はTnpBトランスポザーゼではない、請求項41又は42に記載の方法。
【請求項44】
前記トランスポザーゼが、TnpAトランスポザーゼと80%未満の配列同一性を有する、請求項41~43のいずれか一項に記載の方法。
【請求項45】
前記トランスポザーゼが、TnpBトランスポザーゼと80%未満の配列同一性を有する、請求項41~44のいずれか一項に記載の方法。
【請求項46】
前記トランスポザーゼが、配列番号1、3、5、7、9、11、13、15、及び18~19のうちのいずれか1つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、又は100%の配列同一性を有する、請求項41から45のいずれか一項に記載の方法。
【請求項47】
前記トランスポザーゼが、触媒チロシン残基を含む、請求項41~46のいずれか一項に記載の方法。
【請求項48】
前記トランスポザーゼが、サブ末端回文配列を含む左側領域及びサブ末端回文配列を含む右側領域に結合するように構成されている、請求項41~47のいずれか一項に記載の方法。
【請求項49】
前記トランスポザーゼが、左側認識配列又は右側認識配列に適合する、請求項41~47のいずれか一項に記載の方法。
【請求項50】
前記二本鎖デオキシリボ核酸ポリヌクレオチドが、一本鎖デオキシリボ核酸ポリヌクレオチドとして転位される、請求項41~49のいずれか一項に記載の方法。
【請求項51】
前記二本鎖デオキシリボ核酸ポリヌクレオチドが、真核生物、植物、真菌、哺乳類、齧歯類、又はヒト二本鎖デオキシリボ核酸ポリヌクレオチドである、請求項41~50のいずれか一項に記載の方法。
【請求項52】
標的核酸遺伝子座を修飾する方法であって、前記方法が、請求項1~25のいずれか一項に記載の操作されたトランスポザーゼ系を前記標的核酸遺伝子座に送達することを含み、前記トランスポザーゼが、前記カーゴヌクレオチド配列を前記標的核酸遺伝子座に転位するように構成されており、前記複合体が、前記複合体の前記標的核酸遺伝子座への結合時に、前記複合体が前記標的核酸遺伝子座を修飾するように構成されている、方法。
【請求項53】
前記標的核酸遺伝子座を修飾することが、前記標的核酸遺伝子座を結合、ニッキング、切断、マーキング、修飾、又は転位することを含む、請求項52に記載の方法。
【請求項54】
前記標的核酸遺伝子座が、デオキシリボ核酸(DNA)を含む、請求項52又は53に記載の方法。
【請求項55】
前記標的核酸遺伝子座が、ゲノムDNA、ウイルスDNA、又は細菌DNAを含む、請求項54に記載の方法。
【請求項56】
前記標的核酸遺伝子座が、インビトロである、請求項52~55のいずれか一項に記載の方法。
【請求項57】
前記標的核酸遺伝子座が、細胞内にある、請求項52~55のいずれか一項に記載の方法。
【請求項58】
前記細胞が、原核細胞、細菌細胞、真核細胞、真菌細胞、植物細胞、動物細胞、哺乳類細胞、齧歯類細胞、霊長類細胞、ヒト細胞、又は初代細胞である、請求項57に記載の方法。
【請求項59】
前記細胞が、初代細胞である、請求項57又は58に記載の方法。
【請求項60】
前記初代細胞が、T細胞である、請求項59に記載の方法。
【請求項61】
前記初代細胞が、造血幹細胞(HSC)である、請求項59に記載の方法。
【請求項62】
前記操作されたトランスポザーゼ系を前記標的核酸遺伝子座に送達することが、請求項27~35のいずれか一項に記載の核酸又は請求項36~38のいずれか一項に記載のベクターを送達することを含む、請求項52~61のいずれか一項に記載の方法。
【請求項63】
前記操作されたトランスポザーゼ系を前記標的核酸遺伝子座に送達することが、前記トランスポザーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む、請求項52~62のいずれか一項に記載の方法。
【請求項64】
前記核酸が、前記トランスポザーゼをコードする前記オープンリーディングフレームが作動可能に連結されているプロモーターを含む、請求項63に記載の方法。
【請求項65】
前記操作されたトランスポザーゼ系を前記標的核酸遺伝子座に送達することが、前記トランスポザーゼをコードする前記オープンリーディングフレームを含有するキャッピングされたmRNAを送達することを含む、請求項52~64のいずれか一項に記載の方法。
【請求項66】
前記操作されたトランスポザーゼ系を前記標的核酸遺伝子座に送達することが、翻訳されたポリペプチドを送達することを含む、請求項52~65のいずれか一項に記載の方法。
【請求項67】
前記トランスポザーゼが、前記標的核酸遺伝子座で、又は前記標的核酸遺伝子座の近位で、一本鎖切断又は二本鎖切断を誘導する、請求項52~66のいずれか一項に記載の方法。
【請求項68】
前記トランスポザーゼが、前記標的遺伝子座内又は前記標的遺伝子座の5’に互い違いの一本鎖切断を誘導する、請求項67に記載の方法。
【請求項69】
配列番号1~349のうちのいずれか1つ又はそのバリアントと少なくとも75%の配列同一性を有する異種トランスポザーゼをコードするオープンリーディングフレームを含む、宿主細胞。
【請求項70】
前記トランスポザーゼが、配列番号1、3、5、7、9、11、13、15、又は18~19のうちのいずれか1つと少なくとも75%の配列同一性を有する、請求項69に記載の宿主細胞。
【請求項71】
前記トランスポザーゼが、配列番号1、3、5、7、9、11、13、15、又は18~19のうちのいずれか1つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、又は100%の配列同一性を有する、請求項69に記載の宿主細胞。
【請求項72】
前記トランスポザーゼが、配列番号2、4、6、8、10、12、14、又は17のうちのいずれか1つと少なくとも75%の配列同一性を有する、請求項69に記載の宿主細胞。
【請求項73】
前記宿主細胞が、E.coli細胞である、請求項69~71のいずれか一項に記載の宿主細胞。
【請求項74】
前記E.coli細胞が、λDE3リソゲンであるか、又は前記E.coli細胞が、BL21(DE3)株である、請求項73に記載の宿主細胞。
【請求項75】
前記E.coli細胞が、ompT lon遺伝子型を有する、請求項73又は74に記載の宿主細胞。
【請求項76】
前記オープンリーディングフレームが、T7プロモーター配列、T7-lacプロモーター配列、lacプロモーター配列、tacプロモーター配列、trcプロモーター配列、ParaBADプロモーター配列、PrhaBADプロモーター配列、T5プロモーター配列、cspAプロモーター配列、araPBADプロモーター、ファージラムダからの強い左向きプロモーター(pLプロモーター)、又はそれらの任意の組み合わせに作動可能に連結されている、請求項69~75のいずれか一項に記載の宿主細胞。
【請求項77】
前記オープンリーディングフレームが、前記トランスポザーゼをコードする配列にインフレームで連結された親和性タグをコードする配列を含む、請求項69~76のいずれか一項に記載の宿主細胞。
【請求項78】
前記親和性タグが、固定化金属親和性クロマトグラフィー(IMAC)タグである、請求項77に記載の宿主細胞。
【請求項79】
前記IMACタグが、ポリヒスチジンタグである、請求項78に記載の宿主細胞。
【請求項80】
前記親和性タグが、mycタグ、ヒトインフルエンザヘマグルチニン(HA)タグ、マルトース結合タンパク質(MBP)タグ、グルタチオンS-トランスフェラーゼ(GST)タグ、ストレプトアビジンタグ、FLAGタグ、又はそれらの任意の組み合わせである、請求項77に記載の宿主細胞。
【請求項81】
前記親和性タグが、プロテアーゼ切断部位をコードするリンカー配列を介して、前記トランスポザーゼをコードする前記配列にインフレームで連結されている、請求項77~80のいずれか一項に記載の宿主細胞。
【請求項82】
前記プロテアーゼ切断部位が、タバコエッチウイルス(TEV)プロテアーゼ切断部位、PreScission(登録商標)プロテアーゼ切断部位、トロンビン切断部位、第Xa因子切断部位、エンテロキナーゼ切断部位、又はそれらの任意の組み合わせである、請求項81に記載の宿主細胞。
【請求項83】
前記オープンリーディングフレームが、前記宿主細胞における発現のためにコドン最適化されている、請求項69~82のいずれか一項に記載の宿主細胞。
【請求項84】
前記オープンリーディングフレームが、ベクター上に提供されている、請求項69~83のいずれか一項に記載の宿主細胞。
【請求項85】
前記オープンリーディングフレームが、前記宿主細胞のゲノムに組み込まれている、請求項69~83のいずれか一項に記載の宿主細胞。
【請求項86】
適合する液体培地中に、請求項69~85のいずれか一項に記載の宿主細胞を含む、培養物。
【請求項87】
適合する成長培地中で、請求項69~85のいずれか一項に記載の宿主細胞を培養することを含む、トランスポザーゼを産生する方法。
【請求項88】
追加の化学剤又は増加された量の栄養素を添加することによって、前記トランスポザーゼの発現を誘導することを更に含む、請求項87に記載の方法。
【請求項89】
前記追加の化学剤又は増加された量の栄養素が、イソプロピルβ-D-1-チオガラクトピラノシド(IPTG)又は追加の量のラクトースを含む、請求項88に記載の方法。
【請求項90】
前記培養後に前記宿主細胞を単離することと、前記宿主細胞を溶解してタンパク質抽出物を産生することとを更に含む、請求項87~89のいずれか一項に記載の方法。
【請求項91】
前記タンパク質抽出物をIMAC、又はイオン親和性クロマトグラフィーに供することを更に含む、請求項90に記載の方法。
【請求項92】
前記オープンリーディングフレームが、前記トランスポザーゼをコードする配列にインフレームで連結されたIMAC親和性タグをコードする配列を含む、請求項91に記載の方法。
【請求項93】
前記IMAC親和性タグが、プロテアーゼ切断部位をコードするリンカー配列を介して、前記トランスポザーゼをコードする前記配列にインフレームで連結されている、請求項92に記載の方法。
【請求項94】
前記プロテアーゼ切断部位が、タバコエッチウイルス(TEV)プロテアーゼ切断部位、PreScission(登録商標)プロテアーゼ切断部位、トロンビン切断部位、第Xa因子切断部位、エンテロキナーゼ切断部位、又はそれらの任意の組み合わせを含む、請求項93に記載の方法。
【請求項95】
前記プロテアーゼ切断部位に対応するプロテアーゼを前記トランスポザーゼと接触させることによって、前記IMAC親和性タグを切断することを更に含む、請求項93又は94に記載の方法。
【請求項96】
サブトラクティブIMAC親和性クロマトグラフィーを実施して、前記トランスポザーゼを含む組成物から前記親和性タグを除去することを更に含む、請求項95に記載の方法。
【請求項97】
細胞中の遺伝子座を破壊する方法であって、前記細胞に組成物を接触させることを含み、前記組成物が、
(a)カーゴヌクレオチド配列を含む二本鎖核酸であって、前記カーゴヌクレオチド配列が、トランスポザーゼと相互作用するように構成されている、二本鎖核酸と、
(b)トランスポザーゼであって、
(i)前記カーゴヌクレオチド配列を標的核酸遺伝子座に転位するように構成され、
(ii)配列番号1~349のうちのいずれか1つと少なくとも75%の配列同一性を有する配列を含み、
(iii)細胞内でTnpAトランスポザーゼと少なくとも同等の転位活性を有する、トランスポザーゼと、を含む、方法。
【請求項98】
前記転位活性が、前記標的核酸遺伝子座を含む細胞に前記トランスポザーゼを導入し、前記細胞内の前記標的核酸遺伝子座の転位を検出することによって、インビトロで測定される、請求項97に記載の方法。
【請求項99】
前記組成物が、20ピコモル(pmol)以下の前記トランスポザーゼを含む、請求項97又は98に記載の方法。
【請求項100】
前記組成物が、1pmol以下の前記トランスポザーゼを含む、請求項99に記載の方法。
【請求項101】
操作されたトランスポザーゼ系であって、前記操作されたトランスポザーゼ系が、
(a)カーゴヌクレオチド配列を含む二本鎖核酸であって、前記カーゴヌクレオチド配列が、トランスポザーゼと相互作用するように構成されている、二本鎖核酸と、
(b)トランスポザーゼと、を含み、
(i)前記トランスポザーゼが、前記カーゴヌクレオチド配列を標的核酸遺伝子座に転位するように構成され、
(ii)前記二本鎖核酸が、前記カーゴ配列に隣接する隣接配列を含み、前記隣接配列が、配列番号350~454のうちのいずれか1つの少なくとも90個の連続するヌクレオチドと少なくとも約70%の配列同一性を有する、操作されたトランスポザーゼ系。
【請求項102】
前記トランスポザーゼが、未培養生物に由来する、請求項101に記載の操作されたトランスポザーゼ系。
【請求項103】
前記トランスポザーゼが、TnpAトランスポザーゼ又はTnpBトランスポザーゼではない、請求項101又は102に記載の操作されたトランスポザーゼ系。
【請求項104】
前記トランスポザーゼが、TnpAトランスポザーゼと80%未満の配列同一性を有する、請求項101~103のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項105】
前記トランスポザーゼが、TnpBトランスポザーゼと80%未満の配列同一性を有する、請求項101~104のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項106】
前記トランスポザーゼが、配列番号1~349のうちのいずれか1つと少なくとも75%の配列同一性を有する配列を含む、請求項101~105のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項107】
前記トランスポザーゼが、配列番号1、3、5、7、9、11、13、15、及び18~19のうちのいずれか1つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、又は100%の配列同一性を有する、請求項106に記載の操作されたトランスポザーゼ系。
【請求項108】
前記トランスポザーゼが、触媒チロシン残基を含む、請求項101~107のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項109】
前記トランスポザーゼが、サブ末端回文配列を含む左側領域及びサブ末端回文配列を含む右側領域に結合するように構成されている、請求項101~108のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項110】
前記二本鎖デオキシリボ核酸ポリヌクレオチドが、一本鎖デオキシリボ核酸ポリヌクレオチドとして転位される、請求項101~109のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項111】
前記トランスポザーゼが、前記トランスポザーゼのN末端又はC末端の近位に1つ以上の核局在化シグナル(NLS)を含む、請求項101~110のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項112】
前記1つ以上のNLSのNLSが、配列番号455~470からなる群からの配列と少なくとも80%同一である配列を含む、請求項111に記載の操作されたトランスポザーゼ系。
【請求項113】
前記二本鎖デオキシリボ核酸ポリヌクレオチドが、真核生物、植物、真菌、哺乳類、齧歯類、又はヒト二本鎖デオキシリボ核酸ポリヌクレオチドである、請求項101~112のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項114】
前記隣接配列が、配列番号350、352、355、356、359、361、362、及び367のうちのいずれか1つの少なくとも90個の連続するヌクレオチドと少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、又は100%の配列同一性を有する、請求項101~113のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項115】
前記二本鎖核酸が、前記カーゴ配列に隣接する別の隣接配列を含み、前記別の隣接配列が、配列番号350~454のうちのいずれか1つの少なくとも90個の連続するヌクレオチドと少なくとも約70%の配列同一性を有する、請求項101~114のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項116】
前記別の隣接配列が、配列番号351、353、354、357、358、360、363、及び366のうちのいずれか1つの少なくとも90個の連続するヌクレオチドと少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、又は100%の配列同一性を有する、請求項115に記載の操作されたトランスポザーゼ系。
【請求項117】
前記隣接配列が、前記カーゴ核酸配列の左端に隣接し、前記別の隣接配列が、前記カーゴ核酸配列の右端に隣接する、請求項115又は116に記載の操作されたトランスポザーゼ系。
【請求項118】
前記トランスポザーゼが、前記標的核酸遺伝子座に隣接する挿入モチーフを認識するように構成されている、請求項101~117のいずれか一項に記載の操作されたトランスポザーゼ系。
【請求項119】
前記挿入モチーフが、配列AATGACの少なくとも3、4、5、又は6個の連続するヌクレオチドを含む、請求項118に記載の操作されたトランスポザーゼ系。
【請求項120】
請求項101~119のいずれか一項に記載の操作されたトランスポザーゼ系をコードする、デオキシリボ核酸ポリヌクレオチド。
【請求項121】
カーゴ配列を含む二本鎖デオキシリボ核酸ポリヌクレオチドを結合、ニッキング、切断、マーキング、修飾、又は転位する方法であって、前記方法が、
前記二本鎖デオキシリボ核酸ポリヌクレオチドを、前記カーゴヌクレオチド配列を標的核酸遺伝子座に転位するように構成されたトランスポザーゼと接触させることを含み、
前記二本鎖デオキシリボ核酸ポリヌクレオチドが、前記カーゴ配列に隣接する隣接配列を含み、前記隣接配列が、配列番号350~454のうちのいずれか1つの少なくとも90個の連続するヌクレオチドと少なくとも約70%の配列同一性を有する、方法。
【請求項122】
前記トランスポザーゼが、未培養生物に由来する、請求項121に記載の方法。
【請求項123】
前記トランスポザーゼが、TnpAトランスポザーゼ又はTnpBトランスポザーゼではない、請求項122に記載の方法。
【請求項124】
前記トランスポザーゼが、TnpAトランスポザーゼと80%未満の配列同一性を有する、請求項121~123のいずれか一項に記載の方法。
【請求項125】
前記トランスポザーゼが、TnpBトランスポザーゼと80%未満の配列同一性を有する、請求項121~124のいずれか一項に記載の方法。
【請求項126】
前記トランスポザーゼが、配列番号1~349のうちのいずれか1つと少なくとも75%の配列同一性を有する配列を含む、請求項121~125のいずれか一項に記載の方法。
【請求項127】
前記トランスポザーゼが、配列番号1、3、5、7、9、11、13、15、及び18~19のうちのいずれか1つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、又は100%の配列同一性を有する、請求項126に記載の方法。
【請求項128】
前記トランスポザーゼが、触媒チロシン残基を含む、請求項121~127のいずれか一項に記載の方法。
【請求項129】
前記トランスポザーゼが、サブ末端回文配列を含む左側領域及びサブ末端回文配列を含む右側領域に結合するように構成されている、請求項121~128のいずれか一項に記載の方法。
【請求項130】
前記トランスポザーゼが、左側認識配列又は右側認識配列に適合する、請求項121~129のいずれか一項に記載の方法。
【請求項131】
前記二本鎖デオキシリボ核酸ポリヌクレオチドが、一本鎖デオキシリボ核酸ポリヌクレオチドとして転位される、請求項121~130のいずれか一項に記載の方法。
【請求項132】
前記トランスポザーゼが、前記トランスポザーゼのN末端又はC末端の近位に1つ以上の核局在化シグナル(NLS)を含む、請求項121~131のいずれか一項に記載の方法。
【請求項133】
前記1つ以上のNLSのNLSが、配列番号455~470からなる群からの配列と少なくとも80%同一である配列を含む、請求項121~132のいずれか一項に記載の方法。
【請求項134】
前記二本鎖デオキシリボ核酸ポリヌクレオチドが、真核生物、植物、真菌、哺乳類、齧歯類、又はヒト二本鎖デオキシリボ核酸ポリヌクレオチドである、請求項121~133のいずれか一項に記載の方法。
【請求項135】
前記隣接配列が、配列番号350、352、355、356、359、361、362、及び367のうちのいずれか1つの少なくとも90個の連続するヌクレオチドと少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、又は100%の配列同一性を有する、請求項121~134のいずれか一項に記載の方法。
【請求項136】
前記二本鎖デオキシリボ核酸ポリヌクレオチドが、前記カーゴ配列に隣接する別の隣接配列を含み、前記別の隣接配列が、配列番号350~454のうちのいずれか1つの少なくとも90個の連続するヌクレオチドと少なくとも約70%の配列同一性を有する、請求項121~135のいずれか一項に記載の方法。
【請求項137】
前記別の隣接配列が、配列番号351、353、354、357、358、360、363、及び366のうちのいずれか1つの少なくとも90個の連続するヌクレオチドと少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、又は100%の配列同一性を有する、請求項135に記載の方法。
【請求項138】
前記隣接配列が、前記カーゴ核酸配列の左端に隣接し、前記別の隣接配列が、前記カーゴ核酸配列の右端に隣接する、請求項135又は137に記載の方法。
【請求項139】
前記トランスポザーゼが、前記標的核酸遺伝子座に隣接する挿入モチーフを認識するように構成されている、請求項121~138のいずれか一項に記載の方法。
【請求項140】
前記挿入モチーフが、配列AATGACの少なくとも3、4、5、又は6個の連続するヌクレオチドを含む、請求項139に記載の方法。
【請求項141】
標的核酸遺伝子座を修飾する方法であって、前記方法が、請求項101~119のいずれか一項に記載の操作されたトランスポザーゼ系を前記標的核酸遺伝子座に送達することを含み、前記トランスポザーゼが、前記カーゴヌクレオチド配列を前記標的核酸遺伝子座に転位するように構成されており、前記複合体が、前記複合体の前記標的核酸遺伝子座への結合時に、前記複合体が前記標的核酸遺伝子座を修飾するように構成されている、方法。
【請求項142】
前記標的核酸遺伝子座を修飾することが、前記標的核酸遺伝子座を結合、ニッキング、切断、マーキング、修飾、又は転位することを含む、請求項141に記載の方法。
【請求項143】
前記標的核酸遺伝子座が、デオキシリボ核酸(DNA)を含む、請求項141又は142に記載の方法。
【請求項144】
前記標的核酸遺伝子座が、ゲノムDNA、ウイルスDNA、又は細菌DNAを含む、請求項143に記載の方法。
【請求項145】
前記標的核酸遺伝子座が、インビトロである、請求項141~144のいずれか一項に記載の方法。
【請求項146】
前記標的核酸遺伝子座が、細胞内にある、請求項141~145のいずれか一項に記載の方法。
【請求項147】
前記細胞が、原核細胞、細菌細胞、真核細胞、真菌細胞、植物細胞、動物細胞、哺乳類細胞、齧歯類細胞、霊長類細胞、ヒト細胞、又は初代細胞である、請求項146に記載の方法。
【請求項148】
前記細胞が、初代細胞である、請求項146又は147に記載の方法。
【請求項149】
前記初代細胞が、T細胞である、請求項148に記載の方法。
【請求項150】
前記初代細胞が、造血幹細胞(HSC)である、請求項148に記載の方法。
【請求項151】
前記操作されたトランスポザーゼ系を前記標的核酸遺伝子座に送達することが、前記トランスポザーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む、請求項141~150のいずれか一項に記載の方法。
【請求項152】
前記核酸が、前記トランスポザーゼをコードする前記オープンリーディングフレームが作動可能に連結されているプロモーターを含む、請求項151に記載の方法。
【請求項153】
前記操作されたトランスポザーゼ系を前記標的核酸遺伝子座に送達することが、前記トランスポザーゼをコードする前記オープンリーディングフレームを含有するキャッピングされたmRNAを送達することを含む、請求項151又は152に記載の方法。
【請求項154】
前記操作されたトランスポザーゼ系を前記標的核酸遺伝子座に送達することが、翻訳されたポリペプチドを送達することを含む、請求項141~153のいずれか一項に記載の方法。
【請求項155】
前記トランスポザーゼが、前記標的核酸遺伝子座で、又は前記標的核酸遺伝子座の近位で、一本鎖切断又は二本鎖切断を誘導する、請求項141~154のいずれか一項に記載の方法。
【請求項156】
前記トランスポザーゼが、前記標的遺伝子座内又は前記標的遺伝子座の5’に互い違いの一本鎖切断を誘導する、請求項155に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
相互参照
本出願は、2021年9月8日に出願された「SYSTEMS AND METHODS FOR TRANSPOSING CARGO NUCLEOTIDE SEQUENCES」と題された米国仮特許出願第63/241,934号の利益を主張するものであり、その全体が参照により本明細書に組み込まれる。
【背景技術】
【0002】
転位因子は、遺伝子の機能及び進化において重要な役割を果たす移動可能なDNA配列である。転位因子はほぼ全ての種類の生命体で見られるが、それらの保有率は生物間で異なり、真核生物ゲノムの大部分は転位因子をコードする(ヒトでは少なくとも45%)。転位因子に関する基礎的研究は1940年代に行われたが、DNA操作及び遺伝子編集の用途におけるそれらの潜在的な有用性が認識されるようになったのは近年のことである。
【0003】
配列表
本出願は、XML形式で電子的に提出された配列表を含み、参照によりその全体が本明細書に組み込まれる。2022年9月7日に作成された当該XMLコピーは、55921-733601.xmlと名付けられ、452,421バイトのサイズである。
【発明の概要】
【0004】
いくつかの態様では、本開示は、操作されたトランスポザーゼ系を提供し、上記操作されたトランスポザーゼ系は、カーゴヌクレオチド配列を含む二本鎖核酸であって、カーゴヌクレオチド配列がトランスポザーゼと相互作用するように構成されている、二本鎖核酸と、トランスポザーゼであって、カーゴヌクレオチド配列を標的核酸遺伝子座に転位するように構成され、未培養微生物に由来する、トランスポザーゼと、を含む。
【0005】
いくつかの実施形態では、トランスポザーゼは、配列番号1~349のうちのいずれか1つと少なくとも75%の配列同一性を有する配列を含む。いくつかの実施形態では、トランスポザーゼは、TnpAトランスポザーゼ又はTnpBトランスポザーゼではない。いくつかの実施形態では、トランスポザーゼは、TnpAトランスポザーゼと80%未満の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、TnpBトランスポザーゼと80%未満の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、配列番号1、3、5、7、9、11、13、15、及び18~19のうちのいずれか1つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、触媒チロシン残基を含む。いくつかの実施形態では、トランスポザーゼは、サブ末端回文配列を含む左側領域及びサブ末端回文配列を含む右側領域に結合するように構成されている。いくつかの実施形態では、トランスポザーゼは、一本鎖デオキシリボ核酸ポリヌクレオチドとしてカーゴヌクレオチド配列を転位するように構成されている。いくつかの実施形態では、トランスポザーゼは、トランスポザーゼのN末端又はC末端の近位に1つ以上の核局在化配列(NLS)を含む。いくつかの実施形態では、NLSは、配列番号455~470からなる群からの配列と少なくとも80%同一である配列を含む。いくつかの実施形態では、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、又はSmith-Waterman相同性検索アルゴリズムのパラメーターを用いるCLUSTALWによって決定される。いくつかの実施形態では、配列同一性は、3のワード長(W)、10の期待値(E)のパラメーター、及び11の存在、1の延長でギャップコストを設定しているBLOSUM62スコアリングマトリックスを使用し、条件付き組成スコアマトリックス調整を使用した、BLASTP相同性検索アルゴリズムによって決定される。
【0006】
いくつかの態様では、本開示は、操作されたトランスポザーゼ系を提供し、上記操作されたトランスポザーゼ系は、カーゴヌクレオチド配列を含む二本鎖核酸であって、カーゴヌクレオチド配列がトランスポザーゼと相互作用するように構成されている、二本鎖核酸と、トランスポザーゼであって、カーゴヌクレオチド配列を標的核酸遺伝子座に転位するように構成され、配列番号1~349のうちのいずれか1つと少なくとも75%の配列同一性を有する配列を含む、トランスポザーゼと、を含む。
【0007】
いくつかの実施形態では、トランスポザーゼは、未培養微生物に由来する。いくつかの実施形態では、トランスポザーゼは、TnpAトランスポザーゼ又はTnpBトランスポザーゼではない。いくつかの実施形態では、トランスポザーゼは、TnpAトランスポザーゼと80%未満の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、TnpBトランスポザーゼと80%未満の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、配列番号1、3、5、7、9、11、13、15、及び18~19のうちのいずれか1つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、触媒チロシン残基を含む。いくつかの実施形態では、トランスポザーゼは、サブ末端回文配列を含む左側領域及びサブ末端回文配列を含む右側領域に結合するように構成されている。いくつかの実施形態では、トランスポザーゼは、左側認識配列又は右側認識配列に適合する。いくつかの実施形態では、トランスポザーゼは、一本鎖デオキシリボ核酸ポリヌクレオチドとしてカーゴヌクレオチド配列を転位するように構成されている。いくつかの実施形態では、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、又はSmith-Waterman相同性検索アルゴリズムのパラメーターを用いるCLUSTALWによって決定される。いくつかの実施形態では、配列同一性は、3のワード長(W)、10の期待値(E)のパラメーター、及び11の存在、1の延長でギャップコストを設定しているBLOSUM62スコアリングマトリックスを使用し、条件付き組成スコアマトリックス調整を使用した、BLASTP相同性検索アルゴリズムによって決定される。
【0008】
いくつかの態様では、本開示は、本明細書に開示される任意の操作されたトランスポザーゼ系をコードするデオキシリボ核酸ポリヌクレオチドを提供する。
【0009】
いくつかの態様では、本開示は、生物における発現に最適化された操作された核酸配列を含む核酸を提供し、核酸はトランスポザーゼをコードし、トランスポザーゼは未培養微生物に由来し、生物は未培養微生物ではない。
【0010】
いくつかの実施形態では、トランスポザーゼは、配列番号1~349のうちのいずれか1つと少なくとも75%の配列同一性を有するバリアントを含む。いくつかの実施形態では、トランスポザーゼは、トランスポザーゼのN末端又はC末端の近位に1つ以上の核局在化配列(NLS)をコードする配列を含む。いくつかの実施形態では、NLSは、配列番号455~470から選択される配列を含む。いくつかの実施形態では、NLSは、配列番号456を含む。いくつかの実施形態では、NLSは、トランスポザーゼのN末端の近位にある。いくつかの実施形態では、NLSは、配列番号455を含む。いくつかの実施形態では、NLSは、トランスポザーゼのC末端の近位にある。いくつかの実施形態では、生物は、原核生物、細菌、真核生物、真菌、植物、哺乳類、齧歯類、又はヒトである。
【0011】
いくつかの態様では、本開示は、本明細書に開示される任意の核酸を含むベクターを提供する。いくつかの実施形態では、核酸は、トランスポザーゼと複合体を形成するように構成されたカーゴヌクレオチド配列をコードする核酸を更に含む。いくつかの実施形態では、ベクターは、プラスミド、ミニサークル、CELiD、アデノ随伴ウイルス(AAV)由来ビリオン、又はレンチウイルスである。
【0012】
いくつかの態様では、本開示は、本明細書に開示される任意のベクターを含む細胞を提供する。
【0013】
いくつかの態様では、本開示は、本明細書に開示される任意の細胞を培養することを含む、トランスポザーゼを製造する方法を提供する。
【0014】
いくつかの態様では、本開示は、カーゴ配列を含む二本鎖デオキシリボ核酸ポリヌクレオチドを結合、ニッキング、切断、マーキング、修飾、又は転位する方法を提供し、上記方法は、二本鎖デオキシリボ核酸ポリヌクレオチドを、カーゴヌクレオチド配列を標的核酸遺伝子座に転位するように構成されたトランスポザーゼと接触させることを含み、トランスポザーゼは、配列番号1~349のうちのいずれか1つと少なくとも75%の配列同一性を有する配列を含む。
【0015】
いくつかの実施形態では、トランスポザーゼは、未培養微生物に由来する。いくつかの実施形態では、トランスポザーゼは、TnpAトランスポザーゼ又はTnpBトランスポザーゼではない。いくつかの実施形態では、トランスポザーゼは、TnpAトランスポザーゼと80%未満の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、TnpBトランスポザーゼと80%未満の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、配列番号1、3、5、7、9、11、13、15、及び18~19のうちのいずれか1つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、又は100%の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、触媒チロシン残基を含む。いくつかの実施形態では、トランスポザーゼは、サブ末端回文配列を含む左側領域及びサブ末端回文配列を含む右側領域に結合するように構成されている。いくつかの実施形態では、トランスポザーゼは、左側認識配列又は右側認識配列に適合する。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、一本鎖デオキシリボ核酸ポリヌクレオチドとして転位される。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、真核生物、植物、真菌、哺乳類、齧歯類、又はヒト二本鎖デオキシリボ核酸ポリヌクレオチドである。
【0016】
いくつかの態様では、本開示は、標的核酸遺伝子座を修飾する方法を提供し、上記方法は、本明細書に開示される操作されたトランスポザーゼ系を標的核酸遺伝子座に送達することを含み、トランスポザーゼは、カーゴヌクレオチド配列を標的核酸遺伝子座に転位するように構成されており、複合体は、複合体の標的核酸遺伝子座への結合時に、複合体が標的核酸遺伝子座を修飾するように構成されている。
【0017】
いくつかの実施形態では、標的核酸遺伝子座を修飾することは、標的核酸遺伝子座を結合、ニッキング、切断、マーキング、修飾、又は転位することを含む。いくつかの実施形態では、標的核酸遺伝子座は、デオキシリボ核酸(DNA)を含む。いくつかの実施形態では、標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、又は細菌DNAを含む。いくつかの実施形態では、標的核酸遺伝子座は、インビトロである。いくつかの実施形態では、標的核酸遺伝子座は、細胞内にある。いくつかの実施形態では、細胞は、原核細胞、細菌細胞、真核細胞、真菌細胞、植物細胞、動物細胞、哺乳類細胞、齧歯類細胞、霊長類細胞、ヒト細胞、又は初代細胞である。いくつかの実施形態では、細胞は、初代細胞である。いくつかの実施形態では、初代細胞は、T細胞である。いくつかの実施形態では、初代細胞は、造血幹細胞(HSC)である。いくつかの実施形態では、操作されたトランスポザーゼ系を標的核酸遺伝子座に送達することは、本明細書に開示される核酸又は本明細書に開示される任意のベクターを送達することを含む。いくつかの実施形態では、操作されたトランスポザーゼ系を標的核酸遺伝子座に送達することは、トランスポザーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む。いくつかの実施形態では、核酸は、トランスポザーゼをコードするオープンリーディングフレームが作動可能に連結されているプロモーターを含む。いくつかの実施形態では、操作されたトランスポザーゼ系を標的核酸遺伝子座に送達することは、トランスポザーゼをコードするオープンリーディングフレームを含有するキャッピングされたmRNAを送達することを含む。いくつかの実施形態では、操作されたトランスポザーゼ系を標的核酸遺伝子座に送達することは、翻訳されたポリペプチドを送達することを含む。いくつかの実施形態では、トランスポザーゼは、標的核酸遺伝子座で、又は標的核酸遺伝子座の近位で、一本鎖切断又は二本鎖切断を誘導する。いくつかの実施形態では、トランスポザーゼは、標的遺伝子座内又は標的遺伝子座の5’に互い違いの一本鎖切断を誘導する。
【0018】
いくつかの態様では、本開示は、配列番号1~349のうちのいずれか1つ又はそのバリアントと少なくとも75%の配列同一性を有する異種トランスポザーゼをコードするオープンリーディングフレームを含む、宿主細胞を提供する。いくつかの実施形態では、トランスポザーゼは、配列番号1、3、5、7、9、11、13、15、又は18~19のうちのいずれか1つと少なくとも75%の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、配列番号1、3、5、7、9、11、13、15、又は18~19のうちのいずれか1つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、又は100%の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、配列番号2、4、6、8、10、12、14、又は17のうちのいずれか1つと少なくとも75%の配列同一性を有する。いくつかの実施形態では、宿主細胞は、E.coli細胞である。いくつかの実施形態では、E.coli細胞は、λDE3リソゲンであるか、又はE.coli細胞は、BL21(DE3)株である。いくつかの実施形態では、E.coli細胞は、ompT lon遺伝子型を有する。いくつかの実施形態では、オープンリーディングフレームは、T7プロモーター配列、T7-lacプロモーター配列、lacプロモーター配列、tacプロモーター配列、trcプロモーター配列、ParaBADプロモーター配列、PrhaBADプロモーター配列、T5プロモーター配列、cspAプロモーター配列、araPBADプロモーター、ファージラムダからの強い左向きプロモーター(pLプロモーター)、又はそれらの任意の組み合わせに作動可能に連結されている。いくつかの実施形態では、オープンリーディングフレームは、トランスポザーゼをコードする配列にインフレームで連結された親和性タグをコードする配列を含む。いくつかの実施形態では、親和性タグは、固定化金属親和性クロマトグラフィー(IMAC)タグである。いくつかの実施形態では、IMACタグは、ポリヒスチジンタグである。いくつかの実施形態では、親和性タグは、mycタグ、ヒトインフルエンザヘマグルチニン(HA)タグ、マルトース結合タンパク質(MBP)タグ、グルタチオンS-トランスフェラーゼ(GST)タグ、ストレプトアビジンタグ、FLAGタグ、又はそれらの任意の組み合わせである。いくつかの実施形態では、親和性タグは、プロテアーゼ切断部位をコードするリンカー配列を介して、トランスポザーゼをコードする配列にインフレームで連結されている。いくつかの実施形態では、プロテアーゼ切断部位は、タバコエッチウイルス(TEV)プロテアーゼ切断部位、PreScission(登録商標)プロテアーゼ切断部位、トロンビン切断部位、第Xa因子切断部位、エンテロキナーゼ切断部位、又はそれらの任意の組み合わせである。いくつかの実施形態では、オープンリーディングフレームは、宿主細胞における発現のためにコドン最適化される。いくつかの実施形態では、オープンリーディングフレームは、ベクター上に提供される。いくつかの実施形態では、オープンリーディングフレームは、宿主細胞のゲノムに組み込まれる。
【0019】
いくつかの態様では、本開示は、適合する液体培地中に、本明細書に開示される任意の宿主細胞を含む、培養物を提供する。
【0020】
いくつかの態様では、本開示は、適合する成長培地中で、本明細書に開示される任意の宿主細胞を培養することを含む、トランスポザーゼを産生する方法を提供する。
【0021】
いくつかの実施形態では、方法は、追加の化学剤又は増加された量の栄養素を添加することによって、トランスポザーゼの発現を誘導することを更に含む。いくつかの実施形態では、追加の化学剤又は増加された量の栄養素は、イソプロピルβ-D-1-チオガラクトピラノシド(IPTG)又は追加の量のラクトースを含む。いくつかの実施形態では、方法は、培養後に宿主細胞を単離することと、宿主細胞を溶解してタンパク質抽出物を産生することとを更に含む。いくつかの実施形態では、方法は、タンパク質抽出物をIMAC、又はイオン親和性クロマトグラフィーに供することを更に含む。いくつかの実施形態では、オープンリーディングフレームは、トランスポザーゼをコードする配列にインフレームで連結されたIMAC親和性タグをコードする配列を含む。いくつかの実施形態では、IMAC親和性タグは、プロテアーゼ切断部位をコードするリンカー配列を介して、トランスポザーゼをコードする配列にインフレームで連結されている。いくつかの実施形態では、プロテアーゼ切断部位は、タバコエッチウイルス(TEV)プロテアーゼ切断部位、PreScission(登録商標)プロテアーゼ切断部位、トロンビン切断部位、第Xa因子切断部位、エンテロキナーゼ切断部位、又はそれらの任意の組み合わせを含む。いくつかの実施形態では、方法は、プロテアーゼ切断部位に対応するプロテアーゼをトランスポザーゼと接触させることによって、IMAC親和性タグを切断することを更に含む。いくつかの実施形態では、方法は、サブトラクティブIMAC親和性クロマトグラフィーを実施して、トランスポザーゼを含む組成物から親和性タグを除去することを更に含む。
【0022】
いくつかの態様では、本開示は、細胞中の遺伝子座を破壊する方法を提供し、上記方法は、細胞に組成物を接触させることを含み、組成物は、カーゴヌクレオチド配列を含む二本鎖核酸であって、カーゴヌクレオチド配列が、トランスポザーゼと相互作用するように構成されている、二本鎖核酸と、トランスポザーゼであって、カーゴヌクレオチド配列を標的核酸遺伝子座に転位するように構成され、配列番号1~349のうちのいずれか1つと少なくとも75%の配列同一性を有する配列を含み、細胞内でTnpAトランスポザーゼと少なくとも同等の転位活性を有する、トランスポザーゼと、を含む。
【0023】
いくつかの実施形態では、転位活性は、標的核酸遺伝子座を含む細胞にトランスポザーゼを導入し、細胞内の標的核酸遺伝子座の転位を検出することによって、インビトロで測定される。いくつかの実施形態では、組成物は、20ピコモル(pmol)以下のトランスポザーゼを含む。いくつかの実施形態では、組成物は、1pmol以下のトランスポザーゼを含む。
【0024】
いくつかの態様では、本開示は、操作されたトランスポザーゼ系を提供し、上記操作されたトランスポザーゼ系は、カーゴヌクレオチド配列を含む二本鎖核酸であって、カーゴヌクレオチド配列がトランスポザーゼと相互作用するように構成されている、二本鎖核酸と、カーゴヌクレオチド配列を標的核酸遺伝子座に転位するように構成されている、トランスポザーゼとを含み、二本鎖核酸は、カーゴ配列に隣接する隣接配列を含み、隣接配列は、配列番号350~454のうちのいずれか1つの少なくとも90個の連続するヌクレオチドと少なくとも約70%の配列同一性を有する。
【0025】
いくつかの実施形態では、トランスポザーゼは、未培養生物に由来する。いくつかの実施形態では、トランスポザーゼは、TnpAトランスポザーゼ又はTnpBトランスポザーゼではない。いくつかの実施形態では、トランスポザーゼは、TnpAトランスポザーゼと80%未満の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、TnpBトランスポザーゼと80%未満の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、配列番号1~349のうちのいずれか1つと少なくとも75%の配列同一性を有する配列を含む。いくつかの実施形態では、トランスポザーゼは、配列番号1、3、5、7、9、11、13、15、及び18~19のうちのいずれか1つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、又は100%の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、触媒チロシン残基を含む。いくつかの実施形態では、トランスポザーゼは、サブ末端回文配列を含む左側領域及びサブ末端回文配列を含む右側領域に結合するように構成されている。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、一本鎖デオキシリボ核酸ポリヌクレオチドとして転位される。いくつかの実施形態では、トランスポザーゼは、トランスポザーゼのN末端又はC末端の近位に1つ以上の核局在化シグナル(NLS)を含む。いくつかの実施形態では、1つ以上のNLSのNLSは、配列番号455~470からなる群からの配列と少なくとも80%同一である配列を含む。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、真核生物、植物、真菌、哺乳類、齧歯類、又はヒト二本鎖デオキシリボ核酸ポリヌクレオチドである。いくつかの実施形態では、隣接配列は、配列番号350、352、355、356、359、361、362、及び367のうちのいずれか1つの少なくとも90個の連続するヌクレオチドと少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、又は100%の配列同一性を有する。いくつかの実施形態では、二本鎖核酸は、カーゴ配列に隣接する別の隣接配列を含み、上記別の隣接配列は、配列番号350~454のうちのいずれか1つの少なくとも90個の連続するヌクレオチドと少なくとも約70%の配列同一性を有する。いくつかの実施形態では、別の隣接配列は、配列番号351、353、354、357、358、360、363、及び366のうちのいずれか1つの少なくとも90個の連続するヌクレオチドと少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、又は100%の配列同一性を有する。いくつかの実施形態では、隣接配列は、カーゴ核酸配列の左端に隣接し、別の隣接配列は、カーゴ核酸配列の右端に隣接する。いくつかの実施形態では、トランスポザーゼは、標的核酸遺伝子座に隣接する挿入モチーフを認識するように構成されている。いくつかの実施形態では、挿入モチーフは、配列AATGACの少なくとも3、4、5、又は6個の連続するヌクレオチドを含む。
【0026】
いくつかの態様では、本開示は、本明細書に開示される任意の操作されたトランスポザーゼ系をコードするデオキシリボ核酸ポリヌクレオチドを提供する。
【0027】
いくつかの態様では、本開示は、カーゴ配列を含む二本鎖デオキシリボ核酸ポリヌクレオチドを結合、ニッキング、切断、マーキング、修飾、又は転位する方法を提供し、上記方法は、二本鎖デオキシリボ核酸ポリヌクレオチドを、カーゴヌクレオチド配列を標的核酸遺伝子座に転位するように構成されたトランスポザーゼと接触させることを含み、二本鎖デオキシリボ核酸ポリヌクレオチドは、カーゴ配列に隣接する隣接配列を含み、隣接配列は、配列番号350~454のうちのいずれか1つの少なくとも90個の連続するヌクレオチドと少なくとも約70%の配列同一性を有する。
【0028】
いくつかの実施形態では、トランスポザーゼは、未培養生物に由来する。いくつかの実施形態では、トランスポザーゼは、TnpAトランスポザーゼ又はTnpBトランスポザーゼではない。いくつかの実施形態では、トランスポザーゼは、TnpAトランスポザーゼと80%未満の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、TnpBトランスポザーゼと80%未満の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、配列番号1~349のうちのいずれか1つと少なくとも75%の配列同一性を有する配列を含む。いくつかの実施形態では、トランスポザーゼは、配列番号1、3、5、7、9、11、13、15、及び18~19のうちのいずれか1つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、又は100%の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、触媒チロシン残基を含む。いくつかの実施形態では、トランスポザーゼは、サブ末端回文配列を含む左側領域及びサブ末端回文配列を含む右側領域に結合するように構成されている。いくつかの実施形態では、トランスポザーゼは、左側認識配列又は右側認識配列に適合する。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、一本鎖デオキシリボ核酸ポリヌクレオチドとして転位される。いくつかの実施形態では、トランスポザーゼは、トランスポザーゼのN末端又はC末端の近位に1つ以上の核局在化シグナル(NLS)を含む。いくつかの実施形態では、1つ以上のNLSのNLSは、配列番号455~470からなる群からの配列と少なくとも80%同一である配列を含む。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、真核生物、植物、真菌、哺乳類、齧歯類、又はヒト二本鎖デオキシリボ核酸ポリヌクレオチドである。いくつかの実施形態では、隣接配列は、配列番号350、352、355、356、359、361、362、及び367のうちのいずれか1つの少なくとも90個の連続するヌクレオチドと少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、又は100%の配列同一性を有する。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、カーゴ配列に隣接する別の隣接配列を含み、上記別の隣接配列は、配列番号350~454のうちのいずれか1つの少なくとも90個の連続するヌクレオチドと少なくとも約70%の配列同一性を有する。いくつかの実施形態では、別の隣接配列は、配列番号351、353、354、357、358、360、363、及び366のうちのいずれか1つの少なくとも90個の連続するヌクレオチドと少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、又は100%の配列同一性を有する。いくつかの実施形態では、隣接配列は、カーゴ核酸配列の左端に隣接し、別の隣接配列は、カーゴ核酸配列の右端に隣接する。いくつかの実施形態では、トランスポザーゼは、標的核酸遺伝子座に隣接する挿入モチーフを認識するように構成されている。いくつかの実施形態では、挿入モチーフは、配列AATGACの少なくとも3、4、5、又は6個の連続するヌクレオチドを含む。
【0029】
いくつかの態様では、本開示は、標的核酸遺伝子座を修飾する方法を提供し、上記方法は、本明細書に開示される操作されたトランスポザーゼ系を標的核酸遺伝子座に送達することを含み、トランスポザーゼは、カーゴヌクレオチド配列を標的核酸遺伝子座に転位するように構成されており、複合体は、複合体の標的核酸遺伝子座への結合時に、複合体が標的核酸遺伝子座を修飾するように構成されている。
【0030】
いくつかの実施形態では、標的核酸遺伝子座を修飾することは、標的核酸遺伝子座を結合、ニッキング、切断、マーキング、修飾、又は転位することを含む。いくつかの実施形態では、標的核酸遺伝子座は、デオキシリボ核酸(DNA)を含む。いくつかの実施形態では、標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、又は細菌DNAを含む。いくつかの実施形態では、標的核酸遺伝子座は、インビトロである。いくつかの実施形態では、標的核酸遺伝子座は、細胞内にある。いくつかの実施形態では、細胞は、原核細胞、細菌細胞、真核細胞、真菌細胞、植物細胞、動物細胞、哺乳類細胞、齧歯類細胞、霊長類細胞、ヒト細胞、又は初代細胞である。いくつかの実施形態では、細胞は、初代細胞である。いくつかの実施形態では、初代細胞は、T細胞である。いくつかの実施形態では、初代細胞は、造血幹細胞(HSC)である。いくつかの実施形態では、操作されたトランスポザーゼ系を標的核酸遺伝子座に送達することは、トランスポザーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む。いくつかの実施形態では、核酸は、トランスポザーゼをコードするオープンリーディングフレームが作動可能に連結されているプロモーターを含む。いくつかの実施形態では、操作されたトランスポザーゼ系を標的核酸遺伝子座に送達することは、トランスポザーゼをコードするオープンリーディングフレームを含有するキャッピングされたmRNAを送達することを含む。いくつかの実施形態では、操作されたトランスポザーゼ系を標的核酸遺伝子座に送達することは、翻訳されたポリペプチドを送達することを含む。いくつかの実施形態では、トランスポザーゼは、標的核酸遺伝子座で、又は標的核酸遺伝子座の近位で、一本鎖切断又は二本鎖切断を誘導する。いくつかの実施形態では、トランスポザーゼは、標的遺伝子座内又は標的遺伝子座の5’に互い違いの一本鎖切断を誘導する。
【0031】
いくつかの態様では、本開示は、操作されたトランスポザーゼ系を提供し、上記操作されたトランスポザーゼ系は、(a)カーゴヌクレオチド配列を含む二本鎖核酸であって、カーゴヌクレオチド配列がトランスポザーゼと相互作用するように構成されている、二本鎖核酸と、(b)トランスポザーゼであって、(i)カーゴヌクレオチド配列を標的核酸遺伝子座に転位するように構成され、(ii)未培養微生物に由来する、トランスポザーゼと、を含む。いくつかの実施形態では、カーゴヌクレオチド配列は、異種配列である。いくつかの実施形態では、カーゴヌクレオチド配列は、操作された配列である。いくつかの実施形態では、カーゴヌクレオチド配列は、生物中に存在する野生型ゲノム配列ではない。いくつかの実施形態では、トランスポザーゼは、配列番号1~349のうちのいずれか1つと少なくとも75%の配列同一性を有する配列を含む。いくつかの実施形態では、トランスポザーゼは、TnpAトランスポザーゼ又はTnpBトランスポザーゼではない。いくつかの実施形態では、トランスポザーゼは、TnpAトランスポザーゼと80%未満の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、TnpBトランスポザーゼと80%未満の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、触媒チロシン残基を含む。いくつかの実施形態では、トランスポザーゼは、サブ末端回文配列を含む左側領域及びサブ末端回文配列を含む右側領域に結合するように構成されている。いくつかの実施形態では、トランスポザーゼは、一本鎖デオキシリボ核酸ポリヌクレオチドとしてカーゴヌクレオチド配列を転位するように構成されている。いくつかの実施形態では、トランスポザーゼは、トランスポザーゼのN末端又はC末端の近位に1つ以上の核局在化配列(NLS)を含む。いくつかの実施形態では、NLSは、配列番号455~470からなる群からの配列と少なくとも80%同一である配列を含む。いくつかの実施形態では、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、又はSmith-Waterman相同性検索アルゴリズムのパラメーターを用いるCLUSTALWによって決定される。いくつかの実施形態では、配列同一性は、3のワード長(W)、10の期待値(E)のパラメーター、及び11の存在、1の延長でギャップコストを設定しているBLOSUM62スコアリングマトリックスを使用し、条件付き組成スコアマトリックス調整を使用した、BLASTP相同性検索アルゴリズムによって決定される。
【0032】
いくつかの態様では、本開示は、操作されたトランスポザーゼ系を提供し、上記操作されたトランスポザーゼ系は、(a)カーゴヌクレオチド配列を含む二本鎖核酸であって、カーゴヌクレオチド配列がトランスポザーゼと相互作用するように構成されている、二本鎖核酸と、(b)トランスポザーゼであって、(i)カーゴヌクレオチド配列を標的核酸遺伝子座に転位するように構成され、(ii)配列番号1~349のうちのいずれか1つと少なくとも75%の配列同一性を有する配列を含む、トランスポザーゼと、を含む。いくつかの実施形態では、トランスポザーゼは、未培養微生物に由来する。いくつかの実施形態では、トランスポザーゼは、TnpAトランスポザーゼ又はTnpBトランスポザーゼではない。いくつかの実施形態では、トランスポザーゼは、TnpAトランスポザーゼと80%未満の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、TnpBトランスポザーゼと80%未満の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、触媒チロシン残基を含む。いくつかの実施形態では、トランスポザーゼは、サブ末端回文配列を含む左側領域及びサブ末端回文配列を含む右側領域に結合するように構成されている。いくつかの実施形態では、トランスポザーゼは、一本鎖デオキシリボ核酸ポリヌクレオチドとしてカーゴヌクレオチド配列を転位するように構成されている。いくつかの実施形態では、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、又はSmith-Waterman相同性検索アルゴリズムのパラメーターを用いるCLUSTALWによって決定される。いくつかの実施形態では、配列同一性は、3のワード長(W)、10の期待値(E)のパラメーター、及び11の存在、1の延長でギャップコストを設定しているBLOSUM62スコアリングマトリックスを使用し、条件付き組成スコアマトリックス調整を使用した、BLASTP相同性検索アルゴリズムによって決定される。
【0033】
いくつかの態様では、本開示は、本明細書に記載される態様又は実施形態のうちのいずれか1つの操作されたトランスポザーゼ系をコードするデオキシリボ核酸ポリヌクレオチドを提供する。
【0034】
いくつかの態様では、本開示は、生物における発現に最適化された操作された核酸配列を含む核酸を提供し、核酸はトランスポザーゼをコードし、トランスポザーゼは未培養微生物に由来し、生物は未培養微生物ではない。いくつかの実施形態では、トランスポザーゼは、配列番号1~349のうちのいずれか1つと少なくとも75%の配列同一性を有するバリアントを含む。いくつかの実施形態では、トランスポザーゼは、トランスポザーゼのN末端又はC末端の近位に1つ以上の核局在化配列(NLS)をコードする配列を含む。いくつかの実施形態では、NLSは、配列番号455~470から選択される配列を含む。いくつかの実施形態では、NLSは、配列番号456を含む。いくつかの実施形態では、NLSは、トランスポザーゼのN末端の近位にある。いくつかの実施形態では、NLSは、配列番号455を含む。いくつかの実施形態では、NLSは、トランスポザーゼのC末端の近位にある。いくつかの実施形態では、生物は、原核生物、細菌、真核生物、真菌、植物、哺乳類、齧歯類、又はヒトである。
【0035】
いくつかの態様では、本開示は、本明細書に記載される態様又は実施形態のうちのいずれか1つの核酸を含むベクターを提供する。いくつかの実施形態では、ベクターは、トランスポザーゼと複合体を形成するように構成されたカーゴヌクレオチド配列をコードする核酸を更に含む。いくつかの実施形態では、ベクターは、プラスミド、ミニサークル、CELiD、アデノ随伴ウイルス(AAV)由来ビリオン、又はレンチウイルスである。
【0036】
いくつかの態様では、本開示は、本明細書に記載される態様又は実施形態のうちのいずれか1つのうちのいずれか1つのベクターを含む細胞を提供する。
【0037】
いくつかの態様では、本開示は、本明細書に記載される態様又は実施形態のうちのいずれか1つの細胞を培養することを含む、トランスポザーゼを製造する方法を提供する。
【0038】
いくつかの態様では、本開示は、二本鎖デオキシリボ核酸ポリヌクレオチドを結合、ニッキング、切断、マーキング、修飾、又は転位する方法を提供し、上記方法は、(a)二本鎖デオキシリボ核酸ポリヌクレオチドを、カーゴヌクレオチド配列を標的核酸遺伝子座に転位するように構成されたトランスポザーゼと接触させることを含み、トランスポザーゼは、配列番号1~349のうちのいずれか1つと少なくとも75%の配列同一性を有する配列を含む。いくつかの実施形態では、トランスポザーゼは、未培養微生物に由来する。いくつかの実施形態では、トランスポザーゼは、TnpAトランスポザーゼ又はTnpBトランスポザーゼではない。いくつかの実施形態では、トランスポザーゼは、TnpAトランスポザーゼと80%未満の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、TnpBトランスポザーゼと80%未満の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、触媒チロシン残基を含む。いくつかの実施形態では、トランスポザーゼは、サブ末端回文配列を含む左側領域及びサブ末端回文配列を含む右側領域に結合するように構成されている。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、一本鎖デオキシリボ核酸ポリヌクレオチドとして転位される。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、真核生物、植物、真菌、哺乳類、齧歯類、又はヒト二本鎖デオキシリボ核酸ポリヌクレオチドである。
【0039】
いくつかの態様では、本開示は、標的核酸遺伝子座を修飾する方法を提供し、上記方法は、本明細書に記載される態様又は実施形態のうちのいずれか1つの操作されたトランスポザーゼ系を標的核酸遺伝子座に送達することを含み、トランスポザーゼは、カーゴヌクレオチド配列を標的核酸遺伝子座に転位するように構成されており、複合体は、複合体の標的核酸遺伝子座への結合時に、複合体が標的核酸遺伝子座を修飾するように構成されている。いくつかの実施形態では、標的核酸遺伝子座を修飾することは、標的核酸遺伝子座を結合、ニッキング、切断、マーキング、修飾、又は転位することを含む。いくつかの実施形態では、標的核酸遺伝子座は、デオキシリボ核酸(DNA)を含む。いくつかの実施形態では、標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、又は細菌DNAを含む。いくつかの実施形態では、標的核酸遺伝子座は、インビトロである。いくつかの実施形態では、標的核酸遺伝子座は、細胞内にある。いくつかの実施形態では、細胞は、原核細胞、細菌細胞、真核細胞、真菌細胞、植物細胞、動物細胞、哺乳類細胞、齧歯類細胞、霊長類細胞、ヒト細胞、又は初代細胞である。いくつかの実施形態では、細胞は、初代細胞である。いくつかの実施形態では、初代細胞は、T細胞である。いくつかの実施形態では、初代細胞は、造血幹細胞(HSC)である。いくつかの実施形態では、操作されたトランスポザーゼ系を標的核酸遺伝子座に送達することは、本明細書に記載される態様若しくは実施形態のうちのいずれか1つの核酸、又は本明細書に記載される態様若しくは実施形態のうちのいずれか1つのベクターを送達することを含む。いくつかの実施形態では、操作されたトランスポザーゼ系を標的核酸遺伝子座に送達することは、トランスポザーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む。いくつかの実施形態では、核酸は、トランスポザーゼをコードするオープンリーディングフレームが作動可能に連結されているプロモーターを含む。いくつかの実施形態では、操作されたトランスポザーゼ系を標的核酸遺伝子座に送達することは、トランスポザーゼをコードするオープンリーディングフレームを含有するキャッピングされたmRNAを送達することを含む。いくつかの実施形態では、操作されたトランスポザーゼ系を標的核酸遺伝子座に送達することは、翻訳されたポリペプチドを送達することを含む。いくつかの実施形態では、トランスポザーゼは、標的核酸遺伝子座で、又は標的核酸遺伝子座の近位で、一本鎖切断又は二本鎖切断を誘導する。いくつかの実施形態では、トランスポザーゼは、標的遺伝子座内又は標的遺伝子座の5’に互い違いの一本鎖切断を誘導する。
【0040】
いくつかの態様では、本開示は、配列番号1~349のうちのいずれか1つ又はそのバリアントと少なくとも75%の配列同一性を有する異種トランスポザーゼをコードするオープンリーディングフレームを含む、宿主細胞を提供する。いくつかの実施形態では、トランスポザーゼは、配列番号1、3、5、7、9、11、13、15、又は16のうちのいずれか1つと少なくとも75%の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、配列番号2、4、6、8、10、12、14、又は17のうちのいずれか1つと少なくとも75%の配列同一性を有する。いくつかの実施形態では、宿主細胞は、E.coli細胞である。いくつかの実施形態では、E.coli細胞は、λDE3リソゲンであるか、又はE.coli細胞は、BL21(DE3)株である。いくつかの実施形態では、E.coli細胞は、ompT lon遺伝子型を有する。いくつかの実施形態では、オープンリーディングフレームは、T7プロモーター配列、T7-lacプロモーター配列、lacプロモーター配列、tacプロモーター配列、trcプロモーター配列、ParaBADプロモーター配列、PrhaBADプロモーター配列、T5プロモーター配列、cspAプロモーター配列、araPBADプロモーター、ファージラムダからの強い左向きプロモーター(pLプロモーター)、又はそれらの任意の組み合わせに作動可能に連結されている。いくつかの実施形態では、オープンリーディングフレームは、トランスポザーゼをコードする配列にインフレームで連結された親和性タグをコードする配列を含む。いくつかの実施形態では、親和性タグは、固定化金属親和性クロマトグラフィー(IMAC)タグである。いくつかの実施形態では、IMACタグは、ポリヒスチジンタグである。いくつかの実施形態では、親和性タグは、mycタグ、ヒトインフルエンザヘマグルチニン(HA)タグ、マルトース結合タンパク質(MBP)タグ、グルタチオンS-トランスフェラーゼ(GST)タグ、ストレプトアビジンタグ、FLAGタグ、又はそれらの任意の組み合わせである。いくつかの実施形態では、親和性タグは、プロテアーゼ切断部位をコードするリンカー配列を介して、トランスポザーゼをコードする配列にインフレームで連結されている。いくつかの実施形態では、プロテアーゼ切断部位は、タバコエッチウイルス(TEV)プロテアーゼ切断部位、PreScission(登録商標)プロテアーゼ切断部位、トロンビン切断部位、第Xa因子切断部位、エンテロキナーゼ切断部位、又はそれらの任意の組み合わせである。いくつかの実施形態では、オープンリーディングフレームは、宿主細胞における発現のためにコドン最適化される。いくつかの実施形態では、オープンリーディングフレームは、ベクター上に提供される。いくつかの実施形態では、オープンリーディングフレームは、宿主細胞のゲノムに組み込まれている。
【0041】
いくつかの態様では、本開示は、適合する液体培地中に、本明細書に記載される態様又は実施形態のうちのいずれか1つの宿主細胞を含む、培養物を提供する。
【0042】
いくつかの態様では、本開示は、適合する成長培地中で、本明細書に記載される態様又は実施形態のうちのいずれか1つの宿主細胞を培養することを含む、トランスポザーゼを産生する方法を提供する。いくつかの実施形態では、方法は、追加の化学剤又は増加された量の栄養素を添加することによって、トランスポザーゼの発現を誘導することを更に含む。いくつかの実施形態では、追加の化学剤又は増加された量の栄養素は、イソプロピルβ-D-1-チオガラクトピラノシド(IPTG)又は追加の量のラクトースを含む。いくつかの実施形態では、方法は、培養後に宿主細胞を単離することと、宿主細胞を溶解してタンパク質抽出物を産生することとを更に含む。いくつかの実施形態では、方法は、タンパク質抽出物をIMAC、又はイオン親和性クロマトグラフィーに供することを更に含む。いくつかの実施形態では、オープンリーディングフレームは、トランスポザーゼをコードする配列にインフレームで連結されたIMAC親和性タグをコードする配列を含む。いくつかの実施形態では、IMAC親和性タグは、プロテアーゼ切断部位をコードするリンカー配列を介して、トランスポザーゼをコードする配列にインフレームで連結されている。いくつかの実施形態では、プロテアーゼ切断部位は、タバコエッチウイルス(TEV)プロテアーゼ切断部位、PreScission(登録商標)プロテアーゼ切断部位、トロンビン切断部位、第Xa因子切断部位、エンテロキナーゼ切断部位、又はそれらの任意の組み合わせを含む。いくつかの実施形態では、方法は、プロテアーゼ切断部位に対応するプロテアーゼをトランスポザーゼと接触させることによって、IMAC親和性タグを切断することを更に含む。いくつかの実施形態では、方法は、サブトラクティブIMAC親和性クロマトグラフィーを実施して、トランスポザーゼを含む組成物から親和性タグを除去することを更に含む。
【0043】
いくつかの態様では、本開示は、細胞中の遺伝子座を破壊する方法を提供し、上記方法は、細胞に組成物を接触させることを含み、組成物は、(a)カーゴヌクレオチド配列を含む二本鎖核酸であって、カーゴヌクレオチド配列が、トランスポザーゼと相互作用するように構成されている、二本鎖核酸と、(b)トランスポザーゼであって、(i)カーゴヌクレオチド配列を標的核酸遺伝子座に転位するように構成され、(ii)配列番号1~349のうちのいずれか1つと少なくとも75%の配列同一性を有する配列を含み、(iii)細胞内でTnpAトランスポザーゼと少なくとも同等の転位活性を有する、トランスポザーゼと、を含む。いくつかの実施形態では、転位活性は、標的核酸遺伝子座を含む細胞にトランスポザーゼを導入し、細胞内の標的核酸遺伝子座の転位を検出することによって、インビトロで測定される。いくつかの実施形態では、組成物は、20pmole以下のトランスポザーゼを含む。いくつかの実施形態では、組成物は、1pmol以下のトランスポザーゼを含む。
【0044】
本開示の更なる態様及び利点は、以下の詳細な説明から、当業者に容易に明らかになり、ここで、本開示の例示的な実施形態のみが示され、記載される。理解されるように、本開示は、他の異なる実施形態をすることができ、そのいくつかの詳細は、全て本開示から逸脱することなく、様々な明白な点において改変することができる。したがって、図面及び説明は、本質的に例示とみなされるべきであり、制限としてみなされるべきではない。
【0045】
参照による組み込み
本明細書において言及される全ての刊行物、特許、及び特許出願は、それぞれ個々の刊行物、特許、又は特許出願が、参照により組み込まれるべきことが具体的かつ個別に示されているのと同じ程度に、参照により本明細書に組み込まれる。
【図面の簡単な説明】
【0046】
本発明の新規の特徴は、添付の特許請求の範囲に特記して記載される。本発明の特徴及び利点のより良好な理解は、本発明の原理が利用される例示的な実施形態を記載する以下の詳細な説明、及び添付の図面を参照することによって得られるだろう。
【0047】
図1A図1A及び図1Bは、MGトランスポザーゼを示す。図1Aは、チロシン(Y1)トランスポザーゼMG92-1遺伝子座を含むトランスポゾンの組織を示す。MG92-1は、トランスポゾンの5’端でコードされ、その後にアクセサリー転位タンパク質TnpB及び他のカーゴが続く。トランスポゾン端は、16~17bpの直接反復を含有し、それらは、転位活性に関与し得る二次構造を示す。図1Bは、MG Y1トランスポザーゼホモログの複数の配列アライメントを示す。触媒残基HUH及びYは、コンセンサス配列上及びMSA(ボックス)上で強調表示されている。
図1B図1A及び図1Bは、MGトランスポザーゼを示す。図1Aは、チロシン(Y1)トランスポザーゼMG92-1遺伝子座を含むトランスポゾンの組織を示す。MG92-1は、トランスポゾンの5’端でコードされ、その後にアクセサリー転位タンパク質TnpB及び他のカーゴが続く。トランスポゾン端は、16~17bpの直接反復を含有し、それらは、転位活性に関与し得る二次構造を示す。図1Bは、MG Y1トランスポザーゼホモログの複数の配列アライメントを示す。触媒残基HUH及びYは、コンセンサス配列上及びMSA(ボックス)上で強調表示されている。
図2】は、TnpAタンパク質配列の系統樹を示す。この樹は、ここで回収された414の新規TnpA配列(黒い点)及び19の参照TnpA配列(灰色の点)の複数の配列アライメントから構築された。参照配列の標識が含まれた。
図3】は、例示的な挿入配列IS200/IS605 MG92-28を示す。上のパネル:TnpA様トランスポザーゼ及びその関連TnpB様遺伝子をコードするMG92-28挿入配列のゲノムコンテキスト。両方の遺伝子は、共分散モデルから予測されたLE及びRE(ボックス)に隣接している。下のパネル:LE(左上)及びRE(右下)は、挿入配列の境界を描写している。共分散モデルによって予測された領域は、配列の下の矢印として注釈付けされている。LE及びREの二次構造は、各端について示されている。
図4】は、PureExpressで発現されたTnpA様タンパク質のウェスタンブロットを示す。レーンは、ラダー、1:HpTnpA、2:HhTpA、3:92-2、4:92-3、5:92-4、6:92-5、7:92-6、8:92-7、9:92-8、10:92-10、11:92-11である。HpTnpA及びHhTpAは、それぞれH.pylori及びH.Heilmanniiからの陽性対照である。分子量は、17~23キロダルトン(kDa)の範囲である。
図5A】は、転位反応のLEのPCR産物を示す。カーゴが指定された対照レーンを除き、全ての反応物は、タンパク質及びその対の特定のカーゴを有する。レーンは、1:ラダー、2:HpTnpAカーゴを有する陰性対照NTC、3:92-1、4:92-2、5:92-3、6:92-4、7:92-5、8:92-6、9:92-7、10:92-8、11:92-10、12:92-11、13:HpTnpA、14;HhTnpAである。予想される転位産物は、LEサイズに応じて200~300bpの範囲であり得、矢印でマークされている。92-5における<200bpのバンドは、非特異的プライマー相互作用に関連する。
図5B】は、転位反応のREのPCR産物を示す。カーゴが指定された対照レーンを除き、全ての反応物は、タンパク質及びその対の特定のカーゴを有する。レーンは、1:HpTnpAカーゴを有するNTC、2:92-1、3:92-2、4:92-3、5:92-4、6:92-5、7:92-6、8:92-7、9:92-8、10:92-10、11:92-11、12:HpTnpA、13;HhTnpA、及び14:ラダーである。予想される転位産物は、REサイズに応じて300~500bpの範囲であり得、矢印でマークされている。8N領域に生じる転位は、隣接配列への転位よりもはるかに弱いバンドを有するため、淡いバンドが予想される。
図6】は、MG92-3の転位を確認するサンガーシーケンシングデータを示す。クロマトグラムトレースは、カーゴ配列にマッピングされて示され、影付き文字はカーゴと一致する。切断点(矢印)では、トレースは代わりに標的配列(ボックス)上にマッピングされている。標的の分析により、LEと標的との間で共有される配列である挿入モチーフが明らかになる。隣接する非標準塩基相互作用を有する下流のヘアピンを特定することができる。
図7】は、MG92-3の転位を確認するサンガーシーケンシングデータを示す。クロマトグラムトレースは、カーゴにマッピングされて示され、影付き文字はカーゴと一致する。切断点(矢印)では、トレースは代わりに標的配列(ボックス)上にマッピングされている。標的の分析により、挿入モチーフが明らかになる。推定REにおける切断位置は、REの境界を画定し、これは、TnpA認識及び鎖切断(点線のボックスの差し込み図)を可能にするために、標準ヘアピンに折り畳まれる。
図8】は、ブレイクポイントを決定するために分析されたカーゴ及び標的配列接続を示すキメラNGSリードの分析を示す。x軸は、カーゴ配列に沿った位置であり、y軸は、その位置で遷移するリードの数である。カーゴ上の2030ntでのブレイクポイントにおける特定されたピークは、サンガーシーケンシングで特定されたブレイクポイントと一致し、LE切断の位置が確認されている。
図9】は、MG92-4の転位を確認するNGSシーケンシングデータを示す。NGSリードは、標的にマッピングされて示され、薄い影付き文字はカーゴと一致する。切断点(矢印)では、トレースは代わりにカーゴ配列(ボックス)上にマッピングされている。推定REにおける切断位置は、REの境界を画定し、これは、TnpA認識及び鎖切断(点線のボックスの差し込み図)を可能にするために、標準ヘアピンに折り畳まれる。NGSリードヒストグラムは、カーゴ上のこのブレイクポイントに対応するリードの頻度を示す。
【0048】
配列表の簡単な説明
本明細書とともに提出された配列表は、本開示による方法、組成物、及び系で使用するための例示的なポリヌクレオチド配列及びポリペプチド配列を提供する。以下は、その中の配列の例示的な説明である。
MG92
【0049】
配列番号1~349は、MG92転位タンパク質の完全長ペプチド配列を示す。
【0050】
配列番号350~454は、MG92トランスポゾン端の完全長ペプチド配列を示す。
核局在化配列
【0051】
配列番号455~470は、本明細書に記載されるMG92転位タンパク質との使用に好適な核局在化配列(NLS)の完全長ペプチド配列を示す。
【発明を実施するための形態】
【0052】
本発明の様々な実施形態は本明細書に示され、記載されるが、そのような実施形態が、例示の目的でのみ提供されることは、当業者には明らかであろう。多数の変形、変更、及び置換は、本発明から逸脱することなく、当業者にとって想到し得るものである。本明細書に記載される本発明の実施形態に対する様々な代替が用いられ得ることは、理解されるべきである。
【0053】
本明細書に開示されるいくつかの方法の実践は、別段の示唆がない限り、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノミクス、及び組換えDNAの技術を利用する。例えば、Sambrook and Green,Molecular Cloning:A Laboratory Manual,4th Edition(2012);the series Current Protocols in Molecular Biology(F.M.Ausubel,et al.eds.);the series Methods In Enzymology(Academic Press,Inc.),PCR 2:A Practical Approach(M.J.MacPherson,B.D.Hames and G.R.Taylor eds.(1995)),Harlow and Lane,eds.(1988)Antibodies,A Laboratory Manual,and Culture of Animal Cells:A Manual of Basic Technique and Specialized Applications,6th Edition(R.I.Freshney,ed.(2010))(参照により本明細書に完全に組み込まれる)を参照のこと。
【0054】
本明細書で使用される場合、単数形「a」、「an」及び「the」は、文脈が別途明確に示さない限り、複数形も含むことが意図される。更に、用語「含むこと」、「含む」、「有すること」、「有する」、「有する」、又はそのバリアントが、詳細な説明及び/又は特許請求の範囲のいずれかで使用される限りにおいて、かかる用語は、用語「含むこと」と類似した様式で包含的であることが意図される。
【0055】
用語「約」又は「およそ」は、当業者によって決定される特定の値についての許容可能な誤差範囲内であることを意味し、これは、値がどのように測定又は決定されるか、すなわち、測定系の制限に部分的に依存する。例えば、「約」は、当該技術分野の慣行によると、1又は2つ以上の標準偏差内を意味し得る。あるいは、「約」は、所与の値の最大20%、最大15%、最大10%、最大5%、又は最大1%の範囲を意味し得る。
【0056】
本明細書で使用される場合、「細胞」は概して生物学的細胞を指す。細胞は、生きている生物の基本的な構造、機能、及び/又は生物学的単位であり得る。細胞は、1つ以上の細胞を有する任意の生物を起源とし得る。いくつかの非限定的な例としては、原核細胞、真核生物の細胞、細菌細胞、古細菌細胞、単一細胞の真核生物の細胞、原虫細胞、植物由来の細胞(例えば、植物作物、果実、野菜、穀物、大豆、トウモロコシ、トウモロコシ、小麦、種子、トマト、米、キャッサバ、サトウキビ、カボチャ、乾草、ジャガイモ、綿、大麻、タバコ、開花している植物、針葉樹、ジムノスパーム、シダ、ヒカゲノカズラ、ツノゴケ、コケ植物、コケ由来の細胞)、藻類の細胞(例えば、Botryococcus braunii、Chlamydomonas reinhardtii、Nannochloropsis gaditana、Chlorella pyrenoidosa、Sargassum patens C.Agardhなど)、海藻(例えば、ケルプ)、真菌細胞(例えば、酵母細胞、キノコ由来の細胞)、動物細胞、脊椎動物(例えば、フルーツフライ、クニダリアン、エキノデルム、線虫など)由来の細胞、脊椎動物(例えば、魚、両生類、爬虫類、鳥類、哺乳類)由来の細胞、哺乳類(例えば、ブタ、ウシ、ヤギ、ヒツジ、齧歯類、ラット、マウス、非ヒト霊長類、ヒトなど)由来の細胞などが挙げられる。いくつかの場合では、細胞は、天然の生物に由来するものではない(例えば、細胞は、合成的に作製されてもよく、時には人工細胞と呼ばれることがある)。
【0057】
本明細書で使用される場合、用語「ヌクレオチド」は、概して、塩基-糖-リン酸の組み合わせを指す。ヌクレオチドは、合成ヌクレオチドを含んでもよい。ヌクレオチドは、合成ヌクレオチド類似体を含んでもよい。ヌクレオチドは、核酸配列(例えば、デオキシリボ核酸(DNA)及びリボ核酸(RNA))の単量体単位であってもよい。ヌクレオチドという用語は、リボヌクレオシド三リン酸アデノシン三リン酸(ATP)、ウリジン三リン酸(UTP)、シトシン三リン酸(CTP)、グアノシン三リン酸(GTP)及びデオキシリボヌクレオシド三リン酸、例えば、dATP、dCTP、dITP、dUTP、dGTP、dTTP、又はその誘導体を含み得る。かかる誘導体としては、例えば、[αS]dATP、7-デアザ-dGTP及び7-デアザ-dATP、並びにそれらを含有する核酸分子にヌクレアーゼ耐性を付与するヌクレオチド誘導体を挙げることができる。本明細書で使用される場合、ヌクレオチドという用語は、ジデオキシリボヌクレオシド三リン酸(ddNTP)及びその誘導体を指す場合がある。ジデオキシリボヌクレオシド三リン酸の例としては、ddATP、ddCTP、ddGTP、ddITP、及びddTTPが挙げられるが、これらに限定されない。ヌクレオチドは、光学的に検出可能な部分(例えば、フルオロフォア)を含む部分を使用するなど、非標識又は検出可能に標識されてもよい。標識はまた、量子ドットを用いて行われてもよい。検出可能な標識としては、例えば、放射性同位元素、蛍光標識、化学発光標識、生物発光標識、及び酵素標識を挙げることができる。ヌクレオチドの蛍光標識は、フルオレセイン、5-カルボキシフルオレセイン(FAM)、2′7′-ジメトキシ-4′5-ジクロロ-6-カルボキシフルオレセイン(JOE)、ローダミン、6-カルボキシローダミン(R6G)、N,N,N′,N′-テトラメチル-6-カルボキシローダミン(TAMRA)、6-カルボキシ-X-ローダミン(ROX)、4-(4′ジメチルアミノフェニルアゾ)安息香酸(DABCYL)、カスケードブルー、オレゴングリーン、テキサスレット、シアニン及び5-(2′-アミノエチル)アミノナフタレン-1-スルホン酸(EDANS)を含むが、これらに限定されない。蛍光標識されたヌクレオチドの具体的な例としては、Perkin Elmer、Foster City、Califから入手可能な[R6G]dUTP、[TAMRA]dUTP、[R110]dCTP、[R6G]dCTP、[TAMRA]dCTP、[JOE]ddATP、[R6G]ddATP、[FAM]ddCTP、[R110]ddCTP、[TAMRA]ddGTP、[ROX]ddTTP、[dR6G]ddATP、[dR110]ddCTP、[dTAMRA]ddGTP、及び[dROX]ddTTP;Amersham、Arlington Heights、Il.から入手可能なフルオロ結合デオキシヌクレオチド、フルオロ結合Cy3-dCTP、フルオロ結合Cy5-dCTP、フルオロ結合フルオロX-dCTP、フルオロ結合Cy3-dUTP、及びフルオロ結合Cy5-dUTP;Boehringer Mannheim、Indianapolis、Ind.から入手可能なフルオレセイン-15-dATP、フルオレセイン-12-dUTP、テトラメチル-ローダミン-6-dUTP、IR770-9-dATP、フルオレセイン-12-ddUTP、フルオレセイン-12-UTP、及びフルオレセイン-15-2′-dATP;並びにMolecular Probes、Eugene、Oregから入手可能な染色体標識ヌクレオチド、BODIPY-FL-14-UTP、BODIPY-FL-4-UTP、BODIPY-TMR-14-UTP、BODIPY-TMR-14-dUTP、BODIPY-TR-14-UTP、BODIPY-TR-14-dUTP、カスケードブルー-7-UTP、カスケードブルー-7-dUTP、フルオレセイン-12-UTP、フルオレセイン-12-dUTP、オレゴングリーン488-5-dUTP、ローダミングリーン-5-UTP、ローダミングリーン-5-dUTP、テトラメチルローダミン-6-UTP、テトラメチルローダミン-6-dUTP、テキサスレッド-5-UTP、テキサスレッド-5-dUTP、及びテキサスレッド-12-dUTPを挙げることができる。ヌクレオチドはまた、化学修飾によって標識又はマーキングされてもよい。化学修飾された単一ヌクレオチドは、ビオチン-dNTPであり得る。ビオチン化dNTPのいくつかの非限定的な例としては、ビオチン-dATP(例えば、ビオ-N6-ddATP、ビオチン-14-dATP)、ビオチン-dCTP(例えば、ビオチン-11-dCTP、ビオチン-14-dCTP)、及びビオチン-dUTP(例えば、ビオチン-11-dUTP、ビオチン-16-dUTP、ビオチン-20-dUTP)が挙げられる。
【0058】
用語「ポリヌクレオチド」、「オリゴヌクレオチド」、及び「核酸」は、概して、一本鎖、二本鎖、又は多本鎖のいずれかの形態の、デオキシリボヌクレオチド若しくはリボヌクレオチド、又はその類似体のいずれかの、任意の長さのヌクレオチドのポリマー形態を指すように互換的に使用される。ポリヌクレオチドは、細胞にとって外因性又は内因性であってもよい。ポリヌクレオチドは、無細胞環境に存在してもよい。ポリヌクレオチドは、遺伝子又はその断片であってもよい。ポリヌクレオチドは、DNAであってもよい。ポリヌクレオチドは、RNAであってもよい。ポリヌクレオチドは、任意の三次元構造を有してもよく、任意の機能を発揮してもよい。ポリヌクレオチドは、1つ以上の類似体(例えば、改変された骨格、糖、又は核酸塩基)を含んでもよい。存在する場合、ヌクレオチド構造に対する修飾は、ポリマーのアセンブリの前又は後に付与されてもよい。類似体のいくつかの非限定的な例としては、5-ブロモウラシル、ペプチド核酸、異種核酸、モルホリノ、ロックド核酸、グリコール核酸、トレオース核酸、ジデオキシヌクレオチド、コーディセピン、7-デアザ-GTP、フルオロフォア(例えば、糖に結合したローダミン又はフルオレセイン)、チオール含有ヌクレオチド、ビオチン結合ヌクレオチド、蛍光塩基類似体、CpGアイランド、メチル-7-グアノシン、メチル化ヌクレオチド、イノシン、チオウリジン、シュードウリジン、ジヒドロウリジン、クエオシン、及びワイオシンが挙げられる。ポリヌクレオチドの非限定的な例としては、遺伝子又は遺伝子断片のコード又は非コード領域、結合分析から定義した遺伝子座(遺伝子座)、エクソン、イントロン、メッセンジャーRNA(mRNA)、トランスファーRNA(tRNA)、リボソームRNA(rRNA)、短い干渉RNA(siRNA)、短いヘアピンRNA(shRNA)、マイクロ-RNA(miRNA)、リボザイム、cDNA、組換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたDNA、任意の配列の単離されたRNA、細胞を含まないDNA(cfDNA)及び細胞を含まないRNA(cfRNA)を含む細胞を含まないポリヌクレオチド、核酸プローブ、並びにプライマーが挙げられる。ヌクレオチドの配列は、非ヌクレオチド成分によって中断され得る。
【0059】
用語「トランスフェクション」又は「トランスフェクトされた」は、概して、非ウイルス又はウイルスベースの方法による細胞内への核酸の導入を指す。核酸分子は、完全なタンパク質又はその機能的部分をコードする遺伝子配列であってもよい。例えば、Sambrook et al.,1989,Molecular Cloning:A Laboratory Manual,18.1-18.88(参照により本明細書に完全に組み込まれる)を参照のこと。
【0060】
用語「ペプチド」、「ポリペプチド」、及び「タンパク質」は、本明細書において互換的に使用され、概して、ペプチド結合によって結合された少なくとも2つのアミノ酸残基のポリマーを指す。この用語は、ポリマーの特定の長さを意味しておらず、ペプチドが組換え技術、化学若しくは酵素合成を使用して産生されるか、又は天然に存在するかを暗示又は区別することを意図するものではない。この用語は、天然に存在するアミノ酸ポリマー並びに少なくとも1つの修飾アミノ酸を含むアミノ酸ポリマーに適用する。いくつかの実施形態では、ポリマーは、非アミノ酸によって中断されてもよい。この用語は、完全長タンパク質を含む任意の長さのアミノ酸鎖、並びに二次及び/若しくは三次の構造(例えば、ドメイン)を有する又は有さないタンパク質を含む。用語はまた、例えば、ジスルフィド結合形成、グリコシル化、脂質形成、アセチル化、リン酸化、酸化、及び標識成分とのコンジュゲーションなどの任意の他の操作によって修飾されたアミノ酸ポリマーを包含する。本明細書で使用される場合、「アミノ酸」及び「複数のアミノ酸」という用語は、概して、修飾アミノ酸及びアミノ酸類似体を含むが、これに限定されない天然及び非天然アミノ酸を指す。修飾アミノ酸は、天然アミノ酸及び非天然アミノ酸を含んでもよく、これは、アミノ酸上に天然に存在しない基又は化学的部分を含むように化学的に修飾されている。アミノ酸類似体は、アミノ酸誘導体を指す場合がある。用語「アミノ酸」は、D-アミノ酸とL-アミノ酸の両方を含む。
【0061】
本明細書で使用される場合、「非天然」は、概して、天然の核酸又はタンパク質では見られない核酸又はポリペプチド配列を指すことができる。非天然は、親和性タグを指してもよい。非天然は、融合物を指してもよい。非天然は、変異、挿入、及び/又は欠失を含む、天然に存在する核酸又はポリペプチド配列を指してもよい。非天然配列は、非天然配列が融合される核酸配列及び/又はポリペプチド配列によっても呈され得る活性(例えば、酵素活性、メチルトランスフェラーゼ活性、アセチルトランスフェラーゼ活性、キナーゼ活性、ユビキチン化活性など)を示し得、かつ/又はコードし得る。非天然核酸又はポリペプチド配列を、遺伝子操作によって天然に生じる核酸及び/又はポリペプチド配列(若しくはそのバリアント)に連結して、キメラ核酸又はポリペプチドをコードするキメラ核酸及び/又はポリペプチド配列を生成してもよい。
【0062】
本明細書で使用される場合、用語「プロモーター」は、概して、遺伝子の転写又は発現を制御し、RNA転写が開始されるヌクレオチドのヌクレオチド又はヌクレオチドの領域に隣接するか、又は重複して位置し得る調節DNA領域を指す。プロモーターは、しばしば転写因子と呼ばれるタンパク質因子に結合する特定のDNA配列を含有してもよく、これは、RNAポリメラーゼのDNAへの結合を促進し、これにより、遺伝子転写をもたらす。「コアプロモーター」とも呼ばれる「基礎プロモーター」は、概して、作動可能に連結されたポリヌクレオチドの転写発現を促進するための全てのベーシックエレメントを含有するプロモーターを指してもよい。いくつかの実施形態では、真核生物の基礎プロモーターは、TATA-ボックス及び/又はCAATボックスを含有する。
【0063】
本明細書で使用される場合、用語「発現」は、概して、核酸配列又はポリヌクレオチドがDNA鋳型から(例えば、mRNA又は他のRNA転写物に)転写されるプロセス、及び/又は転写されたmRNAが続いてペプチド、ポリペプチド、又はタンパク質に翻訳されるプロセスを指す。転写物及びコードされたポリペプチドは、「遺伝子産物」と総称され得る。ポリヌクレオチドがゲノムDNAに由来する場合、発現は、真核生物の細胞におけるmRNAのスプライシングを含む。
【0064】
本明細書で使用される場合、「作動可能に連結された」、「作動可能な連結」、「作動可能に連結された」、又はその文法的な均等物は、概して、遺伝子エレメント、例えば、プロモーター、エンハンサー、ポリアデニル化配列などの並列化を指し、ここで、エレメントは、それらが予期される様式で作動することを可能にする関係にある。例えば、プロモーター配列及び/又はエンハンサー配列を含み得る、調節エレメントは、調節エレメントが、コード配列の転写を開始するのを助ける場合、コード領域に作動可能に連結される。この機能的関係が維持される限り、調節エレメントとコード領域との間に介在する残基があってもよい。
【0065】
本明細書で使用される場合、「ベクター」は、概して、ポリヌクレオチドを含むか、又はポリヌクレオチドと会合する高分子又は高分子の会合を指し、ポリヌクレオチドの細胞への送達を媒介するために使用され得る。ベクターの例としては、プラスミド、ウイルスベクター、リポソーム、及び他の遺伝子送達ビヒクルが挙げられる。ベクターは、概して、標的中の遺伝子の発現を促進するために遺伝子に作動可能に連結された、遺伝子エレメント、例えば、調節エレメントを含む。
【0066】
本明細書で使用される場合、「発現カセット」及び「核酸カセット」は、一緒に発現されるか、又は発現のために作動可能に連結される核酸配列又はエレメントの組み合わせを指すために概して互換的に使用される。いくつかの実施形態では、発現カセットは、調節エレメントと、それらが発現のため作動可能に連結されている遺伝子又は複数の遺伝子との組み合わせを指す。
【0067】
DNA又はタンパク質配列の「機能的断片」は、概して、完全長DNA又はタンパク質配列の生物学的活性と実質的に類似した生物学的活性(機能的又は構造的のいずれか)を保持する断片を指す。DNA配列の生物学的活性は、完全長配列に起因する様式で発現に影響を与える能力であり得る。
【0068】
本明細書で使用される場合、「操作された」物体は、概して、物体がヒトの介入によって修飾されたことを示す。非限定的な実施例によれば、核酸は、その配列を、天然では生じない配列に改変することによって修飾されてもよく、核酸は、ライゲーションされた産物が、オリジナルの核酸に存在しない機能を有するように、天然では関連しない核酸にライゲーションすることによって修飾されてもよく、操作された核酸は、天然では存在しない配列を用いてインビトロで合成されてもよく、タンパク質は、天然では存在しない配列にそのアミノ酸配列を変更することによって修飾されてもよく、操作されたタンパク質は、新しい機能又は特性を獲得してもよい。「操作された」系は、少なくとも1つの操作された成分を含む。
【0069】
本明細書で使用される場合、「合成」及び「人工」は概して、天然に存在するヒトタンパク質と低い配列同一性(例えば、50%未満の配列同一性、25%未満の配列同一性、10%未満の配列同一性、5%未満の配列同一性、1%未満の配列同一性)を有するタンパク質又はそのドメインを指すために互換的に使用され得る。例えば、VPRドメイン及びVP64ドメインは、合成トランス活性化ドメインである。
【0070】
本明細書で使用される場合、用語「転位因子」は、ゲノム内のある位置から別の位置に移動することができる(すなわち、それらは「転位」できる)DNA配列を指す。転位因子は、概して2つのクラスに分けることができる。クラスI転位因子、又は「レトロトランスポゾン」は、RNA中間体の転写及び翻訳を介して転位され、その後、逆転写(逆転写酵素によって媒介されるプロセス)を介してゲノム内にその新しい位置に再び組み込まれる。クラスII転位因子、又は「DNAトランスポゾン」は、両側にトランスポザーゼが隣接する一本鎖又は二本鎖DNAの複合体を介して転位される。この酵素ファミリーの更なる特徴は、例えば、Nature Education 2008,1(1),204、及びGenome Biology 2018,19(199),1-12に見出すことができ、その各々は参照により本明細書に組み込まれる。
【0071】
本明細書で使用される場合、用語「TnpA」は、概して、IS200/IS605細菌挿入配列(「IS」)ファミリーのメンバーに見られるトランスポザーゼを指す。二本鎖DNA中間体を介してDNA転位を実行する他の記録されたISトランスポザーゼとは異なり、TnpAは、一本鎖DNA中間体を介して進行する。TnpAはまた、末端逆位反復ではなく隣接するサブ末端回文配列を含有するという点で、他の記録されたISトランスポザーゼとは異なる。更に、TnpAは、標的部位の重複なしに、特定のATリッチのテトラヌクレオチド又はペンタヌクレオチドの3’を挿入する。最後に、TnpAは、他のISトランスポザーゼの「DDE」スーパーファミリーではなく、酵素のHis-疎水性-His(「HuH」)スーパーファミリーに属する。本明細書で使用される場合、「TnpB」は、概して、IS200/IS605細菌においてTnpAと並んで見出される、記録されていない機能(ただし、転位において調節的役割を果たすと推測される)の酵素を指す。IS200/IS605トランスポザーゼは、「Y1トランスポザーゼ」であり、それらが単一の触媒チロシン残基を含む単一ドメインタンパク質であることを意味する。本明細書で使用される場合、用語「TnpA様」は、概して、TnpAタンパク質と共通する1つ以上の機能的、構造的、生化学的、生物物理学的、又は他の特性若しくは特徴を示すタンパク質を指す。本明細書で使用される場合、用語「TnpB様」は、概して、TnpBタンパク質と共通する1つ以上の機能、構造的、生化学的、生物物理学的、又は他の特性若しくは特徴を示すタンパク質を指す。
【0072】
2つ以上の核酸又はポリペプチド配列の文脈における用語「配列同一性」又は「同一性パーセント」は、概して、配列比較アルゴリズムを使用して測定された場合、局所比較ウィンドウ又はグローバル比較ウィンドウにわたって最大の対応について比較及び整列されたとき、同一であるか、又は特定のパーセンテージの、同一であるアミノ酸残基又はヌクレオチドを有する、2つ(例えば、ペアワイズアラインメントにおいて)又はそれ以上(例えば、複数の配列アラインメントにおいて)の配列を指す。ポリペプチド配列に好適な配列比較アルゴリズムとしては、例えば、3のワード長(W)、10の期待値(E)のパラメーター、及び11の存在、1の延長でギャップコストを設定しているBLOSUM62スコアリングマトリックスを使用し、かつ30残基より長いポリペプチド配列についての条件付き組成スコアマトリックス調整を使用したBLASTP;2のワード長(W)、1000000の期待値(E)のパラメーター、及びオープンギャップに対して9及び30残基より短い配列についての拡張ギャップに対して1でのPAM30スコアリング設定ギャップコストを使用したBLASTP(https://blast.ncbi.nlm.nih.govで入手可能なBLASTにおいてBLASTPについてのデフォルトのパラメーターが存在する);2の一致、-1のミスマッチ、及び-1のギャップのSmith-Waterman相同性検索アルゴリズムパラメーターを用いたCLUSTALW;デフォルトパラメーターを用いたMUSCLE;2のリツリー及び1000の最大反復のパラメーターを用いたMAFFT;デフォルトパラメーターを用いたNovafold;デフォルトパラメーターを用いたHMMER hmmalignが挙げられる。
【0073】
2つ以上の核酸配列又はポリペプチド配列の文脈で、用語「最適に整列された」は、概して、例えば、最も高い又は「最適化された」同一性パーセントのスコアを生成するアライメントによって決定される、アミノ酸残基又はヌクレオチドの最大対応に整列された2つ(例えば、ペアワイズアラインメントで)又はそれ以上(例えば、複数の配列アラインメントで)の配列を指す。
【0074】
1つ以上の保存的アミノ酸置換を有する本明細書に記載される酵素のうちのいずれかのバリアントが、本開示に含まれる。こうした保存的置換は、ポリペプチドの三次元構造又は機能を破壊することなく、ポリペプチドのアミノ酸配列においてなされ得る。保存的置換は、アミノ酸を、互いに同様の疎水性、極性、及びR鎖長で置換することによって達成することができる。加えて、又は代わりに、異なる種由来の相同なタンパク質のアラインされた配列を比較することによって、保存的置換は、コードされたタンパク質の基本的な機能を変化させることなく、種間で変異したアミノ酸残基(例えば、非保存残基)を見つけることによって特定され得る。そのような保存的に置換されたバリアントは、本明細書に記載されるトランスポザーゼタンパク質配列(例えば、本明細書に記載されるMG92ファミリートランスポザーゼ、又は本明細書に記載される任意の他のファミリートランスポザーゼ)のうちのいずれか1つと少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するバリアントを含んでもよい。いくつかの実施形態では、そのような保存的に置換されたバリアントは、機能的バリアントである。そのような機能的バリアントは、トランスポザーゼの1つ以上の重要な活性部位残基の活性が破壊されないような置換を有する配列を包含することができる。いくつかの実施形態では、本明細書に記載されるタンパク質のうちのいずれかの機能的バリアントは、図1Bでコールアウトされる保存された残基又は機能的残基のうちの少なくとも1つの置換を欠いている。いくつかの実施形態では、本明細書に記載されるタンパク質のうちのいずれかの機能的バリアントは、図1Bでコールアウトされる保存された残基又は機能的残基の全ての置換を欠いている。
【0075】
また、本開示には、酵素の活性を減少させる又は排除するための1つ以上の触媒残基の置換を有する、本明細書に記載される酵素のうちのいずれかのバリアント(例えば、活性低下バリアント)も含まれる。いくつかの実施形態では、本明細書に記載されるタンパク質としての活性低下バリアントは、図1Bでコールアウトされる少なくとも1つ、少なくとも2つ、又は3つ全ての触媒残基の破壊的置換を含む。
【0076】
機能的に類似したアミノ酸を提供する保存的置換表は、様々な参考文献から入手可能である(例えば、Creighton,Proteins:Structures and Molecular Properties(W H Freeman&Co.;2nd edition(December 1993)を参照のこと))。以下の8つの群はそれぞれ、互いに保存的置換であるアミノ酸を含有する。
1)アラニン(A)、グリシン(G)、
2)アスパラギン酸(D)、グルタミン酸(E)、
3)アスパラギン(N)、グルタミン(Q)、
4)アルギニン(R)、リシン(K)、
5)イソロイシン(I)、ロイシン(L)、メチオニン(M)、バリン(V)、
6)フェニルアラニン(F)、チロシン(Y)、トリプトファン(W)、
7)セリン(S)、スレオニン(T)、及び
8)システイン(C)、メチオニン(M)。
【0077】
概要
固有の機能性及び構造を有する新しい転位因子の発見は、デオキシリボ核酸(DNA)編集技術を更に破壊し、速度、特異性、機能性、及び使いやすさを改善する潜在力を付与する可能性がある。微生物及びまさに多種多様な微生物種における転位因子の予測保有率と比較して、文献には機能的に特徴付けられた転位因子が比較的少ない。これは、実験室条件では、膨大な数の微生物種を容易には培養し得ないことが部分的に理由となっている。多数の微生物種を含有する天然の環境ニッチからのメタゲノムシーケンシングは、記録された新しい転位因子の数を劇的に増加させ、新しいオリゴヌクレオチド編集機能の発見を早める潜在力を付与する可能性がある。
【0078】
転位因子は、ゲノム内で位置を変更できるデオキシリボ核酸配列であり、変異の生成又は改善をもたらすことが多い。真核生物では、ゲノムの大部分、及び細胞DNAの質量の大部分が、転位因子に起因する。転位因子は、他の遺伝子を犠牲にして自身を増殖させる「利己的な遺伝子」であるが、様々な重要な機能を果たし、ゲノム進化に重要であることが見出されている。転位因子は、それらの機構に基づいて、クラスI「レトロトランスポゾン」又はクラスII「DNAトランスポゾン」のいずれかに分類される。
【0079】
クラスI転位因子は、レトロトランスポゾンとも呼ばれ、RNA中間体を伴う二部分の「コピーアンドペースト」機構に従って機能する。まず、レトロトランスポゾンが転写される。得られたRNAは、その後、逆転写酵素(一般にレトロトランスポゾン自体によってコードされる)によって変換されてDNAに戻され、逆転写されたレトロトランスポゾンは、最終的にインテグラーゼによってゲノム内のその新しい位置に組み込まれる。レトロトランスポゾンは、3つの系列に更に分類される。長い末端反復(「LTR」)を有するレトロトランスポゾンは、逆転写酵素をコードし、反復DNAの長い鎖に隣接している。長鎖散在反復配列(「LINE」)を有するレトロトランスポゾンは、逆転写酵素をコードし、LTRを欠いており、RNAポリメラーゼIIによって転写される。短鎖散在反復配列(「SINE」)を有するレトロトランスポゾンは、RNAポリメラーゼIIIによって転写されるが、逆転写酵素を欠いており、代わりに他の転位因子(例えば、LINE)の逆転写機構に依存する。
【0080】
クラスII転位因子は、DNAトランスポゾンとも呼ばれ、RNA中間体を伴わない機構に従って機能する。多くのDNAトランスポゾンは、トランスポザーゼがトランスポゾンに隣接する末端逆位反復(「TIR」)に結合し、ドナー領域からトランスポゾンを切断し、それをゲノムの標的領域に挿入する「カットアンドペースト」機構を示す。「ヘリトロン」と呼ばれる他のものは、一本鎖DNA中間体を伴い、HUHエンドヌクレアーゼ機能及び5’から3’へのヘリカーゼ活性を有すると考えられる記録されていないタンパク質によって媒介される「ローリングサークル」機構を示す。まず、DNAの環状鎖がニッキングされて、2つの単一DNA鎖が作成される。タンパク質は、ニッキングされた鎖の5’リン酸に付着したままであり、相補鎖の3’ヒドロキシル端を露出したままにし、したがって、ポリメラーゼがニッキングされていない鎖を複製することを可能にする。複製が完了すると、新しい鎖は、解離し、それ自体が元の鋳型鎖とともに複製される。更に他のDNAトランスポゾンである「ポリントン」は、「自己合成」機構を経ると理論化されている。転位は、ラケット様構造を形成する一本鎖染色体外ポリントンエレメントのインテグラーゼ切除によって開始される。ポリントンは、DNAポリメラーゼBによる複製を受け、二本鎖ポリントンは、インテグラーゼによってゲノムへと挿入される。最後に、IS200/IS605ファミリーのものなどのいくつかのDNAトランスポゾンは、TnpAがドナー遺伝子のラギング鎖鋳型から一本鎖DNAの一片を(環状「トランスポゾン接続」として)切除し、それを標的遺伝子の複製フォークに再挿入する「ピールアンドペースト」機構を介して進行する。
【0081】
転位因子は、生物学的ツールとしていくつかの用途を見出したが、記録された転位因子は、可能な生物多様性及び標的可能性の全範囲を包含しておらず、全ての可能な活性を表していない場合がある。ここでは、転位因子について、多数のメタゲノムから数千ものゲノム断片を引き出した。記録された転位因子の多様性は、拡大されている可能性があり、新規な系は、高度に標的化可能で、コンパクトで、かつ正確な遺伝子編集剤へと発展している可能性がある。
MG酵素
【0082】
いくつかの態様では、本開示は、新規なトランスポザーゼを提供する。これらの候補は、1つ以上の新規サブタイプを表していてもよく、いくつかのサブファミリーが特定されてもよい。これらのトランスポザーゼは、長さが約500アミノ酸未満である。これらのトランスポザーゼは、送達を単純化する可能性があり、治療用途を拡張する可能性がある。
【0083】
いくつかの態様では、本開示は、新規なトランスポザーゼを提供する。そのようなトランスポザーゼは、本明細書に記載されるMG92であってもよい(図1A及び図1Bを参照のこと)。
【0084】
一態様では、本開示は、メタゲノムシーケンシングを通して発見された操作されたトランスポザーゼ系を提供する。いくつかの実施形態では、メタゲノムシーケンシングは、試料において行われる。いくつかの実施形態では、試料は、様々な環境から収集され得る。そのような環境は、ヒトマイクロバイオーム、動物マイクロバイオーム、高温環境、低温環境であり得る。そのような環境は、堆積物を含み得る。
【0085】
一態様では、本開示は、トランスポザーゼを含む操作されたトランスポザーゼ系を提供する。いくつかの実施形態では、トランスポザーゼは、未培養微生物に由来する。トランスポザーゼは、サブ末端回文配列を含む左側領域に結合するように構成されてもよい。トランスポザーゼは、サブ末端回文配列を含む右側領域に結合してもよい。
【0086】
一態様では、本開示は、トランスポザーゼを含む操作されたトランスポザーゼ系を提供する。いくつかの実施形態では、トランスポザーゼは、配列番号1~349のうちのいずれか1つと少なくとも約70%の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、配列番号1~349のうちのいずれか1つと少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有する。
【0087】
いくつかの実施形態では、トランスポザーゼは、配列番号1~349のうちのいずれか1つと少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含む。いくつかの実施形態では、トランスポザーゼは、配列番号1~349のうちのいずれか1つと実質的に同一であってもよい。
【0088】
いくつかの実施形態では、トランスポザーゼは、TnpA又はTnpBトランスポザーゼではない。いくつかの実施形態では、トランスポザーゼは、TnpAトランスポザーゼと約90%未満、約85%未満、約80%未満、約75%未満、約70%未満、約65%未満、約60%未満、約55%未満、約50%未満、約45%未満、約40%未満、約35%未満、約30%未満、約25%未満、約20%未満、約15%未満、約10%未満、又は約5%未満の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、TnpBトランスポザーゼと約90%未満、約85%未満、約80%未満、約75%未満、約70%未満、約65%未満、約60%未満、約55%未満、約50%未満、約45%未満、約40%未満、約35%未満、約30%未満、約25%未満、約20%未満、約15%未満、約10%未満、又は約5%未満の配列同一性を有する。
【0089】
いくつかの実施形態では、トランスポザーゼは、触媒チロシン残基を含む。
【0090】
いくつかの実施形態では、トランスポザーゼは、サブ末端回文配列を含む左側領域に結合するように構成されている。いくつかの実施形態では、トランスポザーゼは、サブ末端回文配列を含む右側領域に結合するように構成されている。いくつかの実施形態では、トランスポザーゼは、サブ末端回文配列を含む左側領域及びサブ末端回文配列を含む右側領域に結合するように構成されている。
【0091】
いくつかの実施形態では、トランスポザーゼは、二本鎖デオキシリボ核酸ポリヌクレオチドとしてカーゴヌクレオチド配列を転位するように構成されている。いくつかの実施形態では、トランスポザーゼは、一本鎖デオキシリボ核酸ポリヌクレオチドとしてカーゴヌクレオチド配列を転位するように構成されている。
【0092】
いくつかの実施形態では、トランスポザーゼは、真核生物、真菌、植物、哺乳類、又はヒトのゲノムポリヌクレオチド配列と相補的である配列を含む。いくつかの実施形態では、トランスポザーゼは、真核生物のゲノムポリヌクレオチド配列と相補的である配列を含む。いくつかの実施形態では、トランスポザーゼは、真菌のゲノムポリヌクレオチド配列と相補的である配列を含む。いくつかの実施形態では、トランスポザーゼは、植物のゲノムポリヌクレオチド配列と相補的である配列を含む。いくつかの実施形態では、トランスポザーゼは、哺乳類のゲノムポリヌクレオチド配列と相補的である配列を含む。いくつかの実施形態では、トランスポザーゼは、ヒトのゲノムポリヌクレオチド配列と相補的である配列を含む。
【0093】
いくつかの実施形態では、トランスポザーゼは、1つ以上の核局在化配列(NLS)を有するバリアントを含んでもよい。NLSは、トランスポザーゼのN末端又はC末端の近位にあってもよい。NLSは、配列番号455~470のうちのいずれか1つ、又は配列番号455~470のうちのいずれか1つと少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントに対して、N末端又はC末端に付加されてもよい。いくつかの実施形態では、NLSは、配列番号455~470のうちのいずれか1つと実質的に同一の配列を含んでもよい。いくつかの実施形態では、NLSは、配列番号455と実質的に同一の配列を含んでもよい。いくつかの実施形態では、NLSは、配列番号456と実質的に同一の配列を含んでもよい。
【0094】
【表1】
【0095】
いくつかの実施形態では、トランスポザーゼは、配列番号1、3、5、7、9、11、13、15、若しくは16のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも70%同一の配列を含む。いくつかの実施形態では、トランスポザーゼは、配列番号1、3、5、7、9、11、13、15、若しくは16のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも75%同一の配列を含む。いくつかの実施形態では、トランスポザーゼは、配列番号1、3、5、7、9、11、13、15、若しくは16のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも80%同一の配列を含む。いくつかの実施形態では、トランスポザーゼは、配列番号1、3、5、7、9、11、13、15、若しくは16のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも85%同一の配列を含む。いくつかの実施形態では、トランスポザーゼは、配列番号1、3、5、7、9、11、13、15、若しくは16のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも90%同一の配列を含む。いくつかの実施形態では、トランスポザーゼは、配列番号1、3、5、7、9、11、13、15、若しくは16のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも95%同一の配列を含む。
【0096】
いくつかの実施形態では、トランスポザーゼは、配列番号2、4、6、8、10、12、14、若しくは17のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも70%同一の配列を含む。いくつかの実施形態では、トランスポザーゼは、配列番号2、4、6、8、10、12、14、若しくは17のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも75%同一の配列を含む。いくつかの実施形態では、トランスポザーゼは、配列番号2、4、6、8、10、12、14、若しくは17のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも80%同一の配列を含む。いくつかの実施形態では、トランスポザーゼは、配列番号2、4、6、8、10、12、14、若しくは17のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも85%同一の配列を含む。いくつかの実施形態では、トランスポザーゼは、配列番号2、4、6、8、10、12、14、若しくは17のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも90%同一の配列を含む。いくつかの実施形態では、トランスポザーゼは、配列番号2、4、6、8、10、12、14、若しくは17のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも95%同一の配列を含む。
【0097】
いくつかの実施形態では、配列は、BLASTP、CLUSTALW、MUSCLE、若しくはMAFFTアルゴリズム、又はSmith-Waterman相同性検索アルゴリズムパラメーターを用いたCLUSTALWアルゴリズムによって決定され得る。配列同一性は、3のワード長(W)、10の期待値(E)のパラメーター、及び11の存在、1の延長でギャップコストを設定しているBLOSUM62スコアリングマトリックスを使用し、条件付き組成スコアマトリックス調整を使用した、BLASTP相同性検索アルゴリズムによって決定され得る。
【0098】
一態様では、本開示は、本明細書に記載される操作されたトランスポザーゼ系をコードするデオキシリボ核酸ポリヌクレオチドを提供する。
【0099】
一態様では、本開示は、操作された核酸配列を含む核酸を提供する。いくつかの実施形態では、操作された核酸配列は、生物における発現に最適化されている。いくつかの実施形態では、トランスポザーゼは、未培養微生物に由来する。いくつかの実施形態では、生物は、未培養生物ではない。
【0100】
いくつかの実施形態では、トランスポザーゼは、配列番号1~349のうちのいずれか1つと少なくとも約70%の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、配列番号1~349のうちのいずれか1つと少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有する。
【0101】
いくつかの実施形態では、トランスポザーゼは、配列番号1~349のうちのいずれか1つと少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の配列同一性を有するバリアントを含む。いくつかの実施形態では、トランスポザーゼは、配列番号1~349のうちのいずれか1つと実質的に同一であってもよい。
【0102】
いくつかの実施形態では、トランスポザーゼは、TnpA又はTnpBトランスポザーゼではない。いくつかの実施形態では、トランスポザーゼは、TnpAトランスポザーゼと約90%未満、約85%未満、約80%未満、約75%未満、約70%未満、約65%未満、約60%未満、約55%未満、約50%未満、約45%未満、約40%未満、約35%未満、約30%未満、約25%未満、約20%未満、約15%未満、約10%未満、又は約5%未満の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、TnpBトランスポザーゼと約90%未満、約85%未満、約80%未満、約75%未満、約70%未満、約65%未満、約60%未満、約55%未満、約50%未満、約45%未満、約40%未満、約35%未満、約30%未満、約25%未満、約20%未満、約15%未満、約10%未満、又は約5%未満の配列同一性を有する。
【0103】
いくつかの実施形態では、トランスポザーゼは、触媒チロシン残基を含む。
【0104】
いくつかの実施形態では、トランスポザーゼは、サブ末端回文配列を含む左側領域に結合するように構成されている。いくつかの実施形態では、トランスポザーゼは、サブ末端回文配列を含む右側領域に結合するように構成されている。いくつかの実施形態では、トランスポザーゼは、サブ末端回文配列を含む左側領域及びサブ末端回文配列を含む右側領域に結合するように構成されている。
【0105】
いくつかの実施形態では、トランスポザーゼは、二本鎖デオキシリボ核酸ポリヌクレオチドとしてカーゴヌクレオチド配列を転位するように構成されている。いくつかの実施形態では、トランスポザーゼは、一本鎖デオキシリボ核酸ポリヌクレオチドとしてカーゴヌクレオチド配列を転位するように構成されている。
【0106】
いくつかの実施形態では、トランスポザーゼは、真核生物、真菌、植物、哺乳類、又はヒトのゲノムポリヌクレオチド配列と相補的である配列を含む。いくつかの実施形態では、トランスポザーゼは、真核生物のゲノムポリヌクレオチド配列と相補的である配列を含む。いくつかの実施形態では、トランスポザーゼは、真菌のゲノムポリヌクレオチド配列と相補的である配列を含む。いくつかの実施形態では、トランスポザーゼは、植物のゲノムポリヌクレオチド配列と相補的である配列を含む。いくつかの実施形態では、トランスポザーゼは、哺乳類のゲノムポリヌクレオチド配列と相補的である配列を含む。いくつかの実施形態では、トランスポザーゼは、ヒトのゲノムポリヌクレオチド配列と相補的である配列を含む。
【0107】
いくつかの実施形態では、トランスポザーゼは、1つ以上の核局在化配列(NLS)を有するバリアントを含んでもよい。NLSは、トランスポザーゼのN末端又はC末端の近位にあってもよい。NLSは、配列番号455~470のうちのいずれか1つ、又は配列番号455~470のうちのいずれか1つと少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントに対して、N末端又はC末端に付加されてもよい。いくつかの実施形態では、NLSは、配列番号455~470のうちのいずれか1つと実質的に同一の配列を含んでもよい。いくつかの実施形態では、NLSは、配列番号455と実質的に同一の配列を含んでもよい。いくつかの実施形態では、NLSは、配列番号456と実質的に同一の配列を含んでもよい。
【0108】
いくつかの実施形態では、生物は、原核生物である。いくつかの実施形態では、生物は、細菌である。いくつかの実施形態では、生物は、真核生物である。いくつかの実施形態では、生物は、真菌である。いくつかの実施形態では、生物は、植物である。いくつかの実施形態では、生物は、哺乳類である。いくつかの実施形態では、生物は、齧歯類である。いくつかの実施形態では、生物は、ヒトである。
【0109】
一態様では、本開示は、操作されたベクターを提供する。いくつかの実施形態では、操作されたベクターは、トランスポザーゼをコードする核酸配列を含む。いくつかの実施形態では、トランスポザーゼは、未培養微生物に由来する。
【0110】
いくつかの実施形態では、操作されたベクターは、本明細書に記載される核酸を含む。いくつかの実施形態では、本明細書に記載される核酸は、本明細書に記載されるデオキシリボ核酸ポリヌクレオチドである。いくつかの実施形態では、ベクターは、プラスミド、ミニサークル、CELiD、アデノ随伴ウイルス(AAV)由来ビリオン、又はレンチウイルスである。
【0111】
一態様では、本開示は、本明細書に記載されるベクターを含む細胞を提供する。
【0112】
一態様では、本開示は、トランスポザーゼを製造する方法を提供する。いくつかの実施形態では、方法は、細胞を培養することを含む。
【0113】
一態様では、本開示は、二本鎖デオキシリボ核酸ポリヌクレオチドを結合、ニッキング、切断、マーキング、修飾、又は転位する方法を提供する。方法は、二本鎖デオキシリボ核酸ポリヌクレオチドをトランスポザーゼと接触させることを含み得る。いくつかの実施形態では、トランスポザーゼは、サブ末端回文配列を含む左側領域に結合するように構成されている。いくつかの実施形態では、トランスポザーゼは、サブ末端回文配列を含む右側領域に結合するように構成されている。いくつかの実施形態では、トランスポザーゼは、サブ末端回文配列を含む左側領域及びサブ末端回文配列を含む右側領域に結合するように構成されている。
【0114】
いくつかの実施形態では、トランスポザーゼは、TnpAトランスポザーゼ又はTnpBトランスポザーゼではない。いくつかの実施形態では、トランスポザーゼは、TnpAトランスポザーゼと約90%未満、約85%未満、約80%未満、約75%未満、約70%未満、約65%未満、約60%未満、約55%未満、約50%未満、約45%未満、約40%未満、約35%未満、約30%未満、約25%未満、約20%未満、約15%未満、約10%未満、又は約5%未満の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、TnpBトランスポザーゼと約90%未満、約85%未満、約80%未満、約75%未満、約70%未満、約65%未満、約60%未満、約55%未満、約50%未満、約45%未満、約40%未満、約35%未満、約30%未満、約25%未満、約20%未満、約15%未満、約10%未満、又は約5%未満の配列同一性を有する。
【0115】
いくつかの実施形態では、トランスポザーゼは、触媒チロシン残基を含む。
【0116】
いくつかの実施形態では、トランスポザーゼは、二本鎖デオキシリボ核酸ポリヌクレオチドとしてカーゴヌクレオチド配列を転位するように構成されている。いくつかの実施形態では、トランスポザーゼは、一本鎖デオキシリボ核酸ポリヌクレオチドとしてカーゴヌクレオチド配列を転位するように構成されている。
【0117】
いくつかの実施形態では、トランスポザーゼは、未培養微生物に由来する。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、真核生物、植物、真菌、哺乳類、齧歯類、又はヒト二本鎖デオキシリボ核酸ポリヌクレオチドである。
【0118】
一態様では、本開示は、標的核酸遺伝子座を修飾する方法を提供する。方法は、本明細書に記載される操作されたトランスポザーゼ系を標的核酸遺伝子座に送達することを含み得る。いくつかの実施形態では、複合体は、複合体の標的核酸遺伝子座への結合時に、複合体が標的核酸遺伝子座を修飾するように構成されている。
【0119】
いくつかの実施形態では、標的核酸遺伝子座を修飾することは、標的核酸遺伝子座を結合、ニッキング、切断、マーキング、修飾、又は転位することを含む。いくつかの実施形態では、標的核酸遺伝子座は、デオキシリボ核酸(DNA)又はリボ核酸(RNA)を含む。いくつかの実施形態では、標的核酸は、ゲノムDNA、ウイルスDNA、ウイルスRNA、又は細菌DNAを含む。いくつかの実施形態では、標的核酸遺伝子座は、インビトロである。いくつかの実施形態では、標的核酸遺伝子座は、細胞内にある。いくつかの実施形態では、細胞は、原核細胞、細菌細胞、真核細胞、真菌細胞、植物細胞、動物細胞、哺乳類細胞、齧歯類細胞、霊長類細胞、又はヒト細胞である。いくつかの実施形態では、細胞は、初代細胞である。いくつかの実施形態では、初代細胞は、T細胞である。いくつかの実施形態では、初代細胞は、造血幹細胞(HSC)である。
【0120】
いくつかの実施形態では、操作されたトランスポザーゼ系の標的核酸遺伝子座への送達は、本明細書に記載される核酸又は本明細書に記載されるベクターを送達することを含む。いくつかの実施形態では、操作されたトランスポザーゼ系の標的核酸遺伝子座への送達は、トランスポザーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む。いくつかの実施形態では、核酸は、プロモーターを含む。いくつかの実施形態では、トランスポザーゼをコードするオープンリーディングフレームは、プロモーターに作動可能に連結されている。
【0121】
いくつかの実施形態では、操作されたトランスポザーゼ系の標的核酸遺伝子座への送達は、トランスポザーゼをコードするオープンリーディングフレームを含有するキャッピングされたmRNAを送達することを含む。いくつかの実施形態では、操作されたトランスポザーゼ系の標的核酸遺伝子座への送達は、翻訳されたポリペプチドを送達することを含む。いくつかの実施形態では、操作されたトランスポザーゼ系の標的核酸遺伝子座への送達は、リボ核酸(RNA)pol IIIプロモーターに作動可能に連結された操作されたガイドRNAをコードするデオキシリボ核酸(DNA)を送達することを含む。
【0122】
いくつかの実施形態では、トランスポザーゼは、標的遺伝子座で、又は標的伝子座の近位で、一本鎖切断又は二本鎖切断を誘導する。いくつかの実施形態では、トランスポザーゼは、標的遺伝子座内又は標的遺伝子座の5’に互い違いの一本鎖切断を誘導する。
【0123】
一態様では、本開示は、異種トランスポザーゼをコードするオープンリーディングフレームを含む宿主細胞を提供する。いくつかの実施形態では、トランスポザーゼは、配列番号1~349のうちのいずれか1つと少なくとも約70%の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、配列番号1~349のうちのいずれか1つと少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有する。
【0124】
いくつかの実施形態では、トランスポザーゼは、配列番号1~349のうちのいずれか1つと少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含む。いくつかの実施形態では、トランスポザーゼは、配列番号1~349のうちのいずれか1つと実質的に同一であってもよい。
【0125】
いくつかの実施形態では、トランスポザーゼは、TnpA又はTnpBトランスポザーゼではない。いくつかの実施形態では、トランスポザーゼは、TnpAトランスポザーゼと約90%未満、約85%未満、約80%未満、約75%未満、約70%未満、約65%未満、約60%未満、約55%未満、約50%未満、約45%未満、約40%未満、約35%未満、約30%未満、約25%未満、約20%未満、約15%未満、約10%未満、又は約5%未満の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、TnpBトランスポザーゼと約90%未満、約85%未満、約80%未満、約75%未満、約70%未満、約65%未満、約60%未満、約55%未満、約50%未満、約45%未満、約40%未満、約35%未満、約30%未満、約25%未満、約20%未満、約15%未満、約10%未満、又は約5%未満の配列同一性を有する。
【0126】
いくつかの実施形態では、トランスポザーゼは、触媒チロシン残基を含む。
【0127】
いくつかの実施形態では、トランスポザーゼは、サブ末端回文配列を含む左側領域に結合するように構成されている。いくつかの実施形態では、トランスポザーゼは、サブ末端回文配列を含む右側領域に結合するように構成されている。いくつかの実施形態では、トランスポザーゼは、サブ末端回文配列を含む左側領域及びサブ末端回文配列を含む右側領域に結合するように構成されている。
【0128】
いくつかの実施形態では、トランスポザーゼは、二本鎖デオキシリボ核酸ポリヌクレオチドとしてカーゴヌクレオチド配列を転位するように構成されている。いくつかの実施形態では、トランスポザーゼは、一本鎖デオキシリボ核酸ポリヌクレオチドとしてカーゴヌクレオチド配列を転位するように構成されている。
【0129】
いくつかの実施形態では、トランスポザーゼは、配列番号1、3、5、7、9、11、13、15、若しくは16のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも70%同一の配列を含む。いくつかの実施形態では、トランスポザーゼは、配列番号1、3、5、7、9、11、13、15、若しくは16のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも75%同一の配列を含む。いくつかの実施形態では、トランスポザーゼは、配列番号1、3、5、7、9、11、13、15、若しくは16のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも80%同一の配列を含む。いくつかの実施形態では、トランスポザーゼは、配列番号1、3、5、7、9、11、13、15、若しくは16のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも85%同一の配列を含む。いくつかの実施形態では、トランスポザーゼは、配列番号1、3、5、7、9、11、13、15、若しくは16のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも90%同一の配列を含む。いくつかの実施形態では、トランスポザーゼは、配列番号1、3、5、7、9、11、13、15、若しくは16のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも95%同一の配列を含む。
【0130】
いくつかの実施形態では、トランスポザーゼは、配列番号2、4、6、8、10、12、14、若しくは17のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも70%同一の配列を含む。いくつかの実施形態では、トランスポザーゼは、配列番号2、4、6、8、10、12、14、若しくは17のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも75%同一の配列を含む。いくつかの実施形態では、トランスポザーゼは、配列番号2、4、6、8、10、12、14、若しくは17のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも80%同一の配列を含む。いくつかの実施形態では、トランスポザーゼは、配列番号2、4、6、8、10、12、14、若しくは17のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも85%同一の配列を含む。いくつかの実施形態では、トランスポザーゼは、配列番号2、4、6、8、10、12、14、若しくは17のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも90%同一の配列を含む。いくつかの実施形態では、トランスポザーゼは、配列番号2、4、6、8、10、12、14、若しくは17のうちのいずれか1つのバリアント、又はそのバリアントと少なくとも95%同一の配列を含む。
【0131】
いくつかの実施形態では、宿主細胞は、E.coli細胞である。いくつかの実施形態では、E.coli細胞は、λDE3リソゲンであるか、又はE.coli細胞は、BL21(DE3)株である。いくつかの実施形態では、E.coli細胞は、ompT lon遺伝子型を有する。
【0132】
いくつかの実施形態では、オープンリーディングフレームは、T7プロモーター配列、T7-lacプロモーター配列、lacプロモーター配列、tacプロモーター配列、trcプロモーター配列、ParaBADプロモーター配列、PrhaBADプロモーター配列、T5プロモーター配列、cspAプロモーター配列、araPBADプロモーター、ファージラムダからの強い左向きプロモーター(pLプロモーター)、又はそれらの任意の組み合わせに作動可能に連結されている。
【0133】
いくつかの実施形態では、オープンリーディングフレームは、トランスポザーゼをコードする配列にインフレームで連結された親和性タグをコードする配列を含む。いくつかの実施形態では、親和性タグは、固定化金属親和性クロマトグラフィー(IMAC)タグである。いくつかの実施形態では、IMACタグは、ポリヒスチジンタグである。いくつかの実施形態では、親和性タグは、mycタグ、ヒトインフルエンザヘマグルチニン(HA)タグ、マルトース結合タンパク質(MBP)タグ、グルタチオンS-トランスフェラーゼ(GST)タグ、ストレプトアビジンタグ、FLAGタグ、又はそれらの任意の組み合わせである。いくつかの実施形態では、親和性タグは、プロテアーゼ切断部位をコードするリンカー配列を介して、トランスポザーゼをコードする配列にインフレームで連結されている。いくつかの実施形態では、プロテアーゼ切断部位は、タバコエッチウイルス(TEV)プロテアーゼ切断部位、PreScission(登録商標)プロテアーゼ切断部位、トロンビン切断部位、第Xa因子切断部位、エンテロキナーゼ切断部位、又はそれらの任意の組み合わせである。
【0134】
いくつかの実施形態では、オープンリーディングフレームは、宿主細胞における発現のためにコドン最適化される。いくつかの実施形態では、オープンリーディングフレームは、ベクター上に提供される。いくつかの実施形態では、オープンリーディングフレームは、宿主細胞のゲノムに組み込まれる。
【0135】
一態様では、本開示は、適合する液体培地中に、本明細書に記載される宿主細胞を含む培養物を提供する。
【0136】
一態様では、本開示は、適合する成長培地中で、本明細書に記載される宿主細胞を培養することを含む、トランスポザーゼを産生する方法を提供する。いくつかの実施形態では、方法は、追加の化学剤又は増加された量の栄養素を添加することによって、トランスポザーゼの発現を誘導することを更に含む。いくつかの実施形態では、追加の化学剤又は増加された量の栄養素は、イソプロピルβ-D-1-チオガラクトピラノシド(IPTG)又は追加の量のラクトースを含む。いくつかの実施形態では、方法は、培養後に宿主細胞を単離することと、宿主細胞を溶解してタンパク質抽出物を産生することとを更に含む。いくつかの実施形態では、方法は、タンパク質抽出物をIMAC、又はイオン親和性クロマトグラフィーに供することを更に含む。いくつかの実施形態では、オープンリーディングフレームは、トランスポザーゼをコードする配列にインフレームで連結されたIMAC親和性タグをコードする配列を含む。いくつかの実施形態では、IMAC親和性タグは、プロテアーゼ切断部位をコードするリンカー配列を介して、トランスポザーゼをコードする配列にインフレームで連結されている。いくつかの実施形態では、プロテアーゼ切断部位は、タバコエッチウイルス(TEV)プロテアーゼ切断部位、PreScission(登録商標)プロテアーゼ切断部位、トロンビン切断部位、第Xa因子切断部位、エンテロキナーゼ切断部位、又はそれらの任意の組み合わせを含む。いくつかの実施形態では、方法は、プロテアーゼ切断部位に対応するプロテアーゼをトランスポザーゼと接触させることによって、IMAC親和性タグを切断することを更に含む。いくつかの実施形態では、方法は、サブトラクティブIMAC親和性クロマトグラフィーを実施して、トランスポザーゼを含む組成物から親和性タグを除去することを更に含む。
【0137】
一態様では、本開示は、細胞における遺伝子座を破壊する方法を提供する。いくつかの実施形態では、方法は、トランスポザーゼを含む組成物を細胞に接触させることを含む。いくつかの実施形態では、トランスポザーゼは、細胞内でTnpAトランスポザーゼと少なくとも同等の転位活性を有する。いくつかの実施形態では、トランスポザーゼは、配列番号1~349のうちのいずれか1つと少なくとも約70%の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、配列番号1~349のうちのいずれか1つと少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有する。
【0138】
いくつかの実施形態では、トランスポザーゼは、配列番号1~349のうちのいずれか1つと少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含む。いくつかの実施形態では、トランスポザーゼは、配列番号1~349のうちのいずれか1つと実質的に同一であってもよい。
【0139】
いくつかの実施形態では、トランスポザーゼは、TnpA又はTnpBトランスポザーゼではない。いくつかの実施形態では、トランスポザーゼは、TnpAトランスポザーゼと約90%未満、約85%未満、約80%未満、約75%未満、約70%未満、約65%未満、約60%未満、約55%未満、約50%未満、約45%未満、約40%未満、約35%未満、約30%未満、約25%未満、約20%未満、約15%未満、約10%未満、又は約5%未満の配列同一性を有する。いくつかの実施形態では、トランスポザーゼは、TnpBトランスポザーゼと約90%未満、約85%未満、約80%未満、約75%未満、約70%未満、約65%未満、約60%未満、約55%未満、約50%未満、約45%未満、約40%未満、約35%未満、約30%未満、約25%未満、約20%未満、約15%未満、約10%未満、又は約5%未満の配列同一性を有する。
【0140】
いくつかの実施形態では、トランスポザーゼは、触媒チロシン残基を含む。
【0141】
いくつかの実施形態では、トランスポザーゼは、サブ末端回文配列を含む左側領域に結合するように構成されている。いくつかの実施形態では、トランスポザーゼは、サブ末端回文配列を含む右側領域に結合するように構成されている。いくつかの実施形態では、トランスポザーゼは、サブ末端回文配列を含む左側領域及びサブ末端回文配列を含む右側領域に結合するように構成されている。
【0142】
いくつかの実施形態では、トランスポザーゼは、二本鎖デオキシリボ核酸ポリヌクレオチドとしてカーゴヌクレオチド配列を転位するように構成されている。いくつかの実施形態では、トランスポザーゼは、一本鎖デオキシリボ核酸ポリヌクレオチドとしてカーゴヌクレオチド配列を転位するように構成されている。
【0143】
いくつかの実施形態では、トランスポザーゼは、真核生物、真菌、植物、哺乳類、又はヒトのゲノムポリヌクレオチド配列と相補的である配列を含む。いくつかの実施形態では、トランスポザーゼは、真核生物のゲノムポリヌクレオチド配列と相補的である配列を含む。いくつかの実施形態では、トランスポザーゼは、真菌のゲノムポリヌクレオチド配列と相補的である配列を含む。いくつかの実施形態では、トランスポザーゼは、植物のゲノムポリヌクレオチド配列と相補的である配列を含む。いくつかの実施形態では、トランスポザーゼは、哺乳類のゲノムポリヌクレオチド配列と相補的である配列を含む。いくつかの実施形態では、トランスポザーゼは、ヒトのゲノムポリヌクレオチド配列と相補的である配列を含む。
【0144】
いくつかの実施形態では、トランスポザーゼは、1つ以上の核局在化配列(NLS)を有するバリアントを含んでもよい。NLSは、トランスポザーゼのN末端又はC末端の近位にあってもよい。NLSは、配列番号455~470のうちのいずれか1つ、又は配列番号455~470のうちのいずれか1つと少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントに対して、N末端又はC末端に付加されてもよい。いくつかの実施形態では、NLSは、配列番号455~470のうちのいずれか1つと実質的に同一の配列を含んでもよい。いくつかの実施形態では、NLSは、配列番号455と実質的に同一の配列を含んでもよい。いくつかの実施形態では、NLSは、配列番号456と実質的に同一の配列を含んでもよい。
【0145】
いくつかの実施形態では、転位活性は、標的核酸遺伝子座を含む細胞にトランスポザーゼを導入し、細胞内の標的核酸遺伝子座の転位を検出することによって、インビトロで測定される。いくつかの実施形態では、組成物は、20ピコモル(pmol)以下のトランスポザーゼを含む。いくつかの実施形態では、組成物は、1pmol以下のトランスポザーゼを含む。
【0146】
本開示の系は、例えば、核酸編集(例えば、遺伝子編集)、核酸分子への結合(例えば、配列特異的結合)などの様々な用途に使用され得る。そのような系は、例えば、対象において疾患を引き起こす可能性のある遺伝的に受け継がれた変異に対処する(例えば、除去又は置換する)ため、遺伝子を細胞におけるその機能を確認するために不活性化するため、疾患を引き起こす遺伝子エレメントを検出する診断ツールとして(例えば、逆転写されたウイルスRNA若しくは疾患を引き起こす変異をコードする増幅されたDNA配列の切断を介して)、特定のヌクレオチド配列(例えば、細菌内の抗生物質耐性をコードする配列)を標的とし検出するためのプローブと組み合わせた不活性化酵素として、ウイルスゲノムを標的化することによってウイルスを不活性化するか、若しくは宿主細胞に感染できないようにするため、価値ある低分子、高分子、若しくは二次代謝産物を生じるように生物を操作するための遺伝子を加えるか、若しくは代謝経路を修正するため、進化的選択のための遺伝子駆動エレメントを確立するため、バイオセンサーとして外来低分子及びヌクレオチドによる細胞の摂動を検出するために、使用され得る。
【実施例
【0147】
IUPACの慣例に従って、以下の略語が実施例を通して使用される。
A=アデニン
C=シトシン
G=グアニン
T=チミン
R=アデニン又はグアニン
Y=シトシン又はチミン
S=グアニン又はシトシン
W=アデニン又はチミン
K=グアニン又はチミン
M=アデニン又はシトシン
B=C、G、又はT
D=A、G、又はT
H=A、C、又はT
V=A、C、又はG
【0148】
実施例 1-新しいタンパク質のメタゲノム分析の方法
メタゲノム試料を、堆積物、土壌、及び動物から収集した。デオキシリボ核酸(DNA)を、Zymobiomics DNAミニプレップキットを用いて抽出し、Illumina HiSeq(登録商標)2500で配列決定した。試料を、所有者の同意を得て収集した。公的供給源からの更なる生配列データには、動物マイクロバイオーム、堆積物、土壌、温泉、熱水通気孔、海洋、泥炭、パーマフロスト、及び下水の配列が含まれていた。メタゲノム配列データを、記録されたトランスポザーゼタンパク質配列に基づいて生成された隠れマルコフモデルを使用して検索し、新しいトランスポザーゼを特定した。検索によって特定した新規トランスポザーゼタンパク質を、記録されたタンパク質に対して整列させて、潜在的な活性部位を特定した。このメタゲノムワークフローは、本明細書に記載されるMG92ファミリーの描写をもたらした。
【0149】
実施例 2-トランスポザーゼのMG92ファミリーの発見
実施例1のメタゲノム分析からのデータの分析により、これまでに記述されていない、1つのファミリー(MG92)を含む推定トランスポザーゼ系の新しいクラスターが明らかになった。これらの新しい酵素及びそれらの例示的なサブドメインに対応するタンパク質配列を、配列番号1~349として示す。
【0150】
実施例 3-インテグラーゼインビトロ活性(予測的)
インテグラーゼ活性は、E.coli溶解物ベースの発現系(例えば、myTXTL、Arbor Biosciences)における発現を介して行うことができる。インビトロ試験に必要な成分は、3つのプラスミド、すなわち、T7プロモーター下のトランスポゾン遺伝子を有する発現プラスミド、標的プラスミド、並びにカーゴ遺伝子(例えば、Tet耐性遺伝子)の周りの転位に必要な左端(LE)及び右端(RE)のDNA配列を含有するドナープラスミドである。溶解物ベースの発現産物、標的DNA、及びドナーDNAをインキュベートして、転位が起こるようにする。転位は、PCRを介して検出される。加えて、転位産物を、T5でタグメントし、NGSを介して配列決定して、転位事象の集団上の挿入部位を決定する。あるいは、インビトロ転位産物を、抗生物質(例えば、Tet)選択下でE.coliへと形質転換することができ、この場合、成長には、転位カーゴがプラスミドへと安定して挿入されることが必要である。単一コロニー又はE.coliの集団のいずれかを配列決定して、挿入部位を決定することができる。
【0151】
組み込み効率は、組み込まれたカーゴを有する標的DNAの実験アウトプットのddPCR又はqPCRを介して測定することができ、同じくddPCRを介して測定される未修飾の標的DNAの量に対して正規化される。
【0152】
このアッセイはまた、溶解物ベースの発現からではなく、精製されたタンパク質成分で行われてもよい。この場合、タンパク質は、T7誘導性プロモーター下でE.coliプロテアーゼ欠損B株で発現され、細胞は超音波処理を用いて溶解され、目的のHisタグ付きタンパク質は、AKTA Avant FPLC(GE Lifescience)上のHisTrap FF(GE Lifescience)Ni-NTA親和性クロマトグラフィーを用いて精製される。純度は、SDS-PAGE及びInstantBlue Ultrafast(Sigma-Aldrich)クマシー染色アクリルアミドゲル(Bio-Rad)上で分解されたタンパク質バンドのImageLabソフトウェア(Bio-Rad)における密度測定を用いて決定される。タンパク質を、50mMのTris-HCl、300mMのNaCl、1mMのTCEP、5%のグリセロール、pH7.5で構成される保存緩衝液中(又は最大安定性について決定された他の緩衝液)で脱塩し、-80℃で保存する。精製後、トランスポゾン遺伝子を、反応緩衝液、例えば、26mMのHEPES pH7.5、4.2mMのTRIS pH8、50μg/mLのBSA、2mMのATP、2.1mMのDTT、0.05mMのEDTA、0.2mMのMgCl、28mMのNaCl、21mMのKCl、1.35%のグリセロール(最終pH7.5)に15mMのMgOAcを補充したものにおいて、上述の標的DNA及びドナーDNAに添加する。
【0153】
実施例 4-ゲルシフトを介したトランスポゾン端の検証(予測的)
トランスポゾン端は、電気泳動移動度シフトアッセイ(EMSA)を介してトランスポザーゼ結合について試験される。この場合、潜在的なLE又はREは、DNA断片(100~500bp)として合成され、FAM標識プライマーを用いたPCRを介してFAMで端標識される。トランスポザーゼタンパク質を、インビトロ転写/翻訳系(例えば、PURExpress)で合成する。合成後、1μLのタンパク質を、結合緩衝液(例えば、20mMのHEPES pH7.5、2.5mMのTris pH7.5、10mMのNaCl、0.0625mMのEDTA、5mMのTCEP、0.005%のBSA、1μg/mLのポリ(dI-dC)、及び5%のグリセロール)中の10μL反応物中の50nMの標識されたRE又はLEに添加する。結合を30°で40分間インキュベートし、次いで、2μLの6Xローディング緩衝液(60mMのKCl、10mMのTris pH7,6、50%グリセロール)を添加する。結合反応物を5%TBEゲル上で分離し、可視化する。トランスポザーゼタンパク質の存在下でのLE又はREのシフトは、結合の成功に起因し得、トランスポザーゼ活性を示す。このアッセイはまた、トランスポザーゼのトランケーション又は変異で、並びにE.coli抽出物又は精製タンパク質を使用して、実施することができる。
【0154】
実施例 5-ドナーDNAの切断の検証(予測的)
トランスポザーゼがドナーDNAの切断に関与することを確認するために、最大10bpで分離されたRE-LE接合部を含有する短い(約140bp)断片を、FAM標識プライマーを用いたPCRを介して、両端でFAMで標識する。標識されたDNA断片をインビトロ転写/翻訳トランスポザーゼ産物でインキュベートし、DNAを変性ゲル上で分析する。接合部の各端での切断は、ゲル上で異なる比率で移動する2つの標識された一本鎖断片をもたらし得る。
【0155】
実施例 6-E.coliにおけるインテグラーゼ活性(予測的)
操作されたE.coli株を、トランスポゾン遺伝子を発現するプラスミドと、組み込みのための左端(LE)及び右端(RE)トランスポゾンモチーフに隣接した選択可能なマーカーを有する温度感受性複製起点を含有するプラスミドとで形質転換する。トランスポザーゼ成分によるドナーssDNA優先性を確認するためには、ssDNAプラスミド超らせん形成をドナーとして使用することができる。次いで、これらの遺伝子の発現のために誘導された形質転換体を、プラスミド複製のための制限温度での選択によってゲノム標的へのマーカーの移行についてスクリーニングし、ゲノム内のマーカー組み込みをPCRによって確認する。
【0156】
組み込みは、不偏アプローチを使用してスクリーニングされる。簡潔に述べると、精製されたgDNAは、Tn5でタグメントされ、次いで目的のDNAは、Tn5タグメンテーション及び選択可能なマーカーに特異的なプライマーを使用してPCR増幅される。次いで、アンプリコンをNGSシーケンシングのために調製する。得られた配列の分析をトランスポゾン配列からトリミングし、隣接配列をゲノムにマッピングして挿入位置を決定し、挿入比率を決定する。
【0157】
あるいは、42℃で欠陥のあるDNAポリメラーゼI(PolI)を産生するpolA変異体E.coli株MM383を使用して、前述のように組み込みを検出する(Brandsma et al.,1981)。42℃での成長後の選択可能なマーカーに対する耐性は、ドナーDNAの染色体への組み込みを示す。ドナーなしのpUC19プラスミドを、抗生物質選択なしで42℃で24時間成長させた後の対照として使用する。
【0158】
選択培地で正常に成長するE.coli株は、カーゴ耐性遺伝子をコードするドナーDNAを組み込んだものと推定される。抗生物質選択プレートで成長するコロニーは、カーゴの存在について遺伝子型決定され、全ゲノム配列のNGSが実施される。
【0159】
実施例 7-哺乳類細胞におけるインテグラーゼ活性(予測的)
哺乳類細胞における標的化及び切断活性を示すために、トランスポゾンタンパク質の各々を、タンパク質配列のいずれかの末端上の2つのNLSペプチドで精製する。選択可能なネオマイシン耐性マーカー(NeoR)、又は左端(LE)及び右端(RE)モチーフに隣接した蛍光マーカーを含有するプラスミドを合成する。次いで、細胞を、プラスミドでトランスフェクトし、4~6時間回収し、その後、トランスポゾンタンパク質でエレクトロポレーションする。ゲノムへの抗生物質耐性組み込みは、G418-耐性コロニー数によって定量化され、蛍光マーカーによる陽性転位は、蛍光活性化細胞サイトメトリーによってアッセイされる。共トランスフェクションの72時間後、ゲノムDNAが、抽出され、NGS-ライブラリの調製に使用される。組み込み頻度は、Tn5タグメンテーションによってアッセイされる。
【0160】
実施例8-インシリコ分析
微生物、ウイルス、及び真核生物のゲノムの広範なアセンブリ駆動型メタゲノムデータベースを引き出して、ssDNAトランスポザーゼ機能を有する予測タンパク質を得た。400を超える予測タンパク質が、挿入配列IS200/IS605のTnpAトランスポザーゼに対して有意なe値(<1×10-5)を有した。完全なORFをフィルタリングし、触媒残基(Y1及びHuH)の存在を確認した後、TnpA様タンパク質配列を、パラメーターG-INSI(Mol Biol Evol 30,772-780(2013))でMAFFTで整列させ、アライメントを使用して、FastTree2で系統樹を推測した(Plos One 5,e9490(2010))。TnpAトランスポザーゼの系統的分析により、IS200/IS605挿入配列に関連する新規TnpA様タンパク質配列の高い多様性が明らかになった(図2)。
【0161】
挿入配列の左端及び右端(LE及びRE)を予測するために、ISFinderデータベース(https://www-is.biotoul.fr/)で利用可能な活性なLE配列及びRE配列から共分散モデルを構築した。具体的には、LE配列及びRE配列の複数の配列アライメント(MSA)を、パラメーターX-INSI(Mol Biol Evol 30,772-780(2013))でMAFFTで構築し、アライメントの二次構造を、パラメーター-p--aln-stk(Vienna Package)でRNAalifold 2.5.0でMSAから推測した。共分散モデルをInfernalパッケージ(http://eddylab.org/infernal/)で構築し、候補TnpAトランスポザーゼを含有するゲノム断片を、Infernalコマンド「cmsearch」で共分散モデルを使用して検索した。共分散モデルは、70を超える候補IS200/IS605挿入配列についてLE及びREを予測した(図3)。
【0162】
実施例9-ssDNAカーゴの生成
各TnpA様候補は、メタゲノムコンティグで特定された推定の左端(LE)配列及び右端(RE)配列を含む固有のカーゴを有した。これらの推定のLE配列及びRE配列をクローニングして、Gibsonアセンブリを介してカナマイシン(Kan)耐性カーゴ遺伝子に隣接させた。ssDNAカーゴを、Phusion HF(NEB)を用いた標準サイクル条件を使用して、フォワードプライマーGTGCGGTAGTAAAGGTTAATACTGTT及び5’-リン酸修飾リバースプライマーCTATAGTGAGTCGTATTAを用いたLE/RE領域の外側の共通プライマーによるKanカーゴプラスミドのPCRを介して生成した。PCR増幅後、ラムダエキソヌクレアーゼ(NEB)を使用してDNA下部鎖を分解し、残りの上部鎖を、ssDNAを精製するために製造業者が推奨する変更を有するDCC-5スピンカラム(Zymo Research)を使用して精製した。一本鎖DNAを、アガロースゲル上でチェックしてdsDNAの完全な変換を検証し、ssDNA Qubitキット(Thermofisher)によって定量し、20nMの平均濃度を得た。
【0163】
実施例10-TnpAインビトロ発現構築物の設計
インビトロ活性のために、各TnpA様タンパク質遺伝子を、T7プロモーターの制御下でE.coli翻訳のためにコドン最適化されたpET21(+)中で合成し、HAタグを欠く92-1を除き、C末端HAタグ及びHisタグに隣接させた。次いで、TnpA様タンパク質プラスミドを、T7プロモーターの上流及びT7ターミネーターの下流の約150bpに結合するプライマー(プライマーTGGCGAGAAAGGAAGGGAAG及びCCGAAACAAGCGCTCATGAG)を使用して増幅し、SPRIビーズクリーンアップ(MagBio HighPrep)を介して精製して最終鋳型濃度>80ng/μLを得た。
【0164】
実施例11-インビトロ転位活性
インビトロ活性のために、TnpA様タンパク質候補を、まず、製造業者が推奨する条件に従って、37℃で2時間、8ng/μLの最小鋳型濃度(PURExpress,NEB)でインビトロ転写-翻訳(IVTT)キットで発現させた。発現をHAタグに対するウェスタンブロットを介して検証したが、このタグを欠く92-1は除いた。(図4)。10μLの反応物当たり添加された1μLのIVTT産物、平均5nMのssDNAカーゴ、及び反応緩衝液(20mMのHEPES(pH7.5)、160mMのNaCl、5mMのMgCl、5mMのTCEP、20μg/mLのBSA、0.5μg/mLのポリ-dIdC、及び20%のグリセロール)中で8N無作為化配列を含有する50nMの161nt「標的」ssDNAを用いて、転位アッセイをセットアップした。対照反応には、Tris緩衝液をPCR鋳型の代わりにIVTTに添加した、IVTTの鋳型なし対照(NTC)反応が含まれていた。反応物を37℃で1時間インキュベートして、転位を発生させ、次いで反応物を水中で10倍希釈し、PCRを介して転位を検出した。LE接合部は、標的の5’端のフォワードプライマー及びKanカーゴ内のリバースプライマーを介して検出され、RE接合部は、Kanカーゴ内のフォワードプライマー及び標的の3’端のリバースプライマーを介して検出された。PCR産物を、アガロースゲル上で実行して転位を検出し(図5A及び図5B)、サンガー及びNGSシーケンシングを介して配列決定した。標的及びカーゴ配列の両方を含有するキメラリードを分析して、転位の接合部、挿入モチーフ、及びカーゴ上の切断部位を決定した(図6図9)。
【0165】
LE PCR産物については、挿入モチーフは、カーゴと標的との間の重複配列同一性から特定することができる。例えば、MG92-3の標的とLEとの間の接合部は、標的及びカーゴの配列がもはや重複しなくなる点として特定される(図6)。挿入モチーフは、転位を伴わない標的DNAの隣接配列の分析を介して特定することができる。8Nへの挿入の場合、標的モチーフを、REリードではなく、LEリードでのみ曖昧さなしに特定することができる。MG92-3については、挿入モチーフを、AATGAC又はその中のヌクレオチドのサブセット、例えばTGACとして特定した(図6図7)。RE PCR産物については、RE接合部を、カーゴとターゲットへのマッピング間でリードが切り替わるブレイクポイントを介して特定する(図7)。LE接合部及びRE接合部のシーケンシングは、同じ挿入位置を示す。LE接合部は、NGSを介して更に確認され、これはサンガーシーケンシングを介して決定されたLE内の同じ切断点を特定した(図8)。
【0166】
これらのデータから、LE境界を以下のように決定することができる。TGAAAACAAACATTTTACCAAGGCCCGCAGGCTCCGTCTATAGCGACAAGCGCTAACTTTGGCTACGCTTGTCGTTTAGGCGGGGTTAGT。これは、完全なMG92-3 LEのサブセットであり、認識モチーフAATGAC又はその中のヌクレオチドのサブセットに隣接した場合にのみ、MG92-3によって認識される。同様に、RE境界を以下のように特定することができる。GTTTGCGCTGTATCTGTGGTCAGGTATCCACTCCTACCTAAAGTAGCAGGCATGAACGAAAGTTTATGCGGAGTTTGGAAGCCCCGTCTATATTCGCGAAAGCGGATTAGGCGGGGAGGGTTCAC、そのいくつか又は全ては、TnpA様タンパク質による認識、切除、及び挿入に必要である。両方の配列は、Cell 132,208-220(2008)及びNucleic Acids Res 39,8503-8512(2011)に記載されるように、TnpA及びTnpA様タンパク質が認識する非標準塩基対形成相互作用に隣接するTnpA様タンパク質認識の予測ヘアピンを含有する(図6~7)。
【0167】
同様に、MG92-4の活性は、NGS検出を介して確認され、サンガーシーケンシングでは検出可能ではない弱いシグナルを有し、RE切断及び挿入を示した(図9)。このシグナルはNGSによってのみ検出可能であったため、これらの結果は、この挿入モチーフが可能であるが、最適な挿入配列ではない可能性があることを示唆している。
【0168】
実施例12-インビトロ切除アッセイ(予測的)
インビトロ切除活性を決定するために、TnpA様タンパク質候補を、製造業者が推奨する条件に従って、37℃で2時間、8ng/μLの最小鋳型濃度(PURExpress,NEB)でインビトロ転写-翻訳(IVTT)キットで発現させた。10μLの反応物当たり添加された1μLのIVTT産物、及びTnpA反応緩衝液(20mMのHEPES(pH7.5)、160mMのNaCl、5mMのMgCl、10mMのTCEP、20mg/mLのBSA、0.5mgのポリ-dIdC、及び20%のグリセロール)中で37℃で60分間の100ngのLE-Kan-RE ssDNA(約2.2kb)を用いて、切除アッセイを設定する。反応を、0.1%SDSを添加し、37℃で更に15分間インキュベーションすることによって終了させる。その後、反応物をRNase処理し、DNAアガロースゲル上で実行して、LE-Kan-RE ssDNAの切除が起こったかどうかを決定する。次いで、切除されたKan配列を、ゲル抽出し、LE及びRE切断モチーフを決定するためのシーケンシングに供する。
【0169】
実施例13-インビボ切除アッセイ(予測的)
インビボ切除アッセイはまた、一方がLE-Kan-REカーゴ及び他方がTnpAを含有する2つのプラスミドでE.coliを共形質転換することによって実施される。形質転換及び一晩成長させた後、切除は、一晩培養のミニプレップ及びDNAゲル上でKan配列が除去された再閉鎖ドナー骨格分子の検出によって決定される。この実験の対照には、単一のプラスミドの形質転換、又はTnpA含有プラスミド及び逆複製起点を有するカーゴプラスミドの両方の形質転換が含まれる。切除されたDNA骨格を、ゲル抽出し、シーケンシングに供して、TnpAトランスポゾンのRE境界及びLE境界を得る。挿入モチーフは、切除された骨格に留まり、シールされた接合部でも特定され得る。
【0170】
実施例14-挿入部位特異性の変更(予測的)
挿入認識部位の操作は、TnpAタンパク質の操作を必要とすることなく、Cell 132,208-220(2008)によって実証されている。本明細書に記載されるメタゲノミクス由来TnpA様タンパク質によって認識される挿入部位は、挿入部位モチーフに対する配列変異及びLEヘアピン配列に隣接するLE ssDNAにおける塩基対形成パートナーに対する代償的変異を介して修飾される。一連の単一、二重、及び三重配列変異が、挿入部位及びLE配列の合理的に設計された位置に導入される。野生型TnpA様タンパク質による変異挿入部位の認識及び切断を、上述の切除/挿入アッセイ及びその後のシーケンシング工程を使用して、野生型LE挿入配列と同時に試験し、活性レベルを比較する。
【0171】
実施例15-TnpAは、プログラム可能な組み込みのために配列特異的エンドヌクレアーゼとともに使用することができる(予測的)
IS200/IS605トランスポゾンは、特定の標的部位に組み込まれる移動性遺伝子エレメントの一種である。これらのトランスポゾンは、それらのコードされたTnpA様トランスポザーゼ、チロシン(Y)トランスポザーゼのファミリーに属する酵素によって動員される(Microbiol Spectr 3,(2015)で論評されている)。IS200/IS605トランスポゾン動員の機構は、TnpA又はTnpA様タンパク質によるその切除、続いて、標的部位が複製フォークでssDNAとしてアクセス可能な場合、宿主複製中に認識された標的部位でのその組み込みを伴う(Cell 142,398-408(2010))。
【0172】
TnpA様タンパク質と共有される標的部位への特定の配列特異的(例えば、Cas)エンドヌクレアーゼエフェクターのRNAガイド結合能力は、Rループの形成を通してssDNA及び標的部位を利用可能にすることによって、所望のカーゴのTnpA様エフェクター介在性組み込みを補助し得る。具体的には、TnpA様認識可能なLE及びREに隣接した所望のカーゴ(例えば、蛍光マーカー遺伝子)は、TnpA又はTnpA様エフェクターによってドナー鋳型から切除され、(融合された)配列特異的エンドヌクレアーゼの結合によって利用可能になる所望の標的部位(TnpA又はTnpA様タンパク質認識可能モチーフを含有する)へと組み込まれる。配列特異的エンドヌクレアーゼは、触媒的に死滅するか、又は低減若しくは改変されたエンドヌクレアーゼ(例えば、ニッカーゼ)活性を有するように操作されてもよい。したがって、TnpA様タンパク質は、融合され、操作された(例えば、死滅した又はニッカーゼ)配列特異的エンドヌクレアーゼエフェクターによって利用可能にされたTAM依存性標的部位へと所望のカーゴを挿入するように「プログラム」され得る。
【0173】
実施例16-dsDNA中のRループへのTnpA様挿入のインビトロ試験(予測的)
dsDNA中のRループとして生成されたssDNAに挿入するTnpA様タンパク質の能力は、インビトロで特定された活性TnpA様タンパク質、並びにそれらの対応するLE配列及びRE配列を使用して試験することができる。Rループは、IVTT反応で発現されるか、又は精製されたRNPとして添加されるRNA指向性ヌクレアーゼ死滅酵素又はニッカーゼなどの配列特異的エンドヌクレアーゼを介して生成することができる。TnpA様タンパク質は、標的ssDNAがdsDNA及びRNPによって置き換えられることを除いて、インビトロ挿入アッセイに記載されるように試験される。挿入活性は、LE接合部又はRE接合部のいずれかに隣接するdsDNA標的及びssDNAカーゴ内のプライマーを用いてPCRを介してアッセイされる。挿入部位の最適な位置は、Rループに沿った様々な位置に挿入モチーフを配置して、TnpA様タンパク質による最良のアクセス性を有する部位を決定することによって試験される。ミスマッチDNA鎖がアニーリングされるdsDNA中のssDNAバブルへの挿入も試験することができる。
【0174】
【表2-1】
【0175】
【表2-2】
【0176】
【表2-3】
【0177】
【表2-4】
【0178】
【表2-5】
【0179】
【表2-6】
【0180】
【表2-7】
【0181】
【表2-8】
【0182】
【表2-9】
【0183】
【表2-10】
【0184】
【表2-11】
【0185】
【表2-12】
【0186】
【表2-13】
【0187】
【表2-14】
【0188】
【表2-15】
【0189】
【表2-16】
【0190】
【表2-17】
【0191】
【表2-18】
【0192】
【表2-19】
【0193】
【表2-20】
【0194】
【表2-21】
【0195】
【表2-22】
【0196】
【表2-23】
【0197】
【表2-24】
【0198】
【表2-25】
【0199】
【表2-26】
【0200】
【表2-27】
【0201】
本発明の好ましい実施形態が本明細書に示され、記載されてきたが、そのような実施形態が例示の目的でのみ提供されていることは、当業者には明らかであろう。本発明は、本明細書内で提供される特定の実施例によって限定されることは意図されていない。本発明は前述の説明を参照して記載されているが、本明細書の実施形態の記載及び説明は、限定された意味で解釈されることを意図していない。多数の変形、変更、及び置換は、ここで、本発明から逸脱することなく、当業者にとって生じるであろう。更に、本発明の全ての態様は、様々な条件及び変数に依存する、本明細書に記載される特定の描写、構成又は相対的割合に限定されないことが理解されよう。本明細書に記載される本発明の実施形態に対する様々な代替が、本発明の実施に用いられ得ることは、理解されるべきである。したがって、本発明は、こうした任意の代替、修正、変形、又は均等物も包含することが企図される。以下の特許請求の範囲は本発明の範囲を定義し、これらの特許請求の範囲及びそれらの均等物の範囲内の方法及び構造がそれによって包含されることが意図される。
図1A
図1B
図2
図3
図4
図5A
図5B
図6
図7
図8
図9
【配列表】
2024533038000001.xml
【国際調査報告】