IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヴィリニュス・ユニバーシティの特許一覧

特表2024-524514ポリヌクレオチドを標的とする新規RNAプログラム可能システム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-07-05
(54)【発明の名称】ポリヌクレオチドを標的とする新規RNAプログラム可能システム
(51)【国際特許分類】
   C12N 15/09 20060101AFI20240628BHJP
   C12N 9/22 20060101ALI20240628BHJP
   C12N 15/55 20060101ALI20240628BHJP
   C12N 15/31 20060101ALI20240628BHJP
   C12N 11/00 20060101ALI20240628BHJP
   C07K 19/00 20060101ALI20240628BHJP
   C07K 14/195 20060101ALI20240628BHJP
   C12N 15/62 20060101ALI20240628BHJP
   C12N 1/15 20060101ALI20240628BHJP
   C12N 1/19 20060101ALI20240628BHJP
   C12N 1/21 20060101ALI20240628BHJP
   C12N 5/10 20060101ALI20240628BHJP
   C12N 15/864 20060101ALI20240628BHJP
   C12N 5/078 20100101ALI20240628BHJP
   C12N 15/89 20060101ALI20240628BHJP
   C12N 15/88 20060101ALI20240628BHJP
   C12N 15/11 20060101ALI20240628BHJP
   C07K 14/47 20060101ALI20240628BHJP
   C12P 21/02 20060101ALI20240628BHJP
   C12N 15/63 20060101ALI20240628BHJP
   C12N 5/0783 20100101ALI20240628BHJP
【FI】
C12N15/09 100
C12N9/22 ZNA
C12N15/55
C12N15/31
C12N11/00
C07K19/00
C07K14/195
C12N15/62 Z
C12N1/15
C12N1/19
C12N1/21
C12N5/10
C12N15/864 100Z
C12N5/078
C12N15/89 Z
C12N15/88 Z
C12N15/11 Z
C07K14/47
C12P21/02 C
C12N15/63 Z
C12N5/0783
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024500032
(86)(22)【出願日】2021-07-02
(85)【翻訳文提出日】2024-02-13
(86)【国際出願番号】 IB2021055958
(87)【国際公開番号】W WO2023275601
(87)【国際公開日】2023-01-05
(81)【指定国・地域】
(71)【出願人】
【識別番号】516314125
【氏名又は名称】ヴィリニュス・ユニバーシティ
【氏名又は名称原語表記】Vilnius University
(74)【代理人】
【識別番号】110000877
【氏名又は名称】弁理士法人RYUKA国際特許事務所
(72)【発明者】
【氏名】シクスニス、ヴィルギニジュス
(72)【発明者】
【氏名】カルヴェリス、タウトヴィダス
【テーマコード(参考)】
4B033
4B064
4B065
4H045
【Fターム(参考)】
4B033NA26
4B064AG01
4B064CA19
4B064CC24
4B064DA01
4B064DA13
4B065AA01X
4B065AA57X
4B065AA72X
4B065AA87X
4B065AB01
4B065AC14
4B065BA02
4B065CA27
4H045AA10
4H045AA30
4H045BA10
4H045CA11
4H045DA89
4H045FA74
(57)【要約】
本発明は、RNA及びTnpBタンパク質を含むタンパク質を含むエフェクター複合体を用いてポリヌクレオチドを切断するための方法、及び、関連する方法及び産物に関する。
【特許請求の範囲】
【請求項1】
エフェクター複合体を用いてポリヌクレオチドを切断するための方法であって、前記ポリヌクレオチドは標的配列を含み、前記エフェクター複合体は:
(a)TnpBタンパク質を含む又はそれから成るタンパク質;及び
(b)
(i)前記標的配列にハイブリダイズすることが可能なガイド配列を含むポリヌクレオチドターゲティングセグメント;及び
(ii)RNAが前記TnpBタンパク質と結合して前記エフェクター複合体を形成することを可能にするタンパク質結合セグメント
を含む前記RNA
を備え、ここで、前記方法は、前記ポリヌクレオチドを前記エフェクター複合体と接触させ、前記TnpBタンパク質が前記ポリヌクレオチドを切断することを可能にする段階を備える
方法。
【請求項2】
前記TnpBタンパク質は、IS200/IS605ファミリー又はIS607ファミリーにおける可動遺伝因子のtnpB遺伝子から取得されたタンパク質のアミノ酸配列を有する、請求項1に記載の方法。
【請求項3】
前記TnpBタンパク質は、前記IS200/IS605ファミリーからの可動遺伝因子のtnpB遺伝子から取得されたタンパク質のアミノ酸配列を有する、請求項2に記載の方法。
【請求項4】
前記TnpBタンパク質は、デイノコッカス・ラディオデュランスからの前記可動遺伝因子のISDra2のtnpB遺伝子から取得されたタンパク質のアミノ酸配列を有する、請求項3に記載の方法。
【請求項5】
前記TnpBタンパク質は、前記tnpB遺伝子から取得された前記タンパク質の前記アミノ酸配列と少なくとも85%の配列同一性を有する、請求項2から4のいずれか一項に記載の方法。
【請求項6】
前記TnpBタンパク質は、配列番号:1のアミノ酸配列を含み、又は、それから成り、又は、前記TnpBタンパク質は、配列番号:1と少なくとも85%の配列同一性を有するアミノ酸配列を含み、又はそれから成る、請求項1から5のいずれか一項に記載の方法。
【請求項7】
前記RNAは、50~300ヌクレオチドの長さである、請求項1から6のいずれか一項に記載の方法。
【請求項8】
前記RNAは、100~200ヌクレオチドの長さである、請求項7に記載の方法。
【請求項9】
前記RNAは、140~150ヌクレオチドの長さである、請求項8に記載の方法。
【請求項10】
前記RNAの前記ガイド配列は、10~30ヌクレオチドの長さである、請求項1から9のいずれか一項に記載の方法。
【請求項11】
前記RNAの前記ガイド配列は、15~25ヌクレオチドの長さである、請求項10に記載の方法。
【請求項12】
前記RNAの前記タンパク質結合セグメントは逆位反復配列を含む、請求項1から11のいずれか一項に記載の方法。
【請求項13】
前記RNAの前記タンパク質結合セグメントは、少なくとも部分的な回文配列を含み、少なくとも部分的な前記回文配列は、ヘアピン又は不完全なヘアピンを形成可能である、請求項1から12のいずれか一項に記載の方法。
【請求項14】
前記RNAの前記タンパク質結合セグメントは、IS200/IS605ファミリーにおける可動遺伝因子からの右端の不完全な回文配列からの配列を含む、請求項1から13のいずれか一項に記載の方法。
【請求項15】
前記RNAの前記タンパク質結合セグメントは、IS607ファミリーにおける可動遺伝因子の右端の配列からの配列を含む、請求項1から13のいずれか一項に記載の方法。
【請求項16】
前記RNAの前記タンパク質結合セグメントは、前記TnpBタンパク質をコードする遺伝子を含む挿入配列の前記右端からの配列を含む、請求項14又は請求項15に記載の方法。
【請求項17】
前記タンパク質結合セグメントは、配列番号:2を含む配列を含む、請求項1から16のいずれか一項に記載の方法。
【請求項18】
前記タンパク質結合セグメントは配列番号:2を含み、前記TnpBタンパク質は配列番号:1を含む、請求項1から17のいずれか一項に記載の方法。
【請求項19】
前記ポリヌクレオチドは二本鎖DNAである、請求項1から18のいずれか一項に記載の方法。
【請求項20】
前記ポリヌクレオチドは、二本鎖TnpB会合配列モチーフを含む、請求項19に記載の方法。
【請求項21】
前記二本鎖TnpB会合配列モチーフは、前記二本鎖DNAの非標的鎖を指す前記標的配列の5'に位置する、請求項20に記載の方法。
【請求項22】
前記ポリヌクレオチドの前記二本鎖TnpB会合配列モチーフは、2~6ヌクレオチドの長さである、請求項20又は請求項21に記載の方法。
【請求項23】
前記ポリヌクレオチドの前記二本鎖TnpB会合配列モチーフはTTGATである、請求項20から22のいずれか一項に記載の方法。
【請求項24】
前記ポリヌクレオチドの前記二本鎖TnpB会合配列モチーフはTTGATであり、前記TnpBタンパク質は、配列番号:1のアミノ酸配列、又は、配列番号:1と少なくとも85%の配列同一性を有するアミノ酸配列を含み、又は、それから成り、前記RNAの前記タンパク質結合セグメントは配列番号:2を含む、請求項23に記載の方法。
【請求項25】
前記ポリヌクレオチドは、スーパーコイル状の、リラックスした、又はほどかれた二本鎖DNAである、請求項1から24のいずれか一項に記載の方法。
【請求項26】
前記ポリヌクレオチドは二本鎖DNAであり、前記二本鎖DNAの切断は段違い二本鎖切断部を産生する、請求項1から25のいずれか一項に記載の方法。
【請求項27】
前記段違い二本鎖切断部は5'オーバーハングを有する、請求項26に記載の方法。
【請求項28】
前記ポリヌクレオチドは二本鎖DNAであり、前記二本鎖DNAを切断して平滑端二本鎖切断部を産生する、請求項1から27のいずれか一項に記載の方法。
【請求項29】
前記標的配列を含む前記ポリヌクレオチドは染色体DNAである、請求項1から28のいずれか一項に記載の方法。
【請求項30】
前記標的配列を含む前記ポリヌクレオチドは、染色体外DNAである、請求項1から28のいずれか一項に記載の方法。
【請求項31】
前記ポリヌクレオチドは一本鎖DNAである、請求項1から18のいずれか一項に記載の方法。
【請求項32】
前記方法はインビボの方法である、請求項1から31のいずれか一項に記載の方法。
【請求項33】
前記方法はエクスビボの方法である、請求項1から31のいずれか一項に記載の方法。
【請求項34】
前記方法はインビトロの方法である、請求項1から31のいずれか一項に記載の方法。
【請求項35】
前記ポリヌクレオチドは細胞内にある、請求項1から34のいずれか一項に記載の方法。
【請求項36】
前記細胞は原核細胞である、請求項35に記載の方法。
【請求項37】
前記細胞は真核細胞である、請求項35に記載の方法。
【請求項38】
前記細胞は非ヒト動物細胞である、請求項37に記載の方法。
【請求項39】
前記細胞はヒト細胞である、請求項37に記載の方法。
【請求項40】
前記細胞は幹細胞である、請求項37から39のいずれか一項に記載の方法。
【請求項41】
前記幹細胞がヒト幹細胞であるとき、それは全能性幹細胞でない、請求項40に記載の方法。
【請求項42】
前記細胞は人工多能性幹細胞である、請求項40に記載の方法。
【請求項43】
前記細胞は植物細胞である、請求項37に記載の方法。
【請求項44】
前記タンパク質は、前記タンパク質のアミノ及び/又はカルボキシル末端上の1又は複数の核局在化シグナルを含む、請求項1から43のいずれか一項に記載の方法。
【請求項45】
前記接触は、細胞内に:(1)前記TnpBタンパク質を含む前記タンパク質、又は、前記タンパク質をコードする配列を含む第2ポリヌクレオチド配列;及び、(2)前記RNA、又は、前記RNAをコードする配列を含む第3ポリヌクレオチド配列を導入することを含む、請求項1から44のいずれか一項に記載の方法。
【請求項46】
(1)及び(2)は、少なくとも1つのベクターにおいて前記細胞内に導入される、請求項45に記載の方法。
【請求項47】
前記少なくとも1つのベクターは、(1)を含む第1ベクター及び(2)を含む第2ベクターを含む、請求項46に記載の方法。
【請求項48】
前記少なくとも1つのベクターは、少なくとも1つの非ウイルスベクター、任意選択的に、プラスミド、又は、リポソーム又はエクソソームなどの非ウイルス粒子である、請求項46又は請求項47に記載の方法。
【請求項49】
前記少なくとも1つのベクターは、少なくとも1つのウイルスベクター、任意選択的に、レトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ウイルス(AAV)ベクター又は単純ヘルペスウイルスベクターである、請求項46又は請求項47に記載の方法。
【請求項50】
前記少なくとも1つのウイルスベクターはAAVベクターである、請求項49に記載の方法。
【請求項51】
前記接触は、前記第2ポリヌクレオチド配列及び前記第3ポリヌクレオチド配列を前記細胞内に導入することを含み、ここで、前記TnpBタンパク質を含む前記タンパク質及び前記RNAは、前記細胞において発現される、請求項45から50のいずれか一項に記載の方法。
【請求項52】
前記第2ポリヌクレオチド配列は、前記タンパク質をコードする前記配列に動作可能に連結されて前記タンパク質の発現を制御する第1調節因子を含み、及び/又は、前記第3ポリヌクレオチド配列は、前記RNAをコードする前記配列に動作可能に連結されて前記RNAの発現を制御する第2調節因子を含む、請求項45から51のいずれか一項に記載の方法。
【請求項53】
前記TnpBタンパク質を含む前記タンパク質及び前記RNAが、エフェクター複合体の形態で前記細胞内に導入される、請求項45から50のいずれか一項に記載の方法。
【請求項54】
前記細胞内への前記導入は、マイクロインジェクション又は電気穿孔によるものであり、任意選択的に、リポソームの使用と組み合わされる、請求項45から53のいずれか一項に記載の方法。
【請求項55】
前記細胞内への前記導入は、リポフェクション、リン酸カルシウムトランスフェクション又はカチオン系ポリマートランスフェクションなどの化学ベーストランスフェクションである、請求項45から53のいずれか一項に記載の方法。
【請求項56】
前記接触は、前記切断されたポリヌクレオチドの非相同末端結合又は相同組換え修復を可能にする条件下で発生する、請求項1から55のいずれか一項に記載の方法。
【請求項57】
前記方法は更に、相同組換え修復のために前記ポリヌクレオチドをドナーポリヌクレオチドと接触させる段階を備える、請求項56に記載の方法。
【請求項58】
前記方法は、人体又は動物の体の治療の方法ではない、請求項1から57のいずれか一項に記載の方法。
【請求項59】
前記方法は、ヒトの生殖系列遺伝的同一性を改変するための方法ではない、請求項1から58のいずれか一項に記載の方法。
【請求項60】
前記方法は、産業上の目的のためのヒト胎児の使用ではない、請求項1から59のいずれか一項に記載の方法。
【請求項61】
エフェクター複合体をポリヌクレオチドにおける標的領域へガイドするためのRNAであって、
(i)前記ポリヌクレオチドの前記標的領域における標的配列にハイブリダイズすることが可能であるガイド配列を含むポリヌクレオチドターゲティングセグメント;及び
(ii)前記RNAがTnpBタンパク質に結合して前記エフェクター複合体を形成することを可能にするタンパク質結合セグメント
を備えるRNA。
【請求項62】
前記RNAは、50~300ヌクレオチドの長さである、請求項61に記載のRNA。
【請求項63】
前記RNAは、100~200ヌクレオチドの長さである、請求項62に記載のRNA。
【請求項64】
前記RNAは、140~150ヌクレオチドの長さである、請求項63に記載のRNA。
【請求項65】
前記ガイド配列は、10~30ヌクレオチドの長さである、請求項61から64のいずれか一項に記載のRNA。
【請求項66】
前記ガイド配列は、15~25ヌクレオチドの長さである、請求項65に記載のRNA。
【請求項67】
前記タンパク質結合セグメントは逆位反復配列を含む、請求項61から66のいずれか一項に記載のRNA。
【請求項68】
前記タンパク質結合セグメントは、少なくとも部分的な回文配列を含み、少なくとも部分的な前記回文配列は、ヘアピン又は不完全なヘアピンを形成可能である、請求項61から67のいずれか一項に記載のRNA。
【請求項69】
前記タンパク質結合セグメントは、IS200/IS605ファミリーにおける可動遺伝因子からの右端不完全回文配列からの配列、又は、IS607ファミリーからの可動遺伝因子の右端からの配列を含む、請求項61から68のいずれか一項に記載のRNA。
【請求項70】
前記タンパク質結合セグメントは、前記TnpBタンパク質をコードする遺伝子を含む挿入配列の前記右端からの配列を含む、請求項69に記載のRNA。
【請求項71】
前記タンパク質結合セグメントは配列番号:2を含む、請求項61から70のいずれか一項に記載のRNA。
【請求項72】
前記タンパク質結合セグメントが結合可能な前記TnpBタンパク質は、IS200/IS605ファミリー又はIS607ファミリーにおける可動遺伝因子のtnpB遺伝子から取得されたタンパク質のアミノ酸配列を有する、請求項61から71のいずれか一項に記載のRNA。
【請求項73】
前記TnpBタンパク質は、前記IS200/IS605ファミリーの可動遺伝因子のtnpB遺伝子から取得されたタンパク質のアミノ酸配列を有する、請求項72に記載のRNA。
【請求項74】
前記TnpBタンパク質は、デイノコッカス・ラディオデュランスからの可動遺伝因子ISDra2のtnpB遺伝子から取得されたタンパク質のアミノ酸配列を有する、請求項73に記載のRNA。
【請求項75】
タンパク質結合セグメントが結合可能な前記TnpBタンパク質は、配列番号:1のアミノ酸配列を含み、又は、それから成り、又は、配列番号:1と少なくとも85%の配列同一性を有するアミノ酸配列を含み、又は、それから成る、請求項61から74のいずれか一項に記載のRNA。
【請求項76】
前記タンパク質結合セグメントは、配列番号:2を含み、前記タンパク質結合セグメントが結合可能なTnpBタンパク質は、配列番号:1を含む、請求項61から75のいずれか一項に記載のRNA。
【請求項77】
前記ガイド配列がハイブリダイズ可能な前記標的配列を含む前記ポリヌクレオチドはDNAである、請求項61から76のいずれか一項に記載のRNA。
【請求項78】
前記ガイド配列がハイブリダイズ可能な前記標的配列を含む前記ポリヌクレオチドはRNAである、請求項61から76のいずれか一項に記載のRNA。
【請求項79】
単離RNAである、請求項61から78のいずれか一項に記載のRNA。
【請求項80】
前記RNAは、設計された、天然に発生しないRNAである、請求項61から79のいずれか一項に記載のRNA。
【請求項81】
ポリヌクレオチドにおける標的領域に結合するためのエフェクター複合体であって、前記エフェクター複合体は、タンパク質及びRNAを含み、ここで、前記タンパク質は、TnpBタンパク質を含み、又は、それから成り、前記RNAは:
(i)前記標的領域に含まれる標的配列とハイブリダイズ可能なガイド配列を含むポリヌクレオチドターゲティングセグメント;及び
(ii)前記TnpBタンパク質に結合するタンパク質結合セグメント
を含む、エフェクター複合体。
【請求項82】
前記TnpBタンパク質は、IS200/IS605ファミリー又はIS607ファミリーにおける可動遺伝因子のtnpB遺伝子から取得されたタンパク質のアミノ酸配列を有し、又は、それと少なくとも85%の配列同一性を有するアミノ酸配列を有するバリアントである、請求項81に記載のエフェクター複合体。
【請求項83】
前記TnpBタンパク質は、前記IS200/IS605ファミリーにおける可動遺伝因子のtnpB遺伝子から取得されたタンパク質のアミノ酸配列を有し、又は、それと少なくとも85%の配列同一性を有するアミノ酸配列を有するバリアントである、請求項82に記載のエフェクター複合体。
【請求項84】
前記TnpBタンパク質は、デイノコッカス・ラディオデュランスからの可動遺伝因子ISDra2のtnpB遺伝子から取得されたタンパク質のアミノ酸配列を有し、又は、それと少なくとも85%の配列同一性を有するアミノ酸配列を有するそのバリアントである、請求項83に記載のエフェクター複合体。
【請求項85】
前記TnpBタンパク質は、配列番号:1のアミノ酸配列を含み、又は、それから成り、又は、前記TnpBタンパク質は、配列番号:1と少なくとも85%の配列同一性を有するアミノ酸配列を含む、又は、それから成る、請求項81から84のいずれか一項に記載のエフェクター複合体。
【請求項86】
前記RNAは請求項61から80のいずれか一項において定義される、請求項81から85のいずれか一項に記載のエフェクター複合体。
【請求項87】
前記タンパク質結合セグメントは配列番号:2を含む、請求項81から86のいずれか一項に記載のエフェクター複合体。
【請求項88】
前記タンパク質は、前記タンパク質のアミノ又はカルボキシル末端上の1又は複数の核局在化シグナルを含み、及び/又は、前記タンパク質は、前記タンパク質のアミノ又はカルボキシル末端上の1又は複数の細胞膜透過ペプチドを含む、請求項81から87のいずれか一項に記載のエフェクター複合体。
【請求項89】
前記エフェクター複合体は、前記ポリヌクレオチドの前記標的領域を改変するためのものである、請求項81から88のいずれか一項に記載のエフェクター複合体。
【請求項90】
前記エフェクター複合体は、前記TnpBタンパク質を用いて前記ポリヌクレオチドの前記標的領域を切断するためのものである、請求項81から89のいずれか一項に記載のエフェクター複合体。
【請求項91】
前記エフェクター複合体は、不活性化されたヌクレアーゼドメインを有するTnpBタンパク質を含む、請求項81から89のいずれか一項に記載のエフェクター複合体。
【請求項92】
前記標的領域の改変のための1又は複数のエフェクター分子を含む、請求項81から91のいずれか一項に記載のエフェクター複合体。
【請求項93】
1又は複数の前記エフェクター分子は、TnpBタンパク質、リボヌクレアーゼ、ニッカーゼ、ベースエディター、エピジェネティック修飾子、トランスポザーゼ、リコンビナーゼ、及び逆転写酵素でないエンドヌクレアーゼから選択される、請求項92に記載のエフェクター複合体。
【請求項94】
前記ベースエディターは、デアミナーゼであり、任意選択的に、シチジンデアミナーゼ及び/又はアデノシンデアミナーゼである、請求項93に記載のエフェクター複合体。
【請求項95】
前記エフェクター複合体は、シチジンデアミナーゼ及びウラシルグリコシラーゼインヒビターを含む、請求項94に記載のエフェクター複合体。
【請求項96】
前記標的領域の標識のために、1又は複数のエフェクター分子を含む、請求項81から92のいずれか一項に記載のエフェクター複合体。
【請求項97】
前記標識は蛍光タンパク質である、請求項96に記載のエフェクター複合体。
【請求項98】
前記標的領域の転写又は翻訳を増加又は減少させるための1又は複数のエフェクター分子を含む、請求項81から91のいずれか一項に記載のエフェクター複合体。
【請求項99】
1又は複数の前記エフェクター分子は1又は複数の転写活性化因子である、請求項98に記載のエフェクター複合体。
【請求項100】
1又は複数の前記エフェクター分子は、1又は複数の転写抑制因子である、請求項98のエフェクター複合体。
【請求項101】
前記タンパク質は、前記TnpBタンパク質及び前記1又は複数のエフェクター分子を含む融合タンパク質である、請求項92から100のいずれか一項に記載のエフェクター複合体。
【請求項102】
固体支持体に結合される、請求項81から101のいずれか一項に記載のエフェクター複合体。
【請求項103】
前記ポリヌクレオチドは二本鎖DNAである、請求項81から102のいずれか一項に記載のエフェクター複合体。
【請求項104】
前記二本鎖DNAは、スーパーコイル状の、リラックスした、又はほどかれたものである、請求項103に記載のエフェクター複合体。
【請求項105】
前記ポリヌクレオチドは、前記二本鎖DNAの非標的鎖を指す、前記標的配列の5'に位置するTnpB会合配列モチーフを含む、請求項103又は請求項104に記載のエフェクター複合体。
【請求項106】
前記ポリヌクレオチドの前記TnpB会合配列モチーフは、2~6ヌクレオチドの長さである、請求項105に記載のエフェクター複合体。
【請求項107】
前記ポリヌクレオチドの前記TnpB会合配列モチーフはTTGATである、請求項105又は請求項106に記載のエフェクター複合体。
【請求項108】
前記TnpBタンパク質は前記二本鎖DNAを切断して段違い二本鎖切断部を産生することが可能である、請求項103から107のいずれか一項に記載のエフェクター複合体。
【請求項109】
前記段違い二本鎖切断部は、5'オーバーハングを有する、請求項108に記載のエフェクター複合体。
【請求項110】
前記TnpBタンパク質は、前記二本鎖DNAを切断して平滑端二本鎖切断部を産生することが可能である、請求項103から107のいずれか一項に記載のエフェクター複合体。
【請求項111】
前記ポリヌクレオチドは一本鎖DNAである、請求項81から102のいずれか一項に記載のエフェクター複合体。
【請求項112】
前記ポリヌクレオチドはRNAである、請求項81から102のいずれか一項に記載のエフェクター複合体。
【請求項113】
単離されたエフェクター複合体である、請求項81から112のいずれか一項に記載のエフェクター複合体。
【請求項114】
前記エフェクター複合体は、設計された、天然に発生しないエフェクター複合体である、請求項81から112のいずれか一項に記載のエフェクター複合体。
【請求項115】
請求項61から80のいずれか一項に記載のRNAを有するエフェクター複合体を形成するための融合タンパク質であって、前記融合タンパク質は、TnpBタンパク質、及び、(i)前記融合タンパク質のアミノ又はカルボキシル末端上の1又は複数の核局在化シグナル及び/又は細胞膜透過ペプチド、及び/又は、(ii)1又は複数のエフェクター分子を含む、融合タンパク質。
【請求項116】
前記TnpBタンパク質は、IS200/IS605ファミリー又はIS607ファミリーにおける可動遺伝因子のtnpB遺伝子から取得されたタンパク質のアミノ酸配列を有し、又は、それと少なくとも85%の配列同一性を有するアミノ酸配列を有するバリアントである、請求項115に記載の融合タンパク質。
【請求項117】
前記TnpBタンパク質は、前記IS200/IS605ファミリーからの可動遺伝因子のtnpB遺伝子から取得されたタンパク質のアミノ酸配列を有し、又は、それと少なくとも85%の配列同一性を有するアミノ酸配列を有するそのバリアントである、請求項116に記載の融合タンパク質。
【請求項118】
前記TnpBタンパク質は、デイノコッカス・ラディオデュランスからの可動遺伝因子ISDra2のtnpB遺伝子から取得されたタンパク質のアミノ酸配列を有し、又は、それと少なくとも85%の配列同一性を有するアミノ酸配列を有するそのバリアントである、請求項117に記載の融合タンパク質。
【請求項119】
前記TnpBタンパク質は、配列番号:1のアミノ酸配列を含み、又は、それから成り、又は、配列番号:1と少なくとも85%の配列同一性を有するアミノ酸配列を含む、又は、それから成る、請求項115から118のいずれか一項に記載の融合タンパク質。
【請求項120】
前記1又は複数のエフェクター分子は、ポリヌクレオチド内の標的領域を改変し、標識し、又は、前記標的領域の転写又は翻訳を増加又は減少させるためのものである、請求項115から119のいずれか一項に記載の融合タンパク質。
【請求項121】
前記1又は複数のエフェクター分子は、前記TnpBタンパク質、リボヌクレアーゼ、ニッカーゼ、ベースエディター、エピジェネティック修飾子、トランスポザーゼ、リコンビナーゼ、逆転写酵素、標識、転写活性化因子、及び転写抑制因子でないエンドヌクレアーゼから選択される1又は複数である、請求項115から120のいずれか一項に記載の融合タンパク質。
【請求項122】
前記ベースエディターは、デアミナーゼであり、任意選択的に、シチジンデアミナーゼ及び/又はアデノシンデアミナーゼである、請求項121に記載の融合タンパク質。
【請求項123】
シチジンデアミナーゼ及びウラシルグリコシラーゼインヒビターを含む、請求項122に記載の融合タンパク質。
【請求項124】
前記標識は、蛍光タンパク質又はレポーター酵素である、請求項121に記載の融合タンパク質。
【請求項125】
変異を含む変異TnpBタンパク質であって、前記変異は、前記タンパク質のヌクレアーゼドメインを不活性するためのものであり、前記変異TnpBタンパク質は、請求項61から80のいずれか一項に記載のRNAに結合するよう構成され、任意選択的に、前記変異TnpBタンパク質は、請求項115から124のいずれか一項に記載の融合タンパク質の前記TnpBタンパク質である、変異TnpBタンパク質。
【請求項126】
請求項61から80のいずれか一項に記載のRNAをコードするDNA。
【請求項127】
請求項82から85のいずれか一項において定義され前記TnpBタンパク質を含むタンパク質を更にコードし、又は、請求項125の変異TnpBタンパク質を含むタンパク質を更にコードする、請求項126に記載のDNA。
【請求項128】
請求項115から124のいずれか一項に記載の融合タンパク質を更にコードする、請求項126に記載のDNA。
【請求項129】
請求項115から127のいずれか一項に記載の融合タンパク質をコードするDNA。
【請求項130】
請求項125に記載の変異TnpBタンパク質をコードするDNA。
【請求項131】
前記DNAは、設計された、天然に発生しないDNAである、請求項126から130のいずれか一項に記載のDNA。
【請求項132】
任意選択的に、プラスミド、又は、AAVベクターなどのウイルスベクターである、請求項126から131のいずれか一項に記載のDNAを含む組み換え発現ベクター。
【請求項133】
請求項126から131のいずれか一項に記載のDNA、又は、請求項132のいずれか一項に記載の組み換え発現ベクターを含む宿主細胞。
【請求項134】
請求項61から80のいずれか一項に記載のRNA、請求項81から114のいずれか一項に記載のエフェクター複合体、請求項115から124のいずれか一項に記載の融合タンパク質、請求項125に記載の変異TnpBタンパク質、請求項126から131のいずれか一項に記載のDNA、請求項132に記載の組み換え発現ベクター、又は、請求項133に記載の宿主細胞、及び緩衝液を備える組成物。
【請求項135】
前記緩衝液は、医薬的に許容可能な緩衝液である、請求項134に記載の組成物。
【請求項136】
請求項126から128のいずれか一項に記載のDNAを発現する段階、又は、前記RNAを化学的に合成する段階を備える、請求項61から80のいずれか一項に記載のRNAを産生するインビトロ又はエクスビボの方法。
【請求項137】
請求項129又は130に記載のDNAを発現する段階を備える、請求項115から124のいずれか一項に記載の融合タンパク質、又は、請求項125に記載の変異TnpBタンパク質を産生するインビトロ又はエクスビボの方法。
【請求項138】
前記RNAを前記タンパク質と接触させて前記エフェクター複合体を形成する段階を備え、任意選択的に、前記TnpBタンパク質を含む前記タンパク質をコードするDNAを発現する段階、及び、前記RNAをコードするDNAを発現する段階を備える、請求項81から114のいずれか一項に記載のエフェクター複合体を産生するインビトロ又はエクスビボの方法。
【請求項139】
前記方法は、細胞においてインビトロで実行される、請求項136から138のいずれか一項に記載の方法。
【請求項140】
前記方法は、無細胞系においてインビトロで実行される、請求項136から138のいずれか一項に記載の方法。
【請求項141】
前記方法は、産生された前記RNA、産生された前記融合タンパク質、産生された前記変異TnpBタンパク質、又は、産生された前記エフェクター複合体を精製する段階を備える、請求項136から140のいずれか一項に記載の方法。
【請求項142】
ポリヌクレオチドにおける標的領域を改変するためのシステムであって、前記標的領域は標的配列を含み、前記システムは:
a)TnpBタンパク質を含む、又は、それから成るタンパク質、又は、前記タンパク質をコードするDNA又はRNA、及び
b)RNA、又は、前記RNAをコードするDNA
を備え、前記RNAは:
(i)前記標的配列に相補的である配列を含むポリヌクレオチドターゲティングセグメント;及び
(ii)前記TnpBタンパク質に結合するタンパク質結合セグメント
を含む、システム。
【請求項143】
(a)前記タンパク質及び(b)前記RNAを備える、請求項142に記載のシステム。
【請求項144】
(a)前記タンパク質をコードする前記DNA、及び、(b)前記RNAをコードする前記DNAを備える、請求項142に記載のシステム。
【請求項145】
(a)前記タンパク質をコードする前記RNA、及び、(b)前記RNAを備える、請求項142に記載のシステム。
【請求項146】
(a)前記タンパク質、(b)前記RNAをコードする前記DNAを備える、請求項142に記載のシステム。
【請求項147】
前記RNAは、請求項61から80のいずれか一項において定義される、請求項142から146のいずれか一項に記載のシステム。
【請求項148】
前記タンパク質は、請求項82から85のいずれか一項において定義される、請求項142から147のいずれか一項に記載のシステム。
【請求項149】
前記タンパク質は、請求項115から124のいずれか一項において定義される融合タンパク質である、請求項142から147のいずれか一項に記載のシステム。
【請求項150】
前記TnpBタンパク質は、不活性化ヌクレアーゼドメインを含む、請求項142から149のいずれか一項に記載のシステム。
【請求項151】
前記ポリヌクレオチドは、請求項19から23又は29から31のいずれか一項において定義される、請求項142から150のいずれか一項に記載のシステム。
【請求項152】
(a)及び/又は(b)は少なくとも1つのベクターに含まれる、請求項142から151のいずれか一項に記載のシステム。
【請求項153】
少なくとも1つの前記ベクターは、少なくとも1つの非ウイルスベクターである、請求項152に記載のシステム。
【請求項154】
少なくとも1つの前記非ウイルスベクターは、少なくとも1つのプラスミド、又は、リポソーム又はエクソソームなどの少なくとも1つの非ウイルス粒子である、請求項153に記載のシステム。
【請求項155】
少なくとも1つの前記ベクターは少なくとも1つのウイルスベクターである、請求項152に記載のシステム。
【請求項156】
少なくとも1つの前記ウイルスベクターは、レトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ウイルス(AAV)ベクター、又は、単純ヘルペスウイルスベクターから選択される、請求項155に記載のシステム。
【請求項157】
少なくとも1つの前記ウイルスベクターは、少なくとも1つのAAVベクターである、請求項156に記載のシステム。
【請求項158】
前記システムは、設計された、天然に発生しないシステムである、請求項142から157のいずれか一項に記載のシステム。
【請求項159】
薬剤として使用するための、又は、診断において使用するための、請求項81から114のいずれか一項に記載のエフェクター複合体、又は、請求項142から158のいずれか一項に記載のシステム。
【請求項160】
対象における疾病を治療又は予防するための薬剤の製造のための、又は、対象における疾病の診断のための診断組成物の製造のための、請求項81から114のいずれか一項に記載のエフェクター複合体、又は、請求項142から158のいずれか一項に記載のシステムの使用。
【請求項161】
前記RNAは、請求項82から85又は125のいずれか一項において定義される前記タンパク質、又は、前記タンパク質をコードするDNA又はRNAと組み合わせて使用される、薬剤として使用するための、又は、対象における診断に使用するための、請求項61から80のいずれか一項に記載のRNA。
【請求項162】
前記RNAは、請求項115から124のいずれか一項において定義される前記融合タンパク質、又は、前記融合タンパク質をコードするDNA又はRNAと組み合わせて使用される、薬剤として使用するための、又は、対象における診断に使用するための、請求項61から80のいずれか一項に記載のRNA。
【請求項163】
請求項82から85又は125のいずれか一項において定義されるタンパク質、又は、前記タンパク質をコードするDNAと共に使用される、薬剤として使用するための、又は、対象における診断に使用するための、請求項126に記載のRNAをコードするDNA。
【請求項164】
請求項115から124のいずれか一項において定義される融合タンパク質、又は、前記融合タンパク質をコードするDNAと共に使用される、薬剤として使用するための、又は、対象における診断に使用するための、請求項126に記載のRNAをコードするDNA。
【請求項165】
薬剤として使用するための、又は、対象における診断に使用するためのタンパク質をコードするDNA又はRNAであって、前記タンパク質は、請求項82から85又は125のいずれか一項において定義され、前記DNAは、請求項61から80のいずれか一項に記載のRNA、又は、前記RNAをコードするDNAと共に使用される、DNA又はRNA。
【請求項166】
薬剤として使用するための、又は、対象における診断に使用するための融合タンパク質をコードするDNA又はRNAであって、前記融合タンパク質は、請求項115から124のいずれか一項において定義され、前記DNAは、請求項61から80のいずれか一項に記載のRNA、又は、前記RNAをコードするDNAと共に使用される、DNA又はRNA。
【請求項167】
試料における標的配列を含むポリヌクレオチドの存在を判定するためのインビトロ又はエクスビボの方法における、請求項81から114のいずれか一項に記載のエフェクター複合体、又は、請求項142から158のいずれか一項に記載のシステムの使用。
【請求項168】
標的配列を含むポリヌクレオチドの標的領域を改変するためのインビトロ又はエクスビボの方法における、請求項81から114のいずれか一項に記載のエフェクター複合体、又は、請求項142から158のいずれか一項に記載のシステムの使用。
【請求項169】
細胞を遺伝子改変するためのインビトロ又はエクスビボの方法における、請求項81から114のいずれか一項に記載のエフェクター複合体、又は、請求項142から158のいずれか一項に記載のシステムの使用。
【請求項170】
前記細胞は、請求項36から43のいずれか一項において定義される、請求項169に記載の使用。
【請求項171】
対象において薬剤として使用される遺伝子改変細胞であって、前記遺伝子改変細胞は、請求項142から158のいずれか一項に記載のシステム、又は、請求項81から114のいずれか一項に記載のエフェクター複合体を使用して、前記対象から取得される細胞を遺伝子改変する段階を備える方法によって取得される、遺伝子改変細胞。
【請求項172】
前記方法は、前記対象から取得される前記細胞を培養して増やす段階を備える、請求項171に記載の遺伝子改変細胞。
【請求項173】
前記対象から取得される前記細胞は、造血幹細胞及び前駆細胞(HSPC)又はT細胞である、請求項171及び請求項172に記載の遺伝子改変細胞。
【請求項174】
エフェクター複合体を用いて、ポリヌクレオチドにおける標的領域を改変し、標識し、又は、前記標的領域からの発現を制御するための方法であって、前記標的領域は標的配列を含み、
前記エフェクター複合体は:(i)請求項81から114のいずれかのエフェクター複合体であり;(ii)請求項115から124のいずれかの融合タンパク質、及び、請求項61から80のいずれかのRNAを含み;又は、(iii)請求項125の変異TnpBタンパク質、又は、前記変異TnpBタンパク質を含む融合タンパク質、及び、請求項61から80のいずれかのRNAを含み、
前記方法は、前記ポリヌクレオチドを前記エフェクター複合体と接触させる段階を備え、前記RNAのガイド配列は、前記標的配列にハイブリダイズし、前記エフェクター複合体が前記標的領域を改変又は標識すること、又は、前記標的領域からの発現を制御することを可能にする、
方法。
【請求項175】
前記エフェクター複合体は1又は複数のエフェクター分子を含む、請求項174に記載の方法。
【請求項176】
1又は複数の前記エフェクター分子は、前記変異TnpBタンパク質、リボヌクレアーゼ、ニッカーゼ、ベースエディター、エピジェネティック修飾子、トランスポザーゼ、リコンビナーゼ、逆転写酵素、標識、転写活性化因子、及び転写抑制因子でないエンドヌクレアーゼから選択される1又は複数である、請求項175に記載の方法。
【請求項177】
前記エフェクター複合体は、前記変異TnpBタンパク質及び1又は複数のエフェクター分子を含む融合タンパク質を含む、請求項174から176のいずれか一項に記載の方法。
【請求項178】
前記ポリヌクレオチドは二本鎖DNAである、請求項174から177のいずれか一項に記載の方法。
【請求項179】
前記ポリヌクレオチドは一本鎖DNAである、請求項174から177のいずれか一項に記載の方法。
【請求項180】
前記ポリヌクレオチドはRNAである、請求項174から177のいずれか一項に記載の方法。
【請求項181】
前記方法はインビボ方法である、請求項174から180のいずれか一項に記載の方法。
【請求項182】
前記方法はエクスビボの方法である、請求項174から180のいずれか一項に記載の方法。
【請求項183】
前記方法はインビトロの方法である、請求項174から180のいずれか一項に記載の方法。
【請求項184】
前記ポリヌクレオチドは細胞内にある、請求項174から183のいずれか一項に記載の方法。
【請求項185】
前記細胞は原核細胞である、請求項184に記載の方法。
【請求項186】
前記細胞は真核細胞である、請求項184に記載の方法。
【請求項187】
前記細胞は非ヒト動物細胞である、請求項186に記載の方法。
【請求項188】
前記細胞はヒト細胞である、請求項186に記載の方法。
【請求項189】
前記細胞は幹細胞である、請求項186から188のいずれか一項に記載の方法。
【請求項190】
前記幹細胞がヒト幹細胞であるとき、それは全能性幹細胞でない、請求項189に記載の方法。
【請求項191】
前記細胞は人工多能性幹細胞である、請求項189に記載の方法。
【請求項192】
前記細胞は植物細胞である、請求項186に記載の方法。
【請求項193】
前記方法は、エフェクター複合体を細胞内に導入する段階、又は、請求項142から158のいずれか一項に記載のシステムを細胞内に導入する段階を備える、請求項174から192のいずれか一項に記載の方法。
【請求項194】
前記導入する段階は、電気穿孔又はマイクロインジェクションを含み、任意選択的に、リポソームの使用と組み合わせる、請求項193に記載の方法。
【請求項195】
前記細胞への前記導入は、リポフェクション、リン酸カルシウムトランスフェクション又はカチオン系ポリマートランスフェクションなどの化学ベーストランスフェクションである、請求項193に記載の方法。
【請求項196】
前記細胞内への前記導入は、ウイルスベクターを用いる送達による、請求項193に記載の方法。
【請求項197】
前記ウイルスベクターはレンチウイルスベクター、レトロウイルスベクター、又はAAVベクターである、請求項196に記載の方法。
【請求項198】
前記方法は、人体又は動物の体の治療の方法でない、請求項174から197のいずれか一項に記載の方法。
【請求項199】
前記方法は、ヒトの生殖系列遺伝的同一性を改変するための方法でない、請求項174から198のいずれか一項に記載の方法。
【請求項200】
前記方法は、産業上の目的のためのヒト胎児の使用でない、請求項174から199のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、ポリヌクレオチドにおける標的配列の標的ポリヌクレオチド改変及び検出の分野に関する。
【背景技術】
【0002】
微生物は、医療を含む幅広い範囲の技術にわたる用途のための、遺伝子工学のための興味深く有用なツールの供給源である。
【0003】
近年、DNA改変において使用するために、細菌及び古細菌の適応免疫系に由来するCRISPR-Casシステムを適合させることに特に関心が集まっている。天然のCRISPR-Casシステムは非常に多様であり、2つのクラスに分類され、その各々は現在、複数のサブタイプを有する3つの異なるタイプを含む(近年、Makarova et al.,2020によってレビューされた)。これらのうち最も研究されたものは、CRISPR‐Cas9(クラス1、タイプII)に基づくシステムであり(Jiang and Doudna,2017によってレビューされた)、より近年では、CRISPR-Cas12(クラス2、タイプV)に基づくシステムである(例えば、Zetsche et al.,2015及びKarvelis et al.,2020に記載される)。これらのシステムは、標的DNAに部位特異的二本鎖切断を導入することが可能である、リボ核タンパク質(RNP)複合体として構成される、RNAによってガイドされるDNAエンドヌクレアーゼに基づく。両方の場合において、RNP複合体による標的認識は、標的部位にフランキング(flanking)する短いプロトスペーサー隣接モチーフ(PAM)の存在を必要とする。それにもかかわらず、(好適なPAMが存在する場合に)RNA配列を変更することによって異なる標的にエンドヌクレアーゼを誘導する能力により、これらのシステムは、DNA改変のためのツールのソースとして非常に魅力的である。
【発明の概要】
【0004】
本願では、驚くべきことに、TnpBタンパク質は、RNA分子とリボ核タンパク質エフェクター複合体を形成するRNA結合タンパク質であることが示された。また、これらのエフェクター複合体は、ポリヌクレオチドにおける標的配列に対するRNA分子のセグメントの結合、及び、複合体におけるTnpBタンパク質のその後のヌクレアーゼ活性に基づいて、ポリヌクレオチドを切断することが可能であると示された。
【0005】
TnpBタンパク質は、細菌及び古細菌の挿入配列(IS)のいくつかのファミリーにおいて見られるtnpB遺伝子の予測される産物として当技術分野において知られている。挿入配列は、広く見られる原核生物の可動遺伝因子であり、多くの数の真核生物DNA転位因子がそれに関連する(Hickman et al., 2010)。挿入配列は、転位及び転位の調節に関連する遺伝子のみを含む。挿入配列のいくつかのファミリーは、tnpA遺伝子及びtnpB遺伝子を保持する。しかしながら、転位におけるTnpAの機能は十分に確立されている一方で、TnpBの役割は示されていなかった。TnpBは転位に必須ではないことが示され、当該タンパク質は、トランスポゾン切除及び挿入の負の調節に関与すると考えられている(Kersulyte et al.,2000、2002;Pasternak et al.,2013)。過去において、TnpBタンパク質がRNAに結合しているときにヌクレアーゼとして作用できること、及び、切断がRNAのセグメント及び標的部位の間の結合によって標的にされることは示されなかった。
【0006】
本明細書に記載される実験は、TnpBタンパク質を使用して、従来技術のCRISPR‐Cas9及びCRISPR‐Cas12システムとは機能的に別個である、新規のRNAによってガイドされるエフェクター複合体を産生できることを示し、ここで、TnpBタンパク質はヌクレアーゼとして作用できる。CRISPR-Casシステムとは異なり、挿入配列に会合するCRISPRアレイは無い。むしろ、驚くべきことに、天然においてTnpBタンパク質が会合するRNAが挿入配列の部分に由来することが示された。
【0007】
本明細書に記載されるこれらのエフェクター複合体は、インビトロ、エクスビボ、又はインビボで、ポリヌクレオチドの標的化において著しい有用性を有し、有利なことに遺伝子改変ツールボックスを拡張する。TnpBタンパク質のヌクレアーゼ活性を利用してポリヌクレオチドを改変するだけでなく、TnpBタンパク質は、ヌクレアーゼ活性を不活性化するように変異され得、ポリヌクレオチドの切断を伴うことなくエフェクター複合体が遺伝子発現をブロックするために使用されること、又は、標的配列を検出するために使用されることを可能にする。
【0008】
また、TnpBタンパク質の活性又は不活性形態を含む、本明細書に記載のエフェクター複合体は、ポリヌクレオチド内の標的部位に対する1又は複数の追加のエフェクター分子を保持するように設計できる。いくつかの例において、TnpBタンパク質又はその不活性化形態は、1又は複数のエフェクター分子との融合タンパク質に含まれ得る。
【0009】
TnpBタンパク質はサイズが比較的小さいので、例えば、AAVベースの送達による細胞への送達及び治療用途における使用に特に好適である。エフェクター複合体のサイズが重要である特定の状況において、本発明のTnpBベースのエフェクター複合体は、それぞれ1000~1500アミノ酸の長さ及び500~1500アミノ酸の長さである、より大きいCas9及びCas12タンパク質に比べて有利である。
【0010】
従って、本発明は以下を提供する。
【0011】
第1態様において、本発明は、エフェクター複合体を用いてポリヌクレオチドを切断するための方法を提供し、ここでポリヌクレオチドは標的配列を含み、エフェクター複合体は以下を含む:
(a)TnpBタンパク質を含む又はそれから成るタンパク質;及び
(b)以下を含むRNA:
(i)標的配列にハイブリダイズすることが可能なガイド配列を含むポリヌクレオチドターゲティングセグメント;及び
(ii)RNAがTnpBタンパク質と結合してエフェクター複合体を形成することを可能にするタンパク質結合セグメント、ここで、方法は、ポリヌクレオチドをエフェクター複合体に接触させ、TnpBタンパク質がポリヌクレオチドを切断することを可能にすることを含む。
【0012】
第2態様において、本発明は、エフェクター複合体をポリヌクレオチドにおける標的領域へガイドするためのRNAを提供し、RNAは以下を含む:
(i)ポリヌクレオチドの標的領域における標的配列にハイブリダイズすることが可能であるガイド配列を含むポリヌクレオチドターゲティングセグメント;及び
(ii)RNAがTnpBタンパク質に結合してエフェクター複合体を形成することを可能にするタンパク質結合セグメント。
【0013】
第3態様において、本発明は、ポリヌクレオチドにおける標的領域に結合するためのエフェクター複合体を提供し、エフェクター複合体は、タンパク質及びRNAを含み、ここで、タンパク質はTnpBタンパク質を含む又はそれから成り、ここでRNAは以下を含む:
(i)標的領域に含まれる標的配列とハイブリダイズすることが可能なガイド配列を含むポリヌクレオチドターゲティングセグメント;及び
(ii)TnpBタンパク質に結合するタンパク質結合セグメント。
【0014】
第4態様において、本発明は融合タンパク質を提供し、ここで融合タンパク質は、TnpBタンパク質、及び、(i)融合タンパク質のアミノ又はカルボキシル末端上の1又は複数の核局在化シグナル及び/又は細胞膜透過ペプチド、及び/又は(ii)1又は複数のエフェクター分子を含む。
【0015】
第5態様において、本発明は、任意選択的にタンパク質のヌクレアーゼドメインを不活性するための変異を含む変異TnpBタンパク質を提供し、ここで、変異TnpBタンパク質は、本発明の融合タンパク質のTnpBタンパク質である。
【0016】
第6態様において、本発明は、RNAをコードするDNAを提供する。
【0017】
第7態様において、本発明は、融合タンパク質をコードするDNA又はRNAを提供する。
【0018】
第8態様において、本発明は、変異TnpBタンパク質をコードするDNA又はRNAを提供する。
【0019】
第9態様において、本発明は、本発明のDNAを含む組み換え発現ベクターを提供する。
【0020】
第10態様において、本発明は、本発明の組み換え発現ベクター又は発明のDNAを含む宿主細胞を提供する。
【0021】
第11態様において、本発明は、本発明のRNA、本発明のエフェクター複合体、本発明の融合タンパク質、本発明の変異TnpBタンパク質、本発明のDNA、本発明の組み換え発現ベクター、又は本発明の宿主細胞及び緩衝液を含む組成物を提供する。
【0022】
第12態様において、本発明は、本発明のRNA、エフェクター複合体、融合タンパク質、又は変異TnpBタンパク質を産生するためのインビボ、エクスビボ、又はインビトロの方法のための方法を提供する。
【0023】
第13態様において、本発明は、ポリヌクレオチドにおける標的領域を改変するためのシステムを提供し、ここで、標的領域は標的配列を含み、システムは以下を含む:
a)TnpBタンパク質を含む又はそれから成るタンパク質又は当該タンパク質をコードするDNA、及び
b)RNA、又は、RNAをコードするDNA、RNAは以下を含む:
(i)標的配列に相補的である配列を含むポリヌクレオチドターゲティングセグメント;及び
(ii)TnpBタンパク質に結合するタンパク質結合セグメント。
【0024】
第14態様において、本発明は、薬剤として使用される、又は、診断の方法において使用される、RNA、エフェクター複合体、変異TnpB、融合タンパク質、上記をコードするDNA、又は、システムを提供する。
【0025】
第15態様において、本発明は、試料における標的配列を含むポリヌクレオチドの存在を判定するエクスビボ又はインビトロの方法における、RNA、エフェクター複合体、変異TnpB、融合タンパク質、上記をコードするDNA、又は、システムの使用を提供する。
【0026】
第16態様において、本発明は、ポリヌクレオチドの標的領域を改変するためのインビボ、エクスビボ、又はインビトロの方法における、RNA、エフェクター複合体、変異TnpB、融合タンパク質、上記をコードするDNA、又はシステムの使用を提供し、ここで標的領域は標的配列を含む。
【0027】
第17態様において、本発明は、細胞を遺伝子改変するためのインビボ、エクスビボ、又はインビトロの方法における、RNA、エフェクター複合体、変異TnpB、融合タンパク質、上記をコードするDNA、又はシステムの使用を提供する。
【0028】
第18態様において、本発明は、対象における薬剤としての使用のための遺伝子改変細胞を提供し、ここで細胞は、本発明のシステム又はエフェクター複合体を使用して対象から取得される細胞を遺伝子改変する段階を含む方法によって取得される。
【0029】
第19態様において、本発明は、エフェクター複合体を用いて、ポリヌクレオチドにおける標的領域からの発現を改変、標識、又は制御するための方法を提供し、ここで、標的領域は標的配列を含み、ここで、エフェクター複合体は、(i)本発明のエフェクター複合体であり;(ii)本発明の融合タンパク質及びRNAを含み;又は(iii)変異TnpBタンパク質、又は、変異TnpBタンパク質を含む融合タンパク質、及び本発明のRNAを含み、ここで、方法は、ポリヌクレオチドをエフェクター複合体と接触させる段階を備え、それにより、RNAのガイド配列は標的配列にハイブリダイズし、エフェクター複合体が標的領域を改変又は標識すること又は標的領域からの発現を制御することを可能にする。
【図面の簡単な説明】
【0030】
本開示の理解を支援するために、及び、実施形態がどのように実施され得るかを示すために、単に例として添付図面が参照される。
【0031】
図1A図1はIS200/IS605可動遺伝因子特性評価に関連する。図1Aはデイノコッカス・ラディオデュランスISDra2座位の概略を示す。システムは、左及び右の部分的回文配列(LE及びRE)にそれぞれフランキングするtnpA及びtnpB遺伝子から成る。
図1B】TnpAによって媒介される「剥離及びペースト」の転位機構の概略を示す。TnpA二量体は、複製中に宿主DNAラギング鎖からのトランスポゾン切除を媒介し、環状一本鎖DNA中間体及びドナージョイントを形成する。次に、切除されたトランスポゾンは、アクセプタジョイントにおいて、短い5'-TTGAT-3'(ISDra2)モチーフの次の宿主のラギングDNA鎖に挿入され、転位サイクルが完了する。トランスポゾン切除/挿入部位は三角形で示される。
図1C】TnpB複合体発現及び大腸菌細胞からの精製及び結合RNA抽出の実験ワークフローの概略を提供する。
図1D】ISDra2座位に対するsRNAシーケンシングリードのアライメントを提供する。トランスポゾン切除/挿入部位が三角形で示される。RE因子に由来するRNA配列は、ヘアピン形成に関与し得るリボヌクレオチド、及び、ヘアピン及び三角形の間の2つのリボヌクレオチドであり、一方、シーケンシングされたRNA3'末端における最後の約16ntは、三角形の右に示されるトランスポゾンフランキングDNA-リボヌクレオチドとアラインする。
【0032】
図2A図2はISDra2システム精製からのTnpBに関連する。図2Aは単一TnpB発現及び大腸菌細胞からの精製から調製されたHisTrapキレートカラムに結合されたタンパク質の溶出画分を示すSDS-PAGEゲルを示す。枠で囲まれたエリアは、予想される10×MBP-TnpBタンパク質(95.4kDa)サイズのバンドを表す。
図2B】ISDra2システム発現及び大腸菌細胞からの精製を用いる、TnpBから調製されたHisTrapキレートカラムに結合されたタンパク質の溶出画分を示すSDS-PAGEゲルを示す。枠で囲まれたエリアは、予想される10×MBP-TnpBタンパク質(95.4kDa)サイズのバンドを表す。
図2C】10×MBP-TnpBタンパク質を含むプールされた画分のSDS-PAGEゲルを示す。
図2D】TnpBタンパク質と共精製する核酸の検出及び解析に関連するゲルを示す。
【0033】
図3A図3はTnpBタンパク質がRNAによってガイドされるdsDNAヌクレアーゼであることを示す。図3Aは二本鎖(ds)DNA切断活性検出の実験ワークフローの概略を提供する。reRNAコードコンストラクトは、16ntガイド配列を含む。F-連結されたアダプターにアニーリングするフォワードプライマー。R1及びR2-プラスミドバックボーンにアニーリングするリバースプライマー。7Nは、標的配列の次のプラスミドライブラリにおけるランダム化領域を表す。
図3B】標的配列における二本鎖切断(DSB)形成を示すアダプター連結位置決定を示す。
図3C】20~21bp F+R1エンリッチアダプター連結リードにおける7Nランダム化領域において識別されるモチーフのWebLogo表現を提供する。
図3D】TnpB RNP複合体発現及び精製の実験ワークフローを示す概略を提供する。reRNAコードコンストラクトは、16ntガイド配列を含む。
図3E】TnpB RNP複合体がインビトロでスーパーコイル状を切断し、標的プラスミドをほどき、切断はインタクトなRuvC様の活性部位に依存することを示すゲルを提供する。
図3F】トランスポザーゼ会合モチーフ(TAM)及びreRNA3'末端配列に相補的な標的がプラスミドDNA切断に必要であることを示すゲルを提供する。
図3G】5'-TAMから15~21bpの切断位置を明らかにするTnpB切断プラスミド産物のサンガーシーケンシングを示す。識別された切断位置は、三角形を用いたマーカである(NTS-非標的鎖;TS-標的鎖)。
【0034】
図4A図4はTnpB RNP複合体がTAM依存的な方式でdsDNAを切断することを示す。図4Aは二本鎖(ds)DNA切断活性検出の実験ワークフローの概略を示す。reRNAコードコンストラクトは、20ntガイド配列を含む。F-連結されたアダプターにアニーリングするフォワードプライマー。R1及びR2-プラスミドバックボーンにアニーリングするリバースプライマー。7Nは、標的配列の次のプラスミドライブラリにおけるランダム化領域を表す。
図4B】標的配列における二本鎖切断(DSB)形成を示すアダプター連結位置決定を示す。
図4C】20~21bp F+R1エンリッチアダプター連結リードにおける7Nランダム化領域において識別されるモチーフのWebLogo表現を示す。
図4D】20~21bp F+R1(-TnpB)エンリッチアダプター連結リードにおける7Nランダム化領域において識別されるモチーフのWebLogo表現を示す。
【0035】
図5A図5はTnpBがインビボでプラスミド干渉を媒介することを示す。図5Aは大腸菌におけるプラスミド干渉アッセイの実験ワークフローの概略を示す。標的プラスミドの切断の結果、カナマイシン(Kn)に対する耐性の喪失が生じる。reRNAコードコンストラクトは、16ntガイド配列を含む。AmpR-アンピシリン/カルベニシリン(Ap/Cb)耐性遺伝子、KanR-Kn耐性遺伝子。
図5B】形質転換実験の結果を示す。形質転換実験は、連続希釈(10×)され、大腸菌形質転換体は、Cb及びKnを補足された培地上で、25℃で44時間増殖された。
【0036】
図6A図6はTnpB RNP複合体精製を示す。図6AはTnpB RNP複合体発現及び多段階精製の実験ワークフローの概略を示す。reRNAコードコンストラクトは、16ntガイド配列を含む。
図6B】精製されたTnpB及びTnpB(D191A)RNP複合体のSDS-PAGE解析の結果を示す。
図6C】マスフォトメトリーによって判定されたTnpB及びreRNA RNP複合体の分子量を示す。取得された分子量は、約150ntのreRNAに結合されたTnpBタンパク質から成るTnpB RNP複合体に対応する(1:1モル比)。
【0037】
図7A図7はTnpBヌクレアーゼが新規のゲノムエディターであることを示す。図7Aはヒト細胞株(HEK293T)ゲノム編集実験の実験ワークフローの概略を示す。
図7B】ヒトゲノムDNAにおける5つの試験された20bp長標的におけるインデル活性検出を示す(3つの反復の平均、±標準偏差として表される)。x軸に沿って、各部位について、「TnpB(非標的)」を表す棒線が左手側にあり、「TnpB」を表す棒線が右手側にある。
図7C】切断部位にわたる支配的な欠失を示す、EMX1-1部位におけるインデルプロファイル解析の結果を示す。グラフの左にある陰影付きの細長い部分は、「TAM」を表し、右にある陰影付きの細長い部分は、「標的」を表す。
【0038】
図8A図8はTnpB RNP複合体による合成dsDNA切断を示す。図8Aは精製されたTnpB RNP複合体が、TS(標的鎖)上の配列CTCAGGGAACCGCGGG(配列番号:17)(3'→5')である標的(緑色で表される)、及び、NTS(非標的鎖)上の配列TTGAT(5'→3')によって表されるTAM(赤色)を含むdsDNA基質を切断して段違い切断パターンを生成することを示すゲルを提供する。NTS及びTSは、非標的及び標的鎖をそれぞれ表す。D-DNA基質と共に60分間インキュベートされるTnpB(D191A)RNP複合体。
図8B】精製されたTnpB RNP複合体が、二本鎖TAMの非存在下で、標的を含むdsDNA基質を切断しないことを示すゲルを提供する。D-DNA基質と共に60分間インキュベートされるTnpB(D191A)RNP複合体。
【0039】
図9A図9はTnpB RNP複合体によって切断された合成ssDNAを示す。図9Aは精製されたTnpB RNP複合体が、reRNA標的配列に相補的な配列を含むssDNA基質を切断することを示すゲルである。NTS及びTSは、非標的及び標的鎖をそれぞれ表す。D-DNA基質と共に60分間インキュベートされるTnpB(D191A)RNP複合体。
図9B】精製されたTnpB RNP複合体が、reRNA標的配列に相補的な配列を含むssDNA基質を切断することを示すゲルである。NTS及びTSは、非標的及び標的鎖をそれぞれ表す。D-DNA基質と共に60分間インキュベートされるTnpB(D191A)RNP複合体。
【0040】
図10A図10はインビトロのTnpB切断条件試験の結果を示す。図10Aは様々な温度におけるTnpB RNPプラスミドDNA切断を判定するアッセイの結果を示す。産物は、プラスミドDNAをTnpB RNP複合体と共に15分間インキュベートした後に解析された。
図10B】様々なNaCl濃度におけるTnpB RNPプラスミドDNA切断を判定するアッセイの結果を示す。産物は、プラスミドDNAをTnpB RNP複合体と共に15分間インキュベートした後に解析された。
【0041】
図11A図11はTnpBがインビボでプラスミド干渉を媒介すること示す。図11Aは大腸菌におけるプラスミド干渉アッセイの実験ワークフローの概略を提供する。標的プラスミドの切断の結果、カナマイシン(Kn)に対する耐性の喪失が生じる。reRNAコードコンストラクトは、16ntガイド配列を含む。AmpR-アンピシリン/カルベニシリン(Ap/Cb)耐性遺伝子、KanR-Kn耐性遺伝子。
図11B】形質転換実験が連続希釈(10×)され、大腸菌形質転換体が、Cb及びKnで補足された培地上で、25~37℃で増殖される結果を示す。
【0042】
図12】異なる挿入配列からのTnpBタンパク質のRuvC I、RuvC II、及び、RuvC IIIモチーフのアライメントを提供する。モチーフの配列は、ISDra2(IS605ファミリー)TnpBタンパク質(配列番号:1);ISHp608(IS605ファミリー)TnpBタンパク質(配列番号:2);IS605(IS605ファミリー)TnpBタンパク質(配列番号:3);IS606(IS605ファミリー)TnpBタンパク質(配列番号:4);IS609(IS605ファミリー)TnpBタンパク質(配列番号:5);IS1341(IS1341ファミリー)TnpBタンパク質(配列番号:6);ISC1316(IS1341ファミリー)TnpBタンパク質(配列番号:7);IS891(IS1341ファミリー)TnpBタンパク質(配列番号:8);ISEc42(IS1341ファミリー)TnpBタンパク質(配列番号:9);ISTel3(IS1341ファミリー)TnpBタンパク質(配列番号:10);IS607(IS607ファミリーTnpBタンパク質(配列番号:11);ISTsi1(IS607ファミリー)TnpBタンパク質(配列番号:12);IS1535(IS607ファミリー)TnpBタンパク質(配列番号:13);ISBlo12(IS607ファミリー)TnpBタンパク質(配列番号:14);及びISC1926(IS607ファミリー)TnpBタンパク質(配列番号:15)から取得される。アライメントは、活性部位残基(枠で囲まれたD---E---D)が、TnpBファミリーにわたって保存されていることを示す。
【0043】
図13】本開示のRNAによってガイドされるリボ核タンパク質複合体のヌクレアーゼ活性の概略を提供する。リボ核タンパク質複合体((TnpBタンパク質及びRNAを含む)は、二本鎖TAM配列(非標的鎖を参照すると、標的配列の5'に位置する)を認識し、リボ核タンパク質複合体におけるRNAのガイド配列は、ポリヌクレオチドの標的鎖(TS)の標的配列に結合し、それにより、TnpBタンパク質のRuvC様ドメインによる標的鎖(TS)及び非標的鎖(NTS)の切断をもたらす。
【発明を実施するための形態】
【0044】
本発明者は、Cas9及びCas12 DNAエンドヌクレアーゼと同様であるが別個である方式で機能する、新規のRNAによってガイドされるリボ核タンパク質(本明細書において「エフェクター複合体」とも称される)を識別した。従って、本開示は特に、これらのエフェクター複合体、インビトロ、エクスビボ、及びインビボ(原核生物及び真核細胞)でポリヌクレオチドを切断又は改変するためのそれらの使用を伴う方法、及び、標的細胞へのそれらの送達のためのシステムに関連する。
【0045】
TnpBタンパク質
本開示のタンパク質は、TnpBタンパク質を含む、それから本質的に成る、又は、それから成るタンパク質である。特に、タンパク質がTnpBタンパク質を「含む」場合、更なるアミノ酸がタンパク質に存在し得る。これは下で更に記載され、1又は複数の追加のエフェクタータンパク質とのTnpBの融合タンパク質を含む。タンパク質がTnpBタンパク質から「本質的に成る」場合、TnpBタンパク質の必須の特徴、すなわち、RNAに結合することによって本明細書に記載のエフェクター複合体(RNAプログラム可能ヌクレアーゼとして作用する能力を有し得、ここで、TnpBタンパク質は、そのヌクレアーゼ活性を保持し、又は、RNAプログラム可能担体又はRNAプログラム可能ポリヌクレオチドブロッカとして作用する能力を有し得、ここで、エフェクター複合体におけるTnpBは、下で更に記載されるようにそのヌクレアーゼ活性が不活性化された不活性/変異体TnpBタンパク質である)を形成するその能力に重大な影響を与えない更なるアミノ酸又はタンパク質配列がタンパク質に存在し得る。タンパク質がTnpBタンパク質から「成る」場合、更なるアミノ酸は存在しない。
【0046】
TnpBタンパク質は、挿入配列(IS)からのtnpB遺伝子によってコードされるタンパク質、又は、本明細書に記載のエフェクター複合体を形成する能力を保持するこれらのTnpBタンパク質の配列バリアントである。特に、本開示の例において、TnpBタンパク質は、IS200/IS605又はIS607ファミリーにおける可動遺伝因子のtnpB遺伝子から取得されるタンパク質のアミノ酸配列、又はそれらの配列バリアントを有する。好ましい例において、TnpBタンパク質は、IS200/IS605ファミリーからの可動遺伝因子のtnpB遺伝子から取得されるタンパク質のアミノ酸配列、又は、それらの配列変バリアントを有する。より具体的には、TnpBタンパク質は、細菌のデイノコッカスファミリーにおいて見られるIS200/IS605ファミリーからの可動遺伝因子のtnpB遺伝子から取得されるタンパク質のアミノ酸配列、又はそれらの配列バリアントを有し得る。一例において、TnpBタンパク質は、ISDra2のtnpB遺伝子から取得されるTnpBタンパク質のアミノ酸配列(デイノコッカス・ラディオデュランスからの挿入配列IS200/IS605)又はそれらの配列バリアントを有する。
【0047】
上に記載されるように、挿入配列は、転位及び転位の調節に関連する遺伝子のみを含む、単純な広く見られる可動遺伝因子(MGE)である。挿入配列は、当技術分野において、Siguier et al.,2006及びSiguier et al.,2014に記載されるように、及び、細菌及び古細菌から単離された挿入配列のリストを提供するデータベースであるISfinder(https://isfinder.biotoul.fr/)に示されるように、異なるファミリーに分類される。これらの挿入配列の配列は多様であり得るが、IS200/IS605ファミリーの転位因子は、MGEの端における、末端に近い回文因子(LE及びRE)、及び、異なる構成におけるtnpA及びtnpB遺伝子、又は、スタンドアロンtnpA又はtnpB遺伝子を保持するものとして識別される。特に、IS200/IS605ファミリーは更に、(tnpA遺伝子のみを保持する)IS200、(場合によりIS605とも称され、tnpA及びtnpB遺伝子、例えば、ヘリコバクター・ピロリからのIS608、及び、デイノコッカス・ラディオデュランスのISDra2を保持する(この因子の構成は図1Dに示される))IS200/IS605、及び(tnpB遺伝子のみを保持する)IS1341に分類され得る。IS607 MGEは、tnpA及びtnpB遺伝子の両方をコードするものとして識別され、そのコード配列は、場合により重複している。これらの因子の端はまた、不完全な、及び/又は、二次的なRNA構造であることが多い逆位反復配列と会合し得る。
【0048】
TnpBタンパク質は、TnpBタンパク質が本明細書に記載のエフェクター複合体を形成することを共に可能にするRNA結合セグメント及びRuvC様ヌクレアーゼドメインを含み、当該エフェクター複合体は、ポリヌクレオチドにおける(RNAのガイド配列が結合する標的部位を含む)標的領域に対するヌクレアーゼ活性を有する。特に、本明細書において実証されるように、RuvC様ドメインは、TnpBタンパク質のヌクレアーゼ活性を担う。
【0049】
RuvC自体は、活性のために二価金属イオンを必要とする、細菌におけるホリデイジャンクションを解離する二量体の細菌エンドヌクレアーゼである。RuvC様ドメイン(RuvC-I、RuvC-II、及びRuvC-IIIモチーフを含み、任意選択的に、RuvC-II及びRuvC-IIIモチーフの間のZnフィンガーを伴う)は、当技術分野において知られており、Cas9タンパク質による1つのDNA鎖の切断、及び、Cas12タンパク質の二本鎖ヌクレアーゼ活性を担うと認識されている(例えば、Shmakov et al.,2017、Makarova et al.,2015、及びMakarova et al.,2020を参照)。RuvCタンパク質と同様に、TnpBのRuvC様ドメインは通常、活性のために二価金属イオンを必要とする。
【0050】
図12は、異なる挿入配列からのTnpBタンパク質のRuvC-I、RuvC-II、及びRuvC-IIIモチーフのアライメントを提供する。(挿入配列の名称及びファミリーが左手側に示される。)アライメントは、RuvC活性部位に関与する、モチーフI、II及びIIIにおける保存されたD---E---Dアミノ酸(図12における枠で囲まれたアミノ酸)をそれぞれ示す。これらのアミノ酸は、配列アライメントツール、例えば、Clustal Omega配列アライメントプログラム(https://www.ebi.ac.uk/Tools/msa/clustalo/)(Madeira et al.,2019)を使用してTnpBタンパク質内において識別できる。
【0051】
TnpBタンパク質がヌクレアーゼ活性を有する標的配列を含むポリヌクレオチドは二本鎖DNA又は一本鎖DNAであり得る。特に、TnpBタンパク質は二本鎖DNAに対してヌクレアーゼ活性を有し、従って、TnpBタンパク質を含むエフェクター複合体は、ゲノム編集において特に有用性を有する。
【0052】
TnpBタンパク質のRNA結合セグメントは、RNAと相互作用してエフェクター複合体を形成する配列を含む。本明細書において報告される実験において示されるように、本発明者は、大腸菌において単独でマルトース結合タンパク質をコードする配列に融合されたtnpB遺伝子の発現、及び、その後のアフィニティクロマトグラフィーが、インタクトなTnpBタンパク質の低い収量を明らかにしたことを発見した。しかしながら、RNAとの共発現の結果、TnpBタンパク質のより高い収量がもたらされた。理論によって拘束されることを望まないが、本発明者は、RNAとのTnpBタンパク質のRNA結合セグメントの相互作用が、TnpBタンパク質を安定化するように作用すると考えている。
【0053】
TnpBが二本鎖DNAを切断することを可能にするために、ポリヌクレオチドは、標的配列のTnpB会合配列モチーフ5'(図13に示される非標的鎖上)を含む必要がある。このTnpB会合配列モチーフはまた、本明細書において、トランスポゾン関連モチーフ又はTAMと称される。特に、理論によって拘束されることを望まないが、本発明者は、PAMについてのCas9及びCas12エフェクタータンパク質の要件と同様の方式で、DNA分子のエフェクター複合体切断が、TnpB会合配列モチーフの存在を必要とすると、及び、TAMがエフェクター複合体によって二本鎖モチーフとして認識されると考える(本明細書において例によって示されるように、その存在は、エフェクター複合体による一本鎖DNAの切断に必要でないからである)。TAMの配列は、異なるTnpBタンパク質の間で変動し得ると予想される。特定のTnpBタンパク質についてのTAMの配列は、Cas9及びCas12ヌクレアーゼのために過去に開発されたPAM(プロトスペーサー隣接モチーフ)識別アッセイ(Karvelis et al.,2015、2019)を使用して判定できる(例2も参照されたい)。
【0054】
ポリヌクレオチドにおけるTnB会合配列モチーフは、Tリッチモチーフであり得、TTGATであり得る。特に、好ましくは、TnpB会合配列はTTGATであり、TnpBタンパク質はISDra2ファミリーに由来し、より好ましくは、配列番号:1のアミノ酸配列又はそれらの配列バリアントを含む又はそれから成る。
【0055】
TnpBタンパク質は、挿入配列において見られるtnpB遺伝子又はその配列バリアントの産物であり得、すなわち、それに由来し得る。TnpB配列バリアントは、RNA結合セグメント及びRuvC様ヌクレアーゼドメインを保持し、これらは共に、TnpBタンパク質が、ポリヌクレオチドにおける標的領域(RNAが結合する標的部位を含む)に対するヌクレアーゼ活性を有する、本明細書に記載されるエフェクター複合体を形成することを可能にする。エフェクター複合体が、二本鎖DNAであるポリヌクレオチドを標的とするものである場合、TnpBタンパク質バリアントはまた、ポリヌクレオチドの標的領域においてTnpB会合モチーフを認識する能力を保持する必要がある。
【0056】
配列バリアントは、上に示されるISファミリーからのtnpB遺伝子から産生されたTnpBタンパク質と少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%の配列同一性を有し得る。代替的に、バリアントは、TnpBタンパク質と少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%の配列類似性を有し得る(特にBLASTによって判定される)。
【0057】
配列のバリエーションは、保存されたアミノ酸の変化の確立に基づき得る。更に、Cas9及びCas12タンパク質の特異性及び活性を増加させるために使用された、当技術分野において記載される方法はまた、特に、減少したオフターゲットのヌクレアーゼ活性を伴うTnpBバリアントを生成するために利用され得る。1つの例は、指向性進化法である。
【0058】
TnpBタンパク質は、300~600アミノ酸の長さであり得、任意選択的に350~550アミノ酸の長さ、更に任意選択的に、350~450アミノ酸の長さであり得る。
【0059】
一例において、TnpBタンパク質は、配列番号:1のアミノ酸配列を有する408アミノ酸配列であるISDra2(デイノコッカス・ラディオデュランスからの挿入配列IS200/IS605)のtnpB遺伝子からのTnpBタンパク質(https://isfinder.biotoul.fr/scripts/ficheIS.php?name=ISDra2及びNCBIアクセッション番号AE000513を参照)、又は、配列番号:1と少なくとも85%の配列同一性、又は、それと少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%の配列同一性を有するアミノ酸配列を伴うTnpBタンパク質であり得る。
MIRNKAFVVRLYPNAAQTELINRTLGSARFVYNHFLARRIAAYKESGKGLTYGQTSSELTLLKQAEETSWLSEVDKFALQNSLKNLETAYKNFFRTVKQSGKKVGFPRFRKKRTGESYRTQFTNNNIQIGEGRLKLPKLGWVKTKGQQDIQGKILNVTVRRIHEGHYEASVLCEVEIPYLPAAPKFAAGVDVGIKDFAIVTDGVRFKHEQNPKYYRSTLKRLRKAQQTLSRRKKGSARYGKAKTKLARIHKRIVNKRQDFLHKLTTSLVREYEIIGTEHLKPDNMRKNRRLALSISDAGWGEFIRQLEYKAAWYGRLVSKVSPYFPSSQLCHDCGFKNPEVKNLAVRTWTCPNCGETHDRDENAALNIRREALVAAGISDTLNAHGGYVRPASAGNGLRSENHATLVV(配列番号:1)
【0060】
更なる例において、TnpBタンパク質は、以下の1つ、又は、それと少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、又は少なくとも99%の配列同一性を有する配列バリアントであり得る。
【0061】
ISHp608(IS605ファミリー)TnpBタンパク質。長さ:383;NCBIアクセッション番号AF357224
ISファインダーデータベースエントリ:https://isfinder.biotoul.fr/scripts/ficheIS.php?name=ISHp608
MLITYKQKLYKNDKNRRIDTLLRRYGALYNHCIALHKRYYRLFKKYLKLYDLQKHITKLKKTHRYAFLKTLGSQTMQDLTERIDKAFKKFFNKKAKLPRFKKVANYKSFTFKSKIDKKTGLNKGVGFAIKDNVVSFNGYSYKFIKTYAFIGKVKTLTIKRDNTGDYFLCLVCELENHPNKQTACDKSVGFDFGLKTFLTGSDHTKIESPLSFSKYLPLIKRLSKNLSKKVKGSNNFKKAKKKLTQLHQKIKYLRTDFFHKLALKLSREYQTIFIEDLNMKAMQKLWGRKVSDLAFSEFVKILENKANVVKIDRFYPSSKTCSNCLFVNEEINKDFRKIGKTDKEREYHCKYCGLELDRDLNAAINIHRVGASTLGVEFVRPTC(配列番号:2)
【0062】
IS605(IS605ファミリー)TnpBタンパク質。長さ:427;NCBIアクセッション番号HPU60177から
ISファインダーデータベースエントリ:https://isfinder.biotoul.fr/scripts/ficheIS.php?name=IS605
MLNAIKFRIYPNAQQKELISKHFGCSRVVYNYFLDYRQKQYAKGIKETYFTMQKVLTQIKHQEKYHYLNECNSQSLQMALRQLVSAYDNFFSKRARYPKFKSKKNAKQSFAIPQNIEIKTETQTIALPKFKEGIKAKLHRELPKDSVIKQAFISCIADQYFCSISYETKEPIPKPTIIKKAVGLDMGLRTLIVTSDKIEYPHIRFYQKLEKKLTKAQRRLSKKVKGSNNRKKQAKKVARLHLACSNTRDDYLHKISNEITNQYDLIGVETLNVKGLMRTYHSKSLANASWGKFLTMLKYKAQRKAKTLLGIDRFFPSSQLCSYCGFNTGKKHENITKFTCPHCNITHHRDYNASVNIRNYALGMLDDRHKIKIDKSRVGIIRTDYAHYTDERIKACGASSNGVISKYGNILDLASYGAMKQEKAQSL(配列番号:3)
【0063】
IS606(IS605ファミリー)TnpBタンパク質。長さ:442。NCBIアクセッション番号U95957から。
ISファインダーデータベースエントリ:https://isfinder.biotoul.fr/scripts/ficheIS.php?name=IS606
MKVNKGFKFRLYPTKEQQDKLQRCFFVYNQAYNIGLNLLQEQYETNKDSPPKERKWKKSSELDKAIKHHLNARGLSFSSVIAQQSRMNVERALKDAFKVKDRGFPKFKNSKSAKQSFSWNNQGFSIKDSDEERFKIFTLMKMPLMMRMHRDFPPHSKVKQIVISWSHRKYFVSFCVEYEQDITPIKNPKNGVGLDLNILDIACSCGVNNHKKLTDFKQYPTDMKELLGIEIDEELDTKRLIPTYSKLYSLKKYSKKFKRLQRKQSRRVLKSKQNKTKLGGNFYKTQKKLNQAFDKSSHQKTDRYHKITSELSKQFELVVVEDLQVKNMTKRAKLKNVKQKSGLNQSILNTSFYQIISFLDYKQQHNGKLLVKVPPQYTSKTCHCCGNINHKLKLNHRQYWCLECGYREHRDINAANNIISKGLSLFGVGNIHADFKEQSLSC(配列番号:4)
【0064】
IS609(IS605ファミリー)TnpBタンパク質。長さ:402;NCBIアクセッション番号BA000007から
ISファインダーデータベースエントリ:https://isfinder.biotoul.fr/scripts/ficheIS.php?name=IS609
MKRLQAFKFQLRPGGQQEREMRRFAGACRFVFNRALALQNENHEAGNKYIPYGKMASWLVEWKNATETQWLKDAPSQPLQQSLKDLERAYKNFFRKRAAFPRFKKRGQNDAFRYPQGVKLDQENSRIFLPKLGWMRYRNSRQVTGVVKNVTASQSCGKWYISIQTENEVSTPVHPSALMVGLDAGVAKLATLSDGTVFGPVNSFQKNQKTLARLQRQLSRKVKFSNNWQKQKRKIQRLHSCIANICRDYLHKVTTTVSKNHAMIVIEDLKVSNMSKSAAGTVSQPGRNVRAKSGLNRSILDQGWYEMRRQLEYKQLWRGGQVLAVPPAYTSQRCACCGHTAKENRLSQSKFRCQACGYTANADVNGARNILAAGHAVLACGEMVQSGRPLKQEPTEMIQATA(配列番号:5)
【0065】
IS1341(IS1341ファミリー)TnpBタンパク質。長さ:369;NCBIアクセッション番号D38778
ISファインダーデータベースエントリ:https://isfinder.biotoul.fr/scripts/ficheIS.php?name=IS1341
MANKAYQFRLYPTKEQEQLLAKTFGCVRFVYNKMLEERIQMFEKFKDDQESLKQQTCPTPAKYKKEFPWLKEVDSLALANAQLNLQKAFQHFFSGRAGFPKFKNRKAKQSYTTNMVNGNIKLSDGYIKLPKLKWIKLKQHREIPAHHIIKSCTITKTKTGKYYISILTEYEHQPAPKEVQTVVGLDFSMSTLYVDSEGKRANYPRFYRKALETLAKEQRKWSRKKKGSNRWHKQRLKVAKLHEKIANQRKDFLHKESHKLAKRYDCVVIEDLNMKGMSQALHFGQGVHDNGWGMFTTFLQYKLVEQGKKLIKIDKWFPSSKTCSCCGRVKESLSLSERTFRCECGFESDRDVNAAINIKHEGMKRLAIV(配列番号:6)
【0066】
ISC1316(IS1341ファミリー)TnpBタンパク質。長さ:393;NCBIアクセッション番号:NC_002754から
ISファインダーデータベースエントリ:https://isfinder.biotoul.fr/scripts/ficheIS.php?name=ISC1316
MPTLGFRFRAYTDEQTLRALKAQLKLTCEIYNTLRWADIYFYQRDGKGLTQTELRQLALDLRKQDDEYKQLYSQVVQQVADRYSEAKKRFFEGLARFPKEKKPHKYYSLVYTQSGWKILHVREIRKGKKNKKKLITLKLSNLGTFKVIVHRDFPLDKVKRVVVKLTRSERIYITFVVDHEFPKLPNTGKVVAIDVGVEKLLITSDGEYFPNLRPYEKALWKVKHIHRELSRKKFLSNNWFKAKVKLARAYEHLKNLRTDLYMKLGKWFAEHYDVVVMEGIHAKQLVGKSLRSLRRRLSDVGFGELRGVLKYQLEKYGKKLILVNPAYTSKTCARCGYVKNDLSLSDRVFVCPNCGWIADRDYNASLNILRGSGSERPLVWSSALYQYSGKVGL(配列番号:7)
【0067】
IS891(IS1341ファミリー)TnpBタンパク質。長さ:401;NCBIアクセッション番号M24855から
ISファインダーデータベースエントリ:https://isfinder.biotoul.fr/scripts/ficheIS.php?name=IS891
MLVFETKLEGTNEQYQLLMRRLKLLVLSNACLRTWIGQPNIGRYDLSAYCAVLLPMKTFRSLPNSTLWLDKLLLKERGVQLLGFLTIASKTKPGRKVIHALKKNRRMGVLSIKLAAGSLVVTVAYVTFSDGFKAGTFKLWGTRDLHFYQLKQFKRVRVVRRADGYYAQFCIDQERVERREPTLKTIGLDVGLNHFLTDSEGNTVENPRHLRKSEKSLKRLQRRLSKTKKGSNNRVKARNRLSRKHLKVSRQRKDFAVKLARCVVQSSDLVAYEDLQVRNMVRNRHLAKSISDAAWTQFRQWVEYFGKVFGVVTVAVPPHHTSQNCSNCGEVVKKSLSTRTHACPHCGHIQDRDWNAARNILELGLRTVGHTGSQVSGDIDLCLGEVTPPNKSSRGKRKPKK(配列番号:8)
【0068】
ISEc42(IS1341ファミリー)TnpBタンパク質。長さ:376;NCBIアクセッション番号NC_004431から
ISファインダーデータベースエントリ:https://isfinder.biotoul.fr/scripts/ficheIS.php?name=ISEc42
MKRAYKYRFYPTTEQAELLAQTFGCVRFVYNSILRWRTDAYYERKEKIGYLQANARLTALKKEPEYIWLNDVSCVPLQQSLRHQQAAFANFFAGRAAYPAFKSKRHKQVAEFTASAFKHRDGELYIAKSKSPLDVRWSRELPSAPSTVTISRDSAGRYFVSCLCEFEPVSMPVTAKTVGIDVGLKDLFVTDTGFKTDNPRHTAKYAKRLTLLQRRLSRKQKGSRNRIKARLKVARLHAKIADCRMDNLHKLSRKLINENQVVCVESLKVKNMIRNPKLSKAIADAGWSELVRQLQYKGKWAGRSVVAIDQYLPSSKCCSCCGFTMQKMPLNVRKWHCPECGADHDRDINAARNIKAAGLAVLAHGEPVNPESQHAA(配列番号:9)
【0069】
ISTel3(IS1341ファミリー)TnpBタンパク質。長さ:393、NCBIアクセッション番号NC_004113から
ISファインダーデータベースエントリ:https://isfinder.biotoul.fr/scripts/ficheIS.php?name=ISTel3
MRGVEKAFSYRFYPTTEQESLLRKTLGCVRLVYNRALAARTEAWYERKERLDYVQTSALLTQWKKQDDLQFLNEVSCVPLQQALRHLQSAFTNFFAGRAKYPNFKKKRNGGSAEFTKSAFRWKDGKVFLAKCNEPLNIPWSRRLPDGVEPSTVTIRLNPAGQWYISLRFDDPRELTLQPVDPSVGLDVGMSSLITLSTGEKIANPKHFNRYYKRLRKAQRSLSRKQKGSRNWDKARLKVAKIHQKISDSRKDHLHQLTTRLIRENQTIIIESLAVKNMVKNRQLARSISDAGWGELVRQLEYKAQWYGRTLVKIDRWFPSSKRCGQCGHIVEWLPLSVREWDCPKCGAHHDRDINAAGNILAVGHTVTVCGAGVRPDRHTSGGQLRRNRKSQK(配列番号:10)
【0070】
IS607(IS607ファミリー)TnpBタンパク質。長さ:419;NCBIアクセッション番号AF189015から
ISファインダーデータベースエントリ:https://isfinder.biotoul.fr/scripts/ficheIS.php?name=IS607
MSAISITHKIALKPNNKHITYFKKAFGCARFAYNWGLAKWKENYQLGIKTSHLQLKKEFNALKKSQFNFVYEVTKYATQQPFIHLNLAFNKFFRDLEKGLVSYPKFKKKREFQGSFYIGGDQIKIIQTANTDYLKIPNLPPIKLTEKLRFQGKIHNATITQKGDHFYVSISCDIDESEYKRTHKLQESHNKLGIDIGIKSFVSLSNGLNIYAPKPLDKLTRKLVRISRQLSKKIHPKTKGDKTRKSNNYLKHSKKLTHLHEKIANIRLDFLHKLTSSLIRHSNSFCLESLKVKNMFKNHRLAKSLSDISMSVFNTLLEYKAKYSNKEILRADTYYPSSKTCSNCQKVKQDLKLKDRIYQCLECGFELDRDINAAINLLKHLVGRVTAEFTPMDLTALLNDLSNNRLATSKVELGIQQKS(配列番号:11)
【0071】
ISTsi1(IS607ファミリー)TnpBタンパク質。長さ:393;NCBIアクセッション番号NC_012883から
ISファインダーデータベースエントリ:https://isfinder.biotoul.fr/scripts/ficheIS.php?name=ISTsi1
MPSETIKLASKFKLKETPEGLNELFSTYRDIVNFLITHAFENNITSFYRLKKEIYKSLRKEYPELPSHYIYTACQMAASIYKSYRKRKRRGKASGRPVFKKEAIMLDDHLFKLDLEKGIIKLSTPNGRITLKFYPAKHHEKFKNWKVGQAWLVRTPKGVFINVVFSKEVEVKEPEDFVGVDLNENNVTLSLSDGEFVQIITHEKEIRTGYFVKRRKIQKKVKVGKKRQELLEKYGERERNRLNDLYHKLANKIVELAEKYGGIALEDLTEIRNSIRYSAEMNGRLHRWSFRKLQSIIEYKAKLKGVEVVFVDPAYTSSLCPVCGEKLSPNGHRVLKCLNCGFEADRDVVGSWNVRLRALKMWGVSVPPESPPMKMGGGKASRGDVYELYTNYG(配列番号:12)
【0072】
IS1535(IS607ファミリー)TnpBタンパク質。
長さ:550;NCBIアクセッション番号Z95210から
ISファインダーデータベースエントリ:https://isfinder.biotoul.fr/scripts/ficheIS.php?name=IS1535
MIVRMRSCAQAAKVAEATGGVQLAGKPKPDGTPTFSRYVEIGVDFEAHRPVVESVSVLFELYDGDANSYAATGGPGAQLPSGWMVTAAKFEVEWPADPQRAGLVRSHFGARRKAFNWGLAQVKADLDAKAADPAHESVDWDLKSLRWAWNRAKDDVAPWWAENSKECYSSGLADLAQGLANWKAGKNGTRKGRRVGFPRFKSGRRDPGRVRFTTGTMRIEDDRRTITVPVIGPLRAKENTRRVQRHLVSGRAQILNMTLSQRWGRLFVAVCYALRTPTTRSPLTQPTVRAGMDLGVRTLATVATLDTATGEQTIIEYPNPAPLKATLVARRRAGRELSRRIPGSHGHRAVKAKLARLDRRCVHLRREAAHQLTTELAGTYGQVVIEDLDVAAMKRSMRRRAFRRSVSDAAMGLVAPQLAYKTAKCSGVLTVADRWFASSQIHHGCTSPDGTPCRLQGKGRIDKHLLCPVTGEVVDRDRNAALNLRDWPDNASRGPVGTTAPSAPGPTTTVGTGHGADTGSSGAGGASVRPRPRRAGRGEAKTQTPQGDAA(配列番号:13)
【0073】
ISBlo12(IS607ファミリー)TnpBタンパク質。
長さ:440;NCBIアクセッション番号NC_004307から
ISファインダーデータベースエントリ:https://isfinder.biotoul.fr/scripts/ficheIS.php?name=ISBlo12
MSAYEAVRIRLDPTPRQTRLLESHAGGARFAYNLMLAHVRRQISLGEKPDWTLYAMRRWWNEWKDEIAPWWRENSKEAYGSAFEWLSQALRNWSDSRKGRRAGRRVGWPKYKSKRSSVPRFAYTTGSFGLIEDDPKALRLPRIGRVHCMENATERVHGRRIVRMTVSRHAGFWYAALTVERPTESVPAKNRKRKNHDRQVGVDLGVRTLATLSDGTTFPNPRNYVRTQRKLRHAQQSLSRRDRGMSHGCGSKRYNRALERVRRIHARIAAQRADNIGKLTTWLADNYSDISIEDLNVQGMSHNRRLAKHILDADFHEFRRQLEYKTARAGTRLHVIDRWYPSSKTCSNCGTVKAKLSLSERVYHCEECGLVIDRDVNAAINIQVAGSAPETLNARGGSVGQTRLECGTMRHPAKREPSGGDSRVRLGAGLGNEAMQMTSL(配列番号:14)
【0074】
ISC1926(IS607ファミリー)TnpBタンパク質。長さ:412;NCBIアクセッション番号AY671948から
ISファインダーデータベースエントリ:https://isfinder.biotoul.fr/scripts/ficheIS.php?name=ISC1926
MERTIKLRVRVDYITYSALKEVEGEYREVLEDAINYGLSNKTTSFTRIKAGVYKTEREKHKDLPSHYIYTACEDASERLDSFEKLKKRGRSYTEKPSVRKVTVHLDDHLWKFSLDKISISTMQGRVFISPTFPKIFWRYYNTEWRIASEARFKLLKGNVVEFFIVFKRDEPKPYEPKGFIPVDLNEDSVSVLVDGKPMLLETNTKRITLGYEYRRKAITTRRSAEDREVKRKLKRLRERDKKVVIRRKLAKLIVKEAFESMSAIVLEALPRRPPEHMIKDVKDSQLRLRIYRSAFSSMKNAIIEKAKEFRVPVVLVNPSYTSSTCPIHGAKIVYQPDGGDAPRVGVCEKGKEKWHRDVVALYNLRKRAGDVSPVPLGSKESHDPPTVKLGRWLRAKSLHSIMNEHKMIEMKV(配列番号:15)
【0075】
TnpBタンパク質を含むタンパク質は、追加的に、1又は複数のエフェクター分子を含み得、特に、TnpBタンパク質に共有結合で連結されて融合タンパク質を形成する1又は複数のエフェクター分子を含み得る。本開示による融合タンパク質は下で更に論述される。
【0076】
本開示はまた、本明細書に記載されるTnpBタンパク質を含む、それから本質的に成る、又はそれから成るタンパク質をコードするDNA及びRNAに関連し、タンパク質はそれから発現によって産生され得る。DNA又はRNAの発現は、インビトロ、エクスビボ、又はインビボで発生し得る。
【0077】
不活性TnpBタンパク質
エフェクター複合体において使用されるタンパク質はまた、部分的に又は完全にそのヌクレアーゼ活性が不活性化されている変異体TnpBタンパク質を含み得る、それから本質的に成り得る、又は、それから成り得る。そのようなタンパク質は、TnpBのヌクレアーゼ活性に影響を与えるタンパク質のRuvC様ドメインにおける1又は複数の変異を有する。特に、ヌクレアーゼ活性を除去するRuvC様ドメインにおける点変異は、当技術分野において既に知られており、変異体Cas12(Cpf1)を生成するために使用されている。FnCpf1の変異D917A及びE1006Aは、FnCpf1の切断活性を完全に不活性化するが、変異D1225Aは核酸分解活性を著しく低減したことが報告された(Zetsche et al.,2015)。TnpBタンパク質のRuvC様ドメインにおける同様の重要な残基の変異はまた、TnpBのヌクレアーゼ機能を除去し、本明細書に記載される不活性化された変異体TnpBタンパク質を生成するために使用され得る。上に記載されるように、また、図12に示されるように、TnpBタンパク質のRuvC様ドメインは典型的には、変異され得る保存されたD---E---Dモチーフを含む。配列番号:1~15の各々におけるこれらの残基の場所は、図12に示される。例えば、配列番号:1(ISDra2からのTnpBタンパク質)において、これらは、D191、E278、及びD361である。他のTnpBタンパク質における同等の残基は、配列アライメントツール、例えば、Clustal Omega配列アライメントプログラム(https://www.ebi.ac.uk/Tools/msa/clustalo/)を使用して識別され得る(Madeira et al.,2019)。
【0078】
従って、一例において、不活性の変異体TnpBタンパク質は、ヌクレアーゼ活性が不活性化又は部分的に不活性化されるように、RuvC様ドメインにおけるアミノ酸残基の変異を伴う、本明細書に記載されるTnpBタンパク質を含み得る。特に、変異は、保存されたD---E---Dモチーフにおけるアミノ酸残基のうちの1、2、又は3つであり得る。
【0079】
特定の例において、変異体TnpBタンパク質は、配列番号:1と少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、又は少なくとも99%の配列同一性を有する配列を有し、ここで、配列は、RuvC様ドメインが不活性化又は部分的に不活性化されるように、配列番号:1の位置D191、E278、及びD361のうちの少なくとも1つにおいて変異される。
【0080】
MIRNKAFVVRLYPNAAQTELINRTLGSARFVYNHFLARRIAAYKESGKGLTYGQTSSELTLLKQAEETSWLSEVDKFALQNSLKNLETAYKNFFRTVKQSGKKVGFPRFRKKRTGESYRTQFTNNNIQIGEGRLKLPKLGWVKTKGQQDIQGKILNVTVRRIHEGHYEASVLCEVEIPYLPAAPKFAAGVDVGIKDFAIVTDGVRFKHEQNPKYYRSTLKRLRKAQQTLSRRKKGSARYGKAKTKLARIHKRIVNKRQDFLHKLTTSLVREYEIIGTEHLKPDNMRKNRRLALSISDAGWGEFIRQLEYKAAWYGRLVSKVSPYFPSSQLCHDCGFKNPEVKNLAVRTWTCPNCGETHDRDENAALNIRREALVAAGISDTLNAHGGYVRPASAGNGLRSENHATLVV(配列番号:1、太字で示される位置D191、E278、及びD361)
他の例において、変異体TnpBタンパク質は、配列番号:2~15の1つと少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、又は少なくとも99%の配列同一性を有する配列を有し、ここで、配列は、RuvC様ドメインが不活性化又は部分的に不活性化されるように、図12に示される枠で囲まれたアミノ酸残基のうちの少なくとも1つにおいて変異される。
【0081】
不活性TnpBタンパク質を含むエフェクター複合体は、単純に、ポリヌクレオチドにおける標的部位を含む特定の標的領域をブロックするために、例えば、領域における転写を妨害するために使用され得る。それらはまた、例えば、標的部位に対するエフェクター複合体の結合が検出システムの物理的又は化学的特性の測定可能な変化を生じさせる方法において(例えばバイオセンサーの文脈において)、試料における標的配列を含むポリヌクレオチドの存在を検出するために使用され得る。
【0082】
不活性TnpBタンパク質はまた、1又は複数のエフェクター分子を含むエフェクター複合体において使用され得る。これらの態様において、TnpBタンパク質は、1又は複数のエフェクター分子をポリヌクレオチドにおける特定の標的領域へ送達するために、1又は複数のエフェクター分子(「1又は複数のカーゴ分子」とも名付けられ得る)のための担体になる。一例において、1又は複数のエフェクター分子(特に、タンパク質ベースであるエフェクター分子、例えば、酵素又はタンパク質標識様蛍光タンパク質であるとき)は、TnpB(下で更に論述される)との融合タンパク質の部分として「保持」され得る。代替的に、又は追加的に、1又は複数のエフェクター分子は、RNAの部分として「保持」され、又は、下で更に記載されるRNAに結合され得る。
【0083】
本開示はまた、本明細書に記載される不活性TnpBタンパク質を含む、それから本質的に成る、又はそれから成るタンパク質をコードするDNA及びRNAに関連し、タンパク質はそれから発現によって産生され得る。DNA又はRNAの発現は、インビトロ、エクスビボ、又はインビボで発生し得る。
【0084】
TnpB融合タンパク質
上に記載されるように、エフェクター複合体は、TnpBタンパク質との融合タンパク質の形態で1又は複数のエフェクター分子を保持し得る。本開示のそのような例において、エフェクター複合体のタンパク質は、TnpBタンパク質、及び、TnpBタンパク質のN又はC末端に融合された1又は複数のエフェクター分子を含む。エフェクター複合体における融合タンパク質の所望の機能に応じて、融合タンパク質は、TnpBタンパク質、又は、活性ヌクレアーゼドメインを含まない、上で識別された不活性(変異体)TnpBタンパク質を含み得る。
【0085】
1又は複数のエフェクター分子は、核輸送による細胞の核内へのタンパク質の輸送を補助する1又は複数の核局在化シグナル(NLS)であり得る。特に、そのようなNLSは、標的ポリヌクレオチドが細胞の核であるときに使用され得る。典型的には、NLSは、タンパク質がRNAと複合体を形成するときにそれらがタンパク質表面上に露出されるように、タンパク質のN又はC末端に又はその近くに存在する、正に荷電したリシン又はアルギニンの短い配列である。NLSの非限定的な例は、SV40ラージT抗原からの配列PKKKRKV(配列番号:18)、及び、約10アミノ酸(例えば、KRPAATKKAGQAKKK-配列番号:19)のスペーサーによって分離される2つのクラスターの塩基性アミノ酸KR及び4つのK残基を含むヌクレオプラスミンの二分NLSを含む。他のNLSが当技術分野において知られている。
【0086】
エフェクター複合体がどのように細胞に送達されるかに応じて、融合タンパク質はまた、細胞膜透過ペプチド(細胞内への融合タンパク質の取り込みを促進する短いペプチド)を含み得る。
【0087】
更に、又は代替的に、融合タンパク質は、1又は複数のエフェクター分子を含み得る。1又は複数のエフェクター分子は、標的領域におけるポリヌクレオチドを改変可能な1又は複数のエフェクター分子;標的領域の転写を増加又は減少させることが可能な1又は複数のトランス作用因子である1又は複数のエフェクター分子;及び/又は、標的領域を標識可能な1又は複数のエフェクター分子であり得る。
【0088】
Cas9及びCas12融合タンパク質を利用して、1又は複数のエフェクター分子を標的領域へ送達する方法が当技術分野において既に知られている(例えば、Knott et al.,2018、及び、Anzalone et al.,2020に記載されている)。同様の成分がTnpBタンパク質又は不活性TnpBタンパク質に融合され得る。特に、小サイズのTnpBは、融合タンパク質の生成のための良い足場となる。
【0089】
特に、1又は複数のエフェクター分子は、エンドヌクレアーゼ、リボヌクレアーゼ、ニッカーゼ、ベースエディター、エピジェネティック修飾子、トランスポザーゼ、リコンビナーゼ、及び逆転写酵素から選択され得る。特に、ベースエディターがデアミナーゼである場合、シチジンデアミナーゼ及び/又はアデノシンデアミナーゼであり得る。シチジンデアミナーゼを含む融合タンパク質はまた、ウラシルグリコシラーゼインヒビターを含み得る。
【0090】
標的領域の標識のための1又は複数のエフェクター分子が融合タンパク質において利用され得る。標識は、ガイドRNAが標的配列にハイブリダイズしたときにエフェクター複合体を検出するために使用され得るGFPなどのレポーター酵素又は蛍光タンパク質であり得る。
【0091】
標的領域の転写又は翻訳を増加又は減少させるための1又は複数のエフェクター分子が、融合タンパク質において利用され得る。これらは、1又は複数の転写活性化因子又は1又は複数の転写抑制因子であり得る。
【0092】
本開示はまた、TnpBタンパク質(又は不活性TnpBタンパク質)及び本明細書に記載の1又は複数のエフェクター分子を含む融合タンパク質をコードするDNA及びRNAに関連し、融合タンパク質はそれらから発現によって産生され得る。DNA又はRNAの発現は、インビトロ、エクスビボ、又はインビボで発生し得る。
【0093】
エフェクター複合体において使用されるRNA
本開示はまた、TnpBタンパク質に結合してエフェクター複合体を形成することが可能であり、かつ、エフェクター複合体をポリヌクレオチドにおける標的領域へガイド又は誘導し得るRNAに関連する。
【0094】
特に、本開示は、以下を含むRNAを提供する:
(i)RNAがTnpBタンパク質に結合してエフェクター複合体を形成することを可能にするタンパク質結合セグメント、及び
(ii)ポリヌクレオチドの標的領域における標的配列にハイブリダイズすることが可能なガイド配列を含むポリヌクレオチドターゲティングセグメント。
【0095】
RNAのタンパク質結合セグメントは、TnpBタンパク質と相互作用し、RNAをTnpBタンパク質に結合させ、エフェクター複合体を形成する。タンパク質結合セグメントは、RNA二次構造を形成することが可能な配列を含み得る。タンパク質結合セグメントは、少なくとも1つの逆位反復配列、すなわち、その逆相補配列が下流に続く配列セクションを含み得、それにより、2つのセクションは、ハイブリダイズして、ヘアピン、不完全なヘアピン、又は、他の二次RNA構造などの二本鎖RNA(dsRNA)デュプレックスを形成することが可能である。特に、1又は複数の逆位反復配列は、1又は複数の少なくとも部分的に回文構造である配列であり得、それにより、配列は、少なくとも1つのヘアピン又は少なくとも1つの不完全なヘアピン(ステムループ又はヘアピンループとも称され得る)を形成することが可能である。
【0096】
タンパク質結合セグメントは、IS200/IS605又はIS607ファミリーにおける挿入配列の右端(RE)からの(RE DNA配列におけるチミン残基がウラシル残基によって置換される)配列を含み得る。RE配列は、IS200/IS605ファミリーにおける可動遺伝因子からの不完全な回文配列であり得る。RE配列は、tnpB遺伝子の末端配列の一部を組み込み得る。RE配列は、エフェクター複合体におけるTnpBタンパク質の由来であるtnpBと同一の可動遺伝因子からのものであり得る。特定の挿入配列のRE配列は、当技術分野において知られ得る(例えば、上で参照された配列番号:1から15を有するTnpBタンパク質と同一の挿入配列からのものなど、ISfinderデータベースにおいて入手可能であり得る)。代替的に、RE配列は、転位中にtnpB遺伝子と共に移動する挿入配列の右端のシーケンシングに基づいて判定され得る。タンパク質結合セグメントにおいて使用され得るRE配列のセクションは、完全な挿入配列を有する(任意選択的に、これが挿入配列に存在する不活性化されたtnpA遺伝子を有する)好適な宿主細胞(大腸菌など)においてtnpB遺伝子が共発現され、続いて、例えば本明細書の例1に記載されるようにスモールRNAシーケンシングによってTnpB結合RNAが特性評価されるアッセイにおいて判定され得る。
【0097】
一例において、タンパク質結合セグメントは、配列番号:16、GAAUCACGCGACUUUAGUCGUGUGAGGUUCAA(図1Dに示される不完全なヘアピンを形成することが可能である)を含む又はそれから成る。この配列は挿入配列ISDra2のREからのものである。従って、好ましくは、上に記載されたタンパク質が、配列番号:1のアミノ酸配列(ISDra2のtnpB遺伝子からのものである)を伴うTnpBタンパク質を含む場合、RNAのタンパク質結合セグメントは配列番号:16を含む、又はそれから成る。
【0098】
RNAのポリヌクレオチドターゲティングセグメントは、ポリヌクレオチドの標的領域における標的配列にハイブリダイズすることが可能な、すなわち相補的であるガイド配列を含む。RNAのこのセグメントは、ポリヌクレオチドにおける標的領域へエフェクター複合体を誘導する、又は標的とするように作用する。
【0099】
RNAがハイブリダイズする標的配列は、一本鎖DNAであり得るか、又は、二本鎖DNAポリヌクレオチドの一部であり得る。エフェクター複合体が変異体/不活性TnpBを含み、標的領域をブロックするために、又は、1又は複数のエフェクタータンパク質を標的領域へ送達するために使用される例において、DNAがハイブリダイズする標的配列はRNAであり得る。(本明細書に記載されるように、標的配列を含むポリヌクレオチドが二本鎖DNAである場合、ポリヌクレオチドの部位特異的切断が発生する場所が、ガイド配列及び標的配列の間の相補的塩基対、及び、TnpBタンパク質と相互作用する短いTnpB会合配列モチーフ(TAM)の両方によって判定される。)RNAのガイド配列は、10~30ヌクレオチドの長さ、又は、15~25ヌクレオチドの長さであり得、エフェクター複合体が使用されている特定の条件下においてガイド配列及び標的配列の間のハイブリダイゼーションを可能にするのに十分な標的配列に対する相補性を有する。大部分の状況において、80%又はより高い高度の相補性が好ましい。
【0100】
RNAの2つのセグメントは、単一のRNA分子として共有結合により連結され、任意選択的に、2つのセグメントを分離する介在リンカーリボヌクレオチドがあり得る。RNAは、5'タンパク質結合セグメント-(任意選択のリンカー)-ポリヌクレオチドターゲティングセグメント-3'又は5'ポリヌクレオチドターゲティングセグメント-(任意選択のリンカー配列)-タンパク質結合セグメント-3'で構成され得る。好ましくは、構成は、5'タンパク質結合セグメント-(任意選択のリンカー)-ポリヌクレオチドターゲティングセグメント-3'である。
【0101】
全体として、RNAは、50~300ヌクレオチドの長さ、100~200ヌクレオチドの長さ、又は、140~150ヌクレオチドの長さであり得る。
【0102】
RNAは、天然に発生しない設計されたRNAであり、すなわち、RNAは人工的に生成され、ポリヌクレオチドターゲティングセグメント及びタンパク質結合セグメントは共に天然で発生しないことに留意されたい。
【0103】
特に、好ましい実施形態において、ガイドRNAは、非細菌、非古細菌遺伝子配列に対して相補的である。
【0104】
本開示によって提供されるRNAは、例えば、標的細胞におけるRNAの分解を低減するために化学的改変を含み得る。CRISPR Cas9及びCas12システムにおいて使用されるcrRNA及びtracrRNAにおける改変を試験するための技法が、当技術分野において既に記載されており、適用され得る。(例えば、Mir et al.,2018。)RNA分子は更に、ポリヌクレオチドの標的配列を含む標的領域へ送達される1又は複数のエフェクター分子にRNAが結合することを可能にするセグメントを含み得る。MS2ヘアピン又はPP7ヘアピンなどのアプタマーがRNA内に設計され得、それに対してエフェクター分子(例えば、蛍光タンパク質に融合されたMS2 RNA被覆タンパク質MCP)が、例えばdCas9について当技術分野においてに記載された方式で係留又は結合され得る(Sajwan S, et al.,2019;Ma H, et al.,2018;Ma et al.,2016)。
【0105】
本開示はまた、本明細書に記載されるRNAをコードするDNAに関連し、RNAはそれから発現によって産生され得る。DNAの発現は、インビトロ、エクスビボ、又はインビボで発生し得る。
【0106】
エフェクター複合体
上で識別されたタンパク質及びRNAを含むエフェクター複合体も本開示によって提供される。これらは、RNAによって、ポリヌクレオチドの標的領域における標的配列へガイドされ、RNAは、ポリヌクレオチドの標的配列にハイブリダイズするガイド配列を含むポリヌクレオチド結合セグメントを含む。
【0107】
エフェクター複合体が誘導されるポリヌクレオチドは、二本鎖DNA又は一本鎖DNAであり得る。好ましくは、ポリヌクレオチドは二本鎖DNAである。エフェクター複合体が変異体/不活性TnpBを含み、標的領域をブロックするために、又は、1又は複数のエフェクタータンパク質を標的領域へ送達するために使用される例において、エフェクター複合体が誘導される標的配列はRNAであり得る。
【0108】
エフェクター複合体が、活性ヌクレアーゼ部位を伴うTnpBを含む場合、エフェクター複合体は、標的領域におけるDNAを切断することが可能である。切断は、標的部位の端から30bp以内であり得る。切断部位は、標的配列を含む鎖上の標的配列の5'であり得る。
【0109】
一例において、エフェクター複合体は、二本鎖ポリヌクレオチドを切断して段違い二本鎖切断部を生成することが可能である。5'オーバーハングは例えば、4又は5ヌクレオチドの長さであり得る。代替的に、エフェクター複合体は、二本鎖ポリヌクレオチドを切断して平滑末端を生成し得る。
【0110】
本開示のエフェクター複合体は、設計された、天然に発生しない複合体であり得る。特に、複合体のRNA及びタンパク質は、共に天然に発生しない。
【0111】
エフェクター複合体は、単離又は精製された形態であり得る。
【0112】
本開示の一例において、エフェクター複合体は固体支持体に結合される。特に、エフェクター複合体は、標的配列の存在を検出するために使用され得るバイオセンサーにおける固体支持体に結合され得る(例えば、Hajian et al.,(2019)において、グラフェンフィールドエフェクタートランジスター上に固定されるCas9ベースのエフェクター複合体について示されている)。エフェクター複合体を固体表面に接合するために利用され得る、固体表面にタンパク質を接合するための好適な方法が当技術分野において知られている。一例において、エフェクター複合体は、TnpBタンパク質(又は不活性化TnpBタンパク質)、及び、固体支持体の表面上にエフェクター複合体を捕捉するために利用され得るペプチドタグを含む、上に記載される融合タンパク質を含み得る。
【0113】
本開示のエフェクター複合体は、インビトロ、エクスビボ、又はインビボで産生され得る。特に、方法は、細胞において、又は、無細胞系においてインビトロで、本明細書に記載されるRNA及びタンパク質からエフェクター複合体を組み立てることを含み得る。
【0114】
エフェクター複合体が細胞において産生される場合、方法は、細胞において以下を提供することを含み得る。
(i)本明細書に記載されるRNA、及び、本明細書に記載されるタンパク質をコードするDNA;
(ii)本明細書に記載されるタンパク質、及び、本明細書に記載されるRNAをコードするDNA;
(iii)本明細書に記載されるタンパク質をコードするDNA、及び、本明細書に記載されるRNAをコードするDNA;
(iv)本明細書に記載されるタンパク質をコードするRNA(mRNA)、及び、本明細書に記載されるRNA;又は
(v)本明細書に記載されるタンパク質をコードするRNA(mRNA)、及び、本明細書に記載されるRNAをコードするDNA。
【0115】
エフェクター複合体が無細胞系においてインビトロで産生される場合、方法は、RNAをコードするDNAのインビトロ発現、タンパク質をコードするDNAのインビトロ発現、又は、RNAをコードするDNA及びタンパク質をコードするDNAの両方のインビトロ発現を含み得る。
【0116】
タンパク質をコードするDNA及び/又はRNAをコードするDNAは、細胞において又は無細胞系においてDNAの発現を調節する1又は複数の調節因子を含み得る。特に、タンパク質をコードするDNAは、タンパク質をコードするDNA配列に動作可能に連結される少なくとも1つの第1調節因子を含み得、及び/又は、RNAをコードするDNAは、RNAをコードするDNA配列に動作可能に連結された少なくとも1つの第2調節因子を含み得る。「動作可能に連結」とは、RNA及びタンパク質をコードするDNA配列の発現に影響を与えることが可能であるように調節因子がDNA配列に位置することを意味する。調節因子は、プロモーター、エンハンサー、内部リボソーム進入部位、及び他の発現制御因子であり得る。これらは、RNA及びタンパク質を発現するために使用される細胞タイプ、又は、インビトロ無細胞系において使用するために選択された他の成分に応じて選択され得る。
【0117】
本明細書に開示されるDNA配列はベクターに組み込まれ得る。特に、ベクターは、DNA配列の発現、維持、及び/又は伝搬に使用され得る。好適なベクターは、プラスミド及びウイルスベクターを含む。ウイルスベクターは、レトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ウイルス(AAV)ベクター、又は単純ヘルペスウイルスベクターから選択され得る。特に、CRISPR‐Cas9及びCRISPR‐Cas12システムと組み合わせて使用するための、当技術分野において既に知られているウイルスベクターが使用され得る(例えば、Xu et al.,2019に記載される)。好ましい例において、ウイルスベクターは、AAVウイルスベクターである。特に、TnpBタンパク質の相対的に小さいサイズに起因して、AAVウイルスベクターは特に、エフェクター複合体についてのTnpB(又は不活性化TnpB)が、1又は複数のエフェクター分子を保持する融合タンパク質の部分である場合に利用され得る。
【0118】
本開示はまた、本明細書に記載される、RNAをコードするDNA、及び/又は、タンパク質をコードするDNAでトランスフェクトされた宿主細胞を提供する。宿主細胞は、本明細書に記載される、RNAをコードするDNA、及び/又は、タンパク質をコードするDNAのインビトロ発現に使用され得、特に、エフェクター複合体の生成のために使用され得る。宿主細胞は、本明細書に記載される、RNAをコードするDNA、及び/又は、タンパク質をコードするDNAを含む。DNAは、宿主ゲノムと共に複製されるように、宿主細胞のゲノム内に組み込まれ得る。代替的に、DNAは、細胞をトランスフェクトするために使用されたベクター上に残り得る。
【0119】
DNAは、宿主細胞に対して外来のものとして定義され得、すなわち、DNAを含む宿主細胞は天然で発生しない。
【0120】
いくつかの例において、宿主細胞は単離細胞である。
【0121】
いくつかの例において、宿主細胞は、全能性ヒト胚性幹細胞ではない。
【0122】
いくつかの例において、宿主細胞はヒト卵母細胞ではない。
【0123】
いくつかの例において、宿主細胞は、RNAのガイド配列に相補的な標的配列を含まない。
【0124】
宿主細胞は、細胞株からの細胞であり得る。
【0125】
本開示の一態様において、宿主細胞は、ここに記載されるエフェクター複合体を産生するために利用でき、その結果、エフェクター複合体は次に、下で論述される方法において使用できる。
【0126】
本開示の代替的な態様において、エフェクター複合体の生成は、本明細書において論述されたエフェクター複合体の方法及び使用の一部として発生し得る。
【0127】
これらの態様の両方は、本開示によっても提供される以下のシステムを伴い得る。
【0128】
ポリヌクレオチドにおける標的領域を改変するためのシステム、ここで、標的領域は標的配列を含み、システムは:
a)TnpBタンパク質を含む又はそれから成るタンパク質、又は、当該タンパク質をコードするDNA又はRNA、及び、
b)RNA、又はRNAをコードするDNA
を含み、RNAは:
(i)標的配列に相補的である配列を含むポリヌクレオチドターゲティングセグメント;及び
(ii)TnpBタンパク質に結合するタンパク質結合セグメント
を含む。
【0129】
システムは、(a)タンパク質及び(b)RNA;(a)タンパク質をコードするDNA及び(b)RNAをコードするDNA;(a)タンパク質をコードするDNA及び(b)RNA;(a)タンパク質及び(b)RNAをコードするDNA;(a)タンパク質をコードするRNA(mRNA)及び(b)RNA;又は(a)タンパク質をコードするRNA(mRNA)及び(b)RNAをコードするDNAを含み得る。特定の例において、(a)及び(b)は両方ともRNAである(例えば、Cas9について示されている(Gillmore et al.,2021))。
【0130】
RNA及びTnpBを含むタンパク質は本明細書に記載される通りである。特に、タンパク質は、本明細書に記載される融合タンパク質であり得る。TnpBは、本明細書に記載される不活性化TnpBであり得る。
【0131】
システムにおいて、(a)及び/又は(b)は少なくとも1つのベクターに含まれ得る。一例において、(a)及び(b)は、同一のベクターに含まれる。代替的な例において、(a)及び(b)は別個のベクターに含まれる。
【0132】
ベクターは、ウイルスベクターの非ウイルスベクターであり得る。特に、非ウイルスベクターは、少なくとも1つのプラスミド、及び/又は、リポソーム又はエクソソームなどの少なくとも1つの非ウイルス粒子であり得る。
【0133】
代替的に、少なくとも1つのウイルスベクターは、レトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ウイルス(AAV)ベクター又は単純ヘルペスウイルスベクターから選択され得る。上に記載されたように、特に、タンパク質がTnpB及び1又は複数のエフェクター分子を含む融合タンパク質である場合、AAVベクターが好ましいことがあり得る。
【0134】
本開示のシステムは、天然に発生しないシステムに設計される。
【0135】
システムは、(a)及び(b)が別個にパッケージングされたキットの形態であり得、任意選択的に、キットは使用のための指示と共にパッケージングされる。
【0136】
上に記載されたシステム及びエフェクター複合体は、インビトロ、エクスビボ、又はインビボでの細胞への送達のために上で記載されたベクターに含まれ得る。
【0137】
更に、システム又はエフェクター複合体は、単独で、又は、ベクターの一部としてのいずれかで、マイクロインジェクションによって又は電気穿孔を介して送達され得る。特に、ベクターはリポソームであり得る。
【0138】
システム又はエフェクター複合体は、リポフェクション(脂質によって媒介)、トランスフェクション(カチオンポリマーによって媒介)を介して、又は、リン酸カルシウムトランスフェクションによって化学的に送達され得る。
【0139】
レンチウイルスベクター、レトロウイルスベクター、及びAAVベクターを含むウイルスベクターも送達に利用され得る。
【0140】
特に、CRISPR Cas9及びCas12システムについて既に記載されたものに基づく送達システムが利用され得る(例えば、https://blog.addgene.org/crispr-101-mammalian-expression-systems-and-delivery-methodsを参照)。
【0141】
上に記載されたように、エフェクター複合体において使用される融合タンパク質は、細胞によるエフェクター複合体又は融合タンパク質の取り込みを促進するために細胞膜透過ペプチドを含み得る。
【0142】
方法及び使用
本明細書に記載されるエフェクター複合体及び/又はシステムは、ポリヌクレオチドにおける標的領域を切断し、改変し、標識とし、又は、それからの発現を制御するための方法に使用され得、ここで、標的領域は標的配列を含む。
【0143】
特に、方法は、エフェクター複合体をポリヌクレオチドにおける標的領域へ送達するための方法であり得、ここで、標的領域は標的配列を含み、エフェクター複合体は以下を含む:
(a)TnpBタンパク質を含む又はそれから成るタンパク質;及び
(b)以下を含むRNA:
(i)標的配列にハイブリダイズすることが可能なガイド配列を含むポリヌクレオチドターゲティングセグメント;及び
(ii)RNAがTnpBタンパク質に結合することを可能にするタンパク質結合セグメント。
方法は、エフェクター複合体をポリヌクレオチドと接触させ、ガイド配列が標的配列とハイブリダイズすることを可能にすることにより、エフェクター複合体を標的領域へ送達することを備える。エフェクター複合体は、標的領域へ送達される、本明細書に記載される1又は複数のエフェクター分子を含み得る。
【0144】
更なる態様において、方法は、エフェクター複合体を用いてポリヌクレオチドを切断するための方法であり得、ここで、ポリヌクレオチドは、標的配列を含み、エフェクター複合体は以下を含む:
(a)TnpBタンパク質を含む又はそれから成るタンパク質;及び
(b)以下を含むRNA:
(i)標的配列にハイブリダイズすることが可能なガイド配列を含むポリヌクレオチドターゲティングセグメント;及び
(ii)RNAがTnpBタンパク質と結合してエフェクター複合体を形成することを可能にするタンパク質結合セグメント、ここで、方法は、ポリヌクレオチドをエフェクター複合体に接触させ、TnpBタンパク質がポリヌクレオチドを切断することを可能にすることを含む。
【0145】
ポリヌクレオチドが二本鎖DNAである場合、切断は、5'オーバーハングを伴う段違い二本鎖切断部を産生し得る。代替的に、切断は、平滑末端二本鎖切断部を産生し得る。
【0146】
方法の接触段階は、切断されたポリヌクレオチドの非相同末端結合(NHEJ)又は相同組換え修復(HDR)を可能にする条件下で細胞において発生し得、それによりポリヌクレオチドの配列を編集する。更に、方法は更に、HDRのためにポリヌクレオチドをドナーポリペプチドと接触させる段階を備え得る。Cas9及びCas12システムについて当技術分野において知られているNHEJ及びHDRを達成するための好適な方法はまた、本場合において好適である(例えば、Maresca et al.,2013を参照)。
【0147】
これらの態様による方法において、ポリヌクレオチドは、二本鎖DNAであり得、TnpBが相互作用する標的配列(上に記載される)のTnpB会合配列モチーフ5'を含み得る。
【0148】
代替的に、ポリヌクレオチドは一本鎖DNAであり得る。
【0149】
本開示の方法の一例において、ポリヌクレオチドは細胞内にあり得る。細胞は原核細胞又は真核細胞であり得る。細胞が真核細胞である場合、それは非ヒト動物細胞、ヒト細胞又は植物細胞であり得る。特に、細胞は、人工多能性幹細胞などの幹細胞であり得る。
【0150】
Cas9及びCas12システムと同様に、本開示の方法は、植物細胞において特に有用性を有する。特に、本開示は、改変されたポリヌクレオチドを有する細胞を含む植物を産生するための方法を含み、方法は、植物細胞を、本明細書に記載されるシステム又は本明細書に記載されるエフェクター複合体に接触させ、それにより、当該ポリヌクレオチドの標的領域を改変し、当該植物細胞から植物を再生する段階を備え、ここで、改変された標的領域は、当該細胞における関心のある遺伝子にあり、ここで、改変は、関心のある性質に関連する。
【0151】
エフェクター複合体、システム、及び、複合体及びシステムの成分をコードするDNAは、個人において薬剤として使用するためのものであり得る。代替的に、それらは、個人における診断の方法のために使用され得る。
【0152】
代替的に、エフェクター複合体、システム、及び、複合体及びシステムの成分をコードするDNAは、試料における標的配列を含むポリヌクレオチドの存在を判定するために、又は、ポリヌクレオチドの標的領域を改変するために、インビトロ又はエクスビボの方法において使用され得る。
【0153】
ここでは、単に例として、以下の実験作業を参照して、本開示をより詳細に記載する。
【0154】

材料および方法
TnpB発現ベクターの設計
T7プロモーターの下で合成DNA断片としてクローニングされたデイノコッカス・ラディオデュランスR1(GenBank AE000513.1)のIS200/IS605 ISDra2システムを含むpTWIST-ISDra2プラスミドがTwist Biosciencesから取得された。tnpA遺伝子内に欠失を有するISDra2バリアントを含むpGD3プラスミドを取得するために、pTWIST-ISDra2プラスミドがNdeI(Thermo Fisher Scientific)で予め切断され、T4 DNAポリメラーゼ(Thermo Fisher Scientific)を使用して5'-オーバーハングが埋め込まれ、T4 DNAリガーゼ(Thermo Fisher Scientific)を用いて自己環状化された。TnpB精製のために、2つのpBAD由来発現ベクターが、NEBuilder HiFi DNA Assemblyキット(New England Biolabs)を使用して構築された。pTK120-ISDra2-TnpBは、N末端10×His TwinStrep-MBPタンパク質精製タグに融合されたtnpBコード配列を含む一方で、pTK151は、N末端6×His-MBPに融合されたtnpB及びC末端StrepTag IIコード配列を含む。TnpB複合体精製に使用されるreRNA発現ベクター(pGB71)を取得するために、5'末端におけるT7プロモーターを保持するreRNAコード配列、及び、3'末端におけるHDV(D型肝炎ウイルス)リボザイム及びT7ターミネーター(合成オリゴヌクレオチドからPCRによって組み立てられる)が、pACYC184ベクター内に、HindIII 及びBclI 制限部位(Thermo Fisher Scientific)上にクローニングされた。7Nプラスミドライブラリ切断におけるTnpB複合体発現及びプラスミド干渉アッセイに使用されるpGB74-78プラスミドは、T7及びT7lacプロモーターの下にそれぞれ、reRNA及びtnpBコード配列を含む。pGB74-78プラスミドは、Bsu15I及びEcoRI(Thermo Fisher Scientific)部位上のreRNAコード断片、及び、NdeI及びXhoI(Thermo Fisher Scientific)部位上のtnpBをpET-Duet1ベクター(Novagen)内にクローニングすることによって取得された。ヒトHEK293T細胞におけるゲノム編集実験のために、U6及びCAGプロモーターの下にそれぞれreRNA(ヒトゲノムDNAにおける20bpの部位を標的とする)及びtnpB(3'末端においてSV40 NLS-T2A-GFPと融合される)をコードする、pX458プラスミド(Feng Zhang, Addgeneプラスミド#48138からの寄贈)の派生であるプラスミドベクターpRZ122-127が、NEBuilder HiFi DNA Assemblyキット(New England Biolabs)を使用して構築された。Phusion部位指向性変異導入キット(Thermo Fisher Scientific)が、変異RuvC活性部位を有するプラスミドのバリアントを取得するために使用された。
【0155】
TnpB RNP複合体の発現及び精製
初期TnpBタンパク質発現及び事前精製のために、大腸菌BL21-AI細胞が、pTK120-ISDra2-TnpB単独で形質転換され、又は、pGD3(tnpA遺伝子内に欠失を有するISDra2トランスポゾンをコードする)で共形質転換され、アンピシリン(100μg/ml)又はアンピシリン(100μg/ml)及びクロラムフェニコール(50μg/ml)でそれぞれ補足されたLBブロスにおいて37℃で増殖された。0.6~0.8のOD600まで培養した後、タンパク質発現が0.2%アラビノースで誘導され、細胞は16℃の温度で更に16時間にわたって増殖された。翌日、細胞は、遠心分離によってペレット化され、20mM Tris-HCl、pH8.0、25℃、250mM NaCl、5mM 2-メルカプトエタノール、25mMイミダゾール、2mM PMSF、及び5%(v/v)グリセロール含有緩衝液に再懸濁され、超音波処理によって破砕された。遠心分離によって細胞残屑を除去した後に、上清は、Ni2+がチャージされたHiTrapキレートHPカラム(GE Healthcare)上にロードされ、タンパク質が、20mM Tris-HCl、pH8.0、25℃、500mM NaCl、5mM 2-メルカプトエタノール、及び5%(v/v)グリセロール緩衝液における25mMから500mMまで増加するイミダゾール濃度の直線勾配で溶出された。TnpBを含む画分がプールされ、20mM Tris-HCl、pH8.0、25℃、250mM NaCl、2mM DTT、及び50%(v/v)グリセロールに対して透析され、-20℃で保存された。取得された事前精製TnpB試料は、核酸抽出及び解析に使用された。
【0156】
TnpB RNP複合体の発現及び収量の増加のために、大腸菌BL21-AI細胞が、reRNA(pGB71)及びTnpB(pTK151)又はTnpBD191A(pTK152)発現ベクターで形質転換され、アンピシリン(100μg/ml)及びクロラムフェニコール(50μg/ml)を補足された37℃のLBブロスにおいて増殖された。0.6~0.8のOD600まで培養した後、タンパク質発現が0.2%アラビノースで誘導され、細胞は16℃で更に16時間にわたって増殖された。翌日、細胞は、遠心分離によってペレット化され、20mM Tris-HCl、pH8.0、25℃、500mM NaCl、5mM 2-メルカプトエタノール、25mMイミダゾール、2mM PMSF、及び5%(v/v)グリセロール含有緩衝液に再懸濁され、超音波処理によって破砕された。遠心分離によって細胞残屑を除去した後に、上清は、Ni2+がチャージされたHiTrapキレートHPカラム(GE Healthcare)上にロードされ、結合したタンパク質が、20mM Tris-HCl、pH8.0、25℃、500mM NaCl、5mM 2-メルカプトエタノール、及び5%(v/v)グリセロール緩衝液における25から500mMまで増加するイミダゾール濃度の直線勾配で溶出された。TnpB RNP複合体を含む画分はプールされ、6×His-MBPタグは、TEVプロテアーゼを用いて、8℃で一晩インキュベートすることによって切断された。次に、反応混合物は、StrepTrapカラム(GE Healthcare)上にロードされ、20mM Tris-HCl、pH8.0、25℃、150mM NaCl、5mM 2-メルカプトエタノール、及び5%(v/v)グリセロール緩衝液で洗浄され、結合されたTnpB複合体は、2.5mM d-デスチオビオチン溶液で溶出された。TnpBを含む画分がプールされ、HiTrapヘパリンHPカラム(GE Healthcare)上にロードされ、0.15Mから1.0Mまで増加するNaCl濃度の直線勾配を使用して溶出された。取得されたTnpB複合体画分はプールされ、Amicon Ultra-15遠心フィルタユニット(Merck Millipore)を使用して最大0.5mlまで濃縮され、20mM Tris-HCl、pH8.0、25℃、250mM NaCl、5mM 2-メルカプトエタノール緩衝液で平衡化されたSuperdex 200 10/300 GL (GE Healthcare)ゲル濾過カラム上にロードされた。TnpB RNP複合体を含むピーク画分がプールされ、20mM Tris-HCl、pH8.0、25℃、250mM NaCl、2mM DTT及び50%(v/v)グリセロール含有緩衝液に対して透析され、-20℃で保存された。TnpB RNP複合体の濃度は、SDS-PAGEゲルにおけるタンパク質バンドの強度を定量化して、既知の濃度のタンパク質標準と比較することによって判定された。
【0157】
マスフォトメトリーによる分子量測定
測定カバースリップ(No. 1.5 H, 24×50 mm, Marienfeld)が、MilliQ水、イソプロパノール及びMilliQ水において、連続超音波処理によって5分間清浄化され、次に、清浄な窒素ガスの気流を使用して乾燥された。清浄なカバースリップがOneMPマスフォトメーター(Refeyn Ltd.)上に載せられ、CultureWell(登録商標)再使用可能ガスケット(Grace Bio-Labs)が上に配置された。ガスケットウェルが、10μlの20mM Tris-HCl、pH8.0、25℃、及び250mM NaCl緩衝液で充填され、10μlの希釈されたTnpB RNP複合体試料(約60nM)が添加され、生体分子の吸着が、AcquireMPソフトウェア(Refeyn Ltd)を使用して、120秒間モニタリングされた。測定されたレシオメトリックコントラストを分子量に変換するために、Un1Cas12f1タンパク質(Karvelis et al.,2020)及び60~250kDaの範囲のそのオリゴマー(単量体又は四量体)が較正に使用された。試料は3連で測定された。マスフォトメトリーの動画が、DiscoverMP (Refeyn Ltd)を使用して解析された。
【0158】
TnpB結合核酸抽出及び解析
TnpB結合核酸を抽出するために、まず、100μlの事前精製TnpB試料が5μl(20mg/ml)のプロテイナーゼK(Thermo Fisher Scientific)と共に37℃で45分間、1mlの10mM Tris-HCl pH7.5、37℃、5mM MgCl、100mM NaCl、1mM DTT、及び、1mM EDTA反応緩衝液においてインキュベートされた。次に核酸が、フェノール:クロロホルム:イソアミルアルコール(25:24:1)溶液によって抽出され、任意の残留フェノールを除去するために水溶液相が追加的にクロロホルムで処理された。核酸を含む溶液は、新鮮なチューブに分割され(各々198μl)、次に、2μlのRNase I(10U/μl)(Thermo Fisher Scientific)又はDNase I(10U/μl)(Thermo Fisher Scientific)が添加され、反応が37℃で45分間インキュベートされた。反応産物は、2×RNAローディングダイ(Thermo Fisher Scientific)と混合され、0.5×TBE電気泳動緩衝液(Thermo Fisher Scientific)を使用して、TBE-Urea(8M)15%変性ポリアクリルアミドゲル上で分離され、SYBR(登録商標)Gold(Thermo Fisher Scientific)で視覚化された。
【0159】
TnpB RNP複合体からのRNA単離
TnpB結合RNA抽出のために、100μlの事前精製TnpB複合体が5μl(20mg/ml)のプロテイナーゼK(Thermo Fisher Scientific)と共に、37℃で45分間、10mM Tris-HCl、pH7.5、37℃、5mM MgCl、100mM NaCl、1mM DTT、及び1mM EDTAを含む1mlの反応緩衝液と共にインキュベートされた。DNAは、10μlのDNase I(10U/μl)(Thermo Fisher Scientific)を添加することによって消化され、それに続いて37℃で更に45分インキュベートされ、その後、GeneJET RNA Cleanup and Concentration Micro Kit(Thermo Fisher Scientific)を使用して精製された。次に、3μgの精製RNAが、1mM ATPを補足された1×反応緩衝液A(Thermo Fisher Scientific)における1μl(10U/μl)のPNK(Thermo Fisher Scientific)を使用して、20μl反応体積において37℃で30分間にわたってリン酸化され、GeneJET RNA Cleanup and Concentration Micro Kit(Thermo Fisher Scientific)を用いて精製された。
【0160】
RNAシーケンシング及び解析
RNAライブラリが、スモールRNAについての製造元の指示(プロトコルMAN0025359)に従って、Illumina(登録商標)システム(Thermo Fisher Scientific)のためのCollibri(登録商標)Stranded RNA Library Prep Kitを使用して調製され、等モル比においてプールされ、MiSeq System(Illumina)上のMiSeq Reagent Kit v2、300サイクル(Illumina)を使用してペアエンドシーケンシング(2×75bp)された。20bpより短いペアエンドリードは、Cutadapt (Martin, 2011)でフィルタリングされた。残留リードが、BWA(Li及びDurbin、2009)を使用してトランスポゾンコードプラスミド(pTWIST-ISDra2)にマッピングされ、SAMtools(Li et al.,2009)を用いて、.bamファイルフォーマットに変換された。結果として生じるカバレッジデータが、IGV(Robinson、et al.,2011)を使用して視覚化された。
【0161】
TnpB dsDNA切断の検出及びTAM認識
Cas9及びCas12エフェクターについて過去に開発されたPAM決定アッセイ(Karvelis et al.,2015、2019、2020)が、TnpB dsDNA切断要件及びTAM配列の確立のために採用された。簡潔には、7Nランダム化領域に隣接する、プラスミドライブラリにおける16bp又は20bp配列を標的とするtnpB遺伝子及びreRNAコンストラクトが、pET-duet1(MilliporeSigma)ベクター(pGB77-78)にクローニングされた。次に、大腸菌ArcticExpress(DE3)細胞が、TnpB RNPをコードするプラスミドを用いて形質転換され、細胞は、アンピシリン(100μg/ml)及びゲンタマイシン(10μg/ml)が補足されたLBブロスにおいて増殖された。0.5のOD600に到達した後に、0.5mM IPTGを用いてTnpB発現が誘導され、培養液は16℃で一晩インキュベートされた。10mlの一晩の培養液からの細胞が遠心分離で収集され、1mlの溶解緩衝液(20mMリン酸塩、pH7.0、0.5M NaCl、5%(v/v)グリセロール、2mM PMSF)において再懸濁され、超音波処理によて溶解された。細胞残屑は遠心分離で除去され、TnpB RNPを含む10μlの上清が、プラスミドライブラリ消化のために直接使用された。簡潔には、ライセートが、100μlの反応緩衝液(10mM Tris-HCl、pH7.5、37℃、100mM NaCl、1mM DTT及び10mM MgCl)において1μgの7Nランダム化プラスミドライブラリ(pTZ57)と混合され、37℃で1時間インキュベートされた。切断されたDNA末端は、1μlのT4 DNAポリメラーゼ(Thermo Fisher Scientific)及び1μlの10mM dNTPミックス(Thermo Fisher Scientific)を添加することによって修復され、11℃で20分間インキュベートされ、それに続いて、最大75℃で10分回加熱された。次に、反応混合物を1μlのDreamTaqポリメラーゼ(Thermo Fisher Scientific)及び1μlの10mM dATP(Thermo Fisher Scientific)と共に72℃で30分間インキュベートすることによって、3'-dAオーバーハングが添加された。1μlのRNase A(Thermo Fisher Scientific)を添加し、反応混合物を37℃で15分間インキュベートすることによってRNAが除去され、それに続いて、GeneJet PCR精製キット(Thermo Fisher Scientific)を使用してDNAが精製された。次に、100ngの精製された切断産物が、3'-dTオーバーハング(100ng)を含む100ngのdsDNAアダプターと混合され、20μlの反応体積において、1μlのT4 DNAリガーゼ(Thermo Fisher Scientific)と共に22℃で1時間インキュベートされた。次に、アダプターを含む切断産物がPCR増幅され、GeneJetゲル精製キット(Thermo Fisher Scientific)を使用してゲル精製された。DNAライブラリが、製造元の指示に従って、Illumina(登録商標)システム(Thermo Fisher Scientific)のためのCollibri(登録商標)PS DNA Library Prep Kitを使用して調製され、等モル比においてプールされ、MiSeq System(Illumina)上のMiSeq Reagent Kit v2、300サイクル(Illumina)を使用してペアエンドシーケンシング(2×150bp)された。
【0162】
TnpB RNP複合体による二本鎖DNA切断が、7Nプラスミドライブラリにおける標的配列でのアダプター連結を調査することによって評価された。これは、アダプター及びプラスミドバックボーンに由来する配列と完全に一致する10bpを識別することによって、7N領域の次の0~30bp標的位置に連結されたアダプターを含むすべてのリードを抽出及びカウントすることによって達成された。標的領域(7Nランダム化配列から20~21bp)におけるアダプター連結の頻度の上昇を示すリードが、7N配列(TAM)抽出、及び、WebLogo (Crooks, 2004)を使用する視覚化に使用された。切断位置識別及びTAM特性評価に使用されたPython(登録商標)スクリプトが、GitHubレポジトリにおいて提供される(https://github.com/tkarvelis/Nuclease_manuscript)。
【0163】
インビトロTnpB切断反応のためのDNA基質
インビトロ切断アッセイにおいて使用されたプラスミドDNA基質(pGB72-73)は、合成オリゴデュプレックス(Invitrogen)を、EcoRI及びNheI制限エンドヌクレアーゼ(Thermo Fisher Scientific)で予め切断されたpSG4K5プラスミド(Xiao Wangからの寄贈、 Addgeneプラスミド#74492)にクローニングすることによって取得された。
【0164】
合成直鎖DNA基質が、1μMのオリゴヌクレオチド(Thermo Fisher Scientific)を1μl(10U/μl)のPNK(Thermo Fisher Scientific)及び32P-γ-ATP(PerkinElmer)と共に、7.5μlの1×反応緩衝液A(Thermo Fisher Scientific)において、37℃で30分間インキュベートすることによって、5'末端標識された。オリゴデュプレックス(100nM)が、32P-標識及び未標識相補的オリゴヌクレオチド(1:1.5モル比)を組み合わせることによって取得され、続いて、95℃に加熱され、室温までゆっくり冷却された。
【0165】
DNA切断アッセイ
プラスミドDNA切断反応が、10mM Tris-HCl、pH7.5、37℃、10mM MgCl、1mM DTT、1mM EDTA、100mM NaClを含む反応緩衝液において100nM TnpB RNP複合体を3nMプラスミドDNA(pGB72-73)と混合することによって開始され、続いて、37℃で60分間インキュベートされた(別の指示がない場合)。反応は、3×ローディングダイ溶液(50%(v/v)グリセロールにおける0.01%ブロモフェノールブルー及び75mM EDTA)と混合することによって停止され、アガロースゲル電気泳動及び臭化エチジウムによって解析された。ほどかれたプラスミドDNA基質は、NdeIエンドヌクレアーゼ(Thermo Fisher Scientific)を用いて切断することによって取得された。
【0166】
合成オリゴデュプレックスを用いる切断反応は、100μl Tris-HCl、pH7.5、37℃、1mM EDTA、1mM DTT、10mM MgCl、100mM NaCl反応緩衝液において、37℃で、100nMのTnpB RNP複合体を1nMの放射線標識基質と組み合わせることによって開始された。10μlの分量が、時間間隔(0分、1分、5分、15分、及び60分)で反応混合物から除去され、1.8×体積のローディングダイ(95%(v/v)ホルムアルデヒド、0.01%ブロモフェノールブルー及び25mM EDTA)を用いて反応停止され、変性ゲル電気泳動(0.5×TBE緩衝液において8.5M尿素を含む20%ポリアクリルアミド)にかけられた。ゲル
プラスミド干渉アッセイ
プラスミド干渉アッセイが、TnpB及びreRNAコードプラスミド(pGB74-76)を保持する大腸菌Arctic Express(DE3)株において実行された。細胞は37℃で約0.5のOD600まで増殖され、pSG4K5(Xiao Wangからの寄贈、Addgeneプラスミド#74492)から設計された100ngの標的プラスミド(pGB72)を用いて電気穿孔された。1時間後、共形質転換細胞が更に、10倍希釈で連続希釈され、IPTG(0.1mM)、ゲンタマイシン(10μg/ml)、カルベニシリン(100μg/ml)及びカナマイシン(50μg/ml)を含むプレート上において、25℃で、30℃又は37℃で16~44時間にわたって増殖された。
【0167】
HEK293T細胞におけるTnpB誘導DNA切断
ATCCから購入したHEK293T細胞(カタログ番号CRL-3216)が、10%ウシ胎児血清(Gibco)、ペニシリン(100U/ml)及びストレプトマイシン(100μg/ml)(Thermo Fisher Scientific)で補足されたダルベッコ改変イーグル培地(DMEM)(Gibco)において培養された。トランスフェクションの前日に、細胞は、1.4×10細胞/ウェルの密度で24ウェルプレートに蒔かれた。トランスフェクション混合物は、NLSタグTnpB及びそのreRNAをコードする1μgのプラスミド(pRZ122-127)を100μlの無血清DMEM及び2μlのTurboFectトランスフェクション試薬(Thermo Fisher Scientific)と混合することによって調製された。室温で15分間インキュベートした後、トランスフェクション混合物が細胞に液滴で添加された。トランスフェクト細胞は、37℃、5%COで、72時間にわたって増殖された。
【0168】
インデル特性評価
トランスフェクトされたHEK293T細胞がトリプシン処理され、それらのゲノムDNAが、QuickExtract溶液(Lucigen)を使用して抽出された。各標的部位を囲むDNA領域を増幅し、Illuminaシーケンシング及びインデックス付与に必要な配列を追加するために2ラウンドのPCRが実行された。簡潔には、Hot Start Phusionポリメラーゼ(Thermo Fisher Scientific)を使用して、最終体積20μlで、5'終端がIlluminaリード1及びリード2配列である、標的ゲノム座位に特異的なプライマーと共に、1~4μlのDNAライセートが一次PCRにおいて使用された。サーモサイクラー設定は、98℃で30秒間の初期変性、98℃で15秒間、56.8℃で15秒間、72℃で30秒間の15サイクル、及び、72℃で5分間の最終インキュベーションから成る。結果として生じる増幅産物は、1.8×体積の磁気ビーズ(Lexogen)を使用して清浄され、30μlにおいて溶出された。6μlの溶出混合物が、最終体積30μlで第2ラウンドのPCRのテンプレートとして使用され、i7 6 ntインデックスセット(Lexogen)と共にLexogen PCRアドオンキット(Lexogen)を使用してIlluminaシーケンシングに必要なP5及びP7アダプターをインデックス化及び追加した。サーモサイクラー設定は、98℃で30秒間の初期変性、98℃で10秒間、65℃で20秒間、72℃で30秒間の15サイクル、及び、72℃で1分間の最終インキュベーションから成る。PCR産物の純度を確実にするために、0.9×体積の磁気ビーズ(Lexogen)を用いる追加の洗浄が実行された。バーコーディング及び精製されたDNA試料が、Qubit 4 Fluorometer(Thermo Fisher Scientific)によって定量化され、BioAnalyzer (Agilent)を使用して解析され、等モル比においてプールされ、MiniSeqシステム(Illumina)上のMiniSeq High Output Reagent Kit、150サイクル(Illumina)を使用してペアエンドシーケンシングされた(2×75bp)。挿入又は欠失変異(インデル)が、以下のパラメータで、CRISPResso2 (Clement et al., 2019)を使用して解析された:増幅産物配列に対するアライメントについて最低70%の相同性、10bpの定量ウィンドウ、偽陽性を回避するために置換を無視、及び、平均リードについてphred33スコア>10、及び、単一塩基対品質。
【0169】
例1 デイノコッカス・ラディオデュランスISDra2転位因子におけるTnpBの生化学的機能の確立
挿入配列(IS)は、転位及び転位の調節に関連する遺伝子のみを含む単純で広く見られる可動遺伝因子(MGE)である。IS200/IS605ファミリーの転位因子は、もっとも単純で古い可動遺伝因子(MGE)(Siguier et al.,2014)のうちの1つである。典型的には、それらは、MGE末端における末端に近い回文因子(LE及びRE)及び異なる構成におけるtnpA及びtnpB遺伝子を保持する。しかしながら、このファミリーのいくつかのMGEは、スタンドアロンtnpA又はtnpB遺伝子(ISfinderデータベース)を含む(Siguier et al.,2006)。最善に実験的に特性評価されたヘリコバクター・ピロリ(Hp)及びデイノコッカス・ラディオデュランス(Dra)ISDra2のそれぞれのIS608及びIS200/IS605MGEは、左端(LE)及び右端(RE)不完全回文配列(図1A)にフランキングされる、部分的に重複するtnpA及びtnpB遺伝子から成る(Kersulyte et al.,2002;Pasternak et al.,2010)。転位は、DNA複製と組み合わされ、必須の一本鎖DNA中間体を含む「剥離及びペースト」機構を介して発生する(Hoang et al.,2010)。
【0170】
tnpAによってコードされるTnpAトランスポザーゼは、細胞及びインビトロの両方で、ISモビリティを促進するのに十分である。TnpAチロシンY1トランスポザーゼは、ssDNA中間体の切除及び挿入の両方を触媒する。TnpAは、二量体を形成し、一方の単量体における触媒チロシン及び他方の単量体における金属結合HUHモチーフからできている複合活性部位を含む非常に小さい(約18kDa)タンパク質である。それは、環状一本鎖(ss)DNA中間体を生成する「TTAC」(IS608)又は「TTGAC」(ISDra2)配列の近くのトランスポゾンコードDNA鎖を切断する(図1B)(Guynet et al.,2008;Pasternak et al.,2010)。組み込み反応は、具体的には、同一配列の近くのssDNA内で発生し、標的部位複製無しで転位サイクルを完了する(Guynet et al.,2008;Pasternak et al.,2010)。興味深いことに、標的部位選択は、TnpAによる直接的な配列読み取りではなくトランスポゾンLE因子配列を伴う塩基対形成相互作用を通じて発生する(Barabas et al.,2008;He et al.,2011)。IS607ファミリーにおける転位の分子機構は、あまり理解されていない。それは、TnpAセリンファミリートランスポザーゼを必要として、二本鎖(ds)DNA中間体を伴い得る(Boocock and Rice,2013;Chen et al., 2018;Kersulyte et al.,2000)。
【0171】
転位におけるTnpA機能は十分に確立されているが、TnpBの役割は分からないままである。TnpBは、転位に必須でないが、トランスポゾン切除及び挿入の負の調節に関与すると考えられる(Kersulyte et al.,2000、2002;Pasternak et al.,2013)。興味深いことに、TnpB配列における保存されたRuvC様活性部位のバイオインフォマティクス識別は、TnpBが、CRISPR-Casシステムによって採用されたCas9及びCas12ヌクレアーゼの祖先であり得るという推測を生じさせた(Kapitonov et al.2016;Makarova et al.,2020)。しかしながら、転位におけるRuvCモチーフの役割も、TnpBのヌクレアーゼ活性も、実験的に実証されていない。
【0172】
デイノコッカス・ラディオデュランスISDra2転位因子におけるTnpBの生化学的機能を確立するために、我々は、TnpBタンパク質を単離して生化学的に特性評価することを試みた。この目的で、我々は、10×HIs-MBP(マルトース結合タンパク質)精製タグをコードする配列に融合された大腸菌tnpB遺伝子(1227bp)を発現させた。Ni2+アフィニティクロマトグラフィーによって抽出された細胞からTnpBを精製する初期の試みでは、インタクトなTnpBタンパク質(図2A)の収量が非常に低いことが明らかになった。しかしながら、完全ISDra2トランスポゾンとの(不活性化tnpAとの)tnpBの共発現の結果、TnpB収量が著しく増加し、いくつかのトランスポゾン因子が安定的なTnpB発現に貢献し得ることが示唆された(図2B及び2C)。TnpB試料のその後の解析から、RNAがTnpBと共精製されることが明らかになった(図2D)。TnpB結合RNAを特性評価するために、我々は、スモールRNAシーケンシング(sRNA-seq)を実行し、我々がreRNAと名付けたISDra2トランスポゾンRE因子に由来する非コードRNA(約150nt)のエンリッチメントを明らかにした(図1C及び1D)。TpnBと共精製されるreRNAは、tnpB遺伝子及びRE配列の3'-末端と一致したが、IS200/IS605トランスポゾンにフランキングするプラスミドDNA配列に由来する3'末端における最後の約16ntを除く(図1D)。IS200/IS605ファミリートランスポゾンをコードするtnpBと会合する非コードRNAのエンリッチメントが、ハロバクテリウム・サリナルムについて過去に報告された(Gomes-Filho et al.,2015)。まとめると、これらのデータは、TnpBが、トランスポゾン3'末端由来reRNAとリボ核タンパク質(RNP)複合体(gRNAとのCas9又はCas12複合体と同様)を形成することを示す。後者の場合、gRNAの可変配列部分は、CRISPRアレイにおけるスペーサー配列に対応する。
【0173】
例2 TnpBタンパク質と会合するRNAがガイド配列として機能する
我々は、トランスポゾンに隣接するDNAに由来し、それ自体で可変である3'末端の約16ntのreRNA(図1D)は、TnpBをその標的に誘導してRuvC様活性部位によってDNA切断を活性化するガイド配列として機能し得ると考えた。この仮説を試験するために、我々は、Cas9及びCas12ヌクレアーゼについて過去に開発されたPAM(プロトスペーサー隣接モチーフ)識別アッセイを採用した(Karvelis et al.,2015、2019)。簡潔には、我々はまず、プラスミドに由来する3'末端TnpB reRNA配列が7Nランダム化プラスミドライブラリの次の標的と一致する16nt又は20nt配列によって置換されたreRNAバリアントを設計した(図3A及び4A)。次に、大腸菌の形質転換及び発現に続いて、TnpB RNP複合体を含む細胞ライセートが、ランダム化されたプラスミドライブラリ切断を確立するために直接使用された。プラスミド切断の結果生じるDNA末端は、T4 DNAポリメラーゼによって修復され、アダプター連結を受け、PCR増幅及びシーケンシングされた。アダプター連結断片の解析から、TnpB RNP複合体によるプラスミドライブラリ切断を示すランダム化領域から21~22bp及び15bpの標的部位にアダプターを有する産物のエンリッチメントが明らかになった(図3B及び4B)。標的(TS)及び非標的NTS鎖のアダプター連結位置の解析から、5'-オーバーハングを生じさせる段違い切断部が示唆された。DNA断片のさらなる解析から、標的配列の5'上流にあるランダム化7N領域における「TTGAT」配列のエンリッチメントが明らかになった。特に、TnpBによるプラスミドライブラリの切断をライセンスされたTTGAT配列は、TnpA媒介ISDra2トランスポゾン切除及び挿入に必要な標的部位配列と一致した(図3C、4C及び4D)(Islam et al.,2003)。この配列は、Cas9又はCas12ヌクレアーゼによるDNA切断の開始に必要なプロトスペーサー隣接モチーフ(PAM)配列と類似するので、我々はそれをトランスポゾン関連モチーフ(TAM)と名付けた。次に、プラスミドライブラリを使用して確立されるdsDNA切断要件を確認するために、我々は、TnpB RNPを大腸菌から精製し、5'-TTGAT TAM配列によってフランキングされる標的配列を含む様々なdsDNA基質を切断するその能力を試験した(図3D、8、9、及び10)。TnpB複合体は、TAM配列によってフランキングされる標的を含むプラスミドDNA(スーパーコイル状のもの及びほどかれたものの両方)を切断した(図3E、4C、及び4D)。reRNAガイド配列と一致するTAM及び標的配列は、プラスミドDNA切断に必要であった(図3F)。RuvC様活性部位における保存された残基の変異は、切断を損ない、RuvCがdsDNA切断を担うことが示された(図3E)。最後に、切断産物のランオフシーケンシングにより、5'-オーバーハングを結果として生じさせる、TAMから15~21bpにおける段違い切断パターンを確認した(図3G及び8)。まとめると、これらの結果は、インビトロのTnpBが、TAM依存RNAガイドdsDNAヌクレアーゼとして機能することを実証する。
【0174】
例3 TnpBはインビボでドナージョイントを切断することが可能である
TnpBが細胞においてドナージョイント(図5A)でDSBを生じさせることが可能であるかどうかを試験するために、我々は、TAMにフランキングする標的を含み、Knで補足されたアガープレート上で増殖を可能にするカナマイシン(Kn)耐性遺伝子を保持するプラスミドによってTnpB複合体を発現する組み換え大腸菌宿主の形質転換効率をモニタリングした。形質転換体の連続希釈は、インタクトなRuvC様活性部位を有するTnpBバリアントを含む細胞におけるプラスミド干渉を明らかにした。特に、プラスミド干渉は、より低い温度でより顕著であった(図5B及び図11A図11B)。したがって、これらの結果から、TnpBがインビボでドナージョイントを切断することが可能であると確認された。
【0175】
例4 TnpBは細胞における標的ゲノム改変を媒介し得る
我々は、ヒトHEK293T細胞における標的ゲノム改変にTnpBを採用できるかどうかを試験した。核局在化配列(NLS)を有するTnpBタンパク質、及び、ヒトゲノムDNA(gDNA)を標的にするreRNAコンストラクトをコードするプラスミドが、HEK293T細胞内へ一時的にトランスフェクトされた(図7A)。72時間後、gDNAが抽出され、DSB修復イベントを示す標的切断部位における挿入及び欠失(インデル)の存在について、シーケンシングにより解析された。試験された2つの部位(AGBL1-2及びEMX1-1)において、TnpBは、CRISPR‐Cas9及びCas12ベースの編集において観察されたレベル(Cong et al.,2013;Jinek et al.,2013;Liu et al.,2019;Mali et al.,2013;Pausch et al.,2020;Zetsche et al.,2015)と同様に、10~20%の頻度で変異を導入した(図7B)。AGBL1-1及びEMX1-2部位は、適度に(1~5%)改変され、一方、HPRT1部位ではインデルが検出されなかった。取得されたインデルのさらなる解析から、Cas12切断によって生じる変異プロファイル(Pausch et al.,2020;Zetsche et al.,2015)と同様に、切断部位における支配的な欠失(図7C)が明らかになった。
【0176】
まとめると、これらの結果は、非常に小さいRNAガイドTnpBヌクレアーゼが、真核生物gDNAを切断可能であり、ゲノム編集のためのツールとして採用され得、ゲノム編集用途についての異なる生化学的要件を伴う、新しいクラスの非常に小さい非Casヌクレアーゼを提供することを示す。下の表は、RNAガイドTnpBヌクレアーゼとCas9及びCas12ヌクレアーゼとの比較を提供する。
【表1】
本明細書に記載の例は、本発明の実施形態の説明的な例として理解される。更なる実施形態及び例が想定される。任意の1つの例又は実施形態に関連して記載される任意の特徴は、単独で又は他の特徴と組み合わせて使用され得る。更に、任意の1つの例又は実施形態に関連して記載される任意の特徴はまた、任意の他の例又は実施形態の1又は複数の特徴と組み合わせて、又は、任意の他の例又は実施形態の任意の組み合わせで使用され得る。更に、本明細書に記載されない同等物及び改変がまた、請求項において定義される発明の範囲内において採用され得る。
【0177】
本明細書において言及されるすべての公開物は、各個別の公開物が具体的にかつ個別にその全体が参照によって組み込まれることが示される場合と同一の程度で、全体が参照によって組み込まれる。
参考文献
参考文献1. Anzalone et al., (2020) Genome editing with CRISPR-Cas nucleases, base editors, transposases and prime editors. Nature Biotechnology 38, 824-844
参考文献2. Barabas, O., Ronning, D.R., Guynet, C., Hickman, A.B., Ton-Hoang, B., Chandler, M., and Dyda, F. (2008). Mechanism of IS200/IS605 Family DNA Transposases: Activation and Transposon-Directed Target Site Selection. Cell 132, 208-220.
参考文献3. Boocock, M.R., and Rice, P.A. (2013). A proposed mechanism for IS607-family serine transposases. Mob DNA 4, 24.
参考文献4. Chen, W., Mandali, S., Hancock, S.P., Kumar, P., Collazo, M., Cascio, D., and Johnson, R.C. (2018). Multiple serine transposase dimers assemble the transposon-end synaptic complex during IS607-family transposition. ELife 7, e39611.
参考文献5. Clement, K., Rees, H., Canver, M.C., Gehrke, J.M., Farouni, R., Hsu, J.Y., Cole, M.A., Liu, D.R., Joung, J.K., Bauer, D.E., et al. (2019). CRISPResso2 provides accurate and rapid genome editing sequence analysis. Nature Biotechnology 37, 224-226.
参考文献6. Cong, L., Ran, F.A., Cox, D., Lin, S., Barretto, R., Habib, N., Hsu, P.D., Wu, X., Jiang, W., Marraffini, L.A., et al. (2013). Multiplex Genome Engineering Using CRISPR/Cas Systems. Science 339, 819-823.
参考文献7. Crooks, G.E. (2004). WebLogo: A Sequence Logo Generator. Genome Research 14, 1188-1190.
参考文献8. Gillmore et al., (2021) CRISPR-Cas9 in vivo gene-editing for transthyretin amyloidosis. NEJM DOI: 10.1056/NEJMoa2107454, 26 June 2021
参考文献9. Gomes-Filho, J.V., Zaramela, L.S., Italiani, V.C. da S., Baliga, N.S., Vencio, R.Z.N., and Koide, T. (2015). Sense overlapping transcripts in IS1341-type transposase genes are functional non-coding RNAs in archaea. RNA Biol 12, 490-500.
参考文献10. Guynet, C., Hickman, A.B., Barabas, O., Dyda, F., Chandler, M., and Ton-Hoang, B. (2008). In Vitro Reconstitution of a Single-Stranded Transposition Mechanism of IS608. Molecular Cell 29, 302-312.
参考文献11. Hajian et al., (2019) Detection of unamplified target genes via CRISPR-Cas9 immobilized on a graphene field-effect transistor. Nature Biomedical Engineering 3, 427-437
参考文献12. He, S., Hickman, A.B., Dyda, F., Johnson, N.P., Chandler, M., and Ton-Hoang, B. (2011). Reconstitution of a functional IS608 single-strand transpososome: role of non-canonical base pairing. Nucleic Acids Research 39, 8503-8512.
参考文献13. Hickman, A.B., Chandler, M., Dyda, F. (2010) Integrating prokaryotes and eukaryotes: DNA transposases in light of structure. Crit. Rev. Biochem. Mol. Biol. 45, 50-56.
参考文献14. Hoang, B.T., Pasternak, C., Siguier, P., Guynet, C., Hickman, A.B., Dyda, F., Sommer, S., and Chandler, M. (2010). Single-stranded DNA transposition is coupled to host replication. Cell 142, 398-408.
参考文献15. Islam, M.S., Hua, Y., Ohba, H., Satoh, K., Kikuchi, M., Yanagisawa, T., and Narumi, I. (2003). Characterization and distribution of IS8301 in the radioresistant bacterium Deinococcus radiodurans. Genes Genet. Syst. 78, 319-327.
参考文献16. Jiang, F., and Doudna, J. (2017). CRISPR-Cas9 Structures and Mechanisms. Ann. Rev. Biophys. 46, 505-29.
参考文献17. Jinek, M., East, A., Cheng, A., Lin, S., Ma, E., and Doudna, J. (2013). RNA-programmed genome editing in human cells. ELife 2, e00471.
参考文献18. Kapitonov, V.V., Makarova, K.S., and Koonin, E.V. (2016). ISC, a Novel Group of Bacterial and Archaeal DNA Transposons That Encode Cas9 Homologs. J. Bacteriol. 198, 797-807.
参考文献19. Karvelis, T., Gasiunas, G., Young, J., Bigelyte, G., Silanskas, A., Cigan, M., and Siksnys, V. (2015). Rapid characterization of CRISPR-Cas9 protospacer adjacent motif sequence elements. Genome Biol 16, 253.
参考文献20. Karvelis, T., Young, J.K., and Siksnys, V. (2019). A pipeline for characterization of novel Cas9 orthologs. In Methods in Enzymology, (Elsevier), pp. 219-240.
参考文献21. Karvelis, T., Bigelyte, G., Young, J.K., Hou, Z., Zedaveinyte, R., Budre, K., Paulraj, S., Djukanovic, V., Gasior, S., Silanskas, A., et al. (2020). PAM recognition by miniature CRISPR-Cas12f nucleases triggers programmable double-stranded DNA target cleavage. Nucleic Acids Res 48, 5016-5023.
参考文献22. Kersulyte, D., Mukhopadhyay, A.K., Shirai, M., Nakazawa, T., and Berg, D.E. (2000). Functional Organization and Insertion Specificity of IS607, a Chimeric Element of Helicobacter pylori. Journal of Bacteriology 182, 5300-5308.
参考文献23. Kersulyte, D., Velapatino, B., Dailide, G., Mukhopadhyay, A.K., Ito, Y., Cahuayme, L., Parkinson, A.J., Gilman, R.H., and Berg, D.E. (2002). Transposable Element ISHp608 of Helicobacter pylori: Nonrandom Geographic Distribution, Functional Organization, and Insertion Specificity. Journal of Bacteriology 184, 992-1002.
参考文献24. Knott et al., (2018) CRISPR-Cas guides the future of genetic engineering. Science 361, 866-869
参考文献25. Krupovic, M., Makarova, K.S., Forterre, P., Prangishvili, D., and Koonin, E.V. (2014). Casposons: a new superfamily of self-synthesizing DNA transposons at the origin of prokaryotic CRISPR-Cas immunity. BMC Biology 12, 36.
参考文献26. Li, H., and Durbin, R. (2009). Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics 25, 1754-1760.
参考文献27. Li, H., Handsaker, B., Wysoker, A., Fennell, T., Ruan, J., Homer, N., Marth, G., Abecasis, G., Durbin, R., and 1000 Genome Project Data Processing Subgroup (2009). The Sequence Alignment/Map format and SAMtools. Bioinformatics 25, 2078-2079.
参考文献28. Liu, J.-J., Orlova, N., Oakes, B.L., Ma, E., Spinner, H.B., Baney, K.L.M., Chuck, J., Tan, D., Knott, G.J., Harrington, L.B., et al. (2019). CasX enzymes comprise a distinct family of RNA-guided genome editors. Nature 566, 218-223.
参考文献29. Ma H, Tu LC, Naseri A, Chung YC, Grunwald D, Zhang S, Pederson T.. (2018) CRISPR-Sirius: RNA scaffolds for signal amplification in genome imaging. Nat Methods. Nov;15(11):928-931.
参考文献30. Ma H, Tu LC, Naseri A, Huisman M, Zhang S, Grunwald D, Pederson T. (2016) Multiplexed labeling of genomic loci with dCas9 and engineered sgRNAs using CRISPRainbow. Nat Biotechnol.May;34(5):528-30.
参考文献31. Madeira, F., Park, Y.M., Lee, J., Buso, N., Gur, T., Madhusoodanan, N., Basutkar, P., Tivey, A.R.N., Potter, S.C., Finn, R.D., et al. (2019). The EMBL-EBI search and sequence analysis tools APIs in 2019. Nucleic Acids Res 47, W636-W641.
参考文献32. Makarova, K.S., Wolf, Y.I., Iranzo, J., Shmakov, S.A., Alkhnbashi, O.S., Brouns, S.J.J., Charpentier, E., Cheng, D., Haft, D.H., Horvath, P., et al. (2020). Evolutionary classification of CRISPR-Cas systems: a burst of class 2 and derived variants. Nat Rev Microbiol 18, 67-83.
参考文献33. Mali, P., Yang, L., Esvelt, K.M., Aach, J., Guell, M., DiCarlo, J.E., Norville, J.E., and Church, G.M. (2013). RNA-Guided Human Genome Engineering via Cas9. Science 339, 823-826.
参考文献34. Maresca et al., (2013). Obligate Ligation-Gated Recombination (ObLiFaRe): Custom-designed nuclease-mediated targeted integration through nonhomologous end joining. Genome Research 23, 539-546.
参考文献35. Martin, M. (2011). Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.Journal 17, 10-12.
参考文献36. Mir et al., Heavily and fully modified RNAs guide efficient SpyCas9-mediated genome editing - Nature Communications, 9, Article No. 2641 (2018).
参考文献37. Pasternak, C., Ton-Hoang, B., Coste, G., Bailone, A., Chandler, M., and Sommer, S. (2010). Irradiation-Induced Deinococcus radiodurans Genome Fragmentation Triggers Transposition of a Single Resident Insertion Sequence. PLoS Genet 6, e1000799.
参考文献38. Pasternak, C., Dulermo, R., Ton‐Hoang, B., Debuchy, R., Siguier, P., Coste, G., Chandler, M., and Sommer, S. (2013). ISDra2 transposition in Deinococcus radiodurans is downregulated by TnpB. Molecular Microbiology 88, 443-455.
参考文献39. Pausch, P., Al-Shayeb, B., Bisom-Rapp, E., Tsuchida, C.A., Li, Z., Cress, B.F., Knott, G.J., Jacobsen, S.E., Banfield, J.F., and Doudna, J.A. (2020). CRISPR-CasΦ from huge phages is a hypercompact genome editor. Science 369, 333-337.
参考文献40. Robinson, J.T., Thorvaldsdottir, H., Winckler, W., Guttman, M., Lander, E.S., Getz, G., and Mesirov, J.P. (2011). Integrative genomics viewer. Nature Biotechnology 29, 24-26.
参考文献41. Sajwan S, Mannervik M (2019) Gene activation by dCas9-CBP and the SAM system differ in target preference. Scientific Reports 9: Article No. 18104
参考文献42. Shmakov, S., Smargon, A., Scott, D., Cox, D., Pyzocha, N., Yan, W., Abudayyeh, O.O., Gootenberg, J.S., Makarova, K.S., Wolf, Y.I., et al. (2017). Diversity and evolution of class 2 CRISPR-Cas systems. Nat Rev Microbiol 15, 169-182.
参考文献43. Siguier, P., Perochon, J., Lestrade, L., Mahillon, J., and Chandler, M. (2006). ISfinder: the reference centre for bacterial insertion sequences. Nucleic Acids Res 34, D32-36.
参考文献44. Siguier, P., Gourbeyre, E., and Chandler, M. (2014). Bacterial insertion sequences: their genomic impact and diversity. FEMS Microbiology Reviews 38, 865-891.
参考文献45. Takeda, S.N., Nakagawa, R., Okazaki, S., Hirano, H., Kobayashi, K., Kusakizako, T., Nishizawa, T., Yamashita, K., Nishimasu, H., and Nureki, O. (2020). Structure of the miniature type V-F CRISPR-Cas effector enzyme. Molecular Cell S1097276520308352.
参考文献46. Xiao, R., Li, Z., Wang, S., Han, R., and Chang, L. (2021). Structural basis for substrate recognition and cleavage by the dimerization-dependent CRISPR-Cas12f nuclease. Nucleic Acids Research.
参考文献47. Xu et al., (2019) Viral Delivery Systems for CRISPR. Viruses, 11, No. 28
参考文献48. Zetsche, B., Gootenberg, J.S., Abudayyeh, O.O., Slaymaker, I.M., Makarova, K.S., Essletzbichler, P., Volz, S.E., Joung, J., van der Oost, J., Regev, A., et al. (2015). Cpf1 Is a Single RNA-Guided Endonuclease of a Class 2 CRISPR-Cas System. Cell 163, 759-771.
図1A
図1B
図1C
図1D
図2A
図2B
図2C
図2D
図3A
図3B
図3C
図3D
図3E
図3F
図3G
図4A
図4B
図4C
図4D
図5A
図5B
図6A
図6B
図6C
図7A
図7B
図7C
図8A
図8B
図9A
図9B
図10A
図10B
図11A
図11B
図12
図13
【配列表】
2024524514000001.app
【国際調査報告】