(81)【指定国】
AP(BW,GH,GM,KE,LR,LS,MW,MZ,NA,RW,SD,SL,ST,SZ,TZ,UG,ZM,ZW),EA(AM,AZ,BY,KG,KZ,RU,TJ,TM),EP(AL,AT,BE,BG,CH,CY,CZ,DE,DK,EE,ES,FI,FR,GB,GR,HR,HU,IE,IS,IT,LT,LU,LV,MC,MK,MT,NL,NO,PL,PT,RO,RS,SE,SI,SK,SM,TR),OA(BF,BJ,CF,CG,CI,CM,GA,GN,GQ,GW,KM,ML,MR,NE,SN,TD,TG),AE,AG,AL,AM,AO,AT,AU,AZ,BA,BB,BG,BH,BN,BR,BW,BY,BZ,CA,CH,CL,CN,CO,CR,CU,CZ,DE,DJ,DK,DM,DO,DZ,EC,EE,EG,ES,FI,GB,GD,GE,GH,GM,GT,HN,HR,HU,ID,IL,IN,IR,IS,JO,JP,KE,KG,KH,KN,KP,KR,KW,KZ,LA,LC,LK,LR,LS,LU,LY,MA,MD,ME,MG,MK,MN,MW,MX,MY,MZ,NA,NG,NI,NO,NZ,OM,PA,PE,PG,PH,PL,PT,QA,RO,RS,RU,RW,SA,SC,SD,SE,SG,SK,SL,SM,ST,SV,SY,TH,TJ,TM,TN,TR,TT
ゲノム編集および遺伝子調節を含む、遺伝子的およびエピゲノム的工学のためのポリペプチド、組成物およびそれらの使用方法を提供する。これらのポリペプチドおよび組成物は、対象の標的核酸に結合する核酸結合ドメインを含む。核酸結合ドメインは、レジオネラ目の細菌ならびにレジオネラおよびフランシセラ種のような動物病原体からのタンパク質において同定される反復単位に由来する反復単位を含む。
前記ポリペプチドがN末端ドメインを含み、前記N末端ドメインのC末端が前記NBDの最初のRUのN末端に融合されている、請求項1〜6のいずれか一項に記載の組換えポリペプチド。
前記N末端ドメインが、配列番号13、20、21のいずれかに記載のアミノ酸配列に対して少なくとも85%の同一性を有するアミノ酸配列またはその断片を含む、請求項7に記載の組換えポリペプチド。
前記ポリペプチドがC末端ドメインを含み、前記C末端ドメインのN末端が前記NBDの最後のRUのC末端に融合されている、請求項1〜9のいずれか一項に記載の組換えポリペプチド。
前記C末端ドメインが、配列番号12、159、または22のいずれかに記載のアミノ酸に対して少なくとも85%の同一性を有するアミノ酸配列またはその断片を含む、請求項10に記載の組換えポリペプチド。
前記N末端ドメインが、配列番号140に記載のアミノ酸配列に対して少なくとも85%の同一性を有するアミノ酸配列またはその断片を含む、請求項14記載の組換えポリペプチド。
C末端ドメインを含み、前記C末端ドメインのN末端が前記NBDの最後のRUのC末端に融合されている、請求項13〜16のいずれか一項に記載の組換えポリペプチド。
前記C末端ドメインが、配列番号141に記載のアミノ酸配列に対して少なくとも85%の同一性を有するアミノ酸配列またはその断片を含む、請求項17に記載の組換えポリペプチド。
前記N末端ドメインが、配列番号144に記載のアミノ酸配列に対して少なくとも85%の同一性を有するアミノ酸配列またはその断片を含む、請求項21に記載の組換えポリペプチド。
C末端ドメインを含み、前記C末端ドメインのN末端が前記NBDの最後のRUのC末端に融合されている、請求項20〜23のいずれか一項に記載の組換えポリペプチド。
前記C末端ドメインが、配列番号145に記載のアミノ酸配列に対して少なくとも85%の同一性を有するアミノ酸配列またはその断片を含む、請求項24に記載の組換えポリペプチド。
前記NBDは、Legionella種細菌またはLegionellales目細菌において天然に生じる順序でRUを含まない、請求項1〜26のいずれかに記載の組換えポリペプチド。
核酸結合ドメイン(NBD)および異種機能ドメインを含む組換えポリペプチドであって、前記NBDは、前記NBDのN末端からC末端へと配列された、標的核酸に特異的に結合する少なくとも三つの反復単位(RU)を含み、各RUがコンセンサス配列:
YK(P/S)EDIIRLASH(D/G)GGSVNLEAVLRL(H/N)(P/S)QL(I/T)(G/R)LG(配列番号156)
を含む、組換えポリペプチド:
前記N末端ドメインが、配列番号148に記載のアミノ酸配列に対して少なくとも85%の同一性を有するアミノ酸配列またはその断片を含む、請求項31記載の組換えポリペプチド。
前記ポリペプチドがC末端ドメインを含み、前記C末端ドメインのN末端が前記NBDの最後のRUのC末端に融合されている、請求項29〜33のいずれか一項に記載の組換えポリペプチド。
前記C末端ドメインが、配列番号149に記載のアミノ酸配列に対して少なくとも85%の同一性を有するアミノ酸配列またはその断片を含む、請求項34記載の組換えポリペプチド。
前記機能ドメインが、酵素、転写活性化因子、転写抑制因子、またはDNAヌクレオチド修飾因子を含む、請求項39〜41のいずれか一項に記載の組換えポリペプチド。
前記IIS型制限酵素がFokIを含み、前記FokIが、配列番号11に記載のアミノ酸配列に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも97%、または少なくとも99%の同一性を有するアミノ酸配列を含む、請求項46に記載の組換えポリペプチド。
前記転写活性化因子が、VP16、VP64、p65、p300触媒ドメイン、TET1触媒ドメイン、TDG、Ldb1自己会合ドメイン、SAM活性化因子(VP64、p65、HSF1)、またはVPR(VP64、p65、Rta)を含む、請求項42に記載の組換えポリペプチド。
前記転写抑制因子が、KRAB、Sin3a、LSD1、SUV39H1、G9A(EHMT2)、DNMT1、DNMT3A-DNMT3L、DNMT3B、KOX、TGF-β誘導早期遺伝子(TIEG)、v-erbA、SID、MBD2、MBD3、RB、またはMeCP2を含む、請求項42記載の組換えポリペプチド。
標的核酸が、PDCD1遺伝子、CTLA4遺伝子、LAG3遺伝子、TET2遺伝子、ETLA遺伝子、HA VCR2遺伝子、CCR5遺伝子、CXCR4遺伝子、TRA遺伝子、TRE遺伝子、E2M遺伝子、アルブミン遺伝子、HEE遺伝子、HEAl遺伝子、TTR遺伝子、NR3Cl遺伝子、CD52遺伝子、ECLllA遺伝子の赤血球特異的エンハンサー、CELE遺伝子、TGFERl遺伝子、SERPINAl遺伝子、感染細胞におけるHEVゲノムDNA、CEP290遺伝子、DMD遺伝子、CFTR遺伝子、またはIL2 RG遺伝子のなかにある、請求項1〜52のいずれかに記載の組換えポリペプチド。
前記機能ドメインが転写活性化因子であり、前記標的核酸配列が遺伝子の発現制御領域に存在し、前記ポリペプチドが遺伝子の発現を増加させる、請求項67〜71のいずれかに記載の方法。
前記転写活性化因子が、VP16、VP64、p65、p300触媒ドメイン、TET1触媒ドメイン、TDG、Ldb1自己会合ドメイン、SAM活性化因子(VP64、p65、HSF1)、またはVPR(VP64、p65、Rta)を含む、請求項72に記載の方法。
前記機能ドメインが転写抑制因子であり、前記標的核酸配列が遺伝子の発現制御領域に存在し、前記ポリペプチドが遺伝子の発現を減少させる、請求項67〜71のいずれか一項に記載の方法。
前記転写抑制因子が、KRAB、Sin3a、LSD1、SUV39H1、G9A(EHMT2)、DNMT1、DNMT3A-DNMT3L、DNMT3B、KOX、TGF-β誘導早期遺伝子(TIEG)、v-erbA、SID、MBD2、MBD3、RB、またはMeCP2を含む、請求項74に記載の方法。
前記遺伝子が、PDCD1遺伝子、CTLA4遺伝子、LAG3遺伝子、TET2遺伝子、ETLA遺伝子、HA VCR2遺伝子、CCR5遺伝子、CXCR4遺伝子、TRA遺伝子、TRE遺伝子、E2M遺伝子、アルブミン遺伝子、HEE遺伝子、HEAl遺伝子、TTR遺伝子、NR3Cl遺伝子、CD52遺伝子、ECLllA遺伝子の赤血球特異的エンハンサー、CELE遺伝子、TGFERl遺伝子、SERPINAl遺伝子、感染細胞におけるHEVゲノムDNA、CEP290遺伝子、DMD遺伝子、CFTR遺伝子、またはIL2RG遺伝子である、請求項67〜75のいずれかに記載の方法。
前記機能ドメインが切断ドメインまたは半切断ドメインを含むヌクレアーゼであり、前記内因性遺伝子が切断によって不活性化される、請求項67〜71のいずれかに記載の方法。
前記ポリペプチドは、前記遺伝子内の第一の標的核酸配列に結合し半切断ドメインを含む第一のポリペプチドであり、前記方法は第二のポリペプチドを導入することを含み、前記第二のポリペプチドは、前記遺伝子内の第二の標的核酸配列に結合し半切断ドメインを含む請求項44に記載のポリペプチドである、請求項78または79に記載の方法。
前記第一の標的核酸配列および前記第二の標的配列が、前記遺伝子において間隔を置いて配置され、前記二つの半切断ドメインが、前記第一および第二の標的核酸配列の間の位置における前記遺伝子配列の切断を媒介する、請求項80に記載の方法。
FokIが、配列番号11に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも97%、または少なくとも99%の配列同一性を有する、請求項82に記載の方法。
前記遺伝子が、PDCD1遺伝子、CTLA4遺伝子、LAG3遺伝子、TET2遺伝子、ETLA遺伝子、HA VCR2遺伝子、CCR5遺伝子、CXCR4遺伝子、TRA遺伝子、TRE遺伝子、E2M遺伝子、アルブミン遺伝子、HEE遺伝子、HEAl遺伝子、TTR遺伝子、NR3Cl遺伝子、CD52遺伝子、ECLllA遺伝子の赤血球特異的エンハンサー、CELE遺伝子、TGFERl遺伝子、SERPINAl遺伝子、感染細胞におけるHEVゲノムDNA、CEP290遺伝子、DMD遺伝子、CFTR遺伝子、またはIL2RG遺伝子である、請求項78〜85のいずれかに記載の方法。
前記外因性核酸が、キメラ抗原受容体(CAR)、α-Lイズロニダーゼ(IDUA)、イズロネート-2-スルファターゼ(IDS)、または第9因子(F9)をコードする、請求項88〜90のいずれかに記載の方法。
前記標的核酸配列が、PDCD1遺伝子、CTLA4遺伝子、LAG3遺伝子、TET2遺伝子、ETLA遺伝子、HA VCR2遺伝子、CCR5遺伝子、CXCR4遺伝子、TRA遺伝子、TRE遺伝子、E2M遺伝子、アルブミン遺伝子、HEE遺伝子、HEAl遺伝子、TTR遺伝子、NR3Cl遺伝子、CD52遺伝子、ECLllA遺伝子の赤血球特異的エンハンサー、CELE遺伝子、TGFERl遺伝子、SERPINAl遺伝子、感染細胞におけるHEVゲノムDNA、CEP290遺伝子、DMD遺伝子、CFTR遺伝子、またはIL2RG遺伝子のなかにある、請求項88〜90のいずれかに記載の方法。
前記ポリペプチドは、前記遺伝子内の第一の標的核酸配列に結合し半切断ドメインを含む第一のポリペプチドであり、前記方法は、前記遺伝子内の第二の標的核酸配列に結合し半切断ドメインを含む請求項44に記載のポリペプチドである第二のポリペプチドを導入することを含む、請求項87〜93のいずれかに記載の方法。
前記第一の標的核酸配列および前記第二の標的配列が、前記対象領域に隣接し、前記二つの半切断ドメインが、前記対象領域における切断を媒介する、請求項94に記載の方法。
FokIが、配列番号11に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも97%、または少なくとも99%の配列同一性を有する、請求項96に記載の方法。
標的DNA配列に特異的に結合するポリペプチドを産生する方法であって、前記標的配列に特異的に結合するDNA結合ドメイン(DBD)を含むポリペプチドを合成することを含み、前記DBDは、その反復単位によって結合されるDNA塩基に基づいて選択され前記標的DNA配列と一致する適切な順序で組み合わされた反復単位を含み、ここで:
前記標的配列がアデニン(A)を含む場合、前記反復単位は、
FSSQQIIRMVSHAGGANNLKAVTANHDDLQNMG(配列番号2)、
LGHKELIKIAARNGGGNNLIAVLSCYAKLKEMG(配列番号89)
に対して少なくとも70%の同一性を有する33〜35アミノ酸長の配列を含むか、または保存的アミノ酸置換を含む配列番号2もしくは配列番号89の配列を含み;
前記標的配列がチミン(T)を含む場合、前記反復単位は、
FNAEQIVRMVSHGGGSKNLKAVTDNHDDLKNMG(配列番号4);
FNAEQIVSMVSNGGGSLNLKAVKKYHDALKDRG(配列番号6);もしくは
FNVEQIVSIVSHGGGSLNLKAVKKYHDVLKDRE(配列番号8)
に対して少なくとも70%の同一性を有する33〜35アミノ酸長の配列を含むか、または保存的アミノ酸置換を含む配列番号4、6もしくは8の配列を含み;
前記標的配列がシトシン(C)を含む場合、前記反復単位は、
FNTEQIVRMVSHDGGSLNLKAVKKYHDALRERK(配列番号7);もしくは
FNAEQIVRMVSHDGGSLNLKAVTDNHDDLKNMG(配列番号9)
に対して少なくとも70%の同一性を有する33〜35アミノ酸長の配列を含むか、または保存的アミノ酸置換を含む配列番号7もしくは9の配列を含み;
前記標的配列がグアニン(G)を含む場合、前記反復単位は、
FNVEQIVRMVSHNGGSKNLKAVTDNHDDLKNMG(配列番号3);
FNAEQIVSMVSNNGGSKNLKAVTDNHDDLKNMG(配列番号5);
FNAEQIVRMVSHKGGSKNLALVKEYFPVFSSFH(配列番号33);もしくは
LGHKELIKIAARNGGGNNLIAVLSCYAKLKEMG(配列番号89)
に対して少なくとも70%の同一性を有する33〜35アミノ酸長の配列を含むか、または保存的アミノ酸置換を含む配列番号3、5、33、もしくは89の配列を含む、
方法。
標的DNA配列に特異的に結合するポリペプチドを産生する方法であって、前記標的配列に特異的に結合するDNA結合ドメイン(DBD)を含むポリペプチドを合成することを含み、前記DBDは、その反復単位によって結合されるDNA塩基に基づいて選択され前記標的DNA配列と一致する適切な順序で組み合わされた反復単位を含み、ここで:
前記標的配列がアデニン(A)を含む場合、前記反復単位は、
FSAKHIVRIAAHIGGSLNIKAVQQAQQALKELG(配列番号32)、
FSAEQIVSIAAHVGGSHNIEAVQKAHQALKELD(配列番号35)、
FSAEQIVRIAAHIGGSHNLKAVLQAQQALKELD(配列番号31)、もしくは
FSAEQIVRIAAHIGGSRNIEATIKHYAMLTQPP(配列番号133)
に対して少なくとも70%の同一性を有する33〜35アミノ酸長の配列を含むか、または保存的アミノ酸置換を含む配列番号32、36、31もしくは133の配列を含み;
前記標的配列がチミン(T)を含む場合、前記反復単位は、
YSSEQIVRVAAHGGGSLNIKAVLQAHQALKELD(配列番号28)、
FSAEQIVHIAAHGGGSLNIKAILQAHQTLKELN(配列番号29)、
FSTEQIVCIAGHGGGSLNIKAVLLAQQALKDLG(配列番号27)、
FSAEQIVSIAAHVGGSHNIEAVQKAHQALKELD(配列番号35)、もしくは
FSAEQIVRIAAHIGGSRNIEATIKHYAMLTQPP(配列番号133)
に対して少なくとも70%の同一性を有する33〜35アミノ酸長の配列を含むか、または保存的アミノ酸置換を含む配列番号28、29、27、35、もしくは133の配列を含み;
前記標的配列がシトシン(C)を含む場合、前記反復単位は、
FSAEQIVSIVAHDGGSRNIEAVQQAQHILKELG(配列番号24)、
FSAEQIVRIAAHDGGSLNIDAVQQAQQALKELG(配列番号26)、もしくは
FSAEQIVRIAAHIGGSHNLKAVLQAQQALKELD(配列番号31)
に対して少なくとも70%の同一性を有する33〜35アミノ酸長の配列を含むか、または保存的アミノ酸置換を含む配列番号24、26、もしくは31の配列を含み;
前記標的配列がグアニン(G)を含む場合、前記反復単位は、
FSAEQIVRIAAHIGGSRNIEAIQQAHHALKELG(配列番号30)、
FSADQIVRIAAHKGGSHNIVAVQQAQQALKELD(配列番号34)、
FSAEQIVSIAAHVGGSHNIEAVQKAHQALKELD(配列番号35)、もしくは
FSAEQIVRIAAHIGGSRNIEATIKHYAMLTQPP(配列番号133)
に対して少なくとも70%の同一性を有する33〜35アミノ酸長の配列を含むか、または保存的アミノ酸置換を含む配列番号30、34、35、もしくは133の配列を含む、
方法。
【発明を実施するための形態】
【0045】
本発明は、ゲノム編集および遺伝子調節を含む、遺伝学的およびエピゲノム的工学のためのポリペプチド、組成物およびそれらの使用方法を提供する。これらのポリペプチドおよび組成物は、対象の標的核酸に結合する核酸結合ドメインを含む。核酸結合ドメインは、Legionellales目細菌ならびにLegionella種およびFrancisella種のような動物病原体由来のタンパク質において同定された反復単位に由来する反復単位を含む。
【0046】
[定義]
本明細書中でポリペプチドの文脈において使用される用語「由来する」とは、特定の供給源(例えばレジオネラのような動物病原体)からのタンパク質の配列に基づく配列を有するポリペプチドを表す。特定の供給源からのタンパク質に由来するポリペプチドは、その特定の供給源(例えばレジオネラのような動物病原体)からのタンパク質のバリアントであり得る。例えば、特定の供給源からのタンパク質に由来するポリペプチドは、それが由来するタンパク質の配列に関して改変された配列を有し得る。特定の供給源からのタンパク質に由来するポリペプチドは、それが由来するタンパク質と少なくとも30%の配列同一性、少なくとも40%の配列同一性、少なくとも50%の配列同一性、少なくとも60% 70%の配列同一性、少なくとも80%の配列同一性、または少なくとも90%の配列同一性を共有する。
【0047】
核酸結合ドメインの文脈で本明細書中で使用される用語「モジュラー」(例えばモジュラー動物病原体由来核酸結合ドメイン(modular animal pathogen derived nucleic acid binding domain:MAP-NBD))は、NBD中に存在する複数の反復単位が、再編成され得、および/または他の反復単位で置き換えられ得、そしてNBDが標的核酸に結合するような順序で編成され得ることを示す。例えば、モジュラー核酸結合ドメイン中の任意の反復単位を、異なる反復単位と取り換えることができる。いくつかの実施形態において、本願明細書に開示される核酸結合ドメインのモジュール性は、特定の反復単位についての標的核酸塩基を、単に別の反復単位に取り換えることによって、切り替えることを可能にする。いくつかの実施形態において、本願明細書に開示される核酸結合ドメインのモジュール性は、特定の反復単位を別の反復単位と交換して、特定の標的核酸に対する反復単位の親和性を増加させることを可能にする。全体として、本明細書中に開示される核酸結合ドメインのモジュール性は、関心対象の任意の核酸配列を正確に標的化することができるゲノム編集複合体の開発を可能にする。
【0048】
本明細書において互換的に使用される用語「ポリペプチド」、「ペプチド」、および「タンパク質」は、任意の長さのアミノ酸のポリマー形態を指し、これには、遺伝的にコードされたアミノ酸および遺伝的にコードされないアミノ酸、化学的または生化学的に修飾または誘導体化されたアミノ酸、および修飾ポリペプチド骨格を有するポリペプチドが含まれ得る。該用語は融合タンパク質を含み、それには、限定されるものではないが、N末端メチオニン残基を伴うまたは伴わない、異種アミノ酸配列との融合タンパク質、異種および相同的リーダー配列との融合タンパク質;免疫学的に標識されたタンパク質;などが含まれる。特定の実施形態では、該用語は、遺伝的にコードされるアミノ酸を含む任意の長さのアミノ酸のポリマー形態を指す。特定の実施形態において、該用語は、異種アミノ酸配列に融合された、遺伝的にコードされたアミノ酸を含む任意の長さのアミノ酸のポリマー形態を指す。
【0049】
用語「異種(heterologous)」は、異なる供給源に由来する構造によって定義される2つの成分を指す。例えば、ポリペプチドに関連して、「異種」ポリペプチドは、異なるポリペプチドに由来する、作動可能に連結されたアミノ酸配列を含み得る(例えば、NBDおよび異なる供給源に由来する機能ドメイン)。同様に、キメラポリペプチドをコードするポリヌクレオチドに関して、「異種」ポリヌクレオチドは、異なる遺伝子に由来し得る、作動可能に連結された核酸配列を含み得る。他の例示的な「異種」核酸は、コード配列を含む核酸が、そのコード配列とは異なる遺伝子起源からの調節エレメント(例えばプロモーター)に作動可能に連結されている発現コンストラクトを含む(例えば、プロモーター、コード配列、またはその両方とは異なる遺伝子起源であり得る目的の宿主細胞における発現を提供するために)。組換え細胞の文脈において、「異種」は、それが存在する宿主細胞とは異なる遺伝的起源の核酸(またはポリペプチドなどの遺伝子産物)の存在を表し得る。
【0050】
用語「作動可能に連結されている」は、所望の機能を提供するための分子間の連結を指す。例えば、核酸の文脈における「作動可能に連結されている」は、核酸配列間の機能的連結を指す。例として、核酸発現制御配列(プロモーター、シグナル配列、または一並びの転写因子結合部位など)が、第二のポリヌクレオチドに作動可能に連結され得、ここで、発現制御配列は、第二のポリヌクレオチドの転写および/または翻訳に影響を与える。ポリペプチドの文脈において、「作動可能に連結されている」とは、ポリペプチドの記述される活性を提供するためのアミノ酸配列(例えば、異なるドメイン)間の機能的連結を意味する。
【0051】
本明細書中で使用される、用語「切断(cleavage)」とは、核酸、例えばDNA分子の共有結合骨格の切断を指す。切断は、限定されるものではないが、ホスホジエステル結合の酵素的または化学的加水分解を含む種々の方法によって開始され得る。一本鎖切断と二本鎖切断の両方が可能であり、二本鎖切断は2つの異なる一本鎖切断の結果として起こりうる。DNAが切断されると、平滑末端または突出末端(staggered ends)ができる。特定の実施形態において、本明細書において提供されるポリペプチドは、標的化された二本鎖DNA切断のために使用される。
【0052】
「切断半ドメイン」は、第二のポリペプチド(同一であるか異なるかのどちらか)と共に切断活性(好ましくは二本鎖切断活性)を有する複合体を形成するポリペプチド配列である。
【0053】
「標的核酸」「標的配列」または「標的部位」は、本明細書に開示されるNBDなどの結合分子が結合する核酸の部分を規定する核酸配列である。標的核酸は、単離された形態で、または細胞内に存在し得る。標的核酸は、対象領域(region of interest)に存在し得る。「対象領域」は、細胞クロマチンの任意の領域であってよく、例えば、外因性分子に結合することが望まれる遺伝子、または遺伝子内にあるもしくは遺伝子に隣接する非コード配列であってよい。結合は、標的化されたDNA切断および/または標的化された組換え、標的化された活性化もしくは抑制の目的のためであり得る。対象領域は、例えば、染色体、エピソーム、細胞小器官ゲノム(例えば、ミトコンドリア、葉緑体)、または感染ウイルスゲノムに存在し得る。対象領域は、遺伝子のコード領域内、例えばプロモーター配列、リーダー配列、トレーラー配列またはイントロンなどの転写される非コード領域内、またはコード領域の上流もしくは下流のいずれかの非転写領域内にあり得る。対象領域は、単一ヌクレオチド対のような小さいものであってもよいし、長さが2,000ヌクレオチド対にま至るものであってもよいし、ヌクレオチド対の任意の整数値であってもよい。
【0054】
「外因性」分子は、通常は細胞内に存在しないが、1つ以上の遺伝学的、生化学的または他の方法によって細胞内に導入され得る分子である。外因性分子は、例えば、機能不全の内因性分子の機能性バージョン、例えば、その内因性遺伝子に存在する突然変異を欠く遺伝子または遺伝子セグメントを含み得る。外因性核酸は、細胞に導入された感染ウイルスゲノム、プラスミドまたはエピソーム中に存在し得る。外因性分子を細胞に導入する方法は当業者に公知であり、限定されるものではないが、脂質媒介性移入(すなわち、中性およびカチオン性脂質を含むリポソーム)、エレクトロポレーション、直接注射、細胞融合、粒子衝撃、リン酸カルシウム共沈殿、DEAE-デキストラン媒介性移入およびウイルスベクター媒介性移入を含む。
【0055】
対照的に、「内因性」分子は、特定の環境条件下で特定の発生段階にある特定の細胞に通常存在する分子である。例えば、内因性核酸は、染色体、ミトコンドリア、葉緑体もしくは他のオルガネラのゲノム、または天然に存在するエピソーム核酸を含み得る。追加の内因性分子は、タンパク質、例えば、転写因子および酵素を含むことができる。
【0056】
本開示の目的のための「遺伝子」は、遺伝子産物をコードするDNA領域、ならびに遺伝子産物の産生を調節する全てのDNA領域を含み、そのような調節配列はコード配列および/または転写配列に隣接しているか否かを問わない。従って、遺伝子は、プロモーター配列、ターミネーター、リボソーム結合部位および内部リボソームエントリー部位などの翻訳調節配列、エンハンサー、サイレンサー、インシュレーター、境界要素、複製起点、マトリックス付着部位および遺伝子座制御領域を含むが、これらに限定されない。
【0057】
「遺伝子発現」とは、遺伝子に含まれる情報を遺伝子産物に変換することをいう。遺伝子産物は、遺伝子の直接の転写産物であってもよいし、mRNAの翻訳によって産生されるタンパク質であってもよい。遺伝子産物には、キャッピング(例えば、mRNA、tRNA、rRNA、アンチセンスRNA、リボザイム、構造RNA、shRNA、RNAi、miRNA、または任意の他のタイプのRNA)、ポリアデニル化、メチル化および編集などの過程によって修飾されるRNA、ならびにメチル化、アセチル化、リン酸化、ユビキチン化、ADP-リボシル化、ミリストイル化およびグリコシル化などによって修飾されるタンパク質も含まれる。
【0058】
遺伝子発現の「調節」は、遺伝子の活性の変化を意味する。発現の調節は、限定されるものではないが、遺伝子活性化および遺伝子抑制を含み得る。ゲノム編集(例えば、切断、改変、不活化、ドナー組み込み、ランダム突然変異)を用いて発現を調節することができる。遺伝子不活性化とは、ポリペプチドを含まない細胞、または本明細書に記載されるようなポリペプチドによって修飾されていない細胞と比較した場合の遺伝子発現のあらゆる減少を指す。したがって、遺伝子の不活性化は部分的な場合も完全な場合もある。
【0059】
用語 「患者」または「対象(subject)」は、ヒトまたは非ヒト動物(例えば哺乳類)を指すために互換的に使用される。
【0060】
用語「治療する」、「治療すること」、「治療」等は、疾患、障害、もしくは状態またはその症状が診断、観察等された後に、対象が罹患した疾患、障害、もしくは状態の根底にある原因のうちの少なくとも一つ、または対象が罹患した疾患、障害、もしくは状態に関連する症状のうちの少なくとも一つを、一時的または永続的に、除去、低減、抑制、軽減、または改善するように、開始される行為(例えば、異種の機能的ドメインに融合されたNBDを含むポリペプチドまたはそのポリペプチドをコードする核酸を投与すること)を指す。
【0061】
用語「予防する」、「予防すること」、「予防」等は、一般に、特定の疾患、障害または状態を有する傾向がある対象に関連して、その対象が疾患、障害、状態等を発症するリスク(例えば臨床症状がないことによって決定される)を一時的または永続的に予防、抑制、阻害もしくは低減するまたはその発症を遅延させる態様で(例えば疾患、障害、状態またはそれらの症状の発症前に)開始される行為(例えば、異種の機能的ドメインに融合されたNBDを含むポリペプチドまたはそのポリペプチドをコードする核酸を投与すること)を指す。ある場合には、該用語はまた、疾患、障害もしくは状態の進行を遅くすること、または有害または他の望ましくない状態へのそれらの進行を阻害することも指す。
【0062】
フレーズ「治療有効量」とは、単独でまたは薬学的組成物の一部として、そして単回投与または一連の投与の一部として、患者に投与されたときに、疾患、障害または状態の症状、側面、または特徴に対して検出可能な正の効果を有することができる量での、対象への薬剤の投与を指す。治療的有効量は、関連する生理学的効果を測定することによって確認することができる。
【0063】
[動物病原体由来核酸結合ドメイン]
本開示は、モジュラー式の核酸結合ドメイン (NBD) およびモジュラーNBDを使用する方法を提供する。モジュラーNBDは、特定の核酸配列に標的化および結合するように操作することができる。核酸配列は、DNAまたはRNAであり得る。いくつかの実施形態において、モジュラーNBDは、複数の反復ドメインを含むことができ、ここで各反復ドメインは、単一のヌクレオチドまたは塩基対を認識し、結合する。複数の反復ドメイン中の各反復ドメインは、特定の核酸配列を標的化し結合するように特異的に選択することができ、そのようにしてNBDのモジュール的性質に貢献する。動物病原体タンパク質 (MAP-NBD) 由来の非天然型モジュラー核酸結合ドメインは、複数の反復単位を含むことができ、その複数の反復単位のうちの反復単位は、単一の標的ヌクレオチド、塩基対、またはその両方を認識する。
【0064】
ある態様において、反復ドメインは、動物病原体に由来することができ、動物病原体タンパク質に由来する非天然型モジュラー核酸結合ドメイン(MAP-NBD)、あるいは「モジュラー動物病原体-核酸結合ドメイン」(MAP-NBD)と称され得る。例えば、ある場合には、動物病原体はグラム陰性細菌属Legionellaに由来し得る。他の場合には、動物病原体はBurkholderia属からの細菌であり得る。ある場合には、動物病原体はParaburkholderia属からの細菌であり得る。他の場合には、動物病原体はFrancisella属からの細菌であり得る。
【0065】
特定の局面において、MAP-NBDのようなNBDは、動物病原体L. quateirensisに由来するRUを含む。特定の局面において、RUは、L. quateirensisからのタンパク質において同定されるRUに由来するものであり、そのタンパク質は配列番号1に記載のアミノ酸配列を有する。
【0066】
反復(repeat)単位に関して、用語「反復」、「反復単位、」、「反復モチーフ、」、「反復ドメイン」、および「反復配列」は互換的にに使用される。
【0067】
特定の実施形態では、反復ドメインは、Legionellales細菌、Legionella属の種、例えばL. quateirensisまたはL. maceachernii、Burkholderia属、Paraburkholderia属、またはFrancisella属などのレジオネラ属の種であるレジオネラ目細菌に由来し得る。いくつかの実施形態において、反復ドメインは、19個のアミノ酸残基から36個のアミノ酸残基、例えば、19〜35個のアミノ酸、20〜36個のアミノ酸、30〜36個のアミノ酸、31〜36個のアミノ酸、32〜36個のアミノ酸、33〜35個のアミノ酸、または33〜36個のアミノ酸を含むことができる。特定の実施形態では、反復ドメインは33アミノ酸残基を含むことができる。他の実施形態では、反復単位は35アミノ酸残基を含むことができる。いくつかの実施形態において、MAP-NBDは、天然に存在せず、標的核酸を認識するためにMAP-NBDのN末端からC末端に配列された複数の反復単位を含む。
【0068】
一部の実施形態では、反復ドメインは、以下の配列を有するL. quateirensisタンパク質由来のものであり得る。
MPDLELNFAIPLHLFDDETVFTHDATNDNSQASSSYSSKSSPASANARKRTSRKEMSGPPSKEPANTKSRRANSQNNKLSLADRLTKYNIDEEFYQTRSDSLLSLNYTKKQIERLILYKGRTSAVQQLLCKHEELLNLISPDGLGHKELIKIAARNGGGNNLIAVLSCYAKLKEMGFSSQQIIRMVSHAGGANNLKAVTANHDDLQNMGFNVEQIVRMVSHNGGSKNLKAVTDNHDDLKNMGFNAEQIVRMVSHGGGSKNLKAVTDNHDDLKNMGFNAEQIVSMVSNNGGSKNLKAVTDNHDDLKNMGFNAEQIVSMVSNGGGSLNLKAVKKYHDALKDRGFNTEQIVRMVSHDGGSLNLKAVKKYHDALRERKFNVEQIVSIVSHGGGSLNLKAVKKYHDVLKDREFNAEQIVRMVSHDGGSLNLKAVTDNHDDLKNMGFNAEQIVRMVSHKGGSKNLALVKEYFPVFSSFHFTADQIVALICQSKQCFRNLKKNHQQWKNKGLSAEQIVDLILQETPPKPNFNNTSSSTPSPSAPSFFQGPSTPIPTPVLDNSPAPIFSNPVCFFSSRSENNTEQYLQDSTLDLDSQLGDPTKNFNVNNFWSLFPFDDVGYHPHSNDVGYHLHSDEESPFFDF (配列番号1)。
【0069】
本明細書の実施例8に示されるように、このL. quateirensisタンパク質において反復単位が同定された。XanthomonasからのTALEタンパク質に見出される反復は、12番目および13番目の位置以外の位置で高度に保存されたアミノ酸配列を有する。Xanthomonas TALEタンパク質における反復の12番目および13番目の位置にあるアミノ酸は、反復可変二残基 (RVD) と称されるが、これは、Xanthomonas TALEタンパク質における反復の間で、ほとんどの場合、これら二つの位置に存在するアミノ酸のみが変化しているからである。対照的に、このL. quateirensisタンパク質において同定された反復単位は、12番目および13番目アミノ酸位置の外にも配列バリエーションを追加的に有する。しかしながら、実施例8に示されるように、本明細書に開示されるRU中の12番目および13番目の位置に存在するアミノ酸は、特定の塩基への結合を媒介する。これらの残基は、本明細書中、塩基接触残基 (BCR) と呼ばれる。
【0070】
いくつかの実施形態において、L. quateirensisタンパク質からの反復は、XanthomonasからのTALEタンパク質からの反復におけるRVDのものと同じ二残基の配列を有するBCRを含むことができる。そのようなBCRは、標準(canonical)BCRと呼ばれる。いくつかの実施形態において、標準BCRは、残基NN、NG、またはHDを含むことができる。いくつかの実施形態において、L. quateirensisタンパク質からの反復は、XanthomonasからのTALEタンパク質からの反復におけるRVDとは異なる残基の配列を有するBCRを含むことができる。このようなBCRは、非標準BCRと呼ばれる。いくつかの実施形態において、非標準BCRは、残基RN、HA、HN、HG、またはHKを含むことができる。
【0071】
いくつかの実施形態において、配列番号89の反復は、BCR RNを含み、塩基グアニン(G) を認識する。ある態様において、配列番号2の反復は、BCR HAを含み、主に塩基アデニン(A) を認識する。いくつかの実施形態において、配列番号3の反復は、BCR HNを含み、塩基Gを認識する。いくつかの実施形態において、配列番号4の反復は、BCR HGを含み、塩基チミン(T) を認識する。いくつかの実施形態において、配列番号5の反復は、BCR NNを含み、塩基Gを認識する。いくつかの実施形態において、配列番号6の反復は、BCR NGを含み、塩基Tを認識する。いくつかの実施形態において、配列番号7の反復は、BCR HDを含み、塩基シトシン(C) を認識する。いくつかの実施形態において、配列番号8の反復は、BCR HGを含み、塩基Tを認識する。いくつかの実施形態において、配列番号9の反復は、BCR HDを含み、塩基Cを認識する。いくつかの実施形態において、配列番号10の半反復は、BCR HKを含み、塩基Gを認識する。
【0072】
図2は、核酸結合反復ドメインが由来するL. quateirensisからのタンパク質を示す。配列番号1は、完全なタンパク質を示し、配列番号2〜配列番号10および配列番号89の反復を含む。
表1は、本開示のMAP-NBDを構成し得るLegion対立遺伝子、L.quateirensis、L. maceachernii Burkholderia、ParaburkholderiaまたはFrancisellaからの例示的反復を示す。特定の反復のBCR (すなわち、位置12および13に存在するアミノ酸)も示されている。本開示のMAP-NBDは、表1に開示された反復のうちの少なくとも1つを含むことができる。本開示のMAP-NBDは、表1に開示された反復の任意の組み合わせを含むことができる。
【0073】
表1は、本開示のMAP-NBDを構成し得るLegionalleles、L. quateirensis、L. maceachernii、Burkholderia、Paraburkholderia、またはFrancisellaからの代表的反復を示す。特定の反復のBCR(すなわち12番目および13番目の位置に存在するアミノ酸)も示している。本開示のMAP-NBDは、表1に開示される反復の少なくとも1つを含み得る。本開示のMAP-NBDは、表1に開示される反復の任意の組合せを含み得る。
【表1】
【0074】
配列番号2〜10、23〜89、および114〜137の動物病原体由来反復ドメインのいずれにおいても、BCRの配列バリエーションに加えて、MAP-NBDの反復間にかなりの配列分岐が存在し得る。本明細書に記載されるRUにおける、12番目および13番目のアミノ酸位置の外の配列の保存の欠如は、12番目および13番目のアミノ酸位置以外の配列がほとんど保存された反復を含むTALEタンパク質とは対照的である。
【0075】
いくつかの実施形態において、本開示のMAP-NBDは、1から50の動物病原体由来反復ドメイン、例えば9から36の間、12から30の間、5から10の間、10から15の間、15から20の間、20から25の間、25から30の間、30から35の間の動物病原体由来反復ドメイン、または35から40の動物病原体由来反復ドメインを含むことができる。特定の態様では、本明細書に記載されるMAP-NBDは、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40の動物病原体由来反復ドメインを含むことができる。
【0076】
動物病原体由来反復ドメインは、野生型反復ドメイン、例えば配列番号2〜10、23〜89、114〜138、および151〜152のいずれかに由来し得る。動物病原体由来反復ドメインはまた、ヌクレオチドまたは塩基対の特異的認識のために増強された改変動物病原体由来反復ドメインを含むことができる。本明細書に記載されるMAP-NBDは、1つ以上の野生型動物病原体由来反復ドメイン、1つ以上の改変動物病原体由来反復ドメイン、またはそれらの組み合わせを含むことができる。ある態様において、改変された動物病原体由来反復ドメインは、特定の核酸塩基または塩基対の認識を増強し得る1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、または29の突然変異を含み得る。いくつかの実施形態において、改変動物病原体由来反復ドメインは、1個超の改変、例えば、1〜5の改変、5〜10の改変、10〜15の改変、15〜20の改変、20〜25の改変、または25〜29の改変を含むことができる。いくつかの実施形態において、MAP-NBDは、複数の改変動物病原体由来反復ドメインを含むことができ、改変動物病原体由来反復ドメインの各々は、異なる数の改変を有することができる。
【0077】
いくつかの実施形態において、本開示のMAP-NBDは、天然のL. quateirensis由来タンパク質の天然のN末端の全長、例えば配列番号1のN末端を有することができる。N末端は、完全長のN末端配列であってよく、以下の配列を有し得る:MPDLELNFAIPLHLFDDETVFTHDATNDNSQASSSYSSKSSPASANARKRTSRKEMSGPPSKEPANTKSRRANSQNNKLSLADRLTKYNIDEEFYQTRSDSLLSLNYTKKQIERLILYKGRTSAVQQLLCKHEELLNLISPDG(配列番号13)。いくつかの実施形態において、配列番号13の任意の切り詰めを、本開示のMAP-NBDにおけるN末端として使用することができる。例えば、いくつかの実施形態において、MAP-NBDは、以下のように、天然のL. quateirensis N末端の位置15 (D) 〜位置143 (G) におけるアミノ酸残基を含む、切り詰められたN末端を含む:DATNDNSQASSSYSSKSSPASANARKRTSRKEMSGPPSKEPANTKSRRANSQNNKLSLADRLTKYNIDEEFYQTRSDSLLSLNYTKKQIERLILYKGRTSAVQQLLCKHEELLNLISPDG(配列番号20)。いくつかの実施形態において、MAP-NBDは、以下のように、天然のL. quateirensis N末端の位置29 (N) 〜位置143 (G)にあるアミノ酸残基を含む切り詰められたN末端を含む:
NSQASSSYSSKSSPASANARKRTSRKEMSGPPSKEPANTKSRRANSQNNKLSLADRLTKYNIDEEFYQTRSDSLLSLNYTKKQIERLILYKGRTSAVQQLLCKHEELLNLISPDG (配列番号21)。いくつかの実施形態において、天然に存在するL.quateirensis N末端の任意の切り詰めが、本明細書に開示されるNBDのN末端で使用され得る。天然に存在するL. quateirensisのN末端は、位置1〜50、1〜70、1〜100、1〜120、1〜130、10〜40、60〜100、または100〜120のアミノ酸残基に切り詰められて、MAP-NBDのN末端で使用され得る。
【0078】
いくつかの態様において、本開示は、動物病原体由来反復ドメインを同定するための方法を提供する。例えば、第1の反復モチーフ、スペーサー、および第2の反復モチーフを含むコンセンサス配列を定義することができる。コンセンサス配列は、1xxx211x1xxx33x2x1xxxxxxxxx1xxxx1xxx211x1xxx33x2x1xxxxxxxxx1 (配列番号: 14)、1xxx211x1xxx33x2x1xxxxxxxxx1xxxxx1xxx211x1xxx33x2x1xxxxxxxxx1 (配列番号: 15)、1xxx211x1xxx33x2x1xxxxxxxxx1xxxxxx1xxx211x1xxx33x2x1xxxxxxxxx1 (配列番号: 16)、1xxx211x1xxx33x2x1xxxxxxxxx1xxxxxxx1xxx211x1xxx33x2x1xxxxxxxxx1 (配列番号: 17)、1xxx211x1xxx33x2x1xxxxxxxxx1xxxxxxxx1xxx211x1xxx33x2x1xxxxxxxxx1 (配列番号: 18)であり得る。配列番号14〜配列番号18のいずれについても、xは任意のアミノ酸残基であり得、1、2、および3は以下のように定義される柔軟な残基である:1はA、F、I、L、M、T、またはVのいずれかから選択され得、2はD、E、K、N、M、S、R、またはQのいずれかから選択され得、そして3はA、G、N、またはSのいずれかから選択され得る。したがって、いくつかの実施形態において、MAP-NBDは、配列番号14、配列番号15、配列番号16、配列番号17、または配列番号18のコンセンサス配列を含む動物病原体に由来し得る。配列番号14〜18のコンセンサス配列のいずれか一つを、NCBI、MGRAST、JGI、およびEBIなどのデータベース中の全配列と比較して、DNA結合反復ドメインの反復単位を含む動物病原体タンパク質に対応するマッチを同定することができる。
【0079】
いくつかの実施形態において、MAP-NBD反復ドメインがそれ自体、1xxx211x1xxx33x2x1xxxxxxxxx1 (配列番号19)のコンセンサス配列を有することができ、ここでxは任意のアミノ酸残基であり得、1、2、および3は以下のように定義される柔軟な残基でありる:1はA、F、I、L、M、T、またはVのいずれかから選択され得、2はD、E、K、N、M、S、R、またはQのいずれかから選択され得、3はA、G、N、またはSのいずれかから選択され得る。
図3Aおよび3Bは、本開示の動物病原性タンパク質に存在する配列番号14〜配列番号18のコンセンサス配列ならびに本開示のMNBDにおける配列番号19のコンセンサス配列を示す。
図3Aは、本開示のMAP-NBDが提供される動物病原体由来タンパク質中に存在し得る配列番号14〜配列番号18のコンセンサス配列を示す。配列番号14〜配列番号18の各コンセンサス配列は、反復モチーフと、それに続く可変長のスペーサーと、第二の反復モチーフとを含む。
図3Bは、配列番号19のコンセンサス配列を示し、これは、本開示の反復ドメイン(例えばMAP-NBD)中に存在し得る。
【0080】
「MAP-NBD」および 「NBD」という用語は、本明細書中で、レジオネラ目細菌またはレジオネラ種もしくはフランシセラ種などの動物病原体からのタンパク質において同定されたRUに由来する配列を有するRUを含むNBDを指すために互換的に使用される。
【0081】
特定の態様において、本開示は、核酸結合ドメイン (NBD) および異種機能ドメインを含む組換えポリペプチドを提供し、NBDは、標的核酸に特異的に結合するようにNBDのN末端からC末端に配列された少なくとも三つの反復単位 (RU) を含み、NBDの各RUは、コンセンサス配列:1xxxx11x12xx33xxx1xxxxxxxxxx14xxxを含み、ここで1= A, F, I, L, M, T, VまたはY;2= xまたはxx;3= A, G, NまたはS;4=x, xxまたはxxx、およびx=任意のアミノ酸であって、各RUは独立して配列番号2〜9、23〜35、85〜89および131〜137のいずれかに記載のアミノ酸配列と少なくとも70% (例えば、少なくとも75%、80%、85%、90%、95%、もしくは99%、または100%)同一である33〜36アミノ酸長の配列を含み、配列番号2〜9、33および89は、L. quateirensis細菌からのタンパク質(配列番号1)において同定された反復単位のアミノ酸配列を提供し、配列番号23〜32、34〜35および133は、L. maceachernii細菌からのタンパク質(配列番号143)において同定された反復単位のアミノ酸配列を提供し、配列番号25、131〜132および138は、レジオネラ目細菌からのタンパク質(配列番号139)において同定された反復単位のアミノ酸配列を提供し、配列番号85〜88、134〜137は、Francisella属細菌からのタンパク質(配列番号147)において同定された反復単位のアミノ酸配列を提供する。ある態様では、半RUが、NBDのC末端に存在し (すなわち、最後のRUの後に)、半RUは、FNAEQIVRMVSHKGGSKNL(配列番号10)に対して少なくとも70%(例えば、少なくとも75%、80%、85%、90%、95%、もしくは99%、または100%)の同一性を有する15〜20アミノ酸長の配列を含み、半RUに存在するBCR (すなわち、位置12および13のアミノ酸)は、HK, HD, HA, HN, HG, NN, NG, RN, HI, HV, RT, HD, SN, HS, GSまたはLNであり得る。
【0082】
特定の局面において、本開示は、核酸結合ドメイン (NBD) および異種機能ドメインを含む組換えポリペプチドを提供し、NBDは、標的核酸に特異的に結合するようにNBDのN末端からC末端に配列された少なくとも三つの反復単位 (RU) を含み、NBDの各RUがコンセンサス配列:(F/L/Y)(D/G/N/S)(A/H/R/S/T/V)(D/E/K/Q)(E/H/Q)(I/L/V)(I/L/V)(C/H/K/R/S)(I/M/V)(A/V)(A/G/S)(H/N/R)(A/D/G/I/K/N/S/V)(G)(G)(A/G/S)(H/K/L/N/R)(N)(I/L)(A/D/E/I/K/V)(A/L/V)(I/M/V)(K/L/Q/T)(A/D/E/K/L/Q/S)(A/C/F/N/V/Y)(F/H/L/Q/Y)(A/D/H/P/Q)(A/D/I/K/R/T/V)(F/L)(K/M/Q/R/S)(D/E/N/S)(F/L/M)(D/E/G/H/K/N)(配列番号154)を含み、ここで、コンセンサス配列は、Legionelles目、L. quateirensis細菌、およびL. maceachernii細菌からのタンパク質において同定され配列番号2〜10、23〜35、85〜89及び131-137に示される配列を有する反復単位のアミノ酸配列に基づく。
【0083】
特定の態様では、本明細書で提供されるNBDは、C末端に半RUをさらに含んでもよく、半RUは、FNAEQIVRMVSX
12X
13GGSKNL(配列番号155)に対して少なくとも70% (例えば、少なくとも75%、80%、85%、90%、95%、もしくは99%、または100%)同一である15〜20アミノ酸長さの配列を含むか、または、一つ以上の保存的アミノ酸置換を伴う配列番号155の配列を有する配列を含み、ここでX
12X
13= HK, HD, HA, HN, HG, NN, NG, RN, HI, HV, RT, HD, SN, HS, GSまたはLNである。
【0084】
特定の局面において、本明細書において提供されるNBD中に存在する少なくとも三つのRUの各々は、独立に、
FSSQQIIRMVSHAGGANNLKAVTANHDDLQNMG(配列番号2);
FNVEQIVRMVSHNGGSKNLKAVTDNHDDLKNMG(配列番号3);
FNAEQIVRMVSHGGGSKNLKAVTDNHDDLKNMG(配列番号4);
FNAEQIVSMVSNNGGSKNLKAVTDNHDDLKNMG(配列番号5);
FNAEQIVSMVSNGGGSLNLKAVKKYHDALKDRG(配列番号6);
FNTEQIVRMVSHDGGSLNLKAVKKYHDALRERK(配列番号7);
FNVEQIVSIVSHGGGSLNLKAVKKYHDVLKDRE(配列番号8);
FNAEQIVRMVSHDGGSLNLKAVTDNHDDLKNMG(配列番号9);
FNAEQIVRMVSHKGGSKNLALVKEYFPVFSSFH(配列番号33);または
LGHKELIKIAARNGGGNNLIAVLSCYAKLKEMG(配列番号89)
に対して少なくとも70%同一(例えば、少なくとも75%、80%、85%、90%、95%、もしくは99%、または100%同一)である33〜36アミノ酸長の配列を含み、
【0085】
それぞれアミノ酸位置12及び13において、HK, HD, HA, HN, HG, NN, NG, RN, HI, HV, RT, HD, SN, HS, GSまたはLNから選択されるBCRを含む(配列番号2〜9、33、及び89のいずれか1つに対する番号付け)。特定の局面において、NBD中に存在するRUは、一つ以上の保存的アミノ酸置換を伴う配列番号2〜9、33、および89のいずれかのアミノ酸配列を有し得る。特定の局面において、本明細書に開示されるRUのアミノ酸位置12および13に存在するBCRは、別のBCRまたはRVDと置換されて、RUが結合する塩基を変化させることができる。
【0086】
特定の態様では、NBDは、本明細書に開示されるように、少なくとも3つのRUと、半反復単位とを含むことができる。特定の局面において、半反復単位は、NBD中の最後の反復(すなわち、標的核酸配列の最後の塩基に結合する最後のRU)として存在し得る。特定の局面において、半RUは、NBDのC末端に存在し(すなわち、最後のRUの後に)、ここで、半RUは、FNAEQIVRMVSHKGGSKNL(配列番号10)に対して少なくとも70% (例えば、少なくとも75%、80%、85%、90%、95%、もしくは99%、または100%)同一である15〜20アミノ酸長の配列を含み、半RU中に存在するBCR(すなわち、位置12および13のアミノ酸) はHK, HD, HA, HN, HG, NN, NG, RN, HI, HV, RT, HD, SN, HS, GSまたはLNであり得る。
【0087】
特定の局面において、NBDは、アデニンに結合しFSSQQIIRMVSX
12X
13GGANNLKAVTANHDDLQNMG(配列番号2)に対して少なくとも70% (例えば、少なくとも75%、80%、85%、90%、95%、もしくは99%、または100%)同一である33〜36アミノ酸長の配列を含むか、またはて一つ以上の保存的アミノ酸置換を伴う配列番号2のアミノ酸配列を含み、ここでX
12X
13=HAである。
【0088】
特定の局面において、NBD中の最初のRU (すなわち、標的核酸配列の第一の塩基に結合する第一のRU)は、LGHKELIKIAARNGGGNNLIAVLSCYAKLKEMG(配列番号89)に対して少なくとも70%の同一性(例えば、少なくとも75%、80%、85%、90%、95%、もしくは99%、または100%の同一性)を有する33〜36アミノ酸長の配列であってもよい。或る態様では、NBDの最初のRUにおけるBCR (すなわち、配列番号89に関して番号付けされた位置12及び位置13のアミノ酸)は、HK, HD, HA, HN, HG, NN, NG, RN, HI, HV, RT, HD, SN, HS, GSまたはLNのうちの一つであり得る。
【0089】
ある態様において、ポリペプチドはN末端ドメインを含み、ここで、N末端ドメインのC末端(すなわち最後のアミノ酸)は、直接的にまたはリンカーを介して、NBDの最初のRUのN末端(すなわち、最初のアミノ酸)に共有結合的に連結される。特定の局面において、N末端ドメインは、配列番号1に示されるアミノ酸配列を有するL. quateirensisタンパク質のN末端であり、配列番号13に示されるアミノ酸配列を有してもよい。特定の局面において、N末端ドメインは、配列番号13の断片、例えば配列番号20または21に記載のアミノ酸配列を有する断片を含む。ある態様において、N末端ドメインは、一つ以上の保存的アミノ酸置換を伴う配列番号13、20または21のアミノ酸配列を含むポリペプチドである。特定の局面において、N末端ドメインは、配列番号13、20または21のいずれかのアミノ酸配列と少なくとも85% (例えば、少なくとも90%、95%、もしくは99%、または100%)同一であるアミノ酸配列を含むポリペプチドである。特定の局面において、N末端ドメインは、Burkholderia、Paraburkholderia、またはXanthomonasにおいて発現されるもののようなTALEタンパク質からのNキャップドメインまたはその断片である。
【0090】
特定の局面において、ポリペプチドはC末端ドメインを含み、ここで、C末端ドメインのN末端(すなわち、最初のアミノ酸)は、直接的にまたはリンカーを介して、NBDにおける最後のRUまたは(もしあれば)半反復単位のC末端(すなわち最後のアミノ酸)に共有結合的に連結される。特定の局面において、C末端ドメインは、配列番号1に示されるアミノ酸配列を有するL. quateirensisタンパク質のC末端であり、配列番号12または配列番号159に示されるアミノ酸配列を有してもよい。特定の局面において、C末端ドメインは、配列番号12の断片を含み、例えば配列番号22に記載のアミノ酸配列を有する断片を含む。特定の局面において、C末端ドメインは、一つ以上の保存的アミノ酸置換を伴う配列番号12、159または22のアミノ酸配列を含むポリペプチドである。特定の局面において、C末端ドメインは、配列番号:12、159または22のいずれかのアミノ酸配列に対して少なくとも85% (例えば、少なくとも90%、95%、もしくは99%、または100%)同一であるアミノ酸配列を含むポリペプチドである。特定の局面において、C末端ドメインは、Burkholderia、Paraburkholderia、またはXanthomonasで発現されるもののようなTALEタンパク質からのCキャップドメインまたはその断片である。
【0091】
特定の局面において、本明細書に開示されるポリペプチドのNBD中に存在する三つ以上のRUの各々は、独立に、
FKADDAVRIACRTGGSHNLKAVHKNYERLRARG (配列番号131);
FNADQVIKIVGHDGGSNNIDVVQQFFPELKAFG (配列番号132);
FSADQVVKIAGHSGGSNNIAVMLAVFPRLRDFG (配列番号138);または
LDRQQILRIASHDGGSKNIAAVQKFLPKLMNFG (配列番号25)
に対して少なくとも70% (例えば、少なくとも75%、80%、85%、90%、95%、もしくは99%、または100%)同一である33〜36アミノ酸長の配列を含み、
【0092】
配列番号25、131、132及び138のうちの一つに対してそれぞれ番号付けされたアミノ酸位置12及び13において、HK, HD, HA, HN, HG, NN, NG, RN, HI, HV, RT, HD, SN, HS, GSまたはLNから選択されるBCRを含むことができる。特定の局面において、三つ以上のRUの各々は、独立して、一つ以上の保存的アミノ酸置換を伴う配列番号25、131、132および138のうちの一つの配列を有し得る。表1に示すように、配列番号25、131、132および138は、Legionellales目細菌からのタンパク質において同定された反復単位である。このLegionellales細菌タンパク質は、次のアミノ酸配列を有する:MPKTKITTVSHGYDLDLMSSLPNGDPNQAKQGKIYLSGNGVYVVRDVAGIVHRGQLEFAINLEQLEQKINEPAFKAVILEKTSRAVGYTISNECFNVELNALAKAGFNNLDIDKLIFRRSSRGTVQTVLNSYNILLEKPYNLDRQQILRIASHDGGSKNIAAVQKFLPKLMNFGFNADQVIKIVGHDGGSNNIDVVQQFFPELKAFGFSADQVVKIAGHSGGSNNIAVMLAVFPRLRDFGFKADDAVRIACRTGGSHNLKAVHKNYERLRARGYDNKKIISIAASNCGTETINTIMSTDEVEESDFLYFVTTVSTPVASQNLSSASNTNINYSNRFMTARKKTSDDNTDEVEEDQHRDKRRSNGR(配列番号139)
【0093】
このタンパク質において同定されたRUは、
図7において配列番号25、131、132および138によって示されている。
【0094】
ある態様において、ポリペプチドはN末端ドメインを含み、ここで、N末端ドメインのC末端(すなわち最後のアミノ酸)は、直接的にまたはリンカーを介して、NBDの最初のRUのN末端(すなわち、最初のアミノ酸)に共有結合的に連結される。特定の局面において、N末端ドメインは、配列番号140に記載のアミノ酸配列に対して少なくとも85% (例えば、少なくとも90%、95%、もしくは99%、または100%)の同一性のアミノ酸配列またはその断片を含む。配列番号140は、
図7に示すように配列番号25の反復に対してN末端にあるアミノ酸配列を規定する。配列番号140の断片は、配列番号140のN末端から約10、20または30個のアミノ酸を排除し得る。ある態様において、N末端ドメインは、一つ以上の保存的アミノ酸置換を伴う配列番号13、20、21、140のアミノ酸配列を含むポリペプチドである。特定の局面において、N末端ドメインは、配列番号13、20、21または140のいずれかのアミノ酸配列に対して少なくとも85% (例えば、少なくとも90%、95%、もしくは99%、または100%)の同一性のアミノ酸配列を含むポリペプチドである。特定の局面において、N末端ドメインは、Burkholderia、Paraburkholderia、またはXanthomonasにおいて発現されるもののようなTALEタンパク質からのNキャップドメインまたはその断片である。
【0095】
特定の局面において、ポリペプチドはC末端ドメインを含み、ここで、C末端ドメインのN末端(すなわち、最初のアミノ酸)は、直接的にまたはリンカーを介して、NBDにおける最後のRUまたは(もしあれば)半反復単位のC末端(すなわち最後のアミノ酸)に融合される。ある態様において、C末端ドメインは、配列番号139に記載のアミノ酸配列を有するLegionellales細菌タンパク質のC末端であり、配列番号141に記載のアミノ酸配列を有していてもよい。配列番号141は、
図7に示されるように、配列番号131の最後の反復に対してC末端にあるアミノ酸配列を規定する。配列番号141の断片は、配列番号141のC末端から約10個、20個、または25個のアミノ酸を除外し得る。特定の局面において、C末端ドメインは、配列番号142に記載のアミノ酸配列を有する断片などの、配列番号141の断片を含む。特定の局面において、C末端ドメインは、一つ以上の保存的アミノ酸置換を伴う配列番号141または142のアミノ酸配列を含むポリペプチドである。特定の局面において、C末端ドメインは、配列番号141または142のいずれかのアミノ酸配列に対して少なくとも85% (例えば、少なくとも90%、95%、もしくは99%、または100%)の同一性のアミノ酸配列を含むポリペプチドである。特定の局面において、C末端ドメインは、Burkholderia、Paraburkholderia、またはXanthomonasで発現されるもののようなTALEタンパク質からのCキャップドメインまたはその断片である。
【0096】
ある態様において、C末端ドメインは、一つ以上の保存的アミノ酸置換を伴う配列番号12、159、22、141または142のアミノ酸配列を含むポリペプチドである。特定の局面において、C末端ドメインは、配列番号12、159、22、141または142のいずれかのアミノ酸配列に対して少なくとも85% (例えば、少なくとも90%、95%、もしくは99%、または100%)の同一性のアミノ酸配列を含むポリペプチドである。特定の局面において、C末端ドメインは、Burkholderia、Paraburkholderia、またはXanthomonasで発現されるもののようなTALEタンパク質からのCキャップドメインまたはその断片である。
【0097】
特定の局面において、本明細書に開示されるポリペプチドのNBD中に存在する三つ以上のRUの各々は、独立に、
FSAEQIVRIAAHDGGSRNIEAVQQAQHVLKELG(配列番号23);
FSAEQIVSIVAHDGGSRNIEAVQQAQHILKELG(配列番号24);
FSAEQIVRIAAHDGGSLNIDAVQQAQQALKELG(配列番号26);
FSTEQIVCIAGHGGGSLNIKAVLLAQQALKDLG(配列番号27);
YSSEQIVRVAAHGGGSLNIKAVLQAHQALKELD(配列番号28);
FSAEQIVHIAAHGGGSLNIKAILQAHQTLKELN(配列番号29);
FSAEQIVRIAAHIGGSRNIEAIQQAHHALKELG(配列番号30);
FSAEQIVRIAAHIGGSHNLKAVLQAQQALKELD(配列番号31);
FSAKHIVRIAAHIGGSLNIKAVQQAQQALKELG(配列番号32);
FSADQIVRIAAHKGGSHNIVAVQQAQQALKELD(配列番号34);
FSAEQIVSIAAHVGGSHNIEAVQKAHQALKELD(配列番号35);または
FSAEQIVRIAAHIGGSRNIEATIKHYAMLTQPP(配列番号133)
に対して少なくとも70% (例えば、少なくとも75%、80%、85%、90%、95%、もしくは99%、または100%)同一である33〜36アミノ酸長の配列を含み、
【0098】
配列番号23〜24、26〜32、34〜35及び133のいずれかに対応してそれぞれ番号付けられたアミノ酸位置12及び13においてHK, HD, HA, HN, HG, NN, NG, RN, HI, HV, RT, HD, SN, HS, GSまたはLNから選択されるBCRを含む。特定の局面において、三つ以上のRUの各々は、独立に、一つ以上の保存的アミノ酸置換を伴う配列番号23〜24、26〜32、34〜35、および133のうちの一つの配列を有し得る。
【0099】
配列番号23〜24、26〜32、34〜35および133に記載されているRUは、L. maceacherniiからのタンパク質において同定された。このタンパク質のアミノ酸配列は、以下の配列番号143に規定される:
【0101】
L. maceacherniiからのタンパク質において同定された12個のRUは、下線によって示されており、それぞれ、配列番号28、26、32、34、30、31、23、29、24、27、35、および133に記載のアミノ酸配列を含む。
【0102】
特定の局面において、ポリペプチドは、N末端ドメインを含み、ここで、N末端ドメインのC末端は、直接的にまたはリンカーを介して、NBDの第1のRUのN末端に融合される。特定の局面において、N末端ドメインは、配列番号144に記載のアミノ酸配列に対して少なくとも85% (例えば、少なくとも90%、95%、もしくは99%、または100%)の同一性のアミノ酸配列またはその断片を含む。配列番号144は、配列番号143における配列番号28の反復に対してN末端であるアミノ酸配列を規定し、以下の配列を有する:
【0103】
MPKTNQPKNLEAKSTKNKISLPQDPQTLNELKIKGYPQDLAERLIKKGSSLAVKTVLKDHEQLVNFFTHLQIIRMAAQKGGAKNITTALNEYNSLTNLG (配列番号144)
【0104】
配列番号144の断片は、配列番号144のN末端から約10、20または30個のアミノ酸を排除し得る。特定の局面において、N末端ドメインは、一つ以上の保存的アミノ酸置換を伴う配列番号13、20、21,140または144のアミノ酸配列を含むポリペプチドである。特定の局面において、N末端ドメインは、配列番号13、20、21、140または144のいずれかのアミノ酸配列に対して少なくとも85% (例えば、少なくとも90%、95%、もしくは99%、または100%)の同一性のアミノ酸配列を含むポリペプチドである。特定の局面において、N末端ドメインは、Burkholderia、Paraburkholderia、またはXanthomonasにおいて発現されるもののようなTALEタンパク質からのN-キャップドメインまたはその断片である。
【0105】
特定の局面において、ポリペプチドは、C末端ドメインを含み、ここで、C末端ドメインのN末端は、直接的にまたはリンカーを介して、NBDにおける最後のRUまたは(もしあれば)半反復単位のC末端に融合される。ある態様において、C末端ドメインは、配列番号143に記載のアミノ酸配列を有するL. maceacherniiタンパク質のC末端であり、配列番号145に記載のアミノ酸配列を有してもよい。配列番号145は、配列番号143における配列番号133の最後の反復に対してC末端にあるアミノ酸配列を規定し、以下の配列を有する:
【0106】
YMLSQEQFLRLIDHHSGHLNLSILLDEQQWQAINDLCLQPHHFGRQNALEKFLQQGQRKYQNLQELEQFLFQDSADPMLLQETENQHEAEKINDCMDFILRLISATEPLDLQIEIEGIGLFSPSMHFDATQANFSTPAANEEKIDNSATEAGVNSRKRKIAAAHQKQPPRKKTATPLSATFISTLTTLAQSDNPRLEMASAEALMLKAPQKLAMGITVRKKTKCEGIAIITVTDKTKLNGWLSSASESTYSSVEAQGTRTVNNTHAFFSTPLTSDKKSPSFSSLDFYEDSGLGFDEEITNPPYMPELEPEFIL (配列番号145)
【0107】
配列番号145の断片は、配列番号145のC末端から約10個、20個、または25個のアミノ酸を排除し得る。特定の局面において、C末端ドメインは、配列番号145の断片、例えば配列番号146に記載のアミノ酸配列を有する断片を含む。特定の局面において、C末端ドメインは、一つ以上の保存的アミノ酸置換を伴う配列番号145または146のアミノ酸配列を含むポリペプチドである。特定の局面において、C末端ドメインは、配列番号145または146のいずれかのアミノ酸配列に対して少なくとも85%の同一性のアミノ酸配列を含むポリペプチドである。特定の局面において、C末端ドメインは、Burkholderia、Paraburkholderia、またはXanthomonasで発現されるもののようなTALEタンパク質からのC-キャップドメインまたはその断片である。
【0108】
特定の局面において、配列番号143に示される配列を有するL. maceacherniiタンパク質に由来するN末端ドメインまたはC末端ドメインを使用して、NBDを含むポリペプチドを構築することができ、ここで、N末端ドメインは、配列GまたはG-Gへの結合を媒介する。配列番号143に示される配列を有するL. maceacherniiタンパク質に由来するN末端ドメインおよびC末端ドメインの一方または両方を含むことに加えて、ポリペプチドは、複数の反復を含むことができ、各反復は、それぞれ塩基T、C、A、G、G、AまたはC、C、T、C、T、GまたはA、およびAまたはGに結合するために配列番号28、26、32、34、30、31、23、29、24、27、35、および133の一つ以上から独立に由来する配列を有する。
【0109】
或る態様では、NBDおよび異種機能ドメインを含む組換えポリペプチドであって、NBDのN末端からC末端に配列された少なくとも三つの反復単位(RU) を含み、標的核酸に特異的に結合すし、各RUがコンセンサス配列:
YK(P/S)EDIIRLASH(D/G)GGSVNLEAVLRL(H/N)(P/S)QL(I/T)(G/R)LG (配列番号156)を含むものが提供される。このコンセンサス配列は、以下のアミノ酸配列を有するFrancisella細菌タンパク質において同定される反復に基づく:
【0111】
配列番号147に存在するRUは、配列番号85〜87、134〜137および151に示されるアミノ酸配列を有し、配列番号147に存在する半RUは、配列番号152に示されるアミノ酸配列を有する。これらのRUは、上記の配列番号147における下線によって示される。配列番号151に記載のアミノ酸配列を有するRU(
によって示される)は、配列番号147に一度存在する。配列番号86に記載のアミノ酸配列を有するRU(
によって示される)は、配列番号147に一度存在する。配列番号85(
によって示される)は、配列番号147において二回生じる。配列番号87に記載のアミノ酸配列を有するRU(
によって示される)は、配列番号147に三度存在する。配列番号88に記載のアミノ酸配列を有するRU(
によって示される)は、配列番号147に三度存在する。配列番号134に記載のアミノ酸配列を有するRU(
によって示される)は、配列番号147に一度存在する。配列番号135に記載のアミノ酸配列を有するRU(
によって示される)は配列番号147に二度存在する。配列番号136に記載のアミノ酸配列を有するRU(
によって示される)は、配列番号147の配列中に二度存在する。
【0112】
特定の局面において、本明細書に開示される組換えポリペプチドのNBDは、三つのRUを含むことができ、各RUは、独立して、以下のものに対して少なくとも70% (例えば、少なくとも75%、80%、85%、90%、95%、もしくは99%、または100%)の同一性を有する33〜36アミノ酸長の配列を含み:
YKSEDIIRLASHDGGSVNLEAVLRLHSQLTRLG (配列番号85);
YKPEDIIRLASHGGGSVNLEAVLRLNPQLIGLG (配列番号86);
YKSEDIIRLASHGGGSVNLEAVLRLHSQLTRLG (配列番号87);
YKSEDIIRLASHGGGSVNLEAVLRLNPQLIGLG (配列番号88);
YKSEDIIRLASHDGGSVNLEAVLRLNPQLIGLG (配列番号 134);
YKSEDIIRLASHDGGSINLEAVLRLNPQLIGLG (配列番号 135);
YKSEDIIRLASSNGGSVNLEAVLRLNPQLIGLG (配列番号 136);
YKSEDIIRLASSNGGSVNLEAVIAVHKALHSNG (配列番号 137)または
YKINHCVNLLKLNHDGFMLKNLIPYDSKLTGLG (配列番号 151);かつ
【0113】
配列番号85〜88、134〜137及び151のうちの1つに関して番号付けされたアミノ酸位置12及び13にそれぞれHK、HD、HA、HN、HG、NN、NG、RN、HI、HV、RT、HD、SN、HS、GS又はLNから選択されるBCRを含む。特定の局面において、RUの各々は、独立して、一つ以上の保存的アミノ酸置換を伴う配列番号85〜88、134〜137、および151のいずれか一つのアミノ酸配列を有し得る。
【0114】
特定の態様において、ポリペプチドは、配列番号152 (YNKKQIVLIASGSSGG) に記載されたアミノ酸配列に対して少なくとも70% (例えば、少なくとも75%、80%、85%、90%、95%、もしくは99%、または100%)の同一性を有する15〜20アミノ酸長の配列を含む半RUを含む。特定の態様では、半RUは、配列番号152に関して番号付けされたアミノ酸位置12および13においてそれぞれので、HK、HD、HA、HN、HG、NN、NG、RN、HI、HV、RT、HD、SN、HS、GS、またはLNから選択されるBCRを含むことができる。
【0115】
特定の局面において、ポリペプチドは、N末端ドメインを含み、N末端ドメインのC末端は、NBDの第1のRUのN末端に直接的にまたはリンカーを介して融合される。特定の局面において、N末端ドメインは、配列番号148に記載のアミノ酸配列またはその断片に対して少なくとも85%の同一性のアミノ酸配列を含む。配列番号148は、配列番号147に存在する配列番号86の最初のRUに対してN末端にあるアミノ酸配列である。特定の局面において、N末端ドメインは、配列番号13、20、21、140または144に記載のアミノ酸配列に対して少なくとも85% (例えば、少なくとも90%、95%、もしくは99%、または100%)の同一性のアミノ酸配列を含む。
【0116】
特定の局面において、ポリペプチドは、C末端ドメインを含み、C末端ドメインのN末端は、NBDの最後のRUのC末端に直接的にまたはリンカーを介して融合される。特定の局面において、C末端ドメインは、配列番号149に記載のアミノ酸配列に対して少なくとも85% (例えば、少なくとも90%、95%、もしくは99%、または100%)の同一性のアミノ酸配列またはその断片、例えば配列番号147に記載のアミノ酸配列を含む。特定の局面において、C末端ドメインは、配列番号12、159、22、141、142、145または146のいずれかのアミノ酸配列に対して少なくとも85% (例えば、少なくとも90%、95%、もしくは99%、または100%)の同一性のアミノ酸配列を含むポリペプチドである。特定の局面において、C末端ドメインは、Burkholderia、Paraburkholderia、またはXanthomonasで発現されるもののようなTALEタンパク質からのC-キャップドメインまたはその断片である。
【0117】
特定の態様において、N末端ドメインは、例えばUS 20180010152に開示されているDNA結合ドメインと共に使用されるN-キャップドメインのようなN末端領域に由来し得る。特定の態様において、N末端ドメインは、US 20150225465に開示されているN末端領域、例えばそこに開示されている配列番号7、8、または9に由来し得る。
【0118】
特定の態様では、本開示のNBDに存在するRUは、本明細書に提供されるRUから独立して選択することができる。特定の局面において、表1に列挙された個々のRUを、いかなるアミノ酸改変(例えば、欠失、挿入、および/または置換)も加えずに使用して、NBDを生成することができる。特定の局面において、表1に列挙された個々のRUは、欠失、挿入、および/または置換を介して改変されて、NBDを生成するために使用され得る。本明細書に記載されているように、異なる動物病原体タンパク質からここで同定されるRUは、混ぜて適合されてNBDを生成し得る。他の局面において、NBDは、本明細書に開示されているように、細菌の1つの属のみからのRUを含み得る。特定の局面において、本明細書で提供されるNBDは、それが由来する天然タンパク質(例えば、レジオネラ種細菌、フランシセラ種細菌、またはレジオネラ目細菌からのタンパク質)中に生じる順序においてRUを含まない。特定の態様において、本明細書に開示されるNBDは、NBDのC末端において半反復を含み、ここで、半反復は、本明細書に提供されるリンカーおよび/またはCドメインの開始前に、NBDにおける最後のRUを形成する。
【0119】
特定の局面において、本明細書で提供されるNBDにおける一つ以上のRUは、本明細書で提供されるRUに対して少なくとも70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、もしくは99%、または100%の同一性を有し得る。配列の対の間のパーセント同一性は、対における一致の数に100を乗じ、ギャップを含め整列された領域の長さで割ることによって計算され得る。同一性スコアリングは完全一致のみをカウントし、アミノ酸同士の類似性は考慮しない。配列の端のギャップではなく内部ギャップのみが長さに含まる。
【0120】
パーセント同一性=(マッチX 100)/整列領域(ギャップを含む)の長さ
【0121】
「保存的アミノ酸置換」とい語句は、以下の群内のアミノ酸残基の置換を指す:1) L, I, M, V, F; 2) R, K; 3) F, Y, H, W, R; 4) G, A, T, S; 5) Q, N; および 6) D, E。保存的アミノ酸置換は、タンパク質中のアミノ酸を、同様の酸性度、塩基性度、電荷、極性、またはサイズの側鎖を有するアミノ酸で置換することによって、タンパク質の活性を保存することができる。
【0122】
置換、挿入または欠失についてのガイダンスは、異なる種からのタンパク質のアミノ酸配列のアラインメントに基づき、または同一もしくは類似の機能を有する複数のタンパク質に基づくコンセンサス配列に基づき得る。
【0123】
ある態様において、開示されたNBDに含まれるN末端ドメインまたはC末端ドメインは、細胞、例えば動物または植物細胞の核への移入を促進するための核局在化配列 (NLS) を含み得る。特定の局面において、ポリペプチドは、宿主細胞中で産生され、N末端にトランスロケーションシグナルを伴って発現され得、このトランスロケーションシグナルは、トランスロケーションの際に切断され得る。
【0124】
特定の態様では、RUは、すぐ隣のRUから分離するさらなるアミノ酸を伴わずに、C末端からN末端へと連結され得る。特定の局面において、すぐ隣のRUは、少なくとも1アミノ酸のスペーサー配列によって分離され得る。特定の局面において、スペーサー配列は、少なくとも2、3、4、5、6、もしくは7アミノ酸、または最大5アミノ酸、または最大10アミノ酸を含む。スペーサー配列は、小さな側鎖を有するアミノ酸を含み得る。ある態様において、スペーサー配列は、フレキシブルなリンカーである。
【0125】
[リンカー]
ヌクレアーゼドメイン、遺伝子調節ドメイン、またはフルオロフォアなどの任意の機能ドメインが、本明細書に提供されるNBD、例えばMAP-NBD (例えば、L. quateirensis, Burkholderia, ParaburkholderiaまたはFrancisella由来)に、直接的にまたはリンカーを介して連結され得る。リンカーは、天然または非天然(例えば合成)のものであり得る。いくつかの実施形態において、MAP-NBD (例えば、L. quateirensis, Burkholderia, ParaburkholderiaまたはFrancisella由来)は、そのNまたはC末端に「分子ベルクロ」を有するように製造することができる。例えば、第一のペプチド配列を有するMAP-NBD (例えば、L. quateirensis, Legionellales, Burkholderia, ParaburkholderiaまたはFrancisella由来)を製造し得る。別個に、対象ヌクレアーゼ(例えば、FokIのような半切断ドメイン)を、第一のペプチド配列に対して相補的であって結合する第二のペプチド配列を伴うように作ることができ、それによって、細胞における投与後にMAP-NBD-ヌクレアーゼの形成を可能にする。
【0126】
他の実施形態において、MAP-NBD (例えば、L. quateirensis、Burkholderia、ParaburkholderiaまたはFrancisella由来)は、そのN-末端またはC-末端にリンカーを有して作製され得、続いて、機能ドメイン(例えば、遺伝子編集ドメイン、遺伝子調節ドメイン、または蛍光ドメイン)に直接結合され得る。
【0127】
ある態様において、リンカーは、長さが3〜540ヌクレオチド、例えば、3〜18、18〜33、33〜48、48〜63、63〜78、78〜93、93〜108、108〜123、123〜138、138〜153、153〜168、168〜183、183〜198、198〜213、213〜228、228〜243、243〜258、258〜273、273〜288、288〜303、303〜318、318〜333、333〜348、348〜363、363〜378、378〜393、393〜408、408〜423、423〜438、438〜453、453〜468、468〜483、483〜513、513〜528、528〜543、3、18、33、48、63、78、93、108、123、138、153、168、183、198、213、228、243、258、273、288、303、318、333、348、363、378、393、408、423、438、453、468、483、498、513、528、または543ヌクレオチドの核酸配列によってコードされ得る。ある態様において、リンカーは、長さが3、18、33、48、63、78、93、108、123、138、153、168、183、198、213、228、243、258、273、288、303、318、333、348、363、378、393、408、423、438、453、468、483、498、513、528、または543ヌクレオチドである核酸配列によってコードされ得る。
【0128】
特定の局面において、リンカーは、長さが1〜180、1〜20、20〜40、40〜60、60〜80、80〜100、100〜120、120〜140、140〜160、または160〜180アミノ酸残基であり得る。
【0129】
ヌクレアーゼドメインをMAP-NBD (例:L. quateirensis、Burkholderia、ParaburkholderiaまたはFrancisella由来)に連結するためのリンカーは、長さが1、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、または180アミノ酸残基であり得る。リンカーは、長さが1、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、または180アミノ酸残基であり得る。
【0130】
特定の局面において、リンカーは、天然に存在するL. quateirensis由来タンパク質のC末端、例えば配列番号1のC末端であり得る。C末端は完全長のC末端配列であり得、そしてALVKEYFPVFSSFHFTADQIVALICQSKQCFRNLKKNHQQWKNKGLSAEQIVDLILQETPPKPNFNNTSSSTPSPSAPSFFQGPSTPIPTPVLDNSPAPIFSNPVCFFSSRSENNTEQYLQDSTLDLDSQLGDPTKNFNVNNFWSLFPFDDVGYHPHSNDVGYHLHSDEESPFFDF (配列番号12)の配列を有し得る。いくつかの実施形態において、切り詰めた配列番号12をリンカーとして使用することができる。いくつかの実施形態において、リンカーは、以下のように、天然に存在するL. quateirensisタンパク質の位置1 (A) から位置63 (P) までのアミノ酸残基を有するC末端であり得る:ALVKEYFPVFSSFHFTADQIVALICQSKQCFRNLKKNHQQWKNKGLSAEQIVDLILQETPPKP (配列番号22)。
【0131】
特定の局面において、リンカーは、天然に存在するL. quateirensisのC末端、例えば配列番号1のC末端であり得る。C末端は完全長のC末端配列であり得、
ALVKEYFPVFSSFHFTADQIVALICQSKQCFRNLKKNHQQWKNKGLSAEQIVDLILQETPPKPNFNNTSSSTPSPSAPSFFQGPSTPIPTPVLDNSPAPIFSNPVCFFSSRSENNTEQYLQDSTLDLDSQLGDPTKNFNVNNFWSLFPFDDVGYHPHSNDVGYHLHSDEESPFFDF (配列番号12)の配列を有し得る。
【0132】
特定の態様において、リンカーは、本明細書に開示されるようなC末端ドメインであり得る。
【0133】
特定の態様において、本明細書に開示されたポリペプチドに存在し得るC末端ドメインは、C末端領域、例えば、US 20180010152に開示されたDNA結合ドメインと共に使用されるC-キャップドメインから誘導され得る。ある態様において、C末端ドメインは、US 20150225465に開示されているC末端領域、例えばそこに開示されている配列番号64、65、または66に由来し得る。
【0134】
[機能ドメイン]
本明細書に開示されるNBDまたはMAP-NBD (例:L. quateirensis、Burkholderia、ParaburkholderiaまたはFrancisella由来)は、機能ドメインに連結され得る。機能ドメインは、ゲノム編集、遺伝子調節(例えば、活性化または抑制)、またはイメージングによるゲノム遺伝子座の可視化などの、異なるタイプの活性を提供することができる。特定の局面において、機能ドメインは、NBDに対して異種性である。本明細書において使用される機能ドメインおよびNBDの文脈における異種性は、これらのドメインが異なる供給源に由来し、自然において一緒に存在しないことを示す。
【0135】
或る態様では、細胞内の内因性遺伝子の発現を調節する方法が開示される。この方法は、NBDおよび異種機能ドメインを含むポリペプチドを細胞に導入することを含み得、ここで、内因性遺伝子は、ポリペプチドのNBDに結合する標的核酸配列を含み、異種機能ドメインは内因性遺伝子の発現を調節する。ある態様において、ポリペプチドは、ポリペプチドをコードする核酸として導入され得る。特定の局面において、核酸はDNAまたはRNA、例えばmRNAであり、特定の局面において、細胞はヒト細胞であり、核酸の配列は、ヒト細胞における発現のためにコドン最適化される。特定の局面において、機能ドメインは転写アクチベーターであり、標的核酸配列は遺伝子の発現制御領域に存在し、ここでポリペプチドは遺伝子の発現を増加させる。特定の局面において、機能ドメインは転写リプレッサーであり、標的核酸配列は遺伝子の発現制御領域に存在し、ここでポリペプチドは遺伝子の発現を減少させる。ある局面において、遺伝子の発現制御領域は、遺伝子のプロモーター領域を含む。
【0136】
いくつかの局面において、機能ドメインは、切断ドメインまたは半切断ドメインを含むヌクレアーゼであり、内因性遺伝子は、切断によって不活性化される。いくつかの局面において、不活性化は、非相同末端結合 (NHEJ) を介して起こる。いくつかの局面において、不活性化は、塩基対の欠失または挿入、一塩基多型 (SNP) の導入、またはより長い異種DNAのストレッチの導入によって生じる。いくつかの局面において、不活性化は、本明細書中で教示されるように、切断による未熟な終止コドンの生成によって生じる。或る態様では、前記ポリペプチドは、前記遺伝子の第1の標的核酸配列に結合し半切断ドメインを含む第1のポリペプチドであり、前記方法は、前記遺伝子の第2の標的核酸配列に結合し半切断ドメインを含むNBDを含むポリペプチドである第2のポリペプチドを導入することを含む。いくつかの局面において、第1の標的核酸配列および第2の標的配列は、遺伝子内で間隔を置いており、2つの半切断ドメインは、第1および第2の標的核酸配列の間の位置における遺伝子配列の切断を媒介する。
【0137】
また、本明細書では、細胞のゲノム中の目的の領域に外因性核酸を導入する方法も提供され、該方法は、 (i) 開示されたNBDおよび切断ドメインまたは半切断ドメインを含むポリペプチドであって、ポリペプチドのNBDが目的の領域に隣接して存在する標的核酸配列に結合するものと (ii) 切断ドメインまたは半切断ドメインが目的の領域に切断を導入し外因性核酸が相同組換えによって目的の切断領域に組み込まれるところの、外因性核酸とを、細胞に導入することを含む。
【0138】
ポリペプチドおよび方法のさらなる態様を以下に記載する。
【0139】
[A.ゲノム編集ドメイン]
本明細書に開示されるNBD、あるいはMAP-NBD (例:L. quateirensis、Burkholderia、ParaburkholderiaまたはFrancisella由来)は、ヌクレアーゼに連結され得、ここで、MAP-NBDは特異性およびターゲティングを提供し、ヌクレアーゼはゲノム編集機能を提供する。ある態様において、ヌクレアーゼは、切断半ドメインであり、DNAを切断することができる活性な完全ドメインを形成するために二量体化する。他の態様において、ヌクレアーゼは、二量体化する必要なくDNAを切断することができる切断ドメインであり得る。例えば、切断半ドメインを含むヌクレアーゼは、FokIまたはBfilなどのエンドヌクレアーゼであり得る。いくつかの実施形態において、二つの切断半ドメイン(例:FokIやBfil)を融合させて、完全に機能的な単一の切断ドメインを形成することができる。半切断ドメインがヌクレアーゼとして使用される場合、2つのMAP-NBDを操作することができ、第1のMAP-NBDは、標的核酸配列の上側鎖に結合し第1のFokI切断半ドメインを含み、第2のMAP-NBDは標的核酸配列の下側鎖に結合し第2のFokI半切断ドメインを含む。ある態様において、ヌクレアーゼは、FokIまたはBfilなどのIIS型制限酵素であり得る。
【0140】
ある態様において、二量体化する必要なしにDNAを切断することができる切断ドメインは、メガヌクレアーゼであり得る。メガヌクレアーゼはホーミングエンドヌクレアーゼとも呼ばれる。ある態様において、メガヌクレアーゼは、I-AniIまたはI-OnuIであり得る。
【0141】
MAP-NBD (例:L. quateirensis、Burkholderia、ParaburkholderiaまたはFrancisella由来)に融合されたヌクレアーゼドメインは、エンドヌクレアーゼまたはエキソヌクレアーゼであり得る。エンドヌクレアーゼは、制限エンドヌクレアーゼおよびホーミングエンドヌクレアーゼを含み得る。エンドヌクレアーゼはまた、S1ヌクレアーゼ、マングビーンヌクレアーゼ、膵臓DNアーゼI、ミクロコッカスヌクレアーゼ、または酵母HOエンドヌクレアーゼを含み得る。エキソヌクレアーゼは、3’-5’エキソヌクレアーゼまたは5’-3’エキソヌクレアーゼを含み得る。エキソヌクレアーゼはまた、DNAエキソヌクレアーゼまたはRNAエキソヌクレアーゼを含み得る。エキソヌクレアーゼの例としては、エキソヌクレアーゼI、II、III、IV、V、およびVIII;DNAポリメラーゼI、RNAエキソヌクレアーゼ2等が挙げられる。
【0142】
本明細書に開示されるNBDまたはMAP-NBD (例:L. quateirensis、Burkholderia、ParaburkholderiaまたはFrancisella由来)に融合されたヌクレアーゼドメインは、制限エンドヌクレアーゼ(または制限酵素)であり得る。ある場合には、制限酵素は認識部位から離れた部位でDNAを切断し、分離された結合ドメインと切断ドメインをもつ。場合によっては、このような制限酵素はIIS型制限酵素である。
【0143】
本明細書に開示されるNBDまたはMAP-NBD (例:L. quateirensis、Burkholderia、ParaburkholderiaまたはFrancisella由来)に融合されたヌクレアーゼドメインは、IIS型ヌクレアーゼであり得る。IIS型ヌクレアーゼはFokIまたはBfilであり得る。ある場合には、MAP-NBD (例:L. quateirensis、Burkholderia、ParaburkholderiaまたはFrancisella由来)に融合したヌクレアーゼドメインはFokIである。別の場合には、MAP-NBD (例:L. quateirensis、Burkholderia、ParaburkholderiaまたはFrancisella由来)に融合したヌクレアーゼドメインはBfilである。
【0144】
FokIは、野生型FokIであるか、または1以上の突然変異を含み得る。場合によっては、FokIは、1、2、3、4、5、6、7、8、9、10以上の突然変異を含み得る。突然変異は切断効率を高めることができる。変異によって切断活性が失われることがある。ある場合には、突然変異がホモ二量体化を調節し得る。例えば、FokIは、ホモ二量体化を調節するために、446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537および538の位置の一つ以上のアミノ酸残基に突然変異を有することができる。
【0145】
場合によっては、FokI切断ドメインは、例えば、Kim et al. “Hybrid restriction enzymes: Zinc finger fusions to Fok I cleavage domain,” PNAS 93: 1156-1160 (1996) に記載されている通りである。いくつかの場合において、本明細書に記載されるFokI切断ドメインは、配列番号11のFokIである(表2)。他の例では、本明細書に記載されるFokI切断ドメインは、例えば、米国特許第8,586,526号に記載されるようなFokIである。
【0146】
表2は、本明細書に記載の方法またはシステムとともに本明細書で使用することができる例示的なFokI配列を示す。
【表2】
【0147】
MAP-NBD (例:L. quateirensis、Burkholderia、ParaburkholderiaまたはFrancisella由来)は、DNAヌクレオチドを改変する官能基、例えばアデノシンデアミナーゼに連結され得る。
【0148】
[B.調節ドメイン]
別の例として、本明細書に開示されるNBDまたはMAP-NBD (例:L. quateirensis、Burkholderia、ParaburkholderiaまたはFrancisella由来)は、遺伝子調節ドメインに連結され得る。遺伝子調節ドメインは活性化因子(アクチベーター)または抑制因子(リプレッサー)であり得る。例えば、本明細書に開示されるNBDまたはMAP-NBD (例:L. quateirensis、Burkholderia、ParaburkholderiaまたはFrancisella由来)は、VP16、VP64、p65、p300触媒ドメイン、TET1触媒ドメイン、TDG、Ldb 1自己会合ドメイン、SAM活性化因子(VP64、p65、HSF1)、またはVPR (VP64、p65、Rta)などの活性化ドメインに連結され得る。用語「活性化因子」、「活性化ドメイン」および「転写活性化因子」は、互換的に用いられ、遺伝子の発現を増加させるポリペプチドを意味する。あるいは、MAP-NBD (例:L. quateirensis、Burkholderia、ParaburkholderiaまたはFrancisella由来)は、KRAB、Sin3a、LSD1、SUV39H1、G9A (EHMT2) 、DNMT1、DNMT3A-DNMT3L、DNMT3B、KOX、TGF-β誘導早期遺伝子 (TIEG) 、v-erbA、SID、MBD2、MBD3、RB、またはMeCP2などの抑制因子に連結され得る。用語「抑制因子」、「抑制因子ドメイン」、および「転写抑制因子」は、本明細書において互換的に使用され、遺伝子の発現を減少させるポリペプチドを意味する。
【0149】
いくつかの実施形態において、本明細書に開示されるNBDまたはMAP-NBD (例:L. quateirensis、Burkholderia、ParaburkholderiaまたはFrancisella由来)は、DNMT3aなどのDNA修飾タンパク質に連結され得る。MAP-NBD (例:L. quateirensis、Burkholderia、ParaburkholderiaまたはFrancisella由来)は、リジン特異的ヒストンデメチラーゼ1 (LSD1) などのクロマチン修飾タンパク質に連結することができる。MAP-NBD (例:L. quateirensis、Burkholderia、ParaburkholderiaまたはFrancisella由来)は、KRABのような、他のタンパク質をリクルートすることができるタンパク質と結合することができる。DNA修飾タンパク質(例:DNMT3a)や他のタンパク質をリクルートすることができるタンパク質(例:KRAB)は、転写のリプレッサーとして働くことができる。したがって、DNA修飾タンパク質(例:DNMT3a) または他のタンパク質をリクルートすることができるドメイン(例えば、KRAB、Kox1などの転写リプレッサーで見出されるドメイン) に連結されたMAP-NBD(例:L. quateirensis、Burkholderia、ParaburkholderiaまたはFrancisella由来)は、遺伝子抑制機能性を提供することができ、転写因子として機能することができ、ここで、MAP-NBD (例:L. quateirensis、Burkholderia、ParaburkholderiaまたはFrancisella由来)が特異性およびターゲティングを提供し、DNA修飾タンパク質および他のタンパク質をリクルートすることができるタンパク質が遺伝子抑制機能性を提供し、これは、操作されたゲノム調節複合体またはMAP-NBD-遺伝子調節因子 (MAP-NBD-GR) 、より具体的にはMAP-NBD-転写因子 (MAP-NBD-TF) と呼ぶことができる。
【0150】
いくつかの実施形態において、非処理細胞と比較して、本開示の抑制ドメインに融合したDNA結合ドメイン(例:MAP-NBD-TF)を使用することによって、標的遺伝子の発現を少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも97%、または少なくとも99%減少させることができる。いくつかの実施形態において、非処理細胞と比較して、本開示のMAP-NBD-TFを使用することによって、チェックポイント遺伝子の発現を90%以上減少させることができる。
【0151】
いくつかの実施形態において、本開示の抑制ドメインに融合されたDNA結合ドメイン(例:MAP-NBD-TF)を伴う標的遺伝子の抑制およびその後の標的遺伝子の発現低下は、少なくとも1日、少なくとも2日、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも6日、少なくとも7日、少なくとも8日、少なくとも9日、少なくとも10日、少なくとも11日、少なくとも12日、少なくとも13日、少なくとも14日、少なくとも15日、少なくとも16日、少なくとも17日、少なくとも18日、少なくとも19日、少なくとも20日、少なくとも21日、少なくとも22日、少なくとも23日、少なくとも24日、少なくとも25日、少なくとも26日、少なくとも27日、または少なくとも28日続くことができる。いくつかの実施形態において、本開示のMAP-NBD-TFによる標的遺伝子の抑制およびその後の標的遺伝子の発現低下は、1日〜3日間、3日〜5日間、5日〜7日間、7日〜9日間、9日間〜11日間、11日間〜13日間、13日間〜15日間、15日間〜17日間、17日間〜19日間、19日間〜21日間、21日間〜23日間、23日間〜25日間、または25日間〜28日間持続することができる。
【0152】
様々な局面において、本開示は、細胞の標的遺伝子における標的結合部位を同定する方法を提供し、この方法は、 (a) DNA結合ドメイン、リプレッサードメイン、およびリンカーを含む改変された転写リプレッサー細胞を接触させることと;(b) 標的遺伝子の発現を測定することと;(c) 標的遺伝子の発現が少なくとも3日間に渡り少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも97%、または少なくとも99%抑制されることを決定することを含み、ここで、標的遺伝子は、チェックポイント遺伝子およびT細胞表面受容体から選択される。
【0153】
いくつかの局面において、標的遺伝子の発現は、複数の細胞の少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%において抑制される。いくつかの局面において、操作されたゲノム調節複合体は、少なくとも3日後には検出不能である。いくつかの局面において、操作されたゲノム調節複合体が検出不能であることの決定は、qPCR、FLAG-タグのイメージング、またはそれらの組み合わせによって測定される。いくつかの局面において、標的遺伝子の発現測定は、標的遺伝子の発現のフローサイトメトリー定量化を含む。
【0154】
いくつかの実施形態において、本開示の抑制ドメインに融合されたDNA結合ドメイン(例:MAP-NBD-TF)を用いた標的遺伝子の抑制は、DNA結合ドメイン-TFが検出不能になった後でも持続することができる。抑制ドメインと融合したDNA結合ドメイン(例:MAP-NBD-TF)は、少なくとも3日後には検出できなくなる。ある態様において、抑制ドメインに融合されたDNA結合ドメイン(例:MAP-NBD-TF)は、少なくとも1日、少なくとも2日、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも6日、少なくとも1週間、少なくとも2週間、少なくとも3週間、または少なくとも4週間後に検出不能になり得る。いくつかの実施形態において、qPCRまたはFLAG-タグを介するイメージングを用いて、抑制ドメインに融合されたDNA結合ドメイン(例:MAP-NBD-TF)がもはや検出不能であることを確認することができる。
【0155】
いくつかの実施形態において、L. quateirensisに由来する反復単位を含むMAP-NBDを用いて、PDCD1遺伝子の抑制を達成することができる。ヒトPDCD1遺伝子のプロモーター領域に存在する標的DNAの配列、標的DNAに結合することができ配列番号1からの完全長C末端ドメインまたはアミノ酸位置63で切り詰められた配列番号1からのC末端ドメインのいずれかを含むNBDのアミノ酸配列を、表3に示す。
【表3】
【0156】
[C.イメージング部分]
MAP-NBD (例:L. quateirensis、Burkholderia、ParaburkholderiaまたはFrancisella由来)は、以下のもののようなフルオロフォアに連結され得る:ヒドロキシクマリン、メトキシクマリン、アレキサフルオル、アミノクマリン、Cy2、FAM、アレキサフルオル488、フルオレセインFITC、アレキサフルオル430、アレキサフルオル532、HEX、Cy3、TRITC、アレキサフルオル546、アレキサフルオル555、R-フィコエリトリン (PE) 、ローダミンRed-X、Tamara、Cy3.5、Rox、アレキサフルオル568、レッド613、テキサスレッド、アレキサフルオル594、アレキサフルオル633、アロフィコシアニン、アレキサフルオル633、Cy5、アレキサフルオル660、Cy5.5、TruRed、アレキサフルオル680、Cy7、GFP、またはmCHERRY。MAP-NBD (例:L. quateirensis、Burkholderia、ParaburkholderiaまたはFrancisella由来)をビオチン化試薬に連結させることができる。
【0157】
[標的]
いくつかの態様において、本明細書に記載する方法は、本明細書に記載するMAP-NBDを利用して標的細胞の遺伝物質を改変する方法を含む。標的細胞は、真核細胞または原核細胞であり得る。標的細胞は、動物細胞または植物細胞であり得る。動物細胞は、海洋無脊椎動物、魚、昆虫、両生類、爬虫類、または哺乳動物由来の細胞を含むことができる。哺乳類細胞は、霊長類、サル、ウマ、ウシ、ブタ、イヌ、ネコ、またはげっ歯類から得ることができる。哺乳動物は、霊長類、類人猿、イヌ、ネコ、ウサギ、フェレットなどであり得る。げっ歯類は、マウス、ラット、ハムスター、スナネズミ、ハムスター、チンチラ、モルモットなどであり得る。鳥類の細胞は、カナリア、インコ、またはオウムからの細胞であり得る。爬虫類の細胞には、カメ、トカゲ、またはヘビからの細胞であり得る。魚の細胞は熱帯魚からのものであり得る。例えば、魚類細胞はゼブラフィッシュ(例えばDanio rerio)由来であり得る。線虫細胞は線虫(例えばC. elegans)からのものであり得る。両生類の細胞はカエルからのものであり得る。節足動物の細胞はタランチュラやヤドカリからのものであり得る。
【0158】
哺乳類細胞はまた、霊長類(例えば、ヒトまたはヒト以外の霊長類)から得られる細胞を含むことができる。哺乳類細胞は、上皮細胞、結合組織細胞、ホルモン分泌細胞、神経細胞、骨格筋細胞、血液細胞、免疫系細胞、または幹細胞を含むことができる。
【0159】
例示的な哺乳動物細胞は、293A細胞株、293FT細胞株、293F細胞、293H細胞、HEK293細胞、CHO DG 44細胞、CHO-S細胞、CHO-K1細胞、Expi293F
TM細胞、Flp-In
TM T-REx
TM 293細胞株、Flp-In
TM-293細胞株、Flp-In
TM-3T3細胞株、Flp-In
TM-BTK細胞株、Flp-In
TM-CHO細胞株、Flp-In
TM-CV-1細胞株、Flp-In
TM-Jurkat細胞株、FreeStyle
TM 293-F細胞、FreeStyle
TM CHO-S細胞株、GripTite
TM 293 MSR細胞株、GS-CHO細胞株、HepaRG
TM細胞株、T-REx
TM Jurkat細胞株、Per.C6細胞、T-REx
TM-293細胞株、T-REx
TM-CHO細胞株、T-REx
TM-HeLa細胞株、NC-HIMT細胞株、PC12細胞株、および初代T細胞、初代造血幹細胞、初代ヒト胚性幹細胞 (hESC) 、初代人工多能性幹細胞 (iPSC) を含む初代細胞(例えばヒトからのもの)を含み得るが、これらに限定されない。
【0160】
いくつかの実施形態において、本開示のMAP-NBDを用いて、標的細胞を改変することができる。標的細胞自体が改変されたものであっても非改変のものでもよい。例えば、本開示のMAP-NBDで非改変細胞を編集して、そのゲノムに挿入、欠失、または突然変異を導入することができる。いくつかの実施形態において、既に突然変異を有する改変された細胞を、本開示のMAP-NBDで修復することができる。
【0161】
場合によっては、標的細胞は、一以上の一塩基多型 (SNP) を含む細胞である。場合によっては、本明細書に記載されるMAP-NBDヌクレアーゼは、SNPを含む標的細胞を標的化および編集するように設計される。
【0162】
場合によっては、標的細胞は改変を含まない細胞である。例えば、標的細胞は、遺伝的欠陥のない(例えば遺伝子突然変異のない)ゲノムを含むことができ、本明細書に記載されるMAP-NBDヌクレアーゼが、ゲノム内に改変(例えば突然変異)を導入するために使用され得る。
【0163】
場合によっては、標的細胞は癌細胞である。癌は固形腫瘍または血液学的悪性腫瘍である。固形腫瘍には、肉腫またはがん腫が含まれ得る。例示的な肉腫標的細胞は、限定されるものではないが、胞巣状横紋筋肉腫、胞巣状軟部肉腫、エナメル芽腫、血管肉腫、軟骨肉腫、脊索腫、軟部組織の明細胞肉腫、脱分化型脂肪肉腫、デスモイド、線維形成性小円形細胞腫瘍、胎児性横紋筋肉腫、類上皮線維肉腫、類上皮血管内皮腫、類上皮肉腫、骨外性粘液性軟骨肉腫、骨外性骨肉腫、線維肉腫、巨細胞腫、血管周皮腫、乳児線維肉腫、炎症性筋線維芽腫、カポジ肉腫、骨平滑筋肉腫、脂肪肉腫、悪性線維肉腫 (MFH) 、骨の悪性線維性組織球腫 (MFH) 、悪性間葉腫、悪性末梢神経鞘腫瘍、間葉性軟骨肉腫、粘液線維肉腫、粘液性脂肪肉腫、粘液炎症性線維芽細胞肉腫、血管周囲の骨端細胞への分化を伴う新生物、骨肉腫、傍骨骨肉腫、血管周囲の骨端細胞への分化を伴う新生物、骨膜骨肉腫、多形性横紋筋肉腫、PNET/骨外性ユーイング腫瘍、横紋筋肉腫、円形脂肪肉腫、小細胞骨肉腫、孤立性線維腫瘍、滑膜肉腫、または毛細血管拡張性骨肉腫から得られる細胞を含み得る。
【0164】
例示的ながん腫標的細胞としては、肛門癌、虫垂癌、胆管癌(すなわち胆管癌)、膀胱癌、脳腫瘍、乳癌、子宮頸癌、結腸癌、原発不明癌 (CUP) 、食道癌、眼癌、卵管癌、消化器癌、腎臓癌、肝臓癌、肺癌、髄芽腫、黒色腫、口腔癌、卵巣癌、膵臓癌、副甲状腺癌、陰茎癌、下垂体腫瘍、前立腺癌、直腸癌、皮膚癌、胃癌、精巣癌、咽喉癌、甲状腺癌、子宮癌、膣癌、または外陰癌から得られる細胞が挙げられるが、これらに限定されない。
【0165】
あるいは、癌性細胞は、血液学的悪性腫瘍から得られる細胞を含み得る。血液悪性腫瘍は、白血病、リンパ腫、骨髄腫、非ホジキンリンパ腫、またはホジキンリンパ腫を含むことができる。一部の場合には、血液学的悪性腫瘍はT細胞系の血液学的悪性腫瘍でありうる。他の場合には、血液学的悪性腫瘍は、B細胞に基づく血液学的悪性腫瘍であり得る。例示的なB細胞系血液悪性腫瘍には、限定されるものではないが、慢性リンパ性白血病 (CLL) 、小リンパ球性リンパ腫 (SLL) 、高リスクCLL、非CLL/SLLリンパ腫、前リンパ球性白血病 (PLL) 、濾胞性リンパ腫 (FL) 、びまん性大細胞型B細胞リンパ腫 (DLBCL) 、マントル細胞リンパ腫 (マントル細胞リンパ腫) MCL、節性辺縁帯B細胞リンパ腫、節性辺縁帯B細胞リンパ腫、バーキットリンパ腫、非バーキット高悪性度B細胞リンパ腫、原発性縦隔B細胞リンパ腫 (PMBL) 、免疫芽球性大細胞リンパ腫、Bリンパ芽球性リンパ腫、B細胞前リンパ球性白血病、形質細胞性リンパ腫、脾臓辺縁帯リンパ腫、形質細胞骨髄腫、形質細胞腫、縦隔リンパ腫 (胸腺) 大細胞リンパ腫、血管内大B細胞リンパ腫、原発性大細胞リンパ腫、またはリンパ腫様肉芽腫症が含まれ得る。例示的なT細胞ベースの血液悪性腫瘍は、限定されるものではないが、末梢性T細胞リンパ腫、未分化大細胞型リンパ腫、血管免疫芽球性リンパ腫、皮膚T細胞リンパ腫、成人T細胞白血病/リンパ腫 (ATLL) 、芽球性NK細胞リンパ腫、腸症型T細胞リンパ腫、脾γδT細胞リンパ腫、リンパ芽球性リンパ腫、鼻NK/T細胞リンパ腫、または治療関連T細胞リンパ腫を含むことができる。
【0166】
場合によっては、細胞は腫瘍細胞株であり得る。例示的な腫瘍細胞株は、限定されるものではないが、600MPE、AU565、BT-20、BT-474、BT-483、BT-549、Evsa-T、Hs578T、MCF-7、MDA-MB-231、SkBr3、T-47D、HeLa、DU145、PC3、LNCaP、A549、H1299、NCI-H460、A2780、SKOV-3/Luc、Neuro2a、RKO、RKO-AS45-1、HT-29、SW1417、SW948、DLD-1、SW480、Capan-1、MC/9、B72.3、B25.2、B38.1、DMS153、SU86.86、SNU-182、SNU-423、SNU-449、SNU-387、Hs817.T、LMH、LMH/2A、SNU-398、PLHC-1、HepG2/SF、OCI-Ly1、OCI-Ly2、OCI-Ly3、OCI-Ly4、OCI-Ly6、OCI-Ly7、OCI-Ly10、OCI-Ly18、OCI-Ly19、U2932、DB、HBL-1、RIVA、SUDHL2、TMD8、MEC1、MEC2、8E5、CCRF-CEM、MOLT-3、TALL-104、AML-193、THP-1、BDCM、HL-60、Jurkat、RPMI8226、MOLT-4、RS4、K-562、KASUMI-1、DA、DA、DA-10、Raudi、Jeko-1、NK-92、およびMinoを含み得る。
【0167】
いくつかの態様において、本明細書に記載する方法は、本明細書に記載するMAP-NBDを利用して標的遺伝子を改変する方法を含む。いくつかの実施形態において、本開示のヌクレアーゼを、対象とする特定のゲノム遺伝子座のためのDNA結合ドメインと融合させることによって、ゲノム編集を行うことができる。遺伝子改変は、治療目的のための機能的遺伝子の導入、治療遺伝子のための遺伝子のノックアウト、または必要とする対象に投与し直す細胞をex vivoで操作すること(例えばHSCまたはCAR T細胞)を含み得る。例えば、ゲノム編集複合体は、PDCD1、CTLA4、LAG3、TET2、BTLA、HAVCR2、CCR5、CXCR4、TRA、TRB、B2M、アルブミン、HBB、HBA1、TTR、NR3C1、CD52、BCL11A遺伝子の赤血球特異的エンハンサー、CBLB、TGFBR1、SERPINA1、感染細胞中のHBVゲノムDNA、CEP290、DMD、CFTR、IL2RG、CS-1、またはそれらの任意の組合せ内に標的部位を有することができる。ある態様において、ゲノム編集複合体は、キメラ抗原受容体 (CAR) 、α-Lイズロニダーゼ (IDUA) 、イズロネート-2-スルファターゼ (IDS) 、または第9因子 (F9) を挿入するために、標的部位で二本鎖DNAを切断し得る。ゲノム編集複合体を用いて造血幹細胞 (HSC) およびT細胞などの細胞をex vivoで操作することができる。あるいは、ゲノム編集複合体は、必要とする対象に直接投与され得る。
【0168】
[ポリペプチドの製造方法]
特定の実施形態では、MAP-NBDのような本明細書に開示されるポリペプチドは、組換えおよび非組換え方法(例えば化学合成)を含む適切な方法を用いて製造される。
【0169】
[A. 化学合成]
ポリペプチドが化学的に合成される場合、合成は液相または固相を介して進行し得る。固相ペプチド合成 (SPPS) は、非天然アミノ酸および/またはペプチド/蛋白質骨格修飾の取り込みを可能にする。FmocおよびBocなどの種々の形態のSPPSが、本開示のポリペプチドを合成するために利用可能である。化学合成の詳細は当該技術分野において公知である(例:Ganesan A. 2006 Mini Rev. Med. Chem. 6:3-10; and Camarero J.A. et al., 2005 Protein Pept Lett. 12:723-8)。
【0170】
[B. 組換え生産]
組換え技術を用いてポリペプチドが産生される場合、ポリペプチドは、任意の適切な構築物および任意の適切な宿主細胞を用いて、細胞内タンパク質または分泌タンパク質として産生され得、これらは、それぞれ、細菌(例えば大腸菌)または酵母宿主細胞などの原核細胞または真核細胞であり得る。特定の局面において、ポリペプチドの産生のための宿主細胞として使用される真核細胞としては、昆虫細胞、哺乳動物細胞、および/または植物細胞が挙げられる。特定の局面において、哺乳動物宿主細胞が使用され、これには、ヒト細胞(例えばHeLa、293、H9およびJurkat細胞);マウス細胞(例えば、NIH3T3、L細胞、およびC127細胞);霊長類細胞(例:Cos 1、Cos 7およびCV1)およびハムスター細胞(例えばチャイニーズハムスター卵巣 (CHO) 細胞)が含まれ得る。特定の実施形態において、本明細書に開示されるポリペプチドは、CHO細胞において産生される。
【0171】
ポリペプチドの発現に適した種々の宿主-ベクター系を、当該分野で公知の標準的手順に従って使用することができる。例えば、Sambrook et al., 1989 Current Protocols in Molecular Biology Cold Spring Harbor Press, New York; and Ausubel et al. 1995 Current Protocols in Molecular Biology, Eds. Wiley and Sons参照。遺伝物質を宿主細胞に導入する方法としては、例えば、形質転換、エレクトロポレーション、接合、リン酸カルシウム法などが挙げられる。導入されたポリペプチドをコードする核酸の安定な発現を提供するように、移入方法を選択することができる。ポリペプチドをコードする核酸は、遺伝可能エピソーム要素(例えばプラスミド)として提供されるか、またはゲノム的に統合され得る。目的のポリペプチドの製造に使用するための種々の適切なベクターが市販されている。
【0172】
ベクターは、宿主細胞において染色体外的維持を提供するか、または宿主細胞ゲノムへの組み込みを提供することができる。発現ベクターは、転写および翻訳の調節配列を提供し、コード領域が転写開始領域ならびに転写および翻訳の終結領域の転写制御下に作動可能に連結されている場合に、誘導可能なまたは構成的な発現を提供し得る。一般に、転写および翻訳の調節配列は、プロモーター配列、リボソーム結合部位、転写開始および停止配列、翻訳開始および停止配列、ならびにエンハンサーまたはアクチベーター配列を含み得るが、これらに限定されない。プロモーターは構成的プロモーターでも誘導的プロモーターでもよく、強力な構成的プロモーターでもよい(例:T7)。
【0173】
また、本明細書に開示されるポリペプチドをコードする核酸も本明細書に提供される。特定の局面において、本明細書に開示されるポリペプチドをコードする核酸は、ポリペプチドの発現をもたらすプロモーター配列に作動可能に連結されている。特定の局面において、核酸の配列は、ヒト細胞におけるポリペプチドの発現のために最適化されたコドンである。ある態様において、核酸はデオキシリボ核酸 (DNA) である。ある態様において、核酸はリボ核酸(RNA) である。また、本明細書に記載の標的核酸に結合するためのポリペプチドをコードする核酸を含むベクターも本明細書に提供される。特定の局面において、ベクターはウイルスベクターである。
【0174】
特定の局面において、本明細書に開示されるポリペプチドをコードする核酸またはベクターを含む宿主細胞が提供される。特定の局面において、本明細書に開示されるポリペプチドを含む宿主細胞が提供される。特定の局面において、該ポリペプチドを発現する宿主細胞も開示される。
【0175】
[送達]
本明細書に開示されたポリペプチド、開示されたポリペプチドを含む組成物、および開示されたポリペプチドをコードする核酸は、例えば注射、感染、トランスフェクション、および小胞またはリポソーム媒介の送達を含む任意の適切な手段によって標的細胞に送達され得る。
【0176】
特定の局面において、本明細書に開示されるポリペプチドをコードするmRNAまたはベクターは、注入、トランスフェクト、またはウイルス感染を介して標的細胞に導入することができ、ここで細胞はex vivoまたはin vivoである。限定されるものではないが、プラスミドベクター、レトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、ポックスウイルスベクター、ヘルペスウイルスおよびアデノ随伴ウイルスベクターなどを含む任意のベクター系を使用することができる。本開示による2つ以上のポリペプチドが細胞に導入される場合、ポリペプチドをコードする核酸は、同じベクターまたは異なるベクター上に担持され得る。非ウイルスベクター送達システムは、DNAプラスミド、裸の核酸、およびリポソームまたはポロキサマーなどの送達ビヒクルと複合体化された核酸を含む。ウイルスベクター送達システムにはDNAおよびRNAウイルスが含まれ、これらは細胞への送達後にエピソームまたは組み込まれたゲノムを有する。本明細書に記載されるポリヌクレオチドの導入に適したベクターとしては、非組込み型レンチウイルスベクター (IDLV) が挙げられる。
【0177】
非ウイルスベクター送達系には、エレクトロポレーション、リポフェクション、マイクロインジェクション、遺伝子銃、ヴィロソーム、リポソーム、免疫リポソーム、ポリカチオンまたは脂質:核酸コンジュゲート、裸のDNA、人工ビリオン、およびDNAの薬剤増強取り込みが含まれる。
【0178】
初代細胞を単離し、処置される対象への再導入のためにex vivoで使用することができる。適切な一次細胞には、末梢血単核細胞 (PBMC) 、および他の血液細胞サブセット、例えばCD4+ T細胞またはCD8+ T細胞が含まれるが、これらに限定されない。適切な細胞はまた、例えば、胚性幹細胞、人工多能性幹細胞、造血幹細胞、神経幹細胞、間葉系幹細胞、筋幹細胞および皮膚幹細胞などの幹細胞を含む。特定の局面において、幹細胞は、本明細書に開示されたポリペプチドを用いて治療される対象から単離されるか、または治療される対象の体細胞から誘導され得る。
【0179】
特定の局面において、本開示のポリペプチドまたは本開示のポリペプチドをコードする核酸が入る細胞は、動物細胞であり得、例えば治療を必要とするヒト由来の細胞であり得る。他の局面において、細胞は植物細胞であってもよい。DNA構築物は、種々の従来技術によって所望の植物宿主に(例えばそのゲノムに)導入することができる。例えば、DNA構築物を、植物細胞プロトプラストのエレクトロポレーションおよびマイクロインジェクションなどの技術を用いて植物細胞のゲノムDNAに直接導入することができ、またはDNA構築物をDNA粒子衝撃などの遺伝子銃法を用いて植物組織に直接導入することができる。
【0180】
特定の局面において、本開示のポリペプチドは、標的細胞中に一時的にのみ存在する。例えば、短期間、例えば1日、3日、1週間、3週間、または1ヶ月までポリペプチドを発現した核酸からポリペプチドが発現される。本開示のポリペプチドの一過性発現が望まれる用途では、アデノウイルスに基づく系を使用することができる。アデノ随伴ウイルス (「AAV」) ベクターもまた、本開示のポリペプチドをコードする核酸で細胞を形質導入するために使用され得、例えば、核酸およびペプチドのインビトロ生産において、ならびにインビボおよびエクスビボの遺伝子治療手順のために、使用され得る。特定の局面において、複製欠損組換えアデノウイルスベクターのような組換えアデノ随伴ウイルスベクター (rAAV) を、本明細書に開示されたポリペプチドをコードする核酸の導入のために使用することができる。
【0181】
特定の局面において、本明細書に開示されるポリペプチドをコードする核酸は、特定の組織型または細胞型について高度の特異性を有する遺伝子治療ベクターを用いて送達することができる。ウイルスベクターは、典型的には、ウイルス外表面上のウイルス外被タンパク質との融合タンパク質として発現されるリガンドをコードする配列を含むことによって、所定の細胞型に対する特異性を有するように改変される。リガンドは、対象の細胞型上に存在することが知られている受容体に対する親和性を有するように選択される。
【0182】
特定の局面において、遺伝子治療ベクターが、個々の患者への投与によってインビボで送達され得る。特定の局面において、投与は、以下に記載されるように、全身投与(例えば、静脈内、腹腔内、筋肉内、皮下、または頭蓋内注入)、直接注射(例えば、髄腔内)、または局所適用を含む。あるいは、ベクターは、個々の患者から外植された細胞(例えば、リンパ球、骨髄穿刺液、組織生検)または万能ドナー造血幹細胞などの細胞にex vivoで送達され、次いで、通常は、ベクターを組み込んだ細胞またはベクターによってコードされた本開示のポリペプチドの発現によって改変された細胞についての選択の後に、細胞が患者に再移植され得る。
【0183】
特定の局面において、本明細書において提供されるポリペプチドをコードする核酸は、標的細胞におけるポリペプチドの発現を増強するようにコドン最適化され得る。例えば、ヒト細胞におけるポリペプチドの産生を増強するために、ヒト細胞のような動物細胞において高度に使用されることが知られているコドンを提供するように核酸の配列を変化させることができる。例えば、哺乳動物細胞におけるコドン最適化のために、本明細書に開示されるポリペプチドをコードするヌクレオチド配列においてサイレント変異を作製することができる。同様のコドン最適化が、他の宿主細胞系(例えば、植物、菌類など)における最適発現のために使用され得る。
【0184】
[組成物]
特定の局面において、本明細書に記載されるポリペプチドおよび核酸は、薬学的に許容される賦形剤を含む薬学的組成物中に存在し得る。特定の局面において、ポリペプチドおよび核酸は、医薬組成物中に治療上有効な量で存在する。治療上有効な量は、組成物の観察される有効性に基づいて決定することができる。治療上有効な量は、細胞(例えば、本開示のポリペプチドに応答してレポーターの発現が調節されるレポーター細胞株)における所望の効果を測定するアッセイを用いて決定することができる。医薬組成物は、本明細書に記載の治療および予防の方法ならびに使用を実施するために、対象にex vivoまたはin vivoで投与され得る。
【0185】
本開示の薬学的組成物は、意図される方法または投与経路と適合するように処方され得る;例示的投与経路は本明細書に記載されている。適当な薬学的に許容されるまたは生理的に許容される希釈剤、担体または賦形剤としては、ヌクレアーゼ阻害剤、プロテアーゼ阻害剤、生理食塩水またはクエン酸緩衝生理食塩水などの適切なビヒクルが挙げられるが、これらに限定されない。
【0186】
[配列]
本明細書に記載されるさらなるポリペプチドの配列は、以下の通りである。
【実施例】
【0187】
これらの実施例は、例示のみを目的として提供され、本明細書に提供される特許請求の範囲を限定するものではない。
【0188】
[実施例1]
モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) の製造
この実施例は、モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) の製造を例示する。MAP-NBDはL. quateirensisに由来する。MAP-NBDは、配列番号2〜配列番号10または配列番号89のいずれかなどの、L. quateirensisからの複数の反復ドメインを含み、各反復ドメインは、特定のヌクレオチドまたは塩基対を認識して結合するように選択され、それによって、対象核酸配列を標的化し結合するMAP-NBDを提供する。核酸はDNA又はRNAである。MAP-NBDは組換え発現又は合成構築される。
【0189】
[実施例2]
モジュラ動物病原体-核酸結合ドメイン (MAP-NBD) -ヌクレアーゼの製造
この実施例は、モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) -ヌクレアーゼの製造を例示する。MAP-NBDはL. quateirensisに由来する。MAP-NBDは、配列番号2〜配列番号10、配列番号89、または配列番号33のいずれかなどのL. quateirensisからの複数の反復ドメインを含み、ここで、各反復ドメインは、特定のヌクレオチドまたは塩基対を認識して結合するように選択され、それによって、対象核酸配列を標的化し結合するMAP-NBDを提供する。MAP-NBDヌクレアーゼは組換え発現又は合成構築される。MAP-NBDは、任意のリンカーを介してヌクレアーゼに連結される。リンカーは、合成リンカー、配列番号1に記載の天然L. quateirensisタンパク質の全長C末端、または配列番号1に記載の天然L. quateirensisタンパク質のC末端の断片である。ヌクレアーゼは切断ドメイン(例えば、I-AniIまたはI-OnuIのようなメガヌクレアーゼ)または切断半ドメイン(例えば、FokIヌクレアーゼ、例えば、配列番号11、またはBfil)である。
【0190】
[実施例3]
モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) -遺伝子調節因子 (MAP-NBD-GR) の製造
この実施例は、モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) -遺伝子調節因子 (MAP-NBD-GR) の製造を例示する。MAP-NBDはL. quateirensisに由来する。MAP-NBDは、配列番号2〜配列番号10、配列番号89、または配列番号33のいずれかなどのL. quateirensisからの複数の反復ドメインを含み、ここで、各反復ドメインは、特定のヌクレオチドまたは塩基対を認識して結合するように選択され、それによって、対象核酸配列を標的化し結合するMAP-NBDを提供する。MAP-NBD-GRは、組換え的に発現されるか、または合成的に構築される。MAP-NBDは、任意のリンカーを介して遺伝子調節ドメインに連結される。リンカーは、合成リンカー、配列番号1に記載の天然L. quateirensisタンパク質の全長C末端、または配列番号1に記載の天然L. quateirensisタンパク質のC末端の断片である。遺伝子調節因子は、遺伝子アクチベーター(例えば、VP16、VP64、p65、p300触媒ドメイン、TET1触媒ドメイン、TDG、Ldb 1自己会合ドメイン、SAM活性化因子(VP64、p65、HSF1)、もしくはVPR (VP64、p65、Rta))または遺伝子リプレッサー(KRAB、Sin3a、LSD1、SUV39H1、G9A (EHMT2) 、DNMT1、DNMT3A-DNMT3L、DNMT3B、KOX、TGF-β誘導早期遺伝子 (TIEG) 、v-erbA、SID、MBD2、MBD3、RB、もしくはMeCP2)である。
【0191】
[実施例4]
モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) -フルオロフォアの製造
この実施例は、モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) -フルオロフォアの製造を例示する。MAP-NBDはL. quateirensisに由来する。MAP-NBDは、配列番号2〜配列番号10、配列番号89、または配列番号33のいずれかなどのL. quateirensisからの複数の反復ドメインを含み、ここで、各反復ドメインは、特定のヌクレオチドまたは塩基対を認識して結合するように選択され、それによって、対象核酸配列を標的化し結合するMAP-NBDを提供する。MAP-NBD-フルオロフォアは、組換え的に発現されるか、または合成的に構築される。MAP-NBDは、任意のリンカーを介してフルオロフォアに連結される。リンカーは、合成リンカー、配列番号1に記載の天然L. quateirensisタンパク質の全長C末端、または配列番号1に記載の天然L. quateirensisタンパク質のC末端の断片である。フルオロフォアは、緑色蛍光タンパク質またはmCHERRYなどの蛍光部分である。
【0192】
[実施例5]
モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) -ヌクレアーゼによるゲノム編集
この実施例は、モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) -ヌクレアーゼを用いたゲノム編集を示す。MAP-NBDヌクレアーゼは、実施例1および実施例2に記載のように製造される。MAP-NBDは、対象核酸配列を標的とする複数の反復配列を含むように作製される。ヌクレアーゼとして切断半ドメイン(例:FokI)を使用する場合、それぞれがFokI切断半ドメインを有する二つのMAP-NBDを作製し、投与する。FokI切断半ドメインに共有結合された第1のMAP-NBDは、第1の標的核酸配列に結合するように作製され、別のFokI切断半ドメインに共有結合された第2のMAP-NBDは、第2の標的核酸配列に結合するように作製され、ここで第1および第2の標的核酸配列は、第1および第2のMAP-NBDがそれぞれの標的核酸配列に結合する際にFokI切断半ドメインの二量体化を提供するように適切に間隔をあけて配置される。対象に投与されると、MAP-NBDはそれらの標的核酸配列に結合する。二つのFokI切断半ドメインの二量体化は酵素活性と二本鎖切断 (DSB) の誘導をもたらす。切断ドメイン(例えば、I-AniIまたはI-OnuIのようなメガヌクレアーゼまたは2つのFokIドメインの融合)を使用する場合、切断ドメインに結合した単一のMAP-NBDが、対象への投与後に標的核酸配列においてDSBを誘導する。対象は、細胞、複数の細胞、またはヒトもしくは非ヒト霊長類などの動物である。ヌクレアーゼは標的配列に二本鎖切断を誘導し、非相同末端結合または相同性誘導修復をもたらし、それによってゲノム編集機能性を提供する。
【0193】
[実施例6]
モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) -遺伝子調節因子 (MAP-NBD-GR) による遺伝子調節
この例は、モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) -遺伝子調節因子 (MAP-NBD-GR) による遺伝子調節を示す。MAP-NBD-GRは実施例1及び実施例3に記載のとおりに製造される。MAP-NBDは、対象核酸配列を標的とする複数の反復配列を含むように作製される。MAP-NBD-GRを対象に投与する。対象は、細胞、複数の細胞、またはヒトもしくは非ヒト霊長類などの動物である。次いで、MAP-NBD-GRは、実施例3に記載のように、遺伝子発現を調節する(例えば活性化ドメインまたは抑制ドメイン)。
【0194】
[実施例7]
モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) -フルオロフォアによるイメージング
この実施例は、モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) -フルオロフォアを用いた、細胞におけるゲノム遺伝子座のイメージングを例示する。MAP-NBDフルオロフォアは、実施例1及び4に記載のように製造される。MAP-NBDは、対象核酸配列を標的とする複数の反復配列を含むように作製される。MAP-NBD-フルオロフォアを細胞に投与する。細胞は、ex vivoで複数の細胞中にあるか、または、ヒトもしくは非ヒト霊長類などの動物内にある。MAP-NBD-フルオロフォアは、標的核酸配列にハイブリダイズし、それによって、前記標的核酸配列を標識する。イメージングは、標識された標的細胞の可視化を可能にし、標識された標的細胞は、標的ゲノム遺伝子座が存在することを示す。
【0195】
[実施例8]
L. quateirensisからの反復の塩基特異性
この例は、L. quateirensisからの反復配列の塩基特異性を決定することを示す。精製タグに融合された、配列番号1に記載の配列のL. quateirensisタンパク質を含むポリペプチドを構築した。配列番号89および配列番号2〜配列番号10の反復の各々の塩基特異性をSELEXによって決定した。
【0196】
標的ポリペプチドのin vitro転写及び翻訳 (IVTT) をThermo Fisher 1-Step Human Coupled IVT Kitを用いて行った。次の試薬を、ヌクレアーゼフリーのチューブに加えて混合した:Hela溶解物(15μl)、アクセサリータンパク質(3μl)、反応混合物(6μl)、プラスミドDNA (0.2〜0.5μg/μl) (2.4μl)、およびヌクレアーゼフリーH
2O (3.6μl)。反応は30℃で120分間から6時間行う。
【0197】
タンパク質発現は、適切な一次抗体およびHRP結合二次抗体を用いたウェスタンブロットによって検出した。
【0198】
4種類すべてのホスホロアミダイトの混合物を用いてオリゴヌクレオチドターゲットライブラリーをランダムに化学合成した。各オリゴヌクレオチド配列は、以下のように別個の20塩基対配列によって隣接されている:ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNAGATCGGAAGAGCACACGTC。ここで、Nは4つのホスホロアミダイトのいずれかである。各配列を3’ライブラリプライマー(5’- GACGTGTGCTCTTCCGATCT)にアニーリングさせて以下の条件でインキュベートすることによって、ライブラリー中のオリゴヌクレオチド配列を二本鎖に変換した:
【表4】
【0199】
以下のように、37℃で2.5時間、オリゴヌクレオチドライブラリーをExoIで消化してssDNAを除去した。
【表5】
【0200】
フェノール:クロロホルム:イソアミルアルコールおよびEtOH沈殿(-70℃、1.5時間)でDNAをクリーンアップした。二本鎖ライブラリーをQIAGEN EBバッファーに再懸濁した。
【0201】
SELEXは以下のSELEXバッファーを用いて行った。
【表6】
【表7】
【表8】
【0202】
試験した各ポリペプチドについて、25μlのDynabeads(登録商標)His-TagまたはPierce(商標)抗HA磁気ビーズを、200μlのSELEX結合バッファーで一度洗浄した。ビーズを25μlのSELEX結合バッファーに再懸濁し、氷上に置いた。
【0203】
SELEXサイクル1
全体積100μlのSELEXバッファー中でビーズ-タンパク質複合体を200 pmolのオリゴヌクレオチド二本鎖ライブラリーと混合した。インビトロ転写および翻訳反応の反応生成物を、SELEX緩衝液と10分間プレインキュベートし、次いで、ライブラリー二重鎖に添加した。
【表9】
チューブをローテーター上に低角度で置き、室温で50分間インキュベートした。8μlの洗浄したビーズ(SELEX結合バッファー中)を複合体に添加し、ローテーター上で20分間インキュベートした。チューブをマグネット上に2分間置き、上清を廃棄した。ビーズをSELEX洗浄バッファーで6回洗浄した。結合したDNA標的(ビーズを伴う)を、以下の5’/3’ライブラリープライマーを用いてPCR増幅した:fwd: ACACGACGCTCTTCCGATCT
rev: GACGTGTGCTCTTCCGATCT
【表10】
PCR-1反応をマグネット上のビーズから分離した。5μlのPCR-1反応をPCR-2増幅に使用し、μlのPCR-2をSELEXサイクル2で使用した。
【表11】
【0204】
SELEXサイクル2
ビーズ-タンパク質複合体を、第1のサイクルからのPCR産物と、合計容量100μlのSELEXバッファー中で混合した。in vitro転写翻訳 (IVTT) 反応をSELEXバッファーと10分間プレインキュベートした。
【表12】
チューブをローテーター上に低角度で置き、室温で50分間インキュベートした。8μlの洗浄したビーズ(SELEX結合バッファー中)を複合体に添加し、ローテーター上で20分間インキュベートした。チューブをマグネット上に2分間置き、上清を廃棄した。ビーズを、SELEXバッファーで6回洗浄した。結合したDNA標的(ビーズを伴う)を、以下の5’/3’ライブラリープライマーを用いてPCR増幅した:fwd: ACACGACGCTCTTCCGATCT および rev: GACGTGTGCTCTTCCGATCT。
【表13】
PCR-1反応をマグネット上のビーズから分離した。5μlのPCR-1反応をPCR-2増幅に使用し、25μlのPCR-2を第3のSELEXサイクルで使用した。
【表14】
【0205】
SELEXサイクル3
IVTTタンパク質と第1サイクルのPCR産物を、合計100μlのSELEXバッファー中で混合する。in vitro転写翻訳 (IVTT) 反応をSELEXバッファーと共に10分間プレインキュベートした。
【表15】
チューブをローテーター上に低角度で置き、室温で50分間インキュベートした。8μlの洗浄したビーズ(SELEXバインディングバッファ中)を複合体に添加し、ローテーター上で20分間インキュベートした。チューブをマグネット上に2分間置き、上清を廃棄した。ビーズをSELEX洗浄バッファーで6回洗浄した。結合したDNA標的(ビーズを伴う)を、以下5’/3’ライブラリプライマーを用いてPCR増幅した:ACACGACGCTCTTCCGATCT, rev: GACGTGTGCTCTTCCGATCT。
【表16】
PCR-1反応をマグネット上のビーズから分離した。5μlのPCR-1反応をPCR-2増幅に用いた。
【表17】
第3のSELEXサイクルからのPCR-1反応をマグネット上のビーズから分離した。第1、第2、および第3 SELEXサイクルからのPCR-1反応をMiniSeqによって分析した。
【0206】
BBmergeを用いてペアエンド読み取りをマージした。認識される定常領域の間から25塩基対の可変領域配列を抽出した。全セットから5000の配列を無作為に抽出し(重複物を含む)、パラメータ'-maskR 1 -fullScan 1 -gen 3'を用いたGADEMモチーフ発見プログラムへの入力として与えた。
図4Aおよび4Bにおける配列ロゴは、GADEM MMEフォーマットモチーフファイルからMEMEスイートにおける「ceqlogo」ツールを用いて描かれた。
【0207】
図4Aおよび4Bは配列番号1のポリペプチドについて決定された結合モチーフを示し、それはL. quateirensisのN末端に存在する配列LGHKELIKIAARNGGGNNLIAVLSCYAKLKEMG (配列番号89)およびそれに続く配列番号2〜配列番号10の反復のそれぞれを含む。特定の位置における塩基のサイズが大きいほど、試験されたポリペプチドに結合した核酸中のその位置にその塩基が存在する相対的頻度が高い。
【0208】
図4Aは、配列番号1に記載のアミノ酸配列を有するポリペプチドの反復配列(N末端からC末端へと配列された配列番号89および2〜10)が結合する塩基を示す。配列番号1に記載のアミノ酸配列を有するポリペプチドはHisタグに融合させた。
【0209】
図4Bは、配列番号1に記載のアミノ酸配列を有するポリペプチドの反復配列(N末端からC末端に:配列番号89および2〜10)が結合する塩基を示す。配列番号1に記載のアミノ酸配列を有するポリペプチドはHAタグに融合させた。His標識ポリペプチドとHA標識ポリペプチドは同じ結合特異性を示した。
【0210】
図4Aおよび
図4Bの位置重みマトリックス (PWM) の数値表現を以下の表に示す。均一なバックグラウンドからのバックグラウンド文字頻度は以下の通りである:A - 0.25000; C - 0.25000; G - 0.25000; および T - 0.25000。
【表18】
【表19】
【0211】
[実施例9]
モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) の作製
この実施例は、モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) の製造を例示する。MAP-NBDは、L. quateirensis、Burkholderia、Paraburkholderia、Francisella、又はそれらの任意の組み合わせに由来する。MAP-NBDは、L. quateirensis、Burkholderia、Paraburkholderia、Francisellaまたはそれらの任意の組合せからの複数の反復ドメイン、例えば表1の反復のうちの任意の1つを含み、ここで各反復ドメインは、特定のヌクレオチドまたは塩基対を認識して結合するように選択され、それによって、対象核酸配列を標的化し結合するMAP-NBDを提供する。核酸はDNA又はRNAである。MAP-NBDは組換え発現又は合成構築される。
【0212】
[実施例10]
モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) -ヌクレアーゼの製造
この実施例は、モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) -ヌクレアーゼの製造を例示する。MAP-NBDは、L. quateirensis、Burkholderia、Paraburkholderia、Francisella、又はそれらの任意の組み合わせに由来する。MAP-NBDは、L. quateirensis、Burkholderia、Paraburkholderia、Francisellaまたはそれらの任意の組合せからの複数の反復ドメイン、例えば配列番号2〜配列番号95のいずれか一つを含み、ここで各反復ドメインは、特定のヌクレオチドまたは塩基対を認識して結合するように選択され、それによって、対象核酸配列を標的化し結合するMAP-NBDを提供する。MAP-NBDヌクレアーゼは組換え発現又は合成構築される。MAP-NBDは、任意のリンカーを介してヌクレアーゼに連結される。リンカーは、合成リンカー、天然L. quateirensis、Burkholderia、ParaburkholderiaまたはFrancisellaタンパク質の全長C末端、またはその切り詰め形態である。ヌクレアーゼは切断ドメイン(例えば、I-AniIまたはI-OnuIのようなメガヌクレアーゼ)または切断半ドメイン(例えば、FokIヌクレアーゼ、例えば、配列番号11、またはBfil)である。
【0213】
[実施例11]
モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) -遺伝子調節因子 (MAP-NBD-GR) の製造
この実施例は、モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) -遺伝子調節因子 (MAP-NBD-GR) の製造を例示する。MAP-NBDは、L. quateirensis、Burkholderia、Paraburkholderia、Francisella、又はそれらの任意の組み合わせに由来する。MAP-NBDは、L. quateirensis、Burkholderia、Paraburkholderia、Francisellaまたはその任意の組合せからの複数の反復ドメイン、例えば表1に列挙された反復のうちの任意の1つを含み、ここで各反復ドメインは、特定のヌクレオチドまたは塩基対を認識して結合するように選択され、それによって、対象核酸配列を標的化し結合するMAP-NBDを提供する。MAP-NBD-GRは、組換え的に発現されるか、または合成的に構築される。MAP-NBDは、任意のリンカーを介して遺伝子調節ドメインに連結される。リンカーは、合成リンカー、天然L. quateirensis、Burkholderia、ParaburkholderiaもしくはFrancisellaタンパク質の全長C末端、またはそのC末端の切り詰め形態である。遺伝子調節因子は、遺伝子アクチベーター(例えば、VP16、VP64、p65、p300触媒ドメイン、TET1触媒ドメイン、TDG、Ldb1自己会合ドメイン、SAM活性化因子(VP64、p65、HSF1)、もしくはVPR (VP64、p65、Rta))または遺伝子リプレッサー(KRAB、Sin3a、LSD1、SUV39H1、G9A (EHMT2) 、DNMT1、DNMT3A-DNMT3L、DNMT3B、KOX、TGF-β誘導早期遺伝子 (TIEG) 、v-erbA、SID、MBD2、MBD3、RB、もしくはMeCP2)である。
【0214】
[実施例12]
モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) -フルオロフォアの製造
この実施例は、モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) -フルオロフォアの製造を例示する。MAP-NBDは、L. quateirensis、Burkholderia、Paraburkholderia、Francisella、又はそれらの任意の組み合わせに由来する。MAP-NBDは、L. quateirensis、Burkholderia、Paraburkholderia、Francisellaまたはその任意の組合せからの複数の反復ドメイン、例えば表1に列挙された反復のうちの任意の1つを含み、ここで各反復ドメインは、特定のヌクレオチドまたは塩基対を認識して結合するように選択され、それによって、対象核酸配列を標的化し結合するMAP-NBDを提供する。MAP-NBD-フルオロフォアは、組換え的に発現されるか、または合成的に構築される。MAP-NBDは、任意のリンカーを介してフルオロフォアに連結される。リンカーは、合成リンカー、天然L. quateirensis、Burkholderia、ParaburkholderiaもしくはFrancisellaタンパク質の全長C末端、またはそのC末端の切り詰め形態である。フルオロフォアは、緑色蛍光タンパク質またはmCHERRYなどの蛍光部分である。
【0215】
[実施例13]
モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) -ヌクレアーゼによるゲノム編集
この実施例は、モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) -ヌクレアーゼを用いたゲノム編集を示す。MAP-NBDヌクレアーゼは、実施例9および実施例10に記載のように製造する。MAP-NBDは、対象核酸配列を標的とする複数の反復配列を含むように作製される。ヌクレアーゼとして切断半ドメインを使用する場合(例:FokI)、それぞれがFokI切断半ドメインを有する二つのMAP-NBDを作製し、投与する。FokI切断半ドメインに共有結合された第1のMAP-NBDは第1の標的核酸配列に結合するように作製され、別のFokI切断半ドメインに共有結合された第2のMAP-NBDは第2の標的核酸配列に結合するように作製され、ここで、第1および第2の標的核酸配列は、第1および第2のMAP-NBDがそれぞれの標的核酸配列に結合する際にFokI切断半ドメインの二量体化を提供するように、適切に間隔をあけて配置される。対象に投与すると、MAP-NBDはそれらの標的核酸配列に結合する。二つのFokI切断半ドメインの二量体化は酵素活性と二本鎖切断 (DSB) の誘導をもたらす。切断ドメイン(例えば、I-AniIまたはI-OnuIのようなメガヌクレアーゼまたは2つのFokIドメインの融合)を使用する場合、対象への投与後に、切断ドメインに結合した単一のMAP-NBDが標的核酸配列においてDSBを誘導する。対象は、細胞、複数の細胞、またはヒトもしくは非ヒト霊長類などの動物である。ヌクレアーゼは標的配列に二本鎖切断を誘導し、非相同末端結合または相同性誘導の修復をもたらし、それによってゲノム編集機能性を提供する。
【0216】
[実施例14]
モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) -遺伝子調節因子 (MAP-NBD-GR) による遺伝子調節
この例は、モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) -遺伝子調節因子 (MAP-NBD-GR) による遺伝子調節を示す。MAP-NBD-GRは実施例9及び実施例11に記載のとおり製造される。MAP-NBDは、対象核酸配列を標的とする複数の反復配列を含むように作製される。MAP-NBD-GRを対象に投与する。対象は、細胞、複数の細胞、またはヒトもしくは非ヒト霊長類などの動物である。続いてMAP-NBD-GRが遺伝子発現を調節する(すなわちその活性化ドメインまたは抑制ドメインを介して)。
【0217】
[実施例15]
モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) -フルオロフォアによるイメージング
この実施例は、モジュラー動物病原体-核酸結合ドメイン (MAP-NBD) -フルオロフォアを用いた、細胞におけるゲノム遺伝子座のイメージングを例示する。MAP-NBDフルオロフォアは、実施例9及び12に記載のように製造される。MAP-NBDは、対象核酸配列を標的とする複数の反復配列を含むように作製される。MAP-NBD-フルオロフォアを細胞に投与する。細胞は、ex vivoの複数の細胞中、または、ヒトもしくは非ヒト霊長類などの動物中にある。MAP-NBD-フルオロフォアは、標的核酸配列にハイブリダイズし、それによって標的核酸配列を標識する。イメージングは、標識された標的細胞の可視化を可能にし、標識された標的細胞は、標的ゲノム遺伝子座が存在することを示す。
【0218】
[実施例16]
L. maceacherniiからの反復のインビトロ塩基特異性
L. maceacherniiからの仮想タンパク質WP_058451450「LEGm」において同定された反復の塩基特異性を決定するために、全長タンパク質をコードするDNA構築物を操作し作製した。全長タンパク質(配列番号143に記載の配列を有する)を、インビトロ転写および翻訳反応によって合成し、SELEX-seq法を用いて特徴づけを行った。同定した配列モチーフを、各タンパク質のモジュール構造と比較して、各反復ならびにN末端及びC末端にDNA塩基嗜好性を割り当てた。実施例8に記載された、L. quateirensisからの仮想タンパク質WP_WP_058473422(配列番号1)「LEGq」において同定された反復の塩基特異性がさらに確認された。
【0219】
構築物
LEGqおよびLEGmタンパク質は、それらのドメイン構造に基づいて、N末端、個々の反復単位およびC末端のモジュールに分けた。これらのモジュールをコードするDNAモジュールを、隣接する制限部位を伴わせて操作し合成した(Integrated DNA Technologies, Coralville, Iowa)。Reyon et al. 2013, (Current Protocols in Molecular Biology, 12.16.1)の改変プロトコールを用いてこれらのDNAモジュールを連結し、全長タンパク質をコードするDNA構築物を作製した。LEGqタンパク質の場合、全長タンパク質全体をコードするDNA構築物を合成した。LEGm構築物は、SELEX中のタンパク質保持を可能にするN末端FLAGタグおよびC末端HAタグをコードするように操作し、完全に組み立てられた構築物をpVax_NG_63aaにクローニングし、E. coli中で増殖させ、標準的な方法を用いて精製した。LEGq構築物はpT7CFE1-CHAベクター(サーモサイエンティフィック)中にクローニングされ(このベクターがタンパク質にC末端HAタグを付加した)、E. coli中で増殖させ、標準的な方法を用いて精製した。精製したプラスミド構築物をサンガー配列決定に供して、予想されるDNA配列を確認した。各モジュールの配列番号は以下のとおりである。
【0220】
SELEX-seq
in vitro転写/翻訳 (IVTT) キットを使用し、製造業者のプロトコルを用いて、LEGq (1ステップヒトカップリングIVT、Promega)およびLEGm (TnT Quick Coupled Transcription/Translation kit、Thermo Scientific)のためのプラスミド構築物から全長タンパク質を生産した。SELEX-seqプロトコルは、Miller et al. 2011 (上記) から改変された。簡単に述べれば、共通の20 ntアダプター配列に隣接され一本鎖DNAオリゴヌクレオチドとして注文された25ヌクレオチド (nt) 長のランダム配列のライブラリーが作製された。プライマー伸長を用いて二本鎖DNAライブラリーを作製した。
【0221】
IVTTタンパク質を以下のSELEXサイクルに3回供した:タンパク質を二本鎖DNAに結合させる;抗HA磁気ビーズ上のタンパク質:DNA複合体の固定化および未結合DNAの洗い落し;結合したDNAのPCR増幅。このようにして、タンパク質に結合したDNA分子を、LEGqおよびLEGqタンパク質への後続回の結合のためのインプットとして使用し、各サイクルにおいて、DNA分子プール内でこれらのタンパク質の好まれる結合配列を濃縮した。
【0222】
各SELEXサイクルからのPCR試料を1:50に希釈し、25 ntランダム配列に隣接する共通アダプターを認識するインデックス化プライマーを用いて増幅した。PCRをプールし、精製し、Illumina MiniSeq装置で配列決定した。
【0223】
SELEX seqデータ解析
MiniSeqからの配列リードは、プライマーのインデックス配列を用いてマルチプレックス性を解き、個々のSELEXサンプルに配列リードを割り当てた。次いで、これらのリードを、25ヌクレオチドの可変領域に隣接する共通アダプターに一致する定常配列を要件とするフィルターに通した。各サンプルからの5,000リードのランダムサンプルを、GADEMモチーフファインダー(Li et al. 2009, Journal of Computational Biology, 16(2):317-29)へのインプットとして使用した。発見されたモチーフは、MEMEスイート(Bailey et al. 2015, Nucleic Acids Research, 43(W1):W39-49)の「ceqlogo」機能を使用して視覚化された。
結果
SELEX-seqによって発見されたLEGqおよびLEGmタンパク質についての結合モチーフをそれぞれ
図8Aおよび8Bに示し、認識されたDNA塩基を以下に列挙する。
【0224】
[実施例17]
L. maceacherniiからの反復のインビボ塩基特異性
クロマチンの文脈におけるDNAに対するLEGmタンパク質(配列番号143)のDNA結合嗜好性を、それをインビボで発現させFLAG-seq法を用いてヒトゲノムにおけるそのその結合位置を検出することによって、評価した。
【0225】
FLAG-seq
【0226】
「FLAG-seq」と称されるアプローチである、FLAGタグタンパク質の検出のためのCUT&RUN-seq法(Skene and Henikoff 2017)を用いて、LEGmのインビボ結合を検出した。簡単に述べれば、上記のLEGm構築物を制限消化によって直線化し、製造業者のプロトコルに従ってT7 mScript(商標)スタンダードmRNA生産システム (CellScript) を用いたインビトロ転写に供した。このLEGMをコードするmRNAの1マイクログラムを、特定の細胞型についての製造業者の指示に従ってBTX ECM-830ヌクレオフェクションデバイス(Harvard Apparatus)を用いて50万個のCD3+ T細胞にトランスフェクトした。細胞を37℃で六時間インキュベートし、LEGmタンパク質の検出のためにFLAGタグを用いたCUT&RUN-seqプロトコールに供した。対照細胞およびLEGmトランスフェクト細胞から単離したDNA断片を末端修復し、製造業者のプロトコールに従ってSMARTer ThruPLEX DNA-seqキット (タカラ) を用いて配列決定アダプターに連結し、Illumina NextSeq装置で標準プロトコールを用いて配列決定した。
【0227】
FLAG-seqデータ分析
【0228】
NextSeqからの配列リードを脱マルチプレックス化して個々のFLAG-seqサンプルに配列を割り当て、BWAアルゴリズム(Li and Durbin 2009)を用いて参照ヒトゲノムに整列された。MACSピーク呼び出しアルゴリズム(Zhang et al. 2008)を用いて、対照細胞およびLEGmトランスフェクト細胞からのFLAG-seqシグナルを比較することにより、LEGm結合の位置を発見し、次いで、MMEツール一式(Bailey et al. 2015)を用いて、富化された配列モチーフについてマイニングした。この分析は、複数のSELEX-seq実験で観察されたLEGmについての同じ結合モチーフを再取得した (
図9) 。
【0229】
本明細書では、本発明の好ましい実施形態を示し、説明してきたが、当業者には、そのような実施形態が単なる例として提供されることが明らかであろう。当業者にあっては、本発明から逸脱することなく多くの変形、変更、および置換が生じるであろう。本明細書に記載される発明の実施形態に対する様々な代替手段を本発明の実施に使用できることが理解されるべきである。以下の特許請求の範囲は、本発明の範囲を定義し、これらの特許請求の範囲内の方法および構造ならびにそれらの均等物がそれによってカバーされることが意図される。
【0230】
完全性のために、本開示のポリペプチド、組成物および方法の特定の態様が以下の番号を付した項に記載される。
1.動物病原体タンパク質に由来する非天然型モジュラー核酸結合ドメイン(MAP-NBD)を含む組成物であって、前記MAP-NBDが複数の反復単位を含み、前記複数の反復単位の反復単位が標的核酸を認識する、組成物。
2.前記動物病原体タンパク質が細菌に由来する、第1項の組成物。
3.前記細菌がLegionella属から選択される、第2項の組成物。
4.前記細菌が、L. quateirensisである、2〜3項のいずれか一項に記載の組成物。
5.前記反復単位が1xxx211x1xxx33x2x1xxxxxxxxx1(配列番号19)のコンセンサス配列を含む、1〜4項のいずれか一項の組成物。
6.前記標的核酸が単一ヌクレオチド、単一塩基対、または両方である、1〜5項のいずれか一項の組成物。
7.前記標的核酸がDNAまたはRNAである、1〜6項のいずれか一項の組成物。
8.前記MAP-NBDが標的核酸配列に結合する、1〜7項のいずれか一項の組成物。
9.前記標的核酸配列がDNAまたはRNAである、第8項の組成物。
10.機能ドメインをさらに含む、1〜9項のいずれか一項の組成物。
11.前記MAP-NBDと前記機能ドメインとの間に、天然又は非天然のリンカーをさらに含む、10項の組成物。
12.前記機能ドメインは、酵素、活性化ドメイン、抑制ドメイン、ビオチン化試薬、DNAヌクレオチド修飾因子、またはフルオロフォアを含む、10〜11項のいずれか一項の組成物。
13.前記酵素がヌクレアーゼ、DNA修飾タンパク質、またはクロマチン修飾タンパク質である、12項の組成物。
14.前記ヌクレアーゼが切断ドメインまたは半切断ドメインである、13項の組成物。
15.前記切断ドメインまたは半切断ドメインがIIS型制限酵素を含む、14項の組成物。
16.前記IIS型制限酵素がFokIまたはBfilを含む15項の組成物。
17.FokIが、配列番号11に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも97%、または少なくとも99%の配列同一性を有する、16項の組成物。
18.FokIが配列番号11の配列を有する、16〜17項のいずれか一項の組成物。
19.前記クロマチン修飾タンパク質がリジン特異的ヒストンデメチラーゼ1(LSD1)である、13項の組成物。
20.前記活性化ドメインがVP16、VP64、p65、p300触媒ドメイン、TET1触媒ドメイン、TDG、Ldb1自己会合ドメイン、SAM活性化因子(VP64、p65、HSF1)、VPR(VP64、p65、Rta)を含む、12項の組成物。
21.前記リプレッサードメインがKRAB、Sin3a、LSD1、SUV39H1、G9A(EHMT2)、DNMT1、DNMT3A-DNMT3L、DNMT3B、KOX、TGF-β誘導早期遺伝子(TIEG)、v-erbA、SID、MBD2、MBD3、Rb、又はMeCP2を含む、12項の組成物。
22.前記DNAヌクレオチド修飾因子がアデノシンデアミナーゼである、12項の組成物。
23.前記機能ドメインが、前記モジュラー核酸結合ドメインによって特定されるゲノム遺伝子座におけるゲノム編集、遺伝子調節、またはイメージングを可能にする、10〜22項のいずれか一項の組成物。
24.前記反復単位が、配列番号2〜配列番号10のいずれか一つに対して、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも97%、または少なくとも99%の配列同一性を有する、1〜23項のいずれか一項の組成物。
25.前記反復単位が配列番号2〜配列番号10のいずれかである、1〜24項のいずれか一項の組成物。
26.前記反復単位が野生型タンパク質に由来する1〜25項のいずれか一項の組成物。
27.前記反復単位が野生型タンパク質の改変を含む、1〜25項のいずれか一項の組成物。
28.前記改変が標的ヌクレオチド、塩基対、またはその両方の特異的認識を増強する、27項の組成物。
29.前記改変が1から29個の改変を含む、27〜28項のいずれか一項の組成物。
30.前記動物病原体タンパク質が、配列番号1に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも97%、または少なくとも99%の配列同一性を有する、1〜29項のいずれか一項の組成物。
31.前記動物病原体タンパク質が配列番号1である、1〜30項のいずれか一項の組成物。
32.前記標的核酸配列が、PDCD1遺伝子、CTLA4遺伝子、LAG3遺伝子、TET2遺伝子、BTLA遺伝子、HAVCR2遺伝子、CCR5遺伝子、CXCR4遺伝子、TRA遺伝子、TRB遺伝子、B2M遺伝子、アルブミン遺伝子、HBB遺伝子、HBA1遺伝子、TTR遺伝子、NR3C1遺伝子、CD52遺伝子、BCL11A遺伝子の赤血球特異的エンハンサー、CBLB遺伝子、TGFBR1遺伝子、SERPINA1遺伝子、感染細胞におけるHBVゲノムDNA、CEP290遺伝子、DMD遺伝子、CFTR遺伝子、IL2RG遺伝子、またはそれらの組合せのなかにある、1〜31項の組成物。
33.前記標的核酸配列の領域の切断の際にキメラ抗原受容体(CAR)、α-Lイズロニダーゼ(IDUA)、イズロネート-2-スルファターゼ(IDS)又は第9因子(F9)が挿入される、1〜32項のいずれか一項の組成物。
34.対象においてゲノム編集をする方法であって:
非天然型モジュラー核酸結合ドメインを投与すること;および
二本鎖切断を誘発すること
を含み、前記モジュラー核酸結合ドメインが、動物病原体タンパク質に由来するモジュラー核酸結合ドメイン(MAP-NBD)を含み、前記MAP-NBDが複数の反復単位を含み、前記複数の反復単位の反復単位が標的核酸を認識する、
方法。
35.第二のMAP-NBDをさらに含み、前記第二のMAP-NBDが第二の複数の反復単位を含み、第二の複数の反復単位の反復単位が第二の標的核酸を認識する、34項記載の方法。
36.前記MAP-NBD、前記第二のMAP-NBD、またはその両方が機能ドメインをさらに含む、34〜35項のいずれか一項の方法。
37.前記機能ドメインが切断ドメインまたは切断半ドメインを含む、36項記載の方法。
38.前記切断ドメインまたは切断半ドメインがFokIまたはBfilを含む、35項の方法。
39.前記切断ドメインがメガヌクレアーゼを含む、38項の方法。
40.FokIは、配列番号11に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも97%、または少なくとも99%の配列同一性を有する、38項の方法。
41.FokIが配列番号11の配列を有する、38項または40項のいずれか一項に記載の方法。
42.前記標的核酸配列が、PDCD1遺伝子、CTLA4遺伝子、LAG3遺伝子、TET2遺伝子、BTLA遺伝子、HAVCR2遺伝子、CCR5遺伝子、CXCR4遺伝子、TRA遺伝子、TRB遺伝子、B2M遺伝子、アルブミン遺伝子、HBB遺伝子、HBA1遺伝子、TTR遺伝子、NR3C1遺伝子、CD52遺伝子、BCL11A遺伝子の赤血球特異的エンハンサー、CBLB遺伝子、TGFBR1遺伝子、SERPINA1遺伝子、感染細胞におけるHBVゲノムDNA、CEP290遺伝子、DMD遺伝子、CFTR遺伝子、IL2RG遺伝子、またはそれらの組合せのなかにある、34〜41項の方法。
43.前記標的核酸配列の領域の切断の際にキメラ抗原受容体(CAR)、α-Lイズロニダーゼ(IDUA)、イズロネート-2-スルファターゼ(IDS)又は第9因子(F9)が挿入される、34〜42項のいずれか一項の方法。
44.対象において遺伝子調節を行う方法であって:
非天然型モジュラー核酸結合ドメインを投与すること;および
遺伝子の発現を調節すること
を含み、前記モジュラー核酸結合ドメインが動物病原体タンパク質に由来するモジュラーDNA結合ドメイン(MAP-NBD)を含み、前記MAP-NBDが複数の反復単位を含み、前記複数の反復単位の反復単位が標的核酸を認識する、
方法。
45.前記MAP-NBDが機能ドメインをさらに含む、44項の方法。
46.前記機能ドメインが活性化ドメインまたは抑制ドメインを含む、45項記載の方法。
47.前記活性化ドメインがVP16、VP64、p65、p300触媒ドメイン、TET1触媒ドメイン、TDG、Ldb1自己会合ドメイン、SAM活性化因子(VP64、p65、HSF1)、VPR(VP64、p65、Rta)を含む、46項記載の方法。
48.前記リプレッサードメインがKRAB、Sin3a、LSD1、SUV39H1、G9A(EHMT2)、DNMT1、DNMT3A-DNMT3L、DNMT3B、KOX、TGF-β誘導早期遺伝子(TIEG)、v-erbA、SID、MBD2、MBD3、Rb、又はMeCP2を含む、46項の方法。
49.前記標的核酸配列が、PDCD1遺伝子、CTLA4遺伝子、LAG3遺伝子、TET2遺伝子、BTLA遺伝子、HAVCR2遺伝子、CCR5遺伝子、CXCR4遺伝子、TRA遺伝子、TRB遺伝子、B2M遺伝子、アルブミン遺伝子、HBB遺伝子、HBA1遺伝子、TTR遺伝子、NR3C1遺伝子、CD52遺伝子、BCL11A遺伝子の赤血球特異的エンハンサー、CBLB遺伝子、TGFBR1遺伝子、SERPINA1遺伝子、感染細胞におけるHBVゲノムDNA、CEP290遺伝子、DMD遺伝子、CFTR遺伝子、IL2RG遺伝子、またはそれらの組合せのなかにある、44〜48項の方法。
50.前記標的核酸配列の領域の切断の際にキメラ抗原受容体(CAR)、α-Lイズロニダーゼ(IDUA)、イズロネート-2-スルファターゼ(IDS)又は第9因子(F9)が挿入される、44〜49項のいずれか一項の方法。
51.ゲノム遺伝子座をイメージングする方法であって:
非天然型モジュラー核酸結合ドメインを投与すること;および
対象をイメージング化すること
を含み、前記モジュラー核酸結合ドメインが動物病原体タンパク質に由来するモジュラーDNA結合ドメイン(MAP-NBD)を含み、前記MAP-NBDが複数の反復単位を含み、前記複数の反復単位の反復単位が標的核酸を認識する、
方法。
52.前記MAP-NBDが機能ドメインをさらに含む、51項の方法。
53.前記機能ドメインはイメージング剤である、第52項の方法。
54.前記イメージング剤は蛍光部分である、53項の方法。
55.前記蛍光部分がGFPまたはmCHERRYである、54項の方法。
56.前記標的核酸が単一ヌクレオチド、単一塩基対、またはその両方である、38〜55項のいずれか一項に記載の方法。
57.前記標的核酸がDNAまたはRNAである、38〜56項のいずれか一項に記載の方法。
58.前記MAP-NBDが標的核酸配列を認識する、38〜57項のいずれか一項の方法。
59.前記MAP-NBDが前記標的核酸配列に結合する、58項記載の方法。
60.前記標的核酸配列がDNAまたはRNAである、58〜59項のいずれか一項の方法。
61.前記MAP-NBDと前記機能ドメインとの間にリンカーをさらに含む、34〜43項、44〜50項または51〜60項のいずれか一項の方法。
62.前記動物病原体タンパク質が細菌に由来する、32〜61項のいずれか一項の方法。
63.前記細菌がLegionella属から選択される、62項の方法。
64.前記細菌は、L. quateirensisである62〜63項のいずれか一項に記載の方法。
65.前記反復単位が1xxx211x1xxx33x2x1xxxxxxxxx1(配列番号19)のコンセンサス配列を含む、32〜64項のいずれか一項の方法。
66.前記反復単位が、配列番号2〜配列番号10のいずれか一つに対して、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも97%、または少なくとも99%の配列同一性を有する、32〜65項のいずれか一項の方法。
67.前記反復単位が配列番号2〜配列番号10のいずれかである、32〜66項のいずれか一項の方法。
68.前記反復単位が野生型タンパク質に由来する、32〜67項のいずれか一項の方法。
69.前記反復単位が野生型タンパク質の改変を含む、32〜68項のいずれか一項に記載の方法。
70.前記改変が標的ヌクレオチドの特異的認識を増強する、69項の方法。
71.前記改変が1から29個の改変を含む、69〜70項のいずれか一項に記載の方法。
72.前記動物病原体タンパク質が、配列番号1に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも97%、または少なくとも99%の配列同一性を有する、32〜71項のいずれか一項に記載の方法。
73.前記動物病原体タンパク質が配列番号1である、32〜66のいずれか1項の方法。
74.前記ゲノム遺伝子座が細胞内にある、32〜73項のいずれか1項の方法。
75.前記細胞が、ex vivoの複数の細胞のなか、ヒトのなか、又は非ヒト動物のなかにある、68項の方法。
76.前記標的核酸配列が、PDCD1遺伝子、CTLA4遺伝子、LAG3遺伝子、TET2遺伝子、BTLA遺伝子、HAVCR2遺伝子、CCR5遺伝子、CXCR4遺伝子、TRA遺伝子、TRB遺伝子、B2M遺伝子、アルブミン遺伝子、HBB遺伝子、HBA1遺伝子、TTR遺伝子、NR3C1遺伝子、CD52遺伝子、BCL11 A遺伝子の赤血球特異的エンハンサー、CBLB遺伝子、TGFBR1遺伝子、SERPINA1遺伝子、感染細胞中のHBVゲノムDNA、CEP290遺伝子、DMD遺伝子、CFTR遺伝子、IL2RG遺伝子、またはそれらの組合せのなかにある、51〜75項のいずれか1項の方法。
77.前記標的核酸配列の領域の切断の際にキメラ抗原受容体(CAR)、α-Lイズロニダーゼ(IDUA)、イズロネート-2-スルファターゼ(IDS)又は第9因子(F9)が挿入される、51〜76項のいずれか一項の方法。