IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ビーム セラピューティクス インク.の特許一覧

特許7679311プログラム可能塩基エディターシステムを用いた一塩基多型編集法
<>
  • 特許-プログラム可能塩基エディターシステムを用いた一塩基多型編集法 図1
  • 特許-プログラム可能塩基エディターシステムを用いた一塩基多型編集法 図2
  • 特許-プログラム可能塩基エディターシステムを用いた一塩基多型編集法 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-05-09
(45)【発行日】2025-05-19
(54)【発明の名称】プログラム可能塩基エディターシステムを用いた一塩基多型編集法
(51)【国際特許分類】
   C12N 15/09 20060101AFI20250512BHJP
   C12N 9/78 20060101ALN20250512BHJP
【FI】
C12N15/09 110
C12N9/78 ZNA
【請求項の数】 33
(21)【出願番号】P 2021568855
(86)(22)【出願日】2020-05-20
(65)【公表番号】
(43)【公表日】2022-07-25
(86)【国際出願番号】 US2020033807
(87)【国際公開番号】W WO2020236936
(87)【国際公開日】2020-11-26
【審査請求日】2023-05-19
(31)【優先権主張番号】62/850,919
(32)【優先日】2019-05-21
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】520439645
【氏名又は名称】ビーム セラピューティクス インク.
(74)【代理人】
【識別番号】100083806
【弁理士】
【氏名又は名称】三好 秀和
(74)【代理人】
【識別番号】100095500
【弁理士】
【氏名又は名称】伊藤 正和
(74)【代理人】
【識別番号】100111235
【弁理士】
【氏名又は名称】原 裕子
(74)【代理人】
【識別番号】100195257
【弁理士】
【氏名又は名称】大渕 一志
(72)【発明者】
【氏名】ゲールケ、 ジェイソン マイケル
(72)【発明者】
【氏名】ペトロシャン、 ナタリー
【審査官】長谷川 強
(56)【参考文献】
【文献】国際公開第2019/078263(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/09
C12N 9/78
CAplus/REGISTRY(STN)
(57)【特許請求の範囲】
【請求項1】
メチルCpG結合タンパク質2(MECP2)遺伝子を編集するin vitroまたはex vivoの方法であって、細胞、組織、または臓器に、
(i)アデノシン塩基エディターまたはそれをコードする核酸配列、および
(ii)ガイドRNAまたはそれをコードする核酸配列
を投与する工程を含み、ここでアデノシン塩基エディターはCas9のプログラム可能DNA結合ドメインおよびアデノシンデアミナーゼドメインを含み、アデノシンデアミナーゼドメインは、以下のアミノ酸配列:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
に対して少なくとも90%の同一性を有するアミノ酸配列またはN末端メチオニンのみを欠くその断片であって、改変の組合せを有するものを含み、ここで前記改変の組合せは、
Y147R + Q154S;
V82S + Q154S;
V82S + Y147R;
V82S + Q154R;
V82S + Y123H;
I76Y + V82S;
V82S + Y123H + Y147T;
V82S + Y123H + Y147R;
V82S + Y123H + Q154R;
V82S + Y123H + Y147R + Q154R; および
I76Y + V82S + Y123H + Y147R + Q154R;
からなる群から選択され、
前記ガイドRNAは、前記アデノシン塩基エディターを誘導して、レット症候群(RETT)と関連する一塩基多型(SNP)を含むMECP2遺伝子において、AからGへの核酸塩基改変をもたらし、ここで、前記AからGへの核酸塩基改変はRETTと関連する前記SNPにおけるものであり、前記SNPは、 MECP2遺伝子によってコードされるMECP2ポリペプチドにおいてR133CまたはR306Cアミノ酸突然変異を生じるものであり、前記ガイドRNAのスペーサーは、以下の配列:
5′-gAGAGCAAAAGGCUUUUCCCU-3′;
5′-gUAGAGCAAAAGGCUUUUCCC-3′;
5′-gUAGAGCAAAAGGCUUUUCCCU-3′;
5′-gUUUAGAGCAAAAGGCUUUUCCCU-3′;
5′-gUCUUGCACUUCUUGAUGGGG-3′;
5′-gCUUGCACUUCUUGAUGGGGAG-3′;
5′-gGUCUUGCACUUCUUGAUGGGGAG-3′;
5′-AGAGCAAAAGGCUUUUCCCU-3′;
5′-UAGAGCAAAAGGCUUUUCCC-3′;
5′-UAGAGCAAAAGGCUUUUCCCU-3′;
5′-UUUAGAGCAAAAGGCUUUUCCCU-3′;
5′-UCUUGCACUUCUUGAUGGGG-3′;
5′-CUUGCACUUCUUGAUGGGGAG-3′; および
5′-GUCUUGCACUUCUUGAUGGGGAG-3′
からなる群から選択される配列を含む、
前記方法。
【請求項2】
前記AからGへの核酸塩基改変が、RETTと関連する前記SNPを、野生型核酸塩基に変化させる、請求項1に記載の方法。
【請求項3】
RETTと関連するSNPでの前記AからGへの核酸塩基改変が、前記MECP2ポリペプチドにおいて、システインをアルギニンに変化させ;および/または
RETTと関連するSNPでの前記AからGへの核酸塩基改変が、アミノ酸133位および/または306位にアルギニンを含むMECP2ポリペプチドの発現を生じる、
請求項1または2に記載の方法。
【請求項4】
前記アデノシン塩基エディターが、前記ガイドRNAと複合体を形成している、請求項1~3のいずれか一項に記載の方法。
【請求項5】
(i)アデノシン塩基エディターまたはそれをコードする核酸配列、および
(ii)ガイドRNAまたはそれをコードする核酸配列
を含む塩基エディターシステムであって、アデノシン塩基エディターがCas9のプログラム可能DNA結合ドメインおよびアデノシンデアミナーゼドメインを含み、アデノシンデアミナーゼドメインが、以下のアミノ酸配列:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
に対して少なくとも90%の同一性を有するアミノ酸配列またはN末端メチオニンのみを欠くその断片であって、改変の組合せを有するものを含み、ここで前記改変の組合せは、
Y147R + Q154S;
V82S + Q154S;
V82S + Y147R;
V82S + Q154R;
V82S + Y123H;
I76Y + V82S;
V82S + Y123H + Y147T;
V82S + Y123H + Y147R;
V82S + Y123H + Q154R;
V82S + Y123H + Y147R + Q154R; および
I76Y + V82S + Y123H + Y147R + Q154R;
からなる群から選択され、
前記ガイドRNAが、前記アデノシン塩基エディターを誘導して、レット症候群(RETT)と関連する一塩基多型(SNP)を含むメチルCpG結合タンパク質2(MECP2)遺伝子において、AからGへの核酸塩基改変をもたらし;ここで、前記AからGへの核酸塩基改変がRETTと関連する前記SNPにおけるものであり、前記SNPはMECP2遺伝子によってコードされるMECP2ポリペプチドにおいてR133CまたはR306Cアミノ酸突然変異を生じるものであり、
前記ガイドRNAのスペーサーは、以下の配列:
5′-gAGAGCAAAAGGCUUUUCCCU-3′;
5′-gUAGAGCAAAAGGCUUUUCCC-3′;
5′-gUAGAGCAAAAGGCUUUUCCCU-3′;
5′-gUUUAGAGCAAAAGGCUUUUCCCU-3′;
5′-gUCUUGCACUUCUUGAUGGGG-3′;
5′-gCUUGCACUUCUUGAUGGGGAG-3′;
5′-gGUCUUGCACUUCUUGAUGGGGAG-3′;
5′-AGAGCAAAAGGCUUUUCCCU-3′;
5′-UAGAGCAAAAGGCUUUUCCC-3′;
5′-UAGAGCAAAAGGCUUUUCCCU-3′;
5′-UUUAGAGCAAAAGGCUUUUCCCU-3′;
5′-UCUUGCACUUCUUGAUGGGG-3′;
5′-CUUGCACUUCUUGAUGGGGAG-3′; および
5′-GUCUUGCACUUCUUGAUGGGGAG-3′
からなる群から選択される配列を含む、
前記塩基エディターシステム。
【請求項6】
前記AからGへの核酸塩基改変が、RETTと関連する前記SNPを野生型核酸塩基に変化させ;および/または
RETTと関連するSNPにおける前記AからGへの核酸塩基改変が、アミノ酸133位および/または306位でアルギニンを含むMECP2ポリペプチドの発現を生じる、
請求項5に記載の塩基エディターシステム。
【請求項7】
レット症候群(RETT)と関連する一塩基多型(SNP)を含むMECP2ポリヌクレオチドを編集するin vitroまたはex vivoの方法であって、
a)前記MECP2ポリヌクレオチドを、1つ以上のガイドRNAと複合体を形成したアデノシン塩基エディターと接触させる工程を含み、前記アデノシン塩基エディターはCas9のポリヌクレオチドプログラム可能DNA結合ドメインおよびアデノシンデアミナーゼドメインを含み、前記アデノシンデアミナーゼドメインは、以下のアミノ酸配列:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
に対して少なくとも90%の同一性を有するアミノ酸配列またはN末端メチオニンのみを欠くその断片であって、改変の組合せを有するものを含み、ここで前記改変の組合せは、
Y147R + Q154S;
V82S + Q154S;
V82S + Y147R;
V82S + Q154R;
V82S + Y123H;
I76Y + V82S;
V82S + Y123H + Y147T;
V82S + Y123H + Y147R;
V82S + Y123H + Q154R;
V82S + Y123H + Y147R + Q154R; および
I76Y + V82S + Y123H + Y147R + Q154R;
からなる群から選択され、
前記ガイドRNAの1つ以上が、前記塩基エディターを標的指向化して、RETTと関連するMECP2ポリヌクレオチド中の前記SNPのAからGへの核酸塩基改変をもたらし、前記SNPは前記MECP2ポリヌクレオチドによってコードされるMECP2ポリペプチドにおいてR133CまたはR306Cアミノ酸変異をもたらすものであり、
前記ガイドRNAのスペーサーは、以下の配列:
5′-gAGAGCAAAAGGCUUUUCCCU-3′;
5′-gUAGAGCAAAAGGCUUUUCCC-3′;
5′-gUAGAGCAAAAGGCUUUUCCCU-3′;
5′-gUUUAGAGCAAAAGGCUUUUCCCU-3′;
5′-gUCUUGCACUUCUUGAUGGGG-3′;
5′-gCUUGCACUUCUUGAUGGGGAG-3′;
5′-gGUCUUGCACUUCUUGAUGGGGAG-3′;
5′-AGAGCAAAAGGCUUUUCCCU-3′;
5′-UAGAGCAAAAGGCUUUUCCC-3′;
5′-UAGAGCAAAAGGCUUUUCCCU-3′;
5′-UUUAGAGCAAAAGGCUUUUCCCU-3′;
5′-UCUUGCACUUCUUGAUGGGG-3′;
5′-CUUGCACUUCUUGAUGGGGAG-3′; および
5′-GUCUUGCACUUCUUGAUGGGGAG-3′
からなる群から選択される配列を含む、
前記方法。
【請求項8】
前記接触が真核細胞中である、請求項7に記載の方法。
【請求項9】
前記真核細胞は哺乳動物細胞である、請求項8に記載の方法。
【請求項10】
前記哺乳動物細胞はヒト細胞である、請求項9に記載の方法。
【請求項11】
RETTと関連するSNPでの前記AからGへの核酸塩基改変が、前記MECP2ポリペプチドにおいて、システインをアルギニンに変化させ;および/または
RETTと関連するSNPでの前記AからGへの核酸塩基改変が、アミノ酸133位および/または306位でアルギニンを含むMECP2ポリペプチドの発現を生じる、
請求項7~10のいずれか一項に記載の方法。
【請求項12】
ポリヌクレオチドプログラム可能DNA結合ドメインが、Streptococcus pyogenes Cas9(SpCas9)、Staphylococcus aureus Cas9(SaCas9)、Streptococcus thermophilus 1 Cas9(St1Cas9)、またはStreptococcus canis Cas9(ScCas9)から選択され;および/または
ポリヌクレオチドプログラム可能DNA結合ドメインが、改変されたプロトスペーサー隣接モチーフ(PAM)に結合する改変SpCas9を含むか、もしくは
ポリヌクレオチドプログラム可能DNA結合ドメインが、5'-NGT-3'および5'-NGG-3'より選択される核酸配列を含むPAMに結合する改変SpCas9を含むか、もしくは
ポリヌクレオチドプログラム可能DNA結合ドメインが、ヌクレオチド配列NGTを含むPAMに結合する改変SpCas9を含むか、もしくは
ポリヌクレオチドプログラム可能DNA結合ドメインが、ヌクレオチド配列NGTを含むPAMに結合し改変SpCas9の残基1335、1337、1135、1136、1218、および/または1219の1つ以上でのアミノ酸置換、またはそれに対応するアミノ酸置換を含む、改変SpCas9を含む、
請求項7~11のいずれか一項に記載の方法。
【請求項13】
ポリヌクレオチドプログラム可能DNA結合ドメインが、アミノ酸置換L1111R、D1135V、G1218R、E1219F、A1322R、R1335V、T1337R 、ならびに、L1111、D1135L、S1136R、G1218S、E1219V、D1332A、D1332S、D1332T、D1332V、D1332L、D1332K、D1332R、R1335Q、T1337、T1337L、T1337Q、T1337I、T1337V、T1337F、T1337S、T1337N、T1337K、T1337H、T1337Q、およびT1337Mのうちの1つ以上、またはそれに対応するアミノ酸置換を含む改変SpCas9を含むか;または
ポリヌクレオチドプログラム可能DNA結合ドメインが、アミノ酸置換D1135L、S1136R、G1218S、E1219V、A1322R、R1335Q、およびT1337、ならびにL1111R、G1218R、E1219F、D1332A、D1332S、D1332T、D1332V、D1332L、D1332K、D1332R、T1337L、T1337I、T1337V、T1337F、T1337S、T1337N、T1337K、T1337R、T1337H、T1337Q、およびT1337Mのうちの1つ以上、またはそれに対応するアミノ酸置換を含む改変SpCas9を含む、
請求項12に記載の方法。
【請求項14】
ポリヌクレオチドプログラム可能DNA結合ドメインが、ヌクレアーゼ不活性であるかまたはニッカーゼであり;および/または
ポリヌクレオチドプログラム可能DNA結合ドメインが、アミノ酸置換D10Aまたはそれに対応するアミノ酸置換を含むニッカーゼである、
請求項1~4、7~13のいずれか一項に記載の方法。
【請求項15】
ポリヌクレオチドプログラム可能DNA結合ドメインが、ヌクレアーゼ不活性であるかまたはニッカーゼであり;および/または
ポリヌクレオチドプログラム可能DNA結合ドメインが、アミノ酸置換D10Aまたはそれに対応するアミノ酸置換を含むニッカーゼである、
請求項5または6に記載の塩基エディターシステム。
【請求項16】
アデノシンデアミナーゼドメインが、
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸位82位および/または166位で改変を含むか、もしくは
アデノシンデアミナーゼドメインが、アミノ酸位82位および166位で改変を含むか、もしくは
アデノシンデアミナーゼドメインが、V82S改変、T166R改変、またはV82SおよびT166R改変の両方より選択される改変を含み;および/または
アデノシンデアミナーゼドメインが、以下の改変:I76Y 、Y147T、Y147R、Q154S、Y123H、およびQ154Rの1つ以上をさらに含み;および/または
アデノシンデアミナーゼドメインが:
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; および I76Y + V82S + Y123H + Y147R + Q154R
からなる群より選択される改変を含む、
請求項7~14のいずれか一項に記載の方法。
【請求項17】
前記アデノシン塩基エディターが1つだけのアデノシンデアミナーゼドメインを含み、前記アデノシンデアミナーゼドメインはV82SおよびT166R改変を含むか、または
前記アデノシンデアミナーゼドメインがV82SおよびT166R改変を含み、Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154Rからなる群より選択される改変をさらに含む、
請求項7~14、16のいずれか一項に記載の方法。
【請求項18】
前記アデノシン塩基エディターが前記アデノシンデアミナーゼドメインを含み、前記アデノシンデアミナーゼドメインは、Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; およびI76Y + V82S + Y123H + Y147R + Q154Rからなる群から選択される改変の組合せを含み、前記アデノシン塩基エディターはさらに野生型TadAドメインを含む、請求項7に記載の方法。
【請求項19】
アデノシンデアミナーゼがTadA*8.14, TadA*8.15, TadA*8.16, TadA*8.17, TadA*8.18, TadA*8.19, TadA*8.20, TadA*8.21, TadA*8.22, TadA*8.23, および TadA*8.24からなる群より選択される、請求項7に記載の方法。
【請求項20】
前記アデノシン塩基エディターが:
ABE8.14-m, ABE8.15-m, ABE8.16-m, ABE8.17-m, ABE8.18-m, ABE8.19-m, ABE8.20-m, ABE8.21-m, ABE8.22-m, ABE8.23-m, ABE8.24-m, ABE8.14-d, ABE8.15-d, ABE8.16-d, ABE8.17-d, ABE8.18-d, ABE8.19-d, ABE8.20-d, ABE8.21-d, ABE8.22-d, ABE8.23-d, および ABE8.24
からなる群より選択される、請求項7に記載の方法。
【請求項21】
5′-AGAGCAAAAGGCUUUUCCCU-3′, 5′-UAGAGCAAAAGGCUUUUCCC-3′, 5′-UAGAGCAAAAGGCUUUUCCCU-3′, 5′-UUUAGAGCAAAAGGCUUUUCCCU-3′, 5′-UCUUGCACUUCUUGAUGGGG-3′, 5′-CUUGCACUUCUUGAUGGGGAG-3′, または 5′-GUCUUGCACUUCUUGAUGGGGAG-3′
より選択される核酸配列を含むガイドRNAを含む組成物であって、前記組成物は、
メチルCpG結合タンパク質2(MECP2)遺伝子を編集するin vitroまたはex vivoの方法における使用のための組成物であり、前記方法は、細胞、組織、または臓器に、
(i)アデノシン塩基エディターまたはそれをコードする核酸配列、および
(ii)前記ガイドRNA
を投与する工程を含み、ここでアデノシン塩基エディターはCas9のプログラム可能DNA結合ドメインおよびアデノシンデアミナーゼドメインを含み、前記アデノシンデアミナーゼドメインは、以下のアミノ酸配列:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
に対して少なくとも90%の同一性を有するアミノ酸配列またはN末端メチオニンのみを欠くその断片であって、改変の組合せを有するものを含み、ここで前記改変の組合せは、
Y147R + Q154S;
V82S + Q154S;
V82S + Y147R;
V82S + Q154R;
V82S + Y123H;
I76Y + V82S;
V82S + Y123H + Y147T;
V82S + Y123H + Y147R;
V82S + Y123H + Q154R;
V82S + Y123H + Y147R + Q154R; および
I76Y + V82S + Y123H + Y147R + Q154R;
からなる群から選択され、
前記ガイドRNAは、前記アデノシン塩基エディターを誘導して、レット症候群(RETT)と関連する一塩基多型(SNP)を含むMECP2遺伝子において、AからGへの核酸塩基改変をもたらし、ここで、前記AからGへの核酸塩基改変はRETTと関連する前記SNPにおけるものであり、前記SNPは、 MECP2遺伝子によってコードされるMECP2ポリペプチドにおいてR133CまたはR306Cアミノ酸突然変異を生じるものである、
前記組成物。
【請求項22】
前記ガイドRNAはさらに以下の足場配列:
GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT
を含む、請求項21に記載の組成物。
【請求項23】
アデノシンデアミナーゼ塩基エディターおよびガイドRNAを含む組成物であって、前記アデノシンデアミナーゼ塩基エディターはCas9のポリヌクレオチドプログラム可能DNA結合ドメインおよびアデノシンデアミナーゼドメインを含み、前記アデノシンデアミナーゼドメインは、以下のアミノ酸配列:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
に対して少なくとも90%の同一性を有するアミノ酸配列またはN末端メチオニンのみを欠くその断片であって、改変の組合せを有するものを含み、ここで前記改変の組合せは、
Y147R + Q154S;
V82S + Q154S;
V82S + Y147R;
V82S + Q154R;
V82S + Y123H;
I76Y + V82S;
V82S + Y123H + Y147T;
V82S + Y123H + Y147R;
V82S + Y123H + Q154R;
V82S + Y123H + Y147R + Q154R; および
I76Y + V82S + Y123H + Y147R + Q154R;
からなる群から選択され、
前記ガイドRNAが、前記アデノシンデアミナーゼ塩基エディターを標的指向化して、RETT症候群と関連する一塩基多型(SNP)を含むMECP2ポリヌクレオチドのAからGへの核酸塩基改変をもたらし、ここで、前記AからGへの核酸塩基改変はRETTと関連する前記SNPにおけるものであり、前記SNPは、MECP2遺伝子によってコードされるMECP2ポリペプチドにおいてR133CまたはR306Cアミノ酸突然変異を生じるものであり、前記ガイドRNAのスペーサーは、以下の配列:
5′-gAGAGCAAAAGGCUUUUCCCU-3′;
5′-gUAGAGCAAAAGGCUUUUCCC-3′;
5′-gUAGAGCAAAAGGCUUUUCCCU-3′;
5′-gUUUAGAGCAAAAGGCUUUUCCCU-3′;
5′-gUCUUGCACUUCUUGAUGGGG-3′;
5′-gCUUGCACUUCUUGAUGGGGAG-3′;
5′-gGUCUUGCACUUCUUGAUGGGGAG-3′;
5′-AGAGCAAAAGGCUUUUCCCU-3′;
5′-UAGAGCAAAAGGCUUUUCCC-3′;
5′-UAGAGCAAAAGGCUUUUCCCU-3′;
5′-UUUAGAGCAAAAGGCUUUUCCCU-3′;
5′-UCUUGCACUUCUUGAUGGGG-3′;
5′-CUUGCACUUCUUGAUGGGGAG-3′; および
5′-GUCUUGCACUUCUUGAUGGGGAG-3′
からなる群から選択される配列を含む、
前記組成物。
【請求項24】
RETTと関連する前記SNPでのAからGへの核酸塩基改変が、前記MECP2ポリペプチドにおいて、システインをアルギニンに変化させるか、または
RETTと関連する前記SNPでのAからGへの核酸塩基改変が、アミノ酸位133位および/または306位にアルギニンを含むMECP2ポリペプチドの発現を生じる、
請求項23に記載の組成物。
【請求項25】
ポリヌクレオチドプログラム可能DNA結合ドメインが、Streptococcus pyogenes Cas9(SpCas9)、Staphylococcus aureus Cas9(SaCas9)、Streptococcus thermophilus 1 Cas9(St1Cas9)、またはStreptococcus canis Cas9(ScCas9)より選択され;および/または
ポリヌクレオチドプログラム可能DNA結合ドメインが、改変されたプロトスペーサー隣接モチーフ(PAM)に結合する改変SpCas9を含み;および/または
ポリヌクレオチドプログラム可能DNA結合ドメインが、ヌクレアーゼ不活性であるかまたはニッカーゼであり;および/または
ポリヌクレオチドプログラム可能DNA結合ドメインが、アミノ酸置換D10Aまたはそれに対応するアミノ酸置換を含むニッカーゼである、
請求項23または24に記載の組成物。
【請求項26】
アデノシンデアミナーゼドメインが、デオキシリボ核酸(DNA)中のアデノシンを脱アミノ化することが可能であり;および/または
アデノシンデアミナーゼドメインが、
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸位82位および/または166位で改変を含むか、もしくは
アデノシンデアミナーゼドメインが、V82S改変、T166R改変、またはV82SおよびT166R改変の両方より選択される改変を含む、
請求項23~25のいずれか一項に記載の組成物。
【請求項27】
アデノシンデアミナーゼドメインが、以下の改変:I76Y 、Y147T、Y147R、Q154S、Y123H、およびQ154Rの1つ以上をさらに含み;および/または
アデノシンデアミナーゼドメインが:
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; および I76Y + V82S + Y123H + Y147R + Q154R
からなる群より選択される改変を含む、
請求項26に記載の組成物。
【請求項28】
前記アデノシンデアミナーゼ塩基エディターが1つだけのアデノシンデアミナーゼドメインを含み、前記アデノシンデアミナーゼドメインはV82SおよびT166R改変を含み;または
前記アデノシンデアミナーゼ塩基エディターが、さらに野生型アデノシンデアミナーゼドメインを含み;または
前記アデノシンデアミナーゼ塩基エディターが、Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154Rからなる群より選択される1つ以上の改変をさらに含む、1つだけのアデノシンデアミナーゼドメインを含み;または
前記アデノシンデアミナーゼ塩基エディターが、さらに野生型TadAドメインを含む、
請求項23~27のいずれか一項に記載の組成物。
【請求項29】
前記アデノシンデアミナーゼ塩基エディターが前記アデノシンデアミナーゼドメインを含み、前記アデノシンデアミナーゼドメインが、
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; および I76Y + V82S + Y123H + Y147R + Q154R
からなる群より選択される改変の組み合わせを含み、前記アデノシンデアミナーゼ塩基エディターはさらに野生型TadAドメインを含む、
請求項23に記載の組成物。
【請求項30】
アデノシンデアミナーゼがTadA*8.14, TadA*8.15, TadA*8.16, TadA*8.17, TadA*8.18, TadA*8.19, TadA*8.20, TadA*8.21, TadA*8.22, TadA*8.23, および TadA*8.24からなる群より選択される、
請求項23に記載の組成物。
【請求項31】
前記アデノシンデアミナーゼ塩基エディターが:
ABE8.14-m, ABE8.15-m, ABE8.16-m, ABE8.17-m, ABE8.18-m, ABE8.19-m, ABE8.20-m, ABE8.21-m, ABE8.22-m, ABE8.23-m, ABE8.24-m, ABE8.15-d, ABE8.16-d, ABE8.17-d, ABE8.18-d, ABE8.19-d, ABE8.20-d, ABE8.21-d, ABE8.22-d, ABE8.23-d, および ABE8.24
からなる群より選択される、請求項23に記載の組成物。
【請求項32】
組成物が脂質をさらに含むか、またはカチオン性脂質である脂質をさらに含む、請求項23または24に記載の組成物。
【請求項33】
薬学的に許容され得る賦形剤または希釈剤をさらに含む、請求項23または24に記載の組成物。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本国際PCT出願は、2019年5月21日に出願された仮特許出願第62/850,919号に対する優先権およびその利益を主張し、この文献の内容全体が参照により本明細書に完全に組み込まれる。
【背景技術】
【0002】
レット症候群(RTTまたはRETT)は、メチル-CpG-結合タンパク質2(Mecp2)遺伝子がコードするタンパク質が、中枢神経系(CNS)においてクロマチンおよび転写状態を修飾する能力を損なうかまたは抑制する、この遺伝子中の不均一な突然変異群によって引き起こされる。機能性のMecp2を送達するかまたはRNA編集を用いて内因性Mecp2(MECP2)mRNA転写物を修復する遺伝子治療は、CNS全体に広く送達された際、療法介入に向かう有望なアプローチである。しかし、どちらのアプローチも療法有効性を達成するには、かなりの困難を克服しなければならない。Mecp2遺伝子治療は、細胞あたりに送達される遺伝子の投薬量を厳しく制御しなければならず、そうでなければMecp2重複症候群の表現型を模倣するリスクを冒す。RNA編集プラットフォームは、RTT診断の45%を超える割合を占める最も多いMecp2突然変異を正確に修正することができず、また、効率的で無誘導のオフターゲット編集も誘導する。
【0003】
レット症候群(RTT)を引き起こすMecp2における遺伝子突然変異は非常に不均一である。その結果、療法のために好ましい戦略は、組換えアデノ随伴ウイルス(rAAV)によって所持される野生型Mecp2を送達することであった。この戦略は、各個体における原因突然変異にとらわれないため、遺伝子治療アプローチが成功すれば、RTT患者集団の大部分に、療法オプションが提供される。しかし、今日まで、この戦略は限定された成功しか収めていない。RTT患者は、ほぼ常にヘテロ接合性の女性であり、ランダムなX染色体不活性化のため、中枢神経系(CNS)内に、特徴的な野生型および突然変異体X連鎖MeCP2モザイク発現が生じている。したがって、既に野生型MeCP2を発現しているニューロンにrAAVが送達され、野生型MeCP2が発現すると、MeCP2重複症候群の表現型を部分的に模倣する可能性がある。これと一致して、RTTモデルマウスのCNSにおける高効率の形質導入は、野生型マウスに見られるものよりもおよそ2倍高いMeCP2発現を生じた。
【0004】
参照による組み込み
本明細書において言及するすべての刊行物、特許および特許出願は、各個々の刊行物、特許または特許出願が、具体的にかつ個々に、参照により本明細書に組み込まれると示されるのと同じ度合いまで、参照により本明細書に組み込まれる。別に指示のない限り、本明細書で言及する刊行物、特許および特許出願は、その全体が参照により本明細書に組み込まれる。
【発明の概要】
【発明が解決しようとする課題】
【0005】
従って、レット症候群患者を治療するための新規組成物および方法が必要である。
【課題を解決するための手段】
【0006】
以下に記載するように、本発明は、プログラム可能核酸塩基エディターを用いて、病原性アミノ酸を正確に修正するための組成物および方法を特徴とする。特に、本発明の組成物および方法は、レット症候群(RTTまたはRETT)の治療に有用である。従って、本発明は、アデノシン(A)塩基エディター(ABE)(例えばABE8)を用いて、内因性Mecp2遺伝子における一塩基多型を正確に修正して、欠失性突然変異を修正する(例えばR106W、R133C、T158M、R255*、R270*、R306C)、レット症候群を治療するための組成物および方法を提供する。
【0007】
一態様において、メチルCpG結合タンパク質2(MECP2)遺伝子またはその制御エレメントを対象において編集する方法であって、治療の必要がある対象に、(i)アデノシン塩基エディターまたはアデノシン塩基エディターをコードする核酸配列、および(ii)ガイドポリヌクレオチドまたはガイドポリヌクレオチドをコードする核酸配列を投与する工程を含み、ここでアデノシン塩基エディターがプログラム可能DNA結合ドメインおよびアデノシンデアミナーゼドメインを含み、アデノシンデアミナーゼドメインがTadA参照配列に比較して、アミノ酸位82位または166位、あるいはそれに対応する位でアミノ酸置換を含み、ガイドポリヌクレオチドがアデノシン塩基エディターを誘導して、レット症候群(RETT)と関連するSNPを含むMECP2遺伝子またはその制御エレメントにおけるAからGへの核酸塩基改変をもたらし;AからGへの核酸塩基の改変がRETTと関連するSNPで起こり、MECP2遺伝子にコードされるMECP2ポリペプチドまたはそのバリアントにおいて、R133CまたはR306Cアミノ酸突然変異を生じる、方法を提供する。一実施形態では、TadA参照配列は、アミノ酸配列
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
を含む。一実施形態では、AからGへの核酸塩基改変は、RETTと関連するSNPを野生型核酸塩基に変化させる。一実施形態では、AからGへの核酸塩基改変は、RETTと関連するSNPを非野生型核酸塩基に変化させて、RETTの1つ以上の症状の改善を生じる。一実施形態では、RETTと関連するSNPでのAからGへの核酸塩基改変は、メチルCpG結合タンパク質2(MECP2)ポリペプチドにおいて、システインをアルギニンに、または停止コドンをアルギニンに変化させる。一実施形態では、RETTと関連するSNPは、アミノ酸位133位および/または306位にアルギニンを含むMECP2ポリペプチドの発現を生じる。一実施形態では、ガイドポリヌクレオチドは、RETTと関連するSNPを含むMECP2遺伝子またはその制御エレメントに相補的な核酸配列を含む。一実施形態では、アデノシン塩基エディターは、RETTと関連するSNPを含むMECP2遺伝子またはその制御エレメントに相補的な核酸配列を含むシングルガイドRNA(sgRNA)と複合体を形成している。一実施形態では、ガイドポリヌクレオチドは、
5′-AGAGCAAAAGGCUUUUCCCU-3′, 5′-UAGAGCAAAAGGCUUUUCCC-3′, 5′-UAGAGCAAAAGGCUUUUCCCU-3′, 5′-UUUAGAGCAAAAGGCUUUUCCCU-3′, 5′-UCUUGCACUUCUUGAUGGGG-3′, 5′-CUUGCACUUCUUGAUGGGGAG-3′, or 5′-GUCUUGCACUUCUUGAUGGGGAG-3′
より選択される核酸配列を含む。
【0008】
一態様において、塩基エディターシステムが、(i)アデノシン塩基エディターまたはアデノシン塩基エディターをコードする核酸配列、および(ii)ガイドポリヌクレオチドまたはガイドポリヌクレオチドをコードする核酸配列を含み、ここでアデノシン塩基エディターがプログラム可能DNA結合ドメインおよびアデノシンデアミナーゼドメインを含み、アデノシンデアミナーゼドメインがTadA参照配列に比較して、アミノ酸位82位または166位、あるいはれに対応する位でアミノ酸置換を含み、ガイドポリヌクレオチドがアデノシン塩基エディターを誘導して、レット症候群(RETT)と関連するSNPを含むメチルCpG結合タンパク質(MECP2)遺伝子またはその制御エレメントにおけるAからGへの核酸塩基改変をもたらし;AからGへの核酸塩基改変がRETTと関連するSNPで起こり、MECP2遺伝子にコードされるMECP2ポリペプチドまたはそのバリアントにおいて、R133CまたはR306Cアミノ酸突然変異を生じる、塩基エディターシステムを提供する。一実施形態では、AからGへの核酸塩基改変は、RETTと関連するSNPを野生型核酸塩基に変化させる。一実施形態では、AからGへの核酸塩基改変は、RETTと関連するSNPを、RETTの1つ以上の症状の改善を生じる非野生型核酸塩基に変化させる。一実施形態では、RETTと関連するSNPは、アミノ酸位133位および/または306位でアルギニンを含むMECP2ポリペプチドの発現を生じる。一実施形態では、ガイドポリヌクレオチドは、RETTと関連するSNPを含むMECP2遺伝子またはその制御エレメントに相補的な核酸配列を含む。一実施形態では、アデノシン塩基エディターは、RETTと関連するSNPを含むMECP2遺伝子またはその制御エレメントに相補的な核酸配列を含むシングルガイドRNA(sgRNA)と複合体を形成している。一実施形態では、ガイドポリヌクレオチドは、
5′-AGAGCAAAAGGCUUUUCCCU-3′, 5′-UAGAGCAAAAGGCUUUUCCC-3′, 5′-UAGAGCAAAAGGCUUUUCCCU-3′, 5′-UUUAGAGCAAAAGGCUUUUCCCU-3′, 5′-UCUUGCACUUCUUGAUGGGG-3′, 5′-CUUGCACUUCUUGAUGGGGAG-3′, or 5′-GUCUUGCACUUCUUGAUGGGGAG-3′
より選択される核酸配列を含む。
【0009】
別の態様では、レット症候群(RETT)に関連する一塩基多型(SNP)を含むMECP2ポリヌクレオチドを編集する方法であって、MECP2ポリヌクレオチドを、1つ以上のガイドポリヌクレオチドと複合体を形成しているアデノシンデアミナーゼ塩基エディター8(ABE8)と接触させる工程を含み、ここで、ABE8がポリヌクレオチドプログラム可能DNA結合ドメインおよびアデノシンデアミナーゼドメインを含み、前記ガイドポリヌクレオチドの1つ以上が、前記塩基エディターを標的指向化して、RETTと関連するMECP2ポリヌクレオチド中のSNPのA・TからG・Cへの改変をもたらし、改変がR133CまたはR306Cの一方または両方である、方法を提供する。一実施形態では、接触は、細胞、真核細胞、哺乳動物細胞、またはヒト細胞中である。一実施形態では、細胞はin vivoまたはex vivoである。一実施形態では、RETTと関連するSNPでのA・TからG・Cへの改変は、メチルCpG結合タンパク質2(Mecp2)ポリペプチドにおいて、システインをアルギニンに、または停止コドンをアルギニンに変化させる。一実施形態では、RETTと関連するSNPは、アミノ酸位133位および/または306位でアルギニンを含むMECP2ポリペプチドの発現を生じる。一実施形態では、ポリヌクレオチドプログラム可能DNA結合ドメインは、Streptococcus pyogenes Cas9(SpCas9)、Staphylococcus aureus Cas9(SaCas9)、Streptococcus thermophilus 1 Cas9(St1Cas9)、Streptococcus canis Cas9(ScCas9)より選択されるCas9、またはそのバリアントである。一実施形態では、ポリヌクレオチドプログラム可能DNA結合ドメインは、改変されたプロトスペーサー隣接モチーフ(PAM)に結合する改変SpCas9を含む。一実施形態では、改変SpCas9は、5'-NGT-3'または5'-NGG-3'より選択される核酸配列を含むPAMに結合する。一実施形態では、改変SpCas9はNGT PAMバリアントに結合する。一実施形態では、NGT PAMバリアントは、改変SpCas9の1335、1337、1135、1136、1218、および/または1219の1つ以上の残基でのアミノ酸置換、またはそれに対応するアミノ酸置換を含む。一実施形態では、改変SpCas9は、アミノ酸置換L1111R、D1135V、G1218R、E1219F、A1322R、R1335V、T1337R、ならびに1つ以上のL1111、D1135L、S1136R、G1218S、E1219V、D1332A、D1332S、D1332T、D1332V、D1332L、D1332K、D1332R、R1335Q、T1337、T1337L、T1337Q、T1337I、T1337V、T1337F、T1337S、T1337N、T1337K、T1337H、T1337Q、およびT1337M、またはそれに対応するアミノ酸置換を含む。一実施形態では、改変SpCas9は、アミノ酸置換D1135L、S1136R、G1218S、E1219V、A1322R、R1335Q、およびT1337、ならびに1つ以上のL1111R、G1218R、E1219F、D1332A、D1332S、D1332T、D1332V、D1332L、D1332K、D1332R、T1337L、T1337I、T1337V、T1337F、T1337S、T1337N、T1337K、T1337R、T1337H、T1337Q、およびT1337M、またはそれに対応するアミノ酸置換を含む。一実施形態では、ポリヌクレオチドプログラム可能DNA結合ドメインは、ヌクレアーゼ不活性またはニッカーゼバリアントである。一実施形態では、ニッカーゼバリアントは、アミノ酸置換D10Aまたはそれに対応するアミノ酸置換を含む。一実施形態では、アデノシンデアミナーゼドメインは、デオキシリボ核酸(DNA)中のアデノシンを脱アミノ化することが可能である。一実施形態では、アデノシンデアミナーゼドメインは、
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸位82位および/または166位で改変を含む。一実施形態では、アデノシンデアミナーゼドメインは、アミノ酸位82位および166位で改変を含む。一実施形態では、アデノシンデアミナーゼドメインは、V82S改変、T166R改変、またはV82SおよびT166R改変の両方より選択される改変を含む。一実施形態では、アデノシンデアミナーゼドメインは、以下の改変:Y147T、Y147R、Q154S、Y123H、およびQ154Rの1つ以上をさらに含む。一実施形態では、アデノシンデアミナーゼドメインは:
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; および I76Y + V82S + Y123H + Y147R + Q154R
からなる群より選択される改変を含む。一実施形態では、ABE8は、V82SおよびT166R改変を含むアデノシンデアミナーゼバリアントモノマーを含む。一実施形態では、ABE8は、野生型アデノシンデアミナーゼドメインおよびアデノシンデアミナーゼバリアントを含む、アデノシンデアミナーゼヘテロダイマーを含む。一実施形態では、アデノシンデアミナーゼバリアントモノマーは、Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154Rからなる群より選択される1つ以上の改変をさらに含む。一実施形態では、ABE8は、TadA*8ドメインおよび野生型TadAドメインを含む、アデノシンデアミナーゼヘテロダイマーを含む。一実施形態では、アデノシンデアミナーゼモノマーは、Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154Rからなる群より選択される改変をさらに含む。一実施形態では、ABE8塩基エディターは、野生型TadAドメイン、および
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; および I76Y + V82S + Y123H + Y147R + Q154R
からなる群より選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントを含む、ヘテロダイマーを含む。一実施形態では、ガイドポリヌクレオチドは、
AGAGCAAAAGGCUUUUCCCU-3′, 5′-UAGAGCAAAAGGCUUUUCCC-3′, 5′-UAGAGCAAAAGGCUUUUCCCU-3′, 5′-UUUAGAGCAAAAGGCUUUUCCCU-3′, 5′-UCUUGCACUUCUUGAUGGGG-3′, 5′-CUUGCACUUCUUGAUGGGGAG-3′, または 5′-GUCUUGCACUUCUUGAUGGGGAG-3′
より選択される核酸配列を含む。一実施形態では、アデノシンデアミナーゼはTadAデアミナーゼである。一実施形態では、TadAデアミナーゼはTadA*8バリアントである。一実施形態では、TadA*8バリアントは:
TadA*8.1, TadA*8.2, TadA*8.3, TadA*8.4, TadA*8.5, TadA*8.6, TadA*8.6, TadA*8.7, TadA*8.8, TadA*8.9, TadA*8.10, TadA*8.11, TadA*8.12, TadA*8.13, TadA*8.14, TadA*8.15, TadA*8.16, TadA*8.17, TadA*8.18, TadA*8.19, TadA*8.20, TadA*8.21, TadA*8.22, TadA*8.23, および TadA*8.24
からなる群より選択される。一実施形態では、ABE8塩基エディターは:
ABE8.1-m, ABE8.2-m, ABE8.3-m, ABE8.4-m, ABE8.5-m, ABE8.6-m, ABE8.7-m, ABE8.8-m, ABE8.9-m, ABE8.10-m, ABE8.11-m, ABE8.12-m, ABE8.13-m, ABE8.14-m, ABE8.15-m, ABE8.16-m, ABE8.17-m, ABE8.18-m, ABE8.19-m, ABE8.20-m, ABE8.21-m, ABE8.22-m, ABE8.23-m, ABE8.24-m, ABE8.1-d, ABE8.2-d, ABE8.3-d, ABE8.4-d, ABE8.5-d, ABE8.6-d, ABE8.7-d, ABE8.8-d, ABE8.9-d, ABE8.10-d, ABE8.11-d, ABE8.12-d, ABE8.13-d, ABE8.14-d, ABE8.15-d, ABE8.16-d, ABE8.17-d, ABE8.18-d, ABE8.19-d, ABE8.20-d, ABE8.21-d, ABE8.22-d, ABE8.23-d, および ABE8.24
からなる群より選択される。一実施形態では、1つ以上のガイドRNAは、CRISPR RNA(crRNA)およびトランスにコードされる小RNA(tracrRNA)を含み、crRNAは、RETTと関連するSNPを含むMECP2核酸配列に相補的な核酸配列を含む。一実施形態では、ABE8塩基エディターは、RETTと関連するSNPを含むMECP2核酸配列に相補的な核酸配列を含む、シングルガイドRNA(sgRNA)と複合体を形成する。一実施形態では、ABE8塩基エディターは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
【0010】
別の態様において、細胞内に以下を導入することによって産生される細胞、またはその子孫細胞が提供される:(i)ABE8塩基エディターまたは前記塩基エディターをコードするポリヌクレオチドであって、前記ABE8塩基エディターが、ポリヌクレオチドプログラム可能DNA結合ドメインおよびアデノシンデアミナーゼドメインを含む、前記塩基エディターまたはポリヌクレオチド;ならびに(ii)塩基エディターを標的指向化して、RETT症候群(RETT)と関連するMECP2ポリヌクレオチド中のSNPのA・TからG・Cへの改変をもたらす、1つ以上のガイドポリヌクレオチドであって、改変がR133CまたはR306Cの一方または両方である、前記ガイドポリヌクレオチド。一実施形態では、細胞はニューロンである。一実施形態では、ニューロンはMECP2ポリペプチドを発現する。一実施形態では、細胞はRETTを有する対象由来である。一実施形態では、細胞は哺乳動物細胞またはヒト細胞である。一実施形態では、RETTと関連するSNPでのA・TからG・Cへの改変は、メチルCpG結合タンパク質2(MECP2)ポリペプチドにおいて、システインをアルギニンに、停止コドンをアルギニンに変化させる。一実施形態では、RETTと関連するSNPは、アミノ酸位133位および/または306位でアルギニンを含むMECP2ポリペプチドの発現を生じる。一実施形態では、ポリヌクレオチドプログラム可能DNA結合ドメインは、Streptococcus pyogenes Cas9(SpCas9)、Staphylococcus aureus Cas9(SaCas9)、Streptococcus thermophilus 1 Cas9(St1Cas9)、Streptococcus canis Cas9(ScCas9)より選択されるCas9、またはそのバリアントである。一実施形態では、ポリヌクレオチドプログラム可能DNA結合ドメインは、改変されたプロトスペーサー隣接モチーフ(PAM)に結合する改変SpCas9を含む。一実施形態では、改変SpCas9は、5'-NGT-3'または5'-NGG-3'より選択される核酸配列を含むPAMに結合する。一実施形態では、改変SpCas9はNGT PAMバリアントに結合する。一実施形態では、NGT PAMバリアントは、改変SpCas9の1335、1337、1135、1136、1218、および/または1219の1つ以上の残基でのアミノ酸置換、またはそれに対応するアミノ酸置換を含む。一実施形態では、改変SpCas9は、アミノ酸置換L1111R、D1135V、G1218R、E1219F、A1322R、R1335V、T1337R、ならびに1つ以上のL1111、D1135L、S1136R、G1218S、E1219V、D1332A、D1332S、D1332T、D1332V、D1332L、D1332K、D1332R、R1335Q、T1337、T1337L、T1337Q、T1337I、T1337V、T1337F、T1337S、T1337N、T1337K、T1337H、T1337Q、およびT1337M、またはそれに対応するアミノ酸置換を含む。一実施形態では、改変SpCas9は、アミノ酸置換D1135L、S1136R、G1218S、E1219V、A1322R、R1335Q、およびT1337、ならびに1つ以上のL1111R、G1218R、E1219F、D1332A、D1332S、D1332T、D1332V、D1332L、D1332K、D1332R、T1337L、T1337I、T1337V、T1337F、T1337S、T1337N、T1337K、T1337R、T1337H、T1337Q、およびT1337M、またはそれに対応するアミノ酸置換を含む。一実施形態では、ポリヌクレオチドプログラム可能DNA結合ドメインは、ヌクレアーゼ不活性またはニッカーゼバリアントである。一実施形態では、ニッカーゼバリアントは、アミノ酸置換D10Aまたはそれに対応するアミノ酸置換を含む。一実施形態では、アデノシンデアミナーゼドメインは、デオキシリボ核酸(DNA)中のアデノシンを脱アミノ化することが可能である。一実施形態では、アデノシンデアミナーゼドメインは、
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸位82位および/または166位で改変を含む。一実施形態では、アデノシンデアミナーゼは、以下の改変:Y147T、Y147R、Q154S、Y123H、およびQ154Rの1つ以上をさらに含む。一実施形態では、アデノシンデアミナーゼドメインは:
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; および I76Y + V82S + Y123H + Y147R + Q154R
からなる群より選択される改変の組み合わせを含む。一実施形態では、ABE8は、V82SおよびT166R改変を含むアデノシンデアミナーゼバリアントモノマーを含む。一実施形態では、ABE8は、野生型アデノシンデアミナーゼドメインおよびアデノシンデアミナーゼバリアントを含む、アデノシンデアミナーゼヘテロダイマーを含む。一実施形態では、アデノシンデアミナーゼバリアントモノマーは、Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154Rからなる群より選択される1つ以上の改変をさらに含む。一実施形態では、ABE8は、TadA*7.10ドメインおよびTadA*8ドメインを含む、アデノシンデアミナーゼヘテロダイマーを含む。一実施形態では、アデノシンデアミナーゼバリアントモノマーは、Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154Rからなる群より選択される1つ以上の改変をさらに含む。一実施形態では、ABE8塩基エディターは、TadA*7.10ドメイン、および
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; および I76Y + V82S + Y123H + Y147R + Q154R
からなる群より選択される改変を含むアデノシンデアミナーゼバリアントを含む、ヘテロダイマーを含む。一実施形態では、ガイドポリヌクレオチドは、
5′-AGAGCAAAAGGCUUUUCCCU-3′, 5′-UAGAGCAAAAGGCUUUUCCC-3′, 5′-UAGAGCAAAAGGCUUUUCCCU-3′, 5′-UUUAGAGCAAAAGGCUUUUCCCU-3′, 5′-UCUUGCACUUCUUGAUGGGG-3′, 5′-CUUGCACUUCUUGAUGGGGAG-3′, または 5′-GUCUUGCACUUCUUGAUGGGGAG-3′
より選択される核酸配列を含む。一実施形態では、アデノシンデアミナーゼはTadAデアミナーゼである。一実施形態では、TadAデアミナーゼはTadA*8バリアントである。一実施形態では、TadA*8バリアントは:
TadA*8.1, TadA*8.2, TadA*8.3, TadA*8.4, TadA*8.5, TadA*8.6, TadA*8.6, TadA*8.7, TadA*8.8, TadA*8.9, TadA*8.10, TadA*8.11, TadA*8.12, TadA*8.13, TadA*8.14, TadA*8.15, TadA*8.16, TadA*8.17, TadA*8.18, TadA*8.19, TadA*8.20, TadA*8.21, TadA*8.22, TadA*8.23, および TadA*8.24
からなる群より選択される。一実施形態では、ABE8塩基エディターは:
ABE8.1-m, ABE8.2-m, ABE8.3-m, ABE8.4-m, ABE8.5-m, ABE8.6-m, ABE8.7-m, ABE8.8-m, ABE8.9-m, ABE8.10-m, ABE8.11-m, ABE8.12-m, ABE8.13-m, ABE8.14-m, ABE8.15-m, ABE8.16-m, ABE8.17-m, ABE8.18-m, ABE8.19-m, ABE8.20-m, ABE8.21-m, ABE8.22-m, ABE8.23-m, ABE8.24-m, ABE8.1-d, ABE8.2-d, ABE8.3-d, ABE8.4-d, ABE8.5-d, ABE8.6-d, ABE8.7-d, ABE8.8-d, ABE8.9-d, ABE8.10-d, ABE8.11-d, ABE8.12-d, ABE8.13-d, ABE8.14-d, ABE8.15-d, ABE8.16-d, ABE8.17-d, ABE8.18-d, ABE8.19-d, ABE8.20-d, ABE8.21-d, ABE8.22-d, ABE8.23-d, および ABE8.24
からなる群より選択される。一実施形態では、1つ以上のガイドRNAは、CRISPR RNA(crRNA)およびトランスにコードされる小RNA(tracrRNA)を含み、crRNAは、RETTと関連するSNPを含むMECP2核酸配列に相補的な核酸配列を含む。一実施形態では、塩基エディターは、RETTと関連するSNPを含むMECP2核酸配列に相補的な核酸配列を含む、シングルガイドRNA(sgRNA)と複合体を形成する。一実施形態では、ABE8塩基エディターは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる:MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD。一実施形態では、gRNAは以下の配列:
GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT
を有する足場を含む。
【0011】
別の態様では、対象においてRETT症候群(RETT)を治療する方法であって、前記対象に、ABE8塩基エディターまたは前記塩基エディターをコードするポリヌクレオチドを投与する工程を含み、前記ABE8塩基エディターが、ポリヌクレオチドプログラム可能DNA結合ドメインおよびアデノシンデアミナーゼドメイン;ならびにABE8塩基エディターを標的指向化して、RETTと関連するMECP2ポリヌクレオチド中のSNPのA・TからG・Cへの改変をもたらす1つ以上のガイドポリヌクレオチドを含み、改変がR133Cおよび/またはR306Cの一方または両方である、前記方法を提供する。一実施形態では、対象は哺乳動物またはヒトである。一実施形態では、方法は、ABE8塩基エディターまたは前記ABE8塩基エディターをコードするポリヌクレオチド、および前記の1つ以上のガイドポリヌクレオチドを、対象の細胞に送達する工程を含み、任意で、細胞はニューロンである。方法の一実施形態では、RETTと関連するSNPでのA・TからG・Cへの改変は、メチルCpG結合タンパク質2(MECP2)ポリペプチドにおいて、システインをアルギニンに、または停止コドンをアルギニンに変化させる。一実施形態では、RETTと関連するSNPは、アミノ酸位133位および/または306位でアルギニンを含むMECP2ポリペプチドの発現を生じる。一実施形態では、ポリヌクレオチドプログラム可能DNA結合ドメインは、Streptococcus pyogenes Cas9(SpCas9)、Staphylococcus aureus Cas9(SaCas9)、Streptococcus thermophilus 1 Cas9(St1Cas9)、Streptococcus canis Cas9(ScCas9)より選択されるCas9、またはそのバリアントである。一実施形態では、ポリヌクレオチドプログラム可能DNA結合ドメインは、改変されたプロトスペーサー隣接モチーフ(PAM)に結合する改変SpCas9を含む。一実施形態では、改変SpCas9は、5'-NGT-3'または5'-NGG-3'より選択される核酸配列を含むPAMに結合する。一実施形態では、改変SpCas9はNGT PAMバリアントに結合する。一実施形態では、NGT PAMバリアントは、改変SpCas9の1335、1337、1135、1136、1218、および/または1219の1つ以上の残基でのアミノ酸置換、またはそれに対応するアミノ酸置換を含む。一実施形態では、改変SpCas9は、アミノ酸置換L1111R、D1135V、G1218R、E1219F、A1322R、R1335V、T1337R、ならびに1つ以上のL1111、D1135L、S1136R、G1218S、E1219V、D1332A、R1335Q、T1337、T1337L、T1337Q、T1337I、T1337V、T1337F、およびT1337M、またはそれに対応するアミノ酸置換を含む。一実施形態では、改変SpCas9は、アミノ酸置換D1135L、S1136R、G1218S、E1219V、A1322R、R1335Q、およびT1337、ならびに1つ以上のL1111R、D1135L、S1136R、G1218S、E1219V、D1332A、D1332S、D1332T、D1332V、D1332L、D1332K、D1332R、R1335Q、T1337、T1337L、T1337Q、T1337I、T1337V、T1337F、T1337S、T1337N、T1337K、T1337R、T1337H、T1337Q、およびT1337M、またはそれに対応するアミノ酸置換を含む。一実施形態では、ポリヌクレオチドプログラム可能DNA結合ドメインは、ヌクレアーゼ不活性またはニッカーゼバリアントである。一実施形態では、ニッカーゼバリアントは、アミノ酸置換D10Aまたはそれに対応するアミノ酸置換を含む。一実施形態では、アデノシンデアミナーゼドメインは、デオキシリボ核酸(DNA)中のアデノシンを脱アミノ化することが可能である。一実施形態では、アデノシンデアミナーゼドメインは、
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸位82位および/または166位で改変を含む。一実施形態では、アデノシンデアミナーゼドメインは、アミノ酸位82位および166位で改変を含む。一実施形態では、アデノシンデアミナーゼドメインは、V82S改変、T166R改変、またはV82SおよびT166R改変の両方より選択される改変を含む。一実施形態では、アデノシンデアミナーゼドメインは、以下の改変:Y147T、Y147R、Q154S、Y123H、およびQ154Rの1つ以上をさらに含む。一実施形態では、アデノシンデアミナーゼドメインは:
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; および I76Y + V82S + Y123H + Y147R + Q154R
からなる群より選択される改変を含む。一実施形態では、ABE8は、V82SおよびT166R改変を含むアデノシンデアミナーゼバリアントモノマーを含む。一実施形態では、ABE8は、野生型アデノシンデアミナーゼドメインおよびアデノシンデアミナーゼバリアントを含む、アデノシンデアミナーゼヘテロダイマーを含む。一実施形態では、アデノシンデアミナーゼバリアントモノマーは、Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154Rからなる群より選択される1つ以上の改変をさらに含む。一実施形態では、ABE8は、TadA*7.10ドメインおよびTadA*8ドメインを含む、アデノシンデアミナーゼヘテロダイマーを含む。一実施形態では、アデノシンデアミナーゼバリアントモノマーは、Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154Rからなる群より選択される1つ以上の改変をさらに含む。一実施形態では、ABE8塩基エディターは、TadA7.10ドメイン、および
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; および I76Y + V82S + Y123H + Y147R + Q154R
からなる群より選択される改変を含むアデノシンデアミナーゼバリアントを含む、ヘテロダイマーを含む。一実施形態では、ガイドポリヌクレオチドは、
5′-AGAGCAAAAGGCUUUUCCCU-3′, 5′-UAGAGCAAAAGGCUUUUCCC-3′, 5′-UAGAGCAAAAGGCUUUUCCCU-3′, 5′-UUUAGAGCAAAAGGCUUUUCCCU-3′, 5′-UCUUGCACUUCUUGAUGGGG-3′, 5′-CUUGCACUUCUUGAUGGGGAG-3′, または 5′-GUCUUGCACUUCUUGAUGGGGAG-3′
より選択される核酸配列を有する。一実施形態では、アデノシンデアミナーゼはTadAデアミナーゼである。一実施形態では、TadAデアミナーゼはTadA*8バリアントである。一実施形態では、TadA*8バリアントは:
TadA*8.1, TadA*8.2, TadA*8.3, TadA*8.4, TadA*8.5, TadA*8.6, TadA*8.6, TadA*8.7, TadA*8.8, TadA*8.9, TadA*8.10, TadA*8.11, TadA*8.12, TadA*8.13, TadA*8.14, TadA*8.15, TadA*8.16, TadA*8.17, TadA*8.18, TadA*8.19, TadA*8.20, TadA*8.21, TadA*8.22, TadA*8.23, および TadA*8.24
からなる群より選択される。一実施形態では、ABE8塩基エディターは:
ABE8.1-m, ABE8.2-m, ABE8.3-m, ABE8.4-m, ABE8.5-m, ABE8.6-m, ABE8.7-m, ABE8.8-m, ABE8.9-m, ABE8.10-m, ABE8.11-m, ABE8.12-m, ABE8.13-m, ABE8.14-m, ABE8.15-m, ABE8.16-m, ABE8.17-m, ABE8.18-m, ABE8.19-m, ABE8.20-m, ABE8.21-m, ABE8.22-m, ABE8.23-m, ABE8.24-m, ABE8.1-d, ABE8.2-d, ABE8.3-d, ABE8.4-d, ABE8.5-d, ABE8.6-d, ABE8.7-d, ABE8.8-d, ABE8.9-d, ABE8.10-d, ABE8.11-d, ABE8.12-d, ABE8.13-d, ABE8.14-d, ABE8.15-d, ABE8.16-d, ABE8.17-d, ABE8.18-d, ABE8.19-d, ABE8.20-d, ABE8.21-d, ABE8.22-d, ABE8.23-d, および ABE8.24
からなる群より選択される。一実施形態では、1つ以上のガイドRNAは、CRISPR RNA(crRNA)およびトランスにコードされる小RNA(tracrRNA)を含み、crRNAは、RETTと関連するSNPを含むMECP2核酸配列に相補的な核酸配列を含む。一実施形態では、塩基エディターは、RETTと関連するSNPを含むMECP2核酸配列に相補的な核酸配列を含む、シングルガイドRNA(sgRNA)と複合体を形成する。
【0012】
別の態様において、対象において、レット症候群(RETT)を治療する方法であって、治療を必要とする対象に、(i)アデノシン塩基エディターまたはアデノシン塩基エディターをコードする核酸配列、および(ii)ガイドポリヌクレオチドまたはガイドポリヌクレオチドをコードする核酸配列を投与する工程を含み、ここでアデノシン塩基エディターがプログラム可能DNA結合ドメインおよびアデノシンデアミナーゼドメインを含み、アデノシンデアミナーゼドメインがTadA参照配列に比較して、アミノ酸位82位または166位、あるいはそれに対応する位でアミノ酸置換を含み、ガイドポリヌクレオチドがアデノシン塩基エディターを誘導して、対象においてRETTと関連するSNPを含むメチルCpG結合タンパク質2(MECP2)遺伝子またはその制御エレメントにおけるAからGへの核酸塩基改変をもたらし、それによって対象においてRETTを治療し、RETTと関連するSNPが、MECP2遺伝子にコードされるMECP2ポリペプチドまたはその変異体において、R133CまたはR306Cアミノ酸突然変異を生じる、方法を提供する。方法の一実施形態では、投与は、RETTに関連する少なくとも1つの症状を改善する。方法の一実施形態では、投与は、アデノシンデアミナーゼにおけるアミノ酸置換を伴わない塩基エディターでの治療に比較して、RETTと関連する少なくとも1つの症状のより迅速な改善を生じる。方法の一実施形態では、AからGへの核酸塩基改変は、RETTと関連するSNPを野生型核酸塩基に変化させる。一実施形態では、AからGへの核酸塩基改変は、レット症候群と関連するSNPを、RETT症状の改善を生じる非野生型核酸塩基に変化させる。一実施形態では、ガイドポリヌクレオチドは、RETTと関連するSNPを含むMECP2遺伝子またはその制御エレメントに相補的な核酸配列を含む。一実施形態では、アデノシン塩基エディターは、RETTと関連するSNPを含むMECP2遺伝子またはその制御エレメントに相補的な核酸配列を含むシングルガイドRNA(sgRNA)と複合体を形成している。一実施形態では、ガイドポリヌクレオチドは、
5′-AGAGCAAAAGGCUUUUCCCU-3′, 5′-UAGAGCAAAAGGCUUUUCCC-3′, 5′-UAGAGCAAAAGGCUUUUCCCU-3′, 5′-UUUAGAGCAAAAGGCUUUUCCCU-3′, 5′-UCUUGCACUUCUUGAUGGGG-3′, 5′-CUUGCACUUCUUGAUGGGGAG-3′, or 5′-GUCUUGCACUUCUUGAUGGGGAG-3′
より選択される核酸配列を含む。
【0013】
編集法の上述の態様および塩基エディターシステムの上述の態様の実施形態において、ガイドポリヌクレオチドは、MECP2遺伝子またはその制御エレメントに相補的である、少なくとも10の隣接ヌクレオチドを含む核酸配列を含む。一実施形態では、ガイドポリヌクレオチドは、MECP2遺伝子またはその制御エレメントに相補的である、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40の隣接ヌクレオチドを含む核酸配列を含む。
【0014】
編集法または治療法の上述の態様および細胞の上述の態様の実施形態において、ガイドポリヌクレオチドは、MECP2ポリヌクレオチドに相補的である、少なくとも10の隣接ヌクレオチドを含む核酸配列を含む。一実施形態では、ガイドポリヌクレオチドは、MECP2ポリヌクレオチドに相補的である、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40の隣接ヌクレオチドを含む核酸配列を含む。
【0015】
RETTを治療する上述の方法の実施形態では、RETTと関連するSNPは、MECP2遺伝子によってコードされるMECP2ポリペプチドまたはそのバリアントにおいて、R133Cおよび/またはR306Cアミノ酸突然変異を生じる。一実施形態では、RETTと関連するSNPは、MECP2遺伝子によってコードされるMECP2ポリペプチドまたはそのバリアントにおいて、R133Cアミノ酸突然変異を生じる。一実施形態では、RETTと関連するSNPは、MECP2遺伝子によってコードされるMECP2ポリペプチドまたはそのバリアントにおいて、R306Cアミノ酸突然変異を生じる。
【0016】
上述の塩基エディターシステムの実施形態では、RETTと関連するSNPでのAからGへの核酸塩基改変は、MECP2遺伝子によってコードされるMECP2ポリペプチドまたはそのバリアントにおいて、R133Cアミノ酸突然変異を生じる。塩基エディターシステムの実施形態では、RETTと関連するSNPでのAからGへの核酸塩基改変は、MECP2遺伝子によってコードされるMECP2ポリペプチドまたはそのバリアントにおいて、R306Cアミノ酸突然変異を生じる。
【0017】
MECP2ポリヌクレオチドを編集する上述の方法またはRETT症候群(RETT)を治療する方法の実施形態では、RETTと関連するSNPの改変は、R133CおよびR306Cの両方を含む。一実施形態では、RETTと関連するSNPの改変はR133Cである。一実施形態では、RETTと関連するSNPの改変はR306Cである。
【0018】
上述の細胞の実施形態では、RETT症候群(RETT)と関連するSNPの改変はR133Cである。一実施形態では、RETT症候群(RETT)と関連するSNPの改変はR306Cである。
【0019】
別の態様では、ガイドポリヌクレオチドまたはガイドRNA(gRNA)がMECP2タンパク質をコードするMECP2遺伝子に完全に相補的である、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30の隣接ヌクレオチドを含む、ガイドポリヌクレオチドまたはガイドRNAを提供する。一実施形態では、ガイドポリヌクレオチドまたはガイドRNAは、
5′-AGAGCAAAAGGCUUUUCCCU-3′, 5′-UAGAGCAAAAGGCUUUUCCC-3′, 5′-UAGAGCAAAAGGCUUUUCCCU-3′, 5′-UUUAGAGCAAAAGGCUUUUCCCU-3′, 5′-UCUUGCACUUCUUGAUGGGG-3′, 5′-CUUGCACUUCUUGAUGGGGAG-3′, or 5′-GUCUUGCACUUCUUGAUGGGGAG-3′
より選択される核酸配列を含む。一実施形態では、ガイドポリヌクレオチドまたはガイドRNAは、足場配列をさらに含み、足場配列は、任意で、以下の通りである:
GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT。
【0020】
別の態様では、アデノシンデアミナーゼ塩基エディター8(ABE8)およびガイドRNAを含む組成物を提供し、ここで、該組成物において、ABE8はポリヌクレオチドプログラム可能DNA結合ドメインおよびアデノシンデアミナーゼドメインを含み、ガイドRNAは、塩基エディターを標的指向化して、RETT症候群と関連するMECP2ポリヌクレオチド中のSNPのA・TからG・Cへの改変をもたらし、改変はR133CまたはR306Cの一方または両方である。組成物の一実施形態では、RETTと関連するSNPでのA・TからG・Cへの改変は、メチルCpG結合タンパク質2(Mecp2)ポリペプチドにおいて、システインをアルギニンに、または停止コドンをアルギニンに変化させる。一実施形態では、RETTと関連するSNPは、アミノ酸位133位および/または306位でアルギニンを含むMECP2ポリペプチドの発現を生じる。一実施形態では、ポリヌクレオチドプログラム可能DNA結合ドメインは、Streptococcus pyogenes Cas9(SpCas9)、Staphylococcus aureus Cas9(SaCas9)、Streptococcus thermophilus 1 Cas9(St1Cas9)、Streptococcus canis Cas9(ScCas9)より選択されるCas9、またはそのバリアントである。一実施形態では、ポリヌクレオチドプログラム可能DNA結合ドメインは、改変されたプロトスペーサー隣接モチーフ(PAM)に結合する改変SpCas9を含む。一実施形態では、ポリヌクレオチドプログラム可能DNA結合ドメインは、ヌクレアーゼ不活性またはニッカーゼバリアントである。一実施形態では、ニッカーゼバリアントは、アミノ酸置換D10Aまたはそれに対応するアミノ酸置換を含む。一実施形態では、アデノシンデアミナーゼドメインは、デオキシリボ核酸(DNA)中のアデノシンを脱アミノ化することが可能である。組成物の一実施形態では、アデノシンデアミナーゼドメインは、
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸位82位および/または166位で改変を含む。一実施形態では、アデノシンデアミナーゼドメインは、V82S改変、T166R改変、またはV82SおよびT166R改変の両方より選択される改変を含む。一実施形態では、アデノシンデアミナーゼドメインは、以下の改変:Y147T、Y147R、Q154S、Y123H、およびQ154Rの1つ以上をさらに含む。一実施形態では、アデノシンデアミナーゼドメインは:
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; および I76Y + V82S + Y123H + Y147R + Q154R
からなる群より選択される改変を含む。一実施形態では、ABE8は、V82SおよびT166R改変を含むアデノシンデアミナーゼバリアントモノマーを含む。一実施形態では、ABE8は、野生型アデノシンデアミナーゼドメインおよびアデノシンデアミナーゼバリアントを含む、アデノシンデアミナーゼヘテロダイマーを含む。一実施形態では、アデノシンデアミナーゼバリアントモノマーは、Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154Rからなる群より選択される1つ以上の改変をさらに含む。一実施形態では、ABE8は、TadA*8ドメインおよび野生型TadAドメインを含む、アデノシンデアミナーゼヘテロダイマーを含む。一実施形態では、アデノシンデアミナーゼバリアントモノマーは、Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154Rからなる群より選択される1つ以上の改変をさらに含む。一実施形態では、ABE8塩基エディターは、野生型TadAドメイン、および
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; および I76Y + V82S + Y123H + Y147R + Q154R
からなる群より選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントを含む、ヘテロダイマーを含む。一実施形態では、ガイドRNAは、
AGAGCAAAAGGCUUUUCCCU-3′, 5′-UAGAGCAAAAGGCUUUUCCC-3′, 5′-UAGAGCAAAAGGCUUUUCCCU-3′, 5′-UUUAGAGCAAAAGGCUUUUCCCU-3′, 5′-UCUUGCACUUCUUGAUGGGG-3′, 5′-CUUGCACUUCUUGAUGGGGAG-3′, or 5′-GUCUUGCACUUCUUGAUGGGGAG-3′
より選択される核酸配列を含む。一実施形態では、アデノシンデアミナーゼはTadAデアミナーゼである。一実施形態では、TadAデアミナーゼはTadA*8バリアントである。一実施形態では、TadA*8バリアントは:
TadA*8.1, TadA*8.2, TadA*8.3, TadA*8.4, TadA*8.5, TadA*8.6, TadA*8.6, TadA*8.7, TadA*8.8, TadA*8.9, TadA*8.10, TadA*8.11, TadA*8.12, TadA*8.13, TadA*8.14, TadA*8.15, TadA*8.16, TadA*8.17, TadA*8.18, TadA*8.19, TadA*8.20, TadA*8.21, TadA*8.22, TadA*8.23, および TadA*8.24
からなる群より選択される。一実施形態では、ABE8塩基エディターは:
ABE8.1-m, ABE8.2-m, ABE8.3-m, ABE8.4-m, ABE8.5-m, ABE8.6-m, ABE8.7-m, ABE8.8-m, ABE8.9-m, ABE8.10-m, ABE8.11-m, ABE8.12-m, ABE8.13-m, ABE8.14-m, ABE8.15-m, ABE8.16-m, ABE8.17-m, ABE8.18-m, ABE8.19-m, ABE8.20-m, ABE8.21-m, ABE8.22-m, ABE8.23-m, ABE8.24-m, ABE8.1-d, ABE8.2-d, ABE8.3-d, ABE8.4-d, ABE8.5-d, ABE8.6-d, ABE8.7-d, ABE8.8-d, ABE8.9-d, ABE8.10-d, ABE8.11-d, ABE8.12-d, ABE8.13-d, ABE8.14-d, ABE8.15-d, ABE8.16-d, ABE8.17-d, ABE8.18-d, ABE8.19-d, ABE8.20-d, ABE8.21-d, ABE8.22-d, ABE8.23-d, および ABE8.24
からなる群より選択される。組成物の一実施形態では、ガイドRNAは、CRISPR RNA(crRNA)およびトランスにコードされる小RNA(tracrRNA)を含み、crRNAは、RETTと関連するSNPを含むMECP2核酸配列に相補的な核酸配列を含む。一実施形態では、ABE8塩基エディターは、RETTと関連するSNPを含むMECP2核酸配列に相補的な核酸配列を含む、シングルガイドRNA(sgRNA)と複合体を形成する。一実施形態では、ABE8塩基エディターは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる:MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD。
一実施形態では、組成物は脂質をさらに含み、任意で、脂質はカチオン性脂質である。
【0021】
組成物の上述の態様の実施形態において、組成物は、薬学的に許容され得る賦形剤または希釈剤を含む薬学的組成物である。一実施形態では、薬学的組成物は、RETT症候群の治療のためである。薬学的組成物の一実施形態では、gRNAおよびABE8塩基エディターは、一緒にまたは別個に配合される。一実施形態では、薬学的組成物は、哺乳動物細胞における発現に適したベクターをさらに含み、ベクターはABE8塩基エディターをコードするポリヌクレオチドを含む。薬学的組成物の一実施形態では、ベクターはウイルスベクターである。薬学的組成物の一実施形態では、ウイルスベクターは、レトロウイルスベクター、アデノウイルスベクター、レンチウイルスベクター、ヘルペスウイルスベクター、またはアデノ随伴ウイルスベクター(AAV)である。一実施形態では、薬学的組成物は、哺乳動物細胞における発現に適したリボ核粒子(ribonucleoparticle)をさらに含む。
【0022】
別の態様において、RETT症候群を治療する方法であって、治療が必要な対象に、上述の態様および実施形態いずれかに記載するような薬学的組成物を投与する工程を含む、前記方法を提供する。方法の一実施形態では、対象は哺乳動物またはヒトである。
【0023】
別の態様において、対象におけるRETT症候群の治療における、上述の態様および実施形態いずれかに記載するような薬学的組成物の使用を提供する。使用の一実施形態では、対象は哺乳動物またはヒトである。
【0024】
一態様では、上述の態様および実施形態いずれかに記載するような細胞を含む組成物を提供する。一実施形態では、組成物は、薬学的に許容され得るキャリアーまたは希釈剤をさらに含む。
【0025】
別の態様では、上述の態様および実施形態に記載するような、(i)ABE8塩基エディターをコードする核酸;および(ii)ガイドポリヌクレオチドまたはガイドRNAを含む薬学的組成物を提供する。一実施形態では、薬学的組成物は脂質をさらに含む。一実施形態では、脂質はカチオン性脂質である。薬学的組成物の一実施形態では、塩基エディターをコードする核酸はmRNAである。
【0026】
別の態様において、ABE8塩基エディターであって、(i)アミノ酸置換L1111R、D1135V、G1218R、E1219F、A1322R、R1335V、T1337R、ならびに1つ以上のL1111、D1135L、S1136R、G1218S、E1219V、D1332A、D1332S、D1332T、D1332V、D1332L、D1332K、D1332R、R1335Q、T1337、T1337L、T1337Q、T1337I、T1337V、T1337F、T1337S、T1337N、T1337K、T1337H、T1337Q、およびT1337M、またはそれに対応するアミノ酸置換を含む改変SpCas9;ならびに(ii)TadA*8アデノシンデアミナーゼを含む、ABE8塩基エディターを提供する。
【0027】
別の態様では、(i)アミノ酸置換D1135L、S1136R、G1218S、E1219V、A1322R、R1335Q、およびT1337、ならびに1つ以上のL1111R、G1218R、E1219F、D1332A、D1332S、D1332T、D1332V、D1332L、D1332K、D1332R、T1337L、T1337I、T1337V、T1337F、T1337S、T1337N、T1337K、T1337R、T1337H、T1337Q、およびT1337M、またはそれに対応するアミノ酸置換を含む改変SpCas9;ならびに(ii)TadA*8デアミナーゼを含む、ABE8塩基エディターを提供する。
【0028】
本開示の特徴を、特に付随する請求項に示す。本発明の特徴および利点のよりよい理解は、開示の原理を利用する例示的な実施形態を示す以下の詳細な説明、および以下に示す付随する図を参照することによって得られるであろう:
【図面の簡単な説明】
【0029】
図1図1は、RTT突然変異に基づく運動挙動評価を示すグラフである。
【0030】
図2図2は、MECP2タンパク質の各ドメインの機能および一般的なRTT突然変異の位置を例示する。
【0031】
図3図3は、gRNA1、gRNA2、およびgRNA5を使用するABE8塩基エディターバリアントを用いた、R106W RTT突然変異の正確な修正の割合を示すグラフである。各gRNAと組まれた各塩基エディターの結果を、左から右に、ABE8.14(最も左)から陰性対照(最も右)まで示す。
【発明を実施するための形態】
【0032】
本発明は、プログラム可能核酸塩基エディター(例えばABE8)を用いた、RTTと関連する病原性アミノ酸の正確な修正のための組成物および方法を特徴とする。
【0033】
本発明は、少なくとも部分的に、アデノシンデアミナーゼバリアントを特徴とする塩基エディター(本明細書において、アデノシン塩基エディター8または「ABE8」と称される)が、内因性Mecp2遺伝子における一塩基多型(SNP)(例えばR106W、R133C、T158M、R255*、R270*、R306C)を正確に修正するという発見に基づく。一実施形態では、Mecp2遺伝子中のSNPはR133Cである。一実施形態では、Mecp2遺伝子中のSNPはR306Cである。
【0034】
進行性神経発達障害であるレット症候群(RTTまたはRETT)およびその症状の原因に関連する、メチル-CpG-結合タンパク質2(Mecp2)遺伝子中の1つ以上の突然変異を正確に修正する塩基編集および塩基編集システムを提供する組成物および方法を、本明細書に記載する。RTTは主に女性が罹患する、X連鎖優性障害であり、罹患個体の96%でMecp2遺伝子中の突然変異と関連し、見かけ上は正常である初期発生に続いて、細かい運動技能および有効なコミュニケーションの喪失、常同運動、ならびに失行症または歩行の完全な欠如を伴う退行が起こる(図1を参照されたい)。罹患した個体のさらなる臨床的特徴には、出生後の頭部成長速度の異常な減速、周期性呼吸、胃腸機能不全、癲癇、および脊柱側弯症が含まれる。
【0035】
最も多いRTT原因突然変異は、シチジンからチミジンへの(C→T)遷移突然変異であり、G・CからT・Aへの塩基対置換を生じる。この置換は、A・TからG・Cへの置換を触媒するアデノシン塩基エディター(ABE)で、野生型の非病原性ゲノム配列に復帰させることも可能である。さらに拡張して、非常に多いRTT原因突然変異は、遺伝子治療を用いて起こりうるようなMecp2遺伝子過剰発現を誘導するリスクを伴わずに、ABEを用いて野生型配列へ復帰させるための潜在的な標的である。したがって、A・TからG・CへのDNA塩基編集は、Mecp2遺伝子におけるもっとも多いRTT原因突然変異の1つ以上を正確に修正する潜在能力を有する。
【0036】
以下の説明および実施例は、本開示の実施形態を詳細に例示する。本開示は、本明細書に記載する特定の実施形態に限定されず、こうしたものとして多様であり得ることを理解すべきである。当業者は、本開示の多くの変型および改変があり、これらは本開示の範囲に含まれることを認識するであろう。
【0037】
本明細書に用いるセクション見出しは、編成目的のみのためであり、記載する主題を制限するとは見なされないものとする。
【0038】
本開示の多様な特徴が単一の実施形態の背景で記載され得るが、特徴はまた、別個にまたは任意の適切な組み合わせで提供されてもよい。逆に、本開示は、明確にするために別個の実施形態の背景で本明細書に記載される可能性もあるが、本開示はまた、単一の実施形態でも実行可能である。
定義
【0039】
以下の定義は、当技術分野の定義を補足するものであって本出願を対象としており、任意の関連するまたは関連性のない案件、例えば共通の所有に係る特許または出願に帰するものではない。本明細書に記載されたものと同様または同等の任意の方法および材料を、本開示の試験の実施において使用することができるが、好ましい材料および方法を本明細書で説明する。従って、本明細書で使用される用語は、特定の実施形態を説明する目的のみのためのものであり、限定することを意図するものではない。
【0040】
別段の定義がない限り、本開示およびその実施形態で使用されるすべての技術的および科学的用語は、本発明が属する分野の当業者によって一般的に理解される意味を有する。以下の参考文献は、当業者に、本開示において使用される多くの用語の一般的な定義を提供する: Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); およびHale & Marham, The Harper Collins Dictionary of Biology (1991)。
【0041】
本出願において、単数形の使用は、特に断りのない限り、複数形を含む。本明細書で使用されるように、単数形「a」、「an」、および「the」は、文脈が明確にそうでないことを指示しない限り、複数の指示対象を含むことに留意しなければならない。本出願において、「または」の使用は、別段の記載がない限り、「および/または」を意味し、かつ包括的であると理解される。さらに、用語「含む(including)」、ならびに「含む(include)」、「含む(includes)」、および「含まれる(included)」などの他の型の使用は、非限定的である。
【0042】
本明細書および特許請求の範囲において使用される場合、用語「含む(comprising)」(および「含む(comprise)」および「含む(comprises)」などのそのあらゆる形態)、「有する(having)」(「有する(have)」および「有する(has)」などのそのあらゆる形態)、「含む(including)」(「含む(include)」および「含む(includes)」などのそのあらゆる形態)または「含有する(containing)」(「含有する(contains)」および「含有する(contain)」などのそのあらゆる形態)は、包括的または開放的であり、追加の、記載されていない要素または方法工程を排除しない。本明細書で議論される任意の実施形態は、本開示の任意の方法または組成物に関して実施することができ、逆もまた同様であると考えられる。さらに、本開示の組成物を用いて、本開示の方法を達成することができる。
【0043】
用語「約(about)」または「およそ(approximately)」は、当業者によって決定されるように、特定の値について許容可能な誤差範囲内であることを意味し、これは、値がどのように測定または決定されるか、すなわち、測定システムの制限に部分的に依存する。例えば、「約」は、当技術分野における実務によれば、1以内または1を超える標準偏差内であることを意味し得る。あるいは、「約」は、所定の値の最大20%、最大10%、最大5%、または最大1%の範囲を意味し得る。あるいは、特に生物学的システムまたはプロセスに関して、この用語は、同じ桁以内、好ましくは5倍以内、より好ましくは2倍以内の値を意味することができる。特定の値が出願および特許請求の範囲に記載されている場合、別段の記載がない限り、その特定の値について許容可能な誤差範囲内にあることを意味する「約」という用語が推定されるべきである。
【0044】
本明細書に提供する範囲は、範囲内の値すべてに関する省略表現であると理解される。例えば、1~50の範囲は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50からなる群からの任意の数字、数字の組み合わせ、または下位範囲を含むと理解される。
【0045】
本明細書における「いくつかの実施形態」、「ある実施形態」、「一実施形態」、または「他の実施形態」という言及は、その実施形態に関連して説明される特定の特徴、構造、または特性が、本開示の少なくともいくつかの実施形態に含まれるが、必ずしもすべての実施形態に含まれるとは限らないことを意味する。
【0046】
「アデノシンデアミナーゼ」とは、アデニンまたはアデノシンの加水分解的脱アミノ化を触媒することができるポリペプチドまたはその断片を意味する。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、アデノシンからイノシン、またはデオキシアデノシンからデオキシイノシンへの加水分解的脱アミノ化を触媒するアデノシンデアミナーゼである。いくつかの実施形態では、アデノシンデアミナーゼは、デオキシリボ核酸 (DNA) 中のアデニンまたはアデノシンの加水分解的脱アミノ化を触媒する。本明細書で提供されるアデノシンデアミナーゼ(例えば、遺伝子操作されたアデノシンデアミナーゼ、進化させたアデノシンデアミナーゼ)は、細菌などの任意の生物由来であり得る。
【0047】
いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、例えばヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスなどの生物由来の天然存在デアミナーゼのバリアントである。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、天然に存在しない。例えば、いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、天然存在デアミナーゼに対して少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.1%、少なくとも99.2%、少なくとも99.3%、少なくとも99.4%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、または少なくとも99.9%の同一性である。
【0048】
いくつかの実施形態では、アデノシンデアミナーゼはTadAデアミナーゼである。いくつかの実施形態では、TadAデアミナーゼはTadAバリアントである。いくつかの実施形態では、TadAバリアントはTadA*8である。野生型TadA(wt)アデノシンデアミナーゼは、以下の配列(TadA参照配列とも呼ばれる)を有する:
【0049】
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
【0050】
いくつかの実施形態では、アデノシンデアミナーゼは、以下の配列における改変を含む:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
(TadA*7.10とも呼ばれる)。
【0051】
いくつかの実施形態では、TadA*7.10は少なくとも1つの改変を含む。いくつかの実施形態では、TadA*7.10はアミノ酸82位および/または166位で改変を含む。特定の実施形態では、上記参照配列のバリアントは、以下の改変のうちの1つ以上を含む:Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154R。他の実施形態では、TadA*7.10配列のバリアントは、
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R;または I76Y + V82S + Y123H + Y147R + Q154R
からなる群より選択される改変の組み合わせを含む。
【0052】
他の実施形態では、TadA*7.10、TadA参照配列に比較して、残基149、150、151、152、153、154、155、156、または157で始まるC末端の欠失、あるいは別のTadAの対応する突然変異を含む、欠失を含むアデノシンデアミナーゼバリアントを提供する。他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列に比較して、1つ以上の以下の改変: Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154R、あるいは別のTadAにおける対応する突然変異を含むTadA(例えばTadA*8)モノマーである。他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列に比較して:
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; または I76Y + V82S + Y123H + Y147R + Q154R
の群より選択される改変、あるいは別のTadAの対応する突然変異の組み合わせを含むTadA(例えばTadA*8)モノマーである。
【0053】
さらに他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列に比較して、各々、1つ以上の以下の改変、147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154R、あるいは別のTadAの対応する突然変異を有する2つのアデノシンデアミナーゼドメイン(例えばTadA*8)を含む、ホモダイマーである。他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列に比較して、各々:
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; または I76Y + V82S + Y123H + Y147R + Q154R
より選択される改変、あるいは別のTadAの対応する突然変異の組み合わせを有する、2つのアデノシンデアミナーゼドメイン(例えばTadA*8)を含むホモダイマーである。
【0054】
他の実施形態では、アデノシンデアミナーゼバリアントは、野生型TadAアデノシンデアミナーゼドメインと、TadA*7.10、TadA参照配列に比較して以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154R、あるいは別のTadAの対応する突然変異の1つ以上を含むアデノシンデアミナーゼバリアントドメイン(例えばTadA*8)とを含む、ヘテロダイマーである。他の実施形態では、アデノシンデアミナーゼバリアントは、野生型TadAアデノシンデアミナーゼドメインと、TadA*7.10、TadA参照配列に比較して:
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; および I76Y + V82S + Y123H + Y147R + Q154R
の群より選択される改変の組み合わせ、あるいは別のTadAにおける対応する突然変異を含むアデノシンデアミナーゼバリアントドメイン(例えばTadA*8)とを含む、ヘテロダイマーである。
【0055】
他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10ドメインと、TadA*7.10、TadA参照配列に比較して以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154R、あるいは別のTadAの対応する突然変異の1つ以上を含むアデノシンデアミナーゼバリアントドメイン(例えばTadA*8)とを含む、ヘテロダイマーである。他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10ドメインと、TadA*7.10すなわちTadA参照配列に比較して、以下の改変:
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; およびI76Y + V82S + Y123H + Y147R + Q154R
の組み合わせあるいは別のTadAにおける対応する突然変異を含むアデノシンデアミナーゼバリアントドメイン(例えばTadA*8)とを含む、ヘテロダイマーである。
【0056】
一実施形態では、アデノシンデアミナーゼは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこれらから本質的になる、TadA*8である:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
【0057】
いくつかの実施形態では、TadA*8は切り詰められている。いくつかの実施形態では、切詰TadA*8では、全長TadA*8に比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20のN末端アミノ酸残基が失われている。いくつかの実施形態では、切詰TadA*8では、全長TadA*8に比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20のC末端アミノ酸残基が失われている。いくつかの実施形態では、アデノシンデアミナーゼバリアントは全長TadA*8である。
【0058】
特定の実施形態では、アデノシンデアミナーゼヘテロダイマーは、TadA*8ドメイン、および以下の1つより選択されるアデノシンデアミナーゼドメインを含む:
Staphylococcus aureus (S. aureus) TadA:
MGSHMTNDIYFMTLAIEEAKKAAQLGEVPIGAIITKDDEVIARAHNLRETLQQPTAH AEHIAIERAAKVLGSWRLEGCTLYVTLEPCVMCAGTIVMSRIPRVVYGADDPKGGCSGS LMNLLQQSNFNHRAIVDKGVLKEACSTLLTTFFKNLRANKKSTN
Bacillus subtilis (B. subtilis) TadA:
MTQDELYMKEAIKEAKKAEEKGEVPIGAVLVINGEIIARAHNLRETEQRSIAHAEML VIDEACKALGTWRLEGATLYVTLEPCPMCAGAVVLSRVEKVVFGAFDPKGGCSGTLMN LLQEERFNHQAEVVSGVLEEECGGMLSAFFRELRKKKKAARKNLSE
Salmonella typhimurium (S. typhimurium) TadA:
MPPAFITGVTSLSDVELDHEYWMRHALTLAKRAWDEREVPVGAVLVHNHRVIGEG WNRPIGRHDPTAHAEIMALRQGGLVLQNYRLLDTTLYVTLEPCVMCAGAMVHSRIG RVVFGARDAKTGAAGSLIDVLHHPGMNHRVEIIEGVLRDECATLLSDFFRMRRQEIK ALKKADRAEGAGPAV
Shewanella putrefaciens (S. putrefaciens) TadA:
MDEYWMQVAMQMAEKAEAAGEVPVGAVLVKDGQQIATGYNLSISQHDPTAHAEI LCLRSAGKKLENYRLLDATLYITLEPCAMCAGAMVHSRIARVVYGARDEKTGAAGT VVNLLQHPAFNHQVEVTSGVLAEACSAQLSRFFKRRRDEKKALKLAQRAQQGIE
Haemophilus influenzae F3031 (H. influenzae) TadA:
MDAAKVRSEFDEKMMRYALELADKAEALGEIPVGAVLVDDARNIIGEGWNLSIVQSDPTΑΗ AEIIALRNGAKNIQNYRLLNSTLYVTLEPCTMCAGAILHSRIKRLVFGASDYK TGAIGSRFHFFDDYKMNHTLEITSGVLAEECSQKLSTFFQKRREEKKIEKALLKSLSDK
Caulobacter crescentus (C. crescentus) TadA:
MRTDESEDQDHRMMRLALDAARAAAEAGETPVGAVILDPSTGEVIATAGNGPIAAH DPTAHAEIAAMRAAAAKLGNYRLTDLTLVVTLEPCAMCAGAISHARIGRVVFGADD PKGGAVVHGPKFFAQPTCHWRPEVTGGVLADESADLLRGFFRARRKAKI
Geobacter sulfurreducens (G. sulfurreducens) TadA:
MSSLKKTPIRDDAYWMGKAIREAAKAAARDEVPIGAVIVRDGAVIGRGHNLREGSN DPSAHAEMIAIRQAARRSANWRLTGATLYVTLEPCLMCMGAIILARLERVVFGCYDP KGGAAGSLYDLSADPRLNHQVRLSPGVCQEECGTMLSDFFRDLRRRKKAKATPALF IDERKVPPEP
TadA*7.10
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
【0059】
「アデノシンデアミナーゼ塩基エディター(ABE8)ポリペプチド」または「ABE8」は、以下の参照配列:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸82位および/または166位で改変を含むアデノシンデアミナーゼバリアントを含む、本明細書に定義するような塩基エディターを意味する。
【0060】
いくつかの実施形態では、ABE8は、参照配列に比較してさらなる改変を含む。
【0061】
「アデノシンデアミナーゼ塩基エディター8(ABE8)ポリヌクレオチド」は、ABE8をコードするポリヌクレオチド(ポリヌクレオチド配列)を意味する。
【0062】
「投与する」は、本明細書において、患者または対象に、1つ以上の本明細書記載の組成物を提供することを指す。例として、かつ限定なしに、組成物投与、例えば注射は、静脈内(i.v.)注射、皮下(s.c.)注射、皮内(i.d.)注射、腹腔内(i.p.)注射、または筋内(i.m.)注射によって行われてもよい。1つ以上のこうした経路を使用してもよい。非経口投与は、例えば、ボーラス注射、または長期に渡る漸次灌流によってもよい。いくつかの実施形態では、非経口投与には、血管内、静脈内、筋内、動脈内、クモ膜下腔内、腫瘍内、皮内、腹腔内、経気管、皮下、表皮下、関節内、嚢下、クモ膜下および胸骨内(intrasternally)注入または注射が含まれる。あるいは、または同時に、投与は経口経路によってもよい。
【0063】
「剤(agent)」によって、任意の小分子化学化合物、抗体、核酸分子、またはポリペプチド、あるいはその断片を意味する。
【0064】
「改変」とは、本明細書に記載されるような標準技術の公知の方法によって検出されるような、遺伝子またはポリペプチドの発現レベルまたは活性の変化(例えば増加または減少)を意味する。本明細書で使用される場合、改変は、発現レベルの10%の変化、好ましくは25%の変化、より好ましくは40%の変化、最も好ましくは50%以上の発現レベルの変化を含む。「改善する(ameliorate)」とは、疾患の発展または進行を減少させる、抑制する、減衰させる、低減させる、停止させる、または安定させることを意味する。
【0065】
「アナログ」とは、同一ではないが、類似の機能的または構造的特徴を有する分子を意味する。例えば、ポリペプチドアナログは、対応する天然存在ポリペプチドの生物学的活性を保持しながら、天然存在ポリペプチドと比較して、そのアナログの機能を増強させる特定の生化学的修飾を有する。そのような生化学的修飾は、例えばリガンド結合を改変することなく、アナログのプロテアーゼ耐性、膜透過性、および/または半減期を増加させることができる。アナログは、非天然アミノ酸を含み得る。
【0066】
「メチルCpG結合タンパク質2(Mecp2)タンパク質」は、NCBI寄託番号NP_004983に対して少なくとも約95%のアミノ酸配列同一性を有するポリペプチドまたはその断片を意味する。特定の実施形態では、Mecp2タンパク質は、以下の参照配列に比較して、1つ以上の改変を含む。特定の実施形態では、RTTと関連するMecp2タンパク質は、R106W、R168*、R133C、T158M、R255*、R270*、およびR306Cより選択される1つ以上の突然変異を含む。例示的Mecp2アミノ酸配列を以下に提供する。
1 mvagmlglre eksedqdlqg lkdkplkfkk vkkdkkeeke gkhepvqpsa hhsaepaeag
61 kaetsegsgs apavpeasas pkqrrsiird rgpmyddptl pegwtrklkq rksgrsagky
121 dvylinpqgk afrskvelia yfekvgdtsl dpndfdftvt grgspsrreq kppkkpkspk
181 apgtgrgrgr pkgsgttrpk aatsegvqvk rvlekspgkl lvkmpfqtsp ggkaegggat
241 tstqvmvikr pgrkrkaead pqaipkkrgr kpgsvvaaaa aeakkkavke ssirsvqetv
301 lpikkrktre tvsievkevv kpllvstlge ksgkglktck spgrkskess pkgrsssass
361 ppkkehhhhh hhsespkapv pllpplpppp pepessedpt sppepqdlss svckeekmpr
421 ggslesdgcp kepaktqpav ataataaeky khrgegerkd ivsssmprpn reepvdsrtp
481 vtervs
【0067】
「Mecp2ポリヌクレオチド」は、Mecp2タンパク質またはその断片をコードする核酸分子を意味する。NCBI寄託番号NM_004992で入手可能な例示的Mecp2ポリヌクレオチドの配列を以下に提供する。特定の実施形態では、Mecp2ポリヌクレオチドは、以下の参照配列に比較して、1つ以上の改変を含む。特定の実施形態では、RTTと関連するMecp2ポリヌクレオチドは、316C>T、397C>T、473C>T、763C>T、808C>Tおよび916C>Tより選択される1つ以上の突然変異を含む。
1 ccggcgtcgg cggcgcgcgc gctccctcct ctcggagaga gggctgtggt aaaagccgtc
61 cggaaaatgg ccgccgccgc cgccgccgcg ccgagcggag gaggaggagg aggcgaggag
121 gagagactgc tccataaaaa tacagactca ccagttcctg ctttgatgtg acatgtgact
181 ccccagaata caccttgctt ctgtagacca gctccaacag gattccatgg tagctgggat
241 gttagggctc agggaagaaa agtcagaaga ccaggacctc cagggcctca aggacaaacc
301 cctcaagttt aaaaaggtga agaaagataa gaaagaagag aaagagggca agcatgagcc
361 cgtgcagcca tcagcccacc actctgctga gcccgcagag gcaggcaaag cagagacatc
421 agaagggtca ggctccgccc cggctgtgcc ggaagcttct gcctccccca aacagcggcg
481 ctccatcatc cgtgaccggg gacccatgta tgatgacccc accctgcctg aaggctggac
541 acggaagctt aagcaaagga aatctggccg ctctgctggg aagtatgatg tgtatttgat
601 caatccccag ggaaaagcct ttcgctctaa agtggagttg attgcgtact tcgaaaaggt
661 aggcgacaca tccctggacc ctaatgattt tgacttcacg gtaactggga gagggagccc
721 ctcccggcga gagcagaaac cacctaagaa gcccaaatct cccaaagctc caggaactgg
781 cagaggccgg ggacgcccca aagggagcgg caccacgaga cccaaggcgg ccacgtcaga
841 gggtgtgcag gtgaaaaggg tcctggagaa aagtcctggg aagctccttg tcaagatgcc
901 ttttcaaact tcgccagggg gcaaggctga ggggggtggg gccaccacat ccacccaggt
961 catggtgatc aaacgccccg gcaggaagcg aaaagctgag gccgaccctc aggccattcc
1021 caagaaacgg ggccgaaagc cggggagtgt ggtggcagcc gctgccgccg aggccaaaaa
1081 gaaagccgtg aaggagtctt ctatccgatc tgtgcaggag accgtactcc ccatcaagaa
1141 gcgcaagacc cgggagacgg tcagcatcga ggtcaaggaa gtggtgaagc ccctgctggt
1201 gtccaccctc ggtgagaaga gcgggaaagg actgaagacc tgtaagagcc ctgggcggaa
1261 aagcaaggag agcagcccca aggggcgcag cagcagcgcc tcctcacccc ccaagaagga
1321 gcaccaccac catcaccacc actcagagtc cccaaaggcc cccgtgccac tgctcccacc
1381 cctgccccca cctccacctg agcccgagag ctccgaggac cccaccagcc cccctgagcc
1441 ccaggacttg agcagcagcg tctgcaaaga ggagaagatg cccagaggag gctcactgga
1501 gagcgacggc tgccccaagg agccagctaa gactcagccc gcggttgcca ccgccgccac
1561 ggccgcagaa aagtacaaac accgagggga gggagagcgc aaagacattg tttcatcctc
1621 catgccaagg ccaaacagag aggagcctgt ggacagccgg acgcccgtga ccgagagagt
1681 tagctgactt tacacggagc ggattgcaaa gcaaaccaac aagaataaag gcagctgttg
1741 tctcttctcc ttatgggtag ggctctgaca aagcttcccg attaactgaa ataaaaaata
1801 tttttttttc tttcagtaaa cttagagttt cgtggcttca gggtgggagt agttggagca
1861 ttggggatgt ttttcttacc gacaagcaca gtcaggttga agacctaacc agggccagaa
1921 gtagctttgc acttttctaa actaggctcc ttcaacaagg cttgctgcag atactactga
1981 ccagacaagc tgttgaccag gcacctcccc tcccgcccaa acctttcccc catgtggtcg
2041 ttagagacag agcgacagag cagttgagag gacactcccg ttttcggtgc catcagtgcc
2101 ccgtctacag ctcccccagc tccccccacc tcccccactc ccaaccacgt tgggacaggg
2161 aggtgtgagg caggagagac agttggattc tttagagaag atggatatga ccagtggcta
2221 tggcctgtgc gatcccaccc gtggtggctc aagtctggcc ccacaccagc cccaatccaa
2281 aactggcaag gacgcttcac aggacaggaa agtggcacct gtctgctcca gctctggcat
2341 ggctaggagg ggggagtccc ttgaactact gggtgtagac tggcctgaac cacaggagag
2401 gatggcccag ggtgaggtgg catggtccat tctcaaggga cgtcctccaa cgggtggcgc
2461 tagaggccat ggaggcagta ggacaaggtg caggcaggct ggcctggggt caggccgggc
2521 agagcacagc ggggtgagag ggattcctaa tcactcagag cagtctgtga cttagtggac
2581 aggggagggg gcaaaggggg aggagaagaa aatgttcttc cagttacttt ccaattctcc
2641 tttagggaca gcttagaatt atttgcacta ttgagtcttc atgttcccac ttcaaaacaa
2701 acagatgctc tgagagcaaa ctggcttgaa ttggtgacat ttagtccctc aagccaccag
2761 atgtgacagt gttgagaact acctggattt gtatatatac ctgcgcttgt tttaaagtgg
2821 gctcagcaca tagggttccc acgaagctcc gaaactctaa gtgtttgctg caattttata
2881 aggacttcct gattggtttc tcttctcccc ttccatttct gccttttgtt catttcatcc
2941 tttcacttct ttcccttcct ccgtcctcct ccttcctagt tcatcccttc tcttccaggc
3001 agccgcggtg cccaaccaca cttgtcggct ccagtcccca gaactctgcc tgccctttgt
3061 cctcctgctg ccagtaccag ccccaccctg ttttgagccc tgaggaggcc ttgggctctg
3121 ctgagtccga cctggcctgt ctgtgaagag caagagagca gcaaggtctt gctctcctag
3181 gtagccccct cttccctggt aagaaaaagc aaaaggcatt tcccaccctg aacaacgagc
3241 cttttcaccc ttctactcta gagaagtgga ctggaggagc tgggcccgat ttggtagttg
3301 aggaaagcac agaggcctcc tgtggcctgc cagtcatcga gtggcccaac aggggctcca
3361 tgccagccga ccttgacctc actcagaagt ccagagtcta gcgtagtgca gcagggcagt
3421 agcggtacca atgcagaact cccaagaccc gagctgggac cagtacctgg gtccccagcc
3481 cttcctctgc tccccctttt ccctcggagt tcttcttgaa tggcaatgtt ttgcttttgc
3541 tcgatgcaga cagggggcca gaacaccaca catttcactg tctgtctggt ccatagctgt
3601 ggtgtagggg cttagaggca tgggcttgct gtgggttttt aattgatcag ttttcatgtg
3661 ggatcccatc tttttaacct ctgttcagga agtccttatc tagctgcata tcttcatcat
3721 attggtatat ccttttctgt gtttacagag atgtctctta tatctaaatc tgtccaactg
3781 agaagtacct tatcaaagta gcaaatgaga cagcagtctt atgcttccag aaacacccac
3841 aggcatgtcc catgtgagct gctgccatga actgtcaagt gtgtgttgtc ttgtgtattt
3901 cagttattgt ccctggcttc cttactatgg tgtaatcatg aaggagtgaa acatcataga
3961 aactgtctag cacttccttg ccagtcttta gtgatcagga accatagttg acagttccaa
4021 tcagtagctt aagaaaaaac cgtgtttgtc tcttctggaa tggttagaag tgagggagtt
4081 tgccccgttc tgtttgtaga gtctcatagt tggactttct agcatatatg tgtccatttc
4141 cttatgctgt aaaagcaagt cctgcaacca aactcccatc agcccaatcc ctgatccctg
4201 atcccttcca cctgctctgc tgatgacccc cccagcttca cttctgactc ttccccagga
4261 agggaagggg ggtcagaaga gagggtgagt cctccagaac tcttcctcca aggacagaag
4321 gctcctgccc ccatagtggc ctcgaactcc tggcactacc aaaggacact tatccacgag
4381 agcgcagcat ccgaccaggt tgtcactgag aagatgttta ttttggtcag ttgggttttt
4441 atgtattata cttagtcaaa tgtaatgtgg cttctggaat cattgtccag agctgcttcc
4501 ccgtcacctg ggcgtcatct ggtcctggta agaggagtgc gtggcccacc aggcccccct
4561 gtcacccatg acagttcatt cagggccgat ggggcagtcg tggttgggaa cacagcattt
4621 caagcgtcac tttatttcat tcgggcccca cctgcagctc cctcaaagag gcagttgccc
4681 agcctctttc ccttccagtt tattccagag ctgccagtgg ggcctgaggc tccttagggt
4741 tttctctcta tttccccctt tcttcctcat tccctcgtct ttcccaaagg catcacgagt
4801 cagtcgcctt tcagcaggca gccttggcgg tttatcgccc tggcaggcag gggccctgca
4861 gctctcatgc tgcccctgcc ttggggtcag gttgacagga ggttggaggg aaagccttaa
4921 gctgcaggat tctcaccagc tgtgtccggc ccagttttgg ggtgtgacct caatttcaat
4981 tttgtctgta cttgaacatt atgaagatgg gggcctcttt cagtgaattt gtgaacagca
5041 gaattgaccg acagctttcc agtacccatg gggctaggtc attaaggcca catccacagt
5101 ctcccccacc cttgttccag ttgttagtta ctacctcctc tcctgacaat actgtatgtc
5161 gtcgagctcc ccccaggtct acccctcccg gccctgcctg ctggtgggct tgtcatagcc
5221 agtgggattg ccggtcttga cagctcagtg agctggagat acttggtcac agccaggcgc
5281 tagcacagct cccttctgtt gatgctgtat tcccatatca aaagacacag gggacaccca
5341 gaaacgccac atcccccaat ccatcagtgc caaactagcc aacggcccca gcttctcagc
5401 tcgctggatg gcggaagctg ctactcgtga gcgccagtgc gggtgcagac aatcttctgt
5461 tgggtggcat cattccaggc ccgaagcatg aacagtgcac ctgggacagg gagcagcccc
5521 aaattgtcac ctgcttctct gcccagcttt tcattgctgt gacagtgatg gcgaaagagg
5581 gtaataacca gacacaaact gccaagttgg gtggagaaag gagtttcttt agctgacaga
5641 atctctgaat tttaaatcac ttagtaagcg gctcaagccc aggagggagc agagggatac
5701 gagcggagtc ccctgcgcgg gaccatctgg aattggttta gcccaagtgg agcctgacag
5761 ccagaactct gtgtcccccg tctaaccaca gctccttttc cagagcattc cagtcaggct
5821 ctctgggctg actgggccag gggaggttac aggtaccagt tctttaagaa gatctttggg
5881 catatacatt tttagcctgt gtcattgccc caaatggatt cctgtttcaa gttcacacct
5941 gcagattcta ggacctgtgt cctagacttc agggagtcag ctgtttctag agttcctacc
6001 atggagtggg tctggaggac ctgcccggtg ggggggcaga gccctgctcc ctccgggtct
6061 tcctactctt ctctctgctc tgacgggatt tgttgattct ctccattttg gtgtctttct
6121 cttttagata ttgtatcaat ctttagaaaa ggcatagtct acttgttata aatcgttagg
6181 atactgcctc ccccagggtc taaaattaca tattagaggg gaaaagctga acactgaagt
6241 cagttctcaa caatttagaa ggaaaaccta gaaaacattt ggcagaaaat tacatttcga
6301 tgtttttgaa tgaatacgag caagctttta caacagtgct gatctaaaaa tacttagcac
6361 ttggcctgag atgcctggtg agcattacag gcaaggggaa tctggaggta gccgacctga
6421 ggacatggct tctgaacctg tcttttggga gtggtatgga aggtggagcg ttcaccagtg
6481 acctggaagg cccagcacca ccctccttcc cactcttctc atcttgacag agcctgcccc
6541 agcgctgacg tgtcaggaaa acacccaggg aactaggaag gcacttctgc ctgaggggca
6601 gcctgccttg cccactcctg ctctgctcgc ctcggatcag ctgagccttc tgagctggcc
6661 tctcactgcc tccccaaggc cccctgcctg ccctgtcagg aggcagaagg aagcaggtgt
6721 gagggcagtg caaggaggga gcacaacccc cagctcccgc tccgggctcc gacttgtgca
6781 caggcagagc ccagaccctg gaggaaatcc tacctttgaa ttcaagaaca tttggggaat
6841 ttggaaatct ctttgccccc aaacccccat tctgtcctac ctttaatcag gtcctgctca
6901 gcagtgagag cagatgaggt gaaaaggcca agaggtttgg ctcctgccca ctgatagccc
6961 ctctccccgc agtgtttgtg tgtcaagtgg caaagctgtt cttcctggtg accctgatta
7021 tatccagtaa cacatagact gtgcgcatag gcctgctttg tctcctctat cctgggcttt
7081 tgttttgctt tttagttttg cttttagttt ttctgtccct tttatttaac gcaccgacta
7141 gacacacaaa gcagttgaat ttttatatat atatctgtat attgcacaat tataaactca
7201 ttttgcttgt ggctccacac acacaaaaaa agacctgtta aaattatacc tgttgcttaa
7261 ttacaatatt tctgataacc atagcatagg acaagggaaa ataaaaaaag aaaaaaaaga
7321 aaaaaaaacg acaaatctgt ctgctggtca cttcttctgt ccaagcagat tcgtggtctt
7381 ttcctcgctt ctttcaaggg ctttcctgtg ccaggtgaag gaggctccag gcagcaccca
7441 ggttttgcac tcttgtttct cccgtgcttg tgaaagaggt cccaaggttc tgggtgcagg
7501 agcgctccct tgacctgctg aagtccggaa cgtagtcggc acagcctggt cgccttccac
7561 ctctgggagc tggagtccac tggggtggcc tgactccccc agtccccttc ccgtgacctg
7621 gtcagggtga gcccatgtgg agtcagcctc gcaggcctcc ctgccagtag ggtccgagtg
7681 tgtttcatcc ttcccactct gtcgagcctg ggggctggag cggagacggg aggcctggcc
7741 tgtctcggaa cctgtgagct gcaccaggta gaacgccagg gaccccagaa tcatgtgcgt
7801 cagtccaagg ggtcccctcc aggagtagtg aagactccag aaatgtccct ttcttctccc
7861 ccatcctacg agtaattgca tttgcttttg taattcttaa tgagcaatat ctgctagaga
7921 gtttagctgt aacagttctt tttgatcatc tttttttaat aattagaaac accaaaaaaa
7981 tccagaaact tgttcttcca aagcagagag cattataatc accagggcca aaagcttccc
8041 tccctgctgt cattgcttct tctgaggcct gaatccaaaa gaaaaacagc cataggccct
8101 ttcagtggcc gggctacccg tgagcccttc ggaggaccag ggctggggca gcctctgggc
8161 ccacatccgg ggccagctcc ggcgtgtgtt cagtgttagc agtgggtcat gatgctcttt
8221 cccacccagc ctgggatagg ggcagaggag gcgaggaggc cgttgccgct gatgtttggc
8281 cgtgaacagg tgggtgtctg cgtgcgtcca cgtgcgtgtt ttctgactga catgaaatcg
8341 acgcccgagt tagcctcacc cggtgacctc tagccctgcc cggatggagc ggggcccacc
8401 cggttcagtg tttctgggga gctggacagt ggagtgcaaa aggcttgcag aacttgaagc
8461 ctgctccttc ccttgctacc acggcctcct ttccgtttga tttgtcactg cttcaatcaa
8521 taacagccgc tccagagtca gtagtcaatg aatatatgac caaatatcac caggactgtt
8581 actcaatgtg tgccgagccc ttgcccatgc tgggctcccg tgtatctgga cactgtaacg
8641 tgtgctgtgt ttgctcccct tccccttcct tctttgccct ttacttgtct ttctggggtt
8701 tttctgtttg ggtttggttt ggtttttatt tctccttttg tgttccaaac atgaggttct
8761 ctctactggt cctcttaact gtggtgttga ggcttatatt tgtgtaattt ttggtgggtg
8821 aaaggaattt tgctaagtaa atctcttctg tgtttgaact gaagtctgta ttgtaactat
8881 gtttaaagta attgttccag agacaaatat ttctagacac tttttcttta caaacaaaag
8941 cattcggagg gagggggatg gtgactgaga tgagagggga gagctgaaca gatgacccct
9001 gcccagatca gccagaagcc acccaaagca gtggagccca ggagtcccac tccaagccag
9061 caagccgaat agctgatgtg ttgccacttt ccaagtcact gcaaaaccag gttttgttcc
9121 gcccagtgga ttcttgtttt gcttcccctc cccccgagat tattaccacc atcccgtgct
9181 tttaaggaaa ggcaagattg atgtttcctt gaggggagcc aggaggggat gtgtgtgtgc
9241 agagctgaag agctggggag aatggggctg ggcccaccca agcaggaggc tgggacgctc
9301 tgctgtgggc acaggtcagg ctaatgttgg cagatgcagc tcttcctgga caggccaggt
9361 ggtgggcatt ctctctccaa ggtgtgcccc gtgggcatta ctgtttaaga cacttccgtc
9421 acatcccacc ccatcctcca gggctcaaca ctgtgacatc tctattcccc accctcccct
9481 tcccagggca ataaaatgac catggagggg gcttgcactc tcttggctgt cacccgatcg
9541 ccagcaaaac ttagatgtga gaaaacccct tcccattcca tggcgaaaac atctccttag
9601 aaaagccatt accctcatta ggcatggttt tgggctccca aaacacctga cagcccctcc
9661 ctcctctgag aggcggagag tgctgactgt agtgaccatt gcatgccggg tgcagcatct
9721 ggaagagcta ggcagggtgt ctgccccctc ctgagttgaa gtcatgctcc cctgtgccag
9781 cccagaggcc gagagctatg gacagcattg ccagtaacac aggccaccct gtgcagaagg
9841 gagctggctc cagcctggaa acctgtctga ggttgggaga ggtgcacttg gggcacaggg
9901 agaggccggg acacacttag ctggagatgt ctctaaaagc cctgtatcgt attcaccttc
9961 agtttttgtg ttttgggaca attactttag aaaataagta ggtcgtttta aaaacaaaaa
10021 ttattgattg cttttttgta gtgttcagaa aaaaggttct ttgtgtatag ccaaatgact
10081 gaaagcactg atatatttaa aaacaaaagg caatttatta aggaaatttg taccatttca
10141 gtaaacctgt ctgaatgtac ctgtatacgt ttcaaaaaca cccccccccc actgaatccc
10201 tgtaacctat ttattatata aagagtttgc cttataaatt t
【0068】
「塩基エディター(BE)」あるいは「核酸塩基エディター(NBE)」とは、ポリヌクレオチドに結合し核酸塩基改変活性を有する剤を意味する。多様な実施形態では、塩基エディターは、核酸塩基改変ポリペプチド(例えば、デアミナーゼ)および核酸プログラム可能ヌクレオチド結合ドメインを、ガイドポリヌクレオチド(例えばガイドRNA)とともに含む。多様な実施形態では、該剤は、塩基編集活性を有するタンパク質ドメイン、すなわち、核酸分子(例えばDNA)内の塩基(例えばA、T、C、G、またはU)を改変することができるドメインを含む生体分子複合体である。いくつかの実施形態では、ポリヌクレオチドプログラム可能DNA結合ドメインは、デアミナーゼドメインに融合または連結される。一実施形態では、該剤は、塩基編集活性を有するドメインを含む融合タンパク質である。別の実施形態では、塩基編集活性を有するタンパク質ドメインは、ガイドRNAに連結される(例えば、ガイドRNA上のRNA結合モチーフおよびデアミナーゼに融合されたRNA結合ドメインを介して)。いくつかの実施形態では、塩基編集活性を有するドメインは、核酸分子内の塩基を脱アミノ化することができる。いくつかの実施形態では、塩基エディターは、DNA分子内の1つ以上の塩基を脱アミノ化することができる。いくつかの実施形態では、塩基エディターは、DNA内のアデノシン (A) を脱アミノ化することができる。いくつかの実施形態では、塩基エディターはアデノシン塩基エディター (ABE) である。
【0069】
いくつかの実施形態では、塩基エディターは、循環置換体(circular permutant)Cas9(例えばspCas9またはsaCas9)および二部分核局在化配列を含む足場内にアデノシンデアミナーゼバリアント(例えばTadA*8)をクローニングすることによって生成される(例えばABE8)。循環置換体Cas9は当技術分野に公知であり、例えば、Oakes et al., Cell 176, 254-267, 2019に記載されている。例示的な循環置換体は、以下の通りであり、太字配列はCas9由来の配列を示し、斜字配列はリンカー配列を示し、下線配列は二部分核局在化配列を示す。
CP5(MSP「NGC=突然変異を含むPamバリアント、通常のCas9はNGGを好む」、PID=タンパク質相互作用ドメインおよび「D10A」ニッカーゼを含む):
【0070】
いくつかの実施形態では、塩基エディターはアデノシンデアミナーゼ塩基エディター8(ABE8)である。いくつかの実施形態では、ABE8は、以下の表9由来の塩基エディターより選択される。いくつかの実施形態では、ABE8は、TadAから進化したアデノシンデアミナーゼバリアントを含有する。いくつかの実施形態では、ABE8のアデノシンデアミナーゼバリアントは、以下の表9に記載するようなTadA*8バリアントである。いくつかの実施形態では、アデノシンデアミナーゼバリアントは、Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rの群より選択される改変の1つ以上を含むTadA*7.10バリアント(例えばTadA*8)である。多様な実施形態では、ABE8は、
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; および I76Y + V82S + Y123H + Y147R + Q154R
の群より選択される改変の組み合わせを含む、TadA*7.10バリアント(例えばTadA*8)を含む。いくつかの実施形態では、ABE8はモノマー構築物である。いくつかの実施形態では、ABE8はヘテロダイマー構築物である。いくつかの実施形態では、ABE8塩基エディターは、配列:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
を含む。
【0071】
いくつかの実施形態では、ポリヌクレオチドプログラム可能DNA結合ドメインは、CRISPR会合(例えばCasまたはCpf1)酵素である。いくつかの実施形態では、塩基エディターは、デアミナーゼドメインに融合された、触媒的に不活性である(dead)Cas9 (dCas9) である。いくつかの実施形態では、塩基エディターは、デアミナーゼドメインに融合されたCas9ニッカーゼ (nCas9) である。いくつかの実施形態では、塩基エディターを塩基切除修復(BER)の阻害剤と融合させる。いくつかの実施形態では、塩基切除修復の阻害剤はウラシルDNAグリコシラーゼ阻害剤(UGI)である。いくつかの実施形態では、塩基切除修復の阻害剤は、イノシン塩基切除修復阻害剤である。塩基エディターの詳細は、国際PCT出願番号PCT/2017/045381(WO 2018/027078)およびPCT/US 2016/058344(WO 2017/070632)に記載されており、それぞれその全体が参照により本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature 551, 464-471 (2017); Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017), および Rees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1も参照のこと (その内容全体を参照により本明細書に組み込む) 。
【0072】
例として、本明細書に記載する塩基編集組成物、システムおよび方法中で用いられるようなアデニン塩基エディターABEは、以下に提供するような核酸配列(8877塩基対)、(Addgene, Watertown, MA.; Gaudelli NM, et al., Nature. 2017 Nov 23;551(7681):464-471. doi: 10.1038/nature24644; Koblan LW, et al., Nat Biotechnol. 2018 Oct;36(9):843-846. doi: 10.1038/nbt.4172.)を有する。以下のABE核酸配列に少なくとも95%以上の同一性を有するポリヌクレオチド配列もまた含まれる。
ATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACAT
GACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGG
TTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTG
ACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCC
ATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGT
CAGATCCGCTAGAGATCCGCGGCCGCTAATACGACTCACTATAGGGAGAGCCGCCACCATGAAACGGACA
GCCGACGGAAGCGAGTTCGAGTCACCAAAGAAGAAGCGGAAAGTCTCTGAAGTCGAGTTTAGCCACGAGT
ATTGGATGAGGCACGCACTGACCCTGGCAAAGCGAGCATGGGATGAAAGAGAAGTCCCCGTGGGCGCCGT
GCTGGTGCACAACAATAGAGTGATCGGAGAGGGATGGAACAGGCCAATCGGCCGCCACGACCCTACCGCA
CACGCAGAGATCATGGCACTGAGGCAGGGAGGCCTGGTCATGCAGAATTACCGCCTGATCGATGCCACCC
TGTATGTGACACTGGAGCCATGCGTGATGTGCGCAGGAGCAATGATCCACAGCAGGATCGGAAGAGTGGT
GTTCGGAGCACGGGACGCCAAGACCGGCGCAGCAGGCTCCCTGATGGATGTGCTGCACCACCCCGGCATG
AACCACCGGGTGGAGATCACAGAGGGAATCCTGGCAGACGAGTGCGCCGCCCTGCTGAGCGATTTCTTTA
GAATGCGGAGACAGGAGATCAAGGCCCAGAAGAAGGCACAGAGCTCCACCGACTCTGGAGGATCTAGCGG
AGGATCCTCTGGAAGCGAGACACCAGGCACAAGCGAGTCCGCCACACCAGAGAGCTCCGGCGGCTCCTCC
GGAGGATCCTCTGAGGTGGAGTTTTCCCACGAGTACTGGATGAGACATGCCCTGACCCTGGCCAAGAGGG
CACGCGATGAGAGGGAGGTGCCTGTGGGAGCCGTGCTGGTGCTGAACAATAGAGTGATCGGCGAGGGCTG
GAACAGAGCCATCGGCCTGCACGACCCAACAGCCCATGCCGAAATTATGGCCCTGAGACAGGGCGGCCTG
GTCATGCAGAACTACAGACTGATTGACGCCACCCTGTACGTGACATTCGAGCCTTGCGTGATGTGCGCCG
GCGCCATGATCCACTCTAGGATCGGCCGCGTGGTGTTTGGCGTGAGGAACGCAAAAACCGGCGCCGCAGG
CTCCCTGATGGACGTGCTGCACTACCCCGGCATGAATCACCGCGTCGAAATTACCGAGGGAATCCTGGCA
GATGAATGTGCCGCCCTGCTGTGCTATTTCTTTCGGATGCCTAGACAGGTGTTCAATGCTCAGAAGAAGG
CCCAGAGCTCCACCGACTCCGGAGGATCTAGCGGAGGCTCCTCTGGCTCTGAGACACCTGGCACAAGCGA
GAGCGCAACACCTGAAAGCAGCGGGGGCAGCAGCGGGGGGTCAGACAAGAAGTACAGCATCGGCCTGGCC
ATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGG
TGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGA
AACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGC
TATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGT
CCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGC
CTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGAC
CTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACC
TGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGA
GGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGA
CGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCC
TGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAG
CAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTT
CTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCA
AGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGC
TCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCC
GGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGG
ACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAA
CGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTAC
CCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCC
CTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAA
CTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAG
AACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGC
TGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGC
CATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAG
AAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACAT
ACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGA
AGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCC
CACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCC
GGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGG
CTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAA
GCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTA
AGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGA
GAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGA
ATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACA
CCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGA
ACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGAC
TCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAG
AGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTT
CGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAG
CTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACG
ACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCG
GAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAAC
GCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACA
AGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTT
CTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGG
CCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGC
GGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAA
AGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAG
TACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGT
CCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAA
TCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAG
TACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAA
ACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGG
CTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATC
GAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCT
ACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAA
TCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAA
GAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTC
AGCTGGGAGGTGACTCTGGCGGCTCAAAAAGAACCGCCGACGGCAGCGAATTCGAGCCCAAGAAGAAGAG
GAAAGTCTAACCGGTCATCATCACCATCACCATTGAGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTT
CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCAC
TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGT
GGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCT
CTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCGATACCGTCGACCTCTAGCTAGAGCTTGGCGTA
ATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGA
AGCATAAAGTGTAAAGCCTAGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGC
CCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGG
TTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGA
GCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACA
TGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCT
CCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAA
AGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGAT
ACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTC
GGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTA
TCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTA
ACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTA
CACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGC
TCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCA
GAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACACTCAGTGGAACGAAAACTC
ACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGA
AGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGG
CACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTAC
GATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCA
GATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCT
CCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGT
TGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCC
CAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGA
TCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTAC
TGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGT
ATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAA
AAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAG
TTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGA
GCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATAC
TCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATG
TATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCGACGGA
TCGGGAGATCGATCTCCCGATCCCCTAGGGTCGACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAA
GCCAGTATCTGCTCCCTGCTTGTGTGTTGGAGGTCGCTGAGTAGTGCGCGAGCAAAATTTAAGCTACAAC
AAGGCAAGGCTTGACCGACAATTGCATGAAGAATCTGCTTAGGGTTAGGCGTTTTGCGCTGCTTCGCGAT
GTACGGGCCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCAT
TAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCC
CAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCAT
TGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATC
【0073】
「塩基編集活性」とは、ポリヌクレオチド内の塩基を化学的に改変させるように作用することを意味する。一実施形態では、第一の塩基が第二の塩基に変換される。一実施形態では、例えば、塩基編集活性は、アデノシンまたはアデニンデアミナーゼ活性、例えばA・TをG・Cに変換する活性である。
【0074】
いくつかの実施形態では、塩基編集活性は、編集効率によって評価される。塩基編集効率は、任意の適切な手段によって、例えばサンガー配列決定または次世代配列決定によって測定され得る。いくつかの実施形態では、塩基編集効率は、塩基エディターによって達成された核酸塩基変換を含む総配列決定リードの割合、例えばG・C塩基対に変換された標的A・T塩基対を含む総配列決定リードの割合によって測定される。いくつかの実施形態では、塩基編集効率は、細胞集団において塩基編集を行った際、塩基エディターによって達成された核酸塩基変換を含む総細胞の割合によって測定される。
【0075】
用語「塩基エディターシステム」とは、標的ヌクレオチド配列の核酸塩基を編集するためのシステムを指す。多様な実施形態では、塩基エディター(BE)システムは、 (1) ポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン(例えばCas9)と;(2)前記核酸塩基を脱アミノ化するためのデアミナーゼドメイン(例えばアデノシンデアミナーゼ)と;(3)1つ以上のガイドポリヌクレオチド(例えばガイドRNA)とを含む。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能DNA結合ドメインである。いくつかの実施形態では、塩基エディターは、アデニンまたはアデノシン塩基エディター(ABE)である。いくつかの実施形態では、塩基エディターシステムはアデノシン塩基エディター(ABE8)である。いくつかの実施形態では、ABE8はモノマー構築物である。いくつかの実施形態では、ABE8は、
ABE8.1-m, ABE8.2-m, ABE8.3-m, ABE8.4-m, ABE8.5-m, ABE8.6-m, ABE8.7-m, ABE8.8-m, ABE8.9-m, ABE8.10-m, ABE8.11-m, ABE8.12-m, ABE8.13-m, ABE8.14-m, ABE8.15-m, ABE8.16-m, ABE8.17-m, ABE8.18-m, ABE8.19-m, ABE8.20-m, ABE8.21-m, ABE8.22-m, ABE8.23-m, ABE8.24-m
である。いくつかの実施形態では、ABE8は、ヘテロマー構築物である。いくつかの実施形態では、ABE8は、
ABE8.1-d, ABE8.2-d, ABE8.3-d, ABE8.4-d, ABE8.5-d, ABE8.6-d, ABE8.7-d, ABE8.8-d, ABE8.9-d, ABE8.10-d, ABE8.11-d, ABE8.12-d, ABE8.13-d, ABE8.14-d, ABE8.15-d, ABE8.16-d, ABE8.17-d, ABE8.18-d, ABE8.19-d, ABE8.20-d, ABE8.21-d, ABE8.22-d, ABE8.23-d, またはABE8.24-d
である。
【0076】
いくつかの実施形態では、核酸塩基エディターシステムは、1つより多い塩基編集構成要素を含んでもよい。例えば、塩基エディターシステムは1つ以上のアデノシンデアミナーゼを含んでもよい。いくつかの実施形態では、シングルガイドポリヌクレオチドを利用して、標的核酸配列に、異なるデアミナーゼを標的指向化してもよい。いくつかの実施形態では、ガイドポリヌクレオチドの単一対を利用して、標的核酸配列に、異なるデアミナーゼを標的指向化してもよい。
【0077】
塩基エディターシステムのデアミナーゼドメインおよびポリヌクレオチドプログラム可能ヌクレオチド結合構成要素は、互いに共有的にまたは非共有的に結合されてもよいし、あるいはその会合および相互作用の任意の組み合わせによって結合されてもよい。例えば、いくつかの実施形態では、デアミナーゼドメインは、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインによって、標的ヌクレオチド配列に標的指向化されてもよい。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを、デアミナーゼドメインに融合させるかまたは連結してもよい。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、デアミナーゼドメインと非共有結合的に相互作用するかまたは会合することによって、標的ヌクレオチド配列にデアミナーゼドメインを標的指向化し得る。例えば、いくつかの実施形態では、デアミナーゼドメインは、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの一部である、追加の異種部分またはドメインと、相互作用するか、会合するか、または複合体を形成可能である、追加の異種部分またはドメインを含んでもよい。いくつかの実施形態では、追加の異種部分は、ポリペプチドと結合し、相互作用し、会合し、または複合体を形成することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドと結合し、相互作用し、会合し、または複合体を形成可能であり得る。いくつかの実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリペプチドリンカーに結合可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合可能であり得る。追加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態では、追加の異種部分は、K相同 (KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステライルアルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
【0078】
塩基エディターシステムは、ガイドポリヌクレオチド構成要素をさらに含むことができる。塩基エディターシステムの構成要素は、共有結合、非共有相互作用、またはそれらの会合および相互作用の任意の組み合わせを介して互いに随伴され得ることが理解されるべきである。いくつかの実施形態では、デアミナーゼドメインは、ガイドポリヌクレオチドによって、標的ヌクレオチド配列に標的指向化され得る。例えば、いくつかの実施形態では、デアミナーゼドメインは、ガイドポリヌクレオチドの一部またはセグメント(例えばポリヌクレオチドモチーフ)と相互作用し、会合し、または複合体を形成可能である追加の異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質のようなポリヌクレオチド結合ドメイン)を含み得る。いくつかの実施形態では、追加の異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)は、デアミナーゼドメインに融合または連結され得る。いくつかの実施形態では、追加の異種部分は、ポリペプチドと結合するか、相互作用するか、会合するか、または複合体を形成することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドと結合するか、相互作用するか、会合するか、または複合体を形成することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリペプチドリンカーに結合可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合可能であり得る。追加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態では、追加の異種部分は、K相同 (KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステライルアルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
【0079】
いくつかの実施形態では、塩基エディターシステムは、塩基切除修復(BER)構成要素の阻害剤をさらに含んでもよい。塩基エディターシステムの構成要素は、共有結合、非共有相互作用、またはその会合および相互作用の任意の組み合わせを通じて、互いに関連付けられてもよいことが理解されるべきである。BER構成要素の阻害剤は、塩基切除修復(BER)阻害剤を含んでもよい。いくつかの実施形態では、塩基切除修復(BER)の阻害剤は、ウラシルDNAグリコシラーゼ阻害剤(UGI)であってもよい。いくつかの実施形態では、塩基切除修復の阻害剤は、イノシン塩基切除修復(BER)阻害剤であってもよい。いくつかの実施形態では、塩基切除修復(BER)の阻害剤は、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインによって、標的ヌクレオチド配列に標的指向化されていてもよい。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、塩基切除修復(BER)阻害剤に融合または連結されていてもよい。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、デアミナーゼドメインおよび塩基切除修復(BER)の阻害剤に融合または連結されていてもよい。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、塩基切除修復(BER)阻害剤との非共有相互作用または会合によって、塩基切除修復の阻害剤を標的ヌクレオチド配列に標的指向化してもよい。例えば、いくつかの実施形態では、塩基切除修復(BER)構成要素の阻害剤は、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの一部である追加の異種部分またはドメインと、相互作用するか、会合するか、または複合体を形成することが可能な、追加の異種部分またはドメインを含んでもよい。いくつかの実施形態では、塩基切除修復(BER)の阻害剤は、ガイドポリヌクレオチドによって、標的ヌクレオチド配列に標的指向化され得る。例えば、いくつかの実施形態では、塩基切除修復(BER)の阻害剤は、ガイドポリヌクレオチドの一部またはセグメント(例えばポリヌクレオチドモチーフ) と相互作用可能であるか、会合可能であるか、または複合体を形成可能である追加の異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質のようなポリヌクレオチド結合ドメイン)を含み得る。いくつかの実施形態では、ガイドポリヌクレオチドの追加の異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)は、塩基切除修復(BER)の阻害剤に融合または連結され得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドと結合するか、相互作用するか、会合するか、または複合体を形成することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリペプチドリンカーに結合可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合可能であり得る。追加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態では、追加の異種部分は、K相同 (KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステライルアルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
【0080】
用語「Cas9」または「Cas9ドメイン」は、Cas9タンパク質またはその断片(例えばCas9の活性、不活性、または部分的に活性なDNA切断ドメイン、および/またはCas9のgRNA結合ドメインを含むタンパク質)を含むRNA誘導型ヌクレアーゼを指す。Cas9ヌクレアーゼはまた、CasnlヌクレアーゼまたはCRISPR(clustered regularly interspaced short palindromic repeat)関連ヌクレアーゼと呼ばれることもある。CRISPRは、可動性の遺伝要素(ウイルス、転位因子および接合性プラスミド)に対する保護を提供する、適応免疫システムである。CRISPRクラスターは、スペーサー、先行する可動要素に相補的な配列、および標的侵入核酸を含有する。CRISPRクラスターは転写され、CRISPR RNA (crRNA) にプロセシングされる。II型CRISPRシステムでは、pre-crRNAの正しいプロセシングは、トランスにコードされる小RNA(tracrRNA)、内因性リボヌクレアーゼ3(rnc)、およびCas9タンパク質を必要とする。tracrRNAはリボヌクレアーゼ3が補助するpre-crRNAのプロセシングのガイドとなる。続いて、Cas9/crRNA/tracrRNAが、スペーサーに相補的な直鎖または環状のdsDNA標的をエンドヌクレアーゼで切断する。crRNAに相補的でない標的鎖は、最初にエンドヌクレアーゼ的に切断され、次にエキソヌクレアーゼ的に3’-5’にトリムされる。自然界では、DNA結合と切断にはタンパク質と両方のRNAが必要である。しかし、crRNAおよびtracrRNAの両方の態様を単一のRNA種に組み込むように、シングルガイドRNA(「sgRNA」、あるいは単に「gRNA」)を操作することができる。例えばJinek M., et al., Science 337:816-821(2012)を参照のこと(その内容全体が参照により本明細書に組み入れられる)。Cas9は、CRISPR反復配列中の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、「自己」と「非自己」を区別することを助ける。Cas9ヌクレアーゼの配列および構造は、当業者によく知られている(例えば“Complete genome sequence of an Ml strain of Streptococcus pyogenes.” Ferretti et al., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); “CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.” Deltcheva E., et al., Nature 471:602-607(2011); および“A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.” Jinek M., et al., Science 337:816-821(2012)を参照のこと。その内容全体が参照により本明細書に組み入れられる)。Cas9オルソログは、限定されるものではないが、S.pyogenesおよびS.thermophilusを含む多様な種において記述されてきた。追加の適切なCas9ヌクレアーゼおよび配列は、本開示に基づいて当業者に明らかとなり、そのようなCas9ヌクレアーゼおよび配列は、Chylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems” (2013) RNA Biology 10:5, 726-737に開示されている生物および遺伝子座由来のCas9配列を含む。その全内容は参照により本明細書に組み込まれる。
【0081】
例示的なCas9は、Streptococcus pyogenes Cas9(spCas9)であり、そのアミノ酸配列は以下に提供される。
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
【0082】
ヌクレアーゼ不活性化Cas9タンパク質は、交換可能に「dCas9」タンパク質(nuclease-“dead” Cas9の意)または触媒的に不活性なCas9とも称され得る。不活性なDNA切断ドメインを有するCas9タンパク質(またはその断片)を生成する方法は公知である(例えばJinek et al, Science. 337:816-821(2012); Qi et al, “Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression” (2013) Cell. 28; 152(5): 1173-83を参照のこと (各々の全内容は参照により本明細書に組み込まれる))。例えば、Cas9のDNA切断ドメインは、HNHヌクレアーゼサブドメインとRuvC1サブドメインという2つのサブドメインを含むことが知られている。HNHサブドメインはgRNAに相補的な鎖を切断し、RuvC1サブドメインは非相補的な鎖を切断する。これらのサブドメイン内の突然変異はCas9のヌクレアーゼ活性を抑制し得る。例えば、突然変異D10AおよびH840Aは、S. pyogenes Cas9 のヌクレアーゼ活性を完全に不活性化する(Jinek et al, Science. 337:816-821(2012); Qi et al, Cell. 28;152(5): 1173-83 (2013))。いくつかの実施形態では、Cas9ヌクレアーゼは、不活性な(例えば不活化された) DNA切断ドメインを有し、すなわち、Cas9は、「nCas9」タンパク質(「nickase」Cas9の意)と呼ばれるニッカーゼである。いくつかの実施形態では、Cas9の断片を含むタンパク質を提供する。例えば、いくつかの実施形態では、タンパク質は、2つのCas9ドメイン:(1)Cas9のgRNA結合ドメイン;または(2)Cas9のDNA切断ドメインの1つを含む。いくつかの実施形態では、Cas9またはその断片を含むタンパク質は、「Cas9バリアント」と称される。Cas9バリアントは、Cas9またはその断片に対する相同性を共有する。例えば、Cas9バリアントは、野生型Cas9に、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態では、Cas9バリアントは、野生型Cas9に比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれより多いアミノ酸変化を有してもよい。いくつかの実施形態では、Cas9バリアントはCas9の断片(例えばgRNA結合ドメインまたはDNA切断ドメイン)を含み、断片は、野生型Cas9の対応する断片に、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態では、断片は、対応する野生型Cas9のアミノ酸の長さの少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、または少なくとも約99.5%である。
【0083】
いくつかの実施形態では、断片は、長さ少なくとも100アミノ酸である。いくつかの実施形態では、断片は、長さ少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも1300アミノ酸である。
【0084】
いくつかの実施形態では、野生型Cas9は、Streptococcus pyogenes由来のCas9に対応する(NCBI参照配列:NC_017053.1、ヌクレオチドおよびアミノ酸の配列は以下の通り)。
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGATTATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGGCAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGCAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAATCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTAGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAGAAATGGCTTGTTTGGGAATCTCATTGCTTTGTCATTGGGATTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATAGTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAGCGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAGGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGCGCCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGGGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGATATTCAAAAAGCACAGGTGTCTGGACAAGGCCATAGTTTACATGAACAGATTGCTAACTTAGCTGGCAGTCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAATTGTTGATGAACTGGTCAAAGTAATGGGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTACAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCATTAAAGACGATTCAATAGACAATAAGGTACTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
【0085】
いくつかの実施形態では、野生型Cas9は、以下のヌクレオチドおよび/またはアミノ酸配列に対応するか、またはこれらを含む:
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGGCTGCAGGA
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
【0086】
いくつかの実施形態では、野生型Cas9は、Streptococcus pyogenes由来のCas9に対応する(NCBI参照配列: NC_002737.2(ヌクレオチド配列は以下の通り)およびUniprot参照配列: Q99ZW2(アミノ酸配列は以下の通り)。
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
【0087】
いくつかの実施形態では、Cas9は:Corynebacterium ulcerans (NCBI参照: NC_015683.1, NC_017317.1); Corynebacterium diphtheria (NCBI参照: NC_016782.1, NC_016786.1); Spiroplasma syrphidicola (NCBI参照: NC_021284.1); Prevotella intermedia (NCBI参照: NC_017861.1); Spiroplasma taiwanense (NCBI参照: NC_021846.1); Streptococcus iniae (NCBI参照: NC_021314.1); Belliella baltica (NCBI参照: NC_018010.1); Psychroflexus torquisI (NCBI参照: NC_018721.1); Streptococcus thermophilus (NCBI参照: YP_820832.1), Listeria innocua (NCBI参照: NP_472073.1), Campylobacter jejuni (NCBI参照: YP_002344900.1) もしくは Neisseria meningitidis (NCBI参照: YP_002342100.1) 由来のCas9を表し、または任意の他の生物由来のCas9を表す。
【0088】
いくつかの実施形態では、Cas9はNeisseria meningitidis(Nme)由来である。いくつかの実施形態では、Cas9は、Nme1、Nme2またはNme3である。いくつかの実施形態では、Nme1、Nme2またはNme3のPAM相互作用ドメインは、それぞれ、N4GAT、N4CC、およびN4CAAAである(例えば、Edraki et al., A Compact, High-Accuracy Cas9 with a Dinucleotide PAM for In Vivo Genome Editing, Mol. Cell. (2018)を参照のこと)。例示的なNeisseria meningitidis Cas9タンパク質、Nme1Cas9, (NCBI参照: WP_002235162.1; II型CRISPR RNA誘導型エンドヌクレアーゼCas9)は、以下のアミノ酸配列を有する:
1 maafkpnpin yilgldigia svgwamveid edenpiclid lgvrvferae vpktgdslam
61 arrlarsvrr ltrrrahrll rarrllkreg vlqaadfden glikslpntp wqlraaaldr
121 kltplewsav llhlikhrgy lsqrkneget adkelgallk gvadnahalq tgdfrtpael
181 alnkfekesg hirnqrgdys htfsrkdlqa elillfekqk efgnphvsgg lkegietllm
241 tqrpalsgda vqkmlghctf epaepkaakn tytaerfiwl tklnnlrile qgserpltdt
301 eratlmdepy rkskltyaqa rkllgledta ffkglrygkd naeastlmem kayhaisral
361 ekeglkdkks plnlspelqd eigtafslfk tdeditgrlk driqpeilea llkhisfdkf
421 vqislkalrr ivplmeqgkr ydeacaeiyg dhygkkntee kiylppipad eirnpvvlra
481 lsqarkving vvrrygspar ihietarevg ksfkdrkeie krqeenrkdr ekaaakfrey
541 fpnfvgepks kdilklrlye qqhgkclysg keinlgrlne kgyveidhal pfsrtwddsf
601 nnkvlvlgse nqnkgnqtpy eyfngkdnsr ewqefkarve tsrfprskkq rillqkfded
661 gfkernlndt ryvnrflcqf vadrmrltgk gkkrvfasng qitnllrgfw glrkvraend
721 rhhaldavvv acstvamqqk itrfvrykem nafdgktidk etgevlhqkt hfpqpweffa
781 qevmirvfgk pdgkpefeea dtpeklrtll aeklssrpea vheyvtplfv srapnrkmsg
841 qghmetvksa krldegvsvl rvpltqlklk dlekmvnrer epklyealka rleahkddpa
901 kafaepfyky dkagnrtqqv kavrveqvqk tgvwvrnhng iadnatmvrv dvfekgdkyy
961 lvpiyswqva kgilpdravv qgkdeedwql iddsfnfkfs lhpndlvevi tkkarmfgyf
1021 aschrgtgni nirihdldhk igkngilegi gvktalsfqk yqidelgkei rpcrlkkrpp
1081 vr
【0089】
別の例示的なNeisseria meningitidis Cas9タンパク質、Nme2Cas9, (NCBI参照: WP_002230835; II型CRISPR RNA誘導型エンドヌクレアーゼCas9) は、以下のアミノ酸配列を有する:
1 maafkpnpin yilgldigia svgwamveid eeenpirlid lgvrvferae vpktgdslam
61 arrlarsvrr ltrrrahrll rarrllkreg vlqaadfden glikslpntp wqlraaaldr
121 kltplewsav llhlikhrgy lsqrkneget adkelgallk gvannahalq tgdfrtpael
181 alnkfekesg hirnqrgdys htfsrkdlqa elillfekqk efgnphvsgg lkegietllm
241 tqrpalsgda vqkmlghctf epaepkaakn tytaerfiwl tklnnlrile qgserpltdt
301 eratlmdepy rkskltyaqa rkllgledta ffkglrygkd naeastlmem kayhaisral
361 ekeglkdkks plnlsselqd eigtafslfk tdeditgrlk drvqpeilea llkhisfdkf
421 vqislkalrr ivplmeqgkr ydeacaeiyg dhygkkntee kiylppipad eirnpvvlra
481 lsqarkving vvrrygspar ihietarevg ksfkdrkeie krqeenrkdr ekaaakfrey
541 fpnfvgepks kdilklrlye qqhgkclysg keinlvrlne kgyveidhal pfsrtwddsf
601 nnkvlvlgse nqnkgnqtpy eyfngkdnsr ewqefkarve tsrfprskkq rillqkfded
661 gfkecnlndt ryvnrflcqf vadhilltgk gkrrvfasng qitnllrgfw glrkvraend
721 rhhaldavvv acstvamqqk itrfvrykem nafdgktidk etgkvlhqkt hfpqpweffa
781 qevmirvfgk pdgkpefeea dtpeklrtll aeklssrpea vheyvtplfv srapnrkmsg
841 ahkdtlrsak rfvkhnekis vkrvwlteik ladlenmvny kngreielye alkarleayg
901 gnakqafdpk dnpfykkggq lvkavrvekt qesgvllnkk naytiadngd mvrvdvfckv
961 dkkgknqyfi vpiyawqvae nilpdidckg yriddsytfc fslhkydlia fqkdekskve
1021 fayyincdss ngrfylawhd kgskeqqfri stqnlvliqk yqvnelgkei rpcrlkkrpp
1081 vr
【0090】
いくつかの実施形態では、dCas9は、Cas9ヌクレアーゼ活性を不活化する1つ以上の突然変異を有するCas9アミノ酸配列に部分的にまたは全体として対応するか、あるいはこうした配列を部分的にまたは全体として含む。例えば、いくつかの実施形態では、dCas9ドメインは、D10AおよびH840A突然変異、または別のCas9中の対応する突然変異を含む。いくつかの実施形態では、dCas9は、dCas9のアミノ酸配列(D10AおよびH840A)を含む:
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
【0091】
いくつかの実施形態では、Cas9ドメインはD10A突然変異を含み、840位、または本明細書で提供するアミノ酸配列いずれかの対応する位の残基は、上に提供するアミノ酸配列中のヒスチジンのままである。
【0092】
他の実施形態では、D10AおよびH840A以外の突然変異を有するdCas9バリアントを提供し、これは例えばヌクレアーゼ不活化されたCas9(dCas9)を生じる。こうした突然変異には、例えば、D10およびH840での他のアミノ酸置換、あるいはCas9のヌクレアーゼドメイン内の他の置換(例えばHNHヌクレアーゼサブドメインおよび/またはRuvC1サブドメイン中の置換)が含まれる。いくつかの実施形態では、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である、dCas9のバリアントまたはホモログを提供する。いくつかの実施形態では、約5アミノ酸、約10アミノ酸、約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ酸、約50アミノ酸、約75アミノ酸、約100アミノ酸またはそれ以上、短いかまたは長いアミノ酸配列を有するdCas9のバリアントを提供する。
【0093】
いくつかの実施形態では、本明細書に提供するようなCas9融合タンパク質は、Cas9タンパク質の全長アミノ酸配列、例えば本明細書に提供するCas9配列の1つを含む。しかし、他の実施形態では、本明細書に提供するような融合タンパク質は、全長Cas9配列を含まず、その1つ以上の断片のみを含む。適切なCas9ドメインおよびCas9断片の例示的なアミノ酸配列を本明細書に提供し、Cas9ドメインおよび断片の追加の適切な配列は、当業者には明らかであろう。
【0094】
追加のCas9タンパク質(例えばヌクレアーゼ不活性Cas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性Cas9)は、そのバリアントおよびホモログを含めて、本開示の範囲内であることを認識しなければならない。例示的なCas9タンパク質には、限定なしに、以下に提供するものが含まれる。いくつかの実施形態では、Cas9タンパク質は、ヌクレアーゼ不活性Cas9(dCas9)である。いくつかの実施形態では、Cas9タンパク質はCas9ニッカーゼ(nCas9)である。いくつかの実施形態では、Cas9タンパク質はヌクレアーゼ活性Cas9である。
【0095】
例示的な触媒的に不活性であるCas9(dCas9):
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0096】
例示的な触媒的Cas9ニッカーゼ(nCas9):
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0097】
例示的な触媒的に活性であるCas9:
DKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0098】
いくつかの実施形態では、Cas9は、単細胞原核微生物のドメインおよび界を構成する古細菌(例えばナノアーキア)由来のCas9を指す。いくつかの実施形態では、Cas9は、例えば、Burstein et al., "New CRISPR-Cas systems from uncultivated microbes." Cell Res. 2017 Feb 21. doi: 10.1038/cr.2017.21に記載されているCasXまたはCasYを指し、該文献の全体の内容は参照により本明細書に組み込まれる。ゲノム分解メタゲノミクスを用いて、生命の古細菌ドメインにおいて最初に報告されたCas9を含め、多くのCRISPR‐Casシステムが同定された。この多様なCas9タンパク質は、ほとんど研究されていないナノアーキアにおいて、活性CRISPR‐Casシステムの一部として発見された。細菌では、それまで知られていなかった2つのシステム、CRISPR-CasXとCRISPR-CasYが発見され、それらは、これまでに発見された中でも最もコンパクトなシステムに入る。いくつかの実施形態では、Cas9は、CasXまたはCasXのバリアントを指す。いくつかの実施形態では、Cas9は、CasYまたはCasYのバリアントを指す。核酸プログラム可能DNA結合タンパク質 (napDNAbp) として他のRNA誘導型DNA結合タンパク質も使用されてもよく、本開示の範囲内であることが理解されるべきである。
【0099】
特定の実施形態では、本開示の方法で有用なnapDNAbpsには、当技術分野に公知であり、例えばOakes et al., Cell 176, 254-267, 2019によって記載される循環置換体が含まれる。例示的な循環置換体は以下の通りであり、太字はCas9由来の配列を示し、斜字配列はリンカー配列を示し、下線配列は二部分核局在化配列を示す。
【0100】
CP5(MSP「NGC=突然変異を含むPamバリアント、通常のCas9はNGGを好む」、PID=タンパク質相互作用ドメインおよび「D10A」ニッカーゼを含む):
【0101】
塩基エディターに取り込まれ得るポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの限定されない例には、CRISPRタンパク質由来ドメイン、制限ヌクレアーゼ、メガヌクレアーゼ、TALヌクレアーゼ(TALEN)、およびジンクフィンガーヌクレアーゼ(ZFN)が含まれる。
【0102】
いくつかの実施形態では、本明細書に提供する融合タンパク質いずれかの核酸プログラム可能DNA結合タンパク質(napDNAbp)は、CasXまたはCasYタンパク質であってもよい。いくつかの実施形態では、napDNAbpはCasXタンパク質である。いくつかの実施形態では、napDNAbpはCasYタンパク質である。いくつかの実施形態では、napDNAbpは、天然存在CasXまたはCasYタンパク質に対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、napDNAbpは天然存在CasXまたはCasYタンパク質である。いくつかの実施形態では、napDNAbpは、本明細書記載のCasXまたはCasYタンパク質のいずれかに対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。他の細菌種由来のCas12b/C2c1、CasXおよびCasYもまた、本開示に従って使用され得ることを認識すべきである。
【0103】
Cas12b/C2c1 (uniprot.org/uniprot/T0D7A2#2)
sp|T0D7A2|C2C1_ALIAG CRISPR会合エンドヌクレアーゼC2c1 OS= Alicyclobacillus acido- terrestris (ATCC 49025 / DSM 3922/ CIP 106132 / NCIMB 13137/GD3B株) GN=c2c1 PE=1 SV=1
MAVKSIKVKLRLDDMPEIRAGLWKLHKEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECDKTAEECKAELLERLRARQVENGHRGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKEKAETRKSADRTADVLRALADFGLKPLMRVYTDSEMSSVEWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGQEYAKLVEQKNRFEQKNFVGQEHLVHLVNQLQQDMKEASPGLESKEQTAHYVTGRALRGSDKVFEKWGKLAPDAPFDLYDAEIKNVQRRNTRRFGSHDLFAKLAEPEYQALWREDASFLTRYAVYNSILRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGERRHAIRFHKLLKVENGVAREVDDVTVPISMSEQLDNLLPRDPNEPIALYFRDYGAEQHFTGEFGGAKIQCRRDQLAHMHRRRGARDVYLNVSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSKGRVPFFFPIKGNDNLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPVDAANHMTPDWREAFENELQKLKSLHGICSDKEWMDAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYAKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELINQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCTQEHNPEPFPWWLNKFVVEHTLDACPLRADDLIPTGEGEIFVSPFSAEEGDFHQIHADLNAAQNLQQRLWSDFDISQIRLRCDWGEVDGELVLIPRLTGKRTADSYSNKVFYTNTGVTYYERERGKKRRKVFAQEKLSEEEAELLVEADEAREKSVVLMRDPSGIINRGNWTRQKEFWSMV NQRIEGYLVKQIRSRVPLQDSACENTGDI
【0104】
CasX (uniprot.org/uniprot/F0NN87; uniprot.org/uniprot/F0NH53)
>tr|F0NN87|F0NN87_SULIH CRISPR会合Casxタンパク質OS = Sulfolobus islandicus (HVE10/4株) GN = SiH_0402 PE=4 SV=1
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYEFGRSPGMVERTRRVKLEVEPHYLIIAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVRIYTISDAVGQNPTTINGGFSIDLTKLLEKRYLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTG SKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG
【0105】
>tr|F0NH53|F0NH53_SULIR CRISPR会合タンパク質, Casx OS = Sulfolobus islandicus (REY15A株) GN=SiRe_0771 PE=4 SV=1
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYKFGRSPGMVERTRRVKLEVEPHYLIMAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVSIYTISDAVGQNPTTINGGFSIDLTKLLEKRDLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTGSKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG
【0106】
Deltaproteobacteria CasX
MEKRINKIRKKLSADNATKPVSRSGPMKTLLVRVMTDDLKKRLEKRRKKPEVMPQVISNNAANNLRMLLDDYTKMKEAILQVYWQEFKDDHVGLMCKFAQPASKKIDQNKLKPEMDEKGNLTTAGFACSQCGQPLFVYKLEQVSEKGKAYTNYFGRCNVAEHEKLILLAQLKPVKDSDEAVTYSLGKFGQRALDFYSIHVTKESTHPVKPLAQIAGNRYASGPVGKALSDACMGTIASFLSKYQDIIIEHQKVVKGNQKRLESLRELAGKENLEYPSVTLPPQPHTKEGVDAYNEVIARVRMWVNLNLWQKLKLSRDDAKPLLRLKGFPSFPVVERRENEVDWWNTINEVKKLIDAKRDMGRVFWSGVTAEKRNTILEGYNYLPNENDHKKREGSLENPKKPAKRQFGDLLLYLEKKYAGDWGKVFDEAWERIDKKIAGLTSHIEREEARNAEDAQSKAVLTDWLRAKASFVLERLKEMDEKEFYACEIQLQKWYGDLRGNPFAVEAENRVVDISGFSIGSDGHSIQYRNLLAWKYLENGKREFYLLMNYGKKGRIRFTDGTDIKKSGKWQGLLYGGGKAKVIDLTFDPDDEQLIILPLAFGTRQGREFIWNDLLSLETGLIKLANGRVIEKTIYNKKIGRDEPALFVALTFERREVVDPSNIKPVNLIGVARGENIPAVIALTDPEGCPLPEFKDSSGGPTDILRIGEGYKEKQRAIQAAKEVEQRRAGGYSRKFASKSRNLADDMVRNSARDLFYHAVTHDAVLVFANLSRGFGRQGKRTFMTERQYTKMEDWLTAKLAYEGLTSKTYLSKTLAQYTSKTCSNCGFTITYADMDVMLVRLKKTSDGWATTLNNKELKAEYQITYYNRYKRQTVEKELSAELDRLSEESGNNDISKWTKGRRDEALFLLKKRFSHRPVQEQFVCLDCGHEVHAAEQAALNIARSWLFLNSNSTEFKSYKSGKQPFVGAWQAFYKRRLKEVWKPNA
【0107】
CasY (ncbi.nlm.nih.gov/protein/APG80656.1)
>APG80656.1 CRISPR会合タンパク質CasY(非培養Parcubacteria群細菌)
MSKRHPRISGVKGYRLHAQRLEYTGKSGAMRTIKYPLYSSPSGGRTVPREIVSAINDDYVGLYGLSNFDDLYNAEKRNEEKVYSVLDFWYDCVQYGAVFSYTAPGLLKNVAEVRGGSYELTKTLKGSHLYDELQIDKVIKFLNKKEISRANGSLDKLKKDIIDCFKAEYRERHKDQCNKLADDIKNAKKDAGASLGERQKKLFRDFFGISEQSENDKPSFTNPLNLTCCLLPFDTVNNNRNRGEVLFNKLKEYAQKLDKNEGSLEMWEYIGIGNSGTAFSNFLGEGFLGRLRENKITELKKAMMDITDAWRGQEQEEELEKRLRILAALTIKLREPKFDNHWGGYRSDINGKLSSWLQNYINQTVKIKEDLKGHKKDLKKAKEMINRFGESDTKEEAVVSSLLESIEKIVPDDSADDEKPDIPAIAIYRRFLSDGRLTLNRFVQREDVQEALIKERLEAEKKKKPKKRKKKSDAEDEKETIDFKELFPHLAKPLKLVPNFYGDSKRELYKKYKNAAIYTDALWKAVEKIYKSAFSSSLKNSFFDTDFDKDFFIKRLQKIFSVYRRFNTDKWKPIVKNSFAPYCDIVSLAENEVLYKPKQSRSRKSAAIDKNRVRLPSTENIAKAGIALARELSVAGFDWKDLLKKEEHEEYIDLIELHKTALALLLAVTETQLDISALDFVENGTVKDFMKTRDGNLVLEGRFLEMFSQSIVFSELRGLAGLMSRKEFITRSAIQTMNGKQAELLYIPHEFQSAKITTPKEMSRAFLDLAPAEFATSLEPESLSEKSLLKLKQMRYYPHYFGYELTRTGQGIDGGVAENALRLEKSPVKKREIKCKQYKTLGRGQNKIVLYVRSSYYQTQFLEWFLHRPKNVQTDVAVSGSFLIDEKKVKTRWNYDALTVALEPVSGSERVFVSQPFTIFPEKSAEEEGQRYLGIDIGEYGIAYTALEITGDSAKILDQNFISDPQLKTLREEVKGLKLDQRRGTFAMPSTKIARIRESLVHSLRNRIHHLALKHKAKIVYELEVSRFEEGKQKIKKVYATLKKADVYSEIDADKNLQTTVWGKLAVASEISASYTSQFCGACKKLWRAEMQVDETITTQELIGTVRVIKGGTLIDAIKDFMRPPIFDENDTPFPKYRDFCDKHHISKKMRGNSCLFICPFCRANADADIQASQTIALLRYVKEEKKVEDYFERFRKLKNIKVLGQMKKI
【0108】
用語「Cas12」または「Cas12ドメイン」は、Cas12タンパク質またはその断片を含むRNA誘導型ヌクレアーゼ(例えばCas12の活性、不活性、または部分的活性DNA切断ドメインおよび/またはCas12のgRNA結合ドメインを含むタンパク質)を指す。Cas12はクラス2、V型CRISPR/Casシステムに属する。Cas12ヌクレアーゼはまた、ときに、CRISPR(clustered regularly interspaced short palindromic repeat)会合ヌクレアーゼとも呼ばれる。例示的なBacillus hisashii Cas 12b(BhCas12b)Cas12ドメインの配列を以下に提供する:
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKK。
BhCas12bアミノ酸配列に少なくとも85%またはそれより高い同一性を有するアミノ酸配列もまた、本開示の方法において有用である。
【0109】
「保存的アミノ酸置換」または「保存的突然変異」という用語は、あるアミノ酸が共通の特性を有する別のアミノ酸に置き換わることを指す。個々のアミノ酸間の共通の特性を定義するための機能的な方法は、相同的な生物の対応するタンパク質間のアミノ酸変化の正規化された頻度を分析することである(Schulz, G. E. and Schirmer, R. H., Principles of Protein Structure, Springer-Verlag, New York (1979))。このような分析によれば、グループ内のアミノ酸が互いに優先的に交換され、それゆえに全体的なタンパク質構造に対するそれらの影響において互いに最も類似しているアミノ酸のグループを定義することができる(上記Schulz, G. E. and Schirmer, R. H.)。保存的突然変異の非限定的な例には、例えば正電荷を維持することができるアミノ酸アルギニンに対するリジンおよびその逆;負電荷を維持することができるアスパラギン酸に対するグルタミン酸およびその逆;遊離OHを維持することができるトレオニンに対するセリン;ならびに遊離NH2を維持できるアスパラギンに対するグルタミンのようなアミノ酸置換が挙げられる。
【0110】
本明細書中で交換可能に使用される用語「コード配列」または「タンパク質コード配列」とは、タンパク質をコードするポリヌクレオチドのセグメントを指す。この領域または配列は、5’末端に近い方が開始コドンで境界付けられ、3’末端に近い方が停止コドンで境界付けられる。コード配列はまた、オープンリーディングフレームとも呼ばれ得る。
【0111】
本明細書中で使用する場合、用語「デアミナーゼ」または「デアミナーゼドメイン」とは、脱アミノ化反応を触媒するタンパク質または酵素を指す。いくつかの実施形態では、デアミナーゼは、ヒポキサンチンへのアデニンの加水分解的脱アミノ化を触媒するアデノシンデアミナーゼである。いくつかの実施形態では、デアミナーゼは、アデノシンまたはアデニン (A) からイノシン (I) への加水分解的脱アミノ化を触媒するアデノシンデアミナーゼである。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、アデノシンデアミナーゼであり、それぞれイノシンまたはデオキシイノシンへのアデノシンまたはデオキシアデノシンの加水分解的脱アミノ化を触媒する。いくつかの実施形態では、アデノシンデアミナーゼは、デオキシリボ核酸 (DNA) 中のアデノシンの加水分解的脱アミノ化を触媒する。本明細書で提供されるアデノシンデアミナーゼ(例えば、遺伝子操作されたアデノシンデアミナーゼ、進化されたアデノシンデアミナーゼ)は、細菌などの任意の生物由来であり得る。いくつかの実施形態では、アデノシンデアミナーゼは、E. coli、S. aureus、S. typhi、S. putrefaciens、H. influenzae、またはC. crescentusなどの細菌に由来する。
【0112】
いくつかの実施形態では、アデノシンデアミナーゼは、TadAデアミナーゼである。いくつかの実施形態では、TadAデアミナーゼはTadA*7.10バリアントである。いくつかの実施形態では、TadA*7.10バリアントはTadA*8である。いくつかの実施形態では、TadA*8は
TadA*8.1, TadA*8.2, TadA*8.3, TadA*8.4, TadA*8.5, TadA*8.6, TadA*8.7, TadA*8.8, TadA*8.9, TadA*8.10, TadA*8.11, TadA*8.12, TadA*8.13, TadA*8.14, TadA*8.15, TadA*8.16, TadA*8.17, TadA*8.18, TadA*8.19, TadA*8.20, TadA*8.21, TadA*8.22, TadA*8.23, または TadA*8.24
である。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、例えばヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスなどの生物由来の天然存在デアミナーゼのバリアントである。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、天然に存在しない。例えば、いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、天然存在デアミナーゼに対して少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.1%、少なくとも99.2%、少なくとも99.3%、少なくとも99.4%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、または少なくとも99.9%の同一性である。例えば、デアミナーゼドメインは、国際PCT出願第PCT/2017/045381号 (WO 2018/027078) および第PCT/US2016/058344号 (WO 2017/070632)に記載され、これら文献は各々、その全内容が参照により本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017) ), およびRees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1もまた参照のこと、これらの全内容は、参照により本明細書に組み込まれる。
【0113】
「検出可能な標識」とは、関心対象の分子に連結されたときに、分光学的、光化学的、生化学的、免疫化学的、または化学的手段を介して、こうした分子を検出可能にする組成物を意味する。例えば、有用な標識には、放射性同位体、磁気ビーズ、金属ビーズ、コロイド粒子、蛍光色素、高電子密度試薬、酵素(例えば、酵素連結免疫吸着アッセイ(ELISA)で一般的に用いられるもの)、ビオチン、ジゴキシゲニン、またはハプテンが含まれる。
【0114】
「疾患」とは、細胞、組織または臓器の正常な機能を損傷または妨害するあらゆる状態または障害を意味する。疾患の例にはレット症候群が含まれる。
【0115】
用語「有効量」は、本明細書において、生物学的反応を誘発するために十分である生物学的活性剤の量を指す。いくつかの実施形態では、有効量は、未治療の患者に比較して、疾患の症状を改善するために必要な量である。疾患の療法的治療のため、本明細書記載の方法および使用を実施する際に用いられる活性剤(複数可)の有効量は、投与方式、対象の年齢、体重、および全般的健康状態に依存して変化する。最終的には、主治医または獣医が適切な量および投薬措置を決定する。このような量は「有効」量と呼ばれる。一実施形態では、有効量は、細胞(例えば、in vitroまたはin vivoの細胞)内の関心対象の遺伝子(例えばMecp2)に改変を導入するのに十分な本明細書記載の塩基エディター(例えばプログラム可能DNA結合タンパク質を含む融合タンパク質、核酸塩基エディターおよびgRNA)の量である。一実施形態では、有効量は、療法効果を達成する(例えばレット症候群またはその症状もしくは状態を減少させるかまたは制御する)ために必要な塩基エディターの量である。こうした療法効果は、対象、組織または臓器のすべての細胞においてMecp2を改変するために十分である必要はなく、対象、組織または臓器に存在する細胞の約1%、5%、10%、25%、50%、75%またはそれより多くのみが改変されてもよい。一実施形態では、有効量は、レット症候群の1つ以上の症状を軽減させるために十分である。
【0116】
いくつかの実施形態では、本明細書に提供する融合タンパク質、例えばnCas9ドメインおよびデアミナーゼドメイン(例えばアデノシンデアミナーゼ)を含む核酸塩基エディターの有効量は、本明細書記載の核酸塩基エディターによって特異的に結合され、編集されるターゲット部位の編集を誘導するために十分な融合タンパク質の量を指す。当業者に認識されるであろうように、剤、例えば融合タンパク質、ヌクレアーゼ、ハイブリッドタンパク質、タンパク質ダイマー、タンパク質(またはタンパク質ダイマー)およびポリヌクレオチドの複合体、またはポリヌクレオチドの有効量は、多様な要因、例えば所望の生物学的反応、例えば編集しようとする特定のアレル(allele)、ゲノム、または標的部位、標的とされる細胞または組織、および/または用いられる剤に応じて多様であり得る。
【0117】
「断片」とは、ポリペプチドまたは核酸分子の部分を意味する。この部分は、参照核酸分子またはポリペプチドの全長の少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、または90%を含有する。断片は、10、20、30、40、50、60、70、80、90、または100、200、300、400、500、600、700、800、900、または1000のヌクレオチドまたはアミノ酸を含有し得る。
【0118】
「ガイドRNA」または「gRNA」は、標的配列に特異的であってポリヌクレオチドプログラム可能ヌクレオチド結合ドメインタンパク質(例えばCas9またはCas12)と複合体を形成することができるポリヌクレオチドを意味する。一実施形態では、ガイドポリヌクレオチドはガイドRNA (gRNA) である。gRNAは2つ以上のRNAの複合体として存在することもあれば、単一のRNA分子として存在することもある。単一のRNA分子として存在するgRNAは、シングルガイドRNA(sgRNA)と呼ばれることがあるが、「gRNA」は、単一の分子として、または2つ以上の分子の複合体として存在するガイドRNAを指すために交換可能に使用される。典型的には、単一のRNA種として存在するgRNAは、(1) 標的核酸と相同性を共有する(例えば、標的へのCas9またはCas12複合体の結合を誘導する)ドメイン;および(2) Cas9またはCas12タンパク質に結合するドメインという2つのドメインを含む。いくつかの実施形態では、ドメイン (2) は、tracrRNAとして知られる配列に対応し、ステム-ループ構造を含む。例えば、いくつかの実施形態では、ドメイン (2) は、Jinek et al., Science 337:816-821(2012)(その全内容が参照により本明細書に組み入れられる)に提供されるようなtracrRNAと同一または相同である。gRNA (例えばドメイン2を含むもの)の他の例は、「Switchable Cas9 Nucleases and Uses Thereof」と題される2013年9月6日出願の米国仮特許出願U.S.S.N. 61/874,682、および「Delivery System For Functional Nucleases」と題される2013年9月6日出願の米国仮特許出願U.S.S.N. 61/874,746に見出され得、それら各々の全内容が参照により本明細書に組み入れられる。いくつかの実施形態では、gRNAは、ドメイン (1) および (2) の2つ以上を含み、「伸長されたgRNA」と称され得る。伸長されたgRNAは、本明細書に記載されるように、2つ以上のCas9またはCas12タンパク質と結合し、2つ以上の異なる領域で標的核酸と結合する。gRNAは、標的部位を相補するヌクレオチド配列を含み、これが標的部位へのヌクレアーゼ/RNA複合体の結合を仲介し、ヌクレアーゼ:RNA複合体の配列特異性を提供する。
【0119】
「ヘテロダイマー」は、2つのドメイン、例えば野生型TadAドメインおよびTadAドメインのバリアント(例えばTadA*8)または2つのバリアントTadAドメイン(例えばTadA*7.10およびTadA*8または2つのTadA*8ドメイン)を含む融合タンパク質を意味する。
【0120】
「ハイブリダイゼーション」は、相補的な核酸塩基間の水素結合を意味し、ワトソン-クリック、フーグスティーンまたは逆フーグスティーン水素結合であり得る。例えば、アデニンとチミンは相補的な核酸塩基で、水素結合を形成して対を形成する。
【0121】
「増加」とは、少なくとも10%、25%、50%、75%、または100%の正の変化を意味する。
【0122】
用語「塩基修復の阻害剤」、または「IBR」は、核酸修復酵素、例えば塩基除去修復酵素の活性を阻害することができるタンパク質を指す。いくつかの実施形態では、IBRは、イノシン塩基除去修復(BER)の阻害剤である。塩基修復の阻害剤の例としては、APE1、Endo III、Endo IV、Endo V、Endo VIII、Fpg、hOGGl、hNEILl、T7 Endol、T4 PDG、UDG、hSMUGlおよびhAAGの阻害剤が挙げられる。いくつかの実施形態では、IBRは、Endo VまたはhAAGの阻害剤である。いくつかの実施形態では、IBRは、触媒的に不活性なEndoVまたは触媒的に不活性なhAAGである。いくつかの実施形態では、塩基修復阻害剤は、Endo VまたはhAAGの阻害剤である。いくつかの実施形態では、塩基修復阻害剤は、触媒的に不活性なEndoVまたは触媒的に不活性なhAAGである。
【0123】
いくつかの実施形態では、塩基修復阻害剤は、ウラシルグリコシラーゼ阻害剤 (UGI) である。UGIとは、ウラシル-DNAグリコシラーゼの塩基除去修復酵素を阻害することができるタンパク質を指す。いくつかの実施形態では、UGIドメインは、野生型UGIまたは野生型UGIの断片を含む。いくつかの実施形態では、本明細書で提供されるUGIタンパク質は、UGIの断片、およびUGIまたはUGI断片に相同的なタンパク質を含む。いくつかの実施形態では、塩基修復阻害剤は、イノシン塩基除去修復の阻害剤である。いくつかの実施形態において、塩基修復阻害剤は、「触媒的に不活性のイノシン特異的ヌクレアーゼ」または「不活性のイノシン特異的ヌクレアーゼ」である。いかなる特定の理論にも拘束されることを望まないが、触媒的に不活性なイノシングリコシラーゼ(例えば、アルキルアデニングリコシラーゼ (AAG))は、イノシンに結合することができるが、脱塩基部位を作ることもイノシンを除去することもできず、それによって、新たに形成されるイノシン部分をDNA損傷/修復機構から立体的にブロックする。いくつかの実施形態では、触媒的に不活性なイノシン特異的ヌクレアーゼは、核酸中のイノシンに結合することができるが、核酸を切断しない。非限定的で例示的な、触媒的に不活性なイノシン特異的ヌクレアーゼには、例えばヒト由来の触媒的に不活性なアルキルアデノシングリコシラーゼ(AAGヌクレアーゼ)、および例えばE.coli由来の触媒的に不活性なエンドヌクレアーゼV (EndoVヌクレアーゼ)が含まれる。いくつかの実施形態では、触媒的に不活性なAAGヌクレアーゼは、E125Q突然変異または別のAAGヌクレアーゼにおける対応する突然変異を含む。
【0124】
「インテイン(intein)」は、それ自身を切り出して、残った断片(エクステイン(extein))をタンパク質スプライシングとして知られるプロセスにおいてペプチド結合で連結することができるタンパク質の断片である。インテインはまた、「タンパク質イントロン」とも呼ばれる。インテインがそれ自身を切り出し、タンパク質の残りの部分を連結するプロセスは、本明細書において、「タンパク質スプライシング」または「インテイン仲介タンパク質スプライシング」と呼ばれる。いくつかの実施形態では、前駆体タンパク質(インテイン仲介タンパク質スプライシングの前のインテイン含有タンパク質)のインテインは、2つの遺伝子に由来する。そのようなインテインは、本明細書では分割(split)インテインと呼ばれる(例えば、分割インテイン-Nおよび分割インテイン-C)。例えば、シアノバクテリアでは、DNAポリメラーゼIIIの触媒サブユニットaであるDnaEは2つの別々の遺伝子dnaE-nおよびdnaE-cによってコードされている。dnaE-n遺伝子によってコードされるインテインは本明細書において「インテイン-N」と称され得る。dnaE-c遺伝子によってコードされるインテインは本明細書において「インテイン-C」と称され得る。
【0125】
他のインテインシステムも使用され得る。例として、dnaEインテイン、すなわちCfa-N(例えば分割インテイン-N)およびCfa-C(例えば分割インテイン-C)のインテイン対に基づく合成インテインが記述されている(例えば、参照により本明細書に組み入れられるStevens et al., J Am Chem Soc. 2016 Feb. 24; 138(7):2162-5)。本開示に従って使用することができるインテイン対の非限定的な例としては:Cfa DnaEインテイン、Ssp GyrBインテイン、Ssp DnaXインテイン、Ter DnaE3インテイン、Ter ThyXインテイン、Rma DnaBインテイン、およびCne Prp8インテイン(例えば、参照により本明細書に組み込まれる米国特許第8,394,604号に記載のようなもの)が挙げられる。
【0126】
インテインの例示的なヌクレオチドおよびアミノ酸配列を提供する。
DnaE インテイン-N DNA:
TGCCTGTCATACGAAACCGAGATACTGACAGTAGAATATGGCCTTCTGCCAATCGGGAAGATTGTGGAGAAACGGATAGAATGCACAGTTTACTCTGTCGATAACAATGGTAACATTTATACTCAGCCAGTTGCCCAGTGGCACGACCGGGGAGAGCAGGAAGTATTCGAATACTGTCTGGAGGATGGAAGTCTCATTAGGGCCACTAAGGACCACAAATTTATGACAGTCGATGGCCAGATGCTGCCTATAGACGAAATCTTTGAGCGAGAGTTGGACCTCATGCGAGTTGACAACCTTCCTAAT
DnaE インテイン-N タンパク質:
CLSYETEILTVEYGLLPIGKIVEKRIECTVYSVDNNGNIYTQPVAQWHDR GEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPIDEIFERELDLMRVDNLPN
DnaE インテイン-C DNA:
ATGATCAAGATAGCTACAAGGAAGTATCTTGGCAAACAAAACGTTTATGA TATTGGAGTCGAAAGAGATCACAACTTTGCTCTGAAGAACGGATTCATAGCTTCTAAT
インテイン-C:
MIKIATRKYLGKQNVYDIGVERDHNFALKNGFIASN
Cfa-N DNA:
TGCCTGTCTTATGATACCGAGATACTTACCGTTGAATATGGCTTCTTGCCTATTGGAAAGATTGTCGAAGAGAGAATTGAATGCACAGTATATACTGTAGACAAGAATGGTTTCGTTTACACACAGCCCATTGCTCAATGGCACAATCGCGGCGAACAAGAAGTATTTGAGTACTGTCTCGAGGATGGAAGCATCATACGAGCAACTAAAGATCATAAATTCATGACCACTGACGGGCAGATGTTGCCAATAGATGAGATATTCGAGCGGGGCTTGGATCTCAAACAAGTGGATGGATTGCCA
Cfa-N タンパク質:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP
Cfa-C DNA:
ATGAAGAGGACTGCCGATGGATCAGAGTTTGAATCTCCCAAGAAGAAGAGGAAAGTAAAGATAATATCTCGAAAAAGTCTTGGTACCCAAAATGTCTATGATATTGGAGTGGAGAAAGATCACAACTTCCTTCTCAAGAACGGTCTCGTAGCCAGCAAC
Cfa-C タンパク質:
MKRTADGSEFESPKKKRKVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN
【0127】
分割Cas9のN末端部分と分割Cas9のC末端部分とを連結するために、インテイン-Nおよびインテイン-Cをそれぞれ分割Cas9のN末端部分および分割Cas9のC末端部分に融合させ得る。例えば、いくつかの実施形態では、インテイン-Nが、分割Cas9のN末端部分のC末端に融合され、すなわち、N--[分割Cas9のN末端部分]-[インテイン-N]--Cの構造を形成する。いくつかの実施形態では、インテイン-Cが、分割Cas9のC末端部分のN末端に融合され、すなわち、N-[インテイン-C]--[分割Cas9のC末端部分]-Cの構造を形成する。インテインが融合されたタンパク質(例えば分割Cas9)を連結するためのインテイン仲介タンパク質スプライシングの機構は、例えば、参照により本明細書に組み入れられるShah et al., Chem Sci. 2014; 5(1):446-461に記載されているように、当技術分野において公知である。インテインを設計および使用する方法は当技術分野で公知であり、例えばWO2014004336、WO2017132580、US20150344549およびUS20180127780によって記載されており、これらの各々はその全体が参照により本明細書に組み込まれる。
【0128】
用語「単離された」、「精製された」、または「生物学的に純粋な」とは、その天然状態で見出される場合に通常それに付随する構成要素が、多様な程度まで除去されている物質を指す。「単離」は、元の供給源または周囲環境からの分離の程度を示す。「精製」は、単離よりも高い分離度を示す。「精製された」または「生物学的に純粋な」タンパク質は、不純物がタンパク質の生物学的特性に実質的に影響を与えたり他の有害な結果を引き起こしたりしないように、他の物質が十分に除去されている。すなわち、本明細書記載の核酸またはペプチドは、組換えDNA技術によって産生された場合には細胞物質、ウイルス物質または培地を実質的に含まない場合、あるいは化学的に合成された場合には化学的前駆体その他の化学物質を実質的に含まない場合、精製されている。純度および均一性は、典型的には、分析化学技術、例えば、ポリアクリルアミドゲル電気泳動または高性能液体クロマトグラフィーを用いて決定される。用語「精製された」は、核酸またはタンパク質が電気泳動ゲルにおいて本質的に1つのバンドを生じることを意味し得る。修飾、例えば、リン酸化またはグリコシル化を受けることができるタンパク質については、異なる修飾は、別々に精製することができる異なる単離されたタンパク質を生じ得る。
【0129】
「単離ポリヌクレオチド」とは、本明細書記載の核酸分子が由来する生物の天然存在ゲノムにおいて該遺伝子に隣接する遺伝子を含まない核酸(例えばDNA)を意味する。従って、この用語は、例えば、ベクターに組み込まれた;自律的に複製するプラスミドやウイルスに組み込まれた;原核生物や真核生物のゲノムDNAに組み込まれた;または他の配列とは独立した別個の分子(例えば、PCRまたは制限エンドヌクレアーゼ消化によって生成されたcDNAまたはゲノムもしくはcDNA断片)として存在する組換えDNAを含む。さらに、この用語は、DNA分子から転写されるRNA分子、ならびに、さらなるポリペプチド配列をコードするハイブリッド遺伝子の一部である組換えDNAを含む。
【0130】
「単離ポリペプチド」とは、天然状態で付随する構成要素から分離されている本明細書記載のポリペプチドを意味する。典型的には、ポリペプチドは、該ポリペプチドが天然状態で会合しているタンパク質および天然存在有機分子を重量で少なくとも60%含まない場合に、単離されている。好ましくは、調製物は、重量で少なくとも75%、より好ましくは90%、最も好ましくは99%が本明細書記載のポリペプチドである。本開示の単離されたポリペプチドは、例えば、天然供給源からの抽出、そのようなポリペプチドをコードする組換え核酸の発現;または化学的にタンパク質を合成することにより得ることができる。純度は、任意の適切な方法、例えば、カラムクロマトグラフィー、ポリアクリルアミドゲル電気泳動、またはHPLC分析によって測定することができる。
【0131】
本明細書において使用される用語「リンカー」は、2つの分子もしくは部分、例えばタンパク質複合体もしくはリボ核複合体の2つの構成要素、または融合タンパク質の2つのドメイン、例えば、ポリヌクレオチドプログラム可能DNA結合ドメイン(例えばdCas9)とデアミナーゼドメイン(例えばアデノシンデアミナーゼ)を連結する共有リンカー(例えば共有結合)、非共有リンカー、化学基、または分子を指すことができる。リンカーは、塩基エディターシステムの異なる構成要素または構成要素の異なる部分を連結することができる。例えば、いくつかの実施形態では、リンカーは、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインのガイドポリヌクレオチド結合ドメインおよびデアミナーゼの触媒ドメインを連結することができる。いくつかの実施形態では、リンカーは、CRISPRポリペプチドおよびデアミナーゼを連結することができる。いくつかの実施形態では、リンカーは、Cas9およびデアミナーゼを連結することができる。いくつかの実施形態では、リンカーは、dCas9およびデアミナーゼを連結することができる。いくつかの実施形態では、リンカーは、nCas9およびデアミナーゼを連結することができる。いくつかの実施形態では、リンカーは、ガイドポリヌクレオチドおよびデアミナーゼを連結することができる。いくつかの実施形態では、リンカーは、塩基エディターシステムの脱アミノ化構成要素およびポリヌクレオチドプログラム可能ヌクレオチド結合構成要素を連結することができる。いくつかの実施形態では、リンカーは、塩基エディターシステムの脱アミノ化構成要素のRNA結合部分およびポリヌクレオチドプログラム可能ヌクレオチド結合構成要素を連結することができる。いくつかの実施形態では、リンカーは、塩基エディターシステムの脱アミノ化構成要素のRNA結合部分およびポリヌクレオチドプログラム可能ヌクレオチド結合構成要素のRNA結合部分を連結することができる。リンカーは、2つの基、分子、または他の部分の間に配置されるか、またはそれらに隣接し、共有結合または非共有結合相互作用を介してそれぞれにつながれ、したがって2つをつなぐことができる。いくつかの実施形態では、リンカーは、有機分子、基、ポリマー、または化学的部分であり得る。いくつかの実施形態では、リンカーはポリヌクレオチドであり得る。いくつかの実施形態では、リンカーはDNAリンカーであり得る。いくつかの実施形態では、リンカーはRNAリンカーであり得る。いくつかの実施形態では、リンカーは、リガンドに結合することができるアプタマーを含むことができる。いくつかの実施形態では、リガンドは、炭水化物、ペプチド、タンパク質、または核酸であり得る。いくつかの実施形態では、リンカーは、リボスイッチに由来してもよいアプタマーを含むことができる。アプタマーが由来するリボスイッチは、テオフィリンリボスイッチ、チアミンピロリン酸 (TPP) リボスイッチ、アデノシンコバラミン(AdoCbl) リボスイッチ、S-アデノシルメチオニン (SAM) リボスイッチ、SAHリボスイッチ、フラビンモノヌクレオチド (FMN) リボスイッチ、テトラヒドロ葉酸リボスイッチ、リジンリボスイッチ、グリシンリボスイッチ、プリンリボスイッチ、GlmSリボスイッチ、またはプレクエオシン1 (PreQ1) リボスイッチから選択され得る。いくつかの実施形態では、リンカーは、ポリペプチドまたはポリペプチドリガンドなどのタンパク質ドメインに結合したアプタマーを含み得る。いくつかの実施形態では、ポリペプチドリガンドは、K相同 (KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステライルアルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。いくつかの実施形態では、ポリペプチドリガンドは、塩基エディターシステム構成要素の一部であり得る。例えば、核酸塩基編集構成要素は、デアミナーゼドメインおよびRNA認識モチーフを含み得る。
【0132】
いくつかの実施形態では、リンカーは、アミノ酸または複数のアミノ酸(例えばペプチドまたはタンパク質)であり得る。いくつかの実施形態では、リンカーは、長さ約5~100アミノ酸、例えば、長さが約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20~30、30~40、40~50、50~60、60~70、70~80、80~90または90~100アミノ酸であり得る。いくつかの実施形態では、リンカーは、長さ約100~150、150~200、200~250、250~300、300~350、350~400、400~450、または450~500アミノ酸であり得る。より長いまたはより短いリンカーも考えられる。
【0133】
いくつかの実施形態では、リンカーは、Cas9ヌクレアーゼドメインを含むRNAプログラム可能ヌクレアーゼのgRNA結合ドメインおよび核酸編集タンパク質(例えば、アデノシンデアミナーゼ)の触媒ドメインを連結する。いくつかの実施形態では、リンカーは、dCas9および核酸編集タンパク質を連結する。例えば、リンカーは、2つの基、分子、または他の部分の間に配置されるか、またはそれらに隣接し、共有結合を介してそれぞれにつながれ、従って2つを連結する。いくつかの実施形態では、リンカーは、アミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)である。いくつかの実施形態では、リンカーは、有機分子、基、ポリマー、または化学的部分である。いくつかの実施形態では、リンカーは、長さ5~200アミノ酸、例えば、長さ5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、35、45、50、55、60、60、65、70、70、75、80、85、90、90、95、100、101、102、103、104、105、110、120、130、140、150、160、175、180、190、または200アミノ酸である。より長いまたはより短いリンカーもまた意図される。いくつかの実施形態では、リンカーは、XTENリンカーとも呼ばれ得るアミノ酸配列SGSETPGTSESATPESを含む。いくつかの実施形態では、リンカーはアミノ酸配列SGGSを含む。いくつかの実施形態では、リンカーは、(SGGS)n、(GGGS)n、(GGGGS) n、(G)n、(EAAAK)n、(GGS)n、SGSETPGTSESATPES、または(XP)n モチーフ、あるいはこれらのいずれかの組み合わせを含み、nは独立に、1~30の間の整数であり、Xは任意のアミノ酸である。いくつかの実施形態では、nは1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15である。いくつかの実施形態では、リンカーは、複数のプロリン残基を含み、長さ5~21、5~14、5~9、5~7アミノ酸であり、例えば、PAPAP、PAPAPA、PAPAPAP、PAPAPAPA、P(AP)4、P(AP)7、P(AP)10である。このようなプロリンリッチリンカーはまた、「剛性(rigid)」リンカーとも呼ばれる。
【0134】
いくつかの実施形態では、塩基エディターのドメインは:
SGGSSGSETPGTSESATPESSGGS、
SGGSSGGSSGSETPGTSESATPESSGGSSGGS、または
GGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTE PSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGS
のアミノ酸配列を含むリンカーを介して融合される。
【0135】
いくつかの実施形態では、核酸塩基エディターのドメインは、XTENリンカーとも呼ばれ得るアミノ酸配列SGSETPGTSESATPESを含むリンカーを介して融合される。いくつかの実施形態では、リンカーは、長さ24アミノ酸である。いくつかの実施形態では、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESを含む。いくつかの実施形態では、リンカーは、長さ40アミノ酸である。いくつかの実施形態では、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTESATPESSGGSSGGSSGSSGGSを含む。いくつかの実施形態では、リンカーは、長さ64アミノ酸である。いくつかの実施形態では、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGSSGGSを含む。
【0136】
いくつかの実施形態では、リンカーは、長さ92アミノ酸である。いくつかの実施形態では、リンカーは、アミノ酸配列PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAP GTSTEPSEGSAPGTSESATPESGPGSEPATSを含む。
【0137】
本明細書中で使用される場合、用語「突然変異」とは、配列内、例えば核酸もしくはアミノ酸配列内の残基が、別の残基により置換されること、または配列内の1つ以上の残基の欠失もしくは挿入をいう。突然変異は、本明細書において典型的には、元の残基を同定し、次いで配列内の残基の位を同定し、新たに置換された残基の同一性を同定することによって、記載される。本明細書に提供されるアミノ酸置換 (突然変異) を作製するための多様な方法は、当技術分野においてよく知られており、例えば、Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012))によって提供されている。いくつかの実施形態では、本開示の塩基エディターは、有意な数の非意図的な突然変異、例えば非意図的な点突然変異を生成することなく、核酸(例えば対象のゲノム内の核酸)において「意図される突然変異」例えば点突然変異を効率的に生成することができる。いくつかの実施形態では、意図される突然変異は、その意図される突然変異を生じさせるように特に設計された、ガイドポリヌクレオチド(例えばgRNA)に結合した特定の塩基エディター(例えばアデノシン塩基エディター)によって生じる突然変異である。一般に、配列(例えば、本明細書に記載のアミノ酸配列)においてなされるかまたは同定される突然変異は、参照(または野生型)配列、すなわち、その突然変異を含有しない配列に関連して番号付けされる。当業者は、参照配列に対するアミノ酸および核酸配列における突然変異の位置を決定する方法を容易に理解するであろう。
【0138】
「非保存的突然変異」という用語は、異なるグループの間のアミノ酸置換に関し、例えば、トリプトファンに対するリジン、またはセリンに対するフェニルアラニンなどである。この場合、非保存的アミノ酸置換は、機能性バリアントの生物学的活性を妨害または阻害しないことが好ましい。非保存的アミノ酸置換は、機能的バリアントの生物学的活性が野生型タンパク質と比較して増加するように、機能的バリアントの生物学的活性を増進させることができる。
【0139】
「核局在化配列」、「核局在化シグナル」または「NLS」という用語は、タンパク質の細胞核への移入を促進するアミノ酸配列を意味する。核局在化配列は当技術分野において公知であり、例えば、2000年11月23日に出願され2001年5月31日にWO/2001/038547として公開された国際PCT出願PCT/EP 2000/011690のPlank et al.に記載されており、その内容は、例示的な核局在化配列の開示について参照により本明細書に組み入れられる。他の実施形態では、NLSは、例えばKoblan et al., Nature Biotech. 2018 doi:10.1038/nbt.4172によって記載された、最適化されたNLSである。いくつかの実施形態では、NLSは、アミノ酸配列
KRTADGSEFESPKKKRKV,
KRPAATKKAGQAKKKK,
KKTELQTTNAENKTKKL,
KRGINDRNFWRGENGRKTR,
RKSGKIAAIVVKRPRK,
PKKKRKV, または
MDSLLMNRRKFLYQFKNVRWAKGRRETYLC
を含む。
【0140】
本明細書中で使用される際、用語「核酸」および「核酸分子」とは、核酸塩基および酸性部分を含む化合物、例えばヌクレオシド、ヌクレオチド、またはヌクレオチドのポリマーをいう。典型的には、ポリマー核酸、例えば3つ以上のヌクレオチドを含む核酸分子は、隣接するヌクレオチドがホスホジエステル連結を介して互いに連結されている直鎖分子である。いくつかの実施形態では、「核酸」は、個々の核酸残基(例えばヌクレオチドおよび/またはヌクレオシド)を指す。いくつかの実施形態では、「核酸」は、3つ以上の個々のヌクレオチド残基を含むオリゴヌクレオチド鎖をいう。本明細書で使用される際、用語「オリゴヌクレオチド」および「ポリヌクレオチド」は、ヌクレオチドのポリマー(例えば少なくとも3つの一連のヌクレオチド)を指すために交換可能に使用され得る。いくつかの実施形態では、「核酸」は、RNAならびに一本鎖および/または二本鎖DNAを包含する。核酸は、例えば、ゲノム、転写物、mRNA、tRNA、rRNA、siRNA、snRNA、プラスミド、コスミド、染色体、染色分体、または他の天然に存在する核酸分子との関連において、天然に存在し得る。他方、核酸分子は、例えば組換えDNAもしくはRNA、人工染色体、操作されたゲノム、もしくはその断片、または合成DNA、RNA、DNA/RNAハイブリッド、または非天然に存在するヌクレオチドもしくはヌクレオシドを含む、非天然に存在する分子であり得る。さらに、用語「核酸」、「DNA」、「RNA」、および/または類似の用語は、核酸アナログ、例えばホスホジエステル主鎖以外を有するアナログを含む。核酸は、天然供給源から精製される、組換え発現系を用いて産生され必要に応じて精製される、化学的に合成される、等が可能である。化学的に合成された分子の場合、核酸は、適切な場合には、例えば、化学的に修飾された塩基または糖、および主鎖修飾を有するアナログなどのヌクレオシドアナログを含み得る。核酸配列は、特に示されない限り、5’から3’方向に示される。いくつかの実施形態では、核酸は、天然ヌクレオシド(例えばアデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシン、およびデオキシシチジン);ヌクレオシドアナログ(例えば2-アミノアデノシン、2-チオチミジン、イノシン、ピロロピリミジン、3-メチルアデノシン、5-メチルシチジン、2-アミノアデノシン、C5-ブロモウリジン、C5-フルオロウリジン、C5-ヨードウリジン、C5-プロピニル-ウリジン、C5-プロピニル-シチジン、C5-メチルシチジン、2-アミノアデノシン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノシン、8-オキソグアノシン、O(6)-メチルグアニン、および2-チオシチジン);化学修飾塩基;生物学的に修飾された塩基(例えばメチル化塩基);挿入塩基;修飾糖(例えば2’-フルオロリボース、リボース、2’-デオキシリボース、アラビノース、およびヘキソース);および/または修飾リン酸基(例えばホスホロチオエートおよび5’-N-ホスホロアミダイト連結)であるか、またはそれらを含む。
【0141】
用語「核酸塩基」、「窒素塩基」、または「塩基」は、本明細書中で交換可能に使用され、ヌクレオシドを形成する窒素含有生物学的化合物を指し、ヌクレオシドはヌクレオチドの構成要素である。塩基対を形成し、互いに積み重なる核酸塩基の能力は、直接、リボ核酸 (RNA) およびデオキシリボ核酸 (DNA) のような長鎖らせん構造をもたらす。アデニン (A) 、シトシン (C) 、グアニン (G) 、チミン (T) 、ウラシル (U) の5つの核酸塩基は、主要な(primary)塩基またはカノニカルな(canonical)核酸塩基と呼ばれる。アデニンとグアニンはプリンに由来し、シトシン、ウラシル、チミンはピリミジンに由来する。DNAとRNAは修飾された他の (非主要) 塩基も含有してもよい。非限定的な例示的修飾核酸塩基には、ヒポキサンチン、キサンチン、7-メチルグアニン、5,6-ジヒドロウラシル、5-メチルシトシン (m5C) 、および5-ヒドロメチルシトシンが含まれる。ヒポキサンチンとキサンチンは突然変異原の存在によって生成可能であり、どちらも脱アミノ化(アミン基のカルボニル基への置換)によって生成される。ヒポキサンチンはアデニンから修飾され得る。キサンチンはグアニンから修飾され得る。ウラシルはシトシンの脱アミノ化によって生じ得る。「ヌクレオシド」は核酸塩基と五炭糖(リボースまたはデオキシリボースのいずれか)からなる。ヌクレオシドの例には、アデノシン、グアノシン、ウリジン、シチジン、5-メチルウリジン (m5U) 、デオキシアデノシン、デオキシグアノシン、チミジン、デオキシウリジン、およびデオキシシチジンが含まれる。修飾核酸塩基を有するヌクレオシドの例には、イノシン (I) 、キサントシン (X) 、7-メチルグアノシン (m7G) 、ジヒドロウリジン (D) 、5-メチルシチジン (m5C) 、プソイドウリジン (Ψ) が含まれる。「ヌクレオチド」は、核酸塩基、五炭糖(リボースまたはデオキシリボースのいずれか)、および少なくとも1つのリン酸基からなる。
【0142】
「核酸プログラム可能DNA結合タンパク質(nucleic acid programmable DNA binding protein)」あるいは「napDNAbp」という用語は、「ポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン」と交換可能に使用可能であり、特定の核酸配列にnapDNAbpをガイドするガイド核酸(例えばgRNA)のような核酸(例えばDNAまたはRNA)と会合するタンパク質を指す。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能DNA結合ドメインである。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能RNA結合ドメインである。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、Cas9タンパク質である。Cas9タンパク質は、ガイドRNAに相補的な特定のDNA配列にCas9タンパク質をガイドするガイドRNAと会合することができる。いくつかの実施形態では、napDNAbpは、Cas9ドメイン、例えばヌクレアーゼ活性Cas9、Cas9ニッカーゼ (nCas9) 、またはヌクレアーゼ不活性Cas9 (dCas9) である。核酸プログラム可能DNA結合タンパク質の非限定的な例には、限定なしに、Cas9(例えばdCas9およびnCas9)、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12iが挙げられる。Cas酵素の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9(Csn1またはCsx12としても知られる)、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、II型 Casエフェクタータンパク質、V型 Casエフェクタータンパク質、VI型 Casエフェクタータンパク質、CARF、DinG、それらのホモログ、あるいはそれらの改変または操作されたバージョンが含まれる。他の核酸プログラム可能DNA結合タンパク質も、本開示に具体的に列記されていない可能性があるが、本開示の範囲内である。例えばMakarova et al. “Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?” CRISPR J. 2018 Oct;1:325-336. doi: 10.1089/crispr.2018.0033; Yan et al., “Functionally diverse type V CRISPR-Cas systems” Science. 2019 Jan 4;363(6422):88-91. doi: 10.1126/science.aav7271を参照のこと(それぞれの全内容が参照により本明細書に組み込まれる)。
【0143】
「核酸塩基編集ドメイン」または「核酸塩基編集タンパク質」という用語は、本明細書において使用される際、シトシン(またはシチジン)からウラシル(またはウリジン)またはチミン(またはチミジン)、およびアデニン(もしくはアデノシン)からヒポキサンチン(もしくはイノシン)への脱アミノ化、ならびに非テンプレート化ヌクレオチド付加および挿入のような、RNAまたはDNAにおける核酸塩基修飾を触媒することができるタンパク質または酵素を指す。いくつかの実施形態では、核酸塩基編集ドメインは、デアミナーゼドメイン(例えば、アデニンデアミナーゼもしくはアデノシンデアミナーゼ)である。いくつかの実施形態では、核酸塩基編集ドメインは、天然に存在する核酸塩基編集ドメインであり得る。いくつかの実施形態では、核酸塩基編集ドメインは、天然に存在する核酸塩基編集ドメインから操作または進化された核酸塩基編集ドメインであり得る。核酸塩基編集ドメインは、細菌、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスなどの任意の生物由来であり得る。
【0144】
本明細書で使用される際、「剤を取得する」におけるような「取得する」は、その剤を合成すること、購入すること、または他の方法で獲得することを含む。
【0145】
本明細書で使用される際、「患者」または「対象」は、疾患または障害と診断されている、それらを有するかもしくは発展させるリスクがある、またはそれらを有するかもしくは発展させる疑いがある、哺乳動物対象または個体を指す。いくつかの実施形態では、用語「患者」は、疾患または障害を生ずる可能性が平均より高い哺乳動物対象を指す。例示的な患者は、ヒト、非ヒト霊長類、ネコ、イヌ、ブタ、ウシ、ネコ、ウマ、ラクダ、ラマ、ヤギ、ヒツジ、齧歯類(例えば、マウス、ウサギ、ラット、またはモルモット)および本明細書に開示される療法から利益を得ることができる他の哺乳動物であり得る。例示的なヒト患者は、男性および/または女性であり得る。
【0146】
「それを必要とする患者」または「それを必要とする対象」は、本明細書では、疾患または障害、例えば制限なしに、レット症候群(RTT)と診断された、そのリスクがあるもしくはそれを有する、それを有することがあらかじめ決定された、またはそれを有することが疑われる患者として言及される。
【0147】
「病原性突然変異」、「病原性バリアント」、「疾患原因突然変異」、「疾患原因バリアント」、「有害突然変異」または「素因となる突然変異」という用語は、特定の疾患または障害に対する個体の感受性または素因を増大させる遺伝子改変または突然変異を指す。いくつかの実施形態では、病原性突然変異は、遺伝子によってコードされるタンパク質中の少なくとも1つの野生型アミノ酸が少なくとも1つの病原性アミノ酸によって置換されたものを含む。
【0148】
本明細書で用いた際、用語「薬学的に許容され得るキャリアー」は、液体または固体の充填剤、希釈剤、賦形剤、製造助剤(例えば潤滑剤、タルクマグネシウム、ステアリン酸カルシウムまたはステアリン酸亜鉛、あるいはステアリン酸)、または溶媒被包材料などの、身体のある部位(例えば送達部位)から別の部位(例えば臓器、組織または身体の一部)への化合物の運搬または輸送に関与する薬学的に許容され得る材料、組成物またはビヒクルを意味する。薬学的に許容され得るキャリアーは、配合物の他の成分と適合し、対象の組織に有害でないという意味で「許容され得る」(例えば生理的適合性、無菌性、生理的pH等)。「賦形剤」、「キャリアー」、「薬学的に許容され得るキャリアー」、「ビヒクル」等の用語は、本明細書において交換可能に用いられる。
【0149】
用語「薬学的組成物」は、薬学的使用のために配合された組成物を意味する。
【0150】
用語「タンパク質」、「ペプチド」、「ポリペプチド」、およびそれらの文法的等価物は、本明細書において交換可能に使用され、ペプチド (アミド) 結合によってともに連結されたアミノ酸残基のポリマーを指す。この用語は、任意のサイズ、構造または機能のタンパク質、ペプチドまたはポリペプチドを指す。典型的には、タンパク質、ペプチド、またはポリペプチドは、少なくとも長さ3アミノ酸である。タンパク質、ペプチド、またはポリペプチドは、個々のタンパク質または一群のタンパク質を指すことができる。タンパク質、ペプチド、またはポリペプチド中の1つ以上のアミノ酸は、コンジュゲート化、官能化、または他の修飾等のため、例えば炭水化物基、ヒドロキシル基、リン酸基、ファルネシル基、イソファルネシル基、脂肪酸基、リンカーなどの化学的実体の添加によって、修飾され得る。タンパク質、ペプチド、またはポリペプチドはまた、単一分子であってもよく、または多分子複合体であってもよい。タンパク質、ペプチド、またはポリペプチドは、天然に存在するタンパク質またはペプチドの単なる断片であり得る。タンパク質、ペプチド、またはポリペプチドは、天然に存在するもの、組換え体、もしくは合成のもの、またはそれらの任意の組み合わせであり得る。本明細書中で使用される際、用語「融合タンパク質」とは、少なくとも2つの異なるタンパク質由来のタンパク質ドメインを含むハイブリッドポリペプチドをいう。1つのタンパク質は、融合タンパク質のアミノ末端 (N末端) 部分またはカルボキシ末端 (C末端) タンパク質に位置することができ、従って、それぞれ、アミノ末端融合タンパク質またはカルボキシ末端融合タンパク質を形成する。タンパク質は、異なるドメイン、例えば、核酸結合ドメイン(例えば、標的部位へのタンパク質の結合を導くCas9のgRNA結合ドメイン)および核酸切断ドメイン、あるいは核酸編集タンパク質の触媒ドメインを含み得る。いくつかの実施形態では、タンパク質は、タンパク質性部分、例えば、核酸結合ドメインを構成するアミノ酸配列、および有機化合物、例えば、核酸切断剤として作用し得る化合物を含む。いくつかの実施形態では、タンパク質は、核酸、例えばRNAまたはDNAと複合体化されているか、または核酸と会合している。本明細書で提供される任意のタンパク質は、当技術分野で公知の任意の方法によって生産することができる。例えば、本明細書で提供されるタンパク質は、組換えタンパク質発現および精製を介して生産することができ、これは、ペプチドリンカーを含む融合タンパク質に特に適している。組換えタンパク質の発現および精製のための方法はよく知られており、Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012))によって記載されているものを含み、その全内容は参照により本明細書に組み入れられる。
【0151】
本明細書に開示されるポリペプチドおよびタンパク質(機能的部分およびその機能的バリアントを含む)は、1つ以上の天然に存在するアミノ酸の代わりに合成アミノ酸を含むことができる。そのような合成アミノ酸は当技術分野で公知であり、例えば、アミノシクロヘキサンカルボン酸、ノルロイシン、α-アミノn-デカン酸、ホモセリン、S-アセチルアミノメチル-システイン、trans-3-およびtrans-4-ヒドロキシプロリン、4-アミノフェニルアラニン、4-ニトロフェニルアラニン、4-クロロフェニルアラニン、4-カルボキシフェニルアラニン、β-フェニルセリンβ-ヒドロキシフェニルアラニン、フェニルグリシン、α-ナフチルアラニン、シクロヘキシルアラニン、シクロヘキシルグリシン、インドリン-2-カルボン酸、1,2,3,4-テトラヒドロイソキノリン-3-カルボン酸、アミノマロン酸、アミノマロン酸モノアミド、N'-ベンジル-N'-メチル-リジン、N',N'-ジベンジル-リジン、6-ヒドロキシリジン、オルニチン、α-アミノシクロペンタンカルボン酸、α-アミノシクロヘキサンカルボン酸、α-アミノシクロヘプタンカルボン酸、α-(2-アミノ-2-ノルボルナン)-カルボン酸、α,γ-ジアミノ酪酸、α,β-ジアミノプロピオン酸、ホモフェニルアラニン、およびα-tert-ブチルグリシンが挙げられる。ポリペプチドおよびタンパク質は、ポリペプチド構築物の1つ以上のアミノ酸の翻訳後修飾と関連することができる。翻訳後修飾の非限定的な例としては、リン酸化、アセチル化およびホルミル化を含むアシル化、グリコシル化(N-連結およびO-連結を含む)、アミド化、ヒドロキシル化、メチル化およびエチル化を含むアルキル化、ユビキチン化、ピロリドンカルボン酸の添加、ジスルフィド架橋の形成、硫酸化、ミリストイル化、パルミトイル化、イソプレニル化、ファルネシル化、ゲラニル化、グリピエーション(glypiation)、リポイル化およびヨード化が挙げられる。
【0152】
タンパク質または核酸に関連して本明細書中で使用される用語「組換え体」とは、天然には存在せず、人為操作の産物であるタンパク質または核酸を指す。例えば、いくつかの実施形態では、組換えタンパク質または核酸分子は、任意の天然に存在する配列と比較して、少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、または少なくとも7つの突然変異を含むアミノ酸またはヌクレオチド配列を含む。
【0153】
「減少する」とは、少なくとも10%、25%、50%、75%、または100%の負の改変を意味する。
【0154】
「参照(reference)」は、標準または対照の条件を意味する。一実施形態では、参照は野生型または健康な細胞である。他の実施形態では、限定なしに、参照は、試験条件に晒されていないか、またはプラセボもしくは生理食塩水、培地、緩衝液、および/または、関心対象のポリヌクレオチドを保持しない対照ベクターに晒される、非処理細胞である。
【0155】
「参照配列」は、配列比較の基礎として使用される定義済み配列である。参照配列は、特定の配列のサブセットまたは全体であり得る;例えば、完全長のcDNAもしくは遺伝子配列のセグメント、または完全なcDNAまたは遺伝子配列。ポリペプチドについては、参照ポリペプチド配列の長さは、一般に、少なくとも約16アミノ酸、好ましくは少なくとも約20アミノ酸、より好ましくは少なくとも約25アミノ酸、さらにより好ましくは約35アミノ酸、約50アミノ酸、または約100アミノ酸である。核酸については、参照核酸配列の長さは、一般に、少なくとも約50ヌクレオチド、好ましくは少なくとも約60ヌクレオチド、より好ましくは少なくとも約75ヌクレオチド、さらにより好ましくは約100ヌクレオチドまたは約300ヌクレオチドまたはおよそそれらの値もしくはそれらの間の任意の整数である。いくつかの実施形態では、参照配列は、関心対象のタンパク質の野生型配列である。他の実施形態では、参照配列は、野生型タンパク質をコードするポリヌクレオチド配列である。
【0156】
用語「RNAプログラム可能ヌクレアーゼ」および「RNA誘導型ヌクレアーゼ」は、切断の標的ではない1つ以上のRNAとともに使用される(例えば、それに結合または会合する)。いくつかの実施形態では、RNAプログラム可能ヌクレアーゼは、RNAと複合体である場合、ヌクレアーゼ:RNA複合体と称され得る。典型的には、結合したRNA(複数可)はガイドRNA (gRNA) と呼ばれる。gRNAは2つ以上のRNAの複合体として存在することもあれば、単一のRNA分子として存在することもある。単一のRNA分子として存在するgRNAは、シングルガイドRNA(sgRNA)と呼ばれることがあるが、「gRNA」は、単一の分子として、または2つ以上の分子の複合体のいずれかとして存在するガイドRNAを指すために交換可能に使用される。典型的には、単一のRNA種として存在するgRNAは、(1) 標的核酸と相同性を共有するドメイン(例えば、標的へのCas9複合体の結合を誘導する);および(2) Cas9タンパク質に結合するドメインという2つのドメインを含む。いくつかの実施形態では、ドメイン (2) は、tracrRNAとして知られる配列に対応し、ステム-ループ構造を含む。例えば、いくつかの実施形態では、ドメイン (2) は、Jinek et al., Science 337:816-821(2012)(その全内容が参照により本明細書に組み入れられる)に提供されるようなtracrRNAと同一または相同である。gRNA (例えばドメイン2を含むもの)の他の例は、「Switchable Cas9 Nucleases and Uses Thereof」と題され2013年9月6日に出願された米国仮特許出願U.S.S.N.61/874,682および「Delivery System For Functional Nucleases」と題され2013年9月6日に出願された米国仮特許出願U.S.S.N.61/874,746に見出されることが可能であり、それら各々の全内容が参照により本明細書に組み入れられる。いくつかの実施形態では、gRNAは、ドメイン (1) および (2) の2つ以上を含み、「伸長されたgRNA」と称され得る。例えば、伸長されたgRNAは、本明細書に記載されるように、例えば2つ以上のCas9タンパク質と結合し、2つ以上の異なる領域で標的核酸と結合する。gRNAは、標的部位を相補するヌクレオチド配列を含み、これが前記標的部位へのヌクレアーゼ/RNA複合体の結合を仲介し、ヌクレアーゼ:RNA複合体の配列特異性を提供する。
【0157】
いくつかの実施形態では、RNAプログラム可能ヌクレアーゼは、(CRISPR関連システム)Cas9エンドヌクレアーゼ、例えば、Streptococcus pyogenes由来のCas9 (Casnl) である(例えば、"Complete genome sequence of an Ml strain of Streptococcus pyogenes." Ferretti J.J., et al., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); "CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III." Deltcheva E., et al., Nature 471:602-607(2011)を参照のこと)。
【0158】
RNAプログラム可能ヌクレアーゼ(例えばCas9)は、DNA切断部位を標的とするためにRNA:DNAハイブリダイゼーションを使用するため、これらのタンパク質は、原則として、ガイドRNAによって特定される任意の配列を標的とすることができる。部位特異的切断のためにCas9のようなRNAプログラム可能ヌクレアーゼを使用する方法(例えばゲノムを修飾するために)は、当技術分野において公知である(例えば、Cong, L. et al., Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823 (2013); Mali, P. et al., RNA-guided human genome engineering via Cas9. Science 339, 823-826 (2013); Hwang, W.Y. et al., Efficient genome editing in zebrafish using a CRISPR-Cas system. Nature biotechnology 31, 227-229 (2013); Jinek, M. et al., RNA-programmed genome editing in human cells. eLife 2, e00471 (2013); Dicarlo, J.E. et al., Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas systems. Nucleic acids research (2013); Jiang, W. et al., RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nature biotechnology 31, 233-239 (2013)を参照のこと。これらの各々の全内容は参照により本明細書に組み入れられる)。
【0159】
用語「一塩基多型(SNP:single nucleotide polymorphism)」は、ゲノム中の特定の位で起こる単一ヌクレオチドの変異であり、各変異は集団内で認識できるある程度(例えば>1%)まで存在する。例えば、ヒトゲノム中の特定の塩基位では、ほとんどの個体でCヌクレオチドが出現し得るが、少数の個体ではその位がAで占められている。これは、この特定の位にSNPがあり、CまたはAという2つのあり得るヌクレオチドの変異がこの位のアレルであると言われることを意味する。SNPは疾患に対する感受性の相違の根底にある。病気の重症度や治療に対する体の反応も、遺伝的変異の表れである。SNPは、遺伝子のコード領域、遺伝子の非コード領域、または遺伝子間領域(遺伝子と遺伝子の間の領域)に存在し得る。いくつかの実施形態では、コード配列内のSNPは、遺伝暗号の縮重のために、産生されるタンパク質のアミノ酸配列を必ずしも変化させない。コード領域のSNPには、同義SNPと非同義SNPの2種類がある。同義SNPはタンパク質配列に影響しないが、非同義SNPはタンパク質のアミノ酸配列を変化させる。非同義SNPにはミスセンスとナンセンスの2種類がある。タンパク質をコードする領域にないSNPは、遺伝子スプライシング、転写因子の結合、メッセンジャーRNAの分解、または非コードRNAの配列に影響を与えることがある。この種のSNPによって影響を受ける遺伝子発現はeSNP (発現SNP)と呼ばれ、遺伝子の上流または下流にあり得る。一塩基バリアント (SNV) は、頻度に制限のない一塩基の変異であり、体細胞で生じ得る。体細胞一塩基変異(例えば癌と関連するもの)は一塩基改変とも呼ばれ得る。
【0160】
「特異的に結合する」とは、本開示のポリペプチドおよび/または核酸分子を認識し、これに結合するが、試料、例えば生物学的試料中の他の分子を実質的に認識せず、これに結合しない核酸分子、ポリペプチド、もしくはそれらの複合体(例えば、核酸プログラム可能DNA結合ドメインおよびガイド核酸)、化合物、または分子を意味する。
【0161】
本明細書記載の方法において有用な核酸分子は、本開示のポリペプチドまたはその断片をコードする任意の核酸分子を含む。そのような核酸分子は、内因性核酸配列と100%同一である必要はないが、典型的には実質的同一性を示す。内因性配列に対して「実質的同一性」を有するポリヌクレオチドは、典型的には、二本鎖核酸分子の少なくとも1つの鎖とハイブリダイズすることができる。本明細書記載の方法において有用な核酸分子は、本開示のポリペプチドをコードする任意の核酸分子、またはその断片を含む。そのような核酸分子は、内因性核酸配列と100%同一である必要はないが、典型的には実質的同一性を示す。内因性配列に対して「実質的同一性」を有するポリヌクレオチドは、典型的には、二本鎖核酸分子の少なくとも1つの鎖とハイブリダイズすることができる。「ハイブリダイズする」とは、多様なストリンジェンシー条件下で相補的ポリヌクレオチド配列(例えば、本明細書に記載の遺伝子)の間、またはその一部の間に二本鎖分子を形成する対をなすことを意味する。(例えばWahl, G. M. and S. L. Berger (1987) Methods Enzymol. 152:399; Kimmel, A. R. (1987) Methods Enzymol. 152:507を参照のこと)。
【0162】
例えば、ストリンジェントな塩濃度は、通常、約750 mM未満のNaClおよび75 mMクエン酸三ナトリウム、好ましくは約500 mM未満のNaClおよび50 mMクエン酸三ナトリウム、より好ましくは約250 mM未満のNaClおよび25 mMクエン酸三ナトリウムである。低ストリンジェンシーハイブリダイゼーションは、有機溶媒、例えばホルムアミドの非存在下で得ることができ、一方、高ストリンジェンシーハイブリダイゼーションは、少なくとも約35%ホルムアミド、より好ましくは少なくとも約50%ホルムアミドの存在下で得ることができる。ストリンジェントな温度条件は、通常、少なくとも約30℃、より好ましくは少なくとも約37℃、最も好ましくは少なくとも約42℃の温度を含むであろう。ハイブリダイゼーション時間、界面活性剤、例えば、ドデシル硫酸ナトリウム (SDS) の濃度、およびキャリアーDNAの包含または排除などの多様な追加のパラメータは、当業者によく知られている。必要に応じてこれら多様な条件を組み合わせることによって、多様なレベルのストリンジェンシーが達成される。特定の実施形態では、ハイブリダイゼーションは、30℃で、750 mM NaCl、75 mMクエン酸三ナトリウムおよび1% SDS中で起こる。より好ましい実施形態では、ハイブリダイゼーションは、37℃で、500 mM NaCl、50 mMクエン酸三ナトリウム、1% SDS、35%ホルムアミドおよび100μg/ml変性サケ精子DNA (ssDNA) 中で起こる。最も好ましい実施形態では、ハイブリダイゼーションは、42℃で、250 mM NaCl、25 mMクエン酸三ナトリウム、1% SDS、50%ホルムアミドおよび200μg/ml ssDNA中で起こる。これらの条件の有用なバリエーションは、当業者には容易に明らかになるであろう。
【0163】
ほとんどの用途では、ハイブリダイゼーションに続く洗浄工程もまた、ストリンジェンシーが異なる。洗浄ストリンジェンシー条件は、塩濃度および温度によって定義することができる。上記のように、洗浄ストリンジェンシーは、塩濃度を低下させるか、または温度を上昇させることによって増加させることができる。例えば、洗浄工程のためのストリンジェントな塩濃度は、好ましくは約30 mM未満のNaClおよび3 mMクエン酸三ナトリウムであり、最も好ましくは約15 mM未満のNaClおよび1.5 mMクエン酸三ナトリウムであり得る。洗浄工程のためのストリンジェントな温度条件は、通常、少なくとも約25℃、より好ましくは少なくとも約42℃、さらにより好ましくは少なくとも約68℃の温度を含む。好ましい実施形態では、洗浄工程は、25℃で、30 mM NaCl、3 mMクエン酸三ナトリウム、および0.1% SDS中で行われる。より好ましい実施形態では、洗浄工程は、42℃で、15 mM NaCl、1.5 mMクエン酸三ナトリウム、および0.1% SDS中で行われる。より好ましい実施形態では、洗浄工程は、68℃で、15 mM NaCl、1.5 mMクエン酸三ナトリウム、および0.1% SDS中で行われる。これらの条件の追加のバリエーションは、当業者には容易に明らかになるであろう。ハイブリダイゼーション技術は、当業者によく知られており、例えば、Benton and Davis (Science 196:180, 1977); Grunstein and Hogness (Proc. Natl. Acad. Sci., USA 72:3961, 1975); Ausubel et al. (Current Protocols in Molecular Biology, Wiley Interscience, New York, 2001); Berger and Kimmel (Guide to Molecular Cloning Techniques, 1987, Academic Press, New York); および Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, New Yorkに記述されている。
【0164】
「分割(split)」とは、2つ以上の断片に分割されることを意味する。
【0165】
「分割されたCas9タンパク質」あるいは「分割Cas9」とは、2つの別個のヌクレオチド配列によってコードされるN末端断片およびC末端断片として提供されるCas9タンパク質をいう。Cas9タンパク質のN末端部分およびC末端部分に対応するポリペプチドは、スプライスされて「再構成」Cas9タンパク質を形成することができる。特定の実施形態では、Cas9タンパク質は、例えば、Nishimasu et al., Cell, Volume 156, Issue 5, pp. 935-949, 2014に記載されるように、またはJiang et al. (2016) Science 351: 867-871. PDB file: 5F9Rに記載されるように(それぞれ参照により本明細書に組み込まれる)、タンパク質の非秩序的な領域内で2つの断片に分割される。いくつかの実施形態では、タンパク質は、SpCas9のおよそアミノ酸A292~G364、F445~K483、もしくはE565~T637の間の領域内の任意のC、T、A、もしくはSで、または任意の他のCas9、Cas9バリアント(例えばnCas9、dCas9)、もしくは他のnapDNAbpにおける対応する位で、2つの断片に分割される。いくつかの実施形態では、タンパク質は、SpCas9 T310、T313、A456、S469、またはC574で2つの断片に分けられる。いくつかの実施形態では、タンパク質を2つの断片に分けるプロセスは、タンパク質を「分割(スプリッティング)する」と称される。
【0166】
他の実施形態では、Cas9タンパク質のN末端部分は、S. pyogenes Cas9野生型(SpCas9)(NCBI参照配列:NC_002737.2、Uniprot参照配列:Q99ZW2)のアミノ酸1~573または1~637を含み、Cas9タンパク質のC末端部分は、SpCas9野生型のアミノ酸574~1368または638~1368の部分、またはその対応する位を含む。
【0167】
分割されたCas9のC末端部分は、分割Cas9のN末端部分と連結されて完全なCas9タンパク質を形成することができる。いくつかの実施形態では、Cas9タンパク質のC末端部分は、Cas9タンパク質のN末端部分が終わるところから始まる。こうしたものとして、いくつかの実施形態では、分割Cas9のC末端部分は、spCas9のアミノ酸 (551~651) ~1368の部分を含む。「(551~651)~1368」とは、アミノ酸551~651(両端を含む)の間のアミノ酸から始まり、アミノ酸1368で終わることを意味する。例えば、分割Cas9のC末端部分は、spCas9のアミノ酸551~1368、552~1368、553~1368、554~1368、555~1368、556~1368、557~1368、558~1368、559~1368、560~1368、561~1368、562~1368、563~1368、564~1368、565~1368、566~1368、567~1368、568~1368、569~1368、570~1368、571~1368、572~1368、573~1368、574~1368、575~1368、576~1368、577~1368、578~1368、579~1368、580~1368、581~1368、582~1368、583~1368、584~1368、585~1368、586~1368、587~1368、588~1368、589~1368、590~1368、591~1368、592~1368、593~1368、594~1368、595~1368、596~1368、597~1368、598~1368、599~1368、600~1368、601~1368、602~1368、603~1368、604~1368、605~1368、606~1368、607~1368、608~1368、609~1368、610~1368、611~1368、612~1368、613~1368、614~1368、615~1368、616~1368、617~1368、618~1368、619~1368、620~1368、621~1368、622~1368、623~1368、624~1368、625~1368、626~1368、627~1368、628~1368、629~1368、630~1368、631~1368、632~1368、633~1368、634~1368、635~1368、636~1368、637~1368、638~1368、639~1368、640~1368、641~1368、642~1368、643~1368、644~1368、645~1368、646~1368、647~1368、648~1368、649~1368、650~1368、または651~1368のいずれか1つの部分を含み得る。いくつかの実施形態では、分割Cas9タンパク質のC末端部分は、SpCas9のアミノ酸574~1368または638~1368の部分を含む。
【0168】
「対象」とは、哺乳動物を意味し、ヒトまたは非ヒト哺乳動物、例えばウシ亜科、ウマ科、イヌ科、ヒツジ科、もしくはネコ科が含まれるが、これらに限定されない。対象には、家畜(livestock)、労働を生じ、商品、例えば食品を提供するように育てられた飼育動物(domesticated animal)が含まれ、ウシ、ヤギ、ニワトリ、ウマ、ブタ、ウサギ、およびヒツジが含まれるがこれらに限定されない。
【0169】
「実質的に同一である」とは、参照アミノ酸配列(例えば、本明細書に記載のアミノ酸配列のいずれか1つ)または核酸配列(例えば、本明細書に記載の核酸配列のいずれか1つ)に対して少なくとも50%の同一性を示すポリペプチドまたは核酸分子を意味する。好ましくは、そのような配列は、比較のために使用される配列とアミノ酸レベルまたは核酸レベルで少なくとも60%、より好ましくは80%または85%、最も好ましくは90%、95%またはさらに99%の同一性を有する。
【0170】
配列同一性は、典型的には、配列解析ソフトウェア(例えば、Genetics Computer Group, University of Wisconsin Biotechnology Center, 1710 University Avenue, Madison, Wis. 53705のSequence Analysis Software Package、BLAST、BESTFIT、COBALT、EMBOSS Needle、GAP、またはPILEUP/PRETTYBOXプログラム)を用いて測定される。そのようなソフトウェアは、多様な置換、欠失、および/または他の改変に相同性の程度を割り当てることによって、同一または類似の配列をマッチさせる。保存的置換は、典型的には、以下の群内の置換を含む:グリシン、アラニン;バリン、イソロイシン、ロイシン;アスパラギン酸、グルタミン酸、アスパラギン、グルタミン;セリン、トレオニン;リジン、アルギニン;フェニルアラニン、チロシン。同一性の程度を決定するための例示的なアプローチにおいて、密接に関連した配列を示すe -3とe -100の間の確率スコアを含むBLASTプログラムを使用することができる。COBALTは、例えば次のパラメータとともに使用される:
a) アラインメントパラメータ:ギャップペナルティ -11、-1および末端ギャップペナルティ-5、-1
b) CDDパラメータ: RPS BLASTをオンで用いる; Blast E値 0.003; 保存カラムを見つけ再計算を続ける
c) クエリー・クラスタリング・パラメータ:クエリークラスターをオンで用いる; ワードサイズ4; 最大クラスター距離0.8;アルファベットは通常通り。
EMBOSS Needleは、例えば次のパラメータで使用される。
a) マトリックス: BLOSUM62;
b) ギャップオープン: 10;
c) ギャップ伸長: 0.5;
d) 出力形式: 対;
e) 末端ギャップペナルティ: 偽;
f) 末端ギャップオープン: 10; および
g) 末端ギャップ伸長: 0.5。
【0171】
用語「標的部位」とは、核酸分子内の配列であって、核酸塩基エディターによって修飾される配列をいう。一実施形態では、標的部位は、デアミナーゼまたはデアミナーゼ(例えばアデニンデアミナーゼ)を含む融合タンパク質によって脱アミノ化される。
【0172】
本明細書で使用される際、用語「治療する(treat)」、「治療している(treating)」、「治療(treatment)」などは、障害および/またはそれに関連する症状(単数または複数)を軽減もしくは改善すること、または所望の薬理学的および/または生理学的効果を得ることを指す。障害または状態を治療することは、関連する障害、状態または症状を完全に除去することを必要としないことが理解されるであろう。いくつかの実施形態では、効果は、療法的であり、すなわち、限定されるものではないが、効果は、疾患および/または疾患に起因する有害症状を部分的または完全に低減、減少、除去、軽減、緩和、強度低下、または治癒させる。いくつかの実施形態では、効果は予防的であり、すなわち効果は、疾患または状態の発生または再発を保護または予防する。この目的のために、本開示の方法は、本明細書に記載されるような療法的に有効な量の組成物を投与することを含む。
【0173】
「ウラシルグリコシラーゼ阻害剤」、または「UGI」とは、ウラシル除去修復システムを阻害する剤を意味する。一実施形態では、該剤は、宿主ウラシル-DNAグリコシラーゼに結合してDNAからのウラシル残基の除去を妨げるタンパク質またはその断片である。一実施形態では、UGIは、ウラシル-DNAグリコシラーゼ塩基除去修復酵素を阻害することができるタンパク質、その断片、またはドメインである。いくつかの実施形態では、UGIドメインは、野生型UGIまたはその改変バージョンを含む。いくつかの実施形態では、UGIドメインは、以下に提示される例示的アミノ酸配列の断片を含む。いくつかの実施形態では、UGI断片は、以下に提供される例示的UGI配列の少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%を含むアミノ酸配列を含む。いくつかの実施形態では、UGIは、以下に記載されるように、例示的UGIアミノ酸配列またはその断片に対して相同なアミノ酸配列を含む。いくつかの実施形態では、UGIまたはその一部は、以下に記載されるように、野生型UGIもしくUGI配列またはその一部に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.5%、少なくとも99.9%または100%の同一性を有する。例示的なUGIは、以下のアミノ酸配列を含む:
>splP14739IUNGI_BPPB2 ウラシル-DNAグリコシラーゼ阻害剤
MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSD APEYKPWALVIQDSNGENKIKML
【0174】
用語「ベクター」は、細胞内に核酸配列を導入し、形質転換された細胞を生じる手段を指す。ベクターには、プラスミド、トランスポゾン、ファージ、ウイルス、リポソーム、およびエピソームが含まれる。「発現ベクター」は、レシピエント細胞において発現されるべきヌクレオチド配列を含む核酸配列である。発現ベクターには、導入された配列の発現を促進し、かつ/または容易にする、追加の核酸配列、例えば開始、停止、エンハンサー、プロモーター、および分泌配列が含まれてもよい。
【0175】
本明細書における可変物の任意の定義における化学基のリストの記載は、列挙された基の任意の単一の基または組み合わせとしてのその可変物の定義を含む。本明細書における可変物または態様に関する実施形態の記述は、任意の単一の実施形態としての、または任意の他の実施形態もしくはその一部と組み合わせられた、その実施形態を含む。
【0176】
本明細書で提供され、記載される任意の組成物または方法を、本明細書で提供され、記載される任意の他の1つ以上の組成物および方法と組み合わせてもよい。
【0177】
DNA編集は、遺伝子レベルで病原性突然変異を修正することによって、疾患状態を修飾する実行可能な手段として出現してきた。最近まで、すべてのDNA編集プラットフォームは、特定のゲノム部位でDNA二本鎖切断(DSB:double strand break)を誘導し、内因性DNA修復経路に頼り、半確率的方式で産物結果を決定する結果、複雑な遺伝子産物集団を生じることによって機能してきた。相同性指向性修復(HDR:homology directed repair)経路を通じて、正確で、ユーザーが定義する修復結果が達成可能であるが、療法的に適切な細胞タイプにおいて、HDRを用いた高効率修復は、いくつかの困難によって妨げられてきている。実際には、この経路は、競合する、誤りがちな非相同端連結(non-homologous end joining)経路に比較して非効率的である。さらに、HDRは、細胞周期のG1およびS期に厳密に制限され、有糸分裂後の細胞におけるDSBの正確な修復を妨げる。その結果、これらの集団において、高効率に、ユーザーが定義するプログラム可能な方式でゲノム配列を改変することは、困難であるかまたは不可能であることが示されてきている。
【0178】
核酸塩基エディター
ポリヌクレオチドの標的ヌクレオチド配列を編集、修飾または改変するための塩基エディターまたは核酸塩基エディターが本明細書に開示される。本明細書に記載されるのは、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインおよび核酸塩基編集ドメイン(例えばアデノシンデアミナーゼ)を含む核酸塩基エディターまたは塩基エディターである。ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、結合したガイドポリヌクレオチド(例えばgRNA)と一緒である場合に、標的ポリヌクレオチド配列に(すなわち結合したガイド核酸の塩基と標的ポリヌクレオチド配列の塩基との間の相補的塩基対形成を介して)特異的に結合することができ、それによって、編集が望ましい標的核酸配列に塩基エディターを局在化させることができる。いくつかの実施形態では、標的ポリヌクレオチド配列は一本鎖DNAまたは二本鎖DNAを含む。いくつかの実施形態では、標的ポリヌクレオチド配列はRNAを含む。いくつかの実施形態では、標的ポリヌクレオチド配列はDNA-RNAハイブリッドを含む。
【0179】
ポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン
ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインはまた、RNAに結合する核酸プログラム可能タンパク質を含むことができることを理解されたい。例えば、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインをRNAにガイドする核酸と会合し得る。他の核酸プログラム可能DNA結合タンパク質もまた、本開示の範囲内にあるが、それらは本開示には特に列記されていない。
【0180】
塩基エディターのポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、それ自体が1つ以上のドメインを含むことができる。例えば、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、1つ以上のヌクレアーゼドメインを含むことができる。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインのヌクレアーゼドメインは、エンドヌクレアーゼまたはエキソヌクレアーゼを含むことができる。本明細書において、用語「エキソヌクレアーゼ」は、核酸(例えばRNAまたはDNA)を遊離末端から消化することができるタンパク質またはポリペプチドを指し、用語「エンドヌクレアーゼ」は、核酸(例えばDNAまたはRNA)の内部領域を触媒(例えば切断)することができるタンパク質またはポリペプチドを指す。いくつかの実施形態では、エンドヌクレアーゼは、二本鎖核酸の単一の鎖を切断することができる。いくつかの実施形態では、エンドヌクレアーゼは、二本鎖核酸分子の両方の鎖を切断することができる。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、デオキシリボヌクレアーゼであり得る。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、リボヌクレアーゼであり得る。
【0181】
いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインのヌクレアーゼドメインは、標的ポリヌクレオチドの0本、1本または2本の鎖を切断することができる。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、ニッカーゼドメインを含むことができる。本明細書において、用語「ニッカーゼ」は、二本鎖核酸分子(例えばDNA)中の二本鎖の一方の鎖のみを切断することができるヌクレアーゼドメインを含むポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを指す。いくつかの実施形態では、ニッカーゼは、活性ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインに1つ以上の突然変異を導入することによって、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの完全に触媒的に活性な(例えば天然の)形態から得られ得る。例えば、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインがCas9に由来するニッカーゼドメインを含む場合、Cas9に由来するニッカーゼドメインは、D10A突然変異および840位のヒスチジンを含むことができる。そのような実施形態では、残基H 840は触媒活性を保持し、それによって核酸二本鎖の単一の鎖を切断することができる。別の例において、Cas9由来ニッカーゼドメインは、H840A突然変異を含むことができ、一方、10位のアミノ酸残基は、Dのままである。いくつかの実施形態では、ニッカーゼは、ニッカーゼ活性に必要ではないヌクレアーゼドメインのすべてまたは一部を除去することによって、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの完全に触媒的に活性な(例えば天然の)形態から得られ得る。例えば、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインがCas9に由来するニッカーゼドメインを含む場合、Cas9に由来するニッカーゼドメインは、RuvCドメインまたはHNHドメインのすべてまたは一部の欠失を含むことができる。
【0182】
例示的な触媒的に活性なCas9のアミノ酸配列は以下の通りである:
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0183】
従って、ニッカーゼドメインを含むポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを含む塩基エディターは、特定のポリヌクレオチド標的配列(例えば結合したガイド核酸の相補的配列によって決定される)で、一本鎖DNA切断 (ニック) を生成することができる。いくつかの実施形態では、ニッカーゼドメイン(例えばCas9由来のニッカーゼドメイン)を含む塩基エディターによって切断される核酸二本鎖標的ポリヌクレオチド配列の鎖は、塩基エディターによって編集されない鎖である(すなわち、塩基エディターによって切断される鎖は、編集される塩基を含む鎖とは反対の鎖である)。他の実施形態では、ニッカーゼドメイン(例えばCas9由来のニッカーゼドメイン)を含む塩基エディターは、編集のために標的とされるDNA分子の鎖を切断することができる。このような実施形態では、非標的鎖は切断されない。
【0184】
触媒的に不活性である(すなわち標的ポリヌクレオチド配列を切断することができない)ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを含む塩基エディターも本明細書中に提供される。本明細書において、用語「触媒的に不活性である」および「ヌクレアーゼ不活性」は、核酸の鎖を切断することができない結果となる1つ以上の突然変異および/または欠失を有するポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを指すために交換可能に使用される。いくつかの実施形態では、触媒的に不活性であるポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン塩基エディターは、1つ以上のヌクレアーゼドメインにおける特定の点突然変異の結果としてヌクレアーゼ活性を欠くことができる。例えば、Cas9ドメインを含む塩基エディターの場合、Cas9は、D10A突然変異およびH840A突然変異の両方を含むことができる。このような突然変異は両方のヌクレアーゼドメインを不活化し、その結果ヌクレアーゼ活性を失う。他の実施形態では、触媒的に不活性であるポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、触媒ドメイン(例えばRuvC1および/またはHNHドメイン)のすべてまたは一部の1つ以上の欠失を含むことができる。さらなる実施形態では、触媒的に不活性であるポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、点突然変異(例えばD10AまたはH840A)ならびにヌクレアーゼドメインのすべてまたは一部の欠失を含む。
【0185】
また、本明細書では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの以前に機能していたバージョンから、触媒的に不活性であるポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを生成することができる突然変異も企図される。例えば、触媒的に不活性であるCas9 (「dCas9」) の場合、D10AおよびH840A以外の突然変異を有してヌクレアーゼ不活性化Cas9をもたらすバリアントが提供される。このような突然変異は、例えば、D10およびH840での他のアミノ酸置換、またはCas9のヌクレアーゼドメイン内の他の置換(例えば、HNHヌクレアーゼサブドメインおよび/またはRuvC1サブドメインにおける置換)を含む。追加の適切なヌクレアーゼ不活性dCas9ドメインは、本開示および当技術分野における知識に基づいて当業者に明らかとなることが可能であり、本開示の範囲内である。このような追加の例示的な適切なヌクレアーゼ不活性Cas9ドメインには、限定されるものではないが、D10A/H840A、D10A/D839A/H840A、およびD10A/D839A/H840A/N863A突然変異体ドメインが含まれる(例えば、Prashant et al., CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nature Biotechnology. 2013; 31(9): 833-838を参照のこと (その全内容は参照により本明細書に組み込まれる))。
【0186】
塩基エディターに組み込むことができるポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの非限定的な例には、CRISPRタンパク質由来ドメイン、制限ヌクレアーゼ、メガヌクレアーゼ、TALヌクレアーゼ (TALEN) 、およびジンクフィンガーヌクレアーゼ (ZFN) が含まれる。いくつかの実施形態では、塩基エディターは、核酸のCRISPR (すなわちClustered Regularly Interspaced Short Palindromic Repeats)仲介修飾の際に、結合したガイド核酸を介して核酸配列に結合することができる天然もしくは改変されたタンパク質またはその一部を含むポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを含む。そのようなタンパク質は、本明細書において「CRISPRタンパク質」と呼ばれる。従って、本明細書に開示されているのは、CRISPRタンパク質のすべてまたは一部を含むポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを含む塩基エディター(すなわち、CRISPRタンパク質のすべてまたは一部をドメインとして含む塩基エディター、塩基エディターの「CRISPRタンパク質由来ドメイン」とも呼ばれる)である。塩基エディターに組み込まれたCRISPRタンパク質由来ドメインは、野生型または天然型のCRISPRタンパク質と比較して改変され得る。例えば、以下に記載するように、CRISPRタンパク質由来ドメインは、野生型または天然型のCRISPRタンパク質と比較して、1つ以上の突然変異、挿入、欠失、再配置および/または組換えを含み得る。
【0187】
CRISPRは、可動遺伝要素(ウイルス、転移因子、接合性プラスミド)に対する防御を提供する適応免疫システムである。CRISPRクラスターは、スペーサー、先行する可動要素に相補的な配列、および標的侵入核酸を含む。CRISPRクラスターは転写され、CRISPR RNA (crRNA) にプロセシングされる。II型CRISPRシステムでは、pre-crRNAの正しいプロセシングはトランスエンコード小分子RNA (tracrRNA)、内因性リボヌクレアーゼ3 (rnc) 、およびCas9タンパク質を必要とする。tracrRNAはリボヌクレアーゼ3が補助するpre-crRNAのプロセシングのガイドとなる。続いて、Cas9/crRNA/tracrRNAが、スペーサーに相補的な直鎖または環状のdsDNA標的をエンドヌクレアーゼで切断する。crRNAに相補的でない標的鎖は、最初にエンドヌクレアーゼ的に切断され、次にエキソヌクレアーゼ的に3’-5’にトリムされる。自然界では、DNA結合と切断にはタンパク質と両方のRNAが必要である。しかし、crRNAおよびtracrRNAの両方の側面を単一のRNA種に組み込むように、シングルガイドRNA (「sgRNA」、あるいは単に「gRNA」)を作製することができる。例えばJinek M., Chylinski K., Fonfara I., Hauer M., Doudna J. A., Charpentier E. Science 337:816-821(2012)を参照のこと(その内容全体が参照により本明細書に組み入れられる)。Cas9は、CRISPR反復配列中の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、「自己」と「非自己」を区別することを助ける。
【0188】
いくつかの実施形態では、本明細書に記載される方法は、操作されたCasタンパク質を利用することができる。ガイドRNA (gRNA) は、Cas結合に必要な足場配列と、修飾されるゲノム標的を規定するユーザー定義の約20塩基スペーサーとからなる短い合成RNAである。従って、当業者はCasタンパク質特異性のゲノム標的を変化させることができ、これは、ゲノムの残りの部分と比較してgRNA標的化配列がゲノム標的に対していかに特異的であるかによって部分的に決定される。
【0189】
いくつかの実施形態では、gRNA足場配列は以下の通りである:GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU。
【0190】
いくつかの実施形態では、塩基エディター内に組み込まれたCRISPRタンパク質由来ドメインは、結合ガイド核酸と組み合わせられた場合に標的ポリヌクレオチドに結合することができるエンドヌクレアーゼ(例えばデオキシリボヌクレアーゼまたはリボヌクレアーゼ)である。いくつかの実施形態では、塩基エディター内に組み込まれたCRISPRタンパク質由来ドメインは、結合したガイド核酸と組み合わせられた場合に標的ポリヌクレオチドに結合することができるニッカーゼである。いくつかの実施形態では、塩基エディター内に組み込まれたCRISPRタンパク質由来ドメインは、結合したガイド核酸と組み合わせられた場合に標的ポリヌクレオチドに結合することができる触媒的に不活性のドメインである。いくつかの実施形態では、塩基エディターのCRISPRタンパク質由来ドメインに結合する標的ポリヌクレオチドはDNAである。いくつかの実施形態では、塩基エディターのCRISPRタンパク質由来ドメインに結合する標的ポリヌクレオチドはRNAである。
【0191】
本明細書で用いることができるCasタンパク質には、クラス1およびクラス2が含まれる。Casタンパク質の非限定的な例には、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas9 (Csn1またはCsx12としても知られる)、Cas10、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、Cas12a/Cpf1、Cas12b/C2c1、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12i、CARF、DinG、それらのホモログ、またはそれらの改変型が含まれる。非改変CRISPR酵素は、Cas9のように、2つの機能性エンドヌクレアーゼ領域、RuvCおよびHNHを有するDNA切断活性を有することができる。CRISPR酵素は、標的配列内および/または標的配列の相補鎖内などの標的配列で、一方または両方の鎖の切断を誘導することができる。例えば、CRISPR酵素は、標的配列の最初または最後のヌクレオチドから約1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500塩基対またはそれ以上離れた、一方または両方の鎖の切断を誘導することができる。
【0192】
標的配列を含有する標的ポリヌクレオチドの一方または両方の鎖を切断する能力を欠くように、対応する野生型酵素に対して突然変異されたCRISPR酵素をコードするベクターを用いることができる。Cas9は、野生型の例示的なCas9ポリペプチド(例えばS. pyogenes由来のCas9)と少なくとも、または少なくとも約、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性および/または配列相同性を有するポリペプチドを指すことができる。Cas9は、野生型の例示的なCas9ポリペプチド(例えばS.pyogenes由来のもの)に対して、最大で、または最大で約、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性および/または配列相同性を有するポリペプチドを指すことができる。Cas9は、野生型、または欠失、挿入、置換、バリアント、突然変異、融合、キメラ、またはそれらの任意の組み合わせなどのアミノ酸変化を含み得るCas9タンパク質の修飾型を指すことができる。
【0193】
いくつかの実施形態では、塩基エディターのCRISPRタンパク質由来ドメインには、Corynebacterium ulcerans (NCBI参照: NC_015683.1, NC_017317.1); Corynebacterium diphtheria (NCBI参照: NC_016782.1, NC_016786.1); Spiroplasma syrphidicola (NCBI参照: NC_021284.1); Prevotella intermedia (NCBI参照: NC_017861.1); Spiroplasma taiwanense (NCBI参照: NC_021846.1); Streptococcus iniae (NCBI参照: NC_021314.1); Belliella baltica (NCBI参照: NC_018010.1); Psychroflexus torquis (NCBI参照: NC_018721.1); Streptococcus thermophilus (NCBI参照: YP_820832.1); Listeria innocua (NCBI参照: NP_472073.1); Campylobacter jejuni (NCBI参照: YP_002344900.1); Neisseria meningitidis (NCBI参照: YP_002342100.1), Streptococcus pyogenes, または Staphylococcus aureus由来のCas9のすべてまたは一部が含まれてもよい。
【0194】
核酸塩基エディターのCas9ドメイン
Cas9ヌクレアーゼの配列および構造は、当業者によく知られている(例えば“Complete genome sequence of an Ml strain of Streptococcus pyogenes.” Ferretti et al., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); “CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.” Deltcheva E. et al., Nature 471:602-607(2011); および “A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.” Jinek M. et al., Science 337:816-821(2012)を参照のこと。各々、その内容全体が参照により本明細書に組み入れられる)。Cas9オルソログは、限定されるものではないが、S.pyogenesおよびS.thermophilusを含む多様な種において記述されてきた。追加の適切なCas9ヌクレアーゼおよび配列は、本開示に基づいて当業者に明らかとなり、そのようなCas9ヌクレアーゼおよび配列は、Chylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems” (2013) RNA Biology 10:5, 726-737に開示されている生物および遺伝子座由来のCas9配列を含む。その全内容は参照により本明細書に組み込まれる。
【0195】
いくつかの態様では、核酸プログラム可能DNA結合タンパク質 (napDNAbp) は、Cas9ドメインである。非限定的な例示的Cas9ドメインが本明細書で提供される。Cas9ドメインは、ヌクレアーゼ活性Cas9ドメイン、ヌクレアーゼ不活性Cas9ドメイン(dCas9)、またはCas9ニッカーゼ(nCas9)であり得る。いくつかの実施形態では、Cas9ドメインは、ヌクレアーゼ活性ドメインである。例えば、Cas9ドメインは、二本鎖核酸の両方の鎖(例えば二本鎖DNA分子の両方の鎖)を切断するCas9ドメインであり得る。いくつかの実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つを含む。いくつかの実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれより多い突然変異を有するアミノ酸配列を含む。いくつかの実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200の同一の連続したアミノ酸残基を有するアミノ酸配列を含む。
【0196】
いくつかの実施形態では、Cas9の断片を含むタンパク質が提供される。例えば、いくつかの実施形態では、タンパク質は、以下の2つのCas9ドメインのうちの1つを含む:(1) Cas9のgRNA結合ドメイン;(2) Cas9のDNA切断ドメイン。いくつかの実施形態では、Cas9またはその断片を含むタンパク質は、「Cas9バリアント」と称される。Cas9バリアントは、Cas9またはその断片と相同性を共有する。例えば、Cas9バリアントは、野生型Cas9と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態では、Cas9バリアントは、野生型Cas9と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれより多くのアミノ酸変化を有し得る。
【0197】
いくつかの実施形態では、Cas9バリアントは、Cas9の断片 (例えばgRNA結合ドメインまたはDNA切断ドメイン)を含み、その断片は、野生型Cas9の対応する断片と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態では、断片は、対応する野生型Cas9のアミノ酸長の少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。いくつかの実施形態では、断片は、長さが少なくとも100アミノ酸である。いくつかの実施形態では、断片は、少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも 1300アミノ酸の長さである。
【0198】
いくつかの実施形態では、本明細書に提供されるCas9融合タンパク質は、Cas9タンパク質の全長アミノ酸配列、例えば、本明細書に提供されるCas9配列の1つを含む。しかし、他の実施形態では、本明細書に提供される融合タンパク質は、全長Cas9配列を含まず、その1つ以上の断片のみを含む。適切なCas9ドメインおよびCas9断片の例示的アミノ酸配列が本明細書に提供され、Cas9ドメインおよび断片の追加の適切な配列は、当業者には明らかであろう。
【0199】
いくつかの実施形態では、野生型Cas9は、Streptococcus pyogenes由来のCas9に対応する(NCBI参照配列:NC_017053.1、例示的なヌクレオチドおよびアミノ酸の配列は以下の通り)。
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGATTATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGGCAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGCAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAATCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTAGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAGAAATGGCTTGTTTGGGAATCTCATTGCTTTGTCATTGGGATTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATAGTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAGCGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAGGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGCGCCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGGGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGATATTCAAAAAGCACAGGTGTCTGGACAAGGCCATAGTTTACATGAACAGATTGCTAACTTAGCTGGCAGTCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAATTGTTGATGAACTGGTCAAAGTAATGGGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTACAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCATTAAAGACGATTCAATAGACAATAAGGTACTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
【0200】
いくつかの実施形態では、野生型Cas9は、以下のヌクレオチドおよび/またはアミノ酸配列に対応するか、またはこれらを含む:
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGGCTGCAGGA
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
【0201】
いくつかの実施形態では、野生型Cas9は、Streptococcus pyogenes由来のCas9(NCBI参照配列: NC_002737.2(ヌクレオチド配列は以下の通り)およびUniprot参照配列: Q99ZW2(アミノ酸配列は以下の通り)に対応する:
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
【0202】
いくつかの実施形態では、Cas9は、Corynebacterium ulcerans (NCBI参照: NC_015683.1, NC_017317.1); Corynebacterium diphtheria (NCBI参照: NC_016782.1, NC_016786.1); Spiroplasma syrphidicola (NCBI参照: NC_021284.1); Prevotella intermedia (NCBI参照: NC_017861.1); Spiroplasma taiwanense (NCBI参照: NC_021846.1); Streptococcus iniae (NCBI参照: NC_021314.1); Belliella baltica (NCBI参照: NC_018010.1); Psychroflexus torquisI (NCBI参照: NC_018721.1); Streptococcus thermophilus (NCBI参照: YP_820832.1), Listeria innocua (NCBI参照: NP_472073.1), Campylobacter jejuni (NCBI参照: YP_002344900.1) もしくは Neisseria meningitidis (NCBI参照: YP_002342100.1) 由来のCas9を表し、または任意の他の生物由来のCas9を表す。
【0203】
追加的なCas9タンパク質(例えば、ヌクレアーゼ不活性(dead)Cas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性Cas9)は、そのバリアントおよびホモログを含めて、本開示の範囲内にあることを理解されたい。例示的なCas9タンパク質は、限定されるものではないが、以下に提供されるものを含む。いくつかの実施形態では、Cas9タンパク質はヌクレアーゼ活性Cas9である。いくつかの実施形態では、Cas9タンパク質は、ヌクレアーゼ不活性Cas9 (dCas9) である。いくつかの実施形態では、Cas9タンパク質は、Cas9ニッカーゼ (nCas9) である。
【0204】
いくつかの実施形態では、Cas9ドメインは、ヌクレアーゼ不活性Cas9ドメイン (dCas9) である。例えば、dCas9ドメインは、二本鎖核酸分子のいずれの鎖も切断することなく、二本鎖核酸分子に結合し得る(例えば、gRNA分子を介して)。ヌクレアーゼ不活性化Cas9タンパク質は、交換可能に「dCas9」タンパク質(nuclease-“dead” Cas9の意)または触媒的に不活性なCas9とも称され得る。不活性なDNA切断ドメインを有するCas9タンパク質(またはその断片)を生成する方法は公知である(例えばJinek et al, Science. 337:816-821(2012); Qi et al, “Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression” (2013) Cell. 28; 152(5): 1173-83を参照のこと (各内容は参照により本明細書に組み込まれる))。例えば、Cas9のDNA切断ドメインは、HNHヌクレアーゼサブドメインとRuvC1サブドメインという2つのサブドメインを含むことが知られている。HNHサブドメインはgRNAの相補鎖を切断し、RuvC1サブドメインは非相補鎖を切断する。これらのサブドメイン内の突然変異はCas9のヌクレアーゼ活性を抑制し得る。例えば、突然変異D10AおよびH840Aは、S. pyogenes Cas9 のヌクレアーゼ活性を完全に不活性化する(Jinek et al, Science. 337:816-821(2012); Qi et al, Cell. 28;152(5): 1173-83 (2013))。
【0205】
いくつかの実施形態では、dCas9は、Cas9ヌクレアーゼ活性を不活化する1つ以上の突然変異を有するCas9アミノ酸配列に対応するか、またはその一部もしくは全体を含む。いくつかの実施形態では、ヌクレアーゼ不活性dCas9ドメインは、本明細書に記載のアミノ酸配列のD10X突然変異およびH840X突然変異、または本明細書に提供されたアミノ酸配列のいずれかにおける対応する突然変異を含み、Xは任意のアミノ酸変化である。いくつかの実施形態では、ヌクレアーゼ不活性dCas9ドメインは、本明細書に示されたアミノ酸配列のD10A突然変異およびH840A突然変異、または本明細書に提供されたアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態では、ヌクレアーゼ不活性Cas9ドメインは、クローニングベクターpPlatTET-gRNA 2 (寄託番号BAV54124)中に示されるアミノ酸配列を含む。いくつかの実施形態では、dCas9はdCas9(D10AおよびH840A)のアミノ酸配列を含む:
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
【0206】
いくつかの実施形態では、例示的な、触媒的に不活性なCas9 (dCas9) のアミノ酸配列は、以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
(例えばQi et al., “Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression.” Cell. 2013; 152(5):1173-83を参照のこと(その内容全体が参照により本明細書に組み入れられる))。
【0207】
いくつかの実施形態では、例示的な、触媒的に不活性なCas9 (dCas9) のアミノ酸配列は、以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0208】
いくつかの実施形態では、Cas9ドメインはD10A突然変異を含み、一方、上記で提供したアミノ酸配列における840位の残基、または本明細書で提供されるアミノ酸配列のいずれかにおける対応する位の残基は、ヒスチジンのままである。他の実施形態では、例えばヌクレアーゼ不活化Cas9 (dCas9) を生じる、D10AおよびH840A以外の突然変異を有するdCas9バリアントが提供される。このような突然変異は、例えば、D10およびH840での他のアミノ酸置換、またはCas9のヌクレアーゼドメイン内の他の置換(例えば、HNHヌクレアーゼサブドメインおよび/またはRuvC1サブドメインにおける置換)を含む。いくつかの実施形態では、dCas9のバリアントまたはホモログであって、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一であるものが提供される。いくつかの実施形態では、約5アミノ酸、約10アミノ酸、約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ酸、約50アミノ酸、約75アミノ酸、約100アミノ酸またはそれ以上短いまたは長いアミノ酸配列を有するdCas9のバリアントが提供される。
【0209】
追加の適切なヌクレアーゼ不活性dCas9ドメインは、本開示および当技術分野における知識に基づいて当業者には明らかであろうし、本開示の範囲内である。こうした追加の例示的で適切なヌクレアーゼ不活性Cas9ドメインには、限定なしに、D10A/H840A、D10A/D839A/H840A、およびD10A/D839A/H840A/N863A 突然変異体ドメインが含まれる(例えば、Prashant et al., CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nature Biotechnology. 2013; 31(9): 833-838を参照のこと(該文献の全内容は参照により本明細書に組み込まれる))。
【0210】
いくつかの実施形態では、Cas9ヌクレアーゼは、不活性な(例えば不活化された) DNA切断ドメインを有し、すなわち、Cas9は、「nCas9」タンパク質(「nickase」Cas9の意)と呼ばれるニッカーゼである。いくつかの実施形態では、Cas9ドメインは、Cas9ニッカーゼである。Cas9ニッカーゼは、二本鎖核酸分子(例えば二本鎖DNA分子)の一方の鎖のみを切断することができるCas9タンパク質であり得る。いくつかの実施形態では、Cas9ニッカーゼは、二本鎖核酸分子の標的鎖を切断し、これは、Cas9ニッカーゼが、Cas9に結合しているgRNA(例えばsgRNA)と塩基対を形成している(相補的である)鎖を切断することを意味する。いくつかの実施形態では、Cas9ニッカーゼは、D10A突然変異を含み、840位にヒスチジンを有する。いくつかの実施形態では、Cas9ニッカーゼは、二本鎖核酸分子の非標的、非塩基編集鎖を切断し、これは、Cas9ニッカーゼが、Cas9に結合しているgRNA(例えばsgRNA)と塩基対を形成していない鎖を切断することを意味する。いくつかの実施形態では、Cas9ニッカーゼは、H840A突然変異を含み、10位にアスパラギン酸残基を有するか、または対応する突然変異を有する。いくつかの実施形態では、Cas9ニッカーゼは、本明細書に提供されるCas9ニッカーゼのいずれか1つと少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。追加の適切なCas9ニッカーゼは、本開示および当分野における知識に基づいて当業者に明らかであり、本開示の範囲内である。
【0211】
例示的な触媒的Cas9ニッカーゼ (nCas9) のアミノ酸配列は、以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0212】
いくつかの実施形態では、Cas9は、単細胞原核微生物のドメインおよび界を構成する古細菌(例えばナノアーキア)由来のCas9を指す。いくつかの実施形態では、核酸プログラム可能DNA結合タンパク質は、例えば、Burstein et al., "New CRISPR-Cas systems from uncultivated microbes." Cell Res. 2017 Feb 21. doi: 10.1038/cr.2017.21に記載されているCasXまたはCasYタンパク質であってもよく、その全体の内容は参照により本明細書に組み込まれる。ゲノム分解メタゲノミクスを用いて、生命の古細菌ドメインにおいて最初に報告されたCas9を含め、多くのCRISPR-Casシステムが同定された。この多様なCas9タンパク質は、ほとんど研究されていないナノアーキアにおいて、活性CRISPR-Casシステムの一部として発見された。細菌では、それまで知られていなかった2つのシステム、CRISPR-CasXとCRISPR-CasYが発見され、それらは、これまでに発見された中でも最もコンパクトなシステムに入る。いくつかの実施形態では、本明細書に記載される塩基エディターシステムにおいて、Cas9は、CasXまたはCasXのバリアントによって置き換えられる。いくつかの実施形態では、本明細書に記載される塩基エディターシステムにおいて、Cas9は、CasYまたはCasYのバリアントによって置き換えられる。核酸プログラム可能DNA結合タンパク質 (napDNAbp) として他のRNA誘導型DNA結合タンパク質を用いてもよく、これらが本開示の範囲内であることが理解されるべきである。
【0213】
いくつかの実施形態では、本明細書で提供される融合タンパク質のいずれかの核酸プログラム可能DNA結合タンパク質 (napDNAbp) は、CasXまたはCasYタンパク質であり得る。いくつかの実施形態では、napDNAbpはCasXタンパク質である。いくつかの実施形態では、napDNAbpはCasYタンパク質である。いくつかの実施形態では、napDNAbpは、天然に存在するCasXまたはCasYタンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、napDNAbpは、天然に存在するCasXまたはCasYタンパク質である。いくつかの実施形態では、napDNAbpは、本明細書に記載されるいずれかのCasXまたはCasYタンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。他の細菌種由来のCasXおよびCasYもまた、本開示に従って使用され得ることが理解されるべきである。
【0214】
例示的なCasX ((uniprot.org/uniprot/F0NN87; uniprot.org/uniprot/F0NH53) tr|F0NN87|F0NN87_SULIHCRISPR会合Casxタンパク質 OS = Sulfolobus islandicus (HVE10/4株) GN = SiH_0402 PE=4 SV=1) のアミノ酸配列は以下の通りである:
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYEFGRSPGMVERTRRVKLEVEPHYLIIAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVRIYTISDAVGQNPTTINGGFSIDLTKLLEKRYLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTG SKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG
【0215】
例示的なCasX (>tr|F0NH53|F0NH53_SULIR CRISPR会合タンパク質, Casx OS = Sulfolobus islandicus (REY15A株) GN=SiRe_0771 PE=4 SV=1) のアミノ酸配列は以下の通りである:
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYKFGRSPGMVERTRRVKLEVEPHYLIMAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVSIYTISDAVGQNPTTINGGFSIDLTKLLEKRDLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTGSKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG
【0216】
Deltaproteobacteria CasX
MEKRINKIRKKLSADNATKPVSRSGPMKTLLVRVMTDDLKKRLEKRRKKPEVMPQVISNNAANNLRMLLDDYTKMKEAILQVYWQEFKDDHVGLMCKFAQPASKKIDQNKLKPEMDEKGNLTTAGFACSQCGQPLFVYKLEQVSEKGKAYTNYFGRCNVAEHEKLILLAQLKPVKDSDEAVTYSLGKFGQRALDFYSIHVTKESTHPVKPLAQIAGNRYASGPVGKALSDACMGTIASFLSKYQDIIIEHQKVVKGNQKRLESLRELAGKENLEYPSVTLPPQPHTKEGVDfAYNEVIARVRMWVNLNLWQKLKLSRDDAKPLLRLKGFPSFPVVERRENEVDWWNTINEVKKLIDAKRDMGRVFWSGVTAEKRNTILEGYNYLPNENDHKKREGSLENPKKPAKRQFGDLLLYLEKKYAGDWGKVFDEAWERIDKKIAGLTSHIEREEARNAEDAQSKAVLTDWLRAKASFVLERLKEMDEKEFYACEIQLQKWYGDLRGNPFAVEAENRVVDISGFSIGSDGHSIQYRNLLAWKYLENGKREFYLLMNYGKKGRIRFTDGTDIKKSGKWQGLLYGGGKAKVIDLTFDPDDEQLIILPLAFGTRQGREFIWNDLLSLETGLIKLANGRVIEKTIYNKKIGRDEPALFVALTFERREVVDPSNIKPVNLIGVARGENIPAVIALTDPEGCPLPEFKDSSGGPTDILRIGEGYKEKQRAIQAAKEVEQRRAGGYSRKFASKSRNLADDMVRNSARDLFYHAVTHDAVLVFANLSRGFGRQGKRTFMTERQYTKMEDWLTAKLAYEGLTSKTYLSKTLAQYTSKTCSNCGFTITYADMDVMLVRLKKTSDGWATTLNNKELKAEYQITYYNRYKRQTVEKELSAELDRLSEESGNNDISKWTKGRRDEALFLLKKRFSHRPVQEQFVCLDCGHEVHAAEQAALNIARSWLFLNSNSTEFKSYKSGKQPFVGAWQAFYKRRLKEVWKPNA
【0217】
例示的なCasY ((ncbi.nlm.nih.gov/protein/APG80656.1) >APG80656.1 CRISPR会合タンパク質 CasY [未培養Parcubacteria 群細菌]) のアミノ酸配列は以下の通りである:
MSKRHPRISGVKGYRLHAQRLEYTGKSGAMRTIKYPLYSSPSGGRTVPREIVSAINDDYVGLYGLSNFDDLYNAEKRNEEKVYSVLDFWYDCVQYGAVFSYTAPGLLKNVAEVRGGSYELTKTLKGSHLYDELQIDKVIKFLNKKEISRANGSLDKLKKDIIDCFKAEYRERHKDQCNKLADDIKNAKKDAGASLGERQKKLFRDFFGISEQSENDKPSFTNPLNLTCCLLPFDTVNNNRNRGEVLFNKLKEYAQKLDKNEGSLEMWEYIGIGNSGTAFSNFLGEGFLGRLRENKITELKKAMMDITDAWRGQEQEEELEKRLRILAALTIKLREPKFDNHWGGYRSDINGKLSSWLQNYINQTVKIKEDLKGHKKDLKKAKEMINRFGESDTKEEAVVSSLLESIEKIVPDDSADDEKPDIPAIAIYRRFLSDGRLTLNRFVQREDVQEALIKERLEAEKKKKPKKRKKKSDAEDEKETIDFKELFPHLAKPLKLVPNFYGDSKRELYKKYKNAAIYTDALWKAVEKIYKSAFSSSLKNSFFDTDFDKDFFIKRLQKIFSVYRRFNTDKWKPIVKNSFAPYCDIVSLAENEVLYKPKQSRSRKSAAIDKNRVRLPSTENIAKAGIALARELSVAGFDWKDLLKKEEHEEYIDLIELHKTALALLLAVTETQLDISALDFVENGTVKDFMKTRDGNLVLEGRFLEMFSQSIVFSELRGLAGLMSRKEFITRSAIQTMNGKQAELLYIPHEFQSAKITTPKEMSRAFLDLAPAEFATSLEPESLSEKSLLKLKQMRYYPHYFGYELTRTGQGIDGGVAENALRLEKSPVKKREIKCKQYKTLGRGQNKIVLYVRSSYYQTQFLEWFLHRPKNVQTDVAVSGSFLIDEKKVKTRWNYDALTVALEPVSGSERVFVSQPFTIFPEKSAEEEGQRYLGIDIGEYGIAYTALEITGDSAKILDQNFISDPQLKTLREEVKGLKLDQRRGTFAMPSTKIARIRESLVHSLRNRIHHLALKHKAKIVYELEVSRFEEGKQKIKKVYATLKKADVYSEIDADKNLQTTVWGKLAVASEISASYTSQFCGACKKLWRAEMQVDETITTQELIGTVRVIKGGTLIDAIKDFMRPPIFDENDTPFPKYRDFCDKHHISKKMRGNSCLFICPFCRANADADIQASQTIALLRYVKEEKKVEDYFERFRKLKNIKVLGQMKKI
【0218】
Cas9ヌクレアーゼはRuvCとHNHという2つの機能性エンドヌクレアーゼドメインを有する。Cas9は標的に結合するとコンホメーション変化を起こし、これがヌクレアーゼドメインを位置付け、標的DNAの反対側の鎖を切断させる。Cas9を介したDNA切断の最終結果は、標的DNA内の二本鎖切断 (DSB) である(PAM配列の約3~4ヌクレオチド上流)。次いで、生じたDSBは、次の2つの一般的修復経路のうちの1つにより修復される: (1) 効率的だが誤りがちな非相同末端結合 (NHEJ) 経路;または (2) 効率は低いが忠実度の高い相同性指向性修復 (HDR) 経路。
【0219】
非相同末端結合 (NHEJ) および/または相同性指向性修復 (HDR) の「効率」は、任意の簡便な方法によって計算することができる。例えば、効率は、成功したHDRのパーセンテージで表すことができる。例えば、検査用(suveyor)ヌクレアーゼアッセイを用いて切断産物を生成し、基質に対する産物の比を用いてパーセンテージを計算することができる。例えば、HDRが成功した結果として新たに組み込まれた制限配列を含有するDNAを直接切断する検査用ヌクレアーゼ酵素を使用することができる。切断される基質が多いほどHDRの割合が高い(HDRの効率がより高い)ことを示す。例示的な例として、HDRの割合 (パーセンテージ) は、以下の式を用いて計算することができる[(切断産物)/(基質+切断産物)] (例えば、 (b+c) / (a+b+c) ここで、「a」はDNA基質のバンド強度であり、「b」および「c」は切断産物である)。
【0220】
いくつかの実施形態では、効率はNHEJの成功率で表すことができる。例えば、T7エンドヌクレアーゼIアッセイを用いて切断産物を生成し、基質に対する産物の比を用いてNHEJのパーセンテージを計算することができる。T7エンドヌクレアーゼIは、野生型および突然変異体DNA鎖(NHEJは最初の切断部位に小さなランダムな挿入(insertion)や欠失(deletion)(インデル:indel)を生じる)のハイブリダイゼーションから生じるミスマッチのヘテロ二本鎖DNAを切断する。切断が多いほどNHEJの割合が高いこと(NHEJの効率が高いこと)を示す。例示的な例として、NHEJの割合 (パーセンテージ) は、式 (1-(1-(b+c)/(a+b+c))1/2) ×100を用いて計算することができ、ここで、「a」はDNA基質のバンド強度であり、「b」および「c」は切断産物である(Ran et. al., Cell. 2013 Sep. 12; 154(6):1380-9; およびRan et al., Nat Protoc. 2013 Nov.; 8(11): 2281-2308)。
【0221】
NHEJ修復経路は最も活性な修復機構であり、DSB部位での小分子ヌクレオチド挿入または欠失 (インデル) を頻繁に引き起こす。NHEJ仲介DSB修復のランダム性は、Cas9およびgRNAまたはガイドポリヌクレオチドを発現する細胞集団が多様な突然変異のアレイをもたらし得るため、重要な実際的意味を有する。いくつかの実施形態では、NHEJは標的DNAに小さなインデルを生じさせ、その結果、標的遺伝子のオープンリーディングフレーム (ORF) 内に未熟な終止コドンをもたらすアミノ酸欠失、挿入、またはフレームシフト突然変異が生じる。理想的な最終結果は、標的遺伝子内の機能喪失型突然変異である。
【0222】
NHEJ仲介DSB修復はしばしば遺伝子のオープンリーディングフレームを破壊するが、相同性指向性修復 (HDR) は単一ヌクレオチド変化からフルオロフォアまたはタグの付加のような大きな挿入までの範囲の特異的ヌクレオチド変化を生成するために使用できる。
【0223】
HDRを遺伝子編集に利用するために、所望の配列を含有するDNA修復テンプレートを、gRNA(複数可)およびCas9またはCas9ニッカーゼとともに関心対象の細胞タイプに送達することができる。修復テンプレートは、所望の編集ならびにその標的のすぐ上流および下流(左右相同アームと呼ばれる)に追加の相同配列を含有することができる。各相同アームの長さは導入される変化の大きさに依存する可能性があり、より大きな挿入はより長い相同アームを必要とする。修復テンプレートは、一本鎖オリゴヌクレオチド、二本鎖オリゴヌクレオチド、または二本鎖DNAプラスミドであり得る。HDRの効率は、Cas9、gRNAおよび外因性修復テンプレートを発現する細胞においても、一般的に低い(10%未満の修正アレル)。HDRは細胞周期のS期とG2期の間に起こるため、細胞を同調させることによってHDRの効率を高めることができる。NHEJに関与する遺伝子を化学的または遺伝的に阻害することもHDR頻度を増加させ得る。
【0224】
いくつかの実施形態では、Cas9は改変Cas9である。所定のgRNA標的化配列は、ゲノム全体にわたり、部分的な相同性が存在する追加の部位を有し得る。これらの部位はオフターゲットと呼ばれ、gRNAを設計する際に考慮する必要がある。gRNAの設計を最適化することに加えて、Cas9を改変することによってCRISPRの特異性を高めることもできる。Cas9は2つのヌクレアーゼドメイン、RuvCおよびHNHの組み合わせ活性を介して二本鎖切断 (DSB) を生成する。SpCas9のD10A突然変異体であるCas9ニッカーゼは1つのヌクレアーゼドメインを保持し、DSBではなくDNAニックを生成する。特異的遺伝子編集のためのHDR仲介遺伝子編集にニッカーゼシステムを組み合わせることもできる。
【0225】
いくつかの実施形態では、Cas9はバリアントCas9タンパク質である。バリアントCas9ポリペプチドは、野生型Cas9タンパク質のアミノ酸配列と比較して、一アミノ酸単位で異なる(例えば、欠失、挿入、置換、融合を有する)アミノ酸配列を有する。いくつかの例において、バリアントCas9ポリペプチドは、Cas9ポリペプチドのヌクレアーゼ活性を低下させるアミノ酸変化(例えば欠失、挿入、または置換)を有する。例えば、いくつかの例において、バリアントCas9ポリペプチドは、対応する野生型Cas9タンパク質のヌクレアーゼ活性の50%未満、40%未満、30%未満、20%未満、10%未満、5%未満、または1%未満を有する。いくつかの実施形態では、バリアントCas9タンパク質は実質的なヌクレアーゼ活性を持たない。対象Cas9タンパク質が、実質的なヌクレアーゼ活性を持たないバリアントCas9タンパク質である場合、それは「dCas9」と称され得る。
【0226】
いくつかの実施形態では、バリアントCas9タンパク質は減少したヌクレアーゼ活性を有する。例えば、バリアントCas9タンパク質は、野生型Cas9タンパク質、例えば野生型Cas9タンパク質のエンドヌクレアーゼ活性の約20%未満、約15%未満、約10%未満、約5%未満、約1%未満、または約0.1%未満を示す。
【0227】
いくつかの実施形態では、バリアントCas9タンパク質は、ガイド標的配列の相補鎖を切断することができるが、二本鎖ガイド標的配列の非相補鎖を切断する能力が低下している。例えば、バリアントCas9タンパク質は、RuvCドメインの機能を低下させる突然変異(アミノ酸置換)を有することができる。非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、D10A (アミノ酸10位におけるアスパラギン酸からアラニン)を有し、従って、二本鎖ガイド標的配列の相補鎖を切断することができるが、二本鎖ガイド標的配列の非相補鎖を切断する能力が低下している(従って、このバリアントCas9タンパク質が二本鎖標的核酸を切断する際、二本鎖切断 (DSB) の代わりに一本鎖切断 (SSB) を生じる) (例えばJinek et al., Science. 2012 Aug. 17; 337(6096):816-21を参照のこと)。
【0228】
いくつかの実施形態では、バリアントCas9タンパク質は、二本鎖ガイド標的配列の非相補鎖を切断することができるが、ガイド標的配列の相補鎖を切断する能力が低下している。例えば、バリアントCas9タンパク質は、HNHドメインの機能を低下させる突然変異(アミノ酸置換)を有することができる(RuvC/HNH/RuvCドメインモチーフ)。非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、H840A (アミノ酸840位におけるヒスチジンからアラニン)突然変異を有し、従って、ガイド標的配列の非相補鎖を切断することができるが、ガイド標的配列の相補鎖を切断する能力が低下している(従って、このバリアントCas9タンパク質が二本鎖ガイド標的配列を切断すると、DSBの代わりにSSBが生じる)。このようなCas9タンパク質は、ガイド標的配列(例えば一本鎖ガイド標的配列)を切断する能力が低下しているが、ガイド標的配列(例えば一本鎖ガイド標的配列)に結合する能力を保持している。
【0229】
いくつかの実施形態では、バリアントCas9タンパク質は、二本鎖標的DNAの相補鎖および非相補鎖の両方を切断する能力が低下している。非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、D10AおよびH840A突然変異の両方を宿し、その結果、ポリペプチドは、二本鎖標的DNAの相補鎖および非相補鎖の両方を切断する能力が低下している。このようなCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力は保持している。
【0230】
別の非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、W476AおよびW1126A突然変異を宿し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。こうしたCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力を保持している。
【0231】
別の非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、P475A、W476A、N477A、D1125A、W1126A、およびD1127A突然変異を宿し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力を保持している。
【0232】
別の非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、H840A、W476A、およびW1126A突然変異を宿し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。こうしたCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力を保持している。別の非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、H840A、D10A、W476A、およびW1126A突然変異を宿し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。このようなCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力を保持している。いくつかの実施形態では、バリアントCas9は、Cas9 HNHドメインの840位で触媒的His残基が回復されている(A840H)。
【0233】
別の非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1127A突然変異を宿し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。こうしたCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力を保持する。別の非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、D10A、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1127A突然変異を宿し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力を保持している。いくつかの実施形態では、バリアントCas9タンパク質がW476AおよびW1126A突然変異を宿する場合、またはバリアントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、およびD1127A突然変異を宿する場合、バリアントCas9タンパク質はPAM配列に効率的に結合しない。従って、このようないくつかの場合には、このようなバリアントCas9タンパク質を結合法に用いる際、この方法はPAM配列を必要としない。換言すれば、いくつかの実施形態では、このようなバリアントCas9タンパク質を結合法に用いる際、この方法はガイドRNAを含み得るが、この方法は、PAM配列の非存在下で行うことができる(従って、結合の特異性はガイドRNAの標的セグメントによってもたらされる)。上記の効果を達成するために、他の残基を突然変異させ得る(すなわち一方または他方のヌクレアーゼ部分を不活性化する)。非限定的な例として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、および/またはA987を改変(すなわち置換)することができる。また、アラニン置換以外の突然変異も好適である。
【0234】
いくつかの実施形態では、低下した触媒活性を有するバリアントCas9タンパク質(例えばCas9タンパク質がD10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、および/またはA987突然変異、例えばD10A、G12A、G17A、E762A、H840A、N854A、N863A、H982A、H983A、A984A、および/またはD986Aを有する場合)は、それがガイドRNAと相互作用する能力を保持する限り、部位特異的様式で標的DNAになお結合することができる(ガイドRNAによって標的DNA配列になお誘導されるため)。
【0235】
いくつかの実施形態では、バリアントCasタンパク質はspCas9、spCas9-VRQR、spCas9-VRER、xCas9 (sp)、saCas9、saCas9-KKH、spCas9-MQKSER、spCas9-LRKIQK、またはspCas9-LRVSQLであり得る。
【0236】
いくつかの実施形態では、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337Rを含み、改変PAM 5'-NGC-3'に対する特異性を有する修飾SpCas9 (SpCas9-MQKFRAER)を用いた。
【0237】
S. pyogenes Cas9の代替には、哺乳動物細胞において切断活性を示すCpf1ファミリー由来のRNA誘導型エンドヌクレアーゼが含まれてもよい。PrevotellaおよびFrancisella 1由来のCRISPR (CRISPR/Cpf1) は、CRISPR/Cas9システムに類似したDNA編集技術である。Cpf1はクラスII CRISPR/CasシステムのRNA誘導型エンドヌクレアーゼである。この適応免疫機構はPrevotellaやFrancisella細菌に見られる。Cpf1遺伝子はCRISPR遺伝子座に関連しており、ウイルスDNAを見出して切断するためにガイドRNAを用いるエンドヌクレアーゼをコードしている。Cpf1はCas9より小さく単純なエンドヌクレアーゼであり、CRISPR/Cas9システムの制限のいくつかを克服する。Cas9ヌクレアーゼとは異なり、Cpf1を介したDNA切断の結果は、短い3'オーバーハングを伴う二本鎖切断である。Cpf1のねじれ型(staggered)の切断パターンは、伝統的な制限酵素クローニングに類似した、方向性のある遺伝子導入の可能性を開くことができ、これは遺伝子編集の効率を高め得る。上述したCas9のバリアントおよびオルソログと同様に、Cpf1は、CRISPRが標的とすることができる部位の数を、SpCas9が好むNGG PAM部位を欠くATリッチ領域またはATリッチゲノムに拡大することもできる。Cpf1遺伝子座はアルファ/ベータ混合ドメイン、RuvC‐Iとそれに続くらせん領域、RuvC‐IIおよびジンクフィンガー様ドメインを含む。Cpf1タンパク質は、Cas9のRuvCドメインに類似したRuvC様エンドヌクレアーゼドメインを有する。
【0238】
さらに、Cpf1は、Cas9とは異なり、HNHエンドヌクレアーゼドメインを持たず、Cpf1のN末端はCas9のアルファらせん認識ローブを持たない。Cpf1 CRISPR-Casドメイン構成は、Cpf1が機能的にユニークであり、クラス2、V型 CRISPRシステムとして分類されることを示した。Cpf1遺伝子座は、II型システムよりもI型およびIII型により類似したCas1、Cas2およびCas4タンパク質をコードしていた。機能的Cpf1はトランス活性化CRISPR RNA (tracrRNA) を必要とせず、従って、CRISPR (crRNA) だけを要する。Cpf1はCas9より小さいだけでなく、より小さいsgRNA分子(Cas9の約半分の数のヌクレオチド)を有するため、これはゲノム編集に有益である。Cas9が標的とするGリッチPAMとは対照的に、Cpf1-crRNA複合体は、プロトスペーサー隣接モチーフ5'-YTN-3'または5'-TTN-3'の同定によって標的DNAまたはRNAを切断する。PAMの同定後、Cpf1は、4または5ヌクレオチドのオーバーハングを有する付着(sticky)末端様のDNA二本鎖切断を導入する。
【0239】
いくつかの実施形態では、Cas9は、改変PAM配列に対する特異性を有するCas9バリアントである。いくつかの実施形態では、追加のCas9バリアントおよびPAM配列は、Miller et al., Continuous evolution of SpCas9 variants compatible with non-G PAMs. Nat Biotechnol (2020). doi.org/10.1038/s41587-020-0412-8に記載され、その全内容は参照により本明細書に組み込まれる。いくつかの実施形態では、Cas9バリアントは特定のPAM要件を持たない。いくつかの実施形態では、Cas9バリアント、例えばSpCas9バリアントは、NRNH PAMに対する特異性を有し、RはAまたはGであり、HはA、C、またはTである。いくつかの実施形態では、SpCas9バリアントは、PAM配列AAA、TAA、CAA、GAA、TAT、GAT、またはCACに対する特異性を有する。いくつかの実施形態では、SpCas9バリアントは、配列番号1に対して番号付けされるような、1114、1134、1135、1137、1139、1151、1180、1188、1211、1218、1219、1221、1249、1256、1264、1290、1318、1317、1320、1321、1323、1332、1333、1335、1337、または1339位、あるいはその対応する位でアミノ酸置換を含む。いくつかの実施形態では、SpCas9バリアントは、配列番号1に対して番号付けされるような、1114、1135、1218、1219、1221、1249、1320、1321、1323、1332、1333、1335、または1337位、あるいはその対応する位のアミノ酸置換を含む。いくつかの実施形態では、SpCas9バリアントは、配列番号1に対して番号付けされるような、1114、1134、1135、1137、1139、1151、1180、1188、1211、1219、1221、1256、1264、1290、1318、1317、1320、1323、1333位、あるいはその対応する位のアミノ酸置換を含む。いくつかの実施形態では、SpCas9バリアントは、配列番号1に対して番号付けされるような、1114、1131、1135、1150、1156、1180、1191、1218、1219、1221、1227、1249、1253、1286、1293、1320、1321、1332、1335、1339位、あるいはその対応する位のアミノ酸置換を含む。いくつかの実施形態では、SpCas9バリアントは、配列番号1に対して番号付けされるような、1114、1127、1135、1180、1207、1219、1234、1286、1301、1332、1335、1337、1338、1349位のアミノ酸置換を含む。SpCas9バリアントの例示的なアミノ酸置換およびPAM特異性を、表1A~1Dに示す。
【0240】
【表1-1】
【0241】
【表1-2】
【0242】
【表1-3】
【0243】
【表1-4】
【0244】
いくつかの実施形態では、Cas9はNeisseria meningitidis Cas9(NmeCas9)またはそのバリアントである。いくつかの実施形態では、NmeCas9は、NNNNGAYW PAMに対する特異性を有し、YはCまたはTであり、WはAまたはTである。いくつかの実施形態では、NmeCas9はNNNNGYTT PAMに対する特異性を有し、YはCまたはTである。いくつかの実施形態では、NmeCas9はNNNNGTCT PAMに対する特異性を有する。いくつかの実施形態では、NmeCas9はNme1 Cas9である。いくつかの実施形態では、NmeCas9は、NNNNGATT PAM、NNNNCCTA PAM、NNNNCCTC PAM、NNNNCCTT PAM、NNNNCCTG PAM、NNNNCCGT PAM、NNNNCCGGPAM、NNNNCCCA PAM、NNNNCCCT PAM、NNNNCCCC PAM、NNNNCCAT PAM、NNNNCCAG PAM、NNNNCCAT PAM、またはNNNGATT PAMに対する特異性を有する。いくつかの実施形態では、Nme1Cas9は、NNNNGATT PAM、NNNNCCTA PAM、NNNNCCTC PAM、NNNNCCTT PAM、またはNNNNCCTG PAMに対する特異性を有する。いくつかの実施形態では、NmeCas9はCAA PAM、CAAA PAM、またはCCA PAMに対する特異性を有する。いくつかの実施形態では、NmeCas9はNme2 Cas9である。いくつかの実施形態では、NmeCas9は、NNNNCC (N4CC) PAMに対する特異性を有し、NはA、G、C、またはTのいずれか1つである。いくつかの実施形態では、NmeCas9は、NNNNCCGT PAM、NNNNCCGGPAM、NNNNCCCA PAM、NNNNCCCT PAM、NNNNCCCC PAM、NNNNCCAT PAM、NNNNCCAG PAM、NNNNCCAT PAM、またはNNNGATT PAMに対する特異性を有する。いくつかの実施形態では、NmeCas9はNme3Cas9である。いくつかの実施形態では、NmeCas9は、NNNNCAAA PAM、NNNNCC PAM、またはNNNNCNNN PAMに対する特異性を有する。さらなるNmeCas9の特徴およびPAM配列は、Edraki et al., A Compact, High-Accuracy Cas9 with a Dinucleotide PAM for In Vivo Genome Editing, Mol. Cell. (2019) 73(4): 714-726に記載され、該文献はその全体が参照により本明細書に組み込まれる。
【0245】
Nme1Cas9の例示的なアミノ酸配列を以下に提供する:
II型CRISPR RNA誘導型エンドヌクレアーゼCas9 [Neisseria meningitidis] WP_002235162.1
1 maafkpnpin yilgldigia svgwamveid edenpiclid lgvrvferae vpktgdslam
61 arrlarsvrr ltrrrahrll rarrllkreg vlqaadfden glikslpntp wqlraaaldr
121 kltplewsav llhlikhrgy lsqrkneget adkelgallk gvadnahalq tgdfrtpael
181 alnkfekesg hirnqrgdys htfsrkdlqa elillfekqk efgnphvsgg lkegietllm
241 tqrpalsgda vqkmlghctf epaepkaakn tytaerfiwl tklnnlrile qgserpltdt
301 eratlmdepy rkskltyaqa rkllgledta ffkglrygkd naeastlmem kayhaisral
361 ekeglkdkks plnlspelqd eigtafslfk tdeditgrlk driqpeilea llkhisfdkf
421 vqislkalrr ivplmeqgkr ydeacaeiyg dhygkkntee kiylppipad eirnpvvlra
481 lsqarkving vvrrygspar ihietarevg ksfkdrkeie krqeenrkdr ekaaakfrey
541 fpnfvgepks kdilklrlye qqhgkclysg keinlgrlne kgyveidhal pfsrtwddsf
601 nnkvlvlgse nqnkgnqtpy eyfngkdnsr ewqefkarve tsrfprskkq rillqkfded
661 gfkernlndt ryvnrflcqf vadrmrltgk gkkrvfasng qitnllrgfw glrkvraend
721 rhhaldavvv acstvamqqk itrfvrykem nafdgktidk etgevlhqkt hfpqpweffa
781 qevmirvfgk pdgkpefeea dtpeklrtll aeklssrpea vheyvtplfv srapnrkmsg
841 qghmetvksa krldegvsvl rvpltqlklk dlekmvnrer epklyealka rleahkddpa
901 kafaepfyky dkagnrtqqv kavrveqvqk tgvwvrnhng iadnatmvrv dvfekgdkyy
961 lvpiyswqva kgilpdravv qgkdeedwql iddsfnfkfs lhpndlvevi tkkarmfgyf
1021 aschrgtgni nirihdldhk igkngilegi gvktalsfqk yqidelgkei rpcrlkkrpp
1081 vr
【0246】
Nme2Cas9の例示的なアミノ酸配列を以下に提供する:
II型CRISPR RNA誘導型エンドヌクレアーゼCas9 [Neisseria meningitidis] WP_002230835.1
1 maafkpnpin yilgldigia svgwamveid eeenpirlid lgvrvferae vpktgdslam
61 arrlarsvrr ltrrrahrll rarrllkreg vlqaadfden glikslpntp wqlraaaldr
121 kltplewsav llhlikhrgy lsqrkneget adkelgallk gvannahalq tgdfrtpael
181 alnkfekesg hirnqrgdys htfsrkdlqa elillfekqk efgnphvsgg lkegietllm
241 tqrpalsgda vqkmlghctf epaepkaakn tytaerfiwl tklnnlrile qgserpltdt
301 eratlmdepy rkskltyaqa rkllgledta ffkglrygkd naeastlmem kayhaisral
361 ekeglkdkks plnlsselqd eigtafslfk tdeditgrlk drvqpeilea llkhisfdkf
421 vqislkalrr ivplmeqgkr ydeacaeiyg dhygkkntee kiylppipad eirnpvvlra
481 lsqarkving vvrrygspar ihietarevg ksfkdrkeie krqeenrkdr ekaaakfrey
541 fpnfvgepks kdilklrlye qqhgkclysg keinlvrlne kgyveidhal pfsrtwddsf
601 nnkvlvlgse nqnkgnqtpy eyfngkdnsr ewqefkarve tsrfprskkq rillqkfded
661 gfkecnlndt ryvnrflcqf vadhilltgk gkrrvfasng qitnllrgfw glrkvraend
721 rhhaldavvv acstvamqqk itrfvrykem nafdgktidk etgkvlhqkt hfpqpweffa
781 qevmirvfgk pdgkpefeea dtpeklrtll aeklssrpea vheyvtplfv srapnrkmsg
841 ahkdtlrsak rfvkhnekis vkrvwlteik ladlenmvny kngreielye alkarleayg
901 gnakqafdpk dnpfykkggq lvkavrvekt qesgvllnkk naytiadngd mvrvdvfckv
961 dkkgknqyfi vpiyawqvae nilpdidckg yriddsytfc fslhkydlia fqkdekskve
1021 fayyincdss ngrfylawhd kgskeqqfri stqnlvliqk yqvnelgkei rpcrlkkrpp
1081 vr
【0247】
核酸塩基エディターのCas12ドメイン
典型的には、微生物CRISPR-Casシステムは、クラス1およびクラス2システムに分けられる。クラス1システムは、マルチサブユニットエフェクター複合体を有する一方、クラス2システムは単一のタンパク質エフェクターを有する。例えば、Cas9およびCpf1は、異なるタイプである(それぞれII型およびV型)にもかかわらず、クラス2エフェクターである。Cpf1に加えて、クラス2、V型CRISPR-Casシステムはまた、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12iもまた含む。例えば、Shmakov et al., “Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems,” Mol. Cell, 2015 Nov. 5; 60(3): 385-397; Makarova et al., “Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?” CRISPR Journal, 2018, 1(5): 325-336;およびYan et al., “Functionally Diverse Type V CRISPR-Cas Systems,” Science, 2019 Jan. 4; 363: 88-91を参照のこと(これらの文献は、その全体が参照により本明細書に組み込まれる)。V型Casタンパク質は、RuvC (またはRuvC様) エンドヌクレアーゼドメインを含有する。成熟CRISPR RNA (crRNA)の産生は、一般的に、tracrRNA独立であるが、例えば、Cas12b/C2c1は、crRNA の産生にtracrRNAを必要とする。Cas12b/C2c1は、DNA切断のため、crRNAおよびtracrRNAの両方に依存する。
【0248】
本開示で意図される核酸プログラム可能DNA結合タンパク質には、クラス2、V型と分類されるCasタンパク質(Cas12タンパク質)が含まれる。Casクラス2、V型タンパク質の限定されない例には、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12i、そのホモログまたは改変型が含まれる。本明細書で用いる際、Cas12 タンパク質はまた、Cas12ヌクレアーゼ、Cas12ドメイン、またはCas12タンパク質ドメインとも称され得る。いくつかの実施形態では、本開示のCas12タンパク質は、内部に融合したタンパク質ドメイン、例えばデアミナーゼドメインによって中断されるアミノ酸配列を含む。
【0249】
いくつかの実施形態では、Cas12ドメインは、ヌクレアーゼ不活性Cas12ドメインまたはCas12ニッカーゼである。いくつかの実施形態では、Cas12ドメインは、ヌクレアーゼ活性ドメインである。例えば、Cas12ドメインは、二本鎖核酸(例えば二本鎖DNA分子)の一方の鎖にニックを入れるCas12ドメインであり得る。いくつかの実施形態では、Cas12ドメインは、本明細書に記載のアミノ酸配列のいずれか1つを含む。いくつかの実施形態では、Cas12ドメインは、本明細書に記載されたアミノ酸配列のいずれか1つに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。いくつかの実施形態では、Cas12ドメインは、本明細書に記載されるアミノ酸配列のいずれか1つと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれより多い突然変異を有するアミノ酸配列を含む。いくつかの実施形態では、Cas12ドメインは、本明細書に記載されたアミノ酸配列のいずれか1つと比較して、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200の同一の連続したアミノ酸残基を有するアミノ酸配列を含む。
【0250】
いくつかの実施形態では、Cas12の断片を含むタンパク質が提供される。例えば、いくつかの実施形態では、タンパク質は、以下の2つのCas12ドメインのうちの1つを含む:(1) Cas12のgRNA結合ドメイン;または(2) Cas12のDNA切断ドメイン。いくつかの実施形態では、Cas12またはその断片を含むタンパク質は、「Cas12バリアント」と称される。Cas12バリアントは、Cas12またはその断片と相同性を共有する。例えば、Cas12バリアントは、野生型Cas12と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態では、Cas12バリアントは、野生型Cas12と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれより多くのアミノ酸変化を有し得る。いくつかの実施形態では、Cas12バリアントは、Cas12の断片 (例えばgRNA結合ドメインまたはDNA切断ドメイン)を含み、その断片は、野生型Cas12の対応する断片と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態では、断片は、対応する野生型Cas12のアミノ酸長の少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。いくつかの実施形態では、断片は、長さが少なくとも100アミノ酸である。いくつかの実施形態では、断片は、少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも 1300アミノ酸の長さである。
【0251】
いくつかの実施形態では、Cas12は、Cas12ヌクレアーゼ活性を改変する1つ以上の突然変異を有するCas12アミノ酸配列に部分的にまたは全体として対応するか、あるいはこうした配列を部分的にまたは全体として含む。こうした突然変異には、例えば、Cas12のRuvCヌクレアーゼドメイン内のアミノ酸置換が含まれる。いくつかの実施形態では、野生型Cas12に少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一であるCas12のバリアントまたはホモログを提供する。いくつかの実施形態では、約5アミノ酸、約10アミノ酸、約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ酸、約50アミノ酸、約75アミノ酸、約100アミノ酸以上、短いまたは長いアミノ酸配列を有する、Cas12のバリアントを提供する。
【0252】
いくつかの実施形態では、本明細書に提供されるようなCas12融合タンパク質は、Cas12タンパク質の全長アミノ酸配列、例えば本明細書に提供されるCas12配列の1つを含む。しかし、他の実施形態では、本明細書で提供されるような融合タンパク質は、全長Cas12配列を含まず、その1つ以上の断片のみを含む。適切なCas12ドメインの例示的なアミノ酸配列を本明細書に提供し、Cas12ドメインおよび断片の追加の適切な配列は、当業者には明らかであろう。
【0253】
一般的に、クラス2、V型Casタンパク質は、単一の機能性RuvCエンドヌクレアーゼドメインを有する(例えば、Chen et al., “CRISPR-Cas12a target binding unleashes indiscriminate single-stranded DNase activity,” Science 360:436-439 (2018)を参照のこと)。いくつかの場合、Cas12タンパク質はバリアントCas12bタンパク質である(Strecker et al., Nature Communications, 2019, 10(1): Art. No.: 212を参照のこと)。一実施形態では、バリアントCas12ポリペプチドは、野生型Cas12タンパク質のアミノ酸配列と比較した際、1、2、3、4、5以上のアミノ酸で異なる(例えば欠失、挿入、置換、融合を有する)アミノ酸配列を有する。いくつかの例では、バリアントCas12ポリペプチドは、Cas12ポリペプチドの活性を減少させるアミノ酸変化(例えば欠失、挿入、または置換)を有する。例えば、いくつかの例では、バリアントCas12は、対応する野生型Cas12bタンパク質の50%未満、40%未満、30%未満、20%未満、10%未満、5%未満、または1%未満のニッカーゼ活性を有するCas12bポリペプチドである。いくつかの場合、バリアントCas12bタンパク質は、実質的なニッカーゼ活性を持たない。
【0254】
いくつかの場合、バリアントCas12bタンパク質は減少したニッカーゼ活性を有する。例えば、バリアントCas12bタンパク質は、野生型Cas12bタンパク質の約20%未満、約15%未満、約10%未満、約5%未満、約1%未満、または約0.1%未満のニッカーゼ活性を示す。
【0255】
いくつかの実施形態では、Cas12タンパク質には、哺乳動物細胞において活性を示すCas12a/Cpf1ファミリー由来のRNA誘導型エンドヌクレアーゼが含まれる。PrevotellaおよびFrancisella 1由来のCRISPR(CRISPR/Cpf1)は、CRISPR/Cas9システムに類似のDNA編集技術である。Cpf1はクラスII CRISPR/CasシステムのRNA誘導型エンドヌクレアーゼである。この適応免疫機構は、PrevotellaおよびFrancisella細菌で見られる。Cpf1遺伝子は、CRISPR遺伝子座に関連し、ウイルスDNAを発見して切断するためにガイドRNAを用いるエンドヌクレアーゼをコードする。Cpf1は、Cas9よりも小さくより単純なエンドヌクレアーゼであり、CRISPR/Cas9システムの限界のいくつかを克服する。Cas9ヌクレアーゼとは異なり、Cpf1仲介DNA切断の結果は、短い3'オーバーハングを持つ二本鎖切断である。Cpf1のねじれ型切断パターンは、伝統的な制限酵素クローニングに似た、方向性遺伝子導入の可能性を開くことが可能であり、これは遺伝子編集の効率を増加させ得る。上述のCas9バリアントおよびオルソログ同様、Cpf1はまた、CRISPRによって標的とされ得る部位の数を、SpCas9に好まれるNGG PAM部位を欠くATリッチ領域またはATリッチゲノムにまで拡張し得る。Cpf1遺伝子座は、混合アルファ/ベータドメイン、RuvC-I、その後、らせん領域、RuvC-IIおよびジンクフィンガー様ドメインを含有する。Cpf1タンパク質は、Cas9のRuvCドメインに類似のRuvC様エンドヌクレアーゼドメインを有する。さらに、Cpf1は、Cas9とは異なり、HNHエンドヌクレアーゼドメインを持たず、Cpf1のN末端はCas9のアルファらせん認識ローブを持たない。Cpf1 CRISPR-Casドメイン構築は、Cpf1が機能的にユニークであり、クラス2、V型CRISPRシステムと分類されることを示す。Cpf1遺伝子座は、II型システムよりもI型およびIII型と類似のCas1、Cas2、およびCas4タンパク質をコードする。機能的Cpf1は、トランス活性化CRISPR RNA(tracrRNA)を必要とせず、従って、CRISPR(crRNA)のみが必要である。Cpf1はCas9より小さいだけでなく、また、より小さいsgRNA分子(Cas9のおよそ半数のヌクレオチド)も有するため、これはゲノム編集に有益である。Cpf1-crRNA複合体は、Cas9によって標的とされるGリッチPAMとは対照的に、プロトスペーサー隣接モチーフ5'-YTN-3'または5'-TTTN-3'の同定によって、標的DNAまたはRNAを切断する。PAMの同定後、Cpf1は、4または5ヌクレオチドのオーバーハングを有する付着端様DNA二本鎖切断を導入する。
【0256】
本開示のいくつかの態様において、ベクターは、対応する野生型酵素に関して突然変異されているCRISPR酵素をコードし、突然変異されたCRISPR酵素は、標的配列を含有する標的ポリヌクレオチドの一方または両方の鎖を切断する能力を欠く。Cas12は、野生型例示的Cas12ポリペプチド(例えばBacillus hisashii由来のCas12)に少なくとも、または少なくとも約、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性および/または配列相同性を持つポリペプチドを指してもよい。Cas12は、野生型例示的Cas12ポリペプチド(例えば、Bacillus hisashii由来 (BhCas12b)、Bacillus種 V3-13由来 (BvCas12b)、およびAlicyclobacillus acidiphilus由来 (AaCas12b))に、最大または最大約、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100% 配列同一性および/または配列相同性を持つポリペプチドを指してもよい。Cas12は、欠失、挿入、置換、バリアント、突然変異、融合、キメラ、またはその任意の組み合わせなどのアミノ酸変化を含み得る、Cas12タンパク質の野生型または改変型を指してもよい。
【0257】
核酸プログラム可能DNA結合タンパク質。本開示のいくつかの態様は、核酸プログラム可能DNA結合タンパク質として作用するドメインを含む融合タンパク質を提供し、これは、塩基エディターのようなタンパク質を特定の核酸(例えばDNAまたはRNA)配列にガイドするために使用され得る。特定の実施形態では、融合タンパク質は、核酸プログラム可能DNA結合タンパク質ドメインとデアミナーゼドメインとを含む。核酸プログラム可能DNA結合タンパク質の非限定的な例には、Cas9(例えばdCas9およびnCas9)、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12iが含まれる。Cas酵素の非限定的な例には、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9(Csn1またはCsx12とも呼ばれる)、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、II型 Casエフェクタータンパク質、V型 Casエフェクタータンパク質、VI型 Casエフェクタータンパク質、CARF、DinG、それらのホモログ、またはそれらの修飾または操作された型が含まれる。他の核酸プログラム可能DNA結合タンパク質も、本開示に具体的に列記されていない可能性があるが、本開示の範囲内である。例えばMakarova et al. “Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?” CRISPR J. 2018 Oct;1:325-336. doi: 10.1089/crispr.2018.0033; Yan et al., “Functionally diverse type V CRISPR-Cas systems” Science. 2019 Jan 4;363(6422):88-91. doi: 10.1126/science.aav7271を参照のこと(それぞれの全内容が参照により本明細書に組み込まれる)。
【0258】
Cas9とは異なるPAM特異性を有する核酸プログラム可能DNA結合タンパク質の一例は、Prevotella および Francisella 1由来のClustered Regularly Interspaced Short Palindromic Repeats(Cpf1)である。Cas9と同様に、Cpf1もクラス2 CRISPRエフェクターである。Cpf1はCas9とは異なる特徴でロバストなDNA干渉を仲介することが示されている。Cpf1は、tracrRNAを欠く単一RNA誘導型エンドヌクレアーゼであり、Tリッチプロトスペーサー隣接モチーフ(TTN、TTTN、またはYTN)を利用する。さらに、Cpf1はDNAをねじれ型DNA二本鎖切断で切断する。16のCpf1ファミリータンパク質のうち、AcidaminococcusとLachnospiraceae由来の2つの酵素がヒト細胞において効率的なゲノム編集活性を有することが示されている。Cpf1タンパク質は当技術分野で知られており、例えば過去にYamano et al., “Crystal structure of Cpf1 in complex with guide RNA and target DNA.” Cell (165) 2016, p. 949-962に記載されており、その全体の内容は参照により本明細書に組み込まれる。
【0259】
ガイドヌクレオチド配列プログラム可能DNA結合タンパク質ドメインとして使用され得るヌクレアーゼ不活性Cpf1 (dCpf1) バリアントが、本発明の組成物および方法において有用である。Cpf1タンパク質は、Cas9のRuvCドメインに類似したRuvC様エンドヌクレアーゼドメインを有するが、HNHエンドヌクレアーゼドメインを持たず、Cpf1のN末端はCas9のアルファらせん認識ローブを持たない。Zetsche et al., Cell, 163, 759-771, 2015 (参照により本明細書に組み込まれる)は、Cpf1のRuvC様ドメインが両方のDNA鎖の切断を担い、RuvC様ドメインの不活化はCpf1ヌクレアーゼ活性を不活化することを示した。例えば、Francisella novicida Cpf1におけるD917A、E1006A、またはD1255Aに対応する突然変異は、Cpf1ヌクレアーゼ活性を不活化する。いくつかの実施形態では、本開示のdCpf1は、D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A、またはD917A/E1006A/D1255Aに対応する突然変異を含む。Cpf1のRuvCドメインを不活化する任意の突然変異、例えば、置換突然変異、欠失、または挿入が、本開示に従って使用され得ることを理解されたい。
【0260】
いくつかの実施形態では、本明細書で提供される融合タンパク質のいずれかの核酸プログラム可能DNA結合タンパク質(napDNAbp)は、Cpf1タンパク質であり得る。いくつかの実施形態では、Cpf1タンパク質は、Cpf1ニッカーゼ (nCpf1) である。いくつかの実施形態では、Cpf1タンパク質は、ヌクレアーゼ不活性Cpf1 (dCpf1) である。いくつかの実施形態では、Cpf1、nCpf1、またはdCpf1は、本明細書に開示されたCpf1配列に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、dCpf1は、本明細書に開示されたCpf1配列に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含み、D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A、またはD917A/E1006A/D1255Aに対応する突然変異を含む。他の細菌種由来のCpf1もまた本開示に従って使用され得ることが理解されるべきである。
【0261】
野生型Francisella novicida Cpf1(D917、E1006、およびD1255は太字に下線で示される)。
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
【0262】
Francisella novicida Cpf1 D917A(A917、E1006、およびD1255は太字に下線で示される)。
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
【0263】
Francisella novicida Cpf1 E1006A(D917、A1006、および D1255は太字に下線で示される)。
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
【0264】
Francisella novicida Cpf1 D1255A(D917、E1006、および A1255は太字に下線で示される)。
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
【0265】
Francisella novicida Cpf1 D917A/E1006A(A917、A1006、およびD1255は太字に下線で示される)。
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
【0266】
Francisella novicida Cpf1 D917A/D1255A(A917、E1006、および A1255は太字に下線で示される)。
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
【0267】
Francisella novicida Cpf1 E1006A/D1255A(D917、A1006、および A1255は太字に下線で示される)。
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
【0268】
Francisella novicida Cpf1 D917A/E1006A/D1255A(A917、A1006、および A1255は太字に下線で示される)。
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
【0269】
いくつかの実施形態では、融合タンパク質中に存在するCas9ドメインの1つは、PAM配列を必要としないガイドヌクレオチド配列プログラム可能DNA結合タンパク質ドメインで置換され得る。
【0270】
いくつかの実施形態では、核酸プログラム可能DNA結合タンパク質 (napDNAbp) は、微生物CRISPR-Casシステムの単一のエフェクターである。微生物CRISPR-Casシステムの単一エフェクターは、Cas9、Cpf1、Cas12b/C2c1、およびCas12c/C2c3を含むが、これらに限定されない。典型的には、微生物CRISPR-Casシステムはクラス1およびクラス2システムに分けられる。クラス1のシステムはマルチサブユニットエフェクター複合体を持ち、クラス2のシステムは単一のタンパク質エフェクターを持つ。例えば、Cas9とCpf1はクラス2エフェクターである。Cas9およびCpf1に加えて、3つの異なるクラス2 CRISPR-Casシステム(Cas12b/C2c1およびCas12c/C2c3)がShmakov et al., “Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems”, Mol. Cell, 2015 Nov. 5; 60(3): 385-397によって記載されている(その全体の内容は参照により本明細書に組み込まれる) 。2つのシステム、Cas12b/C2c1とCas12c/C2c3のエフェクターはCpf1に関連するRuvC様エンドヌクレアーゼドメインを含む。第三のシステムは、2つの予測されるHEPN RNアーゼドメインを持つエフェクターを含有する。Cas12b/C2c1によるCRISPR RNAの産生とは異なり、成熟CRISPR RNAの産生はtracrRNA非依存性である。Cas12b/C2c1はDNA切断のため、CRISPR RNAとtracrRNAの両方に依存する。
【0271】
Alicyclobaccillus acidoterrastris Cas12b/C2c1 (AacC2c1) の結晶構造が、キメラ単一分子ガイドRNA (sgRNA) との複合体として報告されている。例えば、Liu et al., “C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism”, Mol. Cell, 2017 Jan. 19; 65(2):310-322を参照のこと (その内容全体を参照により本明細書に組み込む) 。また、三元複合体として標的DNAに結合したAlicyclobacillus acidoterrestris C2c1においても結晶構造が報告されている。例えば、Yang et al., “PAM-dependent Target DNA Recognition and Cleavage by C2C1 CRISPR-Cas endonuclease”, Cell, 2016 Dec. 15; 167(7):1814-1828を参照のこと(その内容全体が参照により本明細書に組み込まれる)。標的DNA鎖および非標的DNA鎖の両方とともに、AacC2c1の触媒的に適格な(competent)コンホメーションは、単一のRuvC触媒ポケット内に位置するよう独立して捕捉され、Cas12b/C2c1仲介切断は標的DNAのねじれ型の7ヌクレオチドの切断を生じる。Cas 12b/C2c1三元複合体と以前に同定されたCas9およびCpf1対応物の間の構造比較は、 CRISPR-Cas9システムにより使用される機構の多様性を示す。いくつかの実施形態では、本明細書で提供される融合タンパク質のいずれかの核酸プログラム可能DNA結合タンパク質 (napDNAbp) は、Cas12b/C2c1またはCas12c/C2c3タンパク質であり得る。いくつかの実施形態では、napDNAbpはCas12b/C2c1タンパク質である。いくつかの実施形態では、napDNAbpはCas12c/C2c3タンパク質である。いくつかの実施形態では、napDNAbpは、天然に存在するCas12b/C2c1またはCas12c/C2c3タンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、napDNAbpは、天然に存在するCas12b/C2c1またはCas12c/C2c3タンパク質である。いくつかの実施形態では、napDNAbpは、本明細書に提供されるnapDNAbp配列のいずれか1つに対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。他の細菌種由来のCas12b/C2c1またはCas12c/C2c3も本開示に従って使用することができることが理解されるべきである。
【0272】
Cas12b/C2c1 ((uniprot.org/uniprot/T0D7A2#2) sp|T0D7A2|C2C1_ALIAG CRISPR会合エンドヌクレアーゼ C2c1 OS = Alicyclobacillus acido-terrestris (ATCC 49025 / DSM 3922/ CIP 106132 / NCIMB 13137/GD3B株) GN=c2c1 PE=1 SV=1) のアミノ酸配列は以下の通りである:
MAVKSIKVKLRLDDMPEIRAGLWKLHKEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECDKTAEECKAELLERLRARQVENGHRGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKEKAETRKSADRTADVLRALADFGLKPLMRVYTDSEMSSVEWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGQEYAKLVEQKNRFEQKNFVGQEHLVHLVNQLQQDMKEASPGLESKEQTAHYVTGRALRGSDKVFEKWGKLAPDAPFDLYDAEIKNVQRRNTRRFGSHDLFAKLAEPEYQALWREDASFLTRYAVYNSILRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGERRHAIRFHKLLKVENGVAREVDDVTVPISMSEQLDNLLPRDPNEPIALYFRDYGAEQHFTGEFGGAKIQCRRDQLAHMHRRRGARDVYLNVSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSKGRVPFFFPIKGNDNLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPVDAANHMTPDWREAFENELQKLKSLHGICSDKEWMDAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYAKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELINQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCTQEHNPEPFPWWLNKFVVEHTLDACPLRADDLIPTGEGEIFVSPFSAEEGDFHQIHADLNAAQNLQQRLWSDFDISQIRLRCDWGEVDGELVLIPRLTGKRTADSYSNKVFYTNTGVTYYERERGKKRRKVFAQEKLSEEEAELLVEADEAREKSVVLMRDPSGIINRGNWTRQKEFWSMV NQRIEGYLVKQIRSRVPLQDSACENTGDI
【0273】
BhCas12b (Bacillus hisashii) NCBI参照配列: WP_095142515
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKK
【0274】
いくつかの実施形態では、Cas12bはBvCas12bV4であり、これはBhCas12bのバリアントで、BhCas12Bに対して、以下の変化:S893R、K846R、およびE837Gを含む。BhCas12b(V4)は以下のように発現される:5' mRNA Cap---5'UTR---bhCas12b---停止配列---3'UTR---120ポリAテール
5'UTR:
GGGAAATAAGAGAGAAAAGAAGAGTAAGAAGAAATATAAGAGCCACC
3'UTR(TriLink標準UTR)
GCTGGAGCCTCGGTGGCCATGCTTCTTGCCCCTTGGGCCTCCCCCCAGCCCCTCCTCCCCTTCCTGCACCCGTACCCCCGTGGTCTTTGAATAAAGTCTGA
bhCas12b(V4)の核酸配列
【0275】
ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGCCACCAGATCCTTCATCCTGAAGATCGAGCCCAACGAGGAAGTGAAGAAAGGCCTCTGGAAAACCCACGAGGTGCTGAACCACGGAATCGCCTACTACATGAATATCCTGAAGCTGATCCGGCAAGAGGCCATCTACGAGCACCACGAGCAGGACCCCAAGAATCCCAAGAAGGTGTCCAAGGCCGAGATCCAGGCCGAGCTGTGGGATTTCGTGCTGAAGATGCAGAAGTGCAACAGCTTCACACACGAGGTGGACAAGGACGAGGTGTTCAACATCCTGAGAGAGCTGTACGAGGAACTGGTGCCCAGCAGCGTGGAAAAGAAGGGCGAAGCCAACCAGCTGAGCAACAAGTTTCTGTACCCTCTGGTGGACCCCAACAGCCAGTCTGGAAAGGGAACAGCCAGCAGCGGCAGAAAGCCCAGATGGTACAACCTGAAGATTGCCGGCGATCCCTCCTGGGAAGAAGAGAAGAAGAAGTGGGAAGAAGATAAGAAAAAGGACCCGCTGGCCAAGATCCTGGGCAAGCTGGCTGAGTACGGACTGATCCCTCTGTTCATCCCCTACACCGACAGCAACGAGCCCATCGTGAAAGAAATCAAGTGGATGGAAAAGTCCCGGAACCAGAGCGTGCGGCGGCTGGATAAGGACATGTTCATTCAGGCCCTGGAACGGTTCCTGAGCTGGGAGAGCTGGAACCTGAAAGTGAAAGAGGAATACGAGAAGGTCGAGAAAGAGTACAAGACCCTGGAAGAGAGGATCAAAGAGGACATCCAGGCTCTGAAGGCTCTGGAACAGTATGAGAAAGAGCGGCAAGAACAGCTGCTGCGGGACACCCTGAACACCAACGAGTACCGGCTGAGCAAGAGAGGCCTTAGAGGCTGGCGGGAAATCATCCAGAAATGGCTGAAAATGGACGAGAACGAGCCCTCCGAGAAGTACCTGGAAGTGTTCAAGGACTACCAGCGGAAGCACCCTAGAGAGGCCGGCGATTACAGCGTGTACGAGTTCCTGTCCAAGAAAGAGAACCACTTCATCTGGCGGAATCACCCTGAGTACCCCTACCTGTACGCCACCTTCTGCGAGATCGACAAGAAAAAGAAGGACGCCAAGCAGCAGGCCACCTTCACACTGGCCGATCCTATCAATCACCCTCTGTGGGTCCGATTCGAGGAAAGAAGCGGCAGCAACCTGAACAAGTACAGAATCCTGACCGAGCAGCTGCACACCGAGAAGCTGAAGAAAAAGCTGACAGTGCAGCTGGACCGGCTGATCTACCCTACAGAATCTGGCGGCTGGGAAGAGAAGGGCAAAGTGGACATTGTGCTGCTGCCCAGCCGGCAGTTCTACAACCAGATCTTCCTGGACATCGAGGAAAAGGGCAAGCACGCCTTCACCTACAAGGATGAGAGCATCAAGTTCCCTCTGAAGGGCACACTCGGCGGAGCCAGAGTGCAGTTCGACAGAGATCACCTGAGAAGATACCCTCACAAGGTGGAAAGCGGCAACGTGGGCAGAATCTACTTCAACATGACCGTGAACATCGAGCCTACAGAGTCCCCAGTGTCCAAGTCTCTGAAGATCCACCGGGACGACTTCCCCAAGGTGGTCAACTTCAAGCCCAAAGAACTGACCGAGTGGATCAAGGACAGCAAGGGCAAGAAACTGAAGTCCGGCATCGAGTCCCTGGAAATCGGCCTGAGAGTGATGAGCATCGACCTGGGACAGAGACAGGCCGCTGCCGCCTCTATTTTCGAGGTGGTGGATCAGAAGCCCGACATCGAAGGCAAGCTGTTTTTCCCAATCAAGGGCACCGAGCTGTATGCCGTGCACAGAGCCAGCTTCAACATCAAGCTGCCCGGCGAGACACTGGTCAAGAGCAGAGAAGTGCTGCGGAAGGCCAGAGAGGACAATCTGAAACTGATGAACCAGAAGCTCAACTTCCTGCGGAACGTGCTGCACTTCCAGCAGTTCGAGGACATCACCGAGAGAGAGAAGCGGGTCACCAAGTGGATCAGCAGACAAGAGAACAGCGACGTGCCCCTGGTGTACCAGGATGAGCTGATCCAGATCCGCGAGCTGATGTACAAGCCTTACAAGGACTGGGTCGCCTTCCTGAAGCAGCTCCACAAGAGACTGGAAGTCGAGATCGGCAAAGAAGTGAAGCACTGGCGGAAGTCCCTGAGCGACGGAAGAAAGGGCCTGTACGGCATCTCCCTGAAGAACATCGACGAGATCGATCGGACCCGGAAGTTCCTGCTGAGATGGTCCCTGAGGCCTACCGAACCTGGCGAAGTGCGTAGACTGGAACCCGGCCAGAGATTCGCCATCGACCAGCTGAATCACCTGAACGCCCTGAAAGAAGATCGGCTGAAGAAGATGGCCAACACCATCATCATGCACGCCCTGGGCTACTGCTACGACGTGCGGAAGAAGAAATGGCAGGCTAAGAACCCCGCCTGCCAGATCATCCTGTTCGAGGATCTGAGCAACTACAACCCCTACGAGGAAAGGTCCCGCTTCGAGAACAGCAAGCTCATGAAGTGGTCCAGACGCGAGATCCCCAGACAGGTTGCACTGCAGGGCGAGATCTATGGCCTGCAAGTGGGAGAAGTGGGCGCTCAGTTCAGCAGCAGATTCCACGCCAAGACAGGCAGCCCTGGCATCAGATGTAGCGTCGTGACCAAAGAGAAGCTGCAGGACAATCGGTTCTTCAAGAATCTGCAGAGAGAGGGCAGACTGACCCTGGACAAAATCGCCGTGCTGAAAGAGGGCGATCTGTACCCAGACAAAGGCGGCGAGAAGTTCATCAGCCTGAGCAAGGATCGGAAGTGCGTGACCACACACGCCGACATCAACGCCGCTCAGAACCTGCAGAAGCGGTTCTGGACAAGAACCCACGGCTTCTACAAGGTGTACTGCAAGGCCTACCAGGTGGACGGCCAGACCGTGTACATCCCTGAGAGCAAGGACCAGAAGCAGAAGATCATCGAAGAGTTCGGCGAGGGCTACTTCATTCTGAAGGACGGGGTGTACGAATGGGTCAACGCCGGCAAGCTGAAAATCAAGAAGGGCAGCTCCAAGCAGAGCAGCAGCGAGCTGGTGGATAGCGACATCCTGAAAGACAGCTTCGACCTGGCCTCCGAGCTGAAAGGCGAAAAGCTGATGCTGTACAGGGACCCCAGCGGCAATGTGTTCCCCAGCGACAAATGGATGGCCGCTGGCGTGTTCTTCGGAAAGCTGGAACGCATCCTGATCAGCAAGCTGACCAACCAGTACTCCATCAGCACCATCGAGGACGACAGCAGCAAGCAGTCTATGAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAG
【0276】
いくつかの実施形態では、Cas12bはBvCas12Bである。いくつかの実施形態では、Cas12bは、以下に提供するBvCas12b例示配列において番号付けられるように、アミノ酸置換S893R、K846R、およびE837Gを含む。
BvCas12b (Bacillus種 V3-13) NCBI参照配列: WP_101661451.1
MAIRSIKLKMKTNSGTDSIYLRKALWRTHQLINEGIAYYMNLLTLYRQEAIGDKTKEAYQAELINIIRNQQRNNGSSEEHGSDQEILALLRQLYELIIPSSIGESGDANQLGNKFLYPLVDPNSQSGKGTSNAGRKPRWKRLKEEGNPDWELEKKKDEERKAKDPTVKIFDNLNKYGLLPLFPLFTNIQKDIEWLPLGKRQSVRKWDKDMFIQAIERLLSWESWNRRVADEYKQLKEKTESYYKEHLTGGEEWIEKIRKFEKERNMELEKNAFAPNDGYFITSRQIRGWDRVYEKWSKLPESASPEELWKVVAEQQNKMSEGFGDPKVFSFLANRENRDIWRGHSERIYHIAAYNGLQKKLSRTKEQATFTLPDAIEHPLWIRYESPGGTNLNLFKLEEKQKKNYYVTLSKIIWPSEEKWIEKENIEIPLAPSIQFNRQIKLKQHVKGKQEISFSDYSSRISLDGVLGGSRIQFNRKYIKNHKELLGEGDIGPVFFNLVVDVAPLQETRNGRLQSPIGKALKVISSDFSKVIDYKPKELMDWMNTGSASNSFGVASLLEGMRVMSIDMGQRTSASVSIFEVVKELPKDQEQKLFYSINDTELFAIHKRSFLLNLPGEVVTKNNKQQRQERRKKRQFVRSQIRMLANVLRLETKKTPDERKKAIHKLMEIVQSYDSWTASQKEVWEKELNLLTNMAAFNDEIWKESLVELHHRIEPYVGQIVSKWRKGLSEGRKNLAGISMWNIDELEDTRRLLISWSKRSRTPGEANRIETDEPFGSSLLQHIQNVKDDRLKQMANLIIMTALGFKYDKEEKDRYKRWKETYPACQIILFENLNRYLFNLDRSRRENSRLMKWAHRSIPRTVSMQGEMFGLQVGDVRSEYSSRFHAKTGAPGIRCHALTEEDLKAGSNTLKRLIEDGFINESELAYLKKGDIIPSQGGELFVTLSKRYKKDSDNNELTVIHADINAAQNLQKRFWQQNSEVYRVPCQLARMGEDKLYIPKSQTETIKKYFGKGSFVKNNTEQEVYKWEKSEKMKIKTDTTFDLQDLDGFEDISKTIELAQEQQKKYLTMFRDPSGYFFNNETWRPQKEYWSIVNNIIKSCLKKKILSNKVEL
【0277】
いくつかの実施形態では、Cas12bはBTCas12b.BTCas12b(Bacillus thermoamylovorans)NCBI参照配列: WP_041902512である。
MATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKV
SKAEIQAELWDFVLKMQKCNSFTHEVDKDVVFNILRELYEELVPSSVEKKGEANQLSNKF
LYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAE
YGLIPLFIPFTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEE
YEKVEKEHKTLEERIKEDIQAFKSLEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREII
QKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYAT
FCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTV
QLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGT
LGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKFVNF
KPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLF
FPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFE
DITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGK
EVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQ
LNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERS
RFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKL
QDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKLVTTHADINAAQNLQ
KRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWGNAGK
LKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFG
KLERILISKLTNQYSISTIEDDSSKQSM
【0278】
いくつかの実施形態では、napDNAbpはCas12を指す。いくつかの実施形態では、Cas12cタンパク質はCas12c1またはCas12c1のバリアントである。いくつかの実施形態では、Cas12タンパク質はCas12c2またはCas12c2のバリアントである。いくつかの実施形態では、Cas12タンパク質はOleiphilus属種HI0009由来のCas12cタンパク質(すなわちOspCas12c)またはOspCas12cのバリアントである。これらのCas12c分子は、Yan et al., “Functionally Diverse Type V CRISPR-Cas Systems,” Science, 2019 Jan. 4; 363: 88-91に記載されており;その内容全体が参照により本明細書に組み入れられる。いくつかの実施形態では、napDNAbpは、天然存在Cas12c1、Cas12c2、またはOspCas12cタンパク質に対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、napDNAbpは、天然存在Cas12c1、Cas12c2、またはOspCas12cタンパク質である。いくつかの実施形態では、napDNAbpは、本明細書記載のCas12c1、Cas12c2、またはOspCas12cタンパク質のいずれかに対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。他の細菌種由来のCas12c1、Cas12c2、またはOspCas12cもまた、本開示に従って使用され得ることを認識すべきである。
【0279】
Cas12c1
MQTKKTHLHLISAKASRKYRRTIACLSDTAKKDLERRKQSGAADPAQELSCLKTIKFKLEVPEGSKLPSFDRISQIYNALETIEKGSLSYLLFALILSGFRIFPNSSAAKTFASSSCYKNDQFASQIKEIFGEMVKNFIPSELESILKKGRRKNNKDWTEENIKRVLNSEFGRKNSEGSSALFDSFLSKFSQELFRKFDSWNEVNKKYLEAAELLDSMLASYGPFDSVCKMIGDSDSRNSLPDKSTIAFTNNAEITVDIESSVMPYMAIAALLREYRQSKSKAAPVAYVQSHLTTTNGNGLSWFFKFGLDLIRKAPVSSKQSTSDGSKSLQELFSVPDDKLDGLKFIKEACEALPEASLLCGEKGELLGYQDFRTSFAGHIDSWVANYVNRLFELIELVNQLPESIKLPSILTQKNHNLVASLGLQEAEVSHSLELFEGLVKNVRQTLKKLAGIDISSSPNEQDIKEFYAFSDVLNRLGSIRNQIENAVQTAKKDKIDLESAIEWKEWKKLKKLPKLNGLGGGVPKQQELLDKALESVKQIRHYQRIDFERVIQWAVNEHCLETVPKFLVDAEKKKINKESSTDFAAKENAVRFLLEGIGAAARGKTDSVSKAAYNWFVVNNFLAKKDLNRYFINCQGCIYKPPYSKRRSLAFALRSDNKDTIEVVWEKFETFYKEISKEIEKFNIFSQEFQTFLHLENLRMKLLLRRIQKPIPAEIAFFSLPQEYYDSLPPNVAFLALNQEITPSEYITQFNLYSSFLNGNLILLRRSRSYLRAKFSWVGNSKLIYAAKEARLWKIPNAYWKSDEWKMILDSNVLVFDKAGNVLPAPTLKKVCEREGDLRLFYPLLRQLPHDWCYRNPFVKSVGREKNVIEVNKEGEPKVASALPGSLFRLIGPAPFKSLLDDCFFNPLDKDLRECMLIVDQEISQKVEAQKVEASLESCTYSIAVPIRYHLEEPKVSNQFENVLAIDQGEAGLAYAVFSLKSIGEAETKPIAVGTIRIPSIRRLIHSVSTYRKKKQRLQNFKQNYDSTAFIMRENVTGDVCAKIVGLMKEFNAFPVLEYDVKNLESGSRQLSAVYKAVNSHFLYFKEPGRDALRKQLWYGGDSWTIDGIEIVTRERKEDGKEGVEKIVPLKVFPGRSVSARFTSKTCSCCGRNVFDWLFTEKKAKTNKKFNVNSKGELTTADGVIQLFEADRSKGPKFYARRKERTPLTKPIAKGSYSLEEIERRVRTNLRRAPKSKQSRDTSQSQYFCVYKDCALHFSGMQADENAAINIGRRFLTALRKNRRSDFPSNVKISDRLLDN
【0280】
Cas12c2
MTKHSIPLHAFRNSGADARKWKGRIALLAKRGKETMRTLQFPLEMSEPEAAAINTTPFAVAYNAIEGTGKGTLFDYWAKLHLAGFRFFPSGGAATIFRQQAVFEDASWNAAFCQQSGKDWPWLVPSKLYERFTKAPREVAKKDGSKKSIEFTQENVANESHVSLVGASITDKTPEDQKEFFLKMAGALAEKFDSWKSANEDRIVAMKVIDEFLKSEGLHLPSLENIAVKCSVETKPDNATVAWHDAPMSGVQNLAIGVFATCASRIDNIYDLNGGKLSKLIQESATTPNVTALSWLFGKGLEYFRTTDIDTIMQDFNIPASAKESIKPLVESAQAIPTMTVLGKKNYAPFRPNFGGKIDSWIANYASRLMLLNDILEQIEPGFELPQALLDNETLMSGIDMTGDELKELIEAVYAWVDAAKQGLATLLGRGGNVDDAVQTFEQFSAMMDTLNGTLNTISARYVRAVEMAGKDEARLEKLIECKFDIPKWCKSVPKLVGISGGLPKVEEEIKVMNAAFKDVRARMFVRFEEIAAYVASKGAGMDVYDALEKRELEQIKKLKSAVPERAHIQAYRAVLHRIGRAVQNCSEKTKQLFSSKVIEMGVFKNPSHLNNFIFNQKGAIYRSPFDRSRHAPYQLHADKLLKNDWLELLAEISATLMASESTEQMEDALRLERTRLQLQLSGLPDWEYPASLAKPDIEVEIQTALKMQLAKDTVTSDVLQRAFNLYSSVLSGLTFKLLRRSFSLKMRFSVADTTQLIYVPKVCDWAIPKQYLQAEGEIGIAARVVTESSPAKMVTEVEMKEPKALGHFMQQAPHDWYFDASLGGTQVAGRIVEKGKEVGKERKLVGYRMRGNSAYKTVLDKSLVGNTELSQCSMIIEIPYTQTVDADFRAQVQAGLPKVSINLPVKETITASNKDEQMLFDRFVAIDLGERGLGYAVFDAKTLELQESGHRPIKAITNLLNRTHHYEQRPNQRQKFQAKFNVNLSELRENTVGDVCHQINRICAYYNAFPVLEYMVPDRLDKQLKSVYESVTNRYIWSSTDAHKSARVQFWLGGETWEHPYLKSAKDKKPLVLSPGRGASGKGTSQTCSCCGRNPFDLIKDMKPRAKIAVVDGKAKLENSELKLFERNLESKDDMLARRHRNERAGMEQPLTPGNYTVDEIKALLRANLRRAPKNRRTKDTTVSEYHCVFSDCGKTMHADENAAVNIGGKFIADIEK
【0281】
OspCas12c
MTKLRHRQKKLTHDWAGSKKREVLGSNGKLQNPLLMPVKKGQVTEFRKAFSAYARATKGEMTDGRKNMFTHSFEPFKTKPSLHQCELADKAYQSLHSYLPGSLAHFLLSAHALGFRIFSKSGEATAFQASSKIEAYESKLASELACVDLSIQNLTISTLFNALTTSVRGKGEETSADPLIARFYTLLTGKPLSRDTQGPERDLAEVISRKIASSFGTWKEMTANPLQSLQFFEEELHALDANVSLSPAFDVLIKMNDLQGDLKNRTIVFDPDAPVFEYNAEDPADIIIKLTARYAKEAVIKNQNVGNYVKNAITTTNANGLGWLLNKGLSLLPVSTDDELLEFIGVERSHPSCHALIELIAQLEAPELFEKNVFSDTRSEVQGMIDSAVSNHIARLSSSRNSLSMDSEELERLIKSFQIHTPHCSLFIGAQSLSQQLESLPEALQSGVNSADILLGSTQYMLTNSLVEESIATYQRTLNRINYLSGVAGQINGAIKRKAIDGEKIHLPAAWSELISLPFIGQPVIDVESDLAHLKNQYQTLSNEFDTLISALQKNFDLNFNKALLNRTQHFEAMCRSTKKNALSKPEIVSYRDLLARLTSCLYRGSLVLRRAGIEVLKKHKIFESNSELREHVHERKHFVFVSPLDRKAKKLLRLTDSRPDLLHVIDEILQHDNLENKDRESLWLVRSGYLLAGLPDQLSSSFINLPIITQKGDRRLIDLIQYDQINRDAFVMLVTSAFKSNLSGLQYRANKQSFVVTRTLSPYLGSKLVYVPKDKDWLVPSQMFEGRFADILQSDYMVWKDAGRLCVIDTAKHLSNIKKSVFSSEEVLAFLRELPHRTFIQTEVRGLGVNVDGIAFNNGDIPSLKTFSNCVQVKVSRTNTSLVQTLNRWFEGGKVSPPSIQFERAYYKKDDQIHEDAAKRKIRFQMPATELVHASDDAGWTPSYLLGIDPGEYGMGLSLVSINNGEVLDSGFIHINSLINFASKKSNHQTKVVPRQQYKSPYANYLEQSKDSAAGDIAHILDRLIYKLNALPVFEALSGNSQSAADQVWTKVLSFYTWGDNDAQNSIRKQHWFGASHWDIKGMLRQPPTEKKPKPYIAFPGSQVSSYGNSQRCSCCGRNPIEQLREMAKDTSIKELKIRNSEIQLFDGTIKLFNPDPSTVIERRRHNLGPSRIPVADRTFKNISPSSLEFKELITIVSRSIRHSPEFIAKKRGIGSEYFCAYSDCNSSLNSEANAAANVAQKFQKQLFFEL
【0282】
いくつかの実施形態では、napDNAbpはCas12g、Cas12h、またはCas12iを指し、これらは、例えば、Yan et al., “Functionally Diverse Type V CRISPR-Cas Systems,” Science, 2019 Jan. 4; 363: 88-91に記載されており;各々の内容全体が参照により本明細書に組み入れられる。10テラバイトを超える配列データを統合することによって、Cas12g、Cas12h、およびCas12iを含めて、以前特徴づけられたクラスVタンパク質と弱い類似性を示すV型Casタンパク質の新規分類が同定された。いくつかの実施形態では、Cas12タンパク質はCas12gまたはCas12gのバリアントである。いくつかの実施形態では、Cas12タンパク質はCas12hまたはCas12hのバリアントである。いくつかの実施形態では、Cas12タンパク質はCas12iまたはCas12iのバリアントである。他のRNA誘導型DNA結合タンパク質がnapDNAbpとして使用可能であり、本開示の範囲内にあることが認識されるべきである。いくつかの実施形態では、napDNAbpは、天然存在Cas12g、Cas12h、またはCas12iタンパク質に対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、napDNAbpは、天然存在Cas12g、Cas12h、またはCas12iタンパク質である。いくつかの実施形態では、napDNAbpは、本明細書記載のCas12g、Cas12h、またはCas12iタンパク質のいずれかに対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。他の細菌種由来のCas12g、Cas12h、またはCas12iもまた、本開示に従って使用され得ることを認識すべきである。いくつかの実施形態では、Cas12iはCas12i1またはCas12i2である。
【0283】
Cas12g1
MAQASSTPAVSPRPRPRYREERTLVRKLLPRPGQSKQEFRENVKKLRKAFLQFNADVSGVCQWAIQFRPRYGKPAEPTETFWKFFLEPETSLPPNDSRSPEFRRLQAFEAAAGINGAAALDDPAFTNELRDSILAVASRPKTKEAQRLFSRLKDYQPAHRMILAKVAAEWIESRYRRAHQNWERNYEEWKKEKQEWEQNHPELTPEIREAFNQIFQQLEVKEKRVRICPAARLLQNKDNCQYAGKNKHSVLCNQFNEFKKNHLQGKAIKFFYKDAEKYLRCGLQSLKPNVQGPFREDWNKYLRYMNLKEETLRGKNGGRLPHCKNLGQECEFNPHTALCKQYQQQLSSRPDLVQHDELYRKWRREYWREPRKPVFRYPSVKRHSIAKIFGENYFQADFKNSVVGLRLDSMPAGQYLEFAFAPWPRNYRPQPGETEISSVHLHFVGTRPRIGFRFRVPHKRSRFDCTQEELDELRSRTFPRKAQDQKFLEAARKRLLETFPGNAEQELRLLAVDLGTDSARAAFFIGKTFQQAFPLKIVKIEKLYEQWPNQKQAGDRRDASSKQPRPGLSRDHVGRHLQKMRAQASEIAQKRQELTGTPAPETTTDQAAKKATLQPFDLRGLTVHTARMIRDWARLNARQIIQLAEENQVDLIVLESLRGFRPPGYENLDQEKKRRVAFFAHGRIRRKVTEKAVERGMRVVTVPYLASSKVCAECRKKQKDNKQWEKNKKRGLFKCEGCGSQAQVDENAARVLGRVFWGEIELPTAIP
【0284】
Cas12h1
MKVHEIPRSQLLKIKQYEGSFVEWYRDLQEDRKKFASLLFRWAAFGYAAREDDGATYISPSQALLERRLLLGDAEDVAIKFLDVLFKGGAPSSSCYSLFYEDFALRDKAKYSGAKREFIEGLATMPLDKIIERIRQDEQLSKIPAEEWLILGAEYSPEEIWEQVAPRIVNVDRSLGKQLRERLGIKCRRPHDAGYCKILMEVVARQLRSHNETYHEYLNQTHEMKTKVANNLTNEFDLVCEFAEVLEEKNYGLGWYVLWQGVKQALKEQKKPTKIQIAVDQLRQPKFAGLLTAKWRALKGAYDTWKLKKRLEKRKAFPYMPNWDNDYQIPVGLTGLGVFTLEVKRTEVVVDLKEHGKLFCSHSHYFGDLTAEKHPSRYHLKFRHKLKLRKRDSRVEPTIGPWIEAALREITIQKKPNGVFYLGLPYALSHGIDNFQIAKRFFSAAKPDKEVINGLPSEMVVGAADLNLSNIVAPVKARIGKGLEGPLHALDYGYGELIDGPKILTPDGPRCGELISLKRDIVEIKSAIKEFKACQREGLTMSEETTTWLSEVESPSDSPRCMIQSRIADTSRRLNSFKYQMNKEGYQDLAEALRLLDAMDSYNSLLESYQRMHLSPGEQSPKEAKFDTKRASFRDLLRRRVAHTIVEYFDDCDIVFFEDLDGPSDSDSRNNALVKLLSPRTLLLYIRQALEKRGIGMVEVAKDGTSQNNPISGHVGWRNKQNKSEIYFYEDKELLVMDADEVGAMNILCRGLNHSVCPYSFVTKAPEKKNDEKKEGDYGKRVKRFLKDRYGSSNVRFLVASMGFVTVTTKRPKDALVGKRLYYHGGELVTHDLHNRMKDEIKYLVEKEVLARRVSLSDSTIKSYKSFAHV
【0285】
Cas12i1
MSNKEKNASETRKAYTTKMIPRSHDRMKLLGNFMDYLMDGTPIFFELWNQFGGGIDRDIISGTANKDKISDDLLLAVNWFKVMPINSKPQGVSPSNLANLFQQYSGSEPDIQAQEYFASNFDTEKHQWKDMRVEYERLLAELQLSRSDMHHDLKLMYKEKCIGLSLSTAHYITSVMFGTGAKNNRQTKHQFYSKVIQLLEESTQINSVEQLASIILKAGDCDSYRKLRIRCSRKGATPSILKIVQDYELGTNHDDEVNVPSLIANLKEKLGRFEYECEWKCMEKIKAFLASKVGPYYLGSYSAMLENALSPIKGMTTKNCKFVLKQIDAKNDIKYENEPFGKIVEGFFDSPYFESDTNVKWVLHPHHIGESNIKTLWEDLNAIHSKYEEDIASLSEDKKEKRIKVYQGDVCQTINTYCEEVGKEAKTPLVQLLRYLYSRKDDIAVDKIIDGITFLSKKHKVEKQKINPVIQKYPSFNFGNNSKLLGKIISPKDKLKHNLKCNRNQVDNYIWIEIKVLNTKTMRWEKHHYALSSTRFLEEVYYPATSENPPDALAARFRTKTNGYEGKPALSAEQIEQIRSAPVGLRKVKKRQMRLEAARQQNLLPRYTWGKDFNINICKRGNNFEVTLATKVKKKKEKNYKVVLGYDANIVRKNTYAAIEAHANGDGVIDYNDLPVKPIESGFVTVESQVRDKSYDQLSYNGVKLLYCKPHVESRRSFLEKYRNGTMKDNRGNNIQIDFMKDFEAIADDETSLYYFNMKYCKLLQSSIRNHSSQAKEYREEIFELLRDGKLSVLKLSSLSNLSFVMFKVAKSLIGTYFGHLLKKPKNSKSDVKAPPITDEDKQKADPEMFALRLALEEKRLNKVKSKKEVIANKIVAKALELRDKYGPVLIKGENISDTTKKGKKSSTNSFLMDWLARGVANKVKEMVMMHQGLEFVEVNPNFTSHQDPFVHKNPENTFRARYSRCTPSELTEKNRKEILSFLSDKPSKRPTNAYYNEGAMAFLATYGLKKNDVLGVSLEKFKQIMANILHQRSEDQLLFPSRGGMFYLATYKLDADATSVNWNGKQFWVCNADLVAAYNVGLVDIQKDFKKK
【0286】
Cas12i2
MSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKHHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFDVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNIGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTVKGIGEQSSDEENPDGSRIKLQLTS
【0287】
塩基エディターの代表的な核酸およびタンパク質配列は以下の通りである:
P153のBhCas12 GGSGGS-ABE8-Xten20
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPGGSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA
K255のBhCas12b GGSGGS-ABE8-Xten20
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKGGSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA
D306のBhCas12b GGSGGS-ABE8-Xten20
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDGGSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA
D980のBhCas12b GGSGGS-ABE8-Xten20
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGGSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA
K1019のBhCas12b GGSGGS-ABE8-Xten20
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKGGSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA
【0288】
上記配列に関して、Kozak配列を太字下線で示し;一点鎖線による下線はN末端各局在化シグナル(NLS)を示し;小文字はGGGSGGSリンカーを示し;破線による下線はABE8をコードする配列を示し、非改変配列はBhCas12bをコードし;二重下線はXten20リンカーを示し;一重下線はC末端NLSを示し;GGATCC(点線による下線)はGSリンカーを示し;斜字は3xヘマグルチニン(HA)タグのコード配列を示す。
【0289】
いくつかの実施形態では、Cas9ドメインは、Staphylococcus aureus由来のCas9ドメイン (SaCas9)である。いくつかの実施形態では、SaCas9ドメインは、ヌクレアーゼ活性SaCas9、ヌクレアーゼ不活性SaCas9 (SaCas9d) 、またはSaCas9ニッカーゼ (SaCas9 n) である。いくつかの実施形態では、SaCas9は、N579A突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。
【0290】
いくつかの実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非カノニカルPAMを有する核酸配列に結合することができる。いくつかの実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、NNGRRTまたはNNGRRT PAM配列を有する核酸配列に結合することができる。いくつかの実施形態では、SaCas9ドメインは、E781X、N967X、およびR1014X突然変異の1つ以上、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態では、SaCas9ドメインは、E781K、N967K、およびR1014H突然変異のうちの1つ以上、または本明細書に提供されるアミノ酸配列のいずれかにおける1つ以上の対応する突然変異を含む。いくつかの実施形態では、SaCas9ドメインは、E781K、N967K、またはR1014H突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。
【0291】
いくつかの実施形態では、バリアントCasタンパク質は、SpCas9、SpCas9-VRQR、SpCas9-VRER、xCas9 (sp)、SaCas9、SaCas9-KKH、SpCas9-MQKSER、SpCas9-LRKIQK、またはSpCas9-LRVSQLであってもよい
【0292】
例示的なSaCas9配列
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG
下線で示され太字である上記残基N579は、(例えばA579に)突然変異されてSaCas9ニッカーゼを生じ得る。
【0293】
例示的なSaCas9n配列
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG
【0294】
N579から突然変異されてSaCas9ニッカーゼを生じ得る上記残基A579は下線で示され太字である。
【0295】
例示的なSaKKH Cas9配列
N579から突然変異されてSaCas9ニッカーゼを生じ得る上記残基A579は、下線で示され太字である。E781、N967、およびR1014から突然変異されてSaKKH Cas9を生じ得る上記残基K781、K967、およびH1014は、下線で示され斜字である。
【0296】
塩基エディターのポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、それ自体が1つ以上のドメインを含むことができる。例えば、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、1つ以上のヌクレアーゼドメインを含むことができる。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインのヌクレアーゼドメインは、エンドヌクレアーゼまたはエキソヌクレアーゼを含むことができる。本明細書において、用語「エキソヌクレアーゼ」は、核酸(例えばRNAまたはDNA)を遊離末端から消化することができるタンパク質またはポリペプチドを指し、用語「エンドヌクレアーゼ」は、核酸(例えばDNAまたはRNA)の内部領域を触媒(例えば切断)することができるタンパク質またはポリペプチドを指す。いくつかの実施形態では、エンドヌクレアーゼは、二本鎖核酸の一本鎖を切断することができる。いくつかの実施形態では、エンドヌクレアーゼは、二本鎖核酸分子の両方の鎖を切断することができる。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、デオキシリボヌクレアーゼであり得る。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、リボヌクレアーゼであり得る。
【0297】
いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインのヌクレアーゼドメインは、標的ポリヌクレオチドの0本、1本または2本の鎖を切断することができる。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、ニッカーゼドメインを含むことができる。本明細書において、用語「ニッカーゼ」は、二本鎖核酸分子(例えばDNA)中の二本鎖の一方の鎖のみを切断することができるヌクレアーゼドメインを含むポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを指す。いくつかの実施形態では、ニッカーゼは、活性ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインに1つ以上の突然変異を導入することによって、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの完全に触媒活性な(例えば天然の)形態から得られ得る。例えば、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインがCas9に由来するニッカーゼドメインを含む場合、Cas9に由来するニッカーゼドメインは、D10A突然変異および840位のヒスチジンを含むことができる。そのような実施形態では、残基H 840は触媒活性を保持し、それによって核酸二本鎖の一本鎖を切断することができる。別の例において、Cas9由来ニッカーゼドメインは、H840A突然変異を含むことができ、一方、10位のアミノ酸残基は、Dのままである。いくつかの実施形態では、ニッカーゼは、ニッカーゼ活性に必要ではないヌクレアーゼドメインのすべてまたは一部を除去することによって、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの完全に触媒活性な(例えば天然の)形態から得られ得る。例えば、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインがCas9に由来するニッカーゼドメインを含む場合、Cas9に由来するニッカーゼドメインは、RuvCドメインまたはHNHドメインのすべてまたは一部の欠失を含むことができる。
【0298】
従って、ニッカーゼドメインを含むポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを含む塩基エディターは、特定のポリヌクレオチド標的配列(例えば結合したガイド核酸の相補的配列によって決定される)で、一本鎖DNA切断 (ニック) を生成することができる。いくつかの実施形態では、ニッカーゼドメイン(例えばCas9由来のニッカーゼドメイン)を含む塩基エディターによって切断される核酸二本鎖標的ポリヌクレオチド配列の鎖は、塩基エディターによって編集されない鎖である(すなわち、塩基エディターによって切断される鎖は、編集される塩基を含む鎖とは反対の鎖である)。他の実施形態では、ニッカーゼドメイン(例えばCas9由来のニッカーゼドメイン)を含む塩基エディターは、編集のために標的とされるDNA分子の鎖を切断することができる。このような実施形態では、非標的鎖は切断されない。
【0299】
触媒的に不活性である(すなわち標的ポリヌクレオチド配列を切断することができない)ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを含む塩基エディターも本明細書中に提供される。本明細書において、用語「触媒的に不活性である」および「ヌクレアーゼ不活性」は、核酸の鎖を切断することができない結果となる1つ以上の突然変異および/または欠失を有するポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを指すために交換可能に使用される。いくつかの実施形態では、触媒的に不活性であるポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン塩基エディターは、1つ以上のヌクレアーゼドメインにおける特定の点突然変異の結果としてヌクレアーゼ活性を欠くことができる。例えば、Cas9ドメインを含む塩基エディターの場合、Cas9は、D10A突然変異およびH840A突然変異の両方を含むことができる。このような突然変異は両方のヌクレアーゼドメインを不活化し、その結果ヌクレアーゼ活性を失う。他の実施形態では、触媒的に不活性であるポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、触媒ドメイン(例えばRuvC1および/またはHNHドメイン)のすべてまたは一部の1つ以上の欠失を含むことができる。さらなる実施形態では、触媒的に不活性であるポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、点突然変異(例えばD10AまたはH840A)ならびにヌクレアーゼドメインのすべてまたは一部の欠失を含む。
【0300】
また、本明細書では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの以前に機能していたバージョンから、触媒的に不活性であるポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを生成することができる突然変異も企図される。例えば、触媒的に不活性であるCas9 (「dCas9」) の場合、D10AおよびH840A以外の突然変異を有してヌクレアーゼ不活性化Cas9をもたらすバリアントが提供される。このような突然変異は、例えば、D10およびH840での他のアミノ酸置換、またはCas9のヌクレアーゼドメイン内の他の置換(例えば、HNHヌクレアーゼサブドメインおよび/またはRuvC1サブドメインにおける置換)を含む。
【0301】
追加の適切なヌクレアーゼ不活性dCas9ドメインは、本開示および当技術分野における知識に基づいて当業者に明らかとなることが可能であり、本開示の範囲内である。このような追加の例示的な適切なヌクレアーゼ不活性Cas9ドメインには、限定されるものではないが、D10A/H840A、D10A/D839A/H840A、およびD10A/D839A/H840A/N863A突然変異体ドメインが含まれる(例えば、Prashant et al., CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nature Biotechnology. 2013; 31(9): 833-838を参照のこと (その全内容は参照により本明細書に組み込まれる))。いくつかの実施形態では、dCas9ドメインは、本明細書に提供するdCas9ドメインのいずれか1つに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。いくつかの実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれより多い突然変異を有するアミノ酸配列を含む。いくつかの実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200の同一の連続したアミノ酸残基を有するアミノ酸配列を含む。
【0302】
塩基エディターに組み込むことができるポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの非限定的な例には、CRISPRタンパク質由来ドメイン、制限ヌクレアーゼ、メガヌクレアーゼ、TALヌクレアーゼ (TALEN) 、およびジンクフィンガーヌクレアーゼ (ZFN) が含まれる。いくつかの実施形態では、塩基エディターは、核酸のCRISPR (すなわちClustered Regularly Interspaced Short Palindromic Repeats)仲介修飾の際に、結合したガイド核酸を介して核酸配列に結合することができる天然もしくは改変されたタンパク質またはその一部を含むポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを含む。そのようなタンパク質は、本明細書において「CRISPRタンパク質」と呼ばれる。従って、本明細書に開示されているのは、CRISPRタンパク質のすべてまたは一部を含むポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを含む塩基エディター(すなわち、CRISPRタンパク質のすべてまたは一部をドメインとして含む塩基エディター、塩基エディターの「CRISPRタンパク質由来ドメイン」とも呼ばれる)である。塩基エディターに組み込まれたCRISPRタンパク質由来ドメインは、野生型または天然型のCRISPRタンパク質と比較して改変され得る。例えば、以下に記載するように、CRISPRタンパク質由来ドメインは、野生型または天然型のCRISPRタンパク質と比較して、1つ以上の突然変異、挿入、欠失、再配置および/または組換えを含み得る。
【0303】
いくつかの実施形態では、塩基エディター内に組み込まれたCRISPRタンパク質由来ドメインは、結合ガイド核酸と組み合わせられた場合に標的ポリヌクレオチドに結合することができるエンドヌクレアーゼ(例えばデオキシリボヌクレアーゼまたはリボヌクレアーゼ)である。いくつかの実施形態では、塩基エディター内に組み込まれたCRISPRタンパク質由来ドメインは、結合したガイド核酸と組み合わせられた場合に標的ポリヌクレオチドに結合することができるニッカーゼである。いくつかの実施形態では、塩基エディター内に組み込まれたCRISPRタンパク質由来ドメインは、結合したガイド核酸と組み合わせられた場合に標的ポリヌクレオチドに結合することができる触媒的に不活性のドメインである。いくつかの実施形態では、塩基エディターのCRISPRタンパク質由来ドメインに結合する標的ポリヌクレオチドはDNAである。いくつかの実施形態では、塩基エディターのCRISPRタンパク質由来ドメインに結合する標的ポリヌクレオチドはRNAである。
【0304】
いくつかの実施形態では、塩基エディターのCRISPRタンパク質由来ドメインには、Corynebacterium ulcerans (NCBI参照: NC_015683.1, NC_017317.1); Corynebacterium diphtheria (NCBI参照: NC_016782.1, NC_016786.1); Spiroplasma syrphidicola (NCBI参照: NC_021284.1); Prevotella intermedia (NCBI参照: NC_017861.1); Spiroplasma taiwanense (NCBI参照: NC_021846.1); Streptococcus iniae (NCBI参照: NC_021314.1); Belliella baltica (NCBI参照: NC_018010.1); Psychroflexus torquis (NCBI参照: NC_018721.1); Streptococcus thermophilus (NCBI参照: YP_820832.1); Listeria innocua (NCBI参照: NP_472073.1); Campylobacter jejuni (NCBI参照: YP_002344900.1); Neisseria meningitidis (NCBI参照: YP_002342100.1), Streptococcus pyogenes, または Staphylococcus aureus由来のCas9のすべてまたは一部が含まれてもよい。
【0305】
いくつかの実施形態では、塩基エディターのCas9由来ドメインは、Staphylococcus aureus由来のCas9ドメインである(SaCas9)。いくつかの実施形態では、SaCas9ドメインは、ヌクレアーゼ活性SaCas9、ヌクレアーゼ不活性SaCas9(SaCas9d)、またはSaCas9ニッカーゼ(SaCas9n)である。いくつかの実施形態では、SaCas9ドメインはN579X突然変異を含む。いくつかの実施形態では、SaCas9ドメインはN579A突然変異を含む。いくつかの実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非カノニカルPAMを有する核酸配列に結合することができる。いくつかの実施形態では、SaCas9ドメイン、SaCas9dドメインまたはSaCas9nドメインは、NNGRRT PAM配列を有する核酸配列に結合することができる。いくつかの実施形態では、SaCas9ドメインは、E781X、N967X、およびR1014X突然変異の1つ以上を含む。
【0306】
塩基エディターは、高忠実度Cas9であるCas9のすべてまたは部分に由来するドメインを含むことも可能である。いくつかの実施形態では、塩基エディターの高忠実度Cas9ドメインは、対応する野生型Cas9ドメインに比較して、Cas9ドメインとDNAの糖-リン酸主鎖との間の静電相互作用を減少させる1つ以上の突然変異を含む操作されたCas9ドメインである。DNAの糖-リン酸主鎖との静電相互作用を減少させた高忠実度Cas9ドメインは、より少ないオフターゲット効果を有し得る。いくつかの実施形態では、Cas9ドメイン(例えば、野生型Cas9ドメイン)は、Cas9ドメインとDNAの糖-リン酸主鎖との間の会合を減少させる1つ以上の突然変異を含む。いくつかの実施形態では、Cas9ドメインは、Cas9ドメインとDNAの糖-リン酸主鎖との間の会合を少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、またはそれより多く減少させる1つ以上の突然変異を含む。
【0307】
いくつかの実施形態では、改変Cas9は高忠実度Cas9酵素である。いくつかの実施形態では、高忠実度Cas9酵素は、SpCas9 (K855A)、eSpCas9(1.1)、SpCas9-HF1、または高精度な(hyper accurate)Cas9バリアント(HypaCas9)である。改変Cas9 eSpCas9(1.1)は、HNH/RuvCの溝と非ターゲットDNA鎖の間の相互作用を弱めて、鎖分離およびオフターゲット部位での切断を防止する、アラニン置換を含有する。同様に、SpCas9-HF1は、DNAリン酸主鎖とのCas9の相互作用を破壊するアラニン置換を通じて、オフターゲット編集を低下させる。HypaCas9は、REC3ドメインに、Cas9プルーフリーディングと標的識別を増加させる突然変異(SpCas9 N692A/M694A/Q695A/H698A)を含有する。3つの高忠実度酵素はすべて、野生型Cas9よりも低いオフターゲット編集を生じる。例示的な高忠実度Cas9を以下に提供する。
【0308】
Cas9に比較した高忠実度Cas9ドメインを太字と下線で示す。
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTAFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGALSRKLINGIRDKQSGKTILDFLKSDGFANRNFMALIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRAITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0309】
ガイドポリヌクレオチド
一実施形態では、ガイドポリヌクレオチドはガイドRNAである。本明細書において用いた際、用語「ガイドRNA(gRNA)」とその文法的同等物は、ターゲットDNAに特異的であり、Casタンパク質と複合体を形成し得るRNAを指すことも可能である。RNA/Cas複合体は、Casタンパク質を標的DNAに「ガイド」するのを補助することができる。Cas9/crRNA/tracrRNAは、スペーサーに相補的な直鎖または環状dsDNA標的をエンドヌクレアーゼ的に切断する。crRNAに相補的でない標的鎖が最初にエンドヌクレアーゼ的に切断され、次いでエキソヌクレアーゼ的に3’-5’方向にトリムされる。自然界では、典型的には、DNA結合と切断にはタンパク質と両方のRNAが必要とされる。しかし、crRNAおよびtracrRNAの両方の態様を単一のRNA種に組み込むように、シングルガイドRNA (「sgRNA」、または単に「gRNA」)を操作することができる。例えば、Jinek M. et al., Science 337:816-821(2012)を参照のこと(その内容全体が参照により本明細書に組み入れられる)。Cas9は、CRISPR反復配列中の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、自己と非自己を区別するのを助ける。Cas9ヌクレアーゼの配列および構造は、当業者によく知られている(例えば“Complete genome sequence of an M1 strain of Streptococcus pyogenes.” Ferretti, J.J. et al., Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); “CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.” Deltcheva E. et al., Nature 471:602-607(2011); および “Programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.” Jinek M.et al, Science 337:816-821(2012)参照。その内容全体が参照により本明細書に組み入れられる)。Cas9オルソログは、限定されるものではないが、S. pyogenes および S. thermophilusを含む多様な種において記述されている。追加の適切なCas9ヌクレアーゼおよび配列は、本開示に基づいて当業者に明らかとなることも可能であり、そのようなCas9ヌクレアーゼおよび配列には、Chylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems” (2013) RNA Biology 10:5, 726-737に開示されている生物および遺伝子座由来のCas9配列が含まれる(その全内容は参照により本明細書に組み込まれる)。いくつかの実施形態では、Cas9ヌクレアーゼは、不活性(例えば不活化) DNA切断ドメインを有し、すなわち、Cas9はニッカーゼである。
【0310】
いくつかの実施形態では、ガイドポリヌクレオチドは、少なくとも1つのシングルガイドRNA (「sgRNA」または「gRNA」)である。いくつかの実施形態では、ガイドポリヌクレオチドは、少なくとも1つのtracrRNAである。いくつかの実施形態では、ガイドポリヌクレオチドは、ポリヌクレオチドプログラム可能DNA結合ドメイン(例えばCas9またはCpf1)を標的ヌクレオチド配列にガイドするためにPAM配列を必要としない。
【0311】
本明細書に開示される塩基エディターのポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン(例えばCRISPR由来ドメイン)は、ガイドポリヌクレオチドと会合することによって標的ポリヌクレオチド配列を認識することができる。ガイドポリヌクレオチド(例えばgRNA)は、典型的には一本鎖であり、ポリヌクレオチドの標的配列に部位特異的に(すなわち相補的塩基対形成を介して)結合するようにプログラムすることができ、それによって、ガイド核酸を伴った塩基エディターを標的配列に導く。ガイドポリヌクレオチドはDNAであり得る。ガイドポリヌクレオチドはRNAであり得る。当業者には理解されるであろうように、ガイドポリヌクレオチド配列において、ウラシル(U)は配列中のチミジン(T)を置換する。いくつかの実施形態では、ガイドポリヌクレオチドは天然ヌクレオチド(例えばアデノシン)を含む。いくつかの実施形態では、ガイドポリヌクレオチドは、非天然(または不自然)ヌクレオチド(例えばペプチド核酸またはヌクレオチドアナログ)を含む。いくつかの実施形態では、ガイド核酸配列の標的化領域は、長さ少なくとも15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチドであり得る。ガイド核酸の標的化領域は、長さ10~30ヌクレオチドの間、または長さ15~25ヌクレオチドの間、または長さ15~20ヌクレオチドの間であり得る。いくつかの実施形態では、ガイドポリヌクレオチドは、特に5'端で、1、2、3、4などのヌクレオチド分、切り詰め(truncated)され得る。限定されない例として、長さ20ヌクレオチドのガイドポリヌクレオチドは、特に5'端で、1、2、3、4などのヌクレオチド分、切り詰められ得る。
【0312】
いくつかの実施形態では、ガイドポリヌクレオチドは、例えば相補的塩基対形成を介して互いに相互作用できる、2つ以上の個別のポリヌクレオチドを含む(例えば二重ガイドポリヌクレオチド)。例えば、ガイドポリヌクレオチドは、CRISPR RNA (crRNA) およびトランス活性化CRISPR RNA (tracrRNA) を含むことができる。例えば、ガイドポリヌクレオチドは、1つ以上のトランス活性化CRISPR RNA (tracrRNA) を含むことができる。
【0313】
II型CRISPRシステムにおいて、CRISPRタンパク質(例えばCas9)による核酸の標的化は、典型的には、標的配列を認識する配列を含む第一のRNA分子 (crRNA) と、ガイドRNA-CRISPRタンパク質複合体を安定化させる足場領域を形成する反復配列を含む第二のRNA分子 (trRNA) との間の相補的塩基対形成を必要とする。このような二重ガイドRNAシステムは、本明細書に開示された塩基エディターを標的ポリヌクレオチド配列に導くためのガイドポリヌクレオチドとして使用され得る。
【0314】
いくつかの実施形態では、本明細書で提供される塩基エディターは、シングルガイドポリヌクレオチド(例えばsgRNA)を利用する。いくつかの実施形態では、本明細書で提供される塩基エディターは、デュアル(二重)ガイドポリヌクレオチド(例えばデュアルgRNA)を利用する。いくつかの実施形態では、本明細書で提供される塩基エディターは、1つ以上のガイドポリヌクレオチド(例えば複数のgRNA)を利用する。いくつかの実施形態では、シングルガイドポリヌクレオチドが、本明細書に記載される異なる塩基エディターのために利用される。例えば、シングルガイドポリヌクレオチドを、アデノシン塩基エディターのために利用することができる。
【0315】
他の実施形態では、ガイドポリヌクレオチドは、核酸のポリヌクレオチド標的化部分および核酸の足場部分の両方を単一分子(すなわち単一分子ガイド核酸)中に含むことができる。例えば、単一分子ガイドポリヌクレオチドは、シングルガイドRNA (sgRNAまたはgRNA)であり得る。本明細書において、「ガイドポリヌクレオチド配列」という用語は、塩基エディターと相互作用し標的ポリヌクレオチド配列に塩基エディターを導くことができる任意の単一、二重または複数分子核酸を企図する。
【0316】
典型的には、ガイドポリヌクレオチド(例えばcrRNA/trRNA複合体またはgRNA)は、標的ポリヌクレオチド配列を認識しそれに結合することができる配列を含む「ポリヌクレオチド標的化セグメント」と、塩基エディターのポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン構成要素内でガイドポリヌクレオチドを安定化させる「タンパク質結合セグメント」とを含む。いくつかの実施形態では、ガイドポリヌクレオチドのポリヌクレオチド標的化セグメントは、DNAポリヌクレオチドを認識してそれに結合し、それによりDNA中の塩基の編集を促進する。他の実施形態では、ガイドポリヌクレオチドのポリヌクレオチド標的化セグメントは、RNAポリヌクレオチドを認識しそれに結合し、それによりRNA中の塩基の編集を促進する。ここで、「セグメント」とは、分子の一部分または領域、例えばガイドポリヌクレオチド中の連続したヌクレオチドのストレッチをいう。また、セグメントは、複合体の領域/セクションも指すことも可能であり、従ってセグメントは1つより多い分子の領域を含むことも可能である。例えば、ガイドポリヌクレオチドが複数の核酸分子を含む場合、タンパク質結合セグメントは、例えば相補性の領域に沿ってハイブリダイズした複数の別個の分子のすべてまたは一部を含むことができる。いくつかの実施形態では、2つの別個の分子を含むDNA標的化RNAのタンパク質結合セグメントは、 (i) 長さ100塩基対である第一のRNA分子の塩基対40~75;および(ii) 長さ50塩基対である第二のRNA分子の10~25塩基対を含み得る。「セグメント」の定義は、特定の文脈において特に定義されない限り、全塩基対のうちの特定の数に限定されず、所定のRNA分子由来の塩基対のいかなる特定の数にも限定されず、複合体内の別個の分子の特定の数に限定されず、任意の全長のRNA分子の領域を含んでもよく、他の分子に対する相補性を有する領域を含んでもよい。
【0317】
ガイドRNAまたはガイドポリヌクレオチドは、2つ以上のRNA、例えばCRISPR RNA (crRNA) およびトランス活性化crRNA (tracrRNA) を含むことができる。ガイドRNAまたはガイドポリヌクレオチドは、時に、crRNAおよびtracrRNAの一部分(例えば機能的部分) の融合によって形成される単一鎖RNA、またはシングルガイドRNA (sgRNA) を含み得る。ガイドRNAまたはガイドポリヌクレオチドはまた、crRNAおよびtracrRNAを含むデュアルRNAであってもよい。さらに、crRNAは標的DNAとハイブリダイズし得る。
【0318】
上に論じるように、ガイドRNAまたはガイドポリヌクレオチドは、発現産物であり得る。例えば、ガイドRNAをコードするDNAは、ガイドRNAをコードする配列を含むベクターであり得る。ガイドRNAまたはガイドポリヌクレオチドは、単離されたガイドRNA、またはガイドRNAをコードする配列およびプロモーターを含むプラスミドDNAを細胞にトランスフェクションすることによって、細胞内にトランスファーすることができる。ガイドRNAまたはガイドポリヌクレオチドは、ウイルス仲介遺伝子送達の使用など、他の方法で細胞にトランスファーすることもできる。
【0319】
ガイドRNAまたはガイドポリヌクレオチドを単離することができる。例えば、ガイドRNAは、単離されたRNAの形態で細胞または生物にトランスフェクションされ得る。ガイドRNAは、当技術分野で公知の任意のin vitro転写システムを用いたin vitro転写によって調製することができる。ガイドRNAは、ガイドRNAをコードする配列を含むプラスミドの形態ではなく、単離されたRNAの形態で細胞にトランスファーされ得る。
【0320】
ガイドRNAまたはガイドポリヌクレオチドは、以下の3つの領域を含み得る:染色体配列中の標的部位に相補的であり得る5’端での第一の領域、ステムループ構造を形成し得る第二の内部領域、および一本鎖であり得る第三の3’領域。また、各ガイドRNAが融合タンパク質を特異的な標的部位にガイドするように、各ガイドRNAの第一の領域は異なっていてもよい。さらに、各ガイドRNAの第二および第三の領域は、すべてのガイドRNAにおいて同一であり得る。
【0321】
ガイドRNAまたはガイドポリヌクレオチドの第一の領域は、そのガイドRNAの第一の領域が標的部位と塩基対を形成できるように、染色体配列中の標的部位で配列に相補的であり得る。いくつかの実施形態では、ガイドRNAの第一の領域は、約10ヌクレオチド~25ヌクレオチド(すなわち、10ヌクレオチド~ヌクレオチド;または約10ヌクレオチド~約25ヌクレオチド;または10ヌクレオチド~約25ヌクレオチド;または約10ヌクレオチド~25ヌクレオチド)またはそれより多くを含むことができる。例えば、ガイドRNAの第一の領域と染色体配列中の標的部位との間の塩基対形成の領域は、長さ10、11、12、13、14、15、16、17、18、19、20、22、23、24、25またはそれより多くのヌクレオチドであり得るか、またはおよそその長さであり得る。いくつかの実施形態では、ガイドRNAの第一の領域は、長さ19、20、もしくは21ヌクレオチド、または約19、20、もしくは21ヌクレオチドであり得る。
【0322】
ガイドRNAまたはガイドポリヌクレオチドはまた、二次構造を形成する第二の領域を含むこともできる。例えば、ガイドRNAによって形成される二次構造は、ステム(またはヘアピン)およびループを含むことができる。ループとステムの長さは多様であり得る。例えば、ループの長さは(約)3~10ヌクレオチドの範囲であってもよく、ステムの長さは(約)6~20塩基対の範囲であってもよい。ステムは、1~10または約10ヌクレオチドの1つ以上のバルジを含んでもよい。第二の領域の全長は、長さ(約)16~60ヌクレオチドの範囲であってもよい。例えば、ループは長さ(約)4ヌクレオチドであってもよく、ステムは(約)12塩基対であってもよい。
【0323】
ガイドRNAまたはガイドポリヌクレオチドは、本質的に一本鎖状態であり得る3'端の第三の領域も含むこともできる。例えば、第三の領域は、関心対象の細胞のいずれの染色体配列とも相補的でないこともあれば、ガイドRNAの残りの部分と相補的でないこともある。さらに第三の領域の長さは多様であり得る。第三の領域は、長さ(約)4ヌクレオチド以上であり得る。例えば、第三の領域の長さは、長さ(約)5~60ヌクレオチドの範囲であり得る。
【0324】
ガイドRNAまたはガイドポリヌクレオチドは、遺伝子標的の任意のエクソンまたはイントロンを標的とすることができる。いくつかの実施形態では、ガイドは遺伝子のエクソン1または2を標的にすることができ;他の実施形態では、ガイドは遺伝子のエクソン3または4を標的にすることができる。組成物は、すべてが同じエクソンを標的とする複数のガイドRNA、またはいくつかの実施形態では、異なるエクソンを標的とし得る複数のガイドRNAを含むことができる。遺伝子のエクソンとイントロンが標的とされ得る。
【0325】
ガイドRNAまたはガイドポリヌクレオチドは、(約)20ヌクレオチドの核酸配列を標的とし得る。標的核酸は、(約)20ヌクレオチド未満であり得る。標的核酸は、長さ少なくとも(約)5、10、15、16、17、18、19、20、21、22、23、24、25、30、または1~100ヌクレオチドの間の任意の長さであり得る。標的核酸は、長さ多くとも(約)5、10、15、16、17、18、19、20、21、22、23、24、25、30、40、50ヌクレオチド、または1~100ヌクレオチドの間の任意の長さであり得る。標的核酸配列は、PAMの最初のヌクレオチドのすぐ5’側の(約)20塩基であり得る。ガイドRNAは、核酸配列を標的化し得る。標的核酸は、少なくとも(約)1~10、1~20、1~30、1~40、1~50、1~60、1~70、1~80、1~90、または1~100ヌクレオチドであり得る。
【0326】
ガイドポリヌクレオチド、例えば、ガイドRNAは、別の核酸、例えば、細胞のゲノム中の標的核酸またはプロトスペーサーにハイブリダイズし得る核酸を指すことができる。ガイドポリヌクレオチドはRNAであり得る。ガイドポリヌクレオチドはDNAであり得る。ガイドポリヌクレオチドは、核酸の配列に部位特異的に結合するようにプログラムまたは設計され得る。ガイドポリヌクレオチドは、1つのポリヌクレオチド鎖を含んでもよく、シングルガイドポリヌクレオチドと呼ばれてもよい。ガイドポリヌクレオチドは、2つのポリヌクレオチド鎖を含んでもよく、ダブルガイドポリヌクレオチドと呼ばれてもよい。ガイドRNAはRNA分子として細胞や胚に導入されてもよい。例えば、RNA分子は、in vitroで転写されてもよく、および/または化学的に合成されてもよい。RNAは、合成DNA分子、例えばgBlocks(登録商標)遺伝子断片から転写されてもよい。次いで、ガイドRNAはRNA分子として細胞や胚に導入され得る。ガイドRNAはまた、非RNA核酸分子、例えばDNA分子の形態で細胞または胚に導入され得る。例えば、ガイドRNAをコードするDNAが、関心対象の細胞または胚におけるガイドRNAの発現のためにプロモーター制御配列に機能可能に連結され得る。RNAコード配列は、RNAポリメラーゼIII (Pol III)によって認識されるプロモーター配列に機能可能に連結され得る。ガイドRNAを発現するために使用することができるプラスミドベクターは、px330ベクターおよびpx333ベクターを含むが、これらに限定されない。いくつかの実施形態では、プラスミドベクター(例えばpx333ベクター)は、少なくとも2つのガイドRNAをコードするDNA配列を含むことができる。
【0327】
ガイドポリヌクレオチド、例えばガイドRNAおよび標的化配列を選択、設計および検証するための方法は、本明細書中に記載され、当業者に知られている。例えば、核酸塩基エディターシステムにおけるデアミナーゼドメイン(例えばAIDドメイン)の潜在的基質混合性(promiscuity)の影響を最小限にするために、意図せず脱アミノ化の標的となり得る残基(例えば、標的核酸遺伝子座内のssDNA上に潜在的に位置し得るオフターゲットC残基)の数を最小限にすることができる。さらに、ソフトウェアツールを使用して、標的核酸配列に対応するgRNAを最適化することができ、例えば、ゲノム全体の総オフターゲット活性を最小限にすることができる。例えば、S. pyogenes Cas9を用いた標的化ドメイン選択肢の各可能性について、(例えばNAGまたはNGGなどの選択されたPAMに先行する)ある数(例えば1、2、3、4、5、6、7、8、9、または10)までのミスマッチ塩基対を含むすべてのオフターゲット配列をゲノムにわたって同定することができる。標的部位に相補的なgRNAの第一の領域を同定することができ、すべての第一の領域(例えばcrRNA)をその総予測オフターゲットスコアに従ってランク付けすることができ;上位にランクされた標的化ドメインは、最大のオンターゲット活性と最小のオフターゲット活性を持つ可能性が高いものを表す。候補標的化gRNAは、当技術分野で公知の方法および/または本明細書に記載の方法を用いて機能的に評価することができる。
【0328】
非限定的な例として、Cas9とともに使用するためのガイドRNAのcrRNAにおける標的DNAハイブリダイズ配列は、DNA配列探索アルゴリズムを用いて同定することができる。gRNA設計は、Bae S., Park J., & Kim J.-S. Cas-OFFinder: A fast and versatile algorithm that searches for potential off-target sites of Cas9 RNA-guided endonucleases. Bioinformatics 30, 1473-1475 (2014)に記載されているような公開ツールcas-offinderに基づくカスタムgRNA設計ソフトウェアを用いて実施することができる。このソフトウェアは、ガイドのゲノム全体のオフターゲット傾向を計算した後にガイドにスコアを付ける。典型的には、完全マッチから7個のミスマッチまでの範囲の一致が、17~24の長さの範囲のガイドについて考慮される。いったんオフターゲット部位が計算的に決定されると、各ガイドについて集約スコアが計算され、ウェブインターフェースを使用した表形式の出力に要約される。PAM配列に隣接する潜在的な標的部位を同定することに加えて、ソフトウェアはまた、選択された標的部位から1、2、3ヌクレオチドまたは3ヌクレオチドより多く異なるすべてのPAM隣接配列も同定する。標的核酸配列、例えば標的遺伝子についてのゲノムDNA配列を得て、反復要素を、公的に入手可能なツール、例えば、RepeatMaskerプログラムを用いてスクリーニングすることができる。RepeatMaskerは、入力されたDNA配列から、反復要素や低複雑性領域を探し出す。所定のクエリー配列に存在する反復の詳細な注釈が出力となる。
【0329】
同定後、ガイドRNA、例えばcrRNAの第一の領域が、標的部位へのそれらの距離、それらの直交性(orthogonality)、および関連するPAM配列との密接な一致のための5’ヌクレオチドの存在(例えば、関連するPAM、例えば、S. pyogenesについてのNGG PAM、S. aureusについてのNNGRRTまたはNNGRRV PAMを含むヒトゲノムにおける密接な一致の同定に基づく5’G)に基づいて、階層にランク付けされ得る。本明細書において使用される際、直交性とは、標的配列に対して最小数のミスマッチを含む、ヒトゲノムにおける配列の数を表す。「高レベルの直交性」または「優れた直交性」は、例えば、意図される標的以外にヒトゲノムにおいて同一の配列を持たず、標的配列において1つまたは2つのミスマッチを含有する配列も持たない20量体標的化ドメインを指し得る。優れた直交性を有する標的化ドメインは、オフターゲットDNA切断を最小化するように選択され得る。
【0330】
いくつかの実施形態では、塩基編集活性を検出すること、および候補ガイドポリヌクレオチドを試験することのためにレポーターシステムが使用され得る。いくつかの実施形態では、レポーターシステムは、塩基編集活性がレポーター遺伝子の発現をもたらす、レポーター遺伝子に基づくアッセイを含むことができる。例えば、レポーターシステムは、不活化開始コドン、例えば、テンプレート鎖上の3'-TAC-5'から3'-CAC-5'への突然変異を含むレポーター遺伝子を含み得る。標的Cの脱アミノ化に成功すると、対応するmRNAは5'-GUG-3'ではなく5'-AUG-3'として転写され、レポーター遺伝子の翻訳を可能にする。適切なレポーター遺伝子は、当業者には明らかであろう。レポーター遺伝子の非限定的な例には、緑色蛍光タンパク質 (GFP) 、赤色蛍光タンパク質 (RFP) 、ルシフェラーゼ、分泌型アルカリホスファターゼ (SEAP) をコードする遺伝子、または発現が検出可能であり当業者には明らかである任意の他の遺伝子が含まれる。レポーターシステムを用いて、多くの異なるgRNAを試験することができ、例えば、標的DNA配列に関してどのヌクレオチド残基(複数可)をそれぞれのデアミナーゼが標的とするかを決定することができる。非テンプレート鎖ヌクレオチド残基を標的とするsgRNAもまた、特定の塩基編集タンパク質、例えばCas9デアミナーゼ融合タンパク質のオフターゲット効果を評価するために試験することができる。いくつかの実施形態では、そのようなgRNAは、突然変異開始コドンがgRNAと塩基対を形成しないように設計することができる。ガイドポリヌクレオチドは、標準ヌクレオチド、修飾ヌクレオチド(例えば、プソイドウリジン)、ヌクレオチド異性体、および/またはヌクレオチドアナログを含むことができる。いくつかの実施形態では、ガイドポリヌクレオチドは、少なくとも1つの検出可能な標識を含むことができる。検出可能な標識は、フルオロフォア(例えば、FAM、TMR、Cy3、Cy5、テキサスレッド、オレゴングリーン、Alexa Fluor、Haloタグ、または任意の他の適切な蛍光色素)、検出タグ(例えば、ビオチン、ジゴキシゲニン等)、量子ドット、または金粒子であり得る。
【0331】
ガイドポリヌクレオチドは、化学的に、および/または酵素的に合成され得る。例えば、ガイドRNAは、ホスホロアミダイトに基づく標準的な固相合成法を用いて合成することができる。あるいは、ガイドRNAをコードするDNAを、ファージRNAポリメラーゼにより認識されるプロモーター制御配列に機能可能に連結することによって、ガイドRNAをin vitroで合成することができる。適切なファージプロモーター配列の例には、T7、T3、SP6プロモーター配列、またはそれらの変型が含まれる。ガイドRNAが2つの別々の分子(例えば、crRNAとtracrRNA)を含む実施形態では、crRNAは化学的に合成することができ、tracrRNAは酵素的に合成することができる。
【0332】
いくつかの実施形態では、塩基エディターシステムは、複数のガイドポリヌクレオチド、例えばgRNAを含み得る。例えば、gRNAは、塩基エディターを、1つ以上の標的遺伝子座(例えば少なくとも1つのgRNA、少なくとも2つのgRNA、少なくとも5つのgRNA、少なくとも10のgRNA、少なくとも20のgRNA、少なくとも30のgRNA、少なくとも50のgRNA)に標的指向化することができる。いくつかの実施形態では、複数のgRNA配列はタンデムに配置されてもよく、好ましくは直接反復配列によって分離される。
【0333】
ガイドRNAまたはガイドポリヌクレオチドをコードするDNA配列はまた、ベクターの一部であってもよい。いくつかの実施形態では、ベクターは、追加の発現制御配列(例えばエンハンサー配列、Kozak配列、ポリアデニル化配列、転写終結配列など)、選択可能なマーカー配列(例えばGFPまたはピューロマイシンなどの抗生物質耐性遺伝子)、複製起点などを含むことができる。ガイドRNAまたはガイドポリヌクレオチドをコードするDNA分子は直鎖であってもまた環状であってもよい。
【0334】
いくつかの実施形態では、塩基エディターシステムの1つ以上の構成要素は、DNA配列によってコードされ得る。このようなDNA配列は、発現系、例えば細胞に一緒に、または別々に導入されてもよい。例えば、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインおよびガイドRNAをコードするDNA配列を細胞に導入することができ、各DNA配列は別個の分子の一部であってもよく(例えばポリヌクレオチドプログラム可能ヌクレオチド結合ドメインのコード配列を含む1つのベクターおよびガイドRNAコード配列を含む第二のベクター)、または両方が同じ分子の一部であることができる(例えばポリヌクレオチドプログラム可能ヌクレオチド結合ドメインおよびガイドRNAの両方のためのコード(および調節)配列を含む1つのベクター)。
【0335】
ガイドポリヌクレオチドは、新しいまたは増強された特徴を有する核酸を提供するための1つ以上の修飾を含むことができる。ガイドポリヌクレオチドは、核酸アフィニティタグを含むことができる。ガイドポリヌクレオチドは、合成ヌクレオチド、合成ヌクレオチドアナログ、ヌクレオチド誘導体、および/または修飾ヌクレオチドを含むことができる。
【0336】
いくつかの実施形態では、gRNAまたはガイドポリヌクレオチドは修飾を含むことができる。修飾は、gRNAまたはガイドポリヌクレオチドの任意の位置に施され得る。シングルgRNAまたはガイドポリヌクレオチドに対して複数の修飾を行うことができる。gRNAまたはガイドポリヌクレオチドは、修飾後に品質管理を受けることができる。いくつかの実施形態では、品質管理は、PAGE、HPLC、MS、またはそれらの任意の組み合わせを含むことができる。
【0337】
gRNAまたはガイドポリヌクレオチドの修飾は、置換、挿入、欠失、化学的修飾、物理的修飾、安定化、精製、またはそれらの任意の組み合わせであり得る。
【0338】
gRNAまたはガイドポリヌクレオチドはまた、5’アデニル酸、5’グアノシン三リン酸キャップ、5’N 7-メチルグアノシン三リン酸キャップ、5’三リン酸キャップ、3’リン酸、3’チオリン酸、5’リン酸、5’チオリン酸、Cis-Synチミジンダイマー、トリマー、C12スペーサー、C3スペーサー、C6スペーサー、dスペーサー、PCスペーサー、rスペーサー、スペーサー18、スペーサー9、3’-3’修飾、5’-5’修飾、塩基脱落、アクリジン、アゾベンゼン、ビオチン、ビオチンBB、ビオチンTEG、コレステリルTEG、デスチオビオチンTEG、DNP TEG、DNP-X、DOTA、dT-ビオチン、二重ビオチン、PCビオチン、ソラレンC2、ソラレンC6、TINA、3’DABCYL、ブラックホールクエンチャー1、ブラックホールクエンチャー2、DABCYL SE、dT-DABCYL、IRDye QC-1、QSY-21、QSY-35、QSY-7、QSY-9、カルボキシルリンカー、チオールリンカー、2’-デオキシリボヌクレオシドアナログプリン、2’-デオキシリボヌクレオシドアナログピリミジン、リボヌクレオシドアナログ、2’-O-メチルリボヌクレオシドアナログ、糖修飾アナログ、ウォブル/ユニバーサル塩基、蛍光色素標識、2’-フルオロRNA、2’-O-メチルRNA、メチルホスホネート、ホスホジエステルDNA、ホスホジエステルRNA、ホスホチオエートDNA、ホスホロチオエートRNA、UNA、プソイドウリジン-5’-三リン酸、5’-メチルシジン-5’-三リン酸、またはそれらの任意の組み合わせでも修飾され得る。
【0339】
いくつかの実施形態では、修飾は永続的である。他の実施形態では、修飾は一過性である。いくつかの実施形態では、gRNAまたはガイドポリヌクレオチドに対して複数の修飾が行われる。gRNAまたはガイドポリヌクレオチドの修飾は、それらのコンホメーション、極性、疎水性、化学反応性、塩基対形成相互作用、またはそれらの組み合わせなどの、ヌクレオチドの物理化学的特性を改変することができる。
【0340】
修飾はホスホロチオエート置換でもあり得る。いくつかの実施形態では、天然のホスホジエステル結合は細胞のヌクレアーゼによって急速に分解されやすく、ホスホロチオエート (PS) 結合置換体を用いたヌクレオチド間連結の修飾は、細胞分解による加水分解に対してより安定であってもよい。修飾は、gRNAまたはガイドポリヌクレオチドの安定性を増大させることができる。修飾はまた、生物学的活性を増強させることもできる。いくつかの実施形態では、ホスホロチオエート強化RNA gRNAは、RNアーゼA、RNアーゼT1、子ウシ血清ヌクレアーゼ、またはそれらの組み合わせを阻害することができる。これらの特性は、in vivoまたはin vitroでヌクレアーゼへの曝露がある可能性が高い適用において、PS-RNA gRNAの使用を可能にし得る。例えば、ホスホロチオエート (PS) 結合をgRNAの5'末端または3'末端の13~5ヌクレオチドの間に導入することができ、それはエキソヌクレアーゼ分解を阻害し得る。いくつかの実施形態では、ホスホロチオエート結合をgRNA全体に加えてエンドヌクレアーゼによる攻撃を減らすことができる。
【0341】
プロトスペーサー隣接モチーフ
用語「プロトスペーサー隣接モチーフ (PAM)」またはPAM様モチーフは、CRISPR細菌適応免疫系においてCas9ヌクレアーゼによって標的化されるDNA配列の直後の2~6塩基対DNA配列を指す。いくつかの実施形態では、PAMは5’PAM (すなわちプロトスペーサーの5’端の上流に位置する)であり得る。他の実施形態では、PAMは3’PAM (すなわちプロトスペーサーの5’端の下流に位置する)であり得る。PAM配列は標的結合に必須であるが、正確な配列はCasタンパク質のタイプに依存する。PAM配列は、当技術分野で公知の任意のPAM配列であり得る。適切なPAM配列には、以下が含まれるが、これらに限定されない:NGG、NGA、NGC、NGN、NGT、NGTT、NGCG、NGAG、NGAN、NGNG、NGCN、NGCG、NGTN、NNGRRT、NNNRRT、NNGRR(N)、TTTV、TYCV、TYCV、TATV、NNNNGATT、NNAGAAW、またはNAAAAC。Yはピリミジンであり、Nは任意のヌクレオチド塩基であり、WはAまたはTである。
【0342】
本明細書で提供される塩基エディターは、カノニカルまたは非カノニカル・プロトスペーサー隣接モチーフ (PAM) 配列を含むヌクレオチド配列に結合することができるCRISPRタンパク質由来ドメインを含むことができる。PAM部位は、標的ポリヌクレオチド配列に近接するヌクレオチド配列である。本開示のいくつかの態様は、異なるPAM特異性を有するCRISPRタンパク質のすべてまたは一部を含む塩基エディターを提供する。
【0343】
例えば、S. pyogenes由来のCas9 (spCas9) などのCas9タンパク質は、典型的には、特定の核酸領域に結合するためにカノニカルなNGG PAM配列を必要とし、ここで「NGG」中の「N」はアデニン (A) 、チミン (T) 、グアニン (G) 、またはシトシン (C) であり、Gはグアニンである。PAMはCRISPRタンパク質特異的であってもよく、異なるCRISPRタンパク質由来ドメインを含む異なる塩基エディター間で異なってもよい。PAMは標的配列の5’または3’にあり得る。PAMは、標的配列の上流または下流にあり得る。PAMは、長さ1、2、3、4、5、6、7、8、9、10ヌクレオチドまたはそれより長くてもよい。しばしば、PAMは長さ2~6ヌクレオチドである。
【0344】
いくつかの実施形態では、PAMは「NRN」PAMであり、ここで「NRN」中の「N」はアデニン(A)、チミン(T)、グアニン(G)、またはシトシン(C)であり、Rはアデニン(A)またはグアニン(G)であるか;あるいはPAMは「NYN」PAMであり、ここでNYN中の「N」はアデニン(A)、チミン(T)、グアニン(G)、またはシトシン(C)であり、Yはシチジン(C)またはチミン(T)であり、例えば、その全内容が参照により本明細書に組み込まれる、R.T. Walton et al., 2020, Science, 10.1126/science.aba8853 (2020)に記載される通りである。
【0345】
いくつかのPAMバリアントが下記表2に記載されている。
【表2】
【0346】
いくつかの実施形態では、PAMはNGCである。いくつかの実施形態では、NGC PAMはCas9バリアントによって認識される。いくつかの実施形態では、NGC PAMバリアントには、D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R(集合的に「MQKFRAER」と称される)より選択される1つ以上のアミノ酸置換が含まれる。
【0347】
いくつかの実施形態では、PAMはNGTである。いくつかの実施形態では、NGT PAMはCas9バリアントによって認識される。いくつかの実施形態では、NGT PAMバリアントは、1335、1337、1135、1136、1218、および/または1219の1つ以上の残基での標的化突然変異を通じて生成される。いくつかの実施形態では、NGT PAMバリアントは、1219、1335、1337、1218の1つ以上の残基での標的化突然変異を通じて生成される。いくつかの実施形態では、NGT PAMバリアントは、1135、1136、1218、1219、および1335の1つ以上の残基での標的化突然変異を通じて生成される。いくつかの実施形態では、NGT PAMバリアントは、下記表3および表4に提供される標的化突然変異のセットから選択される。
【表3】
【表4】
【0348】
いくつかの実施形態では、NGT PAMバリアントは、表3および4のバリアント5、7、28、31、または36から選択される。いくつかの実施形態では、バリアントは、改善されたNGT PAM認識を有する。
【0349】
いくつかの実施形態では、NGT PAMバリアントは、残基1219、1335、1337および/または1218で突然変異を有する。いくつかの実施形態では、NGT PAMバリアントは、下記表5に提供されるバリアントから、認識を改善するための突然変異を伴って選択される。
【表5】
【0350】
いくつかの実施形態では、NGT PAMに対する特異性を持つ塩基エディターを、下記表6に提供するように生成してもよい。
【表6】
【0351】
いくつかの実施形態では、NGTNバリアントはバリアント1である。いくつかの実施形態では、NGTNバリアントはバリアント2である。いくつかの実施形態では、NGTNバリアントはバリアント3である。いくつかの実施形態では、NGTNバリアントはバリアント4である。いくつかの実施形態では、NGTNバリアントはバリアント5である。いくつかの実施形態では、NGTNバリアントはバリアント6である。
【0352】
いくつかの実施形態では、Cas9ドメインは、Streptococcus pyogenes由来のCas9ドメインである (SpCas9)。いくつかの実施形態では、SpCas9ドメインは、ヌクレアーゼ活性SpCas9、ヌクレアーゼ不活性SpCas9 (SpCas9d) 、またはSpCas9ニッカーゼ (SpCas9n) である。いくつかの実施形態では、SpCas9は、D9X突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXはD以外の任意のアミノ酸である。いくつかの実施形態では、SpCas9は、D9A突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態では、SpCas9ドメイン、SpCas9dドメインまたはSpCas9nドメインは、非カノニカルPAMを有する核酸配列に結合することができる。いくつかの実施形態では、SpCas9ドメイン、SpCas9dドメインまたはSpCas9nドメインは、NGG、NGAまたはNGCG PAM配列を有する核酸配列に結合することができる。いくつかの実施形態では、SpCas9ドメインは、D1135X、R1335X、およびT1337X突然変異の1つ以上、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態では、SpCas9ドメインは、D1135E、R1335Q、およびT1337R突然変異の1つ以上、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態では、SpCas9ドメインは、D1135E、R1335Q、およびT1337R突然変異、または本明細書に提供されるアミノ配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態では、SpCas9ドメインは、D1135X、R1335X、およびT1337X突然変異の1つ以上、または本明細書において提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態では、SpCas9ドメインは、D1135V、R1335Q、およびT1337R突然変異の1つ以上、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態では、SpCas9ドメインは、D1135V、R1335Q、およびT1337R突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態では、SpCas9ドメインは、D1135X、G1218X、R1335X、およびT1337X突然変異の1つ以上、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態では、SpCas9ドメインは、D1135V、G1218R、R1335Q、およびT1337R突然変異の1つ以上、または本明細書に提供されるアミノ配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態では、SpCas9ドメインは、D1135V、G1218R、R1335Q、およびT1337R突然変異、または本明細書において提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。
【0353】
いくつかの実施形態では、本明細書に提供される融合タンパク質のいずれかのCas9ドメインは、本明細書に記載されるCas9ポリペプチドに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、本明細書に提供される融合タンパク質のいずれかのCas9ドメインは、本明細書に記載される任意のCas9ポリペプチドのアミノ酸配列を含む。いくつかの実施形態では、本明細書に提供される融合タンパク質のいずれかのCas9ドメインは、本明細書に記載される任意のCas9ポリペプチドのアミノ酸配列からなる。
【0354】
いくつかの例では、本明細書に開示される塩基エディターのCRISPRタンパク質由来ドメインによって認識されるPAMは、塩基エディターをコードする挿入物 (例えばAAV挿入物)とは別個のオリゴヌクレオチド上で細胞に提供され得る。そのような実施形態では、別個のオリゴヌクレオチド上にPAMを提供することは、そうでなければ標的配列と同じポリヌクレオチド上に隣接するPAMが存在しないために切断することができない標的配列の切断を可能にする。
【0355】
一実施形態では、S. pyogenes Cas9 (SpCas9) を、ゲノム工学操作のためのCRISPRエンドヌクレアーゼとして使用することができる。しかし、他のものも使用され得る。いくつかの実施形態では、異なるエンドヌクレアーゼを用いて特定のゲノム標的を標的化することができる。いくつかの実施形態では、非NGG PAM配列を有する合成SpCas9由来バリアントを使用することができる。さらに、多様な種由来の他のCas9オルソログが同定されており、これらの 「非SpCas9」は、本開示でも有用になり得る多様なPAM配列に結合し得る。例えば、比較的大きなサイズのSpCas9(約4kbのコード配列)は、細胞内で効率的に発現することができないSpCas9 cDNA所持プラスミドを導くこともあり得る。逆に、Staphylococcus aureus Cas9 (SaCas9) のコード配列は、SpCas9よりも約1キロ塩基短いため、細胞内で効率的に発現させ得る。SpCas9と同様に、SaCas9エンドヌクレアーゼは、in vitroの哺乳動物細胞およびin vivoのマウスにおいて標的遺伝子を修飾する能力がある。いくつかの実施形態では、Casタンパク質は異なるPAM配列を標的とすることができる。いくつかの実施形態では、標的遺伝子は、例えば、Cas9 PAM、5’-NGGに隣接し得る。他の実施形態では、他のCas9オルソログは異なるPAM要件を有し得る。例えば、S. thermophilus(CRISPR1の場合は5’-NNAGAA、CRISPR3の場合は5’-NGGNG)およびNeisseria meningiditis(5’-NNNNGATT)のもののような他のPAMも標的遺伝子に隣接して見出され得る。
【0356】
いくつかの実施形態では、S. pyogenesシステムについて、標的遺伝子配列は、5’-NGG PAMの前(すなわち、その5’側)にあることも可能であり、20 ntガイドRNA配列が、反対側の鎖と塩基対を形成して、PAMに隣接するCas9切断を仲介することができる。いくつかの実施形態では、隣接切断は、PAMの(約)3塩基対上流であり得る。いくつかの実施形態では、隣接切断は、PAMの(約)10塩基対上流であり得る。いくつかの実施形態では、隣接切断は、PAMの(約)0~20塩基対上流であり得る。例えば、隣接切断は、PAM上流の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30塩基対の隣であり得る。隣接切断はPAMの1~30塩基対下流でもあり得る。PAM配列に結合することができる例示的なSpCas9タンパク質の配列は、以下の通りである:
【0357】
例示的なPAM結合SpCas9のアミノ酸配列は以下の通りである:
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0358】
例示的なPAM結合SpCas9nのアミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0359】
例示的なPAM結合SpEQR Cas9のアミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFESPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0360】
D1135、R1335およびT1337から突然変異されてSpEQR Cas9を生じることができる上記残基E1135、Q1335およびR1337を下線と太字で示す。
【0361】
例示的なPAM結合SpVQR Cas9のアミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0362】
D1135、R1335、およびT1337から突然変異されてSpVQR Cas9を生じることができる上記残基V1135、Q1335、およびR1337を下線と太字で示す。
【0363】
例示的なPAM結合SpVRER Cas9のアミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKEYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0364】
D1135、G1218、R1335、およびT1337から突然変異されてSpVRER Cas9を生じることができる上記残基V1135、R1218、Q1335およびR1337を下線と太字で示す。
【0365】
例示的なPAM結合SpVRQR Cas9のアミノ酸配列は以下の通りである:例示的なSpVRQR Cas9
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0366】
D1135、G1218、R1335、およびT1337から突然変異されてSpVRQR Cas9を生じることができる上記残基V1135、R1218、Q1335およびR1337を下線と太字で示す。
【0367】
いくつかの実施形態では、操作SpCas9バリアントは、3' H(非G PAM)が隣接するプロトスペーサー隣接モチーフ(PAM)配列を認識可能である(表1A~1Dを参照のこと)。いくつかの実施形態では、SpCas9バリアントはNRNH PAMを認識する(RはAまたはGであり、HはA、CまたはTである)。いくつかの実施形態では、非G PAMはNRRH、NRTH、またはNRCHである(例えば、その全体が参照により本明細書に組み込まれる、Miller S.M., et al. Continuous evolution of SpCas9 variants compatible with non-G PAMs. Nat Biotechnol. (2020)を参照のこと)。
【0368】
いくつかの実施形態では、Cas9ドメインは、組換えCas9ドメインである。いくつかの実施形態では、組換えCas9ドメインは、SpyMacCas9ドメインである。いくつかの実施形態では、SpyMacCas9ドメインは、ヌクレアーゼ活性SpyMacCas9、ヌクレアーゼ不活性SpyMacCas9 (SpyMacCas9d) 、またはSpyMacCas9ニッカーゼ (SpyMacCas9n) である。いくつかの実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非カノニカルPAMを有する核酸配列に結合することができる。いくつかの実施形態では、SpyMacCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、NAA PAM配列を有する核酸配列に結合することができる。
【0369】
天然5'-NAAN-3' PAM特異性を有するStreptococcus macacae中のSpy Cas9の例示的なCas9Aホモログの配列は、当技術分野に知られ、例えばJakimo et al., (www.biorxiv.org/content/biorxiv/early/2018/09/27/429654.full.pdf)に記載され、以下に提供される。
【0370】
例示的なSpyMacCas9
MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKFKVLGNTDRHSIKKNLIGALLFGSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLADSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQIYNQLFEENPINASRVDAKAILSARLSKSRRLENLIAQLPGEKRNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNSEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGAYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDRGMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGHSLHEQIANLAGSPAIKKGILQTVKIVDELVKVMGHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFIKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEIQTVGQNGGLFDDNPKSPLEVTPSKLVPLKKELNPKKYGGYQKPTTAYPVLLITDTKQLIPISVMNKKQFEQNPVKFLRDRGYQQVGKNDFIKLPKYTLVDIGDGIKRLWASSKEIHKGNQLVVSKKSQILLYHAHHLDSDLSNDYLQNHNQQFDVLFNEIISFSKKCKLGKEHIQKIENVYSNKKNSASIEELAESFIKLLGFTQLGATSPFNFLGVKLNQKQYKGKKDYILPCTEGTLIRQSITGLYETRVDLSKIGED
【0371】
いくつかの実施形態には、バリアントCas9タンパク質はH840A、P475A、W476A、N477A、D1125A、W1126A、およびD1218A 突然変異を宿し、その結果、標的DNAまたはRNAを切断する能力が低下している。このようなCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力は低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力は保持している。別の非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、D10A、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1218A 突然変異を宿し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば一本鎖標的DNA)を切断する能力は低下しているが、標的DNA(例えば一本鎖標的DNA)に結合する能力を保持している。いくつかの実施形態では、バリアントCas9タンパク質がW476AおよびW1126A突然変異を有する場合、またはバリアントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、およびD1218A 突然変異を有する場合、バリアントCas9タンパク質はPAM配列に効率的に結合しない。従って、このような場合には、このようなバリアントCas9タンパク質を結合の方法に用いると、この方法はPAM配列を必要としない。換言すれば、いくつかの実施形態では、このようなバリアントCas9タンパク質を結合の方法に用いる場合、この方法はガイドRNAを含んでもよいが、この方法は、PAM配列の非存在下で行うことができる(従って、結合の特異性はガイドRNAの標的化セグメントによってもたらされる)。上記の効果を達成するために、他の残基が突然変異され得る(すなわち一方または他方のヌクレアーゼ部分を不活化する)。非限定的な例として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、および/またはA987を改変(すなわち置換)することができる。また、アラニン置換以外の突然変異も適切である。
【0372】
いくつかの実施形態では、塩基エディターのCRISPRタンパク質由来ドメインは、カノニカルPAM配列 (NGG) を有するCas9タンパク質のすべてまたは一部を含み得る。他の実施形態では、塩基エディターのCas9由来ドメインは、非カノニカルPAM配列を用いることができる。そのような配列は当技術分野で記述されており当業者には明らかであろう。例えば、非カノニカルPAM配列に結合するCas9ドメインは、Kleinstiver, B. P., et al., “Engineered CRISPR-Cas9 nucleases with altered PAM specificities” Nature, 523, 481-485 (2015); およびKleinstiver, B. P., et al., “Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition” Nature Biotechnology, 33, 1293-1298 (2015)に記述されており、それぞれの全内容は参照により本明細書に組み込まれる。
【0373】
PAM排他性が低減されたCas9ドメイン
典型的には、S. pyogenes由来のCas9 (spCas9) などのCas9タンパク質は、特定の核酸領域に結合するためにカノニカルなNGG PAM配列を必要とし、ここで「NGG」中の「N」はアデノシン (A) 、チミジン (T) またはシトシン (C) であり、Gはグアノシンである。これは、ゲノム内の所望の塩基を編集する能力を制限し得る。いくつかの実施形態では、本明細書に提供される塩基編集融合タンパク質は、正確な位置、例えばPAMの上流にある標的塩基を含む領域に配置することが必要になり得る。例えばKomor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016)を参照のこと(これらの内容全体は、参照により本明細書に組み込まれる)。従って、いくつかの実施形態では、本明細書で提供される融合タンパク質のいずれかは、カノニカルな(例えばNGG)PAM配列を含まないヌクレオチド配列に結合することができるCas9ドメインを含み得る。非カノニカルPAM配列に結合するCas9ドメインは本技術分野において記述されており当業者には明らかであろう。例えば、非カノニカルPAM配列に結合するCas9ドメインは、Kleinstiver, B. P., et al., “Engineered CRISPR-Cas9 nucleases with altered PAM specificities” Nature 523, 481-485 (2015); および Kleinstiver, B. P., et al., “Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition” Nature Biotechnology 33, 1293-1298 (2015)に記述されており、それぞれの全内容を参照により本明細書に組み込む。
【0374】
高忠実度Cas9ドメイン
本開示のいくつかの態様は、高忠実度Cas9ドメインを提供する。いくつかの実施形態では、高忠実度Cas9ドメインは、対応する野生型Cas9ドメインと比較して、Cas9ドメインとDNAの糖-リン酸主鎖との間の静電相互作用を減少させる1つ以上の突然変異を含む操作されたCas9ドメインである。特定の理論いずれかによって束縛されることは望ましくないが、DNAの糖-リン酸主鎖との静電相互作用を減少させた高忠実度Cas9ドメインは、より少ないオフターゲット効果を有し得る。いくつかの実施形態では、Cas9ドメイン(例えば、野生型Cas9ドメイン)は、Cas9ドメインとDNAの糖-リン酸主鎖との間の会合を減少させる1つ以上の突然変異を含む。いくつかの実施形態では、Cas9ドメインは、Cas9ドメインとDNAの糖-リン酸主鎖との間の会合を少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、または少なくとも70%減少させる1つ以上の突然変異を含む。
【0375】
いくつかの実施形態では、本明細書で提供されるCas9融合タンパク質のいずれかは、N497X、R661X、Q695X、および/またはQ926X突然変異の1つ以上、または本明細書で提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態では、本明細書で提供されるCas9融合タンパク質のいずれかは、N497A、R661A、Q695A、および/またはQ926A突然変異の1つ以上、または本明細書で提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態では、Cas9ドメインは、D10A突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。高い忠実度を有するCas9ドメインは当技術分野で公知であり、当業者には明らかであろう。例えば、高い忠実度を有するCas9ドメインは、Kleinstiver, B.P., et al. “High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects.” Nature 529, 490-495 (2016); および Slaymaker, I.M., et al. “Rationally engineered Cas9 nucleases with improved specificity.” Science 351, 84-88 (2015)に記述されており、それぞれの全内容は参照により本明細書に組み入れられる。
【0376】
いくつかの実施形態では、修飾Cas9は、高忠実度Cas9酵素である。いくつかの実施形態では、高忠実度Cas9酵素は、SpCas9(K855A)、eSpCas9(1.1)、SpCas9-HF1、または高精度Cas9バリアント(HypaCas9)である。修飾Cas9 eSpCas9(1.1)は、HNH/RuvCの溝と非標的DNA鎖との間の相互作用を弱めるアラニン置換を含み、オフターゲット部位での鎖分離と切断を防止する。同様に、SpCas9-HF1は、DNAリン酸主鎖とのCas9の相互作用を破壊するアラニン置換を介して、オフターゲット編集を低下させる。HypaCas9は、Cas9プルーフリーディングと標的識別を増加させる突然変異をREC3ドメインに含む(SpCas9 N692A/M694A/Q695A/H698A)。3つの高忠実度酵素はすべて、野生型Cas9よりもオフターゲット編集が少ない。
【0377】
例示的な高忠実度Cas9を以下に提供する。Cas9に対する高忠実度Cas9ドメイン突然変異を太字および下線で示している。
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTAFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGALSRKLINGIRDKQSGKTILDFLKSDGFANRNFMALIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRAITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0378】
核局在化配列 (NLS) を含む融合タンパク質
いくつかの実施形態では、本明細書で提供される融合タンパク質は、1つ以上 (例えば2つ、3つ、4つ、5つ) の核標的化配列、例えば、核局在化配列 (NLS) をさらに含む。一実施形態では、二部分NLSが使用される。いくつかの実施形態では、NLSは、NLSを含むタンパク質の細胞核内への移入(例えば核輸送によるもの)を促進するアミノ酸配列を含む。いくつかの実施形態では、本明細書に提供される融合タンパク質のいずれかは、核局在化配列 (NLS) をさらに含む。いくつかの実施形態では、NLSは融合タンパク質のN末端に融合される。いくつかの実施形態では、NLSは融合タンパク質のC末端に融合される。いくつかの実施形態では、NLSはCas9ドメインのN末端に融合される。いくつかの実施形態では、NLSはnCas9ドメインまたはdCas9ドメインのC末端に融合される。いくつかの実施形態では、NLSはデアミナーゼのN末端に融合される。いくつかの実施形態では、NLSはデアミナーゼのC末端に融合される。いくつかの実施形態では、NLSは、1つ以上のリンカーを介して融合タンパク質に融合される。いくつかの実施形態では、NLSは、リンカーなしで融合タンパク質に融合される。いくつかの実施形態では、NLSは、本明細書において提供または参照されるNLS配列のいずれか1つのアミノ酸配列を含む。追加の核局在化配列は当技術分野で公知であり、当業者には明らかであろう。例えば、NLS配列は、Plank et al., PCT/EP2000/011690に記載されており、その内容は、例示的な核局在化配列の開示について参照により本明細書に組み込まれる。いくつかの実施形態では、NLSは、アミノ酸配列
PKKKRKVEGADKRTADGSEFESPKKKRKV,
KRTADGSEFESPKKKRKV,
KRPAATKKAGQAKKKK,
KKTELQTTNAENKTKKL,
KRGINDRNFWRGENGRKTR,
RKSGKIAAIVVKRPRKPKKKRKV, または
MDSLLMNRRKFLYQFKNVRWAKGRRETYLC
を含む。
【0379】
いくつかの実施形態では、NLSはリンカー中に存在するか、またはNLSにはリンカー、例えば本明細書に記載されるリンカーが隣接する。いくつかの実施形態では、N末端またはC末端NLSは、二部分NLSである。二部分NLSは、比較的短いスペーサー配列によって分離される2つの塩基性アミノ酸クラスターを含む(それゆえにbipartite、二部分と呼ばれ、一部分(monopartite)NLSとは異なる)。ヌクレオプラスミンのNLSであるKR[PAATKKAGQA]KKKKは遍在性の二部分シグナルのプロトタイプであり、塩基性アミノ酸の2つのクラスターが約10アミノ酸のスペーサーによって隔てられたものである。例示的な二部分NLSの配列は以下の通りである:PKKKRKVEGADKRTADGSEFESPKKKRKV。
【0380】
いくつかの実施形態では、本明細書記載の融合タンパク質は、リンカー配列を含まない。いくつかの実施形態では、1つ以上のドメインまたはタンパク質の間にリンカー配列が存在する。いくつかの実施形態では、アデノシンデアミナーゼとCas9ドメインを含む例示的なCas9融合タンパク質の一般的な構築は以下の構造のいずれか1つを含み、ここでNLSは核局在化配列(例えば本明細書に提供する任意のNLS)であり、NH2は融合タンパク質のN末端であり、COOHは融合タンパク質のC末端である:
NH2-NLS-[アデノシンデアミナーゼ]-[Cas9ドメイン]-COOH;
NH2-NLS-[Cas9ドメイン]-[アデノシンデアミナーゼ]-COOH;
NH2-[アデノシンデアミナーゼ]-[Cas9ドメイン]-NLS-COOH;または
NH2-[Cas9ドメイン]-[アデノシンデアミナーゼ]-NLS-COOH
【0381】
本開示の融合タンパク質は、1つ以上の追加の特徴を含み得ることが理解されるべきである。例えば、いくつかの実施形態では、融合タンパク質は、阻害剤、細胞質局在化配列、核外輸送配列などの輸送配列、または他の局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグを含むことができる。本明細書において提供される適切なタンパク質タグには、限定されるものではないが、ビオチンカルボキシラーゼキャリアータンパク質 (BCCP) タグ、myc-タグ、カルモジュリンタグ、FLAG-タグ、赤血球凝集素 (HA) -タグ、ポリヒスチジンタグ(ヒスチジンタグまたはHis-タグとも呼ばれる)、マルトース結合タンパク質 (MBP) -タグ、nus-タグ、グルタチオン-S-トランスフェラーゼ (GST) -タグ、緑色蛍光タンパク質 (GFP) -タグ、チオレドキシンタグ、S-タグ、Softag(例えばSoftag1、Softag3)、Strep-タグ、ビオチンリガーゼタグ、FLAsHタグ、V5タグ、およびSBP-タグが含まれる。追加の適切な配列は、当業者には明らかであろう。いくつかの実施形態では、融合タンパク質は、1つ以上のHisタグを含む。
【0382】
1つ以上の核局在化配列 (NLS) を含むCRISPR酵素をコードするベクターを使用することができる。例えば、約1、2、3、4、5、6、7、8、9、10のNLSを使用することができる。CRISPR酵素は、アミノ末端またはその近傍のNLS、カルボキシ末端またはその近傍の約1、2、3、4、5、6、7、8、9、10またはそれ以上のNLS、あるいはこれらの任意の組み合わせ(例えばアミノ末端での1つ以上のNLSおよびカルボキシ末端での1つ以上のNLS)を含むことができる。複数のNLSが存在する場合、各NLSは他から独立して選択することができ、従って1つのNLSが複数のコピーで存在することができ、および/または1つ以上のコピーで存在する1つ以上の他のNLSと組み合わせて存在することができる。
【0383】
方法において使用されるCRISPR酵素は、約6個のNLSを含むことができる。NLSに最も近いアミノ酸がN-またはC末端からポリペプチド鎖に沿って約50アミノ酸内(例えば1、2、3、4、5、10、15、20、25、30、40、または50アミノ酸内)にあるとき、そのNLSはN-またはC末端の近傍にあると考えられる。
【0384】
排他性が低減されたCas9ドメイン
典型的には、S. pyogenes由来のCas9 (spCas9) などのCas9タンパク質は、特定の核酸領域に結合するためにカノニカルなNGG PAM配列を必要とし、ここで「NGG」中の「N」はアデノシン (A) 、チミジン (T) またはシトシン (C) であり、Gはグアノシンである。これは、ゲノム内の所望の塩基を編集する能力を制限し得る。いくつかの実施形態では、本明細書に提供される塩基編集融合タンパク質は、正確な位置、例えばPAMの上流にある標的塩基を含む領域に配置することが必要になり得る。例えばKomor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016)を参照のこと(これらの内容全体は、参照により本明細書に組み込まれる)。従って、いくつかの実施形態では、本明細書で提供される融合タンパク質のいずれかは、カノニカルな(例えばNGG)PAM配列を含まないヌクレオチド配列に結合することができるCas9ドメインを含み得る。非カノニカルPAM配列に結合するCas9ドメインは本技術分野において記述されており当業者には明らかであろう。例えば、非カノニカルPAM配列に結合するCas9ドメインは、Kleinstiver, B. P., et al., “Engineered CRISPR-Cas9 nucleases with altered PAM specificities” Nature 523, 481-485 (2015); および Kleinstiver, B. P., et al., “Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition” Nature Biotechnology 33, 1293-1298 (2015); Nishimasu, H., et al., “Engineered CRISPR-Cas9 nuclease with expanded targeting space” Science. 2018 Sep 21;361(6408):1259-1262, Chatterjee, P., et al., Minimal PAM specificity of a highly similar SpCas9 ortholog” Sci Adv. 2018 Oct 24;4(10):eaau0766. doi: 10.1126/sciadv.aau0766に記述されており、それぞれの全内容を参照により本明細書に組み込む。
【0385】
内部挿入物を含む融合タンパク質
本明細書に提供するのは、核酸プログラム可能核酸結合タンパク質、例えばnapDNAbpに融合した異種ポリペプチドを含む融合タンパク質である。異種ポリペプチドは、天然または野生型napDNAbpポリペプチド配列に見られないポリペプチドであってもよい。異種ポリペプチドをnapDNAbpのC末端かnapDNAbpのN末端で、napDNAbpに融合させてもよいし、napDNAbpの内部位置で挿入してもよい。いくつかの実施形態では、異種ポリペプチドをnapDNAbpの内部位置で挿入する。
【0386】
いくつかの実施形態では、異種ポリペプチドはデアミナーゼまたはその機能的断片である。例えば、融合タンパク質は、Cas9またはCas12(例えばCas12b/C2cl)ポリペプチドのN末端断片およびC末端断片が隣接したデアミナーゼを含んでもよい。融合タンパク質中のデアミナーゼは、アデノシンデアミナーゼであってもよい。いくつかの実施形態では、アデノシンデアミナーゼはTadA(例えばTadA7.10またはTadA*8)である。いくつかの実施形態では、TadAはTadA*8である。本明細書に記載するようなTadA配列(例えばTadA7.10またはTadA*8)は、上述の融合タンパク質に適したデアミナーゼである。
【0387】
デアミナーゼは循環置換体デアミナーゼであってもよい。例えば、デアミナーゼは循環置換体アデノシンデアミナーゼであってもよい。いくつかの実施形態では、デアミナーゼは循環置換体TadAであり、TadA参照配列中で番号付けられるようなアミノ酸残基116で循環置換されている。いくつかの実施形態では、デアミナーゼは循環置換体TadAであり、TadA参照配列中で番号付けられるようなアミノ酸残基136で循環置換されている。いくつかの実施形態では、デアミナーゼは循環置換体TadAであり、TadA参照配列中で番号付けられるようなアミノ酸残基65で循環置換されている。
【0388】
融合タンパク質は、1つより多いデアミナーゼを含んでもよい。融合タンパク質は、例えば、1、2、3、4、5またはそれより多いデアミナーゼを含んでもよい。いくつかの実施形態では、融合タンパク質は1つのデアミナーゼを含む。いくつかの実施形態では、融合タンパク質は2つのデアミナーゼを含む。2つ以上のデアミナーゼはホモダイマーであってもよい。2つ以上のデアミナーゼはヘテロダイマーであってもよい。2つ以上のデアミナーゼは、napDNAbp中、タンデムに挿入されてもよい。いくつかの実施形態では、2つ以上のデアミナーゼは、napDNAbp中、タンデムでなくてもよい。
【0389】
いくつかの実施形態では、融合タンパク質中のnapDNAbpはCas9ポリペプチドまたはその断片である。Cas9ポリペプチドはバリアントCas9ポリペプチドであってもよい。いくつかの実施形態では、Cas9ポリペプチドはCas9ニッカーゼ(nCas9)ポリペプチドまたはその断片である。いくつかの実施形態では、Cas9ポリペプチドはヌクレアーゼ不活性Cas9(dCas9)ポリペプチドまたはその断片である。融合タンパク質中のCas9ポリペプチドは全長Cas9ポリペプチドであってもよい。いくつかの場合、融合タンパク質中のCas9ポリペプチドは全長Cas9ポリペプチドでなくてもよい。Cas9ポリペプチドは、例えば天然存在Cas9タンパク質に対してN末端またはC末端で切り詰められていてもよい。Cas9ポリペプチドは、循環置換Cas9タンパク質であってもよい。Cas9ポリペプチドは、標的ポリヌクレオチドおよびガイド核酸配列になお結合可能である、Cas9ポリペプチドの断片、部分、またはドメインであってもよい。
【0390】
いくつかの実施形態では、Cas9ポリペプチドは、Streptococcus pyogenes Cas9(SpCas9)、Staphylococcus aureus Cas9(SaCas9)、Streptococcus thermophilus 1 Cas9(St1Cas9)、またはその断片もしくはバリアントである。
【0391】
融合タンパク質のCas9ポリペプチドは、天然存在Cas9ポリペプチドに対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であってもよい。
【0392】
融合タンパク質のCas9ポリペプチドは、以下に示すCas9アミノ酸配列(以下、「Cas9参照配列」と呼ばれる)に対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含んでもよい:
【0393】
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
【0394】
Cas9ポリペプチドのNおよびC末端断片が隣接する異種触媒ドメインを含む融合タンパク質はまた、本明細書に記載するような方法において、塩基編集のために有用である。Cas9および1つ以上のデアミナーゼドメイン、例えばアデノシンデアミナーゼドメインを含むか、あるいはCas9配列が隣接したアデノシンデアミナーゼドメインを含む融合タンパク質もまた、標的配列の非常に特異的で効率的な塩基編集のために有用である。一実施形態では、キメラCas9融合タンパク質は、Cas9ポリペプチド内に挿入された異種触媒ドメイン(例えばアデノシンデアミナーゼ)を含有する。いくつかの実施形態では、融合タンパク質は、1つのアデノシンデアミナーゼドメインおよびCas9内に挿入された1つのアデノシンデアミナーゼドメインを含む。いくつかの実施形態では、1つのアデノシンデアミナーゼはCas9内に融合し、1つのアデノシンデアミナーゼはC末端に融合する。いくつかの実施形態では、1つのアデノシンデアミナーゼはCas9内に融合し、1つのアデノシンデアミナーゼはN末端に融合する。いくつかの実施形態では、1つのアデノシンデアミナーゼはCas9内に融合し、1つのアデノシンデアミナーゼはC末端に融合する。いくつかの実施形態では、1つのアデノシンデアミナーゼはCas9内に融合し、1つのアデノシンデアミナーゼはN末端に融合する。
【0395】
多様な実施形態では、触媒ドメインは、DNA修飾活性(例えばデアミナーゼ活性)、例えばアデノシンデアミナーゼ活性を有する。いくつかの実施形態では、アデノシンデアミナーゼはTadA(例えばTadA7.10)である。いくつかの実施形態では、TadAはTadA*8である。いくつかの実施形態では、TadA*8はCas9内に融合し、アデノシンデアミナーゼはC末端に融合する。いくつかの実施形態では、TadA*8はCas9内に融合し、アデノシンデアミナーゼはN末端に融合する。いくつかの実施形態では、アデノシンデアミナーゼはCas9内に融合し、TadA*8はC末端に融合する。いくつかの実施形態では、アデノシンデアミナーゼはCas9内に融合し、TadA*8はN末端に融合する。TadA*8とアデノシンデアミナーゼとCas9を含む融合タンパク質の例示的構造を以下のように提供する:
NH2-[Cas9(TadA*8)]-[アデノシンデアミナーゼ]-COOH;
NH2-[アデノシンデアミナーゼ-[Cas9(TadA*8)]-COOH;
NH2-[Cas9(アデノシンデアミナーゼ)]-[TadA*8]-COOH;または
NH2-[TadA*8]-[Cas9(アデノシンデアミナーゼ)]-COOH
【0396】
いくつかの実施形態では、上記一般構造中で用いる「-」は、任意のリンカーの存在を示す。
【0397】
異種ポリペプチド(例えばデアミナーゼ)を、適切な位置で、例えばnapDNAbpが標的ポリヌクレオチドおよびガイド核酸に結合する能力を保持するように、napDNAbp(例えばCas9またはCas12(例えばCas12b/C2cl))中に挿入してもよい。デアミナーゼの機能(例えば塩基編集活性)またはnapDNAbpの機能(例えば標的核酸およびガイド核酸に結合する能力)を損なうことなく、デアミナーゼ(例えばアデノシンデアミナーゼ)をnapDNAbp内に挿入してもよい。デアミナーゼ(例えばアデノシンデアミナーゼ)を、例えば結晶研究によって示されるような、無秩序な領域、あるいは高温因子またはB因子を含む領域で、napDNAbp中に挿入してもよい。より秩序だっていない、無秩序な、または構造不定の領域、例えば溶媒に曝露される領域およびループは、構造または機能に影響を与えずに、挿入に用いられ得る。デアミナーゼ(例えばアデノシンデアミナーゼ)を、柔軟なループ領域または溶媒曝露領域でnapDNAbp中に挿入してもよい。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、Cas9またはCas12b/C2clポリペプチドの柔軟なループ中に挿入する。
【0398】
いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)の挿入位置は、Cas9ポリペプチドの結晶構造のB因子分析によって決定される。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、平均より高いB因子(例えば、総タンパク質または損傷を受けた領域を含むタンパク質ドメインに比較してより高いB因子)を含むCas9ポリペプチドの領域中に挿入する。B因子または温度因子は、平均位置からの原子のゆらぎを示し得る(例えば、温度依存性原子振動または結晶格子中の静的障害の結果として)。主鎖原子に関する高いB因子(例えば平均B因子より高い)は、局所可動性が比較的高い領域の指標であり得る。構造または機能を損なうことなく、デアミナーゼを挿入するためにこうした領域を用いてもよい。総タンパク質に関する平均B因子よりも50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%高い、または200%を超えて高いB因子を有するCα原子を有する残基を含む位置で、デアミナーゼ(例えばアデノシンデアミナーゼ)を挿入してもよい。以下のような残基を含むCas9タンパク質ドメインに関する平均B因子よりも50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%高い、または200%を超えて高いB因子を有するCα原子を有する残基を含む位置で、デアミナーゼ(例えばアデノシンデアミナーゼ)を挿入してもよい。平均B因子より高いB因子を含むCas9ポリペプチド位には、上記Cas9参照配列中で番号付けされるような、例えば残基768、792、1052、1015、1022、1026、1029、1067、1040、1054、1068、1246、1247、および1248が含まれてもよい。平均B因子より高いB因子を含むCas9ポリペプチド領域には、上記Cas9参照配列中で番号付けされるような、例えば残基792~872、792~906、および2~791が含まれてもよい。
【0399】
上記Cas9参照配列中で番号付けされるような768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247、および1248からなる群より選択されるアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基で、napDNAbp中に異種ポリペプチド(例えばデアミナーゼ)を挿入してもよい。いくつかの実施形態では、上記Cas9参照配列中で番号付けされるようなアミノ酸位768~769、791~792、792~793、1015~1016、1022~1023、1026~1027、1029~1030、1040~1041、1052~1053、1054~1055、1067~1068、1068~1069、1247~1248、または1248~1249、あるいはその対応するアミノ酸位の間で、異種ポリペプチドを挿入する。いくつかの実施形態では、上記Cas9参照配列中で番号付けされるようなアミノ酸位769~770、792~793、793~794、1016~1017、1023~1024、1027~1028、1030~1031、1041~1042、1053~1054、1055~1056、1068~1069、1069~1070、1248~1249、または1249~1250、あるいはその対応するアミノ酸位の間で、異種ポリペプチドを挿入する。いくつかの実施形態では、異種ポリペプチドは: 上記Cas9参照配列中で番号付けされるような768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247、および1248からなる群、または別のCas9ポリペプチド中の対応するアミノ酸残基より選択されるアミノ酸残基を、異種ポリペプチドが置換する。挿入位に関する上記Cas9参照配列に対する言及は、例示目的のためであることが理解されなければならない。本明細書に論じるような挿入は、上記Cas9参照配列のCas9ポリペプチド配列に限定されず、バリアントCas9ポリペプチド、例えばCas9ニッカーゼ(nCas9)、ヌクレアーゼ不活性Cas9 (dCas9)、ヌクレアーゼドメインを欠くCas9バリアント、切詰Cas9、あるいは部分的または全長HNHドメインを欠くCas9ドメインが含まれる。
【0400】
異種ポリペプチド(例えばデアミナーゼ)を: 上記Cas9参照配列中で番号付けされるような768、792、1022、1026、1040、1068、および1247からなる群、または別のCas9ポリペプチド中の対応するアミノ酸残基より選択されるアミノ酸残基で、napDNAbp中に挿入してもよい。いくつかの実施形態では、異種ポリペプチドを、上記Cas9参照配列中で番号付けされるようなアミノ酸位768~769、792~793、1022~1023、1026~1027、1029~1030、1040~1041、1068~1069、または1247~1248、あるいはその対応するアミノ酸位の間で挿入する。いくつかの実施形態では、異種ポリペプチドを、上記Cas9参照配列中で番号付けされるようなアミノ酸位769~770、793~794、1023~1024、1027~1028、1030~1031、1041~1042、1069~1070、または1248~1249、あるいはその対応するアミノ酸位の間で挿入する。いくつかの実施形態では、異種ポリペプチドは: 上記Cas9参照配列中で番号付けされるような768、792、1022、1026、1040、1068、および1247からなる群、または別のCas9ポリペプチド中の対応するアミノ酸残基より選択されるアミノ酸残基を置換する。
【0401】
異種ポリペプチド(例えばデアミナーゼ)を、本明細書に記載するようなアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基で、napDNAbp中に挿入してもよい。一実施形態では、異種ポリペプチド(例えばデアミナーゼ)を: 上記Cas9参照配列中で番号付けされるような1002、1003、1025、1052~1056、1242~1247、1061~1077、943~947、686~691、569~578、530~539、および1060~1077からなる群、または別のCas9ポリペプチド中の対応するアミノ酸残基より選択されるアミノ酸残基で、napDNAbp中に挿入してもよい。デアミナーゼ(例えばアデノシンデアミナーゼ)を残基のN末端またはC末端で挿入してもよいし、あるいはデアミナーゼ(例えばアデノシンデアミナーゼ)が残基を置換してもよい。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を残基のC末端に挿入する。
【0402】
いくつかの実施形態では、アデノシンデアミナーゼ(例えばTadA)を:上記Cas9参照配列中で番号付けされるような1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群、または別のCas9ポリペプチド中の対応するアミノ酸残基より選択されるアミノ酸残基で挿入する。いくつかの実施形態では、アデノシンデアミナーゼ(例えばTadA)を、上記Cas9参照配列中で番号付けされるような残基792~872、792~906、または2~791、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基の代わりに挿入する。いくつかの実施形態では、アデノシンデアミナーゼを:上記Cas9参照配列中で番号付けされるような1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群、または別のCas9ポリペプチドより選択されるアミノ酸のN末端に挿入する。いくつかの実施形態では、アデノシンデアミナーゼを:上記Cas9参照配列中で番号付けされるような1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群、または別のCas9ポリペプチド中の対応するアミノ酸残基より選択されるアミノ酸のC末端に挿入する。いくつかの実施形態では、アデノシンデアミナーゼを:上記Cas9参照配列中で番号付けされるような1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群、または別のCas9ポリペプチド中の対応するアミノ酸残基より選択されるアミノ酸を置換するよう挿入する。
【0403】
いくつかの実施形態では、CBE(例えばAPOBEC1)は:上記Cas9参照配列中で番号付けられるような1016、1023、1029、1040、1069、および1247からなる群より選択されるアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基で挿入される。いくつかの実施形態では、ABEは: 上記Cas9参照配列中で番号付けられるような1016、1023、1029、1040、1069、および1247からなる群より選択されるアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入される。いくつかの実施形態では、ABEは: 上記Cas9参照配列中で番号付けられるような1016、1023、1029、1040、1069、および1247からなる群より選択されるアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入される。いくつかの実施形態では、ABEは: 上記Cas9参照配列中で番号付けられるような1016、1023、1029、1040、1069、および1247からなる群より選択されるアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基を置換するように挿入される。
【0404】
いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基768、または別のCas9ポリペプチド中の対応するアミノ酸残基で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基768、または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基768、または別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基768、または別のCas9ポリペプチド中の対応するアミノ酸残基を置換するように挿入する。
【0405】
いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基791で挿入するか、またはアミノ酸残基792で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基791のN末端で挿入するか、またはアミノ酸残基792のN末端で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基791のC末端で挿入するか、またはアミノ酸残基792のN末端で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基791を置換するように挿入するか、またはアミノ酸残基792を置換するように挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基を置換するように挿入する。
【0406】
いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1016、または別のCas9ポリペプチド中の対応するアミノ酸残基で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1016、または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1016、または別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1016、または別のCas9ポリペプチド中の対応するアミノ酸残基を置換するように挿入する。
【0407】
いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1022で挿入するか、またはアミノ酸残基1023で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1022のN末端で挿入するか、またはアミノ酸残基1023のN末端で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1022のC末端で挿入するか、またはアミノ酸残基1023のC末端で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1022を置換するように挿入するか、またはアミノ酸残基1023を置換するように挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基を置換するように挿入する。
【0408】
いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1026で挿入するか、またはアミノ酸残基1029で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1026のN末端で挿入するか、またはアミノ酸残基1029のN末端で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1026のC末端で挿入するか、またはアミノ酸残基1029のC末端で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1026を置換するように挿入するか、またはアミノ酸残基1029を置換するように挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基を置換するように挿入する。
【0409】
いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1040、または別のCas9ポリペプチド中の対応するアミノ酸残基で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1040、または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1040、または別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1040、または別のCas9ポリペプチド中の対応するアミノ酸残基を置換するように挿入する。
【0410】
いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1052で挿入するか、またはアミノ酸残基1054で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1052のN末端で挿入するか、またはアミノ酸残基1054のN末端で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1052のC末端で挿入するか、またはアミノ酸残基1054のC末端で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1052を置換するように挿入するか、またはアミノ酸残基1054を置換するように挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基を置換するように挿入する。
【0411】
いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1067で挿入するか、またはアミノ酸残基1068で挿入するか、またはアミノ酸残基1069で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1067のN末端で挿入するか、またはアミノ酸残基1068のN末端で挿入するか、またはアミノ酸残基1069のN末端で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1067のC末端で挿入するか、またはアミノ酸残基1068のC末端で挿入するか、またはアミノ酸残基1069のC末端で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1067を置換するように挿入するか、またはアミノ酸残基1068を置換するように挿入するか、またはアミノ酸残基1069を置換するように挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基を置換するように挿入する。
【0412】
いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1246で挿入するか、またはアミノ酸残基1247で挿入するか、またはアミノ酸残基1248で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1246のN末端で挿入するか、またはアミノ酸残基1247のN末端で挿入するか、またはアミノ酸残基1248のN末端で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1246のC末端で挿入するか、またはアミノ酸残基1247のC末端で挿入するか、またはアミノ酸残基1248のC末端で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入する。いくつかの実施形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1246を置換するように挿入するか、またはアミノ酸残基1247を置換するように挿入するか、またはアミノ酸残基1248を置換するように挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基を置換するように挿入する。
【0413】
いくつかの実施形態では、異種ポリペプチド(例えばデアミナーゼ)をCas9ポリペプチドの柔軟なループ中に挿入する。柔軟なループ部分は、上記Cas9参照配列中で番号付けされるような530~537、569~570、686~691、943~947、1002~1025、1052~1077、1232~1247、または1298~1300からなる群、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基より選択されてもよい。柔軟なループ部分は:上記Cas9参照配列中で番号付けされるような1~529、538~568、580~685、692~942、948~1001、1026~1051、1078~1231、または1248~1297からなる群、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基より選択されてもよい。
【0414】
異種ポリペプチド(例えばアデニンデアミナーゼ)を:上記Cas9参照配列中で番号付けされるようなアミノ酸残基1017~1069、1242~1247、1052~1056、1060~1077、1002~1003、943~947、530~537、568~579、686~691,1242~1247、1298~1300、1066~1077、1052~1056、または1060~1077、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基に対応するCas9ポリペプチド領域に挿入してもよい。
【0415】
異種ポリペプチド(例えばアデニンデアミナーゼ)をCas9ポリペプチドの欠失領域の代わりに挿入してもよい。欠失領域は、Cas9ポリペプチドのN末端またはC末端部分に対応してもよい。いくつかの実施形態では、欠失領域は、上記Cas9参照配列中で番号付けされるような残基792~872、または別のCas9ポリペプチド中の対応するアミノ酸残基に対応する。いくつかの実施形態では、欠失領域は、上記Cas9参照配列中で番号付けされるような残基792~906、または別のCas9ポリペプチド中の対応するアミノ酸残基に対応する。いくつかの実施形態では、欠失領域は、上記Cas9参照配列中で番号付けされるような残基2~791、または別のCas9ポリペプチド中の対応するアミノ酸残基に対応する。いくつかの実施形態では、欠失領域は、上記Cas9参照配列中で番号付けされるような残基1017~1069、またはその対応するアミノ酸残基に対応する。
【0416】
例示的な内部融合塩基エディターを以下の表7Aに提供する。
【表7-1】
【0417】
異種ポリペプチド(例えばデアミナーゼ)を、Cas9ポリペプチドの構造または機能ドメイン内に挿入してもよい。異種ポリペプチド(例えばデアミナーゼ)を、Cas9ポリペプチドの2つの構造または機能ドメインの間に挿入してもよい。例えばCas9ポリペプチドから構造または機能ドメインを欠失させた後、Cas9ポリペプチドのそのドメインの代わりに、異種ポリペプチド(例えばデアミナーゼ)を挿入してもよい。Cas9ポリペプチドの構造または機能ドメインには、例えば、RuvC I、RuvC II、RuvC III、Rec1、Rec2、PI、またはHNHが含まれてもよい。
【0418】
いくつかの実施形態では、Cas9ポリペプチドは:RuvC I、RuvC II、RuvC III、Rec1、Rec2、PI、またはHNHドメインからなる群より選択される1つ以上のドメインを欠く。いくつかの実施形態では、Cas9ポリペプチドはヌクレアーゼドメインを欠く。いくつかの実施形態では、Cas9ポリペプチドはHNHドメインを欠く。いくつかの実施形態では、Cas9ポリペプチドのHNH活性が減少しているかまたは無効になっているように、Cas9ポリペプチドはHNHドメインの部分を欠く。いくつかの実施形態では、Cas9ポリペプチドはヌクレアーゼドメインの欠失を含み、デアミナーゼが挿入されてヌクレアーゼドメインを置換する。いくつかの実施形態では、HNHドメインが欠失され、デアミナーゼがその代わりに挿入される。いくつかの実施形態では、1つ以上のRuvCドメインが欠失され、デアミナーゼがその代わりに挿入される。
【0419】
異種ポリペプチドを含む融合タンパク質には、napDNAbpのN末端およびC末端断片が隣接していてもよい。いくつかの実施形態では、融合タンパク質は、Cas9ポリペプチドのN末端断片およびC末端断片が隣接するデアミナーゼを含む。N末端断片またはC末端断片は標的ポリヌクレオチド配列に結合可能である。N末端断片のC末端またはC末端断片のN末端は、Cas9ポリペプチドの柔軟なループの一部を含んでもよい。N末端断片のC末端またはC末端断片のN末端は、Cas9ポリペプチドのアルファらせん構造の一部を含んでもよい。N末端断片またはC末端断片は、DNA結合ドメインを含んでもよい。N末端断片またはC末端断片は、RuvCドメインを含んでもよい。N末端断片またはC末端断片は、HNHドメインを含んでもよい。いくつかの実施形態では、N末端断片およびC末端断片のいずれも、HNHドメインを含まない。
【0420】
いくつかの実施形態では、N末端Cas9断片のC末端は、融合タンパク質が標的核酸塩基を脱アミノ化する際、標的核酸塩基の近傍にあるアミノ酸を含む。いくつかの実施形態では、C末端Cas9断片のN末端は、融合タンパク質が標的核酸塩基を脱アミノ化する際、標的核酸塩基の近傍にあるアミノ酸を含む。N末端Cas9断片のC末端またはC末端Cas9断片のN末端において、標的核酸塩基およびアミノ酸の間が近接するように、異なるデアミナーゼの挿入位置は異なってもよい。例えば、ABEの挿入位置は、上記Cas9参照配列中で番号付けされるような1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群、または別のCas9ポリペプチド中の対応するアミノ酸残基より選択されるアミノ酸残基であってもよい。
【0421】
融合タンパク質のN末端Cas9断片(すなわち融合タンパク質中のデアミナーゼに隣接するN末端Cas9断片)は、Cas9ポリペプチドのN末端を含んでもよい。融合タンパク質のN末端Cas9断片は、少なくとも約100、200、300、400、500、600、700、800、900、1000、1100、1200、または1300アミノ酸残基の長さを含んでもよい。融合タンパク質のN末端Cas9断片は、上記Cas9参照配列中で番号付けされるようなアミノ酸残基: 1~56、1~95、1~200、1~300、1~400、1~500、1~600、1~700、1~718、1~765、1~780、1~906、1~918、または1~1100、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基に対応する配列を含んでもよい。N末端Cas9断片は、上記Cas9参照配列中で番号付けされるようなアミノ酸残基:1~56、1~95、1~200、1~300、1~400、1~500、1~600、1~700、1~718、1~765、1~780、1~906、1~918、または1~1100に、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基に、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の配列同一性を含む配列を含んでもよい。
【0422】
融合タンパク質のC末端Cas9断片(すなわち融合タンパク質中のデアミナーゼに隣接するC末端Cas9断片)は、Cas9ポリペプチドのC末端を含んでもよい。融合タンパク質のC末端Cas9断片は、少なくとも約100、200、300、400、500、600、700、800、900、1000、1100、1200、または1300アミノ酸の長さを含んでもよい。融合タンパク質のC末端Cas9断片は、上記Cas9参照配列中で番号付けされるようなアミノ酸残基:1099~1368、918~1368、906~1368、780~1368、765~1368、718~1368、94~1368、または56~1368、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基に対応する配列を含んでもよい。N末端Cas9断片は、上記Cas9参照配列中で番号付けされるようなアミノ酸残基:1099~1368、918~1368、906~1368、780~1368、765~1368、718~1368、94~1368、または56~1368、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基に、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の配列同一性を含む配列を含んでもよい。
【0423】
融合タンパク質のN末端Cas9断片およびC末端Cas9断片は、ともに、例えば上記Cas9参照配列に示すような、全長天然存在Cas9ポリペプチド配列に対応しない可能性もある。
【0424】
本明細書記載の融合タンパク質は、非標的部位(例えばオフターゲット部位)での脱アミノ化が減少した、例えばゲノム全体の偽の脱アミノ化が減少した、標的化脱アミノ化を達成し得る。本明細書記載の融合タンパク質は、非標的部位でのバイスタンダー脱アミノ化が減少した標的化脱アミノ化を達成し得る。望ましくない脱アミノ化またはオフターゲット脱アミノ化は、例えば、Cas9ポリペプチドのN末端またはC末端に融合したデアミナーゼを含む末端融合タンパク質と比較して、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、または少なくとも99%、減少し得る。望ましくない脱アミノ化またはオフターゲット脱アミノ化は、例えば、Cas9ポリペプチドのN末端またはC末端に融合したデアミナーゼを含む末端融合タンパク質と比較して、少なくとも1倍、少なくとも2倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも10倍、少なくとも15倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍、少なくとも60倍、少なくとも70倍、少なくとも80倍、少なくとも90倍、または少なくとも100倍、減少し得る。
【0425】
いくつかの実施形態では、融合タンパク質のデアミナーゼ(例えばアデノシンデアミナーゼ)は、Rループの範囲内で2つより多い核酸塩基を脱アミノ化しない。いくつかの実施形態では、融合タンパク質のデアミナーゼは、Rループの範囲内で3つより多くの核酸塩基を脱アミノ化しない。いくつかの実施形態では、融合タンパク質のデアミナーゼは、Rループの範囲内で2、3、4、5、6、7、8、9、または10より多くの核酸塩基を脱アミノ化しない。RループはDNA:RNAハイブリッド、DNA:DNAまたはRNA:RNA相補構造を含み、一本鎖DNAと会合する三本鎖核酸構造である。本明細書において使用する際、Rループは、標的ポリヌクレオチドがCRISPR複合体または塩基編集複合体と接触した際に形成可能であり、ここで、ガイドポリヌクレオチド、例えばガイドRNAの部分が、標的ポリヌクレオチド、例えば標的DNAの部分とハイブリダイズし、そしてこれを置換する。いくつかの実施形態では、Rループは、スペーサー配列および標的DNA相補配列のハイブリダイズした領域を含む。Rループ領域は、長さ約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50核酸塩基対であってもよい。いくつかの実施形態では、Rループ領域は長さ約20核酸塩基対である。本明細書で使用する際、Rループ領域はガイドポリヌクレオチドとハイブリダイズする標的DNA鎖に限定されないことを理解すべきである。例えば、Rループ領域内の標的核酸塩基の編集は、ガイドRNAに対する相補鎖を含むDNA鎖に対してでもよいし、またはガイドRNAに相補的な鎖の反対の鎖であるDNA鎖に対してであってもよい。いくつかの実施形態では、Rループ領域中の編集は、標的DNA配列において、ガイドRNAに対する非相補鎖(プロトスペーサー鎖)上の核酸塩基の編集を含む。
【0426】
本明細書記載の融合タンパク質は、カノニカルな塩基編集とは異なる編集ウィンドウの標的脱アミノ化を達成し得る。いくつかの実施形態では、標的核酸塩基は、標的ポリヌクレオチド配列において、PAM配列の約1~約20塩基上流である。いくつかの実施形態では、標的核酸塩基は、標的ポリヌクレオチド配列において、PAM配列の約2~約12塩基上流である。いくつかの実施形態では、標的核酸塩基は、PAM配列から、約1~9塩基対、約2~10塩基対、約3~11塩基対、約4~12塩基対、約5~13塩基対、約6~14塩基対、約7~15塩基対、約8~16塩基対、約9~17塩基対、約10~18塩基対、約11~19塩基対、約12~20塩基対、約1~7塩基対、約2~8塩基対、約3~9塩基対、約4~10塩基対、約5~11塩基対、約6~12塩基対、約7~13塩基対、約8~14塩基対、約9~15塩基対、約10~16塩基対、約11~17塩基対、約12~18塩基対、約13~19塩基対、約14~20塩基対、約1~5塩基対、約2~6塩基対、約3~7塩基対、約4~8塩基対、約5~9塩基対、約6~10塩基対、約7~11塩基対、約8~12塩基対、約9~13塩基対、約10~14塩基対、約11~15塩基対、約12~16塩基対、約13~17塩基対、約14~18塩基対、約15~19塩基対、約16~20塩基対、約1~3塩基対、約2~4塩基対、約3~5塩基対、約4~6塩基対、約5~7塩基対、約6~8塩基対、約7~9塩基対、約8~10塩基対、約9~11塩基対、約10~12塩基対、約11~13塩基対、約12~14塩基対、約13~15塩基対、約14~16塩基対、約15~17塩基対、約16~18塩基対、約17~19塩基対、約18~20塩基対、離れているかまたは上流である。いくつかの実施形態では、標的核酸塩基は、PAM配列から、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20塩基対、またはそれより多く離れているかまたは上流である。いくつかの実施形態では、標的核酸塩基は、PAM配列の約1、2、3、4、5、6、7、8、または9塩基対上流である。いくつかの実施形態では、標的核酸塩基は、PAM配列の約2、3、4、または6塩基対上流である。
【0427】
融合タンパク質は、1つより多い異種ポリペプチドを含んでもよい。例えば、融合タンパク質は、1つ以上のUGIドメインおよび/または1つ以上の核局在化シグナルをさらに含んでもよい。2つ以上の異種ドメインをタンデムに挿入してもよい。NapDNAbpとタンデムでないような位置で2つ以上の異種ドメインを挿入してもよい。
【0428】
融合タンパク質は、デアミナーゼおよびnapDNAbpポリペプチドの間にリンカーを含んでもよい。リンカーは、ペプチドまたは非ペプチドリンカーであってもよい。例えば、リンカーは、XTEN、(GGGS)n、(GGGGS)n、(G)n、(EAAAK)n、(GGS)n、SGSETPGTSESATPESであってもよい。いくつかの実施形態では、融合タンパク質は、N末端Cas9断片およびデアミナーゼの間にリンカーを含む。いくつかの実施形態では、融合タンパク質は、C末端Cas9断片およびデアミナーゼの間にリンカーを含む。いくつかの実施形態では、napDNAbpのN末端およびC末端断片は、リンカーでデアミナーゼに連結される。いくつかの実施形態では、N末端およびC末端断片は、リンカーを伴わずにデアミナーゼドメインに連結される。いくつかの実施形態では、融合タンパク質は、N末端Cas9断片およびデアミナーゼの間にリンカーを含むが、C末端Cas9断片およびデアミナーゼの間にリンカーを含まない。いくつかの実施形態では、融合タンパク質は、C末端Cas9断片およびデアミナーゼの間にリンカーを含むが、N末端Cas9断片およびデアミナーゼの間にリンカーを含まない。
【0429】
いくつかの実施形態では、融合タンパク質中のnapDNAbpは、Cas12ポリペプチド、例えばCas12b/C2c1、またはその断片である。Cas12ポリペプチドはバリアントCas12ポリペプチドであり得る。他の実施形態では、Cas12ポリペプチドのNまたはC末端断片は、核酸プログラム可能DNA結合ドメインまたはRuvCドメインを含む。他の実施形態では、融合タンパク質は、Cas12ポリペプチドおよび触媒ドメインの間にリンカーを含有する。他の実施形態では、リンカーのアミノ酸配列は、GGSGGSまたはGSSGSETPGTSESATPESSGである。他の実施形態では、リンカーは剛性リンカーである。上記態様の他の実施形態では、リンカーは、GGAGGCTCTGGAGGAAGCまたはGGCTCTTCTGGATCTGAAACACCTGGCACAAGCGAGAGCGCCACCCCTGAGAGCTCTGGCによってコードされる。
【0430】
Cas12ポリペプチドのNおよびC末端断片が隣接する異種触媒ドメインを含む融合タンパク質はまた、本明細書に記載するような方法において、塩基編集のために有用である。Cas12および1つ以上のデアミナーゼドメイン、例えばアデノシンデアミナーゼを含むか、あるいはCas12配列が隣接したアデノシンデアミナーゼドメインを含む融合タンパク質もまた、標的配列の非常に特異的で効率的な塩基編集のために有用である。一実施形態では、キメラCas12融合タンパク質は、Cas12ポリペプチド内に挿入された異種触媒ドメイン(例えばアデノシンデアミナーゼ)を含有する。いくつかの実施形態では、融合タンパク質は、アデノシンデアミナーゼドメインおよびCas12内に挿入されたアデノシンデアミナーゼドメインを含む。いくつかの実施形態では、1つのアデノシンデアミナーゼはCas12内に融合し、1つのアデノシンデアミナーゼはC末端に融合する。いくつかの実施形態では、1つのアデノシンデアミナーゼはCas12内に融合し、1つのアデノシンデアミナーゼはN末端に融合する。いくつかの実施形態では、1つのアデノシンデアミナーゼはCas12内に融合し、1つのアデノシンデアミナーゼはC末端に融合する。いくつかの実施形態では、1つのアデノシンデアミナーゼはCas12内に融合し、1つのアデノシンデアミナーゼはN末端に融合する。アデノシンデアミナーゼとアデノシンデアミナーゼとCas12を含む融合タンパク質の例示的構造を以下のように提供する:
NH2-[Cas12(アデノシンデアミナーゼ)]-[アデノシンデアミナーゼ]-COOH;
NH2-[アデノシンデアミナーゼ-[Cas12(アデノシンデアミナーゼ)]-COOH;
NH2-[Cas12(アデノシンデアミナーゼ)]-[アデノシンデアミナーゼ]-COOH;または
NH2-[アデノシンデアミナーゼ]-[Cas12(アデノシンデアミナーゼ)]-COOH
【0431】
いくつかの実施形態では、上記一般構造中で用いる「-」は、任意のリンカーの存在を示す。
【0432】
多様な実施形態では、触媒ドメインは、DNA修飾活性(例えばデアミナーゼ活性)、例えばアデノシンデアミナーゼ活性を有する。いくつかの実施形態では、アデノシンデアミナーゼはTadA(例えばTadA7.10)である。いくつかの実施形態では、TadAはTadA*8である。いくつかの実施形態では、TadA*8はCas12内に融合し、アデノシンデアミナーゼはC末端に融合する。いくつかの実施形態では、TadA*8はCas12内に融合し、アデノシンデアミナーゼはN末端に融合する。いくつかの実施形態では、アデノシンデアミナーゼはCas12内に融合し、TadA*8はC末端に融合する。いくつかの実施形態では、アデノシンデアミナーゼはCas12内に融合し、TadA*8はN末端に融合する。TadA*8とアデノシンデアミナーゼとCas12を含む融合タンパク質の例示的構造を以下のように提供する:
NH2-[Cas12(TadA*8)]-[アデノシンデアミナーゼ]-COOH;
NH2-[アデノシンデアミナーゼ-[Cas12(TadA*8)]-COOH;
NH2-[Cas12(アデノシンデアミナーゼ)]-[TadA*8]-COOH;または
NH2-[TadA*8]-[Cas12(アデノシンデアミナーゼ)]-COOH
【0433】
いくつかの実施形態では、上記一般構造中で用いる「-」は、任意のリンカーの存在を示す。
【0434】
他の実施形態では、融合タンパク質は1つ以上の触媒ドメインを含む。他の実施形態では、1つ以上の触媒ドメインの少なくとも1つをCas12ポリペプチド内に挿入するか、あるいはCas12 N末端またはC末端に融合させる。他の実施形態では、1つ以上の触媒ドメインの少なくとも1つを、Cas12ポリペプチドのループ、アルファらせん領域、非構造化部分、または溶媒アクセス可能部分に挿入する。他の実施形態では、Cas12ポリペプチドは、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、またはCas12iである。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種 V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bに、少なくとも約85%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種 V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bに、少なくとも約90%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種 V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bに、少なくとも約95%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種 V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bの断片を含有するか、または本質的にこうした断片からなる。
【0435】
他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸位153~154、255~256、306~307、980~981、1019~1020、534~535、604~605、または344~345の間、あるいはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、またはCas12iの対応するアミノ酸残基の間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのP153およびS154の間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのK255およびE256の間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのD980およびG981の間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのK1019およびL1020の間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのF534およびP535の間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのK604およびG605の間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのH344およびF345の間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸位147および148、248および249、299および300、991および992、または1031および1032の間、あるいはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、またはCas12iの対応するアミノ酸残基の間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのP147およびD148の間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのG248およびG249の間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのP299およびE300の間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのG991およびE992の間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのK1031およびM1032の間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸位157および158、258および259、310および311、1008および1009、または1044および1045の間、あるいはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、またはCas12iの対応するアミノ酸残基の間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのP157およびG158の間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのV258およびG259の間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのD310およびP311の間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのG1008およびE1009の間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのG1044およびK104の間に挿入される。
【0436】
他の実施形態では、融合タンパク質は、核局在化シグナル(例えば二部分核局在化シグナル)を含有する。他の実施形態では、核局在化シグナルのアミノ酸配列は、MAPKKKRKVGIHGVPAAである。上記態様の他の実施形態では、核局在化シグナルは、以下の配列:
【0437】
ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCにコードされる。他の実施形態では、Cas12bポリペプチドは、RuvCドメインの触媒活性をサイレンシングする突然変異を含有する。他の実施形態では、Cas12bポリペプチドは、D574A、D829Aおよび/またはD952A突然変異を含有する。他の実施形態では、融合タンパク質は、タグ(例えばインフルエンザ赤血球凝集素タグ)をさらに含有する。
【0438】
いくつかの実施形態では、融合タンパク質は、内部に融合した核酸塩基編集ドメイン(例えばデアミナーゼドメイン、例えばアデノシンデアミナーゼドメインのすべてまたは部分)を含むnapDNAbpドメイン(例えばCas12由来ドメイン)を含む。いくつかの実施形態では、napDNAbpはCas12bである。いくつかの実施形態では、塩基エディターは、以下の表7Bに提供する遺伝子座で挿入された内部融合TadA*8ドメインを含むBhCas12bドメインを含む。
【0439】
【表7-2】
【0440】
限定されない例として、アデノシンデアミナーゼ(例えばABE8.13)をBhCas12b内に挿入して、核酸配列を有効に編集する融合タンパク質(例えばABE8.13-BhCas12b)を産生してもよい。
【0441】
いくつかの実施形態では、本明細書記載の塩基編集システムは、Cas9内に挿入されたTadAとともにABEを含む。Cas9内に挿入されたTadAを含む適切なABEの配列を提供する。
【0442】
101 Cas9 TadAins 1015
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVGSSGSETPGTSESATPESSGSEVEFSHEYWMRHAL
TLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQG
GLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGS
LMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSST
DYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
【0443】
102 Cas9 TadAins 1022
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIGSSGSETPGTSESATPESSGSEVEFSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
【0444】
103 Cas9 TadAins 1029
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGSSGSETPGTSESATPESSGS
EVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLH
DPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRV
VFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMP
RQVFNAQKKAQSSTDGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
【0445】
103 Cas9 TadAins 1040
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSGSSGSETPGT
SESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVI
GEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCA
GAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADEC
AALLCYFFRMPRQVFNAQKKAQSSTDNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
【0446】
105 Cas9 TadAins 1068
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGEGSSGSETPGTSESATPESSGSEVEFSHEYWMR
HALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMAL
RQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGA
AGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQ
SSTDTGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
【0447】
106 Cas9 TadAins 1247
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGGSS
GSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVL
VLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTF
EPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITE
GILADECAALLCYFFRMPRQVFNAQKKAQSSTDSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
【0448】
107 Cas9 TadAins 1054
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDERE
VPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLID
ATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMN
HRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
【0449】
108 Cas9 TadAins 1026
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEGSSGSETPGTSESATPESSGSEVE
FSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPT
AHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFG
VRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQV
FNAQKKAQSSTDQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
【0450】
109 Cas9 TadAins 768
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQGSSGSETPGTSESATPESSGSEVEFSHEYWMR
HALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMAL
RQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGA
AGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRTTQKGQKNSR
ERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQEL
DINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQIT
KHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREI
NNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQE
IGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGR
DFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDP
KKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNP
IDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELAL
PSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSK
RVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFD
TTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0451】
110.1 Cas9 TadAins 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGA
VLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYV
TFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEI
TEGILADECAALLCYFFRMPREDNEQKQLFVEQHKHYLDEIIEQISEFSK
RVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFD
TTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0452】
110.2 Cas9 TadAins 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVP
VGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDAT
LYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHR
VEITEGILADECAALLCYFFRMPREDNEQKQLFVEQHKHYLDEIIEQISE
FSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFK
YFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0453】
110.3 Cas9 TadAins 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARDER
EVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLI
DATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGM
NHRVEITEGILADECAALLCYFFRMPREDNEQKQLFVEQHKHYLDEIIEQ
ISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPA
AFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0454】
110.4 Cas9 TadAins 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARDER
EVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLI
DATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGM
NHRVEITEGILADECAALLCYFFRMRREDNEQKQLFVEQHKHYLDEIIEQ
ISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPA
AFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0455】
110.5 Cas9 TadAins 1249
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSGS
SGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARDERE
VPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLID
ATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMN
HRVEITEGILADECAALLCYFFRMRRPEDNEQKQLFVEQHKHYLDEIIEQ
ISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPA
AFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0456】
110.5 Cas9 TadAinsデルタ59-66 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSSGSETPGTSESATPESGSSGSEVEFSHEYWMRHALTLAKRARDERE
VPVGAVLVLNNRVIGEGWNRAHAEIMALRQGGLVMQNYRLIDATLYVTFE
PCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEG
ILADECAALLCYFFRMPRQVFNAQKKAQSSTDEDNEQKQLFVEQHKHYLD
EIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTN
LGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGG
D
【0457】
110.6 Cas9 TadAins 1251
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPE
GSSGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARDE
REVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRL
IDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPG
MNHRVEITEGILADECAALLCYFFRMRRDNEQKQLFVEQHKHYLDEIIEQ
ISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPA
AFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0458】
110.7 Cas9 TadAins 1252
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPE
DGSSGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARD
EREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYR
LIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYP
GMNHRVEITEGILADECAALLCYFFRMRRNEQKQLFVEQHKHYLDEIIEQ
ISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPA
AFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0459】
110.8 Cas9 TadAinsデルタ59~66 C切詰 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGA
VLVLNNRVIGEGWNRAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMC
AGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADE
CAALLCYFFRMPRQEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADA
NLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKR
YTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0460】
111.1 Cas9 TadAins 997
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDGSSGSETPGTSESATPESSGIKKYPKLESEFVYGDYKVYDVR
KMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGET
GEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKL
IARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIM
ERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGE
LQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEI
IEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLG
APAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0461】
111.2 Cas9 TadAins 997
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDGSSGSSGSETPGTSESATPESSGGSSIKKYPKLESEFVYGDY
KVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLI
ETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPK
RNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKEL
LGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRM
LASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHK
HYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLF
TLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLS
QLGGD
【0462】
112デルタHNH TadA
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSEVEFSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDEND
KLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTAL
IKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFK
TEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKK
TEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVA
KVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIK
LPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKG
SPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKH
RDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATL
IHQSITGLYETRIDLSQLGGD
【0463】
113 N末端単一TadAらせん切詰 165~末端
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIG
LHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIG
RVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFR
MPRSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSV
GWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKR
TARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERH
PIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRG
HFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARL
SKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQL
SKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAP
LSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGG
ASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHL
GELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMT
RKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYE
YFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKE
DYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDIL
EDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKL
INGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQ
GDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARE
NQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYL
QNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGK
SDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGF
IKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDF
RKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVY
DVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETN
GETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNS
DKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGI
TIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLAS
AGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYL
DEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLT
NLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLG
GD
【0464】
114 N末端単一TadAらせん切詰165~末端 デルタ59~65
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRTAH
AEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVR
NAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRSGGS
SGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITD
EYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYT
RRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIV
DEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGD
LNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLE
NLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDD
DLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIK
RYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFY
KFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAIL
RRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETI
TPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNE
LTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIE
CFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTL
TLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDK
QSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEH
IANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKG
QKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMY
VDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSE
EVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVE
TRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFY
KVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIA
KSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIV
WDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARK
KDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSS
FEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKG
NELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQI
SEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAA
FKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0465】
115.1 Cas9 TadAins1004
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREV
PVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDA
TLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNH
RVEITEGILADECAALLCYFFRMPRQLESEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0466】
115.2 Cas9 TadAins1005
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDERE
VPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLID
ATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMN
HRVEITEGILADECAALLCYFFRMPRQESEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0467】
115.3 Cas9 TadAins1006
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLEGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDER
EVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLI
DATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGM
NHRVEITEGILADECAALLCYFFRMPRQSEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0468】
115.4 Cas9 TadAins1007
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDE
REVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRL
IDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPG
MNHRVEITEGILADECAALLCYFFRMPRQEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0469】
116.1 Cas9 TadAins C末端切詰2 792
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGGSSGSETP
GTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNR
VIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVM
CAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILAD
ECAALLCYFFRMPRQSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQE
LDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVK
KMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQI
TKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVRE
INNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0470】
116.2 Cas9 TadAins C末端切詰2 791
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSSGSETPG
TSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRV
IGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMC
AGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADE
CAALLCYFFRMPRQGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQE
LDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVK
KMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQI
TKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVRE
INNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0471】
116.3 Cas9 TadAins C末端切詰2 790
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKEGSSGSETPGT
SESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVI
GEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCA
GAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADEC
AALLCYFFRMPRQLGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQE
LDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVK
KMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQI
TKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVRE
INNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0472】
117 Cas9デルタ1017~1069
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYSSGSEVEFSHEYWMRHALTLAKRARDEREVPVGA
VLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYV
TFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEI
TEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGEIVWDKGRDFATVR
KVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGF
DSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEA
KGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVN
FLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILAD
ANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRK
RYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0473】
118 Cas9 TadA-CP116ins 1067
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRAR
DEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNY
RLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHY
PGGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
【0474】
119 Cas9 TadAins 701
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPV
GAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRV
EITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDLTFKEDIQKAQVS
GQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMA
RENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLY
YLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNR
GKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKA
GFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVS
DFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYK
VYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
【0475】
120 Cas9 TadACP136ins 1248
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSMN
HRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGT
SESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVI
GEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCA
GAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
【0476】
121 Cas9 TadACP136ins 1052
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLAMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGS
ETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVL
NNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEP
CVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGNGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
【0477】
122 Cas9 TadACP136ins 1041
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSMNHRVEITEG
ILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPES
SGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAI
GLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRI
GRVVFGVRNAKTGAAGSLMDVLHYPGNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
【0478】
123 Cas9 TadACP139ins 1299
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPE
DNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRMN
HRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGT
SESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVI
GEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCA
GAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
【0479】
124 Cas9デルタ792~872 TadAins
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSEVEFSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKA
GFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVS
DFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYK
VYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
【0480】
125 Cas9デルタ792~906 TadAins
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSEVEFSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDK
LIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALI
KKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKT
EITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKT
EVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAK
VEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKL
PKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGS
PEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHR
DKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLI
HQSITGLYETRIDLSQLGGD
【0481】
126 TadA CP65ins 1003
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGR
VVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRM
PRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHA
LTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPLESEFVYGDYK
VYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
【0482】
127 TadA CP65ins 1016
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVM
CAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILAD
ECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSE
VEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHD
PYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
【0483】
128 TadA CP65ins 1022
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMITAHAEIMALRQGGLVMQNYRLIDATLYV
TFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEI
TEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESAT
PESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWN
RAIGLHDPAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
【0484】
129 TadA CP65ins 1029
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEITAHAEIMALRQGGLVMQNYRL
IDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPG
MNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETP
GTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNR
VIGEGWNRAIGLHDPGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
【0485】
130 TadA CP65ins 1041
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSTAHAEIMALR
QGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAA
GSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQS
STDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREV
PVGAVLVLNNRVIGEGWNRAIGLHDPNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
【0486】
131 TadA CP65ins 1054
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIG
RVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFR
MPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRH
ALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
【0487】
132 TadA CP65ins 1246
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGTAH
AEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVR
NAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFN
AQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKR
ARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
【0488】
いくつかの実施形態では、アデノシンデアミナーゼ塩基エディターを生成し、同定された位置で、Cas9ポリペプチド内にTadAまたはそのバリアントを挿入した。
【0489】
例としてではあるが限定ではなく、融合タンパク質は、国際PCT出願第PCT/US2020/016285号ならびに米国仮出願第62/852,228号および第62/852,224号に記載され、その全内容は、参照により本明細書に組み込まれる。
【0490】
核酸塩基編集ドメイン
ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインおよび核酸塩基編集ドメイン(例えばデアミナーゼドメイン)を含む融合タンパク質を含む塩基エディターを本明細書に記載する。塩基エディターは、標的配列を認識することができるガイドポリヌクレオチドと相互作用することによって、標的ポリヌクレオチド配列中の1つ以上の塩基を編集するようにプログラムすることができる。標的配列がいったん認識されると、編集が行われるポリヌクレオチド上に塩基エディターが固定され、次いで、塩基エディターのデアミナーゼドメイン構成要素が標的塩基を編集することができる。
【0491】
いくつかの実施形態では、核酸塩基編集ドメインは、デアミナーゼドメインを含む。いくつかの実施形態では、デアミナーゼドメインは、アデニンデアミナーゼまたはアデノシンデアミナーゼであり得る。いくつかの実施形態では、「アデニンデアミナーゼ」および「アデノシンデアミナーゼ」という用語は、交換可能に使用され得る。核酸塩基編集タンパク質の詳細は、国際PCT出願番号PCT/2017/045381 (WO2018/027078) およびPCT/US2016/058344 (WO2017/070632) に記載されており、これらの各々は、その全体が参照により本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); および Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)も参照のこと(その全内容が参照により本明細書に組み込まれる)。
【0492】
AからGへの編集
いくつかの実施形態では、本明細書に記載される塩基エディターは、アデノシンデアミナーゼを含むデアミナーゼドメインを含むことができる。塩基エディターのこのようなアデノシンデアミナーゼドメインは、Aを脱アミノ化して、Gの塩基対形成特性を示すイノシン (I) を形成することによって、アデニン (A) 核酸塩基からグアニン (G) 核酸塩基への編集を促進することができる。アデノシンデアミナーゼは、デオキシリボ核酸 (DNA) 中のデオキシアデノシン残基のアデニンを脱アミノ化すること(すなわちアミン基を除去すること)ができる。
【0493】
いくつかの実施形態では、本明細書において提供される核酸塩基エディターは、1つ以上のタンパク質ドメインを融合させ、それによって融合タンパク質を生成することによって作製することができる。特定の実施形態では、本明細書において提供される融合タンパク質は、融合タンパク質の塩基編集活性(例えば効率、選択性、特異性)を改善する1つ以上の特徴を含む。例えば、本明細書中に提供される融合タンパク質は、ヌクレアーゼ活性が低下したCas9ドメインを含むことができる。いくつかの実施形態では、本明細書で提供される融合タンパク質は、ヌクレアーゼ活性を持たないCas9ドメイン (dCas9) 、または、Cas9ニッカーゼ (nCas9) と呼ばれる、二本鎖DNA分子の一鎖を切断するCas9ドメインを有することができる。いかなる特定の理論にも拘束されることも望まないが、触媒残基(例えばH840)の存在が、標的Aと反対のTを含有する非編集(例えば非脱アミノ化)鎖を切断するCas9の活性を維持する。Cas9の触媒残基の突然変異(例えばD10からA10)は、標的A残基を含有する編集鎖の切断を妨げる。このようなCas9バリアントは、gRNAによって定義される標的配列に基づく特定の位置で一本鎖DNA切断 (ニック) を生じさせることができ、非編集鎖の修復を導き、最終的には非編集鎖上でTからCへの変化をもたらす。いくつかの実施形態では、AからGへの塩基エディターは、イノシン塩基除去修復の阻害剤、例えば、ウラシルグリコシラーゼ阻害剤 (UGI) ドメインまたは触媒的に不活性なイノシン特異的ヌクレアーゼをさらに含む。いかなる特定の理論にも束縛されることを望まないが、UGIドメインまたは触媒的に不活性なイノシン特異的ヌクレアーゼは、脱アミノ化されたアデノシン残基(例えばイノシン)の塩基除去修復を阻害または防止することができ、これが、塩基エディターの活性または効率を改善させることができる。
【0494】
アデノシンデアミナーゼを含む塩基エディターは、DNA、RNAおよびDNA-RNAハイブリッドを含む任意のポリヌクレオチドに作用することができる。特定の実施形態では、アデノシンデアミナーゼを含む塩基エディターは、RNAを含むポリヌクレオチドの標的Aを脱アミノ化することができる。例えば、塩基エディターは、RNAポリヌクレオチドおよび/またはDNA-RNAハイブリッドポリヌクレオチドの標的Aを脱アミノ化することができるアデノシンデアミナーゼドメインを含むことができる。一実施形態では、塩基エディターに組み込まれたアデノシンデアミナーゼは、RNAに作用するアデノシンデアミナーゼ(ADAR、例えばADAR1またはADAR2)のすべてまたは一部を含む。別の実施形態では、塩基エディターに組み込まれたアデノシンデアミナーゼは、tRNAに作用するアデノシンデアミナーゼ(ADAT)のすべてまたは一部を含む。アデノシンデアミナーゼドメインを含む塩基エディターはまた、DNAポリヌクレオチドのA核酸塩基を脱アミノ化する能力も有し得る。一実施形態では、塩基エディターのアデノシンデアミナーゼドメインは、1つ以上の突然変異を含むADATのすべてまたは一部を含み、これがDNA中の標的AをADATが脱アミノ化することを可能にする。例えば、塩基エディターは、突然変異D108N、A106V、D147Y、E155V、L84F、H123Y、I157F、または別のアデノシンデアミナーゼにおける対応する突然変異の1つ以上を含むEscherichia coli由来のADAT (EcTadA)のすべてまたは一部を含むことができる。
【0495】
アデノシンデアミナーゼは、任意の適切な生物(例えば大腸菌)に由来することができる。いくつかの実施形態では、アデノシンデアミナーゼは原核生物由来である。いくつかの実施形態では、アデノシンデアミナーゼは、細菌由来である。いくつかの実施形態では、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhi、Shewanella putrefaciens、Haemophilus influenzae、Caulobacter crescentus、またはBacillus subtilisに由来する。いくつかの実施形態では、アデノシンデアミナーゼは、大腸菌由来である。いくつかの実施形態では、アデニンデアミナーゼは、天然に存在するアデノシンデアミナーゼであって、本明細書に提供される突然変異(例えば、ecTadAにおける突然変異)のいずれかに対応する1つ以上の突然変異を含むものである。任意の相同タンパク質中の対応する残基は、例えば、配列アラインメントおよび相同残基の決定によって同定することができる。本明細書中に記載された突然変異のいずれか(例えば、ecTadAで同定された突然変異のいずれか)に対応する、任意の天然存在アデノシンデアミナーゼ(例えば、ecTadAに対して相同性を有するもの)における突然変異を、それに応じて生成することができる。
【0496】
アデノシンデアミナーゼ
いくつかの実施形態では、本明細書記載の融合タンパク質は、アデノシンデアミナーゼを含むデアミナーゼドメインを含んでもよい。塩基エディターのこうしたアデノシンデアミナーゼドメインは、Aを脱アミノ化して、Gの塩基対形成特性を示すイノシン(I)を形成することによって、アデニン(A)核酸塩基のグアニン(G)核酸塩基への編集を容易にし得る。アデノシンデアミナーゼは、デオキシリボ核酸(DNA)中のデオキシアデノシン残基のアデニンを脱アミノ化する(すなわちアミン基を除去する)ことが可能である。
【0497】
いくつかの実施形態では、本明細書に提供されるアデノシンデアミナーゼは、アデニンを脱アミノ化することができる。いくつかの実施形態では、本明細書で提供されるアデノシンデアミナーゼは、DNAのデオキシアデノシン残基中のアデニンを脱アミノ化することができる。いくつかの実施形態では、アデニンデアミナーゼは、本明細書に提供される突然変異のいずれか(例えばecTadAにおける突然変異)に対応する1つ以上の突然変異を含む、天然存在アデノシンデアミナーゼである。当業者は、例えば配列アラインメントおよび相同残基の決定によって、任意の相同タンパク質中の対応する残基を同定することができる。従って、当業者は、任意の天然存在アデノシンデアミナーゼ(例えばecTadAに対する相同性を有するもの)において、本明細書に記載された突然変異のいずれか(例えば、ecTadAにおいて同定される突然変異のいずれか)に対応する突然変異を生成することができる。いくつかの実施形態では、アデノシンデアミナーゼは原核生物由来である。いくつかの実施形態では、アデノシンデアミナーゼは、細菌由来である。いくつかの実施形態では、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhi、Shewanella putrefaciens、Haemophilus influenzae、Caulobacter crescentus、またはBacillus subtilisに由来する。いくつかの実施形態では、アデノシンデアミナーゼは、E. coli由来である。
【0498】
本開示は、効率(>50~60%)および特異性が増加したアデノシンデアミナーゼバリアントを提供する。特に、本明細書記載のアデノシンデアミナーゼバリアントは、ポリヌクレオチド内の所望の塩基を編集する可能性がより高く、改変されることが意図されない塩基(すなわち「バイスタンダー」)を編集する可能性がより低い。
【0499】
いくつかの実施形態では、アデノシンデアミナーゼはTadAデアミナーゼである。特定の実施形態では、TadAは、その全体が参照により本明細書に組み込まれる、PCT/US2017/045381(WO 2018/027078)に記載されるTadAのいずれか1つである。
【0500】
いくつかの実施形態では、本開示の核酸塩基エディターは、以下の配列中に改変を含むアデノシンデアミナーゼバリアントである:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
(TadA*7.10とも称される)。
【0501】
特定の実施形態では、融合タンパク質は、単一の(例えばモノマーとして提供される)TadA*8バリアントを含む。いくつかの実施形態では、TadA*8は、Cas9ニッカーゼに連結される。いくつかの実施形態では、本開示の融合タンパク質は、TadA*8バリアントに連結された野生型TadA(TadA(wt))のヘテロダイマーとして構成される。他の実施形態では、本開示の融合タンパク質は、TadA*8バリアントに連結されたTadA*7.10のヘテロダイマーとして構成される。いくつかの実施形態では、塩基エディターは、TadA*8バリアントモノマーを含むABE8である。いくつかの実施形態では、塩基エディターは、TadA*8バリアントおよびTadA(wt)のヘテロダイマーを含むABE8である。いくつかの実施形態では、塩基エディターは、TadA*8バリアントおよびTadA*7.10のヘテロダイマーを含むABE8である。いくつかの実施形態では、塩基エディターは、TadA*8バリアントのヘテロダイマーを含むABE8である。いくつかの実施形態では、TadA*8バリアントは表9より選択される。いくつかの実施形態では、ABE8は表8、9、10、または11より選択される。適切な配列は以下の通りである:
野生型TadA(TadA(wt))または「TadA参照配列」
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
TadA*7.10:
MSEVEFSHEYW MRHALTLAKR ARDEREVPVG AVLVLNNRVI GEGWNRAIGL HDPTAHAEIM ALRQGGLVMQ NYRLIDATLY VTFEPCVMCA GAMIHSRIGR VVFGVRNAKT GAAGSLMDVL HYPGMNHRVE ITEGILADEC AALLCYFFRM PRQVFNAQKK AQSSTD
【0502】
いくつかの実施形態では、アデノシンデアミナーゼは、本明細書に提供されるアデノシンデアミナーゼのいずれかに記載のアミノ酸配列のいずれか1つに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。本明細書において提供されるアデノシンデアミナーゼは、1つ以上の突然変異(例えば、本明細書に提供される突然変異のいずれか)を含み得ることが理解されるべきである。本開示は、特定のパーセント同一性を有する任意のデアミナーゼドメインに、本明細書に記載される突然変異のいずれかまたはその組み合わせが加わったものを提供する。いくつかの実施形態では、アデノシンデアミナーゼは、参照配列または本明細書に提供されるアデノシンデアミナーゼのいずれかと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれより多くの突然変異を有するアミノ酸配列を含む。いくつかの実施形態では、アデノシンデアミナーゼは、当技術分野において公知であるかまたは本明細書に記載されたアミノ酸配列のいずれか1つと比較して、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170の同一の連続するアミノ酸残基を有するアミノ酸配列を含む。
【0503】
いくつかの実施形態では、TadAデアミナーゼは全長E. coli TadAデアミナーゼである。例えば、特定の実施形態では、アデノシンデアミナーゼはアミノ酸配列:
MRRAFITGVFFLSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
を含む。
【0504】
しかし、本出願において有用な追加のアデノシンデアミナーゼが当業者に明らかであり、これらが本開示の範囲内にあることを認識しなければならない。例えば、アデノシンデアミナーゼは、tRNAに対して作用するアデノシンデアミナーゼホモログ(ADAT)であってもよい。限定なしに、例示的なAD ATホモログのアミノ酸配列には以下が含まれる:
【0505】
Staphylococcus aureus TadA:
MGSHMTNDIYFMTLAIEEAKKAAQLGEVPIGAIITKDDEVIARAHNLRETLQQPTAHAEHIAIERAAKVLGSWRLEGCTLYVTLEPCVMCAGTIVMSRIPRVVYGADDPKGGCSGS LMNLLQQSNFNHRAIVDKGVLKEACSTLLTTFFKNLRANKKSTN
【0506】
Bacillus subtilis TadA:
MTQDELYMKEAIKEAKKAEEKGEVPIGAVLVINGEIIARAHNLRETEQRSIAHAEMLVIDEACKALGTWRLEGATLYVTLEPCPMCAGAVVLSRVEKVVFGAFDPKGGCSGTLMNLLQEERFNHQAEVVSGVLEEECGGMLSAFFRELRKKKKAARKNLSE
【0507】
Salmonella typhimurium (S. typhimurium) TadA:
MPPAFITGVTSLSDVELDHEYWMRHALTLAKRAWDEREVPVGAVLVHNHRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVLQNYRLLDTTLYVTLEPCVMCAGAMVHSRIGRVVFGARDAKTGAAGSLIDVLHHPGMNHRVEIIEGVLRDECATLLSDFFRMRRQEIKALKKADRAEGAGPAV
【0508】
Shewanella putrefaciens (S. putrefaciens) TadA:
MDEYWMQVAMQMAEKAEAAGEVPVGAVLVKDGQQIATGYNLSISQHDPTAHAEILCLRSAGKKLENYRLLDATLYITLEPCAMCAGAMVHSRIARVVYGARDEKTGAAGTVVNLLQHPAFNHQVEVTSGVLAEACSAQLSRFFKRRRDEKKALKLAQRAQQGIE
【0509】
Haemophilus influenzae F3031 (H. influenzae) TadA:
MDAAKVRSEFDEKMMRYALELADKAEALGEIPVGAVLVDDARNIIGEGWNLSIVQSDPTΑΗAEIIALRNGAKNIQNYRLLNSTLYVTLEPCTMCAGAILHSRIKRLVFGASDYKTGAIGSRFHFFDDYKMNHTLEITSGVLAEECSQKLSTFFQKRREEKKIEKALLKSLSDK
【0510】
Caulobacter crescentus (C. crescentus) TadA:
MRTDESEDQDHRMMRLALDAARAAAEAGETPVGAVILDPSTGEVIATAGNGPIAAHDPTAHAEIAAMRAAAAKLGNYRLTDLTLVVTLEPCAMCAGAISHARIGRVVFGADDPKGGAVVHGPKFFAQPTCHWRPEVTGGVLADESADLLRGFFRARRKAKI
【0511】
Geobacter sulfurreducens (G. sulfrreducens) TadA:
MSSLKKTPIRDDAYWMGKAIREAAKAAARDEVPIGAVIVRDGAVIGRGHNLREGSNDPSAHAEMIAIRQAARRSANWRLTGATLYVTLEPCLMCMGAIILARLERVVFGCYDPKGGAAGSLYDLSADPRLNHQVRLSPGVCQEECGTMLSDFFRDLRRRKKAKATPALFIDERKVPPEP
【0512】
E. coli TadA (ec TadA)の実施形態には、以下が含まれる:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
【0513】
いくつかの実施形態では、アデノシンデアミナーゼは、原核生物由来である。いくつかの実施形態では、アデノシンデアミナーゼは、細菌由来である。いくつかの実施形態では、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhi、Shewanella putrefaciens、Haemophilus influenzae、Caulobacter crescentus、またはBacillus subtilisに由来する。いくつかの実施形態では、アデノシンデアミナーゼは、大腸菌由来である。
【0514】
一実施形態では、本開示の融合タンパク質は、TadA*7.10に連結された野生型TadAがCas9ニッカーゼに連結されたものを含む。特定の実施形態では、融合タンパク質は、単一のTadA*7.10ドメイン(例えば、モノマーとして提供される)を含む。他の実施形態では、ABE7.10エディターは、TadA*7.10およびTadA(wt) を含み、これらはヘテロダイマーを形成することができる。
【0515】
いくつかの実施形態では、アデノシンデアミナーゼは、本明細書に提供されるアデノシンデアミナーゼのいずれかに記載のアミノ酸配列のいずれか1つに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。本明細書において提供されるアデノシンデアミナーゼは、1つ以上の突然変異(例えば、本明細書に提供される突然変異のいずれか)を含み得ることが理解されるべきである。本開示は、特定のパーセント同一性を有する任意のデアミナーゼドメインに、本明細書に記載される突然変異のいずれかまたはその組み合わせが加わったものを提供する。いくつかの実施形態では、アデノシンデアミナーゼは、参照配列または本明細書に提供されるアデノシンデアミナーゼのいずれかと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれより多くの突然変異を有するアミノ酸配列を含む。いくつかの実施形態では、アデノシンデアミナーゼは、当技術分野において公知であるかまたは本明細書に記載されたアミノ酸配列のいずれか1つと比較して、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170の同一の連続するアミノ酸残基を有するアミノ酸配列を含む。
【0516】
本明細書に提供される突然変異(例えばTadA参照配列に基づくもの)のいずれもが、E. coli TadA(ecTadA)、S. aureus TadA(saTadA)、または他のアデノシンデアミナーゼ(例えば細菌アデノシンデアミナーゼ)などの他のアデノシンデアミナーゼに導入され得ることが理解されるべきである。追加のデアミナーゼを同様にアラインメントして、本明細書中に提供されるように突然変異させ得る相同的アミノ酸残基を同定できることは、当業者には明らかであろう。従って、TadA参照配列において同定された突然変異のいずれも、相同なアミノ酸残基を有する他のアデノシンデアミナーゼ(例えばecTada)において作製することができる。また、本明細書中に提供される突然変異のいずれも、TadA参照配列または別のアデノシンデアミナーゼにおいて、個々にまたは任意の組み合わせで作製できることが理解されるべきである。
【0517】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、D108G、D108N、D108V、D108A、またはD108Y突然変異、あるいは別のアデノシンデアミナーゼにおける対応する突然変異を含む。
【0518】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106V突然変異、または別のアデノシンデアミナーゼ(例えば野生型TadAまたはecTadA)における対応する突然変異を含む。
【0519】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE155X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE155D、E155G、またはE155V突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
【0520】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD147X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD147Y突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
【0521】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106X、E155X、またはD147X突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、E155D、E155G、またはE155V突然変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、D147Yを含む。
【0522】
例えば、アデノシンデアミナーゼは、TadA参照配列におけるD108N、A106V、E155V、および/またはD147Y突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含有してもよい。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における以下の突然変異群(突然変異の群は「;」によって分離されている)、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む:D108NおよびA106V;D108NおよびE155V;D108NおよびD147Y;A106VおよびE155V;A106VおよびD147Y;E155VおよびD147Y;D108N、A106V、およびE155V;D108N、A106V、およびD147Y;D108N、E155V、およびD147Y;A106V、E155V、およびD 147Y;ならびにD108N、A106V、E155V、およびD147Y。しかし、ここで提供される対応する突然変異の任意の組み合わせを、アデノシンデアミナーゼ(例えばecTadA)において作製することができることを理解されたい。
【0523】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、T17X、L18X、W23X、L34X、W45X、R51X、A56X、E59X、E85X、M94X、I95X、V102X、F104X、A106X、R107X、D108X、K110X、M118X、N127X、A138X、F149X、M151X、R153X、Q154X、I156X、および/またはK157X突然変異のうちの1つ以上、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における1つ以上の対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、T17S、L18E、W23L、L34S、W45L、R51H、A56E、もしくはA56S、E59G、E85K、もしくはE85G、M94L、1951、V102A、F104L、A106V、R107C、もしくはR107H、もしくはR107P、D108G、もしくはD108N、もしくはD108V、もしくはD108A、もしくはD108Y、K110I、M118K、N127S、A138V、F149Y、M151V、R153C、Q154L、I156D、および/またはK157R突然変異のうちの1つ以上、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における1つ以上の対応する突然変異を含む。
【0524】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、および/またはN127X突然変異のうちの1つ以上、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における1つ以上の対応する突然変異を含み、Xは任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、および/またはN127S突然変異の1つ以上、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における1つ以上の対応する突然変異を含む。
【0525】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、R26X、M61X、L68X、M70X、A106X、D108X、A109X、N127X、D147X、R152X、Q154X、E155X、K161X、Q163X、および/またはT166X突然変異の1つ以上、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における1つ以上の対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、R26W、M61I、L68Q、M70V、A106T、D108N、A109T、N127S、D147Y、R152C、Q154HもしくはQ154R、E155GもしくはE155VもしくはE155D、K161Q、Q163H、および/またはT166P突然変異の1つ以上、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における1つ以上の対応する突然変異を含む。
【0526】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、N127X、D147X、R152X、およびQ154Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、M61X、M70X、D108X、N127X、Q154X、E155X、およびQ163Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、7つ、または8つの突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、N127X、E155X、およびT166Xからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。
【0527】
いくつかの実施形態では、アデノシンデアミナーゼは、H8X、A106X、D108Xからなる群から選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異、あるいは別のアデノシンデアミナーゼにおける突然変異(複数可)を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、H8X、R26X、L68X、D108X、N127X、D147X、およびE155Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、7つ、または8つの突然変異、あるいは別のアデノシンデアミナーゼにおける対応する突然変異(複数可)を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、A109X、N127X、およびE155Xからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。
【0528】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、R152C、およびQ154Hからなる群より選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、M61I、M70V、D108N、N127S、Q154R、E155GおよびQ163Hからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、7つまたは8つの突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、E155V、およびT166Pからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、A106T、D108N、N127S、E155D、およびK161Qからなる群から選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、R26W、L68Q、D108N、N127S、D147Y、およびE155Vからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、7つ、または8つの突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、A109T、N127S、およびE155Gからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含む。
【0529】
本明細書に提供される突然変異のいずれか、および任意の追加の突然変異(例えばecTadAアミノ酸配列に基づくもの)を、任意の他のアデノシンデアミナーゼに導入することができる。本明細書に提供される突然変異のいずれも、TadA参照配列または別のアデノシンデアミナーゼ(例えばecTadA)において、個々に、または任意の組み合わせで作製することができる。
【0530】
AからGへの核酸塩基編集タンパク質の詳細は、国際PCT出願第PCT/2017/045381号(WO 2018/027078)およびGaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature, 551, 464-471 (2017)に記載されており、その内容全体が参照により本明細書に組み込まれる。
【0531】
いくつかの実施形態では、アデノシンデアミナーゼは、別のアデノシンデアミナーゼ(例えばecTadA)において1つ以上の対応する突然変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108N、D108G、またはD108V突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)において対応する突然変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106VおよびD108N突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR107CおよびD108N突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、およびQ154H突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、およびE155V突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108N、D147Y、およびE155V突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、およびN127S突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106V、D108N、D147YおよびE155V突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
【0532】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS2X、H8X、I49X、L84X、H123X、N127X、I156Xおよび/またはK160X突然変異の1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS2A、H8Y、I49F、L84F、H123Y、N127S、I156Fおよび/またはK160S突然変異の1つ以上、または別のアデノシンデアミナーゼ(例えばecTadA)における1つ以上の対応する突然変異を含む。
【0533】
いくつかの実施形態では、アデノシンデアミナーゼは、L84X突然変異アデノシンデアミナーゼを含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるL84F突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
【0534】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH123X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH123Y突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
【0535】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるI156X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるI156F突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
【0536】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるL84X、A106X、D108X、H123X、D147X、E155X、およびI156Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、または7つの突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS2X、I49X、A106X、D108X、D147X、およびE155Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、A106X、D108X、N127X、およびK160Xからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。
【0537】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるL84F、A106V、D108N、H123Y、D147Y、E155V、およびI156Fからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、または7つの突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS2A、I49F、A106V、D108N、D147Y、およびE155Vからなる群より選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異を含む。
【0538】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、A106T、D108N、N127S、およびK160Sからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含む。
【0539】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25X、R26X、R107X、A142X、および/またはA143X突然変異の1つ以上、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における1つ以上の対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25M、E25D、E25A、E25R、E25V、E25S、E25Y、R26G、R26N、R26Q、R26C、R26L、R26K、R107P、R107K、R107A、R107N、R107W、R107H、R107S、A142N、A142D、A142G、A143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Q および/または A143R突然変異の1つ以上、または別のアデノシンデアミナーゼ(例えばecTadA)における1つ以上の対応する突然変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列に対応する本明細書に記載の突然変異の1つ以上、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する1つ以上の突然変異を含む。
【0540】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25M、E25D、E25A、E25R、E25V、E25S、またはE25Y突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
【0541】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR26X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR26G、R26N、R26Q、R26C、R26L、またはR26K突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
【0542】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR107X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR107P、R107K、R107A、R107N、R107W、R107H、またはR107S突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
【0543】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142N、A142D、A142G突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
【0544】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA143X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Qおよび/またはA143Rの突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
【0545】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36X、N37X、P48X、I49X、R51X、M70X、N72X、D77X、E134X、S146X、Q154X、K157X、および/またはK161X突然変異の1つ以上、または別のアデノシンデアミナーゼ(例えばecTadA)における1つ以上の対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36L、N37T、N37S、P48T、P48L、I49V、R51H、R51L、M70L、N72S、D77G、E134G、S146R、S146C、Q154H、K157N、および/またはK161T突然変異の1つ以上、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における1つ以上の対応する突然変異を含む。
【0546】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36L突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
【0547】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるN37X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるN37TまたはN37S突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
【0548】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48TまたはP48L突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
【0549】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR51X突然変異、または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR51HまたはR51L突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
【0550】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS146X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS146RまたはS146C突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
【0551】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるK157X突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるK157N突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
【0552】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48S、P48T、またはP48A突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
【0553】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142N突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
【0554】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるW23X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるW23RまたはW23L突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
【0555】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR152X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR152PまたはR52H突然変異、あるいは別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
【0556】
一実施形態では、アデノシンデアミナーゼは、突然変異H36L、R51L、L84F、A106V、D108N、H123Y、S146C、D147Y、E155V、I156F、およびK157Nを含むことができる。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列に対する突然変異の以下の組み合わせを含み、ここで、組み合わせの各突然変異は「_」によって分離され、突然変異の各組み合わせは括弧内にある:
(A106V_D108N),
(R107C_D108N),
(H8Y_D108N_N127S_D147Y_Q154H),
(H8Y_D108N_N127S_D147Y_E155V),
(D108N_D147Y_E155V),
(H8Y_D108N_N127S),
(H8Y_D108N_N127S_D147Y_Q154H),
(A106V_D108N_D147Y_E155V),
(D108Q_D147Y_E155V),
(D108M_D147Y_E155V),
(D108L_D147Y_E155V),
(D108K_D147Y_E155V),
(D108I_D147Y_E155V),
(D108F_D147Y_E155V),
(A106V_D108N_D147Y),
(A106V_D108M_D147Y_E155V),
(E59A_A106V_D108N_D147Y_E155V),
(E59A cat dead_A106V_D108N_D147Y_E155V),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156Y),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(D103A_D104N),
(G22P_D103A_D104N),
(D103A_D104N_S138A),
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(E25G_R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V
_I156F), (E25D_R26G_L84F_A106V_R107K_D108N_H123Y_A142N_A143G_D147Y_E155V_
I156F),
(R26Q_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(E25M_R26G_L84F_A106V_R107P_D108N_H123Y_A142N_A143D_D147Y_E155V
_I156F),
(R26C_L84F_A106V_R107H_D108N_H123Y_A142N_D147Y_E155V_I156F), (L84F_A106V_D108N_H123Y_A142N_A143L_D147Y_E155V_I156F),
(R26G_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(E25A_R26G_L84F_A106V_R107N_D108N_H123Y_A142N_A143E_D147Y_E155V
_I156F),
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(A106V_D108N_A142N_D147Y_E155V),
(R26G_A106V_D108N_A142N_D147Y_E155V),
(E25D_R26G_A106V_R107K_D108N_A142N_A143G_D147Y_E155V),
(R26G_A106V_D108N_R107H_A142N_A143D_D147Y_E155V),
(E25D_R26G_A106V_D108N_A142N_D147Y_E155V),
(A106V_R107K_D108N_A142N_D147Y_E155V),
(A106V_D108N_A142N_A143G_D147Y_E155V),
(A106V_D108N_A142N_A143L_D147Y_E155V),
(H36L_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(N37T_P48T_M70L_L84F_A106V_D108N_H123Y_D147Y_I49V_E155V_I156F),
(N37S_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K161T),
(H36L_L84F_A106V_D108N_H123Y_D147Y_Q154H_E155V_I156F),
(N72S_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F),
(H36L_P48L_L84F_A106V_D108N_H123Y_E134G_D147Y_E155V_I156F),
(H36L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N), (H36L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T),
(N37S_R51H_D77G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R51L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N),
(D24G_Q71R_L84F_H96L_A106V_D108N_H123Y_D147Y_E155V_I156F_K160E),
(H36L_G67V_L84F_A106V_D108N_H123Y_S146T_D147Y_E155V_I156F),
(Q71L_L84F_A106V_D108N_H123Y_L137M_A143E_D147Y_E155V_I156F),
(E25G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L),
(L84F_A91T_F104I_A106V_D108N_H123Y_D147Y_E155V_I156F),
(N72D_L84F_A106V_D108N_H123Y_G125A_D147Y_E155V_I156F),
(P48S_L84F_S97C_A106V_D108N_H123Y_D147Y_E155V_I156F),
(W23G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(D24G_P48L_Q71R_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L),
(L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(H36L_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F
_K157N), (N37S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_K161T),
(L84F_A106V_D108N_D147Y_E155V_I156F),
(R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E),
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R74A_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_R98Q_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_R129Q_D147Y_E155V_I156F),
(P48S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(P48S_A142N),
(P48T_I49V_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_L157N),
(P48T_I49V_A142N),
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N),
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F (H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_ I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F _K161T),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152H_E155V_I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V _I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_E155V
_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_R152P _E155V_I156F_K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F _K161T),
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V _I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_R152P_E155V
_I156F _K157N)。
【0557】
特定の実施形態では、本明細書で提供される融合タンパク質は、融合タンパク質の塩基編集活性を改善する1つ以上の特徴を含む。例えば、本明細書に提供される任意の融合タンパク質は、ヌクレアーゼ活性が低下したCas9ドメインを含み得る。いくつかの実施形態では、本明細書で提供される任意の融合タンパク質は、ヌクレアーゼ活性を持たないCas9ドメイン (dCas9) 、またはCas9ニッカーゼ (nCas9) と呼ばれる、二本鎖DNA分子の1つの鎖を切断するCas9ドメインを有し得る。
【0558】
いくつかの実施形態では、アデノシンデアミナーゼはTadA*7.10である。いくつかの実施形態では、TadA*7.10は少なくとも1つの改変を含む。特定の実施形態では、TadA*7.10は、TadA*7.10に対する以下の改変の1つ以上を含む:Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154R。改変Y123Hはまた、本明細書において、H123H(TadA*7.10における改変H123YがY123H (wt)に復帰された改変)とも称される。他の実施形態では、TadA*7.10は:Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; およびI76Y + V82S + Y123H + Y147R + Q154Rの群より選択される改変の組み合わせを含む。特定の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列に比較して、残基149、150、151、152、153、154、155、156、および157から始まるC末端の欠失、または別のTadAにおける対応する突然変異を含む。
【0559】
他の実施形態では、本開示の塩基エディターは、TadA*7.10、TadA参照配列に比較して、1つ以上の以下の改変: Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rを含むアデノシンデアミナーゼバリアント(例えばTadA*8)、あるいは別のTadAにおける対応する突然変異を含むモノマーである。他の実施形態では、アデノシンデアミナーゼバリアント(TadA*8)は、TadA*7.10、TadA参照配列に比較して: Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R;およびI76Y + V82S + Y123H + Y147R + Q154Rの群より選択される改変、または別のTadAにおける対応する突然変異の組み合わせを含むモノマーである。他の実施形態では、塩基エディターは、野生型アデノシンデアミナーゼ、ならびに以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rの1つ以上を含むアデノシンデアミナーゼバリアント(例えばTadA*8)を含む、ヘテロダイマーである。他の実施形態では、塩基エディターは、TadA*7.10ドメイン、ならびにTadA*7.10、TadA参照配列に比較して:Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R;およびI76Y + V82S + Y123H + Y147R + Q154R、または別のTadAにおける対応する突然変異の群より選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン(例えばTadA*8)を含む、ヘテロダイマーである。
【0560】
一実施形態では、アデノシンデアミナーゼは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこれらから本質的になる、TadA*8である:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
【0561】
いくつかの実施形態では、TadA*8は切り詰められている。いくつかの実施形態では、切詰TadA*8では、全長TadA*8に比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20のN末端アミノ酸残基が失われている。いくつかの実施形態では、切詰TadA*8では、全長TadA*8に比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20のC末端アミノ酸残基が失われている。いくつかの実施形態では、アデノシンデアミナーゼバリアントは全長TadA*8である。
【0562】
いくつかの実施形態では、TadA*8は、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、TadA*8.24である。
【0563】
一実施形態では、本開示の融合タンパク質は、本明細書記載のアデノシンデアミナーゼバリアント(例えばTadA*8)に連結された野生型TadAがCas9ニッカーゼに連結されたものを含む。特定の実施形態では、融合タンパク質は、単一のTadA*8ドメイン(例えば、モノマーとして提供されるもの)を含む。他の実施形態では、塩基エディターは、TadA*8およびTadA(wt) を含み、これらはヘテロ二量体を形成することができる。例示的な配列は以下の通りである:
【0564】
TadA(wt)または「TadA参照配列」;
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
【0565】
TadA*7.10
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
【0566】
TadA*8
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
【0567】
いくつかの実施形態では、アデノシンデアミナーゼは、本明細書に提供されるアデノシンデアミナーゼのいずれかに記載のアミノ酸配列のいずれか1つに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。本明細書において提供されるアデノシンデアミナーゼは、1つ以上の突然変異(例えば、本明細書に提供される突然変異のいずれか)を含み得ることが理解されるべきである。本開示は、特定のパーセント同一性を有する任意のデアミナーゼドメインに加えて本明細書に記載される突然変異のいずれかまたはその組み合わせを含むものを提供する。いくつかの実施形態では、アデノシンデアミナーゼは、参照配列または本明細書に提供されるアデノシンデアミナーゼのいずれかと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれより多い突然変異を有するアミノ酸配列を含む。いくつかの実施形態では、アデノシンデアミナーゼは、当技術分野において公知であるかまたは本明細書に記載されたアミノ酸配列のいずれか1つと比較して、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170の同一の連続するアミノ酸残基を有するアミノ酸配列を含む。
【0568】
特定の実施形態では、TadA*8は、太字で示す以下の位のいずれかで1つ以上の突然変異を含む。他の実施形態では、TadA*8は、下線で示す位のいずれかで1つ以上の突然変異を含む:
【0569】
例えば、TadA*8は、82位および/または166位のアミノ酸位での改変(例えばV82S、T166R)を単独で、あるいはTadA*7.10、TadA参照配列に比較して、以下のY147T、Y147R、Q154S、Y123H、および/またはQ154Rのいずれか、または別のTadAにおける対応する突然変異の1つ以上と組み合わせて含む。特定の実施形態では、改変の組み合わせはTadA*7.10、TadA参照配列に比較して:Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; およびI76Y + V82S + Y123H + Y147R + Q154R、または別のTadAにおける対応する突然変異の群より選択される。
【0570】
いくつかの実施形態では、アデノシンデアミナーゼは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる、TadA*8である:
MSEVEFSHEY WMRHALTLAK RARDEREVPV GAVLVLNNRV IGEGWNRAIG LHDPTAHAEI MALRQGGLVM QNYRLIDATL YVTFEPCVMC AGAMIHSRIG
RVVFGVRNAK TGAAGSLMDV LHYPGMNHRV EITEGILADE CAALLCTFFR
MPRQVFNAQK KAQSSTD
【0571】
いくつかの実施形態では、TadA*8は切り詰められている。いくつかの実施形態では、切詰TadA*8では、全長TadA*8に比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20のN末端アミノ酸残基が失われている。いくつかの実施形態では、切詰TadA*8では、全長TadA*8に比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20のC末端アミノ酸残基が失われている。いくつかの実施形態では、アデノシンデアミナーゼバリアントは全長TadA*8である。
【0572】
一実施形態では、本開示の融合タンパク質は、本明細書記載のアデノシンデアミナーゼバリアント(例えばTadA*8)に連結された野生型TadAがCas9ニッカーゼに連結されたものを含む。特定の実施形態では、融合タンパク質は、単一のTadA*8ドメイン(例えば、モノマーとして提供されるもの)を含む。他の実施形態では、塩基エディターは、TadA*8およびTadA(wt) を含み、これらはヘテロダイマーを形成することができる。
【0573】
追加のドメイン
本明細書に記載される塩基エディターは、ポリヌクレオチドの核酸塩基の編集、修飾、または改変の促進を補助する任意のドメインを含むことができる。いくつかの実施形態では、塩基エディターは、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン(例えばCas9)、核酸塩基編集ドメイン(例えばデアミナーゼドメイン)、および1つ以上の追加のドメインを含む。いくつかの実施形態では、追加のドメインは、塩基エディターの酵素的または触媒的機能、塩基エディターの結合機能を促進することができ、または所望の塩基編集結果に干渉し得る細胞機構(例えば酵素)の阻害剤であり得る。いくつかの実施形態では、塩基エディターは、ヌクレアーゼ、ニッカーゼ、レコンビナーゼ、デアミナーゼ、メチルトランスフェラーゼ、メチラーゼ、アセチラーゼ、アセチルトランスフェラーゼ、転写アクチベーター、または転写リプレッサードメインを含むことができる。
【0574】
いくつかの実施形態では、塩基エディターは、ウラシルグリコシラーゼ阻害剤 (UGI) ドメインを含むことができる。いくつかの実施形態では、U:Gヘテロ二本鎖DNAの存在に対する細胞DNA修復応答が、細胞における核酸塩基編集効率の低下の原因となり得る。こうした実施形態では、ウラシルDNAグリコシラーゼ (UDG)が、細胞中のDNAからのUの除去を触媒可能であり、それが塩基除去修復 (BER) を開始可能であり、大部分がU:G対からC:G対への復帰をもたらす。こうした実施形態では、一本鎖に結合する、編集された塩基をブロックする、UGIを阻害する、BERを阻害する、編集された塩基を保護する、および/または編集されていない鎖の修復を促進する、1つ以上のドメインを含む塩基エディターにおいてBERは阻害され得る。従って、本開示は、UGIドメインを含む塩基編集融合タンパク質を企図する。
【0575】
いくつかの実施形態では、塩基エディターは、二本鎖切断 (DSB) 結合タンパク質のすべてまたは一部をドメインとして含む。例えば、DSB結合タンパク質は、バクテリオファージMuのGamタンパク質を含んでもよく、これはDSBの末端に結合してそれらを分解から保護することができる。Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)を参照のこと(その全内容が参照により本明細書に組み入れられる)。
【0576】
さらに、いくつかの実施形態では、Gamタンパク質を塩基エディターのN末端に融合させてもよい。いくつかの実施形態では、Gamタンパク質を塩基エディターのC末端に融合させることができる。バクテリオファージMuのGamタンパク質は二本鎖切断 (DSB) の末端に結合し、それらを分解から保護することができる。いくつかの実施形態では、Gamを使用してDSBの遊離末端を結合することにより、塩基編集のプロセス中のインデル形成を低減することができる。いくつかの実施形態では、174残基のGamタンパク質は、塩基エディターのN末端に融合される。Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)を参照のこと。いくつかの実施形態では、突然変異(複数可)が、野生型ドメインと比較して、塩基編集ドメインの長さを変化させることができる。例えば、少なくとも1つのドメインにおける少なくとも1つのアミノ酸の欠失は、塩基エディターの長さを短くすることができる。別の場合、突然変異(複数可)は、野生型ドメインに対するドメインの長さを変化させない。例えば、いずれかのドメインにおける置換(複数可)は塩基エディターの長さを変える/変えない。
【0577】
いくつかの実施形態では、塩基エディターは、核酸ポリメラーゼ (NAP) のすべてまたは一部をドメインとして含むことができる。例えば、塩基エディターは、真核生物NAPのすべてまたは一部を含むことができる。いくつかの実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、DNAポリメラーゼである。いくつかの実施形態では、塩基エディター内に組み込まれるNAPまたはその一部は、損傷乗り越えポリメラーゼ活性を有する。いくつかの実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、損傷乗り越えDNAポリメラーゼである。いくつかの実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、Rev7、Rev1複合体、ポリメラーゼ・イオタ、ポリメラーゼ・カッパ、またはポリメラーゼ・エータである。いくつかの実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、真核生物ポリメラーゼ・アルファ、ベータ、ガンマ、デルタ、イプシロン、ガンマ、エータ、イオタ、カッパ、ラムダ、ミュー、またはニュー構成要素である。いくつかの実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、核酸ポリメラーゼ(例えば損傷乗り越えDNAポリメラーゼ)に対して少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%、または99.5%の同一性であるアミノ酸配列を含む。
【0578】
塩基エディターシステム
本明細書で提供される塩基エディターシステムの使用は、 (a) 対象のポリヌクレオチド(例えば、二本鎖または一本鎖DNAまたはRNA)の標的ヌクレオチド配列を、核酸塩基エディター(例えばアデノシン塩基エディター)およびガイドポリ核酸(例えばgRNA)を含む塩基エディターシステムと接触させ、ここで、標的ヌクレオチド配列が標的とされる核酸塩基対を含む、工程と;(b) 前記標的領域の鎖分離を誘導する工程と;(c)標的領域の一本鎖における前記標的核酸塩基対の第一の核酸塩基を第二の核酸塩基に変換する工程と;(d) 前記標的領域の1つより多くない鎖を切断し、第一の核酸塩基に相補的な第三の核酸塩基が、第二の核酸塩基に相補的な第四の核酸塩基に置換される工程を含む。いくつかの実施形態では、工程 (b) は省略されることを理解されたい。いくつかの実施形態では、前記の標的とされる核酸塩基対は、1つ以上の遺伝子における複数の核酸塩基対である。いくつかの実施形態では、本明細書に提供される塩基エディターシステムは、1つ以上の遺伝子における複数の核酸塩基対の多重編集を可能にする。いくつかの実施形態では、複数の核酸塩基対は、同一遺伝子中に位置する。いくつかの実施形態では、複数の核酸塩基対は、1つ以上の遺伝子に位置し、ここで、少なくとも1つの遺伝子は、異なる遺伝子座に位置する。
【0579】
いくつかの実施形態では、切断される一本鎖(ニック鎖)は、ガイド核酸にハイブリダイズされる。いくつかの実施形態では、切断される一本鎖は、第一の核酸塩基を含む鎖と反対である。いくつかの実施形態では、塩基エディターはCas9ドメインを含む。いくつかの実施形態では、第一の塩基はアデニンであり、第二の塩基はG、C、AまたはTではない。いくつかの実施形態では、第二の塩基はイノシンである。
【0580】
本明細書に提供される塩基編集システムは、触媒的に欠陥のあるStreptococcus pyogenes Cas9、アデノシンデアミナーゼ、および塩基除去修復の阻害剤を含む融合タンパク質を用いて、二本鎖DNA切断を生じることなく、ドナーDNAテンプレートを必要とせず、かつ過剰な確率的挿入および欠失を誘導することなく、DNAにおけるプログラム可能な一塩基(A→G)変化を誘導する、ゲノム編集の新規なアプローチを提供する。
【0581】
本明細書では、塩基エディターシステムを用いて核酸塩基を編集するためのシステム、組成物、および方法を提供する。いくつかの実施形態では、塩基エディターシステムは、(1)核酸塩基を編集するための、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインおよび核酸塩基編集ドメイン(例えばデアミナーゼドメイン)を含む塩基エディター(BE);ならびに(2)ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインと組み合わされたガイドポリヌクレオチド(例えばガイドRNA)を含む。いくつかの実施形態では、塩基エディターシステムはアデノシン塩基エディター(ABE)を含む。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインはポリヌクレオチドプログラム可能DNA結合ドメインである。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインはポリヌクレオチドプログラム可能RNA結合ドメインである。いくつかの実施形態では、核酸塩基編集ドメインはデアミナーゼドメインである。いくつかの実施形態では、デアミナーゼドメインはアデニンデアミナーゼまたはアデノシンデアミナーゼである。
【0582】
いくつかの実施形態では、アデノシン塩基エディターはDNA中のアデニンを脱アミノ化可能である。いくつかの実施形態では、ABEは進化したTadAバリアントを含む。
【0583】
核酸塩基編集タンパク質の詳細は、国際PCT出願番号PCT/2017/045381 (WO2018/027078) およびPCT/US2016/058344 (WO2017/070632) に記載されており、これらの各々は、その全体が参照により本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); および Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)も参照のこと(その内容全体が参照により本明細書に組み入れられる)。
【0584】
いくつかの実施形態では、単一のガイドポリヌクレオチドを利用して、デアミナーゼを標的核酸配列に標的化してもよい。いくつかの実施形態では、単一対のガイドポリヌクレオチドを利用して、異なるデアミナーゼを標的核酸配列に標的指向化してもよい。
【0585】
塩基エディターシステムの核酸塩基構成要素およびポリヌクレオチドプログラム可能ヌクレオチド結合構成要素は、互いに共有的または非共有的に会合され得る。例えば、いくつかの実施形態では、デアミナーゼドメインが、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインによって標的ヌクレオチド配列に標的指向化され得る。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、デアミナーゼドメインに融合または連結され得る。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、デアミナーゼドメインと非共有的に相互作用するかまたは会合することによって、デアミナーゼドメインを標的ヌクレオチド配列に標的指向化することができる。例えば、いくつかの実施形態では、核酸塩基編集構成要素、例えばデアミナーゼ構成要素は、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの一部をなす追加の異種部分またはドメインと相互作用するか、会合するか、または複合体を形成することができる、追加の異種部分またはドメインを含むことができる。いくつかの実施形態では、追加の異種部分は、ポリペプチドと結合するか、相互作用するか、会合するか、または複合体を形成することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドと結合するか、相互作用するか、会合するか、または複合体を形成することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリペプチドリンカーに結合することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合することが可能であり得る。追加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態では、追加の異種部分は、K相同 (KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステライルアルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
【0586】
塩基エディターシステムは、ガイドポリヌクレオチド構成要素をさらに含むことができる。塩基エディターシステムの構成要素は、共有結合、非共有相互作用、またはそれらの会合および相互作用の任意の組み合わせを介して互いに会合され得ることが理解されるべきである。いくつかの実施形態では、デアミナーゼドメインは、ガイドポリヌクレオチドによって標的ヌクレオチド配列に標的指向化され得る。例えば、いくつかの実施形態では、塩基エディターシステムの核酸塩基編集構成要素、例えばデアミナーゼ構成要素は、ガイドポリヌクレオチドの一部またはセグメント(例えばポリヌクレオチドモチーフ) と相互作用するか、会合するか、または複合体を形成することが可能である追加の異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質のようなポリヌクレオチド結合ドメイン)を含み得る。いくつかの実施形態では、追加の異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)は、デアミナーゼドメインに融合または連結され得る。いくつかの実施形態では、追加の異種部分は、ポリペプチドと結合するか、相互作用するか、会合するか、または複合体を形成することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドと結合するか、相互作用するか、会合するか、または複合体を形成することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリペプチドリンカーに結合することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合することが可能であり得る。追加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態では、追加の異種部分は、K相同 (KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステライルアルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
【0587】
いくつかの実施形態では、塩基エディターシステムは、塩基除去修復 (BER) 構成要素の阻害剤をさらに含むことができる。塩基エディターシステムの構成要素は、共有結合、非共有相互作用、またはそれらの会合および相互作用の任意の組み合わせを介して互いに会合され得ることが理解されるべきである。BER構成要素の阻害剤は、塩基除去修復阻害剤を含み得る。いくつかの実施形態では、塩基除去修復の阻害剤は、ウラシルDNAグリコシラーゼ阻害剤 (UGI) であり得る。いくつかの実施形態では、塩基除去修復の阻害剤は、イノシン塩基除去修復阻害剤であり得る。いくつかの実施形態では、塩基除去修復の阻害剤は、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインにより標的ヌクレオチド配列に標的指向化され得る。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、塩基除去修復の阻害剤に融合または連結され得る。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、デアミナーゼドメインおよび塩基除去修復の阻害剤に融合または連結され得る。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、塩基除去修復の阻害剤と非共有的に相互作用するか、または会合することによって、塩基除去修復の阻害剤を標的ヌクレオチド配列へと標的指向化することができる。例えば、いくつかの実施形態では、塩基除去修復構成要素の阻害剤は、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの一部である追加の異種部分またはドメインと相互作用するか、会合するか、または複合体を形成することが可能である追加の異種部分またはドメインを含み得る。いくつかの実施形態では、塩基除去修復の阻害剤は、ガイドポリヌクレオチドにより標的ヌクレオチド配列に標的指向化され得る。例えば、いくつかの実施形態では、塩基除去修復の阻害剤は、ガイドポリヌクレオチドの一部またはセグメント(例えば、ポリヌクレオチドモチーフ)と相互作用するか、会合するか、または複合体を形成することが可能である追加の異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質のようなポリヌクレオチド結合ドメイン)を含み得る。いくつかの実施形態では、ガイドポリヌクレオチドの追加の異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質のようなポリヌクレオチド結合ドメイン)は、塩基除去修復の阻害剤に融合または連結され得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドと結合するか、相互作用するか、会合するか、または複合体を形成することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリペプチドリンカーに結合可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合可能であり得る。追加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態では、追加の異種部分は、K相同 (KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステライルアルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
【0588】
いくつかの実施形態では、塩基エディターは、編集された鎖の塩基除去修復(BER)を阻害する。いくつかの実施形態では、塩基エディターは、編集されていない鎖を保護するかまたはこうした鎖に結合する。いくつかの実施形態では、塩基エディターはUGI活性を含む。いくつかの実施形態では、塩基エディターは、触媒的に不活性なイノシン特異的ヌクレアーゼを含む。いくつかの実施形態では、塩基エディターはニッカーゼ活性を含む。いくつかの実施形態では、塩基対の意図される編集は、PAM部位の上流にある。いくつかの実施形態では、塩基対の意図される編集は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド上流にある。いくつかの実施形態では、塩基対の意図される編集は、PAM部位の下流にある。いくつかの実施形態では、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下流にある。
【0589】
いくつかの実施形態では、本方法は、カノニカル(例えばNGG) PAM部位を必要としない。いくつかの実施形態では、核酸塩基エディターは、リンカーまたはスペーサーを含む。いくつかの実施形態では、リンカーまたはスペーサーは、長さ1~25アミノ酸である。いくつかの実施形態では、リンカーまたはスペーサーは、長さ5~20アミノ酸である。いくつかの実施形態では、リンカーまたはスペーサーは、長さ10、11、12、13、14、15、16、17、18、19、または20アミノ酸である。
【0590】
いくつかの実施形態では、本明細書で提供される塩基編集融合タンパク質は、正確な位置、例えば、標的塩基が定義された領域(例えば「脱アミノ化ウィンドウ」)内に配置されるような位置に配置される必要がある。いくつかの実施形態では、標的は4塩基領域内にあり得る。いくつかの実施形態では、そのような定義された標的領域は、PAMの約15塩基上流にあり得る。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017);およびKomor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017) を参照のこと;その全内容が参照により本明細書に組み入れられる。
【0591】
いくつかの実施形態では、標的領域は標的ウィンドウを含み、標的ウィンドウは標的核酸塩基対を含む。いくつかの実施形態では、標的ウィンドウは、1~10ヌクレオチドを含む。いくつかの実施形態では、標的ウィンドウは、長さ1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチドである。いくつかの実施形態では、塩基対の意図される編集は、標的ウィンドウ内にある。いくつかの実施形態では、標的ウィンドウは、塩基対の意図される編集を含む。いくつかの実施形態では、本方法は、本明細書に提供される塩基エディターのいずれかを用いて実施される。いくつかの実施形態では、標的ウィンドウは、脱アミノ化ウィンドウである。脱アミノ化ウィンドウは、塩基エディターが標的ヌクレオチドに作用して脱アミノ化する、定義された領域であり得る。いくつかの実施形態では、脱アミノ化ウィンドウは、2、3、4、5、6、7、8、9または10塩基領域内にある。いくつかの実施形態では、脱アミノ化ウィンドウは、PAMの5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24または25塩基上流にある。
【0592】
本開示の塩基エディターは、標的ポリヌクレオチド配列の編集を促進させる任意のドメイン、特徴またはアミノ酸配列を含むことができる。例えば、いくつかの実施形態では、塩基エディターは、核局在化配列 (NLS) を含む。いくつかの実施形態では、塩基エディターのNLSは、デアミナーゼドメインとポリヌクレオチドプログラム可能ヌクレオチド結合ドメインとの間に位置する。いくつかの実施形態では、塩基エディターのNLSは、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインに対してC末端に位置する。
【0593】
本明細書に開示されるような塩基エディターに存在し得る他の例示的特徴は、細胞質局在化配列、核輸出配列などの輸出配列、または他の局在化配列などの局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグである。本明細書において提供される適切なタンパク質タグには、限定されるものではないが、ビオチンカルボキシラーゼキャリアータンパク質 (BCCP) タグ、myc-タグ、カルモジュリンタグ、FLAG-タグ、赤血球凝集素 (HA) -タグ、ヒスチジンタグまたはHis-タグとも呼ばれるポリヒスチジンタグ、マルトース結合タンパク質 (MBP) -タグ、nus-タグ、グルタチオン-S-トランスフェラーゼ (GST) -タグ、緑色蛍光タンパク質 (GFP) -タグ、チオレドキシンタグ、S-タグ、Softag(例えばSoftag1、Softag3)、ストレプトタグ、ビオチンリガーゼタグ、FLAsHタグ、V5タグ、およびSBP-タグが含まれる。追加の適切な配列は、当業者には明らかであろう。いくつかの実施形態では、融合タンパク質は、1つ以上のHisタグを含む。
【0594】
融合タンパク質に含まれてもよいタンパク質ドメインの非限定的な例には、デアミナーゼドメイン(例えばアデノシンデアミナーゼ)、ウラシルグリコシラーゼ阻害剤(UGI)ドメイン、エピトープタグ、およびレポーター遺伝子配列が含まれる。
【0595】
エピトープタグの非限定的な例は、ヒスチジン (His) タグ、V5タグ、FLAGタグ、インフルエンザ赤血球凝集素 (HA) タグ、Mycタグ、VSV-Gタグ、およびチオレドキシン (Trx) タグを含む。レポーター遺伝子の例には、グルタチオン-5-トランスフェラーゼ (GST) 、セイヨウワサビペルオキシダーゼ (HRP) 、クロラムフェニコールアセチルトランスフェラーゼ (CAT) 、ベータ-ガラクトシダーゼ、ベータ-グルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質 (GFP) 、HcRed、DsRed、シアン蛍光タンパク質 (CFP) 、黄色蛍光タンパク質 (YFP) 、および青色蛍光タンパク質 (BFP) を含む自己蛍光タンパク質が含まれるが、これらに限定されない。さらなるタンパク質配列には、DNA分子に結合するかまたは他の細胞分子に結合するアミノ酸配列が含まれてもよく、これらには、マルトース結合タンパク質 (MBP) 、Sタグ、Lex A DNA結合ドメイン (DBD) 融合体、GAL4 DNA結合ドメイン融合体、および単純ヘルペスウイルス (HSV) BP16タンパク質融合体が含まれるが、これらに限定されない。
【0596】
いくつかの実施形態では、アデノシン塩基エディター(ABE)は、DNA中のアデニンを脱アミノ化することができる。いくつかの実施形態では、ABEは、BE3のAPOBEC1構成要素を、天然または操作されたE. coli TadA、ヒトADAR2、マウスADA、またはヒトADAT2で置換することによって生成される。いくつかの実施形態では、ABEは、進化されたTadAバリアントを含む。いくつかの実施形態では、ABEはABE 1.2 (TadA*-XTEN-nCas9-NLS) である。いくつかの実施形態では、TadA*はA106VおよびD108N突然変異を含む。
【0597】
いくつかの実施形態では、ABEは第二世代ABEである。いくつかの実施形態では、ABEはABE 2.1であり、これは、TadA*において追加の突然変異D147YおよびE155Vを含む(TadA*2.1)。いくつかの実施形態では、ABEはABE 2.2であり、これはABE 2.1が触媒的に不活化された型のヒトアルキルアデニンDNAグリコシラーゼ(E125Q突然変異を伴うAAG)に融合されたものである。いくつかの実施形態では、ABEはABE 2.3であり、これはABE 2.1が触媒的に不活化された型のE. coli Endo V (D35A突然変異で不活化される)に融合されたものである。いくつかの実施形態において、ABEはABE 2.6であり、これはABE 2.1におけるリンカーの2倍の長さ(32アミノ酸、(SGGS)2-XTEN-(SGGS)2)のリンカーを有する。いくつかの実施形態では、ABEはABE 2.7であり、これはABE 2.1が追加の野生型TadAモノマーに係留されたものである。いくつかの実施形態では、ABEはABE 2.8であり、これはABE 2.1が追加のTadA*2.1モノマーとともに係留されたものである。いくつかの実施形態では、ABEはABE 2.9であり、これは進化されたTadA (TadA*2.1) とABE 2.1のN末端との直接融合体である。いくつかの実施形態では、ABEはABE 2.10であり、これは野生型TadAとABE 2.1のN末端との直接融合体である。いくつかの実施形態では、ABEはABE 2.11であり、これは、TadA*モノマーのN末端で不活化E59A突然変異を有するABE 2.9である。いくつかの実施形態では、ABEはABE 2.12であり、これは、内部TadA*モノマーにおいて不活化E59A突然変異を有するABE 2.9である。
【0598】
いくつかの実施形態では、ABEは、第三世代ABEである。いくつかの実施形態では、ABEはABE 3.1であり、これは、3つの追加のTadA突然変異(L84F、H123Y、およびI157F)を伴うABE 2.3である。
【0599】
いくつかの実施形態では、ABEは第四世代ABEである。いくつかの実施形態では、ABEはABE4.3であり、これは追加のTadA突然変異A142N (TadA*4.3) を伴うABE 3.1である。
【0600】
いくつかの実施形態では、ABEは第五世代ABEである。いくつかの実施形態では、ABEはABE 5.1であり、これは生存クローンからの突然変異のコンセンサスセット(H36L、R51L、S146C、およびK157N) をABE 3.1に移入することによって生成される。いくつかの実施形態では、ABEはABE 5.3であり、これは内部の進化されたTadA*に融合された野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABEは、以下の表8に示されるような、ABE 5.2、ABE 5.4、ABE 5.5、ABE 5.6、ABE 5.7、ABE 5.8、ABE 5.9、ABE 5.10、ABE 5.11、ABE 5.12、ABE 5.13、またはABE 5.14である。いくつかの実施形態では、ABEは第六世代ABEである。いくつかの実施形態では、ABEは、以下の表8に示されるような、ABE 6.1、ABE 6.2、ABE 6.3、ABE 6.4、ABE 6.5、またはABE 6.6である。いくつかの実施形態では、ABEは、第七世代ABEである。いくつかの実施形態では、ABEは、以下の表8に示されるような、ABE7.1、ABE7.2、ABE7.3、ABE7.4、ABE7.5、ABE7.6、ABE7.7、ABE7.8、ABE7.9、またはABE7.10である。
【表8】
【0601】
いくつかの実施形態では、塩基エディターは第八世代ABE(ABE8)である。いくつかの実施形態では、ABE8はTadA*8バリアントを含有する。いくつかの実施形態では、ABE8はTadA*8バリアントを含有するモノマー構築物(「ABE8.x-m」)である。いくつかの実施形態では、ABE8はABE8.1-mであり、これはY147T突然変異を含むTadA*7.10(TadA*8.1)を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.2-mであり、これはY147R突然変異を含むTadA*7.10(TadA*8.2)を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.3-mであり、これはQ154S突然変異を含むTadA*7.10(TadA*8.3)を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.4-mであり、これはY123H突然変異を含むTadA*7.10(TadA*8.4)を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.5-mであり、これはV82S突然変異を含むTadA*7.10(TadA*8.5)を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.6-mであり、これはT166R突然変異を含むTadA*7.10(TadA*8.6)を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.7-mであり、これはQ154R突然変異を含むTadA*7.10(TadA*8.7)を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.8-mであり、これはY147R、Q154R、およびY123H突然変異を含むTadA*7.10(TadA*8.8)を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.9-mであり、これはY147R、Q154RおよびI76Y突然変異を含むTadA*7.10(TadA*8.9)を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.10-mであり、これはY147R、Q154R、およびT166R突然変異を含むTadA*7.10(TadA*8.10)を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.11-mであり、これはY147TおよびQ154R突然変異を含むTadA*7.10(TadA*8.11)を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.12-mであり、これはY147TおよびQ154S突然変異を含むTadA*7.10(TadA*8.12)を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.13-mであり、これはY123H(H123Yから復帰されたY123H)、Y147R、Q154RおよびI76Y突然変異を含むTadA*7.10(TadA*8.13)を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.14-mであり、これはI76YおよびV82S突然変異を含むTadA*7.10(TadA*8.14)を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.15-mであり、これはV82SおよびY147R突然変異を含むTadA*7.10(TadA*8.15)を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.16-mであり、これはV82S、Y123H(H123Yから復帰されたY123H)およびY147R突然変異を含むTadA*7.10(TadA*8.16)を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.17-mであり、これはV82SおよびQ154R突然変異を含むTadA*7.10(TadA*8.17)を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.18-mであり、これはV82S、Y123H(H123Yから復帰されたY123H)およびQ154R突然変異を含むTadA*7.10(TadA*8.18)を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.19-mであり、これはV82S、Y123H(H123Yから復帰されたY123H)、Y147RおよびQ154R突然変異を含むTadA*7.10(TadA*8.19)を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.20-mであり、これはI76Y、V82S、Y123H(H123Yから復帰されたY123H)、Y147RおよびQ154R突然変異を含むTadA*7.10(TadA*8.20)を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.21-mであり、これはY147RおよびQ154S突然変異を含むTadA*7.10(TadA*8.21)を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.22-mであり、これはV82SおよびQ154S突然変異を含むTadA*7.10(TadA*8.22)を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.23-mであり、これはV82SおよびY123H(H123Yから復帰されたY123H)突然変異を含むTadA*7.10(TadA*8.23)を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.24-mであり、これはV82S、Y123H(H123Yから復帰されたY123H)、およびY147T突然変異を含むTadA*7.10(TadA*8.24)を含有するモノマー構築物を有する。
【0602】
いくつかの実施形態では、ABE8は、TadA*8バリアントに融合された野生型E. coli TadAを含有するヘテロダイマー構築物(「ABE8.x-d」)を有する。いくつかの実施形態では、ABE8はABE8.1-dであり、これはY147T突然変異を含むTadA*7.10(TadA*8.1)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.2-dであり、これはY147R突然変異を含むTadA*7.10(TadA*8.2)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.3-dであり、これはQ154S突然変異を含むTadA*7.10(TadA*8.3)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.4-dであり、これはY123H突然変異を含むTadA*7.10(TadA*8.4)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.5-dであり、これはV82S突然変異を含むTadA*7.10(TadA*8.5)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.6-dであり、これはT166R突然変異を含むTadA*7.10(TadA*8.6)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.7-dであり、これはQ154R突然変異を含むTadA*7.10(TadA*8.7)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.8-dであり、これはY147R、Q154R、およびY123H突然変異を含むTadA*7.10(TadA*8.8)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.9-dであり、これはY147R、Q154RおよびI76Y突然変異を含むTadA*7.10(TadA*8.9)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.10-dであり、これはY147R、Q154R、およびT166R突然変異を含むTadA*7.10(TadA*8.10)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.11-dであり、これはY147TおよびQ154R突然変異を含むTadA*7.10(TadA*8.11)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.12-dであり、これはY147TおよびQ154S突然変異を含むTadA*7.10(TadA*8.12)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.13-dであり、これはY123H(H123Yから復帰されたY123H)、Y147R、Q154RおよびI76Y突然変異を含むTadA*7.10(TadA*8.13)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.14-dであり、これはI76YおよびV82S突然変異を含むTadA*7.10(TadA*8.14)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.15-dであり、これはV82SおよびY147R突然変異を含むTadA*7.10(TadA*8.15)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.16-dであり、これはV82S、Y123H(H123Yから復帰されたY123H)およびY147R突然変異を含むTadA*7.10(TadA*8.16)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.17-dであり、これはV82SおよびQ154R突然変異を含むTadA*7.10(TadA*8.17)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.18-dであり、これはV82S、Y123H(H123Yから復帰されたY123H)およびQ154R突然変異を含むTadA*7.10(TadA*8.18)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.19-dであり、これはV82S、Y123H(H123Yから復帰されたY123H)、Y147RおよびQ154R突然変異を含むTadA*7.10(TadA*8.19)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.20-dであり、これはI76Y、V82S、Y123H(H123Yから復帰されたY123H)、Y147RおよびQ154R突然変異を含むTadA*7.10(TadA*8.20)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.21-dであり、これはY147RおよびQ154S突然変異を含むTadA*7.10(TadA*8.21)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.22-dであり、これはV82SおよびQ154S突然変異を含むTadA*7.10(TadA*8.22)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.23-dであり、これはV82SおよびY123H(H123Yから復帰されたY123H)突然変異を含むTadA*7.10(TadA*8.23)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.24-dであり、これはV82S、Y123H(H123Yから復帰されたY123H)、およびY147T突然変異を含むTadA*7.10(TadA*8.24)に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。
【0603】
いくつかの実施形態では、ABE8は、TadA*8バリアントに融合されたTadA*7.10を含有するヘテロダイマー構築物(「ABE8.x-7」)を有する。いくつかの実施形態では、ABE8はABE8.1-7であり、これはY147T突然変異を含むTadA*7.10(TadA*8.1)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.2-7であり、これはY147R突然変異を含むTadA*7.10(TadA*8.2)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.3-7であり、これはQ154S突然変異を含むTadA*7.10(TadA*8.3)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.4-7であり、これはY123H突然変異を含むTadA*7.10(TadA*8.4)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.5-7であり、これはV82S突然変異を含むTadA*7.10(TadA*8.5)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.6-7であり、これはT166R突然変異を含むTadA*7.10(TadA*8.6)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.7-7であり、これはQ154R突然変異を含むTadA*7.10(TadA*8.7)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.8-7であり、これはY147R、Q154R、およびY123H突然変異を含むTadA*7.10(TadA*8.8)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.9-7であり、これはY147R、Q154RおよびI76Y突然変異を含むTadA*7.10(TadA*8.9)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.10-7であり、これはY147R、Q154R、およびT166R突然変異を含むTadA*7.10(TadA*8.10)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.11-7であり、これはY147TおよびQ154R突然変異を含むTadA*7.10(TadA*8.11)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.12-7であり、これはY147TおよびQ154S突然変異を含むTadA*7.10(TadA*8.12)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.13-7であり、これはY123H(H123Yから復帰されたY123H)、Y147R、Q154RおよびI76Y突然変異を含むTadA*7.10(TadA*8.13)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.14-7であり、これはI76YおよびV82S突然変異を含むTadA*7.10(TadA*8.14)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.15-7であり、これはV82SおよびY147R突然変異を含むTadA*7.10(TadA*8.15)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.16-7であり、これはV82S、Y123H(H123Yから復帰されたY123H)およびY147R突然変異を含むTadA*7.10(TadA*8.16)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.17-7であり、これはV82SおよびQ154R突然変異を含むTadA*7.10(TadA*8.17)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.18-7であり、これはV82S、Y123H(H123Yから復帰されたY123H)およびQ154R突然変異を含むTadA*7.10(TadA*8.18)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.19-7であり、これはV82S、Y123H(H123Yから復帰されたY123H)、Y147RおよびQ154R突然変異を含むTadA*7.10(TadA*8.19)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.20-7であり、これはI76Y、V82S、Y123H(H123Yから復帰されたY123H)、Y147RおよびQ154R突然変異を含むTadA*7.10(TadA*8.20)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.21-7であり、これはY147RおよびQ154S突然変異を含むTadA*7.10(TadA*8.21)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.22-7であり、これはV82SおよびQ154S突然変異を含むTadA*7.10(TadA*8.22)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.23-7であり、これはV82SおよびY123H(H123Yから復帰されたY123H)突然変異を含むTadA*7.10(TadA*8.23)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.24-7であり、これはV82S、Y123H(H123Yから復帰されたY123H)、およびY147T突然変異を含むTadA*7.10(TadA*8.24)に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。
【0604】
いくつかの実施形態では、ABEは、以下の表9に示すような、ABE8.1-m、ABE8.2-m、ABE8.3-m、ABE8.4-m、ABE8.5-m、ABE8.6-m、ABE8.7-m、ABE8.8-m、ABE8.9-m、ABE8.10-m、ABE8.11-m、ABE8.12-m、ABE8.13-m、ABE8.14-m、ABE8.15-m、ABE8.16-m、ABE8.17-m、ABE8.18-m、ABE8.19-m、ABE8.20-m、ABE8.21-m、ABE8.22-m、ABE8.23-m、ABE8.24-m、ABE8.1-d、ABE8.2-d、ABE8.3-d、ABE8.4-d、ABE8.5-d、ABE8.6-d、ABE8.7-d、ABE8.8-d、ABE8.9-d、ABE8.10-d、ABE8.11-d、ABE8.12-d、ABE8.13-d、ABE8.14-d、ABE8.15-d、ABE8.16-d、ABE8.17-d、ABE8.18-d、ABE8.19-d、ABE8.20-d、ABE8.21-d、ABE8.22-d、ABE8.23-d、またはABE8.24-dである。
【表9】
【0605】
いくつかの実施形態では、塩基エディター(例えばABE8)は、アデノシンデアミナーゼバリアント(例えばTadA*8)を、循環置換体Cas9(例えばCP5またはCP6)および二部分核局在化配列を含む足場内にクローニングすることによって生成される。いくつかの実施形態では、塩基エディター(例えばABE7.9、ABE7.10、またはABE8)は、NGC PAM CP5バリアント(S. pyogenes Cas9またはspVRQR Cas9)である。いくつかの実施形態では、塩基エディター(例えばABE7.9、ABE7.10、またはABE8)は、AGA PAM CP5バリアント(S. pyogenes Cas9またはspVRQR Cas9)である。いくつかの実施形態では、塩基エディター(例えばABE7.9、ABE7.10、またはABE8)は、NGC PAM CP6バリアント(S. pyogenes Cas9またはspVRQR Cas9)である。いくつかの実施形態では、塩基エディター(例えばABE7.9、ABE7.10、またはABE8)は、AGA PAM CP6バリアント(S. pyogenes Cas9またはspVRQR Cas9)である。
【0606】
いくつかの実施形態では、ABEは以下の表10に示すような遺伝子型を有する。
【表10】
【0607】
以下の表11に示すように、40個のABE8の遺伝子型が記載される。ABEの進化したE. coli TadA部分の残基位を示す。ABE7.10突然変異と異なる場合のABE8中の突然変異変化を示す。いくつかの実施形態では、ABEは以下の表11に示すようなABEの1つの遺伝子型を有する。
【表11】
【0608】
いくつかの実施形態では、塩基エディターはABE8.1であり、これは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる:
【0609】
ABE8.1_Y147T_CP5_NGC PAM_モノマー
【0610】
上記配列中、プレーンテキストはアデノシンデアミナーゼ配列を示し、太字配列はCas9由来の配列を示し、斜字配列はリンカー配列を示し、下線配列は二部分核局在化配列を示す。
【0611】
いくつかの実施形態では、塩基エディターはABE8.1であり、これは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる:
【0612】
pNMG-B335 ABE8.1_Y147T_CP5_NGC PAM_モノマー
【0613】
上記配列中、プレーンテキストはアデノシンデアミナーゼ配列を示し、太字配列はCas9由来の配列を示し、斜字配列はリンカー配列を示し、下線配列は二部分核局在化配列を示す。
【0614】
いくつかの実施形態では、塩基エディターはABE8.14であり、これは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる:
【0615】
NGCPAM CP5を含むpNMG-357-ABE8.14
【0616】
上記配列中、プレーンテキストはアデノシンデアミナーゼ配列を示し、太字配列はCas9由来の配列を示し、斜字配列はリンカー配列を示し、下線配列は二部分核局在化配列を示す。
【0617】
いくつかの実施形態では、塩基エディターはABE8.8-mであり、これは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる:
ABE8.8-m
【0618】
上記配列中、プレーンテキストはアデノシンデアミナーゼ配列を示し、太字配列はCas9由来の配列を示し、斜字配列はリンカー配列を示し、下線配列は二部分核局在化配列を示し、二重下線配列は突然変異を示す。
【0619】
いくつかの実施形態では、塩基エディターはABE8.8-dであり、これは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる:
ABE8.8-d
【0620】
上記配列中、プレーンテキストはアデノシンデアミナーゼ配列を示し、太字配列はCas9由来の配列を示し、斜字配列はリンカー配列を示し、下線配列は二部分核局在化配列を示し、二重下線配列は突然変異を示す。
【0621】
いくつかの実施形態では、塩基エディターはABE8.13-mであり、これは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる:
ABE8.13-m
【0622】
上記配列中、プレーンテキストはアデノシンデアミナーゼ配列を示し、太字配列はCas9由来の配列を示し、斜字配列はリンカー配列を示し、下線配列は二部分核局在化配列を示し、二重下線配列は突然変異を示す。
【0623】
いくつかの実施形態では、塩基エディターはABE8.13-dであり、これは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる:
ABE8.13-d
【0624】
上記配列中、プレーンテキストはアデノシンデアミナーゼ配列を示し、太字配列はCas9由来の配列を示し、斜字配列はリンカー配列を示し、下線配列は二部分核局在化配列を示し、二重下線配列は突然変異を示す。
【0625】
いくつかの実施形態では、塩基エディターはABE8.17-mであり、これは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる:
ABE8.17-m
【0626】
上記配列中、プレーンテキストはアデノシンデアミナーゼ配列を示し、太字配列はCas9由来の配列を示し、斜字配列はリンカー配列を示し、下線配列は二部分核局在化配列を示し、二重下線配列は突然変異を示す。
【0627】
いくつかの実施形態では、塩基エディターはABE8.17-dであり、これは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる:
ABE8.17-d
【0628】
上記配列中、プレーンテキストはアデノシンデアミナーゼ配列を示し、太字配列はCas9由来の配列を示し、斜字配列はリンカー配列を示し、下線配列は二部分核局在化配列を示し、二重下線配列は突然変異を示す。
【0629】
いくつかの実施形態では、塩基エディターはABE8.20-mであり、これは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる:
ABE8.20-m
【0630】
上記配列中、プレーンテキストはアデノシンデアミナーゼ配列を示し、太字配列はCas9由来の配列を示し、斜字配列はリンカー配列を示し、下線配列は二部分核局在化配列を示し、二重下線配列は突然変異を示す。
【0631】
いくつかの実施形態では、塩基エディターはABE8.20-dであり、これは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる:
ABE8.20-d
【0632】
上記配列中、プレーンテキストはアデノシンデアミナーゼ配列を示し、太字配列はCas9由来の配列を示し、斜字配列はリンカー配列を示し、下線配列は二部分核局在化配列を示し、二重下線配列は突然変異を示す。
【0633】
いくつかの実施形態では、本開示のABE8は以下の配列より選択される:
【0634】
01. monoABE8.1_bpNLS + Y147T
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0635】
02. monoABE8.1_bpNLS + Y147R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0636】
03. monoABE8.1_bpNLS + Q154S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRSVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0637】
04. monoABE8.1_bpNLS + Y123H
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0638】
05. monoABE8.1_bpNLS + V82S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0639】
06. monoABE8.1_bpNLS + T166R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSRDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0640】
07. monoABE8.1_bpNLS + Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0641】
08. monoABE8.1_bpNLS + Y147R_Q154R_Y123H
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0642】
09. monoABE8.1_bpNLS + Y147R_Q154R_I76Y
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0643】
10. monoABE8.1_bpNLS + Y147R_Q154R_T166R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSRDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0644】
11. monoABE8.1_bpNLS + Y147T_Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0645】
12. monoABE8.1_bpNLS + Y147T_Q154S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRSVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0646】
13. monoABE8.1_bpNLS + H123Y123H_Y147R_Q154R_I76Y
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0647】
14. monoABE8.1_bpNLS + V82S + Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0648】
いくつかの実施形態では、塩基エディターは、核酸塩基編集ドメイン(例えばデアミナーゼドメインのすべてまたは部分)に融合されたポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン(例えばCas9由来ドメイン)を含む融合タンパク質である。特定の実施形態では、本明細書に提供する融合タンパク質は、融合タンパク質の塩基編集活性を改善する1つ以上の特徴を含む。例えば、本明細書に提供するいかなる融合タンパク質も、減少したヌクレアーゼ活性を有するCas9ドメインを含んでもよい。いくつかの実施形態では、本明細書に提供する融合タンパク質のいずれも、ヌクレアーゼ活性を持たないCas9ドメイン(dCas9)、またはCas9ニッカーゼと称される、二本鎖DNA分子の一方の鎖をカットするCas9ドメイン(nCas9)を有してもよい。
【0649】
いくつかの実施形態では、塩基エディターは、ウラシルグリコシラーゼ阻害剤 (UGI) のすべてまたは一部を含むドメインをさらに含む。いくつかの実施形態では、塩基エディターは、ウラシルDNAグリコシラーゼ(UDG)などの、ウラシル結合タンパク質(UBP)のすべてまたは一部を含むドメインを含む。いくつかの実施形態では、塩基エディターは、核酸ポリメラーゼのすべてまたは一部を含むドメインを含む。いくつかの実施形態では、塩基エディターに組み込まれる核酸ポリメラーゼまたはその一部は、損傷乗り越えDNAポリメラーゼである。
【0650】
いくつかの実施形態では、塩基エディターのドメインは、複数のドメインを含むことができる。例えば、Cas9に由来するポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを含む塩基エディターは、野生型または天然のCas9のRECローブおよびNUCローブに対応するRECローブおよびNUCローブを含むことができる。別の例では、塩基エディターは、RuvCIドメイン、BHドメイン、REC1ドメイン、REC2ドメイン、RuvCIIドメイン、L1ドメイン、HNHドメイン、L2ドメイン、RuvCIIIドメイン、WEDドメイン、TOPOドメインまたはCTDドメインの1つ以上を含むことができる。いくつかの実施形態では、塩基エディターの1つ以上のドメインは、そのドメインを含むポリペプチドの野生型バージョンに対する突然変異(例えば置換、挿入、欠失)を含む。例えば、ポリヌクレオチドプログラム可能DNA結合ドメインのHNHドメインは、H840A置換を含むことができる。別の例では、ポリヌクレオチドプログラム可能DNA結合ドメインのRuvCIドメインは、D10A置換を含むことができる。
【0651】
本明細書に開示される塩基エディターの異なるドメイン(例えば隣接ドメイン)は、1つ以上のリンカードメイン(例えばXTENリンカードメイン)を使用して、または使用せずに、互いに連結することができる。いくつかの実施形態では、リンカードメインは、2つの分子もしくは部分、例えば、第一のドメイン(例えばCas9由来ドメイン)および第二のドメイン(例えばアデノシンデアミナーゼドメイン)のような融合タンパク質の2つのドメインを連結する結合(例えば共有結合)、化学基、または分子であり得る。いくつかの実施形態では、リンカーは、共有結合(例えば炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合など)である。特定の実施形態では、リンカーは、アミド連結の炭素窒素結合である。特定の実施形態では、リンカーは、環状もしくは非環状、置換もしくは非置換、分枝もしくは非分枝の脂肪族もしくはヘテロ脂肪族リンカーである。特定の実施形態では、リンカーは、ポリマー(例えばポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)である。特定の実施形態では、リンカーは、アミノアルカン酸のモノマー、ダイマーまたはポリマーを含む。いくつかの実施形態では、リンカーは、アミノアルカン酸(例えばグリシン、エタン酸、アラニン、ベータ-アラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸等)を含む。いくつかの実施形態では、リンカーは、アミノヘキサン酸 (Ahx) のモノマー、ダイマーまたはポリマーを含む。特定の実施形態では、リンカーは炭素環部分(例えばシクロペンタン、シクロヘキサン)に基づく。他の実施形態では、リンカーはポリエチレングリコール部分 (PEG) を含む。特定の実施形態では、リンカーは、アリールまたはヘテロアリール部分を含む。特定の実施形態では、リンカーは、フェニル環に基づく。リンカーは、ペプチドからリンカーへの求核剤(例えばチオール、アミノ)の付着を促進させる官能化部分を含むことができる。リンカーの一部として任意の求電子剤を使用することができる。例示的な求電子剤には、活性化エステル、活性化アミド、マイケルアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、およびイソチオシアナートが含まれるが、これらに限定されない。いくつかの実施形態では、リンカーは、Cas9ヌクレアーゼドメインを含むRNAプログラム可能ヌクレアーゼのgRNA結合ドメインと、核酸編集タンパク質の触媒ドメインとを結合する。いくつかの実施形態では、リンカーは、dCas9と第二のドメイン(例えばUGI等)とを連結する。
【0652】
典型的には、リンカーは、2つの基、分子、または他の部分の間に配置されるか、または2つの基、分子、または他の部分によって隣接され、共有結合を介してそれぞれに連結され、従って2つを連結する。いくつかの実施形態では、リンカーは、アミノ酸または複数のアミノ酸(例えばペプチドまたはタンパク質)である。いくつかの実施形態では、リンカーは、有機分子、基、ポリマー、または化学的部分である。いくつかの実施形態では、リンカーは、長さ2~100アミノ酸であり、例えば、長さ2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30~35、35~40、40~45、45~50、50~60、60~70、70~80、80~90、90~100、100~150または150~200アミノ酸である。いくつかの実施形態では、リンカーは、長さ約3~約104 (例えば5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、または100)アミノ酸である。より長いまたはより短いリンカーも考えられる。いくつかの実施形態では、リンカードメインは、XTENリンカーとも呼ばれ得るアミノ酸配列SGSETPGTSESATPESを含む。融合タンパク質ドメインを連結するための任意の方法を用いて (例えば、(SGGS)n、(GGGS)n、(GGGGS)n、および(G)nの型の非常に柔軟なリンカーから、(EAAAK)n、 (GGS)n、SGSETPGTSESATPESの型のより剛性の高いリンカーまで(例えばGuilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32(6): 577-82を参照のこと。その全内容は参照により本明細書に組み込まれる)、または (XP)nモチーフ)、核酸塩基エディターの活性のための最適な長さを達成することができる。いくつかの実施形態では、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14または15である。いくつかの実施形態では、リンカーは、(GGS)nモチーフを含み、ここで、nは、1、3、または7である。いくつかの実施形態では、本明細書で提供される融合タンパク質のCas9ドメインは、アミノ酸配列SGSETPGTSESATPESを含むリンカーを介して融合される。いくつかの実施形態では、リンカーは、複数のプロリン残基を含み、長さ5~21、5~14、5~9、5~7アミノ酸であり、例えば、PAPAP、PAPAPA、PAPAPAP、PAPAPAPA、P(AP)4、P(AP)7、P(AP)10である(例えば、Tan J, Zhang F, Karcher D, Bock R. Engineering of high-precision base editors for site-specific single nucleotide replacement. Nat Commun. 2019 Jan 25;10(1):439を参照のこと;その全内容は参照により本明細書に組み込まれる)。このようなプロリンリッチリンカーはまた、「剛性」リンカーとも呼ばれる。
【0653】
本明細書記載の融合タンパク質は核酸編集ドメインを含む。いくつかの実施形態では、デアミナーゼはアデノシンデアミナーゼである。いくつかの実施形態では、デアミナーゼは脊椎動物デアミナーゼである。いくつかの実施形態では、デアミナーゼは無脊椎動物デアミナーゼである。いくつかの実施形態では、デアミナーゼは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスデアミナーゼである。いくつかの実施形態では、デアミナーゼはヒトデアミナーゼである。いくつかの実施形態では、デアミナーゼはラットデアミナーゼである。
【0654】
リンカー
特定の実施形態では、リンカーを用いて、本明細書記載の任意のペプチドまたはペプチドドメインを連結してもよい。リンカーは、共有結合程度に単純であってもよいし、または多くの原子に渡る長さのポリマーリンカーであってもよい。特定の実施形態では、リンカーはポリペプチドであるかまたはアミノ酸に基づく。他の実施形態では、リンカーはペプチド様ではない。特定の実施形態では、リンカーは、共有結合(例えば炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合など)である。特定の実施形態では、リンカーは、アミド連結の炭素-窒素結合である。特定の実施形態では、リンカーは、環状もしくは非環状、置換もしくは非置換、分枝もしくは非分枝の脂肪族もしくはヘテロ脂肪族リンカーである。特定の実施形態では、リンカーは、ポリマー(例えばポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)である。特定の実施形態では、リンカーは、アミノアルカン酸のモノマー、ダイマーまたはポリマーを含む。特定の実施形態では、リンカーは、アミノアルカン酸(例えばグリシン、エタン酸、アラニン、ベータ-アラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸等)を含む。特定の実施形態では、リンカーは、アミノヘキサン酸 (Ahx) のモノマー、ダイマーまたはポリマーを含む。特定の実施形態では、リンカーは炭素環部分(例えばシクロペンタン、シクロヘキサン)に基づく。他の実施形態では、リンカーはポリエチレングリコール部分 (PEG) を含む。他の実施形態では、リンカーはアミノ酸を含む。特定の実施形態では、リンカーはペプチドを含む。特定の実施形態では、リンカーは、アリールまたはヘテロアリール部分を含む。特定の実施形態では、リンカーは、フェニル環に基づく。リンカーは、ペプチドからリンカーへの求核剤(例えばチオール、アミノ)の付着を促進させる官能化部分を含むことができる。リンカーの一部として任意の求電子剤を使用することができる。例示的な求電子剤には、活性化エステル、活性化アミド、マイケルアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、およびイソチオシアナートが含まれるが、これらに限定されない。
【0655】
いくつかの実施形態では、リンカーは、アミノ酸または複数のアミノ酸(例えばペプチドまたはタンパク質)である。いくつかの実施形態では、リンカーは、結合(例えば共有結合)、有機分子、基、ポリマー、または化学的部分である。いくつかの実施形態では、リンカーは、長さ約3~約104 (例えば5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、または100)アミノ酸である。
【0656】
いくつかの実施形態では、アデノシンデアミナーゼおよびnapDNAbpは、長さ4、16、32、または104アミノ酸であるリンカーを通じて融合される。いくつかの実施形態では、リンカーは、長さ約3~約104アミノ酸である。いくつかの実施形態では、本明細書に提供する融合タンパク質はいずれも、互いにリンカーを通じて融合されているアデノシンデアミナーゼおよびCas9ドメインを含む。核酸塩基エディターの活性に最適な長さを達成するため、デアミナーゼドメイン(例えば操作されたecTadA)およびCas9ドメインの間で、多様な長さおよび柔軟性のリンカーを使用してもよい(例えば、 (GGGS)n、(GGGGS)n、および(G)nの型の非常に柔軟なリンカーから、(EAAAK)n、 (SGGS)n、SGSETPGTSESATPESの型のより剛性の高いリンカーまで(例えばGuilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32(6): 577-82を参照のこと。その全内容は参照により本明細書に組み込まれる)、および(XP)nモチーフ)。いくつかの実施形態では、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14または15である。いくつかの実施形態では、リンカーは、(GGS)nモチーフを含み、ここで、nは、1、3、または7である。いくつかの実施形態では、本明細書で提供される任意の融合タンパク質のアデノシンデアミナーゼおよびCas9ドメインは、アミノ酸配列SGSETPGTSESATPESを含むリンカー(例えばXTENリンカー)を介して融合される。
【0657】
ガイドRNAを含むCas9複合体
本開示のいくつかの態様は、本明細書に提供される融合タンパク質のいずれか、および融合タンパク質のCAS9ドメイン(例えばdCas9、ヌクレアーゼ活性Cas9、またはCas9ニッカーゼ)に結合したガイドRNA(例えば、RTT標的化可能突然変異を所持するMecp2アレルを標的とするガイド)を含む複合体を提供する。これらの複合体はまた、リボ核タンパク質(RNP)とも称される。融合タンパク質ドメインを連結するための任意の方法を使用して (例えば、 (GGGS)n、(GGGGS)n、および(G)nの型の非常に柔軟なリンカーから、(EAAAK)n、 (SGGS)n、SGSETPGTSESATPESの型のより剛性の高いリンカーまで(例えばGuilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32(6): 577-82を参照のこと。その全内容は参照により本明細書に組み入れられる)、および (XP)n)、核酸塩基エディターの活性のための最適な長さを達成することができる。いくつかの実施形態では、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14または15である。いくつかの実施形態では、リンカーは、(GGS)nモチーフを含み、ここで、nは、1、3、または7である。いくつかの実施形態では、本明細書で提供される融合タンパク質のCas9ドメインは、アミノ酸配列SGSETPGTSESATPESを含むリンカーを介して融合される。
【0658】
いくつかの実施形態では、ガイド核酸(例えばガイドRNA)は、長さ15~100ヌクレオチドであり、標的配列に相補的である少なくとも10の連続するヌクレオチドの配列を含む。いくつかの実施形態では、ガイドRNAは、長さ15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチドである。いくつかの実施形態では、ガイドRNAは、標的配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40の連続したヌクレオチドの配列を含む。いくつかの実施形態では、標的配列はDNA配列である。いくつかの実施形態では、標的配列は、細菌、酵母、真菌、昆虫、植物または動物のゲノムにおける配列である。いくつかの実施形態では、標的配列は、ヒトのゲノムにおける配列である。いくつかの実施形態では、標的配列の3’端は、カノニカルPAM配列 (NGG) にすぐ隣接している。いくつかの実施形態では、標的配列の3’端は、非カノニカルPAM配列(例えば、表1に列挙されている配列または5’-NAA-3’)にすぐ隣接している。いくつかの実施形態では、ガイド核酸(例えばガイドRNA)は、RTT標的化可能突然変異を所持するMecp2アレル中の配列に相補的である。
【0659】
本開示のいくつかの態様は、本明細書に提供される融合タンパク質または複合体を使用する方法を提供する。例えば、本開示のいくつかの態様は、DNA分子を、本明細書中に提供される融合タンパク質のいずれか、および少なくとも1つのガイドRNAと接触させる工程を含む方法を提供し、ここで、ガイドRNAは、長さ約15~100ヌクレオチドであり、標的配列に相補的である少なくとも10の連続したヌクレオチドの配列を含む。いくつかの実施形態では、標的配列の3’端は、AGC、GAG、TTT、GTG、またはCAA配列にすぐ隣接している。いくつかの実施形態では、標的配列の3’端は、NGA、NAA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN、または5’ (TTTV) 配列にすぐ隣接している。
【0660】
それぞれの配列における特定の位または残基の番号付けは、使用される特定のタンパク質および番号付けスキームに依存することが理解されるであろう。例えば、成熟タンパク質の前駆体と成熟タンパク質そのものとでは番号付けが異なることがあり、種ごとの配列の違いが番号付けに影響することがある。当業者は、当技術分野に周知の方法、例えば、配列アラインメントおよび相同残基の決定によって、任意の相同タンパク質およびそれぞれのコード核酸中のそれぞれの残基を同定することができる。
【0661】
本明細書に開示された、Cas9ドメインとアデノシンデアミナーゼバリアント(例えばTadA*8)を含む融合タンパク質のいずれかを標的部位、例えば、編集される突然変異を含む部位に標的指向化するためには、融合タンパク質をガイドRNA、例えばsgRNAとともに共発現させることが典型的に必要であることは当業者には明らかであろう。本明細書の他の箇所でより詳細に説明されるように、ガイドRNAは、典型的には、Cas9結合を可能にするtracrRNAフレームワークおよびCas9:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付与するガイド配列を含む。あるいは、ガイドRNAおよびtracrRNAは、2つの核酸分子として別々に提供され得る。いくつかの実施形態では、ガイドRNAは、ガイド配列が標的配列に相補的な配列を含む構造を含む。ガイド配列は典型的には長さ20ヌクレオチドである。Cas9:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位に標的指向化するための適切なガイドRNAの配列は、本開示に基づいて当業者に明らかであろう。そのような適切なガイドRNA配列は、典型的には、編集される標的ヌクレオチドの上流または下流50ヌクレオチド以内の核酸配列に相補的なガイド配列を含む。提供された融合タンパク質のいずれかを特定の標的配列に標的指向化するのに適したいくつかの例示的なガイドRNA配列が本明細書に提供される。
【0662】
本明細書開示の塩基エディタードメインは、任意の順序で配置され得る。例えばポリヌクレオチドプログラム可能ヌクレオチド結合ドメインおよびデアミナーゼドメインを含む融合タンパク質を含む塩基エディターの限定されない例は以下のように配置され得る:
NH2-[核酸塩基編集ドメイン]-リンカー1-[例えばCas9由来ドメイン]-COOH;
NH2-[例えばアデノシンデアミナーゼ]-リンカー1-[例えばCas9由来ドメイン]-COOH;
NH2-[例えばアデノシンデアミナーゼ]-リンカー1-[例えばCas9由来ドメイン]-リンカー2-[UGI]-COOH;
NH2-[例えばTadA*7.10]-リンカー1-[例えばCas9由来ドメイン]-COOH;
NH2-[例えばアデノシンデアミナーゼ]-リンカー1-[例えばCas9由来ドメイン]-COOH;
NH2-[例えばTadA*7.10]-リンカー1-[例えばCas9由来ドメイン]-COOH;
NH2-[例えばTadA*7.10]-リンカー1-[例えばCas9由来ドメイン]-リンカー2-[UGI]-COOH
NH2-[例えばアデノシンデアミナーゼ]-[例えばCas9由来ドメイン]-COOH;
NH2-[例えばCas9由来ドメイン]-[例えばアデノシンデアミナーゼ]-COOH;
NH2-[例えばアデノシンデアミナーゼ]-[例えばCas9由来ドメイン]-[イノシンBER阻害剤]-COOH;
NH2-[例えばアデノシンデアミナーゼ]-[イノシンBER阻害剤]-[例えばCas9由来ドメイン]-COOH;
NH2-[イノシンBER阻害剤]-[例えばアデノシンデアミナーゼ]-[例えばCas9由来ドメイン]-COOH;
NH2-[例えばCas9由来ドメイン]-[例えばアデノシンデアミナーゼ]-[イノシンBER阻害剤]-COOH;
NH2-[例えばCas9由来ドメイン]-[イノシンBER阻害剤]-[例えばアデノシンデアミナーゼ]-COOH;または
NH2-[イノシンBER阻害剤]-[例えばCas9由来ドメイン]-[例えばアデノシンデアミナーゼ]-COOH。
【0663】
さらに、いくつかの場合、Gamタンパク質を塩基エディターのN末端に融合させてもよい。いくつかの場合、Gamタンパク質を塩基エディターのC末端に融合させてもよい。バクテリオファージMuのGamタンパク質は二本鎖切断 (DSB) の末端に結合し、それらを分解から保護することができる。いくつかの実施形態では、Gamを使用してDSBの遊離末端を結合することにより、塩基編集のプロセス中のインデル形成を低減することができる。いくつかの実施形態では、174残基のGamタンパク質は、塩基エディターのN末端に融合される。Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)を参照のこと。いくつかの実施形態では、1つまたは複数の突然変異が、野生型ドメインと比較して、塩基編集ドメインの長さを変化させることができる。例えば、少なくとも1つのドメインにおける少なくとも1つのアミノ酸の欠失は、塩基エディターの長さを短くすることができる。別の場合、1つまたは複数の突然変異は、野生型ドメインに対するドメインの長さを変化させない。例えば、いずれかのドメインにおける置換(複数可)は塩基エディターの長さを変化させない。
【0664】
いくつかの実施形態では、本明細書で提供される塩基編集融合タンパク質は、正確な位置、例えば、標的塩基が定義された領域(例えば「脱アミノ化ウィンドウ」)内に配置されるような位置に配置される必要がある。いくつかの実施形態では、標的は4塩基領域内にあり得る。いくつかの実施形態では、そのような定義された標的領域は、PAMの約15塩基上流にあり得る。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); およびKomor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017) を参照のこと;その全内容が参照により本明細書に組み入れられる。
【0665】
定義される標的領域は脱アミノ化ウィンドウであってもよい。脱アミノ化ウィンドウは、塩基エディターが標的ヌクレオチドに作用して脱アミノ化する、定義された領域であり得る。いくつかの実施形態では、脱アミノ化ウィンドウは、2、3、4、5、6、7、8、9または10塩基領域内にある。いくつかの実施形態では、脱アミノ化ウィンドウは、PAMの5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24または25塩基上流にある。
【0666】
本開示の塩基エディターは、標的ポリヌクレオチド配列の編集を容易にする任意のドメイン、特徴またはアミノ酸配列を含んでもよい。例えば、いくつかの実施形態では、塩基エディターは、核局在化配列 (NLS) を含む。いくつかの実施形態では、塩基エディターのNLSは、デアミナーゼドメインおよびポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの間に位置する。いくつかの実施形態では、塩基エディターのNLSは、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインドメインのC末端に位置する。
【0667】
融合タンパク質に含まれてもよいタンパク質ドメインの非限定的な例には、デアミナーゼドメイン(例えばアデノシンデアミナーゼ)、ウラシルグリコシラーゼ阻害剤(UGI)ドメイン、エピトープタグ、レポーター遺伝子配列、および/または以下の活性:メチラーゼ活性、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写放出因子活性、ヒストン修飾活性、RNA切断活性、および核酸結合活性の1つ以上を有するタンパク質ドメインが含まれる。さらなるドメインは異種機能ドメインであってもよい。こうした異種機能ドメインは、DNAメチル化、DNA損傷、DNA修復、標的DNAと会合する標的ポリペプチド(例えばヒストン、DNA結合タンパク質等)の修飾を付与してもよく、例えばヒストンメチル化、ヒストンアセチル化、ヒストンユビキチン化等を導く。
【0668】
与えられる他の機能には、メチルトランスフェラーゼ活性、デメチラーゼ活性、脱アミノ化活性、ジスムターゼ活性、アルキル化活性、脱プリン化活性、酸化活性、ピリミジンダイマー形成活性、インテグラーゼ活性、トランスポザーゼ活性、レコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性またはグリコシラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、リモデリング活性、プロテアーゼ活性、オキシドレダクターゼ活性、トランスフェラーゼ活性、ヒドロラーゼ活性、リアーゼ活性、イソメラーゼ活性、シンターゼ活性、シンテターゼ活性、および脱ミリストイル化活性、または上記の任意の組み合わせが含まれてもよい。
【0669】
エピトープタグの非限定的な例には、ヒスチジン (His) タグ、V5タグ、FLAGタグ、インフルエンザ赤血球凝集素 (HA) タグ、Mycタグ、VSV-Gタグ、およびチオレドキシン (Trx) タグが含まれる。レポーター遺伝子の例には、グルタチオン-5-トランスフェラーゼ (GST) 、セイヨウワサビペルオキシダーゼ (HRP) 、クロラムフェニコールアセチルトランスフェラーゼ (CAT) 、ベータ-ガラクトシダーゼ、ベータ-グルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質 (GFP) 、HcRed、DsRed、シアン蛍光タンパク質 (CFP) 、黄色蛍光タンパク質 (YFP) 、および青色蛍光タンパク質 (BFP) を含む自己蛍光タンパク質が含まれるが、これらに限定されない。追加のタンパク質配列には、DNA分子に結合するかまたは他の細胞分子に結合するアミノ酸配列が含まれてもよく、これらには、マルトース結合タンパク質 (MBP) 、Sタグ、Lex A DNA結合ドメイン (DBD) 融合体、GAL4 DNA結合ドメイン融合体、および単純ヘルペスウイルス (HSV) BP16タンパク質融合体が含まれるが、これらに限定されない。
【0670】
ガイドRNAを含むCas12複合体
本開示のいくつかの態様は、本明細書に提供する融合タンパク質、およびガイドRNA(例えば編集のため標的ポリヌクレオチドを標的化するガイド)のいずれかを含む複合体を提供する。
【0671】
いくつかの実施形態では、ガイド核酸(例えばガイドRNA)は、長さ15~100ヌクレオチドであり、標的配列に相補的である少なくとも10の連続するヌクレオチドの配列を含む。いくつかの実施形態では、ガイドRNAは、長さ15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチドである。いくつかの実施形態では、ガイドRNAは、標的配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40の連続したヌクレオチドの配列を含む。いくつかの実施形態では、標的配列はDNA配列である。いくつかの実施形態では、標的配列は、細菌、酵母、真菌、昆虫、植物または動物のゲノムにおける配列である。いくつかの実施形態では、標的配列は、ヒトのゲノムにおける配列である。いくつかの実施形態では、標的配列の3’端は、カノニカルPAM配列にすぐ隣接している。いくつかの実施形態では、標的配列の3’端は、非カノニカルPAM配列にすぐ隣接している。
【0672】
本開示のいくつかの態様は、本明細書に提供される融合タンパク質または複合体を使用する方法を提供する。例えば、本開示のいくつかの態様は、DNA分子を、本明細書中に提供される融合タンパク質のいずれか、および少なくとも1つのガイドRNAと接触させる工程を含む方法を提供し、ここで、ガイドRNAは、長さ約15~100ヌクレオチドであり、標的配列に相補的である少なくとも10の連続したヌクレオチドの配列を含む。いくつかの実施形態では、標的配列の3’端は、例えばTTN、DTTN、GTTN、ATTN、ATTC、DTTNT、WTTN、HATY、TTTN、TTTV、TTTC、TG、RTR、またはYTN PAM部位にすぐ隣接している。
【0673】
それぞれの配列における特定の位または残基の番号付けは、使用される特定のタンパク質および番号付けスキームに依存することが理解されるであろう。例えば、成熟タンパク質の前駆体と成熟タンパク質そのものとでは番号付けが異なることがあり、種ごとの配列の違いが番号付けに影響することがある。当業者は、当業者に周知の方法、例えば、配列アラインメントおよび相同残基の決定によって、任意の相同タンパク質およびそれぞれのコード核酸中のそれぞれの残基を同定することができる。
【0674】
本明細書に開示された融合タンパク質のいずれかを標的部位、例えば、編集される突然変異を含む部位に標的指向化するためには、融合タンパク質をガイドRNAとともに共発現させることが典型的に必要であることは当業者には明らかであろう。本明細書の他の箇所でより詳細に説明されるように、ガイドRNAは、典型的には、Cas12結合を可能にするtracrRNAフレームワークおよびCas12:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付与するガイド配列を含む。あるいは、ガイドRNAおよびtracrRNAは、2つの核酸分子として別々に提供され得る。いくつかの実施形態では、ガイドRNAは、ガイド配列が標的配列に相補的な配列を含む構造を含む。ガイド配列は典型的には長さ20ヌクレオチドである。Cas12:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位に標的指向化するための適切なガイドRNAの配列は、本開示に基づいて当業者に明らかであろう。そのような適切なガイドRNA配列は、典型的には、編集される標的ヌクレオチドの上流または下流50ヌクレオチド以内の核酸配列に相補的なガイド配列を含む。提供された融合タンパク質のいずれかを特定の標的配列に標的化するのに適したいくつかの例示的なガイドRNA配列が本明細書に提供される。
【0675】
デアミナーゼドメインが、Cas12タンパク質中に内在化されている限り、本明細書に開示する塩基エディターのドメインを、任意の順序で配置してもよい。例えば、Cas12ドメインおよびデアミナーゼドメインを含む融合タンパク質を含む塩基エディターの限定されない例を以下のように配置してもよい:
NH2-[Cas12ドメイン]-リンカー1-[ABE8]-リンカー2-[Cas12ドメイン]-COOH;
NH2-[Cas12ドメイン]-リンカー1-[ABE8]-[Cas12ドメイン]-COOH;
NH2-[Cas12ドメイン]-[ABE8]-リンカー2-[Cas12ドメイン]-COOH;
NH2-[Cas12ドメイン]-[ABE8]-[Cas12ドメイン]-COOH;
NH2-[Cas12ドメイン]-リンカー1-[ABE8]-リンカー2-[Cas12ドメイン]-[イノシン BER阻害剤]-COOH;
NH2-[Cas12ドメイン]-リンカー1-[ABE8]-[Cas12ドメイン]-[イノシン BER阻害剤]-COOH;
NH2-[Cas12ドメイン]-[ABE8]-リンカー2-[Cas12ドメイン]-[イノシン BER阻害剤]-COOH;
NH2-[Cas12ドメイン]-[ABE8]-[Cas12ドメイン]-[イノシン BER阻害剤]-COOH;
NH2-[イノシン BER阻害剤]-[Cas12ドメイン]-リンカー1-[ABE8]-リンカー2-[Cas12ドメイン]-COOH;
NH2-[イノシン BER阻害剤]-[Cas12ドメイン]-リンカー1-[ABE8]-[Cas12ドメイン]-COOH;
NH2-[イノシン BER阻害剤]-[Cas12ドメイン]-[ABE8]-リンカー2-[Cas12ドメイン]-COOH;
NH2-[イノシン BER阻害剤]NH2-[Cas12ドメイン]-[ABE8]-[Cas12ドメイン]-COOH
【0676】
さらに、いくつかの場合、Gamタンパク質を塩基エディターのN末端に融合させてもよい。いくつかの場合、Gamタンパク質を塩基エディターのC末端に融合させてもよい。バクテリオファージMuのGamタンパク質は二本鎖切断 (DSB) の末端に結合し、それらを分解から保護することができる。いくつかの実施形態では、Gamを使用してDSBの遊離末端を結合することにより、塩基編集のプロセス中のインデル形成を低減することができる。いくつかの実施形態では、174残基のGamタンパク質は、塩基エディターのN末端に融合される。Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)を参照のこと。いくつかの実施形態では、1つまたは複数の突然変異が、野生型ドメインと比較して、塩基エディタードメインの長さを変化させることができる。例えば、少なくとも1つのドメインにおける少なくとも1つのアミノ酸の欠失は、塩基エディターの長さを短くすることができる。別の場合、1つまたは複数の突然変異は、野生型ドメインに対するドメインの長さを変化させない。例えば、いずれかのドメインにおける置換(複数可)は塩基エディターの長さを変化させない。
【0677】
いくつかの実施形態では、本明細書で提供される塩基編集融合タンパク質は、正確な位置、例えば、標的塩基が定義された領域(例えば「脱アミノ化ウィンドウ」)内に配置されるような位置に配置される必要がある。場合によっては、標的は4塩基領域内にあり得る。場合によっては、そのような定義された標的領域は、PAMの約15塩基上流にあり得る。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); およびKomor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017) を参照のこと;その全内容が参照により本明細書に組み入れられる。
【0678】
定義される標的領域は脱アミノ化ウィンドウであってもよい。脱アミノ化ウィンドウは、塩基エディターが標的ヌクレオチドに作用して脱アミノ化する、定義された領域であり得る。いくつかの実施形態では、脱アミノ化ウィンドウは、2、3、4、5、6、7、8、9または10塩基領域内にある。いくつかの実施形態では、脱アミノ化ウィンドウは、PAMの5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24または25塩基上流にある。
【0679】
本開示の塩基エディターは、標的ポリヌクレオチド配列の編集を容易にする任意のドメイン、特徴またはアミノ酸配列を含んでもよい。例えば、いくつかの実施形態では、塩基エディターは、核局在化配列 (NLS) を含む。いくつかの実施形態では、塩基エディターのNLSは、デアミナーゼドメインおよびnapDNAbpドメインの間に位置する。いくつかの実施形態では、塩基エディターのNLSは、napDNAbpドメインのC末端に位置する。
【0680】
融合タンパク質に含まれるタンパク質ドメインは、異種機能ドメインであってもよい。融合タンパク質に含まれてもよいタンパク質ドメインの非限定的な例には、デアミナーゼドメイン(例えばアデノシンデアミナーゼ)、ウラシルグリコシラーゼ阻害剤(UGI)ドメイン、エピトープタグ、およびレポーター遺伝子配列が含まれる。タンパク質ドメインは、例えば以下の活性の1つ以上を有する異種機能ドメインであってもよい:転写活性化活性、転写抑制活性、転写放出因子活性、遺伝子サイレンシング活性、クロマチン修飾活性、エピジェネティック修飾活性、ヒストン修飾活性、RNA切断活性、および核酸結合活性。こうした異種機能ドメインは、機能活性、例えば標的DNAと会合する標的ポリペプチド(例えばヒストン、DNA結合タンパク質等)の修飾を与えてもよく、例えばヒストンメチル化、ヒストンアセチル化、ヒストンユビキチン化等を導いてもよい。与えられる他の機能および/または活性には、トランスポザーゼ活性、インテグラーゼ活性、レコンビナーゼ活性、リガーゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、または上記の任意の組み合わせが含まれてもよい。
【0681】
エピトープタグ、レポータータンパク質、他の結合ドメインでドメインを検出するかまたは標識してもよい。エピトープタグの非限定的な例は、ヒスチジン (His) タグ、V5タグ、FLAGタグ、インフルエンザ赤血球凝集素 (HA) タグ、Mycタグ、VSV-Gタグ、およびチオレドキシン (Trx) タグを含む。レポーター遺伝子の例には、グルタチオン-5-トランスフェラーゼ (GST) 、セイヨウワサビペルオキシダーゼ (HRP) 、クロラムフェニコールアセチルトランスフェラーゼ (CAT) 、ベータ-ガラクトシダーゼ、ベータ-グルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質 (GFP) 、HcRed、DsRed、シアン蛍光タンパク質 (CFP) 、黄色蛍光タンパク質 (YFP) 、および青色蛍光タンパク質 (BFP) を含む自己蛍光タンパク質が含まれるが、これらに限定されない。追加のタンパク質配列には、DNA分子に結合するかまたは他の細胞分子に結合するアミノ酸配列が含まれてもよく、これらには、マルトース結合タンパク質 (MBP) 、Sタグ、Lex A DNA結合ドメイン (DBD) 融合体、GAL4 DNA結合ドメイン融合体、および単純ヘルペスウイルス (HSV) BP16タンパク質融合体が含まれるが、これらに限定されない。
【0682】
いくつかの実施形態では、BhCas12bガイドポリヌクレオチドは、以下の配列を有する:
BhCas12b sgRNA 足場 (下線) + 20nt~23nt gガイド配列 (Nnによって示される)
5’GUUCUGTCUUUUGGUCAGGACAACCGUCUAGCUAUAAGUGCUGCAGGGUGUGAGAAACUCCUAUUGCUGGACGAUGUCUCUUACGAGGCAUUAGCACNNNNNNNNNNNNNNNNNNNN-3′
【0683】
いくつかの実施形態では、BvCas12bおよびAaCas12b ガイドポリヌクレオチドは、以下の配列を有する:
BvCas12b sgRNA 足場 (下線) + 20nt~23nt gガイド配列 (Nnによって示される)
5′GACCUAUAGGGUCAAUGAAUCUGUGCGUGUGCCAUAAGUAAUUAAAAAUUACCCACCACAGGAGCACCUGAAAACAGGUGCUUGGCACNNNNNNNNNNNNNNNNNNNN-3′
AaCas12b sgRNA 足場 (下線) + 20nt~23nt gガイド配列 (Nnによって示される)
5′GUCUAAAGGACAGAAUUUUUCAACGGGUGUGCCAAUGGCCACUUUCCAGGUGGCAAAGCCCGUUGAACUUCUCAAAAAGAACGAUCUGAGAAGUGGCACNNNNNNNNNNNNNNNNNNNN-3′
【0684】
アデノシンデアミナーゼバリアントおよびCas9ドメインを含む融合タンパク質を用いる方法
本開示のいくつかの態様は、本明細書に提供される融合タンパク質または複合体を使用する方法を提供する。例えば、本開示のいくつかの態様は、タンパク質の突然変異型をコードするDNA分子を、本明細書中に提供される融合タンパク質のいずれか、および少なくとも1つのガイドRNAと接触させることを含む方法を提供し、ここで、ガイドRNAは、長さ約15~100ヌクレオチドであり、標的配列に相補的である少なくとも10の連続したヌクレオチドの配列を含む。いくつかの実施形態では、標的配列の3'端は、カノニカルPAM配列(NGG)にすぐ隣接している。いくつかの実施形態では、標的配列の3'端はカノニカルPAM配列(NGG)にすぐ隣接していない。いくつかの実施形態では、標的配列の3’端は、AGC、GAG、TTT、GTG、またはCAA配列にすぐ隣接している。いくつかの実施形態では、標的配列の3’端は、NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN、または5’ (TTTV) 配列にすぐ隣接している。
【0685】
いくつかの実施形態では、本開示の融合タンパク質を、関心対象の標的を突然変異誘発させるために用いる。特に、本明細書記載のアデノシンデアミナーゼ核酸塩基エディター(例えばABE8)は、標的配列内で複数の突然変異を作成可能である。これらの突然変異は、標的の機能に影響を及ぼし得る。例えば、アデノシンデアミナーゼ核酸塩基エディター(例えばABE8)を用いて制御領域を標的指向化すると、制御領域の機能が改変され、下流タンパク質発現が減少する。
【0686】
それぞれの配列における特定の位または残基の番号付けは、使用される特定のタンパク質および番号付けスキームに依存することが理解されるであろう。例えば、成熟タンパク質の前駆体と成熟タンパク質そのものとでは番号付けが異なることがあり、種ごとの配列の違いが番号付けに影響することがある。当業者は、当業者に周知の方法、例えば、配列アラインメントおよび相同残基の決定によって、任意の相同タンパク質およびそれぞれのコード核酸中のそれぞれの残基を同定することができる。
【0687】
本明細書に開示するような、Cas9ドメインおよびアデノシンデアミナーゼバリアント(例えばABE8)を含む融合タンパク質のいずれかを標的部位、例えば、編集される突然変異を含む部位に標的指向化するためには、融合タンパク質をガイドRNA、例えばsgRNAとともに共発現させることが典型的に必要であることは当業者には明らかであろう。本明細書の他の箇所でより詳細に説明されるように、ガイドRNAは、典型的には、Cas9結合を可能にするtracrRNAフレームワークおよびCas9:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付与するガイド配列を含む。あるいは、ガイドRNAおよびtracrRNAは、2つの核酸分子として別々に提供され得る。いくつかの実施形態では、ガイドRNAは、ガイド配列が標的配列に相補的な配列を含む構造を含む。ガイド配列は典型的には長さ20ヌクレオチドである。Cas9:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位に標的指向化するための適切なガイドRNAの配列は、本開示に基づいて当業者に明らかであろう。そのような適切なガイドRNA配列は、典型的には、編集される標的ヌクレオチドの上流または下流50ヌクレオチド以内の核酸配列に相補的なガイド配列を含む。提供された融合タンパク質のいずれかを特定の標的配列に標的化するのに適したいくつかの例示的なガイドRNA配列が本明細書に提供される。
【0688】
塩基エディター効率
CRISPR-Cas9ヌクレアーゼは、標的化ゲノム編集を仲介するために広く使用されている。ほとんどのゲノム編集適用において、Cas9はガイドポリヌクレオチド(例えばシングルガイドRNA (sgRNA))と複合体を形成し、sgRNA配列により指定される標的部位で二本鎖DNA切断 (DSB) を誘導する。細胞は主に非相同末端結合 (NHEJ) 修復経路を介してこのDSBに応答し、遺伝子を破壊するフレームシフト突然変異を生じ得る確率的挿入または欠失 (インデル) を生じる。DSBに隣接する配列と高度の相同性を有するドナーDNAテンプレートの存在下で、相同性指向性修復 (HDR) として知られる代替経路を介して遺伝子修正が達成され得る。残念ながら、ほとんどの非侵襲的条件下では、HDRは非効率であり、細胞状態および細胞タイプに依存し、より高いインデルの頻度によって支配される。ヒトの疾患に関連する既知の遺伝的変異の大部分は点突然変異であるため、より効率的かつクリーンに正確な点突然変異を作製できる方法が必要である。本明細書に提供される塩基編集システムは、二本鎖DNA切断を生じることなく、ドナーDNAテンプレートを必要とせず、かつ過剰な確率的挿入および欠失を誘導することなく、ゲノム編集を提供するための新しい方法を提供する。
【0689】
本明細書に提供する塩基エディターは、有意な割合のインデルを生成することなく、突然変異を含むタンパク質をコードする特定のヌクレオチド塩基を改変することが可能である。「インデル(indel)」という用語は、本明細書において使用される場合、核酸内のヌクレオチド塩基の挿入または欠失を指す。このような挿入または欠失は、遺伝子のコード領域内でフレームシフト突然変異を引き起こす可能性がある。いくつかの実施形態では、標的ヌクレオチド配列中で多数の挿入(insertion)または欠失(deletion)(すなわちインデル:indel)を生じることなく、核酸内の特定のヌクレオチドを効率的に改変(例えば突然変異)する塩基エディターを生成することが望ましい。特定の実施形態では、本明細書に提供される塩基エディターのいずれも、インデルに対して意図される改変(例えば点突然変異または脱アミノ化)のより大きな割合を生成することができる。
【0690】
いくつかの実施形態では、本明細書で提供される塩基エディターシステムのいずれも、標的ポリヌクレオチド配列において、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のインデル形成をもたらす。
【0691】
いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントの1つを含む塩基エディターシステムのいずれも、標的ポリヌクレオチド配列において、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のインデル形成をもたらす。
【0692】
いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントの1つを含む塩基エディターシステムはいずれも、標的ポリヌクレオチド配列中に0.8%未満のインデル形成を生じる。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントの1つを含む塩基エディターシステムはいずれも、標的ポリヌクレオチド配列中に最大0.8%のインデル形成を生じる。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントの1つを含む塩基エディターシステムはいずれも、標的ポリヌクレオチド配列中に0.3%未満のインデル形成を生じる。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントの1つを含む塩基エディターシステムはいずれも、ABE7塩基エディターの1つを含む塩基エディターシステムに比較して、標的ポリヌクレオチド配列中で、より低いインデル形成を生じる。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントの1つを含む塩基エディターシステムはいずれも、ABE7.10を含む塩基エディターシステムに比較して、標的ポリヌクレオチド配列中で、より低いインデル形成を生じる。
【0693】
いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントの1つを含む塩基エディターシステムはいずれも、ABE7塩基エディターの1つを含む塩基エディターシステムに比較して、インデル頻度の減少を有する。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントの1つを含む塩基エディターシステムはいずれも、ABE7塩基エディターの1つを含む塩基エディターシステムに比較して、インデル頻度の少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、または少なくとも95%の減少を有する。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントの1つを含む塩基エディターシステムは、ABE7.10を含む塩基エディターシステムに比較して、インデル頻度の少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、または少なくとも95%の減少を有する。
【0694】
本開示は、効率および特異性が増加したアデノシンデアミナーゼバリアント(例えばABE8バリアント)を提供する。特に、本明細書記載のアデノシンデアミナーゼバリアントは、ポリヌクレオチド内の所望の塩基を編集する可能性がより高く、改変が意図されない塩基(例えば「バイスタンダー」)を編集する可能性がより低い。
【0695】
いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントの1つを含む塩基エディターシステムはいずれも、減少したバイスタンダー編集または突然変異を有する。いくつかの実施形態では、企図されない編集または突然変異はバイスタンダー突然変異またはバイスタンダー編集であり、例えば、標的ヌクレオチド配列の標的ウィンドウ中の企図されないまたは非標的位での標的塩基(例えばAまたはC)の塩基編集である。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントの1つを含む塩基編集システムはいずれも、ABE7塩基エディター、例えばABE7.10を含む塩基エディターシステムに比較して、減少したバイスタンダー編集または突然変異を有する。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントの1つを含む塩基編集システムはいずれも、ABE7塩基エディター、例えばABE7.10を含む塩基エディターシステムに比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%、減少したバイスタンダー編集または突然変異を有する。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントの1つを含む塩基編集システムはいずれも、ABE7塩基エディター、例えばABE7.10を含む塩基エディターシステムに比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍、減少したバイスタンダー編集または突然変異を有する。
【0696】
いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントの1つを含む塩基編集システムはいずれも、減少した偽編集を有する。いくつかの実施形態では、企図されない編集または突然変異は偽突然変異または偽編集であり、例えば、ゲノム中の企図されないまたは非標的位での標的塩基(例えばAまたはC)の非特異的編集またはガイド非依存性編集である。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントの1つを含む塩基編集システムはいずれも、ABE7塩基エディター、例えばABE7.10を含む塩基エディターシステムに比較して、減少した偽編集を有する。いくつかの実施形態では、本明細書記載のABE8塩基編集バリアントの1つを含む塩基編集システムはいずれも、ABE7塩基エディター、例えばABE7.10を含む塩基エディターシステムに比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%、減少した偽編集を有する。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントの1つを含む塩基編集システムはいずれも、ABE7塩基エディター、例えばABE7.10を含む塩基エディターシステムに比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍、減少した偽編集を有する。
【0697】
本開示のいくつかの態様は、本明細書に提供される任意の塩基エディターが、有意な数の非意図的な突然変異、例えば非意図的な点突然変異、すなわちバイスタンダーの突然変異を生成することなく、核酸(例えば対象のゲノム内の核酸)において、意図される突然変異、例えば点突然変異を効率的に生成することができるという認識に基づく。いくつかの実施形態では、本明細書に提供される塩基エディターは、少なくとも0.01%の意図される突然変異(すなわち少なくとも0.01%の塩基編集効率)を生じることができる。いくつかの実施形態では、本明細書に提供される塩基エディターはいずれも、少なくとも0.01%、1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、45%、50%、60%、70%、80%、90%、95%、または99%の意図される突然変異を生成することができる。
【0698】
いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントはいずれも、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の塩基編集効率を有する。いくつかの実施形態では、塩基編集効率は、細胞集団中の編集された核酸塩基の割合を計算することによって測定可能である。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントはいずれも、細胞集団中の編集された核酸塩基によって測定した際、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の塩基編集効率を有する。
【0699】
いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントは、ABE7塩基エディターに比較してより高い塩基編集効率を有する。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントはいずれも、ABE7塩基エディター、例えばABE7.10に比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%、より高い塩基編集効率を有する。
【0700】
いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントはいずれも、ABE7塩基エディター、例えばABE7.10に比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍、より高い塩基編集効率を有する。
【0701】
いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントはいずれも、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット塩基編集効率を有する。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントはいずれも、細胞集団中の編集されたターゲット核酸塩基によって測定した際、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット塩基編集効率を有する。
【0702】
いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントはいずれも、ABE7塩基エディターに比較して、より高いオンターゲット塩基編集効率を有する。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントはいずれも、ABE7塩基エディター、例えばABE7.10に比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%、より高いオンターゲット塩基編集効率を有する。
【0703】
いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントはいずれも、ABE7塩基エディター、例えばABE7.10に比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍、より高いオンターゲット塩基編集効率を有する。
【0704】
本明細書記載のABE8塩基エディターバリアントは、プラスミド、ベクター、LNP複合体、またはmRNAを通じて、宿主細胞に送達され得る。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントはいずれも、mRNAとして宿主細胞に送達される。いくつかの実施形態では、核酸塩基に基づく送達システム、例えばmRNAを通じて送達されるABE8塩基エディターは、編集された核酸塩基によって測定した際、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット編集効率を有する。いくつかの実施形態では、mRNAシステムによって送達されるABE8塩基エディターは、プラスミドまたはベクターシステムによって送達されるABE8塩基エディターに比較して、より高い塩基編集効率を有する。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントはいずれも、プラスミドまたはベクターシステムによって送達された場合に比較して、mRNAシステムによって送達された際、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%のオンターゲット塩基編集効率を有する。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントはいずれも、プラスミドまたはベクターシステムによって送達された場合に比較して、mRNAシステムによって送達された際、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍、より高いオンターゲット塩基編集効率を有する。
【0705】
いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントの1つを含む塩基エディターシステムはいずれも、標的ポリヌクレオチド配列において、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のオフターゲット編集を生じる。
【0706】
いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントはいずれも、プラスミドまたはベクターシステムによって送達された場合に比較して、mRNAシステムによって送達された際、より低い誘導型オフターゲット編集効率を有する。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントはいずれも、プラスミドまたはベクターシステムによって送達された場合に比較して、mRNAシステムによって送達された際、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%、より低い誘導型オフターゲット編集効率を生じる。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントはいずれも、プラスミドまたはベクターシステムによって送達された場合に比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍、より低い誘導型オフターゲット編集効率を生じる。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントはいずれも、プラスミドまたはベクターシステムによって送達された場合に比較して、mRNAシステムによって送達された際、誘導型オフターゲット編集効率の少なくとも約2.2倍の減少を有する。
【0707】
いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントはいずれも、プラスミドまたはベクターシステムによって送達された場合に比較して、mRNAシステムによって送達された際、より低いガイド非依存性オフターゲット編集効率を生じる。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントはいずれも、プラスミドまたはベクターシステムによって送達された場合に比較して、mRNAシステムによって送達された際、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%、より低いガイド非依存性オフターゲット編集効率を生じる。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントはいずれも、プラスミドまたはベクターシステムによって送達された場合に比較して、mRNAシステムによって送達された際、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも5.0倍、少なくとも10.0倍、少なくとも20.0倍、少なくとも50.0倍、少なくとも70.0倍、少なくとも100.0倍、少なくとも120.0倍、少なくとも130.0倍、または少なくとも150.0倍、より低いガイド非依存性オフターゲット編集効率を生じる。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントは、プラスミドまたはベクターシステムによって送達された場合に比較して、mRNAシステムによって送達された際、ガイド非依存性オフターゲット編集効率(例えば偽のRNA脱アミノ化)の134.0倍の減少を有する。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントは、ゲノムに渡ってガイド非依存性突然変異率を増加させない。
【0708】
本開示のいくつかの態様は、本明細書提供の塩基エディターがいずれも、有意な数の意図されない突然変異(例えば偽のオフターゲット編集またはバイスタンダー編集)を生じることなく、核酸(例えば対象のゲノム内の核酸)において、意図される突然変異、例えば点突然変異を効率的に生じることが可能であるという認識に基づく。いくつかの実施形態では、意図される突然変異は、標的遺伝子中の突然変異を改変するかまたは修正するために特に設計されたgRNAと結合された特定の塩基エディターによって生じる突然変異である。本開示のいくつかの態様は、本明細書提供の塩基エディターがいずれも、有意な数の意図されない突然変異を生じることなく、核酸(例えば対象のゲノム内の核酸)において、意図される突然変異を効率的に生じることが可能であるという認識に基づく。いくつかの実施形態では、意図される突然変異は、意図される突然変異を改変するかまたは修正するために特に設計されたgRNAと結合された特定の塩基エディターによって生じる突然変異である。いくつかの実施形態では、意図される突然変異は、遺伝子のコード領域内に停止コドン、例えば未成熟停止コドンを生じる突然変異である。いくつかの実施形態では、意図される突然変異は停止コドンを除去する突然変異である。いくつかの実施形態では、意図される突然変異は、遺伝子のスプライシングを改変する突然変異である。いくつかの実施形態では、意図される突然変異は、遺伝子の制御配列(例えば遺伝子プロモーターまたは遺伝子リプレッサー)を改変する突然変異である。
【0709】
いくつかの実施形態では、本明細書に提供される塩基エディターは、1:1より大きい、意図される点突然変異対インデル(すなわち意図されない突然変異)の比を生成することができる。いくつかの実施形態では、本明細書に提供される塩基エディターは、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも8.5:1、少なくとも9:1、少なくとも10:1、少なくとも11:1、少なくとも12:1、少なくとも13:1、少なくとも14:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも200:1、少なくとも300:1、少なくとも400:1、少なくとも500:1、少なくとも600:1、少なくとも700:1、少なくとも800:1、少なくとも900:1、もしくは少なくとも1000:1、またはそれより高い、意図される点突然変異対インデルの比を生じることができる。本明細書記載の塩基エディターの特性は、本明細書に提供する融合タンパク質または融合タンパク質を用いる方法のいずれにも適用可能であることを認識すべきである。
【0710】
意図される突然変異およびインデルの数は、例えば、国際PCT出願番号PCT/2017/045381 (WO2018/027078) およびPCT/US2016/058344 (WO2017/070632);Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); および Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity,” Science Advances 3:eaao4774 (2017)(その全内容は参照により本明細書に組み込まれる)に記載されているもののような、任意の適切な方法を用いて決定することができる。
【0711】
いくつかの実施形態では、インデル頻度を計算するために、インデルが生じ得るウィンドウの両側に隣接する2つの10 bp配列に対する正確なマッチについて配列決定リードがスキャンされる。正確なマッチが見つからない場合、そのリードは解析から除外される。このインデルウィンドウの長さが参照配列と正確にマッチする場合、リードはインデルを含まないものとして分類される。インデルウィンドウが参照配列よりも2塩基以上長いかまたは短い場合、配列決定リードは、それぞれ挿入または欠失として分類される。いくつかの実施形態では、本明細書において提供される塩基エディターは、核酸の領域におけるインデルの形成を制限することができる。いくつかの実施形態では、その領域は、塩基エディターによって標的化されるヌクレオチドのところにあるか、または塩基エディターによって標的化されるヌクレオチドから2、3、4、5、6、7、8、9または10ヌクレオチド以内の領域である。
【0712】
標的ヌクレオチド領域で形成されるインデルの数は、核酸(例えば細胞のゲノム内の核酸)が塩基エディターに曝露される時間の量に依存し得る。いくつかの実施形態では、インデルの数または割合は、標的ヌクレオチド配列(例えば細胞のゲノム内の核酸)を塩基エディターに曝露してから少なくとも1時間、少なくとも2時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、または少なくとも14日後に決定される。本明細書に記載されるような塩基エディターの特徴は、本明細書に提供される融合タンパク質、または融合タンパク質を使用する方法のいずれにも適用され得ることが理解されるべきである。
【0713】
いくつかの実施形態では、本明細書に提供される塩基エディターは、核酸領域中のインデルの形成を制限することが可能である。いくつかの実施形態では、領域は、塩基エディターによって標的化されるヌクレオチドのところにあるか、あるいは塩基エディターによって標的化されるヌクレオチドから2、3、4、5、6、7、8、9または10ヌクレオチド以内の領域である。いくつかの実施形態では、本明細書に提供される塩基エディターはいずれも、核酸領域でのインデルの形成を、1%未満、1.5%未満、2%未満、2.5%未満、3%未満、3.5%未満、4%未満、4.5%未満、5%未満、6%未満、7%未満、8%未満、9%未満、10%未満、12%未満、15%未満、または20%未満に限定することが可能である。核酸領域で形成されるインデルの数は、核酸(例えば細胞ゲノム内の核酸)が塩基エディターに曝露される時間量に応じ得る。いくつかの実施形態では、塩基エディターへの核酸(例えば細胞ゲノム内の核酸)の曝露の、少なくとも1時間後、少なくとも2時間後、少なくとも6時間後、少なくとも12時間後、少なくとも24時間後、少なくとも36時間後、少なくとも48時間後、少なくとも3日後、少なくとも4日後、少なくとも5日後、少なくとも7日後、少なくとも10日後、または少なくとも14日後、インデルの任意の数または比率を決定する。
【0714】
多重編集
いくつかの実施形態では、本明細書に提供される塩基エディターシステムは、1つ以上の遺伝子における複数の核酸塩基対の多重編集を可能にする。いくつかの実施形態では、複数の核酸塩基対は、同一遺伝子中に位置する。いくつかの実施形態では、複数の核酸塩基対は、1つ以上の遺伝子に位置し、ここで、少なくとも1つの遺伝子は、異なる遺伝子座に位置する。いくつかの実施形態では、多重編集は、1つ以上のガイドポリヌクレオチドを含むことができる。いくつかの実施形態では、多重編集は、1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態では、多重編集は、シングルガイドポリヌクレオチドを有する1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態では、多重編集は、複数のガイドポリヌクレオチドを有する1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態では、多重編集は、単一塩基エディターシステムを有する1つ以上のガイドポリヌクレオチドを含むことができる。いくつかの実施形態では、多重編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドを含むことができる。いくつかの実施形態では、多重編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドを含むことができる。いくつかの実施形態では、多重編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチド、および標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドの混合物を含むことができる。本明細書に記載されるような塩基エディターのいずれかを使用する多重編集の特徴は、本明細書に提供される塩基エディターのいずれかを使用する方法の任意の組み合わせに適用され得ることを認識すべきである。また、本明細書に記載されるような塩基エディターのいずれかを使用する多重編集は、複数の核酸塩基対の順次的編集を含むことができることを認識すべきである。
【0715】
いくつかの実施形態では、複数の核酸塩基対は、1つ以上の遺伝子中にある。いくつかの実施形態では、複数の核酸塩基対は、同じ遺伝子中にある。いくつかの実施形態では、1つ以上の遺伝子における少なくとも1つの遺伝子は、異なる遺伝子座に位置する。いくつかの実施形態では、編集は、少なくとも1つのタンパク質コード領域における複数の核酸塩基対の編集である。いくつかの実施形態では、編集は、少なくとも1つのタンパク質非コード領域における複数の核酸塩基対の編集である。いくつかの実施形態では、編集は、少なくとも1つのタンパク質コード領域および少なくとも1つのタンパク質非コード領域における複数の核酸塩基対の編集である。
【0716】
いくつかの実施形態では、編集は、1つ以上のガイドポリヌクレオチドを伴う。いくつかの実施形態では、塩基エディターシステムは、1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態では、塩基エディターシステムは、シングルガイドポリヌクレオチドとともに1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態では、塩基エディターシステムは、複数のガイドポリヌクレオチドとともに1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態では、編集は、単一の塩基エディターシステムを有する1つ以上のガイドポリヌクレオチドを伴う。いくつかの実施形態では、編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドを伴う。いくつかの実施形態では、編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドを伴う。いくつかの実施形態では、編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチド、および標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドの混合物を伴う。本明細書に記載される塩基エディターのいずれかを使用する多重編集の特徴は、本明細書に提供される塩基エディターのいずれかを使用する方法の任意の組み合わせに適用され得ることを認識すべきである。また、編集は、複数の核酸塩基対の順次的編集を含むことができることを認識すべきである。
【0717】
いくつかの実施形態では、1つ以上の遺伝子中の複数の核酸塩基対の多重編集が可能な塩基エディターシステムは、本明細書記載のABE8塩基エディターバリアントの1つを含む。いくつかの実施形態では、1つ以上の遺伝子中の複数の核酸塩基対の多重編集が可能な塩基エディターシステムは、ABE7塩基エディターの1つを含む。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントの1つを含む多重編集可能な塩基エディターシステムは、ABE7塩基エディターの1つを含む多重編集可能な塩基エディターシステムに比較して、より高い多重編集効率を有する。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントの1つを含む多重編集可能な塩基エディターシステムは、ABE7塩基エディターの1つを含む多重編集可能な塩基エディターシステムに比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%、より高い多重編集効率を有する。いくつかの実施形態では、本明細書記載のABE8塩基エディターバリアントの1つを含む多重編集可能な塩基エディターシステムは、ABE7塩基エディターの1つを含む多重編集可能な塩基エディターシステムに比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、または少なくとも6.0倍、より高い多重編集効率を有する。
【0718】
核酸を編集するための方法
本開示のいくつかの態様は、核酸を編集するための方法を提供する。いくつかの実施形態では、本方法は、タンパク質をコードする核酸分子の核酸塩基(例えば二本鎖DNA配列の塩基対)を編集するための方法である。いくつかの実施形態では、本方法は:a) 核酸(例えば二本鎖DNA配列)の標的領域を、塩基エディターおよびガイド核酸(例えばgRNA)を含む複合体と接触させる工程と、b) 前記標的領域の鎖分離を誘導する工程と、c) 標的領域の一本鎖における前記標的核酸塩基対の第一の核酸塩基を第二の核酸塩基に変換する工程と、d) nCas9を用いて、前記標的領域の、一本を超えない数の鎖を切断する工程とを含み、ここで、第一の核酸塩基に相補的な第三の核酸塩基が、第二の核酸塩基に相補的な第四の核酸塩基によって置き換えられる。いくつかの実施形態では、本方法は、核酸において20%未満のインデル形成をもたらす。いくつかの実施形態では、工程bが省略されることが理解されるべきである。いくつかの実施形態では、本方法は、19%未満、18%未満、16%未満、14%未満、12%未満、10%未満、8%未満、6%未満、4%未満、2%未満、1%未満、0.5%未満、0.2%未満、または0.1%未満のインデル形成をもたらす。いくつかの実施形態では、本方法は、第二の核酸塩基を、第四の核酸塩基に相補的な第五の核酸塩基で置き換え、それによって意図される編集塩基対(例えばG・CからA・T)を生成することをさらに含む。いくつかの実施形態では、意図される塩基対の少なくとも5%が編集される。いくつかの実施形態では、意図される塩基対の少なくとも10%、15%、20%、25%、30%、35%、40%、45%、または50%が編集される。
【0719】
いくつかの実施形態では、標的ヌクレオチドにおける意図される産物対意図されない産物の比は、少なくとも2:1、5:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1、もしくは200:1、またはそれより大きい。いくつかの実施形態では、意図される突然変異対インデル形成の比は、1:1超、10:1超、50:1超、100:1超、500:1超、もしくは1000:1超、またはそれより大きい。いくつかの実施形態では、切断される一本鎖(ニック鎖)が、ガイド核酸にハイブリダイズされる。いくつかの実施形態では、切断される一本鎖は、第一の核酸塩基を含む鎖とは反対の鎖である。いくつかの実施形態では、塩基エディターはdCas9ドメインを含む。いくつかの実施形態では、塩基エディターは、編集されていない鎖を保護するかまたはこうした鎖に結合する。いくつかの実施形態では、意図される編集塩基対は、PAM部位の上流にある。いくつかの実施形態では、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド上流である。いくつかの実施形態では、意図される編集塩基対は、PAM部位の下流にある。いくつかの実施形態では、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下流にある。いくつかの実施形態では、本方法は、カノニカルな(例えばNGG)PAM部位を必要としない。いくつかの実施形態では、核酸塩基エディターはリンカーを含む。いくつかの実施形態では、リンカーは、長さ1~25アミノ酸である。いくつかの実施形態では、リンカーは、長さ5~20アミノ酸である。いくつかの実施形態では、リンカーは、長さ10、11、12、13、14、15、16、17、18、19、または20アミノ酸である。一実施形態では、リンカーは、長さ32アミノ酸である。別の実施形態では、「長いリンカー(long linker)」は、長さ少なくとも約60アミノ酸である。他の実施形態では、リンカーは、長さ約3~100アミノ酸の間である。いくつかの実施形態では、標的領域は標的ウィンドウを含み、標的ウィンドウは標的核酸塩基対を含む。ある実施形態では、標的ウィンドウは、1~10ヌクレオチドを含む。いくつかの実施形態では、標的ウィンドウは、長さ1~9、1~8、1~7、1~6、1~5、1~4、1~3、1~2、または1ヌクレオチドである。いくつかの実施形態では、標的ウィンドウは、長さ1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチドである。いくつかの実施形態では、意図される編集塩基対は、標的ウィンドウ内にある。いくつかの実施形態では、標的ウィンドウは、意図される編集塩基対を含む。いくつかの実施形態では、本方法は、本明細書に提供される塩基エディターのいずれかを用いて実施される。
【0720】
いくつかの実施形態では、本開示は、ヌクレオチド(例えばタンパク質をコードする遺伝子中のSNP)を編集するための方法を提供する。いくつかの実施形態では、本開示は、二本鎖DNA配列の核酸塩基対を編集するための方法を提供する。いくつかの実施形態では、本方法は、a) 二本鎖DNA配列の標的領域を、塩基エディターおよびガイド核酸(例えばgRNA)を含む複合体と接触させ、ここで、標的領域が標的核酸塩基対を含む、工程と、b) 前記標的領域の鎖分離を誘導する工程と、c) 標的領域の一本鎖における前記標的核酸塩基対の第一の核酸塩基を第二の核酸塩基に変換する工程と、d) 前記標的領域の一本を超えない数の鎖を切断する工程と、を含み、ここで、第一の核酸塩基に相補的な第三の核酸塩基が、第二の核酸塩基に相補的な第四の核酸塩基によって置き換えられ、第二の核酸塩基が、第四の核酸塩基に相補的な第五の核酸塩基によって置き換えられ、それによって、意図される編集塩基対を生成し、ここで意図される編集塩基対を生成する効率は少なくとも5%である。いくつかの実施形態では、工程bは省略されることが認識されるべきである。いくつかの実施形態では、意図される塩基対の少なくとも5%が編集される。いくつかの実施形態では、意図される塩基対の少なくとも10%、15%、20%、25%、30%、35%、40%、45%、または50%が編集される。いくつかの実施形態では、本方法は、19%未満、18%未満、16%未満、14%未満、12%未満、10%未満、8%未満、6%未満、4%未満、2%未満、1%未満、0.5%未満、0.2%未満、または0.1%未満のインデル形成を引き起こす。いくつかの実施形態では、標的ヌクレオチドでの意図される産物対意図されない産物の比は、少なくとも2:1、5:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1、もしくは200:1、またはそれより大きい。いくつかの実施形態では、意図される突然変異対インデル形成の比は、1:1超、10:1超、50:1超、100:1超、500:1超、もしくは1000:1超、またはそれより大きい。いくつかの実施形態では、切断される一本鎖が、ガイド核酸にハイブリダイズされる。いくつかの実施形態では、切断される一本鎖は、第一の核酸塩基を含む鎖とは反対の鎖である。いくつかの実施形態では、意図される編集塩基対は、PAM部位の上流にある。いくつかの実施形態では、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド上流である。いくつかの実施形態では、意図される編集塩基対は、PAM部位の下流にある。いくつかの実施形態では、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下流にある。いくつかの実施形態では、本方法は、カノニカル(例えばNGG)PAM部位を必要としない。いくつかの実施形態では、リンカーは、長さ1~25アミノ酸である。いくつかの実施形態では、リンカーは、長さ5~20アミノ酸である。ある実施形態では、リンカーは、長さ10、11、12、13、14、15、16、17、18、19、または20アミノ酸である。いくつかの実施形態では、標的領域は標的ウィンドウを含み、標的ウィンドウは標的核酸塩基対を含む。いくつかの実施形態では、標的ウィンドウは、1~10ヌクレオチドを含む。いくつかの実施形態では、標的ウィンドウは、長さ1~9、1~8、1~7、1~6、1~5、1~4、1~3、1~2、または1ヌクレオチドである。いくつかの実施形態では、標的ウィンドウは、長さ1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチドである。いくつかの実施形態では、意図される編集塩基対は、標的ウィンドウ内で起こる。いくつかの実施形態では、標的ウィンドウは、意図される編集塩基対を含む。いくつかの実施形態では、核酸塩基エディターは、本明細書に提供される塩基エディターのいずれかである。
【0721】
宿主細胞における融合タンパク質の発現
アデノシンデアミナーゼバリアントを含む本開示の融合タンパク質は、当業者に知られるルーチンの方法を用いて、細菌、酵母、真菌、昆虫、植物、および動物細胞を含むがこれらに限定されない実質的に任意の関心対象の宿主細胞において発現され得る。例えば、cDNA配列に基づいて、CDSの上流および下流に対する適切なプライマーを設計することによって、本開示のアデノシンデアミナーゼをコードするDNAをクローニングしてもよい。クローニングされたDNAを直接、または望ましい場合には制限酵素で消化した後、あるいは適切なリンカーおよび/または核局在化シグナルの付加後、塩基編集システムの1つ以上の追加の構成要素をコードするDNAと連結してもよい。塩基編集システムは、宿主細胞において翻訳されて、複合体を形成する。
【0722】
本明細書中に記載されるタンパク質ドメインをコードするDNAは、DNAを化学的に合成することによって、またはPCR法およびGibsonアセンブリ法を利用することによって、合成された部分的に重複するオリゴDNA短鎖を連結してその全長をコードするDNAを構築することにより、得られ得る。化学合成またはPCR法もしくはGibsonアセンブリ法の組み合わせによって全長DNAを構築する利点は、DNAを導入する宿主にしたがって、CDS全長で、用いようとするコドンを設計可能であることである。異種DNAの発現において、タンパク質発現レベルは、そのDNA配列を、宿主生物において非常に頻繁に用いられるコドンに変換することによって、増加すると予期される。使用しようとする宿主におけるコドン使用頻度のデータとしては、例えばかずさDNA研究所のホームページに開示されている遺伝子コード使用頻度データベース(http://www.kazusa.or.jp/codon/index.html)を用いてもよいし、または各宿主におけるコドン使用頻度を示す文書を参照してもよい。得られたデータおよび導入しようとするDNA配列を参照することによって、DNA配列に関して用いられるものの中から、宿主において低い使用頻度を示すコドンを、同じアミノ酸をコードし、かつ高い使用頻度を示すコドンに変換してもよい。
【0723】
例えば、適切な発現ベクター中のプロモーター下流にDNAを連結することによって、核酸配列認識モジュールおよび/または核酸塩基変換酵素をコードするDNAを含有する発現ベクターを産生してもよい。
【0724】
発現ベクターとして、Escherichia coli由来プラスミド(例えばpBR322、pBR325、pUC12、pUC13);Bacillus subtilis由来プラスミド(例えばpUB110、pTP5、pC194);酵母由来プラスミド(例えばpSH19、pSH15);昆虫細胞発現プラスミド(例えばpFast-Bac);動物細胞発現プラスミド(例えばpA1-11、pXT1、pRc/CMV、pRc/RSV、pcDNAI/Neo);ラムダファージなどのバクテリオファージ;バキュロウイルスなどの昆虫ウイルスベクター(例えばBmNPV、AcNPV);レトロウイルス、ワクシニアウイルス、アデノウイルスなど、動物ウイルスベクター等を用いる。
【0725】
いくつかの実施形態では、遺伝子発現のために用いられる、宿主に適した任意のプロモーターを用いてもよい。DSBを用いた慣用法では、宿主細胞の生存率は、ときに、毒性のため、顕著に減少するため、誘導性プロモーターを用いることによる誘導の開始によって、細胞の数を増加させることが望ましい。しかし、本開示の核酸修飾酵素複合体を発現させることによって、十分な細胞増殖がまた提供され得るため、制限なしに恒常的プロモーター(constitution promoter)もまた、用いてもよい。
【0726】
例えば、宿主が動物細胞である場合には、SRαプロモーター、SV40プロモーター、LTRプロモーター、CMV (サイトメガロウイルス) プロモーター、RSV (ラウス肉腫ウイルス)プロモーター、MoMuLV (モロニーマウス白血病ウイルス) LTR、HSV-TK (単純ヘルペスウイルスチミジンキナーゼ)プロモーター等が用いられる。これらのうち、CMVプロモーター、SRαプロモーター等が好ましい。
【0727】
宿主がEscherichia coliである場合、trpプロモーター、lacプロモーター、recAプロモーター、λPLプロモーター、lppプロモーター、T7プロモーター等が好ましい。
【0728】
宿主がBacillus属である場合、SPO1プロモーター、SPO2プロモーター、penPプロモーター等が好ましい。
【0729】
宿主が酵母の場合には、Gal1/10プロモーター、PHO5プロモーター、PGKプロモーター、GAPプロモーター、ADHプロモーター等が好ましい。
【0730】
宿主が昆虫細胞である場合には、ポリヘドリンプロモーター、P10プロモーター等が好ましい。
【0731】
宿主が植物細胞である場合、CaMV35Sプロモーター、CaMV19Sプロモーター、NOSプロモーター等が好ましい。
【0732】
発現ベクターとして、上述のものに加えて、オン・デマンドで、エンハンサー、スプライシングシグナル、ターミネーター、ポリA付加シグナル、選択マーカー、例えば、薬剤耐性遺伝子、栄養要求性相補遺伝子等、複製起点等を含有するものを用いてもよい。
【0733】
本明細書に記載されるタンパク質ドメインをコードするRNAは、例えば、上述の核酸配列認識モジュールおよび/または核酸塩基変換酵素をコードするDNAをコードするベクターをテンプレートとして用いることにより、それ自体公知であるin vitro転写システムにおいてmRNAに転写することによって調製することができる。
【0734】
核酸配列認識モジュールおよび/または核酸塩基変換酵素をコードするDNAを含有する発現ベクターを宿主細胞に導入し、該宿主細胞を培養することにより、本開示の融合タンパク質を細胞内で発現させることができる。
【0735】
宿主としてEscherichia属、Bacillus属、酵母、昆虫細胞、昆虫、動物細胞等を用いる。
【0736】
Escherichia属として、Escherichia coli K12.cndot.DH1(Proc. Natl. Acad. Sci. USA, 60, 160 (1968))、Escherichia coli JM103(Nucleic Acids Research, 9, 309 (1981))、Escherichia coli JA221(Journal of Molecular Biology, 120, 517 (1978))、Escherichia coli HB101(Journal of Molecular Biology, 41, 459 (1969))、Escherichia coli C600(Genetics, 39, 440 (1954))等を用いる。
【0737】
Bacillus属として、Bacillus subtilis M1114 (Gene, 24, 255 (1983))、Bacillus subtilis 207-21 (Journal of Biochemistry, 95, 87 (1984)) 等を用いる。
【0738】
酵母として、Saccharomyces cerevisiae AH22、AH22R -、NA87-11A、DKD-5D、20B-12、Schizosaccharomyces pombe NCYC1913、NCYC2036、Pichia pastoris KM71等を用いる。
【0739】
ウイルスがAcNPVである場合、昆虫細胞として、ヨトウガ(cabbage armyworm)幼虫由来樹立株の細胞(Spodoptera frugiperda細胞;Sf細胞)、Trichoplusia niの中腸由来MG1細胞、Trichoplusia niの卵由来のHigh FiveTM細胞、Mamestra brassicae由来細胞、Estigmena acrea由来細胞等が用いられる。ウイルスがBmNPVの場合には、昆虫細胞としてBombyx mori由来樹立株の細胞(Bombyx mori N 細胞;BmN細胞)等を用いる。Sf細胞としては、例えば、Sf9細胞(ATCC CRL1711)、Sf 21細胞(上記すべて、In Vivo, 13, 213-217 (1977))等を用いる。
【0740】
昆虫として、例えば、Bombyx moriの幼虫、Drosophila、コオロギ等を用いる(Nature, 315,592 (1985))。
【0741】
動物細胞として、サルCOS-7細胞、サルVero細胞、チャイニーズハムスター卵巣 (CHO) 細胞、dhfr遺伝子欠損CHO細胞、マウスL細胞、マウスAtT-20細胞、マウスミエローマ細胞、ラットGH3細胞、ヒトFL細胞など、ヒトおよび他の哺乳動物のiPS細胞、ES細胞などの多能性幹細胞、ならびに多様な組織から調製された初代培養細胞が使用される。さらに、ゼブラフィッシュ胚、Xenopus卵母細胞などを用いることもできる。
【0742】
植物細胞として、多様な植物(例えば、イネ、コムギ、トウモロコシ等の穀物、トマト、キュウリ、ナス等の生産作物、カーネーション、Eustoma russellianum等の園芸植物、タバコ、Arabidopsis thaliana等の実験植物等)から調製される、懸濁培養細胞、カルス、プロトプラスト、葉断片、根断片等を用いる。
【0743】
上記の宿主細胞はすべて、ハプロイド(一倍体)または倍数体(例えば二倍体、三倍体、四倍体など)であり得る。慣用的な突然変異導入法では、突然変異は、原則として、1つの相同染色体内にのみ導入されて、ヘテロ遺伝子型を生じる。従って、望ましい表現型は、ドミナント突然変異が起こらない限り発現されず、かつホモ接合は不都合に労力と時間を要する。対照的に、本開示に従えば、突然変異は、ゲノム中の相同染色体上の任意のアレルに導入され得るため、劣性突然変異の場合であっても単一の世代で所望の表現型を発現可能であり、これは慣用法の問題を解決し得るため、非常に有用である。
【0744】
宿主の種類に従って、公知の方法(例えばリゾチーム法、コンピテント法、PEG法、CaCl2共沈法、エレクトロポレーション法、マイクロインジェクション法、粒子銃法、リポフェクション法、アグロバクテリウム法等)によって発現ベクターを導入してもよい。
【0745】
Escherichia coliは、例えばProc. Natl. Acad. Sci. USA, 69, 2110 (1972)、Gene, 17, 107 (1982)等に記載された方法に従って形質転換され得る。
【0746】
Bacillus属には、例えば、Molecular & General Genetics, 168, 111 (1979) 等に記載される方法に従って、ベクターが導入され得る。
【0747】
酵母には、例えばMethods in Enzymology, 194, 182-187 (1991)、Proc. Natl. Acad. Sci. USA, 75, 1929 (1978) 等に記載される方法に従って、ベクターが導入され得る。
【0748】
昆虫細胞および昆虫には、例えばBio/Technology, 6, 47-55 (1988)等に記載される方法に従って、ベクターが導入され得る。
【0749】
動物細胞には、例えば、Cell Engineering additional volume 8, New Cell Engineering Experiment Protocol, 263-267 (1995)(秀潤社刊行)、およびVirology, 52, 456 (1973) に記載される方法に従って、ベクターが導入され得る。
【0750】
ベクターを導入された細胞は、宿主の種類に従った公知の方法に従って培養され得る。
【0751】
例えば、Escherichia coliまたはBacillus属を培養する場合、培養に用いる培地としては、液体培地が好ましい。培地は、好ましくは、炭素源、窒素源、無機物質、および形質転換体の成長に必要な他の成分を含有する。炭素源の例には、グルコース、デキストリン、可溶性デンプン、スクロースなどが含まれる。窒素源の例には、アンモニウム塩、硝酸塩、コーンスティープリカー、ペプトン、カゼイン、肉エキス、大豆かす、ジャガイモエキス等のような無機または有機物質が含まれ、無機物質の例には、塩化カルシウム、リン酸二水素ナトリウム、塩化マグネシウム等が含まれる。培地は、酵母エキス、ビタミン、成長促進因子などを含有してもよい。培地のpHは好ましくは約5~約8である。
【0752】
Escherichia coliを培養するための培地としては、例えば、グルコース、カザミノ酸を含有するM 9培地(Journal of Experiments in Molecular Genetics, 431-433, Cold Spring Harbor Laboratory, New York 1972)が好ましい。必要な場合、例えば、3β-インドリルアクリル酸などの剤を培地に添加して、プロモーターの効率的な機能を確実にしてもよい。Escherichia coliは通常約15~約43℃で培養される。必要な場合、曝気および攪拌を行ってもよい。
【0753】
Bacillus属は一般に約30~約40°Cで培養される。必要な場合、曝気および攪拌を行ってもよい。
【0754】
酵母培養用の培地の例には、バークホルダー最少培地(Proc. Natl. Acad. Sci. USA, 77, 4505 (1980))、0.5%カザミノ酸含有SD培地(Proc. Natl. Acad. Sci. USA, 81, 5330 (1984))等が含まれる。培地のpHは好ましくは約5~約8である。培養は、一般に約20℃~約35℃で行う。必要な場合、曝気および攪拌を行ってもよい。
【0755】
昆虫細胞や昆虫を培養するための培地としては、例えば、適切なように、不活化10%ウシ血清などの添加物を含有するグレース昆虫培地(Nature, 195, 788 (1962))等が用いられる。培地のpHは好ましくは約6.2~約6.4である。培養は一般的に約27℃で実行される。必要な場合、曝気および撹拌を行ってもよい。
【0756】
動物細胞を培養するための培地として、例えば、約5~約20%のウシ胎児血清を含有する最小必須培地 (MEM)(Science, 122, 501 (1952))、Dulbecco修飾イーグル培地 (DMEM)(Virology, 8, 396 (1959))、RPMI 1640培地(The Journal of the American Medical Association, 199, 519 (1967))、199培地(Proceeding of the Society for the Biological Medicine, 73, 1 (1950))等を用いる。培地のpHは好ましくは約6~約8である。培養は、約30℃~約40℃で行われる。必要な場合、曝気および撹拌を行ってもよい。
【0757】
植物細胞を培養するための培地として、例えば、MS培地、LS培地、B5培地等が用いられる。培地のpHは好ましくは約5~約8である。培養は、一般に約20℃~約30℃で行われる。必要な場合、曝気および攪拌を行ってもよい。
【0758】
より高次の真核細胞、例えば動物細胞、昆虫細胞、植物細胞等を宿主細胞として用いる場合、本開示の塩基編集システムをコードする(例えばアデノシンデアミナーゼバリアントを含む)DNAを、誘導性プロモーター(例えばメタロチオネインプロモーター(重金属イオンによって誘導される)、熱ショックタンパク質プロモーター(熱ショックによって誘導される)、Tet-ON/Tet-OFFシステムプロモーター(テトラサイクリンまたはその誘導体の添加または除去によって誘導される)、ステロイド応答性プロモーター(ステロイドホルモンまたはその誘導体によって誘導される)等)の制御下で、宿主細胞内に導入して、適切な段階で誘導剤を培地に添加して(または培地から除去して)、核酸修飾酵素複合体の発現を誘導し、所定の期間、培養を行って、塩基編集および標的遺伝子内への突然変異の導入を実行し、塩基編集システムの一過性発現を達成する。
【0759】
Escherichia coliなどの原核細胞は誘導性プロモーターを利用することができる。誘導性プロモーターの例には、lacプロモーター(IPTGによって誘導される)、cspAプロモーター(寒冷ショックによって誘導される)、araBADプロモーター(アラビノースによって誘導される)などが含まれるが、これらに限定されない。
【0760】
あるいは、より高次の真核細胞、例えば動物細胞、昆虫細胞、植物細胞等を宿主細胞として用いる場合、上述の誘導性プロモーターをベクター除去機構として利用してもよい。すなわち、ベクターには、宿主細胞において機能する複製起点、および複製のために必要なタンパク質をコードする核酸(例えば動物細胞に関しては、SV40 onおよびラージT抗原、oriPおよびEBNA-1等)が搭載され、タンパク質をコードする核酸の発現は、上述の誘導性プロモーターによって制御される。その結果、ベクターは誘導物質の存在下で自律性に複製可能である一方、誘導物質が除去されると、自律性複製は利用可能でなくなり、ベクターは、細胞分裂とともに自然に脱落する(自律性複製は、Tet-OFFシステムベクターにおいては、テトラサイクリンおよびドキシサイクリンの添加によって可能でなくなる)。
【0761】
塩基エディターを用いる方法
疾患関連遺伝子およびアレル中の点突然変異の修正は、療法および基礎研究における適用を伴う、遺伝子修正のための新規戦略を提供する。
【0762】
本開示は、本明細書に提供する塩基エディターシステムによって修正可能な点突然変異と関連するかまたはこうした点突然変異が引き起こす疾患を有すると診断された対象の治療法を提供する。例えば、いくつかの実施形態では、こうした疾患、例えば遺伝子突然変異によって引き起こされる疾患を有する対象に、疾患関連遺伝子中の点突然変異を修正する核酸塩基エディター(例えばアデノシンデアミナーゼ塩基エディター)の有効量を投与する工程を含む方法を提供する。本開示は、デアミナーゼ仲介遺伝子編集によって修正可能な点突然変異と関連するかまたはこうした点突然変異が引き起こすRTTの治療法を提供する。本明細書に提供する戦略および融合タンパク質で治療可能な適切な疾患は、本開示に基づいて、当業者には明らかであろう。
【0763】
本明細書に提供するのは、疾患または障害と関連する標的ヌクレオチド配列中の核酸塩基を編集するための塩基エディターまたは塩基エディターシステムを用いる方法である。いくつかの実施形態では、(例えばアデノシンデアミナーゼおよびCas9ドメインを含む)塩基エディターの活性は、点突然変異の修正を生じる。いくつかの実施形態では、標的DNA配列は、疾患または障害と関連するG→A点突然変異を含み、突然変異体A塩基の脱アミノ化は、疾患または障害と関連しない配列を生じる。いくつかの実施形態では、標的DNA配列は、疾患または障害と関連するT→C点突然変異を含み、突然変異体C塩基の脱アミノ化は、疾患または障害と関連しない配列を生じる。
【0764】
いくつかの実施形態では、標的DNA配列はタンパク質をコードし、点突然変異はコドン中にあり、野生型コドンと比較した際、突然変異体コドンにコードされるアミノ酸の変化を生じる。いくつかの実施形態では、突然変異体Aの脱アミノ化は、突然変異体コドンによってコードされるアミノ酸の変化を生じる。いくつかの実施形態では、突然変異体Aの脱アミノ化は、野生型アミノ酸をコードするコドンを生じる。いくつかの実施形態では、突然変異体Cの脱アミノ化は、突然変異体コドンによってコードされるアミノ酸の変化を生じる。いくつかの実施形態では、突然変異体Cの脱アミノ化は、野生型アミノ酸をコードするコドンを生じる。いくつかの実施形態では、対象は、疾患または障害を有するか、あるいはこれらを有すると診断されている。
【0765】
いくつかの実施形態では、本明細書に提供するアデノシンデアミナーゼは、DNAのデオキシアデノシン残基を脱アミノ化可能である。本開示の他の側面は、アデノシンデアミナーゼ(例えば本明細書に記載するようなDNA中のデオキシアデノシンを脱アミノ化するアデノシンデアミナーゼ)および特定のヌクレオチド配列に結合可能なドメイン(例えばCas9またはCpf1タンパク質)を含む融合タンパク質を提供する。例えば、アデノシンを、典型的にはシトシン残基と塩基対形成するイノシン残基に変換してもよい。こうした融合タンパク質は、とりわけ、核酸配列の標的化編集に有用である。こうした融合タンパク質を、in vitroで、DNAの標的化編集に、例えば突然変異細胞または動物の生成に;標的化突然変異の導入に、例えばex vivoでの細胞中の、例えば対象から得て、続いて同じまたは別の対象内に再導入する細胞中の、遺伝子欠損の修正に;in vivoでの標的化突然変異の導入に用いてもよく、例えば、遺伝子欠損の修正、あるいはGからA、またはTからC突然変異の疾患関連遺伝子中の脱活性化突然変異の導入は、本明細書に提供する核酸塩基エディターを用いて治療可能である。本開示は、デアミナーゼおよび核酸塩基エディターを利用する、デアミナーゼ、融合タンパク質、核酸、ベクター、細胞、組成物、方法、キット、システム等を提供する。
【0766】
Mecp2遺伝子中の標的ヌクレオチドに対する核酸塩基エディターの使用
Mecp2遺伝子中のヌクレオチドを標的指向化する核酸塩基エディターの適切性を本明細書に記載するように評価する。一実施形態では、関心対象の単細胞を、レポーター(例えばGFP)をコードする少量のベクターとともに、本明細書記載の核酸塩基エディターをコードする単数または複数の核酸分子でトランスフェクションするか、形質導入するか、または別の方式で修飾する。これらの細胞は、不死化ヒト細胞株、例えば293T、K562またはU20Sであってもよい。あるいは、初代ヒト細胞を用いてもよい。細胞はまた、対象または個体から、例えば組織生検、手術、血液、血漿、血清、または他の生物学的液体から得られてもよい。こうした細胞は、最終的な細胞標的に関連したものであり得る。
【0767】
以下にさらに記載するように、ウイルスベクターを用いて、送達を実行してもよい。一実施形態では、トランスフェクションは、脂質トランスフェクション(LipofectamineやFugeneなど)を用いて、またはエレクトロポレーションによって実施することができる。トランスフェクション後、GFPの発現を蛍光顕微鏡またはフローサイトメトリーのいずれかによって測定して、一貫した高レベルのトランスフェクションを確認することができる。最も高い活性を与えるエディターの組み合わせを決定するために、これらの予備的なトランスフェクションは異なる核酸塩基エディターを含むことができる。
【0768】
核酸塩基エディターの活性は、本明細書に記載されるように、すなわち標的遺伝子を配列決定して標的配列中の改変を検出することによって評価される。サンガー配列決定のためには、精製されたPCRアンプリコンをプラスミド主鎖内にクローニングし、形質転換し、ミニプレップし、単一プライマーで配列決定する。配列決定はまた、次世代配列決定技術を用いて実施されてもよい。次世代配列決定を使用する場合、アンプリコンは、意図される切断部位が非対称に配置された300~500 bpであり得る。PCRに続いて、例えばハイスループット配列決定(例えばIllumina MiSeq上でのもの)で使用するために、次世代配列決定のアダプターおよびバーコード(例えば、Illumina多重アダプターとインデックス)をアンプリコンの末端に付加し得る。
【0769】
最初の試験で最大レベルの標的特異的改変を誘導する融合タンパク質を、さらなる評価のために選択し得る。
【0770】
特定の実施形態では、核酸塩基エディターを用いて、関心対象のポリヌクレオチドを標的とする。一実施形態では、本明細書記載の核酸塩基エディターを、標的核酸配列、例えばRTT関連突然変異を宿するMecp2ポリヌクレオチドを標的指向化するために用いるガイドRNAとともに、細胞(例えばニューロン)に送達し、それによって標的遺伝子、すなわちMecp2を改変する。
【0771】
いくつかの実施形態では、ガイドRNAによって塩基エディターを標的指向化して、関心対象の遺伝子配列に、1つ以上の編集を導入する。いくつかの実施形態では、Mecp2遺伝子内に導入される1つ以上の改変は、以下の表10に示す通りである。
【0772】
意図される突然変異の生成
いくつかの実施形態では、本明細書に提供する方法の目的は、遺伝子編集を通じて機能不全遺伝子の機能を回復することである。いくつかの実施形態では、機能不全遺伝子の機能は、意図される突然変異を導入することによって回復される。いくつかの実施形態では、本明細書に提供する方法を用いて、遺伝子産物の通常の機能を破壊することも可能である。例えばヒト細胞培養中で疾患関連突然変異を修正することによって、in vitroで、遺伝子編集に基づくヒト療法に関して、本明細書に提供する核酸塩基編集タンパク質を検証することも可能である。当業者には、本明細書に提供する核酸塩基編集タンパク質、例えばポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン(例えばCas9)および核酸塩基編集ドメイン(例えばアデノシンデアミナーゼドメイン)を含む融合タンパク質を用いて、任意の単一ポイントAからGまたはCからTの突然変異を修正することも可能であることが理解される。第一の場合、突然変異体AからIの脱アミノ化が突然変異を修正し、後者の場合、突然変異体Tと塩基対を形成するAの脱アミノ化、その後の複製ラウンドが突然変異を修正する。
【0773】
いくつかの実施形態では、本開示は、有意な数の意図されない突然変異、例えば意図されない点突然変異を生成することなく、核酸(例えば対象のゲノム内の核酸)において、意図される突然変異、例えば点突然変異を効率的に生成する塩基エディターを提供する。いくつかの実施形態では、意図される突然変異は、意図される突然変異を生成するように特に設計されたガイドポリヌクレオチド(例えばgRNA)に結合した特異的塩基エディター(例えばアデノシン塩基エディター)によって生成される突然変異である。いくつかの実施形態では、意図される突然変異は、疾患または障害、例えばRETT症候群に関連する突然変異である。いくつかの実施形態では、意図される突然変異は、疾患または障害、例えばRETT症候群と関連するアデニン(A)からグアニン(G)への点突然変異(例えばSNP)である。いくつかの実施形態では、意図される突然変異は、遺伝子のコード領域または非コード領域(例えば制御領域または要素)内のアデニン(A)からグアニン(G)への点突然変異である。いくつかの実施形態では、意図される突然変異は、停止コドン、例えば遺伝子のコード領域内の未成熟停止コドンを生成する点突然変異である。いくつかの実施形態では、意図される突然変異は、停止コドンを除去する突然変異である。
【0774】
いくつかの実施形態では、本明細書に提供する塩基エディターはいずれも、1:1より大きい、意図される突然変異対意図されない突然変異(例えば、意図される点突然変異:意図されない点突然変異)の比を生成することができる。いくつかの実施形態では、本明細書に提供される塩基エディターはいずれも、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも10:1、少なくとも12:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも150:1、少なくとも200:1、少なくとも250:1、少なくとも500:1、もしくは少なくとも1000:1、またはそれより高い、意図される突然変異対意図されない突然変異(例えば、意図される点突然変異:意図されない点突然変異)の比を生じることができる。
【0775】
塩基エディター効率の詳細は、国際PCT出願番号PCT/2017/045381 (WO2018/027078) およびPCT/US2016/058344 (WO2017/070632)に記載され、これらは各々、その全内容が参照により本明細書に組み込まれる。また、その全内容が参照により本明細書に組み込まれる、Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); および Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity,” Science Advances 3:eaao4774 (2017)も参照されたい。
【0776】
いくつかの実施形態では、本明細書に提供する方法を用いた、1つ以上の遺伝子中の複数の核酸塩基対の編集は、少なくとも1つの意図される突然変異の形成を生じる。いくつかの実施形態では、前記の少なくとも1つの意図される突然変異の前記形成は、疾患を引き起こす突然変異の正確な修正を生じる。本明細書に提供する任意の方法または方法の組み合わせを用いて、多重編集が達成可能であることを認識すべきである。
【0777】
病原性突然変異の正確な修正
いくつかの実施形態では、意図される突然変異は、病原性突然変異または疾患原因突然変異の正確な修正である。病原性突然変異は、病原性一塩基多型(SNP)であり得るかまたはSNPによって引き起こされ得る。例えば、病原性突然変異は、遺伝子によってコードされるタンパク質中のアミノ酸変化であり得る。別の例では、病原性突然変異は、遺伝子中の病原性SNPであり得る。正確な修正は、病原性突然変異を野生型状態に戻す復帰であり得る。いくつかの実施形態では、病原性突然変異は疾患または障害と関連するG→A点突然変異であり、突然変異A塩基のAからGへの塩基エディター(ABE)での脱アミノ化は、疾患または障害に関連しない配列を生じる。いくつかの実施形態では、病原性突然変異は、C→T点突然変異である。例えばAからGへの塩基エディター(ABE)を反対の鎖に標的指向化し、病原性T核酸塩基の相補体Aを編集することによって、C→T点突然変異を修正してもよい。塩基エディターを病原性SNPに、または病原性SNPの相補体に標的指向化してもよい。病原性または疾患原因突然変異、および他の配列変異の説明の命名は、その全内容が参照により本明細書に組み込まれるden Dunnen, J.T. and Antonarakis, S.E., “Mutation Nomenclature Extensions and Suggestions to Describe Complex Mutations: A Discussion.” Human Mutation 15:712 (2000)に記載される。
【0778】
特定の実施形態では、疾患または障害はレット症候群(RTT)である。いくつかの実施形態では、病原性突然変異はMecp2遺伝子中にある。
【0779】
送達システム
核酸塩基エディターおよびgRNAの核酸に基づく送達
当技術分野に公知の方法によって、または本明細書に記載されるように、本開示に従った塩基編集システムをコードする核酸を対象に投与するか、あるいはin vitroまたはin vivoで細胞内に送達してもよい。一実施形態では、例えばベクター(例えばウイルスまたは非ウイルスベクター)、ベクターに基づかない方法(例えば裸のDNA、DNA複合体、脂質ナノ粒子)、またはその組み合わせによって、核酸塩基エディターを送達してもよい。
【0780】
核酸塩基エディターをコードする核酸を、例えばトランスフェクションまたはエレクトロポレーションによって、裸のDNAまたはRNAとして細胞(例えば造血細胞またはその前駆細胞、造血幹細胞、および/または人工多能性幹細胞)に直接送達してもよいし、あるいは、標的細胞による取り込みを促進する分子(例えばN-アセチルガラクトサミン)にコンジュゲート化させてもよい。本明細書に記載するベクターなどの核酸ベクターもまた使用できる。
【0781】
核酸ベクターは、本明細書に記載される融合タンパク質のドメインをコードする1つ以上の配列を含むことができる。ベクターはまた、タンパク質をコードする配列に付随する(例えば、挿入されているか、融合されている)シグナルペプチド(例えば、核局在化、核小体局在化、またはミトコンドリア局在化のためのもの)をコードする配列も含むことができる。一例として、核酸ベクターは、1つ以上の核局在化配列(例えばSV40からの核局在化配列)を含むCas9コード配列、およびアデノシンデアミナーゼバリアント(例えばTadA*8)を含むことができる。
【0782】
核酸ベクターはまた、任意の適切な数の調節/制御エレメント、例えばプロモーター、エンハンサー、イントロン、ポリアデニル化シグナル、Kozakコンセンサス配列、または内部リボソームエントリー部位 (IRES) も含むことができる。これらの要素は当技術分野でよく知られている。造血細胞に関しては、適切なプロモーターにはIFNベータまたはCD45が含まれ得る。
【0783】
本開示による核酸ベクターは、組換えウイルスベクターを含む。例示的なウイルスベクターを本明細書に示す。当技術分野で知られる他のウイルスベクターも使用することができる。さらに、ウイルス粒子を用いて、核酸および/またはペプチドの形態の塩基編集システム構成要素を送達することができる。例えば、「空の」ウイルス粒子は、任意の適切なカーゴを含有するように組み立てられ得る。ウイルスベクターおよびウイルス粒子はまた、標的指向化リガンドを組み込んで標的組織特異性を変化させるように操作することができる。
【0784】
ウイルス性ベクターに加えて、本開示に従ったゲノム編集システムをコードする核酸を送達するために非ウイルス性ベクターを用いてもよい。非ウイルス性核酸ベクターの1つの重要なカテゴリーは、有機または無機であり得るナノ粒子である。ナノ粒子は当技術分野でよく知られている。任意の適切なナノ粒子設計を用いて、ゲノム編集システム構成要素またはそのような構成要素をコードする核酸を送達することができる。例えば、有機(例えば、脂質および/またはポリマー)ナノ粒子が、本開示の特定の実施形態における送達ビヒクルとして使用に適している可能性もある。ナノ粒子配合物、および/または遺伝子導入において使用するための例示的な脂質を、下記表12に示す。
【表12】
【0785】
表13は、遺伝子導入および/またはナノ粒子配合物において使用するための例示的なポリマーを列挙する。
【表13】
【0786】
表14は、本明細書記載の融合タンパク質をコードするポリヌクレオチドのための送達法を要約する。
【表14】
【0787】
別の態様において、例えばCas9もしくはそのバリアントなどの核酸結合タンパク質、および関心対象のゲノム核酸配列を標的とするgRNAのような、ゲノム編集システム構成要素またはそのような構成要素をコードする核酸の送達は、リボ核タンパク質 (RNP) を細胞に送達することによって達成され得る。RNPは、標的化gRNAと複合体形成した核酸結合タンパク質、例えばCas9を含む。RNPは、エレクトロポレーション、ヌクレオフェクション、またはカチオン性脂質仲介法、例えば、Zuris, J.A. et al., 2015, Nat. Biotechnology, 33(1):73-80によって報告されているもののような、公知の方法を用いて細胞に送達することができる。RNPは、CRISPR塩基編集システムにおける使用のために好適であり、特に初代細胞のようなトランスフェクションが困難な細胞のために好適である。さらに、RNPはまた、細胞におけるタンパク質発現で起こり得る困難を軽減することもでき、特に、CRISPRプラスミドにおいて使用され得るCMVまたはEF1Aなどの真核プロモーターがよく発現されない場合にはそうである。好適なことに、RNPの使用は、細胞への外来DNAの送達を必要としない。さらに、核酸結合タンパク質およびgRNA複合体を含むRNPは、経時的に分解されるため、RNPの使用は、オフターゲット効果を制限する可能性を有する。プラスミドに基づく技術の場合と同様の方法で、RNPは、結合タンパク質(例えばCas9バリアント) を送達するために、そして相同性指向性修復(HDR)を導くために使用され得る。
【0788】
核酸分子発現をコードする塩基エディターを駆動するために使用されるプロモーターは、AAV ITRを含み得る。これは、ベクター中のスペースを占領してしまい得る追加のプロモーター要素の必要性を排除するために有利であり得る。解放された追加のスペースは、ガイド核酸または選択可能マーカーなどの追加の要素の発現を駆動するために使用することができる。ITR活性は比較的弱いので、これは選択したヌクレアーゼの過剰発現による潜在的毒性を低減するために使用できる。
【0789】
塩基エディター、および適切な場合、ガイド核酸の発現を駆動するため、任意の適切なプロモーターを用いてもよい。遍在性の発現のため、用いてもよいプロモーターには、CMV、CAG、CBh、PGK、SV40、フェリチン重鎖または軽鎖等が含まれる。脳または他のCNS細胞発現のため、適切なプロモーターには:すべてのニューロンに関してシナプシンI、興奮性ニューロンに関してはCaMKIIアルファ、GABA作動性ニューロンに関してはGAD67またはGAD65またはVGAT等が含まれる。肝細胞での発現に関しては、適切なプロモーターには、アルブミンプロモーターが含まれ得る。肺細胞の発現に関しては、適切なプロモーターにはSP-Bプロモーターが含まれ得る。内皮細胞に関しては、適切なプロモーターにはICAMが含まれ得る。造血細胞に関しては、適切なプロモーターにはIFNベータまたはCD45が含まれ得る。骨芽細胞に関しては、適切なプロモーターにはOG-2が含まれ得る。
【0790】
いくつかの実施形態では、本開示の塩基エディターは、同じ核酸分子内で別々のプロモーターが塩基エディターおよび適合性ガイド核酸の発現を駆動することを可能にするのに十分に小さいサイズである。例えば、ベクターまたはウイルスベクターは、塩基エディターをコードする核酸に機能可能であるように連結された第一のプロモーター、およびガイド核酸に機能可能であるように連結された第二のプロモーターを含むことができる。
【0791】
ガイド核酸の発現を駆動するために使用されるプロモーターには、U6またはH1などのPol IIIプロモーター、gRNAアデノ随伴ウイルス(AAV) を発現するためのPol IIプロモーターとイントロンのカセットの使用が含まれ得る。
【0792】
ウイルスベクター
従って、本明細書記載の塩基エディターをウイルスベクターで送達してもよい。いくつかの実施形態では、本明細書に開示する塩基エディターは、ウイルスベクター中に含有される核酸上にコードされてもよい。いくつかの実施形態では、塩基エディターシステムの1つ以上の構成要素が1つ以上のウイルスベクター上にコードされてもよい。例えば、塩基エディターおよびガイド核酸が単一のウイルスベクター上にコードされてもよい。他の実施形態では、塩基エディターおよびガイド核酸が異なるウイルスベクター上にコードされる。いずれの場合でも、塩基エディターおよびガイド核酸が、プロモーターおよびターミネーターに、互いに機能可能であるように連結されてもよい。ウイルスベクター上にコードされる構成要素の組み合わせは、選択したウイルスベクターのカーゴサイズの制約によって決定され得る。
【0793】
塩基エディターの送達のためのRNAまたはDNAウイルスに基づくシステムの使用は、培養中または宿主中の特定の細胞にウイルスを標的指向化し、ウイルスの積荷を核または宿主細胞ゲノムに輸送する、高度に進化したプロセスを利用する。ウイルスベクターは、培養中の細胞、患者(in vivo)に直接投与することができ、またはそれらを用いて細胞をin vitroで処理してもよく、修飾された細胞を任意で患者に投与することができる(ex vivo)。ウイルスに基づく従来のシステムは、遺伝子導入のためのレトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴および単純ヘルペスウイルスベクターを含み得る。レトロウイルス、レンチウイルス、およびアデノ随伴ウイルスの遺伝子導入法では、宿主ゲノムへの組込みが可能であり、しばしば挿入された導入遺伝子の長期発現をもたらす。さらに、多くの異なる細胞タイプおよび標的組織において高い形質導入効率が観察されている。
【0794】
ウイルスベクターには、レンチウイルス(例えば、HIVおよびFIVに基づくベクター)、アデノウイルスベクター(例えばAD100)、レトロウイルス(例えばMaloneyネズミ白血病ウイルス、MML-V)、ヘルペスウイルスベクター(例えばHSV-2)、およびアデノ随伴ウイルス(AAV)、あるいは他のプラスミドまたはウイルスベクタータイプ、特に、例えば、米国特許第8,454,972号(アデノウイルスの配合物、用量)、米国特許第8,404,658号(AAVの配合物、用量)、米国特許第5,846,946号(DNAプラスミドの配合物、用量)からの配合物および用量を用いるもの、ならびにレンチウイルス、AAVおよびアデノウイルスが関わる臨床試験および臨床試験に関する刊行物からの配合物および用量を用いるものが含まれる。例えば、AAVに関しては、投与経路、配合物および用量は、米国特許第8,454,972号およびAAVが関わる臨床試験におけるようにすることができる。アデノウイルスに関しては、投与経路、配合物および用量は、米国特許第8,404,658号およびアデノウイルスが関わる臨床試験におけるようにすることができる。プラスミド送達に関しては、投与経路、配合物および用量は、米国特許第5,846,946号およびプラスミドが関わる臨床試験におけるようにすることができる。投与量は平均的な70 kgの個体(例えば成人男性)に基づいて算出するか、またはそれに外挿することができ、体重および動物種の異なる患者、対象、哺乳動物に関して調節することができる。投与の頻度は、年齢、性別、全般的な健康状態、患者または対象の他の状態および対処される特定の状態または症状を含む通常の要因に依存して、医学または獣医学の実施者(例えば医師、獣医師)の技量の範囲内である。ウイルスベクターを関心対象の組織に注射することができる。細胞タイプ特異的塩基編集のために、塩基エディターおよび任意のガイド核酸の発現を、細胞型特異的プロモーターによって駆動し得る。
【0795】
レトロウイルスの指向性は、外来のエンベロープタンパク質を組み込み、標的細胞の潜在的な標的集団を拡大することによって改変することができる。レンチウイルスベクターは、非分裂細胞を形質導入または感染させることができ、典型的には高いウイルス力価を産生するレトロウイルスベクターである。従って、レトロウイルス遺伝子導入システムの選択は標的組織に依存する。レトロウイルスベクターは、6~10 kbまでの外来配列のパッケージング能力を有するシス作用性の末端反復配列から構成される。最小シス作用性LTRは、ベクターの複製およびパッケージングのために十分であり、次いでそれを用いて療法遺伝子が標的細胞に組み込まれ、永続的な導入遺伝子発現が提供される。広く使用されているレトロウイルスベクターには、ネズミ白血病ウイルス (MuLV) 、テナガザル(gibbon ape)白血病ウイルス (GaLV) 、サル免疫不全ウイルス(SIV) 、ヒト免疫不全ウイルス (HIV) 、およびそれらの組み合わせに基づくものが含まれる(例えばBuchscher et al., J. Virol. 66:2731-2739 (1992); Johann et al., J. Virol. 66:1635-1640 (1992); Sommnerfelt et al., Virol. 176:58-59 (1990); Wilson et al., J. Virol. 63:2374-2378 (1989); Miller et al., J. Virol. 65:2220-2224 (1991); PCT/US94/05700を参照のこと)。
【0796】
レトロウイルスベクター、特にレンチウイルスベクターは、標的細胞への効率的な組み込みのために所定の長さより小さいポリヌクレオチド配列を必要とし得る。例えば、9 kbを超える長さのレトロウイルスベクターは、より小さいサイズのものと比較して低いウイルス力価をもたらし得る。いくつかの態様において、本開示の塩基エディターは、レトロウイルスベクターを介して効率的なパッケージングおよび標的細胞への送達を可能にするのに十分なサイズである。いくつかの実施形態では、塩基エディターは、ガイド核酸および/または標的化可能なヌクレアーゼシステムの他の構成要素とともに発現された場合でも、効率的なパッキングおよび送達を可能にするサイズである。
【0797】
一過性発現が好ましい用途では、アデノウイルスに基づくシステムを使用することができる。アデノウイルスに基づくベクターは、多くの細胞タイプにおいて非常に高い形質導入効率が可能であり、細胞分裂を必要としない。このようなベクターでは、高い力価および発現レベルが得られている。このベクターは比較的簡単なシステムで大量に生成できる。アデノ随伴ウイルス(「AAV」)ベクターもまた、例えば核酸およびペプチドのin vitro産生において、ならびにin vivoおよびex vivoの遺伝子療法手順のために、標的核酸で細胞を形質導入することに使用され得る(例えば、West et al., Virology 160:38-47 (1987); 米国特許第4,797,368号; WO 93/24641; Kotin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994)を参照のこと)。組換えAAVベクターの構築は、米国特許第5,173,414号; Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); およびSamulski et al., J. Virol. 63:03822-3828 (1989)を含む多くの刊行物に記載されている。
【0798】
AAVはパルボウイルスファミリーに属する小さな一本鎖DNA依存性ウイルスである。4.7 kbの野生型 (wt) AAVゲノムは、それぞれ4つの複製タンパク質および3つのキャプシドタンパク質をコードする2つの遺伝子からなり、いずれかの側に145 bpの逆方向末端反復配列 (ITR) が隣接する。ビリオンは3つのキャプシドタンパク質Vp1、Vp2およびVp3からなり、これらは同じオープンリーディングフレームから1:1:10の比で産生されるが、異なるスプライシング (Vp1) および選択的翻訳開始部位(Vp2とVp3のそれぞれ)から産生される。Vp3はビリオン中に最も豊富に存在するサブユニットであり、細胞表面での受容体認識に関与し、ウイルスの指向性を定義する。ウイルス感染性において機能するホスホリパーゼドメインがVp1のユニークなN末端に同定されている。
【0799】
組換えAAV (rAAV) は、wt AAVと同様に、ベクター導入遺伝子カセットに隣接するシス作用性145 bp ITRを利用し、外来DNAのパッケージングのために最大4.5 kbを提供する。感染後、rAAVは本開示の融合タンパク質を発現することができ、環状のヘッド・トゥー・テール・コンカテマーの状態のエピソームとして存在することにより、宿主ゲノムに組み込まれることなく存続することができる。このシステムを用いたrAAVの成功例は数多くあるが、in vitroおよびin vivoでは、パッケージング能力が限られているため、AAV仲介遺伝子送達の使用は、遺伝子のコード配列の長さがwt AAVゲノムの長さ以上である場合に制限されている。
【0800】
適用に基づいて、ウイルスベクターを選択してもよい。例えばin vivo遺伝子送達に関しては、AAVは他のウイルスベクターよりも好適であり得る。いくつかの実施形態では、AAVベクターは低い毒性を有し、これは、免疫応答を活性化させ得る細胞粒子の超遠心分離を必要としない精製法のためであり得る。いくつかの実施形態では、AAVは、宿主ゲノムに組み込まれないため、挿入突然変異誘発を引き起こす確率を低くする。アデノウイルスは、誘導する免疫原反応が強いため、一般的にワクチンとして用いられる。ウイルスベクターのパッケージング容量は、ベクター内にパッケージング可能な塩基エディターのサイズを制限し得る。
【0801】
AAVは、2つの145塩基末端逆位配列(ITR)を含み、約4.5 Kbまたは4.75 Kbのパッケージング容量を有する。これは、開示する塩基エディターならびにプロモーターおよび転写ターミネーターが単一のウイルスベクター内に収容可能であることを意味する。4.5 Kbまたは4.75 Kbを超える構築物は、ウイルス産生を有意に減少させ得る。例えば、SpCas9は非常に大きく、遺伝子自体が4.1 Kbを超え、AAVに詰め込むことが困難である。従って、本開示の実施形態は、従来の塩基エディターよりも短い長さの開示された塩基エディターを利用することを含む。いくつかの例では、塩基エディターは4 kb未満である。開示される塩基エディターは、4.5 kb、4.4 kb、4.3 kb、4.2 kb、4.1 kb、4 kb、3.9 kb、3.8 kb、3.7 kb、3.6 kb、3.5 kb、3.4 kb、3.3 kb、3.2 kb、3.1 kb、3 kb、2.9 kb、2.8 kb、2.7 kb、2.6 kb、2.5 kb、2 kb、または1.5 kb未満であり得る。いくつかの実施形態では、開示された塩基エディターは、長さ4.5 kb以下である。
【0802】
AAVは、AAV1、AAV2、AAV5、またはそれらの任意の組み合わせであり得る。標的とする細胞に関してAAVのタイプを選択することができる。例えば、AAV血清型1、2、5またはハイブリッドキャプシドAAV1、AAV2、AAV5またはそれらの任意の組み合わせを選択して、脳または神経細胞を標的化することができる;心臓組織を標的とするAAV4を選択してもよい。AAV8は肝臓への送達に有用である。これらの細胞に関する特定のAAV血清型の表は、Grimm, D. et al, J. Virol. 82: 5887-5911 (2008)に見出され得る。
【0803】
レンチウイルスは複雑なレトロウイルスであり、有糸分裂細胞と有糸分裂後細胞の両方に感染してその遺伝子を発現する能力をもつ。最も一般的に知られているレンチウイルスはヒト免疫不全ウイルス (HIV) であり、これは広範囲の細胞タイプを標的とするために他のウイルスのエンベロープ糖タンパク質を使用する。
【0804】
レンチウイルスは以下のように調製できる。(レンチウイルストランスファープラスミド主鎖を含有する)pCasES 10をクローニングした後、低継代(p=5)のHEK293FTを、T-75フラスコ中に播種し、10%ウシ胎児血清を含み、抗生物質を含まないDMEM中でトランスフェクションの前日に50%集密にする。20時間後、培地をOptiMEM (無血清) 培地に変え、トランスフェクションを4時間後に行う。10μgのレンチウイルストランスファープラスミド (pCasES 10) および以下のパッケージングプラスミド:5μgのpMD2.G (VSV-g偽型)および7.5μgのpsPAX2 (gag/pol/rev/tat) で細胞をトランスフェクションする。トランスフェクションは4 mlのOptiMEM中でカチオン性脂質送達剤(50μlのリポフェクタミン2000および100μlのプラス試薬)を用いて行うことができる。6時間後、10%ウシ胎児血清を含む抗生物質不含DMEMに培地を変更する。これらの方法は細胞培養中に血清を用いるが、無血清法が好ましい。
【0805】
レンチウイルスは以下のように精製できる。ウイルス上清を48時間後に採取する。上清からまず破片を除去し、0.45μm低タンパク質結合 (PVDF) フィルターを通して濾過する。次いで、これらを24,000 rpmで2時間、超遠心機で遠心する。ウイルスペレットを50μlのDMEM中に4℃で一晩再懸濁する。次いでそれらをアリコットし、直ちに-80℃で凍結する。
【0806】
別の実施形態では、ウマ伝染性貧血ウイルス (EIAV) に基づく最小の非霊長類レンチウイルスベクターもまた意図される。別の実施形態では、血管新生抑制タンパク質エンドスタチンおよびアンジオスタチンを発現するウマ伝染性貧血ウイルスに基づくレンチウイルス遺伝子療法ベクター、Retinostat(登録商標)を、網膜下注射を介して送達することが意図される。別の実施形態では、自己不活化レンチウイルスベクターの使用が意図される。
【0807】
システムの任意のRNA、例えばガイドRNAまたは塩基エディターをコードするmRNAを、RNAの形態で細胞に送達することができる。塩基エディターをコードするmRNAは、in vitro転写を用いて生成することができる。例えば、ヌクレアーゼmRNAは、以下の要素を含有するPCRカセットを用いて合成することができる:T7プロモーター、任意でコザック配列 (GCCACC) 、ヌクレアーゼ配列、およびベータグロビン-ポリAテール由来の3’UTRなどの3’UTR。このカセットは、T7ポリメラーゼによる転写のために用いられ得る。ガイドポリヌクレオチド(例えばgRNA)もまた、in vitro転写を用いて、T7プロモーター、次いで配列「GG」、およびガイドポリヌクレオチド配列を含有するカセットから転写され得る。
【0808】
発現を増強し、毒性の可能性を低減するために、塩基エディターコード配列および/またはガイド核酸は、1つ以上の修飾ヌクレオシド、例えばプソイドUまたは5-メチル-Cを含むように修飾され得る。
【0809】
AAVベクターのパッケージング容量が小さいため、このサイズを超える多くの遺伝子および/または巨大な生理学的制御エレメントの使用は困難である。例えば、送達すべきタンパク質を2つ以上の断片に分割し、N末端の断片を分割インテイン-Nに融合させ、C末端断片を分割インテイン-Cに融合させることによって、これらの困難に対処してもよい。次いで、これらの断片を2つ以上のAAVベクター内にパッケージングする。本明細書において、「インテイン」は、隣接するN末端およびC末端エクステイン(例えば連結しようとする断片)を連結する、自己スプライシングタンパク質イントロン(例えばペプチド)を指す。異種タンパク質断片を連結するための特定のインテインの使用は、例えばWood et al., J. Biol. Chem. 289(21); 14512-9 (2014) に記載される。例えば、別個のタンパク質断片に融合された場合、インテインIntNおよびIntCは互いを認識し、それ自体をスプライシングして取り出し、融合したタンパク質断片の隣接N末端およびC末端エクステインを同時に連結して、それによって2つのタンパク質断片から全長タンパク質を再構成する。他の適切なインテインは、当業者には明らかであろう。
【0810】
本開示の融合タンパク質の断片は、長さを変えることができる。いくつかの実施形態では、タンパク質断片は、長さ2アミノ酸~約1000アミノ酸の範囲である。いくつかの実施形態では、タンパク質断片は、長さ約5アミノ酸~約500アミノ酸の範囲である。いくつかの実施形態では、タンパク質断片は、長さ約20アミノ酸~約200アミノ酸の範囲である。いくつかの実施形態では、タンパク質断片は、長さ約10アミノ酸~約100アミノ酸の範囲である。他の長さの適切なタンパク質断片は、当業者には明らかであろう。
【0811】
一実施形態では、大きな導入遺伝子発現カセットを2つの別々の半分(5’および3’端、またはヘッドおよびテール)に分割することによって二重AAVベクターが生成され、カセットの各半分が単一のAAVベクター(5 kb未満)内にパッケージングされる。次いで、両方の二重AAVベクターによる同じ細胞の同時感染に続いて、(1) 5’および3’ゲノム(二重AAV重複ベクター)間の相同組換え (HR);(2) ITRを介した5'および3'ゲノム(二重AAVトランススプライシングベクター)のテール・トゥー・ヘッド・コンカテマー化;または (3) それら2つの機構の組み合わせ(二重AAVハイブリッドベクター)により、全長導入遺伝子発現カセットの再構築が達成される。in vivoでの二重AAVベクターの使用は完全長タンパク質の発現をもたらす。二重AAVベクタープラットフォームの使用は、>4.7 kbのサイズの導入遺伝子のための効率的で実行可能な遺伝子導入戦略を表す。
【0812】
インテイン
いくつかの実施形態では、ヌクレアーゼ(例えばCas9)の一部または断片は、インテインに融合される。ヌクレアーゼは、インテインのN末端またはC末端に融合され得る。いくつかの実施形態では、融合タンパク質の一部または断片は、インテインに融合され、AAVキャプシドタンパク質に融合される。インテイン、ヌクレアーゼおよびキャプシドタンパク質は、任意の配置(例えば、ヌクレアーゼ-インテイン-キャプシド、インテイン-ヌクレアーゼ-キャプシド、キャプシド-インテイン-ヌクレアーゼなど)で一緒に融合され得る。いくつかの実施形態では、インテインのN末端は融合タンパク質のC末端に融合され、インテインのC末端はAAVキャプシドタンパク質のN末端に融合される。
【0813】
インテイン(介在タンパク質)は、多種多様な生物に見出される自己プロセシングドメインであり、タンパク質スプライシングとして知られるプロセスを行うものである。タンパク質スプライシングは、ペプチド結合の切断と形成の両方で構成される多段階の生化学的反応である。タンパク質スプライシングの内因性基質は、インテインを含有する生物に見出されるタンパク質であるが、インテインはまた、実質的にあらゆるポリペプチド主鎖を化学的に操作するために使用することもできる。
【0814】
タンパク質スプライシングでは、インテインは、2つのペプチド結合を切断することによって前駆体ポリペプチドから自身を切り出し、それによって、隣接するエクステイン(外部タンパク質)配列を、新しいペプチド結合の形成を介して連結する。この再配置は翻訳後に起こる(翻訳と同時に起こる可能性もある)。インテイン仲介性タンパク質スプライシングは自発的に起こり、インテインドメインの折りたたみだけを必要とする。
【0815】
インテインの約5%が分割インテインであり、これらはN-インテインとC-インテインという2つの別個のポリペプチドとして転写され翻訳され、その各々が1つのエクステインに融合している。翻訳の際に、インテイン断片は、自発的にかつ非共有結合的にカノニカルなインテイン構造へと組み立てられ、トランスにタンパク質スプライシングを行う。タンパク質スプライシングの機構には一連のアシル転移反応が関わっており、これが、インテイン-エクステイン接合部での2つのペプチド結合の切断と、N-エクステインとC-エクステインの間の新しいペプチド結合の形成とをもたらす。このプロセスは、N‐エクステインとインテインのN末端とを連結するペプチド結合の活性化によって開始される。事実上すべてのインテインは、N末端にシステインまたはセリンを有し、これがN-エクステインのC末端残基のカルボニル炭素を攻撃する。このNからO/Sへのアシル基の移動は、保存されたトレオニンとヒスチジン(TXXHモチーフと呼ばれる)とともに、一般的に見出されるアスパラギン酸によって促進され、直鎖状 (チオ)エステル中間体の形成をもたらす。次に、この中間体は、システイン、セリン、またはトレオニンであるC-エクステインの最初の残基 (+1) の求核攻撃によってトランス-(チオ)エステル化される。生成された分枝 (チオ)エステル中間体は、インテインの高度に保存されたC末端アスパラギンの環化というユニークな変換によって、解消される。この過程は、ヒスチジン(高度に保存されたHNFモチーフに見出されるもの)と最後から2番目のヒスチジンによって促進され、アスパラギン酸も関与し得る。このスクシンイミド形成反応は、反応複合体からインテインを切除し、非ペプチド連結を介して付着されたエクステインを残す。この構造は、インテイン非依存方式で迅速に安定なペプチド結合に再編成される。
【0816】
いくつかの実施形態では、塩基エディター(例えばABE、CBE)のN末端断片が分割インテイン-Nに融合され、C末端断片が分割インテイン-Cに融合される。次いで、これらの断片を2つ以上のAAVベクターにパッケージングする。異種タンパク質断片を連結するための特定のインテインの使用は、例えば、Wood et al., J. Biol. Chem. 289(21); 14512-9 (2014) に記載されている。例えば、インテインIntNおよびIntCは、別個のタンパク質断片に融合された場合、互いを認識して、自身をスプライシングして排出し、それと同時に、融合しているタンパク質断片の隣接するN-およびC末端エクステインを連結して、それによって2つのタンパク質断片から全長タンパク質を再構成する。他の適切なインテインは当業者に明らかであろう。
【0817】
いくつかの実施形態では、ABEが、SpCas9の選択された領域内のAla、Ser、ThrまたはCys残基でN-およびC末端断片に分割された。これらの領域は、Cas9結晶構造分析により同定されたループ領域に対応する。各断片のN末端をインテイン-Nに融合させ、各断片のC末端を、下記配列で太字の大文字で示されている、アミノ酸位S303、T310、T313、S355、A456、S460、A463、T466、S469、T472、T474、C574、S577、A589、およびS590でインテインCに融合させた。
1 mdkkysigld igtnsvgwav itdeykvpsk kfkvlgntdr hsikknliga llfdsgetae
61 atrlkrtarr rytrrknric ylqeifsnem akvddsffhr leesflveed kkherhpifg
121 nivdevayhe kyptiyhlrk klvdstdkad lrliylalah mikfrghfli egdlnpdnsd
181 vdklfiqlvq tynqlfeenp inasgvdaka ilsarlsksr rlenliaqlp gekknglfgn
241 lialslgltp nfksnfdlae daklqlskdt ydddldnlla qigdqyadlf laaknlsdai
301 llSdilrvnT eiTkaplsas mikrydehhq dltllkalvr qqlpekykei ffdqSkngya
361 gyidggasqe efykfikpil ekmdgteell vklnredllr kqrtfdngsi phqihlgelh
421 ailrrqedfy pflkdnreki ekiltfripy yvgplArgnS rfAwmTrkSe eTiTpwnfee
481 vvdkgasaqs fiermtnfdk nlpnekvlpk hsllyeyftv yneltkvkyv tegmrkpafl
541 sgeqkkaivd llfktnrkvt vkqlkedyfk kieCfdSvei sgvedrfnAS lgtyhdllki
601 ikdkdfldne enedilediv ltltlfedre mieerlktya hlfddkvmkq lkrrrytgwg
661 rlsrklingi rdkqsgktil dflksdgfan rnfmqlihdd sltfkediqk aqvsgqgdsl
721 hehianlags paikkgilqt vkvvdelvkv mgrhkpeniv iemarenqtt qkgqknsrer
781 mkrieegike lgsqilkehp ventqlqnek lylyylqngr dmyvdqeldi nrlsdydvdh
841 ivpqsflkdd sidnkvltrs dknrgksdnv pseevvkkmk nywrqllnak litqrkfdnl
901 tkaergglse ldkagfikrq lvetrqitkh vaqildsrmn tkydendkli revkvitlks
961 klvsdfrkdf qfykvreinn yhhahdayln avvgtalikk ypklesefvy gdykvydvrk
1021 miakseqeig katakyffys nimnffktei tlangeirkr plietngetg eivwdkgrdf
1081 atvrkvlsmp qvnivkktev qtggfskesi lpkrnsdkli arkkdwdpkk yggfdsptva
1141 ysvlvvakve kgkskklksv kellgitime rssfeknpid fleakgykev kkdliiklpk
1201 yslfelengr krmlasagel qkgnelalps kyvnflylas hyeklkgspe dneqkqlfve
1261 qhkhyldeii eqisefskrv iladanldkv lsaynkhrdk pireqaenii hlftltnlga
1321 paafkyfdtt idrkrytstk evldatlihq sitglyetri dlsqlggd
【0818】
薬学的組成物
本開示の他の態様は、本明細書に記載する塩基エディター、融合タンパク質、または融合タンパク質-ガイドポリヌクレオチド複合体のいずれかを含む薬学的組成物に関する。いくつかの実施形態では、薬学的組成物は、薬学的に許容され得るキャリアーをさらに含む。いくつかの実施形態では、薬学的組成物は、追加の剤(例えば特異的送達、半減期の延長のためのもの、または他の療法化合物)を含む。
【0819】
薬学的に許容され得るキャリアーとして役立つことができる物質のいくつかの非限定的な例は、以下を含む: (1) ラクトース、グルコースおよびスクロースのような糖;(2) コーンスターチ、ジャガイモデンプン等のデンプン;(3) セルロースおよびその誘導体、例えばカルボキシメチルセルロースナトリウム、メチルセルロース、エチルセルロース、微結晶セルロース、酢酸セルロース;(4) トラガント末;(5) モルト;(6)ゼラチン;(7) ステアリン酸マグネシウム、ラウリル硫酸ナトリウム、タルク等の潤滑剤;(8) ココアバター、坐剤用ワックス等の賦形剤;(9) 落花生油、綿実油、ベニバナ油、ゴマ油、オリーブ油、コーン油、大豆油等の油;(10) プロピレングリコール等のグリコール;(11) ポリオール、例えばグリセリン、ソルビトール、マンニトールおよびポリエチレングリコール (PEG); (12) エステル、例えばオレイン酸エチルおよびラウリン酸エチル;(13) 寒天;(14) 水酸化マグネシウム、水酸化アルミニウム等の緩衝剤;(15) アルギン酸;(16) 発熱物質不含水;(17) 等張食塩液;(18) リンゲル液;(19)エチルアルコール;(20) pH緩衝液;(21) ポリエステル、ポリカーボネートおよび/またはポリ無水物;(22) ポリペプチドおよびアミノ酸のような増量剤 (23) エタノールのような血清アルコール;および (23) 製剤処方に使用される他の非毒性適合性物質。緩衝剤、湿潤剤、乳化剤、希釈剤、被包剤、皮膚浸透性増進剤、着色剤、放出剤、コーティング剤、甘味剤、フレーバー剤、香料、保存剤および酸化防止剤も配合物中に存在させることができる。例えば、キャリアーには、限定されるわけではないが、生理食塩水、緩衝生理食塩水、デキストロース、アルギニン、スクロース、水、グリセロール、エタノール、ソルビトール、デキストラン、カルボキシメチルセルロースナトリウム、およびその組み合わせが含まれ得る。
【0820】
薬学的組成物は、約5.0~約8.0の範囲などの生理学的pHを反映するあらかじめ決定されたレベルに配合物のpHを維持するために、1つ以上のpH緩衝化合物を含むことができる。水性液体配合物で使用されるpH緩衝化合物は、アミノ酸またはヒスチジンなどのアミノ酸の混合物、またはヒスチジンおよびグリシンなどのアミノ酸の混合物であり得る。あるいは、いくつかの実施形態では、pH緩衝化合物は、配合物のpHをあらかじめ決定されたレベル、例えば約5.0~約8.0の範囲に維持し、カルシウムイオンをキレートしない剤である。このようなpH緩衝化合物の例示的な例には、イミダゾールおよび酢酸イオンが含まれるが、これらに限定されない。pH緩衝化合物は、配合物のpHをあらかじめ決定されたレベルに維持するのに適した任意の量で存在し得る。
【0821】
薬学的組成物はまた、1つ以上の浸透圧調節剤、すなわち、配合物の浸透圧特性(例えば、等張性、モル浸透圧濃度、および/または浸透圧)を、レシピエント個体の血流および血液細胞にとって許容可能なレベルに調節する化合物を含有することができる。浸透圧調節剤は、カルシウムイオンをキレートしない薬剤であり得る。浸透圧調節剤は、配合物の浸透圧特性を調節する当業者に公知または入手可能な任意の化合物であり得る。当業者は、本発明の配合物における使用のための所定の浸透圧調節剤の適合性を経験的に決定することができる。適切なタイプの浸透圧調節剤の例示的な例には、塩化ナトリウムおよび酢酸ナトリウムのような塩;スクロース、デキストロース、マンニトールなどの糖;グリシンなどのアミノ酸;これらの剤および/または剤タイプの1つ以上の混合物が含まれるが、これらに限定されない。浸透圧調節剤(複数可)は、配合物の浸透圧特性を調節するのに十分な任意の濃度で存在し得る。
【0822】
いくつかの実施形態では、薬学的組成物は、対象への送達のために、例えば遺伝子編集のために配合される。いくつかの実施形態では、本明細書で企図される薬学的組成物の投与は、限定なしに、注入、輸注、または非経口を含む慣用技術を用いて実行され得る。いくつかの実施形態では、非経口投与には、血管内、静脈内、筋内、動脈内、クモ膜下腔内、腫瘍内、皮内、腹腔内、経気管、皮下、表皮下、関節内、嚢下、クモ膜下、および胸骨内の注入または注射が含まれる。いくつかの実施形態では、本明細書に記載の薬学的組成物を投与する適切な経路は、限定されるものではないが、局所、皮下、経皮、皮内、病巣内、関節内、腹腔内、膀胱内、経粘膜、歯肉、歯内、蝸牛内、鼓室内(transtympanic)、臓器内、硬膜外、クモ膜下腔内、筋内、静脈内、血管内、骨内、眼周囲、腫瘍内、脳内、および脳室内投与を含む。
【0823】
いくつかの実施形態では、本明細書に記載される薬学的組成物は、患部(例えば腫瘍部位)に局所的に投与される。いくつかの実施形態では、本明細書に記載される薬学的組成物は、注射、カテーテル、坐剤、またはインプラントによって、対象に投与され、インプラントは、多孔質、非多孔質、またはゼラチン質材料であり、例えば、シアラスティック(sialastic)膜、または繊維などの膜を含む。
【0824】
他の実施形態では、本明細書に記載される薬学的組成物は、制御放出システムにおいて送達される。一実施形態では、ポンプを使用することができる(例えばLanger, 1990, Science 249: 1527-1533; Sefton, 1989, CRC Crit. Ref. Biomed. Eng. 14:201; Buchwald et al., 1980, Surgery 88:507; Saudek et al., 1989, N. Engl. J. Med. 321:574を参照のこと)。別の実施形態では、ポリマー材料を使用することができる。(例えばMedical Applications of Controlled Release (Langer and Wise eds., CRC Press, Boca Raton, Fla., 1974); Controlled Drug Bioavailability, Drug Product Design and Performance (Smolen and Ball eds., Wiley, New York, 1984); Ranger and Peppas, 1983, Macromol. Sci. Rev. Macromol. Chem. 23:61。Levy et al., 1985, Science 228: 190; During et al., 1989, Ann. Neurol. 25:351; Howard et ah, 1989, J. Neurosurg. 71: 105.もまた参照されたい)。他の制御放出システムは、例えば、上記Langerに記載されている。
【0825】
いくつかの実施形態では、薬学的組成物は、対象、例えばヒトへの静脈内または皮下投与に適合された組成物として、ルーチンの手順に従って配合される。いくつかの実施形態では、注射による投与のための薬学的組成物は、可溶化剤としての無菌等張使用の溶液および注射部位の痛みを緩和するためのリグノカインなどの局所麻酔薬である。一般に、成分は、単位投与形態、例えば、活性剤の量を示すアンプルまたはサシェ剤(sachette)のような密閉容器内の乾燥凍結乾燥粉末または水を含まない濃縮物として、別々にまたは一緒に供給される。薬剤が注入によって投与される場合には、無菌の医薬等級の水または生理食塩水を含有する注入ボトルを用いてそれを分注することができる。薬学的組成物が注射によって投与される場合、投与前に成分を混合することができるように、注射用滅菌水または生理食塩水のアンプルを提供することができる。
【0826】
全身投与のための薬学的組成物は、液体、例えば滅菌生理食塩水、乳酸化リンゲル液またはハンク液であり得る。さらに、薬学的組成物は、固体形態であって、使用の直前に再溶解または懸濁され得る。凍結乾燥型もまた考えられる。薬学的組成物は、非経口投与にも適した、リポソームまたは微結晶などの脂質粒子または小胞内に含有されることができる。粒子は、組成物がその中に含まれる限り、単層または多層(plurilamellar)のような任意の適切な構造であり得る。化合物は、融合性脂質ジオレオイルホスファチジルエタノールアミン(DOPE)、低レベル(5~10モル%)のカチオン性脂質を含み、ポリエチレングリコール (PEG) コーティングにより安定化された、「安定化プラスミド脂質粒子」(SPLP)中に捕捉され得る (Zhang Y. P. et al, Gene Ther. 1999, 6: 1438-47)。このような粒子および小胞には、N-[l-(2,3-ジオレオイルキシ)プロピル]-N,N,N-トリメチル-アンモニウムメチル硫酸塩、あるいは「DOTAP」のような正電荷脂質が特に好ましい。このような脂質粒子の調製はよく知られている。例えば、米国特許第4,880,635号; 第4,906,477号; 第4,911,928号; 第4,917,951号; 第4,920,016号;および第4,921,757号を参照のこと(その各々は、参照により本明細書に組み込まれる)。
【0827】
本明細書に記載の薬学的組成物は、例えば、単位用量として投与またはパッケージングすることができる。「単位用量」という用語は、本開示の薬学的組成物に関して使用される場合、対象のための単一用量として適した物理的に個別の単位を指し、各単位は、必要な希釈剤、すなわちキャリアー、またはビヒクルと合わせて所望の療法効果を生じるように計算された、あらかじめ決定された量の活性物質を含有する。
【0828】
さらに、薬学的組成物は、 (a) 凍結乾燥型の本開示の化合物を含有する容器、および (b) 本開示の凍結乾燥化合物の再構成または希釈のために使用される、薬学的に許容される希釈剤 (例えば無菌のもの) を含有する第二の容器を含む薬学的キットとして提供することができる。任意に、そのような容器(複数可)には、医薬品または生物学的製剤の製造、使用または販売を規制する政府機関によって規定された様式の通知であって、ヒトに投与するための製造、使用または販売の機関による承認を反映するものが付随してもよい。
【0829】
別の態様では、レット症候群(RTT)の治療に有用な材料を含有する製品が含まれる。いくつかの実施形態では、製品は、容器およびラベルを含む。適切な容器は、例えばボトル、バイアル、シリンジ、および試験管を含む。容器は、ガラスまたはプラスチックなどの多様な材料から形成することができる。いくつかの実施形態では、容器は、本明細書に記載される疾患を治療するために有効である組成物を保持し、無菌アクセスポートを有し得る。例えば、容器は、静脈内溶液バッグ、または皮下注射針によって穿刺可能なストッパーを有するバイアルであり得る。組成物中の活性剤は、本開示の化合物である。いくつかの実施形態では、容器上のまたは容器に付随するラベルは、選択される疾患を治療するために組成物が使用されることを示す。製品は、リン酸緩衝生理食塩水、リンゲル液、またはデキストロース溶液などの薬学的に許容され得る緩衝液を含む第二の容器をさらに含むことができる。さらに、他の緩衝剤、希釈剤、フィルター、針、シリンジ、および使用説明書付き添付文書を含め、商業的観点および使用者の観点から望ましい他の物質を含むことができる。
【0830】
いくつかの実施形態では、本明細書に記載される融合タンパク質、gRNA、および/または複合体のいずれかは、薬学的組成物の一部として提供される。いくつかの実施形態では、薬学的組成物は、本明細書に提供される融合タンパク質のいずれかを含む。いくつかの実施形態では、薬学的組成物は、本明細書に提供される複合体のいずれかを含む。いくつかの実施形態では、薬学的組成物は、gRNAおよびカチオン性脂質と複合体を形成するRNA-ガイドヌクレアーゼ(例えばCas9)を含むリボ核タンパク質複合体を含む。いくつかの実施形態では、薬学的組成物は、gRNA、核酸プログラム可能DNA結合タンパク質、カチオン性脂質、および薬学的に許容され得る賦形剤を含む。薬学的組成物は、場合により、1つ以上の追加の療法活性物質を含むことができる。
【0831】
いくつかの実施形態では、本明細書で提供される組成物は、対象内で標的化ゲノム修飾を行うために、対象、例えばヒト対象に投与される。いくつかの実施形態では、細胞が対象から取得され、本明細書に提供される薬学的組成物のいずれかと接触される。いくつかの実施形態では、対象から取り除かれ、ex vivoで薬学的組成物と接触された細胞は、随意に、細胞において所望のゲノム修飾が達成されたかまたは検出された後に、対象内に再導入される。ヌクレアーゼを含む薬学的組成物を送達する方法は公知であり、例えば、米国特許第6,453,242号; 第6,503,717号; 第6,534,261号; 第6,599,692号; 第6,607,882号; 第6,689,558号; 第6,824,978号; 第6,933,113号; 第6,979,539号; 第7,013,219号; および第7,163,824号に記載されており、その開示全体が参照により本明細書に組み込まれる。本明細書に提供される薬学的組成物の説明は、主に、ヒトへの投与に適した薬学的組成物に向けられているが、そのような組成物は、一般に、あらゆる種類の動物または生物への投与、例えば、獣医学的使用に適していることが、当業者によって理解されるであろう。
【0832】
多様な動物への投与に適した組成物を与えるための、ヒトへの投与に適した薬学的組成物の修飾は十分に理解されており、通常の熟練した獣医薬理学者は、もし必要だとしても単に通常の実験で、そのような修飾を設計および/または実施することができる。薬学的組成物の投与が意図される対象には、限定されるものではないが、ヒトおよび/または他の霊長類;哺乳動物、家畜、ペット、およびウシ、ブタ、ウマ、ヒツジ、ネコ、イヌ、マウス、および/またはラットなどの商業的に関連のある哺乳動物;ならびに/あるいはニワトリ、カモ、ガチョウおよび/または七面鳥のような商業的に関連のある鳥類を含む鳥類が含まれる。
【0833】
本明細書に記載される薬学的組成物の配合物は、薬学の分野において公知の、または今後開発される任意の方法によって調製することができる。一般に、このような調製法は、活性成分(複数可)を賦形剤および/または1つ以上の他の補助成分と会合させ、次いで、必要および/または所望であれば、製品を所望の単回または複数回投与単位に成形および/またはパッケージングする工程を含む。薬学的配合物はさらに、薬学的に許容され得る賦形剤を含むことができ、それは、本明細書で使用される場合、所望の特定の剤形に適した、あらゆる溶媒、分散媒体、希釈剤、または他の液体ビヒクル、分散または懸濁助剤、界面活性剤、等張剤、増粘剤または乳化剤、保存剤、固体結合剤、潤滑剤などを含む。Remington’s The Science and Practice of Pharmacy, 21st Edition, A. R. Gennaro (Lippincott, Williams & Wilkins, Baltimore, MD, 2006(参照によりその全体が本明細書に組み込まれる)は、薬学的組成物を配合する際に使用される多様な賦形剤およびその調製のための公知の技術を開示する。ヌクレアーゼを含む薬学的組成物を製造するためのさらなる適切な方法、試薬、賦形剤および溶媒については、参照によりその全体が本明細書に組み込まれるPCT出願PCT/US2010/055131(2010年11月2日出願、公開番号WO2011/053982 A8) も参照のこと。
【0834】
あらゆる慣用的な賦形剤媒体は、望ましくない生物学的効果を生じさせること、またはそうでなければ薬学的組成物の何らかの他の構成要素(複数可)と有害な様式で相互作用することなどによって、物質またはその誘導体と不適合である場合を除き、その使用が本開示の範囲内にあると意図される。
【0835】
上記の組成物は、有効量で投与することができる。有効量は、投与様式、治療される特定の状態、および所望の結果に依存する。それはまた、状態のステージ、対象の年齢および身体的状態、もしあれば併用療法の性質、および医師によく知られた同様の要因に依存し得る。療法用途のためには、それは医学的に望ましい結果を達成するのに十分な量である。
【0836】
RETTを治療する方法
レット症候群(RTTまたはRETT)および/またはRETTを引き起こすMecp2中の遺伝子突然変異を治療する方法であって、対象(例えば哺乳動物、例えばヒト)に、本明細書記載の塩基エディターシステム(例えばABE8塩基エディターおよびgRNA)をコードするポリヌクレオチドを含む薬学的組成物の療法的有効量を投与する工程を含む、方法もまた提供する。いくつかの実施形態では、塩基エディターは、ポリヌクレオチドプログラム可能DNA結合ドメインおよびアデノシンデアミナーゼドメインを含む融合タンパク質である。対象の細胞に、塩基エディター、および塩基エディターを標的指向化して、Mecp2遺伝子中で突然変異を含有する核酸配列のA・TからG・Cへの改変をもたらす1つ以上のガイドポリヌクレオチドを形質導入する。
【0837】
本明細書の方法には、対象(こうした治療が必要であると同定された対象、または疾患のリスクがあり、こうした治療を必要とすると推測される対象)に、本明細書記載の組成物の有効量を投与する工程が含まれる。こうした治療を必要とする対象の同定は、対象またはヘルスケア専門家の判断によってもよく、主観的(例えば意見)または客観的(例えば試験または診断法によって測定可能)であってもよい。
【0838】
療法は、一般的に、例えば、治療が必要な対象(例えばヒト患者)のMecp2遺伝子を標的とする塩基エディターおよびgRNAをコードするベクターを含む、薬学的組成物の療法的有効量を投与する工程を含む。こうした治療は、RTTを患うか、有するか、RTTに感受性があるか、またはRTTのリスクがある対象、特にヒト対象に適切に投与される。本明細書の組成物はまた、RTTが関与している可能性がある任意の他の障害の治療に用いられることも可能である。
【0839】
一実施形態では、治療進行をモニターする方法を提供する。方法には、RTTに関連する障害またはその症状を患うかまたはこれらに感受性である対象において、診断マーカー(マーカー)(例えばRTTと関連するSNP)レベルまたは診断測定(例えばスクリーン、アッセイ)を決定する工程を含み、ここで対象は、疾患またはその症状を治療するために十分な本明細書の組成物の療法的有効量を投与されている。方法で決定するマーカーのレベルを、健康な正常対照または他の罹患患者のいずれかにおけるマーカーの既知のレベルに比較して、対象の疾患状態を確立することも可能である。好ましい実施形態では、対象において、第一のレベルの決定より遅い時点で、マーカーの第二のレベルを決定し、2つのレベルを比較して、疾患の経過または療法の有効性をモニターする。特定の好ましい実施形態では、本開示の方法にしたがった治療を開始する前に、対象におけるマーカーの治療前レベルを決定し、次いで、マーカーのこの治療前レベルを、治療を開始した後の対象におけるマーカーレベルに比較して、治療の有効性を決定することも可能である。
【0840】
いくつかの実施形態では、対象から細胞を得て、本明細書に提供するような薬学的組成物と接触させる。いくつかの実施形態では、対象から取り除き、ex vivoで薬学的組成物と接触させた細胞を、任意選択で、細胞において、所望のゲノム改変が影響を受けたか検出した後、対象内に再導入する。ヌクレアーゼを含む薬学的組成物を送達する方法は、例えば、米国特許第米国特許第6,453,242号; 第6,503,717号; 第6,534,261号; 第6,599,692号; 第6,607,882号; 第6,689,558号; 第6,824,978号; 第6,933,113号; 第6,979,539号; 第7,013,219号; および第7,163,824号に記載されており、その開示全体が参照により本明細書に組み込まれる。本明細書に提供される薬学的組成物の説明は、主に、ヒトへの投与に適した薬学的組成物に向けられているが、そのような組成物は、一般に、あらゆる種類の動物または生物への投与、例えば、獣医学的使用に適していることが、当業者によって理解されるであろう。
【0841】
キット
本開示の多様な態様は、塩基エディターシステムを含むキットを提供する。一実施形態では、キットは、核酸塩基エディター融合タンパク質をコードするヌクレオチド配列を含む核酸構築物を含む。一実施形態では、この融合タンパク質は、アデニンデアミナーゼおよび核酸プログラム可能DNA結合タンパク質(napDNAbp)を含む。いくつかの実施形態では、キットは、関心対象の核酸分子、例えばMecp2 RTT関連突然変異を標的化可能である少なくとも1つのガイドRNAを含む。いくつかの実施形態では、キットは、少なくとも1つのガイドRNAをコードするヌクレオチド配列を含む核酸構築物を含む。
【0842】
キットは、いくつかの実施形態では、1つ以上のMecp2 RTT関連突然変異を編集するためにキットを使用するための説明書を提供する。説明書は、一般に、核酸分子を編集するためのキットの使用に関する情報を含む。他の実施形態では、説明書は、以下のうちの少なくとも1つを含む:注意事項;警告;臨床試験;および/または参考資料。使用説明書は、容器(もしあれば)に直接印刷するか、容器に貼付するラベルとして印刷するか、または容器内にもしくは容器とともに提供される独立したシート、パンフレット、カードまたはフォルダーとして印刷され得る。さらなる実施形態では、キットは、適切な動作パラメータのためのラベルまたは別個のインサート(添付文書)の形態で説明書を含むことができる。さらに別の実施形態では、キットは、検出、較正、または正規化のための標準(複数可)として使用される、適切な陽性および陰性対照または対照試料を有する1つ以上の容器を含むことができる。キットは、(滅菌) リン酸緩衝生理食塩水、リンゲル液、またはデキストロース溶液などの薬学的に許容され得る緩衝液を含む第二の容器をさらに含むことができる。さらに、他の緩衝剤、希釈剤、フィルター、針、シリンジ、および使用説明書付きの添付文書を含む、商業的観点および使用者の観点から望ましい他の物質を含むことができる。
【0843】
特定の実施形態では、キットはレット症候群を有する対象の治療に有用である。
【0844】
本開示は以下の実施形態を含む。
実施形態1
対象においてメチルCpG結合タンパク質2(MECP2)遺伝子またはその制御エレメントを編集する方法であって、必要とする対象に、(i)アデノシン塩基エディターまたはそれをコードする核酸配列、および(ii)ガイドポリヌクレオチドまたはそれをコードする核酸配列を投与する工程を含み、ここでアデノシン塩基エディターはプログラム可能DNA結合ドメインおよびアデノシンデアミナーゼドメインを含み、アデノシンデアミナーゼドメインは、TadA参照配列に比較してアミノ酸82位もしくは166位またはそれに対応する位にアミノ酸置換を含み、かつガイドポリヌクレオチドは、アデノシン塩基エディターを誘導して、レット症候群(RETT)と関連するSNPを含むMECP2遺伝子またはその制御エレメントにおいて、AからGへの核酸塩基改変をもたらし、ここで、前記AからGへの核酸塩基改変はRETTと関連するSNPにおけるものであり、MECP2遺伝子によってコードされるMECP2ポリペプチドまたはそのバリアントにおいて、R133CまたはR306Cアミノ酸突然変異を生じる、前記方法。
実施形態2
TadA参照配列がアミノ酸配列
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
を含む、実施形態1に記載の方法。
実施形態3
AからGへの核酸塩基改変が、RETTと関連するSNPを、野生型核酸塩基に変化させる、実施形態1または実施形態2に記載の方法。
実施形態4
AからGへの核酸塩基改変が、RETTと関連するSNPを、RETTの1つ以上の症状の改善をもたらす非野生型核酸塩基に変化させる、実施形態1または実施形態2に記載の方法。
実施形態5
RETTと関連するSNPでのAからGへの核酸塩基改変が、メチルCpG結合タンパク質2(MECP2)ポリペプチドにおいて、システインをアルギニンにまたは停止コドンをアルギニンに変化させる、実施形態1~4のいずれか一項に記載の方法。
実施形態6
RETTと関連するSNPが、アミノ酸133位および/または306位にアルギニンを含むMECP2ポリペプチドの発現を生じる、実施形態1~5のいずれか一項に記載の方法。
実施形態7
ガイドポリヌクレオチドが、RETTと関連するSNPを含むMECP2遺伝子またはその制御エレメントに相補的な核酸配列を含む、実施形態1~6のいずれか一項に記載の方法。
実施形態8
アデノシン塩基エディターが、RETTと関連するSNPを含むMECP2遺伝子またはその制御エレメントに相補的な核酸配列を含むシングルガイドRNA(sgRNA)と複合体を形成している、実施形態1~7のいずれか一項に記載の方法。
実施形態9
ガイドポリヌクレオチドが、
5′-AGAGCAAAAGGCUUUUCCCU-3′, 5′-UAGAGCAAAAGGCUUUUCCC-3′, 5′-UAGAGCAAAAGGCUUUUCCCU-3′, 5′-UUUAGAGCAAAAGGCUUUUCCCU-3′, 5′-UCUUGCACUUCUUGAUGGGG-3′, 5′-CUUGCACUUCUUGAUGGGGAG-3′, または 5′-GUCUUGCACUUCUUGAUGGGGAG-3′
より選択される核酸配列を含む、実施形態8に記載の方法。
実施形態10
(i)アデノシン塩基エディターまたはそれをコードする核酸配列、および(ii)ガイドポリヌクレオチドまたはそれをコードする核酸配列を含む塩基エディターシステムであって、アデノシン塩基エディターがプログラム可能DNA結合ドメインおよびアデノシンデアミナーゼドメインを含み、アデノシンデアミナーゼドメインが、TadA参照配列に比較してアミノ酸82位もしくは166位またはそれに対応する位にアミノ酸置換を含み、かつガイドポリヌクレオチドが、アデノシン塩基エディターを誘導して、レット症候群(RETT)と関連するSNPを含むメチルCpG結合タンパク質2(MECP2)遺伝子またはその制御エレメントにおいて、AからGへの核酸塩基改変をもたらし;ここで、前記AからGへの核酸塩基改変がRETTと関連するSNPにおけるものであり、MECP2遺伝子によってコードされるMECP2ポリペプチドまたはそのバリアントにおいて、R133CまたはR306Cアミノ酸突然変異を生じる、前記塩基エディターシステム。
実施形態11
AからGへの核酸塩基改変が、RETTと関連するSNPを野生型核酸塩基に変化させる、実施形態10に記載の塩基エディターシステム。
実施形態12
AからGへの核酸塩基改変が、RETTと関連するSNPを、RETTの1つ以上の改善された症状をもたらす非野生型核酸塩基に変化させる、実施形態10に記載の塩基エディターシステム。
実施形態13
RETTと関連するSNPが、アミノ酸133位および/または306位でアルギニンを含むMECP2ポリペプチドの発現を生じる、実施形態10~12のいずれか一項に記載の塩基エディターシステム。
実施形態14
ガイドポリヌクレオチドが、RETTと関連するSNPを含むMECP2遺伝子またはその制御エレメントに相補的な核酸配列を含む、実施形態10~13のいずれか一項に記載の塩基エディターシステム。
実施形態15
アデノシン塩基エディターが、RETTと関連するSNPを含むMECP2遺伝子またはその制御エレメントに相補的な核酸配列を含むシングルガイドRNA(sgRNA)と複合体を形成する、実施形態10~14のいずれか一項に記載の塩基エディターシステム。
実施形態16
ガイドポリヌクレオチドが
5′-AGAGCAAAAGGCUUUUCCCU-3′, 5′-UAGAGCAAAAGGCUUUUCCC-3′, 5′-UAGAGCAAAAGGCUUUUCCCU-3′, 5′-UUUAGAGCAAAAGGCUUUUCCCU-3′, 5′-UCUUGCACUUCUUGAUGGGG-3′, 5′-CUUGCACUUCUUGAUGGGGAG-3′, または 5′-GUCUUGCACUUCUUGAUGGGGAG-3′
より選択される核酸配列を含む、実施形態15に記載の塩基エディターシステム。
実施形態17
レット症候群(RETT)と関連する一塩基多型(SNP)を含むMECP2ポリヌクレオチドを編集する方法であって、MECP2ポリヌクレオチドを、1つ以上のガイドポリヌクレオチドと複合体を形成したアデノシンデアミナーゼ塩基エディター8(ABE8)と接触させる工程を含み、ABE8がポリヌクレオチドプログラム可能DNA結合ドメインおよびアデノシンデアミナーゼドメインを含み、前記ガイドポリヌクレオチドの1つ以上が、前記塩基エディターを標的指向化して、RETTと関連するMECP2ポリヌクレオチド中のSNPのA・TからG・Cへの改変をもたらし、改変がR133CまたはR306Cの一方または両方である、前記方法。
実施形態18
接触が、細胞、真核細胞、哺乳動物細胞、またはヒト細胞中である、実施形態17に記載の方法。
実施形態19
細胞がin vivoまたはex vivoである、実施形態17または実施形態18に記載の方法。
実施形態20
RETTと関連するSNPでのA・TからG・Cへの改変が、メチルCpG結合タンパク質2(Mecp2)ポリペプチドにおいて、システインをアルギニンに、または停止コドンをアルギニンに変化させる、実施形態17~19のいずれか一項に記載の方法。
実施形態21
RETTと関連するSNPが、アミノ酸133位および/または306位でアルギニンを含むMECP2ポリペプチドの発現を生じる、実施形態17~20のいずれか一項に記載の方法。
実施形態22
ポリヌクレオチドプログラム可能DNA結合ドメインが、Streptococcus pyogenes Cas9(SpCas9)、Staphylococcus aureus Cas9(SaCas9)、Streptococcus thermophilus1 Cas9(St1Cas9)、Streptococcus canis Cas9(ScCas9)、またはそのバリアントから選択されるCas9である、実施形態17~21のいずれか一項に記載の方法。
実施形態23
ポリヌクレオチドプログラム可能DNA結合ドメインが、改変されたプロトスペーサー隣接モチーフ(PAM)に結合する改変SpCas9を含む、実施形態17~22のいずれか一項に記載の方法。
実施形態24
改変SpCas9が、5'-NGT-3'または5'-NGG-3'より選択される核酸配列を含むPAMに結合する、実施形態23に記載の方法。
実施形態25
改変SpCas9がNGT PAMバリアントに結合する、実施形態23に記載の方法。
実施形態26
NGT PAMバリアントが、改変SpCas9の残基1335、1337、1135、1136、1218、および/または1219の1つ以上でのアミノ酸置換、またはそれに対応するアミノ酸置換を含む、実施形態24または実施形態25に記載の方法。
実施形態27
改変SpCas9が、アミノ酸置換L1111R、D1135V、G1218R、E1219F、A1322R、R1335V、T1337R ならびに1つ以上のL1111、D1135L、S1136R、G1218S、E1219V、D1332A、D1332S、D1332T、D1332V、D1332L、D1332K、D1332R、R1335Q、T1337、T1337L、T1337Q、T1337I、T1337V、T1337F、T1337S、T1337N、T1337K、、T1337H、T1337Q、およびT1337M、またはそれに対応するアミノ酸置換を含む、実施形態23~25のいずれか一項に記載の方法。
実施形態28
改変SpCas9が、アミノ酸置換D1135L、S1136R、G1218S、E1219V、A1322R、R1335Q、およびT1337、ならびに1つ以上のL1111R、G1218R、E1219F、D1332A、D1332S、D1332T、D1332V、D1332L、D1332K、D1332R、T1337L、T1337I、T1337V、T1337F、T1337S、T1337N、T1337K、T1337R、T1337H、T1337Q、およびT1337M、またはそれに対応するアミノ酸置換を含む、実施形態23~25のいずれか一項に記載の方法。
実施形態29
ポリヌクレオチドプログラム可能DNA結合ドメインが、ヌクレアーゼ不活性またはニッカーゼバリアントである、実施形態17~28のいずれか一項に記載の方法。
実施形態30
ニッカーゼバリアントが、アミノ酸置換D10Aまたはそれに対応するアミノ酸置換を含む、実施形態29に記載の方法。
実施形態31
アデノシンデアミナーゼドメインが、デオキシリボ核酸(DNA)中のアデノシンを脱アミノ化することが可能である、実施形態17~30のいずれか一項に記載の方法。
実施形態32
アデノシンデアミナーゼドメインが、
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸位82位および/または166位で改変を含む、実施形態17~31のいずれか一項に記載の方法。
実施形態33
アデノシンデアミナーゼドメインが、アミノ酸位82位および166位で改変を含む、実施形態32に記載の方法。
実施形態34
アデノシンデアミナーゼドメインが、V82S改変、T166R改変、またはV82SおよびT166R改変の両方より選択される改変を含む、実施形態32に記載の方法。
実施形態35
アデノシンデアミナーゼドメインが、以下の改変:Y147T、Y147R、Q154S、Y123H、およびQ154Rの1つ以上をさらに含む、実施形態32~34のいずれか一項に記載の方法。
実施形態36
アデノシンデアミナーゼドメインが:
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; および I76Y + V82S + Y123H + Y147R + Q154R
からなる群より選択される改変を含む、実施形態32~35のいずれか一項に記載の方法。
実施形態37
ABE8が、V82SおよびT166R改変を含むアデノシンデアミナーゼバリアントモノマーを含む、実施形態17~36のいずれか一項に記載の方法。
実施形態38
ABE8が、野生型アデノシンデアミナーゼドメインおよびアデノシンデアミナーゼバリアントを含む、アデノシンデアミナーゼヘテロダイマーを含む、実施形態17~37のいずれか一項に記載の方法。
実施形態39
アデノシンデアミナーゼバリアントモノマーが、Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154Rからなる群より選択される1つ以上の改変をさらに含む、実施形態37に記載の方法。
実施形態40
ABE8が、TadA*8ドメインおよび野生型TadAドメインを含むアデノシンデアミナーゼヘテロダイマーを含む、実施形態17に記載の方法。
実施形態41
アデノシンデアミナーゼモノマーが、Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154Rからなる群より選択される改変をさらに含む、実施形態37に記載の方法。
実施形態42
ABE8塩基エディターが、野生型TadAドメインと、
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; および I76Y + V82S + Y123H + Y147R + Q154R
からなる群より選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントとを含む、ヘテロダイマーを含む、実施形態17に記載の方法。
実施形態43
ガイドポリヌクレオチドが、
AGAGCAAAAGGCUUUUCCCU-3′, 5′-UAGAGCAAAAGGCUUUUCCC-3′, 5′-UAGAGCAAAAGGCUUUUCCCU-3′, 5′-UUUAGAGCAAAAGGCUUUUCCCU-3′, 5′-UCUUGCACUUCUUGAUGGGG-3′, 5′-CUUGCACUUCUUGAUGGGGAG-3′, または 5′-GUCUUGCACUUCUUGAUGGGGAG-3′
より選択される核酸配列を含む、実施形態17~42のいずれか一項に記載の方法。
実施形態44
アデノシンデアミナーゼがTadAデアミナーゼである、実施形態17に記載の方法。
実施形態45
TadAデアミナーゼがTadA*8バリアントである、実施形態44に記載の方法。
実施形態46
TadA*8バリアントが:
TadA*8.1, TadA*8.2, TadA*8.3, TadA*8.4, TadA*8.5, TadA*8.6, TadA*8.6, TadA*8.7, TadA*8.8, TadA*8.9, TadA*8.10, TadA*8.11, TadA*8.12, TadA*8.13, TadA*8.14, TadA*8.15, TadA*8.16, TadA*8.17, TadA*8.18, TadA*8.19, TadA*8.20, TadA*8.21, TadA*8.22, TadA*8.23, および TadA*8.24
からなる群より選択される、実施形態45に記載の方法。
実施形態47
ABE8塩基エディターが:
ABE8.1-m, ABE8.2-m, ABE8.3-m, ABE8.4-m, ABE8.5-m, ABE8.6-m, ABE8.7-m, ABE8.8-m, ABE8.9-m, ABE8.10-m, ABE8.11-m, ABE8.12-m, ABE8.13-m, ABE8.14-m, ABE8.15-m, ABE8.16-m, ABE8.17-m, ABE8.18-m, ABE8.19-m, ABE8.20-m, ABE8.21-m, ABE8.22-m, ABE8.23-m, ABE8.24-m, ABE8.1-d, ABE8.2-d, ABE8.3-d, ABE8.4-d, ABE8.5-d, ABE8.6-d, ABE8.7-d, ABE8.8-d, ABE8.9-d, ABE8.10-d, ABE8.11-d, ABE8.12-d, ABE8.13-d, ABE8.14-d, ABE8.15-d, ABE8.16-d, ABE8.17-d, ABE8.18-d, ABE8.19-d, ABE8.20-d, ABE8.21-d, ABE8.22-d, ABE8.23-d, および ABE8.24
からなる群より選択される、実施形態17に記載の方法。
実施形態48
1つ以上のガイドRNAが、CRISPR RNA(crRNA)およびトランスにコードされる小RNA(tracrRNA)を含み、crRNAが、RETTと関連するSNPを含むMECP2核酸配列に相補的な核酸配列を含む、実施形態17~47のいずれか一項に記載の方法。
実施形態49
ABE8塩基エディターが、RETTと関連するSNPを含むMECP2核酸配列に相補的な核酸配列を含むシングルガイドRNA(sgRNA)と複合体を形成する、実施形態17~48のいずれか一項に記載の方法。
実施形態50
ABE8塩基エディターが、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたは本質的にそれからなる、実施形態17~49のいずれか一項に記載の方法:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD。
実施形態51
細胞内に:
ABE8塩基エディターまたは前記塩基エディターをコードするポリヌクレオチドであって、前記ABE8塩基エディターが、ポリヌクレオチドプログラム可能DNA結合ドメインおよびアデノシンデアミナーゼドメインを含む、前記エディターまたはポリヌクレオチド;ならびに
塩基エディターを標的指向化して、RETT症候群(RETT)と関連するMECP2ポリヌクレオチド中のSNPのA・TからG・Cへの改変をもたらし、改変がR133CまたはR306Cの一方または両方である、1つ以上のガイドポリヌクレオチド
を導入することによって産生される細胞、またはその子孫。
実施形態52
細胞がニューロンである、実施形態51に記載の細胞。
実施形態53
ニューロンがMECP2ポリペプチドを発現する、実施形態51または実施形態52に記載の細胞。
実施形態54
細胞が、RETTを有する対象由来である、実施形態51~53のいずれか一項に記載の細胞。
実施形態55
細胞が哺乳動物細胞またはヒト細胞である、実施形態51~54のいずれか一項に記載の細胞。
実施形態56
RETTと関連するSNPでのA・TからG・Cへの改変が、メチルCpG結合タンパク質2(MECP2)ポリペプチドにおいて、システインをアルギニンに、停止コドンをアルギニンに変化させる、実施形態51~55のいずれか一項に記載の細胞。
実施形態57
RETTと関連するSNPが、アミノ酸位133位および/または306位にアルギニンを含むMECP2ポリペプチドの発現を生じる、実施形態51~56のいずれか一項に記載の細胞。
実施形態58
ポリヌクレオチドプログラム可能DNA結合ドメインが、Streptococcus pyogenes Cas9(SpCas9)、Staphylococcus aureus Cas9(SaCas9)、Streptococcus thermophilus 1 Cas9(St1Cas9)、Streptococcus canis Cas9(ScCas9)またはそのバリアントより選択されるCas9である、実施形態51~57のいずれか一項に記載の細胞。
実施形態59
ポリヌクレオチドプログラム可能DNA結合ドメインが、改変されたプロトスペーサー隣接モチーフ(PAM)に結合する改変SpCas9を含む、実施形態51~58のいずれか一項に記載の細胞。
実施形態60
改変SpCas9が、5'-NGT-3'または5'-NGG-3'より選択される核酸配列を含むPAMに結合する、実施形態59に記載の細胞。
実施形態61
改変SpCas9がNGT PAMバリアントに結合する、実施形態60に記載の細胞。
実施形態62
NGT PAMバリアントが、改変SpCas9の残基1335、1337、1135、1136、1218、および/または1219の1つ以上でのアミノ酸置換、またはそれに対応するアミノ酸置換を含む、実施形態61に記載の方法。
実施形態63
改変SpCas9が、アミノ酸置換L1111R、D1135V、G1218R、E1219F、A1322R、R1335V、T1337Rと、L1111、D1135L、S1136R、G1218S、E1219V、D1332A、D1332S、D1332T、D1332V、D1332L、D1332K、D1332R、R1335Q、T1337、T1337L、T1337Q、T1337I、T1337V、T1337F、T1337S、T1337N、T1337K、、T1337H、T1337Q、およびT1337Mのうちの1つ以上、またはそれらに対応するアミノ酸置換を含む、実施形態59に記載の細胞。
実施形態64
改変SpCas9が、アミノ酸置換D1135L、S1136R、G1218S、E1219V、A1322R、R1335Q、and T1337、ならびに1つ以上のL1111R、G1218R、E1219F、D1332A、D1332S、D1332T、D1332V、D1332L、D1332K、D1332R、T1337L、T1337I、T1337V、T1337F、T1337S、T1337N、T1337K、T1337R、T1337H、T1337Q、およびT1337M、またはそれに対応するアミノ酸置換を含む、実施形態59に記載の細胞。
実施形態65
ポリヌクレオチドプログラム可能DNA結合ドメインが、ヌクレアーゼ不活性またはニッカーゼバリアントである、実施形態51~64のいずれか一項に記載の細胞。
実施形態66
ニッカーゼバリアントが、アミノ酸置換D10Aまたはそれに対応するアミノ酸置換を含む、実施形態65に記載の細胞。
実施形態67
アデノシンデアミナーゼドメインが、デオキシリボ核酸(DNA)中のアデノシンを脱アミノ化することが可能である、実施形態51~66のいずれか一項に記載の細胞。
実施形態68
アデノシンデアミナーゼドメインが、
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸位82位および/または166位で改変を含む、実施形態51~67のいずれか一項に記載の細胞。
実施形態69
アデノシンデアミナーゼドメインが、アミノ酸位82位および166位で改変を含む、実施形態68に記載の細胞。
実施形態70
アデノシンデアミナーゼドメインが、V82S改変、T166R改変、またはV82SおよびT166R改変の両方より選択される改変を含む、実施形態69に記載の細胞。
実施形態71
アデノシンデアミナーゼが、以下の改変:Y147T、Y147R、Q154S、Y123H、およびQ154Rの1つ以上をさらに含む、実施形態68~70のいずれか一項に記載の細胞。
実施形態72
アデノシンデアミナーゼドメインが:
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; および I76Y + V82S + Y123H + Y147R + Q154R
からなる群より選択される改変の組み合わせを含む、実施形態68~71のいずれか一項に記載の細胞。
実施形態73
ABE8が、V82SおよびT166R改変を含むアデノシンデアミナーゼバリアントモノマーを含む、実施形態68~72のいずれか一項に記載の細胞。
実施形態74
ABE8が、野生型アデノシンデアミナーゼドメインおよびアデノシンデアミナーゼバリアントを含む、アデノシンデアミナーゼヘテロダイマーを含む、実施形態68~72のいずれか一項に記載の細胞。
実施形態75
アデノシンデアミナーゼバリアントモノマーが、Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154Rからなる群より選択される1つ以上の改変をさらに含む、実施形態73に記載の細胞。
実施形態76
ABE8が、TadA*7.10ドメインおよびTadA*8ドメインを含むアデノシンデアミナーゼヘテロダイマーを含む、実施形態51に記載の細胞。
実施形態77
アデノシンデアミナーゼバリアントモノマーが、Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154Rからなる群より選択される1つ以上の改変をさらに含む、実施形態73に記載の細胞。
実施形態78
ABE8塩基エディターが、TadA*7.10ドメインと、
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; および I76Y + V82S + Y123H + Y147R + Q154R
からなる群より選択される改変を含むアデノシンデアミナーゼバリアントとを含む、ヘテロダイマーを含む、実施形態51に記載の細胞。
実施形態79
ガイドポリヌクレオチドが、
5′-AGAGCAAAAGGCUUUUCCCU-3′, 5′-UAGAGCAAAAGGCUUUUCCC-3′, 5′-UAGAGCAAAAGGCUUUUCCCU-3′, 5′-UUUAGAGCAAAAGGCUUUUCCCU-3′, 5′-UCUUGCACUUCUUGAUGGGG-3′, 5′-CUUGCACUUCUUGAUGGGGAG-3′, または 5′-GUCUUGCACUUCUUGAUGGGGAG-3′
より選択される核酸配列を含む、実施形態51に記載の細胞。
実施形態80
アデノシンデアミナーゼがTadAデアミナーゼである、実施形態51に記載の細胞。
実施形態81
TadAデアミナーゼがTadA*8バリアントである、実施形態80に記載の細胞。
実施形態82
TadA*8バリアントが:
TadA*8.1, TadA*8.2, TadA*8.3, TadA*8.4, TadA*8.5, TadA*8.6, TadA*8.6, TadA*8.7, TadA*8.8, TadA*8.9, TadA*8.10, TadA*8.11, TadA*8.12, TadA*8.13, TadA*8.14, TadA*8.15, TadA*8.16, TadA*8.17, TadA*8.18, TadA*8.19, TadA*8.20, TadA*8.21, TadA*8.22, TadA*8.23, および TadA*8.24
からなる群より選択される、実施形態81に記載の細胞。
実施形態83
ABE8塩基エディターが:
ABE8.1-m, ABE8.2-m, ABE8.3-m, ABE8.4-m, ABE8.5-m, ABE8.6-m, ABE8.7-m, ABE8.8-m, ABE8.9-m, ABE8.10-m, ABE8.11-m, ABE8.12-m, ABE8.13-m, ABE8.14-m, ABE8.15-m, ABE8.16-m, ABE8.17-m, ABE8.18-m, ABE8.19-m, ABE8.20-m, ABE8.21-m, ABE8.22-m, ABE8.23-m, ABE8.24-m, ABE8.1-d, ABE8.2-d, ABE8.3-d, ABE8.4-d, ABE8.5-d, ABE8.6-d, ABE8.7-d, ABE8.8-d, ABE8.9-d, ABE8.10-d, ABE8.11-d, ABE8.12-d, ABE8.13-d, ABE8.14-d, ABE8.15-d, ABE8.16-d, ABE8.17-d, ABE8.18-d, ABE8.19-d, ABE8.20-d, ABE8.21-d, ABE8.22-d, ABE8.23-d, および ABE8.24
からなる群より選択される、実施形態51に記載の細胞。
実施形態84
1つ以上のガイドRNAが、CRISPR RNA(crRNA)およびトランスにコードされる小RNA(tracrRNA)を含み、crRNAが、RETTと関連するSNPを含むMECP2核酸配列に相補的な核酸配列を含む、実施形態51~83のいずれか一項に記載の細胞。
実施形態85
塩基エディターが、RETTと関連するSNPを含むMECP2核酸配列に相補的な核酸配列を含むシングルガイドRNA(sgRNA)と複合体を形成する、実施形態51~84のいずれか一項に記載の細胞。
実施形態86
ABE8塩基エディターが、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むか、または本質的にそれからなる、実施形態51~85のいずれか一項に記載の細胞:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD。
実施形態87
gRNAが以下の配列:
GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT
を有する足場を含む、実施形態51~86のいずれか一項に記載の細胞。
実施形態88
対象においてRETT症候群(RETT)を治療する方法であって、前記対象に:
ABE8塩基エディター、または前記塩基エディターをコードするポリヌクレオチドであって、前記ABE8塩基エディターが、ポリヌクレオチドプログラム可能DNA結合ドメインおよびアデノシンデアミナーゼドメインを含む、前記塩基エディターまたはポリヌクレオチド;ならびに
ABE8塩基エディターを標的指向化して、RETTと関連するMECP2ポリヌクレオチド中のSNPのA・TからG・Cへの改変をもたらす1つ以上のガイドポリヌクレオチド
を投与する工程を含み、改変がR133Cおよび/またはR306Cの一方または両方である、前記方法。
実施形態89
対象が哺乳動物またはヒトである、実施形態88に記載の方法。
実施形態90
ABE8塩基エディター、または前記ABE8塩基エディターをコードするポリヌクレオチドと、前記の1つ以上のガイドポリヌクレオチドとを対象の細胞に送達する工程を含み、任意で、細胞がニューロンである、実施形態88または89に記載の方法。
実施形態91
RETTと関連するSNPでのA・TからG・Cへの改変が、メチルCpG結合タンパク質2(MECP2)ポリペプチドにおいて、システインをアルギニンに、または停止コドンをアルギニンに変化させる、実施形態88~90のいずれか一項に記載の方法。
実施形態92
RETTと関連するSNPが、アミノ酸位133位および/または306位にアルギニンを含むMECP2ポリペプチドの発現を生じる、実施形態88~91のいずれか一項に記載の方法。
実施形態93
ポリヌクレオチドプログラム可能DNA結合ドメインが、Streptococcus pyogenes Cas9(SpCas9)、Staphylococcus aureus Cas9(SaCas9)、Streptococcus thermophilus 1 Cas9(St1Cas9)、Streptococcus canis Cas9(ScCas9)またはそのバリアントより選択されるCas9である、実施形態88~92のいずれか一項に記載の方法。
実施形態94
ポリヌクレオチドプログラム可能DNA結合ドメインが、改変されたプロトスペーサー隣接モチーフ(PAM)に結合する改変SpCas9を含む、実施形態88~93のいずれか一項に記載の方法。
実施形態95
改変SpCas9が、5'-NGT-3'または5'-NGG-3'より選択される核酸配列を含むPAMに結合する、実施形態94に記載の方法。
実施形態96
改変SpCas9がNGT PAMバリアントに結合する、実施形態94に記載の方法。
実施形態97
NGT PAMバリアントが、改変SpCas9の残基1335、1337、1135、1136、1218、および/または1219の1つ以上でのアミノ酸置換、またはそれに対応するアミノ酸置換を含む、実施形態96に記載の方法。
実施形態98
改変SpCas9が、アミノ酸置換L1111R、D1135V、G1218R、E1219F、A1322R、R1335V、T1337R、ならびに1つ以上のL1111、D1135L、S1136R、G1218S、E1219V、D1332A、R1335Q、T1337、T1337L、T1337Q、T1337I、T1337V、T1337F、およびT1337M、またはそれに対応するアミノ酸置換を含む、実施形態94に記載の方法。
実施形態99
改変SpCas9が、アミノ酸置換D1135L、S1136R、G1218S、E1219V、A1322R、R1335Q、およびT1337と、L1111R、D1135L、S1136R、G1218S、E1219V、D1332A、D1332S、D1332T、D1332V、D1332L、D1332K、D1332R、R1335Q、T1337、T1337L、T1337Q、T1337I、T1337V、T1337F、T1337S、T1337N、T1337K、T1337R、T1337H、T1337Q、およびT1337Mのうちの1つ以上、またはそれらに対応するアミノ酸置換を含む、実施形態94に記載の方法。
実施形態100
ポリヌクレオチドプログラム可能DNA結合ドメインが、ヌクレアーゼ不活性またはニッカーゼバリアントである、実施形態88~99のいずれか一項に記載の方法。
実施形態101
ニッカーゼバリアントが、アミノ酸置換D10Aまたはそれに対応するアミノ酸置換を含む、実施形態100に記載の方法。
実施形態102
アデノシンデアミナーゼドメインが、デオキシリボ核酸(DNA)中のアデノシンを脱アミノ化することが可能である、実施形態88~101のいずれか一項に記載の方法。
実施形態103
アデノシンデアミナーゼドメインが、
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸位82位および/または166位で改変を含む、実施形態88~102のいずれか一項に記載の方法。
実施形態104
アデノシンデアミナーゼドメインが、アミノ酸位82位および166位で改変を含む、実施形態103に記載の方法。
実施形態105
アデノシンデアミナーゼドメインが、V82S改変、T166R改変、またはV82SおよびT166R改変の両方より選択される改変を含む、実施形態103に記載の方法。
実施形態106
アデノシンデアミナーゼドメインが、以下の改変:Y147T、Y147R、Q154S、Y123H、およびQ154Rの1つ以上をさらに含む、実施形態103~105のいずれか一項に記載の方法。
実施形態107
アデノシンデアミナーゼドメインが:
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; および I76Y + V82S + Y123H + Y147R + Q154R
からなる群より選択される改変を含む、実施形態103~106のいずれか一項に記載の方法。
実施形態108
ABE8が、V82SおよびT166R改変を含むアデノシンデアミナーゼバリアントモノマーを含む、実施形態88~107のいずれか一項に記載の方法。
実施形態109
ABE8が、野生型アデノシンデアミナーゼドメインおよびアデノシンデアミナーゼバリアントを含む、アデノシンデアミナーゼヘテロダイマーを含む、実施形態88~107のいずれか一項に記載の方法。
実施形態110
アデノシンデアミナーゼバリアントモノマーが、Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154Rからなる群より選択される1つ以上の改変をさらに含む、実施形態108に記載の方法。
実施形態111
ABE8が、TadA*7.10ドメインおよびTadA*8ドメインを含むアデノシンデアミナーゼヘテロダイマーを含む、実施形態88に記載の方法。
実施形態112
アデノシンデアミナーゼバリアントモノマーが、Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154Rからなる群より選択される1つ以上の改変をさらに含む、実施形態108に記載の方法。
実施形態113
ABE8塩基エディターが、TadA7.10ドメインと、
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; および I76Y + V82S + Y123H + Y147R + Q154R
からなる群より選択される改変を含むアデノシンデアミナーゼバリアントとを含む、ヘテロダイマーを含む、実施形態88に記載の方法。
実施形態114
ガイドポリヌクレオチドが、
5′-AGAGCAAAAGGCUUUUCCCU-3′, 5′-UAGAGCAAAAGGCUUUUCCC-3′, 5′-UAGAGCAAAAGGCUUUUCCCU-3′, 5′-UUUAGAGCAAAAGGCUUUUCCCU-3′, 5′-UCUUGCACUUCUUGAUGGGG-3′, 5′-CUUGCACUUCUUGAUGGGGAG-3′, or 5′-GUCUUGCACUUCUUGAUGGGGAG-3′
より選択される核酸配列を有する、実施形態88~113のいずれか一項に記載の方法。
実施形態115
アデノシンデアミナーゼがTadAデアミナーゼである、実施形態102に記載の方法。
実施形態116
TadAデアミナーゼがTadA*8バリアントである、実施形態115に記載の方法。
実施形態117
TadA*8バリアントが:
TadA*8.1, TadA*8.2, TadA*8.3, TadA*8.4, TadA*8.5, TadA*8.6, TadA*8.6, TadA*8.7, TadA*8.8, TadA*8.9, TadA*8.10, TadA*8.11, TadA*8.12, TadA*8.13, TadA*8.14, TadA*8.15, TadA*8.16, TadA*8.17, TadA*8.18, TadA*8.19, TadA*8.20, TadA*8.21, TadA*8.22, TadA*8.23, および TadA*8.24
からなる群より選択される、実施形態116に記載の方法。
実施形態118
ABE8塩基エディターが:
ABE8.1-m, ABE8.2-m, ABE8.3-m, ABE8.4-m, ABE8.5-m, ABE8.6-m, ABE8.7-m, ABE8.8-m, ABE8.9-m, ABE8.10-m, ABE8.11-m, ABE8.12-m, ABE8.13-m, ABE8.14-m, ABE8.15-m, ABE8.16-m, ABE8.17-m, ABE8.18-m, ABE8.19-m, ABE8.20-m, ABE8.21-m, ABE8.22-m, ABE8.23-m, ABE8.24-m, ABE8.1-d, ABE8.2-d, ABE8.3-d, ABE8.4-d, ABE8.5-d, ABE8.6-d, ABE8.7-d, ABE8.8-d, ABE8.9-d, ABE8.10-d, ABE8.11-d, ABE8.12-d, ABE8.13-d, ABE8.14-d, ABE8.15-d, ABE8.16-d, ABE8.17-d, ABE8.18-d, ABE8.19-d, ABE8.20-d, ABE8.21-d, ABE8.22-d, ABE8.23-d, および ABE8.24
からなる群より選択される、実施形態88に記載の方法。
実施形態119
1つ以上のガイドRNAが、CRISPR RNA(crRNA)およびトランスにコードされる小RNA(tracrRNA)を含み、crRNAが、RETTと関連するSNPを含むMECP2核酸配列に相補的な核酸配列を含む、実施形態88~118のいずれか一項に記載の方法。
実施形態120
塩基エディターが、RETTと関連するSNPを含むMECP2核酸配列に相補的な核酸配列を含むシングルガイドRNA(sgRNA)と複合体を形成する、実施形態88~119のいずれか一項に記載の方法。
実施形態121
対象においてレット症候群(RETT)を治療する方法であって:
必要とする対象に、(i)アデノシン塩基エディターまたはそれをコードする核酸配列、および(ii)ガイドポリヌクレオチドまたはそれをコードする核酸配列を投与する工程を含み、ここでアデノシン塩基エディターがプログラム可能DNA結合ドメインおよびアデノシンデアミナーゼドメインを含み、アデノシンデアミナーゼドメインが、TadA参照配列に比較してアミノ酸位82位もしくは166位またはそれに対応する位でアミノ酸置換を含み、
ガイドポリヌクレオチドがアデノシン塩基エディターを誘導して、対象においてRETTと関連するSNPを含むメチルCpG結合タンパク質2(MECP2)遺伝子またはその制御エレメントにおけるAからGへの核酸塩基改変をもたらし、それによって対象においてRETTを治療し、RETTと関連するSNPは、MECP2遺伝子にコードされるMECP2ポリペプチドまたはそのバリアントにおいてR133CまたはR306Cアミノ酸突然変異を生じる
前記方法。
実施形態122
投与が、RETTに関連する少なくとも1つの症状を改善する、実施形態121に記載の方法。
実施形態123
投与が、アデノシンデアミナーゼ中の前記アミノ酸置換を含まない塩基エディターでの治療に比較して、RETTに関連する少なくとも1つの症状のより迅速な改善を生じる、実施形態121に記載の方法。
実施形態124
AからGへの核酸塩基改変が、RETTと関連するSNPを野生型核酸塩基に変化させる、実施形態121~123のいずれか一項に記載の方法。
実施形態125
AからGへの核酸塩基改変が、Rett症候群と関連するSNPを、RETT症状の改善を生じる非野生型核酸塩基に変化させる、実施形態121~124のいずれか一項に記載の方法。
実施形態126
ガイドポリヌクレオチドが、RETTと関連するSNPを含むMECP2遺伝子またはその制御エレメントに相補的な核酸配列を含む、実施形態121~125のいずれか一項に記載の方法。
実施形態127
アデノシン塩基エディターが、RETTと関連するSNPを含むMECP2遺伝子またはその制御エレメントに相補的な核酸配列を含むシングルガイドRNA(sgRNA)と複合体を形成している、実施形態121~126のいずれか一項に記載の方法。
実施形態128
ガイドポリヌクレオチドが、
5′-AGAGCAAAAGGCUUUUCCCU-3′, 5′-UAGAGCAAAAGGCUUUUCCC-3′, 5′-UAGAGCAAAAGGCUUUUCCCU-3′, 5′-UUUAGAGCAAAAGGCUUUUCCCU-3′, 5′-UCUUGCACUUCUUGAUGGGG-3′, 5′-CUUGCACUUCUUGAUGGGGAG-3′, または 5′-GUCUUGCACUUCUUGAUGGGGAG-3′
より選択される核酸配列を含む、実施形態127に記載の方法。
実施形態129
ガイドポリヌクレオチドが、MECP2遺伝子またはその制御エレメントに相補的である、少なくとも10の隣接ヌクレオチドを含む核酸配列を含む、実施形態1~9または121~128のいずれか一項の方法、あるいは実施形態10~16のいずれか一項に記載の塩基エディター。
実施形態130
ガイドポリヌクレオチドが、MECP2遺伝子またはその制御エレメントに相補的である、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40の隣接ヌクレオチドを含む核酸配列を含む、実施形態129に記載の方法。
実施形態131
ガイドポリヌクレオチドが、MECP2ポリヌクレオチドに相補的である、少なくとも10の隣接ヌクレオチドを含む核酸配列を含む、実施形態17~50または88~120のいずれか一項のに記載方法、あるいは実施形態51~87のいずれか一項に記載の細胞。
実施形態132
ガイドポリヌクレオチドが、MECP2ポリヌクレオチドに相補的である、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40の隣接ヌクレオチドを含む核酸配列を含む、実施形態131に記載の方法。
実施形態133
RETTと関連するSNPが、MECP2遺伝子によってコードされるMECP2ポリペプチドまたはそのバリアントにおいてR133Cおよび/またはR306Cアミノ酸突然変異を生じる、実施形態121~128のいずれか一項に記載の方法。
実施形態134
RETTと関連するSNPが、MECP2遺伝子によってコードされるMECP2ポリペプチドまたはそのバリアントにおいてR133Cアミノ酸突然変異を生じる、実施形態133に記載の方法。
実施形態135
RETTと関連するSNPが、MECP2遺伝子によってコードされるMECP2ポリペプチドまたはそのバリアントにおいてR306Cアミノ酸突然変異を生じる、実施形態133に記載の方法。
実施形態136
RETTと関連するSNPでのAからGへの核酸塩基改変が、MECP2遺伝子によってコードされるMECP2ポリペプチドまたはそのバリアントにおいてR133Cアミノ酸突然変異を生じる、実施形態10~16のいずれか一項に記載の塩基エディターシステム。
実施形態137
RETTと関連するSNPでのAからGへの核酸塩基改変が、MECP2遺伝子によってコードされるMECP2ポリペプチドまたはそのバリアントにおいてR306Cアミノ酸突然変異を生じる、実施形態10~16のいずれか一項に記載の塩基エディターシステム。
実施形態138
RETTと関連するSNPの改変が、R133CおよびR306Cの両方を含む、実施形態17~50、または88~120のいずれか一項に記載の方法。
実施形態139
RETTと関連するSNPの改変がR133Cである、実施形態17~50、または88~120のいずれか一項に記載の方法。
実施形態140
RETTと関連するSNPの改変がR306Cである、実施形態17~50、または88~120のいずれか一項に記載の方法。
実施形態141
RETT症候群(RETT)と関連するSNPの改変がR133Cである、実施形態51~87のいずれか一項に記載の細胞。
実施形態142
RETT症候群(RETT)と関連するSNPの改変がR306Cである、実施形態51~87のいずれか一項に記載の細胞。
実施形態143
MECP2タンパク質をコードするMECP2遺伝子に完全に相補的である15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30の隣接ヌクレオチドを含む、ガイドポリヌクレオチドまたはガイドRNA。
実施形態144
5′-AGAGCAAAAGGCUUUUCCCU-3′, 5′-UAGAGCAAAAGGCUUUUCCC-3′, 5′-UAGAGCAAAAGGCUUUUCCCU-3′, 5′-UUUAGAGCAAAAGGCUUUUCCCU-3′, 5′-UCUUGCACUUCUUGAUGGGG-3′, 5′-CUUGCACUUCUUGAUGGGGAG-3′, または 5′-GUCUUGCACUUCUUGAUGGGGAG-3′
より選択される核酸配列を含む、実施形態143に記載のガイドポリヌクレオチドまたはガイドRNA。
実施形態145
足場配列をさらに含み、足場配列は任意で
GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT
である、実施形態143または実施形態144に記載のガイドポリヌクレオチドまたはガイドRNA。
実施形態146
アデノシンデアミナーゼ塩基エディター8(ABE8)およびガイドRNAを含む組成物であって、ABE8がポリヌクレオチドプログラム可能DNA結合ドメインおよびアデノシンデアミナーゼドメインを含み、ガイドRNAが、塩基エディターを標的指向化して、RETT症候群と関連するMECP2ポリヌクレオチド中のSNPのA・TからG・Cへの改変をもたらし、改変がR133CまたはR306Cの一方または両方である、前記組成物。
実施形態147
RETTと関連するSNPでのA・TからG・Cへの改変が、メチルCpG結合タンパク質2(Mecp2)ポリペプチドにおいて、システインをアルギニンに、または停止コドンをアルギニンに変化させる、実施形態146に記載の組成物。
実施形態148
RETTと関連するSNPが、アミノ酸位133位および/または306位にアルギニンを含むMECP2ポリペプチドの発現を生じる、実施形態146または実施形態147に記載の組成物。
実施形態149
ポリヌクレオチドプログラム可能DNA結合ドメインが、Streptococcus pyogenes Cas9(SpCas9)、Staphylococcus aureus Cas9(SaCas9)、Streptococcus thermophilus 1 Cas9(St1Cas9)、Streptococcus canis Cas9(ScCas9)またはそのバリアントより選択されるCas9である、実施形態146~148のいずれか一項に記載の組成物。
実施形態150
ポリヌクレオチドプログラム可能DNA結合ドメインが、改変されたプロトスペーサー隣接モチーフ(PAM)に結合する改変SpCas9を含む、実施形態146~149のいずれか一項に記載の組成物。
実施形態151
ポリヌクレオチドプログラム可能DNA結合ドメインが、ヌクレアーゼ不活性またはニッカーゼバリアントである、実施形態146~149のいずれか一項に記載の組成物。
実施形態152
ニッカーゼバリアントが、アミノ酸置換D10Aまたはそれに対応するアミノ酸置換を含む、実施形態151に記載の組成物。
実施形態153
アデノシンデアミナーゼドメインが、デオキシリボ核酸(DNA)中のアデノシンを脱アミノ化することが可能である、実施形態146~152のいずれか一項に記載の組成物。
実施形態154
アデノシンデアミナーゼドメインが、
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸位82位および/または166位で改変を含む、実施形態146~153のいずれか一項に記載の組成物。
実施形態155
アデノシンデアミナーゼドメインが、V82S改変、T166R改変、またはV82SおよびT166R改変の両方より選択される改変を含む、実施形態154に記載の組成物。
実施形態156
アデノシンデアミナーゼドメインが、以下の改変:Y147T、Y147R、Q154S、Y123H、およびQ154Rの1つ以上をさらに含む、実施形態154または155に記載の組成物。
実施形態157
アデノシンデアミナーゼドメインが:
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; および I76Y + V82S + Y123H + Y147R + Q154R
からなる群より選択される改変を含む、実施形態154~156のいずれか一項に記載の組成物。
実施形態158
ABE8が、V82SおよびT166R改変を含むアデノシンデアミナーゼバリアントモノマーを含む、実施形態146~157のいずれか一項に記載の組成物。
実施形態159
ABE8が、野生型アデノシンデアミナーゼドメインおよびアデノシンデアミナーゼバリアントを含む、アデノシンデアミナーゼヘテロダイマーを含む、実施形態146~158のいずれか一項に記載の組成物。
実施形態160
アデノシンデアミナーゼバリアントモノマーが、Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154Rからなる群より選択される1つ以上の改変をさらに含む、実施形態158に記載の組成物。
実施形態161
ABE8が、TadA*8ドメインと野生型TadAドメインとを含むアデノシンデアミナーゼヘテロダイマーを含む、実施形態146に記載の組成物。
実施形態162
アデノシンデアミナーゼバリアントモノマーが、Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154Rからなる群より選択される1つ以上の改変をさらに含む、実施形態158に記載の組成物。
実施形態163
ABE8塩基エディターが、野生型TadAドメインと、
Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; および I76Y + V82S + Y123H + Y147R + Q154R
からなる群より選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントとを含む、ヘテロダイマーを含む、実施形態146に記載の組成物。
実施形態164
ガイドRNAが、
AGAGCAAAAGGCUUUUCCCU-3′, 5′-UAGAGCAAAAGGCUUUUCCC-3′, 5′-UAGAGCAAAAGGCUUUUCCCU-3′, 5′-UUUAGAGCAAAAGGCUUUUCCCU-3′, 5′-UCUUGCACUUCUUGAUGGGG-3′, 5′-CUUGCACUUCUUGAUGGGGAG-3′, または 5′-GUCUUGCACUUCUUGAUGGGGAG-3′
より選択される核酸配列を含む、実施形態146~163のいずれか一項に記載の組成物。
実施形態165
アデノシンデアミナーゼがTadAデアミナーゼである、実施形態146に記載の組成物。
実施形態166
TadAデアミナーゼがTadA*8バリアントである、実施形態165に記載の組成物。
実施形態167
TadA*8バリアントが:
TadA*8.1, TadA*8.2, TadA*8.3, TadA*8.4, TadA*8.5, TadA*8.6, TadA*8.6, TadA*8.7, TadA*8.8, TadA*8.9, TadA*8.10, TadA*8.11, TadA*8.12, TadA*8.13, TadA*8.14, TadA*8.15, TadA*8.16, TadA*8.17, TadA*8.18, TadA*8.19, TadA*8.20, TadA*8.21, TadA*8.22, TadA*8.23, および TadA*8.24
からなる群より選択される、実施形態166に記載の組成物。
実施形態168
ABE8塩基エディターが:
ABE8.1-m, ABE8.2-m, ABE8.3-m, ABE8.4-m, ABE8.5-m, ABE8.6-m, ABE8.7-m, ABE8.8-m, ABE8.9-m, ABE8.10-m, ABE8.11-m, ABE8.12-m, ABE8.13-m, ABE8.14-m, ABE8.15-m, ABE8.16-m, ABE8.17-m, ABE8.18-m, ABE8.19-m, ABE8.20-m, ABE8.21-m, ABE8.22-m, ABE8.23-m, ABE8.24-m, ABE8.1-d, ABE8.2-d, ABE8.3-d, ABE8.4-d, ABE8.5-d, ABE8.6-d, ABE8.7-d, ABE8.8-d, ABE8.9-d, ABE8.10-d, ABE8.11-d, ABE8.12-d, ABE8.13-d, ABE8.14-d, ABE8.15-d, ABE8.16-d, ABE8.17-d, ABE8.18-d, ABE8.19-d, ABE8.20-d, ABE8.21-d, ABE8.22-d, ABE8.23-d, および ABE8.24
からなる群より選択される、実施形態146に記載の組成物。
実施形態169
ガイドRNAが、CRISPR RNA(crRNA)およびトランスにコードされる小RNA(tracrRNA)を含み、crRNAが、RETTと関連するSNPを含むMECP2核酸配列に相補的な核酸配列を含む、実施形態146~168のいずれか一項に記載の組成物。
実施形態170
ABE8塩基エディターが、RETTと関連するSNPを含むMECP2核酸配列に相補的な核酸配列を含むシングルガイドRNA(sgRNA)と複合体を形成する、実施形態146~169のいずれか一項に記載の組成物。
実施形態171
ABE8塩基エディターが、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むか、または本質的にそれからなる、実施形態146~170のいずれか一項に記載の組成物:MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD。
実施形態172
組成物が脂質をさらに含み、任意で脂質がカチオン性脂質である、実施形態146~171のいずれか一項に記載の組成物。
実施形態173
薬学的に許容され得る賦形剤または希釈剤を含む薬学的組成物である、実施形態146~172のいずれか一項に記載の組成物。
実施形態174
RETT症候群の治療用の、実施形態173に記載の薬学的組成物。
実施形態175
gRNAおよびABE8塩基エディターが、一緒にまたは別個に配合される、実施形態173に記載の薬学的組成物。
実施形態176
哺乳動物細胞における発現に適したベクターをさらに含み、ベクターがABE8塩基エディターをコードするポリヌクレオチドを含む、実施形態172~175のいずれか一項に記載の薬学的組成物。
実施形態177
ベクターがウイルスベクターである、実施形態176に記載の薬学的組成物。
実施形態178
ウイルスベクターが、レトロウイルスベクター、アデノウイルスベクター、レンチウイルスベクター、ヘルペスウイルスベクター、またはアデノ随伴ウイルスベクター(AAV)である、実施形態177に記載の薬学的組成物。
実施形態179
哺乳動物細胞における発現に適したリボ核粒子(ribonucleoparticle)をさらに含む、実施形態172~178のいずれか一項に記載の薬学的組成物。
実施形態180
RETT症候群を治療する方法であって、治療が必要な対象に、実施形態172~179のいずれか一項の薬学的組成物を投与する工程を含む、前記方法。
実施形態181
対象におけるRETT症候群の治療における、実施形態172~179のいずれか一項に記載の薬学的組成物の使用。
実施形態182
対象が哺乳動物またはヒトである、実施形態180に記載の方法、または実施形態181に記載の使用。
実施形態183
実施形態51~87のいずれか一項に記載の細胞を含む組成物。
実施形態184
薬学的に許容され得るキャリアーまたは希釈剤をさらに含む、実施形態183に記載の組成物。
実施形態185
(i)ABE8塩基エディターをコードする核酸;および(ii)実施形態143~145のいずれか一項に記載のガイドポリヌクレオチドまたはガイドRNAを含む、薬学的組成物。
実施形態186
脂質をさらに含む、実施形態185に記載の薬学的組成物。
実施形態187
脂質がカチオン性脂質である、実施形態186に記載の薬学的組成物。
実施形態188
塩基エディターをコードする核酸がmRNAである、実施形態186または実施形態187に記載の薬学的組成物。
本開示の実施は、別段の表示がない限り、分子生物学(組換え技術を含む)、微生物学、細胞生物学、生化学および免疫学の従来の技術を利用し、これらは当業者の技量の範囲内である。そのような技術は、“Molecular Cloning: A Laboratory Manual”, second edition (Sambrook, 1989); “Oligonucleotide Synthesis” (Gait, 1984); “Animal Cell Culture” (Freshney, 1987); “Methods in Enzymology” “Handbook of Experimental Immunology” (Weir, 1996); “Gene Transfer Vectors for Mammalian Cells” (Miller and Calos, 1987); “Current Protocols in Molecular Biology” (Ausubel, 1987); “PCR: The Polymerase Chain Reaction”, (Mullis, 1994); “Current Protocols in Immunology” (Coligan, 1991)などの文献で詳しく説明されている。これらの技術は、本開示のポリヌクレオチドおよびポリペプチドの製造に適用可能であり、従って、本開示の製造および実施において考慮され得る。特定の実施形態のために特に有用な技術は、以下のセクションで論じられる。
【実施例
【0845】
以下の実施例は、一般の当業者に本開示のアッセイ、スクリーニング、および治療方法をいかに作製して使用するかの完全な開示および説明を提供するために記載されており、本開示およびその実施形態中で記載されるものの範囲を限定することを意図するものではない。
【0846】
実施例1:細胞におけるMecp2 RTT関連突然変異の修正のためのA・TからG・CへのDNA塩基編集
検証されたプロトスペーサー隣接モチーフ(PAM)配列優先性を持つCas9部分を使用する、A・TからG・CへのDNA塩基エディター(ABE)を用いて、野生型配列への復帰のため、8つの最も多いRTT原因Mecp2突然変異のうち、6つを標的化した(図2)。どのガイドRNA(gRNA)およびABE-Cas9プラットフォームが、最も効率的にかつ正確に、標的とされるMecp2突然変異を修正することが可能であるかを決定するため、R255Xを含むRTT標的化可能突然変異を所持するMecp2アレル(表15)を、レンチウイルス形質導入によって、HEK293T細胞中でゲノムに組み込んだ。所定の突然変異に関するgRNAおよびABE-Cas9エディターの編集効率を測定した。ABE-Cas9エディターをコードするDNAおよびgRNAをトランスフェクションした5日後、細胞を溶解し、miSeq分析によって、所望の部位での塩基編集に関して分析した。
表15: 6つのRETT突然変異
【表15】
【0847】
最も重度の突然変異のうち4つ、R255X、R106W、T158M、およびR270Xに関して、特定の標的/スペーサー配列を以下の表16に示す:
【表16】

上記標的/スペーサー配列は、標的化可能な「a」核酸塩基を太字と下線で示す。NGTT PAMバリアントを用いてR255X突然変異を標的化可能であり、NGG PAMを用いてR106W、T158MおよびR270X突然変異を標的化可能である。
【0848】
実施例2:R106W突然変異の修正のための塩基編集
R106Wは、レット症候群における4つの最も重症の突然変異のうちの1つである。ABEを用いて、標的部位で、A>Gを効率的に変換することによって、R106Wの修正を行うことも可能である。実施例1で論じるように、RETT突然変異を含むMECP2のゲノム上に組み込まれた単一コピーを含有する、MECP2-HEK293T細胞株において、塩基編集を試験した。ABE8塩基エディターバリアントとともに、RTT中のR106W突然変異を標的とする5つのガイドRNA(gRNA)を試験した(図3)。
【0849】
gRNAは、本明細書に提供するように、または当業者の知識に基づいて決定されるであろうように、かつ当業者に理解されるであろうように、疾患関連遺伝子に関する足場配列およびスペーサー配列(標的配列)を含む(例えばKomor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)、およびRees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1を参照されたい)。
【0850】
R106W突然変異に関する5つのDNA標的配列を以下に提供する:
DNA標的配列1:CCATGTCCAGCCTTCAGGCAGGG
DNA標的配列2:TCCATGTCCAGCCTTCAGGCAGG
DNA標的配列3:TTCCATGTCCAGCCTTCAGGCAG
DNA標的配列4: GCTTCCATGTCCAGCCTTCAGGC
DNA標的配列5:AGCTTCCATGTCCAGCCTTCAGG
PAM配列を下線と太字フォントで示す。上記表15に示すように、標的配列1、2および5はNGG PAM(すなわちSpCas9)を利用する。標的配列3はxCas9を必要とする(本明細書に参照により組み込まれるLiu et al. WO2017070633に記載される通り)。標的配列4はCas9 PAMバリアントを必要とする(本明細書に参照により組み込まれるJoung et al. WO2019040650に記載される通り)。
【0851】
上記DNA標的配列各々の相補体にハイブリダイズする5つのガイドRNA配列は以下の通りである:
gRNA1: 5′-gCCAUGUCCAGCCUUCAGGCA-3′
gRNA2: 5′-gUCCAUGUCCAGCCUUCAGGC-3′
gRNA3: 5′-gUUCCAUGUCCAGCCUUCAGG-3′
gRNA4: 5′-GCUUCCAUGUCCAGCCUUCA-3′
gRNA5: 5′-gAGCUUCCAUGUCCAGCCUUC-3′
DNA標的配列およびgRNA配列両方の小文字「g」は、ポリメラーゼが転写を開始しなければならない配列中でのミスマッチを示す。いくつかの実施形態では、ガイドポリヌクレオチドは、特に5'端で、1、2、3、4ヌクレオチド等で切り詰められ得る。
【0852】
gRNA各々に関して、足場配列は以下の通りである:
GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT。
当業者には認識されるであろうように、ガイドポリヌクレオチド配列(gRNA)においては、ウラシル(U)が配列中のチミン(T)を置き換える。
【0853】
用いるABE塩基エディターには、ABE8ヘテロダイマーバリアント:ABE8.14、ABE8.15、ABE8.16、ABE8.17、ABE8.18、ABE8.19、ABE8.20、ABE8.21、ABE8.22、ABE8.23、ABE8.24、ABE8.25、およびABE8.26が含まれる(表9を参照されたい)。陽性対照塩基エディターABE7.10および陰性対照もまた、比較のために用いた。
【0854】
プラスミドトランスフェクションのため、Opti-MEM培地およびLipofectamine 2000を用いて、250ngのgRNAおよび750ngのABE8バリアントで、HEK293T細胞をトランスフェクションし、プレーティングした。NGG PAM配列を有するABE8塩基エディターバリアントを用いた。トランスフェクション5日後、細胞を溶解し、配列決定のために調製した(トランスフェクション3日後の培地交換を伴う)。
【0855】
5つのgRNA配列のうち、gRNA1、gRNA2、およびgRNA5は最適なAからGへの編集を提供した(図3)。ABE8塩基エディターバリアントは、ABE7.10対照に比較して、増加した塩基編集活性を有した。図3に示すように、達成されたAからGへの遺伝子編集の量は、gRNA2を用いると、約35%であった。
【0856】
実施例3:R133C突然変異の修正のための塩基編集
ABEを用いて、標的部位で、A>Gを効率的に変換することによって、R133Cの修正を行うことも可能である。実施例1で論じるように、RETT突然変異を含むMECP2のゲノム上に組み込まれた単一コピーを含有する、MECP2-HEK293T細胞株において、塩基編集を試験する。ABE8塩基エディターバリアントとともに、RETT中のR133C突然変異を標的とする4つのガイドRNA(gRNA)を試験する。
【0857】
gRNAは、本明細書に提供するように、または当業者の知識に基づいて決定されるであろうように、かつ当業者に理解されるであろうように、疾患関連遺伝子に関する足場配列およびスペーサー配列(標的配列)を含む(例えばKomor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)、およびRees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1を参照されたい)。
【0858】
R133C突然変異に関する4つのDNA標的配列を以下に提供する:
DNA標的配列1:AGAGCAAAAGGCTTTTCCCT
DNA標的配列2:TAGAGCAAAAGGCTTTTCCC
DNA標的配列3:AGAGCAAAAGGCTTTTCCCT
DNA標的配列4:TTTAGAGCAAAAGGCTTTTCCCT
標的配列は上記表15に示すようなPAM配列を利用する。標的配列1および2はSpCas9を利用する。標的配列3および4はSaCas9を利用する。
【0859】
上記DNA標的配列各々の相補体にハイブリダイズする4つのガイドRNA配列(gRNA)は以下の通りである:
gRNA1: 5′-gAGAGCAAAAGGCUUUUCCCU-3′
gRNA2: 5′-gUAGAGCAAAAGGCUUUUCCC-3′
gRNA3: 5′-gUAGAGCAAAAGGCUUUUCCCU-3′
gRNA4: 5′-gUUUAGAGCAAAAGGCUUUUCCCU-3′
DNA標的配列およびgRNA配列両方の小文字「g」は、ポリメラーゼが転写を開始しなければならない配列中でのミスマッチを示す。いくつかの実施形態では、ガイドポリヌクレオチドは、特に5'端で、1、2、3、4ヌクレオチド等で切り詰められ得る。
【0860】
gRNA各々に関して、足場配列は以下の通りである:
GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT。
当業者には認識されるであろうように、ガイドポリヌクレオチド配列(gRNA)においては、ウラシル(U)が配列中のチミン(T)を置き換える。
【0861】
用いるABE塩基エディターには、ABE8ヘテロダイマーバリアント:ABE8.14、ABE8.15、ABE8.16、ABE8.17、ABE8.18、ABE8.19、ABE8.20、ABE8.21、ABE8.22、ABE8.23、ABE8.24、ABE8.25、およびABE8.26が含まれる(表9を参照されたい)。陽性対照塩基エディターABE7.10および陰性対照もまた、比較のために用いる。
【0862】
プラスミドトランスフェクションのため、Opti-MEM培地およびLipofectamine 2000を用いて、250ngのgRNAおよび750ngのABE8バリアントで、HEK293T細胞をトランスフェクションし、プレーティングする。トランスフェクション5日後、細胞を溶解し、配列決定のために調製する(トランスフェクション3日後の培地交換を伴う)。
【0863】
実施例4:R306C突然変異の修正のための塩基編集
ABEを用いて、標的部位で、A>Gを効率的に変換することによって、R306Cの修正を行うことも可能である(図1および2)。実施例1で論じるように、RETT突然変異を含むMECP2のゲノム上に組み込まれた単一コピーを含有する、MECP2-HEK293T細胞株において、塩基編集を試験する。ABE8塩基エディターバリアントとともに、RETT中のR306C突然変異を標的とする3つのガイドRNA(gRNA)を試験する。
【0864】
gRNAは、本明細書に提供するように、または当業者の知識に基づいて決定されるであろうように、かつ当業者に理解されるであろうように、疾患関連遺伝子に関する足場配列およびスペーサー配列(標的配列)を含む(例えばKomor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)、およびRees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1を参照されたい)。
【0865】
R306C突然変異に関する3つのDNA標的配列を以下に提供する:
DNA標的配列1:TCTTGCACTTCTTGATGGGG
DNA標的配列2:CTTGCACTTCTTGATGGGGAG
DNA標的配列3:GTCTTGCACTTCTTGATGGGGAG
標的配列は上記表15に示すようなPAM配列を利用する。標的配列1はSpCas9を利用する。標的配列2および3はSaCas9を利用する。
【0866】
上記DNA標的配列各々の相補体にハイブリダイズする3つのガイドRNA配列(gRNA)は以下の通りである:
gRNA1: 5′-gUCUUGCACUUCUUGAUGGGG-3′
gRNA2: 5′-gCUUGCACUUCUUGAUGGGGAG-3′
gRNA3: 5′-gGUCUUGCACUUCUUGAUGGGGAG-3′
DNA標的配列およびgRNA配列両方の小文字「g」は、ポリメラーゼが転写を開始しなければならない配列中でのミスマッチを示す。いくつかの実施形態では、ガイドポリヌクレオチドは、特に5'端で、1、2、3、4ヌクレオチド等で切り詰められ得る。
【0867】
gRNA各々に関して、足場配列は以下の通りである:
GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT。
当業者には認識されるであろうように、ガイドポリヌクレオチド配列(gRNA)においては、ウラシル(U)が配列中のチミン(T)を置き換える。
【0868】
用いるABE塩基エディターには、ABE8ヘテロダイマーバリアント:ABE8.14、ABE8.15、ABE8.16、ABE8.17、ABE8.18、ABE8.19、ABE8.20、ABE8.21、ABE8.22、ABE8.23、ABE8.24、ABE8.25、およびABE8.26が含まれる(表9を参照されたい)。陽性対照塩基エディターABE7.10および陰性対照もまた、比較のために用いる。
【0869】
プラスミドトランスフェクションのため、Opti-MEM培地およびLipofectamine 2000を用いて、250ngのgRNAおよび750ngのABE8バリアントで、HEK293T細胞をトランスフェクションし、プレーティングした。トランスフェクション5日後、細胞を溶解し、配列決定のために調製する(トランスフェクション3日後の培地交換を伴う)。
図1
図2
図3
【配列表】
0007679311000001.app