(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024138268
(43)【公開日】2024-10-08
(54)【発明の名称】プログラム可能な塩基エディターシステムを用いて単一ヌクレオチド多型を編集する方法
(51)【国際特許分類】
C12N 15/09 20060101AFI20241001BHJP
A61K 38/50 20060101ALI20241001BHJP
A61K 48/00 20060101ALI20241001BHJP
A61P 25/00 20060101ALI20241001BHJP
C12N 9/78 20060101ALN20241001BHJP
【FI】
C12N15/09 100
A61K38/50
A61K48/00
A61P25/00
C12N9/78 ZNA
C12N9/78
【審査請求】有
【請求項の数】1
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024095566
(22)【出願日】2024-06-13
(62)【分割の表示】P 2021513765の分割
【原出願日】2019-05-11
(31)【優先権主張番号】62/670,588
(32)【優先日】2018-05-11
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/780,838
(32)【優先日】2018-12-17
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/817,986
(32)【優先日】2019-03-13
(33)【優先権主張国・地域又は機関】US
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.MATLAB
(71)【出願人】
【識別番号】520439645
【氏名又は名称】ビーム セラピューティクス インク.
(74)【代理人】
【識別番号】100083806
【弁理士】
【氏名又は名称】三好 秀和
(74)【代理人】
【識別番号】100111235
【弁理士】
【氏名又は名称】原 裕子
(74)【代理人】
【識別番号】100195257
【弁理士】
【氏名又は名称】大渕 一志
(72)【発明者】
【氏名】ブライソン、 デイビッド
(72)【発明者】
【氏名】エヴァンス、 ジョン
(72)【発明者】
【氏名】パッカー、 マイケル
(72)【発明者】
【氏名】ゲールケ、 ジェイソン マイケル
(72)【発明者】
【氏名】ペトロシャン、 ナタリー
(57)【要約】 (修正有)
【課題】レット症候群(RTT)に関連する変異を改変するための組成物および方法を提供する。
【解決手段】ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび核酸塩基編集ドメインをガイドポリヌクレオチドと組み合わせて含む塩基エディターを用いる組成物および方法が提供される。標的ヌクレオチド配列の核酸塩基を編集するための塩基エディターシステムも提供される。
【選択図】
図1
【特許請求の範囲】
【請求項1】
レット症候群(RTT)に関連する単一ヌクレオチド多型(SNP)を含むMECP2ポリヌクレ
オチドを編集する方法であって、前記MECP2ポリヌクレオチドを、1つまたは複数のガイド
ポリヌクレオチドと複合体化した塩基エディターと接触させることを含み、前記塩基エデ
ィターが、ポリヌクレオチドプログラム可能なDNA結合ドメインおよびアデノシンデアミ
ナーゼドメインを含み、前記ガイドポリヌクレオチドの1つまたは複数が、前記塩基エデ
ィターをターゲティングしてRTTに関連する前記SNPのA・TからG・Cへの改変をもたらす、
方法。
【請求項2】
前記接触させることが、細胞中、真核細胞中、哺乳動物細胞中、またはヒト細胞中であ
る、請求項1に記載の方法。
【請求項3】
前記細胞が、in vivoである、請求項1または2に記載の方法。
【請求項4】
前記細胞が、ex vivoである、請求項1または2に記載の方法。
【請求項5】
前記改変が、R106W、R168*、R133C、T158M、R255*、R270*、およびR306Cのうちの1つま
たは複数である、請求項1から4のいずれか一項に記載の方法。
【請求項6】
RTTに関連するSNPにおける前記A・TからG・Cへの改変が、メチルCpG結合タンパク質2(
Mecp2)ポリペプチドにおいてシステインをアルギニンに、メチオニンをスレオニンに、
または停止コドンをアルギニンに変更する、請求項1から5のいずれか一項に記載の方法。
【請求項7】
RTTに関連する前記SNPが、アミノ酸168位、133位、255位、270位、もしくは306位にア
ルギニン、または158位にスレオニンを含むMecp2ポリペプチドの発現をもたらす、請求項
1から6のいずれか一項に記載の方法。
【請求項8】
前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、Streptococcus pyogenes
のCas9(SpCas9)またはそのバリアントである、請求項1から7のいずれか一項に記載の方
法。
【請求項9】
前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、改変されたプロトスペー
サー隣接モチーフ(PAM)特異性を有する改変されたSpCas9を含む、請求項1から8のいず
れか一項に記載の方法。
【請求項10】
前記改変されたSpCas9が、核酸配列5'-NGT-3'に対する特異性を有する、請求項9に記載
の方法。
【請求項11】
前記改変されたSpCas9が、アミノ酸置換L1111R、D1135V、G1218R、E1219F、A1322R、R1
335V、T1337R、ならびにL1111、D1135L、S1136R、G1218S、E1219V、D1332A、D1332S、D13
32T、D1332V、D1332L、D1332K、D1332R、R1335Q、T1337、T1337L、T1337Q、T1337I、T133
7V、T1337F、T1337S、T1337N、T1337K、T1337H、T1337Q、およびT1337Mのうち1つもしく
は複数、またはその対応するアミノ酸置換を含む、請求項10に記載の方法。
【請求項12】
前記改変されたSpCas9が、アミノ酸置換D1135L、S1136R、G1218S、E1219V、A1322R、R1
335Q、およびT1337、ならびにL1111R、G1218R、E1219F、D1332A、D1332S、D1332T、D1332
V、D1332L、D1332K、D1332R、T1337L、T1337I、T1337V、T1337F、T1337S、T1337N、T1337
K、T1337R、T1337H、T1337Q、およびT1337Mのうち1つもしくは複数、またはその対応する
アミノ酸置換を含む、請求項10に記載の方法。
【請求項13】
前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、ヌクレアーゼ不活性バリ
アントまたはニッカーゼバリアントである、請求項1から12のいずれか一項に記載の方法
。
【請求項14】
前記ニッカーゼバリアントが、アミノ酸置換D10Aまたはその対応するアミノ酸置換を含
む、請求項13に記載の方法。
【請求項15】
前記アデノシンデアミナーゼドメインが、デオキシリボ核酸(DNA)中のアデノシンを
脱アミノ化することができる、請求項1から14のいずれか一項に記載の方法。
【請求項16】
前記アデノシンデアミナーゼが、TadAデアミナーゼである、請求項15に記載の方法。
【請求項17】
前記TadAデアミナーゼが、TadA*7.10である、請求項15または16に記載の方法。
【請求項18】
前記1つまたは複数のガイドRNAが、CRISPR RNA(crRNA)およびトランスコード化小RNA
(tracrRNA)を含み、前記crRNAが、RTTに関連するSNPを含むMecp2核酸配列に相補的な核
酸配列を含む、請求項1から17のいずれか一項に記載の方法。
【請求項19】
前記塩基エディターが、RTTに関連するSNPを含むMecp2核酸配列に相補的な核酸配列を
含むシングルガイドRNA(sgRNA)と複合体化している、請求項1から18のいずれか一項に
記載の方法。
【請求項20】
ポリヌクレオチドプログラム可能なDNA結合ドメインおよびアデノシンデアミナーゼド
メインを含む塩基エディターもしくは前記塩基エディターをコードするポリヌクレオチド
、ならびに
前記塩基エディターをターゲティングしてRTTに関連するSNPのA・TからG・Cへの改変を
もたらす1つもしくは複数のガイドポリヌクレオチド
を、細胞またはその前駆体に導入することによって生成される、
細胞。
【請求項21】
ニューロンである、請求項20に記載の細胞。
【請求項22】
前記ニューロンはMecp2ポリペプチドを発現する、請求項20または21に記載の細胞。
【請求項23】
RTTを有する対象からのものである、請求項20から22のいずれか一項に記載の細胞。
【請求項24】
哺乳動物細胞である、請求項20から23のいずれか一項に記載の細胞。
【請求項25】
ヒト細胞である、請求項20から24のいずれか一項に記載の細胞。
【請求項26】
前記改変が、R106W、R168*、R133C、T158M、R255*、R270*、およびR306Cのうち1つまた
は複数である、請求項20から25のいずれか一項に記載の細胞。
【請求項27】
RTTに関連するSNPにおける前記A・TからG・Cへの改変が、メチルCpG結合タンパク質2(
Mecp2)ポリペプチドにおいてシステインをアルギニンに、メチオニンをスレオニンに、
または停止コドンをアルギニンに変更する、請求項20から26のいずれか一項に記載の細胞
。
【請求項28】
RTTに関連するSNPが、アミノ酸168位、133位、255位、270位、もしくは306位にアルギ
ニン、または158位にスレオニンを含むMecp2ポリペプチドの発現をもたらす、請求項20か
ら27のいずれか一項に記載の細胞。
【請求項29】
前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、Streptococcus pyogenes
のCas9(SpCas9)またはそのバリアントである、請求項20から28のいずれか一項に記載の
細胞。
【請求項30】
前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、改変されたプロトスペー
サー隣接モチーフ(PAM)特異性を有する改変されたSpCas9を含む、請求項20から29のい
ずれか一項に記載の細胞。
【請求項31】
前記改変されたSpCas9が、核酸配列5'-NGT-3'に対する特異性を有する、請求項30に記
載の細胞。
【請求項32】
前記改変されたSpCas9が、アミノ酸置換L1111R、D1135V、G1218R、E1219F、A1322R、R1
335V、T1337R、ならびにL1111、D1135L、S1136R、G1218S、E1219V、D1332A、D1332S、D13
32T、D1332V、D1332L、D1332K、D1332R、R1335Q、T1337、T1337L、T1337Q、T1337I、T133
7V、T1337F、T1337S、T1337N、T1337K、T1337H、T1337Q、およびT1337Mのうち1つもしく
は複数、またはその対応するアミノ酸置換を含む、請求項31に記載の細胞。
【請求項33】
前記改変されたSpCas9が、アミノ酸置換D1135L、S1136R、G1218S、E1219V、A1322R、R1
335Q、およびT1337、ならびにL1111R、G1218R、E1219F、D1332A、D1332S、D1332T、D1332
V、D1332L、D1332K、D1332R、T1337L、T1337I、T1337V、T1337F、T1337S、T1337N、T1337
K、T1337R、T1337H、T1337Q、およびT1337Mのうち1つもしくは複数、またはその対応する
アミノ酸置換を含む、請求項31に記載の細胞。
【請求項34】
前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、ヌクレアーゼ不活性バリ
アントまたはニッカーゼバリアントである、請求項20から33のいずれか一項に記載の細胞
。
【請求項35】
前記ニッカーゼバリアントが、アミノ酸置換D10Aまたはその対応するアミノ酸置換を含
む、請求項34に記載の細胞。
【請求項36】
前記アデノシンデアミナーゼドメインが、デオキシリボ核酸(DNA)中のアデノシンを
脱アミノ化することができる、請求項20から35のいずれか一項に記載の細胞。
【請求項37】
前記アデノシンデアミナーゼが、TadAデアミナーゼである、請求項36に記載の細胞。
【請求項38】
前記TadAデアミナーゼが、TadA*7.10である、請求項36または37に記載の細胞。
【請求項39】
前記1つまたは複数のガイドRNAが、CRISPR RNA(crRNA)およびトランスコード化小RNA
(tracrRNA)を含み、前記crRNAが、RTTに関連するSNPを含むMecp2核酸配列に相補的な核
酸配列を含む、請求項20から38のいずれか一項に記載の細胞。
【請求項40】
前記塩基エディターが、RTTに関連するSNPを含むMecp2核酸配列に相補的な核酸配列を
含むシングルガイドRNA(sgRNA)と複合体化している、請求項20から39のいずれか一項に
記載の細胞。
【請求項41】
対象におけるRTTを治療する方法であって、請求項1から40のいずれか一項に記載の細胞
を対象に投与することを含む、方法。
【請求項42】
対象におけるRTTを治療する方法であって、
ポリヌクレオチドプログラム可能なDNA結合ドメインおよびアデノシンデアミナーゼド
メインを含む塩基エディターまたは前記塩基エディターをコードするポリヌクレオチド、
および
前記塩基エディターをターゲティングしてRTTに関連するSNPのA・TからG・Cへの改変を
もたらす1つもしくは複数のガイドポリヌクレオチド
を前記対象に投与することを含む、
方法。
【請求項43】
前記対象が、哺乳動物またはヒトである、請求項42に記載の方法。
【請求項44】
前記塩基エディターまたはそれをコードするポリヌクレオチドと、前記1つもしくは複
数のガイドポリヌクレオチドとを、前記対象の細胞に送達することを含む、請求項42また
は43に記載の方法。
【請求項45】
前記細胞がニューロンである、請求項42から44のいずれか一項に記載の方法。
【請求項46】
前記改変が、R106W、R168*、R133C、T158M、R255*、R270*、およびR306Cのうち1つまた
は複数である、請求項42から45のいずれか一項に記載の方法。
【請求項47】
RTTに関連するSNPにおける前記A・TからG・Cへの改変が、メチルCpG結合タンパク質2(
Mecp2)ポリペプチドにおいてシステインをアルギニンに、メチオニンをスレオニンに、
または停止コドンをアルギニンに変更する、請求項42から46のいずれか一項に記載の方法
。
【請求項48】
RTTに関連するSNPが、アミノ酸168位、133位、255位、270位、もしくは306位にアルギ
ニン、または158位にスレオニンを含むMecp2ポリペプチドの発現をもたらす、請求項42か
ら47のいずれか一項に記載の方法。
【請求項49】
前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、Streptococcus pyogenes
のCas9(SpCas9)またはそのバリアントである、請求項42から48のいずれか一項に記載の
方法。
【請求項50】
前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、改変されたプロトスペー
サー隣接モチーフ(PAM)特異性を有する改変されたSpCas9を含む、請求項42から49のい
ずれか一項に記載の方法。
【請求項51】
前記改変されたSpCas9が、核酸配列5'-NGT-3'に対する特異性を有する、請求項50に記
載の方法。
【請求項52】
前記改変されたSpCas9が、アミノ酸置換L1111R、D1135V、G1218R、E1219F、A1322R、R1
335V、T1337R、ならびにL1111、D1135L、S1136R、G1218S、E1219V、D1332A、R1335Q、T13
37、T1337L、T1337Q、T1337I、T1337V、T1337F、およびT1337Mのうち1つもしくは複数、
またはその対応するアミノ酸置換を含む、請求項51に記載の方法。
【請求項53】
前記改変されたSpCas9が、アミノ酸置換D1135L、S1136R、G1218S、E1219V、A1322R、R1
335Q、およびT1337、ならびにL1111R、D1135L、S1136R、G1218S、E1219V、D1332A、D1332
S、D1332T、D1332V、D1332L、D1332K、D1332R、R1335Q、T1337、T1337L、T1337Q、T1337I
、T1337V、T1337F、T1337S、T1337N、T1337K、T1337R、T1337H、T1337Q、およびT1337Mの
うち1つもしくは複数、またはその対応するアミノ酸置換を含む、請求項52に記載の方法
。
【請求項54】
前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、ヌクレアーゼ不活性バリ
アントまたはニッカーゼバリアントである、請求項42から53のいずれか一項に記載の方法
。
【請求項55】
前記ニッカーゼバリアントが、アミノ酸置換D10Aまたはその対応するアミノ酸置換を含
む、請求項54に記載の方法。
【請求項56】
前記アデノシンデアミナーゼドメインが、デオキシリボ核酸(DNA)中のアデノシンを
脱アミノ化することができる、請求項42から55のいずれか一項に記載の方法。
【請求項57】
前記アデノシンデアミナーゼが、TadAデアミナーゼである、請求項55または56に記載の
方法。
【請求項58】
前記TadAデアミナーゼが、TadA*7.10である、請求項55から57のいずれか一項に記載の
方法。
【請求項59】
前記1つまたは複数のガイドRNAが、CRISPR RNA(crRNA)およびトランスコード化小RNA
(tracrRNA)を含み、前記crRNAが、RTTに関連するSNPを含むMecp2核酸配列に相補的な核
酸配列を含む、請求項55から58のいずれか一項に記載の方法。
【請求項60】
前記塩基エディターが、RTTに関連するSNPを含むMecp2核酸配列に相補的な核酸配列を
含むシングルガイドRNA(sgRNA)と複合体化している、請求項55から59のいずれか一項に
記載の方法。
【請求項61】
(i)アミノ酸置換L1111R、D1135V、G1218R、E1219F、A1322R、R1335V、T1337R、ならび
にL1111、D1135L、S1136R、G1218S、E1219V、D1332A、D1332S、D1332T、D1332V、D1332L
、D1332K、D1332R、R1335Q、T1337、T1337L、T1337Q、T1337I、T1337V、T1337F、T1337S
、T1337N、T1337K、T1337H、T1337Q、およびT1337Mのうち1つもしくは複数、またはその
対応するアミノ酸置換を含む、改変されたSpCas9と、
(ii)アデノシンデアミナーゼと
を含む、塩基エディター。
【請求項62】
(i)アミノ酸置換D1135L、S1136R、G1218S、E1219V、A1322R、R1335Q、およびT1337、な
らびにL1111R、G1218R、E1219F、D1332A、D1332S、D1332T、D1332V、D1332L、D1332K、D1
332R、T1337L、T1337I、T1337V、T1337F、T1337S、T1337N、T1337K、T1337R、T1337H、T1
337Q、およびT1337Mのうち1つもしくは複数、またはその対応するアミノ酸置換を含む、
改変されたSpCas9と、
(ii)アデノシンデアミナーゼと
を含む、塩基エディター。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願
本出願は、それぞれが参照により全体として本明細書に組み込まれる2018年5月11日出
願の米国仮特許出願62/670,558、2018年12月17日出願の米国仮特許出願62/780,838、およ
び2019年3月13日出願の米国仮特許出願62/817,986の優先権および利益を主張する。
【背景技術】
【0002】
レット症候群(RTTまたはRETT)は、中枢神経系(CNS)において、そのコードされたタ
ンパク質がクロマチンおよび転写状態を修飾する能力を損傷しまたは無効にする、メチル
-CpG-結合タンパク質2(Mecp2)の変異の不均一な群によって惹起される。機能性Mecp2を
送達する遺伝子療法または内因性Mecp2 mRNA転写産物を修復するRNA編集を用いることは
、CNS全体に幅広く送達される場合には、治療介入への有望なアプローチとなる。しかし
、いずれのアプローチも治療の有効性を達成するためには重要な課題を克服しなければな
らない。Mecp2遺伝子治療は、細胞あたりに送達される遺伝子の用量を厳密に制御しなけ
ればならず、さもなければMecp2複製症候群の表現型を模倣する危険性がある。RNA編集の
プラットフォームは、RTT診断の45%超を占める最も罹患率が高いMecp2の変異を精密に補
正することができず、また誘導されないオフターゲットの編集を高効率で誘起する。
【0003】
レット症候群を引き起こすMecp2の遺伝子変異は高度に不均一である。その結果、治療
のために好まれてきた戦略は、組み換えアデノ随伴ウイルス(rAAV)によって運搬される
野生型Mecp2を送達することであった。この戦略はそれぞれの個体における原因となる変
異に対しては不可知であるので、成功する遺伝子治療のアプローチはRTTの患者集団の中
の大きな部分に対する治療の選択を提供し得る。しかし現在までには、この戦略は限定さ
れた成功しか得ていない。RTT患者はほぼ常にヘテロ接合体の女性であり、ランダムなX染
色体の不活化により、中枢神経系(CNS)の内部において特徴的な野生型および変異型のX
関連Mecp2モザイク発現をもたらす。したがって、既に野生型Mecp2を発現しているニュー
ロンにおけるrAAVの送達および野生型Mecp2の発現は、Mecp2複製症候群の表現型を部分的
に模倣する可能性がある。これと一致して、RTTモデルマウスのCNSにおける高い形質導入
効率は、野生型マウスにおいて見られるよりほぼ2倍大きなMecp2の発現をもたらした。
【0004】
したがって、レット症候群の患者を治療するための新規な組成物および方法へのニーズ
が存在する。
【0005】
参照による組込み
本明細書で述べる全ての出版物、特許、および特許出願は、それぞれの個別の出版物、
特許、および特許出願が具体的かつ個別に参照により組み込まれると示されているのと同
じ程度に、参照により本明細書に組み込まれる。その他に指示がなければ、本明細書で述
べる出版物、特許、および特許出願は、参照により全体として本明細書に組み込まれる。
【発明の概要】
【0006】
以下に述べるように、本発明はプログラム可能な核酸塩基エディターを用いて病原性ア
ミノ酸を精密に補正するための組成物および方法を特徴としている。特に、本発明の組成
物および方法は、レット症候群(RTT)の治療に有用である。即ち、本発明はアデノシン
(A)塩基エディター(ABE)を用いて内因性Mecp2遺伝子の中の単一ヌクレオチド多型を
精密に補正し、有害な変異(たとえばR133C、T158M、R255*、R270*、R306C)を補正する
、レット症候群を治療するための組成物および方法を提供する。
【0007】
一態様では、本発明はレット症候群(RTT)に関連する単一ヌクレオチド多型(SNP)を
含むMECP2ポリヌクレオチドを編集する方法を提供し、本方法はMECP2ポリヌクレオチドを
、1つまたは複数のガイドポリヌクレオチドと複合体化した塩基エディターと接触させる
ステップを含み、塩基エディターは、ポリヌクレオチドプログラム可能なDNA結合ドメイ
ンおよびアデノシンデアミナーゼドメインを含み、ガイドポリヌクレオチドの1つまたは
複数は、塩基エディターをターゲティング(標的指向化)してRTTに関連するSNPのA・Tか
らG・Cへの改変をもたらす。
【0008】
別の態様では、本発明は、塩基エディターまたは塩基エディターをコードするポリヌク
レオチドを細胞またはその前駆体に導入することによって生成される細胞であって、塩基
エディターがポリヌクレオチドプログラム可能なDNA結合ドメインおよびアデノシンデア
ミナーゼドメイン、ならびに塩基エディターをターゲティングしてRTTに関連するSNPのA
・TからG・Cへの改変をもたらす1つもしくは複数のガイドポリヌクレオチドを含む、細胞
を提供する。
【0009】
別の態様では、本発明は対象におけるRTTを治療する方法であって、塩基エディターま
たは塩基エディターをコードするポリヌクレオチドを前記対象に投与するステップを含み
、塩基エディターはポリヌクレオチドプログラム可能なDNA結合ドメインおよびアデノシ
ンデアミナーゼドメイン、ならびに塩基エディターをターゲティングしてRTTに関連するS
NPのA・TからG・Cへの改変をもたらす1つもしくは複数のガイドポリヌクレオチドを含む
、方法を提供する。
【0010】
別の態様では、本発明は(i)アミノ酸置換L1111R、D1135V、G1218R、E1219F、A1322R
、R1335V、T1337RならびにL1111、D1135L、S1136R、G1218S、E1219V、D1332A、R1335Q、T
1337、T1337L、T1337Q、T1337I、T1337V、T1337FおよびT1337Mのうち1つもしくは複数、
またはそれらの対応するアミノ酸置換を含む修飾(改変)されたSpCas9、ならびに(ii)
アデノシンデアミナーゼを含む塩基エディターを提供する。
【0011】
別の態様では、本発明は(i)アミノ酸置換D1135L、S1136R、G1218S、E1219V、A1322R
、R1335Q、およびT1337、ならびにL1111R、G1218R、E1219F、D1332A、D1332S、D1332T、D
1332V、D1332L、D1332K、D1332R、T1337L、T1337I、T1337V、T1337F、T1337S、T1337N、T
1337K、T1337R、T1337H、T1337Q、およびT1337Mのうち1つもしくは複数、またはそれらの
対応するアミノ酸置換を含む修飾されたSpCas9、ならびに(ii)アデノシンデアミナーゼ
を含む塩基エディターを提供する。
【0012】
種々の実施形態では、接触させるステップは、細胞中、真核細胞中、哺乳動物細胞中、
またはヒト細胞中である。種々の実施形態では、細胞はin vivoまたはex vivoである。種
々の実施形態では、改変は、R106W、R168*、R133C、T158M、R255*、R270*、およびR306C
のうち1つまたは複数である。種々の実施形態では、RTTに関連するSNPにおけるA・TからG
・Cへの改変は、メチルCpG結合タンパク質2(MeCP2)ポリペプチドにおいてシステインを
アルギニンに、メチオニンをスレオニンに、または停止コドンをアルギニンに変更する。
種々の実施形態では、RTTに関連するSNPは、アミノ酸168位、133位、255位、270位、もし
くは306位にアルギニン、または158位にスレオニンを含むMecp2ポリペプチドの発現をも
たらす。種々の実施形態では、ポリヌクレオチドプログラム可能なDNA結合ドメインは、S
treptococcus pyogenesのCas9(SpCas9)またはそのバリアントである。種々の実施形態
では、ポリヌクレオチドプログラム可能なDNA結合ドメインは、改変されたプロトスペー
サー隣接モチーフ(PAM)特異性を有する修飾されたSpCas9を含む。種々の実施形態では
、改変されたPAMは、核酸配列5'-NGT-3'に対する特異性を有する。種々の実施形態では、
修飾されたSpCas9は、アミノ酸置換L1111R、D1135V、G1218R、E1219F、A1322R、R1335V、
T1337R、ならびにL1111、D1135L、S1136R、G1218S、E1219V、D1332A、D1332S、D1332T、D
1332V、D1332L、D1332K、D1332R、R1335Q、T1337、T1337L、T1337Q、T1337I、T1337V、T1
337F、T1337S、T1337N、T1337K、T1337H、T1337Q、およびT1337Mのうち1つもしくは複数
、またはその対応するアミノ酸置換を含む。種々の実施形態では、修飾されたSpCas9は、
アミノ酸置換D1135L、S1136R、G1218S、E1219V、A1322R、R1335Q、およびT1337、ならび
にL1111R、G1218R、E1219F、D1332A、D1332S、D1332T、D1332V、D1332L、D1332K、D1332R
、T1337L、T1337I、T1337V、T1337F、T1337S、T1337N、T1337K、T1337R、T1337H、T1337Q
、およびT1337Mのうち1つもしくは複数、またはその対応するアミノ酸置換を含む。種々
の実施形態では、ポリヌクレオチドプログラム可能なDNA結合ドメインは、ヌクレアーゼ
不活性またはニッカーゼバリアントである。種々の実施形態では、ニッカーゼバリアント
は、アミノ酸置換D10Aまたはその対応するアミノ酸置換を含む。種々の実施形態では、ア
デノシンデアミナーゼドメインは、デオキシリボ核酸(DNA)中のアデノシンを脱アミノ
化することができる。種々の実施形態では、アデノシンデアミナーゼは、天然には産生し
ない修飾(改変)されたアデノシンデアミナーゼである。種々の実施形態では、アデノシ
ンデアミナーゼは、TadAデアミナーゼである。種々の実施形態では、TadAデアミナーゼは
、TadA*7.10である。種々の実施形態では、1つまたは複数のガイドRNAは、CRISPR RNA(c
rRNA)およびトランスコード化小RNA(tracrRNA)を含み、crRNAは、RTTに関連するSNPを
含むMecp2核酸配列に相補的な核酸配列を含む。種々の実施形態では、塩基エディターは
、RTTに関連するSNPを含むMecp2核酸配列に相補的な核酸配列を含むシングルガイドRNA(
sgRNA)と複合体化している。種々の実施形態では、細胞は、ニューロンである。種々の
実施形態では、ニューロンは、Mecp2ポリペプチドを発現する。種々の実施形態では、細
胞は、RTTを有する対象からのものである。
【0013】
本開示の特徴を、特に添付した特許請求の範囲における特殊性とともに説明する。本開
示の原理を利用する実例となる実施形態を説明する以下の詳細な記述および添付した図面
を参照することによって、本発明の特徴および利点のより良い理解が得られる。
【図面の簡単な説明】
【0014】
【
図1】NGT PAMへの特異性を有する塩基エディターバリアントを用いたR255X RTT変異の正確な補正の百分率を示すグラフである。
【0015】
【
図2】NGT PAMへの特異性を有する塩基エディターバリアントを用いたR255X RTT変異の正確な補正の百分率を示すグラフである。
【0016】
【
図3】アミノ酸置換T1337LによるPAMバリアント最適化を示すグラフである。NGT PAMに対する特異性を有する塩基エディターバリアントを用いるR255X RTT変異の正確な補正の百分率を示す。
【0017】
【
図4】他の特徴付けされたPAMバリアントからのシャフリング変異によって産生されたNGT PAMへの特異性を有するPAM塩基エディターバリアントによるR255X RTT変異の正確な補正の百分率を示すグラフである。T1337Qは編集効率に重要であることが確認された。
【0018】
【
図5】T1337およびD1332を他のアミノ酸に置換した場合の塩基編集効率における変化を示すグラフである。NGT PAMへの特異性を有する塩基エディターバリアントを用いるR255X RTT変異の正確な補正の百分率を示す。
【0019】
【
図6】T1337に関連する塩基編集活性に対するE1219VおよびR1335Qの重要性を示すグラフである。NGT PAMに対する特異性を有する塩基エディターバリアントを用いるR255X RTT変異の正確な補正の百分率を示す。
【0020】
【
図7】表8および表9に列挙したNGT PAMバリアントに対する特異性を有するPAMバリアント塩基エディターを用いるR255X RTT変異の正確な補正の百分率を示すグラフである。
【0021】
【
図8】表8および表9に列挙したNGT PAMバリアントに対する特異性を有するPAMバリアント塩基エディターを用いるR255X RTT変異の正確な補正の百分率を示すグラフである。
【0022】
【
図9】表10に列挙したNGT PAMバリアントに対する特異性を有するPAMバリアント塩基エディターを用いるR255X RTT変異の正確な補正の百分率を示すグラフである。
【発明を実施するための形態】
【0023】
進行性の神経発達障害であるレット症候群(RTT)およびその症状に原因として関連し
ているメチル-CpG結合タンパク質2(Mecp2)遺伝子における1つまたは複数の変異を正確
に補正する塩基編集および塩基編集システムを提供する組成物および方法を本明細書に記
載する。RTTは主として女性が罹患するX染色体連鎖優性の障害であり、罹患した個体の96
%でMecp2遺伝子の変異に関連しており、初期の発達では見かけ上正常であるが、その後に
微細な運動能力および効果的な意思疎通の喪失を伴う退行、固定的な動作、ならびに失行
または歩行の完全な喪失が続くという特徴を有する。罹患者のさらなる臨床的特徴には、
出生後の頭部の成長速度の異常な減速、周期的な呼吸、胃腸管の機能不全、てんかん、お
よび脊柱側弯症が含まれる。
【0024】
RTTを引き起こす最も優勢な変異はC・GからT・Aへの塩基対置換をもたらすシチジンか
らチミジンへの(C→T)転位変異である。この置換は、A・TからG・Cへの置換を触媒する
アデノシン塩基エディター(ABE)によって野生型の非病原性ゲノム配列に逆行させるこ
とができる。拡張すれば、RTTを引き起こす高度に優勢な変異は、遺伝子治療を用いる場
合に起こることがあるMecp2遺伝子の過発現を誘導する危険なしに、ABEを用いて野生型配
列に逆行させるための潜在的な標的である。したがって、A・TからG・CへのDNA塩基編集
は、Mecp2遺伝子におけるRTTを引き起こす最も優勢な変異の1つまたは複数を正確に補正
する可能性を有している。
【0025】
以下の記載および実施例によって、本開示の実施形態を詳細に説明する。本開示は本明
細書に記載した特定の実施形態に限定されず、したがって変動し得ることを理解されたい
。当業者であれば、本開示にはその範囲に包含される数多くの変形および改変が存在する
ことが理解される。
【0026】
本明細書で用いる見出しは整理の目的のためのみであり、記載した主題を限定するもの
と解釈すべきではない。
【0027】
本開示の種々の特徴を単一の実施形態の文脈で記載することができるが、これらの特徴
は別々にまたは任意の好適な組合せで提供することもできる。逆に、本開示は明確さのた
めに別々の実施形態の文脈で本明細書に記載することができるが、本開示は単一の実施形
態で実行することもできる。
【0028】
定義
他に定義しなければ、本明細書で用いる全ての技術用語および科学用語は、本発明が属
する技術分野の当業者によって共通に理解される意味を有する。以下の参照文献は、技能
の1つに本発明で用いる用語の多くについての一般的な定義を提供する。Singleton et al
., Dictionary of Microbiology and Molecular Biology (2nd ed. 1994); The Cambridg
e Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genet
ics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); and Hale & Marham
, The Harper Collins Dictionary of Biology (1991).
【0029】
本出願では、単数の使用は、他に具体的に述べなければ複数を含む。本明細書で用いる
場合、単数形の「a」、「an」、および「the」は、文脈によって明確に他が指示されなけ
れば複数の指示対象を含むことに留意しなければならない。本出願では、「または」の使
用は他に述べなければ「および/または」を意味する。さらに、用語「含む(including)
」ならびに「include」、「includes」、および「included」等のその他の形の使用は限
定的ではない。
【0030】
本明細書および特許請求の範囲で用いる場合、単語「含む(comprising)」(ならびに
「comprise」および「comprises」等のcomprisingの任意の形態)、「有する(having)
」(ならびに「have」および「has」等のhavingの任意の形態)、「含む(including)」
(ならびに「includes」および「include」等のincludingの任意の形態)、または「含む
(containing)」(ならびに「contains」および「contain」等のcontainingの任意の形
態)は、包括的かつオープンエンドであり、引用されていない追加的な要素または方法ス
テップを除外しない。本明細書で論じるいずれの実施形態も本開示のいずれの方法または
組成物に関しても実施することができ、逆もそうであることが意図されている。さらに、
本開示の組成物は本開示の方法を達成するために用いることができる。
【0031】
用語「約」または「ほぼ」は、当業者によって決定される特定の値について許容される
誤差範囲内にあることを意味し、これは部分的にその値がどのように測定されまたは決定
されたか、即ち測定システムの限界によることになる。たとえば、「約」は、当技術の実
施ごとに1またはそれを超える標準偏差の範囲内にあることを意味し得る。あるいは、「
約」は、所与の値の20%まで、10%まで、5%まで、または1%までの範囲を意味し得る。ある
いは、特に生物学的システムまたはプロセスに関して、この用語はある値の1桁以内、好
ましくは5倍以内、より好ましくは2倍以内を意味し得る。本出願および特許請求の範囲で
特定の値が記載されている場合には、他に述べない限り、その特定の値についての許容さ
れる誤差範囲内を意味する用語「約」を仮定すべきである。
【0032】
本明細書で提供する範囲は、その範囲内の値の全てについての簡略形と理解される。た
とえば、1~50の範囲は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17
、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37
、38、39、40、41、42、43、44、45、46、47、48、49、または50からなる群の中の任意の
数、数の組合せ、またはサブ範囲を含むと理解される。
【0033】
「いくつかの実施形態」、「一(a)実施形態」、「一(one)実施形態」、または「他
の実施形態」についての明細書中での言及は、実施形態に関連して記述した特定の特色、
構造、または特徴が本開示の少なくともいくつかの実施形態に含まれるが、必ずしも全て
の実施形態には含まれないことを意味する。
【0034】
「アデノシンデアミナーゼ」は、アデニンまたはアデノシンの加水分解的脱アミノ化を
触媒することができるポリペプチドまたはその断片を意味する。いくつかの実施形態では
、デアミナーゼまたはデアミナーゼドメインは、アデノシンのイノシンへの、またはデオ
キシアデノシンのデオキシイノシンへの加水分解的脱アミノ化を触媒するアデノシンデア
ミナーゼである。いくつかの実施形態では、アデノシンデアミナーゼは、デオキシリボ核
酸(DNA)におけるアデニンまたはアデノシンの加水分解的脱アミノ化を触媒する。本明
細書で提供するアデノシンデアミナーゼ(たとえば操作されたアデノシンデアミナーゼ、
進化されたアデノシンデアミナーゼ)は、細菌等の任意の生命体からのものでよい。
【0035】
「薬剤」は、任意の小分子化学化合物、抗体、核酸分子、もしくはポリペプチド、また
はそれらの断片を意味する。
【0036】
「改善する」は、疾患の進展または進行を低減し、抑制し、減衰させ、縮小し、阻止し
、または安定化させることを意味する。
【0037】
「改変」は、本明細書に記載したような標準的な技術で既知の方法によって検出される
遺伝子またはポリペプチドの発現レベルまたは活性の変化(増大または低減)を意味する
。本明細書で用いる場合、改変には発現レベルの10%の変化、好ましくは発現レベルの25%
の変化、より好ましくは40%の変化、最も好ましくは50%またはそれを超える変化が含まれ
る。
【0038】
「アナログ」は、同一ではないが同様の機能的または構造的な特徴を有する分子を意味
する。たとえば、ポリペプチドアナログは対応する天然産生のポリペプチドの生物学的活
性を保持しているが、天然産生のポリペプチドに対してアナログの機能を強化するある種
の生化学的修飾を有している。そのような生化学的修飾は、たとえばリガンド結合性を改
変することなく、アナログのプロテアーゼ耐性、膜透過性、または半減期を増大させるこ
とができる。アナログには非天然アミノ酸が含まれ得る。
【0039】
「投与」は、本明細書では本明細書に記載した1つまたは複数の組成物を患者または対
象に提供することを意味する。例として限定なく、組成物の投与、たとえば注射は、静脈
内(iv)注射、皮下(sc)注射、皮内(id)注射、腹腔内(ip)注射、または筋肉内(im
)注射によって実施することができる。1つまたは複数のそのような経路を採用すること
ができる。非経口投与は、たとえばボーラス注射または経時的な漸次の潅流によってよい
。あるいはまたは同時に、投与は経口経路であってもよい。
【0040】
「シチジンデアミナーゼ」は、アミノ基をカルボニル基に変換する脱アミノ化反応を触
媒することができるポリペプチドまたはその断片を意味する。一実施形態では、シチジン
デアミナーゼはシトシンをウラシルに、または5-メチルシトシンをチミンに変換する。Pe
tromyzon marinusから誘導されるPmCDA1(Petromyzon marinusシチジンデアミナーゼ1、
「PmCDA1」)、哺乳動物(たとえばヒト、ブタ、ウシ、ウマ、サル、その他)から誘導さ
れるAID(活性誘起シチジンデアミナーゼ、AICDA)、およびAPOBECは例示的なシチジンデ
アミナーゼである。
【0041】
「メチルCpG結合タンパク質2(Mecp2)タンパク質」は、NCBI Accession No. NP_00498
3と少なくとも約95%のアミノ酸配列同一性を有するポリペプチドまたはその断片を意味す
る。特定の実施形態では、Mecp2タンパク質は以下の参照配列に対して1つまたは複数の改
変を含む。特定の実施形態では、RTTに関連するMecp2タンパク質は、R106W、R168*、R133
C、T158M、R255*、R270*、およびR306Cから選択される1つまたは複数の変異を含む。例
示的なMecp2アミノ酸配列を以下に提供する。
1 mvagmlglre eksedqdlqg lkdkplkfkk vkkdkkeeke gkhepvqpsa hhsaepaeag
61 kaetsegsgs apavpeasas pkqrrsiird rgpmyddptl pegwtrklkq rksgrsagky
121 dvylinpqgk afrskvelia yfekvgdtsl dpndfdftvt grgspsrreq kppkkpkspk
181 apgtgrgrgr pkgsgttrpk aatsegvqvk rvlekspgkl lvkmpfqtsp ggkaegggat
241 tstqvmvikr pgrkrkaead pqaipkkrgr kpgsvvaaaa aeakkkavke ssirsvqetv
301 lpikkrktre tvsievkevv kpllvstlge ksgkglktck spgrkskess pkgrsssass
361 ppkkehhhhh hhsespkapv pllpplpppp pepessedpt sppepqdlss svckeekmpr
421 ggslesdgcp kepaktqpav ataataaeky khrgegerkd ivsssmprpn reepvdsrtp
481 vtervs
【0042】
「Mecp2ポリヌクレオチド」は、Mecp2タンパク質またはその断片をコードする核酸分子
を意味する。NCBI Accession No. NM_004992で入手可能な例示的なMecp2ポリヌクレオチ
ドの配列を以下に提供する。特定の実施形態では、Mecp2ポリヌクレオチドは以下の参照
配列に対して1つまたは複数の改変を含む。特定の実施形態では、RTTに関連するMecp2ポ
リヌクレオチドは、316C>T、397C>T、473C>T、763C>T、808C>Tおよび916C>Tから選択され
る1つまたは複数の変異を含む。
1 ccggcgtcgg cggcgcgcgc gctccctcct ctcggagaga gggctgtggt aaaagccgtc
61 cggaaaatgg ccgccgccgc cgccgccgcg ccgagcggag gaggaggagg aggcgaggag
121 gagagactgc tccataaaaa tacagactca ccagttcctg ctttgatgtg acatgtgact
181 ccccagaata caccttgctt ctgtagacca gctccaacag gattccatgg tagctgggat
241 gttagggctc agggaagaaa agtcagaaga ccaggacctc cagggcctca aggacaaacc
301 cctcaagttt aaaaaggtga agaaagataa gaaagaagag aaagagggca agcatgagcc
361 cgtgcagcca tcagcccacc actctgctga gcccgcagag gcaggcaaag cagagacatc
421 agaagggtca ggctccgccc cggctgtgcc ggaagcttct gcctccccca aacagcggcg
481 ctccatcatc cgtgaccggg gacccatgta tgatgacccc accctgcctg aaggctggac
541 acggaagctt aagcaaagga aatctggccg ctctgctggg aagtatgatg tgtatttgat
601 caatccccag ggaaaagcct ttcgctctaa agtggagttg attgcgtact tcgaaaaggt
661 aggcgacaca tccctggacc ctaatgattt tgacttcacg gtaactggga gagggagccc
721 ctcccggcga gagcagaaac cacctaagaa gcccaaatct cccaaagctc caggaactgg
781 cagaggccgg ggacgcccca aagggagcgg caccacgaga cccaaggcgg ccacgtcaga
841 gggtgtgcag gtgaaaaggg tcctggagaa aagtcctggg aagctccttg tcaagatgcc
901 ttttcaaact tcgccagggg gcaaggctga ggggggtggg gccaccacat ccacccaggt
961 catggtgatc aaacgccccg gcaggaagcg aaaagctgag gccgaccctc aggccattcc
1021 caagaaacgg ggccgaaagc cggggagtgt ggtggcagcc gctgccgccg aggccaaaaa
1081 gaaagccgtg aaggagtctt ctatccgatc tgtgcaggag accgtactcc ccatcaagaa
1141 gcgcaagacc cgggagacgg tcagcatcga ggtcaaggaa gtggtgaagc ccctgctggt
1201 gtccaccctc ggtgagaaga gcgggaaagg actgaagacc tgtaagagcc ctgggcggaa
1261 aagcaaggag agcagcccca aggggcgcag cagcagcgcc tcctcacccc ccaagaagga
1321 gcaccaccac catcaccacc actcagagtc cccaaaggcc cccgtgccac tgctcccacc
1381 cctgccccca cctccacctg agcccgagag ctccgaggac cccaccagcc cccctgagcc
1441 ccaggacttg agcagcagcg tctgcaaaga ggagaagatg cccagaggag gctcactgga
1501 gagcgacggc tgccccaagg agccagctaa gactcagccc gcggttgcca ccgccgccac
1561 ggccgcagaa aagtacaaac accgagggga gggagagcgc aaagacattg tttcatcctc
1621 catgccaagg ccaaacagag aggagcctgt ggacagccgg acgcccgtga ccgagagagt
1681 tagctgactt tacacggagc ggattgcaaa gcaaaccaac aagaataaag gcagctgttg
1741 tctcttctcc ttatgggtag ggctctgaca aagcttcccg attaactgaa ataaaaaata
1801 tttttttttc tttcagtaaa cttagagttt cgtggcttca gggtgggagt agttggagca
1861 ttggggatgt ttttcttacc gacaagcaca gtcaggttga agacctaacc agggccagaa
1921 gtagctttgc acttttctaa actaggctcc ttcaacaagg cttgctgcag atactactga
1981 ccagacaagc tgttgaccag gcacctcccc tcccgcccaa acctttcccc catgtggtcg
2041 ttagagacag agcgacagag cagttgagag gacactcccg ttttcggtgc catcagtgcc
2101 ccgtctacag ctcccccagc tccccccacc tcccccactc ccaaccacgt tgggacaggg
2161 aggtgtgagg caggagagac agttggattc tttagagaag atggatatga ccagtggcta
2221 tggcctgtgc gatcccaccc gtggtggctc aagtctggcc ccacaccagc cccaatccaa
2281 aactggcaag gacgcttcac aggacaggaa agtggcacct gtctgctcca gctctggcat
2341 ggctaggagg ggggagtccc ttgaactact gggtgtagac tggcctgaac cacaggagag
2401 gatggcccag ggtgaggtgg catggtccat tctcaaggga cgtcctccaa cgggtggcgc
2461 tagaggccat ggaggcagta ggacaaggtg caggcaggct ggcctggggt caggccgggc
2521 agagcacagc ggggtgagag ggattcctaa tcactcagag cagtctgtga cttagtggac
2581 aggggagggg gcaaaggggg aggagaagaa aatgttcttc cagttacttt ccaattctcc
2641 tttagggaca gcttagaatt atttgcacta ttgagtcttc atgttcccac ttcaaaacaa
2701 acagatgctc tgagagcaaa ctggcttgaa ttggtgacat ttagtccctc aagccaccag
2761 atgtgacagt gttgagaact acctggattt gtatatatac ctgcgcttgt tttaaagtgg
2821 gctcagcaca tagggttccc acgaagctcc gaaactctaa gtgtttgctg caattttata
2881 aggacttcct gattggtttc tcttctcccc ttccatttct gccttttgtt catttcatcc
2941 tttcacttct ttcccttcct ccgtcctcct ccttcctagt tcatcccttc tcttccaggc
3001 agccgcggtg cccaaccaca cttgtcggct ccagtcccca gaactctgcc tgccctttgt
3061 cctcctgctg ccagtaccag ccccaccctg ttttgagccc tgaggaggcc ttgggctctg
3121 ctgagtccga cctggcctgt ctgtgaagag caagagagca gcaaggtctt gctctcctag
3181 gtagccccct cttccctggt aagaaaaagc aaaaggcatt tcccaccctg aacaacgagc
3241 cttttcaccc ttctactcta gagaagtgga ctggaggagc tgggcccgat ttggtagttg
3301 aggaaagcac agaggcctcc tgtggcctgc cagtcatcga gtggcccaac aggggctcca
3361 tgccagccga ccttgacctc actcagaagt ccagagtcta gcgtagtgca gcagggcagt
3421 agcggtacca atgcagaact cccaagaccc gagctgggac cagtacctgg gtccccagcc
3481 cttcctctgc tccccctttt ccctcggagt tcttcttgaa tggcaatgtt ttgcttttgc
3541 tcgatgcaga cagggggcca gaacaccaca catttcactg tctgtctggt ccatagctgt
3601 ggtgtagggg cttagaggca tgggcttgct gtgggttttt aattgatcag ttttcatgtg
3661 ggatcccatc tttttaacct ctgttcagga agtccttatc tagctgcata tcttcatcat
3721 attggtatat ccttttctgt gtttacagag atgtctctta tatctaaatc tgtccaactg
3781 agaagtacct tatcaaagta gcaaatgaga cagcagtctt atgcttccag aaacacccac
3841 aggcatgtcc catgtgagct gctgccatga actgtcaagt gtgtgttgtc ttgtgtattt
3901 cagttattgt ccctggcttc cttactatgg tgtaatcatg aaggagtgaa acatcataga
3961 aactgtctag cacttccttg ccagtcttta gtgatcagga accatagttg acagttccaa
4021 tcagtagctt aagaaaaaac cgtgtttgtc tcttctggaa tggttagaag tgagggagtt
4081 tgccccgttc tgtttgtaga gtctcatagt tggactttct agcatatatg tgtccatttc
4141 cttatgctgt aaaagcaagt cctgcaacca aactcccatc agcccaatcc ctgatccctg
4201 atcccttcca cctgctctgc tgatgacccc cccagcttca cttctgactc ttccccagga
4261 agggaagggg ggtcagaaga gagggtgagt cctccagaac tcttcctcca aggacagaag
4321 gctcctgccc ccatagtggc ctcgaactcc tggcactacc aaaggacact tatccacgag
4381 agcgcagcat ccgaccaggt tgtcactgag aagatgttta ttttggtcag ttgggttttt
4441 atgtattata cttagtcaaa tgtaatgtgg cttctggaat cattgtccag agctgcttcc
4501 ccgtcacctg ggcgtcatct ggtcctggta agaggagtgc gtggcccacc aggcccccct
4561 gtcacccatg acagttcatt cagggccgat ggggcagtcg tggttgggaa cacagcattt
4621 caagcgtcac tttatttcat tcgggcccca cctgcagctc cctcaaagag gcagttgccc
4681 agcctctttc ccttccagtt tattccagag ctgccagtgg ggcctgaggc tccttagggt
4741 tttctctcta tttccccctt tcttcctcat tccctcgtct ttcccaaagg catcacgagt
4801 cagtcgcctt tcagcaggca gccttggcgg tttatcgccc tggcaggcag gggccctgca
4861 gctctcatgc tgcccctgcc ttggggtcag gttgacagga ggttggaggg aaagccttaa
4921 gctgcaggat tctcaccagc tgtgtccggc ccagttttgg ggtgtgacct caatttcaat
4981 tttgtctgta cttgaacatt atgaagatgg gggcctcttt cagtgaattt gtgaacagca
5041 gaattgaccg acagctttcc agtacccatg gggctaggtc attaaggcca catccacagt
5101 ctcccccacc cttgttccag ttgttagtta ctacctcctc tcctgacaat actgtatgtc
5161 gtcgagctcc ccccaggtct acccctcccg gccctgcctg ctggtgggct tgtcatagcc
5221 agtgggattg ccggtcttga cagctcagtg agctggagat acttggtcac agccaggcgc
5281 tagcacagct cccttctgtt gatgctgtat tcccatatca aaagacacag gggacaccca
5341 gaaacgccac atcccccaat ccatcagtgc caaactagcc aacggcccca gcttctcagc
5401 tcgctggatg gcggaagctg ctactcgtga gcgccagtgc gggtgcagac aatcttctgt
5461 tgggtggcat cattccaggc ccgaagcatg aacagtgcac ctgggacagg gagcagcccc
5521 aaattgtcac ctgcttctct gcccagcttt tcattgctgt gacagtgatg gcgaaagagg
5581 gtaataacca gacacaaact gccaagttgg gtggagaaag gagtttcttt agctgacaga
5641 atctctgaat tttaaatcac ttagtaagcg gctcaagccc aggagggagc agagggatac
5701 gagcggagtc ccctgcgcgg gaccatctgg aattggttta gcccaagtgg agcctgacag
5761 ccagaactct gtgtcccccg tctaaccaca gctccttttc cagagcattc cagtcaggct
5821 ctctgggctg actgggccag gggaggttac aggtaccagt tctttaagaa gatctttggg
5881 catatacatt tttagcctgt gtcattgccc caaatggatt cctgtttcaa gttcacacct
5941 gcagattcta ggacctgtgt cctagacttc agggagtcag ctgtttctag agttcctacc
6001 atggagtggg tctggaggac ctgcccggtg ggggggcaga gccctgctcc ctccgggtct
6061 tcctactctt ctctctgctc tgacgggatt tgttgattct ctccattttg gtgtctttct
6121 cttttagata ttgtatcaat ctttagaaaa ggcatagtct acttgttata aatcgttagg
6181 atactgcctc ccccagggtc taaaattaca tattagaggg gaaaagctga acactgaagt
6241 cagttctcaa caatttagaa ggaaaaccta gaaaacattt ggcagaaaat tacatttcga
6301 tgtttttgaa tgaatacgag caagctttta caacagtgct gatctaaaaa tacttagcac
6361 ttggcctgag atgcctggtg agcattacag gcaaggggaa tctggaggta gccgacctga
6421 ggacatggct tctgaacctg tcttttggga gtggtatgga aggtggagcg ttcaccagtg
6481 acctggaagg cccagcacca ccctccttcc cactcttctc atcttgacag agcctgcccc
6541 agcgctgacg tgtcaggaaa acacccaggg aactaggaag gcacttctgc ctgaggggca
6601 gcctgccttg cccactcctg ctctgctcgc ctcggatcag ctgagccttc tgagctggcc
6661 tctcactgcc tccccaaggc cccctgcctg ccctgtcagg aggcagaagg aagcaggtgt
6721 gagggcagtg caaggaggga gcacaacccc cagctcccgc tccgggctcc gacttgtgca
6781 caggcagagc ccagaccctg gaggaaatcc tacctttgaa ttcaagaaca tttggggaat
6841 ttggaaatct ctttgccccc aaacccccat tctgtcctac ctttaatcag gtcctgctca
6901 gcagtgagag cagatgaggt gaaaaggcca agaggtttgg ctcctgccca ctgatagccc
6961 ctctccccgc agtgtttgtg tgtcaagtgg caaagctgtt cttcctggtg accctgatta
7021 tatccagtaa cacatagact gtgcgcatag gcctgctttg tctcctctat cctgggcttt
7081 tgttttgctt tttagttttg cttttagttt ttctgtccct tttatttaac gcaccgacta
7141 gacacacaaa gcagttgaat ttttatatat atatctgtat attgcacaat tataaactca
7201 ttttgcttgt ggctccacac acacaaaaaa agacctgtta aaattatacc tgttgcttaa
7261 ttacaatatt tctgataacc atagcatagg acaagggaaa ataaaaaaag aaaaaaaaga
7321 aaaaaaaacg acaaatctgt ctgctggtca cttcttctgt ccaagcagat tcgtggtctt
7381 ttcctcgctt ctttcaaggg ctttcctgtg ccaggtgaag gaggctccag gcagcaccca
7441 ggttttgcac tcttgtttct cccgtgcttg tgaaagaggt cccaaggttc tgggtgcagg
7501 agcgctccct tgacctgctg aagtccggaa cgtagtcggc acagcctggt cgccttccac
7561 ctctgggagc tggagtccac tggggtggcc tgactccccc agtccccttc ccgtgacctg
7621 gtcagggtga gcccatgtgg agtcagcctc gcaggcctcc ctgccagtag ggtccgagtg
7681 tgtttcatcc ttcccactct gtcgagcctg ggggctggag cggagacggg aggcctggcc
7741 tgtctcggaa cctgtgagct gcaccaggta gaacgccagg gaccccagaa tcatgtgcgt
7801 cagtccaagg ggtcccctcc aggagtagtg aagactccag aaatgtccct ttcttctccc
7861 ccatcctacg agtaattgca tttgcttttg taattcttaa tgagcaatat ctgctagaga
7921 gtttagctgt aacagttctt tttgatcatc tttttttaat aattagaaac accaaaaaaa
7981 tccagaaact tgttcttcca aagcagagag cattataatc accagggcca aaagcttccc
8041 tccctgctgt cattgcttct tctgaggcct gaatccaaaa gaaaaacagc cataggccct
8101 ttcagtggcc gggctacccg tgagcccttc ggaggaccag ggctggggca gcctctgggc
8161 ccacatccgg ggccagctcc ggcgtgtgtt cagtgttagc agtgggtcat gatgctcttt
8221 cccacccagc ctgggatagg ggcagaggag gcgaggaggc cgttgccgct gatgtttggc
8281 cgtgaacagg tgggtgtctg cgtgcgtcca cgtgcgtgtt ttctgactga catgaaatcg
8341 acgcccgagt tagcctcacc cggtgacctc tagccctgcc cggatggagc ggggcccacc
8401 cggttcagtg tttctgggga gctggacagt ggagtgcaaa aggcttgcag aacttgaagc
8461 ctgctccttc ccttgctacc acggcctcct ttccgtttga tttgtcactg cttcaatcaa
8521 taacagccgc tccagagtca gtagtcaatg aatatatgac caaatatcac caggactgtt
8581 actcaatgtg tgccgagccc ttgcccatgc tgggctcccg tgtatctgga cactgtaacg
8641 tgtgctgtgt ttgctcccct tccccttcct tctttgccct ttacttgtct ttctggggtt
8701 tttctgtttg ggtttggttt ggtttttatt tctccttttg tgttccaaac atgaggttct
8761 ctctactggt cctcttaact gtggtgttga ggcttatatt tgtgtaattt ttggtgggtg
8821 aaaggaattt tgctaagtaa atctcttctg tgtttgaact gaagtctgta ttgtaactat
8881 gtttaaagta attgttccag agacaaatat ttctagacac tttttcttta caaacaaaag
8941 cattcggagg gagggggatg gtgactgaga tgagagggga gagctgaaca gatgacccct
9001 gcccagatca gccagaagcc acccaaagca gtggagccca ggagtcccac tccaagccag
9061 caagccgaat agctgatgtg ttgccacttt ccaagtcact gcaaaaccag gttttgttcc
9121 gcccagtgga ttcttgtttt gcttcccctc cccccgagat tattaccacc atcccgtgct
9181 tttaaggaaa ggcaagattg atgtttcctt gaggggagcc aggaggggat gtgtgtgtgc
9241 agagctgaag agctggggag aatggggctg ggcccaccca agcaggaggc tgggacgctc
9301 tgctgtgggc acaggtcagg ctaatgttgg cagatgcagc tcttcctgga caggccaggt
9361 ggtgggcatt ctctctccaa ggtgtgcccc gtgggcatta ctgtttaaga cacttccgtc
9421 acatcccacc ccatcctcca gggctcaaca ctgtgacatc tctattcccc accctcccct
9481 tcccagggca ataaaatgac catggagggg gcttgcactc tcttggctgt cacccgatcg
9541 ccagcaaaac ttagatgtga gaaaacccct tcccattcca tggcgaaaac atctccttag
9601 aaaagccatt accctcatta ggcatggttt tgggctccca aaacacctga cagcccctcc
9661 ctcctctgag aggcggagag tgctgactgt agtgaccatt gcatgccggg tgcagcatct
9721 ggaagagcta ggcagggtgt ctgccccctc ctgagttgaa gtcatgctcc cctgtgccag
9781 cccagaggcc gagagctatg gacagcattg ccagtaacac aggccaccct gtgcagaagg
9841 gagctggctc cagcctggaa acctgtctga ggttgggaga ggtgcacttg gggcacaggg
9901 agaggccggg acacacttag ctggagatgt ctctaaaagc cctgtatcgt attcaccttc
9961 agtttttgtg ttttgggaca attactttag aaaataagta ggtcgtttta aaaacaaaaa
10021 ttattgattg cttttttgta gtgttcagaa aaaaggttct ttgtgtatag ccaaatgact
10081 gaaagcactg atatatttaa aaacaaaagg caatttatta aggaaatttg taccatttca
10141 gtaaacctgt ctgaatgtac ctgtatacgt ttcaaaaaca cccccccccc actgaatccc
10201 tgtaacctat ttattatata aagagtttgc cttataaatt t
【0043】
「塩基エディター(BE)」または「核酸塩基エディター(NBE)」は、ポリヌクレオチ
ドに結合し、核酸塩基修飾活性を有する薬剤を意味する。種々の実施形態では、塩基エデ
ィターは、ガイドポリヌクレオチド(たとえばガイドRNA)に連結された核酸塩基修飾ポ
リペプチド(たとえばデアミナーゼ)およびポリヌクレオチドプログラム可能なヌクレオ
チド結合ドメインを含む。種々の実施形態では、薬剤は塩基編集活性を有するタンパク質
ドメイン、即ち核酸分子(たとえばDNA)中の塩基(たとえばA、T、C、G、またはU)を修
飾することができるドメインを含む生物分子複合体である。いくつかの実施形態では、ポ
リヌクレオチドプログラム可能なDNA結合ドメインはデアミナーゼドメインに融合しまた
は連結されている。一実施形態では、薬剤は塩基編集活性を有するドメインを含む融合タ
ンパク質である。別の実施形態では、塩基編集活性を有するタンパク質ドメインはガイド
RNAに(たとえばガイドRNA上のRNA結合モチーフおよびデアミナーゼに融合したRNA結合ド
メインを介して)連結されている。いくつかの実施形態では、塩基編集活性を有するドメ
インは核酸分子中の塩基を脱アミノ化することができる。いくつかの実施形態では、塩基
エディターはDNA分子中の塩基を脱アミノ化することができる。いくつかの実施形態では
、塩基エディターはDNA中のシトシン(C)またはアデノシン(A)を脱アミノ化すること
ができる。いくつかの実施形態では、塩基エディターはシチジン塩基エディター(CBE)
である。いくつかの実施形態では、塩基エディターはアデノシン塩基エディター(ABE)
である。いくつかの実施形態では、アデノシンデアミナーゼはTadAから進化される。いく
つかの実施形態では、ポリヌクレオチドプログラム可能なDNA結合ドメインはCRISPR関連
(たとえばCasまたはCpf1)酵素である。いくつかの実施形態では、塩基エディターはデ
アミナーゼドメインに融合した触媒的には死んだCas9(dCas9)である。いくつかの実施
形態では、塩基エディターはデアミナーゼドメインに融合したCas9ニッカーゼ(nCas9)
である。いくつかの実施形態では、塩基エディターは塩基切除修復(BER)の阻害剤(阻
害因子)に融合している。いくつかの実施形態では、塩基切除修復の阻害剤はウラシルDN
Aグリコシラーゼ阻害剤(UGI)である。いくつかの実施形態では、塩基切除修復の阻害剤
はイノシン塩基切除修復阻害剤である。塩基エディターの詳細は、それぞれが参照により
全体として本明細書に組み込まれる国際PCT出願PCT/2017/045381 (WO2018/027078)および
PCT/US2016/058344 (WO2017/070632)に記載されている。また、その全体の内容が参照に
より本明細書に組み込まれるKomor, A.C., et al., “Programmable editing of a targe
t base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424
(2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in
genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Komor, A.C., et
al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein
yields C:G-to-T:A base editors with higher efficiency and product purity” Scie
nce Advances 3:eaao4774 (2017), および Rees, H.A., et al., “Base editing: preci
sion chemistry on the genome and transcriptome of living cells.” Nat Rev Genet
. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1を参照されたい。
例として、本明細書に記載した塩基編集組成物、システム、および方法において用いら
れるシチジン塩基編集CBEは、以下に提供する下記の核酸配列(8877塩基対)Addgene, Wa
tertown, MA.; Komor AC, et al., 2017, Sci Adv., 30;3(8):eaao4774. doi: 10.1126/s
ciadv.aao4774を有している。BE4核酸配列と少なくとも95%またはそれより大きい同一性
を有するポリヌクレオチド配列も包含される。
1 atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg
61 cccagtacat gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg
121 ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag cggtttgact
181 cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt tggcaccaaa
241 atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa atgggcggta
301 ggcgtgtacg gtgggaggtc tatataagca gagctggttt agtgaaccgt cagatccgct
361 agagatccgc ggccgctaat acgactcact atagggagag ccgccaccat gagctcagag
421 actggcccag tggctgtgga ccccacattg agacggcgga tcgagcccca tgagtttgag
481 gtattcttcg atccgagaga gctccgcaag gagacctgcc tgctttacga aattaattgg
541 gggggccggc actccatttg gcgacataca tcacagaaca ctaacaagca cgtcgaagtc
601 aacttcatcg agaagttcac gacagaaaga tatttctgtc cgaacacaag gtgcagcatt
661 acctggtttc tcagctggag cccatgcggc gaatgtagta gggccatcac tgaattcctg
721 tcaaggtatc cccacgtcac tctgtttatt tacatcgcaa ggctgtacca ccacgctgac
781 ccccgcaatc gacaaggcct gcgggatttg atctcttcag gtgtgactat ccaaattatg
841 actgagcagg agtcaggata ctgctggaga aactttgtga attatagccc gagtaatgaa
901 gcccactggc ctaggtatcc ccatctgtgg gtacgactgt acgttcttga actgtactgc
961 atcatactgg gcctgcctcc ttgtctcaac attctgagaa ggaagcagcc acagctgaca
1021 ttctttacca tcgctcttca gtcttgtcat taccagcgac tgcccccaca cattctctgg
1081 gccaccgggt tgaaatctgg tggttcttct ggtggttcta gcggcagcga gactcccggg
1141 acctcagagt ccgccacacc cgaaagttct ggtggttctt ctggtggttc tgataaaaag
1201 tattctattg gtttagccat cggcactaat tccgttggat gggctgtcat aaccgatgaa
1261 tacaaagtac cttcaaagaa atttaaggtg ttggggaaca cagaccgtca ttcgattaaa
1321 aagaatctta tcggtgccct cctattcgat agtggcgaaa cggcagaggc gactcgcctg
1381 aaacgaaccg ctcggagaag gtatacacgt cgcaagaacc gaatatgtta cttacaagaa
1441 atttttagca atgagatggc caaagttgac gattctttct ttcaccgttt ggaagagtcc
1501 ttccttgtcg aagaggacaa gaaacatgaa cggcacccca tctttggaaa catagtagat
1561 gaggtggcat atcatgaaaa gtacccaacg atttatcacc tcagaaaaaa gctagttgac
1621 tcaactgata aagcggacct gaggttaatc tacttggctc ttgcccatat gataaagttc
1681 cgtgggcact ttctcattga gggtgatcta aatccggaca actcggatgt cgacaaactg
1741 ttcatccagt tagtacaaac ctataatcag ttgtttgaag agaaccctat aaatgcaagt
1801 ggcgtggatg cgaaggctat tcttagcgcc cgcctctcta aatcccgacg gctagaaaac
1861 ctgatcgcac aattacccgg agagaagaaa aatgggttgt tcggtaacct tatagcgctc
1921 tcactaggcc tgacaccaaa ttttaagtcg aacttcgact tagctgaaga tgccaaattg
1981 cagcttagta aggacacgta cgatgacgat ctcgacaatc tactggcaca aattggagat
2041 cagtatgcgg acttattttt ggctgccaaa aaccttagcg atgcaatcct cctatctgac
2101 atactgagag ttaatactga gattaccaag gcgccgttat ccgcttcaat gatcaaaagg
2161 tacgatgaac atcaccaaga cttgacactt ctcaaggccc tagtccgtca gcaactgcct
2221 gagaaatata aggaaatatt ctttgatcag tcgaaaaacg ggtacgcagg ttatattgac
2281 ggcggagcga gtcaagagga attctacaag tttatcaaac ccatattaga gaagatggat
2341 gggacggaag agttgcttgt aaaactcaat cgcgaagatc tactgcgaaa gcagcggact
2401 ttcgacaacg gtagcattcc acatcaaatc cacttaggcg aattgcatgc tatacttaga
2461 aggcaggagg atttttatcc gttcctcaaa gacaatcgtg aaaagattga gaaaatccta
2521 acctttcgca taccttacta tgtgggaccc ctggcccgag ggaactctcg gttcgcatgg
2581 atgacaagaa agtccgaaga aacgattact ccatggaatt ttgaggaagt tgtcgataaa
2641 ggtgcgtcag ctcaatcgtt catcgagagg atgaccaact ttgacaagaa tttaccgaac
2701 gaaaaagtat tgcctaagca cagtttactt tacgagtatt tcacagtgta caatgaactc
2761 acgaaagtta agtatgtcac tgagggcatg cgtaaacccg cctttctaag cggagaacag
2821 aagaaagcaa tagtagatct gttattcaag accaaccgca aagtgacagt taagcaattg
2881 aaagaggact actttaagaa aattgaatgc ttcgattctg tcgagatctc cggggtagaa
2941 gatcgattta atgcgtcact tggtacgtat catgacctcc taaagataat taaagataag
3001 gacttcctgg ataacgaaga gaatgaagat atcttagaag atatagtgtt gactcttacc
3061 ctctttgaag atcgggaaat gattgaggaa agactaaaaa catacgctca cctgttcgac
3121 gataaggtta tgaaacagtt aaagaggcgt cgctatacgg gctggggacg attgtcgcgg
3181 aaacttatca acgggataag agacaagcaa agtggtaaaa ctattctcga ttttctaaag
3241 agcgacggct tcgccaatag gaactttatg cagctgatcc atgatgactc tttaaccttc
3301 aaagaggata tacaaaaggc acaggtttcc ggacaagggg actcattgca cgaacatatt
3361 gcgaatcttg ctggttcgcc agccatcaaa aagggcatac tccagacagt caaagtagtg
3421 gatgagctag ttaaggtcat gggacgtcac aaaccggaaa acattgtaat cgagatggca
3481 cgcgaaaatc aaacgactca gaaggggcaa aaaaacagtc gagagcggat gaagagaata
3541 gaagagggta ttaaagaact gggcagccag atcttaaagg agcatcctgt ggaaaatacc
3601 caattgcaga acgagaaact ttacctctat tacctacaaa atggaaggga catgtatgtt
3661 gatcaggaac tggacataaa ccgtttatct gattacgacg tcgatcacat tgtaccccaa
3721 tcctttttga aggacgattc aatcgacaat aaagtgctta cacgctcgga taagaaccga
3781 gggaaaagtg acaatgttcc aagcgaggaa gtcgtaaaga aaatgaagaa ctattggcgg
3841 cagctcctaa atgcgaaact gataacgcaa agaaagttcg ataacttaac taaagctgag
3901 aggggtggct tgtctgaact tgacaaggcc ggatttatta aacgtcagct cgtggaaacc
3961 cgccaaatca caaagcatgt tgcacagata ctagattccc gaatgaatac gaaatacgac
4021 gagaacgata agctgattcg ggaagtcaaa gtaatcactt taaagtcaaa attggtgtcg
4081 gacttcagaa aggattttca attctataaa gttagggaga taaataacta ccaccatgcg
4141 cacgacgctt atcttaatgc cgtcgtaggg accgcactca ttaagaaata cccgaagcta
4201 gaaagtgagt ttgtgtatgg tgattacaaa gtttatgacg tccgtaagat gatcgcgaaa
4261 agcgaacagg agataggcaa ggctacagcc aaatacttct tttattctaa cattatgaat
4321 ttctttaaga cggaaatcac tctggcaaac ggagagatac gcaaacgacc tttaattgaa
4381 accaatgggg agacaggtga aatcgtatgg gataagggcc gggacttcgc gacggtgaga
4441 aaagttttgt ccatgcccca agtcaacata gtaaagaaaa ctgaggtgca gaccggaggg
4501 ttttcaaagg aatcgattct tccaaaaagg aatagtgata agctcatcgc tcgtaaaaag
4561 gactgggacc cgaaaaagta cggtggcttc gatagcccta cagttgccta ttctgtccta
4621 gtagtggcaa aagttgagaa gggaaaatcc aagaaactga agtcagtcaa agaattattg
4681 gggataacga ttatggagcg ctcgtctttt gaaaagaacc ccatcgactt ccttgaggcg
4741 aaaggttaca aggaagtaaa aaaggatctc ataattaaac taccaaagta tagtctgttt
4801 gagttagaaa atggccgaaa acggatgttg gctagcgccg gagagcttca aaaggggaac
4861 gaactcgcac taccgtctaa atacgtgaat ttcctgtatt tagcgtccca ttacgagaag
4921 ttgaaaggtt cacctgaaga taacgaacag aagcaacttt ttgttgagca gcacaaacat
4981 tatctcgacg aaatcataga gcaaatttcg gaattcagta agagagtcat cctagctgat
5041 gccaatctgg acaaagtatt aagcgcatac aacaagcaca gggataaacc catacgtgag
5101 caggcggaaa atattatcca tttgtttact cttaccaacc tcggcgctcc agccgcattc
5161 aagtattttg acacaacgat agatcgcaaa cgatacactt ctaccaagga ggtgctagac
5221 gcgacactga ttcaccaatc catcacggga ttatatgaaa ctcggataga tttgtcacag
5281 cttgggggtg actctggtgg ttctggagga tctggtggtt ctactaatct gtcagatatt
5341 attgaaaagg agaccggtaa gcaactggtt atccaggaat ccatcctcat gctcccagag
5401 gaggtggaag aagtcattgg gaacaagccg gaaagcgata tactcgtgca caccgcctac
5461 gacgagagca ccgacgagaa tgtcatgctt ctgactagcg acgcccctga atacaagcct
5521 tgggctctgg tcatacagga tagcaacggt gagaacaaga ttaagatgct ctctggtggt
5581 tctggaggat ctggtggttc tactaatctg tcagatatta ttgaaaagga gaccggtaag
5641 caactggtta tccaggaatc catcctcatg ctcccagagg aggtggaaga agtcattggg
5701 aacaagccgg aaagcgatat actcgtgcac accgcctacg acgagagcac cgacgagaat
5761 gtcatgcttc tgactagcga cgcccctgaa tacaagcctt gggctctggt catacaggat
5821 agcaacggtg agaacaagat taagatgctc tctggtggtt ctcccaagaa gaagaggaaa
5881 gtctaaccgg tcatcatcac catcaccatt gagtttaaac ccgctgatca gcctcgactg
5941 tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg
6001 aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg cattgtctga
6061 gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg gaggattggg
6121 aagacaatag caggcatgct ggggatgcgg tgggctctat ggcttctgag gcggaaagaa
6181 ccagctgggg ctcgataccg tcgacctcta gctagagctt ggcgtaatca tggtcatagc
6241 tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca
6301 taaagtgtaa agcctagggt gcctaatgag tgagctaact cacattaatt gcgttgcgct
6361 cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac
6421 gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc
6481 tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt
6541 tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg
6601 ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg
6661 agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat
6721 accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta
6781 ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct
6841 gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc
6901 ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa
6961 gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg
7021 taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag
7081 tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt
7141 gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta
7201 cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc
7261 agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca
7321 cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa
7381 cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat
7441 ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct
7501 taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt
7561 tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat
7621 ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta
7681 atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg
7741 gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt
7801 tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg
7861 cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg
7921 taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc
7981 ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa
8041 ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac
8101 cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt
8161 ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg
8221 gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa
8281 gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata
8341 aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc gacggatcgg
8401 gagatcgatc tcccgatccc ctagggtcga ctctcagtac aatctgctct gatgccgcat
8461 agttaagcca gtatctgctc cctgcttgtg tgttggaggt cgctgagtag tgcgcgagca
8521 aaatttaagc tacaacaagg caaggcttga ccgacaattg catgaagaat ctgcttaggg
8581 ttaggcgttt tgcgctgctt cgcgatgtac gggccagata tacgcgttga cattgattat
8641 tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt
8701 tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc
8761 cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac
8821 gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatc
BE4アミノ酸配列:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNT
RCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYS
PSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLKSGGSSGGSSGS
ETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAE
ATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRK
KLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSR
RLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPIL
EKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNS
RFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFL
SGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIV
LTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRER
MKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRS
DKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMN
TKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRK
MIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPID
FLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVE
QHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTK
EVLDATLIHQSITGLYETRIDLSQLGGDSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILV
HTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVE
EVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSPKKKRK
【0044】
例として、本明細書に記載した塩基編集組成物、システム、および方法において用いら
れるアデニン塩基編集ABEは、以下に提供する下記の核酸配列(8877塩基対)(Addgene,
Watertown, MA.; Gaudelli NM, et al., Nature. 2017 Nov 23;551(7681):464-471. doi:
10.1038/nature24644; Koblan LW, et al., Nat Biotechnol. 2018 Oct;36(9):843-846.
doi: 10.1038/nbt.4172.)を有している。ABE核酸配列と少なくとも95%またはそれより
大きい同一性を有するポリヌクレオチド配列も包含される。
ATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACAT
GACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGG
TTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTG
ACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCC
ATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGT
CAGATCCGCTAGAGATCCGCGGCCGCTAATACGACTCACTATAGGGAGAGCCGCCACCATGAAACGGACA
GCCGACGGAAGCGAGTTCGAGTCACCAAAGAAGAAGCGGAAAGTCTCTGAAGTCGAGTTTAGCCACGAGT
ATTGGATGAGGCACGCACTGACCCTGGCAAAGCGAGCATGGGATGAAAGAGAAGTCCCCGTGGGCGCCGT
GCTGGTGCACAACAATAGAGTGATCGGAGAGGGATGGAACAGGCCAATCGGCCGCCACGACCCTACCGCA
CACGCAGAGATCATGGCACTGAGGCAGGGAGGCCTGGTCATGCAGAATTACCGCCTGATCGATGCCACCC
TGTATGTGACACTGGAGCCATGCGTGATGTGCGCAGGAGCAATGATCCACAGCAGGATCGGAAGAGTGGT
GTTCGGAGCACGGGACGCCAAGACCGGCGCAGCAGGCTCCCTGATGGATGTGCTGCACCACCCCGGCATG
AACCACCGGGTGGAGATCACAGAGGGAATCCTGGCAGACGAGTGCGCCGCCCTGCTGAGCGATTTCTTTA
GAATGCGGAGACAGGAGATCAAGGCCCAGAAGAAGGCACAGAGCTCCACCGACTCTGGAGGATCTAGCGG
AGGATCCTCTGGAAGCGAGACACCAGGCACAAGCGAGTCCGCCACACCAGAGAGCTCCGGCGGCTCCTCC
GGAGGATCCTCTGAGGTGGAGTTTTCCCACGAGTACTGGATGAGACATGCCCTGACCCTGGCCAAGAGGG
CACGCGATGAGAGGGAGGTGCCTGTGGGAGCCGTGCTGGTGCTGAACAATAGAGTGATCGGCGAGGGCTG
GAACAGAGCCATCGGCCTGCACGACCCAACAGCCCATGCCGAAATTATGGCCCTGAGACAGGGCGGCCTG
GTCATGCAGAACTACAGACTGATTGACGCCACCCTGTACGTGACATTCGAGCCTTGCGTGATGTGCGCCG
GCGCCATGATCCACTCTAGGATCGGCCGCGTGGTGTTTGGCGTGAGGAACGCAAAAACCGGCGCCGCAGG
CTCCCTGATGGACGTGCTGCACTACCCCGGCATGAATCACCGCGTCGAAATTACCGAGGGAATCCTGGCA
GATGAATGTGCCGCCCTGCTGTGCTATTTCTTTCGGATGCCTAGACAGGTGTTCAATGCTCAGAAGAAGG
CCCAGAGCTCCACCGACTCCGGAGGATCTAGCGGAGGCTCCTCTGGCTCTGAGACACCTGGCACAAGCGA
GAGCGCAACACCTGAAAGCAGCGGGGGCAGCAGCGGGGGGTCAGACAAGAAGTACAGCATCGGCCTGGCC
ATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGG
TGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGA
AACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGC
TATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGT
CCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGC
CTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGAC
CTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACC
TGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGA
GGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGA
CGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCC
TGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAG
CAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTT
CTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCA
AGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGC
TCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCC
GGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGG
ACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAA
CGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTAC
CCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCC
CTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAA
CTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAG
AACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGC
TGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGC
CATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAG
AAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACAT
ACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGA
AGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCC
CACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCC
GGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGG
CTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAA
GCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTA
AGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGA
GAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGA
ATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACA
CCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGA
ACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGAC
TCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAG
AGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTT
CGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAG
CTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACG
ACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCG
GAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAAC
GCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACA
AGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTT
CTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGG
CCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGC
GGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAA
AGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAG
TACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGT
CCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAA
TCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAG
TACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAA
ACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGG
CTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATC
GAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCT
ACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAA
TCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAA
GAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTC
AGCTGGGAGGTGACTCTGGCGGCTCAAAAAGAACCGCCGACGGCAGCGAATTCGAGCCCAAGAAGAAGAG
GAAAGTCTAACCGGTCATCATCACCATCACCATTGAGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTT
CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCAC
TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGT
GGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCT
CTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCGATACCGTCGACCTCTAGCTAGAGCTTGGCGTA
ATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGA
AGCATAAAGTGTAAAGCCTAGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGC
CCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGG
TTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGA
GCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACA
TGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCT
CCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAA
AGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGAT
ACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTC
GGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTA
TCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTA
ACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTA
CACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGC
TCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCA
GAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACACTCAGTGGAACGAAAACTC
ACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGA
AGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGG
CACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTAC
GATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCA
GATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCT
CCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGT
TGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCC
CAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGA
TCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTAC
TGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGT
ATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAA
AAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAG
TTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGA
GCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATAC
TCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATG
TATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCGACGGA
TCGGGAGATCGATCTCCCGATCCCCTAGGGTCGACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAA
GCCAGTATCTGCTCCCTGCTTGTGTGTTGGAGGTCGCTGAGTAGTGCGCGAGCAAAATTTAAGCTACAAC
AAGGCAAGGCTTGACCGACAATTGCATGAAGAATCTGCTTAGGGTTAGGCGTTTTGCGCTGCTTCGCGAT
GTACGGGCCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCAT
TAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCC
CAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCAT
TGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATC
【0045】
「塩基編集活性」は、ポリヌクレオチドの中の塩基を化学的に改変するように作用する
ことを意味する。一実施形態では、第1の塩基が第2の塩基に変換される。一実施形態では
、塩基編集活性はシチジンデアミナーゼ活性、たとえば標的C・GをT・Aに変換する活性で
ある。別の実施形態では、塩基編集活性はアデノシンまたはアデニンデアミナーゼ活性、
たとえばA・TをG・Cに変換する活性である。
【0046】
用語「塩基エディターシステム」は、標的のヌクレオチド配列の核酸塩基を編集するシ
ステムを意味する。種々の実施形態では、塩基エディター(BE)システムは(1)ポリヌ
クレオチドプログラム可能なヌクレオチド結合ドメインおよび前記核酸塩基を脱アミノ化
するためのデアミナーゼドメイン、ならびに(2)ポリヌクレオチドプログラム可能なヌク
レオチド結合ドメインに連結されたガイドポリヌクレオチド(たとえばガイドRNA)を含
む。いくつかの実施形態では、塩基エディターシステムは(1)ポリヌクレオチドプログ
ラム可能なDNA結合ドメインおよび前記核酸塩基を脱アミノ化するためのデアミナーゼド
メイン、ならびに(2)ポリヌクレオチドプログラム可能なDNA結合ドメインに連結された
ガイドRNAを含む。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレ
オチド結合ドメインはポリヌクレオチドプログラム可能なDNA結合ドメインである。いく
つかの実施形態では、塩基エディターはシチジン塩基エディター(CBE)である。いくつ
かの実施形態では、塩基エディターはアデニンまたはアデノシン塩基エディター(ABE)
である。
【0047】
いくつかの実施形態では、核酸塩基エディターシステムは2つ以上の塩基編集成分を含
んでよい。たとえば、核酸塩基エディターシステムは2つ以上のデアミナーゼを含んでよ
い。いくつかの実施形態では、ヌクレアーゼ塩基エディターシステムは1つもしくは複数
のシチジンデアミナーゼおよび/または1つもしくは複数のアデノシンデアミナーゼを含
んでよい。いくつかの実施形態では、シングルガイドポリヌクレオチドを利用して様々な
デアミナーゼを標的の核酸配列にターゲティングさせてもよい。いくつかの実施形態では
、一対のガイドポリヌクレオチドを利用して異なるデアミナーゼを標的の核酸配列にター
ゲティングさせてもよい。
【0048】
塩基エディターシステムの核酸塩基成分とポリヌクレオチドプログラム可能なヌクレオ
チド結合成分とは、共有結合でまたは非共有結合で、相互に結合してよい。たとえば、い
くつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインに
よって、デアミナーゼドメインを標的のヌクレオチド配列にターゲティングすることがで
きる。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ド
メインはデアミナーゼドメインに融合しまたは連結することができる。いくつかの実施形
態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、デアミナーゼ
ドメインと非共有結合で相互作用すること、またはこれと結合することによって、デアミ
ナーゼドメインを標的のヌクレオチド配列にターゲティングすることができる。たとえば
、いくつかの実施形態では、核酸塩基編集成分、たとえばデアミナーゼ成分は、ポリヌク
レオチドプログラム可能なヌクレオチド結合ドメインの部分であるさらなる異種の部分ま
たはドメインと相互作用することができ、会合し、または複合体を形成することができる
さらなる異種の部分またはドメインを含み得る。いくつかの実施形態では、さらなる異種
の部分はポリペプチドと結合し、相互作用し、会合し、または複合体を形成することがで
きる。いくつかの実施形態では、さらなる異種の部分はポリヌクレオチドと結合し、相互
作用し、会合し、または複合体を形成することができる。いくつかの実施形態では、さら
なる異種の部分はガイドポリヌクレオチドに結合することができる。いくつかの実施形態
では、さらなる異種の部分はポリペプチドリンカーに結合することができる。いくつかの
実施形態では、さらなる異種の部分はポリヌクレオチドリンカーに結合することができる
。さらなる異種の部分はタンパク質ドメインであってよい。いくつかの実施形態では、さ
らなる異種の部分はKホモロジー(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コ
ートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステリルアルファモチー
フ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフお
よびSm7タンパク質、またはRNA認識モチーフであってよい。
【0049】
塩基エディターシステムはガイドポリヌクレオチド成分をさらに含んでよい。塩基エデ
ィターシステムの成分は共有結合、非共有相互作用、またはそれらの会合および相互作用
の任意の組合せを介して相互に会合し得ることを認識されたい。いくつかの実施形態では
、ガイドポリヌクレオチドによって、デアミナーゼドメインを標的のヌクレオチド配列に
ターゲティングすることができる。たとえば、いくつかの実施形態では、塩基エディター
システムの核酸塩基編集成分、たとえばデアミナーゼ成分は、ガイドポリヌクレオチドの
一部またはセグメント(たとえばポリヌクレオチドモチーフ)と相互作用し、会合し、ま
たは複合体を形成することができるさらなる異種の部分またはドメイン(たとえばRNAま
たはDNA結合タンパク質等のポリヌクレオチド結合ドメイン)を含み得る。いくつかの実
施形態では、さらなる異種の部分またはドメイン(たとえばRNAまたはDNA結合タンパク質
等のポリヌクレオチド結合ドメイン)は、デアミナーゼドメインに融合しまたは連結する
ことができる。いくつかの実施形態では、さらなる異種の部分は、ポリペプチドと結合し
、相互作用し、会合し、または複合体を形成することができる。いくつかの実施形態では
、さらなる異種の部分は、ポリヌクレオチドと結合し、相互作用し、会合し、または複合
体を形成することができる。いくつかの実施形態では、さらなる異種の部分は、ガイドポ
リヌクレオチドと結合することができる。いくつかの実施形態では、さらなる異種の部分
は、ポリペプチドリンカーと結合することができる。いくつかの実施形態では、さらなる
異種の部分は、ポリヌクレオチドリンカーと結合することができる。さらなる異種の部分
は、タンパク質ドメインであってよい。いくつかの実施形態では、さらなる異種の部分は
Kホモロジー(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメ
イン、SfMu Comコートタンパク質ドメイン、ステリルアルファモチーフ、テロメラーゼKu
結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、
またはRNA認識モチーフであってよい。
【0050】
いくつかの実施形態では、塩基エディターシステムは塩基切除修復(BER)成分の阻害
剤をさらに含み得る。塩基エディターシステムの成分は共有結合、非共有相互作用、また
はそれらの会合および相互作用の任意の組合せを介して相互に会合し得ることを認識され
たい。BER成分の阻害剤は塩基切除修復阻害剤を含んでよい。いくつかの実施形態では、
塩基切除修復の阻害剤はウラシルDNAグリコシラーゼ阻害剤(UGI)であり得る。いくつか
の実施形態では、塩基切除修復の阻害剤はイノシン塩基切除修復阻害剤であり得る。いく
つかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインによ
って、塩基切除修復の阻害剤を標的のヌクレオチド配列にターゲティングすることができ
る。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメ
インは塩基切除修復の阻害剤に融合しまたは連結することができる。いくつかの実施形態
では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、デアミナーゼド
メインおよび塩基切除修復の阻害剤に融合しまたは連結することができる。いくつかの実
施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、塩基切除
修復の阻害剤と非共有結合で相互作用しまたは会合することによって、塩基切除修復の阻
害剤を標的のヌクレオチド配列にターゲティングすることができる。たとえば、いくつか
の実施形態では、塩基切除修復成分の阻害剤は、ポリヌクレオチドプログラム可能なヌク
レオチド結合ドメインの部分であるさらなる異種の部分またはドメインと相互作用するこ
とができ、会合し、または複合体を形成することができるさらなる異種の部分またはドメ
インを含み得る。いくつかの実施形態では、ガイドポリヌクレオチドによって、塩基切除
修復の阻害剤を標的のヌクレオチド配列にターゲティングすることができる。たとえば、
いくつかの実施形態では、塩基切除修復の阻害剤は、ガイドポリヌクレオチドの一部また
はセグメント(たとえばポリヌクレオチドモチーフ)と相互作用することができ、会合し
、または複合体を形成することができるさらなる異種の部分またはドメイン(たとえばRN
AまたはDNA結合タンパク質等のポリヌクレオチド結合ドメイン)を含み得る。いくつかの
実施形態では、ガイドポリヌクレオチド(たとえばRNAまたはDNA結合タンパク質等のポリ
ヌクレオチド結合ドメイン)のさらなる異種の部分またはドメインは、塩基切除修復の阻
害剤と融合しまたは連結することができる。いくつかの実施形態では、さらなる異種の部
分はポリヌクレオチドと結合し、相互作用し、会合し、または複合体を形成することがで
きる。いくつかの実施形態では、さらなる異種の部分はガイドポリヌクレオチドと結合す
ることができる。いくつかの実施形態では、さらなる異種の部分はポリペプチドリンカー
と結合することができる。いくつかの実施形態では、さらなる異種の部分はポリヌクレオ
チドリンカーと結合することができる。さらなる異種の部分は、タンパク質ドメインであ
ってよい。いくつかの実施形態では、さらなる異種の部分はKホモロジー(KH)ドメイン
、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパ
ク質ドメイン、ステリルアルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパ
ク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであ
ってよい。
【0051】
用語「Cas9」または「Cas9ドメイン」は、Cas9タンパク質を含むRNAガイドされたヌク
レアーゼ、またはその断片(たとえばCas9の活性、不活性、または部分的活性DNA開裂ド
メイン、および/またはCas9のgRNA結合ドメイン)を意味する。Cas9ヌクレアーゼは、cas
n1ヌクレアーゼまたはCRISPR(clustered regularly interspaced short palindromic re
peat)関連ヌクレアーゼと称することもある。例示的なCas9はStreptococcus pyogenesの
Cas9であり、そのアミノ酸配列を以下に提供する。
(一本下線:HNHドメイン、二本下線:RuvCドメイン)
【0052】
用語「保存的アミノ酸置換」または「保存的変異」は、1つのアミノ酸を共通の特性を
有する別のアミノ酸によって置き換えることを意味する。個別のアミノ酸の間の共通の特
性を定義する機能的な方法は、同種の生命体の対応するタンパク質の間のアミノ酸の変化
の正規化された頻度を解析することである(Schulz, G. E. and Schirmer, R. H., Princ
iples of Protein Structure, Springer-Verlag, New York (1979))。そのような解析に
よれば、ある群の中のアミノ酸が優先的に相互に交換され、したがってタンパク質全体の
構造に対する影響において最も相互に類似している場合に、アミノ酸の群を定義すること
ができる(Schulz, G. E. and Schirmer, R. H., supra)。保存的変異の非限定的な例に
は、たとえば正電荷が維持されるアミノ酸リジンからアルギニンおよびその逆、負電荷が
維持されるグルタミン酸からアスパラギン酸およびその逆、遊離-OHが維持されるセリン
からスレオニン、ならびに遊離の-NH2基が維持されるグルタミンからアスパラギンへのア
ミノ酸置換が含まれる。
【0053】
本明細書で相互交換可能に用いられる用語「コーディング配列」または「タンパク質コ
ーディング配列」は、タンパク質をコードするポリヌクレオチドのセグメントを意味する
。この領域または配列は、5’末端により近くで開始コドンによって、また3’末端によ
り近くで終止コドンによって区切られる。コーディング配列はオープンリーディングフレ
ームと称することもできる。
【0054】
本明細書で用いる用語「デアミナーゼ」または「デアミナーゼドメイン」は、脱アミノ
化反応を触媒するタンパク質または酵素を意味する。いくつかの実施形態では、デアミナ
ーゼまたはデアミナーゼドメインはシチジンデアミナーゼであり、シチジンまたはデオキ
シシチジンのウリジンまたはデオキシウリジンへの加水分解的脱アミノ化をそれぞれ触媒
する。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインはシトシンデ
アミナーゼであり、シトシンのウラシルへの加水分解的脱アミノ化を触媒する。いくつか
の実施形態では、デアミナーゼはアデノシンデアミナーゼであり、アデニンのヒポキサン
チンへの加水分解的脱アミノ化を触媒する。いくつかの実施形態では、デアミナーゼはア
デノシンデアミナーゼであり、アデノシンまたはアデニン(A)のイノシン(I)への加水
分解的脱アミノ化を触媒する。いくつかの実施形態では、デアミナーゼまたはデアミナー
ゼドメインはアデノシンデアミナーゼであり、アデノシンまたはデオキシアデノシンのイ
ノシンまたはデオキシイノシンへの加水分解的脱アミノ化をそれぞれ触媒する。いくつか
の実施形態では、アデノシンデアミナーゼはデオキシリボ核酸(DNA)中のアデノシンの
加水分解的脱アミノ化を触媒する。本明細書で提供するアデノシンデアミナーゼ(たとえ
ば操作されたアデノシンデアミナーゼ、進化されたアデノシンデアミナーゼ)は、細菌等
の任意の生命体からのものでよい。いくつかの実施形態では、アデノシンデアミナーゼは
E. coli、S. aureus、S. typhi、S. putrefaciens、H. influenzae、またはC. crescentu
s等の細菌からのものである。いくつかの実施形態では、アデノシンデアミナーゼは、Tad
Aデアミナーゼである。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメ
インはヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウス等の生命
体からの天然産生のデアミナーゼのバリアントである。いくつかの実施形態では、デアミ
ナーゼまたはデアミナーゼドメインは天然に産生しない。たとえば、いくつかの実施形態
では、デアミナーゼまたはデアミナーゼドメインは天然産生のデアミナーゼと少なくとも
50%、少なくも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75% 少
なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なく
とも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも9
8%、少なくとも99%、少なくとも99.1%、少なくとも99.2%、少なくとも99.3%、少なくとも
99.4%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、また
は少なくとも99.9%の同一性である。たとえば、デアミナーゼドメインはそれぞれが参照
により全体として本明細書に組み込まれる国際PCT出願PCT/2017/045381(WO2018/027078)
およびPCT/US2016/058344(WO2017/070632)に記載されている。また、その全ての内容が参
照により本明細書に組み込まれるKomor, A.C., et al., “Programmable editing of a t
arget base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420
-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C
in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Komor, A.C.,
et al., “Improved base excision repair inhibition and bacteriophage Mu Gam pro
tein yields C:G-to-T:A base editors with higher efficiency and product purity”
Science Advances 3:eaao4774 (2017) ), および Rees, H.A., et al., “Base editing:
precision chemistry on the genome and transcriptome of living cells.” Nat Rev
Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1を参照されたい。
【0055】
「検出可能な標識」は、目的の分子に連結された際にその分子を分光法、光化学法、生
化学法、免疫化学法、または化学的な手段によって検出可能にする組成物を意味する。た
とえば、有用な標識には放射性同位元素、磁気ビーズ、金属ビーズ、コロイド状粒子、蛍
光染料、高電子密度試薬、酵素(たとえばELISAで広く用いられている)、ビオチン、ジ
ゴキシゲニン、またはハプテン類が含まれる。
【0056】
「疾患」は、細胞、組織、または器官の正常な機能を損傷し、またはこれに干渉する任
意の条件または障害を意味する。疾患の例にはレット症候群が含まれる。
【0057】
「有効量」は、未治療の患者に対して疾患の症状を改善させるために必要な量を意味す
る。疾患の治療処置のために本発明を実施するために用いられる活性化合物の有効量は、
投与の様式、対象の年齢、体重、および一般的健康状態によって変動する。究極的には、
担当の医師または獣医師が適切な量および用量計画を決定することになる。そのような量
は「有効」量と称される。一実施形態では、有効量は細胞(たとえばin vitroまたはin v
ivoの細胞)の中の目的の遺伝子(たとえばMecp2)に改変を導入するために十分な本発明
の塩基エディターの量である。一実施形態では、有効量は治療効果(たとえばレット症候
群またはその症状もしくは病態の低減または制御)を達成するために必要な塩基エディタ
ーの量である。そのような治療効果は対象、組織、または器官の細胞の全てにおけるMecp
2を改変するために十分である必要はなく、対象、組織、または器官中に存在する細胞の
約1%、5%、10%、25%、50%、75%、またはそれ以上でMecp2を改変させればよい。一実施形
態では、有効量はレット症候群の1つまたは複数の症状を改善するために十分なものであ
る。
【0058】
「断片」はポリペプチドまたは核酸分子の一部を意味する。この部分は、好ましくは参
照の核酸分子またはポリペプチドの全長の少なくとも10%、20%、30%、40%、50%、60%、70
%、80%、または90%を含む。断片は10、20、30、40、50、60、70、80、90、もしくは100、
200、300、400、500、600、700、800、900、もしくは1000ヌクレオチドまたはアミノ酸を
含み得る。
【0059】
「ハイブリダイゼーション」は、相補的な核酸塩基の間のワトソン-クリック、フーグ
スティーン、または逆フーグスティーン水素結合であってよい水素結合を意味する。たと
えば、アデニンおよびチミンは水素結合の形成によって対となる相補的な核酸塩基である
。
【0060】
用語「塩基修復の阻害剤」または「IBR」は、核酸修復酵素、たとえば塩基切除修復酵
素の活性を阻害することができるタンパク質を意味する。いくつかの実施形態では、IBR
はイノシン塩基切除修復の阻害剤である。例示的な塩基修復の阻害剤には、APE1、Endo I
II、Endo IV、Endo V、Endo VIII、Fpg、hOGGl、hNEILl、T7 Endol、T4PDG、UDG、hSMUGl
、およびhAAGの阻害剤が含まれる。いくつかの実施形態では、IBRはEndo VまたはhAAGの
阻害剤である。いくつかの実施形態では、IBRは触媒不活性なEndo Vまたは触媒不活性なh
AAGである。いくつかの実施形態では、塩基修復阻害剤はEndo VまたはhAAGの阻害剤であ
る。いくつかの実施形態では、塩基修復阻害剤は触媒不活性なEndo Vまたは触媒不活性な
hAAGである。いくつかの実施形態では、塩基修復阻害剤はウラシルグリコシラーゼ阻害剤
(UGI)である。UGIはウラシルDNAグリコシラーゼ塩基切除修復酵素を阻害することがで
きるタンパク質を意味する。いくつかの実施形態では、UGIドメインは野生型UGIまたは野
生型UGIの断片を含む。いくつかの実施形態では、本明細書で提供するUGIタンパク質はUG
Iの断片およびUGIまたはUGI断片と相同のタンパク質を含む。いくつかの実施形態では、
塩基修復阻害剤はイノシン塩基切除修復の阻害剤である。いくつかの実施形態では、塩基
修復阻害剤は「触媒不活性のイノシン特異的ヌクレアーゼ」または「死んだイノシン特異
的ヌクレアーゼ」である。いずれの特定の理論にも縛られることを望まないが、触媒不活
性のイノシングリコシラーゼ(たとえばアルキルアデニングリコシラーゼ(AAG))は、
イノシンと結合することができるが、非塩基部位を創成しまたはイノシンを除去すること
はできず、それにより新たに形成されたイノシン部分をDNA損傷/修復機構から立体的にブ
ロックする。いくつかの実施形態では、触媒不活性のイノシン特異的ヌクレアーゼは核酸
中のイノシンと結合することができるが、核酸を開裂させない。触媒不活性のイノシン特
異的ヌクレアーゼの非限定的な例には、たとえばヒトからの触媒不活性のアルキルアデノ
シングリコシラーゼ(AAGヌクレアーゼ)およびたとえばE. coliからの触媒不活性のエン
ドヌクレアーゼV(Endo Vヌクレアーゼ)が含まれる。いくつかの実施形態では、触媒不
活性のAAGヌクレアーゼはE125Qの変異または別のAAGヌクレアーゼにおける対応する変異
を含む。
【0061】
用語「単離された」、「精製された」、または「生物学的に純粋な」は、その天然の状
態で見出された場合に通常それに付随する成分が様々な程度において除去されている物質
を意味する。「単離する」は、もとの供給源または周囲からの分離の程度を示す。「精製
する」は、単離より高い分離の程度を示す。「精製された」または「生物学的に純粋な」
タンパク質は、いずれの不純物もタンパク質の生物学的特性に実質的に影響せず、または
その他の有害な結果を惹起しないように、十分に他の物質が除去されている。即ち、本発
明の核酸またはペプチドは、組み換えDNA手法によって生成された場合には細胞性物質、
ウイルス物質、もしくは培養培地を、または化学合成された場合には化学的前駆体もしく
は他の化学物質を実質的に含まなければ、精製されている。純度および均一性は、典型的
には分析化学手法、たとえばポリアクリルアミドゲル電気泳動または高性能液体クロマト
グラフィーを用いて決定される。用語「精製された」は、核酸またはタンパク質が電気泳
動ゲルで本質的に1つのバンドを生じることを意味し得る。修飾、たとえばリン酸化また
はグリコシル化に供することができるタンパク質については、様々な修飾によって様々な
単離されたタンパク質を生じることができ、これらは個別に精製することができる。
【0062】
「単離されたポリヌクレオチド」は、本発明の核酸分子が誘導された元の生命体の天然
産生のゲノムにおいて遺伝子の傍にある遺伝子を含まない核酸(たとえばDNA)を意味す
る。したがってこの用語には、たとえばベクターに組み込まれた、自発的に複製するプラ
スミドまたはウイルスに組み込まれた、もしくは原核生物もしくは真核生物のゲノムDNA
に組み込まれた組み換えDNA、または他の配列とは独立に個別の分子(たとえばPCRまたは
制限エンドヌクレアーゼ消化によって生成したcDNAまたはゲノムもしくはcDNAの断片)と
して存在する組み換えDNAが含まれる。さらに、この用語には、DNA分子から転写されたRN
A分子、ならびにさらなるポリペプチド配列をコードするハイブリッド遺伝子の部分であ
る組み換えDNAが含まれる。
【0063】
「単離されたポリペプチド」は、天然にはそのポリペプチドに付随する成分から分離さ
れた本発明のポリペプチドを意味する。典型的には、ポリペプチドは、それが天然に会合
しているタンパク質および天然産生の有機分子から少なくとも60重量%フリーである場合
に、単離されている。好ましくは、調製物は少なくとも75重量%、より好ましくは少なく
とも90重量%、最も好ましくは少なくとも99重量%の本発明のポリペプチドである。本発明
の単離されたポリペプチドは、たとえば天然の供給源からの抽出によって、そのようなポ
リペプチドをコードする組み換え核酸の発現によって、またはタンパク質を化学的に合成
することによって、得ることができる。純度は任意の適切な方法、たとえばカラムクロマ
トグラフィー、ポリアクリルアミドゲル電気泳動、またはHPLC解析によって測定すること
ができる。
【0064】
用語「リンカー」は、本明細書で用いる場合、共有結合リンカー(たとえば共有結合)
、非共有結合リンカー、化学基、または2つの分子または部分、たとえばタンパク質複合
体もしくはリボ核酸複合体の2つの成分、またはたとえばポリヌクレオチドプログラム可
能なDNA結合ドメイン(たとえばdCas9)およびデアミナーゼドメイン(たとえばアデノシ
ンデアミナーゼもしくはシチジンデアミナーゼ)等の融合タンパク質の2つのドメインを
連結する分子を意味し得る。リンカーは、塩基エディターシステムの異なる成分、または
成分の異なる部分を接合することができる。たとえば、いくつかの実施形態では、リンカ
ーは、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインのガイドポリヌクレ
オチド結合ドメインとデアミナーゼの触媒ドメインとを接合することができる。いくつか
の実施形態では、リンカーはCRISPRポリペプチドとデアミナーゼとを接合することができ
る。いくつかの実施形態では、リンカーはCas9とデアミナーゼとを接合することができる
。いくつかの実施形態では、リンカーはdCas9とデアミナーゼとを接合することができる
。いくつかの実施形態では、リンカーはnCas9とデアミナーゼとを接合することができる
。いくつかの実施形態では、リンカーはガイドポリヌクレオチドとデアミナーゼとを接合
することができる。いくつかの実施形態では、リンカーは脱アミノ化成分と塩基エディタ
ーシステムのポリヌクレオチドプログラム可能なヌクレオチド結合成分とを接合すること
ができる。いくつかの実施形態では、リンカーは脱アミノ化成分のRNA結合部分と塩基エ
ディターシステムのポリヌクレオチドプログラム可能なヌクレオチド結合成分とを接合す
ることができる。いくつかの実施形態では、リンカーは脱アミノ化成分のRNA結合部分と
塩基エディターシステムのポリヌクレオチドプログラム可能なヌクレオチド結合成分のRN
A結合部分とを接合することができる。リンカーは2つの基、分子、またはその他の部分の
間またはその傍に位置して、共有結合もしくは非共有相互作用を介してそれぞれを連結し
、それによって2つを連結することができる。いくつかの実施形態では、リンカーは有機
分子、基、ポリマー、または化学部分であり得る。いくつかの実施形態では、リンカーは
ポリヌクレオチドであり得る。いくつかの実施形態では、リンカーはDNAリンカーであり
得る。いくつかの実施形態では、リンカーはRNAリンカーであり得る。いくつかの実施形
態では、リンカーはリガンドに結合することができるアプタマーを含み得る。いくつかの
実施形態では、リガンドは炭水化物、ペプチド、タンパク質、または核酸であってよい。
いくつかの実施形態では、リンカーはリボスイッチから誘導されるアプタマーを含んでよ
い。アプタマーがそれから誘導されるリボスイッチは、テオフィリンリボスイッチ、チア
ミンピロホスフェート(TPP)リボスイッチ、アデノシンコバラミン(AdoCbl)リボスイ
ッチ、S-アデノシルメチオニン(SAM)リボスイッチ、SAHリボスイッチ、フラビンモノヌ
クレオチド(FMN)リボスイッチ、テトラヒドロホレートリボスイッチ、リシンリボスイ
ッチ、グリシンリボスイッチ、プリンリボスイッチ、GlmSリボスイッチ、またはプレケオ
シン1(PreQ1)リボスイッチから選択してよい。いくつかの実施形態では、リンカーはポ
リペプチドリガンド等のポリペプチドまたはタンパク質のドメインに結合したアプタマー
を含んでよい。いくつかの実施形態では、ポリペプチドリガンドはKホモロジー(KH)ド
メイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコート
タンパク質ドメイン、ステリルアルファモチーフ、テロメラーゼKu結合モチーフおよびKu
タンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチー
フであってよい。いくつかの実施形態では、ポリペプチドリガンドは塩基エディターシス
テム成分の一部であってよい。たとえば、核酸塩基編集成分はデアミナーゼドメインおよ
びRNA認識モチーフを含んでよい。
【0065】
いくつかの実施形態では、リンカーはアミノ酸または複数のアミノ酸(たとえばペプチ
ドまたはタンパク質)であり得る。いくつかの実施形態では、リンカーは約5~100アミノ
酸の長さ、たとえば約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、2
0~30、30~40、40~50、50~60、60~70、70~80、80~90、または90~100アミノ酸の長
さであり得る。いくつかの実施形態では、リンカーは約100~150、150~200、200~250、
250~300、300~350、350~400、400~450、または450~500アミノ酸の長さであり得る。
これより長い、または短いリンカーも意図し得る。
【0066】
いくつかの実施形態では、リンカーは、Cas9ヌクレアーゼドメインを含むRNAプログラ
ム可能なヌクレアーゼのgRNA結合ドメインと核酸編集タンパク質(たとえばシチジンまた
はアデノシンデアミナーゼ)の触媒ドメインとを接合する。いくつかの実施形態では、リ
ンカーはdCas9と核酸編集タンパク質とを接合する。たとえば、リンカーは2つの基、分子
、またはその他の部分の間、またはその傍に位置して、共有結合を介してそれぞれを連結
し、それによって2つを連結する。いくつかの実施形態では、リンカーはアミノ酸または
複数のアミノ酸(たとえばペプチドまたはタンパク質)である。いくつかの実施形態では
、リンカーは有機分子、基、ポリマー、または化学部分である。いくつかの実施形態では
、リンカーは5~200アミノ酸の長さ、たとえば5、6、7、8、9、10、11、12、13、14、15
、16、17、18、19、20、25、35、45、50、55、60、60、65、70、70、75、80、85、90、90
、95、100、101、102、103、104、105、110、120、130、140、150、160、175、180、190
、または200アミノ酸の長さである。これより長い、または短いリンカーも意図される。
いくつかの実施形態では、リンカーはアミノ酸配列SGSETPGTSESATPESを含み、これはXTEN
リンカーとも称される。いくつかの実施形態では、リンカーはアミノ酸配列SGGSを含む。
いくつかの実施形態では、リンカーは(SGGS)n、(GGGS)n、(GGGGS)n、(G)n、(EA
AAK)n、(GGS)n、SGSETPGTSESATPES、もしくは(XP)nモチーフ、またはこれらの任意
の組合せを含み、ここでnは独立に1~30の整数であり、Xは任意のアミノ酸である。いく
つかの実施形態では、nは1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15で
ある。いくつかの実施形態では、リンカーは複数のプロリン残基を含み、5~21、5~14、
5~9、5~7アミノ酸の長さであり、たとえばPAPAP、PAPAPA、PAPAPAP、PAPAPAPA、P(AP)4
、P(AP)7、P(AP)10である。そのようなプロリンの多いリンカーは、「硬い」リンカーと
も称される。
【0067】
いくつかの実施形態では、塩基エディターのドメインは、SGGSSGSETPGTSESATPESSGGS、
SGGSSGGSSGSETPGTSESATPESSGGSSGGS、またはGGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEG
SAPGSPAGSPTSTEEGTSTE PSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGSのアミノ酸配列
を含むリンカーを介して融合している。いくつかの実施形態では、塩基エディターのドメ
インは、アミノ酸配列SGSETPGTSESATPESを含むリンカーを介して融合しており、この配列
はXTENリンカーとも称される。いくつかの実施形態では、リンカーは24アミノ酸の長さで
ある。いくつかの実施形態では、リンカーはアミノ酸配列SGGSSGGSSGSETPGTSESATPESを含
む。いくつかの実施形態では、リンカーは40アミノ酸の長さである。いくつかの実施形態
では、リンカーはアミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSを含む。いく
つかの実施形態では、リンカーは64アミノ酸の長さである。いくつかの実施形態では、リ
ンカーはアミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGS
SGGSを含む。いくつかの実施形態では、リンカーは92アミノ酸の長さである。いくつか
の実施形態では、リンカーはアミノ酸配列PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAG
SPTSTEEGTSTEPSEGSAP GTSTEPSEGSAPGTSESATPESGPGSEPATSを含む。
【0068】
用語「変異」は、本明細書で用いる場合、配列、たとえば、核酸またはアミノ酸の配列
の中の残基の別の残基による置換、または配列の中の1つもしくは複数の残基の欠失また
は挿入を意味する。変異は典型的には本明細書において、元の残基を特定し、続いて配列
の中の残基の位置、および新たに置換した残基を特定することによって記述される。本明
細書で提供するアミノ酸置換(変異)を作成する種々の方法は当技術で公知であり、たと
えばGreen and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Sp
ring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012))によって提供されて
いる。いくつかの実施形態では、ここで開示する塩基エディターは、顕著な数の意図しな
い変異(意図しない点変異等)を生じることなしに、核酸(たとえば対象のゲノムの中の
核酸)における点変異等の「意図した変異」を効率的に生じることができる。いくつかの
実施形態では、意図した変異は、意図した変異を生じるために特異的に設計したガイドポ
リヌクレオチド(たとえばgRNA)に結合した特異的塩基エディター(たとえばシチジン塩
基エディターまたはアデノシン塩基エディター)によって生じる変異である。一般に、配
列(たとえば本明細書に記載したアミノ酸配列)中で作成されまたは同定される変異は、
参照(または野生型)配列、即ち変異を含まない配列に対して番号付けされる。当業者で
あれば、参照配列に対するアミノ酸配列および核酸配列の中の変異の位置をどのようにし
て決定するかを、容易に理解することができる。
【0069】
用語「核酸」および「核酸分子」は、本明細書で用いる場合、核酸塩基および酸部分を
含む化合物、たとえばヌクレオシド、ヌクレオチド、またはヌクレオチドのポリマーを意
味する。典型的には、ポリマー核酸、たとえば3つ以上のヌクレオチドを含む核酸分子は
線状分子であり、その中で隣接するヌクレオチドはホスホジエステルリンケージを介して
互いに連結されている。いくつかの実施形態では、「核酸」は個別の核酸残基(たとえば
ヌクレオチドおよび/またはヌクレオシド)を意味する。いくつかの実施形態では、「核
酸」は3つ以上の個別のヌクレオチド残基を含むオリゴヌクレオチド鎖を意味する。本明
細書で用いる場合、用語「オリゴヌクレオチド」および「ポリヌクレオチド」は相互交換
可能に用いられ、ヌクレオチドのポリマー(たとえば少なくとも3つのヌクレオチドの鎖
)を意味する。いくつかの実施形態では、「核酸」はRNAならびに一本鎖および/または二
本鎖DNAを包含する。核酸はたとえばゲノム、トランスクリプト、mRNA、tRNA、rRNA、siR
NA、snRNA、プラスミド、コスミド、染色体、クロマチド、またはその他の天然産生の核
酸分子に関連して天然に産生することができる。一方、核酸分子は非天然産生分子、たと
えば組み換えDNAもしくはRNA、人工染色体、操作されたゲノムもしくはその断片、または
合成DNA、RNA、DNA/RNAハイブリッド、または非天然産生ヌクレオチドもしくはヌクレオ
シドであってよい。さらに、用語「核酸」、「DNA」、「RNA」、および/または同様の用
語には、核酸アナログ、たとえばホスホジエステル骨格以外を有するアナログが含まれる
。核酸は、天然の供給源から精製し、組み換え発現システムを用いて生成し、任意選択で
精製し、化学合成等をすることができる。適切な場合には、たとえば化学合成された分子
の場合に、核酸は化学的に修飾された塩基または糖および骨格の修飾を有するアナログ等
のヌクレオシドアナログを含み得る。核酸配列は、他に指示がなければ5'から3'の方向に
提示される。いくつかの実施形態では、核酸は、天然のヌクレオシド(たとえばアデノシ
ン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジ
ン、デオキシグアノシン、およびデオキシシチジン);ヌクレオシドアナログ(たとえば
2-アミノアデノシン、2-チオチミジン、イノシン、ピロロピリミジン、3-メチルアデノシ
ン、5-メチルシチジン、2-アミノアデノシン、C5-ブロモウリジン、C5-フルオロウリジン
、C5-ヨードウリジン、C5-プロピニルウリジン、C5-プロピニルシチジン、C5-メチルシチ
ジン、2-アミノアデノシン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノ
シン、8-オキソグアノシン、O(6)-メチルグアニン、および2-チオシチジン);化学的に
修飾された塩基;生物学的に修飾された塩基(たとえばメチル化塩基);インターカレー
トされた塩基;修飾された糖(たとえば2'-フルオロリボース、リボース、2'-デオキシリ
ボース、アラビノース、およびヘキソース);および/または修飾されたホスフェート基
(たとえばホスホロチオエート類および5'-N-ホスホルアミダイトリンケージ)であるか
、これらを含む。
【0070】
用語「核局在化配列」、「核局在化シグナル」、または「NLS」は、細胞核の中へのタ
ンパク質のインポートを促進するアミノ酸配列を意味する。核局在化配列は当技術で既知
であり、たとえばその内容が例示的な核局在化配列の開示のために参照により本明細書に
組み込まれる2001年5月31日にWO/2001/038547として公開された2000年11月23日出願のPla
nkらの国際PCT出願PCT/EP2000/011690に記載されている。その他の実施形態では、NLSは
たとえばKoblan et al., Nature Biotech. 2018 doi:10.1038/nbt.4172によって記載され
た最適化されたNLSである。いくつかの実施形態では、NLSはアミノ酸配列KRTADGSEFESPKK
KRKV、KRPAATKKAGQAKKKK、KKTELQTTNAENKTKKL、KRGINDRNFWRGENGRKTR、RKSGKIAAIVVKRPRK
、PKKKRKV、またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLCを含む。
【0071】
本明細書で相互交換可能に用いられる用語「核酸塩基」、「窒素塩基」、または「塩基
」は、ヌクレオシドを形成する窒素含有生物学的化合物を意味し、ヌクレオシドはヌクレ
オチドの成分となる。核酸塩基が塩基対を形成して1つずつ積み重なることができる能力
によって、リボ核酸(RNA)およびデオキシリボ核酸(DNA)等の長鎖ヘリカル構造が直接
もたらされる。5つの核酸塩基、即ちアデニン(A)、シトシン(C)、グアニン(G)、チ
ミン(T)、およびウラシル(U)は、プライマリーまたはカノニカルと呼ばれる。アデニ
ンおよびグアニンはプリンから誘導され、シトシン、ウラシル、およびチミンはピリミジ
ンから誘導される。DNAおよびRNAは、修飾される他の(非プライマリー)塩基を含むこと
もできる。非限定的で例示的な修飾された核酸塩基には、ヒポキサンチン、キサンチン、
7-メチルグアニン、5,6-ジヒドロウラシル、5-メチルシトシン(m5C)、および5-ヒドロ
メチルシトシンが含まれ得る。ヒポキサンチンおよびキサンチンは、変異原の存在下に、
いずれも脱アミノ化(アミン基のカルボニル基による置き換え)によって創成することが
できる。ヒポキサンチンはアデニンから修飾することができる。キサンチンはグアニンか
ら修飾することができる。ウラシルはシトシンの脱アミノ化に由来することができる。「
ヌクレオシド」は、核酸塩基および5炭糖(リボースまたはデオキシリボース)からなる
。ヌクレオシドの例には、アデノシン、グアノシン、ウリジン、シチジン、5-メチルウリ
ジン(m5U)、デオキシアデノシン、デオキシグアノシン、チミジン、デオキシウリジン
、およびデオキシシチジンが含まれる。修飾された核酸塩基を含むヌクレオシドの例には
、イノシン(I)、キサントシン(X)、7-メチルグアノシン(m7G)、ジヒドロウリジン
(D)、5-メチルシチジン(m5C)、およびプソイドウリジン(Φ)が含まれる。「ヌクレ
オチド」は核酸塩基、5炭糖(リボースまたはデオキシリボース)、および少なくとも1つ
のホスフェート基からなる。
【0072】
用語「核酸プログラム可能なDNA結合タンパク質」または「napDNAbp」は、「ポリヌク
レオチドプログラム可能なヌクレオチド結合タンパク質」と相互交換可能に用いられ、na
pDNAbpを特異的な核酸配列にガイドするガイド核酸等の核酸(たとえばDNAまたはRNA)と
会合するタンパク質を意味する。たとえば、Cas9タンパク質は、Cas9タンパク質をガイド
RNAと相補的な特定のDNA配列にガイドするガイドRNAと会合することができる。いくつか
の実施形態では、napDNAbpはCas9ドメイン、たとえばヌクレアーゼ活性Cas9、Cas9ニッカ
ーゼ(nCas9)、またはヌクレアーゼ不活性Cas9(dCas9)である。核酸プログラム可能な
DNA結合タンパク質の例には、限定なく、Cas9(たとえばdCas9およびnCas9)、Cas12a/Cpfl
、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、ならびにCa
s12iが含まれる。その他の核酸プログラム可能なDNA結合タンパク質も、本開示には具体
的に列挙しないが本開示の範囲内である。たとえば、それぞれの全ての内容が参照により
本明細書に組み込まれるMakarova et al. “Classification and Nomenclature of CRISP
R-Cas Systems: Where from Here?” CRISPR J. 2018 Oct;1:325-336. doi: 10.1089/cri
spr.2018.0033; Yan et al., “Functionally diverse type V CRISPR-Cas systems” Sc
ience. 2019 Jan 4;363(6422):88-91. doi: 10.1126/science.aav7271を参照されたい。
【0073】
用語「核酸塩基編集ドメイン」または「核酸塩基編集タンパク質」は、本明細書で用い
る場合、RNAまたはDNAにおける核酸塩基の修飾、たとえばシトシン(もしくはシチジン)
からウラシル(もしくはウリジン)またはチミン(もしくはチミジン)への、およびアデ
ニン(もしくはアデノシン)からヒポキサンチン(もしくはイノシン)への脱アミノ化、
ならびに鋳型のないヌクレオチドの付加および挿入を触媒することができるタンパク質ま
たは酵素を意味する。いくつかの実施形態では、核酸塩基編集ドメインはデアミナーゼド
メイン(たとえばシチジンデアミナーゼ、シトシンデアミナーゼ、アデニンデアミナーゼ
、またはアデノシンデアミナーゼ)である。いくつかの実施形態では、核酸塩基編集ドメ
インは天然産生の核酸塩基編集ドメインであり得る。いくつかの実施形態では、核酸塩基
編集ドメインは天然産生の核酸塩基編集ドメインから操作されまたは進化された核酸塩基
編集ドメインであり得る。核酸塩基編集ドメインは、細菌、ヒト、チンパンジー、ゴリラ
、サル、ウシ、イヌ、ラット、またはマウス等の任意の生命体からのものであり得る。た
とえば、核酸塩基編集タンパク質は、それぞれが参照により全体として本明細書に組み込
まれる国際PCT出願PCT/2017/045381(WO2018/027078)およびPCT/US2016/058344(WO2017
/070632)に記載されている。また、その全ての内容が参照により本明細書に組み込まれ
るKomor, A.C., et al., “Programmable editing of a target base in genomic DNA wi
thout double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M.,
et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA
cleavage” Nature 551, 464-471 (2017); および Komor, A.C., et al., “Improved b
ase excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:
A base editors with higher efficiency and product purity” Science Advances 3:ea
ao4774 (2017)を参照されたい。
【0074】
本明細書で用いる場合、「薬剤を得る」というような場合の「得る」は、薬剤を合成す
る、購入する、またはその他のやり方で獲得することを含む。
【0075】
本明細書で用いる「患者」または「対象」は、疾患または障害を有しまたはこれらが進
行していると診断されまたはその疑いがもたれている哺乳動物の対象を意味する。いくつ
かの実施形態では、用語「患者」は、疾患または障害が進行している可能性が平均より高
い哺乳動物の対象を意味する。例示的な患者はヒト、非ヒト霊長類、ネコ、イヌ、ブタ、
ウシ、ネコ、ウマ、ヤギ、ヒツジ、げっ歯類(たとえばマウス、ウサギ、ラット、または
モルモット)、ならびに本明細書で開示する療法の恩恵を受け得るその他の哺乳動物であ
り得る。例示的なヒト患者は男性および/または女性であり得る。
【0076】
「それを必要とする患者」または「それを必要とする対象」は、本明細書では、たとえ
ば疾患または障害を有すると診断されまたはその疑いがもたれている患者を意味するが、
レット症候群(RTT)に限定されない。
【0077】
用語「病原性変異」、「病原性バリアント」、「疾患原因変異」、「疾患原因バリアン
ト」、「有害変異」、または「素因性変異」は、ある疾患または障害に対する個体の感受
性または傾向を増大させる遺伝子の改変または変異を意味する。いくつかの実施形態では
、病原性変異は、遺伝子によってコードされるタンパク質における少なくとも1つの野生
型アミノ酸の少なくとも1つの病原性アミノ酸による置換を含む。
【0078】
用語「非保存的変異」は、異なった群の間の、たとえばリシンのトリプトファンによる
、またはフェニルアラニンのセリンによる等のアミノ酸置換を含む。この場合には、非保
存的アミノ酸置換は、機能性バリアントの生物学的活性に干渉しないか、または阻害しな
いことが好ましい。非保存的アミノ酸置換は機能性バリアントの生物学的活性を増強する
ことができ、それにより機能性バリアントの生物学的活性が野生型タンパク質と比較して
増大する。
【0079】
用語「タンパク質」、「ペプチド」、「ポリペプチド」、およびそれらの文法的等価物
は、本明細書で相互交換可能に用いられ、ペプチド(アミド)結合によって相互に連結さ
れたアミノ酸残基のポリマーを意味する。この用語は任意の大きさ、構造、または機能を
有するタンパク質、ペプチド、またはポリペプチドを意味する。典型的には、タンパク質
、ペプチド、またはポリペプチドは、少なくとも3アミノ酸の長さであることになる。タ
ンパク質、ペプチド、またはポリペプチドは、個別のタンパク質またはタンパク質の集積
を意味し得る。タンパク質、ペプチド、またはポリペプチドにおけるアミノ酸の1つまた
は複数は、たとえば炭水化物基、ヒドロキシル基、ホスフェート基、ファルネシル基、イ
ソファルネシル基、脂肪酸基、コンジュゲーション、機能化、またはその他の修飾のため
のリンカー、その他の化学的実体の付加によって修飾することができる。タンパク質、ペ
プチド、またはポリペプチドは、単一の分子であってもよく、多分子の複合体であっても
よい。タンパク質、ペプチド、またはポリペプチドは、天然産生のタンパク質またはペプ
チドの単なる断片であってもよい。タンパク質、ペプチド、またはポリペプチドは、天然
産生、組み換え、もしくは合成、またはそれらの任意の組合せであってよい。本明細書で
用いる用語「融合タンパク質」は、少なくとも2つの異なるタンパク質からのタンパク質
ドメインを含むハイブリッドポリペプチドを意味する。1つのタンパク質は融合タンパク
質のアミノ末端(N末端)部分に、またはカルボキシ末端(C末端)部分に位置し、それに
より、アミノ末端融合タンパク質またはカルボキシ末端融合タンパク質をそれぞれ形成す
ることができる。タンパク質は異なるドメイン、たとえば核酸結合ドメイン(たとえば標
的部位へのタンパク質の結合を指令するCas9のgRNA結合ドメイン)および核酸開裂ドメイ
ン、または核酸編集タンパク質の触媒ドメインを含み得る。いくつかの実施形態では、タ
ンパク質は、タンパク質部分、たとえば核酸結合ドメインを構成するアミノ酸配列、およ
び有機化合物、たとえば核酸開裂剤として作用し得る化合物を含む。いくつかの実施形態
では、タンパク質は、核酸、たとえばRNAまたはDNAとの複合体中にあるか、またはこれら
と会合している。本明細書で提供するタンパク質のいずれも、当技術で既知の任意の方法
によって生成することができる。たとえば、本明細書で提供するタンパク質は組み換えタ
ンパク質の発現および精製を介して生成することができ、これはペプチドリンカーを含む
融合タンパク質に特に適している。組み換えタンパク質の発現および精製の方法は公知で
あり、その全ての内容が参照により本明細書に組み込まれるGreen and Sambrook, Molecu
lar Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press,
Cold Spring Harbor, N.Y. (2012)に記載されたものが含まれる。
【0080】
本明細書で開示したポリペプチドおよびタンパク質(その機能性部分および機能性バリ
アントを含む)は、1つまたは複数の天然産生のアミノ酸の代わりに合成のアミノ酸を含
み得る。そのような合成アミノ酸は当技術で既知であり、たとえばアミノシクロヘキサン
カルボン酸、ノルロイシン、α-アミノ-n-デカノイン酸、ホモセリン、S-アセチルアミノ
メチルシステイン、trans-3-およびtrans-4-ヒドロキシプロリン、4-アミノフェニルアラ
ニン、4-ニトロフェニルアラニン、4-クロロフェニルアラニン、4-カルボキシフェニルア
ラニン、β-フェニルセリン、β-ヒドロキシフェニルアラニン、フェニルグリシン、α-
ナフチルアラニン、シクロヘキシルアラニン、シクロヘキシルグリシン、インドリン-2-
カルボン酸、1,2,3,4-テトラヒドロイソキノリン-3-カルボン酸、アミノマロン酸、アミ
ノマロン酸モノアミド、N'-ベンジル-N'-メチルリシン、N',N'-ジベンジルリシン、6-ヒ
ドロキシリシン、オルニチン、α-アミノシクロペンタンカルボン酸、α-アミノシクロヘ
キサンカルボン酸、α-アミノシクロヘプタンカルボン酸、α-(2-アミノ-2-ノルボルナン
)カルボン酸、α,γ-ジアミノ酪酸、α,β-ジアミノプロピオン酸、ホモフェニルアラニ
ン、およびα-tert-ブチルグリシンを含む。ポリペプチドおよびタンパク質は、ポリペプ
チド構築物の1つまたは複数のアミノ酸の転写後修飾と組み合わせることができる。転写
後修飾の非限定的な例には、ホスホリル化、アセチル化およびホルミル化を含むアシル化
、グリコシル化(N連結およびO連結を含む)、アミド化、ヒドロキシル化、メチル化およ
びエチル化を含むアルキル化、ユビキチル化、ピロリドンカルボン酸の付加、ジスルフィ
ド架橋の形成、硫酸化、ミリストイル化、パルミトイル化、イソプレニル化、ファルネシ
ル化、ゲラニル化、グリピエーション、リポイル化、およびヨウ素化が含まれる。
【0081】
用語「ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン」は、ポリヌクレ
オチドプログラム可能なDNA結合ドメインを特定の核酸配列にガイドするガイドポリヌク
レオチド(たとえばガイドRNA)等の核酸(たとえばDNAまたはRNA)と会合するタンパク
質を意味する。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチ
ド結合ドメインは、ポリヌクレオチドプログラム可能なDNA結合ドメインである。いくつ
かの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ポ
リヌクレオチドプログラム可能なRNA結合ドメインである。いくつかの実施形態では、ポ
リヌクレオチドプログラム可能なヌクレオチド結合ドメインは、Cas9タンパク質である。
Cas9タンパク質は、Cas9タンパク質をガイドRNAに相補的な特定のDNA配列にガイドするガ
イドRNAと会合することができる。いくつかの実施形態では、ポリヌクレオチドプログラ
ム可能なヌクレオチド結合ドメインはCas9ドメイン、たとえばヌクレアーゼ活性Cas9、Ca
s9ニッカーゼ(nCas9)、またはヌクレアーゼ不活性Cas9(dCas9)である。核酸プログラ
ム可能なDNA結合タンパク質の非限定的な例には、Cas9(たとえばdCas9およびnCas9)、Cas
12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、な
らびにCas12iが含まれる。Cas酵素の非限定的な例には、Cas1、Cas1B、Cas2、Cas3、Cas4
、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9(
Csn1またはCsx12としても知られている)、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、C
as12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、Csy1、Csy2、Csy3、
Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、C
sm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Cs
x14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、
Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、II型Casエフェクター
タンパク質、V型Casエフェクタータンパク質、VI型Casエフェクタータンパク質、CARF、D
inG、それらのホモログ、またはそれらの修飾されたもしくは操作されたバージョンが含
まれる。他の核酸プログラム可能なDNA結合タンパク質も、本開示には具体的に列挙しな
いが本開示の範囲内である。
【0082】
タンパク質または核酸に関連して本明細書で用いる用語「組み換え」は、天然には産生
しないがヒトの操作の生成物であるタンパク質または核酸を意味する。たとえば、いくつ
かの実施形態では、組み換えタンパク質または核酸は、任意の天然に産生する配列と比較
して、少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ
、少なくとも6つ、または少なくとも7つの変異を含むアミノ酸またはヌクレオチドの配列
を含む。
【0083】
「低減」は、少なくとも10%、25%、50%、75%、または100%の負の改変を意味する。
【0084】
「参照」は、標準または対照の条件を意味する。一実施形態では、参照は野生型または
健常な細胞である、
【0085】
「参照配列」は、配列比較の基礎として用いる定義された配列である。参照配列は、特
定された配列のサブセットまたは全体、たとえば全長のcDNAもしくは遺伝子配列の断片、
または完全なcDNAもしくは遺伝子配列であってよい。ポリペプチドについては、参照ポリ
ペプチド配列の長さは一般に、少なくとも約16アミノ酸、好ましくは少なくとも約20アミ
ノ酸、より好ましくは少なくとも約25アミノ酸、さらにより好ましくは約35アミノ酸、約
50アミノ酸、または約100アミノ酸になる。核酸については、参照核酸配列の長さは一般
に、少なくとも約50ヌクレオチド、好ましくは少なくとも約60ヌクレオチド、より好まし
くは少なくとも約75ヌクレオチド、さらに好ましくは約100ヌクレオチド、もしくは約300
ヌクレオチド、またはその付近もしくはその間の任意の整数になる。
【0086】
用語「RNAプログラム可能なヌクレアーゼ」および「RNAガイドされたヌクレアーゼ」は
、開裂の標的ではない1つもしくは複数のRNAとともに(たとえばこれと結合しまたは会合
して)用いられる。いくつかの実施形態では、RNAプログラム可能なヌクレアーゼは、RNA
との複合体中では、ヌクレアーゼ:RNA複合体と称し得る。典型的には、結合したRNAはガ
イドRNA(gRNA)と称される。gRNAは2つ以上のRNAの複合体として、または単一のRNA分子
として存在することができる。単一のRNA分子として存在するgRNAは、シングルガイドRNA
(sgRNA)と称し得るが、「gRNA」は相互交換可能に用いられ、単一の分子として、また
は2つ以上の分子の複合体として存在するガイドRNAを意味する。典型的には、単一のRNA
種として存在するgRNAは2つのドメイン、即ち(1)標的核酸とホモロジーを共有する(た
とえばCas9複合体の標的への結合も指令する)ドメイン、および(2)Cas9タンパク質に
結合するドメインを含む。いくつかの実施形態では、ドメイン(2)はtracrRNAとして知ら
れている配列に対応し、ステムループ構造を含む。たとえば、いくつかの実施形態では、
ドメイン(2)は、その全体の内容が参照により本明細書に組み込まれるJinek et al., S
cience 337:816-821(2012)に提供されているように、tracrRNAと同一または相同である。
gRNAの他の例(たとえばドメイン2を含むもの)は、それぞれの全体の内容が参照により
全体として本明細書に組み込まれる2013年9月6日出願の「Switchable Cas9 Nucleases an
d Uses Thereof」と題する米国仮特許出願第61/874,682号および2013年9月6日出願の「De
livery System For Functional Nucleases」と題する米国仮特許出願第61/874,746号に見
出すことができる。いくつかの実施形態では、gRNAはドメイン(1)および(2)の2つ以
上を含み、「延長されたgRNA」と称される。たとえば、延長されたgRNAは、本明細書で述
べるように、2つ以上のCas9タンパク質に結合して、2つ以上の異なる領域で標的の核酸に
結合することになる。gRNAは標的部位に相補的なヌクレオチド配列を含み、これがヌクレ
アーゼ/RNA複合体の前記標的部位への結合を媒介し、ヌクレアーゼ:RNA複合体の配列特異
性を提供する。いくつかの実施形態では、RNAプログラム可能なヌクレアーゼは(CRISPR
関連システム)Cas9エンドヌクレアーゼ、たとえばStreptococcus pyogenesのCas9(Csnl
)である(たとえば「Complete genome sequence of an Ml strain of Streptococcus pyo
genes.」、Ferretti J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K.,
Primeaux C, Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Ji
a H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Ro
e B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); 「CRI
SPR RNA maturation by trans-encoded small RNA and host factor RNase III.」、Delt
cheva E., Chylinski K., Sharma CM., Gonzales K., Chao Y., Pirzada Z.A., Eckert M
.R., Vogel J., Charpentier E., Nature 471:602-607(2011)を参照されたい)。
【0087】
用語「単一のヌクレオチド多型(SNP)」は、ゲノム中の特定の位置で起こる単一のヌ
クレオチドの変形であり、それぞれの変形は集団の中のいくらかの認識できる程度(たと
えば1%超)で存在する。たとえば、ヒトゲノムの中の特定の塩基の位置において、Cヌク
レオチドは大部分の個体で出現し得るが、少数の個体ではその位置はAによって占められ
ている。これは、この特定の位置にSNPが存在し、2つの可能なヌクレオチドの変形、即ち
CまたはAがこの位置についてのアリルであることを意味している。SNPは疾患、広範囲の
ヒトの疾患への感受性における相違の根底にある。病気の重篤度および我々の身体の治療
に対する応答も、遺伝子の変形の現れである。SNPは遺伝子のコーディング領域、遺伝子
の非コーディング領域、または遺伝子間領域(遺伝子の間の領域)の中に含まれ得る。い
くつかの実施形態では、コーディング配列の中のSNPは、遺伝子コードの縮重のために、
生成されるタンパク質のアミノ酸配列を必ずしも変化させない。コーディング領域の中の
SNPには2つの種類、即ち同義のSNPおよび非同義のSNPがある。同義のSNPはタンパク質の
配列に影響しないが、非同義のSNPはタンパク質のアミノ酸配列を変化させる。非同義のS
NPには2種、即ちミスセンスおよびノンセンスがある。タンパク質コーディング領域にな
いSNPでも、遺伝子のスプライシング、転写因子の結合、メッセンジャーRNAの分解、また
は非コーディングRNAの配列には影響し得る。この種類のSNPによって影響される遺伝子発
現はeSNP(発現SNP)と称され、遺伝子の上流または下流にあってよい。単一ヌクレオチ
ドバリアント(SNV)は頻度の制限のない単一のヌクレオチドにおける変形であり、体細
胞で起こり得る。体細胞の単一ヌクレオチド変形(たとえばがんによって引き起こされる
)も、単一ヌクレオチド改変と呼ぶことができる。
【0088】
「特異的に結合する」は、本発明のポリペプチドおよび/または核酸分子を認識しこれ
と結合するが、試料、たとえば生物学的試料の中の他の分子を実質的に認識せずこれと結
合しない核酸分子、ポリペプチド、またはそれらの複合体(たとえば核酸プログラム可能
なDNA結合ドメインとガイド核酸)、化合物、または分子を意味する。
【0089】
本発明の方法において有用な核酸分子には、本発明のポリペプチドまたはその断片をコ
ードする任意の核酸分子が含まれる。そのような核酸分子は内因性核酸配列と100%同一で
ある必要はなく、典型的には実質的な同一性を呈示することになる。内因性配列と「実質
的な同一性」を有するポリヌクレオチドは、典型的には二本鎖核酸分子の少なくとも1つ
の鎖とハイブリダイズすることができる。本発明の方法において有用な核酸分子には、本
発明のポリペプチドまたはその断片をコードする任意の核酸分子が含まれる。そのような
核酸分子は内因性核酸配列と100%同一である必要はなく、典型的には実質的な同一性を呈
示することになる。内因性配列と「実質的な同一性」を有するポリヌクレオチドは、典型
的には二本鎖核酸分子の少なくとも1つの鎖とハイブリダイズすることができる。「ハイ
ブリダイズ」は、種々のストリンジェンシーの条件の下で相補的なポリヌクレオチド配列
(たとえば本明細書に記載した遺伝子)またはその部分の間で二本鎖分子を形成する対を
意味する(たとえばWahl, G. M. and S. L. Berger (1987) Methods Enzymol. 152:399;
Kimmel, A. R. (1987) Methods Enzymol. 152:507を参照されたい)。
【0090】
たとえば、ストリンジェントな塩濃度は通常、約750mM未満のNaClおよび75mM未満のク
エン酸三ナトリウム、好ましくは約500mM未満のNaClおよび50mM未満のクエン酸三ナトリ
ウム、より好ましくは約250mM未満のNaClおよび25mM未満のクエン酸三ナトリウムになる
。低いストリンジェンシーのハイブリダイゼーションは有機溶媒、たとえばホルムアミド
の非存在下に得られ、一方で高いストリンジェンシーのハイブリダイゼーションは少なく
とも約35%のホルムアミド、より好ましくは少なくとも約50%のホルムアミドの存在下に得
られる。ストリンジェントな温度条件には、通常少なくとも約30℃、より好ましくは少な
くとも約37℃、最も好ましくは少なくとも約42℃の温度が含まれる。ハイブリダイゼーシ
ョンの時間、界面活性剤、たとえばドデシル硫酸ナトリウム(SDS)の濃度、およびキャ
リアDNAの包含または非包含等のさらなる種々のパラメーターは、当業者には公知である
。種々のレベルのストリンジェンシーは、これらの種々の条件を必要に応じて組み合わせ
ることによって達成される。好ましい実施形態では、ハイブリダイゼーションは750mMのN
aCl、75mMのクエン酸三ナトリウム、および1%のSDS中、30℃で起こる。より好ましい実施
形態では、ハイブリダイゼーションは500mMのNaCl、50mMのクエン酸三ナトリウム、1%のS
DS、35%のホルムアミド、および100μg/mlの変性サケ精子DNA(ssDNA)中、37℃で起こる
。最も好ましい実施形態では、ハイブリダイゼーションは250mMのNaCl、25mMのクエン酸
三ナトリウム、1%のSDS、50%のホルムアミド、および200μg/mlのssDNA中、42℃で起こる
。これらの条件の有用な変形は当業者には容易に明白になる。
【0091】
ほとんどの適用について、ハイブリダイゼーションに続く洗浄ステップも、ストリンジ
ェンシーが変化するすることになる。洗浄のストリンジェンシーの条件は塩濃度および温
度によって定義することができる。上記のように、洗浄のストリンジェンシーは塩濃度の
低下または温度の上昇によって増大することができる。たとえば、洗浄ステップのための
ストリンジェントな塩濃度は、好ましくは約30mM未満のNaClおよび3mM未満のクエン酸三
ナトリウム、最も好ましくは約15mM未満のNaClおよび1.5mM未満のクエン酸三ナトリウム
となる。洗浄ステップのためのストリンジェントな温度条件には、通常少なくとも約25℃
、より好ましくは少なくとも約42℃、さらにより好ましくは少なくとも約68℃の温度が含
まれる。好ましい実施形態では、洗浄ステップは30mMのNaCl、3mMのクエン酸三ナトリウ
ム、および0.1%のSDS中、25℃で行なわれることになる。より好ましい実施形態では、洗
浄ステップは15mMのNaCl、1.5mMのクエン酸三ナトリウム、および0.1%のSDS中、42℃で行
なわれることになる。より好ましい実施形態では、洗浄ステップは15mMのNaCl、1.5mMの
クエン酸三ナトリウム、および0.1%のSDS中、68℃で行なわれることになる。これらの条
件のさらなる変動は、当業者には容易に明白になる。ハイブリダイゼーション手法は当業
者には公知であり、たとえばBenton and Davis (Science 196:180, 1977); Grunstein an
d Hogness (Proc. Natl. Acad. Sci., USA 72:3961, 1975); Ausubel et al. (Current P
rotocols in Molecular Biology, Wiley Interscience, New York, 2001); Berger and K
immel (Guide to Molecular Cloning Techniques, 1987, Academic Press, New York);
および Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harb
or Laboratory Press, New York.に記載されている。
【0092】
「対象」は、それだけに限らないが、ヒトまたはウシ、ウマ、イヌ、ヒツジ、またはネ
コ等の非ヒト哺乳動物を含む哺乳動物を意味する。
【0093】
「実質的に同一」は、参照のアミノ酸配列(たとえば本明細書に記載したアミノ酸配列
のいずれか1つ)または核酸配列(たとえば本明細書に記載した核酸配列のいずれか1つ)
と少なくとも50%の同一性を呈示するポリペプチドまたは核酸の分子を意味する。好まし
くは、そのような配列は、比較のために用いる配列とアミノ酸レベルまたは核酸において
少なくとも60%、より好ましくは80%または85%、より好ましくは90%、95%、またはさらに9
9%の同一性を有する。
【0094】
配列同一性は典型的には配列解析ソフトウェア(たとえばSequence Analysis Software
Package of the Genetics Computer Group, University of Wisconsin Biotechnology C
enter, 1710 University Avenue, Madison, Wis. 53705、BLAST、BESTFIT、COBALT、EMBO
SS Needle、GAP、またはPILEUP/PRETTYBOXプログラム)を用いて測定される。そのような
ソフトウェアは、ホモロジーの程度を種々の置換、欠失、および/または他の修飾に割り
当てることによって、同一または同様の配列を一致させる。保存的置換には、典型的には
以下の、グリシン、アラニン;バリン、イソロイシン、ロイシン;アスパラギン酸、グル
タミン酸、アスパラギン、グルタミン;セリン、スレオニン;リシン、アルギニン;およ
びフェニルアラニン、チロシンの群の中における置換が含まれる。同一性の程度を決定す
る例示的なアプローチにおいてはBLASTプログラムが用いられ、e-3とe-100との間の確率
スコアが密接に関連する配列を示す。COBALTは、たとえば以下のパラメーターとともに用
いる。
a)アラインメントパラメーター:ギャップペナルティー-11、-1およびエンドギャップペ
ナルティー-5,-1
b)CDDパラメーター:RPS BLASTオンを用いる;BLAST E値0.003;保存されたカラムを発見
し、再計算する、および
c)クエリークラスタリングパラメーター:クエリークラスターオンを用いる;ワードサイ
ズ4、最大クラスター距離0.8;アルファベットレギュラー。
EMBOSSニードルは、たとえば以下のパラメーターとともに用いる。
a)マトリックス:BLOSUM62
b)GAP OPEN: 10;
c)GAP EXTEND: 0.5;
d)OUTPUT FORMAT:ペア;
e)END GAP PENALTY:フォールス;
f)END GAP OPEN: 10、および
g)END GAP EXTEND: 0.5。
【0095】
用語「標的部位」は、核酸塩基エディターによって改変される核酸分子の中の配列を意
味する。一実施形態では、標的部位はデアミナーゼまたはデアミナーゼを含む融合タンパ
ク質(たとえばシチジンデアミナーゼまたはアデニンデアミナーゼ)によって決定される
。
【0096】
RNAプログラム可能なヌクレアーゼ(たとえばCas9)は、DNA開裂部位を標的とするため
にRNA:DNAハイブリダイゼーションを用いるので、これらのタンパク質は原理的にはガイ
ドRNAによって特定される任意の配列を標的とすることができる。部位特異的開裂のため
に(たとえばゲノムを修飾するために)Cas9等のRNAプログラム可能なヌクレアーゼを用
いる方法は当技術において既知である(たとえばそれぞれの全体の内容が参照により本明
細書に組み込まれるCong, L. et ah, Multiplex genome engineering using CRISPR/Cas
systems. Science 339, 819-823 (2013); Mali, P. et ah, RNA-guided human genome en
gineering via Cas9. Science 339, 823-826 (2013); Hwang, W.Y. et ah, Efficient ge
nome editing in zebrafish using a CRISPR-Cas system. Nature biotechnology 31, 22
7-229 (2013); Jinek, M. et ah, RNA-programmed genome editing in human cells. eLi
fe 2, e00471 (2013); Dicarlo, J.E. et ah, Genome engineering in Saccharomyces ce
revisiae using CRISPR-Cas systems. Nucleic acids research (2013); Jiang, W. et a
h RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nature biote
chnology 31, 233-239 (2013)を参照されたい)。
【0097】
本明細書で用いる場合、用語「治療する(treat)」、「治療する(treating)」、「治療
」等は、障害および/もしくはそれに付随する症状を低減しもしくは改善し、または所望
の薬理学的および/もしくは生理学的な効果を得ることを意味する。障害または病態を治
療することは、除外はしていないが、その障害、病態、またはそれに付随する症状を完全
に除去することを要求していないことが認識される。いくつかの実施形態では、効果は治
療的であり、即ち限定なくその効果は疾患および/またはその疾患に起因する有害な症状
の強度を部分的にまたは完全に低減し、軽減し、無効にし、減弱させ、緩和し、低下させ
、または治癒させる。いくつかの実施形態では、効果は予防的であり、即ちその効果は疾
患または病態の発生または再発を保護し、または防止する。この目的のため、ここで開示
する方法は本明細書に記載した組成物の治療有効量を投与するステップを含む。
【0098】
「ウラシルグリコシラーゼ阻害剤」は、ウラシル切除修復システムを阻害する薬剤を意
味する。一実施形態では、薬剤は宿主のウラシルDNAグリコシラーゼに結合してDNAからの
ウラシル残基の除去を防止するタンパク質またはその断片である。
【0099】
本明細書における変化するもののいずれの定義における化学物質の群のリストへの言及
も、任意の単一の群または列挙された群の組合せとしてのその変化するものの定義を含む
。本明細書における変化するものまたは態様についての実施形態への言及は、任意の単一
の実施形態としてのまたは任意の他の実施形態もしくはその部分と組み合わせた実施形態
を含む。
【0100】
本明細書で提供する任意の組成物または方法は、本明細書で提供する他の組成物または
方法のいずれの1つまたは複数とも組み合わせることができる。
【0101】
DNA編集は、病原性変異を遺伝子レベルで補正することによって疾患の状態を改変する
実行可能な手段として出現した。最近まで、全てのDNA編集プラットフォームは、特定さ
れたゲノム部位にDNA二本鎖の切断(DSB)を誘導し、内因性DNA修復経路に頼って半確率
論的な様式で生成物の結果を決定することによって機能しているので、遺伝子産物の複雑
な集団がもたらされていた。相同性誘導型修復(HDR)経路によって、正確で使用者が定
義する修復結果を達成することはできるが、治療に関連する細胞型におけるHDRを用いる
高効率の修復は多くの課題によって妨げられていた。実際には、この経路は、競合する過
誤が起こりやすい非相同末端接合経路と比較して非効率である。さらに、HDRは細胞サイ
クルのG1期およびS期に厳しく限定され、有糸分裂後の細胞のDSBを正確に修復することが
妨げられている。結果として、これらの集団において使用者が定義するプログラム可能な
様式で高い効率をもってゲノム配列を改変することは困難または不可能であることが証明
されている。
【0102】
核酸塩基エディター
ポリヌクレオチドの標的ヌクレオチド配列を編集し、修飾し、または改変するための塩
基エディターまたは核酸塩基エディターが本明細書で開示される。ポリヌクレオチドプロ
グラム可能なヌクレオチド結合ドメインおよび核酸塩基編集ドメインを含む核酸塩基エデ
ィターまたは塩基エディターが本明細書に記載される。ポリヌクレオチドプログラム可能
なヌクレオチド結合ドメインは、結合したガイドポリヌクレオチド(たとえばgRNA)と併
せれば、標的のポリヌクレオチド配列と特異的に結合し(即ち、結合したガイド核酸の塩
基と標的ポリヌクレオチド配列の塩基との間の相補的な塩基対形成を介して)、それによ
り、編集が望まれる標的の核酸配列に塩基エディターを局在化させることができる。いく
つかの実施形態では、標的のポリヌクレオチド配列は一本鎖DNAまたは二本鎖DNAを含む。
いくつかの実施形態では、標的のポリヌクレオチド配列はRNAを含む。いくつかの実施形
態では、標的のポリヌクレオチド配列はDNA-RNAハイブリッドを含む。
【0103】
ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン
用語「ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン」または「核酸プ
ログラム可能なDNA結合タンパク質(napDNAbp)」は、ポリヌクレオチドプログラム可能
なヌクレオチド結合ドメインを特定の核酸配列にガイドするガイドポリヌクレオチド(た
とえばガイドRNA)等の核酸(たとえばDNAまたはRNA)と会合するタンパク質を意味する
。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイ
ンは、ポリヌクレオチドプログラム可能なDNA結合ドメインである。いくつかの実施形態
では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ポリヌクレオチ
ドプログラム可能なRNA結合ドメインである。いくつかの実施形態では、ポリヌクレオチ
ドプログラム可能なヌクレオチド結合ドメインは、Cas9タンパク質である。いくつかの実
施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、Cpf1タン
パク質である。
【0104】
CRISPRは可動性の遺伝子要素(ウイルス、転置可能な要素、および接合性プラスミド)
に対する保護を提供する適応性免疫システムである。CRISPRクラスターは、スペーサー、
先行する可動性要素に相補的な配列、および標的侵攻性の核酸を含む。CRISPRクラスター
は転写され、プロセシングされてCRISPR RNA(crRNA)になる。II型CRISPRシステムでは
、pre-crRNAの正しいプロセシングにはトランスコード化小RNA(tracrRNA)、内因性リボ
ヌクレアーゼ3(rnc)、およびCas9タンパク質が必要である。tracrRNAはpre-crRNAのリ
ボヌクレアーゼ3に補助されたプロセシングのガイドとして働く。続いてCas9/crRNA/trac
rRNAはスペーサーに相補的な線状または環状のdsDNA標的をエンドヌクレアーゼ的に開裂
させる。crRNAに相補的でない標的鎖は最初にエンドヌクレアーゼ的に切断され、次いで3
'-5'エキソヌクレアーゼ的にトリムされる。天然では、DNAの結合および開裂は、典型的
にはタンパク質および両方のRNAを必要とする。しかし、crRNAとtracrRNAの両方の側面を
単一のRNA種に組み込むようにシングルガイドRNA(「sgRNA」、または単に「gRNA」)を
操作することができる。たとえば、その全体の内容が参照により本明細書に組み込まれる
Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J. A., Charpentier E. Scien
ce 337:816-821(2012)を参照されたい。Cas9はCRISPRリピート配列における短いモチーフ
(PAMまたはプロトスペーサー隣接モチーフ)を認識し、自己と非自己を区別することを
補助する。
【0105】
核酸塩基エディターのCas9ドメイン
Cas9のヌクレアーゼ配列および構造は当業者には公知である(たとえば、それぞれの全
体の内容が参照により本明細書に組み込まれる“Complete genome sequence of an Ml st
rain of Streptococcus pyogenes.” Ferretti et al., Natl. Acad. Sci. U.S.A. 98:4
658-4663(2001); “CRISPR RNA maturation by trans-encoded small RNA and host fact
or RNase III.” Deltcheva E., Chylinski K., Sharma CM., Gonzales K., Chao Y., Pi
rzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011); お
よび “A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial imm
unity.” Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier
E. Science 337:816-821(2012)を参照されたい)。Cas9のオーソログは、それだけに限
らないがS. pyogenesおよびS. thermophilusを含む種々の種において記載されている。さ
らなる好適なCas9ヌクレアーゼおよび配列はこの開示に基づいて当業者には明白であるこ
とができ、そのようなCas9ヌクレアーゼおよび配列には、その全体の内容が参照により本
明細書に組み込まれるChylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 fa
milies of type II CRISPR-Cas immunity systems”(2013) RNA Biology 10:5, 726-737
に開示された生命体および遺伝子座からのCas9配列が含まれる。
【0106】
いくつかの態様では、核酸プログラム可能なDNA結合タンパク質(napDNAbp)はCas9ド
メインである。非限定的で例示的なCas9ドメインを本明細書で提供する。Cas9ドメインは
ヌクレアーゼ活性Cas9ドメイン、ヌクレアーゼ不活性Cas9ドメイン、またはCas9ニッカー
ゼであってよい。いくつかの実施形態では、Cas9ドメインはヌクレアーゼ活性ドメインで
ある。たとえば、Cas9ドメインは二本鎖核酸の両方の鎖(たとえば二本鎖DNA分子の両方
の鎖)を切断するCas9ドメインであってよい。いくつかの実施形態では、Cas9ドメインは
本明細書で説明するアミノ酸配列のいずれか1つを含む。いくつかの実施形態では、Cas9
ドメインは、本明細書で説明するアミノ酸配列のいずれか1つに対して少なくとも60%、少
なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なく
とも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも9
9%、少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、Cas
9ドメインは、本明細書で説明するアミノ酸配列のいずれか1つと比較して1、2、3、4、5
、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26
、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46
、47、48、49、50、またはそれを超える変異を有するアミノ酸配列を含む。いくつかの実
施形態では、Cas9ドメインは、本明細書で説明するアミノ酸配列のいずれか1つと比較し
て少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくと
も50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少
なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なく
とも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも9
00、少なくとも1000、少なくとも1100、または少なくとも1200の同一の連続的なアミノ酸
残基を有するアミノ酸配列を含む。
【0107】
いくつかの実施形態では、Cas9ヌクレアーゼは不活性の(たとえば不活化された)DNA
開裂ドメインを有する。即ち、Cas9は「nCas9」タンパク質(「ニッカーゼ」Cas9につい
て)と称されるニッカーゼである。ヌクレアーゼ不活化Cas9タンパク質は相互交換可能に
「dCas9」タンパク質(ヌクレアーゼデッドCas9について)と称し得る。不活性DNA開裂ド
メインを有するCas9タンパク質(またはその断片)を産生する方法は既知である(たとえ
ばそれぞれの全体の内容が参照により本明細書に組み込まれるJinek et al, Science. 33
7:816-821(2012); Qi et al, “Repurposing CRISPR as an RNA-Guided Platform for Se
quence-Specific Control of Gene Expression” (2013) Cell. 28; 152(5): 1173-83を
参照されたい)。たとえば、Cas9のDNA開裂ドメインは2つのサブドメイン、即ちHNHヌク
レアーゼサブドメインおよびRuvC1サブドメインを含むことが知られている。HNHサブドメ
インはgRNAに相補的な鎖を開裂し、RuvC1サブドメインは非相補的鎖を開裂する。これら
のサブドメインの中の変異はCas9のヌクレアーゼ活性を沈黙させることができる。たとえ
ば、変異D10AおよびH840Aは、S.pyogenesのCas9のヌクレアーゼ活性を完全に不活化する
(Jinek et al, Science. 337:816-821(2012); Qi et al, Cell. 28;152(5): 1173-83 (2
013))。いくつかの実施形態では、Cas9の断片を含むタンパク質が提供される。たとえば
、いくつかの実施形態では、タンパク質は2つのCas9ドメイン、(1)Cas9のgRNA結合ドメ
イン、または(2)Cas9のDNA開裂ドメイン、のうち1つを含む。いくつかの実施形態では
、Cas9またはその断片を含むタンパク質は、「Cas9バリアント」と称される。Cas9バリア
ントはCas9またはその断片とホモロジーを共有している。たとえば、Cas9バリアントは野
生型Cas9に対して少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、
少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同
一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一であ
る。いくつかの実施形態では、Cas9バリアントは野生型Cas9と比較して1、2、3、4、5、6
、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、2
7、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、4
7、48、49、50またはそれを超えるアミノ酸の変化を有してよい。いくつかの実施形態で
は、Cas9バリアントはCas9の断片(たとえばgRNA結合ドメインまたはDNA開裂ドメイン)
を含み、断片は野生型Cas9の対応する断片と少なくとも約70%同一、少なくとも約80%同一
、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%
同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少
なくとも約99.9%同一である。いくつかの実施形態では、断片は対応する野生型Cas9のア
ミノ酸の長さの少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なく
とも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも7
5%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、
少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。
【0108】
いくつかの実施形態では、断片は少なくとも100アミノ酸の長さである。いくつかの実
施形態では、断片は少なくとも100、150、200、250、300、350、400、450、500、550、60
0、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または
少なくとも1300アミノ酸の長さである。いくつかの実施形態では、野生型Cas9はStreptoc
occus pyogenesのCas9に対応する(NCBI Reference Sequence: NC_017053.1、ヌクレオチ
ドおよびアミノ酸の配列は下記の通り):
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGATTATAAGGT
TCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTG
GCAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGT
TATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGT
GGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAA
CTATCTATCATCTGCGAAAAAAATTGGCAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCAT
ATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCA
GTTGGTACAAATCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTAGAGTAGATGCTAAAGCGATTCTTTCTG
CACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAGAAATGGCTTGTTTGGGAAT
CTCATTGCTTTGTCATTGGGATTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTC
AAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTA
AGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATAGTGAAATAACTAAGGCTCCCCTATCAGCTTCA
ATGATTAAGCGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTA
TAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATA
AATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGC
AAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGA
AGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTC
CATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAA
GTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGT
ACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAGGGAA
TGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACC
GTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATT
TAATGCTTCATTAGGCGCCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAG
ATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGGGATGATTGAGGAAAGACTTAAAACATATGCT
CACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGAT
TAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTA
TGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGATATTCAAAAAGCACAGGTGTCTGGACAAGGCCATAGTTTA
CATGAACAGATTGCTAACTTAGCTGGCAGTCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAATTGTTGATGAACT
GGTCAAAGTAATGGGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGA
AAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTT
GAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTACAAAATGGAAGAGACATGTATGTGGACCAAGAATT
AGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCATTAAAGACGATTCAATAGACAATA
AGGTACTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAAC
TATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTT
GAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTT
TGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAA
TTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTA
TCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAG
TTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAAT
ATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGA
AACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTG
TCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCT
CGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAA
GGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTG
AAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATAT
AGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCT
GCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAA
AACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATT
TTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAA
TATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAAC
GATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGAT
TTGAGTCAGCTAGGAGGTGACTGA
(一本下線:HNHドメイン、二本下線:RuvCドメイン)。
【0109】
いくつかの実施形態では、野生型Cas9は以下のヌクレオチドおよび/またはアミノ酸の
配列に対応するか、これを含む。
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGT
ACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCG
ATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGT
TACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGT
CGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAA
CGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCAT
ATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCA
GTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCG
CCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAAC
CTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAG
TAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCA
AAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCA
ATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATA
TAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACA
AGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGA
AAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGA
GGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGAC
CCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAA
GTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGT
ATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCA
TGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACA
GTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATT
TAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAG
ATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCT
CACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTAT
CAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTA
TGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTG
CACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCT
AGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGC
AAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCT
GTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGA
ACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACA
ATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAG
AACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGG
CTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGA
TACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCA
AAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGC
TTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACA
AAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCT
AACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGG
GGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACA
TAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATC
GCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGC
AAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTT
TTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAG
TATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGC
ACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAAC
AGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTC
ATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGA
AAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCA
AACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATA
GATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGA
TTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGGCTGCAGGA
(一本下線:HNHドメイン、二本下線:RuvCドメイン)
【0110】
いくつかの実施形態では、野生型Cas9はStreptococcus pyogenesのCas9(NCBI Referen
ce Sequence: NC_002737.2(ヌクレオチド配列は下記の通り)およびUniprot Reference
Sequence: Q99ZW2(アミノ酸配列は下記の通り))に対応する。
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGT
TCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTG
ACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGT
TATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGT
GGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAA
CTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCAT
ATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCA
GTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTG
CACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAAT
CTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTC
AAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTA
AGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCA
ATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTA
TAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATA
AATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGC
AAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGA
AGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTC
CATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAA
GTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGT
ACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAA
TGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACC
GTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATT
TAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAG
ATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCT
CACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGAT
TAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTA
TGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTA
CATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATT
GGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCC
AGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCT
GTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGA
ATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACA
ATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAA
AACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGG
TTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAA
TTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCT
AAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGC
GTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATA
AAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCT
AATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGG
GGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATA
TTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATT
GCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGC
TAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCT
TTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAA
TATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGC
TCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAAC
AAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTT
ATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGA
AAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTA
AACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATT
GATTTGAGTCAGCTAGGAGGTGACTGA
(一本下線:HNHドメイン、二本下線:RuvCドメイン)
【0111】
いくつかの実施形態では、Cas9はCorynebacterium ulcerans(NCBI Refs: NC_015683.1,
NC_017317.1); Corynebacterium diphtheria (NCBI Refs: NC_016782.1, NC_016786.1);
Spiroplasma syrphidicola (NCBI Ref: NC_021284.1); Prevotella intermedia (NCBI R
ef: NC_017861.1); Spiroplasma taiwanense(NCBI Ref: NC_021846.1); Streptococcus
iniae (NCBI Ref: NC_021314.1); Belliella baltica (NCBI Ref: NC_018010.1); Psychr
oflexus torquisI (NCBI Ref: NC_018721.1); Streptococcus thermophilus (NCBI Ref:
YP_820832.1), Listeria innocua (NCBI Ref: NP_472073.1), Campylobacter jejuni (NC
BI Ref: YP_002344900.1) もしくは Neisseria meningitidis (NCBI Ref: YP_002342100.
1)からのCas9、または他の生物体からのCas9を表す。
【0112】
いくつかの実施形態では、dCas9は部分的にまたは全体として、Cas9ヌクレアーゼの活
性を不活化する1つまたは複数の変異を有するCas9アミノ酸配列に対応するか、これを含
む。たとえば、いくつかの実施形態では、dCas9ドメインはD10AおよびH840Aの変異または
別のCas9における対応する変異を含む。いくつかの実施形態では、dCas9はdCas9(D10Aお
よびH840A)のアミノ酸配列
を含む(一本下線:HNHドメイン、二本下線:RuvCドメイン)。
【0113】
いくつかの実施形態では、Cas9ドメインはD10A変異を含む一方、840位の残基は、上で
提供したアミノ酸配列または本明細書で提供するアミノ酸配列のいずれかにおける対応す
る位置のヒスチジンのままである。
【0114】
他の実施形態では、D10AおよびH840A以外の変異を有するdCas9バリアントが提供され、
これはたとえばヌクレアーゼ不活化Cas9(dCas9)をもたらす。そのような変異は、例と
してD10およびH840における他のアミノ酸置換、またはCas9のヌクレアーゼドメインの中
の他の置換(たとえばHNHヌクレアーゼサブドメインおよび/またはRuvC1サブドメインに
おける置換)を含む。いくつかの実施形態では、少なくとも約70%同一、少なくとも約80%
同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも
約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一のdCas9のバリアント
またはホモログが提供される。いくつかの実施形態では、約5アミノ酸、約10アミノ酸、
約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ酸、約50アミノ
酸、約75アミノ酸、約100アミノ酸、またはそれ以上、短いまたは長いアミノ酸配列を有
するdCas9のバリアントが提供される。
【0115】
いくつかの実施形態では、本明細書で提供するCas9融合タンパク質はCas9タンパク質の
全長のアミノ酸配列、たとえば本明細書で提供するCas9配列の1つを含む。しかし他の実
施形態では、本明細書で提供する融合タンパク質は全長のCas9配列を含まず、その1つま
たは複数の断片のみを含む。好適なCas9ドメインおよびCas9断片の例示的なアミノ酸配列
を本明細書に提供する。Cas9ドメインおよび断片のさらなる好適な配列は当業者には明白
となる。
【0116】
Cas9タンパク質は、Cas9タンパク質をガイドRNAに相補的な特定のDNA配列にガイドする
ガイドRNAと会合することができる。いくつかの実施形態では、ポリヌクレオチドプログ
ラム可能なヌクレオチド結合ドメインはCas9ドメイン、たとえばヌクレアーゼ活性Cas9、
Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ不活性Cas9(dCas9)である。核酸プログ
ラム可能なDNA結合タンパク質の例には、限定なくCas9(たとえばdCas9およびnCas9)、Cas
X、CasY、Cpfl、Cas12b/C2cl、およびCas12c/C2c3が含まれる。
【0117】
ヌクレアーゼ不活化Cas9タンパク質は相互交換可能に「dCas9」タンパク質(ヌクレア
ーゼが「死んだ(dead)」Cas9の意)または触媒的に不活性のCas9と称し得る。不活性のDN
A開裂ドメインを有するCas9タンパク質(またはその断片)を産生する方法は既知である
(たとえばそれぞれの全体の内容が参照により本明細書に組み込まれるJinek et al., Sc
ience. 337:816-821(2012); Qi et al., “Repurposing CRISPR as an RNA-Guided Platf
orm for Sequence-Specific Control of Gene Expression” (2013) Cell. 28;152(5):11
73-83を参照されたい)。たとえば、Cas9のDNA開裂ドメインは2つのサブドメイン、即ちH
NHヌクレアーゼサブドメインおよびRuvC1サブドメインを含むことが知られている。HNHサ
ブドメインはgRNAに相補的な鎖を開裂し、RuvC1サブドメインは非相補的鎖を開裂する。
これらのサブドメインの中の変異はCas9のヌクレアーゼ活性を沈黙させることができる。
たとえば、変異D10AおよびH840Aは、S. pyogenesのCas9のヌクレアーゼ活性を完全に不活
化する(Jinek et al., Science. 337:816-821(2012); Qi et al., Cell. 28;152(5):1173
-83 (2013))。
【0118】
いくつかの実施形態では、Cas9ドメインはCas9ニッカーゼである。Cas9ニッカーゼは二
本鎖核酸分子(たとえば二本鎖DNA分子)の1つの鎖のみを開裂することができるCas9タン
パク質であってよい。いくつかの実施形態では、Cas9ニッカーゼは二本鎖を形成した核酸
分子の標的の鎖を開裂し、これはCas9ニッカーゼがCas9に結合したgRNA(たとえばsgRNA
)と塩基対を形成した(これと相補的な)鎖を開裂することを意味する。いくつかの実施
形態では、Cas9ニッカーゼはD10A変異を含み、840位にヒスチジンを有する。いくつかの
実施形態では、Cas9ニッカーゼは二本鎖を形成した核酸分子の標的でなく塩基編集されな
い鎖を開裂し、これはCas9ニッカーゼがCas9に結合したgRNA(たとえばsgRNA)と塩基対
を形成していない鎖を開裂することを意味する。いくつかの実施形態では、Cas9ニッカー
ゼはH840A変異を含み、10位にアスパラギン酸残基、または対応する変異を有する。いく
つかの実施形態では、Cas9ニッカーゼは、本明細書で提供するCas9ニッカーゼのいずれか
1つに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくと
も80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%
、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列
を含む。さらなる好適なCas9ニッカーゼは、本開示および当分野における知識に基づいて
当業者には明白となり、本開示の範囲内である。
【0119】
いくつかの実施形態では、Cas9ドメインはヌクレアーゼ不活性Cas9ドメイン(dCas9)
である。たとえば、dCas9ドメインは二本鎖を形成した核酸分子のいずれの鎖をも開裂す
ることなく、二本鎖を形成した核酸分子に(たとえばgRNA分子を介して)結合し得る。い
くつかの実施形態では、ヌクレアーゼ不活性dCas9ドメインは本明細書で説明するアミノ
酸配列のD10X変異およびH840X変異、または本明細書で提供するアミノ酸配列のいずれか
における対応する変異を含み、ここでXは任意のアミノ酸の変更である。いくつかの実施
形態では、ヌクレアーゼ不活性dCas9ドメインは本明細書で説明するアミノ酸配列のD10A
変異およびH840A変異、または本明細書で提供するアミノ酸配列のいずれかにおける対応
する変異を含む。一例として、ヌクレアーゼ不活性Cas9ドメインはクローニングベクター
pPlatTET-gRNA2(Accession No. BAV54124)で提供されるアミノ酸配列を含む:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRIC
YLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAH
MIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSAS
MIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVT
VKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYA
HLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSL
HEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMK
NYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS
KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYS
NIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLI
ARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRV
ILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRI
DLSQLGGD
(例えば、その全体の内容が参照により本明細書に組み込まれるQi et al., “Repurposi
ng CRISPR as an RNA-guided platform for sequence-specific control of gene expres
sion.” Cell. 2013; 152(5):1173-83)を参照されたい)。
【0120】
さらなるCas9タンパク質(たとえばヌクレアーゼデッドCas9(dCas9)、Cas9ニッカー
ゼ(nCas9)、またはヌクレアーゼ活性Cas9)は、それらのバリアントおよびホモログを
含んで本開示の範囲内であることを認識されたい。例示的なCas9タンパク質には限定なく
以下に提供するものが含まれる。いくつかの実施形態では、Cas9タンパク質はヌクレアー
ゼデッドCas9(dCas9)である。いくつかの実施形態では、Cas9タンパク質はCas9ニッカ
ーゼ(nCas9)である。いくつかの実施形態では、Cas9タンパク質はヌクレアーゼ活性Cas
9である。
【0121】
例示的な触媒不活性Cas9(dCas9):
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRIC
YLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAH
MIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSAS
MIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVT
VKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYA
HLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSL
HEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMK
NYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS
KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYS
NIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLI
ARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRV
ILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRI
DLSQLGGD
【0122】
例示的な触媒的Cas9ニッカーゼ(nCas9):
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRIC
YLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAH
MIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSAS
MIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVT
VKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYA
HLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSL
HEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMK
NYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS
KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYS
NIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLI
ARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRV
ILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRI
DLSQLGGD
【0123】
例示的な触媒活性Cas9:
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRIC
YLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAH
MIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSAS
MIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVT
VKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYA
HLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSL
HEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMK
NYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS
KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYS
NIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLI
ARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRV
ILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRI
DLSQLGGD.
【0124】
いくつかの実施形態では、Cas9は古細菌(たとえばナノ古細菌)からのCas9を意味し、
古細菌は単細胞の原核微生物のドメインおよび界を構成する。いくつかの実施形態では、
核酸プログラム可能なDNA結合タンパク質は、たとえばその全体の内容が参照により本明
細書に組み込まれるBurstein et al., "New CRISPR-Cas systems from uncultivated mic
robes." Cell Res. 2017 Feb 21. doi: 10.1038/cr.2017.21に記載されているCasXまたは
CasYを意味する。ゲノムに決定されるメタゲノミクスを用いて、生物界の古細菌ドメイン
において最初に報告されたCas9を含むいくつかのCRISPR-Casシステムが同定された。この
多様なCas9タンパク質は、あまり研究されていないナノ古細菌において活性なCRISPR-Cas
システムの部分として見出された。細菌では、以前は未知であった2つのシステム、CRISP
R-CasXおよびCRISPR-CasYが発見された。これらはこれまでに発見された最もコンパクト
なシステムに含まれる。いくつかの実施形態では、本明細書に記載した塩基編集システム
において、Cas9はCasX、またはCasXのバリアントで置き換えられる。いくつかの実施形態
では、本明細書に記載した塩基編集システムにおいて、Cas9はCasY、またはCasYのバリア
ントで置き換えられる。RNAでガイドされる他のDNA結合タンパク質も核酸プログラム可能
なDNA結合タンパク質(napDNAbp)として用いることができ、本開示の範囲内であること
を認識されたい。
【0125】
いくつかの実施形態では、本明細書で提供する融合タンパク質のいずれかの核酸プログ
ラム可能なDNA結合タンパク質(napDNAbp)はCasXまたはCasYタンパク質であってよい。
いくつかの実施形態では、napDNAbpはCasXタンパク質である。いくつかの実施形態では、
napDNAbpはCasYタンパク質である。いくつかの実施形態では、napDNAbpは、天然産生のCa
sXまたはCasYタンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少な
くとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくと
も97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸
配列を含む。いくつかの実施形態では、napDNAbpは天然産生のCasXまたはCasYタンパク質
である。いくつかの実施形態では、napDNAbpは本明細書に記載した任意のCasXまたはCasY
タンパク質と少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくと
も93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%
、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。他の細菌
種からのCasXおよびCasYも本開示に従って用い得ることを認識されたい。
【0126】
CasX (uniprot.org/uniprot/F0NN87; uniprot.org/uniprot/F0NH53) tr|F0NN87|F0NN87_S
ULIH CRISPR-associated Casx protein OS = Sulfolobus islandicus (strain HVE10/4)
GN = SiH_0402 PE=4 SV=1
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIIL
PLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYEFGRSPGMVERTRRVKLEVEPHYLIIAA
AGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVRIYTISDAV
GQNPTTINGGFSIDLTKLLEKRYLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTG SKRLEDLLYFANRDLIMNL
NSDDGKVRDLKLISAYVNGELIRGEG
【0127】
>tr|F0NH53|F0NH53_SULIR CRISPR associated protein, Casx OS = Sulfolobus islandic
us(strain REY15A) GN=SiRe_0771 PE=4 SV=1
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIIL
PLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYKFGRSPGMVERTRRVKLEVEPHYLIMAA
AGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVSIYTISDAV
GQNPTTINGGFSIDLTKLLEKRDLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTGSKRLEDLLYFANRDLIMNLN
SDDGKVRDLKLISAYVNGELIRGEG
Deltaproteobacteria CasX
MEKRINKIRKKLSADNATKPVSRSGPMKTLLVRVMTDDLKKRLEKRRKKPEVMPQVISNNAANNLRMLLDDYTKMKEAIL
QVYWQEFKDDHVGLMCKFAQPASKKIDQNKLKPEMDEKGNLTTAGFACSQCGQPLFVYKLEQVSEKGKAYTNYFGRCNVA
EHEKLILLAQLKPVKDSDEAVTYSLGKFGQRALDFYSIHVTKESTHPVKPLAQIAGNRYASGPVGKALSDACMGTIASFL
SKYQDIIIEHQKVVKGNQKRLESLRELAGKENLEYPSVTLPPQPHTKEGVDfAYNEVIARVRMWVNLNLWQKLKLSRDDA
KPLLRLKGFPSFPVVERRENEVDWWNTINEVKKLIDAKRDMGRVFWSGVTAEKRNTILEGYNYLPNENDHKKREGSLENP
KKPAKRQFGDLLLYLEKKYAGDWGKVFDEAWERIDKKIAGLTSHIEREEARNAEDAQSKAVLTDWLRAKASFVLERLKEM
DEKEFYACEIQLQKWYGDLRGNPFAVEAENRVVDISGFSIGSDGHSIQYRNLLAWKYLENGKREFYLLMNYGKKGRIRFT
DGTDIKKSGKWQGLLYGGGKAKVIDLTFDPDDEQLIILPLAFGTRQGREFIWNDLLSLETGLIKLANGRVIEKTIYNKKI
GRDEPALFVALTFERREVVDPSNIKPVNLIGVARGENIPAVIALTDPEGCPLPEFKDSSGGPTDILRIGEGYKEKQRAIQ
AAKEVEQRRAGGYSRKFASKSRNLADDMVRNSARDLFYHAVTHDAVLVFANLSRGFGRQGKRTFMTERQYTKMEDWLTAK
LAYEGLTSKTYLSKTLAQYTSKTCSNCGFTITYADMDVMLVRLKKTSDGWATTLNNKELKAEYQITYYNRYKRQTVEKEL
SAELDRLSEESGNNDISKWTKGRRDEALFLLKKRFSHRPVQEQFVCLDCGHEVHAAEQAALNIARSWLFLNSNSTEFKSY
KSGKQPFVGAWQAFYKRRLKEVWKPNA
【0128】
CasY (ncbi.nlm.nih.gov/protein/APG80656.1)
>APG80656.1 CRISPR-associated protein CasY [uncultured Parcubacteria group bacte
rium]
MSKRHPRISGVKGYRLHAQRLEYTGKSGAMRTIKYPLYSSPSGGRTVPREIVSAINDDYVGLYGLSNFDDLYNAEKRNEE
KVYSVLDFWYDCVQYGAVFSYTAPGLLKNVAEVRGGSYELTKTLKGSHLYDELQIDKVIKFLNKKEISRANGSLDKLKKD
IIDCFKAEYRERHKDQCNKLADDIKNAKKDAGASLGERQKKLFRDFFGISEQSENDKPSFTNPLNLTCCLLPFDTVNNNR
NRGEVLFNKLKEYAQKLDKNEGSLEMWEYIGIGNSGTAFSNFLGEGFLGRLRENKITELKKAMMDITDAWRGQEQEEELE
KRLRILAALTIKLREPKFDNHWGGYRSDINGKLSSWLQNYINQTVKIKEDLKGHKKDLKKAKEMINRFGESDTKEEAVVS
SLLESIEKIVPDDSADDEKPDIPAIAIYRRFLSDGRLTLNRFVQREDVQEALIKERLEAEKKKKPKKRKKKSDAEDEKET
IDFKELFPHLAKPLKLVPNFYGDSKRELYKKYKNAAIYTDALWKAVEKIYKSAFSSSLKNSFFDTDFDKDFFIKRLQKIF
SVYRRFNTDKWKPIVKNSFAPYCDIVSLAENEVLYKPKQSRSRKSAAIDKNRVRLPSTENIAKAGIALARELSVAGFDWK
DLLKKEEHEEYIDLIELHKTALALLLAVTETQLDISALDFVENGTVKDFMKTRDGNLVLEGRFLEMFSQSIVFSELRGLA
GLMSRKEFITRSAIQTMNGKQAELLYIPHEFQSAKITTPKEMSRAFLDLAPAEFATSLEPESLSEKSLLKLKQMRYYPHY
FGYELTRTGQGIDGGVAENALRLEKSPVKKREIKCKQYKTLGRGQNKIVLYVRSSYYQTQFLEWFLHRPKNVQTDVAVSG
SFLIDEKKVKTRWNYDALTVALEPVSGSERVFVSQPFTIFPEKSAEEEGQRYLGIDIGEYGIAYTALEITGDSAKILDQN
FISDPQLKTLREEVKGLKLDQRRGTFAMPSTKIARIRESLVHSLRNRIHHLALKHKAKIVYELEVSRFEEGKQKIKKVYA
TLKKADVYSEIDADKNLQTTVWGKLAVASEISASYTSQFCGACKKLWRAEMQVDETITTQELIGTVRVIKGGTLIDAIKD
FMRPPIFDENDTPFPKYRDFCDKHHISKKMRGNSCLFICPFCRANADADIQASQTIALLRYVKEEKKVEDYFERFRKLKN
IKVLGQMKKI
【0129】
ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインには、RNAに結合する核
酸プログラム可能なタンパク質も含まれることを認識されたい。たとえば、ポリヌクレオ
チドプログラム可能なヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能な
ヌクレオチド結合ドメインをRNAへとガイドする核酸と会合することができる。他の核酸
プログラム可能なDNA結合タンパク質も、本開示には具体的に列挙しないが本開示の範囲
内である。
本明細書で用いることができるCasタンパク質にはクラス1およびクラス2が含まれる。C
asタンパク質の非限定的な例には、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5
t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas9 (Csn1またはCsx12としても知られる)、Cas10
、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1
、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、
Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csf1、Csf2、CsO
、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、Cas12a
/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およ
びCas12i、CARF、DinG、それらのホモログ、またはそれらの修飾されたバージョンが含ま
れる。未修飾のCRISPR酵素は、たとえば2つの機能性エンドヌクレアーゼドメインであるR
uvCおよびHNHを有するCas9のように、DNA開裂活性を有し得る。CRISPR酵素は、標的配列
の中、および/または標的配列の相補体の中のような標的配列における1つまたは両方の鎖
の開裂を指令することができる。たとえば、CRISPR酵素は標的配列の最初または最後のヌ
クレオチドから約1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500、ま
たはそれよりの塩基対以内にある1つまたは両方の鎖の開裂を指令することができる。
【0130】
対応する野生型酵素との関係で変異されており、それにより、変異したCRISPR酵素が、
標的配列を含む標的ポリヌクレオチドの1つまたは両方の鎖を開裂する能力を欠くCRISPR
酵素をコードするベクターを用いることができる。Cas9は、野生型の例示的なCas9ポリペ
プチド(たとえばS. pyogenesのCas9)に対して少なくとも(約)50%、60%、70%、80%、9
0%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性および/ま
たは配列ホモロジーを有するポリペプチドを意味し得る。Cas9は、野生型の例示的なCas9
ポリペプチド(たとえばS.pyogenesのCas9)と多くとも(約)50%、60%、70%、80%、90%
、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性および/また
は配列ホモロジーを有するポリペプチドを意味し得る。Cas9は野生型または欠失、挿入、
置換、バリアント、変異、融合、キメラ、またはそれらの任意の組合せ等のアミノ酸の変
化を含んでもよいCas9タンパク質の修飾された形態を意味し得る。
【0131】
いくつかの実施形態では、本明細書に記載した方法は操作されたCasタンパク質を利用
することができる。ガイドRNA(gRNA)は、Casの結合に必要なスカフォールド配列と、修
飾すべきゲノム標的を定義する使用者によって定義される約20ヌクレオチドのスペーサー
とを含む短い合成RNAである。したがって、当業者であればCasタンパク質のゲノム標的を
変更することができる。特異性は、部分的には、gRNA標的配列が、ゲノムの他の部分と比
較してそのゲノム標的についていかに特異的であるかによって決定される。
【0132】
Cas9ヌクレアーゼは2つの機能性エンドヌクレアーゼドメイン、即ちRuvCおよびHNHを有
する。Cas9は、標的との結合に際して、標的DNAの反対の鎖を開裂するようにヌクレアー
ゼドメインを位置づける第2のコンフォメーション変化を受ける。Cas9媒介DNA開裂の最終
結果は、標的DNAの中の二本鎖の切断(DSB)(PAM配列の約3~4ヌクレオチド上流)であ
る。得られるDSBは次に2つの一般的修復経路:(1)効率的であるがエラーが起こりやすい
非相同末端接合(NHEJ)経路、または(2)低効率であるが忠実性が高い相同性誘導型修
復(HDR)経路のうちの1つによって修復される。
【0133】
非相同末端接合(NHEJ)および/または相同性誘導型修復(HDR)の「効率」は、任意の
便利な方法によって計算することができる。たとえば、いくつかの場合には、効率は成功
したHDRの百分率として表すことができる。たとえば、サーベイヤーヌクレアーゼアッセ
イを用いて開裂生成物を産生することができ、生成物と基質の比を用いて百分率を計算す
ることができる。たとえば、成功したHDRの結果として新たに組み入れられた制限配列を
含むDNAを直接開裂するサーベイヤーヌクレアーゼ酵素を用いることができる。より多い
開裂された基質はより大きなHDRの百分率(より大きなHDRの効率)を示す。説明的な例と
して、HDRの分率(百分率)は、以下の式:[(開裂生成物)/(基質+開裂生成物)](たと
えば、(b+c)/(a+b+c)、ここで「a」はDNA基質のバンド強度、「b」および「c」は開裂生
成物のバンド強度である)を用いて計算することができる。
【0134】
いくつかの場合には、効率は成功したNHEJの百分率として表すことができる。たとえば
、T7エンドヌクレアーゼIアッセイを用いて開裂生成物を産生することができ、生成物と
基質の比を用いてNHEJの百分率を計算することができる。T7エンドヌクレアーゼIは野生
型と変異型のDNA鎖のハイブリダイゼーションから生じるミスマッチしたヘテロ二本鎖DNA
を開裂する(NHEJはもとの破断部位において小さなランダムな挿入または欠失(インデル
)を産生する)。より多い開裂はより大きなNHEJの百分率(より大きなNHEJの効率)を示
す。説明的な例として、NHEJの分率(百分率)は、以下の式:(1-(1-(b+c)/(a+b+c))1/2)
×100を用いて計算することができる。ここで「a」はDNA基質のバンド強度、「b」および
「c」は開裂生成物のバンド強度である(Ran et. al., Cell. 2013 Sep. 12; 154(6):1380
-9; and Ran et al., Nat Protoc. 2013 Nov.; 8(11): 2281-2308)。
【0135】
NHEJ修復経路は最も活性な修復機構であり、これはしばしばDSB部位において小さなヌ
クレオチドの挿入または欠失(インデル)を引き起こす。NHEJ媒介DSB修復のランダム性
は重要な実用的影響を有する。それは、Cas9およびgRNAまたはガイドポリヌクレオチドを
発現する細胞の集団は、多様な変異をもたらし得るからである。大部分の場合には、NHEJ
は標的DNAの中でアミノ酸の欠失、挿入、またはフレームシフト変異をもたらす小さなイ
ンデルを生じ、これが標的遺伝子のオープンリーディングフレーム(ORF)の中の早すぎ
る停止コドンをもたらす。理想的な最終結果は、標的遺伝子の中の機能喪失変異である。
【0136】
NHEJ媒介DSB修復は遺伝子のオープンリーディングフレームをしばしば崩壊させる一方
、相同性誘導型修復(HDR)を用れば、単一のヌクレオチドの変更からフルオロフォアま
たはタグの付加のような大きな挿入までの範囲の特定のヌクレオチドの変更を生じること
ができる。
【0137】
遺伝子編集にHDRを利用するために、所望の配列を含むDNA修復テンプレートをgRNAおよ
びCas9またはCas9ニッカーゼとともに目的の細胞型に送達することができる。修復テンプ
レートは、所望の編集と、標的の直接上流または下流のさらなる相同的配列(左および右
のホモロジーアームと名付ける)とを含み得る。それぞれのホモロジーアームの長さは導
入する変更の大きさに依存し得、大きな挿入は大きなホモロジーアームを必要とする。修
復テンプレートは一本鎖オリゴヌクレオチド、二本鎖オリゴヌクレオチド、または二本鎖
DNAプラスミドであり得る。HDRの効率は、Cas9、gRNA、および外因性修復テンプレートを
発現する細胞においても一般に低い(10%未満の改変アリル)。HDRは細胞サイクルのS期
およびG2期の間に起こるので、HDRの効率は細胞を同期化することによって向上させ得る
。NHEJに関与する遺伝子を化学的または遺伝学的に阻害することも、HDRの頻度を増大さ
せ得る。
【0138】
いくつかの実施形態では、Cas9は改変されたCas9である。所与のgRNA標的配列は、部分
的なホモロジーが存在するさらなる部位をゲノム全体に有し得る。これらの部位はオフタ
ーゲットと呼ばれ、gRNAを設計する際には考慮する必要がある。gRNAの設計の最適化に加
えて、Cas9の改変によってCRISPRの特異性を増大させることもできる。Cas9は2つのヌク
レアーゼドメイン、即ちRuvCおよびHNHの活性を組み合わせることによって、二本鎖の切
断(DSB)を生じる。Cas9ニッカーゼはSpCas9のD10A変異体であり、1つのヌクレアーゼド
メインを保持していて、DSBよりはDNAニックを生じる。特定の遺伝子編集のために、ニッ
カーゼシステムをHDR媒介遺伝子編集と組み合わせることもできる。
【0139】
いくつかの場合には、Cas9はバリアントCas9タンパク質である。バリアントCas9ポリペ
プチドは、野生型Cas9タンパク質のアミノ酸配列と比較すると1アミノ酸単位で異なるア
ミノ酸配列を有している(たとえば欠失、挿入、置換、融合を有している)。いくつかの
事例では、バリアントCas9ポリペプチドはCas9ポリペプチドのヌクレアーゼ活性を低減さ
せるアミノ酸の変化(たとえば欠失、挿入、または置換)を有している。たとえば、いく
つかの事例では、バリアントCas9ポリペプチドは対応する野生型Cas9タンパク質の50%未
満、40%未満、30%未満、20%未満、10%未満、5%未満、または1%未満のヌクレアーゼ活性を
有している。いくつかの場合には、バリアントCas9タンパク質は実質的なヌクレアーゼ活
性を有しない。対象のCas9タンパク質が実質的なヌクレアーゼ活性を有しないバリアント
Cas9タンパク質である場合には、これは「dCas9」と称し得る。
【0140】
いくつかの場合には、バリアントCas9タンパク質は低減したヌクレアーゼ活性を有する
。たとえば、バリアントCas9タンパク質は野生型Cas9タンパク質、たとえば野生型Cas9タ
ンパク質の約20%未満、約15%未満、約10%未満、約5%未満、約1%未満、または約0.1%未満
のヌクレアーゼ活性を呈する。
【0141】
いくつかの場合には、バリアントCas9タンパク質はガイド標的配列の相補的鎖を開裂す
ることができるが、二本鎖ガイド標的配列の非相補的鎖を開裂する能力は低い。たとえば
、バリアントCas9タンパク質はRuvCドメインの機能を低減する変異(アミノ酸置換)を有
し得る。非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質はD1
0A(10位のアミノ酸におけるアスパラギン酸からアラニン)を有し、したがって二本鎖ガ
イド標的配列の相補的鎖を開裂することができるが、二本鎖ガイド標的配列の非相補的鎖
を開裂する能力は低い(したがってバリアントCas9タンパク質が二本鎖標的核酸を開裂す
る際には、二本鎖の切断(DSB)の代わりに一本鎖の切断(SSB)がもたらされる(たとえ
ばJinek et al., Science. 2012 Aug. 17; 337(6096):816-21を参照されたい)。
【0142】
いくつかの場合には、バリアントCas9タンパク質は二本鎖ガイド標的配列の非相補的鎖
を開裂することができるが、ガイド標的配列の相補的鎖を開裂する能力は低い。たとえば
、バリアントCas9タンパク質はHNHドメインの機能を低減する変異(アミノ酸の置換)を
有し得る(RuvC/HNH/RuvCドメインモチーフ)。非限定的な例として、いくつかの実施形
態では、バリアントCas9タンパク質はH840A(840位のアミノ酸におけるヒスチジンからア
ラニン)の変異を有し、したがってガイド標的配列の非相補的鎖を開裂することができる
が、ガイド標的配列の相補的鎖を開裂する能力は低い(したがってバリアントCas9タンパ
ク質が二本鎖ガイド標的配列を開裂する際には、DSBの代わりにSSBがもたらされる)。そ
のようなCas9タンパク質はガイド標的配列(たとえば一本鎖ガイド標的配列)を開裂する
能力は低いが、ガイド標的配列(たとえば一本鎖ガイド標的配列)に結合する能力を保持
している。
【0143】
いくつかの場合には、バリアントCas9タンパク質は二本鎖標的DNAの相補的および非相
補的な鎖の両方を開裂する能力が低い。非限定的な例として、いくつかの場合には、バリ
アントCas9タンパク質はD10AとH840Aの両方の変異を有しており、したがってポリペプチ
ドは二本鎖標的DNAの相補的および非相補的な鎖の両方を開裂する能力が低い。そのよう
なCas9タンパク質は標的DNA(たとえば一本鎖標的DNA)を開裂する能力が低いが、標的DN
A(たとえば一本鎖標的DNA)と結合する能力を保持している。
【0144】
別の非限定的な例として、いくつかの場合には、バリアントCas9タンパク質はW476AとW
1126Aの変異を有しており、したがってポリペプチドは標的DNAを開裂する能力が低い。そ
のようなCas9タンパク質は標的DNA(たとえば一本鎖標的DNA)を開裂する能力が低いが、
標的DNA(たとえば一本鎖標的DNA)と結合する能力を保持している。
【0145】
別の非限定的な例として、いくつかの場合には、バリアントCas9タンパク質はP475A、W
476A、N477A、D1125A、W1126A、およびD1127Aの変異を有しており、したがってポリペプ
チドは標的DNAを開裂する能力が低い。そのようなCas9タンパク質は標的DNA(たとえば一
本鎖標的DNA)を開裂する能力が低いが、標的DNA(たとえば一本鎖標的DNA)と結合する
能力を保持している。
【0146】
別の非限定的な例として、いくつかの場合には、バリアントCas9タンパク質はH840A、W
476A、およびW1126Aの変異を有しており、したがってポリペプチドは標的DNAを開裂する
能力が低い。そのようなCas9タンパク質は標的DNA(たとえば一本鎖標的DNA)を開裂する
能力が低いが、標的DNA(たとえば一本鎖標的DNA)と結合する能力を保持している。別の
非限定的な例として、いくつかの場合には、バリアントCas9タンパク質はH840A、D10A、W
476A、およびW1126Aの変異を有しており、したがってポリペプチドは標的DNAを開裂する
能力が低い。そのようなCas9タンパク質は標的DNA(たとえば一本鎖標的DNA)を開裂する
能力が低いが、標的DNA(たとえば一本鎖標的DNA)と結合する能力を保持している。いく
つかの実施形態では、バリアントCas9はCas9のHNHドメインの840位に触媒性のHis残基を
復元している(A840H)。
【0147】
別の非限定的な例として、いくつかの場合には、バリアントCas9タンパク質はH840A、P
475A、W476A、N477A、D1125A、W1126A、およびD1127Aの変異を有しており、したがってポ
リペプチドは標的DNAを開裂させる能力が低い。そのようなCas9タンパク質は標的DNA(た
とえば一本鎖標的DNA)を開裂する能力が低いが、標的DNA(たとえば一本鎖標的DNA)と
結合する能力を保持している。別の非限定的な例として、いくつかの場合には、バリアン
トCas9タンパク質はD10A、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1127A
の変異を有しており、したがってポリペプチドは標的DNAを開裂させる能力が低い。その
ようなCas9タンパク質は標的DNA(たとえば一本鎖標的DNA)を開裂させる能力が低いが、
標的DNA(たとえば一本鎖標的DNA)と結合する能力を保持している。いくつかの場合には
、バリアントCas9タンパク質がW476AおよびW1126Aの変異を有している場合、またはバリ
アントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、およびD1127Aの変異を
有している場合には、バリアントCas9タンパク質は効率的にはPAM配列と結合しない。し
たがって、そのようないくつかの場合には、結合の方法においてそのようなバリアントCa
s9タンパク質を用いる際には、この方法はPAM配列を必要としない。換言すれば、いくつ
かの場合には、結合の方法においてそのようなバリアントCas9タンパク質を用いる際には
、この方法はガイドRNAを含ませることができるが、この方法はPAM配列の非存在下で実施
することができる(したがって結合の特異性はガイドRNAの標的セグメントによって提供
される)。上述の効果を達成するために他の残基(即ち不活性残基または他のヌクレアー
ゼ部分)を変異させることができる。非限定的な例として、残基D10、G12、G17、E762、H
840、N854、N863、H982、H983、A984、D986、および/またはA987を改変(即ち置換)する
ことができる。また、アラニン置換以外の変異が好適である。
【0148】
いくつかの実施形態では、低減した触媒活性を有するバリアントCas9タンパク質(たと
えばCas9タンパク質がD10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D98
6、および/またはA987の変異、たとえばD10A、G12A、G17A、E762A、H840A、N854A、N863A
、H982A、H983A、A984A、および/またはD986Aを有する場合)は、これがガイドRNAと相互
作用する能力を保持している限り、(これはガイドRNAによって標的DNA配列にガイドされ
るので)それでも部位特異的に標的DNAと結合することができる。
【0149】
S. pyogenesのCas9の代替物には、哺乳類細胞の中で開裂活性を呈するCpf1ファミリー
のRNAガイドエンドヌクレアーゼが含まれる。PrevotellaおよびFrancisella 1からのCRIS
PR(CRISPR/Cpf1)は、CRISPR/Cas9システムと類似のDNA編集技術である。Cpf1はクラスI
I CRISPR/CasシステムのRNAガイドエンドヌクレアーゼである。この獲得免疫機構はPrevo
tellaおよびFrancisella細菌において見出される。Cpf1遺伝子はCRISPR遺伝子座に関連し
ており、ウイルスDNAを発見して開裂するガイドRNAを用いるエンドヌクレアーゼをコード
している。Cpf1はCas9よりも小さく単純なエンドヌクレアーゼであり、CRISPR/Cas9シス
テムの限界のいくつかを克服している。Cas9ヌクレアーゼと異なり、Cpf1媒介DNA開裂の
結果は、短い3'オーバーハングを有する二本鎖切断である。Cpf1の開裂パターンがジグザ
グ状であることによって、従来の制限酵素によるクローニングと同様の方向性を持った遺
伝子移し替えの可能性を広げることができ、それにより遺伝子編集の効率を増大させるこ
とができる。上述したCas9のバリアントおよびオーソログと同様に、Cpf1は、SpCas9にと
っては好ましいNGG PAM部位を欠く、ATリッチ領域またはATリッチゲノムに、CRISPRによ
って標的とされ得る部位の数を拡大することができる。Cpf1遺伝子座は、混合α/βドメ
イン、ヘリカル領域が続くRuvC-I、RuvC-II、およびジンクフィンガー様ドメインを含む
。Cpf1タンパク質はCas9のRuvCドメインと同様のRuvC様エンドヌクレアーゼドメインを有
する。さらに、Cpf1はHNHエンドヌクレアーゼドメインを有さず、Cpf1のN末端はCas9のα
ヘリカル認識ローブを有しない。Cpf1のCRISPR-Casドメインの構築は、Cpf1が機能的にユ
ニークであり、クラス2、V型のCRISPRシステムと分類されることを示している。Cpf1遺伝
子座はII型のシステムよりもI型およびIII型に近いCas1、Cas2、およびCas4タンパク質を
コードしている。機能性Cpf1はトランス活性化CRISPR RNA(tracrRNA)を必要とせず、し
たがってCRISPR(crRNA)のみを必要とする。Cpf1はCas9より小さいだけでなく、より小
さいsgRNA分子(Cas9のほぼ半数のヌクレオチド)を有しているので、これはゲノム編集
に有利である。Cpf1-crRNA複合体は、Cas9の標的であるGリッチPAMとは対照的にプロトス
ペーサー隣接モチーフ5'-YTN-3'を同定することによって標的のDNAまたはRNAを開裂する
。PAMの同定の後、Cpf1は、4~5個のヌクレオチドオーバーハングを有する粘着性末端様
のDNA二本鎖切断を導入する。
【0150】
本開示のいくつかの態様は、核酸プログラム可能なDNA結合タンパク質として作用する
ドメインを含む融合タンパク質を提供し、これは塩基エディター等のタンパク質を特定の
核酸(たとえばDNAまたはRNA)配列へとガイドするために用いることができる。特定の実
施形態では、融合タンパク質は、核酸プログラム可能なDNA結合タンパク質ドメインおよ
びデアミナーゼドメインを含む。DNA結合タンパク質は、限定なくCas9(たとえばdCas9お
よびnCas9)、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Ca
s12g、Cas12h、およびCas12iを含む。Cas9とは異なるPAM特異性を有するプログラム可能
なポリヌクレオチド結合タンパク質の1つの例は、ProvotellaおよびFrancisella 1からの
Clustered Regularly Interspaced Short Palindromic Repeats(Cpf1)である。Cas9と
同様に、Cpf1もクラス2のCRISPRエフェクターである。Cpf1はCas9とは区別できる特徴を
有して堅固なDNA干渉を媒介することが示されている。Cpf1はtracrRNAを欠く単一のRNAガ
イドエンドヌクレアーゼであり、これはTリッチなプロトスペーサー隣接モチーフ(TTN、
TTTN、またはYTN)を利用する。さらに、Cpf1はジグザグのDNA二本鎖切断を介してDNAを
開裂する。16個のCpf1ファミリータンパク質の中で、AcidaminococcusおよびLachnospira
ceaeからの2つの酵素がヒト細胞において効率的なゲノム編集活性を有することが示され
ている。Cpf1タンパク質は当技術で既知であり、たとえばその全体の内容が参照により本
明細書に組み込まれるYamano et al., “Crystal structure of Cpf1 in complex with g
uide RNA and target DNA.” Cell (165) 2016, p. 949-962に以前に記載されている。
【0151】
本発明の組成物および方法においてはヌクレアーゼ不活性Cpf1(dCpf1)バリアントも
有用であり、これはガイドヌクレオチド配列-プログラム可能なポリヌクレオチド-結合タ
ンパク質ドメインとして用いることができる。Cpf1タンパク質はCas9のRuvCドメインと同
様のRuvC様エンドヌクレアーゼドメインを有するが、HNHエンドヌクレアーゼドメインを
有さず、Cpf1のN末端はCas9のαヘリカル認識ローブを有しない。Zetsche et al., Cell,
163, 759-771, 2015(これは参照により本明細書に組み込まれる)において、Cpf1のRuv
C様ドメインは両方のDNA鎖の開裂に関与しており、RuvC様ドメインの不活化はCpf1のヌク
レアーゼ活性を不活化することが示された。たとえば、Francisella novicidaのCpf1にお
けるD917A、E1006A、またはD1255Aに対応する変異はCpf1のヌクレアーゼ活性を不活化す
る。いくつかの実施形態では、本開示のdCpf1はD917A、E1006A、D1255A、D917A/E1006A、
D917A/D1255A、E1006A/D1255A、またはD917A/E1006A/D1255Aに対応する変異を含む。任意
の変異、たとえばCpf1のRuvCドメインを不活化する置換変異、欠失、または挿入が本開示
に従って用いられ得ることを理解されたい。
【0152】
いくつかの実施形態では、本明細書で提供する融合タンパク質のいずれかの核酸プログ
ラム可能なヌクレオチド結合タンパク質はCpf1タンパク質であってよい。いくつかの実施
形態では、Cpf1タンパク質はCpf1ニッカーゼ(nCpf1)である。いくつかの実施形態では
、Cpf1タンパク質はヌクレアーゼ不活性Cpf1(dCpf1)である。いくつかの実施形態では
、Cpf1、nCpf1、またはdCpf1は、本明細書に開示したCpf1配列に対して少なくとも85%、
少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少な
くとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少
なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、dCpf1は、
本明細書に開示したCpf1配列に対して少なくとも85%、少なくとも90%、少なくとも91%、
少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少な
くとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミ
ノ酸配列を含み、D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A
またはD917A/E1006A/D1255Aに対応する変異を含む。他の細菌種からのCpf1も本開示に従
って用いられ得ることを認識されたい。
【0153】
野生型Francisella novicidaのCpf1(D917、E1006、およびD1255は太字で下線を付して
いる)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYS
DVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDIT
DIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAE
ELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYK
MSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLT
DLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILA
NFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEH
FYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKI
FDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKF
IDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGR
PNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFF
HCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAI
EKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVF
KDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLD
KGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESD
KKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGK
KLNLVIKNEEYFEFVQNRNN
【0154】
Francisella novicidaのCpf1 D917A(A917、E1006、およびD1255は太字で下線を付して
いる)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYS
DVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDIT
DIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAE
ELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYK
MSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLT
DLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILA
NFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEH
FYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKI
FDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKF
IDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGR
PNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFF
HCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAI
EKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVF
KDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLD
KGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESD
KKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGK
KLNLVIKNEEYFEFVQNRNN
【0155】
Francisella novicidaのCpf1 E1006A(D917、A1006、およびD1255は太字で下線を付し
ている)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYS
DVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDIT
DIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAE
ELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYK
MSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLT
DLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILA
NFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEH
FYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKI
FDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKF
IDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGR
PNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFF
HCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAI
EKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVF
KDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLD
KGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESD
KKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGK
KLNLVIKNEEYFEFVQNRNN
【0156】
Francisella novicidaのCpf1 D1255A(D917、E1006、およびA1255は太字で下線を付し
ている)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYS
DVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDIT
DIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAE
ELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYK
MSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLT
DLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILA
NFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEH
FYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKI
FDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKF
IDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGR
PNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFF
HCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAI
EKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVF
KDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLD
KGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESD
KKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGK
KLNLVIKNEEYFEFVQNRNN
【0157】
Francisella novicidaのCpf1 D917A/E1006A(A917、A1006、およびD1255は太字で下線
を付している)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYS
DVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDIT
DIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAE
ELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYK
MSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLT
DLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILA
NFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEH
FYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKI
FDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKF
IDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGR
PNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFF
HCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAI
EKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVF
KDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLD
KGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESD
KKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGK
KLNLVIKNEEYFEFVQNRNN
【0158】
Francisella novicidaのCpf1 D917A/D1255A(A917、E1006、およびA1255は太字で下線
を付している)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYS
DVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDIT
DIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAE
ELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYK
MSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLT
DLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILA
NFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEH
FYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKI
FDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKF
IDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGR
PNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFF
HCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAI
EKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVF
KDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLD
KGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESD
KKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGK
KLNLVIKNEEYFEFVQNRNN
【0159】
Francisella novicidaのCpf1 E1006A/D1255A(D917、A1006、およびA1255は太字で下線
を付している)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYS
DVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDIT
DIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAE
ELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYK
MSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLT
DLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILA
NFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEH
FYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKI
FDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKF
IDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGR
PNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFF
HCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAI
EKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVF
KDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLD
KGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESD
KKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGK
KLNLVIKNEEYFEFVQNRNN
【0160】
Francisella novicidaのCpf1 D917A/E1006A/D1255A(A917、A1006、およびA1255は太字
で下線を付している)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYS
DVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDIT
DIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAE
ELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYK
MSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLT
DLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILA
NFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEH
FYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKI
FDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKF
IDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGR
PNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFF
HCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAI
EKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVF
KDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLD
KGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESD
KKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGK
KLNLVIKNEEYFEFVQNRNN
【0161】
いくつかの実施形態では、融合タンパク質中に存在するCas9ドメインの1つは、PAM配列
について要求のないガイドヌクレオチド配列-プログラム可能なDNA結合タンパク質ドメイ
ンで置き換えてよい。
【0162】
いくつかの実施形態では、核酸プログラム可能なDNA結合タンパク質(napDNAbp)は、
微生物CRISPR/Casシステムの単一エフェクターである。微生物CRISPR/Casシステムの単一
エフェクターには限定なくCas9、Cpf1、Cas12b/C2c1、およびCas12c/C2c3が含まれる。典
型的には、微生物CRISPR/Casシステムはクラス1およびクラス2のシステムに分割される。
クラス1システムはマルチサブユニットエフェクター複合体を含み、クラス2システムは単
一タンパク質エフェクターを含む。たとえば、Cas9およびCpf1はクラス2エフェクターで
ある。Cas9およびCpf1に加えて、3つの区別されるクラス2のCRISPR/Casシステム(Cas12b
/C2c1、およびCas12c/C2c3)が、その全体の内容が参照により本明細書に組み込まれるSh
makov et al., “Discovery and Functional Characterization of Diverse Class 2 CRI
SPR Cas Systems”, Mol. Cell, 2015 Nov. 5; 60(3): 385-397によって記載されている
。システムCas12b/C2c1、およびCas12c/C2c3の2つのエフェクターは、Cpf1に関連するRuv
C様のエンドヌクレアーゼドメインを含む。第3のシステムは、叙述された2つのHEPNリボ
ヌクレアーゼドメインを有するエフェクターを含む。成熟したCRISPR RNAの生成は、Cas1
2b/C2c1によるCRISPR RNAの生成と異なり、tracrRNAに依存しない。Cas12b/C2c1はDNAの
開裂についてCRISPR RNAとtracrRNAの両方に依存する。
【0163】
Alicyclobaccillus acidoterrastrisのCas12b/C2c1(AacC2c1)の結晶構造が、キメラ
単分子ガイドRNA(sgRNA)との複合体において報告されている。たとえば、その全体の内
容が参照により本明細書に組み込まれるLiu et al., “C2c1-sgRNA Complex Structure R
eveals RNA-Guided DNA Cleavage Mechanism”, Mol. Cell, 2017 Jan. 19; 65(2):310-3
22を参照されたい。三元複合体として標的DNAに結合したAlicyclobacillus acidoterrest
risのC2c1の結晶構造も報告されている。たとえばその全体の内容が参照により本明細書
に組み込まれるYang et al., “PAM-dependent Target DNA Recognition and Cleavage b
y C2C1 CRISPR-Cas endonuclease”, Cell, 2016 Dec. 15; 167(7):1814-1828を参照され
たい。触媒としての能力のあるAacC2c1のコンフォメーションが、標的DNA鎖と非標的DNA
鎖の両方とともに、単一のRuvC触媒ポケットの中に位置して独立に捕捉され、Cas12b/C2c
1媒介開裂は標的DNAのジグザグの7ヌクレオチドの切断をもたらす。Cas12b/C2c1三元複合
体と既に同定したCas9およびCpf1の対応物との構造比較により、CRISPR-Cas9システムが
用いている機構の多様性が実証される。
【0164】
いくつかの実施形態では、本明細書で提供する融合タンパク質のいずれかの核酸プログ
ラム可能なDNA結合タンパク質(napDNAbp)は、Cas12b/C2c1、またはCas12c/C2c3タンパ
ク質であってよい。いくつかの実施形態では、napDNAbpはCas12b/C2c1タンパク質である
。いくつかの実施形態では、napDNAbpはCas12c/C2c3タンパク質である。いくつかの実施
形態では、napDNAbpは天然産生のCas12b/C2c1またはCas12c/C2c3タンパク質に対して少な
くとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくと
も94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%
、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では
、napDNAbpは天然産生のCas12b/C2c1またはCas12c/C2c3タンパク質である。いくつかの実
施形態では、napDNAbpは本明細書で提供するnapDNAbp配列のいずれか1つに対して少なく
とも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも9
4%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、
または少なくとも99.5%の同一性であるアミノ酸配列を含む。他の細菌種からのCas12b/C2
c1またはCas12c/C2c3も本開示に従って用い得ることを認識されたい。
Cas12b/C2c1 (uniprot.org/uniprot/T0D7A2#2)
sp|T0D7A2|/C2C1_ALIAG CRISPR-associated endo-nuclease C2c1 OS = =Alicyclobacillu
s acido-terrestris ((strain ATCC 49025 / DSM 3922/ CIP 106132 / NCIMB 13137/GD3B
) GN=c2c1 PE=1 SV=1
MAVKSIKVKLRLDDMPEIRAGLWKLHKEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECDKTAEECKAELLERLRARQ
VENGHRGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWE
EEKEKAETRKSADRTADVLRALADFGLKPLMRVYTDSEMSSVEWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGQ
EYAKLVEQKNRFEQKNFVGQEHLVHLVNQLQQDMKEASPGLESKEQTAHYVTGRALRGSDKVFEKWGKLAPDAPFDLYDA
EIKNVQRRNTRRFGSHDLFAKLAEPEYQALWREDASFLTRYAVYNSILRKLNHAKMFATFTLPDATAHPIWTRFDKLGGN
LHQYTFLFNEFGERRHAIRFHKLLKVENGVAREVDDVTVPISMSEQLDNLLPRDPNEPIALYFRDYGAEQHFTGEFGGAK
IQCRRDQLAHMHRRRGARDVYLNVSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGL
LSGLRVMSVDLGLRTSASISVFRVARKDELKPNSKGRVPFFFPIKGNDNLVAVHERSQLLKLPGETESKDLRAIREERQR
TLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPVDAANHMTPDWREAFENELQKLKSLHGICSDKEWMDAVYESVR
RVWRHMGKQVRDWRKDVRSGERPKIRGYAKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREH
IDHAKEDRLKKLADRIIMEALGYVYALDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELI
NQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCTQEHNPEPFPWWLNKFVVEHTLDACPLRADDLIPTGEGEIF
VSPFSAEEGDFHQIHADLNAAQNLQQRLWSDFDISQIRLRCDWGEVDGELVLIPRLTGKRTADSYSNKVFYTNTGVTYYE
RERGKKRRKVFAQEKLSEEEAELLVEADEAREKSVVLMRDPSGIINRGNWTRQKEFWSMV NQRIEGYLVKQIRSRVPLQ
DSACENTGDI
BhCas12b (Bacillus hisashii) NCBI Reference Sequence: WP_095142515
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAE
IQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRW
YNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQAL
ERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWL
KMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPIN
HPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKH
AFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKE
LTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGET
LVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWV
AFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHL
NALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGE
IYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDR
KCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIK
KGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSS
KQSMKRPAATKKAGQAKKKK
【0165】
いくつかの実施形態では、Cas12bはBvCas12Bであり、これはBhCas12bのバリアントで、
BhCas12Bに対して以下の変化:S893R、K846R、およびE837Gを含む。BvCas12b (Bacillus s
p. V3-13) NCBI Reference Sequence: WP_101661451.1
MAIRSIKLKMKTNSGTDSIYLRKALWRTHQLINEGIAYYMNLLTLYRQEAIGDKTKEAYQAELINIIRNQQRNNGSSEEH
GSDQEILALLRQLYELIIPSSIGESGDANQLGNKFLYPLVDPNSQSGKGTSNAGRKPRWKRLKEEGNPDWELEKKKDEER
KAKDPTVKIFDNLNKYGLLPLFPLFTNIQKDIEWLPLGKRQSVRKWDKDMFIQAIERLLSWESWNRRVADEYKQLKEKTE
SYYKEHLTGGEEWIEKIRKFEKERNMELEKNAFAPNDGYFITSRQIRGWDRVYEKWSKLPESASPEELWKVVAEQQNKMS
EGFGDPKVFSFLANRENRDIWRGHSERIYHIAAYNGLQKKLSRTKEQATFTLPDAIEHPLWIRYESPGGTNLNLFKLEEK
QKKNYYVTLSKIIWPSEEKWIEKENIEIPLAPSIQFNRQIKLKQHVKGKQEISFSDYSSRISLDGVLGGSRIQFNRKYIK
NHKELLGEGDIGPVFFNLVVDVAPLQETRNGRLQSPIGKALKVISSDFSKVIDYKPKELMDWMNTGSASNSFGVASLLEG
MRVMSIDMGQRTSASVSIFEVVKELPKDQEQKLFYSINDTELFAIHKRSFLLNLPGEVVTKNNKQQRQERRKKRQFVRSQ
IRMLANVLRLETKKTPDERKKAIHKLMEIVQSYDSWTASQKEVWEKELNLLTNMAAFNDEIWKESLVELHHRIEPYVGQI
VSKWRKGLSEGRKNLAGISMWNIDELEDTRRLLISWSKRSRTPGEANRIETDEPFGSSLLQHIQNVKDDRLKQMANLIIM
TALGFKYDKEEKDRYKRWKETYPACQIILFENLNRYLFNLDRSRRENSRLMKWAHRSIPRTVSMQGEMFGLQVGDVRSEY
SSRFHAKTGAPGIRCHALTEEDLKAGSNTLKRLIEDGFINESELAYLKKGDIIPSQGGELFVTLSKRYKKDSDNNELTVI
HADINAAQNLQKRFWQQNSEVYRVPCQLARMGEDKLYIPKSQTETIKKYFGKGSFVKNNTEQEVYKWEKSEKMKIKTDTT
FDLQDLDGFEDISKTIELAQEQQKKYLTMFRDPSGYFFNNETWRPQKEYWSIVNNIIKSCLKKKILSNKVEL.
【0166】
いくつかの実施形態では、Cas9ドメインはStaphylococcus aureusのCas9ドメイン(SaC
as9)である。いくつかの実施形態では、SaCas9ドメインはヌクレアーゼ活性なSaCas9、
ヌクレアーゼ不活性なSaCas9(SaCas9d)、またはSaCas9ニッカーゼ(SaCas9n)である。
いくつかの実施形態では、SaCas9はN579A変異または本明細書で提供するアミノ酸配列の
いずれかにおける対応する変異を含む。
【0167】
いくつかの実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメイン
は、非カノニカルPAMを有する核酸配列に結合することができる。いくつかの実施形態で
は、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、NNGRRTまたはNNNRRT
PAM配列を有する核酸配列に結合することができる。いくつかの実施形態では、SaCas9ド
メインは、E781X、N967X、およびR1014Xの変異の1つもしくは複数、または本明細書で提
供するアミノ酸配列のいずれかにおける対応する変異を含み、ここでXは任意のアミノ酸
である。いくつかの実施形態では、SaCas9ドメインは、E781K、N967K、およびR1014Hの変
異の1つもしくは複数、または本明細書で提供するアミノ酸配列のいずれかにおける1つも
しくは複数の対応する変異を含む。いくつかの実施形態では、SaCas9ドメインは、E781K
、N967K、またはR1014Hの変異、または本明細書で提供するアミノ酸配列のいずれかにお
ける対応する変異を含む。
【0168】
いくつかの実施形態では、バリアントCasタンパク質はSpCas9、SpCas9-VRQR、SpCas9-V
RER、xCas9 (sp)、SaCas9、SaCas9-KKH、SpCas9-MQKSER、SpCas9-LRKIQK、またはSpCas9-
LRVSQLであり得る。
【0169】
例示的なSaCas9配列
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHS
ELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKD
GEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFP
EELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKP
EFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAIN
LILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELARE
KNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPR
SVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDF
INRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKL
DKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLI
VNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIK
YYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAE
FIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEV
KSKKHPQIIKKG
下線を施し太字で表した上記の残基N579を(たとえばA579に)変異させ、SaCas9ニッカ
ーゼを得てもよい。
【0170】
例示的なSaCas9n配列
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHS
ELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKD
GEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFP
EELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKP
EFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAIN
LILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELARE
KNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPR
SVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDF
INRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKL
DKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLI
VNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIK
YYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAE
FIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEV
KSKKHPQIIKKG
【0171】
N579から変異させてSaCas9ニッカーゼを得ることができる上記の残基A579は下線を施し
太字で表している。
【0172】
例示的なSaKKH Cas9
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHS
ELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKD
GEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFP
EELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKP
EFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAIN
LILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELARE
KNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPR
SVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDF
INRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKL
DKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRKLINDTLYSTRKDDKGNTLI
VNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIK
YYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAE
FIASFYKNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPHIIKTIASKTQSIKKYSTDILGNLYEV
KSKKHPQIIKKG.
N579から変異させてSaCas9ニッカーゼを得ることができる上記の残基A579は下線を施し太
字で表している。E781、N967、およびR1014から変異させてSaKKH Cas9を得ることができ
る上記の残基K781、K967、およびH1014は下線を施しイタリックで表している。
【0173】
塩基エディターのポリヌクレオチドプログラム可能なヌクレオチド結合ドメインはそれ
自体、1つまたは複数のドメインを含む。たとえば、ポリヌクレオチドプログラム可能な
ヌクレオチド結合ドメインは1つまたは複数のヌクレアーゼドメインを含み得る。いくつ
かの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインのヌク
レアーゼドメインはエンドヌクレアーゼまたはエキソヌクレアーゼを含み得る。本明細書
で用語「エキソヌクレアーゼ」は、核酸(たとえばRNAまたはDNA)を自由末端から消化す
ることができるタンパク質またはポリペプチドを意味し、用語「エンドヌクレアーゼ」は
、核酸(たとえばDNAまたはRNA)の内部領域を触媒する(たとえば開裂させる)ことがで
きるタンパク質またはポリペプチドを意味する。いくつかの実施形態では、エンドヌクレ
アーゼは二本鎖核酸の一本鎖を開裂させることができる。いくつかの実施形態では、エン
ドヌクレアーゼは二本鎖核酸分子の両方の鎖を開裂させることができる。いくつかの実施
形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインはデオキシリボ
ヌクレアーゼであってよい。いくつかの実施形態では、ポリヌクレオチドプログラム可能
なヌクレオチド結合ドメインはリボヌクレアーゼであってよい。
【0174】
いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイ
ンのヌクレアーゼドメインは標的ポリヌクレオチドの0、1、または2個の鎖を切断するこ
とができる。いくつかの場合には、ポリヌクレオチドプログラム可能なヌクレオチド結合
ドメインはニッカーゼドメインを含み得る。本明細書で用語「ニッカーゼ」は、二本鎖を
形成した核酸分子(たとえばDNA)の2つの鎖のうち1つの鎖のみを開裂させることができる
ヌクレアーゼドメインを含むポリヌクレオチドプログラム可能なヌクレオチド結合ドメイ
ンを意味する。いくつかの実施形態では、ニッカーゼは、ポリヌクレオチドプログラム可
能なヌクレオチド結合ドメインの完全に触媒活性の(たとえば天然の)形態から、活性の
ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインに1つまたは複数の変異を
導入することによって、誘導することができる。たとえば、ポリヌクレオチドプログラム
可能なヌクレオチド結合ドメインがCas9から誘導されたニッカーゼドメインを含む場合に
は、Cas9から誘導されたニッカーゼドメインは、D10A変異および840位のヒスチジンを含
み得る。そのような場合には、残基H840は触媒活性を保持しており、したがって核酸二本
鎖の一本鎖を開裂させることができる。別の例では、Cas9から誘導されたニッカーゼドメ
インはH840A変異を含み得るが、10位のアミノ酸残基はDのままである。いくつかの実施形
態では、ニッカーゼは、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインの
完全に触媒活性な(たとえば天然の)形態から、ニッカーゼ活性に必要でないヌクレアー
ゼドメインの全部または一部を除去することによって、誘導することができる。たとえば
、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインがCas9から誘導されたニ
ッカーゼドメインを含む場合には、Cas9から誘導されたニッカーゼドメインはRuvCドメイ
ンまたはHNHドメインの全部または一部の欠失を含み得る。
【0175】
したがって、ニッカーゼドメインを含むポリヌクレオチドプログラム可能なヌクレオチ
ド結合ドメインを含む塩基エディターは、(たとえば結合したガイド核酸の相補的配列に
よって決定される)特定のポリヌクレオチド標的配列において一本鎖DNA切断(ニック)
を生じることができる。いくつかの実施形態では、ニッカーゼドメイン(たとえばCas9か
ら誘導されたニッカーゼドメイン)を含む塩基エディターによって開裂される核酸二本鎖
標的ポリヌクレオチド配列の鎖は、塩基エディターによって編集されない鎖である(即ち
、塩基エディターによって開裂される鎖は、編集されるべき塩基を含む鎖とは反対の鎖で
ある)。他の実施形態では、ニッカーゼドメイン(たとえばCas9から誘導されたニッカー
ゼドメイン)を含む塩基エディターは、編集のための標的とされているDNA分子の鎖を開
裂させることができる。そのような場合には、標的とされていない鎖は開裂されない。
【0176】
触媒的に死んだ(即ち標的ポリヌクレオチド配列を開裂させることができない)ポリヌ
クレオチドプログラム可能なヌクレオチド結合ドメインを含む塩基エディターも、本明細
書で提供される。本明細書で用語「触媒的に死んだ」および「ヌクレアーゼデッド」は相
互交換可能に用いられ、核酸の鎖を開裂させる能力を失わせる1つもしくは複数の変異お
よび/または欠失を有するポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン
を意味する。いくつかの実施形態では、触媒的に死んだポリヌクレオチドプログラム可能
なヌクレオチド結合ドメインの塩基エディターは、1つまたは複数のヌクレアーゼドメイ
ンにおける特定の点変異の結果としてヌクレアーゼ活性を欠くことができる。たとえば、
Cas9ドメインを含む塩基エディターの場合には、Cas9はD10A変異とH840A変異の両方を含
み得る。そのような変異は両方のヌクレアーゼドメインを不活化させ、それによりヌクレ
アーゼ活性の喪失をもたらす。他の実施形態では、触媒的に死んだポリヌクレオチドプロ
グラム可能なヌクレオチド結合ドメインは、触媒ドメイン(たとえばRuvC1および/または
HNHドメイン)の全部または一部の1つもしくは複数の欠失を含み得る。さらなる実施形態
では、触媒的に死んだポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、
点変異(たとえばD10AまたはH840A)ならびにヌクレアーゼドメインの全部または一部の
欠失を含む。
【0177】
ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインの以前の機能性バージョ
ンから、触媒的に死んだポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを
産生することができる変異も、本明細書で意図されている。たとえば、触媒的に死んだCa
s9(「dCas9」)の場合には、D10AおよびH840A以外の変異を有するバリアントが提供され
、それによりヌクレアーゼが不活化されたCas9がもたらされる。そのような変異には、例
としてD10およびH840における他のアミノ酸置換、またはCas9のヌクレアーゼドメインの
中の他の置換(たとえばHNHヌクレアーゼサブドメインおよび/またはRuvC1サブドメイン
における置換)が含まれる。
【0178】
さらなる好適なヌクレアーゼ不活性dCas9ドメインはこの開示および当分野における知
識に基づいて当業者には明白であることができ、本開示の範囲内である。そのようなさら
なる例示的で好適なヌクレアーゼ不活性Cas9ドメインには、それだけに限らないが、D10A
/H840A、D10A/D839A/H840A、およびD10A/D839A/H840A/N863A変異ドメインが含まれる(た
とえばその全体の内容が参照により本明細書に組み込まれるPrashant et al., CAS9 tran
scriptional activators for target specificity screening and paired nickases for
cooperative genome engineering. Nature Biotechnology. 2013; 31(9): 833-838を参照
されたい)。いくつかの実施形態では、dCas9ドメインは本明細書で提供するdCas9ドメイ
ンのいずれか1つに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75
%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少
なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるア
ミノ酸配列を含む。いくつかの実施形態では、Cas9ドメインは、本明細書で説明するアミ
ノ酸配列のいずれか1つと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、
15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、
35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれ以上の変
異を有するアミノ酸配列を含む。いくつかの実施形態では、Cas9ドメインは、本明細書で
説明するアミノ酸配列のいずれか1つと比較して少なくとも10、少なくとも15、少なくと
も20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少な
くとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも2
50、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、
少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、ま
たは少なくとも1200の同一の連続的なアミノ酸残基を有するアミノ酸配列を含む。
【0179】
塩基エディターに組み込むことができるポリヌクレオチドプログラム可能なヌクレオチ
ド結合ドメインの非限定的な例には、CRISPRタンパク質由来ドメイン、制限ヌクレアーゼ
、メガヌクレアーゼ、TALヌクレアーゼ(TALEN)、およびジンクフィンガーヌクレアーゼ
(ZFN)が含まれる。いくつかの場合には、塩基エディターは、核酸のCRISPR(即ちClust
ered Regularly Interspaced Short Palindromic Repeats)媒介修飾の際に、結合したガ
イド核酸を介して核酸配列に結合することができる、天然のもしくは修飾されたタンパク
質またはその部分を含むポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを
含む。そのようなタンパク質は本明細書で「CRISPRタンパク質」と称する。したがって、
CRISPRタンパク質の全部または一部を含むポリヌクレオチドプログラム可能なヌクレオチ
ド結合ドメインを含む塩基エディター(即ち、CRISPRタンパク質の全部または一部を塩基
エディターの「CRISPRタンパク質由来ドメイン」とも称されるドメインとして含む塩基エ
ディター)が本明細書で開示される。塩基エディターに組み込まれるCRISPRタンパク質由
来ドメインは、CRISPRタンパク質の野生型または天然のバージョンと比較して改変され得
る。たとえば、以下に述べるように、CRISPRタンパク質由来ドメインは、CRISPRタンパク
質の野生型または天然のバージョンに対して1つもしくは複数の変異、挿入、欠失、再配
置、および/または組み換えを含むことができる。
【0180】
いくつかの実施形態では、塩基エディターに組み込まれたCRISPRタンパク質由来ドメイ
ンは、結合したガイド核酸と連結されると標的ポリヌクレオチドに結合することができる
エンドヌクレアーゼ(たとえばデオキシリボヌクレアーゼまたはリボヌクレアーゼ)であ
る。いくつかの実施形態では、塩基エディターに組み込まれたCRISPRタンパク質由来ドメ
インは、結合したガイド核酸と共に標的ポリヌクレオチドに結合することができるニッカ
ーゼである。いくつかの実施形態では、塩基エディターに組み込まれたCRISPRタンパク質
由来ドメインは、結合したガイド核酸と共に標的ポリヌクレオチドに結合することができ
る、触媒的に死んだドメインである。いくつかの実施形態では、塩基エディターのCRISPR
タンパク質由来ドメインによって結合される標的ポリヌクレオチドはDNAである。いくつ
かの実施形態では、塩基エディターのCRISPRタンパク質由来ドメインによって結合される
標的ポリヌクレオチドはRNAである。
【0181】
いくつかの実施形態では、塩基エディターのCRISPRタンパク質由来ドメインは、Coryne
bacterium ulcerans(NCBI Refs: NC_015683.1, NC_017317.1); Corynebacterium diphthe
ria (NCBI Refs: NC_016782.1, NC_016786.1); Spiroplasma syrphidicola (NCBI Ref: N
C_021284.1); Prevotella intermedia (NCBI Ref: NC_017861.1); Spiroplasma taiwanen
se(NCBI Ref: NC_021846.1); Streptococcus iniae (NCBI Ref: NC_021314.1); Belliell
a baltica (NCBI Ref: NC_018010.1); Psychroflexus torquis (NCBI Ref: NC_018721.1)
; Streptococcus thermophilus (NCBI Ref: YP_820832.1); Listeria innocua (NCBI Ref
: NP_472073.1); Campylobacter jejuni (NCBI Ref: YP_002344900.1); Neisseria menin
gitidis (NCBI Ref: YP_002342100.1), Streptococcus pyogenes, またはStaphylococcus
aureus.のCas9の全部または一部を含み得る。
【0182】
いくつかの実施形態では、塩基エディターのCas9誘導ドメインはStaphylococcus aureu
sのCas9ドメイン(SaCas9)である。いくつかの実施形態では、SaCas9ドメインはヌクレ
アーゼ活性SaCas9、ヌクレアーゼ不活性SaCas9(SaCas9d)、またはSaCas9ニッカーゼ(S
aCas9n)である。いくつかの実施形態では、SaCas9ドメインはN579X変異を含む。いくつ
かの実施形態では、SaCas9ドメインはN579A変異を含む。いくつかの実施形態では、SaCas
9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非カノニカルPAMを有する核酸
配列に結合することができる。いくつかの実施形態では、SaCas9ドメイン、SaCas9dドメ
イン、またはSaCas9nドメインは、NNGRRT PAM配列を有する核酸配列に結合することがで
きる。いくつかの実施形態では、SaCas9ドメインはE781X、N967X、およびR1014Xの変異の
1つまたは複数を含む。
【0183】
塩基エディターは、高忠実度のCas9であるCas9の全部または一部に由来するドメインを
含み得る。いくつかの実施形態では、塩基エディターの高忠実度Cas9ドメインは、対応す
る野生型のCas9ドメインに対してCas9ドメインとDNAの糖-リン酸骨格との間の静電的相互
作用を低減させる1つまたは複数の変異を含む操作されたCas9ドメインである。DNAの糖-
リン酸骨格との間の静電的相互作用が低減した高忠実度のCas9ドメインは、より少ないオ
フターゲット効果を有し得る。いくつかの実施形態では、Cas9ドメイン(たとえば野生型
Cas9ドメイン)は、Cas9ドメインとDNAの糖-リン酸骨格との間の会合を低減させる1つま
たは複数の変異を含む。いくつかの実施形態では、Cas9ドメインは、Cas9ドメインとDNA
の糖-リン酸骨格との間の会合を少なくとも1%、少なくとも2%、少なくとも3%、少なくと
も4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、
少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少な
くとも55%、少なくとも60%、少なくとも65%、少なくとも70%、またはそれ以上、減少させ
る1つまたは複数の変異を含む。
【0184】
いくつかの実施形態では、修飾されたCas9は高忠実度のCas9酵素である。いくつかの実
施形態では、高忠実度のCas9酵素は、SpCas9(K855A)、eSpCas9(1.1)、SpCas9-HF1、ま
たは超正確Cas9バリアント(HypaCas9)である。改変されたCas9 eSpCas9(1.1)は、HNH/R
uvC溝と非標的DNA鎖との間の相互作用を弱めるアラニン置換を含み、鎖の分離およびオフ
ターゲット部位での切断を防止する。同様に、SpCas9-HF1は、Cas9のDNAリン酸骨格との
相互作用を妨害するアラニン置換によってオフターゲット編集を低下させる。HypaCas9は
REC3ドメインにCas9のプルーフリーディングおよび標的の識別を増大させる変異(SpCas9
N692A/M694A/Q695A/H698A)を含む。3つの高忠実度酵素の全てが、野生型Cas9よりも少
ないオフターゲット編集を生じる。例示的な高忠実度のCas9を以下に提供する。
Cas9に対する高忠実度Cas9ドメイン変異を太字および下線で示す。
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRIC
YLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAH
MIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSAS
MIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTAFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVT
VKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYA
HLFDDKVMKQLKRRRYTGWGALSRKLINGIRDKQSGKTILDFLKSDGFANRNFMALIHDDSLTFKEDIQKAQVSGQGDSL
HEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMK
NYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRAITKHVAQILDSRMNTKYDENDKLIREVKVITLKS
KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYS
NIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLI
ARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRV
ILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRI
DLSQLGGD
【0185】
ガイドポリヌクレオチド
【0186】
本明細書で用いる場合、用語「ガイドポリヌクレオチド」は、標的配列に特異的である
ことができて、かつポリヌクレオチドプログラム可能なヌクレオチド結合ドメインタンパ
ク質(たとえばCas9またはCpf1)と複合体を形成することができるポリヌクレオチドを意
味する。一実施形態では、ガイドポリヌクレオチドはガイドRNAである。本明細書で用い
る場合、用語「ガイドRNA(gRNA)」およびその文法的等価物は、標的DNAに特異的である
ことができて、かつCasタンパク質と複合体を形成することができるRNAを意味し得る。RN
A/Cas複合体はCasタンパク質を標的DNAに「ガイドすること」を補助し得る。Cas9/crRNA/
tracrRNAは、スペーサーに相補的な線状または環状のdsDNA標的をエンドヌクレアーゼ分
解によって開裂させる。crRNAに相補的でない標的鎖が最初にエンドヌクレアーゼ分解に
よって切断され、次いで3'-5'エキソヌクレアーゼ分解によってトリムされる。天然では
、DNAの結合および開裂は、典型的にはタンパク質および両方のRNAを必要とする。しかし
、crRNAとtracrRNAの両方の側面を単一のRNA種に組み込むようにシングルガイドRNA(「s
gRNA」または単に「gRNA」)を操作することができる。たとえば、その全体の内容が参照
により本明細書に組み込まれるJinek M. et al., Science 337:816-821(2012)を参照され
たい。Cas9はCRISPRリピート配列における短いモチーフ(PAMまたはプロトスペーサー隣
接モチーフ)を認識し、自己と非自己を区別することを補助する。Cas9のヌクレアーゼ配
列および構造は当業者には公知である(たとえば、それぞれの全体の内容が参照により本
明細書に組み込まれる“Complete genome sequence of an M1 strain of Streptococcus
pyogenes.” Ferretti, J.J. et al., Natl. Acad. Sci. U.S.A. 98:4658-4663(2001);
“CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.”
Deltcheva E. et al., Nature 471:602-607(2011); および“Programmable dual-RNA-gu
ided DNA endonuclease in adaptive bacterial immunity.” Jinek M.et al, Science 3
37:816-821(2012)を参照されたい。Cas9のオーソログは、それだけに限らないがS. pyoge
nesおよびS. thermophilusを含む種々の種において記載されている。さらなる好適なCas9
ヌクレアーゼおよび配列はこの開示に基づいて当業者には明白であることができ、そのよ
うなCas9ヌクレアーゼおよび配列には、その全体の内容が参照により本明細書に組み込ま
れるChylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 families of type I
I CRISPR-Cas immunity systems”(2013) RNA Biology 10:5, 726-737に開示された生命
体および遺伝子座からのCas9配列が含まれる。いくつかの実施形態では、Cas9ヌクレアー
ゼは不活性の(たとえば不活化された)DNA開裂ドメインを有し、即ちCas9はニッカーゼ
である。
【0187】
いくつかの実施形態では、ガイドポリヌクレオチドは少なくとも1つのシングルガイドR
NA(「sgRNA」または「gRNA」)である。いくつかの実施形態では、ガイドポリヌクレオ
チドは少なくとも1つのtracrRNAである。いくつかの実施形態では、ガイドポリヌクレオ
チドはポリヌクレオチド-プログラム可能なDNA結合ドメイン(たとえばCas9またはCpf1)
を標的ヌクレオチド配列にガイドするためにPAM配列を必要としない。
【0188】
本明細書で開示した塩基エディターのポリヌクレオチドプログラム可能なヌクレオチド
結合ドメイン(たとえばCRISPR誘導ドメイン)は、ガイドポリヌクレオチドと会合するこ
とによって、標的ポリヌクレオチド配列を認識することができる。ガイドポリヌクレオチ
ド(たとえばガイドRNA)は、典型的には一本鎖であり、ポリヌクレオチドの標的配列と
(たとえば相補的塩基対形成を介して)部位特異的に結合し、それにより、ガイド核酸に
伴われた塩基エディターを標的配列に導くようにプログラムすることができる。ガイドポ
リヌクレオチドはDNAであり得る。ガイドポリヌクレオチドはRNAであり得る。いくつかの
場合には、ガイドポリヌクレオチドは天然のヌクレオチド(たとえばアデノシン)を含む
。いくつかの場合には、ガイドポリヌクレオチドは非天然の(または天然でない)ヌクレ
オチド(たとえばペプチド核酸またはヌクレオチドアナログ)を含む。いくつかの場合に
は、ガイド核酸配列の標的領域は少なくとも15、16、17、18、19、20、21、22、23、24、
25、26、27、28、29、または30ヌクレオチドの長さであり得る。ガイド核酸の標的領域は
10~30ヌクレオチドの長さ、または15~25ヌクレオチドの長さ、または15~20ヌクレオチ
ドの長さであり得る。
【0189】
いくつかの実施形態では、ガイドポリヌクレオチドは2つ以上の個別のポリヌクレオチ
ドを含み、これはたとえば相補的塩基対形成を介して互いに相互作用することができる(
たとえば二重ガイドポリヌクレオチド)。たとえば、ガイドポリヌクレオチドはCRISPR R
NA(crRNA)およびトランス活性化CRISPR RNA(tracrRNA)を含み得る。たとえば、ガイ
ドポリヌクレオチドは1つまたは複数のトランス活性化CRISPR RNA(tracrRNA)を含み得
る。
【0190】
II型CRISPRシステムでは、CRISPRタンパク質(たとえばCas9)による核酸のターゲティ
ングは、典型的には標的配列を認識する配列を含む第1のRNA分子(crRNA)と、ガイドRNA
-CRISPRタンパク質複合体を安定化するスカフォールド領域を形成するリピート配列を含
む第2のRNA分子(trRNA)との間の相補的塩基対形成を必要とする。そのような二重ガイ
ドRNAシステムは、本明細書に開示した塩基エディターを標的ポリヌクレオチド配列へと
導くガイドポリヌクレオチドとして採用することができる。
【0191】
いくつかの実施形態では、本明細書で提供する塩基エディターは、シングルガイドポリ
ヌクレオチド(たとえばgRNA)を利用する。いくつかの実施形態では、本明細書で提供す
る塩基エディターは、二重ガイドポリヌクレオチド(たとえば二重gRNA)を利用する。い
くつかの実施形態では、本明細書で提供する塩基エディターは、1つまたは複数のガイド
ポリヌクレオチド(たとえば多重gRNA)を利用する。いくつかの実施形態では、シングル
ガイドポリヌクレオチドが、本明細書に記載した様々な塩基エディターのために利用され
る。たとえば、シングルガイドポリヌクレオチドを、シチジン塩基エディターおよびアデ
ノシン塩基エディターのために利用することができる。
【0192】
他の実施形態では、ガイドポリヌクレオチドは単一の分子の中に核酸のポリヌクレオチ
ド標的部分と核酸のスキャフォールド部分の両方を含み得る(即ち、単分子ガイド核酸)
。たとえば、単分子ガイドポリヌクレオチドは、シングルガイドRNA(sgRNAまたはgRNA)
であり得る。本明細書では、ガイドポリヌクレオチド配列という用語は、塩基エディター
と相互作用してこれを標的ポリヌクレオチド配列に導くことができる任意の単一、二重、
または多重の分子の核酸を意図している。
【0193】
典型的には、ガイドポリヌクレオチド(たとえばcrRNA/trRNA複合体またはgRNA)は、
標的ポリヌクレオチド配列を認識し、これに結合することができる配列を含む「ポリヌク
レオチド標的セグメント」と、塩基エディターのポリヌクレオチドプログラム可能なヌク
レオチド結合ドメイン成分内でガイドポリヌクレオチドを安定化させる「タンパク質結合
セグメント」とを含む。いくつかの実施形態では、ガイドポリヌクレオチドのポリヌクレ
オチドターゲティングセグメントはDNAポリヌクレオチドを認識してこれに結合し、それ
によりDNAにおける塩基の編集を促進させる。他の場合には、ガイドポリヌクレオチドの
ポリヌクレオチドターゲティングセグメントはRNAポリヌクレオチドを認識してこれに結
合し、それによりRNAにおける塩基の編集を促進させる。本明細書で「セグメント」は分
子の区分または領域、たとえばガイドポリヌクレオチド中のヌクレオチドの連続的な一続
きを意味する。セグメントはまた、セグメントが2つ以上の分子の領域を含み得るような
複合体の領域/区分を意味し得る。たとえば、ガイドポリヌクレオチドが多重の核酸分子
を含む場合には、タンパク質結合セグメントは、たとえば相補性の領域に沿ってハイブリ
ダイズする多重の個別の分子の全部または一部を含み得る。いくつかの実施形態では、2
つの個別の分子を含むDNAターゲティングRNAのタンパク質結合セグメントは、(i)100塩
基対の長さである第1のRNA分子の第40~75塩基対、および(ii)50塩基対の長さである第
2のRNA分子の第10~25塩基対を含み得る。「セグメント」の定義は、特定の文脈において
他に具体的に定義しない限り、全塩基対の特定の数に限定されず、所与のRNA分子の塩基
対のいずれの特定の数にも限定されず、複合体中の個別の分子の特定の数に限定されず、
任意の全長を有するRNA分子の領域を含み得て、他の分子との相補性を有する領域を含み
得る。
【0194】
ガイドRNAまたはガイドポリヌクレオチドは、2つ以上のRNA、たとえばCRISPR RNA(crR
NA)およびトランス活性化crRNA(tracrRNA)を含み得る。ガイドRNAまたはガイドポリヌ
クレオチドは、一本鎖RNA、またはcrRNAおよびtracrRNAの一部(たとえば機能性部分)の
融合によって形成されたシングルガイドRNA(sgRNA)を含み得ることもある。ガイドRNA
またはガイドポリヌクレオチドは、crRNAおよびtracrRNAを含む二重RNAでもあり得る。さ
らに、crRNAは標的DNAとハイブリダイズすることができる。
【0195】
上で論じたように、ガイドRNAまたはガイドポリヌクレオチドは、発現生成物であり得
る。たとえば、ガイドRNAをコードするDNAは、ガイドRNAをコードする配列を含むベクタ
ーであり得る。ガイドRNAまたはガイドポリヌクレオチドは、単離されたガイドRNA、また
はガイドRNAをコードする配列を含むプラスミドDNAおよびプロモーターで、細胞をトラン
スフェクトすることによって、細胞の中に移送することができる。ガイドRNAまたはガイ
ドポリヌクレオチドは、ウイルス媒介遺伝子送達を用いる等の他の方法で細胞の中に移送
することもできる。
【0196】
ガイドRNAまたはガイドポリヌクレオチドは、単離することができる。たとえば、ガイ
ドRNAは、単離されたRNAの形態で細胞または生命体の中にトランスフェクトすることがで
きる。ガイドRNAは、当技術で既知の任意のin vitro転写システムを用いるin vitro転写
によって調製することができる。ガイドRNAは、ガイドRNAをコードする配列を含むプラス
ミドの形態ではなく、単離されたRNAの形態で細胞の中に移送され得る。
【0197】
ガイドRNAまたはガイドポリヌクレオチドは、3つの領域、即ち染色体の配列の中の標的
部位に対して相補的であり得る5'末端の第1の領域、ステムループ構造を形成し得る第2の
内部領域、および一本鎖であってよい第3の3'領域を含み得る。それぞれのガイドRNAの第
1の領域は異なり得、それによって、それぞれのガイドRNAは融合タンパク質を特定の標的
部位へとガイドする。さらに、それぞれのガイドRNAの第2および第3の領域は全てのガイ
ドRNAの中で同一であり得る。
【0198】
ガイドRNAまたはガイドポリヌクレオチドの第1の領域は染色体の配列の中の標的部位に
おける配列に対して相補的であり得、それによりガイドRNAの第1の領域は標的部位と塩基
対を形成することができる。いくつかの場合には、ガイドRNAの第1の領域はおよそ10ヌク
レオチド~25ヌクレオチド(即ち10ヌクレオチド~ヌクレオチド、または約10ヌクレオチ
ド~約25ヌクレオチド、または10ヌクレオチド~約25ヌクレオチド、または約10ヌクレオ
チド~25ヌクレオチド)またはそれ以上を含み得る。たとえば、ガイドRNAの第1の領域と
染色体配列の中の標的部位との間の塩基対形成の領域は、およそ10、11、12、13、14、15
、16、17、18、19、20、22、23、24、25、またはそれ以上のヌクレオチドの長さであり得
る。時には、ガイドRNAの第1の領域はおよそ19、20、または21ヌクレオチドの長さであり
得る。
【0199】
ガイドRNAまたはガイドポリヌクレオチドは、二次構造を形成する第2の領域をも含み得
る。たとえば、ガイドRNAによって形成される二次構造は、ステム(またはヘアピン)お
よびループを含み得る。ループおよびステムの長さは変動し得る。たとえば、ループはお
よそ3~10ヌクレオチドの長さの範囲、ステムはおよそ6~20塩基対の長さの範囲であり得
る。ステムは1~10または約10ヌクレオチドの1つまたは複数のバルジを含み得る。第2の
領域の全体の長さはおよそ16~60ヌクレオチドの長さの範囲であり得る。たとえば、ルー
プはおよそ4ヌクレオチドの長さ、ステムはおよそ約12塩基対であり得る。
【0200】
ガイドRNAまたはガイドポリヌクレオチドは、本質的に一本鎖であってよい第3の領域を
3'末端に含み得る。たとえば、第3の領域は時には目的の細胞の中のいずれの染色体配列
にも相補的でなく、時にはガイドRNAの残りの部分に対して相補的でない。さらに、第3の
領域の長さは変動し得る。第3の領域はおよそ4ヌクレオチドを超える長さであり得る。た
とえば、第3の領域の長さはおよそ5~60ヌクレオチドの長さの範囲であり得る。
【0201】
ガイドRNAまたはガイドポリヌクレオチドは、遺伝子標的の任意のエクソンまたはイン
トロンを標的とすることができる。いくつかの場合には、ガイドは遺伝子のエクソン1ま
たは2を標的とすることができる。他の場合には、ガイドは遺伝子の遺伝子のエクソン3ま
たは4を標的とすることができる。組成物は、全てが同じエクソンを標的とする多重のガ
イドRNAを含んでよく、いくつかの場合には、異なるエクソンを標的とすることができる
多重のガイドRNAを含み得る。遺伝子のエクソンおよびイントロンが標的となり得る。
【0202】
ガイドRNAまたはガイドポリヌクレオチドは、およそ20ヌクレオチドの核酸配列を標的
とすることができる。標的核酸はおよそ20ヌクレオチド未満であり得る。標的核酸は少な
くともおよそ5、10、15、16、17、18、19、20、21、22、23、24、25、30、または1~100
ヌクレオチドの間のいずれかの長さであり得る。標的核酸は多くともおよそ5、10、15、1
6、17、18、19、20、21、22、23、24、25、30、40、50、または1~100ヌクレオチドの間
のいずれかの長さであり得る。標的核酸配列はPAMの第1のヌクレオチドの5'に接するおよ
そ20塩基であり得る。ガイドRNAは核酸配列を標的とすることができる。標的核酸は少な
くともおよそ1~10、1~20、1~30、1~40、1~50、1~60、1~70、1~80、1~90、また
は1~100ヌクレオチドであり得る。
【0203】
ガイドポリヌクレオチド、たとえばガイドRNAは、別の核酸、たとえば標的核酸または
細胞のゲノムの中のプロトスペーサーにハイブリダイズすることができる核酸を意味し得
る。ガイドポリヌクレオチドはRNAであり得る。ガイドポリヌクレオチドはDNAであり得る
。ガイドポリヌクレオチドは部位特異的に核酸の配列に結合するようにプログラムまたは
設計することができる。ガイドポリヌクレオチドは1つのポリヌクレオチド鎖を含んでよ
く、シングルガイドポリヌクレオチドと呼ぶことができる。ガイドポリヌクレオチドは2
つのポリヌクレオチド鎖を含んでよく、ダブルガイドポリヌクレオチドと呼ぶことができ
る。ガイドRNAはRNA分子として細胞または胚に導入することができる。たとえば、RNA分
子はin vitroで転写することができ、および/または化学合成することができる。RNAは合
成DNA分子、たとえばgBlocks(登録商標)遺伝子断片から転写することができる。次にガ
イドRNAをRNA分子として細胞または胚に導入することができる。ガイドRNAは非RNA核酸分
子、たとえばDNA分子の形態で、細胞または胚に導入することもできる。たとえば、ガイ
ドRNAをコードするDNAは、目的の細胞または胚におけるガイドRNAの発現のためのプロモ
ーター制御配列に、作動可能に連結することができる。RNAコーディング配列は、RNAポリ
メラーゼIII(Pol III)によって認識されるプロモーター配列に、作動可能に連結するこ
とができる。ガイドRNAを発現するために用いることができるプラスミドベクターには、
それだけに限らないが、px330ベクターおよびpx333ベクターが含まれる。いくつかの場合
には、プラスミドベクター(たとえばpx333ベクター)は、少なくとも2つのガイドRNAコ
ーディングDNA配列を含み得る。
【0204】
ガイドポリヌクレオチド、たとえばガイドRNA、および標的配列を選択し、設計し、検
証する方法を本明細書に記載しており、これは当業者には既知である。たとえば、核酸塩
基エディターシステムにおけるデアミナーゼドメイン(たとえばAIDドメイン)の潜在的
な基質交雑の影響を最小化するために、意図せずに脱アミノ化の標的となり得る残基(た
とえば標的核酸遺伝子座の中のssDNAの上に存在する可能性のあるオフターゲットC残基)
の数を最小化してよい。さらに、標的核酸配列に対応するgRNAを最適化するため、たとえ
ばゲノム全体にわたる全オフターゲット活性を最小化するため、ソフトウェアツールを用
いることができる。たとえば、S. pyogenes Cas9を用いるそれぞれの可能な標的ドメイン
について、ある数(たとえば1、2、3、4、5、6、7、8、9または10)までのミスマッチし
た塩基対を含む全てのオフターゲット配列(選択されたPAM、たとえばNAGまたはNGGの前
にある)をゲノム全体にわたって同定してよい。標的部位に相補的なgRNAの第1領域を同
定することができ、全ての第1領域(たとえばcrRNA)をその全体の予想されるオフター
ゲットスコアに従ってランク付けすることができる。最上位にランクされた標的ドメイン
は最大のオンターゲットおよび最小のオフターゲット活性を有する可能性があるものを表
す。候補となる標的gRNAは、当技術で既知のおよび/または本明細書で説明する方法を用
いることによって、機能的に評価することができる。
【0205】
非限定的な例として、Cas9とともに用いるためのガイドRNAのcrRNAにおける標的DNAハ
イブリダイズ配列を、DNA配列検索アルゴリズムを用いて同定してよい。gRNAの設計は、B
ae S., Park J., & Kim J.-S. Cas-OFFinder: A fast and versatile algorithm that se
arches for potential off-target sites of Cas9 RNA-guided endonucleases. Bioinfor
matics 30, 1473-1475 (2014)に記載された公衆ツールのcas-offinderに基づく特注のgRN
A設計ソフトウェアを用いて行なってよい。このソフトウェアは、ゲノム全体でのオフタ
ーゲットの傾向を計算してガイドをスコア付けする。典型的には完全なマッチから7個の
ミスマッチまでの範囲のマッチを、17~24の長さの範囲のガイドについて考慮する。オフ
ターゲット部位が計算で決定されれば、合計したスコアをそれぞれのガイドについて計算
し、ウェブインターフェースを用いて表形式出力で集約する。PAM配列に隣接する可能な
標的部位の同定に加えて、ソフトウェアは、選択した標的部位から1、2、3、または3
ヌクレオチドを超えて異なる全てのPAM隣接配列をも同定する。標的核酸配列、たとえば
標的遺伝子についてのゲノムDNA配列が得られ、公衆利用可能なツール、たとえばRepeatM
askerプログラムを用いてリピート要素がスクリーニングされる。RepeatMaskerは繰り返
された要素および複雑性の低い領域についてインプットDNA配列を検索する。所与のクエ
リー配列の中に存在するリピートの詳細な注釈が出力される。
【0206】
同定に続いて、ガイドRNA、たとえばcrRNAの第1領域を、その標的部位との距離、その
直交性、および関連するPAM配列との緊密なマッチのための5'ヌクレオチドの存在(たと
えば関連するPAM、たとえばS. pyogenesについてのNGG PAM、S. aureusについてのNNGRRT
またはNNGRRV PAM、を含むヒトゲノムにおける緊密なマッチの同定に基づく5' G)に基づ
いて、段階にランク付けしてよい。本明細書で用いる場合、直交性は、標的配列への最も
少ない数のミスマッチを含むヒトゲノム中の配列の数を意味する。「高レベルの直交性」
または「良好な直交性」は、たとえば意図した標的の他にヒトゲノムに同一の配列を有さ
ず、また標的配列の中に1つもしくは2つのミスマッチを含むいずれの配列も有しない、20
マーの標的ドメインを意味し得る。オフターゲットDNA開裂を最小化するために、良好な
直交性を有する標的ドメインが選択され得る。
【0207】
いくつかの実施形態では、塩基編集活性を試験し、候補となるガイドポリヌクレオチド
を試験するために、レポーターシステムを用いてもよい。いくつかの実施形態では、レポ
ーターシステムは、塩基編集活性がレポーター遺伝子の発現をもたらすレポーター遺伝子
に基づくアッセイを含んでよい。たとえば、レポーターシステムは、不活化した開始コド
ン、たとえば3'-TAC-5'から3'-CAC-5'へのテンプレート鎖の変異を含むレポーター遺伝子
を含んでよい。標的Cの脱アミノ化に成功すれば、対応するmRNAは5'-GUG-3'の代わりに5'
-AUG-3'として転写され、レポーター遺伝子の翻訳が可能になる。好適なレポーター遺伝
子は当業者には明白になる。レポーター遺伝子の非限定的な例には、緑色蛍光タンパク質
(GFP)、赤色蛍光タンパク質(RFP)、ルシフェラーゼ、分泌アルカリホスファターゼ(S
EAP)をコードする遺伝子、ならびにその発現が検出可能で当業者には明白な他の任意の
遺伝子が含まれる。たとえばそれぞれのデアミナーゼが標的のDNA配列に関してどの残基
を標的としているかを決定するために、レポーターシステムを用いて多くの異なったgRNA
を試験することができる。特定の塩基編集タンパク質、たとえばCas9デアミナーゼ融合タ
ンパク質のオフターゲット効果を評価するために、非テンプレート鎖を標的とするsgRNA
を試験することもできる。いくつかの実施形態では、そのようなgRNAは、変異した開始コ
ドンがgRNAと塩基対を形成しないように設計することができる。ガイドポリヌクレオチド
は、標準のリボヌクレオチド、修飾されたリボヌクレオチド(たとえばプソイドウリジン
)、リボヌクレオチドアイソマー、および/またはリボヌクレオチドアナログを含み得る
。いくつかの実施形態では、ガイドポリヌクレオチドは少なくとも1つの検出可能な標識
を含み得る。検出可能な標識は、フルオロフォア(たとえばFAM、TMR、Cy3、Cy5、Texas
Red、Oregon Green、Alexa Fluors、Halo Tags、または好適な蛍光染料)、検出タグ(た
とえばビオチン、ジゴキシゲニン、その他)、量子ドット、または金粒子であり得る。
【0208】
ガイドポリヌクレオチドは化学合成され、酵素合成され、またはその組合せであってよ
い。たとえば、ガイドRNAは標準的なホスホロアミダイト系固体相合成法を用いて合成す
ることができる。あるいは、ガイドRNAは、ガイドRNAコードDNAするを、ファージRNAポリ
メラーゼによって認識されるプロモーター制御配列に作動可能に連結することによってin
vitroで合成することができる。好適なファージプロモーター配列の例には、T7、T3、SP
6プロモーター配列、またはその変形が含まれる。ガイドRNAが2つの分離された分子(た
とえばcrRNAおよびtracrRNA)を含む実施形態では、crRNAは化学合成して、tracrRNAは酵
素合成することができる。
【0209】
いくつかの実施形態では、塩基エディターシステムは多重のガイドポリヌクレオチド、
たとえばgRNAを含んでよい。たとえば、gRNAは、塩基エディターシステムに含まれる1つ
または複数の標的遺伝子座(たとえば少なくとも1つのgRNA、少なくとも2つのgRNA、少な
くとも5つのgRNA、少なくとも10個のgRNA、少なくとも20個のgRNA、少なくとも30個のgRN
A、少なくとも50個のgRNA)を標的としてよい。前記多重のgRNA配列はタンデムに配置さ
れてもよく、好ましくは直接リピートによって分離される。
【0210】
ガイドRNAまたはガイドポリヌクレオチドをコードするDNA配列は、ベクターの一部分で
あってもよい。さらに、ベクターは、さらなる発現制御配列(たとえばエンハンサー配列
、Kozak配列、ポリアデニル化配列、転写停止配列、その他)、選択可能なマーカー配列
(たとえばGFPまたはプロマイシン等の抗生剤耐性遺伝子)、複製起源、その他を含み得
る。ガイドRNAをコードするDNA分子は線状であってもよい。ガイドRNAまたはガイドポリ
ヌクレオチドをコードするDNA分子は環状であってもよい。
【0211】
いくつかの実施形態では、塩基エディターシステムの1つまたは複数の成分はDNA配列に
よってコードされてよい。そのようなDNA配列は発現システム、たとえば細胞に、共にま
たは個別に導入され得る。たとえば、ポリヌクレオチドプログラム可能なヌクレオチド結
合ドメインおよびガイドRNAをコードするDNA配列が細胞に導入され、それぞれのDNA配列
は個別の分子の部分(たとえばポリヌクレオチドプログラム可能なヌクレオチド結合ドメ
インをコードする配列を含む1つのベクターと、ガイドRNAをコードする配列を含む第2の
ベクター)であってよく、または両方が同じ分子(たとえばポリヌクレオチドプログラム
可能なヌクレオチド結合ドメインとガイドRNAの両方のためのコーディング(および制御
)配列を含む1つのベクター)の部分であってもよい。
【0212】
ガイドポリヌクレオチドは、核酸に新たなまたは向上した特徴を提供するための1つま
たは複数の修飾を含み得る。ガイドポリヌクレオチドは、核酸親和性タグを含み得る。ガ
イドポリヌクレオチドは合成ヌクレオチド、合成ヌクレオチドアナログ、ヌクレオチド誘
導体、および/または修飾されたヌクレオチドを含み得る。
【0213】
いくつかの場合には、gRNAまたはガイドポリヌクレオチドは修飾を含み得る。修飾はgR
NAまたはガイドポリヌクレオチドの任意の位置に作成することができる。単一のgRNAまた
はガイドポリヌクレオチドに2つ以上の修飾を作成することができる。gRNAまたはガイド
ポリヌクレオチドは、修飾後に品質管理を受けることができる。いくつかの例では、品質
管理には、PAGE、HPLC、MS、またはそれらの任意の組合せが含まれ得る。
【0214】
gRNAまたはガイドポリヌクレオチドの修飾は、置換、挿入、欠失、化学的修飾、物理的
修飾、安定化、精製、またはそれらの任意の組合せであり得る。
【0215】
gRNAまたはガイドポリヌクレオチドは、5'アデニレート、5'グアノシントリホスフェエ
ートキャップ、5'N7メチルグアノシントリホスフェエートキャップ、5'トリホスフェエー
トキャップ、3'ホスフェート、3'チオホスフェート、5'ホスフェート、5'チオホスフェー
ト、Cis-Synチミジンダイマー、トリマー、C12スペーサー、C3スペーサー、C6スペーサー
、dスペーサー、PCスペーサー、rスペーサー、スペーサー18、スペーサー9、3'-3'修飾、
5'-5'修飾、非塩基、アクリジン、アゾベンゼン、ビオチン、ビオチンBB、ビオチンTEG、
コレステリルTEG、デスチオビオチンTEG、DNP TEG、DNP-X、DOTA、dT-ビオチン、デュア
ルビオチン、PCビオチン、プソラレンC2、プソラレンC6、TINA、3’DABCYL、ブラックホ
ールクエンチャー1、ブラックホールクエンチャー2、DABCYL SE、dT-DABCYL、IRDye QC-1
、QSY-21、QSY-35、QSY-7、QSY-9、カルボキシルリンカー、チオールリンカー、2'-デオ
キシリボヌクレオシドアナログプリン、2'-デオキシリボヌクレオシドアナログピリミジ
ン、リボヌクレオシドアナログ、2'-O-メチルリボヌクレオシドアナログ、糖修飾アナロ
グ、ウォブル/ユニバーサル塩基、蛍光染料標識、2'-フルオロRNA、2'-O-メチルRNA、メ
チルホスホネート、ホスホジエステルDNA、ホスホジエステルRNA、ホスホチオエートDNA
、ホスホロチオエートRNA、UNA、プソイドウリジン-5'-トリホスフェート、5'-メチルシ
チジン-5'-トリホスフェート、またはそれらの任意の組合せによって修飾することもでき
る。
【0216】
いくつかの場合には、修飾は永続的である。他の場合には、修飾は一過的である。いく
つかの場合には、多重修飾がgRNAまたはガイドポリヌクレオチドに作成される。gRNAまた
はガイドポリヌクレオチドの修飾は、ヌクレオチドの物理化学的特性、たとえばコンフォ
メーション、極性、疎水性、化学反応性、塩基対形成相互作用、またはそれらの任意の組
合せを改変することができる。
【0217】
修飾はホスホロチオエート置換であってもよい。いくつかの場合には、天然のホスホジ
エステル結合は細胞のヌクレアーゼによる急速な分解を受けやすいことがあり、ホスホロ
チオエート(PS)結合置換を用いるヌクレオチド間リンケージの修飾は細胞性分解による
加水分解に対してより安定であり得る。修飾によってgRNAまたはガイドポリヌクレオチド
の安定性が増大し得る。修飾は生物学的活性をも強化し得る。いくつかの場合には、ホス
ホロチオエートで強化されたRNA gRNAはリボヌクレアーゼA、リボヌクレアーゼT1、仔ウ
シ血清ヌクレアーゼ、またはそれらの任意の組合せを阻害することができる。これらの特
性により、in vivoまたはin vitroでヌクレアーゼへの曝露の可能性が高い用途において
用いられるPS-RNA gRNAの使用が可能になる。たとえば、gRNAの5'または''末端における
最後の3~5ヌクレオチドの間にホスホロチオエート(PS)結合を導入することができ、こ
れはエキソヌクレアーゼによる分解を阻害することができる。いくつかの場合には、ホス
ホロチオエート結合をgRNAの全体に付加してエンドヌクレアーゼによる攻撃を低減させる
ことができる。
【0218】
プロトスペーサー隣接モチーフ
用語「プロトスペーサー隣接モチーフ(PAM)」またはPAM様モチーフは、CRISPR細菌適
応免疫系においてCas9ヌクレアーゼが標的とするDNA配列に直接続く2~6塩基対のDNA配列
を意味する。いくつかの実施形態では、PAMは5'PAMであり得る(即ち、プロトスペーサー
の5'末端の上流に位置する)。他の実施形態では、PAMは3'PAMであり得る(即ち、プロト
スペーサーの5'末端の下流に位置する)。
【0219】
プロトスペーサー隣接モチーフ(PAM)またはPAM様モチーフは、CRISPR細菌適応免疫系
においてCas9ヌクレアーゼが標的とするDNA配列に直接続く2~6塩基対のDNA配列を意味す
る。いくつかの実施形態では、PAMは5'PAMであり得る(即ち、プロトスペーサーの5'末端
の上流に位置する)。他の実施形態では、PAMは3'PAMであり得る(即ち、プロトスペーサ
ーの5'末端の下流に位置する)。PAM配列は標的結合にとって重要であるが、その正確な
配列はCasタンパク質の型に依存する。
【0220】
本明細書で提供する塩基エディターは、カノニカルまたは非カノニカルプロトスペーサ
ー隣接モチーフ(PAM)配列を含むヌクレオチド配列と結合することができるCRISPRタン
パク質由来ドメインを含み得る。PAM部位は標的ポリヌクレオチド配列に近接したヌクレ
オチド配列である。本開示のいくつかの態様は、様々なPAM特異性を有するCRISPRタンパ
ク質の全部または一部を含む塩基エディターを提供する。たとえば、典型的にはS. pyoge
nesのCas9(SpCas9)等のCas9タンパク質は特定の核酸領域に結合するためにカノニカルN
GG PAM配列を必要とする。ここで「NGG」における「N」はアデニン(A)、チミン(T)、
グアニン(G)、またはシトシン(C)であり、Gはグアニンである。PAMはCRISPRタンパク
質特異的であり得、異なったCRISPRタンパク質由来ドメインを含む異なった塩基エディタ
ーの間で異なり得る。PAMは標的配列の5'または3'であり得る。PAMは標的配列の上流また
は下流であり得る。PAMは1、2、3、4、5、6、7、8、9、10またはそれを超えるヌクレオチ
ドの長さであり得る。PAMはしばしば2~6ヌクレオチドの長さである。
【0221】
いくつかの実施形態では、Cas9ドメインはStreptococcus pyogenesのCas9ドメイン(Sp
Cas9)である。いくつかの実施形態では、SpCas9ドメインはヌクレアーゼ活性SpCas9、ヌ
クレアーゼ不活性SpCas9(SpCas9d)、またはCas9ニッカーゼ(SpCas9n)である。いくつ
かの実施形態では、SpCas9はD9X変異、または本明細書で提供するアミノ酸配列のいずれ
かにおける対応する変異を含み、ここでXはDを除くアミノ酸である。いくつかの実施形態
では、SpCas9はD9A変異、または本明細書で提供するアミノ酸配列のいずれかにおける対
応する変異を含む。いくつかの実施形態では、SpCas9ドメイン、SpCas9dドメイン、また
はSpCas9nドメインは、非カノニカルPAMを有する核酸配列に結合することができる。いく
つかの実施形態では、SpCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、NG
G、NGA、またはNGCG PAM配列を有する核酸配列に結合することができる。いくつかの実施
形態では、SpCas9ドメインはD1135X、R1335X、およびT1137X変異の1つもしくは複数、ま
たは本明細書で提供するアミノ酸配列のいずれかにおける対応する変異を含み、ここでX
は任意のアミノ酸である。いくつかの実施形態では、SpCas9ドメインはD1135E、R1335Q、
およびT1137R変異の1つもしくは複数、または本明細書で提供するアミノ酸配列のいずれ
かにおける対応する変異を含む。いくつかの実施形態では、SpCas9ドメインはD1135E、R1
335Q、およびT1137R変異、または本明細書で提供するアミノ酸配列のいずれかにおける対
応する変異を含む。いくつかの実施形態では、SpCas9ドメインはD1135X、R1335X、および
T1137X変異の1つもしくは複数、または本明細書で提供するアミノ酸配列のいずれかにお
ける対応する変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態では、S
pCas9ドメインはD1135V、R1335Q、およびT1337R変異の1つもしくは複数、または本明細書
で提供するアミノ酸配列のいずれかにおける対応する変異を含む。いくつかの実施形態で
は、SpCas9ドメインはD1135V、R1335Q、およびT1337R変異、または本明細書で提供するア
ミノ酸配列のいずれかにおける対応する変異を含む。いくつかの実施形態では、SpCas9ド
メインはD1135X、G1218X、R1335X、およびT1337X変異の1つもしくは複数、または本明細
書で提供するアミノ酸配列のいずれかにおける対応する変異を含み、ここでXは任意のア
ミノ酸である。いくつかの実施形態では、SpCas9ドメインはD1135V、G1218R、R1335Q、お
よびT1337R変異の1つもしくは複数、または本明細書で提供するアミノ酸配列のいずれか
における対応する変異を含む。いくつかの実施形態では、SpCas9。いくつかの実施形態で
は、SpCas9ドメインはD1135V、G1218R、R1335Q、およびT1337R変異、または本明細書で提
供するアミノ酸配列のいずれかにおける対応する変異を含む。
【0222】
いくつかの実施形態では、本明細書で提供する融合タンパク質のいずれかのCas9ドメイ
ンは、本明細書に記載したCas9ポリペプチドに対して少なくとも60%、少なくとも65%、少
なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なく
とも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少な
くとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、本明細書で
提供する融合タンパク質のいずれかのCas9ドメインは、本明細書に記載した任意のCas9ポ
リペプチドのアミノ酸配列を含む。いくつかの実施形態では、本明細書で提供する融合タ
ンパク質のいずれかのCas9ドメインは、本明細書に記載した任意のCas9ポリペプチドのア
ミノ酸配列からなる。
【0223】
PAM配列と結合することができる例示的なSpCas9タンパク質の配列は以下の通りである
。
【0224】
例示的なSpCas9
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRIC
YLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAH
MIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSAS
MIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVT
VKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYA
HLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSL
HEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMK
NYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS
KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYS
NIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLI
ARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRV
ILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRI
DLSQLGGD
【0225】
例示的なSpCas9n
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRIC
YLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAH
MIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSAS
MIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVT
VKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYA
HLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSL
HEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMK
NYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS
KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYS
NIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLI
ARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRV
ILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRI
DLSQLGGD
【0226】
例示的なSpEQR Cas9
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRIC
YLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAH
MIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSAS
MIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVT
VKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYA
HLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSL
HEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMK
NYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS
KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYS
NIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLI
ARKKDWDPKKYGGFESPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRV
ILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRI
DLSQLGGD
D1135、R1335、およびT1337から変異させてSpEQR Cas9を得ることができる上記の残基E11
35、Q1335、およびR1337は下線を施し太字で表している。
【0227】
例示的なSpVQR Cas9
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRIC
YLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAH
MIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSAS
MIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVT
VKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYA
HLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSL
HEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMK
NYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS
KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYS
NIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLI
ARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRV
ILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRI
DLSQLGGD
D1135、R1335、およびT1337から変異させてSpVQR Cas9を得ることができる上記の残基V11
35、Q1335、およびR1337は下線を施し太字で表している。
【0228】
例示的なSpVRER Cas9
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRIC
YLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAH
MIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSAS
MIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVT
VKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYA
HLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSL
HEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMK
NYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS
KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYS
NIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLI
ARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRV
ILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKEYRSTKEVLDATLIHQSITGLYETRI
DLSQLGGD.
例示的なSpVRQR Cas9
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRIC
YLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAH
MIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSAS
MIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVT
VKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYA
HLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSL
HEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMK
NYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS
KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYS
NIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLI
ARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRV
ILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRI
DLSQLGGD.
D1135、G1218、R1335、およびT1337から変異させてSpVRQR Cas9を得ることができる上記
の残基V1135、R1218、Q1335、およびR1337は下線を施し太字で表している。
【0229】
いくつかの実施形態では、Cas9ドメインは組み換えCas9ドメインである。いくつかの実
施形態では、組み換えCas9ドメインはSpyMacCas9ドメインである。いくつかの実施形態で
は、SpyMacCas9ドメインはヌクレアーゼ活性SpyMacCas9、ヌクレアーゼ不活性SpyMacCas9
(SpyMacCas9d)、またはSpyMacCas9ニッカーゼ(SpyMacCas9n)である。いくつかの実施
形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非カノニカル
PAMを有する核酸配列に結合することができる。いくつかの実施形態では、SpyMacCas9ド
メイン、SpCas9dドメイン、またはSpCas9nドメインは、NAA PAM配列を有する核酸配列に
結合することができる。
例示的なSpyMacCas9
MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKFKVLGNTDRHSIKKNLIGALLFGSGETAEATRLKRTARRRYTRRKNRIC
YLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLADSTDKADLRLIYLALAH
MIKFRGHFLIEGDLNPDNSDVDKLFIQLVQIYNQLFEENPINASRVDAKAILSARLSKSRRLENLIAQLPGEKRNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNSEITKAPLSAS
MIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVT
VKQLKEDYFKKIECFDSVEISGVEDRFNASLGAYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDRGMIEERLKTYA
HLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGHSL
HEQIANLAGSPAIKKGILQTVKIVDELVKVMGHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPV
ENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFIKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKN
YWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSK
LVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSN
IMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEIQTVGQNGGLFDDNPKSPLEVT
PSKLVPLKKELNPKKYGGYQKPTTAYPVLLITDTKQLIPISVMNKKQFEQNPVKFLRDRGYQQVGKNDFIKLPKYTLVDI
GDGIKRLWASSKEIHKGNQLVVSKKSQILLYHAHHLDSDLSNDYLQNHNQQFDVLFNEIISFSKKCKLGKEHIQKIENVY
SNKKNSASIEELAESFIKLLGFTQLGATSPFNFLGVKLNQKQYKGKKDYILPCTEGTLIRQSITGLYETRVDLSKIGED.
【0230】
高忠実度Cas9ドメイン
本開示のいくつかの態様は高忠実度のCas9ドメインを提供する。いくつかの実施形態で
は、高忠実度のCas9ドメインは、対応する野生型Cas9ドメインと比較して、Cas9ドメイン
とDNAの糖-リン酸骨格との間の静電的相互作用を減少させる1つまたは複数の変異を含む
操作されたCas9ドメインである。いずれの特定の理論にも縛られることを望まれないが、
DNAの糖-リン酸骨格との静電的相互作用が減少した高忠実度のCas9ドメインは、より少な
いオフターゲット効果を有し得る。いくつかの実施形態では、Cas9ドメイン(たとえば野
生型Cas9ドメイン)は、Cas9ドメインとDNAの糖-リン酸骨格との間の会合を減少させる1
つまたは複数の変異を含む。いくつかの実施形態では、Cas9ドメインは、Cas9ドメインと
DNAの糖-リン酸骨格との間の会合を少なくとも1%、少なくとも2%、少なくとも3%、少なく
とも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%
、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少
なくとも55%、少なくとも60%、少なくとも65%、または少なくとも70%減少させる1つまた
は複数の変異を含む。
【0231】
いくつかの実施形態では、本明細書で提供するCas9融合タンパク質のいずれかは、N497
X、R661X、Q695X、および/またはQ926X変異の1つもしくは複数、または本明細書で提供す
るアミノ酸配列のいずれかにおける対応する変異を含み、ここでXは任意のアミノ酸であ
る。いくつかの実施形態では、本明細書で提供するCas9融合タンパク質のいずれも、N497
A、R661A、Q695A、および/またはQ926A変異の1つもしくは複数、または本明細書で提供す
るアミノ酸配列のいずれかにおける対応する変異を含む。いくつかの実施形態では、Cas9
ドメインはD10A変異、または本明細書で提供するアミノ酸配列のいずれかにおける対応す
る変異を含む。高忠実度のCas9ドメインは当技術で既知であり、当業者には明白になる。
たとえば、高忠実度のCas9ドメインは、それぞれの全ての内容が参照により本明細書に組
み込まれるKleinstiver, B.P., et al. “High-fidelity CRISPR-Cas9 nucleases with n
o detectable genome-wide off-target effects.” Nature529, 490-495 (2016); and Sl
aymaker, I.M., et al. “Rationally engineered Cas9 nucleases with improved speci
ficity.” Science351, 84-88 (2015)に記載されている。
Cas9に対する高忠実度のCas9ドメイン変異を、太字および下線で示す。
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRIC
YLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAH
MIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSAS
MIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTAFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVT
VKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYA
HLFDDKVMKQLKRRRYTGWGALSRKLINGIRDKQSGKTILDFLKSDGFANRNFMALIHDDSLTFKEDIQKAQVSGQGDSL
HEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMK
NYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRAITKHVAQILDSRMNTKYDENDKLIREVKVITLKS
KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYS
NIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLI
ARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRV
ILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRI
DLSQLGGD.
【0232】
いくつかの場合には、バリアントCas9タンパク質はH840A、P475A、W476A、N477A、D112
5A、W1126A、およびD1127Aの変異を有しており、したがってポリペプチドは標的DNAおよ
びRNAを開裂させる能力が低い。そのようなCas9タンパク質は標的DNA(たとえば一本鎖標
的DNA)を開裂させる能力が低いが、標的DNA(たとえば一本鎖標的DNA)と結合する能力
を保持している。別の非限定的な例として、いくつかの場合には、バリアントCas9タンパ
ク質はD10A、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1127Aの変異を有し
ており、したがってポリペプチドは標的DNAを開裂させる能力が低い。そのようなCas9タ
ンパク質は標的DNA(たとえば一本鎖標的DNA)を開裂させる能力が低いが、標的DNA(た
とえば一本鎖標的DNA)と結合する能力を保持している。いくつかの場合には、バリアン
トCas9タンパク質がW476AおよびW1126Aの変異を有している場合、またはバリアントCas9
タンパク質がP475A、W476A、N477A、D1125A、W1126A、およびD1127Aの変異を有している
場合には、バリアントCas9タンパク質は効率的にはPAM配列に結合しない。したがって、
そのようないくつかの場合には、結合の方法においてそのようなバリアントCas9タンパク
質を用いる際には、この方法はPAM配列を必要としない。換言すれば、いくつかの場合に
は、結合の方法においてそのようなバリアントCas9タンパク質を用いる際には、この方法
はガイドRNAを含ませることができるが、この方法はPAM配列の非存在下で実施することが
できる(したがって結合の特異性はガイドRNAの標的セグメントによって提供される)。
上述の効果を達成するために他の残基(即ち不活性残基または他のヌクレアーゼ部分)を
変異させることができる。非限定的な例として、残基D10、G12、G17、E762、H840、N854
、N863、H982、H983、A984、D986、および/またはA987を改変(即ち置換)することがで
きる。また、アラニン置換以外の変異が好適である。
【0233】
いくつかの実施形態では、塩基エディターのCRISPRタンパク質由来ドメインは、カノニ
カルPAM配列(NGG)を有するCas9タンパク質の全部または一部を含み得る。他の実施形態
では、塩基エディターのCas9誘導ドメインは、非カノニカルPAM配列を採用し得る。その
ような配列は当技術で既知であり、当業者には明白になる。たとえば、非カノニカルPAM
配列に結合するCas9ドメインは、それぞれの全ての内容が参照により本明細書に組み込ま
れるKleinstiver, B. P., et al., “Engineered CRISPR-Cas9 nucleases with altered
PAM specificities” Nature 523, 481-485 (2015); および Kleinstiver, B. P., et al
., “Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modi
fying PAM recognition” Nature Biotechnology 33, 1293-1298 (2015)に記載されてい
る。
【0234】
いくつかの例では、本明細書に開示した塩基エディターのCRISPRタンパク質由来ドメイ
ンによって認識されるPAMは、塩基エディターをコードするインサート(たとえばAAVイン
サート)とは別のオリゴヌクレオチド上で、細胞に提供され得る。そのような場合には、
個別のオリゴヌクレオチド上でPAMを提供することによって、そうでなければ標的配列と
同じポリヌクレオチド上に隣接するPAMが存在しないために開裂されない標的配列を、開
裂させることが可能になる。
【0235】
一実施形態では、ゲノム操作のためのCRISPRエンドヌクレアーゼとしてS. pyogenes Ca
s9(SpCas9)を用いることができる。しかし他を用いてもよい。いくつかの場合には、あ
る種のゲノム標的を標的とするために異なるエンドヌクレアーゼを用いることができる。
いくつかの場合には、非NGG PAM配列を有する合成のSpCas9誘導バリアントを用いること
ができる。さらに、種々の種からの他のCas9オーソログが同定されており、これらの「非
SpCas9」は、本開示に有用であり得る種々のPAM配列に結合することができる。たとえば
、比較的大きな寸法のSpCas9(ほぼ4kbのコーディング配列)は、細胞中で効率的には発
現できないSpCas9 cDNAを運搬するプラスミドをもたらし得る。逆に、Staphylococcus au
reusのCas9(SaCas9)のコーディング配列はSpCas9よりほぼ1キロベース短く、それによ
りおそらく細胞中で効率的に発現することが可能になる。SpCas9と同様に、SaCas9エンド
ヌクレアーゼは、哺乳類細胞中in vitroで、またはマウス中in vivoで、標的遺伝子を修
飾することができる。いくつかの場合には、Casタンパク質は異なるPAM配列を標的とする
ことができる。いくつかの場合には、標的遺伝子はCas9 PAMたとえば5'-NGGに隣接し得る
。他の場合には、他のCas9オーソログが異なるPAM要求性を有し得る。たとえばS. thermo
philus(CRISPR1について5'-NNAGAAおよびCRISPR3について5’-NGGNG)およびNeisseria me
ningiditis(5'-NNNNGATT)等のもののような他のPAMも、標的遺伝子に隣接して見出され得
る。
【0236】
いくつかの実施形態では、S. pyogenes系について、標的遺伝子配列は5'-NGG PAMに先
行し得(即ち、その5'-にあり得)、20ntのガイドRNA配列が対向する鎖と塩基対を形成し
て、PAMに隣接するCas9開裂を媒介し得る。いくつかの場合には、隣接する切断はPAMのお
よそ3塩基対上流であり得る。いくつかの場合には、隣接する切断はPAMのおよそ10塩基対
上流であり得る。いくつかの例では、隣接する切断はPAMのおよそ0~20塩基対上流であり
得る。たとえば、隣接する切断はPAMの1、2、3、4、5、6、7、8、9、10、11、12、13、14
、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29または30塩基対上流の
隣であり得る。隣接する切断はPAMの1~30塩基対下流であってもよい。
核局在化配列(NLS)を含む融合タンパク質
いくつかの実施形態では、本明細書で提供する融合タンパク質は、1つまたは複数の(
たとえば2、3、4、5個の)核標的配列、たとえば核局在化配列(NLS)をさらに含む。一
実施形態では、2成分NLSが用いられる。いくつかの実施形態では、NLSは、NLSを含むタン
パク質を細胞核の中に(たとえば核輸送によって)インポートすることを促進するアミノ
酸配列を含む。いくつかの実施形態では、本明細書で提供する融合タンパク質のいずれも
、核局在化配列(NLS)をさらに含む。いくつかの実施形態では、NLSは融合タンパク質の
N末端に融合している。いくつかの実施形態では、NLSは融合タンパク質のC末端に融合し
ている。いくつかの実施形態では、NLSはCas9ドメインのN末端に融合している。いくつか
の実施形態では、NLSはnCas9ドメインまたはdCas9ドメインのC末端に融合している。いく
つかの実施形態では、NLSはデアミナーゼのN末端に融合している。いくつかの実施形態で
は、NLSはデアミナーゼのC末端に融合している。いくつかの実施形態では、NLSは1つまた
は複数のリンカーを介して融合タンパク質に融合している。いくつかの実施形態では、NL
Sはリンカーなしで融合タンパク質に融合している。いくつかの実施形態では、NLSは本明
細書で提供しまたは参照するNLS配列のいずれか1つのアミノ酸配列を含む。さらなる核局
在化配列は当技術で既知であり、当業者には明白になる。たとえば、NLS配列は、例示的
な核局在化配列の開示についてその内容が参照により本明細書に組み込まれるPlankらのP
CT/EP2000/011690に記載されている。いくつかの実施形態では、NLSはアミノ酸配列PKKKR
KVEGADKRTADGSEFES PKKKRKV、KRTADGSEFESPKKKRKV、KRPAATKKAGQAKKKK、KKTELQTTNAENKTK
KL、KRGINDRNFWRGENGRKTR、RKSGKIAAIVVKRPRKPKKKRKV、またはMDSLLMNRRKFLYQFKNVRWAKGR
RETYLCを含む。いくつかの実施形態では、NLSはリンカーの中に存在し、またはNLSはリン
カー、たとえば本明細書に記載したリンカーの傍に位置している。いくつかの実施形態で
は、N末端またはC末端のNLSは2成分NLSである。2成分NLSは2つの塩基性アミノ酸クラスタ
ーを含み、これらは比較的短いスペーサー配列で分離されている(したがって2成分-2つ
の部分。1成分NLSはそうでない)。核質のNLS、KR[PAATKKAGQA]KKKKは遍在する2成分シグ
ナルのプロトタイプであり、約10アミノ酸のスペーサーによって分離された塩基性アミノ
酸の2つのクラスターである。例示的な2成分NLSの配列は以下の通りである。PKKKRKVEGAD
KRTADGSEFES PKKKRKV
【0237】
いくつかの実施形態では、本発明の融合タンパク質はリンカー配列を含まない。いくつ
かの実施形態では、ドメインまたはタンパク質の1つまたは複数の間のリンカー配列が存
在する。
【0238】
本開示の融合タンパク質は1つまたは複数のさらなる特徴を含み得ることを認識された
い。たとえば、いくつかの実施形態では、融合タンパク質は、阻害剤、細胞質内局在化配
列、核エクスポート配列等のエクスポート配列、またはその他の局在化配列、ならびに融
合タンパク質の可溶化、精製、もしくは検出のために有用な配列タグを含んでよい。本明
細書で提供する好適なタンパク質タグには、それだけに限らないが、ビオチンカルボキシ
ラーゼキャリアタンパク質(BCCP)タグ、mycタグ、カルモジュリンタグ、FLAGタグ、ヘ
マグルチニン(HA)タグ、ヒスチジンタグもしくはHisタグとも称されるポリヒスチジン
タグ、マルトース結合タンパク質(MBP)タグ、nusタグ、グルタチオン-S-トランスフェ
ラーゼ(GST)タグ、緑色蛍光タンパク質(GFP)タグ、チオレドキシンタグ、Sタグ、ソ
フタグ(Softag)(たとえばソフタグ1、ソフタグ3)、ストレップタグ、ビオチンリガーゼ
タグ、F1AsHタグ、V5タグ、およびSBPタグが含まれる。さらなる好適な配列は当業者には
明白になる。いくつかの実施形態では、融合タンパク質は1つまたは複数のHisタグを含む
。
【0239】
1つまたは複数の核局在化配列(NLS)を含むCRISPR酵素をコードするベクターを用いる
ことができる。たとえば、およそ1、2、3、4、5、6、7、8、9、10個のNLSを用いることが
できる。CRISPR酵素は、アミノ末端もしくはその付近にNLSを、カルボキシ末端もしくは
その付近におよそ1、2、3、4、5、6、7、8、9、10個もしくはそれを超えるNLSを、または
これらの任意の組合せ(たとえばアミノ末端に1つもしくは複数のNLSおよびカルボキシ末
端に1つもしくは複数のNLS)を含み得る。2つ以上のNLSが存在する場合には、それぞれは
他から独立に選択することができ、したがって単一のNLSが、2つ以上のコピーの中に、お
よび/または1つもしくは複数のコピーの中に存在する1つもしくは複数の他のNLSと組み合
わせて、存在し得る。
【0240】
本方法で用いられるCRISPR酵素は、約6個のNLSを含み得る。NLSに最も近いアミノ酸がN
末端またはC末端からポリペプチド鎖に沿って約50アミノ酸以内、たとえば1、2、3、4、5
、10、15、20、25、30、40、または50アミノ酸以内にある場合には、NLSはN末端またはC
末端に近接していると考えられる。
【0241】
PAM配列は当技術で既知の任意のPAM配列であってよい。好適なPAM配列には、それだけ
に限らないが、NGG、NGA、NGC、NGN、NGT、NGCG、NGAG、NGAN、NGNG、NGCN、NGCG、NGTN
、NNGRRT、NNNRRT、NNGRR(N)、TTTV、TYCV、TYCV、TATV、NNNNGATT、NNAGAAW、またはNAA
AACが含まれる。Yはピリミジン、Nは任意のヌクレオチド塩基、WはAまたはTである。
【0242】
排他性が低減されたCas9ドメイン
典型的には、S. pyogenesのCas9(spCas9)等のCas9タンパク質は、特定の核酸領域に
結合するためにカノニカルNGG PAM配列を必要とする。ここで「NGG」における「N」はア
デノシン(A)、チミジン(T)、またはシトシン(C)であり、Gはグアノシンである。これ
は、ゲノムの中の所望の塩基を編集する能力を制限し得る。いくつかの実施形態では、本
明細書で提供する融合タンパク質を編集する塩基は正確な位置、たとえばPAMの上流であ
る標的塩基を含む領域に設置する必要がある。たとえばその全体の内容が参照により本明
細書に組み込まれるKomor, A.C., et al., “Programmable editing of a target base i
n genomic DNA without double-stranded DNA cleavage” Nature533, 420-424 (2016)を
参照されたい。したがって、いくつかの実施形態では、本明細書で提供する融合タンパク
質のいずれも、カノニカル(たとえばNGG)PAM配列を含まないヌクレオチド配列に結合す
ることができるCas9ドメインを含み得る。非カノニカルPAM配列に結合するCas9ドメイン
は当技術において記載されており、当業者には明白になる。たとえば、非カノニカルPAM
配列に結合するCas9ドメインは、それぞれの全ての内容が参照により本明細書に組み込ま
れるKleinstiver, B. P., et al., “Engineered CRISPR-Cas9 nucleases with altered
PAM specificities” Nature523, 481-485 (2015); and Kleinstiver, B. P., et al.,
“Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifyi
ng PAM recognition” Nature Biotechnology 33, 1293-1298 (2015); Nishimasu, H., e
t al., “Engineered CRISPR-Cas9 nuclease with expanded targeting space” Science
. 2018 Sep 21;361(6408):1259-1262, Chatterjee, P., et al., Minimal PAM specifici
ty of a highly similar SpCas9 ortholog” Sci Adv. 2018 Oct 24;4(10):eaau0766. do
i: 10.1126/sciadv.aau0766に記載されている。いくつかのPAMバリアントを下の表1に記
載する。
表1.Cas9タンパク質および対応するPAM配列
【表1】
【0243】
核酸塩基編集ドメイン
ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび核酸塩基編集ドメ
イン(たとえばデアミナーゼドメイン)を含む融合タンパク質を含む塩基エディターを本
明細書に記載する。塩基エディターは、標的配列を認識することができるガイドポリヌク
レオチドと相互作用させることによって、標的ポリヌクレオチド配列中の1つまたは複数
の塩基を編集するようにプログラムすることができる。いったん標的配列が認識されれば
、塩基エディターは、編集が起こるところのポリヌクレオチドに固定され、次いで塩基エ
ディターのデアミナーゼドメイン成分が標的塩基を編集することができる。
【0244】
いくつかの実施形態では、核酸塩基編集ドメインはデアミナーゼドメインである。いく
つかの場合には、デアミナーゼドメインはシトシンデアミナーゼまたはシチジンデアミナ
ーゼであり得る。いくつかの実施形態では、用語「シトシンデアミナーゼ」および「シチ
ジンデアミナーゼ」は相互交換可能に用いることができる。いくつかの場合には、デアミ
ナーゼドメインはアデニンデアミナーゼまたはアデノシンデアミナーゼであり得る。いく
つかの実施形態では、用語「アデニンデアミナーゼ」および「アデノシンデアミナーゼ」
は相互交換可能に用いることができる。核酸塩基編集タンパク質の詳細は、それぞれが参
照により全体として本明細書に組み込まれる国際PCT出願PCT/2017/045381 (WO 2018/0270
78)およびPCT/US2016/058344 (WO 2017/070632)に記載されている。またその全体の内容
が参照により本明細書に組み込まれるKomor, A.C., et al., “Programmable editing of
a target base in genomic DNA without double-stranded DNA cleavage” Nature 533,
420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to
G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); および K
omor, A.C., et al., “Improved base excision repair inhibition and bacteriophage
Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and produc
t purity” Science Advances 3:eaao4774 (2017)を参照されたい。
【0245】
CからTへの編集
いくつかの実施形態では、本明細書で開示する塩基エディターは、ポリヌクレオチドの
標的シチジン(C)塩基を脱アミノ化して、チミンと塩基対を形成する特性を有するウリ
ジン(U)を生成することができるシチジンデアミナーゼを含む融合タンパク質を含む。
いくつかの実施形態では、たとえばポリヌクレオチドが二本鎖(たとえばDNA)である場
合には、次にウリジン塩基をチミジン塩基に(たとえば細胞修復装置によって)置換して
C:GからT:Aへの遷移を生じさせることができる。他の実施形態では、塩基エディターによ
る核酸中のCからUへの脱アミノ化は、UからTへの置換を伴うことができない。
【0246】
ポリヌクレオチド中の標的CのUを生じる脱アミノ化は、本明細書に記載した塩基エディ
ターによって実施することができる塩基編集のタイプの非限定的な例である。別の例では
、シチジンデアミナーゼドメインを含む塩基エディターは、シトシン(C)塩基のグアニ
ン(G)塩基への変換を媒介することができる。たとえば、塩基エディターのシチジンデア
ミナーゼドメインによるシチジンの脱アミノ化によって生成するポリヌクレオチドのUは
、(たとえばウラシルDNAグリコシラーゼ(UDG)ドメインによる)塩基切除修復機構によ
ってポリヌクレオチドから切除することができ、非塩基部位が生成する。非塩基部位に対
向する核酸塩基は次にたとえばトランスリージョンポリメラーゼによってC等の別の塩基
に(たとえば塩基修復装置によって)置換され得る。非塩基部位に対向する核酸塩基がC
で置き換えられることは典型的であるが、他の置換(たとえばA、G、またはT)も起こり
得る。
【0247】
したがって、いくつかの実施形態では、本明細書に記載した塩基エディターは、ポリヌ
クレオチド中の標的CをUに脱アミノ化することができる脱アミノ化ドメイン(たとえばシ
チジンデアミナーゼドメイン)を含む。さらに、以下に述べるように、塩基エディターは
、脱アミノ化に起因するUをいくつかの実施形態でTまたはGに変換することを促進するさ
らなるドメインを含み得る。たとえば、シチジンデアミナーゼドメインを含む塩基エディ
ターは、TによるUの置換を媒介し、CからTへの塩基編集事象を完了させるウラシルグリコ
シラーゼ阻害剤(UGI)ドメインをさらに含み得る。別の例では、トランスリージョンポ
リメラーゼが非塩基部位に対向するCの組み込みを促進する(即ち、非塩基部位でのGの組
み込みをもたらし、CからGへの塩基編集事象を完了させる)ことができるので、塩基エデ
ィターはトランスリージョンポリメラーゼを組み込んでCからGへの塩基編集の効率を改善
することができる。
【0248】
ドメインとしてシチジンデアミナーゼを含む塩基エディターは、DNA、RNA、およびDNA-
RNAハイブリッドを含む任意のポリヌクレオチドの中の標的のCを脱アミノ化することがで
きる。典型的には、シチジンデアミナーゼは、ポリヌクレオチドの一本鎖部分に関連して
位置するC核酸塩基を触媒する。いくつかの実施形態では、標的のCを含む全体のポリヌク
レオチドは一本鎖であり得る。たとえば、塩基エディターに組み込まれたシチジンデアミ
ナーゼは、一本鎖RNAポリヌクレオチド中の標的のCを脱アミノ化することができる。他の
実施形態では、シチジンデアミナーゼドメインを含む塩基エディターは二本鎖ポリヌクレ
オチドの上で作用することができるが、標的のCは脱アミノ化反応のときに一本鎖の状態
にあるポリヌクレオチドの一部に位置することができる。たとえば、NAGPBドメインがCas
9ドメインを含む実施形態では、Cas9-gRNA-標的DNAの複合体の形成の間にいくつかのヌク
レオチドが塩基対を形成せずに残り、Cas9「R-ループ複合体」の形成をもたらすことがで
きる。塩基対を形成しないこれらのヌクレオチドは一本鎖DNAのバブルを形成し、これが
一本鎖特異的ヌクレオチドデアミナーゼ酵素(たとえばシチジンデアミナーゼ)の基質と
して働くことができる。
【0249】
いくつかの実施形態では、塩基エディターのシチジンデアミナーゼは、アポリポタンパ
ク質B mRNA編集複合体(APOBEC)ファミリーのデアミナーゼの全部または一部を含み得る
。アポリポタンパク質B mRNA編集酵素、触媒性ポリペプチド様(APOBEC)は、進化的に保
存されたシチジンデアミナーゼのファミリーである。このファミリーのメンバーはCからU
への編集酵素である。APOBEC様タンパク質のN末端ドメインは触媒性ドメインであり、一
方C末端ドメインは疑似触媒性ドメインである。より具体的には、触媒性ドメインは亜鉛
依存性シチジンデアミナーゼドメインであり、シチジン脱アミノ化に重要である。APOBEC
ファミリーメンバーには、APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D
(現在「APOBEC3E」はこれを意味する)、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4、およ
び活性化誘起(シチジン)デアミナーゼが含まれる。いくつかの修飾されたシチジンデア
ミナーゼが市販されており、それだけに限らないが、SaBE3、SaKKH-BE3、VQR-BE3、EQR-B
E3、VRER-BE3、YE1-BE3、EE-BE3、YE2-BE3、およびYEE-BE3が含まれ、これらはAddgene社
から入手可能である(プラスミド85169、85170、85171、85172、85173、85174、85175、8
5176、85177)。いくつかの実施形態では、塩基エディターに組み込まれたデアミナーゼ
はAPOBEC1デアミナーゼの全部または一部を含む。いくつかの実施形態では、塩基エディ
ターに組み込まれたデアミナーゼはAPOBEC2デアミナーゼの全部または一部を含む。いく
つかの実施形態では、塩基エディターに組み込まれたデアミナーゼはAPOBEC3デアミナー
ゼの全部または一部を含む。いくつかの実施形態では、塩基エディターに組み込まれたデ
アミナーゼはAPOBEC3Aデアミナーゼの全部または一部を含む。いくつかの実施形態では、
塩基エディターに組み込まれたデアミナーゼはAPOBEC3Bデアミナーゼの全部または一部を
含む。いくつかの実施形態では、塩基エディターに組み込まれたデアミナーゼはAPOBEC3C
デアミナーゼの全部または一部を含む。いくつかの実施形態では、塩基エディターに組み
込まれたデアミナーゼはAPOBEC3Dデアミナーゼの全部または一部を含む。いくつかの実施
形態では、塩基エディターに組み込まれたデアミナーゼはAPOBEC3Eデアミナーゼの全部ま
たは一部を含む。いくつかの実施形態では、塩基エディターに組み込まれたデアミナーゼ
はAPOBEC3Fデアミナーゼの全部または一部を含む。いくつかの実施形態では、塩基エディ
ターに組み込まれたデアミナーゼはAPOBEC3Gデアミナーゼの全部または一部を含む。いく
つかの実施形態では、塩基エディターに組み込まれたデアミナーゼはAPOBEC3Hデアミナー
ゼの全部または一部を含む。いくつかの実施形態では、塩基エディターに組み込まれたデ
アミナーゼはAPOBEC4デアミナーゼの全部または一部を含む。いくつかの実施形態では、
塩基エディターに組み込まれたデアミナーゼは活性化誘起デアミナーゼ(AID)の全部ま
たは一部を含む。
【0250】
いくつかの実施形態では、塩基エディターに組み込まれたデアミナーゼはシチジンデア
ミナーゼ1(CDA1)の全部または一部を含む。塩基エディターは任意の好適な生命体(た
とえばヒトまたはラット)のデアミナーゼを含み得ることが認識される。いくつかの実施
形態では、塩基エディターのデアミナーゼドメインはヒト、チンパンジー、ゴリラ、サル
、ウシ、イヌ、ラット、またはマウスからのものである。いくつかの実施形態では、塩基
エディターのデアミナーゼドメインはラットから誘導される(たとえばラットAPOBEC1)
。いくつかの実施形態では、塩基エディターのデアミナーゼドメインはヒトAPOBEC1であ
る。いくつかの実施形態では、塩基エディターのデアミナーゼドメインはpmCDA1である。
【0251】
PmCDA1の塩基配列およびアミノ酸配列、ならびにヒトAIDのCDSの塩基配列およびアミノ
酸配列を以下に示す。
【0252】
>tr|A5H718|A5H718_PETMA Cytosine deaminase OS=Petromyzon marinus OX=7757 PE=2 SV
=1
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSG
TERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLK
IWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKT
LKRAEKRRSELSIMIQVKILHTTKSPAV
>EF094822.1 Petromyzon marinus isolate PmCDA.21 cytosine deaminase mRNA, complet
e cds
TGACACGACACAGCCGTGTATATGAGGAAGGGTAGCTGGATGGGGGGGGGGGGAATACGTTCAGAGAGGA
CATTAGCGAGCGTCTTGTTGGTGGCCTTGAGTCTAGACACCTGCAGACATGACCGACGCTGAGTACGTGA
GAATCCATGAGAAGTTGGACATCTACACGTTTAAGAAACAGTTTTTCAACAACAAAAAATCCGTGTCGCA
TAGATGCTACGTTCTCTTTGAATTAAAACGACGGGGTGAACGTAGAGCGTGTTTTTGGGGCTATGCTGTG
AATAAACCACAGAGCGGGACAGAACGTGGAATTCACGCCGAAATCTTTAGCATTAGAAAAGTCGAAGAAT
ACCTGCGCGACAACCCCGGACAATTCACGATAAATTGGTACTCATCCTGGAGTCCTTGTGCAGATTGCGC
TGAAAAGATCTTAGAATGGTATAACCAGGAGCTGCGGGGGAACGGCCACACTTTGAAAATCTGGGCTTGC
AAACTCTATTACGAGAAAAATGCGAGGAATCAAATTGGGCTGTGGAACCTCAGAGATAACGGGGTTGGGT
TGAATGTAATGGTAAGTGAACACTACCAATGTTGCAGGAAAATATTCATCCAATCGTCGCACAATCAATT
GAATGAGAATAGATGGCTTGAGAAGACTTTGAAGCGAGCTGAAAAACGACGGAGCGAGTTGTCCATTATG
ATTCAGGTAAAAATACTCCACACCACTAAGAGTCCTGCTGTTTAAGAGGCTATGCGGATGGTTTTC
>tr|Q6QJ80|Q6QJ80_HUMAN Activation-induced cytidine deaminase OS=Homo sapiens OX
=9606 GN=AICDA PE=2 SV=1
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELL
FLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRK
AEPEGLRRLHRAGVQIAIMTFKAPV
>NG_011588.1:5001-15681 Homo sapiens activation induced cytidine deaminase (AICD
A), RefSeqGene (LRG_17) on chromosome 12
AGAGAACCATCATTAATTGAAGTGAGATTTTTCTGGCCTGAGACTTGCAGGGAGGCAAGAAGACACTCTG
GACACCACTATGGACAGGTAAAGAGGCAGTCTTCTCGTGGGTGATTGCACTGGCCTTCCTCTCAGAGCAA
ATCTGAGTAATGAGACTGGTAGCTATCCCTTTCTCTCATGTAACTGTCTGACTGATAAGATCAGCTTGAT
CAATATGCATATATATTTTTTGATCTGTCTCCTTTTCTTCTATTCAGATCTTATACGCTGTCAGCCCAAT
TCTTTCTGTTTCAGACTTCTCTTGATTTCCCTCTTTTTCATGTGGCAAAAGAAGTAGTGCGTACAATGTA
CTGATTCGTCCTGAGATTTGTACCATGGTTGAAACTAATTTATGGTAATAATATTAACATAGCAAATCTT
TAGAGACTCAAATCATGAAAAGGTAATAGCAGTACTGTACTAAAAACGGTAGTGCTAATTTTCGTAATAA
TTTTGTAAATATTCAACAGTAAAACAACTTGAAGACACACTTTCCTAGGGAGGCGTTACTGAAATAATTT
AGCTATAGTAAGAAAATTTGTAATTTTAGAAATGCCAAGCATTCTAAATTAATTGCTTGAAAGTCACTAT
GATTGTGTCCATTATAAGGAGACAAATTCATTCAAGCAAGTTATTTAATGTTAAAGGCCCAATTGTTAGG
CAGTTAATGGCACTTTTACTATTAACTAATCTTTCCATTTGTTCAGACGTAGCTTAACTTACCTCTTAGG
TGTGAATTTGGTTAAGGTCCTCATAATGTCTTTATGTGCAGTTTTTGATAGGTTATTGTCATAGAACTTA
TTCTATTCCTACATTTATGATTACTATGGATGTATGAGAATAACACCTAATCCTTATACTTTACCTCAAT
TTAACTCCTTTATAAAGAACTTACATTACAGAATAAAGATTTTTTAAAAATATATTTTTTTGTAGAGACA
GGGTCTTAGCCCAGCCGAGGCTGGTCTCTAAGTCCTGGCCCAAGCGATCCTCCTGCCTGGGCCTCCTAAA
GTGCTGGAATTATAGACATGAGCCATCACATCCAATATACAGAATAAAGATTTTTAATGGAGGATTTAAT
GTTCTTCAGAAAATTTTCTTGAGGTCAGACAATGTCAAATGTCTCCTCAGTTTACACTGAGATTTTGAAA
ACAAGTCTGAGCTATAGGTCCTTGTGAAGGGTCCATTGGAAATACTTGTTCAAAGTAAAATGGAAAGCAA
AGGTAAAATCAGCAGTTGAAATTCAGAGAAAGACAGAAAAGGAGAAAAGATGAAATTCAACAGGACAGAA
GGGAAATATATTATCATTAAGGAGGACAGTATCTGTAGAGCTCATTAGTGATGGCAAAATGACTTGGTCA
GGATTATTTTTAACCCGCTTGTTTCTGGTTTGCACGGCTGGGGATGCAGCTAGGGTTCTGCCTCAGGGAG
CACAGCTGTCCAGAGCAGCTGTCAGCCTGCAAGCCTGAAACACTCCCTCGGTAAAGTCCTTCCTACTCAG
GACAGAAATGACGAGAACAGGGAGCTGGAAACAGGCCCCTAACCAGAGAAGGGAAGTAATGGATCAACAA
AGTTAACTAGCAGGTCAGGATCACGCAATTCATTTCACTCTGACTGGTAACATGTGACAGAAACAGTGTA
GGCTTATTGTATTTTCATGTAGAGTAGGACCCAAAAATCCACCCAAAGTCCTTTATCTATGCCACATCCT
TCTTATCTATACTTCCAGGACACTTTTTCTTCCTTATGATAAGGCTCTCTCTCTCTCCACACACACACAC
ACACACACACACACACACACACACACACACACAAACACACACCCCGCCAACCAAGGTGCATGTAAAAAGA
TGTAGATTCCTCTGCCTTTCTCATCTACACAGCCCAGGAGGGTAAGTTAATATAAGAGGGATTTATTGGT
AAGAGATGATGCTTAATCTGTTTAACACTGGGCCTCAAAGAGAGAATTTCTTTTCTTCTGTACTTATTAA
GCACCTATTATGTGTTGAGCTTATATATACAAAGGGTTATTATATGCTAATATAGTAATAGTAATGGTGG
TTGGTACTATGGTAATTACCATAAAAATTATTATCCTTTTAAAATAAAGCTAATTATTATTGGATCTTTT
TTAGTATTCATTTTATGTTTTTTATGTTTTTGATTTTTTAAAAGACAATCTCACCCTGTTACCCAGGCTG
GAGTGCAGTGGTGCAATCATAGCTTTCTGCAGTCTTGAACTCCTGGGCTCAAGCAATCCTCCTGCCTTGG
CCTCCCAAAGTGTTGGGATACAGTCATGAGCCACTGCATCTGGCCTAGGATCCATTTAGATTAAAATATG
CATTTTAAATTTTAAAATAATATGGCTAATTTTTACCTTATGTAATGTGTATACTGGCAATAAATCTAGT
TTGCTGCCTAAAGTTTAAAGTGCTTTCCAGTAAGCTTCATGTACGTGAGGGGAGACATTTAAAGTGAAAC
AGACAGCCAGGTGTGGTGGCTCACGCCTGTAATCCCAGCACTCTGGGAGGCTGAGGTGGGTGGATCGCTT
GAGCCCTGGAGTTCAAGACCAGCCTGAGCAACATGGCAAAACGCTGTTTCTATAACAAAAATTAGCCGGG
CATGGTGGCATGTGCCTGTGGTCCCAGCTACTAGGGGGCTGAGGCAGGAGAATCGTTGGAGCCCAGGAGG
TCAAGGCTGCACTGAGCAGTGCTTGCGCCACTGCACTCCAGCCTGGGTGACAGGACCAGACCTTGCCTCA
AAAAAATAAGAAGAAAAATTAAAAATAAATGGAAACAACTACAAAGAGCTGTTGTCCTAGATGAGCTACT
TAGTTAGGCTGATATTTTGGTATTTAACTTTTAAAGTCAGGGTCTGTCACCTGCACTACATTATTAAAAT
ATCAATTCTCAATGTATATCCACACAAAGACTGGTACGTGAATGTTCATAGTACCTTTATTCACAAAACC
CCAAAGTAGAGACTATCCAAATATCCATCAACAAGTGAACAAATAAACAAAATGTGCTATATCCATGCAA
TGGAATACCACCCTGCAGTACAAAGAAGCTACTTGGGGATGAATCCCAAAGTCATGACGCTAAATGAAAG
AGTCAGACATGAAGGAGGAGATAATGTATGCCATACGAAATTCTAGAAAATGAAAGTAACTTATAGTTAC
AGAAAGCAAATCAGGGCAGGCATAGAGGCTCACACCTGTAATCCCAGCACTTTGAGAGGCCACGTGGGAA
GATTGCTAGAACTCAGGAGTTCAAGACCAGCCTGGGCAACACAGTGAAACTCCATTCTCCACAAAAATGG
GAAAAAAAGAAAGCAAATCAGTGGTTGTCCTGTGGGGAGGGGAAGGACTGCAAAGAGGGAAGAAGCTCTG
GTGGGGTGAGGGTGGTGATTCAGGTTCTGTATCCTGACTGTGGTAGCAGTTTGGGGTGTTTACATCCAAA
AATATTCGTAGAATTATGCATCTTAAATGGGTGGAGTTTACTGTATGTAAATTATACCTCAATGTAAGAA
AAAATAATGTGTAAGAAAACTTTCAATTCTCTTGCCAGCAAACGTTATTCAAATTCCTGAGCCCTTTACT
TCGCAAATTCTCTGCACTTCTGCCCCGTACCATTAGGTGACAGCACTAGCTCCACAAATTGGATAAATGC
ATTTCTGGAAAAGACTAGGGACAAAATCCAGGCATCACTTGTGCTTTCATATCAACCATGCTGTACAGCT
TGTGTTGCTGTCTGCAGCTGCAATGGGGACTCTTGATTTCTTTAAGGAAACTTGGGTTACCAGAGTATTT
CCACAAATGCTATTCAAATTAGTGCTTATGATATGCAAGACACTGTGCTAGGAGCCAGAAAACAAAGAGG
AGGAGAAATCAGTCATTATGTGGGAACAACATAGCAAGATATTTAGATCATTTTGACTAGTTAAAAAAGC
AGCAGAGTACAAAATCACACATGCAATCAGTATAATCCAAATCATGTAAATATGTGCCTGTAGAAAGACT
AGAGGAATAAACACAAGAATCTTAACAGTCATTGTCATTAGACACTAAGTCTAATTATTATTATTAGACA
CTATGATATTTGAGATTTAAAAAATCTTTAATATTTTAAAATTTAGAGCTCTTCTATTTTTCCATAGTAT
TCAAGTTTGACAATGATCAAGTATTACTCTTTCTTTTTTTTTTTTTTTTTTTTTTTTTGAGATGGAGTTT
TGGTCTTGTTGCCCATGCTGGAGTGGAATGGCATGACCATAGCTCACTGCAACCTCCACCTCCTGGGTTC
AAGCAAAGCTGTCGCCTCAGCCTCCCGGGTAGATGGGATTACAGGCGCCCACCACCACACTCGGCTAATG
TTTGTATTTTTAGTAGAGATGGGGTTTCACCATGTTGGCCAGGCTGGTCTCAAACTCCTGACCTCAGAGG
ATCCACCTGCCTCAGCCTCCCAAAGTGCTGGGATTACAGATGTAGGCCACTGCGCCCGGCCAAGTATTGC
TCTTATACATTAAAAAACAGGTGTGAGCCACTGCGCCCAGCCAGGTATTGCTCTTATACATTAAAAAATA
GGCCGGTGCAGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAAGCCAAGGCGGGCAGAACACCCGAGGT
CAGGAGTCCAAGGCCAGCCTGGCCAAGATGGTGAAACCCCGTCTCTATTAAAAATACAAACATTACCTGG
GCATGATGGTGGGCGCCTGTAATCCCAGCTACTCAGGAGGCTGAGGCAGGAGGATCCGCGGAGCCTGGCA
GATCTGCCTGAGCCTGGGAGGTTGAGGCTACAGTAAGCCAAGATCATGCCAGTATACTTCAGCCTGGGCG
ACAAAGTGAGACCGTAACAAAAAAAAAAAAATTTAAAAAAAGAAATTTAGATCAAGATCCAACTGTAAAA
AGTGGCCTAAACACCACATTAAAGAGTTTGGAGTTTATTCTGCAGGCAGAAGAGAACCATCAGGGGGTCT
TCAGCATGGGAATGGCATGGTGCACCTGGTTTTTGTGAGATCATGGTGGTGACAGTGTGGGGAATGTTAT
TTTGGAGGGACTGGAGGCAGACAGACCGGTTAAAAGGCCAGCACAACAGATAAGGAGGAAGAAGATGAGG
GCTTGGACCGAAGCAGAGAAGAGCAAACAGGGAAGGTACAAATTCAAGAAATATTGGGGGGTTTGAATCA
ACACATTTAGATGATTAATTAAATATGAGGACTGAGGAATAAGAAATGAGTCAAGGATGGTTCCAGGCTG
CTAGGCTGCTTACCTGAGGTGGCAAAGTCGGGAGGAGTGGCAGTTTAGGACAGGGGGCAGTTGAGGAATA
TTGTTTTGATCATTTTGAGTTTGAGGTACAAGTTGGACACTTAGGTAAAGACTGGAGGGGAAATCTGAAT
ATACAATTATGGGACTGAGGAACAAGTTTATTTTATTTTTTGTTTCGTTTTCTTGTTGAAGAACAAATTT
AATTGTAATCCCAAGTCATCAGCATCTAGAAGACAGTGGCAGGAGGTGACTGTCTTGTGGGTAAGGGTTT
GGGGTCCTTGATGAGTATCTCTCAATTGGCCTTAAATATAAGCAGGAAAAGGAGTTTATGATGGATTCCA
GGCTCAGCAGGGCTCAGGAGGGCTCAGGCAGCCAGCAGAGGAAGTCAGAGCATCTTCTTTGGTTTAGCCC
AAGTAATGACTTCCTTAAAAAGCTGAAGGAAAATCCAGAGTGACCAGATTATAAACTGTACTCTTGCATT
TTCTCTCCCTCCTCTCACCCACAGCCTCTTGATGAACCGGAGGAAGTTTCTTTACCAATTCAAAAATGTC
CGCTGGGCTAAGGGTCGGCGTGAGACCTACCTGTGCTACGTAGTGAAGAGGCGTGACAGTGCTACATCCT
TTTCACTGGACTTTGGTTATCTTCGCAATAAGGTATCAATTAAAGTCGGCTTTGCAAGCAGTTTAATGGT
CAACTGTGAGTGCTTTTAGAGCCACCTGCTGATGGTATTACTTCCATCCTTTTTTGGCATTTGTGTCTCT
ATCACATTCCTCAAATCCTTTTTTTTATTTCTTTTTCCATGTCCATGCACCCATATTAGACATGGCCCAA
AATATGTGATTTAATTCCTCCCCAGTAATGCTGGGCACCCTAATACCACTCCTTCCTTCAGTGCCAAGAA
CAACTGCTCCCAAACTGTTTACCAGCTTTCCTCAGCATCTGAATTGCCTTTGAGATTAATTAAGCTAAAA
GCATTTTTATATGGGAGAATATTATCAGCTTGTCCAAGCAAAAATTTTAAATGTGAAAAACAAATTGTGT
CTTAAGCATTTTTGAAAATTAAGGAAGAAGAATTTGGGAAAAAATTAACGGTGGCTCAATTCTGTCTTCC
AAATGATTTCTTTTCCCTCCTACTCACATGGGTCGTAGGCCAGTGAATACATTCAACATGGTGATCCCCA
GAAAACTCAGAGAAGCCTCGGCTGATGATTAATTAAATTGATCTTTCGGCTACCCGAGAGAATTACATTT
CCAAGAGACTTCTTCACCAAAATCCAGATGGGTTTACATAAACTTCTGCCCACGGGTATCTCCTCTCTCC
TAACACGCTGTGACGTCTGGGCTTGGTGGAATCTCAGGGAAGCATCCGTGGGGTGGAAGGTCATCGTCTG
GCTCGTTGTTTGATGGTTATATTACCATGCAATTTTCTTTGCCTACATTTGTATTGAATACATCCCAATC
TCCTTCCTATTCGGTGACATGACACATTCTATTTCAGAAGGCTTTGATTTTATCAAGCACTTTCATTTAC
TTCTCATGGCAGTGCCTATTACTTCTCTTACAATACCCATCTGTCTGCTTTACCAAAATCTATTTCCCCT
TTTCAGATCCTCCCAAATGGTCCTCATAAACTGTCCTGCCTCCACCTAGTGGTCCAGGTATATTTCCACA
ATGTTACATCAACAGGCACTTCTAGCCATTTTCCTTCTCAAAAGGTGCAAAAAGCAACTTCATAAACACA
AATTAAATCTTCGGTGAGGTAGTGTGATGCTGCTTCCTCCCAACTCAGCGCACTTCGTCTTCCTCATTCC
ACAAAAACCCATAGCCTTCCTTCACTCTGCAGGACTAGTGCTGCCAAGGGTTCAGCTCTACCTACTGGTG
TGCTCTTTTGAGCAAGTTGCTTAGCCTCTCTGTAACACAAGGACAATAGCTGCAAGCATCCCCAAAGATC
ATTGCAGGAGACAATGACTAAGGCTACCAGAGCCGCAATAAAAGTCAGTGAATTTTAGCGTGGTCCTCTC
TGTCTCTCCAGAACGGCTGCCACGTGGAATTGCTCTTCCTCCGCTACATCTCGGACTGGGACCTAGACCC
TGGCCGCTGCTACCGCGTCACCTGGTTCACCTCCTGGAGCCCCTGCTACGACTGTGCCCGACATGTGGCC
GACTTTCTGCGAGGGAACCCCAACCTCAGTCTGAGGATCTTCACCGCGCGCCTCTACTTCTGTGAGGACC
GCAAGGCTGAGCCCGAGGGGCTGCGGCGGCTGCACCGCGCCGGGGTGCAAATAGCCATCATGACCTTCAA
AGGTGCGAAAGGGCCTTCCGCGCAGGCGCAGTGCAGCAGCCCGCATTCGGGATTGCGATGCGGAATGAAT
GAGTTAGTGGGGAAGCTCGAGGGGAAGAAGTGGGCGGGGATTCTGGTTCACCTCTGGAGCCGAAATTAAA
GATTAGAAGCAGAGAAAAGAGTGAATGGCTCAGAGACAAGGCCCCGAGGAAATGAGAAAATGGGGCCAGG
GTTGCTTCTTTCCCCTCGATTTGGAACCTGAACTGTCTTCTACCCCCATATCCCCGCCTTTTTTTCCTTT
TTTTTTTTTTGAAGATTATTTTTACTGCTGGAATACTTTTGTAGAAAACCACGAAAGAACTTTCAAAGCC
TGGGAAGGGCTGCATGAAAATTCAGTTCGTCTCTCCAGACAGCTTCGGCGCATCCTTTTGGTAAGGGGCT
TCCTCGCTTTTTAAATTTTCTTTCTTTCTCTACAGTCTTTTTTGGAGTTTCGTATATTTCTTATATTTTC
TTATTGTTCAATCACTCTCAGTTTTCATCTGATGAAAACTTTATTTCTCCTCCACATCAGCTTTTTCTTC
TGCTGTTTCACCATTCAGAGCCCTCTGCTAAGGTTCCTTTTCCCTCCCTTTTCTTTCTTTTGTTGTTTCA
CATCTTTAAATTTCTGTCTCTCCCCAGGGTTGCGTTTCCTTCCTGGTCAGAATTCTTTTCTCCTTTTTTT
TTTTTTTTTTTTTTTTTTTTAAACAAACAAACAAAAAACCCAAAAAAACTCTTTCCCAATTTACTTTCTT
CCAACATGTTACAAAGCCATCCACTCAGTTTAGAAGACTCTCCGGCCCCACCGACCCCCAACCTCGTTTT
GAAGCCATTCACTCAATTTGCTTCTCTCTTTCTCTACAGCCCCTGTATGAGGTTGATGACTTACGAGACG
CATTTCGTACTTTGGGACTTTGATAGCAACTTCCAGGAATGTCACACACGATGAAATATCTCTGCTGAAG
ACAGTGGATAAAAAACAGTCCTTCAAGTCTTCTCTGTTTTTATTCTTCAACTCTCACTTTCTTAGAGTTT
ACAGAAAAAATATTTATATACGACTCTTTAAAAAGATCTATGTCTTGAAAATAGAGAAGGAACACAGGTC
TGGCCAGGGACGTGCTGCAATTGGTGCAGTTTTGAATGCAACATTGTCCCCTACTGGGAATAACAGAACT
GCAGGACCTGGGAGCATCCTAAAGTGTCAACGTTTTTCTATGACTTTTAGGTAGGATGAGAGCAGAAGGT
AGATCCTAAAAAGCATGGTGAGAGGATCAAATGTTTTTATATCAACATCCTTTATTATTTGATTCATTTG
AGTTAACAGTGGTGTTAGTGATAGATTTTTCTATTCTTTTCCCTTGACGTTTACTTTCAAGTAACACAAA
CTCTTCCATCAGGCCATGATCTATAGGACCTCCTAATGAGAGTATCTGGGTGATTGTGACCCCAAACCAT
CTCTCCAAAGCATTAATATCCAATCATGCGCTGTATGTTTTAATCAGCAGAAGCATGTTTTTATGTTTGT
ACAAAAGAAGATTGTTATGGGTGGGGATGGAGGTATAGACCATGCATGGTCACCTTCAAGCTACTTTAAT
AAAGGATCTTAAAATGGGCAGGAGGACTGTGAACAAGACACCCTAATAATGGGTTGATGTCTGAAGTAGC
AAATCTTCTGGAAACGCAAACTCTTTTAAGGAAGTCCCTAATTTAGAAACACCCACAAACTTCACATATC
ATAATTAGCAAACAATTGGAAGGAAGTTGCTTGAATGTTGGGGAGAGGAAAATCTATTGGCTCTCGTGGG
TCTCTTCATCTCAGAAATGCCAATCAGGTCAAGGTTTGCTACATTTTGTATGTGTGTGATGCTTCTCCCA
AAGGTATATTAACTATATAAGAGAGTTGTGACAAAACAGAATGATAAAGCTGCGAACCGTGGCACACGCT
CATAGTTCTAGCTGCTTGGGAGGTTGAGGAGGGAGGATGGCTTGAACACAGGTGTTCAAGGCCAGCCTGG
GCAACATAACAAGATCCTGTCTCTCAAAAAAAAAAAAAAAAAAAAGAAAGAGAGAGGGCCGGGCGTGGTG
GCTCACGCCTGTAATCCCAGCACTTTGGGAGGCCGAGCCGGGCGGATCACCTGTGGTCAGGAGTTTGAGA
CCAGCCTGGCCAACATGGCAAAACCCCGTCTGTACTCAAAATGCAAAAATTAGCCAGGCGTGGTAGCAGG
CACCTGTAATCCCAGCTACTTGGGAGGCTGAGGCAGGAGAATCGCTTGAACCCAGGAGGTGGAGGTTGCA
GTAAGCTGAGATCGTGCCGTTGCACTCCAGCCTGGGCGACAAGAGCAAGACTCTGTCTCAGAAAAAAAAA
AAAAAAAGAGAGAGAGAGAGAAAGAGAACAATATTTGGGAGAGAAGGATGGGGAAGCATTGCAAGGAAAT
TGTGCTTTATCCAACAAAATGTAAGGAGCCAATAAGGGATCCCTATTTGTCTCTTTTGGTGTCTATTTGT
CCCTAACAACTGTCTTTGACAGTGAGAAAAATATTCAGAATAACCATATCCCTGTGCCGTTATTACCTAG
CAACCCTTGCAATGAAGATGAGCAGATCCACAGGAAAACTTGAATGCACAACTGTCTTATTTTAATCTTA
TTGTACATAAGTTTGTAAAAGAGTTAAAAATTGTTACTTCATGTATTCATTTATATTTTATATTATTTTG
CGTCTAATGATTTTTTATTAACATGATTTCCTTTTCTGATATATTGAAATGGAGTCTCAAAGCTTCATAA
ATTTATAACTTTAGAAATGATTCTAATAACAACGTATGTAATTGTAACATTGCAGTAATGGTGCTACGAA
GCCATTTCTCTTGATTTTTAGTAAACTTTTATGACAGCAAATTTGCTTCTGGCTCACTTTCAATCAGTTA
AATAAATGATAAATAATTTTGGAAGCTGTGAAGATAAAATACCAAATAAAATAATATAAAAGTGATTTAT
ATGAAGTTAAAATAAAAAATCAGTATGATGGAATAAACTTG
【0253】
本開示の態様に従ってCas9に融合することができる他の例示的なデアミナーゼを以下に
提供する。いくつかの実施形態では、それぞれの配列の活性ドメイン、たとえば局在化シ
グナル(核エクスポートシグナル、核局在化配列、細胞質局在化シグナル)を欠くドメイ
ンを用いることができることを理解されたい。
ヒトAID:
(下線:核局在化配列、二本下線:核エクスポートシグナル)
マウスAID:
(下線:核局在化配列、二本下線:核エクスポートシグナル)
イヌAID:
(下線:核局在化配列、二本下線:核エクスポートシグナル)
ウシAID:
(下線:核局在化配列、二本下線:核エクスポートシグナル)
ラットAID
(下線:核局在化配列、二本下線:核エクスポートシグナル)
マウスAPOBEC-3
(イタリック:核酸編集ドメイン)
ラットAPOBEC-3:
(イタリック:核酸編集ドメイン)
Rhesus macaque APOBEC-3G:
(イタリック:核酸編集ドメイン、下線:細胞質局在化シグナル)
チンパンジー APOBEC-3G:
(イタリック:核酸編集ドメイン、下線:細胞質局在化シグナル)
Green monkey APOBEC-3G:
(イタリック:核酸編集ドメイン、下線:細胞質局在化シグナル)
ヒト APOBEC-3G:
(イタリック:核酸編集ドメイン、下線:細胞質局在化シグナル)
ヒト APOBEC-3F:
(イタリック:核酸編集ドメイン)
ヒト APOBEC-3B:
(イタリック:核酸編集ドメイン)
ラット APOBEC-3B:
MQPQGLGPNAGMGPVCLGCSHRRPYSPIRNPLKKLYQQTFYFHFKNVRYAWGRKNNFLCYEVNGMDCALPVPLRQGVFRK
QGHIHAELCFIYWFHDKVLRVLSPMEEFKVTWYMSWSPCSKCAEQVARFLAAHRNLSLAIFSSRLYYYLRNPNYQQKLCR
LIQEGVHVAAMDLPEFKKCWNKFVDNDGQPFRPWMRLRINFSFYDCKLQEIFSRMNLLREDVFYLQFNNSHRVKPVQNRY
YRRKSYLCYQLERANGQEPLKGYLLYKKGEQHVEILFLEKMRSMELSQVRITCYLTWSPCPNCARQLAAFKKDHPDLILR
IYTSRLYFWRKKFQKGLCTLWRSGIHVDVMDLPQFADCWTNFVNPQRPFRPWNELEKNSWRIQRRLRRIKESWGL
ウシ APOBEC-3B:
DGWEVAFRSGTVLKAGVLGVSMTEGWAGSGHPGQGACVWTPGTRNTMNLLREVLFKQQFGNQPRVPAPYYRRKTYLCYQL
KQRNDLTLDRGCFRNKKQRHAERFIDKINSLDLNPSQSYKIICYITWSPCPNCANELVNFITRNNHLKLEIFASRLYFHW
IKSFKMGLQDLQNAGISVAVMTHTEFEDCWEQFVDNQSRPFQPWDKLEQYSASIRRRLQRILTAPI
Chimpanzee APOBEC-3B:
MNPQIRNPMEWMYQRTFYYNFENEPILYGRSYTWLCYEVKIRRGHSNLLWDTGVFRGQMYSQPEHHAEMCFLSWFCGNQL
SAYKCFQITWFVSWTPCPDCVAKLAKFLAEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENF
VYNEGQPFMPWYKFDDNYAFLHRTLKEIIRHLMDPDTFTFNFNNDPLVLRRHQTYLCYEVERLDNGTWVLMDQHMGFLCN
EAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGQVRAFLQENTHVRLRIFAARIYDYDPLYK
EALQMLRDAGAQVSIMTYDEFEYCWDTFVYRQGCPFQPWDGLEEHSQALSGRLRAILQVRASSLCMVPHRPPPPPQSPGP
CLPLCSEPPLGSLLPTGRPAPSLPFLLTASFSFPPPASLPPLPSLSLSPGHLPVPSFHSLTSCSIQPPCSSRIRETEGWA
SVSKEGRDLG
ヒト APOBEC-3C:
(イタリック:核酸編集ドメイン)
Gorilla APOBEC-3C3C
ヒト APOBEC-3A:
(イタリック:核酸編集ドメイン)
Rhesus macaque APOBEC-3A:
(イタリック:核酸編集ドメイン)
ウシ APOBEC-3A3A:
(イタリック:核酸編集ドメイン)
ヒト APOBEC-3H:
(イタリック:核酸編集ドメイン)
Rhesus macaque APOBEC-3H:
MALLTAKTFSLQFNNKRRVNKPYYPRKALLCYQLTPQNGSTPTRGHLKNKKKDHAEIRFINKIKSMGLDETQCYQVTCYL
TWSPCPSCAGELVDFIKAHRHLNLRIFASRLYYHWRPNYQEGLLLLCGSQVPVEVMGLPEFTDCWENFVDHKEPPSFNPS
EKLEELDKNSQAIKRRLERIKSRSVDVLENGLRSLQLGPVTPSSSIRNSR
ヒト APOBEC-3D:
(イタリック:核酸編集ドメイン)
ヒト APOBEC-1:
MTSEKGPSTGDPTLRRRIEPWEFDVFYDPRELRKEACLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERDFHPSM
SCSITWFLSWSPCWECSQAIREFLSRHPGVTLVIYVARLFWHMDQQNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYP
PGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLTFFRLHLQNCHYQTIPPHILLATGLIHPSVAWR
マウス APOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSVWRHTSQNTSNHVEVNFLEKFTTERYFRPNT
RCSITWFLSWSPCGECSRAITEFLSRHPYVTLFIYIARLYHHTDQRNRQGLRDLISSGVTIQIMTEQEYCYCWRNFVNYP
PSNEAYWPRYPHLWVKLYVLELYCIILGLPPCLKILRRKQPQLTFFTITLQTCHYQRIPPHLLWATGLK
ラット APOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNT
RCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYS
PSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK
ヒト APOBEC-2:
MAQKEEAAVATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVEYSSGRNKTFLCYVVEAQGKG
GQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEEP
EIQAALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK
マウスAPOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEVQSKG
GQAQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEP
EVQAALKKLKEAGCKLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
ラット APOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEAQSKG
GQVQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEP
EVQAALKKLKEAGCKLRIMKPQDFEYLWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
ウシ APOBEC-2:
MAQKEEAAAAAEPASQNGEEVENLEDPEKLKELIELPPFEIVTGERLPAHYFKFQFRNVEYSSGRNKTFLCYVVEAQSKG
GQVQASRGYLEDEHATNHAEEAFFNSIMPTFDPALRYMVTWYVSSSPCAACADRIVKTLNKTKNLRLLILVGRLFMWEEP
EIQAALRKLKEAGCRLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
Petromyzon marinus CDA1 (pmCDAl)
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNK PQSGTERGIHAEIFSIRKVEEYL
RDNPGQFTINWYSSWSPCADCAEKILEWYNQELRG NGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQC
CRKIFIQSSHNQ LNENRWLEKTLKRAEKRRSELSFMIQVKILHTTKSPAV
ヒト APOBEC3G D316R D317R
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPPLDAKIFRGQ VYSELKYHPEMRFFHWFSKWRK
LHRDQEYEVTWYISWSPCTKCTRDMATFLAEDP KVTLTIFVARLYYFWDPDYQEALRSLCQKRDGPRATMKF NYDEFQ
HCWSKFVYSQ RELFEPWNNLPKYYILLHFMLGEILRHSMDPPTFTFNFNNEPWVRGRHETYLCYEVER MHNDTWVLLN
QRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTC FTSWSPCFSCAQEMAKFISK KHVSLCIFTARIY
RRQGRCQEGLRTLAEAGAKISF T YSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQNQEN
ヒト APOBEC3G chain A
MDPPTFTFNFNNEPWWGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHG FLEGRHAELCFLDVIPFWKLDLDQD
YRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCI FTARIYDDQGRCQEGLRTLAEAGAKISF TYSEFKHCWDTFVDHQG
CPFQPWDGLD EHSQDLSGRLRAILQ
ヒト APOBEC3G chain A D120R D121R
MDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHG FLEGRHAELCFLDVIPFWKLDLDQ
DYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCI FTARIYRRQGRCQEGLRTLAEAGAKISFMTYSEFKHCWDTFVDHQ
GCPFQPWDGLDE HSQDLSGRLRAILQ
【0254】
本開示のいくつかの態様は、本明細書に記載した融合タンパク質のいずれかのデアミナ
ーゼドメインの触媒活性を(たとえばデアミナーゼドメインにおいて点変異を作成するこ
とによって)調節することが、融合タンパク質(たとえば塩基エディター)の処理能力に
影響を与えるという認識に基づいている。たとえば、塩基編集融合タンパク質の中のデア
ミナーゼドメインの触媒活性を低減するが削除しない変異は、デアミナーゼドメインが標
的の残基に隣接する残基の脱アミノ化を触媒する可能性を低くし、それにより脱アミノ化
のウィンドウを狭くすることができる。脱アミノ化のウィンドウを狭くする能力は、特定
の標的残基に隣接する残基の望ましくない脱アミノ化を防止することができ、それにより
オフターゲット効果を減少させまたは防止することができる。
【0255】
たとえば、いくつかの実施形態では、塩基エディターに組み込まれたAPOBECデアミナー
ゼは、rAPOBEC1のH121X、H122X、R126X、R126X、R118X、W90X、W90X、およびR132Xからな
る群から選択される1つもしくは複数の変異、または別のAPOBECデアミナーゼにおける1つ
もしくは複数の対応する変異を含むことができ、ここでXは任意のアミノ酸である。いく
つかの実施形態では、塩基エディターに組み込まれたAPOBECデアミナーゼは、rAPOBEC1の
H121R、H122R、R126A、R126E、R118A、W90A、W90Y、およびR132Eからなる群から選択され
る1つもしくは複数の変異、または別のAPOBECデアミナーゼにおける1つもしくは複数の対
応する変異を含み得る。
【0256】
いくつかの実施形態では、塩基エディターに組み込まれたAPOBECデアミナーゼは、hAPO
BEC3GのD316X、D317X、R320X、R320X、R313X、W285X、W285X、R326Xからなる群から選択
される1つもしくは複数の変異、または別のAPOBECデアミナーゼにおける1つもしくは複数
の対応する変異を含むことができ、ここでXは任意のアミノ酸である。いくつかの実施形
態では、本明細書で提供する融合タンパク質のいずれも、hAPOBEC3GのD316R、D317R、R32
0A、R320E、R313A、W285A、W285Y、R326Eからなる群から選択される1つもしくは複数の変
異、または別のAPOBECデアミナーゼにおける1つもしくは複数の対応する変異を含むAPOBE
Cデアミナーゼを含む。
【0257】
いくつかの実施形態では、塩基エディターに組み込まれたAPOBECデアミナーゼは、rAPO
BEC1のH121RおよびH122Rの変異、または別のAPOBECデアミナーゼにおける1つもしくは複
数の対応する変異を含み得る。いくつかの実施形態では、塩基エディターに組み込まれた
APOBECデアミナーゼは、rAPOBEC1のR126Aの変異、または別のAPOBECデアミナーゼにおけ
る1つもしくは複数の対応する変異を含むAPOBECデアミナーゼを含み得る。いくつかの実
施形態では、塩基エディターに組み込まれたAPOBECデアミナーゼは、rAPOBEC1のR126Eの
変異、または別のAPOBECデアミナーゼにおける1つもしくは複数の対応する変異を含むAPO
BECデアミナーゼを含み得る。いくつかの実施形態では、塩基エディターに組み込まれたA
POBECデアミナーゼは、rAPOBEC1のR118Aの変異、または別のAPOBECデアミナーゼにおける
1つもしくは複数の対応する変異を含むAPOBECデアミナーゼを含み得る。いくつかの実施
形態では、塩基エディターに組み込まれたAPOBECデアミナーゼは、rAPOBEC1のW90Aの変異
、または別のAPOBECデアミナーゼにおける1つもしくは複数の対応する変異を含むAPOBEC
デアミナーゼを含み得る。いくつかの実施形態では、塩基エディターに組み込まれたAPOB
ECデアミナーゼは、rAPOBEC1のW90Yの変異、または別のAPOBECデアミナーゼにおける1つ
もしくは複数の対応する変異を含むAPOBECデアミナーゼを含み得る。いくつかの実施形態
では、塩基エディターに組み込まれたAPOBECデアミナーゼは、rAPOBEC1のR132Eの変異、
または別のAPOBECデアミナーゼにおける1つもしくは複数の対応する変異を含むAPOBECデ
アミナーゼを含み得る。いくつかの実施形態では、塩基エディターに組み込まれたAPOBEC
デアミナーゼは、rAPOBEC1のW90YおよびR126Eの変異、または別のAPOBECデアミナーゼに
おける1つもしくは複数の対応する変異を含むAPOBECデアミナーゼを含み得る。いくつか
の実施形態では、塩基エディターに組み込まれたAPOBECデアミナーゼは、rAPOBEC1のR126
EおよびR132Eの変異、または別のAPOBECデアミナーゼにおける1つもしくは複数の対応す
る変異を含むAPOBECデアミナーゼを含み得る。いくつかの実施形態では、塩基エディター
に組み込まれたAPOBECデアミナーゼは、rAPOBEC1のW90YおよびR132Eの変異、または別のA
POBECデアミナーゼにおける1つもしくは複数の対応する変異を含むAPOBECデアミナーゼを
含み得る。いくつかの実施形態では、塩基エディターに組み込まれたAPOBECデアミナーゼ
は、rAPOBEC1のW90Y、R126E、およびR132Eの変異、または別のAPOBECデアミナーゼにおけ
る1つもしくは複数の対応する変異を含むAPOBECデアミナーゼを含み得る。
【0258】
いくつかの実施形態では、塩基エディターに組み込まれたAPOBECデアミナーゼは、hAPO
BEC3GのD316RおよびD317Rの変異、または別のAPOBECデアミナーゼにおける1つもしくは複
数の対応する変異を含むAPOBECデアミナーゼを含み得る。いくつかの実施形態では、本明
細書で提供する融合タンパク質のいずれも、hAPOBEC3GのR320Aの変異、または別のAPOBEC
デアミナーゼにおける1つもしくは複数の対応する変異を含むAPOBECデアミナーゼを含む
。いくつかの実施形態では、塩基エディターに組み込まれたAPOBECデアミナーゼは、hAPO
BEC3GのR320Eの変異、または別のAPOBECデアミナーゼにおける1つもしくは複数の対応す
る変異を含むAPOBECデアミナーゼを含み得る。いくつかの実施形態では、塩基エディター
に組み込まれたAPOBECデアミナーゼは、hAPOBEC3GのR313Aの変異、または別のAPOBECデア
ミナーゼにおける1つもしくは複数の対応する変異を含むAPOBECデアミナーゼを含み得る
。いくつかの実施形態では、塩基エディターに組み込まれたAPOBECデアミナーゼは、hAPO
BEC3GのW285Aの変異、または別のAPOBECデアミナーゼにおける1つもしくは複数の対応す
る変異を含むAPOBECデアミナーゼを含み得る。いくつかの実施形態では、塩基エディター
に組み込まれたAPOBECデアミナーゼは、hAPOBEC3GのW285Yの変異、または別のAPOBECデア
ミナーゼにおける1つもしくは複数の対応する変異を含むAPOBECデアミナーゼを含み得る
。いくつかの実施形態では、塩基エディターに組み込まれたAPOBECデアミナーゼは、hAPO
BEC3GのR326Eの変異、または別のAPOBECデアミナーゼにおける1つもしくは複数の対応す
る変異を含むAPOBECデアミナーゼを含み得る。いくつかの実施形態では、塩基エディター
に組み込まれたAPOBECデアミナーゼは、hAPOBEC3GのW285YおよびR320Eの変異、または別
のAPOBECデアミナーゼにおける1つもしくは複数の対応する変異を含むAPOBECデアミナー
ゼを含み得る。いくつかの実施形態では、塩基エディターに組み込まれたAPOBECデアミナ
ーゼは、hAPOBEC3GのR320EおよびR326Eの変異、または別のAPOBECデアミナーゼにおける1
つもしくは複数の対応する変異を含むAPOBECデアミナーゼを含み得る。いくつかの実施形
態では、塩基エディターに組み込まれたAPOBECデアミナーゼは、hAPOBEC3GのW285Yおよび
R326Eの変異、または別のAPOBECデアミナーゼにおける1つもしくは複数の対応する変異を
含むAPOBECデアミナーゼを含み得る。いくつかの実施形態では、塩基エディターに組み込
まれたAPOBECデアミナーゼは、hAPOBEC3GのW285Y、R320E、およびR326Eの変異、または別
のAPOBECデアミナーゼにおける1つもしくは複数の対応する変異を含むAPOBECデアミナー
ゼを含み得る。
【0259】
いくつかの修飾されたシチジンデアミナーゼが市販されており、それだけに限らないが
、SaBE3、SaKKH-BE3、VQR-BE3、EQR-BE3、VRER-BE3、YE1-BE3、EE-BE3、YE2-BE3、および
YEE-BE3が含まれ、これらはAddgene社から入手可能である(プラスミド85169、85170、85
171、85172、85173、85174、85175、85176、85177)。
【0260】
本開示の態様に従ってCas9に融合することができる他の例示的なデアミナーゼを以下に
提供する。いくつかの実施形態では、それぞれの配列の活性ドメイン、たとえば局在化シ
グナル(核エクスポートシグナル、細胞質局在化シグナル、核局在化配列)を各ドメイン
を用いることができることを理解されたい。
【0261】
CからTへの核酸塩基編集タンパク質の詳細は、その全体の内容が参照により本明細書に
組み込まれる国際PCT出願PCT/US2016/058344 (WO 2017/070632)およびKomor, A.C., et a
l., “Programmable editing of a target base in genomic DNA without double-strand
ed DNA cleavage” Nature 533, 420-424 (2016)に記載されている。
【0262】
AからGへの編集
いくつかの実施形態では、本明細書に記載した塩基エディターは、アデノシンデアミナ
ーゼを含むデアミナーゼドメインを含み得る。塩基エディターのそのようなアデノシンデ
アミナーゼドメインは、アデニン(A)を脱アミノ化して、グアニン(G)の塩基対形成特
性を呈するイノシン(I)を形成することによってアデニン(A)核酸塩基をグアニン(G
)核酸塩基に編集することを促進することができる。アデノシンデアミナーゼは、デオキ
シリボ核酸(DNA)中のデオキシアデノシン残基のアデニンを脱アミノ化(即ちアミノ基を
除去)することができる。
【0263】
いくつかの実施形態では、本明細書で提供する核酸塩基エディターは、1つまたは複数
のタンパク質ドメインを一緒に融合することによって作成することができ、それにより融
合タンパク質が産生される。ある実施形態では、本明細書で提供する融合タンパク質は、
融合タンパク質の塩基編集活性(たとえば効率、選択性、および特異性)を改善する1つ
または複数の特徴を含む。たとえば、本明細書で提供する融合タンパク質は、ヌクレアー
ゼ活性が低減したCa9ドメインを含み得る。いくつかの実施形態では、本明細書で提供す
る融合タンパク質は、ヌクレアーゼ活性を有しないCas9ドメイン(dCas9)、または二本
鎖DNA分子の1つの鎖を切断するCas9ニッカーゼ(nCas9)と称されるCas9ドメインを有し
得る。いずれの特定の理論にも縛られることを望まないが、触媒性残基(たとえばH840)
の存在により、標的とされたAに対向するTを含む編集されない(即ち脱アミノ化されない
)鎖を開裂するCas9の活性が維持される。Cas9の触媒性残基の変異(たとえばD10からA10
への)は、標的とされたA残基を含む編集された鎖の開裂を防止する。そのようなCas9バ
リアントはgRNAによって定義される標的配列に基づいて特定の位置で一本鎖のDNA切断(
ニック)を生じ、編集されない鎖の修復をもたらし、最終的に編集されない鎖のTからCへ
の変化をもたらすことができる。いくつかの実施形態では、AからGへの塩基エディターは
、イノシン塩基の切除修復の阻害剤、たとえばウラシルグリコシラーゼ阻害剤(UGI)ド
メインまたは触媒不活性のイノシン特異的ヌクレアーゼをさらに含む。いずれの特定の理
論にも縛られることを望まないが、UGIドメインまたは触媒不活性のイノシン特異的ヌク
レアーゼは、脱アミノ化されたアデノシン残基(たとえばイノシン)の塩基切除修復を阻
害しまたは防止することができ、それにより塩基エディターの活性または効率を改善する
ことができる。
【0264】
アデノシンデアミナーゼを含む塩基エディターは、DNA、RNA、またはDNA-RNAハイブリ
ッドを含む任意のポリヌクレオチドに作用することができる。ある実施形態では、アデノ
シンデアミナーゼを含む塩基エディターは、RNAを含むポリヌクレオチドの標的Aを脱アミ
ノ化することができる。たとえば、塩基エディターは、RNAポリヌクレオチドおよび/また
はDNA-RNAハイブリッドポリヌクレオチドの標的Aを脱アミノ化することができるアデノシ
ンデアミナーゼドメインを含み得る。一実施形態では、塩基エディターに組み込まれたア
デノシンデアミナーゼは、RNAに作用するアデノシンデアミナーゼ(ADAR、たとえばADAR1
またはADAR2)の全部または一部を含む。別の実施形態では、塩基エディターに組み込ま
れたアデノシンデアミナーゼは、tRNAに作用するアデノシンデアミナーゼ(ADAT)の全部
または一部を含む。アデノシンデアミナーゼドメインを含む塩基エディターは、DNAポリ
ヌクレオチドのA核酸塩基を脱アミノ化することもできる。一実施形態では、塩基エディ
ターのアデノシンデアミナーゼドメインは、ADATがDNA中の標的Aを脱アミノ化することを
許容する1つまたは複数の変異を含むADATの全部または一部を含む。たとえば、塩基エデ
ィターは、以下の変異、D108N、A106V、D147Y、E155V、L84F、H123Y、I157Fの1つもしく
は複数、または別のアデノシンデアミナーゼの対応する変異を含むEscherichia coliのAD
AT(EcTadA)の全部または一部を含み得る。
【0265】
アデノシンデアミナーゼは任意の好適な生命体に由来し得る。いくつかの実施形態では
、アデノシンデアミナーゼは原核生物からのものである。いくつかの実施形態では、アデ
ノシンデアミナーゼは細菌からのものである。いくつかの実施形態では、アデノシンデア
ミナーゼはEscherichia coli、Staphylococcus aureus、Salmonella typhi、Shewanella
putrefaciens、Haemophilus influenzae、Caulobacter crescentus、またはBacillus sub
tilisからのものである。いくつかの実施形態では、アデノシンデアミナーゼはE. coliか
らのものである。いくつかの実施形態では、アデノシンデアミナーゼは本明細書で提供す
る変異のいずれかに対応する1つまたは複数の変異(たとえばecTadAにおける変異)を含
む天然産生のアデノシンデアミナーゼである。任意の相同タンパク質における対応する残
基は、たとえば配列アラインメントおよび相同残基の決定によって同定することができる
。したがって、本明細書に記載した変異のいずれかに対応する任意の天然産生アデノシン
デアミナーゼ(たとえばecTadAに対する相同性を有する)における変異(たとえばecTadA
で同定された変異のいずれか)を産生することができる。
【0266】
TadA
特定の実施形態では、TadAは、参照により全体として本明細書に組み込まれるPCT/US20
17/045381 (WO 2018/027078)に記載されたTadAのうちいずれか1つである。
【0267】
一実施形態では、本発明の融合タンパク質はTadA7.10に連結された野生型TadAを含み、
TadA7.10はCas9ニッカーゼに連結されている。特定の実施形態では、融合タンパク質は単
一のTad7.10ドメインを含む(たとえばモノマーとして提供される)。他の実施形態では
、ABE7.10エディターはTadA7.10およびTadA(wt)を含み、これらはヘテロ二量体を形成す
ることができる。対応する配列は以下の通りである。
SEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLY
VTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKK
AQSSTD
これは「TadA参照配列」または野生型TadA(TadA(wt))と称される。
TadA7.10:
SEVEFSHEYW MRHALTLAKR ARDEREVPVG AVLVLNNRVI GEGWNRAIGL HDPTAHAEIM ALRQGGLVMQ NYR
LIDATLY VTFEPCVMCA GAMIHSRIGR VVFGVRNAKT GAAGSLMDVL HYPGMNHRVE ITEGILADEC AALLCY
FFRM PRQVFNAQKK AQSSTD
【0268】
いくつかの実施形態では、アデノシンデアミナーゼは、本明細書で提供するアデノシン
デアミナーゼのいずれかで説明したアミノ酸配列のいずれか1つに対して少なくとも60%、
少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少な
くとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくと
も99%、少なくとも99.5%の同一性であるアミノ酸配列を含む。本明細書で提供するアデノ
シンデアミナーゼは1つまたは複数の変異(たとえば本明細書で提供する変異のいずれか
)を含んでよいことを認識されたい。本開示は、ある同一性百分率を有する任意のデアミ
ナーゼドメインに加えて本明細書に記載した変異のいずれかまたはその組合せを提供する
。いくつかの実施形態では、アデノシンデアミナーゼは、参照配列と比較して1、2、3、4
、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25
、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45
、46、47、48、49、50もしくはそれを超える変異を有するアミノ酸配列、または本明細書
で提供するアデノシンデアミナーゼのいずれかを含む。いくつかの実施形態では、アデノ
シンデアミナーゼは、当技術で既知のまたは本明細書に記載したアミノ酸配列のいずれか
1つと比較して少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25
、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくと
も60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少
なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または
少なくとも170の同一の連続的なアミノ酸残基を有するアミノ酸配列を含む。
【0269】
いくつかの実施形態では、TadAデアミナーゼは全長のE.coli TadAデアミナーゼである
。たとえば、ある実施形態では、アデノシンデアミナーゼはアミノ酸配列:
MRRAFITGVFFLSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLV
MQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFF
RMRRQEI KAQKKAQSSTD
を含む。
【0270】
しかし、本出願において有用なさらなるアデノシンデアミナーゼが当業者には明白で、
本開示の範囲内であることが認識されよう。たとえば、アデノシンデアミナーゼはtRNAに
作用するアデノシンデアミナーゼのホモログ(AD AT)であってよい。例示的なAD ATホモ
ログには、非限定的に、以下のものが含まれる。
Staphylococcus aureus TadA:
MGSHMTNDIYFMTLAIEEAKKAAQLGEVPIGAIITKDDEVIARAHNLRETLQQPTAHAEHIAIERAAKVLGSWRLEGCTL
YVTLEPCVMCAGTIVMSRIPRVVYGADDPKGGCS GS LMNLLQQS NFNHRAIVDKG VLKE AC S TLLTTFFKNLR
ANKKS TN
Bacillus subtilis TadA:
MTQDELYMKEAIKEAKKAEEKGEVPIGAVLVINGEIIARAHNLRETEQRSIAHAEML VIDEACKALGTWRLEGATLYVT
LEPCPMCAGAVVLSRVEKVVFGAFDPKGGC S GTLMN LLQEERFNHQAEVVSGVLEEECGGMLSAFFRELRKKKKAAR
KNLSE
Salmonella typhimurium (S. typhimurium) TadA:
MPPAFITGVTSLSDVELDHEYWMRHALTLAKRAWDEREVPVGAVLVHNHRVIGEGWNRPIGRHDPTAHAEIMALRQGGLV
LQNYRLLDTTLYVTLEPCVMCAGAMVHSRIGRVVFGARDAKTGAAGSLIDVLHHPGMNHRVEIIEGVLRDECATLLSDFF
RMRRQEIK ALKKADRAEGAGPAV
Shewanella putrefaciens (S. putrefaciens) TadA:
MDE YWMQVAMQM AEKAEAAGE VPVGA VLVKDGQQIATGYNLS IS QHDPT AHAEILCLRSAGKKLENYRLLDAT
LYITLEPCAMCAGAMVHSRIARVVYGARDEKTGAAGTVVNLLQHPAFNHQVEVTSGVLAEACSAQLSRFFKRRRDEKKAL
KLAQRAQQGIE
Haemophilus influenzae F3031 (H. influenzae) TadA:
MDAAKVRSEFDEKMMRYALELADKAEALGEIPVGAVLVDDARNIIGEGWNLSIVQSDPTΑΗAEIIALRNGAKNIQNYR
LLNSTLYVTLEPCTMCAGAILHS RIKRLVFG ASDYKTGAIGSRFHFFDDYKMNHTLEITSGVLAEECSQKLSTFFQKR
REEKKIEKALLKSLSDK
Caulobacter crescentus (C. crescentus) TadA:
MRTDESEDQDHRMMRLALDAARAAAEAGETPVGAVILDPSTGEVIATAGNGPIAAHDPTAHAEIAAMRAAAAKLGNYRLT
DLTLVVTLEPCAMCAGAISHARIGRVVFGADD PKGGAVVHGPKFFAQPTCHWRPEVTGGVLADESADLLRGFFRARRKA
KI
Geobacter sulfurreducens (G. sulfurreducens) TadA:
MSSLKKTPIRDDAYWMGKAIREAAKAAARDEVPIGAVIVRDGAVIGRGHNLREGSNDPSAHAEMIAIRQAARRSANWRLT
GATLYVTLEPCLMCMGAIILARLERVVFGCYDPKGGAAGSLYDLSADPRLNHQVRLSPGVCQEECGTMLSDFFRDLRRRK
KAKATPALF IDERKVPPEP.
【0271】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列に対してD108Xの
変異、または別のアデノシンデアミナーゼにおける対応する変異を含み、ここでXは野生
型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いく
つかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してD108G、D108N、D1
08V、D108A、もしくはD108Yの変異、または別のアデノシンデアミナーゼにおける対応す
る変異を含む。しかし、さらなるデアミナーゼを同様に配列させて本明細書で提供したよ
うに変異させることのできる相同のアミノ酸残基を同定することができることを認識され
たい。
【0272】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列に対してA106Xの
変異、または別のアデノシンデアミナーゼにおける対応する変異を含み、ここでXは野生
型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いく
つかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してA106Vの変異、ま
たは別のアデノシンデアミナーゼにおける対応する変異を含む。
【0273】
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列に対してE155Xの
変異、または別のアデノシンデアミナーゼにおける対応する変異を含み、ここでXの存在
は野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す
。いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してE155D、E15
5G、もしくはE155Vの変異、または別のアデノシンデアミナーゼにおける対応する変異を
含む。
【0274】
いくつかの実施形態では、アデノシンデアミナーゼは、D147Xの変異、または別のアデ
ノシンデアミナーゼにおける対応する変異を含み、ここでXの存在は野生型アデノシンデ
アミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態
では、アデノシンデアミナーゼはTadA参照配列に対してD147Yの変異、または別のアデノ
シンデアミナーゼにおける対応する変異を含む。
【0275】
本明細書で提供する変異(たとえばTadA参照配列)のいずれも、E. coli TadA(ecTadA
)、S. aureus TadA(saTadA)、またはその他のアデノシンデアミナーゼ(たとえば細菌
のアデノシンデアミナーゼ)等の他のアデノシンデアミナーゼに導入できることを認識さ
れたい。TadA参照配列に対して変異した残基と相同的である配列をどのように同定するか
は、当業者には明白であろう。したがって、TadA参照配列に対して同定された変異のいず
れも、相同するアミノ酸残基を有する他のアデノシンデアミナーゼにおいて作成し得る。
本明細書で提供する変異のいずれも、TadA参照配列または別のアデノシンデアミナーゼに
対して個別にまたは任意の組合せで作成し得ることも認識されたい。たとえば、アデノシ
ンデアミナーゼは、TadA参照配列に対してD108N、A106V、E155V、および/もしくはD147Y
の変異、または別のアデノシンデアミナーゼにおける対応する変異を含み得る。いくつか
の実施形態では、アデノシンデアミナーゼはTadA参照配列において以下の変異の群(変異
の群を「;」で分離する)または別のアデノシンデアミナーゼにおける対応する変異を含
む。D108NおよびA106V; D108NおよびE155V; D108NおよびD147Y; A106VおよびE155V; A106
VおよびD147Y; E155VおよびD147Y; D108N、A106VおよびE55V; D108N、A106VおよびD147Y;
D108N、E55VおよびD147Y; A106V、E55VおよびD147Y; ならびにD108N、A106V、E55Vおよ
びD147Y。しかし、本明細書で提供する対応する変異の任意の組合せをアデノシンデアミ
ナーゼにおいて作成してよいことを認識されたい(たとえば野生型TadAまたはecTadA)。
【0276】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してH8X、T17X
、L18X、W23X、L34X、W45X、R51X、A56X、E59X、E85X、M94X、I95X、V102X、F104X、A106
X、R107X、D108X、KllOX、M118X、N127X、A138X、F149X、M151X、R153X、Q154X、I156X、
および/もしくはK157Xの変異の1つもしくは複数、または別のアデノシンデアミナーゼに
おける1つもしくは複数の対応する変異を含み、ここでXの存在は野生型アデノシンデアミ
ナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では
、アデノシンデアミナーゼはTadA参照配列に対してH8Y、T17S、L18E、W23L、L34S、W45L
、R51H、A56E、またはA56S、E59G、E85K、またはE85G、M94L、1951、V102A、F104L、A106
V、R107C、またはR107H、またはR107P、D108G、またはD108N、またはD108V、またはD108A
、またはD108Y、Kl 101、Ml18K、N127S、A138V、F149Y、M151V、R153C、Q154L、I156D、
および/もしくはK157Rの変異のうち1つもしくは複数、または別のアデノシンデアミナー
ゼにおける1つもしくは複数の対応する変異を含む。
【0277】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してH8X、D108X
、および/またはN127Xの変異の1つもしくは複数、または別のアデノシンデアミナーゼに
おける1つもしくは複数の対応する変異を含み、ここでXは任意のアミノ酸の存在を示す。
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してH8Y、D108N、
および/もしくはN127Sの変異の1つもしくは複数、または別のアデノシンデアミナーゼに
おける1つもしくは複数の対応する変異を含む。
【0278】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してH8X、D108X
、N127X、D147X、R152X、およびQ154Xからなる群から選択される1つ、2つ、3つ、4つ、5
つ、または6つの変異、または別のアデノシンデアミナーゼにおける対応する変異を含み
、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミ
ノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に
対してH8X、M61X、M70X、D108X、N127X、Q154X、E155X、およびQ163Xからなる群から選択
される1つ、2つ、3つ、4つ、5つ、6つ、7つ、もしくは8つの変異、または別のアデノシン
デアミナーゼにおける対応する変異を含み、ここでXは野生型アデノシンデアミナーゼに
おける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、
アデノシンデアミナーゼはTadA参照配列に対してH8X、D108X、N127X、E155X、およびT166
Xからなる群から選択される1つ、2つ、3つ、4つ、もしくは5つの変異、または別のアデノ
シンデアミナーゼにおける対応する変異を含み、ここでXは野生型アデノシンデアミナー
ゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態で
は、アデノシンデアミナーゼはH8X、A106X、D108Xからなる群から選択される1つ、2つ、3
つ、4つ、5つ、または6つの変異、別のアデノシンデアミナーゼにおける変異を含み、こ
こでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸
の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対し
てH8X、R126X、L68X、D108X、N127X、D147X、およびE155Xからなる群から選択される1つ
、2つ、3つ、4つ、5つ、6つ、7つ、もしくは8つの変異、または別のアデノシンデアミナ
ーゼにおける対応する変異を含み、ここでXは野生型アデノシンデアミナーゼにおける対
応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシ
ンデアミナーゼはTadA参照配列に対してH8X、D108X、A109X、N127X、およびE155Xからな
る群から選択される1つ、2つ、3つ、4つ、もしくは5つの変異、または別のアデノシンデ
アミナーゼにおける対応する変異を含み、ここでXは野生型アデノシンデアミナーゼにお
ける対応するアミノ酸以外の任意のアミノ酸の存在を示す。
【0279】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してH8Y、D108N
、N127S、D147Y、R152C、およびQ154Hからなる群から選択される1つ、2つ、3つ、4つ、5
つ、もしくは6つの変異、または別のアデノシンデアミナーゼにおける対応する変異を含
む。いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してH8Y、M61
I、M70V、D108N、N127S、Q154R、E155G、およびQ163Hからなる群から選択される1つ、2つ
、3つ、4つ、5つ、6つ、7つ、もしくは8つの変異、または別のアデノシンデアミナーゼに
おける対応する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼはTadA参
照配列に対してH8Y、D108N、N127S、E155V、およびT166Pからなる群から選択される1つ、
2つ、3つ、4つ、もしくは5つの変異、または別のアデノシンデアミナーゼにおける対応す
る変異を含む。いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対し
てH8Y、A106T、D108N、N127S、E155D、およびK161Qからなる群から選択される1つ、2つ、
3つ、4つ、5つ、もしくは6つの変異、または別のアデノシンデアミナーゼにおける対応す
る変異を含む。いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対し
てH8Y、R126W、L68Q、D108N、N127S、D147Y、およびE155Vからなる群から選択される1つ
、2つ、3つ、4つ、5つ、6つ、7つ、もしくは8つの変異、または別のアデノシンデアミナ
ーゼにおける対応する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは
TadA参照配列に対してH8Y、D108N、A109T、N127S、およびE155Gからなる群から選択され
る1つ、2つ、3つ、4つ、もしくは5つの変異、または別のアデノシンデアミナーゼにおけ
る対応する変異を含む。
【0280】
いくつかの実施形態では、アデノシンデアミナーゼは、別のアデノシンデアミナーゼに
おける変異の1つもしくは複数を含む。いくつかの実施形態では、アデノシンデアミナー
ゼはTadA参照配列に対するD108N、D108G、もしくはD108Vの変異、または別のアデノシン
デアミナーゼにおける対応する変異を含む。いくつかの実施形態では、アデノシンデアミ
ナーゼはTadA参照配列に対するA106VおよびD108Nの変異、または別のアデノシンデアミナ
ーゼにおける対応する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは
TadA参照配列におけるR107CおよびD108Nの変異、または別のアデノシンデアミナーゼにお
ける対応する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼはTadA参照
配列に対するH8Y、D108N、N127S、D147Y、およびQ154Hの変異、または別のアデノシンデ
アミナーゼにおける対応する変異を含む。いくつかの実施形態では、アデノシンデアミナ
ーゼはTadA参照配列に対するH8Y、R24W、D108N、N127S、D147Y、およびE155Vの変異、ま
たは別のアデノシンデアミナーゼにおける対応する変異を含む。いくつかの実施形態では
、アデノシンデアミナーゼはTadA参照配列に対するD108N、D147Y、およびE155Vの変異、
または別のアデノシンデアミナーゼにおける対応する変異を含む。いくつかの実施形態で
は、アデノシンデアミナーゼはTadA参照配列に対するH8Y、D108N、およびS127Sの変異、
または別のアデノシンデアミナーゼにおける対応する変異を含む。いくつかの実施形態で
は、アデノシンデアミナーゼはTadA参照配列に対するA106V、D108N、D147Y、およびE155V
の変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
【0281】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してS2X、H8X、
I49X、L84X、H123X、N127X、I156Xおよび/またはK160Xの変異のうち1つもしくは複数、ま
たは別のアデノシンデアミナーゼにおける1つもしくは複数の対応する変異を含み、ここ
でXの存在は野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミ
ノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対して
S2A、H8Y、I49F、L84F、H123Y、N127S、I156Fおよび/またはK160Sの変異のうち1つもしく
は複数、または別のアデノシンデアミナーゼにおける1つもしくは複数の対応する変異を
含む。
【0282】
いくつかの実施形態では、アデノシンデアミナーゼはL84X変異アデノシンデアミナーゼ
を含み、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意
のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼはTadA参照
配列に対してL84Fの変異、または別のアデノシンデアミナーゼにおける対応する変異を含
む。
【0283】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してH123Xの変
異、または別のアデノシンデアミナーゼにおける対応する変異を含み、ここでXは野生型
アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつ
かの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してH123Yの変異、また
は別のアデノシンデアミナーゼにおける対応する変異を含む。
【0284】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してI157Xの変
異、または別のアデノシンデアミナーゼにおける対応する変異を含み、ここでXは野生型
アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつ
かの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してI157Fの変異、また
は別のアデノシンデアミナーゼにおける対応する変異を含む。
【0285】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してL84X、A106
X、D108X、H123X、D147X、E155X、およびI156Xからなる群から選択される1つ、2つ、3つ
、4つ、5つ、6つ、もしくは7つの変異、または別のアデノシンデアミナーゼにおける対応
する変異を含み、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以
外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは
TadA参照配列に対してS2X、I49X、A106X、D108X、D147X、およびE155Xからなる群から選
択される1つ、2つ、3つ、4つ、5つ、もしくは6つの変異、または別のアデノシンデアミナ
ーゼにおける対応する変異を含み、ここでXは野生型アデノシンデアミナーゼにおける対
応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシ
ンデアミナーゼはTadA参照配列に対してH8X、A106X、D108X、N127X、およびK160Xからな
る群から選択される1つ、2つ、3つ、4つ、もしくは5つの変異、または別のアデノシンデ
アミナーゼにおける対応する変異を含み、ここでXは野生型アデノシンデアミナーゼにお
ける対応するアミノ酸以外の任意のアミノ酸の存在を示す。
【0286】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してL84F、A106
V、D108N、H123Y、D147Y、E155V、およびI156Fからなる群から選択される1つ、2つ、3つ
、4つ、5つ、6つ、もしくは7つの変異、または別のアデノシンデアミナーゼにおける対応
する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対
してS2A、I49F、A106V、D108N、D147Y、およびE155Vからなる群から選択される1つ、2つ
、3つ、4つ、5つ、もしくは6つの変異を含む。
【0287】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してH8Y、A106T
、D108N、N127S、およびK160Sからなる群から選択される1つ、2つ、3つ、4つ、もしくは5
つの変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
【0288】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してE25X、R26X
、R107X、A142X、および/またはA143Xのうち1つもしくは複数の変異、または別のアデノ
シンデアミナーゼにおける1つもしくは複数の対応する変異を含み、ここでXの存在は野生
型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いく
つかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してE25M、E25D、E25A
、E25R、E25V、E25S、E25Y、R26G、R26N、R26Q、R26C、R26L、R26K、R107P、R07K、R107A
、R107N、R107W、R107H、R107S、A142N、A142D、A142G、A143D、A143G、A143E、A143L、A
143W、A143M、A143S、A143Qおよび/またはA143Rのうち1つもしくは複数の変異、または別
のアデノシンデアミナーゼにおける1つもしくは複数の対応する変異を含む。いくつかの
実施形態では、アデノシンデアミナーゼはTadA参照配列に対応する本明細書に記載した変
異のうち1つもしくは複数、または別のアデノシンデアミナーゼにおける1つもしくは複数
の対応する変異を含む。
【0289】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してE25Xの変異
、または別のアデノシンデアミナーゼにおける対応する変異を含み、ここでXは野生型ア
デノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつか
の実施形態では、アデノシンデアミナーゼはTadA参照配列に対してE25M、E25D、E25A、E2
5R、E25V、E25S、もしくはE25Yの変異、または別のアデノシンデアミナーゼにおける対応
する変異を含む。
【0290】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してR26Xの変異
、または別のアデノシンデアミナーゼにおける対応する変異を含み、ここでXは野生型ア
デノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつか
の実施形態では、アデノシンデアミナーゼはTadA参照配列に対してR26G、R26N、R26Q、R2
6C、R26L、もしくはR26Kの変異、または別のアデノシンデアミナーゼにおける対応する変
異を含む。
【0291】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してR107Xの変
異、または別のアデノシンデアミナーゼにおける対応する変異を含み、ここでXは野生型
アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつ
かの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してR107P、R07K、R107A
、R107N、R107W、R107H、もしくはR107Sの変異、または別のアデノシンデアミナーゼにお
ける対応する変異を含む。
【0292】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してA142Xの変
異、または別のアデノシンデアミナーゼにおける対応する変異を含み、ここでXは野生型
アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつ
かの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してA142N、A142D、A142
Gの変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
【0293】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してA143Xの変
異、または別のアデノシンデアミナーゼにおける対応する変異を含み、ここでXは野生型
アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつ
かの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してA143D、A143G、A143
E、A143L、A143W、A143M、A143S、A143Qおよび/もしくはA143Rの変異、または別のアデノ
シンデアミナーゼにおける対応する変異を含む。
【0294】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してH36X、N37X
、P48X、I49X、R51X、M70X、N72X、D77X、E134X、S146X、Q154X、K157X、および/もしく
はK161Xのうち1つもしくは複数の変異、または別のアデノシンデアミナーゼにおける対応
する1つもしくは複数の変異を含み、ここでXの存在は野生型アデノシンデアミナーゼにお
ける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシ
ンデアミナーゼはTadA参照配列に対してH36L、N37T、N37S、P48T、P48L、I49V、R51H、R5
1L、M70L、N72S、D77G、E134G、S146R、S146C、Q154H、K157N、および/もしくはK161Tの1
つもしくは複数の変異、または別のアデノシンデアミナーゼにおける1つもしくは複数の
対応する変異を含む。
【0295】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してH36Xの変異
、または別のアデノシンデアミナーゼにおける対応する変異を含み、ここでXは野生型ア
デノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつか
の実施形態では、アデノシンデアミナーゼはTadA参照配列に対してH36Lの変異、または別
のアデノシンデアミナーゼにおける対応する変異を含む。
【0296】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してN37Xの変異
、または別のアデノシンデアミナーゼにおける対応する変異を含み、ここでXは野生型ア
デノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつか
の実施形態では、アデノシンデアミナーゼはTadA参照配列に対してN37TもしくはN37Sの変
異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
【0297】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してP48Xの変異
、または別のアデノシンデアミナーゼにおける対応する変異を含み、ここでXは野生型ア
デノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつか
の実施形態では、アデノシンデアミナーゼはTadA参照配列に対してP48TもしくはP48Lの変
異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
【0298】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してR51Xの変異
、または別のアデノシンデアミナーゼにおける対応する変異を含み、ここでXは野生型ア
デノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつか
の実施形態では、アデノシンデアミナーゼはTadA参照配列に対してR51HもしくはR51Lの変
異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
【0299】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してS146Xの変
異、または別のアデノシンデアミナーゼにおける対応する変異を含み、ここでXは野生型
アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつ
かの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してS146RもしくはS146C
の変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
【0300】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してK157Xの変
異、または別のアデノシンデアミナーゼにおける対応する変異を含み、ここでXは野生型
アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつ
かの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してK157Nの変異、また
は別のアデノシンデアミナーゼにおける対応する変異を含む。
【0301】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してP48Xの変異
、または別のアデノシンデアミナーゼにおける対応する変異を含み、ここでXは野生型ア
デノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつか
の実施形態では、アデノシンデアミナーゼはTadA参照配列に対してP48S、P48T、もしくは
P48Aの変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
【0302】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してA142Xの変
異、または別のアデノシンデアミナーゼにおける対応する変異を含み、ここでXは野生型
アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつ
かの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してA142Nの変異、また
は別のアデノシンデアミナーゼにおける対応する変異を含む。
【0303】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してW23Xの変異
、または別のアデノシンデアミナーゼにおける対応する変異を含み、ここでXは野生型ア
デノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつか
の実施形態では、アデノシンデアミナーゼはTadA参照配列に対してW23RもしくはW23Lの変
異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
【0304】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してR152Xの変
異、または別のアデノシンデアミナーゼにおける対応する変異を含み、ここでXは野生型
アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつ
かの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してR152PもしくはR152H
の変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
【0305】
一実施形態では、アデノシンデアミナーゼは変異H36L、R51L、L84F、A106V、D108N、H1
23Y、S146C、D147Y、E155V、I156F、およびK157Nを含んでよい。いくつかの実施形態では
、アデノシンデアミナーゼはTadA参照配列に対して以下の変異の組合せを含み、ここでそ
れぞれの組合せの変異は「_」で分離され、それぞれの変異の組合せはカッコで括られて
いる。
(A106V_D108N), (R107C_D108N),
(H8Y_D108N_S127S_D147Y_Q154H), (H8Y_R24W_D108N_N127S_D147Y_E155V), (D108N_D147Y_
E155V), (H8Y_D108N_S127S), (H8Y_D108N_N127S_D147Y_Q154H), (A106V_D108N_D147Y_E15
5V), (D108Q_D147Y_E155V) (D108M_D147Y_E155V), (D108L_D147Y_E155V), (D108K_D147Y_
E155V), (D108I_D147Y_E155V),
(D108F_D147Y_E155V), (A106V_D108N_D147Y), (A106V_D108M_D147Y_E155V),
(E59A_A106V_D108N_D147Y_E155V), (E59A cat dead_A106V_D108N_D147Y_E155V),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156Y),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F), (D103A_D104N),
(G22P_D103A_D104N), (G22P_D103A_D104N_S138A), (D103A_D104N_S138A),
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F), (E25G_R26G_L8
4F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F), (E25D_R26G_L84F_A106V
_R107K_D108N_H123Y_A142N_A143G_D147Y_E155V_I156F),
(R26Q_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(E25M_R26G_L84F_A106V_R107P_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(R26C_L84F_A106V_R107H_D108N_H123Y_A142N_D147Y_E155V_I156F), (L84F_A106V_D108N_H
123Y_A142N_A143L_D147Y_E155V_I156F),
(R26G_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(E25A_R26G_L84F_A106V_R107N_D108N_H123Y_A142N_A143E_D147Y_E155V_I156F),
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(A106V_D108N_A142N_D147Y_E155V),
(R26G_A106V_D108N_A142N_D147Y_E155V),
(E25D_R26G_A106V_R107K_D108N_A142N_A143G_D147Y_E155V),
(R26G_A106V_D108N_R107H_A142N_A143D_D147Y_E155V),
(E25D_R26G_A106V_D108N_A142N_D147Y_E155V),
(A106V_R107K_D108N_A142N_D147Y_E155V),
(A106V_D108N_A142N_A143G_D147Y_E155V),
(A106V_D108N_A142N_A143L_D147Y_E155V),
(H36L_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N),
(N37T_P48T_M70L_L84F_A106V_D108N_H123Y_D147Y_I49V_E155V_I156F), (N37S_L84F_A106V
_D108N_H123Y_D147Y_E155V_I156F_K161T), (H36L_L84F_A106V_D108N_H123Y_D147Y_Q154H_
E155V_I156F), (N72S_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F), (H36L_P48L_
L84F_A106V_D108N_H123Y_E134G_D147Y_E155V_I156F), (H36L_L84F_A106V_D108N_H123Y_D1
47Y_E155V_I156F_K157N), (H36L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F), (
L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T), (N37S_R51H_D77G_L84F_A106
V_D108N_H123Y_D147Y_E155V_I156F), (R51L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F
_K157N), (D24G_Q71R_L84F_H96L_A106V_D108N_H123Y_D147Y_E155V_I156F_K160E), (H36L_
G67V_L84F_A106V_D108N_H123Y_S146T_D147Y_E155V_I156F),
(Q71L_L84F_A106V_D108N_H123Y_L137M_A143E_D147Y_E155V_I156F),
(E25G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L),
(L84F_A91T_F104I_A106V_D108N_H123Y_D147Y_E155V_I156F),
(N72D_L84F_A106V_D108N_H123Y_G125A_D147Y_E155V_I156F),
(P48S_L84F_S97C_A106V_D108N_H123Y_D147Y_E155V_I156F),
(W23G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(D24G_P48L_Q71R_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L),
(L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(H36L_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F
_K157N), (N37S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_K161T),
(L84F_A106V_D108N_D147Y_E155V_I156F),
(R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E), (R74Q
L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R74A_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_R98Q_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_R129Q_D147Y_E155V_I156F),
(P48S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(P48S_A142N),
(P48T_I49V_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_L157N),
(P48T_I49V_A142N),
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F), (H36L_P48
T_I49V_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_ I156F _K157
N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F _K161T),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152H_E155V_I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V _I156F _K157
N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_E155V_I156F _K157N
),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_R152P _E155V_I156F
_K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F _K161T),
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V _I156F _K157
N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_R152P_E155V_I156F _K157
N).
【0306】
ある実施形態では、本明細書で提供する融合タンパク質は、融合タンパク質の塩基編集
活性を改善する1つまたは複数の特徴を含む。たとえば、本明細書で提供する融合タンパ
ク質のいずれも、ヌクレアーゼ活性が低減したCas9度ドメインを含んでよい。いくつかの
実施形態では、本明細書で提供する融合タンパク質のいずれも、ヌクレアーゼ活性を有し
ないCas9ドメイン(dCas9)、または二本鎖DNA分子の1つの鎖を切断するCas9ニッカーゼ
(nCas9)と称されるCas9ドメインを有してよい。
【0307】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列中にD108Xの変異、
または別のアデノシンデアミナーゼにおける対応する変異を含み、ここでXは野生型アデ
ノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの
実施形態では、アデノシンデアミナーゼはD108G、D108N、D108V、D108A、もしくはD108Y
の変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
【0308】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してA106X、E15
5X、もしくはD147X、または別のアデノシンデアミナーゼにおける対応する変異を含み、
ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ
酸を示す。いくつかの実施形態では、アデノシンデアミナーゼはE155D、E155G、もしくは
E155Vの変異を含む。いくつかの実施形態では、アデノシンデアミナーゼはD147Yを含む。
【0309】
本明細書で提供する変異(たとえばTadA参照配列アミノ酸配列に基づく)のいずれも、
E. coli TadA(ecTadA)、S. aureus TadA(saTadA)、またはその他のアデノシンデアミ
ナーゼ(たとえば細菌のアデノシンデアミナーゼ)等の他のアデノシンデアミナーゼに導
入できることを認識されたい。TadA参照配列に対して同定された変異のいずれも、相同す
るアミノ酸残基を有する他のアデノシンデアミナーゼにおいて作成し得る。本明細書で提
供する変異のいずれも、TadA参照配列または別のアデノシンデアミナーゼに対して個別に
または任意の組合せで作成し得ることも認識されたい。
【0310】
たとえば、アデノシンデアミナーゼはD108N、A106V、E155V、および/もしくはD147Y、
または別のアデノシンデアミナーゼにおける対応する変異を含み得る。いくつかの実施形
態では、アデノシンデアミナーゼはTadA参照配列に対して以下の変異の群(変異の群を「
;」で分離する)、または別のアデノシンデアミナーゼにおける対応する変異を含む。D10
8NおよびA106V; D108NおよびE155V; D108NおよびD147Y; A106VおよびE155V; A106Vおよび
D147Y; E155VおよびD147Y; D108N、A106V、およびE55V; D108N、A106V、およびD147Y; D1
08N、E55V、およびD147Y; A106V、E55V、およびD147Y; ならびにD108N、A106V、E55V、お
よびD147Y。しかし、本明細書で提供する対応する変異の任意の組合せをアデノシンデア
ミナーゼにおいて作成してよいことを認識されたい(たとえばTadA参照配列またはecTadA
)。
【0311】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してH8X、T17X
、L18X、W23X、L34X、W45X、R51X、A56X、E59X、E85X、M94X、I95X、V102X、F104X、A106
X、R107X、D108X、Kll0X、M118X、N127X、A138X、F149X、M151X、R153X、Q154X、I156X、
および/もしくはK157Xの1つもしくは複数、または別のアデノシンデアミナーゼにおける1
つもしくは複数の対応する変異を含み、ここでXの存在は野生型アデノシンデアミナーゼ
における対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデ
ノシンデアミナーゼはTadA参照配列に対してH8Y、T17S、L18E、W23L、L34S、W45L、R51H
、A56E、またはA56S、E59G、E85K、またはE85G、M94L、1951、V102A、F104L、A106V、R10
7C、またはR107H、またはR107P、D108G、またはD108N、またはD108V、またはD108A、また
はD108Y、Kl101、Ml18K、N127S、A138V、F149Y、M151V、R153C、Q154L、I156D、および/
もしくはK157Rのうち1つもしくは複数、または別のアデノシンデアミナーゼにおける1つ
もしくは複数の対応する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼ
はTadA参照配列に対してH8X、D108X、および/もしくはN127Xのうち1つもしくは複数、ま
たは別のアデノシンデアミナーゼにおける1つもしくは複数の対応する変異を含み、ここ
でXは任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼ
はTadA参照配列に対してH8Y、D108N、および/もしくはN127Sのうち1つもしくは複数、ま
たは別のアデノシンデアミナーゼにおける1つもしくは複数の対応する変異を含む。
【0312】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してH8X、R26X
、M61X、L68X、M70X、A106X、D108X、A109X、N127X、D147X、R152X、Q154X、E155X、K161
X、Q163X、および/もしくはT166Xのうち1つもしくは複数、または別のアデノシンデアミ
ナーゼにおける1つもしくは複数の対応する変異を含み、ここでXは野生型アデノシンデア
ミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施
形態では、アデノシンデアミナーゼはTadA参照配列に対してH8Y、R26W、M61I、L68Q、M70
V、A106T、D108N、A109T、N127S、D147Y、R152C、Q154HもしくはQ154R、E155GもしくはE1
55VもしくはE155D、K161Q、Q163H、および/もしくはT166Pのうち1つもしくは複数、また
は別のアデノシンデアミナーゼにおける1つもしくは複数の対応する変異を含む。
【0313】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してH8X、D108X
、N127X、D147X、R152X、およびQ154Xからなる群から選択される1つ、2つ、3つ、4つ、5
つ、または6つの変異、または別のアデノシンデアミナーゼにおける対応する変異を含み
、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミ
ノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に
対してH8X、M61X、M70X、D108X、N127X、Q154X、E155X、およびQ163Xからなる群から選択
される1つ、2つ、3つ、4つ、5つ、6つ、7つ、もしくは8つの変異、または別のアデノシン
デアミナーゼにおける対応する変異を含み、ここでXは野生型アデノシンデアミナーゼに
おける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、
アデノシンデアミナーゼはTadA参照配列に対してH8X、D108X、N127X、E155X、およびT166
Xからなる群から選択される1つ、2つ、3つ、4つ、もしくは5つの変異、または別のアデノ
シンデアミナーゼにおける対応する変異を含み、ここでXは野生型アデノシンデアミナー
ゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。
【0314】
いくつかの実施形態では、アデノシンデアミナーゼは別のアデノシンデアミナーゼにお
けるH8X、A106X、D108Xからなる群から選択される1つ、2つ、3つ、4つ、5つ、もしくは6
つの変異を含み、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以
外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは
H8X、R126X、L68X、D108X、N127X、D147X、およびE155Xからなる群から選択される1つ、2
つ、3つ、4つ、5つ、6つ、7つ、もしくは8つの変異、または別のアデノシンデアミナーゼ
における対応する変異を含み、ここでXは野生型アデノシンデアミナーゼにおける対応す
るアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデ
アミナーゼはTadA参照配列に対してH8X、D108X、A109X、N127X、およびE155Xからなる群
から選択される1つ、2つ、3つ、4つ、もしくは5つの変異、または別のアデノシンデアミ
ナーゼにおける対応する変異を含み、ここでXは野生型アデノシンデアミナーゼにおける
対応するアミノ酸以外の任意のアミノ酸の存在を示す。
【0315】
いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してH8Y、D108N
、N127S、D147Y、R152C、and Q154Hからなる群から選択される1つ、2つ、3つ、4つ、5つ
、もしくは6つの変異、または別のアデノシンデアミナーゼにおける対応する変異を含む
。いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対してH8Y、M61I
、M70V、D108N、N127S、Q154R、E155GおよびQ163Hからなる群から選択される1つ、2つ、3
つ、4つ、5つ、6つ、7つ、もしくは8つの変異、または別のアデノシンデアミナーゼにお
ける対応する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼはTadA参照
配列に対してH8Y、D108N、N127S、E155V、およびT166Pからなる群から選択される1つ、2
つ、3つ、4つ、もしくは5つの変異、または別のアデノシンデアミナーゼにおける対応す
る変異を含む。いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対し
てH8Y、A106T、D108N、N127S、E155D、およびK161Qからなる群から選択される1つ、2つ、
3つ、4つ、5つ、もしくは6つの変異、または別のアデノシンデアミナーゼにおける対応す
る変異を含む。いくつかの実施形態では、アデノシンデアミナーゼはTadA参照配列に対し
てH8Y、R126W、L68Q、D108N、N127S、D147Y、およびE155Vからなる群から選択される1つ
、2つ、3つ、4つ、5つ、6つ、7つ、もしくは8つの変異、または別のアデノシンデアミナ
ーゼにおける対応する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは
TadA参照配列に対してH8Y、D108N、A109T、N127S、およびE155Gからなる群から選択され
る1つ、2つ、3つ、4つ、もしくは5つの変異、または別のアデノシンデアミナーゼにおけ
る対応する変異を含む。
【0316】
本明細書で提供する変異のいずれも、およびさらなる任意の変異(たとえばTadA参照配
列アミノ酸配列に基づく)は、他の任意のアデノシンデアミナーゼに導入することができ
る。本明細書で提供する変異のいずれも、TadA参照配列または別のアデノシンデアミナー
ゼに対して個別にまたは任意の組合せで作成することができる。
【0317】
AからGへの核酸塩基編集タンパク質の詳細は、その全体の内容が参照により本明細書に
組み込まれる国際PCT出願PCT/2017/045381 (WO 2018/027078)およびGaudelli, N.M., et
al., “Programmable base editing of A・T to G・C in genomic DNA without DNA clea
vage” Nature 551, 464-471 (2017)に記載されている。
【0318】
シチジンデアミナーゼ
一実施形態では、本発明の融合タンパク質はシチジンデアミナーゼを含む。いくつかの
実施形態では、本明細書で提供するシチジンデアミナーゼは、シトシンまたは5-メチルシ
トシンをウラシルまたはチミンに脱アミノ化することができる。いくつかの実施形態では
、本明細書で提供するシトシンデアミナーゼは、DNA中のシトシンを脱アミノ化すること
ができる。シチジンデアミナーゼは、任意の好適な生命体に由来し得る。いくつかの実施
形態では、シチジンデアミナーゼは、本明細書で提供する変異のいずれかに対応する1つ
または複数の変異を含む天然産生のシチジンデアミナーゼである。当業者であれば、たと
えば配列アラインメントおよび相同残基の決定によって、任意の相同性タンパク質中の対
応する残基を同定することができる。したがって、当業者であれば、本明細書に記載した
変異のいずれかに対応する任意の天然産生のシチジンデアミナーゼにおいて変異を産生す
ることができる。いくつかの実施形態では、シチジンデアミナーゼは原核生物からのもの
である。いくつかの実施形態では、シチジンデアミナーゼは細菌からのものである。いく
つかの実施形態では、シチジンデアミナーゼは哺乳類(たとえばヒト)からのものである
。
【0319】
いくつかの実施形態では、シチジンデアミナーゼは、本明細書で説明するシチジンデア
ミナーゼのアミノ酸配列のいずれか1つに対して少なくとも60%、少なくとも65%、少なく
とも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも9
5%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも
99.5%の同一性であるアミノ酸配列を含む。本明細書で提供するシチジンデアミナーゼは1
つまたは複数の変異(たとえば本明細書で提供する変異のいずれか)を含んでよいことを
認識されたい。本開示は、ある同一性百分率を有する任意のデアミナーゼドメインに加え
て本明細書に記載した変異のいずれかまたはそれらの組合せを提供する。いくつかの実施
形態では、シチジンデアミナーゼは、参照配列と比較して1、2、3、4、5、6、7、8、9、1
0、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、3
0、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、5
0もしくはそれを超える変異を有するアミノ酸配列、または本明細書で提供するシチジン
デアミナーゼのいずれかを含む。いくつかの実施形態では、シチジンデアミナーゼは、当
技術で既知のまたは本明細書に記載したアミノ酸配列のいずれか1つと比較して少なくと
も5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少な
くとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、
少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なく
とも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170の同一
の連続的なアミノ酸残基を有するアミノ酸配列を含む。
さらなるドメイン
【0320】
本明細書に記載した塩基エディターは、核酸塩基の編集、修飾、またはポリヌクレオチ
ドの核酸塩基の改変の促進を助ける任意のドメインを含み得る。いくつかの実施形態では
、塩基エディターはポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン(たと
えばCas9)、核酸塩基編集ドメイン(たとえばデアミナーゼドメイン)、および1つまた
は複数のさらなるドメインを含む。いくつかの場合には、さらなるドメインは、塩基エデ
ィターの酵素的または触媒的な機能、塩基エディターの結合機能を促進し、または所望の
塩基エディターの効果に干渉する可能性がある細胞装置(たとえば酵素)の阻害剤となり
得る。いくつかの実施形態では、塩基エディターは、ヌクレアーゼ、ニッカーゼ、リコン
ビナーゼ、デアミナーゼ、メチルトランスフェラーゼ、メチラーゼ、アセチラーゼ、アセ
チルトランスフェラーゼ、転写アクチベーター、または転写リプレッサードメインを含み
得る。
【0321】
いくつかの実施形態では、塩基エディターは、ウラシルグリコシラーゼ阻害剤(UGI)
ドメインを含み得る。UGIドメインは、たとえばCの脱アミノ化によって生成したUがC核酸
塩基に戻る変換を阻害することによって、シチジンデアミナーゼドメインを含む塩基エデ
ィターの効率を改善することができる。いくつかの場合には、U:Gヘテロ二本鎖DNAの存在
に対する細胞DNA修復応答が細胞における核酸塩基編集効率の低下に関与している可能性
がある。そのような場合には、ウラシルDNAグリコシラーゼ(UDG)は細胞中のDNAからのU
の除去を触媒することができ、これが塩基切除修復(BER)を開始し、多くの場合、U:G対
からのC:G対への逆行をもたらす。そのような場合には、一本鎖に結合する、編集された
塩基をブロックする、UGIを阻害する、BERを阻害する、編集された塩基を保護する、およ
び/または、編集されていない鎖の修復を促進する、1つまたは複数のドメインを含む塩基
エディターにおいて、BERを阻害することができる。したがって、本開示はUGIドメインを
含む塩基エディター融合タンパク質を意図している。
【0322】
いくつかの実施形態では、塩基エディターは二本鎖切断(DSB)結合タンパク質の全部
または一部をドメインとして含む。たとえば、DSB結合タンパク質には、DSBの末端に結合
することができ、それらを分解から保護することができるバクテリオファージMuのGamタ
ンパク質が含まれ得る。その全体の内容が参照により本明細書に組み込まれるKomor, A.C
., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam p
rotein yields C:G-to-T:A base editors with higher efficiency and product purity
” Science Advances 3:eaao4774 (2017)を参照されたい。
【0323】
いくつかの実施形態では、塩基エディターは核酸ポリメラーゼ(NAP)の全部または一
部をドメインとして含み得る。たとえば、塩基エディターは、真核生物のNAPの全部また
は一部を含み得る。いくつかの実施形態では、塩基エディターに組み込まれたNAPまたは
その部分はDNAポリメラーゼである。いくつかの実施形態では、塩基エディターに組み込
まれたNAPまたはその部分はトランスリージョンポリメラーゼ活性を有する。いくつかの
場合には、塩基エディターに組み込まれたNAPまたはその部分はトランスリージョンDNAポ
リメラーゼである。いくつかの実施形態では、塩基エディターに組み込まれたNAPまたは
その部分はRev7、Rev1複合体、ポリメラーゼイオタ、ポリメラーゼカッパ、またはポリメ
ラーゼエータである。いくつかの実施形態では、塩基エディターに組み込まれたNAPまた
はその部分は真核生物のポリメラーゼアルファ、ベータ、ガンマ、デルタ、イプシロン、
ガンマ、エータ、イオタ、カッパ、ラムダ、ミュー、またはニュー成分である。いくつか
の実施形態では、塩基エディターに組み込まれたNAPまたはその部分は、核酸ポリメラー
ゼ(たとえばトランスリージョンDNAポリメラーゼ)と少なくとも75%、80%、85%、90%、9
5%、96%、97%、98%、99%、または99.5%同一であるアミノ酸配列を含む。
【0324】
塩基エディターシステム
本明細書で提供する塩基エディターシステムの使用は、(a)対象のポリヌクレオチド
(たとえば二本鎖DNAまたはRNA、一本鎖DNAまたはRNA)の標的ヌクレオチド配列を、核酸
塩基エディター(たとえばアデノシン塩基エディターまたはシチジン塩基エディター)お
よびガイドポリ核酸(たとえばgRNA)を含む塩基エディターシステムと接触させるステッ
プであって、標的ヌクレオチド配列が標的された核酸塩基対を含むステップ、(b)前記
標的領域の鎖分離を誘起するステップ、(c)標的領域の一本鎖の中の前記標的核酸塩基
対の第1の核酸塩基を第2の核酸塩基に変換するステップ、ならびに(d)前記標的領域の1
個を超える鎖は切断せずに、第1の核酸塩基に相補的な第3の核酸塩基を第2の核酸塩基に
相補的な第4の核酸塩基によって置き換えるステップを含む。いくつかの実施形態では、
ステップ(b)は省略され得ることを認識されたい。いくつかの実施形態では、前記標的
核酸塩基対は1つまたは複数の遺伝子の中の複数の核酸塩基対である。いくつかの実施形
態では、本明細書で提供する塩基エディターシステムは、1つまたは複数の遺伝子の中の
複数の核酸塩基対の多重編集をすることができる。いくつかの実施形態では、複数の核酸
塩基対は同じ遺伝子の中に位置している。いくつかの実施形態では、複数の核酸塩基対は
1つまたは複数の遺伝子の中に位置しており、少なくとも1つの遺伝子は異なる遺伝子座の
中に位置している。
【0325】
いくつかの実施形態では、切断された一本鎖(ニックされた鎖)が、ガイド核酸にハイ
ブリダイズする。いくつかの実施形態では、切断された一本鎖は、第1の核酸塩基を含む
鎖に対向している。いくつかの実施形態では、塩基エディターはCas9ドメインを含む。い
くつかの実施形態では、第1の塩基はアデニンであり、第2の塩基はG、C、A、またはTでは
ない。いくつかの実施形態では、第2の塩基はイノシンである。
【0326】
本明細書で提供する塩基編集システムは、二本鎖DNA切断を生じることなく、ドナーDNA
テンプレートを必要とせず、過剰な確率論的な挿入および欠失を誘起することなしに、DN
Aにおいてプログラム可能な単一ヌクレオチド(C→TまたはA→G)の変化を誘起するため
の、触媒として欠陥のあるStreptococcus pyogenes Cas9、シチジンデアミナーゼ、およ
び塩基切除修復の阻害剤を含む融合タンパク質を用いるゲノム編集への新たなアプローチ
を提供する。
【0327】
塩基エディターシステムを用いて核酸塩基を編集するシステム、組成物、および方法が
本明細書で提供される。いくつかの実施形態では、塩基エディターシステムは(1)ポリ
ヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび核酸塩基を編集するため
の核酸塩基編集ドメイン(たとえばデアミナーゼドメイン)を含む塩基エディター(BE)
、および(2)ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインと組み合わ
せたガイドポリヌクレオチド(たとえばガイドRNA)を含む。いくつかの実施形態では、
塩基エディターシステムはシトシン塩基エディター(CBE)を含む。いくつかの実施形態
では、塩基エディターシステムはアデノシン塩基エディター(ABE)を含む。いくつかの
実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインはポリヌク
レオチドプログラム可能なDNA結合ドメインである。いくつかの実施形態では、ポリヌク
レオチドプログラム可能なヌクレオチド結合ドメインはポリヌクレオチドプログラム可能
なRNA結合ドメインである。いくつかの実施形態では、核酸塩基編集ドメインはデアミナ
ーゼドメインである。いくつかの場合には、デアミナーゼドメインはシトシンデアミナー
ゼまたはシチジンデアミナーゼであり得る。いくつかの実施形態では、用語「シトシンデ
アミナーゼ」と「シチジンデアミナーゼ」は相互交換可能に用いることができる。いくつ
かの場合には、デアミナーゼドメインはアデニンデアミナーゼまたはアデノシンデアミナ
ーゼであり得る。いくつかの実施形態では、用語「アデニンデアミナーゼ」と「アデノシ
ンデアミナーゼ」は相互交換可能に用いることができる。核酸塩基編集タンパク質の詳細
は、それぞれが参照により全体として本明細書に組み込まれる国際PCT出願PCT/2017/0453
81 (WO 2018/027078)およびPCT/US2016/058344 (WO 2017/070632)に記載されている。ま
た、その全体の内容が参照により本明細書に組み込まれるKomor, A.C., et al., “Progr
ammable editing of a target base in genomic DNA without double-stranded DNA clea
vage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base e
diting of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-47
1 (2017); および Komor, A.C., et al., “Improved base excision repair inhibition
and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher eff
iciency and product purity” Science Advances 3:eaao4774 (2017)を参照されたい。
【0328】
いくつかの実施形態では、塩基エディターは編集された鎖の塩基切除修復を阻害する。
いくつかの実施形態では、塩基エディターは編集されていない鎖を保護しまたはこれと結
合する。いくつかの実施形態では、塩基エディターはUGI活性を含む。いくつかの実施形
態では、塩基エディターは触媒不活性のイノシン特異的ヌクレアーゼを含む。いくつかの
実施形態では、塩基エディターはニッカーゼ活性を含む。いくつかの実施形態では、塩基
対の意図された編集はPAM部位の上流である。いくつかの実施形態では、塩基対の意図さ
れた編集はPAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18
、19、または20ヌクレオチド上流である。いくつかの実施形態では、塩基対の意図された
編集はPAM部位の下流である。いくつかの実施形態では、塩基対の意図された編集はPAM部
位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20
ヌクレオチド下流である。
【0329】
いくつかの実施形態では、本方法はカノニカル(たとえばNGG)PAM部位を必要としない
。いくつかの実施形態では、核酸塩基エディターはリンカーまたはスペーサーを含む。い
くつかの実施形態では、リンカーまたはスペーサーは1~25アミノ酸の長さである。いく
つかの実施形態では、リンカーまたはスペーサーは5~20アミノ酸の長さである。いくつ
かの実施形態では、リンカーまたはスペーサーは10、11、12、13、14、15、16、17、18、
19、または20アミノ酸の長さである。
【0330】
いくつかの実施形態では、標的領域は標的ウィンドウを含み、標的ウィンドウは標的核
酸塩基対を含む。いくつかの実施形態では、標的ウィンドウは1~10ヌクレオチドを含む
。いくつかの実施形態では、標的ウィンドウは1、2、3、4、5、6、7、8、9、10、11、12
、13、14、15、16、17、18、19、または20ヌクレオチドの長さである。いくつかの実施形
態では、塩基対の意図した編集は標的ウィンドウの中である。いくつかの実施形態では、
標的ウィンドウは塩基対の意図した編集を含む。いくつかの実施形態では、本方法は本明
細書で提供した塩基エディターのいずれかを用いて実施される。いくつかの実施形態では
、標的ウィンドウは脱アミノ化ウィンドウである。
【0331】
いくつかの実施形態では、塩基エディターはシチジン塩基エディター(CBE)である。
いくつかの実施形態では、非限定的で例示的なCBEはBE1 (APOBEC1-XTEN-dCas9)、BE2 (AP
OBEC1-XTEN-dCas9-UGI)、BE3 (APOBEC1-XTEN-dCas9(A840H)-UGI)、BE3-Gam、saBE3、saBE
4-Gam、BE4、BE4-Gam、saBE4、またはsaB4E-Gamである。BE4はAPOBEC1-Cas9n(D10A)リン
カーを32アミノ酸に、またCas9n-UGIリンカーを9アミノ酸に延長し、UGIの第2のコピーを
単一の塩基エディター構築物の中に、別の9アミノ酸リンカーを有する構築物のC末端に付
加する。塩基エディターsaBE3およびsaBE4は、S. pyogenesのCas9n(D10A)をより小さなS
. aureusのCas9n(D10A)で置き換えている。BE3-Gam、saBE3-Gam、BE4-Gam、およびsaBE4
-Gamは、BE3、saBE3、BE4、およびsaBE4のN末端に16アミノ酸のXTENリンカーを介して融
合したGamタンパク質の174残基を有する。
【0332】
いくつかの実施形態では、塩基エディターはアデノシン塩基エディター(ABE)である
。いくつかの実施形態では、アデノシン塩基エディターはDNA中のアデニンを脱アミノ化
することができる。いくつかの実施形態では、ABEはBE3のAPOBEC1成分を天然のもしくは
操作されたE. coli TadA、ヒトADAR2、マウスADA、またはヒトADAT2で置き換えることに
よって産生される。いくつかの実施形態では、ABEは進化されたTadAバリアントを含む。
いくつかの実施形態では、ABEはABE 1.2 (TadA*-XTEN-nCas9-NLS)である。いくつかの実
施形態では、TadA*はA106VおよびD108Nの変異を含む。
【0333】
いくつかの実施形態では、ABEは第2世代ABEである。いくつかの実施形態では、ABEはAB
E2.1であり、これはTadA*にさらなる変異D147YおよびE155Vを含む(TadA*2.1)。いくつ
かの実施形態では、ABEはABE2.2、即ちヒトアルキルアデニンDNAグリコシラーゼの触媒不
活性バージョン(E125Q変異を有するAAG)に融合したABE2.1である。いくつかの実施形態
では、ABEはABE2.3、即ちE. coli Endo Vの触媒不活性バージョン(D35Aの変異によって
不活化)に融合したABE2.1である。いくつかの実施形態では、ABEはABE2.1のリンカーの2
倍の長さのリンカー(32アミノ酸、(SGGS)2-XTEN-(SGGS)2)を有するABE2.6である。いく
つかの実施形態では、ABEはABE2.7であり、これはさらなる野生型TadAモノマーに連結さ
れたABE2.1である。いくつかの実施形態では、ABEはABE2.8であり、これはさらなるTadA*
2.1モノマーに連結されたABE2.1である。いくつかの実施形態では、ABEはABE2.9であり、
これは進化されたTadA(TadA*2.1)のABE2.1のN末端への直接融合である。いくつかの実
施形態では、ABEはABE2.10であり、これは野生型TadAのABE2.1のN末端への直接融合であ
る。いくつかの実施形態では、ABEはABE2.11であり、これはTadA*モノマーのN末端におけ
る不活化E59A変異を有するABE2.9である。いくつかの実施形態では、ABEはABE2.12であり
、これは内部TadA*モノマーにおける不活化E59A変異を有するABE2.9である。
【0334】
いくつかの実施形態では、ABEは第3世代ABEである。いくつかの実施形態では、ABEはAB
E3.1であり、これはさらなる3つのTadA変異(L84F、H123Y、およびI157F)を有するABE2.
3である。
【0335】
いくつかの実施形態では、ABEは第4世代ABEである。いくつかの実施形態では、ABEはAB
E4.3であり、これはさらなるTadA変異A142N(TadA*4.3)を有するABE3.1である。
【0336】
いくつかの実施形態では、ABEは第5世代ABEである。いくつかの実施形態では、ABEはAB
E5.1であり、これは生存するクローンからの変異のコンセンサスセット(H36L、R51L、S1
46C、およびK157N)をABE3.1にインポートすることによって産生される。いくつかの実施
形態では、ABEはABE5.3であり、これは内部の進化されたTadA*に融合した野生型E.coli T
adAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABEは下の表2に示すA
BE5.2、ABE5.4、ABE5.5、ABE5.6、ABE5.7、ABE5.8、ABE5.9、ABE5.10、ABE5.11、ABE5.12
、ABE5.13、またはABE5.14である。いくつかの実施形態では、ABEは第6世代ABEである。
いくつかの実施形態では、ABEは下の表2に示すABE6.1、ABE6.2、ABE6.3、ABE6.4、ABE6.5
、またはABE6.6である。いくつかの実施形態では、ABEは第7世代ABEである。いくつかの
実施形態では、ABEは下の表2に示すABE7.1、ABE7.2、ABE7.3、ABE7.4、ABE7.5、ABE7.6、
ABE7.7、ABE7.8、ABE 7.9、またはABE7.10である。
表2.ABEの遺伝子型
【表2】
【0337】
いくつかの実施形態では、塩基エディターは核酸塩基編集ドメイン(たとえばデアミナ
ーゼドメインの全部または一部)に融合したポリヌクレオチドプログラム可能なヌクレオ
チド結合ドメイン(たとえばCas9誘導ドメイン)を含む融合タンパク質である。いくつか
の実施形態では、塩基エディターはウラシルグリコシラーゼ阻害剤(UGI)の全部または
一部を含むドメインをさらに含む。いくつかの実施形態では、塩基エディターはウラシル
DNAグリコシラーゼ(UDG)等のウラシル結合タンパク質(UBP)の全部または一部を含む
ドメインを含む。いくつかの実施形態では、塩基エディターは核酸ポリメラーゼの全部ま
たは一部を含むドメインを含む。いくつかの実施形態では、塩基エディターに組み込まれ
た核酸ポリメラーゼまたはその部分は、トランスリージョンDNAポリメラーゼである。
【0338】
いくつかの実施形態では、塩基エディターのドメインは多重のドメインを含み得る。た
とえば、Cas9から誘導されたポリヌクレオチドプログラム可能なヌクレオチド結合ドメイ
ンを含む塩基エディターは、野生型または天然のCas9のRECローブおよびNUCローブに対応
するRECローブおよびNUCローブを含み得る。別の例では、塩基エディターはRuvCIドメイ
ン、BHドメイン、REC1ドメイン、REC2ドメイン、RuvCIIドメイン、L1ドメイン、HNHドメ
イン、L2ドメイン、RuvCIIIドメイン、WEDドメイン、TOPOドメイン、またはCTDドメイン
のうち1つもしくは複数を含み得る。いくつかの実施形態では、塩基エディターの1つまた
は複数のドメインは、そのドメインを含むポリペプチドの野生型バージョンに対する変異
(たとえば置換、挿入、欠失)を含む。たとえば、ポリヌクレオチドプログラム可能なDN
A結合ドメインのHNHドメインは、H840Aの置換を含み得る。別の例では、ポリヌクレオチ
ドプログラム可能なDNA結合ドメインのRuvCIドメインはD10Aの置換を含み得る。
【0339】
本明細書で開示した塩基エディターの様々なドメイン(たとえば隣接ドメイン)は、1
つもしくは複数のリンカードメイン(たとえばXTENリンカードメイン)を使用しまたは使
用せずに、互いに連結することができる。いくつかの場合には、リンカードメインは、2
つの分子または部分、たとえば第1のドメイン(たとえばCas9誘導ドメイン)と第2のドメ
イン(たとえばシチジンデアミナーゼドメインまたはアデノシンデアミナーゼドメイン)
のような融合タンパク質の2つのドメインを連結する結合(たとえば共有結合)、化学基
、または分子であり得る。いくつかの実施形態では、リンカーは共有結合(たとえば炭素
-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合、その他)である。ある実施形態で
は、リンカーはアミドリンケージの炭素窒素結合である。ある実施形態では、リンカーは
環状もしくは非環状、置換もしくは非置換、分枝もしくは非分枝の脂肪族またはヘテロ脂
肪族リンカーである。ある実施形態では、リンカーはポリマー性(たとえばポリエチレン
、ポリエチレングリコール、ポリアミド、ポリエステル等)である。ある実施形態では、
リンカーはアミノアルカン酸のモノマー、ダイマー、またはポリマーを含む。いくつかの
実施形態では、リンカーはアミノアルカン酸(たとえばグリシン、エタン酸、アラニン、
β-アラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸、その他)を含む
。いくつかの実施形態では、リンカーはアミノヘキサン酸(Ahx)のモノマー、ダイマー
、またはポリマーを含む。ある実施形態では、リンカーは炭素環部分(たとえばシクロペ
ンタン、シクロヘキサン)に基づく。他の実施形態では、リンカーはポリエチレングリコ
ール部分(PEG)を含む。ある実施形態では、リンカーはアリールまたはヘテロアリール
部分を含む。ある実施形態では、リンカーはフェニル環に基づく。リンカーはペプチドの
求核基(たとえばチオール、アミノ)のリンカーへの結合を促進するための官能性部分を
含み得る。リンカーの部分として任意の求電子基を用いることができる。例示的な求電子
基には、それだけに限らないが、活性化エステル、活性化アミド、マイケル受容体、アル
キルハライド、アリールハライド、アシルハライド、およびイソチオシアネートが含まれ
る。いくつかの実施形態では、リンカーは、Cas9ヌクレアーゼドメインを含むRNAプログ
ラム可能なヌクレアーゼのgRNA結合ドメインと核酸編集タンパク質の触媒ドメインとを接
合する。いくつかの実施形態では、リンカーはdCas9と第2のドメイン(たとえばシチジン
デアミナーゼ、UGI、その他)とを接合する。
【0340】
典型的には、リンカーは2つの基、分子、またはその他の部分の間、またはその傍に位
置して、共有結合を介して互いに連結し、それによって2つを連結する。いくつかの実施
形態では、リンカーはアミノ酸または複数のアミノ酸(たとえばペプチドまたはタンパク
質)である。いくつかの実施形態では、リンカーは有機分子、基、ポリマー、または化学
部分である。いくつかの実施形態では、リンカーは約2~100アミノ酸の長さ、たとえば2
、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、2
4、25、26、27、28、29、30~35、35~40、40~45、45~50、50~60、60~70、70~80、8
0~90、90~100、100~150、または150~200アミノ酸の長さである。いくつかの実施形態
では、リンカーは約3~約104(たとえば5、6、7、8、9、10、11、12、13、14、15、16、1
7、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、3
7、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、8
5、90、95、または100)アミノ酸の長さである。これより長い、または短いリンカーも意
図される。いくつかの実施形態では、リンカードメインはアミノ酸配列SGSETPGTSESATPES
を含み、これはXTENリンカーとも称される。核酸塩基エディターの活性のための最適の長
さを達成するために、(たとえば(SGGS)n、(GGGS)n、(GGGGS)n、および(G)nの形態の極め
て可撓性の高いリンカーから(EAAAK)n、(GGS)n、SGSETPGTSESATPES(たとえば全体の内容
は参照により本明細書に組み込まれるGuilinger JP, Thompson DB, Liu DR. Fusion of c
atalytically inactive Cas9 to FokI nuclease improves the specificity of genome m
odification. Nat. Biotechnol. 2014; 32(6): 577-82を参照されたい)、または(XP)n
モチーフの形態の極めて硬いリンカーまでの範囲の)融合タンパク質ドメインを連結する
ための任意の方法を採用することができる。いくつかの実施形態では、nは1、2、3、4、5
、6、7、8、9、10、11、12、13、14、または15である。いくつかの実施形態では、リンカ
ーは(GGS)nモチーフを含み、ここでnは1、3、または7である。いくつかの実施形態では
、本明細書で提供する融合タンパク質のCas9ドメインはアミノ酸配列SGSETPGTSESATPESを
含むリンカーを介して融合している。いくつかの実施形態では、リンカーは複数のプロリ
ン残基を含み、5~21、5~14、5~9、5~7アミノ酸の長さであり、たとえばPAPAP、PAPAP
A、PAPAPAP、PAPAPAPA、P(AP)4、P(AP)7、P(AP)10である(たとえば全体の内容が参照に
より本明細書に組み込まれるTan J, Zhang F, Karcher D, Bock R. Engineering of high
-precision base editors for site-specific single nucleotide replacement. Nat Com
mun. 2019 Jan 25;10(1):439を参照されたい)。そのようなプロリンの多いリンカーは、
「硬い」リンカーとも称される。
【0341】
本発明の融合タンパク質は核酸編集ドメインを含む。いくつかの実施形態では、核酸編
集ドメインはCからUへの塩基変更を触媒することができる。いくつかの実施形態では、核
酸編集ドメインはデアミナーゼドメインである。いくつかの実施形態では、デアミナーゼ
はシチジンデアミナーゼまたはアデノシンデアミナーゼデアミナーゼである。いくつかの
実施形態では、デアミナーゼはアポリポタンパク質B mRNA編集複合体(APOBEC)ファミリ
ーのデアミナーゼである。いくつかの実施形態では、デアミナーゼはAPOBEC1デアミナー
ゼである。いくつかの実施形態では、デアミナーゼはAPOBEC2デアミナーゼである。いく
つかの実施形態では、デアミナーゼはAPOBEC3デアミナーゼである。いくつかの実施形態
では、デアミナーゼはAPOBEC3Aデアミナーゼである。いくつかの実施形態では、デアミナ
ーゼはAPOBEC3Bデアミナーゼである。いくつかの実施形態では、デアミナーゼはAPOBEC3C
デアミナーゼである。いくつかの実施形態では、デアミナーゼはAPOBEC3Dデアミナーゼで
ある。いくつかの実施形態では、デアミナーゼはAPOBEC3Eデアミナーゼである。いくつか
の実施形態では、デアミナーゼはAPOBEC3Fデアミナーゼである。いくつかの実施形態では
、デアミナーゼはAPOBEC3Gデアミナーゼである。いくつかの実施形態では、デアミナーゼ
はAPOBEC3Hデアミナーゼである。いくつかの実施形態では、デアミナーゼはAPOBEC4デア
ミナーゼである。いくつかの実施形態では、デアミナーゼは活性化誘起デアミナーゼ(AI
D)である。いくつかの実施形態では、デアミナーゼは脊椎動物のデアミナーゼである。
いくつかの実施形態では、デアミナーゼは無脊椎動物のデアミナーゼである。いくつかの
実施形態では、デアミナーゼはヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット
、またはマウスのデアミナーゼである。いくつかの実施形態では、デアミナーゼはヒトの
デアミナーゼである。いくつかの実施形態では、デアミナーゼはラットのデアミナーゼ、
たとえばrAPOBEC1である。いくつかの実施形態では、デアミナーゼはPetromyzon marinus
のシチジンデアミナーゼ1(pmCDA1)である。いくつかの実施形態では、デアミナーゼは
ヒトのAPOBEC3Gである。いくつかの実施形態では、デアミナーゼはヒトのAPOBEC3Gの断片
である。いくつかの実施形態では、デアミナーゼはD316R D317Rの変異を含むヒトのAPOBE
C3Gのバリアントである。いくつかの実施形態では、デアミナーゼはヒトのAPOBEC3Gの断
片であり、D316R D317Rの変異に対応する変異を含む。いくつかの実施形態では、核酸編
集ドメインは本明細書に記載した任意のデアミナーゼのデアミナーゼドメインに対して少
なくとも80%、少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なく
とも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同
一性である。
【0342】
ガイドRNAを有するCas9複合体
本開示のいくつかの態様は、本明細書で提供する融合タンパク質のいずれかとガイドRN
A(たとえばRTT標的可能な変異を有するMecp2アリルを標的とするガイド)とを含む複合
体を提供する。
【0343】
いくつかの実施形態では、ガイド核酸(たとえばガイドRNA)は15~100ヌクレオチドの
長さであり、標的配列に相補的な少なくとも10個の連続的なヌクレオチドの配列を含む。
いくつかの実施形態では、ガイドRNAは15、16、17、18、19、20、21、22、23、24、25、2
6、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、4
6、47、48、49、または50ヌクレオチドの長さである。いくつかの実施形態では、ガイドR
NAは標的配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29
、30、31、32、33、34、35、36、37、38、39、または40個の連続的なヌクレオチドの配列
を含む。いくつかの実施形態では、標的配列はDNA配列である。いくつかの実施形態では
、標的配列は細菌、酵母、真菌、昆虫、植物、または動物のゲノムの配列である。いくつ
かの実施形態では、標的配列はヒトのゲノムの配列である。いくつかの実施形態では、標
的配列の3'末端はカノニカルPAM配列(NGG)に直接隣接している。いくつかの実施形態で
は、標的配列の3'末端は非カノニカルPAM配列(たとえば表1に列挙した配列または5'-NAA
-3')に直接隣接している。いくつかの実施形態では、ガイド核酸(たとえばガイドRNA)
はRTT標的可能な変異を有するMecp2アリル中の配列に相補的である。
【0344】
本開示のいくつかの態様は、融合タンパク質、または本明細書で提供する複合体を用い
る方法を提供する。たとえば、本開示のいくつかの態様は、DNA分子を本明細書で提供す
る融合タンパク質のいずれかおよび少なくとも1つのガイドRNAと接触させるステップを含
む方法を提供し、ガイドRNAは約15~100ヌクレオチドの長さであり、標的配列に相補的な
少なくとも10個の連続したヌクレオチドの配列を含む。いくつかの実施形態では、標的配
列の3'末端はAGC、GAG、TTT、GTG、またはCAA配列に直接隣接している。いくつかの実施
形態では、標的配列の3'末端は、NGA、NAA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、N
GTN、NGTN、NGTN、または5’(TTTV)配列に直接隣接している。
【0345】
それぞれの配列の中の特定の位置または残基の番号付けは特定のタンパク質および使用
した番号付けスキームによることが理解されよう。番号付けはたとえば成熟したタンパク
質の前駆体および成熟したタンパク質それ自体において異なり、種の間の配列の相違は番
号付けに影響することがある。当業者であれば、当技術で公知の方法によって、たとえば
配列アラインメントおよび相同性残基の決定によって、任意の相同性タンパク質の中およ
びそれぞれのコードする核酸の中のそれぞれの残基を同定することができる。
【0346】
本明細書で開示した融合タンパク質のいずれかを標的部位、たとえば編集すべき変異を
含む部位にターゲティングするために、典型的には融合タンパク質をガイドRNAとともに
共発現させる必要があることは、当業者には明白となる。本明細書の他の箇所により詳細
に説明したように、ガイドRNAは典型的にはCas9結合を可能にするtracrRNAフレームワー
クと、Cas9:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付与するガイド配列と
を含む。あるいは、ガイドRNAとtracrRNAとを2つの核酸分子として個別に提供してもよい
。いくつかの実施形態では、ガイドRNAは、ガイド配列が標的配列に相補的な配列を含む
という構造を含む。ガイド配列は典型的には20ヌクレオチドの長さである。Cas9:核酸編
集酵素/ドメイン融合タンパク質を特定のゲノム標的部位にターゲティングするために好
適なガイドRNAの配列は、本開示に基づいて当業者には明白になる。そのような好適なガ
イドRNA配列は、典型的には編集すべき標的ヌクレオチドの50ヌクレオチド上流または下
流の中の核酸配列に相補的なガイド配列を含む。提供した融合タンパク質のいずれかを特
定の標的配列にターゲティングするために好適ないくつかの例示的なガイドRNA配列を本
明細書に提供する。
【0347】
本明細書に開示した塩基エディターのドメインは、任意の順序に配置することができる
。たとえばポリヌクレオチドプログラム可能なヌクレオチド結合ドメインとデアミナーゼ
ドメインとを含む融合タンパク質を含む塩基エディターの非限定的な例は、以下のように
配置することができる。
NH2-[核酸塩基編集ドメイン]-リンカー1-[e.g., Cas9 由来ドメイン]-COOH;
NH2-[e.g., アデノシンデアミナーゼ]-リンカー1-[e.g., Cas9 由来ドメイン]-COOH;
NH2-[e.g., アデノシンデアミナーゼ]-リンカー1-[e.g., Cas9 由来ドメイン]-リンカ
ー2-[UGI]-COOH;
NH2-[e.g., TadA7.10]-リンカー1-[e.g., Cas9 由来ドメイン]-COOH;
NH2-[e.g., アデノシンデアミナーゼ]-リンカー1-[e.g., Cas9 由来ドメイン]-COOH;
NH2-[e.g., TadA7.10]-リンカー1-[e.g., Cas9 由来ドメイン]-COOH;
NH2-[e.g., TadA7.10]-リンカー1-[e.g., Cas9 由来ドメイン]-リンカー2-[UGI]-COOH
NH2-[e.g., アデノシンデアミナーゼ]-[e.g., Cas9 由来ドメイン]-COOH;
NH2-[e.g., Cas9 由来ドメイン]-[e.g., アデノシンデアミナーゼ]-COOH;
NH2-[e.g., アデノシンデアミナーゼ]-[e.g., Cas9 由来ドメイン]-[イノシンBER阻害
因子]-COOH;
NH2-[e.g., アデノシンデアミナーゼ]-[イノシンBER阻害因子]-[e.g., Cas9 由来ドメ
イン]-COOH;
NH2-[イノシンBER阻害因子]-[e.g., アデノシンデアミナーゼ]-[e.g., Cas9 由来ドメ
イン]-COOH;
NH2-[e.g., Cas9 由来ドメイン]-[e.g., アデノシンデアミナーゼ]-[イノシンBER阻害
因子]-COOH;
NH2-[e.g., Cas9 由来ドメイン]-[イノシンBER阻害因子]-[e.g., アデノシンデアミナ
ーゼ]-COOH; or
NH2-[イノシンBER阻害因子]-[e.g., Cas9 由来ドメイン]-[e.g., アデノシンデアミナ
ーゼ]-COOH.
【0348】
さらに、いくつかの場合には、Gamタンパク質を塩基エディターのN末端に融合させるこ
とができる。いくつかの場合には、Gamタンパク質を塩基エディターのC末端に融合させる
ことができる。バクテリオファージMuのGamタンパク質は二本鎖切断(DSB)の末端に結合
してこれを分解から保護することができる。いくつかの実施形態では、Gamを用いてDSBの
自由末端に結合させることによって、塩基編集のプロセスの間のインデルの形成を低減さ
せることができる。いくつかの実施形態では、174残基のGamタンパク質が塩基エディター
のN末端に融合される。Komor, A.C., et al., “Improved base excision repair inhibi
tion and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher
efficiency and product purity” Science Advances 3:eaao4774 (2017)を参照された
い。いくつかの場合には、変異は野生型ドメインに対する塩基エディタードメインの長さ
を変化させることができる。たとえば、少なくとも1つのドメインにおける少なくとも1つ
のアミノ酸の欠失は、塩基エディターの長さを低減させることができる。別の場合には、
変異は野生型ドメインに対するドメインの長さを変化させない。たとえば、任意のドメイ
ンにおける置換は、塩基エディターの長さを変化させ/変化させない。全てのドメインの
長さが野生型ドメインと同じそのような塩基エディターの非限定的な例には、
NH2-[APOBEC1]-リンカー1-[Cas9(D10A)]-リンカー2-[UGI]-COOH;
NH2-[CDA1]-リンカー1-[Cas9(D10A)]-リンカー2-[UGI]-COOH;
NH2-[AID]-リンカー1-[Cas9(D10A)]-リンカー2-[UGI]-COOH;
NH2-[APOBEC1]-リンカー1-[Cas9(D10A)]-リンカー2-[SSB]-COOH;
NH2-[UGI]-リンカー1-[ABOBEC1]-リンカー2-[Cas9(D10A)]-COOH;
NH2-[APOBEC1]-リンカー1-[Cas9(D10A)]-リンカー2-[UGI]-リンカー3-[UGI]-COOH;
NH2-[Cas9(D10A)]-リンカー1-[CDA1]-リンカー2-[UGI]-COOH;
NH2-[Gam]-リンカー1-[APOBEC1]-リンカー2-[Cas9(D10A)]-リンカー3-[UGI]-COOH;
NH2-[Gam]-リンカー1-[APOBEC1]-リンカー2-[Cas9(D10A)]-リンカー3-[UGI]-リンカー4
-[UGI]-COOH;
NH2-[APOBEC1]-リンカー1-[dCas9(D10A, H840A)]-リンカー2-[UGI]-COOH; or
NH2-[APOBEC1]-リンカー1-[dCas9(D10A, H840A)]-COOH
が含まれ得る。
【0349】
いくつかの実施形態では、本明細書で提供する塩基編集融合タンパク質は、正確な場所
、たとえば標的塩基が定義された領域(たとえば「脱アミノ化ウィンドウ」)の中に置か
れるところに位置している必要がある。いくつかの場合には、標的は4塩基領域の中にあ
り得る。いくつかの場合には、そのような定義された標的領域は、PAMのほぼ15塩基上流
であり得る。その全ての内容が参照により本明細書に組み込まれるKomor, A.C., et al.,
“Programmable editing of a target base in genomic DNA without double-stranded
DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmabl
e base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551
, 464-471 (2017); およびKomor, A.C., et al., “Improved base excision repair inh
ibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with hig
her efficiency and product purity” Science Advances 3:eaao4774 (2017)を参照され
たい。
【0350】
定義された標的領域は脱アミノ化ウィンドウであり得る。脱アミノ化ウィンドウは塩基
エディターが標的ヌクレオチドの上で作用し、これを脱アミノ化する定義された領域であ
り得る。いくつかの実施形態では、脱アミノ化ウィンドウは2、3、4、5、6、7、8、9、ま
たは10塩基領域の中である。いくつかの実施形態では、脱アミノ化ウィンドウはPAMの5、
6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25
塩基上流である。
【0351】
本開示の塩基エディターは、標的ポリヌクレオチド配列の編集を促進する任意のドメイ
ン、特徴、またはアミノ酸配列を含み得る。たとえば、いくつかの実施形態では、塩基エ
ディターは核局在化配列(NLS)を含む。いくつかの実施形態では、塩基エディターのNLS
はデアミナーゼドメインとポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン
との間に位置している。いくつかの実施形態では、塩基エディターのNLSはポリヌクレオ
チドプログラム可能なヌクレオチド結合ドメインのC末端に局在している。
【0352】
本明細書に開示した塩基エディターの中に存在し得る他の例示的な特徴は、細胞質内局
在化配列等の局在化配列、核エクスポート配列等のエクスポート配列、またはその他の局
在化配列、ならびに融合タンパク質の可溶化、精製、もしくは検出のために有用な配列タ
グである。本明細書で提供する好適なタンパク質タグには、それだけに限らないが、ビオ
チンカルボキシラーゼキャリアタンパク質(BCCP)タグ、mycタグ、カルモジュリンタグ
、FLAGタグ、ヘマグルチニン(HA)タグ、ヒスチジンタグもしくはHisタグとも称される
ポリヒスチジンタグ、マルトース結合タンパク質(MBP)タグ、nusタグ、グルタチオン-S
-トランスフェラーゼ(GST)タグ、緑色蛍光タンパク質(GFP)タグ、チオレドキシンタ
グ、Sタグ、ソフタグ(たとえばソフタグ1、ソフタグ3)、ストレップタグ、ビオチンリ
ガーゼタグ、F1AsHタグ、V5タグ、およびSBPタグが含まれる。さらなる好適な配列は当業
者には明白になる。いくつかの実施形態では、融合タンパク質は1つまたは複数のHisタグ
を含む。
【0353】
融合タンパク質に含まれ得るタンパク質ドメインの非限定的な例には、デアミナーゼド
メイン(たとえばシチジンデアミナーゼおよび/またはアデノシンデアミナーゼ)、ウラ
シルグリコシラーゼ阻害剤(UGI)ドメイン、エピトープタグ、レポーター遺伝子配列、
および/または以下の活性:メチラーゼ活性、デメチラーゼ活性、転写活性化活性、転写抑
制活性、転写リリース因子活性、ヒストン修飾活性、RNA開裂活性、および核酸結合活性
のうち1つもしくは複数を有するタンパク質ドメインが含まれる。さらなるドメインは異
種機能性ドメインであり得る。そのような異種機能性ドメインは、DNAのメチル化、DNAの
損傷、DNAの修復、標的DNAに関連する標的ポリペプチド(たとえばヒストン、DNA結合タ
ンパク質、その他)の修飾等の機能活性を付与し、たとえばヒストンのメチル化、ヒスト
ンのアセチル化、ヒストンのユビキチン化等をもたらすことができる。
【0354】
付与される他の機能には、メチルトランスフェラーゼ活性、デメチラーゼ活性、脱アミ
ノ化活性、ジスムターゼ活性、アルキル化活性、脱プリン化活性、酸化活性、ピリミジン
二量体形成活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポ
リメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、ホトリアーゼ活性もしくはグリコシラ
ーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホス
ファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱ア
デニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリス
トイル化活性、リモデリング活性、プロテアーゼ活性、オキシドリダクターゼ活性、トラ
ンスフェラーゼ活性、ヒドロラーゼ活性、リアーゼ活性、イソメラーゼ活性、シンターゼ
活性、シンセターゼ活性、および脱ミリストイル化活性、またはこれらの任意の組合せが
含まれ得る。
【0355】
エピトープタグの非限定的な例には、ヒスチジン(His)タグ、V5タグ、FLAGタグ、イ
ンフルエンザヘマグルチニン(HA)タグ、Mycタグ、VSV-Gタグ、およびチオレドキシン(
Trx)タグが含まれる。レポーター遺伝子の例には、それだけに限らないが、グルタチオ
ン-5-トランスフェラーゼ(GST)、セイヨウワサビペルオキシダーゼ(HRP)、クロラム
フェニコールアセチルトランスフェラーゼ(CAT)β-ガラクトシダーゼ、β-グルクロニ
ダーゼ、ルシフェラーゼ、緑色蛍光タンパク質(GFP)、HcRed、DsRed、シアン蛍光タン
パク質(CFP)、黄色蛍光タンパク質(YFP)、および青色蛍光タンパク質(BFP)を含む
自己蛍光タンパク質が含まれる。さらなるタンパク質配列には、それだけに限らないが、
マルトース結合タンパク質(MBP)、Sタグ、Lex A DNA結合ドメイン(DBD)融合、GAL4 D
NA結合ドメイン融合、およびヘルペスシンプレックスウイルス(HSV)BP16タンパク質融
合を含むDNA分子に結合しまたは他の細胞内分子に結合するアミノ酸配列が含まれ得る。
【0356】
塩基エディターの効率
CRISPR-Cas9ヌクレアーゼは、標的ゲノム編集を媒介するために広く用いられてきた。
大部分のゲノム編集用途では、Cas9はガイドポリヌクレオチド(たとえばシングルガイド
RNA(sgRNA))と複合体を形成し、sgRNA配列によって特定される標的部位において二本
鎖DNA切断(DSB)を誘起する。細胞は非相同末端接合(NHEJ)修復経路によって一次的に
このDSBに応答し、これは遺伝子を崩壊させるフレームシフト変異を引き起こし得る確率
論的な挿入または欠失(インデル)をもたらす。DSBの傍にある配列に対して高度の相同
性を有するドナーDNAテンプレートの存在下では、遺伝子の補正は相同性誘導型修復(HDR
)として知られている代替経路を通して達成され得る。残念ながら、大部分の非侵襲条件
下ではHDRは効率が低く、細胞の状態および細胞の型に依存し、高頻度のインデルが主と
なる。ヒトの疾患に関連する既知の遺伝子の変化の大部分は点変異であるので、より効率
的にかつ純粋に正確な点変異を作成することができる方法が必要である。本明細書で提供
する塩基編集システムは、二本鎖DNA切断を生じることなく、ドナーDNAテンプレートを必
要とせず、過剰な確率論的な挿入および欠失を誘起することなしに、ゲノム編集を編集す
る新しい方法を提供する。
【0357】
本明細書で提供する塩基エディターは、顕著な割合のインデルを生じることなしに、特
定のヌクレオチド塩基を改変することができる。用語「インデル」は、本明細書で用いる
場合、核酸の中におけるヌクレオチド塩基の挿入または欠失を意味する。そのような挿入
または欠失は、遺伝子のコーディング領域の中でフレームシフト変異をもたらし得る。い
くつかの実施形態では、標的のヌクレオチド配列において多数の挿入または欠失(即ちイ
ンデル)を生じることなしに、核酸の中の特定のヌクレオチドを効率的に改変する(たと
えば変異させまたは脱アミノ化する)塩基エディターを産生することが望ましい。ある実
施形態では、本明細書で提供する塩基エディターのいずれも、インデルに対してより大き
な割合の意図した改変(たとえば点変異または脱アミノ化)を生じることができる。
【0358】
いくつかの実施形態では、本明細書で提供する塩基エディターシステムのいずれも、標
的のポリヌクレオチド配列において50%未満、40%未満、30%未満、20%未満、19%未満、18%
未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%
未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、
0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、
0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.0
2%未満、または0.01%未満のインデル形成をもたらす。
【0359】
本開示のいくつかの態様は、本明細書で提供する塩基エディターのいずれも、顕著な数
の意図しない変異(意図しない点変異等)を生じることなしに核酸(たとえば対象のゲノ
ムの中の核酸)の中で点変異等の意図した変異を効率的に生じることができるという認識
に基づいている。
【0360】
いくつかの実施形態では、本明細書で提供する塩基エディターのいずれも、少なくとも
0.01%の意図した変異を生じることができる(即ち、塩基編集効率が少なくとも0.01%)。
いくつかの実施形態では、本明細書で提供する塩基エディターのいずれも、少なくとも0.
01%、1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、45%、50%、60%、70%、80%、
90%、95%、または99%の意図した変異を生じることができる。
【0361】
いくつかの実施形態では、本明細書で提供する塩基エディターは、意図した点変異対イ
ンデルの比を1:1より大きくすることができる。いくつかの実施形態では、本明細書で提
供する塩基エディターは、意図した点変異対インデルの比を少なくとも1.5:1、少なくと
も2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくと
も4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なく
とも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも8.5:1、少なくとも9:1、少なく
とも10:1、少なくとも11:1、少なくとも12:1、少なくとも13:1、少なくとも14:1、少なく
とも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なく
とも50:1、少なくとも100:1、少なくとも200:1、少なくとも300:1、少なくとも400:1、少
なくとも500:1、少なくとも600:1、少なくとも700:1、少なくとも800:1、少なくとも900:
1、もしくは少なくとも1000:1、またはそれより大きくできる。
【0362】
意図した変異およびインデルの数は、任意の好適な方法を用いて、たとえばその全体の
内容が参照により本明細書に組み込まれる国際PCT出願PCT/2017/045381 (WO 2018/027078
)およびPCT/US2016/058344 (WO 2017/070632);Komor, A.C., et al., “Programmable e
diting of a target base in genomic DNA without double-stranded DNA cleavage” Na
ture 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of
A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017);
および Komor, A.C., et al., “Improved base excision repair inhibition and bact
eriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency a
nd product purity” Science Advances 3:eaao4774 (2017)に記載されているように決定
することができる。
【0363】
いくつかの実施形態では、インデルの頻度を計算するために、インデルが起こり得るウ
ィンドウの両側の傍にある2つの10bpの配列に対する正確なマッチについて、シーケンシ
ングリードをスキャンする。正確なマッチが見つからなければ、そのリードは解析から除
外する。このインデルウィンドウの長さが参照配列と正確に一致すれば、そのリードはイ
ンデルを含まないと分類する。インデルウィンドウが参照配列より2塩基以上長いか短け
れば、そのシーケンシングリードをそれぞれ挿入または欠失と分類する。いくつかの実施
形態では、本明細書で提供する塩基エディターは、核酸の領域におけるインデルの形成を
制限することができる。いくつかの実施形態では、その領域は塩基エディターが標的とす
るヌクレオチドにあるか、または塩基エディターが標的とするヌクレオチドの2、3、4、5
、6、7、8、9、または10ヌクレオチド以内にある。
【0364】
標的ヌクレオチド領域で形成されるインデルの数は、核酸(たとえば細胞のゲノムの中
の核酸)が塩基エディターに曝露される時間に依存し得る。いくつかの実施形態では、イ
ンデルの数または割合は、標的ヌクレオチド配列(たとえば細胞のゲノムの中の核酸)を
塩基エディターに曝露して、少なくとも1時間、少なくとも2時間、少なくとも6時間、少
なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも
3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、または少なくと
も14日後に決定される。本明細書に記載した塩基エディターの特徴は融合タンパク質のい
ずれか、または本明細書で提供する融合タンパク質を用いる方法に適用できることを認識
されたい。
【0365】
多重編集
いくつかの実施形態では、本明細書で提供する塩基エディターシステムは、1つまたは
複数の遺伝子における複数の核酸塩基対を多重編集することができる。いくつかの実施形
態では、複数の核酸塩基対は同じ遺伝子の上に位置している。いくつかの実施形態では、
複数の核酸塩基対は1つまたは複数の遺伝子の上に位置しており、少なくとも1つの遺伝子
は異なる遺伝子座の上に位置している。いくつかの実施形態では、多重編集は1つまたは
複数のガイドポリヌクレオチドを含み得る。いくつかの実施形態では、多重編集は1つま
たは複数の塩基エディターシステムを含み得る。いくつかの実施形態では、多重編集はシ
ングルガイドポリヌクレオチドを含む1つまたは複数の塩基エディターシステムを含み得
る。いくつかの実施形態では、多重編集は複数のガイドポリヌクレオチドを含む1つまた
は複数の塩基エディターシステムを含み得る。いくつかの実施形態では、多重編集は単一
の塩基エディターシステムを含む1つまたは複数のガイドポリヌクレオチドを含み得る。
いくつかの実施形態では、多重編集は、標的ポリヌクレオチド配列への結合を標的とする
PAM配列を必要としない少なくとも1つのガイドポリヌクレオチドを含み得る。いくつかの
実施形態では、多重編集は、標的ポリヌクレオチド配列への結合を標的とするPAM配列を
必要とする少なくとも1つのガイドポリヌクレオチドを含み得る。いくつかの実施形態で
は、多重編集は、標的ポリヌクレオチド配列への結合を標的とするPAM配列を必要としな
い少なくとも1つのガイドポリヌクレオチドと、標的ポリヌクレオチド配列への結合を標
的とするPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドとの混合物を含み
得る。本明細書に記載した塩基エディターのいずれかを用いる多重編集の特徴は、本明細
書で提供する塩基エディターのいずれかを用いる方法の組合せのいずれにも適用できるこ
とを認識されたい。本明細書に記載した塩基エディターのいずれかを用いる多重編集は、
複数の核酸塩基対の順次的な編集を含み得ることも認識されたい。
【0366】
本明細書で提供する方法は、(a)対象のポリヌクレオチドの標的ヌクレオチド配列(
たとえば二本鎖DNA配列)を、核酸塩基エディター(たとえばアデノシン塩基エディター
またはシチジン塩基エディター)およびガイドポリ核酸(たとえばgRNA)を含む塩基エデ
ィターシステムと接触させるステップであって、標的ヌクレオチド配列が標的された核酸
塩基対を含むステップ、(b)前記標的領域の鎖分離を誘起するステップ、(c)標的領域
の一本鎖の中の前記標的核酸塩基対の第1の核酸塩基を第2の核酸塩基に編集するステップ
、ならびに(d)前記標的領域の1個を超える鎖は切断せずに、第1の核酸塩基に相補的な
第3の核酸塩基を第2の核酸塩基に相補的な第4の核酸塩基によって置き換えるステップを
含む。
【0367】
いくつかの実施形態では、前記複数の核酸塩基対は1つまたは複数の遺伝子の中にある
。いくつかの実施形態では、前記複数の核酸塩基対は同じ遺伝子の中にある。いくつかの
実施形態では、前記1つまたは複数の遺伝子の中の少なくとも1つの遺伝子は異なる遺伝子
座の中に位置している。
【0368】
いくつかの実施形態では、前記編集するステップは、少なくとも1つのタンパク質コー
ディング領域の中の前記複数の核酸塩基対を編集するステップである。いくつかの実施形
態では、前記編集するステップは、少なくとも1つのタンパク質非コーディング領域の中
の前記複数の核酸塩基対を編集するステップである。いくつかの実施形態では、前記編集
するステップは、少なくとも1つのタンパク質コーディング領域および少なくとも1つのタ
ンパク質非コーディング領域の中の前記複数の核酸塩基対を編集するステップである。
【0369】
いくつかの実施形態では、前記編集するステップは1つまたは複数のガイドポリヌクレ
オチドと組み合わされる。いくつかの実施形態では、前記塩基エディターシステムは1つ
または複数の塩基エディターシステムを含み得る。いくつかの実施形態では、前記塩基エ
ディターシステムはシングルガイドポリヌクレオチドと組み合わされた1つまたは複数の
塩基エディターシステムを含み得る。いくつかの実施形態では、前記塩基エディターシス
テムは複数のガイドポリヌクレオチドと組み合わされた1つまたは複数の塩基エディター
システムを含み得る。いくつかの実施形態では、前記編集するステップは単一の塩基エデ
ィターシステムを有する1つまたは複数のガイドポリヌクレオチドと組み合わされる。い
くつかの実施形態では、前記編集するステップは、標的ポリヌクレオチド配列への結合を
標的とするPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドと組み合わさ
れる。いくつかの実施形態では、前記編集するステップは、標的ポリヌクレオチド配列へ
の結合を標的とするPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドと組み
合わされる。いくつかの実施形態では、前記編集するステップは、標的ポリヌクレオチド
配列への結合を標的とするPAM配列を必要としない少なくとも1つのガイドポリヌクレオチ
ドと、標的ポリヌクレオチド配列への結合を標的とするPAM配列を必要とする少なくとも1
つのポリヌクレオチドとの混合物と組み合わされる。本明細書に記載した塩基エディター
のいずれかを用いる多重編集の特徴は、本明細書で提供する塩基エディターのいずれかを
用いる方法の組合せのいずれにも適用できることを認識されたい。前記編集するステップ
は、複数の核酸塩基対の順次的な編集を含み得ることも認識されたい。
【0370】
塩基エディターを使用する方法
疾患に関連する遺伝子およびアリルにおける点変異の補正は、治療および基礎研究にお
ける応用とともに、遺伝子の補正のための新たな戦略を提供する。
【0371】
本開示は、本明細書で提供する塩基エディターシステムによって補正することができる
点変異に関連しまたはこれによって引き起こされる疾患と診断された対象の治療のための
方法を提供する。たとえば、いくつかの実施形態では、そのような疾患、たとえば遺伝子
変異によって引き起こされる疾患を有する対象に、疾患関連遺伝子における点変異を補正
する有効量の核酸塩基エディター(たとえばアデノシンデアミナーゼ塩基エディターまた
はシチジンデアミナーゼ塩基エディター)を投与するステップを含む方法が提供される。
本開示は、デアミナーゼ介在遺伝子編集によって補正することができる点変異に関連しま
たはこれによって引き起こされるRTTの治療のための方法を提供する。いくつかのそのよ
うな疾患は本明細書に記載されており、本明細書で提供する戦略および融合タンパク質に
よって治療することができるさらなる好適な疾患は本開示に基づいて当業者には明白にな
る。それぞれの配列の中の特定の位置または残基の番号付けは特定のタンパク質および使
用した番号付けスキームによることが理解されよう。番号付けはたとえば成熟したタンパ
ク質の前駆体および成熟したタンパク質それ自体において異なり、種の間の配列の相違は
番号付けに影響することがある。当業者であれば、当技術で公知の方法によって、たとえ
ば配列アラインメントおよび相同性残基の決定によって、任意の相同性タンパク質の中お
よびそれぞれのコードする核酸の中のそれぞれの残基を同定することができる。
【0372】
疾患または障害に関連する標的ヌクレオチド配列において核酸塩基を編集するための塩
基エディターまたは塩基エディターシステムを用いる方法が本明細書で提供される。いく
つかの実施形態では、塩基エディター(たとえばアデノシンデアミナーゼおよびCas9ドメ
インを含む)の活性が点変異の補正をもたらす。いくつかの実施形態では、標的DNA配列
は疾患または障害に関連するG→Aの点変異を含み、変異体A塩基の脱アミノ化は疾患また
は障害に関連しない配列をもたらす。いくつかの実施形態では、標的DNA配列は疾患また
は障害に関連するT→Cの点変異を含み、変異体C塩基の脱アミノ化は疾患または障害に関
連しない配列をもたらす。
【0373】
いくつかの実施形態では、標的DNA配列はタンパク質をコードし、点変異はコドンの中
であって野生型コドンと比較して変異コドンによってコードされるアミノ酸の変化をもた
らす。いくつかの実施形態では、変異体Aの脱アミノ化は変異体コドンによってコードさ
れるアミノ酸の変化をもたらす。いくつかの実施形態では、変異体Aの脱アミノ化は野生
型アミノ酸をコードするコドンをもたらす。いくつかの実施形態では、変異体Cの脱アミ
ノ化は変異体コドンによってコードされるアミノ酸の変化をもたらす。いくつかの実施形
態では、変異体Cの脱アミノ化は野生型アミノ酸をコードするコドンをもたらす。いくつ
かの実施形態では、対象は疾患また障害を有するか有すると診断されている。
【0374】
いくつかの実施形態では、本明細書で提供するアデノシンデアミナーゼはDNAのデオキ
シアデノシン残基のアデニンを脱アミノ化することができる。本開示の他の態様は、アデ
ノシンデアミナーゼ(たとえば本明細書に記載したようにDNA中のデオキシアデノシンを
脱アミノ化するアデノシンデアミナーゼ)と、特定のヌクレオチド配列に結合することが
できるドメイン(たとえばCas9またはCpf1タンパク質)とを含む融合タンパク質を提供す
る。たとえば、アデノシンはイノシン残基に変換することができ、これは典型的にはシト
シン残基と塩基対を形成する。そのような融合タンパク質は核酸配列の標的編集にとりわ
け有用である。そのような融合タンパク質は、in vitroでのDNAの標的編集、たとえば変
異細胞または動物の産生のため、標的変異の導入、たとえばex vivoにおける細胞中、た
とえば対象から得られ、続いて同じ対象もしくは別の対象に再導入される細胞中における
遺伝子欠陥の補正のため、ならびにin vivoでの標的変異の導入、たとえば本明細書で提
供する核酸塩基エディターを用いて治療することができるGからA、またはTからCへの変異
における疾患関連遺伝子における遺伝子欠陥の補正または不活化変異の導入のために、用
いることができる。本開示は、デアミナーゼおよび核酸塩基エディターを利用するデアミ
ナーゼ、融合タンパク質、核酸、ベクター、細胞、組成物、方法、キット、システム、そ
の他を提供する。
【0375】
Mecp2遺伝子中のヌクレオチドを標的とする核酸塩基エディターの使用
Mecp2遺伝子中のヌクレオチドを標的とする核酸塩基エディターの適合性は本明細書に
記載したようにして評価される。一実施形態では、本明細書に記載した核酸塩基エディタ
ーをコードする核酸分子(複数可)を、レポーター(たとえばGFP)をコードする少量のベ
クターとともに用いて、目的の単一細胞をトランスフェクト、形質導入、または他の方法
で改変する。これらの細胞は293T、K562、またはU20S等の不死化ヒト細胞株であり得る。
あるいは、初代ヒト細胞を用いてよい。細胞は対象または個体から、たとえば組織生検、
手術、血液、血漿、血清、またはその他の生物学的流体から得てよい。そのような細胞は
最終的な細胞標的に関連したものであり得る。
【0376】
送達は、以下にさらに述べるようにウイルスベクターを用いて実施してよい。一実施形
態では、トランスフェクションは脂質トランスフェクション(リポフェクタミンまたはフ
ージーン等)またはエレクトロポレーションを用いて実施してよい。トランスフェクショ
ンに続いて、一貫した高レベルのトランスフェクションを確認する蛍光顕微鏡またはフロ
ーサイトメトリーによってGFPの発現を決定することができる。これらの予備的なトラン
スフェクションは、どのエディターの組合せが最大の活性を生じるかを決定するために様
々な核酸塩基エディターを含むことができる。
【0377】
核酸塩基エディターの活性は、本明細書に記載するように、即ち標的遺伝子をシーケン
シングして標的配列における改変を検出することによって評価する。サンガーシーケンシ
ングについては、精製したPCRアンプリコンをプラスミド骨格にクローニングし、トラン
スフォームし、ミニプレップし、単一のプライマーとともにシーケンシングする。シーケ
ンシングは次世代シーケンシング手法を用いて実施してもよい。次世代シーケンシングを
用いる場合には、アンプリコンは300~500bpであり、意図した切断部位を非対称に置く。
PCRに続いて、たとえば高スループットシーケンシングにおける使用のために(たとえばI
llumina社のMiSeqの上で)、次世代シーケンシングアダプターおよびバーコード(たとえ
ばIllumina社のマルチプレックスアダプターおよびインデックス)をアンプリコンの末端
に付加してよい。
【0378】
初期の試験で最大レベルの標的特異的改変を誘起する融合タンパク質を、さらなる評価
のために選択することができる。
【0379】
特定の実施形態では、核酸塩基エディターを用いて目的のポリヌクレオチドを標的化す
る。一実施形態では、本発明の核酸塩基エディターを、核酸配列、たとえばRTT関連変異
を有するMecp2ポリヌクレオチドを標的とするために用いるガイドRNAと組み合わせて細胞
(たとえばニューロン)に送達し、それにより標的遺伝子、即ちMecp2を改変する。
【0380】
いくつかの実施形態では、ガイドRNAによって塩基エディターをターゲティングして、1
つまたは複数の編集を目的の遺伝子の配列に導入する。いくつかの実施形態では、Mecp2
遺伝子に導入される1つまたは複数の改変は、下の表6に提示した通りである。
【0381】
意図した変異の産生
いくつかの実施形態では、本明細書で提供する方法の目的は、機能不全になった遺伝子
の機能を遺伝子編集によって回復することである。いくつかの実施形態では、機能不全に
なった遺伝子の機能は、意図した変異を導入することによって回復される。本明細書で提
供する核酸塩基編集タンパク質は、たとえばヒト細胞の培養において疾患関連変異を補正
することによって、遺伝子編集に基づくヒトの治療のためにin vitroで立証することがで
きる。本明細書で提供する核酸塩基編集タンパク質、たとえばポリヌクレオチドプログラ
ム可能なヌクレオチド結合ドメイン(たとえばCas9)と核酸塩基編集ドメイン(たとえば
アデノシンデアミナーゼドメインまたはシチジンデアミナーゼドメイン)とを含む融合タ
ンパク質が任意の単一点のAからGまたはCからTへの変異を補正するために用いられ得るこ
とは、当業者には理解されよう。前者の場合には変異体AからIへの脱アミノ化が変異を補
正し、後者の場合には変異体Tと塩基対を形成するAの脱アミノ化およびそれに続く一回の
複製が変異を補正する。
【0382】
いくつかの実施形態では、本開示は、顕著な数の意図しない変異(意図しない点変異等
)を生じることなしに核酸(たとえば対象のゲノムの中の核酸)の中で点変異等の意図し
た変異を効率的に生じることができる塩基エディターを提供する。いくつかの実施形態で
は、意図した変異は、意図した変異を生じるように特に設計した、ガイドポリヌクレオチ
ド(たとえばgRNA)に結合した特定の塩基エディター(たとえばシチジン塩基エディター
またはアデノシン塩基エディター)によって生じる変異である。いくつかの実施形態では
、意図した変異は疾患または障害に関連する変異である。いくつかの実施形態では、意図
した変異は疾患または障害に関連するアデニン(A)からグアニン(G)への点変異である
。いくつかの実施形態では、意図した変異は疾患または障害に関連するシトシン(C)か
らチミン(T)への点変異である。いくつかの実施形態では、意図した変異は、遺伝子のコ
ーディング領域または非コーディング領域の中のアデニン(A)からグアニン(G)への点
変異である。いくつかの実施形態では、意図した変異は、遺伝子のコーディング領域また
は非コーディング領域の中のシトシン(C)からチミン(T)への点変異である。いくつか
の実施形態では、意図した変異は、遺伝子のコーディング領域の中の停止コドン、たとえ
ば早すぎる停止コドンを生じる点変異である。いくつかの実施形態では、意図した変異は
、停止コドンを削除する変異である。
【0383】
いくつかの実施形態では、本明細書で提供する塩基エディターのいずれも、1:1より大
きい意図した変異対意図しない変異の比(たとえば意図した点変異:意図しない点変異)
を生じることができる。いくつかの実施形態では、本明細書で提供する塩基エディターの
いずれも、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なく
とも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少な
くとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少な
くとも10:1、少なくとも12:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少な
くとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも150:1、少
なくとも200:1、少なくとも250:1、少なくとも500:1、または少なくとも1000:1、または
それを超える、意図した変異対意図しない変異の比(たとえば意図した点変異:意図しな
い点変異)を生じることができる。
【0384】
塩基エディターの効率の詳細は、それぞれが参照により全体として本明細書に組み込ま
れる国際PCT出願PCT/2017/045381 (WO 2018/027078)およびPCT/US2016/058344 (WO 2017/
070632)に記載されている。また、その全体の内容が参照により本明細書に組み込まれるK
omor, A.C., et al., “Programmable editing of a target base in genomic DNA witho
ut double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et
al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cle
avage” Nature 551, 464-471 (2017); および Komor, A.C., et al., “Improved base
excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A b
ase editors with higher efficiency and product purity” Science Advances 3:eaao4
774 (2017)を参照されたい。
【0385】
いくつかの実施形態では、1つまたは複数の遺伝子の中の前記複数の核酸塩基対の前記
編集するステップは、少なくとも1つの意図した変異の形成をもたらす。いくつかの実施
形態では、前記少なくとも1つの意図した変異の前記形成は、疾患を引き起こす変異の正
確な補正をもたらす。本明細書に記載した塩基エディターの多重編集の特徴は本明細書で
提供する塩基エディターを用いる方法の組合せのいずれにも適用できることを認識された
い。
【0386】
病原性変異の正確な補正
いくつかの実施形態では、意図した変異は病原性変異または疾患を引き起こす変異の正
確な補正である。病原性変異は病原性の単一ヌクレオチド多型(SNP)であるか、またはS
NPに起因し得る。たとえば、病原性変異は遺伝子によってコードされるタンパク質におけ
るアミノ酸の変化であり得る。別の例では、病原性変異は遺伝子の中の病原性SNPであり
得る。正確な補正は病原性変異をその野生型の状態に逆行させることであり得る。いくつ
かの実施形態では、病原性変異は疾患または障害に関連するG→Aの点変異であり、変異体
A塩基のAからGへの塩基エディター(AGE)による脱アミノ化は、疾患または障害に関連し
ない配列をもたらす。いくつかの実施形態では、病原性変異はC→Tの点変異である。C→T
の点変異は、たとえばAからGへの塩基エディター(ABE)を対向する鎖に標的させ、病原
性T核酸塩基の相補体Aを編集することによって、補正することができる。いくつかの実施
形態では、病原性変異は疾患または障害に関連するT→Cの点変異であり、変異体C塩基のC
からTへの塩基エディター(BEまたはCBE)による脱アミノ化は、疾患または障害に関連し
ない配列をもたらす。いくつかの実施形態では、病原性変異はA→Gの点変異である。A→G
の点変異は、たとえば反対の鎖にCBEをターゲティングし、病原性G核酸塩基の相補鎖Cを
編集することによって、補正することができる。塩基エディターは、病原性SNPに、また
は病原性SNPの相補鎖に、ターゲティングされ得る。病原性変異または疾患原因変異およ
びその他の配列のバリエーションを記載する命名法は、その全体の内容が参照により本明
細書に組み込まれるden Dunnen, J.T. and Antonarakis, S.E., “Mutation Nomenclatur
e Extensions and Suggestions to Describe Complex Mutations: A Discussion.” Huma
n Mutation 15:712 (2000)に記載されている。
【0387】
特定の実施形態では、疾患または障害はレット症候群(RTT)である。いくつかの実施
形態では、病原性変異はMecp2遺伝子中にある。
【0388】
送達システム
本明細書に開示した塩基エディターは、ウイルスベクターに含まれる核酸にコードする
ことができる。例示的なウイルスベクターには、レトロウイルスベクター(たとえばマロ
ニーマウス白血病ウイルス、MML-V)、アデノウイルスベクター(たとえばAD100)、レン
チウイルスベクター(HIV系およびFIV系のベクター)、ヘルペスウイルスベクター(たと
えばHSV-2)、およびアデノ随伴ウイルスベクターが含まれる。
【0389】
アデノ随伴ウイルスベクター(AAV)
アデノ随伴ウイルス(「AAV」)ベクターは、細胞を標的の核酸で形質導入するため、
たとえば核酸およびペプチドのin vitro生成において、ならびにin vivoおよびex vivoの
遺伝子治療手順のためにも用いることができる(たとえばWest et al., Virology 160:38
-47 (1987); U.S. Patent No. 4,797,368; WO 93/24641; Kotin, Human Gene Therapy 5:
793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994)参照)。組み換えAAVベク
ターの構築は多くの刊行物に記載されており、それらには米国特許第5,173,414号; Trats
chin et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, et al., Mol. Cell.
Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); およびS
amulski et al., J. Virol. 63:03822-3828 (1989)が含まれる。
【0390】
in vivo送達に関しては、AAVは他のウイルスベクターよりも有利であり得る。いくつか
の場合には、AAVは、免疫応答を活性化する可能性のある細胞粒子の超遠心分離を必要と
しない精製方法のため、低い毒性が可能になる。いくつかの場合には、AAVは宿主ゲノム
の中に一体化しないので、挿入突然変異を引き起こす可能性が低い。
【0391】
AAVは、パルボウイルスファミリーに属する小さな、一本鎖DNAに依存するウイルスであ
る。4.7kbの野生型(wt)AAVゲノムは4つの複製タンパク質と3つのカプシドタンパク質を
それぞれコードする2つの遺伝子からなっており、145bpの逆転したターミナルリピート(
ITR)がいずれかの傍にある。ビリオンは、同じオープンリーディングフレームからであ
るが異なるスプライシング(Vp1)および択一的な翻訳開始部位(それぞれVp2およびVp3)
から1:1:10の比で生成する3つのカプシドタンパク質、Vp1、Vp2、およびVp3からなってい
る。Vp3はビリオン中で最も多いサブユニットであり、ウイルスの向性を定義する細胞表
面における受容体の認識に寄与している。ウイルスの感染性において機能するホスホリパ
ーゼドメインがVp1のユニークなN末端で同定されている。
【0392】
AAVは4.5kbまたは4.75kbのパッケージング限界を有している。したがって、開示した塩
基エディターならびにプロモーターおよび転写ターミネーターは単一のウイルスベクター
の中に存在することができる。4.5kbまたは4.75kbより大きな構築物はウイルス生成の顕
著な低減をもたらし得る。たとえば、SpCas9は極めて大きく、遺伝子それ自体が4.1kbを
超え、それにより、これをAAVの中にパッケージングすることが難しくなる。したがって
、本開示の実施形態には、従来の塩基エディターよりも長さが短い、開示した塩基エディ
ターを利用することが含まれる。いくつかの例では、塩基エディターは4kb未満である。
開示した塩基エディターは4.5kb、4.4kb、4.3kb、4.2kb、4.1kb、4kb、3.9kb、3.8kb、3.
7kb、3.6kb、3.5kb、3.4kb、3.3kb、3.2kb、3.1kb、3kb、2.9kb、2.8kb、2.7kb、2.6kb、
2.5kb、2kb、または1.5kb未満であり得る。いくつかの場合には、開示した塩基エディタ
ーは長さ4.5kbまたはそれ未満である。
【0393】
AAVは、AAV1、AAV2、AAV5、またはそれらの任意の組合せであり得る。標的とすべき細
胞に関してAAVの型を選択することができ、たとえば脳または神経の細胞を標的とするた
めにAAVの血清型1、2、5、もしくはハイブリッドカプシドAAV1、AAV2、AAV5、またはそれ
らの任意の組合せを選択することができ、心臓組織を標的とするためにAAV4を選択するこ
とができる。AAV8は肝臓への送達のために有用である。これらの細胞に関するある種のAA
V血清型の表は、Grimm, D. et al, J. Virol. 82: 5887-5911 (2008)に見出すことができ
る。
【0394】
wt AAVと同様に、組み換えAAV(rAAV)は、ベクタートランスジーンカセットの傍に存
在するcis-作用性145bpのITRを利用しており、外来DNAをパッケージングするために4.5kb
までを提供する。感染に続いて、rAAVは本発明の融合タンパク質を発現し、環状の頭尾コ
ンカテマーのかたちでエピソームとして存在することによって、宿主ゲノムに一体化する
ことなく持続することができる。in vitroおよびin vivoでこのシステムを用いるrAAVの
数多くの成功例があるが、遺伝子のコーディング配列の長さがwt AAVゲノムの大きさ以上
の場合には、パッケージング容量の限界がAAV介在遺伝子送達の使用を制限してきた。
【0395】
AAVベクターのパッケージング容量が小さいので、この大きさを超えるいくつかの遺伝
子の送達および/または大きな生理学的規制要素の使用は困難である。これらの課題は、
たとえば送達すべきタンパク質を2つ以上の断片に分割して、N末端断片を分割されたイン
テインNに融合し、C末端断片を分割されたインテインCに融合することによって対処する
ことができる。次いでこれらの断片を2つ以上のAAVベクターにパッケージングする。本明
細書で用いる場合、「インテイン」は、傍にあるN末端およびC末端のエクステイン(たと
えば接合すべき断片)をライゲートする自己スプライシングタンパク質イントロン(たと
えばペプチド)を意味する。非相同タンパク質断片を接合するためのある種のインテイン
の使用は、たとえばWood et al., J. Biol. Chem. 289(21); 14512-9 (2014)に記載され
ている。たとえば、分離されたタンパク質断片に融合すれば、インテインIntNおよびIntC
は相互に認識し、自身をスプライスすると同時に、それらが融合されたタンパク質断片の
隣接するN末端およびC末端のエクステインをライゲートし、それにより、2つのタンパク
質断片から全長のタンパク質を再構成する。その他の好適なインテインは、当業者には明
白になる。
【0396】
本発明の融合タンパク質の断片の長さは変動し得る。いくつかの実施形態では、タンパ
ク質断片は2アミノ酸から約1000アミノ酸の範囲の長さである。いくつかの実施形態では
、タンパク質断片は約5アミノ酸から約500アミノ酸の範囲の長さである。いくつかの実施
形態では、タンパク質断片は約20アミノ酸から約200アミノ酸の範囲の長さである。いく
つかの実施形態では、タンパク質断片は約10アミノ酸から約100アミノ酸の範囲の長さで
ある。他の長さの好適なタンパク質断片は、当業者には明白になる。
【0397】
いくつかの実施形態では、ヌクレアーゼ(たとえばCas9)の一部または断片は、インテ
インに融合される。ヌクレアーゼはインテインのN末端またはC末端に融合することができ
る。いくつかの実施形態では、融合タンパク質の一部または断片はインテインに融合され
、AAVカプシドタンパク質に融合される。インテイン、ヌクレアーゼ、およびカプシドタ
ンパク質は、任意の配置で共に融合することができる(たとえばヌクレアーゼ-インテイ
ン-カプシド、インテイン-ヌクレアーゼ-カプシド、カプシド-インテイン-ヌクレアーゼ
、その他)。いくつかの実施形態では、インテインのN末端は融合タンパク質のC末端に融
合され、インテインのC末端はAAVカプシドタンパク質のN末端に融合される。
【0398】
いくつかの実施形態では、大きなトランスジーン発現カセットを2つの個別の半体(5'
末端および3'末端、または頭尾)に分割することによって二重AAVベクターが産生され、
カセットのそれぞれの半体が単一のAAVベクター(5kb未満)にパッケージングされる。次
いで二重のAAVベクターの両方による同じ細胞の共感染およびそれに続く(1)5'および3'
のゲノムの間の相同組み換え(HR)(二重AAVオーバーラップベクター)、(2)5'および
3'のゲノムのITR媒介頭尾コンカタマー化(二重AAV trans-スプライシングベクター)、
または(3)これら2つの機構の組合せ(二重AAVハイブリッドベクター)によって、全長
のトランスジーン発現カセットの再アセンブリーが達成される。in vivoにおける二重AAV
ベクターの使用により、全長タンパク質の発現がもたらされる。二重AAVベクタープラッ
トフォームの使用は、大きさが4.7kbを超えるトランスジーンについての効率的で実行可
能な遺伝子導入戦略を表す。
【0399】
塩基エディターの送達のためのRNAまたはDNAウイルスに基づくシステムの使用は、ウイ
ルスを培養中または宿主中の特定の細胞に標的化させ、ウイルスの積荷を核または宿主細
胞のゲノムに輸送するための高度に進化したプロセスを利用するものである。ウイルスベ
クターは直接、培養中の細胞に、もしくは患者に投与することができ(in vivo)、また
はこれらを用いてin vitroで細胞を処理し、改変された細胞を任意で患者に投与すること
ができる(ex vivo)。ウイルスに基づく従来のシステムには、遺伝子導入のためのレト
ロウイルス、レンチウイルス、アデノウイルス、アデノ随伴およびヘルペスシンプレック
スウイルスベクターが含まれる。レトロウイルス、レンチウイルス、およびアデノ随伴ウ
イルスによる遺伝子導入法では宿主ゲノム中への一体化が可能であり、挿入されたトラン
スジーンの長期の発現がもたらされることが多い。さらに、多くの異なる細胞型および標
的組織において、高い形質導入効率が観察されている。
【0400】
レトロウイルスの向性は、外来のエンベロープタンパク質を組み込み、標的細胞の潜在
的な標的集団を拡大することによって改変することができる。レンチウイルスベクターは
、分裂していない細胞に形質導入しまたは感染して、典型的には高いウイルスタイターを
生成することができるレトロウイルスベクターである。したがって、レトロウイルス遺伝
子導入システムの選択は標的組織による。レトロウイルスベクターは、6~10kbまでの外
来配列のパッケージング容量を有するcis-作用性の長いターミナルリピートからなってい
る。最小のcis-作用性LTRはベクターの複製およびパッケージングのために十分であり、
続いてこれらは、治療遺伝子を標的細胞に挿入して永続的なトランスジーン発現を提供す
るために用いられる。広く用いられるレトロウイルスベクターには、マウス白血病ウイル
ス(MuLV)、テナガザル白血病ウイルス(GaLV)、サル免疫不全ウイルス(SIV)、ヒト
免疫不全ウイルス(HIV)、およびそれらの組合せに基づくベクターが含まれる(たとえば
Buchscher et al., J. Virol., 66:2731-2739 (1992); Johann et al., J. Virol. 66:16
35-1640 (1992); Sommnerfelt et al., Virol., 176:58-59 (1990); Wilson et al., J.
Virol. 63:2374-2378 (1989); Miller et al., J. Virol. 65:2220-2224 (1991); PCT/US
94/05700を参照されたい)。
【0401】
レトロウイルスベクター、特にレンチウイルスベクターは、標的細胞への効率的な組み
入れのために、所与の長さより小さいポリヌクレオチド配列を必要とすることがある。た
とえば、9kbより大きな長さのレトロウイルスベクターは、より小さな寸法のベクターと
比較して低いウイルスタイターをもたらすことがある。いくつかの態様では、本開示の塩
基エディターは、レトロウイルスベクターを介する標的細胞への効率的なパッケージング
および送達を可能にする十分な寸法を有している。いくつかの場合には、塩基エディター
は、ガイド核酸および/または標的可能なヌクレアーゼシステムの他の成分とともに発現
された場合でさえも、効率的なパッケージングおよび送達を可能にするための寸法を有し
ている。
【0402】
一時的な発現が好ましい応用では、アデノウイルスに基づくシステムを用いることがで
きる。アデノウイルスに基づくベクターは多くの細胞の型で極めて高い形質導入効率が可
能で、細胞の分裂を必要としない。そのようなベクターを用いて、高いタイターおよび発
現レベルが得られた。このベクターは比較的単純なシステムで大量に生成することができ
る。
【0403】
したがって、本明細書に記載した塩基エディターはウイルスベクターとともに送達する
ことができる。塩基エディターシステムの1つまたは複数の成分は、1つまたは複数のウイ
ルスベクターにコードすることができる。たとえば、塩基エディターおよびガイド核酸は
、単一のウイルスベクターにコードすることができる。他の場合には、塩基エディターお
よびガイド核酸は、異なるウイルスベクターにコードする。いずれの場合にも、塩基エデ
ィターおよびガイド核酸は、プロモーターおよびターミネーターにそれぞれ作動可能に連
結することができる。
【0404】
ウイルスベクターにコードされる成分の組合せは、選択したウイルスベクターの積荷の
大きさの制約によって決定することができる。
【0405】
塩基エディター、および適切な場合にはガイド核酸の発現を推進するために任意の好適
なプロモーターを用いることができる。普遍的な発現のため、用いることができるプロモ
ーターには、CMV、CAG、CBh、PGK、SV40、フェリチンの重鎖または軽鎖、その他が含まれ
る。脳またはその他のCNS細胞発現のため、好適なプロモーターには、全てのニューロン
にはSynapsinI、興奮性ニューロンにはCaMKIIα、GABA作動性ニューロンにはGAD67もしく
はGAD65またはVGAT、その他が含まれ得る。肝細胞の発現のため、好適なプロモーターに
はアルブミンプロモーターが含まれる。肺細胞の発現のため、好適なプロモーターにはSP
-Bが含まれ得る。内皮細胞のため、好適なプロモーターにはICAMが含まれ得る。造血細胞
のため、好適なプロモーターにはIFNβまたはCD45が含まれ得る。骨芽細胞のため、好適
なプロモーターにはOG-2が含まれ得る。
【0406】
塩基エディターをコードする核酸分子の発現を推進するために用いられるプロモーター
には、AAV ITRが含まれ得る。これは、ベクター中のスペースを取り得るさらなるプロモ
ーター要素の必要性を除去するために有利であり得る。解放された追加のスペースは、ガ
イド核酸または選択可能なマーカーのようなさらなる要素の発現を推進するために用いる
ことができる。ITRの活性は比較的弱く、したがって選択したヌクレアーゼの過発現によ
る潜在的な毒性を低減するために用いることができる。
【0407】
いくつかの場合には、本開示の塩基エディターは十分に小さな寸法なので、同じ核酸分
子の中で個別のプロモーターが塩基エディターおよび親和性のガイド核酸の発現を推進す
ることが可能になる。たとえば、ベクターまたはウイルスベクターは、塩基エディターを
コードする核酸に作動可能に連結された第1のプロモーターと、ガイド核酸に作動可能に
連結された第2のプロモーターとを含むことができる。
【0408】
ガイド核酸の発現を推進するために用いられるプロモーターは、U6またはH1等のPol II
Iプロモーターを含み得る。gRNAアデノ随伴ウイルス(AAV)を発現するためのPol IIプロ
モーターおよびイントロンカセットの使用。
【0409】
1つもしくは複数のガイド核酸を含むまたは含まない本明細書に記載した塩基エディタ
ーは、アデノ随伴ウイルス(AAV)、レンチウイルス、アデノウイルス、またはその他の
プラスミドもしくはウイルスベクター型を用いて、特にたとえば米国特許第8,454,972号
(アデノウイルスの処方、用量)、米国特許第8,404,658号(AAVの処方、用量)、および
米国特許第5,846,946号(DNAプラスミドの処方、用量)、ならびにレンチウイルス、AAV
、およびアデノウイルスを含む臨床試験および臨床試験に関する出版物からの処方および
用量を用いて、送達することができる。たとえば、AAVについては、投与経路、処方、お
よび用量は米国特許第8,454,972号およびAAVを含む臨床試験によることができる。アデノ
ウイルスについては、投与経路、処方、および用量は米国特許第8,404,658号およびアデ
ノウイルスを含む臨床試験によることができる。プラスミドの送達については、投与経路
、処方、および用量は米国特許第5,846,946号およびプラスミドを含む臨床研究によるこ
とができる。用量は平均70kgの個体(たとえば男性成人)に基づきまたはこれを外挿する
ことができ、異なる体重および種の患者、対象、哺乳類について調整することができる。
投与の頻度は医学または獣医学の施術者(たとえば医師、獣医師)の裁量範囲内で、患者
もしくは対象の年齢、性別、一般的健康状態、その他の条件、および対処すべき特定の病
態または症状を含む通常の要素に依存する。ウイルスベクターは目的の組織に注射するこ
とができる。細胞型特異的塩基編集については、塩基エディターおよび任意選択のガイド
核酸の発現は細胞型特異的プロモーターによって推進することができる。
【0410】
レンチウイルスは、有糸分裂中および有糸分裂後の細胞に感染し、その中でその遺伝子
を発現する能力を有する複雑なレトロウイルスである。最も一般に知られているレンチウ
イルスはヒト免疫不全ウイルス(HIV)であり、これは他のウイルスのエンベロープ糖タ
ンパク質を用いて広範囲の細胞型を標的とする。
【0411】
レンチウイルスは以下のように調製することができる。pCasES10(これはレンチウイル
ス導入プラスミド骨格を含む)をクローニングした後、トランスフェクションの前日に、
低継代(p=5)のHEK293FTを、10%のウシ胎児血清を含み抗生剤を含まないDMEM中で50%コ
ンフルエンスまで、T-75フラスコに播種した。20時間後に培地をOptiMEM(無血清)培地
に交換し、4時間後にトランスフェクションを行なった。細胞を、10μgのレンチウイルス
導入プラスミド(pCasES10)ならびに以下のパッケージングプラスミド:5μgのpMD2.G(V
SV-gプソイドタイプ)および7.5μgのpsPAX2(gag/pol/rev/tat)でトランスフェクトす
る。トランスフェクションは、カチオン性脂質送達剤(50μlのリポフェクタミン2000お
よび100μlのプラス剤)を含む4mLのOptiMEM中で行なうことができる。6時間後に、培地
を10%のウシ胎児血清を含む無抗生剤のDMEMに交換する。これらの方法では細胞培養中に
血清を用いるが、無血清法が好ましい。
【0412】
レンチウイルスは下記のように精製することができる。48時間後にウイルス上清を収穫
する。上清から最初にデブリを除去し、0.45μmの低タンパク質結合(PDVF)フィルター
で濾過する。次いでこれを24,000rpmで2時間、超遠心する。ウイルスペレットを50μlのD
MEMに4℃で一夜再懸濁する。次いでこれらを分注し、直ちに-80℃で凍結する。
【0413】
別の実施形態では、ウマ感染性貧血ウイルス(EIAV)に基づく最小の非霊長類レンチウ
イルスベクターも意図される。別の実施形態では、RetinoStat RTM、即ち網膜下注射を介
して送達することを意図した、血管新生抑制タンパク質、即ちエンドスタチンおよびアン
ギオスタチンを発現するウマ感染性貧血ウイルス系レンチウイルス遺伝子治療ベクター。
別の実施形態では、自己不活化レンチウイルスベクターの使用が意図される。
【0414】
本システムの任意のRNA、たとえばガイドRNAまたは塩基エディターコーディングmRNAは
、RNAの形態で送達することができる。塩基エディターコーディングmRNAは、in vitro転
写を用いて産生することができる。たとえば、ヌクレアーゼmRNAは、以下の要素:T7プロ
モーター、任意選択のKozak配列(GCCACC)、ヌクレアーゼ配列、およびβグロビン-ポリ
Aテイルからの3'UTR等の3'UTRを含むPCRカセットを用いて合成することができる。カセッ
トは、T7ポリメラーゼによる転写のために用いることができる。ガイドポリヌクレオチド
(たとえばgRNA)は、T7プロモーターを含むカセット、続いて配列「GG」、およびガイド
ポリヌクレオチド配列から、in vitro転写を用いて転写することもできる。
【0415】
発現を促進して可能な毒性を低減するために、塩基エディターコーディング配列および
/またはガイド核酸を、たとえばプソイドUまたは5-メチル-Cを用いて1つまたは複数の修
飾されたヌクレオシドを含むように修飾することができる。
【0416】
いくつかの実施形態における開示は、細胞または生命体を修飾する方法を包含する。細
胞は原核細胞または真核細胞であり得る。細胞は哺乳類細胞であり得る。哺乳類細胞は非
ヒト霊長類、ウシ、ブタ、げっ歯類、またはマウスの細胞であってよい。本開示の塩基エ
ディター、組成物、および方法によって細胞に導入される修飾は、細胞および細胞の子孫
が、抗体、デンプン、アルコール、またはその他の望ましい細胞産物等の生物学的生成物
の改善された生成のために改変されるようなものであり得る。本開示の方法によって細胞
に導入される修飾は、細胞および細胞の子孫が、生成される生物学的生成物を変化させる
改変を含むようなものであり得る。
【0417】
本システムは1つまたは複数の異なるベクターを含み得る。一態様では、塩基エディタ
ーは所望の細胞型、優先的には真核細胞、好ましくは哺乳類細胞またはヒト細胞における
発現のためにコドン最適化される。
【0418】
一般に、コドン最適化は、天然の配列の少なくとも1つのコドン(たとえば約1、2、3、
4、5、10、15、20、25、50、またはそれを超えるコドン)を、天然のアミノ酸配列を維持
しながら、その宿主細胞の遺伝子の中でより頻繁にまたは最も頻繁に用いられるコドンに
置き換えることによって、目的の宿主細胞の中の発現が促進されるように核酸配列を修飾
するプロセスを意味する。種々の種は特定のアミノ酸のあるコドンについて特定のバイア
スを呈する。コドンのバイアス(生命体の間のコドンの使用法における差異)は、メッセ
ンジャーRNA(mRNA)の翻訳の効率と相関することが多く、これはとりわけ、翻訳される
コドンの特性および特定のトランスファーRNA(tRNA)分子の利用可能性に依存すると考
えられている。細胞中の選択されたtRNAの優位性は一般に、ペプチド合成において最も頻
繁に用いられるコドンの反映である。したがって、遺伝子は所与の生命体の中で、コドン
最適化に基づいて最適の遺伝子発現ができるように調整され得る。コドン使用法の表は、
たとえばwww.kazusa.orjp/codon/ で入手可能な「Codon Usage Database」(2002年7月9
日閲覧)で容易に入手可能であり、これらの表はいくつかの方法で適応させることができ
る。Nakamura, Y., et al. "Codon usage tabulated from the international DNA seque
nce databases: status for the year 2000" Nucl. Acids Res. 28:292 (2000)を参照さ
れたい。特定の宿主細胞中での発現のための特定の配列をコドン最適化するコンピュータ
アルゴリズムも利用可能であり、Gene Forge (Aptagen;Jacobus,Pa)も利用可能である
。いくつかの実施形態では、操作されたヌクレアーゼをコードする配列における1つまた
は複数のコドン(たとえば1、2、3、4、5、10、15、20、25、50、もしくはそれを超える
、または全てのコドン)が、特定のアミノ酸に対して最も頻繁に用いられるコドンに対応
している。
【0419】
宿主細胞に感染することができるウイルス粒子を形成するために、典型的にはパッケー
ジング細胞が用いられる。そのような細胞には、アデノウイルスを詰め込む293細胞およ
びレトロウイルスを詰め込むpsi.2細胞またはPA317細胞が含まれる。遺伝子治療に用いら
れるウイルスベクターは通常、核酸ベクターをウイルス粒子の中にパッケージングする細
胞株を生成することによって産生される。ベクターは、典型的にはパッケージングおよび
引き続く宿主への組み入れのために必要な最小のウイルス配列を含み、他のウイルス配列
は発現すべきポリヌクレオチドのための発現カセットによって置き換えられる。失われた
ウイルス機能は、典型的にはパッケージング細胞株によってトランスで供給される。たと
えば、遺伝子治療で用いられるAAVベクターは、典型的にはパッケージングおよび宿主ゲ
ノムへの組み入れのために必要なAAVゲノムからのITR配列を有するのみである。ウイルス
DNAは、他のAAV遺伝子、即ちrepおよびcapをコードするヘルパープラスミドを含むがITR
配列を欠く細胞株に詰め込むことができる。細胞株はヘルパーとしてのアデノウイルスに
感染させることもできる。ヘルパーウイルスは、AAVベクターの複製およびヘルパープラ
スミドからのAAV遺伝子の発現を促進することができる。いくつかの場合におけるヘルパ
ープラスミドは、ITR配列を欠いているために顕著な量でパッケージングされることがで
きない。アデノウイルスによる汚染は、たとえばアデノウイルスがAAVよりも感受性が高
い熱処理によって低減することができる。
【0420】
塩基エディターの非ウイルス送達
塩基エディターの送達のための非ウイルス送達アプローチも利用可能である。非ウイル
ス核酸ベクターの1つの重要なカテゴリーは、有機または無機であり得るナノ粒子である
。ナノ粒子は当技術で公知である。ゲノム編集システムの成分またはそのような成分をコ
ードする核酸を送達するために、任意の好適なナノ粒子設計を用いることができる。たと
えば、有機(たとえば脂質および/またはポリマー)ナノ粒子は、本開示のある実施形態
における送達ビヒクルとしての使用のために好適であり得る。ナノ粒子の処方および/ま
たは遺伝子導入における使用のための例示的な脂質を、表3(以下)に示す。
【表3】
表4は、遺伝子移入および/またはナノ粒子製剤における使用のための例示的ポリマー
を列記する。
【表4】
表5は、本明細書に記載する融合タンパク質をコードするポリヌクレオチドのための送
達方法を要約する。
【表5】
【0421】
別の態様では、ゲノム編集システム成分またはそのような成分をコードする核酸、たと
えばCas9もしくはそのバリアント等の核酸結合タンパク質、および目的のゲノム核酸配列
を標的とするgRNA等の送達は、リボヌクレオタンパク質(RNP)を細胞に送達することに
よって達成してよい。RNPは標的gRNAとの複合体をなす核酸結合タンパク質、たとえばCas
9を含む。RNPは、たとえばZuris, J.A. et al., 2015, Nat. Biotechnology, 33(1):73-8
0によって報告されたエレクトロポレーション、ヌクレオフェクション、またはカチオン
性脂質媒介法等の既知の方法を用いて細胞に送達してよい。RNPはCRISPR塩基編集システ
ムにおける使用について、特に初代細胞のようにトランスフェクトすることが難しい細胞
について有利である。さらに、RNPは細胞におけるタンパク質の発現に伴って、特にCRISP
Rプラスミドで用いられる真核生物プロモーター、たとえばCMVまたはEF1Aがよく発現しな
い場合に起こり得る困難を軽減することもできる。有利なことに、RNPの使用は外来DNAの
細胞中への送達を必要としない。さらに、核酸結合タンパク質とgRNA複合体とを含むRNP
は経時的に分解するので、RNPの使用はオフターゲット効果を制限する可能性がある。プ
ラスミドに基づく手法と同様に、RNPは結合タンパク質(たとえばCas9バリアント)を送
達し、相同性誘導型修復(HDR)を導くために用いることができる。
【0422】
医薬組成物
本開示の他の態様は、本明細書に記載した塩基エディター、融合タンパク質、または融
合タンパク質-ガイドポリヌクレオチド複合体のいずれかを含む医薬組成物に関する。用
語「医薬組成物」は、本明細書で用いる場合、薬学的用途のために処方された組成物を意
味する。いくつかの実施形態では、医薬組成物は、薬学的に許容される担体をさらに含む
。いくつかの実施形態では、医薬組成物は、さらなる薬剤(たとえば特定の送達のため、
半減期を延長するため、またはその他の治療用化合物)を含む。
【0423】
ここで用いる場合、用語「薬学的に許容される担体」は、薬学的に許容される材料、組
成物、またはビヒクル、たとえば液体もしくは固体のフィラー、希釈剤、賦形剤、製造助
剤(たとえば滑剤、タルクマグネシウム、ステアリン酸カルシウムもしくはステアリン酸
亜鉛、またはステアリン酸)、または化合物を身体の1つの部位(たとえば送達部位)か
ら別の部位(たとえば臓器、組織、または身体の部分)に運びまたは輸送することに関与
する溶媒カプセル化材料を意味する。薬学的に許容される担体は、製剤の他の成分との親
和性があり、対象の組織に傷害を与えない(たとえば生理学的親和性、無菌、生理的pH等
)という意味で「許容される」。
【0424】
薬学的に許容される担体として役立ちうる材料のいくつかの例には、(1)ラクトース
、グルコース、およびスクロース等の糖類、(2)コーンスターチおよびポテトスターチ等
のデンプン類、(3)セルロースならびにカルボキシメチルセルロース、メチルセルロー
ス、エチルセルロース、微結晶セルロース、およびセルロースアセテート等のセルロース
ならびにその誘導体、(4)粉末化トラガント、(5)マルト、(6)ゼラチン、(7)ステ
アリン酸マグネシウム、ラウリル硫酸ナトリウム、およびタルク等の滑剤、(8)ココア
バターおよび坐剤用ワックス等の賦形剤、(9)ピーナツ油、綿実油、サフラワー油、ゴ
マ油、オリーブ油、コーン油、および大豆油等の油、(10)プロピレングリコール等のグ
リコール類、(11)グリセリン、ソルビトール、マンニトール、およびポリエチレングリ
コール(PEG)等のポリオール類、(12)オレイン酸エチルおよびラウリン酸エチル等の
エステル類、(13)寒天、(14)水酸化マグネシウムおよび水酸化アルミニウム等の緩衝
剤、(15)アルギン酸、(16)パイロジェンフリー水、(17)等張食塩液、(18)リンゲル
液、(19)エチルアルコール、(20)pH緩衝溶液、(21)ポリエステル、ポリカーボネー
ト、および/またはポリ無水物、(22)ポリペプチドおよびアミノ酸等のバルキング剤、
(23)エタノール等の血清アルコール類、および(24)薬学的製剤に採用されるその他の
非毒性親和性物質が含まれる。湿潤剤、着色剤、放出剤、コーティング剤、甘味剤、香味
剤、芳香剤、保存剤、および抗酸化剤も製剤中に存在してよい。「賦形剤」、「担体」、
「薬学的に許容される担体」等の用語は、本明細書では相互交換可能に用いられる。
【0425】
医薬組成物は、製剤のpHを、生理学的pHを反映する所定のレベル、たとえば約5.0~約8
.0の範囲に維持するための1つまたは複数のpH緩衝化合物を含み得る。水性液体製剤にお
いて用いられるpH緩衝化合物は、アミノ酸またはアミノ酸の混合物、たとえばヒスチジン
またはヒスチジンとグリシンのようなアミノ酸の混合物であり得る。あるいは、pH緩衝化
合物は、好ましくは製剤のpHを所定のレベル、たとえば約5.0~約8.0の範囲に維持し、カ
ルシウムイオンをキレート化しない薬剤である。そのようなpH緩衝化合物の説明的な例に
は、それだけに限らないが、イミダゾールおよび酢酸イオンが含まれる。pH緩衝化合物は
、製剤のpHを所定のレベルに維持するために好適な任意の量で存在してよい。
【0426】
医薬組成物は、1つまたは複数の浸透圧調節剤、即ち製剤の浸透圧特性(たとえば張性
、オスモル濃度、および/または浸透圧)をレシピエント個体の血流および血球に許容さ
れるレベルに調節する化合物をも含み得る。浸透圧調節剤はカルシウムイオンをキレート
化しない薬剤であり得る。浸透圧調節剤は当業者に既知または利用可能で製剤の浸透圧特
性を調節する任意の化合物であり得る。当業者であれば、本発明の製剤における使用のた
めの所与の浸透圧調節剤の好適性を実験的に決定することができる。浸透圧調節剤の好適
な型の説明的な例には、それだけに限らないが、塩化ナトリウムおよび酢酸ナトリウム等
の塩類、スクロース、デキストロース、およびマンニトール等の糖類、グリシン等のアミ
ノ酸類、ならびにこれらの薬剤および/もしくは薬剤の型の1つもしくは複数の混合物が含
まれる。浸透圧調節剤は、製剤の浸透圧特性を調節するために十分な任意の濃度で存在し
てよい。
【0427】
いくつかの実施形態では、医薬組成物は、対象への送達のため、たとえば遺伝子編集の
ために処方される。本明細書に記載した医薬組成物を投与する好適な経路には、限定なし
に局所、皮下、経皮、皮内、病巣内、関節内、腹腔内、膀胱内、経粘膜、歯肉、口内、蝸
牛内、経鼓膜、臓器内、硬膜外、髄腔内、筋肉内、静脈内、血管内、骨内、眼周囲、腫瘍
内、脳内、および脳室内の投与が含まれる。
【0428】
いくつかの実施形態では、本明細書に記載した医薬組成物は、疾患の部位(たとえば腫
瘍の部位)に局所的に投与される。いくつかの実施形態では、本明細書に記載した医薬組
成物は、注射によって、カテーテルによって、坐剤によって、またはインプラントによっ
て、対象に投与され、インプラントは、シラスティック膜等の膜または繊維を含む多孔質
、非多孔質、またはゼラチン状材料である。
【0429】
他の実施形態では、本明細書に記載した医薬組成物は、制御放出システムにおいて送達
される。一実施形態ではポンプを用いることができる(たとえばLanger, 1990, Science
249: 1527-1533; Sefton, 1989, CRC Crit. Ref. Biomed. Eng. 14:201; Buchwald et al
., 1980, Surgery 88:507; Saudek et al, 1989, N. Engl. J. Med. 321:574を参照され
たい)。別の実施形態では、ポリマー材料を用いることができる(たとえばMedical Appl
ications of Controlled Release (Langer and Wise eds., CRC Press, Boca Raton, Fla
., 1974); Controlled Drug Bioavailability, Drug Product Design and Performance (
Smolen and Ball eds., Wiley, New York, 1984); Ranger and Peppas, 1983, Macromol.
Sci. Rev. Macromol. Chem. 23:61参照。Levy et al., 1985, Science 228: 190; Durin
g et al., 1989, Ann. Neurol. 25:351; Howard et ah, 1989, J. Neurosurg. 71: 105も
参照されたい)。他の制御放出システムは、たとえば上記のLangerに論じられている。
【0430】
いくつかの実施形態では、医薬組成物は、対象、たとえばヒトへの静脈内または皮下の
投与に適合する組成物として通常の手順に従って処方される。いくつかの実施形態では、
注射による投与のための医薬組成物は、可溶化剤としての無菌の等張使用の溶液および注
射部位における疼痛を緩和するためのリグノカイン等の局所麻酔剤である。一般に、成分
は個別にまたは単位用量形態で混合して、たとえば活性薬剤の量を表示するアンプルまた
はサシェット等の密封シールされた容器の中に、乾燥した凍結乾燥粉末または無水の濃縮
物として供給される。医薬組成物が注入によって投与される場合には、これは無菌の薬学
グレードの水または食塩液を含む注入ボトルに分注することができる。医薬組成物が注射
によって投与される場合には、無菌の注射用水または食塩液のアンプルを提供することが
でき、それにより投与の前に成分を混合することができる。
【0431】
全身投与のための医薬組成物は液体、たとえば無菌の食塩液、ラクテート化リンゲル液
またはハンクス液であり得る。さらに、医薬組成物は固体状態で使用直前に再溶解または
懸濁してもよい。凍結乾燥された形態も意図される。医薬組成物を脂質粒子またはベシク
ル、たとえばリポソームまたは微結晶の中に含ませることもでき、これも非経口投与に好
適である。粒子は、組成物がその中に含まれている限り、単層または多層等の任意の好適
な構造であってよい。化合物は、融合性の脂質、ジオレイルホスファチジルエタノールア
ミン(DOPE)、低レベル(5~10モル%)のカチオン性脂質を含み、ポリエチレングリコー
ル(PEG)コーティングによって安定化された「安定化プラスミド-脂質粒子」(SPLP)に
閉じ込めることができる(Zhang Y. P. et ah, Gene Ther. 1999, 6: 1438-47)。そのよ
うな粒子およびベシクルには、N-[l-(2,3-ジオレオイルオキシ)プロピル]-N,N,N-トリメ
チル-アンモニウムメチル硫酸、即ち「DOTAP」等の正荷電の脂質が特に好ましい。そのよ
うな脂質粒子の調製は公知である。たとえば、それぞれが参照により本明細書に組み込ま
れる米国特許第4,880,635号、第4,906,477号、第4,911,928号、第4,917,951号、第4,920,
016号、および第4,921,757号を参照されたい。
【0432】
本明細書に記載した医薬組成物は、たとえば単位用量として投与しまたは包装すること
ができる。用語「単位用量」は、本開示の医薬組成物に関連して用いる場合は、対象への
単一の用量として好適な物理的に離散した単位であって、それぞれの単位が必要な希釈剤
、即ち担体またはビヒクルと組み合わせて所望の治療効果を生じるように計算された所定
量の活性材料を含む単位を意味する。
【0433】
さらに、医薬組成物は、(a)本発明の化合物を凍結乾燥された形態で含む容器、およ
び(b)薬学的に許容される希釈剤(たとえば無菌で本発明の凍結乾燥された化合物の再
構成または希釈のために用いられる)を含む第2の容器を含む薬学的キットとして提供す
ることができる。そのような容器には任意選択で、医薬または生物学的製品の製造、使用
、または販売を規制する政府当局によって規定された様式の、ヒトへの投与のための製造
、使用、または販売の当局による承認を反映した注意書を添付することができる。
【0434】
いくつかの実施形態では、本明細書に記載した融合タンパク質、gRNA、および/または
複合体のいずれも、医薬組成物の部分として提供される。いくつかの実施形態では、医薬
組成物は本明細書で提供する融合タンパク質のいずれかを含む。いくつかの実施形態では
、医薬組成物は本明細書で提供する複合体のいずれかを含む。いくつかの実施形態では、
医薬組成物は、gRNAと複合体を形成するRNAガイドヌクレアーゼ(たとえばCas9)を含む
リボヌクレオタンパク質複合体およびカチオン性脂質を含む。いくつかの実施形態では、
医薬組成物はgRNA、核酸プログラム可能なDNA結合タンパク質、カチオン性脂質、および
薬学的に許容される賦形剤を含む。医薬組成物は任意選択で1つまたは複数のさらなる治
療活性物質を含み得る。
【0435】
医薬組成物を種々の動物への投与に適するようにするための、ヒトへの投与に適した医
薬組成物の改変はよく理解されており、通常の技術を有する獣医薬学者は、あるとしても
単に通常の実験によってそのような改変を設計しおよび/または実施することができる。
医薬組成物の投与が意図される対象には、それだけに限らないが、ヒトおよび/またはそ
の他の霊長類、哺乳類、家畜、ペット、および市販の関連する哺乳類、たとえばウシ、ブ
タ、ウマ、ヒツジ、ネコ、イヌ、マウス、および/またはラット、ならびに/またはニワト
リ、アヒル、ガチョウ、および/もしくはシチメンチョウ等の市販の鳥類が含まれる。
【0436】
本明細書に記載した医薬組成物の製剤は、薬学技術において既知のまたは今後開発され
る任意の方法によって調製することができる。一般に、そのような調製法には、活性成分
を賦形剤および/または1つもしくは複数の他の補助的な成分と組み合わせるステップ、な
らびに次いで必要であればおよび/または所望であれば、製品を所望の単一または複数の
用量単位に形付けおよび/または包装するステップが含まれる。薬学的製剤は、本明細書
で用いる場合には、所望の特定の用量形態に適した、任意のかつ全ての溶媒、分散媒、希
釈剤、またはその他の液体ビヒクル、分散または懸濁の助剤、表面活性剤、等浸透圧剤、
増粘剤もしくは乳化剤、保存剤、固体バインダー、滑剤、その他を含む薬学的に許容され
る賦形剤をさらに含むことができる。RemingtonのThe Science and Practice of Pharmac
y, 21st Edition, A. R. Gennaro (Lippincott, Williams & Wilkins, Baltimore, MD, 2
006、参照により全体として本明細書に組み込まれる)に、医薬組成物の処方において用
いられる種々の賦形剤およびその調製のための既知の手法が開示されている。ヌクレアー
ゼを含む医薬組成物を生成するためのさらなる好適な方法、薬剤、賦形剤、および溶媒に
ついては、参照により全体として本明細書に組み込まれるPCT出願PCT/US2010/055131 (2
010年11月2日出願、公開番号WO2011053982 A8)も参照されたい。
【0437】
いずれかの従来の賦形剤媒体が、何らかの望ましくない生物学的影響を生じるか、また
はその他に医薬組成物の何らかの他の成分と有害な様式で相互作用すること等によって、
物質またはその誘導体と調和しない場合を除いて、その使用は本開示の範囲内であること
が意図される。
【0438】
組成物は上述のように有効量で投与することができる。有効量は投与の様式、治療され
る特定の病態、および所望の成果に依存することになる。有効量は、病態の段階、対象の
年齢および身体的条件、もしあれば同時治療の性質、ならびに臨床医には公知の同様の要
素にも依存する。治療用途では、有効量は医学的に望まれる結果を達成するために十分な
量である。
【0439】
RTTを治療する方法
本明細書に記載した塩基エディターシステム(たとえば塩基エディターおよびgRNA)を
コードするポリヌクレオチドを含む治療有効量の医薬組成物を対象(たとえばヒト等の哺
乳類)に投与することを含む、レット症候群(RTT)および/またはそれを引き起こすMecp
2における遺伝子変異を治療する方法も提供される。いくつかの実施形態では、塩基エデ
ィターは、ポリヌクレオチドプログラム可能なDNA結合ドメインとアデノシンデアミナー
ゼドメインまたはシチジンデアミナーゼドメインとを含む融合タンパク質である。対象の
細胞は、塩基エディターと、それをターゲティングしてMecp2遺伝子における変異を含む
核酸配列のA・TからG・Cへの改変(細胞がアデノシンデアミナーゼドメインによって形質
導入される場合)またはC・GからU・Aへの改変(細胞がシチジンデアミナーゼドメインに
よって形質導入される場合)をもたらす1つまたは複数のガイドポリヌクレオチドとによ
って形質導入される。
【0440】
本明細書の方法は、対象(そのような治療を必要とすると特定された対象または疾患の
リスクがあり、そのような治療を必要とする疑いがある対象)に、本明細書に記載した組
成物の有効量を投与することを含む。そのような治療を必要とする対象の特定は、対象ま
たは保健専門家の判定であってよく、主観的(たとえば所見)または客観的(たとえば検
査もしくは診断の方法によって測定される)であってよい。
【0441】
治療法は一般に、たとえば塩基エディターと、それを必要とする対象(たとえばヒト患
者)のMecp2遺伝子を標的とするgRNAとをコードするベクターを含む、治療有効量の医薬
組成物の投与を含む。そのような治療は、RTTを患い、有し、その疑いがあり、またはそ
のリスクがある対象、特にヒト対象に、好適に適用されることになる。本明細書の組成物
は、RTTが関連し得る任意の他の障害の治療にも用いられる。
【0442】
一実施形態では、本発明は治療の進展をモニターする方法を提供する。本方法は、対象
が疾患もしくはその症状を治療するために十分な治療量の本明細書の組成物を投与されて
いる、RTTに関連する障害もしくはその症状に罹患しているかその影響を受けやすい対象
における診断用マーカー(マーカー)(たとえばRTTに関連するSNP)または診断用測定(
たとえばスクリーニング、アッセイ)のレベルを決定するステップを含む。本方法におい
て決定されるマーカーのレベルは、健常な正常対照または対象の疾患状態を確立するため
の他の罹患した患者におけるマーカーの既知のレベルと比較することができる。好ましい
実施形態では、対象におけるマーカーの第2のレベルを第1のレベルの決定よりも遅い時点
で決定し、2つのレベルを比較して疾患の進行状態または治療の有効性をモニターする。
ある好ましい実施形態では、対象におけるマーカーの治療前レベルを本発明による治療を
開始する前に決定する。次いでこの治療前のマーカーのレベルを治療開始後の対象におけ
るマーカーのレベルと比較して、治療の有効性を決定することができる。
【0443】
いくつかの実施形態では、対象から細胞を得て、本明細書で提供する医薬組成物と接触
させる。いくつかの実施形態では、対象から取り出して医薬組成物とex vivoで接触させ
た細胞を、任意選択で細胞の中で所望のゲノム修飾を達成しまたは検出した後で、対象に
再導入する。ヌクレアーゼを含む医薬組成物を送達する方法は、たとえばその全ての開示
が参照により全体として本明細書に組み込まれる米国特許第6,453,242号、第6,503,717号
、第6,534,261号、第6,599,692号、第6,607,882号、第6,689,558号、第6,824,978号、第6
,933,113号、第6,979,539号、第7,013,219号、および第7,163,824号に記載されている。
本明細書で提供する医薬組成物の記載は原理的にはヒトへの投与に適した医薬組成物を指
向しているが、そのような組成物は一般に動物または全ての種類の生命体への投与、たと
えば獣医用途に適していることは当業者には理解されよう。
キット
【0444】
本開示の種々の態様は、塩基エディターシステムを含むキットを提供する。一実施形態
では、キットは、核酸塩基エディター融合タンパク質をコードするヌクレオチド配列を含
む核酸構築物を含む。融合タンパク質は、デアミナーゼ(たとえばシチジンデアミナーゼ
またはアデニンデアミナーゼ)および核酸プログラム可能なDNA結合ドメイン(napDNAbp
)を含む。いくつかの実施形態では、キットは、目的の核酸分子、たとえばMecp2 RTT関
連変異を標的とすることができる少なくとも1つのガイドRNAを含む。いくつかの実施形態
では、キットは、少なくとも1つのガイドRNAをコードするヌクレオチド配列を含む核酸構
築物を含む。
【0445】
キットは、いくつかの実施形態では、キットを用いて1つまたは複数のMecp2 RTT関連変
異を編集するための説明書を提供する。説明書には一般に、核酸分子を編集するためのキ
ットの使用に関する情報が含まれる。他の実施形態では、説明書には以下の少なくとも1
つが含まれる。事前注意;警告;臨床試験;および/または参考文献。説明書は容器(存
在する場合)に直接印刷してもよく、容器に貼付したラベルとして、または容器の中にも
しくは容器とともに供給する個別のシート、パンフレット、カード、またはフォルダーと
してもよい。さらなる実施形態では、キットは好適な操作パラメーターのためのラベルま
たは個別の挿入物(パッケージインサート)の形態で説明書を含むことができる。さらに
別の実施形態では、キットは、検出、較正、または正規化のための標準として用いられる
適切な陽性および陰性の対照または対照試料を含む1つまたは複数の容器を含むことがで
きる。キットは(無菌の)リン酸緩衝食塩液、リンゲル液、またはデキストロース溶液等
の薬学的に許容される緩衝液を含む第2の容器をさらに含むことができる。第2の容器はそ
の他の緩衝剤、希釈剤、フィルター類、針類、シリンジ類、および使用説明書を含むパッ
ケージインサートを含む市販および使用者の立場から望ましいその他の材料をさらに含む
ことができる。
【0446】
ある実施形態では、キットはレット症候群を有する対象の治療に有用である。
【0447】
本明細書に開示した実施形態の実施は、他に指示しない限り、免疫学、生化学、化学、
分子生物学、微生物学、細胞生物学、遺伝学、および組み換えDNAの従来の手法を採用し
ており、これらは当技術の技能の範囲内である。たとえばSambrook and Green, Molecula
r Cloning: A Laboratory Manual, 4th Edition (2012); the series Current Protocols
in Molecular Biology (F. M. Ausubel, et al. eds.); the series Methods In Enzymo
logy (Academic Press, Inc.), PCR 2: A Practical Approach (M.J. MacPherson, B.D.
Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) Antibodies, A L
aboratory Manual, および Culture of Animal Cells: A Manual of Basic Technique an
d Specialized Applications, 6th Edition (R.I. Freshney, ed. (2010))を参照された
い。
【0448】
塩基エディターシステムの方法および組成物ならびに使用を包含する以下に番号付けし
たさらなる実施形態が本明細書で想定される。
1. ガイドポリヌクレオチドまたはそれをコードする核酸;
ポリヌクレオチドプログラム可能なDNA結合ドメインまたはそれをコードする核酸、お
よび
アデノシンデアミナーゼドメインまたはそれをコードする核酸
を含む塩基エディターシステムを対象に投与するステップを含む、それを必要とする対象
においてレット症候群(RTT)を治療する方法であって、
ガイドポリヌクレオチドが塩基エディターシステムをターゲティングして、対象におけ
る細胞のMECP2ポリヌクレオチドにおけるRTTを引き起こす単一ヌクレオチド多型(SNP)
のA・TからG・Cへの改変をもたらすことができ、それによりRTTを治療する方法。
2. (a)ガイドポリヌクレオチドまたはそれをコードする核酸;
ポリヌクレオチドプログラム可能なDNA結合ドメインまたはそれをコードする核酸、お
よび
アデノシンデアミナーゼドメインまたはそれをコードする核酸
を含む塩基エディターシステムを細胞に導入するステップ、ならびに
(b)細胞を対象に投与するステップ
を含む、それを必要とする対象におけるレット症候群(RTT)を治療する方法であって、
ガイドポリヌクレオチドが塩基エディターシステムをターゲティングして、細胞中のME
CP2ポリヌクレオチドにおけるRTTを引き起こす単一ヌクレオチド多型(SNP)のA・TからG
・Cへの改変をもたらすことができ、それにより疾患を治療する、方法。
3. 細胞がニューロンである、実施形態2に記載の方法。
4. 細胞が対象にとって自己、同種、または異種である、実施形態2または3に記載の方法
。
5. MECP2ポリヌクレオチドを、
ガイドポリヌクレオチド;
ポリヌクレオチドプログラム可能なDNA結合ドメイン、および
アデノシンデアミナーゼドメイン
を含む塩基エディターシステムと接触させるステップを含む、MECP2ポリヌクレオチドを
編集する方法であって、
ガイドポリヌクレオチドが塩基エディターシステムをターゲティングして、MECP2ポリ
ヌクレオチドにおけるレット症候群(RTT)を引き起こす単一ヌクレオチド多型(SNP)の
A・TからG・Cをもたらすことができる、方法。
6. ガイドポリヌクレオチドまたはそれをコードする核酸;
ポリヌクレオチドプログラム可能なDNA結合ドメインまたはそれをコードする核酸、お
よび
アデノシンデアミナーゼドメインまたはそれをコードする核酸
を含む塩基エディターシステムを細胞に導入するステップを含む、レット症候群(RTT)
の治療のための改変された細胞を生成する方法であって、
ガイドポリヌクレオチドが塩基エディターシステムをターゲティングして、細胞中のME
CP2ポリヌクレオチドにおけるRTTを引き起こす単一ヌクレオチド多型(SNP)のA・TからG
・Cへの改変をもたらすことができる、方法。
7. 導入がin vivoである、実施形態6に記載の方法。
8. 導入がex vivoである、実施形態6に記載の方法。
9. 細胞がニューロンである、実施形態6から8のいずれか一項に記載の方法。
10. 細胞がRTTを有する対象から得られるものである、実施形態6から9のいずれか一項に
記載の方法。
11. MECP2ポリヌクレオチドが、SNPに起因して106位にトリプトファン、133位にシステ
イン、255位に停止コドン、270位に停止コドン、または306位にシステインを含む病原性
アミノ酸を含むMECP2タンパク質をコードする、実施形態1から10のいずれか一項に記載の
方法。
12. A・TからG・Cへの改変が病原性アミノ酸を野生型アミノ酸に置換する、実施形態11
に記載の方法。
13. ガイドポリヌクレオチドまたはそれをコードする核酸;
ポリヌクレオチドプログラム可能なDNA結合ドメインまたはそれをコードする核酸、お
よび
アデノシンデアミナーゼドメインまたはそれをコードする核酸
を含む塩基エディターシステムを対象に投与するステップを含む、それを必要とする対象
においてレット症候群(RTT)を治療する方法であって、
ガイドポリヌクレオチドが塩基エディターシステムをターゲティングして、対象におけ
る細胞のMECP2ポリヌクレオチドにおけるRTTを引き起こす単一ヌクレオチド多型(SNP)
のA・TからG・Cへの改変をもたらすことができ、
MECP2ポリペプチドが、SNPに起因して106位にトリプトファン、133位にシステイン、25
5位に停止コドン、270位に停止コドン、または306位にシステインを含む病原性アミノ酸
を含むMECP2タンパク質をコードし、
A・TからG・Cへの改変が病原性アミノ酸を野生型アミノ酸に置換し、それによりRTTを
治療する、方法。
14. (a) 細胞を
ガイドポリヌクレオチドまたはそれをコードする核酸;
ポリヌクレオチドプログラム可能なDNA結合ドメインまたはそれをコードする核酸、お
よび
アデノシンデアミナーゼドメインまたはそれをコードする核酸
を含む塩基エディターシステムに接触させるステップ、
(b) 細胞を対象に投与するステップ
を含む、それを必要とする対象におけるレット症候群(RTT)を治療する方法であって、
ガイドポリヌクレオチドが塩基エディターシステムをターゲティングして、細胞中のME
CP2ポリヌクレオチドにおけるRTTを引き起こす単一ヌクレオチド多型(SNP)のA・TからG
・Cへの改変をもたらすことができ、
MECP2ポリペプチドが、SNPに起因して106位にトリプトファン、133位にシステイン、25
5位に停止コドン、270位に停止コドン、または306位にシステインを含む病原性アミノ酸
を含むMECP2タンパク質をコードし、
A・TからG・Cへの改変が病原性アミノ酸を野生型アミノ酸に置換し、それによりRTTを
治療する、方法。
15. 細胞がニューロンである、実施形態14に記載の方法。
16. 細胞が対象にとって自己、同種、または異種である、実施形態14または15に記載の
方法。
17. MECP2ポリヌクレオチドを、
ガイドポリヌクレオチド;
ポリヌクレオチドプログラム可能なDNA結合ドメイン、および
アデノシンデアミナーゼドメイン
を含む塩基エディターシステムと接触させるステップを含む、MECP2ポリヌクレオチドの
中のRTTを引き起こす単一ヌクレオチド多型(SNP)を補正する方法であって、
ガイドポリヌクレオチドが塩基エディターシステムをターゲティングしてSNPのA・Tか
らG・Cをもたらすことができ、
MECP2ポリペプチドが、SNPに起因して106位にトリプトファン、133位にシステイン、25
5位に停止コドン、270位に停止コドン、または306位にシステインを含む病原性アミノ酸
を含むMECP2タンパク質をコードし、
A・TからG・Cへの改変が病原性アミノ酸を野生型アミノ酸に置換し、それによりSNPを
補正する、方法。
18. ガイドポリヌクレオチドまたはそれをコードする核酸;
ポリヌクレオチドプログラム可能なDNA結合ドメインまたはそれをコードする核酸、お
よび
アデノシンデアミナーゼドメインまたはそれをコードする核酸
を含む塩基エディターシステムを細胞に導入するステップを含む、レット症候群(RTT)
の治療のための改変された細胞を生成する方法であって、
ガイドポリヌクレオチドが塩基エディターシステムをターゲティングして、細胞中のME
CP2ポリヌクレオチドにおける単一ヌクレオチド多型(SNP)のA・TからG・Cへの改変をも
たらすことができ、
MECP2ポリペプチドが、SNPに起因して106位にトリプトファン、133位にシステイン、25
5位に停止コドン、270位に停止コドン、または306位にシステインを含む病原性アミノ酸
を含むMECP2タンパク質をコードし、
A・TからG・Cへの改変が病原性アミノ酸を野生型アミノ酸に置換する、方法。
19. 導入がin vivoである、実施形態18に記載の方法。
20. 導入がex vivoである、実施形態18に記載の方法。
21. 細胞がニューロンである、実施形態18から20のいずれか一項に記載の方法。
22. 細胞がRTTを有する対象から得られるものである、実施形態18から21のいずれか一項
に記載の方法。
23. 野生型アミノ酸がアルギニンである、実施形態12から22のいずれか一項に記載の方
法。
24. A・TからG・Cへの改変がMECP2タンパク質の255位の停止コドンをアルギニンに置換
する、実施形態23に記載の方法。
25. SNPがMECP2ポリヌクレオチドの763位である、実施形態24に記載の方法。
26. ポリヌクレオチドプログラム可能なDNA結合ドメインがCas9ドメインである、実施形
態1から25のいずれか一項に記載の方法。
27. Cas9ドメインがヌクレアーゼ不活性Cas9ドメインである、実施形態26に記載の方法
。
28. Cas9ドメインがCas9ニッカーゼドメインである、実施形態26に記載の方法。
29. Cas9ドメインがSpCas9ドメインを含む、実施26から28のいずれか一項に記載の方法
。
30. SpCas9ドメインがD10Aおよび/またはH840Aアミノ酸置換またはその対応するアミノ
酸置換を含む、実施形態29に記載の方法。
31. SpCas9ドメインがNGG PAMに対する特異性を有する、実施形態29または30に記載の方
法。
32. SpCas9ドメインがNGA PAM、NGT PAM、またはNGC PAMに対する特異性を有する、実施
形態29から31のいずれか一項に記載の方法。
33. SpCas9ドメインが、アミノ酸置換L1111R、D1135V、G1218R、E1219F、A1322R、R1335
V、T1337RならびにL1111、D1135L、S1136R、G1218S、E1219V、D1332A、R1335Q、T1337I、
T1337V、T1337F、およびT1337Mのうち1つもしくは複数、またはその対応するアミノ酸置
換を含む、実施形態29から32のいずれか一項に記載の方法。
34. SpCas9ドメインが、アミノ酸置換L1111R、D1135V、G1218R、E1219F、A1322R、R1335
V、T1337RならびにL1111、D1135L、S1136R、G1218S、E1219V、D1332A、D1332S、D1332T、
D1332V、D1332L、D1332K、D1332R、R1335Q、T1337I、T1337V、T1337F、T1337S、T1337N、
T1337K、T1337R、T1337H、T1337Q、およびT1337Mのうち1つもしくは複数、またはその対
応するアミノ酸置換を含む、実施形態29から32のいずれか一項に記載の方法。
35. SpCas9ドメインが、アミノ酸置換D1135L、S1136R、G1218S、E1219V、A1322R、R1335
Q、T1337、およびA1322R、ならびにL1111、D1135L、S1136R、G1218S、E1219V、D1332A、D
1332S、D1332T、D1332V、D1332L、D1332K、D1332R、R1335Q、T1337I、T1337V、T1337F、T
1337S、T1337N、T1337K、T1337R、T1337H、T1337Q、およびT1337Mのうち1つもしくは複数
、またはその対応するアミノ酸置換を含む、実施形態29から32のいずれか一項に記載の方
法。
36. SpCas9ドメインがアミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A
、R1335E、およびT1337R、またはその対応するアミノ酸置換を含む、実施形態29から32の
いずれか一項に記載の方法。
37. SpCas9ドメインがNG PAM、NNG PAM、GAA PAM、GAT PAM、またはCAA PAMに対する特
異性を有する、実施形態29から32のいずれか一項に記載の方法。
38. Cas9ドメインがアミノ酸置換E480K、E543K、およびE1219V、またはその対応するア
ミノ酸置換を含む、実施形態36に記載の方法。
39. Cas9ドメインがSaCas9ドメインを含む、実施形態26から28のいずれか一項に記載の
方法。
40. SaCas9ドメインがNNNRRT PAMに対する特異性を有する、実施形態39に記載の方法。
41. SaCas9ドメインがNNGRRT PAMに対する特異性を有する、実施形態40に記載の方法。
42. SaCas9ドメインがアミノ酸置換N579Aまたはその対応するアミノ酸置換を含む、実施
形態39から41のいずれか一項に記載の方法。
43. SaCas9ドメインがアミノ酸置換E782K、N968K、およびR1015H、またはその対応する
アミノ酸置換を含む、実施形態39から42のいずれか一項に記載の方法。
44. Cas9ドメインがSt1Cas9ドメインを含む、実施形態26から28のいずれか一項に記載の
方法。
45. St1Cas9ドメインがNNACCA PAMに対する特異性を有する、実施形態44に記載の方法。
46. アデノシンデアミナーゼドメインが天然には生成しない改変されたアデノシンデア
ミナーゼドメインである、実施形態1から45のいずれか一項に記載の方法。
47. アデノシンデアミナーゼドメインがTadAドメインを含む、実施形態46に記載の方法
。
48. TadAドメインがTadA 7.10のアミノ酸配列を含む、実施形態47に記載の方法。
49. 塩基エディターシステムがジンクフィンガードメインをさらに含む、実施形態1から
48のいずれか一項に記載の方法。
50. ジンクフィンガードメインが認識ヘリックス配列RNEHLEV、QSTTLKR、およびRTEHLAR
、または認識ヘリックス配列RGEHLRQ、QSGTLKR、およびRNDKLVPを含む、実施形態97に記
載の方法。
51. ジンクフィンガードメインがzf1raまたはzf1rbである、実施形態49または50に記載
の方法。
52. 塩基エディターシステムが核局在化シグナル(NLS)をさらに含む、実施形態1から5
1のいずれか一項に記載の方法。
53. 塩基エディターシステムが1つまたは複数のリンカーをさらに含む、実施形態1から5
2のいずれか一項に記載の方法。
54. ポリヌクレオチドプログラム可能なDNA結合ドメイン、アデノシンデアミナーゼドメ
イン、ジンクフィンガードメイン、およびNLSのうち2つ以上がリンカーを介して連結され
る、実施形態53に記載の方法。
55. リンカーがペプチドリンカーであり、それにより塩基編集融合タンパク質が形成さ
れる、実施形態54に記載の方法。
56. ペプチドリンカーが、SGGSSGSETPGTSESATPESSGGS、SGGSSGGSSGSETPGTSESATPESSGGSS
GGS、GGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSE
GSAPGTSESATPESGPGSEPATSGGSGGS、
SGGSSGGSSGSETPGTSESATPES、
SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGS、SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSG
GSSGSETPGTSESATPESSGGSSGGS、PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTS
TEPSEGSAP GTSTEPSEGSAPGTSESATPESGPGSEPATS、(SGGS)n、(GGGS)n、(GGGGS)n、(G)n、(EA
AAK)n、(GGS)n、SGSETPGTSESATPES、および(XP)nからなる群から選択されるアミノ酸配列
を含む、実施形態55に記載の方法。
57. 塩基編集融合タンパク質が
MPKKKRKVSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNY
RLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRR
QEIKAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLV
LNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAG
SLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESDLVL
GLAIGIGSVGVGILNKVTGEIIHKNSRIFPAAQAENNLVRRTNRQGRRLARRKKHRRVRLNRLFEESGLITDFTKISINL
NPYQLRVKGLTDELSNEELFIALKNMVKHRGISYLDDASDDGNSSVGDYAQIVKENSKQLETKTPGQIQLERYQTYGQLR
GDFTVEKDGKKHRLINVFPTSAYRSEALRILQTQQEFNPQITDEFINRYLEILTGKRKYYHGPGNEKSRTDYGRYRTSGE
TLDNIFGILIGKCTFYPDEFRAAKASYTAQEFNLLNDLNNLTVPTETKKLSKEQKNQIINYVKNEKAMGPAKLFKYIAKL
LSCDVADIKGYRIDKSGKAEIHTFEAYRKMKTLETLDIEQMDRETLDKLAYVLTLNTEREGIQEALEHEFADGSFSQKQV
DELVQFRKANSSIFGKGWHNFSVKLMMELIPELYETSEEQMTILTRLGKQKTTSSSNKTKYIDEKLLTEEIYNPVVAKSV
RQAIKIVNAAIKEYGDFDNIVIEMARETNEDDEKKAIQKIQKANKDEKDAAMLKAANQYNGKAELPHSVFHGHKQLATKI
RLWHQQGERCLYTGKTISIHDLINNSNQFEVDHILPLSITFDDSLANKVLVYATANQEKGQRTPYQALDSMDDAWSFREL
KAFVRESKTLSNKKKEYLLTEEDISKFDVRKKFIERNLVDTLYASRVVLNALQEHFRAHKIDTKVSVVRGQFTSQLRRHW
GIEKTRDTYHHHAVDALIIAASSQLNLWKKQKNTLVSYSEDQLLDIETGELISDDEYKESVFKAPYQHFVDTLKSKEFED
SILFSYQVDSKFNRKISDATIYATRQAKVGKDKADETYVLGKIKDIYTQDGYDAFMKIYKKDKSKFLMYRHDPQTFEKVI
EPILENYPNKQINDKGKEVPCNPFLKYKEEHGYIRKYSKKGNGPEIKSLKYYDSKLGNHIDITPKDSNNKVVLQSVSPWR
ADVYFNKTTGKYEILGLKYADLQFDKGTGTYKISQEKYNDIKKKEGVDSDSEFKFTLYKNDLLLVKDTETKEQQLFRFLS
RTMPKQKHYVELKPYDKQKFEGGEALIKVLGNVANSGQCKKGLGKSNISIYKVRTDVLGNQHIIKNEGDKPKLDFPKKKR
KVEGADKRTADGSEFESPKKKRKV、
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSKRN
YILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELS
GINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEV
RGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEEL
RSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFT
NLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLIL
DELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNS
KDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVS
FDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINR
NLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKA
KKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRKLINDTLYSTRKDDKGNTLIVNN
LNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYG
NKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIA
SFYKNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPHIIKTIASKTQSIKKYSTDILGNLYEVKSK
KHPQIIKKGEGADKRTADGSEFESPKKKRKV、
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSKRN
YILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELS
GINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEV
RGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEEL
RSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFT
NLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLIL
DELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNS
KDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVS
FDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINR
NLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKA
KKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRKLINDTLYSTRKDDKGNTLIVNN
LNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYG
NKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIA
SFYKNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPHIIKTIASKTQSIKKYSTDILGNLYEVKSK
KHPQIIKKGEGADKRTADGSEFESPKKKRKVSSGNSNANSRGPSFSSGLVPLSLRGSHSRPGERPFQCRICMRNFSRNEH
LEVHTRTHTGEKPFQCRICMRNFSQSTTLKRHLRTHTGEKPFQCRICMRNFSRTEHLARHLKTHLRGSSAQ、または
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSKRN
YILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELS
GINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEV
RGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEEL
RSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFT
NLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLIL
DELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNS
KDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVS
FDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINR
NLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKA
KKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRKLINDTLYSTRKDDKGNTLIVNN
LNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYG
NKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIA
SFYKNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPHIIKTIASKTQSIKKYSTDILGNLYEVKSK
KHPQIIKKGEGADKRTADGSEFESPKKKRKVSSGNSNANSRGPSFSSGLVPLSLRGSHSRPGERPFQCRICMRNFSRGEH
LRQHTRTHTGEKPFQCRICMRNFSQSGTLKRHLRTHTGEKPFQCRICMRNFSRNDKLVPHLKTHLRGSSAQ
からなる群から選択されるアミノ酸配列を含む、実施形態55または56に記載の方法。
58. ガイドポリヌクレオチドが2つの個別のポリヌクレオチドを含み、2つの個別のポリ
ヌクレオチドが2つのDNA、2つのRNA、または1つのDNAと1つのRNAである、実施形態1から5
7のいずれか一項に記載の方法。
59. ガイドポリヌクレオチドがcrRNAおよびtracrRNAを含み、crRNAがMECP2ポリヌクレオ
チドにおける標的配列に相補的な核酸配列を含む、実施形態1から58のいずれか一項に記
載の方法。
60. 標的配列が、CCATGTCCAGCCTTCAGGCA, TCCATGTCCAGCCTTCAGGC, TTCCATGTCCAGCCTTCAG
G, GCTTCCATGTCCAGCCTTCA, CTTCCATGTCCAGCCTTCAGG, AGCTTCCATGTCCAGCCTTCAGG, AGCTTCC
ATGTCCAGCCTTC, CTTAAGCTTCCATGTCCAGC, AGCAAAAGGCTTTTCCCTGG, GAGCAAAAGGCTTTTCCCTG,
AGAGCAAAAGGCTTTTCCCT, TAGAGCAAAAGGCTTTTCCC, TAGAGCAAAAGGCTTTTCCCT, TTTAGAGCAAAA
GGCTTTTCCCT, CCATGAAGTCAAAATCATTA, ACCATGAAGTCAAAATCATT, TACCATGAAGTCAAAATCAT, T
TACCATGAAGTCAAAATCAT, AGTTACCATGAAGTCAAAATCAT, CTTTTCACTTCCTGCCGGGG, TCAGCCCCGTT
TCTTGGGAA, GCTTTCAGCCCCGTTTCTTG, CGGCTTTCAGCCCCGTTTCTT, CCCGGCTTTCAGCCCCGTTTCTT,
GCACTTCTTGATGGGGAGTA, TCTTGCACTTCTTGATGGGG, CTTGCACTTCTTGATGGGGAG, および GTCTT
GCACTTCTTGATGGGGAGからなる群から選択される配列を含む、実施形態59に記載の方法。
61. 塩基エディターシステムがシングルガイドRNA(sgRNA)を含む、実施形態58または5
9に記載の方法。
62. sgRNAがCUUUUCACUUCCUGCCGGGGを含む、実施形態60に記載の方法。
63. ガイドポリヌクレオチドまたはそれをコードする核酸;
ポリヌクレオチドプログラム可能なDNA結合ドメインまたはそれをコードする核酸、お
よび
アデノシンデアミナーゼドメインまたはそれをコードする核酸
を含む塩基エディターシステムを含み、
ガイドポリヌクレオチドが塩基エディターシステムをターゲティングして、細胞中のME
CP2ポリヌクレオチドにおけるレット症候群(RTT)を引き起こす単一ヌクレオチド多型(
SNP)のA・TからG・Cへの改変をもたらすことができる、
改変された細胞。
64. ガイドポリヌクレオチドまたはそれをコードする核酸;
ポリヌクレオチドプログラム可能なDNA結合ドメインまたはそれをコードする核酸、お
よび
アデノシンデアミナーゼドメインまたはそれをコードする核酸
を含む塩基エディターシステムを含み、
ガイドポリヌクレオチドが塩基エディターシステムをターゲティングして細胞中のMECP
2ポリヌクレオチドにおけるレット症候群(RTT)を引き起こす単一ヌクレオチド多型(SN
P)のA・TからG・Cへの改変をもたらすことができ、
MECP2ポリペプチドが、SNPに起因して106位にトリプトファン、133位にシステイン、25
5位に停止コドン、270位に停止コドン、または306位にシステインを含む病原性アミノ酸
を含むMECP2タンパク質をコードし、
A・TからG・Cへの改変が病原性アミノ酸を野生型アミノ酸に置換する、改変された細胞
。
65. MECP2ポリヌクレオチドが、SNPに起因して106位にトリプトファン、133位にシステ
イン、255位に停止コドン、270位に停止コドン、または306位にシステインを含む病原性
アミノ酸を含むMECP2タンパク質をコードする、実施形態63に記載の改変された細胞。
66. A・TからG・Cへの改変が病原性アミノ酸を野生型アミノ酸に置換する、実施形態65
に記載の改変された細胞。
67. 細胞がニューロンである、実施形態63から66のいずれか一項に記載の改変された細
胞。
68. 細胞がRTTを有する対象から得られるものである、実施形態63から67のいずれか一項
に記載の改変された細胞。
69. 野生型アミノ酸がアルギニンである、実施形態66から68のいずれか一項に記載の改
変された細胞。
70. A・TからG・Cへの改変がMECP2タンパク質の255位の停止コドンをアルギニンに置換
する、実施形態69に記載の改変された細胞。
71. SNPがMECP2ポリヌクレオチドの763位である、実施形態70に記載の改変された細胞。
72. ポリヌクレオチドプログラム可能なDNA結合ドメインがCas9ドメインである、実施形
態63から71のいずれか一項に記載の改変された細胞。
73. Cas9ドメインがヌクレアーゼ不活性Cas9ドメインである、実施形態72に記載の改変
された細胞。
74. Cas9ドメインがCas9ニッカーゼドメインである、実施形態72に記載の改変された細
胞。
75. Cas9ドメインがSpCas9ドメインを含む、実施形態72から74のいずれか一項に記載の
改変された細胞。
76. SpCas9ドメインがD10Aおよび/もしくはH840Aアミノ酸置換またはその対応するアミ
ノ酸置換を含む、実施形態75に記載の改変された細胞。
77. SpCas9ドメインがNGG PAMに対する特異性を有する、実施形態75または76に記載の改
変された細胞。
78. SpCas9ドメインがNGA PAM、NGT PAM、またはNGC PAMに対する特異性を有する、実施
形態75から77のいずれか一項に記載の改変された細胞。
79. SpCas9ドメインが、アミノ酸置換L1111R、D1135V、G1218R、E1219F、A1322R、R1335
V、T1337R、ならびにL1111、D1135L、S1136R、G1218S、E1219V、D1332A、R1335Q、T1337I
、T1337V、T1337F、およびT1337Mのうち1つもしくは複数、またはその対応するアミノ酸
置換を含む、実施形態75から78のいずれか一項に記載の改変された細胞。
80. SpCas9ドメインが、アミノ酸置換L1111R、D1135V、G1218R、E1219F、A1322R、R1335
V、T1337RならびにL1111、D1135L、S1136R、G1218S、E1219V、D1332A、D1332S、D1332T、
D1332V、D1332L、D1332K、D1332R、R1335Q、T1337I、T1337V、T1337F、T1337S、T1337N、
T1337K、T1337R、T1337H、T1337Q、およびT1337Mのうち1つもしくは複数、またはその対
応するアミノ酸置換を含む、実施形態75から78のいずれか一項に記載の改変された細胞。
81. SpCas9ドメインが、アミノ酸置換D1135L、S1136R、G1218S、E1219V、A1322R、R1335
Q、T1337、およびA1322R、ならびにL1111、D1135L、S1136R、G1218S、E1219V、D1332A、D
1332S、D1332T、D1332V、D1332L、D1332K、D1332R、R1335Q、T1337I、T1337V、T1337F、T
1337S、T1337N、T1337K、T1337R、T1337H、T1337Q、およびT1337Mのうち1つもしくは複数
、またはその対応するアミノ酸置換を含む、実施形態75から78のいずれか一項に記載の改
変された細胞。
82. SpCas9ドメインがアミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A
、R1335E、およびT1337R、またはその対応するアミノ酸置換を含む、実施形態75から78の
いずれか一項に記載の改変された細胞。
83. SpCas9ドメインがNG PAM、NNG PAM、GAA PAM、GAT PAM、またはCAA PAMに対する特
異性を有する、実施形態75または76に記載の改変された細胞。
84. SpCas9ドメインがアミノ酸置換E480K、E543K、およびE1219V、またはその対応する
アミノ酸置換を含む、実施形態83に記載の改変された細胞。
85. Cas9ドメインがSaCas9ドメインを含む、実施形態72から74のいずれか一項に記載の
改変された細胞。
86. SaCas9ドメインがNNNRRT PAMに対する特異性を有する、実施形態85に記載の改変さ
れた細胞。
87. SaCas9ドメインがNNGRRT PAMに対する特異性を有する、実施形態86に記載の改変さ
れた細胞。
88. SaCas9ドメインがアミノ酸置換N579A、またはその対応するアミノ酸置換を含む、実
施形態85から87のいずれか一項に記載の改変された細胞。
89. SaCas9ドメインがアミノ酸置換E782K、N968K、およびR1015H、またはその対応する
アミノ酸置換を含む、実施形態85から89のいずれか一項に記載の改変された細胞。
90. Cas9ドメインがSt1Cas9ドメインを含む、実施形態72から74のいずれか一項に記載の
改変された細胞。
91. St1Cas9ドメインがNNACCA PAMに対する特異性を有する、実施形態90に記載の改変さ
れた細胞。
92. アデノシンデアミナーゼドメインが天然には生成しない改変されたアデノシンデア
ミナーゼドメインである、実施形態63から91のいずれか一項に記載の改変された細胞。
93. アデノシンデアミナーゼドメインがTadAドメインを含む、実施形態92に記載の改変
された細胞。
94. TadAドメインがTadA 7.10のアミノ酸配列を含む、実施形態93に記載の改変された細
胞。
95. 改変塩基エディターシステムがジンクフィンガードメインをさらに含む、実施形態63
から94のいずれか一項に記載の改変された細胞。
96. ジンクフィンガードメインが認識ヘリックス配列RNEHLEV、QSTTLKR、およびRTEHLAR
、または認識ヘリックス配列RGEHLRQ、QSGTLKR、およびRNDKLVPを含む、実施形態95に記
載の改変された細胞。
97. ジンクフィンガードメインがzf1raまたはzf1rbである、実施形態95または96に記載
の改変された細胞。
98. 塩基エディターシステムが核局在化シグナル(NLS)をさらに含む、実施形態63から
97のいずれか一項に記載の改変された細胞。
99. 塩基エディターシステムが1つまたは複数のリンカーをさらに含む、実施形態63から
98のいずれか一項に記載の改変された細胞。
100. ポリヌクレオチドプログラム可能なDNA結合ドメイン、アデノシンデアミナーゼド
メイン、ジンクフィンガードメイン、およびNLSのうち2つ以上がリンカーを介して連結さ
れる、実施形態99に記載の改変された細胞。
101. リンカーがペプチドリンカーであり、それにより塩基編集融合タンパク質が形成さ
れる、実施形態54に記載の改変された細胞。
102. ペプチドリンカーが、SGGSSGSETPGTSESATPESSGGS, SGGSSGGSSGSETPGTSESATPESSGGS
SGGS, GGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPS
EGSAPGTSESATPESGPGSEPATSGGSGGS, SGGSSGGSSGSETPGTSESATPES, SGGSSGGSSGSETPGTSESATP
ESSGGSSGGSSGGSSGGS, SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGS
SGGS, PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAP GTSTEPSEGSAP
GTSESATPESGPGSEPATS, (SGGS)n, (GGGS)n, (GGGGS)n, (G)n, (EAAAK)n, (GGS)n, SGSETPG
TSESATPES, および (XP)nからなる群から選択されるアミノ酸配列を含む、実施形態100に
記載の改変された細胞。
103. 塩基編集融合タンパク質が、
MPKKKRKVSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNY
RLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRR
QEIKAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLV
LNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAG
SLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESDLVL
GLAIGIGSVGVGILNKVTGEIIHKNSRIFPAAQAENNLVRRTNRQGRRLARRKKHRRVRLNRLFEESGLITDFTKISINL
NPYQLRVKGLTDELSNEELFIALKNMVKHRGISYLDDASDDGNSSVGDYAQIVKENSKQLETKTPGQIQLERYQTYGQLR
GDFTVEKDGKKHRLINVFPTSAYRSEALRILQTQQEFNPQITDEFINRYLEILTGKRKYYHGPGNEKSRTDYGRYRTSGE
TLDNIFGILIGKCTFYPDEFRAAKASYTAQEFNLLNDLNNLTVPTETKKLSKEQKNQIINYVKNEKAMGPAKLFKYIAKL
LSCDVADIKGYRIDKSGKAEIHTFEAYRKMKTLETLDIEQMDRETLDKLAYVLTLNTEREGIQEALEHEFADGSFSQKQV
DELVQFRKANSSIFGKGWHNFSVKLMMELIPELYETSEEQMTILTRLGKQKTTSSSNKTKYIDEKLLTEEIYNPVVAKSV
RQAIKIVNAAIKEYGDFDNIVIEMARETNEDDEKKAIQKIQKANKDEKDAAMLKAANQYNGKAELPHSVFHGHKQLATKI
RLWHQQGERCLYTGKTISIHDLINNSNQFEVDHILPLSITFDDSLANKVLVYATANQEKGQRTPYQALDSMDDAWSFREL
KAFVRESKTLSNKKKEYLLTEEDISKFDVRKKFIERNLVDTLYASRVVLNALQEHFRAHKIDTKVSVVRGQFTSQLRRHW
GIEKTRDTYHHHAVDALIIAASSQLNLWKKQKNTLVSYSEDQLLDIETGELISDDEYKESVFKAPYQHFVDTLKSKEFED
SILFSYQVDSKFNRKISDATIYATRQAKVGKDKADETYVLGKIKDIYTQDGYDAFMKIYKKDKSKFLMYRHDPQTFEKVI
EPILENYPNKQINDKGKEVPCNPFLKYKEEHGYIRKYSKKGNGPEIKSLKYYDSKLGNHIDITPKDSNNKVVLQSVSPWR
ADVYFNKTTGKYEILGLKYADLQFDKGTGTYKISQEKYNDIKKKEGVDSDSEFKFTLYKNDLLLVKDTETKEQQLFRFLS
RTMPKQKHYVELKPYDKQKFEGGEALIKVLGNVANSGQCKKGLGKSNISIYKVRTDVLGNQHIIKNEGDKPKLDFPKKKR
KVEGADKRTADGSEFESPKKKRKV、
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSKRN
YILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELS
GINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEV
RGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEEL
RSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFT
NLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLIL
DELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNS
KDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVS
FDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINR
NLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKA
KKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRKLINDTLYSTRKDDKGNTLIVNN
LNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYG
NKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIA
SFYKNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPHIIKTIASKTQSIKKYSTDILGNLYEVKSK
KHPQIIKKGEGADKRTADGSEFESPKKKRKV、
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSKRN
YILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELS
GINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEV
RGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEEL
RSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFT
NLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLIL
DELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNS
KDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVS
FDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINR
NLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKA
KKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRKLINDTLYSTRKDDKGNTLIVNN
LNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYG
NKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIA
SFYKNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPHIIKTIASKTQSIKKYSTDILGNLYEVKSK
KHPQIIKKGEGADKRTADGSEFESPKKKRKVSSGNSNANSRGPSFSSGLVPLSLRGSHSRPGERPFQCRICMRNFSRNEH
LEVHTRTHTGEKPFQCRICMRNFSQSTTLKRHLRTHTGEKPFQCRICMRNFSRTEHLARHLKTHLRGSSAQ、または
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSKRN
YILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELS
GINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEV
RGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEEL
RSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFT
NLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLIL
DELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNS
KDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVS
FDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINR
NLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKA
KKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRKLINDTLYSTRKDDKGNTLIVNN
LNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYG
NKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIA
SFYKNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPHIIKTIASKTQSIKKYSTDILGNLYEVKSK
KHPQIIKKGEGADKRTADGSEFESPKKKRKVSSGNSNANSRGPSFSSGLVPLSLRGSHSRPGERPFQCRICMRNFSRGEH
LRQHTRTHTGEKPFQCRICMRNFSQSGTLKRHLRTHTGEKPFQCRICMRNFSRNDKLVPHLKTHLRGSSAQ
からなる群から選択されるアミノ酸配列を含む、実施形態101または102に記載の改変され
た細胞。
104. ガイドポリヌクレオチドが2つの個別のポリヌクレオチドを含み、2つの個別のポリ
ヌクレオチドが2つのDNA、2つのRNA、または1つのDNAと1つのRNAである、実施形態63から
103のいずれか一項に記載の改変された細胞。
105. ガイドポリヌクレオチドがcrRNAおよびtracrRNAを含み、crRNAがMECP2ポリヌクレ
オチドにおける標的配列に相補的な核酸配列を含む、実施形態63から104のいずれか一項
に記載の改変された細胞。
106. 標的配列が、CCATGTCCAGCCTTCAGGCA, TCCATGTCCAGCCTTCAGGC, TTCCATGTCCAGCCTTCA
GG, GCTTCCATGTCCAGCCTTCA, CTTCCATGTCCAGCCTTCAGG, AGCTTCCATGTCCAGCCTTCAGG, AGCTTC
CATGTCCAGCCTTC, CTTAAGCTTCCATGTCCAGC, AGCAAAAGGCTTTTCCCTGG, GAGCAAAAGGCTTTTCCCTG
, AGAGCAAAAGGCTTTTCCCT, TAGAGCAAAAGGCTTTTCCC, TAGAGCAAAAGGCTTTTCCCT, TTTAGAGCAAA
AGGCTTTTCCCT, CCATGAAGTCAAAATCATTA, ACCATGAAGTCAAAATCATT, TACCATGAAGTCAAAATCAT,
TTACCATGAAGTCAAAATCAT, AGTTACCATGAAGTCAAAATCAT, CTTTTCACTTCCTGCCGGGG, TCAGCCCCGT
TTCTTGGGAA, GCTTTCAGCCCCGTTTCTTG, CGGCTTTCAGCCCCGTTTCTT, CCCGGCTTTCAGCCCCGTTTCTT
, GCACTTCTTGATGGGGAGTA, TCTTGCACTTCTTGATGGGG, CTTGCACTTCTTGATGGGGAG, および GTCT
TGCACTTCTTGATGGGGAGからなる群から選択される配列を含む、実施形態105に記載の改変さ
れた細胞。
107. 塩基エディターシステムがシングルガイドRNA(sgRNA)を含む、実施形態105また
は106に記載の改変された細胞。
108. sgRNAがCUUUUCACUUCCUGCCGGGGを含む、実施形態107に記載の改変された細胞。
109. ガイドポリヌクレオチドまたはそれをコードする核酸;
ポリヌクレオチドプログラム可能なDNA結合ドメインまたはそれをコードする核酸、お
よび
アデノシンデアミナーゼドメインまたはそれをコードする核酸
を含み、
ガイドポリヌクレオチドが塩基エディターシステムをターゲティングして、MECP2ポリヌ
クレオチドにおけるレット症候群(RTT)を引き起こす単一ヌクレオチド多型(SNP)のA
・TからG・Cへの改変をもたらすことができる、塩基エディターシステム。
110. ガイドポリヌクレオチドまたはそれをコードする核酸;
ポリヌクレオチドプログラム可能なDNA結合ドメインまたはそれをコードする核酸、お
よび
アデノシンデアミナーゼドメインまたはそれをコードする核酸
を含み、
ガイドポリヌクレオチドが塩基エディターシステムをターゲティングして、MECP2ポリ
ヌクレオチドにおけるレット症候群(RTT)を引き起こす単一ヌクレオチド多型(SNP)の
A・TからG・Cへの改変をもたらすことができ、
MECP2ポリペプチドが、SNPに起因して106位にトリプトファン、133位にシステイン、25
5位に停止コドン、270位に停止コドン、または306位にシステインを含む病原性アミノ酸
を含むMECP2タンパク質をコードし、
A・TからG・Cへの改変が病原性アミノ酸を野生型アミノ酸に置換する、
塩基エディターシステム。
111. MECP2ポリヌクレオチドが、SNPに起因して106位にトリプトファン、133位にシステ
イン、255位に停止コドン、270位に停止コドン、または306位にシステインを含む病原性
アミノ酸を含むMECP2タンパク質をコードする、実施形態109に記載の塩基エディターシス
テム。
112. A・TからG・Cへの改変が病原性アミノ酸を野生型アミノ酸に置換する、実施形態11
1に記載の塩基エディターシステム。
113. 野生型アミノ酸がアルギニンである、実施形態110から112のいずれか一項に記載の
塩基エディターシステム。
114. A・TからG・Cへの改変がMECP2タンパク質の255位の停止コドンをアルギニンに置換
する、実施形態113に記載の塩基エディターシステム。
115. SNPがMECP2ポリヌクレオチドの763位である、実施形態114に記載の塩基エディター
システム。
116. ポリヌクレオチドプログラム可能なDNA結合ドメインがCas9ドメインである、実施
形態109から115のいずれか一項に記載の塩基エディターシステム。
117. Cas9ドメインがヌクレアーゼ不活性Cas9ドメインである、実施形態116に記載の塩
基エディターシステム。
118. Cas9ドメインがCas9ニッカーゼドメインである、実施形態117に記載の塩基エディ
ターシステム。
119. Cas9ドメインがSpCas9ドメインを含む、実施形態116から118のいずれか一項に記載
の方法。
120. SpCas9ドメインがD10Aおよび/もしくはH840Aアミノ酸置換、またはその対応するア
ミノ酸置換を含む、実施形態119に記載の塩基エディターシステム。
121. SpCas9ドメインがNGG PAMに対する特異性を有する、実施形態119または120に記載
の塩基エディターシステム。
122. SpCas9ドメインがNGA PAM、NGT PAM、またはNGC PAMに対する特異性を有する、実
施形態119から121のいずれか一項に記載の塩基エディターシステム。
123. SpCas9ドメインが、アミノ酸置換L1111R、D1135V、G1218R、E1219F、A1322R、R133
5V、T1337R、ならびにL1111、D1135L、S1136R、G1218S、E1219V、D1332A、R1335Q、T1337
I、T1337V、T1337F、およびT1337Mのうち1つもしくは複数、またはその対応するアミノ酸
置換を含む、実施形態119から121のいずれか一項に記載の塩基エディターシステム。
124. SpCas9ドメインが、アミノ酸置換L1111R、D1135V、G1218R、E1219F、A1322R、R133
5V、T1337RならびにL1111、D1135L、S1136R、G1218S、E1219V、D1332A、D1332S、D1332T
、D1332V、D1332L、D1332K、D1332R、R1335Q、T1337I、T1337V、T1337F、T1337S、T1337N
、T1337K、T1337R、T1337H、T1337Q、およびT1337Mのうち1つもしくは複数、またはその
対応するアミノ酸置換を含む、実施形態119から121のいずれか一項に記載の塩基エディタ
ーシステム。
125. SpCas9ドメインが、アミノ酸置換D1135L、S1136R、G1218S、E1219V、A1322R、R133
5Q、T1337、およびA1322R、ならびにL1111、D1135L、S1136R、G1218S、E1219V、D1332A、
D1332S、D1332T、D1332V、D1332L、D1332K、D1332R、R1335Q、T1337I、T1337V、T1337F、
T1337S、T1337N、T1337K、T1337R、T1337H、T1337Q、およびT1337Mのうち1つもしくは複
数、またはその対応するアミノ酸置換を含む、実施形態119から121のいずれか一項に記載
の塩基エディターシステム。
126. SpCas9ドメインがアミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A
、R1335E、およびT1337R、またはその対応するアミノ酸置換を含む、実施形態119から121
のいずれか一項に記載の塩基エディターシステム。
127. SpCas9ドメインがNG PAM、NNG PAM、GAA PAM、GAT PAM、またはCAA PAMに対する特
異性を有する、実施形態119または120に記載の塩基エディターシステム。
128. Cas9ドメインがアミノ酸置換E480K、E543K、およびE1219V、またはその対応するア
ミノ酸置換を含む、実施形態127に記載の塩基エディターシステム。
129. Cas9ドメインがSaCas9ドメインを含む、実施形態116から118のいずれか一項に記載
の塩基エディターシステム。
130. SaCas9ドメインがNNNRRT PAMに対する特異性を有する、実施形態129に記載の塩基
エディターシステム。
131. SaCas9ドメインがNNGRRT PAMに対する特異性を有する、実施形態130に記載の塩基
エディターシステム。
132. SaCas9ドメインがアミノ酸置換N579A、またはその対応するアミノ酸置換を含む、
実施形態129から131のいずれか一項に記載の塩基エディターシステム。
133. SaCas9ドメインがアミノ酸置換E782K、N968K、およびR1015H、またはその対応する
アミノ酸置換を含む、実施形態129から132のいずれか一項に記載の塩基エディターシステ
ム。
134. Cas9ドメインがSt1Cas9ドメインを含む、実施形態116から118のいずれか一項に記
載の塩基エディターシステム。
135. St1Cas9ドメインがNNACCA PAMに対する特異性を有する、実施形態134に記載の塩基
エディターシステム。
136. アデノシンデアミナーゼドメインが天然には生成しない改変されたアデノシンデア
ミナーゼドメインである、実施形態109から135のいずれか一項に記載の塩基エディターシ
ステム。
137. アデノシンデアミナーゼドメインがTadAドメインを含む、実施形態136に記載の塩
基エディターシステム。
138. TadAドメインがTadA 7.10のアミノ酸配列を含む、実施形態137に記載の塩基エディ
ターシステム。
139. ジンクフィンガードメインをさらに含む、実施形態109から138のいずれか一項に記
載の塩基エディターシステム。
140. ジンクフィンガードメインが認識ヘリックス配列RNEHLEV、QSTTLKR、およびRTEHLA
R、または認識ヘリックス配列RGEHLRQ、QSGTLKR、およびRNDKLVPを含む、実施形態139に
記載の塩基エディターシステム。
141. ジンクフィンガードメインがzf1raまたはzf1rbである、実施形態139または140に記
載の塩基エディターシステム。
142. 核局在化シグナル(NLS)をさらに含む、実施形態109から141のいずれか一項に記
載の塩基エディターシステム。
143. 1つまたは複数のリンカーをさらに含む、実施形態109から142のいずれか一項に記
載の塩基エディターシステム。
144. ポリヌクレオチドプログラム可能なDNA結合ドメイン、アデノシンデアミナーゼド
メイン、ジンクフィンガードメイン、およびNLSのうち2つ以上がリンカーを介して連結さ
れる、実施形態143に記載の塩基エディターシステム。
145. リンカーがペプチドリンカーであり、それにより塩基編集融合タンパク質が形成さ
れる、実施形態144に記載の塩基エディターシステム。
146. ペプチドリンカーが、SGGSSGSETPGTSESATPESSGGS, SGGSSGGSSGSETPGTSESATPESSGGS
SGGS, GGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPS
EGSAPGTSESATPESGPGSEPATSGGSGGS, SGGSSGGSSGSETPGTSESATPES, SGGSSGGSSGSETPGTSESATP
ESSGGSSGGSSGGSSGGS, SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGS
SGGS, PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAP GTSTEPSEGSAP
GTSESATPESGPGSEPATS, (SGGS)n, (GGGS)n, (GGGGS)n, (G)n, (EAAAK)n, (GGS)n, SGSETPG
TSESATPES, および(XP)nからなる群から選択されるアミノ酸配列を含む、実施形態145に
記載の塩基エディターシステム。
147. 塩基編集融合タンパク質が、
MPKKKRKVSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNY
RLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRR
QEIKAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLV
LNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAG
SLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESDLVL
GLAIGIGSVGVGILNKVTGEIIHKNSRIFPAAQAENNLVRRTNRQGRRLARRKKHRRVRLNRLFEESGLITDFTKISINL
NPYQLRVKGLTDELSNEELFIALKNMVKHRGISYLDDASDDGNSSVGDYAQIVKENSKQLETKTPGQIQLERYQTYGQLR
GDFTVEKDGKKHRLINVFPTSAYRSEALRILQTQQEFNPQITDEFINRYLEILTGKRKYYHGPGNEKSRTDYGRYRTSGE
TLDNIFGILIGKCTFYPDEFRAAKASYTAQEFNLLNDLNNLTVPTETKKLSKEQKNQIINYVKNEKAMGPAKLFKYIAKL
LSCDVADIKGYRIDKSGKAEIHTFEAYRKMKTLETLDIEQMDRETLDKLAYVLTLNTEREGIQEALEHEFADGSFSQKQV
DELVQFRKANSSIFGKGWHNFSVKLMMELIPELYETSEEQMTILTRLGKQKTTSSSNKTKYIDEKLLTEEIYNPVVAKSV
RQAIKIVNAAIKEYGDFDNIVIEMARETNEDDEKKAIQKIQKANKDEKDAAMLKAANQYNGKAELPHSVFHGHKQLATKI
RLWHQQGERCLYTGKTISIHDLINNSNQFEVDHILPLSITFDDSLANKVLVYATANQEKGQRTPYQALDSMDDAWSFREL
KAFVRESKTLSNKKKEYLLTEEDISKFDVRKKFIERNLVDTLYASRVVLNALQEHFRAHKIDTKVSVVRGQFTSQLRRHW
GIEKTRDTYHHHAVDALIIAASSQLNLWKKQKNTLVSYSEDQLLDIETGELISDDEYKESVFKAPYQHFVDTLKSKEFED
SILFSYQVDSKFNRKISDATIYATRQAKVGKDKADETYVLGKIKDIYTQDGYDAFMKIYKKDKSKFLMYRHDPQTFEKVI
EPILENYPNKQINDKGKEVPCNPFLKYKEEHGYIRKYSKKGNGPEIKSLKYYDSKLGNHIDITPKDSNNKVVLQSVSPWR
ADVYFNKTTGKYEILGLKYADLQFDKGTGTYKISQEKYNDIKKKEGVDSDSEFKFTLYKNDLLLVKDTETKEQQLFRFLS
RTMPKQKHYVELKPYDKQKFEGGEALIKVLGNVANSGQCKKGLGKSNISIYKVRTDVLGNQHIIKNEGDKPKLDFPKKKR
KVEGADKRTADGSEFESPKKKRKV、
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSKRN
YILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELS
GINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEV
RGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEEL
RSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFT
NLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLIL
DELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNS
KDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVS
FDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINR
NLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKA
KKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRKLINDTLYSTRKDDKGNTLIVNN
LNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYG
NKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIA
SFYKNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPHIIKTIASKTQSIKKYSTDILGNLYEVKSK
KHPQIIKKGEGADKRTADGSEFESPKKKRKV、
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSKRN
YILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELS
GINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEV
RGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEEL
RSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFT
NLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLIL
DELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNS
KDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVS
FDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINR
NLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKA
KKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRKLINDTLYSTRKDDKGNTLIVNN
LNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYG
NKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIA
SFYKNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPHIIKTIASKTQSIKKYSTDILGNLYEVKSK
KHPQIIKKGEGADKRTADGSEFESPKKKRKVSSGNSNANSRGPSFSSGLVPLSLRGSHSRPGERPFQCRICMRNFSRNEH
LEVHTRTHTGEKPFQCRICMRNFSQSTTLKRHLRTHTGEKPFQCRICMRNFSRTEHLARHLKTHLRGSSAQ、または
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSKRN
YILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELS
GINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEV
RGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEEL
RSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFT
NLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLIL
DELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNS
KDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVS
FDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINR
NLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKA
KKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRKLINDTLYSTRKDDKGNTLIVNN
LNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYG
NKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIA
SFYKNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPHIIKTIASKTQSIKKYSTDILGNLYEVKSK
KHPQIIKKGEGADKRTADGSEFESPKKKRKVSSGNSNANSRGPSFSSGLVPLSLRGSHSRPGERPFQCRICMRNFSRGEH
LRQHTRTHTGEKPFQCRICMRNFSQSGTLKRHLRTHTGEKPFQCRICMRNFSRNDKLVPHLKTHLRGSSAQ
からなる群から選択されるアミノ酸配列を含む、実施形態145または146に記載の塩基エデ
ィターシステム。
148. ガイドポリヌクレオチドが2つの個別のポリヌクレオチドを含み、2つの個別のポリ
ヌクレオチドが2つのDNA、2つのRNA、または1つのDNAと1つのRNAである、実施形態109か
ら147のいずれか一項に記載の塩基エディターシステム。
149. ガイドポリヌクレオチドがcrRNAおよびtracrRNAを含み、crRNAがMECP2ポリヌクレ
オチドにおける標的配列に相補的な核酸配列を含む、実施形態109から148のいずれか一項
に記載の塩基エディターシステム。
150. 標的配列が、CCATGTCCAGCCTTCAGGCA, TCCATGTCCAGCCTTCAGGC, TTCCATGTCCAGCCTTCA
GG, GCTTCCATGTCCAGCCTTCA, CTTCCATGTCCAGCCTTCAGG, AGCTTCCATGTCCAGCCTTCAGG, AGCTTC
CATGTCCAGCCTTC, CTTAAGCTTCCATGTCCAGC, AGCAAAAGGCTTTTCCCTGG, GAGCAAAAGGCTTTTCCCTG
, AGAGCAAAAGGCTTTTCCCT, TAGAGCAAAAGGCTTTTCCC, TAGAGCAAAAGGCTTTTCCCT, TTTAGAGCAAA
AGGCTTTTCCCT, CCATGAAGTCAAAATCATTA, ACCATGAAGTCAAAATCATT, TACCATGAAGTCAAAATCAT,
TTACCATGAAGTCAAAATCAT, AGTTACCATGAAGTCAAAATCAT, CTTTTCACTTCCTGCCGGGG, TCAGCCCCGT
TTCTTGGGAA, GCTTTCAGCCCCGTTTCTTG, CGGCTTTCAGCCCCGTTTCTT, CCCGGCTTTCAGCCCCGTTTCTT
, GCACTTCTTGATGGGGAGTA, TCTTGCACTTCTTGATGGGG, CTTGCACTTCTTGATGGGGAG, および GTCT
TGCACTTCTTGATGGGGAGからなる群から選択される配列を含む、実施形態149に記載の塩基エ
ディターシステム。
151. シングルガイドRNA(sgRNA)を含む、実施形態149または150に記載の塩基エディタ
ーシステム。
152. sgRNAがCUUUUCACUUCCUGCCGGGGを含む、実施形態151に記載の塩基エディターシステ
ム。
【実施例0449】
これらの実施例は説明目的のためのみに提供され、本明細書で提供する特許請求の範囲
を限定するものではない。
【0450】
実施例1.細胞内のMecp2 RTT関連変異の補正のためのA・TからG・CへのDNA塩基編集
RTTを引き起こす8種の最も優勢なMecp2の変異のうち6種を、立証されたプロトスペーサ
ー隣接モチーフ(PAM)配列の嗜好性を有するCas9部分を採用するA・TからG・CへのDNA塩
基エディター(ABE)を用いて、野生型配列への逆行のために標的化した。どのガイドRNA
(gRNA)およびABE-Cas9プラットフォームが最も効率的かつ正確に標的のMecp2変異を補
正することができるかを決定するために、R255Xを含むRTT標的化可能変異(表66)を有す
るMecp2アリルを、レンチウイルスを用いる形質導入によって、HEK293T細胞のゲノムに組
み入れた。所与の変異に対するgRNAおよびABE-Cas9エディターの編集効率を測定した。AB
E-Cas9エディターおよびgRNAをコードするDNAをトランスフェクトした5日後に細胞を溶解
し、所望の部位における塩基編集についてmiSeq解析によって解析した。
【0451】
【0452】
一組の実験では、核酸配列CUUUUCACUUCCUGCCGGGGを含むgRNAを用いてR255Xを標的化し
た。この配列は、RTT変異763C>T(R255X)を含む核酸配列CTTTTCACTTCCTGCCGGGGに塩基エ
ディターをターゲティングさせる。
【0453】
SpCas9においてアミノ酸置換L1111R、D1135V、G1218R、E1219F、A1322R、R1335V、T133
7R、ならびにL1111、D1135L、S1136R、G1218S、E1219V、D1332A、R1335Q、T1337I、T1337
V、T1337F、およびT1337Mのうち1つもしくは複数を有する、NGT PAMに特異性を有するア
デノシンデアミナーゼ塩基エディターを創成した。塩基エディターは、R255Xの正確な補
正によって測定される活性を示した。
【0454】
SpCas9においてアミノ酸置換L1111R、D1135V、G1218R、E1219F、A1322R、R1335V、T133
7R、ならびにL1111、D1135L、S1136R、G1218S、E1219V、D1332A、D1332S、D1332T、D1332
V、D1332L、D1332K、D1332R、R1335Q、T1337I、T1337V、T1337F、T1337S、T1337N、T1337
K、T1337H、T1337Q、およびT1337Mのうち1つもしくは複数を有する、NGT PAMに特異性を
有するアデノシンデアミナーゼ塩基エディターを創成した。塩基エディターは、R255Xの
正確な補正によって測定される活性を示した(
図1)。
【0455】
SpCas9においてアミノ酸置換D1135L、S1136R、G1218S、E1219V、A1322R、R1335Q、およ
びT1337、ならびにL1111R、D1332A、D1332S、D1332T、D1332V、D1332L、D1332K、D1332R
、T1337、T1337I、T1337V、T1337F、T1337S、T1337N、T1337K、T1337R、T1337H、T1337Q
、およびT1337Mのうち1つもしくは複数を有する、NGT PAMに特異性を有するアデノシンデ
アミナーゼ塩基エディターを創成した。塩基エディターは、R255Xの正確な補正によって
測定される活性を示した(
図2)。左側のデータ(淡灰色)にはpCAGプロモーターを用い
、右側のデータ(濃灰色)にはpCMVプロモーターを用いた。
【0456】
NGT PAMに特異性を有するアデノシンデアミナーゼ塩基エディターを、表7に示すように
産生した。
表7.NGT PAMバリアント
【表7】
【0457】
塩基エディターは、R255Xの正確な補正によって測定される活性を示した(
図3)。特に
、LRSVRQLとも名付けられるバリアント6は4%の塩基編集を示し、全てのバリアントの中で
最多であった。バリアント6はA1322RおよびT1337Lを含んでいる。理論に縛られるもので
はないが、これらのアミノ酸置換はNGT PAMへの特異性に重要であったことを提案された
。
【0458】
特徴解析された他のPAMバリアントからのさらなる変異を、PAMバリアント6に導入した
。編集にはアミノ酸残基T1337が重要であると特定された(
図4)。バリアント6に基づき
、T1337QおよびT1337を有するように修飾されたPAMバリアントは、T1337Lと比較して、R2
55Xの補正のための編集が増大していることを示した。バリアント6に基づき、D1332Aを有
するように改変されたPAMバリアントも、バリアント6と比較してR255Xの補正のための編
集が増大していることが特定された。
【0459】
T1337およびD1332の残基をさらに特徴解析するため、R255Xの補正のための編集効率に
関してこれら2つの位置で様々なアミノ酸を試験した。1337位における他の置換と比較し
て、T1337およびT1337Qが編集のための最も重要な残基であった(
図5)。
【0460】
特にT1337を評価するため、PAMバリアントにおける個別のアミノ酸を野生型に逆行させ
た。理論に縛られるものではないが、この解析によってどの残基がNGT PAMの活性に重要
であるかを特定することができる。特にE1219VおよびR1335QがT1337に関連する活性に重
要であることが示された。それは、これらの残基のそれぞれにおける野生型への逆行が編
集を無効化、顕著に低減させたからである(
図6)。
【0461】
分子モデリングも用いて、NGT PAM認識を改善するためのペアワイズ変異のライブラリ
ーを得た。アミノ酸を入れ替えてPAMバリアント6から55種の新たなバリアントを創成した
。変異の群を下の表8および表9に示す。
表8:残基1219、1335、1337、1218におけるNGT PAMバリアント変異
【表8】
表9:残基1135、1136、1218、1219、および1335におけるNGT PAMバリアント変異
【表9】
[0001]
表8および表9における55種の新たなPAMバリアントについての標的化変異によって、T13
37の重要性が補強された(
図7および
図8)。表8のバリアント5は顕著に強化された編集を
呈した(
図7)。特に、バリアント5の配列(表8)は、T1337への逆行を含む。
[0002]
表10に示すように、NGT PAM認識を改善するために、さらなるペアワイズ変異を産生し
た。
表10:残基1219、1335、1337、1218におけるNGT PAMバリアント変異
【表10】
[0003]
表10に示すように、NGT PAM認識を改善するために、さらなるペアワイズ変異を産生し
た。置換G1218Rは、E1219F、R1335V、およびT1337またはT1337Qによる編集について相加
的であった(
図9)。
【0462】
実施例2.材料および方法
本明細書に記載した実施例で提供した結果は、以下の材料および方法を用いて得られた
[クローニング]
PCRはVeraSeq ULtra DNAポリメラーゼ (Enzymatics) またはQ5 Hot Start High-Fideli
ty DNAポリメラーゼ(New England Biolabs)を用いて行った。USERクローニング(New Engl
and Biolabs)を用いて塩基エディター (BE) プラスミドを構築した。デアミナーゼ遺伝子
はgBlocks Gene Fragments (Integrated DNA Technologies)として合成された。用いたCa
s9遺伝子は下記に示す。Cas9遺伝子は以前に報告されたプラスミドから得られた。デアミ
ナーゼと融合遺伝子をpCMV (哺乳類コドン最適化)またはpET28b (大腸菌コドン最適化)の
骨格にクローニングした。sgRNA発現プラスミドは、部位特異的変異誘発を用いて構築し
た。
【0463】
簡単に説明すると、上述のプライマーは、製造業者の指示に従ってT4ポリヌクレオチド
キナーゼ(New England Biolabs)を用いて5’リン酸化した。次に、リン酸化プライマー、
およびテンプレートとしての、Mecp2をコードするプラスミドと共に、Q5 Hot Start High
-Fidelity Polymerase (New England Biolabs)を用いて、製造業者の指示に従ってPCRを
実施した。PCR産物をDpnI (20 U、New England Biolabs)と共に37℃で1時間インキュベー
トし、QIAprepスピンカラム(Qiagen) で精製し、製造業者の指示に従ってQuickLigase (N
ew England Biolabs)を用いてライゲーションした。DNAベクター増幅はMach1コンピテン
ト細胞(ThermoFisher Scientific)を用いて行った。
【0464】
gRNAについて、以下の足場配列を示す:GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGU
C CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU。この足場は、本明細書の表に示され
るPAM、例えばNGG、NGA、NGC、NGT PAMのために使用された;gRNAは、このスキャフォー
ド配列と、本明細書に提供されるか、または当業者の知識に基づいて決定されかつ当業者
に理解されるような、疾患関連遺伝子(例えば表3A、3Bおよび4)のためのおよびスペーサ
ー配列(標的配列)とを包含する。(例えば、Komor, A.C., et al., “Programmable editi
ng of a target base in genomic DNA without double-stranded DNA cleavage” Nature
533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・
T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Kom
or, A.C., et al., “Improved base excision repair inhibition and bacteriophage M
u Gam protein yields C:G-to-T:A base editors with higher efficiency and product
purity” Science Advances 3:eaao4774 (2017), and Rees, H.A., et al., “Base edit
ing: precision chemistry on the genome and transcriptome of living cells.” Nat
Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1参照。)
【0465】
[ssDNAに対するインビトロのデアミナーゼアッセイ]
Cy3標識基質はすべてIntegrated DNA Technologies (IDT) から入手した。デアミナー
ゼは、1μgのプラスミドを使用して、製造業者の指示に従ってTNT T7 Quick Coupled Tra
nscription/Translation Kit (Promega) を使用してin vitroで発現させた。タンパク質
発現に続いて、5μlの溶解物を、CutSmart緩衝液(New England Biolabs) (50 mM酢酸カリ
ウム、29 mMトリス酢酸、10 mM酢酸マグネシウム、100μg ml-1 BSA、pH 7.9)中で35μl
のssDNA (1.8μM)およびUSER酵素(1ユニット)と組み合わせ、37℃で2時間インキュベート
した。切断されたU含有基質を、10% TBE‐尿素ゲル(Bio-Rad) 上で完全長未改変基質から
分離した。
【0466】
[His6-rAPOBEC1-リンカー-dCas9融合体の発現および精製]
大腸菌BL21 STAR (DE3) コンピテント細胞(ThermoFisher Scientific)を、pET28b-His6
-rAPOBEC1-リンカー-dCas9リンカーをコードするプラスミドで形質転換した。得られた発
現株を、カナマイシン100μg/mlを含むLuria-Bertani (LB) ブロス中で37℃で一晩増殖さ
せた。細胞を同じ増殖培地に1:100希釈し、OD600=~0.6になるまで37℃で増殖させた。培
養物を4℃で2時間冷却し、イソプロピル-β-d-1-チオガラクトピラノシド(IPTG) を0.5 m
Mで添加してタンパク質発現を誘導した。約16時間後、4,000 gで遠心分離して細胞を集め
、溶解緩衝液(50 mMトリス(ヒドロキシメチル)アミノメタン(Tris) -HCl (pH 7.5)、1M N
aCl、20%グリセロール、10 mMトリス(2-カルボキシエチル)ホスフィン(TCEP、Soltec Ven
tures))に再懸濁した。細胞を超音波処理(20秒パルス・オン、20秒パルス・オフ、合計8
分間、6 W出力)によって溶解し、25,000 gで15分間遠心分離した後に溶解物上清を単離し
た。溶解物をHis-Purニッケル-ニトリロ酢酸(ニッケル-NTA) 樹脂(ThermoFisher Scienti
fic)と共に4℃で1時間インキュベートし、His標識融合タンパク質を捕捉した。樹脂をカ
ラムに移し、溶解緩衝液40 mlで洗浄した。Hisタグ融合タンパク質を、285 mMイミダゾー
ルを補充した溶解緩衝液中で溶出し、限外濾過(100 kDa分子量カットオフのAmicon-Milli
pore)によって全容量1 mlに濃縮した。タンパク質を、50 mMトリス(ヒドロキシメチル)-
アミノメタン(Tris) -HCl (pH 7.0)、0.1 M NaCl、20%グリセロール、10 mM TCEPを含む
低塩精製緩衝液中で20mlに希釈し、SPセファロースFast Flow樹脂(GE Life Sciences)上
にロードした。樹脂をこの低塩緩衝液40 mlで洗浄し、50 mMトリス(ヒドロキシメチル)ア
ミノメタン(Tris) -HCl (pH 7.0)、0.5 M NaCl、20%グリセロール、10 mM TCEPを含む活
性緩衝液5 mlでタンパク質を溶出した。溶出したタンパク質をSDS-PAGEで定量した。
【0467】
[sgRNAのin vitro転写]
T7プロモーターに続いて20-bp sgRNA標的配列を含む直鎖DNA断片を、製造業者の指示に
従ってTranscriptAid T 7 High Yield Transcription Kit (ThermoFisher Scientific)を
用いて、in vitroで転写した。製造業者の指示に従ってMEGAclear キット(ThermoFisher
Scientific)を用いてsgRNA産物を精製し、UV吸収により定量した。
【0468】
[Cy3共役dsDNA基質の調製]
80 ntの無標識鎖の配列を、PAGE精製オリゴヌクレオチドとしてIDT社にオーダーした。
補足情報に記載された25-nt Cy3標識プライマーは、各80 nt基質の3’末端に相補的であ
る。このプライマーは、HPLC精製オリゴヌクレオチドとしてIDTにオーダーした。Cy3標識
dsDNA基質を生成するために、80 nt鎖(5μlの100μM溶液)を、Cy3標識プライマー(5μlの
100μM溶液)とNEBuffer 2 (38.25μlの50 mM NaCl、10 mM Tris-HCl、10 mM MgCl2、1 mM
DTT、pH 7.9溶液、New England Biolabs)中でdNTP (0.75μlの100 mM溶液)と組み合わせ
、95℃で5分間加熱し、その後45℃まで0.1℃/秒の速度で徐々に冷却した。このアニーリ
ング期間の後、Klenow exo-(5U、New England Biolabs)を加え、反応物を37℃で1時間イ
ンキュベートした。溶液を緩衝液PB (250μl、Qiagen)およびイソプロパノール(50μl)で
希釈し、QIAprepスピンカラム(Qiagen) で精製し、50μlのTris緩衝液で溶出した。dsDNA
に対するデアミナーゼアッセイ。精製した融合タンパク質(活性緩衝液中1.9μMを20μl)
を1当量の適切なsgRNAと組み合わせ、周囲温度で5分間インキュベートした。Cy3標識dsDN
A基質を125 nMの最終濃度で添加し、得られた溶液を37℃で2時間インキュベートした。緩
衝液PB (100μl、Qiagen)およびイソプロパノール(25μl)の添加により融合物からdsDNA
を分離し、EconoSpinマイクロスピンカラム(Epoch Life Science)で精製し、20μlのCutS
mart緩衝液(New England Biolabs)で溶出した。精製された編集dsDNAにUSER酵素(1 U、Ne
w England Biolabs)を添加し、37℃で1時間インキュベートした。5μlの反応溶液を15μl
のDMSOベースのローディング緩衝液(5 mM Tris、0.5 mM EDTA、12.5%グリセロール、0.02
%ブロモフェノールブルー、0.02%キシレンシアン、80% DMSO)と組み合わせることによっ
て、Cy3標識鎖をその相補鎖から完全に変性させた。全長C含有基質を、10% TBE-尿素ゲル
(Bio-Rad) 上で、切断されたU含有編集基質から分離し、GE Amersham Typhoonイメージャ
ー上で画像化した。
【0469】
[ハイスループットシークエンシングのためのin vitro編集dsDNAの調製]
下記オリゴヌクレオチドはIDT社から入手した。相補的配列をTris緩衝液中で組み合わ
せ(5μlの100μM溶液)、95℃に5分間加熱し、続いて45℃まで0.1℃/秒の速度で徐々に冷
却することによってアニールし、60 bpのdsDNA基質を生成した。精製融合タンパク質(活
性緩衝液中1.9μMを20μl)を1当量の適切なsgRNAと組み合わせ、周囲温度で5分間インキ
ュベートした。60マーdsDNA基質を125 nMの最終濃度で添加し、得られた溶液を37℃で2時
間インキュベートした。緩衝液PB (100μl、Qiagen)およびイソプロパノール(25μl)の添
加により融合物からdsDNAを分離し、EconoSpinマイクロスピンカラム(Epoch Life Scienc
e)で精製し、20μlのTris緩衝液で溶出した。得られた編集されたDNA (1μlをテンプレー
トとして使用した)を、製造業者の指示に従って下記ハイスループット配列決定プライマ
ー対およびVeraSeq Ultra (Enzymatics) を用いて13サイクルの増幅を伴うPCRによって増
幅した。RapidTips (Diffinity Genomics)を用いてPCR反応生成物を精製し、精製したDNA
を、シークエンシングアダプターを含むプライマーを用いてPCRにより増幅し、精製し、
先に記載したようにMiSeqハイスループットDNAシークエンサー(Illumina) 上で配列決定
した。
【0470】
[細胞培養]
HEK293T (ATCC CRL-3216)およびU2OS (ATCC HTB-96)を、10% (v/v) ウシ胎児血清 (FBS
) を補充したダルベッコの改変イーグル培地プラスGlutaMax (ThermoFisher) 中で、37℃
、5% CO2で維持した。HCC1954細胞(ATCC CRL-2338)を、上記のように補充したRPMI-1640
培地(ThermoFisher Scientific)中で維持した。Mecp2遺伝子を含有する不死化細胞(Tacon
ic Biosciences)を、10% (v/v) ウシ胎児血清 (FBS) および200μg ml-1ゲネチシン(Ther
moFisher Scientific)を補足したダルベッコの改変イーグル培地プラスGlutaMax (Thermo
Fisher Scientific)中で培養した。
【0471】
[トランスフェクション]
HEK293Tを、48ウェルのコラーゲン被覆BioCoatプレート(Corning) 上に播種し、約85%
コンフルエントの状態でトランスフェクトした。簡単に述べれば、750 ngのBEおよび250
ngのsgRNA発現プラスミドを、1.5μlのリポフェクタミン2000 (ThermoFisher Scientific
)/ウェルを用いて、製造業者のプロトコルに従ってトランスフェクトした。HEK293T細胞
を、メーカーの指示に従って、適切なAmaxa Nucleofector IIプログラムを用いてトラン
スフェクトした(HEK 293T細胞のためのプログラムQ-001を用いるVキット)。
【0472】
[ゲノムDNA試料のハイスループットDNA配列決定]
トランスフェクトした細胞を3日後に収穫し、Agencourt DNAdvance Genomic DNA Isola
tion Kit (Beckman Coulter)を製造業者の指示に従って用いてゲノムDNAを単離した。対
象のオン・ターゲットおよびオフ・ターゲットゲノム領域を、隣接するハイスループット
配列決定プライマー対を用いたPCRによって増幅した。PCR増幅は、5 ngのゲノムDNAをテ
ンプレートとして使用し、Phusion高忠実度DNAポリメラーゼ(ThermoFisher) を用いて、
製造業者の指示に従って実施した。反応が直線的増幅範囲内で停止することを確実にする
ために、各プライマー対について別々にサイクル数を決定した。RapidTips (Diffinity G
enomics)を用いてPCR産物を精製した。精製DNAを、配列決定アダプターを含むプライマー
を用いたPCRにより増幅した。生成物をゲル精製し、Quant-iT PicoGreen dsDNA Assay Ki
t (ThermoFisher) およびKAPA Library Quantification Kit-Illumina (KAPA Biosystems
)を用いて定量した。サンプルは、前述のようにIllumina MiSeq上で配列決定された(Patt
anayak, Nature Biotechnol. 31, 839-843 (2013))。
【0473】
[データ分析]
配列決定リード(read)は、MiSeq Reporter (Illumina) を使用して自動的に脱マルチ
プレックス化され、個々のFASTQファイルを、カスタムMatlabを使用して分析した。各リ
ードは、Smith-Watermanアルゴリズムを使用して、適切な参照配列にペアワイズでアライ
ンメントされた。Qスコアが31未満の塩基コールはNに置き換え、ヌクレオチド頻度の計算
から除外した。この処理により、予測されるMiSeq塩基呼び出しエラー率は約1,000分の1
になる。リードと参照配列がギャップを含まないアラインメント配列は、アラインメント
テーブルに保存し、そこから各遺伝子座について塩基頻度を表にすることができた。イン
デル頻度は、前述の基準(Zuris, et al., Nature Biotechnol. 33, 73-80 (2015)) を用
いて、カスタムのMatlabスクリプトで定量した。配列決定リードをスキャンして、インデ
ル(indel)が生じる可能性のあるウィンドウの両側に隣接する二つの10 bp配列との正確
なマッチを探した。完全なマッチが見つからなかった場合、そのリードは分析から除外し
た。このインデルウィンドウの長さが参照配列と正確に一致した場合、そのリードはイン
デルを含まないものとして分類された。インデルウィンドウが参照配列よりも2塩基以上
長いかまたは短い場合、その配列決定リードは、それぞれ挿入または欠失として分類され
た。
レット症候群(RTT)に関連する単一ヌクレオチド多型(SNP)を含むMECP2ポリヌクレオチドを編集する方法であって、前記MECP2ポリヌクレオチドを、1つまたは複数のガイドポリヌクレオチドと複合体化した塩基エディターと接触させることを含み、前記塩基エディターが、ポリヌクレオチドプログラム可能なDNA結合ドメインおよびアデノシンデアミナーゼドメインを含み、前記ガイドポリヌクレオチドの1つまたは複数が、前記塩基エディターをターゲティングしてRTTに関連する前記SNPのA・TからG・Cへの改変をもたらす、方法。