(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024112895
(43)【公開日】2024-08-21
(54)【発明の名称】変更されたPAM特異性を有する遺伝子操作されたCRISPR-Cas9ヌクレアーゼ
(51)【国際特許分類】
C12N 9/16 20060101AFI20240814BHJP
C07K 19/00 20060101ALI20240814BHJP
C12N 15/09 20060101ALI20240814BHJP
C12N 15/55 20060101ALN20240814BHJP
【FI】
C12N9/16 Z ZNA
C07K19/00
C12N15/09 110
C12N9/16 Z
C12N15/55
【審査請求】有
【請求項の数】31
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024080681
(22)【出願日】2024-05-17
(62)【分割の表示】P 2020511253の分割
【原出願日】2018-08-22
(31)【優先権主張番号】62/549,303
(32)【優先日】2017-08-23
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/641,687
(32)【優先日】2018-03-12
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】592017633
【氏名又は名称】ザ ジェネラル ホスピタル コーポレイション
(74)【代理人】
【識別番号】100092783
【弁理士】
【氏名又は名称】小林 浩
(74)【代理人】
【識別番号】100120134
【弁理士】
【氏名又は名称】大森 規雄
(72)【発明者】
【氏名】ジョン,キース,ジェイ.
(72)【発明者】
【氏名】クラインスティーバー,ベンジャミン
(57)【要約】 (修正有)
【課題】変更および改善されたプロトスペーサー隣接モチーフ(PAM)特異性を有する、遺伝子操作されたCRISPR-Cas9ヌクレアーゼを提供する。
【解決手段】一般に使用される化膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)を、構造情報、細菌選択に基づく指向進化およびコンビナトリアル設計を使用して、新規なPAM配列を認識するように遺伝子操作した。これらの変更されたPAM特異性バリアントは、野生型SpCas9によって効率よく標的化することができないヒト細胞中のレポーター部位および内在性遺伝子部位の安定した編集を可能にする。
【選択図】
図1
【特許請求の範囲】
【請求項1】
以下の位置:D1135、S1136、G1218、E1219、R1335および/
もしくはT1337の3つ、4つ、5つまたは6つすべてで変異を有する、単離された化
膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)タンパク質であって
、前記変異が、VSREERまたはVSREQRではない、タンパク質。
【請求項2】
配列番号1のアミノ酸配列と少なくとも80%同一である配列を含む、請求項1に記載
の単離されたタンパク質。
【請求項3】
表A、1、2または3に示される変異のセットを含む、請求項1に記載の単離されたタ
ンパク質。
【請求項4】
以下の変異のセット:
LRSVQL、LRKIQK、LRSVQK、LWKIQK、VRKIQK、LWKIQ
K、IRAVQL、VRKLRS、GRKIQK、SWRVVV、SWKVLK、TAH
FKV、MSGVKC、LRSVRS、SKTLRP、MWVHLN、TWSMRG、K
RRCKV、VRAVQL、VSSVRS、VRSVRS、SRMHCK、GWKLLR
、GWKOQK、VAKLLR、VAKIQK、VAKILR、GRKILR、VRKL
LR、IRAVQL、VRKIQK、またはVRMHCKバリアント(例えば、NGTN
PAMについて);MQKSER、VRKSER、ICKSER、LRSVER、LW
LETR、LSRWER、MQSVQL、VRREER、ICCCER、LSRWQR、
LWRVVA、WMQAYG、LWRSEY、SQSWRS、LKAWRS、LWGWQ
H、MCSFER、LWMREQ、LWRVVA、HSSWVR、MWSEPT、GSN
YQS、FMQWVN、YCSWVG、MCAWCG、FMQWVR、またはSSKWP
Aバリアント(例えば、NGCN PAMについて);LRSVRS、SRQMRG、M
RARKE、SRMHCK、VRREQR、VRGEQR、LRLSAR、AWTEVT
R、KWMMCG、VRGAKE、AWNFQV、LWTTLN、SRMHCK、CWC
QCV、AEEQQR、GWEKVR、NRAVNG、LRSYLH、VRGNNR、V
QDAQR、GWRQSK、AWLCLS、KWARVV、MWAARP、SRMHCK
、VKMAKG、QRKTRE、LCRQQR、CWSHQR、SRTHTQ、LWEV
IR、VSSVRS、VRSVRS、IRAVRS、SRSVRS、LWKIQK、また
はVRMHCKバリアント(例えば、NGAN PAMについて)
を含む、請求項1~3に記載の単離されたタンパク質。
【請求項5】
D10、E762、D839、H983またはD986;およびH840またはN86
3での変異からなる群から選択されるヌクレアーゼ活性を減少させる1つまたは複数の変
異をさらに含む、請求項1に記載の単離されたタンパク質。
【請求項6】
前記変異が、
(i)D10AまたはD10N、および
(ii)H840A、H840NまたはH840Y
である、請求項5に記載の単離されたタンパク質。
【請求項7】
N497、R661、N692、M694、Q695、H698、K810、K848
、Q926、K1003およびR0160での変異、ならびに任意選択でK526および
/またはR691での変異からなる群から選択される特異性を増加させる1つまたは複数
の変異をさらに含む、請求項1に記載の単離されたタンパク質。
【請求項8】
N692A、Q695A、Q926A、H698A、N497A、R661A、M69
4A、K810A、K848A、K1003A、R0160A、Y450A/Q695A
、L169A/Q695A、Q695A/Q926A、Q695A/D1135E、Q9
26A/D1135E、Y450A/D1135E、L169A/Y450A/Q695
A、L169A/Q695A/Q926A、Y450A/Q695A/Q926A、R6
61A/Q695A/Q926A、N497A/Q695A/Q926A、Y450A/
Q695A/D1135E、Y450A/Q926A/D1135E、Q695A/Q9
26A/D1135E、L169A/Y450A/Q695A/Q926A、L169A
/R661A/Q695A/Q926A、Y450A/R661A/Q695A/Q92
6A、N497A/Q695A/Q926A/D1135E、R661A/Q695A/
Q926A/D1135E、およびY450A/Q695A/Q926A/D1135E
;N692A/M694A/Q695A/H698A、N692A/M694A/Q69
5A/H698A/Q926A;N692A/M694A/Q695A/Q926A;N
692A/M694A/H698A/Q926A;N692A/Q695A/H698A
/Q926A;M694A/Q695A/H698A/Q926A;N692A/Q69
5A/H698A;N692A/M694A/Q695A;N692A/H698A/Q
926A;N692A/M694A/Q926A;N692A/M694A/H698A
;M694A/Q695A/H698A;M694A/Q695A/Q926A;Q69
5A/H698A/Q926A;G582A/V583A/E584A/D585A/N
588A/Q926A;G582A/V583A/E584A/D585A/N588A
;T657A/G658A/W659A/R661A/Q926A;T657A/G65
8A/W659A/R661A;F491A/M495A/T496A/N497A/Q
926A;F491A/M495A/T496A/N497A;K918A/V922A
/R925A/Q926A;または918A/V922A/R925A;K855A;K
810A/K1003A/R1060A;またはK848A/K1003A/R1060
A、および任意選択でK526Aおよび/またはR691Aの変異を含む、請求項7に記
載の単離されたタンパク質。
【請求項9】
任意の介在リンカーで異種性機能ドメインと融合された請求項1~8に記載の単離され
たタンパク質を含む融合タンパク質であって、前記リンカーが、前記融合タンパク質の活
性を妨げない、融合タンパク質。
【請求項10】
前記異種性機能ドメインが、転写活性化ドメインである、請求項9に記載の融合タンパ
ク質。
【請求項11】
前記転写活性化ドメインが、VP16、VP64、rTA、NF-κB p65または
複合性VPR(VP64-p65-rTA)からのものである、請求項9に記載の融合タ
ンパク質。
【請求項12】
前記異種性機能ドメインが、転写サイレンサーまたは転写抑制ドメインである、請求項
9に記載の融合タンパク質。
【請求項13】
前記転写抑制ドメインが、クルッペル関連ボックス(KRAB)ドメイン、ERFリプ
レッサードメイン(ERD)またはmSin3A相互作用ドメイン(SID)である、請
求項12に記載の融合タンパク質。
【請求項14】
前記転写サイレンサーが、ヘテロクロマチンタンパク質1(HP1)である、請求項1
2に記載の融合タンパク質。
【請求項15】
前記異種性機能ドメインが、DNAのメチル化状態を改変する酵素である、請求項12
に記載の融合タンパク質。
【請求項16】
DNAのメチル化状態を改変する前記酵素が、DNAメチルトランスフェラーゼ(DN
MT)またはTETタンパク質である、請求項15に記載の融合タンパク質。
【請求項17】
前記TETタンパク質が、TET1である、請求項16に記載の融合タンパク質。
【請求項18】
前記異種性機能ドメインが、ヒストンサブユニットを改変する酵素である、請求項9に
記載の融合タンパク質。
【請求項19】
ヒストンサブユニットを改変する前記酵素が、ヒストンアセチルトランスフェラーゼ(
HAT)、ヒストンデアセチラーゼ(HDAC)、ヒストンメチルトランスフェラーゼ(
HMT)またはヒストンデメチラーゼである、請求項18に記載の融合タンパク質。
【請求項20】
前記異種性機能ドメインが、塩基エディターである、請求項9に記載の融合タンパク質
。
【請求項21】
前記塩基エディターが、(i)シチジンデアミナーゼドメイン、好ましくは、アポリポ
タンパク質B mRNA編集酵素、デアミナーゼの触媒ポリペプチド様(APOBEC)
ファミリー、任意選択で、APOBEC1、APOBEC2、APOBEC3A、APO
BEC3B、APOBEC3C、APOBEC3D/E、APOBEC3F、APOBE
C3G、APOBEC3HもしくはAPOBEC4;活性化誘導シチジンデアミナーゼ(
AID)、任意選択で、活性化誘導シチジンデアミナーゼ(AICDA);シトシンデア
ミナーゼ1(CDA1)もしくはCDA2;またはtRNAに作用するシトシンデアミナ
ーゼ(CDAT)からなる群から選択されるシチジンデアミナーゼドメイン、あるいは(
ii)アデノシンデアミナーゼ、好ましくは、アデノシンデアミナーゼ1(ADA1)、
ADA2;RNA1に作用するアデノシンデアミナーゼ(ADAR1)、ADAR2、A
DAR3;tRNA1に作用するアデノシンデアミナーゼ(ADAT1)、ADAT2、
ADAT3;および天然に存在するまたは遺伝子操作されたtRNA特異的アデノシンデ
アミナーゼ(TadA)からなる群から選択されるアデノシンデアミナーゼである、請求
項20に記載の融合タンパク質。
【請求項22】
前記異種性機能ドメインが、生物学的テザーである、請求項9に記載の融合タンパク質
。
【請求項23】
前記生物学的テザーが、MS2、Csy4またはラムダNタンパク質である、請求項2
2に記載の融合タンパク質。
【請求項24】
前記異種性機能ドメインが、FokIである、請求項9に記載の融合タンパク質。
【請求項25】
請求項1~24に記載のタンパク質をコードする単離された核酸。
【請求項26】
請求項25に記載の単離された核酸を含むベクター。
【請求項27】
請求項25に記載の単離された核酸が、以下の位置:D1135、S1136、G12
18、E1219、R1335および/もしくはT1337の1つ、2つ、3つ、4つ、
5つまたは6つすべてで変異を有する、単離された化膿性連鎖球菌(Streptococcus pyog
enes)Cas9(SpCas9)タンパク質を発現するための1つまたは複数の制御ドメ
インに作動可能に連結された、請求項24に記載のベクター。
【請求項28】
請求項25に記載の核酸を含み、および任意選択で、請求項1~24に記載のタンパク
質を発現する宿主細胞、好ましくは、哺乳動物宿主細胞。
【請求項29】
細胞のゲノムを変更する方法であって、請求項1~24に記載の単離されたタンパク質
もしくは融合タンパク質、および前記細胞の前記ゲノムの選択された部分に相補的な領域
を有するガイドRNAを、前記細胞で発現させること、または前記細胞をこれらと接触さ
せることを含む方法。
【請求項30】
前記単離されたタンパク質または融合タンパク質が、核局在化配列、細胞透過性ペプチ
ド配列および/もしくはアフィニティタグの1つまたは複数を含む、請求項29に記載の
方法。
【請求項31】
前記細胞が、幹細胞である、請求項30に記載の方法。
【請求項32】
前記細胞が、胚性幹細胞、間葉系幹細胞もしくは人工多能性幹細胞であるか、生きてい
る動物における細胞であるか、または胚における細胞である、請求項31に記載の方法。
【請求項33】
二本鎖DNA(dsDNA)分子を変更する方法であって、前記dsDNA分子を、請
求項1~24に記載の単離されたタンパク質もしくは融合タンパク質、および前記dsD
NA分子の選択された部分に相補的な領域を有するガイドRNAと接触させることを含む
方法。
【請求項34】
前記dsDNA分子が、インビトロにある、請求項33に記載の方法。
【請求項35】
前記融合タンパク質およびRNAが、リボヌクレオタンパク質複合体にある、請求項3
3に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
優先権の主張
本出願は、2017年8月23日に出願された米国仮特許出願第62/549,303
号、および2018年3月12日に出願された同第62/641,687号の利益を主張
する。前述の全内容は、参照によって本明細書に組み込まれる。
【0002】
連邦政府による支援を受けた研究または開発
本発明は、米国国立衛生研究所によって付与された、助成金番号GM105378、G
M107427、GM118158およびGM088040の政府支援により行われた。
政府は、本発明において一定の権利を有する。
【0003】
技術分野
本発明は、少なくとも一部は、変更および改善されたプロトスペーサー隣接モチーフ(
PAM)特異性を有する遺伝子操作されたクラスター化した規則的な配置の短い回文配列
リピート(CRISPR)/CRISPR関連タンパク質9(Cas9)、ならびにゲノ
ム工学、エピゲノム工学およびゲノム標的化におけるそれらの使用に関する。
【背景技術】
【0004】
CRISPR-Cas9ヌクレアーゼは、多種多様な生物体および細胞の種類において
、効率が良く、カスタマイズ可能なゲノム編集を可能にする(Sander & Joung, Nat Biot
echnol 32, 347-355 (2014);Hsuet al., Cell 157, 1262-1278 (2014); Doudna & Charp
entier, Science 346, 1258096 (2014);Barrangou & May, Expert Opin Biol Ther 15,
311-314 (2015))。Cas9による標的部位認識は、crRNAおよびtracrRNA
として公知の2つの短いRNAによって導かれ(Deltcheva et al., Nature 471, 602-60
7 (2011);Jinek et al., Science 337, 816-821 (2012))、これらは融合してキメラ単
一ガイドRNA(sgRNA)とすることができる(Jinek et al., Science 337, 816-8
21 (2012);Jinek et al., Elife 2, e00471 (2013); Mali et al., Science 339, 823-8
26 (2013);Cong et al., Science 339, 819-823 (2013))。sgRNA(crRNAに
由来する)の5’末端は、標的DNA部位と塩基対形成することができ、それによって、
Cas9/sgRNA複合体による部位特異的切断の直接リプログラミングを可能にする
(Jinek et al., Science 337, 816-821 (2012))。しかしながら、Cas9は、sgR
NAと塩基対形成するDNAの近位にある特異的プロトスペーサー隣接モチーフ(PAM
)も認識しなければならず(Mojica et al., Microbiology 155, 733-740 (2009);Shah
et al., RNA Biol 10, 891-899 (2013);Jinek et al., Science 337, 816-821 (2012);
Sapranauskas et al, Nucleic Acids Res 39, 9275-9282 (2011);Horvath et al., J Ba
cteriol 190, 1401-1412 (2008))、この要件は、配列特異的な認識を開始するために必
要であるが(Sternberg et al., Nature 507, 62-67 (2014))、これはまた、ゲノム編集
のためにこれらのヌクレアーゼの標的化範囲を制限し得る。幅広く使用される化膿性連鎖
球菌(Streptococcus pyogenes)Cas9(SpCas9)は、短いNGG PAMを認
識し(Jinek et al., Science 337, 816-821 (2012); Jiang et al., Nat Biotechnol 31
, 233-239 (2013))、これは、ランダムなDNA配列の8bpごとに1回生じる。一方、
これまでに特徴付けられた他のCas9オルソログは、より長いPAMを認識することが
できる(Horvath et al., J Bacteriol 190, 1401-1412 (2008);Fonfara et al., Nucle
ic Acids Res 42, 2577-2590 (2014);Esvelt et al., Nat Methods 10, 1116-1121 (201
3);Ran et al., Nature 520, 186-191 (2015);Zhang et al., Mol Cell 50, 488-503 (
2013))。例えば、ウイルス送達のためにより適切ないくつかのより小さなCas9オル
ソログの1つである黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9
)は(Horvath et al., J Bacteriol 190, 1401-1412 (2008);Ran et al., Nature 520,
186-191 (2015);Zhang et al., Mol Cell 50, 488-503 (2013))、ランダムなDNAの
32bpごとに1回生じると予想されるより長いNNGRRT PAMを認識する。Ca
s9オルソログの標的化範囲の広幅化は、小さな遺伝要素(例えば、転写因子結合部位(
Canver et al. Nature. 527(7577):192-7 (2015);Vierstra et al., Nat Methods. 12(1
0):927-30 (2015))の改変、またはPAM内に配列の相違を位置させることによるアレル
特異的変更を行うこと(Courtney, D.G. et al. Gene Ther. 23(1):108-12 (2015))を含
むさまざまな適用のために重要である。本発明者らは、以前に、NGAおよびNGCG
PAM配列により部位を認識することができるSpCas9のバリアントを遺伝子操作に
より作製したが(Kleinstiver et al, Nature 2015;国際公開第2016/141224
号パンフレット)、それにもかかわらず多くの代替のPAM配列は標的化できないままで
ある。
【発明の概要】
【0005】
本明細書に記載されるように、一般に使用される化膿性連鎖球菌(Streptococcus pyog
enes)Cas9(SpCas9)を、構造情報、細菌選択に基づく指向進化およびコンビ
ナトリアル設計を使用して、新規なPAM配列を認識するように遺伝子操作した。これら
の変更されたPAM特異性バリアントは、野生型SpCas9によって効率よく標的化す
ることができないヒト細胞中のレポーター部位および内在性遺伝子部位の安定した編集を
可能にする。本知見は、本明細書において「バリアント」または「本バリアント」と総称
される、幅広く有用なSpCas9バリアントを提供する。
【0006】
第1の態様において、本発明は、以下の位置:D1135、S1136、G1218、
E1219、R1335および/もしくはT1337の3つ、4つ、5つまたは6つすべ
てで、例えば、D1135、S1136、G1218、E1219、R1335および/
もしくはT1337(D1135X/S1136X/G1218X/E1219X/R1
335X/T1337X、ここで、Xは、任意のアミノ酸である)の2つ、3つ、4つ、
5つまたはすべてで、変異を有し、例えば、示された変異を有する配列番号1のアミノ酸
配列と少なくとも80%、90%または95%同一である配列を含む、単離された化膿性
連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)タンパク質を提供する。
いくつかの実施形態において、バリアントSpCas9タンパク質は、表A、1、2また
は3に示される変異のセット、例えば、以下の変異のセットの1つ:LRSVQL、LR
KIQK、LRSVQK、LWKIQK、VRKIQK、LWKIQK、IRAVQL、
VRKLRS、GRKIQK、SWRVVV、SWKVLK、TAHFKV、MSGVK
C、LRSVRS、SKTLRP、MWVHLN、TWSMRG、KRRCKV、VRA
VQL、VSSVRS、VRSVRS、SRMHCK、GWKLLR、GWKOQK、V
AKLLR、VAKIQK、VAKILR、GRKILR、VRKLLR、IRAVQL
、VRKIQK、またはVRMHCKバリアント(例えば、NGTN PAMについて)
;MQKSER、VRKSER、ICKSER、LRSVER、LWLETR、LSRW
ER、MQSVQL、VRREER、ICCCER、LSRWQR、LWRVVA、WM
QAYG、LWRSEY、SQSWRS、LKAWRS、LWGWQH、MCSFER、
LWMREQ、LWRVVA、HSSWVR、MWSEPT、GSNYQS、FMQWV
N、YCSWVG、MCAWCG、FMQWVR、またはSSKWPAバリアント(例え
ば、NGCN PAMについて);LRSVRS、SRQMRG、MRARKE、SRM
HCK、VRREQR、VRGEQR、LRLSAR、AWTEVTR、KWMMCG、
VRGAKE、AWNFQV、LWTTLN、SRMHCK、CWCQCV、AEEQQ
R、GWEKVR、NRAVNG、LRSYLH、VRGNNR、VQDAQR、GWR
QSK、AWLCLS、KWARVV、MWAARP、SRMHCK、VKMAKG、Q
RKTRE、LCRQQR、CWSHQR、SRTHTQ、LWEVIR、VSSVRS
、VRSVRS、IRAVRS、SRSVRS、LWKIQK、またはVRMHCKバリ
アント(例えば、NGAN PAMについて)を含む。いくつかの実施形態において、変
異は、VSREER(VRERとしても公知)またはVSREQR(VRQRとしても公
知)ではない。
【0007】
いくつかの実施形態において、バリアントSpCas9タンパク質は、D10、E76
2、D839、H983またはD986;およびH840またはN863での変異からな
る群から選択されるヌクレアーゼ活性を減少させる1つまたは複数の変異を含む。いくつ
かの実施形態において、変異は、(i)D10AまたはD10N、および(ii)H84
0A、H840NまたはH840Yである。
【0008】
いくつかの実施形態において、バリアントSpCas9タンパク質は、N497、K5
26、R661、R691、N692、M694、Q695、H698、K810、K8
48、Q926、K1003および/もしくはR0160での変異からなる群から選択さ
れる特異性を増加させる1つまたは複数の変異を含む。いくつかの実施形態において、変
異は、N692A、Q695A、Q926A、H698A、N497A、K526A、R
661A、R691A、M694A、K810A、K848A、K1003A、R016
0A、Y450A/Q695A、L169A/Q695A、Q695A/Q926A、Q
695A/D1135E、Q926A/D1135E、Y450A/D1135E、L1
69A/Y450A/Q695A、L169A/Q695A/Q926A、Y450A/
Q695A/Q926A、R661A/Q695A/Q926A、N497A/Q695
A/Q926A、Y450A/Q695A/D1135E、Y450A/Q926A/D
1135E、Q695A/Q926A/D1135E、L169A/Y450A/Q69
5A/Q926A、L169A/R661A/Q695A/Q926A、Y450A/R
661A/Q695A/Q926A、N497A/Q695A/Q926A/D1135
E、R661A/Q695A/Q926A/D1135E、およびY450A/Q695
A/Q926A/D1135E;N692A/M694A/Q695A/H698A、N
692A/M694A/Q695A/H698A/Q926A;N692A/M694A
/Q695A/Q926A;N692A/M694A/H698A/Q926A;N69
2A/Q695A/H698A/Q926A;M694A/Q695A/H698A/Q
926A;N692A/Q695A/H698A;N692A/M694A/Q695A
;N692A/H698A/Q926A;N692A/M694A/Q926A;N69
2A/M694A/H698A;M694A/Q695A/H698A;M694A/Q
695A/Q926A;Q695A/H698A/Q926A;G582A/V583A
/E584A/D585A/N588A/Q926A;G582A/V583A/E58
4A/D585A/N588A;T657A/G658A/W659A/R661A/Q
926A;T657A/G658A/W659A/R661A;F491A/M495A
/T496A/N497A/Q926A;F491A/M495A/T496A/N49
7A;K918A/V922A/R925A/Q926A;または918A/V922A
/R925A;K855A;K810A/K1003A/R1060A;またはK848
A/K1003A/R1060Aである。いくつかの実施形態において、タンパク質は、
K526またはR691での変異を含まない。
【0009】
本明細書において、任意の介在リンカーで異種性機能ドメインと融合された本明細書に
記載の単離されたバリアントSpCas9タンパク質を含む融合タンパク質であって、リ
ンカーが、融合タンパク質の活性を妨げない、融合タンパク質も提供する。いくつかの実
施形態において、異種性機能ドメインは、転写活性化ドメインである。いくつかの実施形
態において、転写活性化ドメインは、VP64またはNF-κB p65からのものであ
る。いくつかの実施形態において、異種性機能ドメインは、転写サイレンサーまたは転写
抑制ドメインである。いくつかの実施形態において、転写抑制ドメインは、クルッペル関
連ボックス(KRAB)ドメイン、ERFリプレッサードメイン(ERD)またはmSi
n3A相互作用ドメイン(SID)である。いくつかの実施形態において、転写サイレン
サーは、ヘテロクロマチンタンパク質1(HP1)、例えば、HP1αまたはHP1βで
ある。いくつかの実施形態において、異種性機能ドメインは、DNAのメチル化状態を改
変する酵素である。いくつかの実施形態において、DNAのメチル化状態を改変する酵素
は、DNAメチルトランスフェラーゼ(DNMT)またはTETタンパク質である。いく
つかの実施形態において、TETタンパク質は、TET1である。いくつかの実施形態に
おいて、異種性機能ドメインは、ヒストンサブユニットを改変する酵素である。いくつか
の実施形態において、ヒストンサブユニットを改変する酵素は、ヒストンアセチルトラン
スフェラーゼ(HAT)、ヒストンデアセチラーゼ(HDAC)、ヒストンメチルトラン
スフェラーゼ(HMT)またはヒストンデメチラーゼである。
【0010】
いくつかの実施形態において、異種性機能ドメインは、塩基エディター、例えば、シチ
ジンデアミナーゼドメイン、例えば、APOBEC1、APOBEC2、APOBEC3
A、APOBEC3B、APOBEC3C、APOBEC3D/E、APOBEC3F、
APOBEC3G、APOBEC3HもしくはAPOBEC4を含む、アポリポタンパク
質B mRNA編集酵素、デアミナーゼの触媒ポリペプチド様(APOBEC)ファミリ
ー;活性化誘導シチジンデアミナーゼ(AID)、例えば、活性化誘導シチジンデアミナ
ーゼ(AICDA);シトシンデアミナーゼ1(CDA1)もしくはCDA2;またはt
RNAに作用するシトシンデアミナーゼ(CDAT)からのものである。いくつかの実施
形態において、異種性機能ドメインは、アデノシンDNA塩基を改変するデアミナーゼで
あり、例えば、デアミナーゼは、アデノシンデアミナーゼ1(ADA1)、ADA2;R
NA1に作用するアデノシンデアミナーゼ(ADAR1)、ADAR2、ADAR3;t
RNA1に作用するアデノシンデアミナーゼ(ADAT1)、ADAT2、ADAT3;
および天然に存在するまたは遺伝子操作されたtRNA特異的アデノシンデアミナーゼ(
TadA)である。いくつかの実施形態において、異種性機能ドメインは、生物学的テザ
ーである。いくつかの実施形態において、生物学的テザーは、MS2、Csy4またはラ
ムダNタンパク質である。いくつかの実施形態において、異種性機能ドメインは、Fok
Iである。
【0011】
いくつかの実施形態において、異種性機能ドメインは、内因性DNA修復もしくは塩基
除去修復(BER)経路を阻害または増強する酵素、ドメインあるいはペプチド、例えば
、BERを開始するウラシルの除去を媒介するウラシルDNAグリコシラーゼ(UDG、
ウラシルN-グリコシラーゼまたはUNGとしても公知)を阻害するウラシルDNAグリ
コシラーゼ阻害剤;あるいはバクテリオファージMuからのGamなどのDNA末端結合
タンパク質である。
【0012】
本明細書において、本明細書に記載のバリアントSpCas9タンパク質をコードする
単離された核酸、および任意選択で、本明細書に記載のバリアントSpCas9タンパク
質を発現するための1つまたは複数の制御ドメインに作動可能に連結された、単離された
核酸を含むベクターも提供する。本明細書において、任意選択で、本明細書に記載のバリ
アントSpCas9タンパク質を発現する、本明細書に記載の核酸を含む宿主細胞、例え
ば、哺乳動物宿主細胞も提供する。本明細書において、本明細書に記載のバリアントSp
Cas9タンパク質、およびバリアントタンパク質によって標的化されるPAM配列を有
する配列を標的化するガイドRNAを含むリボヌクレオタンパク質(RNP)複合体も提
供する。
【0013】
本明細書において、本明細書に記載の単離されたバリアントSpCas9タンパク質、
および細胞のゲノムの選択された部分に相補的な領域を有するガイドRNAを、細胞で発
現させることによって、細胞のゲノムを変更する方法を提供する。
【0014】
本明細書において、バリアントタンパク質、および細胞のゲノムの選択された部分に相
補的な領域を有するガイドRNAを、細胞で発現させることによって、細胞のゲノムを変
更する、例えば、選択的に変更するための方法を提供する。
【0015】
細胞を、本明細書に記載のタンパク質バリアント、および細胞のゲノムの選択された部
分に相補的な領域を有するガイドRNAと接触させることによって、細胞のゲノムを変更
する、例えば、選択的に変更するための方法も提供する。
【0016】
いくつかの実施形態において、単離されたタンパク質または融合タンパク質は、核局在
化配列、細胞透過性ペプチド配列および/もしくはアフィニティタグの1つまたは複数を
含む。
【0017】
本明細書に記載の方法のいくつかの実施形態において、細胞は、幹細胞、例えば、胚性
幹細胞、間葉系幹細胞もしくは人工多能性幹細胞であるか、生きている動物における細胞
であるか、あるいは胚、例えば、哺乳動物、昆虫もしくは魚類(例えば、ゼブラフィッシ
ュ)の胚における細胞または胚細胞である。
【0018】
さらに、本明細書において、二本鎖DNA(dsDNA)分子を変更するための方法、
例えば、インビトロの方法を提供する。この方法は、dsDNA分子を、1つまたは複数
の本明細書に記載のバリアントタンパク質、およびdsDNA分子の選択された部分に相
補的な領域を有するガイドRNAと接触させることを含む。
【0019】
他に定義されない限り、本明細書で使用されるすべての技術用語および科学用語は、こ
の発明が属する技術分野の当業者によって一般に理解されるものと同じ意味を有する。方
法および材料は、本発明における使用のために本明細書に記載され、当技術分野において
公知の他の適切な方法および材料を使用することもできる。材料、方法および例は、説明
のみを目的とし、限定することを意図するものではない。本明細書において列挙される、
すべての刊行物、特許出願、特許、配列、データーベースのエントリーおよび他の参照は
、それらの全体が参照によって組み込まれる。矛盾がある場合には、定義を含む本明細書
が支配する。
【0020】
本発明の他の特徴および利点は、以下の詳細な説明および図面から、ならびに特許請求
の範囲から明らかになろう。
【0021】
本特許または本出願ファイルは、カラーで作成された少なくとも1つの図面を含む。カ
ラーの図面を伴う本特許または本出願公開の写しは、申請および必要な料金の支払により
、特許庁によって提供されるだろう。
【図面の簡単な説明】
【0022】
【
図1】
図1A~1Bは、SpCas9 PAMバリアントライブラリーの生成およびスクリーニングに関する。(a)PAM認識のために重要な6つの位置で多様なアミノ酸の組み合わせを有するSpCas9バリアントのライブラリーを生成するために、変性オリゴライブラリーをSpCas9コード配列の3つの領域にクローニングして、赤で強調された6つのコドンをランダム化した。(b)細菌選択アッセイの概略図、ここで、SpCas9バリアントおよびsgRNAは、1つのプラスミドから発現し、第2のプラスミドは、誘導毒性遺伝子およびカスタマイズ化標的部位をコードする。両方のプラスミドは、細菌に同時形質転換され、毒性プラスミドの標的部位でコードされるPAMを認識することができるSpCas9 PAMバリアントを保有する細胞のみが、毒性遺伝子の発現を誘導する培地上で生存することができる(選択培地は10mMのアラビノースを含有する)。
【
図2-1】
図2A~2Fは、NGTN PAMを有する部位を認識する細菌選択から得られたSpCas9 PAMバリアントに関する。(A~F)NGTG、NGTT、NGTCまたはNGTA PAM配列を運ぶ陽性選択プラスミドに対する初期スクリーニングからのSpCas9バリアントをコードするプラスミドを、細菌スクリーニングアッセイで再スクリーニングして、NGTN PAM配列を有する標的部位に対する活性を評価した。パネルC、EおよびFについて、バリアントはまた、NGAG、NGAT、NGACおよびNGAA PAMを有する標的部位に対してスクリーニングした。示されたPAMを有する部位におけるバリアントのおおよその活性を、非選択培地(クロラムフェニコールのみ)におけるコロニーの数を選択培地(クロラムフェニコール+10mMのアラビノース)のものと比較することによって計算し、生存%を計算した(表1)。数字にアスタリスクがあるバリアントは、以前のアッセイにおいて試験されたプラスミドを示し(この図の上側パネルに示される)、これらのバリアントのアミノ酸配列は表1に見ることができる。
【
図3】
図3A~3Cは、ヒト細胞におけるSpCas9 NGTN PAMバリアントの活性に関する。(A、B)NGTA、NGTC、NGTTおよびNGTG PAMを保有するEGFPにおける部位に対する、(選択によって得られたか、または合理的に設計された)さまざまなSpCas9バリアントの活性を評価するためのヒト細胞EGFP破壊アッセイ。エラーバーは、n=2~7についてのs.e.mを表す。(C)NGTG、NGTA、NGTCまたはNGTT PAMを保有する部位に対する、SpCas9-NGTN PAMバリアント、SpCas9-LRSVQLバリアントを行うトップの1つの内在性遺伝子破壊活性。T7E1アッセイによって定量された遺伝子破壊。
【
図4】
図4A~4Fは、NGCN PAMを有する部位を認識する細菌選択から得られたSpCas9 PAMバリアントに関する。(A~B)NGCG、NGCT、NGCCまたはNGCA PAM配列を運ぶ陽性選択プラスミドに対する初期スクリーニングからのSpCas9バリアントをコードするプラスミドを、細菌スクリーニングアッセイで再スクリーニングして、NGCN PAM配列を有する標的部位に対する活性を評価した。示されたPAMを有する部位におけるバリアントのおおよその活性を、非選択培地(クロラムフェニコールのみ)におけるコロニーの数を選択培地(クロラムフェニコール+10mMのアラビノース)のものと比較することによって計算し、生存%を計算した(表2)。数字にアスタリスクがあるバリアントは、以前のアッセイにおいて試験されたプラスミドを示し(この図の上側パネルに示される)、これらのバリアントのアミノ酸配列は表2に見ることができる。
【
図5-1】
図5A~5Eは、ヒト細胞におけるSpCas9 NGCN PAMバリアントの活性に関する。(A~E)NGCA、NGCC、NGCTおよびNGCG PAMを保有するEGFPにおける部位に対する、(選択によって得られたか、または合理的に設計された)さまざまなSpCas9バリアントの活性を評価するためのヒト細胞EGFP破壊アッセイ。(A)NGCA PAM部位、(B)NGCC PAM部位、(C)NGCT PAM部位、(D)NGCCおよびNGCT PAM部位、ならびに(E)さまざまなNGCN PAM部位を有する部位に対する活性。
【
図6】
図6A~6Bは、NGAN PAMを有する部位を認識する細菌選択から得られたSpCas9 PAMバリアントに関する。(A~B)NGAG、NGAT、NGACまたはNGAA PAM配列を運ぶ陽性選択プラスミドに対する初期スクリーニングからのSpCas9バリアントをコードするプラスミドを、細菌スクリーニングアッセイで再スクリーニングして、NGAN PAM配列を有する標的部位に対する活性を評価した。示されたPAMを有する部位におけるバリアントのおおよその活性を、非選択培地(クロラムフェニコールのみ)におけるコロニーの数を選択培地(クロラムフェニコール+10mMのアラビノース)のものと比較することによって計算し、生存%を計算した(表3)。これらのバリアントのアミノ酸配列は表3に見ることができる。
【
図7】
図7A~7Bは、ヒト細胞におけるSpCas9 NGAN PAMバリアントの活性に関する。(A~B)(A)NGAA、NGAC、NGATおよびNGAG PAM、または(B)さまざまなNGAC PAMを保有するEGFPにおける部位に対する、(選択によって得られたか、または合理的に設計された)さまざまなSpCas9バリアントの活性を評価するためのヒト細胞EGFP破壊アッセイ。
【
図8】ヒト細胞におけるSpCas9 PAMバリアントとxCas9のヌクレアーゼ活性の比較。内因性遺伝子破壊活性をT7E1アッセイによって評価した。
【
図9-1】
図9は、ヒト細胞の内因性部位おけるSpCas9 PAMバリアントとxCas9の塩基編集活性の比較に関する。(A)SpCas9 PAMバリアントのBE3バージョン(Komor et al., Nature. 2016 May 19;533(7603):420-4)を、CRISPRessoによって行った標的化ディープシークエンシングおよび解析によって評価される、CからTへの塩基編集活性について試験した(Pinello et al., Nat Biotechnol. 2016 Jul 12; 34(7): 695-697;Nat Biotechnol. 2016 Jul 12; 34(7): 695-697)。x軸に表示された編集されたシトシンヌクレオチドは、Cas9標的配列の最もPAMから遠位の位置として位置1から番号付けされる。(B)SpCas9 PAMバリアントのABE7.10バージョン(Gaudelli et al., Nature. 2017 Nov 23;551(7681):464-471)を、CRISPRessoによって行った標的化ディープシークエンシングおよび解析によって評価される、AからGへの塩基編集活性について試験した。x軸に表示された編集されたアデノシンヌクレオチドは、Cas9標的配列の最もPAMから遠位の位置として位置1から番号付けされる。
【発明を実施するための形態】
【0023】
表1:NGTN PAMを保有する部位に対する細菌のバリアントの選択結果および活性
表2:NGCN PAMを保有する部位に対する細菌のバリアントの選択結果および活性
表3:NGAN PAMを保有する部位に対する細菌のバリアントの選択結果および活性
【0024】
化膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)によるプロトス
ペーサー隣接モチーフ(PAM)の認識は、標的DNA認識の重要な第1ステップであり
、SpCas9が結合およびDNAを加水分解することを可能にする。CRISPR-C
as9ヌクレアーゼは、ゲノム編集のために幅広く使用されているが1~4、Cas9が
切断することができる配列の範囲は、標的部位における特異的PAMについての必要性に
よって制限される5、6。例えば、これまでに最も安定かつ幅広く使用されているCas
9であるSpCas9は、主に、NGG PAMを認識する。結果として、多くの場合、
さまざまなゲノム編集の応用のために必要な正確さで二本鎖の破壊(DSB)を標的化す
ることは困難であり得る。加えて、Cas9による不完全なPAM認識は、望まない標的
外変異の生成をもたらし得る7、8。意図的に変更および/または改善されたPAM特異
性を有するCas9誘導体は、これらの限界に対処するだろう。
【0025】
結晶構造から、野生型SpCas9が2つのアルギニンアミノ酸側鎖(R1333およ
びR1335)を利用して、塩基を、基準のNGG PAM配列のグアニンに特異的に接
触させることが明らかである。しかしながら、PAM認識を変更し、かつSpCas9の
標的範囲を改善するために、本発明者らおよび他者は、これらのアルギニンのいずれか1
つまたは両方の単純な変異は、PAM選好性を転換しないことを示した(Anders et al,
Nature 2014; Kleinstiver et al, Nature 2015;国際公開第2016/141224号
パンフレット)。本発明者らは、以前に、NGAおよびNGCG PAM配列を標的化す
ることができるSpCas9のバリアントを進化させるための選択アプローチに着手した
が(Kleinstiver et al, Nature 2015;国際公開第2016/141224号パンフレッ
ト)、しかしながら、多くの代替のPAM配列は、標的化できないままである。
【0026】
現在アクセスできないPAM配列の標的化を可能にすることによってSpCas9の有
用性をさらに拡大するために、本発明者らは、新規なPAM配列を認識する能力があるS
pCas9バリアントについて選択するための代替戦略を考えた。SpCas9コード配
列内のある特定の位置がPAM認識のために重要であることが以前に確立されており(Kl
einstiver et al., Nature 2015;国際公開第2016/141224号パンフレット)
、本発明者らは、PAM相互作用ドメインの3つの別々の領域内の6つのアミノ酸をラン
ダム化して、これらの位置:D1135/S1136、G1218/E1219およびR
1335/T1337で多様なコドン使用頻度を有するSpCas9バリアントのライブ
ラリーを生成させる集中飽和変異生成アプローチを実施した。そうするために、本発明者
らは、コードされたこれらの6つのアミノ酸を含有するSpCas9のコドンで、NNS
ヌクレオチドトリプレット(ここで、Nは任意のヌクレオチドであり、SはGまたはCで
ある)をコードするランダム化オリゴヌクレオチドカセットを連続してクローニングした
(
図1A)。次いで、得られるSpCas9バリアントのライブラリーを、以前に記載さ
れたようにして(Kleinstiver et al., Nature 2015)、本発明者らの細菌陽性選択アッ
セイを使用する選択に供して、さまざまなNGNN PAM配列を保有する標的部位を切
断することができるバリアントを特定した(
図1B)。簡潔には、発現したSpCas9
バリアントが陽性選択プラスミドにおいてコードされる標的部位(PAMおよびスペーサ
ー配列)を認識することができる場合にのみ、細菌は、選択条件(10mMのアラビノー
ス上に蒔かれ、これは、ccdB毒性遺伝子の転写を誘導する)で生存することができる
。強いPAM認識は、選択プラスミドの加水分解をもたらし、ccdB発現の誘導を防ぎ
、それによって、細菌の増殖を可能にする。このように、SpCas9ライブラリーのス
クリーニングの間に、10mMのアラビノースを含有する培地で増殖するコロニーは、目
的とする代替PAMを持つ部位を標的化することができるSpCas9 PAMバリアン
トをコードすると予想される(
図1B)。
【0027】
変更されたPAM特異性を有する遺伝子操作されたCas9バリアント
この研究において遺伝子操作されたSpCas9バリアントは、野生型SpCas9に
よってアクセス可能な標的部位の範囲を大いに増加させ、効率がよいHDRを実施するた
め、NHEJ媒介インデルを小さな遺伝要素に標的化するため、およびPAMについての
要件を利用して同じ細胞中の2つの異なるアレルの間を区別するために、CRISPR-
Cas9プラットフォームを使用する機会をさらに増強する。以前はアクセス可能ではな
かったNGTNおよびNGCH(ここで、Hは、A、CまたはTである)PAM含有部位
を現在標的化することができるバリアント、ならびにNGACに対する活性を改善するこ
とができるバリアントの選択および合理的設計は、正確かつ高分解能のゲノム編集のため
の見込みを改善する。変更されたPAM特異性SpCas9バリアントは、細菌およびヒ
ト細胞の両方においてSpCas9によって現在標的化できない内在性遺伝子部位を効率
よく破壊することができ、これらが、いろいろな異なる細胞の種類および生物体において
働くことを示唆する。
【0028】
本明細書に記載のすべてのSpCas9バリアントは、例えば、単純な部位指定変異生
成によって、既存の広く使用されているベクターに迅速に組み込むことができ、それらは
、PAM相互作用ドメイン内に含有される少数の変異のみを必要とするので、バリアント
はまた、SpCas9プラットフォームに以前に記載された他の改善とともに働くはずで
ある(例えば、トランケートsgRNA(Tsai et al., Nat Biotechnol 33, 187-197 (2
015);Fu et al., Nat Biotechnol 32, 279-284 (2014))、ニッカーゼ変異(Mali et al
., Nat Biotechnol 31, 833-838 (2013);Ran et al., Cell 154, 1380-1389 (2013))、
二量体FokI-dCas融合体(Guilinger et al., Nat Biotechnol 32, 577-582 (20
14);Tsai et al., Nat Biotechnol 32, 569-576 (2014));および高フィデリティーバ
リアント(Kleinstiver et al. Nature 2016))。
【0029】
変更されたPAM特異性を有するSpCas9バリアント
したがって、本明細書において、SpCas9バリアントを提供する。SpCas9野
生型配列は以下の通りである。
【0030】
【0031】
【0032】
本明細書に記載のSpCas9バリアントは、以下の位置:D1135、S1136、
G1218、E1219、R1335および/もしくはT1337、例えば、D1135
X/S1136X/G1218X/E1219X/R1335X/T1337X(ここで
、Xは、任意のアミノ酸である)の1つ、2つ、3つ、4つ、5つまたは6つすべてで(
またはこれらと類似の位置)、変異を含むことができる。いくつかの実施形態において、
SpCas9バリアントは、配列番号1のアミノ酸配列と、少なくとも80%、例えば、
少なくとも85%、90%または95%同一であり、例えば、配列番号1の残基の最大で
5%、10%、15%または20%まで、例えば、保存的変異で置き換えられた、相違を
有する。好ましい実施形態において、本バリアントは、所望の親の活性、例えば、ヌクレ
アーゼ活性(親が、ニッカーゼまたは死Cas9である場合を除く)ならびに/またはガ
イドRNAおよび標的DNAと相互作用する能力を保持する。
【0033】
2つの核酸配列の同一性パーセントを決定するために、配列は、最適な比較の目的のた
めに整列される(例えば、ギャップは、最適な整列のための第1および第2のアミノ酸も
しくは核酸配列の一方または両方に導入することができ、非相同配列は、比較の目的のた
めに無視することができる)。比較の目的のために整列された参照配列の長さは、参照配
列の長さの少なくとも80%であり、いくつかの実施形態において、少なくとも90%ま
たは100%である。次いで、対応するアミノ酸の位置またはヌクレオチドの位置でのヌ
クレオチドが比較される。第1の配列中の位置は、第2の配列中の対応する位置と同じヌ
クレオチドによって占められ、その結果、分子は、その位置で同一である(本明細書で使
用される場合、核酸の「同一性」は核酸の「相同性」と同等である)。2つの配列の間の
同一性パーセントは、2つの配列の最適な整列化のために導入することが必要な、ギャッ
プの数およびそれぞれのギャップの長さを考慮して、配列によって共有される同一の位置
の数の関数である。2つのポリペプチドまたは核酸配列の間の同一性パーセントは、当技
術分野における技能内であるさまざまな方法、例えば、Smith Waterman
Alignment(Smith, T. F. and M. S. Waterman (1981) J Mol Biol 147:195-7
);GeneMatcher Plus(商標)に組み込まれた「Best Fit」(
Smith and Waterman, Advances in Applied Mathematics, 482-489 (1981))、Schwarz a
nd Dayhof (1979) Atlas of Protein Sequence and Structure, Dayhof, M.O., Ed, pp 3
53-358;BLASTプログラム(基本的なローカルアライメント検索ツール;(Altschul
, S. F., W. Gish, et al. (1990) J Mol Biol 215: 403-10)、BLAST-2、BLA
ST-P、BLAST-N、BLAST-X、WU-BLAST-2、ALIGN、AL
IGN-2、CLUSTAL、またはMegalign(DNASTAR)ソフトウェア
などの公的に利用可能なコンピューターソフトウェアを使用して、決定される。加えて、
当業者は、比較される配列の長さに対する最大の整列を達成するために必要な任意のアル
ゴリズムを含む、整列を測定するための適切なパラメーターを決定することができる。一
般に、タンパク質または核酸のためには、比較の長さは、最大で、かつ全長を含む、任意
の長さ(例えば、5%、10%、20%、30%、40%、50%、60%、70%、8
0%、90%、95%または100%)であり得る。本組成物および方法の目的のために
、配列の全長の少なくとも80%が、BLASTアルゴリズムおよび初期設定パラメータ
ーを使用して整列される。
【0034】
本発明の目的のために、2つの配列の間の配列の比較および同一性パーセントの決定は
、ギャップペナルティ12、ギャップ拡張ペナルティ4およびフレームシフトギャップペ
ナルティ5でBlossum62スコアリング行列を使用して達成することができる。
【0035】
保存的置換は、典型的には、以下の群内での置換を含む:グリシン、アラニン;バリン
、イソロイシン、ロイシン;アスパラギン酸、グルタミン酸、アスパラギン、グルタミン
;セリン、トレオニン;リジン、アルギニン;およびフェニルアラニン、チロシン。
【0036】
いくつかの実施形態において、SpCas9バリアントは、表1、2または3に示され
る変異のセット、例えば、以下の変異のセットの1つ:D1135X/S1136X/G
1218X/E1219X/R1335X/T1337X:SpCas9-LWKIQK
、LWKIQK、IRAVQL、SWRVVV、SWKVLK、TAHFKV、MSGV
KC、LRSVRS、SKTLRP、MWVHLN、TWSMRG、KRRCKV、VR
AVQL、VSSVRS、VRSVRS、SRMHCK、GRKIQK、GWKLLR、
GWKOQK、VAKLLR、VAKIQK、VAKILR、GRKILR、VRKLL
R、LRSVQL、IRAVQL、VRKIQK、VRMHCK、LRKIQK、LRS
VQK、またはVRKIQKバリアント(例えば、NGTN PAMについて);WMQ
AYG、MQKSER、LWRSEY、SQSWRS、LKAWRS、LWGWQH、M
CSFER、LWMREQ、LWRVVA、HSSWVR、MWSEPT、GSNYQS
、FMQWVN、YCSWVG、MCAWCG、LWLETR、FMQWVR、SSKW
PA、LSRWQR、ICCCER、VRKSER、またはICKSERバリアント(例
えば、NGCN PAMについて);またはLRLSAR、AWTEVTR、KWMMC
G、VRGAKE、MRARKE、AWNFQV、LWTTLN、SRMHCK、CWC
QCV、AEEQQR、GWEKVR、NRAVNG、SRQMRG、LRSYLH、V
RGNNR、VQDAQR、GWRQSK、AWLCLS、KWARVV、MWAARP
、SRMHCK、VKMAKG、QRKTRE、LCRQQR、CWSHQR、SRTH
TQ、LWEVIR、VSSVRS、VRSVRS、LRSVRS、IRAVRS、SR
SVRS、LWKIQK、VRMHCK、またはSRMHCK(例えば、NGAN PA
Mについて)を含む。いくつかの実施形態において、SpCas9バリアントは、D11
35L/S1136R/G1218S/E1219V/R1335X/T1337X、例
えば、LRSVQLまたはLRSVRSを含む。いくつかの実施形態において、D113
5での残基は、L、G、I、V、MまたはSである。いくつかの実施形態において、S1
136での残基は、R、Q、W、SまたはCである。いくつかの実施形態において、G1
218での残基は、S、K、S、R、L、C、G、AまたはQである。いくつかの実施形
態において、E1219での残基は、V、I、S、E、W、C、AまたはRである。いく
つかの実施形態において、R1335での残基は、R、Q、E、V、TまたはKである。
いくつかの実施形態において、T1337での残基は、S、K、L、R、A、E、Tまた
はGである。いくつかの実施形態において、バリアントは、表Aにおける変異のセットの
1つを含む。
【0037】
【0038】
いくつかの実施形態において、SpCas9バリアントはまた、タンパク質のヌクレア
ーゼ部分を触媒的に不活性にするために、Cas9のヌクレアーゼ活性を低減もしくは破
壊する以下のアミノ酸の位置の1つ:D10、E762、D839、H983またはD9
86、およびH840またはN863、例えば、D10A/D10NおよびH840A/
H840N/H840Yで変異を含み、これらの位置での置換は、アラニン(これらは、
Nishimasu al., Cell 156, 935-949 (2014)にある)、または他の残基、例えば、グルタ
ミン、アスパラギン、チロシン、セリンもしくはアスパラギン酸塩、例えば、E762Q
、H983N、H983Y、D986N、N863D、N863SまたはN863Hであ
ろう(国際公開第2014/152432号パンフレットを参照されたい)。いくつかの
実施形態において、バリアントは、D10AもしくはH840Aでの変異(一本鎖ニッカ
ーゼを生成する)、またはD10AおよびH840Aでの変異(ヌクレアーゼ活性を無効
にし、この変異は死Cas9またはdCas9として公知である)を含む。
【0039】
いくつかの実施形態において、SpCas9バリアントはまた、タンパク質の特異性を
増加させる(すなわち、標的外の効果を低減する)1つまたは複数のアミノ酸の位置で変
異を含む。いくつかの実施形態において、SpCas9バリアントは、以下の残基:N4
97、K526、R661、R691、N692、M694、Q695、H698、K8
10、K848、Q926、K1003および/もしくはR0160で、1つ、2つ、3
つ、4つ、5つ、6つ、7つ、8つ、9つ、10、11、12または13すべての変異を
含む。いくつかの実施形態において、変異は、N692A、Q695A、Q926A、H
698A、N497A、K526A、R661A、R691A、M694A、K810A
、K848A、K1003A、R0160A、Y450A/Q695A、L169A/Q
695A、Q695A/Q926A、Q695A/D1135E、Q926A/D113
5E、Y450A/D1135E、L169A/Y450A/Q695A、L169A/
Q695A/Q926A、Y450A/Q695A/Q926A、R661A/Q695
A/Q926A、N497A/Q695A/Q926A、Y450A/Q695A/D1
135E、Y450A/Q926A/D1135E、Q695A/Q926A/D113
5E、L169A/Y450A/Q695A/Q926A、L169A/R661A/Q
695A/Q926A、Y450A/R661A/Q695A/Q926A、N497A
/Q695A/Q926A/D1135E、R661A/Q695A/Q926A/D1
135E、およびY450A/Q695A/Q926A/D1135E;N692A/M
694A/Q695A/H698A、N692A/M694A/Q695A/H698A
/Q926A;N692A/M694A/Q695A/Q926A;N692A/M69
4A/H698A/Q926A;N692A/Q695A/H698A/Q926A;M
694A/Q695A/H698A/Q926A;N692A/Q695A/H698A
;N692A/M694A/Q695A;N692A/H698A/Q926A;N69
2A/M694A/Q926A;N692A/M694A/H698A;M694A/Q
695A/H698A;M694A/Q695A/Q926A;Q695A/H698A
/Q926A;G582A/V583A/E584A/D585A/N588A/Q92
6A;G582A/V583A/E584A/D585A/N588A;T657A/G
658A/W659A/R661A/Q926A;T657A/G658A/W659A
/R661A;F491A/M495A/T496A/N497A/Q926A;F49
1A/M495A/T496A/N497A;K918A/V922A/R925A/Q
926A;または918A/V922A/R925A;K855A;K810A/K10
03A/R1060A;またはK848A/K1003A/R1060Aである。例えば
、米国特許第9512446号;Kleinstiver et al., Nature. 2016 Jan 28;529(7587):
490-5;Slaymaker et al., Science. 2016 Jan 1;351(6268):84-8;Chen et al., Nature
. 2017 Oct 19;550(7676):407-410;Tsai and Joung, Nature Reviews Genetics 17:300-
312 (2016);Vakulskas et al., Nature Medicine 24:1216-1224 (2018);Casini et al.
, Nat Biotechnol. 2018 Mar;36(3):265-27を参照されたい。いくつかの実施形態におい
て、本バリアントは、K526またはR691での変異を含まない。
【0040】
いくつかの実施形態において、SpCas9バリアントは、以下の位置:L169A、
Y450、N497、R661、Q695、Q926および/もしくはD1135Eの1
つ、2つ、3つ、4つ、5つ、6つまたは7つすべてで変異を含み、例えば、いくつかの
実施形態において、バリアントSpCas9タンパク質は、以下:N497、R661、
Q695およびQ926の1つ、2つ、3つまたは4つすべてで、例えば、以下の変異:
N497A、R661A、Q695AおよびQ926Aの1つ、2つ、3つまたは4つす
べてで、変異を含む。いくつかの実施形態において、バリアントSpCas9タンパク質
は、Q695および/またはQ926で、ならびに任意選択で、例えば、限定されないが
、Y450A/Q695A、L169A/Q695A、Q695A/Q926A、Q69
5A/D1135E、Q926A/D1135E、Y450A/D1135E、L169
A/Y450A/Q695A、L169A/Q695A/Q926A、Y450A/Q6
95A/Q926A、R661A/Q695A/Q926A、N497A/Q695A/
Q926A、Y450A/Q695A/D1135E、Y450A/Q926A/D11
35E、Q695A/Q926A/D1135E、L169A/Y450A/Q695A
/Q926A、L169A/R661A/Q695A/Q926A、Y450A/R66
1A/Q695A/Q926A、N497A/Q695A/Q926A/D1135E、
R661A/Q695A/Q926A/D1135E、およびY450A/Q695A/
Q926A/D1135Eを含む、L169、Y450、N497、R661およびD1
135Eの1つ、2つ、3つ、4つまたは5つすべてで変異を含む。例えば、Kleinstive
r et al., Nature 529:490-495 (2016);国際公開第2017/040348号パンフレ
ット;米国特許第9,512,446号を参照されたい。
【0041】
いくつかの実施形態において、SpCas9バリアントはまた、以下の位置:F491
、M495、T496、N497、G582、V583、E584、D585、N588
、T657、G658、W659、R661、N692、M694、Q695、H698
、K918、V922、および/またはR925の1つ、2つ、3つ、4つ、5つ、6つ
、7つまたはそれ以上で、および任意選択でQ926で変異を含み、好ましくは、以下の
位置:F491、M495、T496、N497、G582、V583、E584、D5
85、N588、T657、G658、W659、R661、N692、M694、Q6
95、H698、K918、V922および/もしくはR925の1つ、2つ、3つ、4
つ、5つ、6つ、7つまたはそれ以上で、および任意選択でQ926で変異を有する配列
番号1のアミノ酸配列と少なくとも80%同一である配列、ならびに任意選択で核局在化
配列、細胞透過性ペプチド配列および/もしくはアフィニティタグの1つまたは複数を含
む。
【0042】
いくつかの実施形態において、タンパク質は、以下:N692、M694、Q695、
およびH698;G582、V583、E584、D585、およびN588;T657
、G658、W659、およびR661;F491、M495、T496、およびN49
7;またはK918、V922、R925、およびQ926の1つ、2つ、3つまたは4
つすべてで変異を含む。
【0043】
いくつかの実施形態において、タンパク質は、以下の変異:N692A、M694A、
Q695A、およびH698A;G582A、V583A、E584A、D585A、お
よびN588A;T657A、G658A、W659A、およびR661A;F491A
、M495A、T496A、およびN497A;またはK918A、V922A、R92
5A、およびQ926Aの1つ、2つ、3つ、4つまたはすべてを含む。
【0044】
いくつかの実施形態において、タンパク質は、変異:N692A/M694A/Q69
5A/H698Aを含む。
【0045】
いくつかの実施形態において、タンパク質は、変異:N692A/M694A/Q69
5A/H698A/Q926A;N692A/M694A/Q695A/Q926A;N
692A/M694A/H698A/Q926A;N692A/Q695A/H698A
/Q926A;M694A/Q695A/H698A/Q926A;N692A/Q69
5A/H698A;N692A/M694A/Q695A;N692A/H698A/Q
926A;N692A/M694A/Q926A;N692A/M694A/H698A
;M694A/Q695A/H698A;M694A/Q695A/Q926A;Q69
5A/H698A/Q926A;G582A/V583A/E584A/D585A/N
588A/Q926A;G582A/V583A/E584A/D585A/N588A
;T657A/G658A/W659A/R661A/Q926A;T657A/G65
8A/W659A/R661A;F491A/M495A/T496A/N497A/Q
926A;F491A/M495A/T496A/N497A;K918A/V922A
/R925A/Q926A;または918A/V922A/R925Aを含む。例えば、
Chen et al., “Enhanced proofreading governs CRISPR-Cas9 targeting accuracy,” b
ioRxiv, doi.org/10.1101/160036 (August 12, 2017)を参照されたい。
【0046】
いくつかの実施形態において、バリアントタンパク質は、R780、K810、R83
2、K848、K855、K968、R976、H982、K1003、K1014、K
1047および/もしくはR1060、例えば、R780A、K810A、R832A、
K848A、K855A、K968A、R976A、H982A、K1003A、K10
14A、K1047Aおよび/もしくはR1060A、例えば、K855A;K810A
/K1003A/R1060A;(eSpCas9 1.0とも称される);またはK8
48A/K1003A/R1060A(eSpCas9 1.1とも称される)の1つま
たは複数で変異を含む(Slaymaker et al., Science. 2016 Jan l;351(6268):84-8を参照
されたい)。
【0047】
本明細書において、SpCas9バリアントをコードする単離された核酸、任意選択で
バリアントタンパク質を発現するための1つまたは複数の制御ドメインと作動可能に連結
された単離された核酸を含むベクター、ならびに、核酸を含み、および任意選択でバリア
ントタンパク質を発現する宿主細胞、例えば、哺乳動物宿主細胞も提供する。
【0048】
本明細書に記載のバリアントは、細胞のゲノムを変更するために使用することができ、
この方法は、一般に、細胞中のバリアントタンパク質を、細胞のゲノムの選択された部分
に相補的な領域を有するガイドRNAと一緒に発現させることを含む。細胞のゲノムを選
択的に変更するための方法は、当技術分野において、公知であり、例えば、米国特許第8
,697,359号;米国特許出願公開第2010/0076057号;米国特許出願公
開第2011/0189776号;米国特許出願公開第2011/0223638号;米
国特許出願公開第2013/0130248号;国際公開第2008/108989号パ
ンフレット;国際公開第2010/054108号パンフレット;国際公開第2012/
164565号パンフレット;国際公開第2013/098244号パンフレット;国際
公開第2013/176772号パンフレット;米国特許出願公開第2015/0050
699号;米国特許出願公開第2015/0045546号;米国特許出願公開第201
5/0031134号;米国特許出願公開第2015/0024500号;米国特許出願
公開第2014/0377868号;米国特許出願公開第2014/0357530号;
米国特許出願公開第2014/0349400号;米国特許出願公開第2014/033
5620号;米国特許出願公開第2014/0335063号;米国特許出願公開第20
14/0315985号;米国特許出願公開第2014/0310830号;米国特許出
願公開第2014/0310828号;米国特許出願公開第2014/0309487号
;米国特許出願公開第2014/0304853号;米国特許出願公開第2014/02
98547号;米国特許出願公開第2014/0295556号;米国特許出願公開第2
014/0294773号;米国特許出願公開第2014/0287938号;米国特許
出願公開第2014/0273234号;米国特許出願公開第2014/0273232
号;米国特許出願公開第2014/0273231号;米国特許出願公開第2014/0
273230号;米国特許出願公開第2014/0271987号;米国特許出願公開第
2014/0256046号;米国特許出願公開第2014/0248702号;米国特
許出願公開第2014/0242702号;米国特許出願公開第2014/024270
0号;米国特許出願公開第2014/0242699号;米国特許出願公開第2014/
0242664号;米国特許出願公開第2014/0234972号;米国特許出願公開
第2014/0227787号;米国特許出願公開第2014/0212869号;米国
特許出願公開第2014/0201857号;米国特許出願公開第2014/01997
67号;米国特許出願公開第2014/0189896号;米国特許出願公開第2014
/0186958号;米国特許出願公開第2014/0186919号;米国特許出願公
開第2014/0186843号;米国特許出願公開第2014/0179770号;米
国特許出願公開第2014/0179006号;米国特許出願公開第2014/0170
753号;Makarova et al., "Evolution and classification of the CRISPR-Cas syste
ms" 9(6) Nature Reviews Microbiology 467-477 (1-23) (Jun. 2011);Wiedenheft et a
l., "RNA-guided genetic silencing systems in bacteria and archaea" 482 Nature 33
1-338 (Feb. 16, 2012);Gasiunas et al., "Cas9-crRNA ribonucleoprotein complex me
diates specific DNA cleavage for adaptive immunity in bacteria" 109(39) Proceedi
ngs of the National Academy of Sciences USA E2579-E2586 (Sep. 4, 2012);Jinek et
al., "A Programmable Dual-RNA-Guided DNA Endonuclease in Adaptive Bacterial Imm
unity" 337 Science 816-821 (Aug. 17, 2012);Carroll, "A CRISPR Approach to Gene
Targeting" 20(9) Molecular Therapy 1658-1660 (Sep. 2012);2012年5月25日に
出願された米国出願第61/652,086号;Al-Attar et al., Clustered Regularly
Interspaced Short Palindromic Repeats (CRISPRs): The Hallmark of an Ingenious A
ntiviral Defense Mechanism in Prokaryotes, Biol Chem. (2011) vol. 392, Issue 4,
pp. 277-289;Hale et al., Essential Features and Rational Design of CRISPR RNAs
That Function With the Cas RAMP Module Complex to Cleave RNAs, Molecular Cell, (
2012) vol. 45, Issue 3, 292-302を参照されたい。
【0049】
本明細書に記載のバリアントタンパク質は、前述の参照文献に記載のSpCas9タン
パク質の代わりに、表1、2または3によるPAM配列を有する配列を標的化するガイド
RNAとともに使用することができる。
【0050】
加えて、本明細書に記載のバリアントは、当技術分野において公知の野生型Cas9ま
たは他のCas9変異(上記に記載のdCas9またはCas9ニッカーゼなど)の代わ
りに、融合タンパク質、例えば、国際公開第2014/124284号パンフレットに記
載の異種性機能ドメインを有する融合タンパク質において使用することができる。例えば
、好ましくは、1つもしくは複数のヌクレアーゼ低減変異または致死変異を含むバリアン
トは、Cas9のNまたはC末端において、転写活性化ドメインもしくは他の異種性機能
ドメイン(例えば、転写リプレッサー(例えば、KRAB、ERD、SIDなど、例えば
、ets2リプレッサー因子(ERF)のリプレッサードメイン(ERD)の473~5
30番目のアミノ酸、KOX1のKRABドメインの1~97番目のアミノ酸、もしくは
Mad mSIN3相互作用ドメイン(SID)の1~36番目のアミノ酸;Beerli et
al., PNAS USA 95:14628-14633 (1998)を参照されたい)、またはヘテロクロマチンタン
パク質1(HP1、swi6としても公知)などのサイレンサー、例えば、HP1αもし
くはHP1β;MS2コートタンパク質、エンドリボヌクレアーゼCsy4もしくはラム
ダNタンパク質に結合したものなどの固定RNA結合配列に融合された長い非コードRN
A(lncRNA)をリクルートすることができるタンパク質またはペプチド;DNAの
メチル化状態を改変する酵素(例えば、DNAメチルトランスフェラーゼ(DNMT)ま
たはTETタンパク質);ヒストンサブユニットを改変する酵素(例えば、ヒストンアセ
チルトランスフェラーゼ(HAT)、ヒストンデアセチラーゼ(HDAC)、ヒストンメ
チルトランスフェラーゼ(例えば、リジンまたはアルギニン残基のメチル化のため)もし
くはヒストンデメチラーゼ(例えば、リジンまたはアルギニン残基の脱メチル化のため)
)に融合させることができる。
【0051】
いくつかの実施形態において、異種性機能ドメインは、塩基エディター、例えば、シト
シンDNA塩基を改変するデアミナーゼ、例えば、APOBEC1、APOBEC2、A
POBEC3A、APOBEC3B、APOBEC3C、APOBEC3D/E、APO
BEC3F、APOBEC3G、APOBEC3HおよびAPOBEC4を含む、アポリ
ポタンパク質B mRNA編集酵素、デアミナーゼの触媒ポリペプチド様(APOBEC
)ファミリー(例えば、Yang et al., J Genet Genomics. 2017 Sep 20;44(9):423-437を
参照されたい);活性化誘導シチジンデアミナーゼ(AID)、例えば、活性化誘導シチ
ジンデアミナーゼ(AICDA);シトシンデアミナーゼ1(CDA1)およびCDA2
;ならびにtRNAに作用するシトシンデアミナーゼ(CDAT)からのシチジンデアミ
ナーゼである。以下の表に例示的な配列を提示し、他の配列を使用することもできる。
【0052】
【0053】
いくつかの実施形態において、異種性機能ドメインは、アデノシンDNA塩基を改変す
るデアミナーゼであり、例えば、デアミナーゼは、アデノシンデアミナーゼ1(ADA1
)、ADA2;RNA1に作用するアデノシンデアミナーゼ(ADAR1)、ADAR2
、ADAR3(例えば、Savva et al., Genome Biol. 2012 Dec 28;13(12):252を参照さ
れたい);tRNA1に作用するアデノシンデアミナーゼ(ADAT1)、ADAT2、
ADAT3(Keegan et al., RNA. 2017 Sep;23(9):1317-1328およびSchaub and Keller,
Biochimie. 2002 Aug;84(8):791-803を参照されたい);および天然に存在するまたは遺
伝子操作されたtRNA特異的アデノシンデアミナーゼ(TadA)(例えば、Gaudelli
et al., Nature. 2017 Nov 23;551(7681):464-471(NP_417054.2(大腸菌(
Escherichia coli)株K-12亜株MG1655)を参照されたい;例えば、Wolf et al.
, EMBO J. 2002 Jul 15;21(14):3841-51を参照されたい)である。以下の表に例示的な配
列を提示し、他の配列を使用することもできる。
【0054】
【0055】
いくつかの実施形態において、異種性機能ドメインは、内因性DNA修復もしくは塩基
除去修復(BER)経路を阻害または増強する、酵素、ドメインあるいはペプチド、例え
ば、チミンDNAグリコシラーゼ(TDG;GenBank受託番号NM_003211
.4(核酸)およびNP_003202.3(タンパク質))、またはウラシルDNAグ
リコシラーゼ(UDG、ウラシルN-グリコシラーゼまたはUNGとしても公知;Gen
Bank受託番号NM_003362.3(核酸)およびNP_003353.1(タン
パク質))、またはBERを開始するウラシルの除去を媒介するUNGを阻害するウラシ
ルDNAグリコシラーゼ阻害剤(UGI)(例えば、Mol et al., Cell 82, 701-708 (19
95);Komor et al., Nature. 2016 May 19;533(7603)を参照されたい);あるいはDNA
修復酵素を阻害およびより正確な編集をもたらす(意図的ではない塩基編集がより少ない
)、遊離DNA末端に結合するバクテリオファージMuからのタンパク質であるGamな
どのDNA末端結合タンパク質である。例えば、Komor et al., Sci Adv. 2017 Aug 30;3
(8):eaao4774を参照されたい。
【0056】
例えば、使用することもできる当技術分野において公知の、Komor et al., Nature. 20
16 May 19;533(7603):420-4;Nishida et al., Science. 2016 Sep 16;353(6305). pii:
aaf8729;Rees et al., Nat Commun. 2017 Jun 6;8:15790;またはKim et al., Nat Biot
echnol. 2017 Apr;35(4):371-376)を参照されたい。
【0057】
多くのドメインについての配列は、DNA中のメチル化シトシンのヒドロキシル化を触
媒する。例示的なタンパク質としては、10-11転位(TET)1~3ファミリー、D
NA中で5-メチルシトシン(5-mC)を5-ヒドロキシメチルシトシン(5-hmC
)に変換する酵素が挙げられる。
【0058】
ヒトTET1~3についての配列は、当技術分野において公知であり、以下の表に示す
。
【0059】
【0060】
いくつかの実施形態において、触媒ドメインの全長配列のすべてまたは一部は、例えば
、7つの高度に保存されたエクソンによってコードされる、システインリッチ拡張および
2OGFeDOドメインを含む触媒モジュール、例えば、1580~2052番目のアミ
ノ酸を含むTet1触媒ドメイン、1290~1905番目のアミノ酸を含むTet2、
および966~1678番目のアミノ酸を含むTet3を含むことができる。3つすべて
のTetタンパク質中の重要な触媒残基および全長配列についてのこれらの補助物質を示
す配列について(例えば、配列2cを参照されたい)、Iyer et al., Cell Cycle. 2009
Jun 1;8(11):1698-710. Epub 2009 Jun 27の
図1を参照されたい;いくつかの実施形態に
おいて、配列は、Tet1の1418~2136番目のアミノ酸またはTet2/3の対
応する領域を含む。
【0061】
他の触媒モジュールは、Iyer et al., 2009において特定されたタンパク質からのもの
であり得る。
【0062】
いくつかの実施形態において、異種性機能ドメインは、生物学的テザーであり、MS2
コートタンパク質、エンドリボヌクレアーゼCsy4またはラムダNタンパク質のすべて
または一部(例えば、これらからのDNA結合ドメイン)を含む。これらのタンパク質は
、dCas9 gRNA標的化配列によって特異化された場所に特異的ステムループ構造
を含有するRNA分子をリクルートするために使用することができる。例えば、MS2コ
ートタンパク質、エンドリボヌクレアーゼCsy4またはラムダNに融合されたdCas
9バリアントは、XISTまたはHOTAIRなどの長い非コードRNA(lncRNA
)をリクルートするために使用することができ、例えば、Cys4、MS2またはラムダ
N結合配列に連結された、Keryer-Bibens et al., Biol. Cell 100:125-138 (2008)を参
照されたい。あるいは、Csy4、MS2またはラムダNタンパク質結合配列は、例えば
、Keryer-Bibens et al.(上記)に記載の別のタンパク質と連結され得、このタンパク質
は、本明細書に記載の方法および組成物を使用して、dCas9バリアント結合部位に標
的化することができる。いくつかの実施形態において、Csy4は、触媒的に不活性であ
る。いくつかの実施形態において、Cas9バリアント、好ましくは、dCas9バリア
ントは、国際公開第2014/204578号パンフレットに記載のFokIと融合され
る。
【0063】
いくつかの実施形態において、融合タンパク質は、dCas9バリアントおよび異種性
機能ドメインの間にリンカーを含む。これらの融合タンパク質(または連結された構造中
の融合タンパク質の間)で使用することができるリンカーは、融合タンパク質の機能を妨
げない任意の配列を含むことができる。好ましい実施形態において、リンカーは、短く、
例えば、2~20アミノ酸であり、典型的には、フレキシブルである(すなわち、グリシ
ン、アラニンおよびセリンなどの高自由度のアミノ酸を含む)。いくつかの実施形態にお
いて、リンカーは、GGGS(配列番号2)もしくはGGGGS(配列番号3)からなる
1つまたは複数のユニット、例えば、GGGS(配列番号2)もしくはGGGGS(配列
番号3)ユニットの2つ、3つ、4つまたはそれ以上のリピートを含む。他のリンカー配
列を使用することもできる。
【0064】
送達および発現系
本明細書に記載のCas9バリアントを使用するために、これらをコードする核酸から
これらを発現することが望ましくあり得る。これは、いろいろな方法で行うことができる
。例えば、Cas9バリアントをコードする核酸は、複製および/もしくは発現のために
、原核細胞または真核細胞に形質転換するための中間ベクターにクローニングすることが
できる。中間ベクターは、典型的には、Cas9バリアントの産生のためにCas9バリ
アントをコードする核酸の貯蔵または操作のための、原核ベクター、例えば、プラスミド
、またはシャトルベクターもしくは昆虫ベクターである。Cas9バリアントをコードす
る核酸は、植物細胞、動物細胞、好ましくは、哺乳動物細胞もしくはヒト細胞、真菌細胞
、細菌細胞または原生動物細胞への投与のために、発現ベクターにクローニングすること
もできる。
【0065】
発現を得るために、Cas9バリアントをコードする配列は、典型的には、直接転写の
ためのプロモーターを含有する発現ベクターにサブクローニングされる。適切な細菌およ
び真核プロモーターは、当技術分野において周知であり、例えば、Sambrook et al., Mol
ecular Cloning, A Laboratory Manual (3d ed. 2001);Kriegler, Gene Transfer and E
xpression: A Laboratory Manual (1990);およびCurrent Protocols in Molecular Biol
ogy (Ausubel et al., eds., 2010)に記載されている。遺伝子操作されたタンパク質を発
現させるための細菌発現系は、例えば、大腸菌(E. coli)、バチルス種(Bacillus sp.
)およびサルモネラ(Salmonella)で利用可能である(Palva et al., 1983, Gene 22:22
9-235)。このような発現系のためのキットが市販されている。哺乳動物細胞、酵母およ
び昆虫細胞のための真核発現系は、当技術分野において周知であり、これも市販されてい
る。
【0066】
核酸の直接発現のために使用されるプロモーターは、特定の適用に依存する。例えば、
強い構成的プロモーターは、典型的には、融合タンパク質の発現および精製のために使用
される。対照的に、Cas9バリアントが遺伝子制御のためにインビボで投与されるべき
である場合、構成的プロモーターまたは誘導プロモーターのいずれかを、Cas9バリア
ントの特定の使用に応じて、使用することができる。加えて、Cas9バリアントの投与
のための好ましいプロモーターは、HSV TKなどの弱いプロモーター、または同様の
活性を有するプロモーターであり得る。プロモーターは、トランス活性化に応答するエレ
メント、例えば、低酸素応答エレメント、Gal4応答エレメント、lacリプレッサー
応答エレメント、ならびにテトラサイクリン調節系およびRU-486系などの低分子調
節系(例えば、Gossen & Bujard, 1992, Proc. Natl. Acad. Sci. USA, 89:5547;Oligin
o et al., 1998, Gene Ther., 5:491-496;Wang et al., 1997, Gene Ther., 4:432-441
;Neering et al., 1996, Blood, 88:1147-55;およびRendahl et al., 1998, Nat. Biot
echnol., 16:757-761を参照されたい)を含むこともできる。
【0067】
プロモーターに加えて、発現ベクターは、典型的には、原核または真核のいずれかの宿
主細胞での核酸の発現のために必要なすべての追加エレメントを含有する転写ユニットま
たは発現カセットを含有する。したがって、典型的な発現カセットは、例えば、Cas9
バリアントをコードする核酸配列に作動可能に連結されたプロモーター、および例えば、
転写物、転写終結、リボソーム結合部位または翻訳終結の効率がよいポリアデニル化のた
めに必要な任意のシグナルを含有する。カセットの追加エレメントは、例えば、エンハン
サー、および異種スプライシングイントロンシグナルを含んでいてもよい。
【0068】
細胞に遺伝情報を運ぶために使用される特定の発現ベクターは、Cas9バリアントの
意図される使用、例えば、植物、動物、細菌、真菌、原性動物などにおける発現に関して
選択される。標準的な細菌発現ベクターとしては、pBR322系プラスミド、pSKF
、pET23Dなどのプラスミド、ならびにGSTおよびLacZなどの市販のタグ融合
発現系が挙げられる。
【0069】
真核ウイルスからの制御エレメントを含有する発現ベクターは、多くの場合、真核発現
ベクター、例えば、SV40ベクター、パピローマウイルスベクターおよびエプスタイン
バーウイルスに由来するベクターにおいて使用される。他の例示的な真核ベクターとして
は、pMSG、pAV009/A+、pMTO10/A+、pMAMneo-5、バキュ
ロウイルスpDSVEが挙げられ、任意の他のベクターは、SV40早期プロモーター、
SV40後期プロモーター、メタロチオネインプロモーター、マウス乳腺腫瘍ウイルスプ
ロモーター、ラウス肉腫ウイルスプロモーター、ポリヘドリンプロモーター、または真核
細胞における発現のために効果的であることが示されているその他のプロモーターの指示
の下でタンパク質の発現を可能にする。
【0070】
Cas9バリアントを発現するためのベクターとしては、ガイドRNAの発現を推進す
る、RNA Pol IIIプロモーター、例えば、H1、U6または7SKプロモータ
ーを挙げることができる。これらのヒトプロモーターは、プラスミドのトランスフェクシ
ョン後、哺乳動物細胞中においてCas9バリアントの発現を可能にする。
【0071】
いくつかの発現系は、チミジンキナーゼ、ハイグロマイシンBホスホトランスフェラー
ゼおよびジヒドロ葉酸レダクターゼなどの安定的にトランスフェクトされた細胞株の選択
のためのマーカーを有する。例えば、昆虫細胞においてバキュロウイルスベクターをポリ
ヒドリンプロモーターまたは他の強いバキュロウイルスプロモーターの指示の下、配列を
コードするgRNAとともに使用する、高収率の発現系も適切である。
【0072】
典型的に発現ベクターに含まれるエレメントは、大腸菌(E. coli)において機能する
レプリコン、組み換えプラスミドを保有する細菌の選択を可能にする抗生物質耐性をコー
ドする遺伝子、および組み換え配列の挿入を可能にするプラスミドの非必須領域のユニー
クな制限部位も含む。
【0073】
標準的なトランスフェクション方法を使用して、大量のタンパク質を発現する、細菌、
哺乳動物、酵母または昆虫の細胞株を生成し、次いで、これは、標準的な技術を使用して
精製される(例えば、Colley et al., 1989, J. Biol. Chem., 264:17619-22; Guide to
Protein Purification, in Methods in Enzymology, vol. 182 (Deutscher, ed., 1990)
を参照されたい)。真核細胞および真核細胞の形質転換は、標準的な技術に従って行われ
る(例えば、Morrison, 1977, J. Bacteriol. 132:349-351;Clark-Curtiss & Curtiss,
Methods in Enzymology 101:347-362 (Wu et al., eds, 1983)を参照されたい)。
【0074】
外来ヌクレオチド配列を宿主細胞に導入するための任意の公知の手順を使用してもよい
。これらは、リン酸カルシウムトランスフェクション、ポリブレン、プロトプラスト融合
、エレクトロポレーション、ヌクレオフェクション、リポソーム、マイクロインジェクシ
ョン、ネイキッドDNA、プラスミドベクター、ウイルスベクター、エピソームおよびイ
ンテグレーションの両方、ならびにクローニングされたゲノムDNA、cDNA、合成D
NA、または他の外来遺伝物質を宿主細胞に導入するための任意の他の周知の方法を含む
(例えば、Sambrook et al.(上記)を参照されたい)。使用される特定の遺伝子操作手
順は、Cas9バリアントを発現する能力がある宿主細胞に少なくとも1つの遺伝子を成
功裏に導入する能力があることのみが必要である。
【0075】
あるいは、本方法は、Cas9バリアントタンパク質およびガイドRNAを一緒に、例
えば、複合体として、送達することを含み得る。例えば、Cas9バリアントおよびgR
NAは、宿主細胞中で過剰発現および精製され、次いで、ガイドRNA(例えば、試験管
中)と複合体化して、リボヌクレオタンパク質(RNP)を形成し、細胞に送達すること
ができる。いくつかの実施形態において、バリアントCas9は、細菌Cas9発現プラ
スミドの使用によって、細菌から発現および精製することができる。例えば、Hisタグ
化バリアントCas9タンパク質は、細菌細胞中で発現し、次いで、ニッケルアフィニテ
ィークロマトグラフィーを使用して精製することができる。RNPの使用は、ヌクレアー
ゼもしくはガイドをコードするか、またはmRNAとしてヌクレアーゼをコードするプラ
スミドDNAを送達する必要性を回避する。RNP送達はまた、おそらく、RNPの半減
期がより短く、ヌクレアーゼおよびガイドの持続的発現がないので(プラスミドから取得
する場合)、特異性を改善し得る。RNPは、例えば、脂質媒介トランスフェクションま
たはエレクトロポレーションを使用して、インビボまたはインビトロで細胞に送達するこ
とができる。例えば、Liang et al. "Rapid and highly efficient mammalian cell engi
neering via Cas9 protein transfection." Journal of biotechnology 208 (2015): 44-
53;Zuris, John A., et al. "Cationic lipid-mediated delivery of proteins enables
efficient protein-based genome editing in vitro and in vivo." Nature biotechnol
ogy 33.1 (2015): 73-80;Kim et al. "Highly efficient RNA-guided genome editing i
n human cells via delivery of purified Cas9 ribonucleoproteins." Genome research
24.6 (2014): 1012-1019を参照されたい。
【0076】
本発明は、ベクター、およびベクターを含む細胞を含む。
【実施例0077】
本発明を以下の実施例においてさらに記載し、これは、特許請求の範囲に記載の本発明
の範囲を限定するものではない。
【0078】
方法
以下の材料および方法を実施例1において使用した。
【0079】
プラスミドおよびオリゴヌクレオチド
T7E1アッセイのための内因性ヒト遺伝子標的部位を増幅するために使用されるオリ
ゴヌクレオチドの配列は表4に見られる。
【0080】
【0081】
細菌Cas9/sgRNA発現プラスミドを、Cas9およびsgRNAを別々に発現
させるための2つのT7プロモーターを用いて、以前に記載されるようにして(Kleinsti
ver et al., Nature 2015)、構築した。D1135、S1136、G1218、E12
19、R1335およびT1337の位置で可変アミノ酸を含有する細菌発現プラスミド
を、これらの位置でランダム化コドンをコードするオリゴヌクレオチドを、親SpCas
9細菌発現ベクターにクローニングすることによって生成した(
図1)。
【0082】
ヒト細胞での発現のために、SpCas9における点変異を、pCMV-T7-hSp
Cas9-NLS-3xFLAGベクター(JDS246;配列は、ここで、addge
ne.org/43861/sequences/に見られる)への等温アセンブリーに
よって生成した。
【0083】
sgRNAのU6発現のためのプラスミド(所望のスペーサーオリゴをクローニングす
ることができる)を、BsmBI消化BPK1520に適切にアニーリングされたオリゴ
をクローニングすることによって生成した。
【0084】
SpCas9バリアントを進化させるための細菌系陽性選択アッセイ
陽性選択プラスミド(埋め込まれた標的部位を有する)を含有する形質転換受容性のあ
る大腸菌(E.coli)BW25141(λDE3)23をCas9/sgRNAをコードす
るプラスミドで形質転換した。SOB培地中での回収の60分後、形質転換体を、クロラ
ムフェニコール(非選択的)またはクロラムフェニコール+10mMアラビノース(選択
的)のいずれかを含有するLBプレートに蒔いた。
【0085】
新規PAMを切断することができるSpCas9バリアントについて選択するために、
ランダム化D1135X/S1136X/G1218X/E1219X/R1335X/
T1337X SpCas9ライブラリーをコードするプラスミドを、目的とするPAM
を有する標的部位をコードする陽性選択プラスミドを既に保有している大腸菌(E.coli)
BW25141(λDE3)細胞にエレクトロポレーションした。生存コロニーを、終夜
増殖させ、ミニプレップして、SpCas9-XXXXXX発現プラスミドを抽出し、個
々に、以前に記載のPAM配列を有する陽性選択を含有する大腸菌(E.coli)BW251
41(λDE3)細胞に再形質転換して、生存表現型とそのプラスミドの連結を再試験し
、それによって、偽陽性クローンを排除した。一般に、約300クローンを、追跡実験で
再スクリーニングした。二次スクリーニングにおける真正の生存コロニーのSpCas9
発現プラスミドを、シークエンシングして、特異性の変更をもたらすD1135、S11
36、G1218、E1219、R1335および/またはT1337の位置でのアミノ
酸を特定した(表1~3を参照されたい)。シークエンシングされたクローンにおいて観
察された変異を、生存クローンにおけるそれらの頻度、および(いくつかの場合では)ヒ
ト細胞系EGFP破壊アッセイにおける活性に基づいて、さらなる評価のために選択した
。
【0086】
ヒト細胞培養およびトランスフェクション
EGFP-PESTレポーター遺伝子の単一の統合されたコピーを保有するU2OS細
胞およびU2OS.EGFP細胞(Reyon, D. et al. FLASH assembly of TALENs for hi
gh-throughput genome editing. Nat Biotechnol 30, 460-465 (2012))を、10%のF
BS、ペニシリン/ストレプトマイシンおよび2mMのGlutaMAX(Life T
echnologies)を有するAdvanced DMEM培地中、37℃、5%C
O2で培養した。細胞株の特定を、STRプロファイリング(ATCC)およびディープ
シークエンシングによって検証し、細胞を、マイコプラズマ汚染について2週間に1回試
験した。U2OS.EGFP培養培地に、追加で、400μg/mLのG418を補充し
た。細胞を、Lonza 4D-ヌクレオフェクターのDN-100プログラムを使用し
て、製造者の指示書に従って、750ngのCas9プラスミドおよび250ngのsg
RNAプラスミドで同時トランスフェクトした。空のU6プロモータープラスミドで一緒
にトランスフェクトされたCas9プラスミドを、すべてのヒト細胞実験について、陰性
対照として使用した。
【0087】
ヒト細胞EGFP破壊アッセイ
EGFP破壊実験を、以前に記載されたようにして(Fu, Y. et al. High-frequency o
ff-target mutagenesis induced by CRISPR-Cas nucleases in human cells. Nat Biotec
hnol 31, 822-826 (2013); Reyon, D. et al. FLASH assembly of TALENs for high-thro
ughput genome editing. Nat Biotechnol 30, 460-465 (2012))、行った。トランスフェ
クションのおよそ52時間後、Fortessaフローサイトメーター(BD Bios
ciences)を使用して、トランスフェクトされたU2OS.EGFP細胞中のEG
FP蛍光を測定した。Cas9および空のU6プロモータープラスミドの陰性対照トラン
スフェクションを使用して、すべての実験について、約2.5%のバックグラウンドのE
GFPのロスを確立した。
【0088】
T7E1アッセイ
T7E1アッセイを、以前に記載されたようにして15、行った。U2OSヒト細胞の
ために、ゲノムDNAを、Agencourt DNAdvance Genomic
DNA単離キット(Beckman Coulter Genomics)を使用して、
トランスフェクションの約72時間後に、トランスフェクトされた細胞から抽出した。ヒ
ト細胞のゲノムDNAからの標的遺伝子座を、表4に列挙したプライマーを使用して増幅
した。概略で200ngの精製PCR産物を、変性させ、アニーリングし、およびT7E
1(New England BioLabs)で消化した。変異生成頻度を、以前に記
載されたようにして15、Qiaxcelキャピラリー電気泳動装置(QIagen)を
使用して定量化した。
【0089】
[実施例1]
現在アクセスできないPAM配列の標的化を可能にすることによってSpCas9の有
用性をさらに拡大するために、本発明者らは、新規なPAM配列を認識する能力があるS
pCas9バリアントについて選択するための代替戦略を考えた。SpCas9コード配
列内のある特定の位置がPAM認識のために重要であることが以前に確立されており(Kl
einstiver et al., Nature 2015)、本発明者らは、6つの位置でアミノ酸をランダム化
して、PAM相互作用ドメイン:D1135/S1136、G1218/E1219およ
びR1335/T1337の3つの別々の領域内で多様なコドン使用頻度を有するSpC
as9バリアントのライブラリーを生成させる、集中変異生成アプローチを実施した。そ
うするために、本発明者らは、コードされたこれらの6つのアミノ酸を含有するSpCa
s9のコドンで、NNSヌクレオチドトリプレット(ここで、Nは任意のヌクレオチドで
あり、SはGまたはCである)をコードするランダム化オリゴヌクレオチドカセットを連
続してクローニングした(
図1A)。次いで、得られるSpCas9バリアントのライブ
ラリーを、以前に記載されたようにして(Kleinstiver et al., Nature 2015)、さまざ
まなNGNN PAM配列をコードする標的部位に対して、本発明者らの細菌陽性選択ア
ッセイでスクリーニングした(
図1B)。簡潔には、SpCas9が陽性選択プラスミド
においてコードされる標的部位(PAMおよびスペーサー配列)を認識することができる
場合にのみ、細菌は、選択条件(10mMのアラビノース上に蒔かれ、これは、ccdB
毒性遺伝子の転写を誘導する)で生存することができる。強いPAM認識は、選択プラス
ミドの加水分解をもたらし、ccdB発現の誘導を防ぎ、細菌の増殖を可能にする。この
ように、SpCas9ライブラリーのスクリーニングの間に、10mMのアラビノースを
含有する培地で増殖したコロニーは、代替PAMを標的化することができるSpCas9
PAMバリアントをコードすると予想される(
図1B)。
【0090】
本発明者らは、最初に、NGTG、NGTT、NGTCおよびNGTA PAMを有す
る標的部位をコードする陽性選択プラスミドにおいて、ランダム化されたD1135X/
S1136X/G1218X/E1219X/R1335X/T1337X SpCas
9ライブラリー(SpCas9-XXXXXX、ここで、Xは、任意のアミノ酸である)
をスクリーニングした。それぞれの異なるPAM選択のために、アラビノース選択からの
48の生存コロニーを集め、クロラムフェニコール含有培地中で終夜増殖させて、プラス
ミドをコードするヌクレアーゼを回収した。一次スクリーニングにおいて偽陽性の割合を
低減するために、すべての推定上のPAMバリアントプラスミドを、その後、標的部位を
コードする陽性選択プラスミドに対して、およびそれらが最初にスクリーニングされたP
AMに対して、再スクリーニングした(データは示さない)。この再スクリーニングアッ
セイにおいて少なくとも50%生存の真正バリアントのサブセットをシークエンシングし
て、1135、1136、1218、1219、1335、1337番目の残基でのアミ
ノ酸を特定し(表1)、次いで、これらのバリアントを、NGTG、NGTT、NGTC
およびNGTA PAMに対してより広範にスクリーニングして、NGTN部位に対する
活性を評価した(
図2a~2bおよび表1)。注意:この記載以降、細菌アッセイにおい
て、SpCas9バリアントは、それらのバリアント番号(vNGTN-#)によって記
載し、またはヒトアッセイにおいて「アミノ酸名称」によって記載し、ここで、アミノ酸
名称は、SpCas9-XXXXXXの形式であり、ここで、6つのXは、1135、1
136、1218、1219、1335および1337番目の位置でのアミノ酸識別を表
す(表1~3において見られる)。再スクリーニングはわずかな傾向を特定し、ここで、
いくつかの場合において、バリアントは、最初に選択されたもの(例、vNGTN-1、
-3、-12、-27、-28など)に対するNGTN PAMに対して最も高い活性を
有し、いくつかのバリアントは、NGT
N PAM(例、vNGTN-15、-31、-
35など、これは、NGTCおよびNGTAを標的化することができる)の組み合わせを
標的化することができ、いくつかのバリアントは、NGT
N PAM(例、vNGTN-
9、-10、-30など)のすべてを標的化することができる(
図2A~2Bおよび表1
)。これらの結果に基づいて、新規なバリアントを、初期スクリーニングにおいて十分に
行われたクローン中の1135、1136、1218、1219、1335および133
7番目の位置でアミノ酸を生じる頻度に基づいて、合理的に設計した。これらの合理的に
設計されたNGTNバリアントを、NGTG、NGTT、NGTCおよびNGTA PA
M(
図2C~2F)に対する細菌スクリーニングにおいて評価し、いくつかの場合におい
て、NGAN PAM(NGAG、NGAT、NGAC、NGAA;
図2C、2E~2F
)に対してもスクリーニングした。再び、上記の選好性と一致した性質を有する多数の興
味深いバリアントを特定したが、とりわけ、PAM(例、NGT
GもしくはNGA
G P
AMを標的化することができるvNGTG-37、またはNGT
CおよびNGA
C PA
MにおけるvNGTG-18ならびに-41など)の4番目の位置での選好性を与え得る
いくつかの追加バリアント、NGT
N PAM(例、vNGTN-40、-46、-48
など)のすべてを標的化することができる追加バリアント、およびNGT
NもしくはNG
A
N PAM(例、vNGTN-7、-44、-59など;
図2C~2Fおよび表1)の
すべてまたはほぼすべてを標的化することができるバリアントを特定した。
【0091】
細菌中のNGTN PAM部位を標的化することができるいくつかのバリアントを特定
し、本発明者らは、これらの選好性がヒト細胞における真正な活動に翻訳されるか否かを
決定することを試みた。本発明者らのヒトU2OS EGFP破壊アッセイにおける12
の異なるNGTN PAMバリアントの初期スクリーニングにおいて、本発明者らは、N
GT
TおよびNGT
G PAM(例、SpCas9-GRKIQK、-VAKLLR、-
VRKLLRなど)を安定して標的化し得るバリアント、およびすべてのNGT
N PA
M部位(例、SpCas9-LRSVQL、-IRAVQLなど)を改変し得るいくつか
のバリアントを特定した(
図3A)。ヒト細胞EGFP破壊アッセイにおいてこれらのバ
リアントおよび追加の合理的に設計されたバリアントのサブセットのさらなるスクリーニ
ングは、SpCas9-LRSVQL、-LRKIQK、-LRSVQKなどを、NGT
N PAM配列を標的化することができる有望なバリアントとして特定した(
図3B)。
ヒト細胞でのNGT
N PAM配列におけるSpCas9-LRSVQLの活性をより厳
しく特徴付けるために、本発明者らは、ヒトU2OS細胞において、EMX1、FANC
FおよびRUNX1遺伝子にわたる32の異なる内因性部位にわたって、このヌクレアー
ゼバリアントの活性を調べた。この解析は、NGTG、NGTA、NGTCおよびNGT
T PAMを持つさまざまな内因性部位におけるSpCas9-LRSVQLの安定した
活性を明らかにした(
図3C、本発明者らの選択および合理的に設計したPAMバリアン
トが公表されたSpCas9バリアントで以前に標的化できなかった多数の遺伝子座にわ
たって効率よく機能することができることを実証する)。
【0092】
本発明者らは、SpCas9-VRER(D1135V/G1218R/R1335E
/T1337R置換をコードする)と呼ばれるNGCG PAM部位(Kleinstiver et a
l., Nature, 2015)を効率的に標的化することができるSpCas9バリアントを以前に
記載した。このバリアントは、以前にアクセス可能ではなかった部位の標的化を可能にす
るが、これは、拡張されたNGCG PAMを有する部位における活性を制限する。現在
NGC
T、NGC
CおよびNGC
Aを含むNGC
N PAMをすべて潜在的に標的化する
ことによってSpCas9 PAMバリアントの有用性を拡大するために、本発明者らは
、上記に記載のものに対する同様の選択を行ったが、NGCG、NGCT、NGCCまた
はNGCA PAMのいずれかを有する標的部位を保有する陽性選択プラスミドに対する
SpCas9-XXXXXXライブラリーをスクリーニングした(
図4A~4Bおよび表
2)。本発明者らがNGTN選択で観察したものと酷似して、NGC
Nバリアントの再ス
クリーニングは、バリアントが、最初に選択されたNGCN PAM(例、vNGCN-
3、-8、-9、-17など)に対して最も高い活性を有する場合、いくつかのバリアン
トが、NGC
N PAM(例、vNGCN-10など、これは、NGCT、NGCCおよ
びNGCAを標的化することができる)の組み合わせを標的化することができること、な
らびにいくつかのバリアントがNGC
N PAM(例、vNGCN-1、-2、-5、-
18、-26など)のすべてを標的化することができることを特定した(
図4A~4Bお
よび表2)。さまざまな合理的に生成されたNGCNバリアントを、SpCas9-XX
XXXX選択クローンにおけるアミノ酸富化の観察に基づいてクローニングし、NGCN
PAMに対する活性について細菌中で試験した(
図4A~4B、表2、データは示さな
い)。
【0093】
次に、本発明者らは、本発明者らのU2OS EGFP破壊アッセイにおけるさまざま
なNGCN選択SpCas9 PAMバリアントの活性を調べて、それらの再標的化PA
M選好性およびヌクレアーゼ活性がヒト細胞で再現されるか否かを決定した(
図5A~5
D)。本発明者らは、NGCA PAM(SpCas9-MQKSER、-LWRVVA
、-LWLETRなど;
図5A)、NGCC PAM(SpCas9-MQKSER、-
LSRWQR、-ICCCERなど;
図5A)、NGCT PAM(SpCas9-MQ
KSER;
図5C)、またはNGCCおよびNGCT PAM(SpCas9-MQKS
ER、-VRKSER、-ICKSERなど;
図5C)に対する多数のバリアントの活性
を観察した。さらに、全部で15のNGCA、NGCC、NGCTおよびNGCG部位に
対するSpCas9-MQKSER、-VRKSER、-ICKSERバリアントの試験
は、すべてのクラスのNGC
N PAMに対するそれぞれのバリアントの安定した活性を
明らかにした(
図5E)。いくつかの場合において、これらのバリアントは、公表された
SpCas9-VRER(例えば、
図5B~5Cに示される)より優れ得るが、これは、
一般に、SpCas9-VRERによって効率的に標的化されないことが以前に示された
PAMに対してであった。まとめると、これらの新しいバリアントは、SpCas9-M
QKSER、およびすべてのNGC
N PAMに対して安定した活性を有する他のバリア
ントにより、以前にアクセス可能であったNGCGの代わりに、NGCT、NGCCおよ
びNGCAに、SpCas9の標的化を拡大する。
【0094】
加えて、本発明者らは、SpCas9-VQR(D1135V/R1335Q/T13
37R;Kleinstiver et al., Nature, 2015)およびSpCas9-VRQR(D113
5V/G1218R/R1335Q/T1337R;Kleinstiver and Pattanayak et al
., Nature, 2016)と呼ばれるNGA
N PAM部位を効率的に標的化することができる
SpCas9バリアントも以前に記載している。しかしながら、これらのバリアントは、
NGAG>NGAA=NGAT>NGACの順で、NGA
N PAMのサブクラスへの選
好性を有し、すなわち、これらは、NGA
C PAM部位に対する準最適な活性を有する
。NGAN PAMのSpCas9標的化を潜在的に改善するために、本発明者らは、N
GAG、NGAT、NGACおよびNGAA PAMをコードする陽性選択プラスミドに
対する上記に記載のSpCas9-XXXXXXライブラリーによる選択を行った(
図6
A~6Bおよび表3)。NGA
Nバリアントの再スクリーニングは、クローンが、最初に
選択されたNGA
N PAM(例、NGA
GにおけるvNGAN-1、-2、-17、-
26から-30など、NGA
TにおけるvNGAN-32、NGA
CにおけるvNGAN
-4、-5、-40、-41など)に対する最も高い活性を有すること、いくつかのバリ
アントがNGA
N PAM(例、NGA
TおよびNGA
Cを標的化することができるvN
GAN-20、-21など、またはNGA
GおよびNGA
Cを標的化することができるv
NGAN-22)の組み合わせを標的化することができること、ならびにいくつかのバリ
アントがNGA
N PAM(例、vNGAN-3、-13、-25、-31など)のすべ
てを標的化することができることを明らかにした(
図6A~6Bおよび表3)。
【0095】
多数のSpCas9-XXXXXXバリアントが細菌スクリーニングにおける強いNG
AC PAM標的化を明らかにしたので、多くのバリアントを、本発明者らのヒト発現ベ
クターにサブクローニングして、本発明者らのヒト細胞U2OS EGFP破壊アッセイ
において活性を調べた。EGFPにおける単一のNGAA、NGAC、NGATおよびN
GAG PAM部位に対するバリアントのサブセットの初期スクリーニングは、ある特定
のバリアントが、NGAC PAMを保有する部位でSpCas9-VQRよりも潜在的
に優れていることを明らかにした(
図7A)。
図7Aからのバリアントおよび追加で選択
されたバリアントのより広範囲におよぶ試験は、複数のSpCas9バリアントが、Sp
Cas9-LRSVRS、-MRARKE、-SRQMRGなどを含む、EGFP破壊ア
ッセイ(
図7B)において調べられたNGAC PAMの一部または4つすべてに対する
SpCas9-VRQRと比べて活性が改善されていることを明らかにした。
【0096】
次いで、本発明者らは、本発明者らのSpCas9バリアントの活性を、緩和されたN
G PAM選好性が報告されているxCas9と呼ばれる最近記載されたSpCas9
PAMバリアント(Hu et al., Nature volume 556, pages 57-63 (05 April 2018))と
比較した。本発明者らの以前の結果と一致して、本発明者らは、VRQRバリアント(V
SREQRとしても公知)を有するNGA PAMを有する部位、VRER(VSREE
Rとしても公知)およびMQKSERバリアントを有するNGCG PAMを有する部位
、ならびにLRSVQLバリアントを有するNGT PAMを有する部位の安定したヌク
レアーゼ標的化(T7E1アッセイによって評価された場合に、15~50%の間)を観
察した(
図8)。しかしながら、xCas9バリアントにより、NGA、NGCGまたは
NGT PAMを有する部位の標的化は、10%超の効率は観察されず、さらにまた、本
発明者らは、xCas9が、野生型SpCas9と比較して、NGG PAMを有する標
的部位で平均で約2分の1の効果であったことを観察した(
図8)。これらの結果は、本
発明者らのSpCas9 PAMバリアントが、xCas9と比較した場合に、いろいろ
なPAMに対してより効果的なヌクレアーゼであることを実証する。
【0097】
[実施例2]
正確な単一の塩基編集イベントを行うための能力は、最近、遺伝子操作されたSpCa
s9塩基エディター(BE)コンストラクトを使用して実証され(例えば、Komor et al.
, Nature. 2016 May 19;533(7603):420-4;Nishida et al., Science. 2016 Sep 16;353(
6305);Kim et al., Nat Biotechnol. 2017 Apr;35(4):371-376;Komor et al., Sci Adv
. 2017 Aug 30;3(8):eaao4774;およびGaudelli et al., Nature. 2017 Nov 23;551(7681
):464-471を参照されたい)、これは、非標的DNA鎖のssDNA到達性を引き起こす
Rループを形成するSpCas9-gRNAの形成を利用する。したがって、異種性のシ
チジンまたはアデニンデアミナーゼ酵素ドメインのSpCas9への融合体は、露出した
ssDNA鎖上で作用し得、それぞれ、CからTへの変更(いわゆる、シトシン塩基エデ
ィター、またはCBE)またはAからGへの変更(いわゆる、アデノシン塩基エディター
、またなABE)の効率がよい導入をもたらす。細胞の塩基除去修復(BER)は、ウラ
シル塩基を除去するためにウラシルDNAグリコシラーゼ(UDG;ウラシルN-グリコ
シラーゼまたはUNGとしても公知)を利用するので、この内因性プロセスは、シチジン
BEによって生成した編集を効率的に元に戻してしまう可能性がある。これは、シチジン
の脱アミノ化がウラシル中間体をもたらすからである。したがって、シチジンBEの効率
を改善するために、ウラシルグリコシラーゼ阻害剤(UGI)などの異種エフェクタード
メインはまた、SpCas9と融合して、UDGを阻害することができ、BERの開始を
覆し、シチジンBEの有効性を増加させる。
【0098】
したがって、本発明者らは、本発明者らのSpCas9 PAMバリアントの拡大され
た標的範囲が、以前にアクセス可能ではなかった部位の編集を可能にすることによって、
塩基エディターの有用性を改善することができるか否かを決定することを試みた。そうす
るために、本発明者らは、BE3(Komor et al., Nature. 2016 May 19;533(7603):420-
4)PAMバリアントを構築して、NGAおよびNGT PAMを有する部位を認識する
能力があるCBEを生成した。本発明者らは、NGA PAMを有する部位において、C
BE-VRQRバリアントが、編集ウィンドウにおいて7.5%~64.2%の間のCか
らTへの変換を示した一方で、xCas9が、同じ部位において0%~19.9%のCか
らTへの編集を示したことを見出した(
図9A)。同様に、NGT PAMを有する部位
において、CBE-LRSVQLバリアントは、10.8%~50.3%の間のCからT
への変換を示した一方で、CBE-xCas9が、同じ部位において0%~28.5%の
CからTへの編集を示した(
図9A)。本発明者らは、NGG PAMを有する部位にお
いて、野生型SpCas9(52.5%~62.4%)と比較して、CBE-xCas9
によるCからTへの編集活性(26.7%~37.2%)の著しい減少も観察した(
図9
A)。これらの結果は、VRQRおよびLRSVQLのBE3バージョンが、それぞれ、
xCas9より約2倍大きい割合で、NGAおよびNGT PAMを有する部位において
、効果的なCBEであることを実証する。
【0099】
次に、本発明者らは、本発明者らのPAMバリアントのABE(7.10)(Gaudelli
et al., Nature. 2017 Nov 23;551(7681):464-471)バージョンを構築して、ヒト細胞に
おけるAからGへの変換を媒介するABEとしてそれらの有効性を決定した。本発明者ら
は、ABE-xCas9で観察された0%~12.5%の編集と比較して、NGA PA
Mを有する部位において、ABE-VRQRによるAからGへの強い編集活性(8.0%
~77.3%)を観察した(
図9B)。同様に、NGCG PAMを有する部位において
、ABE-VRER(0%~75.9%)およびABE-MSQKER(5.4%~90
.4%)バリアントは、またもや、AからGへの編集について、ABE-xCas9(0
%~62.3%)より優れていた(
図9B)。本発明者らは、NGG PAMを有する部
位において、野生型SpCas9(13.9%~50.4%)と比較して、ABE-xC
as9によるAからGへの編集の減少(0%~16.9%)も観察した(
図9B)。本発
明者らの結果は、VRQRのABE(7.10)バージョンが、NGA PAMを有する
部位におけるAからGへの編集の媒介に効果的であること、ならびにVRERおよびMS
QKERのABE(7.10)バージョンが、NGCG PAMを有する部位において効
果的であることを明らかにする。
【0100】
参照文献
【0101】
【0102】
【0103】
他の実施形態
本発明をその詳細な説明と関連して記載したが、前述の記載は、説明することを意図す
るものであって、本発明の範囲を限定することを意図するものではなく、本発明は、添付
の特許請求の範囲によって規定されることが理解されるべきである。他の態様、利点およ
び改変は、以下の特許請求の範囲内である。
【0104】
【0105】
【0106】
【0107】
【0108】
【0109】
【0110】
【0111】
【0112】
配列番号1のアミノ酸配列と少なくとも80%の同一性を有する、化膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)タンパク質であって、以下の位置:D1135、S1136およびG1218で変異を有し、
D1135の位置での変異がMであり、S1136の位置での変異がQであり、およびG1218の位置での変異がKである、前記SpCas9タンパク質。
前記転写活性化ドメインが、VP16、VP64、rTA、NF-κB p65または複合性VPR(VP64-p65-rTA)である、請求項8に記載の融合タンパク質。
前記転写抑制ドメインが、クルッペル関連ボックス(KRAB)ドメイン、ERFリプレッサードメイン(ERD)またはmSin3A相互作用ドメイン(SID)である、請求項10に記載の融合タンパク質。
ヒストンサブユニットを改変する前記酵素が、ヒストンアセチルトランスフェラーゼ(HAT)、ヒストンデアセチラーゼ(HDAC)、ヒストンメチルトランスフェラーゼ(HMT)またはヒストンデメチラーゼである、請求項15に記載の融合タンパク質。
前記異種性機能ドメインが、アポリポタンパク質B mRNA編集酵素、触媒ポリペプチド様(APOBEC)デアミナーゼ、活性化誘導シチジンデアミナーゼ(AID)、およびtRNAに作用するシトシンデアミナーゼ(CDAT)からなる群から選択されるシチジンデアミナーゼドメインである、請求項18に記載の融合タンパク質。
前記異種性機能ドメインが、アデノシンデアミナーゼであり、アデノシンデアミナーゼ1(ADA1)、ADA2;RNA1に作用するアデノシンデアミナーゼ(ADAR1)、ADAR2、ADAR3;tRNA1に作用するアデノシンデアミナーゼ(ADAT1)、ADAT2、ADAT3;および天然に存在するまたは遺伝子操作されたtRNA特異的アデノシンデアミナーゼ(TadA)からなる群から選択される、請求項18に記載の融合タンパク質。
二本鎖DNA(dsDNA)分子におけるヌクレオチド塩基を編集する方法であって、前記dsDNA分子を、請求項18に記載の融合タンパク質、および前記dsDNA分子の選択された部分に相補的な領域を有するガイドRNAと接触させることを含む、前記方法。
前記異種性機能ドメインが、アポリポタンパク質B mRNA編集酵素、触媒ポリペプチド様(APOBEC)デアミナーゼ、活性化誘導シチジンデアミナーゼ(AID)、およびtRNAに作用するシトシンデアミナーゼ(CDAT)からなる群から選択されるシチジンデアミナーゼドメインである、請求項21に記載の方法。
前記異種性機能ドメインが、アデノシンデアミナーゼ1(ADA1)、ADA2;RNA1に作用するアデノシンデアミナーゼ(ADAR1)、ADAR2、ADAR3;tRNA1に作用するアデノシンデアミナーゼ(ADAT1)、ADAT2、ADAT3;および天然に存在するまたは遺伝子操作されたtRNA特異的アデノシンデアミナーゼ(TadA)からなる群から選択されるアデノシンデアミナーゼである、請求項21に記載の方法。
細胞のゲノムを変更する方法であって、請求項1に記載の単離されたタンパク質、および前記細胞の前記ゲノムの選択された部分に相補的な領域を有するガイドRNAを、前記細胞で発現させることを含む、前記方法。
二本鎖DNA(dsDNA)分子を変更する方法であって、前記dsDNA分子を、請求項1に記載のタンパク質、および前記dsDNA分子の選択された部分に相補的な領域を有するガイドRNAと接触させることを含む、前記方法。
前記E1219の位置での変異がSまたはFであり、前記R1335の位置での変異がEであり、および前記T1337の位置での変異がRである、請求項28に記載のSpCas9タンパク質。