特許第6799586号(P6799586)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ザ ジェネラル ホスピタル コーポレイションの特許一覧

特許6799586遺伝子操作CRISPR−Cas9ヌクレアーゼ
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6799586
(24)【登録日】2020年11月25日
(45)【発行日】2020年12月16日
(54)【発明の名称】遺伝子操作CRISPR−Cas9ヌクレアーゼ
(51)【国際特許分類】
   C12N 15/55 20060101AFI20201207BHJP
   C12N 9/16 20060101ALI20201207BHJP
   C12N 15/63 20060101ALI20201207BHJP
   C07K 19/00 20060101ALI20201207BHJP
   C12N 15/62 20060101ALI20201207BHJP
   C12N 1/15 20060101ALI20201207BHJP
   C12N 1/19 20060101ALI20201207BHJP
   C12N 1/21 20060101ALI20201207BHJP
   C12N 5/10 20060101ALI20201207BHJP
   C12N 15/09 20060101ALI20201207BHJP
【FI】
   C12N15/55ZNA
   C12N9/16 Z
   C12N15/63 Z
   C07K19/00
   C12N15/62 Z
   C12N1/15
   C12N1/19
   C12N1/21
   C12N5/10
   C12N15/09 110
【請求項の数】33
【全頁数】88
(21)【出願番号】特願2018-510914(P2018-510914)
(86)(22)【出願日】2016年8月26日
(65)【公表番号】特表2018-525019(P2018-525019A)
(43)【公表日】2018年9月6日
(86)【国際出願番号】US2016049147
(87)【国際公開番号】WO2017040348
(87)【国際公開日】20170309
【審査請求日】2019年8月26日
(31)【優先権主張番号】62/211,553
(32)【優先日】2015年8月28日
(33)【優先権主張国】US
(31)【優先権主張番号】62/216,033
(32)【優先日】2015年9月9日
(33)【優先権主張国】US
(31)【優先権主張番号】62/258,280
(32)【優先日】2015年11月20日
(33)【優先権主張国】US
(31)【優先権主張番号】62/271,938
(32)【優先日】2015年12月28日
(33)【優先権主張国】US
(31)【優先権主張番号】15/015,947
(32)【優先日】2016年2月4日
(33)【優先権主張国】US
【早期審査対象出願】
(73)【特許権者】
【識別番号】592017633
【氏名又は名称】ザ ジェネラル ホスピタル コーポレイション
(74)【代理人】
【識別番号】100092783
【弁理士】
【氏名又は名称】小林 浩
(74)【代理人】
【識別番号】100120134
【弁理士】
【氏名又は名称】大森 規雄
(74)【代理人】
【識別番号】100104282
【弁理士】
【氏名又は名称】鈴木 康仁
(72)【発明者】
【氏名】ジョン,ジェイ.キース
(72)【発明者】
【氏名】クラインスティーバー,ベンジャミン
(72)【発明者】
【氏名】パターナヤック,ヴィクラム
【審査官】 西 賢二
(56)【参考文献】
【文献】 国際公開第2014/144592(WO,A2)
【文献】 Kleinstiver, B. P. et al.,"Engineered CRISPR-Cas9 nucleases with altered PAM specificities",Nature,2015年 6月22日,Vol. 523,pp. 481-485
【文献】 Nishimasu, H. et al.,"Crystal Structure of Staphylococcus aureus Cas9",Cell,2015年 8月27日,Vol. 162,pp. 1113-1126, Supplemental Information
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00−15/90
C12N 9/00−9/99
MEDLINE/EMBASE/BIOSIS/WPIDS(STN)
(57)【特許請求の範囲】
【請求項1】
配列番号2のアミノ酸配列と少なくとも95%同一であり、以下の位置:Y211、Y212、W229、Y230、R245、T392、またはY651のうちの1、2、3、4、5、6つまたはそれ以上における突然変異を有し、野生型SaCas9と比較して改善されたオフターゲット活性を有する、単離黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9)タンパク質。
【請求項2】
以下の突然変異:Y211A、Y212A、W229A、Y230A、R245A、T392A、および/またはY651Aの1つ以上を含む、請求項1に記載の単離タンパク質。
【請求項3】
N419における突然変異をさらに含む、請求項1に記載の単離タンパク質。
【請求項4】
Y211、Y212、W229、Y230、R245、およびT392のうちの1、2、3、4、5または6つにおける突然変異、ならびに任意選択的にR654における突然変異を含む、請求項1に記載の単離タンパク質。
【請求項5】
211A/R654A、Y211A/Y212A、Y211A/Y230A、Y211A/R245A、Y212A/Y230A、Y212A/R245A、Y230A/R245A、W229A/R654A、Y211A/Y212A/Y230A、Y211A/Y212A/R245A、Y211A/Y212A/Y651A、Y211A/Y230A/R245A、Y211A/Y230A/Y651A、Y211A/R245A/Y651A、Y211A/R245A/R654A、Y211A/R245A/N419A、Y211A/N419A/R654A、Y212A/Y230A/R245A、Y212A/Y230A/Y651A、Y212A/R245A/Y651A、Y230A/R245A/Y651A、R245A/N419A/R654A、T392A/N419A/R654A、R245A/T392A/N419A/R654A、Y211A/R245A/N419A/R654A、W229A/R245A/N419A/R654A、Y211A/R245A/T392A/N419A/R654A、またはY211A/W229A/R245A/N419A/R654A
における突然変異を含む、請求項3または4に記載の単離タンパク質。
【請求項6】
N44;R45;R51;R55;K57;R59;R60;R61;H111;K114;R116;V164;R165;N169;R208;R209;T238;Y239;K248;Y256;R314;N394;Q414;L446;Q488;N492;Q495;R497;N498;R499;Q500;K518;K523;K525;H557;R561;K572;R634;G655;N658;S662;N667;R686;K692;R694;H700;K751;D786;T787;L788;Y789;S790;R792;N804;Y868;K870;K878;K879;K881;T882;K886;Y897;N888;A889;R901;K906;L909;N985;N986;R991;および/またはR1015における突然変異をさらに含む、請求項1〜5のいずれか一項に記載の単離タンパク質。
【請求項7】
以下の突然変異:E782K;K929R;N968K;R1015H;E782K/N968K/R1015H(KKHバリアント);E782K/K929R/R1015H(KRHバリアント);またはE782K/K929R/N968K/R1015H(KRKHバリアント)のうちの1つ以上をさらに含む、請求項1〜5のいずれか一項に記載の単離タンパク質。
【請求項8】
ヌクレアーゼ活性を減少させる突然変異である、H557またはN580における突然変異、およびD10、E477、D556、H701またはD704における突然変異をさらに含む、請求項1〜5のいずれか一項に記載の単離タンパク質。
【請求項9】
前記突然変異が、
D10における突然変異がD10AもしくはD10Nであるか、
D556における突然変異がD556Aであるか、
H557における突然変異がH557A、H557N、もしくはH557Yであるか、または
N580における突然変異がN580Aである、
請求項に記載の単離タンパク質。
【請求項10】
前記SaCas9タンパク質が、核局在化配列、細胞浸透ペプチド配列および/または親和性タグのうちの1つ以上と融合されている、請求項1〜9のいずれか一項に記載の単離タンパク質。
【請求項11】
任意選択の介在リンカーにより異種機能ドメインに融合されている請求項1〜10のいずれか一項に記載の単離タンパク質を含む融合タンパク質であって、前記リンカーが前記融合タンパク質の活性を妨害しない、融合タンパク質。
【請求項12】
前記異種機能ドメインが転写活性化ドメインである、請求項11に記載の融合タンパク質。
【請求項13】
前記転写活性化ドメインがVP64またはNF−κB p65からのものである、請求項12に記載の融合タンパク質。
【請求項14】
前記異種機能ドメインが転写サイレンサーまたは転写抑制ドメインである、請求項11に記載の融合タンパク質。
【請求項15】
前記転写抑制ドメインが、クルッペル関連ボックス(KRAB)ドメイン、ERFリプレッサードメイン(ERD)、またはmSin3A相互作用ドメイン(SID)である、請求項14に記載の融合タンパク質。
【請求項16】
前記転写サイレンサーがヘテロクロマチンタンパク質1(HP1)である、請求項14に記載の融合タンパク質。
【請求項17】
前記HP1がHP1αまたはHP1βである、請求項16に記載の融合タンパク質。
【請求項18】
前記異種機能ドメインが、DNAのメチル化状態を改変する酵素である、請求項11に記載の融合タンパク質。
【請求項19】
前記DNAのメチル化状態を改変する前記酵素がDNAメチルトランスフェラーゼ(DNMT)またはテンイレブントランスロケーション(TET)タンパク質である、請求項18に記載の融合タンパク質。
【請求項20】
前記TETタンパク質がTET1である、請求項19に記載の融合タンパク質。
【請求項21】
前記異種機能ドメインが、ヒストンサブユニットを改変する酵素である、請求項11に記載の融合タンパク質。
【請求項22】
ヒストンサブユニットを改変する前記酵素が、ヒストンアセチルトランスフェラーゼ(HAT)、ヒストンデアセチラーゼ(HDAC)、ヒストンメチルトランスフェラーゼ(HMT)、またはヒストンデメチラーゼである、請求項21に記載の融合タンパク質。
【請求項23】
前記異種機能ドメインが生物学的係留物である、請求項11に記載の融合タンパク質。
【請求項24】
前記生物学的係留物がMS2、Csy4またはラムダNタンパク質である、請求項23に記載の融合タンパク質。
【請求項25】
前記異種機能ドメインがFokIである、請求項11に記載の融合タンパク質。
【請求項26】
請求項1〜10のいずれか一項に記載のタンパク質をコードする単離核酸。
【請求項27】
請求項26に記載の単離核酸を含み、任意選択的に前記単離核酸が1つ以上の調節ドメインに作動可能に結合されている、ベクター。
【請求項28】
請求項26に記載の核酸を含む宿主細胞。
【請求項29】
細胞のゲノムまたはエピゲノムを変更するインビトロの方法であって、前記細胞中で、請求項1〜10のいずれか一項に記載の単離タンパク質および前記細胞の前記ゲノムの選択部分に相補的な領域を有するガイドRNAを発現させるか、または前記単離タンパク質および前記ガイドRNAと前記細胞とを接触させることを含む方法。
【請求項30】
細胞のゲノムまたはエピゲノムを変更するインビトロの方法であって、前記細胞中で、請求項11〜25のいずれか一項に記載の融合タンパク質および前記細胞の前記ゲノムの選択部分に相補的な領域を有するガイドRNAを発現させるか、または前記融合タンパク質および前記ガイドRNAと前記細胞とを接触させることを含む方法。
【請求項31】
二本鎖DNA(dsDNA)分子を変更するインビトロの方法であって、前記dsDNA分子を請求項1〜10のいずれか一項に記載の単離タンパク質および前記dsDNA分子の選択部分に相補的な領域を有するガイドRNAと接触させることを含む方法。
【請求項32】
前記dsDNA分子がインビトロで存在する、請求項31に記載のインビトロの方法。
【請求項33】
二本鎖DNA(dsDNA)分子を変更するインビトロの方法であって、前記dsDNA分子を請求項11〜25のいずれか一項に記載の融合タンパク質および前記dsDNA分子の選択部分に相補的な領域を有するガイドRNAと接触させることを含む方法。
【発明の詳細な説明】
【技術分野】
【0001】
優先権の主張
本出願は、35USC§119(e)のもと、2015年8月28日に出願された米国特許出願第62/211,553号明細書;2015年9月9日に出願された同第62/216,033号明細書;2015年11月20日に出願された同第62/258,280号明細書;2015年12月28日に出願された同第62/271,938号明細書;および2016年2月4日に出願された米国特許出願公開第15/015,947号明細書に対する優先権を主張する。上記の全体の内容は、参照により本明細書に組み込まれる。
【0002】
配列表
本出願は、ASCIIフォーマットで電子的に提出され、参照により全体として本明細書に組み込まれる配列表を含有する。前記ASCII複写物は、2016年8月26日に作成され、SEQUENCE LISTING.txtと命名され、サイズが129,955バイトである。
【0003】
連邦政府による資金提供を受けた研究または開発
本発明は、National Institutes of Healthにより授与された助成金番号DP1GM105378、およびR01GM088040のもとで政府支援により作製された。政府は、本発明における一定の権利を有する。
【0004】
本発明は、少なくとも部分的に、変更および改善された標的特異性を有する遺伝子操作クラスター化等間隔短鎖回文リピート(Clustered Regularly Interspaced Short Palindromic Repeats)(CRISPR)/CRISPR関連タンパク質9(Cas9)ヌクレアーゼならびにゲノム遺伝子操作、エピゲノミック遺伝子操作、ゲノム標的化、ゲノム編集、およびインビトロ診断におけるその使用に関する。
【背景技術】
【0005】
CRISPR−Cas9ヌクレアーゼは、広範な生物および細胞タイプにおいて効率的で効率的なゲノム編集を可能とする(Sander&Joung,Nat Biotechnol 32,347−355(2014);Hsu et al.,Cell 157,1262−1278(2014);Doudna&Charpentier,Science 346,1258096(2014);Barrangou&May,Expert Opin Biol Ther 15,311−314(2015))。Cas9による標的部位認識は、標的プロトスペーサーに相補的な配列をコードするキメラ単一ガイドRNA(sgRNA)によりプログラミングされるが(Jinek et al.,Science 337,816−821(2012))、短鎖隣接PAMの認識も要求する(Mojica et al.,Microbiology 155,733−740(2009);Shah et al.,RNA Biol 10,891−899(2013);Jiang et al.,Nat Biotechnol 31,233−239(2013);Jinek et al.,Science 337,816−821(2012);Sternberg et al.,Nature 507,62−67(2014))。
【発明の概要】
【課題を解決するための手段】
【0006】
本明細書に記載のとおり、Cas9タンパク質は、理論的には、DNAについてのCas9の結合親和性を低減させることにより、増加した特異性を示すように遺伝子操作することができる。したがって、野生型タンパク質と比較して増加した特異性を有する(すなわち、不完全マッチまたはミスマッチDNA部位において実質的により少ないオフターゲット効果を誘導する)多数のCas9バリアントおよびそれらを使用する方法が本明細書に記載される。
【0007】
第1の態様において、本発明は、以下の位置:L169、Y450、N497、R661、Q695、Q926、および/またはD1135Eの1、2、3、4、5、6、または7つ全てにおける突然変異を有し、例えば、以下の位置:L169A、Y450、N497、R661、Q695、Q926、D1135Eの1、2、3、4、5、6または7つにおける突然変異を有する配列番号1のアミノ酸配列と少なくとも80%同一である配列ならびに任意選択的に核局在化配列、細胞浸透ペプチド配列、および/または親和性タグの1つ以上を含む単離化膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)タンパク質を提供する。突然変異は、アミノ酸を天然アミノ酸以外のアミノ酸に変更する(例えば、497は、N以外のいずれかである)。好ましい実施形態において、突然変異は、アミノ酸を天然のもの、アルギニンまたはリジン以外の任意のアミノ酸に変化させ;一部の実施形態において、アミノ酸は、アラニンである。
【0008】
一部の実施形態において、バリアントSpCas9タンパク質は、以下:N497、R661、Q695、およびQ926の1、2、3、または4つ全てにおける突然変異、例えば、以下の突然変異:N497A、R661A、Q695A、およびQ926Aの1、2、3、または4つ全てを含む。
【0009】
一部の実施形態において、バリアントSpCas9タンパク質は、Q695および/またはQ926ならびに任意選択的にL169、Y450、N497、R661、およびD1135Eの1、2、3、4、または5つ全てにおける突然変異、例えば、例として、限定されるものではないが、Y450A/Q695A、L169A/Q695A、Q695A/Q926A、Q695A/D1135E、Q926A/D1135E、Y450A/D1135E、L169A/Y450A/Q695A、L169A/Q695A/Q926A、Y450A/Q695A/Q926A、R661A/Q695A/Q926A、N497A/Q695A/Q926A、Y450A/Q695A/D1135E、Y450A/Q926A/D1135E、Q695A/Q926A/D1135E、L169A/Y450A/Q695A/Q926A、L169A/R661A/Q695A/Q926A,Y450A/R661A/Q695A/Q926A、N497A/Q695A/Q926A/D1135E、R661A/Q695A/Q926A/D1135E、およびY450A/Q695A/Q926A/D1135Eを含む。
【0010】
一部の実施形態において、バリアントSpCas9タンパク質は、N14;S15;S55;R63;R78;H160;K163;R165;L169;R403;N407;Y450;M495;N497;K510;Y515;W659;R661;M694;Q695;H698;A728;S730;K775;S777;R778;R780;K782;R783;K789;K797;Q805;N808;K810;R832;Q844;S845;K848;S851;K855;R859;K862;K890;Q920;Q926;K961;S964;K968;K974;R976;N980;H982;K1003;K1014;S1040;N1041;N1044;K1047;K1059;R1060;K1107;E1108;S1109;K1113;R1114;S1116;K1118;D1135;S1136;K1153;K1155;K1158;K1200;Q1221;H1241;Q1254;Q1256;K1289;K1296;K1297;R1298;K1300;H1311;K1325;K1334;T1337および/またはS1216における突然変異を含む。
【0011】
一部の実施形態において、バリアントSpCas9タンパク質は、以下の突然変異:N14A;S15A;S55A;R63A;R78A;R165A;R403A;N407A;N497A;Y450A;K510A;Y515A;R661A;Q695A;S730A;K775A;S777A;R778A;R780A;K782A;R783A;K789A;K797A;Q805A;N808A;K810A;R832A;Q844A;S845A;K848A;S851A;K855A;R859A;K862A;K890A;Q920A;Q926A;K961A;S964A;K968A;K974A;R976A;N980A;H982A;K1003A;K1014A;S1040A;N1041A;N1044A;K1047A;K1059A;R1060A;K1107A;E1108A;S1109A;K1113A;R1114A;S1116A;K1118A;D1135A;S1136A;K1153A;K1155A;K1158A;K1200A;Q1221A;H1241A;Q1254A;Q1256A;K1289A;K1296A;K1297A;R1298A;K1300A;H1311A;K1325A;K1334A;T1337Aおよび/またはS1216Aの1つ以上も含む。一部の実施形態において、バリアントタンパク質は、HF1(N497A/R661A/Q695A/Q926A)+K810A、HF1+K848A、HF1+K855A、HF1+H982A、HF1+K848A/K1003A、HF1+K848A/R1060A、HF1+K855A/K1003A、HF1+K855A/R1060A、HF1+H982A/K1003A、HF1+H982A/R1060A、HF1+K1003A/R1060A、HF1+K810A/K1003A/R1060A、HF1+K848A/K1003A/R1060Aを含む。一部の実施形態において、バリアントタンパク質は、HF1+K848A/K1003A、HF1+K848A/R1060A、HF1+K855A/K1003A、HF1+K855A/R1060A、HF1+K1003A/R1060A、HF1+K848A/K1003A/R1060Aを含む。一部の実施形態において、バリアントタンパク質は、Q695A/Q926A/R780A、Q695A/Q926A/R976A、Q695A/Q926A/H982A、Q695A/Q926A/K855A、Q695A/Q926A/K848A/K1003A、Q695A/Q926A/K848A/K855A、Q695A/Q926A/K848A/H982A、Q695A/Q926A/K1003A/R1060A、Q695A/Q926A/K848A/R1060A、Q695A/Q926A/K855A/H982A、Q695A/Q926A/K855A/K1003A、Q695A/Q926A/K855A/R1060A、Q695A/Q926A/H982A/K1003A、Q695A/Q926A/H982A/R1060A、Q695A/Q926A/K1003A/R1060A、Q695A/Q926A/K810A/K1003A/R1060A、Q695A/Q926A/K848A/K1003A/R1060Aを含む。一部の実施形態において、バリアントは、N497A/R661A/Q695A/Q926A/K810A、N497A/R661A/Q695A/Q926A/K848A、N497A/R661A/Q695A/Q926A/K855A、N497A/R661A/Q695A/Q926A/R780A、N497A/R661A/Q695A/Q926A/K968A、N497A/R661A/Q695A/Q926A/H982A、N497A/R661A/Q695A/Q926A/K1003A、N497A/R661A/Q695A/Q926A/K1014A、N497A/R661A/Q695A/Q926A/K1047A、N497A/R661A/Q695A/Q926A/R1060A、N497A/R661A/Q695A/Q926A/K810A/K968A、N497A/R661A/Q695A/Q926A/K810A/K848A、N497A/R661A/Q695A/Q926A/K810A/K1003A、N497A/R661A/Q695A/Q926A/K810A/R1060A、N497A/R661A/Q695A/Q926A/K848A/K1003A、N497A/R661A/Q695A/Q926A/K848A/R1060A、N497A/R661A/Q695A/Q926A/K855A/K1003A、N497A/R661A/Q695A/Q926A/K855A/R1060A、N497A/R661A/Q695A/Q926A/K968A/K1003A、N497A/R661A/Q695A/Q926A/H982A/K1003A、N497A/R661A/Q695A/Q926A/H982A/R1060A、N497A/R661A/Q695A/Q926A/K1003A/R1060A、N497A/R661A/Q695A/Q926A/K810A/K1003A/R1060A、N497A/R661A/Q695A/Q926A/K848A/K1003A/R1060A、Q695A/Q926A/R780A、Q695A/Q926A/K810A、Q695A/Q926A/R832A、Q695A/Q926A/K848A、Q695A/Q926A/K855A、Q695A/Q926A/K968A、Q695A/Q926A/R976A、Q695A/Q926A/H982A、Q695A/Q926A/K1003A、Q695A/Q926A/K1014A、Q695A/Q926A/K1047A、Q695A/Q926A/R1060A、Q695A/Q926A/K848A/K968A、Q695A/Q926A/R976A、Q695A/Q926A/H982A、Q695A/Q926A/K855A、Q695A/Q926A/K848A/K1003A、Q695A/Q926A/K848A/K855A、Q695A/Q926A/K848A/H982A、Q695A/Q926A/K1003A/R1060A、Q695A/Q926A/R832A/R1060A、Q695A/Q926A/K968A/K1003A、Q695A/Q926A/K968A/R1060A、Q695A/Q926A/K848A/R1060A、Q695A/Q926A/K855A/H982A、Q695A/Q926A/K855A/K1003A、Q695A/Q926A/K855A/R1060A、Q695A/Q926A/H982A/K1003A、Q695A/Q926A/H982A/R1060A、Q695A/Q926A/K1003A/R1060A、Q695A/Q926A/K810A/K1003A/R1060A、Q695A/Q926A/K1003A/K1047A/R1060A、Q695A/Q926A/K968A/K1003A/R1060A、Q695A/Q926A/R832A/K1003A/R1060A、またはQ695A/Q926A/K848A/K1003A/R1060Aを含む。
【0012】
アラニン以外のアミノ酸の突然変異も含まれ、本方法および組成物においてそれを作製および使用することができる。
【0013】
一部の実施形態において、バリアントSpCas9タンパク質は、以下の追加の突然変異:R63A、R66A、R69A、R70A、R71A、Y72A、R74A、R75A、K76A、N77A、R78A、R115A、H160A、K163A、R165A、L169A、R403A、T404A、F405A、N407A、R447A、N497A、I448A、Y450A、S460A、M495A、K510A、Y515A、R661A、M694A、Q695A、H698A、Y1013A、V1015A、R1122A、K1123A、K1124A、K1158A、K1185A、K1200A、S1216A、Q1221A、K1289A、R1298A、K1300A、K1325A、R1333A、K1334A、R1335A、およびT1337Aの1つ以上を含む。
【0014】
一部の実施形態において、バリアントSpCas9タンパク質は、複数の置換突然変異:N497/R661/Q695/Q926(四重バリアント突然変異体);Q695/Q926(二重突然変異体);R661/Q695/Q926およびN497/Q695/Q926(三重突然変異体)を含む。一部の実施形態において、L169、Y450および/またはD1135における追加の置換突然変異をそれらの二重、三重、および四重突然変異体に追加することができ、またはQ695もしくはQ926における置換を担持する単一突然変異体に追加することができる。一部の実施形態において、突然変異体は、野生型アミノ酸に代えてアラニンを有する。一部の実施形態において、突然変異体は、アルギニンまたはリジン(または天然アミノ酸)以外の任意のアミノ酸を有する。
【0015】
一部の実施形態において、バリアントSpCas9タンパク質は、D10、E762、D839、H983、またはD986;およびH840またはN863における突然変異からなる群から選択される、ヌクレアーゼ活性を減少させる1つ以上の突然変異も含む。一部の実施形態において、突然変異は、(i)D10AまたはD10N、および(ii)H840A、H840N、またはH840Yである。
【0016】
一部の実施形態において、SpCas9バリアントは、以下の突然変異のセット:D1135V/R1335Q/T1337R(VQRバリアント);D1135E/R1335Q/T1337R(EQRバリアント);D1135V/G1218R/R1335Q/T1337R(VRQRバリアント);またはD1135V/G1218R/R1335E/T1337R(VRERバリアント)の1つも含み得る。
【0017】
本明細書において、以下の位置:Y211、Y212、W229、Y230、R245、T392、N419、Y651、またはR654の1、2、3、4、5、6つ以上における突然変異を有し、例えば、以下の位置:Y211、Y212、W229、Y230、R245、T392、N419、Y651、またはR654の1、2、3、4、もしくは5、または6つにおける突然変異を有する配列番号のアミノ酸配列と少なくとも80%同一である配列ならびに任意選択的に核局在化配列、細胞浸透ペプチド配列、および/または親和性タグの1つ以上を含む単離黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9)タンパク質も提供される。一部の実施形態において、本明細書に記載のSaCas9バリアントは、以下の位置:Y211、Y212、W229、Y230、R245、T392、N419、Y651および/またはR654の1、2、3、4、5、6つ以上における突然変異を有する配列番号2のアミノ酸配列を含む。一部の実施形態において、バリアントは、以下の突然変異:Y211A、Y212A、W229、Y230A、R245A、T392A、N419A、Y651、および/またはR654Aの1つ以上を含む。


【0018】
一部の実施形態において、バリアントSaCas9タンパク質は、N419および/またはR654における突然変異ならびに任意選択的に追加の突然変異Y211、Y212、W229、Y230、R245およびT392の1、2、3、4つ以上、好ましくは、N419A/R654A、Y211A/R654A、Y211A/Y212A、Y211A/Y230A、Y211A/R245A、Y212A/Y230A、Y212A/R245A、Y230A/R245A、W229A/R654A、Y211A/Y212A/Y230A、Y211A/Y212A/R245A、Y211A/Y212A/Y651A、Y211A/Y230A/R245A、Y211A/Y230A/Y651A、Y211A/R245A/Y651A、Y211A/R245A/R654A、Y211A/R245A/N419A、Y211A/N419A/R654A、Y212A/Y230A/R245A、Y212A/Y230A/Y651A、Y212A/R245A/Y651A、Y230A/R245A/Y651A、R245A/N419A/R654A、T392A/N419A/R654A、R245A/T392A/N419A/R654A、Y211A/R245A/N419A/R654A、W229A/R245A/N419A/R654A、Y211A/R245A/T392A/N419A/R654A、またはY211A/W229A/R245A/N419A/R654Aを含む。
【0019】
一部の実施形態において、バリアントSaCas9タンパク質は、Y211;Y212;W229;Y230;R245;T392;N419;L446;Q488;N492;Q495;R497;N498;R499;Q500;K518;K523;K525;H557;R561;K572;R634;Y651;R654;G655;N658;S662;N667;R686;K692;R694;H700;K751;D786;T787;Y789;T882;K886;N888;889;L909;N985;N986;R991;R1015;N44;R45;R51;R55;R59;R60;R116;R165;N169;R208;R209;Y211;T238;Y239;K248;Y256;R314;N394;Q414;K57;R61;H111;K114;V164;R165;L788;S790;R792;N804;Y868;K870;K878;K879;K881;Y897;R901;および/またはK906における突然変異を含む。
【0020】
一部の実施形態において、バリアントSaCas9タンパク質は、以下の突然変異:Y211A;Y212A;W229A;Y230A;R245A;T392A;N419A;L446A;Q488A;N492A;Q495A;R497A;N498A;R499A;Q500A;K518A;K523A;K525A;H557A;R561A;K572A;R634A;Y651A;R654A;G655A;N658A;S662A;N667A;R686A;K692A;R694A;H700A;K751A;D786A;T787A;Y789A;T882A;K886A;N888A;A889A;L909A;N985A;N986A;R991A;R1015A;N44A;R45A;R51A;R55A;R59A;R60A;R116A;R165A;N169A;R208A;R209A;T238A;Y239A;K248A;Y256A;R314A;N394A;Q414A;K57A;R61A;H111A;K114A;V164A;R165A;L788A;S790A;R792A;N804A;Y868A;K870A;K878A;K879A;K881A;Y897A;R901A;K906Aの1つ以上を含む。
【0021】
一部の実施形態において、バリアントSaCas9タンパク質は、以下の追加の突然変異:Y211A、W229A、Y230A、R245A、T392A、N419A、L446A、Y651A、R654A、D786A、T787A、Y789A、T882A、K886A、N888A、A889A、L909A、N985A、N986A、R991A、R1015A、N44A、R45A、R51A、R55A、R59A、R60A、R116A、R165A、N169A、R208A、R209A、T238A、Y239A、K248A、Y256A、R314A、N394A、Q414A、K57A、R61A、H111A、K114A、V164A、R165A、L788A、S790A、R792A、N804A、Y868A、K870A、K878A、K879A、K881A、Y897A、R901A、K906Aの1つ以上を含む。
【0022】
一部の実施形態において、バリアントSaCas9タンパク質は、複数の置換突然変異:R245/T392/N419/R654およびY221/R245/N419/R654(四重バリアント突然変異体);N419/R654、R245/R654、Y221/R654、およびY221/N419(二重突然変異体);R245/N419/R654、Y211/N419/R654、およびT392/N419/R654(三重突然変異体)を含む。一部の実施形態において、突然変異体は、野生型アミノ酸に代えてアラニンを含有する。
【0023】
一部の実施形態において、バリアントSaCas9タンパク質は、D10、E477、D556、H701、またはD704;およびH557またはN580における突然変異からなる群から選択される、ヌクレアーゼ活性を減少させる1つ以上の突然変異も含む。一部の実施形態において、突然変異は、(i)D10AもしくはD10N、(ii)H557A、H557N、もしくはH557Y、(iii)N580A、および/または(iv)D556Aである。
【0024】
一部の実施形態において、バリアントSaCas9タンパク質は、以下の突然変異:E782K、K929R、N968K、またはR1015Hの1つ以上を含む。具体的には、E782K/N968K/R1015H(KKHバリアント);E782K/K929R/R1015H(KRHバリアント);またはE782K/K929R/N968K/R1015H(KRKHバリアント)である。
【0025】
一部の実施形態において、バリアントCas9タンパク質は、特異性を増加させるための以下の領域の1つ以上の突然変異を含む。
【0026】
【表1】
【0027】
本明細書において、任意選択の介在リンカーにより異種機能ドメインに融合している本明細書に記載の単離バリアントCas9タンパク質を含む融合タンパク質であって、リンカーが融合タンパク質の活性を妨害しない融合タンパク質も提供される。一部の実施形態において、異種機能ドメインは、DNAまたはタンパク質、例えば、クロマチンに対して作用する。一部の実施形態において、異種機能ドメインは転写活性化ドメインである。一部の実施形態において、転写活性化ドメインはVP64またはNF−κB p65からのものである。一部の実施形態において、異種機能ドメインは転写サイレンサーまたは転写抑制ドメインである。一部の実施形態において、転写抑制ドメインは、クルッペル関連ボックス(KRAB)ドメイン、ERFリプレッサードメイン(ERD)、またはmSin3A相互作用ドメイン(SID)である。一部の実施形態において、転写サイレンサーはヘテロクロマチンタンパク質1(HP1)、例えば、HP1αまたはHP1βである。一部の実施形態において、異種機能ドメインは、DNAのメチル化状態を改変する酵素である。一部の実施形態において、DNAのメチル化状態を改変する酵素は、DNAメチルトランスフェラーゼ(DNMT)またはTETタンパク質の全体もしくはジオキシゲナーゼドメイン、例えば、システインリッチ伸長部および7つの高度に保存されるエキソンによりコードされる2OGFeDOドメイン、例えば、アミノ酸1580〜2052を含むTet1触媒ドメイン、アミノ酸1290〜1905を含むTet2およびアミノ酸966〜1678を含むTet3を含む触媒モジュールである。一部の実施形態において、TETタンパク質またはTET由来ジオキシゲナーゼドメインは、TET1からのものである。一部の実施形態において、異種機能ドメインは、ヒストンサブユニットを改変する酵素である。一部の実施形態において、ヒストンサブユニットを改変する酵素は、ヒストンアセチルトランスフェラーゼ(HAT)、ヒストンデアセチラーゼ(HDAC)、ヒストンメチルトランスフェラーゼ(HMT)、またはヒストンデメチラーゼである。一部の実施形態において、異種機能ドメインは生物学的係留物である。一部の実施形態において、生物学的係留物はMS2、Csy4またはラムダNタンパク質である。一部の実施形態において、異種機能ドメインはFokIである。
【0028】
本明細書において、本明細書に記載のバリアントCas9タンパク質をコードする核酸、単離核酸、および任意選択的に本明細書に記載のバリアントCas9タンパク質の発現のための1つ以上の調節ドメインに作動可能に結合されているその単離核酸を含むベクターも提供される。本明細書において、本明細書に記載の核酸を含み、かつ任意選択的に本明細書に記載のバリアントCas9タンパク質を発現する宿主細胞、例えば細菌、酵母、昆虫もしく哺乳動物宿主細胞またはトランスジェニック動物(例えばマウス)も提供される。
【0029】
本明細書において、Cas9バリアントをコードする単離核酸および任意選択的にそのバリアントの発現のための1つ以上の調節ドメインに作動可能に結合されているその単離核酸を含むベクターおよびその核酸を含み、かつ任意選択的にそのバリアントタンパク質を発現する宿主細胞、例えば、哺乳動物宿主細胞も提供される。
【0030】
本明細書において、細胞中で、本明細書に記載のバリアントCas9タンパク質または融合タンパク質、およびゲノム標的部位における最適なヌクレオチド間隔を有する、細胞のゲノムの選択部分に相補的な領域を有する少なくとも1つのガイドRNAを発現させることにより、またはそれらと細胞を接触させることにより、細胞のゲノムまたはエピゲノムを変更する方法も提供される。方法は、細胞を、例えば、単一ベクター中のCas9タンパク質およびガイドRNAをコードする核酸と接触させること;細胞を、例えば、複数のベクター中のCas9タンパク質コードする核酸およびガイドRNAをコードする核酸と接触させること;ならびに細胞を、精製Cas9タンパク質および合成または精製gRNAの複合体と接触させることをとりわけ含み得る。一部の実施形態において、細胞はgRNAまたはバリアントタンパク質/融合タンパク質の一方または両方を安定的に発現し、他のエレメントは細胞中に形質移入または導入される。例えば、細胞は本明細書に記載のバリアントタンパク質または融合タンパク質を安定的に発現し得、方法は、細胞を、合成gRNA、精製組換え産生gRNA、またはgRNAをコードする核酸と接触させることを含み得る。一部の実施形態において、バリアントタンパク質または融合タンパク質は、核局在化配列、細胞浸透ペプチド配列、および/または親和性タグの1つ以上を含む。
【0031】
本明細書において、dsDNAを、本明細書に記載の精製バリアントタンパク質または融合タンパク質およびdsDNA分子の選択部分に相補的な領域を有するガイドRNAと接触させることにより、インビトロで単離dsDNA分子を変更する、例えば、選択的に変更する方法も提供される。
【0032】
特に定義のない限り、本明細書において使用される全ての技術および科学用語は、本発明が属する技術分野の当業者により一般に理解されるものと同一の意味を有する。方法および材料は、本発明における使用のために本明細書に記載され、当技術分野において公知の他の好適な方法および材料を使用することもできる。材料、方法、および実施例は、説明のためのものにすぎず、限定するものではない。本明細書に挙げられる全ての刊行物、特許出願、特許、配列、データベースエントリー、および他の参照文献は、参照により全体として組み込まれる。矛盾する場合、本明細書が定義を含めて優先される。
【0033】
本発明の他の特徴部および利点は、以下の詳細な説明および図面、ならびに特許請求の範囲から明らかである。
【図面の簡単な説明】
【0034】
図1-1】図1A:非特異的DNA接触を形成する残基中の突然変異を担持するSpCas9バリアントの同定および特徴付けである。PDB 4OOGおよび4UN3(出典、それぞれ参照文献31および32)に基づく標的DNA:sgRNA二本鎖の野生型SpCas9認識を示す概略図である。
図1-2】図1B:非特異的DNA接触を形成する残基中の突然変異を担持するSpCas9バリアントの同定および特徴付けである。DNA骨格への水素結合を形成する位置におけるアラニン置換を含有するSpCas9バリアントの特徴付けである。完全マッチsgRNAまたは標的部位に対するミスマッチをコードする4つの他のsgRNAを用いてプログラミングしたヒト細胞EGFP崩壊アッセイ使用して野生型SpCas9およびバリアントを評価した。エラーバーは、n=3についてのs.e.m.を表し;バックグラウンドEGFP損失の平均レベルを赤色点線により表す(このパネルおよびパネルCについて)。 図1C:非特異的DNA接触を形成する残基中の突然変異を担持するSpCas9バリアントの同定および特徴付けである。EGFP崩壊アッセイにより評価された24個の部位にわたる野生型SpCas9およびSpCas9−HF1のオンターゲット活性である。エラーバーは、n=3についてのs.e.m.を表す。
図1-3】図1D:非特異的DNA接触を形成する残基中の突然変異を担持するSpCas9バリアントの同定および特徴付けである。T7E1アッセイにより評価された13個の内在性部位にわたる野生型SpCas9およびSpCas9−HF1のオンターゲット活性である。エラーバーは、n=3についてのs.e.m.を表す。 図1E:非特異的DNA接触を形成する残基中の突然変異を担持するSpCas9バリアントの同定および特徴付けである。SpCas9−HF1のオンターゲット活性と、野生型SpCas9のオンターゲット活性との比(パネルCおよびDからのもの)である。
図2-1】図2A:標準的な標的部位についてのsgRNAを用いた野生型SpCas9およびSpCas9−HF1のゲノムワイド特異性である。GUIDE−seqにより決定された、内在性ヒト遺伝子に標的化される8つのsgRNAを用いた野生型SpCas9およびSpCas9−HF1のオフターゲット部位である。リードカウントは、所与の部位における開裂頻度の尺度を表し;スペーサーまたはPAM内のミスマッチ位置を着色して強調する。
図2-2】図2B:標準的な標的部位についてのsgRNAを用いた野生型SpCas9およびSpCas9−HF1のゲノムワイド特異性である。パネルAにおいて使用された8つのsgRNAからの野生型SpCas9およびSpCas9−HF1についてのGUIDE−seqにより同定されたゲノムワイドオフターゲット部位の総数のまとめである。 図2C:標準的な標的部位についてのsgRNAを用いた野生型SpCas9およびSpCas9−HF1のゲノムワイド特異性である。オンターゲット活性に対するミスマッチ(プロトスペーサーおよびPAM内)の総数に従ってビン化された、8つのsgRNAについての野生型SpCas9およびSpCas9−HF1について同定されたオフターゲット部位である。
図3-1】図3A:GUIDE−seqにより同定されたオフターゲット部位の標的化ディープシーケンシングによるSpCas9−HF1特異性改善のバリデーションである。図2からの6つのsgRNAを用いた野生型SpCas9およびSpCas9−HF1についてのディープシーケンシングにより決定された平均オンターゲット改変パーセントである。エラーバーは、n=3についてのs.e.m.を表す。
図3-2】図3B:GUIDE−seqにより同定されたオフターゲット部位の標的化ディープシーケンシングによるSpCas9−HF1特異性改善のバリデーションである。インデル突然変異を含有するディープシーケンシングされたオンターゲット部位およびGUIDE−seq検出されたオフターゲット部位の割合である。トリプリケート実験を、野生型SpCas9、SpCas9−HF1、および対照条件についてプロットする。x軸下方の黒丸は、挿入突然変異も欠失突然変異も観察されなかったレプリケートを表す。PCRにより増幅することができなかったオフターゲット部位を、アスタリスクとともに赤色文字で示す。プールリードカウントを用いる片側検定のフィッシャーの正確確率検定を使用する仮説検定は、EMX1−1オフターゲット1およびFANCF−3オフターゲット1のみにおけるSpCas9−HF1と対照条件との間の比較についての有意差を見出した(Benjamini−Hochberg法を使用する多重比較について調整後p<0.05)。有意差は、全てのオフターゲット部位における野生型SpCas9とSpCas9−HF1との間、およびRUNX1−1オフターゲット2を除き全てのオフターゲット部位における野生型SpCas9と対照条件との間でも見出された。
図3-3】図3C:GUIDE−seqにより同定されたオフターゲット部位の標的化ディープシーケンシングによるSpCas9−HF1特異性改善のバリデーションである。GUIDE−seqリードカウント(図2Aからのもの)と、野生型SpCas9を用いたオンおよびオフターゲット開裂部位におけるディープシーケンシングにより決定された平均改変パーセントとの間の相関の分散プロットである。
図4-1】図4A:非標準的な反復部位についてのsgRNAを用いた野生型SpCas9およびSpCas9−HF1のゲノムワイド特異性である。多数のオフターゲット部位を開裂することが公知の2つのsgRNA(Fu et al.,Nat Biotechnol 31,822−826(2013);Tsai et al.,Nat Biotechnol 33,187−197(2015))を使用した野生型SpCas9およびSpCas9−HF1のGUIDE−seq特異性プロファイルである。GUIDE−seqリードカウントは、所与の部位における開裂効率の尺度を表し;スペーサーまたはPAM内のミスマッチ位置を着色して強調し;赤色丸は、sgRNA−DNA界面において、示されるバルジ(Lin et al.,Nucleic Acids Res 42,7473−7485(2014))を有する可能性が高い部位を示し;青色丸は、示されるものに対する代替ギャップありアラインメントを有し得る部位を示す(図8参照)。
図4-2】図4B:非標準的な反復部位についてのsgRNAを用いた野生型SpCas9およびSpCas9−HF1のゲノムワイド特異性である。パネルAにおいて使用された2つのsgRNAからの野生型SpCas9およびSpCas9−HF1についてのGUIDE−seqにより同定されたゲノムワイドオフターゲット部位の総数のまとめである。 図4C:非標準的な反復部位についてのsgRNAを用いた野生型SpCas9およびSpCas9−HF1のゲノムワイド特異性である。オンターゲット部位に対するミスマッチ(プロトスペーサーおよびPAM内)の総数に従ってビン化された、VEGFA部位2および3についての野生型SpCas9またはSpCas9−HF1を用いて同定されたオフターゲット部位である。パネルAにおいて赤色丸により標識されるオフターゲット部位は、これらのカウントに含めず;パネルAにおいて青色丸により標識される部位を、ギャップなしアラインメント中のミスマッチの数とともにカウントする。
図5-1】図5A:追加の置換を担持するSpCas9−HF1誘導体の活性である。8つのsgRNAを用いた野生型SpCas9、SpCas9−HF1、およびSpCas9−HF1誘導体バリアントのヒト細胞EGFP崩壊活性である。SpCas9−HF1は、N497A、R661A、Q695、およびQ926A突然変異を保有し;HF2=HF1+D1135E;HF3=HF1+L169A;HF4=HF1+Y450Aである。エラーバーは、n=3についてのs.e.m.を表し;バックグラウンドEGFP損失の平均レベルを赤色点線により表す。 図5B:追加の置換を担持するSpCas9−HF1誘導体の活性である。パネルaからの8つのsgRNAを用いて野生型SpCas9と比較したSpCas9−HF1バリアントを使用した場合のオンターゲット活性のまとめである。中央値および四分位範囲を示し;野生型活性の>70%を示す間隔を緑色で強調する。 図5C:追加の置換を担持するSpCas9−HF1誘導体の活性である。FANCF部位2およびVEGFA部位3オンターゲット部位、ならびにSpCas9−HF1の効果に耐性の図2Aおよび4Aからのオフターゲット部位におけるSpCas9およびHFバリアントによる平均改変パーセントである。改変パーセントはT7E1アッセイにより決定し;全ての実験についてバックグラウンドインデル割合を差し引いた。エラーバーは、n=3についてのs.e.m.を表す。 図5D:追加の置換を担持するSpCas9−HF1誘導体の活性である。オンターゲット活性とオフターゲット活性(パネルCからのもの)との比としてプロットされる、FANCF部位2またはVEGFA部位3sgRNAを用いた野生型SpCas9およびHFバリアントの特異性の比である。
図5-2】図5E:SpCas9−HF1の効果に耐性のオフターゲット部位を有するsgRNAを用いた、SpCas9−HF1、−HF2、および−HF4のゲノムワイド特異性である。パネルFにおけるGUIDE−seq実験についての目的オンターゲット部位における平均GUIDE−seqタグインテグレーション。SpCas9−HF1=N497A/R661A/Q695A/Q926A;HF2=HF1+D1135E;HF4=HF1+Y450Aである。エラーバーは、n=3についてのs.e.m.を表す。
図5-3】図5F:SpCas9−HF1の効果に耐性のオフターゲット部位を有するsgRNAを用いた、SpCas9−HF1、−HF2、および−HF4のゲノムワイド特異性である。FANCF部位2またはVEGFA部位3sgRNAのいずれかを用いたSpCas9−HF1、−HF2、または−HF4のGUIDE−seq同定オフターゲット部位である。リードカウントは、所与の部位における開裂頻度の尺度を表し;スペーサーまたはPAM内のミスマッチ位置を着色して強調する。オフターゲット区別の改善倍率は、SpCas9−HFバリアントについてのオフターゲットリードカウントをSpCas9−HFバリアント間の比較前にオンターゲット部位におけるリードカウントに正規化することにより計算した。
図6-1】図6A:sgRNAおよび標的DNAとのSpCas9相互作用である。SpCas9:sgRNA複合体を、sgRNAと標的DNAとの間の塩基対合とともに説明する概略図である。
図6-2】図6B:sgRNAおよび標的DNAとのSpCas9相互作用である。PDB:4UN3(参照文献32)からの、標的DNAに結合しているSpCas9:sgRNA複合体の構造表示である。標的鎖DNA骨格への水素結合接触を形成する4つの残基を青色で強調し;可視目的のためにHNHドメインを非表示にする。
図7図7A:GUIDE−seq実験に使用された種々のsgRNAを用いた野生型およびSpCas9−HF1のオンターゲット活性比較である。制限断片長多型アッセイにより定量された、図2Aに示されるGUIDE−seq実験についての目的オンターゲット部位における平均GUIDE−seqタグインテグレーションである。エラーバーは、n=3についてのs.e.m.を表す。 図7B:GUIDE−seq実験に使用された種々のsgRNAを用いた野生型およびSpCas9−HF1のオンターゲット活性比較である。T7E1アッセイにより検出された、図2Aに示されるGUIDE−seq実験についての目的オンターゲット部位における平均改変パーセントである。エラーバーは、n=3についてのs.e.m.を表す。 図7C:GUIDE−seq実験に使用された種々のsgRNAを用いた野生型およびSpCas9−HF1のオンターゲット活性比較である。制限断片長多型アッセイにより定量された、図4Aに示されるGUIDE−seq実験についての目的オンターゲット部位における平均GUIDE−seqタグインテグレーションである。エラーバーは、n=3についてのs.e.m.を表す。 図7D:GUIDE−seq実験に使用された種々のsgRNAを用いた野生型およびSpCas9−HF1のオンターゲット活性比較である。T7E1アッセイにより検出された、図4Aに示されるGUIDE−seq実験についての目的オンターゲット部位における平均改変パーセントである。エラーバーは、n=3についてのs.e.m.を表す。
図8】VEGFA部位2オフターゲット部位についての潜在的代替アラインメントである。Geneious(Kearse et al.,Bioinformatics 28,1647−1649(2012))バージョン8.1.6を使用してアラインされた、単一ヌクレオチドギャップを含有するオフターゲット部位として潜在的に認識することができるGUIDE−seq(左)により同定された10個のVEGFA部位2オフターゲット部位(Lin et al.,Nucleic Acids Res 42,7473−7485(2014)))(右)である。
図9】トランケートsgRNA14を用いた野生型SpCas9およびSpCas9−HF1の活性。EGFP中の4つの部位に標的化される全長またはトランケートsgRNAを使用した野生型SpCas9およびSpCas9−HF1のEGFP崩壊活性である。エラーバーは、n=3についてのs.e.m.を表し;対照実験におけるバックグラウンドEGFP損失の平均レベルを赤色点線により表す。
図10】5’−ミスマッチグアニン塩基を担持するsgRNAを用いた野生型SpCas9およびSpCas9−HF1活性である。4つの異なる部位に標的化されるsgRNAを用いた野生型SpCas9およびSpCas9−HF1のEGFP崩壊活性である。それぞれの標的部位について、sgRNAは、マッチ非グアニン5’−塩基または意図的にミスマッチさせた5’−グアニンのいずれかを含有する。
図11】野生型SpCas9およびSpCas9−HF1発現プラスミドの量のタイトレーションである。変動量の野生型およびSpCas9−HF1発現プラスミドによる形質移入からのヒト細胞EGFP崩壊活性。全ての形質移入について、sgRNA含有プラスミドの量を250ngに固定した。別個の部位を標的化する2つのsgRNAを使用し;エラーバーは、n=3についてのs.e.m.を表し;陰性対照におけるバックグラウンドEGFP損失の平均レベルを赤色点線により表す。
図12-1】図12A:SpCas9−HF1のPAM認識特異性の変更である。T7E1アッセイにより定量された、8つのsgRNAを使用したSpCas9−VQR(参照文献15)および改善されたSpCas9−VRQRによるオンターゲット内在性ヒト部位の平均改変パーセントの比較である。両方のバリアントは、NGAN PAMを認識するように遺伝子操作されている。エラーバーは、n=2または3についてのs.e.m.を表す。 図12B:SpCas9−HF1のPAM認識特異性の変更である。8つのsgRNAを使用したSpCas9−VQRおよびSpCas9−VRQRの、それらの−HF1相当物と比較したオンターゲットEGFP崩壊活性である。エラーバーは、n=3についてのs.e.m.を表し;陰性対照におけるバックグラウンドEGFP損失の平均レベルを赤色点線により表す。
図12-2】図12C:SpCas9−HF1のPAM認識特異性の変更である。T7E1アッセイにより定量された8つの内在性ヒト遺伝子部位におけるSpCas9−VQRおよびSpCas9−VRQRによる、それらの−HF1バリアントと比較した平均オンターゲット改変パーセントの比較である。エラーバーは、n=3についてのs.e.m.を表し;NDは、不検出である。 図12D:SpCas9−HF1のPAM認識特異性の変更である。SpCas9−VQRまたはSpCas9−VRQRを使用し、それらの対応する−HF1バリアント(パネルBおよびCからのもの)と比較した場合のオンターゲット活性の変化倍率のまとめである。中央値および四分位範囲を示し;野生型活性の>70%を示す間隔を緑色で強調する。
図13図13A:野生型SpCas9、SpCas9−HF1、および非標的DNA鎖に潜在的に接触し得る位置における1つ以上のアラニン置換を担持する野生型SpCas9誘導体の活性である。EGFP遺伝子中の部位に完全にマッチするsgRNAならびに11および12位において意図的にミスマッチさせたsgRNAを用いるEGFP崩壊アッセイを使用してヌクレアーゼを評価した。ミスマッチ位置に番号付与し、20位は最もPAMから遠位の位置であり;赤色点線は、EGFP崩壊のバックグラウンドレベルを表し;HF1=N497A/R661A/Q695A/Q926A置換を有するSpCas9である。 図13B:野生型SpCas9、SpCas9−HF1、および非標的DNA鎖に潜在的に接触し得る位置における1つ以上のアラニン置換を担持する野生型SpCas9誘導体の活性である。EGFP遺伝子中の部位に完全にマッチするsgRNAならびに9および10位(パネルB)において意図的にミスマッチさせたsgRNAを用いるEGFP崩壊アッセイを使用してヌクレアーゼを評価した。ミスマッチ位置に番号付与し、20位は最もPAMから遠位の位置であり;赤色点線は、EGFP崩壊のバックグラウンドレベルを表し;HF1=N497A/R661A/Q695A/Q926A置換を有するSpCas9である。
図14図14A:野生型SpCas9、SpCas9−HF1、および非標的DNA鎖に潜在的に接触し得る位置における1つ以上のアラニン置換を担持するSpCas9−HF1誘導体の活性である。EGFP遺伝子中の部位に完全にマッチするsgRNAならびに11および12位において意図的にミスマッチさせたsgRNAを用いるEGFP崩壊アッセイを使用してヌクレアーゼを評価した。ミスマッチ位置に番号付与し、20位は最もPAMから遠位の位置であり;赤色点線は、EGFP崩壊のバックグラウンドレベルを表し;HF1=N497A/R661A/Q695A/Q926A置換を有するSpCas9である。 図14B:野生型SpCas9、SpCas9−HF1、および非標的DNA鎖に潜在的に接触し得る位置における1つ以上のアラニン置換を担持するSpCas9−HF1誘導体の活性である。EGFP遺伝子中の部位に完全にマッチするsgRNAならびに9および10位(パネルB)において意図的にミスマッチさせたsgRNAを用いるEGFP崩壊アッセイを使用してヌクレアーゼを評価した。ミスマッチ位置に番号付与し、20位は最もPAMから遠位の位置であり;赤色点線は、EGFP崩壊のバックグラウンドレベルを表し;HF1=N497A/R661A/Q695A/Q926A置換を有するSpCas9である。
図15】野生型SpCas9、SpCas9−HF1、および非標的DNA鎖に潜在的に接触し得る位置における1つ以上のアラニン置換を担持するSpCas9(Q695A/Q926A)誘導体の活性である。EGFP遺伝子中の部位に完全にマッチするsgRNAならびに11および12位において意図的にミスマッチさせたsgRNAを用いるEGFP崩壊アッセイを使用してヌクレアーゼを評価した。ミスマッチ位置に番号付与し、20位は最もPAMから遠位の位置であり;赤色点線は、EGFP崩壊のバックグラウンドレベルを表し;HF1=N497A/R661A/Q695A/Q926A置換を有するSpCas9であり;Dbl=Q695A/Q926A置換を有するSpCas9である。
図16】マッチsgRNAおよびスペーサー中のそれぞれ位置における単一ミスマッチを有するsgRNAを使用した野生型SpCas9、SpCas9−HF1、およびeSpCas9−1.1の活性である。EGFP遺伝子中の部位に完全にマッチするsgRNA(「マッチ」)ならびに示される位置において意図的にミスマッチさせたsgRNAを用いるEGFP崩壊アッセイを使用してヌクレアーゼを評価した。ミスマッチ位置に番号付与し、20位は最もPAMから遠位の位置である。SpCas9−HF1=N497A/R661A/Q695A/Q926Aであり、eSP1.1=K848A/K1003A/R1060Aである。
図17図17A:マッチsgRNAおよびスペーサー中の種々の位置における単一ミスマッチを有するsgRNAを使用した野生型SpCas9およびバリアントの活性である。アラニン置換(標的または非標的DNA鎖に潜在的に接触し得る位置に指向される)の組合せを含有するSpCas9ヌクレアーゼの活性を、EGFP遺伝子中の部位に完全にマッチするsgRNA(「マッチ」)ならびに示されるスペーサー位置において意図的にミスマッチさせたsgRNAを用いるEGFP崩壊アッセイを使用して評価した。ミスマッチ位置に番号付与し、20位は最もPAMから遠位の位置であり;mm=ミスマッチである。WT=野生型であり、Db=Q695A/Q926Aであり、HF1=N497A/R661A/Q695A/Q926Aであり、1.0=K810A/K1003A/R1060Aであり、1.1=K848A/K1003A/R1060Aである。 図17B:マッチsgRNAおよびスペーサー中の種々の位置における単一ミスマッチを有するsgRNAを使用した野生型SpCas9およびバリアントの活性である。マッチオンターゲット部位について残りの全ての考えられる単一ミスマッチのsgRNAを使用して、(a)からのこれらのヌクレアーゼのサブセットを試験した。ミスマッチ位置に番号付与し、20位は最もPAMから遠位の位置であり;mm=ミスマッチである。WT=野生型であり、Db=Q695A/Q926Aであり、HF1=N497A/R661A/Q695A/Q926Aであり、1.0=K810A/K1003A/R1060Aであり、1.1=K848A/K1003A/R1060Aである。
図18】マッチsgRNAおよびスペーサー中の種々の個々の位置におけるミスマッチを有するsgRNAを使用した野生型SpCas9およびバリアントの活性である。アラニン置換(標的または非標的DNA鎖に潜在的に接触し得る位置に指向される)の組合せを含有するSpCas9ヌクレアーゼの活性を、EGFP遺伝子中の部位に完全にマッチするsgRNA(「マッチ」)ならびに示される位置において意図的にミスマッチさせたsgRNAを用いるEGFP崩壊アッセイを使用して評価した。Db=Q695A/Q926Aであり、HF1=N497A/R661A/Q695A/Q926Aである。
図19-1】図19A:マッチsgRNAおよびスペーサー中の種々の個々の位置におけるミスマッチを有するsgRNAを使用した野生型SpCas9およびバリアントの活性である。アラニン置換(標的または非標的DNA鎖に潜在的に接触し得る位置を対象とする)の組合せを含有するSpCas9ヌクレアーゼのオンターゲット活性を、EGFP遺伝子中の部位に完全にマッチする2つのsgRNAを用いるEGFP崩壊アッセイを使用して評価した。Db=Q695A/Q926Aであり、HF1=N497A/R661A/Q695A/Q926Aである。
図19-2】図19B:マッチsgRNAおよびスペーサー中の種々の個々の位置におけるミスマッチを有するsgRNAを使用した野生型SpCas9およびバリアントの活性である。スペーサー配列中の(sgRNA「部位1」の)12、14、16、または18位におけるミスマッチを含有するsgRNAを用いて(a)からのこれらのヌクレアーゼのサブセットを試験して、それらの置換によりミスマッチの不寛容性が付与されたか否かを決定した。Db=Q695A/Q926Aであり、HF1=N497A/R661A/Q695A/Q926Aである。
図20】四重突然変異体構築物中の突然変異の位置間の類似性を説明するSpCas9(上段)およびSaCas9(下段)の構造比較(黄色球状表示で示される)である。DNA骨格に接触する他の残基も桃色球状表示で示す。
図21図21A:野生型SaCas9および1つ以上のアラニン置換を担持するSaCas9誘導体の活性である。SaCas9置換は、標的DNA鎖に潜在的に接触し得る位置を対象とした。EGFP遺伝子中の部位に完全にマッチするsgRNAならびに11および12位において意図的にミスマッチさせたsgRNAを用いるEGFP崩壊アッセイを使用してヌクレアーゼを評価した。ミスマッチ位置に番号付与し、20位は最もPAMから遠位の位置であり;赤色点線は、EGFP崩壊のバックグラウンドレベルを表す。 図21B:野生型SaCas9および1つ以上のアラニン置換を担持するSaCas9誘導体の活性である。SaCas9置換は、PAM特異性に既に影響することが示されている位置を対象とした。EGFP遺伝子中の部位に完全にマッチするsgRNAならびに11および12位において意図的にミスマッチさせたsgRNAを用いるEGFP崩壊アッセイを使用してヌクレアーゼを評価した。ミスマッチ位置に番号付与し、20位は最もPAMから遠位の位置であり;赤色点線は、EGFP崩壊のバックグラウンドレベルを表す。
図22-1】図22A:野生型(WT)SaCas9および標的DNA鎖に潜在的に接触し得る残基における1つ以上のアラニン置換を担持するSaCas9誘導体の活性である。EGFP遺伝子中の部位に完全にマッチするsgRNA(「マッチ」)ならびに19および20位において意図的にミスマッチさせたsgRNAを用いるEGFP崩壊アッセイを使用してヌクレアーゼを評価した。ミスマッチ位置に番号付与し、20位は最もPAMから遠位の位置である。
図22-2】図22B:野生型(WT)SaCas9および標的DNA鎖に潜在的に接触し得る残基における1つ以上のアラニン置換を担持するSaCas9誘導体の活性である。EGFP遺伝子中の部位に完全にマッチするsgRNA(「マッチ」)ならびに19および20位において意図的にミスマッチさせたsgRNAを用いるEGFP崩壊アッセイを使用してヌクレアーゼを評価した。ミスマッチ位置に番号付与し、20位は最もPAMから遠位の位置である。
図23】野生型(WT)SaCas9および標的DNA鎖に潜在的に接触し得る残基におけるアラニン置換の三重組合せを担持するSaCas9バリアントの活性である。EGFP崩壊アッセイを使用してヌクレアーゼを評価した。4つの異なるsgRNAを使用し(マッチ#1〜4)、さらに野生型SaCas9により効率的に使用されることが公知のミスマッチsgRNAを用いて4つの標的部位のそれぞれを試験した。それぞれの部位についてのミスマッチsgRNAを、それぞれのマッチsgRNAの右側に示す(例えば、マッチ部位3についての唯一のミスマッチsgRNAは、mm11および12である)。ミスマッチ位置に番号付与し、21位は最もPAMから遠位の位置であり;mmは、ミスマッチである。
図24図24A:野生型(WT)SaCas9および標的DNA鎖に潜在的に接触し得る残基における1つ以上のアラニン置換を担持するSaCas9誘導体の活性である。二重組合せ置換を担持するSaCas9バリアントを、マッチおよび単一ミスマッチ内在性ヒト遺伝子標的部位に対してT7E1アッセイを使用して評価した。マッチ「オンターゲット」部位を、Kleinstiver et al.,Nature Biotechnology 2015からのそれらの遺伝子標的部位のsgRNA番号に従って命名する。ミスマッチsgRNAに番号付与し、ミスマッチは最もPAMから遠位の位置の21位において生じ;ミスマッチsgRNAは、ミスマッチsgRNAの左側に列記されるマッチオンターゲット部位に由来する。 図24B:野生型(WT)SaCas9および標的DNA鎖に潜在的に接触し得る残基における1つ以上のアラニン置換を担持するSaCas9誘導体の活性である。三重組合せ置換を担持するSaCas9バリアントを、マッチおよび単一ミスマッチ内在性ヒト遺伝子標的部位に対してT7E1アッセイを使用して評価した。マッチ「オンターゲット」部位を、Kleinstiver et al.,Nature Biotechnology 2015からのそれらの遺伝子標的部位のsgRNA番号に従って命名する。ミスマッチsgRNAに番号付与し、ミスマッチは最もPAMから遠位の位置の21位において生じ;ミスマッチsgRNAは、ミスマッチsgRNAの左側に列記されるマッチオンターゲット部位に由来する。
【発明を実施するための形態】
【0035】
CRISPR−Cas9ヌクレアーゼの制限は、不完全にマッチする標的部位における不所望な「オフターゲット」突然変異を誘導するそれらの潜在性であり(例えば、Tsai et al.,Nat Biotechnol.2015参照)、ある場合には頻度が目的オンターゲット部位において観察されるものと同等である(Fu et al.,Nat Biotechnol.2013)。CRISPR−Cas9ヌクレアーゼを用いる従来の研究は、ガイドRNA(gRNA)と標的部位のスペーサー領域との間の配列特異的相互作用の数を低減させることにより、ヒト細胞中の開裂のオフターゲット部位における突然変異効果を低減させ得ることを示唆している(Fu et al.,Nat Biotechnol.2014)。
【0036】
これは、gRNAをその5’末端において2または3ntだけトランケートすることにより早期に達成され、この増加した特異性の機序は、gRNA/Cas9複合体の相互作用エネルギーの減少であり、その結果、それはオンターゲット部位を開裂するためにちょうど十分なエネルギーとバランスを取り、それにより標的DNA部位中のミスマッチに起因するエネルギーペナルティーが存在すると想定されるオフターゲット部位を開裂するために十分なエネルギーを有する可能性が低くなることが仮定された(国際公開第2015/099850号パンフレット)。
【0037】
SpCas9のオフターゲット効果(ガイドRNAのための目的標的部位を有する不完全マッチまたはミスマッチのDNA部位におけるもの)は、その標的DNA部位との非特異的相互作用を減少させることにより最小化し得ることが仮定された。SpCas9−sgRNA複合体は、NGG PAM配列(SpCas9により認識される)(Deltcheva,E.et al.Nature 471,602−607(2011);Jinek,M.et al.Science 337,816−821(2012);Jiang,W.,et al.,Nat Biotechnol 31,233−239(2013);Sternberg,S.H.,et al.,Nature 507,62−67(2014))および隣接20bpプロトスペーサー配列(sgRNAの5’末端に相補的である)(Jinek,M.et al.Science 337,816−821(2012);Jinek,M.et al.Elife 2,e00471(2013);Mali,P.et al.,Science 339,823−826(2013);Cong,L.et al.,Science 339,819−823(2013))から構成される標的部位を開裂する。SpCas9−sgRNA複合体は、その目的標的DNA部位の認識に必要とされるよりも大きいエネルギーを有し得、それにより、ミスマッチオフターゲット部位の開裂が可能となることが既に理論付けられた(Fu,Y.,et al.,Nat Biotechnol 32,279−284(2014))。この特性は、適応細菌免疫におけるCas9の目的の役割に有利であり得ることが想定することができ、突然変異し得る外来配列を開裂する能力をそれに付与する。この過剰なエネルギーモデルは、SpCas9濃度を減少させることにより(Hsu,P.D.et al.Nat Biotechnol 31,827−832(2013);Pattanayak,V.et al.Nat Biotechnol 31,839−843(2013))、またはsgRNAの相補性長さを低減させることにより(Fu,Y.,et al.,Nat Biotechnol 32,279−284(2014)、オフターゲット効果を低減させることができる(しかし、排除することはできない)ことを実証する従来の研究によっても支持されているが、この効果についての他の解釈も提案されている(Josephs,E.A.et al.Nucleic Acids Res 43,8924−8941(2015);Sternberg,S.H.,et al.Nature 527,110−113(2015);Kiani,S.et al.Nat Methods 12,1051−1054(2015)))。構造データは、SpCas9−sgRNA−標的DNA複合体を、4つのSpCas9残基(N497、R661、Q695、Q926)により作製される、標的DNA鎖のリン酸骨格への直接的な水素結合を含むいくつかのSpCas9媒介DNA接触により安定化し得ることを示唆する(Nishimasu,H.et al.Cell 156,935−949(2014);Anders,C.,et al.Nature 513,569−573(2014))(図1aならびに図6aおよび6b)。本発明者らは、これらの接触の1つ以上の崩壊が、ロバストなオンターゲット活性を保持するためにちょうど十分であるが、ミスマッチオフターゲット部位を開裂する能力が縮小するレベルにおいてSpCas9−sgRNA複合体のエネルギー的なバランスを取り得ることを想定した。
【0038】
本明細書に記載のとおり、Cas9タンパク質は、理論的には、DNAについてのCas9の結合親和性を低減させることにより、増加した特異性を示すように遺伝子操作することができる。広く使用される化膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)のいくつかのバリアントは、構造情報、細菌選択ベース指向進化、およびコンビナトリアル設計を使用してDNA骨格上のリン酸と相互作用することが予測することができるSpCas9中の種々の残基中に個々のアラニン置換を導入することにより遺伝子操作された。ロバストな大腸菌(E.coli)ベーススクリーニングアッセイを使用してバリアントを細胞活性についてさらに試験してそれらのバリアントの細胞活性を評価し;この細菌系において、細胞生存率は、毒性ギラーゼ毒素ccdBについての遺伝子ならびにgRNAおよびSpCas9により標的化される23塩基対配列を含有する選択プラスミドの開裂および後続の崩壊に依存し、活性の保持または損失と関連する残基の同定をもたらした。さらに、ヒト細胞中で改善された標的特異性を示す別のSpCas9バリアントを同定および特徴付けした。
【0039】
さらに、細菌細胞ベース系において評価されたSpCas9の単一アラニン置換突然変異体の活性は、50〜100%の生存割合が通常ロバストな開裂を示す一方、0%の生存率は、酵素が機能的に減衰したことを示すことを示した。次いで、R63A、R66A、R69A、R70A、R71A、Y72A、R74A、R75A、K76A、N77A、R78A、R115A、H160A、K163A、R165A、L169A、R403A,T404A、F405A、N407A、R447A、N497A、I448A、Y450A、S460A、M495A、K510A、Y515A、R661A、M694A、Q695A、H698A、Y1013A、V1015A、R1122A、K1123A、K1124A、K1158A、K1185A、K1200A、S1216A、Q1221A、K1289A、R1298A、K1300A、K1325A、R1333A、K1334A、R1335A、およびT1337Aを含むSpCas9の追加の突然変異を細菌中でアッセイした。細菌中で<5%の生存率を有する2つの突然変異体(R69AおよびF405A)を除き、それらの追加の単一突然変異の全てがSpCas9のオンターゲット活性に対する効果をほとんど有さないと考えられた(細菌スクリーンにおいて>70%の生存率)。
【0040】
細菌スクリーンにおいて同定されたCas9のバリアントがヒト細胞中で効率的に機能したか否かをさらに決定するため、ヒトU2OS細胞ベースEGFP崩壊アッセイを使用して種々のアラニン置換Cas9突然変異体を試験した。このアッセイにおいて、単一のインテグレートされた構成的に発現されるEGFP遺伝子のコード配列中の標的部位の良好な開裂は、フローサイトメトリーにより定量的に評価されたインデル突然変異の誘導およびEGFP活性の崩壊をもたらした(例えば、Reyon et al.,Nat Biotechnol.2012 May;30(5):460−5参照)。
【0041】
これらの実験は、細菌細胞ベースアッセイにおいて得られた結果が、ヒト細胞中でヌクレアーゼ活性と十分に相関することを示し、それらの遺伝子操作方針を他の種および異なる細胞からのCas9に拡張し得ることを示唆する。したがって、これらの知見は、本明細書において「バリアント」または「そのバリアント」と集合的に称されるSpCas9およびSaCas9バリアントについての支持を提供する。
【0042】
本明細書に記載のバリアントの全ては、例えば、単純な部位特異的突然変異誘発により既存の広く使用されるベクター中に急速に取り込むことができ、それらは少数の突然変異を要求するにすぎないため、バリアントは、SpCas9プラットフォームの既に記載された他の改善(例えば、トランケートsgRNA(Tsai et al.,Nat Biotechnol 33,187−197(2015);Fu et al.,Nat Biotechnol 32,279−284(2014))、ニッカーゼ突然変異(Mali et al.,Nat Biotechnol 31,833−838(2013);Ran et al.,Cell 154,1380−1389(2013))、FokI−dCas9融合(Guilinger et al.,Nat Biotechnol 32,577−582(2014);Tsai et al.,Nat Biotechnol 32,569−576(2014);国際公開第2014144288号パンフレット);および変更PAM特異性を有する遺伝子操作CRISPR−Cas9ヌクレアーゼ(Kleinstiver et al.,Nature.2015 Jul 23;523(7561):481−5)とともに機能するはずである。
【0043】
したがって、本明細書において、Cas9バリアント、例として、SpCas9バリアントが提供される。SpCas9野生型配列は、以下のとおりである。
【化1】
【化2】
【0044】
本明細書に記載のSpCas9バリアントは、以下の位置:N497、R661、Q695、Q926(またはそれらと類似する位置)の1つ以上における突然変異(すなわち、天然アミノ酸の、異なるアミノ酸、例えば、アラニン、グリシン、またはセリンとの置き換え)を有する配列番号1のアミノ酸配列を含み得る。一部の実施形態において、SpCas9は、本明細書に記載の突然変位に加えて、配列番号1のアミノ酸配列と少なくとも80%、例えば、少なくとも85%、90%、または95%同一であり、例えば、保存的突然変異により置き換えられている、例えば、配列番号1の残基の最大5%、10%、15%、または20%における差異を有する。好ましい実施形態において、バリアントは、親の所望の活性、例えば、ヌクレアーゼ活性(親がニッカーゼまたはデッドCas9である場合を除外する)、ならびに/またはガイドRNAおよび標的DNA)と相互作用する能力を保持する。
【0045】
2つの核酸配列の同一性パーセントを決定するため、最適な比較目的のために配列をアラインする(例えば、最適なアラインメントのため、ギャップを第1および第2のアミノ酸または核酸配列の一方または両方の中に導入することができ、比較目的のために、非相同配列を無視することができる)。比較目的のためにアラインされる参照配列の長さは、参照配列の長さの少なくとも80%であり、一部の実施形態において、少なくとも90%または100%である。次いで、対応するアミノ酸位置またはヌクレオチド位置におけるヌクレオチドを比較する。第1の配列中のある位置が、第2の配列中の対応する位置と同一のヌクレオチドにより占有される場合、その分子はその位置において同一である(本明細書において使用される核酸「同一性」は、核酸「相同性」に相当する)。2つの配列間の同一性パーセントは、それらの配列により共有される同一位置の数の関数であり、それら2つの配列の最適なアラインメントのために導入が必要とされるギャップの数、およびそれぞれのギャップの長さを考慮する。2つのポリペプチドまたは核酸配列間の同一性パーセントは、当技術分野の技能の範囲内の種々の手段で、例えば、公的に入手可能なコンピュータソフトウェア、例えば、Smith Waterman Alignment(Smith,T.F.and M.S.Waterman(1981)J Mol Biol 147:195−7);GeneMatcher Plus(商標)に組み込まれた“BestFit”(Smith and Waterman,Advances in Applied Mathematics,482−489(1981))、Schwarz and Dayhof(1979)Atlas of Protein Sequence and Structure,Dayhof,M.O.,Ed,pp 353−358;BLASTプログラム(Basic Local Alignment Search Tool;(Altschul,S.F.,W.Gish,et al.(1990)J Mol Biol 215:403−10)、BLAST−2、BLAST−P、BLAST−N、BLAST−X、WU−BLAST−2、ALIGN、ALIGN−2、CLUSTAL、またはMegalign(DNASTAR)ソフトウェアを使用して決定する。さらに、当業者は、アラインメントを計測するための適切なパラメータ、例として、比較される配列の長さにわたり最大アラインメントを達成するために必要される任意のアルゴリズムを決定することができる。一般に、タンパク質または核酸について、比較の長さは、全長以下の任意の長さ(例えば、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、または100%)であり得る。本組成物および方法の目的のため、配列の全長の少なくとも80%がアラインされる。
【0046】
本発明の目的のため、2つの配列間の配列の比較および同一性パーセントの決定は、Blossum 62スコアリング行列をギャップペナルティ12、ギャップ伸長ペナルティ4、およびフレームシフトギャップペナルティ5で使用して達成することができる。
【0047】
保存的置換としては、典型的には、以下の群:グリシン、アラニン;バリン、イソロイシン、ロイシン;アスパラギン酸、グルタミン酸、アスパラギン、グルタミン;セリン、トレオニン;リジン、アルギニン;およびフェニルアラニン、チロシン内の置換が挙げられる。
【0048】
一部の実施形態において、SpCas9バリアントは、以下の突然変異のセット:N497A/R661A/Q695/Q926A(四重アラニン突然変異体);Q695A/Q926A(二重アラニン突然変異体);R661A/Q695A/Q926AおよびN497A/Q695A/Q926A(三重アラニン突然変異体)の1つを含む。一部の実施形態において、L169および/またはY450における追加の置換突然変異をそれらの二重、三重、および四重突然変異体に追加することができ、またはQ695もしくはQ926における置換を担持する単一突然変異体に追加することができる。一部の実施形態において、突然変異体は、野生型アミノ酸に代えてアラニンを有する。一部の実施形態において、突然変異体は、アルギニンまたはリジン(または天然アミノ酸)以外の任意のアミノ酸を有する。
【0049】
一部の実施形態において、SpCas9バリアントは、タンパク質のヌクレアーゼ部分を触媒的に不活性にするため、Cas9のヌクレアーゼ活性を低減させ、または破壊する以下の突然変異:D10、E762、D839、H983、またはD986およびH840またはN863の1つ、例えば、D10A/D10NおよびH840A/H840N/H840Yも含み;それらの位置における置換は、アラニン(Nishimasu al.,Cell 156,935−949(2014)におけるとおり)、または他の残基、例えば、グルタミン、アスパラギン、チロシン、セリン、またはアスパラギン酸、例えば、E762Q、H983N、H983Y、D986N、N863D、N863S、またはN863Hであり得る(国際公開第2014/152432号パンフレット参照)。一部の実施形態において、バリアントは、D10AまたはH840A(一本鎖ニッカーゼを作出する)における突然変異、またはD10AおよびH840A(ヌクレアーゼ活性を解消する;この突然変異体は、デッドCas9またはdCas9として公知である)における突然変異を含む。
【0050】
SpCas9N497A/R661A/Q695A/R926A突然変異は、黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9)中の類似残基を有し;例えば、図20を参照されたい。DNAまたはRNA骨格に接触する残基の突然変異は、SpCas9について観察されたとおり、SaCas9の特異性を増加させると予測される。したがって、本明細書においてSaCas9バリアントも提供される。
【0051】
SaCas9野生型配列は、以下のとおりである。
【化3】
【0052】
本明細書に記載のSaCas9バリアントは、以下の位置:Y211、W229、R245、T392、N419、および/またはR654の1、2、3、4、5、または6つ全てにおける突然変異を有する配列番号2のアミノ酸配列を含み、例えば、以下の位置:Y211、W229、R245、T392、N419、および/またはR654の1、2、3、4、5または6つにおける突然変異を有する配列番号2のアミノ酸配列と少なくとも80%同一である配列を含む。
【0053】
一部の実施形態において、バリアントSaCas9タンパク質は、以下の突然変異:Y211A;W229A;Y230A;R245A;T392A;N419A;L446A;Y651A;R654A;D786A;T787A;Y789A;T882A;K886A;N888A;A889A;L909A;N985A;N986A;R991A;R1015A;N44A;R45A;R51A;R55A;R59A;R60A;R116A;R165A;N169A;R208A;R209A;Y211A;T238A;Y239A;K248A;Y256A;R314A;N394A;Q414A;K57A;R61A;H111A;K114A;V164A;R165A;L788A;S790A;R792A;N804A;Y868A;K870A;K878A;K879A;K881A;Y897A;R901A;K906Aの1つ以上も含む。
【0054】
一部の実施形態において、バリアントSaCas9タンパク質は、以下の追加の突然変異:Y211A、W229A、Y230A、R245A、T392A、N419A、L446A、Y651A、R654A、D786A、T787A、Y789A、T882A、K886A、N888A、A889A、L909A、N985A、N986A、R991A、R1015A、N44A、R45A、R51A、R55A、R59A、R60A、R116A、R165A、N169A、R208A、R209A、Y211A、T238A、Y239A、K248A、Y256A、R314A、N394A、Q414A、K57A、R61A、H111A、K114A、V164A、R165A、L788A、S790A、R792A、N804A、Y868A、K870A、K878A、K879A、K881A、Y897A、R901A、K906Aの1つ以上を含む。
【0055】
一部の実施形態において、バリアントSaCas9タンパク質は、複数の置換突然変異:R245/T392/N419/R654およびY221/R245/N419/R654(四重バリアント突然変異体);N419/R654、R245/R654、Y221/R654、およびY221/N419(二重突然変異体);R245/N419/R654、Y211/N419/R654、およびT392/N419/R654(三重突然変異体)を含む。一部の実施形態において、突然変異体は、野生型アミノ酸に代えてアラニンを含有する。
【0056】
一部の実施形態において、バリアントSaCas9タンパク質は、E782K、K929R、N968K、および/またはR1015Hにおける突然変異も含む。例えば、KKHバリアント(E782K/N968K/R1015H)、KRHバリアント(E782K/K929R/R1015H)、またはKRKHバリアント(E782K/K929R/N968K/R1015H)]である。
【0057】
一部の実施形態において、バリアントSaCas9タンパク質は、D10、E477、D556、H701、またはD704;およびH557またはN580における突然変異からなる群から選択される、ヌクレアーゼ活性を減少させる1つ以上の突然変異も含む。
【0058】
一部の実施形態において、突然変異は、(i)D10AもしくはD10N、(ii)H557A、H557N、またはH557Y、(iii)N580A、および/または(iv)D556Aである。
【0059】
本明細書において、任意選択的に、バリアントタンパク質の発現のための1つ以上の調節ドメインに作動可能に結合されているCas9バリアントをコードする単離核酸、単離核酸を含むベクター、ならびにその核酸を含み、および任意選択的にバリアントタンパク質を発現する宿主細胞、例えば、哺乳動物宿主細胞も提供される。
【0060】
本明細書に記載のバリアントは、細胞のゲノムを変更するために使用することができ;本方法は、一般に、細胞中でバリアントタンパク質を、細胞のゲノムの選択部分に相補的な領域を有するガイドRNAとともに発現させることを含む。細胞のゲノムを選択的に変更する方法は、当技術分野において公知であり、例えば、米国特許第8,993,233号明細書;米国特許出願公開第20140186958号明細書;米国特許第9,023,649号明細書;国際公開第2014/099744号パンフレット;国際公開第2014/089290号パンフレット;国際公開第2014/144592号パンフレット;国際公開第144288号パンフレット;国際公開第2014/204578号パンフレット;国際公開第2014/152432号パンフレット;国際公開第2115/099850号パンフレット;米国特許第8,697,359号明細書;米国特許出願公開第20160024529号明細書;米国特許出願公開第20160024524号明細書;米国特許出願公開第20160024523号明細書;米国特許出願公開第20160024510号明細書;米国特許出願公開第20160017366号明細書;米国特許出願公開第20160017301号明細書;米国特許出願公開第20150376652号明細書;米国特許出願公開第20150356239号明細書;米国特許出願公開第20150315576号明細書;米国特許出願公開第20150291965号明細書;米国特許出願公開第20150252358号明細書;米国特許出願公開第20150247150号明細書;米国特許出願公開第20150232883号明細書;米国特許出願公開第20150232882号明細書;米国特許出願公開第20150203872号明細書;米国特許出願公開第20150191744号明細書;米国特許出願公開第20150184139号明細書;米国特許出願公開第20150176064号明細書;米国特許出願公開第20150167000号明細書;米国特許出願公開第20150166969号明細書;米国特許出願公開第20150159175号明細書;米国特許出願公開第20150159174号明細書;米国特許出願公開第20150093473号明細書;米国特許出願公開第20150079681号明細書;米国特許出願公開第20150067922号明細書;米国特許出願公開第20150056629号明細書;米国特許出願公開第20150044772号明細書;米国特許出願公開第20150024500号明細書;米国特許出願公開第20150024499号明細書;米国特許出願公開第20150020223号明細書;米国特許出願公開第20140356867号明細書;米国特許出願公開第20140295557号明細書;米国特許出願公開第20140273235号明細書;米国特許出願公開第20140273226号明細書;米国特許出願公開第20140273037号明細書;米国特許出願公開第20140189896号明細書;米国特許出願公開第20140113376号明細書;米国特許出願公開第20140093941号明細書;米国特許出願公開第20130330778号明細書;米国特許出願公開第20130288251号明細書;米国特許出願公開第20120088676号明細書;米国特許出願公開第20110300538号明細書;米国特許出願公開第20110236530号明細書;米国特許出願公開第20110217739号明細書;米国特許出願公開第20110002889号明細書;米国特許出願公開第20100076057号明細書;米国特許出願公開第20110189776号明細書;米国特許出願公開第20110223638号明細書;米国特許出願公開第20130130248号明細書;米国特許出願公開第20150050699号明細書;米国特許出願公開第20150071899号明細書;米国特許出願公開第20150050699号明細書;米国特許出願公開第20150045546号明細書;米国特許出願公開第20150031134号明細書;米国特許出願公開第20150024500号明細書;米国特許出願公開第20140377868号明細書;米国特許出願公開第20140357530号明細書;国際公開第2008/108989号パンフレット;国際公開第2010/054108号パンフレット;国際公開第2012/164565号パンフレット;国際公開第2013/098244号パンフレット;国際公開第2013/176772号パンフレット;国際公開第20150071899号パンフレット;米国特許出願公開第20140349400号明細書;米国特許出願公開第20140335620号明細書;米国特許出願公開第20140335063号明細書;米国特許出願公開第20140315985号明細書;米国特許出願公開第20140310830号明細書;米国特許出願公開第20140310828号明細書;米国特許出願公開第20140309487号明細書;米国特許出願公開第20140304853号明細書;米国特許出願公開第20140298547号明細書;米国特許出願公開第20140295556号明細書;米国特許出願公開第20140294773号明細書;米国特許出願公開第20140287938号明細書;米国特許出願公開第20140273234号明細書;米国特許出願公開第20140273232号明細書;米国特許出願公開第20140273231号明細書;米国特許出願公開第20140273230号明細書;米国特許出願公開第20140271987号明細書;米国特許出願公開第20140256046号明細書;米国特許出願公開第20140248702号明細書;米国特許出願公開第20140242702号明細書;米国特許出願公開第20140242700号明細書;米国特許出願公開第20140242699号明細書;米国特許出願公開第20140242664号明細書;米国特許出願公開第20140234972号明細書;米国特許出願公開第20140227787号明細書;米国特許出願公開第20140212869号明細書;米国特許出願公開第20140201857号明細書;米国特許出願公開第20140199767号明細書;米国特許出願公開第20140189896号明細書;米国特許出願公開第20140186958号明細書;米国特許出願公開第20140186919号明細書;米国特許出願公開第20140186843号明細書;米国特許出願公開第20140179770号明細書;米国特許出願公開第20140179006号明細書;米国特許出願公開第20140170753号明細書;Makarova et al.,“Evolution and classification of the CRISPR−Cas systems”9(6)Nature Reviews Microbiology 467−477(1−23)(Jun.2011);Wiedenheft et al.,“RNA−guided genetic silencing systems in bacteria and archaea”482 Nature 331−338(Feb.16,2012);Gasiunas et al.,“Cas9−crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria”109(39)Proceedings of the National Academy of Sciences USA E2579−E2586(Sep.4,2012);Jinek et al.,“A Programmable Dual−RNA−Guided DNA Endonuclease in Adaptive Bacterial Immunity”337 Science 816−821(Aug.17,2012);Carroll,“A CRISPR Approach to Gene Targeting”20(9)Molecular Therapy 1658−1660(Sep.2012);2012年5月25日に出願された米国特許出願第61/652,086号明細書;Al−Attar et al.,Clustered Regularly Interspaced Short Palindromic Repeats(CRISPRs):The Hallmark of an Ingenious Antiviral Defense Mechanism in Prokaryotes,Biol Chem.(2011)vol.392,Issue 4,pp.277−289;Hale et al.,Essential Features and Rational Design of CRISPR RNAs That Function With the Cas RAMP Module Complex to Cleave RNAs,Molecular Cell,(2012)vol.45,Issue 3,292−302を参照されたい。
【0061】
本明細書に記載のバリアントタンパク質は、上記参照文献に記載のCas9タンパク質のいずれかに代えてもしくはそれらに加えて、またはそれらに記載の突然変異との組合せで使用することができる。さらに、本明細書に記載のバリアントは、当技術分野において公知の野生型Cas9または他のCas9突然変異(例えば、上記のdCas9またはCas9ニッカーゼ)に代えて融合タンパク質、例えば、米国特許第8,993,233号明細書;米国特許出願公開第20140186958号明細書;米国特許第9,023,649号明細書;国際公開第2014/099744号パンフレット;国際公開第2014/089290号パンフレット;国際公開第2014/144592号パンフレット;国際公開第144288号パンフレット;国際公開第2014/204578号パンフレット;国際公開第2014/152432号パンフレット;国際公開第2115/099850号パンフレット;米国特許第8,697,359号明細書;米国特許出願公開第2010/0076057号明細書;米国特許出願公開第2011/0189776号明細書;米国特許出願公開第2011/0223638号明細書;米国特許出願公開第2013/0130248号明細書;国際公開第2008/108989号パンフレット;国際公開第2010/054108号パンフレット;国際公開第2012/164565号パンフレット;国際公開第2013/098244号パンフレット;国際公開第2013/176772号パンフレット;米国特許出願公開第20150050699号明細書;米国特許出願公開第20150071899号明細書、および国際公開第2014/124284号パンフレットに記載の異種機能ドメインを有する融合タンパク質中で使用することができる。例えば、バリアント、好ましくは、1つ以上のヌクレアーゼ低減、変更または殺傷突然変異を含むバリアントをCas9のNまたはC末端上で、転写活性化ドメインまたは他の異種機能ドメイン(例えば、転写リプレッサー(例えば、KRAB、ERD、SIDなど、例えば、ets2リプレッサー因子(ERF)リプレッサードメイン(ERD)のアミノ酸473〜530、KOX1のKRABドメインのアミノ酸1〜97、またはMad mSIN3相互作用ドメイン(SID)のアミノ酸1〜36;Beerli et al.,PNAS USA 95:14628−14633(1998)参照)またはサイレンサー、例えば、ヘテロクロマチンタンパク質1(HP1、swi6としても公知)、例えば、HP1αまたはHP1β;固定RNA結合配列に融合している長鎖非コードRNA(lncRNA)をリクルートし得るタンパク質またはペプチド、例えば、MS2コートタンパク質、エンドリボヌクレアーゼCsy4、またはラムダNタンパク質により結合されるものに融合させることができ;当技術分野において公知のDNAのメチル化状態を改変する酵素(例えば、DNAメチルトランスフェラーゼ(DNMT)またはTETタンパク質);またはヒストンサブユニットを改変する酵素(例えば、ヒストンアセチルトランスフェラーゼ(HAT)、ヒストンデアセチラーゼ(HDAC)、ヒストンメチルトランスフェラーゼ(例えば、リジンまたはアルギニン残基のメチル化のため)またはヒストンデメチラーゼ(例えば、リジンまたはアルギニン残基の脱メチル化のため))を使用することもできる。多数のこのようなドメインの配列、例えば、DNA中のメチル化シトシンのヒドロキシル化を触媒するドメインが当技術分野において公知である。例示的なタンパク質としては、テンイレブントランスロケーション(Ten−Eleven−Translocation)(TET)1〜3ファミリー、DNA中の5−メチルシトシン(5−mC)を5−ヒドロキシメチルシトシン(5−hmC)に変換する酵素が挙げられる。
【0062】
ヒトTET1〜3配列は当技術分野において公知であり、それを以下の表に示す。
【0063】
【表2】
【0064】
一部の実施形態において、触媒ドメインの全長配列の全部または一部、例えば、システインリッチ伸長部および7つの高度に保存されるエキソンによりコードされる2OGFeDOドメイン、例えば、アミノ酸1580〜2052を含むTet1触媒ドメイン、アミノ酸1290〜1905を含むTet2、およびアミノ酸966〜1678を含むTet3を含む触媒モジュールを含めることができる。3つ全てのTetタンパク質中のキー触媒残基を説明するアラインメント、および全長配列についてのその補助材料について(ftpサイトftp.ncbi.nih.gov/pub/aravind/DONS/supplementary_material_DONS.htmlで入手可能)は、例えば、Iyer et al.,Cell Cycle.2009 Jun 1;8(11):1698−710.Epub 2009 Jun 27の図1を参照されたい(例えば、seq 2c参照);一部の実施形態において、配列は、Tet1のアミノ酸1418〜2136またはTet2/3中の対応領域を含む。
【0065】
他の触媒モジュールは、Iyer et al.,2009において同定されたタンパク質からのものであり得る。
【0066】
一部の実施形態において、異種機能ドメインは、生物学的係留物であり、MS2コートタンパク質、エンドリボヌクレアーゼCsy4、またはラムダNタンパク質の全部または一部(例えば、それからのDNA結合ドメイン)を含む。これらのタンパク質は、特異的ステム−ループ構造を含有するRNA分子をdCas9 gRNA標的化配列により規定される場所にリクルートするための使用することができる。例えば、MS2コートタンパク質、エンドリボヌクレアーゼCsy4、またはラムダNに融合しているdCas9バリアントは、Csy4、MS2またはラムダN結合配列に結合している長鎖非コードRNA(lncRNA)、例えば、XISTまたはHOTAIRをリクルートするために使用することができる;例えば、Keryer−Bibens et al.,Biol.Cell 100:125−138(2008)を参照されたい。あるいは、Csy4、MS2またはラムダNタンパク質結合配列は、例えば、Keryer−Bibens et al.,前掲に記載のとおり、別のタンパク質に結合させることができ、本明細書に記載の方法および組成物を使用してタンパク質をdCas9バリアント結合部位に標的化させることができる。一部の実施形態において、Csy4は、触媒的に不活性である。一部の実施形態において、Cas9バリアント、好ましくは、dCas9バリアントは、米国特許第8,993,233号明細書;米国特許出願公開第20140186958号明細書;米国特許第9,023,649号明細書;国際公開第2014/099744号パンフレット;国際公開第2014/089290号パンフレット;国際公開第2014/144592号パンフレット;国際公開第144288号パンフレット;国際公開第2014/204578号パンフレット;国際公開第2014/152432号パンフレット;国際公開第2115/099850号パンフレット;米国特許第8,697,359号明細書;米国特許出願公開第2010/0076057号明細書;米国特許出願公開第2011/0189776号明細書;米国特許出願公開第2011/0223638号明細書;米国特許出願公開第2013/0130248号明細書;国際公開第2008/108989号パンフレット;国際公開第2010/054108号パンフレット;国際公開第2012/164565号パンフレット;国際公開第2013/098244号パンフレット;国際公開第2013/176772号パンフレット;米国特許出願公開第20150050699号明細書;米国特許出願公開第20150071899号明細書、および国際公開第2014/204578号パンフレットに記載のとおり、FokIに融合している。
【0067】
一部の実施形態において、融合タンパク質は、dCas9バリアントおよび異種機能ドメイン間のリンカーを含む。これらの融合タンパク質中(または連結構造の融合タンパク質間)で使用することができるリンカーは、融合タンパク質の機能を妨害しない任意の配列を含み得る。好ましい実施形態において、リンカーは、短鎖であり、例えば、2〜20アミノ酸であり、典型的には、フレキシブルである(すなわち、高い自由度を有するアミノ酸、例えば、グリシン、アラニン、およびセリンを含む)。一部の実施形態において、リンカーは、GGGS(配列番号3)またはGGGGS(配列番号4)からなる1つ以上の単位、例えば、GGGS(配列番号5)またはGGGGS(配列番号6)単位の2、3、4つ、またはそれより多いリピートを含む。他のリンカー配列を使用することもできる。
【0068】
一部の実施形態において、バリアントタンパク質は、細胞内空間への送達を容易にする細胞浸透ペプチド配列、例えば、HIV由来TATペプチド、ペネトラチン、トランスポータン、またはhCT由来細胞浸透ペプチドを含み、例えば、Caron et al.,(2001)Mol Ther.3(3):310−8;Langel,Cell−Penetrating Peptides:Processes and Applications(CRC Press,Boca Raton FL 2002);El−Andaloussi et al.,(2005)Curr Pharm Des.11(28):3597−611;およびDeshayes et al.,(2005)Cell Mol Life Sci.62(16):1839−49を参照されたい。
【0069】
細胞浸透ペプチド(CPP)は、細胞膜を通過する細胞質または他の細胞小器官、例えば、ミトコンドリアおよび核中への広範な生体分子の移動を容易にする短鎖ペプチドである。CPPにより送達することができる分子の例としては、治療薬、プラスミドDNA、オリゴヌクレオチド、siRNA、ペプチド核酸(PNA)、タンパク質、ペプチド、ナノ粒子、およびリポソームが挙げられる。CPPは、一般に、30アミノ酸以下であり、天然または非天然存在タンパク質またはキメラ配列に由来し、高い相対存在量の正荷電アミノ酸、例えば、リジンもしくはアルギニン、または交互パターンの極性および非極性アミノ酸を含有する。当技術分野において一般に使用されるCPPとしては、Tat(Frankel et al.,(1988)Cell.55:1189−1193,Vives et al.,(1997)J.Biol.Chem.272:16010−16017)、ペネトラチン(Derossi et al.,(1994)J.Biol.Chem.269:10444−10450)、ポリアルギニンペプチド配列(Wender et al.,(2000)Proc.Natl.Acad.Sci.USA 97:13003−13008,Futaki et al.,(2001)J.Biol.Chem.276:5836−5840)、およびトランスポータン(Pooga et al.,(1998)Nat.Biotechnol.16:857−861)が挙げられる。
【0070】
CPPは、共有または非共有結合方針を介してその積み荷と結合させることができる。CPPおよびその積み荷を共有結合させる方法は当技術分野において公知であり、例えば、化学的架橋(Stetsenko et al.,(2000)J.Org.Chem.65:4900−4909,Gait et al.(2003)Cell.Mol.Life.Sci.60:844−853)または融合タンパク質のクローニング(Nagahara et al.,(1998)Nat.Med.4:1449−1453)である。積み荷と、極性および非極性ドメインを含む短鎖両親媒性CPPとの間の非共有カップリングは、静電および疎水性相互作用を介して確立される。
【0071】
CPPは、潜在的に治療的な生体分子を細胞中に送達するために当技術分野において利用されている。例としては、免疫抑制のためのポリアルギニンに結合しているシクロスポリン(Rothbard et al.,(2000)Nature Medicine 6(11):1253−1257)、腫瘍発生の阻害のためのMPGと呼ばれるCPPに結合しているサイクリンB1に対するsiRNA(Crombez et al.,(2007)Biochem Soc.Trans.35:44−46)、癌細胞成長を低減させるためのCPPに結合している腫瘍抑制因子p53ペプチド(Takenobu et al.,(2002)Mol.Cancer Ther.1(12):1043−1049,Snyder et al.,(2004)PLoS Biol.2:E36)、および喘息を治療するためのTatに融合しているRasまたはホスホイノシトール3キナーゼ(PI3K)のドミナントネガティブ型(Myou et al.,(2003)J.Immunol.171:4399−4405)が挙げられる。
【0072】
CPPは、当技術分野において、造影およびバイオセンシング用途のために造影剤を細胞中に輸送するために利用されている。例えば、Tatに付着している緑色蛍光タンパク質(GFP)が、癌細胞を標識するために使用されている(Shokolenko et al.,(2005)DNA Repair 4(4):511−518)。量子ドットにコンジュゲートしているTatが、ラット脳の可視化のために血液脳関門を良好に通過させるために使用されている(Santra et al.,(2005)Chem.Commun.3144−3146)。CPPは、細胞画像化のために磁気共鳴画像化技術と組み合わせることもできる(Liu et al.,(2006)Biochem.and Biophys.Res.Comm.347(1):133−140)。Ramsey and Flynn,Pharmacol Ther.2015 Jul 22.pii:S0163−7258(15)00141−2も参照されたい。
【0073】
代替的にまたはさらに、バリアントタンパク質は、核局在化配列、例えば、SV40ラージT抗原NLS(PKKKRRV(配列番号7))およびヌクレオプラスミンNLS(KRPAATKKAGQAKKKK(配列番号8))を含み得る。他のNLSは、当技術分野において公知であり;例えば、Cokol et al.,EMBO Rep.2000 Nov 15;1(5):411−415;Freitas and Cunha,Curr Genomics.2009 Dec;10(8):550−557を参照されたい。
【0074】
一部の実施形態において、バリアントは、リガンドについての高い親和性を有する部分、例えば、GST、FLAGまたはヘキサヒスチジン配列を含む。このような親和性タグは、組換えバリアントタンパク質の精製を容易にし得る。
【0075】
バリアントタンパク質を細胞に送達する方法について、当技術分野において公知の任意の方法を使用して、例えば、バリアントタンパク質コードする核酸からのインビトロ翻訳、または好適な宿主細胞中の発現により、タンパク質を産生することができ;タンパク質産生についての当技術分野において多数の方法が公知である。例えば、タンパク質は、酵母、大腸菌(E.coli)、昆虫細胞系、植物、トランスジェニック動物、または培養哺乳動物細胞中で産生し、それから精製することができ;例えば、Palomares et al.,“Production of Recombinant Proteins:Challenges and Solutions,”Methods Mol Biol.2004;267:15−52を参照されたい。さらに、バリアントタンパク質は、任意選択的に、タンパク質が細胞内に存在すると開裂されるリンカーを用いて細胞中への移動を容易にする部分、例えば、脂質ナノ粒子に結合させることができる。例えば、LaFountaine et al.,Int J Pharm.2015 Aug 13;494(1):180−194を参照されたい。
【0076】
発現系
本明細書に記載のCas9バリアントを使用するため、それらをコードする核酸からそれらを発現させることが望ましいことがある。これは、種々の手段で実施することができる。例えば、Cas9バリアントをコードする核酸を、複製および/または発現のための原核または真核細胞中への形質転換のための中間ベクター中にクローニングすることができる。中間ベクターは、典型的には、Cas9バリアントの産生のためのCas9バリアントをコードする核酸の貯蔵または操作のための原核生物ベクター、例えば、プラスミド、もしくはシャトルベクター、または昆虫ベクターである。Cas9バリアントをコードする核酸は、植物細胞、動物細胞、好ましくは、哺乳動物細胞もしくはヒト細胞、真菌細胞、細菌細胞、または原虫細胞への投与のための発現ベクター中にクローニングすることもできる。
【0077】
発現を得るため、Cas9バリアントをコードする配列は、典型的には、転写を指向するためのプロモーターを含有する発現ベクター中にサブクローニングする。好適な細菌および真核生物プロモーターは、当技術分野において周知であり、例えば、Sambrook et al.,Molecular Cloning,A Laboratory Manual(3d ed.2001);Kriegler,Gene Transfer and Expression:A Laboratory Manual(1990);およびCurrent Protocols in Molecular Biology(Ausubel et al.,eds.,2010)に記載されている。遺伝子操作タンパク質を発現させるための細菌発現系は、例えば、大腸菌(E.coli)、バシラス属種(Bacillus sp.)、およびサルモネラ属(Salmonella)において利用可能である(Palva et al.,1983,Gene 22:229−235)。このような発現系のためのキットは、市販されている。哺乳動物細胞、酵母、および昆虫細胞のための真核生物発現系も、当技術分野において周知であり、それらも市販されている。
【0078】
核酸の発現を指向するために使用されるプロモーターは、特定の用途に依存する。例えば、強力な構成的プロモーターは、典型的には、融合タンパク質の発現および精製に使用される。対照的に、Cas9バリアントを遺伝子調節のためにインビボ投与すべき場合、Cas9バリアントの特定の使用に応じて構成的または誘導性プロモーターのいずれかを使用することができる。さらに、Cas9バリアントの投与に好ましいプロモーターは、弱いプロモーター、例えば、HSV TKまたは類似の活性を有するプロモーターであり得る。プロモーターは、トランス活性化に応答性であるエレメント、例えば、低酸素症応答エレメント、Gal4応答エレメント、lacリプレッサー応答エレメント、ならびに小分子制御系、例えば、テトラサイクリン調節系およびRU−486系も含み得る(例えば、Gossen&Bujard,1992,Proc.Natl.Acad.Sci.USA,89:5547;Oligino et al.,1998,Gene Ther.,5:491−496;Wang et al.,1997,Gene Ther.,4:432−441;Neering et al.,1996,Blood,88:1147−55;およびRendahl et al.,1998,Nat.Biotechnol.,16:757−761参照)。
【0079】
プロモーターに加え、発現ベクターは、典型的には、原核生物または真核生物のいずれであれ、宿主細胞中の核酸の発現に要求される全ての追加のエレメントを含有する転写単位または発現カセットを含有する。したがって、典型的な発現カセットは、例えば、Cas9バリアントをコードする核酸配列に作動可能に結合されているプロモーター、および例えば、転写物の効率的なポリアデニル化、転写終結、リボソーム結合部位、または翻訳終結に要求される任意のシグナルを含有する。カセットの追加のエレメントとしては、例えば、エンハンサー、および異種スプライシングイントロンシグナルを挙げることができる。
【0080】
遺伝子情報を細胞中に輸送するために使用される特定の発現ベクターは、Cas9バリアントの目的の使用、例えば、植物、動物、細菌、真菌、原生動物中などでの発現に関して選択される。標準的な細菌発現ベクターとしては、pBR322ベースのプラスミド、pSKF、pET23Dなどのプラスミド、ならびに市販のタグ融合発現系、例えば、GSTおよびLacZが挙げられる。
【0081】
真核発現ベクターでは、真核生物ウイルスからの調節エレメントを含有する発現ベクター、例えば、SV40ベクター、パピローマウイルスベクター、およびエプスタイン・バーウイルス由来のベクターを使用することが多い。他の例示的な真核生物ベクターとしては、pMSG、pAV009/A+、pMTO10/A+、pMAMneo−5、バキュロウイルスpDSVE、およびSV40初期プロモーター、SV40後期プロモーター、メタロチオネインプロモーター、ネズミ乳腺腫瘍ウイルスプロモーター、ラウス肉腫ウイルスプロモーター、ポリヘドリンプロモーターまたは真核細胞中での発現に有効であることが示されている他のプロモーターの指向下でタンパク質の発現を可能とする他の任意のベクターが挙げられる。
【0082】
Cas9バリアントを発現させるためのベクターは、ガイドRNAの発現を駆動するRNA PolIIIプロモーター、例えば、H1、U6または7SKプロモーターを含み得る。これらのヒトプロモーターは、プラスミド形質移入後に哺乳動物細胞中でのCas9バリアントの発現を可能とする。
【0083】
一部の発現系は、安定的に形質移入された細胞系を選択するためのマーカー、例えばチミジンキナーゼ、ハイグロマイシンBホスホトランスフェラーゼ、およびジヒドロ葉酸レダクターゼを有する。高収率の発現系、例えば、バキュロウイルスベクターを昆虫細胞中で、ポリヘドリンプロモーターまたは他の強力なバキュロウイルスプロモーターの指向下でgRNAコード配列とともに使用するものも好適である。
【0084】
発現ベクター中に典型的に含まれるエレメントとしては、大腸菌(E.coli)中で機能するレプリコン、組換えプラスミドを保有する細菌の選択を可能にする抗生物質耐性をコードする遺伝子、および組換え配列の挿入を可能にするためのプラスミドの非必須領域中のユニーク制限部位も挙げられる。
【0085】
標準的な形質移入法を使用して大量のタンパク質を発現する細菌、哺乳動物、酵母または昆虫の細胞系を産生し、次いで標準的な技術を用いてそのタンパク質を精製する(例えば、Colley et al.,1989,J.Biol.Chem.,264:17619−22;Guide to Protein Purification,in Methods in Enzymology,vol.182(Deutscher,ed.,1990)参照)。真核および原核細胞の形質転換は、標準的な技術に従って実施する(例えば、Morrison,1977,J.Bacteriol.132:349−351;Clark−Curtiss&Curtiss,Methods in Enzymology 101:347−362(Wu et al.,eds,1983参照)。
【0086】
宿主細胞内に外来ヌクレオチド配列を導入する公知の手順のいずれかを使用することができる。このような方法としては、リン酸カルシウム形質移入、ポリブレン、プロトプラスト融合、エレクトロポレーション、ヌクレオフェクション、リポソーム、マイクロインジェクション、ネイキッドDNA、プラスミドベクター、ウイルスベクター(エピソーム型および組込み型の両方)およびクローニングされたゲノムDNA、cDNA、合成DNAまたは他の外来遺伝子材料を宿主細胞内に導入する他の周知の方法のいずれかの使用が挙げられる(例えば、Sambrook et al.,前掲参照)。唯一必要なことは、使用される特定の遺伝子操作手順が、Cas9バリアントを発現し得る宿主細胞内に少なくとも1つの遺伝子を良好に導入し得ることである。
【0087】
本方法は、精製Cas9タンパク質をgRNAと細胞中にリボ核タンパク質(RNP)複合体として導入することにより、およびgRNAとCas9タンパク質をコードするmRNAを導入することによりgDNAを改変することも含み得る。gRNAは、合成gRNAまたはガイドRNAをコードする核酸(例えば、発現ベクター中)であり得る。
【0088】
本発明は、ベクターおよびベクターを含む細胞も含む。
【実施例】
【0089】
本発明を以下の実施例においてさらに説明するが、それらの実施例は特許請求の範囲に記載の本発明の範囲を限定するものではない。
【0090】
方法
SpCas9バリアントを進化させるための細菌ベース陽性選択アッセイ
陽性選択プラスミド(標的部位が埋め込まれた)を含有するコンピテント大腸菌(E.coli)BW25141(λDE3)23をCas9/sgRNAコードプラスミドにより形質転換した。SOB培地中の60分間のリカバリー後、クロラムフェニコール(非選択)またはクロラムフェニコール+10mMのアラビノース(選択)のいずれかを含有するLB培地上で形質転換物をプレーティングした。
【0091】
ゲノムワイド標的特異性について重要であり得る追加の位置を同定するため、ホーミングエンドヌクレアーゼの特性を研究するために既に使用されている細菌選択系(以下、陽性選択と称される)(Chen&Zhao,Nucleic Acids Res 33,e154(2005);Doyon et al.,J Am Chem Soc 128,2477−2484(2006))を適合させた。
【0092】
この系の本適合において、誘導性毒性遺伝子をコードする陽性選択プラスミドのCas9媒介開裂は、線形化プラスミドの後続の分解および損失に起因する細胞生存を可能とする。SpCas9が陽性選択系中で機能し得ることを確立した後、野生型およびバリアントの両方を、公知のヒトゲノムから選択される標的部位を保有する選択プラスミドを開裂するそれらの能力について試験した。標的部位を含有する陽性選択プラスミドを有する細菌中にこれらのバリアントを導入し、選択培地上でプレーティングした。陽性選択プラスミドの開裂は、生存頻度:選択プレート上のコロニー/非選択プレート上のコロニーを計算することにより推定した(図1,5〜6参照)。
【0093】
【表3】
【0094】
ヒト細胞培養および形質移入
構成的に発現されるEGFP−PESTレポーター遺伝子15の単一インテグレートコピーを保有するU2OS.EGFP細胞を、10%のFBS、2mMのGlutaMax(Life Technologies)、ペニシリン/ストレプトマイシン、および400μg/mlのG418が補給されたAdvanced DMEM培地(Life Technologies)中で、37℃において5%COを用いて培養した。Lonza 4D−nucleofectorのDN−100プログラムを製造業者のプロトコルに従って使用して、750ngのCas9プラスミドおよび250ngのsgRNAプラスミド(特に注釈のない限り)により、細胞を同時形質移入した。空のU6プロモータープラスミドと一緒に形質移入されるCas9プラスミドを全てのヒト細胞実験についての陰性対照として使用した(図2、7〜10参照)。
【0095】
ヒト細胞EGFP崩壊アッセイ
EGFP崩壊実験を既に記載のとおり実施した16。EGFP発現について、形質移入された細胞を形質移入の約52時間後にFortessaフローサイトメーター(BD Biosciences)を使用して分析した。バックグラウンドEGFP損失を全ての実験について約2.5%においてゲーティングした(図2、7参照)。
【0096】
ヌクレアーゼ誘導突然変異率を定量するためのT7E1アッセイ、標的化ディープシーケンシング、およびGUIDE−seq
T7E1アッセイを、ヒト細胞について既に記載のとおり(Kleinstiver,B.P.et al.,Nature 523,481−485(2015))実施した。U2OS.EGFPヒト細胞について、Agencourt DNAdvance Genomic DNA Isolation Kit(Beckman Coulter Genomics)を使用して形質移入の約72時間後にゲノムDNAを形質移入細胞から抽出した。約200ngの精製PCR産物を変性させ、アニーリングし、T7E1(New England BioLabs)により消化した。ヒト細胞について既に記載のとおり(Kleinstiver et al.,Nature 523,481−485(2015);Reyon et al,.Nat Biotechnol 30,460−465(2012))、Qiaxcelキャピラリー電気泳動機器(QIagen)を使用して突然変異誘発頻度を定量した。
【0097】
GUIDE−seq実験は、既に記載のとおり実施した(Tsai et al.,Nat Biotechnol 33,187−197(2015))。簡潔に述べると、リン酸化ホスホロチオエート修飾二本鎖オリゴデオキシヌクレオチド(dsODN)を上記のとおりCas9およびsgRNA発現プラスミドとともにCas9ヌクレアーゼとともにU2OS細胞中に形質移入した。dsODN特異的増幅、ハイスループットシーケンシング、およびマッピングを実施してDSB活性を含有するゲノム間隔を同定した。野生型対二重または四重変異体バリアント実験のため、オフターゲットリードカウントをオンターゲットリードカウントに正規化して、試料間のシーケンシング深度の差を補正した。次いで、野生型およびバリアントSpCas9についての正規化比を比較してオフターゲット部位における活性の変化倍率を計算した。GUIDE−seqについての野生型およびバリアント試料が、設定標的部位における類似のオリゴタグインテグレーション率を有するか否かを決定するため、100ngのゲノムDNA(上記のとおり単離)からPhusion Hot−Start Flexにより設定標的遺伝子座を増幅することにより制限断片長多型(RFLP)アッセイを実施した。ほぼ150ngのPCR産物を20UのNdeI(New England BioLabs)により37℃において3時間消化してから、Agencourt Ampure XPキットを使用してクリーンアップした。Qiaxcelキャピラリー電気泳動装置(QIagen)を使用してRFLP結果を定量してオリゴタグインテグレーション率を推定した。T7E1アッセイを上記のとおり同様の目的のために実施した。
【0098】
実施例1
CRISPR−Cas9RNAガイド遺伝子編集の標的化特異性に対処するための1つの潜在的な解決法は、新規突然変異を有するCas9バリアントを遺伝子操作することである。
【0099】
これらの従来の結果に基づき、CRISPR−Cas9ヌクレアーゼの特異性は、DNA上のリン酸基への結合により媒介されるDNAについてのCas9の非特異的結合親和性またはDNAとの疎水性もしくは塩基スタッキング相互作用を低減させることにより有意に増加させ得ることが仮定された(理論により拘束されるものではない)。このアプローチは、既に記載されたトランケートgRNAアプローチのようなgRNA/Cas9複合体により認識される標的部位の長さを減少させないという利点を有する。DNAについてのCas9の非特異的結合親和性は、標的DNA上のリン酸基に接触するアミノ酸残基を突然変異させることにより低減させ得ることが推定された。
【0100】
非Cas9ヌクレアーゼ、例えば、TALENのバリアントを作出するための類似のアプローチが使用されている(例えば、Guilinger et al.,Nat.Methods.11:429(2014)参照)。
【0101】
この仮定の最初の試験において、本発明者らは、DNA骨格上のリン酸と相互作用することが予測することができるSpCas9中の種々の残基中に個々のアラニン置換を導入することにより、広く使用される化膿性連鎖球菌(S.pyogenes)Cas9(SpCas9)の親和性低減バリアントを遺伝子操作することを試行した。大腸菌(E.coli)ベーススクリーニングアッセイを使用してこれらのバリアントの活性を評価した(Kleinstiver et al.,Nature.2015 Jul 23;523(7561):481−5)。この細菌系において、細胞生存率は、毒性ギラーゼ毒素ccdBについての遺伝子ならびにgRNAおよびSpCas9により標的化される23塩基対配列を含有する選択プラスミドの開裂(および後続の崩壊)に依存した。この実験の結果は、活性を保持または損失する残基を同定した(表1)。
【0102】
【表4】
【0103】
50〜100%の生存割合は通常ロバストな開裂を示す一方、0%の生存率は酵素が機能的に減衰したことを示した。細菌中でアッセイした(しかし、上記表に示されない)追加の突然変異としては、R69A、R71A、Y72A、R75A、K76A、N77A、R115A、H160A、K163A、L169A、T404A、F405A、R447A、I448A、Y450A、S460A、M495A、M694A、H698A、Y1013A、V1015A、R1122A、K1123A、およびK1124Aが挙げられる。R69AおよびF405A(細菌中の<5%の生存率を有した)を除き、それらの追加の単一突然変異の全ては、SpCas9のオンターゲット活性に対する効果をほとんど有さないと考えられた(細菌スクリーンにおいて>70%の生存率)。
【0104】
N497A、R661A、Q695A、およびQ926A突然変異の全ての考えられる単一、二重、三重および四重組合せを担持する15個の異なるSpCas9バリアントを構築して、それらの残基により作製される接触がオンターゲット活性について欠失可能であり得るか否かを試験した(図1b)。これらの実験について、単一インテグレートEGFPレポーター遺伝子内の開裂および非相同末端結合(NHEJ)媒介修復による挿入または欠失突然変異(インデル)の誘導が細胞蛍光の損失をもたらす既に記載されたヒト細胞ベースアッセイを使用した(Reyon,D.et al.,Nat Biotechnol.30,460−465,2012)。野生型SpCas9と対合させた場合、ヒト細胞中でEGFP発現を効率的に崩壊することが既に示されているEGFP標的化sgRNAを使用すると(Fu,Y.et al.,Nat Biotechnol 31,822−826(2013)、15個全てのSpCas9バリアントは野生型SpCas9のものと同等のEGFP崩壊活性を有した(図1b、灰色バー)。したがって、これらの残基の1つまたは全ての置換は、このEGFP標的化sgRNAを用いたSpCas9のオンターゲット開裂効率を低減させなかった。
【0105】
次に、ミスマッチ標的部位における15個全てのSpCas9バリアントの相対活性を評価するための実験を実施した。これを行うため、13および14、15および16、17および18、ならびに18および19位(最もPAMから近位の塩基について1から出発し、最もPAMから遠位の塩基について20で終わる番号付与;図1b)における置換塩基のペアを含有する先の実験において使用されたEGFP標的化sgRNAの誘導体を用いてEGFP崩壊アッセイを繰り返した。この分析により、三重突然変異体の1つ(R661A/Q695A/Q926A)および四重突然変異体(N497A/R661A/Q695A/Q926A)の両方が、ミスマッチsgRNAの4つ全てを用いてバックグラウンドのものと同等のEGFP崩壊のレベルを示すことが明らかになった(図1b、着色バー)。特に、15個のバリアントのうち、ミスマッチsgRNAを用いて最低活性を有するものは、全て、Q695AおよびQ926A突然変異を保有した。これらの結果および別のEGFP標的部位についてのsgRNAを使用した実験からの類似データに基づき、四重突然変異体(N497A/R661A/Q695A/Q926A)を追加の分析のために選択し、それをSpCas9−HF1(高フィデリティバリアント#1について)と命名した。
【0106】
SpCas9−HF1のオンターゲット活性
より多数のオンターゲット部位においていかにロバストにSpCas9−HF1が機能するかを決定するため、追加のsgRNAを使用してこのバリアントと野生型SpCas9との間の直接比較を実施した。合計で37個の異なるsgRNAを試験した:24個はEGFPに標的化され(EGFP崩壊アッセイを用いてアッセイする)13個は内在性ヒト遺伝子標的に標的化される(T7エンドヌクレアーゼI(T7EI)ミスマッチアッセイを使用してアッセイする)。EGFP崩壊アッセイを用いて試験した24個のsgRNAの20個(図1c)および内在性ヒト遺伝子部位に対して試験された13個のsgRNAの12個(図1d)は、SpCas9−HF1を用いて、同一のsgRNAを用いて野生型SpCas9の活性の少なくとも70%である活性を示した(図1e)。実際、SpCas9−HF1は、大部分のsgRNAを用いて野生型SpCas9と高度に同等の活性(90〜140%)を示した(図1e)。試験した37個のsgRNAの3つは、SpCas9−HF1を用いて本質的に活性を示さず、それらの標的部位の試験は、高い活性が見られたものと比較してそれらの配列の特徴のいかなる明らかな差も示唆しなかった(表3)。概して、SpCas9−HF1は、試験したsgRNAの86%(32個/37個)について同等の活性を有した(野生型SpCas9活性の70%超)。
【0107】
【表5】
【0108】
【表6】
【0109】
【表7】
【0110】
【表8】
【0111】
【表9】
【0112】
【表10】
【0113】
SpCas9−HF1のゲノムワイド特異性
SpCas9−HF1がヒト細胞中で低減したオフターゲット効果を示したか否かを試験するため、シーケンシング(GUIDE−seq)方法により可能となる二本鎖分解のゲノムワイドの偏りのない同定を使用した。GUIDE−seqは、隣接ゲノム配列の増幅およびシーケンシングを可能とするための二本鎖分解への短鎖二本鎖オリゴデオキシヌクレオチド(dsODN)タグのインテグレーションを使用し、任意の所与の部位におけるタグインテグレーションの数は、開裂効率の定量的尺度を提供する(Tsai,S.Q.et al,Nat Biotechnol 33,187−197(2015))。GUIDE−seqを使用して内在性ヒトEMX1、FANCF、RUNX1、およびZSCAN2遺伝子中の種々の部位に標的化される8つの異なるsgRNAを使用して野生型SpCas9およびSpCas9−HF1により誘導されるオフターゲット効果の範囲を比較した。これらのsgRNAにより標的化される配列はユニークであり、参照ヒトゲノム中の長さが様々な予測ミスマッチ部位を有する(表2)。8つのsgRNAについてのオンターゲットdsODNタグインテグレーションの評価(制限断片長多型(RFLP)アッセイによる)およびインデル形成(T7EIアッセイによる)により、野生型SpCas9およびSpCas9−HF1を用いた同等のオンターゲット活性が明らかになった(それぞれ図7aおよび7b)。GUIDE−seq実験は、8つのsgRNAの7つが、野生型SpCas9を用いて複数のゲノムワイドオフターゲット部位(sgRNA当たり2〜25の範囲)における開裂を誘導する一方、8番目のsgRNA(FANCF部位4について)は、いかなる検出可能なオフターゲット部位も産生しないことを示した(図2aおよび2b)。しかしながら、野生型SpCas9を用いてインデルを誘導した7つのsgRNAの6つは、SpCas9−HF1を用いてGUIDE−seq検出可能オフターゲットイベントの顕著に完全な不存在を示し(図2aおよび2b);残りの7番目のsgRNA(FANCF部位2について)は、プロトスペーサーシード配列内の1つのミスマッチを保有する部位における単一の検出可能なゲノムワイドオフターゲット開裂イベントのみを誘導した(図2a)。合計で、SpCas9−HF1を使用した場合に検出されなかったオフターゲット部位は、プロトスペーサーおよび/またはPAM配列中の1〜6つのミスマッチを保有した(図2c)。野生型SpCas9に関して、8つのsgRNA(FANCF部位4について)は、SpCas9−HF1を用いて試験した場合にいかなる検出可能なオフターゲット開裂イベントも生じさせなかった(図2a)。
【0114】
GUIDE−seqの知見を確認するため、標的化アンプリコンシーケンシングを使用して野生型SpCas9およびSpCas9−HF1により誘導されるNHEJ媒介インデル突然変異の頻度をより直接的に計測した。これらの実験のため、ヒト細胞にsgRNA−およびCas9コードプラスミドのみ(すなわち、GUIDE−seqタグを用いない)を形質移入した。次いで、次世代シーケンシングを使用してGUIDE−seq実験において6つのsgRNAについて野生型SpCas9を用いて同定された40個のオフターゲット部位の36個を試験した(40個の部位の4つは、それらをゲノムDNAから特異的に増幅させることができなかったため、試験することができなかった)。これらのディープシーケンシング実験は、(1)野生型SpCas9およびSpCas9−HF1が6つのsgRNAオンターゲット部位のそれぞれにおける同等の頻度のインデルを誘導すること(図3aおよび3b);(2)野生型SpCas9が、予測されるとおり、同一部位についてのGUIDE−seqリードカウントと十分に相関する頻度における36個のオフターゲット部位(図3b)の35個におけるインデル突然変異の統計的に有意な証拠を示すこと(図3c);および(3)36個のオフターゲット部位の34個におけるSpCas9−HF1により誘導されるインデルの頻度は、対照形質移入からの試料中で観察されるインデルのバックグラウンドレベルと区別不能であることを示した(図3b)。陰性対照に対してSpCas9−HF1を用いて統計的に有意な突然変異頻度を有することが考えられる2つのオフターゲット部位について、インデルの平均頻度は0.049%および0.037%であり、そのレベルにおいてそれらがシーケンシング/PCRエラーに起因するか、正規のヌクレアーゼ誘導インデルであるかを決定することは困難である。これらの結果に基づき、SpCas9−HF1は、野生型SpCas9を用いて異なる頻度の範囲にわたり生じるオフターゲット突然変異を、検出不能なレベルに完全にまたはほぼ完全に低減させ得ることが結論付けられた。
【0115】
次に、非典型のホモポリマーまたは反復配列を標的化するsgRNAのゲノムワイドオフターゲット効果を低減させるSpCas9−HF1の能力を評価した。目下のところ、多くがゲノムに対する直交性の相対的欠落に起因するの特徴を有するオンターゲット部位を回避しようと試行するが、SpCas9−HF1がそれらの困難な標的についてもオフターゲットインデルを低減させ得るか否かを調査することが望ましいことがあった。したがって、ヒトVEGFA遺伝子中のシトシンリッチホモポリマー配列または複数のTGリピートを含有する配列(それぞれVEGFA部位2およびVEGFA部位3)のいずれかを標的化する、既に特徴付けされたsgRNA(Fu,Y.et al.,Nat Biotechnol 31,Tsai,S.Q.et al.,Nat Biotechnol 33,187−197(2015)を使用した(表2)。対照実験において、これらのsgRNAのそれぞれは、野生型SpCas9およびSpCas9−HF1の両方を用いて同等のレベルのGUIDE−seq dsODNタグ取り込み(図7c)およびインデル突然変異(図7d)を誘導し、SpCas9−HF1はそれらのsgRNAのいずれかを用いてオンターゲット活性が害されないことを実証した。重要なことに、GUIDE−seq実験により、SpCas9−HF1が、それらのsgRNAのオフターゲット部位の低減において高度に有効であることが明らかになり、VEGFA部位2についての123個/144個の部位およびVEGFA部位3についての31個/32個の部位が検出されなかった(図4aおよび4b)。SpCas9−HF1を用いて検出されなかったこれらのオフターゲット部位の試験は、それらがそれぞれ、それらのプロトスペーサーおよびPAM配列内の一連の総ミスマッチ:VEGFA部位2sgRNAについての2〜7つのミスマッチおよびVEGFA部位3sgRNAについての1〜4つのミスマッチを有することを示し(図4c);さらに、VEGFA部位2についてのそれらのオフターゲットの9つは、sgRNA−DNA界面における潜在的なバルジ塩基(Lin,Y.et al,.Nucleic Acids Res 42,7473−7485(2014)を有し得る(図4aおよび図8)。SpCas9−HF1を用いて検出されなかった部位は、VEGFA部位2sgRNAについての2〜6つのミスマッチおよびVEGFA部位3sgRNAについての単一部位中の2つのミスマッチを有し(図4c)、VEGFA部位2sgRNAについての3つのオフターゲット部位はここでも潜在的バルジを有した(図8)。まとめると、これらの結果は、SpCas9−HF1が、単純リピート配列に標的化されるsgRNAのオフターゲット効果の低減において高度に有効であり得、ホモポリマー配列に標的化されるsgRNAへのかなりの影響も有し得ることを実証した。
【0116】
【表11】
【0117】
【表12】
【0118】
【表13】
【0119】
【表14】
【0120】
【表15】
【0121】
【表16】
【0122】
SpCas9−HF1の特異性の改良
既に記載された方法、例えば、トランケートgRNA(Fu,Y.et al.,Nat Biotechnol 32,279−284(2014))およびSpCas9−D1135Eバリアント(Kleinstiver,B.P.et al.,Nature 523,481−485(2015))は、SpCas9オフターゲット効果を部分的に低減させ得、本発明者らは、それらをSpCas9−HF1と組み合わせてそのゲノムワイド特異性をさらに改善することができるか否かを考慮した。ヒト細胞ベースEGFP崩壊アッセイにおける4つの部位に標的化されるマッチ全長およびトランケートsgRNAを用いたSpCas9−HF1の試験により、sgRNA相補性長さの短縮が、オンターゲット活性を実質的に害することが明らかになった(図9)。対照的に、追加のD1135E突然変異を有するSpCas9−HF1(本明細書においてSpCas9−HF2と称されるバリアント)は、ヒト細胞ベースEGFP崩壊アッセイを使用して試験した8つのsgRNAの6つを用いて野生型SpCas9の70%以上の活性を保持した(図5aおよび5b)。側鎖が標的DNAとのそのPAM近位末端上での疎水性非特異的相互作用を媒介する位置におけるそれぞれL169AまたはY450A突然変異を保有するSpCas9−HF3およびSpCas9−HF4バリアントも作出した(Nishimasu,H.et al.,Cell 156,935−949(2014);Jiang,F.,et al.,Science 348,1477−1481(2015))。SpCas9−HF3およびSpCas9−HF4は、8つのEGFP標的化sgRNAのうちの同一の6つを用いて野生型SpCas9を用いて観察された活性の70%以上を保持した(図5aおよび5b)。
【0123】
SpCas9−HF2、−HF3、および−HF4が、SpCas9−HF1に耐性である2つのオフターゲット部位(FANCF部位2およびVEGFA部位3sgRNAについて)におけるインデル頻度を低減させ得るか否かを決定するため、さらなる実験を実施した。プロトスペーサーのシード配列中の単一ミスマッチを担持するFANCF部位2オフターゲットについて、SpCas9−HF4は、T7EIアッセイにより判断されるとおり、インデル突然変異頻度をほぼバックグラウンドレベルに低減させた一方、オンターゲット活性も有益に増加させ(図5c)、3つのバリアント間の特異性の最大増加をもたらした(図5d)。2つのプロトスペーサーミスマッチ(シード配列中に1つ、およびPAM配列から最も遠位のヌクレオチドにおいて1つ)を担持するVEGFA部位3オフターゲット部位について、SpCas9−HF2はインデル形成の最大低減を示した一方、オンターゲット突然変異頻度に対してわずかな効果のみを示し(図5c)、試験した3つのバリアント間の特異性の最大増加をもたらした(図5d)。まとめると、これらの結果は、非特異的DNA接触を媒介し、またはPAM認識を変更し得る他の残基における追加の突然変異を導入することにより、SpCas9−HF1に耐性であるオフターゲット効果の低減についての潜在性を実証する。
【0124】
FANCF部位2およびVEGFA部位3sgRNAのオフターゲットに対してそれぞれ、SpCas9−HF4およびSpCas9−HF2がSpCas9−HF1に対して改善された区別を有することを示す上記のT7E1アッセイの知見を一般化するため、GUIDE−seqを使用してそれらのバリアントのゲノムワイド特異性を試験した。RFLPアッセイを使用して、SpCas9−HF4およびSpCas9−HF2は、GUIDE−seqタグインテグレーション率によりアッセイされたとおり、SpCas9−HF1と類似のオンターゲット活性を有することが決定された(図5E)。GUIDE−seqデータを分析した場合、SpCas9−HF2またはSpCas9−HF4について新たなオフターゲット部位は同定されなかった(図5F)。SpCas9−HF1と比較して、全ての部位におけるオフターゲット活性はGUIDE−seqにより検出不能になり、または実質的に減少した。SpCas9−HF1に対して、SpCas9−HF4は、SpCas9−HF1の特異性の改善に抵抗性のままである単一のFANCF部位2オフターゲット部位に対してほぼ26倍良好な特異性を有した(図5F)。SpCas9−HF2は、高頻度VEGFA部位3オフターゲットについてSpCas9−HF1に対してほぼ4倍改善された特異性を有した一方、他の低頻度オフターゲット部位におけるGUIDE−seq検出可能イベントも大幅に低減し(>38倍)、または排除した。注目すべきことに、SpCas9−HF1について同定されたそれらの低頻度部位の3つのゲノム位置は、既に特徴付けされたバックグラウンドU2OS細胞切断点ホットスポットに隣接する。まとめると、これらの結果はSpCas9−HF2およびSpCas9−HF4バリアントがSpCas9−HF1のゲノムワイド特異性を改善し得ることを示唆する。
【0125】
標準的な非反復標的配列に対して設計されたsgRNAを使用した場合、SpCas9−HF1はオフターゲット突然変異をロバストに一貫して低減させた。SpCas9−HF1に最も耐性であった2つのオフターゲット部位は、プロトスペーサー中の1および2つのミスマッチのみを有する。まとめると、これらの観察は、SpCas9−HF1を使用し、ゲノム中のいずれかの場所で1または2つのミスマッチを担持する密接に関連する部位を有さない非反復配列を標的化することにより(既存の公的に利用可能なソフトウェアプログラム(Bae,S.,et al,Bioinformatics 30,1473−1475(2014)を使用して容易に達成することができるもの)、オフターゲット突然変異を検出不能なレベルに最小化させ得ることを示唆する。使用者が留意すべき1つのパラメータは、SpCas9−HF1が、プロトスペーサー配列にミスマッチするgRNAの5’末端におけるGを使用する一般的手法と適合性であり得ないことである。標的部位に対してミスマッチする5’Gを担持する4つのsgRNAの試験は、4つのうちの3つが野生型SpCas9と比較してSpCas9−HF1を用いて縮小した活性を示し(図10)、部分的にマッチする部位をより良好に区別するSpCas9−HF1の能力を反映する可能性がある。
【0126】
さらなる生化学的試験は、SpCas9−HF1その高いゲノムワイド特異性を達成する正確な機序を確認または明確化し得る。導入される4つの突然変異が細胞中のSpCas9の安定性または定常状態発現レベルを変更することは明らかでない。それというのも、減少濃度の発現プラスミドを用いるタイトレーション実験は、野生型SpCas9およびSpCas9−HF1が、それらの濃度が低下するにつれて同等に挙動することを示唆した(図11)。その代わり、最も簡易な機序的説明は、それらの突然変異が、オンターゲット活性を保持するためにちょうど十分であるがオフターゲット部位開裂を非効率または不存在にするほど低いレベルにおける複合体のエネルギーでCas9−sgRNAと標的DNAとの間の相互作用のエネルギーを減少させたことである。この機序は、構造データ中の突然変異残基と標的DNAリン酸骨格との間で観察された非特異的相互作用と一致する(Nishimasu,H.et al.,Cell 156,935−949(2014);Anders,C et.Al.,Nature 513,569−573(2014))。いくらか類似の機序は、正荷電残基における置換を担持する転写アクチベーター様エフェクターヌクレアーゼの増加した特異性を説明するために提案されている(Guilinger,J.P.et al.,Nat Methods 11,429−435(2014))。
【0127】
SpCas9−HF1は、Cas9機能を変更することが示された他の突然変異と組み合わせることもできることが可能であった。例えば、3つのアミノ酸置換を担持するSpCas9突然変異体(D1135V/R1335Q/T1337R、SpCas9−VQRバリアントとしても公知)は、NGAN PAM(NGAG>NGAT=NGAA>NGACについての相対効率を有する)を有する部位を認識し(Kleinstiver,B.P.et al,Nature 523,481−485(2015))、近年同定された四重SpCas9突然変異体(D1135V/G1218R/R1335Q/T1337R、SpCas9−VRQRバリアントと称される)は、NGAH(H=A、C、またはT)PAMを有する部位に対してVQRバリアントに対して改善された活性を有する(図12a)。SpCas9−HF1からSpCas9−VQRおよびSpCas9−VRQR中への4つの突然変異(N497A/R661A/Q695A/Q926A)の導入は、それぞれSpCas9−VQR−HF1およびSpCas9−VRQR−HF1を作出した。これらのヌクレアーゼのHFバージョンの両方は、EGFPレポーター遺伝子に標的化される8つのsgRNAの5つを用いて、および内在性ヒト遺伝子部位に標的化される8つのsgRNAの7つを用いてそれらの非HF相当物と同等(すなわち、70%以上)のオンターゲット活性を示した(図12b〜12d)。
【0128】
より広く考慮すると、これらの結果は、CRISPR関連ヌクレアーゼの追加の高フィデリティバリアントの遺伝子操作のための一般的方針を説明する。非特異的DNA接触残基における追加の突然変異を追加することは、SpCas9−HF1を用いて存続する極めて少数の残留オフターゲット部位の一部をさらに低減させた。したがって、バリアント、例えば、SpCas9−HF2、SpCas9−HF3、SpCas9−HF4などは、オフターゲット配列の性質に応じて特注様式で利用することができる。さらに、SpCas9の高フィデリティバリアントの遺伝子操作を用いた成功は、非特異的DNA接触を突然変異させるアプローチが他の天然存在および遺伝子操作Cas9オルソログ(Ran,F.A.et al.,Nature 520,186−191(2015),Esvelt,K.M.et al.,Nat Methods 10,1116−1121(2013);Hou,Z.et al.,Proc Natl Acad Sci USA(2013);Fonfara,I.et al.,Nucleic Acids Res 42,2577−2590(2014);Kleinstiver,B.P.et al,Nat Biotechnol(2015)ならびに増加した頻度で発見および特徴付けされているより新たなCRISPR関連ヌクレアーゼ(Zetsche,B.et al.,Cell 163,759−771(2015);Shmakov,S.et al.,Molecular Cell 60,385−397)に拡張し得ることを示唆する。
【0129】
実施例2
標的鎖DNAに接触する残基中のアラニン置換、例として、N497A、Q695A、R661A、およびQ926Aを有するSpCas9バリアントが本明細書に記載される。これらの残基の他、本発明者らは、それらのバリアント、例えば、SpCas9−HF1バリアント(N497A/R661A/Q695A/Q926A)の特異性を、非標的DNA鎖に接触すると考えられる正荷電SpCas9残基:R780、K810、R832、K848、K855、K968、R976、H982、K1003、K1014、K1047、および/またはR1060(Slaymaker et al.,Science.2016 Jan 1;351(6268):84−8参照)中の置換を追加することにより、さらに改善することができるか否かを決定することを追求した。
【0130】
これらの位置における単一アラニン置換およびそれらの組合せを担持する野生型SpCas9誘導体の活性を、EGFP遺伝子中の部位に対して設計された完全マッチsgRNA(オンターゲット活性を評価するため)ならびに11および12位(1位は、最もPAMから近位の塩基である)における意図的なミスマッチを担持する同一のsgRNA(オフターゲット部位において見出されるミスマッチ部位における活性を評価するため)を用いるEGFP崩壊アッセイを使用して最初に試験した(図13A)。(三重置換K810A/K1003A/R1060AまたはK848A/K1003A/R1060Aを担持する誘導体は、それぞれeSpCas9(1.0)およびeSpCas9(1.1)として公知の近年記載されたバリアントと同一であることに留意されたい;参照文献1参照)。予測されるとおり、野生型SpCas9は、ロバストなオンターゲットおよびミスマッチ標的活性を有した。対照として、この実験においてSpCas9−HF1も試験し、それが予測されるとおりオンターゲット活性を維持する一方、ミスマッチ標的活性を低減させることを見出した(図13A)。非標的DNA鎖に潜在的に接触し得る位置における1つ以上のアラニン置換を担持する野生型SpCas9誘導体の全ては、野生型SpCas9と同等のオンターゲット活性を示した(図13A)。興味深いことに、これらの誘導体の一部は、野生型SpCas9を用いて観察された活性に対して、ミスマッチ11/12sgRNAを用いて低減した開裂も示し、それらの誘導体中の置換のサブセットが、野生型SpCas9に対してこのミスマッチ部位に対する向上した特異性を付与することを示唆した(図13A)。しかしながら、これらの単一置換も置換の組合せも11/12ミスマッチsgRNAを用いて観察された活性を完全に排除するために十分でなかった。9および10位におけるミスマッチを担持する追加のsgRNAを使用して野生型SpCas9、SpCas9−HF1、およびそれらの同一の野生型SpCas9誘導体を試験した場合(図13B)、ほとんどの誘導体についてミスマッチ標的活性の最小の変化のみが観察された。ここでも、これは、これらの潜在的な非標的鎖接触残基における単一、二重、またはさらには三重置換(既に記載されたeSpCas9(1.0)および(1.1)バリアントと等価である)が不完全マッチDNA部位における活性を排除するには不十分であることを実証した。まとめると、これらのデータは、野生型SpCas9バリアントがマッチsgRNAを用いてオンターゲット活性を保持すること、および(野生型SpCas9に関して)それら自体でそれらの誘導体中に含有される置換が2つの異なるミスマッチDNA部位に対するヌクレアーゼ活性を排除するために十分でないことを実証する(図13Aおよび13B)。
【0131】
これらの結果を考慮すると、非標的DNA鎖に接触し得る残基における1つ以上の追加のアミノ酸置換を担持するSpCas9−HF1誘導体が、親SpCas9−HF1タンパク質に対して特異性をさらに改善し得ることが仮定された。したがって、単一、二重、または三重アラニン置換の組合せを担持する種々のSpCas9−HF1誘導体を、完全マッチsgRNA(オンターゲット活性を試験するため)ならびに11および12位におけるミスマッチを担持する同一のsgRNA(オフターゲット部位について見出されるミスマッチ標的部位における活性を評価するため)を使用するヒト細胞ベースEGFP崩壊アッセイにおいて試験した。これらのsgRNAは、図13A〜Bに使用された同一のものである。この実験により、試験したSpCas9−HF1誘導体バリアントのほとんどが、野生型SpCas9およびSpCas9−HF1の両方を用いて観察されたものと同等のオンターゲット活性を示すことが明らかになった(図14A)。11/12ミスマッチsgRNAを用いると、試験したSpCas9−HF1誘導体の一部(例えば、SpCas9−HF1+R832AおよびSpCas9−HF1+K1014A)は、ミスマッチsgRNAを用いて開裂の認識可能な変化を示さなかった。しかしながら、重要なことにSpCas9−HF1誘導体のほとんどが、11/12ミスマッチsgRNAを用いてSpCas9−HF1、eSpCas9(1.0)、またはeSpCas9(1.1)を用いて観察されたものよりもかなり低い活性を有し、それらの新たなバリアントのある組合せが、低減したミスマッチ標的活性およびしたがって改善された特異性を有することを示唆した(図14A)。11/12ミスマッチsgRNAを用いてミスマッチ標的活性をほぼバックグラウンドレベルに低減させた16個のSpCas9−HF1誘導体のうち、9つが、オンターゲット活性に対する最小の効果のみを有すると考えられた(完全マッチsgRNAを使用して評価した;図14A)。9および10位において意図的にミスマッチさせたsgRNAを使用したEGFP崩壊アッセイにおけるこれらのSpCas9−HF1誘導体のサブセットの追加の試験(図14B)により、それらのバリアントがこのミスマッチsgRNAを用いて、SpCas9−HF1(図14b)、eSpCas9(1.1)(図13A)、または野生型SpCas9ヌクレアーゼに追加された同一置換(図13B)のいずれかを用いて観察されたものよりも低い活性を有することも明らかになった。重要なことに、5つのバリアントは、9/10ミスマッチsgRNAを用いたこのアッセイにおいてバックグラウンドレベルのオフターゲット活性を示した。
【0132】
次に、非標的鎖のこれらのアラニン置換を、本発明者らのSpCas9−HF1バリアントからのQ695AおよびQ926A置換のみを含有するSpCas9バリアント(ここでは、「二重」バリアント)と組み合わせることができるか否かを試験した。上記の試験HF1誘導体の多くがオンターゲット活性の観察可能(および不所望)な減少を示したため、SpCas9−HF1からの2つの最も重要な置換のみ(Q695AおよびQ926A;図1B参照)を、1つ以上の非標的鎖接触置換と組み合わせることはオンターゲット活性をレスキューし得るが、それらの置換をSpCas9−HF1バリアントに追加した場合に観察された特異性の増加を依然として維持することが仮定された。したがって、潜在的な非標的DNA鎖相互作用位置における単一、二重、または三重アラニン置換の組合せを担持する種々のSpCas9(Q695A/Q926A)誘導体を、図13A〜Bに使用された上記のEGFPに標的化される同一の完全マッチsgRNA(オンターゲット活性を試験するため)ならびに11および12位におけるミスマッチを担持する同一のsgRNA(オフターゲット部位について見出されるミスマッチ標的部位における活性を評価するため)を使用するヒト細胞ベースEGFP崩壊アッセイにおいて試験した。この実験により、試験したSpCas9(Q695A/Q926A)誘導体バリアントのほとんどが野生型SpCas9およびSpCas9−HF1の両方を用いて観察されたものと同等のオンターゲット活性を示すことが明らかになった(図15)。重要なことに、SpCas9−HF1誘導体の多くは、11/12ミスマッチsgRNAを用いて、SpCas9−HF1、eSpCas9(1.0)、またはeSpCas9(1.1)を用いて観察されたものと比較してかなり低い活性を有し、それらの新たなバリアントのある組合せが、低減したミスマッチ標的活性およびしたがって改善された特異性を有することを示唆した(図15)。11/12ミスマッチsgRNAを用いてミスマッチ標的活性を、ほぼバックグラウンドレベルに低減させた13個のSpCas9(Q695A/Q926A)誘導体のうち、1つのみがオンターゲット活性に対するかなりの効果を有すると考えられた(完全マッチsgRNAを使用して評価した;図15)。
【0133】
概して、これらのデータは、非標的DNA鎖に接触し得る位置におけるSpCas9−HF1またはSpCas9(Q695A/Q926A)への1、2、または3つのアラニン置換の追加は、(それらの親クローンまたは近年記載されたeSpCas9(1.0)または(1.1)に対して)ミスマッチオフターゲット部位を区別する改善された能力を有する新たなバリアントをもたらし得ることを実証する。重要なことに、野生型SpCas9に関するにそれらの同一の置換は、いかなる実質的な特異性利益も提供することが考えられない。
【0134】
sgRNA−標的DNA相補性界面におけるミスマッチに対するSpCas9−HF1およびeSpCas9−1.1の寛容性をより良好に定義および比較するため、スペーサー相補性領域中の全ての考えられる位置における単一ミスマッチを含有するsgRNAを使用してそれらの活性を試験した。SpCas9−HF1およびeSPCas9−1.1バリアントの両方が野生型SpCas9と比較してほとんどの単一ミスマッチsgRNAに対する類似の活性を有し、いくつかの例外でSpCas9−HF1がeSpCas9−1.1を上回った(図16)。
【0135】
次に、二重突然変異体(Db=Q695A/Q926A)、SpCas9−HF1(N497A/R661A/Q695A/Q926A)、eSpCas9−1.0(1.0=K810A/K1003A/R1060A)、またはeSpCas9−1.1(1.1=K848A/K1003A/R1060A)のいずれかからのアミノ酸置換と、標的鎖DNAに接触し、または非標的鎖DNAに潜在的に接触する残基中の追加のアラニン置換との組合せを含有する一部のバリアントの単一ヌクレオチドミスマッチ寛容性を試験した(図17A〜B)。完全マッチsgRNAを使用してオンターゲット活性を評価した一方、スペーサー配列中の4、8、12、または16位におけるそのようなミスマッチを担持するsgRNAを使用して単一ヌクレオチドミスマッチ寛容性を評価した(図17A)。多数のこれらのバリアントはオンターゲット活性を維持し、ミスマッチsgRNAを用いて観察された活性はかなり低減した。これらのバリアントの3つ(Q695A/K848A/Q926A/K1003A/R1060A、N497A/R661A/Q695A/K855A/Q926A/R1060A、およびN497A/R661A/Q695A/Q926A/H982A/R1060A)を、残りの単一ミスマッチsgRNA(1〜3、5〜7、9〜11、13〜15、および17〜20位におけるミスマッチを含有する)を用いてさらに試験した。これらのバリアントは、eSpCas9−1.1と比較してsgRNA中の単一ヌクレオチド置換に対するロバストな不寛容性を実証し、それらの新たなバリアントの改善された特異性プロファイルを実証した(図17B)。アミノ酸置換の代替組合せを含有する追加のバリアントヌクレアーゼを、スペーサー中の5、7、および9位におけるミスマッチを含有するsgRNAを使用して試験した(従来のバリアントがそれらの位置におけるミスマッチを寛容すると考えられたため、それらの特定のミスマッチsgRNAを使用した)(図18)。多数のこれらのヌクレアーゼはミスマッチ部位に対する改善された特異性を有し、オンターゲット活性はわずかに低減したにすぎなかった(図18)。
【0136】
突然変異の追加の組合せが、特異性の改善を付与し得るか否かをさらに決定するため、2つの追加のマッチsgRNAを用いるヌクレアーゼバリアントの大幅に拡張されたパネルを試験して本発明者らのEGFP崩壊活性におけるオンターゲット活性を試験した(図19A)。多数のこれらのバリアントはロバストなオンターゲット活性を維持し、それらが特異性に対するさらなる改善の生成に有用であり得ることを示唆した(図19B)。多数のこれらのバリアントを、12、14、16、または18位における単一置換を含有するsgRNAを用いて試験して特異性の改善が観察されたか否かを決定し、それらの位置における単一ヌクレオチドミスマッチに対するより大きい不寛容性を示すことが見出された(図19B)。
【0137】
実施例3
SpCas9を用いて行ったものと類似する、黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9)を用いる方針を採用することにより、標的DNA鎖に接触することが公知の残基(図20および21A)、非標的DNAに接触し得る残基(進行中の実験)、およびPAM特異性に影響し得ると本発明者らが既に示した残基(図21B)中のアラニン置換を導入することによりSaCas9の特異性を改善するための実験を実施した。標的鎖DNA骨格に接触し得る残基としては、Y211、Y212、W229、Y230、R245、T392、N419、L446、Y651、およびR654が挙げられ;非標的鎖DNAに接触し得る残基としては、Q848、N492、Q495、R497、N498、R499、Q500、K518、K523、K525、H557、R561、K572、R634、R654、G655、N658、S662、N668、R686、K692、R694、H700、K751が挙げられ;PAMに接触する残基としては、E782、D786、T787、Y789、T882、K886、N888、A889、L909、K929、N985、N986、R991、およびR1015が挙げられる。予備実験において、標的鎖DNA接触残基またはPAM接触残基(それぞれ図21AおよびB)中の単一アラニン置換(またはそれらの一部の組合せ)は、オンターゲットEGFP崩壊活性に対する可変効果を有し(完全マッチsgRNAを使用)、オフターゲット開裂を排除し得なかった(11および12位においてミスマッチするsgRNAを使用した場合)。興味深いことに、HF1中のSpCas9突然変異は、類似ミスマッチ標的/sgRNAペアを用いてオフターゲット活性を完全に停止させ得ず、(SpCas9を用いて観察されたとおり)標的鎖/非標的鎖置換の組合せを含有するバリアントがそのような部位における特異性を改善するために必要であり得ることを示唆した。
【0138】
潜在的な標的鎖DNA接触を突然変異させてSaCas9特異性を改善する方針をさらに評価するため、sgRNA中の19および20位におけるミスマッチを寛容する突然変異の単一、二重、三重、および四重組合せの潜在性を試験した(図22AおよびB)。これらの組合せにより、Y230およびR245におけるアラニン置換が、他の置換と組み合わせた場合、ミスマッチ部位をより良好に区別する能力により判断されるとおり、特異性を増加させ得ることが明らかになった。
【0139】
次に、これらの三重アラニン置換バリアントの2つ(Y211A/Y230A/R245AおよびY212A/Y230A/R245A)のオンターゲット遺伝子崩壊活性を、EGFP中の4つのオンターゲット部位で試験した(マッチ部位#1〜4;図23)。これらのバリアントは、マッチ部位1および2についてロバストなオンターゲット活性を維持したが、部位3および4を用いてオンターゲット活性の約60〜70%の損失を示した。これらの三重アラニン置換バリアントの両方は、標的部位1〜4のスペーサー中の種々の位置における二重ミスマッチを担持するsgRNAを使用することにより判断されるとおり、野生型SaCas9に対して特異性を大幅に改善した(図23)。
【0140】
これらのアラニン置換の二重および三重組合せ(それぞれ図24AおよびB)を担持するSaCas9バリアントをオンターゲット活性について6つの内在性部位に対して試験し、21位(最もPAMから遠位の位置は、区別が困難なミスマッチであると予測される)における単一ミスマッチを含有するsgRNAを使用して特異性の改善を評価した。一部の例において、マッチsgRNAを用いるオンターゲット活性はバリアントを用いて維持した一方、21位においてミスマッチするsgRNAを用いて「オフターゲット」活性を排除した(図24AおよびB)。他の場合、マッチsgRNAを用いて活性のわずかな損失から完全な損失が観察された。
【0141】
参考文献
1.Sander,J.D.&Joung,J.K.CRISPR−Cas systems for editing,regulating and targeting genomes.Nat Biotechnol 32,347−355(2014).
2.Hsu,P.D.,Lander,E.S.&Zhang,F.Development and applications of CRISPR−Cas9 for genome engineering.Cell 157,1262−1278(2014).
3.Doudna,J.A.&Charpentier,E.Genome editing.The new frontier of genome engineering with CRISPR−Cas9.Science 346,1258096(2014).
4.Barrangou,R.&May,A.P.Unraveling the potential of CRISPR−Cas9 for gene therapy.Expert Opin Biol Ther 15,311−314(2015).
5.Jinek,M.et al.A programmable dual−RNA−guided DNA endonuclease in adaptive bacterial immunity.Science 337,816−821(2012).
6.Sternberg,S.H.,Redding,S.,Jinek,M.,Greene,E.C.&Doudna,J.A.DNA interrogation by the CRISPR RNA−guided endonuclease Cas9.Nature 507,62−67(2014).
7.Hsu,P.D.et al.DNA targeting specificity of RNA−guided Cas9 nucleases.Nat Biotechnol 31,827−832(2013).
8.Tsai,S.Q.et al.GUIDE−seq enables genome−wide profiling of off−target cleavage by CRISPR−Cas nucleases.Nat Biotechnol 33,187−197(2015).
9.Hou,Z.et al.Efficient genome engineering in human pluripotent stem cells using Cas9 from Neisseria meningitidis.Proc Natl Acad Sci USA(2013).
10.Fonfara,I.et al.Phylogeny of Cas9 determines functional exchangeability of dual−RNA and Cas9 among orthologous type II CRISPR−Cas systems.Nucleic Acids Res 42,2577−2590(2014).
11.Esvelt,K.M.et al.Orthogonal Cas9 proteins for RNA−guided gene regulation and editing.Nat Methods 10,1116−1121(2013).
12.Cong,L.et al.Multiplex genome engineering using CRISPR/Cas systems.Science 339,819−823(2013).
13.Horvath,P.et al.Diversity,activity,and evolution of CRISPR loci in Streptococcus thermophilus.J Bacteriol 190,1401−1412(2008).
14.Anders,C.,Niewoehner,O.,Duerst,A.&Jinek,M.Structural basis of PAM−dependent target DNA recognition by the Cas9 endonuclease.Nature 513,569−573(2014).
15.Reyon,D.et al.FLASH assembly of TALENs for high−throughput genome editing.Nat Biotechnol 30,460−465(2012).
16.Fu,Y.et al.High−frequency off−target mutagenesis induced by CRISPR−Cas nucleases in human cells.Nat Biotechnol 31,822−826(2013).
17.Chen,Z.&Zhao,H.A highly sensitive selection method for directed evolution of homing endonucleases.Nucleic Acids Res 33,e154(2005).
18.Doyon,J.B.,Pattanayak,V.,Meyer,C.B.&Liu,D.R.Directed evolution and substrate specificity profile of homing endonuclease I−SceI.J Am Chem Soc 128,2477−2484(2006).
19.Jiang,W.,Bikard,D.,Cox,D.,Zhang,F.&Marraffini,L.A.RNA−guided editing of bacterial genomes using CRISPR−Cas systems.Nat Biotechnol 31,233−239(2013).
20.Mali,P.et al.RNA−guided human genome engineering via Cas9.Science 339,823−826(2013).
21.Hwang,W.Y.et al.Efficient genome editing in zebrafish using a CRISPR−Cas system.Nat Biotechnol 31,227−229(2013).
22.Chylinski,K.,Le Rhun,A.&Charpentier,E.The tracrRNA and Cas9 families of type II CRISPR−Cas immunity systems.RNA Biol 10,726−737(2013).
23.Kleinstiver,B.P.,Fernandes,A.D.,Gloor,G.B.&Edgell,D.R.A unified genetic,computational and experimental framework identifies functionally relevant residues of the homing endonuclease I−BmoI.Nucleic Acids Res 38,2411−2427(2010).
24.Gagnon,J.A.et al.Efficient mutagenesis by Cas9 protein−mediated oligonucleotide insertion and large−scale assessment of single−guide RNAs.PLoS One 9,e98186(2014).
【0142】
配列
配列番号271 − JDS246:CMV−T7−ヒトSpCas9−NLS−3xFLAG
ヒトコドン最適化化膿性連鎖球菌(S.pyogenes)Cas9、通常フォント、NLS、二重下線、3xFLAGタグ、太字:
【化4】
【0143】
配列番号272 − VP12:CMV−T7−ヒトSpCas9−HF1(N497A、R661A、Q695A、Q926A)−NLS−3xFLAG
ヒトコドン最適化化膿性連鎖球菌(S.pyogenes)Cas9、通常フォント、改変コドン、小文字、NLS、二重下線、3xFLAGタグ、太字:
【化5】
【0144】
配列番号273 − MSP2135:CMV−T7−ヒトSpCas9−HF2(N497A、R661A、Q695A、Q926A、D1135E)−NLS−3xFLAG
ヒトコドン最適化化膿性連鎖球菌(S.pyogenes)Cas9、通常フォント、改変コドン、小文字、NLS、二重下線、3xFLAGタグ、太字:
【化6】
【0145】
配列番号274 − MSP2133:CMV−T7−ヒトSpCas9−HF4(Y450A、N497A、R661A、Q695A、Q926A)−NLS−3xFLAG
ヒトコドン最適化化膿性連鎖球菌(S.pyogenes)Cas9、通常フォント、改変コドン、小文字、NLS、二重下線、3xFLAGタグ、太字:
【化7】
【0146】
配列番号275 − MSP469:CMV−T7−ヒトSpCas9−VQR(D1135V、R1335Q、T1337R)−NLS−3xFLAG
ヒトコドン最適化化膿性連鎖球菌(S.pyogenes)Cas9、通常フォント、改変コドン、小文字、NLS、二重下線、3xFLAGタグ、太字:
【化8】
【0147】
配列番号276 − MSP2440:CMV−T7−ヒトSpCas9−VQR−HF1(N497A、R661A、Q695A、Q926A、D1135V、R1335Q、T1337R)−NLS−3xFLAG
ヒトコドン最適化化膿性連鎖球菌(S.pyogenes)Cas9、通常フォント、改変コドン、小文字、NLS、二重下線、3xFLAGタグ、太字:
【化9】
【0148】
配列番号277 − BPK2797:CMV−T7−ヒトSpCas9−VRQR(D1135V、G1218R、R1335Q、T1337R)−NLS−3xFLAG
ヒトコドン最適化化膿性連鎖球菌(S.pyogenes)Cas9、通常フォント、改変コドン、小文字、NLS、二重下線、3xFLAGタグ、太字:
【化10】
【0149】
配列番号278 − MSP2443:CMV−T7−ヒトSpCas9−VRQR−HF1(N497A、R661A、Q695A、Q926A、D1135V、G1218R、R1335Q、T1337R)−NLS−3xFLAG
ヒトコドン最適化化膿性連鎖球菌(S.pyogenes)Cas9、通常フォント、改変コドン、小文字、NLS、二重下線、3xFLAGタグ、太字:
【化11】
【0150】
配列番号279 − BPK1520:U6−BsmBIカセット−Sp−sgRNA
U6プロモーター、通常フォント、BsmBI部位、イタリック、化膿性連鎖球菌(S.pyogenes)sgRNA、小文字、U6ターミネーター、二重下線:
【化12】
【0151】
他の実施形態
本発明をその詳細な説明とともに記載した一方、上記の説明は、添付の特許請求の範囲
の範囲により定義される本発明の範囲を説明するものであり、限定するものではないこと
を理解すべきである。他の態様、利点、および改変は、以下の特許請求の範囲の範囲内で
ある。

上記の開示に基づく発明の例として、以下のものが挙げられる。
[1] 以下の位置:L169、Y450、N497、R661、Q695、Q926、および/またはD1135の1、2、3、4、5、6、または7つ全てにおける突然変異を有し、好ましくは、以下の位置:L169、Y450、N497、R661、Q695、Q926、D1135の1、2、3、4、5、6、または7つにおける突然変異を有する配列番号1のアミノ酸配列と少なくとも80%同一である配列ならびに任意選択的に核局在化配列、細胞浸透ペプチド配列、および/または親和性タグの1つ以上を含む単離化膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)タンパク質。
[2] 以下:N497、R661、Q695、およびQ926の1、2、3、または4つ全てにおける突然変異、好ましくは、以下の突然変異:N497A、R661A、Q695A、およびQ926Aの1、2、3、または4つ全てを含む、[1]に記載の単離タンパク質。
[3] Q695および/またはQ926の一方または両方ならびに任意選択的にL169、Y450、N497、R661、およびD1135の1、2、3、4、または5つ全てにおける突然変異、好ましくは、Y450A/Q695A、L169A/Q695A、Q695A/Q926A、Q695A/D1135E、Q926A/D1135E、Y450A/D1135E、L169A/Y450A/Q695A、L169A/Q695A/Q926A、Y450A/Q695A/Q926A、R661A/Q695A/Q926A、N497A/Q695A/Q926A、Y450A/Q695A/D1135E、Y450A/Q926A/D1135E、Q695A/Q926A/D1135E、L169A/Y450A/Q695A/Q926A、L169A/R661A/Q695A/Q926A,Y450A/R661A/Q695A/Q926A、N497A/Q695A/Q926A/D1135E、R661A/Q695A/Q926A/D1135E、またはY450A/Q695A/Q926A/D1135Eを含む、[1]に記載の単離タンパク質。
[4] N14;S15;S55;R63;R78;H160;K163;R165;L169;R403;N407;Y450;M495;N497;K510;Y515;W659;R661;M694;Q695;H698;A728;S730;K775;S777;R778;R780;K782;R783;K789;K797;Q805;N808;K810;R832;Q844;S845;K848;S851;K855;R859;K862;K890;Q920;Q926;K961;S964;K968;K974;R976;N980;H982;K1003;Y1013;K1014;V1015;S1040;N1041;N1044;K1047;K1059;R1060;K1107;E1108;S1109;K1113;R1114;S1116;K1118;R1122;K1123;K1124;D1135;S1136;K1153;K1155;K1158;K1200;Q1221;H1241;Q1254;Q1256;K1289;K1296;K1297;R1298;K1300;H1311;K1325;K1334;T1337および/またはS1216における突然変異、好ましくは、N497A/R661A/Q695A/Q926A/K810A、N497A/R661A/Q695A/Q926A/K848A、N497A/R661A/Q695A/Q926A/K855A、N497A/R661A/Q695A/Q926A/R780A、N497A/R661A/Q695A/Q926A/K968A、N497A/R661A/Q695A/Q926A/H982A、N497A/R661A/Q695A/Q926A/K1003A、N497A/R661A/Q695A/Q926A/K1014A、N497A/R661A/Q695A/Q926A/K1047A、N497A/R661A/Q695A/Q926A/R1060A、N497A/R661A/Q695A/Q926A/K810A/K968A、N497A/R661A/Q695A/Q926A/K810A/K848A、N497A/R661A/Q695A/Q926A/K810A/K1003A、N497A/R661A/Q695A/Q926A/K810A/R1060A、N497A/R661A/Q695A/Q926A/K848A/K1003A、N497A/R661A/Q695A/Q926A/K848A/R1060A、N497A/R661A/Q695A/Q926A/K855A/K1003A、N497A/R661A/Q695A/Q926A/K855A/R1060A、N497A/R661A/Q695A/Q926A/K968A/K1003A、N497A/R661A/Q695A/Q926A/H982A/K1003A、N497A/R661A/Q695A/Q926A/H982A/R1060A、N497A/R661A/Q695A/Q926A/K1003A/R1060A、N497A/R661A/Q695A/Q926A/K810A/K1003A/R1060A、N497A/R661A/Q695A/Q926A/K848A/K1003A/R1060A、Q695A/Q926A/R780A、Q695A/Q926A/K810A、Q695A/Q926A/R832A、Q695A/Q926A/K848A、Q695A/Q926A/K855A、Q695A/Q926A/K968A、Q695A/Q926A/R976A、Q695A/Q926A/H982A、Q695A/Q926A/K1003A、Q695A/Q926A/K1014A、Q695A/Q926A/K1047A、Q695A/Q926A/R1060A、Q695A/Q926A/K848A/K968A、Q695A/Q926A/K848A/K1003A、Q695A/Q926A/K848A/K855A、Q695A/Q926A/K848A/H982A、Q695A/Q926A/K1003A/R1060A、Q695A/Q926A/R832A/R1060A、Q695A/Q926A/K968A/K1003A、Q695A/Q926A/K968A/R1060A、Q695A/Q926A/K848A/R1060A、Q695A/Q926A/K855A/H982A、Q695A/Q926A/K855A/K1003A、Q695A/Q926A/K855A/R1060A、Q695A/Q926A/H982A/K1003A、Q695A/Q926A/H982A/R1060A、Q695A/Q926A/K1003A/R1060A、Q695A/Q926A/K810A/K1003A/R1060A、Q695A/Q926A/K1003A/K1047A/R1060A、Q695A/Q926A/K968A/K1003A/R1060A、Q695A/Q926A/R832A/K1003A/R1060A、またはQ695A/Q926A/K848A/K1003A/R1060Aをさらに含む、[1]に記載の単離タンパク質。
[5] 以下の突然変異:D1135E;D1135V;D1135V/R1335Q/T1337R(VQRバリアント);D1135E/R1335Q/T1337R(EQRバリアント);D1135V/G1218R/R1335Q/T1337R(VRQRバリアント);またはD1135V/G1218R/R1335E/T1337R(VRERバリアント)の1つ以上をさらに含む、[1]に記載の単離タンパク質。
[6] D10、E762、D839、H983、またはD986;およびH840またはN863における突然変異からなる群から選択される、ヌクレアーゼ活性を減少させる1つ以上の突然変異をさらに含む、[1]に記載の単離タンパク質。
[7] ヌクレアーゼ活性を減少させる前記突然変異が、
(i)D10AまたはD10N、および
(ii)H840A、H840N、またはH840Y
である、[6に記載の単離タンパク質。
[8] 以下の位置:Y211、Y212、W229、Y230、R245、T392、N419、Y651、R654の1、2、3、4、5、6つ以上における突然変異を有し、好ましくは、以下の位置:Y211、Y212、W229、Y230、R245、T392、N419、Y651、R654の1、2、3、4、または5、6つ以上における突然変異を有する配列番号1のアミノ酸配列と少なくとも80%同一である配列ならびに任意選択的に核局在化配列、細胞浸透ペプチド配列、および/または親和性タグの1つ以上を含む単離黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9)タンパク質。
[9] 以下の突然変異:Y211A、Y212A、W229、Y230A、R245A、T392A、N419A、Y651、および/またはR654Aの1つ以上を含む、[8]に記載の単離タンパク質。
[10] N419および/またはR654における突然変異ならびに任意選択的に追加の突然変異Y211、Y212、W229、Y230、R245およびT392の1、2、3、4つ以上、好ましくは、N419A/R654A、Y211A/R654A、Y211A/Y212A、Y211A/Y230A、Y211A/R245A、Y212A/Y230A、Y212A/R245A、Y230A/R245A、W229A/R654A、Y211A/Y212A/Y230A、Y211A/Y212A/R245A、Y211A/Y212A/Y651A、Y211A/Y230A/R245A、Y211A/Y230A/Y651A、Y211A/R245A/Y651A、Y211A/R245A/R654A、Y211A/R245A/N419A、Y211A/N419A/R654A、Y212A/Y230A/R245A、Y212A/Y230A/Y651A、Y212A/R245A/Y651A、Y230A/R245A/Y651A、R245A/N419A/R654A、T392A/N419A/R654A、R245A/T392A/N419A/R654A、Y211A/R245A/N419A/R654A、W229A/R245A/N419A/R654A、Y211A/R245A/T392A/N419A/R654A、またはY211A/W229A/R245A/N419A/R654Aを含む、[8]に記載の単離タンパク質。
[11] Y211;Y212;W229;Y230;R245;T392;N419;L446;Q488A;N492A;Q495A;R497A;N498A;R499;Q500;K518;K523;K525;H557;R561;K572;R634;Y651;R654;G655;N658;S662;N667;R686;K692;R694;H700;K751;D786;T787;Y789;T882;K886;N888;889;L909;N985;N986;R991;R1015;N44;R45;R51;R55;R59;R60;R116;R165;N169;R208;R209;Y211;T238;Y239;K248;Y256;R314;N394;Q414;K57;R61;H111;K114;V164;R165;L788;S790;R792;N804;Y868;K870;K878;K879;K881;Y897;R901;および/またはK906における突然変異をさらに含む、[8]に記載の単離タンパク質。
[12] 以下の突然変異:E782K、K929R、N968K、またはR1015Hの1つ以上、具体的には、E782K/N968K/R1015H(KKHバリアント);E782K/K929R/R1015H(KRHバリアント);またはE782K/K929R/N968K/R1015H(KRKHバリアント)をさらに含む、[8]に記載の単離タンパク質。
[13] D10、E477、D556、H701、またはD704;およびH557またはN580における突然変異からなる群から選択される、ヌクレアーゼ活性を減少させる1つ以上の突然変異をさらに含む、[8]に記載の単離タンパク質。
[14] 前記突然変異が、
(i)D10AもしくはD10N、および/または
(ii)H557A、H557N、もしくはH557Y、および/または
(iii)N580A、および/または
(iv)D556A
である、[13]に記載の単離タンパク質。
[15] 任意選択の介在リンカーにより異種機能ドメインに融合されている[1]〜[14]のいずれか一項に記載の単離タンパク質を含む融合タンパク質であって、前記リンカーが前記融合タンパク質の活性を妨害しない、融合タンパク質。
[16] 前記異種機能ドメインが転写活性化ドメインである、[15]に記載の融合タンパク質。
[17] 前記転写活性化ドメインがVP64またはNF−κB p65からのものである、[16に記載の融合タンパク質。
[18] 前記異種機能ドメインが転写サイレンサーまたは転写抑制ドメインである、[15]に記載の融合タンパク質。
[19] 前記転写抑制ドメインが、クルッペル関連ボックス(KRAB)ドメイン、ERFリプレッサードメイン(ERD)、またはmSin3A相互作用ドメイン(SID)である、[18]に記載の融合タンパク質。
[20] 前記転写サイレンサーがヘテロクロマチンタンパク質1(HP1)、好ましくはHP1αまたはHP1βである、[18]に記載の融合タンパク質。
[21] 前記異種機能ドメインが、DNAのメチル化状態を改変する酵素である、[15]に記載の融合タンパク質。
[22] 前記DNAのメチル化状態を改変する前記酵素がDNAメチルトランスフェラーゼ(DNMT)またはTETタンパク質である、[21]に記載の融合タンパク質。
[23] 前記TETタンパク質がTET1である、[22]に記載の融合タンパク質。
[24] 前記異種機能ドメインが、ヒストンサブユニットを改変する酵素である、[15]に記載の融合タンパク質。
[25] ヒストンサブユニットを改変する前記酵素が、ヒストンアセチルトランスフェラーゼ(HAT)、ヒストンデアセチラーゼ(HDAC)、ヒストンメチルトランスフェラーゼ(HMT)、またはヒストンデメチラーゼである、[15]に記載の融合タンパク質。
[26] 前記異種機能ドメインが生物学的係留物である、[15]に記載の融合タンパク質。
[27] 前記生物学的係留物がMS2、Csy4またはラムダNタンパク質である、[26]に記載の融合タンパク質。
[28] 前記異種機能ドメインがFokIである、[26]に記載の融合タンパク質。
[29] [1]〜[14]のいずれか一項に記載のタンパク質をコードする単離核酸。
[30] 任意選択的に、[1]〜[24]のいずれか一項に記載のタンパク質を発現させるための1つ以上の調節ドメインに作動可能に結合されている、[29]に記載の単離核酸を含むベクター。
[31] [29]に記載の核酸を含み、かつ任意選択的に[1]〜[14]のいずれか一項に記載のタンパク質を発現する宿主細胞、好ましくは哺乳動物宿主細胞。
[32] 細胞のゲノムまたはエピゲノムを変更する方法であって、前記細胞中で、[1]〜[14]のいずれか一項に記載の単離タンパク質および前記細胞の前記ゲノムの選択部分に相補的な領域を有するガイドRNAを発現させるか、またはそれらと前記細胞を接触させることを含む方法。
[33] [15]に記載のタンパク質をコードする単離核酸。
[34] 任意選択的に、[15]に記載のタンパク質を発現させるための1つ以上の調節ドメインに作動可能に結合されている、[33]に記載の単離核酸を含むベクター。
[35] [33]に記載の核酸を含み、かつ任意選択的に[15]に記載のタンパク質を発現する宿主細胞、好ましくは哺乳動物宿主細胞。
[36] 細胞のゲノムまたはエピゲノムを変更する方法であって、前記細胞中で、[1]〜[14]のいずれか一項に記載の単離タンパク質および前記細胞の前記ゲノムの選択部分に相補的な領域を有するガイドRNAを発現させるか、またはそれらと前記細胞を接触させることを含む方法。
[37] 細胞のゲノムまたはエピゲノムを変更する方法であって、前記細胞中で、[15]〜[28]のいずれか一項に記載の単離融合タンパク質および前記細胞の前記ゲノムの選択部分に相補的な領域を有するガイドRNAを発現させるか、またはそれらと前記細胞を接触させることを含む方法。
[38] 前記単離タンパク質または融合タンパク質が、核局在化配列、細胞浸透ペプチド配列、および/または親和性タグの1つ以上を含む、[36]または[37]に記載の方法。
[39] 前記細胞が、幹細胞、好ましくは、胚性幹細胞、間葉系幹細胞、もしくは誘導多能性幹細胞であるか、生存動物中に存在するか、または胚中に存在する、[36]または[37]に記載の方法。
[40] 二本鎖DNA D(dsDNA)分子を変更する方法であって、前記dsDNA分子を[1]〜[14]のいずれか一項に記載の単離タンパク質および前記dsDNA分子の選択部分に相補的な領域を有するガイドRNAと接触させることを含む方法。
[41] 前記dsDNA分子がインビトロで存在する、[40]に記載の方法。
[42] 二本鎖DNA D(dsDNA)分子を変更する方法であって、前記dsDNA分子を[15]に記載の融合タンパク質および前記dsDNA分子の選択部分に相補的な領域を有するガイドRNAと接触させることを含む方法。
[43] 前記dsDNA分子がインビトロで存在する、[42]に記載の方法。

図1-1】
図1-2】
図1-3】
図2-1】
図2-2】
図3-1】
図3-2】
図3-3】
図4-1】
図4-2】
図5-1】
図5-2】
図5-3】
図6-1】
図6-2】
図7
図8
図9
図10
図11
図12-1】
図12-2】
図13
図14
図15
図16
図17
図18
図19-1】
図19-2】
図20
図21
図22-1】
図22-2】
図23
図24
【配列表】
[この文献には参照ファイルがあります.J-PlatPatにて入手可能です(IP Forceでは現在のところ参照ファイルは掲載していません)]