IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ザ ジェネラル ホスピタル コーポレイションの特許一覧

特許7581046変更されたPAM特異性を有する遺伝子操作されたCRISPR-Cas9ヌクレアーゼ
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-01
(45)【発行日】2024-11-12
(54)【発明の名称】変更されたPAM特異性を有する遺伝子操作されたCRISPR-Cas9ヌクレアーゼ
(51)【国際特許分類】
   C12N 15/09 20060101AFI20241105BHJP
   C12N 9/22 20060101ALI20241105BHJP
   C12N 15/55 20060101ALI20241105BHJP
   C07K 19/00 20060101ALI20241105BHJP
   C07K 14/47 20060101ALI20241105BHJP
   C12N 15/62 20060101ALI20241105BHJP
   C12N 15/12 20060101ALI20241105BHJP
   C12N 15/54 20060101ALI20241105BHJP
   C12N 9/10 20060101ALI20241105BHJP
   C12N 15/63 20060101ALI20241105BHJP
   C12N 5/10 20060101ALI20241105BHJP
   C12N 5/0735 20100101ALI20241105BHJP
   C12N 5/0775 20100101ALI20241105BHJP
   C12N 5/074 20100101ALI20241105BHJP
   C12N 9/16 20060101ALI20241105BHJP
【FI】
C12N15/09 110
C12N9/22 ZNA
C12N15/55
C07K19/00
C07K14/47
C12N15/62 Z
C12N15/12
C12N15/54
C12N9/10
C12N15/63 Z
C12N5/10
C12N5/0735
C12N5/0775
C12N5/074
C12N9/16
【請求項の数】 32
(21)【出願番号】P 2020511253
(86)(22)【出願日】2018-08-22
(65)【公表番号】
(43)【公表日】2020-11-19
(86)【国際出願番号】 US2018047577
(87)【国際公開番号】W WO2019040650
(87)【国際公開日】2019-02-28
【審査請求日】2021-08-17
(31)【優先権主張番号】62/549,303
(32)【優先日】2017-08-23
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/641,687
(32)【優先日】2018-03-12
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】592017633
【氏名又は名称】ザ ジェネラル ホスピタル コーポレイション
(74)【代理人】
【識別番号】100092783
【弁理士】
【氏名又は名称】小林 浩
(74)【代理人】
【識別番号】100120134
【弁理士】
【氏名又は名称】大森 規雄
(74)【代理人】
【識別番号】100186897
【弁理士】
【氏名又は名称】平川 さやか
(74)【代理人】
【氏名又は名称】鈴木 康仁
(72)【発明者】
【氏名】ジョン,キース,ジェイ.
(72)【発明者】
【氏名】クラインスティーバー,ベンジャミン
【審査官】山本 匡子
(56)【参考文献】
【文献】国際公開第2017/070633(WO,A1)
【文献】Kleinstiver BP, et al.,Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition,Nat Biotechnol.,33(12),2015年12月,pp.1293-1298
(58)【調査した分野】(Int.Cl.,DB名)
C12N
C07K
REGISTRY/CAPLUS/MEDLINE/EMBASE/BIOSIS(STN)
JSTPlus/JMEDPlus/JST7580(JDreamIII)
GenBank/EMBL/Geneseq
Uniprot/Geneseq
(57)【特許請求の範囲】
【請求項1】
配列番号1において以下の位置:D1135、S1136、G1218、E1219、R1335およびT1337の6つすべてで変異を有し、かつ、配列番号1のアミノ酸配列において少なくとも95%の同一性を有する、単離された化膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)タンパク質であって、
以下の変異を有する、前記タンパク質:
(i)NGTN PAMを標的とし、以下から選択される変異:
IRAVQL、VRAVQL、LRSVQL、LRKIQK、LRSVQK、VRKLLR、LWKIQK、VRKIQK、GRKIQK、VRMHCK、LCRQQR、CWSHQR、SWRVVV、SWKVLK、MWVHLN、KRRCKV、SRMHCK、GWKLLR、GWKQQK、VAKLLR、VAKIQK、VAKILR、GRKILR、MQSVQL、またはTAHFKVバリアント;
(ii)NGCN PAMを標的とし、以下から選択される変異:
MQKSER、VRKSER、ICKSER、LWLETR、LCRQQR、CWSHQR、ICCCER、MCSFER、LWRVVA、WMQAYG、LRSVER、LWRVVA、LWRSEY、LWMREQ、FMQWVN、YCSWVG、MCAWCG、またはFMQWVRバリアント;
(iii)NGAN PAMを標的とし、以下から選択される変異:
LWKIQK、LCRQQR、CWSHQR、LRLSAR、KWMMCG、AWNFQV、LWTTLN、CWCQCV、VRMHCK、MRARKE、AEEQQR、GWEKVR、NRAVNG、LRSYLH、VQDAQR、GWRQSK、AWLCLS、KWARVV、SRMHCK、VKMAKG、SRTHTQ、QRKTRE、またはLWEVIRバリアント。
【請求項2】
D10、E762、D839、H983またはD986;およびH840またはN863での変異からなる群から選択されるヌクレアーゼ活性を減少させる1つまたは複数の変異をさらに含む、請求項1に記載の単離されたタンパク質。
【請求項3】
前記変異が、
(i)D10AまたはD10N、および
(ii)H840A、H840NまたはH840Y
での変異である、請求項2に記載の単離されたタンパク質。
【請求項4】
N497、R661、N692、M694、Q695、H698、K810、K848、Q926、K1003およびR1060での変異からなる群から選択される特異性を増加させる1つまたは複数の変異をさらに含む、請求項1~3のいずれか1項に記載の単離されたタンパク質。
【請求項5】
前記変異が、
N692A、Q695A、Q926A、H698A、N497A、R661A、M694A、K810A、K848A、K1003A、R0160A、Y450A/Q695A、L169A/Q695A、Q695A/Q926A、Q695A/D1135E、Q926A/D1135E、Y450A/D1135E、L169A/Y450A/Q695A、L169A/Q695A/Q926A、Y450A/Q695A/Q926A、R661A/Q695A/Q926A、N497A/Q695A/Q926A、Y450A/Q695A/D1135E、Y450A/Q926A/D1135E、Q695A/Q926A/D1135E、L169A/Y450A/Q695A/Q926A、L169A/R661A/Q695A/Q926A、Y450A/R661A/Q695A/Q926A、N497A/Q695A/Q926A/D1135E、R661A/Q695A/Q926A/D1135E、およびY450A/Q695A/Q926A/D1135E;N692A/M694A/Q695A/H698A、N692A/M694A/Q695A/H698A/Q926A;N692A/M694A/Q695A/Q926A;N692A/M694A/H698A/Q926A;N692A/Q695A/H698A/Q926A;M694A/Q695A/H698A/Q926A;N692A/Q695A/H698A;N692A/M694A/Q695A;N692A/H698A/Q926A;N692A/M694A/Q926A;N692A/M694A/H698A;M694A/Q695A/H698A;M694A/Q695A/Q926A;Q695A/H698A/Q926A;G582A/V583A/E584A/D585A/N588A/Q926A;G582A/V583A/E584A/D585A/N588A;T657A/G658A/W659A/R661A/Q926A;T657A/G658A/W659A/R661A;F491A/M495A/T496A/N497A/Q926A;F491A/M495A/T496A/N497A;K918A/V922A/R925A/Q926A;または918A/V922A/R925A;K855A;K810A/K1003A/R1060A;またはK848A/K1003A/R1060A
の変異を含む、請求項4に記載の単離されたタンパク質。
【請求項6】
K526および/またはR691での変異をさらに含む、請求項4または5に記載の単離されたタンパク質。
【請求項7】
K526Aおよび/またはR691Aの変異をさらに含む、請求項6に記載の単離されたタンパク質。
【請求項8】
任意の介在リンカーで異種性機能ドメインと融合された請求項1~7のいずれか1項に記載の単離されたタンパク質を含む融合タンパク質であって、前記リンカーが、前記融合タンパク質の活性を妨げない、融合タンパク質。
【請求項9】
前記異種性機能ドメインが、
(i)転写活性化ドメインであり、
(ii)転写サイレンサーまたは転写抑制ドメインであり、
(iii)DNAのメチル化状態を改変する酵素であり、
(iv)ヒストンサブユニットを改変する酵素であり、
(v)塩基エディターであり、
(vi)生物学的テザーであり、または
(vii)FokIである、
請求項8に記載の融合タンパク質。
【請求項10】
前記転写活性化ドメインが、VP16、VP64、rTA、NF-κB p65または複合性VPR(VP64-p65-rTA)からのものである、請求項9に記載の融合タンパク質。
【請求項11】
前記転写抑制ドメインが、クルッペル関連ボックス(KRAB)ドメイン、ERFリプレッサードメイン(ERD)もしくはmSin3A相互作用ドメイン(SID)であり、または前記転写サイレンサーが、ヘテロクロマチンタンパク質1(HP1)である、請求項9に記載の融合タンパク質。
【請求項12】
DNAのメチル化状態を改変する前記酵素が、DNAメチルトランスフェラーゼ(DNMT)またはTETタンパク質である、請求項9に記載の融合タンパク質。
【請求項13】
前記TETタンパク質が、TET1である、請求項12に記載の融合タンパク質。
【請求項14】
ヒストンサブユニットを改変する前記酵素が、ヒストンアセチルトランスフェラーゼ(HAT)、ヒストンデアセチラーゼ(HDAC)、ヒストンメチルトランスフェラーゼ(HMT)またはヒストンデメチラーゼである、請求項9に記載の融合タンパク質。
【請求項15】
前記生物学的テザーが、MS2、Csy4またはラムダNタンパク質である、請求項9に記載の融合タンパク質。
【請求項16】
前記塩基エディターが、(a)シチジンデアミナーゼドメイン、または(b)アデノシンデアミナーゼである、請求項9に記載の融合タンパク質。
【請求項17】
シチジンデアミナーゼドメインが、アポリポタンパク質B mRNA編集酵素、デアミナーゼの触媒ポリペプチド様(APOBEC)ファミリー、活性化誘導シチジンデアミナーゼ(AID)、シトシンデアミナーゼ1(CDA1)およびCDA2、ならびにtRNAに作用するシトシンデアミナーゼ(CDAT)からなる群から選択される、請求項16に記載の融合タンパク質。
【請求項18】
APOBECが、APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D/E、APOBEC3F、APOBEC3G、APOBEC3HまたはAPOBEC4である、請求項17に記載の融合タンパク質。
【請求項19】
AIDが、活性化誘導シチジンデアミナーゼ(AICDA)である、請求項17に記載の融合タンパク質。
【請求項20】
アデノシンデアミナーゼが、アデノシンデアミナーゼ1(ADA1)、ADA2;RNA1に作用するアデノシンデアミナーゼ(ADAR1)、ADAR2、ADAR3;tRNA1に作用するアデノシンデアミナーゼ(ADAT1)、ADAT2、ADAT3;および天然に存在するまたは遺伝子操作されたtRNA特異的アデノシンデアミナーゼ(TadA)からなる群から選択される、請求項16に記載の融合タンパク質。
【請求項21】
請求項1~20のいずれか1項に記載のタンパク質をコードする単離された核酸。
【請求項22】
請求項21に記載の単離された核酸を含むベクター。
【請求項23】
単離された核酸が、以下の位置:D1135、S1136、G1218、E1219、R1335およびT1337の6つすべてで変異を有する、単離された化膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)タンパク質を発現するための1つまたは複数の制御ドメインに作動可能に連結された、請求項22に記載のベクター。
【請求項24】
請求項21に記載の核酸を含む、宿主細胞。
【請求項25】
請求項1~20のいずれか1項に記載のタンパク質を発現する、請求項24に記載の宿主細胞。
【請求項26】
哺乳動物細胞である、請求項24または25に記載の宿主細胞。
【請求項27】
細胞のゲノムを変更するex vivoまたはin vitroの方法であって、請求項1~20のいずれか1項に記載の単離されたタンパク質もしくは融合タンパク質、および前記細胞の前記ゲノムの選択された部分に相補的な領域を有するガイドRNAを、前記細胞で発現させること、または前記細胞をこれらと接触させることを含む方法。
【請求項28】
前記単離されたタンパク質または融合タンパク質が、核局在化配列、細胞透過性ペプチド配列および/またはアフィニティタグの1つまたは複数を含む、請求項27に記載のex vivoまたはin vitroの方法。
【請求項29】
前記細胞が、幹細胞であるか、動物細胞であるか、または胚における細胞である、請求項27または28に記載のex vivoまたはin vitroの方法(ただし、ヒト胚を除く。)
【請求項30】
前記幹細胞が、胚性幹細胞、間葉系幹細胞または人工多能性幹細胞である、請求項29に記載のex vivoまたはin vitroの方法。
【請求項31】
二本鎖DNA(dsDNA)分子を変更するex vivoまたはin vitroの方法であって、前記dsDNA分子を、請求項1~20のいずれか1項に記載の単離されたタンパク質または融合タンパク質、および前記dsDNA分子の選択された部分に相補的な領域を有するガイドRNAと接触させることを含む方法。
【請求項32】
前記融合タンパク質およびRNAが、リボヌクレオタンパク質複合体にある、請求項27に記載のex vivoまたはin vitroの方法。
【発明の詳細な説明】
【技術分野】
【0001】
優先権の主張
本出願は、2017年8月23日に出願された米国仮特許出願第62/549,303号、および2018年3月12日に出願された同第62/641,687号の利益を主張する。前述の全内容は、参照によって本明細書に組み込まれる。
【0002】
連邦政府による支援を受けた研究または開発
本発明は、米国国立衛生研究所によって付与された、助成金番号GM105378、GM107427、GM118158およびGM088040の政府支援により行われた。政府は、本発明において一定の権利を有する。
【0003】
技術分野
本発明は、少なくとも一部は、変更および改善されたプロトスペーサー隣接モチーフ(PAM)特異性を有する遺伝子操作されたクラスター化した規則的な配置の短い回文配列リピート(CRISPR)/CRISPR関連タンパク質9(Cas9)、ならびにゲノム工学、エピゲノム工学およびゲノム標的化におけるそれらの使用に関する。
【背景技術】
【0004】
CRISPR-Cas9ヌクレアーゼは、多種多様な生物体および細胞の種類において、効率が良く、カスタマイズ可能なゲノム編集を可能にする(Sander & Joung, Nat Biotechnol 32, 347-355 (2014);Hsuet al., Cell 157, 1262-1278 (2014); Doudna & Charpentier, Science 346, 1258096 (2014);Barrangou & May, Expert Opin Biol Ther 15, 311-314 (2015))。Cas9による標的部位認識は、crRNAおよびtracrRNAとして公知の2つの短いRNAによって導かれ(Deltcheva et al., Nature 471, 602-607 (2011);Jinek et al., Science 337, 816-821 (2012))、これらは融合してキメラ単一ガイドRNA(sgRNA)とすることができる(Jinek et al., Science 337, 816-821 (2012);Jinek et al., Elife 2, e00471 (2013); Mali et al., Science 339, 823-826 (2013);Cong et al., Science 339, 819-823 (2013))。sgRNA(crRNAに由来する)の5’末端は、標的DNA部位と塩基対形成することができ、それによって、Cas9/sgRNA複合体による部位特異的切断の直接リプログラミングを可能にする(Jinek et al., Science 337, 816-821 (2012))。しかしながら、Cas9は、sgRNAと塩基対形成するDNAの近位にある特異的プロトスペーサー隣接モチーフ(PAM)も認識しなければならず(Mojica et al., Microbiology 155, 733-740 (2009);Shah et al., RNA Biol 10, 891-899 (2013);Jinek et al., Science 337, 816-821 (2012);Sapranauskas et al, Nucleic Acids Res 39, 9275-9282 (2011);Horvath et al., J Bacteriol 190, 1401-1412 (2008))、この要件は、配列特異的な認識を開始するために必要であるが(Sternberg et al., Nature 507, 62-67 (2014))、これはまた、ゲノム編集のためにこれらのヌクレアーゼの標的化範囲を制限し得る。幅広く使用される化膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)は、短いNGG PAMを認識し(Jinek et al., Science 337, 816-821 (2012); Jiang et al., Nat Biotechnol 31, 233-239 (2013))、これは、ランダムなDNA配列の8bpごとに1回生じる。一方、これまでに特徴付けられた他のCas9オルソログは、より長いPAMを認識することができる(Horvath et al., J Bacteriol 190, 1401-1412 (2008);Fonfara et al., Nucleic Acids Res 42, 2577-2590 (2014);Esvelt et al., Nat Methods 10, 1116-1121 (2013);Ran et al., Nature 520, 186-191 (2015);Zhang et al., Mol Cell 50, 488-503 (2013))。例えば、ウイルス送達のためにより適切ないくつかのより小さなCas9オルソログの1つである黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9)は(Horvath et al., J Bacteriol 190, 1401-1412 (2008);Ran et al., Nature 520, 186-191 (2015);Zhang et al., Mol Cell 50, 488-503 (2013))、ランダムなDNAの32bpごとに1回生じると予想されるより長いNNGRRT PAMを認識する。Cas9オルソログの標的化範囲の広幅化は、小さな遺伝要素(例えば、転写因子結合部位(Canver et al. Nature. 527(7577):192-7 (2015);Vierstra et al., Nat Methods. 12(10):927-30 (2015))の改変、またはPAM内に配列の相違を位置させることによるアレル特異的変更を行うこと(Courtney, D.G. et al. Gene Ther. 23(1):108-12 (2015))を含むさまざまな適用のために重要である。本発明者らは、以前に、NGAおよびNGCG PAM配列により部位を認識することができるSpCas9のバリアントを遺伝子操作により作製したが(Kleinstiver et al, Nature 2015;国際公開第2016/141224号パンフレット)、それにもかかわらず多くの代替のPAM配列は標的化できないままである。
【発明の概要】
【0005】
本明細書に記載されるように、一般に使用される化膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)を、構造情報、細菌選択に基づく指向進化およびコンビナトリアル設計を使用して、新規なPAM配列を認識するように遺伝子操作した。これらの変更されたPAM特異性バリアントは、野生型SpCas9によって効率よく標的化することができないヒト細胞中のレポーター部位および内在性遺伝子部位の安定した編集を可能にする。本知見は、本明細書において「バリアント」または「本バリアント」と総称される、幅広く有用なSpCas9バリアントを提供する。
【0006】
第1の態様において、本発明は、以下の位置:D1135、S1136、G1218、E1219、R1335および/もしくはT1337の3つ、4つ、5つまたは6つすべてで、例えば、D1135、S1136、G1218、E1219、R1335および/もしくはT1337(D1135X/S1136X/G1218X/E1219X/R1335X/T1337X、ここで、Xは、任意のアミノ酸である)の2つ、3つ、4つ、5つまたはすべてで、変異を有し、例えば、示された変異を有する配列番号1のアミノ酸配列と少なくとも80%、90%または95%同一である配列を含む、単離された化膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)タンパク質を提供する。いくつかの実施形態において、バリアントSpCas9タンパク質は、表A、1、2または3に示される変異のセット、例えば、以下の変異のセットの1つ:LRSVQL、LRKIQK、LRSVQK、LWKIQK、VRKIQK、LWKIQK、IRAVQL、VRKLRS、GRKIQK、SWRVVV、SWKVLK、TAHFKV、MSGVKC、LRSVRS、SKTLRP、MWVHLN、TWSMRG、KRRCKV、VRAVQL、VSSVRS、VRSVRS、SRMHCK、GWKLLR、GWKOQK、VAKLLR、VAKIQK、VAKILR、GRKILR、VRKLLR、IRAVQL、VRKIQK、またはVRMHCKバリアント(例えば、NGTN PAMについて);MQKSER、VRKSER、ICKSER、LRSVER、LWLETR、LSRWER、MQSVQL、VRREER、ICCCER、LSRWQR、LWRVVA、WMQAYG、LWRSEY、SQSWRS、LKAWRS、LWGWQH、MCSFER、LWMREQ、LWRVVA、HSSWVR、MWSEPT、GSNYQS、FMQWVN、YCSWVG、MCAWCG、FMQWVR、またはSSKWPAバリアント(例えば、NGCN PAMについて);LRSVRS、SRQMRG、MRARKE、SRMHCK、VRREQR、VRGEQR、LRLSAR、AWTEVTR、KWMMCG、VRGAKE、AWNFQV、LWTTLN、SRMHCK、CWCQCV、AEEQQR、GWEKVR、NRAVNG、LRSYLH、VRGNNR、VQDAQR、GWRQSK、AWLCLS、KWARVV、MWAARP、SRMHCK、VKMAKG、QRKTRE、LCRQQR、CWSHQR、SRTHTQ、LWEVIR、VSSVRS、VRSVRS、IRAVRS、SRSVRS、LWKIQK、またはVRMHCKバリアント(例えば、NGAN PAMについて)を含む。いくつかの実施形態において、変異は、VSREER(VRERとしても公知)またはVSREQR(VRQRとしても公知)ではない。
【0007】
いくつかの実施形態において、バリアントSpCas9タンパク質は、D10、E762、D839、H983またはD986;およびH840またはN863での変異からなる群から選択されるヌクレアーゼ活性を減少させる1つまたは複数の変異を含む。いくつかの実施形態において、変異は、(i)D10AまたはD10N、および(ii)H840A、H840NまたはH840Yである。
【0008】
いくつかの実施形態において、バリアントSpCas9タンパク質は、N497、K526、R661、R691、N692、M694、Q695、H698、K810、K848、Q926、K1003および/もしくはR0160での変異からなる群から選択される特異性を増加させる1つまたは複数の変異を含む。いくつかの実施形態において、変異は、N692A、Q695A、Q926A、H698A、N497A、K526A、R661A、R691A、M694A、K810A、K848A、K1003A、R0160A、Y450A/Q695A、L169A/Q695A、Q695A/Q926A、Q695A/D1135E、Q926A/D1135E、Y450A/D1135E、L169A/Y450A/Q695A、L169A/Q695A/Q926A、Y450A/Q695A/Q926A、R661A/Q695A/Q926A、N497A/Q695A/Q926A、Y450A/Q695A/D1135E、Y450A/Q926A/D1135E、Q695A/Q926A/D1135E、L169A/Y450A/Q695A/Q926A、L169A/R661A/Q695A/Q926A、Y450A/R661A/Q695A/Q926A、N497A/Q695A/Q926A/D1135E、R661A/Q695A/Q926A/D1135E、およびY450A/Q695A/Q926A/D1135E;N692A/M694A/Q695A/H698A、N692A/M694A/Q695A/H698A/Q926A;N692A/M694A/Q695A/Q926A;N692A/M694A/H698A/Q926A;N692A/Q695A/H698A/Q926A;M694A/Q695A/H698A/Q926A;N692A/Q695A/H698A;N692A/M694A/Q695A;N692A/H698A/Q926A;N692A/M694A/Q926A;N692A/M694A/H698A;M694A/Q695A/H698A;M694A/Q695A/Q926A;Q695A/H698A/Q926A;G582A/V583A/E584A/D585A/N588A/Q926A;G582A/V583A/E584A/D585A/N588A;T657A/G658A/W659A/R661A/Q926A;T657A/G658A/W659A/R661A;F491A/M495A/T496A/N497A/Q926A;F491A/M495A/T496A/N497A;K918A/V922A/R925A/Q926A;または918A/V922A/R925A;K855A;K810A/K1003A/R1060A;またはK848A/K1003A/R1060Aである。いくつかの実施形態において、タンパク質は、K526またはR691での変異を含まない。
【0009】
本明細書において、任意の介在リンカーで異種性機能ドメインと融合された本明細書に記載の単離されたバリアントSpCas9タンパク質を含む融合タンパク質であって、リンカーが、融合タンパク質の活性を妨げない、融合タンパク質も提供する。いくつかの実施形態において、異種性機能ドメインは、転写活性化ドメインである。いくつかの実施形態において、転写活性化ドメインは、VP64またはNF-κB p65からのものである。いくつかの実施形態において、異種性機能ドメインは、転写サイレンサーまたは転写抑制ドメインである。いくつかの実施形態において、転写抑制ドメインは、クルッペル関連ボックス(KRAB)ドメイン、ERFリプレッサードメイン(ERD)またはmSin3A相互作用ドメイン(SID)である。いくつかの実施形態において、転写サイレンサーは、ヘテロクロマチンタンパク質1(HP1)、例えば、HP1αまたはHP1βである。いくつかの実施形態において、異種性機能ドメインは、DNAのメチル化状態を改変する酵素である。いくつかの実施形態において、DNAのメチル化状態を改変する酵素は、DNAメチルトランスフェラーゼ(DNMT)またはTETタンパク質である。いくつかの実施形態において、TETタンパク質は、TET1である。いくつかの実施形態において、異種性機能ドメインは、ヒストンサブユニットを改変する酵素である。いくつかの実施形態において、ヒストンサブユニットを改変する酵素は、ヒストンアセチルトランスフェラーゼ(HAT)、ヒストンデアセチラーゼ(HDAC)、ヒストンメチルトランスフェラーゼ(HMT)またはヒストンデメチラーゼである。
【0010】
いくつかの実施形態において、異種性機能ドメインは、塩基エディター、例えば、シチジンデアミナーゼドメイン、例えば、APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D/E、APOBEC3F、APOBEC3G、APOBEC3HもしくはAPOBEC4を含む、アポリポタンパク質B mRNA編集酵素、デアミナーゼの触媒ポリペプチド様(APOBEC)ファミリー;活性化誘導シチジンデアミナーゼ(AID)、例えば、活性化誘導シチジンデアミナーゼ(AICDA);シトシンデアミナーゼ1(CDA1)もしくはCDA2;またはtRNAに作用するシトシンデアミナーゼ(CDAT)からのものである。いくつかの実施形態において、異種性機能ドメインは、アデノシンDNA塩基を改変するデアミナーゼであり、例えば、デアミナーゼは、アデノシンデアミナーゼ1(ADA1)、ADA2;RNA1に作用するアデノシンデアミナーゼ(ADAR1)、ADAR2、ADAR3;tRNA1に作用するアデノシンデアミナーゼ(ADAT1)、ADAT2、ADAT3;および天然に存在するまたは遺伝子操作されたtRNA特異的アデノシンデアミナーゼ(TadA)である。いくつかの実施形態において、異種性機能ドメインは、生物学的テザーである。いくつかの実施形態において、生物学的テザーは、MS2、Csy4またはラムダNタンパク質である。いくつかの実施形態において、異種性機能ドメインは、FokIである。
【0011】
いくつかの実施形態において、異種性機能ドメインは、内因性DNA修復もしくは塩基除去修復(BER)経路を阻害または増強する酵素、ドメインあるいはペプチド、例えば、BERを開始するウラシルの除去を媒介するウラシルDNAグリコシラーゼ(UDG、ウラシルN-グリコシラーゼまたはUNGとしても公知)を阻害するウラシルDNAグリコシラーゼ阻害剤;あるいはバクテリオファージMuからのGamなどのDNA末端結合タンパク質である。
【0012】
本明細書において、本明細書に記載のバリアントSpCas9タンパク質をコードする単離された核酸、および任意選択で、本明細書に記載のバリアントSpCas9タンパク質を発現するための1つまたは複数の制御ドメインに作動可能に連結された、単離された核酸を含むベクターも提供する。本明細書において、任意選択で、本明細書に記載のバリアントSpCas9タンパク質を発現する、本明細書に記載の核酸を含む宿主細胞、例えば、哺乳動物宿主細胞も提供する。本明細書において、本明細書に記載のバリアントSpCas9タンパク質、およびバリアントタンパク質によって標的化されるPAM配列を有する配列を標的化するガイドRNAを含むリボヌクレオタンパク質(RNP)複合体も提供する。
【0013】
本明細書において、本明細書に記載の単離されたバリアントSpCas9タンパク質、および細胞のゲノムの選択された部分に相補的な領域を有するガイドRNAを、細胞で発現させることによって、細胞のゲノムを変更する方法を提供する。
【0014】
本明細書において、バリアントタンパク質、および細胞のゲノムの選択された部分に相補的な領域を有するガイドRNAを、細胞で発現させることによって、細胞のゲノムを変更する、例えば、選択的に変更するための方法を提供する。
【0015】
細胞を、本明細書に記載のタンパク質バリアント、および細胞のゲノムの選択された部分に相補的な領域を有するガイドRNAと接触させることによって、細胞のゲノムを変更する、例えば、選択的に変更するための方法も提供する。
【0016】
いくつかの実施形態において、単離されたタンパク質または融合タンパク質は、核局在化配列、細胞透過性ペプチド配列および/もしくはアフィニティタグの1つまたは複数を含む。
【0017】
本明細書に記載の方法のいくつかの実施形態において、細胞は、幹細胞、例えば、胚性幹細胞、間葉系幹細胞もしくは人工多能性幹細胞であるか、生きている動物における細胞であるか、あるいは胚、例えば、哺乳動物、昆虫もしくは魚類(例えば、ゼブラフィッシュ)の胚における細胞または胚細胞である。
【0018】
さらに、本明細書において、二本鎖DNA(dsDNA)分子を変更するための方法、例えば、インビトロの方法を提供する。この方法は、dsDNA分子を、1つまたは複数の本明細書に記載のバリアントタンパク質、およびdsDNA分子の選択された部分に相補的な領域を有するガイドRNAと接触させることを含む。
【0019】
他に定義されない限り、本明細書で使用されるすべての技術用語および科学用語は、この発明が属する技術分野の当業者によって一般に理解されるものと同じ意味を有する。方法および材料は、本発明における使用のために本明細書に記載され、当技術分野において公知の他の適切な方法および材料を使用することもできる。材料、方法および例は、説明のみを目的とし、限定することを意図するものではない。本明細書において列挙される、すべての刊行物、特許出願、特許、配列、データーベースのエントリーおよび他の参照は、それらの全体が参照によって組み込まれる。矛盾がある場合には、定義を含む本明細書が支配する。
【0020】
本発明の他の特徴および利点は、以下の詳細な説明および図面から、ならびに特許請求の範囲から明らかになろう。
【0021】
本特許または本出願ファイルは、カラーで作成された少なくとも1つの図面を含む。カラーの図面を伴う本特許または本出願公開の写しは、申請および必要な料金の支払により、特許庁によって提供されるだろう。
【図面の簡単な説明】
【0022】
図1図1A~1Bは、SpCas9 PAMバリアントライブラリーの生成およびスクリーニングに関する。(a)PAM認識のために重要な6つの位置で多様なアミノ酸の組み合わせを有するSpCas9バリアントのライブラリーを生成するために、変性オリゴライブラリーをSpCas9コード配列の3つの領域にクローニングして、赤で強調された6つのコドンをランダム化した。(b)細菌選択アッセイの概略図、ここで、SpCas9バリアントおよびsgRNAは、1つのプラスミドから発現し、第2のプラスミドは、誘導毒性遺伝子およびカスタマイズ化標的部位をコードする。両方のプラスミドは、細菌に同時形質転換され、毒性プラスミドの標的部位でコードされるPAMを認識することができるSpCas9 PAMバリアントを保有する細胞のみが、毒性遺伝子の発現を誘導する培地上で生存することができる(選択培地は10mMのアラビノースを含有する)。
図2-1】図2A~2Fは、NGTN PAMを有する部位を認識する細菌選択から得られたSpCas9 PAMバリアントに関する。(A~F)NGTG、NGTT、NGTCまたはNGTA PAM配列を運ぶ陽性選択プラスミドに対する初期スクリーニングからのSpCas9バリアントをコードするプラスミドを、細菌スクリーニングアッセイで再スクリーニングして、NGTN PAM配列を有する標的部位に対する活性を評価した。パネルC、EおよびFについて、バリアントはまた、NGAG、NGAT、NGACおよびNGAA PAMを有する標的部位に対してスクリーニングした。示されたPAMを有する部位におけるバリアントのおおよその活性を、非選択培地(クロラムフェニコールのみ)におけるコロニーの数を選択培地(クロラムフェニコール+10mMのアラビノース)のものと比較することによって計算し、生存%を計算した(表1)。数字にアスタリスクがあるバリアントは、以前のアッセイにおいて試験されたプラスミドを示し(この図の上側パネルに示される)、これらのバリアントのアミノ酸配列は表1に見ることができる。
図2-2】図2-1と同様である。
図3図3A~3Cは、ヒト細胞におけるSpCas9 NGTN PAMバリアントの活性に関する。(A、B)NGTA、NGTC、NGTTおよびNGTG PAMを保有するEGFPにおける部位に対する、(選択によって得られたか、または合理的に設計された)さまざまなSpCas9バリアントの活性を評価するためのヒト細胞EGFP破壊アッセイ。エラーバーは、n=2~7についてのs.e.mを表す。(C)NGTG、NGTA、NGTCまたはNGTT PAMを保有する部位に対する、SpCas9-NGTN PAMバリアント、SpCas9-LRSVQLバリアントを行うトップの1つの内在性遺伝子破壊活性。T7E1アッセイによって定量された遺伝子破壊。
図4図4A~4Fは、NGCN PAMを有する部位を認識する細菌選択から得られたSpCas9 PAMバリアントに関する。(A~B)NGCG、NGCT、NGCCまたはNGCA PAM配列を運ぶ陽性選択プラスミドに対する初期スクリーニングからのSpCas9バリアントをコードするプラスミドを、細菌スクリーニングアッセイで再スクリーニングして、NGCN PAM配列を有する標的部位に対する活性を評価した。示されたPAMを有する部位におけるバリアントのおおよその活性を、非選択培地(クロラムフェニコールのみ)におけるコロニーの数を選択培地(クロラムフェニコール+10mMのアラビノース)のものと比較することによって計算し、生存%を計算した(表2)。数字にアスタリスクがあるバリアントは、以前のアッセイにおいて試験されたプラスミドを示し(この図の上側パネルに示される)、これらのバリアントのアミノ酸配列は表2に見ることができる。
図5-1】図5A~5Eは、ヒト細胞におけるSpCas9 NGCN PAMバリアントの活性に関する。(A~E)NGCA、NGCC、NGCTおよびNGCG PAMを保有するEGFPにおける部位に対する、(選択によって得られたか、または合理的に設計された)さまざまなSpCas9バリアントの活性を評価するためのヒト細胞EGFP破壊アッセイ。(A)NGCA PAM部位、(B)NGCC PAM部位、(C)NGCT PAM部位、(D)NGCCおよびNGCT PAM部位、ならびに(E)さまざまなNGCN PAM部位を有する部位に対する活性。
図5-2】図5-1と同様である。
図6図6A~6Bは、NGAN PAMを有する部位を認識する細菌選択から得られたSpCas9 PAMバリアントに関する。(A~B)NGAG、NGAT、NGACまたはNGAA PAM配列を運ぶ陽性選択プラスミドに対する初期スクリーニングからのSpCas9バリアントをコードするプラスミドを、細菌スクリーニングアッセイで再スクリーニングして、NGAN PAM配列を有する標的部位に対する活性を評価した。示されたPAMを有する部位におけるバリアントのおおよその活性を、非選択培地(クロラムフェニコールのみ)におけるコロニーの数を選択培地(クロラムフェニコール+10mMのアラビノース)のものと比較することによって計算し、生存%を計算した(表3)。これらのバリアントのアミノ酸配列は表3に見ることができる。
図7図7A~7Bは、ヒト細胞におけるSpCas9 NGAN PAMバリアントの活性に関する。(A~B)(A)NGAA、NGAC、NGATおよびNGAG PAM、または(B)さまざまなNGAC PAMを保有するEGFPにおける部位に対する、(選択によって得られたか、または合理的に設計された)さまざまなSpCas9バリアントの活性を評価するためのヒト細胞EGFP破壊アッセイ。
図8】ヒト細胞におけるSpCas9 PAMバリアントとxCas9のヌクレアーゼ活性の比較。内因性遺伝子破壊活性をT7E1アッセイによって評価した。
図9-1】図9は、ヒト細胞の内因性部位おけるSpCas9 PAMバリアントとxCas9の塩基編集活性の比較に関する。(A)SpCas9 PAMバリアントのBE3バージョン(Komor et al., Nature. 2016 May 19;533(7603):420-4)を、CRISPRessoによって行った標的化ディープシークエンシングおよび解析によって評価される、CからTへの塩基編集活性について試験した(Pinello et al., Nat Biotechnol. 2016 Jul 12; 34(7): 695-697;Nat Biotechnol. 2016 Jul 12; 34(7): 695-697)。x軸に表示された編集されたシトシンヌクレオチドは、Cas9標的配列の最もPAMから遠位の位置として位置1から番号付けされる。(B)SpCas9 PAMバリアントのABE7.10バージョン(Gaudelli et al., Nature. 2017 Nov 23;551(7681):464-471)を、CRISPRessoによって行った標的化ディープシークエンシングおよび解析によって評価される、AからGへの塩基編集活性について試験した。x軸に表示された編集されたアデノシンヌクレオチドは、Cas9標的配列の最もPAMから遠位の位置として位置1から番号付けされる。
図9-2】図9-1と同様である。
【発明を実施するための形態】
【0023】
表1:NGTN PAMを保有する部位に対する細菌のバリアントの選択結果および活性
表2:NGCN PAMを保有する部位に対する細菌のバリアントの選択結果および活性
表3:NGAN PAMを保有する部位に対する細菌のバリアントの選択結果および活性
【0024】
化膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)によるプロトスペーサー隣接モチーフ(PAM)の認識は、標的DNA認識の重要な第1ステップであり、SpCas9が結合およびDNAを加水分解することを可能にする。CRISPR-Cas9ヌクレアーゼは、ゲノム編集のために幅広く使用されているが1~4、Cas9が切断することができる配列の範囲は、標的部位における特異的PAMについての必要性によって制限される5、6。例えば、これまでに最も安定かつ幅広く使用されているCas9であるSpCas9は、主に、NGG PAMを認識する。結果として、多くの場合、さまざまなゲノム編集の応用のために必要な正確さで二本鎖の破壊(DSB)を標的化することは困難であり得る。加えて、Cas9による不完全なPAM認識は、望まない標的外変異の生成をもたらし得る7、8。意図的に変更および/または改善されたPAM特異性を有するCas9誘導体は、これらの限界に対処するだろう。
【0025】
結晶構造から、野生型SpCas9が2つのアルギニンアミノ酸側鎖(R1333およびR1335)を利用して、塩基を、基準のNGG PAM配列のグアニンに特異的に接触させることが明らかである。しかしながら、PAM認識を変更し、かつSpCas9の標的範囲を改善するために、本発明者らおよび他者は、これらのアルギニンのいずれか1つまたは両方の単純な変異は、PAM選好性を転換しないことを示した(Anders et al, Nature 2014; Kleinstiver et al, Nature 2015;国際公開第2016/141224号パンフレット)。本発明者らは、以前に、NGAおよびNGCG PAM配列を標的化することができるSpCas9のバリアントを進化させるための選択アプローチに着手したが(Kleinstiver et al, Nature 2015;国際公開第2016/141224号パンフレット)、しかしながら、多くの代替のPAM配列は、標的化できないままである。
【0026】
現在アクセスできないPAM配列の標的化を可能にすることによってSpCas9の有用性をさらに拡大するために、本発明者らは、新規なPAM配列を認識する能力があるSpCas9バリアントについて選択するための代替戦略を考えた。SpCas9コード配列内のある特定の位置がPAM認識のために重要であることが以前に確立されており(Kleinstiver et al., Nature 2015;国際公開第2016/141224号パンフレット)、本発明者らは、PAM相互作用ドメインの3つの別々の領域内の6つのアミノ酸をランダム化して、これらの位置:D1135/S1136、G1218/E1219およびR1335/T1337で多様なコドン使用頻度を有するSpCas9バリアントのライブラリーを生成させる集中飽和変異生成アプローチを実施した。そうするために、本発明者らは、コードされたこれらの6つのアミノ酸を含有するSpCas9のコドンで、NNSヌクレオチドトリプレット(ここで、Nは任意のヌクレオチドであり、SはGまたはCである)をコードするランダム化オリゴヌクレオチドカセットを連続してクローニングした(図1A)。次いで、得られるSpCas9バリアントのライブラリーを、以前に記載されたようにして(Kleinstiver et al., Nature 2015)、本発明者らの細菌陽性選択アッセイを使用する選択に供して、さまざまなNGNN PAM配列を保有する標的部位を切断することができるバリアントを特定した(図1B)。簡潔には、発現したSpCas9バリアントが陽性選択プラスミドにおいてコードされる標的部位(PAMおよびスペーサー配列)を認識することができる場合にのみ、細菌は、選択条件(10mMのアラビノース上に蒔かれ、これは、ccdB毒性遺伝子の転写を誘導する)で生存することができる。強いPAM認識は、選択プラスミドの加水分解をもたらし、ccdB発現の誘導を防ぎ、それによって、細菌の増殖を可能にする。このように、SpCas9ライブラリーのスクリーニングの間に、10mMのアラビノースを含有する培地で増殖するコロニーは、目的とする代替PAMを持つ部位を標的化することができるSpCas9 PAMバリアントをコードすると予想される(図1B)。
【0027】
変更されたPAM特異性を有する遺伝子操作されたCas9バリアント
この研究において遺伝子操作されたSpCas9バリアントは、野生型SpCas9によってアクセス可能な標的部位の範囲を大いに増加させ、効率がよいHDRを実施するため、NHEJ媒介インデルを小さな遺伝要素に標的化するため、およびPAMについての要件を利用して同じ細胞中の2つの異なるアレルの間を区別するために、CRISPR-Cas9プラットフォームを使用する機会をさらに増強する。以前はアクセス可能ではなかったNGTNおよびNGCH(ここで、Hは、A、CまたはTである)PAM含有部位を現在標的化することができるバリアント、ならびにNGACに対する活性を改善することができるバリアントの選択および合理的設計は、正確かつ高分解能のゲノム編集のための見込みを改善する。変更されたPAM特異性SpCas9バリアントは、細菌およびヒト細胞の両方においてSpCas9によって現在標的化できない内在性遺伝子部位を効率よく破壊することができ、これらが、いろいろな異なる細胞の種類および生物体において働くことを示唆する。
【0028】
本明細書に記載のすべてのSpCas9バリアントは、例えば、単純な部位指定変異生成によって、既存の広く使用されているベクターに迅速に組み込むことができ、それらは、PAM相互作用ドメイン内に含有される少数の変異のみを必要とするので、バリアントはまた、SpCas9プラットフォームに以前に記載された他の改善とともに働くはずである(例えば、トランケートsgRNA(Tsai et al., Nat Biotechnol 33, 187-197 (2015);Fu et al., Nat Biotechnol 32, 279-284 (2014))、ニッカーゼ変異(Mali et al., Nat Biotechnol 31, 833-838 (2013);Ran et al., Cell 154, 1380-1389 (2013))、二量体FokI-dCas融合体(Guilinger et al., Nat Biotechnol 32, 577-582 (2014);Tsai et al., Nat Biotechnol 32, 569-576 (2014));および高フィデリティーバリアント(Kleinstiver et al. Nature 2016))。
【0029】
変更されたPAM特異性を有するSpCas9バリアント
したがって、本明細書において、SpCas9バリアントを提供する。SpCas9野生型配列は以下の通りである。
【0030】
【化1-1】
【0031】
【化1-2】
【0032】
本明細書に記載のSpCas9バリアントは、以下の位置:D1135、S1136、G1218、E1219、R1335および/もしくはT1337、例えば、D1135X/S1136X/G1218X/E1219X/R1335X/T1337X(ここで、Xは、任意のアミノ酸である)の1つ、2つ、3つ、4つ、5つまたは6つすべてで(またはこれらと類似の位置)、変異を含むことができる。いくつかの実施形態において、SpCas9バリアントは、配列番号1のアミノ酸配列と、少なくとも80%、例えば、少なくとも85%、90%または95%同一であり、例えば、配列番号1の残基の最大で5%、10%、15%または20%まで、例えば、保存的変異で置き換えられた、相違を有する。好ましい実施形態において、本バリアントは、所望の親の活性、例えば、ヌクレアーゼ活性(親が、ニッカーゼまたは死Cas9である場合を除く)ならびに/またはガイドRNAおよび標的DNAと相互作用する能力を保持する。
【0033】
2つの核酸配列の同一性パーセントを決定するために、配列は、最適な比較の目的のために整列される(例えば、ギャップは、最適な整列のための第1および第2のアミノ酸もしくは核酸配列の一方または両方に導入することができ、非相同配列は、比較の目的のために無視することができる)。比較の目的のために整列された参照配列の長さは、参照配列の長さの少なくとも80%であり、いくつかの実施形態において、少なくとも90%または100%である。次いで、対応するアミノ酸の位置またはヌクレオチドの位置でのヌクレオチドが比較される。第1の配列中の位置は、第2の配列中の対応する位置と同じヌクレオチドによって占められ、その結果、分子は、その位置で同一である(本明細書で使用される場合、核酸の「同一性」は核酸の「相同性」と同等である)。2つの配列の間の同一性パーセントは、2つの配列の最適な整列化のために導入することが必要な、ギャップの数およびそれぞれのギャップの長さを考慮して、配列によって共有される同一の位置の数の関数である。2つのポリペプチドまたは核酸配列の間の同一性パーセントは、当技術分野における技能内であるさまざまな方法、例えば、Smith Waterman Alignment(Smith, T. F. and M. S. Waterman (1981) J Mol Biol 147:195-7);GeneMatcher Plus(商標)に組み込まれた「Best Fit」(Smith and Waterman, Advances in Applied Mathematics, 482-489 (1981))、Schwarz and Dayhof (1979) Atlas of Protein Sequence and Structure, Dayhof, M.O., Ed, pp 353-358;BLASTプログラム(基本的なローカルアライメント検索ツール;(Altschul, S. F., W. Gish, et al. (1990) J Mol Biol 215: 403-10)、BLAST-2、BLAST-P、BLAST-N、BLAST-X、WU-BLAST-2、ALIGN、ALIGN-2、CLUSTAL、またはMegalign(DNASTAR)ソフトウェアなどの公的に利用可能なコンピューターソフトウェアを使用して、決定される。加えて、当業者は、比較される配列の長さに対する最大の整列を達成するために必要な任意のアルゴリズムを含む、整列を測定するための適切なパラメーターを決定することができる。一般に、タンパク質または核酸のためには、比較の長さは、最大で、かつ全長を含む、任意の長さ(例えば、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%または100%)であり得る。本組成物および方法の目的のために、配列の全長の少なくとも80%が、BLASTアルゴリズムおよび初期設定パラメーターを使用して整列される。
【0034】
本発明の目的のために、2つの配列の間の配列の比較および同一性パーセントの決定は、ギャップペナルティ12、ギャップ拡張ペナルティ4およびフレームシフトギャップペナルティ5でBlossum62スコアリング行列を使用して達成することができる。
【0035】
保存的置換は、典型的には、以下の群内での置換を含む:グリシン、アラニン;バリン、イソロイシン、ロイシン;アスパラギン酸、グルタミン酸、アスパラギン、グルタミン;セリン、トレオニン;リジン、アルギニン;およびフェニルアラニン、チロシン。
【0036】
いくつかの実施形態において、SpCas9バリアントは、表1、2または3に示される変異のセット、例えば、以下の変異のセットの1つ:D1135X/S1136X/G1218X/E1219X/R1335X/T1337X:SpCas9-LWKIQK、LWKIQK、IRAVQL、SWRVVV、SWKVLK、TAHFKV、MSGVKC、LRSVRS、SKTLRP、MWVHLN、TWSMRG、KRRCKV、VRAVQL、VSSVRS、VRSVRS、SRMHCK、GRKIQK、GWKLLR、GWKOQK、VAKLLR、VAKIQK、VAKILR、GRKILR、VRKLLR、LRSVQL、IRAVQL、VRKIQK、VRMHCK、LRKIQK、LRSVQK、またはVRKIQKバリアント(例えば、NGTN PAMについて);WMQAYG、MQKSER、LWRSEY、SQSWRS、LKAWRS、LWGWQH、MCSFER、LWMREQ、LWRVVA、HSSWVR、MWSEPT、GSNYQS、FMQWVN、YCSWVG、MCAWCG、LWLETR、FMQWVR、SSKWPA、LSRWQR、ICCCER、VRKSER、またはICKSERバリアント(例えば、NGCN PAMについて);またはLRLSAR、AWTEVTR、KWMMCG、VRGAKE、MRARKE、AWNFQV、LWTTLN、SRMHCK、CWCQCV、AEEQQR、GWEKVR、NRAVNG、SRQMRG、LRSYLH、VRGNNR、VQDAQR、GWRQSK、AWLCLS、KWARVV、MWAARP、SRMHCK、VKMAKG、QRKTRE、LCRQQR、CWSHQR、SRTHTQ、LWEVIR、VSSVRS、VRSVRS、LRSVRS、IRAVRS、SRSVRS、LWKIQK、VRMHCK、またはSRMHCK(例えば、NGAN PAMについて)を含む。いくつかの実施形態において、SpCas9バリアントは、D1135L/S1136R/G1218S/E1219V/R1335X/T1337X、例えば、LRSVQLまたはLRSVRSを含む。いくつかの実施形態において、D1135での残基は、L、G、I、V、MまたはSである。いくつかの実施形態において、S1136での残基は、R、Q、W、SまたはCである。いくつかの実施形態において、G1218での残基は、S、K、S、R、L、C、G、AまたはQである。いくつかの実施形態において、E1219での残基は、V、I、S、E、W、C、AまたはRである。いくつかの実施形態において、R1335での残基は、R、Q、E、V、TまたはKである。いくつかの実施形態において、T1337での残基は、S、K、L、R、A、E、TまたはGである。いくつかの実施形態において、バリアントは、表Aにおける変異のセットの1つを含む。
【0037】
【表1】
【0038】
いくつかの実施形態において、SpCas9バリアントはまた、タンパク質のヌクレアーゼ部分を触媒的に不活性にするために、Cas9のヌクレアーゼ活性を低減もしくは破壊する以下のアミノ酸の位置の1つ:D10、E762、D839、H983またはD986、およびH840またはN863、例えば、D10A/D10NおよびH840A/H840N/H840Yで変異を含み、これらの位置での置換は、アラニン(これらは、Nishimasu al., Cell 156, 935-949 (2014)にある)、または他の残基、例えば、グルタミン、アスパラギン、チロシン、セリンもしくはアスパラギン酸塩、例えば、E762Q、H983N、H983Y、D986N、N863D、N863SまたはN863Hであろう(国際公開第2014/152432号パンフレットを参照されたい)。いくつかの実施形態において、バリアントは、D10AもしくはH840Aでの変異(一本鎖ニッカーゼを生成する)、またはD10AおよびH840Aでの変異(ヌクレアーゼ活性を無効にし、この変異は死Cas9またはdCas9として公知である)を含む。
【0039】
いくつかの実施形態において、SpCas9バリアントはまた、タンパク質の特異性を増加させる(すなわち、標的外の効果を低減する)1つまたは複数のアミノ酸の位置で変異を含む。いくつかの実施形態において、SpCas9バリアントは、以下の残基:N497、K526、R661、R691、N692、M694、Q695、H698、K810、K848、Q926、K1003および/もしくはR0160で、1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10、11、12または13すべての変異を含む。いくつかの実施形態において、変異は、N692A、Q695A、Q926A、H698A、N497A、K526A、R661A、R691A、M694A、K810A、K848A、K1003A、R0160A、Y450A/Q695A、L169A/Q695A、Q695A/Q926A、Q695A/D1135E、Q926A/D1135E、Y450A/D1135E、L169A/Y450A/Q695A、L169A/Q695A/Q926A、Y450A/Q695A/Q926A、R661A/Q695A/Q926A、N497A/Q695A/Q926A、Y450A/Q695A/D1135E、Y450A/Q926A/D1135E、Q695A/Q926A/D1135E、L169A/Y450A/Q695A/Q926A、L169A/R661A/Q695A/Q926A、Y450A/R661A/Q695A/Q926A、N497A/Q695A/Q926A/D1135E、R661A/Q695A/Q926A/D1135E、およびY450A/Q695A/Q926A/D1135E;N692A/M694A/Q695A/H698A、N692A/M694A/Q695A/H698A/Q926A;N692A/M694A/Q695A/Q926A;N692A/M694A/H698A/Q926A;N692A/Q695A/H698A/Q926A;M694A/Q695A/H698A/Q926A;N692A/Q695A/H698A;N692A/M694A/Q695A;N692A/H698A/Q926A;N692A/M694A/Q926A;N692A/M694A/H698A;M694A/Q695A/H698A;M694A/Q695A/Q926A;Q695A/H698A/Q926A;G582A/V583A/E584A/D585A/N588A/Q926A;G582A/V583A/E584A/D585A/N588A;T657A/G658A/W659A/R661A/Q926A;T657A/G658A/W659A/R661A;F491A/M495A/T496A/N497A/Q926A;F491A/M495A/T496A/N497A;K918A/V922A/R925A/Q926A;または918A/V922A/R925A;K855A;K810A/K1003A/R1060A;またはK848A/K1003A/R1060Aである。例えば、米国特許第9512446号;Kleinstiver et al., Nature. 2016 Jan 28;529(7587):490-5;Slaymaker et al., Science. 2016 Jan 1;351(6268):84-8;Chen et al., Nature. 2017 Oct 19;550(7676):407-410;Tsai and Joung, Nature Reviews Genetics 17:300-312 (2016);Vakulskas et al., Nature Medicine 24:1216-1224 (2018);Casini et al., Nat Biotechnol. 2018 Mar;36(3):265-27を参照されたい。いくつかの実施形態において、本バリアントは、K526またはR691での変異を含まない。
【0040】
いくつかの実施形態において、SpCas9バリアントは、以下の位置:L169A、Y450、N497、R661、Q695、Q926および/もしくはD1135Eの1つ、2つ、3つ、4つ、5つ、6つまたは7つすべてで変異を含み、例えば、いくつかの実施形態において、バリアントSpCas9タンパク質は、以下:N497、R661、Q695およびQ926の1つ、2つ、3つまたは4つすべてで、例えば、以下の変異:N497A、R661A、Q695AおよびQ926Aの1つ、2つ、3つまたは4つすべてで、変異を含む。いくつかの実施形態において、バリアントSpCas9タンパク質は、Q695および/またはQ926で、ならびに任意選択で、例えば、限定されないが、Y450A/Q695A、L169A/Q695A、Q695A/Q926A、Q695A/D1135E、Q926A/D1135E、Y450A/D1135E、L169A/Y450A/Q695A、L169A/Q695A/Q926A、Y450A/Q695A/Q926A、R661A/Q695A/Q926A、N497A/Q695A/Q926A、Y450A/Q695A/D1135E、Y450A/Q926A/D1135E、Q695A/Q926A/D1135E、L169A/Y450A/Q695A/Q926A、L169A/R661A/Q695A/Q926A、Y450A/R661A/Q695A/Q926A、N497A/Q695A/Q926A/D1135E、R661A/Q695A/Q926A/D1135E、およびY450A/Q695A/Q926A/D1135Eを含む、L169、Y450、N497、R661およびD1135Eの1つ、2つ、3つ、4つまたは5つすべてで変異を含む。例えば、Kleinstiver et al., Nature 529:490-495 (2016);国際公開第2017/040348号パンフレット;米国特許第9,512,446号を参照されたい。
【0041】
いくつかの実施形態において、SpCas9バリアントはまた、以下の位置:F491、M495、T496、N497、G582、V583、E584、D585、N588、T657、G658、W659、R661、N692、M694、Q695、H698、K918、V922、および/またはR925の1つ、2つ、3つ、4つ、5つ、6つ、7つまたはそれ以上で、および任意選択でQ926で変異を含み、好ましくは、以下の位置:F491、M495、T496、N497、G582、V583、E584、D585、N588、T657、G658、W659、R661、N692、M694、Q695、H698、K918、V922および/もしくはR925の1つ、2つ、3つ、4つ、5つ、6つ、7つまたはそれ以上で、および任意選択でQ926で変異を有する配列番号1のアミノ酸配列と少なくとも80%同一である配列、ならびに任意選択で核局在化配列、細胞透過性ペプチド配列および/もしくはアフィニティタグの1つまたは複数を含む。
【0042】
いくつかの実施形態において、タンパク質は、以下:N692、M694、Q695、およびH698;G582、V583、E584、D585、およびN588;T657、G658、W659、およびR661;F491、M495、T496、およびN497;またはK918、V922、R925、およびQ926の1つ、2つ、3つまたは4つすべてで変異を含む。
【0043】
いくつかの実施形態において、タンパク質は、以下の変異:N692A、M694A、Q695A、およびH698A;G582A、V583A、E584A、D585A、およびN588A;T657A、G658A、W659A、およびR661A;F491A、M495A、T496A、およびN497A;またはK918A、V922A、R925A、およびQ926Aの1つ、2つ、3つ、4つまたはすべてを含む。
【0044】
いくつかの実施形態において、タンパク質は、変異:N692A/M694A/Q695A/H698Aを含む。
【0045】
いくつかの実施形態において、タンパク質は、変異:N692A/M694A/Q695A/H698A/Q926A;N692A/M694A/Q695A/Q926A;N692A/M694A/H698A/Q926A;N692A/Q695A/H698A/Q926A;M694A/Q695A/H698A/Q926A;N692A/Q695A/H698A;N692A/M694A/Q695A;N692A/H698A/Q926A;N692A/M694A/Q926A;N692A/M694A/H698A;M694A/Q695A/H698A;M694A/Q695A/Q926A;Q695A/H698A/Q926A;G582A/V583A/E584A/D585A/N588A/Q926A;G582A/V583A/E584A/D585A/N588A;T657A/G658A/W659A/R661A/Q926A;T657A/G658A/W659A/R661A;F491A/M495A/T496A/N497A/Q926A;F491A/M495A/T496A/N497A;K918A/V922A/R925A/Q926A;または918A/V922A/R925Aを含む。例えば、Chen et al., “Enhanced proofreading governs CRISPR-Cas9 targeting accuracy,” bioRxiv, doi.org/10.1101/160036 (August 12, 2017)を参照されたい。
【0046】
いくつかの実施形態において、バリアントタンパク質は、R780、K810、R832、K848、K855、K968、R976、H982、K1003、K1014、K1047および/もしくはR1060、例えば、R780A、K810A、R832A、K848A、K855A、K968A、R976A、H982A、K1003A、K1014A、K1047Aおよび/もしくはR1060A、例えば、K855A;K810A/K1003A/R1060A;(eSpCas9 1.0とも称される);またはK848A/K1003A/R1060A(eSpCas9 1.1とも称される)の1つまたは複数で変異を含む(Slaymaker et al., Science. 2016 Jan l;351(6268):84-8を参照されたい)。
【0047】
本明細書において、SpCas9バリアントをコードする単離された核酸、任意選択でバリアントタンパク質を発現するための1つまたは複数の制御ドメインと作動可能に連結された単離された核酸を含むベクター、ならびに、核酸を含み、および任意選択でバリアントタンパク質を発現する宿主細胞、例えば、哺乳動物宿主細胞も提供する。
【0048】
本明細書に記載のバリアントは、細胞のゲノムを変更するために使用することができ、この方法は、一般に、細胞中のバリアントタンパク質を、細胞のゲノムの選択された部分に相補的な領域を有するガイドRNAと一緒に発現させることを含む。細胞のゲノムを選択的に変更するための方法は、当技術分野において、公知であり、例えば、米国特許第8,697,359号;米国特許出願公開第2010/0076057号;米国特許出願公開第2011/0189776号;米国特許出願公開第2011/0223638号;米国特許出願公開第2013/0130248号;国際公開第2008/108989号パンフレット;国際公開第2010/054108号パンフレット;国際公開第2012/164565号パンフレット;国際公開第2013/098244号パンフレット;国際公開第2013/176772号パンフレット;米国特許出願公開第2015/0050699号;米国特許出願公開第2015/0045546号;米国特許出願公開第2015/0031134号;米国特許出願公開第2015/0024500号;米国特許出願公開第2014/0377868号;米国特許出願公開第2014/0357530号;米国特許出願公開第2014/0349400号;米国特許出願公開第2014/0335620号;米国特許出願公開第2014/0335063号;米国特許出願公開第2014/0315985号;米国特許出願公開第2014/0310830号;米国特許出願公開第2014/0310828号;米国特許出願公開第2014/0309487号;米国特許出願公開第2014/0304853号;米国特許出願公開第2014/0298547号;米国特許出願公開第2014/0295556号;米国特許出願公開第2014/0294773号;米国特許出願公開第2014/0287938号;米国特許出願公開第2014/0273234号;米国特許出願公開第2014/0273232号;米国特許出願公開第2014/0273231号;米国特許出願公開第2014/0273230号;米国特許出願公開第2014/0271987号;米国特許出願公開第2014/0256046号;米国特許出願公開第2014/0248702号;米国特許出願公開第2014/0242702号;米国特許出願公開第2014/0242700号;米国特許出願公開第2014/0242699号;米国特許出願公開第2014/0242664号;米国特許出願公開第2014/0234972号;米国特許出願公開第2014/0227787号;米国特許出願公開第2014/0212869号;米国特許出願公開第2014/0201857号;米国特許出願公開第2014/0199767号;米国特許出願公開第2014/0189896号;米国特許出願公開第2014/0186958号;米国特許出願公開第2014/0186919号;米国特許出願公開第2014/0186843号;米国特許出願公開第2014/0179770号;米国特許出願公開第2014/0179006号;米国特許出願公開第2014/0170753号;Makarova et al., "Evolution and classification of the CRISPR-Cas systems" 9(6) Nature Reviews Microbiology 467-477 (1-23) (Jun. 2011);Wiedenheft et al., "RNA-guided genetic silencing systems in bacteria and archaea" 482 Nature 331-338 (Feb. 16, 2012);Gasiunas et al., "Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria" 109(39) Proceedings of the National Academy of Sciences USA E2579-E2586 (Sep. 4, 2012);Jinek et al., "A Programmable Dual-RNA-Guided DNA Endonuclease in Adaptive Bacterial Immunity" 337 Science 816-821 (Aug. 17, 2012);Carroll, "A CRISPR Approach to Gene Targeting" 20(9) Molecular Therapy 1658-1660 (Sep. 2012);2012年5月25日に出願された米国出願第61/652,086号;Al-Attar et al., Clustered Regularly Interspaced Short Palindromic Repeats (CRISPRs): The Hallmark of an Ingenious Antiviral Defense Mechanism in Prokaryotes, Biol Chem. (2011) vol. 392, Issue 4, pp. 277-289;Hale et al., Essential Features and Rational Design of CRISPR RNAs That Function With the Cas RAMP Module Complex to Cleave RNAs, Molecular Cell, (2012) vol. 45, Issue 3, 292-302を参照されたい。
【0049】
本明細書に記載のバリアントタンパク質は、前述の参照文献に記載のSpCas9タンパク質の代わりに、表1、2または3によるPAM配列を有する配列を標的化するガイドRNAとともに使用することができる。
【0050】
加えて、本明細書に記載のバリアントは、当技術分野において公知の野生型Cas9または他のCas9変異(上記に記載のdCas9またはCas9ニッカーゼなど)の代わりに、融合タンパク質、例えば、国際公開第2014/124284号パンフレットに記載の異種性機能ドメインを有する融合タンパク質において使用することができる。例えば、好ましくは、1つもしくは複数のヌクレアーゼ低減変異または致死変異を含むバリアントは、Cas9のNまたはC末端において、転写活性化ドメインもしくは他の異種性機能ドメイン(例えば、転写リプレッサー(例えば、KRAB、ERD、SIDなど、例えば、ets2リプレッサー因子(ERF)のリプレッサードメイン(ERD)の473~530番目のアミノ酸、KOX1のKRABドメインの1~97番目のアミノ酸、もしくはMad mSIN3相互作用ドメイン(SID)の1~36番目のアミノ酸;Beerli et al., PNAS USA 95:14628-14633 (1998)を参照されたい)、またはヘテロクロマチンタンパク質1(HP1、swi6としても公知)などのサイレンサー、例えば、HP1αもしくはHP1β;MS2コートタンパク質、エンドリボヌクレアーゼCsy4もしくはラムダNタンパク質に結合したものなどの固定RNA結合配列に融合された長い非コードRNA(lncRNA)をリクルートすることができるタンパク質またはペプチド;DNAのメチル化状態を改変する酵素(例えば、DNAメチルトランスフェラーゼ(DNMT)またはTETタンパク質);ヒストンサブユニットを改変する酵素(例えば、ヒストンアセチルトランスフェラーゼ(HAT)、ヒストンデアセチラーゼ(HDAC)、ヒストンメチルトランスフェラーゼ(例えば、リジンまたはアルギニン残基のメチル化のため)もしくはヒストンデメチラーゼ(例えば、リジンまたはアルギニン残基の脱メチル化のため))に融合させることができる。
【0051】
いくつかの実施形態において、異種性機能ドメインは、塩基エディター、例えば、シトシンDNA塩基を改変するデアミナーゼ、例えば、APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D/E、APOBEC3F、APOBEC3G、APOBEC3HおよびAPOBEC4を含む、アポリポタンパク質B mRNA編集酵素、デアミナーゼの触媒ポリペプチド様(APOBEC)ファミリー(例えば、Yang et al., J Genet Genomics. 2017 Sep 20;44(9):423-437を参照されたい);活性化誘導シチジンデアミナーゼ(AID)、例えば、活性化誘導シチジンデアミナーゼ(AICDA);シトシンデアミナーゼ1(CDA1)およびCDA2;ならびにtRNAに作用するシトシンデアミナーゼ(CDAT)からのシチジンデアミナーゼである。以下の表に例示的な配列を提示し、他の配列を使用することもできる。
【0052】
【表2】
【0053】
いくつかの実施形態において、異種性機能ドメインは、アデノシンDNA塩基を改変するデアミナーゼであり、例えば、デアミナーゼは、アデノシンデアミナーゼ1(ADA1)、ADA2;RNA1に作用するアデノシンデアミナーゼ(ADAR1)、ADAR2、ADAR3(例えば、Savva et al., Genome Biol. 2012 Dec 28;13(12):252を参照されたい);tRNA1に作用するアデノシンデアミナーゼ(ADAT1)、ADAT2、ADAT3(Keegan et al., RNA. 2017 Sep;23(9):1317-1328およびSchaub and Keller, Biochimie. 2002 Aug;84(8):791-803を参照されたい);および天然に存在するまたは遺伝子操作されたtRNA特異的アデノシンデアミナーゼ(TadA)(例えば、Gaudelli et al., Nature. 2017 Nov 23;551(7681):464-471(NP_417054.2(大腸菌(Escherichia coli)株K-12亜株MG1655)を参照されたい;例えば、Wolf et al., EMBO J. 2002 Jul 15;21(14):3841-51を参照されたい)である。以下の表に例示的な配列を提示し、他の配列を使用することもできる。
【0054】
【表3】
【0055】
いくつかの実施形態において、異種性機能ドメインは、内因性DNA修復もしくは塩基除去修復(BER)経路を阻害または増強する、酵素、ドメインあるいはペプチド、例えば、チミンDNAグリコシラーゼ(TDG;GenBank受託番号NM_003211.4(核酸)およびNP_003202.3(タンパク質))、またはウラシルDNAグリコシラーゼ(UDG、ウラシルN-グリコシラーゼまたはUNGとしても公知;GenBank受託番号NM_003362.3(核酸)およびNP_003353.1(タンパク質))、またはBERを開始するウラシルの除去を媒介するUNGを阻害するウラシルDNAグリコシラーゼ阻害剤(UGI)(例えば、Mol et al., Cell 82, 701-708 (1995);Komor et al., Nature. 2016 May 19;533(7603)を参照されたい);あるいはDNA修復酵素を阻害およびより正確な編集をもたらす(意図的ではない塩基編集がより少ない)、遊離DNA末端に結合するバクテリオファージMuからのタンパク質であるGamなどのDNA末端結合タンパク質である。例えば、Komor et al., Sci Adv. 2017 Aug 30;3(8):eaao4774を参照されたい。
【0056】
例えば、使用することもできる当技術分野において公知の、Komor et al., Nature. 2016 May 19;533(7603):420-4;Nishida et al., Science. 2016 Sep 16;353(6305). pii: aaf8729;Rees et al., Nat Commun. 2017 Jun 6;8:15790;またはKim et al., Nat Biotechnol. 2017 Apr;35(4):371-376)を参照されたい。
【0057】
多くのドメインについての配列は、DNA中のメチル化シトシンのヒドロキシル化を触媒する。例示的なタンパク質としては、10-11転位(TET)1~3ファミリー、DNA中で5-メチルシトシン(5-mC)を5-ヒドロキシメチルシトシン(5-hmC)に変換する酵素が挙げられる。
【0058】
ヒトTET1~3についての配列は、当技術分野において公知であり、以下の表に示す。
【0059】
【表4】
【0060】
いくつかの実施形態において、触媒ドメインの全長配列のすべてまたは一部は、例えば、7つの高度に保存されたエクソンによってコードされる、システインリッチ拡張および2OGFeDOドメインを含む触媒モジュール、例えば、1580~2052番目のアミノ酸を含むTet1触媒ドメイン、1290~1905番目のアミノ酸を含むTet2、および966~1678番目のアミノ酸を含むTet3を含むことができる。3つすべてのTetタンパク質中の重要な触媒残基および全長配列についてのこれらの補助物質を示す配列について(例えば、配列2cを参照されたい)、Iyer et al., Cell Cycle. 2009 Jun 1;8(11):1698-710. Epub 2009 Jun 27の図1を参照されたい;いくつかの実施形態において、配列は、Tet1の1418~2136番目のアミノ酸またはTet2/3の対応する領域を含む。
【0061】
他の触媒モジュールは、Iyer et al., 2009において特定されたタンパク質からのものであり得る。
【0062】
いくつかの実施形態において、異種性機能ドメインは、生物学的テザーであり、MS2コートタンパク質、エンドリボヌクレアーゼCsy4またはラムダNタンパク質のすべてまたは一部(例えば、これらからのDNA結合ドメイン)を含む。これらのタンパク質は、dCas9 gRNA標的化配列によって特異化された場所に特異的ステムループ構造を含有するRNA分子をリクルートするために使用することができる。例えば、MS2コートタンパク質、エンドリボヌクレアーゼCsy4またはラムダNに融合されたdCas9バリアントは、XISTまたはHOTAIRなどの長い非コードRNA(lncRNA)をリクルートするために使用することができ、例えば、Cys4、MS2またはラムダN結合配列に連結された、Keryer-Bibens et al., Biol. Cell 100:125-138 (2008)を参照されたい。あるいは、Csy4、MS2またはラムダNタンパク質結合配列は、例えば、Keryer-Bibens et al.(上記)に記載の別のタンパク質と連結され得、このタンパク質は、本明細書に記載の方法および組成物を使用して、dCas9バリアント結合部位に標的化することができる。いくつかの実施形態において、Csy4は、触媒的に不活性である。いくつかの実施形態において、Cas9バリアント、好ましくは、dCas9バリアントは、国際公開第2014/204578号パンフレットに記載のFokIと融合される。
【0063】
いくつかの実施形態において、融合タンパク質は、dCas9バリアントおよび異種性機能ドメインの間にリンカーを含む。これらの融合タンパク質(または連結された構造中の融合タンパク質の間)で使用することができるリンカーは、融合タンパク質の機能を妨げない任意の配列を含むことができる。好ましい実施形態において、リンカーは、短く、例えば、2~20アミノ酸であり、典型的には、フレキシブルである(すなわち、グリシン、アラニンおよびセリンなどの高自由度のアミノ酸を含む)。いくつかの実施形態において、リンカーは、GGGS(配列番号2)もしくはGGGGS(配列番号3)からなる1つまたは複数のユニット、例えば、GGGS(配列番号2)もしくはGGGGS(配列番号3)ユニットの2つ、3つ、4つまたはそれ以上のリピートを含む。他のリンカー配列を使用することもできる。
【0064】
送達および発現系
本明細書に記載のCas9バリアントを使用するために、これらをコードする核酸からこれらを発現することが望ましくあり得る。これは、いろいろな方法で行うことができる。例えば、Cas9バリアントをコードする核酸は、複製および/もしくは発現のために、原核細胞または真核細胞に形質転換するための中間ベクターにクローニングすることができる。中間ベクターは、典型的には、Cas9バリアントの産生のためにCas9バリアントをコードする核酸の貯蔵または操作のための、原核ベクター、例えば、プラスミド、またはシャトルベクターもしくは昆虫ベクターである。Cas9バリアントをコードする核酸は、植物細胞、動物細胞、好ましくは、哺乳動物細胞もしくはヒト細胞、真菌細胞、細菌細胞または原生動物細胞への投与のために、発現ベクターにクローニングすることもできる。
【0065】
発現を得るために、Cas9バリアントをコードする配列は、典型的には、直接転写のためのプロモーターを含有する発現ベクターにサブクローニングされる。適切な細菌および真核プロモーターは、当技術分野において周知であり、例えば、Sambrook et al., Molecular Cloning, A Laboratory Manual (3d ed. 2001);Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990);およびCurrent Protocols in Molecular Biology (Ausubel et al., eds., 2010)に記載されている。遺伝子操作されたタンパク質を発現させるための細菌発現系は、例えば、大腸菌(E. coli)、バチルス種(Bacillus sp.)およびサルモネラ(Salmonella)で利用可能である(Palva et al., 1983, Gene 22:229-235)。このような発現系のためのキットが市販されている。哺乳動物細胞、酵母および昆虫細胞のための真核発現系は、当技術分野において周知であり、これも市販されている。
【0066】
核酸の直接発現のために使用されるプロモーターは、特定の適用に依存する。例えば、強い構成的プロモーターは、典型的には、融合タンパク質の発現および精製のために使用される。対照的に、Cas9バリアントが遺伝子制御のためにインビボで投与されるべきである場合、構成的プロモーターまたは誘導プロモーターのいずれかを、Cas9バリアントの特定の使用に応じて、使用することができる。加えて、Cas9バリアントの投与のための好ましいプロモーターは、HSV TKなどの弱いプロモーター、または同様の活性を有するプロモーターであり得る。プロモーターは、トランス活性化に応答するエレメント、例えば、低酸素応答エレメント、Gal4応答エレメント、lacリプレッサー応答エレメント、ならびにテトラサイクリン調節系およびRU-486系などの低分子調節系(例えば、Gossen & Bujard, 1992, Proc. Natl. Acad. Sci. USA, 89:5547;Oligino et al., 1998, Gene Ther., 5:491-496;Wang et al., 1997, Gene Ther., 4:432-441;Neering et al., 1996, Blood, 88:1147-55;およびRendahl et al., 1998, Nat. Biotechnol., 16:757-761を参照されたい)を含むこともできる。
【0067】
プロモーターに加えて、発現ベクターは、典型的には、原核または真核のいずれかの宿主細胞での核酸の発現のために必要なすべての追加エレメントを含有する転写ユニットまたは発現カセットを含有する。したがって、典型的な発現カセットは、例えば、Cas9バリアントをコードする核酸配列に作動可能に連結されたプロモーター、および例えば、転写物、転写終結、リボソーム結合部位または翻訳終結の効率がよいポリアデニル化のために必要な任意のシグナルを含有する。カセットの追加エレメントは、例えば、エンハンサー、および異種スプライシングイントロンシグナルを含んでいてもよい。
【0068】
細胞に遺伝情報を運ぶために使用される特定の発現ベクターは、Cas9バリアントの意図される使用、例えば、植物、動物、細菌、真菌、原性動物などにおける発現に関して選択される。標準的な細菌発現ベクターとしては、pBR322系プラスミド、pSKF、pET23Dなどのプラスミド、ならびにGSTおよびLacZなどの市販のタグ融合発現系が挙げられる。
【0069】
真核ウイルスからの制御エレメントを含有する発現ベクターは、多くの場合、真核発現ベクター、例えば、SV40ベクター、パピローマウイルスベクターおよびエプスタインバーウイルスに由来するベクターにおいて使用される。他の例示的な真核ベクターとしては、pMSG、pAV009/A+、pMTO10/A+、pMAMneo-5、バキュロウイルスpDSVEが挙げられ、任意の他のベクターは、SV40早期プロモーター、SV40後期プロモーター、メタロチオネインプロモーター、マウス乳腺腫瘍ウイルスプロモーター、ラウス肉腫ウイルスプロモーター、ポリヘドリンプロモーター、または真核細胞における発現のために効果的であることが示されているその他のプロモーターの指示の下でタンパク質の発現を可能にする。
【0070】
Cas9バリアントを発現するためのベクターとしては、ガイドRNAの発現を推進する、RNA Pol IIIプロモーター、例えば、H1、U6または7SKプロモーターを挙げることができる。これらのヒトプロモーターは、プラスミドのトランスフェクション後、哺乳動物細胞中においてCas9バリアントの発現を可能にする。
【0071】
いくつかの発現系は、チミジンキナーゼ、ハイグロマイシンBホスホトランスフェラーゼおよびジヒドロ葉酸レダクターゼなどの安定的にトランスフェクトされた細胞株の選択のためのマーカーを有する。例えば、昆虫細胞においてバキュロウイルスベクターをポリヒドリンプロモーターまたは他の強いバキュロウイルスプロモーターの指示の下、配列をコードするgRNAとともに使用する、高収率の発現系も適切である。
【0072】
典型的に発現ベクターに含まれるエレメントは、大腸菌(E. coli)において機能するレプリコン、組み換えプラスミドを保有する細菌の選択を可能にする抗生物質耐性をコードする遺伝子、および組み換え配列の挿入を可能にするプラスミドの非必須領域のユニークな制限部位も含む。
【0073】
標準的なトランスフェクション方法を使用して、大量のタンパク質を発現する、細菌、哺乳動物、酵母または昆虫の細胞株を生成し、次いで、これは、標準的な技術を使用して精製される(例えば、Colley et al., 1989, J. Biol. Chem., 264:17619-22; Guide to Protein Purification, in Methods in Enzymology, vol. 182 (Deutscher, ed., 1990)を参照されたい)。真核細胞および真核細胞の形質転換は、標準的な技術に従って行われる(例えば、Morrison, 1977, J. Bacteriol. 132:349-351;Clark-Curtiss & Curtiss, Methods in Enzymology 101:347-362 (Wu et al., eds, 1983)を参照されたい)。
【0074】
外来ヌクレオチド配列を宿主細胞に導入するための任意の公知の手順を使用してもよい。これらは、リン酸カルシウムトランスフェクション、ポリブレン、プロトプラスト融合、エレクトロポレーション、ヌクレオフェクション、リポソーム、マイクロインジェクション、ネイキッドDNA、プラスミドベクター、ウイルスベクター、エピソームおよびインテグレーションの両方、ならびにクローニングされたゲノムDNA、cDNA、合成DNA、または他の外来遺伝物質を宿主細胞に導入するための任意の他の周知の方法を含む(例えば、Sambrook et al.(上記)を参照されたい)。使用される特定の遺伝子操作手順は、Cas9バリアントを発現する能力がある宿主細胞に少なくとも1つの遺伝子を成功裏に導入する能力があることのみが必要である。
【0075】
あるいは、本方法は、Cas9バリアントタンパク質およびガイドRNAを一緒に、例えば、複合体として、送達することを含み得る。例えば、Cas9バリアントおよびgRNAは、宿主細胞中で過剰発現および精製され、次いで、ガイドRNA(例えば、試験管中)と複合体化して、リボヌクレオタンパク質(RNP)を形成し、細胞に送達することができる。いくつかの実施形態において、バリアントCas9は、細菌Cas9発現プラスミドの使用によって、細菌から発現および精製することができる。例えば、Hisタグ化バリアントCas9タンパク質は、細菌細胞中で発現し、次いで、ニッケルアフィニティークロマトグラフィーを使用して精製することができる。RNPの使用は、ヌクレアーゼもしくはガイドをコードするか、またはmRNAとしてヌクレアーゼをコードするプラスミドDNAを送達する必要性を回避する。RNP送達はまた、おそらく、RNPの半減期がより短く、ヌクレアーゼおよびガイドの持続的発現がないので(プラスミドから取得する場合)、特異性を改善し得る。RNPは、例えば、脂質媒介トランスフェクションまたはエレクトロポレーションを使用して、インビボまたはインビトロで細胞に送達することができる。例えば、Liang et al. "Rapid and highly efficient mammalian cell engineering via Cas9 protein transfection." Journal of biotechnology 208 (2015): 44-53;Zuris, John A., et al. "Cationic lipid-mediated delivery of proteins enables efficient protein-based genome editing in vitro and in vivo." Nature biotechnology 33.1 (2015): 73-80;Kim et al. "Highly efficient RNA-guided genome editing in human cells via delivery of purified Cas9 ribonucleoproteins." Genome research 24.6 (2014): 1012-1019を参照されたい。
【0076】
本発明は、ベクター、およびベクターを含む細胞を含む。
【実施例
【0077】
本発明を以下の実施例においてさらに記載し、これは、特許請求の範囲に記載の本発明の範囲を限定するものではない。
【0078】
方法
以下の材料および方法を実施例1において使用した。
【0079】
プラスミドおよびオリゴヌクレオチド
T7E1アッセイのための内因性ヒト遺伝子標的部位を増幅するために使用されるオリゴヌクレオチドの配列は表4に見られる。
【0080】
【表5】
【0081】
細菌Cas9/sgRNA発現プラスミドを、Cas9およびsgRNAを別々に発現させるための2つのT7プロモーターを用いて、以前に記載されるようにして(Kleinstiver et al., Nature 2015)、構築した。D1135、S1136、G1218、E1219、R1335およびT1337の位置で可変アミノ酸を含有する細菌発現プラスミドを、これらの位置でランダム化コドンをコードするオリゴヌクレオチドを、親SpCas9細菌発現ベクターにクローニングすることによって生成した(図1)。
【0082】
ヒト細胞での発現のために、SpCas9における点変異を、pCMV-T7-hSpCas9-NLS-3xFLAGベクター(JDS246;配列は、ここで、addgene.org/43861/sequences/に見られる)への等温アセンブリーによって生成した。
【0083】
sgRNAのU6発現のためのプラスミド(所望のスペーサーオリゴをクローニングすることができる)を、BsmBI消化BPK1520に適切にアニーリングされたオリゴをクローニングすることによって生成した。
【0084】
SpCas9バリアントを進化させるための細菌系陽性選択アッセイ
陽性選択プラスミド(埋め込まれた標的部位を有する)を含有する形質転換受容性のある大腸菌(E.coli)BW25141(λDE3)23をCas9/sgRNAをコードするプラスミドで形質転換した。SOB培地中での回収の60分後、形質転換体を、クロラムフェニコール(非選択的)またはクロラムフェニコール+10mMアラビノース(選択的)のいずれかを含有するLBプレートに蒔いた。
【0085】
新規PAMを切断することができるSpCas9バリアントについて選択するために、ランダム化D1135X/S1136X/G1218X/E1219X/R1335X/T1337X SpCas9ライブラリーをコードするプラスミドを、目的とするPAMを有する標的部位をコードする陽性選択プラスミドを既に保有している大腸菌(E.coli)BW25141(λDE3)細胞にエレクトロポレーションした。生存コロニーを、終夜増殖させ、ミニプレップして、SpCas9-XXXXXX発現プラスミドを抽出し、個々に、以前に記載のPAM配列を有する陽性選択を含有する大腸菌(E.coli)BW25141(λDE3)細胞に再形質転換して、生存表現型とそのプラスミドの連結を再試験し、それによって、偽陽性クローンを排除した。一般に、約300クローンを、追跡実験で再スクリーニングした。二次スクリーニングにおける真正の生存コロニーのSpCas9発現プラスミドを、シークエンシングして、特異性の変更をもたらすD1135、S1136、G1218、E1219、R1335および/またはT1337の位置でのアミノ酸を特定した(表1~3を参照されたい)。シークエンシングされたクローンにおいて観察された変異を、生存クローンにおけるそれらの頻度、および(いくつかの場合では)ヒト細胞系EGFP破壊アッセイにおける活性に基づいて、さらなる評価のために選択した。
【0086】
ヒト細胞培養およびトランスフェクション
EGFP-PESTレポーター遺伝子の単一の統合されたコピーを保有するU2OS細胞およびU2OS.EGFP細胞(Reyon, D. et al. FLASH assembly of TALENs for high-throughput genome editing. Nat Biotechnol 30, 460-465 (2012))を、10%のFBS、ペニシリン/ストレプトマイシンおよび2mMのGlutaMAX(Life Technologies)を有するAdvanced DMEM培地中、37℃、5%CO2で培養した。細胞株の特定を、STRプロファイリング(ATCC)およびディープシークエンシングによって検証し、細胞を、マイコプラズマ汚染について2週間に1回試験した。U2OS.EGFP培養培地に、追加で、400μg/mLのG418を補充した。細胞を、Lonza 4D-ヌクレオフェクターのDN-100プログラムを使用して、製造者の指示書に従って、750ngのCas9プラスミドおよび250ngのsgRNAプラスミドで同時トランスフェクトした。空のU6プロモータープラスミドで一緒にトランスフェクトされたCas9プラスミドを、すべてのヒト細胞実験について、陰性対照として使用した。
【0087】
ヒト細胞EGFP破壊アッセイ
EGFP破壊実験を、以前に記載されたようにして(Fu, Y. et al. High-frequency off-target mutagenesis induced by CRISPR-Cas nucleases in human cells. Nat Biotechnol 31, 822-826 (2013); Reyon, D. et al. FLASH assembly of TALENs for high-throughput genome editing. Nat Biotechnol 30, 460-465 (2012))、行った。トランスフェクションのおよそ52時間後、Fortessaフローサイトメーター(BD Biosciences)を使用して、トランスフェクトされたU2OS.EGFP細胞中のEGFP蛍光を測定した。Cas9および空のU6プロモータープラスミドの陰性対照トランスフェクションを使用して、すべての実験について、約2.5%のバックグラウンドのEGFPのロスを確立した。
【0088】
T7E1アッセイ
T7E1アッセイを、以前に記載されたようにして15、行った。U2OSヒト細胞のために、ゲノムDNAを、Agencourt DNAdvance Genomic DNA単離キット(Beckman Coulter Genomics)を使用して、トランスフェクションの約72時間後に、トランスフェクトされた細胞から抽出した。ヒト細胞のゲノムDNAからの標的遺伝子座を、表4に列挙したプライマーを使用して増幅した。概略で200ngの精製PCR産物を、変性させ、アニーリングし、およびT7E1(New England BioLabs)で消化した。変異生成頻度を、以前に記載されたようにして15、Qiaxcelキャピラリー電気泳動装置(QIagen)を使用して定量化した。
【0089】
[実施例1]
現在アクセスできないPAM配列の標的化を可能にすることによってSpCas9の有用性をさらに拡大するために、本発明者らは、新規なPAM配列を認識する能力があるSpCas9バリアントについて選択するための代替戦略を考えた。SpCas9コード配列内のある特定の位置がPAM認識のために重要であることが以前に確立されており(Kleinstiver et al., Nature 2015)、本発明者らは、6つの位置でアミノ酸をランダム化して、PAM相互作用ドメイン:D1135/S1136、G1218/E1219およびR1335/T1337の3つの別々の領域内で多様なコドン使用頻度を有するSpCas9バリアントのライブラリーを生成させる、集中変異生成アプローチを実施した。そうするために、本発明者らは、コードされたこれらの6つのアミノ酸を含有するSpCas9のコドンで、NNSヌクレオチドトリプレット(ここで、Nは任意のヌクレオチドであり、SはGまたはCである)をコードするランダム化オリゴヌクレオチドカセットを連続してクローニングした(図1A)。次いで、得られるSpCas9バリアントのライブラリーを、以前に記載されたようにして(Kleinstiver et al., Nature 2015)、さまざまなNGNN PAM配列をコードする標的部位に対して、本発明者らの細菌陽性選択アッセイでスクリーニングした(図1B)。簡潔には、SpCas9が陽性選択プラスミドにおいてコードされる標的部位(PAMおよびスペーサー配列)を認識することができる場合にのみ、細菌は、選択条件(10mMのアラビノース上に蒔かれ、これは、ccdB毒性遺伝子の転写を誘導する)で生存することができる。強いPAM認識は、選択プラスミドの加水分解をもたらし、ccdB発現の誘導を防ぎ、細菌の増殖を可能にする。このように、SpCas9ライブラリーのスクリーニングの間に、10mMのアラビノースを含有する培地で増殖したコロニーは、代替PAMを標的化することができるSpCas9 PAMバリアントをコードすると予想される(図1B)。
【0090】
本発明者らは、最初に、NGTG、NGTT、NGTCおよびNGTA PAMを有する標的部位をコードする陽性選択プラスミドにおいて、ランダム化されたD1135X/S1136X/G1218X/E1219X/R1335X/T1337X SpCas9ライブラリー(SpCas9-XXXXXX、ここで、Xは、任意のアミノ酸である)をスクリーニングした。それぞれの異なるPAM選択のために、アラビノース選択からの48の生存コロニーを集め、クロラムフェニコール含有培地中で終夜増殖させて、プラスミドをコードするヌクレアーゼを回収した。一次スクリーニングにおいて偽陽性の割合を低減するために、すべての推定上のPAMバリアントプラスミドを、その後、標的部位をコードする陽性選択プラスミドに対して、およびそれらが最初にスクリーニングされたPAMに対して、再スクリーニングした(データは示さない)。この再スクリーニングアッセイにおいて少なくとも50%生存の真正バリアントのサブセットをシークエンシングして、1135、1136、1218、1219、1335、1337番目の残基でのアミノ酸を特定し(表1)、次いで、これらのバリアントを、NGTG、NGTT、NGTCおよびNGTA PAMに対してより広範にスクリーニングして、NGTN部位に対する活性を評価した(図2a~2bおよび表1)。注意:この記載以降、細菌アッセイにおいて、SpCas9バリアントは、それらのバリアント番号(vNGTN-#)によって記載し、またはヒトアッセイにおいて「アミノ酸名称」によって記載し、ここで、アミノ酸名称は、SpCas9-XXXXXXの形式であり、ここで、6つのXは、1135、1136、1218、1219、1335および1337番目の位置でのアミノ酸識別を表す(表1~3において見られる)。再スクリーニングはわずかな傾向を特定し、ここで、いくつかの場合において、バリアントは、最初に選択されたもの(例、vNGTN-1、-3、-12、-27、-28など)に対するNGTN PAMに対して最も高い活性を有し、いくつかのバリアントは、NGT PAM(例、vNGTN-15、-31、-35など、これは、NGTCおよびNGTAを標的化することができる)の組み合わせを標的化することができ、いくつかのバリアントは、NGT PAM(例、vNGTN-9、-10、-30など)のすべてを標的化することができる(図2A~2Bおよび表1)。これらの結果に基づいて、新規なバリアントを、初期スクリーニングにおいて十分に行われたクローン中の1135、1136、1218、1219、1335および1337番目の位置でアミノ酸を生じる頻度に基づいて、合理的に設計した。これらの合理的に設計されたNGTNバリアントを、NGTG、NGTT、NGTCおよびNGTA PAM(図2C~2F)に対する細菌スクリーニングにおいて評価し、いくつかの場合において、NGAN PAM(NGAG、NGAT、NGAC、NGAA;図2C、2E~2F)に対してもスクリーニングした。再び、上記の選好性と一致した性質を有する多数の興味深いバリアントを特定したが、とりわけ、PAM(例、NGTもしくはNGA PAMを標的化することができるvNGTG-37、またはNGTおよびNGA PAMにおけるvNGTG-18ならびに-41など)の4番目の位置での選好性を与え得るいくつかの追加バリアント、NGT PAM(例、vNGTN-40、-46、-48など)のすべてを標的化することができる追加バリアント、およびNGTもしくはNGA PAM(例、vNGTN-7、-44、-59など;図2C~2Fおよび表1)のすべてまたはほぼすべてを標的化することができるバリアントを特定した。
【0091】
細菌中のNGTN PAM部位を標的化することができるいくつかのバリアントを特定し、本発明者らは、これらの選好性がヒト細胞における真正な活動に翻訳されるか否かを決定することを試みた。本発明者らのヒトU2OS EGFP破壊アッセイにおける12の異なるNGTN PAMバリアントの初期スクリーニングにおいて、本発明者らは、NGTおよびNGT PAM(例、SpCas9-GRKIQK、-VAKLLR、-VRKLLRなど)を安定して標的化し得るバリアント、およびすべてのNGT PAM部位(例、SpCas9-LRSVQL、-IRAVQLなど)を改変し得るいくつかのバリアントを特定した(図3A)。ヒト細胞EGFP破壊アッセイにおいてこれらのバリアントおよび追加の合理的に設計されたバリアントのサブセットのさらなるスクリーニングは、SpCas9-LRSVQL、-LRKIQK、-LRSVQKなどを、NGT PAM配列を標的化することができる有望なバリアントとして特定した(図3B)。ヒト細胞でのNGT PAM配列におけるSpCas9-LRSVQLの活性をより厳しく特徴付けるために、本発明者らは、ヒトU2OS細胞において、EMX1、FANCFおよびRUNX1遺伝子にわたる32の異なる内因性部位にわたって、このヌクレアーゼバリアントの活性を調べた。この解析は、NGTG、NGTA、NGTCおよびNGTT PAMを持つさまざまな内因性部位におけるSpCas9-LRSVQLの安定した活性を明らかにした(図3C、本発明者らの選択および合理的に設計したPAMバリアントが公表されたSpCas9バリアントで以前に標的化できなかった多数の遺伝子座にわたって効率よく機能することができることを実証する)。
【0092】
本発明者らは、SpCas9-VRER(D1135V/G1218R/R1335E/T1337R置換をコードする)と呼ばれるNGCG PAM部位(Kleinstiver et al., Nature, 2015)を効率的に標的化することができるSpCas9バリアントを以前に記載した。このバリアントは、以前にアクセス可能ではなかった部位の標的化を可能にするが、これは、拡張されたNGCG PAMを有する部位における活性を制限する。現在NGC、NGCおよびNGCを含むNGC PAMをすべて潜在的に標的化することによってSpCas9 PAMバリアントの有用性を拡大するために、本発明者らは、上記に記載のものに対する同様の選択を行ったが、NGCG、NGCT、NGCCまたはNGCA PAMのいずれかを有する標的部位を保有する陽性選択プラスミドに対するSpCas9-XXXXXXライブラリーをスクリーニングした(図4A~4Bおよび表2)。本発明者らがNGTN選択で観察したものと酷似して、NGCバリアントの再スクリーニングは、バリアントが、最初に選択されたNGCN PAM(例、vNGCN-3、-8、-9、-17など)に対して最も高い活性を有する場合、いくつかのバリアントが、NGC PAM(例、vNGCN-10など、これは、NGCT、NGCCおよびNGCAを標的化することができる)の組み合わせを標的化することができること、ならびにいくつかのバリアントがNGC PAM(例、vNGCN-1、-2、-5、-18、-26など)のすべてを標的化することができることを特定した(図4A~4Bおよび表2)。さまざまな合理的に生成されたNGCNバリアントを、SpCas9-XXXXXX選択クローンにおけるアミノ酸富化の観察に基づいてクローニングし、NGCN PAMに対する活性について細菌中で試験した(図4A~4B、表2、データは示さない)。
【0093】
次に、本発明者らは、本発明者らのU2OS EGFP破壊アッセイにおけるさまざまなNGCN選択SpCas9 PAMバリアントの活性を調べて、それらの再標的化PAM選好性およびヌクレアーゼ活性がヒト細胞で再現されるか否かを決定した(図5A~5D)。本発明者らは、NGCA PAM(SpCas9-MQKSER、-LWRVVA、-LWLETRなど;図5A)、NGCC PAM(SpCas9-MQKSER、-LSRWQR、-ICCCERなど;図5A)、NGCT PAM(SpCas9-MQKSER;図5C)、またはNGCCおよびNGCT PAM(SpCas9-MQKSER、-VRKSER、-ICKSERなど;図5C)に対する多数のバリアントの活性を観察した。さらに、全部で15のNGCA、NGCC、NGCTおよびNGCG部位に対するSpCas9-MQKSER、-VRKSER、-ICKSERバリアントの試験は、すべてのクラスのNGC PAMに対するそれぞれのバリアントの安定した活性を明らかにした(図5E)。いくつかの場合において、これらのバリアントは、公表されたSpCas9-VRER(例えば、図5B~5Cに示される)より優れ得るが、これは、一般に、SpCas9-VRERによって効率的に標的化されないことが以前に示されたPAMに対してであった。まとめると、これらの新しいバリアントは、SpCas9-MQKSER、およびすべてのNGC PAMに対して安定した活性を有する他のバリアントにより、以前にアクセス可能であったNGCGの代わりに、NGCT、NGCCおよびNGCAに、SpCas9の標的化を拡大する。
【0094】
加えて、本発明者らは、SpCas9-VQR(D1135V/R1335Q/T1337R;Kleinstiver et al., Nature, 2015)およびSpCas9-VRQR(D1135V/G1218R/R1335Q/T1337R;Kleinstiver and Pattanayak et al., Nature, 2016)と呼ばれるNGA PAM部位を効率的に標的化することができるSpCas9バリアントも以前に記載している。しかしながら、これらのバリアントは、NGAG>NGAA=NGAT>NGACの順で、NGA PAMのサブクラスへの選好性を有し、すなわち、これらは、NGA PAM部位に対する準最適な活性を有する。NGAN PAMのSpCas9標的化を潜在的に改善するために、本発明者らは、NGAG、NGAT、NGACおよびNGAA PAMをコードする陽性選択プラスミドに対する上記に記載のSpCas9-XXXXXXライブラリーによる選択を行った(図6A~6Bおよび表3)。NGAバリアントの再スクリーニングは、クローンが、最初に選択されたNGA PAM(例、NGAにおけるvNGAN-1、-2、-17、-26から-30など、NGAにおけるvNGAN-32、NGAにおけるvNGAN-4、-5、-40、-41など)に対する最も高い活性を有すること、いくつかのバリアントがNGA PAM(例、NGAおよびNGAを標的化することができるvNGAN-20、-21など、またはNGAおよびNGAを標的化することができるvNGAN-22)の組み合わせを標的化することができること、ならびにいくつかのバリアントがNGA PAM(例、vNGAN-3、-13、-25、-31など)のすべてを標的化することができることを明らかにした(図6A~6Bおよび表3)。
【0095】
多数のSpCas9-XXXXXXバリアントが細菌スクリーニングにおける強いNGAC PAM標的化を明らかにしたので、多くのバリアントを、本発明者らのヒト発現ベクターにサブクローニングして、本発明者らのヒト細胞U2OS EGFP破壊アッセイにおいて活性を調べた。EGFPにおける単一のNGAA、NGAC、NGATおよびNGAG PAM部位に対するバリアントのサブセットの初期スクリーニングは、ある特定のバリアントが、NGAC PAMを保有する部位でSpCas9-VQRよりも潜在的に優れていることを明らかにした(図7A)。図7Aからのバリアントおよび追加で選択されたバリアントのより広範囲におよぶ試験は、複数のSpCas9バリアントが、SpCas9-LRSVRS、-MRARKE、-SRQMRGなどを含む、EGFP破壊アッセイ(図7B)において調べられたNGAC PAMの一部または4つすべてに対するSpCas9-VRQRと比べて活性が改善されていることを明らかにした。
【0096】
次いで、本発明者らは、本発明者らのSpCas9バリアントの活性を、緩和されたNG PAM選好性が報告されているxCas9と呼ばれる最近記載されたSpCas9 PAMバリアント(Hu et al., Nature volume 556, pages 57-63 (05 April 2018))と比較した。本発明者らの以前の結果と一致して、本発明者らは、VRQRバリアント(VSREQRとしても公知)を有するNGA PAMを有する部位、VRER(VSREERとしても公知)およびMQKSERバリアントを有するNGCG PAMを有する部位、ならびにLRSVQLバリアントを有するNGT PAMを有する部位の安定したヌクレアーゼ標的化(T7E1アッセイによって評価された場合に、15~50%の間)を観察した(図8)。しかしながら、xCas9バリアントにより、NGA、NGCGまたはNGT PAMを有する部位の標的化は、10%超の効率は観察されず、さらにまた、本発明者らは、xCas9が、野生型SpCas9と比較して、NGG PAMを有する標的部位で平均で約2分の1の効果であったことを観察した(図8)。これらの結果は、本発明者らのSpCas9 PAMバリアントが、xCas9と比較した場合に、いろいろなPAMに対してより効果的なヌクレアーゼであることを実証する。
【0097】
[実施例2]
正確な単一の塩基編集イベントを行うための能力は、最近、遺伝子操作されたSpCas9塩基エディター(BE)コンストラクトを使用して実証され(例えば、Komor et al., Nature. 2016 May 19;533(7603):420-4;Nishida et al., Science. 2016 Sep 16;353(6305);Kim et al., Nat Biotechnol. 2017 Apr;35(4):371-376;Komor et al., Sci Adv. 2017 Aug 30;3(8):eaao4774;およびGaudelli et al., Nature. 2017 Nov 23;551(7681):464-471を参照されたい)、これは、非標的DNA鎖のssDNA到達性を引き起こすRループを形成するSpCas9-gRNAの形成を利用する。したがって、異種性のシチジンまたはアデニンデアミナーゼ酵素ドメインのSpCas9への融合体は、露出したssDNA鎖上で作用し得、それぞれ、CからTへの変更(いわゆる、シトシン塩基エディター、またはCBE)またはAからGへの変更(いわゆる、アデノシン塩基エディター、またなABE)の効率がよい導入をもたらす。細胞の塩基除去修復(BER)は、ウラシル塩基を除去するためにウラシルDNAグリコシラーゼ(UDG;ウラシルN-グリコシラーゼまたはUNGとしても公知)を利用するので、この内因性プロセスは、シチジンBEによって生成した編集を効率的に元に戻してしまう可能性がある。これは、シチジンの脱アミノ化がウラシル中間体をもたらすからである。したがって、シチジンBEの効率を改善するために、ウラシルグリコシラーゼ阻害剤(UGI)などの異種エフェクタードメインはまた、SpCas9と融合して、UDGを阻害することができ、BERの開始を覆し、シチジンBEの有効性を増加させる。
【0098】
したがって、本発明者らは、本発明者らのSpCas9 PAMバリアントの拡大された標的範囲が、以前にアクセス可能ではなかった部位の編集を可能にすることによって、塩基エディターの有用性を改善することができるか否かを決定することを試みた。そうするために、本発明者らは、BE3(Komor et al., Nature. 2016 May 19;533(7603):420-4)PAMバリアントを構築して、NGAおよびNGT PAMを有する部位を認識する能力があるCBEを生成した。本発明者らは、NGA PAMを有する部位において、CBE-VRQRバリアントが、編集ウィンドウにおいて7.5%~64.2%の間のCからTへの変換を示した一方で、xCas9が、同じ部位において0%~19.9%のCからTへの編集を示したことを見出した(図9A)。同様に、NGT PAMを有する部位において、CBE-LRSVQLバリアントは、10.8%~50.3%の間のCからTへの変換を示した一方で、CBE-xCas9が、同じ部位において0%~28.5%のCからTへの編集を示した(図9A)。本発明者らは、NGG PAMを有する部位において、野生型SpCas9(52.5%~62.4%)と比較して、CBE-xCas9によるCからTへの編集活性(26.7%~37.2%)の著しい減少も観察した(図9A)。これらの結果は、VRQRおよびLRSVQLのBE3バージョンが、それぞれ、xCas9より約2倍大きい割合で、NGAおよびNGT PAMを有する部位において、効果的なCBEであることを実証する。
【0099】
次に、本発明者らは、本発明者らのPAMバリアントのABE(7.10)(Gaudelli et al., Nature. 2017 Nov 23;551(7681):464-471)バージョンを構築して、ヒト細胞におけるAからGへの変換を媒介するABEとしてそれらの有効性を決定した。本発明者らは、ABE-xCas9で観察された0%~12.5%の編集と比較して、NGA PAMを有する部位において、ABE-VRQRによるAからGへの強い編集活性(8.0%~77.3%)を観察した(図9B)。同様に、NGCG PAMを有する部位において、ABE-VRER(0%~75.9%)およびABE-MSQKER(5.4%~90.4%)バリアントは、またもや、AからGへの編集について、ABE-xCas9(0%~62.3%)より優れていた(図9B)。本発明者らは、NGG PAMを有する部位において、野生型SpCas9(13.9%~50.4%)と比較して、ABE-xCas9によるAからGへの編集の減少(0%~16.9%)も観察した(図9B)。本発明者らの結果は、VRQRのABE(7.10)バージョンが、NGA PAMを有する部位におけるAからGへの編集の媒介に効果的であること、ならびにVRERおよびMSQKERのABE(7.10)バージョンが、NGCG PAMを有する部位において効果的であることを明らかにする。
【0100】
参照文献
【0101】
【表6-1】
【0102】
【表6-2】
【0103】
他の実施形態
本発明をその詳細な説明と関連して記載したが、前述の記載は、説明することを意図するものであって、本発明の範囲を限定することを意図するものではなく、本発明は、添付の特許請求の範囲によって規定されることが理解されるべきである。他の態様、利点および改変は、以下の特許請求の範囲内である。
【0104】
【表7-1】
【0105】
【表7-2】
【0106】
【表7-3】
【0107】
【表8-1】
【0108】
【表8-2】
【0109】
【表8-3】
【0110】
【表9-1】
【0111】
【表9-2】
【0112】
【表9-3】
図1
図2-1】
図2-2】
図3
図4
図5-1】
図5-2】
図6
図7
図8
図9-1】
図9-2】
【配列表】
0007581046000001.app