【実施例】
【0089】
本発明を以下の実施例においてさらに説明するが、それらの実施例は特許請求の範囲に記載の本発明の範囲を限定するものではない。
【0090】
方法
SpCas9バリアントを進化させるための細菌ベース陽性選択アッセイ
陽性選択プラスミド(標的部位が埋め込まれた)を含有するコンピテント大腸菌(E.coli)BW25141(λDE3)
23をCas9/sgRNAコードプラスミドにより形質転換した。SOB培地中の60分間のリカバリー後、クロラムフェニコール(非選択)またはクロラムフェニコール+10mMのアラビノース(選択)のいずれかを含有するLB培地上で形質転換物をプレーティングした。
【0091】
ゲノムワイド標的特異性について重要であり得る追加の位置を同定するため、ホーミングエンドヌクレアーゼの特性を研究するために既に使用されている細菌選択系(以下、陽性選択と称される)(Chen&Zhao,Nucleic Acids Res 33,e154(2005);Doyon et al.,J Am Chem Soc 128,2477−2484(2006))を適合させた。
【0092】
この系の本適合において、誘導性毒性遺伝子をコードする陽性選択プラスミドのCas9媒介開裂は、線形化プラスミドの後続の分解および損失に起因する細胞生存を可能とする。SpCas9が陽性選択系中で機能し得ることを確立した後、野生型およびバリアントの両方を、公知のヒトゲノムから選択される標的部位を保有する選択プラスミドを開裂するそれらの能力について試験した。標的部位を含有する陽性選択プラスミドを有する細菌中にこれらのバリアントを導入し、選択培地上でプレーティングした。陽性選択プラスミドの開裂は、生存頻度:選択プレート上のコロニー/非選択プレート上のコロニーを計算することにより推定した(
図1,5〜6参照)。
【0093】
【表3】
【0094】
ヒト細胞培養および形質移入
構成的に発現されるEGFP−PESTレポーター遺伝子
15の単一インテグレートコピーを保有するU2OS.EGFP細胞を、10%のFBS、2mMのGlutaMax(Life Technologies)、ペニシリン/ストレプトマイシン、および400μg/mlのG418が補給されたAdvanced DMEM培地(Life Technologies)中で、37℃において5%CO
2を用いて培養した。Lonza 4D−nucleofectorのDN−100プログラムを製造業者のプロトコルに従って使用して、750ngのCas9プラスミドおよび250ngのsgRNAプラスミド(特に注釈のない限り)により、細胞を同時形質移入した。空のU6プロモータープラスミドと一緒に形質移入されるCas9プラスミドを全てのヒト細胞実験についての陰性対照として使用した(
図2、7〜10参照)。
【0095】
ヒト細胞EGFP崩壊アッセイ
EGFP崩壊実験を既に記載のとおり実施した
16。EGFP発現について、形質移入された細胞を形質移入の約52時間後にFortessaフローサイトメーター(BD Biosciences)を使用して分析した。バックグラウンドEGFP損失を全ての実験について約2.5%においてゲーティングした(
図2、7参照)。
【0096】
ヌクレアーゼ誘導突然変異率を定量するためのT7E1アッセイ、標的化ディープシーケンシング、およびGUIDE−seq
T7E1アッセイを、ヒト細胞について既に記載のとおり(Kleinstiver,B.P.et al.,Nature 523,481−485(2015))実施した。U2OS.EGFPヒト細胞について、Agencourt DNAdvance Genomic DNA Isolation Kit(Beckman Coulter Genomics)を使用して形質移入の約72時間後にゲノムDNAを形質移入細胞から抽出した。約200ngの精製PCR産物を変性させ、アニーリングし、T7E1(New England BioLabs)により消化した。ヒト細胞について既に記載のとおり(Kleinstiver et al.,Nature 523,481−485(2015);Reyon et al,.Nat Biotechnol 30,460−465(2012))、Qiaxcelキャピラリー電気泳動機器(QIagen)を使用して突然変異誘発頻度を定量した。
【0097】
GUIDE−seq実験は、既に記載のとおり実施した(Tsai et al.,Nat Biotechnol 33,187−197(2015))。簡潔に述べると、リン酸化ホスホロチオエート修飾二本鎖オリゴデオキシヌクレオチド(dsODN)を上記のとおりCas9およびsgRNA発現プラスミドとともにCas9ヌクレアーゼとともにU2OS細胞中に形質移入した。dsODN特異的増幅、ハイスループットシーケンシング、およびマッピングを実施してDSB活性を含有するゲノム間隔を同定した。野生型対二重または四重変異体バリアント実験のため、オフターゲットリードカウントをオンターゲットリードカウントに正規化して、試料間のシーケンシング深度の差を補正した。次いで、野生型およびバリアントSpCas9についての正規化比を比較してオフターゲット部位における活性の変化倍率を計算した。GUIDE−seqについての野生型およびバリアント試料が、設定標的部位における類似のオリゴタグインテグレーション率を有するか否かを決定するため、100ngのゲノムDNA(上記のとおり単離)からPhusion Hot−Start Flexにより設定標的遺伝子座を増幅することにより制限断片長多型(RFLP)アッセイを実施した。ほぼ150ngのPCR産物を20UのNdeI(New England BioLabs)により37℃において3時間消化してから、Agencourt Ampure XPキットを使用してクリーンアップした。Qiaxcelキャピラリー電気泳動装置(QIagen)を使用してRFLP結果を定量してオリゴタグインテグレーション率を推定した。T7E1アッセイを上記のとおり同様の目的のために実施した。
【0098】
実施例1
CRISPR−Cas9RNAガイド遺伝子編集の標的化特異性に対処するための1つの潜在的な解決法は、新規突然変異を有するCas9バリアントを遺伝子操作することである。
【0099】
これらの従来の結果に基づき、CRISPR−Cas9ヌクレアーゼの特異性は、DNA上のリン酸基への結合により媒介されるDNAについてのCas9の非特異的結合親和性またはDNAとの疎水性もしくは塩基スタッキング相互作用を低減させることにより有意に増加させ得ることが仮定された(理論により拘束されるものではない)。このアプローチは、既に記載されたトランケートgRNAアプローチのようなgRNA/Cas9複合体により認識される標的部位の長さを減少させないという利点を有する。DNAについてのCas9の非特異的結合親和性は、標的DNA上のリン酸基に接触するアミノ酸残基を突然変異させることにより低減させ得ることが推定された。
【0100】
非Cas9ヌクレアーゼ、例えば、TALENのバリアントを作出するための類似のアプローチが使用されている(例えば、Guilinger et al.,Nat.Methods.11:429(2014)参照)。
【0101】
この仮定の最初の試験において、本発明者らは、DNA骨格上のリン酸と相互作用することが予測することができるSpCas9中の種々の残基中に個々のアラニン置換を導入することにより、広く使用される化膿性連鎖球菌(S.pyogenes)Cas9(SpCas9)の親和性低減バリアントを遺伝子操作することを試行した。大腸菌(E.coli)ベーススクリーニングアッセイを使用してこれらのバリアントの活性を評価した(Kleinstiver et al.,Nature.2015 Jul 23;523(7561):481−5)。この細菌系において、細胞生存率は、毒性ギラーゼ毒素ccdBについての遺伝子ならびにgRNAおよびSpCas9により標的化される23塩基対配列を含有する選択プラスミドの開裂(および後続の崩壊)に依存した。この実験の結果は、活性を保持または損失する残基を同定した(表1)。
【0102】
【表4】
【0103】
50〜100%の生存割合は通常ロバストな開裂を示す一方、0%の生存率は酵素が機能的に減衰したことを示した。細菌中でアッセイした(しかし、上記表に示されない)追加の突然変異としては、R69A、R71A、Y72A、R75A、K76A、N77A、R115A、H160A、K163A、L169A、T404A、F405A、R447A、I448A、Y450A、S460A、M495A、M694A、H698A、Y1013A、V1015A、R1122A、K1123A、およびK1124Aが挙げられる。R69AおよびF405A(細菌中の<5%の生存率を有した)を除き、それらの追加の単一突然変異の全ては、SpCas9のオンターゲット活性に対する効果をほとんど有さないと考えられた(細菌スクリーンにおいて>70%の生存率)。
【0104】
N497A、R661A、Q695A、およびQ926A突然変異の全ての考えられる単一、二重、三重および四重組合せを担持する15個の異なるSpCas9バリアントを構築して、それらの残基により作製される接触がオンターゲット活性について欠失可能であり得るか否かを試験した(
図1b)。これらの実験について、単一インテグレートEGFPレポーター遺伝子内の開裂および非相同末端結合(NHEJ)媒介修復による挿入または欠失突然変異(インデル)の誘導が細胞蛍光の損失をもたらす既に記載されたヒト細胞ベースアッセイを使用した(Reyon,D.et al.,Nat Biotechnol.30,460−465,2012)。野生型SpCas9と対合させた場合、ヒト細胞中でEGFP発現を効率的に崩壊することが既に示されているEGFP標的化sgRNAを使用すると(Fu,Y.et al.,Nat Biotechnol 31,822−826(2013)、15個全てのSpCas9バリアントは野生型SpCas9のものと同等のEGFP崩壊活性を有した(
図1b、灰色バー)。したがって、これらの残基の1つまたは全ての置換は、このEGFP標的化sgRNAを用いたSpCas9のオンターゲット開裂効率を低減させなかった。
【0105】
次に、ミスマッチ標的部位における15個全てのSpCas9バリアントの相対活性を評価するための実験を実施した。これを行うため、13および14、15および16、17および18、ならびに18および19位(最もPAMから近位の塩基について1から出発し、最もPAMから遠位の塩基について20で終わる番号付与;
図1b)における置換塩基のペアを含有する先の実験において使用されたEGFP標的化sgRNAの誘導体を用いてEGFP崩壊アッセイを繰り返した。この分析により、三重突然変異体の1つ(R661A/Q695A/Q926A)および四重突然変異体(N497A/R661A/Q695A/Q926A)の両方が、ミスマッチsgRNAの4つ全てを用いてバックグラウンドのものと同等のEGFP崩壊のレベルを示すことが明らかになった(
図1b、着色バー)。特に、15個のバリアントのうち、ミスマッチsgRNAを用いて最低活性を有するものは、全て、Q695AおよびQ926A突然変異を保有した。これらの結果および別のEGFP標的部位についてのsgRNAを使用した実験からの類似データに基づき、四重突然変異体(N497A/R661A/Q695A/Q926A)を追加の分析のために選択し、それをSpCas9−HF1(高フィデリティバリアント#1について)と命名した。
【0106】
SpCas9−HF1のオンターゲット活性
より多数のオンターゲット部位においていかにロバストにSpCas9−HF1が機能するかを決定するため、追加のsgRNAを使用してこのバリアントと野生型SpCas9との間の直接比較を実施した。合計で37個の異なるsgRNAを試験した:24個はEGFPに標的化され(EGFP崩壊アッセイを用いてアッセイする)13個は内在性ヒト遺伝子標的に標的化される(T7エンドヌクレアーゼI(T7EI)ミスマッチアッセイを使用してアッセイする)。EGFP崩壊アッセイを用いて試験した24個のsgRNAの20個(
図1c)および内在性ヒト遺伝子部位に対して試験された13個のsgRNAの12個(
図1d)は、SpCas9−HF1を用いて、同一のsgRNAを用いて野生型SpCas9の活性の少なくとも70%である活性を示した(
図1e)。実際、SpCas9−HF1は、大部分のsgRNAを用いて野生型SpCas9と高度に同等の活性(90〜140%)を示した(
図1e)。試験した37個のsgRNAの3つは、SpCas9−HF1を用いて本質的に活性を示さず、それらの標的部位の試験は、高い活性が見られたものと比較してそれらの配列の特徴のいかなる明らかな差も示唆しなかった(表3)。概して、SpCas9−HF1は、試験したsgRNAの86%(32個/37個)について同等の活性を有した(野生型SpCas9活性の70%超)。
【0107】
【表5】
【0108】
【表6】
【0109】
【表7】
【0110】
【表8】
【0111】
【表9】
【0112】
【表10】
【0113】
SpCas9−HF1のゲノムワイド特異性
SpCas9−HF1がヒト細胞中で低減したオフターゲット効果を示したか否かを試験するため、シーケンシング(GUIDE−seq)方法により可能となる二本鎖分解のゲノムワイドの偏りのない同定を使用した。GUIDE−seqは、隣接ゲノム配列の増幅およびシーケンシングを可能とするための二本鎖分解への短鎖二本鎖オリゴデオキシヌクレオチド(dsODN)タグのインテグレーションを使用し、任意の所与の部位におけるタグインテグレーションの数は、開裂効率の定量的尺度を提供する(Tsai,S.Q.et al,Nat Biotechnol 33,187−197(2015))。GUIDE−seqを使用して内在性ヒトEMX1、FANCF、RUNX1、およびZSCAN2遺伝子中の種々の部位に標的化される8つの異なるsgRNAを使用して野生型SpCas9およびSpCas9−HF1により誘導されるオフターゲット効果の範囲を比較した。これらのsgRNAにより標的化される配列はユニークであり、参照ヒトゲノム中の長さが様々な予測ミスマッチ部位を有する(表2)。8つのsgRNAについてのオンターゲットdsODNタグインテグレーションの評価(制限断片長多型(RFLP)アッセイによる)およびインデル形成(T7EIアッセイによる)により、野生型SpCas9およびSpCas9−HF1を用いた同等のオンターゲット活性が明らかになった(それぞれ
図7aおよび7b)。GUIDE−seq実験は、8つのsgRNAの7つが、野生型SpCas9を用いて複数のゲノムワイドオフターゲット部位(sgRNA当たり2〜25の範囲)における開裂を誘導する一方、8番目のsgRNA(FANCF部位4について)は、いかなる検出可能なオフターゲット部位も産生しないことを示した(
図2aおよび2b)。しかしながら、野生型SpCas9を用いてインデルを誘導した7つのsgRNAの6つは、SpCas9−HF1を用いてGUIDE−seq検出可能オフターゲットイベントの顕著に完全な不存在を示し(
図2aおよび2b);残りの7番目のsgRNA(FANCF部位2について)は、プロトスペーサーシード配列内の1つのミスマッチを保有する部位における単一の検出可能なゲノムワイドオフターゲット開裂イベントのみを誘導した(
図2a)。合計で、SpCas9−HF1を使用した場合に検出されなかったオフターゲット部位は、プロトスペーサーおよび/またはPAM配列中の1〜6つのミスマッチを保有した(
図2c)。野生型SpCas9に関して、8つのsgRNA(FANCF部位4について)は、SpCas9−HF1を用いて試験した場合にいかなる検出可能なオフターゲット開裂イベントも生じさせなかった(
図2a)。
【0114】
GUIDE−seqの知見を確認するため、標的化アンプリコンシーケンシングを使用して野生型SpCas9およびSpCas9−HF1により誘導されるNHEJ媒介インデル突然変異の頻度をより直接的に計測した。これらの実験のため、ヒト細胞にsgRNA−およびCas9コードプラスミドのみ(すなわち、GUIDE−seqタグを用いない)を形質移入した。次いで、次世代シーケンシングを使用してGUIDE−seq実験において6つのsgRNAについて野生型SpCas9を用いて同定された40個のオフターゲット部位の36個を試験した(40個の部位の4つは、それらをゲノムDNAから特異的に増幅させることができなかったため、試験することができなかった)。これらのディープシーケンシング実験は、(1)野生型SpCas9およびSpCas9−HF1が6つのsgRNAオンターゲット部位のそれぞれにおける同等の頻度のインデルを誘導すること(
図3aおよび3b);(2)野生型SpCas9が、予測されるとおり、同一部位についてのGUIDE−seqリードカウントと十分に相関する頻度における36個のオフターゲット部位(
図3b)の35個におけるインデル突然変異の統計的に有意な証拠を示すこと(
図3c);および(3)36個のオフターゲット部位の34個におけるSpCas9−HF1により誘導されるインデルの頻度は、対照形質移入からの試料中で観察されるインデルのバックグラウンドレベルと区別不能であることを示した(
図3b)。陰性対照に対してSpCas9−HF1を用いて統計的に有意な突然変異頻度を有することが考えられる2つのオフターゲット部位について、インデルの平均頻度は0.049%および0.037%であり、そのレベルにおいてそれらがシーケンシング/PCRエラーに起因するか、正規のヌクレアーゼ誘導インデルであるかを決定することは困難である。これらの結果に基づき、SpCas9−HF1は、野生型SpCas9を用いて異なる頻度の範囲にわたり生じるオフターゲット突然変異を、検出不能なレベルに完全にまたはほぼ完全に低減させ得ることが結論付けられた。
【0115】
次に、非典型のホモポリマーまたは反復配列を標的化するsgRNAのゲノムワイドオフターゲット効果を低減させるSpCas9−HF1の能力を評価した。目下のところ、多くがゲノムに対する直交性の相対的欠落に起因するの特徴を有するオンターゲット部位を回避しようと試行するが、SpCas9−HF1がそれらの困難な標的についてもオフターゲットインデルを低減させ得るか否かを調査することが望ましいことがあった。したがって、ヒトVEGFA遺伝子中のシトシンリッチホモポリマー配列または複数のTGリピートを含有する配列(それぞれVEGFA部位2およびVEGFA部位3)のいずれかを標的化する、既に特徴付けされたsgRNA(Fu,Y.et al.,Nat Biotechnol 31,Tsai,S.Q.et al.,Nat Biotechnol 33,187−197(2015)を使用した(表2)。対照実験において、これらのsgRNAのそれぞれは、野生型SpCas9およびSpCas9−HF1の両方を用いて同等のレベルのGUIDE−seq dsODNタグ取り込み(
図7c)およびインデル突然変異(
図7d)を誘導し、SpCas9−HF1はそれらのsgRNAのいずれかを用いてオンターゲット活性が害されないことを実証した。重要なことに、GUIDE−seq実験により、SpCas9−HF1が、それらのsgRNAのオフターゲット部位の低減において高度に有効であることが明らかになり、VEGFA部位2についての123個/144個の部位およびVEGFA部位3についての31個/32個の部位が検出されなかった(
図4aおよび4b)。SpCas9−HF1を用いて検出されなかったこれらのオフターゲット部位の試験は、それらがそれぞれ、それらのプロトスペーサーおよびPAM配列内の一連の総ミスマッチ:VEGFA部位2sgRNAについての2〜7つのミスマッチおよびVEGFA部位3sgRNAについての1〜4つのミスマッチを有することを示し(
図4c);さらに、VEGFA部位2についてのそれらのオフターゲットの9つは、sgRNA−DNA界面における潜在的なバルジ塩基(Lin,Y.et al,.Nucleic Acids Res 42,7473−7485(2014)を有し得る(
図4aおよび
図8)。SpCas9−HF1を用いて検出されなかった部位は、VEGFA部位2sgRNAについての2〜6つのミスマッチおよびVEGFA部位3sgRNAについての単一部位中の2つのミスマッチを有し(
図4c)、VEGFA部位2sgRNAについての3つのオフターゲット部位はここでも潜在的バルジを有した(
図8)。まとめると、これらの結果は、SpCas9−HF1が、単純リピート配列に標的化されるsgRNAのオフターゲット効果の低減において高度に有効であり得、ホモポリマー配列に標的化されるsgRNAへのかなりの影響も有し得ることを実証した。
【0116】
【表11】
【0117】
【表12】
【0118】
【表13】
【0119】
【表14】
【0120】
【表15】
【0121】
【表16】
【0122】
SpCas9−HF1の特異性の改良
既に記載された方法、例えば、トランケートgRNA(Fu,Y.et al.,Nat Biotechnol 32,279−284(2014))およびSpCas9−D1135Eバリアント(Kleinstiver,B.P.et al.,Nature 523,481−485(2015))は、SpCas9オフターゲット効果を部分的に低減させ得、本発明者らは、それらをSpCas9−HF1と組み合わせてそのゲノムワイド特異性をさらに改善することができるか否かを考慮した。ヒト細胞ベースEGFP崩壊アッセイにおける4つの部位に標的化されるマッチ全長およびトランケートsgRNAを用いたSpCas9−HF1の試験により、sgRNA相補性長さの短縮が、オンターゲット活性を実質的に害することが明らかになった(
図9)。対照的に、追加のD1135E突然変異を有するSpCas9−HF1(本明細書においてSpCas9−HF2と称されるバリアント)は、ヒト細胞ベースEGFP崩壊アッセイを使用して試験した8つのsgRNAの6つを用いて野生型SpCas9の70%以上の活性を保持した(
図5aおよび5b)。側鎖が標的DNAとのそのPAM近位末端上での疎水性非特異的相互作用を媒介する位置におけるそれぞれL169AまたはY450A突然変異を保有するSpCas9−HF3およびSpCas9−HF4バリアントも作出した(Nishimasu,H.et al.,Cell 156,935−949(2014);Jiang,F.,et al.,Science 348,1477−1481(2015))。SpCas9−HF3およびSpCas9−HF4は、8つのEGFP標的化sgRNAのうちの同一の6つを用いて野生型SpCas9を用いて観察された活性の70%以上を保持した(
図5aおよび5b)。
【0123】
SpCas9−HF2、−HF3、および−HF4が、SpCas9−HF1に耐性である2つのオフターゲット部位(FANCF部位2およびVEGFA部位3sgRNAについて)におけるインデル頻度を低減させ得るか否かを決定するため、さらなる実験を実施した。プロトスペーサーのシード配列中の単一ミスマッチを担持するFANCF部位2オフターゲットについて、SpCas9−HF4は、T7EIアッセイにより判断されるとおり、インデル突然変異頻度をほぼバックグラウンドレベルに低減させた一方、オンターゲット活性も有益に増加させ(
図5c)、3つのバリアント間の特異性の最大増加をもたらした(
図5d)。2つのプロトスペーサーミスマッチ(シード配列中に1つ、およびPAM配列から最も遠位のヌクレオチドにおいて1つ)を担持するVEGFA部位3オフターゲット部位について、SpCas9−HF2はインデル形成の最大低減を示した一方、オンターゲット突然変異頻度に対してわずかな効果のみを示し(
図5c)、試験した3つのバリアント間の特異性の最大増加をもたらした(
図5d)。まとめると、これらの結果は、非特異的DNA接触を媒介し、またはPAM認識を変更し得る他の残基における追加の突然変異を導入することにより、SpCas9−HF1に耐性であるオフターゲット効果の低減についての潜在性を実証する。
【0124】
FANCF部位2およびVEGFA部位3sgRNAのオフターゲットに対してそれぞれ、SpCas9−HF4およびSpCas9−HF2がSpCas9−HF1に対して改善された区別を有することを示す上記のT7E1アッセイの知見を一般化するため、GUIDE−seqを使用してそれらのバリアントのゲノムワイド特異性を試験した。RFLPアッセイを使用して、SpCas9−HF4およびSpCas9−HF2は、GUIDE−seqタグインテグレーション率によりアッセイされたとおり、SpCas9−HF1と類似のオンターゲット活性を有することが決定された(
図5E)。GUIDE−seqデータを分析した場合、SpCas9−HF2またはSpCas9−HF4について新たなオフターゲット部位は同定されなかった(
図5F)。SpCas9−HF1と比較して、全ての部位におけるオフターゲット活性はGUIDE−seqにより検出不能になり、または実質的に減少した。SpCas9−HF1に対して、SpCas9−HF4は、SpCas9−HF1の特異性の改善に抵抗性のままである単一のFANCF部位2オフターゲット部位に対してほぼ26倍良好な特異性を有した(
図5F)。SpCas9−HF2は、高頻度VEGFA部位3オフターゲットについてSpCas9−HF1に対してほぼ4倍改善された特異性を有した一方、他の低頻度オフターゲット部位におけるGUIDE−seq検出可能イベントも大幅に低減し(>38倍)、または排除した。注目すべきことに、SpCas9−HF1について同定されたそれらの低頻度部位の3つのゲノム位置は、既に特徴付けされたバックグラウンドU2OS細胞切断点ホットスポットに隣接する。まとめると、これらの結果はSpCas9−HF2およびSpCas9−HF4バリアントがSpCas9−HF1のゲノムワイド特異性を改善し得ることを示唆する。
【0125】
標準的な非反復標的配列に対して設計されたsgRNAを使用した場合、SpCas9−HF1はオフターゲット突然変異をロバストに一貫して低減させた。SpCas9−HF1に最も耐性であった2つのオフターゲット部位は、プロトスペーサー中の1および2つのミスマッチのみを有する。まとめると、これらの観察は、SpCas9−HF1を使用し、ゲノム中のいずれかの場所で1または2つのミスマッチを担持する密接に関連する部位を有さない非反復配列を標的化することにより(既存の公的に利用可能なソフトウェアプログラム(Bae,S.,et al,Bioinformatics 30,1473−1475(2014)を使用して容易に達成することができるもの)、オフターゲット突然変異を検出不能なレベルに最小化させ得ることを示唆する。使用者が留意すべき1つのパラメータは、SpCas9−HF1が、プロトスペーサー配列にミスマッチするgRNAの5’末端におけるGを使用する一般的手法と適合性であり得ないことである。標的部位に対してミスマッチする5’Gを担持する4つのsgRNAの試験は、4つのうちの3つが野生型SpCas9と比較してSpCas9−HF1を用いて縮小した活性を示し(
図10)、部分的にマッチする部位をより良好に区別するSpCas9−HF1の能力を反映する可能性がある。
【0126】
さらなる生化学的試験は、SpCas9−HF1その高いゲノムワイド特異性を達成する正確な機序を確認または明確化し得る。導入される4つの突然変異が細胞中のSpCas9の安定性または定常状態発現レベルを変更することは明らかでない。それというのも、減少濃度の発現プラスミドを用いるタイトレーション実験は、野生型SpCas9およびSpCas9−HF1が、それらの濃度が低下するにつれて同等に挙動することを示唆した(
図11)。その代わり、最も簡易な機序的説明は、それらの突然変異が、オンターゲット活性を保持するためにちょうど十分であるがオフターゲット部位開裂を非効率または不存在にするほど低いレベルにおける複合体のエネルギーでCas9−sgRNAと標的DNAとの間の相互作用のエネルギーを減少させたことである。この機序は、構造データ中の突然変異残基と標的DNAリン酸骨格との間で観察された非特異的相互作用と一致する(Nishimasu,H.et al.,Cell 156,935−949(2014);Anders,C et.Al.,Nature 513,569−573(2014))。いくらか類似の機序は、正荷電残基における置換を担持する転写アクチベーター様エフェクターヌクレアーゼの増加した特異性を説明するために提案されている(Guilinger,J.P.et al.,Nat Methods 11,429−435(2014))。
【0127】
SpCas9−HF1は、Cas9機能を変更することが示された他の突然変異と組み合わせることもできることが可能であった。例えば、3つのアミノ酸置換を担持するSpCas9突然変異体(D1135V/R1335Q/T1337R、SpCas9−VQRバリアントとしても公知)は、NGAN PAM(NGAG>NGAT=NGAA>NGACについての相対効率を有する)を有する部位を認識し(Kleinstiver,B.P.et al,Nature 523,481−485(2015))、近年同定された四重SpCas9突然変異体(D1135V/G1218R/R1335Q/T1337R、SpCas9−VRQRバリアントと称される)は、NGAH(H=A、C、またはT)PAMを有する部位に対してVQRバリアントに対して改善された活性を有する(
図12a)。SpCas9−HF1からSpCas9−VQRおよびSpCas9−VRQR中への4つの突然変異(N497A/R661A/Q695A/Q926A)の導入は、それぞれSpCas9−VQR−HF1およびSpCas9−VRQR−HF1を作出した。これらのヌクレアーゼのHFバージョンの両方は、EGFPレポーター遺伝子に標的化される8つのsgRNAの5つを用いて、および内在性ヒト遺伝子部位に標的化される8つのsgRNAの7つを用いてそれらの非HF相当物と同等(すなわち、70%以上)のオンターゲット活性を示した(
図12b〜12d)。
【0128】
より広く考慮すると、これらの結果は、CRISPR関連ヌクレアーゼの追加の高フィデリティバリアントの遺伝子操作のための一般的方針を説明する。非特異的DNA接触残基における追加の突然変異を追加することは、SpCas9−HF1を用いて存続する極めて少数の残留オフターゲット部位の一部をさらに低減させた。したがって、バリアント、例えば、SpCas9−HF2、SpCas9−HF3、SpCas9−HF4などは、オフターゲット配列の性質に応じて特注様式で利用することができる。さらに、SpCas9の高フィデリティバリアントの遺伝子操作を用いた成功は、非特異的DNA接触を突然変異させるアプローチが他の天然存在および遺伝子操作Cas9オルソログ(Ran,F.A.et al.,Nature 520,186−191(2015),Esvelt,K.M.et al.,Nat Methods 10,1116−1121(2013);Hou,Z.et al.,Proc Natl Acad Sci USA(2013);Fonfara,I.et al.,Nucleic Acids Res 42,2577−2590(2014);Kleinstiver,B.P.et al,Nat Biotechnol(2015)ならびに増加した頻度で発見および特徴付けされているより新たなCRISPR関連ヌクレアーゼ(Zetsche,B.et al.,Cell 163,759−771(2015);Shmakov,S.et al.,Molecular Cell 60,385−397)に拡張し得ることを示唆する。
【0129】
実施例2
標的鎖DNAに接触する残基中のアラニン置換、例として、N497A、Q695A、R661A、およびQ926Aを有するSpCas9バリアントが本明細書に記載される。これらの残基の他、本発明者らは、それらのバリアント、例えば、SpCas9−HF1バリアント(N497A/R661A/Q695A/Q926A)の特異性を、非標的DNA鎖に接触すると考えられる正荷電SpCas9残基:R780、K810、R832、K848、K855、K968、R976、H982、K1003、K1014、K1047、および/またはR1060(Slaymaker et al.,Science.2016 Jan 1;351(6268):84−8参照)中の置換を追加することにより、さらに改善することができるか否かを決定することを追求した。
【0130】
これらの位置における単一アラニン置換およびそれらの組合せを担持する野生型SpCas9誘導体の活性を、EGFP遺伝子中の部位に対して設計された完全マッチsgRNA(オンターゲット活性を評価するため)ならびに11および12位(1位は、最もPAMから近位の塩基である)における意図的なミスマッチを担持する同一のsgRNA(オフターゲット部位において見出されるミスマッチ部位における活性を評価するため)を用いるEGFP崩壊アッセイを使用して最初に試験した(
図13A)。(三重置換K810A/K1003A/R1060AまたはK848A/K1003A/R1060Aを担持する誘導体は、それぞれeSpCas9(1.0)およびeSpCas9(1.1)として公知の近年記載されたバリアントと同一であることに留意されたい;参照文献1参照)。予測されるとおり、野生型SpCas9は、ロバストなオンターゲットおよびミスマッチ標的活性を有した。対照として、この実験においてSpCas9−HF1も試験し、それが予測されるとおりオンターゲット活性を維持する一方、ミスマッチ標的活性を低減させることを見出した(
図13A)。非標的DNA鎖に潜在的に接触し得る位置における1つ以上のアラニン置換を担持する野生型SpCas9誘導体の全ては、野生型SpCas9と同等のオンターゲット活性を示した(
図13A)。興味深いことに、これらの誘導体の一部は、野生型SpCas9を用いて観察された活性に対して、ミスマッチ11/12sgRNAを用いて低減した開裂も示し、それらの誘導体中の置換のサブセットが、野生型SpCas9に対してこのミスマッチ部位に対する向上した特異性を付与することを示唆した(
図13A)。しかしながら、これらの単一置換も置換の組合せも11/12ミスマッチsgRNAを用いて観察された活性を完全に排除するために十分でなかった。9および10位におけるミスマッチを担持する追加のsgRNAを使用して野生型SpCas9、SpCas9−HF1、およびそれらの同一の野生型SpCas9誘導体を試験した場合(
図13B)、ほとんどの誘導体についてミスマッチ標的活性の最小の変化のみが観察された。ここでも、これは、これらの潜在的な非標的鎖接触残基における単一、二重、またはさらには三重置換(既に記載されたeSpCas9(1.0)および(1.1)バリアントと等価である)が不完全マッチDNA部位における活性を排除するには不十分であることを実証した。まとめると、これらのデータは、野生型SpCas9バリアントがマッチsgRNAを用いてオンターゲット活性を保持すること、および(野生型SpCas9に関して)それら自体でそれらの誘導体中に含有される置換が2つの異なるミスマッチDNA部位に対するヌクレアーゼ活性を排除するために十分でないことを実証する(
図13Aおよび13B)。
【0131】
これらの結果を考慮すると、非標的DNA鎖に接触し得る残基における1つ以上の追加のアミノ酸置換を担持するSpCas9−HF1誘導体が、親SpCas9−HF1タンパク質に対して特異性をさらに改善し得ることが仮定された。したがって、単一、二重、または三重アラニン置換の組合せを担持する種々のSpCas9−HF1誘導体を、完全マッチsgRNA(オンターゲット活性を試験するため)ならびに11および12位におけるミスマッチを担持する同一のsgRNA(オフターゲット部位について見出されるミスマッチ標的部位における活性を評価するため)を使用するヒト細胞ベースEGFP崩壊アッセイにおいて試験した。これらのsgRNAは、
図13A〜Bに使用された同一のものである。この実験により、試験したSpCas9−HF1誘導体バリアントのほとんどが、野生型SpCas9およびSpCas9−HF1の両方を用いて観察されたものと同等のオンターゲット活性を示すことが明らかになった(
図14A)。11/12ミスマッチsgRNAを用いると、試験したSpCas9−HF1誘導体の一部(例えば、SpCas9−HF1+R832AおよびSpCas9−HF1+K1014A)は、ミスマッチsgRNAを用いて開裂の認識可能な変化を示さなかった。しかしながら、重要なことにSpCas9−HF1誘導体のほとんどが、11/12ミスマッチsgRNAを用いてSpCas9−HF1、eSpCas9(1.0)、またはeSpCas9(1.1)を用いて観察されたものよりもかなり低い活性を有し、それらの新たなバリアントのある組合せが、低減したミスマッチ標的活性およびしたがって改善された特異性を有することを示唆した(
図14A)。11/12ミスマッチsgRNAを用いてミスマッチ標的活性をほぼバックグラウンドレベルに低減させた16個のSpCas9−HF1誘導体のうち、9つが、オンターゲット活性に対する最小の効果のみを有すると考えられた(完全マッチsgRNAを使用して評価した;
図14A)。9および10位において意図的にミスマッチさせたsgRNAを使用したEGFP崩壊アッセイにおけるこれらのSpCas9−HF1誘導体のサブセットの追加の試験(
図14B)により、それらのバリアントがこのミスマッチsgRNAを用いて、SpCas9−HF1(
図14b)、eSpCas9(1.1)(
図13A)、または野生型SpCas9ヌクレアーゼに追加された同一置換(
図13B)のいずれかを用いて観察されたものよりも低い活性を有することも明らかになった。重要なことに、5つのバリアントは、9/10ミスマッチsgRNAを用いたこのアッセイにおいてバックグラウンドレベルのオフターゲット活性を示した。
【0132】
次に、非標的鎖のこれらのアラニン置換を、本発明者らのSpCas9−HF1バリアントからのQ695AおよびQ926A置換のみを含有するSpCas9バリアント(ここでは、「二重」バリアント)と組み合わせることができるか否かを試験した。上記の試験HF1誘導体の多くがオンターゲット活性の観察可能(および不所望)な減少を示したため、SpCas9−HF1からの2つの最も重要な置換のみ(Q695AおよびQ926A;
図1B参照)を、1つ以上の非標的鎖接触置換と組み合わせることはオンターゲット活性をレスキューし得るが、それらの置換をSpCas9−HF1バリアントに追加した場合に観察された特異性の増加を依然として維持することが仮定された。したがって、潜在的な非標的DNA鎖相互作用位置における単一、二重、または三重アラニン置換の組合せを担持する種々のSpCas9(Q695A/Q926A)誘導体を、
図13A〜Bに使用された上記のEGFPに標的化される同一の完全マッチsgRNA(オンターゲット活性を試験するため)ならびに11および12位におけるミスマッチを担持する同一のsgRNA(オフターゲット部位について見出されるミスマッチ標的部位における活性を評価するため)を使用するヒト細胞ベースEGFP崩壊アッセイにおいて試験した。この実験により、試験したSpCas9(Q695A/Q926A)誘導体バリアントのほとんどが野生型SpCas9およびSpCas9−HF1の両方を用いて観察されたものと同等のオンターゲット活性を示すことが明らかになった(
図15)。重要なことに、SpCas9−HF1誘導体の多くは、11/12ミスマッチsgRNAを用いて、SpCas9−HF1、eSpCas9(1.0)、またはeSpCas9(1.1)を用いて観察されたものと比較してかなり低い活性を有し、それらの新たなバリアントのある組合せが、低減したミスマッチ標的活性およびしたがって改善された特異性を有することを示唆した(
図15)。11/12ミスマッチsgRNAを用いてミスマッチ標的活性を、ほぼバックグラウンドレベルに低減させた13個のSpCas9(Q695A/Q926A)誘導体のうち、1つのみがオンターゲット活性に対するかなりの効果を有すると考えられた(完全マッチsgRNAを使用して評価した;
図15)。
【0133】
概して、これらのデータは、非標的DNA鎖に接触し得る位置におけるSpCas9−HF1またはSpCas9(Q695A/Q926A)への1、2、または3つのアラニン置換の追加は、(それらの親クローンまたは近年記載されたeSpCas9(1.0)または(1.1)に対して)ミスマッチオフターゲット部位を区別する改善された能力を有する新たなバリアントをもたらし得ることを実証する。重要なことに、野生型SpCas9に関するにそれらの同一の置換は、いかなる実質的な特異性利益も提供することが考えられない。
【0134】
sgRNA−標的DNA相補性界面におけるミスマッチに対するSpCas9−HF1およびeSpCas9−1.1の寛容性をより良好に定義および比較するため、スペーサー相補性領域中の全ての考えられる位置における単一ミスマッチを含有するsgRNAを使用してそれらの活性を試験した。SpCas9−HF1およびeSPCas9−1.1バリアントの両方が野生型SpCas9と比較してほとんどの単一ミスマッチsgRNAに対する類似の活性を有し、いくつかの例外でSpCas9−HF1がeSpCas9−1.1を上回った(
図16)。
【0135】
次に、二重突然変異体(Db=Q695A/Q926A)、SpCas9−HF1(N497A/R661A/Q695A/Q926A)、eSpCas9−1.0(1.0=K810A/K1003A/R1060A)、またはeSpCas9−1.1(1.1=K848A/K1003A/R1060A)のいずれかからのアミノ酸置換と、標的鎖DNAに接触し、または非標的鎖DNAに潜在的に接触する残基中の追加のアラニン置換との組合せを含有する一部のバリアントの単一ヌクレオチドミスマッチ寛容性を試験した(
図17A〜B)。完全マッチsgRNAを使用してオンターゲット活性を評価した一方、スペーサー配列中の4、8、12、または16位におけるそのようなミスマッチを担持するsgRNAを使用して単一ヌクレオチドミスマッチ寛容性を評価した(
図17A)。多数のこれらのバリアントはオンターゲット活性を維持し、ミスマッチsgRNAを用いて観察された活性はかなり低減した。これらのバリアントの3つ(Q695A/K848A/Q926A/K1003A/R1060A、N497A/R661A/Q695A/K855A/Q926A/R1060A、およびN497A/R661A/Q695A/Q926A/H982A/R1060A)を、残りの単一ミスマッチsgRNA(1〜3、5〜7、9〜11、13〜15、および17〜20位におけるミスマッチを含有する)を用いてさらに試験した。これらのバリアントは、eSpCas9−1.1と比較してsgRNA中の単一ヌクレオチド置換に対するロバストな不寛容性を実証し、それらの新たなバリアントの改善された特異性プロファイルを実証した(
図17B)。アミノ酸置換の代替組合せを含有する追加のバリアントヌクレアーゼを、スペーサー中の5、7、および9位におけるミスマッチを含有するsgRNAを使用して試験した(従来のバリアントがそれらの位置におけるミスマッチを寛容すると考えられたため、それらの特定のミスマッチsgRNAを使用した)(
図18)。多数のこれらのヌクレアーゼはミスマッチ部位に対する改善された特異性を有し、オンターゲット活性はわずかに低減したにすぎなかった(
図18)。
【0136】
突然変異の追加の組合せが、特異性の改善を付与し得るか否かをさらに決定するため、2つの追加のマッチsgRNAを用いるヌクレアーゼバリアントの大幅に拡張されたパネルを試験して本発明者らのEGFP崩壊活性におけるオンターゲット活性を試験した(
図19A)。多数のこれらのバリアントはロバストなオンターゲット活性を維持し、それらが特異性に対するさらなる改善の生成に有用であり得ることを示唆した(
図19B)。多数のこれらのバリアントを、12、14、16、または18位における単一置換を含有するsgRNAを用いて試験して特異性の改善が観察されたか否かを決定し、それらの位置における単一ヌクレオチドミスマッチに対するより大きい不寛容性を示すことが見出された(
図19B)。
【0137】
実施例3
SpCas9を用いて行ったものと類似する、黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9)を用いる方針を採用することにより、標的DNA鎖に接触することが公知の残基(
図20および21A)、非標的DNAに接触し得る残基(進行中の実験)、およびPAM特異性に影響し得ると本発明者らが既に示した残基(
図21B)中のアラニン置換を導入することによりSaCas9の特異性を改善するための実験を実施した。標的鎖DNA骨格に接触し得る残基としては、Y211、Y212、W229、Y230、R245、T392、N419、L446、Y651、およびR654が挙げられ;非標的鎖DNAに接触し得る残基としては、Q848、N492、Q495、R497、N498、R499、Q500、K518、K523、K525、H557、R561、K572、R634、R654、G655、N658、S662、N668、R686、K692、R694、H700、K751が挙げられ;PAMに接触する残基としては、E782、D786、T787、Y789、T882、K886、N888、A889、L909、K929、N985、N986、R991、およびR1015が挙げられる。予備実験において、標的鎖DNA接触残基またはPAM接触残基(それぞれ
図21AおよびB)中の単一アラニン置換(またはそれらの一部の組合せ)は、オンターゲットEGFP崩壊活性に対する可変効果を有し(完全マッチsgRNAを使用)、オフターゲット開裂を排除し得なかった(11および12位においてミスマッチするsgRNAを使用した場合)。興味深いことに、HF1中のSpCas9突然変異は、類似ミスマッチ標的/sgRNAペアを用いてオフターゲット活性を完全に停止させ得ず、(SpCas9を用いて観察されたとおり)標的鎖/非標的鎖置換の組合せを含有するバリアントがそのような部位における特異性を改善するために必要であり得ることを示唆した。
【0138】
潜在的な標的鎖DNA接触を突然変異させてSaCas9特異性を改善する方針をさらに評価するため、sgRNA中の19および20位におけるミスマッチを寛容する突然変異の単一、二重、三重、および四重組合せの潜在性を試験した(
図22AおよびB)。これらの組合せにより、Y230およびR245におけるアラニン置換が、他の置換と組み合わせた場合、ミスマッチ部位をより良好に区別する能力により判断されるとおり、特異性を増加させ得ることが明らかになった。
【0139】
次に、これらの三重アラニン置換バリアントの2つ(Y211A/Y230A/R245AおよびY212A/Y230A/R245A)のオンターゲット遺伝子崩壊活性を、EGFP中の4つのオンターゲット部位で試験した(マッチ部位#1〜4;
図23)。これらのバリアントは、マッチ部位1および2についてロバストなオンターゲット活性を維持したが、部位3および4を用いてオンターゲット活性の約60〜70%の損失を示した。これらの三重アラニン置換バリアントの両方は、標的部位1〜4のスペーサー中の種々の位置における二重ミスマッチを担持するsgRNAを使用することにより判断されるとおり、野生型SaCas9に対して特異性を大幅に改善した(
図23)。
【0140】
これらのアラニン置換の二重および三重組合せ(それぞれ
図24AおよびB)を担持するSaCas9バリアントをオンターゲット活性について6つの内在性部位に対して試験し、21位(最もPAMから遠位の位置は、区別が困難なミスマッチであると予測される)における単一ミスマッチを含有するsgRNAを使用して特異性の改善を評価した。一部の例において、マッチsgRNAを用いるオンターゲット活性はバリアントを用いて維持した一方、21位においてミスマッチするsgRNAを用いて「オフターゲット」活性を排除した(
図24AおよびB)。他の場合、マッチsgRNAを用いて活性のわずかな損失から完全な損失が観察された。
【0141】
参考文献
1.Sander,J.D.&Joung,J.K.CRISPR−Cas systems for editing,regulating and targeting genomes.Nat Biotechnol 32,347−355(2014).
2.Hsu,P.D.,Lander,E.S.&Zhang,F.Development and applications of CRISPR−Cas9 for genome engineering.Cell 157,1262−1278(2014).
3.Doudna,J.A.&Charpentier,E.Genome editing.The new frontier of genome engineering with CRISPR−Cas9.Science 346,1258096(2014).
4.Barrangou,R.&May,A.P.Unraveling the potential of CRISPR−Cas9 for gene therapy.Expert Opin Biol Ther 15,311−314(2015).
5.Jinek,M.et al.A programmable dual−RNA−guided DNA endonuclease in adaptive bacterial immunity.Science 337,816−821(2012).
6.Sternberg,S.H.,Redding,S.,Jinek,M.,Greene,E.C.&Doudna,J.A.DNA interrogation by the CRISPR RNA−guided endonuclease Cas9.Nature 507,62−67(2014).
7.Hsu,P.D.et al.DNA targeting specificity of RNA−guided Cas9 nucleases.Nat Biotechnol 31,827−832(2013).
8.Tsai,S.Q.et al.GUIDE−seq enables genome−wide profiling of off−target cleavage by CRISPR−Cas nucleases.Nat Biotechnol 33,187−197(2015).
9.Hou,Z.et al.Efficient genome engineering in human pluripotent stem cells using Cas9 from Neisseria meningitidis.Proc Natl Acad Sci USA(2013).
10.Fonfara,I.et al.Phylogeny of Cas9 determines functional exchangeability of dual−RNA and Cas9 among orthologous type II CRISPR−Cas systems.Nucleic Acids Res 42,2577−2590(2014).
11.Esvelt,K.M.et al.Orthogonal Cas9 proteins for RNA−guided gene regulation and editing.Nat Methods 10,1116−1121(2013).
12.Cong,L.et al.Multiplex genome engineering using CRISPR/Cas systems.Science 339,819−823(2013).
13.Horvath,P.et al.Diversity,activity,and evolution of CRISPR loci in Streptococcus thermophilus.J Bacteriol 190,1401−1412(2008).
14.Anders,C.,Niewoehner,O.,Duerst,A.&Jinek,M.Structural basis of PAM−dependent target DNA recognition by the Cas9 endonuclease.Nature 513,569−573(2014).
15.Reyon,D.et al.FLASH assembly of TALENs for high−throughput genome editing.Nat Biotechnol 30,460−465(2012).
16.Fu,Y.et al.High−frequency off−target mutagenesis induced by CRISPR−Cas nucleases in human cells.Nat Biotechnol 31,822−826(2013).
17.Chen,Z.&Zhao,H.A highly sensitive selection method for directed evolution of homing endonucleases.Nucleic Acids Res 33,e154(2005).
18.Doyon,J.B.,Pattanayak,V.,Meyer,C.B.&Liu,D.R.Directed evolution and substrate specificity profile of homing endonuclease I−SceI.J Am Chem Soc 128,2477−2484(2006).
19.Jiang,W.,Bikard,D.,Cox,D.,Zhang,F.&Marraffini,L.A.RNA−guided editing of bacterial genomes using CRISPR−Cas systems.Nat Biotechnol 31,233−239(2013).
20.Mali,P.et al.RNA−guided human genome engineering via Cas9.Science 339,823−826(2013).
21.Hwang,W.Y.et al.Efficient genome editing in zebrafish using a CRISPR−Cas system.Nat Biotechnol 31,227−229(2013).
22.Chylinski,K.,Le Rhun,A.&Charpentier,E.The tracrRNA and Cas9 families of type II CRISPR−Cas immunity systems.RNA Biol 10,726−737(2013).
23.Kleinstiver,B.P.,Fernandes,A.D.,Gloor,G.B.&Edgell,D.R.A unified genetic,computational and experimental framework identifies functionally relevant residues of the homing endonuclease I−BmoI.Nucleic Acids Res 38,2411−2427(2010).
24.Gagnon,J.A.et al.Efficient mutagenesis by Cas9 protein−mediated oligonucleotide insertion and large−scale assessment of single−guide RNAs.PLoS One 9,e98186(2014).
【0142】
配列
配列番号271 − JDS246:CMV−T7−ヒトSpCas9−NLS−3xFLAG
ヒトコドン最適化化膿性連鎖球菌(S.pyogenes)Cas9、通常フォント、NLS、二重下線、3xFLAGタグ、太字:
【化4】
【0143】
配列番号272 − VP12:CMV−T7−ヒトSpCas9−HF1(N497A、R661A、Q695A、Q926A)−NLS−3xFLAG
ヒトコドン最適化化膿性連鎖球菌(S.pyogenes)Cas9、通常フォント、改変コドン、小文字、NLS、二重下線、3xFLAGタグ、太字:
【化5】
【0144】
配列番号273 − MSP2135:CMV−T7−ヒトSpCas9−HF2(N497A、R661A、Q695A、Q926A、D1135E)−NLS−3xFLAG
ヒトコドン最適化化膿性連鎖球菌(S.pyogenes)Cas9、通常フォント、改変コドン、小文字、NLS、二重下線、3xFLAGタグ、太字:
【化6】
【0145】
配列番号274 − MSP2133:CMV−T7−ヒトSpCas9−HF4(Y450A、N497A、R661A、Q695A、Q926A)−NLS−3xFLAG
ヒトコドン最適化化膿性連鎖球菌(S.pyogenes)Cas9、通常フォント、改変コドン、小文字、NLS、二重下線、3xFLAGタグ、太字:
【化7】
【0146】
配列番号275 − MSP469:CMV−T7−ヒトSpCas9−VQR(D1135V、R1335Q、T1337R)−NLS−3xFLAG
ヒトコドン最適化化膿性連鎖球菌(S.pyogenes)Cas9、通常フォント、改変コドン、小文字、NLS、二重下線、3xFLAGタグ、太字:
【化8】
【0147】
配列番号276 − MSP2440:CMV−T7−ヒトSpCas9−VQR−HF1(N497A、R661A、Q695A、Q926A、D1135V、R1335Q、T1337R)−NLS−3xFLAG
ヒトコドン最適化化膿性連鎖球菌(S.pyogenes)Cas9、通常フォント、改変コドン、小文字、NLS、二重下線、3xFLAGタグ、太字:
【化9】
【0148】
配列番号277 − BPK2797:CMV−T7−ヒトSpCas9−VRQR(D1135V、G1218R、R1335Q、T1337R)−NLS−3xFLAG
ヒトコドン最適化化膿性連鎖球菌(S.pyogenes)Cas9、通常フォント、改変コドン、小文字、NLS、二重下線、3xFLAGタグ、太字:
【化10】
【0149】
配列番号278 − MSP2443:CMV−T7−ヒトSpCas9−VRQR−HF1(N497A、R661A、Q695A、Q926A、D1135V、G1218R、R1335Q、T1337R)−NLS−3xFLAG
ヒトコドン最適化化膿性連鎖球菌(S.pyogenes)Cas9、通常フォント、改変コドン、小文字、NLS、二重下線、3xFLAGタグ、太字:
【化11】
【0150】
配列番号279 − BPK1520:U6−BsmBIカセット−Sp−sgRNA
U6プロモーター、通常フォント、BsmBI部位、イタリック、化膿性連鎖球菌(S.pyogenes)sgRNA、小文字、U6ターミネーター、二重下線:
【化12】
【0151】
他の実施形態
本発明をその詳細な説明とともに記載した一方、上記の説明は、添付の特許請求の範囲
の範囲により定義される本発明の範囲を説明するものであり、限定するものではないこと
を理解すべきである。他の態様、利点、および改変は、以下の特許請求の範囲の範囲内で
ある。
上記の開示に基づく発明の例として、以下のものが挙げられる。
[1] 以下の位置:L169、Y450、N497、R661、Q695、Q926、および/またはD1135の1、2、3、4、5、6、または7つ全てにおける突然変異を有し、好ましくは、以下の位置:L169、Y450、N497、R661、Q695、Q926、D1135の1、2、3、4、5、6、または7つにおける突然変異を有する配列番号1のアミノ酸配列と少なくとも80%同一である配列ならびに任意選択的に核局在化配列、細胞浸透ペプチド配列、および/または親和性タグの1つ以上を含む単離化膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)タンパク質。
[2] 以下:N497、R661、Q695、およびQ926の1、2、3、または4つ全てにおける突然変異、好ましくは、以下の突然変異:N497A、R661A、Q695A、およびQ926Aの1、2、3、または4つ全てを含む、[1]に記載の単離タンパク質。
[3] Q695および/またはQ926の一方または両方ならびに任意選択的にL169、Y450、N497、R661、およびD1135の1、2、3、4、または5つ全てにおける突然変異、好ましくは、Y450A/Q695A、L169A/Q695A、Q695A/Q926A、Q695A/D1135E、Q926A/D1135E、Y450A/D1135E、L169A/Y450A/Q695A、L169A/Q695A/Q926A、Y450A/Q695A/Q926A、R661A/Q695A/Q926A、N497A/Q695A/Q926A、Y450A/Q695A/D1135E、Y450A/Q926A/D1135E、Q695A/Q926A/D1135E、L169A/Y450A/Q695A/Q926A、L169A/R661A/Q695A/Q926A,Y450A/R661A/Q695A/Q926A、N497A/Q695A/Q926A/D1135E、R661A/Q695A/Q926A/D1135E、またはY450A/Q695A/Q926A/D1135Eを含む、[1]に記載の単離タンパク質。
[4] N14;S15;S55;R63;R78;H160;K163;R165;L169;R403;N407;Y450;M495;N497;K510;Y515;W659;R661;M694;Q695;H698;A728;S730;K775;S777;R778;R780;K782;R783;K789;K797;Q805;N808;K810;R832;Q844;S845;K848;S851;K855;R859;K862;K890;Q920;Q926;K961;S964;K968;K974;R976;N980;H982;K1003;Y1013;K1014;V1015;S1040;N1041;N1044;K1047;K1059;R1060;K1107;E1108;S1109;K1113;R1114;S1116;K1118;R1122;K1123;K1124;D1135;S1136;K1153;K1155;K1158;K1200;Q1221;H1241;Q1254;Q1256;K1289;K1296;K1297;R1298;K1300;H1311;K1325;K1334;T1337および/またはS1216における突然変異、好ましくは、N497A/R661A/Q695A/Q926A/K810A、N497A/R661A/Q695A/Q926A/K848A、N497A/R661A/Q695A/Q926A/K855A、N497A/R661A/Q695A/Q926A/R780A、N497A/R661A/Q695A/Q926A/K968A、N497A/R661A/Q695A/Q926A/H982A、N497A/R661A/Q695A/Q926A/K1003A、N497A/R661A/Q695A/Q926A/K1014A、N497A/R661A/Q695A/Q926A/K1047A、N497A/R661A/Q695A/Q926A/R1060A、N497A/R661A/Q695A/Q926A/K810A/K968A、N497A/R661A/Q695A/Q926A/K810A/K848A、N497A/R661A/Q695A/Q926A/K810A/K1003A、N497A/R661A/Q695A/Q926A/K810A/R1060A、N497A/R661A/Q695A/Q926A/K848A/K1003A、N497A/R661A/Q695A/Q926A/K848A/R1060A、N497A/R661A/Q695A/Q926A/K855A/K1003A、N497A/R661A/Q695A/Q926A/K855A/R1060A、N497A/R661A/Q695A/Q926A/K968A/K1003A、N497A/R661A/Q695A/Q926A/H982A/K1003A、N497A/R661A/Q695A/Q926A/H982A/R1060A、N497A/R661A/Q695A/Q926A/K1003A/R1060A、N497A/R661A/Q695A/Q926A/K810A/K1003A/R1060A、N497A/R661A/Q695A/Q926A/K848A/K1003A/R1060A、Q695A/Q926A/R780A、Q695A/Q926A/K810A、Q695A/Q926A/R832A、Q695A/Q926A/K848A、Q695A/Q926A/K855A、Q695A/Q926A/K968A、Q695A/Q926A/R976A、Q695A/Q926A/H982A、Q695A/Q926A/K1003A、Q695A/Q926A/K1014A、Q695A/Q926A/K1047A、Q695A/Q926A/R1060A、Q695A/Q926A/K848A/K968A、Q695A/Q926A/K848A/K1003A、Q695A/Q926A/K848A/K855A、Q695A/Q926A/K848A/H982A、Q695A/Q926A/K1003A/R1060A、Q695A/Q926A/R832A/R1060A、Q695A/Q926A/K968A/K1003A、Q695A/Q926A/K968A/R1060A、Q695A/Q926A/K848A/R1060A、Q695A/Q926A/K855A/H982A、Q695A/Q926A/K855A/K1003A、Q695A/Q926A/K855A/R1060A、Q695A/Q926A/H982A/K1003A、Q695A/Q926A/H982A/R1060A、Q695A/Q926A/K1003A/R1060A、Q695A/Q926A/K810A/K1003A/R1060A、Q695A/Q926A/K1003A/K1047A/R1060A、Q695A/Q926A/K968A/K1003A/R1060A、Q695A/Q926A/R832A/K1003A/R1060A、またはQ695A/Q926A/K848A/K1003A/R1060Aをさらに含む、[1]に記載の単離タンパク質。
[5] 以下の突然変異:D1135E;D1135V;D1135V/R1335Q/T1337R(VQRバリアント);D1135E/R1335Q/T1337R(EQRバリアント);D1135V/G1218R/R1335Q/T1337R(VRQRバリアント);またはD1135V/G1218R/R1335E/T1337R(VRERバリアント)の1つ以上をさらに含む、[1]に記載の単離タンパク質。
[6] D10、E762、D839、H983、またはD986;およびH840またはN863における突然変異からなる群から選択される、ヌクレアーゼ活性を減少させる1つ以上の突然変異をさらに含む、[1]に記載の単離タンパク質。
[7] ヌクレアーゼ活性を減少させる前記突然変異が、
(i)D10AまたはD10N、および
(ii)H840A、H840N、またはH840Y
である、[6に記載の単離タンパク質。
[8] 以下の位置:Y211、Y212、W229、Y230、R245、T392、N419、Y651、R654の1、2、3、4、5、6つ以上における突然変異を有し、好ましくは、以下の位置:Y211、Y212、W229、Y230、R245、T392、N419、Y651、R654の1、2、3、4、または5、6つ以上における突然変異を有する配列番号1のアミノ酸配列と少なくとも80%同一である配列ならびに任意選択的に核局在化配列、細胞浸透ペプチド配列、および/または親和性タグの1つ以上を含む単離黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9)タンパク質。
[9] 以下の突然変異:Y211A、Y212A、W229、Y230A、R245A、T392A、N419A、Y651、および/またはR654Aの1つ以上を含む、[8]に記載の単離タンパク質。
[10] N419および/またはR654における突然変異ならびに任意選択的に追加の突然変異Y211、Y212、W229、Y230、R245およびT392の1、2、3、4つ以上、好ましくは、N419A/R654A、Y211A/R654A、Y211A/Y212A、Y211A/Y230A、Y211A/R245A、Y212A/Y230A、Y212A/R245A、Y230A/R245A、W229A/R654A、Y211A/Y212A/Y230A、Y211A/Y212A/R245A、Y211A/Y212A/Y651A、Y211A/Y230A/R245A、Y211A/Y230A/Y651A、Y211A/R245A/Y651A、Y211A/R245A/R654A、Y211A/R245A/N419A、Y211A/N419A/R654A、Y212A/Y230A/R245A、Y212A/Y230A/Y651A、Y212A/R245A/Y651A、Y230A/R245A/Y651A、R245A/N419A/R654A、T392A/N419A/R654A、R245A/T392A/N419A/R654A、Y211A/R245A/N419A/R654A、W229A/R245A/N419A/R654A、Y211A/R245A/T392A/N419A/R654A、またはY211A/W229A/R245A/N419A/R654Aを含む、[8]に記載の単離タンパク質。
[11] Y211;Y212;W229;Y230;R245;T392;N419;L446;Q488A;N492A;Q495A;R497A;N498A;R499;Q500;K518;K523;K525;H557;R561;K572;R634;Y651;R654;G655;N658;S662;N667;R686;K692;R694;H700;K751;D786;T787;Y789;T882;K886;N888;889;L909;N985;N986;R991;R1015;N44;R45;R51;R55;R59;R60;R116;R165;N169;R208;R209;Y211;T238;Y239;K248;Y256;R314;N394;Q414;K57;R61;H111;K114;V164;R165;L788;S790;R792;N804;Y868;K870;K878;K879;K881;Y897;R901;および/またはK906における突然変異をさらに含む、[8]に記載の単離タンパク質。
[12] 以下の突然変異:E782K、K929R、N968K、またはR1015Hの1つ以上、具体的には、E782K/N968K/R1015H(KKHバリアント);E782K/K929R/R1015H(KRHバリアント);またはE782K/K929R/N968K/R1015H(KRKHバリアント)をさらに含む、[8]に記載の単離タンパク質。
[13] D10、E477、D556、H701、またはD704;およびH557またはN580における突然変異からなる群から選択される、ヌクレアーゼ活性を減少させる1つ以上の突然変異をさらに含む、[8]に記載の単離タンパク質。
[14] 前記突然変異が、
(i)D10AもしくはD10N、および/または
(ii)H557A、H557N、もしくはH557Y、および/または
(iii)N580A、および/または
(iv)D556A
である、[13]に記載の単離タンパク質。
[15] 任意選択の介在リンカーにより異種機能ドメインに融合されている[1]〜[14]のいずれか一項に記載の単離タンパク質を含む融合タンパク質であって、前記リンカーが前記融合タンパク質の活性を妨害しない、融合タンパク質。
[16] 前記異種機能ドメインが転写活性化ドメインである、[15]に記載の融合タンパク質。
[17] 前記転写活性化ドメインがVP64またはNF−κB p65からのものである、[16に記載の融合タンパク質。
[18] 前記異種機能ドメインが転写サイレンサーまたは転写抑制ドメインである、[15]に記載の融合タンパク質。
[19] 前記転写抑制ドメインが、クルッペル関連ボックス(KRAB)ドメイン、ERFリプレッサードメイン(ERD)、またはmSin3A相互作用ドメイン(SID)である、[18]に記載の融合タンパク質。
[20] 前記転写サイレンサーがヘテロクロマチンタンパク質1(HP1)、好ましくはHP1αまたはHP1βである、[18]に記載の融合タンパク質。
[21] 前記異種機能ドメインが、DNAのメチル化状態を改変する酵素である、[15]に記載の融合タンパク質。
[22] 前記DNAのメチル化状態を改変する前記酵素がDNAメチルトランスフェラーゼ(DNMT)またはTETタンパク質である、[21]に記載の融合タンパク質。
[23] 前記TETタンパク質がTET1である、[22]に記載の融合タンパク質。
[24] 前記異種機能ドメインが、ヒストンサブユニットを改変する酵素である、[15]に記載の融合タンパク質。
[25] ヒストンサブユニットを改変する前記酵素が、ヒストンアセチルトランスフェラーゼ(HAT)、ヒストンデアセチラーゼ(HDAC)、ヒストンメチルトランスフェラーゼ(HMT)、またはヒストンデメチラーゼである、[15]に記載の融合タンパク質。
[26] 前記異種機能ドメインが生物学的係留物である、[15]に記載の融合タンパク質。
[27] 前記生物学的係留物がMS2、Csy4またはラムダNタンパク質である、[26]に記載の融合タンパク質。
[28] 前記異種機能ドメインがFokIである、[26]に記載の融合タンパク質。
[29] [1]〜[14]のいずれか一項に記載のタンパク質をコードする単離核酸。
[30] 任意選択的に、[1]〜[24]のいずれか一項に記載のタンパク質を発現させるための1つ以上の調節ドメインに作動可能に結合されている、[29]に記載の単離核酸を含むベクター。
[31] [29]に記載の核酸を含み、かつ任意選択的に[1]〜[14]のいずれか一項に記載のタンパク質を発現する宿主細胞、好ましくは哺乳動物宿主細胞。
[32] 細胞のゲノムまたはエピゲノムを変更する方法であって、前記細胞中で、[1]〜[14]のいずれか一項に記載の単離タンパク質および前記細胞の前記ゲノムの選択部分に相補的な領域を有するガイドRNAを発現させるか、またはそれらと前記細胞を接触させることを含む方法。
[33] [15]に記載のタンパク質をコードする単離核酸。
[34] 任意選択的に、[15]に記載のタンパク質を発現させるための1つ以上の調節ドメインに作動可能に結合されている、[33]に記載の単離核酸を含むベクター。
[35] [33]に記載の核酸を含み、かつ任意選択的に[15]に記載のタンパク質を発現する宿主細胞、好ましくは哺乳動物宿主細胞。
[36] 細胞のゲノムまたはエピゲノムを変更する方法であって、前記細胞中で、[1]〜[14]のいずれか一項に記載の単離タンパク質および前記細胞の前記ゲノムの選択部分に相補的な領域を有するガイドRNAを発現させるか、またはそれらと前記細胞を接触させることを含む方法。
[37] 細胞のゲノムまたはエピゲノムを変更する方法であって、前記細胞中で、[15]〜[28]のいずれか一項に記載の単離融合タンパク質および前記細胞の前記ゲノムの選択部分に相補的な領域を有するガイドRNAを発現させるか、またはそれらと前記細胞を接触させることを含む方法。
[38] 前記単離タンパク質または融合タンパク質が、核局在化配列、細胞浸透ペプチド配列、および/または親和性タグの1つ以上を含む、[36]または[37]に記載の方法。
[39] 前記細胞が、幹細胞、好ましくは、胚性幹細胞、間葉系幹細胞、もしくは誘導多能性幹細胞であるか、生存動物中に存在するか、または胚中に存在する、[36]または[37]に記載の方法。
[40] 二本鎖DNA D(dsDNA)分子を変更する方法であって、前記dsDNA分子を[1]〜[14]のいずれか一項に記載の単離タンパク質および前記dsDNA分子の選択部分に相補的な領域を有するガイドRNAと接触させることを含む方法。
[41] 前記dsDNA分子がインビトロで存在する、[40]に記載の方法。
[42] 二本鎖DNA D(dsDNA)分子を変更する方法であって、前記dsDNA分子を[15]に記載の融合タンパク質および前記dsDNA分子の選択部分に相補的な領域を有するガイドRNAと接触させることを含む方法。
[43] 前記dsDNA分子がインビトロで存在する、[42]に記載の方法。