【実施例】
【0070】
本発明を以下の実施例においてさらに説明するが、それらの実施例は特許請求の範囲に記載の本発明の範囲を限定するものではない。
【0071】
方法
実施例1および2では、以下の材料および方法を使用した。
【0072】
プラスミドおよびオリゴヌクレオチド
本試験において使用される親構築物についての概略図およびDNA配列は、
図5A〜Jおよび配列番号7〜20に見出すことができる。陽性選択プラスミド、陰性選択プラスミド、および部位枯渇ライブラリーを生成するために使用されるオリゴヌクレオチドの配列は、表1において入手可能である。本試験における全てのgRNA標的の配列は、表2において入手可能である。Cas9中の点突然変異は、PCRにより生成した。
【0073】
【表3】
【0074】
【表4】
【0075】
【表5】
【0076】
【表6】
【0077】
【表7】
【0078】
Cas9およびsgRNAを別個に発現させるための2つのT7プロモーターを有する細菌Cas9/sgRNA発現プラスミドを構築した。これらのプラスミドは、化膿性連鎖球菌(S.pyogenes)についてのCas9(BPK764、JDS246からサブクローニングされたSpCas9配列
17)、CRISPR遺伝子座1からのS.サーモフィラス(S.thermophilus)Cas9についてのCas9(MSP1673、既に公開された記載から改変されたSt1Cas9配列
20)、および黄色ブドウ球菌(S.aureus)についてのCas9(BPK2101、Uniprot J7RUA5からコドン最適化されたSaCas9配列)のヒトコドン最適化バージョンをコードする。SpCas9
34,35およびSt1Cas9
20については、既に記載されているsgRNA配列を利用した一方、SaCas9 sgRNA配列は、CRISPRfinderを使用するcrRNAリピートについてのEuropean Nucleotide Archive配列HE980450の検索、および既に記載されているものと同様の生物情報学的アプローチを使用するtracrRNAの同定により決定した
36。sgRNAのスペーサー相補性領域を完成させるためにアニールされるオリゴをBsaI切断BPK764およびBPK2101、またはBspMI切断MSP1673中にライゲートした(5’−ATAGをスペーサーに付加してトップオリゴを生成し、5’−AAACをスペーサー配列の逆相補鎖に付加してボトムオリゴを生成する)。
【0079】
Mutazyme II(Agilent Technologies)を使用してSpCas9の残基1097〜1368を約5.2個の置換/キロベースの率においてランダムに突然変異させて突然変異PAM相互作用(PI)ドメインライブラリーを生成した。それぞれのPIドメインライブラリーの理論複雑度は、得られた形質転換体の数に基づき10
7個超のクローンであると推定された。陽性および陰性選択プラスミドは、XbaI/SphIまたはEcoRI/SphI切断p11−lacY−wtx1
17中にアニールされる標的部位オリゴをそれぞれライゲートすることにより生成した。
【0080】
2つのランダム化PAMライブラリー(それぞれ異なるプロトスペーサー配列を有する)は、クレノウ(−エキソ)を使用して構築し、プロトスペーサーの3’末端に直接隣接する6つのランダム化ヌクレオチドを含有するオリゴのボトム鎖をフィルインした(表1参照)。二本鎖産物をEcoRIにより切断し、切断p11−lacY−wtx1中へのライゲーションのためのEcoRI/SphI末端を残した。それぞれのランダム化PAMライブラリーの理論複雑度は、得られた形質転換体の数に基づき10
6個超であることが推定された。
【0081】
SpCas9およびSpCas9バリアントは、JDS246
16に由来するベクターからヒト細胞中で発現させた。St1Cas9およびSaCas9について、MSP1673およびBPK2101からのCas9 ORFをCAGプロモーターベクター中にサブクローニングして、それぞれMSP1594およびBPK2139を生成した。sgRNAのU6発現のためのプラスミド(その中に、所望のスペーサーオリゴをクローニングすることができる)は、SpCas9 sgRNA(BPK1520)、St1Cas9 sgRNA(BPK2301)、およびSaCas9 gRNA(VVT1)について上記のsgRNA配列を使用して生成した。sgRNAのスペーサー相補性領域を完成させるためにアニールされるオリゴをそれらのベクターのBsmBIオーバーハング中にライゲートした(5’−CACCをスペーサーに付加してトップオリゴを生成し、5’−AAACをスペーサー配列の逆相補鎖に付加してボトムオリゴを生成する)。
【0082】
SpCas9バリアントを進化させるための細菌ベース陽性選択アッセイ
陽性選択プラスミド(標的部位が埋め込まれた)を含有するコンピテント大腸菌(E.coli)BW25141(λDE3)
23をCas9/sgRNAコードプラスミドにより形質転換した。SOB培地中の60分間のリカバリー後、クロラムフェニコール(非選択)またはクロラムフェニコール+10mMのアラビノース(選択)のいずれかを含有するLB培地上で形質転換物をプレーティングした。陽性選択プラスミドの開裂は、生存頻度:選択プレート上のコロニー/非選択プレート上のコロニーを計算することにより推定した(
図12も参照)。
【0083】
新規PAMを開裂し得るSpCas9バリアントについて選択するため、標的部位+目的のPAMをコードする陽性選択プラスミドを含有する大腸菌(E.coli)BW25141(λDE3)細胞中に、PIドメイン突然変異Cas9/sgRNAプラスミドライブラリーをエレクトロポレートした。一般に、約50,000個のクローンをスクリーニングして50〜100個の生存物を得た。生存クローンのPIドメインをフレッシュなバックボーンプラスミド中にサブクローニングし、陽性選択において再試験した。活性についてのこの第2のスクリーンにおいて10%超の生存率を有したクローンをシーケンシングした。シーケンシングされたクローン中で観察された突然変異を、生存クローン中のそれらの頻度、置換のタイプ、SpCas9/sgRNA結晶構造(PDB:4UN3)
14中のPAM塩基への近接性、および(一部の場合)ヒト細胞ベースEGFP崩壊アッセイにおける活性に基づきさらなる評価のために選択した。
【0084】
Cas9PAM特異性をプロファイルするための細菌ベース部位枯渇アッセイ
Cas9/sgRNA発現プラスミドを含有するコンピテント大腸菌(E.coli)BW25141(λDE3)を、開裂性または非開裂性標的部位を保有する陰性選択プラスミドにより形質転換した。SOB培地中の60分間のリカバリー後、クロラムフェニコール+カルベニシリンを含有するLB培地上で形質転換物をプレーティングした。陰性選択プラスミドの開裂は、形質転換されたDNA1μg当たりのコロニー形成単位を計算することにより推定した(
図13も参照)。
【0085】
陰性選択は、適切なCas9/sgRNAプラスミドを既に保有する大腸菌(E.coli)BW25141(λDE3)細胞中にそれぞれのランダム化PAMライブラリーをエレクトロポレートすることにより、Cas9ヌクレアーゼのPAM特異性プロファイルを決定するように適合させた。80,000〜100,000個のコロニーをLB+クロラムフェニコール+カルベニシリンプレート上で低密度スプレッドにおいてプレーティングした。Cas9による開裂が生じない陰性選択プラスミドを含有する生存コロニーをハーベストし、プラスミドDNAをマキシプレップ(Qiagen)により単離した。得られたプラスミドライブラリーは、Phusion Hot−start Flex DNA Polymerase(New England BioLabs)使用するPCRと、それに続くAgencourt Ampure XPクリーンアップステップ(Beckman Coulter Genomics)とにより増幅した。それぞれの部位枯渇実験についての約500ngのクリーンPCR産物から、KAPA HTPライブラリー調製キット(KAPA BioSystems)を使用して二重インデックス化Tru−Seq Illuminaディープシーケンシングライブラリーを調製した。Dana−Farber Cancer Institute Molecular Biology Coreにより、Illumina MiSeq Sequencer上で150bpペアドエンドシーケンシングが実施された。
【0086】
それぞれのMiSeqランについて出力された未処理FASTQファイルをPythonプログラムにより分析して相対PAM枯渇を決定した。プログラム(方法参照)は、以下のとおり作動する:第1に、所与の実験についての全てのFASTQリードファイルを選択することができるファイルダイアログを使用者に提示する。これらのファイルについて、それぞれのFASTQエントリーを両方の鎖上の固定スペーサー領域についてスキャンする。スペーサー領域が見出される場合、スペーサー領域をフランキングする6つの変動ヌクレオチドを捕捉し、カウンタに付加する。この検出された変動領域の組から、それぞれの考えられる位置における長さ2〜6ntのそれぞれのウインドウのカウントおよび頻度を一覧にした。両方のランダム化PAMライブラリーについての部位枯渇データは、選択後PAM枯渇値(PPDV):選択集団におけるPAMの選択後頻度を、そのPAMの選択前ライブラリー頻度により除したものを計算することにより分析した。PPDV分析は、6bpランダム化領域中の全ての考えられる2〜6長のウインドウにわたるそれぞれの実験について実施した。PAM優先性を可視化するために本発明者らが使用したウインドウは、野生型およびバリアントSpCas9実験についての2番目、3番目、および4番目のPAM位置を表す3ntウインドウ、ならびにSt1Cas9およびSaCas9についての3番目、4番目、5番目、6番目のPAM位置を表す4ntウインドウであった。
【0087】
PPDVについての2つの有意性閾値は、1)dCas9対選択前ライブラリー対数リードカウント比の分布に基づく統計的有意性閾値(
図13cおよび13d参照)、ならびに2)ヒト細胞における枯渇値および活性間の経験的相関に基づく生物学的活性閾値に基づき決定した。統計的閾値は、dCas9についての平均PPDVからの3.36標準偏差(0.85の相対PPDVに相当)において設定し、それは多重比較のための調整後の0.05の正規分布両側p値に対応する(すなわち、p=0.05/64)。生物学的活性閾値は、5倍枯渇(0.2のPPDVに相当)において設定した。なぜなら、この枯渇のレベルがヒト細胞における活性の妥当な予測因子として機能するためである(
図14も参照)。
図14の95%信頼区間は、平均の標準偏差を、1.96により乗じた試料サイズの平方根により除することにより計算した。
【0088】
ヒト細胞培養および形質移入
構成的に発現されるEGFP−PESTレポーター遺伝子の単一インテグレートコピーを保有するU2OS.EGFP細胞
15を、10%のFBS、2mMのGlutaMax(Life Technologies)、ペニシリン/ストレプトマイシン、および400μg/mlのG418が補給されたAdvanced DMEM培地(Life Technologies)中で、37℃において5%CO
2を用いて培養した。Lonza 4D−nucleofectorのDN−100プログラムを製造業者のプロトコルに従って使用して、750ngのCas9プラスミドおよび250ngのsgRNAプラスミド(特に注釈のない限り)により、細胞を同時形質移入した。空のU6プロモータープラスミドと一緒に形質移入されるCas9プラスミドを全てのヒト細胞実験についての陰性対照として使用した。内在性遺伝子実験についての標的部位を野生型SpCas9により開裂可能なNGG部位の200bp内で選択した(
図16aおよび表2参照)。
【0089】
ゼブラフィッシュケアおよび注射
ゼブラフィッシュケアおよび使用は、Massachusetts General Hospital Subcommittee on Research Animal Careにより承認された。Cas9 mRNAは、既に記載のとおりmMESSAGE mMACHINE T7 ULTRA Kit(Life Technologies)を使用してPmeI消化JDS246(野生型SpCas9)またはMSP469(VQRバリアント)により転写させた
21。本試験の全てのsgRNAは、クローニング非依存的sgRNA生成法に従って調製した
24。sgRNAは、MEGAscript SP6 Transcription Kit(Life Technologies)により転写させ、RNA Clean&Concentrator−5(Zymo Research)により精製し、RNアーゼ不含水により溶出させた。
【0090】
sgRNAおよびCas9コードmRNAを一細胞期のゼブラフィッシュ胚中に同時注射した。それぞれの胚に、30ng/μLのgRNAおよび300ng/μLのCas9 mRNAを含有する約2〜4.5nLの溶液を注射した。翌日、注射された胚を立体鏡下で正常な形態発生について精査し、ゲノムDNAを5〜9つの胚から抽出した。
【0091】
ヒト細胞EGFP崩壊アッセイ
EGFP崩壊実験を既に記載のとおり実施した
16。EGFP発現について、形質移入された細胞を形質移入の約52時間後にFortessaフローサイトメーター(BD Biosciences)を使用して分析した。バックグラウンドEGFP損失を全ての実験について約2.5%においてゲーティングした(赤色破線としてグラフにより表示)。
【0092】
ヌクレアーゼ誘導突然変異率を定量するためのT7E1アッセイ、標的化ディープシーケンシング、およびGUIDE−seq
T7E1アッセイは、ヒト細胞
15およびゼブラフィッシュ
21について既に記載のとおり実施した。U2OS.EGFPヒト細胞について、Agencourt DNAdvance Genomic DNA Isolation Kit(Beckman Coulter Genomics)を使用してゲノムDNAを形質移入細胞から形質移入の約72時間後に抽出した。表1に列記されるプライマーを使用してゼブラフィッシュまたはヒト細胞ゲノムDNAからの標的遺伝子座を増幅した。ほぼ200ngの精製PCR産物を変性し、アニールし、T7E1(New England BioLabs)により消化した。突然変異誘発頻度は、ヒト細胞
15およびゼブラフィッシュ
21について既に記載のとおりQiaxcelキャピラリー電気泳動装置(QIagen)を使用して定量した。
【0093】
標的化ディープシーケンシングについて、表1に列記されるプライマーを用いるPhusion Hot−start Flexを使用して、既に特徴付けされたオンおよびオフターゲット部位(Tsai et al.,Nat Biotechnol 33,187−197(2015);Fu et al.,Nat Biotechnol 31,822−826(2013;Fu et al.,Nat Biotechnol 32,279−284(2014))を増幅した。ゲノム遺伝子座は、対照条件(空のsgRNA)、野生型、およびD1135E SpCas9について増幅した。Agencourt Ampure XPクリーンアップステップ(Beckman Coulter Genomics)を実施してから、ライブラリー調製のためにそれぞれの条件から約500ngのDNAをプールした。KAPA HTPライブラリー調製キット(KAPA BioSystems)を使用して二重インデックス化Tru−Seq Illuminaディープシーケンシングライブラリーを生成した。Dana−Farber Cancer Institute Molecular Biology Coreにより、Illumina MiSeq Sequencer上で150bpペアドエンドシーケンシングが実施された。標的化ディープシーケンシングデータの突然変異分析は、既に記載のとおり実施した(Tsai et al.,Nat Biotechnol 32,569−576(2014))。簡潔に述べると、bwa(Li et al.,Bioinformatics 25,1754−1760(2009))を使用してIllumina MiSeqペアドエンドリードデータをヒトゲノム参照GRChr37にマッピングした。高品質リード(品質スコア>=30)を標的またはオフターゲット部位に重複するインデル突然変異について評価した。1bpインデル突然変異は、それらが予測切断点の1bp内で生じない限り、分析から除外した。D1135Eを野生型SpCas9に対して比較するオンおよびオフターゲット部位における活性の変化は、両方の条件からのインデル頻度を比較することにより計算した(バックグラウンド対照アンプリコンインデルレベルを超える率について)。
【0094】
GUIDE−seq実験は、既に記載のとおり実施した(Tsai et al.,Nat Biotechnol 33,187−197(2015))。簡潔に述べると、リン酸化ホスホロチオエート修飾二本鎖オリゴデオキシヌクレオチド(dsODN)を上記のとおりCas9およびsgRNA発現プラスミドとともにCas9ヌクレアーゼとともにU2OS細胞中に形質移入した。dsODN特異的増幅、ハイスループットシーケンシング、およびマッピングを実施してDSB活性を含有するゲノム間隔を同定した。野生型対D1135E実験のため、オフターゲットリードカウントをオンターゲットリードカウントに正規化して、試料間のシーケンシング深度の差を補正した。次いで、野生型およびD1135E SpCas9についての正規化比を比較してオフターゲット部位における活性の変化倍率を計算した。GUIDE−seqについての野生型およびD1135E試料が、設定標的部位における類似のオリゴタグインテグレーション率を有するか否かを決定するため、表1に列記されるプライマーを使用して100ngのゲノムDNA(上記のとおり単離)からPhusion Hot−Start Flexにより設定標的遺伝子座を増幅することにより制限断片長多型(RFLP)アッセイを実施した。ほぼ150ngのPCR産物を20UのNdeI(New England BioLabs)により37℃において3時間消化してから、Agencourt Ampure XPキットを使用してクリーンアップした。Qiaxcelキャピラリー電気泳動装置(QIagen)を使用してRFLP結果を定量してオリゴタグインテグレーション率を推定した。T7E1アッセイを上記のとおり同様の目的のために実施した。
【0095】
【数1】
【0096】
【数2】
【0097】
【数3】
【0098】
【数4】
【0099】
【数5】
【0100】
実施例1
標的化範囲の制限に対処する1つの潜在的な解決策は、新規PAM特異性を有するCas9バリアントを遺伝子操作することである。PAM特異性を変更する従来の試行は、塩基特異的SpCas9−PAM相互作用についての構造情報を利用し、2番目および3番目のPAM位置におけるグアニンヌクレオチドに接触するアルギニン残基(R1333およびR1335)をそれぞれ突然変異させた(Anders et al.,Nature 513,569−573(2014))。両方のアルギニンのグルタミンによる置換(側鎖がアデニンと相互作用すると予測され得るもの)は、インビトロで予測NAA PAMを保有する標的を開裂し得るSpCas9バリアントを生じさせ得なかった(Anders et al.,Nature 513,569−573(2014))。ヌクレアーゼ誘導インデルが蛍光の損失をもたらすヒト細胞ベースU2OS EGFPレポーター遺伝子崩壊アッセイ(Reyon et al.,Nat Biotechnol 30,460−465(2012);Fu et al.,Nat Biotechnol 31,822−826(2013))を使用して、本発明者らは、R1333Q/R1335Q SpCas9バリアントがNAA PAMを有する標的部位を効率的に開裂し得ないことを確認した(
図1a)。さらに、本発明者らは、単一のR1333QおよびR1335Q SpCas9バリアントが、それぞれ、それらの予測NAGおよびNGA部位をそれぞれ有する標的部位を効率的に開裂し得ないことを見出した(
図1a)。したがって、本発明者らは、PAM特異性の再遺伝子操作は、R1333およびR1335以外の位置における追加の突然変異を要求し得ることを結論付けた。例えば、入手可能な構造情報は、K1107およびS1136が、PAM中の2番目および3番目の塩基への直接および間接的な副溝の接触を作ることを示す(Anders et al.,Nature 513,569−573(2014))。したがって、これらの位置におけるまたはその付近の追加の変更は、PAM特異性を変更することを必要とし得ることが妥当である。
【0101】
PAM特異性の改変に重要であり得る追加の位置を同定するため、本発明者らは、既に使用されている細菌選択系を、ホーミングエンドヌクレアーゼの特性を試験するように適合させた(以下、陽性選択と称する)(Chen&Zhao,Nucleic Acids Res 33,e154(2005);Doyon et al.,J Am Chem Soc 128,2477−2484(2006))。本発明者らのこの系の適合において、誘導性毒性遺伝子をコードする陽性選択プラスミドのCas9媒介開裂により、線形化プラスミドの後続の分解および損失に起因して細胞生存が可能となる(
図1bおよび
図12a)。SpCas9が陽性選択系において機能し得ることを確立した後、本発明者らは、野生型およびR1335Qバリアントの両方を、NGA PAMを有する標的部位を保有する選択プラスミドを開裂するそれらの能力について試験し、予測されるとおり生存を観察し得なかった(
図12a)。機能獲得突然変異についてスクリーニングするため、本発明者らは、1キロベース当たり5.2個の突然変異の平均率でランダムに突然変異したPAM相互作用ドメイン(アミノ酸位置1097〜1368)を担持する野生型およびR1335Q SpCas9ライブラリーを生成した(
図12bおよび方法)。NGA PAMを有する標的部位を含有する陽性選択プラスミドを有する細菌中にこれらのライブラリーを導入し、選択培地上でプレーティングした。R1335Qベースライブラリーからの生存クローンの配列により、既存のR1335Q突然変異に加わった最大頻度の置換は、D1135V/Y/N/EおよびT1337Rであることが明らかになった(表3)。本発明者らは、野生型SpCas9ベースライブラリー選択についてより少ない生存物を得たが、それらのクローンの配列もD1135V/Y/NおよびR1335Q突然変異を含んだ。次に、本発明者らは、ヒト細胞ベースEGFP崩壊アッセイを使用してD1135V/Y/N/E、R1335Q、およびT1337R突然変異の全ての考えられる単一、二重および三重の組合せを担持するSpCas9をアセンブルおよび試験した。この分析は、3つ全ての位置における置換を有するSpCas9バリアントが、NGA PAMに対して最大活性を示すが、NGG PAMに対して最小活性も示すことを示した(
図1c)。本発明者らは、2つのSpCas9バリアント、D1135V/R1335Q/T1337RおよびD1135E/R1335Q/T1337R(以下、それぞれVQRおよびEQR SpCas9バリアントと称する)を選択した。なぜなら、それらは、さらなる特徴付けのためのNGAおよびNGG PAM間の最大の差(
図1c)を有したためである。
【0102】
本発明者らの新規SpCas9バリアントの全体PAM特異性プロファイルを評価するため、本発明者らは、細菌ベース陰性選択系を使用した(
図1dおよび
図13a)。従来の研究は、類似タイプの選択系を使用してCas9ヌクレアーゼの開裂部位優先性を同定した(Jiang et al.,Nat Biotechnol 31,233−239(2013);Esvelt et al.,Nat Methods 10,1116−1121(2013))。このアッセイの本発明者らの変法(本発明者らは、部位枯渇アッセイと称する)では、プロトスペーサーに隣接して配置されるランダム化6bp配列を担持するプラスミドのライブラリーを大腸菌(E.coli)中のCas9/sgRNA複合体による開裂について試験する(
図13b)。Cas9/sgRNA複合体による開裂に耐性であるプロトスペーサー隣接配列を有するプラスミドにより、抗生物質耐性遺伝子の存在に起因して細胞生存が可能となる一方、開裂性配列を担持するプラスミドは、分解され、したがって、ライブラリーから枯渇する(
図13b)。約100,000個の標的化可能でない配列のハイスループットシーケンシングにより、任意の所与のPAMについての選択後PAM枯渇値(PPDV)を計算することができた。PAM(またはPAMの群)のPPDVは、選択後集団中のそのPAMの頻度を選択前ライブラリー中のその頻度により除したものと定義される。この定量値は、そのPAMに対するCas9活性の推定値を提供する。2つのランダム化PAMライブラリー(それぞれ異なるプロトスペーサーを有する)に対して触媒的に不活性なCas9(dCas9)について得られたプロファイルにより、任意の所与のPAMまたはPAMの群についてのPPDVの統計的に有意な変化を表すものを定義することが可能となった(
図13c)。次いで、本発明者らは、2つのランダム化PAMライブラリーについて得られた野生型SpCas9についてのPPDVが、その既に記載された標的化可能なPAMのプロファイル(Jiang et al.,Nat Biotechnol 31,233−239(2013))(
図1e)を再現することを実証することにより本発明者らの部位枯渇アッセイをバリデートした。
【0103】
部位枯渇アッセイを使用して、本発明者らは、2つのランダム化PAMライブラリーを使用してVQRおよびEQR SpCas9バリアントについてのPAM特異性プロファイルを得た。VQRバリアントは、NGANおよびNGCG PAMを担持する部位を強力に枯渇させ、NGGG、NGTG、およびNAAG PAMを担持する部位をより弱く枯渇させた(
図1f)。対照的に、EQRバリアントは、NGAG PAMを強力に、NGAT、NGAA、およびNGCG PAMをより弱く枯渇させ(
図1f)、それは、VQRバリアントに対して潜在的により制限される標的化範囲を実証した。部位枯渇アッセイにより同定されたPAMがヒト細胞中でも認識することができるか否かを試験するため、本発明者らは、EGFP崩壊アッセイを使用して標的部位に対するVQRおよびEQR SpCas9バリアントによる開裂を評価した。VQRバリアントは、NGAN PAMを担持するEGFPにおける部位をロバストに開裂し(相対効率は、NGAG>NGAT=NGAA>NGACである)、およびさらにNGCG、NGGG、およびNGTG PAMを担持する部位を一般により低い効率で開裂した(
図1g)。EQRバリアントは、ヒト細胞において他のNGAN PAMよりもNGAGおよびNGNG PAMについてのその優先性も再現し、ここでも全てVQRバリアントよりも低い活性であった(
図1g)。まとめると、ヒト細胞におけるこれらの結果は、細菌部位枯渇アッセイについて観察されたものを強力に反映し(
図14)、細菌アッセイにおける0.2のPPDV(5倍枯渇を表す)が、ヒト細胞における活性についての妥当な予測閾値を提供することを示唆した(
図14)。
【0104】
次に、本発明者らは、NGC PAMを認識し得るSpCas9バリアントを同定する試行により本発明者らの遺伝子操作方針の一般化可能性を拡張することを求めた。本発明者らは、最初に、シトシンと相互作用することが予測することができるR1335のアミノ酸置換(D、E、S、またはT)を担持するCas9突然変異体を設計し、陽性選択系を使用してNGC PAM部位に対する活性を見出さなかった。次いで、本発明者らは、それらの単置換SpCas9バリアントのそれぞれのPAM相互作用ドメインをランダムに突然変異させたが、依然として陽性選択において生存コロニーを得ることができなかった。T1337R突然変異は、本発明者らのVQRおよびEQR SpCas9バリアントの活性を増加させたため(
図1c)、本発明者らは、この突然変異と、A、D、E、S、T、またはVのR1335置換と組み合わせ、ここでもそれらのPAM相互作用ドメインをランダムに突然変異させた。これら6つの突然変異ライブラリーの2つ(既存のR1335E/T1337RおよびR1335T/T1337R置換を担持する)を使用する選択により、種々の追加の突然変異を保有する生存コロニーが生じた(表3)。細菌およびヒト細胞ベースアッセイの両方を使用する種々の選択クローンの特徴付けは、特に4つの位置における置換(D1135V、G1218R、R1335E、およびT1337R)が、NGC PAMの開裂に重要であると考えられることを示唆した。EGFP崩壊アッセイを使用するこれらの突然変異の全ての潜在的な単一、二重、三重、および四重の組合せのアセンブリおよび試験は、四重VRERバリアントがNGCG PAMに対する最大活性およびNGGG PAMに対する最小活性を示すことを確立した(
図1h)。部位枯渇アッセイを使用するVRERバリアントの分析により、それは、NGCG PAMに高度に特異的であることが明らかになった(
図1i)。この結果と一致して、VRERバリアントを用いてヒト細胞において実施されたEGFP崩壊アッセイにより、NGCG PAMを有する部位の効率的な開裂、NGCA、NGCC、およびNGCT PAMを有する部位の大幅に減少した不一致の開裂、ならびにNGAG、NGTG、およびNGGG PAMを有する部位に対する本質的な無活性が明らかになった(
図1j)。
【0105】
本発明者らのVQRおよびVRER SpCas9バリアントが、野生型SpCas9により現在、改変可能でない部位を標的化し得ることを直接実証するため、本発明者らは、ゼブラフィッシュ胚およびヒト細胞中の内在性遺伝子に対するそれらの活性を試験した。単細胞ゼブラフィッシュ胚において、本発明者らは、VQRバリアントが、NGAG PAMを担持する内在性遺伝子部位を20〜43%の平均突然変異誘発頻度で効率的に改変し得ること(
図2a)、およびインデルが予測開裂部位において生じることを見出した(
図15)。ヒト細胞において、本発明者らは、VQRバリアントが、NGAG、NGAT、およびNGAA PAMを保有する4つの異なる内在性遺伝子にわたる16個の部位をロバストに改変することを見出した(6〜53%の範囲、平均33%;
図2bおよび
図16a)。重要なことに、本発明者らは、野生型SpCas9が、ゼブラフィッシュおよびヒト細胞中のNGAGおよびNGAT PAMを有する同一部位のほとんどを効率的に変更し得ないことを確認したが(
図16b)、NGG PAMを担持する隣接部位を効率的に改変し得た(
図16b)。同様に、3つの内在性ヒト遺伝子にわたるNGCG PAMを有する9つの部位におけるVRERバリアント活性を試験した場合、本発明者らはまた、ロバストな平均崩壊頻度を観察した(5〜36%の範囲、平均21%;
図2d)。本発明者らの部位枯渇データ(
図1eおよび1f)と一致して、VQRバリアントは、VRERバリアントについて観察されたものと同様にNGCG PAM部位の効率を変更した一方、野生型SpCas9は変更し得なかった(
図2d)。参照ヒトゲノム配列のコンピュータ分析は、本発明者らのVQRおよびVRER SpCas9バリアントの追加が、野生型SpCas9単独について既に考えられたものと比較して潜在的な標的部位の範囲を2倍にすることを示す(
図2e)。まとめると、これらの結果は、本発明者らの遺伝子操作SpCas9バリアントが、ゼブラフィッシュ胚およびヒト細胞中の従来アクセス不可能な内在性部位を改変し得ることによりSpCas9の標的化範囲を広げることを実証する。
【0106】
本発明者らのVQRおよびVRER SpCas9ヌクレアーゼのゲノムワイド特異性を決定するため、本発明者らは、近年記載されたGUIDE−seq(シーケンシングによる二本鎖分解のゲノムワイドな偏りのない識別)法
10を使用してヒト細胞におけるそれらのSpCas9バリアントのオフターゲット開裂イベントをプロファイリングした。本発明者らは、設定オンターゲット部位における高い改変効率を誘導し得ること本発明者らが示した合計13個の異なるsgRNA(
図2bおよび2dから、それぞれVQRについて8つ、およびVRERについて5つ)を使用してVQRおよびVRER SpCas9バリアントのゲノムワイド活性をプロファイリングした。これらのGUIDE−seq実験について、多数の重要な観察が見られた:ヒト細胞中で本発明者らのSpCas9バリアントにより誘導されたオフターゲットDSBの数は、野生型SpCas9について既に観察されたものと同等である(またはVRERバリアントの場合、おそらくよりいっそう良好である)(
図2f)。本発明者らは、VRERについて観察された高いゲノムワイド特異性が、NGCG PAMについてのその制限された特異性、およびおそらくヒトゲノム中のNGCG PAMを有する部位の相対枯渇の両方から生じ得たことを留意する(
図2e)
21。さらに、観察されたオフターゲット部位は、一般に、1塩基だけ3’に「シフトした」PAM(
図1fおよび1iからのPAMを
図17の部位のものと比較する)についていくらかの寛容を含む、本発明者らの部位枯渇実験により予測される予測PAM配列を有する。最後に、本発明者らのVQRおよびVRER SpCas9バリアントについてのオフターゲット部位中に見出されたミスマッチの位置および数(
図17)は、それらの分布において、非反復配列に標的化されるsgRNAについて野生型SpCas9について本発明者らが既に観察したものと類似する
10。
【0107】
従来の研究は、SpCas9による不完全なPAM認識が、ヒト細胞中の非カノニカルNAG、NGA、および他のPAMを含有する不所望な部位の認識をもたらし得ることを示している(Hsu et al.,Nat Biotechnol 31,827−832(2013);Tsai et al.,Nat Biotechnol 33,187−197(2015);Jiang et al.,Nat Biotechnol 31,233−239(2013);Mali et al.,Nat Biotechnol 31,833−838(2013);Zhang et al.,Sci Rep 4,5405(2014))。したがって、本発明者らは、PAM相互作用を媒介する残基におけるまたはその付近の突然変異が、SpCas9PAM特異性を改善し得るか否かの探索に関心を向けた。VQRバリアントの遺伝子操作の間、本発明者らは、D1135E SpCas9突然変異体が、野生型SpCas9と比較してカノニカルNGG PAMおよび非カノニカルNGA PAM間を良好に区別することが考えられることに留意した(
図1c)。この観察を考慮して、本発明者らは、本発明者らの部位枯渇アッセイを使用してD1135EバリアントのPAM認識プロファイルを包括的に評価した。この実験により、野生型SpCas9に対してD1135E SpCas9について非カノニカルNAG、NGA、およびNNGG PAMの枯渇の減少が明らかになった(
図3a)。興味深いことに、この効果は、本発明者らが使用した2つのプロトスペーサーの一方について、より傑出しており、それは、非カノニカルPAM認識に対するD1135E置換の影響がある程度プロトスペーサー依存的に変動し得ることを示唆した。重要なことに、本発明者らは、いかなる新たな非カノニカルPAM特異性の出現も観察しなかった。
【0108】
次に、本発明者らは、D1135E SpCas9の改善されたPAM特異性がヒト細胞中でも観察することができるか否かを試験した。非カノニカルNAGまたはNGA PAMを有する8つの標的部位に対する野生型およびD1135E SpCas9の直接比較において、本発明者らは、それらの部位が、EGFP崩壊アッセイにおいて野生型SpCas9よりもD1135Eにより一貫して効率的に開裂されないことを観察した(
図3b、1.94の活性の平均減少倍率)。重要なことに、野生型およびD1135E SpCas9は、両方とも4つのEGFPレポーター遺伝子部位およびカノニカルNGG PAMを有する6つの内在性ヒト遺伝子部位に対する同等の活性を示し(それぞれ
図3bおよび3c)、それは、D1135EバリアントがNGG PAMを有するオンターゲット部位の開裂にそれほど影響しないことを実証した(10個全ての部位にわたる1.04の活性の平均減少倍率)。本発明者らが、ヒト細胞中に形質移入されたCas9コードプラスミドの濃度を減少させたタイトレーション実験により、野生型およびD1135E SpCas9の活性には、それらを同一部位に標的化した場合に実質的な差異がないことが明らかになり(
図3d)、それは、D1135Eバリアントについて観察された増加した特異性が、単にタンパク質の不安定化の結果でないことを意味した。
【0109】
D1135Eの導入がSpCas9のオフターゲット開裂効果を低減させ得るか否かをより直接的に評価するため、本発明者らは、ディープシーケンシングを使用して3つの異なるsgRNAの25個の既に公知のオフターゲット部位(Hsu et al.,Nat Biotechnol 31,827−832(2013);Tsai et al.,Nat Biotechnol 33,187−197(2015);Fu et al.,Nat Biotechnol 31,822−826(2013))に対して野生型およびD1135E SpCas9により誘導された突然変異率を比較した。これらの25個の部位は、スペーサー配列ならびにカノニカルNGGおよび非カノニカルPAM中の両方の種々のミスマッチを有するオフターゲット部位を含んだ(
図3e)。これらのディープシーケンシング実験の結果により、D1135Eバリアントが、3つのオンターゲット部位において観察された突然変異頻度に対してバックグラウンドインデル率を超える活性を有する22個のオフターゲット部位の19個における低減した突然変異頻度を示すことが明らかになった(
図3eおよび3f)。興味深いことに、これらの低減したオフターゲット突然変異頻度は、カノニカルPAMを有する多くの部位において観察され、それは、D1135Eによる特異性の獲得が、非カノニカルPAMを有する部位にのみ制限されないことを示唆した。D1135Eに関連する特異性の改善をゲノムワイドスケールで評価するため、本発明者らは、3つの異なるsgRNA(そのうちの2つは、カノニカルおよび非カノニカルPAMを有するオフターゲット部位を有することが既に公知であった(Hsu et al.,Nat Biotechnol 31,827−832(2013);Tsai et al.,Nat Biotechnol 33,187−197(2015);Fu et al.,Nat Biotechnol 31,822−826(2013))とともに野生型およびD1135E SpCas9を使用するGUIDE−seq実験を実施した。本発明者らは、野生型SpCas9と比較してD1135E SpCas9バリアントを使用した場合、ゲノムワイド特異性の一般化した改善を観察した(
図3g)。本発明者らが試験した3つ全てのsgRNAについて、カノニカルまたは非カノニカルPAMを有するミスマッチスペーサーを含有するオフターゲット部位において特異性のそれらの改善が観察された(
図18)。重要なことに、これらのGUIDE−seq実験により、D1135E突然変異の導入が、SpCas9により誘導されるオフターゲット効果の数を増加させないことが実証された。まとめると、これらの結果は、D1135E置換がSpCas9の全体特異性を増加させ得ることを示す。
【0110】
上記の実験の全てはSpCas9を用いて実施したが、新規PAM特異性を有するCas9の特徴付けおよび遺伝子操作に魅力的な候補となり得る他の細菌からの多くのCas9オルソログが存在する(Fonfara et al.,Nucleic Acids Res 42,2577−2590(2014);Ran et al.,Nature 520,186−191(2015))。この実行可能性を探索するため、本発明者らは、2つのより小さいサイズのオルソログ、CRISPR1遺伝子座からのストレプトコッカス・サーモフィラス(Streptococcus thermophilus)Cas9(St1Cas9)(Deveau et al.,J Bacteriol 190,1390−1400(2008);Horvath et al.,J Bacteriol 190,1401−1412(2008))および黄色ブドウ球菌(Staphyloccocus aureus)(SaCas9)(Hsu et al.,Cell 157,1262−1278(2014);Ran et al.,Nature 520,186−191(2015))が、本発明者らの細菌選択アッセイにおいても機能し得るか否かを決定した。St1Cas9のPAMは、NNAGAA(配列番号3)として既に特徴付けされている一方(Esvelt et al.,Nat Methods 10,1116−1121(2013);Fonfara et al.,Nucleic Acids Res 42,2577−2590(2014);Deveau et al.,J Bacteriol 190,1390−1400(2008);Horvath et al.,J Bacteriol 190,1401−1412(2008))、既に記載されているアプローチ(Fonfara et al.,Nucleic Acids Res 42,2577−2590(2014))を使用してSaCas9 PAMを生物情報学的に導出する本発明者らの試行は、コンセンサス配列を生じさせ得なかった(データ示さず)。したがって、本発明者らは、本発明者らの部位枯渇アッセイを使用し、SaCas9についておよび陽性対照としてSt1Cas9についてのPAMを決定した。これらの実験は、2つの異なるプロトスペーサーおよびそれぞれプロトスペーサーについての2つの異なる相補性長さを有するsgRNAを使用して実施し、それぞれのCas9について4つの選択をもたらした。St1Cas9について、本発明者らは、既に記載されている6つのPAM(Esvelt et al.,Nat Methods 10,1116−1121(2013);Fonfara et al.,Nucleic Acids Res 42,2577−2590(2014);Horvath et al.,J Bacteriol 190,1401−1412(2008))に加えて2つの新規PAMを同定した(
図4aならびに
図19cおよび19d、SaCas9 PAM特異性の近年の定義(Ran et al.,Nature 520,186−191(2015))と一致)。SaCas9について、主に、1つのプロトスペーサーについて観察される制限されたPAM優先性に起因する4つの選択間のPPDV変動性が存在した。結果として、3つのPAMのみが4つ全ての実験において5倍超で枯渇した:NNGGGT(配列番号4)、NNGAAT(配列番号6)、NNGAGT(配列番号5)(
図4b)。しかしながら、本発明者らは、第2のプロトスペーサーライブラリーを有する多くのより標的化可能なPAMを同定し、それは、SaCas9が多数の追加のPAMを認識し得ることを意味した(
図18cおよび18d)。本発明者らの部位枯渇実験において同定されたSt1Cas9についてのPAM(NNAGAA(配列番号3)およびSaCas9についてのNNGAGT(配列番号5))を使用して、本発明者らは、St1Cas9およびSaCas9の両方が細菌陽性選択系において効率的に機能し得ることを見出し(
図4c)、それは、それらのPAM特異性を突然変異誘発および選択により改変し得ることを示唆する。
【0111】
全てのCas9オルソログがそれらの天然環境外で効率的に機能するわけではないため(Esvelt et al.,Nat Methods 10,1116−1121(2013))、本発明者らは、St1Cas9およびSaCas9が、ヒト細胞中の標的部位をロバストに開裂し得るか否かを試験した。St1Cas9は、ヒト細胞中でヌクレアーゼとして機能するが、数個の部位に対してのみ機能することが既に示されている(Esvelt et al.,2013;Cong et al.,Science 339,819−823(2013))。本発明者らは、変動長さの相補性領域を有するsgRNAを使用してNNAGAA(配列番号3)PAMを保有する部位に対するSt1Cas9活性を評価し、5つの標的部位の3つにおいて高い活性を見出した(
図4d)。SaCas9について、本発明者らは、NNGGGT(配列番号4)またはNNGAGT(配列番号5)PAMを保有する8つの部位において効率的な活性を観察した(
図4e)。St1Cas9およびSaCas9の両方について、活性およびスペーサー相補性の長さ間の明らかな相関は観察されなかった(
図19e)。次に、本発明者らは、St1Cas9およびSaCas9がヒト細胞中で内在性遺伝子座を効率的に改変し得るか否かを決定した。St1Cas9について、4つの遺伝子にわたる11個の部位のうちの7つが、T7E1アッセイにより判断されるとおり効率的に崩壊された一方(1〜25%、平均13%;
図4f)、SaCas9は、4つの遺伝子にわたる16個の試験部位においていくぶんよりロバストな活性を示した(1%〜37%、平均19%;
図4g)。ここでも、St1Cas9およびSaCas9についてのsgRNAスペーサー長さを考慮した場合に区別の傾向は観察されなかった(
図19f)。まとめると、本発明者らの結果は、St1Cas9およびSaCas9が、本発明者らの細菌ベース選択およびヒト細胞の両方においてロバストに機能することを示し、それらを、新規PAM特異性を有する追加のSpCas9バリアントの遺伝子操作のための魅力的な候補とする。
【0112】
【表8】
【0113】
【表9】
【0114】
【表10】
【0115】
【表11】
【0116】
【表12】
【0117】
【表13】
【0118】
【表14】
【0119】
実施例2.黄色ブドウ球菌(Staphylococcus aureus)Cas9のPAM特異性の遺伝子操作
本発明者らは、化膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)のいずれの残基がPAM認識に重要であるかに知得したため(R1333およびR1335)、本発明者らは、Cas9オルソログのアラインメントを生成して黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9)のPAM相互作用ドメイン(PIドメイン)中の相同性残基を探索した(
図6参照)。本発明者らは、SaCas9のPAMがNNGRRT(配列番号46)(Nは、任意のヌクレオチドであり、Rは、AまたはGである)であることを既に示した。PAMの3番目の位置におけるGについての優先性が本発明者らのデータに基づき最も厳密な要求であると考えられるため、本発明者らは、正荷電残基、例えば、リジン(K)またはアルギニン(R)がその相互作用を媒介し得ることを仮定した。
図6に示されるとおり、SpCas9のR1333およびR1335との相同性領域中のSaCas9中の多数の候補残基、例として、K1101、R1012、R1015、K1018、およびK1023が存在する。
【0120】
本発明者らは、これら5つの位置におけるアラニン(A)およびグルタミン(Q)置換を生成し、突然変異クローンが依然としてカノニカルNNGRRT PAM(配列番号46)を含有する部位を開裂し得るか否か、または場合により、従来、標的化可能でないNNARRT(配列番号43)のPAMを開裂し得るか否かを決定した(
図7)。本発明者らは、選択条件下でプレーティングした場合の細菌コロニーの生存によりCas9の活性を可視化することができる本発明者らの細菌アッセイ(先行特許出願に記載)を利用した。Cas9の相対活性は、非選択培地に対する選択培地上で増殖する細菌コロニーの比を計算することにより定量することができる。
図7において、本発明者らは、R1015AおよびR1015Q突然変異のみが、カノニカルNNGAGT(配列番号5)PAMを認識するSaCas9の能力に影響する一方、ピーク、NNARRT(配列番号43)PAM(NNAAGT(配列番号41)またはNNAGGT(配列番号42))を標的化し得る突然変異は見られないことを示す。これらの結果は、R1015がSaCas9によるPAM認識における役割を担うことを示唆した。
【0121】
次いで、本発明者らは、野生型SaCas9、またはR1015Qバリアントのいずれかを選択し、ランダムに突然変異させ、NNAAGT(配列番号41)またはNNAGGT(配列番号42)PAMを含有する部位に対する変更PAM特異性クローンについて選択した(SpCas9について既に記載)。本発明者らは、
図8(および表6)に示されるアミノ酸配列を有する、それらのPAMを標的化し得る多数の突然変異クローンを同定し、再スクリーニングし、シーケンシングした。これらの配列のまとめにおいて、多数の変化がSaCas9の変更に極めて重要である一方(R1015Q、R1015H、E782K)、多くの他の突然変異も寄与し得ると考えられる(N968K、E735K、K929R、A1021T、K1044N)。
【0122】
NNARRT(配列番号43)に対するSaCas9のPAM特異性を変更するために必須の位置および突然変異を同定した後、本発明者らは、単一、二重、および三重突然変異体組合せを作製することにより特異性変化に対する最も豊富な突然変異の寄与を評価した(表5)。本発明者らの陽性選択(既に記載)における種々のPAMに対するそれらの突然変異を試験した場合、本発明者らは、多数の突然変異がカノニカルNNGAGT(配列番号5)および非カノニカルNNAAGT(配列番号41)またはNNAGGT(配列番号42)PAMの両方に対する活性を可能とする一方、野生型SaCas9酵素が非カノニカルPAMに対する極めて低い活性を有することを観察した。具体的には、三重突然変異がPAMの3番目の位置における緩和した特異性を可能とすると考えられ(KKQ、KKH、GKQ、GKH−E782/N968/R1015位の突然変異に基づき命名した)、それは、カノニカルNNGRRT(配列番号46)に対するNNRRRT(配列番号45)のコンセンサスPAMモチーフをもたらす。PAM要求のこの緩和は、理論的には、SpCas9の標的化範囲を2倍にする。以下、バリアントは、782、968、および1015位におけるそれらのアイデンティティに基づき命名する。例えば、E782K/N968K/R1015Hは、SaCas9KKHバリアントと命名する。
【0123】
【表15】
【0124】
次に、本発明者らは、ヒト細胞EGFP崩壊アッセイ(既に記載)において三重突然変異体の2つを評価して遺伝子操作バリアントがヒト細胞環境中で非カノニカルPAMを標的化し得るか否かを決定した(
図9)。非カノニカルPAMを含有するEGFP遺伝子内の部位を標的化し得るバリアントは、EGFPコードフレームを崩壊させ、シグナルの損失をもたらす。この結果により、KKQおよびKKH突然変異体の両方がカノニカルNNGRRT(配列番号46)PAMに対して野生型SaCas9と類似する活性を保持するが、NNARRT(配列番号43)PAMに対してかなり高い活性を有することが明らかになった。
【0125】
全体として、本発明者らは、GからR(AまたはG)へのPAMの3番目の位置における野生型酵素の優先性を緩和することが考えられるSaCas9中の突然変異(KKQまたはKKHバリアント)を同定した。これは、NNGRRT(配列番号46)PAM制約からNNRRRT(配列番号45)PAMにSaCas9の標的化を効率的に緩和する。
【0126】
本発明者らは、ヒト細胞中でNNARRT(配列番号43)PAMを標的化し得るバリアントを良好に誘導したため、次に、本発明者らは、NNCRRT(配列番号47)またはNNTRRT(配列番号48)についての特異性を有するバリアントを遺伝子操作することができるか否かを追求した。これを行うため、本発明者らは、最初に、R1015をEに(PAMの3番目の位置におけるCを規定する場合)、およびLまたはMに(PAMの3番目の位置におけるTを規定する場合)突然変異させ、本発明者らの細菌陽性選択アッセイ(既に記載)においてそれらの予測PAMに対してそれらを試験した(
図10)。本発明者らは、野生型SaCas9がNNCAGT(配列番号511)PAMを含有する部位を非効率に開裂し得ること、R1015Eバリアントがその同一部位に対してわずかに良好な活性を有すること、ならびに野生型または他の指向突然変異のいずれも他のPAMに対する活性を与えないことを観察した(
図10)。これは、本発明者らがR1015Qについて観察したとおり、NNCRRT(配列番号47)およびNNTRRT(配列番号48)PAMを標的化し得るSaCas9バリアントを遺伝子操作するために他の突然変異が必要であることを示唆した。
【0127】
NNARRT(配列番号43)PAMに対するSaCas9進化バリアントのため、ER1015(H/Q)とともに782KおよびN968K突然変異が必要および必須であった。これらの突然変異がそれらの予測PAMに対するR1015(E/L/M)バリアントの活性を増加させるか否かを試験するため、本発明者らは、KKE、KKL、およびKKMバリアントを生成した。
図11に示されるとおり、KKE、KKL、およびKKMは全て、それらの予測PAMに対するロバストな活性を有した。
【0128】
本発明者らは、KKQ、KKH、KKE、KKL、またはKKMバリアントが、PAMの3番目の位置における任意のヌクレオチドに対する緩和した特異性を有するか否かに関しても関心があったため、NNNRRT PAMを含有する本発明者らの細菌陽性選択アッセイにおける多数の部位を調査した。
図11に示されるとおり、若干の例外はあるものの、それらのバリアントのほぼ全てが、NNNRRT PAMを含有する全ての試験部位を開裂し得る。これは、それらがNNNRRT部位を効率的に標的化し得るため、それらがPAMの3番目の位置における緩和した特異性を有することを示した。これは、数個のNNNRRT部位に対する極めて低い活性でNNGAGT(配列番号5)部位のみを効率的に標的化し得る野生型タンパク質(ENR)とは対照的である。まとめると、KKH(および
図11に示される他の類似の誘導体)バリアントは、細菌中でNNNRRT PAMを含有する部位を標的化し得、SaCas9の標的化範囲を効率的に4倍にする。
【0129】
したがって、KKHバリアント(および
図6の他のバリアントの一部)は、細菌中でNNNRRT PAMを標的化し得、SaCas9の標的化範囲を効率的に4倍にする。
【0130】
【表16】
【0131】
【表17】
【0132】
【表18】
【0133】
【表19】
【0134】
【表20】
【0135】
【表21】
【0136】
【表22】
【0137】
【表23】
【0138】
【表24】
【0139】
実施例3のための方法
以下の材料および方法を実施例3に使用した。
【0140】
プラスミドおよびオリゴヌクレオチド
オリゴヌクレオチドを表11に列記し、sgRNA標的部位を表12に列記し、本試験において使用されるプラスミドを表10に列記する。
【0141】
細菌Cas9/sgRNA発現プラスミドを使用し、それぞれ別個のT7プロモーター下で発現されるSaCas9のヒトコドン最適化バージョンおよびsgRNAの両方を発現させた。選択において使用される細菌発現プラスミドは、BPK2101(実施例1〜2参照)に由来した一方、部位枯渇アッセイにおいて使用されるものを改変して短縮リピート:アンチリピート配列を有するsgRNAを発現させた(下記参照)。これらの細菌発現プラスミド中の全てのsgRNAは、T7プロモーターからの適切な発現のためのスペーサー配列の5’末端における2つのグアニンを含んだ。
【0142】
SaCas9バリアントのライブラリーを生成するため、Mutazyme II(Agilent Technologies)を使用してSaCas9のアミノ酸M657〜G1053を約5.5個の突然変異/キロベースの頻度においてランダムに突然変異させた。野生型およびR1015Q SaCas9の両方を突然変異誘発のための出発テンプレートとして使用し、6×10
6個超のクローンの推定複雑度を有する2つのライブラリーをもたらした。
【0143】
陽性選択プラスミドは、XbaI/SphI消化p11−lacY−wtx1(Chen,Z.&Zhao,H.A highly sensitive selection method for directed evolution of homing endonucleases.Nucleic Acids Res 33,e154(2005))中に、標的部位をコードするオリゴヌクレオチド二本鎖をライゲートすることによりアセンブルした。部位枯渇実験のため、異なるスペーサー配列を含有する2つの別個のライブラリーを生成した。それぞれのライブラリーのため、スペーサー配列に隣接する8つのランダム化ヌクレオチド(PAMに代えて)を含有するオリゴヌクレオチドをボトム鎖プライマーと複合体化させ、クレノウ(−エキソ)を使用してフィルインした(表11参照)。得られた産物をEcoRIにより消化し、EcoRI/SphI消化p11−lacY−wtx1中にライゲートした。2つの部位枯渇ライブラリーの推定複雑度は、4×10
6個超のクローンであった。
【0144】
ヒト細胞実験のため、CAGプロモーターを含有するプラスミドからヒトコドン最適化野生型およびバリアントSaCas9を発現させた(表12)。BsmBI消化VVT1(実施例1〜2参照またはBPK2660(全長120ntのcrRNA:tracrRNA sgRNAまたは84ntの短縮リピート:アンチリピートバージョンをそれぞれ含有する)中に、スペーサー配列をコードするオリゴヌクレオチド二本鎖をライゲートすることにより、sgRNA発現プラスミド(U6プロモーターを含有する)を生成した。ヒト発現のために本試験において使用される全てのsgRNAは、U6プロモーターからの適切な発現を確保するためのスペーサーの5’末端における1つのグアニンを含み、既に記載のもの(Ran,F.A.et al.In vivo genome editing using Staphylococcus aureus Cas9.Nature 520,186−191(2015))と類似する短縮sgRNA(
図37A〜B)も使用した。
【0145】
Cas9オルソログ配列の生物情報学的分析
従来の研究(Fonfara,I.et al.Phylogeny of Cas9 determines functional exchangeability of dual−RNA and Cas9 among orthologous type II CRISPR−Cas systems.Nucleic Acids Res 42,2577−2590(2014);Ran,F.A.et al.In vivo genome editing using Staphylococcus aureus Cas9.Nature 520,186−191(2015);Anders,C.,Niewoehner,O.,Duerst,A.&Jinek,M.Structural basis of PAM−dependent target DNA recognition by the Cas9 endonuclease.Nature 513,569−573(2014))において実施されたアラインメントと同様に、ClustalW2(ebi.ac.uk/Tools/msa/clustalw2/)を使用してSpCas9およびSaCas9の両方と類似するCas9オルソログをアラインした。Geneiousバージョン8.1.6およびESPript(espript.ibcp.fr/ESPript/ESPript/)を使用して、得られた系統樹およびタンパク質アラインメントを可視化した。
【0146】
細菌ベース陽性選択アッセイ
細菌陽性選択アッセイは、既に記載のとおり実施した(実施例1〜2参照)。簡潔に述べると、陽性選択プラスミドを含有する大腸菌(E.coli)BW25141(λDE3)(Kleinstiver et al.,Nucleic Acids Res 38,2411−2427(2010))中に、Cas9/sgRNAプラスミドを形質転換した。非選択(クロラムフェニコール)および選択(クロラムフェニコール+10mMのアラビノース)条件上の両方で形質転換物をプレーティングした。生存率:(選択プレート上のコロニーの数/非選択プレート上のコロニーの数)×100を計算することにより、選択プラスミドのCas9開裂を推定した。代替PAMを認識し得るSaCas9バリアントについて選択するため、NNAAGT(配列番号41)、NNAGGT(配列番号42)、NNCAGT(配列番号511)、NNCGGT(配列番号512)、NNTAGT(配列番号513)、またはNNTGGT(配列番号514)PAMを有する陽性選択プラスミドを含有するコンピテント大腸菌(E.coli)BW25141(λDE3)中に、突然変異PIドメインを有する野生型およびR1015Qライブラリーを形質転換した。選択条件上でプレーティングすることにより、約1×10
5個のクローンをスクリーニングし、選択プラスミドを開裂することが想定されるSaCas9バリアントを含有する生存コロニーをミニプレップした(MGH DNA Core)。全てのバリアントを陽性選択アッセイにおいて個々に再スクリーニングし、約20%超の生存率を有するものをシーケンシングして代替PAMの認識に要求される突然変異を決定した。
【0147】
細菌ベース部位枯渇アッセイ
部位枯渇実験は、既に記載のとおり実施した(実施例1〜2参照)。簡潔に述べると、野生型、触媒的に不活性な(D10A/H557A)、またはKKHバリアントSaCas9/sgRNAプラスミドのいずれかを含有するコンピテント大腸菌(E.coli)BW25141(λDE3)中に、ランダム化PAMライブラリーをエレクトロポレートした。1×10
5個超のコロニーをクロラムフェニコール/カルベニシリンプレート上でプレーティングし、生存コロニー内に含有されるCas9標的化に耐性であるPAMを有する選択プラスミドをマキシプレップ(Qiagen)により単離した。表11に列記されるプライマーを使用して、スペーサー配列およびPAMを含有するプラスミドの領域をPCR増幅した。KAPA HTPライブラリー調製キット(KAPA BioSystems)を使用し、それぞれの部位枯渇条件からの約500ngの精製PCR産物を使用して二重インデックス化Tru−seq Illuminaシーケンシングライブラリーを生成してから、Dana−Farber Cancer Institute Molecular Biology CoreにおいてIllumina MiSeqハイスループットシーケンシングランした。部位枯渇実験からのデータを既に記載のとおり分析し(実施例1〜2参照)、但し、スクリプトを改変して8つのランダム化ヌクレオチドを分析した。任意の所与のPAMの選択後PAM枯渇値(PPDV):そのPAMの選択後頻度と、選択前ライブラリー頻度との比を計算することにより、PAMを認識するCas9の能力を決定した。触媒的に不活性なSaCas9を使用する対照実験を使用して0.794のPPDVが、インプットライブラリーに対する統計的に有意な枯渇を表すことを確立した。
【0148】
ヒト細胞培養および形質移入
本発明者らの協力者T.Cathomen氏(Freiburg)から入手したU2OS細胞、およびEGFP−PESTレポーター遺伝子の単一インテグレートコピーを保有するU2OS.EGFP細胞(Reyon,D.et al.FLASH assembly of TALENs for high−throughput genome editing.Nat Biotechnol 30,460−465(2012))を、10%のFBS、ペニシリン/ストレプトマイシン、および2mMのGlutaMAX(Life Technologies)を有するAdvancedDMEM培地(Life Technologies)培地中で37℃、5%のCO
2を用いて培養した。細胞系アイデンティティは、STRプロファイリング(ATCC)およびディープシーケンシングによりバリデートし、細胞をマイコプラズマ汚染について週2回試験した。U2OS.EGFP培養培地に、400μg/mLのG418をさらに補給した。Lonza 4D−nucleofectorのDN−100プログラムを製造業者の説明書に従って使用して、750ngのCas9プラスミドおよび250ngのsgRNAプラスミドにより、細胞を同時形質移入した。
【0149】
ヒト細胞EGFP崩壊アッセイ
EGFP崩壊実験は、既に記載のとおり実施した(Fu,Y.et al.High−frequency off−target mutagenesis induced by CRISPR−Cas nucleases in human cells.Nat Biotechnol 31,822−826(2013);Reyon,D.et al.FLASH assembly of TALENs for high−throughput genome editing.Nat Biotechnol 30,460−465(2012))。形質移入の約52時間後、Fortessaフローサイトメーター(BD Biosciences)を使用して形質移入U2OS.EGFP細胞中のEGFP蛍光を計測した。Cas9および空のU6プロモータープラスミドの陰性対照形質移入を使用して全ての実験について約2.5%のバックグラウンドEGFP損失を確立した(図中に赤色破線として表す)。
【0150】
T7E1アッセイ
T7E1アッセイは、既に記載のとおり実施して(Reyon,D.et al.FLASH assembly of TALENs for high−throughput genome editing.Nat Biotechnol 30,460−465(2012))ヒト細胞中の内在性遺伝子座におけるCas9誘導突然変異誘発を定量した。形質移入の約72時間後、Agencourt DNAdvance Genomic DNA Isolation Kit(Beckman Coulter Genomics)を使用してゲノムDNAを単離した。表11に列記されるプライマーを使用して約100ngのゲノムDNAから、標的遺伝子座をPCR増幅した。Agencourt Ampure XPクリーンアップステップ(Beckman Coulter Genomics)後、約200ngの精製PCR産物を変性し、ハイブリダイズしてからT7E1(New England Biolabs)により消化した。2回目のクリーンアップステップ後、Qiaxcelキャピラリー電気泳動装置(Qiagen)を使用して突然変異誘発頻度を定量した。
【0151】
GUIDE−seq実験
GUIDE−seq実験は、既に記載のとおり実施および分析した(Tsai,S.Q.et al.GUIDE−seq enables genome−wide profiling of off−target cleavage by CRISPR−Cas nucleases.Nat Biotechnol 33,187−197(2015))。簡潔に述べると、U2OS細胞を上記のとおり、Cas9およびsgRNAプラスミド、ならびにNdeI部位が埋め込まれた100pmolのリン酸化ホスホロチオエート修飾二本鎖オリゴデオキシヌクレオチド(dsODN)により形質移入した。制限断片長多型(RFLP)分析を実施してdsODNタグインテグレーション頻度の頻度を決定し(実施例1〜2参照:Tsai,S.Q.et al.GUIDE−seq enables genome−wide profiling of off−target cleavage by CRISPR−Cas nucleases.Nat Biotechnol 33,187−197(2015))、T7E1アッセイを実施してオンターゲットCas9突然変異誘発頻度を定量した。dsODNタグ特異的増幅およびライブラリー調製(Tsai,S.Q.et al.GUIDE−seq enables genome−wide profiling of off−target cleavage by CRISPR−Cas nucleases.Nat Biotechnol 33,187−197(2015))を実施してから、Illumina MiSeq Sequencerを使用してハイスループットシーケンシングを行った。潜在的なオフターゲット部位をマッピングした場合、オンターゲットスペーサー配列に対するアラインメントについてのカットオフを21ヌクレオチドスペーサーについて8ミスマッチに、22ヌクレオチドスペーサーについて9ミスマッチに、および23ヌクレオチドスペーサーについて10ミスマッチに設定した。潜在的なDNAまたはRNAバルジ(Lin,Y.et al.CRISPR/Cas9 systems have off−target activity with insertions or deletions between target DNA and guide RNA sequences.Nucleic Acids Res 42,7473−7485(2014))を有するオフターゲット部位をマニュアルアラインメントにより同定した。
【0152】
【表25】
【0153】
【表26】
【0154】
【表27】
【0155】
【表28】
【0156】
【表29】
【0157】
実施例3.黄色ブドウ球菌(Staphylococcus aureus)Cas9のPAM特異性の遺伝子操作
CRISPR−Cas9ヌクレアーゼによる部位特異的DNA開裂は、主に、RNA−DNA相互作用によりガイドされるが、プロトスペーサー隣接モチーフ(PAM)のCas9媒介認識も要求する。一般に使用される化膿性連鎖球菌(Streptococcus pyogenes)Cas9は、そのNGG PAM内の2つのヌクレオチドを規定するが、望ましい特性を有する他のCas9オルソログは、より長鎖のPAMを認識する。伸長PAM配列は、特異性の関連から潜在的に有利である一方、ゲノム編集用途のためのCas9オルソログの標的化範囲を制限し得る。このようなCas9オルソログにより標的化可能な配列の範囲を拡大する1つの考えられる方針は、PAM内のある位置についての緩和した特異性を有するバリアントを進化させることであり得る。ここで、本発明者らは、分子進化を使用して黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9)(ウイルス送達を要求する用途に有用なより小さいサイズのオルソログ)のNNGRRT(配列番号46)PAM特異性を改変した。本発明者らが同定した1つのバリアントは、KKH SaCas9と称され、NNNRRT PAMを有する内在性ヒト標的部位におけるロバストなゲノム編集活性を示す。重要なことに、GUIDE−seq法を使用して、本発明者らは、野生型およびKKH SaCas9の両方がヒト細胞中で同等数のオフターゲット効果を誘導することを示した。KKH SaCas9は、SaCas9の標的化範囲をほぼ2〜4倍だけ増加させ、それは、野生型ヌクレアーゼにより変更することができない配列の標的化を可能とした。より一般に、これらの結果は、Cas9オルソログの標的化範囲を拡大するためのPAM特異性緩和の実行可能性を実証する。本発明者らの分子進化方針は、PAMに接触する特異的残基の構造情報も先験的知識も要求せず、したがって、広範なCas9オルソログに適用可能であるはずである。
【0158】
結果
本発明者らは、構造情報を要求しない、緩和したPAM認識特異性を有するCas9バリアントを遺伝子操作するための偏りのない遺伝的アプローチを考案した。本発明者らは、本発明者らがそれらの試験を開始した時点で構造データが入手可能でないSaCas9を使用してこの方針を試験した。初期ステップにおいて、本発明者らは、構造的に十分に特徴付けされたSpCas9(Jiang et al.,Science 348,1477−1481(2015);Anders et al.,Nature 513,569−573(2014);Jinek et al.,Science(2014);Nishimasu et al.,Cell(2014))との配列比較によりSaCas9についてのPAM相互作用ドメインを保守的に推定することを求めた。SpCas9およびSaCas9は、一次配列レベルにおいてかなり異なるが(
図21a、
図29)、10個の追加のオルソログとのその両方のアラインメントにより、SaCas9についての予測PAM相互作用ドメインを保守的に定義することが可能となった(実施例3のための方法;
図29および30参照)。
【0159】
SaCas9 PAM中の3番目の位置におけるグアニンは最も厳密に規定された塩基であるため(Ran et al.,Nature 520,186−191(2015))、本発明者らは、予測PIドメインをランダムに突然変異させ、本発明者らの既に記載された細菌細胞ベース法(実施例1〜2参照)を使用し、3番目のPAM位置における3つの他の考えられるヌクレオチドのそれぞれ(すなわち、NN[A/C/T]RRT PAM(NNHRRT(配列番号44));
図31a)を有する部位を開裂し得る突然変異体について選択することを試行した。NNARRT(配列番号43)およびNNCRRT(配列番号47)PAMを含有する部位に対する選択からの生存バリアントの1つを除き全てが、R1015H突然変異を保有した一方、本発明者らは、NNTRRT(配列番号48)PAMについての選択からいかなるバリアントも得なかった。これらの結果は、R1015が、SpCas9 PAMの3番目の位置におけるグアニンの認識に関与し得ることを強力に示唆した。実際、本発明者らのアラインメントにおいて、SaCas9のR1015は、PAMの3番目の塩基位置の認識に既に関与する残基のSpCas9 R1335に近接することを見出した(
図30)((実施例1〜2参照;Anders,C.,Niewoehner,O.,Duerst,A.&Jinek,M.Structural basis of PAM−dependent target DNA recognition by the Cas9 endonuclease.Nature 513,569−573(2014))。これと一致して、本発明者らは、R1015のアラニンまたはグルタミンへの突然変異が、本発明者らの細菌選択系(
図31b)において試験した場合、NNGRRT(配列番号46)PAMを含有する標的部位に対するSaCas9活性をかなり減少させることを見出した(
図21b)。R1015に近接する他の正荷電残基のアラニンまたはグルタミン置換は、SaCas9活性に対する強力な効果を有さなかった(
図21b、
図30)。
【0160】
本発明者らの細菌ベース選択結果は、R1015H突然変異が、PAMの3番目の位置におけるSaCas9の特異性を少なくとも部分的に緩和し得ることも示唆した。しかしながら、本発明者らは、NNNRRT PAMの3番目の位置における任意のヌクレオチドを有する部位に対して試験した場合、R1015H単一突然変異体が本発明者らの既に記載されたヒト細胞ベースEGFP崩壊アッセイ(Fu et al.,Nat Biotechnol 31,822−826(2013);Reyon et al.,Nat Biotechnol 30,460−465(2012))において準最適活性を有することを見出した(
図21c)。これは、ヒト細胞中でR1015H突然変異体の活性を増加または最適化させるために追加の突然変異が要求され得ることを示唆したため、本発明者らは、R1015Q突然変異も保有するSaCas9の予測PIドメインを包含する領域をランダムに突然変異させた。次いで本発明者らは、本発明者らの細菌選択系を使用して3つの異なるNNHRRT(配列番号44)PAMのそれぞれを有する標的部位を開裂し得るこのライブラリーからのバリアントについて選択した。本発明者らは、R1015Hではなく、R1015Qを使用した。なぜなら、この突然変異体が細菌中で活性を示さなかったためである(
図21b)。NNTRRT(配列番号48)PAMに対して選択した場合、生存クローンはここでも観察されなかったが、NNARRT(配列番号43)またはNNCRRT(配列番号47)に対するR1015Qバリアントについての選択は、E782、K929、N968における突然変異、および驚くべきことに、1015におけるQのHへの突然変異を生じさせた。
【0161】
野生型SaCas9からの選択結果と組み合わせると、全ての選択にわたり同定された最も高頻度のミスセンス突然変異は、E782K、K929R、N968K、およびR1015Hであり(
図21d)、それらの突然変異の組合せが、SaCas9 PAMの3番目の位置におけるAまたはCを含有する部位の効率的な開裂を許容し得ることを示唆した。したがって、本発明者らは、PAM(すなわち、NNNRRT PAM上)の3番目の位置における4つの塩基のそれぞれを保有する部位に標的化されるsgRNAを用いるヒト細胞ベースEGFP崩壊アッセイを使用してそれらの突然変異の異なる組合せを含有するSaCas9バリアントを試験した(
図21e、
図32)。本発明者らは、三重突然変異体の組合せE782K/N968K/R1015HおよびE782K/K929R/R1015Hを有するバリアントが、NNNRRT PAMを有する部位において高度に活性である一方(
図21e、
図32)、4つ全ての突然変異を含有する四重突然変異バリアント(E782K/K929R/N968K/R1015H)が、それらの部位に対する一般により低い活性を有することを見出した(
図32)。本発明者らは、さらなる特徴付けのためにE782K/N968K/R1015H(以下、KKHバリアントと称する)を選択し、本発明者らのヒト細胞ベースEGFP崩壊アッセイを使用してKKHバリアントを含む3つ全ての置換が活性に要求されることを確認した(
図21e)。
【0162】
KKHおよび野生型SaCas9のPAM特異性をより包括的に定義するため、本発明者らは、本発明者らの既に記載された細菌細胞ベース部位枯渇アッセイ(実施例1〜2参照)を使用した(
図33)。この方法は、選択後PAM枯渇値(PPDV)として定量される、ランダム化PAM配列を担持するDNAプラスミドの相対開裂(およびしたがって細菌細胞中の枯渇)を同定することにより、Cas9PAM特異性プロファイルを生じさせる。本発明者らは、PAMに代えて8つのランダム化塩基をそれぞれ有する2つの異なるスペーサー配列を有するライブラリーを使用して野生型およびKKH SaCas9の両方を用いる部位枯渇実験を実施した(
図33)。触媒的に不活性なSaCas9を使用する対照実験は、任意のPAM配列の枯渇をほとんど示さず(
図34a)、それは、統計的に有意な枯渇についての閾値を0.794のPPDVとして確立することを可能とした(
図34b)。先行実験は、本発明者らの細菌部位枯渇アッセイにおける<0.2のPPDVを有するPAMを、本発明者らのヒト細胞ベースEGFP崩壊アッセイにおいて効率的に開裂し得ることを示した(実施例1〜2参照)。野生型SaCas9について、最も枯渇したPAM(2つのライブラリーから得られた平均PPDVに基づく)は、予測されるとおり、4つのNNGRRT(配列番号46)(PAM(
図21fおよび
図34c)であった。興味深いことに、<0.1の平均PPDVを有する他のPAMは、形態NNGRRN(配列番号49)のものを含み(
図34d)、それは、本発明者らの細菌ベースアッセイにおいて一部のスペーサー配列についてPAMの最後の位置が、Tとして十分に規定され得ないことを示唆した(しかし、従来の報告は、インビトロPAM枯渇アッセイ、ChIP−seq、および内在性ヒト部位の標的化によりPAMの6番目の位置におけるチミンが非常に好ましいことを実証した(Ran,F.A.et al.In vivo genome editing using Staphylococcus aureus Cas9.Nature 520,186−191(2015)))。対照的に、KKHバリアントについて、<0.2の平均PPDVを有するPAMは、NNGRRT(配列番号46)PAMだけでなく、4つ全てのNNARRT(配列番号43)、4つ全てのNNCRRT(配列番号47)、および4つのNNTRRT(配列番号48)PAMの3つも含んだ(
図21f、
図34cおよび34e)。これらの結果は、KKH SaCas9が、その野生型相当物に対して拡大したPAM標的化範囲を有すると考えられることを示唆した。
【0163】
ヒト細胞中でのKKH SaCas9バリアントのロバストネスを評価するため、本発明者らは、種々のNNNRRT PAMを含有する55個の異なる内在性遺伝子標的部位に対するその活性を試験した(
図22a)。KKHバリアントは、効率的な活性を示し、平均突然変異誘発頻度は全ての部位にわたり24.7%であり、部位の80%(55個の部位の44個)が、5%超の崩壊を示した。55個全ての部位にわたるKKH SaCas9活性の分析により、PAMの3番目の位置(NN[G>A=C>T]RRT;
図22b)、およびPAMの4番目/5番目の位置(NNN[AG>GG>GA>AA]T;
図22c)についての順序付けられた優先性が明らかになった。これと一致して、本発明者らは、NNNRRT PAMの3番目/4番目/5番目の位置の16個の考えられる組合せ間の差異を観察した(
図35a)。KKH SaCas9は、21〜23ヌクレオチドに及ぶスペーサー長さ(
図22d)、変動GC含有率を有するスペーサー配列(
図35b)、および変動GC含有率を有するPAM(
図35c)に対して効率的に機能した。低程度、中程度、および高程度の効率(それぞれ0〜10%、10〜30%、および>30%の平均突然変異誘発頻度)で開裂された部位から導かれた配列ロゴにより、NNNRRT PAMの4番目および5番目の位置以外の標的部位全体にわたる希少な配列優先性、およびおそらく高程度の効率で開裂された部位上の2番目のPAM位置におけるグアニンについてのわずかな優先性が明らかになった(
図35d)。
【0164】
KKHバリアントが、野生型SaCas9により標的化することができないPAMの改変を可能とすることを実証するため、本発明者らは、種々のNNNRRT PAMを担持する部位に対するヒト細胞中のそれらのヌクレアーゼの直接比較を実施した。本発明者らのEGFP崩壊アッセイおよび16個の内在性ヒト遺伝子標的を使用する16個の部位の評価(それぞれ
図22eおよび22f)は、KKH SaCas9がNNNRRT PAMを担持する標的部位をロバストに改変する一方、野生型SaCas9はNNGRRT(配列番号46)PAMを有する部位のみを効率的に標的化することを示した。NNHRRT(配列番号44)PAMを有する24個全ての部位について、KKHバリアントは、NNGRRT(配列番号46)PAMを有する8つの部位に対して、野生型SaCas9よりもかなり高い率の突然変異誘発を誘導し、KKH SaCas9は、野生型と比較して同等またはわずかに低いレベルの突然変異誘発を誘導した(
図22eおよび22f)。これらの結果は、まとめて、KKHバリアントがNNNRRT PAMを有する部位を開裂し得、それにより、現在、ヒト細胞中で野生型SaCas9により効率的に変更することができないNNHRRT(配列番号44)PAMを有する部位の標的化が可能となることを実証する。
【0165】
SaCas9のゲノムワイド特異性に対するKKH突然変異の影響を評価するため、本発明者らは、GUIDE−seq(シーケンシングによるDSBのゲノムワイドな偏りのない識別)法(Tsai,S.Q.et al.GUIDE−seq enables genome−wide profiling of off−target cleavage by CRISPR−Cas nucleases.Nat Biotechnol 33,187−197(2015))を使用して野生型およびKKH SaCas9のオフターゲットプロファイルを同一のsgRNAと直接比較した。NNGRRT(配列番号46)PAMを含有する6つの内在性ヒト遺伝子部位に標的化されるsgRNAについて試験した場合、本発明者らは、野生型およびKKH SaCas9が6つ全ての部位についてほぼ同一のGUIDE−seqタグインテグレーション率およびオンターゲット開裂頻度を誘導することを観察した(それぞれ
図36aおよび36b)。さらに、野生型およびKKH SaCas9は、6つのsgRNAのそれぞれを有する類似数のオフターゲット部位における突然変異を誘導する(
図23aおよび23b)。KKHバリアントについてのオフターゲット部位は、一般に、NNNRRT PAMモチーフに付着し、野生型SaCas9についてのオフターゲット部位は、NNGRR[T>G]モチーフに付着した(
図22b)。6つの試験sgRNAのうちの最大数のオフターゲット部位を誘導したsgRNAの1つについて、本発明者らは、野生型およびKKH SaCas9について類似数のオフターゲット部位を観察した。しかしながら、オフターゲット部位は、野生型およびKKH SaCas9間で部分的にのみ重複し、それは、それらの異なるPAM特異性を考慮して予測することができたとおりである(
図23bおよび23c)。本発明者らは、NNGRRT(配列番号46)PAMを有する部位の標的化のためのKKHバリアントの使用を提唱しないが(野生型SaCas9は、それらの部位についてKKHよりも高いオンターゲット活性を示し得るため)、これらの結果は、KKH SaCas9が、予測PAMを有するオフターゲット部位のみを開裂し、一般に、野生型SaCas9について観察されるものと同等数のオフターゲット部位を誘導することを示唆する。
【0166】
KKH SaCas9のゲノムワイド特異性をさらに試験するため、本発明者らは、NNHRRT(配列番号44)PAMを含有する部位に標的化される5つの追加のsgRNAを試験した(
図23dおよび23e)。GUIDE−seqにより検出されたオフターゲット部位は、一般に、(既に公開された実験において野生型SpCas9およびSpCas9バリアントについて観察された数と同等に数が少なく(実施例1〜2参照(Tsai,S.Q.et al.GUIDE−seq enables genome−wide profiling of off−target cleavage by CRISPR−Cas nucleases.Nat Biotechnol 33,187−197(2015))、潜在的なDNAおよびRNAバルジ型オフターゲットを示し(Lin,Y.et al.CRISPR/Cas9 systems have off−target activity with insertions or deletions between target DNA and guide RNA sequences.Nucleic Acids Res 42,7473−7485(2014))、予測PAM配列を含有した。まとめると、本発明者らの実験は、野生型およびKKH SaCas9のゲノムワイド特異性が類似することを実証し、一般に、GUIDE−seqにより判断されるとおりヒト細胞中の少ない数のオフターゲット突然変異を示す。
【0167】
野生型SaCas9はNNGRRT(配列番号46)PAMの標的化のための最適な選択を保つが、本発明者らが本明細書に記載するKKH SaCas9バリアントは、NNARRT(配列番号43)およびNNCRRT(配列番号47)PAMを有する部位をロバストに標的化し得、NNTRRT(配列番号48)PAMを有する部位についての妥当な良好な率を有する。したがって、本発明者らは、KKHバリアントがSaCas9の標的化範囲をランダムDNA配列中でほぼ2〜4倍だけ増加させ、それにより、高精度の標的化を要求する種々の異なる用途におけるSaCas9のより広い利用の見込みを改善することを保守的に推定する。GUIDE−seqを使用して、本発明者らは、NNGRRT(配列番号46)PAMを含有する同一部位に標的化される場合、KKH SaCas9が、野生型SaCas9と類似数のオフターゲット突然変異を誘導することを実証した。さらに、KKH SaCas9は、NNHRRT(配列番号44)PAMを担持する部位に標的化される場合、少数のみのオフターゲット突然変異を誘導する。KKH SaCas9は野生型SaCas9に対して改変PAM配列を認識するが、本発明者らの知見は、プロトスペーサーおよびPAMの合計の組合せ長さがKKHバリアントについてヒトゲノムに妥当にオルソゴナルであるために依然として十分に長い(24〜26bp)ことを考慮すると完全に驚くべきことではない。さらに、PAM認識の改変は、Cas9/sgRNAのその標的部位との相互作用のエネルギー論を変更することにより特異性を改善し得ることが考えられる(トランケートsgRNA(Fu,Y.,Sander,J.D.,Reyon,D.,Cascio,V.M.&Joung,J.K.Improving CRISPR−Cas nuclease specificity using truncated guide RNAs.Nat Biotechnol 32,279−284(2014))またはD1135E SpCas9突然変異体(実施例1〜2参照)の改善された特異性について既に提案された機序と類似する)。
【0168】
実施例4.SpCas9−VQRバリアントの活性の改善
SpCas9−VQRバリアントはNGAG>NGAA=NGAT>NGACのNGAN PAMについての優先性を有するため、本発明者らは、NGAH PAM(H=A、C、またはT)に対する改善された活性を有する誘導体バリアントについて選択することを求めた。NGAA、NGAT、またはNGAC PAMのいずれかを有する標的部位を含有する細胞に対するR1335Qライブラリー(ランダムに突然変異誘発したPIドメインを有する)についての選択により、変更PAM特異性を与える突然変異を含有する追加のクローンをシーケンシングすることが可能となった。これらのクローンの配列により、NGAA、NGAT、またはNGAC PAMへのPAM特異性の変更に重要であり得る追加の突然変異が明らかになった。
【0169】
これらの選択の結果に基づき、VQRバリアントおよび24個の他の誘導体バリアントを細菌中のNGAG、NGAA、NGAT、およびNGAC PAM部位に対して試験した。多数のこれらの誘導体バリアントは、NGAH PAM部位に対してVQRバリアントよりも良好に生存し、それらの多くはG1218R突然変異を含有した(表7および
図24)。
【0170】
【表30】
【0171】
細菌スクリーンからの結果が、それらの追加の突然変異の一部がNGAH PAM部位に対する活性を改善することを実証したことを考慮して、本発明者らは、EGFP崩壊アッセイにおいてヒト細胞中で最良の候補の一部を試験した。本発明者らが観察したことは、多数のそれらのバリアント、例として、VRQR、NRQR、およびYRQRバリアントがVQRバリアントよりも、NGAH部位の標的化において優れていることである(表8および
図25)。これらのクローンおよびVQRバリアント間の主な差異は、それらがG1218R突然変異を含むことである。
【0172】
【表31】
【0173】
VRQRバリアントは試験したもののなかで最もロバストであると考えられるため、本発明者らは、ヒト細胞中の9つの異なる内在性部位(NGAA、NGAC、NGAT、およびNGAG PAMについて2つの部位、ならびにNGCG PAMについて1つの部位)に対するその活性をVQRバリアントのものと比較した。このデータにより、ヒト細胞中の全ての試験部位においてVRQRバリアントがVQRバリアントよりも優れていることが明らかになる(
図26)。
【0174】
VRQRバリアントがVQRバリアントに対して改善された活性を有することを実証した後、本発明者らは、追加の置換の追加が活性をさらに改善し得るか否かを決定することを求めた。本発明者らは、SpCas9のPAM相互作用ポケットに近接する選択における追加の突然変異を観察したため、それらの突然変異のサブセットをVQRおよびVRQRバリアントに追加し、NGAG、NGAA、NGAT、およびNGAC PAMを含有する部位に対して細菌中でスクリーニングした(表9および
図27)。多数の誘導体バリアントは、NGATおよびNGAC PAM部位に対するより高い活性を有することが考えられるため、本発明者らは、ヒト細胞中のそれらのバリアントの試験を開始した。本発明者らは、ヒト細胞EGFP崩壊アッセイにおいて、VQRまたはVRQRバックグラウンドのいずれかへの追加の突然変異を含有する追加のバリアントを試験した。これらの実験により、ここでも、VRQRがVQRバリアントよりも、NGAH PAMに対するよりロバストな活性を有すること、およびVRQRバックボーンへの追加の突然変異が有益であることが明らかになった。
【0175】
【表32】
【0176】
まとめると、これらの結果は、SpCas9−VQRバリアント中で追加の突然変異を含めることは、NGAN PAMを含有する部位、具体的には、NGAH PAMを含有する部位に対する活性を改善し得ることを示唆する。
【0177】
参照文献
1.Sander,J.D.&Joung,J.K.CRISPR−Cas systems for editing,regulating and targeting genomes.Nat Biotechnol 32,347−355(2014).
2.Hsu,P.D.,Lander,E.S.&Zhang,F.Development and applications of CRISPR−Cas9 for genome engineering.Cell 157,1262−1278(2014).
3.Doudna,J.A.&Charpentier,E.Genome editing.The new frontier of genome engineering with CRISPR−Cas9.Science 346,1258096(2014).
4.Barrangou,R.&May,A.P.Unraveling the potential of CRISPR−Cas9 for gene therapy.Expert Opin Biol Ther 15,311−314(2015).
5.Jinek,M.et al.A programmable dual−RNA−guided DNA endonuclease in adaptive bacterial immunity.Science 337,816−821(2012).
6.Sternberg,S.H.,Redding,S.,Jinek,M.,Greene,E.C.&Doudna,J.A.DNA interrogation by the CRISPR RNA−guided endonuclease Cas9.Nature 507,62−67(2014).
7.Hsu,P.D.et al.DNA targeting specificity of RNA−guided Cas9 nucleases.Nat Biotechnol 31,827−832(2013).
8.Tsai,S.Q.et al.GUIDE−seq enables genome−wide profiling of off−target cleavage by CRISPR−Cas nucleases.Nat Biotechnol 33,187−197(2015).
9.Hou,Z.et al.Efficient genome engineering in human pluripotent stem cells using Cas9 from Neisseria meningitidis.Proc Natl Acad Sci U S A(2013).
10.Fonfara,I.et al.Phylogeny of Cas9 determines functional exchangeability of dual−RNA and Cas9 among orthologous type II CRISPR−Cas systems.Nucleic Acids Res 42,2577−2590(2014).
11.Esvelt,K.M.et al.Orthogonal Cas9 proteins for RNA−guided gene regulation and editing.Nat Methods 10,1116−1121(2013).
12.Cong,L.et al.Multiplex genome engineering using CRISPR/Cas systems.Science 339,819−823(2013).
13.Horvath,P.et al.Diversity,activity,and evolution of CRISPR loci in Streptococcus thermophilus.J Bacteriol 190,1401−1412(2008).
14.Anders,C.,Niewoehner,O.,Duerst,A.&Jinek,M.Structural basis of PAM−dependent target DNA recognition by the Cas9 endonuclease.Nature 513,569−573(2014).
15.Reyon,D.et al.FLASH assembly of TALENs for high−throughput genome editing.Nat Biotechnol 30,460−465(2012).
16.Fu,Y.et al.High−frequency off−target mutagenesis induced by CRISPR−Cas nucleases in human cells.Nat Biotechnol 31,822−826(2013).
17.Chen,Z.&Zhao,H.A highly sensitive selection method for directed evolution of homing endonucleases.Nucleic Acids Res 33,e154(2005).
18.Doyon,J.B.,Pattanayak,V.,Meyer,C.B.&Liu,D.R.Directed evolution and substrate specificity profile of homing endonuclease I−SceI.J Am Chem Soc 128,2477−2484(2006).
19.Jiang,W.,Bikard,D.,Cox,D.,Zhang,F.&Marraffini,L.A.RNA−guided editing of bacterial genomes using CRISPR−Cas systems.Nat Biotechnol 31,233−239(2013).
20.Mali,P.et al.RNA−guided human genome engineering via Cas9.Science 339,823−826(2013).
21.Hwang,W.Y.et al.Efficient genome editing in zebrafish using a CRISPR−Cas system.Nat Biotechnol 31,227−229(2013).
22.Chylinski,K.,Le Rhun,A.&Charpentier,E.The tracrRNA and Cas9 families of type II CRISPR−Cas immunity systems.RNA Biol 10,726−737(2013).
23.Kleinstiver,B.P.,Fernandes,A.D.,Gloor,G.B.&Edgell,D.R.A unified genetic,computational and experimental framework identifies functionally relevant residues of the homing endonuclease I−BmoI.Nucleic Acids Res 38,2411−2427(2010).
24.Gagnon,J.A.et al.Efficient mutagenesis by Cas9 protein−mediated oligonucleotide insertion and large−scale assessment of single−guide RNAs.PLoS One 9,e98186(2014).
【0178】
他の実施形態
本発明をその詳細な説明とともに記載した一方、上記の説明は、添付の特許請求の範囲の範囲により定義される本発明の範囲を説明するものであり、限定するものではないことを理解すべきである。他の態様、利点、および改変は、以下の特許請求の範囲の範囲内である。
本発明は、以下の態様を含み得る。
[1]
以下の位置:G1104、S1109、L1111、D1135、S1136、G1218、N1317、R1335、T1337の1つ以上における突然変異を有する単離膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)タンパク質。
[2]
配列番号1のアミノ酸配列と少なくとも80%同一である配列を含む、請求項1に記載の単離タンパク質。
[3]
以下の突然変異:G1104K;S1109T;L1111H;D1135V;D1135E;D1135N;D1335Y;S1136N;G1218R;N1317K;R1335E;R1335Q;およびT1337Rの1つ以上を含む、請求項1に記載の単離タンパク質。
[4]
以下の突然変異:D1135E(D1135Eバリアント);D1135V/R1335Q/T1337R(VQRバリアント);D1135V/G1218R/R1335Q/T1337R(VRQRバリアント);D1135E/R1335Q/T1337R(EQRバリアント);D1135N/G1218R/R1335Q/T1337R(NRQRバリアント);D1135Y/G1218R/R1335Q/T1337R(YRQRバリアント);G1104K/D1135V/G1218R/R1335Q/T1337R(KVRQRバリアント);S1109T/D1135V/G1218R/R1335Q/T1337R(TVRQRバリアント);L1111H/D1135V/G1218R/R1335Q/T1337R(HVRQRバリアント);D1135V/S1136N/G1218R/R1335Q/T1337R(VNRQRバリアント);D1135V/G1218R/N1317K/R1335Q/T1337R(VRKQRバリアント);またはD1135V/G1218R/R1335E/T1337R(VRERバリアント)を含む、請求項1〜3のいずれか一項に記載の単離タンパク質。
[5]
D10、E762、D839、H983、またはD986;およびH840またはN863における突然変異からなる群から選択される、ヌクレアーゼ活性を減少させる1つ以上の突然変異をさらに含む、請求項1に記載の単離タンパク質。
[6]
前記突然変異が、
(i)D10AまたはD10N、および
(ii)H840A、H840N、またはH840Y
である、請求項5に記載の単離タンパク質。
[7]
以下の位置:E782、N968、および/またはR1015の1つ以上における突然変異を有する単離黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9)タンパク質。
[8]
配列番号2のアミノ酸配列と少なくとも80%同一である配列を含む、請求項7に記載の単離タンパク質。
[9]
以下の突然変異:R1015Q、R1015H、E782K、N968K、E735K、K929R、A1021T、K1044N、E782K/N968K/R1015H(KKHバリアント);E782K/K929R/R1015H(KRHバリアント);またはE782K/K929R/N968K/R1015H(KRKHバリアント)の1つ以上を含む、請求項7に記載の単離タンパク質。
[10]
D10、D556、H557、および/またはN580における突然変異からなる群から選択される、ヌクレアーゼ活性を減少させる1つ以上の突然変異をさらに含む、請求項7に記載の単離タンパク質。
[11]
前記突然変異が、D10A、D556A、H557A、N580A、例えば、D10A/H557Aおよび/またはD10A/D556A/H557A/N580Aである、請求項7に記載の単離タンパク質。
[12]
任意選択の介在リンカーにより異種機能ドメインに融合されている請求項1〜11のいずれか一項に記載の単離タンパク質を含む融合タンパク質であって、前記リンカーが前記融合タンパク質の活性を妨害しない、融合タンパク質。
[13]
前記異種機能ドメインが転写活性化ドメインである、請求項12に記載の融合タンパク質。
[14]
前記転写活性化ドメインがVP64またはNF−κB p65からのものである、請求項12に記載の融合タンパク質。
[15]
前記異種機能ドメインが転写サイレンサーまたは転写抑制ドメインである、請求項12に記載の融合タンパク質。
[16]
前記転写抑制ドメインが、クルッペル関連ボックス(KRAB)ドメイン、ERFリプレッサードメイン(ERD)、またはmSin3A相互作用ドメイン(SID)である、請求項15に記載の融合タンパク質。
[17]
前記転写サイレンサーがヘテロクロマチンタンパク質1(HP1)である、請求項15に記載の融合タンパク質。
[18]
前記異種機能ドメインが、DNAのメチル化状態を改変する酵素である、請求項12に記載の融合タンパク質。
[19]
前記DNAのメチル化状態を改変する前記酵素がDNAメチルトランスフェラーゼ(DNMT)またはTETタンパク質である、請求項18に記載の融合タンパク質。
[20]
前記TETタンパク質がTET1である、請求項19に記載の融合タンパク質。
[21]
前記異種機能ドメインが、ヒストンサブユニットを改変する酵素である、請求項12に記載の融合タンパク質。
[22]
ヒストンサブユニットを改変する前記酵素が、ヒストンアセチルトランスフェラーゼ(HAT)、ヒストンデアセチラーゼ(HDAC)、ヒストンメチルトランスフェラーゼ(HMT)、またはヒストンデメチラーゼである、請求項12に記載の融合タンパク質。
[23]
前記異種機能ドメインが生物学的係留物である、請求項12に記載の融合タンパク質。
[24]
前記生物学的係留物がMS2、Csy4またはラムダNタンパク質である、請求項23に記載の融合タンパク質。
[25]
前記異種機能ドメインがFokIである、請求項12に記載の融合タンパク質。
[26]
請求項1〜25のいずれか一項に記載のタンパク質をコードする単離核酸。
[27]
請求項26に記載の単離核酸を含むベクター。
[28]
請求項21に記載の単離核酸が、以下の位置:G1104、S1109、L1111、D1135、S1136、G1218、N1317、R1335、T1337の1つ以上における突然変異を有する単離膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)タンパク質を発現させるための1つ以上の調節ドメインに作動可能に結合されている、請求項27に記載のベクター。
[29]
請求項21に記載の単離核酸が、以下の位置:E782、N968、および/またはR1015の1つ以上における突然変異を有する単離黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9)タンパク質を発現させるための1つ以上の調節ドメインに作動可能に結合されている、請求項27に記載のベクター。
[30]
請求項26に記載の核酸を含み、および任意選択的に請求項1〜25のいずれか一項に記載のタンパク質を発現する宿主細胞、好ましくは哺乳動物宿主細胞。
[31]
細胞のゲノムを変更する方法であって、前記細胞中で、請求項1〜25のいずれか一項に記載の単離タンパク質または融合タンパク質、および前記細胞の前記ゲノムの選択部分に相補的な領域を有するガイドRNAを発現させるか、またはそれらと前記細胞を接触させることを含む方法。
[32]
前記単離タンパク質または融合タンパク質が、核局在化配列、細胞浸透ペプチド配列、および/または親和性タグの1つ以上を含む、請求項31に記載の方法。
[33]
前記細胞が幹細胞である、請求項31に記載の方法。
[34]
前記細胞が胚性幹細胞、間葉系幹細胞、もしくは誘導多能性幹細胞であるか、生存動物中に存在するか、または胚中に存在する、請求項33に記載の方法。
[35]
二本鎖DNA(dsDNA)分子を変更する方法であって、前記dsDNA分子を、請求項1〜25のいずれか一項に記載の単離タンパク質または融合タンパク質、および前記dsDNA分子の選択部分に相補的な領域を有するガイドRNAと接触させることを含む方法。
[36]
前記dsDNA分子がインビトロで存在する、請求項35に記載の方法。