【実施例】
【0035】
実施例I
Cas9変異体
Cas9をコードする遺伝子サイズが大きいという問題を克服するために、最も小さい特徴解析されているCas9ファミリーメンバーの1つであるNM‐Cas9(ナイセリア・メニンジティディスのCas9)内で種々の領域の標的化欠失を行う。NM‐Cas9のサイズは3,249bpである。ゲノム標的化のための必要条件およびヌクレアーゼ活性に関わる残基を決定する。よりサイズの小さいNM‐Cas9を作製するために、Cas9タンパク質のアラインメントを作製し、低度保存された隣接区間または保存エッジ間の区間を欠失のために同定した。複数の目的領域を同定し、NM‐Cas9から選択的に除去した後、Cas9抑制因子アッセイを用いて機能を評価した。アッセイでは、ヌクレアーゼ活性を欠いているがレポーター遺伝子の5′領域を標的化可能なNM‐Cas9変異体を用いた。NM‐Cas9は、レポーター遺伝子に結合できる場合は転写を抑制し、蛍光レポーターの場合、細胞が非蛍光性となる。
【0036】
Cas9のアラインメントおよび欠失予測:PFAMデータベース、またはjackHMMER(その全体が参照により援用されるR.D. Finn, J. Clements, S.R. Eddy, Nucleic Acids Research (2011) Web Server Issue 39:W29-W37)などのデータベースサーチから、Cas9ホモログの全長配列を得た。配列のコレクションがアライメントされない場合、CLUSTALW(その全体が参照により援用されるSievers F, Wilm A, Dineen DG, Gibson TJ, Karplus K, Li W, Lopez R, McWilliam H, Remmert M, Soding J, Thompson JD, Higgins DG (2011))などのアラインメントアルゴリズムまたは同等物を用いてアラインメントを作成する。アラインメントを目的配列の位置まで計算的にカットし、アラインメントの偏りが少なくなるように調整した(例えば、ペアワイズ同一性が95%を超える配列を除去した)。その位置でのアミノ酸およびギャップの量を考慮して、位置当たりのアミノ酸頻度のエントロピーまたは相対エントロピーとして保存度を計算する。低度保存領域または保存エッジ間領域を欠失の標的とする。実験検証を反復して、欠失を拡大するか、またはシフトさせる。
【0037】
欠失体の構築および特徴解析:その全体が参照により援用されるEsvelt, K. M., Mali, P., Braff, J. L., Moosburner, M., Yaung, S. J., and Church, G. M. (2013) Nat Methods 10, 1116-1121に記載されるように、ヌクレアーゼ欠損NM‐Cas9を発現する細菌プラスミドをあらかじめ作製した。NM‐Cas9内に標的欠失を生じさせるために、その全体が参照により援用されるGibson, D. G., Young, L., Chuang, R. Y., Venter, J. C., Hutchison, C. A., 3rd, and Smith, H. O. (2009) Nat Methods 6, 343-345に記載されるように、ギブソン・アセンブリを用いた。重複する相補的部分を含み、NM‐Cas9内の標的領域を除去してSGGGSリンカーを挿入するようにデザインされたプライマーを購入し、PCR反応に用いた。PCR断片をゲル精製し、ギブソン・アセンブリを用いてインビトロでアセンブルし、大腸菌に形質転換した。クローンの配列を検証し、(2つではなく)単一のプラスミドがNM‐Cas9のスペーサー、標的プロトスペーサー、およびNM‐Cas9活性に対するYFPレポーターを含む、あらかじめ作製されたNM‐Cas9レポータープラスミド((2013) Nat Methods 10, 1116-1121参照)の改変型を用いてクローンを試験した。簡潔に述べると、このアッセイでは、合成NM‐Cas9バリアントおよびレポータープラスミドで細胞を同時形質転換する。次に、二重に形質転換された細胞を37℃で生育し、蛍光プレートリーダーを用いてYFP蛍光の量を測定し、野生型ヌクレアーゼ欠損NM‐Cas9を有する対照プラスミドおよびレポータープラスミドで形質転換された細胞と比較する。
【0038】
以下の配列は、YFPレポーターアッセイにより測定されるように、ほぼ野生型レベルに近い活性を保持していた2つの最も大きなNM‐Cas9単一欠失変異体の配列である。NM‐cas9内の欠失領域を置換しているSGGGSリンカーの配列は、大文字で示される。
【0039】
【化1】
【0040】
【化2】
【0041】
【化3-1】
【化3-2】
【0042】
本明細書に記載の方法に従って、NM‐Cas9内の複数の欠失が同定された。最大のNM‐Cas9‐Δ255‐449は595塩基対が除去されており、レポーターアッセイにより測定されるように、活性低下はわずか16%である。ある態様によれば、NM‐Cas9などの野生型Cas9より1000塩基対または900塩基対少なく、野生型レベルに近い活性を保持している、変異Cas9タンパク質が提供される。
【0043】
実施例II
欠失のためのCas9ヌクレアーゼドメインの標的化
Cas9のニッカーゼ欠損アレルまたはヌクレアーゼ欠損アレルが望まれる場合、低度配列保存領域または配列保存エッジ間領域を標的化すると共に、Cas9ヌクレアーゼドメインを周囲のヌクレオチドと共に欠失のための標的としてもよい。このようなアプローチを用いて、HNHモチーフおよび周囲のヌクレオチドを欠いた機能的NM‐Cas9アレルであるNM‐Cas9‐Δ567‐654を作製した。このアレルは、YFPレポーターアッセイで測定されるように、野生型とほぼ同じDNA結合能を保持していた。
【0044】
実施例III
偏りのないNM‐Cas9欠失ライブラリーの構築方法
Cas9欠失体を作製するために標的アプローチに加えて、本開示の態様には、ランダム欠失生成および機能的変異体のスクリーニングのためのハイスループットアプローチが含まれる。例示的な方法によれば、無差別(promiscuous)ヌクレアーゼ、超音波処理、サンプルの反復ピペッティング、または他の化学的、酵素的、もしくは環境的手段を用いて、所望のCas9アレルを含むプラスミドDNAを剪断してもよい。断片化後、プラスミドDNAをエキソヌクレアーゼで処理して、Cas9遺伝子からヌクレオチドを除去してもよい。エキソヌクレアーゼ処理後、断片化末端をマングビーンヌクレアーゼまたはクレノーポリメラーゼなどの酵素で平滑末端化し、互いにライゲーションさせて、ランダム欠失を含むCas9プラスミドを再生する。Cas9の欠失部分内にリンカーまたはエフェクターモチーフなどの外来性ドメインを挿入するために、平滑末端化された断片DNAにそのようなドメインをライゲーションさせてもよく、次に、プラスミドの環状化により、Cas9の欠失部分内に外来性ドメインが挿入されたCas9コード配列が得られる。次に、環状化分子のライブラリーを大腸菌に形質転換し、プラスミドDNAを抽出する。
【0045】
この時点で、ライブラリーをCas9活性のレポーターアッセイを含む細胞に形質転換してもよく、機能的活性を維持しているライブラリーのメンバーを同定してもよい。あるいは、スクリーニングするライブラリーのサイズを小さくするために、新たに作製されたライブラリー由来のCas9のコード配列を消化またはPCRにより単離してもよく、最初の野生型Cas9遺伝子より短くなるように断片をサイズで選択してもよい。次に、これらのより小さいメンバーを最初のベクター中に再度ライゲーションし、Cas9活性に対するレポーターを含む細胞に形質転換してもよい。
【0046】
プラスミドの剪断に加えて、3′側にCas9遺伝子に対する相同性を有するが5′側には互いに対する相同性を有し、各オリゴヌクレオチドの3′末端がCas9内の約30塩基対の異なる区間に結合する、オリゴヌクレオチドのライブラリーを作製してもよい。これらのオリゴヌクレオチドはCas9コード配列のセンス鎖およびアンチセンス鎖の両方をカバーする。次に、これらのオリゴヌクレオチドを用いてPCRを行い、所与のセンスPCR反応産物のそれぞれが他のアンチセンスPCR産物の全てに対する相補性を有し、逆も同じである、一連のCas9断片を作製することができる。次に、ギブソン・アセンブリまたはオーバーラップ・エクステンションPCRなどの方法を用いてこれらの断片同士をアニーリングさせた後、ベクター骨格中へのライゲーションおよび細胞への形質転換を行い、Cas9遺伝子のランダムな区間が除去されたCas9バリアントのライブラリーを作製することができる。より長いリンカーのため、または欠失領域内にエフェクタードメインを挿入するためには、オリゴヌクレオチドはその5′末端に、より長いリンカーまたはエフェクタードメインに対する相補性を有するべきであり、次に、このドメインは、ギブソン・アセンブリ反応中またはオーバーラップ・エクステンションPCR中に導入されるべきである。ライブラリー作製されると、本明細書に記載のYFPレポーターシステムなどのレポーターアッセイを用いて機能的バリアントを同定することができる。
【0047】
実施例IV
ベクター構築
Cas9ヌクレアーゼ欠損プラスミドは、ST1(Addgene#48659)であるか、またはNMプラスミドおよびTDプラスミド(それぞれ、Addgene#48646および48648)から、以下の点変異(NM:D16A D587A H588A N611A、およびTD:D13A D878A H879A N902A)を導入することにより構築した。ギブソン・アセンブリを用いてCas9欠失体を作製した。内部欠失体を作製する場合、連結断片間のリンカーを欠くNMΔ566‐620以外は、内部欠失体を5アミノ酸のSer‐Gly‐Gly‐Gly‐Serリンカーで連結した。N末端ドメイン交換により、ST1の残基1〜117をNMの残基118〜1082に融合させた。C末端ドメイン交換により、NMの残基1〜727をST1の残基743〜1121に融合させた。
【0048】
実施例V
細菌レポーターコンストラクト
欠失変異体の解析に用いるレポーターコンストラクトは、単一のSC101‐kanRプラスミド骨格中にスペーサーエレメントおよびYFPレポーターを併せ持つこと以外は、以前に発表されているものと同様である。ドメイン交換解析のためのレポーターコンストラクトは以前に使用されているものと同じである。その全体が参照により援用されるEsvelt, K. M. et al. Orthogonal Cas9 proteins for RNA-guided gene regulation and editing. Nature methods 10, 1116-1121, doi:10.1038/nmeth.2681 (2013) を参照されたい。
【0049】
実施例VI
哺乳動物レポーターコンストラクト
M‐ST1n‐VP64コンストラクト、ST1ガイドRNAプラスミド、およびST1特異的哺乳動物転写レポーターは、Esvelt, K. M. et al. Orthogonal Cas9 proteins for RNA-guided gene regulation and editing. Nature methods 10, 1116-1121, doi:10.1038/nmeth.2681 (2013)において以前に発表されている(それぞれ、Addgene#48675、48672、および48678)。細菌のコンストラクトの場合と同様に欠失変異体を作製した。
【0050】
実施例VII
抑制アッセイ
試験対象の適切なスペーサー/レポーターコンストラクトおよびCas9ベクターでNEB 10‐beta細胞(New England NioLabs社)を同時形質転換することにより、Cas9抑制アッセイを行った。形質転換によって生じたコロニーをピックアップし、96ウェルプレート中で連続振盪しながら37℃で生育した。翌日、Synergy Neoマイクロプレートリーダー(BioTek社)を用いてプレートを読み取り、495〜528nmの蛍光および600nmの吸光度を測定した。交換実験では、以前に公開されている2つの異なったスペーサー/プロトスペーサーの組合せ(AおよびB)(Esvelt, K. M. et al. Orthogonal Cas9 proteins for RNA-guided gene regulation and editing. Nature methods 10, 1116-1121, doi:10.1038/nmeth.2681 (2013) 参照)を試験した。他の全ての実験では、スペーサー/プロトスペーサーの組合せBのみを調べた。
【0051】
実施例VIII
細胞培養およびトランスフェクション
10%FBS(Invitrogen社)およびペニシリン/ストレプトマイシン(Invitrogen社)を添加した、高グルコースダルベッコ変法イーグル培地(Invitrogen社)中でHEK 293T細胞を維持した。加湿インキュベーター中に細胞を37℃、5%CO
2で維持した。1ウェル当たり50,000細胞を播種した24ウェルプレート中で細胞に遺伝子導入した。2.5μlのリポフェクタミン2000を用いて、400ngのCas9活性化因子、100ngのgRNA、および60ngのレポータープラスミドを各ウェルに送達した。細胞をさらに36〜48時間生育した後、免疫蛍光またはFACSを用いてアッセイした。
【0052】
実施例IX
多重配列アラインメントおよびエッジフィルタ
MUSCLEでPFAMデータベースのCas9配列(PF13395、798個の配列)をリアライメントし、MATLABスクリプトを用いて多様性および全長配列についてアラインメントを調整することにより多重配列アラインメントを作成した。以下に更に具体的に説明するこの方法により、217個の配列が得られた。
【0053】
PFAMデータベース中のCas9配列(PF13395、798個の配列)の最終的なリアラインメントを得るために、以下のステップ(プログラムコードは全てMATLAB)を行った。Fonfara I, et al., (2014) Phylogeny of Cas9 determines functional exchangeability of dual-RNA and Cas9 among orthologous type II CRISPR-Cas systems, Nucleic Acids Res. 42, 2577-90からのアラインメントを得、グループIIAおよびIICからの配列のみを含め、後者からは、IIAとIICを分離する分岐までの配列のみ(
図2中で赤色の四角で印付けられている)の合計49個の配列を含めた。
【0054】
次に、配列を2つのグループ、すなわち150位付近に大きな挿入を有するグループおよび有さないグループに分けた(これは、例えば一方でNM‐Cas9とST‐Cas9を区別し、他方でSP‐Cas9とTD‐Cas9を区別する)。MUSCLE(Edgar, RC (2004) MUSCLE: multiple sequence alignment with high accuracy and high throughput, Nucleic Acids Res 32, 1792-97参照)を用いてこれらのグループを別個にアライメントし、(配列の長さのため)ウィンドウアプローチ(windowed approach)を用いてリアライメントした後、1つのシードアラインメントへとプロファイル間アライメントを行った。
【0055】
PF13395中の配列を、MUSCLEでシードアラインメントを用いてリアライメントした。シードを用いた全てのアラインメントは、各標的配列を1つずつシードに対してアライメントすることにより行われる。このアラインメントを用いて、シードと標的配列の間でトップヒット同一性を決定し、トップヒット同一性の降順に再度整理する。次に、今度は同一性の降順に、標的配列をシードに対して1つずつリアライメントする。この2ステップのアプローチをとることでアラインメントのロバスト性を確保する。さらに、これらの配列を、挿入を含むか否かによって分け、2つの別個のグループをプロファイルとしてシードとリアライメントする。短い配列および大きな短縮を有する配列を手動で除く。90%を超えるペアワイズ類似性を有する配列を除く。
【0056】
得られた2つのアラインメントをプロファイル間で互いにアライメントし、合計217個の配列を得た。得られたアラインメントを、目的のCas9オルソログの位置まで短縮する。
【0057】
大腸菌O157の全遺伝子の平均アミノ酸バックグラウンド頻度に対する相対エントロピーとして配列保存度を計算した。得られた保存プロファイルにガウス差分(DoG)エッジフィルタ(その全体が参照により援用されるMarr, D. & Hildreth, E. Theory of edge detection. Proceedings of the Royal Society of London. Series B, Containing papers of a Biological character. Royal Society 207, 187-217 (1980) 参照)を適用し、パラメータ選択に対するロバスト性を実現するために複数の長さスケールで平均化し、種々の長さスケールで検出することにより、ドメイン境界検出を行った。
【0058】
具体的には、アラインメントの保存度を、大腸菌O157の全遺伝子の平均頻度に対するアミノ酸頻度の相対エントロピーとして計算した(Cover, TM and Thomas, JT (2006) Elements of Information Theory; 2nd edition, Wiley-Interscience参照)。
【0059】
【数1】
【0060】
式中、p
iaは、位置iにおけるアミノ酸aの頻度であり、q
aは、アミノ酸aの平均頻度である。20アミノ酸の全体の総和である。logの底は2であり、エントロピーはビットで与えられる。平均頻度q
aは以下の通りである。
{A C D E F G H I K L M N P Q R S T V W Y}=0.094 0.012 0.052 0.058 0.038 0.073 0.022 0.059 0.045 0.104 0.027 0.041 0.044 0.044 0.057 0.060 0.055 0.070 0.015 0.029。NM‐Cas9の位置まで短縮した後、Cas9のアラインメントにより、
図3の保存プロファイルが得られる。
【0061】
保存プロファイルを、(IIA型サブファミリーの、より大きなCas9タンパク質の一例である)SP‐Cas9における位置までプロット短縮する。N末端のおよそNM145(SP170)の位置まで、およびさらにNM200(SP400)の位置の後に、同様な特徴が観察され、これは前述の大きな挿入である。
図4を参照されたい。
【0062】
マルチスケールエッジフィルタを保存プロファイルに適用することにより潜在的ドメイン境界を同定した。このフィルタにより、様々なスケールでガウス差分(DoG)(その全体が参照により援用されるMarr, D and Hildreth, E (1980) Theory of Edge Detection, Proc R Soc Lond B Biol Sci 207, 187-217参照)が計算され、得られたグラフが総計される。この曲線の極値は、タンパク質中の低度保存領域と高度保存領域の境界であると解釈される。これらのドメインは、進化的分岐速度の差につながる潜在的に異なる機能的重要性のため、異なる保存レベルを示し得る。異なる保存度は、進化的時間軸にわたるドメイン挿入により生じたマルチドメインタンパク質の特徴であり得る。極値の値は、重要性の点から境界を順位付けるために用いられる。
【0063】
NMの位置に限定したCas9アラインメントでは、本明細書に記載の方法を用いて以下の境界または保存エッジまたはエッジアミノ酸が同定された。
【0064】
【表1】
【0065】
実施例X
Cas9ファミリーメンバーの計算解析
欠失に適していると考えられるマルチドメインCas9タンパク質内の領域を同定するために、バイオインフォマティクス的アプローチを用いてドメイン間の潜在的境界を同定した。よく精選されたシードアラインメントを用いて、前述したように、PFAMから得た全長Cas9配列(PF13395)を再度アライメントし、高いペアワイズ同一性を有する配列を除去した。大腸菌の全遺伝子の平均頻度に対する観察されたアミノ酸頻度の相対エントロピー(Cover, T. M., Thomas, J.T. Elements of Information Theory, 2nd edition. (Wiley-Interscience, 2006) 参照)として一次配列保存度を計算した。マルチドメインタンパク質中のドメインは様々なレベルの配列保存度を示すと予想できるので、ドメイン境界の位置を同定するためには、保存プロファイルにマルチスケールエッジフィルタを適用することが好適であると考えられる。
【0066】
狭い範囲の空間周波数(spatial frequency)に対して感受性があるガウス差分(DoG)バンドパスフィルタを用いて保存プロファイルについてエッジ検出を行った。Marr, D. & Hildreth, E. Theory of edge detection. Proceedings of the Royal Society of London. Series B, Containing papers of a Biological character. Royal Society 207, 187-217 (1980) を参照されたい。種々の長さスケールでの検出を可能にするため、および特定のパラメータ選択に対してフィルタを非感受性にするため、複数のスケール(5〜50アミノ酸)にわたる平均化を行った。次に、Cas9アラインメントの保存プロファイルにバンドパスフィルタを適用した。NM‐Cas9についての同定された潜在的境界位置を
図5Aに示す。上位6つの境界を赤色の長い太線で示す。図に示すように、それぞれの全体が参照により援用されるSapranauskas, R. et al. The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coli. Nucleic acids research 39, 9275-9282, doi:10.1093/nar/gkr606 (2011)およびFonfara, I. et al. Phylogeny of Cas9 determines functional exchangeability of dual-RNA and Cas9 among orthologous type II CRISPR-Cas systems. Nucleic acids research 42, 2577-2590, doi:10.1093/nar/gkt1074 (2014) において以前に帰属された500位の上流から始まり750位まで及ぶ既知のHNHおよびRuvCドメインの配置をフィルタは正確に同定している(
図5B参照)。560位周辺および620位周辺のドメイン間境界も正確に予想されている。88位の第1のアルギニンリッチαヘリックスの境界も予想されている。144位にある、タンパク質のN末端側の上位の境界の1つは、過去にFonfara, I. et al. Phylogeny of Cas9 determines functional exchangeability of dual-RNA and Cas9 among orthologous type II CRISPR-Cas systems. Nucleic acids research 42, 2577-2590, doi:10.1093/nar/gkt1074 (2014) においてドメイン境界として同定されていないが、アルギニン(Arg)リッチαヘリックス領域をより詳細に描写しており、今回、第2の保存されたアルギニンリッチヘリックスを含んでいた。
【0067】
実施例XI
Cas9の短縮体および欠失解析
Cas9内の機能的ドメインおよび潜在的非機能的ドメインを実験的に探索するために、N末端およびC末端の短縮体、並びに、本明細書に記載のドメイン検出解析に基づく中程度の一連の内部欠失体を作製した。機能的ヌクレアーゼ欠損Cas9タンパク質がYFPレポーターの5′末端に結合し、それによりレポーターの発現レベルが低下する、大腸菌における転写抑制因子アッセイを用いて欠失の影響を解析した(
図6A参照)。それぞれの全体が参照により援用されるQi, L. S. et al. Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression. Cell 152, 1173-1183, doi:10.1016/j.cell.2013.02.022 (2013); Esvelt, K. M. et al. Orthogonal Cas9 proteins for RNA-guided gene regulation and editing. Nature methods 10, 1116-1121, doi:10.1038/nmeth.2681 (2013); およびBikard, D. et al. Programmable repression and activation of bacterial gene expression using an engineered CRISPR-Cas system. Nucleic acids research 41, 7429-7437, doi:10.1093/nar/gkt520 (2013) を参照されたい。N末端またはC末端の短縮体はいずれもレポーターを抑制できなかったが、288位の境界の下流および上流の2つの内部欠失体であるNMΔ255‐289およびNMΔ330‐389、ならびにNMΔ566‐620欠失体は野生型レベルに近い抑制を示した(
図6Bおよび
図7)。欠失を反復的に拡大した複数回の解析をさらに行い、レポーターを抑制する能力をアッセイした(
図6B)。NM活性をほとんど低下させずに除去可能であった2つの大きな非重複領域254‐449および567‐654(それぞれ、タンパク質の全長の18%および8%を構成する)が同定された(
図6C)。アラインメントに示されるように、NMの254‐449位は、Cas9タンパク質に特異的なタンパク質領域内において、比較的低度保存された区間である。567から654位はHNHドメインであり、これはCas9のDNA触媒に重要であることが知られているが、DNA結合については不必要であることが分かっているドメインである。
【0068】
NM‐Cas9から除去された領域がNMに固有でなく、他のCas9ファミリーメンバーから除去可能な一般的領域であることを実証するために、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)のCas9(ST1)およびトレポネーマ・デンティコラ(Treponema denticola)のCas9(TD、GI:42525843)のヌクレアーゼ欠損バリアント内で対応する欠失体を作製し、転写抑制アッセイを用いてこれらの機能を測定した(
図8Aおよび
図9)。ST1およびTDの両方における対応する欠失変異体がそれらの対応する野生型と同様な活性を示したことから、除去された領域が、Cas9系統樹全体において、さらにTDなどのタイプII‐Aサブファミリー内のより離れたメンバー間においても、Cas9のDNA結合に不必要であることが示唆される。
【0069】
本明細書に記載の2つの最も大きい機能的欠失体の活性を、転写活性化因子アッセイを用いてST1‐Cas9内で試験した(
図8B)。大腸菌内での解析と一致して、VP64活性化ドメインに融合させてヒト細胞において蛍光レポーターを標的化した場合に、両方のST1欠失変異体が野生型タンパク質に匹敵する活性を保持していた(
図8C〜
図8D)。2つの欠失変異体の大きい方であるΔ255‐450(ST1のナンバリング)は、サイズが2,793塩基対であるCas9遺伝子を生じる。
【0070】
実施例XII
Cas9ドメイン交換
Cas9のN末端ドメインおよびC末端ドメインは、crRNA:tracrRNA結合および/またはPAM選択性に重要な役割を果たし得る。活性を解析するために、NMのN末端および/またはC末端をST1の相同な領域と置換した、NMとST1との間の一連のドメイン交換変異体を作製した。次に、レポーター内のガイドRNAおよび/またはCas9特異的PAMを変更して、本明細書に記載の転写レポーターアッセイを用いてキメラタンパク質を試験して、タンパク質特異性に対するドメイン交換の影響を決定した(
図10A)。ドメイン交換の正確な位置はドメイン境界解析に基づいて決定された。すなわち、同定された最も有意なN末端境界およびC末端境界(
図5A)にできるだけ近い位置であると同時にアラインメント内でほぼ完全に保存されている位置を選択した(
図10B)。NMとST1との間のN末端ドメイン交換体はいずれもNMに新規な特性を付与しなかったことから、ST1のN末端はモジュール式ではなく、導入されなかったST1の他の領域と関連して機能することが示唆される(
図10C〜10F)。C末端交換により、ST1のcrRNA:tracrRNA複合体と相互作用可能であり、さらにST1特異的PAMを有するレポーターを抑制可能である、NM‐ST1ハイブリッドが作製された(
図10E)。この結果は、
図11(A)〜11(D)に示されているように、他のST1特異的レポーターを用いてさらに検証された。
本発明の態様は以下を含む。
付記1
DNA結合タンパク質のファミリー内で、低度保存された2つの隣接アミノ酸配列と隣接する高度保存されたアミノ酸配列であるか、または高度保存された2つの隣接アミノ酸配列と隣接する低度保存されたアミノ酸配列である、第1のアミノ酸配列を同定すること、
前記第1のアミノ酸配列に対応する核酸配列を同定すること、
前記第1のアミノ酸配列に対応する核酸配列を欠いた、標的DNA結合タンパク質のための核酸配列を作製すること、および
前記作製された核酸配列から変異DNA結合タンパク質を作製すること
を含む、変異DNA結合タンパク質を作製する方法。
付記2
前記標的DNA結合タンパク質がヌクレアーゼ活性を有する、付記1に記載の方法。
付記3
前記標的DNA結合タンパク質がニッカーゼである、付記1に記載の方法。
付記4
前記標的DNA結合タンパク質がヌクレアーゼ欠損である、付記1に記載の方法。
付記5
前記第1のアミノ酸配列に対応する核酸配列を、前記標的DNA結合タンパク質のための核酸配列から欠失させる、付記1に記載の方法。
付記6
前記第1のアミノ酸配列に対応する核酸配列を、前記標的DNA結合タンパク質のための核酸配列から欠失させてリンカーで置換する、付記1に記載の方法。
付記7
前記第1のアミノ酸配列に対応する核酸配列を、前記標的DNA結合タンパク質のための核酸配列から欠失させてSGGGSリンカーで置換する、付記1に記載の方法。
付記8
前記DNA結合タンパク質がCas9タンパク質である、付記1に記載の方法。
付記9
前記第1のアミノ酸配列が、前記第1のアミノ酸配列を隣接アミノ酸配列から区別する一対のエッジアミノ酸配列を有する、付記1に記載の方法。
付記10
配列番号1の変異Cas9タンパク質。
付記11
配列番号2の変異Cas9タンパク質。
付記12
高度には保存されていないか、または低度保存されたCas9タンパク質のファミリー内の1または複数のアミノ酸配列を同定すること、
前記1または複数の同定されたアミノ酸配列に対応する核酸配列を同定すること、
前記1または複数の同定されたアミノ酸配列に対応する核酸配列を欠いた、標的Cas9タンパク質のための核酸配列を作製すること、および
前記作製された核酸配列から変異Cas9タンパク質を作製すること
を含む、変異Cas9タンパク質を作製する方法。
付記13
前記標的Cas9タンパク質がヌクレアーゼ活性を有する、付記12に記載の方法。
付記14
前記標的Cas9タンパク質がニッカーゼである、付記12に記載の方法。
付記15
前記標的Cas9タンパク質がヌクレアーゼ欠損である、付記12に記載の方法。
付記16
前記1または複数の同定されたアミノ酸配列に対応する核酸配列を、前記標的Cas9タンパク質のための核酸配列から欠失させる、付記12に記載の方法。
付記17
前記1または複数の同定されたアミノ酸配列に対応する核酸配列を、前記標的Cas9タンパク質のための核酸配列から欠失させてリンカーで置換する、付記12に記載の方法。
付記18
前記1または複数の同定されたアミノ酸配列に対応する核酸配列を、前記標的Cas9タンパク質のための核酸配列から欠失させてSGGGSリンカーで置換する、付記12に記載の方法。
付記19
第1のCas9タンパク質種のC末端ドメインを第2のCas9タンパク質種のC末端ドメインで置換すること
を含む、変異Cas9タンパク質を作製する方法。
付記20
前記第1のCas9タンパク質種がNM‐Cas9であり、前記第2のCas9タンパク質種がST1‐Cas9である、付記19に記載の方法。
付記21
第1のCas9タンパク質種のN末端ドメインを第2のCas9タンパク質種のN末端ドメインで置換すること
を含む、キメラCas9タンパク質を作製する方法。
付記22
前記第1のCas9タンパク質種がNM‐Cas9であり、前記第2のCas9タンパク質種がST1‐Cas9である、付記21に記載の方法。