【実施例】
【0464】
以下の実施例を、本発明の種々の実施形態を説明する目的のために挙げ、それらは本発明をいかなる様式にも限定することを意味しない。本実施例は、本明細書に記載の方法とともに、目下好ましい実施形態の代表例であり、例示であり、本発明の範囲に対する限定を意図するものではない。特許請求の範囲の範囲により定義される本発明の趣旨に包含されるその変更および他の使用は、当業者が行う。
【0465】
実施例1:真核細胞の核中のCRISPR複合体活性
例示的なII型CRISPR系は、4つの遺伝子Cas9、Cas1、Cas2、およびCsn1のクラスター、ならびに2つの非コードRNAエレメント、tracrRNAおよび非反復配列の短いストレッチ(スペーサー、それぞれ約30bp)により間隔が空いている反復配列の特徴的アレイ(ダイレクトリピート)を含有する化膿連鎖球菌(Streptococcus pyogenes)SF370からのII型CRISPR遺伝子座である。この系において、ターゲティングされるDNA二本鎖切断(DSB)を4つの連続ステップにおいて生成する(
図2A)。第1に、2つの非コードRNA、プレcrRNAアレイおよびtracrRNAがCRISPR遺伝子座から転写される。第2に、tracrRNAがプレcrRNAのダイレクトリピートにハイブリダイズし、次いでそれが個々のスペーサー配列を含有する成熟crRNAにプロセシングされる。第3に、成熟crRNA:tracrRNA複合体がCas9を、crRNAのスペーサー領域とプロトスペーサーDNAとの間のヘテロ二本鎖形成を介してプロトスペーサーおよび対応するPAMからなるDNA標的に指向する。最後に、Cas9は、PAMの上流の標的DNAの開裂を媒介してプロトスペーサー内でDSBを創成する(
図2A)。この例は、このRNAプログラマブルヌクレアーゼ系を適応させて真核細胞の核中のCRISPR複合体活性を指向する例示プロセスを記載する。
【0466】
細胞培養および形質移入
ヒト胚腎臓(HEK)細胞系HEK293FT(Life Technologies)を、10%のウシ胎仔血清(HyClone)、2mMのGlutaMAX(Life Technologies)、100U/mLのペニシリン、および100μg/mLのストレプトマイシンが補給されたダルベッコ改変イーグル培地(DMEM)中で37℃において5%のCO
2インキュベーションで維持した。マウスneuro2A(N2A)細胞系(ATCC)を、5%のウシ胎仔血清(HyClone)、2mMのGlutaMAX(Life Technologies)、100U/mLのペニシリン、および100μg/mLのストレプトマイシンが補給されたDMEMにより、37℃、5%のCO
2で維持した。
【0467】
HEK293FTまたはN2A細胞を24ウェルプレート(Corning)中に、形質移入1日前に1ウェル当たり200,000個の細胞の密度において播種した。Lipofectamine2000(Life Technologies)を製造業者の推奨プロトコルに従って使用して細胞を形質移入した。24ウェルプレートのそれぞれのウェルについて、合計800ngのプラスミドを使用した。
【0468】
ゲノム改変についてのSurveyorアッセイおよびシーケンシング分析
HEK293FTまたはN2A細胞を、上記プラスミドDNAにより形質移入した。形質移入後、細胞を37℃において72時間インキュベートしてからゲノムDNAを抽出した。ゲノムDNAは、QuickExtractDNA抽出キット(Epicentre)を製造業者のプロトコルに従って使用して抽出した。手短に述べると、細胞をQuickExtract溶液中で再懸濁させ、65℃において15分間および98℃において10分間インキュベートした。抽出されたゲノムDNAを直ちに処理または−20℃において貯蔵した。
【0469】
それぞれの遺伝子についてのCRISPR標的部位周囲のゲノム領域をPCR増幅し、QiaQuick Spin Column(Qiagen)を製造業者のプロトコルに従って使用して産物を精製した。合計400ngの精製PCR産物を2μlの10×TaqポリメラーゼPCR緩衝液(Enzymatics)と混合し、超純水で20μlの最終容量とし、リアニーリングプロセスに供してヘテロ二本鎖形成を可能とした:95℃において10分間、−2℃/秒における傾斜で95℃から85℃、−0.25℃/秒における85℃から25℃、および25℃において1分間維持。リアニーリング後、産物をSurveyorヌクレアーゼおよびSurveyorエンハンサーS(Transgenomics)により製造業者の推奨プロトコルに従って処理し、4〜20%のNovex TBEポリアクリルアミドゲル(Life Technologies)上で分析した。ゲルをSYBR Gold DNA染色(Life Technologies)により30分間染色し、Gel Docゲルイメージングシステム(Bio−rad)によりイメージングした。定量は、開裂したDNAの率の尺度としての相対バンド強度に基づくものであった。
図8は、このSurveyorアッセイの模式的説明を提供する。
【0470】
相同組換えの検出のための制限断片長多型アッセイ
HEK293FTおよびN2A細胞を、プラスミドDNAにより形質移入し、37℃において72時間インキュベートしてから上記のとおりゲノムDNAを抽出した。相同組換え(HR)テンプレートのホモロジーアーム外側のプライマーを使用して標的ゲノム領域をPCR増幅した。PCR産物を1%のアガロースゲル上で分離し、MinElute GelExtraction Kit(Qiagen)により抽出した。精製産物をHindIII(Fermentas)により消化し、6%のNovex TBEポリアクリルアミドゲル(Life Technologies)上で分析した。
【0471】
RNA二次構造予測および分析
RNA二次構造予測は、Institute for Theoretical Chemistry at the University of Viennaにおいて開発されたオンラインウェブサーバーRNAfoldを使用し、セントロイド構造予測アルゴリズムを使用して実施した(例えば、A.R.Gruber et al.,2008,Cell 106(1):23−24;およびPA Carr and GM Church,2009,Nature Biotechnology 27(12):1151−62参照)。
【0472】
RNA精製
HEK293FT細胞を上記のとおり維持および形質移入した。細胞をトリプシン処理により回収し、次いでリン酸緩衝生理食塩水(PBS)中で洗浄した。トータル細胞RNAをTRI試薬(Sigma)により製造業者のプロトコルに従って抽出した。抽出されたトータルRNAをNaonodrop(Thermo Scientific)を使用して定量し、同一濃度に正規化した。
【0473】
哺乳動物細胞中のcrRNAおよびtracrRNA発現のノザンブロット分析
RNAを等容量の2×ローディング緩衝液(Ambion)と混合し、95℃に5分間加熱し、氷上で1分間冷蔵し、次いで8%の変性ポリアクリルアミドゲル(SequaGel,National Diagnostics)上に、少なくとも30分間のゲルのプレラン後にロードした。試料を40W限界において1.5時間電気泳動した。その後、RNAをHybond N+メンブレン(GE Healthcare)に300mAにおいてセミドライ転写装置(Bio−rad)中で室温において1.5時間転写した。Stratagene UV CrosslinkerのStratalinker(Stratagene)上のオートクロスリンクボタンを使用してRNAをメンブレンに架橋させた。メンブレンをULTRAhyb−オリゴハイブリダイゼーション緩衝液(Ambion)中で回転させながら42℃において30分間プレハイブリダイズさせ、次いでプローブを添加し、一晩ハイブリダイズさせた。プローブはIDTに発注し、T4ポリヌクレオチドキナーゼ(New England Biolabs)を用いて[ガンマ−
32P]ATP(Perkin Elmer)により標識した。メンブレンを予備加温(42℃)された2×SSC、0.5%のSDSにより1分間1回洗浄し、次いで42℃において30分間2回洗浄した。メンブレンを蛍光スクリーンに室温において1時間または一晩曝露させ、次いでphosphorimager(Typhoon)によりスキャンした。
【0474】
細菌CRISPR系構築および評価
tracrRNA、Cas9、およびリーダーを含むCRISPR遺伝子座エレメントを、化膿連鎖球菌(Streptococcus pyogenes)SF370ゲノムDNAから、ギブソン・アセンブリ(Gibson Assembly)のためのフランキングホモロジーアームを用いてPCR増幅した。2つのBsaI IIS型部位を2つのダイレクトリピート間に導入してスペーサーの容易な挿入を促進した(
図8)。Gibson Assembly Master Mix(NEB)を使用してPCR産物をEcoRV消化pACYC184中にtetプロモーターの下流でクローニングした。Csn2の最後の50bpは除き、他の内因性CRISPR系エレメントは除外した。相補的オーバーハングを有するスペーサーをコードするオリゴ(Integrated DNA Technology)をBsaI消化ベクターpDC000(NEB)中にクローニングし、次いでT7リガーゼ(Enzymatics)によりライゲートしてpCRISPRプラスミドを生成した。PAM配列(本明細書において「CRISPRモチーフ配列」とも称される)を有するスペーサーを含有するチャレンジプラスミドを、同等のオーバーハングを担持するハイブリダイズされたオリゴ(Integrated DNA Technology)をBamHI消化pUC19中にライゲートすることにより創成した。全ての構築物のためのクローニングは、大腸菌(E.coli)株JM109(Zymo Research)中で実施した。PAMを有するスペーサーを含有するチャレンジプラスミド
【0475】
哺乳動物細胞中の発現のために選択した(
図6Aに説明される発現構築物、
図6Bに示されるSurveyorアッセイの結果により決定された機能性を有する)。転写開始部位を+1として標識し、転写ターミネーターおよびノザンブロットによりプロ―ビングされる配列も示す。プロセシングされたtracrRNAの発現もノザンブロットにより確認した。
図6Cは、長鎖または短鎖tracrRNA、ならびにSpCas9およびDR−EMX1(1)−DRを担持するU6発現構築物により形質移入された293FT細胞から抽出されたトータルRNAのノザンブロット分析の結果を示す。左および右側のパネルは、それぞれSpRNアーゼIIIを用いず、または用いて形質移入された293FT細胞からのものである。U6は、ヒトU6snRNAをターゲティングするプローブによりブロットされたローディング対照を示す。短鎖tracrRNA発現構築物の形質移入は、十分なレベルのプロセシング形態のtracrRNA(約75bp)をもたらした。極めて少量の長鎖tracrRNAがノザンブロット上で検出される。
【0476】
正確な転写開始を促進するため、RNAポリメラーゼIIIベースU6プロモーターを選択してtracrRNAの発現をドライブした(
図2C)。同様に、U6プロモーターベース構築物を開発して2つのダイレクトリピート(DR、用語「tracrメイト配列」にも包含される;
図2C)によりフランキングされている単一スペーサーからなるプレcrRNAアレイを発現させた。最初のスペーサーは、大脳皮質の発達におけるキー遺伝子であるヒトEMX1遺伝子座中の33塩基対(bp)標的部位(30bpのプロトスペーサーと、Cas9のNGG認識モチーフを満たす3bpのCRISPRモチーフ(PAM)配列)をターゲティングするように設計した(
図2C)。
【0477】
哺乳動物細胞中のCRISPR系(SpCas9、SpRNアーゼIII、tracrRNA、およびプレcrRNA)の異種発現がターゲティングされる哺乳動物染色体の開裂を達成し得るか否かを試験するため、HEK293FT細胞をCRISPR成分の組合せにより形質移入した。哺乳動物核中のDSBは部分的には、インデルの形成をもたらす非相同末端結合(NHEJ)経路により修復されるため、Surveyorアッセイを使用して標的EMX1遺伝子座における潜在的な開裂活性を検出した(
図7)(例えば、Guschin et al.,2010,Methods Mol Biol 649:247参照)。4つ全てのCRISPR成分の同時形質移入は、プロトスペーサーの最大5.0%の開裂を誘導し得た(
図2D参照)。SpRNアーゼIIIを除く全てのCRISPR成分の同時形質移入も、プロトスペーサーの最大4.7%のインデルを誘導し、このことはcrRNA成熟を支援し得る内因性哺乳動物RNアーゼ、例えば、関連DicerおよびDrosha酵素などが存在し得ることを示唆した。残り3つの成分のいずれかを除去すると、CRISPR系のゲノム開裂活性は停止する(
図2D)。標的遺伝子座を含有するアンプリコンのサンガーシーケンシングにより開裂活性を確認し;43個のシーケンシングされたクローンのうち5つの突然変異アレル(11.6%)が見出された。種々のガイド配列を使用する同様の実験は、29%と高いインデル割合を生じさせた(
図3〜6、10、および11参照)。これらの結果は、哺乳動物細胞中の効率的なCRISPR媒介ゲノム改変のための3成分系を定義する。開裂効率を最適化するため、本出願人らは、tracrRNAの異なるアイソフォームが開裂効率に影響するか否かも試験し、この例示的系において、短鎖(89bp)転写物形態のみがヒトEMX1ゲノム遺伝子座の開裂を媒介し得ることを見出した(
図6B)。
【0478】
図12は、哺乳動物細胞中のcrRNAプロセシングの追加のノザンブロット分析を提供する。
図12Aは、2つのダイレクトリピートによりフランキングされている単一スペーサー(DR−EMX1(1)−DR)についての発現ベクターを示す模式図を説明する。ヒトEMX1遺伝子座プロトスペーサー1をターゲティングする30bpのスペーサー(
図6参照)およびダイレクトリピート配列を、
図12Aの下方の配列中に示す。線は、逆相補配列を使用してEMX1(1)crRNA検出のためのノザンブロットプローブを生成する領域を示す。
図12Bは、DR−EMX1(1)−DRを担持するU6発現構築物により形質移入された293FT細胞から抽出されたトータルRNAのノザンブロット分析を示す。左および右側のパネルは、それぞれSpRNアーゼIIIを用いず、または用いて形質移入された293FT細胞からのものである。DR−EMX1(1)−DRは、SpCas9が存在する場合のみ成熟crRNAにプロセシングされ、短鎖tracrRNAはSpRNアーゼIIIの存在に依存的でなかった。形質移入293FTトータルRNAから検出された成熟crRNAは、約33bpであり、化膿連鎖球菌(S.pyogenes)からの39〜42bpの成熟crRNAよりも短かった。これらの結果は、CRISPR系を真核細胞中に移植し、リプログラミングして内因性哺乳動物標的ポリヌクレオチドの開裂を促進することができることを実証する。
【0479】
図2は、本実施例に記載の細菌CRISPR系を説明する。
図2Aは、化膿連鎖球菌(Streptococcus pyogenes)SF370からのCRISPR遺伝子座1およびこの系によるCRISPR媒介DNA開裂の提案される機序を示す模式図を説明する。ダイレクトリピート−スペーサーアレイからプロセシングされた成熟crRNAは、Cas9を、相補的プロトスペーサーおよびプロトスペーサー隣接モチーフ(PAM)からなるゲノム標的に指向する。標的−スペーサー塩基対形成時、Cas9は標的DNA中の二本鎖切断を媒介する。
図2Bは、化膿連鎖球菌(S.pyogenes)Cas9(SpCas9)およびRNアーゼIII(SpRNアーゼIII)の、哺乳動物核中への輸送を可能とするための核局在化シグナル(NLS)によるエンジニアリングを説明する。
図2Cは、構成的EF1aプロモーターによりドライブされるSpCas9およびSpRNアーゼIIIならびに正確な転写開始および終結を促進するためのRNAPol3プロモーターU6によりドライブされるtracrRNAおよびプレcrRNAアレイ(DR−スペーサー−DR)の哺乳動物発現を説明する。十分なPAM配列を有するヒトEMX1遺伝子座からのプロトスペーサーを、プレcrRNAアレイ中のスペーサーとして使用する。
図2Dは、SpCas9媒介少数挿入および欠失についてのsurveyorヌクレアーゼアッセイを説明する。SpCas9を、SpRNアーゼIII、tracrRNA、およびEMX1標的スペーサーを担持するプレcrRNAアレイを用いてまたは用いずに発現させた。
図2Eは、標的遺伝子座とEMX1ターゲティングcrRNAとの間の塩基対形成の模式的表示、ならびにSpCas9開裂部位に隣接する微小欠失を示す例示的クロマトグラムを説明する。
図2Fは、種々の微小挿入および欠失を示す43個のクローンアンプリコンのシーケンシング分析から同定された突然変異アレルを説明する。点線は、欠失塩基を示し、アラインされず、またはミスマッチの塩基は挿入または突然変異を示す。スケールバー=10μm。
【0480】
3成分系をさらに簡略化するため、ステム−ループを介して成熟crRNA(ガイド配列を含む)を部分tracrRNAに融合させて天然crRNA:tracrRNA二本鎖を模倣するキメラcrRNA−tracrRNAハイブリッド設計を適応させた。同時送達効率を増加させるため、形質移入細胞中のキメラRNAおよびSpCas9の同時発現をドライブするバイシストロニック発現ベクターを創成した。並行して、バイシストロニックベクターを使用してプレcrRNA(DR−ガイド配列−DR)をSpCas9とともに発現させてcrRNAへのプロセシングを誘導し、tracrRNAを別個に発現させた(
図11Bの上図および下図を比較)。
図8は、hSpCas9を有するプレcrRNAアレイ(
図8A)またはキメラcrRNA(
図8B中のガイド配列挿入部位の下流およびEF1αプロモーターの上流の短い線により表わされる)のためのバイシストロニック発現ベクターの模式的説明を提供し、種々のエレメントの局在およびガイド配列挿入の場所を示す。
図8B中のガイド配列挿入部位の局在周囲の拡大された配列は、部分DR配列(GTTTAGAGCTA)および部分tracrRNA配列(TAGCAAGTTAAAATAAGGCTAGTCCGTTTTT)も示す。ガイド配列は、アニールされたオリゴヌクレオチドを使用してBbsI部位間に挿入することができる。オリゴヌクレオチドについての配列設計を
図8の模式的説明の下方に示し、適切なライゲーションアダプターを示す。WPREは、ウッドチャック肝炎ウイルス転写後調節エレメントを表す。キメラRNA媒介開裂の効率を、上記の同一のEMX1遺伝子座をターゲティングすることにより試験した。Surveyorアッセイおよびアンプリコンのサンガーシーケンシングの両方を使用して、本出願人らは、キメラRNA設計がヒトEMX1遺伝子座の開裂を約4.7%の改変比率で促進することを確認した(
図3)。
【0481】
真核細胞中のCRISPR媒介開裂の一般化可能性を、ヒトEMX1およびPVALB、ならびにマウスTh遺伝子座中の複数部位をターゲティングするキメラRNAを設計することによりヒトおよびマウス細胞の両方において追加のゲノム遺伝子座をターゲティングすることにより試験した。
図13は、いくつかの追加のターゲティングされるヒトPVALB(
図13A)およびマウスTh(
図13B)遺伝子座中のプロトスペーサーの選択を説明する。遺伝子座およびそれぞれの最後のエクソン内の3つのプロトスペーサーの局在の模式図を提供する。下線付き配列は、30bpのプロトスペーサー配列およびPAM配列に対応する3’末端における3bpを含む。センスおよびアンチセンス鎖上のプロトスペーサーを、それぞれDNA配列の上方および下方に示す。ヒトPVALBおよびマウスTh遺伝子座についてそれぞれ6.3%および0.75%の改変比率が達成され、このことは複数の生物にわたる異なる遺伝子座の改変におけるCRISPR系の幅広い適用可能性を実証した(
図5)。開裂はキメラ構築物を使用してそれぞれの遺伝子座について3つのスペーサーのうち1つについてのみ検出された一方、同時発現されるプレcrRNA配置を使用した場合、全ての標的配列が27%に達するインデル生成の効率で開裂された(
図6および13)。
【0482】
図11は、SpCas9をリプログラミングして哺乳動物細胞中の複数のゲノム遺伝子座をターゲティングすることができることのさらなる説明を提供する。
図11Aは、下線付き配列により示される5つのプロトスペーサーの局在を示すヒトEMX1遺伝子座の模式図を提供する。
図11Bは、プレcrRNAおよびtracrRNAのダイレクトリピート領域間のハイブリダイゼーションを示すプレcrRNA/trcrRNA複合体の模式図(上図)および20bpのガイド配列、ならびにヘアピン構造にハイブリダイズしている部分ダイレクトリピートおよびtracrRNA配列からなるtracrメイトおよびtracr配列を含むキメラRNA設計の模式図(下図)を提供する。ヒトEMX1遺伝子座中の5つのプロトスペーサーにおけるCas9媒介開裂の効力を比較するSurveyorアッセイの結果を、
図11Cに説明する。プロセシングされたプレcrRNA/tracrRNA複合体(crRNA)またはキメラRNA(chiRNA)のいずれかを使用してそれぞれのプロトスペーサーをターゲティングする。
【0483】
RNAの二次構造は分子間相互作用に重要であり得るため、最小自由エネルギーおよびボルツマン加重構造アンサンブルに基づく構造予測アルゴリズムを使用してゲノムターゲティング実験に使用される全てのガイド配列の推定二次構造を比較した(例えば、Gruber et al.,2008,Nucleic Acids Research,36:W70参照)。分析により、ほとんどの場合、キメラcrRNAコンテクスト中の有効なガイド配列は二次構造モチーフを実質的に含まない一方、無効なガイド配列は標的プロトスペーサーDNAとの塩基対形成を妨害し得る内部二次構造を形成する可能性がより高いことが明らかになった。したがって、スペーサー二次構造の変動性は、キメラcrRNAを使用する場合にCRISPR媒介干渉の効率に影響し得ることが考えられる。
【0484】
SpCas9のためのさらなるベクター設計を
図22に示し、それはガイドオリゴのための挿入部位に結合しているU6プロモーター、およびSpCas9コード配列に結合しているCbhプロモーターを取り込む単一発現ベクターを説明する。
図22bに示されるベクターは、H1プロモーターに結合しているtracrRNAコード配列を含む。
【0485】
細菌アッセイでは、全てのスペーサーが効率的なCRISPR干渉を促進した(
図3C)。これらの結果は、哺乳類細胞におけるCRISPR活性の効率に影響を与えるさらなる因子が存在し得ることを示唆している。
【0486】
CRISPR媒介開裂の特異性を調査するため、哺乳動物ゲノム中のプロトスペーサー開裂に対するガイド配列中の単一ヌクレオチド突然変異の効果を、単一点突然変異を有する一連のEMX1ターゲティングキメラcrRNAを使用して分析した(
図3A)。
図3Bは、異なる突然変異体キメラRNAと対形成した場合のCas9の開裂効率を比較するSurveyorヌクレアーゼアッセイの結果を説明する。PAMの5’側の最大12bpの単一塩基ミスマッチは、SpCas9によるゲノム開裂を実質的に停止させた一方、さらなる上流位置に突然変異を有するスペーサーは元のプロトスペーサー標的に対する活性を保持した(
図3B)。PAMの他、SpCas9は、スペーサーの最後の12bp内の単一塩基特異性を有する。さらに、CRISPRは、同一EMX1プロトスペーサーをターゲティングするTALEヌクレアーゼ(TALEN)のペアと同程度に効率的にゲノム開裂を媒介し得る。
図3Cは、EMX1をターゲティングするTALENの設計を示す模式図を提供し、
図3Dは、TALENおよびCas9の効率を比較するSurveyorゲルを示す(n=3)。
【0487】
エラープローンNHEJ機序を通した哺乳動物細胞中のCRISPR媒介遺伝子編集を達成するための成分のセットを樹立したため、相同組換え(HR)、ゲノム中の正確な編集を作製するための高フィデリティ遺伝子修復経路を刺激するCRISPRの能力を試験した。野生型SpCas9は、NHEJおよびHRの両方を通して修復され得る部位特異的DSBを媒介し得る。さらに、SpCas9のRuvC I触媒ドメイン中のアスパラギン酸からアラニンへの置換(D10A)をエンジニアリングしてヌクレアーゼをニッカーゼに変換し(SpCas9n;
図4Aに説明)(例えば、Sapranausaks et al.,2011,Nucleic Acids Research,39:9275;Gasiunas et al.,2012,Proc.Natl.Acad.Sci.USA,109:E2579参照)、その結果、ニック形成されたゲノムDNAが高フィデリティ相同性組換え修復(HDR)を受ける。Surveyorアッセイにより、SpCas9nはEMX1プロトスペーサー標的におけるインデルを生成しないことを確認した。
図4Bに説明されるとおり、EMX1ターゲティングキメラcrRNAとSpCas9との同時発現は標的部位中のインデルを生じさせた一方、SpCas9nとの同時発現は生じさせなかった(n=3)。さらに、327個のアンプリコンのシーケンシングは、SpCas9nにより誘導されるいかなるインデルも検出しなかった。同一の遺伝子座を選択し、HEK293FT細胞をEMX1をターゲティングするキメラRNA、hSpCas9またはhSpCas9n、およびプロトスペーサー付近に制限部位のペア(HindIIIおよびNheI)を導入するためのHRテンプレートにより同時形質移入することによりCRISPR媒介HRを試験した。
図4Cは、HR方針の模式的説明を、組換え場所の相対局在およびプライマーアニーリング配列(矢印)とともに提供する。SpCas9およびSpCas9nは、実際、EMX1遺伝子中へのHRテンプレートのインテグレーションを触媒した。標的領域のPCR増幅とそれに続くHindIIIによる制限消化により、予測断片サイズ(
図4Dに示される制限断片長多型ゲル分析中の矢印)に対応する開裂産物が明らかになり、SpCas9およびSpCas9nは類似レベルのHR効率を媒介した。本出願人らは、ゲノムアンプリコンのサンガーシーケンシングを使用してHRをさらに確認した(
図4E)。これらの結果は、哺乳動物ゲノム中のターゲティングされる遺伝子挿入を促進するためのCRISPRの有用性を実証する。野生型SpCas9の14bp(スペーサーからの12bpおよびPAMからの2bp)の標的特異性を考慮すると、ニッカーゼの利用可能性は、一本鎖分解物がエラープローンNHEJ経路のための基質でないため、オフターゲット改変の可能性を顕著に低減させ得る。
【0488】
アレイスペーサーを有するCRISPR遺伝子座の天然アーキテクチャーを模倣する発現構築物(
図2A)を構築して多重化配列ターゲティングの可能性を試験した。EMX1およびPVALBターゲティングスペーサーのペアをコードする単一のCRISPRアレイを使用して、両方の遺伝子座における効率的な開裂が検出された(
図4F、crRNAアレイの模式的設計および開裂の効率的な媒介を示すSurveyorブロットの両方を示す)。119bpにより間隔が空いているEMX1内の2つの標的に対するスペーサーを使用する同時DSBを通したより大きいゲノム領域のターゲティングされる欠失も試験し、1.6%の欠失効力(182個のアンプリコンのうち3つ;
図4G)が検出された。このことは、CRISPR系が単一ゲノム内の多重化編集を媒介し得ることを実証する。
【0489】
実施例2:CRISPR系改変および代替例
配列特異的DNA開裂をプログラミングするためにRNAを使用する技能は、種々の研究および産業用途のための新たなクラスのゲノムエンジニアリングツールを定義する。CRISPR系のいくつかの態様は、CRISPRターゲティングの効率および多用途性を増加させるようにさらに改善することができる。最適なCas9活性は、哺乳動物核中に存在するものよりも高いレベルにおけるフリーMg
2+の利用可能性に依存し得(例えば、Jinek et al.,2012,Science,337:816参照)、プロトスペーサーのすぐ下流のNGGモチーフについての優先性は、ヒトゲノム中で平均12bpごとでターゲティング能を制限する(
図9、ヒト染色体配列のプラスおよびマイナス鎖の両方を評価)。これらの拘束の一部は、微生物メタゲノムにわたるCRISPR遺伝子座の多様性を利用することにより克服することができる(例えば、Makarova et al.,2011,Nat Rev Microbiol,9:467参照)。他のCRISPR遺伝子座を、実施例1に記載のものと同様の方法により哺乳動物細胞環境中に移植することができる。例えば、
図10は、CRISPR媒介ゲノム編集を達成するための哺乳動物細胞中の異種発現のためのサーモフィラス菌(Streptococcus thermophilus)LMD−9のCRISPR1からのII型CRISPR系の適応を説明する。
図10Aは、サーモフィラス菌(S.thermophilus)LMD−9のCRISPR1の模式的説明を提供する。
図10Bは、サーモフィラス菌(S.thermophilus)CRISPR系のための発現系の設計を説明する。ヒトコドン最適化hStCas9を、構成的EF1αプロモーターを使用して発現させる。tracrRNAおよびcrRNAの成熟バージョンを、U6プロモーターを使用して発現させて正確な転写開始を促進する。成熟crRNAおよびtracrRNAからの配列を説明する。crRNA配列中の小文字「a」により示される単一塩基を使用してRNApolIII転写ターミネーターとして機能するポリU配列を除去する。
図10Cは、ヒトEMX1遺伝子座ターゲティングするガイド配列を示す模式図を提供する。
図10Dは、Surveyorアッセイを使用する標的遺伝子座中のhStCas9媒介開裂の結果を示す。RNAガイドスペーサー1および2は、それぞれ14%および6.4%を誘導した。これらの2つのプロトスペーサー部位における生物学的複製物にわたる開裂活性の統計分析も
図5に提供する。
図14は、ヒトEMX1遺伝子座中のサーモフィラス菌(S.thermophilus)CRISPR系の追加のプロトスペーサーおよび対応するPAM配列標的の模式図を提供する。2つのプロトスペーサー配列を強調し、NNAGAAWモチーフを満たすそれらの対応するPAM配列を対応する強調配列に対して3’側で下線を付けることにより示す。両方のプロトスペーサーは、アンチセンス鎖をターゲティングする。
【0490】
実施例3:試料標的配列選択アルゴリズム
規定のCRISPR酵素についての所望のガイド配列長およびCRISPRモチーフ配列(PAM)に基づきインプットDNA配列の両方の鎖上の候補CRISPR標的配列を同定するためのソフトウェアプログラムを設計する。例えば、化膿連鎖球菌(S.pyogenes)からのCas9についての標的部位は、PAM配列NGGを用いて、インプット配列およびインプットの逆相補鎖の両方の上の5’−N
x−NGG−3’を探索することにより同定することができる。同様に、サーモフィラス菌(S.thermophilus)CRISPR1のCas9についての標的部位は、PAM配列NNAGAAWを用いて、インプット配列およびインプットの逆相補鎖の両方の上の5’−N
x−NNAGAAW−3’を探索することにより同定することができる。同様に、サーモフィラス菌(S.thermophilus)CRISPR3のCas9についての標的部位は、PAM配列NGGNGを用いて、インプット配列およびインプットの逆相補鎖の両方の上の5’−N
x−NGGNG−3’を探索することにより同定することができる。N
x中の値「x」は、プログラムにより固定し、または使用者により規定することができ、例えば、20である。
【0491】
DNA標的部位のゲノム中の複数の発生は、非特異的ゲノム編集をもたらし得るため、全ての潜在的な部位を同定した後、プログラムは配列が関連参照ゲノム中で出現する回数に基づき配列をフィルタリング除去する。配列特異性が「シード」配列、例えば、PAM配列自体を含め、PAM配列から5’側の11〜12bpにより決定されるそれらのCRISPR酵素について、フィルタリングステップはシード配列に基づき得る。したがって、追加のゲノム遺伝子座における編集を回避するため、結果を関連ゲノム中のシード:PAM配列の発生数に基づきフィルタリングする。使用者に、シード配列の長さを選択させることができる。使用者に、フィルタ通過の目的のためにゲノム中のシード:PAM配列の発生数を規定させることもできる。デフォルトは、ユニーク配列をスクリーニングすることである。フィルトレーションレベルは、シード配列の長さおよびゲノム中の配列の発生数の両方を変えることにより変更する。プログラムは、さらにまたは代替的に、同定された標的配列の逆相補鎖を提供することにより、報告された標的配列に相補的なガイド配列の配列を提供し得る。
【0492】
配列選択を最適化する方法およびアルゴリズムのさらなる詳細は、参照により本明細書に組み込まれる米国特許出願第61/064,798号明細書(代理人整理番号44790.11.2022;Broad参照番号BI−2012/084)に見出すことができる。
【0493】
実施例4:複数のキメラcrRNA−tracrRNAハイブリッドの評価
本実施例は、異なる長さの野生型tracrRNA配列を取り込むtracr配列を有するキメラRNA(chiRNA;ガイド配列、tracrメイト配列、およびtracr配列を単一転写物中で含む)について得られた結果を記載する。
図16aは、キメラRNAおよびCas9のためのバイシストロニック発現ベクターの模式図を説明する。Cas9はCBhプロモーターによりドライブされ、キメラRNAはU6プロモーターによりドライブされる。キメラガイドRNAは、からなる。示される種々の位置においてトランケートされたtracr配列(下方の鎖の最初の「U」から転写物の末端に及ぶ)に結合している20bpのガイド配列(N)からなる。ガイドおよびtracr配列は、tracrメイト配列GUUUUAGAGCUAと、それに続くループ配列GAAAにより離隔している。ヒト遺伝子座EMX1およびPVALB遺伝子座におけるCas9媒介インデルについてのSURVEYORアッセイの結果を、それぞれ
図16bおよび16cに説明する。矢印は、予測SURVEYOR断片を示す。chiRNAをそれらの「+n」表記により示し、crRNAは、ガイドおよびtracr配列が別個の転写物として発現されるハイブリッドRNAを指す。トリプリケートで実施されたこれらの結果の定量を、
図17aおよび17bにヒストグラムにより示し、それぞれ
図16bおよび16cに対応する(「N.D.」は、インデルが検出されなかったことを示す)。プロトスペーサーIDおよびそれらの対応するゲノム標的、プロトスペーサー配列、PAM配列、および鎖局在を表Dに提供する。ガイド配列は、ハイブリッド系における別個の転写物の場合、プロトスペーサー配列全体に相補的であるように、またはキメラRNAの場合、下線部にのみ相補的であるように設計した。
【0494】
【表24】
[この文献は図面を表示できません]
【0495】
ガイド配列を最適化するためのさらなる詳細は、米国仮特許出願第61/836,127号明細書(代理人整理番号44790.08.2022;Broad参照番号BI−2013/004G)(参照により本明細書に組み込まれる)を参照することができる。
【0496】
最初に、ヒトHEK293FT細胞中のEMX1遺伝子座内の3つの部位をターゲティングした。それぞれのchiRNAのゲノム改変効率は、DNA二本鎖切断(DSB)および非相同末端結合(NHEJ)DNA損傷修復経路によるその後続の修復から生じる突然変異を検出するSURVEYORヌクレアーゼアッセイを使用して評価した。chiRNA(+n)と表記される構築物は、野生型tracrRNAの最大+n個のヌクレオチドがキメラRNA構築物中に含まれることを示し、nについては48、54、67、および85の値が使用される。野生型tracrRNAのより長い断片を含有するキメラRNA(chiRNA(+67)およびchiRNA(+85))は、3つ全てのEMX1標的部位におけるDNA開裂を媒介し、特にchiRNA(+85)は、ガイドおよびtracr配列を別個の転写物中で発現する対応するcrRNA/tracrRNAハイブリッドよりも顕著に高いレベルのDNA開裂を実証した(
図16bおよび17a)。ハイブリッド系(別個の転写物として発現されるガイド配列およびtracr配列)を検出可能な開裂を生じなかったPVALB遺伝子座中の2つの部位も、chiRNAを使用してターゲティングした。chiRNA(+67)およびchiRNA(+85)は、2つのPVALBプロトスペーサーにおける顕著な開裂を媒介し得た(
図16cおよび17b)。EMX1およびPVALB遺伝子座中の5つ全ての標的について、tracr配列長さの増加に伴うゲノム改変効率の一貫した増加が観察された。いかなる理論によっても拘束されるものではないが、tracrRNAの3’末端により形成される二次構造は、CRISPR複合体形成の比率の向上における役割を担い得る。
【0497】
実施例5:Cas9多様性
CRISPR−Cas系は、細菌から古細菌にわたる多様な種により用いられる侵入外因性DNAに対する適応免疫機序である。II型CRISPR−Cas9系は、CRISPR遺伝子座中への外来DNAの「獲得」を担うタンパク質をコードする遺伝子のセット、およびDNA開裂機序の「実行」をコードする遺伝子のセットからなり;これらは、DNAヌクレアーゼ(Cas9)、非コードトランス活性化crRNA(tracrRNA)、およびダイレクトリピートによりフランキングされている外来DNA由来スペーサーのアレイ(crRNA)を含む。Cas9による成熟時、tracRNAおよびcrRNA二本鎖は、Cas9ヌクレアーゼをスペーサーガイド配列により規定される標的DNA配列にガイドし、開裂に要求され、それぞれのCRISPR−Cas系に特異的な標的DNA中の短鎖配列モチーフ付近のDNAの二本鎖切断を媒介する。II型CRISPR−Cas系は、細菌界全体にわたり見出されており、Cas9タンパク質配列およびサイズ、tracrRNAおよびcrRNAダイレクトリピート配列、それらのエレメントのゲノム構成、および標的開裂のためのモチーフ要件は高度に多様である。ある種は、複数の区別されるCRISPR−Cas系を有し得る。
【0498】
本出願人らは、公知のCas9との配列相同性および公知のサブドメイン、例として、HNHエンドヌクレアーゼドメインおよびRuvCエンドヌクレアーゼドメイン[Eugene KooninおよびKira Makarovaからの情報]とオルソロガスな構造に基づき同定された細菌種から207個の推定Cas9を評価した。このセットのタンパク質配列保存に基づく系統発生分析により、大型Cas9(約1400アミノ酸)の3つの群および小型Cas9(約1100アミノ酸)の2つの群を含むCas9の5つのファミリーが明らかになった(
図19および20A〜F)。
【0499】
Cas9およびニッカーゼまたはDNA結合タンパク質に転換するCas9酵素の突然変異および変化した機能を有するそれの使用のさらなる詳細は、米国仮特許出願第61/836,101号明細書および同第61/835,936号明細書(それぞれ代理人整理番号44790.09.2022および4790.07.2022およびBroad参照番号BI−2013/004EおよびBI−2013/004F)(参照により本明細書に組み込まれる)を参照することができる。
【0500】
実施例6:Cas9オルソログ
本出願人らは、関連性のあるPAM配列および対応するキメラガイドRNAを同定するためCas9オルソログを分析した。拡張したPAMセットを有することにより、全ゲノムにわたるより幅広いターゲティングが提供され、またユニークな標的部位の数が大幅に増加し、かつゲノムにおいて高い特異性レベルで新規Cas9を同定できる可能性がもたらされる。
【0501】
Cas9オルソログの特異性は、各Cas9がガイドRNAとそのDNA標的との間のミスマッチを許容する能力を試験することにより評価し得る。例えば、ガイドRNAにおける突然変異が開裂効率に及ぼす効果を試験することにより、SpCas9の特異性が特徴付けられている。ガイド配列と標的DNAとの間の単一または複数のミスマッチを含むガイドRNAのライブラリが作製された。これらの知見に基づき、以下の指針に基づきSpCas9の標的部位を選択することができる:
【0502】
特定の遺伝子の編集に対するSpCas9の特異性を最大化するため、目的の遺伝子座内の標的部位は、潜在的な「オフターゲット」ゲノム配列が以下の4つの制約条件に従うように選択しなければならない:まず第一に、それらの配列の後に5’−NGGまたはNAG配列のいずれかを有するPAMが続いてはならない。第二に、標的配列とのそれらの配列の大域的な配列類似性が最小化されなければならない。第三に、最大数のミスマッチがPAM−オフターゲット部位の近位領域内になければならない。最後に、最大数のミスマッチが連続しているかまたは離れていても4塩基未満でなければならない。
【0503】
同様の方法を用いて他のCas9オルソログの特異性を評価し、標的種のゲノム内にある特定の標的部位を選択するための基準を確立することができる。既述のとおり、このセットのタンパク質配列保存に基づく系統発生解析から、3群の大型Cas9(約1400アミノ酸)および2群の小型Cas9(約1100アミノ酸)を含む5つのCas9ファミリーが明らかとなった(
図19および
図20A〜
図20Fを参照)。Casオルソログに関するさらなる詳細は、参照により本明細書に組み込まれる米国仮特許出願第61/836,101号明細書および同第61/835,936号明細書(それぞれ代理人整理番号44790.09.2022および4790.07.2022およびBroad参照番号BI−2013/004EおよびBI−2013/004F)を参照することができる。
【0504】
実施例7:植物遺伝子を標的化および操作するためにCas9を使用する植物(微細藻類)のエンジニアリング
Cas9を送達する方法
方法1:本出願人らは、構成的プロモーター、例えば、Hsp70A−Rbc S2またはベータ2−チューブリンの制御下でCas9を発現するベクターを使用してCas9およびガイドRNAを送達する。
【0505】
方法2:本出願人らは、構成的プロモーター、例えば、Hsp70A−Rbc S2またはベータ2−チューブリンの制御下でCas9およびT7ポリメラーゼを発現するベクターを使用してCas9およびT7ポリメラーゼを送達する。ガイドRNAは、ガイドRNAをドライブするT7プロモーターを含有するベクターを使用して送達する。
【0506】
方法3:本出願人らは、Cas9mRNAおよびインビトロで転写されたガイドRNAを藻類細胞に送達する。RNAは、インビトロで転写させることができる。Cas9mRNAは、Cas9についてのコード領域およびCas9mRNAの安定化を確保するためのCop1からの3’UTRからなる。
【0507】
相同組換えのため、本出願人らは、追加の相同組換え修復テンプレートを提供する。
【0508】
ベータ−2チューブリンプロモーターの制御下でCas9の発現をドライブするカセットと、それに続くCop1の3’UTRについての配列。
【化2】
[この文献は図面を表示できません]
【化3】
[この文献は図面を表示できません]
【化4】
[この文献は図面を表示できません]
【0509】
ベータ−2チューブリンプロモーターの制御下でT7ポリメラーゼの発現をドライブするカセットと、それに続くCop1の3’UTRについての配列:
【化5】
[この文献は図面を表示できません]
【化6】
[この文献は図面を表示できません]
【0510】
T7プロモーターによりドライブされるガイドRNAの配列(T7プロモーター、Nは、ターゲティング配列を表す):
gaaatTAATACGACTCACTATANNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt
【0511】
遺伝子送達:
Chlamydomonas Resource Centerからのコナミドリムシ(Chlamydomonas reinhardtii)株CC−124およびCC−125を、エレクトロポレーションに使用する。エレクトロポレーションプロトコルは、GeneArt Chlamydomonas Engineeringキットからの標準的な推奨プロトコルに従う。
【0512】
また、本出願人らは、Cas9を構成的に発現するコナミドリムシ(Chlamydomonas reinhardtii)の系統を生成する。このことは、pChlamy1(PvuIを使用して線形化)を使用し、ハイグロマイシン耐性コロニーを選択することにより行うことができる。Cas9を含有するpChlamy1についての配列を以下に示す。遺伝子ノックアウトを達成するためのこの手法において、ガイドRNAのためのRNAを送達することが必要なだけである。相同組換えのため、本出願人らは、ガイドRNAおよび線形化相同組換えテンプレートを送達する。
【0513】
pChlamy1−Cas9:
【化7】
[この文献は図面を表示できません]
【化8】
[この文献は図面を表示できません]
【化9】
[この文献は図面を表示できません]
【化10】
[この文献は図面を表示できません]
【化11】
[この文献は図面を表示できません]
【化12】
[この文献は図面を表示できません]
【0514】
全ての改変コナミドリムシ(Chlamydomonas reinhardtii)細胞について、本出願人らは、PCR、SURVEYORヌクレアーゼアッセイ、およびDNAシーケンシングを使用して良好な改変を確認した。
【0515】
実施例8:結晶構造
図23A〜Mは、CRISPR−cas複合体結晶構造(A〜I)、結晶構造からのキメラRNAアーキテクチャー(J〜K)、結晶構造からの相互作用模式図(L)および結晶構造からのトポロジー模式図(M)の種々の図を提供する。
【0516】
図23J〜Kは、SpCas9sgRNA構造研究に関し、
図26A〜Bは、sgRNA突然変異にも関する。SpCas9sgRNAは、活性への規定の塩基または塩基群の寄与を調査するために突然変異させた。これらは、ステム1(DRとtracrRNAとの間の塩基対形成領域)、バルジ(DRとtracrRNAとの間のペア形成しない塩基)、ループ1(DRとtracrとの間の人工GAAAコネクター)、リンカー1(ステム1とステム2との間)、ステム2(tracrRNAテールにより形成される第1のヘアピン)、ループ2(ステム2間のループ)、ステム3(tracrRNAテールにより形成される第2の、または最後のヘアピン)、およびループ3(ステム3間のループ)に分類されるsgRNAのダイレクトリピート(DR)およびtracrRNA領域中の突然変異を含む。突然変異は、予測二次構造および
図23A〜M、特に
図23Jに説明される二次構造に基づき選択した。さらに、MBPに融合している機能ドメインをリクルートするための相互作用/結合のためにループ領域中にMS2ループを取り込むように3つのsrRNA足場を設計した。sgRNAをU6::PCRアンプリコンとして合成し、野生型SpCas9との同時形質移入において試験した。
【0517】
400ngのCas9プラスミド、100ngのsgRNAをLipofectamine2000により200,000個のHEK293FT細胞中に;DNAをSURVEYOR分析のために形質移入の3日後に回収した。
【0518】
したがって、本発明は包含し、本発明は、以下の結晶構造表(CRISPR−cas9結晶構造)の座標により定義される構造を有する結晶を有するCRISPR−cas9(化膿連鎖球菌(S.pyogenes))系を包含する。
【0519】
【表25】
[この文献は図面を表示できません]
【0520】
【表26】
[この文献は図面を表示できません]
【0521】
【表27】
[この文献は図面を表示できません]
【0522】
【表28】
[この文献は図面を表示できません]
【0523】
【表29】
[この文献は図面を表示できません]
【0524】
【表30】
[この文献は図面を表示できません]
【0525】
【表31】
[この文献は図面を表示できません]
【0526】
【表32】
[この文献は図面を表示できません]
【0527】
【表33】
[この文献は図面を表示できません]
【0528】
【表34】
[この文献は図面を表示できません]
【0529】
【表35】
[この文献は図面を表示できません]
【0530】
【表36】
[この文献は図面を表示できません]
【0531】
【表37】
[この文献は図面を表示できません]
【0532】
【表38】
[この文献は図面を表示できません]
【0533】
【表39】
[この文献は図面を表示できません]
【0534】
【表40】
[この文献は図面を表示できません]
【0535】
【表41】
[この文献は図面を表示できません]
【0536】
【表42】
[この文献は図面を表示できません]
【0537】
【表43】
[この文献は図面を表示できません]
【0538】
【表44】
[この文献は図面を表示できません]
【0539】
【表45】
[この文献は図面を表示できません]
【0540】
【表46】
[この文献は図面を表示できません]
【0541】
【表47】
[この文献は図面を表示できません]
【0542】
【表48】
[この文献は図面を表示できません]
【0543】
【表49】
[この文献は図面を表示できません]
【0544】
【表50】
[この文献は図面を表示できません]
【0545】
【表51】
[この文献は図面を表示できません]
【0546】
【表52】
[この文献は図面を表示できません]
【0547】
【表53】
[この文献は図面を表示できません]
【0548】
【表54】
[この文献は図面を表示できません]
【0549】
【表55】
[この文献は図面を表示できません]
【0550】
【表56】
[この文献は図面を表示できません]
【0551】
【表57】
[この文献は図面を表示できません]
【0552】
【表58】
[この文献は図面を表示できません]
【0553】
【表59】
[この文献は図面を表示できません]
【0554】
【表60】
[この文献は図面を表示できません]
【0555】
【表61】
[この文献は図面を表示できません]
【0556】
【表62】
[この文献は図面を表示できません]
【0557】
【表63】
[この文献は図面を表示できません]
【0558】
【表64】
[この文献は図面を表示できません]
【0559】
【表65】
[この文献は図面を表示できません]
【0560】
【表66】
[この文献は図面を表示できません]
【0561】
【表67】
[この文献は図面を表示できません]
【0562】
【表68】
[この文献は図面を表示できません]
【0563】
【表69】
[この文献は図面を表示できません]
【0564】
【表70】
[この文献は図面を表示できません]
【0565】
【表71】
[この文献は図面を表示できません]
【0566】
【表72】
[この文献は図面を表示できません]
【0567】
【表73】
[この文献は図面を表示できません]
【0568】
【表74】
[この文献は図面を表示できません]
【0569】
【表75】
[この文献は図面を表示できません]
【0570】
【表76】
[この文献は図面を表示できません]
【0571】
【表77】
[この文献は図面を表示できません]
【0572】
【表78】
[この文献は図面を表示できません]
【0573】
【表79】
[この文献は図面を表示できません]
【0574】
【表80】
[この文献は図面を表示できません]
【0575】
【表81】
[この文献は図面を表示できません]
【0576】
【表82】
[この文献は図面を表示できません]
【0577】
【表83】
[この文献は図面を表示できません]
【0578】
【表84】
[この文献は図面を表示できません]
【0579】
【表85】
[この文献は図面を表示できません]
【0580】
【表86】
[この文献は図面を表示できません]
【0581】
【表87】
[この文献は図面を表示できません]
【0582】
【表88】
[この文献は図面を表示できません]
【0583】
【表89】
[この文献は図面を表示できません]
【0584】
【表90】
[この文献は図面を表示できません]
【0585】
【表91】
[この文献は図面を表示できません]
【0586】
【表92】
[この文献は図面を表示できません]
【0587】
【表93】
[この文献は図面を表示できません]
【0588】
【表94】
[この文献は図面を表示できません]
【0589】
【表95】
[この文献は図面を表示できません]
【0590】
【表96】
[この文献は図面を表示できません]
【0591】
【表97】
[この文献は図面を表示できません]
【0592】
【表98】
[この文献は図面を表示できません]
【0593】
【表99】
[この文献は図面を表示できません]
【0594】
【表100】
[この文献は図面を表示できません]
【0595】
【表101】
[この文献は図面を表示できません]
【0596】
【表102】
[この文献は図面を表示できません]
【0597】
【表103】
[この文献は図面を表示できません]
【0598】
【表104】
[この文献は図面を表示できません]
【0599】
【表105】
[この文献は図面を表示できません]
【0600】
【表106】
[この文献は図面を表示できません]
【0601】
【表107】
[この文献は図面を表示できません]
【0602】
【表108】
[この文献は図面を表示できません]
【0603】
【表109】
[この文献は図面を表示できません]
【0604】
【表110】
[この文献は図面を表示できません]
【0605】
【表111】
[この文献は図面を表示できません]
【0606】
【表112】
[この文献は図面を表示できません]
【0607】
【表113】
[この文献は図面を表示できません]
【0608】
【表114】
[この文献は図面を表示できません]
【0609】
【表115】
[この文献は図面を表示できません]
【0610】
【表116】
[この文献は図面を表示できません]
【0611】
【表117】
[この文献は図面を表示できません]
【0612】
【表118】
[この文献は図面を表示できません]
【0613】
【表119】
[この文献は図面を表示できません]
【0614】
【表120】
[この文献は図面を表示できません]
【0615】
【表121】
[この文献は図面を表示できません]
【0616】
【表122】
[この文献は図面を表示できません]
【0617】
【表123】
[この文献は図面を表示できません]
【0618】
【表124】
[この文献は図面を表示できません]
【0619】
【表125】
[この文献は図面を表示できません]
【0620】
【表126】
[この文献は図面を表示できません]
【0621】
【表127】
[この文献は図面を表示できません]
【0622】
【表128】
[この文献は図面を表示できません]
【0623】
【表129】
[この文献は図面を表示できません]
【0624】
【表130】
[この文献は図面を表示できません]
【0625】
【表131】
[この文献は図面を表示できません]
【0626】
【表132】
[この文献は図面を表示できません]
【0627】
【表133】
[この文献は図面を表示できません]
【0628】
【表134】
[この文献は図面を表示できません]
【0629】
【表135】
[この文献は図面を表示できません]
【0630】
【表136】
[この文献は図面を表示できません]
【0631】
【表137】
[この文献は図面を表示できません]
【0632】
【表138】
[この文献は図面を表示できません]
【0633】
【表139】
[この文献は図面を表示できません]
【0634】
【表140】
[この文献は図面を表示できません]
【0635】
【表141】
[この文献は図面を表示できません]
【0636】
【表142】
[この文献は図面を表示できません]
【0637】
【表143】
[この文献は図面を表示できません]
【0638】
【表144】
[この文献は図面を表示できません]
【0639】
【表145】
[この文献は図面を表示できません]
【0640】
【表146】
[この文献は図面を表示できません]
【0641】
【表147】
[この文献は図面を表示できません]
【0642】
【表148】
[この文献は図面を表示できません]
【0643】
【表149】
[この文献は図面を表示できません]
【0644】
【表150】
[この文献は図面を表示できません]
【0645】
【表151】
[この文献は図面を表示できません]
【0646】
【表152】
[この文献は図面を表示できません]
【0647】
【表153】
[この文献は図面を表示できません]
【0648】
【表154】
[この文献は図面を表示できません]
【0649】
【表155】
[この文献は図面を表示できません]
【0650】
【表156】
[この文献は図面を表示できません]
【0651】
【表157】
[この文献は図面を表示できません]
【0652】
【表158】
[この文献は図面を表示できません]
【0653】
【表159】
[この文献は図面を表示できません]
【0654】
【表160】
[この文献は図面を表示できません]
【0655】
【表161】
[この文献は図面を表示できません]
【0656】
【表162】
[この文献は図面を表示できません]
【0657】
【表163】
[この文献は図面を表示できません]
【0658】
【表164】
[この文献は図面を表示できません]
【0659】
【表165】
[この文献は図面を表示できません]
【0660】
【表166】
[この文献は図面を表示できません]
【0661】
【表167】
[この文献は図面を表示できません]
【0662】
【表168】
[この文献は図面を表示できません]
【0663】
【表169】
[この文献は図面を表示できません]
【0664】
【表170】
[この文献は図面を表示できません]
【0665】
【表171】
[この文献は図面を表示できません]
【0666】
【表172】
[この文献は図面を表示できません]
【0667】
【表173】
[この文献は図面を表示できません]
【0668】
【表174】
[この文献は図面を表示できません]
【0669】
【表175】
[この文献は図面を表示できません]
【0670】
【表176】
[この文献は図面を表示できません]
【0671】
【表177】
[この文献は図面を表示できません]
【0672】
【表178】
[この文献は図面を表示できません]
【0673】
【表179】
[この文献は図面を表示できません]
【0674】
【表180】
[この文献は図面を表示できません]
【0675】
【表181】
[この文献は図面を表示できません]
【0676】
【表182】
[この文献は図面を表示できません]
【0677】
【表183】
[この文献は図面を表示できません]
【0678】
【表184】
[この文献は図面を表示できません]
【0679】
【表185】
[この文献は図面を表示できません]
【0680】
【表186】
[この文献は図面を表示できません]
【0681】
【表187】
[この文献は図面を表示できません]
【0682】
【表188】
[この文献は図面を表示できません]
【0683】
【表189】
[この文献は図面を表示できません]
【0684】
【表190】
[この文献は図面を表示できません]
【0685】
【表191】
[この文献は図面を表示できません]
【0686】
【表192】
[この文献は図面を表示できません]
【0687】
【表193】
[この文献は図面を表示できません]
【0688】
【表194】
[この文献は図面を表示できません]
【0689】
【表195】
[この文献は図面を表示できません]
【0690】
【表196】
[この文献は図面を表示できません]
【0691】
【表197】
[この文献は図面を表示できません]
【0692】
【表198】
[この文献は図面を表示できません]
【0693】
【表199】
[この文献は図面を表示できません]
【0694】
【表200】
[この文献は図面を表示できません]
【0695】
【表201】
[この文献は図面を表示できません]
【0696】
【表202】
[この文献は図面を表示できません]
【0697】
【表203】
[この文献は図面を表示できません]
【0698】
【表204】
[この文献は図面を表示できません]
【0699】
【表205】
[この文献は図面を表示できません]
【0700】
【表206】
[この文献は図面を表示できません]
【0701】
【表207】
[この文献は図面を表示できません]
【0702】
【表208】
[この文献は図面を表示できません]
【0703】
【表209】
[この文献は図面を表示できません]
【0704】
【表210】
[この文献は図面を表示できません]
【0705】
【表211】
[この文献は図面を表示できません]
【0706】
【表212】
[この文献は図面を表示できません]
【0707】
【表213】
[この文献は図面を表示できません]
【0708】
【表214】
[この文献は図面を表示できません]
【0709】
【表215】
[この文献は図面を表示できません]
【0710】
【表216】
[この文献は図面を表示できません]
【0711】
【表217】
[この文献は図面を表示できません]
【0712】
【表218】
[この文献は図面を表示できません]
【0713】
【表219】
[この文献は図面を表示できません]
【0714】
【表220】
[この文献は図面を表示できません]
【0715】
【表221】
[この文献は図面を表示できません]
【0716】
【表222】
[この文献は図面を表示できません]
【0717】
【表223】
[この文献は図面を表示できません]
【0718】
【表224】
[この文献は図面を表示できません]
【0719】
【表225】
[この文献は図面を表示できません]
【0720】
【表226】
[この文献は図面を表示できません]
【0721】
【表227】
[この文献は図面を表示できません]
【0722】
【表228】
[この文献は図面を表示できません]
【0723】
【表229】
[この文献は図面を表示できません]
【0724】
【表230】
[この文献は図面を表示できません]
【0725】
【表231】
[この文献は図面を表示できません]
【0726】
【表232】
[この文献は図面を表示できません]
【0727】
【表233】
[この文献は図面を表示できません]
【0728】
【表234】
[この文献は図面を表示できません]
【0729】
【表235】
[この文献は図面を表示できません]
【0730】
【表236】
[この文献は図面を表示できません]
【0731】
【表237】
[この文献は図面を表示できません]
【0732】
【表238】
[この文献は図面を表示できません]
【0733】
【表239】
[この文献は図面を表示できません]
【0734】
【表240】
[この文献は図面を表示できません]
【0735】
【表241】
[この文献は図面を表示できません]
【0736】
【表242】
[この文献は図面を表示できません]
【0737】
【表243】
[この文献は図面を表示できません]
【0738】
【表244】
[この文献は図面を表示できません]
【0739】
【表245】
[この文献は図面を表示できません]
【0740】
【表246】
[この文献は図面を表示できません]
【0741】
【表247】
[この文献は図面を表示できません]
【0742】
【表248】
[この文献は図面を表示できません]
【0743】
【表249】
[この文献は図面を表示できません]
【0744】
【表250】
[この文献は図面を表示できません]
【0745】
【表251】
[この文献は図面を表示できません]
【0746】
【表252】
[この文献は図面を表示できません]
【0747】
【表253】
[この文献は図面を表示できません]
【0748】
【表254】
[この文献は図面を表示できません]
【0749】
【表255】
[この文献は図面を表示できません]
【0750】
【表256】
[この文献は図面を表示できません]
【0751】
【表257】
[この文献は図面を表示できません]
【0752】
【表258】
[この文献は図面を表示できません]
【0753】
【表259】
[この文献は図面を表示できません]
【0754】
【表260】
[この文献は図面を表示できません]
【0755】
【表261】
[この文献は図面を表示できません]
【0756】
【表262】
[この文献は図面を表示できません]
【0757】
【表263】
[この文献は図面を表示できません]
【0758】
【表264】
[この文献は図面を表示できません]
【0759】
【表265】
[この文献は図面を表示できません]
【0760】
【表266】
[この文献は図面を表示できません]
【0761】
【表267】
[この文献は図面を表示できません]
【0762】
【表268】
[この文献は図面を表示できません]
【0763】
【表269】
[この文献は図面を表示できません]
【0764】
【表270】
[この文献は図面を表示できません]
【0765】
【表271】
[この文献は図面を表示できません]
【0766】
【表272】
[この文献は図面を表示できません]
【0767】
【表273】
[この文献は図面を表示できません]
【0768】
【表274】
[この文献は図面を表示できません]
【0769】
【表275】
[この文献は図面を表示できません]
【0770】
【表276】
[この文献は図面を表示できません]
【0771】
【表277】
[この文献は図面を表示できません]
【0772】
【表278】
[この文献は図面を表示できません]
【0773】
【表279】
[この文献は図面を表示できません]
【0774】
【表280】
[この文献は図面を表示できません]
【0775】
【表281】
[この文献は図面を表示できません]
【0776】
【表282】
[この文献は図面を表示できません]
【0777】
【表283】
[この文献は図面を表示できません]
【0778】
【表284】
[この文献は図面を表示できません]
【0779】
【表285】
[この文献は図面を表示できません]
【0780】
【表286】
[この文献は図面を表示できません]
【0781】
【表287】
[この文献は図面を表示できません]
【0782】
【表288】
[この文献は図面を表示できません]
【0783】
【表289】
[この文献は図面を表示できません]
【0784】
【表290】
[この文献は図面を表示できません]
【0785】
【表291】
[この文献は図面を表示できません]
【0786】
【表292】
[この文献は図面を表示できません]
【0787】
【表293】
[この文献は図面を表示できません]
【0788】
【表294】
[この文献は図面を表示できません]
【0789】
【表295】
[この文献は図面を表示できません]
【0790】
【表296】
[この文献は図面を表示できません]
【0791】
【表297】
[この文献は図面を表示できません]
【0792】
【表298】
[この文献は図面を表示できません]
【0793】
【表299】
[この文献は図面を表示できません]
【0794】
【表300】
[この文献は図面を表示できません]
【0795】
【表301】
[この文献は図面を表示できません]
【0796】
【表302】
[この文献は図面を表示できません]
【0797】
【表303】
[この文献は図面を表示できません]
【0798】
【表304】
[この文献は図面を表示できません]
【0799】
【表305】
[この文献は図面を表示できません]
【0800】
【表306】
[この文献は図面を表示できません]
【0801】
【表307】
[この文献は図面を表示できません]
【0802】
【表308】
[この文献は図面を表示できません]
【0803】
【表309】
[この文献は図面を表示できません]
【0804】
【表310】
[この文献は図面を表示できません]
【0805】
【表311】
[この文献は図面を表示できません]
【0806】
【表312】
[この文献は図面を表示できません]
【0807】
【表313】
[この文献は図面を表示できません]
【0808】
【表314】
[この文献は図面を表示できません]
【0809】
【表315】
[この文献は図面を表示できません]
【0810】
【表316】
[この文献は図面を表示できません]
【0811】
【表317】
[この文献は図面を表示できません]
【0812】
【表318】
[この文献は図面を表示できません]
【0813】
【表319】
[この文献は図面を表示できません]
【0814】
【表320】
[この文献は図面を表示できません]
【0815】
【表321】
[この文献は図面を表示できません]
【0816】
【表322】
[この文献は図面を表示できません]
【0817】
【表323】
[この文献は図面を表示できません]
【0818】
【表324】
[この文献は図面を表示できません]
【0819】
【表325】
[この文献は図面を表示できません]
【0820】
【表326】
[この文献は図面を表示できません]
【0821】
【表327】
[この文献は図面を表示できません]
【0822】
【表328】
[この文献は図面を表示できません]
【0823】
【表329】
[この文献は図面を表示できません]
【0824】
【表330】
[この文献は図面を表示できません]
【0825】
【表331】
[この文献は図面を表示できません]
【0826】
【表332】
[この文献は図面を表示できません]
【0827】
【表333】
[この文献は図面を表示できません]
【0828】
【表334】
[この文献は図面を表示できません]
【0829】
【表335】
[この文献は図面を表示できません]
【0830】
【表336】
[この文献は図面を表示できません]
【0831】
【表337】
[この文献は図面を表示できません]
【0832】
【表338】
[この文献は図面を表示できません]
【0833】
【表339】
[この文献は図面を表示できません]
【0834】
【表340】
[この文献は図面を表示できません]
【0835】
【表341】
[この文献は図面を表示できません]
【0836】
【表342】
[この文献は図面を表示できません]
【0837】
【表343】
[この文献は図面を表示できません]
【0838】
【表344】
[この文献は図面を表示できません]
【0839】
【表345】
[この文献は図面を表示できません]
【0840】
【表346】
[この文献は図面を表示できません]
【0841】
【表347】
[この文献は図面を表示できません]
【0842】
【表348】
[この文献は図面を表示できません]
【0843】
【表349】
[この文献は図面を表示できません]
【0844】
【表350】
[この文献は図面を表示できません]
【0845】
【表351】
[この文献は図面を表示できません]
【0846】
【表352】
[この文献は図面を表示できません]
【0847】
【表353】
[この文献は図面を表示できません]
【0848】
【表354】
[この文献は図面を表示できません]
【0849】
【表355】
[この文献は図面を表示できません]
【0850】
【表356】
[この文献は図面を表示できません]
【0851】
【表357】
[この文献は図面を表示できません]
【0852】
【表358】
[この文献は図面を表示できません]
【0853】
【表359】
[この文献は図面を表示できません]
【0854】
【表360】
[この文献は図面を表示できません]
【0855】
【表361】
[この文献は図面を表示できません]
【0856】
【表362】
[この文献は図面を表示できません]
【0857】
【表363】
[この文献は図面を表示できません]
【0858】
【表364】
[この文献は図面を表示できません]
【0859】
【表365】
[この文献は図面を表示できません]
【0860】
【表366】
[この文献は図面を表示できません]
【0861】
【表367】
[この文献は図面を表示できません]
【0862】
【表368】
[この文献は図面を表示できません]
【0863】
【表369】
[この文献は図面を表示できません]
【0864】
【表370】
[この文献は図面を表示できません]
【0865】
【表371】
[この文献は図面を表示できません]
【0866】
【表372】
[この文献は図面を表示できません]
【0867】
【表373】
[この文献は図面を表示できません]
【0868】
【表374】
[この文献は図面を表示できません]
【0869】
【表375】
[この文献は図面を表示できません]
【0870】
【表376】
[この文献は図面を表示できません]
【0871】
【表377】
[この文献は図面を表示できません]
【0872】
【表378】
[この文献は図面を表示できません]
【0873】
【表379】
[この文献は図面を表示できません]
【0874】
【表380】
[この文献は図面を表示できません]
【0875】
【表381】
[この文献は図面を表示できません]
【0876】
【表382】
[この文献は図面を表示できません]
【0877】
【表383】
[この文献は図面を表示できません]
【0878】
【表384】
[この文献は図面を表示できません]
【0879】
【表385】
[この文献は図面を表示できません]
【0880】
【表386】
[この文献は図面を表示できません]
【0881】
【表387】
[この文献は図面を表示できません]
【0882】
【表388】
[この文献は図面を表示できません]
【0883】
【表389】
[この文献は図面を表示できません]
【0884】
【表390】
[この文献は図面を表示できません]
【0885】
【表391】
[この文献は図面を表示できません]
【0886】
【表392】
[この文献は図面を表示できません]
【0887】
【表393】
[この文献は図面を表示できません]
【0888】
【表394】
[この文献は図面を表示できません]
【0889】
【表395】
[この文献は図面を表示できません]
【0890】
【表396】
[この文献は図面を表示できません]
【0891】
【表397】
[この文献は図面を表示できません]
【0892】
【表398】
[この文献は図面を表示できません]
【0893】
【表399】
[この文献は図面を表示できません]
【0894】
【表400】
[この文献は図面を表示できません]
【0895】
【表401】
[この文献は図面を表示できません]
【0896】
【表402】
[この文献は図面を表示できません]
【0897】
【表403】
[この文献は図面を表示できません]
【0898】
【表404】
[この文献は図面を表示できません]
【0899】
【表405】
[この文献は図面を表示できません]
【0900】
【表406】
[この文献は図面を表示できません]
【0901】
【表407】
[この文献は図面を表示できません]
【0902】
実施例9:結晶構造からの化膿連鎖球菌(S.pyogenes)(Sp)SpCas9トランケーション
図25A〜Bは、全長SpCas9からのSpCas9トランケーションに関する。これらの図は、開裂活性を保持する結晶構造からのSpCas9トランケーション突然変異体のSurveyorゲル試験結果(A)ならびにアミノ酸トランケーションおよび
図25Aのゲルのレーンのフレキシブル(GGGS)またはリジッド(A(EAAAK))リンカー置換を示す表(B)を示す。
【0903】
この実施例において、SpCas9配列は、1.オルソログ(黄色ブドウ球菌(S.aureus)、サーモフィラス菌(S.thermophilus)CRISPR1、サーモフィラス菌(S.thermophilus)CRISPR3、および(髄膜炎菌(N.meningiditis))、例として、保存または可変の領域についてより小さいCas9(黄色ブドウ球菌(S.aureus)、サーモフィラス菌(S.thermophilus)CRISPR1、および髄膜炎菌(N.meningiditis))と比較すること、および2.標的DNA:sgRNA二本鎖の接触に潜在的にクリティカルでないと結晶分析により同定された境界により分析した。SpCas9のある領域(ヘリカルドメイン2)は、多くのより小さいCas9オルソログ中に存在せず、機能に重要でないと予測された。トランケーションの2つの類似セットを作製し、一方はより小さいCas9との配列アラインメントにより、一方は結晶予測により作製した。さらに、3、6、9、または12個のリピートの群のフレキシブルグリシン−セリン(GlyGlyGlySer)またはリジッドアルファ−ヘリカルリンカー(Ala(GluAlaAlaAlaLys)Ala)のいくつかのセットも使用して潜在的な構造安定化および/またはSpCas9:sgRNA特異性の保持の支援のためにヘリカルドメイン2を置き換えた。ヘリカル領域2トランケーションおよびリンカー置換の全ては、SpCas9活性を保持した。SpCas9は、ヘリカル1、2、および3ドメイン、ならびにC’末端推定PAM認識ドメイン中で体系的にトランケートした。トランケーション突然変異体は、HEK293FT細胞に以下のとおり形質移入した:400ngのトランケーションCas9プラスミドおよび100ngのsgRNAを200,000個の細胞中にLipofectamine 2000により同時形質移入した。細胞からのDNAをSURVEYOR分析のために回収した。
【0904】
下記:全長SpCas9DNA配列およびサブドメインの配列:それに続くヘリカルドメイン2トランケーションおよびバリアント。
>全長NLS−SpCas9−NLS
【化13】
[この文献は図面を表示できません]
【化14】
[この文献は図面を表示できません]
【化15】
[この文献は図面を表示できません]
【化16】
[この文献は図面を表示できません]
>N’末端NLS
ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCC
>RuvCIドメイン
【化17】
[この文献は図面を表示できません]
>ブリッジヘリックス
GCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTC
>ヘリカルドメイン1
【化18】
[この文献は図面を表示できません]
>ヘリカルドメイン2(非必須)
【化19】
[この文献は図面を表示できません]
>ヘリカルドメイン3
【化20】
[この文献は図面を表示できません]
>フレキシブルリンカー
CAGGTGTCCGGCCAGGGCGAT
>RuvC II
ATCGTGATCGAAATGGCCAGAGAG
>HNH
GACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAAC
>RuvCIII
CACCACGCCCACGACGCCTACCTG
>C末端(PAM認識ドメイン)
【化21】
[この文献は図面を表示できません]
C’−NLS
AAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAG
6.Sp_Δ_hel2(174−311)ヘリカルドメイン2欠失(オルソログアラインメントから)
【化22】
[この文献は図面を表示できません]
【化23】
[この文献は図面を表示できません]
【化24】
[この文献は図面を表示できません]
7.Sp_Δ_hel2−(GGGGS)3ヘリカルドメイン2欠失(オルソログアラインメントから)
【化25】
[この文献は図面を表示できません]
【化26】
[この文献は図面を表示できません]
【化27】
[この文献は図面を表示できません]
8.Sp_Δ_hel2−(GGGGS)6ヘリカルドメイン2欠失(オルソログアラインメントから)
【化28】
[この文献は図面を表示できません]
【化29】
[この文献は図面を表示できません]
【化30】
[この文献は図面を表示できません]
9.Sp_Δ_hel2−(GGGGS)9ヘリカルドメイン2欠失(オルソログアラインメントから)
【化31】
[この文献は図面を表示できません]
【化32】
[この文献は図面を表示できません]
【化33】
[この文献は図面を表示できません]
10.Sp_Δ_hel2−(GGGGS)12ヘリカルドメイン2欠失(オルソログアラインメントから)
【化34】
[この文献は図面を表示できません]
【化35】
[この文献は図面を表示できません]
【化36】
[この文献は図面を表示できません]
【化37】
[この文献は図面を表示できません]
11.Sp_Δ_hel2−A(EAAAK)3Aヘリカルドメイン2欠失(オルソログアラインメントから)
【化38】
[この文献は図面を表示できません]
【化39】
[この文献は図面を表示できません]
【化40】
[この文献は図面を表示できません]
12.Sp_Δ_hel2−A(EAAAK)3ALEA(EAAAK)3Aヘリカルドメイン2欠失(オルソログアラインメントから)
【化41】
[この文献は図面を表示できません]
【化42】
[この文献は図面を表示できません]
【化43】
[この文献は図面を表示できません]
13.Sp_Δ_hel2−A(EAAAK)3ALEA(EAAAK)3ALEA(EAAAK)3Aヘリカルドメイン2欠失(オルソログアラインメントから)
【化44】
[この文献は図面を表示できません]
【化45】
[この文献は図面を表示できません]
【化46】
[この文献は図面を表示できません]
【化47】
[この文献は図面を表示できません]
14.Sp_del_hel2−A(EAAAK)3LE(EAAAK)3LE(EAAAK)3LE(EAAAK)312Aヘリカルドメイン2欠失(オルソログアラインメントから)
【化48】
[この文献は図面を表示できません]
【化49】
[この文献は図面を表示できません]
【化50】
[この文献は図面を表示できません]
30.Sp_del(175−307)(Hiroshi予測)
【化51】
[この文献は図面を表示できません]
【化52】
[この文献は図面を表示できません]
【化53】
[この文献は図面を表示できません]
31.Sp_del(1098−終端)
【化54】
[この文献は図面を表示できません]
【化55】
[この文献は図面を表示できません]
【化56】
[この文献は図面を表示できません]
32.Sp_del(175−307)−(GGGGS)3
【化57】
[この文献は図面を表示できません]
【化58】
[この文献は図面を表示できません]
【化59】
[この文献は図面を表示できません]
33.Sp_del(175−307)−(GGGGS)6
【化60】
[この文献は図面を表示できません]
【化61】
[この文献は図面を表示できません]
【化62】
[この文献は図面を表示できません]
34.Sp_del(175−307)−(GGGGS)9
【化63】
[この文献は図面を表示できません]
【化64】
[この文献は図面を表示できません]
【化65】
[この文献は図面を表示できません]
35.Sp_del(175−307)−(GGGGS)12
【化66】
[この文献は図面を表示できません]
【化67】
[この文献は図面を表示できません]
【化68】
[この文献は図面を表示できません]
36.Sp_del(175−307)−A(EAAAK)3A
【化69】
[この文献は図面を表示できません]
【化70】
[この文献は図面を表示できません]
【化71】
[この文献は図面を表示できません]
【化72】
[この文献は図面を表示できません]
37.Sp_del(175−307)−A(EAAAK)3ALEA(EAAAK)3A
【化73】
[この文献は図面を表示できません]
【化74】
[この文献は図面を表示できません]
【化75】
[この文献は図面を表示できません]
38.Sp_del(175−307)−A(EAAAK)3ALEA(EAAAK)3ALEA(EAAAK)3A
【化76】
[この文献は図面を表示できません]
【化77】
[この文献は図面を表示できません]
【化78】
[この文献は図面を表示できません]
39.Sp_del(175−307)−A(EAAAK)3LE(EAAAK)3LE(EAAAK)3LE(EAAAK)312A
【化79】
[この文献は図面を表示できません]
【化80】
[この文献は図面を表示できません]
【化81】
[この文献は図面を表示できません]
【化82】
[この文献は図面を表示できません]
【0905】
実施例10:新たなニッカーゼ
図24A〜Cは新たなSpCas9ニッカーゼに関し、以下を提供する。A.SpCas9の触媒ドメイン、および推定新ニッカーゼについての突然変異誘発の部位を示す模式図。RuvCドメインI、II、およびIIIを橙色で示し、HNHドメインをRuvCIIとRuvCIIIとの間で白色で示す。ドメインサイズは縮尺通りに描かれていない。B.二重ニック形成の試験に使用されるsgRNAの局在を示す模式図:sgRNAを単独で(A1またはC1単独)SpCas9ニッカーゼと形質移入する場合、インデルは生じないはずである。RuvCIII突然変異ニッカーゼとの組合せで使用されるA1+C1の組合せは、5’−オーバーハングをもたらす一方、D1+A1およびC7+A1は3’−オーバーハングをもたらす。逆に、HNH突然変異ニッカーゼと使用されるそれらの3つの組合せは、それぞれ3’−、5’−、および5’−オーバーハングをもたらす。C.ヌクレアーゼ活性を保持する1つのHNH突然変異体(N854A)、およびニッカーゼ活性を示す1つのHNH突然変異体(N863A)、ならびにニッカーゼ活性を示す2つのRuvCIII突然変異体(H983A、D986A)を示すSurveyor試験。
【0906】
この実施例において、5つの潜在的なニック形成突然変異部位を、Cas9オルソログ間の配列相同性に基づき選択した。3つの追加の部位を本明細書の結晶分析データに基づき選択した。ニッカーゼ突然変異体Cas9のこれらのセットのサブセットを再クローニングして最適化SpCas9のものと同一であるN’およびC’−NLS配列の両方を取り込んだ。配列を以下に示す。
【0907】
ニッカーゼ突然変異体を再クローニングして指定突然変異をpAAVベクター中にCbhプロモーター下に取り込み、配列を検証した。
【0908】
全ての潜在的ニッカーゼについてのヌクレアーゼおよび二重ニック形成活性は、HEK293FT細胞中で以下のとおり試験した:約200,000個の細胞中へのLipofectamine 2000による400ngのニッカーゼおよび100ngのU6ドライブsgRNA(1つのガイドについて100ng、またはsgRNAのペアについてぞれぞれ50ng)の同時形質移入。形質移入された細胞からのDNAをSURVEYOR分析のために回収した。ニッカーゼは、単一sgRNAと同時形質移入した場合にインデル突然変異をもたらさないが、適切に離隔するsgRNAのペアと同時形質移入した場合、それをもたらす。元のD10A SpCas9ニッカーゼからのデータに基づき、RuvCドメイン突然変異体のために選択されたsgRNAのペア(A1/C1)は、0bpの離隔および最大開裂のための5’−オーバーハングを有する。
【0909】
【表408】
[この文献は図面を表示できません]
【0910】
【表409】
[この文献は図面を表示できません]
【0911】
>NLS−S15A−NLS
【化83】
[この文献は図面を表示できません]
【化84】
[この文献は図面を表示できません]
【化85】
[この文献は図面を表示できません]
>NLS−E762A−NLS
【化86】
[この文献は図面を表示できません]
【化87】
[この文献は図面を表示できません]
【化88】
[この文献は図面を表示できません]
【化89】
[この文献は図面を表示できません]
>NLS−H982A−NLS
【化90】
[この文献は図面を表示できません]
【化91】
[この文献は図面を表示できません]
【化92】
[この文献は図面を表示できません]
>NLS−H983A−NLS
【化93】
[この文献は図面を表示できません]
【化94】
[この文献は図面を表示できません]
【化95】
[この文献は図面を表示できません]
【化96】
[この文献は図面を表示できません]
>NLS−D986A−NLS
【化97】
[この文献は図面を表示できません]
【化98】
[この文献は図面を表示できません]
【化99】
[この文献は図面を表示できません]
【0912】
実施例11:本明細書の化膿連鎖球菌(S.pyogenes)Cas9結晶構造に基づくキメラCas9のトランケートおよび作出
図27A〜Cは、本明細書の結晶構造に基づくキメラCas9のトランケートおよび作出に関する。これらの図は、以下を説明する模式図を提供する。A.タンパク質のトランケーションのためのCas9の不可欠な機能ドメインを確定するために設計されるSpCas9突然変異体。B.サーモフィラス菌(S.thermophilus)CRISPR1、サーモフィラス菌(S.thermophilus)CRISPR3、黄色ブドウ球菌(Staphylococcus aureus)、髄膜炎菌(Neisseria meningiditis)からのCas9、または他のCas9オルソログからの配列(桃色の領域)を含有するキメラCas9。C.SpCas9の化学誘導性ダイマー化を作出するための設計。化学誘導性SpCas9は機能する。
【0913】
キメラCas9のためのDNA配列は、GenScriptによりヒト発現のために最適化し、デノボ合成する。キメラCas9タンパク質は、Cas9オルソログからの個々の機能ドメインをクローニングおよびライゲートすることにより(すなわち、所望のCas9オルソログからの個々の機能ドメインをPCR増幅させ、次いでGibsonまたはGolden Gateクローニングのいずれかによりそれらの片を一緒にアセンブルすることにより)、構築することができる。さらに、化学誘導性Cas9のセットを2成分系として構築し、Cas9タンパク質の一部分がFKBPに融合しており、残りがFRBに融合している(例えば、FKBP−Cas9(アミノ酸1〜1098)、FRB−Cas(1099〜1368))。化学誘導の不存在下、2つの誘導性Cas9成分の同時形質移入は、触媒活性を有さないが、成分の機能アセンブリはラパマイシン[5nMから10μM]を使用して誘導することができる。
【0914】
実施例12:ガイドRNAおよび標的DNAとの複合体におけるCas9の結晶構造
Cas9は、単一ガイドRNA(sgRNA)により特異的ゲノム遺伝子座に標的化することができる微生物CRISPR−Cas系からのRNAガイドヌクレアーゼである。本出願人らは、2.4Å分解能におけるsgRNAおよびその標的DNAとの複合体における化膿連鎖球菌(Streptococcus pyogenes)Cas9の結晶構造を報告する。構造は、界面における正荷電溝中にsgRNA:DNAヘテロ二本鎖を収容する標的認識およびヌクレアーゼローブから構成されるバイローブ型アーキテクチャーを明らかにした。認識ローブがsgRNAおよびDNAの結合に不可欠である一方、ヌクレアーゼローブは、標的DNAの相補および非相補鎖の開裂のために適切にそれぞれ位置決めされたHNHおよびRuvCヌクレアーゼドメインをそれぞれ含有する。この高分解能構造および付随機能分析は、Cas9によるRNAガイドDNA標的化の分子機序を解明し、新たな多用途ゲノム編集技術の合理的設計のための経路を開く。
【0915】
CRISPR(クラスター化等間隔短鎖回文リピート)−Cas系は、侵入ファージおよび他の可動遺伝子エレメントに対する防御のための天然存在の微生物適応免疫系である(Deveau et al.,2010;Horvath and Barrangou,2010;Marraffini and Sontheimer,2010;Terns and Terns,2011)。CRISPR−Cas系の3つのタイプ(I〜III)は、広範な微生物種にわたり機能的に同定されており(Barrangou et al.,2007;Brouns et al.,2008;Marraffini and Sontheimer,2008)、それぞれ、CRISPR関連(Cas)遺伝子およびその対応するCRISPRアレイのクラスターを含有する。これらの特徴的なCRISPRアレイは、外来遺伝子材料の短鎖セグメント(プロトスペーサー)に由来する非反復配列の短鎖ストレッチ(スペーサー)により間隔が空いている反復配列(ダイレクトリピート、リピートと称される)からなる。CRISPRアレイは転写され、短鎖CRISPR RNA(crRNA)にプロセシングされ、それはCasタンパク質を標的核酸、DNAまたはRNAに、ワトソン−クリック塩基対形成を介して指向して核酸破壊を容易にする。
【0916】
IおよびIII型CRISPR系は、crRNAとの複合体におけるCasタンパク質のアンサンブルを利用して標的核酸の認識および後続の分解を媒介する(Spilman et al.,2013;Wiedenheft et al.,2011)。対照的に、II型CRISPR系は、標的DNA(Garneau et al.,2010)の認識および開裂を、2つの非コードRNA、crRNAおよびトランス作用crRNA(tracrRNA)(Deltcheva et al.,2011)とともにCas9(Sapranauskas et al.,2011)と呼ばれる単一酵素を介して達成する。crRNAは、tracrRNAとハイブリダイズしてcrRNA:tracrRNA二本鎖を形成し、次いでそれをCas9上にロードして適切なプロトスペーサー隣接モチーフ(PAM)を担持するコグネートDNA配列の開裂を指向する(Mojica et al.,2009)。
【0917】
II型CRISPR系は、真核細胞中のゲノム編集を容易にするために採用され得る最初のものであった(Cong et al.,2013;Mali et al.,2013b)。化膿連鎖球菌(Streptococcus pyogenes)からのCas9タンパク質は、単一ガイドRNA(sgRNA)、crRNAおよび最小tracrRNA(Jinek et al.,2012)の合成融合物とともに、哺乳動物中で5’−NGG PAM配列に先行する実質的に任意の配列の開裂を指示するようにプログラミングすることができた(Cong et al.,2013;Mali et al.,2013b)。この前例のないフレキシビリティーは、広範囲の用途、例として、遺伝子改変細胞および動物モデルの迅速な生成(Gratz et al.,2013;Hwang et al.,2013;Wang et al.,2013;Yang et al.,2013)、ならびにゲノムスケール遺伝子スクリーニング(Qi et al.,2013;Shalem et al.,2014;Wang et al.,2014)を可能とした。
【0918】
しかしながら、Cas9技術の開発の順調な進歩にかかわらず、Cas9−sgRNA複合体がその標的DNAをいかに認識および開裂するかという機序が解明されるべきままである。今日まで、ドメインレベルにおける生化学分析は、真核細胞中の相同組換え修復を容易にし(Cong et al.,2013;Mali et al.,2013b)、さらに適切にペア形成したsgRNAを所与として改善された特異度でDNAを開裂する(Mali et al.,2013a;Ran et al.,2013)天然Cas9をDNAニック形成酵素(Gasiunas et al.,2012;Jinek et al.,2012;Sapranauskas et al.,2011)に変換するための部位特異的エンジニアリングを可能とした。さらに、触媒的に不活性なCas9は、エフェクタードメインを標的化し、内因性転写をモジュレートするためのRNAガイドDNA結合プラットフォームとして機能し得る(Gilbert et al.,2013;Konermann et al., 2013; Maeder et al.,2013;Perez−Pinera et al.,2013;Qi et al.,2013)。これらのCas9エンジニアリングの進歩は、このフレキシブルRNAガイドゲノム位置決め系の潜在性を完全に実現するにあたり考えられるもののまさに最初のステップを表す。したがって、Cas9に関する正確な構造情報は、この洗練されたRNAガイド微生物適応免疫系がいかに機能するかの理解を向上させるだけでなく、Cas9標的化特異性のさらなる改善、インビトロおよびインビボ送達の単純化、ならびに新規機能および特徴の最適化のためのCas9のエンジニアリングも提供する。
【0919】
この実施例において、本出願人らは、2.4Å分解能におけるsgRNAおよびその標的DNAとの複合体における化膿連鎖球菌(S.pyogenes)Cas9の結晶構造を報告する。この高分解能構造は、機能分析とともに、ガイドRNA、標的DNA、およびCas9タンパク質をインテグレートするキー機能相互作用を明らかにし、Cas9機能を向上させ、新規用途をエンジニアリングするための経路を開く。
【0920】
Cas9−sgRNA−DNA三元構造の全体構造:本出願人らは、SeMet−標識タンパク質を使用するSAD(単一波長異常分散)法により、2.4Å分解能における98ヌクレオチド(nt)sgRNAおよび23nt標的DNAとの複合体における全長化膿連鎖球菌(S.pyogenes)Cas9(残基1〜1368;D10A/C80L/C574E/H840A)の結晶構造を解明した(
図1、37および表1)。Cas9の溶液挙動を改善するため、本出願人らは、あまり保存されていない2つのシステイン残基(Cys80およびCys574)を、ロイシンおよびグルタミン酸によりそれぞれ置き換えた。このC80L/C574E突然変異体は、ヒト胚性腎臓293FT(HEK293FT)細胞中のゲノムDNAを効率的に開裂する能力を保持し、それらの突然変異がCas9ヌクレアーゼ機能に対して効果を有さないことを裏付けた(
図38)。さらに、結晶化の間の標的DNAの開裂を防止するため、本出願人らは、2つの触媒残基、RuvCドメインからのAsp10およびHNHドメインからのHis840を、アラニンにより置き換えた。
【0921】
【表410】
[この文献は図面を表示できません]
【0922】
結晶分析非対称単位は、2つのCas9−sgRNA−DNA三元複合体(Mol AおよびMol B)を含有した。2つの複合体間に立体構造の差異が存在するが、sgRNAおよびDNAは、Cas9により類似の様式において認識される。最も注目すべきは、Mol A中のHNHドメインが不規則リンカーによりRuvCドメインと接続されている一方、Mol B中のHNHドメインは電子密度マップ中で可視的でなく、このことはHNHドメインのフレキシブルな性質を示す。したがって、本出願人らは、最初に、特に記載のない限り、Mol Aの構造的特徴を記載し、次いでCas9の立体構造フレキシビリティーを示唆する2つの複合体間の構造的差異を考察する。
【0923】
結晶構造は、Cas9が2つのローブ、認識(REC)ローブおよびヌクレアーゼ(NUC)ローブからなることを明らかにした(
図30A〜C)。RECローブは、3つの領域、ブリッジヘリックス(BH)と称される長鎖α−ヘリックス(残基60〜93)、REC1(残基94〜179および308〜713)、およびREC2(残基180〜307)ドメインに分類することができる(
図30A〜C)。NUCローブは、RuvC(残基1〜59、718〜769、および909〜1098)、HNH(残基775〜908)、およびPAM相互作用(PI)(残基1099〜1368)ドメインからなる(
図30A〜C)。負荷電sgRNA:DNAハイブリッド二本鎖は、RECおよびNUCローブ間の界面における正荷電溝中に収容される(
図30D)。NUCローブにおいて、RuvCドメインは、3つの分割RuvCモチーフ(RuvCI〜III)からアセンブルされ、それがPIドメインと調和してsgRNAの3’テールと相互作用する正荷電表面を形成する(
図30D)。HNHドメインは、RuvCII〜IIIモチーフ間に存在し、タンパク質の残部とのわずかな接触のみを形成する。
【0924】
リピート:アンチリピート二本鎖と相互作用しているCas9のRECローブ:RECローブは、REC1およびREC2ドメインを含む。REC1は、26個のα−ヘリックス(α2〜α5およびα12〜α33)および2つのβ−シート(β6/β10およびβ7〜β9)を含む延長されたα−ヘリカル構造を採用した一方、REC2は、6つのヘリックス束構造(α6〜α11)を採用した(
図31Aおよび39)。Daliサーチ(Holm and Rosenstrom,2010)は、RECローブが他の公知のタンパク質と構造的類似性を共有しないことを明らかにし、このことはそれがCas9特異的機能ドメインであることを示した。
【0925】
RECローブは、II型CRISPR系(IIA、IIBおよびIIC)内のCas9の3つのファミリーにわたり少なくとも保存された領域の1つであり、多くのCas9は、顕著に短いRECローブを含有する(
図40、41)。本出願人らは、RECローブ中のトランケーションが許容され得ることを仮定した。予測どおり、REC2ドメインが結合sgRNA:DNAハイブリッド二本鎖に接触しない観察と一致して、REC2ドメインを欠くCas9突然変異体(Δ175〜307)は、野生型Cas9活性の約50%を示し(
図31B)、このことは、REC2ドメインがDNA開裂にクリティカルでないことを示した。より低い開裂効率は、部分的には、野生型タンパク質のものに対するCas9(Δ175〜307)発現のレベルの低減が原因であり得る(
図31C)。著しく対照的に、REC1ドメインのcrRNAリピート相互作用領域の欠失(Δ97〜150)またはtracrRNAアンチリピート相互作用領域の欠失(Δ312〜409)は、DNA開裂活性を停止させ(
図31B)、このことは、REC1ドメインによるリピート:アンチリピート二本鎖の認識がCas9機能にクリティカルであることを示した。
【0926】
PAM相互作用(PI)ドメインは、PAM特異性を付与する:NUCローブは、7つのα−ヘリックス(α47〜α53)、三本鎖逆平行β−シート(β18〜β20)、五本鎖逆平行β−シート(β21〜β23、β26およびβ27)、および二本鎖逆平行β−シート(β24およびβ25)(
図31Dおよび39)を含む延長された構造を採用するPIドメインを含有する。RECローブと同様に、PIドメインも、Cas9ファミリーにユニークな新規タンパク質折り畳みを表す。
【0927】
本発明の構造中の結合相補鎖DNAおよびRuvCドメイン中の活性部位の局在は、PIドメインが標的DNAの非相補鎖上のPAM配列を認識するように位置決めされることを示唆する。本出願人らは、化膿連鎖球菌(S.pyogenes)Cas9(SpCas9;この研究におけるCas9)PIドメインの、異なるPAMを認識するオルソロガスCas9タンパク質のものによる置換が、SpCas9PAM特異性を変更するのに十分か否かを試験した。サーモフィラス菌(Streptococcus thermophilus)CRISPR−3Cas9(St3Cas9)はSpCas9と約60%の配列同一性を共有し;さらに、それらのcrRNAリピートおよびtracrRNAは交換可能である(Fonfara et al.,2013)。しかしながら、SpCas9およびSt3Cas9は、標的DNA開裂のために異なるPAM配列(Cas9について5’−NGGおよびSt3Cas9について5’−NGGNG)を要求する(Fonfara et al.,2013)。
【0928】
本出願人らは、2つのPIドメインをスワップして2つのキメラSp−St3Cas9(St3Cas9のPIドメインを有するSpCas9)およびSt3−SpCas9(SpCas9のPIドメインを有するSt3Cas9)を生成し、5’−NGG PAM(5’−GGGCT)または5’−NGGNG PAM(5’−GGGCGを担持する標的DNA配列についてのそれらの開裂活性を試験した(
図31E)。SpCas9およびSt3−SpCas9は、5’−NGG PAMを有する標的DNAを開裂するが、St3Cas9は開裂せず(
図31E)、このことはSpCas9のPIドメインが5’−NGG PAMの認識に要求され、St3Cas9のPAM認識を変更するのに十分であることを示す。Sp−St3Cas9は、SpCas9のものよりも低いレベルにもかかわらず、5’−NGG PAMを有する標的DNAについての開裂活性を保持した(
図31E)。さらに、PIドメインの欠失(Δ1099〜1368)は、開裂活性を停止させ(
図31E)、このことはPIドメインがCas9機能にクリティカルであることを示した。これらの結果は、PIドメインがPAM特異性の主要な決定因子であることを明らかにする。
【0929】
RuvCドメインは、非相補鎖DNAを標的化する:RuvCドメインは、α−ヘリックス(α34、α35およびα40〜α46)および2つの追加の二本鎖逆平行β−シート(β3/β4およびβ15/β16)によりフランキングされている六本鎖混合β−シート(β1、β2、β5、β11、β14およびβ17)からなる(
図32Aおよび39)。これは、RNアーゼH折り畳みにより特徴付けられるレトロウイルスインテグラーゼスーパーファミリーメンバー、例えば、大腸菌(Escherichia coli)RuvC(PDBコード1HJR、13%の同一性、123個の等価Cα原子について3.4Åの平方根平均二乗偏差(rmsd))(Ariyoshi et al.,1994)およびサーマス・サーモフィラス(Thermus thermophilus)RuvC(PDBコード4LD0、17%の同一性、129個の等価Cα原子について3.4Åのrmsd)(Ariyoshi et al.,1994)およびサーマス・サーモフィラス(Thermus thermophilus)RuvC(PDBコード4LD0、17%の同一性、129個の等価Cα原子について3.4Åのrmsd)(Gorecka et al.,2013)(
図32B)と構造的類似性を共有する。RuvCヌクレアーゼは、4つの触媒残基(例えば、T.サーモフィラス(T.thermophilus)RuvC中のAsp7、Glu70、His143およびAsp146)を有し、2金属機序を介してホリデイジャンクションを開裂する(Ariyoshi et al.,1994;Chen et al.,2013;Gorecka et al.,2013)。Cas9RuvCドメインのAsp10(Ala)、Glu762、His983およびAsp986は、T.サーモフィラス(T.thermophilus)RuvCの触媒残基のものと類似する位置において局在し(
図32A、B)、D10A突然変異が非相補DNA鎖の開裂を停止させ、Cas9が開裂活性のためにMg2+イオンを要求する従来の結果と一致する(Gasiunas et al.,2012;Jinek et al.,2012)。さらに、Glu762、His983またはAsp986のアラニン置換も、Cas9をニッカーゼに変換した(
図32C、D)。それぞれのニッカーゼ突然変異体は、並置sgRNAのペア(
図32C、D)を使用して標的化された二本鎖分解を容易にし得、これはD10Aニッカーゼにより既に実証されているとおりである(Ran et al.,2013)。構造観察および突然変異分析のこの組合せは、Cas9RuvCドメインが他のレトロウイルスインテグラーゼスーパーファミリーヌクレアーゼについて既に観察された2金属機序を介して標的DNAの非相補鎖を開裂することを示唆する。
【0930】
Cas9RuvCドメインとRuvCヌクレアーゼとの間に、それらの機能的差異を説明するキー構造的非類似性が存在することに留意することが重要である。Cas9RuvCドメインとは異なり、RuvCヌクレアーゼはダイマーを形成し、ホリデイジャンクションを認識する(Gorecka et al.,2013)(
図32B)。保存RNアーゼH折り畳みの他、Cas9のRuvCドメインは、ガイド:DNA二本鎖(α43とα44との間の終端キャッピングループ)およびPIドメイン/ステムループ3(β3およびβ4により形成されるβ−ヘアピン)との相互作用に関与する追加の構造エレメントを有する(
図32A)。
【0931】
HNHドメインは、相補鎖DNAを標的化する:HNHドメインは、4つのα−ヘリックス(α36〜α42)によりフランキングされている二本鎖逆平行β−シート(β12およびβ13)を含む(
図32E)。同様に、これは、ββα−金属折り畳みにより特徴付けられるHNHエンドヌクレアーゼ、例えば、ファージT4エンドヌクレアーゼVII(Endo VII)(Biertumpfel et al.,2007)(PDBコード2QNC、8%の同一性、60個の等価Cα原子について2.6Åのrmsd)(
図32F)およびビブリオ・バルニフィカス(Vibrio vulnificus)ヌクレアーゼ(Li et al.,2003)(PDBコード1OUP、8%の同一性、78個の等価Cα原子について2.9Åのrmsd)と構造的類似性を共有する。HNHヌクレアーゼは、3つの触媒残基(例えば、Endo VII中のAsp40、His41、およびAsn62)を有し、単一金属機序を介して核酸基質を開裂する(Biertumpfel et al.,2007;Li et al.,2003)。ホリデイジャンクションとの複合体におけるEndo VII N62D突然変異体の構造において、Mg2+イオンはAsp40、Asp62および基質の切断しやすいリン酸基の酸素原子により配位される一方、His41は触媒作用のために水分子を活性化させる一般塩基として作用する(
図32F)。Cas9HNHドメインのAsp839、His840、およびAsn863は、それぞれEndoVIIのAsp40、His41、およびAsn62に対応し(
図32E)、His840が相補DNA鎖の開裂にクリティカルである観察と一致する(Gasiunas et al.,2012;Jinek et al.,2012)。N863A突然変異体は、ニッカーゼとして機能し(
図32C、D)、このことはAsn863が触媒作用に関与することを示す。これらの観察は、Cas9HNHドメインが、他のHNHスーパーファミリーヌクレアーゼについて観察される単一金属機序を介して標的DNAの相補鎖を開裂し得ることを示唆する。しかしながら、本発明の構造において、Cas9のAsn863は、Endo VII中のAsn62とは異なる位置において局在する一方(Biertumpfel et al.,2007)、Cas9のAsp839およびHis840(Ala)は、それぞれEndo VIIのAsp40およびHis41と類似する位置において局在する(
図32E、F)。これは、本出願人らの結晶化溶液中の二価イオン、例えば、Mg2+の不存在に起因し得、このことはAsn863が活性部位に向き、触媒作用に関与し得ることを示唆する。HNHドメインは他のHNHエンドヌクレアーゼとββα−金属折り畳みを共有する一方、それらの全体構造は異なり(
図32E、F)、それらの基質特異性の差異と一致する。
【0932】
sgRNAは、ワトソン−クリック塩基対形成を介して標的DNAを認識する:sgRNAは、人工テトラループにより接続されたcrRNAおよびtracrRNA由来配列からなる(
図33A)。crRNA配列は、ガイド(20nt)およびリピート(12nt)領域に下位分類することができ、同様にtracrRNA配列はアンチリピート(14nt)および3つのtracrRNAステムループに下位分類することができる(
図33A)。結晶構造は、sgRNAが標的DNAに結合してガイド:DNA二本鎖、リピート:アンチリピート二本鎖およびステムループ1〜3を含むT形状アーキテクチャーを形成することを明らかにする(
図33A、B)。リピート:アンチリピート二本鎖およびステムループ1は、単一ヌクレオチド(A51)により接続されており、ステムループ1および2は5nt一本鎖リンカー(ヌクレオチド63〜67)により接続されている。
【0933】
ガイド(ヌクレオチド1〜20)および標的DNA(ヌクレオチド3’〜23’)は、20個のワトソン−クリック塩基対を介してガイド:DNAハイブリッド二本鎖を形成し、二本鎖の立体構造は基準のA型RNA二本鎖から変形する(
図33Bおよび42)。crRNAリピート(ヌクレオチド21〜32)およびtracrRNAアンチリピート(ヌクレオチド37〜50)は、9個のワトソン−クリック塩基対(U22:A49〜A26:U45およびG29:C40〜A32:U37)を介してリピート:アンチリピート二本鎖を形成する(
図33A、B)。この領域内で、G27、A28、A41、A42、G43、およびU44はペア形成せず、A28およびU44は二本鎖からフリップアウトする(
図33C)。G27およびA41のヌクレオ塩基はA26:U45およびG29:C40ペアとそれぞれスタッキングし、G27の2−アミノ基はG43とU44との間の骨格リン酸基と相互作用し、二本鎖構造を安定化する(
図33C)。G21およびU50は、ガイド:DNA/リピート:アンチリピート二本鎖とステムループ1との間の3方向ジャンクションにおいてゆらぎ塩基対を形成し、T形状アーキテクチャーを安定化する(
図33C)。
【0934】
ヌクレオチド配列のRNA折り畳み予測から予測されるとおり、tracrRNA3’テール(ヌクレオチド68〜81および82〜96)は、4および6つのワトソン−クリック塩基対(A69:U80〜U72:A77およびG82:C96〜G87:C91)を介してそれぞれステムループ2および3を形成する(
図33A、B)。これまで認識されていないが、3つのワトソン−クリック塩基対(G53:C61、G54:C60およびC55:G58)を介してヌクレオチド52〜62もステムループ(ステムループ1)を形成し、U59はステムからフリップアウトする(
図33A、B)。ステムループ1は、G62〜G53:C61スタッキング相互作用およびG62〜A51/A52極性相互作用により安定化される(
図33C)。
【0935】
ガイド:DNAおよびリピート:アンチリピート二本鎖は、2つのローブの界面における正荷電溝中に収容され、深く埋め込まれる一方、sgRNAの残部は、タンパク質の裏側上の正荷電界面と広く相互作用する(
図30D)。Mol Aにおいて、標的DNAの3’末端塩基(PAMに相補的な3’−ACC)は、電子密度マップにおいて可視的でない。対照的に、Mol B中の2つの隣接塩基(3’−AC)は、Cas9により認識されないが、それらは結晶充填相互作用に起因して構造的に規則的に並んでおり、電子密度マップにおいて可視的である。これらの観察は、PAM(5’−TGG)に相補的な3’−ACC配列がCas9により認識されないことを示唆し、Cas9触媒DNA開裂が非相補鎖上の5’−NGG PAMを要求するが、相補鎖上の3’−NCC配列を要求しないことを実証する従来の生化学データと一致する(Jinek et al.,2012)。
【0936】
従来の研究は、48ntのtracrRNAテールを有するsgRNA(sgRNA(+48)とも称される)が、インビトロでのCas9触媒DNA開裂のための最小領域であるが(Jinek et al.,2012)、伸長tracrRNAテールを有するsgRNA、sgRNA(+67)およびsgRNA(+85)がインビボでCas9開裂活性を大幅に改善することを示した(Hsu et al.,2013)。本発明の構造は、sgRNA(+48)、sgRNA(+67)およびsgRNA(+85)がそれぞれステムループ1、ステムループ1〜2およびステムループ1〜3を含有することを明らかにした(
図33A、B)。これらの観察は、ステムループ1が機能Cas9−sgRNA複合体の形成に不可欠である一方、ステムループ2および3は、安定的複合体形成をさらに支持し、sgRNA安定性を向上させ、こうしてインビボ活性を改善することを示した。
【0937】
Cas9機能に対するそれぞれのsgRNA構造成分の重要性を裏付けるため、本出願人らは、リピート:アンチリピート二本鎖、ステムループ1〜3、およびステムループ1および2間のリンカー中の突然変異を有する多数のsgRNAを試験した。本出願人らの結果は、ステムループ2および3ならびにリンカー領域が多数の突然変異を許容し得る一方、リピート:アンチリピート二本鎖およびステムループ1がCas9機能にクリティカルであることを明らかにした(
図33D)。さらに、sgRNA配列は、多数の突然変異を許容し得る(
図33D、再構築sgRNA)。これらの結果は、Cas9によるリピート:アンチリピート二本鎖の構造依存的認識の機能重要性を強調する。
【0938】
ブリッジヘリックス上の保存アルギニンクラスターは、sgRNA:DNA相互作用においてクリティカルな役割を担う:crRNAガイド領域は、主としてRECローブにより認識される(
図34A)。crRNAガイド領域(ヌクレオチド4〜6および13〜20)の骨格リン酸基は、REC1ドメイン(Arg165、Gly166、Arg403、Asn407、Lys510、Tyr515およびArg661)およびブリッジヘリックス(Ala59、Arg63、Arg66、Arg70、Arg71、Arg74およびArg78)と相互作用し(
図34B)、C15、U16およびG19の2’−ヒドロキシル基はREC1ドメイン中のTyr450、Arg447/Ile448およびThr404とそれぞれ水素結合する(
図34B)。これらの観察は、Cas9結合sgRNAの8つのPAM近位ヌクレオチドのワトソン−クリック面が溶媒に露出され、こうして標的相補鎖とのペア形成のための核形成部位として機能することを示唆した。これは、10〜12bpのPAM近位「シード」領域がCas9触媒DNA開裂にクリティカルである従来の報告と一致する(Cong et al.,2013;Fu et al.,2013;Hsu et al.,2013;Jinek et al.,2012;Mali et al.,2013a;Pattanayak et al.,2013)。
【0939】
突然変異分析は、ブリッジヘリックス上のR66A、R70AおよびR74A突然変異が、DNA開裂活性を顕著に低減させることを実証し(
図34C)、このことはブリッジヘリックスによるsgRNA「シード」領域の認識の機能的重要性を強調した。Arg78およびArg165も「シード」領域と相互作用するが、R78AおよびR165A突然変異体は、穏やかに減少した活性のみを示した(
図34C)。これらの結果は、Arg66、Arg70およびArg74が、sgRNA骨格との分岐塩架橋を形成する一方、Arg78およびArg165がsgRNA骨格との単一塩架橋を形成することを反映し得る。ブリッジヘリックス上のアルギニン残基のクラスターは、II型A〜C系におけるCas9タンパク質間で高度に保存され(
図40、41)、このことはブリッジヘリックスがsgRNAおよび標的DNAの認識に関与するCas9タンパク質の普遍的な構造的特徴であることを示唆する。この観念は、厳密に保存されるアルギニン残基が、化膿連鎖球菌(S.pyogenes)Cas9)のArg70と同等であり、II−B型系のフランシセラ・ノビシダ(Francisella novicida)Cas9の機能に不可欠である従来の観察により支持される(Sampson et al.,2013)。さらに、リピート:アンチリピート二本鎖相互作用残基(Arg75およびLys163)およびステムループ1相互作用残基(Arg69)のアラニン突然変異は、DNA開裂活性の減少をもたらし(
図34C)、このことはCas9によるリピート:アンチリピート二本鎖およびステムループ1の認識の機能的重要性を裏付けた。
【0940】
crRNAガイド領域は、U16−Arg447およびG18−Arg71相互作用を除き配列非依存的にCas9により認識される(
図34A、B)。この塩基特異的G18−Arg71相互作用は、4つのPAM近位ガイド配列中のグアニンを有するsgRNAについて観察されるCas9の優先性を部分的に説明し得る(Wang et al.,2014)。
【0941】
REC1およびRuvCドメインは、RNAガイドDNA標的化を容易にする:Cas9は、20bpのDNA標的部位を配列非依存的に認識する(
図34A)。標的DNA(ヌクレオチド1’、9’〜11’、13’、および20’)の骨格リン酸基は、REC1(Asn497、Trp659、Arg661およびGln695)、RuvC(Gln926)、およびPI(Glu1108)ドメインと相互作用する。標的DNA(ヌクレオチド5’、7’、8’、11’、19’、および20’)のC2’原子は、REC1ドメイン(Leu169、Tyr450、Met495、Met694およびHis698)およびRuvCドメイン(Ala728)とのファンデルワールス相互作用を形成する(
図34D)。これらの相互作用は、Cas9によるDNAとRNA標的との区別に寄与する可能性が高い。ガイド:DNA二本鎖の末端塩基対(G1:C20’)は、終端キャッピング相互作用を介してRuvCドメインにより認識され(
図34D);sgRNA G1および標的DNA C20’のヌクレオ塩基は、それぞれTyr1013およびVal1015の側鎖と相互作用する一方、sgRNA G1の2’−ヒドロキシルおよびリン酸基はそれぞれVal1009およびGln926と相互作用する。これらの終端キャッピング相互作用は、Cas9が17〜20bpのガイド:DNA二本鎖を認識し、伸長ガイド配列が細胞中で分解され、配列特異性に改善に寄与しない従来の観察と一致する(Mali et al.,2013a;Ran et al.,2013)。まとめると、これらの構造的知見は、Cas9のRNAガイドDNA標的化機序を説明する。
【0942】
リピート:アンチリピート二本鎖は、配列依存的にRECおよびNUCローブにより認識される:リピート:アンチリピート二本鎖は、RECおよびNUCローブにより広く認識される(
図34A)。crRNAリピート(ヌクレオチド24、26、および27)およびアンチリピート(ヌクレオチド41、45、46、および48〜50)の骨格リン酸基は、REC1ドメイン(Arg115、His116、His160、Lys163、Arg340、およびArg403)、PIドメイン(Lys1113)、およびブリッジヘリックス(Lys76)と相互作用する(
図34E、F)。crRNAリピート(ヌクレオチド22〜24)およびアンチリピート(ヌクレオチド43〜45および47)の2’−ヒドロキシル基は、REC1ドメイン(Leu101、Ser104、Phe105、Ile135、Tyr359、およびGln402)およびPIドメイン(Ile1110およびTyr1131)と水素結合する。
【0943】
ガイド領域の配列非依存的認識とは対照的に、Cas9とリピート:アンチリピート二本鎖との間の配列依存的相互作用が存在する。フリップしたU44のヌクレオ塩基は、Tyr325およびHis328の側鎖間に挟まれ、そのN3原子はTyr325のカルボニル基と水素結合する一方、ペア形成していないG43のそれはTyr359の側鎖とスタッキングし、Asp364の側鎖と水素結合する(
図34A、F)。最後に、U23/A49およびA42/G43のヌクレオ塩基は、それぞれArg1122の側鎖およびPhe351の主鎖カルボニル基と水素結合する。
【0944】
本発明の構造において、リピート:アンチリピート二本鎖は、主として、II型A〜C系内のCas9オルソログ間で配列および長さが異なるRECローブにより認識され(
図40、41)、密接に関連するII型系間でのみCas9およびsgRNAが交換可能である従来の観察と一致する(Fonfara et al.,2013)。3つのPAM遠位塩基対(C30:G39〜A32:U37)はCas9により認識されず、複合体から突出しており(
図34A)、Cas9結合リピート:アンチリピート二本鎖が宿主RNアーゼIII酵素によりプロセシングされる提案モデルと一致する(Deltcheva et al.,2011)。
【0945】
G21:U50ゆらぎペア中のG21およびU50のヌクレオ塩基は、それぞれガイド:DNA二本鎖中の末端C20:G1’ペアおよびブリッジヘリックス上のTyr72の側鎖とスタッキングし、U50 O4原子はArg75の側鎖と水素結合する(
図34E)。特に、A51は、syn立体構造を採用し、U50と逆の方向に配向される(
図33Cおよび34G)。A51のヌクレオ塩基は、PIドメイン中のPhe1105側鎖とリンカー中のU63ヌクレオ塩基との間に挟まれ、そのN7およびN1原子はそれぞれPhe1105の主鎖アミド基およびステムループ1中のG62 2’−ヒドロキシル基と水素結合する(
図34G)。リピート:アンチリピート二本鎖は、II型A〜C系間で配列および長さが異なる一方、G21:U50塩基対は、Cas9間で高度に保存され(Fonfara et al.,2013)、このことはこのゆらぎペア形成が3方向ジャンクション形成に関与する普遍的な構造的特徴であることを示唆する。
【0946】
リピート:アンチリピート二本鎖の配列依存的認識を確認するため、本出願人らは、Cas9媒介DNA開裂に対するリピート:アンチリピート突然変異の効果を評価し、Cas9活性を顕著に低減させる複数の突然変異を見出した(
図34C)。特に、Asp364との塩基特異的水素結合を形成するG43のアデニンによる置換は、Cas9活性を3倍超だけ低減させた。さらに、リピート:アンチリピート二本鎖中のフリップしたU44のアデニンによる置換は、開裂活性の5倍超の降下をもたらした一方、U44の別のピリミジン塩基(シトシン)による置換は、開裂活性に有意に影響を及ぼさなかった(
図34C)。これらの結果は、G43およびU44の塩基特異的認識がCas9によるsgRNA認識において重要な役割を担い得ることを示唆する。
【0947】
sgRNAステムループ1〜3は、Cas9と相互作用する:ステムループ1は、主として、RECローブによりPIドメインと一緒に認識される(
図34A)。ステムループ1(ヌクレオチド52、53、および59〜61)の骨格リン酸基は、REC1ドメイン(Leu455、Ser460、Arg467、Thr472、およびIle473)、PIドメイン(Lys1123およびLys1124)、およびブリッジヘリックス(Arg70およびArg74)と相互作用し、G58の2’−ヒドロキシル基はREC1ドメイン中のLeu455と水素結合する。A52は、表面から端部のπ−πスタッキング相互作用を介してPhe1105と相互作用し(
図34G)、フリップしたU59ヌクレオ塩基はAsn77の側鎖と水素結合する(
図34H)。
【0948】
ステムループ2および3、ならびに一本鎖リンカーは、主として、NUCローブにより認識され(
図34A);これは、NUCおよびRECローブの両方により認識されるステムループ1およびガイド:DNA/リピート:アンチリピート二本鎖とは対照的である。リンカー(ヌクレオチド63〜65および67)の骨格リン酸基は、RuvCドメイン(Glu57、Lys742、およびLys1097)、PIドメイン(Thr1102)、ブリッジヘリックス(Arg69)と相互作用し、U64およびA65の2’−ヒドロキシル基はそれぞれGlu57およびHis721と水素結合する(
図34I)。C67のヌクレオ塩基は、Val1100の主鎖アミド基と水素結合する(
図34I)。
【0949】
ステムループ2は、直接(A68N6およびG81O6原子間)および水媒介(A68N1およびG81N1原子間)水素結合相互作用により形成されるNUCローブと非ワトソン−クリックA68:G81ペアとの間の相互作用を介してCas9により認識される(
図34J)。A68およびG81のヌクレオ塩基は、それぞれSer1351およびTyr1356の側鎖に接触し、A68:G81ペアは水媒介水素結合を介してThr1358により認識される(
図34J)。A68の2’−ヒドロキシル基は、His1349の側鎖と水素結合し、G81の2−アミノ基は、Lys33の主鎖カルボニル基と水素結合する(
図34J)。
【0950】
ステムループ3は、ステムループ2よりも広くNUCローブと相互作用する(
図34K)。C91およびG92の骨格リン酸基は、RuvCドメイン(Arg40およびLys44)と相互作用する一方(
図34K)、G89およびU90のヌクレオ塩基はそれぞれGln1272およびGlu1225/Ala1227と水素結合する(
図34K)。A88およびC91のヌクレオ塩基は、複数の水素結合相互作用を介してAsn46の側鎖により認識される(
図34K)。
【0951】
Cas9およびsgRNAの構造的フレキシビリティー:HNHドメインは、PAM配列の3ヌクレオチド上流の位置における標的DNAの相補鎖を開裂するが(Gasiunas et al.,2012;Jinek et al.,2012)、本発明の構造において、HNHドメインは結合相補鎖の切断しやすいリン酸基から離れて位置決めされる(
図35A)。Mol A およびMol Bの構造比較は、HNHドメインによる相補鎖開裂への機序の見識を提供した。Mol Aにおいて、HNHドメインにはRuvCドメインのα40ヘリックスが続き、それはα40〜α41リンカー(残基919〜925)によりα41ヘリックスと接続される(
図35A)。Mol Aにおいて、残基913〜925はα43ヘリックスのC末端部分およびα43〜α44リンカーを形成する一方、Mol Bにおいて、それらの残基は、相補鎖の開裂部位に指向される伸長α−ヘリックスを形成する(
図35A)。これらの観察は、HNHドメインがHNHおよびRuvCドメインを接続するセグメントの立体構造変化を介して標的DNAにアプローチし、それを開裂し得ることを示唆する。
【0952】
さらに、構造比較は、RECおよびNUCローブ間の立体構造フレキシビリティーを明らかにした(
図35B)。Mol Aと比較して、Mol Bは、2つのローブがRuvCドメイン中のブリッジヘリックスとβ5鎖との間のヒンジループにおいて15°だけ回転されるよりオープンな立体構造を採用する(
図35B)。結合sgRNAは、ヒンジループと相互作用する一本鎖リンカーにおいて付随する立体構造変化も受ける(
図35C)。本出願人らは、リピート:アンチリピート二本鎖およびREC1ドメインのα2〜α3ループと相互作用するPIドメインのβ17〜β18ループの付随する変位も観察した(
図35B)。特に、α2〜α3およびβ17〜β18ループ間の相互作用を除き、本発明の構造において2つのローブ間の直接接触は存在せず(
図35D)、このことはCas9がsgRNAの不存在下で高度にフレキシブルであることを示唆する。Cas9のフレキシブル性は、Cas9−sgRNA−DNA三元複合体のアセンブリにおける役割を担う可能性が高い。
【0953】
ガイドRNAおよび標的DNAとの複合体におけるCas9の結晶構造は、crRNAガイド領域および標的DNAの相補鎖により形成される20bpのヘテロ二本鎖がCas9のRECおよびNUCローブ間の界面における正荷電溝中に収容され、標的の切断しやすいリン酸基は、HNHドメインによる開裂のために適切に位置決めされることを明らかにする。本発明の構造は非相補DNA鎖を含有しないが、結合相補鎖の位置は、非相補鎖の切断しやすいリン酸がRuvCドメインの活性部位に近接して局在することを示唆し、従来の生化学データと一致する(Gasiunas et al.,2012;Jinek et al.,2012)。さらに、本出願人らの構造および機能分析は、PIドメインが非相補鎖のPAM配列の認識に関与することを示す。
【0954】
これらの観察に基づき、本出願人らは、Cas9触媒RNAガイドDNA開裂のためのモデルを提案する(
図36)。Cas9は、PAM近位ガイド領域およびsgRNAのリピート:アンチリピート二本鎖を認識してCas9−sgRNA二元複合体を形成する。二元複合体は、続いて結合sgRNAの20ntガイド領域に相補的なDNA配列を認識し、最終的なCas9−sgRNA−標的DNA三元複合体を形成する。三元複合体形成の間、PIドメインは非相補鎖のPAM配列を認識し、R−ループ形成を容易にする。三元複合体のアセンブリ時、可動HNHドメインはガイド:DNA二本鎖中の相補鎖にアプローチし、それを開裂する一方、RuvCドメインは一本鎖非相補鎖を開裂する。
【0955】
本出願人らの結晶構造は、Cas9によるRNAガイドDNA標的化の分子機序の理解へのクリティカルステップを提供する。化膿連鎖球菌(S.pyogenes)Cas9または関連オルソログを用いるさらなる構造および機能研究、例として、非相補鎖を含有するCas9−sgRNA−DNA三元複合体の構造決定が、詳細、例えば、標的DNA上のPAM配列のCas9媒介認識またはsgRNA:DNA二本鎖間のミスマッチ許容の説明に重要であり得る。しかしながら、本発明の構造および機能分析は、Cas9ベースゲノムモジュレート技術の合理的エンジニアリングに有用な足場を既に提供する。本出願人らは、例えば、インビボおよび治療用途のためのサイズ制約ウイルスベクター中へのCas9のパッケージングを容易にする化膿連鎖球菌(S.pyogenes)Cas9トランケーション突然変異体を報告した(
図31B)。同様に、PIドメインの将来的なエンジニアリングは、PAM特異性のプログラミングを可能とし、標的部位認識フィデリティーを改善し、Cas9ゲノムエンジニアリングプラットフォームの多用途性を増加させる。
【0956】
実験手順
タンパク質調製:全長化膿連鎖球菌(S.pyogenes)Cas9(残基1〜1368)をコードする遺伝子を、改変pCold−GSTベクター(TaKaRa)のNdeIおよびXhoI部位間にクローニングした。タンパク質を20℃において大腸菌(Escherichia coli)Rosetta 2(DE3)(Novagen)中で発現させ、Ni−NTA Superflow樹脂(QIAGEN)により精製した。溶出させたタンパク質を4℃においてTEVプロテアーゼと一晩インキュベートしてGSTタグを除去し、Ni−NTA,Mono S(GE Healthcare)およびHiLoad Superdex 200 16/60(GE Healthcare)カラム上でのクロマトグラフィーによりさらに精製した。天然タンパク質について同様のプロトコルを使用してSeMet標識タンパク質を調製した。sgRNAは、PCR増幅テンプレートを使用してT7ポリメラーゼによりインビトロ転写させ、10%変性ポリアクリルアミドゲル電気泳動により精製した。標的DNAはSigma−Aldrichから購入した。精製したCas9タンパク質をsgRNAおよびDNA(モル比1:1.5:2)と混合し、次いで10mMのTris−HCl、pH8.0、150mMのNaClおよび1mMのDTTを含有する緩衝液中でSuperdex 200 Increaseカラム(GE Healthcare)を使用して複合体を精製した。
【0957】
結晶分析:精製したCas9−sgRNA−DNA複合体を懸滴蒸気拡散法により20℃において結晶化させた。結晶は、1μlの複合体溶液(A
260nm=15)および1μlの保存溶液(12%のPEG3,350、100mMのTris−HCl、pH8.0、200mMの酢酸アンモニウム、150mMのNaClおよび100mMのNDSB−256)を混合することにより得た。SeMet標識タンパク質を天然タンパク質についてのものと同様の条件下で結晶化させた。X線回折データを、SPring−8(兵庫、日本)においてビームラインBL32XUおよびBL41XUで100Kにおいて収集した。25%のエチレングリコールが補給された保存溶液中で、結晶を凍結保護した。X線回折データは、XDS(Kabsch,2010)を使用して処理した。構造は、SeMet標識結晶からの2.8Å分解能データを使用するSAD法により決定した。SHELXD(Sheldrick,2008)およびautoSHARP(delaFortelle and Bricogne,1997)を使用して潜在的な44個のSe原子の40個を局在させた。autoSHARPを使用して初期位相を計算し、DMを使用する2倍NCS平均化(Winn et al.,2011)によりさらに改善させた。このモデルは、PHENIX AutoSol(Adams et al.,2002)を使用して自動的に構築し、次いでCOOT(Emsley and Cowtan,2004)を使用して手動モデルを構築しPHENIX(Adams et al.,2002)を使用してリファインした。天然2.4Å分解能データを使用して得られたモデルをさらにリファインした。
【0958】
細胞培養および形質移入:ヒト胚性腎臓(HEK)細胞系293FT(Life Technologies)またはマウスNeuro2a(Sigma−Aldrich)細胞系を、10%のウシ胎仔血清(HyClone)、2mMのGlutaMAX(Life Technologies)、100U/mLのペニシリン、および100μg/mLのストレプトマイシンが補給されたダルベッコ改変イーグル培地(DMEM)中で37℃において5%のCO
2インキュベーションで維持した。細胞を24ウェルプレート(Corning)上に、形質移入24時間前に120,000個の細胞/ウェルの密度において播種した。Lipofectamine2000(Life Technologies)を製造業者の推奨プロトコルに従って使用して70〜80%のコンフルエンシーにおいて細胞を形質移入した。合計400ngのCas9プラスミドおよび100ngのU6::sgRNAのPCR産物を形質移入した。
【0959】
ゲノム改変のためのSURVEYORヌクレアーゼアッセイ:293FT細胞を、上記DNAにより形質移入した。細胞を37℃において形質移入後、72時間インキュベートしてからゲノムDNAを抽出した。ゲノムDNAは、QuickExtractDNA Extraction Solution(Epicentre)を製造業者のプロトコルに従って使用して抽出した。手短に述べると、ペレット化された細胞をQuickExtract溶液中で再懸濁させ、65℃において15分間、68℃において15分間、および98℃において10分間インキュベートした。
【0960】
それぞれの遺伝子についてのCRISPR標的部位をフランキングするゲノム領域をPCR増幅し、QiaQuick Spin Column(Qiagen)を製造業者のプロトコルに従って使用して産物を精製した。合計400ngの精製PCR産物を2μlの10×Taq DNAポリメラーゼPCR緩衝液(Enzymatics)と混合し、超純水で20μlの最終容量とし、リアニーリングプロセスに供してヘテロ二本鎖形成を可能とした:95℃において10分間、−2℃/秒における傾斜で95℃から85℃、−0.25℃/秒における85℃から25℃、および25℃において1分間維持。リアニーリング後、産物をSURVEYORヌクレアーゼおよびSURVEYORエンハンサーS(Transgenomics)により製造業者の推奨プロトコルに従って処理し、4〜20%のNovex TBEポリアクリルアミドゲル(Life Technologies)上で分析した。ゲルをSYBR Gold DNA染色(Life Technologies)により30分間染色し、Gel Docゲルイメージングシステム(Bio−rad)によりイメージングした。定量は、相対バンド強度に基づくものであった。インデル割合は、式100×(1−(1−(b+c)/(a+b+c))
1/2)(式中、aは、未消化PCR産物のインテグレート強度であり、bおよびcは、それぞれの開裂産物のインテグレート強度である)により決定した。
【0961】
ウエスタンブロット:HEK293FT細胞を形質移入し、プロテアーゼ阻害剤(Roche)が補給された1×RIPA緩衝液(Sigma−Aldrich)中で溶解させた。溶解物をBolt 4−12% Bis−Tris Plus Gel(Invitrogen)上にロードし、ニトロセルロース膜に転写した。膜は、0.1%のTween−20および5%のブロッキング剤(G−Biosciences)を含有するTris緩衝生理食塩水中でブロッキングした。膜をウサギ抗FLAG(1:5000、Abcam)、HRPコンジュゲート抗GAPDH(1:5,000 Cell Signaling Technology)、およびHRPコンジュゲート抗ウサギ(1:1000)によりプロービングした。ブロットをGel Doc XR+System(Bio−rad)上で可視化した。
【0962】
配列情報:
イタリック:3×FLAG配列
下線:NLS配列
野生型SpCas9
【化100】
[この文献は図面を表示できません]
【化101】
[この文献は図面を表示できません]
Sp_del(97−150)
【化102】
[この文献は図面を表示できません]
【化103】
[この文献は図面を表示できません]
Sp_del(175−307)
【化104】
[この文献は図面を表示できません]
【化105】
[この文献は図面を表示できません]
Sp_del(312−409)
【化106】
[この文献は図面を表示できません]
【化107】
[この文献は図面を表示できません]
Sp_del(1098−終端)
【化108】
[この文献は図面を表示できません]
【化109】
[この文献は図面を表示できません]
St3Cas9
【化110】
[この文献は図面を表示できません]
【化111】
[この文献は図面を表示できません]
SpCas9(C80L、C574A)
【化112】
[この文献は図面を表示できません]
【化113】
[この文献は図面を表示できません]
Sp_St3 Cas9キメラ(St3を太字)
【化114】
[この文献は図面を表示できません]
【化115】
[この文献は図面を表示できません]
St3_Sp Cas9キメラ(St3を太字)
【化116】
[この文献は図面を表示できません]
【化117】
[この文献は図面を表示できません]
SpCas9ニッカーゼ
突然変異残基(GCCに変化)を以下の順に太字で示す:D10、E762、N863、H983、D986
【化118】
[この文献は図面を表示できません]
SpCas9点突然変異体
突然変異残基(GCCに変化)を以下の順に太字で示す:R63A、R66A、R69A、R70A、R74A、R75A、R78A、K163A、R165A、K510A
【化119】
[この文献は図面を表示できません]
sgRNA配列:
ガイド配列を下線
【化120】
[この文献は図面を表示できません]
【0963】
【表411】
[この文献は図面を表示できません]
【0964】
実施例13:sgRNAのループ中へのMS2ループの挿入物によりsgRNAアーキテクチャーを改変することによりNeurog2遺伝子を標的化する最適化機能CRISPR−Cas系の生成
結晶構造情報(2013年12月12日に出願された米国仮特許出願第61/915,251号明細書、2014年1月22日に出願された同第61/930,214号明細書、2014年4月15日に出願された同第61/980,012号明細書に記載)は、sgRNAアーキテクチャーを改変するための構造情報を提供する。本出願人らは、sgRNAのテトラループおよびループ2の両方の伸長のための潜在的な空間が存在することを決定した(Cas9タンパク質との衝突なし)。本出願人らは、それらの位置におけるMS2ループの挿入物が、それらの2つの局在へのMS2結合タンパク質のリクルートメントを可能とし、それにより任意のエフェクター融合物(例えば、転写アクチベータードメインvp64、p65、転写リプレッサードメインSID4X、KRAB、または任意のエピジェネティックエフェクタードメイン)の遺伝子座特異的リクルートメントを媒介することを示した。実施例は、興味深い。Cas9−ガイド−標的DNA複合体の「外側」に露出されるガイド中の2つの4ntストレッチの同定に対するフォーカスが存在する(それら4ntステム末端とCas9アミノ酸との間の接触は、結晶中で同定されなかった)。一方の4ntストレッチはテトラループ中に収まり、他方の4ntストレッチはステムループ2中に収まる。これら4ntのストレッチの一方または両方は、アプタマー配列により置き換えることができる。一方または両方は、完全にもしくは部分的に置き換えることができ、またはその一方または両方は、完全に保持することができ、非コードループをその4ntの後に付加することができる。アプタマーは、ポリヌクレオチドであり、DNAまたはRNAであり得るが、RNAが好ましい。アプタマーは、特異的RNA配列を認識する対応するRNA結合タンパク質を有する。sgRNAのテトラループおよびループ2へのこれらのエフェクタードメインのリクルートメントは、標的化されるDNAに対してより好ましい位置決めを潜在的にもたらした(Cas9タンパク質へのエフェクタードメインのC末端融合物またはsgRNAのループ3の後のMs2ループの付加と比較して)。
【0965】
Neuro2a細胞(Sigma−Aldrich)を、OptiMEM(Life Technologies)と、5%のHyClone熱不活化FBS(Thermo Scientific)、1%のペニシリン/ストレプトマイシン(Life Technologies)が補給されたGlutaMaxおよびピルビン酸ナトリウム(Life Technologies)を有する高グルコースDMEMとを、1:1の比で含有する培地中で成長させ、1:5において2日ごとに継代した。形質移入18〜20時間前、120,000個の細胞を24ウェルプレートのそれぞれのウェル中でプレーティングした。細胞をLipofectamine形質移入試薬(Life Technologies)により製造業者の指示書に従って形質移入した。プラスミドDNAをMS2−VP64およびCas9構築物の形質移入に使用した一方、PCR産物をガイドRNA発現カセットについて形質移入した。
【0966】
RNeasyキット(Qiagen)を製造業者の指示書に従って使用してRNAを抽出し、qScript(Quanta Biosystems)を使用して試料当たり1mgのRNAを逆転写させた。標的化された遺伝子および内因性対照としてのGAPDHに特異的なTaqManプローブ(Life Technologies)を使用して逆転写定量PCR(qRT−PCR)により相対mRNAレベルを計測した。ddCt分析を使用してGFPのみにより形質移入された陰性対照に対する倍率変化を得た。
【0967】
結果は、テトラループおよびループ2中の両方の挿入物が有効であることならびに最も効率的な組合せは、dCas9−vp64およびMS2−vp64構築物との組合せでsgRNAのテトラループおよびループ2の両方中のMS2ループの挿入物を使用することを示した。この新たなアクチベーター設計(
図44に説明され、
図45にTL+L2:Ms2ガイドについて赤色バーとして示される)は、従来の設計(
図43に説明され、
図45に標準ガイドについて緑色バーとして示される)と比較してかなり高い標的遺伝子上方調節を媒介することが見出された。
【0968】
MS2パイロット配列を以下に示す:
Neurog2標的配列
GATACGATGAAAAGAATAAGC
テトラループMS2ステムループ挿入sgRNA足場
NNNNNNNNNNNNNNNNNNNNgttttagagctaggccAACATGAGGATCACCCATGTCTGCAGggcctagcaagttaaaataaggctagtccgttatcaCGCCGAAAGGCGggcaccgAGTcggtgcTTTTT
ループ2MS2ステムループ挿入sgRNA足場
NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttggccAACATGAGGATCACCCATGTCTGCAGggccaagtggcaccgAGTcggtgcTTTTT
テトラループおよびループ2MS2ステムループ挿入sgRNA足場
【化121】
[この文献は図面を表示できません]
標準ガイド足場
NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttGAAAaagtggcaccgAGTcggtgcTTTTT
MS2−vp64配列
【化122】
[この文献は図面を表示できません]
【0969】
実施例14:sgRNA骨格またはアーキテクチャーを改変することによる機能CRISPR−Cas系のさらなる最適化
本出願人らは、2つの追加の遺伝子標的(ヒトASCL1およびヒトMYOD1)に対するテトラループおよびループ2MS2ループ挿入の効率を試験し、VP64のCas9への標準C末端融合物と比較して実施例13に記載のsgRNA設計の増加した有効性を裏付けた(
図46および47参照)。本出願人らは、2つの異なる活性化ドメイン(例えば、VP64およびP65について)の組合せが相乗作用をもたらし、したがって同一の総数の単一タイプの活性化ドメインの使用と比較して標的遺伝子上方調節の増加した効率をもたらし得る仮定をさらに試験した。本出願人らは、遺伝子活性化のコンテクストにおけるChen,Baohui,et al.“Dynamic Imaging of Genomic Loci in Living Human Cells by an Optimized CRISPR/Cas System.”Cell 155.7(2013):1479−1491におけるCRISPR−Casイメージングのために最適化された代替ガイドアーキテクチャーも試験した。
【0970】
方法:
標的配列
ASCL1
GCAGCCGCTCGCTGCAGCAG
MYOD1
GGGCCCCTGCGGCCACCCCG
【0971】
細胞培養および形質移入ならびに遺伝子発現分析
熱不活化を特徴とする10%のHyCloneウシ胎仔血清(Thermo Scientific)および1%のペニシリン/ストレプトマイシン(Life Technologies)が補給されたGlutaMaxおよびピルビン酸ナトリウム(Life Technologies)を有する高グルコースDMEM中でヒトHEK293FT細胞を維持した。細胞を、1対2または1対2.5の比において毎日継代した。MS2/dCas9アクチベーター実験のため、20,000個のHEK293FT細胞を、ポリ−d−リジンコート96ウェルプレート(BD biosciences)中で100μLの培養培地中でプレーティングした。プレーティング24時間後、細胞を、1:1:1の質量比において、以下のものにより形質移入した:
・遺伝子特異的標的化配列を有するsgRNA骨格プラスミドまたはpUC19対照プラスミド
・MS2−VP64プラスミドまたはMS2−p65プラスミドまたはpUC19対照プラスミド
・dCas9プラスミドまたはdCas9−VP64プラスミドまたはdCas9−p65プラスミドまたはpUC19対照プラスミド
【0972】
1ウェル当たりの総プラスミド質量は、0.3マイクログラムであった。形質移入は、1.5uLのLipfectamine2000(Life Technologies)を製造業者の指示書に従って用いて実施した。細胞培地を形質移入5時間後に交換した。形質移入48時間後、Cells−to−Ctキット(Life Technologies)を使用して細胞溶解および逆転写を実施した。Taqman qPCRプローブ(LIfe technologies)およびFast Advanced Master Mix(Life Technologies)を使用して遺伝子発現レベルを定量した。ASCL1およびMYOD1発現レベルをGAPDH発現レベルに対して計算した。遺伝子発現レベル倍率は、GFPプラスミドのみにより形質移入された試料との比較により決定した。
【0973】
結果は、本出願人らが、2つの追加の遺伝子標的に対するテトラループおよびループ2MS2ループ挿入物の効率を検証し、Cas9へのVP64の標準C末端融合物と比較してその設計の増加した有効性を裏付けたことを示す。本出願人らは、2つの異なる活性化ドメインの組合せが標的遺伝子活性化を改善し得る仮定をさらに裏付けた(相乗作用を介して、例えば、異なるエピジェネティックモジュレーター、基本転写因子およびコアクチベーターのリクルートによる)。本出願人らは、Chen,Baohui,et al.“Dynamic Imaging of Genomic Loci in Living Human Cells by an Optimized CRISPR/Cas System.”Cell 155.7(2013):1479−1491におけるCRISPR/Cas9イメージングのために最適化された代替ガイドアーキテクチャーが、標準アーキテクチャーに対していかなる改善も示さないことも決定した。
【0974】
まとめると、これらの実験は、改善されたCas9アクチベーターアーキテクチャーが、MS2−VP64およびdCas9−P65またはMS2−P65およびdCas9−VP64のいずれかとの組合せでテトラループおよびループ2中のMS2ループ挿入物を有するsgRNAからなることを示した。
【0975】
MS2sgRNA足場配列情報
以下の全ての配列において、
NNNNNNNNNNNNNNNNNNNN
は、それぞれのsgRNAの遺伝子座特異的標的化配列を表す。
pSAMca006標準sgRNA骨格
NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTTT
Zhang研究室CRISPR/Cas9刊行物において使用される+83ヌクレオチドキメラ骨格
pSAMca002テトラループステム伸長+AUフリップsgRNA骨格
NNNNNNNNNNNNNNNNNNNNgtttaagagctatgctgGAAAcagcatagcaagtttaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTTT
【0976】
Chen,Baohui,et al.“Dynamic Imaging of Genomic Loci in Living Human Cells by an Optimized CRISPR/Cas System.”Cell 155.7(2013):1479−1491
におけるCRISPR/Cas9イメージングのために最適化された骨格。
+5位(標的配列の後の5番目のヌクレオチド)におけるTを、+36位におけるAと交換した。著者らは、この変化が+2から+5位における推定U6末端部位を除去することによりsgRNA濃度を増加させるはずであると示唆する。
TGCTGは、標準骨格の+12位の後に付加され、CAGCAは、標準骨格の+21位の後に付加される。これらの挿入物は、互いにペア形成してテトラループの塩基において伸長ステムを作出する。著者らは、このステム伸長がsgRNAの安定化に役立ち得ることを示唆する。
【0977】
テトラループおよびステムループ2sgRNA骨格上のpSAMca009MS2結合ループ
【化123】
[この文献は図面を表示できません]
MS2結合ループggccAACATGAGGATCACCCATGTCTGCAGggccは、標準sgRNA骨格のヌクレオチド+13から+16およびヌクレオチド+53から+56を置き換える。得られる構造は、テトラループおよびステムループ2配列がMS2結合ループにより置き換えられたsgRNA足場である。テトラループおよびステムループ2は、Cas9/RNA/DNA結晶構造から得られた情報に基づき置換のために選択した。具体的には、テトラループおよびステムループ2は、Cas9タンパク質から突出していることが見出され、その結果、MS2結合ループの付加がいかなるCas9残基も干渉しないことを示唆した。さらに、DNAへのテトラループおよびステムループ2部位の近位性は、それらの局在への局在化がDNAと、任意のリクルートされるタンパク質、例えば、転写アクチベーターとの間の高程度の相互作用をもたらすことを示唆した。
【0978】
テトラループおよびステムループ2上のpSAMca010MS2結合ループ+テトラループステム伸長+AUフリップsgRNA骨格
【化124】
[この文献は図面を表示できません]
標準sgRNA骨格の+5位におけるTを、標準sgRNA骨格の+36位におけるAと交換した。ステムループ伸長およびMS2結合ループ配列tgctgggccAACATGAGGATCACCCATGTCTGCAGggcccagcaは、標準sgRNA骨格ヌクレオチド+13から+16を置き換える。MS2結合ループ配列ggccAACATGAGGATCACCCATGTCTGCAGggccは、標準sgRNA骨格のヌクレオチド+53から+56を置き換える。得られる構造は、pSAMca002およびpSAMca009について記載される仮定を組み合わせる。
【0979】
テトラループおよびステムループ2上のpSAMca011MS2結合ループ+AUフリップsgRNA骨格
【化125】
[この文献は図面を表示できません]
標準sgRNA骨格の+5位におけるTを、標準sgRNA骨格の+36位におけるAと交換した。MS2結合ループ配列ggccAACATGAGGATCACCCATGTCTGCAGggccは、標準sgRNA骨格のヌクレオチド+13から+16およびヌクレオチド+53から+56を置き換える。得られる構造は、pSAMca009について記載される仮定を、pSAMca002(推定U6終結部を除去)のAUフリップ仮定と組み合わせる。この構築物は、それがpSAMca002からの追加のtgctgテトラループステム伸長を含まないという点でpSAMca010と異なり、テトラループステムの過剰伸長がpSAMca010の場合においてsgRNA機能性を縮小するか否かを決定する。
【0980】
テトラループ上のpSAMca003MS2結合ループ+ステムループ2GCトラクトスイッチsgRNA骨格
NNNNNNNNNNNNNNNNNNNNgttttagagctaggccAACATGAGGATCACCCATGTCTGCAGggcctagcaagttaaaataaggctagtccgttatcaCGCCgaaaGGCGggcaccgagtcggtgcTTTTTTT
MS2結合ループ配列ggccAACATGAGGATCACCCATGTCTGCAGggccは、標準sgRNA骨格のヌクレオチド+13から+16を置き換える。配列CGCCは、標準sgRNA骨格のヌクレオチド+49から+52を置き換える。配列GGCGは、標準sgRNA骨格のヌクレオチド+57から+60を置き換える。テトラループMS2結合ループ挿入は、上記pSAMca009について記載のものと同一の根拠により設計した。CGCCおよびGGCG配列は、ステムループ2のステム部分を置き換える。元のACTT−AAGTステムと比較してCGCC−GGCGステムの増加した塩基対形成強度は、ステムループ2構造に追加の安定性を提供し、それによりsgRNA性能または寿命を増加させると仮定された。
【0981】
ステムループ2GCトラクトなしのテトラループ上のpSAMca013MS2結合ループスイッチsgRNA骨格
NNNNNNNNNNNNNNNNNNNNgttttagagctaggccAACATGAGGATCACCCATGTCTGCAGggcctagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTTT
MS2結合ループ配列ggccAACATGAGGATCACCCATGTCTGCAGggccは、標準sgRNA骨格のヌクレオチド+13から+16を置き換える。テトラループMS2結合ループ挿入は、上記pSAMca009について記載のものと同一の根拠により設計した。
【0982】
テトラループおよびステムループ2上のpSAMca025MS2結合ループ+3’テールsgRNA骨格上の2つのMS2結合ループ
【化126】
[この文献は図面を表示できません]
短鎖リンカーにより離隔している2つのMS2結合ループを含む配列TAACATGAGGATCACCCATGTCTGCAGTGCAGGTCGACTCTAGAAACATGAGGATCACCCATGTを、標準sgRNA骨格のヌクレオチド+76および+77間に挿入した。本出願人らは、sgRNAの3’テールへの2つの追加のMS2結合ループの付加が、より多数のMS2ドメイン結合部位を提供し、活性化ドメインのリクルートメントの増加を容易にすることによりMS2/CRISPR/dCas9アクチベーター系の活性を増加させると仮定する。
【0983】
テトラループおよびステムループ1およびステムループ2sgRNA骨格上のpSAMca026MS2結合ループ
【化127】
[この文献は図面を表示できません]
MS2結合ループggccAACATGAGGATCACCCATGTCTGCAGggccは、標準sgRNA骨格のヌクレオチド+13から+16およびヌクレオチド+35から+38およびヌクレオチド+53から+56を置き換える。pSAMca009について記載のテトラループおよびステムループ1MS2結合ループ置換の他、この構造は、ステムループ1のループをMS2結合ループにより置き換える。Cas9/RNA/DNA結晶構造において観察されるステムループ1の露出状態は、この局在におけるMS2結合ループの付加がCas9/RNA/DNA相互作用を破壊しないことを示唆する。さらに、この局在において挿入されたMS2結合ループは、標的DNAに近い領域中のMS2−アクチベータータンパク質のリクルートメントを可能とする。
【0984】
MS2−アクチベータータンパク質情報
MS2−VP64
DNA配列
【化128】
[この文献は図面を表示できません]
アミノ酸配列
【化129】
[この文献は図面を表示できません]
説明
MS2−VP64アクチベータータンパク質は、N末端からC末端までの以下のドメインからなる:MS2バクテリオファージコートタンパク質のN55K突然変異体(Lim,F.,M.Spingola,and D.S.Peabody.“Altering the RNA binding specificity of a translational repressor.”Journal of Biological Chemistry 269.12(1994):9006−9010において、野生型MS2よりも高い結合親和性を有することが示されている)、3×GGGGSリンカー、SV40核局在化シグナル、およびVP64活性化ドメイン。機能的には、MS2ドメインがその特異的RNAアプタマーに結合し、3×GGGGSリンカーがMS2およびVP64ドメイン間の機械的フレキシビリティーを提供し、SV40核局在化シグナルが核中へのタンパク質の輸送を容易にし、VP64活性化ドメインが転写活性化を促進する。
【0985】
MS2−p65
DNA配列
【化130】
[この文献は図面を表示できません]
アミノ酸配列
【化131】
[この文献は図面を表示できません]
説明
MS2−VP64アクチベータータンパク質は、N末端からC末端まで以下のドメインからなる:MS2バクテリオファージコートタンパク質のN55K突然変異体(Lim,F.,M.Spingola,and D.S.Peabody.“Altering the RNA binding specificity of a translational repressor.”Journal of Biological Chemistry 269.12(1994):9006−9010において、野生型MS2よりも高い結合親和性を有することが示されている)、3×GGGGSリンカー、SV40核局在化シグナル、およびp65活性化ドメイン。機能的には、MS2ドメインがその特異的RNAアプタマーに結合し、3×GGGGSリンカーがMS2およびp65ドメイン間の機械的フレキシビリティーを提供し、SV40核局在化シグナルが核中へのタンパク質の輸送を容易にし、p65活性化ドメインが転写活性化を促進する。
【0986】
実施例15:異なるゲノム遺伝子座において区別される効果を同時に媒介するように多重化することによる機能CRISPR−Cas系のさらなる最適化
PP7は、バクテリオファージシュードモナス属(Pseudomonas)のRNA結合コートタンパク質である。MS2と同様に、それは特異的RNA配列および二次構造に結合する。PP7RNA認識モチーフは、MS2のものと区別される。結果的に、PP7およびMS2は、異なるゲノム遺伝子座において区別される効果を同時に媒介するように多重化することができる。例えば、遺伝子座Aを標的化するsgRNAはMS2ループにより改変することができ、MS2−VP64アクチベーターをリクルートする一方、遺伝子座Bを標的化する別のsgRNAは、PP7ループにより改変することができ、PP7−SID4Xリプレッサードメインをリクルートする(
図48)。したがって、同一の細胞において、dCas9は、オルソゴナル遺伝子座特異的改変を媒介し得る。この原理は、他のオルソゴナルRNA結合タンパク質、例えば、Q−ベータを取り込むように拡張することができる。
【0987】
PP7エフェクタータンパク質情報
本出願人らは、実施例13および14に既に記載のとおりPP7エフェクター構築物を構築する。これらの構築物に関する配列情報を以下に提供する:
PP7−VP64
DNA配列
【化132】
[この文献は図面を表示できません]
アミノ酸配列
【化133】
[この文献は図面を表示できません]
説明
PP7−VP64アクチベータータンパク質は、N末端からC末端まで以下のドメインからなる:PP7シュードモナス属(Pseudomonas)バクテリオファージコートタンパク質(Wu,Bin,Jeffrey A.Chao,and Robert H.Singer.“Fluorescence fluctuation spectroscopy enables quantitative imaging of single mRNAs in living cells.”Biophysical journal 102.12(2012):2936−2944およびChao,Jeffrey A.,et al.“Structural basis for the coevolution of a viral RNA−protein complex.”Nature structural&molecular biology 15.1(2007):103−105に記載のとおり、アミノ酸68〜69がSGに突然変異しており、野生型タンパク質からアミノ酸70〜75が欠失している)、3×GGGGSリンカー、SV40核局在化シグナル、およびVP64活性化ドメイン。機能的には、PP7ドメインがその特異的RNAアプタマーに結合し、3×GGGGSリンカーがMS2およびVP64ドメイン間の機械的フレキシビリティーを提供し、SV40核局在化シグナルが核中へのタンパク質の輸送を容易にし、VP64活性化ドメインが転写活性化を促進する。
【0988】
PP7−SID4X
DNA配列
【化134】
[この文献は図面を表示できません]
アミノ酸配列
【化135】
[この文献は図面を表示できません]
説明
PP7−SID4Xリプレッサータンパク質は、N末端からC末端まで以下のドメインからなる:PP7シュードモナス属(Pseudomonas)バクテリオファージコートタンパク質(Wu,Bin,Jeffrey A.Chao,and Robert H.Singer.“Fluorescence fluctuation spectroscopy enables quantitative imaging of single mRNAs in living cells.”Biophysical journal 102.12(2012):2936−2944およびChao,Jeffrey A.,et al.“Structural basis for the coevolution of a viral RNA−protein complex.”Nature structural&molecular biology 15.1(2007):103−105に記載のとおり、野生型タンパク質からアミノ酸68〜69がSGに突然変異しており、アミノ酸70〜75が欠失している)、3×GGGGSリンカー、SV40核局在化シグナル、およびSID4Xリプレッサードメイン。機能的には、PP7ドメインがその特異的RNAアプタマーに結合し、3×GGGGSリンカーがMS2およびSID4Xドメイン間の機械的フレキシビリティーを提供し、SV40核局在化シグナルが核中へのタンパク質の輸送を容易にし、SID4Xドメインが転写活性化を抑制する。
【0989】
PP7−KRAB
DNA配列
【化136】
[この文献は図面を表示できません]
アミノ酸配列
【化137】
[この文献は図面を表示できません]
説明
PP7−KRABリプレッサータンパク質は、N末端からC末端まで以下のドメインからなる:PP7シュードモナス属(Pseudomonas)バクテリオファージコートタンパク質(Wu,Bin,Jeffrey A.Chao,and Robert H.Singer.“Fluorescence fluctuation spectroscopy enables quantitative imaging of single mRNAs in living cells.”Biophysical journal 102.12(2012):2936−2944およびChao,Jeffrey A.,et al.“Structural basis for the coevolution of a viral RNA−protein complex.”Nature structural&molecular biology 15.1(2007):103−105に記載のとおり、野生型タンパク質からアミノ酸68〜69がSGに突然変異しており、アミノ酸70〜75が欠失している)、3×GGGGSリンカー、SV40核局在化シグナル、およびKRABリプレッサードメイン。機能的には、PP7ドメインがその特異的RNAアプタマーに結合し、3×GGGGSリンカーがMS2およびKRABドメイン間の機械的フレキシビリティーを提供し、SV40核局在化シグナルが核中へのタンパク質の輸送を容易にし、KRABドメインが転写活性化を抑制する。
【0990】
PP7−NUE
DNA配列
【化138】
[この文献は図面を表示できません]
【化139】
[この文献は図面を表示できません]
アミノ酸配列
【化140】
[この文献は図面を表示できません]
説明
PP7−NUEヒストンエフェクタータンパク質は、N末端からC末端まで以下のドメインからなる:PP7シュードモナス属(Pseudomonas)バクテリオファージコートタンパク質(Wu,Bin,Jeffrey A.Chao,and Robert H.Singer.“Fluorescence fluctuation spectroscopy enables quantitative imaging of single mRNAs in living cells.”Biophysical journal 102.12(2012):2936−2944およびChao,Jeffrey A.,et al.“Structural basis for the coevolution of a viral RNA−protein complex.”Nature structural&molecular biology 15.1(2007):103−105に記載のとおり、野生型タンパク質からアミノ酸68〜69がSGに突然変異しており、アミノ酸70〜75が欠失している)、3×GGGGSリンカー、SV40核局在化シグナル、およびクラミジア・トラコマチス(Chlamydia trachomatis)からのNUEヒストンメチルトランスフェラーゼドメイン。機能的には、PP7ドメインがその特異的RNAアプタマーに結合し、3×GGGGSリンカーがMS2およびNUEドメイン間の機械的フレキシビリティーを提供し、SV40核局在化シグナルが核中へのタンパク質の輸送を容易にし、NUEドメインが抑制ヒストンメチル化を増加させる。
【0991】
PP7−NcoR
DNA配列
【化141】
[この文献は図面を表示できません]
アミノ酸配列
【化142】
[この文献は図面を表示できません]
説明
PP7−NcoRヒストンエフェクタータンパク質は、N末端からC末端まで以下のドメインからなる:PP7シュードモナス属(Pseudomonas)バクテリオファージコートタンパク質(Wu,Bin,Jeffrey A.Chao,and Robert H.Singer.“Fluorescence fluctuation spectroscopy enables quantitative imaging of single mRNAs in living cells.”Biophysical journal 102.12(2012):2936−2944およびChao,Jeffrey A.,et al.“Structural basis for the coevolution of a viral RNA−protein complex.”Nature structural&molecular biology 15.1(2007):103−105に記載のとおり、野生型タンパク質からアミノ酸68〜69がSGに突然変異しており、アミノ酸70〜75が欠失している)、3×GGGGSリンカー、SV40核局在化シグナル、およびヒトNcoRタンパク質のHDACリクルータードメイン(野生型のアミノ酸420〜488)。機能的には、PP7ドメインがその特異的RNAアプタマーに結合し、3×GGGGSリンカーがMS2およびNcoRドメイン間の機械的フレキシビリティーを提供し、SV40核局在化シグナルが核中へのタンパク質の輸送を容易にし、NcoRドメインがヒストンデアセチラーゼをリクルートし、抑制ヒストン修飾をもたらす。
【0992】
他の潜在的なオルソゴナルRNA結合タンパク質:追加のオルソゴナルRNA結合タンパク質/アプタマー組合せは、多様なバクテリオファージコートタンパク質内に存在する。これらの代替的な組合せを使用して本出願人らがMS2およびPP7について記載したものに類似する転写モジュレーターまたはDNAエフェクターを開発することができる。このようなコートタンパク質のリストとしては、限定されるものではないが、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s、PRR1が挙げられる。
【0993】
実施例16:MS2CasLITE
本発明のさらなる実施形態は、2013年7月21日に出願され、2014年1月30日にPCT特許出願公開の国際公開第2014018423A2号パンフレットとして公開されたPCT出願PCT/US2013/051418号明細書、表題「INDUCIBLE DNA BINDING PROTEINS AND GENOME PERTURBATION TOOLS AND APPLICATIONS THEREOF」(これらの内容は、参照により全体として本明細書に組み込まれる)に記載の誘導性CRISPR−Cas系におけるさらなる適用を伴う実施例13および14に記載のMS2ループによるsgRNAアーキテクチャーの改変を含む。
【0994】
本出願人らは、CRY2およびCIB1タンパク質をそれぞれ転写活性化ドメインおよびDNA結合ドメインに融合して内因性転写の遺伝子座特異的光誘導性制御を可能とすることができることを既に示した(Konermann S,Brigham MD,Trevino AE,Hsu PD,Heidenreich M,Cong L,Platt RJ,Scott DA,Church GM,Zhang F..“Optical control of endogenous mammalian transcription and epigenetic states.”Nature.2013 Aug 22;500(7463):472−6)。本出願人らは、この系をdCas9転写エフェクターに拡張することができることをさらに示した。本出願人らは、dCas9−sgRNAおよびCRY2−VP64転写アクチベータードメインに結合しているMS2−CIB1リクルートメント成分により特徴付けられる類似のdCas9ベース光誘導性MS2エフェクターを生成する。青色光による活性化時、CRY2−VP64はMS2−CIB1と会合し、標的遺伝子座への転写機構のリクルートメントを可能とする。
【0995】
新規MS2−CIB1誘導性リクルートメント複合体は、N末端からC末端まで以下のドメインからなる:MS2バクテリオファージコートタンパク質のN55K突然変異体(Lim,F.,M.Spingola,and D.S.Peabody.“Altering the RNA binding specificity of a translational repressor.”Journal of Biological Chemistry 269.12(1994):9006−9010に野生型MS2よりも高い結合親和性を有することが示されている)、3×GGGGSリンカー、SV40核局在化シグナル、およびp65活性化ドメイン。機能的には、MS2ドメインがその特異的RNAアプタマーに結合し、3×GGGGSリンカーがMS2およびCIB1ドメイン間の機械的フレキシビリティーを提供し、SV40核局在化シグナルが核中へのタンパク質の輸送を容易にし、CIB1ドメインが光感受性クリプトクロム2(CRY2)のヘテロダイマー結合パートナーである。
【0996】
上記実施例に考察される代替的なsgRNA設計、オルソゴナルRNA結合タンパク質、およびMS2融合アーキテクチャーは、全体的に、MS2−CIB1融合物と同等であり、CIB1は「エフェクター」ドメインとして作用する。既に記載されているdCas9−CIB1は、MS2−CIB1と同等でもあり得、すなわち、dCas9−CIB1およびMS2−CIB1融合物のタンデムでの使用は、標的遺伝子発現の誘導性操作についての機能的利点を提供し得る。最終的に、最適化されたLITEアーキテクチャーをKonermann et al 2013に記載のとおり用いることができる。
【0997】
MS2CasLITE構築物についての配列情報を以下に提供する:
MS2−CIB1DNA配列
【化143】
[この文献は図面を表示できません]
MS2−CIB1アミノ酸配列:
【化144】
[この文献は図面を表示できません]
【0998】
実施例17:結晶構造情報により提供される新たなdCas9アクチベーター構築物
最適化CRISPR/Cas9アクチベーター系は、sgRNA骨格において改善を要求するだけでなく、dCas9−アクチベーター融合構築物においても改善を要求する。Cas9/RNA/DNA結晶構造は、dCas9−アクチベーター機能を改善するためのいくつかの仮定の生成をもたらした。結晶構造は、標準dCas9アクチベーターの活性化ドメインが融合しているdCas9のC末端が、標的DNAに不十分に局在することを示した。これらの仮定の全てではないがほとんどが、C末端以外のdCas9タンパク質内の活性化ドメインに好ましい局在を見出すことによりdCas9−アクチベーター機能を改善するように求める。
【0999】
手短に述べると:
− dCas9Rec2ドメインを転写エフェクタードメインにより置き換え、
− dCas9HNHドメインを転写エフェクタードメインにより置き換え、
− 転写エフェクタードメインを、dCas9内のフレキシブルリンカー:アミノ酸553、575、または1153の部位において挿入し、
− D10AおよびH840A突然変異ではなく、D10AおよびN863A突然変異の組合せにより触媒的に不活性なdCas9を作出する。
【1000】
転写エフェクタードメインによるdCas9Rec2ドメインの置換:
Cas9/RNA/DNA結晶構造実験は、Rec2ドメインが欠失したCas9突然変異体が顕著なレベルのヌクレアーゼ活性を維持することを示した。この知見は、Rec2ドメインがCas9/RNA/DNA複合体の形成に不可欠でないことを示唆する。本出願人らは、転写エフェクタードメインによるdCas9中のRec2ドメインの置換がdCas9/RNA/DNA複合体の形成を阻害せず、転写エフェクタードメインと標的DNAとの間のより効率的な相互作用を容易にし得ると仮定する。いくつかの構築物を合成してこの理論を調査した。
【1001】
それぞれの場合において、dCas9のアミノ酸175〜306を以下のインサートの1つにより置き換え、サブドメインをNからC末端まで列記する:
− VP64活性化ドメイン
− 3×GGGGSリンカー、VP64活性化ドメイン、3×GGGGSリンカー
− p65活性化ドメイン
− 3×GGGGSリンカー、p65活性化ドメイン、3×GGGGSリンカー
【1002】
【表412】
[この文献は図面を表示できません]
【1003】
転写エフェクタードメインによるHNHドメインの置換:
結晶構造に基づくと、HNHドメインはDNA/RNAハイブリッドに近接して局在する。さらに、それは立体構造変化の結果として移動し得るフレキシブルドメインである一方、Cas9が標的DNAに結合していることが見出された。これは、N末端上の不規則リンカーおよびC末端上のa39〜a40リンカーによりフランキングされ、それは伸長a−ヘリックスの立体構造変化を受け得、HNHドメインをその標的DNA塩基近くに移動させる。標的DNAへの近位性および結晶中で同定されたフレキシビリティーは、このヌクレアーゼドメインを有望な転写エフェクタードメインにより置き換える。説明については
図49参照。
【1004】
本出願人らは、AA775〜901(HNHドメインの)を、挿入される転写エフェクタードメインの両側上の(GGGGS)3または(GGGGS)6リンカーによりフランキングされるvp64またはP65のいずれかにより置き換える。
【1005】
【表413】
[この文献は図面を表示できません]
【1006】
dCas9の3つのループ中への転写ドメインの挿入物:
既存のドメイン(例えば、HNH、Rec2)を転写エフェクタードメインにより置き換える他、転写エフェクタードメインをCas9タンパク質中の異なる位置において挿入することが可能であり得る。結晶構造は、そのような挿入に有望なループの同定に役立つ(挿入のための場所に好ましい特性としては、低い二次構造複雑性(ループとヘリックスまたはシート、追加のドメインのための非閉塞空間、標的DNAへの近位性および標的DNAまたはsgRNAのいずれかとの目下の相互作用がないこと(それというのも、それらは転写エフェクタードメインの付加により破壊され得るため)が挙げられる)。
【1007】
本出願人らは、3つの好ましい位置:G533、F575およびK1153を同定した。Cas9タンパク質中のG533およびK1153の局在を対応する
図49に示す。本出願人らは、挿入される転写エフェクタードメインの両側の(GGGGS)1または(GGGGS)3リンカーによりフランキングされるvp64またはP65のいずれかをそれら3つの局在において挿入する。
【1008】
【表414】
[この文献は図面を表示できません]
【1009】
dCasアクチベーター配列情報を以下に提供する:
dCas9Rec2ドメインを転写エフェクタードメインにより置き換える
pSAMca042dCas(hel2−−>vp64)−DNA
【化145】
[この文献は図面を表示できません]
【化146】
[この文献は図面を表示できません]
【化147】
[この文献は図面を表示できません]
pSAMca042dCas(hel2−−>vp64)−アミノ酸
【化148】
[この文献は図面を表示できません]
pSAMca043dCas(hel2−−>vp64、GSリンカー)−DNA
【化149】
[この文献は図面を表示できません]
【化150】
[この文献は図面を表示できません]
【化151】
[この文献は図面を表示できません]
【化152】
[この文献は図面を表示できません]
pSAMca043dCas(hel2−−>vp64、GSリンカー)−アミノ酸
【化153】
[この文献は図面を表示できません]
pSAMca044dCas(hel2−−>P65)−DNA
【化154】
[この文献は図面を表示できません]
【化155】
[この文献は図面を表示できません]
【化156】
[この文献は図面を表示できません]
【化157】
[この文献は図面を表示できません]
pSAMca044dCas(hel2−−>P65)−アミノ酸
【化158】
[この文献は図面を表示できません]
pSAMca045dCas(hel2−−>P65GSリンカー)−DNA
【化159】
[この文献は図面を表示できません]
【化160】
[この文献は図面を表示できません]
【化161】
[この文献は図面を表示できません]
pSAMca045dCas(hel2−−>P65GSリンカー)−アミノ酸
【化162】
[この文献は図面を表示できません]
HNHドメインを転写エフェクタードメインにより置き換える
pSAMca050dCas9(HNH−−>vp64、3×GS)−DNA
【化163】
[この文献は図面を表示できません]
【化164】
[この文献は図面を表示できません]
【化165】
[この文献は図面を表示できません]
【化166】
[この文献は図面を表示できません]
pSAMca050dCas9(HNH−−>vp64、3×GS)−AA
【化167】
[この文献は図面を表示できません]
pSAMca051dCas9(HNH−−>vp64、6×GS)−DNA
【化168】
[この文献は図面を表示できません]
【化169】
[この文献は図面を表示できません]
【化170】
[この文献は図面を表示できません]
pSAMca051dCas9(HNH−−>vp64、6×GS)−AA
【化171】
[この文献は図面を表示できません]
pSAMca052dCas9(HNH−−>P65、3×GS)−DNA
【化172】
[この文献は図面を表示できません]
【化173】
[この文献は図面を表示できません]
【化174】
[この文献は図面を表示できません]
pSAMca052dCas9(HNH−−>P65、3×GS)−AA
【化175】
[この文献は図面を表示できません]
pSAMca053dCas9(HNH−−>P65、6×GS)−DNA
【化176】
[この文献は図面を表示できません]
【化177】
[この文献は図面を表示できません]
【化178】
[この文献は図面を表示できません]
【化179】
[この文献は図面を表示できません]
pSAMca053dCas9(HNH−−>P65、6×GS)−AA
【化180】
[この文献は図面を表示できません]
【化181】
[この文献は図面を表示できません]
dCas9の3つのループ中への転写ドメインの挿入物
pSAMca054dCas9(G533−vp64、1×GS)−DNA
【化182】
[この文献は図面を表示できません]
【化183】
[この文献は図面を表示できません]
【化184】
[この文献は図面を表示できません]
【化185】
[この文献は図面を表示できません]
pSAMca054dCas9(G533−vp64、1×GS)−AA
【化186】
[この文献は図面を表示できません]
pSAMca055dCas9(G533−vp64、3×GS)−DNA
【化187】
[この文献は図面を表示できません]
【化188】
[この文献は図面を表示できません]
【化189】
[この文献は図面を表示できません]
pSAMca055dCas9(G533−vp64、3×GS)−AA
【化190】
[この文献は図面を表示できません]
pSAMca056dCas9(G533−P65、1×GS)−DNA
【化191】
[この文献は図面を表示できません]
【化192】
[この文献は図面を表示できません]
【化193】
[この文献は図面を表示できません]
【化194】
[この文献は図面を表示できません]
pSAMca056dCas9(G533−P65、1×GS)−AA
【化195】
[この文献は図面を表示できません]
pSAMca057dCas9(G533−P65、3×GS)−DNA
【化196】
[この文献は図面を表示できません]
【化197】
[この文献は図面を表示できません]
【化198】
[この文献は図面を表示できません]
【化199】
[この文献は図面を表示できません]
pSAMca057dCas9(G533−P65、3×GS)−AA
【化200】
[この文献は図面を表示できません]
pSAMca058dCas9(F575−vp64、1×GS)−DNA
【化201】
[この文献は図面を表示できません]
【化202】
[この文献は図面を表示できません]
【化203】
[この文献は図面を表示できません]
pSAMca058dCas9(F575−vp64、1×GS)−AA
【化204】
[この文献は図面を表示できません]
pSAMca059dCas9(F575−vp64、3×GS)−DNA
【化205】
[この文献は図面を表示できません]
【化206】
[この文献は図面を表示できません]
【化207】
[この文献は図面を表示できません]
【化208】
[この文献は図面を表示できません]
pSAMca059dCas9(F575−vp64、3×GS)−AA
【化209】
[この文献は図面を表示できません]
pSAMca060dCas9(F575−P65、1×GS)−DNA
【化210】
[この文献は図面を表示できません]
【化211】
[この文献は図面を表示できません]
【化212】
[この文献は図面を表示できません]
pSAMca060dCas9(F575−P65、1×GS)−AA
【化213】
[この文献は図面を表示できません]
pSAMca061dCas9(F575−P65、3×GS)−DNA
【化214】
[この文献は図面を表示できません]
【化215】
[この文献は図面を表示できません]
【化216】
[この文献は図面を表示できません]
【化217】
[この文献は図面を表示できません]
pSAMca061dCas9(F575−P65、3×GS)−AA
【化218】
[この文献は図面を表示できません]
pSAMca062dCas9(K1153−vp64、1×GS)−DNA
【化219】
[この文献は図面を表示できません]
【化220】
[この文献は図面を表示できません]
【化221】
[この文献は図面を表示できません]
【化222】
[この文献は図面を表示できません]
pSAMca062dCas9(K1153−vp64、1×GS)−AA
【化223】
[この文献は図面を表示できません]
pSAMca063dCas9(K1153−vp64、3×GS)−DNA
【化224】
[この文献は図面を表示できません]
【化225】
[この文献は図面を表示できません]
【化226】
[この文献は図面を表示できません]
pSAMca063dCas9(K1153−vp64、3×GS)−AA
【化227】
[この文献は図面を表示できません]
pSAMca064dCas9(K1153−P65、1×GS)−DNA
【化228】
[この文献は図面を表示できません]
【化229】
[この文献は図面を表示できません]
【化230】
[この文献は図面を表示できません]
【化231】
[この文献は図面を表示できません]
pSAMca064dCas9(K1153−P65、1×GS)−AA
【化232】
[この文献は図面を表示できません]
【化233】
[この文献は図面を表示できません]
pSAMca065dCas9(K1153−P65、3×GS)−DNA
【化234】
[この文献は図面を表示できません]
【化235】
[この文献は図面を表示できません]
【化236】
[この文献は図面を表示できません]
【化237】
[この文献は図面を表示できません]
pSAMca065dCas9(K1153−P65、3×GS)−AA
【化238】
[この文献は図面を表示できません]
【1010】
実施例18:新たな触媒不活性dCas9タンパク質
本発明の別の態様において、新規dCas9突然変異体を作出する。触媒不活性dCas9を、D10AおよびH840A突然変異ではなく、D10AおよびN863A突然変異の組合せにより生成する。
【1011】
文献および本出願人らの従来の実験において使用される触媒不活性dCas9突然変異体は、野生型Cas9タンパク質内の突然変異D10AおよびH840Aにより生成した。結晶構造から、本出願人らは、H840Aは機能DNAニッカーゼを形成し得ないことを観察した。この結果は、H840A突然変異が、最初に仮定されたCas9タンパク質に対してより大きい機能不全効果を有することを示唆し;元の理論は、H840Aが単一核酸分解(nucleopytic)部位の損失をもたらし、他の効果を有さないことである。H840A突然変異がdCas9タンパク質の他の機能または立体構造特性を破壊している場合、dCas9−アクチベーター融合物がH840Aにより部分的に損傷され得るのは当然である。したがって、本出願人らは、他のCas9機能を破壊せずにHNHヌクレアーゼ活性をノックアウトし得るHNHドメイン内の他の突然変異を見出すことに興味を覚える。Cas9/RNA/DNA結晶構造マニュスクリプトは、正確にそのような突然変異として突然変異N863Aを同定し:N863Aは、Cas9二本鎖ヌクレアーゼ活性をノックアウトするが、ニッカーゼ活性を許容し、このことはN863A Cas9の全体的な機能が完全には破壊されないことを示唆する。この観察に照らし、本出願人らは、dCas9−アクチベーターとして使用される二重ノックアウトD10A N863A Cas9突然変異体を合成した。
【1012】
【表415】
[この文献は図面を表示できません]
【1013】
D10AおよびH840A突然変異ではなく、D10AおよびN863A突然変異の組合せにより触媒不活性dCas9を作出するための配列情報を以下に提供する:
pSAMca041dCas(N863A)−vp64−DNA
【化239】
[この文献は図面を表示できません]
【化240】
[この文献は図面を表示できません]
【化241】
[この文献は図面を表示できません]
【化242】
[この文献は図面を表示できません]
pSAMca041dCas(N863A)−vp64−アミノ酸
【化243】
[この文献は図面を表示できません]
【1014】
実施例19:MS2sgRNA配列アーキテクチャー−新たなMS2/dCas9/sgRNAバージョン
本出願人らは、MS2sgRNA配列アーキテクチャーの効果を理解するために追加の3’MS2構築物および他のMS2sgRNA改変を生成した。実施された実験は、MS2sgRNA配列アーキテクチャーに関する2つのさらなる考えにフォーカスした。
【1015】
第1に、MS2結合ステムを、sgRNAの天然ステムループ中へのそれらの結合部位の挿入ではなくsgRNAの3’終端において配置する考え。3’MS2結合部位のペアの使用は、Mali,Prashant,et al.“CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering.”Nature biotechnology(2013))に既に記載されているが、この系は標準dCas9−VP64/sgRNA活性化系よりも不十分に機能することが見出された。本出願人らは、sgRNAの3’終端における2つのMS2結合部位、ならびにテトラループおよびステムループ2の両方におけるMS2部位を有する本出願人ら自身の設計のsgRNAが、Mali et al.からの3’MS2sgRNAよりも高いレベルにおいてASCL1およびMYOD1の両方を活性化させることを見出した(
図50参照)。しかしながら、テトラループおよびステムループ2においてのみMS2部位を有する本出願人らのMS2 1.0は、3’MS2sgRNAアーキテクチャーのいずれよりも強力であった(
図50参照)。
【1016】
第2に、本出願人らは、MS2 1.0アーキテクチャー内のバリエーションを試験した。これらの改変としては、限定されるものではないが、MS2 1.0結合部位ステムからのバルジの除去、MS2 1.0に付加された安定化GCトラクトの除去、天然sgRNAステムをMS2結合部位のステムにより置き換えることによるエンジニアリングされたステムの短縮、ならびにそれらのアプローチの組合せが挙げられた。これらの改変は、ASCL1またはMYOD1のいずれの活性化レベルに対してもほとんど効果を有さず、このことはMS2ステムループがMS2/dCas9/sgRNA活性化コンテクスト内の構造変化にいくぶんロバストであることを示唆した。
図51に示されるテトラループ改変の他、同等の改変もステムループ2におけるMS2結合部位について試験し、同様の結果であった。
【1017】
dCas9タンパク質改変(NLS、N863A):本出願人らは、dCas9−アクチベータータンパク質の改善のための2つの仮定を試験した。第1に、dCas9中で含有されるNLSの他、VP64リンカーへの第2のSV40核局在化シグナルの付加を、dCas9核局在化および転写モジュレーション活性の改善方法として試験した。dCas9のN末端における第2のNLSの配置は、いくつかのコンテクストにおいて活性化を増加させることが観察された。第2のNLSをVP64活性化ドメインのC末端において配置した場合に効果が縮小した。後の実験(
図54および55)は、それらの効果を裏付け、第2のSV40シグナルではなく、N末端アルファ−インポーチンNLSの使用による考えられる改善を示唆する。
【1018】
第2に、本出願人らは、Nishimasu et al.“Crystal structure of Cas9 in complex with guide RNA and target DNA.”Cell.2014 Feb 27;156(5):935−49に実証されており、機能ニッカーゼ作出突然変異部位であるN863A突然変異を使用するdCas9のバージョンを作出した。この突然変異は、最適未満のニッカーゼ作出突然変異であることが観察されたH840A突然変異を置き換え、このことはH840A突然変異が、それをD10A突然変異と使用してヌクレアーゼ活性を停止させることができるが、ある程度、ニッカーゼまたはdCas9タンパク質の立体構造または機能性に有害であることを示唆する。本出願人らは、N863A dCas9が、ASCL1およびMYOD1についてそれぞれ
図52および53に示されるとおり、あるコンテクストにおいてより強力なアクチベータータンパク質として作用することを観察した。
【1019】
新たなMS2アクチベーター融合タンパク質(HSF1、MyoTAD):同一アクチベーター複合体(dCasおよびMS2)中の2つの異なる活性化ドメイン(P65およびVP64)の組合せが単独で2回使用されるいずれかのドメインよりも大きい活性化を生じさせる本出願人らの従来の知見に基づき、本出願人らは、さらに異なる活性化ドメイン間の相乗作用についての潜在性を試験することを求めた。本出願人らは、2つの区別される活性化ドメイン(HSF1活性化ドメインとの組合せのP65またはMyoDトランス活性化ドメインとの組合せのP65のいずれか)を有するMS2の融合タンパク質を構築した。本出願人らは、個々のまたは組合せ活性化ドメインに融合しているMS2との組合せの、異なるNLSおよび点突然変異dCas−VP64アーキテクチャーを有する構築物を使用してASCL1およびMYOD1の両方の上方調節倍率を観察した。a−インポーチンNLSの付加が核へのCas9の局在化に対して好ましい効果を有することおよびN863A突然変異が強力なアクチベーターを生成するために有利な突然変異であることが留意された(
図53および55)。本出願人らは、異なるアクチベータードメインの組合せが増加した効果を有することも決定した。例えば、p65−HSF1融合物を有する構築物は、p65単独を有する構築物よりも強力なアクチベーターであることが見出された(
図56および57)。
【1020】
PP7−VP64活性化:本出願人らが用いたMS2ファージコートタンパク質の他、多数のファージコートタンパク質がRNA配列特異的結合を示す。本出願人らは、PP7ファージからのRNA結合ドメインを使用してオルソゴナル活性化系を設計および試験した。この新たな系は、通常(既に記載)のdCas9−アクチベータータンパク質、PP7−アクチベーター融合タンパク質、ならびにPP7結合部位がテトラループおよびステムループ2においてインテグレートされたsgRNAを含む。本出願人らは、PP7系がMS2/dCas9/sgRNA活性化系と同程度に十分に機能することを観察した。これらの結果は、sgRNA RNAアプタマーアプローチが一般化可能であり、dCas9および相互排除RNA結合タンパク質(例えば、MS2、PP7、qベータ、GAなど)を使用するオルソゴナルモジュレーションモダリティの将来的な可能性につながることを示唆する。
【1021】
標的多様性:
困難な活性化標的およびsgRNA TSS近位性:CRISPR/Cas9転写モジュレーションに関する本出願人らの早期の研究、および公開文献は、大多数の標的が単一sgRNAガイドによる活性化を受けにくいことを見出した。本出願人らは、dCas9媒介活性化に困難または扱いにくいことが既に証明された文献および本出願人ら自身の研究から12個の遺伝子標的を選択した(
図58参照)。本出願人らは、8つのガイド配列の1つを使用するMS2−p65−HSF1/SV40−dCas9−VP64/sgRNA系によりそれらの遺伝子のそれぞれを活性化させることを試みた。本出願人らは、それらの困難な遺伝子標的のそれぞれについて顕著な活性化を観察し、最良のガイドについての活性化レベルは、MYCについての2倍から、IL1Bについての>10,000倍に及んだ。12個の遺伝子の8つは、少なくとも15倍の発現を示した(
図58参照)。試験されたそれぞれのガイド配列について、MS2/dCas9系は、標準dCas9−VP64アーキテクチャーよりも良好に機能し、標準系の発現倍率はいずれの遺伝子についても2倍よりも大きくなかった(
図58参照)。さらに、本出願人らは、ガイド配列の成功率は、典型的には、標的遺伝子の転写開始部位(TSS)に近接するとともに増加することを観察した。本発明の好ましい実施形態において、特定の標的について、TSSの200bp内が、ガイドRNAを選択するための有利な幅であると考えられる。この情報は、将来的な実験のためのsgRNAガイド配列の選択に有用であり得る。
【1022】
活性化対基本的発現:人工内因性転写モジュレーションの分野における未解決問題は、なぜ一部の遺伝子が他の遺伝子よりも活性化に適しているか?ということである。上記列記の困難な標的について、本出願人らは、対照試料中のその遺伝子についてのqPCRからのデルタCt値に対して最良のガイド配列の発現倍率をプロットした。これらの結果は、基本的遺伝子発現(より高いデルタCtは、より低い基本的発現に対応する)と、MS2/dCas9/sgRNA系による最大転写活性化との間の強力な負の相関を示唆する(
図59参照)。
【1023】
多重化活性化:単一ガイドによりロバストな活性化を提供する本出願人らの系の能力の1つの重要な考えられる利点は、それぞれの遺伝子単独の活性化に多数のガイドが要求される場合に解決困難である遺伝子のパネルを同時に(それらの遺伝子についての複数のガイドへの同時送達により)容易に活性化させるキャパシティーである。
【1024】
複数の遺伝子を同時に活性化させる本出願人らの系(MS2−NLS−P65−HSF1との組合せのNLS−dCAS(D10、H840A)−NLS−VP64)の能力を試験するため、本出願人らは、2、4、6、8または10個の遺伝子を1回で標的化するガイドを同時形質移入した。複数の遺伝子の活性化は高度に良好であり、10個の遺伝子の組合せについても、それぞれの遺伝子は有意に活性化された(
図60〜63参照)。
【1025】
実施例20:ゲノムスケール遺伝子活性化のためのCRISPR−Cas9複合体の構造ガイドエンジニアリング
ゲノムの機能的組織化の体系的調査は、ロバストで一般化可能な様式で遺伝子発現を摂動させる能力を要求する。内因性ゲノム遺伝子座における効率的な転写活性化を媒介するためのCRISPR−Cas9複合体の構造ガイドエンジニアリングが記載される。エンジニアリングされたCas9アクチベーターを使用して有効な転写活性化のためのsgRNA標的化規則を調査し、同時に10個の遺伝子の効率的な多重化活性化を実証し、長鎖遺伝子間非コードRNA(lincRNA)転写物を上方調節する。全てのヒトRefSeqコードアイソフォームをヒト標的化する70,290個のガイドからなるライブラリーを合成し、SAMを黒色腫モデルにおいて適用して活性化がRAF阻害剤PLX−4720、治療化合物ベムラフェニブのアナログに対する耐性を付与する遺伝子をスクリーニングした。予測された耐性遺伝子、例えば、EGFRおよびGタンパク質共役受容体タンパク質が、潜在的に新規な耐性遺伝子、例えば、インテグリンファミリーのメンバーである上位ヒットにおいてエンリッチされた。上位スクリーニングヒットのシグネチャーは、29個の短期患者腫瘍培養物ならびに27個の異なる黒色腫細胞系ならびに113個の原発性および転移性患者黒色腫においてBRAF阻害剤耐性状態を有意に予測し、このことは強力な遺伝的ツールとしてのCas9アクチベーターの潜在性を実証した。
【1026】
インタクトな生物学的系内でゲノムスケール体系的摂動を達成することは、遺伝子の機能およびエピジェネティック調節を解明するために重要である。遺伝子摂動は、それらの作用方式に基づき機能損失または機能獲得(GOF)のいずれかとして広く分類することができる。種々のゲノムスケール機能損失スクリーニング法、例として、RNA干渉
1,2および微生物適応免疫系CRISPRからのRNAガイドエンドヌクレアーゼCas9
3が開発されてきた。ゲノムスケールGOFスクリーニングアプローチは、大部分が、cDNAライブラリー過剰発現系の使用に限定されたままである。しかしながら、それらのライブラリーを使用して転写物アイソフォームバリアンスの複雑性を捕捉することは困難であり、大きいcDNA配列はウイルス発現ベクター中にクローニングすることが困難であることが多い。さらに、cDNA構築物は、遺伝子発現をオーバードライブする傾向があり、生理学的タンパク質レベルを反映し得ない。より一般的には、過剰発現される遺伝子の内因性調節コンテクストは、繰り返すことができない。したがって、内因性遺伝子座におけるゲノムスケールGOF摂動を可能とする方法は、依然として今後も求められる。
【1027】
プログラマブルDNA結合タンパク質が、内因性ゲノム遺伝子座における転写をモジュレートするための有望なプラットフォームとして出現した
4〜13。確立された合成転写因子プラットフォームのうち、CRISPR関連エンドヌクレアーゼCas9は、亜鉛フィンガータンパク質および転写アクチベーター様エフェクター(TALE)に対する系のプログラミングおよび産生の簡易性に起因してゲノムスケール摂動
14〜16を容易にするために最も容易にスケーリングされる。Cas9ヌクレアーゼは、その触媒ドメインの両方を不活化させることによりRNAガイドDNA結合タンパク質(dCas9)に容易に変換することができる
17,18。dCas9は、転写活性化ドメインに融合させ、内因性遺伝子のプロモーター領域に再標的化させて遺伝子発現の標的化モジュレーションを達成することができる
7,8,10〜12。dCas9ベース転写エフェクターの現行の生成は、一部の内因性遺伝子座の活性化を達成することができるが、個々の単一ガイドRNA(sgRNA)により達成される転写上方調節の尺度は典型的には低効率から無効率に及ぶ
8,10,12。所与のプロモーター領域をタイリングするsgRNAの組合せを標的化することは、よりロバストな転写活性化をもたらし得るが
10〜12、この要求はスケーラビリティーについて、特にdCas9を使用するプールされるゲノムワイドGOFスクリーンの確立について膨大なチャレンジを提示する。
【1028】
Cas9の用途を改善および拡張するため、Cas9−sgRNA−標的DNA三元複合体の原子構造を解明する結晶学的研究
17が実施され、Cas9およびsgRNAの合理的エンジニアリングを可能とした。この例は、単一sgRNAによりロバストな上方調節を媒介し得る強力な転写活性化複合体をもたらす一連の構造ガイドエンジニアリングステップを提供する。この新たな活性化系を使用して、内因性遺伝子および非コードRNAの活性化が実証され、有効なsgRNA標的部位についての設計規則が解明され、黒色腫の細胞モデルにおける標的療法耐性を研究するためのゲノムワイドdCas9ベース転写活性化スクリーニング系が確立および適用される。これらの結果は、まとめて、機能ゲノム研究のためのRNAガイド機能獲得(GOF)スクリーニングの潜在的に広い適用性を実証する。
【1029】
dCas9ベース転写活性化複合体の構造ガイド設計
有効な転写アクチベーターへのCas9−sgRNA複合体の転換におけるキーステップは、活性化ドメインに最適なアンカリング位置を見出すことである。理想的な位置は、転写機構と標的DNAとの間の効率的な相互作用を可能とするために標的DNAに対して近接して局在し、転写機構をリクルートするためのトランス活性化エフェクターの妨害されない提示を許容する。単一ガイドRNA(sgRNA)および相補的標的DNAとの複合体における化膿連鎖球菌(Streptococcus pyogenes)dCas9(D10A/H840A)の結晶構造
17は、sgRNA−標的DNAヘテロ二本鎖がCas9タンパク質ドメインの三次元組織化のための足場として機能するリボ核タンパク質複合体を明らかにした。Cas9のNおよびC末端は、sgRNA−標的DNAヘテロ二本鎖結合溝の反対側において局在し(
図64a)、このことは従来のdCas9−アクチベーター設計において報告されるそれらの局在におけるトランス活性化ペプチドの融合が最適未満であり得ることを示す。sgRNAのテトラループおよびステムループ2がCas9−sgRNAリボ核タンパク質複合体の外側に突出し、それぞれのステムの遠位4bpはCas9アミノ酸側鎖との相互作用から完全にフリーであることが観察された(
図70a)。テトラループおよびステムループ2の両方は、NまたはC末端のいずれよりも標的DNAにもより近接し、エフェクターにより良好なアンカリング位置を提供し得る。sgRNA配列のテトラループおよびステムループ2領域中の置換および欠失がCas9触媒機能に影響を及ぼさないこれらの観察および機能データ
17に基づくと(
図64a)、テトラループおよびステムループ2を伸長させてタンパク質相互作用アプタマーを取り込むことができ、Cas9複合体へのエフェクターのリクルートメントを容易にすることが結論付けられた(
図64b)。
【1030】
バクテリオファージコートタンパク質MS2に結合し得る最小ヘアピンアプタマーは、哺乳動物細胞中で強力な配列および構造特異的相互作用を介してMS2に結合してテトラループおよびステムループ2を取り込むことができることが公知であり
18,19(
図70b)、それを選択した。試験は、テトラループおよびステムループ2へのVP64のMS2媒介リクルートメントが、dCas9−VP64融合物単独よりも効率的に転写上方調節を媒介し得るか否かを評価するように実施した。テトラループ(sgRNA1.1)またはステムループ2(sgRNA1.2)のいずれかへのMS2−VP64のアプタマー媒介リクルートメントは、dCas9−VP64融合物(sgRNA1.0)よりもそれぞれ3および5倍高いレベルのNeurog2上方調節を媒介した。両方の位置(sgRNA2.0)へのVP64のリクルートメントは、dCas9−VP64(sgRNA1.0)に対して12倍の増加をもたらす追加の効果をもたらした。sgRNA2.0をdCas9に代えてdCas9−VP64と組み合わせることにより、Neurog2上方調節の追加の1.3倍の増加が提供された。
【1031】
有効な転写活性化のための決定的因子である活性化ドメインの数だけでなく、空間的位置決めを裏付けるため、sgRNA2.0を、3’末端における2つのMS2結合ステムループを担持する既に記載されたsgRNA(sgRNA+2×MS2)
11と比較した。sgRNA2.0は、ASCL1およびMYOD1についてそれぞれsgRNA+2×MS2よりも14および8.5倍高いレベルの転写活性化をドライブした(
図64d)。
【1032】
エフェクタードメインは相乗的に作用して転写活性化を向上させる
Cas9媒体転写活性化の効力をさらに改善するため、天然環境において転写活性化がいかに達成されるかを考慮した。内因性転写因子は、一般に、補因子と相乗的に作用して転写を刺激する
20。VP64を追加の区別される活性化ドメインと組み合わせることが相乗作用を介して活性化効率を改善し得ることが仮定された。いくつかの共通の補因子をVP64と共有する一方、転写因子およびクロマチンリモデリング複合体の区別されるサブセットをリクルートするNF−κBトランス活性化サブユニットp65を選択した。例えば、p65はAp−1、ATF/CREB、およびSp1
21をリクルートすることが示されている一方、VP64はPC4
22、CBP/p300
23、およびSWI/SNF複合体
24をリクルートする。
【1033】
dCas9およびMS2に融合しているエフェクタードメインを変動させた。dCas9およびMS2融合タンパク質のヘテロエフェクターペア形成(例えば、MS2−p65とペア形成しているdCas9−VP64またはMS2−VP64とペア形成しているdCas9−p65)は、ASCL1およびMYOD1の両方について同一のエフェクターペア形成(例えば、MS2−VP64とペア形成しているdCas9−VP64またはMS2−p65とペア形成しているdCas9−p65)よりも2.5倍超高い転写活性化を提供した(
図64e)。ドメイン相乗作用のこの概念は、ヒト熱ショック因子1(HSF1)(Marinho et al.,Redox Biol 2014)からの活性化ドメインを第3の活性化ドメインとして導入することによりさらに調査し、MS2−p65−HSF1融合タンパク質がASCL1(12%)およびMYOD1(37%)の転写活性化をさらに改善することが実証された。sgRNAおよびCas9タンパク質の追加の改変は、わずかな改善を提供したにすぎなかった(
図70c〜e)。これらの結果に基づき、sgRNA2.0、NLS−dCas9−VP64、およびMS2−p65−HSF1の組合せが最も有効な転写活性化系を含むことを結論付け、それをSAMと命名した。簡易性のため、特に記載のない限り、本実施例の後続の考察においてsgRNA2.0をsgRNAと称する。
【1034】
SAM効力の特性決定およびsgRNA効率規則の決定
内因性遺伝子転写の活性化についてのSAMの有効性を完全に評価するため、dCas9−VP64および個々のsgRNA1.0ガイドを使用して活性化させることが困難であることが既に見出された12個の遺伝子
8,11,12を選択した。それぞれの遺伝子について、転写開始部位(TSS)の−1000bpおよび+1間の近位プロモーターにわたり広がる8つのsgRNA標的部位を選択した。12個の遺伝子のうち9つについて、8つのsgRNA1.0ガイドのいずれかを有するdCas9−VP64を使用して達成される最大レベルの活性化は2倍未満であった一方、残りの3つの遺伝子(ZFP42、KLF4およびIL1b)は2から5倍の間で最大で活性された(
図65a)。対照的に、SAMは全ての遺伝子について少なくとも2倍転写を刺激し、12個の遺伝子のうち8つについては15倍超刺激した。一貫して、SAMは96個全てのガイドについてsgRNA1.0+dCas9−VP64よりも良好に機能し、12個全ての遺伝子にわたり105倍高い発現上方調節の増加率の中央値を示した。
【1035】
従来の研究は、dCas9−VP64を標的遺伝子の近位プロモーター領域をタイリングするsgRNAのプールと組み合わせることにより単一sgRNAの不十分な活性化効率を克服することができることを実証した
10〜12。したがって、SAMの単一sgRNA活性化効率を、8つの同一遺伝子標的化sgRNA1.0ガイドのプールと組み合わせたdCas9−VP64と比較した。ほとんどの遺伝子について、単一sgRNAを有するSAMは、8つのsgRNA1.0ガイドのプールを有するdCas9−VP64よりもロバストに機能した(
図65b)。平均して、単一sgRNAを有するSAMは、8つのsgRNA1.0ガイドのプールと組み合わせたdCas9−VP64よりも15倍大きい活性化を達成した。12個全ての遺伝子について、3つの区別される活性化ドメイン(MS2−p65−HSF1またはMS2−p65−MyoD1のいずれかを有するdCas9−VP64、一方、MyoD1は、ヒトMYOD1遺伝子に由来するトランス活性化ペプチドである
25)を取り込むSAMは、2つの区別される活性化ドメイン(MS2−p65を有するdCas9−VP64)のみを取り込むSAMよりも良好に機能した(
図71a)。12個の遺伝子のうち9つについて、三重ドメインSAMが二重ドメインSAMよりも42%から196%大きい活性化を達成した(p<0.01、スチューデントt検定、FDR補正)。さらに、非標的化sgRNAを有する三重ドメインSAMは、標的化sgRNAによる活性化と比較して1%未満の非特異的活性化を生成した(
図71bおよびc)。
【1036】
次に、異なるsgRNAによる活性化効率の遺伝子間および遺伝子内変動性に寄与する因子を決定する研究を実施した。遺伝子間変動性について、sgRNAと標的遺伝子との間の活性化レベルの変動を分析した。活性化レベルの差異は、所与の遺伝子座がいかにタイトに調節されるか、および/または転写のその基底レベルの変動に由来し得た。したがって、基底転写と、SAMを使用して達成される転写活性化のレベルとの間の相関は、特に興味深かった。対照試料中の標的遺伝子の相対転写物レベルを使用して、基底転写物レベルの逆数とSAMを使用して達成される上方調節倍率との間の高度に有意な相関が観察された(
図65c;r=0.94、p<0.0001)。高発現の遺伝子(例えば、MYC、VEGFA、TERT、SOX2)は、穏やかに上方調節された一方、低発現の遺伝子(例えばHBG1、IL1B、ZFP42)は、SAMによってより顕著に上方調節された。
【1037】
遺伝子内変動性について、活性化データを96個全てのガイドについて集め、ガイドRNA標的部位とTSSとの間の距離が活性化効率の最も有意な予測因子であることが見出された(
図65d;r=0.67、p<0.0001)。それぞれの遺伝子についての最も強力なガイドは、常に−200bpおよび+1内に局在した。高い率のガイドがこの幅で効率的であり、TSSの200bp上流内のガイドの約85%が、所与の遺伝子の最大活性化の少なくとも25%を達成した。この簡易な知見を使用して遺伝子活性化のために効率的なsgRNAの選択を提供することができる。
【1038】
lincRNAの転写活性化
長鎖遺伝子間非コードRNA(lincRNA)は、200bpよりも長い非タンパク質コード転写物のクラスである
26。多数のlincRNAがトランスクリプトームシーケンシングにより同定されている一方、それらの分子のほとんどは機能的特性決定を欠く。これにもかかわらず、一部はエピジェネティックな調節、癌および発生において重要な役割を担うことがこれまで示されている
27。これらの転写物の標的化活性化は、それらの生物学的意義を明らかにするための有価なツールである。SAMがlincRNAを活性化させ得るか否かを試験するため、公知の機能を有する3つの標的(TINCR
28、HOTTIP
29、およびPCAT
30)および不明の機能を有する3つの標的(LINC00925、LINC00514およびLINC00028)を選択した。従来のmRNA上方調節実験と同様に、RefSeqアノテーションを使用してそれぞれのlincRNAの近位プロモーター(−800bp+1)から8つのsgRNA標的部位を選択した。実際、SAMはlincRNA転写物の有意な上方調節を、PCATの3倍の上方調節からLINC00514の360倍の上方調節まで媒介した(
図66a)。興味深いことに、およびmRNAデータとは対照的に、lincRNA標的化ガイドのTSSまでの距離と活性化倍率との間の有意な相関は見出されなかった(
図66b)。考えられることに、この相違は、非コード転写物の複合体アイソフォーム構造から生じ得、標的は全て、報告される異なるTSS
31を有する少なくとも2つのアイソフォームを有する。
【1039】
lincRNAに有効な活性化ドメインを見出すため、異なるトランスアクチベーター成分の効力を比較した。48個のlincRNA標的化ガイドのそれぞれについて、VP64単独、p65単独、p65−HSF1、およびp65−MyoD1へのMS2融合物の比較を実施した(
図72)。三重ドメインSAM、MS2−p65−HSF1またはMS2−p65−MyoD1に結合しているdCas9−VP64は、6つ全てのlincRNAに最良なガイドについて二重ドメインSAM(MS2−P65を有するdCas9−VP64)よりも顕著に高い活性化をもたらした(p<0.01)。単一ドメインSAM、MS2−VP64を有するdCas9−VP64は、6つ全てのlincRNAについて最悪に機能し、このことは相乗ドメインの複合体による活性化が試験ドメインに基づく非コードRNAの効率的な人工上方調節に重要であり得ることを示唆した。
【1040】
SAMは、複数の遺伝子の同時活性化を媒介する
遺伝子ネットワークおよび転写調節の複雑性を研究するため、複数の遺伝子座における遺伝子発現の同時モジュレーションのためのツールが必要とされる。これは、シグナリング経路の複数のエレメントまたは疾患状態でシグナリングを調整する遺伝子のセットの標的化を可能とする。その目的のため、SAMが複数の遺伝子を同時に活性化させ、性能の多重化に影響を及ぼす因子を特性決定し得るか否かを試験することが求められた。2、4、6または8つの遺伝子の3つのセットおよび10個の遺伝子の1つのセットの同時活性化を、sgRNAの組合せの同時発現により試験した(
図73)。10個の遺伝子の同時活性化を含む試験された全ての遺伝子組合せについて、全ての遺伝子の良好な活性化(>2倍)が観察された(
図67aおよび67b)。ほとんどの遺伝子(IL1R2を除く)は、他の9つの遺伝子と同時に標的化された場合に達成される上方調節の量の降下を示した(
図67aおよび67b)。興味深いことに、それぞれの遺伝子の相対活性化レベルは、多重活性化および単一遺伝子活性化実験間で変化した。例えば、NANOGは単一遺伝子活性化の間、10個の標的化遺伝子のうち5番目にランクした一方、それは10多重化活性化実験においては10番目にランクした。一部の遺伝子は、遺伝子の数の増加とともに同時に標的化された場合に活性化の変化を示さず、または穏やかで段階的な降下のみを示した(例えば、IL1R2、MYOD1、ASCL1)。しかしながら、他のものは、単一の遺伝子パートナー組み合わせた場合にも上方調節の急な減少を示した(例えば、LIN28A、IL1B、NANOG)。遺伝子間でこれらの区別される挙動は、一般に異なる遺伝子ペア形成にわたり観察された(
図73)。
【1041】
10個の遺伝子の多重化の間の標的の低減した活性化が、遺伝子当たりで利用可能なsgRNAまたはSAMタンパク質成分の量の低減に起因するか否かを評価した。驚くべきことに、sgRNA発現プラスミドを単一遺伝子活性化実験において10倍だけ希釈すると、全ての遺伝子について活性化は低減しなかった(
図67d)。例えば、10個の遺伝子のうち4つ(IL1R2、KLF4、ASCL1、およびMYOD1)についての活性化は、10倍希釈のsgRNA発現プラスミドを用いて平均90%だけ増加した。残り6つの遺伝子は、平均51%だけ減少した。sgRNA希釈の結果として活性化が低減した遺伝子は、多重化によっても減衰した(
図67e;r=、0.94、p<0.001)。
【1042】
SAMの活性化効率は、一般に、そのタンパク質成分(dCas9−VP64およびMS2−p65−HSF1)の希釈に安定であった。両方の成分についての発現プラスミドの量の10倍だけの低減は、活性化効率の26%の平均降下をもたらした(
図74a)。活性化効率は、3つ全ての成分(sgRNAを含む)を希釈した場合に特に安定であり、50倍の希釈範囲にわたり平均100%の活性化効率を保持した(
図74b)。SAMが低い形質移入濃度においても高度に効率的であるという知見は、単一コピーレンチウイルスインテグレーションに依存するゲノムスケールプールスクリーンにおける適用に特に有望であった。
【1043】
ゲノムスケールプール転写活性化スクリーンの開発
単一sgRNAを使用して標的遺伝子を活性化させる能力は、プールゲノムスケールプール転写活性化スクリーニングを実施する可能性を開く。SAMベーススクリーンの開発に向かう第1のステップとして、3つ全ての成分をレンチウイルスベクター中にクローニングした(
図68a)。それぞれのベクターは、ユニークな選択マーカー(ブラスチシジン、ハイグロマイシン、およびZeocinまたはピューロマイシン)をコードして3つ全てのSAM成分を同時発現する細胞の選択を可能とする。低い感染多重度(MOI)においてレンチウイルスを介して送達される場合にSAMの効率を評価するため、3つの検証遺伝子を標的化した:弱く活性化されるMYC;ならびに穏やかにのみ活性化されるKLF4およびMYOD1。HEK293FT細胞をレンチ−dCas9−VP64およびlenti−MS2−p65−HSF1とMOI<1において同時形質導入し、ブラスチシジンおよびハイグロマイシンにより同時に7日間選択した。次いで、Cas9−VP65−およびMS2−p65−HSF1発現細胞をレンチウイルスsgRNAベクター(lenti−sgRNA)により低いMOI(<0.2)において形質導入し、ピューロマイシンまたはZeocinのいずれかを使用して良好に形質導入された細胞を選択した。標的遺伝子発現レベルを形質導入4日後に計測した。3つ全ての遺伝子が、一過的SAM形質移入後に観察されるものと同等なレベル(MYOD1)またはそれよりも大きいレベル(MYCおよびKLF4)に効率的に上方調節された。特に、sgRNA構築物上のピューロマイシンまたはZeocin耐性マーカーにより達成される発現レベルは、同等でなかった(
図68b)。
【1044】
lentiSAM構築物(lenti−dCas9−VP64、lenti−MS2−p65−HSF1、およびlenti−sgRNA)を検証したら、RefSeqデータベースから全てのコードアイソフォーム(23430個のアイソフォーム)を標的化するゲノムスケールsgRNAライブラリーを設計した。アイソフォーム当たり3つのsgRNAを設計し、より効率的な活性化を提供することが既に決定された(
図65d)TSSの200bp上流内の標的部位を選択した。最終ライブラリーは70,290個のガイドを含有し、Zeocin(lenti−sgRNA−Zeo)またはピューロマイシン(lenti−sgRNA−Puro)耐性を有する2つの別個のライブラリーを生成した。遺伝子活性化は増殖および細胞生存に対して負および正の効果の両方を有し得るため、細胞成長のエフェクターについてのゲノムワイドスクリーンを実施した。dCas9−VP64およびMS2−p65−HSF1成分の両方を構成的に発現するポリクローナルA375黒色腫細胞系を生成し、それらの細胞をゲノムスケールlenti−sgRNA−Zeoライブラリーにより0.2のMOIにおいて形質導入した(
図68c)。ゲノムDNAをsgRNAレンチウイルスによる形質導入の3および21日後に抽出し、ガイドカウント数はNGSにより決定した。これら2つの時点についてのlog
2正規化ガイドカウント数を比較した。選択下の集団について予測されるとおり、ガイドカウント数の分布は、培養物の21日後の増加したバリアンスを示し、ガイドの大部分は枯渇を示した(
図68d)(ウィルコクソン順位和検定、p<0.0001)。上位1000個の枯渇sgRNAについての機能遺伝子カテゴリーのエンリッチメントを分析し、Ingenuity pathway analysisを使用して上位1000個の枯渇遺伝子(所与の遺伝子に標的化された3つ全てのガイドの平均枯渇に基づき決定)を分析した。Benjamini−Hochberg FDR補正後にp<0.01を有するカテゴリーを
図68eに示す。癌および多能性関連遺伝子カテゴリー(例として、癌調節に関与するPTEN
32およびSTAT3
33シグナリング経路)のエンリッチメントが観察された。これらの結果は、それらの遺伝子カテゴリーのメンバーの機能不全が黒色腫増殖に負に影響を及ぼし得ることおよびSAMを枯渇スクリーニングに使用することができることを示唆する。
【1045】
BRAF阻害剤耐性に関与する遺伝子を同定するためのゲノムスケール転写活性化スクリーンの使用
既に、Cas9媒体遺伝子ノックアウトを使用するゲノムスケールスクリーニングが、黒色腫の細胞系モデルにおいてBRAF阻害剤耐性を付与する機能損失突然変異の同定を容易にし得ることが実証されている
14。SAMを使用する相補的ゲノムスケール転写活性化スクリーンは、黒色腫薬物耐性に関与する機能獲得摂動の同定を可能とする。ゲノムワイド陽性選択スクリーニングについてのSAMの効率を試験するため、1つの目的は、BRAF
V600E突然変異黒色腫におけるBRAF阻害剤耐性の発生に関与する遺伝子を同定することであった。A375黒色腫細胞系は、BRAF
V600E突然変異を保有し、BRAF阻害剤、例えば、PLX4720(PLX)および密接に関連する市販の治療薬ベムラフェニブに天然で感受性である。したがって、PLX耐性をもたらす遺伝子を活性化させるsgRNAを保有する細胞はその薬物の存在下で継続培養後にエンリッチされるはずである一方、そのような効果はビヒクルのみにより処理された細胞中で観察されないはずである。ベースライン時点(感染3日後)およびPLXまたはビヒクルのいずれかによる処理14日後におけるインプットsgRNA−zeoライブラリーについての正規化ガイドカウント数を分析した。sgRNA分布は、2つの独立感染レプリケートスクリーンについてPLXおよびビヒクルにより処理された細胞間で有意に異なり、sgRNAの大多数は低減した提示を示し、ガイドの小さいセットはPLX処理細胞の高いエンリッチメントを示す(ウィルコクソン順位和検定、P<0.0001、DMSOに対するPLXについて中央値−1.3)(
図69a)。
【1046】
多数の遺伝子標的について、同一遺伝子についてのいくつかのsgRNAがPLX処理細胞中でエンリッチされ(
図69b)、このことはPLX耐性の形成についてのそれらの遺伝子の重要性を示唆した。複数のsgRNAにわたり一貫して高いエンリッチメントを示す遺伝子を決定するため、RNAi遺伝子エンリッチメントランキング(RNAi Gene Enrichment Ranking)(RIGER)アルゴリズム(
図69c)を用いた。10個の最も重要なヒットがゲノム全体に分布した(
図69c)。上位20個のRIGERヒットの50%を、sgRNAライブラリーに対してzeoではなくpuro選択を使用する検証スクリーンにおいて複製させた(
図75)。上位100個のRIGERヒットのp値の有意性は、GeCKOスクリーニング
14について観察されるものと同等であり、このことは、SAM機能獲得活性化スクリーンから得られる結果がCas9ヌクレアーゼベースノックアウトスクリーニングと比較して類似の統計力を有することを示す(
図69d)。さらに、zeoおよびpuroスクリーン間の上位10個の共有ヒットについて、遺伝子当たりの効率的にエンリッチされるガイド(全てのガイドの上位5%に存在)の率は極めて高く、zeoについて97%、puroについて81%であった(上位10個のGECKOヒットについての78%±27%と比較して全体で89%±10.7%、
図69e)。
【1047】
両方のスクリーンからの上位ヒットの異所性発現(EGFR)が、BRAFと並行する経路中でAKTを活性化させることによりBRAF
V600E突然変異を保有する腫瘍タイプにおいてPLX耐性を引き起こすことを既に示された
34。さらに、患者由来BRAF突然変異黒色腫は、EGFRおよびAKT阻害剤により処理した場合、PLXに感作された
35。さらに、第1のスクリーンからの上位10個のヒットのうち4つは、Gタンパク質共役受容体のファミリーに属する(GPR35、LPAR1、LPAR5、およびP2RY8)。GPCRは、Johannessen et al.
36によるcDNA過剰発現を使用する近年のスクリーンにおいて黒色腫細胞中で複数のMAPキナーゼ阻害剤に対する耐性を付与する上位ランクタンパク質クラスとしても出現した。GPR35およびLPAR1は、cDNAを介して過剰発現させた場合にA375細胞中でPLX耐性を媒介することが既に見出されている
36。GPR35、LPAR1およびLPAR5は、下流標的としてGα13を共有し
37,38、ERK/GSK3β/β−カテニン経路を介して細胞増殖を誘導し、複数の癌タイプにおいて成長利点をもたらす
39,40。P2RY8作用についての正確な分子機序は同定されていないが、P2RY8は、白血病細胞中で豊富に発現される
41。cDNAによるNIH3T3細胞中のP2RY8の過剰発現は、増加したCREB、Elk−1、c−Fos、およびc−Myc活性をもたらし、このことはP2RY8がERK経路を介して細胞増殖を誘発し得ることを示唆した
41。ERKのRAF非依存性活性化が、BRAF阻害剤に対する耐性機序として既に示されている
42。両方のスクリーンの上位20個のヒットに存在するタンパク質の第2のファミリーは、GPCRの下流でGα13に対しても作用するRhoグアニンヌクレオチド交換因子(ARHGEF1およびARHGEF2)である。GPCR経路の活性化は、CREBおよびATF1を介する転写のcAMP/PKA媒介活性化を介するBRAF阻害療法に対する耐性についての非依存性機序として作用することが示された
36。上位ヒットの2つ(GPR35およびLPAR1)のみが、Johannessenスクリーン
36からの上位ヒットと重複する一方、上位ヒットにおいてエンリッチされたGPCR経路の多くの新規メンバーは、GPCR経路活性化がMAPK経路阻害剤に対する耐性を媒介し得るモデルと一致した。さらに、上位ヒットは、腫瘍発生および悪性腫瘍において役割を有する複数のインテグリン遺伝子(ITGA9、ITGB3、およびITGB5)を含む。特に、3つ全てのインテグリンヒットは、MAPKシグナリングをドライブし、悪性腫瘍、足場非依存性、ならびに黒色腫および種々の癌腫の遊走を促進し得る
43〜46。さらに、ITGB3は、NF−κB経路活性化を介して癌性細胞をステム様状態にドライブし得、これはBRAF阻害療法に対する耐性を媒介することが示されている
47(
図69f)。したがって、これらのインテグリン上位ヒットは、耐性を促進し、RAFの下流でMAPKを再活性化させて悪性腫瘍を促進することが公知のアクセサリー経路の活性化によりBRAF阻害の迂回において役割を担い得る。
【1048】
ゲノムワイドスクリーンからの上位ヒットの生物学的関連を確認するため、Cancer Cell Line Encyclopedia(CCLE)のBRAF
v600突然変異黒色腫細胞系からの遺伝子発現データのコレクション
48、患者腫瘍の短期培養物
49、ならびにThe Cancer Genome Atlas(TCGA)(https://tcga−data.nci.nih.gov/tcga/)からの原発性および転移性患者黒色腫試料のコレクションを試験した。既に示されたとおり
47、区別される転写状態は、感受性および耐性状態が内因性MITF/関連マーカー(例えば、PMEL)およびNF−κB−経路活性/関連マーカー(例えば、AXL)それぞれの活性化により記載されるBRAF阻害感受性/耐性を定義する(
図6f)。29個の黒色腫短期培養物からの遺伝子発現プロファイルを使用して、SAMスクリーンからの上位遺伝子が耐性状態内で有意に同時発現されることおよび上位ヒットを表す遺伝子発現シグネチャーがこのBRAF阻害剤耐性転写状態を予測することが見出された(
図69f、zeoおよびpuroスクリーンからの重複ヒットについてp<0.0001)。
【1049】
遺伝子発現および薬理学的データが利用可能であるCCLEからの27個のBRAF
V600突然変異黒色腫細胞系における上位ヒットの発現をさらに調査した。活性化スクリーンからの上位ヒットの遺伝子発現はエンリッチされ、SAMスクリーンからの上位ヒットシグネチャーと同様にBRAF阻害(PLX4720)に対する耐性と有意に関連する(
図77;zeoおよびpuroスクリーンからの重複ヒットについてp=0.007)。上位ヒットがインビボで耐性状態を表したことを裏付けるため、TCGAからの113個の原発性および転移性黒色腫試料からの遺伝子発現データ(
図78)を分析した。同一遺伝子および上記のシグネチャーマーカーを使用して感受性および耐性転写状態を定義し、SAMスクリーンからの上位ヒットおよびシグネチャーがBRAF阻害剤耐性表現型と有意に関連することが見出された(
図78、zeoおよびpuroスクリーンの両方についてp<0.0001)。したがって、インビトロ(患者黒色腫試料の短期培養物および樹立黒色腫細胞系のパネル)およびインビボ(TCGA)の両方において、ヒットは、潜在的に新規な治療標的によるBRAF阻害耐性と関連する転写状態の理解を拡張する。
【1050】
まとめると、ロバストな単一sgRNA媒介遺伝子上方調節を達成するためにdCas9ベース転写活性化系を設計する構造ガイドアプローチが採用された。タンパク質相互作用アプタマーを取り込むようにsgRNAをエンジニアリングすることにより、天然転写活性化プロセスをより密接に模倣する複数の区別されるエフェクタードメインからなる合成転写活性化複合体をアセンブルした。追加の開発は、区別されるタイプのエフェクターをリクルートするための異なるアプタマーを有する一連のsgRNA足場を確立するためのsgRNA足場のモジュラリティおよびカスタム可能性を利用し得る。例えば、MS2ステムループのPP7相互作用ステムループによる置換を使用して転写抑制エレメントをリクルートすることができる。
【1051】
本実施例において提供される強力なsgRNAについての選択規則の定義に向かう例示的ステップは、当業者がガイド効力に有用な追加の選択基準、例えば、配列固有特性(
図79)を明らかにすることを可能とする。
【1052】
標的化特異性のさらなる特性決定および改善された理解も、Cas9またはSAMの継続有用性に有用である。ゲノムワイドdCas9結合の近年の分析は、有意な濃度依存性オフターゲット結合を明らかにした
50。
【1053】
個々の遺伝子摂動のコンテクストにおける、またはゲノムスケール遺伝子活性化ライブラリーとしてのCas9転写活性化複合体の適用は、タンパク質コード遺伝子から非コードlincRNAエレメントに及ぶ多くのタイプの遺伝子エレメントの詳細分析をさらに可能とする。さらに、SAMをCas9媒介ゲノム編集またはdCas9媒介遺伝子抑制と組み合わせることにより、発生および再生から多くの疾患に跨るコンテクストにおける多様な生物学的プロセスにおける遺伝子相互作用を研究するための強力なアプローチを可能とする。
【1054】
一過的形質移入実験:Neuro−2a細胞(Sigma−Aldrich)を、OptiMEM(Life Technologies)と、5%のHyClone熱不活化FBS(Thermo Scientific)、1%のペニシリン/ストレプトマイシン(Life Technologies)が補給されたGlutaMaxおよびピルビン酸ナトリウム(Life Technologies)を有する高グルコースDMEMとを、1:1の比で含有する培地中で成長させ、1:5において2日ごとに継代した。
【1055】
熱不活化を特徴とする10%のHyCloneウシ胎仔血清(Thermo Scientific)および1%のペニシリン/ストレプトマイシン(Life Technologies)が補給されたGlutaMaxおよびピルビン酸ナトリウム(Life Technologies)を有する高グルコースDMEM中で、HEK293FT細胞(Life Technologies)を維持した。細胞を、1:2または1:2.5の比において毎日継代した。遺伝子活性化実験のため、20,000個のHEK293FT細胞/ウェルをポリ−d−リジンコート96ウェルプレート(BD biosciences)中で100μLの培地中でプレーティングした。プレーティング24時間後、細胞を、1:1:1の質量比において、以下のものにより形質移入した:
・遺伝子特異的標的化配列を有するsgRNAプラスミドまたはpUC19対照プラスミド
・MS2エフェクタープラスミドまたはpUC19。
・dCas9プラスミド、dCas9−エフェクタープラスミド、またはpUC19。
1.5uL/ウェルのLipofectamine2000(Life Technologies)を製造業者の指示書に従って使用して0.3ug/ウェルの総プラスミド質量を形質移入した。細胞培地を形質移入5時間後に交換した。形質移入48時間後、Cells−to−Ctキット(Life Technologies)を使用して細胞溶解および逆転写を実施した。Taqman qPCRプローブ(LIfe technologies)およびFast Advanced Master Mix(Life Technologies)を使用する逆転写および定量PCR(qPCR)により相対RNA発現レベルを定量した。qPCRは、5uLの多重化反応および384ウェルフォーマットで、LightCycler 480 Instrument IIを使用して実施した。データをΔΔC
t法により分析し:標的Ct値(FAM色素)をGAPDH Ct値(VIC色素)に正規化し、標的遺伝子発現の変化倍率をGFP形質移入実験対照と比較することにより決定した。
【1056】
レンチウイルス産生:HEK293T細胞(Life Technologies)を、HEK293FT細胞について上記のとおり培養した。形質移入1日前、細胞を約40%のコンフルエンシーにおいて播種した(ライブラリースケール産生については12個のT225フラスコ、個々のガイド産生については1つのT75フラスコ)。細胞を翌日に約80〜90%のコンフルエンシーにおいて形質移入した。それぞれのフラスコについて、100uLのLipofectamine2000および200uLのPlus Reagent(Life Technologies)を使用して目的ベクターを含有する20ugのプラスミド、10ugのpVSVG、および15ugのpsPAX2(Addgene)を形質移入した。形質移入5時間後に培地を交換した。ウイルス上清を形質移入48時間後に回収し、0.45μmのPVDFフィルター(Millipore)により濾過し、アリコート化し、−80℃において貯蔵した。
【1057】
レンチウイルス形質導入:A375細胞(ATCC)を、10%のFBS(Seradigm)および1%のペニシリン/ストレプトマイシン(Life Technologies)が補給されたRPMI1640(Life Technologies)中で培養し、1日おきに1:4の比において継代した。細胞をレンチウイルスにより12ウェルプレート中のスピンフェクション(spinfection)を介して形質導入した。8ug/mLのpolybrene(Sigma)が補給された2mLの培地中の3×10
6個の細胞をそれぞれのウェルに添加し、レンチウイルス上清を補給し、1000gにおいて2時間遠心分離した。スピンフェクションの24時間後、細胞をTrypLE(Life Technologies)により剥離させ、計数した。細胞を低密度(T225フラスコ当たり7.5×10
6個の細胞)において再プレーティングし、選択剤を直ちに(zeocin、ブラスチシジンおよびハイグロマイシン、全てLife technologies)またはプレーティングの3時間後(ピューロマイシン)のいずれかで添加した。選択剤についての濃度は、殺滅曲線を使用して決定した:0.5ug/mlのピューロマイシン、200ug/mLのzeocin、2ug/mLのブラスチシジン、および300ug/mLのハイグロマイシン。培地を2日目にリフレッシュし、細胞を再プレーティング後4日目から開始して1日おきに継代した。選択の持続期間は、ピューロマイシンについては4日間、zeocin、ハイグロマイシンおよびブラスチシジンについては7日間であった。レンチウイルス力価は、0から600uLに及ぶ6つの異なる容量のレンチウイルスによる細胞のスピンフェクションおよび完全選択後(3〜6日間)の生存細胞数の計数により決定した。
【1058】
SAMライブラリーの設計およびクローニング:ユニークTSSを有するRefSeqコード遺伝子アイソフォーム(合計23430個のアイソフォーム)を、70300個のガイドの総ライブラリーについてそれぞれ3つのガイドにより標的化した。ガイドは、それぞれのTSSの最初の200bp上流を標的化するように設計し、続いてGC含有率>25%および標的配列の最小の重複についてフィルタリングした。フィルタリング後、残りのガイドをHsu et al.に基づく予測オフターゲットマッチによりスコアリングし、最良のオフターゲットスコアを有する3つのガイドを選択した。SAMsgRNAライブラリーのクローニングは、既に記載のとおり
14実施し、最小の提示は100個の形質転換コロニー/ガイドであった。
【1059】
枯渇およびPLXスクリーン:SAMCas9およびエフェクター成分により安定的にインテグレートされたA375細胞を、0.2のMOIにおいて上記のSAMsgRNAライブラリーにより形質導入し、最小の提示は500個の形質導入細胞/ガイドであった。細胞を後続の継代の間、>1000個の細胞/ガイドにおいて維持した。7DPI(完全選択、上記参照)において、細胞をビヒクル(DMSO)およびPLX4720条件(DMSO中に溶解している2uMのPLX、Selleckchem)中に分割した。細胞を薬物処理の合計14日間、2日ごとに継代した。>1000個の細胞/ガイドをgDNA抽出のためにベースラインとして3DPI(処理4日前)および21DPI(処理14日後)において回収した。Zymo Quick−gDNAミディキット(Zymo Research)を使用してゲノムDNAを抽出した。ウイルスによりインテグレートされたガイドのPCRを、>500個の細胞/ガイドの当量において、NEBnext High Fidelity 2X Master Mix(New England Biolabs)を22サイクルの単一ステップ反応で使用する96個の並行反応においてgDNAに対して実施した。プライマーを以下に列記する:
フォワードプライマー:
AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNNNN(1−10bp stagger)GCTTTATATATCTTGTGGAAAGGACGAAACACC
8bpバーコードを赤色で示す
リバースプライマー:
CAAGCAGAAGACGGCATACGAGATNNNNNNNNGTGACTGGAGTTCAGACGTGTGCTC TTCCGATCTGCCAAGTTGATAACGGACTAGCCTT
8bpインデックスリードバーコードを赤色で示す
【1060】
96個全ての反応からのPCR産物をプールし、Zymo−Spin(商標)V with Reservoir(Zymo research)を使用して精製し、Zymoclean(商標)Gel DNA Recovery Kit(Zymo research)を使用してゲル抽出した。得られるライブラリーをIllumina MiseqおよびHiseqプラットフォーム上でディープシンケンシングし、合計>3500万のリードのカバレッジがライブラリー当たりフィルターをパスした。
【1061】
NGSおよびスクリーンヒット分析:ユニークインデックスリードを使用してNGSデータを脱多重化した。ガイドカウント数を完全にマッチしたシーケンシングリードのみに基づき決定した。それぞれの条件について、ガイドカウント数は条件当たりのカウント数の総数に正規化し、それらの値に基づきlog
2カウント数を計算した。条件間のカウント数の比を、正規化カウント数に基づきlog
2((カウント1+1)/(カウント2+1))として計算した。
【1062】
RIGER分析は、2つの独立感染レプリケートにわたり平均化された正規化14日目log2比(PLX/DMSO)に基づきGENE−Eを使用して実施した。全てのRIGER分析は、既に記載
51のコルモゴロフ−スミルノフ法を使用し、但し重み付き平均法を使用してその方法により決定されたGeCKO値との比較を可能とした
図6cを除く。
【1063】
遺伝子発現および薬理学的検証分析:SAMスクリーンからの上位遺伝子ヒットの生物学的関連性をより良好に理解するため、遺伝子発現データ(CCLE、TCGA、短期培養物)および薬理学的データ(CCLE、短期培養物)を分析した。CCLEデータセット
48において、BRAF
V600突然変異黒色腫細胞系からの遺伝子発現データ(RNAシーケンシング)および薬理学的データ(MAPK経路阻害剤についての活性面積)を使用してPLX−4720耐性と上位ヒットのそれぞれの遺伝子発現との間の関連を算出した。さらに、上位ヒットに含まれる遺伝子発現シグネチャーは、単一試料遺伝子セットエンリッチメント分析(ssGSEA)
52,53を使用して生成し、PLX−4720耐性とそれらのシグネチャー間の関連を算出した。
【1064】
短期黒色腫培養物(STC)からの遺伝子発現データ(Affymetrix GeneChip HT−HGU133)およびPLX−4720薬理学的データ(GI
50;試料のサブセットについてのみ)
49も、上位ヒットの遺伝子発現およびそれらのssGSEAシグネチャースコアをプロットするために使用した。STC試料についての発現データを遺伝子当たりの最大プローブ値に分解し、ロバストなスプライン正規化を使用して予備処理した。
【1065】
遺伝子発現(RNAシーケンシング)およびゲノタイピングデータを、The Cancer Genome Atlas(https://tcga−data.nci.nih.gov/tcga/)からの113個のBRAF
V600突然変異原発性および転移性患者腫瘍から収集し、このデータを耐性と上位ヒットの発現/ssGSEAシグネチャースコアとの間の関連の決定に同様に使用した。STC(サブセットのみがPLX−4720データを有した)およびTCGA黒色腫試料について薬理学的データは利用可能でなかったため、転写状態はマーカー遺伝子およびシグネチャー
47を使用してプロットしてどの試料がBRAF阻害に対して耐性であるかを同定した。
【1066】
単一試料遺伝子セットエンリッチメント分析:上位の個々のSAMスクリーンヒットの一部の過剰発現と、3つの外部癌データセットにおける耐性との間の有意な関連が存在する一方、いかなる単一遺伝子からも独立したよりロバストなスコアリング系が求められた。遺伝子発現シグネチャーは、2つのSAMスクリーンのそれぞれからの上位ヒットのセットに基づき、およびそれらの間の重複について生成した。単一試料遺伝子セットエンリッチメント分析(ssGSEA)を使用して、その試料中のSAMスクリーン遺伝子発現シグネチャーのエンリッチメントを表すそれぞれの試料およびそれらの遺伝子が協調的に上方または下方調節される程度についてスコアを生成した。さらに、Molecular Signature Database(MSigDB)
54からのシグネチャー遺伝子セットを使用して既に記載
47の短期培養物およびTCGAデータセットにおける転写BRAF阻害剤耐性/感受性状態を完全にマッピングした。
【1067】
外部データセットにおける関連を計測するための情報係数:外部癌データセットにおける異なる特徴(例えば、シグネチャースコア、遺伝子発現、または薬物耐性データ)間の相関を計測するため、情報理論的アプローチ(情報係数(Information Coefficient);IC)を使用し、既に記載
47の並べ替え検定(n=10,000)を使用して有意性を計測した。ICは、それぞれのデータセットにおける試料(列)をソートするために使用される特徴と、ヒートマップ(薬理学的データ、遺伝子発現、およびシグネチャースコア)にプロットされる特徴のそれぞれとの間で計算した。
【1068】
sgRNA配列分析:それぞれのsgRNAの枯渇を、3日目と21日目との間のカウント数(「NGSおよびスクリーンヒット分析」参照)の比として計算した。sgRNA−puroおよびsgRNA−zeoライブラリーの有意な枯渇(RIGER分析によるp<=.05)を有する遺伝子に対応するsgRNAを、分析のために選択した。選択されたsgRNAをsgRNA配列中のヌクレオチド発生率について計数し、それぞれのヌクレオチドタイプについて、カウント数のsgRNA比との相関および有意性を最小二乗線形回帰により計算した。
【1069】
参照文献(実施例20により規定)
1 Berns,K.et al.A large−scale RNAi screen in human cells identifies new components of the p53 pathway.Nature 428,431−437,doi:10.1038/nature02371(2004).
2 Boutros,M.et al.Genome−wide RNAi analysis of growth and viability in Drosophila cells.Science 303,832−835, doi:10.1126/science.1091266(2004).
3 Horvath,P.&Barrangou,R.CRISPR/Cas,the immune system of bacteria and archaea.Science 327,167−170, doi:10.1126/science.1179555(2010).
4 Beerli,R.R.&Barbas,C.F.,3rd.Engineering polydactyl zinc−finger transcription factors.Nature biotechnology 20,135−141, doi:10.1038/nbt0202−135(2002).
5 Beerli,R.R.,Segal,D.J.,Dreier,B.&Barbas,C.F.,3rd.Toward controlling gene expression at will:specific regulation of the erbB−2/HER−2 promoter by using polydactyl zinc finger proteins constructed from modular building blocks.Proceedings of the National Academy of Sciences of the United States of America 95,14628−14633(1998).
6 Zhang,F.et al.Efficient construction of sequence−specific TAL effectors for modulating mammalian transcription. Nature biotechnology 29,149−153,doi:10.1038/nbt.1775(2011).
7 Gilbert,L.A.et al.CRISPR−mediated modular RNA−guided regulation of transcription in eukaryotes.Cell 154,442−451,doi:10.1016/j.cell.2013.06.044(2013).
8 Konermann,S.et al.Optical control of mammalian endogenous transcription and epigenetic states.Nature 500,472−476,doi:10.1038/nature12466(2013).
9 Maeder,M.L.et al.Targeted DNA demethylation and activation of endogenous genes using programmable TALE−TET1 fusion proteins.Nature biotechnology 31,1137−1142,doi:10.1038/nbt.2726(2013).
10 Maeder,M.L.et al.CRISPR RNA−guided activation of endogenous human genes.Nature methods 10,977−979,doi:10.1038/nmeth.2598(2013).
11 Mali,P.et al.CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nature biotechnology 31,833−838,doi:10.1038/nbt.2675 (2013).
12 Perez−Pinera,P.et al.RNA−guided gene activation by CRISPR−Cas9−based transcription factors.Nature methods 10,973−976,doi:10.1038/nmeth.2600(2013).
13 Perez−Pinera,P.et al.Synergistic and tunable human gene activation by combinations of synthetic transcription factors.Nature methods 10,239−242,doi:10.1038/nmeth.2361(2013).
14 Shalem,O.et al.Genome−scale CRISPR−Cas9 knockout screening in human cells.Science 343,84−87,doi:10.1126/science.1247005(2014).
15 Wang,T.,Wei,J.J.,Sabatini,D.M.&Lander,E.S.Genetic screens in human cells using the CRISPR−Cas9 system.Science 343,80−84,doi:10.1126/science.1246981(2014).
16 Koike−Yusa,H.,Li,Y.,Tan,E.P.,Velasco−Herrera Mdel,C.&Yusa,K.Genome−wide recessive genetic screening in mammalian cells with a lentiviral CRISPR−guide RNA library.Nature biotechnology 32,267−273,doi:10.1038/nbt.2800(2014).
17 Nishimasu,H.et al.Crystal structure of Cas9 in complex with guide RNA and target DNA.Cell 156, 935−949,doi:10.1016/j.cell.2014.02.001(2014).
18 Peabody,D.S.The RNA binding site of bacteriophage MS2 coat protein.The EMBO journal 12,595−600(1993).
19 Auslander,S.,Auslander,D.,Muller,M.,Wieland,M.&Fussenegger,M.Programmable single−cell mammalian biocomputers.Nature 487,123−127,doi:10.1038/nature11149(2012).
20 Lemon,B.&Tjian,R.Orchestrated response: a symphony of transcription factors for gene control.Genes&development 14,2551−2569(2000).
21 van Essen,D.,Engist,B.,Natoli,G.&Saccani, S. Two modes of transcriptional activation at native promoters by NF−kappaB p65.PLoS biology 7,e73,doi:10.1371/journal.pbio.1000073 (2009).
22 Kretzschmar,M.,Kaiser,K.,Lottspeich,F.&Meisterernst,M.A novel mediator of class II gene transcription with homology to viral immediate−early transcriptional regulators.Cell 78,525−534(1994).
23 Ikeda,K.,Stuehler,T.&Meisterernst,M.The H1 and H2 regions of the activation domain of herpes simplex virion protein 16 stimulate transcription through distinct molecular mechanisms.Genes to cells:devoted to molecular&cellular mechanisms 7,49−58(2002).
24 Neely,K.E.et al.Activation domain−mediated targeting of the SWI/SNF complex to promoters stimulates transcription from nucleosome arrays.Molecular cell 4,649−655(1999).
25 Weintraub,H.et al.Muscle−specific transcriptional activation by MyoD.Genes&development 5,1377−1386(1991).
26 Cech,T.R.&Steitz,J.A.The noncoding RNA revolution−trashing old rules to forge new ones.Cell 157,77−94,doi:10.1016/j.cell.2014.03.008(2014).
27 Engreitz,J.M.et al.The Xist lncRNA exploits three−dimensional genome architecture to spread across the X chromosome.Science 341,1237973,doi:10.1126/science.1237973(2013).
28 Kretz,M.et al.Control of somatic tissue differentiation by the long non−coding RNA TINCR.Nature 493,231−235,doi:10.1038/nature11661(2013).
29 Wang,K.C.et al.A long noncoding RNA maintains active chromatin to coordinate homeotic gene expression.Nature 472,120−124,doi:10.1038/nature09819(2011).
30 Prensner,J.R.et al.Transcriptome sequencing across a prostate cancer cohort identifies PCAT−1,an unannotated lincRNA implicated in disease progression.Nature biotechnology 29,742−749,doi:10.1038/nbt.1914(2011).
31 Cabili,M.N.et al.Integrative annotation of human large intergenic noncoding RNAs reveals global properties and specific subclasses.Genes&development 25,1915−1927,doi:10.1101/gad.17446611(2011).
32 Li,J.et al.PTEN,a putative protein tyrosine phosphatase gene mutated in human brain,breast,and prostate cancer. Science 275,1943−1947(1997).
33 Bowman,T.et al.Stat3−mediated Myc expression is required for Src transformation and PDGF−induced mitogenesis.Proceedings of the National Academy of Sciences of the United States of America 98,7319−7324,doi:10.1073/pnas.131568898(2001).
34 Prahallad,A.et al.Unresponsiveness of colon cancer to BRAF(V600E)inhibition through feedback activation of EGFR.Nature 483,100−103,doi:10.1038/nature10868(2012).
35 Held,M.A.et al.Genotype−selective combination therapies for melanoma identified by high−throughput drug screening.Cancer discovery 3,52−67,doi:10.1158/2159−8290.CD−12−0408(2013).
36 Johannessen,C.M.et al.A melanocyte lineage program confers resistance to MAP kinase pathway inhibition.Nature 504,138−142,doi:10.1038/nature12688(2013).
37 Jenkins,L.et al.Agonist activation of the G protein−coupled receptor GPR35 involves transmembrane domain III and is transduced via Galpha(1)(3)and beta−arrestin−2.British journal of pharmacology 162,733−748,doi:10.1111/j.1476−5381.2010.01082.x(2011).
38 Choi,J.W.et al.LPA receptors:subtypes and biological actions.Annual review of pharmacology and toxicology 50,157−186,doi:10.1146/annurev.pharmtox.010909.105753(2010).
39 Kumar,S.A.et al.Lysophosphatidic acid receptor expression in chronic lymphocytic leukemia leads to cell survival mediated though vascular endothelial growth factor expression. Leukemia&lymphoma 50,2038−2048,doi:10.3109/10428190903275586(2009).
40 Okabe,K.et al.Possible involvement of lysophosphatidic acid receptor−5 gene in the acquisition of growth advantage of rat tumor cells.Molecular carcinogenesis 50,635−642,doi:10.1002/mc.20750(2011).
41 Fujiwara,S.et al.Transforming activity of purinergic receptor P2Y,G protein coupled,8 revealed by retroviral expression screening.Leukemia&lymphoma 48,978−986,doi:10.1080/10428190701225882(2007).
42 Johannessen,C.M.et al.COT drives resistance to RAF inhibition through MAP kinase pathway reactivation. Nature 468,968−972,doi:10.1038/nature09627(2010).
43 Gupta,S.K.,Oommen,S.,Aubry,M.C.,Williams,B.P.&Vlahakis,N.E.Integrin alpha9beta1 promotes malignant tumor growth and metastasis by potentiating epithelial−mesenchymal transition.Oncogene 32,141−150,doi:10.1038/onc.2012.41(2013).
44 Bao,W.&Stromblad,S.Integrin alphav−mediated inactivation of p53 controls a MEK1−dependent melanoma cell survival pathway in three−dimensional collagen.The Journal of cell biology 167,745−756,doi:10.1083/jcb.200404018(2004).
45 Desgrosellier,J.S.&Cheresh,D.A.Integrins in cancer:biological implications and therapeutic opportunities.Nature reviews.Cancer 10,9−22,doi:10.1038/nrc2748(2010).
46 Seguin,L.et al.An integrin beta(3)−KRAS−RalB complex drives tumour stemness and resistance to EGFR inhibition.Nature cell biology 16,457−468,doi:10.1038/ncb2953(2014).
47 Konieczkowski,D.J.et al.A melanoma cell state distinction influences sensitivity to MAPK pathway inhibitors.Cancer discovery 4,816−827,doi:10.1158/2159−8290.CD−13−0424(2014).
48 Barretina,J.et al.The Cancer Cell Line Encyclopedia enables predictive modelling of anticancer drug sensitivity.Nature 483,603−607,doi:10.1038/nature11003(2012).
49 Lin,W.M.et al.Modeling genomic diversity and tumor dependency in malignant melanoma. Cancer research 68,664−673,doi:10.1158/0008−5472.CAN−07−2615(2008).
50 Wu,X.et al.Genome−wide binding of the CRISPR endonuclease Cas9 in mammalian cells.Nature biotechnology 32,670−676,doi:10.1038/nbt.2889(2014).
51 Luo,B.et al.Highly parallel identification of essential genes in cancer cells.Proceedings of the National Academy of Sciences of the United States of America 105,20380−20385,doi:10.1073/pnas.0810485105(2008).
52 Subramanian,A.et al.Gene set enrichment analysis: a knowledge−based approach for interpreting genome−wide expression profiles.Proceedings of the National Academy of Sciences of the United States of America 102,15545−15550,doi:10.1073/pnas.0506580102(2005).
53 Barbie,D.A.et al.Systematic RNA interference reveals that oncogenic KRAS−driven cancers require TBK1.Nature 462,108−112,doi:10.1038/nature08460(2009).
54 Liberzon,A.et al.Molecular signatures database(MSigDB)3.0.Bioinformatics 27,1739−1740,doi:10.1093/bioinformatics/btr260(2011).
【1070】
実施例21:誘導性構造設計活性化メディエータートランスジェニックマウス
Platt et al.,Cell(2014),159(2):440−455、または本明細書に引用されるPCT特許出願公開、例えば、国際公開第2014/093622号パンフレット(PCT/US2013/074667号明細書)に基づき、誘導性構造設計活性化メディエータートランスジェニックマウスを樹立する。SpCas9−VP64融合タンパク質のコード領域の上流でLox−Stop−polyA−Lox(LSL)カセットによりエンジニアリングされたマウスを樹立する。SpCas9−VP64融合タンパク質のコード領域の上流で、およびMS2−P65−HSF1融合タンパク質のコード領域の上流でLox−Stop−polyA−Lox(LSL)カセットによりエンジニアリングされた第2のマウスを樹立する。
【1071】
実施例22:細胞およびトランスジェニックマウス中で誘導性構造設計活性化メディエーターを使用する機能獲得表現型のスクリーニング
実施例21において樹立されたマウスを、Cre(例えば、U6プロモーターの制御下)をコードおよび発現し、AAVを介して本発明による改変sgRNA(例えば、U6改変sgRNA)もコードおよび発現するAAV−Cre構築物により形質移入する。sgRNAは、不明機能のlincRNAのTTSの1000ヌクレオチド上流内のプロモーター領域を標的化するように設計する。動物を異常な表現型についてスクリーニングする。
【1072】
PCT出願、とりわけ、2014年6月10日に出願された米国指定出願第PCT/US14/41806号明細書、およびこのPCT出願の系列における出願(すなわち、PCT/US14/41806号明細書が優先権を主張する出願におけるガイド)(全て参照により本明細書に組み込まれる)のヒトガイドおよびマウスガイドは、本明細書に記載のアクチベーター、または本明細書に記載のリプレッサーを含有するように改変する。
【1073】
Cas9を含有し、またはそれを構成的に発現し、もしくは誘導的に発現するように改変されたヒト細胞を、PCT出願、とりわけ、2014年6月10日に出願された米国指定出願第PCT/US14/41806号明細書、およびこのPCT出願の系列の出願(すなわち、PCT/US14/41806号明細書が優先権を主張する出願におけるガイド)のヒトsgRNAをコードするAAV構築物により形質移入し、ガイドは、本明細書の記載により少なくとも1つのリプレッサーまたは少なくとも1つのアクチベーターのいずれかを、プロモーター、例えば、本発明によるU6改変sgRNAの制御下およびそれに作動可能に結合させて含み;Cas9が誘導的に発現されるそのような細胞の場合、Creは発現を誘導し、構築物は、AAVを介して、例えば、U6プロモーターに作動可能に結合させてコードすることによりCreもコードおよび発現する。sgRNAがアクチベーターを有する細胞を機能獲得についてモニタリングし、sgRNAがリプレッサーを有する細胞を機能損失についてモニタリングする。改変sgRNAがアクチベーターを有する細胞は機能獲得を示し、改変sgRNAがリプレッサーを有する細胞は機能損失を示す。この様式において、ヒト細胞をスクリーニングすることができる。
【1074】
実施例21、Platt et al.,Cell(2014),159(2):440−455、または本明細書に引用されるPCT出願公開、例えば、国際公開第2014/093622号パンフレット(PCT/US2013/074667号明細書)のCas9マウスを、Cre(例えば、U6プロモーターの制御下)をコードおよび発現し、さらにはPCT出願、とりわけ、2014年6月10日に出願された米国指定出願第PCT/US14/41806号明細書、およびこのPCT出願の系列の出願(すなわち、PCT/US14/41806号明細書が優先権を主張する出願におけるガイド)の改変マウスsgRNA(例えば、U6改変sgRNA)をコードおよび発現するAAV−Cre構築物により形質移入し、ガイドは、本明細書の開示による少なくとも1つのリプレッサーまたは少なくとも1つのアクチベーターのいずれかを含む。sgRNAがアクチベーターを有するマウスを機能獲得についてモニタリングし、sgRNAがリプレッサーを有するマウスを機能損失についてモニタリングする。改変sgRNAがアクチベーターを有するマウスは機能獲得を示し、改変sgRNAがリプレッサーを有するマウスは機能損失を示す。この様式において、マウスをスクリーニングすることができる。
【1075】
一態様において、本発明の方法におけるベクター系は、1つ以上のレンチウイルスベクターを含む。好ましい実施形態において、1つ以上のレンチウイルスベクターは、コドン最適化核局在化シグナル(NLS)、コドン最適化P2Aバイシストロニックリンカー配列および最適に配置されたU6ドライブガイドRNAカセットを含み得る。別の態様において、ベクター系は、2つのレンチウイルスベクターを含み、一方のレンチウイルスベクターは、Cas9酵素を含み、他方のレンチウイルスベクターは、本発明のライブラリーから選択されるガイドRNAを含む。本発明の一実施形態において、それぞれのベクターは、異なる選択マーカー、例えば、異なる抗生物質耐性マーカーを有する。本発明はまた、本発明のライブラリーを含むキットを包含する。ある態様において、キットは、本発明のライブラリーを含むベクターを含む単一容器を含む。他の態様において、キットは、本発明のライブラリーを含むプラスミドを含む単一容器を含む。本発明はまた、本発明のライブラリーからのユニークCRISPR−Cas系ガイド配列の選択を含むパネルを含み、選択は、特定の生理学的状態を示すキットを包含する。好ましい実施形態において、標的化は、約100個以上の配列、約1000個以上の配列または約20,000個以上の配列または全ゲノムである。他の実施形態において、標的配列のパネルは、関連または所望の経路、例えば、免疫経路または細胞分裂にフォーカスされる。
【1076】
実施例23:ペア形成ニッカーゼFok1
CRISPR酵素が「不機能」(非突然変異Cas9またはCRISPR酵素の多くとも5%のヌクレアーゼ活性を有する)であり、Fok1ヌクレアーゼがsgRNAに作動可能に結合している突然変異CRISPR酵素を有するペア形成CRISPR−Cas複合体を細胞に送達し、ペアにおいて、第1のCRISPR−Cas複合体は、細胞中の第1の遺伝子座において切断を行い、第2のCRISPR−Cas複合体は、細胞中の第2の遺伝子座において切断を行い;2つのFok1酵素は、例えば、第1および第2の遺伝子座が互いに向き合い、または互いに近く存在するが、二本鎖DNAの異なる鎖上に存在する場合に二本鎖分解を提供し、その結果、CRISPR−Cas複合体は、特定の特異的切断または二本鎖切断を提供し、CRISPR−Cas複合体は、未改変CRISPR−Cas複合体よりもオフターゲット切断のより大きい低減を有する。ペア形成CRISPR−Cas9複合体は、二本鎖DNAの2つの鎖を切断し得、その結果、HDRが生じ得る。テンプレートDNAを細胞中に導入する実施形態において、二本鎖切断が行われたテンプレートDNAを挿入する相同組換えが存在する。
【1077】
実施例24:3成分キメラCas9酵素
キメラCas9酵素を構築および試験した。キメラ酵素は、SpCas9からのN’およびC’末端ドメインを有したが、内部ドメインはSaまたはSt3ドメインについてスワップアウトしてSp−St3−SpまたはSp−Sa−Spキメラ3成分酵素を提供した。
【1078】
一連のガイドをそれぞれのキメラ酵素と試験した。ガイドは純粋なSp、SaもしくはSt3野生型のいずれかであり、またはそれらは、それらがSpとSaまたはSt3とのハイブリッドになるようにエンジニアリングした。酵素が1つ以上のSt3内部ドメインを含んでSp−St3−Spキメラ3成分酵素を形成する場合、ハイブリッドガイドは、Sp骨格(BB)およびSt3標的化配列(TGS);またはSt3骨格(BB)およびSp標的化配列(TGS)のいずれかを含んだ。1つ以上のSa内部ドメインをスワップインしてSp−Sa−Spキメラ3成分酵素を形成した場合、ガイドは、Sp骨格(BB)およびSa標的化配列(TGS);またはSa骨格(BB)およびSp標的化配列(TGS)のいずれかを含むようにエンジニアリングした。骨格は、sgRNA足場(またはtracr配列およびtracrメイト)およびsgRNAの20bpスペーサー部分からなる標的化配列(DNA標的に特異的)を含む。
【1079】
スワップインまたはアウトされたドメインは、それらが完全および部分ドメインを含むという点で必ずしも完全なドメインではなかった。Recローブの完全なスワップは本発明の範囲内である一方、説明目的のため、この研究は、Recローブの部分スワップにフォーカスした。Nucローブは、RuvCIドメイン、RuvCIIドメイン、HNHドメイン、RuvCIIIドメインおよびPIドメインを含む一方、Recローブは、BH、REC1およびREC2ドメインを含む。
【1080】
方法
細胞培養および形質移入
ヒト胚性腎臓(HEK)細胞系HEK293FT(Life Technologies)またはマウスNeuro2a(Sigma−Aldrich)細胞系を、10%のウシ胎仔血清(HyClone)、2mMのGlutaMAX(Life Technologies)、100U/mLのペニシリン、および100μg/mLのストレプトマイシンが補給されたダルベッコ改変イーグル培地(DMEM)中で37℃において5%のCO
2インキュベーションで維持した。
【1081】
細胞を24ウェルプレート(Corning)上に、形質移入24時間前に120,000個の細胞/ウェルの密度において播種した。Lipofectamine2000(Life Technologies)を製造業者の推奨プロトコルに従って使用して細胞を80〜90%のコンフルエンシーにおいて形質移入した。合計500ngのCas9プラスミドおよび100ngのU6−sgRNA PCR産物を形質移入した。
【1082】
ゲノム改変のためのSURVEYORヌクレアーゼアッセイ
293FTおよびHUES62細胞を、上記DNAにより形質移入した。形質移入後、細胞を37℃において72時間インキュベートしてからゲノムDNAを抽出した。ゲノムDNAは、QuickExtractDNA Extraction Solution(Epicentre)を製造業者のプロトコルに従って使用して抽出した。手短に述べると、ペレット化された細胞をQuickExtract溶液中で再懸濁させ、65℃において15分間、68℃において15分間および98℃において10分間インキュベートした。
【1083】
それぞれの遺伝子についてのCRISPR標的部位をフランキングするゲノム領域を、以下のとおりプライマーを使用してPCR増幅した:
【1084】
【表416】
[この文献は図面を表示できません]
【1085】
QiaQuick Spin Column(Qiagen)を製造業者のプロトコルに従って使用して産物を精製した。合計400ngの精製PCR産物を2マイクロリットルの10×Taq DNAポリメラーゼPCR緩衝液(Enzymatics)と混合し、超純水で20マイクロリットルの最終容量とし、リアニーリングプロセスに供してヘテロ二本鎖形成を可能とした:95℃において10分間、−2℃/秒における傾斜で95℃から85℃、−0.25℃/秒における85℃から25℃、および25℃において1分間維持。リアニーリング後、産物をSURVEYORヌクレアーゼおよびSURVEYORエンハンサーS(Transgenomics)により製造業者の推奨プロトコルに従って処理し、4〜20%のNovex TBEポリアクリルアミドゲル(Life Technologies)上で分析した。ゲルをSYBR Gold DNA染色(Life Technologies)により30分間染色し、Gel Docゲルイメージングシステム(Bio−rad)によりイメージングした。定量は、相対バンド強度に基づくものであった。インデル割合は、式:
100×(1−(1−(b+c)/(a+b+c))
1/2)
(式中、「a」は、未消化PCR産物のインテグレート強度であり、「b」および「c」は、それぞれの開裂産物のインテグレート強度である)により決定した。
【1086】
結果
ヘリカルドメイン、例えば、本明細書に上記のHD2またはヘリカルドメイン2は、1368アミノ酸SpCas9の初期アノテーションであり、現在の専門用語は、3つのドメイン:REC1(SpCas9を参照して残基94〜179)、REC2(SpCas9を参照して残基180〜307)およびブリッジヘリックスと称される長鎖アルファへリックス(SpCas9を参照して残基60〜93)(Nishimasu et al参照)を有する認識またはRecローブも含む。本実施例の結果を
図86に示す。
図86は、結晶構造に基づくSp、SaおよびSt3Cas9間のキメラの試験を示す。A)SpCas9のドメイン組織化およびアミノ酸(AA)位置。RECローブは、Cas9の新たに同定された構造成分である。B)Nucローブの部分または完全スワップのキメラマップ、キメラ境界のAA位置を示す、C)左側のそれぞれの対応するキメラを用いて達成されたインデル%。標識は、使用されたsgRNAを示す。TGS=標的化配列(sgRNAの20bpスペーサー部分)、BB=sgRNA骨格。本出願人らは、少なくとも3つの成分からなる異なるCas9タンパク質(異なる種に由来)間のキメラを構築することが可能であり、それにより内部ドメインのスワップアウトを可能とすることを見出した。本出願人らは、本明細書に提供される結晶構造に基づき新たに同定されたCas9の内部RECローブに対して実施されたスワップによりこれを説明した。
【1087】
本発明の好ましい実施形態を本明細書において示し、記載したが、そのような実施形態が例として提供されるにすぎないことは当業者に明らかである。当業者は目下、多数のバリエーション、変更、および置換を本発明から逸脱せずに行う。本明細書に記載の本発明の実施形態の種々の代替例を本発明の実施において用いることができることを理解されるべきである。以下の特許請求の範囲は、本発明の範囲を定義し、それらの特許請求の範囲の範囲内の方法および構造ならびにそれらの均等物は、特許請求の範囲により包含されるものとする。
【1088】
参照文献:
1.Urnov,F.D.,Rebar,E.J.,Holmes,M.C.,Zhang,H.S.&Gregory,P.D.Genome editing with engineered zinc finger nucleases.Nat.Rev.Genet.11,636−646(2010).
2.Bogdanove,A.J.&Voytas,D.F.TAL effectors:customizable proteins for DNA targeting.Science 333,1843−1846(2011).
3.Stoddard,B.L.Homing endonuclease structure and function.Q.Rev.Biophys.38,49−95(2005).
4.Bae,T.&Schneewind,O.Allelic replacement in Staphylococcus aureus with inducible counter−selection.Plasmid 55,58−63(2006).
5.Sung,C.K.,Li,H.,Claverys,J.P.&Morrison,D.A.An rpsL cassette,janus,for gene replacement through negative selection in Streptococcus pneumoniae.Appl.Environ.Microbiol.67,5190−5196(2001).
6.Sharan,S.K.,Thomason,L.C.,Kuznetsov,S.G.&Court,D.L.Recombineering:a homologous recombination−based method of genetic engineering.Nat.Protoc.4,206−223(2009).
7.Jinek,M.et al.A programmable dual−RNA−guided DNA endonuclease in adaptive bacterial immunity.Science 337,816−821(2012).
8.Deveau,H.,Garneau,J.E.&Moineau,S.CRISPR/Cas system and its role in phage−bacteria interactions.Annu.Rev.Microbiol.64,475−493(2010).
9.Horvath,P.&Barrangou,R.CRISPR/Cas,the immune system of bacteria and archaea.Science 327,167−170(2010).
10.Terns,M.P.&Terns,R.M.CRISPR−based adaptive immune systems.Curr.Opin.Microbiol.14,321−327(2011).
11.van der Oost,J.,Jore,M.M.,Westra,E.R.,Lundgren,M.&Brouns,S.J.CRISPR−based adaptive and heritable immunity in prokaryotes.Trends.Biochem.Sci.34,401−407(2009).
12.Brouns,S.J.et al.Small CRISPR RNAs guide antiviral defense in prokaryotes.Science 321,960−964(2008).
13.Carte,J.,Wang,R.,Li,H.,Terns,R.M.&Terns,M.P.Cas6 is an endoribonuclease that generates guide RNAs for invader defense in prokaryotes.Genes Dev.22,3489−3496(2008).
14.Deltcheva,E.et al.CRISPR RNA maturation by trans−encoded small RNA and host factor RNase III.Nature 471,602−607(2011).
15.Hatoum−Aslan,A.,Maniv,I.&Marraffini,L.A.Mature clustered,regularly interspaced,short palindromic repeats RNA(crRNA)length is measured by a ruler mechanism anchored at the precursor processing site.Proc.Natl.Acad.Sci.U.S.A. 108,21218−21222(2011).
16.Haurwitz,R.E.,Jinek,M.,Wiedenheft,B.,Zhou,K.&Doudna,J.A.Sequence−and structure−specific RNA processing by a CRISPR endonuclease.Science 329,1355−1358(2010).
17.Deveau,H.et al.Phage response to CRISPR−encoded resistance in Streptococcus thermophilus.J.Bacteriol.190,1390−1400(2008).
18.Gasiunas,G.,Barrangou,R.,Horvath,P.&Siksnys,V.Cas9−crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria.Proc.Natl.Acad.Sci.U.S.A.(2012).
19.Makarova,K.S.,Aravind,L.,Wolf,Y.I.&Koonin,E.V.Unification of Cas protein families and a simple scenario for the origin and evolution of CRISPR−Cas systems.Biol.Direct.6,38(2011).
20.Barrangou,R.RNA−mediated programmable DNA cleavage.Nat.Biotechnol.30,836−838(2012).
21.Brouns,S.J.Molecular biology.A Swiss army knife of immunity.Science 337,808−809(2012).
22.Carroll,D.A CRISPR Approach to Gene Targeting.Mol.Ther.20,1658−1660(2012).
23.Bikard,D.,Hatoum−Aslan,A.,Mucida,D.&Marraffini,L.A.CRISPR interference can prevent natural transformation and virulence acquisition during in vivo bacterial infection.Cell Host Microbe 12,177−186(2012).
24.Sapranauskas,R.et al.The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coli.Nucleic Acids Res.(2011).
25.Semenova,E.et al.Interference by clustered regularly interspaced short palindromic repeat(CRISPR)RNA is governed by a seed sequence.Proc.Natl.Acad.Sci.U.S.A.(2011).
26.Wiedenheft,B.et al.RNA−guided complex from a bacterial immune system enhances target recognition through seed sequence interactions.Proc.Natl.Acad.Sci.U.S.A.(2011).
27.Zahner,D.&Hakenbeck,R.The Streptococcus pneumoniae beta−galactosidase is a surface protein.J.Bacteriol.182,5919−5921(2000).
28.Marraffini,L.A.,Dedent,A.C.&Schneewind,O.Sortases and the art of anchoring proteins to the envelopes of gram−positive bacteria.Microbiol.Mol.Biol.Rev.70,192−221(2006).
29.Motamedi,M.R.,Szigety,S.K.&Rosenberg,S.M.Double−strand−break repair recombination in Escherichia coli:physical evidence for a DNA replication mechanism in vivo.Genes Dev.13,2889−2903(1999).
30.Hosaka,T.et al.The novel mutation K87E in ribosomal protein S12 enhances protein synthesis activity during the late growth phase in Escherichia coli.Mol.Genet.Genomics 271,317−324(2004).
31.Costantino,N.&Court,D.L.Enhanced levels of lambda Red−mediated recombinants in mismatch repair mutants.Proc.Natl.Acad.Sci.U.S.A.100,15748−15753(2003).
32.Edgar,R.&Qimron,U.The Escherichia coli CRISPR system protects from lambda lysogenization,lysogens,and prophage induction.J.Bacteriol.192,6291−6294(2010).
33.Marraffini,L.A.&Sontheimer,E.J.Self versus non−self discrimination during CRISPR RNA−directed immunity.Nature 463,568−571(2010).
34.Fischer,S.et al.An archaeal immune system can detect multiple Protospacer Adjacent Motifs(PAMs)to target invader DNA.J.Biol.Chem.287,33351−33363(2012).
35.Gudbergsdottir,S.et al.Dynamic properties of the Sulfolobus CRISPR/Cas and CRISPR/Cmr systems when challenged with vector−borne viral and plasmid genes and protospacers.Mol.Microbiol.79,35−49(2011).
36.Wang,H.H.et al.Genome−scale promoter engineering by coselection MAGE.Nat Methods 9,591−593(2012).
37.Cong L,Ran FA,Cox D,Lin S,Barretto R,Habib N,Hsu PD,Wu X,Jiang W,Marraffini LA,Zhang F.Multiplex Genome Engineering Using CRISPR/Cas Systems.Science. 2013 Feb 15;339(6121):819−23.
38.Mali,P.,Yang,L.,Esvelt,K.M.,Aach,J.,Guell,M.,DiCarlo,J.E.,Norville,J.E.,and Church,G.M.(2013b).RNA−guided human genome engineering via Cas9.Science 339,823−826.
39.Hoskins,J.et al.Genome of the bacterium Streptococcus pneumoniae strain R6.J.Bacteriol.183,5709−5717(2001).
40.Havarstein,L.S.,Coomaraswamy,G.&Morrison,D.A.An unmodified heptadecapeptide pheromone induces competence for genetic transformation in Streptococcus pneumoniae.Proc.Natl.Acad.Sci.U.S.A.92,11140−11144(1995).
41.Horinouchi,S.&Weisblum,B.Nucleotide sequence and functional map of pC194, a plasmid that specifies inducible chloramphenicol resistance.J.Bacteriol. 150,815−825(1982).
42.Horton,R.M.In Vitro Recombination and Mutagenesis of DNA :SOEing Together Tailor−Made Genes.Methods Mol.Biol.15,251−261(1993).
43.Podbielski,A.,Spellerberg,B.,Woischnik,M.,Pohl,B.&Lutticken,R.Novel series of plasmid vectors for gene inactivation and expression analysis in group A streptococci(GAS).Gene 177,137−147(1996).
44.Husmann,L.K.,Scott,J.R.,Lindahl,G.&Stenberg,L.Expression of the Arp protein, a member of the M protein family, is not sufficient to inhibit phagocytosis of Streptococcus pyogenes.Infection and immunity 63,345−348(1995).
45.Gibson,D.G.et al.Enzymatic assembly of DNA molecules up to several hundred kilobases.Nat Methods 6,343−345(2009).
46.Garneau J.E.et al.The CRISPR/Cas bacterial immune system cleaves bacteriophage and plasmid DNA.Nature 468,67−71(04 November 2010)
47.Barrangou R.et al.CRISPR provides acquired resistance against viruses in prokaryotes.Science.2007 Mar 23;315(5819):1709−12.
48.Ishino Y.et al.Nucleotide sequence of the iap gene,responsible for alkaline phosphatase isozyme conversion in Escherichia coli,and identification of the gene product.J Bacteriol.1987 Dec;169(12):5429−33.
49.Mojica F.J.M et al.Biological significance of a family of regularly spaced repeats in the genomes of Archaea, Bacteria and mitochondria.Molecular Microbiology(2000)36(1),244−246.
50.Jansen R.et al.Identification of genes that are associated with DNA repeats in prokaryotes.Molecular Microbiology(2002)43(6),1565−1575.
51.Gouet,P.,Courcelle,E.,Stuart,D.I.,and Metoz,F.(1999).ESPript:analysis of multiple sequence alignments in PostScript.Bioinformatics 15,305−308.
52.Notredame,C.,Higgins,D.G.,and Heringa,J.(2000).T−Coffee:A novel method for fast and accurate multiple sequence alignment.J Mol Biol 302,205−217.
53.Adams,P.D.,Grosse−Kunstleve,R.W.,Hung,L.W.,Ioerger,T.R.,McCoy,A.J.,Moriarty,N.W.,Read,R.J.,Sacchettini,J.C.,Sauter,N.K.,and Terwilliger,T.C.(2002).PHENIX:building new software for automated crystallographic structure determination.Acta Crystallogr D Biol Crystallogr 58,1948−1954.
54.Ariyoshi,M.,Vassylyev,D.G.,Iwasaki,H.,Nakamura,H.,Shinagawa,H.,and Morikawa,K.(1994).Atomic structure of the RuvC resolvase:a holliday junction−specific endonuclease from E.coli.Cell 78,1063−1072.
55.Biertumpfel,C.,Yang,W.,and Suck,D.(2007).Crystal structure of T4 endonuclease VII resolving a Holliday junction.Nature 449,616−620.
56.Chen,L.,Shi,K.,Yin,Z.,and Aihara,H.(2013).Structural asymmetry in the Thermus thermophilus RuvC dimer suggests a basis for sequential strand cleavages during Holliday junction resolution.Nucleic acids research 41,648−656.
57.delaFortelle,E.,and Bricogne,G.(1997).Maximum−likelihood heavy−atom parameter refinement for multiple isomorphous replacement and multiwavelength anomalous diffraction methods.Methods Enzymol 276,472−494.
58.Emsley,P.,and Cowtan,K.(2004).Coot:model−building tools for molecular graphics.Acta Crystallogr D Biol Crystallogr 60,2126−2132.
59.Fonfara,I.,Le Rhun,A.,Chylinski,K.,Makarova,K.S.,Lecrivain,A.L.,Bzdrenga,J.,Koonin,E.V.,and Charpentier,E.(2013).Phylogeny of Cas9 determines functional exchangeability of dual−RNA and Cas9 among orthologous type II CRISPR−Cas systems.Nucleic acids research.
60.Fu,Y.,Foden,J.A.,Khayter,C.,Maeder,M.L.,Reyon,D.,Joung,J.K.,and Sander,J.D.(2013).High−frequency off−target mutagenesis induced by CRISPR−Cas nucleases in human cells.Nature biotechnology 31,822−826.
61.Gilbert,L.A.,Larson,M.H.,Morsut,L.,Liu,Z.,Brar,G.A.,Torres,S.E.,Stern−Ginossar,N.,Brandman,O.,Whitehead,E.H.,Doudna,J.A.,et al.(2013).CRISPR−mediated modular RNA−guided regulation of transcription in eukaryotes.Cell 154,442−451.
62.Gorecka,K.M.,Komorowska,W.,and Nowotny,M.(2013).Crystal structure of RuvC resolvase in complex with Holliday junction substrate.Nucleic Acids Res 41,9945−9955.
63.Gratz,S.J.,Cummings,A.M.,Nguyen,J.N.,Hamm,D.C.,Donohue,L.K.,Harrison,M.M.,Wildonger,J.,and O’Connor−Giles,K.M.(2013).Genome engineering of Drosophila with the CRISPR RNA−guided Cas9 nuclease.Genetics 194,1029−1035.
64.Holm,L.,and Rosenstrom,P.(2010).Dali server:conservation mapping in 3D.Nucleic acids research 38,W545−549.
65.Hsu,P.D.,Scott,D.A.,Weinstein,J.A.,Ran,F.A.,Konermann,S.,Agarwala,V.,Li,Y.,Fine,E.J.,Wu,X.,Shalem,O.,et al.(2013).DNA targeting specificity of RNA−guided Cas9 nucleases.Nature biotechnology 31,827−832.
66.Hwang,W.Y.,Fu,Y.,Reyon,D.,Maeder,M.L.,Tsai,S.Q.,Sander,J.D.,Peterson,R.T.,Yeh,J.R.,and Joung,J.K.(2013).Efficient genome editing in zebrafish using a CRISPR−Cas system.Nature biotechnology 31,227−229.
67.Kabsch,W.(2010).Xds.Acta crystallographica Section D,Biological crystallography 66,125−132.
68.Konermann,S.,Brigham,M.D.,Trevino,A.E.,Hsu,P.D.,Heidenreich,M.,Cong,L., Platt,R.J.,Scott,D.A.,Church,G.M.,and Zhang,F.(2013).Optical control of mammalian endogenous transcription and epigenetic states.Nature 500,472−476.
69.Li,C.L.,Hor,L.I.,Chang,Z.F.,Tsai,L.C.,Yang,W.Z.,and Yuan,H.S.(2003).DNA binding and cleavage by the periplasmic nuclease Vvn:a novel structure with a known active site.The EMBO journal 22,4014−4025.
70.Maeder,M.L.,Linder,S.J.,Cascio,V.M.,Fu,Y.,Ho,Q.H.,and Joung,J.K.(2013).CRISPR RNA−guided activation of endogenous human genes.Nature methods 10,977−979.
71.Mali,P.,Aach,J.,Stranges,P.B.,Esvelt,K.M.,Moosburner,M.,Kosuri,S.,Yang, L.,and Church,G.M.(2013a).CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering.Nature biotechnology 31,833−838.
72.Marraffini,L.A.,and Sontheimer,E.J.(2008).CRISPR interference limits horizontal gene transfer in staphylococci by targeting DNA.Science 322,1843−1845.
73.Marraffini,L.A.,and Sontheimer,E.J.(2010).CRISPR interference:RNA−directed adaptive immunity in bacteria and archaea.Nat Rev Genet 11,181−190.
74.Mojica,F.J.,Diez−Villasenor,C.,Garcia−Martinez,J.,and Almendros,C.(2009).Short motif sequences determine the targets of the prokaryotic CRISPR defence system.Microbiology 155,733−740.
75.Pattanayak,V.,Lin,S.,Guilinger,J.P.,Ma,E.,Doudna,J.A.,and Liu,D.R.(2013).High−throughput profiling of off−target DNA cleavage reveals RNA−programmed Cas9 nuclease specificity.Nature biotechnology 31,839−843.
76.Perez−Pinera,P.,Kocak,D.D.,Vockley,C.M.,Adler,A.F.,Kabadi,A.M.,Polstein,L.R.,Thakore,P.I.,Glass,K.A.,Ousterout,D.G.,Leong,K.W.,et al.(2013).RNA−guided gene activation by CRISPR−Cas9−based transcription factors.Nature methods 10,973−976.
77.Qi,L.S.,Larson,M.H.,Gilbert,L.A.,Doudna,J.A.,Weissman,J.S.,Arkin,A.P., and Lim,W.A.(2013).Repurposing CRISPR as an RNA−guided platform for sequence−specific control of gene expression.Cell 152,1173−1183.
78.Ran,F.A.,Hsu,P.D.,Lin,C.Y.,Gootenberg,J.S.,Konermann,S.,Trevino,A.E.,Scott,D.A.,Inoue,A.,Matoba,S.,Zhang,Y.,et al.(2013).Double nicking by RNA−guided CRISPR Cas9 for enhanced genome editing specificity.Cell 154,1380−1389.
79.Sampson,T.R.,Saroj,S.D.,Llewellyn,A.C.,Tzeng,Y.L.,and Weiss,D.S.(2013).A CRISPR/Cas system mediates bacterial innate immune evasion and virulence.Nature 497,254−257.
80.Shalem,O.,Sanjana,N.E.,Hartenian,E.,Shi,X.,Scott,D.A.,Mikkelsen,T.S., Heckl,D.,Ebert,B.L.,Root,D.E.,Doench,J.G.,et al.(2014).Genome−scale CRISPR−Cas9 knockout screening in human cells.Science 343,84−87.
81.Sheldrick,G.M.(2008).A short history of SHELX.Acta crystallographica Section A,Foundations of crystallography 64,112−122.
82.Spilman,M.,Cocozaki,A.,Hale,C.,Shao,Y.,Ramia,N.,Terns,R.,Terns,M.,Li,H.,and Stagg,S.(2013).Structure of an RNA silencing complex of the CRISPR−Cas immune system.Molecular cell 52,146−152.
83.Wang,H.,Yang,H.,Shivalila,C.S.,Dawlaty,M.M.,Cheng,A.W.,Zhang,F.,and Jaenisch,R.(2013).One−step generation of mice carrying mutations in multiple genes by CRISPR/Cas−mediated genome engineering.Cell 153,910−918.
84.Wang,T.,Wei,J.J.,Sabatini,D.M.,and Lander,E.S.(2014).Genetic screens in human cells using the CRISPR−Cas9 system.Science 343,80−84.
85.Wiedenheft,B.,Lander,G.C.,Zhou,K.,Jore,M.M.,Brouns,S.J.,van der Oost,J.,Doudna,J.A.,and Nogales,E.(2011).Structures of the RNA−guided surveillance complex from a bacterial immune system.Nature 477,486−489.
86.Winn,M.D.,Ballard,C.C.,Cowtan,K.D.,Dodson,E.J.,Emsley,P.,Evans,P.R.,Keegan,R.M.,Krissinel,E.B.,Leslie,A.G., McCoy,A.,et al.(2011).Overview of the CCP4 suite and current developments.Acta crystallographica Section D,Biological crystallography 67,235−242.
87.Yang,H.,Wang,H.,Shivalila,C.S.,Cheng,A.W.,Shi,L.,and Jaenisch,R.(2013).One−step generation of mice carrying reporter and conditional alleles by CRISPR/Cas−mediated genome engineering.Cell 154,1370−1379.