【文献】
Cell,2013年 2月28日,Vol.152,pp.1173-1183, Supplemental Information
【文献】
Mol. Cell,2013年 2月 7日,Vol.49,pp.524-535
【文献】
Nat. Methods,2013年 2月10日,Vol.10,pp.243-245
【文献】
J. Biotechnol.,2009年,Vol.140,pp.156-161,Fig.1
(58)【調査した分野】(Int.Cl.,DB名)
前記異種機能ドメインが、介在リンカーを伴って前記触媒的に不活性なCas9タンパク質のN末端またはC末端と連結し、前記リンカーが、前記融合タンパク質の活性に干渉しない、請求項1〜4のいずれか一項に記載の融合タンパク質。
N末端上、C末端上および/または前記触媒的に不活性なCRISPR関連9(Cas9)タンパク質と前記異種機能ドメインとの間に核局在化配列および1つもしくは複数のエピトープタグの一方または両方をさらに含む、請求項1〜5のいずれか一項に記載の融合タンパク質。
1つまたは複数の介在リンカーを伴って、N末端上、C末端上および/または前記触媒的に不活性なCRISPR関連9(Cas9)タンパク質と前記異種機能ドメインとの間に核局在化配列および1つもしくは複数のエピトープタグの一方または両方をさらに含む、請求項1〜5のいずれか一項に記載の融合タンパク質。
【発明を実施するための形態】
【0019】
詳細な説明
本明細書には、異種機能ドメイン(例えば、転写活性化ドメイン)の、細胞および生きた生物体の特定のゲノム位置へのRNA誘導型標的化を可能にすることを目的として、触媒的に不活性化された型のCas9タンパク質と融合したこれらの異種機能ドメインの融合タンパク質が記載される。
【0020】
CRISPR/Cas系は、細菌においてプラスミドおよびウイルスの侵入から保護するため防御機序として進化してきた。外来核酸に由来する短いプロトスペーサーがCRISPR遺伝子座内に組み込まれ、次いで転写され、プロセシングを受けて短いCRISPR RNA(crRNA)になる。第二のtracrRNAと複合体を形成したこのcrRNAは、その侵入核酸との配列相補性を利用して、外来核酸のCas9媒介性切断とこれに続く破壊を誘導する。2012年、Doudnaらは、crRNAとtracrRNAとの融合物からなる単一ガイドRNA(sgRNA)が、in vitroで特定のDNA配列へのCas9ヌクレアーゼの動員を媒介し得ることを示した(
図1C;Jinekら,Science 2012)。
【0021】
より最近では、さらに長い型のsgRNAを用いて、ヒト細胞およびゼブラフィッシュに標的化された変化が導入されている(
図1B;Maliら,Science 2013、HwangおよびFuら,Nat Biotechnol.2013 Mar;31(3):227−9)。Qiらは、触媒的に不活性な変異型のCas9(dCas9とも呼ばれる)のgRNA媒介性動員によって、大腸菌(E.coli)の特定内在遺伝子およびヒト細胞のEGFPレポーター遺伝子の抑制を引き起こすことが可能であることを示した(Qiら,Cell 152,1173−1183(2013))。この研究はRNA誘導型Cas9技術を遺伝子発現の調節に適用できる可能性を示したものであるが、プログラム可能なsgRNAまたは二重gRNAs(dgRNA、すなわち、カスタマイズされたcrRNAおよびtracrRNA)によって特定のゲノム部位に動員される能力を破壊せずに異種機能ドメイン(例えば、転写活性化ドメイン)とdCas9とを融合させることが可能かどうかについては検討も実証もしていない。
【0022】
本明細書に記載されるように、Cas9媒介性ヌクレアーゼ活性を誘導することに加えて、CRISPR由来RNAを用いて、Cas9と融合した異種機能ドメイン(Cas9−HFD)をゲノムの特定部位に標的化することが可能である(
図1C)。例えば、本明細書に記載されるように、単一ガイドRNA(sgRNA)を用いてCas9−HFD、例えばCas9−転写活性化因(以降、Cas9−活性化因子と呼ぶ)を特定遺伝子のプロモーターに標的化することによって、標的遺伝子の発現を増大させることが可能である。このように、ガイドRNAの配列相補性によって定められる標的特異性によってCas9−HFDをゲノム内の部位に局在させることが可能である。標的配列は、PAM配列(RNAによって特定される配列に隣接し、Cas9タンパク質によって特定される2〜5ヌクレオチドの配列)も含む。
【0023】
Cas9−HFDは、異種機能ドメイン(例えば転写活性化ドメイン、例えば、VP64またはNF−κB p65の転写活性化ドメイン)と、触媒的に不活性なCas9タンパク質(dCas9)のN末端またはC末端とを融合することによって作製される。
【0024】
Cas9
いくつかの細菌がCas9タンパク質変異体を発現する。現在、化膿性連鎖球菌(Streptococcus pyogenes)Cas9が最もよく用いられているが、他のCas9タンパク質にも化膿性連鎖球菌(S.pyogenes)Cas9と高レベルの配列同一性を有し、同じガイドRNAを利用するものがある。それ以外のものはさらに多様であり、利用するgRNAが異なり、認識するPAM配列(RNAによって定められる配列に隣接するタンパク質によって定められる、2〜5のヌクレオチドの配列)も異なる。Chylinskiらは多数の細菌群のCas9タンパク質を分類し(RNA Biology 10:5,1−12;2013)、その付
図1および付表1に多数のCas9タンパク質を列記しており、これらは参照により本明細書に組み込まれる。ほかのCas9タンパク質については、Esveltら,Nat Methods.2013 Nov;10(11):1116−21およびFonfaraら,“Phylogeny of Cas9 determines functional exchangeability of dual−RNA and Cas9 among orthologous type II CRISPR−Cas systems.” Nucleic Acids Res.2013 Nov 22.[印刷前電子出版]doi:10.1093/nar/gkt1074に記載されている。
【0025】
本明細書に記載の方法および組成物には様々な種のCas9分子を用いることができる。化膿性連鎖球菌(S.pyogenes)およびサーモフィルス菌(S.thermophilus)のCas9分子が本開示の大部分の対象となるが、ほかにも、本明細書に列記する他の種のCas9タンパク質に由来するか、これに基づくCas9分子を用いることができる。換言すれば、本記載の大部分が化膿性連鎖球菌(S.pyogenes)およびサーモフィルス菌(S.thermophilus)のCas9分子を用いるものであるが、他の種のCas9分子をその代わりに用いることができる。このような種としては、Chylinskiら,2013の付
図1に基づいて作成した以下の表に記載される種が挙げられる。
【0027】
本明細書に記載される構築物および方法は上に挙げたいずれかのCas9タンパク質およびその対応するガイドRNAまたはこれに相当する他のガイドRNAの使用を含み得る。サーモフィルス菌(Streptococcus thermophilus)LMD−9のCas9 CRISPR1系がヒト細胞で機能することがCongらに示されている(Science 339,819(2013))。さらに、Jinekらは、サーモフィルス菌(S.thermophilus)およびL.イノキュア(L.innocua)のCas9オルソログ(異なるガイドRNAを利用すると思われる髄膜炎菌(N.meningitidis)およびジェジュニ菌(C.jejuni)のCas9オルソログではない)が、わずかに効率が低下するものの、化膿性連鎖球菌(S.pyogenes)二重gRNAによって誘導されて標的プラスミドDNAを切断し得ることをin vitroで明らかにしている。
【0028】
いくつかの実施形態では、本発明の系は、細菌にコードされるか、哺乳動物細胞での発現にコドン最適化され、D10、E762、H983またはD986およびH840またはN863の変異、例えば、D10A/D10NおよびH840A/H840N/H840Yを含む化膿性連鎖球菌(S.pyogenes)Cas9タンパク質を用いてタンパク質のヌクレアーゼ部分の触媒的に不活性な状態にし;これらの位置における置換は、(Nishimasuら,Cell 156,935−949(2014)に記載されているように)アラニンであってよく、また他の残基、例えばグルタミン、アスパラギン、チロシン、セリンまたはアスパラギン酸、例えばE762Q、H983N、H983Y、D986N、N863D、N863SまたはN863Hであってよい(
図1C)。本明細書に記載の方法および組成物に使用することができる触媒的に不活性な化膿性連鎖球菌(S.pyogenes)Cas9は以下の通りであり、例示的なD10AおよびH840Aの変異は太字で表され、下線が施されている。
【0030】
いくつかの実施形態では、本明細書で使用されるCas9ヌクレアーゼは、化膿性連鎖球菌(S.pyogenes)Cas9の配列と少なくとも約50%同一である、すなわち、配列番号13と少なくとも50%同一である。いくつかの実施形態では、ヌクレオチド配列は配列番号13と約50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%または100%同一である。
【0031】
いくつかの実施形態では、本明細書で使用される触媒的に不活性なCas9は、触媒的に不活性な化膿性連鎖球菌(S.pyogenes)Cas9の配列と少なくとも約50%同一である、すなわち、配列番号13と少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%または100%同一であり、ここでは、D10およびH840の変異、例えばD10A/D10NおよびH840A/H840N/H840Yが維持される。
【0032】
いくつかの実施形態では、配列番号13との差はいずれも非保存領域内にあり、これはChylinskiら,RNA Biology 10:5,1−12;2013(例えば、その付
図1および付表1);Esveltら,Nat Methods.2013 Nov;10(11):1116−21およびFonfaraら,Nucl.Acids Res.(2014)42(4):2577−2590.[印刷前電子出版 2013 Nov 22]doi:10.1093/nar/gkt1074に記載されている配列の配列アライメントによって確認され、ここでは、D10およびH840の変異、例えばD10A/D10NおよびH840A/H840N/H840Yが維持される。
【0033】
2つの配列のパーセント同一性を決定するには、最適比較目的で配列を整列させる(最適な整列に必要であれば第一および第二のアミノ酸または核酸配列の一方または両方にギャップを導入し、また非相同配列を無視することができる)。比較目的で整列させる参照配列の長さは少なくとも50%である(いくつかの実施形態では、参照配列の長さの約50%、55%、60%、65%、70%、75%、85%、90%、95%または100%)を整列させる。次いで、対応する位置のヌクレオチドまたは残基を比較する。第一の配列のある位置が、第二の配列の対応する位置と同じヌクレオチドまたは残基によって占められていれば、2つの分子はその位置において同一である。2つの配列のパーセント同一性は、2つの配列の最適な整列のために導入する必要があるギャップの数および各ギャップの長さを考慮に入れた、2つの配列に共通する同一の位置の数の関数となる。
【0034】
配列の比較および2つの配列間のパーセント同一性の決定は、数学的アルゴリズムを用いて実施することができる。本願の目的には、GCGソフトウェアパッケージのGAPプログラムに組み込まれているNeedlemanおよびWunsch((1970)J.Mol.Biol.48:444−453)のアルゴリズムを使用し、ギャップペナルティが12、ギャップ伸長ペナルティが4、フレームシフトギャップペナルティが5のBlossum62スコア行列を用いて、2つのアミノ酸配列間のパーセント同一性を決定する。
【0035】
異種機能ドメイン
転写活性化ドメインはCas9のN末端に融合しても、C末端に融合してもよい。さらに、本記載では転写活性化ドメインを例にあげているが、ほかにも当該技術分野で公知の他の異種機能ドメイン(例えば、転写リプレッサー(例えば、KRAB、ERD、SIDなど、例えば、ets2リプレッサー因子(ERF)リプレッサードメイン(ERD)のアミノ酸473〜530、KOX1のKRABドメインのアミノ酸1〜97またはMad mSIN3相互作用ドメイン(SID)のアミノ酸1〜36;Beerliら,PNAS USA 95:14628−14633(1998)を参照されたい)またはヘテロクロマチンタンパク質1(HP1、swi6としても知られる)、例えば、HP1αもしくはHP1βなどのサイレンサー;固定化RNA結合配列、例えばMS2コートタンパク質,エンドリボヌクレアーゼCsy4またはラムダNタンパク質が結合するRNA結合配列などと融合した長い非コードRNA(lncRNA)を動員し得るタンパク質またはペプチド;DNAのメチル化状態を修飾する酵素(例えば、DNAメチルトランスフェラーゼ(DNMT)またはTETタンパク質);あるいはヒストンサブユニットを修飾する酵素(例えば、ヒストンアセチルトランスフェラーゼ(HAT)、ヒストンデアセチラーゼ(HDAC)、ヒストンメチルトランスフェラーゼ(例えば、リジンまたはアルギニン残基をメチル化する)またはヒストンデメチラーゼ(例えば、リジンまたはアルギニン残基を脱メチル化する))を用いることができる。このようなドメインのいくつかの配列、例えば、DNA中のメチル化シトシンのヒドロキシル化を触媒するドメインの配列が当該技術分野で公知である。例示的なタンパク質は、DNA中の5−メチルシトシン(5−mC)を5−ヒドロキシメチルシトシン(5−hmC)n変換する酵素である、Ten−Eleven−Translocation(TET)1〜3のファミリーを含む。
【0036】
ヒトTET1−3の配列は当該技術分野で公知であり、これを下の表に示す。
【0038】
いくつかの実施形態では、触媒ドメインの完全長配列の全部または一部、例えば、システインリッチ延長と7つの高度の保存されたエキソンによってコードされる2OGFeDOドメインとを含む触媒モジュール、例えば、アミノ酸1580〜2052を含むTet1触媒ドメイン、アミノ酸1290〜1905を含むTet2およびアミノ酸966〜1678を含むTet3を含み得る。例えば、3種類すべてのTetタンパク質の重要な触媒残基を示す整列に関しては、Iyerら,Cell Cycle.2009 Jun 1;8(11):1698−710.Epub 2009 Jun 27の
図1を、また完全長配列に関してはその付属資料(ftpサイトftp.ncbi.nih.gov/pub/aravind/DONS/supplementary_material_DONS.htmlで入手可能)を参照されたい(例えば、seq 2cを参照されたい);いくつかの実施形態では、配列はTet1のアミノ酸1418〜2136またはTet2/3の対応する領域を含む。
【0039】
その他の触媒モジュールは、Iyerら,2009で特定されているタンパク質に由来するものであり得る。
【0040】
いくつかの実施形態では、異種機能ドメインは生物学的テザーであり、MS2コートタンパク質、エンドリボヌクレアーゼCsy4またはラムダNタンパク質の全部または一部(例えば、これらのDNA結合ドメイン)を含む。これらのタンパク質を用いて、特異的なステムループ構造を含むRNA分子をdCas9 gRNA標的化配列によって特定される場所に動員することができる。例えば、MS2コートタンパク質、エンドリボヌクレアーゼCsy4またはラムダNと融合したdCas9を用いて、Csy4結合配列、MS2結合配列またはラムダN結合配列と連結したXISTまたはHOTAIRなどの長い非コードRNA(lncRNA)を動員することができる(例えば、Keryer−Bibensら,Biol.Cell 100:125−138(2008)を参照されたい)。あるいは、Csy4結合配列、MS2結合配列またはラムダNタンパク質結合配列を例えば、Keryer−Bibensら(上記)に記載されているように、別のタンパク質と連結してもよく、本明細書に記載の方法および組成物を用いて、このタンパク質をdCas9結合部位に標的化してもよい。いくつかの実施形態では、Csy4は触媒的に不活性である。
【0041】
いくつかの実施形態では、融合タンパク質はdCas9と異種機能ドメインとの間にリンカーを含む。これらの融合タンパク質(または連結構造の融合タンパク質同士)に使用し得るリンカーは、融合タンパク質の機能に干渉しない任意の配列を含み得る。好ましい実施形態では、リンカーは短く、例えば2〜20アミノ酸であり、通常は柔軟である(すなわち、グリシン、アラニンおよびセリンなどの自由度の高いアミノ酸を含む)。いくつかの実施形態では、リンカーはGGGS(配列番号14)またはGGGGS(配列番号15)からなる1つまたは複数の単位、例えば、2回、3回、4回またはそれ以上反復したGGGS(配列番号14)またはGGGGS(配列番号15)の単位を含む。ほかにも、これ以外のリンカー配列を使用することができる。
【0042】
使用方法
記載されるCas9−HFD系は、内在遺伝子の発現の改変に有用で用途の多いツールである。これを達成するのに現在用いられている方法では、標的とする各部位について新規に設計したDNA結合タンパク質(設計された亜鉛フィンガーまたは転写活性化因子様エフェクターDNA結合ドメインなど)が必要である。これらの方法は、各標的部位と結合するよう特異的に設計された大型のタンパク質を発現させる必要があるため、それを多重化する容量に制限がある。しかし、Cas9−HFDは、Cas9−HFDタンパク質1つのみの発現を必要し、それは複数の短いgRNAの発現によってゲノムの複数の部位を標的とさせ得る。したがって、この系は同時に多数の遺伝子の発現を誘導する、または単一の遺伝子、プロモーターもしくはエンハンサーに複数のCas9−HFDを動員するのに容易に用いることが可能である。この能力は用途の範囲が広く、例えば、基礎的な生物学的研究では、遺伝子機能を研究し、単一経路の複数の遺伝子の発現を操作するためにこれを用いることが可能であり、また合成生物学では、これにより研究者が細胞内に複数の入力シグナルに応答する回路を作製することが可能となる。この技術は比較的容易に実施し多重化に適用することが可能であることから、用途が多岐にわたる汎用性の高い技術となる。
【0043】
本明細書に記載される方法は、細胞と、本明細書に記載されるCas9−HFDをコードする核酸および選択された遺伝子に対する1つまたは複数のガイドRNAをコードする核酸とを接触させて、遺伝子の発現を調節することを含む。
【0044】
ガイドRNA(gRNA)
一般的に言えば、ガイドRNAには2つの系、すなわち、一緒に機能してCas9による切断を誘導する別個のcrRNAとtracrRNAを用いる系1および2つの別個のガイドRNAを単一の系に組み合わせるキメラcrRNA−tracrRNAハイブリッドを用いる系2(単一ガイドRNAまたはsgRNAと呼ばれる。このほか、Jinekら,Science 2012;337:816−821を参照されたい)がある。tracrRNAは様々な長さに短縮することが可能であり、様々な長さのものが別個の系(系1)およびキメラgRNA系(系2)の両方で機能することが示されている。例えば、いくつかの実施形態では、tracrRNAは、その3’末端から少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15nt、20nt、25nt、30nt、35ntまたは40nt短縮されていてよい。いくつかの実施形態では、tracrRNA分子は、その5’末端から少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15nt、20nt、25nt、30nt、35ntまたは40nt短縮されていてよい。あるいは、tracrRNA分子は、5’末端および3’末端の両方から、例えば、5’末端で少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15ntまたは20nt、3’末端で少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15nt、20nt、25nt、30nt、35ntまたは40nt短縮されていてよい。例えば、Jinekら,Science 2012;337:816−821;Maliら,Science.2013 Feb 15;339(6121):823−6;Congら,Science.2013 Feb 15;339(6121):819−23;ならびにHwangおよびFuら,Nat Biotechnol.2013 Mar;31(3):227−9;Jinekら,Elife 2,e00471(2013)を参照されたい。系2では一般に、キメラgRNAの長さが長いほどオンターゲット活性が高いことがわかっているが、様々な長さのgRNAの相対的特異性は現時点では明らかにされておらず、したがって、場合によっては短いgRNAを用いる方が望ましいことがある。いくつかの実施形態では、gRNAは、転写開始部位を含む転写開始部位の上流約100〜800bp以内、例えば、転写開始部位の上流約500bp以内、または転写開始部位の下流約100〜800bp以内、例えば、約500bp以内にある領域に相補的である。いくつかの実施形態では、2種類以上のgRNAをコードするベクター(例えば、プラスミド)、例えば、標的遺伝子の同じ領域の異なる部位を対象とする2種類、3種類、4種類、5種類またはそれ以上のgRNAをコードするプラスミドを用いる。
【0045】
ガイドRNA、例えば、5’末端にゲノムDNA標的部位の相補鎖に相補的な17〜20ntを有する単一gRNAまたはtracrRNA/crRNAを用いて、例えば配列NGGの追加のプロトスペーサー隣接モチーフ(PAM)を有する特定の17〜20ntゲノム標的にCas9ヌクレアーゼを誘導することができる。したがって、本発明の方法は、通常通りにトランスコードされたtracrRNAと融合したcrRNAを含み、5’末端に標的配列、例えば、プロトスペーサー隣接モチーフ(PAM)、例えばNGG、NAGまたはNNGGの5’側に隣接する標的配列の相補鎖の25〜17ヌクレオチド、任意選択で20以下のヌクレオチド(nt)、例えば、20nt、19nt、18ntまたは17nt、好ましくは17ntまたは18ntに相補的な配列を有する単一ガイドRNA、例えば、Maliら,Science 2013 Feb 15;339(6121):823−6に記載されている単一Cas9ガイドRNAの使用を含み得る。いくつかの実施形態では、単一Cas9ガイドRNAは、配列:
(X
17〜20)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCG(X
N)(配列番号1);
(X
17〜20)GUUUUAGAGCUAUGCUGAAAAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(X
N)(配列番号2);
(X
17〜20)GUUUUAGAGCUAUGCUGUUUUGGAAACAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(X
N)(配列番号3);
(X
17〜20)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(X
N)(配列番号4)、
(X
17〜20GUUUAAGAGCUAGAAAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号5);
(X
17〜20)GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号6);または
(X
17〜20)GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号7);
からなり、
配列中、X
17〜20は、標的配列の連続する17〜20ヌクレオチドに相補的なヌクレオチド配列である。単一ガイドRNAをコードするDNAについては既に文献(Jinekら,Science.337(6096):816−21(2012)およびJinekら,Elife.2:e00471(2013))に記載されている。
【0046】
ガイドRNAは、リボ核酸とCas9との結合に干渉しない任意の配列であり得るX
Nを含んでよく、(RNA中の)Nは0〜200、例えば、0〜100、0〜50または0〜20であり得る。
【0047】
いくつかの実施形態では、ガイドRNAは、3’末端に1つまたは複数のアデニン(A)またはウラシル(U)ヌクレオチドを含む。いくつかの実施形態では、RNA PolIII転写を停止させる終止シグナルとして用いられる1つまたは複数のTが任意選択で存在するので、RNAは分子の3’末端に1つまたは複数のU、例えば、1〜8つまたはそれ以上のU(例えば、U、UU、UUU、UUUU、UUUUU、UUUUUU、UUUUUUU、UUUUUUUU)を含む。
【0048】
本明細書に記載される実施例の一部では単一gRNAを用いるが、ほかにもこの方法を二重gRNA(例えば、天然の系にみられるcrRNAとtracrRNA)とともに用いてもよい。この場合、単一tracrRNAを、本発明の系を用いて発現させる複数の異なるcrRNAとともに使用し、例えば、以下のような:
(X
17〜20)GUUUUAGAGCUA(配列番号102);
(X
17〜20)GUUUUAGAGCUAUGCUGUUUUG(配列番号103);または
(X
17〜20)GUUUUAGAGCUAUGCU(配列番号104)
とtracrRNA配列とを使用する。この場合、crRNAを本明細書に記載の方法および分子のガイドRNAとして使用し、tracrRNAを同じまたは異なるDNA分子から発現させ得る。いくつかの実施形態では、この方法は、細胞と、配列GGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号8)またはその活性部分(活性部分とは、Cas9またはdCas9と複合体を形成する能力を保持している部分のことである)を含むか、これよりなるtracrRNAとを接触させることを含む。いくつかの実施形態では、tracrRNA分子は、その3’末端から少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15nt、20nt、25nt、30nt、35ntまたは40nt短縮されていてよい。別の実施形態では、tracrRNA分子は、その5’末端から少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15nt、20nt、25nt、30nt、35ntまたは40nt短縮されていてよい。あるいは、tracrRNA分子は、5’末端および3’末端の両方から、例えば、5’末端で少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15ntまたは20nt、3’末端で少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15nt、20nt、25nt、30nt、35ntまたは40nt短縮されていてよい。例示的なtracrRNA配列は配列番号8のほかにも、以下のものを含む:
UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号105)もしくはその活性部分;または
AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号106)もしくはその活性部分。
【0049】
(X
17〜20)GUUUUAGAGCUAUGCUGUUUUG(配列番号102)をcrRNAとして用いるいくつかの実施形態では、以下のtracrRNAを用いる:GGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号8)またはその活性部分。
【0050】
(X
17〜20)GUUUUAGAGCUA(配列番号102)をcrRNAとして用いるいくつかの実施形態では、以下のtracrRNAを用いる:UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号105)またはその活性部分。
【0051】
(X
17〜20)GUUUUAGAGCUAUGCU(配列番号104)をcrRNAとして用いるいくつかの実施形態では、以下のtracrRNAを用いる:AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号106)またはその活性部分。
【0052】
いくつかの実施形態では、オフターゲット効果を最小限に抑えるため、gRNAをゲノムの残りの部分の任意の配列と異なる少なくとも3つ以上のミスマッチである部分に標的化する。
【0053】
ロックト核酸(LNA)などの修飾RNAオリゴヌクレオチドが、修飾オリゴヌクレオチドをより好ましい(安定な)コンホメーションにロックすることによってRNA−DNAハイブリダイゼーションの特異性を増大させることが示されている。例えば、2’−O−メチルRNAは2’酸素と4’炭素の間に追加の共有結合が存在する修飾塩基であり、これをオリゴヌクレオチド内に組み込むことによって全体の熱安定性および選択性を改善することができる(式I)。
【化1】
【0054】
したがって、いくつかの実施形態では、本明細書に開示されるtru−gRNAは、1つまたは複数の修飾RNAオリゴヌクレオチドを含み得る。例えば、本明細書に記載の短縮ガイドRNA分子は、標的配列に相補的なガイドRNAの17〜18ntまたは17〜19n5’領域の1つ、一部または全部が修飾されていてよく、例えば、ロックされていてよく(2’−O−4’−Cメチレン架橋)、5’−メチルシチジンであってよく、2’−O−メチル−プソイドウリジンであってよく、あるいはリボースリン酸骨格がポリアミド鎖に置き換わっていてよく(ペプチド核酸)、例えば、合成リボ核酸であってよい。
【0055】
他の実施形態では、tru−gRNA配列の1つ、一部または全部のヌクレオチドが修飾されていてよく、例えば、ロックされていてよく(2’−O−4’−Cメチレン架橋)、5’−メチルシチジンであってよく、2’−O−メチル−プソイドウリジンであってよく、あるいはリボースリン酸骨格がポリアミド鎖に置き換わっていてよく(ペプチド核酸)、例えば、合成リボ核酸であってよい。
【0056】
いくつかの実施形態では、単一ガイドRNAおよび/またはcrRNAおよび/またはtracrRNAは、3’末端に1つまたは複数のアデニン(A)またはウラシル(U)ヌクレオチドを含み得る。
【0057】
既存のCas9ベースのRGNは、目的とするゲノム部位への標的化を誘導するのにgRNA−DNAヘテロ二本鎖の形成を利用するものである。しかし、RNA−DNAヘテロ二本鎖ではそのDNA−DNA対応物よりも無差別な範囲の構造が形成され得る。実際、DNA−DNA二本鎖の方がミスマッチに対する感度が高く、このことは、DNA誘導型ヌクレアーゼがオフターゲット配列と容易には結合せず、RNA誘導型ヌクレアーゼに比して特異性が高いことを示唆している。したがって、本明細書に記載の方法に使用可能なガイドRNAはハイブリッド、すなわち、1つまたは複数のデオキシリボヌクレオチド、例えば短いDNAオリゴヌクレオチドが、gRNAの全部または一部、例えばgRNAの相補性領域の全部または一部と置き換わったハイブリッドであり得る。このDNAベースの分子は、単一gRNA系の全部または一部と置き換わってもよく、あるいは二重crRNA/tracrRNA系のcrRNAおよび/またはtracrRNAの全部または一部と置き換わってもよい。一般にDNA−DNA二本鎖の方がRNA−DNA二本鎖よりもミスマッチに対する許容性が低いことから、相補性領域内にDNAを組み込むこのような系の方がより高い信頼性で目的とするゲノムDNA配列を標的とするはずである。このような二本鎖を作製する方法は当該技術分野で公知であり、例えば、Barkerら,BMC Genomics.2005 Apr 22;6:57;およびSugimotoら,Biochemistry.2000 Sep 19;39(37):11270−81を参照されたい。
【0058】
さらに、別個のcrRNAとtracrRNAを用いる系では、その一方または両方が合成であり、1つまたは複数の修飾(例えば、ロックト)ヌクレオチドまたはデオキシリボヌクレオチドを含むものであり得る。
【0059】
細胞との関連において、Cas9と上に挙げた合成gRNAとの複合体を用いて、CRISPR/Cas9ヌクレアーゼ系のゲノム全域にわたる特異性を改善することが可能である。
【0060】
記載される方法は、本明細書に記載のCas9 gRNAと融合タンパク質を細胞内で発現させるか、細胞と接触させることを含み得る。
【0061】
発現系
本明細書に記載される融合タンパク質およびガイドRNAを使用するためには、それをコードする核酸から発現させるのが望ましいであろう。これは様々な方法で実施することができる。例えば、ガイドRNAまたは融合タンパク質をコードする核酸を中間ベクターにクローン化して原核細胞または真核細胞を形質転換し、複製および/または発現させる。中間ベクターは通常、融合タンパク質をコードする核酸を保管または操作するか、融合タンパク質を産生するための原核生物ベクター、例えばプラスミドもしくはシャトルベクターまたは昆虫ベクターである。このほか、ガイドRNAまたは融合タンパク質をコードする核酸を発現ベクターにクローン化して植物細胞、動物細胞、好ましくは哺乳動物細胞もしくはヒト細胞、真菌細胞、細菌細胞または原生動物細胞に投与してもよい。
【0062】
ガイドRNAまたは融合タンパク質をコードする配列を発現させるためには通常、転写を指令するプロモーターを含む発現ベクターにサブクローン化する。適切な細菌プロモーターおよび真核プロモーターは当該技術分野で周知であり、例えば、Sambrookら,Molecular Cloning,A Laboratory Manual(第3版,2001);Kriegler,Gene Transfer and Expression:A Laboratory Manual(1990);およびCurrent Protocols in Molecular Biology(Ausubelら編,2010)に記載されている。設計したタンパク質を発現させるための細菌発現系を例えば、大腸菌(E.coli)、バチルス(Bacillus)菌種およびサルモネラ(Salmonella)で入手することができる(Palvaら,1983,Gene 22:229−235)。そのような発現系のキットが市販されている。哺乳動物細胞、酵母および昆虫細胞用の真核発現系は当該技術分野で周知であり、同じく市販されている。
【0063】
核酸の発現を指令するために使用するプロモーターは、具体的な用途によって決まる。例えば、融合タンパク質の発現および精製には通常、強力な構成的プロモーターを使用する。これに対して、遺伝子調節のために融合タンパク質をin vivoで投与する場合、融合タンパク質の具体的な用途に応じて構成的プロモーターまたは誘導プロモーターのいずれかを使用することができる。さらに、融合タンパク質の投与に好ましいプロモーターは、HSV TKなどの弱いプロモーターまたはこれと類似する活性を有するプロモーターであり得る。プロモーターはほかにも、トランス活性化に応答性の要素、例えば、低酸素応答要素、Gal4応答要素、lacリプレッサー応答要素ならびにテトラサイクリン調節系およびRU−486系などの小分子制御系を含み得る(例えば、GossenおよびBujard,1992,Proc.Natl.Acad.Sci.USA,89:5547;Oliginoら,1998,Gene Ther.,5:491−496;Wangら,1997,Gene Ther.,4:432−441;Neeringら,1996,Blood,88:1147−55;ならびにRendahlら,1998,Nat.Biotechnol.,16:757−761を参照されたい)。
【0064】
発現ベクターは通常、プロモーターに加えて、原核または真核宿主細胞で核酸を発現するのに必要なほかのあらゆる要素を含む転写単位または発現カセットを含む。したがって、典型的な発現カセットは、例えば融合タンパク質をコードする核酸配列と作動可能に連結されたプロモーターと、例えば効率的な転写産物のポリアデニル化、転写停止、リボソーム結合部位または翻訳停止に必要な任意のシグナルとを含む。カセットのほかの要素としては、例えば、エンハンサーおよび異種スプライスイントロンシグナルを挙げ得る。
【0065】
細胞内に遺伝情報を輸送するのに使用する具体的な発現ベクターは、意図する融合タンパク質の用途、例えば、植物、動物、細菌、真菌、原生動物などでの発現を考慮して選択する。標準的な細菌発現ベクターとしては、pBR322ベースのプラスミド、pSKF、pET23DなどのプラスミドならびにGSTおよびLacZなどの市販のタグ融合発現系が挙げられる。好ましいタグ融合タンパク質はマルトース結合タンパク質(MBP)である。操作したTALE反復タンパク質の精製にこのようなタグ融合タンパク質を用いることができる。このほか組換えタンパク質にエピトープタグ、例えばc−mycまたはFLAGを付加して、単離、発現のモニタリングならびに細胞局在および細胞内局在のモニタリングに便利な方法を得ることができる。
【0066】
真核発現ベクターには真核ウイルスの調節要素を含む発現ベクター、例えば、SV40ベクター、パピローマウイルスベクターおよびエプスタイン・バーウイルス由来のベクターを用いることが多い。その他の例示的な真核ベクターとしては、pMSG、pAV009/A+、pMTO10/A+、pMAMneo−5、バキュロウイルスpDSVEおよびSV40初期プロモーター、SV40後期プロモーター、メタロチオネインプロモーター、マウス乳腺腫瘍ウイルスプロモーター、ラウス肉腫ウイルスプロモーター、ポリヘドリンプロモーターをはじめとする真核細胞での発現に効果を示すプロモーターの指令を受けてタンパク質を発現させる他の任意のベクターが挙げられる。
【0067】
ガイドRNAを発現させるためのベクターは、ガイドRNAの発現を駆動するRNA PolIIIプロモーター、例えば、H1、U6または7SKプロモーターを含み得る。これらのヒトプロモーターは、プラスミドトランスフェクション後に哺乳動物細胞にgRNAを発現させる。あるいは、例えばvitro転写にT7プロモーターを使用してもよく、RNAをin vitroで転写させてから精製することができる。短いRNA、例えば、siRNA、shRNAをはじめとする低分子RNAの発現に適したベクターを使用することができる。
【0068】
一部の発現系は、安定にトランスフェクトされた細胞系を選択するためのマーカー、例えばチミジンキナーゼ、ヒグロマイシンBホスホトランスフェラーゼおよびジヒドロ葉酸レダクターゼなどを有する。このほか、昆虫細胞にバキュロウイルスベクターを用いてポリヘドリンプロモーターをはじめとする強力なバキュロウイルスプロモーターの指令の下に融合タンパク質をコードする配列を置くものなど、高収率の発現系が適している。
【0069】
発現ベクターに通常含まれる要素としてはほかにも、大腸菌(E.coli)で機能するレプリコン、組換えプラスミドを保有する細菌の選択を可能にする抗生物質耐性をコードする遺伝子およびプラスミドの非必須領域にあり組換え配列の挿入を可能にする固有の制限部位が挙げられる。
【0070】
標準的なトランスフェクション法を用いて、大量のタンパク質を発現する細菌、哺乳動物、酵母または昆虫の細胞系を作製し、次いで標準的な技術を用いてこのタンパク質を精製する(例えば、Colleyら,1989,J.Biol.Chem.,264:17619−22;Guide to Protein Purification,in Methods in Enzymology,vol.182(Deutscherら編,1990)を参照されたい)。真核および原核細胞の形質転換を標準的な技術により実施する(例えば、Morrison,1977,J.Bacteriol.132:349−351;Clark−CurtissおよびCurtiss,Methods in Enzymology 101:347−362(Wuら編,1983)を参照されたい)。
【0071】
宿主細胞内に外来ヌクレオチド配列を導入するあらゆる既知の方法を用い得る。このような方法としては、リン酸カルシウムトランスフェクション、ポリブレン、プロトプラスト融合、エレクトロポレーション、ヌクレオフェクション、リポソーム、マイクロインジェクション、裸のDNA、プラスミドベクター、ウイルスベクター(エピソーム型および組込み型の両方)およびクローン化したゲノムDNA、cDNA、合成DNAをはじめとする外来遺伝物質を宿主細胞内に導入する他のあらゆる周知の方法の使用が挙げられる(例えば、Sambrookら,上記を参照されたい)。唯一必要なのは、用いる具体的な遺伝子工学的方法で、選択したタンパク質の発現が可能な宿主細胞内に遺伝子を少なくとも1つ良好に導入することができることである。
【0072】
いくつかの実施形態では、融合タンパク質は、タンパク質が核に移行するための核局在化ドメインを含む。核局在化配列(NLS)がいくつか知られており、任意の適切なNLSを使用し得る。例えば、多くのNLSが二連塩基反復(bipartite basic repeats)と呼ばれる複数の塩基性アミノ酸を有する(Garcia−Bustosら,1991,Biochim.Biophys.Acta,1071:83−101に概説されている)。二連塩基反復(bipartite basic repeats)を含むNLSをキメラタンパク質の任意に部分に配置し、核内に局在化するキメラタンパク質を生じさせることができる。好ましい実施形態では、本明細書に記載される融合タンパク質の最終的な機能には通常、タンパク質が核内に局在する必要があるため、最終的な融合タンパク質に核局在化ドメインを組み込む。しかし、最終的なキメラタンパク質内にあるDBDドメイン自体または別の機能ドメインに内因性の核移行機能がある場合、別個に核局在化ドメインを付加する必要がないこともある。
【0073】
本発明は、ベクターおよびベクターを含む細胞を含む。
【実施例】
【0074】
本発明は以下の実施例でさらに説明されるが、これらの実施例は特許請求の範囲に記載される本発明の範囲を限定するものではない。
【0075】
実施例1.CRISPR/Cas活性化因子系の設計:
強力な合成VP64活性化ドメイン(Beerliら,Proc Natl Acad Sci USA 95,14628−14633(1998))と、触媒的に不活性化されたdCas9タンパク質のカルボキシ末端とを融合することによって、RNA誘導型転写活性化因子を作製することが可能であるとする仮説を立てた(
図1D)。
【0076】
ヒト細胞内でガイドRNA(gRNA)を発現させるため、U6プロモーターによって駆動される完全長キメラgRNA(最初にJinekら(Science 2012)に記載されたcrRNAとtracrRNAとの融合物)を発現するベクターを設計した。gRNA発現プラスミドの構築を以下の通りに実施した。可変20nt gRNA標的化配列をコードするDNAオリゴヌクレオチドのペアをアニールさせて、4bpのオーバーハングを有する短い二本鎖DNAフラグメントを作製した(表1)。
【0077】
【表4】
【0078】
上記フラグメントをBsmBI消化プラスミドpMLM3636に連結して、キメラの約102nt一本鎖ガイドRNA(Maliら,Science.2013 Feb 15;339(6121):823−6;Hwangら,Nat Biotechnol.2013 Mar;31(3):227−9)をコードしヒトU6プロモーターによって発現されるDNAを得た。pMLM3636プラスミドおよびその完全DNA配列はAddgeneから入手可能である。
図4を参照されたい。
【0079】
Cas9活性化因子を設計するため、D10A、H840A触媒変異(既にJinekら,2012;およびQiら,2013に記載されている)を野生型またはコドン最適化Cas9配列に導入した(
図5)。上記変異は、Cas9が二本鎖切断を誘導しないよう触媒的に不活性な状態にするものである。1つの構築物では、不活性化Cas9のC末端に三重flagタグ、核局在化シグナルおよびVP64活性化ドメインを融合した(
図6)。CMVプロモーターによってこの融合タンパク質の発現を駆動した。
【0080】
dCas−VP64発現プラスミドの構築を以下の通りに実施した。既に記載されている通りに、開始コドンの5’側にT7プロモーター部位、Cas9コード配列のカルボキシ末端に核局在化シグナルを付加するプライマーを用いて、不活性化D10A/H840A変異を保有するCas9ヌクレアーゼ(dCas9)をコードするDNAをプラスミドpMJ841(Addgeneプラスミド番号39318)からPCRにより増幅し、CMVプロモーターを含むプラスミドにクローン化して(Hwangら,Nat Biotechnol 31,227−229(2013))、プラスミドpMLM3629を得た。三重FLAGエピトープをコードするオリゴヌクレオチドをアニールさせ、プラスミドpMLM3629のXhoI部位およびPstI部位にクローン化して、C末端flagFLAGタグを有するdCas9を発現するプラスミドpMLM3647を作製した。プラスミドpMLM3647のFLAGタグ化dCas9の下流にGly
4SerリンカーをコードするDNA配列とこれに続く合成VP64活性化ドメインを導入して、プラスミドpSL690を得た。このほか、ヒト細胞での発現にコドン最適化されたFLAGタグ化Cas9配列をコードするプラスミドpJDS247にD10A/H840A変異をQuikChange部位特異的変異誘発(Agilent)により導入して、プラスミドpMLM3668を得た。次いで、Gly
4SerリンカーをコードするDNA配列およびVP64活性化ドメインをpMLM3668に導入して、pMLM3705という名称のコドン最適化dCas9−VP64発現ベクターを得た。
【0081】
細胞培養、トランスフェクションおよびELISAアッセイを以下の通りに実施した。Flp−In T−Rex293細胞を10%FBS、1%penstrepおよび1%Glutamaxを添加したAdvanced DMEM(Invitrogen)で維持した。製造業者の説明書に従ってLipofectamine LTX(Invitrogen)により細胞をトランスフェクトした。簡潔に述べると、160,000個の293細胞を24ウェルプレートに播種し、翌日、gRNAプラスミド250ng、Cas9−VP64プラスミド250ng、pmaxGFPプラスミド30ng(Lonza)、Plus試薬0.5μlおよびLipofectamine LTX 1.65μlでトランスフェクトした。トランスフェクションの40時間後、トランスフェクトした293細胞から組織培地を回収し、R&D System社のHuman VEGF−A ELISAキット「Human VEGF Immunoassay」を用いて、分泌されたVEGF−Aタンパク質をアッセイした。
【0082】
293細胞のヒトVEGFA遺伝子の上流、下流または転写開始部位に位置する3つのDNアーゼI高感受性部位(HSS)内にある標的配列に対して16種類のsgRNAを構築した(
図1E)。
【0083】
16種類のVEGFAを標的とするgRNAが新規なdCas9−VP64融合タンパク質を動員する能力を検証する前に、最初に上記gRNAがそれぞれヒト293細胞内の目的とする標的部位にCas9ヌクレアーゼを誘導する能力を評価した。この目的のために、gRNA発現ベクターおよびCas9発現ベクターを1:3の比でトランスフェクトしたが、それは、これまでの最適化実験で、U2OS細胞にプラスミドを1:3の比で用いて高レベルのCas9誘導DNA切断が得られることが示されたからである。
【0084】
VEGFA標的化gRNAをコードするプラスミド125ngおよび活性なCas9ヌクレアーゼ(pMLM3639)をコードするプラスミド375ngを細胞にトランスフェクトしたことを除いて、dCas9−VP16 VEGFA実験について上に記載した通りに293細胞のトランスフェクションを実施した。トランスフェクションの40時間後、QIAamp DNA Blood Miniキット(Qiagen)を製造業者の説明書に従って用い、ゲノムDNAを単離した。Phusion Hot Start II高忠実度DNAポリメラーゼ(NEB)および3%DMSOならびに以下のタッチダウンPCRサイクル:98℃、10秒;72〜62℃、−1℃/サイクル、15秒;72℃、30秒を10サイクル、次いで98℃、10秒;62℃、15秒;72℃、30秒を25サイクル用いて、VEGFAプロモーター内の3つの異なる標的化領域のPCR増幅を実施した。プライマーoFYF434(5’−TCCAGATGGCACATTGTCAG−3’(配列番号82))およびoFYF435(5’−AGGGAGCAGGAAAGTGAGGT−3’(配列番号83))を用いて−500領域を増幅した。プライマーoFYF438(5’−GCACGTAACCTCACTTTCCT−3’(配列番号84))およびoFYF439(5’−CTTGCTACCTCTTTCCTCTTTCT−3’(配列番号85))を用いて転写開始部位付近の領域を増幅した。プライマーoFYF444(5’−AGAGAAGTCGAGGAAGAGAGAG−3’(配列番号86))およびoFYF445(5’−CAGCAGAAAGTTCATGGTTTCG−3’(配列番号87))を用いて+500領域を増幅した。既に記載されている通りにAmpure XPビーズ(Agencourt)を用いてPCR産物を精製し、T7エンドヌクレアーゼIアッセイを実施し、QIAXCELキャピラリー電気泳動系で分析した(Reyonら,Nat Biotech 30,460−465(2012))。
【0085】
16種類のgRNAはいずれも、既に記載されているT7E1遺伝子型同定アッセイを用いた評価でそれぞれの標的部位へのCas9ヌクレアーゼ誘導挿入欠失変異の効率的な導入を媒介することができた(表2)。したがって、16種類のgRNAはいずれも、ヒト細胞内でCas9ヌクレアーゼと複合体を形成し、特定の標的ゲノム部位にその活性を誘導することができる。
【0086】
【表5】
【0087】
これらの同じgRNAによってdCas9−VP64タンパク質を、ヒト細胞内の特定のゲノム部位に標的化することが可能であるかどうかを検証するため、VEGFAタンパク質の酵素結合免疫測定を以下の通りに実施した。VEGFを標的とするsgRNAおよびdCas9−VP64をコードするプラスミドをトランスフェクトしたFlp−In T−Rex HEK293細胞の培地をトランスフェクションの40時間後に回収し、VEGFAタンパク質の発現を既に記載されている通りにELISAにより測定した(Maederら,Nat Methods 10,243−245(2013))。sgRNAとdCas9−VP64の両方を発現する細胞に由来する培地中のVEGFAタンパク質の濃度を、オフターゲットsgRNA(EGFPレポーター遺伝子内に配列を標的とする)およびdCas9−VP64を発現する細胞に由来する培地中のVEGFAタンパク質の濃度で除することにより、VEGFA発現の活性化倍数を計算した。
【0088】
検証した16種類のgRNAのうち15種類が、ヒト293細胞内でdCas9−VP64と共発現した場合にVEGFAタンパク質発現の有意な増加を誘導した(
図2A)。観察されたVEGFA誘導の程度は2〜18.7倍の範囲の活性化であり、平均は5倍の活性化であった。対照実験では、16種類のgRNA単独の発現、dCas9−VP64単独の発現およびdCas9−VP64と、EGFPレポーター遺伝子配列と結合するよう設計した「オフターゲット」gRNAとの共発現ではいずれも、VEGFA発現の増大を誘導することはできなかったことが明らかになり(
図2A)、プロモーター活性化には特異的gRNAとdCas9−VP64タンパク質の両方が同時発現する必要があることが示された。したがって、dCas9−VP64をヒト細胞内で安定に発現させ、gRNAによって特定のゲノム遺伝子座の転写を活性化するよう誘導することが可能である。gRNA3でトランスフェクトした細胞において最大のVEGFA増加が観察され、この細胞ではタンパク質発現が18.7倍誘導された。興味深いことに、最も成績の良かった3種類のgRNAおよび発現を3倍以上誘導することができる9種類のgRNAのうち6種類が、−500領域(転写開始部位の約500bp上流)を標的とする。
【0089】
一態様では本明細書に記載される系が可変gRNAを用いて共通のdCas9−VP64活性化因子融合物を動員するものであるため、単一細胞内で複数のガイドRNAを発現させることによって、内在遺伝子標的を多重に、または組み合わせて活性化することが可能であると考えることができる。この可能性を検証するため、dCas9−VP64発現プラスミドを、それぞれがVEGFAプロモーターから発現を誘導する4種類のgRNA(V1、V2、V3およびV4)の発現プラスミドとともに293細胞にトランスフェクトした。全4種類のgRNAとdCas9−VP64の同時発現によりVEGFAタンパク質発現の相乗的活性化(すなわち、予想される個々の活性化因子の相加効果を上回る活性化倍数)が誘導された(
図2B)。さらに、この4種類の活性化因子のうち3種類を様々に組み合わせた場合にも、VEGFAプロモーターが相乗的に活性化された(
図2B)。転写の相乗的活性化は複数の活性化因子ドメインが単一のプロモーターに動員されることに起因すると考えられるため、以上の実験では複数のgRNA/dCas9−VP64複合体が同時にVEGFAプロモーターと結合していると可能性が高い。
【0090】
以上の実験は、ヒトHEK293細胞内でCas9−HFD、例えばCas9−アクチベータータンパク質(VP64転写活性化ドメインを保有する)と、ヒトVEGF−Aプロモーターの部位に対して20ntの配列相補性を有するsgRNAとを同時発現させることによって、VEGF−A発現の上方制御を生じさせることが可能であることを示している。ELISAアッセイによりVEGF−Aタンパク質の増加を測定し、個々のgRNAがCas9活性化因子融合タンパク質とともに機能して、VEGF−Aタンパク質レベルを最大で約18倍増大させ得ることがわかった(
図2A)。さらに、同じプロモーターの様々な部位を標的とする複数のgRNAをCas9活性化因子融合タンパク質とともに導入することによって、転写相乗作用を介して活性化増大をさらに大きくすることができた(
図2B)。
【0091】
実施例2.内在ヒトNTF3遺伝子を標的とするCRISPR/Cas活性化因子系の設計
今回の観察結果の一般性を拡大するため、本発明者らは、RNA誘導型活性化因子プラットフォームを用いてヒトNTF3遺伝子の発現を誘導することが可能であるかどうかを検証した。この検証を実施するため、ヒトNTF3プロモーターの予測DNアーゼI高感受性部位(HSS)に対して6種類のsgRNAを設計し、これらのgRNAをそれぞれ発現するプラスミドと、dCas9−VP64タンパク質をコードし、ヒト細胞での発現にコドン最適化されたプラスミドとを共トランスフェクトした(
図3A)。
【0092】
検証した6種類のgRNAはいずれも、定量的RT−PCRによる検出でNTF3転写レベルの有意な増大を誘導した(
図3B)。この6種類のRNA誘導型活性化因子の活性化倍数の数値を正確に計算することはできなかったが(転写の基底レベルが実質的に検出不可能であったため)、活性化されたNTF3 mRNA発現の平均レベルは4倍の範囲で変化した。トランスフェクトするgRNA発現プラスミドおよびdCas9−VP64発現プラスミドの量を減らすとNTF3遺伝子の活性化が低くなり(
図3B)、これは明確な用量依存性の効果を示している。
【0093】
さらに、293細胞にdCas9−VP64発現プラスミドとNTF3標的化gRNA発現プラスミドを単独で、ならびに単一および二重の組合せで共トランスフェクトした。NTF3 mRNAの相対発現量を定量的RT−PCRにより検出し、GAPDH対照に正規化した(デルタCt×10
4)。上記実験ではいずれも、トランスフェクションに使用した個々のgRNA発現プラスミドの量を同じにした。
図3Bは、この多重gRNA発現がdCas9−VP64タンパク質によるNTF3 mRNA発現の相乗的活性化を誘導したことを示している。
【0094】
実施例3.CRISPR/Cas−MS2、CRISPR/Cas−Csy4およびCRISPR/Cas−ラムダN融合物系の設計―生物学的テザーの作製
不活性化されたdCas9のN末端またはC末端にMS2コートタンパク質、Csy4ヌクレアーゼ(好ましくは触媒的に不活性なCsy4、例えば、Haurwitzら,329(5997):1355−8(2010)に記載されているH29A変異体)またはラムダNが融合した融合タンパク質を作製する。MS2およびラムダNは特定のRNA配列と結合するバクテリオファージタンパク質であり、したがって、その特定のMS2またはラムダN RNA結合配列でタグ化した異種RNA配列をdCas9タンパク質に係留するアダプターとして用いることができる。dCas9−MS2融合物またはdCas9−ラムダN融合物と、MS2またはラムダNステムループ認識配列と5’末端または3’末端で融合した長いキメラ非コードRNA(lncRNA)とを同時発現させる。キメラXistまたはキメラRepA lncRNAはがdCas9融合物によって特異的に動員され、標的遺伝子発現を測定することによって、この戦略が標的化サイレンシングを誘導する能力を評価する。コートタンパク質およびキメラRNAに対する様々な変化を試験することによってこの系を最適化する。MS2コートタンパク質に対するN55KおよびデルタFG変異がタンパク質凝集を防ぎ、ステムループRNAに対する親和性を増大させることが以前に示されている。さらに、本発明者らは、MS2コートタンパク質に対する親和性を増大させることが報告されている高親和性CループRNA変異体を検証する。MS2およびラムダNタンパク質の例示的な配列を以下に記載するが、MS2は二量体として機能するため、MS2タンパク質は融合した一本鎖二量体配列を含み得る。
【0095】
1.単一MS2コートタンパク質(wt、N55KまたはデルタFG)をdCas9のN末端またはC末端に融合した融合物の例示的な配列。
MS2コートタンパク質のアミノ酸配列:
MASNFTQFVLVDNGGTGDVTVAPSNFANGVAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKVATQTVGGVELPVAAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(配列番号88)
MS2 N55K:
MASNFTQFVLVDNGGTGDVTVAPSNFANGVAEWISSNSRSQAYKVTCSVRQSSAQKRKYTIKVEVPKVATQTVGGVELPVAAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(配列番号89)
MS2デルタFG:
MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(配列番号90)
【0096】
2.二量体MS2コートタンパク質(wt、N55KまたはデルタFG)をdCas9のN末端またはC末端に融合した融合物の例示的な配列。
二量体MS2コートタンパク質:
MASNFTQFVLVDNGGTGDVTVAPSNFANGVAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKVATQTVGGVELPVAAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGLYGAMASNFTQFVLVDNGGTGDVTVAPSNFANGVAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKVATQTVGGVELPVAAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSLIN(配列番号91)
MASNFTQFVLVDNGGTGDVTVAPSNFANGVAEWISSNSRSQAYKVTCSVRQSSAQKRKYTIKVEVPKVATQTVGGVELPVAAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGLYGAMASNFTQFVLVDNGGTGDVTVAPSNFANGVAEWISSNSRSQAYKVTCSVRQSSAQKRKYTIKVEVPKVATQTVGGVELPVAAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSLIN(配列番号92)
二量体MS2デルタFG:
MASNFTQFVLVDNGGTGDVTVAPSNFANGVAEWISSNSRSQAYKVTCSVRQSSAQKRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGLYGAMASNFTQFVLVDNGGTGDVTVAPSNFANGVAEWISSNSRSQAYKVTCSVRQSSAQKRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSLIN(配列番号93)
【0097】
3.ラムダNをdCas9のN末端またはC末端に融合した融合物の例示的な配列。
ラムダNのアミノ酸配列:
MDAQTRRRERRAEKQAQWKAAN(配列番号94)または
MDAQTRRRERRAEKQAQWKAANPLLVGVSAKPVNRPILSLNRKPKSRVESALNPIDLTVLAEYHKQIESNLQRIERKNQRTWYSKPGERGITCSGRQKIKGKSIPLI(配列番号95)
【0098】
4.Csy4をCas9のN末端またはC末端に融合した融合物の例示的配列
Haurwitzら,329(5997):1355−8(2010)にCys4の例示的な配列が、例えば不活性型のものが記載されている。
【0099】
ラムダNまたはMS2に対する同種ステムループ認識配列と5’末端または3’末端で融合した調節RNA、例えば、HOTAIR、HOTTIP、XISTまたはXIST RepAなどの長い非コードRNA(lncRNA)も発現する細胞内で構築物を発現させる。MS2の野生型配列および高親和性配列はそれぞれ、AAACAUGAGGAUUACCCAUGUCG(配列番号96)およびAAACAUGAGGAUCACCCAUGUCG(配列番号97)である(Keryer−Bibensら,上記,
図2を参照されたい);ラムダNが結合するnutL配列およびnutR BoxB配列はそれぞれ、GCCCUGAAGAAGGGC(配列番号98)およびGCCCUGAAAAAGGGC(配列番号99)である。Csy4が結合する配列は、GTTCACTGCCGTATAGGCAG(短縮された20nt)(配列番号100)またはGUUCACUGCCGUAUAGGCAGCUAAGAAA(配列番号101)である。
【0100】
MS2結合配列でタグ化されたlncRNAを発現する細胞内でdCas9/MS2が標的部位と結合すると、そのlncRNAがdCas9結合部位に動員され、lncRNAがリプレッサー、例えばXISTであればdCas9結合部位付近の遺伝子が抑制される。同様に、ラムダN結合配列でタグ化されたlncRNAを発現する細胞内でdCas9/ラムダNが標的部位と結合すると、そのlncRNAがdCas9結合部位に動員される。
【0101】
実施例4.CRISPR/Cas−HP1融合物系の設計―配列特異的サイレンシング
本明細書に記載されるdCas9融合タンパク質は、サイレンシングドメイン、例えば、ヘテロクロマチンタンパク質1(HP1、swi6としても知られる)、例えばHP1αまたはHP1βを標的とするのに用いることもできる。クロモドメインが除去された短縮型のHP1αまたはHP1βを特定の遺伝子座に対して標的として、ヘテロクロマチン形成および遺伝子サイレンシングを誘導することができる。dCas9と融合した短縮HP1の例示的な配列を
図8A〜8Bに示す。HP1配列を上記のように不活性化されたdCas9のN末端またはC末端に融合することができる。
【0102】
実施例5.CRISPR/Cas−TET融合物系の設計―配列特異的脱メチル化
本明細書に記載されるdCas9融合タンパク質は、DNAのメチル化状態を修飾する酵素(例えば、DNAメチルトランスフェラーゼ(DNMT)またはTETタンパク質)を標的とするのに用いることもできる。短縮型のTET1を特定の遺伝子座に対して標的として、DNA脱メチル化を触媒することができる。dCas9と融合した短縮TET1の例示的な配列を
図9に示す。TET1配列を上記のように不活性化されたdCas9のN末端またはC末端に融合することができる。
【0103】
実施例6.最適化CRISPR/Cas−VP64融合物の設計
VP64活性化ドメインを保有するdCas9ベースの転写活性化因子の活性を、これらの融合物内の核局在化シグナル(1つまたは複数)(NLS)および3×FLAGタグの数および位置を変化させることによって、最適化した(
図10)。N末端NLSおよびdCas9配列とVP64配列の間にあるNLSの両方を含むdCas9−VP64融合物では一貫してより高いレベルの標的遺伝子活性化が誘導されたが、これは活性化因子の核局在化の増強によるものである可能性が考えられる(
図10)。さらに、3×FLAGタグをdCas9のC末端とVP64のN末端の間に配置したところ、さらに高いレベルの活性化が観察された。3×FLAGタグは人工リンカーとしての役割を果たし、dCas9とVP64の間に必要な間隔が生じさせ、おそらくVP64ドメインの折り畳み(dCas9付近に拘束されていると不可能であると考えられる)を向上させるか、RNAポリメラーゼIIを動員する転写メディエーター複合体によるVP64の認識を向上させると考えられる。あるいは、負に帯電した3×FLAGタグが偶発的な転写活性化ドメインとして機能し、VP64ドメインの効果を増強する可能性もある。
【0104】
実施例7.最適化された触媒的に不活性なCas9タンパク質(dCas9)
dCas9ドメインのCas9のヌクレアーゼ活性を失活させる不活性化変異の性質を変化させることによって、dCas9−VP64活性化因子の活性をさらに最適化した(
図11A〜11B)。これまでに公開された研究では、触媒残基D10およびH840をアラニンに変異させて(D10AおよびH840A)、DNAの加水分解を媒介する活性部位のネットワークを破壊している。これらの位置におけるアラニン置換によってdCas9が不安定化するため、活性が最適に至らないとする仮説を立てた。そこで、D10またはH840におけるより構造的に保存された置換(例えば、アスパラギンまたはチロシン残基への置換:D10N、H840NおよびH840Y)であれば、これらの異なる変異を有するdCas9−VP64融合物による遺伝子活性化が増大するかどうかを確認するため、このような置換を検証した。上記変異型置換を有するdCas9−VP64変異体を内在ヒトVEGFA遺伝子の上流領域を標的とする3種類のgRNAとともにHEK293細胞に共トランスフェクトしたところ、上記変異体のうち1つを除く全変異体でVEGFAタンパク質発現の増大が観察された(
図11A)。しかし、dCas9−VP64変異体を上記gRNAのうちの1種類のみと共トランスフェクトした場合(
図11A)または単一のVEGFA標的化gRNAを発現するHEK293由来細胞系に共トランスフェクトした場合(
図11B)、この効果はそれほど著しいものではなかった。
【0105】
その他の実施形態
ここまで本発明をその詳細な説明と関連させて記載してきたが、上記説明は例示説明を目的とするものであり、添付の「特許請求の範囲」の範囲によって定められる本発明の範囲を限定するものではないことを理解するべきである。その他の態様、利点および改変は以下の特許請求の範囲内にある。
本発明は、以下の態様を包含し得る。
[1]
異種機能ドメインと連結した触媒的に不活性なCRISPR関連9(dCas9)タンパク質を含む、融合タンパク質。
[2]
前記異種機能ドメインが転写活性化ドメインである、上記[1]に記載の融合タンパク質。
[3]
前記転写活性化ドメインが、VP64またはNF−κB p65由来のものである、上記[2]に記載の融合タンパク質。
[4]
前記異種機能ドメインが、転写サイレンサーまたは転写抑制ドメインである、上記[1]に記載の融合タンパク質。
[5]
前記転写抑制ドメインが、クルッペル関連ボックス(KRAB)ドメイン、ERFリプレッサードメイン(ERD)またはmSin3A相互作用ドメイン(SID)である、上記[4]に記載の融合タンパク質。
[6]
前記転写サイレンサーが、ヘテロクロマチンタンパク質1(HP1)、例えばHP1αまたはHP1βである、上記[4]に記載の融合タンパク質。
[7]
前記異種機能ドメインが、DNAのメチル化状態を修飾する酵素である、上記[1]に記載の融合タンパク質。
[8]
前記DNAのメチル化状態を修飾する酵素が、DNAメチルトランスフェラーゼ(DNMT)またはTETタンパク質である、上記[7]に記載の融合タンパク質。
[9]
前記TETタンパク質がTET1である、上記[8]に記載の融合タンパク質。
[10]
前記異種機能ドメインが、ヒストンサブユニットを修飾する酵素である、上記[1]に記載の融合タンパク質。
[11]
前記ヒストンサブユニットを修飾する酵素が、ヒストンアセチルトランスフェラーゼ(HAT)、ヒストンデアセチラーゼ(HDAC)、ヒストンメチルトランスフェラーゼ(HMT)またはヒストンデメチラーゼである、上記[1]に記載の融合タンパク質。
[12]
前記異種機能ドメインが生物学的テザーである、上記[1]に記載の融合タンパク質。
[13]
前記生物学的テザーが、MS2、Csy4またはラムダNタンパク質である、上記[12]に記載の融合タンパク質。
[14]
前記触媒的に不活性なCas9タンパク質が、化膿性連鎖球菌(S.pyogenes)由来のものである、上記[1]に記載の融合タンパク質。
[15]
前記触媒的に不活性なCas9タンパク質が、D10、E762、H983またはD986;およびH840またはN863に変異を含む、上記[1]に記載の融合タンパク質。
[16]
前記変異が、
(i)D10AまたはD10Nおよび
(ii)H840A、H840NまたはH840Y
である、上記[15]に記載の融合タンパク質。
[17]
前記異種機能ドメインが、任意選択の介在リンカーを伴って前記触媒的に不活性なCas9タンパク質のN末端またはC末端と連結し、前記リンカーが、前記融合タンパク質の活性に干渉しない、上記[1]に記載の融合タンパク質。
[18]
任意選択で1つまたは複数の介在リンカーを伴って、N末端上、C末端上および/または前記触媒的に不活性なCRISPR関連9(Cas9)タンパク質と前記異種機能ドメインとの間に核局在化配列および1つもしくは複数のエピトープタグの一方または両方をさらに含む、上記[1]に記載の融合タンパク質。
[19]
前記エピトープタグが、c−myc、6HisまたはFLAGである、上記[18]に記載の融合タンパク質。
[20]
上記[1]〜[19]のいずれかに記載の融合タンパク質をコードする、核酸。
[21]
上記[20]に記載の核酸を含む、発現ベクター。
[22]
細胞の標的遺伝子の発現を増大させる方法であって、前記細胞内で上記[2]〜[3]に記載の融合タンパク質と、前記標的遺伝子に対する1つまたは複数のガイドRNAとを発現させることを含む、方法。
[23]
細胞の標的遺伝子を減少させる方法であって、前記細胞内で上記[4]〜[6]に記載の融合タンパク質と、前記標的遺伝子に対する1つまたは複数のガイドRNAとを発現させることを含む、方法。
[24]
細胞の標的遺伝子またはそのプロモーターもしくはエンハンサー(1つまたは複数)のDNAメチル化を減少させる方法であって、前記細胞内で上記[7]〜[9]に記載の融合タンパク質と、関連する標的遺伝子配列に対する1つまたは複数のガイドRNAとを発現させることを含む、方法。
[25]
細胞の標的遺伝子またはそのプロモーターもしくはエンハンサー(1つまたは複数)と結合しているヒストンを修飾する方法であって、前記細胞内で上記[10]〜[11]に記載の融合タンパク質と、関連する標的遺伝子配列に対する1つまたは複数のガイドRNAとを発現させることを含む、方法。