【文献】
ZALATAN J. G. et al.,Cell,2015年 1月,Vol. 160,pp. 339-350
【文献】
MALI P. et al.,Nature Biotechnology,2013年,Vol. 31, No. 9,pp. 833-838
【文献】
CHENG A. W. et al.,Cell Research,2013年,Vol. 23,pp. 1163-1171
(58)【調査した分野】(Int.Cl.,DB名)
前記Cas9タンパク質が、野生型Cas9タンパク質、エンドヌクレアーゼ活性を欠くdCas9タンパク質、および、Cas9ニッカーゼからなる群より選択される、請求項1または2に記載の三構成要素複合体。
前記Cas9タンパク質が、野生型Cas9タンパク質、エンドヌクレアーゼ活性を欠くdCas9タンパク質、および、Cas9ニッカーゼからなる群より選択される、請求項12に記載のキット。
前記Cas9タンパク質が、野生型Cas9タンパク質、エンドヌクレアーゼ活性を欠くdCas9タンパク質、および、Cas9ニッカーゼからなる群より選択される、請求項21に記載のin vitroの方法。
【発明を実施するための形態】
【0045】
1.概説
本明細書に記載する発明は、ターゲットポリヌクレオチド配列への結合のため(例えばDNAターゲティング配列);野生型Cas9タンパク質、あるいは減少したまたは欠損したヌクレアーゼ活性を伴う修飾Cas9タンパク質(例えばCas9ニッカーゼまたはdCas9)のいずれかに結合するため(例えばCas9結合配列);そして各々機能的またはエフェクタードメインに融合した、1またはそれより多いPUFドメインに結合するための、3つの機能的配列を含むポリヌクレオチドを提供する。本発明のポリヌクレオチドは、野生型または修飾Cas9タンパク質、および1またはそれより多いPUFドメイン融合タンパク質とともに、三構成要素複合体(対象の三構成要素CRISPR/Cas複合体/系)を、特定のターゲットDNA配列で形成して、特定のターゲットDNA配列で、1またはそれより多い生物学的効果を達成しうる。
【0046】
本発明はまた、こうしたポリヌクレオチドをコードするベクター、ならびにポリヌクレオチド、Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)、および少なくとも1つのPUFドメイン融合タンパク質によって形成される複合体も提供する。本発明はさらに、ベクターまたはポリヌクレオチドを含む宿主細胞を提供する。
【0047】
対象の三構成要素CRISPR/Cas複合体/系は、ターゲットDNA配列で多様な生物学的機能を達成可能であり、これらには、限定されるわけではないが:ノックインの効率を増加させる相同組換え増進、多数のゲノム遺伝子座での同時転写活性化および/または抑制;蛍光画像化または他の検出可能シグナルによるゲノム遺伝子座での特定の配列の検出;ならびに細胞運命決定、細胞分化、代謝流動、あるいは生物学的または生化学的決定可能転帰への影響等が含まれる。
【0048】
本発明は、さらに、本発明の方法を実行するためのキットおよび試薬を提供する。
したがって、1つの側面において、本発明は:(1)ターゲットポリヌクレオチド配列に相補的であるDNAターゲティング配列;(2)Cas9結合配列;および(3)1またはそれより多いコピーのPUFドメイン結合配列(PBS)、ここで1またはそれより多いコピーのPBSは各々、同じまたは異なるPUFドメインに結合する、を含むポリヌクレオチドであって;Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)が、Cas9結合配列に結合することによって、ポリヌクレオチドと複合体を形成可能である、前記ポリヌクレオチドを提供する。特定の態様において、dCas9タンパク質は、減少したヌクレアーゼ活性を有するか、またはヌクレアーゼ活性を欠く(例えばヌクレアーゼ不全である)が、対象のポリヌクレオチドと複合体化した際、DNA結合能を保持する。特定の態様において、(1)〜(3)は、この順序で5’から3’に配置される。他の態様において、1またはそれより多くのPBSは、DNAターゲティング配列の5’、および/またはCas9結合配列の5’であってもよい。
【0049】
ターゲットポリヌクレオチド配列は、任意のDNA配列であってもよい。特定の態様において、ターゲットポリヌクレオチド配列は、1またはそれより多い転写制御要素を含むかまたは該要素に隣接している。特定の態様において、転写制御要素(単数または複数)は:コアプロモーター、近位プロモーター要素、エンハンサー、サイレンサー、インスレーター、および遺伝子座調節領域の1またはそれより多くを含む。別の態様において、ターゲットポリヌクレオチド配列は、セントロメア配列、テロメア配列、または反復ゲノム配列を含むか、または該配列に隣接している。テロメア配列は、TTAGGGリピートの5〜15kbトラックを有することによって特徴付け可能である。さらに別の態様において、ターゲットポリヌクレオチド配列は、ゲノムマーカー配列または関心対象の任意のゲノム遺伝子座を含むかまたは該配列に隣接している。
【0050】
特定の態様において、ターゲットポリヌクレオチド配列は、相補鎖のPAM(プロトスペーサー隣接モチーフ)配列のすぐ3’である。例えば、特定の態様において、相補鎖のPAM配列は、5’−CCN−3’であり、式中、Nは任意のDNAヌクレオチドである。
【0051】
他の態様において、相補鎖のPAM配列は、用いようとする特定のCas9タンパク質または相同体またはオルソログにマッチする。
当該技術分野に知られるように、Cas9が成功裡にDNAに結合するためには、ゲノムDNA中のターゲット配列は、ガイドRNA配列に相補的でなければならず、そしてそのすぐ後には正しいプロトスペーサー隣接モチーフまたはPAM配列が続かなければならない。PAM配列は、DNAターゲット配列中には存在するが、ガイドRNA配列中には存在しない。PAM配列が続く、正しいターゲット配列を含む任意のDNA配列は、Cas9によって結合されるであろう。
【0052】
PAM配列は、Cas9が由来する細菌種によって異なる。最も広く用いられるII型CRISPR系は、化膿性連鎖球菌由来であり、そしてPAM配列は、ガイドRNA認識配列のすぐ3’端上に位置する5’−NGG−3’(または相補鎖上の5’−CCN−3’)である。異なる細菌種由来の他のII型CRISPR系のPAM配列を以下の表に列挙する。
【0054】
特定の態様において、DNAターゲティング配列は、Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)がポリヌクレオチドと複合体化した際、ターゲットポリヌクレオチド配列と塩基対形成する。
【0055】
DNAターゲティング配列は、ターゲットポリヌクレオチド配列と100%相補的であってもまたはなくてもよいことに注目すべきである。特定の態様において、DNAターゲティング配列は、約8〜25ヌクレオチド(nts)、約12〜22ヌクレオチド、約14〜20nts、約16〜20nts、約18〜20nts、あるいは約8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ntsに渡って、ターゲットポリヌクレオチド配列に相補的である。特定の態様において、相補領域は、好ましくはDNAターゲティング配列の3’で、約12〜22ntsの連続ストレッチを含む。特定の態様において、DNAターゲティング配列の5’端は、ターゲットポリヌクレオチド配列と最大8ヌクレオチドのミスマッチを有する。特定の態様において、DNA結合配列は、ターゲットポリヌクレオチド配列に、約50、55、60、65、70、75、80、85、90、95または100%相補的である。
【0056】
関連する態様において、相補的ターゲットポリヌクレオチド配列に比較して、DNAターゲティング配列の3’端には15ヌクレオチドを超えるマッチはなく、そして複合体中のCas9タンパク質は、ある状況下でターゲットDNAに結合するがこれを切断しない、野生型Cas9タンパク質である。
【0057】
特定の態様において、DNA結合配列は、5’端ヌクレオチドGを有する。
特定の態様において、ポリヌクレオチドは、DNAターゲティング配列をCas9結合配列に連結するリンカー配列をさらに含む。
【0058】
特定の態様において、Cas9結合配列はヘアピン構造を形成する。特定の態様において、Cas9結合配列は、長さ約30〜100nt、約35〜50nt、約37〜47nt、または約42ntである。
【0059】
例示的なCas9結合配列は、GTTTTAGAGCTAGAAATAGCAAGTTAA AATAAGGCTAである。別の例示的なCas9結合配列は、GTTTAAGAGCTATGC TG GAAACAGCATAGCAAGTTTAAATAAGGCTAである。
【0060】
修飾Cas9タンパク質(ニッカーゼまたはdCas9)は、減少したヌクレアーゼ活性を有してもよいし、あるいは一方または両方のエンドヌクレアーゼ触媒部位のヌクレアーゼ活性を欠く。特定の態様において、dCas9タンパク質は、野生型Cas9の両方のエンドヌクレアーゼ触媒部位(RuvCおよびHNH)の点突然変異のため、エンドヌクレアーゼ活性を欠く。例えば、点突然変異は、化膿性連鎖球菌Cas9において、それぞれ、D10AおよびH840Aであってもよいし、または化膿性連鎖球菌以外の種における対応する残基におけるものであってもよい。特定の態様において、Cas9タンパク質は、野生型Cas9の一方の部位でエンドヌクレアーゼ触媒活性を欠くが、両方の部位ではなく、そしてdsDNAターゲット上にニックを生成可能である(Cas9ニッカーゼ)。
【0061】
特定の態様において、1つまたはそれより多いコピーのPBSは各々、約8ヌクレオチドを有する。1つの例示的なPBSは、PUFドメインPUF(3−2)が結合可能な5’−UGUAUGUA−3’の配列を有しうる。別の例示的なPBSは、PUFドメインPUF(6−2/7−2)が結合可能な5’−UUGAUAUA−3’の配列を有しうる。さらなるPBSおよび対応するPUFドメインを以下に記載する。
【0062】
本発明のポリヌクレオチドは、PBSの1コピーより多くを有しうる。特定の態様において、ポリヌクレオチドは、1、2、3、4、5、10、15、20、25、30、35、40、45、46、47、48、49、または50コピーのPBS、例えば5、6、7、8、9、10、11、12、13、14、または15コピーのPBSを含む。特定の態様において、PBSコピー数の範囲は、LからHであり、式中、Lは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、または40の任意の1つであり、そしてHがLより長い限り、Hは、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、80、90、または100の任意の1つである。各PBSは、同じであってもまたは異なってもよい。
【0063】
特定の態様において、ポリヌクレオチドは、約5〜15コピーのPBS、または約5〜14コピー、約5〜13コピー、約5〜12コピー、約5〜11コピー、約5〜10コピー、または約5〜9コピーを含む。
【0064】
特定の態様において、トランスフェクションされるかまたは発現されるsgRNA−PBSの量および/またはPUF融合体の量を調整して、PBS/PUF結合を最大にする。例えば、これは、より強いプロモーターによって、または誘導性プロモーター、例えばDox誘導性プロモーターを用いることによって、PUFアクチベーターの発現を増加させることにより、達成可能である。
【0065】
特定の態様において、PBS部位および/またはスペーサー配列の間のスペーシングを最適化して、系の効率を改善する。例えば、スペーシング最適化を特定のPUF融合体に供することも可能であり、そしてこれは、個々のタンパク質として作用するPUF融合体および機能するために十分に近く配置する必要がありうるPUF融合体(例えばタンパク質複合体)の間では異なる可能性もある。
【0066】
本発明の別の側面は、対象のポリヌクレオチドのいずれか1つをコードするベクターを提供する。特定の態様において、ポリヌクレオチドの転写は、恒常的プロモーター、または誘導性プロモーターの制御下にある。特定の態様において、ベクターは、哺乳動物(ヒト;非ヒト霊長類;非ヒト哺乳動物;齧歯類、例えばマウス、ラット、ハムスター、モルモット;家畜哺乳動物、例えばブタ、ヒツジ、ヤギ、ウマ、ラクダ、ウシ;あるいはペット哺乳動物、例えばネコまたはイヌ);鳥類、魚類、昆虫、虫、酵母、または細菌由来の細胞において活性である。
【0067】
特定の態様において、ベクターはプラスミド、ウイルスベクタ−(例えばアデノウイルス、レトロウイルス、またはレンチウイルスベクター、あるいはAAVベクター)、またはトランスポゾン(例えばピギーBacトランスポゾン)である。ベクターを一過性に宿主細胞にトランスフェクションしてもよいし、あるいは感染または転位によって、宿主ゲノム内に取り込んでもよい。
【0068】
本発明の関連する側面は、本発明のベクターの任意の1つの多数またはライブラリーを提供し、ここで、ベクターのうちの2つが、それぞれのDNAターゲティング配列にコードされるポリヌクレオチド、Cas9結合配列、および/またはPBSのコピー数、同一性(配列、結合特異性等)、または相対的順序において異なる。
【0069】
本発明の別の側面は、任意の1つの本発明のポリヌクレオチド、およびCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)を含む、複合体を提供する。特定の態様において、複合体は、任意の1つの本発明のポリヌクレオチド、およびCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)を含む。特定の態様において、複合体は野生型Cas9タンパク質を含まない。特定の態様において、複合体は野生型Cas9を含む。
【0070】
特定の態様において、複合体は、1またはそれより多いPUFドメイン、あるいは1またはそれより多いPBSに結合したその融合体をさらに含んでもよい。特定の態様において、PUFドメインの各々は、エフェクタードメインに融合している。各エフェクタードメインは、独立に(限定されるわけではないが):転写リプレッサー、転写アクチベーター、蛍光タンパク質、酵素、またはクロマチンリモデリングタンパク質(HDAC/HAT)であってもよい。特定の態様において、PUFドメインの少なくとも2つは、異なるエフェクタードメインに融合している。
【0071】
特定の態様において、Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)、PUFドメイン、および/またはエフェクタードメインは、核局在化シグナル(NLS)をさらに含む。
【0072】
特定の態様において、複合体は、ポリヌクレオチドのDNAターゲティング配列を通じて、ターゲットポリヌクレオチド配列に結合している。 本発明の別の側面は、任意の1つの対象のベクター、または複数のベクターを含む、宿主細胞を提供する。
【0073】
特定の態様において、宿主細胞は、Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)をコードする第二のベクターをさらに含む。
特定の態様において、第二のベクターは、Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)に融合しているエフェクタードメインをさらにコードする。Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)の発現は、恒常的プロモーターまたは誘導性プロモーターの制御下にあってもよい。
【0074】
特定の態様において、宿主細胞は、各々エフェクタードメインに融合している、1またはそれより多いPUFドメインをコードする第三のベクターをさらに含んでもよい。1またはそれより多いPUFドメインの発現は、独立に、恒常的プロモーターまたは誘導性プロモーターの制御下にあってもよい。
【0075】
エフェクタードメインは、多くの機能または生物学的効果のいずれを有してもよい。単に例示のため、エフェクタードメインは、相同組換えに関与するタンパク質、転写リプレッサー、転写アクチベーター、蛍光タンパク質、酵素、またはクロマチンリモデリングタンパク質(HDAC/HAT)等であってもよい。
【0076】
特定の態様において、第二のベクターは、Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)またはエフェクタードメインに融合した核局在化シグナル(NLS)をさらにコードしてもよく、そして/または第三のベクターは、PUFドメインまたはエフェクタードメインに融合した核局在化シグナル(NLS)をさらにコードしてもよい。
【0077】
特定の態様において、異なるベクターによってコードされうる配列は、同じベクター上にあってもよい。例えば、特定の態様において、第二のベクターはベクターと同じであってもよく、そして/または第三のベクターはベクターまたは第二のベクターと同じであってもよい。
【0078】
宿主細胞は、生存動物中にあってもよいし、または培養細胞であってもよい。
特定の態様において、宿主細胞は、対象の三構成要素系の1またはそれより多い構成要素(例えばdCas9、PUF融合体)を、恒常的にまたは誘導性に発現してもよい。
【0079】
本発明のさらに別の側面は、ターゲットポリヌクレオチド配列で、本発明の複合体を組み立てる方法であって、ターゲットポリヌクレオチド配列に:(1)任意の1つの対象のポリヌクレオチド、または任意の1つの対象のベクター、または複数のベクター;(2)Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)、またはCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)をコードする任意の1つの対象の第二のベクター;および(3)各々がエフェクタードメインに融合している1またはそれより多いPUFドメイン、またはPUFドメイン融合体をコードする第三のベクターを接触させるかまたはその近傍に運ぶ工程を含む、前記方法を提供する。
【0080】
特定の態様において、複合体は、細胞内部で組み立てられ、ターゲットポリヌクレオチド配列は細胞のゲノムDNAの一部であり、そして対象のベクター、第二のベクター、およびの第三のベクターが細胞内に導入される。
【0081】
特定の態様において、ターゲットポリヌクレオチド配列は、ヘテロクロマチンが豊富なゲノム遺伝子座にあるかまたはその近傍にあり、そしてエフェクタードメインは検出可能マーカー(例えば蛍光タンパク質)である。別の態様において、ターゲットポリヌクレオチド配列は、ターゲット遺伝子の転写制御要素にあるかまたはその近傍にあり、そしてエフェクタードメインは転写調節因子(例えばアクチベーター、サプレッサー)である。ターゲット遺伝子の転写は、例えば、細胞運命決定、細胞分化、代謝流動、あるいは生物学的または生化学的に決定可能な転帰に影響を及ぼしうる。
【0082】
本発明の関連する側面は、細胞において、複数のターゲット遺伝子の転写を調節する方法であって:細胞内に、対象の複数のベクター、dCas9タンパク質のコード配列、および1またはそれより多いPUFドメイン融合体のコード配列を導入する工程を含み、ここでターゲット遺伝子の各々は、(1)複数のベクターの1つにコードされるポリヌクレオチド、dCas9タンパク質、およびPUFドメイン融合体の三分子複合体の、ターゲットポリヌクレオチド配列での組み立て;および(2)ターゲットポリヌクレオチド配列を含むターゲット遺伝子の転写調節を可能にする、ターゲットポリヌクレオチド配列を含む、前記方法を提供する。
【0083】
関連する側面において、本発明はまた、細胞における、複数のターゲット遺伝子のエピジェネティック調節の方法(例えば、転写活性に直接関連しないクロマチンのエピジェネティック状態の調節)であって:細胞内に、複数の対象のベクター、野生型Cas9またはCas9ニッカーゼのコード配列、および1またはそれより多いPUFドメイン融合体のコード配列を導入する工程を含み、ここでターゲット遺伝子の各々は、(1)複数のベクターの1つにコードされるポリヌクレオチド、野生型Cas9またはCas9ニッカーゼ、およびPUFドメイン融合体の三分子複合体の、ターゲットポリヌクレオチド配列での組み立て;および(2)ターゲットポリヌクレオチド配列を含むターゲット遺伝子のエピジェネティック調節を可能にする、ターゲットポリヌクレオチド配列を含む、前記方法を提供する。該方法は、例えば、同じ時点で、エピジェネティック状態を変化させ(例えばクロマチンを開放し)、閉鎖クロマチン部位へのCas9結合のアクセス/安定性を獲得する(例えばこれらの部位での切断およびゲノム編集を増加させる)ために有用でありうる。
【0084】
特定の態様において、少なくとも1つのターゲット遺伝子の転写が増進され/刺激される一方、少なくとも1つの別のターゲット遺伝子が阻害される。
本発明はさらに:(1)対象のポリヌクレオチド、または該ポリヌクレオチドをコードするベクター;(2)Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)をコードする第二のベクター;および(3)各々、エフェクタードメインに融合している、1またはそれより多いPUFドメインをコードする第三のベクターを含む、キットを提供する。該キットは、該ベクターの細胞内への導入を促進する、形質転換、トランスフェクション、または感染試薬をさらに含んでもよい。
【0085】
本発明は一般的に上記に記載されてきているが、本発明の多様な特徴を以下にさらに詳述する。別個の態様の背景で、または本発明の異なる側面下での別個の態様で記載した際であっても、本発明の特徴は、単一の態様において、組み合わせて提供可能である。逆に、単一の態様の背景で記載した本発明の多様な特徴もまた、別個に、または任意の適切な下位組み合わせで提供可能である。本発明に関する態様のすべての組み合わせが、本発明に特に含まれ、そしてちょうど、各々およびすべての組み合わせが個々にそして明確に開示されるかのように、本明細書に開示される。さらに、多様な態様およびその要素のすべての下位組み合わせもまた、本発明に特に含まれ、そしてちょうど、各々およびすべての下位組み合わせが個々にそして明確に開示されるかのように、本明細書に開示される。
【0086】
2.本発明のポリヌクレオチド
本発明のポリヌクレオチドは、3つの配列セグメントを含む:i)ターゲット配列に相補的なヌクレオチド配列を含む第一のセグメント;ii)Cas9タンパク質(例えば野生型、ニッカーゼ、あるいは減少したヌクレアーゼ活性を有するかまたはヌクレアーゼ活性を欠くdCas9タンパク質)と相互作用する第二のセグメント(例えばCas9結合配列);およびiii)1またはそれより多いコピーのPUFドメイン結合配列(PBS)。
【0087】
特定の態様において、ターゲット配列はRNAである。特定の態様において、ターゲット配列はDNAである。本明細書の説明において、第一のセグメントは、ターゲット配列がDNA(例えばゲノムDNA)である場合、一般的に、「DNAターゲティング配列」と称される。ターゲット配列がRNAである関連する態様において、本明細書の説明は、以下で、冗長性を回避するため、「DNAターゲティング配列」への言及を「RNAターゲティング配列」で置き換えることを例外として、一般的に同様に適用する。すなわち、第一のセグメントは、ターゲットポリヌクレオチド配列(DNAまたはRNA)に相補的なヌクレオチド配列を含む。
【0088】
特定の態様において、3つのセグメントi)〜iii)は、5’から3’に、この順序で配置される。
特定の態様において、本発明のポリヌクレオチドは、単一のRNA分子(単一RNAポリヌクレオチド)であってもよく、これには「単一ガイドRNA」または「sgRNA」が含まれうる。別の態様において、本発明のポリヌクレオチドは、2つのRNA分子を含んでもよい(例えばCas9結合配列でのハイブリダイゼーションを通じてともに連結される。以下を参照されたい)。したがって、対象のポリヌクレオチドは包含性であり、2分子ポリヌクレオチドおよび単一分子ポリヌクレオチド(例えばsgRNA)の両方を指す。
【0089】
a. DNAターゲティング配列
DNAターゲティング配列は、CRISPR/Cas複合体/系のcrRNAまたはガイドRNAまたはgRNAと機能的に類似であるかまたは同等である。しかし、本発明の背景において、DNAターゲティング配列は、任意の特定のcrRNAまたはgRNAから生じなくてもよく、ターゲットポリヌクレオチド配列の配列に基づいて、恣意的に設計されてもよい。
【0090】
DNAターゲティング配列は、ターゲットDNA(またはターゲットDNAの相補鎖)内の特定の配列に相補的なヌクレオチド配列を含む。言い換えると、DNAターゲティング配列は、ハイブリダイゼーション(すなわち塩基対形成)を通じて、配列特異的方式で、ターゲットDNAのターゲットポリヌクレオチド配列と相互作用する。こうしたものとして、DNAターゲティング配列のヌクレオチド配列は、多様であることも可能であり、そしてこれは、対象のポリヌクレオチドおよびターゲットDNAが相互作用するであろう、ターゲットDNA内の位置を決定する。ターゲットDNA内の任意の望ましい配列にハイブリダイズするように、DNAターゲティング配列を修飾するかまたは設計してもよい(例えば遺伝子操作によって)。特定の態様において、ターゲットポリヌクレオチド配列は、相補鎖のPAM(プロトスペーサー隣接モチーフ)配列のすぐ3’であり、これは、5’−CCN−3’であってもよく、式中、Nは任意のDNAヌクレオチドである。すなわち、この態様において、ターゲットポリヌクレオチド配列の相補鎖は、5’−NGG−3’、式中、Nは任意のDNA配列である、である、PAM配列のすぐ5’である。関連する態様において、相補鎖のPAM配列は、野生型またはdCas9にマッチする。化膿性連鎖球菌以外の種由来のPAM配列に関しては、上記を参照されたい。
【0091】
DNAターゲティング配列は、約12ヌクレオチド〜約100ヌクレオチドの長さを有することも可能である。例えば、DNAターゲティング配列は、約12ヌクレオチド(nt)〜約80nt、約12nt〜約50nt、約12nt〜約40nt、約12nt〜約30nt、約12nt〜約25nt、約12nt〜約20nt、または約12nt〜約19ntの長さを有することも可能である。例えば、DNAターゲティング配列は、約19nt〜約20nt、約19nt〜約25nt、約19nt〜約30nt、約19nt〜約35nt、約19nt〜約40nt、約19nt〜約45nt、約19nt〜約50nt、約19nt〜約60nt、約19nt〜約70nt、約19nt〜約80nt、約19nt〜約90nt、約19nt〜約100nt、約20nt〜約25nt、約20nt〜約30nt、約20nt〜約35nt、約20nt〜約40nt、約20nt〜約45nt、約20nt〜約50nt、約20nt〜約60nt、約20nt〜約70nt、約20nt〜約80nt、約20nt〜約90nt、または約20nt〜約100ntの長さを有することも可能である。
【0092】
ターゲットDNAのターゲットポリヌクレオチド配列に相補的であるDNAターゲティング配列のヌクレオチド配列は、少なくとも約12ntの長さを有することも可能である。例えば、ターゲットDNAのターゲットポリヌクレオチド配列に相補的であるDNAターゲティング配列は、少なくとも約12nt、少なくとも約15nt、少なくとも約18nt、少なくとも約19nt、少なくとも約20nt、少なくとも約25nt、少なくとも約30nt、少なくとも約35ntまたは少なくとも約40ntの長さを有することも可能である。例えば、ターゲットDNAのターゲットポリヌクレオチド配列に相補的であるDNAターゲティング配列は、約12ヌクレオチド(nt)〜約80nt、約12nt〜約50nt、約12nt〜約45nt、約12nt〜約40nt、約12nt〜約35nt、約12nt〜約30nt、約12nt〜約25nt、約12nt〜約20nt、または約12nt〜約19nt、約19nt〜約20nt、約19nt〜約25nt、約19nt〜約30nt、約19nt〜約35nt、約19nt〜約40nt、約19nt〜約45nt、約19nt〜約50nt、約19nt〜約60nt、約20nt〜約25nt、約20nt〜約30nt、約20nt〜約35nt、約20nt〜約40nt、約20nt〜約45nt、約20nt〜約50nt、または約20nt〜約60ntの長さを有することも可能である。ターゲットDNAのターゲットポリヌクレオチド配列に相補的であるDNAターゲティング配列のヌクレオチド配列は、少なくとも約12ntの長さを有することも可能である。
【0093】
いくつかの場合、ターゲットDNAのターゲットポリヌクレオチド配列に相補的であるDNAターゲティング配列は、長さ20ヌクレオチドである。いくつかの場合、ターゲットDNAのターゲットポリヌクレオチド配列に相補的であるDNAターゲティング配列は、長さ19ヌクレオチドである。
【0094】
DNAターゲティング配列およびターゲットDNAのターゲットポリヌクレオチド配列の間の相補性パーセントは、少なくとも50%(例えば少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも97%、少なくとも98%、少なくとも99%、または100%)であってもよい。いくつかの場合、DNAターゲティング配列およびターゲットポリヌクレオチド配列の間の相補性パーセントは、ターゲットポリヌクレオチド配列の最も5’の7または8の隣接するヌクレオチドに渡って100%である。いくつかの場合、DNAターゲティング配列およびターゲットポリヌクレオチド配列の間の相補性パーセントは、約20の隣接ヌクレオチドに渡って、少なくとも60%である。いくつかの場合、DNAターゲティング配列およびターゲットポリヌクレオチド配列の間の相補性パーセントは、ターゲットポリヌクレオチド配列の最も5’の7、8、9、10、11、12、13、または14の隣接するヌクレオチド(すなわち、DNAターゲティング配列の最も3’の7、8、9、10、11、12、13、または14の隣接するヌクレオチド)に渡って100%であり、そして残りに渡って、0%と同程度に低い。こうした場合、DNAターゲティング配列は、それぞれ、長さ7、8、9、10、11、12、13、または14ヌクレオチドと見なすことも可能である。
【0095】
b. Cas9結合配列
対象のポリヌクレオチドのタンパク質結合セグメントまたはタンパク質結合配列は、野生型Cas9、あるいは減少したエンドヌクレアーゼ活性を持つかまたはエンドヌクレアーゼ活性を欠く修飾dCas9タンパク質(例えばニッカーゼまたはdCas9)に結合する。単純化のため、野生型および/または修飾Cas9タンパク質に結合可能である、対象のポリヌクレオチドのタンパク質結合配列は、本明細書において、単純に、「Cas9結合配列」と称されうる。しかし、本発明のCas9結合配列がdCas9に結合する際、野生型Cas9またはCas9ニッカーゼへの結合は妨げられないことを理解すべきである。特定の態様において、本発明のCas9結合配列は、dCas9、ならびに野生型Cas9および/またはCas9ニッカーゼに結合する。
【0096】
Cas9結合配列は、Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)と相互作用するかまたはこれに結合し、そしてともに、これらは、DNAターゲティング配列が認識するターゲットポリヌクレオチド配列に結合する。Cas9結合配列は、互いにハイブリダイズして、二本鎖RNA二重鎖(dsRNA二重鎖)を形成する、ヌクレオチドの2つの相補ストレッチを含む。ヌクレオチドのこれらの2つの相補ストレッチは、リンカーまたはリンカーヌクレオチドとして知られる介在ヌクレオチドによって共有結合され(例えば単一分子ポリヌクレオチドの場合)、そしてCas9結合配列の二本鎖RNA二重鎖(dsRNA二重鎖、または「Cas9結合ヘアピン」)を形成するようハイブリダイズし、こうしてステム・ループ構造を生じてもよい。あるいは、いくつかの態様において、ヌクレオチドの2つの相補ストレッチは、共有結合しておらず、その代わり、相補配列間のハイブリダイゼーションによってともに保持されてもよい(例えば本発明の2分子ポリヌクレオチドの場合)。
【0097】
Cas9結合配列は、約10ヌクレオチド〜約100ヌクレオチド、例えば約10ヌクレオチド(nt)〜約20nt、約20nt〜約30nt、約30nt〜約40nt、約40nt〜約50nt、約50nt〜約60nt、約60nt〜約70nt、約70nt〜約80nt、約80nt〜約90nt、または約90nt〜約100ntの長さを有することも可能である。例えば、Cas9結合配列は、約15ヌクレオチド(nt)〜約80nt、約15nt〜約50nt、約15nt〜約40nt、約15nt〜約30nt、約37nt〜約47nt(例えば42nt)、または約15nt〜約25ntの長さを有することも可能である。
【0098】
Cas9結合配列のdsRNA二重鎖は、約6塩基対(bp)〜約50bpの長さを有することも可能である。例えば、Cas9結合配列のdsRNA二重鎖は、約6bp〜約40bp、約6bp〜約30bp、約6bp〜約25bp、約6bp〜約20bp、約6bp〜約15bp、約8bp〜約40bp、約8bp〜約30bp、約8bp〜約25bp、約8bp〜約20bpまたは約8bp〜約15bpの長さを有することも可能である。例えば、Cas9結合配列のdsRNA二重鎖は、約8bp〜約10bp、約10bp〜約15bp、約15bp〜約18bp、約18bp〜約20bp、約20bp〜約25bp、約25bp〜約30bp、約30bp〜約35bp、約35bp〜約40bp、または約40bp〜約50bpの長さを有することも可能である。いくつかの態様において、Cas9結合配列のdsRNA二重鎖は、36塩基対の長さを有する。ハイブリダイズしてCas9結合配列のdsRNA二重鎖を形成するヌクレオチド配列間の相補性パーセントは、少なくとも約60%であることも可能である。例えば、ハイブリダイズしてCas9結合配列のdsRNA二重鎖を形成するヌクレオチド配列間の相補性パーセントは、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約98%、または少なくとも約99%であることも可能である。いくつかの場合、ハイブリダイズしてCas9結合配列のdsRNA二重鎖を形成するヌクレオチド配列間の相補性パーセントは100%である。
【0099】
リンカーは、約3ヌクレオチド〜約100ヌクレオチドの長さを有することも可能である。例えば、リンカーは、約3ヌクレオチド(nt)〜約90nt、約3ヌクレオチド(nt)〜約80nt、約3ヌクレオチド(nt)〜約70nt、約3ヌクレオチド(nt)〜約60nt、約3ヌクレオチド(nt)〜約50nt、約3ヌクレオチド(nt)〜約40nt、約3ヌクレオチド(nt)〜約30nt、約3ヌクレオチド(nt)〜約20ntまたは約3ヌクレオチド(nt)〜約10ntの長さを有することも可能である。例えば、リンカーは、約3nt〜約5nt、約5nt〜約10nt、約10nt〜約15nt、約15nt〜約20nt、約20nt〜約25nt、約25nt〜約30nt、約30nt〜約35nt、約35nt〜約40nt、約40nt〜約50nt、約50nt〜約60nt、約60nt〜約70nt、約70nt〜約80nt、約80nt〜約90nt、または約90nt〜約100ntの長さを有することも可能である。いくつかの態様において、リンカーは、4ntである。
【0100】
適切なCas9結合配列中に含まれてもよいヌクレオチド配列(すなわちCas9ハンドル)の限定されない例は、本明細書に援用されるWO2013/176772の配列番号563〜682(例えば、WO2013/176772の
図8および9を参照されたい)に示される。
いくつかの場合、適切なCas9結合配列は、上に列挙する任意の1つと1、2、3、4、または5ヌクレオチド異なるヌクレオチド配列を含む。
【0101】
c. PUFドメイン結合配列(PBS)
対象のポリヌクレオチドは、1またはそれより多いタンデム配列を含み、その各々は、特定のPUFドメイン(以下)によって特異的に認識され、そして結合されてもよい。PUFドメインは、PUFドメインの個々のPUFモチーフおよびこれらが認識する単一RNAヌクレオチドの間のヌクレオチド特異的相互作用に基づいて、実質的にいかなるPBSにも結合するよう操作可能であるため、PBS配列は、対応するPUFドメインに結合する任意の設計配列であってもよい。
【0102】
特定の態様において、本発明のPBSは8量体を有する。他の態様において、本発明のPBSは、5、6、7、8、9、10、11、12、13、14、15、16またはそれより多いRNAヌクレオチドを有する。
【0103】
特定の態様において、本発明のPBSは、配列5’−UGUAUAUA−3’を有し、そして野生型ヒトPumilio 1 PUFドメインに結合する。
特定の態様において、本発明のPBSは、配列5’−UGUAUGUA−3’を有し、そしてPUFドメインPUF(3−2)に結合する。
【0104】
特定の態様において、本発明のPBSは、配列5’−UUGAUAUA−3’を有し、そしてPUFドメインPUF(6−2/7−2)に結合する。
特定の態様において、本発明のPBSは、配列5’−UG
GAUAUA−3’を有し、そしてPUFドメインPUF(6−2)に結合する。
【0105】
特定の態様において、本発明のPBSは、配列5’−U
UUAUAUA−3’を有し、そしてPUFドメインPUF(7−2)に結合する。
特定の態様において、本発明のPBSは、配列5’−UGU
GU
GU
G−3’を有し、そしてPUFドメインPUF
531に結合する。
【0106】
特定の態様において、本発明のPBSは、配列5’−UGUAUAU
G−3’を有し、そしてPUFドメインPUF(1−1)に結合する。
特定の態様において、本発明のPBSは、配列5’−U
UUAUAUA−3’または5’−U
AUAUAUA−3’を有し、そしてPUFドメインPUF(7−1)に結合する。
【0107】
特定の態様において、本発明のPBSは、配列5’−UGUAU
UUA−3’を有し、そしてPUFドメインPUF(3−1)に結合する。
特定の態様において、本発明のPBSは、配列5’−U
UUAU
UUA−3’を有し、そしてPUFドメインPUF(7−2/3−1)に結合する。
【0108】
本出願者は、65,536の8量体PBS、および特定のPBSに結合可能な対応するPUFドメイン配列(以下を参照されたい)を生成した。本出願者はまた、所定の8量体PBSに結合する65,536の個々のPUFドメイン配列のいずれかを回収するパイソンスクリプトも生成した。例えば、8量体UUGAUGUAに関して、1つのありうるPUFドメイン配列は、以下でありうる:
【0110】
特定の態様において、1またはそれより多いスペーサー領域は、2つの隣接するPBS配列を分離する。スペーサー領域は、約3ヌクレオチド〜約100ヌクレオチドの長さを有することも可能である。例えば、スペーサーは、約3ヌクレオチド(nt)〜約90nt、約3ヌクレオチド(nt)〜約80nt、約3ヌクレオチド(nt)〜約70nt、約3ヌクレオチド(nt)〜約60nt、約3ヌクレオチド(nt)〜約50nt、約3ヌクレオチド(nt)〜約40nt、約3ヌクレオチド(nt)〜約30nt、約3ヌクレオチド(nt)〜約20ntまたは約3ヌクレオチド(nt)〜約10ntの長さを有することも可能である。例えば、スペーサーは、約3nt〜約5nt、約5nt〜約10nt、約10nt〜約15nt、約15nt〜約20nt、約20nt〜約25nt、約25nt〜約30nt、約30nt〜約35nt、約35nt〜約40nt、約40nt〜約50nt、約50nt〜約60nt、約60nt〜約70nt、約70nt〜約80nt、約80nt〜約90nt、または約90nt〜約100ntの長さを有することも可能である。いくつかの態様において、スペーサーは、4ntである。
【0111】
d. 場合による他の配列
安定性調節配列(例えば転写ターミネーターセグメント)は、RNA(例えば対象のポリヌクレオチド)の安定性に影響を及ぼす。適切な安定性調節配列の一例は、転写ターミネーターセグメント(すなわち転写終結配列)である。対象のポリヌクレオチドの転写ターミネーターセグメントは、約10ヌクレオチド〜約100ヌクレオチド、例えば約10ヌクレオチド(nt)〜約20nt、約20nt〜約30nt、約30nt〜約40nt、約40nt〜約50nt、約50nt〜約60nt、約60nt〜約70nt、約70nt〜約80nt、約80nt〜約90nt、または約90nt〜約100ntの全長を有することも可能である。例えば、転写ターミネーターセグメントは、約15ヌクレオチド(nt)〜約80nt、約15nt〜約50nt、約15nt〜約40nt、約15nt〜約30ntまたは約15nt〜約25ntの長さを有することも可能である。
【0112】
いくつかの場合、転写終結配列は、真核細胞において機能するものである。いくつかの場合、転写終結配列は、原核細胞において機能するものである。
安定性調節配列中(例えば転写終結セグメント、または安定性増加を提供する、DNAターゲティングRNAの任意のセグメント中)に含まれることが可能なヌクレオチド配列の限定されない例には、WO 2013/176772(本明細書に援用される)の配列番号683〜696に示される配列が含まれる。例えば、WO 2013/176772の配列番号795、Rho独立性転写終結部位を参照されたい。
【0113】
安定性調節配列は、Cas9結合配列の後に、例えばCas9結合配列および最初のPBSの間、2つの隣接するPBSの間、または最後のPBSの後に配置されてもよい。
いくつかの態様において、本発明のポリヌクレオチドまたはその一部(例えばDNAターゲティング配列、Cas9結合配列、および/または1またはそれより多いPBS)、またはCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)をコードするポリヌクレオチド、またはPUFドメイン融合体(以下)の1つをコードするポリヌクレオチドは、さらなる望ましい特徴、例えば修飾されたまたは制御された安定性;細胞内ターゲティング;追跡用、例えば蛍光標識;タンパク質またはタンパク質複合体のための結合部位などを提供する、修飾または配列を含んでもよい。
【0114】
限定されない例には:5’キャップ(例えば7−メチルグアニル酸キャップ(m
7G));3’ポリアデニル化テール(すなわち3’ポリ(A)テール);リボスイッチ配列またはアプタマー配列(例えば制御された安定性および/またはタンパク質およびタンパク質複合体による制御されたアクセス可能性を可能にするもの);ターミネーター配列;dsRNA二重鎖(すなわちヘアピン)を形成する配列;RNAを細胞内位置(例えば核、ミトコンドリア、葉緑体等)にターゲティングする修飾または配列;追跡を提供する修飾または配列(例えば蛍光分子への直接コンジュゲート化、蛍光検出を促進する部分へのコンジュゲート化、蛍光検出を可能にする配列等);タンパク質に対する結合部位を提供する修飾または配列(例えばDNAに作用するタンパク質、転写アクチベーター、転写リプレッサー、DNAメチルトランスフェラーゼ、DNA脱メチル化酵素、ヒストンアセチルトランスフェラーゼ、ヒストン脱アセチル化酵素等);増加した、減少した、および/または調節可能な安定性を提供する修飾または配列;ならびにその組み合わせが含まれる。
【0115】
3. Cas9タンパク質(野生型、ニッカーゼ、またはdCas9)
本発明のCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)は:i)対象のポリヌクレオチドのCas9結合配列と相互作用するRNA結合部分、およびii)Cas9タンパク質の同一性に応じて、野生型、減少したエンドヌクレアーゼ(例えばエンドデオキシリボヌクレアーゼ)活性を示すか、エンドヌクレアーゼ(例えばエンドデオキシリボヌクレアーゼ)活性を欠く、活性部分を含む。
【0116】
ポリヌクレオチドのCas9結合配列およびCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)は、DNAターゲティング配列およびターゲットポリヌクレオチド配列の間の配列相補性に基づいて、特定のターゲットポリヌクレオチド配列に結合する複合体を形成可能である。対象のポリヌクレオチドのDNAターゲティング配列は、ターゲットDNAのターゲットポリヌクレオチド配列に対する配列相補性を通じて、複合体へのターゲット特異性を提供する。ターゲットポリヌクレオチド配列が、ターゲット遺伝子の転写制御要素またはエピジェネティック修飾部位にあるかまたはこれに隣接している場合、複合体は、PBS結合PUFドメインに融合した転写制御因子またはエピジェネティック修飾を調節するエフェクターとともに、ターゲット遺伝子の転写またはエピジェネティック修飾を選択的に調節可能である。
【0117】
特定の態様において、修飾Cas9タンパク質は、減少したエンドヌクレアーゼ(例えばエンドデオキシリボヌクレアーゼ)活性を有するか、または該活性を欠く。例えば、本発明の方法で使用するのに適した修飾Cas9は、Cas9ニッカーゼであってもよいし、または野生型Cas9ポリペプチド、例えばWO2013/176772(本明細書に援用される)の
図3および配列番号8に示されるようなアミノ酸配列を含む野生型Cas9ポリペプチドのエンドヌクレアーゼ(例えばエンドデオキシリボヌクレアーゼ)活性の約20%未満、約15%未満、約10%未満、約5%未満、約1%未満、または約0.1%未満を示す。いくつかの態様において、dCas9は、実質的に、検出可能なエンドヌクレアーゼ(例えばエンドデオキシリボヌクレアーゼ)活性を持たない。いくつかの態様において、dCas9が減少した触媒活性を有する場合(例えばCas9タンパク質が、D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、および/またはA987突然変異、例えばD10A、G12A、G17A、E762A、H840A、N854A、N863A、H982A、H983A、A984A、および/またはD986Aを有する場合)、対象のポリヌクレオチドのCas9結合配列と相互作用する能力を保持する限り、対象のポリヌクレオチドのDNAターゲティング配列によって、ターゲットポリヌクレオチド配列になお導かれるため、ポリペプチドは、なお、部位特異的方式でターゲットDNAに結合可能である。
【0118】
いくつかの場合、適切なCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)は、WO2013/176772(本明細書に援用される)の
図3および配列番号8に示されるようなCas9/Csnlアミノ酸配列(化膿性連鎖球菌の)のアミノ酸7〜166または731〜1003に対して、あるいはWO2013/176772(本明細書に援用される)の配列番号1〜256および795〜1346のアミノ酸配列の任意の1つの対応する部分に対して、好ましくは、化膿性連鎖球菌、淋菌(N. meningitidis)、S.サーモフィルス(S. thermophilus)およびT.デンティコラ(T. denticola)(本明細書に援用されるEsveltら, Nature Methods, 10(11): 1116-1121, 2013を参照されたい)由来の直交性Cas9配列のアミノ酸配列の任意の1つの対応する部分に対して、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%または100%のアミノ酸配列同一性を有するアミノ酸配列を含む。
【0119】
いくつかの場合、Cas9ニッカーゼは、ターゲットDNAの相補鎖を切断可能であるが、ターゲットDNAの非相補鎖を切断する能力が減少している。例えば、Cas9ニッカーゼは、RuvCドメインの機能を減少させる突然変異(アミノ酸置換)を有しうる。限定されない例として、いくつかの場合、Cas9ニッカーゼは、WO 2013/176772の
図3に示されるアミノ酸配列のD10A(アスパラギン酸からアラニン)突然変異、またはWO 2013/176772の配列番号1〜256および795〜1346に示すアミノ酸配列のいずれかの対応する突然変異(こうした配列のすべては本明細書に援用される)である。
【0120】
いくつかの場合、Cas9ニッカーゼは、ターゲットDNAの非相補鎖を切断可能であるが、ターゲットDNAの相補鎖を切断する能力が減少している。例えば、Cas9ニッカーゼは、HNHドメイン(RuvC/HNH/RuvCドメインモチーフ)の機能を減少させる突然変異(アミノ酸置換)を有しうる。限定されない例として、いくつかの場合、Cas9ニッカーゼは、H840A(本明細書に援用されるWO 2013/176772の
図8のアミノ酸位840でのヒスチジンからアラニン)、またはWO 2013/176772の配列番号1〜256および795〜1346に示されるアミノ酸配列のいずれかの対応する突然変異(こうした配列のすべては本明細書に援用される)である。
【0121】
いくつかの場合、dCas9は、ターゲットDNAの相補鎖および非相補鎖の両方を切断する能力が減少している。限定されない例として、いくつかの場合、dCas9は、WO 2013/176772の
図3に示されるアミノ酸配列のD10AおよびH840A突然変異の両方、またはWO 2013/176772の配列番号1〜256および795〜1346に示されるアミノ酸配列のいずれかの対応する突然変異(こうした配列のすべては本明細書に援用される)を宿する。
【0122】
他の残基を突然変異させて、同じ効果を達成する(すなわち一方または他方のヌクレアーゼ部分を不活性化する)ことも可能である。限定されない例として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、および/またはA987(または配列番号1〜256および795〜1346として示されるタンパク質セットのいずれかの対応する突然変異)が改変される(すなわち置換される)ことも可能である(Cas9アミノ酸残基の変換に関するさらなる情報に関しては、WO 2013/176772の
図3、5、11Aおよび表1(すべて本明細書に援用される)を参照されたい)。また、アラニン置換以外の突然変異が適切である。
【0123】
いくつかの場合、Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)は、場合によって:i)Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質);およびb)PUFドメイン(以下)に融合した融合パートナーと同じであっても異なっていてもよい、共有結合した異種ポリペプチド(また「融合パートナー」とも称される)を含む、融合ポリペプチドである。
【0124】
4. PUFドメイン(および場合によるCas9)融合タンパク質
PUFタンパク質(ショウジョウバエ属(Drosophila)Pumilioおよび線虫(C. elegans)fern−3結合因子にちなんで名付けられた)は、mRNA安定性および翻訳を仲介する際に関与することが知られる。これらのタンパク質は、PUFドメインとして知られるユニークなRNA結合ドメインを含有する。RNA結合PUFドメイン、例えばヒトPumilio 1タンパク質(本明細書においてPUMとも称される)のものは、逆平行様式で、連続塩基に結合する8リピート(各リピートはPUFモチーフまたはPUFリピートと呼ばれる)を含有し、各リピートは一塩基を認識し、すなわちPUFリピートR1〜R8は、それぞれ、ヌクレオチドN8〜N1を認識する。例えば、PUMは8つのタンデムリピートで構成され、各リピートは、アルファらせんを構成する緊密にパッキングされたドメインにフォールディングする、34アミノ酸からなる。
【0125】
各PUFリピートは、各リピート中央から2つの保存されるアミノ酸を用いて、RNA認識配列内の1つの個々の塩基のエッジを特異的に認識し、そして第三のアミノ酸(Tyr、HisまたはArg)を用いて、隣接塩基間にスタッキングして、PUFドメインおよび8量体RNAの間に非常に特異的な結合を引き起こす。例えば、塩基Uを認識するコードは、アミノ酸配列「NYxxQ」であり、一方「(C/S)RxxQ」はAを認識し、そして「SNxxE」はGを認識する。これらのアミノ酸は、ヒトPumilio 1 PUFモチーフ中の12、13、および16位に対応する。各PUF α−α−αリピート中の12および16位の2つの認識アミノ酸側鎖は、対応する塩基のワトソン・クリック・エッジを認識し、そしてそのリピートの特異性を大部分決定する。
【0126】
したがって、PUFドメインの配列特異性は、RNA認識配列内の塩基認識に関与する、保存されたアミノ酸を変化させる(例えば部位特異的突然変異誘発によって)ことによって、正確に改変させることも可能である。各リピート中の2つのアミノ酸を変化させることによって、PUFドメインを修飾して、ほぼいかなる8nt RNA配列に結合するように修飾することも可能である。このユニークな結合様式は、PUFおよびその誘導体を、対象のポリヌクレオチド上の特定のPBSに任意のエフェクタードメインを運ぶ、PUFドメイン融合体の一部として、本発明で使用可能なプログラム可能RNA結合ドメインにする。
【0127】
本明細書において、「PUFドメイン」は、野生型または天然存在PUFドメイン、ならびに天然または現存PUFドメイン、例えば原型ヒトPumilio 1 PUFドメインに基づく/由来するPUF相同ドメインを指す。本発明のPUFドメインは、RNA配列(例えば8量体RNA配列)に特異的に結合し、ここで、PUFドメインおよびRNA配列間の全体の結合特異性は、PUFドメイン内の各PUFモチーフ/PUFリピートおよび対応する単一RNAヌクレオチドの間の配列特異的結合によって定義される。
【0128】
特定の態様において、PUFドメインは、8 PUFモチーフを含むか、または本質的に該モチーフからなり、各々は、1つのRNAヌクレオチド(例えばA、U、G、またはC)を特異的に認識し、そしてこれに結合する。
【0129】
本出願者は、65,536の8量体PBS、および特定のPBSに結合可能な対応するPUFドメイン配列(各々長さ約350アミノ酸)を生成した。本出願者はまた、所定の8量体PBSに結合する65,536の個々のPUFドメイン配列のいずれかを回収するパイソンスクリプトも生成した。
【0130】
特定の態様において、PUFドメインは、8より多いまたは少ないPUFモチーフ/リピートを有し、例えばPUFドメインは、5、6、7、8、9、10、11、12、13、14、15、16、またはそれより多いPUFリピート/モチーフを含むかまたは本質的にこれらからなり、PUFドメインが、5、6、7、8、9、10、11、12、13、14、15、16、またはそれより多いヌクレオチドのRNAに結合する限り、各々は、1つのRNAヌクレオチド(例えばA、U、G、またはC)を特異的に認識し、そしてこれに結合する。PUFモチーフの数を増加させるかまたは減少させることによって、認識されるRNAの長さは、対応して増加するかまたは減少するであろう。各PUFモチーフは1つのRNA塩基を認識するため、ドメインを1モチーフ減少させると、認識されるRNAの長さが1塩基減少し;一方、ドメインを1モチーフ増加させると、認識されるRNAの長さが1塩基増加する。任意の数のモチーフが存在可能である。したがって、こうした態様において、本発明のPUFドメイン融合体の特異性は、PUFドメインの長さの変化によって改変されうる。特定の態様において、元来のPUFモチーフのうち2つの間に、例えば第一のものの前に、第一のものおよび第二のものの間に、第二のものおよび第三のものの間に、第三のものおよび第四のものの間に、第四のものおよび第五のものの間に、第五のものおよび第六のものの間に、第六のものおよび第七のものの間に、第七のものおよび第八のものの間に、または第八のものの後に、さらなるPUFモチーフを挿入する。特定の態様において、上記挿入ポイントのいずれかの間に、1、2、3、4、5、6、7、8、またはそれより多くの挿入されたPUFモチーフがある。例えば、特定の態様において、第五および第六の元来のPUFモチーフの間に、1、2、3、4、5、6、7、8、またはそれより多くの挿入されたPUFモチーフがある。Filipovskaら(Nature Chemical Biology doi: 10.1038/NChemBio.577, オンライン公開:2011年5月11日)は、16のPUFモチーフを含む操作されたPUFドメインを報告し、これには、第五および第六の元来のPUFモチーフの間に挿入された8つのさらなるPUFモチーフが含まれた。
【0131】
特定の態様において、PUFドメインは、異なるタンパク質由来の異なるPUFドメイン由来のPUFモチーフを含む。例えば、本発明のPUFドメインは、ヒトPumilio 1タンパク質由来のPUFモチーフ、および1またはそれより多い他のPUFタンパク質、例えばPuDpまたはFBFに由来する1またはそれより多い他のPUFで構築されてもよい。PUFドメインのRNA結合ポケットは、天然のへこんだ屈曲を有する。異なるPUFタンパク質は異なる屈曲を有することも可能であるため、PUFドメイン中の異なるPUFモチーフを用いて、PUFドメインの屈曲を改変することも可能である。より平らな屈曲は、より多くのRNA塩基の認識を可能にしうるため、屈曲の改変は、PUFドメインの特異性および/または結合アフィニティを改変するための別の方法である。
【0132】
本発明の範囲にやはり含まれるのは、対象のPUFドメインまたはその融合体の機能的変異体である。用語「機能的変異体」は、本明細書において、親PUFドメインに対する実質的なまたは有意な配列同一性または類似性を有するPUFドメインを指し、この機能的変異体は、これが変異体であるPUFドメインの生物学的活性を保持する、例えばターゲットRNAを認識する能力を、結合アフィニティに関して、親PUFドメインと、類似の度合い、同じ度合い、またはより高い度合いまで、そして/または実質的に同じまたは同一の結合特異性で、保持するものである。機能的変異体PUFドメインは、例えば、親PUFドメインに対して、アミノ酸配列において、少なくとも約30%、50%、75%、80%、90%、98%またはそれより高く同一であることも可能である。機能的変異体は、例えば、少なくとも1つの保存的アミノ酸置換、例えばPUFドメインの足場(すなわちRNAと相互作用しないアミノ酸)における保存的アミノ酸置換を含み、親PUFドメインのアミノ酸配列を含む。あるいはまたはさらに、機能的変異体は、少なくとも1つの非保存的アミノ酸置換を含み、親PUFドメインのアミノ酸配列を含むことも可能である。この場合、非保存的アミノ酸置換は、機能的変異体の生物学的活性に干渉しないかまたはこれを阻害しないことが好ましい。非保存的アミノ酸置換は、機能的変異体の生物学的活性が親PUFドメインに比較した際に増加するように、機能的変異体の生物学的活性を増進させてもよいし、または、PUFドメインの安定性を望ましいレベルに(例えば足場中のアミノ酸の置換により)改変してもよい。PUFドメインは、他の構成要素、例えば他のアミノ酸が機能的変異体の生物学的活性を実質的に改変しないように、特定のアミノ酸配列または本明細書記載の配列から本質的になることも可能である。
【0133】
特定の態様において、PUFドメインは、Pumilio相同ドメイン(PU−HUD)である。特定の態様において、PU−HUDはヒトPumilio 1ドメインである。ヒトPUMの配列は、当該技術分野に知られ、そして以下に再現される:
【0135】
野生型ヒトPUMは、Nonas反応要素(NRE)RNAに特異的に結合し、コア8nt配列5’−UGUAUAUA−3’を所持する。
特定の態様において、本発明のPUFドメインは、Pum−HDドメインを含む任意のPUFタンパク質ファミリーメンバーである。PUFファミリーメンバーの限定されない例には、線虫におけるFBF、ショウジョウバエ属におけるDs pum、およびシロイヌナズナ属(Arabidopsis)およびイネ(rice)などの植物におけるPUFタンパク質が含まれる。シロイヌナズナ属、イネおよび他の植物、ならびに非植物種のPUM−HDの系統樹が、Tamら(その全内容が本明細書に援用される、「植物におけるRNA結合タンパク質のPufファミリー:系統樹、構造モデリング、活性および細胞内局在」BMC Plant Biol. 10:44, 2010)に提供される。
【0136】
PUFファミリーメンバーは、酵母からヒトまで非常に保存されており、そしてファミリーのすべてのメンバーが、予測可能なコードで、配列特異的方式で、RNAに結合する。該ドメインの寄託番号は、Prositeデータベース(スイス・バイオインフォマティクス研究所)において、PS50302であり、そしてこのファミリーのメンバーのいくつかの配列整列は、WO 2011−160052 A2の
図5および6に示される(それぞれ、ヒト、マウス、ラットPumilio 1(hpum1、Mpum1、Ratpum1)ならびにヒトおよびマウスPumilio 2(hpum2、Mpum2)のClustalW多数配列整列)。
【0137】
ショウジョウバエ属Pumilio(PumDr)は、他の哺乳動物Pumilio 1相同体と長さが非常に異なり、したがって、C末端PUF HUDドメインのみが、WO 2011/160052A2の
図6において、ヒトPUM1およびPUM2との配列整列中に示される。ヒトおよびハエPumタンパク質のN末端部分は、弱い相同性(40%類似性)を示し、そしてサイズおよびタンパク質配列が有意に異なる。C末端部分は、非常に高い度合いの相同性および進化的保存(PUM1に関して78%同一性、86%類似性、そしてPUM2に関して79%同一性、88%類似性)、非常に保存されたタンパク質配列およびPum RNA結合ドメインの構造とともに示す。3つのタンパク質すべてにおいて、PUM−HDは、20アミノ酸のN末端保存部分、各36アミノ酸の8つのPumリピート、およびC末端保存領域で構成される。ヒトPumilioタンパク質において、C保存部分は、長さ44アミノ酸である一方、ショウジョウバエ属のタンパク質は、C保存領域中にさらなる85アミノ酸の挿入物を有する。ヌクレオチドおよびアミノ酸配列は、寄託番号AF315592(PUM1)およびAF315591(PUM2)の下に、DDBJ/EMBL/GENBANK(登録商標)データベース中に見出されうる(刊行物および配列の各々の全内容が本明細書に援用される、Spassov & Jurecic,「RNA結合タンパク質のPumilioファミリーのヒトメンバー、PUM1およびPUM2遺伝子のクローニングおよび比較配列分析」 Gene, 299:195-204, 2002年10月)。
【0138】
さらに、すべての整列配列、すなわちWO 2011/160052A2の配列番号55〜60は本明細書に援用される。
いくつかの態様において、本発明のPUFドメインは、8つの36量体で作製されてもよく、ここで、アミノ酸の33が保存され、そして34番目、35番目、および36番目のアミノ酸は多様である可能性もあり、RNA配列中の特定の塩基に対する特異性を分け与える。特定の態様において、RNA結合ドメインは、長さ約300(例えば310、309、308、307、306、305、304、303、302、301、300、299、298、297、296、295、294、293、292、291、290等)アミノ酸である。いくつかの態様において、本発明のPUFドメインは、約8ヌクレオチドの特定のRNA配列(例えば8〜16の連続RNA塩基)に結合するよう設計されている。特定の態様において、8nt配列の5番目のヌクレオチドは、UまたはCであり、一方、他の7ヌクレオチドは多様であってもよい。
【0139】
いくつかの態様において、PUFドメインは、野生型PUFドメインから修飾されて、非修飾(すなわち野生型)RNA結合PUFドメインが結合するRNA配列とは異なるRNA配列に結合する。RNA配列は、約8量体(例えば8量体、9量体、10量体、11量体、12量体、13量体、14量体、15量体、16量体等)であってもよい。RNA結合ドメインのアミノ酸配列に、ターゲットRNA配列に対する特異性を改変する修飾を導入する能力は、RNA結合ドメイン(例えばPUFタンパク質)の異なるアミノ酸側鎖との塩基の既知の相互作用に基づく。PUFドメインのRNA認識コードを以下に示し、これは一般的に以下のように書くことが可能である:
G(グアニン)に対して、SerXXXGlu、例えばSNxxE;
A(アデニン)に対して、CysXXXGln、例えばCysArgXXGlnまたはSerArgXXGln(すなわち(C/S)RxxQ);
U(ウラシル)に対して、AsnXXXGln、例えばNYxxQ、および
C(シトシン)に対して、SnXXXArg、例えばSerTyrXXArg。
式中、Xは任意のアミノ酸であり、そしてSnは、小分子または求核性残基、例えばGly、Ala、Ser、Thr、またはCysに相当する。
【0140】
上記指針に基づき、少なくとも1つのPUFドメインを、任意の所定の8量体配列に基づいて構築してもよい。特に、5’−N
1N
2N
3N
4N
5N
6N
7N
8−3’の8量体RNA配列に結合するPUFドメインは、以下の配列式を有してもよく、式中、R1〜R8は各々、N
1〜N
8位のいずれかでのリボヌクレオチド(すなわちA、U、CまたはG)の特定の同一性に応じて、以下の表に列挙するPUFモチーフペプチド配列を示す。R1がN
8に結合し、R2がN
7に結合する等であることに注目されたい。
【0150】
上記RNA認識コードに基づいて構築された、修飾RNA結合特異性を持ついくつかの例示的なPUFドメインを以下に提供し、各々は、本発明のPUFドメイン融合体を構築するために使用可能である。
【0152】
PUF(3−2)は、PUFリピート3中に2つの点突然変異(C935S/Q939E)を有し、そしてNREの6位に突然変異を含む同族RNA(A6G;5’−UGUAU
GUA−3’)を認識する。
【0154】
PUF(6−2/7−2)は、それぞれリピート6および7中に二重点突然変異(N1043S/Q1047EおよびS1079N/E1083Q)を有し、そしてNREの2位および3位に2つの突然変異を含む同族RNA配列(GU/UG;5’−U
UGAUAUA−3’)を認識する。
【0155】
関連するPUF(6−2)は、リピート6中に点突然変異(N1043S/Q1047E)を有し、そしてNREの3位に突然変異を含む同族RNA配列(5’−UG
GAUAUA−3’)を認識する。
【0156】
別の関連するPUF(7−2)は、リピート7中に点突然変異(S1079N/E1083Q)を有し、そしてNREの2位に突然変異を含む同族RNA配列(5’−U
UUAUAUA−3’)を認識する。
【0158】
PUFドメインPUF
531は、野生型PUFリピート1、3および5中に突然変異(Q867E/Q939E/C935S/Q1011E/C1007S)を有し、そして配列5’−UGU
GU
GU
G−3’を認識する。PUF
531は、野生型PUF RNAに比較して、非常に高いアフィニティでその新規ターゲット配列を認識可能である。
【0159】
別の修飾PUFドメインPUF(1−1)は、PUFリピート1中に1つの点突然変異(Q867E)を有し、そしてNREの8位に突然変異を含む同族RNA(A8G;5’−UGUAUAU
G−3’)を認識する。
【0160】
さらに別の修飾PUFドメインPUF(7−1)は、PUFリピート7中に1つの点突然変異(E1083Q)を有し、そしてNREの2位に突然変異を含む同族RNA(G2U;5’−U
UUAUAUA−3’;またはG2A;5’−U
AUAUAUA−3’)を認識する。
【0161】
さらに別の修飾PUFドメインPUF(3−1)は、PUFリピート3中に1つの点突然変異(C935N)を有し、そしてNREの6位に突然変異を含む同族RNA(A6U;5’−UGUAU
UUA−3’)を認識する。
【0162】
さらなる修飾PUF(7−2/3−1)は、リピート7および3中に点突然変異(C935N/S1079N/E1083Q)を有し、そしてNREの2位および6位に突然変異を含む同族RNA配列(5’−U
UUAU
UUA−3’)を認識する。
【0163】
特定の修飾PUFドメインの配列を以下に示す。
【0167】
本発明にしたがって、異種ポリペプチド(「融合パートナー」とも称される)を、対象のポリヌクレオチド上のPBSの少なくとも1つに結合する、本発明のPUFドメインに融合させてもよい。さらに、望ましい場合、同じまたは異なる融合パートナーをまた、場合によってCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)に融合させてもよい。したがって、本明細書に記載するように、特に否定しない限り、任意の融合パートナーがPUFドメインに融合するよう意図され、そして場合によってまた、Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)に融合するよう意図される。PUFドメインに融合する融合パートナーは、Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)に融合する場合による融合パートナーと同じであってもまたは異なってもよい(以下)。
【0168】
融合パートナーは、活性(例えば酵素活性)を示してもよい。適切な融合パートナーには、限定されるわけではないが、メチルトランスフェラーゼ活性、脱メチル化酵素活性、アセチルトランスフェラーゼ活性、脱アセチル化酵素活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、または脱ミリストイル化活性が含まれ、これらのいずれもDNAの直接修飾に向けられる(例えばDNAのメチル化)ことも可能であるし、またはDNA会合ポリペプチド(例えばヒストンまたはDNA結合タンパク質)の修飾に向けられることも可能である。
【0172】
さらなる融合パートナーには、多様な蛍光タンパク質、ポリペプチド、変異体、またはその機能性ドメイン、例えばGFP、スーパーフォルダーGFP、EGFP、BFP、EBFP、EBFP2、Azurite、mKalama1、CFP、ECFP、セルリアン、CyPet、mTurquoise2、YFP、シトリン、ヴェヌス、Ypet、BFPms1、roGFP、およびビリルビン誘導性蛍光タンパク質、例えばUnaG、dsレッド、eqFP611、Dronpa、TagRFP、KFP、EosFP、Dendra、IrisFP等が含まれてもよい。
【0173】
さらなる適切な融合パートナーには、限定されるわけではないが、境界要素(例えばCTCF)、末梢補充を提供するタンパク質およびその断片(例えばラミンA、ラミンB等)、ならびにタンパク質ドッキング要素(例えばFKBP/FRB、Pill/Abyl等)が含まれる。
【0174】
転写の増加または減少を達成する融合パートナーのさらなる限定されない例を、以下に列挙し、そしてこれには、転写アクチベーターおよび転写リプレッサードメイン(例えばKruppel会合ボックス(KRABまたはSKD);Mad mSIN3相互作用ドメイン(SID);ERFリプレッサードメイン(ERD)等)が含まれる。
【0175】
いくつかの態様において、異種配列をPUFドメインまたはCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)のC末端に融合させてもよい。いくつかの態様において、異種配列をPUFドメインまたはCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)のN末端に融合させてもよい。いくつかの態様において、異種配列をPUFドメインまたはCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)の内部部分(すなわちNまたはC末端以外の部分)に融合させてもよい。
【0176】
いくつかの態様において、PUFドメイン融合体は、PUFドメインと、細胞内局在を提供する異種配列を融合させることによって生成される(すなわち異種配列は細胞内局在化配列、例えば核にターゲティングするための核局在化シグナル(NLS、例えばPPKKKRKV);ミトコンドリアにターゲティングするためのミトコンドリア局在化シグナル;葉緑体にターゲティングするための葉緑体局在化シグナル;ER保持シグナル等である)。いくつかの態様において、異種配列は、追跡および/または精製を容易にするためのタグ(例えば蛍光タンパク質、例えば緑色蛍光タンパク質(GFP)、YFP、RFP、CFP、mCherry、tdTomato等;ヒスチジンタグ、例えば6xHisタグ;赤血球凝集素(HA)タグ;FLAGタグ;Mycタグ等)である(すなわち異種配列は検出可能標識である)。いくつかの態様において、異種配列は、安定性増加または減少を提供しうる(すなわち、異種配列は、安定性調節ペプチド、例えばいくつかの場合調節可能であるデグロン(例えば温度感受性または薬剤調節可能デグロン配列、以下を参照されたい)である)。いくつかの態様において、異種配列は、ターゲットDNAの増加したまたは減少した転写を提供可能である(すなわち異種配列は、転写調節配列、例えば転写因子/アクチベーターまたはその断片、転写因子/アクチベーターを補充するタンパク質またはその断片、転写リプレッサーまたはその断片、転写リプレッサーを補充するタンパク質またはその断片、小分子/薬剤反応性転写制御因子等である)。いくつかの態様において、異種配列は、結合ドメインを提供可能である(すなわち異種配列は、例えばキメラPUFドメインまたはCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)が関心対象の別のタンパク質、例えばDNAまたはヒストン修飾タンパク質、転写因子または転写リプレッサー、補充タンパク質等に結合する能力を提供するタンパク質結合配列である)。
【0177】
増加したまたは減少した安定性を提供する適切な融合パートナーには、限定されるわけではないが、デグロン配列が含まれる。デグロンは、一般の当業者には、それらがその一部であるタンパク質の安定性を調節するアミノ酸配列であることが容易に理解される。例えば、デグロン配列を含むタンパク質の安定性は、少なくとも部分的に,デグロン配列によって調節される。いくつかの場合、適切なデグロンは、デグロンが、実験調節とは独立にタンパク質安定性に影響を発揮するように、恒常的である(すなわち、デグロンは薬剤誘導性、温度誘導性等ではない)。いくつかの場合、PUFドメインまたはCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)が、望ましい条件に応じて、「オン」(すなわち安定)または「オフ」(すなわち不安定、分解される)になるょうに、デグロンは、PUFドメインまたはCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)に調節可能安定性を提供する。例えば、デグロンが温度感受性デグロンである場合、PUFドメインまたはCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)は、閾値温度(例えば42℃、41℃、40℃、39℃、38℃、37℃、36℃、35℃、34℃、33℃、32℃、31℃、30℃等)未満で機能性(すなわち「オン」、安定性)であることが可能であるが、閾値温度より高いと非機能性(すなわち「オフ」、分解される)になる。別の例として、デグロンが薬剤誘導性デグロンである場合、薬剤の存在または非存在が、タンパク質を、「オフ」(すなわち不安定)状態から「オン」(すなわち安定)状態にスイッチするかまたはその逆を行うことも可能である。例示的な薬剤誘導性デグロンは、FKBP12タンパク質に由来する。デグロンの安定性は、デグロンに結合する小分子の存在または非存在によって調節される。
【0178】
適切なデグロンの例には、限定されるわけではないが、Shield−1、DHFR、オーキシン、および/または温度によって調節されるデグロンが含まれる。適切なデグロンの限定されない例が当該技術分野に知られる(例えばDohmenら, Science, 263(5151): 1273-1276, 1994:「熱誘導性デグロン:温度感受性突然変異体を構築するための方法」; Schoeberら, Am. J. Physiol. Renal. Physiol., 296(l):F204-211, 2009:「Shield−1を用いた、多量体TRPV5チャネルの条件付迅速発現および機能」; Chuら, Bioorg. Med. Chem. Lett., 18(22): 5941-4, 2008:「FKBP由来脱安定化ドメインを用いた、最近の進歩」; Kanemaki, Pflugers Arch., 2012:「条件付デグロンを用いたタンパク質発現調節のフロンティア」; Yangら, Mol. Cell., 48(4):487-8, 2012:「破壊のための装飾(titivated):メチルデグロン」; Barbourら, Biosci. Rep., 33(1), 2013:「チミジル酸シンターゼのユビキチン独立分解を制御する二分デグロンの性質決定」;およびGreussingら, J. Vis. Exp., (69), 2012:「デグロン(dgn)脱安定化緑色蛍光タンパク質(GFP)に基づくレポータータンパク質を用いた生存細胞におけるユビキチンプロテアソーム活性の監視」;すべて、その全体が本明細書に援用される)。
【0179】
典型的なデグロン配列は、細胞および動物の両方において、よく特徴付けられ、そして試験されてきている。したがって、Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)のデグロン配列への融合は、「調節可能」でそして「誘導可能な」PUFドメインまたはCas9(例えば野生型、ニッカーゼ、またはdCas9タンパク質)を生じる。
【0180】
本明細書に記載する融合パートナーはいずれも、任意の望ましい組み合わせで使用可能である。例示するための1つの限定されない例として、各PUFドメインは、独立に、同じまたは異なる融合パートナーに融合可能であり、そしてこれらは、任意の順序で、対象のポリヌクレオチドの一連のPBSに結合可能である。例えば、1つのPUFドメインが検出のためのYFP配列に融合し、第二のPUFドメインが安定性のためのデグロン配列に融合し、そして第三のPUFドメインがターゲットDNAの転写を増加させる転写アクチベーター配列に融合してもよい。これらのタイプのPUFドメイン融合体のいずれも、対象のポリヌクレオチド上の1より多い結合部位またはPBSを、任意の望ましい順序で有してもよい。PUFドメイン融合体で使用可能な融合パートナーの数は、大部分無制限である(例えば少なくとも2、5、10、20、30、40、50またはそれより多い)。
【0181】
いくつかの態様において、任意のPUFドメインまたはCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)融合タンパク質は、1またはそれより多い(例えば2またはそれより多い、3またはそれより多い、4またはそれより多い、あるいは5またはそれより多い)異種配列または融合パートナーを含んでもよい。
【0182】
いくつかの態様において、対象のCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)またはPUFドメイン融合体は、コドン最適化されていてもよい。このタイプの最適化は当該技術分野に知られ、そして同じタンパク質をコードしながら、意図される宿主生物または細胞のコドン優先性を模倣する、外来由来DNAの突然変異を含む。したがって、コドンは変化するが、コードされるタンパク質は不変のままである。例えば、意図されるターゲット細胞がヒト細胞である場合、ヒトコドン最適化PUFドメインまたはCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)融合体が、より適したPUFドメインまたはCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)融合体であろう。別の限定されない例として、意図される宿主細胞がマウス細胞である場合、マウスコドン最適化PUFドメイン融合体またはCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)が、適切なPUFドメイン融合体またはCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)であろう。コドン最適化は必要ではないが、許容可能であり、そして特定の場合には好ましい可能性もある。
【0183】
任意の対象のPUFドメインを、例えば、Addgene(キット#1000000051)で入手可能なGolden Gate組み立てキット(Abilら, Journal of Biological Engineering 8:7, 2014を参照されたい)を用いて作製可能である。
【0184】
5.転写調節
本発明のPUFドメインおよび/またはCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)融合タンパク質を、対象のポリヌクレオチドのDNAターゲティング配列によって、ターゲットDNA中の特定の位置(すなわちターゲットポリヌクレオチド配列)にターゲティングし、そして遺伝子座特異的制御、例えばプロモーターへのRNAポリメラーゼ結合のブロッキング(これは選択的に転写アクチベーター機能を阻害する)、および/または局所クロマチン状態の修飾(例えばターゲットDNAを修飾するかまたはターゲットDNAと会合するポリペプチドを修飾する融合配列を用いる場合)を実行する。いくつかの場合、変化は一過性である(例えば転写抑制または活性化)。いくつかの場合、変化は遺伝性である(例えばターゲットDNAまたはターゲットDNAと会合するタンパク質、例えばヌクレオソームヒストンにエピジェネティック修飾を行う場合)。
【0185】
対象のPUFドメインまたはCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)融合タンパク質を用いる方法の生物学的効果を、任意の好適な方法(例えば遺伝子発現アッセイ;クロマチンに基づくアッセイ、例えばクロマチン免疫沈降(ChiP)、クロマチンin vivoアッセイ(CiA)等)によって検出可能である。
【0186】
いくつかの場合、対象の方法は、2またはそれより多い異なるDNAターゲティング配列の使用を伴う。例えば、2つの異なるDNAターゲティング配列を単一の宿主細胞において用いてもよく、ここで、2つの異なるDNAターゲティング配列は、同じターゲット核酸における2つの異なるターゲットポリヌクレオチド配列をターゲティングする。したがって、例えば、対象の転写調節法は、宿主細胞内に、第二のDNAターゲティング配列、または第二のDNAターゲティング配列をコードするヌクレオチド配列を含む核酸を導入する工程をさらに含んでもよい。いくつかの場合、同じターゲット核酸中の2つの異なるターゲティング配列をターゲティングする2つの異なるDNAターゲティング配列の使用は、ターゲット核酸の転写における調節(例えば減少または増加)の増加を提供する。
【0187】
別の例として、2つの異なるDNAターゲティング配列を単一の宿主細胞で用いてもよく、ここで2つの異なるDNAターゲティング配列は、2つの異なるターゲット核酸をターゲティングする。
【0188】
したがって、特定の態様において、本発明の転写調節法は、宿主細胞において、ターゲット核酸の選択的調節(例えば減少または増加)を提供する。例えば、ターゲット核酸の転写の「選択的」減少は、ターゲット核酸の転写を、DNAターゲティング配列/修飾Cas9ポリペプチド/PUFドメイン融合複合体の非存在下でのターゲット核酸の転写レベルに比較して、少なくとも約10%、少なくとも約20%、少なくとも約30%、少なくとも約40%、少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、または90%より多く減少させる。ターゲット核酸の転写の選択的減少は、ターゲット核酸の転写を減少させるが、非ターゲット核酸の転写を実質的に減少させず、例えば非ターゲット核酸の転写は、あるとしても、DNAターゲティング配列/修飾Cas9ポリペプチド/PUFドメイン融合複合体の非存在下での非ターゲット核酸の転写レベルに比較して、10%未満しか減少させない。
【0189】
一方で、ターゲットDNAの転写の「選択的」増加は、ターゲットDNAの転写を、DNAターゲティング配列/修飾Cas9ポリペプチド/PUFドメイン融合複合体の非存在下でのターゲットDNAの転写レベルに比較して、少なくとも約1.1倍(例えば少なくとも約1.2倍、少なくとも約1.3倍、少なくとも約1.4倍、少なくとも約1.5倍、少なくとも約1.6倍、少なくとも約1.7倍、少なくとも約1.8倍、少なくとも約1.9倍、少なくとも約2倍、少なくとも約2.5倍、少なくとも約3倍、少なくとも約3.5倍、少なくとも約4倍、少なくとも約4.5倍、少なくとも約5倍、少なくとも約6倍、少なくとも約7倍、少なくとも8倍、少なくとも約9倍、少なくとも約10倍、少なくとも約12倍、少なくとも約15倍、または少なくとも約20倍)増加させる。ターゲットDNAの転写の選択的増加は、ターゲットDNAの転写を増加させるが、非ターゲットDNAの転写を実質的に増加させず、例えば非ターゲットDNAの転写は、あるとしても、DNAターゲティング配列/修飾Cas9ポリペプチド/PUFドメイン融合複合体の非存在下での非ターゲットDNAの転写レベルに比較して、約5倍未満(例えば約4倍未満、約3倍未満、約2倍未満、約1.8倍未満、約1.6倍未満、約1.4倍未満、約1.2倍未満、または約1.1倍未満)しか増加させない。
【0190】
限定されない例として、増加した転写は、dCas9を異種配列に融合させることによって、そして/または対象のポリヌクレオチドのPBSに結合するPUFドメインの1つに異種配列を融合させることによって、達成可能である。適切な融合パートナーには、限定されるわけではないが、ターゲットDNAに、またはターゲットDNAと会合するポリペプチド(例えばヒストンまたは他のDNA結合タンパク質)に直接作用することによって、転写を間接的に増加させる活性を提供するポリペプチドが含まれる。適切な融合パートナーには、限定されるわけではないが、メチルトランスフェラーゼ活性、脱メチル化酵素活性、アセチルトランスフェラーゼ活性、脱アセチル化酵素活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、または脱ミリストイル化活性を提供するポリペプチドが含まれる。
【0191】
さらなる適切な融合パートナーには、限定されるわけではないが、ターゲット核酸の転写増加を直接提供するポリペプチド(例えば転写アクチベーターまたはその断片、転写アクチベーターを補充するタンパク質またはその断片、小分子/薬剤反応性転写制御因子等)が含まれる。「PUFドメイン(および場合によるdCas9)融合タンパク質」と題するセクションを参照されたい。
【0192】
原核生物において、転写を増加させるdCas9融合タンパク質および/またはPUFドメイン融合タンパク質を用いた対象の方法の限定されない例には、細菌1ハイブリッド(B1H)または2ハイブリッド(B2H)系の修飾が含まれる。B1H系において、DNA結合ドメイン(BD)を細菌転写活性化ドメイン(AD、例えば大腸菌RNAポリメラーゼのアルファサブユニット(RNAPα))に融合させる。したがって、対象のdCas9またはPUFドメインを、ADを含む異種配列に融合させてもよい。対象のdCas9またはPUFドメイン融合タンパク質が、プロモーターの上流領域(DNAターゲティング配列によってそこにターゲティングされる)に到着すると、dCas9またはPUFドメイン融合タンパク質のAD(例えばRNAPα)が、RNAPホロ酵素を補充して、転写活性化を導く。B2H系では、BDは、ADに直接融合せず;その代わり、その相互作用は、タンパク質間相互作用(例えばGAL11P−GAL4相互作用)によって仲介される。対象の方法で使用するために、こうした系を修飾するため、dCas9またはPUFドメインを、タンパク質間相互作用を提供する第一のタンパク質配列(例えば酵母GAL11Pおよび/またはGAL4タンパク質)に融合させ、そしてRNAPαを、タンパク質間相互作用を完了させる第二のタンパク質配列に融合させてもよい(例えばGAL11PをdCas9またはPUFドメインに融合させる場合はGAL4、GAL4をdCas9またはPUFドメインに融合させる場合はGAL11P等)。GP11PおよびGAL4の間の結合アフィニティは、結合の効率および転写速度を増加させる。
【0193】
dCas9および/またはPUFドメイン融合タンパク質を用いて、真核生物において転写を増加させる、対象の方法の限定されない例には、dCas9および/またはPUFドメインの活性化ドメイン(AD)(例えばGAL4、ヘルペスウイルス活性化タンパク質VP16またはVP64、ヒト核因子NF−κB p65サブユニット等)への融合が含まれる。系を誘導性にするため、dCas9/PUFドメイン融合タンパク質の発現は、誘導性プロモーター(例えばTet−ON、Tet−OFF等)によって調節されてもよい。DNAターゲティング配列が既知の転写反応要素(例えばプロモーター、エンハンサー等)、既知の上流活性化配列(UAS)、ターゲットDNAの発現を調節可能であると推測される未知のまたは既知の機能の配列等をターゲティングするように設計することも可能である。
【0194】
いくつかの態様において、多数の対象のポリヌクレオチドを同時に同じ細胞において用いて、同じターゲットDNAまたは異なるターゲットDNA上の異なる位置で転写を同時に調節する。いくつかの態様において、2またはそれより多い対象のポリヌクレオチドは、同じ遺伝子または転写物または遺伝子座をターゲティングする。いくつかの態様において、2またはそれより多い対象のポリヌクレオチドは、異なる関連しない遺伝子座をターゲティングする。いくつかの態様において、2またはそれより多い対象のポリヌクレオチドは、異なるが関連する遺伝子座をターゲティングする。
【0195】
対象のポリヌクレオチドが小さく、そしてロバストであるため、これらは、同じ発現ベクター上に同時に存在可能であり、そして望ましい場合には、同じ転写調節下にあることさえ可能である。いくつかの態様において、2またはそれより多い(例えば3またはそれより多い、4またはそれより多い、5またはそれより多い、10またはそれより多い、15またはそれより多い、20またはそれより多い、25またはそれより多い、30またはそれより多い、35またはそれより多い、40またはそれより多い、45またはそれより多い、あるいは50またはそれより多い)対象のポリヌクレオチドが、ターゲット細胞において、同じまたは異なるベクターから、同時に発現される。発現される対象のポリヌクレオチドは、異なる細菌、例えば化膿性連鎖球菌、S.サーモフィルス、L.イノキュア(L. innocua)、および淋菌からの直交性dCas9タンパク質によって異なって認識されうる。
【0196】
多数の対象のポリヌクレオチドを発現させるため、Csy4エンドリボヌクレアーゼによって仲介される人工的RNAプロセシング系を用いてもよい。多数の対象のポリヌクレオチドを、前駆体転写物上のタンデムアレイに連鎖状にし(例えばU6プロモーターから発現させ)、そしてCsy4特異的RNA配列によって分離することも可能である。同時発現Csy4タンパク質が前駆体転写物を多数の対象のポリヌクレオチドに切断する。RNAプロセシング系を用いる利点には、以下が含まれる:まず、多数のプロモーターまたはベクターを用いる必要がなく;次に、すべての対象のポリヌクレオチドが前駆体転写物からプロセシングされるため、これらの濃度が、類似の野生型Cas9/Cas9ニッカーゼ/dCas9結合に関して規準化される。
【0197】
Csy4は、細菌、緑膿菌(Pseudomonas aeruginosa)に由来する小分子エンドリボヌクレアーゼ(RNアーゼ)タンパク質である。Csy4は、最小17bp RNAヘアピンを特異的に認識し、そして迅速で(<1分間)、そして非常に効率的な(>99.9)RNA切断を示す。大部分のRNアーゼとは異なり、切断されたRNA断片は、安定であり、そして機能的に活性であるままである。Csy4に基づくRNA切断は、人工的RNAプロセシング系に流用することも可能である。この系では、17bpのRNAヘアピンを、単一プロモーターから前駆体転写物として転写される多数のRNA断片の間に挿入する。Csy4の同時発現は、個々のRNA断片を生成する際に有効である。
【0198】
6.宿主細胞
転写を調節する本発明の方法を使用して、in vivoおよび/またはex vivoおよび/またはin vitroで、有糸分裂または有糸分裂後の細胞において、転写調節を誘導することも可能である。対象のポリヌクレオチドは、ターゲットDNAのターゲットポリヌクレオチド配列にハイブリダイズすることによって特異性を提供するため、有糸分裂および/または有糸分裂後の細胞は、多様な宿主細胞のいずれであってもよく、ここで、適切な宿主細胞には、限定されるわけではないが、細菌細胞;古細菌細胞;単細胞真核生物;植物細胞;藻類細胞、例えばボトリオコッカス・ブラウニー(Botryococcus braunii)、クラミドモナス・レインハーディ(Chlamydomonas reinhardtii)、ナノクロロプシス・ガディタナ(Nannochloropsis gaditana)、クロレラ・ピレノイドーサ(Chlorella pyrenoidosa)、サルガッスム・パテンス(Sargassum patens)、C.アガーディ(C. agardh)等;真菌細胞;動物細胞;無脊椎動物(例えば昆虫、刺胞動物、棘皮動物、線虫等)由来の細胞;真核寄生虫(例えばマラリア寄生虫、例えば熱帯熱マラリア原虫(Plasmodium falciparum);蠕虫等);脊椎動物(例えば魚類、両生類、爬虫類、鳥類、哺乳類)由来の細胞;哺乳動物細胞、例えば齧歯類細胞、ヒト細胞、非ヒト霊長類細胞等が含まれる。適切な宿主細胞には、天然存在細胞;遺伝子修飾細胞(例えば実験室において、例えば「人の手」によって遺伝的に修飾された細胞);および何らかの方法でin vitroで操作された細胞が含まれる。いくつかの場合、宿主細胞は単離されているかまたは培養されている。
【0199】
任意のタイプの細胞が関心対象でありうる(例えば幹細胞、例えば胚性幹(ES)細胞、人工多能性幹(iPS)細胞、生殖系列細胞;体細胞、例えば線維芽細胞、造血細胞、ニューロン、筋肉細胞、骨細胞、肝細胞、膵臓細胞;任意の段階の胚のin vitroまたはin vivo胚性細胞、例えば1細胞、2細胞、4細胞、8細胞等の段階のゼブラフィッシュ胚等)。細胞は、樹立された細胞株由来であってもよいし、またはこれらは初代細胞であってもよく、ここで「初代細胞」、「初代細胞株」、および「初代培養」は、本明細書において交換可能に用いられ、被験体から得られ、そして培養の限定された数の継代、すなわちスプリットに渡って、in vitroで増殖を可能にした、細胞および細胞培養を指す。例えば、初代培養には、0回、1回、2回、4回、5回、10回、または15回継代されていてもよいが、危機段階を経るほどの回数は継代されていない培養が含まれる。初代細胞株は、in vitroで10回未満の継代で維持可能である。ターゲット細胞は、多くの態様において、単細胞生物であるか、または培養中で増殖されている。
【0200】
細胞が初代細胞である場合、こうした細胞は、任意の好適な方法によって、個体から採取されていてもよい。例えば、白血球は、アフェレーシス、白血球アフェレーシス、密度勾配分離等によって好適に採取される一方、組織、例えば皮膚、筋肉、骨髄、脾臓、肝臓、膵臓、肺、腸、胃等由来の細胞は、最も好適には生検によって採取される。採取した細胞の分散または懸濁には、適切な溶液を用いてもよい。こうした溶液は、一般的に、ウシ胎児血清または他の天然存在因子を、低濃度、例えば5〜25mMの許容されうる緩衝液と組み合わせて、好適に補充した、平衡塩溶液、例えば正常生理食塩水、リン酸緩衝生理食塩水(PBS)、ハンクス平衡塩溶液等であろう。好適な緩衝液には、HEPES、リン酸緩衝液、乳酸緩衝液等が含まれる。細胞を直ちに用いてもよいし、またはこれらを長期間凍結保存し、融解し、そして再使用可能にすることも可能である。こうした場合、細胞は通常、10%ジメチルスルホキシド(DMSO)、50%血清、40%緩衝培地、またはこうした凍結温度で細胞を保存するために当該技術分野で一般的に用いられる他の溶液中で凍結され、そして凍結培養細胞を融解するために、当該技術分野に一般的に知られる方式で融解してもよい。
【0201】
7. 宿主細胞への核酸の導入
対象のポリヌクレオチド、これをコードするヌクレオチド配列を含む核酸、または対象のCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)またはPUFドメイン融合体をコードするヌクレオチド配列を含む核酸を、多様な周知の方法のいずれによって宿主細胞に導入してもよい。
【0202】
宿主細胞内に核酸を導入する方法は、当該技術分野に知られ、そして任意の既知の方法を用いて、核酸(例えばベクターまたは発現構築物)を、幹細胞または前駆体細胞内に導入してもよい。適切な方法には、例えば、ウイルスまたはバクテリオファージ感染、トランスフェクション、コンジュゲート化、プロトプラスト融合、リポフェクション、エレクトロポレーション、リン酸カルシウム沈殿、ポリエチレンイミン(PEI)仲介性トランスフェクション、DEAE−デキストラン仲介性トランスフェクション、リポソーム仲介性トランスフェクション、粒子銃技術、リン酸カルシウム沈殿、直接マイクロインジェクション、ナノ粒子仲介性核酸送達等が含まれる(例えばPanyamら, Adv. Drug Deliv. Rev., pii: S0169-409X(12)00283-9.doi:10.1016 / j.addr.2012.09.023を参照されたい)。
【0203】
したがって、本発明はまた、対象のポリヌクレオチドをコードするヌクレオチド配列を含む単離核酸も提供する。いくつかの場合、対象の核酸はまた、対象のCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)および/または対象のPUFドメイン融合体をコードするヌクレオチド配列も含む。
【0204】
いくつかの態様において、対象の方法は、宿主細胞(または宿主細胞集団)に、対象のポリヌクレオチドおよび/または対象のCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)および/または対象のPUFドメイン融合体をコードするヌクレオチド配列を含む1またはそれより多い核酸(例えばベクター)を導入する工程を含む。いくつかの態様において、ターゲットDNAを含む宿主細胞はin vitroである。いくつかの態様において、ターゲットDNAを含む宿主細胞はin vivoである。対象のポリヌクレオチドおよび/または対象のCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)および/または対象のPUFドメイン融合体をコードするヌクレオチド配列を含む適切な核酸には、発現ベクターが含まれ、ここで発現ベクターは、組換え発現ベクターであってもよい。
【0205】
いくつかの態様において、組換え発現ベクターは、ウイルス構築物、例えば組換えアデノ随伴ウイルス構築物(例えば、米国特許第7,078,387号を参照されたい)、組換えアデノウイルス構築物、組換えレンチウイルス構築物、組換えレトロウイルス構築物等である。
【0206】
適切な発現ベクターには、限定されるわけではないが、ウイルスベクター(例えばワクシニアウイルス;ポリオウイルス;アデノウイルス(例えば、Liら, Invest Opthalmol. Vis. Sci., 35:2543-2549, 1994; Borrasら,Gene Ther., 6:515-524, 1999; LiおよびDavidson, Proc. Natl. Acad. Sci. USA, 92:7700-7704, 1995; Sakamotoら,Hum. Gene Ther., 5:1088-1097, 1999; WO 94/12649, WO 93/03769; WO 93/19191; WO 94/28938; WO 95/11984およびWO 95/00655を参照されたい);アデノ随伴ウイルス(例えば、Aliら, Hum. Gene Ther., 9:81-86, 1998, Flanneryら, Proc. Natl. Acad. Sci. USA, 94:6916-6921, 1997; Bennettら,Invest Opthalmol Vis Sci 38:2857-2863, 1997; Jomaryら, Gene Ther., 4:683-690, 1997, Rollingら, Hum. Gene Ther., 10:641-648, 1999; Aliら, Hum. Mol. Genet., 5:591-594, 1996; Srivastava、WO 93/09239中, Samulskiら, J. Vir., 63:3822-3828, 1989; Mendelsonら, Virol., 166: 154-165, 1988;およびFlotteら, Proc. Natl. Acad. Sci. USA, 90: 10613-10617, 1993を参照されたい); SV40;ヘルペス・シンプレックス・ウイルス;ヒト免疫不全ウイルス(例えば、Miyoshiら, Proc. Natl. Acad. Sci. USA, 94: 10319-23, 1997; Takahashiら, J. Virol., 73:7812-7816, 1999を参照されたい);レトロウイルスベクター(例えば、ネズミ白血病ウイルス、脾臓壊死ウイルス、ならびにレトロウイルス、例えばラウス肉腫ウイルス、ハーベイ肉腫ウイルス、鳥類白血症ウイルス、レンチウイルス、HIVウイルス、骨髄増殖性肉腫ウイルス、および乳腺腫瘍ウイルス由来のベクター)に基づくウイルスベクター等が含まれる。
【0207】
多くの適切な発現ベクターが当業者に知られ、そして多くが商業的に入手可能である。以下のベクターを例として提供する;真核宿主細胞に関しては: pXTl、pSG5(Stratagene)、pSVK3、pBPV、pMSG、およびpSVLSV40(Pharmacia)。しかし、宿主細胞と適合する限り、任意の他のベクターを用いてもよい。
【0208】
利用する宿主/ベクター系に応じて、恒常的および誘導性プロモーター、転写エンハンサー要素、転写ターミネーター等を含む、任意の数の適切な転写および翻訳調節要素を、発現ベクター中で用いてもよい(例えば、Bitterら, Methods in Enzymology, 153:516-544, 1987を参照されたい)。
【0209】
いくつかの態様において、対象のポリヌクレオチドおよび/または対象のCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)および/または対象のPUFドメイン融合体をコードするヌクレオチド配列を、調節要素、例えば転写調節要素、例えばプロモーターに、機能可能であるように連結する。転写調節要素は、真核細胞、例えば哺乳動物細胞;または原核細胞(例えば細菌または古細菌細胞)のいずれにおいて機能性であってもよい。いくつかの態様において、対象のポリヌクレオチドおよび/または対象のCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)および/または対象のPUFドメイン融合体をコードするヌクレオチド配列を、原核および真核細胞両方において、対象のポリヌクレオチドおよび/または対象のCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)および/または対象のPUFドメイン融合体をコードするヌクレオチド配列の発現を可能にする、多数の調節要素に、機能可能であるように連結する。
【0210】
プロモーターは、恒常的に活性なプロモーター(すなわち恒常的に活性/「オン」状態にあるプロモーター)であってもよいし、誘導性プロモーター(すなわちその状態、活性/「オン」または不活性/「オフ」が、外部刺激によって、例えば特定の温度、化合物、またはタンパク質の存在によって調節されるプロモーター)であってもよいし、空間的に制限されるプロモーター(すなわち転写制御要素、エンハンサー等)(例えば組織特異的プロモーター、細胞タイプ特異的プロモーター等)であってもよいし、そして時間的に制限されるプロモーターであってもよい(すなわちプロモーターは、胚発生の特定の段階中に、または生物学的プロセスの特定の段階中に、例えばマウスにおける毛包周期中に、「オン」状態または「オフ」状態である)。
【0211】
適切なプロモーターは、ウイルスに由来していてもよく、そしてしたがって、ウイルスプロモーターと称されることも可能であるし、またはこれらは原核または真核生物を含む任意の生物に由来していてもよい。適切なプロモーターを用いて、任意のRNAポリメラーゼ(例えばpol I、pol II、pol III)によって発現を駆動することも可能である。例示的なプロモーターには、限定されるわけではないが、SV40初期プロモーター、マウス乳腺腫瘍ウイルス末端反復配列(LTR)プロモーター;アデノウイルス主要後期プロモーター(Ad MLP);ヘルペス・シンプレックス・ウイルス(HSV)プロモーター、サイトメガロウイルス(CMV)プロモーター、例えばCMV極初期プロモーター領域(CMVIE)、ラウス肉腫ウイルス(RSV)プロモーター、ヒトU6小分子核プロモーター(U6)(Miyagishiら, Nature Biotech., 20:497-500, 2002)、増進されたU6プロモーター(例えばXiaら, Nucleic Acids Res., 31(17):e100, 2003)、ヒトHIプロモーター(HI)等が含まれる。
【0212】
誘導性プロモーターの例には、限定されるわけではないが、T7 RNAポリメラーゼプロモーター、T3 RNAポリメラーゼプロモーター、イソプロピル−ベータ−D−チオガラクトピラノシド(IPTG)制御プロモーター、ラクトース誘導性プロモーター、熱ショックプロモーター、テトラサイクリン制御プロモーター(例えばTet−ON、Tet−OFF等)、ステロイド制御プロモーター、金属制御プロモーター、エストロゲン受容体制御プロモーター等が含まれる。したがって、誘導性プロモーターは、限定されるわけではないが、ドキシサイクリン;RNAポリメラーゼ、例えばT7 RNAポリメラーゼ;エストロゲン受容体;エストロゲン受容体融合体等を含む分子によって制御されることも可能である。
【0213】
いくつかの態様において、多細胞生物において、プロモーターが特定の細胞サブセットにおいて活性である(すなわち「オン」である)ように、プロモーターは、空間的に制限されるプロモーター(すなわち細胞タイプ特異的プロモーター、組織特異的プロモーター等)である。空間的に制限されるプロモーターはまた、エンハンサー、転写制御要素、調節配列等と称されることも可能である。任意の好適な空間的に制限されるプロモーターを用いてもよく、そして適切なプロモーター(例えば脳特異的プロモーター、ニューロンサブセットにおいて発現を駆動するプロモーター、生殖系列において発現を駆動するプロモーター、肺において発現を駆動するプロモーター、筋肉において発現を駆動するプロモーター、膵臓の膵島細胞において発現を駆動するプロモーター等)の選択は、生物に応じるであろう。例えば、多様な空間的に制限されるプロモーターが、植物、ハエ、虫、哺乳動物、マウス等に関して知られる。したがって、生物に応じて、空間的に制限されるプロモーターを用いて、非常に多様な異なる組織および細胞タイプにおいて、対象のCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)またはPUFドメイン融合体をコードする核酸の発現を制御することも可能である。いくつかの空間的に制限されるプロモーターは、胚発生の特定の段階中、または生物学的プロセスの特定の段階(例えばマウスにおける毛包周期)中、プロモーターが「オン」状態または「オフ」状態にあるように、時間的にも制限されている。
【0214】
例示目的のため、空間的に制限されるプロモーターの例には、限定されるわけではないが、ニューロン特異的プロモーター、脂肪細胞特異的プロモーター、心筋細胞特異的プロモーター、平滑筋特異的プロモーター、光受容体特異的プロモーター等が含まれる。ニューロン特異的な空間的に制限されるプロモーターには、限定されるわけではないが、ニューロン特異的エノラーゼ(NSE)プロモーター(例えば、EMBL HSEN02、X51956を参照されたい);芳香族アミノ酸脱炭酸酵素(AADC)プロモーター;ニューロフィラメントプロモーター(例えば、GenBank HUMNFL、L04147を参照されたい);シナプシンプロモーター(例えば、GenBank HUMSYNIB、M55301を参照されたい);thy−1プロモーター(例えば、Chenら, Cell, 51:7-19, 1987;およびLlewellynら, Nat. Med., 16(10): 1161-1166, 2010を参照されたい);セロトニン受容体プロモーター(例えば、GenBank S62283を参照されたい);チロシンヒドロキシラーゼプロモーター(TH)(例えば、Ohら, Gene Ther., 16:437, 2009; Sasaokaら, Mol. Brain Res., 16:274, 1992; Boundyら, Neurosci., 18:9989, 1998;およびKanedaら, Neuron, 6:583-594, 1991を参照されたい);GnRHプロモーター(例えば、Radovickら, Proc. Natl. Acad. Sci. USA, 88:3402-3406, 1991を参照されたい);L7プロモーター(例えば、Oberdickら, Science, 248:223-226, 1990を参照されたい);DNMTプロモーター(例えば、Bartgeら, Proc. Natl. Acad. Sci. USA, 85:3648-3652, 1988を参照されたい);エンケファリンプロモーター(例えば、Combら, EMBO J., 17:3793-3805, 1988を参照されたい);ミエリン塩基性タンパク質(MBP)プロモーター;Ca
2+カルモジュリン依存性プロテインキナーゼIIアルファ(CamKIIa)プロモーター(例えば、Mayfordら, Proc. Natl. Acad. Sci. USA, 93: 13250, 1996;およびCasanovaら, Genesis, 31:37, 2001を参照されたい);CMVエンハンサー/血小板由来増殖因子βプロモーター(例えば、Liuら, Gene Therapy, 11:52-60, 2004を参照されたい)等が含まれる。
【0215】
脂肪細胞特異的な空間的に制限されるプロモーターには、限定されるわけではないが、aP2遺伝子プロモーター/エンハンサー、例えばヒトaP2遺伝子の−5.4kb〜+21bpの領域(例えば、Tozzoら, Endocrinol. 138: 1604, 1997; Rossら, Proc. Natl. Acad. Sci. USA, 87:9590, 1990;およびPavjaniら, Nat. Med., 11:797, 2005を参照されたい);グルコース輸送因子4(GLUT4)プロモーター(例えば、Knightら, Proc. Natl. Acad. Sci. USA, 100: 14725, 2003を参照されたい);脂肪酸転移酵素(FAT/CD36)プロモーター(例えば、Kurikiら, Biol. Pharm. Bull., 25: 1476, 2002;およびSatoら, Biol. Chem. 277: 15703, 2002を参照されたい);ステアロイル−CoA脱飽和酵素−1(SCD1)プロモーター(Taborら, Biol. Chem. 274:20603, 1999);レプチンプロモーター(例えば、Masonら, Endocrinol. 139: 1013, 1998;およびChenら, Biochem. Biophys. Res. Comm., 262: 187, 1999を参照されたい);アディポネクチンプロモーター(例えば、Kitaら, Biochem. Biophys. Res. Comm., 331 :484, 2005;およびChakrabarti, Endocrinol. 151:2408, 2010を参照されたい);アディプシンプロモーター(例えば、Piattら, Proc. Natl. Acad. Sci. USA, 86:7490, 1989を参照されたい);レジスチンプロモーター(例えば、Seoら, Molec. Endocrinol., 17: 1522, 2003を参照されたい)等が含まれる。
【0216】
心筋細胞特異的な空間的に制限されるプロモーターには、限定されるわけではないが、以下の遺伝子由来の制御配列が含まれる:ミオシン軽鎖2、ミオシン重鎖、AE3、心臓トロポニンC、心臓アクチン等。Franzら, Cardiovasc. Res., 35:560-566, 1997; Robbinsら, Ann. N.Y. Acad. Sci., 752:492-505, 1995; Linnら, Circ. Res., 76:584-591, 1995; Parmacekら, Mol. Cell. Biol., 14:1870-1885, 1994; Hunterら, Hypertension, 22:608-617, 1993;およびSartorelliら, Proc. Natl. Acad. Sci., 89:4047-4051, 1992。
【0217】
平滑筋特異的な空間的に制限されるプロモーターには、限定されるわけではないが、SM22aプロモーター(例えば、Akyurekら, Mol. Med., 6:983, 2000;および米国特許第7,169,874号を参照されたい);スムースリンプロモーター(例えば、WO 2001/018048を参照されたい);平滑筋アクチンプロモーター等が含まれる。例えば、2つのCArG要素が存在するSM22aプロモーターの0.4kb領域は、血管平滑筋細胞特異的発現を仲介することが示されてきている(例えば、Kimら, Mol. Cell. Biol., 17:2266-2278, 1997; Liら, J. Cell Biol., 132:849-859, 1996;およびMoesslerら, Development, 122:2415-2425, 1996を参照されたい)。
【0218】
光受容体特異的な空間的に制限されるプロモーターには、限定されるわけではないが、ロドプシンプロモーター;ロドプシンキナーゼプロモーター(Youngら, Ophthalmol. Vis. Sci., 44:4076, 2003);ベータホスホジエステラーゼ遺伝子プロモーター(Nicoudら, Gene Med., 9: 1015, 2007);網膜色素変性症遺伝子プロモーター(Nicoudら, 2007, 上記);光受容体間レチノイド結合タンパク質(IRBP)遺伝子エンハンサー(Nicoudら (2007) 上記);IRBP遺伝子プロモーター(Yokoyamaら, Exp. Eye Res., 55:225, 1992)が含まれる。
【0219】
8.ライブラリー
本発明はまた、対象のポリヌクレオチド配列の複数またはライブラリー、あるいは該ポリヌクレオチド配列をコードするベクターの複数またはライブラリーも提供する。後者は、対象のポリヌクレオチドをコードするヌクレオチドを含む組換え発現ベクターのライブラリーを含んでもよい。
【0220】
対象のライブラリーは、約10の個々のメンバーから約10
12の個々のメンバーを含むことも可能であり;例えば対象のライブラリーは、約10の個々のメンバーから約10
2の個々のメンバー、約10
2の個々のメンバーから約10
3の個々のメンバー、約10
3の個々のメンバーから約10
5の個々のメンバー、約10
5の個々のメンバーから約10
7の個々のメンバー、約10
7の個々のメンバーから約10
9の個々のメンバー、約10
9の個々のメンバーから約10
12の個々のメンバーを含むことも可能である。
【0221】
特定の態様において、ベクターの2つは、それぞれのDNAターゲティング配列、Cas9結合配列、および/またはPBSのコピー数、同一性(例えば配列、または結合特異性)、または相対的順序において、コードされるポリヌクレオチドが異なる。
【0222】
例えば、特定の態様において、対象のライブラリーの「個々のメンバー」は、対象のポリヌクレオチドのDNAターゲティング配列のヌクレオチド配列において、ライブラリーの他のメンバーと異なる。したがって、例えば、対象のライブラリーの各個々のメンバーは、ライブラリーの他のすべてのメンバーと、Cas9結合配列の同じまたは実質的に同じヌクレオチド配列を含むことも可能であり;そしてライブラリーの他のすべてのメンバーと、PBSの同じまたは実質的に同じヌクレオチド配列を含むことも可能である;が対象のポリヌクレオチドのDNAターゲティング配列のヌクレオチド配列において、ライブラリーの他のメンバーと異なる。この方式で、ライブラリーは、同じターゲット遺伝子上または異なるターゲット遺伝子上のいずれかである、異なるターゲットポリヌクレオチド配列に結合するメンバーを含むことも可能である。
【0223】
関連する態様において、異なるターゲットDNAが独立に制御可能であるよう、例えばいくつかのターゲット遺伝子が転写的に活性化される(そして場合によって第一の蛍光色によって標識される)一方、他のものは転写的に抑制される(そして場合によって第二の蛍光色によって標識される)よう、異なるDNAターゲティング配列が異なるPBSと会合するように、ライブラリーメンバーは異なってもよい。
【0224】
特定の他の態様において、対象のライブラリーの個々のメンバーは、対象のポリヌクレオチドのCas9結合配列のヌクレオチド配列において、ライブラリーの他のメンバーと異なる。したがって、例えば対象のライブラリーの各個々のメンバーは、ライブラリーの他のすべてのメンバーと、DNAターゲティング配列の同じまたは実質的に同じヌクレオチド配列を含むことも可能であり;そしてライブラリーの他のすべてのメンバーと、PBSの同じまたは実質的に同じヌクレオチド配列を含むことも可能である;が対象のポリヌクレオチドのCas9結合配列のヌクレオチド配列において、ライブラリーの他のメンバーと異なる。この方式で、ライブラリーは、異なる種由来の異なる直交性Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)に結合するメンバーを含み、同じ宿主細胞において、別個におよび平行に制御可能な系を可能にしてもよい。
【0225】
特定の他の態様において、対象のライブラリーの個々のメンバーは、対象のポリヌクレオチドのPBSのヌクレオチド配列において、ライブラリーの他のメンバーとは異なる。したがって、例えば対象のライブラリーの各個々のメンバーは、ライブラリーの他のすべてのメンバーと、DNAターゲティング配列の同じまたは実質的に同じヌクレオチド配列を含むことも可能であり;そしてライブラリーの他のすべてのメンバーと、Cas9結合配列の同じまたは実質的に同じヌクレオチド配列を含むことも可能である;が対象のポリヌクレオチドのPBSのヌクレオチド配列において、ライブラリーの他のメンバーと異なる。
【0226】
9.例示的な有用性
本発明にしたがって、転写を調節するための方法は、研究適用;診断適用;産業適用;および治療適用を含む、多様な適用に使用を見出す。
【0227】
研究適用には、例えば、発生、代謝、下流遺伝子の発現等に対する、ターゲット核酸の転写減少または増加の影響を決定することが含まれうる。
対象の転写調節法を用いて、ハイスループットゲノム分析を行ってもよく、ここで、対象のポリヌクレオチドのDNAターゲティング配列のみを変化させる必要があり、一方、Cas9結合配列およびPBSは、(いくつかの場合)一定に保持されていてもよい。ゲノム分析で用いる複数の核酸を含むライブラリー(例えば対象のライブラリー)には:対象のポリヌクレオチドをコードするヌクレオチド配列に機能可能であるように連結されたプロモーターが含まれ、ここで各核酸には、異なるDNAターゲティング配列、共通のCas9結合配列、および共通のPBSが含まれるであろう。チップは、5x10
4を超えるユニークな本発明のポリヌクレオチドを含有可能であった。
【0228】
適用には、大規模表現型決定、遺伝子対機能マッピング、およびメタゲノム分析が含まれるであろう。
本明細書に開示する対象の方法はまた、代謝操作の分野においても使用を見出す。転写レベルは、本明細書に開示するように、適切なDNAターゲティングRNAを設計することによって、効率的にそして予測可能に調節可能であるため、代謝経路(例えば生合成経路)の活性は、関心対象の代謝経路内の特定の酵素のレベルを調節することによって(例えば転写増加または減少を通じて)正確に調節し、そして調整することも可能である。関心対象の代謝経路には、化学薬品(ファインケミカル、燃料、抗生物質、毒素、アゴニスト、アンタゴニスト等)および/または薬剤産生に用いるものが含まれる。
【0229】
関心対象の生合成経路には、限定されるわけではないが、(1)メバロン酸経路(例えばHMG−CoAレダクターゼ経路)(アセチルCoAをピロリン酸ジメチルアリル(DMAPP)およびピロリン酸イソペンテニル(IPP)に変換し、これらはテルペノイド/イソプレノイドを含む非常に多様な生物分子の生合成に用いられる)、(2)非メバロン酸経路(すなわち「2−C−メチル−D−エリスリトール4−リン酸/l−デオキシ−D−キシルロース5−リン酸経路」または「MEP/DOXP経路」または「DXP経路」)(メバロン酸経路に対する代替経路を通じて、代わりに、ピルビン酸およびグリセロアルデヒド3−リン酸をDMAPPおよびIPPに変換することによって、DMAPPおよびIPPを産生する)、(3)ポリケチド合成経路(多様なポリケチドシンターゼ酵素を通じて、多様なポリケチドを産生する。ポリケチドには、化学療法に用いられる天然存在小分子(例えばテトラサイクリン、およびマクロライド)が含まれ、そして産業的に重要なポリケチドには、ラパマイシン(免疫抑制剤)、エリスロマイシン(抗生物質)、ロバスタチン(抗コレステロール薬剤)、およびエポチロンB(抗癌薬剤)が含まれる)、(4)脂肪酸合成経路、(5)DAHP(3−デオキシ−D−アラビノ−ヘプツロソネート7リン酸)合成経路、(6)潜在的な生物燃料(例えば短鎖アルコールおよびアルカン、脂肪酸メチルエステルおよび脂肪性アルコール、イソプレノイド等)が含まれる。
【0230】
また、本明細書に開示する方法を用いて、調節の統合ネットワーク(すなわち単数または複数のカスケード)を設計してもよい。例えば、対象のポリヌクレオチド/Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)/PUFドメイン融合体を用いて、別のポリヌクレオチド/Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)/PUFドメイン融合体の発現を制御する(すなわち調節する、例えば増加させる、減少させる)ことも可能である。例えば、第一の対象のポリヌクレオチドは、第二のCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)または第一のPUFドメイン誘導体とは異なる機能(例えば、メチルトランスフェラーゼ活性、脱メチル化酵素活性、アセチルトランスフェラーゼ活性、脱アセチル化酵素活性等)を持つPUFドメイン融合体の転写の調節をターゲティングするように設計されうる。さらに、異なるCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)(例えば異なる種に由来する)は、異なるCas9ハンドル(すなわちCas9結合配列)を必要とする可能性もあるため、第二のCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)は、第一の上記のCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)とは異なる種に由来してもよい。したがって、いくつかの場合、第一の対象のポリヌクレオチドと相互作用不能であるように、第二のCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)を選択してもよい。他の場合、第二のCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)が第一の対象のポリヌクレオチドと相互作用するように選択してもよい。いくつかのこうした場合、2つ(またはそれより多い)Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)/PUFドメイン融合体の活性は、競合してもよい(例えばポリペプチドが反対の活性を有する際)し、または相乗作用してもよい(例えばポリヌクレオチドが類似のまたは相乗的活性を有する際)。同様に、上述のように、ネットワーク中の任意の複合体(すなわちポリヌクレオチド/Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)/PUFドメイン融合体)を設計して、他のポリヌクレオチド/Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)/PUFドメイン融合体を調節することも可能である。対象のポリヌクレオチド/Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)/PUFドメイン融合体を任意の望ましいDNA配列にターゲティングすることが可能であるため、本明細書記載の方法を用いて、任意の望ましいターゲットの発現を調節しそして制御することも可能である。設計可能な統合ネットワーク(すなわち相互作用のカスケード)は、非常に単純なものから非常に複雑なものに渡り、そして限定はない。
【0231】
2またはそれより多い構成要素(例えばポリヌクレオチド/Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)/PUFドメイン融合体)が、各々、別のポリヌクレオチド/Cas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)/PUFドメイン融合体の制御調節下にあるネットワークにおいて、ネットワークの1つの構成要素の発現レベルは、ネットワークの別の構成要素の発現レベルに影響を及ぼすことも可能である(例えば発現を増加させるかまたは減少させることも可能である)。この機構を通じて、1つの構成要素の発現は、同じネットワーク中の異なる構成要素の発現に影響を及ぼすことも可能であり、そしてネットワークには、他の構成要素の発現を増加させる構成要素、ならびに他の構成要素の発現を減少させる構成要素の混合物が含まれることも可能である。当業者には容易に理解されるであろうように、1つの構成要素の発現レベルが1またはそれより多くの異なる構成要素の発現レベルに影響を及ぼしうる上記例は、例示目的のためのものであり、そして限定しない。1またはそれより多い構成要素を操作可能であるように(すなわち実験的調節下、例えば温度調節;薬剤調節、すなわち薬剤誘導性調節;光調節等)修飾する(上記のとおり)場合、さらなる層の複雑性を、場合によってネットワークに導入してもよい。
【0232】
1つの限定されない例として、第一の対象のポリヌクレオチドを、ターゲット療法/代謝遺伝子の発現を調節する、第二の対象のポリヌクレオチドのプロモーターに結合させてもよい。こうした場合、第一の対象のポリヌクレオチドの条件付発現は、療法/代謝遺伝子を間接的に活性化する。このタイプのRNAカスケードは、例えば、リプレッサーをアクチベーターに容易に変換するために有用であり、そしてこれを用いて、ターゲット遺伝子発現の論理または動力学を調節することも可能である。
対象の転写調節法はまた、薬剤発見およびターゲット検証にも使用可能である。
【0233】
10.キット
本発明はまた、対象の方法を実行するためのキットも提供する。対象のキットは:a)本発明のポリヌクレオチド、または該ポリヌクレオチドをコードするヌクレオチド配列を含む核酸(例えばベクター);場合によって、b)対象のCas9タンパク質(例えば野生型、ニッカーゼ、またはdCas9タンパク質)、または該タンパク質をコードするベクター(該タンパク質をコードする発現可能mRNAを含む);および場合によって、c)各々、エフェクタードメインに融合したPUFドメインを含む1またはそれより多い対象のPUFドメイン融合体であって、該エフェクタードメインは、異なるPUFドメイン融合体の間で同じであってもまたは異なってもよい、該融合体、または該融合体をコードするベクター(該融合体をコードする発現可能mRNAを含む)を含んでもよい。
【0234】
特定の態様において、a)〜c)の1またはそれより多くは、同じベクターにコードされてもよい。
特定の態様において、キットはまた、a)〜c)のいずれか1つの宿主細胞内への導入を促進する1またはそれより多い緩衝剤または試薬、例えば形質転換、トランスフェクション、または感染のための試薬も含む。
【0235】
例えば、対象のキットには、さらに、1またはそれより多いさらなる試薬が含まれてもよく、ここで、こうしたさらなる試薬は:緩衝剤;洗浄緩衝剤;対照試薬;対照発現ベクターまたはRNAポリメラーゼポリヌクレオチド;野生型またはdCas9またはPUFドメイン融合体のDNAからのin vitro産生のための試薬等より選択されてもよい。
【0236】
対象のキットの構成要素は、別個の容器中にあってもよいし;または単一の容器中に組み合わされていてもよい。
上述の構成要素に加えて、対象のキットには、さらに、対象の方法を実施するためのキット構成要素の使用のための説明書が含まれてもよい。対象の方法を実施するための説明書は、一般的に、適切な記録媒体上に記録されている。例えば、説明書は、基盤、例えば紙またはプラスチック等の上に印刷されていてもよい。こうしたものとして、説明書は、パッケージ挿入物として、キットまたはその構成要素の容器のラベル中(すなわちパッケージングまたはサブパッケージングと関連して)等に、存在していてもよい。他の態様において、説明書は、適切なコンピュータ読み取り可能保存媒体、例えばCD−ROM、ディスケット、フラッシュドライブ等の上に存在する、電子保存データファイルとして存在する。さらに他の態様において、実際の説明書は、キット中には存在せず、遠隔供給源から、例えばインターネットを通じて、説明書を得るための手段が提供される。この態様の例は、説明書を見ることが可能であり、そして/またはそこから説明書をダウンロードすることが可能であるウェブアドレスを含むキットである。説明書と同様、説明書を得るためのこの手段は、適切な基盤に記録される。
【実施例】
【0237】
実施例1 sgRNA足場は、操作されたPumilio結合部位の47コピーの挿入を伴っても、機能性であるままである
本実施例は、対象の三構成要素CRISPR/Cas複合体/系が、dCas9/sgRNA複合体の機能に実質的に影響を及ぼすことなく、操作された8量体Pumilio相同体ドメイン結合配列(PBS)を少なくとも47コピー、sgRNAの3’端に有しうることを立証する。
【0238】
特に、sgRNAの3’端にPBSを付加することが、sgRNA機能に影響を及ぼすかどうかを試験するため、0コピー、5コピー、15コピー、25コピー、および47コピーの、PUF(3−2)(単にPUFaとも称される)[PBS32またはPBSa:5’−UGUAUgUA−3’]、PUF(6−2/7−2)(単にPUFbとも称される)[PBS6272またはPBSb:5’−UugAUAUA−3’]に対する8量体Pumilio相同体ドメイン結合配列(PBS)を伴う、一連の修飾Tetターゲティング(sgTetO)または非ターゲティング対照(sg対照)sgRNAを生成した。
図1Aを参照されたい。これらの構築物が、dCas9−VP64転写アクチベーターに、HEK293T/TetO::tdTomato細胞株におけるtdTomato発現を活性化させるように指示する能力を試験した。
【0239】
異なるsgRNA足場を持つdCas9−VP64で細胞をトランスフェクションし、そしてトランスフェクション2日後、蛍光活性化細胞ソーティング(FACS)によって分析した(
図1B)。対照非ターゲティングsgRNAはすべて、tdTomato発現を活性化しなかった。一方、異なる数のPBSを含むTetターゲティングsgRNAはすべて、dCas9−VP64にtdTomato発現を活性化させるように指示することが可能であり、少なくとも47コピーの8量体部位の挿入が、ターゲットへのdCas9−VP64の方向付けにおいて、sgRNAの活性に実質的に影響を及ぼさないことを示した。
【0240】
試験条件下で、そしてPUFa−VP64/PBSaおよびPUFb−VP64/PBSbの両方に関して、sgRNAに付加された5〜10コピーのPBSが、ターゲット導入遺伝子を最適に活性化させることが可能であった。一方、15、20、および47コピーのPBSは、わずかに低いがなお実質的な導入遺伝子活性化を導いた(
図1C)。
【0241】
実施例2 対象の三構成要素CRISPR/Cas複合体/系は、同族8量体結合部位を含む操作されたPumilioの特異性のため、互いに直交性である
本実施例は、異なってプログラムされたPUFドメインおよびその同族8量体モチーフを含むその対応するsgRNAの間の特異性が、対象の三構成要素CRISPR/Cas複合体/系各々の間の独立性または直交性を提供することを立証する。
【0242】
それぞれ、5’−UGUAUgUA−3’結合部位を含むsgRNA(sgRNA−PBS32)、および5’−UugAUAUA−3’結合部位を含むsgRNA−PBS6272と相互作用する、PUF(3−2)::VP64およびPUF(6−2/7−2)::VP64の融合体を生成し、そしてこれらがdCas9と組み合わせて、tdTomato発現をオンにする活性を試験した。さらに、2つのさらなる対、PBSw(5’−UGUAUAUA−3’)を認識するPUFw−VP64およびPBSc(5’−UugAUgUA−3’)を認識するPUFc−VP64もまた構築して、dCas9と組み合わせて、同じTetO::tdTomato発現を活性化する能力を試験した(
図1D)。
【0243】
図1Dに示すように、PUF::VP64は、同族結合部位を含むsgRNAが提供された場合にのみ、tdTomato発現を活性化可能である。これは、対象の三構成要素CRISPR/Cas複合体/系が、PUFドメインおよびsgRNA−PBS上のその8量体結合部位の対形成に基づいて、エフェクター機能の独立性または直交性を提供することを立証する。印象深いことに、PBSaおよびPBSw結合部位は1ヌクレオチドしか異ならないが、その遺伝子活性化はターゲット特異的なままであり、対象の三構成要素CRISPR/Cas複合体/系の高い特異性を立証する。
【0244】
実施例3 対象の三構成要素CRISPR/Cas複合体/系は、ターゲット遺伝子座でのタンパク質複合体の組み立てを可能にする
本実施例は、2またはそれより多い異なるタンパク質構成要素を含むタンパク質複合体が、sgRNA上で組み立て可能であり、そして対象の系を用いて、定義された遺伝子座で作動可能であることを立証する。
【0245】
特に、p65−HSF1は、近年、強力なアクチベータードメインであることが示されてきている。互いに隣接して配置されたPBS32およびPBS6272の両方を含むsgRNA、ならびに2つの異なる部位を占めるであろうPUF(3−2)::VP64およびPUF(6−2/7−2)::p65−HSF1融合体を生成した(
図2A)。PUF(3−2)::VP64およびPUF(6−2/7−2)::p65−HSF1の両方での同時トランスフェクションは、tdTomato蛍光を誘導し、単一のアクチベーターのみをトランスフェクションすることから生じる蛍光強度のほぼ総計である強度であった。これは、PUF(3−2)およびPUF(6−2/7−2)の両方の結合部位を含むsgRNAが、ターゲティングされるゲノム遺伝子座上で、両方のタイプの両方の融合タンパク質が組み立てられることを可能にすることを示す。
【0246】
最近の論文は、転写活性化ドメインとしてのVP64およびp65HSF1の両方を試験し、そしてp65HSF1がより強力なアクチベーターであることを見出した。これらの2つの転写活性化ドメインを直接比較するため、p65HSF1 PUF融合体(PUFa−p65HSF1)およびVP64 PUF融合体(PUFa−VP64)を用いて、異なる数のPBSaを含むsgRNAを用い、TetO::tdTomato導入遺伝子を活性化した(
図2C)。PUFa−p65HSF1はPUFa−VP64の最大3倍より多い活性化を提供した。活性化は、1つのPBSaであっても観察された(PUFa−VP64モジュールでは、以前には観察されなかった)。したがって、p65HSF1は、VP64よりもより強力な転写活性化ドメインであることが確認される。
【0247】
実施例4 対象の三構成要素CRISPR/Cas複合体/系は、アクチベーターを含むdCas9直接融合体よりも、より効率的に、内因性遺伝子を活性化させることも可能である
本発明者らは、以前、dCas9−VP160直接融合体を用いて、OCT4およびSOX2のロバストな内因性遺伝子活性化を達成するため、遺伝子あたり3〜4のsgRNAのカクテルを用い、一方、単一sgRNAは、高い活性化を誘導することに失敗した(データ未提示)。
【0248】
本実施例は、対象の系において、sgRNA−PBS上の多数のPBSを通じた、アクチベータードメインの多数の分子の補充が、トランス活性化活性を増加させ、したがって、より少ないsgRNAの使用でも、内因性遺伝子活性化達成を可能にすることを示す。
【0249】
特に、HEK293Tにおける内因性遺伝子OCT4およびSOX2の活性化を、遺伝子あたり4つのsgRNA−PBSのカクテル、または個々のsgRNA−PBSのいずれかを用いて、直接dCas9−p65HSF1アクチベーターと、対象の系を比較した(
図3Aおよび3B)。OCT4およびSOX2活性化実験の両方において、混合sgRNA−PBSカクテルならびに単一ガイド実験における直接融合に比較して、対象の三構成要素CRISPR/Cas複合体/系を用いると、より高い活性化が観察された(
図3Aおよび3B)。OCT4およびSOX2への直接融合体dCas9−p65HSF1の単一ガイドターゲティングによっては、ほとんどまたはまったく活性が観察されず、一方、対応する三構成要素系実験においては、ロバストな活性化が観察され、直接融合体に勝る、対象の三構成要素CRISPR/Cas複合体/系アクチベーターの優れた活性が示された。
【0250】
OCT4およびSOX2活性化に関するsgRNA上のPBSa部位の最適な数を決定するため、1、5、15または25コピーのPBSaを含む、OCT4またはSOX2近位プロモーターのいずれかをターゲティングするsgRNA−PBSを構築した。OCT4およびSOX2実験の両方において、本発明者らは、sgRNA−5xPBSaカクテル実験および単一sgRNA−5xPBSa実験のいずれにおいても、5xPBSaを用いて、最高の活性化を観察し、TetO::tdTomatoレポーター実験における発見を反復した(
図3Dおよび3E)。
【0251】
実施例5 対象の三構成要素CRISPR/Cas複合体/系は、ターゲット遺伝子の同時の活性化および抑制を可能にする
本実施例は、異なるエフェクター機能を、対象の三構成要素CRISPR/Cas複合体/系の各々に割り当て可能であることを立証する。
【0252】
KRAB::PUF(6−2/7−2)抑制融合体およびSV40プロモーターをターゲティングするsgRNAをまず生成した。次いで、TetOプロモーターの調節下にあるtdTomatoレポーター、およびSV40プロモーターの調節下にあるEGFPレポーターを有する、HEK293Tレポーター細胞株(HEK293T/TetO::tdTomato/SV40::EGFP)を用いて、同時の(1)TetOプロモーターへのdCas9/sgTetO−PBS32/PUF(3−2)::VP64結合を通じたtdTomatoの活性化、および(2)SV40プロモーターでのdCas9/sgSV40−PBS6272/KRAB::PUF(6−2/7−2)の結合を通じたEGFP発現の抑制を試験した(
図4A)。dCas9、sgTetO−5xPBS32およびPUF(3−2)::VP64からなる三構成要素CRISPR/Casアクチベーター複合体の発現は、tdTomato蛍光を活性化し(
図4B;試料2)、一方、dCas9、sgSV40−5×PBS6272からなる三構成要素CRISPR/Casリプレッサー複合体の発現は、EGFP蛍光を減少させた(
図4B;試料4)。アクチベーターおよびリプレッサー複合体両方の同時発現は、それぞれ、同時に、tdTomatoの活性化およびEGFP導入遺伝子の抑制を誘導し(
図4B、試料6)、異なるエフェクター機能を含む対象の三構成要素CRISPR/Cas複合体が、同じ細胞内で作動可能であり、そしてそのターゲットで、異なるアウトプットを生じうることを立証する。
【0253】
多様なエフェクターを補充する際の対象の系の多用途性をさらに確認するため、KRAB−PUFaリプレッサー融合体、ならびにPUFc−p65HSF1アクチベーター融合体を構築した。レポーター細胞株、HEK293T/TetO::tdTomato/SV40::EGFPにおいて、TetO::tdTomatoレポーター遺伝子は、dCas9/PUFc−p65HSF1/sgTetO−PBScによって効率的に活性化されることが可能である一方、SV40::EGFP発現は、dCas9/KRAB−PUFa/sgSV40−PBSaによって有意に抑制される(
図4C)。両方の系を適用した際、同時の、TetO::tdTomato活性化およびSV40::EGFP発現抑制が達成された(
図4C)。非ターゲティング(sg対照)sgRNAを用いた際、またはPUF融合体を省いた際、それぞれのレポーターの蛍光レベルは影響を受けず、レポーターに対する影響が特異的であり、そしてターゲットでの同族dCas9/sgRNA−PBSによって補充されるエフェクターの作用によるものであることが示される。
【0254】
次に、この戦略を用いて、多数の内因性遺伝子の発現を独立に制御することが可能であるかどうかを試験した。PUFb−p65HSF1がOCT4プロモーターに補充され、そしてBFPKRAB−PUFaがSOX2プロモーターに補充されるように、sgRNA−PBSbおよびsgRNA−PBSaのターゲティング配列を変化させることによって、対象の三構成要素モジュールを内因性ターゲット遺伝子に向けた。レポーター遺伝子実験からの結果と同様、エフェクター仲介性の同時のそして独立の、OCT4活性化およびSOX2抑制が達成された(
図4D)。
【0255】
実施例6 対象の三構成要素CRISPR/Cas複合体/系によるヒストンアセチルトランスフェラーゼ(HAT)ドメインの補充は、エンハンサー活性化を達成する
人工的な転写因子系を用いて、エピジェネティック修飾因子を補充して、遺伝子を活性化するかまたは抑制する。最近の実験は、ヒストンアセチルトランスフェラーゼ(HAT)を用いて、エンハンサーを活性化している。対象の三構成要素系が、HATドメインの多数の分子を補充して、エピジェネティック編集の効率を増加させることが可能であることを立証するため、OCT4をモデル遺伝子として用いたが、これはOCT4のエンハンサーおよびプロモーターがよく定義されており、そしてエンハンサー使用の選択が、胚性幹細胞状態に応じて、生物学的に重要であるためである。
【0256】
この実験において、近位プロモーター(PP)、近位エンハンサー(PE)および遠位エンハンサー(DE)が、各々4つの異なるsgRNA−PBSでターゲティングされた(
図5A)。CREB結合タンパク質(CBP)由来のHATおよびdCas9のC末端の間の直接融合体(dCas9::CBPHAT)を構築し、N末端融合モジュールCBPHAT::PUFa、およびC末端融合モジュールPUFa::CBPHATもまた構築した。次いで、PP、PEおよびDEへの結合を通じたOCT4発現の活性化におけるその活性を試験した。
【0257】
図5Bに示すように、dCas9::CBPHATおよびCBPHAT::PUFaは、近位プロモーター(PP)で類似の活性を有する。興味深いことに、sgRNAと5×PBSaをカップリングした際、対象の三構成要素モジュールは、エンハンサーPEおよびDEの両方を通じて、OCT4遺伝子を活性化する、より高い効率を有し、N末端融合体CBPHAT::PUFaが最高の活性化を生じる。次に、単一のsgRNA−5×PBSaにより、PP、PEおよびDEによって導かれるCBPHAT::PUFaの活性を分析した(
図5C)。4つのsgRNA−5×PBSaカクテルを用いるよりもより小さい倍変化であったが、単一sgRNA−5×PBSaは、これらの要素をターゲティングすることを通じて、OCT4遺伝子の発現を活性化させることが可能であった(
図5C)。
【0258】
実施例7 対象の三構成要素CRISPR/Cas複合体/系は、テロメアの蛍光タグ化を可能にする
転写制御に加えて、dCas9−エフェクターの別の重要な適用は、生存細胞画像化のため、ゲノム遺伝子座を標識することである。本実施例は、対象の三構成要素CRISPR/Cas複合体/系を、染色体遺伝子座の蛍光タグ化、例えばテロメアの標識に使用可能であることを立証する。
【0259】
本発明者らは、PUFaドメインに融合した蛍光タンパク質を補充するため、テロメアをターゲティングするよう設計したsgRNA(sgテロメア)に、0、5、15、または25コピーのPBSaを付加した(
図6A)。sgテロメア―5xPBSa、15xPBSaおよび25xPBSaと、dCas9およびクローバー::PUFaの発現は、テロメア標識と一致する緑色蛍光フォーカスを生じる一方、PBSa部位を持たないsgRNAの発現は、いかなるフォーカスも生じなかった(
図6B)。対象の三構成要素系が導く蛍光シグナルが、実際にテロメアに局在することを確認するため、テロメアリピート結合因子TRF2に対する抗体を用いた同時標識実験を行った。三構成要素系テロメアシグナルは、TRF標識と大部分重複し(
図6C)、クローバー−PUFaを補充するPBSa部位が付加されたsgRNAによるテロメアの非常に特異的な標識が示された。
【0260】
興味深いことに、テロメア標識の強度は、より多くのコピーのPBSがテロメア−sgRNAに付加されるにつれて増加した(
図6B)。フォーカスの数の定量化およびシグナル対ノイズ比(フォーカス中の%GFP/核中の総GFP)は、5、15〜25xPBSaを含むsgRNAを用いた実験から進行性の増加が示され(
図6Dおよび6E)、ターゲット遺伝子座での標識強度の力価決定を可能にする対象の三構成要素系の多量体化特徴が示された。
【0261】
実施例8 対象の三構成要素CRISPR/Cas複合体/系は、テロメアおよびセントロメアの同時の蛍光タグ付けを可能にする
本実施例は、対象の三構成要素CRISPR/Cas複合体/系が、多重化特徴を用いることによって、1より多い(例えば2つの)ゲノム遺伝子座を、同じ細胞において同時に標識可能であることを立証する。
【0262】
対象の三構成要素系が、2つのゲノム遺伝子座を同時に標識する能力をさらに立証するため、セントロメアをターゲティングするように、PUFcに対する結合部位が付加されたsgRNAを設計した(sgセントロメア−20xPBSc)。対象の三構成要素系によるセントロメアの標識、および抗CREST抗体を用いた免疫染色を観察し、そして確認した(
図6F)。クローバー−PUFb/sgセントロメア−20xPBSc、Ruby−PUFa/sgテロメア−25xPBSaおよびdCas9をHEK293T細胞内に同時導入した際、同じ細胞におけるセントロメアおよびテロメア両方の独立の標識が観察され(
図6G)、対象の三構成要素系を用いて、多数のゲノム遺伝子座を独立に標識可能であることが立証された。
【0263】
実施例9 対象の三構成要素CRISPR/Cas複合体/系は、非リピート染色体遺伝子座の蛍光タグ付けを可能にする
dCas9:GFPを用いて、非反復DNAを標識する以前の研究は、こうした非リピート領域を標識するために、十分なシグナルを濃縮するには、>32のターゲティング事象が必要であると報告した。本実施例は、PUF蛍光タンパク質融合体に関する多数の結合部位を取り込むことによって、蛍光シグナルをターゲット部位で濃縮させて、こうして非リピートDNAの検出に必要なターゲティング部位の量を減少させることも可能であることを立証する。
【0264】
MUC4遺伝子座での非リピート領域を本実施例で試験した。各々、15xPBS32を宿する7つのsgRNA、クローバー::PUF(3−2)およびdCas9を用いると、MUC4標識のものを反映する標識パターンが成功裡に検出された(
図7)。これは、対象の三構成要素CRISPR/Cas複合体/系を用いて、定義されたゲノム遺伝子座で、タンパク質を「重合」させることが可能であり、これによって、画像化分野において、対象の三構成要素CRISPR/Cas複合体/系の適用が可能になり、そして非常に拡大されることを立証する。
【0265】
上記実施例は、転写制御因子、エピジェネティック修飾因子、および蛍光タンパク質を含めて、対象の三構成要素CRISPR/Cas複合体/系が、多重化(
図8A)、複合体形成(
図8C)、およびタンパク質の重合(
図8B)を達成する能力を立証し、そして系は、独立に、これらを定義されたゲノム遺伝子座に導くことが可能である。これによって、多数の遺伝子座での複雑な分子の振る舞いの構築が可能であり、そして定義された化学量論でのタンパク質複合体の研究および再構成が可能になる。対象の三構成要素CRISPR/Cas複合体/系の重合特徴は、定義されたゲノム遺伝子座での酵素活性または他のタンパク質の濃縮を可能にして、酵素活性の効果を増加させるか、または染色体画像化のような適用のためにシグナルを濃縮する。
【0266】
より具体的には、対象の三構成要素系のいくつかの主な利点には、以下が含まれる:(A)多重化。対象の三構成要素系の異なるモジュールを、細胞内に同時に送達することが可能であり、そして各々は、独立に(すなわち他のモジュールおよびそのターゲット部位との干渉を伴わずに)定義されたターゲット部位で作動可能である。PUFドメインは、任意の8量体RNAモチーフを認識するために容易にプログラミング可能であるため、これは、独立モジュールの潜在的な数を、4
8(65536)の理論的最大値に拡大する。PUFアレイを別のものの内部に挿入することによって、認識部位を16量体RNAモチーフにプログラムすることも可能であり、配列スペースは4
16(42億9千万)となる。(B)多量体化:直鎖8量体PBSモチーフの単純性は、sgRNA転写またはCas9/sgRNA DNA結合活性を妨害することなく、sgRNA−PBS上のPUF融合体の拡張された多量体化を可能にする。この特徴は、多数の分子のPUF融合体が、sgRNA上で組み立てられることを可能にし、エフェクターまたはタンパク質タグの局在化濃縮を可能にする。これは、蛍光画像化または転写制御のために特に有益である。テロメアのようなリピート配列を標識する上記実験で示されるように、より多くのPBSを含むsgRNA−PBSは、テロメアフォーカスでのシグナルを増加させる。この特徴は、通常、30より多いsgRNAのタイリングが必要である非リピート配列の標識を容易にしうる。直接dCas9−HAT融合体に対して、本系を用いたHAT仲介エンハンサー活性化のより高い効率が観察された。多量体化は、大きなエピジェネティックドメイン、例えばスーパーエンハンサーまたはインプリンティングされた遺伝子座の再プログラミングに有用な人工的エピジェネティック因子によって導かれるエピジェネティック修飾の伝播を容易にしうることが意図される。(C)化学量論的に定義された複合体形成:本明細書において、直接試験していないが、sgRNA−PBSが、化学量論的に定義されたタンパク質複合体のPUF誘導性組み立てのためのRNA足場として作用しうることが意図される。特に、多様な特異性を持つ多様な数のPBSコピーを、sgRNAに付加させて、定義される化学量論を伴い、同時にsgRNA−PBSに沿って定義される順序を伴う、多タンパク質複合体形成を可能にすることも可能である。
【0267】
上記実施例で用いる材料および方法を、以下に収集する。
クローニング
ベクター、そのAddgene実体への連結のリストを、以下の表S1に提供する。クローニング戦略の詳細な説明および配列を以下に提供する。
【0268】
N末端NLSを含むPUFa[PUF(3−2)]およびPUFb[PUF(6−2/7−2)]を、これらのコード配列を含有する構築物から、SgrAIおよびPacI部位を含有するプライマーで増幅し、そしてpAC164:pmax−dCas9Master_VP64からSgrAI−dCas9−FseIを置換して、pAC1355:pmax−NLSPUFa_VP64およびpAC1356:pmax−NLSPUFb_VP64を生成した。NLSPUFbのリピート4までの5’断片およびNLSPUFaのリピート5から末端までの3’断片を用いた融合PCRを用いて、pAC1357:pmax−NLSPUFw_VP64を生成した。NLSPUFaの5’断片とNLSPUbの3’断片の融合PCRを用いて、pAC1358:pmax−NLSPUFc_VP64を生成した。
【0269】
p65HSF1アクチベーターORFを、FseI PacI部位を含むMS2−P65−HSF1_GFP(Addgene:61423)から増幅し、pAC164中のVP64断片を置換して、pAC1410:pmax−dCas9_p65HSF1を生成し、そしてpAC1355およびpAC1358中のVP64を置換して、それぞれ、pAC1393:pmax−NLSPUFa_p65HSF1およびpAC1411:pmax−NLSPUFc_p65HSF1を生成した。
【0270】
クローバーおよびmRuby2を、それぞれ、pcDNA3−クローバー(Addgene #40259)およびpcDNA3−mRuby2(Addgene #40260)から、SgrAIおよびFseIクローニング部位を含有するプライマーで増幅し、上記pAC1356〜1358から増幅された多様なFseI−PUF−PacIおよびpAC149:pCR8−dCas9VP160(Addgene #48221)から消化したベクターと連結して、それぞれ、クローバー_PUFaおよびクローバー_PUFc、mRuby2_PUFaのORFを含有するゲートウェイドナーベクター、pAC1402、pAC1403およびpAC1404を生成した。これらのORFを次いで、pAC1119:PB3−neo(−)−pmaxDEST(+)と、LRクロナーゼ(Invitrogen)により組み換えることによって、PB3−neoベクターにトランスファーして、発現ベクターpAC1360(クローバー_PUFa)、pAC1381(クローバー_PUFc)およびpAC1362(mRuby2_PUFa)を生成した。
【0271】
NLSKRABリプレッサードメインを、AgeI−ClaI部位を含有するプライマーを用いて、SOX2 TALEリプレッサー(KRAB 1−75)(Addgene #42945)から増幅し、そしてAclI PacI部位を含有するプライマーで増幅したNLSPUFa、およびベクターとしてのSgrAI−PacI消化したpAC1360と連結して、pAC1412:PB3−neo(−)−pmax−NLSKRAB_NLSPUFaを生成した。
【0272】
FseI−p65HSF1−PacI断片をpAC1393から放出させて、そしてpAC1356から放出させたSgrAI−NLSPUMb断片、およびベクターとして、SgrAI−PacIで消化したpAC1360と連結して、pAC1413:PB3−neo(−)−pmax−NLSPUFb_p65HSF1を生成した。BFPKRAB断片をpHR−SFFV−dCas9−BFP−KRAB(Addgene #46911)から増幅し、そしてこれを用いてpAC1360からクローバー断片を置換して、pAC1414:PB3−neo(−)−pmax−BFPKRAB_NLSPUFaを生成した。次いで、NheI−CAGGS−NLSPUFb_p65HSF1−NheI断片を、pAC1413から増幅して、そしてNheIで消化したpAC1414内に挿入して、BFPKRAB−NLSPUFaおよびNLSPUFb−p65HSF1の二重発現ベクター(pAC1414:PB3−NLSPUFb_p65HSF1(−)neo(−)−BFPKRAB2_NLSPUFa)を生成した。
【0273】
改善されたリンカー配列、およびPUFのN末端の3つの過剰なNLSおよびC末端の1つのさらなるNLS、ならびにN末端(SgrAI、ClaI)およびC末端(FseI−PacI)挿入のためのクローニング部位を含む4つのゲートウェイドナーベクターを生成した(pAC1404〜1408)。FseI−PacI部位を含有するプライマーを用いて、マウスcDNAを用い、マウスCrebbp遺伝子からHAT配列を増幅し、そしてpAC164に挿入して、pAC1364:pmax−dCas9Master_CBPHATを生成し、そしてpAC1405に挿入して、pAC1415:pCR8−4×NLSPUFa_2×NLS_CBPHATを生成した。SgrAI−AclI部位を含有するプライマーの別の対を用いて、HAT配列を増幅し、そしてpAC1405のSgrAI−ClaI部位にクローニングして、pAC1416:pCR8−CBPHAT_4×NLSPUFa_2×NLSを生成した。pAC1415およびpAC1416をpAC90:pmax−DEST(Addgene #48222)内に組み換えて、それぞれ、発現ベクターpAC1417:pmax−4×NLSPUFa_2×NLS_CBPHATおよびpAC1418:pmax−CBPHAT_4×NLSPUFa_2×NLSを生成した。FseI−mCherry−PacI断片を、mCherry配列を含有するプラスミドから増幅し、そしてSgrAI−dCas9−FseIとともに、PB3−neo(−)−pmaxに連結させて、pAC1419:PB3−neo(−)−pmax−dCas9Master_mCherryを生成した。
【0274】
sgRNA−PBSの発現ベクターを以下のように構築した:まず、ガイド配列のオリゴクローニングのためのBbsI、およびPBS挿入のための3’ BsaI(ターミネーターの右上流)を含む、sgF+Eに基づくsgRNA足場を、gBlock(IDT)として注文し、そしてpX330(Addgene #42230)にクローニングして、AflIII−NotI領域を置換して、ベクターpAC1394:pX−sgFE−BsaI(AGAT)を生成した。次いで、各々、ggcスペーサーによって分離され、一方で、5’−AGAT−3’オーバーハング、そしてもう一方で5’−ATCT−3’が隣接した5×PBSaをコードするオリゴを、T4PNKで処理し、そしてアニーリングして、そしてBsaIで消化した(適合するオーバーハングを生成するため)pAC1394内に連結した。次いで、クローンを、1コピー(5×PBS)、2コピー(10×PBS)等の、異なる数のPBSのオリゴ挿入物に関してスクリーニングした。1×PBSおよび2×PBSベクターに関しては、1つのPBS部位を含有するオリゴを用いてこれらを構築した。次いで、各ターゲットに関するガイド配列を、先に記載されるように、BbsI部位を通じてsgRNA−PBS発現ベクター上にクローニングした。GFP発現マーカーを含むsgRNA発現ベクターに関しては、pXベクター由来のsgRNA−PBS発現カセットを、AscI部位を通じてPB−GFPベクター上にトランスファーすることによって、これらを構築した。異なるsgRNA発現構築物を表S1に列挙する。
【0275】
実験のための細胞培養
10%ウシ胎児血清(FBS)(Lonza)、4%Glutamax(Gibco)、1%ピルビン酸ナトリウム(Gibco)およびペニシリン−ストレプトマイシン(Gibco)を含むダルベッコの修飾イーグル培地(DMEM)(Sigma)中で、HEK293T細胞を培養した。インキュベーター条件は、37℃および5%CO
2であった。活性化実験のため、200ngのdCas9構築物、100ngの修飾sgRNAおよび100ngのPUF融合体で、Attracteneトランスフェクション試薬(Qiagen)を用いてトランスフェクションする前日に、細胞を、12ウェルプレートに、ウェルあたり100,000細胞で植え付けた。トランスフェクション後、細胞を48時間増殖させ、そしてRNA抽出または蛍光活性化細胞ソーティング(FACS)のいずれかのため、採取した。二重活性化抑制実験に関しては、トランスフェクションは同じままであるが、FACSのために採取する前に、細胞を、ウェルあたり150,000細胞で12ウェルプレートに植え付け、そして72時間増殖させた。OCT4およびSOX2二重活性化−抑制実験のため、RNA抽出前に、細胞をBFP(アクチベーター−リプレッサーモジュールPUFb−p65HSF1/BFPKRAB−PUFaに関して)、mCherry(dCas9mCherryに関して)およびGFP(EGFPを同時発現するベクター上のsgRNA−PBSに関して)によって三重ソーティングした。画像化実験のため、50ngのdCas9構築物、500ngの修飾sgRNA、および50ngのPUF蛍光融合体で、Attracteneトランスフェクション試薬を用いてトランスフェクションする前日に、細胞を、ウェルあたり300,000細胞で22x22x1顕微鏡カバーガラスを含む6ウェルプレート内に植え付けた。トランスフェクション後、細胞を48時間増殖させて、次いで、免疫染色した。
【0276】
定量的RT−PCR分析
細胞をトリプシンで採取し、ダルベッコのリン酸緩衝生理食塩水(dPBS)で洗浄し、125gで5分間遠心分離し、そして次いで、RNeasy Plusミニキット(Qiagen)を用いてRNAを抽出した。1μgのRNAとともに、Applied Biosystems高容量RNA−to−cDNAキットを用いて、cDNAライブラリーを作製した。内因性対照としてGAPDH(Hs03929097、VIC)を、そしてターゲットとしてOCT4(Hs00999632、FAM)およびSOX2(Hs01053049、FAM)を用いて、TaqMan遺伝子発現アッセイ(Applied Biosystems)を設計した。2μlの1:10希釈cDNAを各反応に用いて、TaqMan普遍的マスターミックスIIを、UNG(Applied Biosystems)と、定量的PCR(qPCR)に用いた。Applied Biosystems ViiA7装置を用いて、活性化を分析した。「デルタデルタCt」アルゴリズムによって遺伝子発現レベルを計算し、そして対照試料に対して規準化した。
【0277】
蛍光活性化細胞ソーティング
細胞をトリプシン処理し、そして2%パラホルムアルデヒドで10分間固定した。その後、細胞を125gで5分間遠心分離し、そしてdPBS中に再懸濁した。CellQuest Proソフトウェア(BD Bioscience)を用いて、FACScaliburフローサイトメーター上で、試料を分析した。各実行で1000事象を収集した。
【0278】
免疫染色および顕微鏡検査
カバーガラス上に接着した細胞を、2%パラホルムアルデヒドで固定し、dPBS中の0.1%Triton X−100で洗浄し、dPBS中の0.4%Triton X−100で4℃で5分間透過処理し、5%ブロッティング等級ブロッキング緩衝液(BIO−RAD)で30分間ブロッキングし、ブロッキング緩衝液中の一次抗体と4℃で一晩インキュベーションし、dPBSで3回洗浄し、次いで、暗所で、それぞれのAlexa蛍光コンジュゲート化二次抗体と室温で3時間インキュベーションし、再び洗浄し、そしてDAPIで染色した。画像化の前に、カバーガラスを、グリセロールでスライド上にマウントした。テロメアの免疫染色を、抗TRF2一次抗体(Novus Biologicals:NB110-57130)の1:100希釈、およびAlexa蛍光594コンジュゲート化抗ウサギIgG二次抗体(Invitrogen、A11037)の1:500希釈で行った。CREST抗体(Antibodies Incorporated:15-235-0001)の1:100希釈を、Alexa蛍光594コンジュゲート化抗ヒトIgG二次抗体(Invitrogen、A11014)の1:500希釈と組み合わせて用いて、セントロメアを検出した。
【0279】
上記実施例で用いた構築物のいくつかの配列および関連配列を本明細書において以下に列挙する。
【0280】
【化8】
【0281】
上記配列において、NLS配列は残基6〜12であり、PUFaは残基15〜363であり、そしてVP64は残基371〜421である。
【0282】
【化9】
【0283】
上記配列において、NLS配列は残基6〜12であり、PUFbは残基15〜363であり、そしてVP64は残基371〜421である。
【0284】
【化10】
【0285】
上記配列において、NLS配列は残基6〜12であり、PUFwは残基15〜363であり、そしてVP64は残基371〜421である。
【0286】
【化11】
【0287】
上記配列において、NLS配列は残基6〜12であり、PUFcは残基15〜363であり、そしてVP64は残基371〜421である。
【0288】
【化12】
【0289】
上記配列において、NLS配列は残基264〜270であり、PUFaは残基273〜621であり、そしてクローバーは残基1〜251である。
【0290】
【化13】
【0291】
上記配列において、NLS配列は残基264〜270であり、PUFcは残基273〜621であり、そしてクローバーは残基1〜251である。
【0292】
【化14】
【0293】
上記配列において、NLS配列は残基284〜290であり、PUFaは残基293〜641であり、そして6xHis−mRuby2は、残基6〜11に6xHisタグを含み、残基1〜271である。
【0294】
【化15】
【0295】
上記配列において、NLS配列は残基6〜12であり、PUFaは残基15〜363であり、p65は残基427〜575であり、そしてHSF1は残基584〜707である。
【0296】
【化16】
【0297】
上記配列において、2つのNLS配列は残基4〜10および残基99〜105であり、PUFaは残基108〜456であり、そしてKRABは残基11〜92である。
【0298】
【化17】
【0299】
上記配列において、NLS配列は残基370〜376であり、PUFaは残基379〜727であり、そしてHA−2xNLS−BFPKRABは、残基3〜11にHAタグを含み、残基1〜355である。
【0300】
【化18】
【0301】
上記配列において、2つのNLS配列は残基30〜36および1408〜1414であり、dCas9は残基40〜1406であり、mCherryは残基1436〜1671であり、そしてHAタグは残基20〜28である。
【0302】
【化19】
【0303】
上記配列において、6つの7残基NLS配列は残基773、781、789、826、1185、および1193で始まり、PUFaは残基835〜1183であり、そしてCBPHATは残基2〜764である。
【0304】
【化20】
【0305】
上記配列において、6つの7残基NLS配列は残基10、18、26、63、422、および430で始まり、PUFaは残基72〜420であり、そしてCBPHATは残基458〜1220である。
【0306】
【表11-1】
【0307】
【表11-2】
【0308】
【表11-3】
【0309】
【表11-4】
【0310】
【表11-5】
【0311】
【表11-6】
【0312】
【表11-7】
【0313】
【表11-8】
【0314】
【表11-9】
【0315】
【表11-10】
【0316】
【表12-1】
【0317】
【表12-2】
【0318】
【表12-3】
【0319】
【表12-4】
【0320】
【表12-5】
【0321】
【表12-6】
【0322】
【表12-7】
【0323】
ベクターのリストおよびそのAddgene寄託番号
【0324】
【表13-1】
【0325】
【表13-2】
【0326】
【表13-3】
【0327】
【表13-4】
【0328】
PBSの数および型によるsgRNA−PBS発現ベクターのリスト
【0329】
【表14】