IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ザ・リージエンツ・オブ・ザ・ユニバーシテイー・オブ・カリフオルニアの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-13
(45)【発行日】2024-09-25
(54)【発明の名称】ゲノム編集のための組成物および方法
(51)【国際特許分類】
   C07K 19/00 20060101AFI20240917BHJP
   C07K 14/47 20060101ALI20240917BHJP
   C12N 9/10 20060101ALI20240917BHJP
   C12N 9/14 20060101ALI20240917BHJP
   C12N 15/62 20060101ALI20240917BHJP
   C12N 15/63 20060101ALI20240917BHJP
   C12N 5/10 20060101ALI20240917BHJP
   C12Q 1/68 20180101ALI20240917BHJP
【FI】
C07K19/00 ZNA
C07K14/47
C12N9/10
C12N9/14
C12N15/62 Z
C12N15/63 Z
C12N5/10
C12Q1/68
【請求項の数】 40
(21)【出願番号】P 2020557291
(86)(22)【出願日】2019-04-19
(65)【公表番号】
(43)【公表日】2021-08-30
(86)【国際出願番号】 US2019028377
(87)【国際公開番号】W WO2019204766
(87)【国際公開日】2019-10-24
【審査請求日】2022-04-11
(31)【優先権主張番号】62/660,023
(32)【優先日】2018-04-19
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】507127440
【氏名又は名称】ザ・リージエンツ・オブ・ザ・ユニバーシテイー・オブ・カリフオルニア
(74)【代理人】
【識別番号】110001173
【氏名又は名称】弁理士法人川口國際特許事務所
(72)【発明者】
【氏名】チェン,ジン
(72)【発明者】
【氏名】ギルバート,ルーク
(72)【発明者】
【氏名】ヌーニェス,ジェームズ
(72)【発明者】
【氏名】ワイスマン,ジョナサン
【審査官】福間 信子
(56)【参考文献】
【文献】特表2017-537611(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
C12N
C07K
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
N末端からC末端へと
(i)DNAメチルトランスフェラーゼドメイン、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素、およびクルッペル関連ボックスドメイン、または
(ii)クルッペル関連ボックスドメイン、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素、およびDNAメチルトランスフェラーゼドメインを含む、融合タンパク質。
【請求項2】
前記ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素が、dCas9、ddCpf1、ヌクレアーゼ欠損Cas9バリアント、またはヌクレアーゼ欠損クラスII CRISPRエンドヌクレアーゼである、請求項1に記載の融合タンパク質。
【請求項3】
前記DNAメチルトランスフェラーゼドメインが、Dnmt3Aタンパク質およびDnmt3Lタンパク質(Dnmt3A-3Lドメイン)を含む、請求項1に記載の融合タンパク質。
【請求項4】
前記融合タンパク質が(i)DNAメチルトランスフェラーゼドメイン、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素、およびクルッペル関連ボックスドメインを含む、請求項1に記載の融合タンパク質。
【請求項5】
前記ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素が、dCas9であり、前記DNAメチルトランスフェラーゼドメインが、Dnmt3Aタンパク質およびDnmt3Lタンパク質(Dnmt3A-3Lドメイン)を含む、請求項4に記載の融合タンパク質。
【請求項6】
前記dCas9が、ペプチドリンカーを介して前記Dnmt3A-3Lドメインに共有結合しており、前記dCas9が、ペプチドリンカーを介して前記クルッペル関連ボックスドメインに共有結合している、請求項5に記載の融合タンパク質。
【請求項7】
前記ペプチドリンカーが、XTENリンカーである、請求項6に記載の融合タンパク質。
【請求項8】
前記融合タンパク質が(ii)クルッペル関連ボックスドメイン、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素、およびDNAメチルトランスフェラーゼドメインを含む、請求項1に記載の融合タンパク質。
【請求項9】
前記ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素が、dCas9であり、前記DNAメチルトランスフェラーゼドメインが、Dnmt3Aタンパク質およびDnmt3Lタンパク質(Dnmt3A-3Lドメイン)を含む、請求項8に記載の融合タンパク質。
【請求項10】
前記dCas9が、ペプチドリンカーを介して前記Dnmt3A-3Lドメインに共有結合しており、前記クルッペル関連ボックスドメインが、ペプチドリンカーを介して前記dCas9に共有結合している、請求項9に記載の融合タンパク質。
【請求項11】
前記ペプチドリンカーが、XTENリンカーである、請求項10に記載の融合タンパク質。
【請求項12】
前記ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素が、ペプチドリンカーを介して前記クルッペル関連ボックスドメインに共有結合している、請求項1に記載の融合タンパク質。
【請求項13】
前記ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素が、ペプチドリンカーを介して前記DNAメチルトランスフェラーゼドメインに共有結合している、請求項1に記載の融合タンパク質。
【請求項14】
前記ペプチドリンカーが、XTENリンカーである、請求項12に記載の融合タンパク質。
【請求項15】
前記XTENリンカーが、16~80個のアミノ酸残基を含む、請求項14に記載の融合タンパク質。
【請求項16】
核局在化シグナルペプチドをさらに含む、請求項1に記載の融合タンパク質。
【請求項17】
前記融合タンパク質が、配列番号1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15のアミノ酸配列を含む、請求項1に記載の融合タンパク質。
【請求項18】
請求項1~17のいずれか一項に記載の融合タンパク質をコードする核酸。
【請求項19】
前記核酸が、メッセンジャーRNAである、請求項18に記載の核酸。
【請求項20】
複合体であって、(i)請求項1~17のいずれか一項に記載の融合タンパク質と、(ii)ポリヌクレオチドであって、(a)標的ポリヌクレオチド配列に相補的なDNA標的化配列、および(b)前記ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素の結合配列であって、前記ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素は、前記結合配列を介して前記ポリヌクレオチドに結合している、前記結合配列を含む、ポリヌクレオチドと、を含む、複合体。
【請求項21】
前記標的ポリヌクレオチド配列が、遺伝子の一部である、請求項20に記載の複合体。
【請求項22】
前記標的ポリヌクレオチド配列が、転写調節配列の一部である、請求項20に記載の複合体。
【請求項23】
前記標的ポリヌクレオチド配列が、プロモーター、エンハンサー、またはサイレンサーの一部である、請求項20に記載の複合体。
【請求項24】
前記標的ポリヌクレオチド配列が、転写開始部位に隣接する3000bp以内にある、請求項20に記載の複合体。
【請求項25】
請求項1~17のいずれか一項に記載の融合タンパク質をコードする核酸を含む、ベクター。
【請求項26】
ポリヌクレオチドをさらに含み、前記ポリヌクレオチドが、(a)標的ポリヌクレオチド配列に相補的なDNA標的化配列と、(b)前記ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素の結合配列と、を含む、請求項25に記載のベクター。
【請求項27】
請求項1~17のいずれか一項に記載の融合タンパク質、請求項18もしくは19に記載の核酸、請求項20~24のいずれか一項に記載の複合体、または請求項25もしくは26に記載のベクター、を含む、細胞。
【請求項28】
前記細胞が、真核細胞である、請求項27に記載の細胞。
【請求項29】
前記細胞が、哺乳動物細胞である、請求項27に記載の細胞。
【請求項30】
細胞内の標的核酸をサイレンシングする方法であって、(i)請求項1~17のいずれか一項に記載の融合タンパク質をコードする第1のポリヌクレオチドを、前記標的核酸を含む細胞に送達することと、(ii)第2のポリヌクレオチドであって、(a)前記標的核酸の核酸配列に相補的なDNA標的化配列および(b)前記ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素の結合配列を含む、前記第2のポリヌクレオチド、を前記細胞に送達することと、を含む、方法。
【請求項31】
前記融合タンパク質が、前記標的核酸を含むクロマチンをメチル化することによって、および/または前記標的核酸を含むクロマチンに抑制性クロマチンマークを導入することによって、前記細胞内の前記標的核酸をサイレンシングする、請求項30に記載の方法。
【請求項32】
前記第1のポリヌクレオチドが、第1のベクター内に含まれ、および前記第2のポリヌクレオチドが、第2のベクター内に含まれる、請求項30に記載の方法。
【請求項33】
前記第1のベクターおよび前記第2のベクターが同じである、請求項32に記載の方法。
【請求項34】
前記第1のベクターが前記第2のベクターとは異なる、請求項32に記載の方法。
【請求項35】
前記細胞が、哺乳動物細胞である、請求項30に記載の方法。
【請求項36】
前記方法が、非標的核酸に対する特異性よりも2倍高い特異性を有する、請求項30に記載の方法。
【請求項37】
細胞内の標的核酸をサイレンシングする方法であって、請求項20~24のいずれか一項に記載の複合体を、前記標的核酸を含む細胞に送達することを含む、方法。
【請求項38】
前記複合体が、前記標的核酸を含むクロマチンをメチル化することによって、および/または前記標的核酸を含むクロマチンに抑制性クロマチンマークを導入することによって、前記細胞内の前記標的核酸をサイレンシングする、請求項37に記載の方法。
【請求項39】
前記細胞が、哺乳動物細胞である、請求項37に記載の方法。
【請求項40】
前記方法が、非標的核酸に対する特異性よりも2倍高い特異性を有する、請求項37に記載の方法。
【発明の詳細な説明】
【背景技術】
【0001】
関連出願の相互参照
本出願は、2018年4月19日に提出された米国出願第62/660,023号の優先権を主張し、その開示は、参照によりその全体が本明細書に組み込まれる。
【0002】
連邦政府の助成による研究開発において行われた発明に対する権利に関する陳述
本発明は、国防総省国防高等研究計画局によって授与された助成金番号HR0011-17-2-0043および国立衛生研究所によって授与された助成金番号R01DA036858の下で政府の支援を受けて行われた。政府は、本発明における一定の権利を有する。
【0003】
病気の治療のための有望な治療アプローチと考えられているが、ゲノム編集は二本鎖切断による遺伝毒性の可能性があるため、固有のリスクを伴う。さらに、ゲノム編集は、多くの場合、標的遺伝子に対するオールオアナッシング効果に関連する(つまり、完全なノックアウトを生成する)。対照的に、標的エピゲノム工学は、DSB誘発性の遺伝毒性のリスクを伴わず、さらに、それは遺伝子発現に対してより段階的な効果を生み出す機会を与え、したがって完全なサイレンシングからあまり目立たない効果まで機能する。
【0004】
本明細書で提供されるのは、当技術分野におけるこれらおよび他のニーズに対する解決策である。
【発明の概要】
【0005】
一態様では、ヌクレアーゼ欠損RNA誘導型(RNA-guided)DNAエンドヌクレアーゼ酵素、クルッペル関連ボックス(KRAB)ドメインおよびDNAメチルトランスフェラーゼドメインを含む融合タンパク質が提供される。一態様では、配列番号1~15のいずれか1つの融合タンパク質が提供される。
【0006】
一態様では、実施形態およびその態様を含む、本明細書に記載の融合タンパク質をコードする核酸配列が提供される。
【0007】
一態様では、実施形態およびその態様を含む、本明細書に記載の融合タンパク質と、(1)標的ポリヌクレオチド配列に相補的なDNA標的化配列および(2)ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素の結合配列を含むポリヌクレオチドと、を含む複合体であって、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素は、この結合配列を介してポリヌクレオチドに結合している、複合体を提供する。
【0008】
一態様では、実施形態およびその態様を含む、本明細書に記載の融合タンパク質の核酸配列を含むベクターが提供される。
【0009】
一態様では、実施形態およびその態様を含む本明細書に記載の融合タンパク質を含む細胞、実施形態およびその態様を含む本明細書に記載の核酸、実施形態およびその態様を含む本明細書に記載の複合体、または実施形態およびその態様を含む本明細書に記載のベクターが提供される。
【0010】
一態様では、細胞内の標的核酸配列をサイレンシングする方法であって、実施形態およびその態様を含む本明細書に記載の融合タンパク質をコードする第1のポリヌクレオチドを、標的核酸を含む細胞に送達することと、(i)標的核酸配列に相補的なDNA標的配列、および(ii)ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素の結合配列を含む第2のポリヌクレオチド、をその細胞に送達することと、を含む、方法を提供する。いかなる理論にも拘束されることを意図することなく、融合タンパク質は、標的核酸配列を含むクロマチンをメチル化することによって、および/または標的核酸配列を含むクロマチンに抑制性クロマチンマークを導入することによって、細胞内の標的核酸配列をサイレンシングする、と考えられている。したがって、態様では、融合タンパク質は、標的核酸配列を含むクロマチンをメチル化することによって、および/または標的核酸配列を含むクロマチンに抑制性クロマチンマークを導入することによって、細胞内の標的核酸配列をサイレンシングする。
【0011】
一態様では、実施形態およびその態様を含む本明細書に記載の複合体を標的核酸を含む細胞に送達することを含む、細胞内の標的核酸配列をサイレンシングする方法が提供され、複合体は、細胞内の標的核酸配列をサイレンシングする。いかなる理論にも拘束されることを意図することなく、複合体は、標的核酸配列を含むクロマチンをメチル化することによって、および/または標的核酸配列を含むクロマチンに抑制性クロマチンマークを導入することによって、細胞内の標的核酸配列をサイレンシングする、と考えられている。したがって、態様では、複合体は、標的核酸配列を含むクロマチンをメチル化することによって、および/または標的核酸配列を含むクロマチンに抑制性クロマチンマークを導入することによって、細胞内の標的核酸配列をサイレンシングする。
【図面の簡単な説明】
【0012】
図1A】長期遺伝子サイレンシングのためのオールインワンタンパク質のエンジニアリングについて説明する。図1Aは、GGSGGGS(配列番号17)リンカーによって隔てられているdCas9(配列番号23)の-N末端に融合されたKRABドメインおよびdCas9のC末端にDnmt3A-Dnmt3L(EASGSGRASPGIPGSTR(配列番号19)リンカーによって隔てられている)を有する本開示のオールインワンタンパク質(配列番号1)の概略図である。図1Bは、永続的な遺伝子サイレンシングについて試験されたdCas9融合エピジェネティックモジュレーターの概略図を提供する。dCas9-KRABタンパク質は、CRISPR干渉(CRISPRi)適用に関するGilbert et al.,Cell 2013から採用される。dCas9-Dnmt3A-Dnmt3L融合は、Stepper et al.,Nucleic Acids Research,2016から採用される。本発明者らは、KRABドメイン(配列番号16)、dCas9(D10A、H208A)、Dnmt3A-Dnmt3L(配列番号33、ここで、Dnmt3Aは配列番号26でありかつDnmt3Lは配列番号28である)を1つのポリペプチドに統合する新規なオールインワンタンパク質を設計した。図1Cは、オールインワンタンパク質による長期サイレンシングを評価するために使用されたメチル化感受性GFPレポーター(Stelzer et al.,Cell 2015から採用)の概略図を示す。図1D~1Eは、図3に示されるGFPレポーターを発現するHEK293T細胞におけるヒットエンドラン実験ワークフローの図および結果を提供する。図1Dは、プラスミドが細胞内にコトランスフェクトされたことを示し、一方はヒットエンドランタンパク質をコードし、もう一方はsgRNAをコードするプラスミドである。図1Eは、オールインワンプラスミドおよびsgRNAプラスミドでコトランスフェクトされた細胞について選別されたヒットエンドランアッセイの結果を示す。図1Fは、GFPレポーターのサイレンシングの結果がsgRNA配列に依存していることを示す。
図1B】長期遺伝子サイレンシングのためのオールインワンタンパク質のエンジニアリングについて説明する。図1Aは、GGSGGGS(配列番号17)リンカーによって隔てられているdCas9(配列番号23)の-N末端に融合されたKRABドメインおよびdCas9のC末端にDnmt3A-Dnmt3L(EASGSGRASPGIPGSTR(配列番号19)リンカーによって隔てられている)を有する本開示のオールインワンタンパク質(配列番号1)の概略図である。図1Bは、永続的な遺伝子サイレンシングについて試験されたdCas9融合エピジェネティックモジュレーターの概略図を提供する。dCas9-KRABタンパク質は、CRISPR干渉(CRISPRi)適用に関するGilbert et al.,Cell 2013から採用される。dCas9-Dnmt3A-Dnmt3L融合は、Stepper et al.,Nucleic Acids Research,2016から採用される。本発明者らは、KRABドメイン(配列番号16)、dCas9(D10A、H208A)、Dnmt3A-Dnmt3L(配列番号33、ここで、Dnmt3Aは配列番号26でありかつDnmt3Lは配列番号28である)を1つのポリペプチドに統合する新規なオールインワンタンパク質を設計した。図1Cは、オールインワンタンパク質による長期サイレンシングを評価するために使用されたメチル化感受性GFPレポーター(Stelzer et al.,Cell 2015から採用)の概略図を示す。図1D~1Eは、図3に示されるGFPレポーターを発現するHEK293T細胞におけるヒットエンドラン実験ワークフローの図および結果を提供する。図1Dは、プラスミドが細胞内にコトランスフェクトされたことを示し、一方はヒットエンドランタンパク質をコードし、もう一方はsgRNAをコードするプラスミドである。図1Eは、オールインワンプラスミドおよびsgRNAプラスミドでコトランスフェクトされた細胞について選別されたヒットエンドランアッセイの結果を示す。図1Fは、GFPレポーターのサイレンシングの結果がsgRNA配列に依存していることを示す。
図1C】長期遺伝子サイレンシングのためのオールインワンタンパク質のエンジニアリングについて説明する。図1Aは、GGSGGGS(配列番号17)リンカーによって隔てられているdCas9(配列番号23)の-N末端に融合されたKRABドメインおよびdCas9のC末端にDnmt3A-Dnmt3L(EASGSGRASPGIPGSTR(配列番号19)リンカーによって隔てられている)を有する本開示のオールインワンタンパク質(配列番号1)の概略図である。図1Bは、永続的な遺伝子サイレンシングについて試験されたdCas9融合エピジェネティックモジュレーターの概略図を提供する。dCas9-KRABタンパク質は、CRISPR干渉(CRISPRi)適用に関するGilbert et al.,Cell 2013から採用される。dCas9-Dnmt3A-Dnmt3L融合は、Stepper et al.,Nucleic Acids Research,2016から採用される。本発明者らは、KRABドメイン(配列番号16)、dCas9(D10A、H208A)、Dnmt3A-Dnmt3L(配列番号33、ここで、Dnmt3Aは配列番号26でありかつDnmt3Lは配列番号28である)を1つのポリペプチドに統合する新規なオールインワンタンパク質を設計した。図1Cは、オールインワンタンパク質による長期サイレンシングを評価するために使用されたメチル化感受性GFPレポーター(Stelzer et al.,Cell 2015から採用)の概略図を示す。図1D~1Eは、図3に示されるGFPレポーターを発現するHEK293T細胞におけるヒットエンドラン実験ワークフローの図および結果を提供する。図1Dは、プラスミドが細胞内にコトランスフェクトされたことを示し、一方はヒットエンドランタンパク質をコードし、もう一方はsgRNAをコードするプラスミドである。図1Eは、オールインワンプラスミドおよびsgRNAプラスミドでコトランスフェクトされた細胞について選別されたヒットエンドランアッセイの結果を示す。図1Fは、GFPレポーターのサイレンシングの結果がsgRNA配列に依存していることを示す。
図1D】長期遺伝子サイレンシングのためのオールインワンタンパク質のエンジニアリングについて説明する。図1Aは、GGSGGGS(配列番号17)リンカーによって隔てられているdCas9(配列番号23)の-N末端に融合されたKRABドメインおよびdCas9のC末端にDnmt3A-Dnmt3L(EASGSGRASPGIPGSTR(配列番号19)リンカーによって隔てられている)を有する本開示のオールインワンタンパク質(配列番号1)の概略図である。図1Bは、永続的な遺伝子サイレンシングについて試験されたdCas9融合エピジェネティックモジュレーターの概略図を提供する。dCas9-KRABタンパク質は、CRISPR干渉(CRISPRi)適用に関するGilbert et al.,Cell 2013から採用される。dCas9-Dnmt3A-Dnmt3L融合は、Stepper et al.,Nucleic Acids Research,2016から採用される。本発明者らは、KRABドメイン(配列番号16)、dCas9(D10A、H208A)、Dnmt3A-Dnmt3L(配列番号33、ここで、Dnmt3Aは配列番号26でありかつDnmt3Lは配列番号28である)を1つのポリペプチドに統合する新規なオールインワンタンパク質を設計した。図1Cは、オールインワンタンパク質による長期サイレンシングを評価するために使用されたメチル化感受性GFPレポーター(Stelzer et al.,Cell 2015から採用)の概略図を示す。図1D~1Eは、図3に示されるGFPレポーターを発現するHEK293T細胞におけるヒットエンドラン実験ワークフローの図および結果を提供する。図1Dは、プラスミドが細胞内にコトランスフェクトされたことを示し、一方はヒットエンドランタンパク質をコードし、もう一方はsgRNAをコードするプラスミドである。図1Eは、オールインワンプラスミドおよびsgRNAプラスミドでコトランスフェクトされた細胞について選別されたヒットエンドランアッセイの結果を示す。図1Fは、GFPレポーターのサイレンシングの結果がsgRNA配列に依存していることを示す。
図1E】長期遺伝子サイレンシングのためのオールインワンタンパク質のエンジニアリングについて説明する。図1Aは、GGSGGGS(配列番号17)リンカーによって隔てられているdCas9(配列番号23)の-N末端に融合されたKRABドメインおよびdCas9のC末端にDnmt3A-Dnmt3L(EASGSGRASPGIPGSTR(配列番号19)リンカーによって隔てられている)を有する本開示のオールインワンタンパク質(配列番号1)の概略図である。図1Bは、永続的な遺伝子サイレンシングについて試験されたdCas9融合エピジェネティックモジュレーターの概略図を提供する。dCas9-KRABタンパク質は、CRISPR干渉(CRISPRi)適用に関するGilbert et al.,Cell 2013から採用される。dCas9-Dnmt3A-Dnmt3L融合は、Stepper et al.,Nucleic Acids Research,2016から採用される。本発明者らは、KRABドメイン(配列番号16)、dCas9(D10A、H208A)、Dnmt3A-Dnmt3L(配列番号33、ここで、Dnmt3Aは配列番号26でありかつDnmt3Lは配列番号28である)を1つのポリペプチドに統合する新規なオールインワンタンパク質を設計した。図1Cは、オールインワンタンパク質による長期サイレンシングを評価するために使用されたメチル化感受性GFPレポーター(Stelzer et al.,Cell 2015から採用)の概略図を示す。図1D~1Eは、図3に示されるGFPレポーターを発現するHEK293T細胞におけるヒットエンドラン実験ワークフローの図および結果を提供する。図1Dは、プラスミドが細胞内にコトランスフェクトされたことを示し、一方はヒットエンドランタンパク質をコードし、もう一方はsgRNAをコードするプラスミドである。図1Eは、オールインワンプラスミドおよびsgRNAプラスミドでコトランスフェクトされた細胞について選別されたヒットエンドランアッセイの結果を示す。図1Fは、GFPレポーターのサイレンシングの結果がsgRNA配列に依存していることを示す。
図1F】長期遺伝子サイレンシングのためのオールインワンタンパク質のエンジニアリングについて説明する。図1Aは、GGSGGGS(配列番号17)リンカーによって隔てられているdCas9(配列番号23)の-N末端に融合されたKRABドメインおよびdCas9のC末端にDnmt3A-Dnmt3L(EASGSGRASPGIPGSTR(配列番号19)リンカーによって隔てられている)を有する本開示のオールインワンタンパク質(配列番号1)の概略図である。図1Bは、永続的な遺伝子サイレンシングについて試験されたdCas9融合エピジェネティックモジュレーターの概略図を提供する。dCas9-KRABタンパク質は、CRISPR干渉(CRISPRi)適用に関するGilbert et al.,Cell 2013から採用される。dCas9-Dnmt3A-Dnmt3L融合は、Stepper et al.,Nucleic Acids Research,2016から採用される。本発明者らは、KRABドメイン(配列番号16)、dCas9(D10A、H208A)、Dnmt3A-Dnmt3L(配列番号33、ここで、Dnmt3Aは配列番号26でありかつDnmt3Lは配列番号28である)を1つのポリペプチドに統合する新規なオールインワンタンパク質を設計した。図1Cは、オールインワンタンパク質による長期サイレンシングを評価するために使用されたメチル化感受性GFPレポーター(Stelzer et al.,Cell 2015から採用)の概略図を示す。図1D~1Eは、図3に示されるGFPレポーターを発現するHEK293T細胞におけるヒットエンドラン実験ワークフローの図および結果を提供する。図1Dは、プラスミドが細胞内にコトランスフェクトされたことを示し、一方はヒットエンドランタンパク質をコードし、もう一方はsgRNAをコードするプラスミドである。図1Eは、オールインワンプラスミドおよびsgRNAプラスミドでコトランスフェクトされた細胞について選別されたヒットエンドランアッセイの結果を示す。図1Fは、GFPレポーターのサイレンシングの結果がsgRNA配列に依存していることを示す。
図2A】内在性遺伝子の長期サイレンシングについて説明する。図2A~2Cは、オールインワンタンパク質を使用する長期サイレンシングのための遺伝子(CD29、CD81、CD151)標的化に続くトランスフェクションの22日後に取得された代表的なフローサイトメトリーデータである。象限IVは、遺伝子がオフになっている細胞を表し、遺伝子がオフになっている細胞のパーセンテージ(すなわち、それぞれ45%、66%、53%)で示した。図2Dは、3つの異なるsgRNAによるCD29、CD81、およびCD151のサイレンシングの定量化を提供する。図2Eは、異なる遺伝子を標的とするsgRNAの同時送達によってオールインタンパク質が多重化され得ることを示すため、2つまたは3つの遺伝子を同時にサイレンシングすることの定量化を提供する。図2Fは、細胞の大部分がCLTA遺伝子を安定的にオフにしていることを意味する、オールインワンタンパク質およびCLTA遺伝子を標的とするsgRNAのトランスフェクションの9ヶ月後に取得された時点を表すプロットを提供する。
図2B】内在性遺伝子の長期サイレンシングについて説明する。図2A~2Cは、オールインワンタンパク質を使用する長期サイレンシングのための遺伝子(CD29、CD81、CD151)標的化に続くトランスフェクションの22日後に取得された代表的なフローサイトメトリーデータである。象限IVは、遺伝子がオフになっている細胞を表し、遺伝子がオフになっている細胞のパーセンテージ(すなわち、それぞれ45%、66%、53%)で示した。図2Dは、3つの異なるsgRNAによるCD29、CD81、およびCD151のサイレンシングの定量化を提供する。図2Eは、異なる遺伝子を標的とするsgRNAの同時送達によってオールインタンパク質が多重化され得ることを示すため、2つまたは3つの遺伝子を同時にサイレンシングすることの定量化を提供する。図2Fは、細胞の大部分がCLTA遺伝子を安定的にオフにしていることを意味する、オールインワンタンパク質およびCLTA遺伝子を標的とするsgRNAのトランスフェクションの9ヶ月後に取得された時点を表すプロットを提供する。
図2C】内在性遺伝子の長期サイレンシングについて説明する。図2A~2Cは、オールインワンタンパク質を使用する長期サイレンシングのための遺伝子(CD29、CD81、CD151)標的化に続くトランスフェクションの22日後に取得された代表的なフローサイトメトリーデータである。象限IVは、遺伝子がオフになっている細胞を表し、遺伝子がオフになっている細胞のパーセンテージ(すなわち、それぞれ45%、66%、53%)で示した。図2Dは、3つの異なるsgRNAによるCD29、CD81、およびCD151のサイレンシングの定量化を提供する。図2Eは、異なる遺伝子を標的とするsgRNAの同時送達によってオールインタンパク質が多重化され得ることを示すため、2つまたは3つの遺伝子を同時にサイレンシングすることの定量化を提供する。図2Fは、細胞の大部分がCLTA遺伝子を安定的にオフにしていることを意味する、オールインワンタンパク質およびCLTA遺伝子を標的とするsgRNAのトランスフェクションの9ヶ月後に取得された時点を表すプロットを提供する。
図2D】内在性遺伝子の長期サイレンシングについて説明する。図2A~2Cは、オールインワンタンパク質を使用する長期サイレンシングのための遺伝子(CD29、CD81、CD151)標的化に続くトランスフェクションの22日後に取得された代表的なフローサイトメトリーデータである。象限IVは、遺伝子がオフになっている細胞を表し、遺伝子がオフになっている細胞のパーセンテージ(すなわち、それぞれ45%、66%、53%)で示した。図2Dは、3つの異なるsgRNAによるCD29、CD81、およびCD151のサイレンシングの定量化を提供する。図2Eは、異なる遺伝子を標的とするsgRNAの同時送達によってオールインタンパク質が多重化され得ることを示すため、2つまたは3つの遺伝子を同時にサイレンシングすることの定量化を提供する。図2Fは、細胞の大部分がCLTA遺伝子を安定的にオフにしていることを意味する、オールインワンタンパク質およびCLTA遺伝子を標的とするsgRNAのトランスフェクションの9ヶ月後に取得された時点を表すプロットを提供する。
図2E】内在性遺伝子の長期サイレンシングについて説明する。図2A~2Cは、オールインワンタンパク質を使用する長期サイレンシングのための遺伝子(CD29、CD81、CD151)標的化に続くトランスフェクションの22日後に取得された代表的なフローサイトメトリーデータである。象限IVは、遺伝子がオフになっている細胞を表し、遺伝子がオフになっている細胞のパーセンテージ(すなわち、それぞれ45%、66%、53%)で示した。図2Dは、3つの異なるsgRNAによるCD29、CD81、およびCD151のサイレンシングの定量化を提供する。図2Eは、異なる遺伝子を標的とするsgRNAの同時送達によってオールインタンパク質が多重化され得ることを示すため、2つまたは3つの遺伝子を同時にサイレンシングすることの定量化を提供する。図2Fは、細胞の大部分がCLTA遺伝子を安定的にオフにしていることを意味する、オールインワンタンパク質およびCLTA遺伝子を標的とするsgRNAのトランスフェクションの9ヶ月後に取得された時点を表すプロットを提供する。
図2F】内在性遺伝子の長期サイレンシングについて説明する。図2A~2Cは、オールインワンタンパク質を使用する長期サイレンシングのための遺伝子(CD29、CD81、CD151)標的化に続くトランスフェクションの22日後に取得された代表的なフローサイトメトリーデータである。象限IVは、遺伝子がオフになっている細胞を表し、遺伝子がオフになっている細胞のパーセンテージ(すなわち、それぞれ45%、66%、53%)で示した。図2Dは、3つの異なるsgRNAによるCD29、CD81、およびCD151のサイレンシングの定量化を提供する。図2Eは、異なる遺伝子を標的とするsgRNAの同時送達によってオールインタンパク質が多重化され得ることを示すため、2つまたは3つの遺伝子を同時にサイレンシングすることの定量化を提供する。図2Fは、細胞の大部分がCLTA遺伝子を安定的にオフにしていることを意味する、オールインワンタンパク質およびCLTA遺伝子を標的とするsgRNAのトランスフェクションの9ヶ月後に取得された時点を表すプロットを提供する。
図3A】内在性遺伝子の長期サイレンシングについて説明する。図3A~3Cは、収集された細胞が、それらのRNA発現プロファイルによって決定されるように、トランスフェクションの36日後にCD29(図3A)、CD81(図3B)、およびCD151(図3C)の発現を失ったことを示す。図3D~3Fは、標的遺伝子CD29(図3D)、CD81(図3E)およびCD151(図3F)が、各実験でノックダウンされた唯一の有意な遺伝子であることを示すボルケーノプロットであり、遺伝子サイレンシングの高い特異性を意味する。図3G~3Iは、標的遺伝子のそれぞれの96%を超えるノックダウンを示す、CD151(図3G)、CD81(図3H)、およびCD29(図3I)の転写レベルの定量化を提供する。
図3B】内在性遺伝子の長期サイレンシングについて説明する。図3A~3Cは、収集された細胞が、それらのRNA発現プロファイルによって決定されるように、トランスフェクションの36日後にCD29(図3A)、CD81(図3B)、およびCD151(図3C)の発現を失ったことを示す。図3D~3Fは、標的遺伝子CD29(図3D)、CD81(図3E)およびCD151(図3F)が、各実験でノックダウンされた唯一の有意な遺伝子であることを示すボルケーノプロットであり、遺伝子サイレンシングの高い特異性を意味する。図3G~3Iは、標的遺伝子のそれぞれの96%を超えるノックダウンを示す、CD151(図3G)、CD81(図3H)、およびCD29(図3I)の転写レベルの定量化を提供する。
図3C】内在性遺伝子の長期サイレンシングについて説明する。図3A~3Cは、収集された細胞が、それらのRNA発現プロファイルによって決定されるように、トランスフェクションの36日後にCD29(図3A)、CD81(図3B)、およびCD151(図3C)の発現を失ったことを示す。図3D~3Fは、標的遺伝子CD29(図3D)、CD81(図3E)およびCD151(図3F)が、各実験でノックダウンされた唯一の有意な遺伝子であることを示すボルケーノプロットであり、遺伝子サイレンシングの高い特異性を意味する。図3G~3Iは、標的遺伝子のそれぞれの96%を超えるノックダウンを示す、CD151(図3G)、CD81(図3H)、およびCD29(図3I)の転写レベルの定量化を提供する。
図3D】内在性遺伝子の長期サイレンシングについて説明する。図3A~3Cは、収集された細胞が、それらのRNA発現プロファイルによって決定されるように、トランスフェクションの36日後にCD29(図3A)、CD81(図3B)、およびCD151(図3C)の発現を失ったことを示す。図3D~3Fは、標的遺伝子CD29(図3D)、CD81(図3E)およびCD151(図3F)が、各実験でノックダウンされた唯一の有意な遺伝子であることを示すボルケーノプロットであり、遺伝子サイレンシングの高い特異性を意味する。図3G~3Iは、標的遺伝子のそれぞれの96%を超えるノックダウンを示す、CD151(図3G)、CD81(図3H)、およびCD29(図3I)の転写レベルの定量化を提供する。
図3E】内在性遺伝子の長期サイレンシングについて説明する。図3A~3Cは、収集された細胞が、それらのRNA発現プロファイルによって決定されるように、トランスフェクションの36日後にCD29(図3A)、CD81(図3B)、およびCD151(図3C)の発現を失ったことを示す。図3D~3Fは、標的遺伝子CD29(図3D)、CD81(図3E)およびCD151(図3F)が、各実験でノックダウンされた唯一の有意な遺伝子であることを示すボルケーノプロットであり、遺伝子サイレンシングの高い特異性を意味する。図3G~3Iは、標的遺伝子のそれぞれの96%を超えるノックダウンを示す、CD151(図3G)、CD81(図3H)、およびCD29(図3I)の転写レベルの定量化を提供する。
図3F】内在性遺伝子の長期サイレンシングについて説明する。図3A~3Cは、収集された細胞が、それらのRNA発現プロファイルによって決定されるように、トランスフェクションの36日後にCD29(図3A)、CD81(図3B)、およびCD151(図3C)の発現を失ったことを示す。図3D~3Fは、標的遺伝子CD29(図3D)、CD81(図3E)およびCD151(図3F)が、各実験でノックダウンされた唯一の有意な遺伝子であることを示すボルケーノプロットであり、遺伝子サイレンシングの高い特異性を意味する。図3G~3Iは、標的遺伝子のそれぞれの96%を超えるノックダウンを示す、CD151(図3G)、CD81(図3H)、およびCD29(図3I)の転写レベルの定量化を提供する。
図3G】内在性遺伝子の長期サイレンシングについて説明する。図3A~3Cは、収集された細胞が、それらのRNA発現プロファイルによって決定されるように、トランスフェクションの36日後にCD29(図3A)、CD81(図3B)、およびCD151(図3C)の発現を失ったことを示す。図3D~3Fは、標的遺伝子CD29(図3D)、CD81(図3E)およびCD151(図3F)が、各実験でノックダウンされた唯一の有意な遺伝子であることを示すボルケーノプロットであり、遺伝子サイレンシングの高い特異性を意味する。図3G~3Iは、標的遺伝子のそれぞれの96%を超えるノックダウンを示す、CD151(図3G)、CD81(図3H)、およびCD29(図3I)の転写レベルの定量化を提供する。
図3H】内在性遺伝子の長期サイレンシングについて説明する。図3A~3Cは、収集された細胞が、それらのRNA発現プロファイルによって決定されるように、トランスフェクションの36日後にCD29(図3A)、CD81(図3B)、およびCD151(図3C)の発現を失ったことを示す。図3D~3Fは、標的遺伝子CD29(図3D)、CD81(図3E)およびCD151(図3F)が、各実験でノックダウンされた唯一の有意な遺伝子であることを示すボルケーノプロットであり、遺伝子サイレンシングの高い特異性を意味する。図3G~3Iは、標的遺伝子のそれぞれの96%を超えるノックダウンを示す、CD151(図3G)、CD81(図3H)、およびCD29(図3I)の転写レベルの定量化を提供する。
図3I】内在性遺伝子の長期サイレンシングについて説明する。図3A~3Cは、収集された細胞が、それらのRNA発現プロファイルによって決定されるように、トランスフェクションの36日後にCD29(図3A)、CD81(図3B)、およびCD151(図3C)の発現を失ったことを示す。図3D~3Fは、標的遺伝子CD29(図3D)、CD81(図3E)およびCD151(図3F)が、各実験でノックダウンされた唯一の有意な遺伝子であることを示すボルケーノプロットであり、遺伝子サイレンシングの高い特異性を意味する。図3G~3Iは、標的遺伝子のそれぞれの96%を超えるノックダウンを示す、CD151(図3G)、CD81(図3H)、およびCD29(図3I)の転写レベルの定量化を提供する。
図4A】異なる哺乳動物細胞株における長期遺伝子サイレンシングについて説明する。図4A~4Fは、HeLa(頸部)(図4A)、U2OS(骨)(図4B)、およびヒト人工多能性細胞(iPSC)(図4C)におけるBFP発現(オールインワンタンパク質に融合)を示すフローサイトメトリープロットである。図4D~4Fは、それぞれ、図4A~4Cのトランスフェクトされなかった対照である。図4Gは、オールインワンタンパク質でのトランスフェクションの18日後に測定された、HeLaおよびU2OS細胞における内在性遺伝子の安定したサイレンシングが達成されたことを示している。図4A~4Fでは、x軸はBFP(オールインワンタンパク質に融合)であり、y軸はmCherryである。図4Hは、Pcsk9、Npc1、Spcs1、およびCd81を標的とした場合、AML12マウス肝細胞株でqPCRによるトランスフェクションの14日後に遺伝子サイレンシングが検出されたことを示している。
図4B】異なる哺乳動物細胞株における長期遺伝子サイレンシングについて説明する。図4A~4Fは、HeLa(頸部)(図4A)、U2OS(骨)(図4B)、およびヒト人工多能性細胞(iPSC)(図4C)におけるBFP発現(オールインワンタンパク質に融合)を示すフローサイトメトリープロットである。図4D~4Fは、それぞれ、図4A~4Cのトランスフェクトされなかった対照である。図4Gは、オールインワンタンパク質でのトランスフェクションの18日後に測定された、HeLaおよびU2OS細胞における内在性遺伝子の安定したサイレンシングが達成されたことを示している。図4A~4Fでは、x軸はBFP(オールインワンタンパク質に融合)であり、y軸はmCherryである。図4Hは、Pcsk9、Npc1、Spcs1、およびCd81を標的とした場合、AML12マウス肝細胞株でqPCRによるトランスフェクションの14日後に遺伝子サイレンシングが検出されたことを示している。
図4C】異なる哺乳動物細胞株における長期遺伝子サイレンシングについて説明する。図4A~4Fは、HeLa(頸部)(図4A)、U2OS(骨)(図4B)、およびヒト人工多能性細胞(iPSC)(図4C)におけるBFP発現(オールインワンタンパク質に融合)を示すフローサイトメトリープロットである。図4D~4Fは、それぞれ、図4A~4Cのトランスフェクトされなかった対照である。図4Gは、オールインワンタンパク質でのトランスフェクションの18日後に測定された、HeLaおよびU2OS細胞における内在性遺伝子の安定したサイレンシングが達成されたことを示している。図4A~4Fでは、x軸はBFP(オールインワンタンパク質に融合)であり、y軸はmCherryである。図4Hは、Pcsk9、Npc1、Spcs1、およびCd81を標的とした場合、AML12マウス肝細胞株でqPCRによるトランスフェクションの14日後に遺伝子サイレンシングが検出されたことを示している。
図4D】異なる哺乳動物細胞株における長期遺伝子サイレンシングについて説明する。図4A~4Fは、HeLa(頸部)(図4A)、U2OS(骨)(図4B)、およびヒト人工多能性細胞(iPSC)(図4C)におけるBFP発現(オールインワンタンパク質に融合)を示すフローサイトメトリープロットである。図4D~4Fは、それぞれ、図4A~4Cのトランスフェクトされなかった対照である。図4Gは、オールインワンタンパク質でのトランスフェクションの18日後に測定された、HeLaおよびU2OS細胞における内在性遺伝子の安定したサイレンシングが達成されたことを示している。図4A~4Fでは、x軸はBFP(オールインワンタンパク質に融合)であり、y軸はmCherryである。図4Hは、Pcsk9、Npc1、Spcs1、およびCd81を標的とした場合、AML12マウス肝細胞株でqPCRによるトランスフェクションの14日後に遺伝子サイレンシングが検出されたことを示している。
図4E】異なる哺乳動物細胞株における長期遺伝子サイレンシングについて説明する。図4A~4Fは、HeLa(頸部)(図4A)、U2OS(骨)(図4B)、およびヒト人工多能性細胞(iPSC)(図4C)におけるBFP発現(オールインワンタンパク質に融合)を示すフローサイトメトリープロットである。図4D~4Fは、それぞれ、図4A~4Cのトランスフェクトされなかった対照である。図4Gは、オールインワンタンパク質でのトランスフェクションの18日後に測定された、HeLaおよびU2OS細胞における内在性遺伝子の安定したサイレンシングが達成されたことを示している。図4A~4Fでは、x軸はBFP(オールインワンタンパク質に融合)であり、y軸はmCherryである。図4Hは、Pcsk9、Npc1、Spcs1、およびCd81を標的とした場合、AML12マウス肝細胞株でqPCRによるトランスフェクションの14日後に遺伝子サイレンシングが検出されたことを示している。
図4F】異なる哺乳動物細胞株における長期遺伝子サイレンシングについて説明する。図4A~4Fは、HeLa(頸部)(図4A)、U2OS(骨)(図4B)、およびヒト人工多能性細胞(iPSC)(図4C)におけるBFP発現(オールインワンタンパク質に融合)を示すフローサイトメトリープロットである。図4D~4Fは、それぞれ、図4A~4Cのトランスフェクトされなかった対照である。図4Gは、オールインワンタンパク質でのトランスフェクションの18日後に測定された、HeLaおよびU2OS細胞における内在性遺伝子の安定したサイレンシングが達成されたことを示している。図4A~4Fでは、x軸はBFP(オールインワンタンパク質に融合)であり、y軸はmCherryである。図4Hは、Pcsk9、Npc1、Spcs1、およびCd81を標的とした場合、AML12マウス肝細胞株でqPCRによるトランスフェクションの14日後に遺伝子サイレンシングが検出されたことを示している。
図4G】異なる哺乳動物細胞株における長期遺伝子サイレンシングについて説明する。図4A~4Fは、HeLa(頸部)(図4A)、U2OS(骨)(図4B)、およびヒト人工多能性細胞(iPSC)(図4C)におけるBFP発現(オールインワンタンパク質に融合)を示すフローサイトメトリープロットである。図4D~4Fは、それぞれ、図4A~4Cのトランスフェクトされなかった対照である。図4Gは、オールインワンタンパク質でのトランスフェクションの18日後に測定された、HeLaおよびU2OS細胞における内在性遺伝子の安定したサイレンシングが達成されたことを示している。図4A~4Fでは、x軸はBFP(オールインワンタンパク質に融合)であり、y軸はmCherryである。図4Hは、Pcsk9、Npc1、Spcs1、およびCd81を標的とした場合、AML12マウス肝細胞株でqPCRによるトランスフェクションの14日後に遺伝子サイレンシングが検出されたことを示している。
図4H】異なる哺乳動物細胞株における長期遺伝子サイレンシングについて説明する。図4A~4Fは、HeLa(頸部)(図4A)、U2OS(骨)(図4B)、およびヒト人工多能性細胞(iPSC)(図4C)におけるBFP発現(オールインワンタンパク質に融合)を示すフローサイトメトリープロットである。図4D~4Fは、それぞれ、図4A~4Cのトランスフェクトされなかった対照である。図4Gは、オールインワンタンパク質でのトランスフェクションの18日後に測定された、HeLaおよびU2OS細胞における内在性遺伝子の安定したサイレンシングが達成されたことを示している。図4A~4Fでは、x軸はBFP(オールインワンタンパク質に融合)であり、y軸はmCherryである。図4Hは、Pcsk9、Npc1、Spcs1、およびCd81を標的とした場合、AML12マウス肝細胞株でqPCRによるトランスフェクションの14日後に遺伝子サイレンシングが検出されたことを示している。
図5】それぞれ、配列番号1~15に対応する融合タンパク質p76、p90~p102、p112の概略図を提供する。
図6A】オールインワンタンパク質バリアントの遺伝子サイレンシング活性を説明する。図6A~6Bは、CLTA遺伝子の標的サイレンシングのためにHEK293T細胞にトランスフェクトされた配列番号1~15の融合タンパク質のトランスフェクションの18日後の遺伝子サイレンシングの結果を示す。dCas9-KRABおよびdCas9-Dnmt3A-Dnmt3Lの設計では、一過性であり、長期的なサイレンシングの効率が低いことが示された。図6C~6Dは、HEK293T細胞で安定して発現されるHIST2H2BE(H2B)内在性遺伝子(図6C)および合成Snrpn-GFPレポーター遺伝子(図6D)をサイレンシングするための配列番号1(p76)および配列番号15(p112)の比較を提供する。図6Eは、HIST2H2BE(H2B)遺伝子をオフにするための50日の時間経過にわたるp76およびp112のタンパク質発現(点線)のプロットを提供する。タンパク質レベルは、オールインワンタンパク質と同時発現するBFPのフローサイトメトリー検出によって測定された。
図6B】オールインワンタンパク質バリアントの遺伝子サイレンシング活性を説明する。図6A~6Bは、CLTA遺伝子の標的サイレンシングのためにHEK293T細胞にトランスフェクトされた配列番号1~15の融合タンパク質のトランスフェクションの18日後の遺伝子サイレンシングの結果を示す。dCas9-KRABおよびdCas9-Dnmt3A-Dnmt3Lの設計では、一過性であり、長期的なサイレンシングの効率が低いことが示された。図6C~6Dは、HEK293T細胞で安定して発現されるHIST2H2BE(H2B)内在性遺伝子(図6C)および合成Snrpn-GFPレポーター遺伝子(図6D)をサイレンシングするための配列番号1(p76)および配列番号15(p112)の比較を提供する。図6Eは、HIST2H2BE(H2B)遺伝子をオフにするための50日の時間経過にわたるp76およびp112のタンパク質発現(点線)のプロットを提供する。タンパク質レベルは、オールインワンタンパク質と同時発現するBFPのフローサイトメトリー検出によって測定された。
図6C】オールインワンタンパク質バリアントの遺伝子サイレンシング活性を説明する。図6A~6Bは、CLTA遺伝子の標的サイレンシングのためにHEK293T細胞にトランスフェクトされた配列番号1~15の融合タンパク質のトランスフェクションの18日後の遺伝子サイレンシングの結果を示す。dCas9-KRABおよびdCas9-Dnmt3A-Dnmt3Lの設計では、一過性であり、長期的なサイレンシングの効率が低いことが示された。図6C~6Dは、HEK293T細胞で安定して発現されるHIST2H2BE(H2B)内在性遺伝子(図6C)および合成Snrpn-GFPレポーター遺伝子(図6D)をサイレンシングするための配列番号1(p76)および配列番号15(p112)の比較を提供する。図6Eは、HIST2H2BE(H2B)遺伝子をオフにするための50日の時間経過にわたるp76およびp112のタンパク質発現(点線)のプロットを提供する。タンパク質レベルは、オールインワンタンパク質と同時発現するBFPのフローサイトメトリー検出によって測定された。
図6D】オールインワンタンパク質バリアントの遺伝子サイレンシング活性を説明する。図6A~6Bは、CLTA遺伝子の標的サイレンシングのためにHEK293T細胞にトランスフェクトされた配列番号1~15の融合タンパク質のトランスフェクションの18日後の遺伝子サイレンシングの結果を示す。dCas9-KRABおよびdCas9-Dnmt3A-Dnmt3Lの設計では、一過性であり、長期的なサイレンシングの効率が低いことが示された。図6C~6Dは、HEK293T細胞で安定して発現されるHIST2H2BE(H2B)内在性遺伝子(図6C)および合成Snrpn-GFPレポーター遺伝子(図6D)をサイレンシングするための配列番号1(p76)および配列番号15(p112)の比較を提供する。図6Eは、HIST2H2BE(H2B)遺伝子をオフにするための50日の時間経過にわたるp76およびp112のタンパク質発現(点線)のプロットを提供する。タンパク質レベルは、オールインワンタンパク質と同時発現するBFPのフローサイトメトリー検出によって測定された。
図6E】オールインワンタンパク質バリアントの遺伝子サイレンシング活性を説明する。図6A~6Bは、CLTA遺伝子の標的サイレンシングのためにHEK293T細胞にトランスフェクトされた配列番号1~15の融合タンパク質のトランスフェクションの18日後の遺伝子サイレンシングの結果を示す。dCas9-KRABおよびdCas9-Dnmt3A-Dnmt3Lの設計では、一過性であり、長期的なサイレンシングの効率が低いことが示された。図6C~6Dは、HEK293T細胞で安定して発現されるHIST2H2BE(H2B)内在性遺伝子(図6C)および合成Snrpn-GFPレポーター遺伝子(図6D)をサイレンシングするための配列番号1(p76)および配列番号15(p112)の比較を提供する。図6Eは、HIST2H2BE(H2B)遺伝子をオフにするための50日の時間経過にわたるp76およびp112のタンパク質発現(点線)のプロットを提供する。タンパク質レベルは、オールインワンタンパク質と同時発現するBFPのフローサイトメトリー検出によって測定された。
図7A】オールインワンタンパク質バリアントのウエスタンブロットを提供する。図7Aは、Steptococcus pyogenesのCas9に対する抗体を使用するオールインワンタンパク質バリアントp76およびp90~p102のウエスタンブロット分析である。上のバンドは完全長のタンパク質を表し、小さいサイズのバンドはオールインワンタンパク質のタンパク質分解を表す。図7Bは、融合タンパク質から切断された遊離Dnmt3Aを検出するためのオールインワンタンパク質バリアントのウエスタンブロット分析である。
図7B】オールインワンタンパク質バリアントのウエスタンブロットを提供する。図7Aは、Steptococcus pyogenesのCas9に対する抗体を使用するオールインワンタンパク質バリアントp76およびp90~p102のウエスタンブロット分析である。上のバンドは完全長のタンパク質を表し、小さいサイズのバンドはオールインワンタンパク質のタンパク質分解を表す。図7Bは、融合タンパク質から切断された遊離Dnmt3Aを検出するためのオールインワンタンパク質バリアントのウエスタンブロット分析である。
図8A】最適なsgRNAを決定するためのプールされたスクリーンについて説明する。図8Aは、長期の遺伝子サイレンシングをもたらす最適なsgRNAを決定するためのプールされたスクリーンの概略図である。図8B~8Eは、トランスフェクションの4週間後に遺伝子サイレンシングを受けている細胞のパーセントのフローサイトメトリーヒストグラムである。CLTA(図8B)、VIM(図8C)、HIST2H2BE(H2B)(図8D)、およびRAB11A(図8E)を含む、それぞれがGFPタグを有する異なる遺伝子を有する4つのHEK293T細胞株を使用した。
図8B】最適なsgRNAを決定するためのプールされたスクリーンについて説明する。図8Aは、長期の遺伝子サイレンシングをもたらす最適なsgRNAを決定するためのプールされたスクリーンの概略図である。図8B~8Eは、トランスフェクションの4週間後に遺伝子サイレンシングを受けている細胞のパーセントのフローサイトメトリーヒストグラムである。CLTA(図8B)、VIM(図8C)、HIST2H2BE(H2B)(図8D)、およびRAB11A(図8E)を含む、それぞれがGFPタグを有する異なる遺伝子を有する4つのHEK293T細胞株を使用した。
図8C】最適なsgRNAを決定するためのプールされたスクリーンについて説明する。図8Aは、長期の遺伝子サイレンシングをもたらす最適なsgRNAを決定するためのプールされたスクリーンの概略図である。図8B~8Eは、トランスフェクションの4週間後に遺伝子サイレンシングを受けている細胞のパーセントのフローサイトメトリーヒストグラムである。CLTA(図8B)、VIM(図8C)、HIST2H2BE(H2B)(図8D)、およびRAB11A(図8E)を含む、それぞれがGFPタグを有する異なる遺伝子を有する4つのHEK293T細胞株を使用した。
図8D】最適なsgRNAを決定するためのプールされたスクリーンについて説明する。図8Aは、長期の遺伝子サイレンシングをもたらす最適なsgRNAを決定するためのプールされたスクリーンの概略図である。図8B~8Eは、トランスフェクションの4週間後に遺伝子サイレンシングを受けている細胞のパーセントのフローサイトメトリーヒストグラムである。CLTA(図8B)、VIM(図8C)、HIST2H2BE(H2B)(図8D)、およびRAB11A(図8E)を含む、それぞれがGFPタグを有する異なる遺伝子を有する4つのHEK293T細胞株を使用した。
図8E】最適なsgRNAを決定するためのプールされたスクリーンについて説明する。図8Aは、長期の遺伝子サイレンシングをもたらす最適なsgRNAを決定するためのプールされたスクリーンの概略図である。図8B~8Eは、トランスフェクションの4週間後に遺伝子サイレンシングを受けている細胞のパーセントのフローサイトメトリーヒストグラムである。CLTA(図8B)、VIM(図8C)、HIST2H2BE(H2B)(図8D)、およびRAB11A(図8E)を含む、それぞれがGFPタグを有する異なる遺伝子を有する4つのHEK293T細胞株を使用した。
図9A】は、CLTA(図9A)、H2B(図9B)、RAB11(図9C)、およびVIM(図9D)を含む、標的遺伝子の転写開始部位にまたがるsgRNA機能性のマップである。転写開始部位(TSS)とCpGアイランドは、各プロットの上に注釈が付けられている。各ドットは1つのsgRNAを表し、長期遺伝子サイレンシングにおけるその有効性は、sgRNAの存在量のlog2倍変化としてプロットされる。ヌクレオソーム占有率(下のプロット)は、MNaseシグナルからプロットされる。
図9B】は、CLTA(図9A)、H2B(図9B)、RAB11(図9C)、およびVIM(図9D)を含む、標的遺伝子の転写開始部位にまたがるsgRNA機能性のマップである。転写開始部位(TSS)とCpGアイランドは、各プロットの上に注釈が付けられている。各ドットは1つのsgRNAを表し、長期遺伝子サイレンシングにおけるその有効性は、sgRNAの存在量のlog2倍変化としてプロットされる。ヌクレオソーム占有率(下のプロット)は、MNaseシグナルからプロットされる。
図9C】は、CLTA(図9A)、H2B(図9B)、RAB11(図9C)、およびVIM(図9D)を含む、標的遺伝子の転写開始部位にまたがるsgRNA機能性のマップである。転写開始部位(TSS)とCpGアイランドは、各プロットの上に注釈が付けられている。各ドットは1つのsgRNAを表し、長期遺伝子サイレンシングにおけるその有効性は、sgRNAの存在量のlog2倍変化としてプロットされる。ヌクレオソーム占有率(下のプロット)は、MNaseシグナルからプロットされる。
図9D】は、CLTA(図9A)、H2B(図9B)、RAB11(図9C)、およびVIM(図9D)を含む、標的遺伝子の転写開始部位にまたがるsgRNA機能性のマップである。転写開始部位(TSS)とCpGアイランドは、各プロットの上に注釈が付けられている。各ドットは1つのsgRNAを表し、長期遺伝子サイレンシングにおけるその有効性は、sgRNAの存在量のlog2倍変化としてプロットされる。ヌクレオソーム占有率(下のプロット)は、MNaseシグナルからプロットされる。
図10A】長期遺伝子サイレンシングのための機能的なsgRNAについて説明する。図10Aは、オールインワンタンパク質の最適なsgRNA標的化位置を決定するためのHEK293T細胞のプールされたスクリーンのワークフローであり、dCas9-KRABに最適なsgRNAを決定するためのK562細胞での従来のリシンタイリングスクリーンから採用されている(Gilbert,Horlbeck et al.,Cell 2014)。図10B~10Eは、K562細胞の既存のdCas9-KRAB/CRISPRiデータセット(Gilbert,Horlbeck et al.,Cell 2014)からの、ARL1(図10B)、EIF6(図10C)、SMC3(図10D)、HEATR1(図10E)を含む、4つの遺伝子の増殖表現型を、オールインワンタンパク質(下のプロット)とともに、示す代表的なプロットである。各ドットはsgRNAを表す。TSSおよび注釈付きCpGアイランドが各遺伝子について示される。
図10B】長期遺伝子サイレンシングのための機能的なsgRNAについて説明する。図10Aは、オールインワンタンパク質の最適なsgRNA標的化位置を決定するためのHEK293T細胞のプールされたスクリーンのワークフローであり、dCas9-KRABに最適なsgRNAを決定するためのK562細胞での従来のリシンタイリングスクリーンから採用されている(Gilbert,Horlbeck et al.,Cell 2014)。図10B~10Eは、K562細胞の既存のdCas9-KRAB/CRISPRiデータセット(Gilbert,Horlbeck et al.,Cell 2014)からの、ARL1(図10B)、EIF6(図10C)、SMC3(図10D)、HEATR1(図10E)を含む、4つの遺伝子の増殖表現型を、オールインワンタンパク質(下のプロット)とともに、示す代表的なプロットである。各ドットはsgRNAを表す。TSSおよび注釈付きCpGアイランドが各遺伝子について示される。
図10C】長期遺伝子サイレンシングのための機能的なsgRNAについて説明する。図10Aは、オールインワンタンパク質の最適なsgRNA標的化位置を決定するためのHEK293T細胞のプールされたスクリーンのワークフローであり、dCas9-KRABに最適なsgRNAを決定するためのK562細胞での従来のリシンタイリングスクリーンから採用されている(Gilbert,Horlbeck et al.,Cell 2014)。図10B~10Eは、K562細胞の既存のdCas9-KRAB/CRISPRiデータセット(Gilbert,Horlbeck et al.,Cell 2014)からの、ARL1(図10B)、EIF6(図10C)、SMC3(図10D)、HEATR1(図10E)を含む、4つの遺伝子の増殖表現型を、オールインワンタンパク質(下のプロット)とともに、示す代表的なプロットである。各ドットはsgRNAを表す。TSSおよび注釈付きCpGアイランドが各遺伝子について示される。
図10D】長期遺伝子サイレンシングのための機能的なsgRNAについて説明する。図10Aは、オールインワンタンパク質の最適なsgRNA標的化位置を決定するためのHEK293T細胞のプールされたスクリーンのワークフローであり、dCas9-KRABに最適なsgRNAを決定するためのK562細胞での従来のリシンタイリングスクリーンから採用されている(Gilbert,Horlbeck et al.,Cell 2014)。図10B~10Eは、K562細胞の既存のdCas9-KRAB/CRISPRiデータセット(Gilbert,Horlbeck et al.,Cell 2014)からの、ARL1(図10B)、EIF6(図10C)、SMC3(図10D)、HEATR1(図10E)を含む、4つの遺伝子の増殖表現型を、オールインワンタンパク質(下のプロット)とともに、示す代表的なプロットである。各ドットはsgRNAを表す。TSSおよび注釈付きCpGアイランドが各遺伝子について示される。
図10E】長期遺伝子サイレンシングのための機能的なsgRNAについて説明する。図10Aは、オールインワンタンパク質の最適なsgRNA標的化位置を決定するためのHEK293T細胞のプールされたスクリーンのワークフローであり、dCas9-KRABに最適なsgRNAを決定するためのK562細胞での従来のリシンタイリングスクリーンから採用されている(Gilbert,Horlbeck et al.,Cell 2014)。図10B~10Eは、K562細胞の既存のdCas9-KRAB/CRISPRiデータセット(Gilbert,Horlbeck et al.,Cell 2014)からの、ARL1(図10B)、EIF6(図10C)、SMC3(図10D)、HEATR1(図10E)を含む、4つの遺伝子の増殖表現型を、オールインワンタンパク質(下のプロット)とともに、示す代表的なプロットである。各ドットはsgRNAを表す。TSSおよび注釈付きCpGアイランドが各遺伝子について示される。
図11A】VPS53(図11A)およびVPS54(図11B)の増殖表現型およびヌクレオソーム配置(MNaseシグナルからの)の比較を提供し、ヌクレオソーム枯渇領域における機能的sgRNAの位置を示す。
図11B】VPS53(図11A)およびVPS54(図11B)の増殖表現型およびヌクレオソーム配置(MNaseシグナルからの)の比較を提供し、ヌクレオソーム枯渇領域における機能的sgRNAの位置を示す。
図12A】mRNA発現によるオールインワンタンパク質の送達を示す図12Aは各設計の完全長合成を示す2つのオールインワンバリアント(p102およびp112)のインビトロ転写を示す。図12Bは、HEK293T細胞へのmRNAのトランスフェクションの1日後のp102およびp112の発現を示すフローサイトメトリープロットを提供する。図12Cは、p102およびp112オールインワンバリアントを発現するmRNAをトランスフェクトした後のHEK293T細胞におけるCLTA内在性遺伝子サイレンシングの時間経過を提供する。
図12B】mRNA発現によるオールインワンタンパク質の送達を示す図12Aは各設計の完全長合成を示す2つのオールインワンバリアント(p102およびp112)のインビトロ転写を示す。図12Bは、HEK293T細胞へのmRNAのトランスフェクションの1日後のp102およびp112の発現を示すフローサイトメトリープロットを提供する。図12Cは、p102およびp112オールインワンバリアントを発現するmRNAをトランスフェクトした後のHEK293T細胞におけるCLTA内在性遺伝子サイレンシングの時間経過を提供する。
図12C】mRNA発現によるオールインワンタンパク質の送達を示す図12Aは各設計の完全長合成を示す2つのオールインワンバリアント(p102およびp112)のインビトロ転写を示す。図12Bは、HEK293T細胞へのmRNAのトランスフェクションの1日後のp102およびp112の発現を示すフローサイトメトリープロットを提供する。図12Cは、p102およびp112オールインワンバリアントを発現するmRNAをトランスフェクトした後のHEK293T細胞におけるCLTA内在性遺伝子サイレンシングの時間経過を提供する。
図13A】ドキシサイクリン誘導によるオールインワンタンパク質の制御された発現を説明する。図13Aは、ドキシサイクリン誘導性プロモーター下でオールインワンタンパク質を安定してコードするK562細胞におけるドキシサイクリンの添加によるオールインワンタンパク質の誘導された発現を示すフローサイトメトリープロットを提供する。点線は、ドキシサイクリン投与なしでのベースライン中央値BFP蛍光を表す。図13Bは、ドキシサイクリン処理の前後のオールインワンタンパク質の発現を検出するための細胞のウエスタンブロットを提供する。図13C~13Fは、K562細胞のドキシサイクリン処理の14日後のCD81(図13C~13D)およびCD151(図13E~13F)ノックダウンのフローサイトメトリープロットである。図13Gは、ドキシサイクリン処理の14日後またはドキシサイクリン処理なしのCD81およびCD151ノックダウンの定量化を示す。
図13B】ドキシサイクリン誘導によるオールインワンタンパク質の制御された発現を説明する。図13Aは、ドキシサイクリン誘導性プロモーター下でオールインワンタンパク質を安定してコードするK562細胞におけるドキシサイクリンの添加によるオールインワンタンパク質の誘導された発現を示すフローサイトメトリープロットを提供する。点線は、ドキシサイクリン投与なしでのベースライン中央値BFP蛍光を表す。図13Bは、ドキシサイクリン処理の前後のオールインワンタンパク質の発現を検出するための細胞のウエスタンブロットを提供する。図13C~13Fは、K562細胞のドキシサイクリン処理の14日後のCD81(図13C~13D)およびCD151(図13E~13F)ノックダウンのフローサイトメトリープロットである。図13Gは、ドキシサイクリン処理の14日後またはドキシサイクリン処理なしのCD81およびCD151ノックダウンの定量化を示す。
図13C】ドキシサイクリン誘導によるオールインワンタンパク質の制御された発現を説明する。図13Aは、ドキシサイクリン誘導性プロモーター下でオールインワンタンパク質を安定してコードするK562細胞におけるドキシサイクリンの添加によるオールインワンタンパク質の誘導された発現を示すフローサイトメトリープロットを提供する。点線は、ドキシサイクリン投与なしでのベースライン中央値BFP蛍光を表す。図13Bは、ドキシサイクリン処理の前後のオールインワンタンパク質の発現を検出するための細胞のウエスタンブロットを提供する。図13C~13Fは、K562細胞のドキシサイクリン処理の14日後のCD81(図13C~13D)およびCD151(図13E~13F)ノックダウンのフローサイトメトリープロットである。図13Gは、ドキシサイクリン処理の14日後またはドキシサイクリン処理なしのCD81およびCD151ノックダウンの定量化を示す。
図13D】ドキシサイクリン誘導によるオールインワンタンパク質の制御された発現を説明する。図13Aは、ドキシサイクリン誘導性プロモーター下でオールインワンタンパク質を安定してコードするK562細胞におけるドキシサイクリンの添加によるオールインワンタンパク質の誘導された発現を示すフローサイトメトリープロットを提供する。点線は、ドキシサイクリン投与なしでのベースライン中央値BFP蛍光を表す。図13Bは、ドキシサイクリン処理の前後のオールインワンタンパク質の発現を検出するための細胞のウエスタンブロットを提供する。図13C~13Fは、K562細胞のドキシサイクリン処理の14日後のCD81(図13C~13D)およびCD151(図13E~13F)ノックダウンのフローサイトメトリープロットである。図13Gは、ドキシサイクリン処理の14日後またはドキシサイクリン処理なしのCD81およびCD151ノックダウンの定量化を示す。
図13E】ドキシサイクリン誘導によるオールインワンタンパク質の制御された発現を説明する。図13Aは、ドキシサイクリン誘導性プロモーター下でオールインワンタンパク質を安定してコードするK562細胞におけるドキシサイクリンの添加によるオールインワンタンパク質の誘導された発現を示すフローサイトメトリープロットを提供する。点線は、ドキシサイクリン投与なしでのベースライン中央値BFP蛍光を表す。図13Bは、ドキシサイクリン処理の前後のオールインワンタンパク質の発現を検出するための細胞のウエスタンブロットを提供する。図13C~13Fは、K562細胞のドキシサイクリン処理の14日後のCD81(図13C~13D)およびCD151(図13E~13F)ノックダウンのフローサイトメトリープロットである。図13Gは、ドキシサイクリン処理の14日後またはドキシサイクリン処理なしのCD81およびCD151ノックダウンの定量化を示す。
図13F】ドキシサイクリン誘導によるオールインワンタンパク質の制御された発現を説明する。図13Aは、ドキシサイクリン誘導性プロモーター下でオールインワンタンパク質を安定してコードするK562細胞におけるドキシサイクリンの添加によるオールインワンタンパク質の誘導された発現を示すフローサイトメトリープロットを提供する。点線は、ドキシサイクリン投与なしでのベースライン中央値BFP蛍光を表す。図13Bは、ドキシサイクリン処理の前後のオールインワンタンパク質の発現を検出するための細胞のウエスタンブロットを提供する。図13C~13Fは、K562細胞のドキシサイクリン処理の14日後のCD81(図13C~13D)およびCD151(図13E~13F)ノックダウンのフローサイトメトリープロットである。図13Gは、ドキシサイクリン処理の14日後またはドキシサイクリン処理なしのCD81およびCD151ノックダウンの定量化を示す。
図13G】ドキシサイクリン誘導によるオールインワンタンパク質の制御された発現を説明する。図13Aは、ドキシサイクリン誘導性プロモーター下でオールインワンタンパク質を安定してコードするK562細胞におけるドキシサイクリンの添加によるオールインワンタンパク質の誘導された発現を示すフローサイトメトリープロットを提供する。点線は、ドキシサイクリン投与なしでのベースライン中央値BFP蛍光を表す。図13Bは、ドキシサイクリン処理の前後のオールインワンタンパク質の発現を検出するための細胞のウエスタンブロットを提供する。図13C~13Fは、K562細胞のドキシサイクリン処理の14日後のCD81(図13C~13D)およびCD151(図13E~13F)ノックダウンのフローサイトメトリープロットである。図13Gは、ドキシサイクリン処理の14日後またはドキシサイクリン処理なしのCD81およびCD151ノックダウンの定量化を示す。
【発明を実施するための形態】
【0013】
本明細書に記載の技術は、とりわけ、宿主ゲノムにおいて二本鎖DNA切断を生成することなく、哺乳動物細胞における遺伝子の永続的なサイレンシングを可能にする。実施形態では、中心構成要素は、Dnmt3A、Dnmt3L、およびKRABドメイン(本明細書では「オールインワンタンパク質」と呼ばれる)に融合された触媒的に不活性なCas9(dCas9)から構成される一本鎖ポリペプチドである。本明細書で提供されるこの融合タンパク質は、シングルガイドRNA(sgRNA)を使用して哺乳動物ゲノムの特定の部位に向けることができ、その部位にDNAメチル化および/または抑制性クロマチンマークを加えることができる。実施形態では、結果は、その後の細胞分裂にわたって継承可能な遺伝子サイレンシングである。実施形態では、本明細書で提供される融合タンパク質(およびsgRNA)は、永続的なサイレンシングを誘導するためのウイルス送達方法の使用を回避して、一時的にのみ発現される。
【0014】
実施形態では、本明細書で提供される融合タンパク質は、ゲノム編集ではなくエピゲノム編集による内在性遺伝子発現のロバストな長期のまたは永続的なサイレンシングを提供する。遺伝子の両方の対立遺伝子を標的にすることも、単一の病原性対立遺伝子を選択的に標的にすることもできる。実施形態では、本明細書で提供される融合タンパク質の利点は、エピジェネティック編集が可逆的であり、したがって、ゲノム編集よりも本質的に安全であることである。したがって、実施形態では、本明細書で提供される融合タンパク質は、予防的用途において有用である。例えば、遺伝子サイレンシングは、感染/生物学的毒素からの急性の保護を可能にし、感染または中毒のリスクがなくなった後に元に戻すことができる。したがって、実施形態では、本明細書で提供される融合タンパク質は、長期の器官機能または恒常性に必要とされるタンパク質との相互作用を介して細胞に入るウイルスまたは毒素に有用である。実施形態では、本明細書で提供される融合タンパク質は、ゲノム編集に基づく治療において有用である。
【0015】
実施形態では、哺乳動物細胞における永続的な遺伝子サイレンシングは、2つの構成要素で達成することができる:3つのエピジェネティックモジュレーターに融合したdCas9から構成される一本鎖ポリペプチド、およびタンパク質を宿主ゲノムの特定の部位に向けるシングルガイドRNA。実施形態では、構成要素は、宿主細胞において一過性にのみ発現され、したがって、毒性およびオフターゲットの事象を低減する。
【0016】
実施形態では、本明細書で提供される融合タンパク質は、永続的な遺伝子サイレンシングのために宿主細胞においてDNA切断を誘導しない。実施形態では、目的のゲノム部位に追加されるエピジェネティックマークは可逆的であり、したがって、発生する可能性のあるオフターゲットの事象の除去を可能にする。
【0017】
定義
本開示の様々な実施形態および態様が本明細書に示され説明されているが、そのような実施形態および態様が例としてのみ提供されていることは当業者には明らかであろう。当業者は、本発明から逸脱することなく、多くの変形、変更、および置換を思いつくであろう。本明細書に記載される実施形態の様々な代替物が使用され得ることが理解されるべきである。
【0018】
本書で使用されている項目の見出しは、組織化の目的のためであり、記載されている主題を限定するものとして解釈されるべきではない。特許、特許出願、論説、書籍、マニュアル、および論文を含むがこれらに限定されない、本出願で引用されているすべての文書または文書の一部は、参照によりその目的が全て明示的に組み込まれている。
【0019】
別段の定義がない限り、本明細書で使用されるすべての技術用語および科学用語は、本発明が属する技術分野の当業者によって一般的に理解される意味を有する。以下の参考文献は、本発明で使用される多くの用語の一般的な定義を有する技能の1つを提供する:Singleton et al.,Dictionary of Microbiology and Molecular Biology(2nd ed.1994)、The Cambridge Dictionary of Science and Technology(Walker ed.,1988)、The Glossary of Genetics,5th Ed.,R.Rieger et al.(eds.),Springer Verlag(1991)、およびHale&Marham,The Harper Collins Dictionary of Biology(1991)。本明細書で使用される場合、以下の用語は、特に明記されていない限り、それらに帰する意味を有する。
【0020】
本開示および以下の特許請求の範囲における単数の不定冠詞または定冠詞(例えば、「a」、「an」、「the」など)の使用は、特定の事例において、その用語が具体的に唯一のことを意味することを意図していることが文脈から明らかでない限り、「少なくとも1つ」を意味する特許における従来のアプローチに従う。同様に、「含む(comprising)」という用語は、追加のアイテム、機能、構成要素などを除外することなく、制限のないものである。本明細書で特定される参照文献は、特に明記しない限り、参照によりその全体が明示的に本明細書に組み込まれる。
【0021】
「含む(comprise)」、「含める(include)」、「有する(have)」という用語、およびそれらの派生語は、本明細書では、包括的で制限のない用語として互換的に使用される。例えば、「含む(comprising)」、「含める(including)」、または「有する(having)」の使用は、動詞を含有する節の主語に包含される要素が、含まれる、有される、または含められる要素だけではないことを意味する。
【0022】
「核酸」とは、一本鎖、二本鎖、もしくは多本鎖のいずれかの形態のヌクレオチド(例えば、デオキシリボヌクレオチドまたはリボヌクレオチド)およびそれらのポリマー、あるいはそれらの相補体を指す。「ポリヌクレオチド」、「オリゴヌクレオチド」、「オリゴ」などの用語は、通常および慣習的な意味で、ヌクレオチドの線状配列を指す。「ヌクレオチド」という用語は、通常のおよび慣習的な意味で、単一のポリヌクレオチド単位、すなわちモノマーを指す。ヌクレオチドは、リボヌクレオチド、デオキシリボヌクレオチド、またはそれらの修飾型であり得る。本明細書で企図されるポリヌクレオチドの例には、一本鎖および二本鎖DNA、一本鎖および二本鎖RNA、ならびに一本鎖および二本鎖DNAとRNAの混合物を有するハイブリッド分子が含まれる。本明細書で企図される核酸、例えばポリヌクレオチドの例には、任意の種類のRNA、例えば、mRNA、siRNA、miRNA、sgRNA、およびガイドRNA、ならびに任意の種類のDNA、ゲノムDNA、プラスミドDNA、およびミニサークルDNA、ならびにそれらの任意の断片が含まれるが、これらに限定されない。態様では、核酸はメッセンジャーRNAである。態様では、メッセンジャーRNAはメッセンジャーリボ核タンパク質(RNP)である。ポリヌクレオチドの文脈における「二本鎖」という用語は、通常のおよび慣習的な意味で、二本鎖性を指す。核酸は、直鎖または分岐鎖であり得る。例えば、核酸は、ヌクレオチドの直鎖であり得るか、または核酸は、例えば、核酸がヌクレオチドの1つ以上のアームまたは分岐を含むように分岐し得る。任意に、分岐核酸は、繰り返し分岐して、デンドリマーなどの高次構造を形成する。
【0023】
本明細書で使用され得るように、「核酸」、「核酸分子」、「核酸オリゴマー」、「オリゴヌクレオチド」、「核酸配列」、「核酸フラグメント」および「ポリヌクレオチド」という用語は互換的に使用され、様々な長さを有し得る互いに共有結合されたヌクレオチドのポリマー形態、デオキシリボヌクレオチドまたはリボヌクレオチドのいずれか、またはその類似体、誘導体もしくは修飾物を含むことが意図されているが、これらに限定されない。異なるポリヌクレオチドは、異なる三次元構造を有し得、そして既知または未知の様々な機能を実行し得る。ポリヌクレオチドの非限定的な例には、遺伝子、遺伝子断片、エクソン、イントロン、遺伝子間DNA(異質染色質のDNAを含むがこれらに限定されない)、メッセンジャーRNA(mRNA)、トランスファーRNA、リボソームRNA、リボザイム、cDNA、組換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、配列の単離されたDNA、配列の単離されたRNA、sgRNA、ガイドRNA、核酸プローブ、およびプライマー、が含まれる。本開示の方法において有用なポリヌクレオチドは、天然の核酸配列およびそのバリアント、人工の核酸配列、またはそのような配列の組み合わせを含み得る。
【0024】
ポリヌクレオチドの配列は、4つのヌクレオチド塩基:アデニン(A)、シトシン(C)、グアニン(G)、およびチミン(T)(ポリヌクレオチドがRNAの場合、チミンの代わりにウラシル(U))で構成されている。したがって、「ポリヌクレオチド配列」という用語は、ポリヌクレオチド分子のアルファベット順の表現である、あるいは、この用語は、ポリヌクレオチド分子自体に適用され得る。このアルファベット順の表現は、中央処理装置を備えたコンピューターのデータベースに入力でき、機能ゲノミクスや相同性検索などのバイオインフォマティクスアプリケーションに使用できる。ポリヌクレオチドは、任意選択で、1つ以上の非標準ヌクレオチド(複数可)、ヌクレオチド類似体(複数可)、および/または修飾ヌクレオチドを含み得る。
【0025】
例えばホスホチオエート骨格を有する核酸を含む核酸は、1つ以上の反応性部分を含み得る。本明細書で使用される場合、反応性部分という用語は、共有結合、非共有結合、または他の相互作用を介して別の分子、例えば、核酸またはポリペプチドと反応することができる任意の基を含む。例として、核酸は、共有結合、非共有結合、または他の相互作用を介してタンパク質またはポリペプチド上のアミノ酸と反応するアミノ酸反応性部分を含み得る。
【0026】
この用語はまた、既知のヌクレオチド類似体または修飾された骨格残基もしくは結合を含む核酸も包含し、合成、天然に存在する、および天然に存在せず、参照核酸と同様の結合特性を有し、参照ヌクレオチドと類似の方法で代謝される。そのような類似体の例としては、例えば、ホスホルアミデート、ホスホロジアミデート、ホスホロチオエート(リン酸中の酸素を二重結合硫黄で置換するホスホチオエートとしても知られる)、ホスホロジチオエート、ホスホノカルボン酸、ホスホノカルボキシレート、ホスホノ酢酸、ホスホノギ酸、メチルホスホネート、ボロンホスホネート、またはO-メチルホスホロアミダイト結合(Eckstein,Oligonucleotides and Analogues:A Practical Approach,Oxford University Pressを参照されたい)、ならびに5-メチルシチジンまたはプソイドウリジンなどのヌクレオチド塩基に対する修飾、ならびにペプチド核酸骨格および結合を含むホスホジエステル誘導体が挙げられ、挙げられるが、これらに限定されない。他の類似体核酸としては、米国特許第5,235,033号および同第5,034,506号、ならびに第6章および第7章、ASCシンポジウムシリーズ580、Carbohydrate Modifications in Antisense Research,Sanghui&Cook,eds.に記載されているものを含む、陽性骨格、非イオン性骨格、修飾糖、および非リボース骨格(例えば、当該技術分野において公知のホスホロジアミデートモルホリノオリゴまたはロックド核酸(LNA))を有するものが挙げられる。1つ以上の炭素環式糖を含有する核酸もまた、核酸の1つの定義内に含まれる。リボース-ホスフェート骨格の修飾は、例えば、生理学的環境におけるそのような分子の安定性および半減期を増加させるために、またはバイオチップ上のプローブとして、様々な理由で行うことができる。天然に存在する核酸と類似体の混合物が作製され得るか、あるいは、異なる核酸類似体の混合物、および天然に存在する核酸と類似体の混合物が作製され得る。態様では、DNA中のヌクレオチド間結合は、ホスホジエステル、ホスホジエステル誘導体、または両方の組み合わせである。
【0027】
核酸は、非特異的配列を含み得る。本明細書中で使用される場合、「非特異的配列」という用語は、任意の他の核酸配列に相補的であるか、または部分的にのみ相補的であるように設計されていない一連の残基を含む核酸配列を指す。例として、非特異的核酸配列は、細胞または生物と接触した場合に阻害性核酸として機能しない核酸残基の配列である。
【0028】
「相補的」または「相補性」という用語は、従来のワトソン-クリック型または他の非従来型のいずれかによって、別の核酸配列と水素結合を形成する核酸の能力を指す。例えば、配列AGTは配列TCAに相補的である。パーセント相補性は、第2の核酸配列と水素結合(例えば、ワトソン-クリック塩基対)を形成できる核酸分子の残基のパーセンテージを示す(例えば、10のうち5、6、7、8、9、10は、それぞれ50%、60%、70%、80%、90%、100%相補的である)。「完全に相補的」とは、核酸配列のすべての隣接する残基が、第2の核酸配列における同じ数の隣接する残基と水素結合することを意味する。本明細書で使用される「実質的に相補的」とは、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、またはそれ以上のヌクレオチドの領域にわたり、少なくとも60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、または100%である相補性の程度を指すか、ストリンジェントな条件下(すなわち、ストリンジェントなハイブリダイゼーション条件下)でハイブリダイズする2つの核酸を指す。
【0029】
「ストリンジェントなハイブリダイゼーション条件」という句は、プローブが、その標的部分配列、典型的には核酸の複合体混合物にハイブリダイズするが、他の配列にはハイブリダイズしない条件を指す。ストリンジェントな条件は配列に依存し、様々な状況によって異なる。より長い配列は、特に高温でハイブリダイズする。核酸のハイブリダイゼーションに関する広範なガイドは、Tijssen,Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Probes,“Overview of principles of hybridization and the strategy of nucleic acid assays”(1993)に見出される。一般に、ストリンジェントな条件は、定義されたイオン強度pHでの特定の配列の熱融点(thermal melting point)(Tm)よりも約5~10°C低くなるように選択される。Tmは、標的に相補的なプローブの50%が平衡状態で標的配列にハイブリダイズする温度(定義されたイオン強度、pH、および核酸濃度の下で)である(標的配列が過剰に存在するため、Tmではプローブのうち50%が平衡状態で占有されている)。ホルムアミドなどの不安定化剤を添加することで、ストリンジェントな条件を達成することもできる。選択的または特異的ハイブリダイゼーションの場合、陽性シグナルはバックグラウンドの少なくとも2倍、好ましくはバックグラウンドハイブリダイゼーションの10倍である。例示的なストリンジェントなハイブリダイゼーション条件は、以下のとおりである:50%ホルムアミド、5xSSC、および1%SDS、42℃でインキュベートするまたは、5xSSC、1%SDS、65℃でインキュベートし、65℃で0.2xSSCおよび0.1%SDSで洗浄する。
【0030】
ストリンジェントな条件下で互いにハイブリダイズしない核酸は、それらがコードするポリペプチドが実質的に同一である場合には、依然として実質的に同一である。これは、例えば、遺伝暗号によって許容されている最大のコドン縮重を使用して核酸のコピーが作成された場合に発生する。そのような場合、核酸は通常、中程度にストリンジェントなハイブリダイゼーション条件下でハイブリダイズする。例示的な「中程度にストリンジェントなハイブリダイゼーション条件」には、37℃での40%ホルムアミド、1M NaCl、1%SDSの緩衝液でのハイブリダイゼーション、および45℃での1XSSCでの洗浄が含まれる。ポジティブハイブリダイゼーションは少なくとも2倍のバックグラウンドである。当業者は、代替のハイブリダイゼーションおよび洗浄条件を利用して、同様のストリンジェンシーの条件を提供できることを容易に認識するであろう。ハイブリダイゼーションパラメータを決定するための追加のガイドラインは、多くの参考文献、例えば、前出のCurrent Protocols in Molecular Biology,ed.Ausubel,et al.,に提供される。
【0031】
「遺伝子」という用語は、タンパク質の産生に関与するDNAのセグメントを意味し、これには、コーディング領域の前後の領域(リーダーとトレーラー)、および個々のコーディングセグメント(エクソン)間の介在配列(イントロン)が含まれる。リーダー、トレーラー、およびイントロンには、遺伝子の転写および翻訳中に必要な調節エレメントが含まれている。さらに、「タンパク質遺伝子産物」は、特定の遺伝子から発現されるタンパク質である。
【0032】
遺伝子に関して本明細書で使用される「発現」または「発現された」という用語は、その遺伝子の転写および/または翻訳産物を意味する。細胞内のDNA分子の発現レベルは、細胞内に存在する対応するmRNAの量、または細胞によって産生されるそのDNAによってコードされるタンパク質の量のいずれかに基づいて決定され得る。非コード核酸分子(例えば、sgRNA)の発現レベルは、当技術分野で周知の標準的なPCRまたはノーザンブロット法によって検出することができる。Sambrook et al.,1989 Molecular Cloning:A Laboratory Manual,18.1-18.88を参照されたい。
【0033】
本明細書で提供される「転写調節配列」という用語は、生物内の特定の遺伝子の転写(例えば、発現)を増加または減少させることができるDNAのセグメントを指す。転写調節配列の非限定的な例には、プロモーター、エンハンサー、およびサイレンサーが含まれる。
【0034】
「転写開始部位(transcription start site)」および「転写開始部位(transcription initiation site)」という用語は、本明細書において、RNAポリメラーゼ(例えば、DNA指向性RNAポリメラーゼ)がRNA転写物の合成を開始する遺伝子配列(例えば、DNA配列)の5’末端を指すために交換可能に使用され得る。転写開始部位は、RNAポリメラーゼがRNA転写物の合成を開始する転写されたDNA配列の最初のヌクレオチドであり得る。当業者は、例えば、ラン・オフ転写アッセイを実施することによって、またはFANTOM5データベースによる定義によって、日常的な実験および分析を介して転写開始部位を決定することができる。
【0035】
本明細書で使用される「プロモーター」という用語は、特定の遺伝子の転写を開始するDNAの領域を指す。プロモーターは通常、遺伝子の転写開始部位の近く、遺伝子の上流、およびDNAの同じ鎖(すなわち、センス鎖の5’)に位置する。プロモーターは、長さが約100~約1000塩基対であり得る。
【0036】
本明細書で使用される「エンハンサー」という用語は、遺伝子の転写が起こる可能性を高めるためにタンパク質(例えば、転写因子)によって結合され得るDNAの領域を指す。エンハンサーは、長さが約50~約1500塩基対であり得る。エンハンサーは、それが調節する転写開始部位の下流または上流に位置し得、そして転写開始部位から数百塩基対離れていてもよい。
【0037】
本明細書で使用される「サイレンサー」という用語は、リプレッサーとして知られる転写調節因子に結合することができ、それによって遺伝子の転写に悪影響を与えることができるDNA配列を指す。サイレンサーDNA配列は、遺伝子の転写を抑制するように作用する標的遺伝子の上流を含むがこれに限定されない、DNA全体の多くの異なる位置に見出され得る(例えば、サイレンサー遺伝子発現)。
【0038】
本明細書で提供される「ガイドRNA」または「gRNA」は、標的ヌクレオチド配列と十分な相補性を有して、その標的配列とハイブリダイズし、CRISPR複合体の標的配列への直接配列特異的結合を有する、任意のポリヌクレオチド配列を指す。態様では、ガイド配列とそれに対応する標的配列との間の相補性の程度は、適切なアラインメントアルゴリズムを使用して最適にアラインメントされた場合、約50%以上、約60%以上、約75%以上、約80%以上、約85%以上、約90%以上、約95%以上、約97.5%以上、約99%以上、またはそれ以上である。
【0039】
実施形態では、ポリヌクレオチド(例えば、gRNA)は、一本鎖リボ核酸である。態様では、ポリヌクレオチド(例えば、gRNA)は、10、20、30、40、50、60、70、80、90、100またはそれ以上の長さの核酸残基である。態様では、ポリヌクレオチド(例えば、gRNA)は、10~30の核酸残基の長さである。態様では、ポリヌクレオチド(例えば、gRNA)は、20の核酸残基の長さである。態様では、ポリヌクレオチド(例えば、gRNA)の長さは、少なくとも5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100以上の核酸残基または糖残基の長さであってよい。態様では、ポリヌクレオチド(例えば、gRNA)は、5~50、10~50、15~50、20~50、25~50、30~50、35~50、40~50、45~50、5~75、10~75、15~75、20~75、25~75、30~75、35~75、40~75、45~75、50~75、55~75、60~75、65~75、70~75、5~100、10~100、15~100、20~100、25~100、30~100、35~100、40~100、45~100、50~100、55~100、60~100、65~100、70~100、75~100、80~100、85~100、90~100、95~100、またはそれ以上の残基の長さである。態様では、ポリヌクレオチド(例えば、gRNA)は、10~15、10~20、10~30、10~40、または10~50残基の長さである。
【0040】
「アミノ酸」という用語は、天然に存在するアミノ酸および合成アミノ酸、ならびに天然に存在するアミノ酸と同様に機能するアミノ酸類似体およびアミノ酸模倣体を指す。天然に存在するアミノ酸は、遺伝コードによってコード化されたもの、ならびに例えばヒドロキシプロリン、γ-カルボキシグルタメート、およびO-ホスホセリンなど、後で修飾されるアミノ酸である。アミノ酸類似体とは、天然に存在するアミノ酸と同じ基本化学構造、つまり、水素、カルボキシル基、アミノ基、およびR基に結合しているα炭素を有する化合物を指し、例えば、ホモセリン、ノルロイシン、メチオニンスルホキシド、メチオニンメチルスルホニウムである。そのような類似体は、修飾されたR基(例えば、ノルロイシン)または修飾されたペプチド骨格を有するが、天然に存在するアミノ酸と同じ基本的な化学構造を保持している。アミノ酸模倣物とは、アミノ酸の一般的な化学構造とは異なる構造を有するが、天然に存在するアミノ酸と同様に機能する化合物を指す。「非天然アミノ酸」および「非天然アミノ酸」という用語は、天然には見られないアミノ酸類似体、合成アミノ酸、およびアミノ酸模倣物を指す。
【0041】
アミノ酸は、本明細書では、それらの一般的に既知である3文字記号またはIUPAC-IUB生化学命名委員会によって推奨される1文字記号のいずれかによって参照され得る。同様に、ヌクレオチドは、それらの一般的に認められている一文字コードによって参照され得る。
【0042】
「ポリペプチド」、「ペプチド」、および「タンパク質」という用語は、アミノ酸残基のポリマーを指すために本明細書中で交換可能に使用され、ポリマーは、態様では、アミノ酸から構成されない部分にコンジュゲートされ得る。この用語は、1つ以上のアミノ酸残基が対応する天然に存在するアミノ酸の人工化学模倣物であるアミノ酸ポリマー、ならびに天然に存在するアミノ酸ポリマーおよび天然に存在しないアミノ酸ポリマーに対して適用される。「融合タンパク質」は、単一の部分として組換えにより発現される2つ以上の別々のタンパク質配列をコードするキメラタンパク質を指す。
【0043】
「保存的に修飾されたバリアント」は、アミノ酸および核酸配列の両方に適用される。特定の核酸配列に関して、「保存的に修飾されたバリアント」は、同一または本質的に同一のアミノ酸配列をコードする核酸を指す。遺伝コードの縮重のため、多くの核酸配列が任意の所与のタンパク質をコードする。例えば、コドンGCA、GCC、GCGおよびGCUはすべて、アミノ酸アラニンをコードする。したがって、アラニンがコドンによって指定されるすべての位置で、コドンは、コードされたポリペプチドを変更することなく、記載された対応するコドンのいずれかに変更され得る。そのような核酸バリエーションは、保存的に修飾されたバリエーションの一種である「サイレントバリエーション」である。ポリペプチドをコードする本明細書中のすべての核酸配列はまた、核酸のすべての可能なサイレントバリエーションについて記載する。当業者は、核酸中の各コドン(通常、メチオニンの唯一のコドンであるAUG、および通常はトリプトファンの唯一のコドンであるTGGを除く)を修飾して、機能的に同一の分子を生じさせ得ることを認識するであろう。したがって、ポリペプチドをコードする核酸の各サイレントバリエーションは、記載された各配列に内在している。
【0044】
アミノ酸配列に関して、当業者は、コードされる配列中の単一のアミノ酸または少ないパーセンテージのアミノ酸を変更し、付加し、または欠失する、核酸、ペプチド、ポリペプチド、またはタンパク質配列に対する個々の置換、欠失、または付加が、変更により、化学的に類似したアミノ酸でのアミノ酸の置換がもたらされる「保存的に修飾されたバリアント」であることを認識する。機能的に同様のアミノ酸を提供する保存的置換表は、当該技術分野で周知である。そのような保存的に修飾されたバリアントは、本開示の多型バリアント、種間ホモログ、および対立遺伝子に加えられ、それらを除外しない。以下の8つの群はそれぞれ、互いに対して保存的置換であるアミノ酸を含む:(1)アラニン(A)、グリシン(G)、(2)アスパラギン酸(D)、グルタミン酸(E)、(3)アスパラギン(N)、グルタミン(Q)、(4)アルギニン(R)、リジン(K)、(5)イソロイシン(I)、ロイシン(L)、メチオニン(M)、バリン(V)、(6)フェニルアラニン(F)、チロシン(Y)、トリプトファン(W)、(7)セリン(S)、トレオニン(T)、および(8)システイン(C)、メチオニン(M)(例えば、Creighton,Proteins(1984)を参照されたい)。
【0045】
「配列同一性パーセンテージ」は、比較ウィンドウにわたって2つの最適にアラインメントされた配列を比較することによって決定され、比較ウィンドウにおけるポリヌクレオチドまたはポリペプチド配列の部分は、2つの配列の最適アラインメントのための参照配列(付加または欠失を含まない)と比較して、付加または欠失(すなわちギャップ)を含み得る。パーセンテージは、同一の核酸塩基またはアミノ酸残基が両方の配列に存在する位置数を決定して、マッチした位置数を出し、そのマッチした位置数を比較のウィンドウにおける位置の総数で割り、その結果に100を掛けて配列同一性のパーセンテージを得ることによって計算される。
【0046】
2つ以上の核酸またはポリペプチド配列の文脈における「同一の」または「同一性」パーセントという用語は、下記のデフォルトパラメータを用いたBLASTまたはBLAST2.0配列比較アルゴリズムを使用して、またはマニュアルアラインメントおよび目視検査によって、測定されるように、同一であるか、または同一である特定のパーセンテージ(すなわち、比較ウィンドウまたは指定された領域に関して最大に対応するように比較およびアラインメントを行った場合に、特定の領域について、約60%の同一性、好ましくは65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれ以上の同一性)のアミノ酸残基またはヌクレオチドを有する、2つ以上の配列または部分配列を指す(例えば、NCBIウェブサイトncbi.nlm.nih.gov/BLAST/などを参照されたい)。次いで、そのような配列は、「実質的に同一」であると言われる。この定義はまた、試験配列の相補物を指すか、またはこれに適用することができる。定義はまた、欠失および/または付加を有する配列、ならびに置換を有するものを含む。以下に説明するように、好ましいアルゴリズムは、ギャップなどを計算することができる。好ましくは、同一性は、少なくとも約25アミノ酸長またはヌクレオチド長の領域にわたり、またより好ましくは50~100アミノ酸長またはヌクレオチド長の領域にわたって存在する。
【0047】
アミノ酸またはヌクレオチド塩基の「位置」は、N末端(または5’末端)に対するその位置に基づいて、参照配列中の各アミノ酸(またはヌクレオチド塩基)を順次識別する番号によって示される。最適なアラインメントを決定する際に考慮しなければならない欠失、挿入、トランケーション、融合などのために、一般に、N末端から単純にカウントすることよって決定される試験配列のアミノ酸残基数は必ずしも参照配列内の対応する位置の数と同じではない。例えば、バリアントがアラインメントされた参照配列に対して欠失を有する場合、欠失部位での参照配列中の位置に対応するバリアント中のアミノ酸は存在しないであろう。アラインメントされた参照配列に挿入がある場合、その挿入は参照配列の番号付きアミノ酸位置に対応しない。トランケーションまたは融合の場合、参照配列またはアラインメントされた配列のいずれかに、対応する配列のいずれのアミノ酸にも対応しないアミノ酸のストレッチが存在し得る。
【0048】
所与のアミノ酸またはポリヌクレオチド配列の番号付けの文脈で使用される場合、「参照して番号付けされる」または「対応する」という用語は、所与のアミノ酸またはポリヌクレオチド配列が参照配列と比較された場合の特定の参照配列の残基の番号付けを指す。
【0049】
本明細書に記載の特定のタンパク質(例えば、KRAB、dCas9、Dnmt3A、Dnmt3L)の場合、指定されたタンパク質は、タンパク質の天然に存在する形態、またはタンパク質活性を維持するバリアントまたはホモログのいずれかが含まれる(例えば、天然タンパク質と比較して、少なくとも50%、80%、90%、95%、96%、97%、98%、99%、または100%の活性内)。態様では、バリアントまたはホモログは、天然に存在する形態と比較して、配列の全体または配列の一部(例えば、50、100、150または200個の連続したアミノ酸部分)にわたって、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、または100%のアミノ酸配列同一性を有する。態様では、タンパク質は、そのNCBI配列参照によって同定されるタンパク質である。態様では、タンパク質は、そのNCBI配列参照またはその機能的断片またはホモログによって同定されるタンパク質である。
【0050】
本明細書で提供される「クルッペル関連ボックスドメイン」または「KRABドメイン」という用語は、約400個のヒトジンクフィンガータンパク質ベースの転写因子に存在する転写抑制ドメインのカテゴリーを指す。KRABドメインは通常、約45~約75個のアミノ酸残基を含む。それらの機能および使用を含むKRABドメインの説明は、例えば、Ecco,G.,Imbeault,M.,Trono,D.,KRAB zinc finger proteins,Development 144,2017、Lambert et al.The human transcription factors,Cell 172,2018、Gilbert et al.,Cell(2013)、およびGilbert et al.,Cell(2014)に見出され得、これらはすべて、参照によりその全体が本明細書に組み込まれる。態様では、KRABドメインは、Kox 1のKRABドメインである。態様では、KRABドメインは、配列番号16によって示される配列を含む。態様では、KRABドメインは、配列番号16の配列である。態様では、KRABドメインは、配列番号16に対して少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%の配列同一性を有するアミノ酸配列を含む。態様では、KRABドメインは、配列番号16に対して少なくとも75%の配列同一性を有するアミノ酸配列を含む。態様では、KRABドメインは、配列番号16に対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。態様では、KRABドメインは、配列番号16に対して少なくとも85%の配列同一性を有するアミノ酸配列を含む。態様では、KRABドメインは、配列番号16に対して少なくとも90%の配列同一性を有するアミノ酸配列を含む。態様では、KRABドメインは、配列番号16に対して少なくとも95%の配列同一性を有するアミノ酸配列を含む。
【0051】
本明細書で提供される「DNAメチルトランスフェラーゼ」という用語は、メチル基のDNAへの転移を触媒する酵素を指す。DNAメチルトランスフェラーゼの非限定的な例には、Dnmt1、Dnmt3A、Dnmt3B、およびDnmt3Lが含まれる。態様では、DNAメチルトランスフェラーゼは、細菌のシトシンメチルトランスフェラーゼおよび/または細菌の非シトシンメチルトランスフェラーゼである。特定のDNAメチルトランスフェラーゼに応じて、DNAの様々な領域がメチル化された。例えば、Dnmt3Aは通常、メチル化のためにCpGジヌクレオチドを標的とする。DNAメチル化により、DNAメチルトランスフェラーゼは、DNA配列を変更することなく、DNAセグメントの活性(遺伝子発現など)を改変できる。態様では、DNAメチル化は、遺伝子転写の抑制および/またはメチル化感受性転写因子もしくはCTCFの調節をもたらす。本明細書に記載されるように、融合タンパク質は、1つ以上(例えば、2つ)のDNAメチルトランスフェラーゼを含み得る。DNAメチルトランスフェラーゼが融合タンパク質の一部として含まれている場合、DNAメチルトランスフェラーゼは「DNAメチルトランスフェラーゼドメイン」と呼ばれることがある。態様では、DNAメチルトランスフェラーゼドメインは、1つ以上のDNAメチルトランスフェラーゼを含む。態様では、DNAメチルトランスフェラーゼドメインは、2つのDNAメチルトランスフェラーゼを含む。態様では、DNAメチルトランスフェラーゼドメインはDnmt3Aである。態様では、DNAメチルトランスフェラーゼドメインは、配列番号26のアミノ酸配列を有する。態様では、DNAメチルトランスフェラーゼドメインは、配列番号26に対して少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%の配列同一性を有するアミノ酸配列を有する。態様では、DNAメチルトランスフェラーゼドメインは、配列番号26に対して少なくとも75%の配列同一性を有するアミノ酸配列を有する。態様では、DNAメチルトランスフェラーゼドメインは、配列番号26に対して少なくとも80%の配列同一性を有するアミノ酸配列を有する。態様では、DNAメチルトランスフェラーゼドメインは、配列番号26に対して少なくとも85%の配列同一性を有するアミノ酸配列を有する。態様では、DNAメチルトランスフェラーゼドメインは、配列番号26に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、DNAメチルトランスフェラーゼドメインは、配列番号26に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。態様では、DNAメチルトランスフェラーゼドメインはDnmt3Lである。態様では、DNAメチルトランスフェラーゼドメインは、配列番号28のアミノ酸配列を有する。態様では、DNAメチルトランスフェラーゼドメインは、配列番号28に対して少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%の配列同一性を有するアミノ酸配列を有する。態様では、DNAメチルトランスフェラーゼドメインは、配列番号28に対して少なくとも75%の配列同一性を有するアミノ酸配列を有する。態様では、DNAメチルトランスフェラーゼドメインは、配列番号28に対して少なくとも80%の配列同一性を有するアミノ酸配列を有する。態様では、DNAメチルトランスフェラーゼドメインは、配列番号28に対して少なくとも85%の配列同一性を有するアミノ酸配列を有する。態様では、DNAメチルトランスフェラーゼドメインは、配列番号28に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、DNAメチルトランスフェラーゼドメインは、配列番号28に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。態様では、DNAメチルトランスフェラーゼドメインは、Dnmt3AおよびDnmt3Lを含む。態様では、DNAメチルトランスフェラーゼドメインは、配列番号33のアミノ酸配列を有する。態様では、DNAメチルトランスフェラーゼドメインは、配列番号33に対して少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%の配列同一性を有するアミノ酸配列を有する。態様では、DNAメチルトランスフェラーゼドメインは、配列番号33に対して少なくとも75%の配列同一性を有するアミノ酸配列を有する。態様では、DNAメチルトランスフェラーゼドメインは、配列番号33に対して少なくとも80%の配列同一性を有するアミノ酸配列を有する。態様では、DNAメチルトランスフェラーゼドメインは、配列番号33に対して少なくとも85%の配列同一性を有するアミノ酸配列を有する。態様では、DNAメチルトランスフェラーゼドメインは、配列番号33に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、DNAメチルトランスフェラーゼドメインは、配列番号33に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。Dnmt3A-3Lドメインの構造と使用法の説明は、例えば、Siddique et al,Targeted methylation and gene silencing of VEGF-A in human cells by using a designed Dnmt3a-Dnmt3L single-chain fusion protein with increased DNA methylation activity,J.Mol.Biol.425,2013およびStepper et al,Efficient targeted DNA methylation with chimeric dCas9-Dnmt3a-Dnmt3L methyltransferase,Nucleic Acids Res.45,2017に見出され得、これらは参照によりその全体およびすべての目的のために本明細書に組み込まれる。
【0052】
本明細書で言及される「Dnmt3A」、「Dnmt3a」、「DNA(シトシン-5)-メチルトランスフェラーゼ3A」または「DNAメチルトランスフェラーゼ3a」タンパク質には、Dnmt3A酵素の組換え型または天然に存在する形態またはDnmt3A酵素活性を維持するそのバリアントまたはホモログ(例えば、Dnmt3Aと比較して、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%の活性内)のいずれかが含まれる。態様では、バリアントまたはホモログは、天然に存在するDnmt3Aタンパク質と比較して、全配列または配列の一部(例えば、50、100、150、または200個の連続したアミノ酸部分)にわたる少なくとも90%、95%、96%、97%、98%、99%、または100%のアミノ酸配列同一性を有する。態様では、Dnmt3Aタンパク質は、UniProt参照番号Q9Y6K1によって同定されるタンパク質、またはそれに対して実質的な同一性を有するバリアントもしくはホモログと実質的に同一である。態様では、Dnmt3Aポリペプチドは、NCBI参照配列受入番号NM_022552によって同定される核酸配列、そのホモログまたは機能的フラグメントによってコードされる。態様では、Dnmt3Aは、配列番号26によって示される配列を含む。態様では、Dnmt3Aは、配列番号26によって示される配列である。態様では、Dnmt3Aは、配列番号26に対して少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%の配列同一性を有するアミノ酸配列を有する。態様では、DNAメチルトランスフェラーゼドメインは、配列番号26に対して少なくとも75%の配列同一性を有するアミノ酸配列を有する。態様では、DNAメチルトランスフェラーゼドメインは、配列番号26に対して少なくとも80%の配列同一性を有するアミノ酸配列を有する。態様では、DNAメチルトランスフェラーゼドメインは、配列番号26に対して少なくとも85%の配列同一性を有するアミノ酸配列を有する。態様では、Dnmt3Aは、配列番号26に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、Dnmt3Aは、配列番号26に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。
【0053】
本明細書で言及される「Dnmt3L」、「DNA(シトシン-5)-メチルトランスフェラーゼ3L」または「DNAメチルトランスフェラーゼ3L」タンパク質は、Dnmt3L酵素の組換え型または天然に存在する形態、またはDnmt3L酵素を維持するそのバリアントまたはホモログ(例えば、Dnmt3Lと比較して、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%の活性内)のいずれかを含む。態様では、バリアントまたはホモログは、天然に存在するDnmt3Lタンパク質と比較して、全配列または配列の一部(例えば、50、100、150、または200個の連続したアミノ酸部分)にわたって少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%のアミノ酸配列同一性を有する。態様では、Dnmt3Lタンパク質は、UniProt参照番号Q9CWR8によって同定されるタンパク質、またはそれに対して実質的な同一性を有するバリアントもしくはホモログと実質的に同一である。態様では、Dnmt3Lタンパク質は、UniProt参照番号Q9CWR8によって同定されるタンパク質と同一である。態様では、Dnmt3Lタンパク質は、UniProt参照番号Q9CWR8によって同定されるタンパク質のアミノ酸配列に対して少なくとも75%の配列同一性を有する。態様では、Dnmt3Lタンパク質は、UniProt参照番号Q9CWR8によって同定されるタンパク質のアミノ酸配列に対して少なくとも80%の配列同一性を有する。態様では、Dnmt3Lタンパク質は、UniProt参照番号Q9CWR8によって同定されるタンパク質のアミノ酸配列に対して少なくとも85%の配列同一性を有する。態様では、Dnmt3Lタンパク質は、UniProt参照番号Q9CWR8によって同定されるタンパク質のアミノ酸配列に対して少なくとも95%の配列同一性を有する。
【0054】
態様では、Dnmt3Lタンパク質は、UniProt参照番号Q9UJWによって同定されるタンパク質、またはそれに対して実質的な同一性を有するバリアントもしくはホモログと実質的に同一である。態様では、Dnmt3Lタンパク質は、UniProt参照番号Q9UJWによって同定されるタンパク質と同一である。態様では、Dnmt3Lタンパク質は、UniProt参照番号Q9UJWによって同定されるタンパク質のアミノ酸配列に対して少なくとも50%の配列同一性を有する。態様では、Dnmt3Lタンパク質は、UniProt参照番号Q9UJWによって同定されるタンパク質に対して少なくとも55%の配列同一性を有する。態様では、Dnmt3Lタンパク質は、UniProt参照番号Q9UJWによって同定されるタンパク質のアミノ酸配列に対して少なくとも60%の配列同一性を有する。態様では、Dnmt3Lタンパク質は、UniProt参照番号Q9UJWによって同定されるタンパク質のアミノ酸配列に対して少なくとも65%の配列同一性を有する。態様では、Dnmt3Lタンパク質は、UniProt参照番号Q9UJWによって同定されるタンパク質のアミノ酸配列に対して少なくとも70%の配列同一性を有する。態様では、Dnmt3Lタンパク質は、UniProt参照番号Q9UJWによって同定されるタンパク質のアミノ酸配列に対して少なくとも75%の配列同一性を有する。態様では、Dnmt3Lタンパク質は、UniProt参照番号Q9UJWによって同定されるタンパク質のアミノ酸配列に対して少なくとも80%の配列同一性を有する。態様では、Dnmt3Lタンパク質は、UniProt参照番号Q9UJWによって同定されるタンパク質のアミノ酸配列に対して少なくとも85%の配列同一性を有する。態様では、Dnmt3Lタンパク質は、UniProt参照番号Q9UJWによって同定されるタンパク質のアミノ酸配列に対して少なくとも90%の配列同一性を有する。態様では、Dnmt3Lタンパク質は、UniProt参照番号Q9UJWによって同定されるタンパク質のアミノ酸配列に対して少なくとも95%の配列同一性を有する。態様では、Dnmt3Lポリペプチドは、NCBI参照配列受入番号NM_001081695によって同定される核酸配列、またはそのホモログまたは機能的フラグメントによってコードされる。態様では、Dnmt3Lは、配列番号28によって示される配列を含む。態様では、Dnmt3Lは、配列番号28によって示される配列である。態様では、Dnmt3Lは、配列番号28に対して少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%の配列同一性を有するアミノ酸配列を有する。態様では、Dnmt3Lは、配列番号28に対して少なくとも50%の配列同一性を有するアミノ酸配列を有する。態様では、Dnmt3Lは、配列番号28に対して少なくとも55%の配列同一性を有するアミノ酸配列を有する。態様では、Dnmt3Lは、配列番号28に対して少なくとも60%の配列同一性を有するアミノ酸配列を有する。態様では、Dnmt3Lは、配列番号28に対して少なくとも65%の配列同一性を有するアミノ酸配列を有する。態様では、Dnmt3Lは、配列番号28に対して少なくとも97%の配列同一性を有するアミノ酸配列を有する。態様では、Dnmt3Lは、配列番号28に対して少なくとも75%の配列同一性を有するアミノ酸配列を有する。態様では、Dnmt3Lは、配列番号28に対して少なくとも80%の配列同一性を有するアミノ酸配列を有する。態様では、Dnmt3Lは、配列番号28に対して少なくとも85%の配列同一性を有するアミノ酸配列を有する。態様では、Dnmt3Lは、配列番号28に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、Dnmt3Lは、配列番号28に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。
【0055】
「RNA誘導型(RNA-guided)DNAエンドヌクレアーゼ」などの用語は、通常の慣習的な意味で、DNAポリヌクレオチド鎖内のホスホジエステル結合を切断する酵素を指し、ホスホジエステル結合の認識は、別個のRNA配列によって促進される(例えば、シングルガイドRNA)。
【0056】
「クラスII CRISPRエンドヌクレアーゼ」という用語は、Cas9と同様のエンドヌクレアーゼ活性を持ち、クラスII CRISPRシステムに関与するエンドヌクレアーゼを指す。クラスII CRISPRシステムの例は、Streptococcus pyogenes SF370のII型CRISPR遺伝子座で、Cas9、Cas1、Cas2、Csn1の4つの遺伝子のクラスターと、2つの非コードRNAエレメント、tracrRNA、および非反復配列(スペーサー、各約30bp)の短いストレッチによって間隔が空けられた反復配列(直接反復)の特徴的なアレイを含有する。Cpf1酵素は、推定上のV型CRISPR-Casシステムに属している。II型とV型の両方のシステムは、CRISPR-CasシステムのクラスIIに含まれている。
【0057】
「核局在化配列」または「核局在化シグナル」または「NLS」は、タンパク質を核に向けるペプチドである。態様では、NLSは、5つの基本的な正に帯電したアミノ酸を含む。NLSはペプチド鎖のどこにでも配置できる。態様では、NLSは、SV40由来のNLSである。態様では、NLSは、配列番号25によって示される配列を含む。態様では、NLSは、配列番号25によって示される配列である。態様では、NLSは、配列番号25に対して少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%の配列同一性を有するアミノ酸配列を有する。態様では、NLSは、配列番号25に対して少なくとも75%の配列同一性を有するアミノ酸配列を有する。態様では、NLSは、配列番号25に対して少なくとも80%の配列同一性を有するアミノ酸配列を有する。態様では、NLSは、配列番号25に対して少なくとも85%の配列同一性を有するアミノ酸配列を有する。態様では、NLSは、配列番号25に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、NLSは、配列番号25に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。態様では、NLSは、配列番号25のアミノ酸配列を有する。
【0058】
本明細書で使用される「細胞」は、そのゲノムDNAを保存または複製するのに十分な代謝または他の機能を果たす細胞を指す。細胞は、例えば、無傷の膜の存在、特定の染料による染色、子孫を産生する能力、または配偶子の場合、第2の配偶子と組み合わせて、生存能力のある子孫を生み出す能力を含む、当該技術分野において周知の方法によって同定することができる。細胞には、原核細胞および真核細胞が含まれ得る。原核細胞には、細菌が含まれるが、これに限定されない。真核細胞には、酵母細胞ならびに植物および動物に由来する細胞、例えば、哺乳動物細胞、昆虫細胞(例えば、Spodoptera)、およびヒト細胞が含まれるが、これらに限定されない。細胞は、それらが天然に非接着性であるか、または表面に接着しないように(例えば、トリプシン処理によって)処理されている場合に有用であり得る。
【0059】
本明細書で使用される場合、「ベクター」という用語は、それが連結されている別の核酸を輸送することができる核酸分子を指す。ベクターの1つのタイプは「プラスミド」であり、これは、追加のDNAセグメントをライゲーションできる線形または円形の二本鎖DNAループを指す。別のタイプのベクターはウイルスベクターであり、追加のDNAセグメントをウイルスゲノムにライゲーションすることができる。特定のベクターは、それらが導入された宿主細胞(例えば、細菌の複製起点を有する細菌ベクターおよびエピソーム哺乳動物ベクター)において自律複製することができる。他のベクター(例えば、非エピソーム哺乳動物ベクター)は、宿主細胞への導入時に宿主細胞のゲノムに組み込まれ、それにより、宿主ゲノムとともに複製される。さらに、特定のベクターは、それらが動作可能に連結されている遺伝子の発現を指示することができる。このようなベクターを、本明細書では「発現ベクター」と呼ぶ。一般に、組換えDNA技術で有用な発現ベクターは、多くの場合、プラスミドの形態である。本明細書では、プラスミドがベクターの最も一般的に使用される形態であるため、「プラスミド」および「ベクター」を交換可能に使用することができる。しかしながら、本発明は、同等の機能を果たす、ウイルスベクター(例えば、複製欠損レトロウイルス、アデノウイルスおよびアデノ随伴ウイルス)などのそのような他の形態の発現ベクターを含むことを意図している。さらに、いくつかのウイルスベクターは、特定の細胞型を特異的または非特異的に標的化することができる。複製能力のないウイルスベクターまたは複製欠損ウイルスベクターは、それらの標的細胞に感染し、それらのウイルスペイロードを送達することができるが、細胞溶解および死につながる典型的な溶解経路を継続できないウイルスベクターを指す。
【0060】
「トランスフェクション」、「形質導入」、「トランスフェクションする」または「形質導入する」という用語は、交換可能に使用することができ、核酸分子および/またはタンパク質を細胞に導入するプロセスとして定義される。非ウイルスのまたはウイルスベースの方法を使用して、核酸を細胞に導入することができる。核酸分子は、完全なタンパク質またはその機能的部分をコードする配列であってよい。典型的には、タンパク質発現に必要な要素(例えば、プロモーター、転写開始部位など)を含む核酸ベクターである。トランスフェクションの非ウイルス方法には、核酸分子を細胞に導入するための送達システムとしてウイルスDNAまたはウイルス粒子を使用しない任意の適切な方法が含まれる。例示的な非ウイルストランスフェクション法には、融合タンパク質をコードする核酸のナノ粒子カプセル化(例えば、脂質ナノ粒子、金ナノ粒子など)、リン酸カルシウムトランスフェクション、リポソームトランスフェクション、ヌクレオフェクション(nucleofection)、ソノポレーション、熱ショックによるトランスフェクション、マグネティフェクション(magnetifection)およびエレクトロポレーション、が含まれる。ウイルスベースの方法の場合、任意の有用なウイルスベクターを本明細書に記載の方法で使用することができる。ウイルスベクターの例には、レトロウイルスベクター、アデノウイルスベクター、レンチウイルスベクター、およびアデノ随伴ウイルスベクターが含まれるが、これらに限定されない。態様では、核酸分子は、当技術分野で周知の標準的な手順に従って、レトロウイルスベクターを使用して細胞に導入される。「トランスフェクション」または「形質導入」という用語はまた、外部環境から細胞にタンパク質を導入することを指す。通常、タンパク質の形質導入またはトランスフェクションは、細胞膜を横断できるペプチドまたはタンパク質の、目的のタンパク質への付着に依存する。例えば、Ford et al.(2001)Gene Therapy 8:1-4およびProchiantz(2007)Nat.Methods 4:119-20を参照されたい。
【0061】
本明細書で提供される「ペプチドリンカー」は、ペプチド部分を含むリンカーである。実施形態では、ペプチドリンカーは2価ペプチド、例えば化合物の残部(例えば、本明細書で提供される融合タンパク質)にN末端およびC末端で結合されたアミノ酸配列である。ペプチドリンカーは、切断可能なペプチド部分(2価ペプチド部分)であってもよい(例えば、P2A切断可能なポリペプチド)。本明細書で提供されるペプチドリンカーはまた、交換可能にアミノ酸リンカーとも呼ばれ得る。態様では、ペプチドリンカーは、1~約80個のアミノ酸残基を含む。態様では、ペプチドリンカーは、1~約70個のアミノ酸残基を含む。態様では、ペプチドリンカーは、1~約60個のアミノ酸残基を含む。態様では、ペプチドリンカーは、1~約50個のアミノ酸残基を含む。態様では、ペプチドリンカーは、1~約40個のアミノ酸残基を含む。態様では、ペプチドリンカーは、1~約30個のアミノ酸残基を含む。態様では、ペプチドリンカーは、1~約25個のアミノ酸残基を含む。態様では、ペプチドリンカーは、1~約20個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約2~約20個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約2~約19個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約2~約18個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約2~約17個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約2~約16個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約2~約15個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約2~約14個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約2~約13個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約2~約12個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約2~約11個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約2~約10個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約2~約9個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約2~約8個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約2~約7個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約2~約6個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約2~約5個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約2~約4個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約2~約3個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約3~約19個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約3~約18個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約3~約17個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約3~約16個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約3~約15個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約3~約14個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約3~約13個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約3~約12個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約3~約11個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約3~約10個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約3~約9個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約3~約8個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約3~約7個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約3~約6個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約3~約5個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約3~約4個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約10~約20個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約15~約20個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約2個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約3個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約4個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約5個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約6個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約7個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約8個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約9個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約10個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約11個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約12個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約13個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約14個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約15個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約16個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約17個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約18個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約19個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約20個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約21個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約22個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約23個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約24個のアミノ酸残基を含む。態様では、ペプチドリンカーは、約25個のアミノ酸残基を含む。
【0062】
態様では、ペプチドリンカーは、配列番号17によって示される配列を含む。態様では、ペプチドリンカーは、配列番号17によって示される配列である。態様では、ペプチドリンカーは、配列番号18によって示される配列を含む。態様では、ペプチドリンカーは、配列番号18によって示される配列である。態様では、ペプチドリンカーは、配列番号19によって示される配列を含む。態様では、ペプチドリンカーは、配列番号19によって示される配列である。態様では、ペプチドリンカーは、配列番号20によって示される配列を含む。態様では、ペプチドリンカーは、配列番号20によって示される配列である。態様では、ペプチドリンカーは、配列番号21によって示される配列を含む。態様では、ペプチドリンカーは、配列番号21によって示される配列である。態様では、ペプチドリンカーは、配列番号22によって示される配列を含む。態様では、ペプチドリンカーは、配列番号22によって示される配列である。態様では、ペプチドリンカーは、配列番号27によって示される配列を含む。態様では、ペプチドリンカーは、配列番号27によって示される配列である。態様では、ペプチドリンカーは、配列番号24によって示される配列を含む。態様では、ペプチドリンカーは、配列番号24によって示される配列である。態様では、ペプチドリンカーは、配列番号29によって示される配列を含む。態様では、ペプチドリンカーは、配列番号29によって示される配列である。態様では、ペプチドリンカーはXTENポリペプチドである。態様では、ペプチドリンカーは、配列番号17、18、19、20、21、22、24、27、または29に対して、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性を有するアミノ酸配列を有する。態様では、ペプチドリンカーは、配列番号17、18、19、20、21、22、24、27、または29に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。
【0063】
態様では、ペプチドリンカーは、配列番号17に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、ペプチドリンカーは、配列番号18に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、ペプチドリンカーは、配列番号19に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、ペプチドリンカーは、配列番号20に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、ペプチドリンカーは、配列番号21に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、ペプチドリンカーは、配列番号22に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、ペプチドリンカーは、配列番号24に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、ペプチドリンカーは、配列番号27に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、ペプチドリンカーは、配列番号29に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、ペプチドリンカーは、配列番号17、18、19、20、21、22、24、27、または29に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。態様では、ペプチドリンカーは、配列番号17に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。態様では、ペプチドリンカーは、配列番号18に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。態様では、ペプチドリンカーは、配列番号19に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。態様では、ペプチドリンカーは、配列番号20に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。態様では、ペプチドリンカーは、配列番号21に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。態様では、ペプチドリンカーは、配列番号22に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。態様では、ペプチドリンカーは、配列番号24に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。態様では、ペプチドリンカーは、配列番号27に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。態様では、ペプチドリンカーは、配列番号29に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。
【0064】
本明細書で使用される「XTEN」、「XTENリンカー」、または「XTENポリペプチド」という用語は、疎水性アミノ酸残基を欠く組換えポリペプチド(例えば、構造化されていない組換えペプチド)を指す。XTENの開発および使用は、例えば、Schellenberger et al.,Nature Biotechnology 27,1186-1190(2009)に見出され得、これは、その全体およびすべての目的のために参照により本明細書に組み込まれる。態様では、XTENリンカーは、配列番号31によって示される配列を含む。態様では、XTENリンカーは、配列番号31によって示される配列である。態様では、XTENリンカーは、配列番号32によって示される配列を含む。態様では、XTENリンカーは、配列番号32によって示される配列である。態様では、XTENリンカーは、配列番号31に対して、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%の配列同一性を有するアミノ酸配列を有する。態様では、XTENリンカーは、配列番号31に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、XTENリンカーは、配列番号31に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。態様では、XTENリンカーは、配列番号32に対して、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%の配列同一性を有するアミノ酸配列を有する。態様では、XTENリンカーは、配列番号32に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、XTENリンカーは、配列番号32に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。
【0065】
「検出可能な薬剤」または「検出可能な部分」は、分光学的、光化学的、生化学的、免疫化学的、化学的、磁気共鳴画像法、または他の物理的手段などの適切な手段によって検出可能な組成物である。例えば、有用な検出可能な薬剤には、18F、32P、33P、45Ti、47Sc、52Fe、59Fe、62Cu、64Cu、67Cu、67Ga、68Ga、77As、86Y、90Y、89Sr、89Zr、94Tc、94Tc、99mTc、99Mo、105Pd、105Rh、111Ag、111In、123I、124I、125I、131I、142Pr、143Pr、149Pm、153Sm、154-1581Gd、161Tb、166Dy、166Ho、169Er、175Lu、177Lu、186Re、188Re、189Re、194Ir、198Au、199Au、211At、211Pb、212Bi、212Pb、213Bi、223Ra、225Ac、Cr、V、Mn、Fe、Co、Ni、Cu、La、Ce、Pr、Nd、Pm、Sm、Eu、Gd、Tb、Dy、Ho、Er、Tm、Yb、Lu、32P、フルオロフォア(蛍光色素など)、高電子密度試薬、酵素(例えば、ELISAで一般的に使用されるもの)、ビオチン、ジゴキシゲニン、常磁性分子、常磁性ナノ粒子、超小型超常磁性酸化鉄(「USPIO」)ナノ粒子、USPIOナノ粒子凝集体、超常磁性酸化鉄(「SPIO」)ナノ粒子、SPIOナノ粒子凝集体、単結晶酸化鉄ナノ粒子、単結晶酸化鉄、ナノ粒子造影剤、リポソーム、またはガドリニウムキレートを含むその他の送達媒体(「Gd-キレート」)分子、ガドリニウム、放射性同位元素、放射性核種(例えば、炭素-11、窒素-13、酸素-15、フッ素-18、ルビジウム-82)、フルオロデオキシグルコース(例えば、フッ素-18標識)、任意のガンマ線放出放射性核種、陽電子放出放射性核種、放射性標識グルコース、放射性標識水、放射性標識アンモニア、生体コロイド、マイクロバブル(例えば、アルブミン、ガラクトース、脂質、および/またはポリマーを含むマイクロバブルシェル、空気、重ガス(複数可)、パーフルオロカーボン、窒素、オクタフルオロプロパン、パーフレクサン(perflexane)脂質ミクロスフェア、パーフルトレンなどを含むマイクロバブルガスコア)、ヨード造影剤(例、イオヘキソール、イオジキサノール、イオベルソル、イオパミドール、イオキシラン、イオプロミド、ジアトリゾエート、メトリゾエート、イオキサグレート)、硫酸バリウム、二酸化トリウム、金、金ナノ粒子、金ナノ粒子凝集体、フルオロフォア、2光子フルオロフォア、またはハプテンおよびタンパク質、または、例えば、標的ペプチドと特異的に反応するペプチドまたは抗体に放射性標識を組み込むことによって検出可能にすることができる他の実体、が含まれる。
【0066】
検出可能な部分は、一価の検出可能な薬剤または別の組成物と結合を形成することができる検出可能な薬剤である。態様では、検出可能な薬剤はHAタグである。態様では、HAタグは、配列番号24によって示される配列を含む。態様では、HAタグは、配列番号24によって示される配列である。態様では、HAタグは、配列番号24に対して少なくとも80%の配列同一性を有するアミノ酸配列を有する。態様では、HAタグは、配列番号24に対して少なくとも85%の配列同一性を有するアミノ酸配列を有する。態様では、HAタグは、配列番号24に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、HAタグは、配列番号24に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。態様では、検出可能な薬剤は、青色蛍光タンパク質(BFP)である。態様では、BFPは、配列番号30によって示される配列を含む。態様では、BFPは、配列番号30によって示される配列である。態様では、BFPは、配列番号30に対して少なくとも80%の配列同一性を有するアミノ酸配列を有する。態様では、BFPは、配列番号30に対して少なくとも85%の配列同一性を有するアミノ酸配列を有する。態様では、BFPは、配列番号30に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、BFPは、配列番号30に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。
【0067】
本開示の態様によるイメージングおよび/または標識剤として使用することができる放射性物質(例えば、放射性同位体)は、これらに限定されないが、18F、32P、33P、45Ti、47Sc、52Fe、59Fe、62Cu、64Cu、67Cu、67Ga、68Ga、77As、86Y、90Y、89Sr、89Zr、94Tc、94Tc、99mTc、99Mo、105Pd、105Rh、111Ag、111In、123I、124I、125I、131I、142Pr、143Pr、149Pm、153Sm、154-1581Gd、161Tb、166Dy、166Ho、169Er、175Lu、177Lu、186Re、188Re、189Re、194 Ir、198Au、199Au、211At、211Pb、212Bi、212Pb、213Bi、223Raおよび225Ac、が含まれる。本開示の態様に従って追加の造影剤として使用することができる常磁性イオンには、遷移金属およびランタニド金属(例えば、原子番号が21~29、42、43、44、または57~71である金属)のイオンが含まれるが、これらに限定されない。これらの金属には、Cr、V、Mn、Fe、Co、Ni、Cu、La、Ce、Pr、Nd、Pm、Sm、Eu、Gd、Tb、Dy、Ho、Er、Tm、Yb、Luのイオンが含まれる。
【0068】
「接触させる(contacting)」は、その単純な通常の意味に従って使用され、少なくとも2つの異なる種が、反応するか、相互作用するか、または物理的に接するために十分に近位になることを可能にするプロセスを指す。しかしながら、結果として生じた反応生成物が、添加された試薬間の反応から直接生成され得るか、または反応混合物中に生成され得る添加された試薬のうちの1つ以上由来の中間体から生成され得ることを理解するべきである。
【0069】
「接触させる(contacting)」という用語は、2つの種が反応、相互作用、または物理的に接することを可能にすることを含み得、ここで、2つの種は、例えば、本明細書で提供される融合タンパク質および核酸配列(例えば、標的DNA配列)であり得る。
【0070】
本明細書で定義される、「阻害」、「阻害する(inhibit)」、「阻害する(inhibiting)」、「抑制」、「抑制する(repressing)」、「サイレンシングする(silencing)」、「サイレンシングする(silence)」などの用語は、本明細書で提供される組成物(例えば、融合タンパク質、複合体、核酸、ベクター)に関して使用される場合、組成物(例えば、融合タンパク質、複合体、核酸、ベクター)の非存在下での核酸配列の活性(例えば、遺伝子の転写)と比較して、核酸配列の活性(例えば、転写)に負の影響を与える(例えば、減少させる)こと(例えば遺伝子の転写を減少させる)を指す。態様では、阻害とは、疾患または疾患の症状(例えば、癌)の低減を指す。したがって、阻害には、少なくとも部分的に、部分的または完全に活性化(例えば、転写)を遮断すること、または核酸配列の活性化(例えば、転写)を減少、防止、または遅延させることが含まれる。阻害された活性(例えば、転写)は、対照のものと比較して、90%、80%、70%、60%、50%、40%、30%、20%、10%、またはそれ以下であってもよい。態様では、対照と比較して阻害は、1.5倍、2倍、3倍、4倍、5倍、10倍、またはそれ以上である。
【0071】
「対照」試料または値は、試験試料との比較のための基準となる、通常は既知の基準となる試料を指す。例えば、試験試料は、例えば、試験化合物の存在下での試験条件から採取され得、例えば、試験化合物の非存在下(陰性対照)、または既知の化合物の存在下(陽性対照)での既知の条件からの試料と比較され得る。対照は、いくつかの試験または結果から収集された平均値を表すこともできる。当業者は、対照を任意の数のパラメータの評価のために設計し得ることを認識するであろう。例えば、薬理学的データ(例えば、半減期)または治療手段(例えば、副作用の比較)に基づいて治療効果を比較するための対照を考案することができる。当業者は、対照が所与の状況において価値があるかを理解し、対照値との比較に基づいてデータを分析することができるであろう。対照は、データの有意性を判断するためにも役立つ。例えば、所与のパラメータの値が対照において大きく変動する場合、試験試料の変動は有意であるとみなされない。
【0072】
融合タンパク質
本明細書で提供されるのは、とりわけ、CRISPRベースのエピゲノム編集を使用して、哺乳動物細胞において遺伝子を永続的に(例えば、不可逆的に)および可逆的にオフにすることができる融合タンパク質である。実施形態では、融合タンパク質は、細胞において一過性に発現され得る4つのタンパク質(例えば、触媒的に不活性なCas9(例えば、dCas9)、KRABドメイン、Dnmt3AおよびDnmt3L)の単一ポリペプチド融合を含む。融合タンパク質は、標的核酸配列(例えば、DNA配列)に相補的なポリヌクレオチドを使用して哺乳動物ゲノムの特定の部位に向けることができ、それは、融合タンパク質に結合することができる配列(すなわち、結合配列)をさらに含む。適切に配置されると、理論に拘束されることを意図せずに、融合タンパク質は、DNAメチル化および/または抑制性クロマチンマークを標的核酸に追加し、その後の細胞分裂にわたって継承可能な遺伝子サイレンシングをもたらす。このように、融合タンパク質は、宿主ゲノムにDNA二本鎖切断を生成する必要性を回避するエピゲノム編集を実行できるため、生物のゲノムを操作する安全で可逆的な方法になる。
【0073】
実施形態では、融合タンパク質は、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素、KRABドメイン、およびDNAメチルトランスフェラーゼドメインを含む。態様では、融合タンパク質は、N末端からC末端へと、DNAメチルトランスフェラーゼドメイン、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素、およびKRABドメインを含む。態様では、融合タンパク質は、N末端からC末端へと、KRABドメイン、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素、およびDNAメチルトランスフェラーゼドメインを含む。実施形態では、融合タンパク質は、1つ以上のペプチドリンカーをさらに含む。態様では、融合タンパク質は、1つ以上の検出可能なタグをさらに含む。態様では、融合タンパク質は、1つ以上の核局在化配列をさらに含む。態様では、融合タンパク質は、1つ以上のペプチドリンカー、1つ以上の検出可能なタグ、1つ以上の核局在化配列、または前述の2つ以上の組み合わせをさらに含む。融合タンパク質が1つ以上のペプチドリンカーを含む場合、各ペプチドリンカーは同じであっても異なっていてもよい。融合タンパク質が1つ以上の検出可能なタグを含む場合、各検出可能なタグは同じであっても異なっていてもよい。態様では、融合タンパク質は、1~10個の検出可能なタグを含む。態様では、融合タンパク質は、1~9つの検出可能なタグを含む。態様では、融合タンパク質は、1~8つの検出可能なタグを含む。態様では、融合タンパク質は、1~7つの検出可能なタグを含む。態様では、融合タンパク質は、1~6つの検出可能なタグを含む。態様では、融合タンパク質は、1~5つの検出可能なタグを含む。態様では、融合タンパク質は、1~4つの検出可能なタグを含む。態様では、融合タンパク質は、1~3つの検出可能なタグを含む。態様では、融合タンパク質は、1~2つの検出可能なタグを含む。態様では、融合タンパク質は、1つの検出可能なタグを含む。態様では、融合タンパク質は、2つの検出可能なタグを含む。態様では、融合タンパク質は、3つの検出可能なタグを含む。態様では、融合タンパク質は、4つの検出可能なタグを含む。態様では、融合タンパク質は、5つの検出可能なタグを含む。
【0074】
実施形態では、融合タンパク質は、以下の構造:A-B-C、またはB-A-C、またはC-A-B、またはC-B-A、またはB-C-A、またはA-C-Bを含み、構造中、Aはヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素を含み、BはKRABドメインを含み、CはDNAメチルトランスフェラーゼドメインを含み、構造中、左側の構成要素はN末端であり、右側の構成要素はC末端である。態様では、融合タンパク質は、1つ以上のペプチドリンカーおよび1つ以上の検出可能なタグをさらに含む。態様では、A-B、B-A、B-C、C-B、A-C、およびC-Aはそれぞれ、共有結合、ペプチドリンカー、検出可能なタグ、核局在化配列、またはそれらの2つ以上の組み合わせを介して、独立して連結している。ペプチドリンカーは、当技術分野で知られている任意のものであってよい(例えば、P2A切断可能ペプチド、XTENリンカーなど)。態様では、融合タンパク質は、検出可能なタグ(例えば、HAタグ、青色蛍光タンパク質など)などの他の構成要素を含む。
【0075】
実施形態では、融合タンパク質は、以下の構造:A-L-B-L-Cを含み、構造中、Aはヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素を含み、BはKRABドメインを含み、CはDNAメチルトランスフェラーゼドメインを含み、Lは共有結合またはペプチドリンカーであり、Lは共有結合またはペプチドリンカーであり、構造中、AはN末端にあり、CはC末端にある。態様では、Aは、ペプチドリンカーを介してBに共有結合している。態様では、Aは共有結合を介してBに共有結合している。態様では、Bは、ペプチドリンカーを介してCに共有結合している。態様では、Bは、共有結合を介してCに共有結合している。ペプチドリンカーは、当技術分野で知られている任意のものであってよい(例えば、P2A切断可能ペプチド、XTENリンカーなど)。態様では、融合タンパク質は、検出可能なタグ、核局在化配列などの他の構成要素を含む。態様では、Lは、共有結合、ペプチドリンカー、検出可能なタグ、核局在化配列、またはそれらの組み合わせである。態様では、Lは、共有結合、ペプチドリンカー、検出可能なタグ、核局在化配列、またはそれらの組み合わせである。
【0076】
実施形態において、融合タンパク質は、以下の構造:B-L-A-L-Cを含み、構造中、Aは、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素を含み、BはKRABドメインを含み、CはDNAメチルトランスフェラーゼドメインを含み、Lは共有結合またはペプチドリンカーであり、Lは共有結合またはペプチドリンカーであり、構造中、BはN末端にあり、CはC末端にある。態様では、Lはペプチドリンカーである。態様では、Lは共有結合である。態様では、Lはペプチドリンカーである。態様では、Lは共有結合である。ペプチドリンカーは、当技術分野で知られているか、または本明細書に記載されている任意のものであってよい(例えば、P2A切断可能ペプチド、XTENリンカーなど)。態様では、融合タンパク質は、検出可能なタグなどの他の構成要素を含む。態様では、Lは、共有結合、ペプチドリンカー、検出可能なタグ、またはそれらの組み合わせである。態様では、Lは、共有結合、ペプチドリンカー、検出可能なタグ、またはそれらの組み合わせである。態様では、融合タンパク質は、核局在化配列をさらに含む。構造:B-L-A-L-Cを含む例示的な融合タンパク質には、p76、p90、p91、p92、p93、p94、p95、p96、p97、p98、p99、p100、p101、およびp102が含まれる(図5)。
【0077】
実施形態では、融合タンパク質は、以下の構造:B-L-A-L-C-L-Dを含み、構造中、Aはヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素を含み、BはKRABドメインを含み、CはDNAメチルトランスフェラーゼドメインを含み、Dは存在しないか、またはDは1つ以上の検出可能なタグを含み、Lは共有結合、ペプチドリンカー、検出可能なタグ、またはそれらの2つ以上の組み合わせを含み、Lは共有結合、ペプチドリンカー、検出可能なタグ、またはそれらの2つ以上の組み合わせを含み、Lは存在しないか、またはLは共有結合またはペプチドリンカーを含み、構造中、BはN末端にあり、DはC末端にある。態様では、Lはペプチドリンカーである。態様では、Lは共有結合である。態様では、Lはペプチドリンカーおよび検出可能なタグを含む。態様では、Lは検出可能なタグを含む。態様では、Lはペプチドリンカーである。態様では、Lはペプチドリンカーおよび検出可能なタグを含む。態様では、Lは共有結合である。態様では、Lは検出可能なタグを含む。態様では、Lはペプチドリンカーである。態様では、Lは共有結合である。態様では、Dは1つまたは複数の検出可能なタグを含む。態様では、Dは1つの検出可能なタグを含む。態様では、Dは2つの検出可能なタグを含む。態様では、Dは3つの検出可能なタグを含む。態様では、Dは複数の検出可能なタグを含む。Dは、当技術分野で知られているおよび/または本明細書に記載されている任意の検出可能なタグ(例えば、HAタグ、青色蛍光タンパク質など)であってよい。一態様では、LおよびDは存在しない。L、L、L、およびDが2つ以上の検出可能なタグを含む場合、各検出可能なタグは同じであるかまたは異なる。ペプチドリンカーは、当技術分野で知られている、および/または本明細書に記載されている任意のものであってよい(例えば、P2A切断可能ペプチド、XTENリンカーなど)。態様では、融合タンパク質は、核局在化配列をさらに含む。構造:B-L-A-L-C-L-Dを含む例示的な融合タンパク質には、図5に示すように、p76、p90、p91、p92、p93、p94、p95、p96、p97、p98、p99、p100、p101、およびp102が含まれる。
【0078】
実施形態において、融合タンパク質は、以下の構造:C-L-A-L-B-L-Dを含み、構造中、Aはヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素を含み、BはKRABドメインを含み、CはDNAメチルトランスフェラーゼドメインを含み、Dは存在しないか、またはDは1つ以上の検出可能なタグを含み、Lは共有結合、ペプチドリンカー、検出可能なタグ、またはそれらの2つ以上の組み合わせを含み、Lは共有結合、ペプチドリンカー、検出可能なタグ、またはそれらの2つ以上の組み合わせを含み、Lは存在しないか、またはLは共有結合またはペプチドリンカーを含み、構造中、CはN末端にあり、DはC末端にある。態様では、Lはペプチドリンカーである。態様では、Lは共有結合である。態様では、Lは検出可能なタグを含む。態様では、Lはペプチドリンカーおよび検出可能なタグを含む。態様では、Lはペプチドリンカーである。態様では、Lは共有結合である。態様では、Lは検出可能なタグを含む。態様では、Lはペプチドリンカーおよび検出可能なタグを含む。態様では、Lはペプチドリンカーである。態様では、Lは共有結合である。態様では、Dは1つまたは複数の検出可能なタグを含む。態様では、Dは1つの検出可能なタグを含む。態様では、Dは2つの検出可能なタグを含む。態様では、Dは3つの検出可能なタグを含む。態様では、Dは複数の検出可能なタグを含む。Dは、当技術分野で知られているおよび/または本明細書に記載されている任意の検出可能なタグ(例えば、HAタグ、青色蛍光タンパク質など)であってよい。一態様では、LおよびDは存在しない。L、L、L、およびDが2つ以上の検出可能なタグを含む場合、各検出可能なタグは同じであるかまたは異なる。ペプチドリンカーは、当技術分野で知られている、および/または本明細書に記載されている任意のものであってよい(例えば、P2A切断可能ペプチド、XTENリンカーなど)。態様では、融合タンパク質は、核局在化配列をさらに含む。構造:C-L-A-L-B-L-Dを含む例示的な融合タンパク質は、図5に示されるように、p112を含む。
【0079】
「ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素」などの用語は、通常の慣習的な意味で、DNAポリヌクレオチド内の特定のホスホジエステル結合を標的とするRNA誘導型DNAエンドヌクレアーゼ(例えば、天然に存在するRNA誘導型DNAエンドヌクレアーゼの変異型)を指し、この場合、ホスホジエステル結合の認識は、別個のポリヌクレオチド配列(例えば、RNA配列(例えば、シングルガイドRNA(sgRNA))によって促進されるが、標的ホスホジエステル結合を有意な程度に切断することはできない(例えば、生理学的条件下でのホスホジエステル結合の測定可能な切断はない)。したがって、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼは、ポリヌクレオチド(例えば、sgRNA)と複合体を形成したときにDNA結合能力(例えば、標的配列への特異的結合)を保持するが、有意なエンドヌクレアーゼ活性(例えば、検出可能なエンドヌクレアーゼ活性の量)を欠く。態様では、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素は、dCas9、ddCpf1、ヌクレアーゼ欠損Cas9バリアント、またはヌクレアーゼ欠損クラスII CRISPRエンドヌクレアーゼである。
【0080】
実施形態では、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素は、dCas9である。本明細書で言及される「dCas9」または「dCas9タンパク質」という用語は、エンドヌクレアーゼ活性の両方の触媒部位に欠陥があるか、または活性を欠いているCas9タンパク質である。態様では、dCas9タンパク質は、S.pyogenesCas9のD10AおよびH840Aに対応する位置に突然変異を有する。態様では、dCas9タンパク質は、野生型Cas9の両方のエンドヌクレアーゼ触媒部位(RuvCおよびHNH)での点突然変異のために、エンドヌクレアーゼ活性を欠いている。点突然変異はD10AとH840Aであり得る。態様では、dCas9は、検出可能なエンドヌクレアーゼ(例えば、エンドデオキシリボヌクレアーゼ)活性を実質的に有さない。態様では、dCas9は、配列番号23のアミノ酸配列を含む。態様では、dCas9は、配列番号23のアミノ酸配列を有する。態様では、dCas9は、配列番号23に対して少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%の配列同一性を有するアミノ酸配列を有する。態様では、dCas9は、配列番号23に対して少なくとも75%の配列同一性を有するアミノ酸配列を有する。態様では、dCas9は、配列番号23に対して少なくとも80%の配列同一性を有するアミノ酸配列を有する。態様では、dCas9は、配列番号23に対して少なくとも85%の配列同一性を有するアミノ酸配列を有する。態様では、dCas9は、配列番号23に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、dCas9は、配列番号23に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。
【0081】
本明細書で言及される「CRISPR関連タンパク質9」、「Cas9」、「Csn1」または「Cas9タンパク質」は、Cas9エンドヌクレアーゼの組換え型または天然型、Cas9エンドヌクレアーゼ酵素活性を維持するまたはそのバリアントまたはホモログのいずれかを含む(例えば、Cas9と比較して少なくとも50%、80%、90%、95%、96%、97%、98%、99%、または100%の活性内)。いくつかの態様では、バリアントまたはホモログは、天然に存在するCas9タンパク質と比較して、全配列または配列の一部(例えば、50、100、150、または200個の連続したアミノ酸部分)にわたる少なくとも90%、95%、96%、97%、98%、99%、または100%のアミノ酸配列同一性を有する。態様では、Cas9タンパク質は、UniProt参照番号Q99ZW2によって同定されるタンパク質、またはそれに対して実質的な同一性を有するバリアントもしくはホモログと実質的に同一である。態様では、Cas9タンパク質は、UniProt参照番号Q99ZW2によって同定されるタンパク質のアミノ酸配列に対して少なくとも75%の配列同一性を有する。態様では、Cas9タンパク質は、UniProt参照番号Q99ZW2によって同定されるタンパク質のアミノ酸配列に対して少なくとも80%の配列同一性を有する。態様では、Cas9タンパク質は、UniProt参照番号Q99ZW2によって同定されるタンパク質のアミノ酸配列に対して少なくとも85%の配列同一性を有する。態様では、Cas9タンパク質は、UniProt参照番号Q99ZW2によって同定されるタンパク質のアミノ酸配列に対して少なくとも90%の配列同一性を有する。態様では、Cas9タンパク質は、UniProt参照番号Q99ZW2によって同定されるタンパク質のアミノ酸配列に対して少なくとも95%の配列同一性を有する。
【0082】
実施形態では、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素は、「ddCpf1」または「ddCas12a」である。「DNAse-deadCpf1」または「ddCpf1」という用語は、Cpf1DNAse活性の不活性化をもたらす変異したAcidaminococcus属Cpf1(AsCpf1)を指す。態様では、ddCpf1は、AsCpf1のRuvCドメインにE993A突然変異を含む。態様では、ddCpf1は、検出可能なエンドヌクレアーゼ(例えば、エンドデオキシリボヌクレアーゼ)活性を実質的に有さない。態様では、ddCpf1は、配列番号34のアミノ酸配列を含む。態様では、ddCpf1は、配列番号34のアミノ酸配列を有する。態様では、ddCpf1は、配列番号34に対して少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%の配列同一性を有するアミノ酸配列を有する。態様では、ddCpf1は、配列番号34に対して少なくとも75%の配列同一性を有するアミノ酸配列を有する。態様では、ddCpf1は、配列番号34に対して少なくとも80%の配列同一性を有するアミノ酸配列を有する。態様では、ddCpf1は、配列番号34に対して少なくとも85%の配列同一性を有するアミノ酸配列を有する。態様では、ddCpf1は、配列番号34に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、ddCpf1は、配列番号34に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。
【0083】
実施形態では、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素は、dLbCpf1である。「dLbCpf1:という用語は、DNAse活性を欠くLachnospiraceae bacterium ND2006(LbCpf1)からの変異したCpf1を指す。態様では、dLbCpf1は、D832A突然変異を含む。態様では、dLbCpf1は、検出可能なエンドヌクレアーゼ(例えば、エンドデオキシリボヌクレアーゼ)活性を実質的に有さない。態様では、dLbCpf1は、配列番号35のアミノ酸配列を含む。態様では、dLbCpf1は、配列番号35のアミノ酸配列を有する。態様では、dLbCpf1は、配列番号35に対して少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%の配列同一性を有するアミノ酸配列を有する。態様では、dLbCpf1は、配列番号35に対して少なくとも75%の配列同一性を有するアミノ酸配列を有する。態様では、dLbCpf1は、配列番号35に対して少なくとも80%の配列同一性を有するアミノ酸配列を有する。態様では、dLbCpf1は、配列番号35に対して少なくとも85%の配列同一性を有するアミノ酸配列を有する。態様では、dLbCpf1は、配列番号35に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、dLbCpf1は、配列番号35に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。
【0084】
実施形態では、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素は、dFnCpf1である。「dFnCpf1」という用語は、DNAse活性を欠くFrancisella novicida U112(FnCpf1)からの変異Cpf1を指す。態様では、dFnCpf1は、D917A突然変異を含む。態様では、dFnCpf1は、検出可能なエンドヌクレアーゼ(例えば、エンドデオキシリボヌクレアーゼ)活性を実質的に有さない。態様では、dFnCpf1は、配列番号36のアミノ酸配列を含む。態様では、dFnCpf1は、配列番号36のアミノ酸配列を有する。態様では、dFnCpf1は、配列番号36に対して少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%の配列同一性を有するアミノ酸配列を有する。態様では、dFnCpf1は、配列番号36に対して少なくとも75%の配列同一性を有するアミノ酸配列を有する。態様では、dFnCpf1は、配列番号36に対して少なくとも80%の配列同一性を有するアミノ酸配列を有する。態様では、dFnCpf1は、配列番号36に対して少なくとも85%の配列同一性を有するアミノ酸配列を有する。態様では、dFnCpf1は、配列番号36に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、dFnCpf1は、配列番号36に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。
【0085】
本明細書で言及される「Cpf1」または「Cpf1タンパク質」は、Cpf1(PrevotellaおよびFrancisella1からのCRISPR)エンドヌクレアーゼの組換えまたは天然に存在する形態またはCpf1エンドヌクレアーゼ酵素活性を維持するそのバリアントまたはホモログ(Cpf1と比較して少なくとも50%、80%、90%、95%、96%、97%、98%、99%または100%の活性内)のいずれかが含まれる態様では、バリアントまたはホモログは、天然に存在するCpf1タンパク質と比較して、全配列または配列の一部(例えば、50、100、150または200個の連続したアミノ酸部分)にわたって、少なくとも90%、95%、96%、97%、98%、99%、または100%のアミノ酸配列同一性を有する。態様では、Cpf1タンパク質は、UniProt参照番号U2UMQ6によって同定されるタンパク質、またはそれに対して実質的な同一性を有するバリアントもしくはホモログと実質的に同一である。態様では、Cpf1タンパク質は、UniProt参照番号U2UMQ6によって同定されるタンパク質と同一である。態様では、Cpf1タンパク質は、UniProt参照番号U2UMQ6によって同定されるタンパク質のアミノ酸配列に対して少なくとも75%の配列同一性を有する。態様では、Cpf1タンパク質は、UniProt参照番号U2UMQ6によって同定されるタンパク質のアミノ酸配列に対して少なくとも80%の配列同一性を有する。態様では、Cpf1タンパク質は、UniProt参照番号U2UMQ6によって同定されるタンパク質と同一である。態様では、Cpf1タンパク質は、UniProt参照番号U2UMQ6によって同定されるタンパク質のアミノ酸配列に対して少なくとも85%の配列同一性を有する。態様では、Cpf1タンパク質は、UniProt参照番号U2UMQ6によって同定されるタンパク質と同一である。態様では、Cpf1タンパク質は、UniProt参照番号U2UMQ6によって同定されるタンパク質のアミノ酸配列に対して少なくとも90%の配列同一性を有する。態様では、Cpf1タンパク質は、UniProt参照番号U2UMQ6によって同定されるタンパク質と同一である。態様では、Cpf1タンパク質は、UniProt参照番号U2UMQ6によって同定されるタンパク質のアミノ酸配列に対して少なくとも95%の配列同一性を有する。
【0086】
実施形態において、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素は、ヌクレアーゼ欠損Cas9バリアントである。「ヌクレアーゼ欠損Cas9バリアント」という用語は、野生型Cas9と比較してPAMへの結合特異性を高める1つ以上の変異を有し、さらに、タンパク質をエンドヌクレアーゼ活性が不可能にするか、または著しく損なうタンパク質変異を含むCas9タンパク質を指す。理論に拘束されることを望まないが、標的配列はPAM(プロトスペーサー隣接モチーフ)、すなわちCRISPR複合体によって認識される短い配列、と関連しているべきであると考えられている。PAMの正確な配列と長さの要件は、使用するCRISPR酵素によって異なるが、PAMは通常、プロトスペーサー(すなわち、標的配列)に隣接する2~5塩基対の配列である。ヌクレアーゼ欠損Cas9バリアントのPAMへの結合特異性は、当技術分野で知られている任意の方法によって決定することができる。既知のCas9バリアントの説明と使用法は、例えば、Shmakov et al.,Diversity and evolution of class 2 CRISPR-Cas systems.Nat.Rev.Microbiol.15,2017およびCebrian-Serrano et al,CRISPR-Cas orthologues and variants:optimizing the repertoire,specificity and delivery of genome engineering toolsMamm.Genome 7-8,2017に記載されており、これらは参照によりその全体およびすべての目的のために本明細書に組み込まれる。例示的なCas9バリアントを以下の表4に示す。
【表1】
【0087】
実施形態では、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素は、ヌクレアーゼ欠損クラスII CRISPRエンドヌクレアーゼである。本明細書で使用される「ヌクレアーゼ欠損クラスII CRISPRエンドヌクレアーゼ」という用語は、減少した、損なわれた、または不活性なエンドヌクレアーゼ活性をもたらす突然変異を有する任意のクラスII CRISPRエンドヌクレアーゼを指す。
【0088】
実施形態において、DNAメチルトランスフェラーゼドメインは、Dnmt3A-3Lドメインである。本明細書で提供される「Dnmt3A-3Lドメイン」は、Dnmt3AおよびDnmt3Lの両方を含むタンパク質を指す。態様では、Dnmt3AおよびDnmt3Lは共有結合している。態様では、Dnmt3Aは、ペプチドリンカーを介してDnmt3Lに共有結合している。態様では、ペプチドリンカーは、配列番号27によって示される配列を含む。態様では、ペプチドリンカーは、配列番号27によって示される配列である。態様では、ペプチドリンカーは、配列番号27に対して、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%の配列同一性を有するアミノ酸配列を有する。態様では、ペプチドリンカーは、配列番号27に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、ペプチドリンカーは、配列番号27に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。態様では、Dnmt3A-3Lドメインは、配列番号33によって示される配列を含む。態様では、Dnmt3A-3Lドメインは、配列番号33によって示される配列である。態様では、Dnmt3A-3Lドメインは、配列番号33に対して、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%の配列同一性を有するアミノ酸配列を有する。態様では、Dnmt3A-3Lドメインは、配列番号33に対して少なくとも75%の配列同一性を有するアミノ酸配列を有する。態様では、Dnmt3A-3Lドメインは、配列番号33に対して少なくとも80%の配列同一性を有するアミノ酸配列を有する。態様では、Dnmt3A-3Lドメインは、配列番号33に対して少なくとも85%の配列同一性を有するアミノ酸配列を有する。態様では、Dnmt3A-3Lドメインは、配列番号33に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、Dnmt3A-3Lドメインは、配列番号33に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。
【0089】
実施形態では、ペプチドリンカーはXTENリンカーである。態様では、XTENリンカーは、約16~約80個のアミノ酸残基を含む。態様では、XTENリンカーは、約17~約80個のアミノ酸残基を含む。態様では、XTENリンカーは、約18~約80個のアミノ酸残基を含む。態様では、XTENリンカーは、約19~約80個のアミノ酸残基を含む。態様では、XTENリンカーは、約20~約80個のアミノ酸残基を含む。態様では、XTENリンカーは、約30~約80個のアミノ酸残基を含む。態様では、XTENリンカーは、約40~約80個のアミノ酸残基を含む。態様では、XTENリンカーは、約50~約80個のアミノ酸残基を含む。態様では、XTENリンカーは、約60~約80個のアミノ酸残基を含む。態様では、XTENリンカーは、約70~約80個のアミノ酸残基を含む。態様では、XTENリンカーは、約16~約70個のアミノ酸残基を含む。態様では、XTENリンカーは、約16~約60個のアミノ酸残基を含む。態様では、XTENリンカーは、約16~約50個のアミノ酸残基を含む。態様では、XTENリンカーは、約16~約40個のアミノ酸残基を含む。態様では、XTENリンカーは、約16~約35個のアミノ酸残基を含む。態様では、XTENリンカーは、約16~約30個のアミノ酸残基を含む。態様では、XTENリンカーは、約16~約25個のアミノ酸残基を含む。態様では、XTENリンカーは、約16~約20個のアミノ酸残基を含む。態様では、XTENリンカーは、約16個のアミノ酸残基を含む。態様では、XTENリンカーは、約17個のアミノ酸残基を含む。態様では、XTENリンカーは、約18個のアミノ酸残基を含む。態様では、XTENリンカーは、約19個のアミノ酸残基を含む。態様では、XTENリンカーは、約20個のアミノ酸残基を含む。
【0090】
実施形態では、XTENリンカーは、配列番号31によって示される配列を含む。態様では、XTENリンカーは、配列番号31によって示される配列である。態様では、XTENリンカーは、配列番号32によって示される配列を含む。態様では、XTENリンカーは、配列番号32によって示される配列である。態様では、XTENリンカーは、配列番号31に対して、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%の配列同一性を有するアミノ酸配列を有する。態様では、XTENリンカーは、配列番号31に対して少なくとも85%の配列同一性を有するアミノ酸配列を有する。態様では、XTENリンカーは、配列番号31に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、XTENリンカーは、配列番号31に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。態様では、XTENリンカーは、配列番号32に対して、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%の配列同一性を有するアミノ酸配列を有する。態様では、XTENリンカーは、配列番号32に対して少なくとも75%の配列同一性を有するアミノ酸配列を有する。態様では、XTENリンカーは、配列番号32に対して少なくとも80%の配列同一性を有するアミノ酸配列を有する。態様では、XTENリンカーは、配列番号32に対して少なくとも85%の配列同一性を有するアミノ酸配列を有する。態様では、XTENリンカーは、配列番号32に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、XTENリンカーは、配列番号32に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。
【0091】
融合タンパク質は、細胞の特定の領域(例えば、細胞質、核)に融合タンパク質を標的化するのに有用なアミノ酸配列を含み得る。したがって、態様では、融合タンパク質は、核局在化シグナル(NLS)ペプチドをさらに含む。態様では、NLSは、配列番号25によって示される配列を含む。態様では、NLSは、配列番号25によって示される配列である。態様では、NLSは、配列番号25に対して、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%の配列同一性を有するアミノ酸配列を有する。態様では、NLSは、配列番号25に対して少なくとも75%の配列同一性を有するアミノ酸配列を有する。態様では、NLSは、配列番号25に対して少なくとも80%の配列同一性を有するアミノ酸配列を有する。態様では、NLSは、配列番号25に対して少なくとも85%の配列同一性を有するアミノ酸配列を有する。態様では、NLSは、配列番号25に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、NLSは、配列番号25に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。
【0092】
実施形態では、融合タンパク質は、N末端からC末端へと、KRABドメイン、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素、およびDNAメチルトランスフェラーゼドメインを含む。
【0093】
実施形態では、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素はdCas9であり、DNAメチルトランスフェラーゼドメインはDnmt3A-3Lドメインである。
【0094】
実施形態では、dCas9は、ペプチドリンカーを介してKRABドメインに共有結合され、ここで、dCas9は、ペプチドリンカーを介してDnmt3A-3Lドメインに共有結合される。
【0095】
実施形態では、ペプチドリンカーはXTENリンカーである。態様では、XTENリンカーは、配列番号31によって示される配列を含む。態様では、XTENリンカーは、配列番号31によって示される配列である。態様では、XTENリンカーは、配列番号31に対して少なくとも75%の配列同一性を有するアミノ酸配列を有する。態様では、XTENリンカーは、配列番号31に対して少なくとも80%の配列同一性を有するアミノ酸配列を有する。態様では、XTENリンカーは、配列番号31に対して少なくとも85%の配列同一性を有するアミノ酸配列を有する。態様では、XTENリンカーは、配列番号31に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、XTENリンカーは、配列番号31に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。態様では、XTENリンカーは、配列番号32によって示される配列を含む。態様では、XTENリンカーは、配列番号32によって示される配列である。態様では、XTENリンカーは、配列番号32に対して少なくとも75%の配列同一性を有するアミノ酸配列を有する。態様では、XTENリンカーは、配列番号32に対して少なくとも80%の配列同一性を有するアミノ酸配列を有する。態様では、XTENリンカーは、配列番号32に対して少なくとも85%の配列同一性を有するアミノ酸配列を有する。態様では、XTENリンカーは、配列番号32に対して少なくとも90%の配列同一性を有するアミノ酸配列を有する。態様では、XTENリンカーは、配列番号32に対して少なくとも95%の配列同一性を有するアミノ酸配列を有する。
【0096】
実施形態において、融合タンパク質は、配列番号1、2、3、4、5、6、7、8、9、10、11、12、13、14または15のアミノ酸配列を含む。態様では、融合タンパク質は、配列番号1のアミノ酸配列を含む。態様では、融合タンパク質は、配列番号1のアミノ酸配列である。態様では、融合タンパク質は、配列番号2のアミノ酸配列を含む。態様では、融合タンパク質は、配列番号2のアミノ酸配列である。態様では、融合タンパク質は、配列番号3のアミノ酸配列を含む。態様では、融合タンパク質は、配列番号3のアミノ酸配列である。態様では、融合タンパク質は、配列番号4のアミノ酸配列を含む。態様では、融合タンパク質は、配列番号4のアミノ酸配列である。態様では、融合タンパク質は、配列番号5のアミノ酸配列を含む。態様では、融合タンパク質は、配列番号5のアミノ酸配列である。態様では、融合タンパク質は、配列番号6のアミノ酸配列を含む。態様では、融合タンパク質は、配列番号6のアミノ酸配列である。態様では、融合タンパク質は、配列番号7のアミノ酸配列を含む。態様では、融合タンパク質は、配列番号7のアミノ酸配列である。態様では、融合タンパク質は、配列番号8のアミノ酸配列を含む。態様では、融合タンパク質は、配列番号8のアミノ酸配列である。態様では、融合タンパク質は、配列番号9のアミノ酸配列を含む。態様では、融合タンパク質は、配列番号9のアミノ酸配列である。態様では、融合タンパク質は、配列番号10のアミノ酸配列を含む。態様では、融合タンパク質は、配列番号10のアミノ酸配列である。態様では、融合タンパク質は、配列番号11のアミノ酸配列を含む。態様では、融合タンパク質は、配列番号11のアミノ酸配列である。態様では、融合タンパク質は、配列番号12のアミノ酸配列を含む。態様では、融合タンパク質は、配列番号12のアミノ酸配列である。態様では、融合タンパク質は、配列番号13のアミノ酸配列を含む。態様では、融合タンパク質は、配列番号13のアミノ酸配列である。態様では、融合タンパク質は、配列番号14のアミノ酸配列を含む。態様では、融合タンパク質は、配列番号14のアミノ酸配列である。態様では、融合タンパク質は、配列番号15のアミノ酸配列を含む。態様では、融合タンパク質は、配列番号15のアミノ酸配列である。
【0097】
実施形態では、融合タンパク質は、配列番号1、2、3、4、5、6、7、8、9、10、11、12、13、14または15に対して、少なくとも75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号1に対して、少なくとも75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号2に対して、少なくとも75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号3に対して、少なくとも75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号4に対して、少なくとも75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号5に対して、少なくとも75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号6に対して、少なくとも75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号7に対して、少なくとも75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号8に対して、少なくとも75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号9に対して、少なくとも75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号10に対して、少なくとも75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号11に対して、少なくとも75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号12に対して、少なくとも75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号13に対して、少なくとも75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号14に対して、少なくとも75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号15に対して、少なくとも75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有するアミノ酸配列を含む。
【0098】
実施形態では、融合タンパク質は、配列番号1、2、3、4、5、6、7、8、9、10、11、12、13、14または15に対して少なくとも75%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号1に対して少なくとも75%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号2に対して少なくとも75%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号3に対して少なくとも75%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号4に対して少なくとも75%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号5に対して少なくとも75%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号6に対して少なくとも75%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号7に対して少なくとも75%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号8に対して少なくとも75%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号9に対して少なくとも75%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号10に対して少なくとも75%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号11に対して少なくとも75%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号12に対して少なくとも75%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号13に対して少なくとも75%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号14に対して少なくとも75%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号15に対して少なくとも75%の配列同一性を有するアミノ酸配列を含む。
【0099】
実施形態では、融合タンパク質は、配列番号1、2、3、4、5、6、7、8、9、10、11、12、13、14または15に対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号1に対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号2に対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号3に対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号4に対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号5に対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号6に対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号7に対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号8に対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号9に対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号10に対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号11に対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号12に対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号13に対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号14に対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号15に対して少なくとも80%の配列同一性を有するアミノ酸配列を含む。
【0100】
実施形態では、融合タンパク質は、配列番号1、2、3、4、5、6、7、8、9、10、11、12、13、14または15に対して少なくとも85%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号1に対して少なくとも85%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号2に対して少なくとも85%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号3に対して少なくとも85%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号4に対して少なくとも85%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号5に対して少なくとも85%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号6に対して少なくとも85%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号7に対して少なくとも85%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号8に対して少なくとも85%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号9に対して少なくとも85%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号10に対して少なくとも85%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号11に対して少なくとも85%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号12に対して少なくとも85%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号13に対して少なくとも85%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号14に対して少なくとも85%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号15に対して少なくとも85%の配列同一性を有するアミノ酸配列を含む。
【0101】
実施形態では、融合タンパク質は、配列番号1、2、3、4、5、6、7、8、9、10、11、12、13、14または15に対して少なくとも90%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号1に対して少なくとも90%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号2に対して少なくとも90%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号3に対して少なくとも90%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号4に対して少なくとも90%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号5に対して少なくとも90%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号6に対して少なくとも90%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号7に対して少なくとも90%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号8に対して少なくとも90%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号9に対して少なくとも90%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号10に対して少なくとも90%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号11に対して少なくとも90%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号12に対して少なくとも90%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号13に対して少なくとも90%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号14に対して少なくとも90%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号15に対して少なくとも90%の配列同一性を有するアミノ酸配列を含む。
【0102】
実施形態では、融合タンパク質は、配列番号1、2、3、4、5、6、7、8、9、10、11、12、13、14または15に対して少なくとも95%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号1に対して少なくとも95%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号2に対して少なくとも95%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号3に対して少なくとも95%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号4に対して少なくとも95%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号5に対して少なくとも95%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号6に対して少なくとも95%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号7に対して少なくとも95%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号8に対して少なくとも95%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号9に対して少なくとも95%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号10に対して少なくとも95%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号11に対して少なくとも95%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号12に対して少なくとも95%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号13に対して少なくとも95%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号14に対して少なくとも95%の配列同一性を有するアミノ酸配列を含む。態様では、融合タンパク質は、配列番号15に対して少なくとも95%の配列同一性を有するアミノ酸配列を含む。
【0103】
複合体
融合タンパク質がエピゲノム編集を実行するために、融合タンパク質は、標的ポリヌクレオチド配列(例えば、編集される標的DNA配列)に相補的なポリヌクレオチド(例えば、sgRNA)と相互作用し(例えば、非共有結合的に結合する)、さらに、本明細書に記載の融合タンパク質のヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素が結合することができる配列(すなわち、結合配列)を含む。この複合体を形成することにより、融合タンパク質はエピゲノム編集を実行するために適切に配置される。「複合体」という用語は、2つ以上の構成要素を含み、構成要素が一緒に結合して機能単位を形成する組成物を指す。態様では、本明細書に記載の複合体は、本明細書に記載の融合タンパク質および本明細書に記載のポリヌクレオチドを含む。したがって、一態様では、実施形態およびその態様を含む、本明細書に記載の融合タンパク質と、ポリヌクレオチドであって、(1)標的ポリヌクレオチド配列に相補的なDNA標的化配列、および(2)ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素の結合配列であって、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素が、結合配列(例えば、DNA標的配列に結合可能なアミノ酸配列)を介してポリヌクレオチドに結合している、結合配列を含む、ポリヌクレオチドと、が提供される。
【0104】
DNA標的化配列とは、標的ポリヌクレオチド配列(DNAまたはRNA)に相補的なヌクレオチド配列を含むポリヌクレオチドを指す。態様では、DNA標的化配列は、「シングルガイドRNA」または「sgRNA」を含み得る単一RNA分子(単一RNAポリヌクレオチド)であり得る。態様では、DNA標的化配列は、2つのRNA分子を含む(例えば、結合配列(例えば、dCas9結合配列)でのハイブリダイゼーションを介して一緒に結合される)。態様では、DNA標的化配列(例えば、sgRNA)は、標的ポリヌクレオチド配列に対して、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%または99%相補的である。態様では、DNA標的化配列(例えば、sgRNA)は、細胞遺伝子の配列に対して、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%または99%相補的である。態様では、DNA標的化配列(例えば、sgRNA)は、細胞遺伝子の配列に結合する。態様では、DNA標的化配列(例えば、sgRNA)は、細胞遺伝子の配列に対して少なくとも75%相補的である。態様では、DNA標的化配列(例えば、sgRNA)は、細胞遺伝子の配列に対して少なくとも80%相補的である。態様では、DNA標的化配列(例えば、sgRNA)は、細胞遺伝子の配列に結合する。態様では、DNA標的化配列(例えば、sgRNA)は、細胞遺伝子の配列に対して少なくとも85%相補的である。態様では、DNA標的化配列(例えば、sgRNA)は、細胞遺伝子の配列に結合する。態様では、DNA標的化配列(例えば、sgRNA)は、細胞遺伝子の配列に対して少なくとも90%相補的である。態様では、DNA標的化配列(例えば、sgRNA)は、細胞遺伝子の配列に結合する。態様では、DNA標的化配列(例えば、sgRNA)は、細胞遺伝子の配列に対して少なくとも95%相補的である。態様では、DNA標的化配列(例えば、sgRNA)は、細胞遺伝子の配列に結合する。
【0105】
本明細書で提供される「標的ポリヌクレオチド配列」は、細胞内に存在するか、または細胞によって発現される核酸配列であり、ガイド配列(またはDNA標的化配列)は、標的配列とガイド配列(またはDNA標的化配列)間のハイブリダイゼーションがCRISPR複合体の形成を促進する相補性を有するように設計される。ハイブリダイゼーションを引き起こし、CRISPR複合体の形成を促進するのに十分な相補性があれば、完全な相補性は必ずしも必要ではない。態様では、標的ポリヌクレオチド配列は、外来性核酸配列である。態様では、標的ポリヌクレオチド配列は、内在性核酸配列である。
【0106】
標的ポリヌクレオチド配列は、エピゲノム編集に適したポリヌクレオチド(例えば、DNA配列)の任意の領域であり得る。態様では、標的ポリヌクレオチド配列は遺伝子の一部である。態様では、標的ポリヌクレオチド配列は、転写調節配列の一部である。態様では、標的ポリヌクレオチド配列は、プロモーター、エンハンサー、またはサイレンサーの一部である。態様では、標的ポリヌクレオチド配列は、プロモーターの一部である。態様では、標的ポリヌクレオチド配列は、エンハンサーの一部である。態様では、標的ポリヌクレオチド配列は、サイレンサーの一部である。
【0107】
実施形態では、標的ポリヌクレオチド配列は、低メチル化核酸配列である。「低メチル化核酸配列」は、当技術分野における標準的な意味に従って本明細書で使用され、5-メチルシトシンヌクレオチド上の(例えば、CpGでの)メチル基の喪失または欠如を指す。メチル基の喪失または欠如は、標準的な対照と比較して起こり得る。低メチル化は、例えば、より若い細胞または非癌細胞と比較して、それぞれ、老化細胞または癌(例えば、新生物の初期段階)で起こり得る。したがって、この複合体は、正常な(例えば、非疾患の非加齢)メチル化レベルを再確立するのに有用であり得る。
【0108】
実施形態では、標的ポリヌクレオチド配列は、転写開始部位に隣接する約3000塩基対(bp)以内にある。態様では、標的ポリヌクレオチド配列は、転写開始部位に隣接する約3000、2900、2800、2700、2600、2500、2400、2300、2200、2100、2000、1900、1800、1700、1600、1500、1400、1300、1200、1100、1000、900、800、700、600、500、400、300、200、または100塩基対(bp)以内にある。
【0109】
実施形態では、標的ポリヌクレオチド配列は、プロモーター配列に、その近くに、またはその中にある。態様では、標的ポリヌクレオチド配列は、CpGアイランド内にある。態様では、標的ポリヌクレオチド配列は、DNA低メチル化を特徴とする疾患または状態に関連することが知られている。
【0110】
実施形態では、例示的な標的ポリヌクレオチド配列は、表1および2に記載されるものを含む。態様では、標的ポリヌクレオチド配列は、配列番号37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、または95の配列を含む。態様では、標的ポリヌクレオチド配列は、配列番号37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、または95に対して、少なくとも80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有するアミノ酸配列を含む。態様では、標的ポリヌクレオチド配列は配列番号37である。態様では、標的ポリヌクレオチド配列は配列番号39である。態様では、標的ポリヌクレオチド配列は配列番号41である。態様では、標的ポリヌクレオチド配列は配列番号43である。態様では、標的ポリヌクレオチド配列は配列番号45である。態様では、標的ポリヌクレオチド配列は配列番号47である。態様では、標的ポリヌクレオチド配列は配列番号49である。態様では、標的ポリヌクレオチド配列は配列番号51である。態様では、標的ポリヌクレオチド配列は配列番号53である。態様では、標的ポリヌクレオチド配列は配列番号55である。態様では、標的ポリヌクレオチド配列は配列番号57である。態様では、標的ポリヌクレオチド配列は配列番号59である。態様では、標的ポリヌクレオチド配列は配列番号61である。態様では、標的ポリヌクレオチド配列は配列番号63である。態様では、標的ポリヌクレオチド配列は配列番号65である。態様では、標的ポリヌクレオチド配列は配列番号67である。態様では、標的ポリヌクレオチド配列は配列番号69である。態様では、標的ポリヌクレオチド配列は配列番号71である。態様では、標的ポリヌクレオチド配列は配列番号73である。態様では、標的ポリヌクレオチド配列は配列番号75である。態様では、標的ポリヌクレオチド配列は配列番号77である。態様では、標的ポリヌクレオチド配列は配列番号79である。態様では、標的ポリヌクレオチド配列は配列番号81である。態様では、標的ポリヌクレオチド配列は配列番号83である。態様では、標的ポリヌクレオチド配列は配列番号85である。態様では、標的ポリヌクレオチド配列は配列番号87である。態様では、標的ポリヌクレオチド配列は配列番号89である。態様では、標的ポリヌクレオチド配列は配列番号91である。態様では、標的ポリヌクレオチド配列は配列番号93である。態様では、標的ポリヌクレオチド配列は配列番号95である。
【0111】
態様では、標的ポリヌクレオチド配列は、配列番号37に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号39に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号41に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号43に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は配列番号45である。態様では、標的ポリヌクレオチド配列は、配列番号47に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号49に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号51に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号53に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号55に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号57に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号59に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号61に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号63に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号65に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号67に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号69に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号71に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号73に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号75に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号77に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号79に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号81に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号83に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号85に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号87に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号89に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号91に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号93に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号95に対して少なくとも75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する。
【0112】
態様では、標的ポリヌクレオチド配列は、配列番号37に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号39に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号41に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号43に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は配列番号45である。態様では、標的ポリヌクレオチド配列は、配列番号47に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号49に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号51に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号53に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号55に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号57に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号59に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号61に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号63に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号65に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号67に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号69に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号71に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号73に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号75に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号77に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号79に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号81に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号83に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号85に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号87に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号89に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号91に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号93に対して少なくとも90%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号95に対して少なくとも90%の配列同一性を有する。
【0113】
態様では、標的ポリヌクレオチド配列は、配列番号37に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号39に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号41に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号43に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は配列番号45である。態様では、標的ポリヌクレオチド配列は、配列番号47に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号49に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号51に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号53に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号55に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号57に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号59に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号61に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号63に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号65に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号67に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号69に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号71に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号73に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号75に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号77に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号79に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号81に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号83に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号85に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号87に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号89に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号91に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号93に対して少なくとも95%の配列同一性を有する。態様では、標的ポリヌクレオチド配列は、配列番号95に対して少なくとも95%の配列同一性を有する。
【0114】
実施形態では、複合体は、ポリヌクレオチドの結合配列に結合することによってポリヌクレオチドに結合し、それによってリボ核タンパク質複合体を形成するdCas9を含む。態様では、結合配列はヘアピン構造を形成する。態様では、結合配列は、30~100nt、35~50nt、37~47nt、または42ntの長さである。
【0115】
実施形態では、結合配列(例えば、Cas9結合配列)は、Cas9タンパク質(例えば、dCas9タンパク質)と相互作用するか、または結合し、そしてそれらは一緒に、DNA標的化配列によって認識される標的ポリヌクレオチド配列に結合する。結合配列(例えば、Cas9結合配列)は、互いにハイブリダイズして二本鎖RNA二重鎖(dsRNA二重鎖)を形成するヌクレオチドの2つの相補的なストレッチを含む。これらのヌクレオチドの2つの相補的ストレッチは、リンカーまたはリンカーヌクレオチドとして知られる介在ヌクレオチド(例えば、単一分子ポリヌクレオチドの場合)によって共有結合され得、そしてハイブリダイズして結合配列(例えば、Cas9結合配列)の二本鎖RNA二重鎖(dsRNA二重鎖、または「Cas9-結合配列の結合ヘアピン」)を形成し、したがって、ステムループ構造をもたらす。あるいは、いくつかの態様では、ヌクレオチドの2つの相補的ストレッチは共有結合されなくてもよく、代わりに、相補的配列(例えば、2分子ポリヌクレオチド)間のハイブリダイゼーションによって一緒に保持される。
【0116】
結合配列(例えば、Cas9結合配列)は、10ヌクレオチド~100ヌクレオチド、例えば、10ヌクレオチド(nt)~20nt、20nt~30nt、30nt~40nt、40nt~50nt、50nt~60nt、60nt~70nt、70nt~80nt、80nt~90nt、または90nt~100ntの長さを有することができる。態様では、結合配列は15ヌクレオチド(nt)~80ntまでの長さを有する。態様では、結合配列は15nt~50ntの長さを有する。態様では、結合配列は15nt~40ntの長さを有する。態様では、結合配列は15nt~30ntの長さを有する。態様では、結合配列は37nt~47nt(例えば、42nt)の長さを有する。態様では、結合配列は、15nt~25ntの長さを有する。
【0117】
結合配列(例えば、Cas9結合配列)のdsRNA二重鎖は、6塩基対(bp)~50bpの長さを有することができる。例えば、結合配列(例えば、Cas9結合配列)のdsRNA二重鎖は、6bp~40bp、6bp~30bp、6bp~25bp、6bp~20bp、6bp~15bp、8bp~40bp、8bp~30bp、8bp~25bp、8bp~20bp、または8bp~15bpの長さを有することができる。態様では、結合配列(例えば、Cas9結合配列)のdsRNA二重鎖は、8bp~10bpの長さを有する。態様では、結合配列(例えば、Cas9結合配列)のdsRNA二重鎖は、10bp~15bpの長さを有する。態様では、結合配列(例えば、Cas9結合配列)のdsRNA二重鎖は、15bp~18bpの長さを有する。態様では、結合配列(例えば、Cas9結合配列)のdsRNA二重鎖は、18bp~20bpの長さを有する。態様では、結合配列(例えば、Cas9結合配列)のdsRNA二重鎖は、20bp~25bpの長さを有する。態様では、結合配列(例えば、Cas9結合配列)のdsRNA二重鎖は、25bp~30bpの長さを有する。態様では、結合配列(例えば、Cas9結合配列)のdsRNA二重鎖は、30bp~35bpまでの長さを有する。態様では、結合配列(例えば、Cas9結合配列)のdsRNA二重鎖は、35bp~40bpまでの長さを有する。態様では、結合配列(例えば、Cas9結合配列)のdsRNA二重鎖は、40bp~50bpの長さを有する。
【0118】
実施形態では、本明細書に記載の融合タンパク質と複合体を形成する例示的なポリヌクレオチドには、sgRNAとして表1および2に記載されているものが含まれる。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドには、配列番号38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、もしくは94の配列またはそれらの対応するRNA配列が含まれる。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、もしくは94またはそれらに対応するRNA配列に対して、少なくとも80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有する配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号38の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号40の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号42の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号44の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号46の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号48の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号50の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号52の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号54の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号56の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号58の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号60の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号62の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号64の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号66の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号68の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号70の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号72の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号74の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号76の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号78の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号80の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号82の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号84の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号86の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号88の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号90の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号92の配列を含む。態様では、本明細書に記載の融合タンパク質と複合体を形成するポリヌクレオチドは、配列番号94の配列を含む。
【0119】
核酸とベクター
実施形態およびその態様を含む、本明細書に記載の融合タンパク質は、融合タンパク質をコードする核酸配列として提供され得る。したがって、一態様では、実施形態およびその態様を含む、本明細書に記載の融合タンパク質をコードする核酸配列が提供される。一態様では、実施形態およびその態様を含む、本明細書に記載の融合タンパク質をコードする核酸配列(DNA標的化配列を含む)が提供される。態様では、核酸配列は、本明細書に記載の特定の%配列同一性を有するアミノ酸配列を有する融合タンパク質を含む、本明細書に記載の融合タンパク質をコードする。態様では、核酸はRNAである。態様では、核酸はメッセンジャーRNAである。態様では、メッセンジャーRNAはメッセンジャーRNPである。態様では、核酸配列は、実施形態およびその態様を含む、本明細書に記載の融合タンパク質をコードする。態様では、核酸配列は配列番号1の融合タンパク質をコードする。態様では、核酸配列は配列番号2の融合タンパク質をコードする。態様では、核酸配列は配列番号3の融合タンパク質をコードする。態様では、核酸配列は配列番号4の融合タンパク質をコードする。態様では、核酸配列は配列番号5の融合タンパク質をコードする。態様では、核酸配列は配列番号6の融合タンパク質をコードする。態様では、核酸配列は配列番号7の融合タンパク質をコードする。態様では、核酸配列は配列番号8の融合タンパク質をコードする。態様では、核酸配列は配列番号9の融合タンパク質をコードする。態様では、核酸配列は配列番号10の融合タンパク質をコードする。態様では、核酸配列は配列番号11の融合タンパク質をコードする。態様では、核酸配列は配列番号12の融合タンパク質をコードする。態様では、核酸配列は配列番号13の融合タンパク質をコードする。態様では、核酸配列は配列番号14の融合タンパク質をコードする。態様では、核酸配列は配列番号15の融合タンパク質をコードする。
【0120】
実施形態およびその態様を含む、本明細書に記載の融合タンパク質をコードする核酸配列は、ベクターに含まれ得ることがさらに企図される。したがって、一態様では、実施形態およびその態様を含む、本明細書に記載の核酸配列を含むベクターが提供される。態様では、ベクターは、本明細書に記載の特定の%配列同一性を有するアミノ酸配列を有する融合タンパク質を含む、本明細書に記載の融合タンパク質をコードする核酸配列を含む。態様では、核酸はメッセンジャーRNAである。態様では、メッセンジャーRNAはメッセンジャーRNPである。態様では、ベクターは配列番号1の融合タンパク質をコードする核酸配列を含む。態様では、ベクターは配列番号2の融合タンパク質をコードする核酸配列を含む。態様では、ベクターは配列番号3の融合タンパク質をコードする核酸配列を含む。態様では、ベクターは配列番号4の融合タンパク質をコードする核酸配列を含む。態様では、ベクターは配列番号5の融合タンパク質をコードする核酸配列を含む。態様では、ベクターは配列番号6の融合タンパク質をコードする核酸配列を含む。態様では、ベクターは配列番号7の融合タンパク質をコードする核酸配列を含む。態様では、ベクターは配列番号8の融合タンパク質をコードする核酸配列を含む。態様では、ベクターは配列番号9の融合タンパク質をコードする核酸配列を含む。態様では、ベクターは配列番号10の融合タンパク質をコードする核酸配列を含む。態様では、ベクターは配列番号11の融合タンパク質をコードする核酸配列を含む。態様では、ベクターは配列番号12の融合タンパク質をコードする核酸配列を含む。態様では、ベクターは配列番号13の融合タンパク質をコードする核酸配列を含む。態様では、ベクターは配列番号14の融合タンパク質をコードする核酸配列を含む。態様では、ベクターは配列番号15の融合タンパク質をコードする核酸配列を含む。
【0121】
実施形態において、ベクターは、ポリヌクレオチドをさらに含み、ポリヌクレオチドは、(1)標的ポリヌクレオチド配列に相補的なDNA標的化配列、および(2)ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素の結合配列を含む。したがって、1つ以上のベクターは、エピゲノム編集を実行するために必要なすべての構成要素を含み得る。
【0122】
細胞
本明細書に記載の組成物は、細胞に組み込むことができる。細胞内で、実施形態およびその態様を含む、本明細書に記載の組成物は、エピゲノム編集を実行することができる。したがって、一態様では、実施形態およびその態様を含む本明細書に記載の融合タンパク質、実施形態およびその態様を含む本明細書に記載の核酸、実施形態およびその態様を含む本明細書に記載の複合体、または実施形態およびその態様を含む、本明細書に記載のベクター、を含む細胞を提供する。一態様では、実施形態およびその態様を含む、本明細書に記載の融合タンパク質を含む細胞が提供される。一態様では、実施形態およびその態様を含む、本明細書に記載の核酸を含む細胞が提供される。一態様では、実施形態およびその態様を含む、本明細書に記載の複合体を含む細胞が提供される。一態様では、実施形態およびその態様を含む、本明細書に記載のベクターを含む細胞が提供される。態様では、細胞は真核細胞である。態様では、細胞は哺乳動物細胞である。
【0123】
方法
本明細書に記載の組成物は、エピゲノム編集、より具体的には、標的核酸配列(例えば、遺伝子)の抑制またはサイレンシングをもたらすエピゲノム編集に使用できることが企図される。いかなる理論にも拘束されることを意図することなく、サイレンシングは、標的核酸配列を含むクロマチン上で、メチル化および/または抑制性クロマチンマーカーの導入(例えば、特定のヒストン(例えば、H3K9、H3K27)のモノメチル化、ジメチル化、またはトリメチル化、脱アセチル化、アセチル化、リン酸化、ユビキチン化)から生じ得る。いかなる理論にも拘束されることを意図することなく、この方法を使用して、例えば、メチル化を介してクロマチンを閉じるか、または標的核酸配列(例えば、遺伝子)を含むクロマチンに抑制性クロマチンマーカーを導入することによって、エピジェネティックな状態を変えることができる。いかなる理論にも拘束されることを意図することなく、Dnmt3A-3L融合はCpGアイランドに見出されるCG DNA部位にメチルマークを追加するように機能し、KRABドメインは抑制性マークを導入することによってヒストンを修飾するエピジェネティック因子を動員すると考えられる。いかなる理論にも拘束されることを意図することなく、DNAはCpGアイランドに見出されるCG配列のCヌクレオチドでメチル化される(すなわち、CpGアイランドに見出されるCG DNA部位のCヌクレオチドにメチルマークを追加する)。
【0124】
一態様では、実施形態およびその態様を含む、本明細書に記載の融合タンパク質をコードする第1のポリヌクレオチドを標的核酸を含む細胞に送達することと、(i)標的核酸配列に相補的なDNA標的化配列、および(ii)ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素の結合配列を含む、第2のポリヌクレオチドをその細胞に送達することと、を含む細胞内の標的核酸配列をサイレンシングする方法が提供される。いかなる理論にも拘束されることを意図することなく、融合タンパク質は、標的核酸配列を含むクロマチンをメチル化することによって、および/または標的核酸配列を含むクロマチンに抑制性クロマチンマークを導入することによって、細胞内の標的核酸配列をサイレンシングする。いかなる理論にも拘束されることを意図することなく、クロマチンをメチル化することは、CpGアイランドに見出されるCG配列のCヌクレオチドでDNAがメチル化されることを意味する(すなわち、CpGアイランドに見出されるCG DNA部位のCヌクレオチドにメチルマークを追加する)。態様では、標的核酸配列の約3000塩基対以内にある配列はメチル化されている。態様では、標的核酸配列の、約3000、2900、2800、2700、2600、2500、2400、2300、2200、2100、2000、1900、1800、1700、1600、1500、1400、1300、1200、1100、1000、900、800、700、600、500、400、300、200、または100塩基対以内にある配列はメチル化されている。
【0125】
本明細書で使用される「抑制性クロマチンマーカー」という用語は、標的核酸配列(例えば、遺伝子)のサイレンシング(例えば、転写の減少または阻害)をもたらすクロマチンに加えられた修飾を指す。抑制性クロマチンマーカーの例には、ヒストン(例えば、H3K9、H3K27、H3K79、H2BK5)のモノメチル化、ジメチル化、および/またはトリメチル化、アセチル化/脱アセチル化、リン酸化、およびユビキチン化が含まれるが、これらに限定されない。
【0126】
実施形態では、サイレンシングは、転写の完全な抑制を指す。態様では、サイレンシングは、対照の転写のレベルと比較して、転写の有意な減少を指す。
【0127】
実施形態では、第1のポリヌクレオチドは、第1のベクター内に含まれる。態様では、第1のポリヌクレオチドは、第2のベクター内に含まれる。態様では、第1のベクターと第2のベクターは同じである。態様では、第1のベクターは第2のベクターとは異なる。
【0128】
実施形態では、本明細書に記載のポリヌクレオチドは、当技術分野で知られている任意の方法によって、例えば、トランスフェクション、エレクトロポレーション、または形質導入によって細胞に送達される。
【0129】
あるいは、一態様では、実施形態およびその態様を含む、本明細書に記載の複合体を標的核酸を含む細胞に送達することを含む、細胞内の標的核酸配列をサイレンシングする方法が提供される。いかなる理論にも拘束されることを意図することなく、複合体は、標的核酸配列を含むクロマチンをメチル化することによって、および/または標的核酸配列を含むクロマチンに抑制性クロマチンマークを導入することによって、細胞内の標的核酸配列をサイレンシングする。
【0130】
実施形態では、細胞は哺乳動物細胞である。
【0131】
実施形態では、この方法は、非標的核酸配列に対する特異性よりも2倍高い特異性を有する。態様では、この方法は、非標的核酸配列に対する特異性よりも、少なくとも2倍(例えば、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、25倍)高い特異性を有する。特異性を決定するための方法は当技術分野で周知であり、これらに限定されないが、RNAシーケンシング(RNA-seq)、バイサルファイトシーケンシング、クロマチン免疫沈降、フローサイトメトリー、およびqPCRが含まれる。したがって、態様では、特異性はRNAシーケンシングによって決定される。態様では、特異性はバイサルファイトシーケンシングによって決定される。態様では、特異性はクロマチン免疫沈降によって決定される。態様では、特異性はフローサイトメトリーによって決定される。態様では、特異性はqPCRによって決定される。
【0132】
態様では、複合体は、当技術分野で知られている任意の方法、例えば、リボ核タンパク質(RNP)送達を介して細胞に送達される。
【0133】
実施形態N1~N41
実施形態N1.ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素、クルッペル関連ボックスドメイン、およびDNAメチルトランスフェラーゼドメインを含む、融合タンパク質。
【0134】
実施形態N2.ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素が、dCas9、ddCpf1、ヌクレアーゼ欠損Cas9バリアント、またはヌクレアーゼ欠損クラスII CRISPRエンドヌクレアーゼである、実施形態N1に記載の融合タンパク質。
【0135】
実施形態N3.DNAメチルトランスフェラーゼドメインが、Dnmt3A-3Lドメインである、実施形態N1またはN2に記載の融合タンパク質。
【0136】
実施形態N4.融合タンパク質が、N末端からC末端へと、DNAメチルトランスフェラーゼドメイン、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素、およびクルッペル関連ボックスドメインを含む、実施形態N1に記載の融合タンパク質。
【0137】
実施形態N5.ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素が、dCas9であり、DNAメチルトランスフェラーゼドメインが、Dnmt3A-3Lドメインである、実施形態N4に記載の融合タンパク質。
【0138】
実施形態N6.ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素が、dCas9であり、DNAメチルトランスフェラーゼドメインが、Dnmt3A-3Lドメインである、実施形態N5に記載の融合タンパク質。
【0139】
実施形態N7.ペプチドリンカーが、XTENリンカーである、実施形態N6に記載の融合タンパク質。
【0140】
実施形態N8.融合タンパク質が、N末端からC末端へと、クルッペル関連ボックス、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素、およびDNAメチルトランスフェラーゼドメインを含む、実施形態N1に記載の融合タンパク質。
【0141】
実施形態N9.ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素が、dCas9であり、DNAメチルトランスフェラーゼドメインが、Dnmt3A-3Lドメインである、実施形態N8に記載の融合タンパク質。
【0142】
実施形態N10.dCas9が、ペプチドリンカーを介してDnmt3A-3Lドメインに共有結合しており、クルッペル関連ボックスドメインが、ペプチドリンカーを介してdCas9に共有結合している、実施形態N9に記載の融合タンパク質。
【0143】
実施形態N11.ペプチドリンカーが、XTENリンカーである、実施形態N10に記載の融合タンパク質。
【0144】
実施形態N12.ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素が、ペプチドリンカーを介してクルッペル関連ボックスドメインに共有結合している、実施形態N1~N3のいずれか1つに記載の融合タンパク質。
【0145】
実施形態N13.ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素が、ペプチドリンカーを介してDNAメチルトランスフェラーゼドメインに共有結合している、実施形態N1~N3のいずれか1つに記載の融合タンパク質。
【0146】
実施形態N14.クルッペル関連ボックスドメインが、ペプチドリンカーを介してDNAメチルトランスフェラーゼドメインに共有結合している、実施形態N1~N3のいずれか1つに記載の融合タンパク質。
【0147】
実施形態N15.ペプチドリンカーが、XTENリンカーである、実施形態N12~N14のいずれか1つに記載の融合タンパク質。
【0148】
実施形態N16.XTENリンカーが、約16~80個のアミノ酸残基を含む、実施形態N15に記載の融合タンパク質。
【0149】
実施形態N17.核局在化シグナルペプチドをさらに含む、実施形態N1~N16のいずれか1つに記載の融合タンパク質。
【0150】
実施形態N18.融合タンパク質が、配列番号1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15のアミノ酸配列を含む、実施形態N1に記載の融合タンパク質。
【0151】
実施形態N19.実施形態N1~N18のいずれか1つに記載の融合タンパク質をコードする核酸配列。
【0152】
実施形態N20.核酸配列がメッセンジャーRNAである、実施形態N19の核酸配列。
【0153】
実施形態N21.複合体であって、(i)実施形態N1からN18のいずれか1つに記載の融合タンパク質と、(ii)ポリヌクレオチドであって、(a)標的ポリヌクレオチド配列に相補的なDNA標的化配列、および(b)ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素の結合配列であって、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素は、結合配列を介してポリヌクレオチドに結合している、結合配列を含む、ポリヌクレオチドと、を含む、複合体。
【0154】
実施形態N22.標的ポリヌクレオチド配列が、遺伝子の一部である、実施形態N21に記載の複合体。
【0155】
実施形態N23.標的ポリヌクレオチド配列が、転写調節配列の一部である、実施形態N21に記載の複合体。
【0156】
実施形態N24.標的ポリヌクレオチド配列が、プロモーター、エンハンサー、またはサイレンサーの一部である、実施形態N21に記載の複合体。
【0157】
実施形態N25.標的ポリヌクレオチド配列が、転写開始部位に隣接する約3000bp以内にある、実施形態N21に記載の複合体。
【0158】
実施形態N26.実施形態N19またはN20に記載の核酸配列を含むベクター。
【0159】
実施形態N27.ポリヌクレオチドをさらに含み、ポリヌクレオチドが、(a)標的ポリヌクレオチド配列に相補的なDNA標的化配列と、(b)ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素の結合配列と、を含む、実施形態N26に記載のベクター。
【0160】
実施形態N28.実施形態N1~N18のいずれか1つに記載の融合タンパク質、実施形態N19もしくはN20に記載の核酸、実施形態N21~N25のいずれか1つに記載の複合体、または実施形態N26もしくはN27に記載のベクター、を含む、細胞。
【0161】
実施形態N29.細胞が真核細胞である、実施形態N28に記載の細胞。
【0162】
実施形態N30.細胞が哺乳動物細胞である、実施形態N28に記載の細胞。
【0163】
実施形態N31.細胞内の標的核酸配列をサイレンシングする方法であって、(i)実施形態N1~N18のいずれか1つに記載の融合タンパク質をコードする第1のポリヌクレオチドを、標的核酸を含む細胞に送達することと、(ii)第2のポリヌクレオチドであって、(a)標的核酸配列に相補的なDNA標的化配列および(b)ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素の結合配列を含む、第2のポリヌクレオチド、を細胞に送達することと、を含む、方法。
【0164】
実施形態N32.融合タンパク質が、標的核酸配列を含むクロマチンをメチル化することによって、および/または標的核酸配列を含むクロマチンに抑制性クロマチンマークを導入することによって、細胞内の標的核酸配列をサイレンシングする、実施形態N31に記載の方法。
【0165】
実施形態N33.第1のポリヌクレオチドが、第1のベクター内に含まれる、実施形態N31またはN32に記載の方法。
【0166】
実施形態N34.第1のポリヌクレオチドが、第2のベクター内に含まれる、実施形態N31~N33のいずれか1つに記載の方法。
【0167】
実施形態N35.第1のベクターと第2のベクターが同じである、実施形態N34に記載の方法。
【0168】
実施形態N36.第1のベクターが第2のベクターとは異なる、実施形態N34に記載の方法。
【0169】
実施形態N37.細胞が哺乳動物細胞である、実施形態N31に記載の方法。
【0170】
実施形態N38.方法が、非標的核酸配列に対する特異性よりも2倍高い特異性を有する、実施形態N31に記載の方法。
【0171】
実施形態N39.細胞内の標的核酸配列をサイレンシングする方法であって、実施形態N21~N25のいずれか1つに記載の複合体を標的核酸を含む細胞に送達することを含む、方法。
【0172】
実施形態N40.複合体が、標的核酸配列を含むクロマチンをメチル化することによって、および/または標的核酸配列を含むクロマチンに抑制性クロマチンマークを導入することによって、細胞内の標的核酸配列をサイレンシングする、実施形態N39に記載の方法。
【0173】
実施形態N41.細胞が、哺乳動物細胞である、実施形態N39またはN40に記載の方法。
【0174】
実施形態N42.方法が、非標的核酸配列に対する特異性よりも2倍高い特異性を有する、実施形態N39~N41のいずれか1つに記載の方法。
【0175】
実施形態1~36
実施形態1.ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素、クルッペル関連ボックス(KRAB)ドメイン、およびDNAメチルトランスフェラーゼドメインを含む、融合タンパク質。
【0176】
実施形態2.ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素が、dCas9、ddCpf1、ヌクレアーゼ欠損Cas9バリアント、またはヌクレアーゼ欠損クラスII CRISPRエンドヌクレアーゼである、実施形態1に記載の融合タンパク質。
【0177】
実施形態3.DNAメチルトランスフェラーゼドメインが、Dnmt3A-3Lドメインである、実施形態1または2の融合タンパク質。
【0178】
実施形態4.ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素が、ペプチドリンカーを介してKRABドメインに共有結合している、実施形態1~3のいずれか1つに記載の融合タンパク質。
【0179】
実施形態5.ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素が、ペプチドリンカーを介してDNAメチルトランスフェラーゼドメインに共有結合している、実施形態1~4のいずれか1つに記載の融合タンパク質。
【0180】
実施形態6.KRABドメインが、ペプチドリンカーを介してDNAメチルトランスフェラーゼドメインに共有結合している、実施形態1~5のいずれか1つに記載の融合タンパク質。
【0181】
実施形態7.ペプチドリンカーが、XTENリンカーである、実施形態4~6のいずれか1つに記載の融合タンパク質。
【0182】
実施形態8.XTENリンカーが、約16~80個のアミノ酸残基を含む、実施形態7に記載の融合タンパク質。
【0183】
実施形態9.核局在化シグナルペプチドをさらに含む、実施形態1~8のいずれか1つに記載の融合タンパク質。
【0184】
実施形態10.融合タンパク質が、N末端からC末端へと、KRABドメイン、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素、およびDNAメチルトランスフェラーゼドメインを含む、実施形態1~9のいずれか1つに記載の融合タンパク質。
【0185】
実施形態11.ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素が、dCas9であり、DNAメチルトランスフェラーゼドメインが、Dnmt3A-3Lドメインである、実施形態1~10のいずれか1つに記載の融合タンパク質。
【0186】
実施形態12.dCas9が、ペプチドリンカーを介してKRABドメインに共有結合しており、dCas9が、ペプチドリンカーを介してDnmt3A-3Lドメインに共有結合している、実施形態11に記載の融合タンパク質。
【0187】
実施形態13.ペプチドリンカーが、XTENリンカーである、実施形態12に記載の融合タンパク質。
【0188】
実施形態14.融合タンパク質が、配列番号1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15のアミノ酸配列を含む、実施形態1~13のいずれか1つに記載の融合タンパク質。
【0189】
実施形態15.実施形態1~14のいずれか1つに記載の融合タンパク質をコードする核酸配列。
【0190】
実施形態16.複合体であって、(i)実施形態1~18のいずれか1つに記載の融合タンパク質と、(ii)ポリヌクレオチドであって、(a)標的ポリヌクレオチド配列に相補的なDNA標的化配列、および(b)ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素の結合配列であって、ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素は、結合配列を介してポリヌクレオチドに結合している、結合配列を含む、ポリヌクレオチドと、を含む、複合体。
【0191】
実施形態17.標的ポリヌクレオチド配列が、遺伝子の一部である、実施形態21に記載の複合体。
【0192】
実施形態18.標的ポリヌクレオチド配列が、転写調節配列の一部である、実施形態21に記載の複合体。
【0193】
実施形態19.標的ポリヌクレオチド配列が、プロモーター、エンハンサー、またはサイレンサーの一部である、実施形態21に記載の複合体。
【0194】
実施形態20.標的ポリヌクレオチド配列が、低メチル化核酸配列である、実施形態21に記載の複合体。
【0195】
実施形態21.標的ポリヌクレオチド配列が、転写開始部位に隣接する約3000bp以内にある、実施形態21に記載の複合体。
【0196】
実施形態22.実施形態19に記載の核酸配列を含むベクター。
【0197】
実施形態23.ポリヌクレオチドをさらに含み、ポリヌクレオチドが、(a)標的ポリヌクレオチド配列に相補的なDNA標的化配列と、(b)ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素の結合配列と、を含む、実施形態26に記載のベクター。
【0198】
実施形態24.実施形態1~14のいずれか1つに記載の融合タンパク質、実施形態15に記載の核酸、実施形態16~21のいずれか1つに記載の複合体、または実施形態22もしくは23に記載のベクター、を含む、細胞。
【0199】
実施形態25.細胞が、真核細胞である、実施形態28に記載の細胞。
【0200】
実施形態26.細胞が、哺乳動物細胞である、実施形態28に記載の細胞。
【0201】
実施形態27.細胞内の標的核酸配列をサイレンシングする方法であって、(i)実施形態1~14のいずれか1つに記載の融合タンパク質をコードする第1のポリヌクレオチドを、標的核酸を含む細胞に送達することと、(ii)第2のポリヌクレオチドであって、(a)標的核酸配列に相補的なDNA標的化配列および(b)ヌクレアーゼ欠損RNA誘導型DNAエンドヌクレアーゼ酵素の結合配列を含む、第2のポリヌクレオチド、を細胞に送達することと、を含み、融合タンパク質が、標的核酸配列を含むクロマチンをメチル化すること、および/または標的核酸配列を含むクロマチンに抑制性クロマチンマークを導入すること、により、細胞内の標的核酸配列をサイレンシングする、方法。
【0202】
実施形態28.第1のポリヌクレオチドが、第1のベクター内に含まれる、実施形態27に記載の方法。
【0203】
実施形態29.第1のポリヌクレオチドが、第2のベクター内に含まれる、実施形態27に記載の方法。
【0204】
実施形態30.第1のベクターおよび第2のベクターが同じである、実施形態28または29に記載の方法。
【0205】
実施形態31.第1のベクターが、第2のベクターとは異なる、実施形態28または29に記載の方法。
【0206】
実施形態32.細胞が、哺乳動物細胞である、実施形態27~31のいずれか1つに記載の方法。
【0207】
実施形態33.方法が、非標的核酸配列に対する特異性よりも2倍高い特異性を有する、実施形態27~32のいずれか1つに記載の方法。
【0208】
実施形態34.細胞内の標的核酸配列をサイレンシングする方法であって、方法は、実施形態16~20のいずれか1つに記載の複合体を、標的核酸を含む細胞に送達することを含み、複合体が、(i)標的核酸配列を含むクロマチンをメチル化すること、(ii)標的核酸配列を含むクロマチンに抑制性クロマチンマークを導入すること、または(iii)標的核酸配列を含むクロマチンをメチル化しかつ標的核酸配列を含むクロマチンに抑制性クロマチンマークを導入すること、により、細胞内の標的核酸配列をサイレンシングする、方法。
【0209】
実施形態35.細胞が、哺乳動物細胞である、実施形態34に記載の方法。
【0210】
実施形態36.方法が、非標的核酸配列に対する特異性よりも2倍高い特異性を有する、実施形態34または35に記載の方法。
【実施例
【0211】
本明細書の実施形態および態様は、以下の実施例によってさらに説明される。実施例は、単に実施形態および態様を説明することを意図しており、本明細書の範囲を限定するものと解釈されるべきではない。
【0212】
実施例1
dCas9融合エピジェネティックモジュレーターを、永続的な遺伝子サイレンシングについて試験した。オールインワンタンパク質(図1A)の初期バージョン(V1、p76(配列番号1))は、GGSGGGS(配列番号17)リンカーで隔てられている、dCas9(配列番号23)の-N末端に融合されたKRABドメイン、およびdCas9のC末端にDnmt3A-Dnmt3L(EASGSGRASPGIPGSTR(配列番号19)リンカーによって隔てられている)を有する。KRABドメイン(配列番号16)、dCas9(D10A、H208A)、Dnmt3A-Dnmt3L(配列番号33、ここで、配列番号26はDnmt3Aでありかつ配列番号28はDnmt3Lである)を1つのポリペプチドにまとめた別のオールインワンタンパク質(図1B)。図1Bを参照すると、dCas9-KRABタンパク質は、CRISPR干渉(CRISPRi)適用に関するGilbert et al.,Cell 2013から採用され、dCas9-Dnmt3A-Dnmt3L融合は、Stepper et al.,Nucleic Acids Research,2016から採用された。
【0213】
オールインワンタンパク質による長期サイレンシングを評価するため、DNAメチル化感受性GFPレポーター(Stelzer et al.,Cell 2015から採用)を使用して、V1エピジェネティックエディタの活性をHEK293T細胞で試験した(図1C)。哺乳動物細胞におけるレンチウイルスベクターのバックグラウンドサイレンシングを防ぐために、GAPDH CpGアイランド(CGI)の上流にユビキタスクロマチンオープニングエレメント(UCOE)が追加された。GAPDH CGIがメチル化されると、gfp遺伝子はオフになる。A、B、Cは、プロモーターで標的とするシングルガイドRNA(sgRNA)をコードした位置を示す。これらの標的配列および対応するsgRNA配列を以下の表1に示す。2つのプラスミドを細胞にコトランスフェクトし、一方はヒットエンドランタンパク質をコードし、もう一方はsgRNAをコードするプラスミドであった(図1D)。トランスフェクションの2日後、ヒットエンドランタンパク質とsgRNA発現ベクターを発現する細胞を選別する。GFP蛍光は、フローサイトメトリーによって経時的に評価される。オールインワンタンパク質がsgRNAで発現されると、GFPレポーターの長期サイレンシングを受けている細胞の集団が観察された(図1E)。長期サイレンシングを受けている細胞の数は、dCas9-Dnmt3A-Dnmt3L(KRABドメインを欠いている)よりも多かった。
【表2】
【0214】
GFPレポーターのサイレンシングはsgRNA配列に依存しており、ガイドCは、試験した3つのsgRNA配列の中で最高レベルのサイレンシングをもたらす。異なる配列をコードするsgRNAのプーリングは、遺伝子サイレンシングに有意な変化がなかった。
【0215】
実施例2
3つの遺伝子(CD29、CD81、CD151)を、ヒットエンドラン融合タンパク質を使用して長期サイレンシングの標的とした。3つのタンパク質はすべて細胞表面に局在しており、ノックダウンを細胞の細胞表面抗体染色とそれに続くフローサイトメトリーによって評価した。トランスフェクションの22日後に取られた代表的なフローサイトメトリーデータを図2A~2Cに示す。象限IVは、遺伝子がオフになっている細胞を表し、遺伝子がオフになっている細胞のパーセンテージで示した。象限IおよびIIに細胞がないことは、ヒットエンドランタンパク質(BFPでマークされている)が細胞内に存在しなくなったことを意味する。図2Dは、3つの異なるsgRNA配列または3つすべてのsgRNAのプールを用いたCD29、CD81およびCD151のサイレンシングの定量化を提供する。この実験で使用した標的DNA配列とそのsgRNAを表2にまとめる。
【表3】
【0216】
2つまたは3つの遺伝子を同時に標的にして、異なる遺伝子を標的とするsgRNAの同時送達によってオールインタンパク質を多重化できることを示した。NT sgRNAは、非標的化sgRNA対照を指す。結果を図2Eに示す。
【0217】
単一クローンとして開始された細胞の遺伝子サイレンシングが追跡され、細胞の大部分が標的CLTA遺伝子をオフに維持していることが観察された(39クローンのうち37クローン)。図2Fのプロットは、オールインワンタンパク質およびCLTA遺伝子を標的とするsgRNAのトランスフェクションの9ヶ月後にとった時点を表す。
【0218】
本明細書に記載のシステムは、哺乳動物ゲノム内の任意の遺伝子、特に遺伝子プロモーターにCpGアイランドを含む遺伝子を標的にすることができる。Dnmt3A-Dnmt3Lは、CpGジヌクレオチドを標準的に標的にする。標的化できる遺伝子の例には、CXCR4、CD4、CD8、CD45、PD-1、CLTA-4、TGFBR、TCRa、TCRb、B2Mが含まれるが、これらに限定されない。
【0219】
実施例3
トランスフェクションの36日後にITGB1(CD29)、CD81およびCD151の発現を失った細胞を収集し、それらのRNA発現プロファイルを分析した。図3A~3Cに示されるように、標的遺伝子のノックダウンに成功したことが、非標的化sgRNA対照と比較して検出された。図3D~3Fは、標的遺伝子が各実験でノックダウンされた唯一の有意な遺伝子であることを示す、ボルケーノプロットであり、遺伝子サイレンシングの高い特異性を示している。図3G~3Iは、標的遺伝子の96%を超えるノックダウンを示す転写物レベルの定量化である。
【0220】
実施例4
オールインワンタンパク質は、HeLa(頸部)、U2OS(骨)、およびヒト人工多能性幹細胞(iPSC)でトランスフェクトおよび発現させることができる。図4A~4Fのフローサイトメトリープロットは、タンパク質に融合されたBFP発現を示している。HeLaおよびU2OS細胞の3つの内在性遺伝子(すなわち、CD29、CD81、およびCD151)が標的とされた。図4Gに示されるように、トランスフェクションの18日後に測定された安定したサイレンシングが検出された。Pcsk9、Npc1、Spcs1、およびCd81を標的とした場合、AML12マウス肝細胞株の遺伝子サイレンシングが検出された。図4Hに示されるように、サイレンシングは、トランスフェクションの14日後に測定されたqPCRによって検出された。この実験で使用したsgRNA配列を表3にまとめる。
【表4】
【0221】
実施例5
図5は、遺伝子サイレンシングのために設計および試験されたオールインワンタンパク質構築物の概略図を提供する。配列番号1の初期設計(p76、V1)は、dCas9(配列番号29)のNまたはC末端のいずれかで、XTENリンカー(例えば、16アミノ酸(配列番号31)または80アミノ酸(配列番号32))をコードするように改変された。すべてのベクターは、dCas9のC末端にHAタグ(配列番号24)を含んでいる。態様では、例えば、構築物p76、およびp90-102、p112(V2)において良好な発現を提供するため、CAGプロモーターが使用される。図5を参照すると、p90~p102のタンパク質構築物は、それぞれ、配列番号2~14に対応し、タンパク質構築物p112は、配列番号15に対応する。
【0222】
実施例6
図5に示されるタンパク質構築物は、トランスフェクション後18日間のHEK293T細胞におけるCLTA遺伝子のサイレンシングについて試験された(図6A~6B)。p99(配列番号11)、p100(配列番号12)、およびp112(配列番号15)などのp76(V1)設計と比較してより耐久性のある遺伝子サイレンシングを有するバリアントのパネルを含む、可変レベルの遺伝子サイレンシング活性が検出された。図6Aおよび6Bは、dCas9-KRABおよびdCas9-Dnmt3A-Dnmt3L構築物が、一過性で長期サイレンシングがより低効率であることを示したことを示す。
【0223】
p76(配列番号1)、p112(配列番号15)を、HEK293T細胞で安定して発現されるHIST2H2BE(H2B)内在性遺伝子および合成Snrpn-GFPレポーター遺伝子のサイレンシングについて試験した(図6C~6D)。トランスフェクション後50日間細胞を追跡した。p112バリアントは、p76(V1)設計よりも高効率で遺伝子サイレンシングを維持した。dCas9-Dnmt3A-Dnmt3LおよびdCas9-KRAB融合タンパク質は、一過性であり、長期サイレンシングがより低効率である。図6Eは、HIST2H2BE(H2B)遺伝子をオフにするための50日の時間経過にわたるp76およびp112のタンパク質発現のプロットを提供する。タンパク質レベルは、オールインワンタンパク質と同時発現するBFPのフローサイトメトリー検出によって測定された。
【0224】
実施例7
Steptococcus pyogenes Cas9に対する抗体を使用してオールインワンタンパク質バリアントp76、p90~p102でウエスタンブロット分析を行った。図7Aを参照すると、上のバンドは完全長タンパク質を表し、より小さいサイズのバンドはオールインワンタンパク質のタンパク質分解を表す。p99(配列番号11)、p100(配列番号12)、およびp102(配列番号14)など、タンパク質分解をほとんど示さないバリアントは、遺伝子サイレンシングのより高効率を示した。p96(配列番号8)およびp97(配列番号9)などの高レベルのタンパク質分解を伴うバリアントは、より低効率の持続的な遺伝子サイレンシングにつながった。
【0225】
融合タンパク質から切断された遊離Dnmt3Aを検出するために、オールインワンタンパク質バリアントを用いてウエスタンブロット分析を実施した。図7Bに示されるように、p92(配列番号4)、p100(配列番号12)、p101(配列番号13)、およびp102(配列番号14)などの、検出可能な遊離Dnmt3をほとんどまたは全く持たないバリアントは、検出可能な切断されたDnmt3Aを有するバリアント、すなわちp76(配列番号1)、p91(配列番号3)、p96(配列番号8)およびp98(配列番号10)と比較して、持続的な遺伝子サイレンシングの効率が高かった。
【0226】
実施例8
図8Aに示されるように、プールされたスクリーンをアッセイして、長期遺伝子サイレンシングをもたらす最適なsgRNAを決定した。それぞれがGFPタグ(CLTA、VIM、HIST2H2BE(H2B)、およびRAB11A)を含む異なる遺伝子を有する4つのHEK293T細胞株を使用した。各遺伝子の転写開始部位(TSS)から+/-2.5kbにおよぶsgRNAからなるタイリングライブラリーは、レンチウイルス送達とそれに続くオールインワンタンパク質を発現する一過性発現プラスミドDNAによって細胞内で安定して発現された。トランスフェクションの4週間後、遺伝子サイレンシングを維持している細胞を選別して、sgRNAの同一性を決定した。図8B~8Eは、トランスフェクションの4週間後に遺伝子サイレンシングを受けている細胞のパーセントを示すフローサイトメトリーヒストグラムである。
【0227】
図9A~9Dは、標的遺伝子(CLTA、H2B、RAB11、VIM)の転写開始部位にまたがるsgRNA機能性のマップである。転写開始部位(TSS)とCpGアイランドは、各プロットの上に注釈が付けられている。各ドットは1つのsgRNAを表し、長期遺伝子サイレンシングにおけるその有効性は、sgRNAの存在量のlog2倍の変化としてプロットされる。ヌクレオソーム占有率(下のプロット)は、MNaseシグナルからプロットされる。
【0228】
実施例9
図10Aは、オールインワンタンパク質の最適なsgRNA標的位置を決定するためのHEK293T細胞のプールされたスクリーンのワークフローであり、dCas9-KRABの最適なsgRNAを決定するため、K562細胞での従来のリシンタイリングスクリーンから採用されている(Gilbert,Horlbeck et al.,Cell 2014)。sgRNAは、レンチウイルス送達、続いてオールインワンタンパク質をコードするプラスミドの一過性トランスフェクションによってHEK293T細胞で最初に安定して発現された(0日目)。オールインワンタンパク質を発現する細胞を選別し(2日目)、さらに3日間増殖させる。細胞は5日目に分割され、そこから半分が最初の時点として収集され、残りの半分は最後の時点でさらに10日間(15日目)継代された。増殖表現型(γ)は、log2 sgRNAエンリッチメントを、T(初期)とT(最終)の間の細胞倍加の数で割ったものとして計算された。
【0229】
図10B-10Eは、K562細胞の既存のdCas9-KRAB/CRISPRiデータセット(Gilbert,Horlbeck et al.,2014)からの4つの遺伝子(ARL1、EIF6、SMC3、HEATR1)の増殖表現型を、オールインワンタンパク質(下のプロット)とともに示す、代表的なプロットである。各ドットはsgRNAを表す。TSSと注釈付きCpGアイランドが各遺伝子について示される。オールインワンタンパク質を使用する機能的sgRNAは、その機能的sgRNAよりも広い範囲におよび、より広い範囲で有効な標的化を示す。
【0230】
実施例10
図11A~11Bは、VPS53およびVPS54の増殖表現型およびヌクレオソーム配置(MNaseシグナルからの)の比較を提供し、ヌクレオソーム枯渇領域における機能的sgRNAの位置を示す。さらに、dCas9-KRAB/CRISPRiと比較して、オールインワンタンパク質を使用すると、機能的なsgRNAの範囲が広がる。
【0231】
実施例11
2つのオールインワンバリアント(p102(配列番号14)およびp112(配列番号15))のインビトロ転写は、各設計の完全長合成を示す(図12A)。図12Bは、HEK293T細胞へのmRNAのトランスフェクションの1日後のp102およびp112の発現を示すフローサイトメトリープロットを提供する。図12Cは、p102およびp112オールインワンバリアントを発現するmRNAをトランスフェクトした後のHEK293T細胞におけるCLTA内在性遺伝子サイレンシングの時間経過を示す。
【0232】
実施例12
図13Aは、ドキシサイクリン誘導性プロモーター下でオールインワンタンパク質を安定してコードするK562細胞におけるドキシサイクリンの添加によるオールインワンタンパク質の誘導された発現を示すフローサイトメトリープロットを提供する。ドキシサイクリン誘導後4日間タンパク質発現を追跡した。図13Aのパネルの点線は、ドキシサイクリン投与なしでのベースライン中央値BFP蛍光を表す。ドキシサイクリン処理の前後のオールインワンタンパク質の発現を検出するために、細胞のウエスタンブロットを行った(図13B)。オールインワンタンパク質の存在は、誘導後96時間までには検出されない。K562細胞のドキシサイクリン処理の14日後のCD81およびCD151ノックダウンのフローサイトメトリープロットを図13C~13Fに示す。標的遺伝子がノックダウンされた細胞のパーセントを示す。BFP+象限には細胞が存在しないため、オールインワンタンパク質の検出可能な発現はない。ドキシサイクリン処理の14日後またはドキシサイクリン処理なしのCD81およびCD151ノックダウンの定量化を図13Gに示す。
【0233】
参考文献
Ecco et al,Development 144,2017.Lambert et al,Cell 172,2018.Siddique et al.,J.Mol.Biol.,425,2013.Stepper et al,Nucleic Acids Res.,45,2017.Shmakov et al.,Nat.Rev.Microbiol.15,2017.Cebrian-Serrano et al,Mamm.Genome 7-8,2017.Pulecio et al.,Cell Stem Cell 21,2017.
【0234】
非公式の配列表
配列番号1(p76(オールインワンタンパク質配列、バージョン1):KRAB(太字、Gilbert et al.,Cell,2013,2014から)、リンカー(下線付き)、dCas9(斜体)、HAタグ(小文字)、SV40 NLS(小文字斜体)、Dnmt3A(太字斜体、残基612-912、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、27アミノ酸リンカー(斜体下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、Dnmt3L(太字下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、P2Aペプチド切断配列(小文字太字)、BFP(小文字下線付き))
【化1-1】
【化1-2】
【0235】
配列番号2(p90(KRAB-dCas9-XTEN16-Dnmt3A-Dnmt3L-P2A-BFP):KRAB(太字、Gilbert et al.,Cell,2013,2014から)、リンカー(下線付き)、dCas9(斜体)、HAタグ(小文字)、SV40 NLS(小文字斜体)、XTEN16(大文字、16アミノ酸配列)、Dnmt3A(太字斜体、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、27アミノ酸リンカー(斜体下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、Dnmt3L(太字下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、P2Aペプチド切断配列(小文字太字)、BFP(小文字下線付き))
【化2-1】
【化2-2】
【0236】
配列番号3(p91(KRAB-dCas9-Dnmt3A-Dnmt3L-P2A-P2A-BFP):KRAB(太字、Gilbert et al.,Cell,2013,2014から)、リンカー(下線付き)、dCas9(斜体)、HAタグ(小文字)、SV40 NLS(小文字斜体)、Dnmt3A(太字斜体、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、27アミノ酸リンカー(斜体下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、Dnmt3L(太字下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、P2Aペプチド切断配列(小文字太字)、BFP(小文字下線付き))
【化3-1】
【化3-2】
【0237】
配列番号4(p92(KRAB-dCas9-XTEN16-Dnmt3A-Dnmt3L-P2A-P2A-BFP):KRAB(太字、Gilbert et al.,Cell,2013,2014から)、リンカー(下線付き)、dCas9(斜体)、HAタグ(小文字)、SV40 NLS(小文字斜体)、XTEN16(16アミノ酸配列)、Dnmt3A(太字斜体、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、27アミノ酸リンカー(斜体下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、Dnmt3L(太字下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、P2Aペプチド切断配列(小文字太字)、BFP(小文字下線付き))
【化4-1】
【化4-2】
【0238】
配列番号5(p93(KRAB-dCas9-XTEN80-Dnmt3A-Dnmt3L-P2A-BFP):KRAB(太字、Gilbert et al.,Cell,2013,2014から)、リンカー(下線付き)、dCas9(斜体)、HAタグ(小文字)、SV40 NLS(小文字斜体)、XTEN80(80アミノ酸配列)、Dnmt3A(太字斜体、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、27アミノ酸リンカー(斜体下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、Dnmt3L(太字下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、P2Aペプチド切断配列(小文字太字)、BFP(小文字下線付き))
【化5-1】
【化5-2】
【0239】
配列番号6(p94(KRAB-dCas9-XTEN80-Dnmt3A-Dnmt3L-P2A-P2A-BFP):KRAB(太字、Gilbert et al.,Cell,2013,2014から)、リンカー(下線付き)、dCas9(斜体)、HAタグ(小文字)、SV40 NLS(小文字斜体)、XTEN80(80アミノ酸配列)、Dnmt3A(太字斜体、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、27アミノ酸リンカー(斜体下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、Dnmt3L(太字下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、P2Aペプチド切断配列(小文字太字)、BFP(小文字下線付き))
【化6】
【0240】
配列番号7(p95(KRAB-XTEN16-dCas9-Dnmt3A-Dnmt3L-P2A-BFP):KRAB(太字、Gilbert et al.,Cell,2013,2014から)、リンカー(下線付き)、XTEN16(16アミノ酸配列)、dCas9(斜体)、HAタグ(小文字)、SV40 NLS(小文字斜体)、Dnmt3A(太字斜体、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、27アミノ酸リンカー(斜体下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、Dnmt3L(太字下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、P2Aペプチド切断配列(小文字太字)、BFP(小文字下線付き))
【化7】
【0241】
配列番号8(p96(KRAB-XTEN16-dCas9-Dnmt3A-Dnmt3L-P2A-P2A-BFP):KRAB(太字、Gilbert et al.,Cell,2013,2014から)、リンカー(下線付き)、XTEN16(16アミノ酸配列)、dCas9(斜体)、HAタグ(小文字)、SV40 NLS(小文字斜体)、Dnmt3A(太字斜体、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、27アミノ酸リンカー(斜体下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、Dnmt3L(太字下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、P2Aペプチド切断配列(小文字太字)、BFP(小文字下線付き))
【化8】
【0242】
配列番号9(p97(KRAB-XTEN80-dCas9-Dnmt3A-Dnmt3L-P2A-BFP):KRAB(太字、Gilbert et al.,Cell,2013,2014から)、リンカー(下線付き)、XTEN80(80アミノ酸配列)、dCas9(斜体)、HAタグ(小文字)、SV40 NLS(小文字斜体)、Dnmt3A(太字斜体、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、27アミノ酸リンカー(斜体下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、Dnmt3L(太字下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、P2Aペプチド切断配列(小文字太字)、BFP(小文字下線付き))
【化9-1】
【化9-2】
【0243】
配列番号:10(p98(KRAB-XTEN80-dCas9-Dnmt3A-Dnmt3L-P2A-P2A-BFP):KRAB(太字、Gilbert et al.,Cell,2013,2014から)、リンカー(下線付き)、XTEN80(80アミノ酸配列)、dCas9(斜体)、HAタグ(小文字)、SV40 NLS(小文字斜体)、Dnmt3A(太字斜体、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、27アミノ酸リンカー(斜体下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、Dnmt3L(太字下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、P2Aペプチド切断配列(小文字太字)、BFP(小文字下線付き))
【化10-1】
【化10-2】
【0244】
配列番号11(p99(KRAB-XTEN16-dCas9-XTEN80-Dnmt3A-Dnmt3L-P2A-BFP):KRAB(太字、Gilbert et al.,Cell,2013,2014から)、XTEN16(16アミノ酸配列)、dCas9(斜体)、HAタグ(小文字)、リンカー(下線付き)、SV40 NLS(小文字斜体)、XTEN80(小文字斜体太字、80アミノ酸配列)、Dnmt3A(太字斜体、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、27アミノ酸リンカー(斜体下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、Dnmt3L(太字下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、P2Aペプチド切断配列(小文字太字)、BFP(小文字下線付き))
【化11-1】
【化11-2】
【0245】
配列番号12(p100(KRAB-XTEN16-dCas9-XTEN80-Dnmt3A-Dnmt3L-P2A-P2A-BFP):KRAB(太字、Gilbert et al.,Cell,2013,2014から)、XTEN16(16アミノ酸配列)、dCas9(斜体)、HAタグ(小文字)、リンカー(下線付き)、SV40 NLS(小文字斜体)、XTEN80(小文字太字斜体、80アミノ酸配列)、Dnmt3A(太字斜体、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、27アミノ酸リンカー(斜体下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、Dnmt3L(太字下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、P2Aペプチド切断配列(小文字太字)、BFP(小文字下線付き))
【化12-1】
【化12-2】
【0246】
配列番号13(p101(KRAB-XTEN80-dCas9-XTEN16-Dnmt3A-Dnmt3L-P2A-BFP):KRAB(太字、Gilbert et al.,Cell,2013,2014から)、リンカー(下線付き)、XTEN80(小文字太字斜体、80アミノ酸配列)、dCas9(斜体)、HAタグ(小文字)、SV40 NLS(小文字斜体)、XTEN16(16アミノ酸配列)、Dnmt3A(太字斜体、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、27アミノ酸リンカー(斜体下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、Dnmt3L(太字下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、P2Aペプチド切断配列(小文字太字)、BFP(小文字下線付き))
【化13-1】
【化13-2】
【0247】
配列番号14(p102(KRAB-XTEN80-dCas9-XTEN16-Dnmt3A-Dnmt3L-P2A-BFP):KRAB(太字、Gilbert et al.,Cell,2013,2014から)、リンカー(下線付き)、XTEN80(小文字太字斜体、80アミノ酸配列)、dCas9(斜体)、HAタグ(小文字)、SV40 NLS(小文字斜体)、XTEN16(16アミノ酸配列)、Dnmt3A(太字斜体、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、27アミノ酸リンカー(斜体下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、Dnmt3L(太字下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、P2Aペプチド切断配列(小文字太字)、BFP(小文字下線付き))
【化14-1】
【化14-2】
【0248】
配列番号15(p112(Dnmt3A-Dnmt3L-XTEN80-dCas9-BFP-KRAB); KRAB(太字、Gilbert et al.,Cell,2013,2014から)、リンカー(下線付き)、XTEN80(小文字太字斜体、80アミノ酸配列)、dCas9(斜体)、HAタグ(小文字)、SV40 NLS(小文字斜体)、Dnmt3A(太字斜体、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、27アミノ酸リンカー(斜体下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、Dnmt3L(太字下線付き、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)、BFP(小文字下線付き))
【化15-1】
【化15-2】
【0249】
配列番号16(KRAB、Gilbert et al.,Cell,2013,2014から)
DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP
【0250】
配列番号17(リンカー)
GGSGGGS
【0251】
配列番号18(リンカー)
SGS
【0252】
配列番号19 (リンカー)
EASGSGRASPGIPGSTR
【0253】
配列番号20(リンカー)
SRAD
【0254】
配列番号21(リンカー)
GSG
【0255】
配列番号22(リンカー
SPG
【0256】
配列番号23(dCas9)
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
【0257】
配列番号24(HAタグ)
YPYDVPDYA
【0258】
配列番号25(SV40 NLS)
PKKKRKV
【0259】
配列番号26(Dnmt3A、残基612-912、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)
NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV
【0260】
配列番号27(27アミノ酸リンカー、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)
SSGNSNANSRGPSFSSGLVPLSLRGSH
【0261】
配列番号28(Dnmt3L、Siddique et al.,JMB,2013、Stepper et al.,NAR,2016から)
MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL
【0262】
配列番号29(P2Aペプチド切断配列)
ATNFSLLKQAGDVEENPGP
【0263】
配列番号30(BFP)
SELIKENMHMKLYMEGTVDNHHFKCTSEGEGKPYEGTQTMRIKVVEGGPLPFAFDILATSFLYGSKTFINHTQGIPDFFKQSFPEGFTWERVTTYEDGGVLTATQDTSLQDGCLIYNVKIRGVNFTSNGPVMQKKTLGWEAFTETLYPADGGLEGRNDMALKLVGGSHLIANIKTTYRSKKPAKNLKMPGVYYVDYRLERIKEANNETYVEQHEVAVARYCDLPSKLGHKLN*
【0264】
配列番号31(XTEN16(16アミノ酸配列))
SGSETPGTSESATPES
【0265】
配列番号32(XTEN80(80アミノ酸配列))
GGPSSGAPPPSGGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSE
【0266】
配列番号33(Dnmt3A-Dnmt3Lドメイン)
NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACVSSGNSNANSRGPSFSSGLVPLSLRGSHMGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL
【0267】
配列番号34(ddAsCfp1)
MTQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKSAKEKVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNYATKKPYSVEKFKLNFQMPTLASGWDVNKEKNNGAILFVKNGLYYLGIMPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAVTAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQKGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQAELFYRPKSRMKRMAHRLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKDRRFTSDKFFFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVVGTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLANLNFGFKSKRTGIAEKAVYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQSGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAGKRIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQELRN
【0268】
配列番号35(ddLbCfp1)
MSKLEKFTNCYSLSKTLRFKAIPVGKTQENIDNKRLLVEDEKRAEDYKGVKKLLDRYYLSFINDVLHSIKLKNLNNYISLFRKKTRTEKENKELENLEINLRKEIAKAFKGNEGYKSLFKKDIIETILPEFLDDKDEIALVNSFNGFTTAFTGFFDNRENMFSEEAKSTSIAFRCINENLTRYISNMDIFEKVDAIFDKHEVQEIKEKILNSDYDVEDFFEGEFFNFVLTQEGIDVYNAIIGGFVTESGEKIKGLNEYINLYNQKTKQKLPKFKPLYKQVLSDRESLSFYGEGYTSDEEVLEVFRNTLNKNSEIFSSIKKLEKLFKNFDEYSSAGIFVKNGPAISTISKDIFGEWNVIRDKWNAEYDDIHLKKKAVVTEKYEDDRRKSFKKIGSFSLEQLQEYADADLSVVEKLKEIIIQKVDEIYKVYGSSEKLFDADFVLEKSLKKNDAVVAIMKDLLDSVKSFENYIKAFFGEGKETNRDESFYGDFVLAYDILLKVDHIYDAIRNYVTQKPYSKDKFKLYFQNPQFMGGWDKDKETDYRATILRYGSKYYLAIMDKKYAKCLQKIDKDDVNGNYEKINYKLLPGPNKMLPKVFFSKKWMAYYNPSEDIQKIYKNGTFKKGDMFNLNDCHKLIDFFKDSISRYPKWSNAYDFNFSETEKYKDIAGFYREVEEQGYKVSFESASKKEVDKLVEEGKLYMFQIYNKDFSDKSHGTPNLHTMYFKLLFDENNHGQIRLSGGAELFMRRASLKKEELVVHPANSPIANKNPDNPKKTTTLSYDVYKDKRFSEDQYELHIPIAINKCPKNIFKINTEVRVLLKHDDNPYVIGIARGERNLLYIVVVDGKGNIVEQYSLNEIINNFNGIRIKTDYHSLLDKKEKERFEARQNWTSIENIKELKAGYISQVVHKICELVEKYDAVIALADLNSGFKNSRVKVEKQVYQKFEKMLIDKLNYMVDKKSNPCATGGALKGYQITNKFESFKSMSTQNGFIFYIPAWLTSKIDPSTGFVNLLKTKYTSIADSKKFISSFDRIMYVPEEDLFEFALDYKNFSRTDADYIKKWKLYSYGNRIRIFRNPKKNNVFDWEEVCLTSAYKELFNKYGINYQQGDIRALLCEQSDKAFYSSFMALMSLMLQMRNSITGRTDVDFLISPVKNSDGIFYDSRNYEAQENAILPKNADANGAYNIARKVLWAIGQFKKAEDEKLDKVKIAISNKEWLEYAQTSVKH
【0269】
配列番号36(ddFnCfp1)
MYPYDVPDYASGSGMSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
図1A
図1B
図1C
図1D
図1E
図1F
図2A
図2B
図2C
図2D
図2E
図2F
図3A
図3B
図3C
図3D
図3E
図3F
図3G
図3H
図3I
図4A
図4B
図4C
図4D
図4E
図4F
図4G
図4H
図5
図6A
図6B
図6C
図6D
図6E
図7A
図7B
図8A
図8B
図8C
図8D
図8E
図9A
図9B
図9C
図9D
図10A
図10B
図10C
図10D
図10E
図11A
図11B
図12A
図12B
図12C
図13A
図13B
図13C
図13D
図13E
図13F
図13G
【配列表】
0007555822000001.app