(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-06-28
(54)【発明の名称】RNA誘導エフェクターリクルートのためのシステム、方法、成分
(51)【国際特許分類】
C12N 15/09 20060101AFI20240621BHJP
C12N 9/16 20060101ALI20240621BHJP
C12N 15/11 20060101ALI20240621BHJP
C12N 1/15 20060101ALI20240621BHJP
C12N 1/19 20060101ALI20240621BHJP
C12N 1/21 20060101ALI20240621BHJP
C12N 5/10 20060101ALI20240621BHJP
C12N 5/071 20100101ALI20240621BHJP
【FI】
C12N15/09 110
C12N9/16 Z ZNA
C12N15/11 Z
C12N1/15
C12N1/19
C12N1/21
C12N5/10
C12N5/071
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023577887
(86)(22)【出願日】2022-06-17
(85)【翻訳文提出日】2024-02-08
(86)【国際出願番号】 US2022034072
(87)【国際公開番号】W WO2022266492
(87)【国際公開日】2022-12-22
(32)【優先日】2021-06-17
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】507303125
【氏名又は名称】ザ トラスティーズ オブ コロンビア ユニバーシティー イン ザ シティー オブ ニューヨーク
(74)【代理人】
【識別番号】110000338
【氏名又は名称】弁理士法人 HARAKENZO WORLD PATENT & TRADEMARK
(72)【発明者】
【氏名】スタンバーグ,サミュエル ヘンリー
(72)【発明者】
【氏名】ランプ,ジョージ ディヴィス
(72)【発明者】
【氏名】キング デヴィッドソン,レベッカ テレサ
【テーマコード(参考)】
4B065
【Fターム(参考)】
4B065AA93X
4B065AB01
4B065BA02
4B065CA44
(57)【要約】
本開示は、システム、キット、および方法を提供する。当該システム、キット、および方法は、1つ以上のエフェクタードメインを標的核酸にリクルートするため、およびまたは遺伝子操作された集合等間隔短回文リピート(CRISPR)-CRISPR関連(Cas)システムを利用して細胞内の標的遺伝子の発現を調節するためのシステムおよび方法を提供する。より詳細には、本開示は、以下を含むシステムを提供する:遺伝子操作されたCRISPR-Casシステムまたは遺伝子操作されたCRISPR-Casシステムをコードする1つ以上の核酸、ここで、CRISPR-Casシステムは、以下を含む:少なくとも1つのCasタンパク質(例えば、Cas6、Cas7、Cas5、Cas8、および/またはCas12k);標的核酸配列の少なくとも一部に相補的なガイドRNA(gRNA);ならびに、任意に、少なくとも1つのトランスポゾン関連タンパク質(例えば、TniQ、TnsC、TnsA、および/またはTnsB)。
【特許請求の範囲】
【請求項1】
以下を含む、標的核酸へのエフェクタードメインのリクルートシステム:
遺伝子操作された集合等間隔短回文リピート(CRISPR)-CRISPR関連(Cas)システム、または前記遺伝子操作されたCRISPR-Casシステムをコードする1つ以上の核酸、ここで、前記CRISPR-Casシステムは、以下a)およびb)を含む:
a)少なくとも1つのCasタンパク質;および
b)前記標的核酸配列の少なくとも一部に相補的なガイドRNA(gRNA)、
ここで、前記少なくとも1つのCasタンパク質のうちの1つ以上は、少なくとも1つのエフェクタードメインを含む。
【請求項2】
少なくとも1つのトランスポゾン関連タンパク質、またはそれをコードする1つ以上の核酸をさらに含む、請求項1に記載のシステム。
【請求項3】
前記少なくとも1つのトランスポゾン関連タンパク質のうちの1つ以上は、少なくとも1つのエフェクタードメインを含む、請求項2に記載のシステム。
【請求項4】
以下を含む、標的核酸へのエフェクタードメインのリクルートシステム:
遺伝子操作された集合等間隔短回文リピート(CRISPR)-CRISPR関連(Cas)システム、または前記遺伝子操作されたCRISPR-Casシステムをコードする1つ以上の核酸、ここで、前記CRISPR-Casシステムは、以下a)~c)を含む:
a)少なくとも1つのCasタンパク質;
b)少なくとも1つのトランスポゾン関連タンパク質;および
c)前記標的核酸配列の少なくとも一部に相補的なガイドRNA(gRNA)、
ここで、前記少なくとも1つのCasタンパク質および前記少なくとも1つのトランスポゾン関連タンパク質のうちの1つ以上は、少なくとも1つのエフェクタードメインを含む。
【請求項5】
前記少なくとも1つのエフェクタードメインは、転写活性化因子、転写抑制因子、塩基編集因子、エピジェネティック修飾因子、染色体座位イメージング剤、またはそれらの組み合わせを含む、請求項1~4のいずれかに記載のシステム。
【請求項6】
前記少なくとも1つのエフェクタードメインは、前記少なくとも1つのCasタンパク質および前記少なくとも1つのトランスポゾン関連タンパク質のうちの1つ以上に、N末端、C末端、またはそれらの組み合わせにおいて付加される、請求項1~5のいずれかに記載のシステム。
【請求項7】
前記少なくとも1つのCasタンパク質は、I型CRISPR-Casシステムに由来する、請求項1~6のいずれかに記載のシステム。
【請求項8】
前記少なくとも1つのCasタンパク質は、Cas5、Cas6、Cas7、およびCas8を含む、請求項1~7のいずれかに記載のシステム。
【請求項9】
前記少なくとも1つのCasタンパク質は、Cas8-Cas5融合タンパク質を含む、請求項1~8のいずれかに記載のシステム。
【請求項10】
Cas7は、少なくとも1つのエフェクタードメインを含む、請求項8または9に記載のシステム。
【請求項11】
Cas8または前記Cas8-Cas5融合タンパク質は、少なくとも1つのエフェクタードメインを含む、請求項8~10のいずれかに記載のシステム。
【請求項12】
前記少なくとも1つのCasタンパク質は、V型CRISPR-Casシステムに由来する、請求項1~6のいずれかに記載のシステム。
【請求項13】
前記少なくとも1つのCasタンパク質は、Cas12kを含む、請求項12に記載のシステム。
【請求項14】
Cas12kは、少なくとも1つのエフェクタードメインを含む、請求項13に記載のシステム。
【請求項15】
前記少なくとも1つのトランスポゾンタンパク質は、Tn7またはTn7様トランスポゾンシステムに由来する、請求項2~14のいずれかに記載のシステム。
【請求項16】
前記少なくとも1つのトランスポゾン関連タンパク質は、TniQを含む、請求項2~15のいずれかに記載のシステム。
【請求項17】
TniQは、少なくとも1つのエフェクタードメインを含む、請求項16に記載のシステム。
【請求項18】
前記少なくとも1つのトランスポゾン関連タンパク質は、TnsCをさらに含む、請求項2~17のいずれかに記載のシステム。
【請求項19】
TnsCは、少なくとも1つのエフェクタードメインを含む、請求項18に記載のシステム。
【請求項20】
前記少なくとも1つのトランスポゾン関連タンパク質は、TnsA、TnsB、またはそれらの組み合わせをさらに含む、請求項2~19のいずれかに記載のシステム。
【請求項21】
前記少なくとも1つのトランスポゾンタンパク質は、TnsA-TnsB融合タンパク質を含む、請求項20に記載のシステム。
【請求項22】
前記TnsA-TnsB融合タンパク質は、TnsAとTnsBとの間のアミノ酸リンカーをさらに含む、請求項21に記載のシステム。
【請求項23】
前記リンカーは、フレキシブルリンカーである、請求項22に記載のシステム。
【請求項24】
前記リンカーは、少なくとも1つのグリシンリッチ領域を含む、請求項22または23に記載のシステム。
【請求項25】
前記リンカーは、NLS配列を含む、請求項22~24のいずれかに記載のシステム。
【請求項26】
前記リンカーは、グリシンリッチ領域によって両端を挟まれたNLS配列を含む、請求項25に記載のシステム。
【請求項27】
前記少なくとも1つのCasタンパク質および前記少なくとも1つのトランスポゾン関連タンパク質のうちの1つ以上は、核局在化シグナル(NLS)を含む、請求項1~26のいずれかに記載のシステム。
【請求項28】
前記少なくとも1つのCasタンパク質および前記少なくとも1つのトランスポゾン関連タンパク質のうちの1つ以上は、2つ以上のNLSを含む、請求項27に記載のシステム。
【請求項29】
前記NLSは、前記少なくとも1つのCasタンパク質および前記少なくとも1つのトランスポゾン関連タンパク質のうちの1つ以上に、N末端、C末端、またはそれらの組み合わせにおいて付加される、請求項27または28に記載のシステム。
【請求項30】
前記NLSは、単節型配列である、請求項25~29のいずれかに記載のシステム。
【請求項31】
前記NLSは、双節型配列である、請求項25~29のいずれかに記載のシステム。
【請求項32】
前記NLSは、KRTADGSEFESPKKKRKV(配列番号4)に対して少なくとも70%の類似性を有する配列を含む、請求項31に記載のシステム。
【請求項33】
前記遺伝子操作されたCRISPR-Casシステムは、コレラ菌(Vibrio cholerae)、フォトバクテリウム・イリオピスカリウム(Photobacterium iliopiscarium)、腸炎ビブリオ(Vibrio parahaemolyticus)、シュードアルテロモナス属(Pseudoalteromonas sp.)、シュードアルテロモナス・ルテニカ(Pseudoalteromonas ruthenica)、フォトバクテリウム・ガンフウェンセ(Photobacterium ganghwense)、シェワネラ属(Shewanella sp.)、ビブリオ・ジアゾトロフィクス(Vibrio diazotrophicus)、ビブリオ属16(Vibrio sp.16)、ビブリオ属F12(Vibrio sp.F12)、ビブリオ・スプレンディダス(Vibrio splendidus)、アリイビブリオ・ウォダニス(Aliivibrio wodanis)、アリイビブリオ属(Aliivibrio sp.)、エンドゾイコモナス・アシディコラ(Endozoicomonas ascidiicola)、パラシェワネラ・スポンジアエ(Parashewanella spongiae)またはスキトネマ・ホフマニー(Scytonema hofmannii)に由来する、請求項1~32のいずれかに記載のシステム。
【請求項34】
前記少なくとも1つのgRNAは、非天然起源のgRNAである、請求項1~33のいずれかに記載のシステム。
【請求項35】
前記少なくとも1つのgRNAは、CRISPR RNA(crRNA)アレイにコードされる、請求項1~34のいずれかに記載のシステム。
【請求項36】
前記gRNAは、RNAポリメラーゼIIプロモーターの制御下で転写される、請求項1~35のいずれかに記載のシステム。
【請求項37】
前記標的核酸は、プロモーター領域を含む、請求項1~36のいずれかに記載のシステム。
【請求項38】
前記標的核酸は、上流活性化因子配列を含む、請求項1~37のいずれかに記載のシステム。
【請求項39】
前記1つ以上の核酸は、1つ以上のメッセンジャーRNA、1つ以上のベクター、またはそれらの組み合わせを含む、請求項1~38のいずれかに記載のシステム。
【請求項40】
前記少なくとも1つのCasタンパク質および前記gRNAは、異なる核酸によってコードされる、請求項1~39のいずれかに記載のシステム。
【請求項41】
前記少なくとも1つのCasタンパク質および前記gRNAのうちの1つ以上は、単一の核酸によってコードされる、請求項1~39のいずれかに記載のシステム。
【請求項42】
Cas7は、個別の核酸によってコードされる、請求項40または41に記載のシステム。
【請求項43】
単一の核酸が、前記gRNAおよび少なくとも1つのCasタンパク質をコードする、請求項1~42のいずれかに記載のシステム。
【請求項44】
前記少なくとも1つのCasタンパク質は、Cas6またはCas7である、請求項43に記載のシステム。
【請求項45】
前記少なくとも1つのトランスポゾン関連タンパク質は、前記少なくとも1つのCasタンパク質および前記gRNAと同じまたは異なる核酸上にコードされる、請求項2~44のいずれかに記載のシステム。
【請求項46】
前記少なくとも1つのCasタンパク質、前記少なくとも1つのトランスポゾン関連タンパク質、および前記gRNAの各々は、単一の核酸によってコードされる、請求項45に記載のシステム。
【請求項47】
前記システムは、残りのタンパク質成分またはそれをコードする核酸と比較して、Cas7またはCas7をコードする前記核酸をより多く含む、請求項1~46のいずれかに記載のシステム。
【請求項48】
前記1つ以上の核酸は、前記少なくとも1つのCasタンパク質をコードする前記配列または前記少なくとも1つのトランスポゾン関連タンパク質をコードする前記配列の下流に、三重らせんを形成することができる配列をさらに含む、請求項1~47のいずれかに記載のシステム。
【請求項49】
三重らせんを形成することができる前記配列は、前記少なくとも1つのCasタンパク質をコードする前記配列または前記少なくとも1つのトランスポゾン関連タンパク質をコードする前記配列の3’非翻訳領域にある、請求項48に記載のシステム。
【請求項50】
前記少なくとも1つのCasタンパク質および前記少なくとも1つのトランスポゾン関連タンパク質のうちの1つ以上は、リボソームスキッピングペプチドの配列を含む、請求項1~49のいずれかに記載のシステム。
【請求項51】
前記リボソームスキッピングペプチドは、2Aファミリーペプチドを含む、請求項50に記載のシステム。
【請求項52】
前記少なくとも1つのCasタンパク質の各々は、単一の融合タンパク質の一部である、請求項1~51のいずれかに記載のシステム。
【請求項53】
前記少なくとも1つのCasタンパク質および1つ以上の前記少なくとも1つのトランスポゾン関連タンパク質の各々は、単一の融合タンパク質の一部である、請求項52に記載のシステム。
【請求項54】
前記少なくとも1つのCasタンパク質のうちの1つ以上は、前記gRNAを有するリボ核タンパク質複合体の一部である、請求項1~53のいずれかに記載のシステム。
【請求項55】
前記リボ核タンパク質複合体は、前記少なくとも1つのトランスポゾン関連タンパク質のうちの1つ以上を含む、請求項54に記載のシステム。
【請求項56】
請求項1~55のいずれかに記載のシステムを含む、細胞。
【請求項57】
前記細胞は原核細胞である、請求項56に記載の細胞。
【請求項58】
前記細胞は真核細胞である、請求項56に記載の細胞。
【請求項59】
前記細胞は哺乳動物細胞である、請求項58に記載の細胞。
【請求項60】
前記細胞はヒト細胞である、請求項58または59に記載の細胞。
【請求項61】
請求項1~55のいずれかに記載のシステムを含む、組成物。
【請求項62】
以下を含む、細胞内の標的核酸に1つ以上のエフェクタードメインをリクルートする方法:
請求項1~55のいずれかに記載のシステムを細胞に導入すること。
【請求項63】
以下を含む、細胞内の標的遺伝子の発現を調節する方法:
請求項1~55のいずれかに記載のシステムを細胞に導入すること。
【請求項64】
前記標的核酸は、前記標的遺伝子の前記プロモーター領域または前記上流活性化因子配列を含む、請求項62または63に記載の方法。
【請求項65】
前記細胞は原核細胞である、請求項62~64のいずれかに記載の方法。
【請求項66】
前記細胞は真核細胞である、請求項62~64のいずれかに記載の方法。
【請求項67】
前記細胞は哺乳動物細胞である、請求項66に記載の方法。
【請求項68】
前記細胞はヒト細胞である、請求項66または67に記載の方法。
【請求項69】
前記細胞に導入することは、前記システムを対象に投与することを含む、請求項62~68のいずれかに記載の方法。
【請求項70】
前記投与することは、in vivo投与を含む、請求項69に記載の方法。
【請求項71】
前記投与することは、前記システムを含むex vivo処理された細胞の移植を含む、請求項69に記載の方法。
【発明の詳細な説明】
【発明の詳細な説明】
【0001】
〔分野〕
本発明は、エフェクター分子(例えば、転写活性化因子、抑制因子、エピジェネティック修飾因子)を標的核酸にRNA誘導でリクルートする方法およびシステムに関する。
【0002】
〔関連出願に対する相互参照〕
本出願は、2021年6月17日に出願された米国仮出願第63/211,635号の利益を主張するものであり、その内容は参照によってその全体が本明細書に組込まれる。
【0003】
〔連邦政府後援の研究または開発に関する声明〕
本発明は、米国国立衛生研究所から授与された番号HG011650の助成金による政府の支援を受けて行われた。政府は本発明について一定の権利を有する。
【0004】
〔塩基配列表の声明〕
2022年6月17日に作成され、ファイルサイズが430,408バイトである、「39604-601_SEQUENCE_LISTING_ST25」と題された、本明細書で出願されたコンピュータ可読配列リストのテキストは、参照によってその全体が本明細書に組込まれる。
【0005】
〔背景〕
DNA配列を正確かつ効率的に編集し、生きた細胞内での遺伝子発現を制御する能力は、何十年もの間、生命科学研究の究極の目標であり、多くの疾患の遺伝的影響に関する劇的な洞察を提供することができる。RNA-プログラム可能なCRISPR-関連(Cas)ヌクレアーゼは、多種多様な細胞および生物のゲノムにおいて正確な標的位置に二本鎖DNA切断(DSB)を発生させる能力を通じて、この目標の追求に貢献してきた。さらに、触媒的に不活性化されたCasヌクレアーゼは、標的DNA遺伝子座に繋留タンパク質を局在させるプログラム可能なDNA-結合タンパク質としても有用である。
【0006】
〔概要〕
本明細書に提供されるのは、標的核酸へのエフェクタードメインのリクルートシステムである。
【0007】
いくつかの実施形態では、システムは、遺伝子操作された集合等間隔短回文リピート(CRISPR)-CRISPR関連(Cas)システム、または遺伝子操作されたCRISPR-Casシステムをコードする1つ以上の核酸を含み、ここで、CRISPR-Casシステムは、以下を含み:a)少なくとも1つのCasタンパク質、およびb)標的核酸配列の少なくとも一部に相補的なガイドRNA(gRNA)、ここで、少なくとも1つのCasタンパク質のうちの1つ以上は、少なくとも1つのエフェクタードメインを含む。システムは、少なくとも1つのトランスポゾン関連タンパク質、またはそれをコードする1つ以上の核酸をさらに含み得、ここで、少なくとも1つのトランスポゾン関連タンパク質のうちの1つ以上は、少なくとも1つのエフェクタードメインを含む。
【0008】
いくつかの実施形態では、システムは、遺伝子操作された集合等間隔短回文リピート(CRISPR)-CRISPR関連(Cas)システム、または遺伝子操作されたCRISPR-Casシステムをコードする1つ以上の核酸を含み、ここで、CRISPR-Casシステムは、以下を含み:a)少なくとも1つのCasタンパク質;b)少なくとも1つのトランスポゾン関連タンパク質;およびc)標的核酸配列の少なくとも一部に相補的なガイドRNA(gRNA)、ここで、少なくとも1つのCasタンパク質および少なくとも1つのトランスポゾン関連タンパク質のうちの1つ以上は、少なくとも1つのエフェクタードメインを含む。
【0009】
いくつかの実施形態では、標的核酸は、目的の遺伝子のプロモーター領域を含む。いくつかの実施形態では、標的核酸は、上流活性化因子配列を含む。いくつかの実施形態では、目的の遺伝子は、細胞内の染色体上に位置する。
【0010】
いくつかの実施形態では、少なくとも1つのCasタンパク質のうちの1つ以上は、gRNAを有するリボ核タンパク質複合体の一部である。
【0011】
いくつかの実施形態では、少なくとも1つのエフェクタードメインは、転写活性化因子、転写抑制因子、塩基編集因子、エピジェネティック修飾因子、染色体座位イメージング剤、またはそれらの組み合わせを含む。
【0012】
いくつかの実施形態では、少なくとも1つのCasタンパク質は、I型CRISPR-CasシステムまたはV型CRISPR-Casシステムに由来する。いくつかの実施形態では、少なくとも1つのCasタンパク質は、Cas5、Cas6、Cas7、およびCas8を含む。いくつかの実施形態では、少なくとも1つのCasタンパク質は、Cas8-Cas5融合タンパク質を含む。いくつかの実施形態では、少なくとも1つのCasタンパク質は、Cas12kを含む。
【0013】
いくつかの実施形態では、エフェクタードメインは、Cas7、Cas8、Cas8-Cas5、またはそれらの任意の組み合わせに付加され得る。いくつかの実施形態では、エフェクタードメインは、Cas12kに付加され得る。
【0014】
いくつかの実施形態では、少なくとも1つのトランスポゾンタンパク質は、Tn7またはTn7様トランスポゾンシステムに由来する。いくつかの実施形態では、少なくとも1つのトランスポゾン関連タンパク質は、TniQを含む。いくつかの実施形態では、少なくとも1つのトランスポゾン関連タンパク質は、TnsCをさらに含む。いくつかの実施形態では、少なくとも1つのトランスポゾン関連タンパク質は、TnsA、TnsB、またはそれらの組み合わせをさらに含む。
【0015】
いくつかの実施形態では、エフェクタードメインは、TniQ、TnsC、またはそれらの組み合わせに付加され得る。
【0016】
いくつかの実施形態では、少なくとも1つのトランスポゾンタンパク質は、TnsA-TnsB融合タンパク質を含む。いくつかの実施形態では、TnsA-TnsB融合タンパク質は、TnsAとTnsBとの間のアミノ酸リンカーをさらに含む。リンカーはフレキシブルリンカーであってもよい。いくつかの実施形態では、リンカーは、少なくとも1つのグリシンリッチ領域を含む。いくつかの実施形態では、リンカーはNLS配列を含む。いくつかの実施形態では、リンカーは、グリシンリッチ領域によって両端を挟まれたNLS配列を含む。
【0017】
いくつかの実施形態では、少なくとも1つのCasタンパク質および少なくとも1つのトランスポゾン関連タンパク質のうちの1つ以上は、核局在化シグナル(NLS)を含む。いくつかの実施形態では、少なくとも1つのCasタンパク質および少なくとも1つのトランスポゾン関連タンパク質のうちの1つ以上は、2つ以上のNLSを含む。いくつかの実施形態では、NLSは、N末端、C末端、またはそれらの組み合わせにおいて、少なくとも1つのCasタンパク質および少なくとも1つのトランスポゾン関連タンパク質のうちの1つ以上に付加される。
【0018】
NLSは、単節型配列または双節型配列であり得る。いくつかの実施形態では、NLSは、KRTADGSEFESPKKKRKV(配列番号4)に対して少なくとも70%の類似性を有する配列を含む。
【0019】
いくつかの実施形態では、1つ以上の核酸は、1つ以上のメッセンジャーRNA、1つ以上のベクター、またはそれらの組み合わせを含む。
【0020】
いくつかの実施形態では、少なくとも1つのCasタンパク質、少なくとも1つのトランスポゾン関連タンパク質、およびgRNAは、異なる核酸によってコードされる。
【0021】
いくつかの実施形態では、少なくとも1つのCasタンパク質、少なくとも1つのトランスポゾン関連タンパク質、およびgRNAのうちの1つ以上は、単一の核酸によってコードされる。
【0022】
特定の実施形態では、Cas7は、個別の核酸によってコードされる。特定の実施形態では、Cas7またはCas7をコードする核酸は、残りのタンパク質成分またはそれらをコードする核酸と比較して、より大量に存在する。
【0023】
いくつかの実施形態では、単一の核酸が、gRNAおよび少なくとも1つのCasタンパク質(例えば、Cas6またはCas7)をコードする。
【0024】
いくつかの実施形態では、少なくとも1つのCasタンパク質、少なくとも1つのトランスポゾン関連タンパク質、およびgRNAの各々は、単一の核酸によってコードされる。
【0025】
いくつかの実施形態では、少なくとも1つのgRNAは、非天然起源のgRNAである。いくつかの実施形態では、少なくとも1つのgRNAは、CRISPR RNA(crRNA)アレイにコードされる。いくつかの実施形態では、少なくとも1つのgRNAは、RNAポリメラーゼIIプロモーターまたはRNAポリメラーゼIIIプロモーターの制御下で転写される。
【0026】
いくつかの実施形態では、1つ以上の核酸は、少なくとも1つのCasタンパク質をコードする配列、または少なくとも1つのトランスポゾン関連タンパク質をコードする配列の下流に、三重らせんを形成することができる配列をさらに含むか、またはコードする。いくつかの実施形態では、三重らせんを形成することができる配列は、少なくとも1つのCasタンパク質をコードする配列、または少なくとも1つのトランスポゾン関連タンパク質をコードする配列の3’非翻訳領域にある。
【0027】
いくつかの実施形態では、少なくとも1つのCasタンパク質をコードする核酸、および少なくとも1つのトランスポゾン関連タンパク質をコードする核酸のうちの1つ以上は、リボソームスキッピングペプチドをコードする配列を含む。いくつかの実施形態では、リボソームスキッピングペプチドは、2Aファミリーペプチドを含む。
【0028】
いくつかの実施形態では、遺伝子操作されたCRISPR-Casシステムは、コレラ菌(Vibrio cholerae)、フォトバクテリウム・イリオピスカリウム(Photobacterium iliopiscarium)、腸炎ビブリオ(Vibrio parahaemolyticus)、シュードアルテロモナス属(Pseudoalteromonas sp.)、シュードアルテロモナス・ルテニカ(Pseudoalteromonas ruthenica)、フォトバクテリウム・ガンフウェンセ(Photobacterium ganghwense)、シェワネラ属(Shewanella sp.)、ビブリオ・ジアゾトロフィクス(Vibrio diazotrophicus)、ビブリオ属16(Vibrio sp.16)、ビブリオ属F12(Vibrio sp.F12)、ビブリオ・スプレンディダス(Vibrio splendidus)、アリイビブリオ・ウォダニス(Aliivibrio wodanis)、アリイビブリオ属(Aliivibrio sp.)、エンドゾイコモナス・アシディコラ(Endozoicomonas ascidiicola)、パラシェワネラ・スポンジアエ(Parashewanella spongiae)またはスキトネマ・ホフマニー(Scytonema hofmannii)に由来する。
【0029】
また、開示されたシステムを含む細胞も提供される。いくつかの実施形態では、細胞は、原核細胞である。いくつかの実施形態では、細胞は、真核細胞(例えば、哺乳動物細胞またはヒト細胞)である。
【0030】
さらに、細胞内の標的核酸に1つ以上のエフェクタードメインをリクルートする方法、および本明細書に開示されるシステムまたは組成物を細胞に導入して細胞内の標的遺伝子の発現を調節する方法が開示される。
【0031】
いくつかの実施形態では、標的核酸配列は、標的遺伝子のプロモーター領域または上流活性化因子配列を含む。
【0032】
いくつかの実施形態では、細胞は原核細胞である。いくつかの実施形態では、細胞は真核細胞(例えば、哺乳動物細胞またはヒト細胞)である。
【0033】
いくつかの実施形態では、システムを細胞に導入することは、システムを対象に投与することを含む。いくつかの実施形態では、投与することは、in vivo投与を含む。いくつかの実施形態では、投与することは、システムを含むex vivoで処理された細胞の移植を含む。
【0034】
本明細書に開示されるシステムの成分のいずれかまたは全てを含むキットもまた、提供される。いくつかの実施形態では、キットは、1つ以上の試薬、出荷および/またはパッケージングのための容器、1つ以上の緩衝液、送達デバイス、説明書、またはそれらの組み合わせをさらに含む。
【0035】
本開示の他の態様および実施形態は、以下の詳細な説明に照らして明らかになるであろう。
【0036】
〔図面の簡単な説明〕
図1Aおよび1Bは、TniQ-Cascadeベースの転写抑制因子の開発を示す。
図1Aは、転写抑制設計の概略図である。Gal4-VP16ポリペプチドと上流活性化因子配列(UAS)との結合は、RNAポリメラーゼIIのリクルートを引き起こし、eYFPの転写を駆動する。QCascadeと適切なgRNAとを共導入すると、競合的結合によってGal4-VP16のリクルートを阻害するか(gRNA-3)、あるいは最小CMVプロモーターへの競合的結合によってRNA Pol IIのリクルートを直接阻害するか(gRNA-1およびgRNA-2)のいずれかによって、eYFP転写が競合的に阻害される。いずれの場合も、結合に成功するとeYFPの転写および発現が低下する。
図1Bは、レポータープラスミドおよび様々なTniQ-Cascade発現ベクター成分を、様々なNLS(例えば、双節型-NLS、またはBP;SV40-NLS、またはSV40)融合体を用いて、または用いずに共遺伝子導入した際の、eYFP平均蛍光強度(MFI)のグラフである。いくつかの対照実験では、タンパク質成分は意図的に省略した。
図1B内の各々のバーの上の数字は、表1に記載された情報に対応する実験識別子を表す。
【0037】
図2A~2Eは、TniQ-Cascadeベースの転写活性化因子の開発を示す。
図2Aは、pcDNA3.1-誘導体発現ベクター内の代表的なCas8-活性化因子構築物またはCas7-活性化因子構築物の例示的なプラスミド設計である。様々な活性化因子ドメインのうちの1つが、1つ以上のCas8またはTnsタンパク質のN末端またはC末端(または両方)のいずれかに融合され得る。
図2Bは、転写活性化アッセイの概略図である。レポータープラスミドは、最小CMVプロモーター、mCherryカセット、および5’CC PAMを有する上流32塩基対標的配列を含む。単独で遺伝子導入すると、レポーターはmCherryを最小発現する。Cas8またはCas7のいずれかに融合した活性化因子とQCascadeタンパク質成分を発現するプラスミドとを、レポータープラスミドを標的とするgRNAをコードするプラスミドと共に共遺伝子導入すると、QCascadeは発現し、複合体化し、次いでレポータープラスミド標的配列を標的とすることができ、転写活性化、RNA Pol IIのリクルート、およびmCherry発現レベルの上昇をもたらし、これはフローサイトメトリーによって定量される。
図2Cは、Cas8およびCas7への様々な活性化因子融合体を用いたVchINTEGRATEの大腸菌組込み効率のグラフである。RPVは、Rta-P65-VP64を含む三者活性化因子融合構築物を指す。これらの結果は、Cas7のN末端へのVP64およびRPV融合体がDNA組込み活性に悪影響を及ぼさないことを示している。組込み効率は、tRLおよびtLR配向産物の両方について示される。
図2Dは、様々なQCascade構築物を用いた転写活性化実験について、非標的化(NT)対照(バー69)に対するmCherry MFIを示す棒グラフである。活性化は、標的化(T)gRNAおよびVP64-Cas7融合タンパク質を用いて達成される。SV40は、SV40 NLSタグを指す。
図2Eは、様々なCRISPRシステム、および様々なタグ付きバージョンのQCascadeタンパク質成分を用いた転写活性化実験における、非標的化(NT)gRNAに対するmCherry MFIを示す棒グラフである。特に、VchINTEGRATE QCascade複合体を用いた転写活性化は、全てのタンパク質成分が、単節型SV40 NLSタグとは対照的に、双節型NLS(BP)タグを含む場合に、顕著により高い(バー78~80を比較)。活性化は、非標的化gRNAを用いた対照実験において、または、Cas6もしくはCas8を除去した場合に排除される。化膿性連鎖球菌(S.pyogenes)dCas9(II-A型)およびシュードモナス(Pseudomonas)S-6-2 Cascade(I-E型)との比較を示す。
図2C~2E内の各々のバーの上の数字は、表1に記載された情報に対応する実験識別子を表す。
【0038】
図3A~3Eは、TnsCがTniQ-CascadeによってDNAに特異的にリクルートされるオリゴマー複合体を形成することを示している。
図3A(下)は、ATPの存在下で大きな分子量種を形成するVchTnsC(Tn6677由来;VchINTEGRATE)のSuperdex 200カラムでのサイズ排除クロマトグラフィー(SEC)のクロマトグラムであり;標準物質(右)との比較は、ヘプタマー配列(予測分子量、MW=268kDa)と一致する分子量を示す。
図3A(上)は、反応中のATPを含むSECランからのタンパク質画分を示す上流のSDS-PAGEゲルである。
図3Bは、生の低温電子顕微鏡(cryoEM)の顕微鏡写真(右)およびTnsC・ATPの参照なしの2Dクラス平均(左)であり、中央孔を有する7つのスポークリングを明らかにした。
図3Cは、TnsC・ATPヘプタマーの予備的な3次元再構築の直交図であり、下に寸法を示す。中央孔は、モデル化した二本鎖DNA(dsDNA、右)の寸法に完全に対応している。
図3Dは、TnsC・ATPを低塩に溶かしたcryoEMデータであり、より大きなフィラメント集合体の存在を明示している。
図3Eは、クロマチン免疫沈降と続く次世代シークエンシング(ChIP-seq)によってアッセイした、VchTnsCが大腸菌のゲノム標的部位に極めて高いゲノムワイド特異性で結合することを示している。細胞は、VchINTEGRATEおよびドナーDNAからの全てのタンパク質成分と共に、赤い三角形で示した領域(lacZに見られる標的-4)を標的とするgRNAを発現した。VchCas8(上)またはVchTnsC(下)のいずれかは、3xFLAGタグを含んでいた。細胞を架橋し、溶解液を超音波処理してDNAをせん断し、タンパク質-DNA架橋種をChIPによって単離し、次いでNGSライブラリー調製およびディープシークエンシングを行った。これらの実験から、標的化gRNAおよび全てのTniQ-Cascade成分の存在に依存するメカニズムにおいて、TnsCによる極めて高い特異性の標的結合が示されている。
【0039】
図4A~4Dは、TnsC-活性化因子融合タンパク質をTniQ-Cascadeと組み合わせて、強力で高効率の合成転写活性化を行うことができることを示している。
図4Aは、pcDNA3.1-誘導体発現ベクター内のTnsC-VP64構築物の例示的なプラスミド設計である。Tn6677由来のVchTnsC(VchINTEGRATE)は、NLSタグおよびVp64-ドメインに融合される。
図4Bは転写活性化アッセイの概略図である。単独で遺伝子導入した場合には、
図2に記載のmCherryレポーターは、最小限のCMVプロモーターによって制御されるため、mCherryを最小限に発現する。QCascadeと、TnsC-VP64と、レポータープラスミド上に存在する標的を認識するgRNAとを発現するプラスミドを共遺伝子導入すると、QCascade(青色の楕円)は標的配列に結合し、TnsC-VP64(薄いオレンジ色の楕円)をリクルートし、mCherryの発現レベルの上昇につながる。TnsC-VP64の3つのコピーは、TnsCのリクルートのオリゴマー性を示すために単純化して示されており;細胞内の標的部位にリクルートされるTnsCタンパク質の実際の数は、かなり多くなり得る。
図4Cは、様々なCRISPR-Cas成分システム、および様々なタグ付きバージョンのTniQ-CascadeおよびTnsC成分を有するmCherry活性化を示す棒グラフである。データはフローサイトメトリーで測定し、細胞内のmCherry平均蛍光強度(MFI)を、下部に示した各々のシステムの非標的化gRNA対照に対してプロットした。dCas9は、化膿性連鎖球菌(S.pyogenes)由来であり;「Psp S-6-2」は、シュードモナス(Pseudomonas)種からのI-E型Cascadeを指し;Vchは、Tn6677由来のVchINTEGRATEを指す。右側に見られるように、BPおよびVP64に融合したTnsCの存在は、BPタグのついたQCascade成分と結合すると、強力な転写活性化につながる。この活性化は、VP64ドメインを除去した場合に(バー94)、かつ、TniQを省略した場合に(バー95)失われる。追加の順列を棒グラフの下のテキストに示し、ラベルを付した。
図4Dは、TnsA、TnsB、またはTnsAB
fの存在下で測定した、TnsC-VP64融合タンパク質を介したmCherry活性化を示す棒グラフである。データは
図4Cと同様に示され、非標的化(NT)対照に対する相対値でプロットされている。TnsAB
fは、TniQ-CascadeおよびTnsC-BP-VP64活性化因子と共に、転写活性化のレベルを高めた。
図4Cおよび4D内の各々のバーの上の数字は、表1に記載された情報に対応する実験識別子を表す。
【0040】
図5Aおよび5Bは、核内輸送およびQCascadeのアセンブリーおよび活性に関するVchCas7変異体を示す。
図5Aは、pcDNA3.1由来の発現ベクター内で生成され、試験された様々な例示的構築物の概略図である。VchCas7(VchINTEGRATE由来)は、CMVプロモーターの下流にクローニングされ、1つ以上のSV40タグまたはBP NLSタグを含み、任意で3xFLAGタグを含む。
図5Bは、
図5Aに記載の異なるCas7変異体を用いたQCascadeおよびTnsC転写活性化データを示す棒グラフである。TnsC活性化実験は、
図4に記載されるように実施および分析され、バー番号104の非標的化gRNAデータに対して正規化される。
図5B内の各々のバーの上の数字は、表1に記載された情報に対応する実験識別子を表す。
【0041】
図6は、TnsC-VP64発現プラスミドに対するQCascadeおよびgRNA発現プラスミドの異なる比率を用いた、TnsC-媒介転写活性化データを示す棒グラフである。TnsC-VP64活性化実験は、
図4に記載したように設計および実施し、細胞mCherry MFIをフローサイトメトリーによって測定し、非標的(NT)との相対値でプロットした。プラスミド量は各々の遺伝子導入のTnsC-VP64プラスミド量に対する相対値で示し、データはVPRに融合した化膿性連鎖球菌(S.pyogenes)dCas9の転写活性化レベルと比較する。これらのデータは、Cas8発現プラスミドの量が増加すると、QCascadeおよびTnsCの活性化レベルがdCas9-VPRのそれを上回ることを示しており、この因子が他の実験において制限的であったことを示している。各々のバーの上の数字は、表1に記載された情報に対応する実験識別子を表す。
【0042】
図7A~7Jは、転写抑制、転写活性化、エピゲノム編集、塩基編集、染色体DNAイメージング、およびコンビナトリアルエフェクター送達のためにQCascadeおよびTnsCを利用するための例示的な方法の概略図である。
図7Aは、TniQ-Cascade(別名QCascade)複合体によるRNA誘導標的DNA結合と、それに続くAAA+ATPアーゼであるTnsCのリクルートの可能なメカニズムの概略図である。上図では、PAMを黄色、ならびに標的DNA鎖を栗色で示す。標的DNA結合はRループの形成を伴い、QCascade複合体はgRNA(別名crRNA)、Cas8の1コピー、Cas7の6コピー、Cas6の1コピー、およびTniQの2コピーを含む。gRNAのスペーサー配列は32ヌクレオチド長であるが、代替長スペーサーも使用され得、RNA誘導DNA標的化および組込みを保持する((Klompe et al., Nature 571, 219-225 (2019); Songailiene, I. et al. Cell Rep 28, 3157-3166.e4 (2019))。QCascadeは標的DNA上に構造的なスキャフォールドを形成し、TnsCの複数コピーのリクルートをもたらす。このことは、続くTnsAおよびTnsBによって結合されたドナーDNAのリクルートをもたらし、最終的に標的組込みをもたらす(三角形)。リクルートされるTnsサブユニットの正確な数は知られていないが、1よりはるかに大きいことに注意されたい。代表的な経路は、I-F型CRISPR-トランスポゾンシステム(例えば、VchINTEGRATE)について示されており、Cas8タンパク質(I-F型では天然のCas8-Cas5融合体)がCas5の別の分子によって結合されるI-B型システムにも適用可能である。V-K型CRISPR-トランスポゾンシステムにおける経路は類似しているが、Rループ形成は、Cas12kとデュアルガイドRNA(または遺伝子操作されたシングルガイドRNA、sgRNA)との結合によって駆動される。
図7Bは、TniQ-CascadeおよびTnsCを含む異なるタンパク質サブユニットのN末端および/またはC末端のうちの1つ以上を、新規ゲノム変動試薬(perturbation reagents)の生成のために、所望のエフェクタードメインに融合され得ることを示す。様々な実施形態では、これらは、転写活性化因子;転写抑制因子;エピゲノム修飾試薬;DNAメチル化または脱アミノ化試薬;蛍光タンパク質;代替スキャフォールディングタンパク質;ヒストン修飾酵素;ヌクレアーゼ酵素;などを含み得る。核局在化シグナル(NLS)もまた、効率的な核輸送を指示するために、エフェクター融合設計のために含まれるが、これらは示されていない。他の実施形態では、Cascade成分は、複合体全体が細胞質で形成された後に核に輸送されるため、全てのタンパク質成分がそれ自身のNLSを含むわけではない。
図7Cは、Cascade複合体、および1つ以上の転写活性化ドメインのCas7のN末端もしくはC末端のいずれか、または両方の末端への融合を中心に構築された転写活性化因子の概略図である。様々な活性化因子構築物の代表的なドメイン概略図を上に示す。Cas7はDNA-結合Cascade複合体中、複数コピーで存在するため(32ヌクレオチドスペーサーでは6コピー)、活性化ドメインは標的部位で高い価数で表示され、強固な転写活性化につながる。これらのCascade活性化因子はTniQを含んでもよく(右下)、あるいはTniQを含まないCas8-Cas7-Cas6タンパク質成分のみを使用してもよい(左下)。核局在化シグナル(NLS)もまた、効率的な核輸送を指示するために、エフェクター融合設計のために含まれるが、これらは示されていない。他の実施形態では、Cascade成分は、複合体全体が細胞質で形成された後に核に輸送されるため、全てのタンパク質成分がそれ自身のNLSを含むわけではない。
図7Dは、活性化ドメインをTnsCのC末端に融合させることによって、AAA+ATPアーゼの周りに構築された転写活性化因子の概略図である。様々な活性化ドメインを異なる実施形態で用いてもよいし、複数のエフェクタードメインを一緒に融合してもよい。TnsCは、TniQ-依存的融合で、標的-結合QCascade複合体を介してDNAにリクルートされ、複数コピーでリクルートされるため、活性化ドメインは標的部位で高い価数で表示され、強固な転写活性化につながる。他の実施形態では、V-K型CRISPR-トランスポゾンシステムからのTnsCを用いて同様のTnsC融合体が構築され、それによって標的DNAはCas12kおよびgRNAによって媒介され、同様のTniQ-依存的TnsCリクルート経路をもたらす。核局在化シグナル(NLS)もまた、効率的な核輸送を指示するために、エフェクター融合設計のために含まれるが、これらは示されていない。
図7Eは、Cas8、Cas7、またはCas6(図示せず)、またはTnsCのC末端(図示)のいずれかに抑制ドメインを融合することによって構築された転写抑制因子の概略図である。抑制ドメインは、KRABドメイン、またはヒストンメチル化酵素などの他のヒストン修飾ドメイン、またはDNAメチル基転位酵素などの他のDNA修飾ドメインであってもよい。QCascadeが結合した標的DNAへのTnsCの多価リクルートは、遺伝子調節の強力な抑制につながる。核局在化シグナル(NLS)もまた、効率的な核輸送を指示するために、エフェクター融合設計のために含まれるが、これらは示されていない。
図7Bは、Cas7(図示せず)またはTnsC(図示)のいずれかを、GFPまたは別の蛍光タンパク質(FP)に融合することによって、高シグナル対ノイズの染色体座イメージングを行うためのQCascadeおよびTnsCの概略図である。Cas7およびTnsCの両方が複数コピーで標的DNAにリクルートされるため、単一のgRNAで複数コピーのFP融合タンパク質がリクルートされ、標的部位での高い蛍光シグナルをもたらす。核局在化シグナル(NLS)もまた、効率的な核輸送を指示するために、エフェクター融合設計用に含まれるが、これらは示されていない。
図7Gは、シチジンデアミナーゼ(Cyt.デアミナーゼ;Cyt.deam.)またはアデニンデアミナーゼ(2xTadA)ドメインのいずれかを、CascadeのCas8またはCas7サブユニットのいずれかに融合することによる塩基編集の構築の概略図である。シチジンデアミナーゼドメインは、これまでに記載されたように、2つのタンデムウラシルグリコシラーゼインヒビタードメインと組み合わされる(Doman, J. L. et al. Nat Biotechnol 38, 620-628 (2020); and references therein)。Cas8またはCas7への融合は、複数の異なる配置で起こり得、塩基編集活性の可変ウィンドウをもたらし、様々な所望の編集結果のために適用され得る。2xTadAエフェクターは、Cas7のN末端またはC末端のいずれかに融合され得る。これらの編集試薬は、QCascade複合体の全ての成分と共に用いてもよいし、Cascade複合体の成分のみを用いてもよい(例えば、TniQを省略する)。核局在化シグナル(NLS)はまた、効率的な核輸送を指示するために、エフェクター融合設計用に含まれるが、これらは示されていない。他の実施形態では、Cascade成分は、複合体全体が細胞質で形成された後に核に輸送されるので、全てのタンパク質成分がそれ自身のNLSを含むわけではない。
図7Hは、TnsCおよびCas7サブユニットの両方へのエフェクタードメインのコンビナトリアル付加によって同時に生成される強力な転写活性化因子の概略図である。TnsCおよびCas7が示されたエフェクタードメインに融合された、4つの実施形態が左側に示されている。この構造は、Cas6、Cas8、TniQ、およびgRNAと組み合わされると、gRNAによって指定された単一の標的部位への複数の異なるエフェクタードメインの標的化されたリクルートをもたらし(右)、高活性の相乗的転写活性化をもたらす。他の実施形態では、N末端の代わりにCas7のC末端へのエフェクター融合を含む、他のエフェクタードメインの組み合わせが試験される。核局在化シグナル(NLS)もまた、効率的な核輸送を指示するために、エフェクター融合設計のために含まれるが、これらは示されていない。他の実施形態では、Cascade成分は、複合体全体が細胞質で形成された後に核に輸送されるので、全てのタンパク質成分がそれ自身のNLSを含むわけではない。
図7Iは、TnsCおよびCas7の両方への複数のエフェクタードメインのコンビナトリアル融合によって生成される強力な転写抑制因子およびエピゲノム編集因子の概略図である。一実施形態では、これらは、CRISPRoff試薬で使用されるKRABおよびDnmt3A/3Lドメインを含む(Nunez, J. K. et al. Cell 184, 2503-2519.e17 (2021))。他の実施形態では、追加のエフェクタードメインが使用される。単一のgRNAによって誘導される、標的部位へのCas7およびTnsCの両方の多価のリクルートは、関連する抑制因子またはエピゲノム修飾ドメインの強力かつ耐久性のあるリクルートをもたらす。核局在化シグナル(NLS)もまた、効率的な核輸送を指示するために、エフェクター融合設計用に含まれるが、これらは示されていない。他の実施形態では、Cascade成分は、複合体全体が細胞質で形成された後に核に輸送されるため、全てのタンパク質成分がそれ自身のNLSを含むわけではない。
図7Jは、TnsCおよびCas7の両方に対する複数のスペクトル的に異なる蛍光タンパク質(FP)のコンビナトリアル融合によって構築された高シグナル対ノイズDNA標識/イメージング試薬の概略図であり;GFPおよびRFP融合体が、提供された例(左および右)に示されている。単一のgRNAが両タンパク質の複数コピーを同じゲノム標的部位に局在化させるため、二色標識は単一色のみのイメージング試薬と比較してより高いシグナル対ノイズをもたらし、標識特異性の内部検証を可能にする。他の実施形態では、FRETペアが使用されるので、タンパク質がエネルギーを伝達し、細胞質および核内の自由に拡散する分子と比較して、標的部位で共局在化したTnsCタンパク質とCas7タンパク質との識別がさらに可能になり、それによってバックグラウンドが減少する。核局在化シグナル(NLS)もまた、効率的な核輸送を指示するために、エフェクター融合設計のために含まれるが、これらは示されていない。他の実施形態では、Cascade成分は、複合体全体が細胞質で形成された後に核に輸送されるため、全てのタンパク質成分がそれ自身のNLSを含むわけではない。
【0043】
図8Aおよび8Bは、改変されたgRNA発現カセットが強力なRNA誘導DNA標的化活性を保持していることを示している。
図8Aは、ヒトU6プロモーターによって制御されるリピート-スペーサー-リピートアレイとしてgRNAをコードする別のプラスミド、およびCRISPRアレイ発現カセットがミニ-トランスポゾンのすぐ下流に配置される改変されたpDonorプラスミド(下)を採用する例示的な初期gRNA発現戦略の概略図(上)である。
図8Bは、改変されたgRNA発現プラスミドを用いたQCascadeおよびTnsC-VP64転写活性化のグラフであり、gRNAはpDonor自体にコードされている。相対的なmCherry MFI(非標的対照に対して正規化)によって測定される活性化のレベルは、初期gRNA発現戦略(
図8A、上)と、gRNAがpDonor上にコードされる改変戦略(
図8A、下)との間でほぼ区別できない。
図8Bの各々のバーの上の数字は、表1に記載された情報に対応する実験識別子を表す。
【0044】
図9A~9Cは、VchINTEGRATEのためのガイドRNAのRNAポリメラーゼIIベースの発現を示す。
図9Aは、gRNAを発現させる異なる方法の概略図である。CRISPRアレイ(リピート-スペーサー-リピート)は、RNA Pol IIIプロモーター(例えば、ヒトU6)上に規範的にコードされるので、新生転写産物は主に核内に留まる。しかし、RNA Pol II転写産物の3’-UTR内にコードされることもあり、MALAT1三重鎖などの機能を利用して、切断後に上流のタンパク質-コード転写産物を安定化させることもできる。切断は、CascadeのCas6リボヌクレアーゼサブユニットによるリピート-スペーサー-リピート処理の際に起こる。
図9Bは、pcDNA3.1-誘導体発現ベクター内で生成され、試験された様々な構築物の概略図である。MALAT1三重鎖およびCRISPRアレイを、VchCas6またはVchCas7のいずれかの3’-UTRに挿入した。
図8Cは、
図9Bに記載の構築物を用いた転写活性化データを示す棒グラフである。これらの結果は、Pol IIにコードされたgRNAが、RNA誘導DNA標的化およびTnsCベースの活性化に対して機能的であり、バックグラウンド(ここでは非標的化gRNA対照として定義される)より上であることを実証している。
図9Cの各々のバーの上の数字は、表1に記載の情報に対応する実験識別子を表す。
【0045】
図10Aは、TnsC-VP64転写活性化の例示的な概略図である。
図10Bは、定量的逆転写PCR(RT-qPCR)を介したTTNの相対的遺伝子発現によって測定される正規化活性化のグラフである。
図10Cは、4つの例示的な個々のcrRNA発現プラスミド、または個々のcrRNAプラスミドと同じ領域を標的とする4つのスペーサー配列を含む未処理のCRISPRアレイを発現する1つのプラスミドの概略図である。
図10Dは、内因性遺伝子TTN、MIAT、ASCL1、およびACTC1を標的とするcrRNA発現プラスミドの概略図である。
図10Eは、3つの追加のゲノム遺伝子座、MIAT、ASCL1、およびACTC1について観察された正規化活性化のグラフである。
【0046】
〔詳細な説明〕
開示されたシステム、キット、および方法は、エフェクター分子(例えば、活性化因子、抑制因子、核酸修飾因子)をDNAにRNA-誘導でリクルートするシステムおよび方法を提供する。
【0047】
本明細書に提供されるのは、誘導-RNA依存的方法において、核酸結合を介してタンパク質活性を媒介する合成エフェクターを提供するシステムおよび方法である。システムのオリゴマー特性は、dCas9のような単一コピーのタンパク質およびシステムで可能となるよりも、より強力でダイナミックな範囲で下流への応用を可能にする。さらに、開示されたシステムの多成分の性質は、相乗的または調整可能な活性のために、複数の異なる型のエフェクタードメインを単一の場所にコンビナトリアルリクルートすることを可能にする。したがって、開示されたシステムは、調整可能で強力なシグナル増幅をもたらすことができる。
【0048】
本セクションおよび本開示全体において使用されているセクション見出しは、単に整理のためのものであり、限定することを意図したものではない。
【0049】
〔定義〕
本明細書で使用される用語「含む(comprise)」、「含む(include)」、「有する(having)」、「有する(has)」、「できる(can)」、「含む(contain)」、およびそれらの変形は、付加的な作用または構造の可能性を排除しない、オープンエンドの移行句、用語、または単語であることが意図される。本明細書で使用される場合には、特定の配列または特定の配列番号を含むことは、通常、当該配列の少なくとも1つのコピーが、引用されるペプチドまたはポリヌクレオチド中に存在することを意味する。しかしながら、2つ以上のコピーもまた企図される。単数形「a」、「and」、および「the」は、文脈上明らかに複数形ではないと指示されない限り、複数形の参照を含む。本開示はまた、明示的に規定されているか否かにかかわらず、本明細書に提示された実施形態または要素「を含む(comprising)」他の実施形態、「からなる(consisting of)」他の実施形態、および「から本質的になる(consisting essentially of)」他の実施形態も企図する。
【0050】
本明細書における数値範囲の記載については、その間に同程度の精度で介在する各々の数値が明示的に企図される。例えば、6~9の範囲については、6および9に加えて7および8という数字が想定され、6.0~7.0の範囲については、6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9、および7.0という数値が明示的に企図される。
【0051】
本明細書において特に定義されない限り、本開示に関連して使用される科学用語および技術用語は、当業者に一般的に理解される意味を有するものとする。例えば、本明細書に記載される細胞および組織培養、分子生物学、微生物学、遺伝学、ならびにタンパク質および核酸の化学、ならびにハイブリダイゼーションに関連して使用されるいかなる用語体系、ならびにそれらの技術は、当技術分野において周知であり、一般的に使用されるものである。用語の意味および範囲は、明確であるべきであり;しかしながら、潜在的な曖昧さがある場合には、本明細書で提供される定義が、いかなる辞書または外からの定義よりも優先される。さらに、文脈上別段の定めがない限り、単数形の用語は複数形を含み、複数形の用語は単数形を含むものとする。
【0052】
本明細書中で使用される場合には、「核酸」または「核酸配列」は、ピリミジンおよび/またはプリン塩基、好ましくはシトシン、チミンおよびウラシル、ならびにアデニンおよびグアニンのポリマーまたはオリゴマーをそれぞれ指す(Albert L. Lehninger, Principles of Biochemistry, at 793-800 (Worth Pub. 1982)を参照されたい)。本技術は、任意のデオキシリボヌクレオチド、リボヌクレオチド、またはペプチド核酸成分、およびこれらの塩基のメチル化、ヒドロキシメチル化、またはグリコシル化形態などの任意の化学的バリアントを企図する。ポリマーまたはオリゴマーは、組成が不均一であっても均一であってもよく、天然に生じる供給源から単離されてもよく、または人工的もしくは合成的に調製されてもよい。さらに、核酸は、DNAもしくはRNA、またはそれらの混合物であってよく、ホモ二本鎖、ヘテロ二本鎖、およびハイブリッド状態を含む、一本鎖または二本鎖の形態で永続的または移行的に存在してよい。いくつかの実施形態では、核酸または核酸配列は、例えば、DNA/RNAらせん、ペプチド核酸(PNA)、モルホリノ核酸(例えば、Braasch and Corey, Biochemistry, 41(14): 4503-4510 (2002)および米国特許第5,034,506号を参照されたい)、ロック核酸(LNA;Wahlestedt et al., Proc. Natl. Acad. Sci. U.S.A., 97: 5633-5638 (2000)を参照されたい)、シクロヘキセニル核酸(Wang, J. Am. Chem. Soc., 122: 8595-8602 (2000)を参照されたい)、および/またはリボザイムなどの他の種類の核酸構造を含んでいてもよい。それゆえ、用語「核酸」または「核酸配列」はまた、非天然ヌクレオチド、修飾ヌクレオチド、および/または天然ヌクレオチドと同じ機能を示し得る非ヌクレオチド構築ブロック(例えば、「ヌクレオチドアナログ」)を含む鎖を包含し得;さらに、本明細書で使用される用語「核酸配列」は、オリゴヌクレオチド、ヌクレオチドもしくはポリヌクレオチド、およびそれらのフラグメントもしくは部分、ならびにゲノム起源もしくは合成起源のDNAもしくはRNA(これらは一本鎖または二本鎖であり得、そしてセンス鎖またはアンチセンス鎖を表し得る)を指す。用語「核酸」、「ポリヌクレオチド」、「ヌクレオチド配列」、および「オリゴヌクレオチド」は、互換的に使用される。それらは、デオキシリボヌクレオチドもしくはリボヌクレオチド、またはそれらの類似体である、任意の長さのヌクレオチドの重合体形態を指す。
【0053】
本明細書に記載される核酸またはアミノ酸配列の「同一性」は、目的の核酸またはアミノ酸配列を参照核酸またはアミノ酸配列と比較することによって決定することができる。同一性パーセントは、目的の配列と参照配列の間で同じ(例えば、同一である)ヌクレオチドまたはアミノ酸残基を、最も長い配列の長さ(例えば、目的の配列または参照配列のいずれか長い方の長さ)で割った値である。最適なアラインメントを求め、2つ以上の配列間の同一性を計算するための多くの数学的アルゴリズムが知られており、多くの利用可能なソフトウェアプログラムに組込まれている。このようなプログラムの例としては、CLUSTAL-W、T-Coffee、およびALIGN(例えば、核酸配列およびアミノ酸配列のアラインメント用)、BLASTプログラム(例えば、BLAST 2.1、BL2SEQ、およびそれ以降のバージョン)、およびFASTAプログラム(例えば、FASTA3x、FAS(商標)、およびSSEARCH)(配列アラインメントおよび配列類似性検索用)が挙げられる。配列アライメントアルゴリズムもまた、例えば、Altschul et al., J. Molecular Biol., 215(3): 403-410 (1990)、Beigert et al., Proc. Natl. Acad. Sci. USA, 106(10): 3770-3775 (2009)、Durbin et al., eds., Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids, Cambridge University Press, Cambridge, UK (2009), Soding, Bioinformatics, 21(7): 951-960 (2005)、Altschul et al., Nucleic Acids Res., 25(17): 3389-3402 (1997)、およびGusfield, Algorithms on Strings, Trees and Sequences, Cambridge University Press, Cambridge UK (1997)において開示されている。
【0054】
本明細書で使用される場合には、用語「ハイブリダイゼーション」は、相補的核酸の対合に関連して用いられる。ハイブリダイゼーションおよびハイブリダイゼーションの強さ(すなわち、核酸間の会合の強さ)は、核酸間の相補性の程度、関与する条件のストリンジェンシー、および形成されるハイブリッドのTmなどの因子によって影響される。「ハイブリダイゼーション」方法は、ある核酸を、別の相補的な核酸(例えば、相補的ヌクレオチド配列を有する核酸)へアニールすることを含む。相補的配列を含む核酸の2つのポリマーが互いを見出し、そして塩基対合相互作用を介して「アニール」または「ハイブリダイズ」する能力は、よく認識された現象である。Marmur and Lane, Proc. Natl. Acad. Sci. USA, 46: 453 (1960)およびDoty et al., Proc. Natl. Acad. Sci. USA, 46: 461 (1960)による「ハイブリダイゼーション」プロセスの最初の観察に続き、このプロセスは、現代生物学の必須ツールに改良されている。例えば、ハイブリダイゼーションの条件および洗浄の条件は、現在ではよく知られており、Sambrook et al., supraにおいて説明されている。温度条件およびイオン強度の条件は、ハイブリダイゼーションの「ストリンジェンシー」を決定する。
【0055】
本明細書で使用される場合には、「二本鎖核酸」は、核酸の一部、より長い核酸の領域、または核酸全体であってもよい。「二本鎖核酸」は限定されないが、例えば、二本鎖DNA、二本鎖RNA、二本鎖DNA/RNAハイブリッドなどであり得る。二次構造(例えば、塩基対二次構造)および/または高次構造(例えば、ステム-ループ構造)を有する一本鎖核酸もまた、「二本鎖核酸」とみなされ得る。例えば、三重鎖構造は「二本鎖」とみなされる。いくつかの実施形態では、任意の塩基対核酸は、「二本鎖核酸」である。
【0056】
用語「遺伝子」は、非コード機能を有するRNA(例えば、リボソームRNAもしくはトランスファーRNA)、ポリペプチド、または前述のいずれかの前駆体の産生に必要な制御配列およびコード配列を含むDNA配列を指す。RNAまたはポリペプチドは、所望の活性または機能が保持される限り、全長のコード配列またはコード配列の任意の部分によってコードされ得る。したがって、「遺伝子」とは、生物において機能的役割を果たすポリペプチドまたはRNA鎖をコードする、DNAもしくはRNA、またはその一部を指す。本開示の目的のために、遺伝子は、そのような調節配列がコード配列および/または転写配列に隣接しているか否かにかかわらず、遺伝子産物の産生を調節する領域を含むと考えられ得る。したがって、遺伝子は、プロモーター配列、ターミネーター、翻訳調節配列(リボソーム結合部位および内部リボソーム進入部位など)、エンハンサー、サイレンサー、インシュレーター、境界要素、複製起点、マトリックス付着部位、ならびに遺伝子座制御領域を含むが、必ずしもこれらに限定されない。
【0057】
用語「非天然起源の」、「遺伝子操作された」、および「合成の」は、互換的に使用され、人の手の関与を示す。核酸分子またはポリペプチドに言及する場合には、これらの用語は、核酸分子またはポリペプチドが、それらが天然に自然界に関連し、自然界に見出されるような少なくとも1つの他の成分を、少なくとも実質的に含まないことを意味する。
【0058】
「ベクター」または「発現ベクター」とは、プラスミド、ファージ、ウイルス、またはコスミドなどのレプリコンであり、これに、別のDNAセグメント(例えば「インサート」)を結合させ、または組込ませて、細胞内で結合セグメントを複製することができる。
【0059】
外来性DNA(例えば、組換え発現ベクター)によって、細胞が「遺伝子組換え」、「形質転換」、「遺伝子導入」されたのは、そのようなDNAが細胞内に導入された場合である。外来性DNAの存在は、永続的または一過性の遺伝的変化をもたらす。形質転換DNAは、細胞のゲノムに組込まれてもよいし(共有結合)、されなくてもよい。例えば、形質転換DNAは、プラスミドなどのエピソーム要素上に維持されてもよい。真核細胞に関して、安定に形質転換された細胞は、形質転換DNAが染色体に組込まれ、結果としてそれが染色体複製を通じて娘細胞により受け継がれている。この安定性は、真核細胞が形質転換DNAを含む娘細胞の集団を含む細胞株またはクローンを樹立する能力によって示される。「クローン」とは、有糸分裂によって単一の細胞または共通の祖先から派生した細胞の集団のことである。「細胞株」とは、in vitroで何世代にもわたって安定した増殖が可能な初代細胞のクローンである。
【0060】
「対象」または「患者」は、ヒトまたは非ヒトであってよく、例えば、本明細書に記載されているようなマウスモデルなどの、研究目的の「モデル系」として使用される動物系統または種が含まれる。同様に、患者には、成人または少年(例えば、小児)のいずれかが含まれ得る。さらに、患者は、本明細書で企図される組成物の投与から利益を得る可能性のある任意の生物、好ましくは哺乳動物(例えば、ヒトまたは非ヒト)を意味し得る。哺乳動物の例としては、ヒト、チンパンジーなどの非ヒト霊長類、ならびに他の類人猿およびサル類;ウシ、ウマ、ヒツジ、ヤギ、ブタなどの家畜;ウサギ、イヌ、およびネコなどの飼育動物;ラット、マウス、およびモルモットなどのげっ歯類を含む実験動物などの哺乳動物クラスの任意のメンバーが挙げられるが、これらに限定されない。非哺乳動物の例としては、鳥類、魚類などが挙げられるが、これらに限定されない。本明細書に提供される方法および組成物の一実施形態では、哺乳動物はヒトである。
【0061】
本明細書で使用される場合には、用語「接触(contacting)」は、接触させる(bring in contact)、接触させる(put in contact)、接触させる(be in contact)、接触させる(come into contact)ことを指す。本明細書で使用される場合には、用語「接触(contact)」は、触れている状態もしくは条件、または即時もしくは局所的に近接の状態または条件を指す。臓器、組織、細胞、または腫瘍など(これらに限定されない)の標的目的地への組成物の接触は、当業者に公知の任意の投与手段によって起こり得る。
【0062】
本明細書で使用される場合には、用語「提供する」、「投与する」、および「導入する」は、本明細書で互換的に使用され、所望の部位へのシステムの少なくとも部分的な局在化をもたらす方法または経路による、細胞、生物、または対象への本開示のシステムの配置を指す。システムは、細胞、生物、または対象の所望の部位への送達をもたらす任意の適切な経路によって投与され得る。
【0063】
好ましい方法および材料を以下に記載するが、本明細書に記載したものと類似または同等の方法および材料を、本開示の実施または試験に使用することができる。本明細書で言及される全ての刊行物、特許出願、特許および他の参考文献は、参照によりその全体が組込まれる。本明細書に開示される材料、方法、および実施例は、例示に過ぎず、限定を意図するものではない。
【0064】
〔DNA組込みのためのCRISPR-Casシステム〕
細菌および古細菌において、CRISPR/Casシステムは、侵入してきたファージのフラグメント、ウイルスのフラグメント、およびプラスミドDNAのフラグメントをCRISPR遺伝子座に組込み、対応するCRISPR RNA(「crRNA」)を用いて相同配列の分解を誘導することにより、免疫を提供する。CRISPR遺伝子座の転写により「pre-crRNA」が生成され、当該pre-crRNAは、スペーサーに相補的なdsDNA配列を切断するエフェクターヌクレアーゼ複合体を誘導するスペーサーリピートフラグメントを含む産出されたcrRNAに加工される。いくつかの異なる型のCRISPRシステム(例えば、I型、II型、またはIII型)が知られており、Casタンパク質の型、および侵入したDNA中のプロトスペーサーを選択するためのプロトスペーサー隣接モチーフ(PAM)の使用に基づいて分類されている。
【0065】
RNA誘導標的化は通常、結合した基質の核内切断につながるが、最近の研究では、CRISPRタンパク質-RNAエフェクター複合体が自然に別の機能に再利用される、非規範的な経路の範囲が明らかになりつつある。
【0066】
本明細書において開示されるのは、以下を含む、標的核酸配列にエフェクタードメインをリクルートするためのシステムまたはキットである:遺伝子操作された集合等間隔短回文リピート(CRISPR)-CRISPR関連(Cas)システム、または遺伝子操作されたCRISPR-Casシステムをコードする1つ以上の核酸、ここで、CRISPR-Casシステムは、以下の少なくとも1つまたは両方を含む:a)少なくとも1つのCasタンパク質;およびb)標的核酸配列の少なくとも一部に相補的なガイドRNA(gRNA)、ここで、少なくとも1つのCasタンパク質のうちの1つ以上が少なくとも1つのエフェクタードメインを含む。いくつかの実施形態では、標的核酸は、目的の遺伝子のプロモーター領域を含む。いくつかの実施形態では、標的核酸は、上流活性化因子配列を含む。いくつかの実施形態では、目的の遺伝子は、細胞内の染色体上に位置する。
【0067】
また、本明細書において開示されるのは、以下を含む、標的核酸配列にエフェクタードメインをリクルートするためのシステムまたはキットである:遺伝子操作された集合等間隔短回文リピート(CRISPR)-CRISPR関連(Cas)システム、または遺伝子操作されたCRISPR-Casシステムをコードする1つ以上の核酸、ここで、CRISPR-Casシステムは、以下の少なくとも1つまたは両方を含む:a)少なくとも1つのCasタンパク質;b)少なくとも1つのトランスポゾン関連タンパク質;およびc)標的核酸配列の少なくとも一部に相補的なガイドRNA(gRNA)、ここで、少なくとも1つのCasタンパク質および少なくとも1つのトランスポゾン関連タンパク質のうちの1つ以上が、少なくとも1つのエフェクタードメインを含む。
【0068】
いくつかの実施形態では、少なくとも1つのCasタンパク質のうちの1つ以上は、gRNAとのリボ核タンパク質複合体の一部である。いくつかの実施形態では、リボ核タンパク質複合体は、少なくとも1つのトランスポゾン関連タンパク質のうちの1つ以上を含む。
【0069】
いくつかの実施形態では、システムは、2つ以上の遺伝子操作されたCRISPR-Casシステムを含む。直交システム対は、異なる標的核酸への複数の異なるエフェクターのタンデムリクルートを可能にする。例えば、1つ、2つ、3つ、4つ、5つ、またはそれ以上の直交CRISPR-Casシステムが、様々な標的核酸に複数のエフェクターを送達するために使用され得る。
【0070】
CRISPR-Casシステムは、コレラ菌(Vibrio cholerae)、フォトバクテリウム・イリオピスカリウム(Photobacterium iliopiscarium)、腸炎ビブリオ(Vibrio parahaemolyticus)、シュードアルテロモナス属(Pseudoalteromonas sp.)、シュードアルテロモナス・ルテニカ(Pseudoalteromonas ruthenica)、フォトバクテリウム・ガンフウェンセ(Photobacterium ganghwense)、シェワネラ属(Shewanella sp.)、ビブリオ・ジアゾトロフィクス(Vibrio diazotrophicus)、ビブリオ属16(Vibrio sp.16)、ビブリオ属F12(Vibrio sp.F12)、ビブリオ・スプレンディダス(Vibrio splendidus)、アリイビブリオ・ウォダニス(Aliivibrio wodanis)、アリイビブリオ属(Aliivibrio sp.)、エンドゾイコモナス・アシディコラ(Endozoicomonas ascidiicola)、パラシェワネラ・スポンジアエ(Parashewanella spongiae)またはスキトネマ・ホフマニー(Scytonema hofmannii)に由来し得る。
【0071】
また、本明細書に記載のシステムを含む細胞も開示する。いくつかの実施形態では、細胞は原核細胞である。いくつかの実施形態では、細胞は真核細胞である。いくつかの実施形態では、細胞は哺乳動物細胞(例えば、ヒト細胞)である。
【0072】
〔a.CRISPR-Casシステム〕
CRISPR-Casシステムは、現在、CRISPRアレイに付随するシグネチャー遺伝子およびアクセサリー遺伝子によって、2つのクラス(1-2)、6つの型(I-VI)、および数十の亜類型に分類されている。遺伝子操作されたCRISPR-Casシステムは、クラス1CRISPR-Casシステムまたはクラス2CRISPR-Casシステムに由来していてもよい。本システムは、I型CRISPR-Casシステム(亜類I-B型、I-D型、I-F型(I-F型変異体を含む)など)に由来していてもよい。本システムは、V型CRISPR-Casシステムに由来していてもよい。
【0073】
I型CRISPR-Casシステムは、Cascadeと呼ばれるマルチサブユニットタンパク質-RNA複合体をコードし、免疫応答の際に二本鎖DNAを標的とするcrRNA(またはガイドRNA)を利用する。Cascade自体はヌクレアーゼ活性を持たず、標的DNAの分解は代わりにCas3として知られるトランス作用型ヌクレアーゼによって媒介される。I-A型およびI-D型のシステムでは、Cas3の活性はCas3’(ヘリカーゼ)およびCas3’’(ヌクレアーゼ)と呼ばれる別々のタンパク質によって行われる。I-D型システムはまた、Cas8の代わりにCas10dを含む。
【0074】
いくつかの実施形態では、遺伝子操作されたCRISPR-Casシステムは、Cas5、Cas6、Cas7、Cas8、またはそれらの任意の組み合わせを含む。いくつかの実施形態では、遺伝子操作されたCRISPR-Casシステムは、Cas8-Cas5融合タンパク質を含む。いくつかの実施形態では、遺伝子操作されたCRISPR-Casシステムは、Cas5、Cas6、Cas7、およびCas8を含む。いくつかの実施形態では、遺伝子操作されたCRISPR-Casシステムは、Cas5、Cas6、Cas7、およびCas10dを含む。
【0075】
V型システムは、gRNAでプログラムされた単一のタンパク質エフェクター複合体を特徴とする、クラス2CRISPR-Casシステムに属する。トランスポゾン-関連V型CRISPR-Casシステムは、以下に由来してもよい:Anabaena variabilis ATCC 29413 (またはTrichormus variabilis ATCC 29413 (GenBank CP000117.1)を参照のこと), Cyanobacterium aponinum IPPAS B-1202, Filamentous cyanobacterium CCP2, Nostoc punctiforme PCC 73102,およびScytonema hofmannii PCC 7110。
【0076】
いくつかの実施形態では、遺伝子操作されたCRISPR-Casシステムは、以前はC2c5として知られていたCas12kを含む。
【0077】
本発明のシステムは、少なくとも1つのトランスポゾン関連タンパク質(例えば、トランスポザーゼまたはトランスポゾンの他の成分)、またはそれをコードする核酸を含み得る。トランスポゾン関連タンパク質は、標的核酸の認識を促進し得る。
【0078】
いくつかの実施形態では、トランスポゾン関連タンパク質は、Tn7またはTn7様トランスポゾンに由来する。Tn7およびTn7様トランスポゾンは、特徴的なDDE様トランスポザーゼ遺伝子であるtnsB(tniAとも呼ばれる)の存在、AAA+ATPアーゼファミリー内のタンパク質をコードする遺伝子であるtnsC(tniBとも呼ばれる)の存在、組込み部位を定義する1つ以上の標的因子(tniQファミリーのタンパク質(tnsDとも称される)が含まれ得るが、場合によっては他の異なる標的因子が含まれる)、およびTnsBトランスポザーゼタンパク質によって特異的に認識されると考えられる複数の結合部位を典型的に含むインバーテッドリピートトランスポゾン末端に基づいて分類され得る。Tn7では、標的因子、すなわち「標的セレクタ」は、遺伝子tnsDおよび遺伝子tnsEを含む。生化学的研究および遺伝学的研究に基づいて、TnsDがglmS遺伝子の3’末端に保存された結合部位に結合し、下流への組込みを指示するのに対し、TnsEはラギング鎖の複製フォークに結合し、主に複製/移動プラスミドへの配列非特異的組込みを指示することが知られている。
【0079】
このトランスポゾンのファミリーの中で最もよく研究されているのがTn7であり、それゆえ、より広いトランスポゾンのファミリーをTn7様と呼ぶことがある。用語「Tn7様」は、Tn7と関連するトランスポゾンとの間に特別な進化的関係があることを意味するものではなく;場合によっては、Tn7様トランスポゾンは、系統樹においてより根本に位置し、したがってTn7はこの関連するTn7様トランスポゾンから進化した、または派生したと考えることができる。
【0080】
Tn7がtnsD標的セレクタおよびtnsE標的セレクタを含むのに対し、関連するトランスポゾンは標的化のための他の遺伝子を含む。例えば、Tn5090/Tn5053は、tniQファミリーのメンバー(大腸菌tnsDのホモログ)と、レゾルバーゼ遺伝子tniRとをコードし;Tn6230は、タンパク質TnsFをコードし;Tn6022は、2つの未特定のオープンリーディングフレームorf2およびorf3をコードし;Tn6677および関連するトランスポゾンは、RNA誘導動員のためにTniQと協働するバリアントI-F型CRISPR-CasシステムおよびI-B型CRISPR-Casシステムをコードし;他のトランスポゾンは、ランダムおよびRNA誘導動員のためにTniQと協働するV-U5型CRISPR-Casシステムをコードする。前述のいずれのトランスポゾンシステムも、本明細書に記載のシステムおよび方法に適合する。
【0081】
いくつかの実施形態では、少なくとも1つのトランスポゾン関連タンパク質は、TniQを含む。いくつかの実施形態では、少なくとも1つのトランスポゾン関連タンパク質は、TnsCをさらに含む。
【0082】
いくつかの実施形態では、少なくとも1つのトランスポゾン関連タンパク質は、TniAおよびTniBとしても知られているTnsAおよびTnsBをさらに含む。いくつかの実施形態では、少なくとも1つのトランスポゾンタンパク質は、TnsA-TnsB融合タンパク質を含む。TnsAおよびTnsBは、任意の方向で融合され得る:それぞれ、N末端からC末端;C末端からN末端;N末端からN末端;またはC末端からC末端である。好ましくは、TnsAのC末端は、TnsBのN末端に融合している。
【0083】
いくつかの実施形態では、TnsA-TnsB融合体は、より大きな物理的分離を提供し、融合部分間でより多くの空間的移動性を可能にするために、様々な長さのアミノ酸リンカーペプチドを用いて融合され得る。リンカーは任意のアミノ酸を含み得、任意の長さであり得る。リンカーは約50(例えば、40、30、20、10、または5)アミノ酸残基未満であり得る。
【0084】
いくつかの実施形態では、リンカーは、TnsAおよびTnsBが互いに対して方法の自由を有することができるようなフレキシブルリンカーである。例えば、フレキシブルリンカーは、比較的小さな側鎖を有するアミノ酸を含み、親水性であり得る。限定はされないが、フレキシブルリンカーは、グリシン残基および/またはセリン残基のストレッチを含み得る。いくつかの実施形態では、前記リンカーは、少なくとも1つのグリシンリッチ領域を含む。例えば、グリシンリッチ領域は、[GS]n(nは1~10の整数)を含む配列を含み得る。
【0085】
いくつかの実施形態では、リンカーは、核局在化配列(NLS)をさらに含む。NLSは、追加のアミノ酸によって挟まれるように、リンカー配列内に埋め込まれていてもよい。いくつかの実施形態では、NLSは、フレキシブルリンカーの少なくとも一部によって両端を挟まれている。いくつかの実施形態では、NLSはリンカーのグリシンリッチ領域によって両端を挟まれている。開示されたシステムと共に使用するのに適した核局在化配列は、以下にさらに記載され、TnsA-TnsB融合タンパク質と共に使用するのに適用可能である。いくつかの実施形態では、リンカーは、GCGCGKRTADGSEFESPKKKRKVGSGSGG(配列番号1)のアミノ酸配列を含む。
【0086】
特定の実施形態では、TnsA-TnsB融合タンパク質は、配列番号9~14のものと少なくとも70%(少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%)の類似性を有するアミノ酸配列を含む。例えば、TnsA-TnsB融合タンパク質は、配列番号9~14のものと比較して1つ以上(例えば、1、2、3、4、5、6、7、8、9、10、12、15、18、または20)の置換を有するアミノ酸配列を含み得る。
【0087】
いくつかの実施形態では、少なくとも1つのCasタンパク質および少なくとも1つのトランスポゾン関連タンパク質の任意の組み合わせは、単一の融合タンパク質として発現され得る。例えば、いくつかの実施形態では、少なくとも1つのCasタンパク質の各々は、単一の融合タンパク質の一部である。いくつかの実施形態では、少なくとも1つのCasタンパク質および1つ以上の少なくとも1つのトランスポゾン関連タンパク質の各々は、成分が単一のメガペプチドとして発現される単一の融合タンパク質の一部である。
【0088】
例示的なCasタンパク質およびトランスポゾン関連タンパク質の配列は、国際特許公開WO2020181264および国際特許出願PCT/US22/32541に見出すことができ、参照によって各々本明細書に組込まれる。
【0089】
しかし、本発明は、開示または参照された例示的配列に限定されるものではない。実際、遺伝子配列は異なる株間で異なることがあり、この自然な対立遺伝子変異の範囲も本発明の範囲に含まれる。
【0090】
他の実施形態において、本明細書中に記載される、または参考として援用されるタンパク質のいずれかは、そのタンパク質の野生型バージョンに対応する、または実質的に対応する配列を含み得る。例えば、配列は、容易なクローニングのためになされた変更または既知の制限部位の除去を除いて、野生型タンパク質配列に実質的に対応し得る。したがって、本明細書で予測される核酸配列と比較して、潜在的な代替開始コドンからのタンパク質産物は除外されない。
【0091】
本明細書中に記載される、または参考として援用されるタンパク質のいずれもが、引用された配列と比較して、1つ以上のアミノ酸置換を含み得る。アミノ酸の「置換え(replacement)」または「置換(substitution)」は、ポリペプチド配列内の所定の位置または残基における1つのアミノ酸の、同じ位置または残基における別のアミノ酸による置換えを指す。アミノ酸は、「芳香族」または「脂肪族」に広く分類される。芳香族アミノ酸は芳香環を含む。「芳香族」アミノ酸の例としては、ヒスチジン(HまたはHis)、フェニルアラニン(FまたはPhe)、チロシン(YまたはTyr)、およびトリプトファン(WまたはTrp)が挙げられる。非芳香族アミノ酸は、「脂肪族」として広く分類される。「脂肪族」アミノ酸の例としては、グリシン(GまたはGly)、アラニン(AまたはAla)、バリン(VまたはVal)、ロイシン(LまたはLeu)、イソロイシン(IまたはHe)、メチオニン(MまたはMet)、セリン(SまたはSer)、スレオニン(TまたはThr)、システイン(CまたはCys)、プロリン(PまたはPro)、グルタミン酸(EまたはGlu)、アスパラギン酸(AまたはAsp)、アスパラギン(NまたはAsn)、グルタミン(QまたはGin)、リジン(KまたはLys)、およびアルギニン(RまたはArg)が挙げられる。
【0092】
アミノ酸の置換え(replacement)または置換(substitution)は、保存的、半保存的、または非保存的であり得る。用語「保存的アミノ酸置換」または「保存的変異」とは、あるアミノ酸が、共通の性質を持つ別のアミノ酸によって置換えられることを指す。個々のアミノ酸間に共通する性質を定義する機能的な方法は、相同な生物の対応するタンパク質間のアミノ酸変化の正規化された頻度を分析することである(Schulz and Schirmer, Principles of Protein Structure, Springer-Verlag, New York (1979))。このような分析によると、アミノ酸のグループは、グループ内のアミノ酸が互いに優先的に交換され、したがって、タンパク質構造全体への影響において互いに最も似ているところに定義することができる(前述のSchulz and Schirmer)。保存的アミノ酸置換の例としては、前述のサブグループ内のアミノ酸の置換が挙げられ、例えば、正電荷が維持されるようなリジンからアルギニンへの置換およびその逆、負電荷が維持されるようなグルタミン酸からアスパラギン酸への置換およびその逆、遊離-OHが維持されるようなセリンからスレオニンへの置換、遊離-NH2が維持されるようなグルタミンからアスパラギンへの置換が挙げられる。「半保存的変異」には、前述の同じグループ内ではあるが、同じサブグループ内ではないアミノ酸のアミノ酸置換が含まれる。例えば、アスパラギン酸のアスパラギンへの置換、またはアスパラギンのリジンへの置換は、同じグループ内だが異なるサブグループのアミノ酸を含む。「非保存的変異」は、例えば、リジンからトリプトファン、またはフェニルアラニンからセリンなど、異なるグループ間のアミノ酸置換を含む。
【0093】
システムの成分は、様々な比率でシステム中に存在し得る。いくつかの実施形態では、タンパク質成分またはそれをコードする核酸の各々は、1:1の比率で提供される。例えば、各タンパク質成分が単一の核酸上にコードされる場合には、単一の核酸は、各タンパク質成分についての単一のコード配列を含む。
【0094】
いくつかの実施形態では、タンパク質成分のいずれか1つは、他のタンパク質成分よりも大量に提供され得る。特定の実施形態では、Cas7またはCas7をコードする核酸は、残りのタンパク質成分またはそれをコードする核酸と比較して、より大量に提供される。例えば、Cas7をコードする核酸の複数コピーが、他の成分(例えば、Cas6、Cas5、Cas8、TniQまたはTnsC)のいずれかのコピーごとに提供され得る。いくつかの実施形態では、Cas7は、他の成分よりも高い存在量または用量で本明細書のシステムおよび方法において提供され得るように、他の成分のいずれかとは別の核酸上にコードされる。同様に、より高濃度のCas7タンパク質は、他のタンパク質と比較して、システムおよび方法において提供され得る。いくつかの実施形態では、Cas6もしくはCas8、またはそれらをコードする核酸の1コピーごとに、Cas7またはCas7をコードする核酸の2コピー以上がシステムに含まれる。いくつかの実施形態では、Cas6もしくはCas8またはそれらをコードする核酸の1コピーごとに、Cas7またはCas7をコードする核酸の5~10コピーがシステムに含まれる。
【0095】
〔a.エフェクタードメイン〕
本明細書に開示されるシステムにおいて、少なくとも1つのCasタンパク質、およびシステムが少なくとも1つのトランスポゾン関連タンパク質を含む場合には、少なくとも1つのトランスポゾン関連タンパク質のうちの1つ以上は、少なくとも1つのエフェクタードメインを含み得る。少なくとも1つのエフェクタードメインは、N末端、C末端、内部、またはそれらの組み合わせにおいて、少なくとも1つのCasタンパク質および少なくとも1つのトランスポゾン関連タンパク質のうちの1つ以上に付加され得る。エフェクタードメインは、少なくとも1つのCasタンパク質および少なくとも1つのトランスポゾン関連タンパク質に対して任意の向きで融合され得る。
【0096】
いくつかの実施形態では、少なくとも1つのCasタンパク質および少なくとも1つのトランスポゾン関連タンパク質のうちの1つ以上は、2つ以上のエフェクタードメインを含み得る。エフェクタードメインは、少なくとも1つのCasタンパク質および少なくとも1つのトランスポゾン関連タンパク質に、タンデムまたは個別に、例えばN末端およびC末端で融合され得る。
【0097】
エフェクタードメインは、標的核酸を修飾、調節、またはタグ付けできるタンパク質またはそのフラグメントを含む。エフェクタードメインは、ヌクレアーゼ機能、リコンビナーゼ機能、エピジェネティック修飾機能、トランスポザーゼ機能、インテグラーゼ機能、レゾルバーゼ機能、インベルターゼ機能、プロテアーゼ機能、DNAメチル基転位酵素機能、DNA脱メチル化酵素機能、ヒストンアセチル化酵素機能、ヒストン脱アセチル化酵素機能、転写抑制因子機能、転写活性化因子機能、DNA結合タンパク質機能、転写因子リクルータータンパク質機能、核局在化シグナル機能、DNA編集機能(例えば、デアミナーゼ)またはそれらの任意の組み合わせを含むが、これらに限定されない多くの機能性を含み得る。例えば、いくつかのエフェクタードメインは、基礎転写機構および一般的な共活性化因子と相互作用する能力、協調的結合を可能にするために他の転写因子と相互作用する能力、および/またはヒストンおよびクロマチン修飾酵素を直接的または間接的にリクルートする能力を介して、転写調節において機能する。いくつかの実施形態では、エフェクタードメインの機能性に必要な任意の付加的なドメインまたはタンパク質は、少なくとも1つのCasタンパク質および少なくとも1つのトランスポゾン関連タンパク質のうちの1つ以上との融合体として、または別個に提供され得る。
【0098】
いくつかの実施形態では、本明細書に記載のシステムは、転写活性または翻訳活性などの遺伝子調節活性を調節するために使用される。例えば、少なくとも1つのエフェクタードメインは、コード領域の上流および下流の転写に影響を及ぼし得る活性化因子および/または抑制因子の活性を含み得、遺伝子発現を活性化または抑制するために使用され得る。いくつかの実施形態では、少なくとも1つのエフェクタードメインは、転写因子(活性化因子、抑制因子、共活性化因子、共抑制因子)、サイレンサー、および/またはクロマチン関連タンパク質およびそれらの修飾因子(例えば、メチル化酵素、脱メチル化酵素、アセチル化酵素および脱アセチル化酵素)からのドメインを含み得る。
【0099】
したがって、いくつかの実施形態では、転写活性化因子エフェクタードメインを有する本明細書に開示されるようなシステムは、遺伝子発現を直接増加させるために使用され得る。いくつかの実施形態では、転写タンパク質リクルートドメイン、またはその活性フラグメントを含む本明細書に開示されるようなシステムは、転写活性化因子または抑制因子を特定の核酸配列にリクルートして、標的化された方法で遺伝子発現を調節するために活性化因子および抑制因子を局在化させるために使用され得る。
【0100】
いくつかの実施形態では、少なくとも1つのエフェクタードメインは、転写抑制因子機能を含む。転写抑制因子は、その標的部位に近い遺伝子の転写を部分的または完全に阻止する。例示的な転写抑制因子は、KRAB-ドメイン含有タンパク質、SID、およびSp1を含むが、これらに限定されない。
【0101】
いくつかの実施形態では、少なくとも1つのエフェクタードメインは、転写活性化因子機能を含む。転写活性化因子は、一般に、プロモーターDNA上の特定の部位に結合し、他のタンパク質との相互作用を通じて特定の遺伝子の転写の増加をもたらす、タンパク質、またはそのドメインとして定義され得る。例示的な転写活性化因子は、VP64、p65、p53、c-Myb、GATA-1、EKLF、MyoD、E2F、dTCF、Tat、HSF1、RTAおよびSET7/9を含むが、これらに限定されない。
【0102】
いくつかの実施形態では、少なくとも1つのエフェクタードメインは、DNAメチル基転位酵素またはDNAメチル化酵素機能を含む。DNAメチル基転位酵素(DNMT)は、異なる異性体(例えば、DNMT1、DNMT3A、およびDNMT3B)からなるDNA修飾タンパク質のファミリーである。他の例示的なDNAメチル基転位酵素は、SssIメチル化酵素、AluIメチル化酵素、HaeIIIメチル化酵素、HhaIメチル化酵素、およびHpaIIメチル化酵素を含む。これらの酵素の主な作用メカニズムは、グアニン残基に隣接するシトシン残基(5mc)の5番目の炭素にメチル基を付加することである。
【0103】
いくつかの実施形態では、少なくとも1つのエフェクタードメインは、DNA脱メチル化酵素を含む。DNA脱メチル化は、少なくとも3つの酵素ファミリーによって媒介され得る:(i)5mCの5hmCへの変換を媒介するTETファミリー;(ii)5mCまたは5hmCの脱アミノ化を媒介するAID/APOBECファミリー;および(iii)DNA修復に関与するBER(塩基除去修復)グリコシラーゼファミリー。
【0104】
遺伝子調節に関与する他のポリペプチドを修飾または調節するキナーゼ、ホスファターゼ、およびその他のタンパク質もエフェクタードメインとして有用である。このような修飾因子は、例えばホルモンによって媒介される転写のオンまたはオフの切り替えに関与することが多い。遺伝子発現を調節するための他の有用なドメインは、癌遺伝子(例えば、myc、jun、fos、myb、max、mad、rel、ets、bcl、myb、mosファミリーメンバー)の遺伝子産物、ならびに、それらに関連する因子および修飾因子からも得ることができる。
【0105】
少なくとも1つのエフェクタードメインは、gRNAが指向する標的核酸配列を含む場所に酵素活性を標的化するために使用することができる。例えば、いくつかの実施形態では、インテグラーゼ活性またはトランスポザーゼ活性を有するエフェクタードメインを使用して、特定の核酸配列領域への外因性核酸配列の組込みを促進し、および/または特定の内因性核酸配列を除去(ノックアウト)することができる。
【0106】
インテグラーゼは、例えば、宿主ゲノム(哺乳動物、ヒト、マウス、ラット、サル、カエル、魚、植物(作物植物およびシロイヌナズナのような実験植物を含む)、実験室または生物医学の細胞株または初代細胞培養、線虫、ハエ(ショウジョウバエ)など)への核酸の挿入を可能にする。インテグラーゼは、HIV(ヒト免疫不全ウイルス)およびλインテグラーゼなどのレトロウイルスに見られる。
【0107】
いくつかの実施形態では、少なくとも1つのエフェクタードメインは、トランスポザーゼ機能性を含む。トランスポザーゼは、トランスポゾンの末端に結合し、カットアンドペーストのメカニズムまたは複製的転位メカニズムによってその移動を触媒する酵素である。例示的なトランスポザーゼは、Tc1トランスポザーゼ、Mos1トランスポザーゼ、Tn5トランスポザーゼ、およびMuトランスポザーゼを含むが、これらに限定されない。
【0108】
いくつかの実施形態では、少なくとも1つのエフェクタードメインは、エピジェネティックシグナルを修飾し、それによって、例えばヒストンアセチル化酵素活性およびヒストン脱アセチル化酵素活性を促進することによって、遺伝子調節を修飾する。用語「エピジェネティック修飾因子」は、本明細書で使用される場合には、DNA、例えば染色体DNAのエピジェネティック修飾をもたらす酵素活性を有するタンパク質またはその触媒ドメインを指す。エピジェネティック修飾は、メチル化および脱メチル化(例えば、モノ-メチル化、ジ-メチル化およびトリ-メチル化)、ヒストンのアセチル化および脱アセチル化、ならびにヒストンのユビキチン化、リン酸化およびスモイル化(sumoylation)を含むヒストン修飾を含むが、これらに限定されない。
【0109】
ヒストンのアセチル化および脱アセチル化は、遺伝子調節の一環として、ヌクレオソームのヒストンコアから突出したN末端尾部内のリジン残基がアセチル化および脱アセチル化されるプロセスである。これらの反応は通常、ヒストンアセチル基転位酵素(HAT)活性またはヒストン脱アセチル化酵素(HDAC)活性を有する酵素によって触媒される。ヒストンアセチル基転位酵素は、GNATファミリータンパク質(例えば、Gcn5、Gcn5L、p300/CREB-結合タンパク質関連因子(PCAF)、Elp3、HPA2およびHAT1)ならびにMYSTファミリータンパク質(例えば、Sas3、必須SAS-関連アセチル基転位酵素(Esa1)、Sas2、Tip60、MOF、MOZ、MORF、およびHBO1)を含む。ヒストン脱アセチル化酵素は、4つのクラスに分類される。クラスIは、HDAC1、2、3、および8を含む。クラスIIは、2つのサブグループ、クラスIIAおよびクラスIIBに分けられる。クラスIIAは、HDAC4、5、7、および9を含み、一方クラスIIBは、HDAC6および10を含む。クラスIIIはサーチュイン(Sirtuin)を含み、クラスIVはHDAC11のみを含む。HDACタンパク質のクラスは、クラスI HDACについてはRpd3、Hos1、およびHos2、クラスII HDACについてはHDA1、およびHos3、クラスIII HDACについてはサーチュインの配列相同性との比較に基づいて共に分けられ、グループ化されている。
【0110】
ヒストン残基の部位特異的なメチル化および脱メチル化は、それぞれメチル基転位酵素および脱メチル化酵素によって触媒される。ヒストンメチル化酵素は、ヒストンタンパク質のアミノ酸(例えば、リジンおよびアルギニン)にメチル基を転移し、最終的に遺伝子の転写に影響を及ぼす。メチル化酵素は、SET1、MLL、SMYD3、G9a、GLP、EZH2、およびSETDB1を含む。ヒストン脱メチル化酵素は、転写調節およびDNA損傷修復に関連する活性である、ヒストンからのメチルマークの除去を触媒する。脱メチル化酵素は、例えば、KDM1A、KDM1B、KDM2A、KDM2B、UTX、UTY、Jumonji C(JmJC)ドメイン-含有脱メチル化酵素、およびGSK-J4を含む。
【0111】
いくつかの実施形態では、少なくとも1つのエフェクタードメインは、ヌクレアーゼ活性を含む。ヌクレアーゼは、核酸配列における切断(例えば、二本鎖DNA配列における一本鎖切断または二本鎖切断)を誘導する薬剤である。ヌクレアーゼは、あらかじめ選択された、もしくは特異的な配列またはその近傍で切断するものと、部位特異的でないものを含む。例えば、ヌクレアーゼは、ジンクフィンガーヌクレアーゼ(ZFN)、ホーミングエンドヌクレアーゼ、メガヌクレアーゼ、制限酵素、TALエフェクターヌクレアーゼ、アルゴノート(Argonaute)ヌクレアーゼ、例えば、Cas9、Cpf1、Csm1、CasXまたはCasYヌクレアーゼを含む、CRISPRヌクレアーゼ、マイクロコッカルヌクレアーゼ、ブドウ球菌ヌクレアーゼ、DNase I、T7エンドヌクレアーゼ、またはそれらの触媒活性フラグメントを含むが、これらに限定されない。
【0112】
いくつかの実施形態では、少なくとも1つのエフェクタードメインは、インベルターゼ活性を含む。インベルターゼ活性は、DNAフラグメントの向きを入れ替えることによってゲノムの構造を変化させるために使用することができる。
【0113】
いくつかの実施形態では、少なくとも1つのエフェクタードメインは、リコンビナーゼ活性を含む。リコンビナーゼは、リコンビナーゼ認識配列間のDNAの組換えを仲介する部位特異的酵素であり、リコンビナーゼ認識配列間のDNAフラグメントの切除、組込み、逆位、または交換(例えば、転座)をもたらす。リコンビナーゼは、2つの異なるファミリーに分類することができる:セリンリコンビナーゼ(例えば、レゾルバーゼおよびインベルターゼ)およびチロシンリコンビナーゼ(例えば、インテグラーゼ)。セリンリコンビナーゼの例は、限定するものではないが、Hin、Gin、Tn3(TnpRとしても知られている)、β-six、CinH、ParA、γδ、Bxb1、φC31、TP901、TG1、φBT1、R4、φRV1、φFC1、MR11、A118、U153、およびgp29を含む。チロシンリコンビナーゼの例は、これらに限定されないが、Cre、FLP、R、Lambda、HK101、HK022、およびpSAM2を含む。セリンリコンビナーゼおよびチロシンリコンビナーゼの名称は、リコンビナーゼがDNAを攻撃するために使用し、鎖交換の際にDNAと共有結合する保存された求核アミノ酸残基に由来する。
【0114】
いくつかの実施形態では、少なくとも1つのエフェクタードメインは、レゾルバーゼ活性を含む。レゾルバーゼは、2つの組換え部位(resと呼ばれる)間に含まれるDNAのセグメントを(円として)切除する機能を有する部位特異的リコンビナーゼであり、例えば、Ruv Cレゾルバーゼ、ホリデー連結レゾルバーゼHjc,Tn3およびγδレゾルバーゼを含む。
【0115】
いくつかの実施形態では、少なくとも1つのエフェクタードメインは、例えば、エストロゲン受容体、グルココルチコステロイド受容体などのリガンド結合ドメインを含む、ホルモン受容体リガンド結合ドメインなどのリガンドに応答するペプチド配列またはポリペプチド配列を含む。このようなエフェクタードメインは、「遺伝子スイッチ」として作用するために使用され得、リガンド結合ドメインに特異的な低分子リガンドまたはタンパク質リガンドなどの誘導物質によって調節され得る。
【0116】
いくつかの実施形態では、少なくとも1つのエフェクタードメインは、例えば、ロイシンジッパードメイン、STATタンパク質N末端ドメイン、および/またはFK506結合タンパク質を含む、直接的または間接的なタンパク質-タンパク質相互作用を媒介するポリペプチドの配列またはドメインを含む。
【0117】
いくつかの実施形態では、少なくとも1つのエフェクタードメインは、DNA編集機能(例えば、デアミナーゼ、DNA修復活性、DNA損傷活性、ジスムターゼ活性、アルキル化活性、脱プリン化活性、酸化活性、ピリミジン二量体形成活性、ポリメラーゼ活性(例えば、逆転写酵素)、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性またはグリコシラーゼ活性)を含む。
【0118】
いくつかの実施形態では、少なくとも1つのエフェクタードメインによって媒介される活性は、蛍光活性(例えば、蛍光タンパク質)、発光活性(例えば、基質と相互作用した場合に発光を生じる発光タンパク質または発光酵素(例えば、ルシフェラーゼ))などの非生物活性、または、エフェクタードメインが付加されたポリペプチドの検出、精製、発現のモニタリング、および/または、細胞および細胞レベル下の局在化のモニタリングを容易にするための、結合活性(マルトース結合タンパク質(「MBP」)、グルタチオンS転移酵素(GST)、ヘキサヒスチジン、c-myc、およびFLAGエピトープによって媒介されるものなど)である。このような実施形態では、システムは、例えば、遺伝子配列の変異を検出するため、溶液から制限フラグメントを精製するため、またはゲルのDNAフラグメントを可視化するための診断試薬としても使用することができる。
【0119】
本明細書に記載のエフェクタードメインは例示であり、本明細書に記載のシステムおよび方法と組み合わせて使用できるエフェクターの例を当業者に提供するにすぎない。
【0120】
いくつかの実施形態では、少なくとも1つのエフェクタードメインは、転写活性化因子、転写抑制因子、塩基編集因子、エピジェネティック修飾因子、染色体座イメージング剤(例えば、蛍光タンパク質もしくはタンパク質タグ)、またはそれらの組み合わせを含む。
【0121】
いくつかの実施形態では、エフェクタードメインは、天然のDNA結合ドメインから分離され、本明細書中に記載される成分との融合タンパク質の一部となるように遺伝子操作されたタンパク質のフラグメントである。いくつかの実施形態では、エフェクタードメインは、通常、他のタンパク質または因子に結合するタンパク質であり、その結果、特異的核酸または非特異的核酸にリクルートされる。
【0122】
いくつかの実施形態では、Cas7は、少なくとも1つのエフェクタードメインを含む。
【0123】
いくつかの実施形態では、Cas8またはCas8-Cas5融合タンパク質は、少なくとも1つのエフェクタードメインを含む。いくつかの実施形態では、Cas12kは、少なくとも1つのエフェクタードメインを含む。いくつかの実施形態では、TniQは、少なくとも1つのエフェクタードメインを含む。いくつかの実施形態では、TnsCは、少なくとも1つのエフェクタードメインを含む。特定の実施形態では、TnsCは、C末端でエフェクタードメインに融合される。
【0124】
いくつかの実施形態では、Cas7およびTnsCの両方は、少なくとも1つのエフェクタードメインを含む。いくつかの実施形態では、Cas7およびTnsC上のエフェクタードメインは、同じまたは異なる型のエフェクタードメインである。例えば、Cas7およびTnsCの両方は、同じ転写活性化因子または異なる転写活性化因子のいずれかの転写活性化因子を含んでいてもよい。あるいは、Cas7は転写活性化因子を含んでいてもよく、一方、TnsCは転写抑制因子を含んでいてもよい。
【0125】
〔b.核局在配列〕
本明細書に開示されるシステムにおいて、少なくとも1つのCasタンパク質および少なくとも1つのトランスポゾン関連タンパク質のうちの1つ以上は、核局在化シグナル(NLS)を含み得る。核局在化配列は、N末端、C末端、またはそれらの組み合わせにおいて、少なくとも1つのCasタンパク質および少なくとも1つのトランスポゾン関連タンパク質のうちの1つ以上に付加され得る。
【0126】
いくつかの実施形態では、少なくとも1つのCasタンパク質および少なくとも1つのトランスポゾン関連タンパク質のうちの1つ以上は、2つ以上のNLSを含む。2つ以上のNLSは、タンデムであってもよく、リンカーによって分離されていてもよく、タンパク質のいずれかのエンド末端にあってもよく、タンパク質に埋め込まれていてもよい。
【0127】
いくつかの実施形態では、NLSは、Cas6のC末端に融合される。いくつかの実施形態では、NLSは、Cas7のN末端、C末端、または両方に融合される。特定の実施形態では、Cas7は、N末端にタンデムに融合された2つのNLSを含む。いくつかの実施形態では、NLSは、Cas8-Cas5融合タンパク質のN末端またはC末端に融合される。
【0128】
いくつかの実施形態では、NLSはTniQのN末端またはC末端に融合している。いくつかの実施形態では、NLSはTnsCのC末端に融合している。いくつかの実施形態では、NLSはTnsAのC末端に融合している。いくつかの実施形態では、NLSはTnsBのN末端に融合している。
【0129】
核局在化配列は、タンパク質を機能的にタグ付けするか、タンパク質を細胞の核にインポートする(例えば、核輸送のため)ように誘導するために、当技術分野で知られている任意のアミノ酸配列を含み得る。通常、核局在化配列は、リジンおよびアルギニンなどの1つ以上の正電荷アミノ酸を含む。
【0130】
いくつかの実施形態では、NLSは、単節型配列である。単節型NLSは、正に荷電したアミノ酸または塩基性アミノ酸の単一のクラスターを含む。いくつかの実施形態では、単節型NLSは、K-K/R-X-K/Rの配列を含み、ここで、Xは任意のアミノ酸であり得る。例示的な単節型NLS配列には、SV40ラージT抗原、c-Myc、およびTUS-タンパク質由来のものが含まれる。
【0131】
いくつかの実施形態では、NLSは、双節型配列である。双節型NLSは、約9~12アミノ酸のスペーサーで分離された塩基性アミノ酸の2つのクラスターを含む。例示的な双節型NLSには、ヌクレオプラスミンのNLS、KR[PAATKKAGQA]KKKK(配列番号2)のNLS、およびEGL-13のNLS、MSRRRKANPTKLSENAKKLAKEVEN(配列番号3)が含まれる。いくつかの実施形態では、NLSは、双節型SV40 NLSを含む。特定の実施形態では、NLSは、KRTADGSEFESPKKKRKV(配列番号4)に対して少なくとも70%の類似性を有するアミノ酸配列を含む。選択された実施形態では、NLSは、KRTADGSEFESPKKKRKV(配列番号4)のアミノ酸配列からなる。
【0132】
開示されるシステムのタンパク質成分(例えば、Casタンパク質またはトランスポゾン関連タンパク質)は、エピトープタグ(例えば、3xFLAGタグ、HAタグ、Mycタグなど)をさらに含み得る。いくつかの実施形態では、エピトープタグは、核局在化配列の上流または下流のいずれかに隣接し得る。エピトープタグは、対応するタンパク質のN末端、C末端、またはそれらの組み合わせに存在し得る。
【0133】
〔c.gRNA〕
遺伝子操作されたCRISPR-Casシステムは、標的核酸配列の少なくとも一部に相補的なgRNA、または少なくとも1つのgRNAをコードする核酸を含む。
【0134】
gRNAは、crRNA、crRNA/tracrRNA(またはシングルガイドRNA、sgRNA)であってもよい。用語「gRNA」、「ガイドRNA」および「CRISPR誘導配列」は、全体を通して互換的に使用され得、CRISPR-Casシステムの結合特異性を決定する配列を含む核酸を指す。gRNAは、標的核酸配列(例えば、宿主細胞内のゲノム)にハイブリダイズする(部分的または完全に相補的である)。いくつかの実施形態では、少なくとも1つのgRNAは、CRISPR RNA(crRNA)アレイにコードされる。
【0135】
標的核酸(標的部位)にハイブリダイズするgRNAまたはその一部は、長さが15~40ヌクレオチドであり得る。いくつかの実施形態では、標的核酸にハイブリダイズするgRNA配列は、長さが15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40ヌクレオチドである。本開示で使用されるgRNAまたはsgRNAは、長さが約5~100ヌクレオチドまたはそれ以上(例えば、長さが5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、もしくは100ヌクレオチドまたはそれ以上)であり得る。
【0136】
gRNAの設計を容易にするために、多くのコンピュータツールが開発されている(Prykhozhij et al. (PLoS ONE, 10(3): (2015));Zhu et al. (PLoS ONE, 9(9) (2014));Xiao et al. (Bioinformatics. Jan 21 (2014));Heigwer et al. (Nat Methods, 11(2): 122-123 (2014))を参照されたい)。ガイドRNA設計のための方法およびツールは、Zhu(Frontiers in Biology, 10 (4) pp 289-296 (2015))によって論じられており、当該文献は参照により本明細書に組込まれる。さらに、sgRNAの設計を容易にするために使用することができる多くの公的に入手可能なソフトウェアツールが存在し;Genscript Interactive CRISPR gRNA Design Tool、WU-CRISPR、およびBroad Institute GPP sgRNA Designerが含まれるが、これらに限定されない。また多くの種(ヒト、マウス、ラット、ゼブラフィッシュ、線虫(C.elegans))のゲノム内の多くの遺伝子および位置を標的とする事前設計されたgRNA配列も公的に入手可能であり、IDT DNA事前設計Alt-R CRISPR-Cas9ガイドRNA、Addgene検証済みgRNA標的配列、およびGenScriptゲノムワイドgRNAデータベースが含まれるが、これらに限定されない。
【0137】
いくつかの実施形態では、標的核酸に結合する配列に加えて、gRNAはまた、スキャフォールド配列(例えば、tracrRNA)を含み得る。いくつかの実施形態では、このようなキメラgRNAは、シングルガイドRNA(sgRNA)と呼ばれ得る。例示的なスキャフォールド配列は、当業者には明らかであり、例えば、Jinek, et al. Science (2012) 337(6096):816-821、およびRan, et al. Nature Protocols (2013) 8:2281-2308に見つけることができ、それらはその全体が参照により本明細書に組込まれる。
【0138】
いくつかの実施形態では、gRNA配列は、スキャフォールド配列を含まず、スキャフォールド配列は別個の転写産物として発現される。そのような実施形態では、gRNA配列は、スキャフォールド配列の一部に相補的なさらなる配列をさらに含み、スキャフォールド配列と結合(ハイブリダイズ)するように機能する。
【0139】
本明細書の他の箇所に記載されているように、システムのタンパク質およびgRNA成分は、当技術分野で公知の任意のプロモーターまたは調節配列を使用して、核酸から発現および転写され得る。いくつかの実施形態では、gRNAは、RNAポリメラーゼIIプロモーターの制御下で転写される。いくつかの実施形態では、gRNAは、RNAポリメラーゼIIIプロモーターの制御下で転写される。
【0140】
いくつかの実施形態では、gRNA配列は、標的核酸に対して少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、または少なくとも100%相補的である。いくつかの実施形態では、gRNA配列は、標的核酸の3’末端(例えば、標的核酸の3’末端の最後の5、6、7、8、9、または10ヌクレオチド)に対して少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、または少なくとも100%相補的である。
【0141】
gRNAは非天然起源のgRNAであってもよい。
【0142】
標的核酸は、プロトスペーサー隣接モチーフ(PAM)によって挟まれていてもよい。PAM部位は、標的配列に近接したヌクレオチド配列である。例えば、PAMは、CRISPR-Casシステムによって標的とされるDNA配列の直後のDNA配列であってもよい。
【0143】
標的配列は、プロトスペーサー隣接モチーフ(PAM)配列によって挟まれていても挟まれていなくてもよい。特定の実施形態において、核酸誘導ヌクレアーゼは、適切なPAMが存在する場合にのみ標的配列を切断することができ、例えば、Doudna et al., Science, 2014, 346(6213): 1258096(参照により本明細書に組込まれる)を参照されたい。PAMは標的配列の5’側の場合も3’側の場合もある。PAMは標的配列の上流の場合も下流の場合もある。一実施形態において、標的配列は3’末端でPAM配列とすぐに隣接する。PAMは、長さが1、2、3、4、5、6、7、8、9、10またはそれ以上のヌクレオチドであり得る。特定の実施形態では、PAMは、長さが2~6ヌクレオチドである。標的配列は、PAM配列(例えば、標的配列のすぐ3’側に位置するPAM配列)に隣接して位置する場合もそうでない場合もある(例えば、I型CRISPR/Casシステムの場合)。いくつかの実施形態では、例えば、I型システムにおいて、PAMは、プロトスペーサーの代替側(5’末端)にある。Makarovaらは、CRISPRシステムの全てのクラス、型、およびサブタイプの名称について説明している(Nature Reviews Microbiology 13:722-736 (2015))。ガイド構造およびPAMは、R.Barrangouによって説明されている(Genome Biol.16:247(2015))。
【0144】
PAM配列の非限定的な例は、以下を含む:CC、CA、AG、GT、TA、AC、CA、GC、CG、GG、CT、TG、GA、AGG、TGG、T-リッチPAM(TTT、TTG、TTCなど)、NGG、NGA、NAG、NGGNG、およびNNAGAAW(W=AまたはT、配列番号6)、NNNNGATT(配列番号7)、NAAR(R=AまたはG)、NNGRR(R=AまたはG)、NNAGAA(配列番号8)およびNAAAAC(配列番号5)。ここで「N」は任意のヌクレオチドである。
【0145】
「相補性」とは、従来のワトソン-クリック型または他の非伝統的型のいずれかによって、核酸が別の核酸配列と水素結合を形成する能力を指す。相補性パーセントとは、第2の核酸配列と水素結合(例えば、ワトソン-クリック塩基対合)を形成することができる核酸分子中の残基のパーセントを示す。ハイブリダイゼーションを生じさせるのに十分な相補性があれば、完全な相補性は必ずしも必要ではない。PAMから遠位にミスマッチが存在する場合がある。
【0146】
〔d.核酸〕
遺伝子操作されたCRISPR-Casシステムをコードする1つ以上の核酸は、DNA、RNA、またはそれらの組み合わせを含む任意の核酸であり得る。いくつかの実施形態では、1つ以上の核酸は、1つ以上のメッセンジャーRNA、1つ以上のベクター、またはそれらの任意の組合せを含む。
【0147】
少なくとも1つのCasタンパク質、少なくとも1つのトランスポゾン関連タンパク質、および少なくとも1つのgRNAは、同じまたは異なる核酸(例えば、ベクター)上に存在し得る。いくつかの実施形態では、少なくとも1つのトランスポゾン関連タンパク質は、少なくとも1つのCasタンパク質およびgRNAと同じまたは異なる核酸上にコードされる。いくつかの実施形態では、少なくとも1つのCasタンパク質および少なくとも1つのトランスポゾン関連タンパク質は、単一の核酸によってコードされる。いくつかの実施形態では、少なくとも1つのCasタンパク質、少なくとも1つのトランスポゾン関連タンパク質、およびgRNAの各々が、単一の核酸によってコードされる。
【0148】
いくつかの実施形態では、少なくとも1つのgRNAは、少なくとも1つのCasタンパク質および少なくとも1つのトランスポゾン関連タンパク質をコードする核酸とは異なる核酸によってコードされる。
【0149】
いくつかの実施形態では、少なくとも1つのgRNAは、少なくとも1つのCasタンパク質、少なくとも1つのトランスポゾン関連タンパク質、またはその両方をコードする核酸によってもコードされる。選択された実施形態では、単一の核酸がgRNAおよび少なくとも1つのCasタンパク質をコードする。例えば、特定の実施形態では、単一の核酸が、gRNAおよびCas6をコードする。代替の実施形態では、単一の核酸が、gRNAおよびCas7をコードする。
【0150】
gRNAは、少なくとも1つのCasタンパク質をコードする核酸のどこにコードされていてもよい。いくつかの実施形態では、gRNAはCasタンパク質の3’UTRにコードされる。
【0151】
タンパク質成分をコードする1つ以上の核酸は、RNAの場合には、タンパク質成分をコードする配列に隣接して、三重らせんを形成することができる配列をさらに含み得るか、またはDNAの場合のように、三重らせんを形成することができる配列をコードし得る。いくつかの実施形態では、三重らせんを形成することができる配列は、少なくとも1つのCasタンパク質をコードする配列および/または少なくとも1つのトランスポゾン関連タンパク質をコードする配列の下流にある。いくつかの実施形態では、三重らせんを形成することができる配列は、少なくとも1つのCasタンパク質をコードする配列または少なくとも1つのトランスポゾン関連タンパク質をコードする配列の3’非翻訳領域にある。
【0152】
三重らせんは、二重鎖核酸の主要な溝に第三の鎖がHoogsteen塩基対(例えば水素結合)を介して結合した後、主要な溝を作る二つの鎖の二重鎖構造を維持したまま形成される。ピリミジンリッチ配列およびプリンリッチ配列(例えば、2つのピリミジントラクトおよび1つのプリントラクト、またはその逆)は、三重鎖(例えば、A-U-AおよびC-G-C)の形成の結果として、安定な三重鎖構造を形成することができる。
【0153】
いくつかの実施形態では、三重らせん形成配列は、各々がリンカー領域またはループ領域によって分離された、2つのウラシルリッチトラクトおよびアデノシンリッチトラクトを含む。本明細書で使用される場合には、用語「Aリッチトラクト」は、連続するヌクレオシドの少なくとも80%がアデノシンである連続するヌクレオシドの鎖を指す。同様に、用語「Uリッチモチーフ」は、連続するヌクレオシドの少なくとも80%がウリジンである連続するヌクレオシドの鎖を指す。
【0154】
いくつかの実施形態では、三重らせん配列は、長鎖非コードRNA(lncRNA)(例えば、転移-関連肺腺癌転写産物1(MALAT1))からの三重らせんターミネーターの3’末端三重らせん配列に由来する。
【0155】
少なくとも1つのCasタンパク質および少なくとも1つのトランスポゾン関連タンパク質のうちの1つ以上は、内部リボソーム進入部位(IRES)またはリボソームスキッピングペプチドの配列を含む。これは、システムの複数の成分を発現させるために単一の核酸またはベクターを使用する場合に特に有利である。
【0156】
リボソームスキッピングペプチドは、2Aファミリーペプチドを含み得る。2Aペプチドは、ウイルス由来の短い(約18~25aa)ペプチドである。P2A、T2A、E2A、およびF2Aの4種類の2Aペプチドが一般的に使用されており、これらは4つの異なるウイルスに由来する。いかなる公知の2Aペプチド配列が、開示されたシステムでの使用に適している。
【0157】
特定の実施形態では、真核細胞で使用するためのシステムの遺伝子操作は、コドン最適化を含み得る。ネイティブなコドンを哺乳動物において最も頻繁に使用されるコドンに変更することにより、哺乳動物細胞(例えば、ヒト細胞)におけるシステムタンパク質の最大限の発現が可能になることが理解されるであろう。このような改変された核酸配列は、当技術分野において、一般に、「最適化されたコドン」、または「哺乳動物優先」もしくは「ヒト優先」コドンを利用するものとして記載される。いくつかの実施形態では、核酸配列は、その中にコードされるコドンの少なくとも約60%(例えば、65%、70%、75%、80%、85%、90%、95%、または98%)が哺乳動物優先コドンである場合には、最適化されたコドンとみなされる。さらに、いくつかの実施形態では、CRISPR-Casシステムの遺伝子操作は、開示されたシステムにネイティブなCRISPRアレイの要素を組込むことを含む。
【0158】
本開示はまた、本明細書に開示されたタンパク質および核酸をコードするDNAセグメント、これらのセグメントを含むベクター、およびベクターを含む細胞を提供する。ベクターは、適切な細胞中でセグメントを増殖させるため、および/またはセグメントからの発現(例えば、発現ベクター)を可能にするために使用され得る。当業者であれば、核酸配列の増殖および発現に利用可能な様々なベクターを知っているであろう。
【0159】
本開示はさらに、本システムの成分の1つ以上またはすべてをコードし得る、遺伝子操作され、非天然起源のベクターおよびベクターシステムを提供する。ベクターは、任意の適切な原核細胞または真核細胞を含む、それによってコードされるポリペプチドを発現することができる細胞に導入され得る。
【0160】
本開示のベクターは、対象中の真核細胞に送達され得る。本システムを介した真核細胞の改変は、細胞培養において行われ得、ここで、該方法は、改変の前に、対象から真核細胞を単離することを含む。いくつかの実施形態では、前記方法は、前記真核細胞および/またはそれに由来する細胞を対象に戻すことをさらに含む。
【0161】
ウイルスおよび非ウイルスベースの遺伝子導入法は、本システムの成分をコードする核酸を細胞、組織、または対象に導入するために使用することができる。このような方法は、本システムの成分をコードする核酸を、培養中の細胞、または宿主生物に投与するために使用することができる。非ウイルスベクター送達システムには、DNAプラスミド、コスミド、RNA(例えば、本明細書に記載のベクターの転写物)、核酸、および送達ビヒクルと複合化した核酸が含まれる。ウイルスベクター送達システムには、DNAおよびRNAウイルスが含まれ、これらは細胞への送達後にエピソームまたは組込みゲノムを有する。ウイルスベクターには、例えば、レトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ウイルスベクター、および単純ヘルペスウイルスベクターが含まれる。
【0162】
特定の実施形態では、非複製性プラスミド、または高温で硬化し得るプラスミドが使用され得、システムの必要な成分のいずれかまたは全てが、特定の条件下で細胞から除去され得る。例えば、これは目的の細菌を形質転換することでDNAの組込みを可能にし、組込みに使用されたプラスミドまたはベクターの記憶を持たない遺伝子操作された株を残すことができる。
【0163】
本システム(1つ以上のCasタンパク質および/またはトランスポゾン関連タンパク質、gRNAなど)を標的細胞および/または対象に送達するために、様々なウイルス構築物を使用することができる。このような組換えウイルスの非限定的な例は、組換えアデノ随伴ウイルス(AAV)、組換えアデノウイルス、組換えレンチウイルス、組換えレトロウイルス、組換え単純ヘルペスウイルス、組換えポックスウイルス、ファージなどを含む。本開示は、レトロウイルスまたはレンチウイルスなどの宿主ゲノムに組込むことができるベクターを提供する。例えば、参照によって本明細書に組込まれる、Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, New York, 1989; Kay, M. A., et al., 2001 Nat. Medic. 7(1):33-40;およびWalther W. and Stein U., 2000 Drugs, 60(2): 249-71を参照されたい。
【0164】
一実施形態において、本タンパク質をコードするDNAセグメントは、本タンパク質の発現、ならびに組換えベクターによって産生されたタンパク質のその後の単離および精製を可能にするプラスミドベクターに含まれる。したがって、本明細書中に開示されるタンパク質は、発現後に精製することができるか、化学合成によって得ることができるか、または組換え法によって得ることができる。
【0165】
本システムを発現する細胞を構築するために、本システムの安定発現または一過性発現のための発現ベクターは、本明細書に記載されるような従来の方法により構築され、宿主細胞に導入され得る。例えば、本システムの成分をコードする核酸を、適当なプロモーターに作動可能に連結したプラスミドまたはウイルスベクターなどの、適当な発現ベクターにクローニングすることができる。発現ベクター/プラスミド/ウイルスベクターの選択は、真核細胞における組込みおよび複製に適しているべきである。
【0166】
特定の実施形態において、本開示のベクターは、原核細胞において1つ以上の配列の発現を駆動し得る。使用され得るプロモーターとしては、T7 RNAポリメラーゼプロモーター、構成的大腸菌プロモーター、および広範な細菌生物における転写機構によって広く認識され得るプロモーターが挙げられる。このシステムは様々な細菌を宿主として用いることができる。
【0167】
特定の実施形態において、本開示のベクターは、哺乳動物発現ベクターを使用して、哺乳動物細胞において1つ以上の配列の発現を駆動し得る。哺乳動物発現ベクターの例としては、pCDM8(Seed, Nature (1987) 329:840、参照により本明細書に組込まれる)およびpMT2PC(Kaufman, et al., EMBO J. (1987) 6:187、参照により本明細書に組込まれる)が挙げられる。哺乳動物細胞において使用される場合には、発現ベクターの制御機能は、典型的には、1つ以上の調節因子によって提供される。例えば、一般的に使用されるプロモーターは、ポリオーマ、アデノウイルス2、サイトメガロウイルス、シミアンウイルス40、および本明細書中に開示され、当該分野で公知の他のものに由来する。原核細胞および真核細胞の両方に対する他の適切な発現システムについては、例えば、Sambrook, et al., MOLECULAR CLONING: A LABORATORY MANUAL. 2nd eds., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989の第16章および第17章(参照により本明細書に組込まれる)を参照されたい。
【0168】
本開示のベクターは、当技術分野で公知の多数のプロモーターのいずれかを含み得、ここで、プロモーターは、構成的、調節可能または誘導可能、細胞型特異的、組織特異的、または種特異的である。転写を指示するのに十分な配列に加えて、本発明のプロモーター配列はまた、転写の調節に関与する他の調節因子の配列(例えば、エンハンサー、コザック配列およびイントロン)を含み得る。遺伝子の構成的発現を駆動するのに有用な多くのプロモーター/調節配列が当技術分野で利用可能であり、例えば、限定されるものではないが、CMV(サイトメガロウイルスプロモーター)、EF1a(ヒト伸長因子1アルファプロモーター)、SV40(サル空胞形成ウイルス40プロモーター)、PGK(哺乳類ホスホグリセリン酸キナーゼプロモーター)、Ubc(ヒトユビキチンCプロモーター)、ヒトベータ-アクチンプロモーター、げっ歯類ベータ-アクチンプロモーター、CBh(ニワトリベータ-アクチンプロモーター)、CAG(ハイブリッドプロモーターは、CMVエンハンサー、ニワトリベータ-アクチンプロモーター、およびウサギベータ-グロビンスプライス受容体を含む)、TRE(テトラサイクリン応答因子プロモーター)、H1(ヒトポリメラーゼIII RNAプロモーター)、U6(ヒトU6小核プロモーター)などが挙げられる。本発明のシステムの成分の発現に使用され得るさらなるプロモーターとしては、限定されるものではないが、サイトメガロウイルス(CMV)中間初期プロモーター、ウイルスLTR(例えば、ラウス肉腫ウイルスLTR、HIV-LTR、HTLV-1 LTR、マロニーマウス白血病ウイルス(MMLV)LTR、脊髄増殖性肉腫ウイルス(MPSV)LTR、脾臓フォーカス形成ウイルス(SFFV)LTR、サルウイルス40(SV40)初期プロモーター、単純ヘルペスtkウイルスプロモーター、伸長因子1-アルファ(EF1-α)イントロンありまたはなしのEF1-αプロモーターが挙げられる。さらなるプロモーターとしては、任意の構成的活性プロモーターが挙げられる。代替的に、任意の調節可能なプロモーターを使用してその発現が細胞内で調節できるようにしてもよい。
【0169】
さらに、RNA、膜貫通タンパク質、または他のタンパク質の誘導性および組織特異的発現は、このような分子をコードする核酸を誘導性または組織特異的プロモーター/調節配列の制御下に置くことによって遂行することができる。この目的において有用な組織特異的または誘導性プロモーター/調節配列の例としては、限定されるものではないが、ロドプシンプロモーター、MMTV LTR誘導性プロモーター、SV40後期エンハンサー/プロモーター、シナプシン1プロモーター、ET肝細胞プロモーター、GSグルタミンシンターゼプロモーター、および他の多くのプロモーター/調節配列が挙げられる。様々な市販のユビキタスならびに組織特異的および腫瘍特異的プロモーターが、例えば、InvivoGenから入手可能である。加えて、当技術分野で周知されているプロモーターは、誘導剤(金属、グルココルチコイド、テトラサイクリン、ホルモンなど)に応答して誘導することができ、これらを本発明で使用することも企図されている。したがって、本開示は、作動可能に連結している所望のタンパク質の発現を駆動可能な当技術分野で知られている任意のプロモーター/調節配列の使用を含むことが理解されよう。
【0170】
本開示のベクターは、特定の細胞型での核酸の発現を指示することができる(例えば、組織特異的調節因子が、核酸を発現させるために使用される)。このような調節因子としては、組織特異的または細胞特異的であり得るプロモーターが挙げられる。用語「組織特異的」は、プロモーターに適用される場合には、異なる型の組織における同じ目的ヌクレオチド配列の発現が相対的に存在しない場合に、特定の型の組織(例えば、種子)に目的ヌクレオチド配列の選択的発現を指示することが可能なプロモーターを指す。用語「細胞型特異的」は、プロモーターに適用される場合には、同じ組織内の異なる型の細胞における同じ目的ヌクレオチド配列の発現が相対的に存在しない場合に、特定の型の細胞に目的ヌクレオチド配列の選択的発現を指示することが可能なプロモーターを指す。また、用語「細胞型特異的」は、プロモーターに適用される場合には、単一の組織内の領域で目的ヌクレオチド配列の選択的発現を促進することができるプロモーターも意味する。プロモーターの細胞型特異性は、当技術分野で周知されている方法(例えば、免疫組織化学染色)を用いて評価することができる。
【0171】
加えて、ベクターは、例えば、以下の一部または全てを含み得る:選択マーカー遺伝子(宿主細胞内の安定的なまたは一過性のトランスフェクト体を選択するためのネオマイシン遺伝子など);高レベルの転写のためのヒトCMVの最初期遺伝子からのエンハンサー/プロモーター配列;mRNAの安定性のためのSV40からの転写終結シグナルおよびRNA処理シグナル;α-グロビンまたはβ-グロビンのような高発現遺伝子からのmRNAの安定性および翻訳効率のための5’-および3’-非翻訳領域;適切なエピソーム複製のためのSV40ポリオーマ複製起点およびColE1;内部リボソーム結合部位(IRES)、多目的マルチクローニング部位;センスおよびアンチセンスRNAのin vitro転写のためのT7およびSP6 RNAプロモーター;誘発されたときにベクターを有する細胞を死滅させる「自殺スイッチ」または「自殺遺伝子」(例えば、HSVチミジンキナーゼ、iCasp9などの誘導性カスパーゼ)、ならびにキメラ型受容体の発現を評価するためのレポーター遺伝子。導入遺伝子を含むベクターを産生するための好適なベクターおよび方法は周知されており、当技術分野で利用可能である。また、選択可能マーカーは、クロラムフェニコール抵抗性、テトラサイクリン抵抗性、スペクチノマイシン抵抗性、ストレプトマイシン抵抗性、エリスロマイシン抵抗性、リファンピシン抵抗性、ブレオマイシン抵抗性、熱適応カナマイシン抵抗性、ゲンタマイシン抵抗性、ハイグロマイシン抵抗性、トリメトプリム抵抗性、ジヒドロ葉酸レダクターゼ(DHFR)、GPT;S.cerevisiaeのURA3、HIS4、LEU2、およびTRP1遺伝子も含む。
【0172】
宿主細胞内に導入する場合には、ベクターは、自律複製配列もしくは染色体外因子として維持されることがあり、または宿主DNA内に組込まれることもある。
【0173】
本システム(例えば、タンパク質、これらのタンパク質をコードするポリヌクレオチド、および本明細書中に記載されるタンパク質および/またはポリヌクレオチドを含む組成物)は、任意の適切な手段によって送達され得る。特定の実施形態では、本システムは、in vivoで送達される。他の実施形態では、本システムは、疾患または状態に罹患した患者へのin vivo送達に有用な改変された細胞を提供するために、in vitroで単離/培養細胞(例えば、自己iPS細胞)に送達される。
【0174】
本開示によるベクターは、形質転換、遺伝子導入、または他の方法で多種多様な宿主細胞に導入され得る。遺伝子導入とは、任意のコード配列が実際に発現されているか否かにかかわらず、宿主細胞がベクターを取り込むことを指す。遺伝子導入の多数の方法は、通常の当業者に知られており、例えば、リポフェクタミン、リン酸カルシウム共沈、エレクトロポレーション、DEAE-デキストラン処理、マイクロインジェクション、ウイルス感染、および当技術分野で知られている他の方法が挙げられる。形質導入とは、細胞内へのウイルスの侵入と、ウイルスベクターゲノムによって送達される配列の発現(例えば、転写および/または翻訳)とを指す。組換えベクターの場合には、「導入」とは一般に、組換えウイルスベクターの細胞内への侵入と、ベクターゲノムによって送達される目的の核酸の発現とを指す。
【0175】
本発明のシステムの成分をコードする核酸配列を含む任意のベクターも本開示の範囲内である。このようなベクターは、好適な方法によって宿主細胞に送達することができる。ベクターを細胞に送達する方法は当技術分野で周知されており、このような方法としては、DNAもしくはRNAエレクトロポレーション、トランスフェクション試薬(DNAもしくはRNAを送達するためのリポソームまたはナノ粒子など);機械的変形によるDNA、RNA、もしくはタンパク質の送達(例えば、Sharei et al. Proc. Natl. Acad. Sci. USA (2013) 110(6): 2082-2087(参照により本明細書に組込まれる)を参照されたい);またはウイルス形質導入を挙げることができる。いくつかの実施形態では、ベクターは、ウイルス形質導入によって宿主細胞に送達される。核酸は、より大きな構築物(プラスミドまたはウイルスベクターなど)の一部として、または直接的に、例えば、エレクトロポレーション、脂質小胞、ウイルス輸送体、マイクロインジェクション、および微粒子銃(高速粒子衝撃)によって送達することができる。同様に、1つ以上の導入遺伝子を含む構築物は、核酸を細胞内に導入するのに適した任意の方法によって送達することができる。いくつかの実施形態では、本発明のシステムの成分をコードする構築物または核酸はDNA分子である。いくつかの実施形態では、本発明のシステムの成分をコードする核酸は、DNAベクターであり、細胞にエレクトロポレーションすることができる。いくつかの実施形態では、本発明のシステムの成分をコードする核酸は、細胞にエレクトロポレーションすることができるRNA分子である。
【0176】
加えて、送達ビヒクル(ナノ粒子および脂質ベースのmRNAまたはタンパク質送達システムなど)を使用することができる。送達ビヒクルのさらなる例としては、レンチウイルスベクター、リボ核タンパク質(RNP)複合体、脂質ベース送達システム、遺伝子銃、流体力学、エレクトロポレーションまたはヌクレオフェクションマイクロインジェクション、および微粒子銃が挙げられる。様々な遺伝子送達法が、Nayerossadat et al. (Adv Biomed Res. 2012; 1: 27)およびIbraheem et al. (Int J Pharm. 2014 Jan 1;459(1-2):70-83)(参照により本明細書に組込まれる)によって詳細に論じられている。
【0177】
本明細書に記載のシステムをコードする例示的なベクターは、配列番号14-55に提供されている。
【0178】
〔方法〕
本明細書に開示されるのは、開示されるシステムを細胞内で利用する方法である。いくつかの実施形態では、方法は、細胞内の標的核酸に1つ以上のエフェクタードメインをリクルートすることに向けられる。いくつかの実施形態では、方法は、細胞における標的遺伝子の発現を調節することに向けられる。方法は、開示されたシステムを細胞内に導入することを含み得る。遺伝子操作されたCRISPR-Casシステム、gRNA、およびエフェクタードメインに関して前記で提供された説明および実施形態は、本明細書に記載される方法に適用可能である。
【0179】
前述したように、本システムは当技術分野で知られている方法によって真核細胞または原核細胞内に導入することができる。いくつかの実施形態では、細胞は真核細胞である。いくつかの実施形態では、細胞は哺乳動物細胞(例えば、ヒト細胞)である。いくつかの実施形態では、細胞は原核細胞である。
【0180】
いくつかの実施形態では、標的核酸は、標的細胞に内因性の核酸である。いくつかの実施形態では、標的核酸は、遺伝子または遺伝子産物をコードする。用語「遺伝子産物」は、本明細書で使用される場合には、遺伝子の発現から生じる任意の生化学的産物を指す。遺伝子産物は、RNAまたはタンパク質であり得る。RNA遺伝子産物は、tRNA、rRNA、マイクロRNA(miRNA)、およびスモール干渉RNA(siRNA)などの非コードRNA、ならびにメッセンジャーRNA(mRNA)などのコードRNAを含む。いくつかの実施形態では、標的核酸配列は、タンパク質またはポリペプチドをコードする。
【0181】
いくつかの実施形態では、標的核酸は、目的の遺伝子のプロモーター領域を含む。いくつかの実施形態では、標的核酸は、上流活性化因子配列を含む。いくつかの実施形態では、目的の遺伝子は、細胞内の染色体上に位置する。
【0182】
標的核酸配列を含むポリヌクレオチドとしては、限定されるものではないが、精製された染色体DNA、全cDNA、組織もしくは発現状態(例えば、熱ショック後、もしくはサイトカイン処置後、その他の処置後)、または(任意のこのような処置の後の)発現時間、または発生段階に従って分割されたcDNA、プラスミド、コスミド、BAC、YAC、ファージライブラリーなどを挙げることができる。標的部位を含むポリヌクレオチドには、ホモ・サピエンス(Homo sapiens)、ムス・ドメスティクス(Mus domesticus)、ムス・スプレタス(Mus spretus)、イヌ属ドメスティクス(Canis domesticus)、ウシ属(Bos)、シノラブディティス・エレガンス(Caenorhabditis elegans)、熱帯熱マラリア原虫(Plasmodium falciparum)、三日熱マラリア原虫(Plasmodium vivax)、回旋糸状虫(Onchocerca volvulus)、マレー糸状虫(Brugia malayi)、ジロフィラリア・イミティス(Dirofilaria immitis)、リーシュマニア(Leishmania)、トウモロコシ(Zea maize)、アラビドプシス・タリアナ(Arabidopsis thaliana)、大豆(Glycine max)、キイロショウジョウバエ(Drosophila melanogaster)、サッカロミセス・セレビシエ(Saccharomyces cerevisiae)、シゾサッカロミセス・ポンベ(Schizosaccharomyces pombe)、ニューロスポラ(Neurospora)、大腸菌(Escherichia coli)、ネズミチフス菌(Salmonella typhimurium)、枯草菌(Bacillus subtilis)、淋菌(Neisseria gonorrhoeae)、黄色ブドウ球菌(Staphylococcus aureus)、肺炎連鎖球菌(Streptococcus pneumonia)、結核菌(Mycobacterium tuberculosis)、アクウィフェクス(Aquifex)、サーマス・アクアティカス(Thermus aquaticus)、パイロコッカス・フリオサス(Pyrococcus furiosus)、サーマス・リトラリス(Thermus littoralis)、メタノバクテリウム・サーモオートトロフィカム(Methanobacterium thermoautotrophicum)、スルフォロブス・カルドアセティカス(Sulfolobus caldoaceticus)、その他などの生物由来のDNAが含まれ得る。
【0183】
本方法は、記載されたシステムの有効量を対象に、in vivoで投与するか、またはex vivoで処理された細胞の移植によって投与することを含み得る。いくつかの実施形態では、ベクターは、例えば、筋肉内、静脈内、経皮、経鼻、経口、粘膜、または他の送達方法によって目的の組織に送達される。
【0184】
本システムの成分またはex vivoで処理された細胞は、医薬組成物として薬学的に許容される担体または賦形剤とともに投与することができる。いくつかの実施形態では、本システムの成分は、個別に、または任意の組み合わせで、薬学的に許容される担体と混合して医薬組成物を形成してもよく、これも本開示の範囲内である。
【0185】
いくつかの実施形態では、本明細書に記載の本システムの成分または組成物の有効量が投与され得る。本開示の文脈において、用語「有効量」は、1つ以上のエフェクタードメインのリクルート、および所望により標的遺伝子の発現のモジュレーションが達成されるような、システムの成分のその量を指す。
【0186】
治療方法として利用される場合には、有効量は、治療される特定の状態、状態の重症度、個別の患者のパラメータ(年齢、健康状態、サイズ、性別、および体重を含む)、治療期間、(あれば)同時治療の性質、特定の投与経路、ならびに医療従事者の知識および専門知識内の同様の因子に応じて変化する。いくつかの実施形態では、有効量は、対象における任意の疾患または障害を緩和し、軽減し、回復し、改善し、症状を低減し、またはその進行を遅らせる。いくつかの実施形態では、対象はヒトである。
【0187】
本明細書に記載される疾患状態のいずれかに関連する限り、本開示の文脈において、用語「治療する」、「治療」などは、そのような状態に関連する少なくとも1つの症状を緩和もしくは軽減すること、またはそのような状態の進行を遅らせるもしくは逆転させることを意味する。本開示の意味の範囲内で、用語「治療する」はさらに、疾患を阻止すること、発症(すなわち、疾患の臨床的発現前の期間)を遅らせること、および/または疾患を発症もしくは悪化させるリスクを低減することも意味する。例えば、癌に関連しての用語「治療」は、患者の腫瘍負荷を除去もしくは低減させること、または転移を予防、遅延、もしくは阻害することなどを意味し得る。
【0188】
本開示の組成物および/または細胞に関連して使用する場合には、「医薬的に許容される」という語句は、生理学的に忍容でき、対象(例えば、哺乳動物、ヒト)に投与されたときに典型的に不利な反応を生じさせないような組成物の分子実体および他の成分を指す。好ましくは、本明細書で使用する場合には、用語「医薬的に許容される」は、連邦もしくは州の政府の規制機関の承認を受けていること、または哺乳動物における使用、より特定的にはヒトにおける使用のために、米国薬局方もしくは他の広く認識された薬局方に収載されていることを意味する。「許容される」とは、担体が組成物の活性成分(例えば、核酸、ベクター、細胞、または治療用抗体)に適合性であり、組成物が投与される対象に悪影響を及ぼさないことを意味する。本発明の方法で使用されるいずれの医薬組成物および/または細胞も、凍結乾燥製剤または水溶液の形態で、医薬的に許容される担体、賦形剤、または安定剤を含むことができる。
【0189】
医薬的に許容される担体(緩衝液を含む)は当技術分野で周知されており、リン酸、クエン酸、および他の有機酸;アスコルビン酸およびメチオニンを含む抗酸化剤;保存剤;低分子量ポリペプチド;タンパク質(血清アルブミン、ゼラチン、または免疫グロブリンなど);アミノ酸;疎水性ポリマー;単糖類;二糖類;および他の炭水化物;金属錯体;および/または非イオン性界面活性剤を含み得る。例えば、Remington: The Science and Practice of Pharmacy 20th Ed. (2000) Lippincott Williams and Wilkins, Ed. K. E. Hooverを参照されたい。
【0190】
〔キット〕
本システムの成分を含むキットも本開示の範囲内にある。
【0191】
キットは、本明細書に記載のいずれかの方法における使用のための説明書を含み得る。説明書は、意図された効果を達成するための、本発明のシステムまたは組成物の対象への投与についての説明を含み得る。説明書は、概して、意図された治療のための薬用量、投薬スケジュール、および投与経路に関する情報を含む。キットはさらに、対象が治療を必要としているかどうかを同定することに基づいて治療に適した対象を選択する記述を含み得る。
【0192】
本明細書で提供されるキットは、好適なパッケージングが行われる。好適なパッケージングとしては、バイアル、瓶、ジャー、フレキシブルパッケージングなどが挙げられるが、これらに限定されない。キットは、無菌アクセスポートを有し得る(例えば、容器は、静注用溶液バッグ、または皮下注射針によって貫通可能なストッパーを有するバイアルであり得る)。また、容器は無菌アクセスポートも有し得る。
【0193】
パッケージングは、単位用量、バルクパッケージ(例えば、複数回用量パッケージ)、またはサブユニット用量であり得る。本開示のキットで供給される説明書は、典型的にはラベルまたは添付文書上の書面による説明書である。ラベルまたは添付文書は、医薬組成物が対象における疾患または障害を治療し、発症を遅らせ、および/または軽減するために使用されることを示す。
【0194】
キットは任意に、緩衝液および解釈情報などの追加成分を提供することができる。通常、キットは、容器と、容器上または容器に付随するラベルまたは添付文書とを含む。いくつかの実施形態では、本開示は、前記キットの内容物を含む製造品を提供する。キットの任意成分は、以下の1つ以上を含む:緩衝液成分、対照プラスミド、配列決定プライマー、細胞。
【0195】
キットはさらに、本発明のシステムまたは組成物を保持するためのデバイスを含むことができる。このデバイスは、点滴デバイス、静注用溶液バッグ、皮下注射針、バイアル、および/またはシリンジを含み得る。
【0196】
〔実施例〕
以下は、本発明の実施例であり、限定的に解釈されるものではない。
【0197】
本明細書に示され、添付の図に記載された実験結果は、可変のgRNAおよびタンパク質発現ベクターの大きなセットを採用した。棒グラフなどで示された結果は実験の数字が付されており、表1に提供される情報と連結している。この表は、同じ実験の数字IDについて、使用されたベクター(別名プラスミド)を記述する記号表を提供する。プラスミドの説明は表2にある。
【0198】
〔実施例1〕
〔ヒト細胞におけるCascadeベースの転写抑制活性〕
Tn6677によってコードされるTniQ-Cascade複合体は、RNA誘導DNA結合複合体であり、crRNA(別名ガイドRNA、1コピー)、Cas8(1コピー)、Cas7(6コピー)、Cas6(1コピー)およびTniQ(2コピー)を含む(Klompe et al., Nature 571, 219-225 (2019); Halpin-Healy et al., Nature 577, 271-274 (2020))。TniQサブユニットを含まないCascadeの精製能力、および規範的なI-F1 CRISPR-CasシステムからのI-F型Cascade(別名Csy複合体)に関するこれまでの研究に基づいて、TniQは、複合体の形成およびRNA誘導DNA標的化および結合に必須ではない。
【0199】
ヒト細胞におけるコレラ菌TniQ-CascadeのDNA結合活性をモニターするために、蛍光ベースの転写抑制アッセイが開発された。このアッセイは、eYFPレポーター遺伝子の上流にある最小CMVプロモーターへのRNA Pol IIのリクルートを阻害するか、あるいはeYFPレポータープラスミド上の最小CMVプロモーターの上流にクローニングされた上流活性化配列(UAS)へのGal4-VP16合成転写活性化因子の結合を阻害するプログラム可能なDNA結合タンパク質の能力に基づいていた(
図1A&1B)。対照実験では、適切なsgRNAによってプログラムされた化膿性連鎖球菌(S.pyogenes)dCas9は、eYFPレポータープラスミド、Gal4-VP16発現プラスミド、およびCas9-sgRNA発現プラスミドを有するHEK293T共遺伝子導入の際に、eYFP発現を90パーセント抑制することができる(Yeo et al., Nature Methods 15, 611-616 (2018); FIG. 1B)。
【0200】
VchINTEGRATE gRNAは、最小CMVプロモーター(gRNA-1およびgRNA-2)、またはeYFPレポーター構築物の上流のUAS(gRNA-3;
図1Aおよび1B)のいずれかを直接標的とするように設計された。注目すべきは、UASのタンデムアレイの性質のため、UAS特異的gRNA-3は全長UAS要素内に3つの同一の標的部位を有する。HEK293T細胞を、レポータープラスミド、ヒトU6プロモーターによって駆動されるVchINTEGRATE gRNA発現プラスミド、および適切に設計されたNLSタグを有するTniQ、Cas8、Cas7、およびCas6をコードする発現プラスミドで遺伝子導入すると、転写抑制の明らかな証拠が観察された(
図1B)。この抑制活性は、非標的化gRNAを用いた場合には見られなかった。TniQ、Cas8、Cas7、またはCas6をコードするプラスミドが省略された制御が完了し、Cas8、Cas7、またはCas6が省略された場合には、抑制活性は存在しなかった;TniQの不存在は、抑制活性を完全には消失させなかった(
図1B)。
【0201】
〔実施例2〕
〔ヒト細胞におけるCascadeおよびTniQ-Cascadeベースの転写活性化活性〕
QCascadeベースの活性化因子を遺伝子操作し、蛍光ベースのレポータープラスミドアッセイで転写活性化活性を試験した(
図2B)。mCherryレポーター遺伝子を最小CMVプロモーターの下流に配置し、基礎的なmCherry発現、ひいては細胞内のmCherry蛍光が最小になるようにした。合成転写因子が最小CMVプロモーターの上流領域にうまく結合すれば、RNAポリメラーゼIIの最小プロモーターへのリクルートが駆動され、その結果mCherry発現が大きく増加する。このレポーターアプローチは、VP64転写活性化因子に融合した化膿性連鎖球菌(S.pyogenes)からのヌクレアーゼ-デッドCas9(Mali et al., Nature Biotechnol 31, 833-838 (2013))、またはCas7サブユニットのC末端にVP64を融合したシュードモナス(Pseudomonas)種S-6-2由来のI-E型Cascade複合体(Cameron et al., Nat Biotechnol 37, 1471-1477 (2019)により記載される)のいずれかを用いて検証された。これらの実験は、適切に設計されたgRNAを用いてmCherry転写活性化が強固に観察され得ること、およびこの活性が非標的化gRNA対照では存在しないことを示した(
図2E)。
【0202】
コレラ菌TniQ-Cascade(単にQCascadeとも呼ばれる)について、転写活性化因子のパネルを作製した。活性化因子ドメインは、Cas8、Cas7、Cas6、TniQ、またはそれらの組み合わせに付加され得る(例えば、
図2Aを参照のこと)。VP64またはRPV(以前に記載されたVPR活性化因子の逆順で、VP64-p65-Rtaドメインを含む)のCas7のN末端への融合が、活性化因子融合の上流のNLSタグと共に生成された。同様の融合タンパク質を細菌のTniQ-Cascade発現プラスミド上に作製し、大腸菌中でRNA誘導DNA組込みを試験した。Cas7に融合した哺乳動物活性化ドメインの有無にかかわらず、効率的なDNA組込みが観察され(
図2C)、これらの融合体が、標的DNAに結合し、下流のトランスポザーゼ(例えば、TnsC)成分をリクルートするQCascadeの能力を損なわないことが示された。
【0203】
Cas7活性化因子融合体を哺乳動物発現ベクターのコンテクスト(context)において作製し、HEK293T細胞を、レポータープラスミド、mCherryおよび最小CMVプロモーターの上流領域を標的とするgRNA発現プラスミド(
図2B)、ならびにVP64-Cas7融合体、Cas8、Cas6、およびTniQをコードするタンパク質発現プラスミドで共導入した。フローサイトメトリーによってmCherry発現レベルを評価した後、VchINTEGRATE由来のQCascadeは、細胞内のmCherry蛍光レベルが162倍と大きく増加したことから、強力な転写活性化活性を示した(
図2Dおよび2E)。特定のgRNAは他のものよりも転写活性化においてより強力であり、転写活性化の頑健性において配列および/または位置に依存する効果が示唆された(
図2Eおよび表1)。VchINTEGRATE QCascadeによって介在されるRNA誘導転写活性化活性は、非標的化gRNAを用いると失われた。TniQ、Cas8、またはCas6をコードするプラスミドを省略した追加の制御では、Cas8またはCas6を省略した場合に、転写活性化活性が完全に消失することが決定された。TniQの不存在は、転写活性化を減少させたが、転写活性化を排除しなかった(
図2E)。
【0204】
タンパク質発現プラスミドは、SV40 NLSタグを双節型(BP)NLSタグに置き換えるように改変した。前述と同様の転写活性化実験を行ったところ、活性化のレベルは、単節型(SV40)NLSタグの代わりにBP NLSタグを用いた場合に、かなり高かった(
図2E;78-80の棒グラフを比較)。
【0205】
〔実施例3〕
〔ヒト細胞におけるTniQ-Cascadeベースの転写活性化活性およびTnsCベースの転写活性化活性〕
大腸菌Tn7トランスポゾンに関するこれまでの研究から、TnsCはAAA+ATPアーゼであり、glmS遺伝子中の保存された付着部位に結合するTniQファミリータンパク質であるTnsDと特異的な相互作用を持つことが示されている。TnsCはTnsAおよびTnsBに関与する調節因子タンパク質であり、実際に両タンパク質と特異的な相互作用を持ち、標的化モジュール(Tn7のTnsD)と切除/組込みモジュール(TnsAおよびTnsB)との相互作用の橋渡しをしていると考えられている。Tn6677由来のVchTnsCは、RNA誘導DNA組込み活性を媒介する。
【0206】
VchTnsCは単量体の状態で細菌から精製することができ、高イオン強度条件下(例えば、塩化ナトリウムなどの1Mの一価塩)でのみ可溶性を保つ。しかし、ATPまたはATPアナログの存在下では、VchTnsCは生理的緩衝液および塩条件下で可溶性を保つ安定なヘプタマー種を形成し、核酸基質の周囲で核形成すると予想されるリング状の構造を形成する(
図3A-3C)。さらに、TnsCは、陰性染色電子顕微鏡によって可視化されるように、特定の条件下でより大きな積層リングを形成することができる(
図3D)。大腸菌の実験では、VchTnsCはTniQ-Cascadeによって結合されたゲノム標的部位に特異的にリクルートされ、クロマチン免疫沈降実験と、続く次世代シークエンシング(ChIP-seq;
図3E)とによってアッセイされたように、優れたゲノムワイドな忠実性を有する。
【0207】
TniQ-CascadeおよびTnsCを使用することで、dCas9のような単一コピーのエフェクタータンパク質を使用して可能であるよりも、より強力かつダイナミックな範囲で下流への応用を可能にするかどうかを具体的に試験するために、Tn6677由来のTniQ-CascadeおよびTnsC成分を用いて合成転写活性化因子を構築した。
【0208】
コレラ菌TnsCをVP64転写活性化ドメインに融合し(
図4A)、HEK293T細胞を、前述のmCherryレポータープラスミド、gRNA発現プラスミド、およびCas8、Cas7、Cas6、TniQ、およびTnsC-VP64活性化因子をコードするタンパク質発現プラスミドと共導入した。これらの実験において、タンパク質成分は、NLSタグ、SV40 NLSタグ、双節型(BP)NLSタグ、またはそれらの組み合わせを有し得ない。gRNA依存的方法でTniQ-CascadeによってmCherryレポータープラスミドを標的にすると、安定な結合がもたらされ、それによって本質的にオリゴマーであるTnsCポリペプチドの多くのコピーが引き続いてリクルートされる(
図4Aおよび4B)。TnsCはVP64活性化因子ドメインに融合されているため、TnsCの複数コピーが局在部位にリクルートされると、多価性による遺伝子発現の強力で強固な活性化が引き起こされた。
【0209】
QCascadeのCas7サブユニットに融合したVP64、dCas9、またはCas7サブユニットのC末端に融合したVP64を有するシュードモナス(Pseudomonas)種S-6-2由来のI-E型Cascade複合体と比較した場合には、mCherry発現のはるかに大きな活性化が観察された(
図4C)。活性化は、最小CMVプロモーターの上流にマッチする配列を標的とするgRNAに依存し、TniQ発現プラスミドが省略されるか、非標的化gRNAが代わりに使用されると失われた(
図4C)。同様の実験をTnsA、TnsB、またはTnsAB
f発現プラスミドを含めて行ったところ、TnsAB
fを含めた場合には、転写活性化のレベルは約2倍増加し、TnsAB
fの存在が、QCascadeによってマークされた標的部位へのTnsCのリクルートを安定化および/または刺激することが示唆された(
図4D)。NLS、エピトープ(3xFLAG)、または2Aモチーフの異なる組み合わせは、転写活性化のレベルを変化させた(
図4C)。
【0210】
データは、Cas7についてSV40 NLSタグをBP NLSタグで置換すると、QCascade複合体形成および標的化に影響を及ぼし得ることを示唆した(
図2E)。複数のタンデムBP NLSタグ、および/またはNLSタグと3xFLAGエピトープタグとの組み合わせを含む、Cas7の追加の順列を試験した(
図5A)。前記と同じTnsC-VP64活性化アッセイを用いて、QCascade活性およびTnsC活性は、Cas7のみがSV40 NLSからBP NLSに切り替えられた場合に、実質的に増加し(バー105およびバー106を比較)、2x BP-NLSタグはTnsC転写活性化をわずかに増加させた。対照的に、より多くのBP-NLSタグの添加は、転写活性化の減少をもたらし、Cas7の発現および/または活性の負の効果を示唆した(
図5B)。
【0211】
Cas7発現プラスミドの相対濃度を、他の全ての成分と比較して順次増加させ、前述のTnsCベースの転写活性化アッセイを介してmCherry活性化の用量依存的増加をもたらした(
図6)。さらに、他のサブユニットの相対濃度を増加させることは、mCherry活性化における限定的な増加をもたらし、場合によっては、mCherry活性化が減少した(
図6)。場合によっては、dCas9-VPRで見られたよりも強いmCherry活性化が生じ、DNA結合QCascadeへのリクルート時に多価性を示すことから、転写活性化因子としてのTnsCの強力さが強調された。
【0212】
内因性遺伝子発現を転写的に誘導するTnsC-VP64の能力を、HEK293T細胞でプロファイリングした(
図10A)。TnsC-VP64、Cas8、Cas7、Cas6、およびTniQのタンパク質発現プラスミドを、内因性遺伝子TTN、MIAT、ASCL1、およびACTC1を標的とする3つまたは4つのcrRNA発現プラスミドと共に遺伝子導入した(
図10D)。標的遺伝子座の相対的遺伝子発現は、定量的逆転写PCR(RT-qPCR)によって測定した。TTN遺伝子座について、ゲノム活性化実験に含まれる対照条件は、全ての必要なタンパク質成分および非標的化crRNAをコードするプラスミド、全ての必要なタンパク質成分およびVP64ドメインを欠くTnsCをコードするプラスミド、ならびにTniQを除く全ての必要なタンパク質成分をコードするプラスミドの遺伝子導入を含む。非標的化条件と比較して、4つの別々のcrRNA発現プラスミドを受けた実験サンプルは、TTN発現が278倍増加したことを示した(
図10B)。TniQまたはTnsCに融合したVP64タグのいずれかを欠く条件では、強固な転写誘導は示されなかった。TnsC-VP64によるTTNの活性化は、dCas9-VP64による同じ遺伝子座での活性化を大きく上回り、dCas9-VPRと比較して同様の活性化を示した。このことは、ヒト細胞中のゲノム標的部位に多価でリクルートする結果としてのTnsCの強力さを強調している。同様に、転写活性化はプロファイリングされた他の3つのゲノム遺伝子座でも観察され、そのレベルはACTC1の35倍からASCL1の1290倍であった(
図10E)。
【0213】
TnsC-VP64ゲノム転写誘導を、crRNA発現プラスミド送達の機能としてプロファイリングした。HEK293T細胞を、全ての必要なタンパク質成分と、TTNを標的とする4つのcrRNA発現プラスミドを発現するプラスミド、または個々のcrRNAプラスミドと同じTTN領域を標的とする4つのスペーサー配列を含む未処理のCRISPRアレイを発現する1つのプラスミドのいずれかと、で遺伝子導入した(
図10C)。個々のcrRNAプラスミドおよびCRISPRアレイプラスミドの両方(以下、「多重化crRNA」プラスミドと称する)が強固なTTN発現誘導を示したが、多重化crRNAプラスミドはより高いレベルのTTN発現を示した。この研究は、Cas6が1つのCRISPRアレイから複数のcrRNAを処理することができ、目的の遺伝子内の複数の配列を標的とすること、または1つの細胞内で複数の異なる遺伝子を標的とするために1つの多重化crRNAプラスミドを使用することの両方を容易にするという有利なメカニズムを強調している。
【0214】
〔実施例4〕
〔TniQ-CascadeおよびTnsCベースのゲノム工学、エピゲノム工学、および染色体イメージング〕
QCascadeによるRNA誘導DNA標的化とそれに続くTnsCのリクルートとにより、Cas7およびTnsCの両方が高コピー局在化する(
図7A)。Cas7の場合には、I-F CRISPR-Casシステムの定型gRNAは、6コピーのCas7が存在することをもたらすが、gRNAはさらに大きなRループを形成するために拡張されることもある((Klompe et al., Nature 571, 219-225 (2019); Halpin-Healy, T. S. et al., Nature 577, 271-274 (2020); Songailiene, I. et al. Cell Rep 28, 3157-3166.e4 (2019))。その後の工程でリクルートされるTnsCコピーの正確な数は不明であるが、少なくとも7であろう。このように、前述の結果に基づいて、QCascadeおよびTnsCのうちの1つ以上のタンパク質成分のN末端またはC末端のいずれかにエフェクタードメインをテザー結合させることによって、様々な新規ゲノム工学ツールが構築される(
図7B)。
【0215】
一連の実施形態が、本明細書に記載されるシステムおよび方法に基づく、真核生物の転写活性化ツール(CRISPRa)、転写抑制ツール(CRISPRi)、塩基編集ツール(CBEおよびABE)、および染色体座イメージングツールを記載する
図7に示される。また、Cascadeの成分(例えば、Cas7)およびTnsCの両方に複数の異なるエフェクタードメインをコンビナトリアル付加することで、高コピーで存在する両方の融合タンパク質の相乗活性が、ただ1つのgRNAを使用して、高度に特異的に標的化された方法で、強力かつ耐久性のある変動をもたらすことも記載されている。
【0216】
同じアプローチが、相同CRISPR-トランスポゾンシステムに適用し得、I-F型(例えば、VchINTEGRATEに相同)、I-B型(例えば、AvCASTに相同;M. et al. Cell 184, 2441-2453.e18 (2021))、またはV-K型(例えば、相同ShoINTEGRATE;Vo, P. L. H. et al. Nat Biotechnol 359, eaan4672 (2020))のいずれかに由来し得る。相同I-F型システムおよびI-B型システムの場合には、
図7に記載されるのと同じ融合戦略が適用され得る;RNA誘導DNA標的化および組込みに必要なタンパク質成分に関して、これらのシステム間の唯一の実質的な相違点は、I-F型が天然のCas8-Cas5融合体(本明細書では、単にCas8と称される)をコードするのに対し、I-B型システムは別々のCas8およびCas5ポリペプチドをコードすることである。さらに、I-B型システムは、TnsA-TnsB融合ポリペプチドをコードする。V-K型システムからの成分が使用される実施形態では、エフェクター融合体は、依然としてTnsCを用いて生成され得、これは同様に存在し、複数コピーでゲノム標的部位にリクルートされる。あるいは、融合構築物はCas12kで生成されてもよく、またはコンビナトリアルエフェクター融合体は、Cas12kおよびTnsC、またはTniQおよびTnsC、またはCas12kおよびTniQ、またはCas12kおよびTniQおよびTnsCに対して作製される。
【0217】
Cascadeベースの転写活性化因子は、適切な核局在化シグナル(NLS)と共に、VP64をCas7のN末端に融合することによって構築され得る。記載されたVP64-TnsC融合体(
図2)に加えて、他の活性化ドメインの範囲が利用され得る(
図7C)。Cas7ベースの転写活性化因子は、Cascade複合体単独(例えば、TniQを欠く)のコンテクストにおいて、またはQCascade複合体のコンテクストにおいて使用され得る。gRNAの長さに応じて、6コピー以上でCas7を標的部位に多価リクルートすることで、単一のgRNAで標的に応答して強力な転写活性化をもたらす。
【0218】
転写活性化ドメインをTnsCのC末端に融合させることによっても、RNA誘導転写活性化因子を生成することができる。TnsC-VP64活性化因子について提供された広範なデータ(
図4-6)に加えて、TnsCは広範な代替活性化またはエピゲノム修飾ドメインと融合させることができる(
図7D)。NLSが含まれ(図には示されていない)、C末端、またはTnsCとエフェクタードメインとの間、または内部にコードされ得る。TnsCはQCascade複合体によってゲノム標的部位にリクルートされ、高い価数によって融合エフェクタードメインの強力な活性につながるように、複数コピーでリクルートされる(
図7D)。
【0219】
TnsCは、KRABドメインまたは他の抑制ドメインなどの転写抑制ドメインと融合していてもよい(
図7E)。NLSが含まれ(図には示していない)、C末端、またはTnsCとエフェクタードメインとの間、または内部にコードされ得る。TnsCはQCascade複合体によってゲノム標的部位にリクルートされ、高い原子価が強力な活性につながるように、複数コピーでリクルートされる(
図7E)。
【0220】
TnsCは染色体標識のために、GFPなどの蛍光タンパク質(FP)と融合させることもできる(
図7F)。NLSが含まれ(図には示されていない)、C末端、またはTnsCとFPドメインとの間、または内部にコードされ得る。TnsCはQCascade複合体によってゲノム標的部位にリクルートされ、複数コピーでリクルートされるため、ただ1つのgRNAによる標的化に応答して、高い価数によって同じ標的部位に複数の発色団が高シグナル対ノイズで局在する(
図7F)。
【0221】
Cas8またはCas7は、(Anzalone et al., Nat Biotechnol 38, 824-844 (2020)およびその中の参考文献)に記載されているように、塩基編集試薬に融合され得る(
図7G)。様々な融合は、32ヌクレオチドRループにわたる塩基編集の可変ウィンドウを可能にし、あるいは、異なる長さのスペーサーを含む修飾gRNAの場合には、より小さい/より大きいRループを可能にする。シトシン塩基編集因子(CBEs)の場合には、標的Cascade成分は、デアミナーゼドメインならびにウラシルグリコシラーゼインヒビタードメインの両方に融合されている。アデニン塩基編集因子(ABE)の場合には、標的Cascade成分は2つのタンデムTadAドメインに融合され、そのうちの1つはデオキシアデノシンを脱アミノ化するように進化している。Cas7-CBEおよびCas7-ABE塩基編集因子の場合には、Cascade複合体全体にCas7が複数コピーされているため、Rループの大きなウィンドウが強力な脱アミノ化に供される。Cascade塩基編集因子はまた、DNAの1本鎖をニックし、それによって最終産物の純度を改善するために、Cas9ニッカーゼ酵素と組み合わせることもできる。
【0222】
QCascadeおよびTnsCはまた、相乗的な応答を可能にするために、複数のエフェクタードメインを異なるタンパク質成分にコンビナトリアル融合する機会を提供する(
図7H-7J)。転写活性化ドメインは、TnsCおよびCas7の両方に同時に融合され得、ただ単一のgRNAによって誘導される、近接した同じ標的部位へのCas7エフェクターおよびTnsCエフェクターの両方の高コピーリクルートをもたらす(
図7H)。核局在化シグナル(NLS)タグは両タンパク質上にもコードされているが、図には示されていない。様々な活性化ドメインの組み合わせが可能であり、異なる転写活性化のレベルおよび強度をもたらす。相乗的な転写抑制を達成するために、抑制ドメインをTnsCおよびCas7の両方に組み合わせて融合させることもできる。一組の実施形態が
図7Iに示されており、KRABドメインが一方の成分に融合され、Dnmt3A-3Lドメインが他方の成分に融合されている。核局在化シグナル(NLS)タグは両融合タンパク質上に同様にコードされているが、図には示されていない。他のコンビナトリアル抑制ドメインも可能である。単一のgRNAがTnsCおよびCas7の両方の複数コピーの標的動員および結合をもたらすように、TnsCおよびCas7を異なる蛍光タンパク質(FP)に融合させることによって、高いシグナル対ノイズの染色体座DNAイメージング試薬が生成され得る(
図7J)。これは2つのスペクトル的に異なるFPの共局在化をもたらすため、両方のFPからのシグナルを示す病巣のみをスクリーニングすることによって、バックグラウンドの細胞蛍光をより容易に識別することができる。他の実施形態では、TnsCおよびCas7は、エネルギー移動および異なる波長での蛍光が高いシグナル対ノイズ座イメージングをもたらすように、FRETを受け得るFPに代わりに融合される。
【0223】
前述のゲノム変動試薬はまた、エフェクタードメインを前述の同じCas8、Cas7、および/またはTnsCサブユニットに融合することによって、I-B型CRISPR-トランスポゾンシステムを使用して生成され得る。この戦略はまた、
図7H~7Jに概説されたコンビナトリアルエフェクター戦略にも適用される。
【0224】
前述のゲノム変動試薬はまた、エフェクタードメインをCas12k、TniQ、および/またはTnsCサブユニットに融合させることによって、V-K型CRISPR-トランスポゾンシステムを使用して生成され得る。この戦略はまた、
図7H~7Jに概説されたコンビナトリアルエフェクター戦略にも適用されるが、V-K型CRISPR-Casシステムには、Cascadeの複数コピーCas7サブユニットに相当するものは存在せず;Cas12kの単一分子のみがsgRNAと共に標的DNA結合に関与する。
【0225】
〔実施例5〕
〔代替ガイドRNA発現ベクター〕
CRISPR-Casシステムをゲノム編集に利用するための規範的なアプローチ(CRISPR-Cas9法の大部分を含む)は、RNAポリメラーゼIII U6プロモーターの下流にガイドRNAをコードする。VchINTEGRATEなどのCRISPR-Casトランスポゾンシステムのコンテクスト内では、ミニ-トランスポゾンドナーDNAとは別のプラスミド上でガイドRNAを発現させると、先に述べたように、自己標的化のリスクが生じる(Vo et al., Nature Biotechnology 39, 480-489 (2021))。自己標的化は、選択された発現ベクターのプールを不活性化することによってシステム全体の効率を低下させる可能性があり、また望ましくない組込み事象を引き起こす可能性もある。これを避けるために、ミニ-トランスポゾンドナーそれ自体のすぐ隣のRNAポリメラーゼIII U6プロモーターの下流にガイドRNAをコードする新しいドナーDNAプラスミド(pDonor)を設計した(
図8A)。このアプローチは、CRISPRアレイを「特権化」し、自己標的化を防ぐ標的免疫の自然なメカニズムを活用し、意図したゲノム標的部位への適切なRNA誘導DNA組込みをもたらす。この戦略を哺乳動物細胞でも同様に採用できるか否かを調べるために、TnsC-BP-VP64融合タンパク質を用いた転写活性化アッセイのコンテクストにおいてgRNAの機能を試験した。pDonor上にコードされたgRNAをターゲットにすると、pDonorとは別のプラスミド上にコードされた全く同じgRNAとほぼ区別できないレベルの転写活性化に至った。
【0226】
VchINTEGRATEタンパク質成分およびガイドRNAの両方が、RNA Pol II プロモーターによって制御された同じRNA分子上に、一種のポリシストロニック構築物としてコードされたベクターが設計された。この戦略は、完全なINTEGRATEシステムを再構築するために遺伝子導入に必要な別々のプラスミドの数を減らし、また核内輸送に先立ち、タンパク質成分が最初に発現し局在化する細胞質へgRNAを輸送することによって、細胞質TniQ-Cascade複合体の形成を促進した(
図9A)。TniQ-Cascadeを細胞質でアセンブリーすることで、全ての単一のタンパク質サブユニットにNLSタグを配置する必要もなくなった。なぜなら、マルチサブユニットTniQ-Cascade複合体上の選択された数個のNLSタグがあれば、複合体全体が効率的に核に輸送されるのに十分だからである。ポリAテールを欠くmRNA転写産物を安定化することが以前に示された、MALAT1遺伝子座からの110bpフラグメント(Nissim et al., Mol Cell 54, 698-710 (2014))を設計し、目的の遺伝子の下流、停止コドンとCRISPRアレイとの間にコードした。この状況では、CRISPRアレイは3’-UTR内に見出された。pre-crRNAのCas6プロセシングは、融合mRNA-crRNA種の切断につながるが、ポリ(A)タグが転写産物の残りの部分から切断されると、三重鎖構造がタンパク質をコードするmRNAを3’エキソヌクレアーゼベースの分解から保護する。MALAT1三重鎖配列およびCRISPRアレイが、BP NLSタグ付きCas6またはCas7のいずれかの3’UTR内にコードされた2つの構築物が設計され、RNA誘導DNA標的化および合成転写活性化のために機能するこれらの改変されたgRNA発現カセットの能力が、TnsC-BP-VP64活性化因子を用いて測定された(
図9B)。これらの代替的gRNA発現状況は、Pol III転写産物上のgRNAをコードする別個のプラスミドと比較して、わずかに効率が低下するものの、転写活性化のために機能的であった(
図9C)。CRISPRアレイは、蛍光レポータータンパク質遺伝子の薬剤耐性など、他の3’-UTR内に配置することができ、細胞質におけるTniQ-Cascadeの形成を最適化するために、タンパク質機構をさらに改変することができる。
【0227】
【0228】
【0229】
本発明の範囲は、本明細書で具体的に示され説明されたものによって限定されるものではない。当業者であれば、図示した材料、構成、構造、および寸法の例に代わる好適なものが存在することを認識するであろう。本明細書に記載されたものの変形、修正、および他の実施態様は、本発明の精神および範囲から逸脱することなく、当業者に生じるであろう。
【0230】
本発明の説明では、特許および様々な刊行物を含む多数の文献を引用し、考察する。このような文献の引用および考察は、単に本発明の説明を明確にするために提供されるものであり、いかなる文献も本明細書に記載される発明の先行技術であることを認めるものではない。本明細書において引用され、考察されている全ての文献は、参照によってその全体が本明細書に組込まれる。
【図面の簡単な説明】
【0231】
【
図1】
図1Aおよび1Bは、TniQ-Cascadeベースの転写抑制因子の開発を示す。
図1Aは、転写抑制設計の概略図である。Gal4-VP16ポリペプチドと上流活性化因子配列(UAS)との結合は、RNAポリメラーゼIIのリクルートを引き起こし、eYFPの転写を駆動する。QCascadeと適切なgRNAとを共導入すると、競合的結合によってGal4-VP16のリクルートを阻害するか(gRNA-3)、あるいは最小CMVプロモーターへの競合的結合によってRNA Pol IIのリクルートを直接阻害するか(gRNA-1およびgRNA-2)のいずれかによって、eYFP転写が競合的に阻害される。いずれの場合も、結合に成功するとeYFPの転写および発現が低下する。
図1Bは、レポータープラスミドおよび様々なTniQ-Cascade発現ベクター成分を、様々なNLS(例えば、双節型-NLS、またはBP;SV40-NLS、またはSV40)融合体を用いて、または用いずに共遺伝子導入した際の、eYFP平均蛍光強度(MFI)のグラフである。いくつかの対照実験では、タンパク質成分は意図的に省略した。
図1B内の各々のバーの上の数字は、表1に記載された情報に対応する実験識別子を表す。
【
図2】
図2A~2Eは、TniQ-Cascadeベースの転写活性化因子の開発を示す。
図2Aは、pcDNA3.1-誘導体発現ベクター内の代表的なCas8-活性化因子構築物またはCas7-活性化因子構築物の例示的なプラスミド設計である。様々な活性化因子ドメインのうちの1つが、1つ以上のCas8またはTnsタンパク質のN末端またはC末端(または両方)のいずれかに融合され得る。
図2Bは、転写活性化アッセイの概略図である。レポータープラスミドは、最小CMVプロモーター、mCherryカセット、および5’CC PAMを有する上流32塩基対標的配列を含む。単独で遺伝子導入すると、レポーターはmCherryを最小発現する。Cas8またはCas7のいずれかに融合した活性化因子とQCascadeタンパク質成分を発現するプラスミドとを、レポータープラスミドを標的とするgRNAをコードするプラスミドと共に共遺伝子導入すると、QCascadeは発現し、複合体化し、次いでレポータープラスミド標的配列を標的とすることができ、転写活性化、RNA Pol IIのリクルート、およびmCherry発現レベルの上昇をもたらし、これはフローサイトメトリーによって定量される。
図2Cは、Cas8およびCas7への様々な活性化因子融合体を用いたVchINTEGRATEの大腸菌組込み効率のグラフである。RPVは、Rta-P65-VP64を含む三者活性化因子融合構築物を指す。これらの結果は、Cas7のN末端へのVP64およびRPV融合体がDNA組込み活性に悪影響を及ぼさないことを示している。組込み効率は、tRLおよびtLR配向産物の両方について示される。
図2Dは、様々なQCascade構築物を用いた転写活性化実験について、非標的化(NT)対照(バー69)に対するmCherry MFIを示す棒グラフである。活性化は、標的化(T)gRNAおよびVP64-Cas7融合タンパク質を用いて達成される。SV40は、SV40 NLSタグを指す。
図2Eは、様々なCRISPRシステム、および様々なタグ付きバージョンのQCascadeタンパク質成分を用いた転写活性化実験における、非標的化(NT)gRNAに対するmCherry MFIを示す棒グラフである。特に、VchINTEGRATE QCascade複合体を用いた転写活性化は、全てのタンパク質成分が、単節型SV40 NLSタグとは対照的に、双節型NLS(BP)タグを含む場合に、顕著により高い(バー78~80を比較)。活性化は、非標的化gRNAを用いた対照実験において、または、Cas6もしくはCas8を除去した場合に排除される。化膿性連鎖球菌(S.pyogenes)dCas9(II-A型)およびシュードモナス(Pseudomonas)S-6-2 Cascade(I-E型)との比較を示す。
図2C~2E内の各々のバーの上の数字は、表1に記載された情報に対応する実験識別子を表す。
【
図3】
図3A~3Eは、TnsCがTniQ-CascadeによってDNAに特異的にリクルートされるオリゴマー複合体を形成することを示している。
図3A(下)は、ATPの存在下で大きな分子量種を形成するVchTnsC(Tn6677由来;VchINTEGRATE)のSuperdex 200カラムでのサイズ排除クロマトグラフィー(SEC)のクロマトグラムであり;標準物質(右)との比較は、ヘプタマー配列(予測分子量、MW=268kDa)と一致する分子量を示す。
図3A(上)は、反応中のATPを含むSECランからのタンパク質画分を示す上流のSDS-PAGEゲルである。
図3Bは、生の低温電子顕微鏡(cryoEM)の顕微鏡写真(右)およびTnsC・ATPの参照なしの2Dクラス平均(左)であり、中央孔を有する7つのスポークリングを明らかにした。
図3Cは、TnsC・ATPヘプタマーの予備的な3次元再構築の直交図であり、下に寸法を示す。中央孔は、モデル化した二本鎖DNA(dsDNA、右)の寸法に完全に対応している。
図3Dは、TnsC・ATPを低塩に溶かしたcryoEMデータであり、より大きなフィラメント集合体の存在を明示している。
図3Eは、クロマチン免疫沈降と続く次世代シークエンシング(ChIP-seq)によってアッセイした、VchTnsCが大腸菌のゲノム標的部位に極めて高いゲノムワイド特異性で結合することを示している。細胞は、VchINTEGRATEおよびドナーDNAからの全てのタンパク質成分と共に、赤い三角形で示した領域(lacZに見られる標的-4)を標的とするgRNAを発現した。VchCas8(上)またはVchTnsC(下)のいずれかは、3xFLAGタグを含んでいた。細胞を架橋し、溶解液を超音波処理してDNAをせん断し、タンパク質-DNA架橋種をChIPによって単離し、次いでNGSライブラリー調製およびディープシークエンシングを行った。これらの実験から、標的化gRNAおよび全てのTniQ-Cascade成分の存在に依存するメカニズムにおいて、TnsCによる極めて高い特異性の標的結合が示されている。
【
図4】
図4A~4Dは、TnsC-活性化因子融合タンパク質をTniQ-Cascadeと組み合わせて、強力で高効率の合成転写活性化を行うことができることを示している。
図4Aは、pcDNA3.1-誘導体発現ベクター内のTnsC-VP64構築物の例示的なプラスミド設計である。Tn6677由来のVchTnsC(VchINTEGRATE)は、NLSタグおよびVp64-ドメインに融合される。
図4Bは転写活性化アッセイの概略図である。単独で遺伝子導入した場合には、
図2に記載のmCherryレポーターは、最小限のCMVプロモーターによって制御されるため、mCherryを最小限に発現する。QCascadeと、TnsC-VP64と、レポータープラスミド上に存在する標的を認識するgRNAとを発現するプラスミドを共遺伝子導入すると、QCascade(青色の楕円)は標的配列に結合し、TnsC-VP64(薄いオレンジ色の楕円)をリクルートし、mCherryの発現レベルの上昇につながる。TnsC-VP64の3つのコピーは、TnsCのリクルートのオリゴマー性を示すために単純化して示されており;細胞内の標的部位にリクルートされるTnsCタンパク質の実際の数は、かなり多くなり得る。
図4Cは、様々なCRISPR-Cas成分システム、および様々なタグ付きバージョンのTniQ-CascadeおよびTnsC成分を有するmCherry活性化を示す棒グラフである。データはフローサイトメトリーで測定し、細胞内のmCherry平均蛍光強度(MFI)を、下部に示した各々のシステムの非標的化gRNA対照に対してプロットした。dCas9は、化膿性連鎖球菌(S.pyogenes)由来であり;「Psp S-6-2」は、シュードモナス(Pseudomonas)種からのI-E型Cascadeを指し;Vchは、Tn6677由来のVchINTEGRATEを指す。右側に見られるように、BPおよびVP64に融合したTnsCの存在は、BPタグのついたQCascade成分と結合すると、強力な転写活性化につながる。この活性化は、VP64ドメインを除去した場合に(バー94)、かつ、TniQを省略した場合に(バー95)失われる。追加の順列を棒グラフの下のテキストに示し、ラベルを付した。
図4Dは、TnsA、TnsB、またはTnsAB
fの存在下で測定した、TnsC-VP64融合タンパク質を介したmCherry活性化を示す棒グラフである。データは
図4Cと同様に示され、非標的化(NT)対照に対する相対値でプロットされている。TnsAB
fは、TniQ-CascadeおよびTnsC-BP-VP64活性化因子と共に、転写活性化のレベルを高めた。
図4Cおよび4D内の各々のバーの上の数字は、表1に記載された情報に対応する実験識別子を表す。
【
図5】
図5Aおよび5Bは、核内輸送およびQCascadeのアセンブリーおよび活性に関するVchCas7変異体を示す。
図5Aは、pcDNA3.1由来の発現ベクター内で生成され、試験された様々な例示的構築物の概略図である。VchCas7(VchINTEGRATE由来)は、CMVプロモーターの下流にクローニングされ、1つ以上のSV40タグまたはBP NLSタグを含み、任意で3xFLAGタグを含む。
図5Bは、
図5Aに記載の異なるCas7変異体を用いたQCascadeおよびTnsC転写活性化データを示す棒グラフである。TnsC活性化実験は、
図4に記載されるように実施および分析され、バー番号104の非標的化gRNAデータに対して正規化される。
図5B内の各々のバーの上の数字は、表1に記載された情報に対応する実験識別子を表す。
【
図6】
図6は、TnsC-VP64発現プラスミドに対するQCascadeおよびgRNA発現プラスミドの異なる比率を用いた、TnsC-媒介転写活性化データを示す棒グラフである。TnsC-VP64活性化実験は、
図4に記載したように設計および実施し、細胞mCherry MFIをフローサイトメトリーによって測定し、非標的(NT)との相対値でプロットした。プラスミド量は各々の遺伝子導入のTnsC-VP64プラスミド量に対する相対値で示し、データはVPRに融合した化膿性連鎖球菌(S.pyogenes)dCas9の転写活性化レベルと比較する。これらのデータは、Cas8発現プラスミドの量が増加すると、QCascadeおよびTnsCの活性化レベルがdCas9-VPRのそれを上回ることを示しており、この因子が他の実験において制限的であったことを示している。各々のバーの上の数字は、表1に記載された情報に対応する実験識別子を表す。
【
図7】
図7A~7Jは、転写抑制、転写活性化、エピゲノム編集、塩基編集、染色体DNAイメージング、およびコンビナトリアルエフェクター送達のためにQCascadeおよびTnsCを利用するための例示的な方法の概略図である。
図7Aは、TniQ-Cascade(別名QCascade)複合体によるRNA誘導標的DNA結合と、それに続くAAA+ATPアーゼであるTnsCのリクルートの可能なメカニズムの概略図である。上図では、PAMを黄色、ならびに標的DNA鎖を栗色で示す。標的DNA結合はRループの形成を伴い、QCascade複合体はgRNA(別名crRNA)、Cas8の1コピー、Cas7の6コピー、Cas6の1コピー、およびTniQの2コピーを含む。gRNAのスペーサー配列は32ヌクレオチド長であるが、代替長スペーサーも使用され得、RNA誘導DNA標的化および組込みを保持する((Klompe et al., Nature 571, 219-225 (2019); Songailiene, I. et al. Cell Rep 28, 3157-3166.e4 (2019))。QCascadeは標的DNA上に構造的なスキャフォールドを形成し、TnsCの複数コピーのリクルートをもたらす。このことは、続くTnsAおよびTnsBによって結合されたドナーDNAのリクルートをもたらし、最終的に標的組込みをもたらす(三角形)。リクルートされるTnsサブユニットの正確な数は知られていないが、1よりはるかに大きいことに注意されたい。代表的な経路は、I-F型CRISPR-トランスポゾンシステム(例えば、VchINTEGRATE)について示されており、Cas8タンパク質(I-F型では天然のCas8-Cas5融合体)がCas5の別の分子によって結合されるI-B型システムにも適用可能である。V-K型CRISPR-トランスポゾンシステムにおける経路は類似しているが、Rループ形成は、Cas12kとデュアルガイドRNA(または遺伝子操作されたシングルガイドRNA、sgRNA)との結合によって駆動される。
図7Bは、TniQ-CascadeおよびTnsCを含む異なるタンパク質サブユニットのN末端および/またはC末端のうちの1つ以上を、新規ゲノム変動試薬(perturbation reagents)の生成のために、所望のエフェクタードメインに融合され得ることを示す。様々な実施形態では、これらは、転写活性化因子;転写抑制因子;エピゲノム修飾試薬;DNAメチル化または脱アミノ化試薬;蛍光タンパク質;代替スキャフォールディングタンパク質;ヒストン修飾酵素;ヌクレアーゼ酵素;などを含み得る。核局在化シグナル(NLS)もまた、効率的な核輸送を指示するために、エフェクター融合設計のために含まれるが、これらは示されていない。他の実施形態では、Cascade成分は、複合体全体が細胞質で形成された後に核に輸送されるため、全てのタンパク質成分がそれ自身のNLSを含むわけではない。
図7Cは、Cascade複合体、および1つ以上の転写活性化ドメインのCas7のN末端もしくはC末端のいずれか、または両方の末端への融合を中心に構築された転写活性化因子の概略図である。様々な活性化因子構築物の代表的なドメイン概略図を上に示す。Cas7はDNA-結合Cascade複合体中、複数コピーで存在するため(32ヌクレオチドスペーサーでは6コピー)、活性化ドメインは標的部位で高い価数で表示され、強固な転写活性化につながる。これらのCascade活性化因子はTniQを含んでもよく(右下)、あるいはTniQを含まないCas8-Cas7-Cas6タンパク質成分のみを使用してもよい(左下)。核局在化シグナル(NLS)もまた、効率的な核輸送を指示するために、エフェクター融合設計のために含まれるが、これらは示されていない。他の実施形態では、Cascade成分は、複合体全体が細胞質で形成された後に核に輸送されるため、全てのタンパク質成分がそれ自身のNLSを含むわけではない。
図7Dは、活性化ドメインをTnsCのC末端に融合させることによって、AAA+ATPアーゼの周りに構築された転写活性化因子の概略図である。様々な活性化ドメインを異なる実施形態で用いてもよいし、複数のエフェクタードメインを一緒に融合してもよい。TnsCは、TniQ-依存的融合で、標的-結合QCascade複合体を介してDNAにリクルートされ、複数コピーでリクルートされるため、活性化ドメインは標的部位で高い価数で表示され、強固な転写活性化につながる。他の実施形態では、V-K型CRISPR-トランスポゾンシステムからのTnsCを用いて同様のTnsC融合体が構築され、それによって標的DNAはCas12kおよびgRNAによって媒介され、同様のTniQ-依存的TnsCリクルート経路をもたらす。核局在化シグナル(NLS)もまた、効率的な核輸送を指示するために、エフェクター融合設計のために含まれるが、これらは示されていない。
図7Eは、Cas8、Cas7、またはCas6(図示せず)、またはTnsCのC末端(図示)のいずれかに抑制ドメインを融合することによって構築された転写抑制因子の概略図である。抑制ドメインは、KRABドメイン、またはヒストンメチル化酵素などの他のヒストン修飾ドメイン、またはDNAメチル基転位酵素などの他のDNA修飾ドメインであってもよい。QCascadeが結合した標的DNAへのTnsCの多価リクルートは、遺伝子調節の強力な抑制につながる。核局在化シグナル(NLS)もまた、効率的な核輸送を指示するために、エフェクター融合設計のために含まれるが、これらは示されていない。
図7Bは、Cas7(図示せず)またはTnsC(図示)のいずれかを、GFPまたは別の蛍光タンパク質(FP)に融合することによって、高シグナル対ノイズの染色体座イメージングを行うためのQCascadeおよびTnsCの概略図である。Cas7およびTnsCの両方が複数コピーで標的DNAにリクルートされるため、単一のgRNAで複数コピーのFP融合タンパク質がリクルートされ、標的部位での高い蛍光シグナルをもたらす。核局在化シグナル(NLS)もまた、効率的な核輸送を指示するために、エフェクター融合設計用に含まれるが、これらは示されていない。
図7Gは、シチジンデアミナーゼ(Cyt.デアミナーゼ;Cyt.deam.)またはアデニンデアミナーゼ(2xTadA)ドメインのいずれかを、CascadeのCas8またはCas7サブユニットのいずれかに融合することによる塩基編集の構築の概略図である。シチジンデアミナーゼドメインは、これまでに記載されたように、2つのタンデムウラシルグリコシラーゼインヒビタードメインと組み合わされる(Doman, J. L. et al. Nat Biotechnol 38, 620-628 (2020); and references therein)。Cas8またはCas7への融合は、複数の異なる配置で起こり得、塩基編集活性の可変ウィンドウをもたらし、様々な所望の編集結果のために適用され得る。2xTadAエフェクターは、Cas7のN末端またはC末端のいずれかに融合され得る。これらの編集試薬は、QCascade複合体の全ての成分と共に用いてもよいし、Cascade複合体の成分のみを用いてもよい(例えば、TniQを省略する)。核局在化シグナル(NLS)はまた、効率的な核輸送を指示するために、エフェクター融合設計用に含まれるが、これらは示されていない。他の実施形態では、Cascade成分は、複合体全体が細胞質で形成された後に核に輸送されるので、全てのタンパク質成分がそれ自身のNLSを含むわけではない。
図7Hは、TnsCおよびCas7サブユニットの両方へのエフェクタードメインのコンビナトリアル付加によって同時に生成される強力な転写活性化因子の概略図である。TnsCおよびCas7が示されたエフェクタードメインに融合された、4つの実施形態が左側に示されている。この構造は、Cas6、Cas8、TniQ、およびgRNAと組み合わされると、gRNAによって指定された単一の標的部位への複数の異なるエフェクタードメインの標的化されたリクルートをもたらし(右)、高活性の相乗的転写活性化をもたらす。他の実施形態では、N末端の代わりにCas7のC末端へのエフェクター融合を含む、他のエフェクタードメインの組み合わせが試験される。核局在化シグナル(NLS)もまた、効率的な核輸送を指示するために、エフェクター融合設計のために含まれるが、これらは示されていない。他の実施形態では、Cascade成分は、複合体全体が細胞質で形成された後に核に輸送されるので、全てのタンパク質成分がそれ自身のNLSを含むわけではない。
図7Iは、TnsCおよびCas7の両方への複数のエフェクタードメインのコンビナトリアル融合によって生成される強力な転写抑制因子およびエピゲノム編集因子の概略図である。一実施形態では、これらは、CRISPRoff試薬で使用されるKRABおよびDnmt3A/3Lドメインを含む(Nunez, J. K. et al. Cell 184, 2503-2519.e17 (2021))。他の実施形態では、追加のエフェクタードメインが使用される。単一のgRNAによって誘導される、標的部位へのCas7およびTnsCの両方の多価のリクルートは、関連する抑制因子またはエピゲノム修飾ドメインの強力かつ耐久性のあるリクルートをもたらす。核局在化シグナル(NLS)もまた、効率的な核輸送を指示するために、エフェクター融合設計用に含まれるが、これらは示されていない。他の実施形態では、Cascade成分は、複合体全体が細胞質で形成された後に核に輸送されるため、全てのタンパク質成分がそれ自身のNLSを含むわけではない。
図7Jは、TnsCおよびCas7の両方に対する複数のスペクトル的に異なる蛍光タンパク質(FP)のコンビナトリアル融合によって構築された高シグナル対ノイズDNA標識/イメージング試薬の概略図であり;GFPおよびRFP融合体が、提供された例(左および右)に示されている。単一のgRNAが両タンパク質の複数コピーを同じゲノム標的部位に局在化させるため、二色標識は単一色のみのイメージング試薬と比較してより高いシグナル対ノイズをもたらし、標識特異性の内部検証を可能にする。他の実施形態では、FRETペアが使用されるので、タンパク質がエネルギーを伝達し、細胞質および核内の自由に拡散する分子と比較して、標的部位で共局在化したTnsCタンパク質とCas7タンパク質との識別がさらに可能になり、それによってバックグラウンドが減少する。核局在化シグナル(NLS)もまた、効率的な核輸送を指示するために、エフェクター融合設計のために含まれるが、これらは示されていない。他の実施形態では、Cascade成分は、複合体全体が細胞質で形成された後に核に輸送されるため、全てのタンパク質成分がそれ自身のNLSを含むわけではない。
【
図8】
図8Aおよび8Bは、改変されたgRNA発現カセットが強力なRNA誘導DNA標的化活性を保持していることを示している。
図8Aは、ヒトU6プロモーターによって制御されるリピート-スペーサー-リピートアレイとしてgRNAをコードする別のプラスミド、およびCRISPRアレイ発現カセットがミニ-トランスポゾンのすぐ下流に配置される改変されたpDonorプラスミド(下)を採用する例示的な初期gRNA発現戦略の概略図(上)である。
図8Bは、改変されたgRNA発現プラスミドを用いたQCascadeおよびTnsC-VP64転写活性化のグラフであり、gRNAはpDonor自体にコードされている。相対的なmCherry MFI(非標的対照に対して正規化)によって測定される活性化のレベルは、初期gRNA発現戦略(
図8A、上)と、gRNAがpDonor上にコードされる改変戦略(
図8A、下)との間でほぼ区別できない。
図8Bの各々のバーの上の数字は、表1に記載された情報に対応する実験識別子を表す。
【
図9】
図9A~9Cは、VchINTEGRATEのためのガイドRNAのRNAポリメラーゼIIベースの発現を示す。
図9Aは、gRNAを発現させる異なる方法の概略図である。CRISPRアレイ(リピート-スペーサー-リピート)は、RNA Pol IIIプロモーター(例えば、ヒトU6)上に規範的にコードされるので、新生転写産物は主に核内に留まる。しかし、RNA Pol II転写産物の3’-UTR内にコードされることもあり、MALAT1三重鎖などの機能を利用して、切断後に上流のタンパク質-コード転写産物を安定化させることもできる。切断は、CascadeのCas6リボヌクレアーゼサブユニットによるリピート-スペーサー-リピート処理の際に起こる。
図9Bは、pcDNA3.1-誘導体発現ベクター内で生成され、試験された様々な構築物の概略図である。MALAT1三重鎖およびCRISPRアレイを、VchCas6またはVchCas7のいずれかの3’-UTRに挿入した。
図8Cは、
図9Bに記載の構築物を用いた転写活性化データを示す棒グラフである。これらの結果は、Pol IIにコードされたgRNAが、RNA誘導DNA標的化およびTnsCベースの活性化に対して機能的であり、バックグラウンド(ここでは非標的化gRNA対照として定義される)より上であることを実証している。
図9Cの各々のバーの上の数字は、表1に記載の情報に対応する実験識別子を表す。
【
図10】
図10Aは、TnsC-VP64転写活性化の例示的な概略図である。
図10Bは、定量的逆転写PCR(RT-qPCR)を介したTTNの相対的遺伝子発現によって測定される正規化活性化のグラフである。
図10Cは、4つの例示的な個々のcrRNA発現プラスミド、または個々のcrRNAプラスミドと同じ領域を標的とする4つのスペーサー配列を含む未処理のCRISPRアレイを発現する1つのプラスミドの概略図である。
図10Dは、内因性遺伝子TTN、MIAT、ASCL1、およびACTC1を標的とするcrRNA発現プラスミドの概略図である。
図10Eは、3つの追加のゲノム遺伝子座、MIAT、ASCL1、およびACTC1について観察された正規化活性化のグラフである。
【配列表】
【国際調査報告】