(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-08-06
(45)【発行日】2024-08-15
(54)【発明の名称】標的ゲノム修飾を増強するためのプログラム可能なDNA結合タンパク質の使用
(51)【国際特許分類】
C12N 15/09 20060101AFI20240807BHJP
C12N 15/55 20060101ALI20240807BHJP
C12N 15/113 20100101ALI20240807BHJP
C12N 9/16 20060101ALN20240807BHJP
【FI】
C12N15/09 110
C12N15/55 ZNA
C12N15/113
C12N9/16
【外国語出願】
(21)【出願番号】P 2023012725
(22)【出願日】2023-01-31
(62)【分割の表示】P 2021076124の分割
【原出願日】2017-02-20
【審査請求日】2023-03-01
(32)【優先日】2016-06-02
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2016-07-05
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】311016949
【氏名又は名称】シグマ-アルドリッチ・カンパニー・リミテッド・ライアビリティ・カンパニー
【氏名又は名称原語表記】Sigma-Aldrich Co. LLC
(74)【代理人】
【識別番号】100145403
【氏名又は名称】山尾 憲人
(74)【代理人】
【識別番号】100122301
【氏名又は名称】冨田 憲史
(74)【代理人】
【識別番号】100170520
【氏名又は名称】笹倉 真奈美
(72)【発明者】
【氏名】フーチアン・チェン
【審査官】中野 あい
(56)【参考文献】
【文献】国際公開第2014/197568(WO,A2)
【文献】国際公開第2014/144288(WO,A1)
【文献】特表2007-501626(JP,A)
【文献】特表2009-528816(JP,A)
【文献】特表2002-534104(JP,A)
【文献】国際公開第2015/127439(WO,A1)
【文献】Cell (2013) vol.155, issue 7, p.1479-1491
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00-15/90
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
PubMed
(57)【特許請求の範囲】
【請求項1】
(a)プログラム可能なDNA修飾タンパク質またはプログラム可能なDNA修飾タンパク質をコードする核酸、ここで、プログラム可能なDNA修飾タンパク質が、RNAにガイドされたクラスター化した規則的に間隔が空いている短い回文配列リピート(CRISPR)ヌクレアーゼシステムである;
(b)少なくとも1つのプログラム可能なDNA結合タンパク質または少なくとも1つのプログラム可能なDNA結合タンパク質をコードする核酸、ここで、少なくとも1つのプログラム可能なDNA結合タンパク質が、ヌクレアーゼ活性を有さないCRISPRシステムである;および
(c)ドナー配列を含むドナーポリヌクレオチド、
を含む、組成物であって、
各CRISPRシステムがCRISPRタンパク質およびガイドRNAを含む;
プログラム可能なDNA修飾タンパク質が、標的染色体配列を標的とし、少なくとも1つのプログラム可能なDNA結合タンパク質の各々が、標的染色体配列の一方の側の約250塩基対以内の部位を標的とする;および
各CRISPRタンパク質が、II型CRISPRタンパク質またはV型CRISPRタンパク質である、
組成物。
【請求項2】
少なくとも1つのプログラム可能なDNA結合タンパク質が、標的染色体配列の一方の側の約100塩基対以内の部位を標的とする、請求項1に記載の組成物。
【請求項3】
少なくとも1つのプログラム可能なDNA結合タンパク質が、標的染色体配列の一方の側の約75塩基対以内の部位を標的とする、請求項2に記載の組成物。
【請求項4】
少なくとも1つのプログラム可能なDNA結合タンパク質が、標的染色体配列の一方の側の約50塩基対以内の部位を標的とする、請求項3に記載の組成物。
【請求項5】
少なくとも1つのプログラム可能なDNA結合タンパク質が、標的染色体配列の一方の側の約25塩基対以内の部位を標的とする、請求項4に記載の組成物。
【請求項6】
ヌクレアーゼ活性を有さないCRISPRシステムが、触媒不活性なCRISPRタンパク質である、請求項1~5のいずれか一項に記載の組成物。
【請求項7】
各CRISPRタンパク質をコードする核酸がmRNAまたはDNAである、請求項1~6のいずれか一項に記載の組成物。
【請求項8】
各CRISPRタンパク質をコードする核酸および/または各ガイドRNAをコードする核酸がプラスミドベクターの一部またはウイルスベクターの一部である、請求項1~7のいずれか一項に記載の組成物。
【請求項9】
各CRISPRシステムのガイドRNAが少なくとも部分的に化学合成されている、請求項1~8のいずれか一項に記載の組成物。
【請求項10】
各CRISPRシステムのガイドRNAが酵素的に合成されている、請求項1~9のいずれか一項に記載の組成物。
【請求項11】
請求項1~10のいずれか一項に記載の組成物を含むキット。
【請求項12】
真核細胞中の標的ゲノム修飾のためのインビトロまたはエクスビボ方法であって、真核細胞に以下を導入すること:
(a)プログラム可能なDNA修飾タンパク質またはプログラム可能なDNA修飾タンパク質をコードする核酸、ここで、プログラム可能なDNA修飾タンパク質が、RNAにガイドされたクラスター化した規則的に間隔が空いている短い回文配列リピート(CRISPR)ヌクレアーゼシステムである;
(b)少なくとも1つのプログラム可能なDNA結合タンパク質または少なくとも1つのプログラム可能なDNA結合タンパク質をコードする核酸、ここで、少なくとも1つのプログラム可能なDNA結合タンパク質が、ヌクレアーゼ活性を有さないCRISPRシステムである;および
(c)ドナー配列を含むドナーポリヌクレオチド、
を含み、;
各CRISPRシステムがCRISPRタンパク質およびガイドRNAを含む;
プログラム可能なDNA修飾タンパク質は標的染色体配列を標的とし、少なくとも1つのプログラム可能な各DNA結合タンパク質は、標的染色体配列の近位の部位を標的とする;
少なくとも1つのプログラム可能なDNA結合タンパク質と標的染色体配列の近位の部位との結合は、プログラム可能なDNA修飾タンパク質の標的染色体配列へのアクセスしやすさを増大させ、これにより標的ゲノム修飾の効率および/または特異性を増大させる;
各CRISPRタンパク質が、II型CRISPRタンパク質またはV型CRISPRタンパク質である;および
標的染色体配列の近位の部位が、標的染色体配列の一方の側の約250塩基対以内に位置している、
ここで、方法は、ヒトの生殖系列の遺伝的同一性を改変するためのプロセス、または産業または商業目的のためのヒト胚の使用を含まない、
方法。
【請求項13】
標的染色体配列の近位の部位が、標的染色体配列の一方の側の約100塩基対以内に位置している、請求項12に記載の方法。
【請求項14】
標的染色体配列の近位の部位が、標的染色体配列の一方の側の約75塩基対以内に位置している、請求項13に記載の方法。
【請求項15】
標的染色体配列の近位の部位が、標的染色体配列の一方の側の約50塩基対以内に位置している、請求項14に記載の方法。
【請求項16】
標的染色体配列の近位の部位が、標的染色体配列の一方の側の約25塩基対以内に位置している、請求項15に記載の方法。
【請求項17】
ヌクレアーゼ活性を有さないCRISPRシステムが、触媒不活性なCRISPRタンパク質である、請求項12~16のいずれか一項に記載の方法。
【請求項18】
真核細胞がインビトロである、請求項12~17のいずれか一項に記載の方法。
【請求項19】
真核細胞が哺乳類細胞である、請求項12~18のいずれか一項に記載の方法。
【請求項20】
哺乳類細胞がヒト細胞である、請求項19に記載の方法。
【請求項21】
プログラム可能なDNA修飾タンパク質および少なくとも1つのプログラム可能なDNA結合タンパク質が、互いに異なるCRISPRタンパク質型またはサブタイプである、請求項1~10のいずれか一項に記載の組成物、
または請求項11に記載のキッ
ト。
【請求項22】
(i)プログラム可能なDNA修飾タンパク質がII型CRISPRタンパク質であり、少なくとも1つのプログラム可能なDNA結合タンパク質がV型CRISPRタンパク質である;
(ii)プログラム可能なDNA修飾タンパク質がV型CRISPRタンパク質であり、少なくとも1つのプログラム可能なDNA結合タンパク質がII型CRISPRタンパク質である;または
(iii)プログラム可能なDNA修飾タンパク質がV型CRISPRタンパク質であり、少なくとも1つのプログラム可能なDNA結合タンパク質がV型CRISPRタンパク質である、
請求項1~10のいずれか一項に記載の組成物、
または請求項11に記載のキッ
ト。
【請求項23】
(i)プログラム可能なDNA修飾タンパク質がIIA型CRISPRタンパク質であり、少なくとも1つのプログラム可能なDNA結合タンパク質がIIB型CRISPRタンパク質である;
(ii)プログラム可能なDNA修飾タンパク質がIIB型CRISPRタンパク質であり、少なくとも1つのプログラム可能なDNA結合タンパク質がIIA型CRISPRタンパク質である;
(iii)プログラム可能なDNA修飾タンパク質がIIC型CRISPRタンパク質であり、少なくとも1つのプログラム可能なDNA結合タンパク質がIIA型CRISPRタンパク質である;または
(iv)プログラム可能なDNA修飾タンパク質がV型CRISPRタンパク質であり、少なくとも1つのプログラム可能なDNA結合タンパク質がIIA型CRISPRタンパク質である、
請求項1~10のいずれか一項に記載の組成物、
または請求項11に記載のキッ
ト。
【請求項24】
(i)II型CRISPRタンパク質が、Francisella novicida Cas9(FnCas9)、Campylobacter jejuni Cas9(CjCas9)、およびStreptococcus pyogenes Cas9(SpCas9)から選択される;および/または、
(ii)V型CRISPRタンパク質が、Francisella novicida Cpf1(FnCpf1)、である、
請求項22または23に記載の組成物
またはキッ
ト。
【請求項25】
少なくとも1つのプログラム可能なDNA結合タンパク質が、Cas9II型CRISPRタンパク質であり、Cas9タンパク質がRuvC様ドメインおよびHNH様ドメインの各々に1つ以上の変異を有する、
請求項22~24のいずれか一項に記載の組成物
またはキッ
ト。
【請求項26】
(i)RuvC様ドメインの1つ以上の変異が、D10A、D8A、E762Aおよび/またはD986Aである;および/または、(ii)HNH様ドメインの1つ以上の変異がH840A、H559A、N854A、N856Aおよび/またはN863Aである、請求項25に記載の組成物
またはキッ
ト。
【請求項27】
ドナー配列が外来性配列である、請求項1~10および21~26のいずれか一項に記載の組成物、
または請求項11および21~26のいずれか一項に記載のキッ
ト。
【請求項28】
ドナーポリヌクレオチドがベクターである、請求項1~10および21~27のいずれか一項に記載の組成物、
または請求項11および21~27のいずれか一項に記載のキッ
ト。
【請求項29】
ドナーポリヌクレオチドが直鎖状配列である、請求項1~10および21~28のいずれか一項に記載の組成物、
または請求項11および21~28のいずれか一項に記載のキッ
ト。
【請求項30】
治療に使用するための、請求項1~10および21~29のいずれか一項に記載の組成物、または請求項11および21~29のいずれか一項に記載のキット。
【請求項31】
鎌状赤血球症、サラセミア、重症複合免疫不全症(SCID)、ハンチントン病または網膜色素変性症の治療に使用するための、請求項1~10および21~29のいずれか一項に記載の組成物、または請求項11および21~29のいずれか一項に記載のキット。
【請求項32】
プログラム可能なDNA修飾タンパク質および少なくとも1つのプログラム可能なDNA結合タンパク質が、互いに異なるCRISPRタンパク質型またはサブタイプである、請求項12~20のいずれか一項に記載の方法。
【請求項33】
(i)プログラム可能なDNA修飾タンパク質がII型CRISPRタンパク質であり、少なくとも1つのプログラム可能なDNA結合タンパク質がV型CRISPRタンパク質である;
(ii)プログラム可能なDNA修飾タンパク質がV型CRISPRタンパク質であり、少なくとも1つのプログラム可能なDNA結合タンパク質がII型CRISPRタンパク質である;または
(iii)プログラム可能なDNA修飾タンパク質がV型CRISPRタンパク質であり、少なくとも1つのプログラム可能なDNA結合タンパク質がV型CRISPRタンパク質である、
請求項12~20のいずれか一項に記載の方法。
【請求項34】
(i)プログラム可能なDNA修飾タンパク質がIIA型CRISPRタンパク質であり、少なくとも1つのプログラム可能なDNA結合タンパク質がIIB型CRISPRタンパク質である;
(ii)プログラム可能なDNA修飾タンパク質がIIB型CRISPRタンパク質であり、少なくとも1つのプログラム可能なDNA結合タンパク質がIIA型CRISPRタンパク質である;
(iii)プログラム可能なDNA修飾タンパク質がIIC型CRISPRタンパク質であり、少なくとも1つのプログラム可能なDNA結合タンパク質がIIA型CRISPRタンパク質である;または
(iv)プログラム可能なDNA修飾タンパク質がV型CRISPRタンパク質であり、少なくとも1つのプログラム可能なDNA結合タンパク質がIIA型CRISPRタンパク質である、
請求項12~20のいずれか一項に記載の方法。
【請求項35】
(i)II型CRISPRタンパク質が、Francisella novicida Cas9(FnCas9)、Campylobacter jejuni Cas9(CjCas9)、およびStreptococcus pyogenes Cas9(SpCas9)から選択される;および/または、
(ii)V型CRISPRタンパク質が、Francisella novicida Cpf1(FnCpf1)、である、
請求項33または34に記載の方法。
【請求項36】
少なくとも1つのプログラム可能なDNA結合タンパク質が、Cas9II型CRISPRタンパク質であり、Cas9タンパク質がRuvC様ドメインおよびHNH様ドメインの各々に1つ以上の変異を有する、
請求項33~35のいずれか一項に記載の方法。
【請求項37】
(i)RuvC様ドメインの1つ以上の変異が、D10A、D8A、E762Aおよび/またはD986Aである;および/または、(ii)HNH様ドメインの1つ以上の変異がH840A、H559A、N854A、N856Aおよび/またはN863Aである、請求項36に記載の方法。
【請求項38】
ドナー配列が外来性配列である、請求項12~20および32~37のいずれか一項に記載の方法。
【請求項39】
ドナーポリヌクレオチドがベクターである、請求項12~20および32~38のいずれか一項に記載の方法。
【請求項40】
ドナーポリヌクレオチドが直鎖状配列である、請求項12~20および32~39のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、標的ゲノム修飾の効率および/または特異性を増大させる組成物および方法に関する。
【背景技術】
【0002】
プログラム可能なエンドヌクレアーゼは真核生物における標的ゲノム編集または標的ゲノム修飾のためのますます重要なツールとなっている。最近、RNAにガイドされたクラスター化した規則的に間隔が空いている短い回文配列リピート(RNA-guided clustered regularly interspersed short palindromic repeats、CRISPR)/CRISPR関連(Cas)(CRISPR/Cas)システムが新世代のゲノム修飾ツールとして現れてきた。これらの新しいプログラム可能なエンドヌクレアーゼは、前世代のヌクレアーゼ(Znフィンガーヌクレアーゼ(ZFN)および転写活性化因子様エフェクターヌクレアーゼ(TALEN)など)と比較してゲノム編集の性能を大きく向上させた。
【0003】
しかしながら、全てのゲノム標的にこれらのプログラム可能なエンドヌクレアーゼによる効率的な修飾が利用できるわけではない。実際、いくつかのCRISPR-Casエンドヌクレアーゼは、ヒト細胞においてほとんどまたは全く活性を示さないようである。特にクロマチン構造は、これらのプログラム可能なエンドヌクレアーゼに対する障壁を示し得、これらが標的配列に結合するのを妨げ得る。したがって、これらのプログラム可能なエンドヌクレアーゼの標的配列へのアクセスしやすさを改善し、かつ/または標的ゲノム修飾の効率を改善する必要がある。さらに、オフターゲット効果を減少させることによって標的ゲノム修飾の特異性を増大させる必要がある。
【発明の概要】
【0004】
本開示の様々な態様において、(a)プログラム可能なDNA修飾タンパク質またはプログラム可能なDNA修飾タンパク質をコードする核酸、および(b)少なくとも1つのプログラム可能なDNA結合タンパク質または少なくとも1つのプログラム可能なDNA結合タンパク質をコードする核酸を含む組成物である。一般に、プログラム可能なDNA修飾タンパク質はヌクレアーゼ活性(すなわち、二本鎖配列の両方の鎖を切断する)または非ヌクレアーゼ活性(例えば、エピジェネティック修飾活性または転写制御活性)を有し、少なくとも1つのプログラム可能なDNA結合タンパク質はヌクレアーゼ活性を有さない。
【0005】
プログラム可能なDNA修飾タンパク質がヌクレアーゼ活性を有している実施態様において、例えばプログラム可能なDNA修飾タンパク質は、RNAにガイドされたクラスター化した規則的に間隔が空いている短い回文配列リピート(RNA-guided clustered regularly interspersed short palindromic repeats、CRISPR)/CRISPR関連(Cas)(CRISPR/Cas)ヌクレアーゼシステム、CRISPR/Cas二重ニッカーゼシステム、Znフィンガーヌクレアーゼ(ZFN)、転写活性化因子様エフェクターヌクレアーゼ(TALEN)、メガヌクレアーゼ、ヌクレアーゼドメインと連結した(すなわち、二本鎖DNA切断を生成する)プログラム可能なDNA結合ドメインを含む融合タンパク質およびそれらの組合せから選択され得る。
【0006】
プログラム可能なDNA修飾タンパク質が非ヌクレアーゼ活性を有している実施態様において、例えばプログラム可能なDNA修飾タンパク質は、非ヌクレアーゼ修飾ドメインと連結したプログラム可能なDNA結合ドメインを含む融合タンパク質であり得る。ある実施態様において、融合タンパク質のプログラム可能なDNA結合ドメインは、触媒不活性なCRISPR/Casシステム、触媒不活性なメガヌクレアーゼ、Znフィンガータンパク質、または転写活性化因子様エフェクターであり得、融合タンパク質の非ヌクレアーゼ修飾ドメインは、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、脱ミリストイル化活性、シトルリン化活性、ヘリカーゼ活性、アミノ化活性、脱アミノ化活性、アルキル化活性、脱アルキル化活性、酸化活性、転写活性化活性、または転写抑制因子活性を有し得る。具体的な実施態様において、融合タンパク質の非ヌクレアーゼ修飾ドメインは、シトシンデアミナーゼ活性、ヒストンアセチルトランスフェラーゼ活性、転写活性化活性、または転写抑制因子活性を有する。
【0007】
本明細書で開示される組成物のある実施態様において、少なくとも1つのプログラム可能なDNA結合タンパク質は、触媒不活性なCRISPR/Casシステム、触媒不活性なメガヌクレアーゼ、Znフィンガーヌクレアーゼ、転写活性化因子様エフェクター、CRISPR/Casニッカーゼ、ZFNニッカーゼ、TALENニッカーゼ、またはメガヌクレアーゼニッカーゼであり得る。
【0008】
一般に、プログラム可能なDNA修飾タンパク質および/または少なくとも1つのプログラム可能なDNA結合タンパク質をコードする核酸は、mRNAまたはDNAである。いくつかの実施態様において、プログラム可能なDNA修飾タンパク質および/または少なくとも1つのプログラム可能なDNA結合タンパク質をコードする核酸はベクター(例えば、プラスミドベクター、レンチウイルスベクター、アデノ随伴ウイルスベクター、またはアデノウイルスベクターなど)の一部である。
【0009】
具体的な実施態様において、プログラム可能なDNA修飾タンパク質は、CRISPR/Casヌクレアーゼシステム、CRISPR/Cas二重ニッカーゼシステム、または非ヌクレアーゼドメインと連結した触媒不活性なCRISPR/Casシステムを含み、少なくとも1つのプログラム可能なDNA結合タンパク質は触媒不活性なCRISPR/Casシステムを含み、ここで各CRISPR/CasシステムはCRISPR/Casタンパク質およびガイドRNAを含む。様々な実施態様において、各CRISPR/Casヌクレアーゼシステムは、I型CRISPR/Casシステム、II型CRISPR/Casシステム、III型CRISPR/Casシステム、またはV型CRISPR/Casシステムであり得る。いくつかの実施態様において、各ガイドRNAは少なくとも部分的に化学合成され得る。他の実施態様において、各ガイドRNAは酵素的に合成され得る。さらなる実施態様において、各CRISPR/Casタンパク質をコードする核酸はmRNAであり得、各ガイドRNAをコードする核酸はDNAであり得る。さらなる他の実施態様において、各CRISPR/Casタンパク質をコードする核酸はmRNAであり得、各ガイドRNAをコードする核酸はDNAであり得る。ある実施態様において、CRISPR/Casタンパク質をコードする核酸および/またはガイドRNAをコードする核酸はベクター(例えば、プラスミドベクター、レンチウイルスベクター、アデノ随伴ウイルスベクター、またはアデノウイルスベクター)の一部であり得る。
【0010】
本開示の別の態様は、上述の組成物のいずれか1つ以上を含むキットを包含する。
【0011】
本開示のさらなる別の態様は、真核細胞中の標的ゲノム修飾の効率および/または特異性を増大させる方法を提供する。本方法は真核細胞に、(a)プログラム可能なDNA修飾タンパク質またはプログラム可能なDNA修飾タンパク質をコードする核酸、および(b)少なくとも1つのプログラム可能なDNA結合タンパク質または少なくとも1つのプログラム可能なDNA結合タンパク質をコードする核酸を導入することを含む。プログラム可能なDNA修飾タンパク質は標的染色体配列を標的とし、少なくとも1つのプログラム可能な各DNA結合タンパク質は、標的染色体配列の近位の部位を標的とする。少なくとも1つのプログラム可能なDNA結合タンパク質と標的染色体配列の近位の部位との結合は、プログラム可能なDNA修飾タンパク質の標的染色体配列へのアクセスしやすさを増大させ、これにより標的ゲノム修飾の効率および/または特異性を増大させる。少なくとも1つのプログラム可能な各DNA結合タンパク質に結合された近位部は、例えば標的染色体配列の一方の側の約250塩基対以内に位置している。いくつかの実施態様において、近位結合部位は標的染色体配列の一方の側の約200bp未満または約100bp未満に位置している。
【0012】
本方法において使用されるプログラム可能なDNA修飾タンパク質は、CRISPR/Casヌクレアーゼシステム、CRISPR/Cas二重ニッカーゼシステム、Znフィンガーヌクレアーゼ(ZFN)、転写活性化因子様エフェクターヌクレアーゼ(TALEN)、メガヌクレアーゼ、ヌクレアーゼドメインと連結したプログラム可能なDNA結合ドメインを含む融合タンパク質、または非ヌクレアーゼドメインと連結したプログラム可能なDNA結合ドメインを含む融合タンパク質であり得る。融合タンパク質のプログラム可能なDNA結合ドメインは、触媒不活性なCRISPR/Casシステム、触媒不活性なメガヌクレアーゼ、Znフィンガータンパク質、または転写活性化因子様エフェクターであり得、融合タンパク質の非ヌクレアーゼ修飾ドメインは、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、脱ミリストイル化活性、シトルリン化活性、ヘリカーゼ活性、アミノ化活性、脱アミノ化活性、アルキル化活性、脱アルキル化活性、酸化活性、転写活性化活性、または転写抑制因子活性を有し得る。具体的な実施態様において、融合タンパク質の非ヌクレアーゼ修飾ドメインは、シトシンデアミナーゼ活性、ヒストンアセチルトランスフェラーゼ活性、転写活性化活性、または転写抑制因子活性を有する。
【0013】
本方法において使用される少なくとも1つのプログラム可能なDNA結合タンパク質はDNAに結合するが、ヌクレアーゼ活性(すなわち二本鎖切断活性)を持たない。ある実施態様において、少なくとも1つのプログラム可能なDNA結合タンパク質は、触媒不活性なCRISPR/Casシステム、触媒不活性なメガヌクレアーゼ、Znフィンガータンパク質、転写活性化因子様エフェクター、CRISPR/Casニッカーゼ、ZFNニッカーゼ、TALENニッカーゼ、またはメガヌクレアーゼニッカーゼであり得る。
【0014】
具体的な実施態様において、プログラム可能なDNA修飾タンパク質は、CRISPR/Casヌクレアーゼシステム、CRISPR/Cas二重ニッカーゼシステム、または非ヌクレアーゼドメインと連結した触媒不活性なCRISPR/Casシステムを含み、少なくとも1つのプログラム可能なDNA結合タンパク質は触媒不活性なCRISPR/Casシステムを含み、ここで各CRISPR/CasシステムはCRISPR/Casタンパク質およびガイドRNAを含む。
【0015】
様々な実施態様において、少なくとも2つ、少なくとも3つ、または4つ以上のプログラム可能なDNA結合タンパク質が真核細胞に導入される。具体的な実施態様において、真核細胞は哺乳類細胞またはヒト細胞である。
【0016】
本開示のさらなる態様は、真核細胞中の染色体配列またはゲノム遺伝子座を検出する方法を包含する。本方法は真核細胞に、(a)少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質または少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質をコードする核酸、および(b)少なくとも1つのプログラム可能なDNA結合タンパク質または少なくとも1つのプログラム可能なDNA結合タンパク質をコードする核酸を導入することを含み、ここで少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質は標的染色体配列を標的とし、少なくとも1つのプログラム可能な各DNA結合タンパク質は標的染色体配列の近位の部位を標的とし、少なくとも1つのプログラム可能なDNA結合タンパク質と標的染色体配列の近位の部位との結合は、少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質の標的染色体配列へのアクセスしやすさを増大させる。本方法はさらに、標的染色体配列に結合した少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質を検出することを含み得る。検出の工程は、生細胞または固定細胞中であり得、例えば動的生細胞イメージング、蛍光顕微鏡、共焦点顕微鏡、免疫蛍光、免疫検出、RNA-タンパク質結合、またはタンパク質-タンパク質結合を含み得る。
【0017】
本検出方法において使用される少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質はプログラム可能なDNA結合ドメインを含み、これは触媒不活性なCRISPR/Casシステム、触媒不活性なメガヌクレアーゼ、Znフィンガータンパク質、または転写活性化因子様エフェクターであり得る。少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質の少なくとも1つの検出可能なマーカードメインは、例えば蛍光タンパク質、蛍光タグ、エピトープタグ、またはプログラム可能なDNA結合タンパク質中に天然に存在するエピトープであり得る。いくつかの実施態様において、少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質はさらに、非ヌクレアーゼ修飾を含み得る。少なくとも1つのプログラム可能なDNA結合タンパク質はDNAに結合するが、ヌクレアーゼ活性(すなわち二本鎖切断活性)を持たない。いくつかの実施態様において、プログラム可能なDNA結合タンパク質は、触媒不活性なCRISPR/Casシステム、触媒不活性なメガヌクレアーゼ、Znフィンガータンパク質、転写活性化因子様エフェクター、CRISPR/Casニッカーゼ、ZFNニッカーゼ、TALENニッカーゼ、またはメガヌクレアーゼニッカーゼであり得る。具体的な実施態様において、少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質は、少なくとも1つの検出可能なマーカードメインを連結した触媒不活性なCRISPR/Casシステムであり得、少なくとも1つのプログラム可能なDNA結合タンパク質は、触媒不活性なCRISPR/Casシステムであり得る。
【0018】
本開示の他の態様および特徴が以下に詳述される。
【図面の簡単な説明】
【0019】
【
図1】
図1は、本明細書において開示される方法のある実施態様の略図を示す。プログラム可能なDNA結合タンパク質の近位の結合は、標的部位のプログラム可能なヌクレアーゼへのアクセスしやすさを増大させ、これにより標的部位の切断効率を増大させる。
【0020】
【
図2】
図2は、触媒不活性なSpCas9(SpdCas9)と近位部との結合がFnCas9による切断の効率を増大させることを示す。上部に示される配列は、POR遺伝子座におけるFnCas9標的部位とSpdCas9の結合部位との相対的な位置を示す。Cel-Iヌクレアーゼアッセイの結果を下部に示す。
【0021】
【
図3A】
図3Aは、触媒不活性なSpCas9(SpdCas9)の結合が、エピトープ標識(すなわちFLAG
(登録商標)標識)された触媒不活性なCjCas9(CjdCas9)のPOR遺伝子座中における以前はアクセスできなかった部位への結合およびアクセスしやすさを増大させるか否かを決定するための実験計画を示す。
【0022】
【
図3B】
図3Bは、エピトープ標識されたCjdCas9とPORおよびAAVS1遺伝子座中の標的部位との結合を検出するために使用される、クロマチン免疫沈降結合アッセイの略図を示す。
【0023】
【
図3C】
図3Cは、SpdCas9と近位部との結合がエピトープ標識されたCjCas9とPOR遺伝子座中の以前はアクセスできなかった部位との結合を増大させることを示す。
【0024】
【
図4】
図4は、触媒不活性なSpCas9(SpdCas9)と近位部との結合がCjCas9による切断の効率を増大させることを示す。上部に示される配列は、POR遺伝子座におけるCjCas9標的部位とSpdCas9の結合部位との相対的な位置を示す。Cel-Iヌクレアーゼアッセイの結果を下部に示す。
【0025】
【
図5】
図5は、触媒不活性なSpCas9(SpdCas9)と近位部との結合がFnCaf1による切断の効率を増大させることを示す。POR遺伝子座におけるFnCaf1標的部位とSpdCas9結合部位との相対的な位置を上部に示し、Cel-Iヌクレアーゼアッセイの結果を下部に示す。
【0026】
【
図6】
図6は、触媒不活性なSpCas9(SpdCas9)と近位部との結合がCjCas9による特異的な切断を増大させることを示す。HBDおよびHBB遺伝子座におけるCjCas9の標的部位、ならびにHBB遺伝子座におけるSpdCas9の結合部位を上部に示す。Cel-Iヌクレアーゼアッセイの結果を下部に示す。
【0027】
【
図7】
図7は、触媒不活性なFnCas9(FndCas9)と近位部との結合がSpCas9による特異的な切断を増大させることを示す。POR遺伝子座におけるSpCas9標的部位とFndCas9結合部位との相対的な位置を上部に示す。Cel-Iヌクレアーゼアッセイの結果を下部に示す。
【0028】
【
図8】
図8は、ssDNAオリゴを介した遺伝子編集の増強を示す。POR遺伝子座における標的部位とssDNAオリゴの配列との相対的な位置を上部に示す。EcoRI部位を標的とする組込みの結果を下部に示す。EcoRI部位の組込み効率(%)をImageJによって決定した。M:広範囲DNAマーカー。ND:決定されず。
【発明を実施するための形態】
【0029】
本開示は、染色体DNAの標的指向性エンドヌクレアーゼおよび他のプログラム可能なDNA修飾タンパク質へのアクセスしやすさを増大させる組成物および方法を提供し、ここでアクセスしやすさの増大は標的ゲノム修飾またはエピジェネティック修飾の効率および/または特異性の増大を導く。いくつかのCRISPR/Casエンドヌクレアーゼはヒト細胞中で活性が減少し、または活性を示さないことが見出されている。ヌクレオソーム占有率、ヌクレオソームポジショニング、およびDNA配列のヒストン八量体への巻き付き方が、そのDNA配列がDNA結合タンパク質にどの程度アクセスできるかを決定し得ると考えられている(Chereji et al., Briefing Functional Genomics, 2014, 14:506-60)。したがって、局所的なクロマチン配置によって課せられた障害が、ヒト細胞における多くのCRISPR/Casエンドヌクレアーゼの見かけ上の不活性に影響を与え得ると考えられる。本明細書で詳述するように、DNA修飾タンパク質と標的指向性DNA修飾タンパク質の標的部位の近位(すなわち約250塩基対以内)に位置する部位との結合が、標的指向性DNA修飾タンパク質の標的部位へのアクセスしやすさを増大させ、これにより標的ゲノム修飾または標的エピジェネティック修飾の効率および/または特異性を増大させることが見出されている。したがって、本明細書で開示される組成物および方法は、これまでヒト細胞中で不活性であると考えられていたCRISPR/Casエンドヌクレアーゼを用いた効率的な標的ゲノム修飾/エピジェネティック修飾を可能にする。さらに本明細書で開示される組成物および方法はまた、ほとんど同一の標的部位間の選択的なゲノム修飾を改善し、これによりオフターゲット効果を減少させる。
【0030】
(I)組成物
本開示のある態様は、(a)プログラム可能なDNA修飾タンパク質またはプログラム可能なDNA修飾タンパク質をコードする核酸、および(b)少なくとも1つのプログラム可能なDNA結合タンパク質または少なくとも1つのプログラム可能なDNA結合タンパク質をコードする核酸を含む組成物を提供する。プログラム可能なDNA修飾タンパク質は下記のセクション(I)(a)において詳述され、プログラム可能なDNA結合タンパク質は下記のセクション(I)(b)において詳述され、これらのタンパク質をコードする核酸は下記のセクション(I)(c)において詳述される。
【0031】
(a)プログラム可能なDNA修飾タンパク質
プログラム可能なDNA修飾タンパク質は、染色体DNA中の特定の標的配列に結合するタンパク質であり、標的配列またはその付近のDNAまたはDNAに関連するタンパク質を修飾する。したがって、プログラム可能なDNA修飾タンパク質はDNA結合ドメインおよび触媒活性な修飾ドメインを含む。
【0032】
DNA結合ドメインは種々のDNA配列を認識および結合するように設計または編集され得るという点で、プログラム可能である。いくつかの実施態様において、例えば、DNA結合はタンパク質と標的DNAとの間の相互作用によって仲介される。したがって、DNA結合ドメインは、タンパク質工学によって対象のDNA配列と結合するようにプログラムされ得る。他の実施態様において、例えば、DNA結合はタンパク質のプログラム可能なDNA結合ドメインおよび標的DNAと相互作用するガイドDNAによって仲介される。このような場合、プログラム可能なDNA結合ドメインは、適切なガイドRNAを設計することによって対象のDNA配列を標的とし得る。
【0033】
多様な修飾ドメインがプログラム可能なDNA修飾タンパク質に含まれ得る。いくつかの実施態様において、修飾ドメインはヌクレアーゼドメインであり、これはヌクレアーゼ活性を有し、二本鎖DNA配列の両方の鎖を切断する(すなわち二本鎖切断を生成する)。次に、二本鎖切断は細胞のDNA修復過程(非相同末端結合(NHEJ)または相同組換え修復(HDR)など)によって修復され得る。結果として、DNA配列は少なくとも1つの塩基対(最大で、例えば何千もの塩基対)の欠失、挿入および/または置換によって修飾され得る。ヌクレアーゼドメインを含むプログラム可能なDNA修飾タンパク質の例は、限定されないが、CRISPR/Casヌクレアーゼシステム、CRISPR/Cas二重ニッカーゼシステム、Znフィンガーヌクレアーゼ、転写活性化因子様エフェクターヌクレアーゼ、メガヌクレアーゼ、プログラム可能なDNA結合ドメインと連結したヌクレアーゼドメインを含む融合タンパク質、およびそれらの組合せを含む。ヌクレアーゼドメインを含むプログラム可能なDNA修飾タンパク質は下記のセクション(I)(a)(i)~(vi)において詳述される。
【0034】
他の実施態様において、プログラム可能なDNA修飾タンパク質の修飾ドメインは、プログラム可能なDNA修飾タンパク質がDNAおよび/またはDNAに関連するタンパク質の構造および/または活性を修飾するように、非ヌクレアーゼ活性(例えば、エピジェネティック修飾活性または転写制御活性)を有する。したがって、プログラム可能なDNA修飾タンパク質は、プログラム可能なDNA結合ドメインと連結した非ヌクレアーゼ修飾ドメインを含む融合タンパク質である。このようなタンパク質は下記のセクション(I)(a)(vii)において詳述される。
【0035】
プログラム可能なDNA修飾タンパク質は、野生型または天然に存在するDNA結合および/または修飾ドメイン、天然に存在するDNA結合および/または修飾ドメインを修飾したバージョン、合成または人工DNA結合および/または修飾ドメイン、およびそれらの組合せを含み得る。
【0036】
(i)CRISPR/Casヌクレアーゼシステム
いくつかの実施態様において、プログラム可能なDNA修飾タンパク質はRNAにガイドされたCRISPR/Casヌクレアーゼシステムであり得、これはDNAに二本鎖切断を導入する。CRISPR/CasヌクレアーゼシステムはCRISPR/CasヌクレアーゼおよびガイドRNAを含む。
【0037】
CRISPR/Casヌクレアーゼ
ある実施態様において、CRISPR/CasヌクレアーゼはI型(すなわちIA、IB、IC、ID、IEまたはIF)、II型(すなわちIIA、IIBまたはIIC)、III型(すなわちIIIAまたはIIIB)またはV型のCRISPRシステムに由来し得、これらは様々な細菌および古細菌中に存在する。例えばCRISPR/Casシステムは、Streptococcus sp.(例えば、Streptococcus pyogenes)、Campylobacter sp.(例えば、Campylobacter jejuni)、Francisella sp.(例えば、Francisella novicida)、Acaryochloris sp.、Acetohalobium sp.、Acidaminococcus sp.、Acidithiobacillus sp.、Alicyclobacillus sp.、Allochromatium sp.、Ammonifex sp.、Anabaena sp.、Arthrospira sp.、Bacillus sp.、Burkholderiales sp.、Caldicelulosiruptor sp.、Candidatus sp.、Clostridium sp.、Crocosphaera sp.、Cyanothece sp.、Exiguobacterium sp.、Finegoldia sp.、Ktedonobacter sp.、Lachnospiraceae sp.、Lactobacillus sp.、Lyngbya sp.、Marinobacter sp.、Methanohalobium sp.、Microscilla sp.、Microcoleus sp.、Microcystis sp.、Natranaerobius sp.、Neisseria sp.、Nitrosococcus sp.、Nocardiopsis sp.、Nodularia sp.、Nostoc sp.、Oscillatoria sp.、Polaromonas sp.、Pelotomaculum sp.、Pseudoalteromonas sp.、Petrotoga sp.、Prevotella sp.、Staphylococcus sp.、Streptomyces sp.、Streptosporangium sp.、Synechococcus sp.、Thermosipho sp.、またはVerrucomicrobia sp.に由来し得る。さらなる他の実施態様において、CRISPR/Casヌクレアーゼは、古細菌CRISPRシステム、CRISPR-CasXシステム、またはCRISPR-CasYシステムに由来し得る(Burstein et al., Nature, 2017, 542(7640):237-241)。
【0038】
ある特定の実施態様において、CRISPR/CasヌクレアーゼはI型CRISPR/Casシステムに由来し得る。別の特定の実施態様において、CRISPR/CasヌクレアーゼはII型CRISPR/Casシステムに由来し得る。別の特定の実施態様において、CRISPR/CasヌクレアーゼはIII型CRISPR/Casシステムに由来し得る。別の特定の実施態様において、CRISPR/CasヌクレアーゼはV型CRISPR/Casシステムに由来し得る。
【0039】
適切なCRISPRタンパク質の限定されない例は、Casタンパク質、Cpfタンパク質、C2cタンパク質(例えばC2c1、C2c2、Cdc3)、Cmrタンパク質、Csaタンパク質、Csbタンパク質、Cscタンパク質、Cseタンパク質、Csfタンパク質、Csmタンパク質、Csnタンパク質、Csxタンパク質、Csyタンパク質、Cszタンパク質、およびそれらの誘導体または変異体を含む。具体的な実施態様において、CRISPR/CasヌクレアーゼはII型Cas9タンパク質、V型Cpf1タンパク質、またはそれらの誘導体であり得る。
【0040】
いくつかの実施態様において、CRISPR/Casヌクレアーゼは、Streptococcus pyogenes Cas9(SpCas9)またはStreptococcus thermophilus Cas9(StCas9)であり得る。他の実施態様において、CRISPR/CasヌクレアーゼはCampylobacter jejuni Cas9(CjCas9)であり得る。代替の実施態様において、CRISPR/CasヌクレアーゼはFrancisella novicida Cas9(FnCas9)であり得る。さらなる他の実施態様において、CRISPR/CasヌクレアーゼはNeisseria cinerea Cas9(NcCas9)であり得る。さらなる実施態様において、CRISPR/CasヌクレアーゼはFrancisella novicida Cpf1(FnCpf1)、Acidaminococcus sp.Cpf1(AsCpf1)、またはLachnospiraceae bacterium ND2006 Cpf1(LbCpf1)であり得る。
【0041】
一般に、CRISPR/CasヌクレアーゼはRNA認識および/またはRNA結合ドメインを含み、これはガイドRNAと相互作用する。CRISPR/Casヌクレアーゼはまた、エンドヌクレアーゼ活性を有する少なくとも1つのヌクレアーゼドメインを含む。例えば、Cas9タンパク質はRuvC様ヌクレアーゼドメインおよびHNH様ヌクレアーゼドメインを含み、Cpf1タンパク質はRuvC様ドメインを含む。CRISPR/Casヌクレアーゼはまた、DNA結合ドメイン、ヘリカーゼドメイン、RNaseドメイン、タンパク質-タンパク質相互作用ドメイン、二量体形成ドメイン、および他のドメインを含み得る。
【0042】
CRISPR/Casヌクレアーゼはさらに、核移行シグナル、細胞透過性ドメインおよび/またはマーカードメインのうち少なくとも1つを含み得る。核移行シグナルの限定されない例は、PKKKRKV(配列番号1)、PKKKRRV(配列番号2)、KRPAATKKAGQAKKKK(配列番号3)、YGRKKRRQRRR(配列番号28)、RKKRRQRRR(配列番号29)、PAAKRVKLD(配列番号30)、RQRRNELKRSP(配列番号31)、VSRKRPRP(配列番号32)、PPKKARED(配列番号33)、PQPKKKPL(配列番号34)、SALIKKKKKMAP(配列番号35)、PKQKKRK(配列番号36)、RKLKKKIKKL(配列番号37)、REKKKFLKRR(配列番号38)、KRKGDEVDGVDEVAKKKSKK(配列番号39)、RKCLQAGMNLEARKTKK(配列番号40)、NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(配列番号41)、およびRMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(配列番号42)を含む。適切な細胞透過性ドメインの例は限定されないが、GRKKRRQRRRPPQPKKKRKV(配列番号4)、PLSSIFSRIGDPPKKKRKV(配列番号5)、GALFLGWLGAAGSTMGAPKKKRKV(配列番号6)、GALFLGFLGAAGSTMGAWSQPKKKRKV(配列番号7)、KETWWETWWTEWSQPKKKRKV(配列番号8)、YARAAARQARA(配列番号43)、THRLPRRRRRR(配列番号44)、GGRRARRRRRR(配列番号45)、RRQRRTSKLMKR(配列番号46)、GWTLNSAGYLLGKINLKALAALAKKIL(配列番号47)、KALAWEAKLAKALAKALAKHLAKALAKALKCEA(配列番号48)、およびRQIKIWFQNRRMKWKK(配列番号49)を含む。マーカードメインは蛍光タンパク質および精製タグまたはエピトープタグを含む。適切な蛍光タンパク質は限定されないが、緑色蛍光タンパク質(例えばGFP、eGFP、GFP-2、tagGFP、turboGFP、Emerald、アザミグリーン、単量体アザミグリーン、CopGFP、AceGFP、ZsGreen1)、黄色蛍光タンパク質(例えばYFP、EYFP、Citrine、Venus、YPet、PhiYFP、ZsYellow1)、青色蛍光タンパク質(例えばBFP、EBFP、EBFP2、Azurite、mKalama1、GFPuv、Sapphire、T-sapphire)、シアン蛍光タンパク質(例えば、ECFP、Cerulean、CyPet、AmCyan1、Midoriishi-Cyan)、赤色蛍光タンパク質(例えばmKate、mKate2、mPlum、DsRed monomer、mCherry、mRFP1、DsRed-Express、DsRed2、DsRed-Monomer、HcRed-Tandem、HcRed1、AsRed2、eqFP611、mRasberry、mStrawberry、Jred)およびオレンジ蛍光タンパク質(例えばmOrange、mKO、Kusabira-Orange、単量体Kusabira-Orange、mTangerine、tdTomato)を含む。適切な精製タグまたはエピトープタグの限定されない例は、6xHis、FLAG(登録商標)、HA、GSTおよびMycなどを含む。
【0043】
核移行シグナル、細胞透過性ドメインおよび/またはマーカードメインは、タンパク質のN末端、C末端、または内部の部位に位置し得る。いくつかの実施態様において、CRISPR/Casヌクレアーゼはさらに、少なくとも1つの検出可能な標識を含み得る。検出可能な標識は、フルオロフォア(例えばFAM、TMR、Cy3、Cy5、テキサスレッド、Oregon Green、Alexa Fluor、Halo tagまたは適切な蛍光タグ/色素)、発色団(例えばビオチンおよびジゴキシゲニンなど)、量子ドットまたは金粒子であり得る。検出可能な標識は、従来の方法によってタンパク質の任意のアミノ酸に結合し得る。
【0044】
ガイドRNA
CRISPR/Casヌクレアーゼシステムはまた、ガイドRNA(gRNA)を含む。ガイドRNAはCRISPR/Casヌクレアーゼおよび標的部位と相互作用し、CRISPR/Casヌクレアーゼを染色体配列中の標的部位に導く。標的部位は、配列がプロトスペーサー隣接モチーフ(PAM)に隣接しているということを除いて配列の制限を有さない。例えば、Cas9タンパク質のPAM配列は3’-NGG、3’-NGGNG、3’-NNAGAAWおよび3’-ACAYを含み、Cpf1のPAM配列は5’-TTNを含む(ここでNは任意のヌクレオチドとして規定され、WはAまたはTのいずれかとして規定され、YはCまたはTのいずれかとして規定される)。
【0045】
各ガイドRNAは3つの領域を含み得る:染色体DNA配列中の標的部位との相補性を有する5’末端の第1の領域、内部にあり、ステムループ構造を形成する第2の領域、および本質的に一本鎖のままである3’末端の第3の領域。第2および第3の領域はCRISPR/Casタンパク質と相互作用する二次構造を形成する。各ガイドRNAの第1の領域は様々である(すなわち、配列特異的である)。第2および第3の領域は、特定のCRISPR/Casタンパク質と複合体を形成するガイドRNAにおいて同一であり得る。
【0046】
ガイドRNAの第1の領域は標的配列と塩基対形成できるように、標的部位の配列(すなわちプロトスペーサー配列)との相補性を有する。例えば、SpCas9ガイドRNAの第1の領域はGN17-20GGを含み得る。一般に、ガイドRNAの第1の領域(すなわちcrRNA)と標的配列との間の相補性は少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%またはそれ以上である。様々な実施態様において、ガイドRNAの第1の領域は約10ヌクレオチド~約25ヌクレオチド以上を含み得る。例えば、ガイドRNAの第1の領域とcDNA配列中の標的部位との間の塩基対形成する領域は、約10、11、12、13、14、15、16、17、18、19、20、22、23、24、25またはそれ以上のヌクレオチド長であり得る。例示的な実施態様において、ガイドRNAの第1の領域は約19、20または21ヌクレオチド長である。
【0047】
ガイドRNAはまた、二次構造を形成する第2の領域を含む。いくつかの実施態様において、この二次構造は少なくとも1つのステム(またはヘアピン)およびループを含む。各ループおよびステムの長さは様々であり得る。例えば、ループは約3~約10ヌクレオチド長の範囲であり得、ステムは約6~約20塩基対長の範囲であり得る。ステムは1~約10ヌクレオチドの1以上のバルジを含み得る。したがって、第2の領域の全長は約16~約60ヌクレオチド長の範囲であり得る。ガイドRNAはまた、本質的に一本鎖のままである3’末端の第3の領域を含む。したがって、第3の領域は、対象の細胞中のいかなる核酸配列との相補性も有さず、ガイドRNAの残りの部分との相補性も有さない。第3の領域の長さは様々であり得る。一般に、第3の領域は約4ヌクレオチド長よりも長い。例えば、第3の領域の長さは約5~約60ヌクレオチド長の範囲であり得る。
【0048】
ガイドRNAの第2の領域と第3の領域の組合せ(ユニバーサル領域またはスキャホールド領域とも呼ばれる)の長さは約30~約120ヌクレオチド長の範囲であり得る。ある態様において、ガイドRNAの第2の領域と第3の領域の組合せの長さは約70~約100ヌクレオチド長の範囲である。
【0049】
さらなる他の実施態様において、ガイドRNAの第2および第3の領域は1以上の追加のステムループ領域を含み得、ここでステムループ領域はアプタマー配列を含む(Konermann et al., Nature3, 2015, 517(7536):583-588; Zalatan et al., Cell, 2015, 160(1-2):339-50)。適切なアプタマー配列は、MS2、PP7、COM、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s、PRR1、HSF1、AID、APOBEC1、p300、TET1/2/3、VP64、GFP、Rta、p65、MyoD1またはVP160から選択されるアダプタータンパク質に結合するアプタマー配列を含む。このような実施態様において、ガイドRNAの第2の領域と第3の領域の全長は、最大で約125ヌクレオチド、最大で約150ヌクレオチド、最大で約175ヌクレオチド、最大で約200ヌクレオチド、最大で約225ヌクレオチド、最大で約250ヌクレオチド、最大で約275ヌクレオチド、または最大で約300ヌクレオチドの範囲であり得る。
【0050】
いくつかの実施態様において、ガイドRNAは3つの領域全てを含む単一分子であり得る。他の実施態様において、ガイドRNAは2つの別々の分子を含み得る。第1のRNA分子(すなわちcrRNA)は、ガイドRNAの第1の領域およびガイドRNAの第2の領域の「ステム」の半分を含み得る。第2のRNA分子(すなわちtracrRNA)は、ガイドRNAの第2の領域の「ステム」の残り半分およびガイドRNAの第3の領域を含み得る。したがって、この実施態様において、第1および第2のRNA分子はそれぞれ互いに相補的なヌクレオチド配列を含む。例えば、ある実施態様において、crRNAおよびtracrRNAの各RNA分子は他の配列と塩基対形成する(約6~約20ヌクレオチドの)配列を含み、機能的なガイドRNAを形成する。例えば、II型CRISPR/CasシステムのガイドRNAはcrRNAおよびtracrRNAを含み得る。いくつかの態様において、II型CRISPR/CasシステムのcrRNAは化学合成され得、II型CRISPR/CasシステムのtracrRNAはインビトロにおいて合成され得る(下記のセクション(I)(c)参照)。他の実施態様において、V型CRISPR/CasシステムのガイドRNAはcrRNAのみを含み得る。
【0051】
ガイドRNAは、標準的なリボヌクレオチド、改変リボヌクレオチド(例えばプソイドウリジン)、リボヌクレオチド異性体、および/またはリボヌクレオチド類似体を含み得る。いくつかの実施態様において、ガイドRNAはさらに、少なくとも1つの検出可能な標識を含み得る。検出可能な標識は、フルオロフォア(例えばFAM、TMR、Cy3、Cy5、テキサスレッド、Oregon Green、Alexa Fluor、Halo tagまたは適切な蛍光色素)、発色団(例えばビオチンおよびジゴキシゲニンなど)、量子ドットまたは金粒子であり得る。当業者はgRNA設計および作成に精通している(例えばgRNA設計ツールがインターネット上または商業的な供給源から利用できる)。
【0052】
ガイドRNAは化学的、酵素的、またはそれらの組合せで合成され得る。例えば、ガイドRNAは標準的なホスホロアミダイトに基づく固相合成法を用いて合成され得る。あるいは、ガイドRNAは、ガイドRNAをコードするDNAをファージRNAポリメラーゼによって認識されるプロモーター制御配列に作動可能に連結することによってインビトロで合成され得る。適切なファージプロモーター配列の例は、T7、T3、SP6プロモーター配列、またはそれらの変異を含む。ガイドRNAが2つの別々の分子(すなわちcrRNAおよびtracrRNA)を含む実施態様において、crRNAは化学合成され得、tracrRNAは酵素的に合成され得る。ガイドRNAをコードする核酸はプラスミドベクターの一部であり得、このプラスミドベクターは追加の発現制御配列(例えば、エンハンサー配列、Kozak配列、ポリアデニル化配列、転写終結配列など)、選択可能なマーカー配列(例えば、抗生物質耐性遺伝子)、および複製起点などをさらに含み得る。下記のセクション(I)(c)において詳述されるように、ガイドRNAをコードする核酸は真核細胞における発現のために、RNAポリメラーゼIII(Pol III)によって認識されるプロモーター制御配列に作動可能に連結してい得る。
【0053】
(ii)CRISPR/Cas二重ニッカーゼシステム
他の実施態様において、プログラム可能なDNA修飾タンパク質はCRISPR/Cas二重ニッカーゼシステムであり得る。CRISPR/Cas二重ニッカーゼシステムは、CRISPR/CasヌクレアーゼがDNAの一方の鎖のみを切断するように修飾されていることを除いて、上記のセクション(I)(a)(i)に記述されたCRISPR/Casヌクレアーゼシステムに類似している。したがって、単一のCRISPR/Casニッカーゼシステムは二本鎖DNAにおいて一本鎖切断またはニックを生成し、対のオフセットガイドRNAを含む対のCRISPR/Cas二重ニッカーゼシステムはDNAの二本鎖切断を生成する。
【0054】
CRISPR/Casヌクレアーゼは1以上の変異および/または欠失によってニッカーゼに変換され得る。例えば、Cas9ニッカーゼはヌクレアーゼドメイン(例えば、RuvC様ドメインまたはHNH様ドメイン)のうち1つにおいて1以上の変異を含み得る。例えば、1以上の変異はRuvC様ドメイン中のD10A、D8A、E762Aおよび/またはD986Aであり得、または1以上の変異はHNH様ドメイン中のH840A、H559A、N854A、N856Aおよび/またはN863Aであり得る。
【0055】
(iii)Znフィンガーヌクレアーゼ
さらなる他の実施態様において、プログラム可能なDNA修飾タンパク質はZnフィンガーヌクレアーゼ(ZFN)であり得る。ZFNは、DNA結合Znフィンガー領域およびヌクレアーゼドメインを含む。Znフィンガー領域は約2~7個のZnフィンガー(例えば約4~6個のZnフィンガー)を含み得、ここで各Znフィンガーは3ヌクレオチドに結合する。Znフィンガー領域は任意のDNA配列を認識し、結合するように設計できる。Znフィンガー設計ツールまたはアルゴリズムがインターネット上または商業的な供給源から利用できる。Znフィンガーは適切なリンカー配列を用いて連結され得る。
【0056】
また、ZFNはヌクレアーゼドメインを含み、これはあらゆるエンドヌクレアーゼまたはエキソヌクレアーゼから取得され得る。ヌクレアーゼドメインが由来し得るエンドヌクレアーゼの限定されない例は、限定されないが、制限エンドヌクレアーゼおよびホーミングエンドヌクレアーゼを含み得る。いくつかの実施態様において、ヌクレアーゼドメインはII-S型制限エンドヌクレアーゼに由来し得る。II-S型エンドヌクレアーゼは通常、認識/結合部位から数塩基対離れた部位でDNAを切断し、そのようなものとして、分離可能な結合および切断ドメインを有する。これらの酵素は一般に、一時的に会合して二量体を形成し、DNAの各鎖をねじれた位置で切断する単量体である。適切なII-S型エンドヌクレアーゼの限定されない例は、BfiI、BpmI、BsaI、BsgI、BsmBI、BsmI、BspMI、FokI、MboIIおよびSapIを含む。いくつかの実施態様において、ヌクレアーゼドメインはFokIヌクレアーゼドメインまたはその誘導体であり得る。II-S型ヌクレアーゼドメインは2つの異なるヌクレアーゼドメインの二量体化を促進するように修飾され得る。例えば、FokIの切断ドメインは特定のアミノ酸残基を変異させることによって修飾され得る。限定されない例として、FokIヌクレアーゼドメインの446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537および538位のアミノ酸残基が修飾のための標的である。例えば、ある修飾されたFokIドメインは、Q486E、I499Lおよび/またはN496D変異を含み得、他の修飾されたFokIドメインは、E490K、I538Kおよび/またはH537R変異を含み得る。
【0057】
ZFNは、核移行シグナル、細胞透過性ドメイン、および/またはマーカードメインのうち少なくとも1つをさらに含み得、これらは上記のセクション(I)(a)(i)に記述されている。
【0058】
(iv)転写活性化因子様エフェクターヌクレアーゼ
代替の実施態様において、プログラム可能なDNA修飾タンパク質は転写活性化因子様エフェクターヌクレアーゼ(TALEN)であり得る。TALENは、ヌクレアーゼドメインに連結している、転写活性化因子様エフェクター(TALE)に由来する高度に保存された反復配列で構成されるDNA結合ドメインを含む。TALEは植物病原菌キサントモナスによって分泌されるタンパク質であり、宿主植物細胞において遺伝子の転写を変化させる。TALE反復アレイは対象の任意のDNA配列を標的とするように、モジュラータンパク質設計を介して設計され得る。TALENのヌクレアーゼドメインは、上記のセクション(I)(a)(iii)に記述されているあらゆるヌクレアーゼドメインであり得る。具体的な実施態様において、ヌクレアーゼドメインはFokIに由来している(Sanjana et al., 2012, Nat Protoc, 7(1):171-192)。
【0059】
TALENはまた、核移行シグナル、細胞透過性ドメイン、マーカードメインおよび/または検出可能な標識のうち少なくとも1つを含み得、これらは上記のセクション(I)(a)(i)に記述されている。
【0060】
(v)メガヌクレアーゼまたはレアカットエンドヌクレアーゼ
さらなる他の実施態様において、プログラム可能なDNA修飾タンパク質はメガヌクレアーゼまたはその誘導体であり得る。メガヌクレアーゼは、長い認識配列(すなわち、認識配列が一般に約12塩基対~約45塩基対の範囲である)によって特徴付けられるエンドデオキシリボヌクレアーゼである。この要求の結果として、認識配列は一般に、所定のあらゆるゲノムにおいて一度しか生じない。メガヌクレアーゼの中で、LAGLIDADGと名付けられたホーミングエンドヌクレアーゼのファミリーはゲノムの研究およびゲノム編集のための有用なツールとなっている。いくつかの実施態様において、メガヌクレアーゼはI-SceI、I-TevIまたはそれらの変異体であり得る。メガヌクレアーゼは当業者に周知の技術を用いてその認識配列を改変することによって、特定の染色体配列を標的とし得る。
【0061】
代替の実施態様において、プログラム可能なDNA修飾タンパク質はレアカットエンドヌクレアーゼまたはその誘導体であり得る。レアカットエンドヌクレアーゼは部位特異的なエンドヌクレアーゼであり、その認識配列はゲノム中にまれに生じる(好ましくはゲノム中に一度しか生じない)。レアカットエンドヌクレアーゼは、7ヌクレオチドの配列、8ヌクレオチドの配列、またはそれよりも長い認識配列を認識し得る。レアカットエンドヌクレアーゼの限定されない例は、NotI、AscI、PacI、AsiSI、SbfIおよびFseIを含む。
【0062】
メガヌクレアーゼまたはレアカットエンドヌクレアーゼはまた、核移行シグナル、細胞透過性ドメイン、マーカードメインおよび/または検出可能な標識のうち少なくとも1つを含み得、これらは上記のセクション(I)(a)(i)に記述されている。
【0063】
(vi)ヌクレアーゼドメインを含むプログラム可能な融合タンパク質
さらなる他の実施態様において、プログラム可能なDNA修飾タンパク質は、(二本鎖切断)ヌクレアーゼドメインと連結したプログラム可能なDNA結合ドメインを含む融合タンパク質であり得る。融合タンパク質のヌクレアーゼドメインは、上記のセクション(I)(a)(iii)に記述されているヌクレアーゼドメインのいずれか、CRISPR/Casヌクレアーゼに由来するヌクレアーゼドメイン(例えば、Cas9のRuvC様ヌクレアーゼドメインもしくはHNH様ヌクレアーゼドメイン、またはCpf1のヌクレアーゼドメイン)、またはメガヌクレアーゼもしくはレアカットエンドヌクレアーゼに由来するヌクレアーゼドメインであり得る。
【0064】
融合タンパク質のプログラム可能なDNA結合ドメインは、全てのヌクレアーゼ活性を有さないように修飾されたプログラム可能なエンドヌクレアーゼ(すなわちCRISPR/Casヌクレアーゼまたはメガヌクレアーゼ)であり得る。したがって、融合タンパク質のDNA結合ドメインは、触媒不活性なCRISPR/Casシステムまたは触媒不活性なメガヌクレアーゼであり得る。あるいは、融合タンパク質のプログラム可能なDNA結合ドメインは、プログラム可能なDNA結合タンパク質(例えば、Znフィンガータンパク質または転写活性化因子様エフェクターなど)であり得る。いくつかの実施態様において、プログラム可能なDNA結合ドメインは、ヌクレアーゼ活性が変異および/または欠失によって除去された触媒不活性なCRISPR/Casヌクレアーゼであり得る。例えば、触媒不活性なCRISPR/Casタンパク質は、RuvC様ドメインがD10A、D8A、E762Aおよび/またはD986A変異を含み、HNH様ドメインがH840A、H559A、N854A、N865Aおよび/またはN863A変異を含む、触媒不活性な(不活性化)Cas9(dCas9)であり得る。あるいは、触媒不活性なCRISPR/Casタンパク質は、ヌクレアーゼドメイン中に相当する変異を含む触媒不活性な(不活性化)Cpf1タンパク質であり得る。さらなる他の実施態様において、プログラム可能なDNA結合ドメインは、ヌクレアーゼ活性が変異および/または欠失によって除去された触媒不活性なメガヌクレアーゼ(例えば、触媒不活性なメガヌクレアーゼはC末端短縮化を含み得る)であり得る。
【0065】
ヌクレアーゼ活性を含む融合タンパク質はまた、核移行シグナル、細胞透過性ドメイン、マーカードメインおよび/または検出可能な標識のうち少なくとも1つを含み得、これらは上記のセクション(I)(a)(i)に記述されている。
【0066】
(vii)非ヌクレアーゼドメインを含むプログラム可能な融合タンパク質/複合体
代替の実施態様において、プログラム可能なDNA修飾タンパク質は、非ヌクレアーゼ修飾ドメインと連結したプログラム可能なDNA結合ドメインを含む融合タンパク質であり得る。適切なプログラム可能なDNA結合ドメインは上記のセクション(I)(a)(vi)に記述されている。
【0067】
いくつかの実施態様において、非ヌクレアーゼ修飾ドメインはエピジェネティック修飾ドメインであり得、これはDNAまたはクロマチン構造を変化させる(DNA構造は変化させる場合もあり、または変化させない場合もある)。適切なエピジェネティック修飾ドメインの限定されない例は、DNAメチルトランスフェラーゼ活性(例えばシトシンメチルトランスフェラーゼ)、DNAデメチラーゼ活性、DNA脱アミノ化(例えば、シトシンデアミナーゼ、アデノシンデアミナーゼ、グアニンデアミナーゼ)、DNAアミノ化、DNAヘリカーゼ活性、ヒストンアセチルトランスフェラーゼ(HAT)活性(例えば、E1A結合タンパク質p300に由来するHATドメイン)、ヒストンデアセチラーゼ活性、ヒストンメチルトランスフェラーゼ活性、ヒストンデメチラーゼ活性、ヒストンキナーゼ活性、ヒストンホスファターゼ活性、ヒストンユビキチンリガーゼ活性、ヒストン脱ユビキチン化活性、ヒストンアデニル化活性、ヒストン脱アデニル化活性、ヒストンSUMO化活性、ヒストン脱SUMO化活性、ヒストンリボシル化活性、ヒストン脱リボシル化活性、ヒストンミリストイル化活性、ヒストン脱ミリストイル化活性、ヒストンシトルリン化活性、ヒストンアルキル化活性、ヒストン脱アルキル化活性、またはヒストン酸化活性を有するエピジェネティック修飾ドメインを含む。具体的な実施態様において、エピジェネティック修飾ドメインは、シトシンデアミナーゼ活性、ヒストンアセチルトランスフェラーゼ活性、またはDNAメチルトランスフェラーゼ活性を含み得る。
【0068】
他の実施態様において、非ヌクレアーゼ修飾ドメインは、転写活性化ドメインまたは転写抑制因子ドメインであり得る。適切な転写活性化ドメインは、限定されないが、単純ヘルペスウイルスVP16ドメイン、VP64(これはVP16の四量体の誘導体である)、VP160、NFκB p65活性化ドメイン、p53活性化ドメイン1および2、CREB(cAMP応答配列結合タンパク質)活性化ドメイン、E2A活性化ドメイン、ヒト熱ショック因子1(HSF1)由来の活性化ドメイン、またはNFAT(活性化T細胞の核内因子)活性化ドメインを含む。適切な転写抑制因子ドメインの限定されない例は、誘導性cAMP初期抑制因子(ICER)ドメイン、クルッペル関連ボックスA(KRAB-A)抑制因子ドメイン、YY1グリシンリッチ抑制因子ドメイン、Sp1様抑制因子、E(spl)抑制因子、IκB抑制因子またはMeCP2を含む。転写活性化ドメインまたは転写抑制因子ドメインは、DNA結合タンパク質と遺伝子融合していてもよく、または非共有結合的なタンパク質-タンパク質相互作用、タンパク質-RNA相互作用、もしくはタンパク質-DNA相互作用を介して結合していてもよい。
【0069】
プログラム可能なDNA修飾タンパク質がCRISPR/Casシステムを含んでいる実施態様において、CRISPR/CasシステムのガイドRNAは、転写活性化因子、転写抑制因子またはエピジェネティック修飾タンパク質を結合するアプタマー配列を含み得る(Konermann et al., Nature, 2015, 517(7536):583-588; Zalatan et al., Cell, 2015, 160(1-2):339-50)。
【0070】
非ヌクレアーゼ活性を含む融合タンパク質はまた、核移行シグナル、細胞透過性ドメイン、マーカードメインおよび/または検出可能な標識のうち少なくとも1つを含み得、これらは上記のセクション(I)(a)(i)に記述されている。
【0071】
(b)プログラム可能なDNA結合タンパク質
組成物はまた、少なくとも1つのプログラム可能なDNA結合タンパク質を含む。プログラム可能なDNA結合タンパク質は特定のDNA配列に結合するが、DNAまたはDNAに関連するタンパク質を修飾しないタンパク質である。
【0072】
いくつかの実施態様において、少なくとも1つのプログラム可能なDNA結合タンパク質は、ヌクレアーゼ活性を有さないように修飾されたCRISPR/Casヌクレアーゼであり得る。例えば、プログラム可能なDNA結合タンパク質は触媒不活性なCRISPR/Casシステムであり得る。このため、CRISPR/Casヌクレアーゼは、全てのヌクレアーゼ活性を除去するように変異および/または欠失によって修飾され得る。ある実施態様において、RuvC様ドメインおよびHNH様ドメインは共に、ヌクレアーゼ活性を除去するように1以上の変異および/または欠失を含む。例えば、触媒不活性なCRISPR/Casタンパク質は、RuvC様ドメインがD10A、D8A、E762Aおよび/またはD986A変異を含み、HNH様ドメインがH840A、H559A、N854A、N856Aおよび/またはN863A変異を含む、触媒不活性な(不活性化)Cas9(dCas9)であり得る。あるいは、触媒不活性なCRISPR/Casタンパク質は、ヌクレアーゼドメイン中に相当する変異を含む触媒不活性な(不活性化)Cpf1タンパク質であり得る。他の態様において、プログラム可能なDNA結合タンパク質は、上記のセクション(I)(a)(ii)に記述されるように、二本鎖配列の一方の鎖に切れ目を入れる(すなわちニッカーゼである)ように修飾されたCRISPR/Casタンパク質であり得る。
【0073】
他の実施態様において、少なくとも1つのプログラム可能なDNA結合タンパク質は、ヌクレアーゼ活性が変異および/または欠失によって除去された触媒不活性なメガヌクレアーゼ(例えば、触媒不活性なメガヌクレアーゼはC末端短縮化を含み得る)であり得る。さらなる他の実施態様において、少なくとも1つのプログラム可能なDNA結合タンパク質は、Znフィンガータンパク質または転写活性化因子様エフェクター(TALE)であり得る。さらなる実施態様において、少なくとも1つのプログラム可能なDNA結合タンパク質は、CRISPR/Casニッカーゼ、ZFNニッカーゼ、TALENニッカーゼまたはメガヌクレアーゼニッカーゼであり得る。ZFNニッカーゼ、TALENニッカーゼおよびメガヌクレアーゼニッカーゼは、ニッカーゼが二本鎖配列の一方の鎖のみを切断するように、ヌクレアーゼドメインまたはハーフドメインのうち1つにおいて変異および/または欠失を含む。
【0074】
プログラム可能なDNA結合タンパク質はまた、核移行シグナル、細胞透過性ドメイン、マーカードメインおよび/または検出可能な標識のうち少なくとも1つを含み得、これらは上記のセクション(I)(a)(i)に記述されている。
【0075】
(c)プログラム可能なDNA修飾タンパク質またはプログラム可能なDNA結合タンパク質をコードする核酸
上記のセクション(I)(a)に記述されるプログラム可能なDNA修飾タンパク質または上記のセクション(I)(b)に記述されるプログラム可能なDNA結合タンパク質をコードする核酸は、DNAまたはRNA、直鎖状または環状、一本鎖または二本鎖であり得る。RNAまたはDNAは、対象の真核細胞中でのタンパク質への効率的な翻訳のためにコドン最適化され得る。コドン最適化プログラムはフリーウェアとして、または商業的供給源から利用できる。
【0076】
いくつかの実施態様において、プログラム可能なDNA修飾タンパク質または少なくとも1つのプログラム可能なDNA結合タンパク質をコードする核酸はmRNAであり得る。mRNAはインビトロで合成され得る。このため、DNA修飾タンパク質または少なくとも1つのDNA結合タンパク質をコードするDNAは、mRNAのインビトロ合成のためにファージRNAポリメラーゼによって認識されるプロモーター配列に作動可能に連結され得る。例えば、プロモーター配列はT7、T3またはSP6プロモーター配列またはT7、T3またはSP6プロモーター配列の変種であり得る。そのような実施態様において、インビトロで転写されたRNAは、精製、キャッピングおよび/またはポリアデニル化され得る。以下で詳述するように、DNA修飾タンパク質またはDNA結合タンパク質をコードするDNAはベクターの一部であり得る。
【0077】
他の実施態様において、プログラム可能なDNA修飾タンパク質または少なくとも1つのプログラム可能なDNA結合タンパク質をコードする核酸はDNAであり得る。プログラム可能なDNA修飾タンパク質または少なくとも1つのプログラム可能なDNA結合タンパク質をコードするDNA配列は、対象の細胞内での発現のために少なくとも1つのプロモーター制御配列に作動可能に連結され得る。いくつかの実施態様において、DNAコード配列はまた、ポリアデニル化シグナル(例えば、SV40ポリAシグナル、ウシ成長ホルモン(BGH)ポリAシグナルなど)および/または少なくとも1つの転写終結配列に連結され得る。
【0078】
ある実施態様において、DNAコード配列は、細菌(例えば大腸菌)細胞または真核(例えば、酵母、昆虫または哺乳類)細胞におけるDNA修飾タンパク質またはDNA結合タンパク質の発現のために、プロモーター配列に作動可能に連結され得る。適切な細菌性プロモーターは、限定されないが、T7プロモーター、lacオペロンプロモーター、trpプロモーター、tacプロモーター(trpおよびlacプロモーターのハイブリッド)、上記のいずれかの変種、および上記のいずれかの組合せを含む。適切な真核生物プロモーターの限定されない例には、構成的プロモーター、調節されたプロモーター、または細胞特異的プロモーターもしくは組織特異的プロモーターが含まれる。適切な真核生物の構成的プロモーター制御配列には、限定されないが、サイトメガロウイルス(CMV)前初期プロモーター、サルウイルス(SV40)プロモーター、アデノウイルス主要後期プロモーター、ラウス肉腫ウイルス(RSV)プロモーター、マウス乳癌ウイルス(MMTV)プロモーター、ホスホグリセリン酸キナーゼ(PGK)プロモーター、伸長因子(ED-1)アルファプロモーター、ユビキチンプロモーター、アクチンプロモーター、チューブリンプロモーター、免疫グロブリンプロモーター、それらのフラグメント、または上記のいずれかの組み合わせが含まれる。適切な真核生物の調節されたプロモーター制御配列には、限定されないが、熱ショック、金属、ステロイド、抗生物質またはアルコールによって調節されたプロモーター制御配列が含まれる。組織特異的プロモーターの限定されない例は、B29プロモーター、CD14プロモーター、CD43プロモーター、CD45プロモーター、CD68プロモーター、デスミンプロモーター、エラスターゼ1プロモーター、エンドグリンプロモーター、フィブロネクチンプロモーター、Flt-1プロモーター、GFAPプロモーター、GPIIbプロモーター、ICAM-2プロモーター、INF-βプロモーター、Mbプロモーター、NphsIプロモーター、OG-2プロモーター、SP-Bプロモーター、SYN1プロモーター、およびWASPプロモーターを含む。プロモーター配列は野生型であってもよく、またはより効率的もしくは効果的な発現のために改変されていてもよい。
【0079】
様々な実施態様において、プログラム可能なDNA修飾タンパク質および/または少なくとも1つのプログラム可能なDNA結合タンパク質をコードする核酸はベクター中に存在し得る。適切なベクターには、プラスミドベクター、ファージミド、コスミド、人工/ミニ染色体、トランスポゾンおよびウイルスベクター(例えば、レンチウイルスベクター、アデノ随伴ウイルスベクター、アデノウイルスベクターなど)が含まれる。ある実施態様において、プログラム可能なDNA修飾タンパク質および/または少なくとも1つのプログラム可能なDNA結合タンパク質をコードするDNAはプラスミドベクター中に存在し得る。適切なプラスミドベクターの限定されない例は、pUC、pBR322、pET、pBluescriptおよびそれらの変異体を含む。他の実施態様において、プログラム可能なDNA修飾タンパク質および/または少なくとも1つのプログラム可能なDNA結合タンパク質をコードする核酸は、ウイルスベクター中に存在し得る。プラスミドまたはウイルスベクターは、追加の発現制御配列(例えば、エンハンサー配列、Kozak配列、ポリアデニル化配列、転写終結配列など)、選択可能なマーカー配列(例えば、抗生物質抵抗性遺伝子)、および複製起点などを含み得る。さらなる情報が、"Current Protocols in Molecular Biology" Ausubel et al., John Wiley & Sons, New York, 2003または"Molecular Cloning: A Laboratory Manual" Sambrook & Russell, Cold Spring Harbor Press, Cold Spring Harbor, NY, 3rd edition, 2001に見出され得る。
【0080】
プログラム可能なDNA修飾タンパク質および/または少なくとも1つのプログラム可能なDNA結合タンパク質がCRISPR/Casタンパク質またはその変異体を含む実施態様において、プログラム可能なDNA修飾タンパク質および/または少なくとも1つのプログラム可能なDNA結合タンパク質をコードする核酸を含む発現ベクターは、1以上のガイドRNAをコードする配列をさらに含み得る。ガイドRNAをコードする配列は一般に、対象の真核細胞中におけるガイドRNAの発現のために少なくとも1つの転写制御配列に作動可能に連結している。例えば、ガイドRNAをコードする核酸は、RNAポリメラーゼIII(Pol III)によって認識されるプロモーター配列に作動可能に連結され得る。適切なPol IIIプロモーターの例には、限定されないが、哺乳類U6、U3、H1、および7SL RNAプロモーターが含まれる。
【0081】
(d)具体的な組成物
いくつかの実施態様において、プログラム可能なDNA修飾タンパク質および1以上のプログラム可能なDNA結合タンパク質は、タンパク質(または、場合によりタンパク質-RNA複合体)として提供される。プログラム可能なDNA修飾タンパク質およびプログラム可能なDNA結合タンパク質は、細菌細胞または真核細胞において発現され得、当分野で周知の手段を用いて精製され得る。他の実施態様において、プログラム可能なDNA修飾タンパク質および1以上のプログラム可能なDNA結合タンパク質は、それらをコードする核酸として提供される。
【0082】
いくつかの実施態様において、組成物は、1つのプログラム可能なDNA結合タンパク質/システムまたはそれをコードする核酸を含み得る。他の実施態様において、組成物は、2つのプログラム可能なDNA結合タンパク質/システムまたはそれらをコードする核酸を含み得る。さらなる他の実施態様において、組成物は、3つのプログラム可能なDNA結合タンパク質/システムまたはそれらをコードする核酸を含み得る。さらなる実施態様において、組成物は、4つのプログラム可能なDNA結合タンパク質/システムまたはそれらをコードする核酸を含み得る。さらなる他の実施態様において、組成物は、5つ以上のプログラム可能なDNA結合タンパク質/システムまたはそれらをコードする核酸を含み得る。
【0083】
具体的な実施態様において、プログラム可能なDNA修飾タンパク質は、CRISPR/Casシステム(例えば、CRISPR/Casヌクレアーゼ、CRISPR/Cas二重ニッカーゼ、または非ヌクレアーゼ修飾ドメインと連結した触媒不活性な(不活性化)CRISPR/Casタンパク質)を含み得、プログラム可能なDNA結合タンパク質は、ヌクレアーゼ活性を有さないCRISPR/Casシステムであり得る。例えば、プログラム可能なDNA結合タンパク質は、触媒不活性なCRISPR/Casシステムであり得る。一般に、各CRISPR/Casタンパク質は、少なくとも1つの核移行シグナルを含む。いくつかの反復において、組成物は、CRISPR/Casタンパク質およびガイドRNAとしてCRISPR/Casシステムを含み得、ここで該タンパク質およびRNAはその実体が分離されていてもよく、または複合体形成されていてもよい。ガイドRNAは少なくとも部分的に化学合成され得る。ガイドRNAは酵素的に合成され得る。他の反復において、組成物は、ガイドRNAをコードするDNAおよびCRISPR/Casタンパク質を含み得る。さらなる他の反復において、組成物は、CRISPR/Casタンパク質をコードするmRNAおよびガイドRNAをコードするDNAを含み得る。さらなる他の反復において、組成物は、CRISPR/Casタンパク質および/またはガイドRNAをコードするプラスミドまたはウイルスベクターを含み得る。ある実施態様において、触媒活性なCRISPR/Casタンパク質および触媒不活性な(不活性化)CRISPR/Casタンパク質はCas9タンパク質である。CRISPR/Casタンパク質をコードする核酸は一般に、対象の真核細胞における最適な発現のためにコドン最適化されている。
【0084】
(II)キット
本開示のさらなる態様は、上記のセクション(I)において詳述された組成物を含むキットを提供する。キットは、上記で詳述されたように、プログラム可能なDNA修飾タンパク質および少なくとも1つのプログラム可能なDNA結合タンパク質をタンパク質として、タンパク質-RNA複合体として、または様々な構成要素をコードする核酸として提供し得る。キットは、遺伝子導入試薬、細胞増殖培地、選択培地、インビトロにおける転写試薬、核酸精製試薬、タンパク質精製試薬、および緩衝液などをさらに含み得る。本明細書で提供されるキットは一般に、下記で詳述される方法を実行するための説明書を含む。キットに含まれる説明書は、包装材に貼り付けられていてもよく、または添付文書として含まれていてもよい。説明書は通常、資料または印刷物であるが、そのようなものに限定されない。そのような説明書を格納でき、エンドユーザーに伝達できるあらゆる媒体が本開示によって想定される。そのような媒体には、限定されないが、電子記憶媒体(例えば、磁気ディスク、テープ、カートリッジ、チップ)、および光学式媒体(例えばCD ROM)などが含まれる。本明細書において、用語「説明書」は、説明書を提供するインターネットサイトのアドレスを含み得る。
【0085】
いくつかの実施態様において、キットのプログラム可能なDNA修飾タンパク質および/または少なくとも1つのプログラム可能なDNA結合タンパク質は、II型CRISPR/Casシステムを含み得る。ある実施態様において、II型CRISPR/CasシステムのガイドRNAは、crRNAおよびtracrRNAを含み得る。したがって、キットはユニバーサルなtracrRNAを提供し得、キットのエンドユーザーが配列特異的なcrRNAを提供し得る。いくつかの態様において、キットはII型CRISPR/Casタンパク質およびtracrRNAを含み得る。他の態様において、キットはII型CRISPR/Casタンパク質をコードするmRNAまたはDNAおよびtracrRNAをコードするDNAを含み得る。
【0086】
さらなる他の実施態様において、キットのプログラム可能なDNA修飾タンパク質および/または少なくとも1つのプログラム可能なDNA結合タンパク質は、V型CRISPR/Casシステムを含み得る。上記で詳述されたように、V型CRISPR/CasシステムのガイドRNAはcrRNAのみを含む。いくつかの態様において、キットはV型CRISPR/Casタンパク質およびcrRNAを含み得、またはキットはV型CRISPR/Casタンパク質をコードするmRNAもしくはDNAおよびcrRNAをコードするDNAを含み得る。他の態様において、キットはV型CRISPR/Casタンパク質またはV型CRISPR/Casタンパク質をコードする核酸のみを含み得、ここでキットのエンドユーザーがcrRNAを提供する。
【0087】
(III)標的染色体部位へのアクセスしやすさを増大させる方法
本開示の別の態様は、プログラム可能なDNA修飾タンパク質の、染色体DNA中の標的配列へのアクセスしやすさを増大させることによって、真核細胞における標的ゲノム/エピジェネティック修飾の効率および/または特異性を増大させる方法を包含する。本方法は、対象の真核細胞に、(a)プログラム可能なDNA修飾タンパク質またはプログラム可能なDNA修飾タンパク質をコードする核酸、および(b)少なくとも1つのプログラム可能なDNA結合タンパク質または少なくとも1つのプログラム可能なDNA結合タンパク質をコードする核酸を導入することを含む。プログラム可能なDNA修飾タンパク質は、染色体DNA中の標的配列(これは、DNA修飾タンパク質がDNAまたは関連タンパク質を修飾し得る部位である)を認識し、結合するように設計される。1以上のプログラム可能な各DNA結合タンパク質は、DNA修飾タンパク質の標的染色体配列の近位の配列を認識し、結合するように設計される。プログラム可能なDNA修飾タンパク質およびプログラム可能なDNA結合タンパク質は、上記のセクション(I)において詳述されている。
【0088】
一般に、標的染色体配列の近位の配列は、標的染色体配列の一方の側(すなわち上流または下流)の約250塩基対以内に位置している。近位部は二本鎖DNAの一方の鎖上に位置し得る。いくつかの実施態様において、標的染色体配列の近位の配列は、DNA修飾タンパク質の標的染色体配列から約250bp未満、約200bp未満、約150bp未満、約100bp未満、約75bp未満、約50bp未満、約25bp未満、約20bp未満、約15bp未満、約10bp未満、または約5bp未満に位置し得る。ある実施態様において、標的染色体配列の近位の配列は、標的染色体配列の一方の側の約1bp~約10bp、約11bp~約20bp、約21bp~約30bp、約31bp~約40bp、約41bp~約50bp、約51bp~約60bp、約61bp~約70bp、約71bp~約80bp、約81bp~約90bp、約91bp~約100bp、約101bp~約150bp、約151bp~約200bp、または約201bp~約250bpに位置し得る。他の実施態様において、標的染色体配列の近位の配列は、標的染色体配列の一方の側の約5bp~約75bp、約10bp~約50bpまたは約15bp~約25bpに位置し得る。
【0089】
いくつかの実施態様において、本方法は、細胞に少なくとも1つのプログラム可能なDNA結合タンパク質を導入することを含み、このタンパク質の結合配列は、標的染色体配列の上流または下流のいずれかに位置している。他の実施態様において、本方法は、細胞に少なくとも2つのプログラム可能なDNA結合タンパク質を導入することを含み、これらのタンパク質の一方の結合配列は標的染色体配列の上流に位置し、他方の結合配列は標的染色体配列の下流に位置している。さらなる実施態様において、本方法は、細胞に少なくとも3つのプログラム可能なDNA結合タンパク質を導入することを含み、これらのタンパク質の結合配列は、標的染色体配列の上流または下流のいずれかに位置している。さらなる実施態様において、本方法は、細胞に少なくとも4つ以上のプログラム可能なDNA結合タンパク質を導入することを含み、これらのタンパク質の結合配列は、標的染色体配列の上流または下流のいずれかに位置している。これらの実施態様において、例えば、本方法は、1、2、3、4、5、6、7、8、9、10またはそれ以上のプログラム可能なDNA結合タンパク質を導入することを含み得、これらのタンパク質の結合配列は、標的染色体配列の一方の側(すなわち上流または下流)の約250bp以内に位置している。
【0090】
1以上のプログラム可能な各DNA結合タンパク質と標的染色体配列の近位の部位との結合は、局所的なクロマチン配置を変化させ、これはプログラム可能なDNA修飾タンパク質の(これまでアクセスできなかった)標的染色体配列へのアクセスしやすさの増大を導く(
図1参照)。結果として、DNA修飾タンパク質による修飾の効率が増大する(例えば実施例1~3参照)。言い換えると、DNA修飾タンパク質が細胞に単独で導入された場合と比較して、DNA修飾タンパク質が細胞に1以上のプログラム可能なDNA結合タンパク質と組み合わせて導入された場合、DNA修飾タンパク質による修飾の効率は増大する。
【0091】
さらに、本明細書において開示される方法は、標的ゲノム修飾の特異性を増大させる。プログラム可能なDNA修飾タンパク質は特定の染色体座における標的配列を認識し、結合するように設計されるが、同一またはほとんど同一の配列が他の染色体位置に存在し得る(これはオフターゲット効果をもたらす)。しかしながら、プログラム可能なDNA修飾タンパク質と標的染色体配列との結合が、1以上のプログラム可能なDNA結合タンパク質と標的染色体配列の近位の配列との結合に大きく依存している実施態様において、1以上のプログラム可能なDNA結合タンパク質と対象の染色体座における標的配列の近位の部位との結合は、修飾イベントに対してさらなる特異性を提供する(実施例4参照)。
【0092】
したがって、本明細書において開示される方法は、標的ゲノム編集(例えば、遺伝子修復、遺伝子ノックアウト、および遺伝子ノックインなど)、標的エピジェネティック修飾、および標的転写制御の効率および/または特異性を増大させ得る。
【0093】
(a)細胞への導入
記述されるように、本方法は細胞に、(a)プログラム可能なDNA修飾タンパク質またはプログラム可能なDNA修飾タンパク質をコードする核酸、および(b)少なくとも1つのプログラム可能なDNA結合タンパク質または少なくとも1つのプログラム可能なDNA結合タンパク質をコードする核酸を導入することを含む。プログラム可能なDNA修飾タンパク質は上記のセクション(I)(a)において詳述され、プログラム可能なDNA結合タンパク質は上記のセクション(I)(b)において詳述され、DNA修飾タンパク質またはプログラム可能なDNA結合タンパク質をコードする核酸は上記のセクション(I)(c)において記述されている。
【0094】
プログラム可能なDNA修飾タンパク質またはプログラム可能なDNA修飾タンパク質をコードする核酸および少なくとも1つのプログラム可能なDNA結合タンパク質または少なくとも1つのプログラム可能なDNA結合タンパク質をコードする核酸は、多様な手段によって対象の細胞に導入され得る。
【0095】
いくつかの実施態様において、細胞には適切な分子(すなわちタンパク質、DNAおよび/またはRNA)が遺伝子導入され得る。適切な遺伝子導入方法には、ヌクレオフェクション(nucleofection)(またはエレクトロポレーション)、リン酸カルシウム介在性遺伝子導入、カチオン性ポリマー遺伝子導入(例えば、DEAE-デキストランまたはポリエチレンイミン)、ウイルス形質導入、ビロソーム遺伝子導入、ビリオン遺伝子導入、リポソーム遺伝子導入、カチオン性リポソーム遺伝子導入、免疫リポソーム遺伝子導入、非リポソーム脂質遺伝子導入、デンドリマー遺伝子導入、熱ショック遺伝子導入、マグネトフェクション、リポフェクション、遺伝子銃送達、インペールフェクション(impalefection)、ソノポレーション、光学遺伝子導入、および専売薬によって増強される核酸の取り込みが含まれる。遺伝子導入方法は当分野で周知である(例えば、"Current Protocols in Molecular Biology" Ausubel et al., John Wiley & Sons, New York, 2003または"Molecular Cloning: A Laboratory Manual" Sambrook & Russell, Cold Spring Harbor Press, Cold Spring Harbor, NY, 3rd edition, 2001参照)。他の実施態様において、分子はマイクロインジェクション法によって細胞に導入され得る。例えば、分子は対象の細胞の細胞質または核に注入され得る。細胞に導入された各分子の量は様々であり得るが、当業者は適切な量を決定する手段に精通している。
【0096】
様々な分子が細胞に同時または連続的に導入され得る。例えば、プログラム可能なDNA修飾タンパク質(またはそれをコードする核酸)および少なくとも1つのプログラム可能なDNA結合タンパク質(またはそれをコードする核酸)は同時に導入され得る。あるいは、一方が最初に細胞に導入され得、他方がその後に導入され得る。
【0097】
一般に、細胞は細胞増殖および/または維持に適した条件下で維持される。適切な細胞培養条件は当分野で周知であり、例えば、Santiago et al., Proc. Natl. Acad. Sci. USA, 2008, 105:5809-5814;Moehle et al. Proc. Natl. Acad. Sci. USA, 2007, 104:3055-3060;Urnov et al., Nature, 2005, 435:646-651;およびLombardo et al., Nat. Biotechnol., 2007, 25:1298-1306に記載されている。当業者は、細胞を培養する方法が当分野で公知であり、細胞種に依存して様々であり得ることを認識している。あらゆる場合において、特定の細胞種のための最良の技術を決定するために通常の最適化が用いられ得る。
【0098】
(b)標的ゲノム修飾
1以上のプログラム可能なDNA結合タンパク質と標的染色体配列の近位の配列との結合は、局所的なクロマチン配置を変化させる(例えば、ヌクレオソーム構造が変化し得、かつ/またはヒストンが移動し得る)。結果として、プログラム可能なDNA修飾タンパク質を単独で使用する場合と比較して、プログラム可能なDNA修飾タンパク質は標的染色体配列によりアクセスできる。このアクセスしやすさの増大は、標的ゲノム修飾の効率および/または特異性の増大をもたらす。標的ゲノム/エピジェネティック修飾は、ヌクレアーゼ活性または非ヌクレアーゼ活性を有するDNA修飾タンパク質によって仲介され得る。
【0099】
プログラム可能なDNA修飾タンパク質がヌクレアーゼ活性を有する実施態様において、DNA修飾タンパク質は標的染色体配列に二本鎖切断を導入し得る。染色体配列中の二本鎖切断は、非相同末端結合(NHEJ)修復プロセスによって修復され得る。NHEJはエラーが発生しやすいため、少なくとも1つのヌクレオチドの欠失、少なくとも1つのヌクレオチドの挿入、少なくとも1つのヌクレオチドの置換、またはそれらの組合せが切断の修復中に生じ得る。したがって、標的染色体配列が修飾または不活性化され得る。例えば、コード配列のリーディングフレームのシフトにおける欠失、挿入または置換は、タンパク質産物の変化またはタンパク質産物が生じないこと(「ノックアウト」と呼ばれる)を導き得る。いくつかの反復において、本方法は、ドナー配列を含むドナーポリヌクレオチド(下記参照)を細胞に導入することをさらに含み得、相同組換え修復過程(HDR)による二本鎖切断の修復中に、ドナーポリヌクレオチド中のドナー配列が標的染色体配列における染色体配列と交換され得、またはその染色体配列中に組み込まれ得るように、このドナー配列は標的染色体配列の一方の側に位置する配列と実質的な配列同一性を有する配列に隣接している。外来性配列の組込みは「ノックイン」と呼ばれる。上記で詳述されるように、本明細書において開示される方法はオフターゲット効果を減少させ、それにより標的ゲノム修飾の特異性を増大させる。
【0100】
したがって、様々な反復において、標的ゲノム修飾の効率および/または特異性は、ヌクレアーゼ活性を有するプログラム可能なDNA修飾タンパク質を単独で使用した場合と比較して、少なくとも約0.1倍、少なくとも約0.5倍、少なくとも約1倍、少なくとも約2倍、少なくとも約5倍、少なくとも約10倍、または少なくとも約20倍、少なくとも約50倍、少なくとも約100倍、または約100倍を超えて増大され得る。例えば、ヌクレアーゼ活性を有するプログラム可能なDNA修飾タンパク質は単独で使用される場合、検出可能なインデルまたは組込みイベントを有さなくてもよい。しかしながら、ヌクレアーゼ活性を有するプログラム可能なDNA修飾タンパク質が少なくとも1つのプログラム可能なDNA結合タンパク質と組み合わせて使用される場合、インデルおよび組込みイベント(例えば、少なくとも約1%のインデル/組込み、少なくとも約5%のインデル/組込み、少なくとも約10%のインデル/組込み、少なくとも約20%のインデル/組込み、少なくとも約30%のインデル/組込み、少なくとも約40%のインデル/組込み、少なくとも約50%のインデル/組込み、または約50%を超えるインデル/組込み)が検出され得る。
【0101】
プログラム可能なDNA修飾タンパク質が非ヌクレアーゼ活性を有する実施態様において、DNA修飾タンパク質は、標的染色体配列においてDNAもしくは関連タンパク質を修飾し得、または標的染色体配列の発現を修飾し得る。例えば、プログラム可能なDNA修飾タンパク質がエピジェネティック修飾活性を含む場合、ヒストンアセチル化、メチル化、リン酸化、アデニル化などの状態が修飾され得、またはDNAメチル化、アミノ化などの状態が修飾され得る。例として、プログラム可能なDNA修飾タンパク質がシトシンデアミナーゼ活性を含む実施態様において、標的染色体配列における1以上のシトシン残基がウラシル残基に変換され得る。あるいは、プログラム可能なDNA修飾タンパク質が転写活性化活性または転写抑制因子活性を含む場合、標的染色体配列における転写が増加または減少し得る。結果として得られるエピジェネティック修飾または転写制御は、非ヌクレアーゼ活性を有するプログラム可能なDNA修飾タンパク質を単独で使用する場合と比較して、少なくとも約0.1倍、少なくとも約0.5倍、少なくとも約1倍、少なくとも約2倍、少なくとも約5倍、少なくとも約10倍、または少なくとも約20倍、少なくとも約50倍、少なくとも約100倍、または約100倍を超えて増大され得る。
【0102】
上述の標的ゲノム修飾/エピジェネティック修飾は単独で実行され得、または多重化され得る(すなわち、2以上の染色体配列が同時に標的にされ得る)。
【0103】
(c)任意のドナーポリヌクレオチド
プログラム可能なDNA修飾タンパク質がヌクレアーゼ活性を含む実施態様において、本方法はさらに、少なくとも1つのドナーポリヌクレオチドを細胞に導入することを含み得る。ドナーポリヌクレオチドは一本鎖もしくは二本鎖であり得、直鎖状もしくは環状であり得、かつ/またはRNAもしくはDNAであり得る。いくつかの実施態様において、ドナーポリヌクレオチドはベクター(例えばプラスミドベクター)であり得る。
【0104】
ドナーポリヌクレオチドは少なくとも1つのドナー配列を含む。いくつかの態様において、ドナーポリヌクレオチドのドナー配列は、内在性または天然染色体配列の修飾されたバージョンであり得る。例えば、ドナー配列は、DNA修飾タンパク質によって標的とされた配列またはその付近における染色体配列の一部と本質的に同一であり得るが、少なくとも1つのヌクレオチド交換を含む。したがって、天然配列への組込みまたは天然配列との交換により、標的染色体位置における配列は少なくとも1つのヌクレオチド交換を含む。例えば、この交換は、1以上のヌクレオチドの挿入、1以上のヌクレオチドの欠失、1以上のヌクレオチドの置換、またはそれらの組合せであり得る。修飾された配列の「遺伝子修正」の組込みの結果として、細胞は標的染色体配列から修飾された遺伝子産物を産生し得る。
【0105】
他の態様において、ドナーポリヌクレオチドのドナー配列は外来性配列であり得る。本明細書において、「外来性」配列は、細胞に対して天然でない配列、または細胞のゲノムにおけるその配列の天然の位置が異なった位置にある配列を指す。例えば、外来性配列はタンパク質をコードする配列を含み得、これはゲノムへの組込みにより、細胞が組み込まれた配列によってコードされたタンパク質を発現できるように、外来性プロモーター制御配列に作動可能に連結され得る。あるいは、外来性配列は、その発現が内在性プロモーター制御配列によって調節されるように、染色体配列に組み込まれ得る。他の反復において、外来性配列は、転写制御配列、別の発現制御配列、およびRNAをコードしている配列などであり得る。上述のように、外来性配列の染色体配列への組み込みは「ノックイン」と呼ばれる。
【0106】
当業者に認識され得るように、ドナー配列の長さは様々であり得る。例えば、ドナー配列は、数ヌクレオチドから数百ヌクレオチド、数百ヌクレオチドから数十万ヌクレオチドまでの長さにおいて様々であり得る。
【0107】
通常、ドナーポリヌクレオチドにおけるドナー配列は上流配列および下流配列に隣接しており、これらの配列はプログラム可能なDNA修飾タンパク質によって標的とされる配列のそれぞれ上流および下流に位置する配列と実質的な配列同一性を有する。これらの配列類似性のために、ドナーポリヌクレオチドの上流配列および下流配列は、ドナー配列が染色体配列に組み込まれ得る(または、染色体配列と交換され得る)ように、ドナーポリヌクレオチドと標的染色体配列との間の相同組換えを可能にする。
【0108】
本明細書において、上流配列は、プログラム可能なDNA修飾タンパク質によって標的とされる配列の上流の染色体配列との実質的な配列同一性を有する核酸配列を指す。同様に、下流配列は、プログラム可能なDNA修飾タンパク質によって標的とされる配列の下流の染色体配列との実質的な配列同一性を有する核酸配列を指す。本明細書において、語句「実質的な配列同一性」は、少なくとも約75%の配列同一性を有する配列を指す。したがって、ドナーポリヌクレオチドにおける上流配列および下流配列は、標的配列の上流の配列または下流の配列との約75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有し得る。例示的な実施態様において、ドナーポリヌクレオチドにおける上流配列および下流配列は、プログラム可能なDNA修飾タンパク質によって標的とされる配列の上流または下流の染色体配列との約95%または100%の配列同一性を有し得る。
【0109】
いくつかの実施態様において、上流配列は、プログラム可能なDNA修飾タンパク質によって標的とされる配列のすぐ上流に位置する染色体配列との実質的な配列同一性を有する。他の実施態様において、上流配列は、標的配列から約百(100)ヌクレオチド以内の上流に位置する染色体配列との実質的な配列同一性を有する。したがって、例えば、上流配列は、標的配列から約1~約20、約21~約40、約41~約60、約61~約80、または約81~約100ヌクレオチド上流に位置する染色体配列との実質的な配列同一性を有し得る。いくつかの実施態様において、下流配列は、プログラム可能なDNA修飾タンパク質によって標的とされる配列のすぐ下流に位置する染色体配列との実質的な配列同一性を有する。他の実施態様において、下流配列は、標的配列から約百(100)ヌクレオチド以内の下流に位置する染色体配列との実質的な配列同一性を有する。したがって、例えば、下流配列は、標的配列から約1~約20、約21~約40、約41~約60、約61~約80、または約81~約100ヌクレオチド下流に位置する染色体配列との実質的な配列同一性を有し得る。
【0110】
各上流配列または下流配列は、約20ヌクレオチド~約5000ヌクレオチド長であり得る。いくつかの実施態様において、上流配列および下流配列は、約50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2800、3000、3200、3400、3600、3800、4000、4200、4400、4600、4800、または5000ヌクレオチドを含み得る。具体的な実施態様において、上流配列および下流配列は約50~約1500ヌクレオチド長であり得る。
【0111】
(e)細胞種
多様な細胞が本明細書で開示される方法における使用に適している。一般に、細胞は真核細胞である。例えば、細胞は、ヒト哺乳類細胞、非ヒト哺乳類細胞、非哺乳類脊椎動物細胞、無脊椎動物細胞、昆虫細胞、植物細胞、酵母細胞または単細胞真核生物であり得る。いくつかの実施態様において、細胞はまた、1つの細胞胚であり得る。例えば、非ヒト哺乳類胚は、ラット、ハムスター、げっ歯類、ウサギ、ネコ、イヌ、ヒツジ、ブタ、ウシ、ウマおよび霊長類胚を含む。さらなる他の実施態様において、細胞は幹細胞(胚性幹細胞、ES様幹細胞、胎生幹細胞、および成体幹細胞など)であり得る。ある実施態様において、幹細胞はヒト胚性幹細胞ではない。さらに、幹細胞は、WO2003/046141(これはその全体が本明細書に組み込まれる)またはChung et al. (Cell Stem Cell, 2008, 2:113-117)に開示される技術によって作製された幹細胞を含み得る。細胞はインビトロまたはインビボ(すなわち生体内)であり得る。例示的な実施態様において、細胞は哺乳類細胞である。特定の実施態様において、細胞はヒト細胞である。
【0112】
適切な哺乳類細胞の限定されない例には、ヒト胚性腎細胞(HEK293、HEK293T);ヒト子宮頸がん細胞(HELA);ヒト肺細胞(W138);ヒト肝細胞(Hep G2);ヒトU2-OS骨肉腫細胞、ヒトA594細胞、ヒトA-431細胞およびヒトK562細胞;チャイニーズハムスター卵巣(CHO)細胞、ベビーハムスター腎臓(BHK)細胞;マウス骨髄腫NS0細胞、マウス胚性線維芽3T3細胞(NIH3T3)、マウスBリンパ腫A20細胞;マウス黒色腫B16細胞;マウス筋芽C2C12細胞;マウス骨髄腫SP2/0細胞;マウス胚性間葉C3H-10T1/2細胞;マウスがんCT26細胞、マウス前立腺DuCuP細胞;マウス乳腺EMT6細胞;マウス肝がんHepa1c1c7細胞;マウス骨髄腫J5582細胞;マウス上皮MTD-1A細胞;マウス心筋MyEnd細胞;マウス腎臓RenCa細胞;マウス膵臓RIN-5F細胞;マウス黒色腫X64細胞;マウスリンパ腫YAC-1細胞;ラット膠芽腫9L細胞;ラットBリンパ腫RBL細胞;ラット神経芽腫B35細胞;ラット肝がん細胞(HTC);バッファローラット肝臓BRL3A細胞;イヌ腎臓細胞(MDCK);イヌ乳腺(CMT)細胞;ラット骨肉腫D17細胞;ラット単球/マクロファージDH82細胞;サル腎臓SV-40形質転換線維芽(COS7)細胞;サル腎臓CVI-76細胞;アフリカミドリザル腎臓(VERO-76)細胞が含まれる。哺乳類細胞株の広範なリストが、American Type Culture Collection(ATCC, Manassas, VA)のカタログに見出され得る。
【0113】
(IV)特定のゲノム遺伝子座を検出する方法
また、本明細書において、真核細胞中の特定のゲノム遺伝子座を検出または可視化する方法が提供される。1以上のプログラム可能なDNA結合タンパク質の近位の結合はクロマチン構造を変化させ、プログラム可能なDNA修飾タンパク質の以前にアクセスできなかった染色体座へのアクセスを増大させるため、上記のセクション(III)において記述された方法は、特定のゲノム遺伝子座または標的染色体配列の検出を増強するように修飾され得る。本方法は真核細胞に、(a)少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質または少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質をコードする核酸、および(b)少なくとも1つのプログラム可能なDNA結合タンパク質または少なくとも1つのプログラム可能なDNA結合タンパク質をコードする核酸を導入することを含み、ここで少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質は標的染色体配列を標的とし、1以上のプログラム可能な各DNA結合タンパク質は標的染色体配列の近位の部位を標的とする。少なくとも1つのプログラム可能なDNA結合タンパク質と標的染色体配列の近位の部位との結合は、少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質の標的染色体配列へのアクセスしやすさを増大させる。本方法はさらに、標的染色体配列に結合した少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質を検出することを含む。
【0114】
少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質は、プログラム可能なDNA結合ドメインを含む。適切なプログラム可能なDNA結合ドメインは上記のセクション(I)(a)(vi)に記述されている。具体的な実施態様において、プログラム可能なDNA結合ドメインは、触媒不活性なCRISPR/Casシステム、触媒不活性なメガヌクレアーゼ、Znフィンガータンパク質、または転写活性化因子様エフェクターであり得る。プログラム可能なDNA結合タンパク質の少なくとも1つの検出可能なマーカードメインは蛍光タンパク質(例えば、GFP、eGFPおよびRFPなど)、蛍光タグ、またはエピトープタグ(これらは上記のセクション(I)(a)(i)に記述されている)であり得る。ある実施態様において、プログラム可能なDNA結合タンパク質の少なくとも1つの検出可能なマーカードメインは、プログラム可能なDNA結合タンパク質がプログラム可能なDNA結合タンパク質に対する抗体によって検出され得るように、プログラム可能なDNA結合タンパク質中の天然に存在するエピトープであり得る。少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質は、上記のセクション(I)(a)(i)に記述されるように、少なくとも1つの核移行シグナルおよび/または細胞透過性ドメインをさらに含み得る。いくつかの実施態様において、少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質は、(上記のセクション(I)(a)(vi)に記述される)非ヌクレアーゼ修飾ドメインをさらに含み得る。
【0115】
1以上のプログラム可能なDNA結合タンパク質は上記のセクション(I)(b)に記述されている。一般に、少なくとも1つのプログラム可能なDNA結合タンパク質は、触媒不活性なCRISPR/Casタンパク質、触媒不活性なメガヌクレアーゼ、Znフィンガータンパク質、転写活性化因子様エフェクター、CRISPR/Casニッカーゼ、ZFNニッカーゼ、TALENニッカーゼ、またはメガヌクレアーゼニッカーゼであり得る。
【0116】
本方法はさらに、標的染色体配列に結合している検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質を検出することを含み、この検出は動的生細胞イメージング、蛍光顕微鏡、共焦点顕微鏡、免疫蛍光、免疫検出、RNA-タンパク質結合、およびタンパク質-タンパク質結合などを介し得る。検出工程は生細胞または固定細胞において実行され得る。
【0117】
本方法が生細胞中のクロマチン構造の動力学を検出することを含む実施態様において、検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質および1以上のプログラム可能なDNA結合タンパク質は、上記のセクション(III)(a)において本質的に記述されるように、タンパク質または核酸として細胞に導入され得る。本方法が固定細胞中の標的染色体配列を検出することを含む実施態様において、検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質およびプログラム可能なDNA結合タンパク質は、タンパク質(またはRNA-タンパク質複合体)として細胞に導入され得る。細胞を固定および透過処理する手段は当分野で周知である。いくつかの実施態様において、固定細胞は化学プロセスおよび/または熱変性プロセスに曝露され得、二本鎖染色体DNAを一本鎖DNAに変換し得る。他の実施態様において、固定細胞は化学プロセスおよび/または熱変性プロセスに曝露されない。
【0118】
具体的な実施態様において、検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質は、触媒不活性な(または不活性化)CRISPR/Casタンパク質および蛍光タンパク質マーカードメインを含む融合タンパク質であり、少なくとも1つのプログラム可能なDNA結合タンパク質は触媒不活性な(または不活性化)CRISPR/Casタンパク質である。
【0119】
プログラム可能なDNA修飾タンパク質またはプログラム可能なDNA結合タンパク質のうちの少なくとも1つがCRISPR/Casタンパク質を含む実施態様において、ガイドRNAはインサイチュ(in situ)の検出(例えばFISHまたはCISH)のための検出可能な標識をさらに含み得る。検出可能な標識は上記のセクション(I)(a)(i)に詳述されている。いくつかの実施態様において、プログラム可能なDNA修飾タンパク質およびプログラム可能なDNA結合タンパク質はそれぞれCRISPR/Casタンパク質を含み、各ガイドRNAは少なくとも1つの検出可能な標識を含み、それにより検出される信号の量または強度を増加させる。
【0120】
さらなる他の実施態様において、近位に結合したプログラム可能なDNA修飾タンパク質および1以上のプログラム可能なDNA結合タンパク質は、近接ライゲーションアッセイを介して検出され得る。例えば、プログラム可能なDNA修飾タンパク質は第1の抗体に結合され得、プログラム可能なDNA結合タンパク質の少なくとも1つは第2の抗体に結合され得、これらはそれぞれ一本鎖近接検出オリゴヌクレオチド(single-stranded proximity detection oligonucleotide)に直接的または(例えば第2の抗体を介して)間接的に連結する。他の実施態様において、一本鎖近接検出オリゴヌクレオチドはガイドRNAに直接的または間接的に連結し得る。さらなる他の実施態様において、一本鎖近接検出オリゴヌクレオチドはプログラム可能なDNA修飾タンパク質またはプログラム可能なDNA結合タンパク質に直接的または間接的に連結し得る。近接検出オリゴヌクレオチドは、近位に位置する、染色体に結合しているタンパク質と複合体を形成し、インサイチュの近接依存的な増幅反応を介して検出され得る。インサイチュの近接依存的な増幅反応は近接ライゲーションアッセイ(PLA、Soderberg, et al., Nature Methods, 2006, 3(12):995-1000参照)またはハイブリダイゼーション連鎖反応の近接依存的な開始(proxHCR、Koos et al., Nature Communications, 2015, 6:7294, 10 pp.参照)であり得る。
【0121】
(V)応用
本明細書において開示される組成物および方法は、多様な治療応用、診断応用、産業的応用および研究応用において使用され得る。いくつかの実施態様において、本開示は、遺伝子の機能をモデル化および/または研究し、対象の遺伝子状態もしくはエピジェネティック状態を研究し、または様々な疾患もしくは障害に関与する生化学的経路を研究するために、細胞、動物または植物中の対象の任意の染色体配列を修飾するのに使用され得る。例えば、疾患または障害をモデル化するトランスジェニック生物が作製され得、ここで疾患または障害に関連する1以上の核酸配列の発現が変化している。疾患モデルは、生物に対する変異の効果を研究し、疾患の発生および/または進行を研究し、疾患に対する薬学的に活性な化合物の効果を研究し、かつ/または潜在的な遺伝子治療戦略の効力を評価するために使用され得る。
【0122】
他の実施態様において、組成物および方法は、効率的で費用効率の高い機能的なゲノムスクリーニング(これは特定の生物学的プロセスに関与する遺伝子の機能およびどのような遺伝子発現の変化が生物学的プロセスに影響を与え得るかを調べるために使用され得る)を実行するため、または細胞表現型と組み合わせたゲノム遺伝子座の飽和変異導入法もしくはディープスキャニング変異導入法(deep scanning mutagenesis)を実行するために使用され得る。例えば、飽和変異導入法またはディープスキャニング変異導入法は、遺伝子発現、薬剤耐性、および疾患の回復に必要な機能的要素の重要な最小限の特徴および別々の脆弱性を決定するために使用され得る。
【0123】
さらなる実施態様において、本明細書で開示される組成物および方法は、疾患または障害の存在を立証し、かつ/または処置の選択肢を決定するために使用される診断テストのために使用され得る。適切な診断テストの例には、がん細胞における特定の変異(例えば、EGFRおよびHER2などにおける特定の変異)の検出、特定の疾患に関与する特定の変異(例えば、トリヌクレオチド反復、鎌状赤血球症に関連するβグロビン内の変異、特定のSNPなど)の検出、肝炎の検出、およびウイルス(例えばジカウイルス)の検出などが含まれる。
【0124】
さらなる実施態様において、本明細書で開示される組成物および方法は、特定の疾患または障害に関連する遺伝子変異を修正するため(例えば、鎌状赤血球症またはサラセミアに関連するグロビン遺伝子の変異を修正するため、重症複合免疫不全症(SCID)に関連するアデノシンデアミナーゼ遺伝子の変異を修正するため、ハンチントン病の疾患原因遺伝子であるHTTの発現を減少させるため、または網膜色素変性症の処置のためにロドプシン遺伝子の変異を修正するためなど)に使用され得る。このような修飾は、エクスビボ(ex vivo)の細胞において行われ得る。
【0125】
さらなる他の実施態様において、本明細書で開示される組成物および方法は、形質が改善し、または環境ストレスに対する抵抗性が増大した作物を作製するために使用され得る。本開示はまた、形質が改善した家畜または生産動物(production animal)を作製するために使用され得る。例えば、ブタは、生物医学的モデルとして(特に再生医療または異種移植において)ブタを魅力的なものとする多くの特徴を有する。
【0126】
定義
他に定義されない限り、本明細書で使用されるあらゆる技術用語および科学用語は、本発明の属する分野の当業者によって一般的に理解される意味を有する。以下の参考文献は、本発明で使用される多くの用語の一般的な定義を当業者に提供する:Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd ed. 1994);The Cambridge Dictionary of Science and Technology (Walker ed., 1988);The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991);およびHale & Marham, The Harper Collins Dictionary of Biology (1991)。本明細書において、以下の用語は他に明記されない限り、これらに帰する意味を有する。
【0127】
本開示またはその好ましい実施態様の要素を導入する場合、冠詞「a」、「an」、「the」および「前記」は1以上の要素が存在することを意味することが意図されている。用語「含む」、「包含する」および「有する」は包含的であり、記載された要素以外のさらなる要素が存在し得ることを意味することが意図される。
【0128】
用語「約」は、数値xに関して使用される場合、例えばx±5%を意味する。
【0129】
本明細書において、用語「相補的」または「相補性」は、特定の水素結合を介した塩基対形成による二本鎖核酸の結合を指す。塩基対形成は、標準的なワトソン・クリック塩基対形成であり得る(例えば、5’-AGTC-3’は相補的配列3’-TCAG-5’と対形成する)。塩基対形成はまた、フーグスティーン水素結合または逆フーグスティーン水素結合であり得る。相補性は通常、二本鎖領域に関して測定され、したがって例えばオーバーハングは除外される。二本鎖領域の2つの鎖の間の相補性は部分的であり得、いくつか(例えば70%)の塩基のみが相補的である場合、割合(例えば70%)として表現され得る。相補的でない塩基は「ミスマッチ」している。二本鎖領域の全ての塩基が相補的である場合、相補性は完全(すなわち100%)であり得る。
【0130】
本明細書において、用語「CRISPR/Casシステム」は、CRISPR/Casタンパク質(すなわち、ヌクレアーゼ、ニッカーゼ、または触媒不活性化タンパク質)およびガイドRNAを含む複合体を指す。
【0131】
本明細書における用語「内在性配列」は、細胞に対して天然である染色体配列を指す。
【0132】
本明細書における用語「外来性」は細胞に対して天然でない配列、または細胞のゲノムにおけるその配列の天然の位置が異なる染色体位置にある染色体配列を指す。
【0133】
本明細書において、「遺伝子」は、遺伝子産物をコードするDNA領域(エクソンおよびイントロンを含む)および遺伝子産物の生成を制御するあらゆるDNA領域を指し、これはそのような制御配列がコード配列および/または転写される配列に隣接しているか否かによらない。したがって、遺伝子は必ずしも限定されないが、プロモーター配列、ターミネーター、翻訳制御配列(リボソーム結合部位および内部リボソーム侵入部位など)、エンハンサー、サイレンサー、インシュレーター、境界要素、複製起点、マトリックス結合部位、および遺伝子座調節領域を含む。
【0134】
用語「異種」は、対象の細胞に対して内在性または天然でない実体を指す。例えば、異種タンパク質は外来性の供給源に由来しており、または元々由来していた(外因的に導入された核酸配列など)タンパク質を指す。場合により、異種タンパク質は対象の細胞によって正常に生成されない。
【0135】
本明細書において、用語「局所的なクロマチン構造」または「局所的なクロマチン配置」は、ヌクレオソーム構造および/またはヒストンタンパク質スペーシングを指し、ヌクレオソームのクロマチン繊維およびヘテロクロマチンへの圧縮を一般的に指さない。
【0136】
用語「ニッカーゼ」は、二本鎖核酸配列の一方の鎖を切断する(すなわち、二本鎖配列に切れ目を入れる)酵素を指す。例えば、二本鎖切断活性を有するヌクレアーゼは、ニッカーゼとして機能し、二本鎖配列の一方の鎖のみを切断するように変異および/または欠失によって改変され得る。
【0137】
本明細書において、用語「ヌクレアーゼ」は、二本鎖核酸配列の両方の鎖を切断する酵素を指す。
【0138】
用語「核酸」および「ポリヌクレオチド」は、一本鎖型または二本鎖型のいずれかにおける、直鎖状構造または環状構造のデオキシリボヌクレオチドポリマーまたはリボヌクレオチドポリマーを指す。本開示の目的において、これらの用語は、ポリマーの長さに関して限定するものとして解釈されるべきではない。これらの用語は、天然のヌクレオチドの既知の類似体、ならびに塩基、糖および/またはリン酸部分(例えばホスホロチオエート骨格)で修飾されたヌクレオチドを包含し得る。一般に、特定のヌクレオチドの類似体は同一の塩基対形成の特異性を有する(すなわち、Aの類似体はTと塩基対形成する)。
【0139】
用語「ヌクレオチド」は、デオキシリボヌクレオチドまたはリボヌクレオチドを指す。ヌクレオチドは標準的なヌクレオチド(すなわち、アデノシン、グアノシン、シチジン、チミジンおよびウリジン)、ヌクレオチド異性体、またはヌクレオチド類似体であり得る。ヌクレオチド類似体は、修飾されたプリン塩基もしくはピリミジン塩基または修飾されたリボース部分を有するヌクレオチドを指す。ヌクレオチド類似体は天然に存在するヌクレオチド(たとえば、イノシン、プソイドウリジンなど)または天然に存在しないヌクレオチドであり得る。ヌクレオチドの糖部分または塩基部分における修飾の限定されない例には、アセチル基、アミノ基、カルボキシ基、カルボキシメチル基、ヒドロキシ基、メチル基、ホスホリル基およびチオール基の付加(または除去)、ならびに塩基の炭素原子および窒素原子の他の原子への置換(たとえば、7-デアザプリン)が含まれる。また、ヌクレオチド類似体には、ジデオキシヌクレオチド、2’-O-メチルヌクレオチド、ロックド核酸(LNA)、ペプチド核酸(PNA)およびモルフォリノが含まれる。
【0140】
用語「ポリペプチド」および「タンパク質」は互換的に使用され、アミノ酸残基のポリマーを指す。
【0141】
本明細書において、用語「近位部」は、染色体DNAにおける標的配列の一方の側の約250塩基対以内に位置する結合部位またはヌクレオチド配列を指す。
【0142】
本明細書において、用語「プログラム可能なDNA修飾タンパク質」は、染色体DNA中の特定の標的配列に結合するように設計され、標的配列またはその付近のDNAまたはDNAに関連するタンパク質を修飾するタンパク質を指す。
【0143】
本明細書において、用語「プログラム可能なDNA結合タンパク質」は、染色体DNA中の特定の標的配列に結合するように設計されたタンパク質を指すが、前記タンパク質は標的配列またはその付近のDNAまたはDNAに関連するタンパク質を修飾しない。
【0144】
用語「標的配列」、「標的染色体配列」および「標的部位」は互換的に使用され、プログラム可能なDNA修飾タンパク質が標的とする染色体DNA中の特定の配列、およびプログラム可能なDNA修飾タンパク質がDNAまたはDNAに関連するタンパク質を修飾する部位を指す。
【0145】
核酸およびアミノ酸の配列同一性を決定する技術は当分野で公知である。通常、このような技術には、遺伝子のためのmRNAのヌクレオチド配列を決定すること、および/またはそれによってコードされているアミノ酸配列を決定すること、ならびにこれらの配列を第2のヌクレオチド配列またはアミノ酸配列と比較することが含まれる。ゲノム配列もまた、この様式で決定および比較され得る。一般に、同一性は、2つのポリヌクレオチド配列またはポリペプチド配列の、それぞれヌクレオチドとヌクレオチドとの正確な一致またはアミノ酸とアミノ酸との正確な一致を指す。2以上の配列(ポリヌクレオチドまたはアミノ酸)は、その割合同一性を決定することによって比較され得る。2つの配列の割合同一性は、核酸配列であるかアミノ酸配列であるかによらず、2つのアラインされた配列間の正確な一致の数をより短い配列の長さで割り、100を乗じたものである。核酸配列のための近似アライメントは、Smith and Waterman, Advances in Applied Mathematics 2:482-489 (1981)の局所的相同性アルゴリズムによって提供される。このアルゴリズムは、Dayhoff, Atlas of Protein Sequences and Structure, M. O. Dayhoff ed., 5 suppl. 3:353-358, National Biomedical Research Foundation, Washington, D.C., USAによって開発され、Gribskov, Nucl. Acids Res. 14(6):6745-6763 (1986)によって標準化されたスコア化マトリックスを用いることで、アミノ酸配列に適用され得る。配列の割合同一性を決定するためのこのアルゴリズムの例示的な実施は、「BestFit」の実用的用途におけるGenetics Computer Group (Madison, Wis.)によって提供されている。配列間の割合同一性または類似性を計算するのに適した他のプログラムは当分野で一般的に知られおり、例えば、別のアライメントプログラムは初期設定パラメータで使用されるBLASTである。例えば、BLASTNおよびBLASTPは、以下の初期設定パラメータを用いて使用され得る:遺伝子コード=標準;フィルター=なし;鎖=両方;カットオフ=60;期待値=10;マトリックス=BLOSUM62;記載=50配列;ソーティング方法=HIGH SCORE;データベース=非冗長、GenBank+EMBL+DDBJ+PDB+GenBank CDS翻訳+Swissタンパク質+Spupdate+PIR。これらのプログラムの詳細はGenBankのウェブサイト上に見出され得る。
【0146】
本発明の範囲から逸脱することなく、様々な変更が上述の細胞および方法において行われ得るため、上記の記載および以下で与えられる実施例に含まれるあらゆる事項は、限定的な意味ではなく説明として解釈されるべきであることが意図される。
【0147】
列挙された実施態様
以下の列挙された実施態様は、本発明の特定の態様を説明するために提示され、本発明の範囲を限定することは意図されない。
【0148】
1.(a)プログラム可能なDNA修飾タンパク質またはプログラム可能なDNA修飾タンパク質をコードする核酸、および(b)少なくとも1つのプログラム可能なDNA結合タンパク質または少なくとも1つのプログラム可能なDNA結合タンパク質をコードする核酸を含む、組成物。
【0149】
2.プログラム可能なDNA修飾タンパク質が、RNAにガイドされたクラスター化した規則的に間隔が空いている短い回文配列リピート(RNA-guided clustered regularly interspersed short palindromic repeats、CRISPR)/CRISPR関連(Cas)(CRISPR/Cas)ヌクレアーゼシステム、CRISPR/Cas二重ニッカーゼシステム、Znフィンガーヌクレアーゼ(ZFN)、転写活性化因子様エフェクターヌクレアーゼ(TALEN)、メガヌクレアーゼ、ヌクレアーゼドメインと連結したプログラム可能なDNA結合ドメインを含む融合タンパク質、または非ヌクレアーゼドメインと連結したプログラム可能なDNA結合ドメインを含む融合タンパク質である、実施態様1記載の組成物。
【0150】
3.融合タンパク質のプログラム可能なDNA結合ドメインが、触媒不活性なCRISPR/Casシステム、触媒不活性なメガヌクレアーゼ、Znフィンガータンパク質、または転写活性化因子様エフェクターである、実施態様2記載の組成物。
【0151】
4.融合タンパク質の非ヌクレアーゼドメインが、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、脱ミリストイル化活性、シトルリン化活性、ヘリカーゼ活性、アミノ化活性、脱アミノ化活性、アルキル化活性、脱アルキル化活性、酸化活性、転写活性化活性、または転写抑制因子活性を有する、実施態様2または3記載の組成物。
【0152】
5.融合タンパク質の非ヌクレアーゼドメインが、シトシンデアミナーゼ活性、ヒストンアセチルトランスフェラーゼ活性、転写活性化活性、または転写抑制因子活性を有する、実施態様4記載の組成物。
【0153】
6.少なくとも1つのプログラム可能なDNA結合タンパク質が、触媒不活性なCRISPR/Casタンパク質、触媒不活性なメガヌクレアーゼ、Znフィンガータンパク質、転写活性化因子様エフェクター、CRISPR/Casニッカーゼ、ZFNニッカーゼ、TALENニッカーゼ、またはメガヌクレアーゼニッカーゼである、実施態様1~5のいずれかに記載の組成物。
【0154】
7.プログラム可能なDNA修飾タンパク質および少なくとも1つのプログラム可能なDNA結合タンパク質をコードする核酸が、RNAまたはDNAであり、かつ/または前記核酸がプラスミドベクターまたはウイルスベクターの一部である、実施態様1~6のいずれかに記載の組成物。
【0155】
8.プログラム可能なDNA修飾タンパク質が、CRISPR/Casヌクレアーゼシステム、CRISPR/Cas二重ニッカーゼシステム、または非ヌクレアーゼドメインと連結した触媒不活性なCRISPR/Casシステムであり、少なくとも1つのプログラム可能なDNA結合タンパク質が触媒不活性なCRISPR/Casシステムであり、ここで各CRISPR/CasシステムがCRISPR/Casタンパク質およびガイドRNAを含む、実施態様1~6のいずれかに記載の組成物。
【0156】
9.各CRISPR/Casヌクレアーゼシステムが、I型CRISPR/Casシステム、II型CRISPR/Casシステム、III型CRISPR/Casシステム、またはV型CRISPR/Casシステムである、実施態様8記載の組成物。
【0157】
10.各CRISPR/Casヌクレアーゼシステムが、II型CRISPR/Casシステム、またはV型CRISPR/Casシステムである、実施態様9記載の組成物。
【0158】
11.各CRISPR/Casタンパク質をコードする核酸がmRNAまたはDNAである、実施態様8~10のいずれかに記載の組成物。
【0159】
12.各CRISPR/Casタンパク質をコードする核酸および/または各ガイドRNAをコードする核酸が、プラスミドベクターの一部またはウイルスベクターの一部である、実施態様8~11のいずれかに記載の組成物。
【0160】
13.各CRISPR/CasシステムのガイドRNAが酵素的に合成されている、実施態様8~11のいずれかに記載の組成物。
【0161】
14.各CRISPR/CasシステムのガイドRNAが少なくとも部分的に化学合成されている、実施態様8~11のいずれかに記載の組成物。
【0162】
15.実施態様1~14のいずれかに記載の組成物を含むキット。
【0163】
16.真核細胞中の標的ゲノム修飾の効率および/または特異性を増大させる方法であって、真核細胞に以下を導入することを含む方法:
(a)プログラム可能なDNA修飾タンパク質またはプログラム可能なDNA修飾タンパク質をコードする核酸、および;
(b)少なくとも1つのプログラム可能なDNA結合タンパク質または少なくとも1つのプログラム可能なDNA結合タンパク質をコードする核酸;
ここで、プログラム可能なDNA修飾タンパク質は標的染色体配列を標的とし、少なくとも1つのプログラム可能な各DNA結合タンパク質は、標的染色体配列の近位の部位を標的とし、少なくとも1つのプログラム可能なDNA結合タンパク質と標的染色体配列の近位の部位との結合は、プログラム可能なDNA修飾タンパク質の標的染色体配列へのアクセスしやすさを増大させ、これにより標的ゲノム修飾の効率および/または特異性を増大させる。
【0164】
17.標的染色体配列の近位の部位が、標的染色体配列の一方の側の約250塩基対以内に位置している、実施態様16記載の方法。
【0165】
18.標的染色体配列の近位の部位が、標的染色体配列の一方の側の約100塩基対以内に位置している、実施態様17記載の方法。
【0166】
19.標的染色体配列の近位の部位が、標的染色体配列の一方の側の約75塩基対以内に位置している、実施態様18記載の方法。
【0167】
20.標的染色体配列の近位の部位が、標的染色体配列の一方の側の約50塩基対以内に位置している、実施態様19記載の方法。
【0168】
21.標的染色体配列の近位の部位が、標的染色体配列の一方の側の約25塩基対以内に位置している、実施態様20記載の方法。
【0169】
22.プログラム可能なDNA修飾タンパク質が、CRISPR/Casヌクレアーゼシステム、CRISPR/Cas二重ニッカーゼシステム、Znフィンガーヌクレアーゼ(ZFN)、転写活性化因子様エフェクターヌクレアーゼ(TALEN)、メガヌクレアーゼ、ヌクレアーゼドメインと連結したプログラム可能なDNA結合ドメインを含む融合タンパク質、または非ヌクレアーゼドメインと連結したプログラム可能なDNA結合ドメインを含む融合タンパク質である、実施態様16~21のいずれかに記載の方法。
【0170】
23.融合タンパク質のプログラム可能なDNA結合ドメインが、触媒不活性なCRISPR/Casシステム、触媒不活性なメガヌクレアーゼ、Znフィンガータンパク質、または転写活性化因子様エフェクターである、実施態様22記載の方法。
【0171】
24.融合タンパク質の非ヌクレアーゼ修飾ドメインが、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、脱ミリストイル化活性、シトルリン化活性、ヘリカーゼ活性、アミノ化活性、脱アミノ化活性、アルキル化活性、脱アルキル化活性、酸化活性、転写活性化活性、または転写抑制因子活性を有する、実施態様22または23に記載の方法。
【0172】
25.融合タンパク質の非ヌクレアーゼドメインが、シトシンデアミナーゼ活性、ヒストンアセチルトランスフェラーゼ活性、転写活性化活性、または転写抑制因子活性を有する、実施態様24記載の方法。
【0173】
26.少なくとも1つのプログラム可能なDNA結合タンパク質が、触媒不活性なCRISPR/Casシステム、触媒不活性なメガヌクレアーゼ、Znフィンガータンパク質、転写活性化因子様エフェクター、CRISPR/Casニッカーゼ、ZFNニッカーゼ、TALENニッカーゼ、またはメガヌクレアーゼニッカーゼである、実施態様16~25のいずれかに記載の方法。
【0174】
27.プログラム可能なDNA修飾タンパク質が、CRISPR/Casヌクレアーゼシステム、CRISPR/Cas二重ニッカーゼシステム、または非ヌクレアーゼドメインと連結した触媒不活性なCRISPR/Casシステムであり、少なくとも1つのプログラム可能なDNA結合タンパク質が触媒不活性なCRISPR/Casシステムであり、ここで各CRISPR/CasシステムがCRISPR/Casタンパク質およびガイドRNAを含む、実施態様16~26のいずれかに記載の方法。
【0175】
28.各CRISPR/CasシステムのガイドRNAが少なくとも部分的に化学合成されている、実施態様27記載の方法。
【0176】
29.各CRISPR/CasシステムのガイドRNAが酵素的に合成されている、実施態様27記載の方法。
【0177】
30.真核細胞がインビトロである、実施態様16~29のいずれかに記載の方法。
【0178】
31.真核細胞がインビボである、実施態様16~29のいずれかに記載の方法。
【0179】
32.真核細胞が哺乳類細胞である、実施態様16~31のいずれかに記載の方法。
【0180】
33.哺乳類細胞がヒト細胞である、実施態様32記載の方法。
【0181】
34.哺乳類細胞が非ヒト細胞である、実施態様32記載の方法。
【0182】
35.真核細胞中の染色体配列を検出する方法であって、以下を含む方法:
I.真核細胞に、(a)少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質または少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質をコードする核酸;および(b)少なくとも1つのプログラム可能なDNA結合タンパク質または少なくとも1つのプログラム可能なDNA結合タンパク質をコードする核酸を導入する工程、ここで少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質は標的染色体配列を標的とし、少なくとも1つのプログラム可能な各DNA結合タンパク質は標的染色体配列の近位の部位を標的とし、少なくとも1つのプログラム可能なDNA結合タンパク質と標的染色体配列の近位の部位との結合は、少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質の標的染色体配列へのアクセスしやすさを増大させる;および
II.標的染色体配列に結合した少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質を検出する工程。
【0183】
36.標的染色体配列の近位の部位が、標的染色体配列の一方の側の約250塩基対以内に位置している、実施態様35記載の方法。
【0184】
37.標的染色体配列の近位の部位が、標的染色体配列の一方の側の約100塩基対以内に位置している、実施態様36記載の方法。
【0185】
38.標的染色体配列の近位の部位が、標的染色体配列の一方の側の約75塩基対以内に位置している、実施態様37記載の方法。
【0186】
39.標的染色体配列の近位の部位が、標的染色体配列の一方の側の約50塩基対以内に位置している、実施態様38記載の方法。
【0187】
40.標的染色体配列の近位の部位が、標的染色体配列の一方の側の約25塩基対以内に位置している、実施態様39記載の方法。
【0188】
41.少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質の少なくとも1つの検出可能なマーカードメインが、蛍光タンパク質、蛍光タグ、エピトープタグ、またはプログラム可能なDNA結合タンパク質中に天然に存在するエピトープである、実施態様35~40のいずれかに記載の方法。
【0189】
42.少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質が、少なくとも1つの検出可能なマーカードメインと連結した触媒不活性なCRISPR/Casシステム、少なくとも1つの検出可能なマーカードメインと連結した触媒不活性なメガヌクレアーゼ、少なくとも1つの検出可能なマーカードメインと連結したZnフィンガータンパク質、または少なくとも1つの検出可能なマーカードメインと連結した転写活性化因子様エフェクターである、実施態様35~41のいずれかに記載の方法。
【0190】
43.少なくとも1つのプログラム可能なDNA結合タンパク質が、触媒不活性なCRISPR/Casシステム、触媒不活性なメガヌクレアーゼ、Znフィンガータンパク質、転写活性化因子様エフェクター、CRISPR/Casニッカーゼ、ZFNニッカーゼ、TALENニッカーゼ、またはメガヌクレアーゼニッカーゼである、実施態様35~42のいずれかに記載の方法。
【0191】
44.少なくとも1つの検出可能なマーカードメインを含むプログラム可能なDNA結合タンパク質が少なくとも1つの検出可能なマーカードメインと連結した触媒不活性なCRISPR/Casシステムであり、少なくとも1つのプログラム可能なDNA結合タンパク質が触媒不活性なCRISPR/Casシステムであり、各CRISPR/CasシステムがCRISPR/Casタンパク質およびガイドRNAを含む、実施態様35~43のいずれかに記載の方法。
【0192】
45.各CRISPR/CasシステムのガイドRNAが少なくとも部分的に化学合成されている、実施態様44記載の方法。
【0193】
46.各CRISPR/CasシステムのガイドRNAが酵素的に合成されている、実施態様44記載の方法。
【0194】
47.真核細胞が哺乳類細胞である、実施態様35~46のいずれかに記載の方法。
【0195】
48.哺乳類細胞がヒト細胞である、実施態様47記載の方法。
【0196】
49.哺乳類細胞が非ヒト細胞である、実施態様47記載の方法。
【0197】
50.真核細胞が生存している、または固定されている、実施態様35~49のいずれかに記載の方法。
【0198】
51.検出が、動的生細胞イメージング、蛍光顕微鏡、共焦点顕微鏡、免疫蛍光、免疫検出、RNA-タンパク質結合、またはタンパク質-タンパク質結合を含む、実施態様35~50のいずれかに記載の方法。
【実施例】
【0199】
以下の実施例は本開示の特定の態様を示す。
【0200】
実施例1.Francisella novicida CRISPR-Cas9(FnCas9)遺伝子編集の増強
FnCas9はIIB型CRISPR-Cas9である。これは広く使用されているSpCas9よりも高い固有の特異性を示すが、ヒト細胞においてSpCas9よりも頑強性が低いことが見出されている。プログラム可能なDNA結合タンパク質と近位部との結合が、ヌクレアーゼがヒト細胞における他のアクセスできない標的(すなわちPOR遺伝子座)を切断することを可能とし得るか否かを決定するために、K562細胞に、細胞百万個当たり、5.6μgのFnCas9プラスミドDNA、5μgの触媒不活性化SpCas9(SpdCas9)プラスミドDNA、および3μgの各sgRNAのプラスミドDNAを遺伝子導入した(
図2参照)。ゲノムDNAを遺伝子導入の3日後に回収し、標的領域を順方向プライマー5’-CTCCCCTGCTTCTTGTCGTAT-3’(配列番号9)および逆方向プライマー5’-ACAGGTCGTGGACACTCACA-3’(配列番号10)を用いてPCRで増幅した。標的に対するFnCas9による標的挿入/欠失を、Cel-Iヌクレアーゼ消化およびポリアクリルアミドゲル分析によって決定した。
【0201】
図2に示されるように、FnCas9は単独で遺伝子導入された場合、標的を切断できなかった。しかし、局所的なクロマチン配置を破壊することを助けるためにSpdCas9と組み合わせて遺伝子導入された場合、FnCas9は標的を頑強なレベルで(SpdCas9を1つの近位部に結合するように使用した場合に10~11%のインデルを伴って)切断できた。SpdCas9を2つの近位部に結合するように使用した場合、FnCas9活性はさらに28%のインデルに増加した。これらの結果は、本明細書において開示された方法が、エンドヌクレアーゼがアクセスできない他の標的を効率的に切断することを可能にし得、局所的なクロマチン配置を破壊するのに使用される2つの部位の間に相乗効果が存在することを示す。
【0202】
実施例2.Campylobacter jejuni CRISPR-Cas9(CjCas9)遺伝子編集の増強
CjCas9はIIC型CRISPR-Cas9である。CjCas9はこれまでに特徴付けられた最も小さなCas9であり、特有のACAY PAM要求を有する。しかし、このヌクレアーゼはヒト細胞中のほとんどの標的に対して不活性であることが見出されている。本明細書において開示される方法が、CjCas9タンパク質がヒト細胞中のアクセスできない標的に結合することを可能にし得るか否かを決定するために、K562細胞に、細胞百万個当たり、4.2μgのFlag標識された触媒不活性化CjCas9(CjdCas9)プラスミドDNA、5μgの触媒不活性化SpCas9(SpdCas9)プラスミドDNA、および3μgの各sgRNAのプラスミドDNAを遺伝子導入した(
図3A参照)。細胞を遺伝子導入の16時間後にホルムアルデヒド中で固定し、クロマチン免疫沈降(ChIP)を抗flag抗体を用いて行った。Flag-CjdCas9による標的結合を、ドロップレットデジタルPCR(ddPCR)によって決定した。
【0203】
図3Cに示されるように、Flag-CjdCas9は単独で遺伝子導入された場合、AAVS1遺伝子座における以前に公知のアクセス可能な標的に結合できたが、POR遺伝子座におけるアクセスできない標的に結合できなかった。しかしながら、局所的なクロマチン配置を破壊するためにSpdCas9と組み合わせて遺伝子導入された場合、Flag-CjdCas9はAAVS1標的との結合よりもさらにより効率的にPOR標的に結合できた。
【0204】
標的DNA切断に対する効果を調べるために、K562細胞に、細胞百万個当たり、4.2μgのCjCas9プラスミドDNA、5μgのSpdCas9プラスミドDNA、および3μgの各sgRNAのプラスミドDNAを遺伝子導入した。ゲノムDNAを遺伝子導入の3日後に回収し、標的領域を順方向プライマー5’-CTCCCCTGCTTCTTGTCGTAT-3’(配列番号9)および逆方向プライマー5’-ACAGGTCGTGGACACTCACA-3’(配列番号10)を用いてPCRで増幅した。POR標的に対するCjCas9切断活性を、Cel-Iヌクレアーゼ消化およびポリアクリルアミドゲル分析によって決定した。
図4に示されるように、CjCas9はSpdCas9を伴わずに標的を切断することはできなかった。しかし、SpdCas9と組み合わせて遺伝子導入された場合、CjCas9は34.1~37.9%のインデルを伴って効率的に標的を切断できた。これらの結果は、本明細書において開示される方法が、ヌクレアーゼがアクセスできない他の標的に効率的に結合し、切断することを可能にし得ることを示す。
【0205】
実施例3.Francisella novicida Cpf1(FnCpf1)遺伝子編集の増強
FnCpf1はV型CRISPR-Casシステムである。Cpf1システムは、II型CRISPR-Cas9システムとは著しく異なっている。Cas9システムとは異なり、Cpf1システムはtracrRNAを用いず、標的化のために5’TリッチPAMおよび単一RNAガイドを使用する(Zetsche et al., Cell, 2015, 163:1-13)。これらの「より新しい」CRISPRシステムは、遺伝子編集の実行をさらにより簡便にする可能性を有するが、多くのCpf1システムはヒト細胞中で不活性であることが見出されている。本明細書において開示される方法が、この異なる「不活性」Cpf1ヌクレアーゼがヒト細胞中の内在性標的を切断することを可能にするか否かを決定するために、K562細胞に、細胞百万個当たり、5μgのFnCpf1プラスミドDNA、5μgのSpdCas9プラスミドDNA、および3μgの各sgRNAのプラスミドDNAを遺伝子導入した(
図5参照)。ゲノムDNAを遺伝子導入の3日後に回収し、標的領域を順方向プライマー5’-CTCCCCTGCTTCTTGTCGTAT-3’(配列番号9)および逆方向プライマー5’-ACAGGTCGTGGACACTCACA-3’(配列番号10)を用いてPCRで増幅した。POR標的に対するFnCpf1切断活性を、Cel-Iヌクレアーゼ消化およびポリアクリルアミドゲル分析によって決定した。
【0206】
図5に示されるように、FnCpf1は単独で遺伝子導入された場合、標的を切断できなかったが、SpdCas9と組み合わせて遺伝子導入された場合、標的を効率的に切断できた。これらの結果は、本明細書において開示される方法が異なるV型CRISPR-Casシステムに適用可能であることを示す。
【0207】
実施例4.ヒトHBBおよびHBDにおける同一の標的間の選択的編集
ヒト(すなわちHBBおよびHBD)における2つの同一の標的を用いて、本明細書において開示される方法が、異なる遺伝子中の同一の部位間の選択的編集を促進できるか否かを決定した。K562細胞に、細胞百万個当たり、4.2μgのCjCas9プラスミドDNA、5μgのSpdCas9プラスミドDNA、および3μgの各sgRNAのプラスミドDNAを遺伝子導入した(
図6参照)。ゲノムDNAを遺伝子導入の3日後に回収し、2つの標的領域を、HBBのための順方向プライマー5’-CGGCTGTCATCACTTAGACCTCA-3’(配列番号11)および逆方向プライマー5’-GCAGCCTAAGGGTGGGAAAATAGA-3’(配列番号12)、ならびにHBDのための順方向プライマー5’-AGGGCAAGTTAAGGGAATAGTGGAA-3’(配列番号13)および逆方向プライマー5’-CCAAGGGTAGACCACCAGTAATCTG-3’(配列番号14)を用いてPCRで増幅した。HBB標的およびHBD標的に対するCjCas9切断活性を、Cel-Iヌクレアーゼ消化およびポリアクリルアミドゲル分析によって決定した。
【0208】
図6に示されるように、CjCas9は単独で遺伝子導入された場合、いずれの標的も切断できなかった。しかし、HBBの近位の部位を標的とするSpdCas9と組み合わせて遺伝子導入された場合、CjCas9はHBB標的を効率的に切断し、同一のHBD標的を切断できなかった。最初の2つのレーンにおける2つのCel-Iヌクレアーゼ消化のバンドは、K562細胞集団に存在するSNPによって生じた。これらの結果は、遺伝子編集の選択性を改善するという開示された本方法の特有の能力を示す。
【0209】
実施例5.Streptococcus pyogenes CRISPR-Cas9(SpCas9)遺伝子編集の増強
SpCas9はIIA型CRISPR-Cas9であり、真核細胞におけるその頑強な活性のためにゲノム修飾において広く使用されている。しかしながら、その活性は標的によって様々であり得る。本明細書において開示される方法がこのヌクレアーゼを増強し得るか否かを決定するために、K562細胞に、細胞百万個当たり、5μgのSpCas9プラスミドDNA、5.6μgの触媒不活性化FnCas9(FndCas9)、および3μgの各sgRNAのプラスミドDNAを遺伝子導入した(
図7参照)。ゲノムDNAを遺伝子導入の3日後に回収し、標的領域を順方向プライマー5’-CTCCCCTGCTTCTTGTCGTAT-3’(配列番号9)および逆方向プライマー5’-ACAGGTCGTGGACACTCACA-3’(配列番号10)を用いてPCRで増幅した。POR標的に対するSpCas9切断活性を、Cel-Iヌクレアーゼ消化およびポリアクリルアミドゲル分析によって決定した。
【0210】
図7に示されるように、SpCas9切断活性は、単独で遺伝子導入された場合と比較して、FndCas9と組み合わせて遺伝子導入された場合に著しく増加した。これらの結果は、本明細書において開示される方法が頑強なエンドヌクレアーゼにも適用できることを示す。
【0211】
実施例6.ssDNAオリゴドナーを用いた遺伝子編集の増強
K562細胞に、細胞百万個当たり、4.2μgのCjCas9プラスミドDNA、5μgのSpdCas9プラスミドDNA、3μgの各sgRNAのプラスミドDNA、およびEcoRI制限部位の標的とされる組込みのための300pmolの88nt ssDNAオリゴドナーを遺伝子導入した。ゲノムDNAを遺伝子導入の3日後に回収し、標的領域を順方向プライマー5’-CTCCCCTGCTTCTTGTCGTAT-3’(配列番号9)および逆方向プライマー5’-ACAGGTCGTGGACACTCACA-3’(配列番号10)を用いてPCRで増幅した。標的とされたEcoRI制限部位の組込みを、EcoRI制限酵素での消化およびポリアクリルアミドゲル分析によって決定した。
図8に示されるように、ssDNAオリゴドナーをCjCas9およびSpdCas9と協調して遺伝子導入した場合、制限部位はPOR遺伝子座中に効率的(28~37%)に組み込まれたが、オリゴドナーを単独またはSpdCas9を伴わないCjCas9との組合せのいずれかにおいて遺伝子導入した場合、組込みは検出されなかった。これらの結果は、本明細書において開示される方法が、他のアクセスできない標的に対するssDNAオリゴドナーを用いた効率的な遺伝子編集を促進し得ることを示す。
【0212】
実施例7.生細胞中および固定細胞中の配列特異的なゲノムDNA検出の増強
Cas9タンパク質と蛍光タンパク質との融合は、生細胞中の染色体の動態を検出することを可能にしている(Chen et al., Cell, 2013, 155:1479-91)。したがって、クロマチン構造の動態は、CRISPR/Casシステム複合体が様々なゲノム遺伝子座にアクセスする能力に影響を与えていると考えられる。したがって、dCas9-GFPを有するCRISPR(dCas9)複合体の近位のその複合体の配置は、クロマチン免疫沈降のために実施例2で観察されたものに類似する程度で、染色体の動態の検出を増強すると考えられる。例えば、CjdCas9はGFPと融合され得、CjdCas9-GFPの検出可能な結合を妨げるクロマチン状態を含む領域を標的とし得る。SpdCas9に基づくシステムは、CjdCas9-GFP標的の近位に設計され得、検出可能なシグナルを生成し得る。SpdCas9-GFPの結合および検出に対して抵抗性であるクロマチン領域のために、近位のFndCas9分子が使用され得、SpCas9およびFndCas9の近位の標的化および二本鎖切断活性の増強のために実施例5で示されたものに類似する程度で検出を増強し得る。さらに、以前の研究が、CRISPRガイドRNAとゲノムDNAとの間のハイブリダイゼーションの要求の程度が二本鎖切断の場合よりも結合の場合においてより低くなり得ることを示している(Wu et al., Nature Biotechnology, 2014, 32(7): 670-6)ことを考慮すると、近位のCRISPR結合の使用は、細胞中のゲノムDNA検出のための信号雑音比を増加させると考えられる。
【0213】
類似のCRISPRに基づく検出方法が固定細胞に適用されている(Deng et al., Proc. Natl. Acad, Sci. USA, 2015, 112(38):11870-75)。したがって、近位のCRISPR標的化は、上述した生細胞のための様式に類似した様式で固定されたDNAの検出を増強すると考えられる。固定細胞中のゲノムDNA鎖は化学的に架橋されているため、核酸プローブのハイブリダイゼーションによる配列情報の照合は通常、鎖を十分に分離するための熱プロセシングまたは化学的プロセシングを伴う前処理の工程を必要とする。したがって、近位のCRISPR標的化は固定されたDNAをよりアクセスしやすくし、固定細胞の熱処理または化学処理の程度(または要求)を減少させる可能性がある。熱処理または化学処理の排除は、診断プロトコルの単純化、および生細胞生物学をより良く反映する細胞内分子構造の維持において利点を提供し、したがってより確かな情報に基づく診断結果を提供する。
【0214】
実施例8.真核細胞中のCRISPRに基づく遺伝子活性化および遺伝子抑制の増強
Cas9タンパク質と転写制御ドメインとの融合は、標的遺伝子の活性化および抑制を可能にする(Konermann et al., Nature, 2014; 517(7536):583-8; Gilbert et al., Cell, 2014, 159(3):547-661)。クロマチン構造の動態は、CRISPR複合体が様々なゲノム遺伝子座にアクセスし、活性化または抑制を誘導する能力に影響を与えると考えられる。したがって、転写制御ドメインと融合したdCas9を有するCRISPR(dCas9)複合体の近位のその複合体の配置は、クロマチン免疫沈降のために実施例2で観察されたものに類似する程度で標的遺伝子制御を増強すると考えられる。SpdCas9-転写制御因子による結合および修飾に対して抵抗性であるクロマチン領域のために、近位のFndCas9分子が使用され得、SpCas9およびFndCas9の近位の標的化および二本鎖切断活性の増強のための実施例5で示されたものに類似する程度で、遺伝子活性化および遺伝子抑制を増強し得る。
【0215】
実施例9.真核細胞中のCRISPRに基づくエピジェネティック修飾の増強
Cas9タンパク質とエピジェネティック修飾ドメインとの融合は、標的エピジェネティック染色体修飾(p300によるヒストンアセチル化またはシトシンデアミナーゼによるシトシン脱アミノ化など)を可能にする(Hilton et al., Nat. Biotechnol; 2015, 33(5):510-7; Komor et al., Nature, 2016, 533(7603):420-4)。クロマチン構造の動態は、CRISPR複合体が様々なゲノム遺伝子座にアクセスする能力に影響を与えると考えられる。したがって、エピジェネティック修飾因子と融合したdCas9を有するCRISPR(dCas9)複合体の近位のその複合体の配置は、クロマチン免疫沈降のために実施例2で観察されたものに類似する程度で、染色体DNA、局所的なタンパク質または局所的なRNAの標的エピジェネティック修飾を増強するはずである。SpdCas9-エピジェネティック修飾因子による結合および修飾に対して抵抗性であるクロマチン領域のために、近位のFndCas9分子が使用され得、SpCas9およびFndCas9の近位の標的化および二本鎖切断活性の増強のために実施例5で示されたものに類似する程度で検出を増強し得る。
【配列表】