(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-20
(45)【発行日】2024-10-01
(54)【発明の名称】レトロウイルスインテグラーゼ-Cas9融合タンパク質を使用した指向性非相同DNA挿入によるゲノム編集
(51)【国際特許分類】
C07K 19/00 20060101AFI20240924BHJP
C07K 14/15 20060101ALI20240924BHJP
C12N 9/00 20060101ALI20240924BHJP
C12N 15/52 20060101ALI20240924BHJP
C12N 15/48 20060101ALI20240924BHJP
C12N 15/62 20060101ALI20240924BHJP
C12N 15/09 20060101ALN20240924BHJP
C12N 15/63 20060101ALN20240924BHJP
【FI】
C07K19/00 ZNA
C07K14/15
C12N9/00
C12N15/52 Z
C12N15/48
C12N15/62 Z
C12N15/09 100
C12N15/63 Z
(21)【出願番号】P 2021547065
(86)(22)【出願日】2019-10-22
(86)【国際出願番号】 US2019057498
(87)【国際公開番号】W WO2020086627
(87)【国際公開日】2020-04-30
【審査請求日】2022-08-18
(32)【優先日】2018-10-22
(33)【優先権主張国・地域又は機関】US
【前置審査】
(73)【特許権者】
【識別番号】508144129
【氏名又は名称】ユニバーシティ オブ ロチェスター
(74)【代理人】
【識別番号】100099759
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100092624
【氏名又は名称】鶴田 準一
(74)【代理人】
【識別番号】100114018
【氏名又は名称】南山 知広
(74)【代理人】
【識別番号】100117019
【氏名又は名称】渡辺 陽一
(74)【代理人】
【識別番号】100108903
【氏名又は名称】中村 和広
(72)【発明者】
【氏名】ダグラス マシュー アンダーソン
【審査官】松井 一泰
(56)【参考文献】
【文献】特表2018-513681(JP,A)
【文献】米国特許第06228647(US,B1)
【文献】韓国公開特許第10-2014-0111541(KR,A)
【文献】MOORE, Sharon P. et al.,“A Ty1 Integrase Nuclear Localization Signal Required for Retrotransposition”,Molecular and Cellular Biology,1998年02月01日,Vol. 18,No. 2,pp.1105-1114,DOI: 10.1128/MCB.18.2.1105
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00- 15/90
C07K 1/00- 19/00
C12N 9/00- 9/99
UniProt/GeneSeq
(57)【特許請求の範囲】
【請求項1】
a)第1のアミノ酸配列を有するレトロウイルスインテグラーゼ(IN)またはその断片、
b)第2のアミノ酸配列を有するCRISPR関連(Cas)タンパク質、及び
c)
配列番号51を含む第3のアミノ酸配列を有する
Ty1レトロトランスポゾン核局在化シグナル(NLS)
を含む、融合タンパク質。
【請求項2】
前記レトロウイルスINが、ヒト免疫不全ウイルス(HIV)IN、ラウス肉腫ウイルス(RSV)IN、マウス乳癌ウイルス(MMTV)IN、モロニーマウス白血病ウイルス(MoLV)IN、ウシ白血病ウイルス(BLV)IN、ヒトTリンパ向性ウイルス(HTLV)IN、トリ肉腫白血病ウイルス(ASLV)IN、ネコ白血病ウイルス(FLV)IN、異種指向性マウス白血病ウイルス関連ウイルス(XMLV)IN、サル免疫不全ウイルス(SIV)IN、ネコ免疫不全ウイルス(FIV)IN、ウマ伝染性貧血ウイルス(EIAV)IN、プロトタイプフォーミーウイルス(PFV)IN、サルフォーミーウイルス(SFV)IN、ヒトフォーミーウイルス(HFV)IN、ウォールアイ皮膚肉腫ウイルス(WDSV)IN、及びウシ免疫不全ウイルス(BIV)INからなる群から選択される、請求項1に記載の融合タンパク質。
【請求項3】
前記レトロウイルスINの断片が、IN N末端ドメイン(NTD)及びIN触媒コアドメイン(CCD)を含む、請求項1に記載の融合タンパク質。
【請求項4】
前記Casタンパク質が、Cas9、Cas13及びCpf1からなる群から選択される、請求項1に記載の融合タンパク質。
【請求項5】
前記Casタンパク質が、触媒的に欠損している(dCas)、請求項1に記載の融合タンパク質。
【請求項6】
前記レトロウイルスINが、配列番号1~40のうちの1つと少なくとも90%同一である配列を含む、請求項1に記載の融合タンパク質。
【請求項7】
前記レトロウイルスINが、配列番号1~40から選択される配列を含む、請求項1に記載の融合タンパク質。
【請求項8】
前記Casタンパク質が、配列番号41~46のうちの1つと少なくとも95%同一である配列を含む、請求項1に記載の融合タンパク質。
【請求項9】
前記Casタンパク質が、配列番号41~46から選択される配列を含む、請求項1に記載の融合タンパク質。
【請求項10】
前記融合タンパク質が、配列番号57~98のうちの1つと少なくとも90%同一である配列を含む、請求項1に記載の融合タンパク質。
【請求項11】
前記融合タンパク質が、配列番号57~98から選択される配列を含む、請求項1に記載の融合タンパク質。
【請求項12】
請求項1~1
1のいずれか1項に記載の融合タンパク質をコードする、核酸分子。
【請求項13】
前記核酸が、配列番号155~196のうちの1つと少なくとも90%同一である配列を含む、請求項1
2に記載の核酸分子。
【請求項14】
前記核酸が、配列番号155~196から選択される配列を含む、請求項1
2に記載の核酸分子。
【請求項15】
遺伝物質を編集する方法であって、
a)請求項1~
11のいずれか1項に記載の融合タンパク質または請求項1
2~1
4のいずれか1項に記載の核酸分子、
b)前記遺伝物質内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸、ならびに
c)U3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸
を、前記遺伝物質に投与することを含む、前記方法。
【請求項16】
in vitro法
である、請求項1
5に記載の方法。
【請求項17】
遺伝物質を編集するための
組成物であって、
a)融合タンパク質をコードする核酸配列であって、前記融合タンパク質が、レトロウイルスインテグラーゼ(IN)またはその断片、CRISPR関連(Cas)タンパク質、及び
配列番号51を含むアミノ酸配列を有するTy1レトロトランスポゾン核局在化シグナル(NLS)を含む、前記融合タンパク質をコードする核酸配列、
b)CRISPR-Cas系ガイドRNAをコードする核酸配列、ならびに
c)ドナー鋳型核酸をコードする核酸配列であって、前記ドナー鋳型核酸が、U3配列、U5配列及びドナー鋳型配列を含む、前記ドナー鋳型核酸をコードする核酸配列
を、1つ以上のベクターに含む、前記
組成物。
【請求項18】
a)、b)及びc)の核酸が同じかまたは異なるベクター上に存在する、請求項
17に記載の
組成物。
【請求項19】
前記融合タンパク質が、配列番号57~98のうちの1つと少なくとも95%同一である配列を含む、請求項
17に記載の
組成物。
【請求項20】
前記融合タンパク質が、配列番号57~98から選択される配列を含む、請求項
17に記載の
組成物。
【請求項21】
前記CRISPR-Cas系ガイドRNAが、遺伝子の標的DNA配列に
ハイブリダイズする、請求項
17に記載の
組成物。
【請求項22】
前記U3配列及び前記U5配列が、前記レトロウイルスINに特異的である、請求項
17に記載の
組成物。
【請求項23】
ゲノム編集成分を送達するための
組成物であって、
a)触媒的に死んだCas(dCas)タンパク質及び
配列番号51を含むアミノ酸配列を有するTy1レトロトランスポゾン核局在化シグナル(NLS)に融合されたインテグラーゼを含むgag-polポリタンパク質をコードする配列を含むパッケージングプラスミド、
b)ドナー配列、5’LTR及び3’LTRをコードする配列を含む導入プラスミド、ならびに
c)エンベロープタンパク質をコードする核酸配列を含むエンベローププラスミド
を含む、前記
組成物。
【請求項24】
前記パッケージングプラスミドが、ガイドRNA配列をコードする配列をさらに含む、請求項2
3に記載の
組成物。
【請求項25】
ゲノム編集成分を送達するための
組成物であって、
a)gag-polポリタンパク質をコードする配列を含むパッケージングプラスミド、
b)ドナー配列、5’LTR及び3’LTRをコードする配列を含む導入プラスミド、
c)エンベロープタンパク質をコードする核酸配列を含むエンベローププラスミド、ならびに
d)VPR、インテグラーゼ及び触媒的に死んだCas(dCas)、及び
配列番号51を含むアミノ酸配列を有するTy1レトロトランスポゾン核局在化シグナル(NLS)を含む融合タンパク質をコードする核酸配列を含むVPR-IN-dCasプラスミド
を含む、前記
組成物。
【請求項26】
前記VPR-IN-dCasプラスミドが、ガイドRNA配列をコードする配列をさらに含む、請求項2
5に記載の
組成物。
【請求項27】
ゲノム編集成分を送達するための
組成物であって、
a)gag-polポリタンパク質をコードする核酸配列を含むパッケージングプラスミド、
b)ガイドRNA、
インテグラーゼと触媒的に死んだCas(dCas)とを含む融合タンパク質
、5’LTR及び3’LTR、及び
配列番号51を含むアミノ酸配列を有するTy1レトロトランスポゾン核局在化シグナル(NLS)をコードする核酸配列を含む導入プラスミド、ならびに
c)エンベロープタンパク質をコードする核酸配列を含むエンベローププラスミド
を含む、前記
組成物。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2018年10月22日に出願された米国特許仮出願シリアル番号第62/748,703号に対する優先権を主張するものであり、この仮出願は、その全体が参照により本明細書に組み込まれる。
【背景技術】
【0002】
CRISPR-Cas9により、基礎研究及び臨床適用のために哺乳動物ゲノムを迅速に改変する能力が大幅に向上した。CRISPR-Cas9は、ガイドRNAを使用してCas9を特定のDNA標的配列に誘導し、そこで二本鎖DNA切断を誘発し、細胞修復経路を作動させてフレームシフト突然変異を導入するか、または相同組換え修復(HDR)を介してドナー配列を挿入する。これらの著しい進歩にもかかわらず、CRISPR-Cas9媒介性HDRを使用したゲノム編集のための大型DNA配列の標的化送達は、依然として非効率的であり、かなり大きな隣接相同領域を含むドナー鋳型を必要とし、かつp53 DNA損傷経路を誘発する(Byrne et al.,2015,NAR 43:e21、Happaniemi et al.,2018,Nat Med 24:927-30、Ihry et al.,2018,Nat Med 24:939-46)。総合すると、これらはCRISPR-Cas9ゲノム編集の効率を著しく制限する。したがって、統合的なゲノム編集の改善が必要とされている。
【0003】
対照的に、レンチウイルス酵素であるインテグラーゼ(IN)は、標的配列の相同性を必要としないプロセスを介して大型レンチウイルスゲノムの宿主細胞DNAへの挿入を触媒するのに、必要かつ十分である。レンチウイルスDNAのIN媒介性挿入は、DNAに非特異的に結合するC末端ドメインに部分的に起因して、DNA標的配列の特異性がほとんどない状態で生じる(Lutzke & Plasterk 1998,J Virol 72:4841-48)。
【0004】
遺伝子治療技術に関する現在の制限により、大部分のヒト単一遺伝子疾患の治療が妨げられている。CRISPR-Cas9遺伝子編集は、近年、哺乳動物ゲノムの有害な突然変異を修復するための治療的アプローチの開発に関して注目されている。これは、疾患及び障害を引き起こす可能性のあるヒトゲノム内の多数の患者特異的突然変異に起因して、依然として相当な難題である。エクソン-イントロン境界を標的とするように設計されたCRISPRガイドRNAにより、これらの突然変異群を標的とするエクソンスキッピング戦略が可能となるが、しかしながら、これらの戦略の有効性は依然として試験されておらず、すべての患者に適用できるわけではない。
【0005】
多くの遺伝子の遺伝子導入発現は、動物モデルにおいて疾患結果を予防しかつ回復させることができるが、一部の遺伝子の大型のサイズは、CRISPR-Cas9などの従来の遺伝子編集アプローチ、またはAAV(限度約4.9kb)などの従来のウイルス遺伝子治療アプローチのサイズ制限を大幅に超過しており、ヒト遺伝子治療への使用が妨げられている。AAVによって送達される、より小さな操作された遺伝子を使用するアプローチは現在臨床試験中であるが、これらの戦略が長期的な回復をもたらすかどうか、及び特定の突然変異を有する患者にのみに適用可能かどうかは、依然として明らかになっていない。
【0006】
対照的に、レンチウイルスベクターは大型遺伝子を送達することができ、宿主ゲノムへの組み込みにより永続的な修復が可能となる。しかし、レンチウイルス組み込みの現在のランダムな性質は、オフターゲット突然変異及び疾患を引き起こす可能性があり、これにより臨床用途へのこれらの使用が妨げられている(Milone et al.,2018,Leukemia 23:1529-41)。レンチウイルス配列は、ゲノム組み込みに必要な非特異的DNA結合ドメインを利用する、ウイルスにコードされた酵素インテグラーゼ(IN)によって宿主ゲノムに挿入される(Andrake et al.,2015,Annu Rev Virol 2:241-64)。
【0007】
したがって、ゲノム物質の編集の改善が必要とされている。本発明は、この必要性を満たす。
【発明の概要】
【0008】
一態様では、本発明は、融合タンパク質を提供する。一実施形態では、融合タンパク質は、第1のアミノ酸配列を有するレトロウイルスインテグラーゼ(IN)またはその断片、第2のアミノ酸配列を有するCRISPR関連(Cas)タンパク質、及び第3のアミノ酸配列を有する核局在化シグナル(NLS)を含む。
【0009】
一実施形態では、レトロウイルスINは、ヒト免疫不全ウイルス(HIV)IN、ラウス肉腫ウイルス(RSV)IN、マウス乳癌ウイルス(MMTV)IN、モロニーマウス白血病ウイルス(MoLV)IN、ウシ白血病ウイルス(BLV)IN、ヒトTリンパ向性ウイルス(HTLV)IN、トリ肉腫白血病ウイルス(ASLV)IN、ネコ白血病ウイルス(FLV)IN、異種指向性マウス白血病ウイルス関連ウイルス(XMLV)IN、サル免疫不全ウイルス(SIV)IN、ネコ免疫不全ウイルス(FIV)IN、ウマ伝染性貧血ウイルス(EIAV)IN、プロトタイプフォーミーウイルス(PFV)IN、サルフォーミーウイルス(SFV)IN、ヒトフォーミーウイルス(HFV)IN、ウォールアイ皮膚肉腫ウイルス(WDSV)IN、及びウシ免疫不全ウイルス(BIV)INからなる群から選択される。
【0010】
一実施形態では、レトロウイルスIN断片は、IN N末端ドメイン(NTD)及びIN触媒コアドメイン(CCD)を含む。一実施形態では、レトロウイルスINは、配列番号1~40のうちの1つと少なくとも70%同一である配列を含む。一実施形態では、レトロウイルスINは、配列番号1~40のうちの1つの配列を含む。
【0011】
一実施形態では、Casタンパク質は、Cas9、Cas13及びCpf1からなる群から選択される。一実施形態では、Casタンパク質は、触媒的に欠損している(dCas)。一実施形態では、Casタンパク質は、配列番号41~46のうちの1つと少なくとも95%同一である配列を含む。一実施形態では、Casタンパク質は、配列番号41~46のうちの1つの配列を含む。
【0012】
一実施形態では、NLSは、レトロトランスポゾンNLSである。一実施形態では、レトロトランスポゾンNLSは、Ty1 NLSまたはTy2 NLSである。一実施形態では、NLSは、Ty1様NLSである。一実施形態では、NLSは、配列番号47~56、配列番号254~257及び配列番号275~887のうちの1つと少なくとも70%同一である配列を含む。一実施形態では、NLSは、配列番号47~56、配列番号254~257及び配列番号275~887のうちの1つの配列を含む。
【0013】
一実施形態では、融合タンパク質は、配列番号57~98のうちの1つと少なくとも70%同一である配列を含む。一実施形態では、融合タンパク質は、配列番号57~98のうちの1つの配列を含む。
【0014】
一態様では、本発明は、本発明の融合タンパク質をコードする核酸を提供する。一実施形態では、核酸は、配列番号155~196のうちの1つと少なくとも70%同一である配列を含む。一実施形態では、核酸は、配列番号155~196から選択される配列を含む。
【0015】
一態様では、本発明は、遺伝物質を編集する方法を提供する。一実施形態では、本方法は、(a)本発明の融合タンパク質または本発明の融合タンパク質をコードする核酸分子、(b)遺伝物質内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸、ならびに(c)U3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を遺伝物質に投与することを含む。一実施形態では、遺伝物質の編集方法は、in vitro法である。一実施形態では、遺伝物質の編集方法は、in vivo法である。
【0016】
一態様では、本発明は、遺伝物質を編集するための系を提供する。一実施形態では、この系は、(a)本発明の融合タンパク質をコードする核酸配列、(b)CRISPR-Cas系ガイドRNAをコードする核酸配列、ならびに(c)ドナー鋳型核酸をコードする核酸配列であって、このドナー鋳型核酸がU3配列、U5配列及びドナー鋳型配列を含む核酸配列を、1つ以上のベクターに含む。一実施形態では、融合タンパク質は、レトロウイルスインテグラーゼ(IN)またはその断片、CRISPR関連(Cas)タンパク質、及び核局在化シグナル(NLS)を含む。一実施形態では、核酸は、同じベクター上に存在する。一実施形態では、核酸は、異なるベクター上に存在する。
【0017】
一実施形態では、CRISPR-Cas系ガイドRNAは、遺伝子の標的DNA配列に実質的にハイブリダイズする。一実施形態では、U3配列及びU5配列は、レトロウイルスINに特異的である。
【0018】
一態様では、本発明は、ゲノム編集成分を送達するための系を提供する。一実施形態では、この系は、(a)触媒的に死んだCas(dCas)タンパク質に融合されたインテグラーゼを含むgag-polポリタンパク質をコードする配列を含むパッケージングプラスミド、(b)ドナー配列、5’LTR及び3’LTRをコードする配列を含む導入プラスミド、ならびに(c)エンベロープタンパク質をコードする核酸配列を含むエンベローププラスミドを含む。一実施形態では、パッケージングプラスミドは、ガイドRNA配列をコードする配列をさらに含む。
【0019】
一実施形態では、この系は、(a)gag-polポリタンパク質をコードする配列を含むパッケージングプラスミド、(b)ドナー配列、5’LTR及び3’LTRをコードする配列を含む導入プラスミド、(c)エンベロープタンパク質をコードする核酸配列を含むエンベローププラスミド、ならびに(d)VPR、インテグラーゼ及び触媒的に死んだCas(dCas)を含む融合タンパク質をコードする核酸配列を含むVPR-IN-dCasプラスミドを含む。一実施形態では、VPR-IN-dCasプラスミドは、ガイドRNA配列をコードする配列をさらに含む。
【0020】
一実施形態では、この系は、(a)gag-polポリタンパク質をコードする核酸配列を含むパッケージングプラスミド、(b)ガイドRNA、融合タンパク質(インテグラーゼ及び触媒的に死んだCasを含む)、5’LTRならびに3’LTRをコードする核酸配列を含む導入プラスミド、ならびに(c)エンベロープタンパク質をコードする核酸配列を含むエンベローププラスミドを含む。
【0021】
以下の本発明の実施形態の詳細な説明は、添付図面と併せて読むとより良好に理解されるであろう。しかしながら、本発明は、図面に示される実施形態の正確な配置及び手段に限定されないことを理解されたい。
【図面の簡単な説明】
【0022】
【
図1A】哺乳動物のゲノムDNAを編集するためのレトロウイルスインテグラーゼ-dCas9融合タンパク質の核局在化の向上を実証する実験結果を示す。IN-dCas9融合タンパク質の概略図を示す。
【
図1B】哺乳動物のゲノムDNAを編集するためのレトロウイルスインテグラーゼ-dCas9融合タンパク質の核局在化の向上を実証する実験結果を示す。IN-dCas9融合タンパク質の核局在化を示す。
【
図1C】哺乳動物のゲノムDNAを編集するためのレトロウイルスインテグラーゼ-dCas9融合タンパク質の核局在化の向上を実証する実験結果を示す。HEK293細胞中のEF1-アルファの3’UTREを標的とするIRES-mCherry鋳型を組み込むための、INΔC-dCas9融合タンパク質の酵素活性を実証する実験結果を示す。
【
図2】ウイルスインテグラーゼ(IN)とCRISPR-dCas9の融合により、標的特異的な方法で大型DNA配列を組み込むことができることを示す核酸編集技術の概略図を示す。このアプローチにより、通常は非組み込みAAVベクターの制限を超える大型遺伝子配列を、安全かつ永続的に送達することができる。
【
図3】哺乳動物細胞における個々の組み込み事象の忠実度を定量化及び特性決定するために使用した、GFPレポーター細胞株の実験設計及び実験結果を示す。
【
図4】CRISPR-Cas9媒介性の相同組換え修復及びレトロウイルスインテグラーゼ媒介性のランダムDNA組み込みの概略図を示す。
【
図5】インテグラーゼ-Casゲノム編集の概略図を示す。
【
図6】ドナーベクター、平滑末端鋳型の作製、及び3’プロセシング鋳型の作製の概略図を示す。
【
図7】INsrt鋳型、amilCP配列を標的とするIN-dCas9ベクターをCos7細胞にコトランスフェクトした、コトランスフェクションの実験設計を示す。
【
図8】IGR-mCherry-2A-ピューロマイシン-pAカセットをヒトHEK293細胞株にノックインするための、ヒトEF1-アルファ遺伝子座の3’UTRに特異的な対形成したガイドRNAの実験設計、及びトランスフェクションの48時間後のmCherry陽性細胞の画像を示す。
【
図10】floxed対立遺伝子を作製するための多重ゲノム編集を示す概略図を示す。
【
図11】AからCを含み、INΔC-Cas9融合タンパク質の核局在化に対するTy1 NLS様配列の効率を実証する実験結果を示す。Aは、抗FLAG抗体を使用した、Cos-7細胞で発現したC末端の古典的なSV40 NLS、Ty1 NLS、またはTy2 NLSを含有するINΔC-dCas9融合タンパク質の検出を示す。Bは、酵母タンパク質から単離されたTy1 NLS様配列が、強力な核局在化をもたらすことができるか(MAK11)、または明らかな局在化活性をもたらさない(INO4及びSTH1)ことを示す。Cは、Ty1、Ty2及びTy1 NLS様配列の配列を示す。Ty1及びTy2は、長さ及び残基組成の両方において高度に保存されている。スケールバー=10μm。
【
図12】AからCを含み、Ty1 NLSが哺乳動物細胞中のCas9 DNA編集を向上させることを実証する実験結果を示す。Aは、hU6駆動単一ガイドRNA(sgRNA)と、N末端の3xFLAGタグ、SV40 NLS及びC末端のNPM NLSを含有するCAG駆動Cas9タンパク質とをコードするpx330 CRISPR-Cas9発現プラスミドの図を示す。Ty1 NLSを、px330(px330-Ty1)のNPM NLSの代わりにクローニングした。Bは、上流の20ntの標的配列(ts)が下流のルシフェラーゼオープンリーディングフレームからのオープンリーディングを中断する、フレームシフト活性化ルシフェラーゼレポーターが作製されたことを示す。非相同末端結合(NHEJ)によって誘発されるフレームシフトは、下流のレポーターを再構成し、ルシフェラーゼを発現させる。Cは、フレームシフト応答性ルシフェラーゼレポーターと、標的配列に特異的な単一ガイドRNAを含有するpx330との共発現が、非標的化sgRNAと比較して、ルシフェラーゼ活性の約20倍の活性化をもたらしたことを示す。px330-Ty1の共発現は、px330と比べて約44%の向上をもたらした。
【
図13】AからEを含み、編集のためのゲノム標的化戦略を示す。DNAドナー配列の組み込みは、所望の用途に応じて様々なゲノム位置を標的とすることができる。Aは、遺伝子カセットを保有するDNAドナー配列の送達が、遺伝子間の「セーフハーバー」遺伝子座を標的とし、隣接遺伝子または必須遺伝子の発現の破壊を防止できることを示す。Bは、遺伝子カセットを保有するDNAドナー配列の送達が、非必須「セーフハーバー」遺伝子座を標的とし、隣接遺伝子または必須遺伝子の発現の破壊を防止できることを示す。Cは、スプライスアクセプター配列(SA)をコードするDNA配列の組み込みを、遺伝子のイントロン領域(例えば、疾患遺伝子座)に送達することができ、これにより、組み込まれた配列を発現させ、下流の配列の発現を防止できることを示す。Dは、スプライスアクセプター配列(SA)をコードするDNA配列の組み込みを、遺伝子のイントロン領域(例えば、疾患遺伝子座)に送達することができ、これにより、組み込まれた配列を発現させ、下流の配列の発現を防止できることを示す。Eは、3’UTRへの内部リボソーム侵入配列(IRES)を含有するDNAドナー配列の組み込みにより、内在性遺伝子座からの発現を妨害することなく発現させることができることを示す。
【
図14】レンチウイルスの生活環の図を示す。レトロウイルスのサブクラスであるレンチウイルスは、それらのプロウイルスゲノムの永続的な二本鎖DNA(dsDNA)コピーを宿主細胞DNAに組み込む、一本鎖RNAウイルスである。ウイルスの形質導入後、レンチウイルスRNAゲノムは、ウイルスにコードされた逆転写酵素(RT)により平滑末端dsDNAとしてコピーされ、インテグラーゼI(IN)により宿主ゲノムに挿入される。レンチウイルスゲノムは、そのU3末端及びU5末端で、INによるプロウイルスゲノムの組み込みに必要な短い(約20塩基対)配列モチーフに隣接している。レトロウイルスDNAのIN媒介性挿入は、DNA標的配列特異性をほとんど伴わずに生じ、活性遺伝子座へ組み込むことができるが、これは、正常遺伝子機能を破壊する可能性があり、ヒトにおいて疾患を引き起こす可能性がある。
【
図15A】哺乳動物細胞におけるゲノム編集を示す。レンチウイルスインテグラーゼのdCas9への融合は、短いウイルス末端を含有するドナーDNA配列の標的化非相同挿入を可能とする。ヒトU6駆動単一ガイドRNA(sgRNA)及びインテグラーゼ-dCas9融合タンパク質をコードする哺乳動物発現ベクターの図を示す。
【
図15B】哺乳動物細胞におけるゲノム編集を示す。レンチウイルスインテグラーゼのdCas9への融合は、短いウイルス末端を含有するドナーDNA配列の標的化非相同挿入を可能とする。U3/U5ウイルスモチーフに隣接するIGR IRES-mCherry-2A-ピューロマイシン(puro)カセットを含有するdsDNAドナー鋳型を示す図を示す。
【
図15C】哺乳動物細胞におけるゲノム編集を示す。レンチウイルスインテグラーゼのdCas9への融合は、短いウイルス末端を含有するドナーDNA配列の標的化非相同挿入を可能とする。COS-7細胞中で安定して発現するCMV-eGFPレポーター導入遺伝子へのこのドナー鋳型のインテグラーゼ-Cas9媒介性組み込みの概略図を示す。
【
図15D】哺乳動物細胞におけるゲノム編集を示す。レンチウイルスインテグラーゼのdCas9への融合は、短いウイルス末端を含有するドナーDNA配列の標的化非相同挿入を可能とする。COS-7中で安定して発現するCMV-eGFPレポーター導入遺伝子へのこのドナー鋳型のインテグラーゼ-Cas9媒介性組み込みが、mCherryを発現させると同時にeGFP発現の破壊を生じさせることを示す概略図を示す。
【
図15E】哺乳動物細胞におけるゲノム編集を示す。レンチウイルスインテグラーゼのdCas9への融合は、短いウイルス末端を含有するドナーDNA配列の標的化非相同挿入を可能とする。編集したCOS-7細胞中のeGFP発現の喪失及びmCherry発現の獲得を示す実験結果を示す。
【
図16A】従来のレンチウイルス遺伝子送達系を示す。隣接するロングターミナルリピート(LTR)間でウイルスタンパク質をコードするレンチウイルスゲノムの図を示す。
【
図16B】従来のレンチウイルス遺伝子送達系を示す。レンチウイルスゲノムが強力な遺伝子送達ツールとして利用されていることを示す概略図を示す。レンチウイルス粒子を使用して、ドナー導入遺伝子配列をパッケージングし、送達し、安定して発現させることができる。レンチウイルスベクター遺伝子発現系では、ウイルスポリタンパク質はウイルスゲノムから取り除かれ、別々の哺乳動物発現プラスミドを使用して発現される。次に、目的のドナーDNA配列をウイルスポリタンパク質の代わりに、隣接するLTR配列の間にクローニングすることができる。哺乳動物パッケージング細胞におけるこれらのベクターのコトランスフェクションにより、コードされたドナー配列を送達及び組み込むことができるレンチウイルス粒子が形成されるが、しかしながら、後続のウイルス増殖に必要なインテグラーゼ及び他のウイルスタンパク質についてのコード情報は必要とされない。レンチウイルス粒子は、ウイルスタンパク質(例えば、インテグラーゼ及び逆転写酵素)ならびにdsDNAドナー配列の両方を送達するための天然のベクターであり、哺乳動物細胞へのインテグラーゼ媒介性の挿入に要する必要なウイルス末端配列を含有する。レンチウイルスベクターの作製を示す。
【
図16C】従来のレンチウイルス遺伝子送達系を示す。レンチウイルスゲノムが強力な遺伝子送達ツールとして利用されていることを示す概略図を示す。レンチウイルス粒子を使用して、ドナー導入遺伝子配列をパッケージングし、送達し、安定して発現させることができる。レンチウイルスベクター遺伝子発現系では、ウイルスポリタンパク質はウイルスゲノムから取り除かれ、別々の哺乳動物発現プラスミドを使用して発現される。次に、目的のドナーDNA配列をウイルスポリタンパク質の代わりに、隣接するLTR配列の間にクローニングすることができる。哺乳動物パッケージング細胞におけるこれらのベクターのコトランスフェクションにより、コードされたドナー配列を送達及び組み込むことができるレンチウイルス粒子が形成されるが、しかしながら、後続のウイルス増殖に必要なインテグラーゼ及び他のウイルスタンパク質についてのコード情報は必要とされない。レンチウイルス粒子は、ウイルスタンパク質(例えば、インテグラーゼ及び逆転写酵素)ならびにdsDNAドナー配列の両方を送達するための天然のベクターであり、哺乳動物細胞へのインテグラーゼ媒介性の挿入に要する必要なウイルス末端配列を含有する。ドナー導入遺伝子配列を送達し、安定して発現するレンチウイルス粒子の形質導入を示す。
【
図17A】標的化レンチウイルス組み込みを示す。既存のレンチウイルス送達系を改変して、哺乳動物細胞におけるゲノム編集のための、標的化レンチウイルスドナー鋳型の組み込みを目的とした編集成分を導入することができる。gag-polポリタンパク質をコードするレンチウイルスパッケージングプラスミド(例えば、psPax2)内に、インテグラーゼ(またはそのC末端非特異的DNA結合ドメインを欠くインテグラーゼ)にdCas9を直接融合させる1つのアプローチを示す。
【
図17B】標的化レンチウイルス組み込みを示す。既存のレンチウイルス送達系を改変して、哺乳動物細胞におけるゲノム編集のための、標的化レンチウイルスドナー鋳型の組み込みを目的とした編集成分を導入することができる。修飾gag-polポリタンパク質が他のウイルス成分とともにポリタンパク質として翻訳され、ガイドRNAとともに搭載されレンチウイルス粒子にパッケージングされることを示す。このアプローチでは、IN-dCas9融合タンパク質は、プロテアーゼ切断(PR)に必要な配列を保持しており、これにより、粒子成熟中にgag-polポリタンパク質から正常に切断される。哺乳動物細胞の形質導入により、IN-dCas9融合タンパク質、sgRNA及びレンチウイルスドナー配列を含むウイルスタンパク質が送達される。
【
図17C】標的化レンチウイルス組み込みを示す。既存のレンチウイルス送達系を改変して、哺乳動物細胞におけるゲノム編集のための、標的化レンチウイルスドナー鋳型の組み込みを目的とした編集成分を導入することができる。レンチウイルスの形質導入時に、逆転写酵素によるssRNAゲノムの逆転写によって正確なウイルス末端配列(U3及びU5)を含有するdsDNA配列が生成され、この配列はIN-dCas9融合タンパク質により哺乳動物ゲノムに組み込まれることを示す。
【
図18A】ウイルスタンパク質への融合を介した標的化レンチウイルス組み込みを示す。標的化レンチウイルス遺伝子の組み込みを達成するための1つのアプローチとして、ウイルスタンパク質(例えば、ウイルスタンパク質R、VPR)とのN末端及びC末端融合体としてのIN-dCas9の発現及びパッケージングを示す。ウイルスプロテアーゼ切断配列がVPRとIN-dCas9融合タンパク質との間に含まれており、これにより、成熟後にIN-dCas9がVPRから遊離する。
【
図18B】ウイルスタンパク質への融合を介した標的化レンチウイルス組み込みを示す。パッケージング細胞とレンチウイルス成分とのコトランスフェクションにより、VPR-IN-dCas9タンパク質及びsgRNAを含有するウイルス粒子が生成されることを示す。ウイルス粒子形成に必要なパッケージングプラスミド(例えば、psPax2)は、パッケージングプラスミドの状態でインテグラーゼ内にその触媒活性を阻害する突然変異を含んでおり、それにより非インテグラーゼ-Cas9媒介性組み込みを阻害する。
【
図18C】ウイルスタンパク質への融合を介した標的化レンチウイルス組み込みを示す。ウイルスの形質導入時に、IN-dCas9タンパク質がタンパク質として送達され、レンチウイルスドナー配列の組み込みを媒介することを示す。IN-dCas9融合体及びsgRNAをリボタンパク質として送達する利点は、これが標的細胞中で一過性にのみ発現することである。
【
図19A】導入プラスミドへの導入を介した標的化レンチウイルス組み込みを示す。ウイルス導入プラスミド(またはAAVなどの他のウイルスベクター)内からのIN-dCas9融合タンパク質及び/またはガイドRNAの発現が、標的化レンチウイルス遺伝子の組み込みを達成するための1つのアプローチであることを示す。
【
図19B】導入プラスミドへの導入を介した標的化レンチウイルス組み込みを示す。このアプローチでは、IN-dCas9融合タンパク質とsgRNAとを含有する導入プラスミドを、レンチウイルス粒子を生成するのに必要なパッケージングプラスミド及びエンベローププラスミドとともにコトランスフェクトすることを示す。レンチウイルスを使用する場合、パッケージングプラスミドには、非特異的組み込みを阻害するための触媒性突然変異をインテグラーゼ内に含める。
【
図19C】導入プラスミドへの導入を介した標的化レンチウイルス組み込みを示す。哺乳動物細胞を形質導入すると、IN-dCas9融合タンパク質及びsgRNAの発現は、標的化組み込みのためにそれ自身のウイルスドナーベクターを標的とすること(自己組み込み)ができる成分を生成することを示す。この方法は、標的遺伝子の破壊のために、または遺伝子ドライブとして使用される。
【
図20A】レンチウイルスドナー配列の共送達を示す。ドナーDNA配列をコードするレンチウイルス粒子との共形質導入は、組み込まれたドナー鋳型として機能することを示す。
【
図20B】レンチウイルスドナー配列の共送達を示す。このアプローチにおいて、自身のウイルスをコードする配列の自己組み込みの防止は、異なるレトロウイルス科のメンバーに由来するインテグラーゼ酵素及びそれらの対応する導入プラスミドを使用することにより行われ得ることを示す。IN(FIV)-dCas9融合タンパク質をコードするHIVレンチウイルス粒子の作製を示す。
【
図20C】レンチウイルスドナー配列の共送達を示す。このアプローチにおいて、自身のウイルスをコードする配列の自己組み込みの防止は、異なるレトロウイルス科のメンバーに由来するインテグラーゼ酵素及びそれらの対応する導入プラスミドを使用することにより行われ得ることを示す。FIV導入プラスミドを含むFIVレンチウイルス粒子の作製を示す。
【
図20D】レンチウイルスドナー配列の共送達を示す。IN(FIV)-dCas9融合タンパク質をコードするHIVレンチウイルス粒子を利用して、FIVレンチウイルス粒子内にコードされたFIVドナー鋳型を組み込むことを示す。
【
図21】哺乳動物初代細胞における標的化レンチウイルス組み込みを示す。このデータは、マウス胚性線維芽細胞のROSA26
mG/+遺伝子座への、IRES-tdTOカセットをコードするレンチウイルスドナー鋳型のレンチウイルスパッケージング、送達及び標的化組み込みを示す。2日後、IRES-tdTOレポーターをコードするレンチウイルスで形質導入したMEF中で、遍在性の赤色蛍光タンパク質の発現が検出可能であったが、GFP蛍光が保持されていた。注目すべきことに、形質導入の7日後、ROSA26
mG/+一次細胞において緑色蛍光を欠くtdTO赤色蛍光細胞が培養液中で検出可能であった。
【
図22】哺乳動物の安定細胞株における標的化レンチウイルス組み込みを示す。このデータは、COS-7細胞中で安定して発現するCMV-eGFPへの、IRES-tdTOカセットをコードするレンチウイルスドナー鋳型のレンチウイルスパッケージング、送達及び標的化組み込みを示す。
【
図23A】レンチウイルス粒子の標的化組み込みのためのDNA結合ドメインを示す。インテグラーゼの非特異的DNA結合ドメインをdCas9のプログラム可能なDNA結合ドメインに置き換えることにより、レンチウイルス粒子での送達を介したdsDNAドナー鋳型の標的化組み込みが可能となる。代替DNA結合ドメイン(TALENなど)は、ウイルスインテグラーゼへの融合体として標的化組み込みに利用することができる。同様のレンチウイルス産生アプローチを使用して、以前の我々のパッケージング戦略におけるdCas9を特定の配列を標的とするTALENに置き換える。gag-polポリタンパク質の状態でインテグラーゼへの融合体としてパッケージング及び送達されるTALENを示す。
【
図23B】レンチウイルス粒子の標的化組み込みのためのDNA結合ドメインを示す。インテグラーゼの非特異的DNA結合ドメインをdCas9のプログラム可能なDNA結合ドメインに置き換えることにより、レンチウイルス粒子での送達を介したdsDNAドナー鋳型の標的化組み込みが可能となる。代替DNA結合ドメイン(TALENなど)は、ウイルスインテグラーゼへの融合体として標的化組み込みに利用することができる。同様のレンチウイルス産生アプローチを使用して、以前の我々のパッケージング戦略におけるdCas9を特定の配列を標的とするTALENに置き換える。ウイルスタンパク質への融合体としてのインテグラーゼへの融合体として、パッケージング及び送達されるTALENを示す。
【
図23C】レンチウイルス粒子の標的化組み込みのためのDNA結合ドメインを示す。インテグラーゼの非特異的DNA結合ドメインをdCas9のプログラム可能なDNA結合ドメインに置き換えることにより、レンチウイルス粒子での送達を介したdsDNAドナー鋳型の標的化組み込みが可能となる。代替DNA結合ドメイン(TALENなど)は、ウイルスインテグラーゼへの融合体として標的化組み込みに利用することができる。同様のレンチウイルス産生アプローチを使用して、以前の我々のパッケージング戦略におけるdCas9を特定の配列を標的とするTALENに置き換える。導入プラスミド内にコードされたインテグラーゼへの融合体としてパッケージング及び送達されるTALENを示す。
【
図24】AからCを含み、Ty1 NLSが哺乳動物細胞中のCas9 DNA編集を向上させることを実証する実験結果を示す。Aは、hU6駆動単一ガイドRNA(sgRNA)と、N末端の3xFLAGタグ、SV40 NLS及びC末端のNPM NLSを含有するCAG駆動Cas9タンパク質とをコードするpx330 CRISPR-Cas9発現プラスミドの図を示す。Ty1 NLSを、px330(px330-Ty1)のNPM NLSの代わりにクローニングした。Bは、上流の20ntの標的配列(ts)が下流のルシフェラーゼオープンリーディングフレームからのオープンリーディングを中断する、フレームシフト活性化ルシフェラーゼレポーターが作製されたことを示す結果を示す。非相同末端結合(NHEJ)によって誘発されるフレームシフトは、下流のレポーターを再構成し、ルシフェラーゼを発現させる。Cは、フレームシフト応答性ルシフェラーゼレポーターと、標的配列に特異的な単一ガイドRNAを含有するpx330との共発現が、非標的化sgRNAと比較して、ルシフェラーゼ活性の約20倍の活性化をもたらしたことを実証する結果を示す。px330-Ty1の共発現は、px330と比べて約44%の向上をもたらした。
【
図25】TALENを利用して、ドナーDNA鋳型のレトロウイルスインテグラーゼ媒介性の組み込みを誘導することができることを示す概略図を示す。
【
図26】プラスミドDNA組み込みアッセイの模式図を示す。
【
図27】16bp離したTALEN対は約6倍多いクロラムフェニコール耐性コロニーを生じさせたが、28bp離したTALEN対は非標的化インテグラーゼと同様であったことを実証する実験データを示す。
【
図29】AからCを含み、実験結果を示す。Aは、e coli中のamilCP色素タンパク質の発現が紫色のe coliを生じさせることを示す(白矢尻)。ウイルス末端を含有するドナー配列のインテグラーゼ-Cas媒介性組み込みは、amilCPの発現(オレンジ色の矢尻)(カナマイシンプレート上での増殖)を妨害する。Bは、哺乳動物細胞における、平滑末端(ScaI切断)または3’プロセシング模倣(FauI切断)末端のいずれかを有するInsrt IGR-CATドナー鋳型のpCRII-amilCPレポーターへの組み込みを示す。興味深いことに、dCas9への融合体としてのC末端非特異的DNA結合ドメインの欠失は、インテグラーゼ-Cas媒介性組み込みを阻害しない。3’プロセシングを模倣する末端を使用すると、CAT耐性クローンの約2倍の増加が示される。Cは、プラスミドDNAにおけるインテグラーゼ-Cas媒介性組み込みに対するインテグラーゼ突然変異の評価を示す。二量体化阻害突然変異(E85G及びE85F)は、IGR-CATドナー鋳型のamilCPへの二重ガイドRNA標的化組み込みを使用したインテグラーゼ-Cas媒介性組み込みを妨害しない。しかしながら、IN E87G突然変異を、対形成した標的化sgRNAによって回復させることはできない。興味深いことに、dCas9へのタンデムINΔC融合体(tdINΔC-dCas9)は、約2倍向上した組み込みを示す。
【発明を実施するための形態】
【0023】
本発明は、遺伝物質を編集するための融合タンパク質、融合タンパク質をコードする核酸、系及び方法に関する。一実施形態では、本発明は、レトロウイルスインテグラーゼ(IN)-CRISPR関連(Cas)融合タンパク質、及びレトロウイルスIN-Cas融合タンパク質をコードする核酸分子に関する。一実施形態では、IN-Cas融合タンパク質は、核局在化シグナル(NLS)をさらに含む。
【0024】
本発明の融合タンパク質、核酸分子、系及び方法は、ドナーDNA配列を標的ゲノム位置に送達する能力を有する。さらに、本発明は、相同性アームを不要にしてガイドRNAによる標的化に依存し、遺伝物質の編集を大幅に簡素化する。
【0025】
一態様では、本発明は、IN-Cas融合タンパク質を提供する。一実施形態では、融合タンパク質は、第1のアミノ酸配列を有するレトロウイルスINまたはその断片、第2のアミノ酸配列を有するCasタンパク質、及び第3のアミノ酸配列を有するNLSを含む。
【0026】
一態様では、本発明は、IN-Cas融合タンパク質をコードする核酸分子を提供する。一実施形態では、核酸分子は、レトロウイルスINまたはその断片をコードする第1の核酸配列、Casタンパク質をコードする第2の核酸配列、及びNLSをコードする第3の核酸配列を含む。
【0027】
一実施形態では、レトロウイルスINは、ヒト免疫不全ウイルス(HIV)IN、ラウス肉腫ウイルス(RSV)IN、マウス乳癌ウイルス(MMTV)IN、モロニーマウス白血病ウイルス(MoLV)IN、ウシ白血病ウイルス(BLV)IN、ヒトTリンパ向性ウイルス(HTLV)IN、トリ肉腫白血病ウイルス(ASLV)IN、ネコ白血病ウイルス(FLV)IN、異種指向性マウス白血病ウイルス関連ウイルス(XMLV)IN、サル免疫不全ウイルス(SIV)IN、ネコ免疫不全ウイルス(FIV)IN、ウマ伝染性貧血ウイルス(EIAV)IN、プロトタイプフォーミーウイルス(PFV)IN、サルフォーミーウイルス(SFV)IN、ヒトフォーミーウイルス(HFV)IN、ウォールアイ皮膚肉腫ウイルス(WDSV)IN、またはウシ免疫不全ウイルス(BIV)INであり得る。一実施形態では、Casタンパク質は、Cas9またはCpf1である。一実施形態では、NLSは、Ty1 NLSなどのレトロトランスポゾンNLSである。一実施形態では、レトロトランスポゾンNLSは、核局在化を増加させる。
【0028】
一態様では、本発明は、遺伝物質を編集するための系を提供する。一実施形態では、この系は、融合タンパク質をコードする核酸配列であって、この融合タンパク質がレトロウイルスINまたはその断片、Casタンパク質及びNLSを含む核酸配列;CRISPR-Cas系ガイドRNAをコードする核酸配列;ならびにドナー鋳型核酸をコードする核酸配列であって、このドナー鋳型核酸がU3配列、U5配列及びドナー鋳型配列を含む核酸配列を、1つ以上のベクターに含む。
【0029】
一態様では、本発明は、遺伝物質を編集するための方法を提供する。一実施形態では、本発明の核酸分子;遺伝子内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;U3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を投与することを含む方法。
【0030】
定義
別途定義されない限り、本明細書で使用されるすべての技術用語及び科学用語は、本発明が属する技術分野の当業者が一般に理解する意味と同一の意味を有する。
【0031】
概して、本明細書で使用される命名法ならびに細胞培養、分子遺伝学、有機化学、及び核酸化学及びハイブリダイゼーションにおける実験手順は、当該技術分野で周知であり、一般的に用いられるものである。
【0032】
核酸及びペプチド合成には、標準的技術が使用される。技術及び手順は、概して、当該技術分野における従来の方法及び本明細書全体にわたり提供される様々な一般的な参照文献(例えば、Sambrook and Russell,2012,Molecular Cloning,A Laboratory Approach,Cold Spring Harbor Press,Cold Spring Harbor,NY、及びAusubel et al.,2012,Current Protocols in Molecular Biology,John Wiley & Sons,NY)に従って実施される。
【0033】
本明細書で使用される命名法ならびに以下に記載される分析化学及び有機合成で使用される実験手順は、当該技術分野で周知であり、一般的に用いられるものである。標準的技術またはその改変は、化学合成及び化学分析に使用される。
【0034】
本発明の文脈中で(特に特許請求の範囲の文脈中で)使用される「a」、「an」、「the」という用語及び類似の用語は、本明細書中に別段の定めなき限りまたは文脈により明らかに矛盾しない限り、単数及び複数の両方を含むと解釈されるべきである。
【0035】
量、時間の持続期間などの測定可能な値を指すときに本明細書で使用される「約」は、指定の値から±20%、または±10%、または±5%、または±1%、または±0.1%の変動を、そのような変動が開示された方法を実施するために適切である場合に包含することを意味する。
【0036】
「アンチセンス」は、特に、タンパク質をコードする二本鎖DNA分子の非コード鎖の核酸配列、または非コード鎖に実質的に相同である配列を指す。本明細書で定義されるように、アンチセンス配列は、タンパク質をコードする二本鎖DNA分子の配列に相補的である。アンチセンス配列が、DNA分子のコード鎖のコード部分のみに相補的である必要はない。アンチセンス配列は、タンパク質をコードするDNA分子のコード鎖上に指定された調節配列に相補的であり得、この調節配列は、コード配列の発現を制御する。
【0037】
「疾患」は、動物が恒常性を維持することができず、疾患が改善されない場合は動物の健康が悪化し続ける、動物の健康状態である。
【0038】
対照的に、動物における「障害」は、動物が恒常性を維持できるが、その動物の健康状態がその障害が存在しないときよりも好ましくない、健康状態である。障害は、治療せずに放置しても必ずしも動物の健康状態をさらに低下させるとは限らない。
【0039】
疾患もしくは障害の徴候もしくは症状の重症度、そのような徴候もしくは症状が患者によって経験される頻度、またはその両方が低減される場合、疾患または障害は「軽減」される。
【0040】
「コードする」とは、定義されたヌクレオチド配列(すなわち、rRNA、tRNA及びmRNA)または定義されたアミノ酸配列のいずれか、及びそれらから生じる生物学的特性を有する生物学的プロセスにおける他のポリマー及び高分子の合成のための鋳型として機能するための、遺伝子、cDNA、またはmRNAなどのポリヌクレオチド中のヌクレオチドの特定の配列の固有の性質を指す。したがって、遺伝子は、その遺伝子に対応するmRNAの転写及び翻訳が、細胞または他の生物系においてタンパク質を生じさせる場合、タンパク質をコードする。ヌクレオチド配列がmRNA配列と同一であり、通常は配列表に示されるコード鎖と、遺伝子またはcDNAの転写のための鋳型として使用される非コード鎖の両方を、その遺伝子またはcDNAのタンパク質または他の産物をコードすると称することができる。
【0041】
「患者」、「対象」、「個体」などの用語は、本明細書において互換的に使用され、in vitroであるかin vivoであるかを問わず、本明細書に記載の方法に適用可能な任意の動物またはその細胞を指す。特定の非限定的な実施形態では、患者、対象または個体は、ヒトである。
【0042】
抗体に関して本明細書で使用される「特異的に結合する」という用語は、特定の抗原を認識するが、試料中の他の分子を実質的に認識しないか、またはそれらに結合しない抗体を意味する。例えば、1つの種に由来する抗原に特異的に結合する抗体はまた、1つ以上の種に由来するその抗原にも結合し得る。しかし、そのような異種間の反応性それ自体が、特異的なものとしての抗体の分類を変更することはない。別の例では、抗原に特異的に結合する抗体は、その抗原の異なる対立遺伝子形態にも結合し得る。しかしながら、そのような交差反応性それ自体が、特異的なものとしての抗体の分類を変更することはない。
【0043】
場合によっては、「特異的結合」または「特異的に結合」という用語は、抗体、タンパク質、またはペプチドと第2の化学種との相互作用に関して、この相互作用が、化学種の特定の構造(例えば、抗原決定基またはエピトープ)の存在に依存することを意味するのに使用され得る。例えば、抗体はタンパク質全体にではなく、特定のタンパク質構造を認識してそれに結合する。抗体がエピトープ「A」に特異的である場合、標識された「A」及び抗体を含む反応物中にエピトープA(または遊離の非標識のA)を含む分子が存在すると、抗体に結合する標識されたAの量が減少する。
【0044】
遺伝子の「コード領域」は、遺伝子の転写によって産生されるmRNA分子のコード領域とそれぞれ相同または相補的である、遺伝子のコード鎖のヌクレオチド残基及び遺伝子の非コード鎖のヌクレオチドからなる。
【0045】
mRNA分子の「コード領域」はまた、mRNA分子の翻訳中に転移RNA分子のアンチコドン領域と一致するかまたは停止コドンをコードする、mRNA分子のヌクレオチド残基からなる。したがって、コード領域は、mRNA分子によってコードされる成熟タンパク質に存在しないアミノ酸残基のコドンを含むヌクレオチド残基(例えば、タンパク質輸送シグナル配列中のアミノ酸残基)を含み得る。
【0046】
核酸に言及するために本明細書で使用される「相補的」は、2つの核酸鎖の領域間、または同じ核酸鎖の2つの領域間の配列相補性の広範な概念を指す。第1の核酸領域のアデニン残基は、第1の領域に対して逆平行である第2の核酸領域の残基と、この残基がチミンまたはウラシルである場合に特異的な水素結合を形成(「塩基対形成」)できることが知られている。同様に、第1の核酸鎖のシトシン残基は、第1の鎖に対して逆平行である第2の核酸鎖の残基と、この残基がグアニンである場合に塩基対形成できることが知られている。核酸の第1の領域は、2つの領域が逆平行の形で配置され、第1の領域の少なくとも1つのヌクレオチド残基が第2の領域の残基と塩基対形成できる場合、同一または異なる核酸の第2の領域と相補的である。一実施形態では、第1の領域は第1の部分を含み、第2の領域は第2の部分を含み、それにより、第1及び第2の部分が逆平行の形で配置される場合、第1の部分のヌクレオチド残基の少なくとも約50%、少なくとも約75%、少なくとも約90%、または少なくとも約95%が、第2の部分のヌクレオチド残基と塩基対形成できる。一実施形態では、第1の部分のすべてのヌクレオチド残基は、第2の部分のヌクレオチド残基と塩基対形成できる。
【0047】
本明細書で使用される「DNA」という用語は、デオキシリボ核酸と定義される。
【0048】
本明細書で使用される場合、「発現」という用語は、特定のヌクレオチド配列のそのプロモーターによって駆動される転写及び/または翻訳として定義される。
【0049】
本明細書で使用される場合、「発現ベクター」という用語は、転写され得る遺伝子産物の少なくとも一部をコードする核酸配列を含むベクターを指す。場合によっては、RNA分子は続いて、タンパク質、ポリペプチド、またはペプチドに翻訳される。他の場合では、これらの配列は、例えば、アンチセンス分子、siRNA、リボザイムなどの産生において翻訳されない。発現ベクターは、特定の宿主生物における作動可能に連結されたコード配列の転写及び場合により翻訳に必要な核酸配列を指す、様々な制御配列を含み得る。転写及び翻訳を管理する制御配列に加えて、ベクター及び発現ベクターは、他の機能も同様に果たす核酸配列を含み得る。
【0050】
本明細書で使用される場合、「野生型」という用語は、当業者によって理解される当該技術分野の用語であり、突然変異体形態または変異体形態とは区別される、自然界に存在するような生物、株、遺伝子または特徴の典型的な形態を意味する。
【0051】
「相同性」という用語は、相補性の程度を指す。部分的な相同性または完全な相同性(すなわち、同一性)があってもよい。相同性は、多くの場合、配列解析ソフトウェア(例えば、Genetics Computer Group. University of Wisconsin Biotechnology Center.1710 University Avenue. Madison,Wis.53705の Sequence Analysis Software Package)を使用して測定される。そのようなソフトウェアは、様々な置換、欠失、挿入、及び他の修飾に相同性の程度を割り当てることによって、類似配列を合致させる。保存的置換は、通常、以下の群、すなわち、グリシン、アラニン;バリン、イソロイシン、ロイシン;アスパラギン酸、グルタミン酸、アスパラギン、グルタミン;セリン、スレオニン;リジン、アルギニン;及びフェニルアラニン、チロシン内の置換を含む。
【0052】
「単離された」とは、天然状態から変化または除去されたことを意味する。例えば、生存している動物においてその通常の状況で天然に存在する核酸またはペプチドは「単離され」ていないが、その天然の状況の共存物質から部分的にまたは完全に分離された同じ核酸またはペプチドは「単離され」ている。単離された核酸またはタンパク質は、実質的に精製された形態で存在することができ、または、例えば、宿主細胞などの非天然環境に存在することができる。
【0053】
「単離された」という用語は、「単離されたオリゴヌクレオチド」または「単離されたポリヌクレオチド」のように核酸に関して使用されるとき、その供給源中で通常会合している少なくとも1つの混入物から同定され、分離される核酸配列を指す。したがって、単離された核酸は、それが自然界に見出されるものとは異なる形態または状況に存在する。対照的に、単離されていない核酸(例えば、DNA及びRNA)は、それらが自然界に存在する状態で見出される。例えば、所与のDNA配列(例えば、遺伝子)は、隣接遺伝子に近接して宿主細胞染色体上に見出され、RNA配列(例えば、特定のタンパク質をコードする特定のmRNA配列)は、多数のタンパク質をコードする複数の他のmRNAとの混合物として細胞中に見出される。しかしながら、単離された核酸は、例として、その核酸を通常発現する細胞中のそのような核酸を含み、そこで核酸は、天然細胞のものと異なる染色体位置にあるか、またはそうでなければ自然界に見出されるものと異なる核酸配列に隣接している。単離された核酸またはオリゴヌクレオチドは、一本鎖または二本鎖の形態で存在し得る。単離された核酸またはオリゴヌクレオチドがタンパク質を発現するために利用されるとき、このオリゴヌクレオチドは、センス鎖またはコード鎖を最低限含む(すなわち、オリゴヌクレオチドは一本鎖であってよい)が、センス鎖及びアンチセンス鎖の両方を含んでもよい(すなわち、オリゴヌクレオチドは、二本鎖であってもよい)。
【0054】
「単離された」という用語は、「単離されたタンパク質」または「単離されたポリペプチド」のようにポリペプチドに関して使用されるとき、その供給源中で通常会合している少なくとも1つの混入物から同定され、分離されるポリペプチドを指す。したがって、単離された核酸は、それが自然界に見出されるものとは異なる形態または状況に存在する。対照的に、単離されていないポリペプチド(例えば、タンパク質及び酵素)は、それらが自然界に存在する状態で見出される。
【0055】
「核酸」とは、デオキシリボヌクレオシドで構成されているかまたはリボヌクレオシドで構成されているかにかかわらず、かつホスホジエステル結合で構成されているかまたは修飾結合、例えば、ホスホトリエステル、ホスホロアミデート、シロキサン、カーボネート、カルボキシメチルエステル、アセトアミデート、カルバメート、チオエーテル、架橋ホスホロアミデート、架橋メチレンホスホネート、ホスホロチオエート、メチルホスホネート、ホスホロジチオエート、架橋ホスホロチオエートもしくはスルホン結合、及びそのような結合の組み合わせで構成されているかにかかわらず、任意の核酸を意味する。核酸という用語はまた、生物学的に存在する5つの塩基(アデニン、グアニン、チミン、シトシン及びウラシル)以外の塩基から構成される核酸も具体的に含む。「核酸」という用語は、通常、大型のポリヌクレオチドを指す。
【0056】
本明細書では、ポリヌクレオチド配列を記述するために従来の表記法が使用される。一本鎖ポリヌクレオチド配列の左端は5’末端であり、二本鎖ポリヌクレオチド配列の左側方向は、5’方向と称される。
【0057】
新生RNA転写物へのヌクレオチドの5’から3’への付加の方向は、転写方向と称される。mRNAと同じ配列を有するDNA鎖は「コード鎖」と称され、DNA上の参照点に対して5’に位置するDNA鎖上の配列は「上流配列」と称され、DNA鎖上の参照点に対して3’であるDNA鎖上の配列は、「下流配列」と称される。
【0058】
「発現カセット」とは、コード配列の転写及び場合により翻訳に必要なプロモーター/調節配列に作動可能に連結されたコード配列を含む核酸分子を意味する。
【0059】
本明細書で使用される「作動可能に連結された」という用語は、所与の遺伝子の転写及び/または所望のタンパク質分子の合成を指示することができる核酸分子が産生されるような方法での核酸配列の連結を指す。この用語はまた、機能的(例えば、酵素的に活性、結合パートナーに結合することが可能、阻害することが可能など)タンパク質またはポリペプチドが産生されるような方法でアミノ酸をコードする配列の連結を指す。
【0060】
本明細書で使用される場合、「プロモーター/調節配列」という用語は、プロモーター/調節配列に作動可能に連結された遺伝子産物の発現に必要な核酸配列を意味する。場合によっては、この配列はコアプロモーター配列であり得、他の例では、この配列はまた、遺伝子産物の発現に必要なエンハンサー配列及び他の調節エレメントを含み得る。プロモーター/調節配列は、例えば、遺伝子産物を誘導可能な方法で発現させるものであり得る。
【0061】
本明細書で使用される場合、ハイブリダイゼーションに関する「ストリンジェントな条件」は、標的配列に対して相補性を有する核酸が標的配列と主にハイブリダイズし、非標的配列に実質的にハイブリダイズしない条件を指す。ストリンジェントな条件は、一般に配列依存的であり、いくつかの要因によって変動する。一般に、配列が長いほど、その配列がその標的配列に特異的にハイブリダイズする温度は高くなる。ストリンジェントな条件の非限定的な例は、Tijssen(1993),Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part 1,Second Chapter “Overview of principles of hybridization and the strategy of nucleic acid probe assay”,Elsevier,N.Y.に詳細が記載されている。
【0062】
「ハイブリダイゼーション」は、1つ以上のポリヌクレオチドが反応して、ヌクレオチド残基の塩基間の水素結合を介して安定化される複合体を形成する反応を指す。水素結合は、ワトソンクリック塩基対形成、フーグスティーン結合、または他の任意の配列特異的な方法により生じ得る。複合体は、二本鎖構造を形成する2本の鎖、多鎖複合体を形成する3本以上の鎖、単一の自己ハイブリダイズ鎖、またはこれらの任意の組み合わせを含み得る。ハイブリダイゼーション反応は、PCRの開始、または酵素によるポリヌクレオチドの切断などの、より広範なプロセスのステップを構成し得る。所与の配列とハイブリダイズすることができる配列は、所与の配列の「相補体」と称される。
【0063】
「誘導性」プロモーターは、遺伝子産物をコードまたは特定するポリヌクレオチドと作動可能に連結された場合、プロモーターに対応するインデューサーが存在する場合にのみ遺伝子産物を実質的に産生させるヌクレオチド配列である。
【0064】
「構成的」プロモーターは、遺伝子産物をコードまたは特定するポリヌクレオチドと作動可能に連結された場合、細胞中で細胞の大部分またはすべての生理学的条件下において遺伝子産物を産生させるヌクレオチド配列である。
【0065】
本明細書で使用される「ポリヌクレオチド」という用語は、ヌクレオチドの鎖として定義される。さらに、核酸はヌクレオチドのポリマーである。したがって、本明細書で使用される核酸及びポリヌクレオチドは互換的である。当業者は、核酸がポリヌクレオチドであり、これを単量体の「ヌクレオチド」に加水分解することができるという一般的知識を有する。単量体ヌクレオチドを、ヌクレオシドに加水分解することができる。本明細書で使用される場合、ポリヌクレオチドには、限定されないが、当該技術分野で利用可能な任意の手段によって得られるすべての核酸配列が含まれ、これら手段には、限定されないが、通常のクローニング技術及びPCRなどを使用した、ならびに合成的手段による、組換え手段すなわち組換えライブラリーまたは細胞ゲノムからの核酸配列のクローニングが含まれる。
【0066】
本発明との関係において、一般に存在する核酸塩基に関する以下の略称が使用される。「A」はアデノシンを指し、「C」はシトシンを指し、「G」はグアノシンを指し、「T」はチミジンを指し、「U」はウリジンを指す。
【0067】
本明細書で使用される場合、「ペプチド」、「ポリペプチド」及び「タンパク質」という用語は、互換的に使用され、ペプチド結合によって共有結合したアミノ酸残基から構成される化合物を指す。タンパク質またはペプチドには少なくとも2つのアミノ酸が含まれている必要があり、タンパク質またはペプチドの配列を構成することができるアミノ酸の最大数に制限は設けられていない。ポリペプチドには、ペプチド結合によって互いに連結した2つ以上のアミノ酸を含む任意のペプチドまたはタンパク質が含まれる。本明細書で使用される場合、この用語は、例えば、当該技術分野で一般にペプチド、オリゴペプチド及びオリゴマーとも称される短い鎖と、当該技術分野で一般にタンパク質と称され、多くのタイプが存在するより長い鎖の両方を指す。「ポリペプチド」には、例えば、特に、生物学的に活性な断片、実質的に相同なポリペプチド、オリゴペプチド、ホモ二量体、ヘテロ二量体、ポリペプチドの変異体、修飾ポリペプチド、誘導体、類似体、融合タンパク質が含まれる。ポリペプチドには、天然ペプチド、組換えペプチド、合成ペプチド、またはそれらの組み合わせが含まれる。
【0068】
本明細書で使用される「RNA」という用語は、リボ核酸と定義される。
【0069】
「組換えポリヌクレオチド」は、天然に互いに連結していない配列を有するポリヌクレオチドを指す。増幅またはアセンブルした組換えポリヌクレオチドを適切なベクターに含めることができ、このベクターを、適切な宿主細胞を形質転換するために使用することができる。
【0070】
組換えポリヌクレオチドは、非コード機能(例えば、プロモーター、複製起点、リボソーム結合部位など)も同様に果たすことができる。
【0071】
本明細書で使用される「組換えポリペプチド」という用語は、組換えDNA法を使用することによって産生されるポリペプチドとして定義される。
【0072】
本明細書で使用される場合、「転写活性化因子様エフェクターヌクレアーゼ(TALEN)」は、TALエフェクターDNA結合ドメインをDNA切断ドメインに融合することによって作製される人工制限酵素である。これらの反応物質は、効率的でプログラム可能な特異的DNA切断を可能にし、遺伝物質をin situで編集するための強力なツールを代表する。転写活性化因子様エフェクター(TALE)を、ほぼ任意のDNA配列に結合するように迅速に操作することができる。本明細書で使用されるTALENという用語は広義であり、別のTALENの補助なしに二本鎖DNAを切断することができる単量体TALENを含む。TALENという用語は、同じ部位でDNAを切断するために共に機能するように操作された、TALEN対の一方または両方のメンバーを指すためにも使用される。共に機能するTALENは、DNAの掌性を参照して左TALEN及び右TALENと称される場合がある。米国シリアル番号第12/965,590号、米国シリアル番号第13/426,991号(米国特許番号第8,450,471号)、米国シリアル番号第13/427,040号(米国特許番号第8,440,431号)、米国シリアル番号第13/427,137号(米国特許番号第8,440,432号)、及び米国シリアル番号第13/738,381号(これらはすべて、その全体が参照により本明細書に組み込まれる)を参照されたい。
【0073】
「変異体」とは、この用語が本明細書で使用される場合、それぞれ参照核酸配列または参照ペプチド配列とは配列が異なるが、参照分子の本質的な生物学的特性を保持する、核酸配列またはペプチド配列である。核酸変異体の配列の変化は、参照核酸によってコードされるペプチドのアミノ酸配列を変化させない場合もあれば、またはアミノ酸の置換、付加、欠失、融合及びトランケーションを生じさせる場合もある。ペプチド変異体の配列の変化は、通常、限定的または保存的であるため、参照ペプチド及び変異体の配列は全体的に極めて類似しており、多くの領域では同一である。変異体及び参照ペプチドは、任意の組み合わせでの1つ以上の置換、付加、欠失によってアミノ酸配列が異なり得る。核酸またはペプチドの変異体は、対立遺伝子変異体などの天然に存在するものであり得るか、または天然に存在することが知られていない変異体であり得る。核酸及びペプチドの天然に存在しない変異体は、突然変異誘発技術または直接合成によって作製することができる。
【0074】
「ベクター」は、単離された核酸を含み、単離された核酸を細胞内部に送達するために使用することができる物質の組成物である。直鎖状ポリヌクレオチド、イオン性または両親媒性化合物と会合したポリヌクレオチド、プラスミド、及びウイルスを含むがこれらに限定されない多数のベクターが、当該技術分野で公知である。したがって、「ベクター」という用語は、自律的に複製するプラスミドまたはウイルスを含む。この用語はまた、例えば、ポリリジン化合物、リポソームなどの、細胞への核酸の導入を容易にする非プラスミド及び非ウイルス化合物を含むと解釈されるべきである。ウイルスベクターの例としては、アデノウイルスベクター、アデノ随伴ウイルスベクター、レトロウイルスベクターなどが挙げられるが、これらに限定されない。
【0075】
範囲:本開示全体を通して、本発明の様々な態様を範囲形式で表すことができる。範囲形式での記載は、単に便宜上及び簡潔にするためのものであり、本発明の範囲に対する不可変の制限として解釈されるべきではないことを理解されたい。したがって、範囲の記載は、その範囲内の個々の数値に加えて、すべての考えられる副次的範囲を具体的に開示していると見なされるべきである。例えば、1~6などの範囲の記述は、その範囲内の個々の数、例えば、1、2、2.7、3、4、5、5.3及び6などに加えて、1~3、1~4、1~5、2~4、2~6、3~6などの副次的範囲を具体的に開示していると見なされるべきである。これは、範囲の幅に関係なく適用される。
【0076】
融合タンパク質
一態様では、本発明は、核に効果的に送達される編集タンパク質の新規融合体の開発に基づく。一態様では、本発明は、編集タンパク質と第2のアミノ酸配列を有する核局在化シグナル(NLS)とを含む融合タンパク質を提供する。
【0077】
一実施形態では、編集タンパク質は、CRISPR関連(Cas)タンパク質、転写活性化因子様エフェクターベースのヌクレアーゼ(TALEN)タンパク質、ジンクフィンガーヌクレアーゼ(ZFN)タンパク質、及びDNA結合ドメインを有するタンパク質を含むが、これらに限定されない。
【0078】
Casタンパク質の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csxl、Csx15、Csf1、Csf2、Csf3、Csf4、SpCas9、StCas9、NmCas9、SaCas9、CjCas9、CjCas9、AsCpf1、LbCpf1、FnCpf1、VRER SpCas9、VQR SpCas9、xCas9 3.7、それらのホモログ、それらのオルソログ、またはそれらの改変型が挙げられる。いくつかの実施形態では、Casタンパク質は、DNAまたはRNA切断活性を有する。いくつかの実施形態では、Casタンパク質は、標的配列内及び/または標的配列の相補体内などの標的配列の位置での、核酸分子の一方または両方の鎖の切断を誘導する。いくつかの実施形態では、Casタンパク質は、標的配列の最初または最後のヌクレオチドから約1塩基対以内、約2塩基対以内、約3塩基対以内、約4塩基対以内、約5塩基対以内、約6塩基対以内、約7塩基対以内、約8塩基対以内、約9塩基対以内、約10塩基対以内、約15塩基対以内、約20塩基対以内、約25塩基対以内、約50塩基対以内、約100塩基対以内、約200塩基対以内、約500塩基対以内、またはそれを超える塩基対以内の一方または両方の鎖の切断を誘導する。一実施形態では、Casタンパク質は、Cas9、Cas13またはCpf1である。一実施形態では、Casタンパク質は、Cas9である。一実施形態では、Casタンパク質は、触媒的に欠損している(dCas)。
【0079】
一実施形態では、Casタンパク質は、配列番号41~46のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、Casタンパク質は、配列番号41~46のうちの1つの配列を含む。
【0080】
一実施形態では、NLSは、レトロトランスポゾンNLSである。一実施形態では、NLSは、Ty1、酵母GAL4、SKI3、L29、またはヒストンH2Bタンパク質、ポリオーマウイルス大型Tタンパク質、VP1もしくはVP2カプシドタンパク質、SV40 VP1もしくはSV40 VP2カプシドタンパク質、アデノウイルスE1aまたはDBPタンパク質、インフルエンザウイルスNS1タンパク質、肝炎ウイルスコア抗原または哺乳動物ラミン、c-myc、max、c-myb、p53、c-erbA、jun、Tax、ステロイド受容体またはMxタンパク質、ヌクレオプラスミン(NPM2)、ヌクレオフォスミン(NPM1)、またはサルウイルス40(「SV40」)T抗原に由来する。一実施形態では、NLSは、Ty1もしくはTy1由来のNLS、Ty2もしくはTy2由来のNLS、またはMAK11もしくはMAK11由来のNLSである。一実施形態では、Ty1 NLSは、配列番号51のアミノ酸配列を含む。一実施形態では、Ty2 NLSは、配列番号254のアミノ酸配列を含む。一実施形態では、MAK11 NLSは、配列番号256のアミノ酸配列を含む。一実施形態では、NLSは、配列番号47~56及び配列番号254~257のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、NLSタンパク質は、配列番号47~56及び配列番号254~257のうちの1つの配列を含む。
【0081】
一実施形態では、NLSは、Ty1様NLSである。例えば、一実施形態では、Ty様NLSは、KKRXモチーフを含む。一実施形態では、Ty1様NLSは、N末端にKKRXモチーフを含む。一実施形態では、Ty1様NLSは、KKRモチーフを含む。一実施形態では、Ty1様NLSは、C末端にKKRモチーフを含む。一実施形態では、Ty1様NLSは、KKRXモチーフ及びKKRモチーフを含む。一実施形態では、Ty1様NLSは、N末端にKKRX、及びC末端にKKRモチーフを含む。一実施形態では、Ty1様NLSは、少なくとも20個のアミノ酸を含む。一実施形態では、Ty1様NLSは、20~40個のアミノ酸を含む。一実施形態では、Ty1様NLSは、配列番号275~887のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、Ty1様NLSタンパク質は、配列番号275~887のうちの1つの配列を含む。
【0082】
一実施形態では、融合タンパク質は、配列番号249~250のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、融合タンパク質は、配列番号249~250のうちの1つの配列を含む。
【0083】
一態様では、本発明は、核に効果的に送達される、編集タンパク質とレトロウイルスインテグラーゼタンパク質との新規融合体の開発に基づく。これらの融合タンパク質は、ウイルスインテグラーゼのDNA組み込み活性と、触媒的に死んだCasのプログラム可能なDNA標的化能力とを組み合わせる。したがって、この融合タンパク質はDNA挿入について細胞経路に依存しないか、またはATPなどの細胞エネルギー源を必要としないため、この酵素は、例えば、in vitroから原核細胞、分裂真核細胞または非分裂真核細胞に至るまで、多くの状況で機能することができる。さらに、インテグラーゼは挿入に相同性領域を必要とせず、各インテグラーゼファミリーに特異的な小さな末端モチーフ配列のみを必要とするため、これらの融合タンパク質の編集は、複数のガイドRNAによって誘導される場合、多重ゲノム組み込みのための単一DNAドナー鋳型を利用することができる。
【0084】
したがって、一態様では、本発明は、第1のアミノ酸配列を有するCRISPR関連(Cas)タンパク質、第2のアミノ酸配列を有する核局在化シグナル(NLS)、及び第3のアミノ酸配列を有するレトロウイルスインテグラーゼ(IN)またはその断片もしくは変異体を含む融合タンパク質を提供する。
【0085】
一実施形態では、レトロウイルスINは、ヒト免疫不全ウイルス(HIV)IN、ラウス肉腫ウイルス(RSV)IN、マウス乳癌ウイルス(MMTV)IN、モロニーマウス白血病ウイルス(MoLV)IN、ウシ白血病ウイルス(BLV)IN、ヒトTリンパ向性ウイルス(HTLV)IN、トリ肉腫白血病ウイルス(ASLV)IN、ネコ白血病ウイルス(FLV)IN、異種指向性マウス白血病ウイルス関連ウイルス(XMLV)IN、サル免疫不全ウイルス(SIV)IN、ネコ免疫不全ウイルス(FIV)IN、ウマ伝染性貧血ウイルス(EIAV)IN、プロトタイプフォーミーウイルス(PFV)IN、サルフォーミーウイルス(SFV)IN、ヒトフォーミーウイルス(HFV)IN、ウォールアイ皮膚肉腫ウイルス(WDSV)IN、またはウシ免疫不全ウイルス(BIV)INである。
【0086】
一実施形態では、インテグラーゼは、レトロトランスポゾンインテグラーゼである。一実施形態では、レトロトランスポゾンインテグラーゼは、Ty1またはTy2である。一実施形態では、インテグラーゼは、細菌インテグラーゼである。一実施形態では、細菌インテグラーゼは、insFである。
【0087】
一実施形態では、レトロウイルスINは、HIV INである。一実施形態では、HIV INは、1つ以上のアミノ酸置換を含み、この置換は、触媒活性を改善するか、溶解性を改善するか、または1つ以上の宿主細胞補因子との相互作用を増加させる。一実施形態では、HIV INは、E85G、E85F、D116N、F185K、C280S、T97A、Y134R、G140S及びQ148Hからなる群から選択される1つ以上、2つ以上、3つ以上、4つ以上、5つ以上、6つ以上、7つ以上、8つ以上または9つのアミノ酸置換を含む。一実施形態では、HIV INは、アミノ酸置換F185K及びC280Sを含む。一実施形態では、HIV INは、アミノ酸置換T97A及びY134Rを含む。一実施形態では、HIV INは、アミノ酸置換G140S及びQ148Hを含む。
【0088】
一実施形態では、レトロウイルスIN断片は、IN N末端ドメイン(NTD)及びIN触媒コアドメイン(CCD)を含む。一実施形態では、レトロウイルスIN断片は、IN CCD及びIN C末端ドメイン(CTD)を含む。一実施形態では、レトロウイルスIN断片は、IN NTDを含む。一実施形態では、レトロウイルスIN断片は、IN CCDを含む。一実施形態では、レトロウイルスIN断片は、IN CTDを含む。一実施形態では、インテグラーゼの断片は、完全長インテグラーゼの少なくとも1つの活性を保持している。レトロウイルスインテグラーゼの機能及び断片は当該技術分野で公知であり、例えば、Li,et al.,2011,Virology 411:194-205、及びMaertens et al.,2010,Nature 468:326-29に見出すことができ、これらは参照により本明細書に組み込まれる。
【0089】
一実施形態では、レトロウイルスINは、配列番号1~40のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、レトロウイルスINは、配列番号1~40のうちの1つの配列を含む。
【0090】
いくつかの実施形態では、CRISPR-Casドメインは、Casタンパク質を含む。Casタンパク質の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csxl、Csx15、Csf1、Csf2、Csf3、Csf4、SpCas9、StCas9、NmCas9、SaCas9、CjCas9、CjCas9、AsCpf1、LbCpf1、FnCpf1、VRER SpCas9、VQR SpCas9、xCas9 3.7、それらのホモログ、それらのオルソログ、またはそれらの改変型が挙げられる。いくつかの実施形態では、Casタンパク質は、DNAまたはRNA切断活性を有する。いくつかの実施形態では、Casタンパク質は、標的配列内及び/または標的配列の相補体内などの標的配列の位置での、核酸分子の一方または両方の鎖の切断を誘導する。いくつかの実施形態では、Casタンパク質は、標的配列の最初または最後のヌクレオチドから約1塩基対以内、約2塩基対以内、約3塩基対以内、約4塩基対以内、約5塩基対以内、約6塩基対以内、約7塩基対以内、約8塩基対以内、約9塩基対以内、約10塩基対以内、約15塩基対以内、約20塩基対以内、約25塩基対以内、約50塩基対以内、約100塩基対以内、約200塩基対以内、約500塩基対以内、またはそれを超える塩基対以内の一方または両方の鎖の切断を誘導する。一実施形態では、Casタンパク質は、Cas9、Cas13またはCpf1である。一実施形態では、Casタンパク質は、触媒的に欠損している(dCas)。
【0091】
一実施形態では、Casタンパク質は、配列番号41~46のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、Casタンパク質は、配列番号41~46のうちの1つの配列を含む。
【0092】
一実施形態では、NLSは、レトロトランスポゾンNLSである。一実施形態では、NLSは、Ty1、酵母GAL4、SKI3、L29、またはヒストンH2Bタンパク質、ポリオーマウイルス大型Tタンパク質、VP1もしくはVP2カプシドタンパク質、SV40 VP1もしくはSV40 VP2カプシドタンパク質、アデノウイルスE1aまたはDBPタンパク質、インフルエンザウイルスNS1タンパク質、肝炎ウイルスコア抗原または哺乳動物ラミン、c-myc、max、c-myb、p53、c-erbA、jun、Tax、ステロイド受容体またはMxタンパク質、ヌクレオプラスミン(NPM2)、ヌクレオフォスミン(NPM1)、またはサルウイルス40(「SV40」)T抗原に由来する。一実施形態では、NLSは、Ty1もしくはTy1由来のNLS、Ty2もしくはTy2由来のNLS、またはMAK11もしくはMAK11由来のNLSである。一実施形態では、Ty1 NLSは、配列番号51のアミノ酸配列を含む。一実施形態では、Ty2 NLSは、配列番号254のアミノ酸配列を含む。一実施形態では、MAK11 NLSは、配列番号256のアミノ酸配列を含む。一実施形態では、NLSは、配列番号47~56及び配列番号254~257のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、NLSタンパク質は、配列番号47~56及び配列番号254~257のうちの1つの配列を含む。
【0093】
一実施形態では、NLSは、Ty1様NLSである。例えば、一実施形態では、Ty様NLSは、KKRXモチーフを含む。一実施形態では、Ty1様NLSは、N末端にKKRXモチーフを含む。一実施形態では、Ty1様NLSは、KKRモチーフを含む。一実施形態では、Ty1様NLSは、C末端にKKRモチーフを含む。一実施形態では、Ty1様NLSは、KKRXモチーフ及びKKRモチーフを含む。一実施形態では、Ty1様NLSは、N末端にKKRX、及びC末端にKKRモチーフを含む。一実施形態では、Ty1様NLSは、少なくとも20個のアミノ酸を含む。一実施形態では、Ty1様NLSは、20~40個のアミノ酸を含む。一実施形態では、Ty1様NLSは、配列番号275~887のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、Ty1様NLSタンパク質は、配列番号275~887のうちの1つの配列を含む。
【0094】
一実施形態では、融合タンパク質は、配列番号249~250のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、融合タンパク質は、配列番号249~250のうちの1つの配列を含む。
【0095】
一実施形態では、NLSは、2つの異なるNLSの組み合わせを含む。例えば、一実施形態では、NLSは、Ty1由来のNLS及びSV40由来のNLSを含む。一実施形態では、NLSは、Ty1もしくはTy1由来のNLS、Ty2もしくはTy2由来のNLS、またはMAK11もしくはMAK11由来のNLSである。一実施形態では、Ty1 NLSは、配列番号51のアミノ酸配列を含む。一実施形態では、Ty2 NLSは、配列番号254のアミノ酸配列を含む。一実施形態では、MAK11 NLSは、配列番号256のアミノ酸配列を含む。
【0096】
一実施形態では、NLSは、同じNLSの2つのコピーを含む。例えば、一実施形態では、NLSは、第1のTy1由来のNLSと第2のTy1由来のNLSの多量体を含む。
【0097】
一実施形態では、NLSは、配列番号47~56、配列番号254~257及び配列番号275~887のうちの1つに対して少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%である第1の配列、ならびに配列番号47~56、配列番号254~257及び配列番号275~887のうちの1つに対して少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%である第2の配列を含む。一実施形態では、第1の配列及び第2の配列は同じである。一実施形態では、第1の配列及び第2の配列は異なる。
【0098】
一実施形態では、融合タンパク質は、配列番号57~98のうちの1つに対して70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%である配列を含む。一実施形態では、融合タンパク質は、配列番号57~98のうちの1つの配列を含む。
【0099】
本発明のペプチドは、化学的な方法を使用して作製することができる。例えば、ペプチドを、固相技術(Roberge J Y et al(1995)Science 269:202-204)によって合成し、樹脂から切断して、分取高速液体クロマトグラフィーによって精製することができる。自動合成は、例えば、製造業者より提供された指示に従って、ABI 431 A Peptide Synthesizer(Perkin Elmer)を使用して行うことができる。
【0100】
本発明はまた、本明細書に開示される融合タンパク質に対して実質的な相同性を有する任意の形態のペプチドを含むと解釈されるべきである。一実施形態では、「実質的に相同」であるペプチドは、本明細書に開示される融合タンパク質のアミノ酸配列に対して約50%相同、約70%相同、約80%相同、約90%相同、約95%相同、または約99%相同である。
【0101】
あるいは、ペプチドを、組換え手段によって、またはより長いポリペプチドからの切断によって作製することができる。ペプチドの組成は、アミノ酸分析または配列決定によって確認することができる。
【0102】
本発明によるペプチドの変異体は、(i)1つ以上のアミノ酸残基が保存または非保存アミノ酸残基で置換されており、そのような置換されたアミノ酸残基が遺伝暗号によってコードされていてもコードされていなくてもよいもの、(ii)1つ以上の修飾アミノ酸残基、例えば、置換基の付加によって修飾される残基が存在するもの、(iii)ペプチドが本発明のペプチドの代替のスプライス変異体であるもの、(iv)ペプチドの断片、及び/または(v)ペプチドが別のペプチド、例えば、リーダー配列もしくは分泌配列、または精製に使用される配列(例えば、Hisタグ)もしくは検出に使用される配列(例えば、Sv5エピトープタグ)に融合しているものであり得る。断片には、元の配列のタンパク質分解切断(多部位タンパク質分解を含む)を介して生成されたペプチドが含まれる。変異体は、翻訳後修飾または化学的修飾されていてもよい。そのような変異体は、本明細書の教示から当業者の範囲内にあると見なされる。
【0103】
当該技術分野において公知のように、2つのペプチド間の「類似性」は、一方のポリペプチドのアミノ酸配列及びその保存的アミノ酸代替物を、第2のポリペプチドの配列と比較することによって決定される。変異体は、元の配列とは異なるペプチド配列を含むと定義される。一実施形態では、変異体は、対象のセグメントあたりの残基の40%未満で元の配列と異なるか、対象のセグメントあたりの残基の25%未満で元の配列と異なるか、対象のセグメントあたりの残基の10%未満で異なるか、または対象のセグメントあたりわずか数残基で元のタンパク質配列とは異なり、同時に、元の配列の機能性及び/または幹細胞の骨芽細胞系統への分化を刺激する能力を維持するために、元の配列と十分に相同である。本発明は、元のアミノ酸配列と少なくとも60%、65%、70%、72%、74%、76%、78%、80%、90%、または95%類似しているかまたは同一であるアミノ酸配列を含む。2つのペプチド間の同一性の程度は、当業者に周知のコンピュータアルゴリズム及び方法を使用して決定される。2つのアミノ酸配列間の同一性は、BLASTPアルゴリズム[BLAST Manual,Altschul,S.,et al.,NCBI NLM NIH Bethesda,Md.20894、Altschul,S.,et al.,J.Mol.Biol.215:403-410(1990)]を使用することにより決定することができる。
【0104】
本発明のペプチドは、翻訳後修飾され得る。例えば、本発明の範囲内にある翻訳後修飾には、シグナルペプチド切断、グリコシル化、アセチル化、イソプレニル化、タンパク質分解、ミリストイル化、タンパク質フォールディング及びタンパク質分解プロセシングなどが含まれる。いくつかの修飾またはプロセシング事象は、さらなる生物学的機構の導入を必要とする。例えば、シグナルペプチド切断及びコアグリコシル化などのプロセシング事象は、イヌミクロソーム膜またはXenopus卵抽出物(米国特許第6,103,489号)を標準的な翻訳反応に加えることによって検査される。
【0105】
本発明のペプチドは、翻訳後修飾によって、または翻訳中に非天然アミノ酸を導入することによって形成される非天然アミノ酸を含み得る。タンパク質翻訳中に非天然アミノ酸を導入するための様々なアプローチが利用可能である。
【0106】
本発明のペプチドまたはタンパク質は、Reedijk et al.(The EMBO Journal 11(4):1365,1992)に記載されている方法などの従来の方法を使用してリン酸化することができる。
【0107】
本発明のペプチドの環状誘導体もまた、本発明の一部である。環化により、ペプチドは他の分子との会合により好ましい立体構造をとることができる。環化は、当該技術分野で公知の技術を使用して行うことができる。例えば、ジスルフィド結合を、遊離スルフヒドリル基を有する適切に離間した2つの成分の間に形成することができ、またはアミド結合を、一方の成分のアミノ基と別の成分のカルボキシル基との間に形成することができる。環化はまた、Ulysse,L.,et al.,J.Am.Chem.Soc.1995,117,8466-8467に記載されているアゾベンゼン含有アミノ酸を使用して行うことができる。結合を形成する成分は、アミノ酸の側鎖、非アミノ酸成分、またはその2つの組み合わせであり得る。本発明の一実施形態では、環状ペプチドは、右位置にベータターンを含み得る。アミノ酸Pro-Glyを右位置に付加することにより、ベータターンを本発明のペプチドに導入することができる。
【0108】
前述のようなペプチド結合連結を含む環状ペプチドよりも、より可撓性のある環状ペプチドを生成することが望ましい場合がある。より可撓性のあるペプチドは、ペプチドの左右の位置にシステインを導入し、2つのシステインの間にジスルフィドブリッジを形成することによって調製することができる。2つのシステインは、ベータシート及びターンを変形させないように配置される。このペプチドは、ジスルフィド結合の長さ、及びベータシート部分の水素結合数の減少の結果として、より可撓性が高い。環状ペプチドの相対的な可撓性は、分子動力学シミュレーションによって測定することができる。
【0109】
本発明はまた、標的タンパク質に、及び/またはキメラタンパク質を所望の細胞成分もしくは細胞タイプもしくは組織へと誘導することができる標的化ドメインに、融合されたかまたは組み込まれたIN-Cas9ペプチドを含むペプチドに関する。キメラタンパク質はまた、追加のアミノ酸配列またはドメインを含み得る。キメラタンパク質は、様々な成分が異なる供給源に由来し、したがって自然界では一緒に見出されない(すなわち、異種である)という意味において組換えである。
【0110】
一実施形態では、標的化ドメインは、膜貫通ドメイン、膜結合ドメイン、または例えば小胞もしくは核と会合するようにタンパク質を誘導する配列であり得る。一実施形態では、標的化ドメインは、ペプチドを特定の細胞タイプまたは組織に標的化することができる。例えば、標的化ドメインは、細胞表面リガンドまたは標的組織の細胞表面抗原に対する抗体であり得る。標的化ドメインは、本発明のペプチドを細胞成分に標的化することができる。
【0111】
本発明のペプチドを、従来技術により合成することができる。例えば、ペプチドまたはキメラタンパク質を、固相ペプチド合成を使用する化学合成によって合成することができる。これらの方法は、固相合成方法または液相合成方法のいずれかを用いる(例えば、固相合成技術については、J.M.Stewart,and J.D.Young,Solid Phase Peptide Synthesis,2nd Ed.,Pierce Chemical Co.,Rockford Ill.(1984)及びG.Barany and R.B.Merrifield,The Peptides:Analysis Synthesis,Biology editors E.Gross and J.Meienhofer Vol.2 Academic Press,New York,1980,pp.3-254、ならびに古典的な溶液合成については、M Bodansky,Principles of Peptide Synthesis,Springer-Verlag,Berlin 1984、及びE.Gross and J.Meienhofer,Eds.,The Peptides:Analysis,Synthesis,Biology,suprs,Vol 1を参照されたい)。例として、本発明のペプチドは、N-フルオレニルメトキシ-カルボニル-O-ベンジル-L-ホスホスレオニン誘導体としてホスホスレオニンを直接導入する、9-フルオレニルメトキシカルボニル(Fmoc)固相化学を使用して合成することができる。
【0112】
他の分子とコンジュゲートされた本発明のペプチドまたはキメラタンパク質を含むN末端またはC末端融合タンパク質は、ペプチドまたはキメラタンパク質のN末端またはC末端と、所望の生物学的機能を有する選択されたタンパク質または選択マーカーの配列を組換え技術により融合することによって調製することができる。得られた融合タンパク質は、本明細書に記載の選択されたタンパク質またはマーカータンパク質に融合されたIN-Cas9ペプチドを含有する。融合タンパク質を調製するために使用することができるタンパク質の例としては、免疫グロブリン、グルタチオン-S-トランスフェラーゼ(GST)、ヘマグルチニン(HA)及び短縮型mycが挙げられる。
【0113】
本発明のペプチドは、生物学的発現系を使用して開発することができる。これらの系の使用により、ランダムペプチド配列の大型ライブラリーの作成、及び特定のタンパク質に結合するペプチド配列についてのこれらのライブラリーのスクリーニングが可能となる。ライブラリーは、ランダムペプチド配列をコードする合成DNAを適切な発現ベクターにクローニングすることにより作成することができる(Christian et al 1992,J.Mol.Biol.227:711、Devlin et al,1990 Science 249:404、Cwirla et al 1990,Proc.Natl.Acad,Sci.USA,87:6378を参照されたい)。ライブラリーは、重複ペプチドの同時合成によっても構築することもできる(米国特許第4,708,871号を参照されたい)。
【0114】
本発明のペプチド及びキメラタンパク質は、無機酸、例えば、塩酸、硫酸、臭化水素酸、リン酸など、または有機酸、例えば、ギ酸、酢酸、プロピオン酸、グリコール酸、乳酸、ピルビン酸、シュウ酸、コハク酸、リンゴ酸、酒石酸、クエン酸、安息香酸、サリチル酸、ベンゼンスルホン酸、及びトルエンスルホン酸と反応させることにより、医薬塩へと変換することができる。
【0115】
核酸
一実施形態では、本発明の方法は、融合タンパク質をコードする核酸分子を提供する。一実施形態では、核酸分子は、編集タンパク質をコードする第1の核酸配列、及び核局在化シグナル(NLS)をコードする第2の核酸配列を含む。
【0116】
一実施形態では、編集タンパク質は、CRISPR関連(Cas)タンパク質、転写活性化因子様エフェクターベースのヌクレアーゼ(TALEN)タンパク質、ジンクフィンガーヌクレアーゼ(ZFN)タンパク質、及びDNA結合ドメインを有するタンパク質を含むが、これらに限定されない。一実施形態では、編集タンパク質は、Casタンパク質である。
【0117】
Casタンパク質の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csxl、Csx15、Csf1、Csf2、Csf3、Csf4、SpCas9、StCas9、NmCas9、SaCas9、CjCas9、CjCas9、AsCpf1、LbCpf1、FnCpf1、VRER SpCas9、VQR SpCas9、xCas9 3.7、それらのホモログ、それらのオルソログ、またはそれらの改変型が挙げられる。いくつかの実施形態では、Casタンパク質は、DNAまたはRNA切断活性を有する。いくつかの実施形態では、Casタンパク質は、標的配列内及び/または標的配列の相補体内などの標的配列の位置での、核酸分子の一方または両方の鎖の切断を誘導する。いくつかの実施形態では、Casタンパク質は、標的配列の最初または最後のヌクレオチドから約1塩基対以内、約2塩基対以内、約3塩基対以内、約4塩基対以内、約5塩基対以内、約6塩基対以内、約7塩基対以内、約8塩基対以内、約9塩基対以内、約10塩基対以内、約15塩基対以内、約20塩基対以内、約25塩基対以内、約50塩基対以内、約100塩基対以内、約200塩基対以内、約500塩基対以内、またはそれを超える塩基対以内の一方または両方の鎖の切断を誘導する。一実施形態では、Casタンパク質は、Cas9、Cas13またはCpf1である。一実施形態では、Casタンパク質は、Cas9である。一実施形態では、Casタンパク質は、触媒的に欠損している(dCas)。
【0118】
一実施形態では、Casタンパク質をコードする第1の核酸配列は、配列番号41~46のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一であるアミノ酸配列をコードする核酸配列を含む。一実施形態では、Casタンパク質をコードする第1の核酸配列は、配列番号41~46のうちの1つをコードする核酸配列を含む。
【0119】
一実施形態では、Casタンパク質をコードする第1の核酸配列は、配列番号139~144のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である核酸配列を含む。一実施形態では、Casタンパク質をコードする第1の核酸配列は、配列番号139~144のうちの1つの核酸配列を含む。
【0120】
一実施形態では、第2の核酸配列は、核局在化シグナル(NLS)をコードする。一実施形態では、NLSは、レトロトランスポゾンNLSである。一実施形態では、NLSは、酵母GAL4、SKI3、L29、またはヒストンH2Bタンパク質、ポリオーマウイルス大型Tタンパク質、VP1もしくはVP2カプシドタンパク質、SV40 VP1もしくはSV40 VP2カプシドタンパク質、アデノウイルスE1aまたはDBPタンパク質、インフルエンザウイルスNS1タンパク質、肝炎ウイルスコア抗原または哺乳動物ラミン、c-myc、max、c-myb、p53、c-erbA、jun、Tax、ステロイド受容体またはMxタンパク質、ヌクレオプラスミン(NPM2)、ヌクレオフォスミン(NPM1)、またはサルウイルス40(「SV40」)T抗原に由来する。一実施形態では、NLSは、Ty1もしくはTy1由来のNLS、Ty2もしくはTy2由来のNLS、またはMAK11もしくはMAK11由来のNLSである。一実施形態では、Ty1 NLSは、配列番号51のアミノ酸配列を含む。一実施形態では、Ty2 NLSは、配列番号254のアミノ酸配列を含む。一実施形態では、MAK11 NLSは、配列番号256のアミノ酸配列を含む。
【0121】
一実施形態では、NLSは、Ty1様NLSである。例えば、一実施形態では、Ty様NLSは、KKRXモチーフを含む。一実施形態では、Ty1様NLSは、N末端にKKRXモチーフを含む。一実施形態では、Ty1様NLSは、KKRモチーフを含む。一実施形態では、Ty1様NLSは、C末端にKKRモチーフを含む。一実施形態では、Ty1様NLSは、KKRXモチーフ及びKKRモチーフを含む。一実施形態では、Ty1様NLSは、N末端にKKRX、及びC末端にKKRモチーフを含む。一実施形態では、Ty1様NLSは、少なくとも20個のアミノ酸を含む。一実施形態では、Ty1様NLSは、20~40個のアミノ酸を含む。
【0122】
一実施形態では、レトロトランスポゾンNLSは、核局在化を増加させる。一実施形態では、レトロトランスポゾンNLSは、非レトロトランスポゾンNLSと比較して、核局在化を著しく増加させる。
【0123】
一実施形態では、NLSをコードする第2の核酸配列は、配列番号47~56、配列番号254~257及び配列番号275~887のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一であるアミノ酸配列をコードする核酸配列を含む。一実施形態では、NLSをコードする第2の核酸配列は、配列番号47~56、配列番号254~257及び配列番号275~887のうちの1つをコードする核酸配列を含む。
【0124】
一実施形態では、NLSをコードする第2の核酸配列は、配列番号145~154のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である核酸配列を含む。一実施形態では、NLSをコードする第2の核酸配列は、配列番号145~154のうちの1つの核酸配列を含む。
【0125】
一実施形態では、核酸分子は、配列番号249~250のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む融合タンパク質をコードする。一実施形態では、核酸分子は、配列番号249~250のうちの1つの配列を含む融合タンパク質をコードする。
【0126】
一実施形態では、核酸分子は、編集タンパク質をコードする第1の核酸配列、核局在化シグナル(NLS)をコードする第2の核酸配列、及びレトロウイルスインテグラーゼ(IN)またはその断片をコードする第3の核酸配列を含む。
【0127】
一実施形態では、レトロウイルスINは、ヒト免疫不全ウイルス(HIV)IN、ラウス肉腫ウイルス(RSV)IN、マウス乳癌ウイルス(MMTV)IN、モロニーマウス白血病ウイルス(MoLV)IN、ウシ白血病ウイルス(BLV)IN、ヒトTリンパ向性ウイルス(HTLV)IN、トリ肉腫白血病ウイルス(ASLV)IN、ネコ白血病ウイルス(FLV)IN、異種指向性マウス白血病ウイルス関連ウイルス(XMLV)IN、サル免疫不全ウイルス(SIV)IN、ネコ免疫不全ウイルス(FIV)IN、ウマ伝染性貧血ウイルス(EIAV)IN、プロトタイプフォーミーウイルス(PFV)IN、サルフォーミーウイルス(SFV)IN、ヒトフォーミーウイルス(HFV)IN、ウォールアイ皮膚肉腫ウイルス(WDSV)IN、またはウシ免疫不全ウイルス(BIV)INである。
【0128】
一実施形態では、レトロウイルスINは、HIV INである。一実施形態では、HIV INは、1つ以上のアミノ酸置換を含み、この置換は、触媒活性を改善するか、溶解性を改善するか、または1つ以上の宿主細胞補因子との相互作用を増加させる。一実施形態では、HIV INは、E85G、E85F、D116N、F185K、C280S、T97A、Y134R、G140S及びQ148Hからなる群から選択される1つ以上、2つ以上、3つ以上、4つ以上、5つ以上、6つ以上、7つ以上、8つ以上または9つのアミノ酸置換を含む。一実施形態では、HIV INは、アミノ酸置換F185K及びC280Sを含む。一実施形態では、HIV INは、アミノ酸置換T97A及びY134Rを含む。一実施形態では、HIV INは、アミノ酸置換G140S及びQ148Hを含む。
【0129】
一実施形態では、レトロウイルスIN断片は、IN N末端ドメイン(NTD)及びIN触媒コアドメイン(CCD)を含む。一実施形態では、レトロウイルスIN断片は、IN CCD及びIN C末端ドメイン(CTD)を含む。一実施形態では、レトロウイルスIN断片は、IN NTDを含む。一実施形態では、レトロウイルスIN断片は、IN CCDを含む。一実施形態では、レトロウイルスIN断片は、IN CTDを含む。一実施形態では、インテグラーゼの断片は、完全長インテグラーゼの少なくとも1つの活性を保持している。レトロウイルスインテグラーゼの機能及び断片は当該技術分野で公知であり、例えば、Li,et al.,2011,Virology 411:194-205、及びMaertens et al.,2010,Nature 468:326-29に見出すことができ、これらは参照により本明細書に組み込まれる。
【0130】
一実施形態では、レトロウイルスINをコードする第3の核酸配列は、配列番号1~40のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一であるアミノ酸配列をコードする核酸配列を含む。一実施形態では、レトロウイルスINをコードする第3の核酸配列は、配列番号1~40のうちの1つをコードする核酸配列を含む。
【0131】
一実施形態では、レトロウイルスINをコードする第3の核酸配列は、配列番号99~138のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である核酸配列を含む。一実施形態では、レトロウイルスINをコードする第3の核酸配列は、配列番号99~138のうちの1つの核酸配列を含む。
【0132】
一実施形態では、編集タンパク質は、CRISPR関連(Cas)タンパク質、転写活性化因子様エフェクターベースのヌクレアーゼ(TALEN)タンパク質、ジンクフィンガーヌクレアーゼ(ZFN)タンパク質、及びDNA結合タンパク質を含むが、これらに限定されない。一実施形態では、編集タンパク質は、Casタンパク質である。一実施形態では、Casタンパク質は、Cas9、Cas13またはCpf1である。一実施形態では、Casタンパク質は、触媒的に欠損している(dCas)。
【0133】
一実施形態では、第1の核酸配列は、Casタンパク質をコードする。一実施形態では、Casタンパク質をコードする第1の核酸配列は、配列番号41~46のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一であるアミノ酸配列をコードする核酸配列を含む。一実施形態では、Casタンパク質をコードする第1の核酸配列は、配列番号41~46のうちの1つをコードする核酸配列を含む。
【0134】
一実施形態では、Casタンパク質をコードする第1の核酸配列は、配列番号139~144のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である核酸配列を含む。一実施形態では、Casタンパク質をコードする第1の核酸配列は、配列番号139~144のうちの1つの核酸配列を含む。
【0135】
一実施形態では、第2の核酸配列は、核局在化シグナル(NLS)をコードする。一実施形態では、NLSは、レトロトランスポゾンNLSである。一実施形態では、NLSは、酵母GAL4、SKI3、L29、またはヒストンH2Bタンパク質、ポリオーマウイルス大型Tタンパク質、VP1もしくはVP2カプシドタンパク質、SV40 VP1もしくはSV40 VP2カプシドタンパク質、アデノウイルスE1aまたはDBPタンパク質、インフルエンザウイルスNS1タンパク質、肝炎ウイルスコア抗原または哺乳動物ラミン、c-myc、max、c-myb、p53、c-erbA、jun、Tax、ステロイド受容体またはMxタンパク質、ヌクレオプラスミン(NPM2)、ヌクレオフォスミン(NPM1)、またはサルウイルス40(「SV40」)T抗原に由来する。一実施形態では、NLSは、Ty1もしくはTy1由来のNLS、Ty2もしくはTy2由来のNLS、またはMAK11もしくはMAK11由来のNLSである。一実施形態では、Ty1 NLSは、配列番号51のアミノ酸配列を含む。一実施形態では、Ty2 NLSは、配列番号254のアミノ酸配列を含む。一実施形態では、MAK11 NLSは、配列番号256のアミノ酸配列を含む。
【0136】
一実施形態では、レトロトランスポゾンNLSは、核局在化を増加させる。一実施形態では、レトロトランスポゾンNLSは、非レトロトランスポゾンNLSと比較して、核局在化を著しく増加させる。
【0137】
一実施形態では、NLSをコードする第2の核酸配列は、配列番号47~56、配列番号254~257及び配列番号275~87のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一であるアミノ酸配列をコードする核酸配列を含む。一実施形態では、NLSをコードする第2の核酸配列は、配列番号47~56、配列番号254~257及び配列番号275~887のうちの1つをコードする核酸配列を含む。
【0138】
一実施形態では、NLSをコードする第2の核酸配列は、配列番号145~154のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である核酸配列を含む。一実施形態では、NLSをコードする第2の核酸配列は、配列番号145~154のうちの1つの核酸配列を含む。
【0139】
一実施形態では、核酸分子は、配列番号57~98のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む融合タンパク質をコードする。一実施形態では、核酸分子は、配列番号57~98のうちの1つの配列を含む融合タンパク質をコードする。
【0140】
一実施形態では、核酸分子は、配列番号155~196のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である核酸配列を含む。一実施形態では、核酸分子は、配列番号155~196のうちの1つの核酸配列を含む。
【0141】
融合タンパク質をコードする単離された核酸配列は、当該技術分野において公知の多数の組換え方法のいずれかを使用して、例えば、標準的技術を使用して、その遺伝子を発現する細胞からライブラリーをスクリーニングすることによって、その遺伝子を含むことが知られているベクターから遺伝子を誘導することによって、またはその遺伝子を含む細胞及び組織から直接単離することなどによって得ることができる。あるいは、目的の遺伝子を、クローニングするのではなく合成的に生成することができる。
【0142】
単離された核酸は、DNA及びRNAを含むがこれらに限定されない、任意のタイプの核酸を含み得る。例えば、一実施形態では、組成物は例えば、本発明の融合タンパク質をコードする、単離されたcDNA分子を含む単離されたDNA分子を含む。一実施形態では、組成物は、本発明の融合タンパク質をコードする単離されたRNA分子、またはその機能的断片を含む。
【0143】
本発明の核酸分子は、血清中または細胞培養用の増殖培地中の安定性を改善するように修飾することができる。本発明の核酸分子の安定性、機能性及び/または特異性を向上させ、免疫刺激特性を最小化するために、修飾を加えることができる。例えば、安定性を向上させるために、3’残基を分解に対して安定化させることができ、例えば、それらを、プリンヌクレオチド、特にアデノシンまたはグアノシンヌクレオチドからなるように選択することができる。あるいは、修飾類似体によるピリミジンヌクレオチドの置換、例えば、2’-デオキシチミジンによるウリジンの置換は許容され、分子の機能に影響を及ぼさない。
【0144】
本発明の一実施形態では、核酸分子は、少なくとも1つの修飾ヌクレオチド類似体を含み得る。例えば、末端は、修飾ヌクレオチド類似体を導入することによって安定化され得る。
【0145】
ヌクレオチド類似体の非限定的な例には、糖修飾及び/または骨格修飾リボヌクレオチドが含まれる(すなわち、リン酸-糖骨格への修飾が含まれる)。例えば、天然RNAのホスホジエステル結合は、窒素または硫黄ヘテロ原子のうちの少なくとも1つを含むように修飾され得る。例示的な骨格修飾リボヌクレオチドでは、隣接するリボヌクレオチドに連結するリン酸エステル基は、修飾基、例えば、ホスホチオエート基の修飾基によって置換されている。例示的な糖修飾リボヌクレオチドでは、2’-OH基は、H、OR、R、ハロ、SH、SR、NH2、NHR、NR2またはONから選択される基(式中、RはC1~C6アルキル、アルケニルまたはアルキニルであり、ハロはF、Cl、BrまたはIである)によって置換されている。
【0146】
修飾の他の例は、核酸塩基修飾リボヌクレオチド、すなわち、天然に存在する核酸塩基の代わりに少なくとも1つの天然に存在しない核酸塩基を含有するリボヌクレオチドである。アデノシンデアミナーゼの活性を遮断するように塩基を修飾することができる。例示的な修飾核酸塩基には、限定されないが、5位で修飾されたウリジン及び/またはシチジン、例えば、5-(2-アミノ)プロピルウリジン、5-ブロモウリジン;8位で修飾されたアデノシン及び/またはグアノシン、例えば、8-ブロモグアノシン;デアザヌクレオチド、例えば、7-デアザ-アデノシン;O-アルキル化及びN-アルキル化ヌクレオチド、例えば、N6-メチルアデノシンが含まれ、好適である。前述の修飾を組み合わせてもよいことに留意されたい。
【0147】
場合によっては、核酸分子は、以下の化学修飾のうちの1つ以上、すなわち、1つ以上のヌクレオチドの2’-H修飾、2’-O-メチル修飾、または2’-OH修飾を含む。特定の実施形態では、本発明の核酸分子は、ヌクレアーゼに対する向上した耐性を有し得る。ヌクレアーゼ耐性を増加させるために、核酸分子は、例えば、2’-修飾リボース単位及び/またはホスホロチオエート結合を含み得る。例えば、2’ヒドロキシル基(OH)を、いくつかの異なる「オキシ」または「デオキシ」置換基で修飾または置換することができる。ヌクレアーゼ耐性を増加させるために、本発明の核酸分子は、2’-O-メチル、2’-フッ素、2’-O-メトキシエチル、2’-O-アミノプロピル、2’-アミノ、及び/またはホスホロチオエート結合を含み得る。ロックド核酸(LNA)、エチレン核酸(ENA)、例えば2’-4’-エチレン架橋核酸の包含、及び2-アミノ-A修飾、2-チオ(例えば、2-チオ-U)修飾、G-クランプ修飾などの特定の核酸塩基修飾もまた、標的に対する結合親和性を増加させることができる。
【0148】
一実施形態では、核酸分子は、2’-修飾ヌクレオチド、例えば、2’-デオキシ、2’-デオキシ-2’-フルオロ、2’-O-メチル、2’-O-メトキシエチル(2’-O-MOE)、2’-O-アミノプロピル(2’-O-AP)、2’-O-ジメチルアミノエチル(2’-O-DMAOE)、2’-O-ジメチルアミノプロピル(2’-O-DMAP)、2’-O-ジメチルアミノエチルオキシエチル(2’-O-DMAEOE)、または2’-O-N-メチルアセトアミド(2’-O-NMA)を含む。一実施形態では、核酸分子は、少なくとも1つの2’-O-メチル修飾ヌクレオチドを含み、いくつかの実施形態では、核酸分子のすべてのヌクレオチドは、2’-O-メチル修飾を含む。
【0149】
特定の実施形態では、本発明の核酸分子は、以下の特性のうちの1つ以上を有する。
【0150】
本明細書で論じられる核酸剤は、特に修飾されていないRNA及びDNA、ならびに例えば有効性を改善するために修飾されたRNA及びDNA、ならびにヌクレオシド代替物のポリマーを含む。非修飾RNAとは、核酸の成分、すなわち糖、塩基及びリン酸部分が自然界に存在するもの、または人体に天然に存在するものと同じかまたは本質的に同じである分子を指す。当該技術分野では、稀または特殊であるが天然に存在するRNAを修飾RNAと称しており、例えば、Limbach et al.(Nucleic Acids Res.,1994,22:2183-2196)を参照されたい。しばしば修飾RNAと称されるこのような稀または特殊なRNAは、通常、転写後修飾の結果であり、本明細書で使用される非修飾RNAという用語の範囲内にある。本明細書で使用される修飾RNAとは、核酸の成分、すなわち糖、塩基及びリン酸部分の1つ以上が、自然界に存在するものと異なるか、または人体に存在するものと異なる分子を指す。それらは「修飾RNA」と称されるが、修飾に起因して、厳密に言えばRNAではない分子も当然ながら含まれることになる。ヌクレオシド代替物とは、ハイブリダイゼーションがリボリン酸骨格で見られるものと実質的に類似するように、塩基を正しい空間関係で提示することが可能となる非リボリン酸構築物、例えばリボリン酸骨格の非荷電模倣物で、リボリン酸骨格が置換されている分子である。
【0151】
本発明の核酸の修飾は、リン酸基、糖基、骨格、N末端、C末端、または核酸塩基のうちの1つ以上に存在し得る。
【0152】
本発明はまた、本発明の単離された核酸が挿入されたベクターを含む。当該技術分野には、本発明において有用である適切なベクターが豊富に存在する。
【0153】
簡単に要約すると、本発明の融合タンパク質をコードする天然または合成核酸の発現は、通常、本発明の融合タンパク質またはその一部をコードする核酸をプロモーターに作動可能に連結し、その構築物を発現ベクターに導入することにより行われる。使用するベクターは、真核細胞における複製、及び場合により組み込みに適している。典型的なベクターには、転写及び翻訳ターミネーター、開始配列、ならびに所望の核酸配列の発現の調節に有用なプロモーターが含まれる。
【0154】
本発明のベクターはまた、標準的な遺伝子送達プロトコルを使用する核酸免疫化及び遺伝子治療に使用することができる。遺伝子送達の方法は当該技術分野で公知である。例えば、その全体が参照により本明細書に組み込まれる、米国特許第5,399,346号、同第5,580,859号、同第5,589,466号を参照されたい。別の実施形態では、本発明は、遺伝子治療ベクターを提供する。
【0155】
本発明の単離された核酸は、多数のタイプのベクターにクローニングすることができる。例えば、核酸は、プラスミド、ファージミド、ファージ誘導体、動物ウイルス及びコスミドを含むがこれらに限定されないベクターにクローニングすることができる。特に対象となるベクターには、発現ベクター、複製ベクター、プローブ生成ベクター及び配列決定ベクターが含まれる。
【0156】
さらに、ベクターを、ウイルスベクターの形態で細胞に供給することができる。ウイルスベクター技術は当該技術分野で周知であり、例えば、Sambrook et al.(2012,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory,New York)ならびに他のウイルス学及び分子生物学のマニュアルに記載されている。ベクターとして有用なウイルスとしては、レトロウイルス、アデノウイルス、アデノ随伴ウイルス、ヘルペスウイルス及びレンチウイルスが挙げられるが、これらに限定されない。一般に、適切なベクターは、少なくとも1種の生物において機能する複製起点、プロモーター配列、好都合な制限エンドヌクレアーゼ部位、及び1つ以上の選択マーカーを含有する(例えば、WO01/96584、WO01/29058、及び米国特許第6,326,193号)。
【0157】
送達系及び方法
一態様では、本発明は、新規のレンチウイルスパッケージング及び送達系の開発に関する。レンチウイルス粒子は、ウイルス酵素をタンパク質として送達する。このような方法では、レンチウイルス酵素が短命であることから、細胞の生涯にわたる長期間の発現に起因するオフターゲット編集の可能性が制限される。編集成分、または従来のCRISPR-Cas編集成分をタンパク質としてレンチウイルス粒子に導入することは、それらの必要な活性が短期間のみ必要とされることを考慮すると有利である。したがって、一実施形態では、本発明は、レンチウイルス送達系、ならびにレンチウイルス送達系を使用した本発明の組成物の送達、遺伝物質の編集、及び核酸送達の方法を提供する。
【0158】
例えば、一態様では、送達系は、(1)パッケージングプラスミド、(2)導入プラスミド、及び(3)エンベローププラスミドを含む。一実施形態では、パッケージングプラスミドは、修飾gag-polポリタンパク質をコードする核酸配列を含む。一実施形態では、修飾gag-polポリタンパク質は、編集タンパク質に融合されたインテグラーゼを含む。一実施形態では、修飾gag-polポリタンパク質は、Casタンパク質に融合されたインテグラーゼを含む。一実施形態では、修飾gag-polポリタンパク質は、触媒的に死んだCasタンパク質(dCas)に融合されたインテグラーゼを含む。一実施形態では、パッケージングプラスミドは、sgRNA配列をコードする配列をさらに含む。
【0159】
一実施形態では、導入プラスミドは、ドナー配列を含む。ドナー配列は、ゲノムに送達される任意の核酸配列であり得る。一実施形態では、導入プラスミドは、5’ロングターミナルリピート(LTR)配列及び3’LTR配列を含む。一実施形態では、3’LTRは、自己不活型(SIN)LTRである。したがって、一実施形態では、5’LTRは、U3配列、R配列及びU5配列を含み、3’LTRは、R配列及びU5配列を含むが、U3配列を含まない。一実施形態では、5’LTR及び3’LTRは、Insctriptrパッケージングプラスミド中のインテグラーゼに特異的である。
【0160】
一実施形態では、エンベローププラスミドは、エンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベローププラスミドは、HIVエンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベローププラスミドは、水疱性口内炎ウイルスgタンパク質エンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベロープタンパク質は、所望の細胞タイプに基づいて選択され得る。
【0161】
一実施形態では、パッケージングプラスミド、導入プラスミド及びエンベローププラスミドは、細胞に導入される。一実施形態では、細胞は、修飾gag-polタンパク質をコードする核酸配列を転写及び翻訳して、修飾gag-polタンパク質を産生する。一実施形態では、細胞は、sgRNAをコードする核酸配列を転写する。一実施形態では、sgRNAは、インテグラーゼ-Cas融合タンパク質に結合する。一実施形態では、細胞は、エンベロープタンパク質をコードする核酸配列を転写及び翻訳して、エンベロープタンパク質を産生する。一実施形態では、細胞は、ドナー配列を転写して、ドナー配列RNA分子をもたらす。一実施形態では、sgRNAに結合する修飾gag-polタンパク質、エンベロープポリタンパク質及びドナー配列RNAは、ウイルス粒子にパッケージングされる。一実施形態では、ウイルス粒子は細胞培地から採取される。一実施形態では、ウイルス粒子は標的細胞を形質導入し、ここで、sgRNAは細胞DNAの標的領域に結合し、これによりIN-Cas9融合タンパク質を標的化し、インテグラーゼはドナー配列の細胞DNAへの組み込みを触媒する。
【0162】
一態様では、送達系は、(1)パッケージングプラスミド、(2)導入プラスミド、(3)エンベローププラスミド、及び(4)VPR-IN-dCasプラスミドを含む。一実施形態では、パッケージングプラスミドは、gag-polポリタンパク質をコードする核酸配列を含む。一実施形態では、gag-polポリタンパク質は、触媒的に死んだインテグラーゼを含む。一実施形態では、gag-polポリタンパク質は、D116Nインテグラーゼ突然変異を含む。
【0163】
一実施形態では、導入プラスミドは、ドナー配列を含む。ドナー配列は、ゲノムに送達される任意の核酸配列であり得る。一実施形態では、導入プラスミドは、5’ロングターミナルリピート(LTR)配列及び3’LTR配列を含む。一実施形態では、3’LTRは、自己不活型(SIN)LTRである。したがって、一実施形態では、5’LTRは、U3配列、R配列及びU5配列を含み、3’LTRは、R配列及びU5配列を含むが、U3配列を含まない。一実施形態では、5’LTR及び3’LTRは、VPR-IN-dCasパッケージングプラスミド中のインテグラーゼに特異的である。
【0164】
一実施形態では、エンベローププラスミドは、エンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベローププラスミドは、HIVエンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベローププラスミドは、水疱性口内炎ウイルスgタンパク質(VSV-g)エンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベロープタンパク質は、所望の細胞タイプに基づいて選択され得る。
【0165】
一実施形態では、VPR-IN-dCasプラスミドは、VPR、インテグラーゼ及び編集タンパク質を含む融合タンパク質をコードする核酸配列を含む。一実施形態では、VPR-IN-dCasプラスミドは、VPR、インテグラーゼ及びCasタンパク質を含む融合タンパク質をコードする核酸配列を含む。一実施形態では、VPR-IN-dCasプラスミドは、VPR、インテグラーゼ及びdCasタンパク質を含む融合タンパク質をコードする核酸配列を含む。一実施形態では、融合タンパク質は、VPRとインテグラーゼとの間にプロテアーゼ切断部位を含む。一実施形態では、VPR-IN-dCasプラスミドパッケージングプラスミドは、sgRNA配列をコードする配列をさらに含む。
【0166】
一実施形態では、パッケージングプラスミド、導入プラスミド、エンベローププラスミド及びVPR-IN-dCasプラスミドは、細胞に導入される。一実施形態では、細胞は、gag-polタンパク質をコードする核酸配列を転写及び翻訳して、gag-polポリタンパク質を産生する。一実施形態では、細胞は、エンベロープタンパク質をコードする核酸配列を転写及び翻訳して、エンベロープタンパク質を産生する。一実施形態では、細胞は、ドナー配列を転写して、ドナー配列RNA分子をもたらす。一実施形態では、細胞は、融合タンパク質を転写及び翻訳して、VPR-インテグラーゼ-編集タンパク質融合タンパク質を産生する。一実施形態では、細胞は、融合タンパク質を転写及び翻訳して、VPR-インテグラーゼ-dCas融合タンパク質を産生する。一実施形態では、細胞は、sgRNAをコードする核酸配列を転写する。一実施形態では、sgRNAは、VPR-インテグラーゼ-dCas融合タンパク質に結合する。
【0167】
一実施形態では、gag-polタンパク質、エンベロープポリタンパク質、ドナー配列RNA、及びsgRNAに結合するVPR-インテグラーゼ-dCas9タンパク質は、ウイルス粒子にパッケージングされる。一実施形態では、ウイルス粒子は細胞培地から採取される。一実施形態では、VPRは、プロテアーゼ部位を介してウイルス粒子内の融合タンパク質から切断され、IN-dCas融合タンパク質をもたらす。一実施形態では、ウイルス粒子は標的細胞を形質導入し、ここで、sgRNAは細胞DNAの標的領域に結合し、これによりIN-dCas融合タンパク質を標的化し、インテグラーゼはドナー配列の細胞DNAへの組み込みを触媒する。
【0168】
一態様では、送達系は、(1)導入プラスミド、(2)パッケージングプラスミド、及び(3)エンベローププラスミドを含む。一実施形態では、パッケージングプラスミドは、gag-polポリタンパク質をコードする核酸配列を含む。一実施形態では、gag-polポリタンパク質は、触媒的に死んだインテグラーゼを含む。一実施形態では、gag-polポリタンパク質は、D116Nインテグラーゼ突然変異を含む。
【0169】
一実施形態では、導入プラスミドは、sgRNAをコードする核酸、ならびにインテグラーゼ及び編集タンパク質を含む融合タンパク質をコードする核酸配列を含む。一実施形態では、導入プラスミドは、5’ロングターミナルリピート(LTR)配列及び3’LTR配列を含む。一実施形態では、3’LTRは、自己不活型(SIN)LTRである。したがって、一実施形態では、5’LTRは、U3配列、R配列及びU5配列を含み、3’LTRは、R配列及びU5配列を含むが、U3配列を含まない。一実施形態では、5’LTR及び3’LTRは、融合タンパク質のインテグラーゼに特異的である。一実施形態では、融合タンパク質は、インテグラーゼ及びCasタンパク質を含む。一実施形態では、融合タンパク質は、インテグラーゼ及びdCasタンパク質を含む。一実施形態では、5’LTR及び3’LTRは、融合タンパク質をコードする配列及びsgRNAをコードする配列に隣接する。
【0170】
一実施形態では、エンベローププラスミドは、エンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベローププラスミドは、HIVエンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベローププラスミドは、水疱性口内炎ウイルスgタンパク質(VSV-g)エンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベロープタンパク質は、所望の細胞タイプに基づいて選択され得る。
【0171】
一実施形態では、パッケージングプラスミド、導入プラスミド及びエンベローププラスミドは、細胞に導入される。一実施形態では、細胞は、gag-polタンパク質をコードする核酸配列を転写及び翻訳して、gag-polポリタンパク質を産生する。一実施形態では、細胞は、エンベロープタンパク質をコードする核酸配列を転写及び翻訳して、エンベロープタンパク質を産生する。一実施形態では、細胞は、sgRNAをコードする核酸配列を転写する。一実施形態では、細胞は、融合タンパク質をコードする核酸配列を転写する。
【0172】
一実施形態では、gag-polタンパク質、エンベロープポリタンパク質、ドナー配列RNA、及びsgRNAに結合するVPR-インテグラーゼ-dCas9タンパク質は、ウイルス粒子にパッケージングされる。一実施形態では、ウイルス粒子は細胞培地から採取される。一実施形態では、ウイルス粒子は標的細胞を形質導入し、ここで、ウイルスは逆翻訳し、細胞は融合タンパク質及びsgRNAを発現する。一実施形態では、sgRNAは、融合タンパク質のCasタンパク質及び別のウイルスDNA転写物に結合し、ここで、インテグラーゼは自己組み込みを触媒する。一実施形態では、sgRNAは、融合タンパク質のCasタンパク質及び細胞DNAの標的領域に結合し、これにより標的遺伝子を破壊する。
【0173】
一態様では、送達系は、(1)導入プラスミド、(2)第1のパッケージングプラスミド、(3)第1のエンベローププラスミド、(4)第2のパッケージングプラスミド、(5)第2のエンベローププラスミド、及び(6)導入プラスミドを含む。一実施形態では、第1のパッケージングプラスミドは、gag-polポリタンパク質をコードする核酸配列を含む。一実施形態では、第2のパッケージングプラスミドは、gag-polポリタンパク質をコードする核酸配列を含む。一実施形態では、gag-polポリタンパク質は、触媒的に死んだインテグラーゼを含む。一実施形態では、gag-polポリタンパク質は、D116NまたはD64Vインテグラーゼ突然変異を含む。
【0174】
一実施形態では、第1のエンベローププラスミドは、エンベロープタンパク質をコードする核酸配列を含む。一実施形態では、第2のエンベローププラスミドは、エンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベローププラスミドは、HIVエンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベローププラスミドは、水疱性口内炎ウイルスgタンパク質(VSV-g)エンベロープタンパク質をコードする核酸配列を含む。一実施形態では、エンベロープタンパク質は、所望の細胞タイプに基づいて選択され得る。
【0175】
一実施形態では、導入プラスミドは、sgRNAをコードする核酸、ならびにインテグラーゼ及び編集タンパク質を含む融合タンパク質をコードする核酸配列を含む。一実施形態では、融合タンパク質は、インテグラーゼ及びCasタンパク質を含む。一実施形態では、融合タンパク質は、インテグラーゼ及びdCasタンパク質を含む。一実施形態では、融合タンパク質のインテグラーゼは、第1及び第2のパッケージングプラスミドのgag-polポリタンパク質と比較して、異なる種のレンチウイルスに由来する。例えば、一実施形態では、導入プラスミドは、FIVインテグラーゼ及びCasを含む融合タンパク質をコードする核酸を含み、第1及び第2のパッケージングプラスミドは、HIV gag-polポリタンパク質をコードする核酸配列を含む。一実施形態では、異なるレンチウイルス種の使用は、自己組み込みを防止する。
【0176】
一実施形態では、導入プラスミドは、5’ロングターミナルリピート(LTR)配列及び3’LTR配列を含む。一実施形態では、3’LTRは、自己不活型(SIN)LTRである。したがって、一実施形態では、5’LTRは、U3配列、R配列及びU5配列を含み、3’LTRは、R配列及びU5配列を含むが、U3配列を含まない。一実施形態では、5’LTR及び3’LTRは、gag-polポリタンパク質のインテグラーゼに特異的である。一実施形態では、5’LTR及び3’LTRは、融合タンパク質をコードする配列及びsgRNAをコードする配列に隣接する。
【0177】
一実施形態では、導入プラスミドは、ドナー配列を含む。ドナー配列は、ゲノムに送達される任意の核酸配列であり得る。一実施形態では、導入プラスミドは、5’ロングターミナルリピート(LTR)配列及び3’LTR配列を含む。一実施形態では、3’LTRは、自己不活型(SIN)LTRである。したがって、一実施形態では、5’LTRは、U3配列、R配列及びU5配列を含み、3’LTRは、R配列及びU5配列を含むが、U3配列を含まない。一実施形態では、5’LTR及び3’LTRは、Inscrtipter導入プラスミド中のインテグラーゼに特異的である。
【0178】
一実施形態では、第1のパッケージングプラスミド、導入プラスミド及び第1のエンベローププラスミドは、細胞に導入される。一実施形態では、細胞は、gag-polタンパク質をコードする核酸配列を転写及び翻訳して、gag-polポリタンパク質を産生する。一実施形態では、細胞は、エンベロープタンパク質をコードする核酸配列を転写及び翻訳して、エンベロープタンパク質を産生する。一実施形態では、細胞は、sgRNAをコードする核酸配列を転写する。一実施形態では、細胞は、融合タンパク質をコードする核酸配列を転写する。一実施形態では、gag-polタンパク質、エンベロープポリタンパク質、gRNA及び融合タンパク質RNAは、第1のウイルス粒子にパッケージングされる。一実施形態では、第1のウイルス粒子は細胞培地から採取される。
【0179】
一実施形態では、第2のパッケージングプラスミド、導入プラスミド及び第2のエンベローププラスミドは、細胞に導入される。一実施形態では、細胞は、gag-polポリタンパク質をコードする核酸配列を転写及び翻訳して、gag-polポリタンパク質を産生する。一実施形態では、細胞は、エンベロープタンパク質をコードする核酸配列を転写及び翻訳して、エンベロープタンパク質を産生する。一実施形態では、細胞は、ドナー配列を転写して、ドナー配列RNA分子をもたらす。一実施形態では、gag-polポリタンパク質、エンベロープポリタンパク質及びドナー配列RNAは、第2のウイルス粒子にパッケージングされる。一実施形態では、第2のウイルス粒子は細胞培地から採取される。
【0180】
一実施形態では、第1のパッケージングプラスミド、導入プラスミド、第1のエンベローププラスミド、第2のパッケージングプラスミド、導入プラスミド及び第2のエンベローププラスミドは、同じ細胞に導入される。一実施形態では、第1のパッケージングプラスミド、導入プラスミド、第1のエンベローププラスミドは、第2のパッケージングプラスミド、導入プラスミド及び第2のエンベローププラスミドと異なる細胞に導入される。
【0181】
一実施形態では、第1のウイルス粒子及び第2のウイルス粒子は、標的細胞を形質導入する。一実施形態では、ウイルスは逆翻訳し、細胞は融合タンパク質及びsgRNAを発現し、ここで、sgRNAは、融合タンパク質のdCasに結合する。一実施形態では、ウイルスは、ドナー配列RNAを、融合タンパク質のインテグラーゼに結合するドナーDNA配列に逆翻訳する。一実施形態では、sgRNAは細胞DNAの標的領域に結合し、これによりIN-dCas融合タンパク質を標的化し、インテグラーゼはドナーDNA配列の細胞DNAへの組み込みを触媒する。
【0182】
さらに、哺乳動物細胞への遺伝子導入のための、さらなるウイルスベースの系が数多く開発されている。例えば、レトロウイルスは、遺伝子送達系に好都合なプラットフォームを提供する。選択した遺伝子を、当該技術分野で公知の技術を使用して、ベクターに挿入し、レトロウイルス粒子にパッケージングすることができる。次に、組換えウイルスを単離して、in vivoまたはex vivoでのいずれかで対象の細胞に送達することができる。多数のレトロウイルス系が当該技術分野で公知である。いくつかの実施形態では、アデノウイルスベクターを使用する。多数のアデノウイルスベクターが当該技術分野で公知である。いくつかの実施形態では、レンチウイルスベクターを使用する。
【0183】
例えば、レンチウイルスなどのレトロウイルス由来のベクターは、導入遺伝子の長期間の安定した組み込み及び娘細胞中のその増殖を可能とすることから、長期間の遺伝子導入を実現するのに適したツールである。レンチウイルスベクターは、肝細胞などの非増殖細胞を形質導入することができるという点で、マウス白血病ウイルスなどのオンコレトロウイルス由来のベクターと比べてさらなる利点を有する。これらはまた、免疫原性が低いというさらなる利点を有する。
【0184】
一実施形態では、組成物は、アデノ随伴ウイルス(AAV)に由来するベクターを含む。「AAVベクター」という用語は、AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-7、AAV-8及びAAV-9を含むがこれらに限定されない、アデノ随伴ウイルス血清型に由来するベクターを意味する。AAVベクターは、様々な障害の治療のための強力な遺伝子送達ツールとなっている。AAVベクターは、病原性の欠如、最小限の免疫原性、及び安定かつ効率的な方法で有糸分裂後細胞を形質導入する能力を含む、遺伝子治療に最適なベクターとなるいくつかの特徴を有する。AAVベクター内に含まれる特定の遺伝子の発現は、AAV血清型、プロモーター及び送達方法の適切な組み合わせを選択することにより、1つ以上のタイプの細胞を特異的に標的とすることができる。
【0185】
AAVベクターは、AAV野生型遺伝子のうちの1つ以上、好ましくはrep及び/またはcap遺伝子の全体または一部の欠失を有し得るが、機能的な隣接ITR配列を保持し得る。高い相同性にもかかわらず、異なる血清型は異なる組織に対する指向性を有する。AAV1の受容体は明らかではないが、AAV1はAAV2よりも効率的に骨格筋及び平滑筋を形質導入することが知られている。ほとんどの研究が、AAV2 ITRに隣接したベクターDNAが別の血清型のカプシドにパッケージングされる偽型ベクターを用いて行われたため、生物学的相違がゲノムよりもカプシドに関連することは明らかである。最近のエビデンスは、AAV1カプシドにパッケージングされたDNA発現カセットが、心筋細胞の形質導入において、AAV2カプシドにパッケージングされたものよりも少なくとも1log10効率的であることを示している。一実施形態では、ウイルス送達系は、アデノ随伴ウイルス送達系である。アデノ随伴ウイルスは、血清型1(AAV1)、血清型2(AAV2)、血清型3(AAV3)、血清型4(AAV4)、血清型5(AAV5)、血清型6(AAV6)、血清型7(AAV7)、血清型8(AAV8)、または血清型9(AAV9)のものであり得る。
【0186】
ベクターへのアセンブルに望ましいAAV断片としては、vp1、vp2、vp3及び超可変領域を含むcapタンパク質、rep78、rep68、rep52、及びrep40を含むrepタンパク質、ならびにこれらのタンパク質をコードする配列が挙げられる。これらの断片は、様々なベクター系及び宿主細胞で容易に利用することができる。このような断片を、単独で、他のAAV血清型配列もしくは断片と組み合わせて、または他のAAVもしくは非AAVウイルス配列由来のエレメントと組み合わせて使用することができる。本明細書で使用される場合、人工AAV血清型は、限定されないが、天然に存在しないカプシドタンパク質を有するAAVを含む。そのような人工カプシドは、選択したAAV配列(例えば、vp1カプシドタンパク質の断片)を、選択した異なるAAV血清型、同じAAV血清型の非隣接部分、非AAVウイルス源、または非ウイルス源から得ることができる異種配列と組み合わせて使用して、任意の適切な技術により作製することができる。人工AAV血清型は、限定されないが、キメラAAVカプシド、組換えAAVカプシド、または「ヒト化」AAVカプシドであり得る。したがって、1つ以上のタンパク質の発現に適した例示的なAAV、または人工AAVには、とりわけ、AAV2/8(米国特許第7,282,199号を参照されたい)、AAV2/5(National Institutes of Healthから入手可能)、AAV2/9(国際特許公開第WO2005/033321号)、AAV2/6(米国特許第6,156,303号)、及びAAVrh8(国際特許公開第WO2003/042397号)が含まれる。
【0187】
特定の実施形態では、ベクターはまた、プラスミドベクターでトランスフェクトされた細胞、または本発明によって産生されたウイルスに感染した細胞における導入遺伝子の転写、翻訳及び/または発現を可能にする形で導入遺伝子に作動可能に連結された従来の調節エレメントを含む。本明細書で使用される場合、「作動可能に連結された」配列は、目的遺伝子と隣接する発現制御配列と、目的遺伝子を制御するためにトランスでまたは一定の距離で作用する発現制御配列の両方を含む。発現制御配列には、適切な転写開始配列、転写終結配列、転写プロモーター配列、及び転写エンハンサー配列;スプライシングシグナル及びポリアデニル化(polyA)シグナルなどの効率的なRNAプロセシングシグナル;細胞質mRNAを安定化させる配列;翻訳効率を向上させる配列(すなわち、Kozakコンセンサス配列);タンパク質安定性を向上させる配列;ならびに必要に応じて、コードされた産物の分泌を向上させる配列が含まれる。天然プロモーター、構成的プロモーター、誘導性プロモーター、及び/または組織特異的プロモーターを含む、多数の発現制御配列が当該技術分野で公知であり、利用可能である。
【0188】
さらなるプロモーターエレメント、例えばエンハンサーは転写開始の頻度を調節する。通常、これらは開始部位の30~110bp上流の領域に位置するが、近年、いくつかのプロモーターは開始部位の下流にも機能的エレメントを含むことが示されている。プロモーターエレメント間の間隔は柔軟であることが多く、そのためエレメントが互いに対して反転または移動する際にプロモーター機能が維持される。チミジンキナーゼ(tk)プロモーターでは、プロモーターエレメント間の間隔は、50bpの間隔まで長くすることができ、それ以降は活性が低下し始める。プロモーターによっては、転写を活性化するために、個々のエレメントを協働的に機能させることも、または独立して機能させることもできると思われる。
【0189】
適切なプロモーターの一例は、前初期サイトメガロウイルス(CMV)プロモーター配列である。このプロモーター配列は、それに作動可能に連結された任意のポリヌクレオチド配列の高レベルの発現を駆動することができる強力な構成的プロモーター配列である。適切なプロモーターの別の例は、伸長成長因子-1α(EF-1α)である。しかしながら、他の構成的プロモーター配列も使用することができ、これらとしては、限定されないが、サルウイルス40(SV40)初期プロモーター、マウス乳癌ウイルス(MMTV)、ヒト免疫不全ウイルス(HIV)ロングターミナルリピート(LTR)プロモーター、MoMuLVプロモーター、トリ白血病ウイルスプロモーター、エプスタイン・バールウイルス前初期プロモーター、ラウス肉腫ウイルスプロモーター、ならびに、限定されないが、アクチンプロモーター、ミオシンプロモーター、ヘモグロビンプロモーター、及びクレアチンキナーゼプロモーターなどのヒト遺伝子プロモーターが挙げられる。さらに、本発明は、構成的プロモーターの使用に限定されるべきではない。誘導性プロモーターもまた、本発明の一部として企図される。誘導性プロモーターの使用により、それが作動可能に連結されているポリヌクレオチド配列の発現を、そのような発現が望ましい場合はオンにし、または発現が望ましくない場合はその発現をオフにすることが可能な分子スイッチが得られる。誘導性プロモーターの例としては、メタロチオニンプロモーター、グルココルチコイドプロモーター、プロゲステロンプロモーター、及びテトラサイクリンプロモーターが挙げられるが、これらに限定されない。
【0190】
ベクター上に見られるエンハンサー配列もまた、その中に含まれる遺伝子の発現を調節する。通常、エンハンサーはタンパク質因子と結合して遺伝子の転写を増強させる。エンハンサーは、それが調節する遺伝子の上流または下流に位置し得る。エンハンサーはまた、特定の細胞タイプまたは組織タイプにおける転写を増強するために組織特異的であり得る。一実施形態では、本発明のベクターは、ベクター内に存在する遺伝子の転写を高めるための1つ以上のエンハンサーを含む。
【0191】
本発明の融合タンパク質の発現を評価するために、細胞に導入される発現ベクターはまた、ウイルスベクターを介してトランスフェクトまたは感染させようとする細胞集団からの発現細胞の同定及び選択を容易にする、選択マーカー遺伝子もしくはレポーター遺伝子のいずれかまたは両方を含み得る。他の態様では、選択マーカーを個々のDNA片上に保有させ、コトランスフェクション手順に使用することができる。選択マーカーとレポーター遺伝子はいずれも、宿主細胞での発現を可能とする適切な調節配列と隣接させることができる。有用な選択マーカーとしては、例えば、neoなどの抗生物質耐性遺伝子が挙げられる。
【0192】
レポーター遺伝子は、潜在的なトランスフェクト細胞を同定するため、及び調節配列の機能性を評価するために使用される。一般に、レポーター遺伝子は、レシピエント生物もしくは組織に存在しないか、またはそれらによって発現されない遺伝子であり、かついくつかの容易に検出可能な特性、例えば酵素活性によってその発現が明らかとなるポリペプチドをコードする遺伝子である。レポーター遺伝子の発現は、DNAがレシピエント細胞に導入された後の適切な時点でアッセイされる。適切なレポーター遺伝子には、ルシフェラーゼ、ベータ-ガラクトシダーゼ、クロラムフェニコールアセチルトランスフェラーゼ、分泌アルカリホスファターゼをコードする遺伝子、または緑色蛍光タンパク質遺伝子が含まれ得る(例えば、Ui-Tei et al.,2000 FEBS Letters 479:79-82)。適切な発現系は周知であり、公知の技術を用いて調製するか、または商業的に入手することができる。一般に、最小の5’隣接領域がレポーター遺伝子の最も高い発現レベルを示す構築物は、プロモーターとして同定される。そのようなプロモーター領域をレポーター遺伝子に連結させて、プロモーター駆動型転写を調節する能力について薬剤を評価するのに使用することができる。
【0193】
遺伝子を細胞に導入し発現させる方法は、当該技術分野で公知である。発現ベクターに関連して、ベクターを、当該技術分野の任意の方法によって、宿主細胞、例えば、哺乳動物細胞、細菌細胞、酵母細胞、または昆虫細胞に容易に導入することができる。例えば、発現ベクターを、物理的、化学的、または生物学的手段により宿主細胞に導入することができる。
【0194】
ポリヌクレオチドを宿主細胞に導入するための物理的方法としては、リン酸カルシウム沈殿、リポフェクション、微粒子銃、マイクロインジェクション、エレクトロポレーションなどが挙げられる。ベクター及び/または外来核酸を含む細胞の産生方法は、当該技術分野において周知である。例えば、Sambrook et al.(2012,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory,New Yorkを参照されたい)。ポリヌクレオチドを宿主細胞に導入するための例示的な方法は、リン酸カルシウムトランスフェクションである。
【0195】
目的のポリヌクレオチドを宿主細胞に導入するための生物学的方法には、DNA及びRNAベクターの使用が含まれる。ウイルスベクター、特にレトロウイルスベクターは、哺乳動物、例えばヒト細胞への遺伝子挿入に最も広く使用される方法となっている。他のウイルスベクターは、レンチウイルス、ポックスウイルス、単純ヘルペスウイルスI型、アデノウイルス及びアデノ随伴ウイルスなどに由来し得る。例えば、米国特許第5,350,674号及び同第5,585,362号を参照されたい。
【0196】
ポリヌクレオチドを宿主細胞に導入するための化学的手段としては、巨大分子複合体、ナノカプセル、ミクロスフェア、ビーズ、ならびに水中油型エマルション、ミセル、混合ミセル及びリポソームを含む脂質ベース系などのコロイド分散系が挙げられる。in vitro及びin vivoでの送達ビヒクルとして使用するための例示的なコロイド系は、リポソーム(例えば、人工膜小胞)である。
【0197】
非ウイルス送達系を利用する場合、例示的な送達ビヒクルはリポソームである。核酸の宿主細胞への導入(in vitro、ex vivoまたはin vivo)に脂質製剤の使用が企図される。別の態様では、核酸は脂質と会合され得る。脂質と会合される核酸は、リポソームの水性内部にカプセル化され得るか、リポソームの脂質二重層内に散在され得るか、リポソームとオリゴヌクレオチドの両方に会合した連結分子を介してリポソームに結合され得るか、リポソーム中に封入され得るか、リポソームと複合体を形成され得るか、脂質を含有する溶液中に分散され得るか、脂質と混合され得るか、脂質と組み合わされ得るか、脂質中に懸濁液として含有され得るか、ミセルに含有され得るかもしくはそれと複合体を形成され得るか、または他の方法で脂質と会合され得る。脂質、脂質/DNA、または脂質/発現ベクター会合組成物は、溶液中で何らかの特定の構造に限定されない。例えば、それらは、二重層構造で、ミセルとして、または「崩壊した」構造で存在し得る。それらはまた、単に溶液中に散在していてもよく、あるいは、サイズまたは形状が均一ではない凝集体を形成してもよい。脂質は、天然に存在する脂質または合成の脂質であり得る脂肪物質である。例えば、脂質には、細胞質に天然に存在する脂肪滴、ならびに脂肪酸、アルコール、アミン、アミノアルコール及びアルデヒドなどの長鎖脂肪族炭化水素ならびにそれらの誘導体を含む化合物のクラスが含まれる。
【0198】
使用に適した脂質は、商業的供給源から入手することができる。例えば、ジミリスチルホスファチジルコリン(「DMPC」)は、Sigma,St.Louis,MOから入手することができ、リン酸ジセチル(「DCP」)は、K & K Laboratories(Plainview,NY)から入手することができ、コレステロール(「Choi」)は、Calbiochem-Behringから入手することができ、ジミリスチルホスファチジルグリセロール(「DMPG」)及び他の脂質は、Avanti Polar Lipids,Inc.(Birmingham,AL)から入手することができる。クロロホルムまたはクロロホルム/メタノール中の脂質原液は、約-20℃で保存することができる。クロロホルムはメタノールよりも容易に蒸発するため、単独の溶媒として使用される。「リポソーム」は、封入脂質二重層または凝集体の生成によって形成される様々な単層及び多層脂質ビヒクルを包含する一般的用語である。リポソームは、リン脂質二重層膜及び内部水性媒体を有する小胞構造を有することを特徴とし得る。多層リポソームは、水性媒体によって分離された複数の脂質層を有する。これらは、リン脂質を過剰の水溶液中で懸濁させた場合に自発的に形成される。脂質成分は、閉鎖構造の形成前に自己再構成を起こし、脂質二重層間に水及び溶解された溶質を取り込む(Ghosh et al.,1991 Glycobiology 5:505-10)。しかしながら、溶液中で通常の小胞構造とは異なる構造を有する組成物も包含される。例えば、脂質は、ミセル構造をとることも、または単に脂質分子の不均一な凝集体として存在することもできる。また、リポフェクタミン-核酸複合体も企図される。
【0199】
外来核酸の宿主細胞への導入に使用する方法を問わず、宿主細胞中の組換えDNA配列の存在を確認するために、様々なアッセイを実施することができる。そのようなアッセイとしては、例えば、サザンブロッティング及びノーザンブロッティング、RT-PCR、ならびにPCRなどの当業者に周知の「分子生物学的」アッセイ;例えば、免疫学的手段(ELISA及びウエスタンブロット)によって、または本発明の範囲内にある薬剤を同定するための本明細書に記載されるアッセイによって、特定のペプチドの存在または不在を検出するなどの「生化学的」アッセイが挙げられる。
【0200】
系
一態様では、本発明は、核酸分子、ゲノムまたは遺伝子などの遺伝物質を編集するための系を提供する。一実施形態では、この系は、融合タンパク質をコードする核酸配列であって、この融合タンパク質がレトロウイルスインテグラーゼ(IN)またはその断片、CRISPR関連(Cas)タンパク質及び核局在化シグナル(NLS)を含む核酸配列;CRISPR-Cas系ガイドRNAをコードする核酸配列;ならびにドナー鋳型核酸をコードする核酸配列であって、このドナー鋳型核酸がU3配列、U5配列及びドナー鋳型配列を含む核酸配列を、1つ以上のベクターに含む。一実施形態では、CRISPR-Cas系ガイドRNAは、遺伝子の標的DNA配列に実質的にハイブリダイズする。
【0201】
一実施形態では、この系は、融合タンパク質をコードする核酸配列であって、この融合タンパク質がレトロウイルスインテグラーゼ(IN)またはその断片、CRISPR関連(Cas)タンパク質及び核局在化シグナル(NLS)を含む核酸配列;第1のCRISPR-Cas系ガイドRNAをコードする核酸配列;第2のCRISPR-Cas系ガイドRNAをコードする核酸配列;ならびにドナー鋳型核酸をコードする核酸配列であって、このドナー鋳型核酸がU3配列、U5配列及びドナー鋳型配列を含む核酸配列を、1つ以上のベクターに含む。一実施形態では、第1のCRISPR-Cas系ガイドRNAは第1のDNA配列に実質的にハイブリダイズし、第2のCRISPR-Cas系ガイドRNAは第2のDNA配列に実質的にハイブリダイズする。一実施形態では、第1のDNA配列及び第2のDNA配列は、標的挿入領域に隣接する。一実施形態では、この系は、ドナー鋳型核酸の標的挿入領域への挿入を触媒する。
【0202】
一実施形態では、この系は、第1の融合タンパク質をコードする核酸配列であって、第1の融合タンパク質がレトロウイルスインテグラーゼ(IN)またはその断片、CRISPR関連(Cas)タンパク質及び核局在化シグナル(NLS)を含む核酸配列;第1のCRISPR-Cas系ガイドRNAをコードする核酸配列;第2の融合タンパク質をコードする核酸配列であって、第2の融合タンパク質が、レトロウイルスインテグラーゼ(IN)またはその断片、CRISPR関連(Cas)タンパク質及び核局在化シグナル(NLS)を含む核酸配列;第1のCRISPR-Cas系ガイドRNAをコードする核酸配列;第2のCRISPR-Cas系ガイドRNAをコードする核酸配列;ならびにドナー鋳型核酸をコードする核酸配列であって、このドナー鋳型核酸がU3配列、U5配列及びドナー鋳型配列を含む核酸配列を、1つ以上のベクターに含む。
【0203】
一実施形態では、第1の融合タンパク質及び第2の融合タンパク質は、同じであるか、または異なっている。例えば、一実施形態では、第1の融合タンパク質は、HIV INまたはその断片、dCas9タンパク質及びNLSを含み、第2の融合タンパク質は、BIV INまたはその断片、Cpf1 Casタンパク質及びNLSを含む。
【0204】
一実施形態では、U3は、第1の融合タンパク質のレトロウイルスINに特異的であり、U5は、第2の融合タンパク質のレトロウイルスINに特異的である。例えば、一実施形態では、第1の融合タンパク質は、HIV INまたはその断片、dCas9タンパク質及びNLSを含み、第2の融合タンパク質は、BIV INまたはその断片、Cpf1 Casタンパク質及びNLSを含み、U3配列はHIV INに特異的であり、U5配列はBIV INに特異的である。
【0205】
一実施形態では、第1のCRISPR-Cas系ガイドRNAは第1のDNA配列に実質的にハイブリダイズし、第2のCRISPR-Cas系ガイドRNAは第2のDNA配列に実質的にハイブリダイズする。一実施形態では、第1のDNA配列及び第2のDNA配列は、標的挿入領域に隣接する。一実施形態では、この系は、ドナー鋳型核酸の標的挿入領域への挿入を触媒する。
【0206】
一実施形態では、この系は、融合タンパク質をコードする核酸配列であって、この融合タンパク質が、レトロウイルスインテグラーゼ(IN)またはその断片、CRISPR関連(Cas)タンパク質及び核局在化シグナル(NLS)を含む核酸配列;CRISPR-Cas系ガイドRNA;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を含む。
【0207】
一実施形態では、融合タンパク質をコードする核酸配列、CRISPR-Cas系ガイドRNAをコードする核酸配列、及びドナー鋳型核酸をコードする核酸配列は、同じかまたは異なるベクター上に存在する。
【0208】
一実施形態では、融合タンパク質をコードする核酸配列は、配列番号57~98のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む融合タンパク質をコードする。一実施形態では、融合タンパク質をコードする核酸配列は、配列番号57~98のうちの1つの配列を含む融合タンパク質をコードする。
【0209】
一実施形態では、融合タンパク質をコードする核酸配列は、配列番号155~196のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である核酸配列を含む。一実施形態では、融合タンパク質をコードする核酸配列は、配列番号155~196のうちの1つの核酸配列を含む。
【0210】
一実施形態では、U3配列及びU5配列は、レトロウイルスINに特異的である。例えば、一実施形態では、レトロウイルスINはHIV INであり、U3配列は、配列番号197と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号198と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
【0211】
一実施形態では、レトロウイルスINはRSV INであり、U3配列は、配列番号199と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号200と95%同一である配列を含む。
【0212】
一実施形態では、レトロウイルスINはHFV INであり、U3配列は、配列番号201と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号202と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
【0213】
一実施形態では、レトロウイルスINはEIAV INであり、U3配列は、配列番号203と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号204と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
【0214】
一実施形態では、レトロウイルスINはMoLV INであり、U3配列は、配列番号205と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号206と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
【0215】
一実施形態では、レトロウイルスINはMMTV INであり、U3配列は、配列番号207と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号208と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
【0216】
一実施形態では、レトロウイルスINはWDSV INであり、U3配列は、配列番号209と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号210と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
【0217】
一実施形態では、レトロウイルスINはBLV INであり、U3配列は、配列番号211と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号212と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
【0218】
一実施形態では、レトロウイルスINはSIV INであり、U3配列は、配列番号213と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号214と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
【0219】
一実施形態では、レトロウイルスINはFIV INであり、U3配列は、配列番号215と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号216と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
【0220】
一実施形態では、レトロウイルスINはBIV INであり、U3配列は、配列番号217と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号218と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
【0221】
一実施形態では、INはTy1であり、U3配列は、配列番号219と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号220と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
【0222】
一実施形態では、INはInsF INであり、U3配列はIS3 IRL配列であり、U5配列はIS3 IRR配列である。一実施形態では、INはInsF INであり、U3配列は、配列番号221と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含み、U5配列は、配列番号222と少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。
【0223】
系及びベクターは、原核細胞または真核細胞中のCRISPR転写物(例えば、核酸転写物、タンパク質または酵素)の発現のために設計することができる。例えば、CRISPR転写物を、Escherichia coliなどの細菌細胞、昆虫細胞(バキュロウイルス発現ベクターを使用)、酵母細胞、または哺乳動物細胞内で発現させることができる。適切な宿主細胞は、Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)にさらに論じられている。あるいは、組換え発現ベクター系を、in vitroで、例えばT7プロモーター調節配列及びT7ポリメラーゼを使用して転写及び翻訳することができる。
【0224】
ベクターを原核生物に導入し、原核生物中で増殖させることができる。いくつかの実施形態では、原核生物を、真核細胞に導入されるベクターのコピーを増幅するために使用するか、または真核細胞に導入されるベクターの産生における中間ベクターとして使用する(例えば、ウイルスベクターパッケージング系の一部としてのプラスミドを増幅する)。いくつかの実施形態では、宿主細胞または宿主生物に送達するための1つ以上のタンパク質の供給源を提供するように、原核生物を使用してベクターのコピーを増幅し、1つ以上の核酸を発現させる。原核生物中のタンパク質の発現は、ほとんどの場合、Escherichia coli内で、融合タンパク質または非融合タンパク質のいずれかの発現を指示する構成的プロモーターまたは誘導性プロモーターを含むベクターを用いて行われる。融合ベクターは、そこにコードされているタンパク質に、例えば、組換えタンパク質のアミノ末端に、いくつかのアミノ酸を付加する。そのような融合ベクターは、1つ以上の目的、例えば、(i)組換えタンパク質の発現を増加させるため、(ii)組換えタンパク質の溶解性を増加させるため、及び(iii)アフィニティー精製においてリガンドとして作用することにより組換えタンパク質の精製を補助するために役立ち得る。多くの場合、融合発現ベクターでは、融合タンパク質の精製後に組換えタンパク質を融合部分から分離することができるように、融合部分と組換えタンパク質との接合部にタンパク質分解切断部位が導入される。そのような酵素、及びそれらの同族認識配列には、第Xa因子、トロンビン、及びエンテロキナーゼが含まれる。融合発現ベクターの例としては、グルタチオンS-トランスフェラーゼ(GST)、マルトースE結合タンパク質、またはプロテインAを標的組換えタンパク質にそれぞれ融合する、pGEX(Pharmacia Biotech Inc;Smith and Johnson,1988.Gene 67:31-40)、pMAL(New England Biolabs,Beverly,Mass.)及びpRIT5(Pharmacia,Piscataway,N.J.)が挙げられる。
【0225】
適切な誘導性非融合E.coli発現ベクターの例としては、pTrc(Amrann et al.,(1988)Gene 69:301-315)及びpET 11d(Studier et al.,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)60-89)が挙げられる。
【0226】
いくつかの実施形態では、ベクターは、酵母発現ベクターである。酵母Saccharomyces cerivisaeにおける発現用のベクターの例としては、pYepSec1(Baldari,et al.,1987.EMBO J.6:229-234)、pMFa(Kuijan and Herskowitz,1982.Cell 30:933-943)、pJRY88(Schultz et al.,1987.Gene 54:113-123)、pYES2(Invitrogen Corporation,San Diego,Calif.)及びpicZ(InVitrogen Corp,San Diego,Calif.)が挙げられる。
【0227】
いくつかの実施形態では、ベクターは、バキュロウイルス発現ベクターを使用して、昆虫細胞におけるタンパク質発現を駆動する。培養昆虫細胞(例えば、SF9細胞)におけるタンパク質の発現に利用可能なバキュロウイルスベクターとしては、pAcシリーズ(Smith,et al.,1983.Mol.Cell.Biol.3:2156-2165)及びpVLシリーズ(Lucklow and Summers,1989.Virology 170:31-39)が挙げられる。
【0228】
いくつかの実施形態では、ベクターは、哺乳動物発現ベクターを使用して、哺乳動物細胞における1つ以上の配列の発現を駆動することができる。哺乳動物の発現ベクターの例としては、pCDM8(Seed,1987.Nature 329:840)及びpMT2PC(Kaufman,et al.,1987.EMBO J.6:187-195)が挙げられる。哺乳動物細胞中で使用される場合、発現ベクターの制御機能は、通常、1つ以上の調節エレメントによってもたらされる。例えば、一般的に使用されるプロモーターは、ポリオーマ、アデノウイルス2、サイトメガロウイルス、サルウイルス40、及び本明細書に開示され、当該技術分野で公知の他のものに由来する。原核細胞及び真核細胞の両方に適した他の発現系については、例えば、Sambrook,et al.,MOLECULAR CLONING:A LABORATORY MANUAL.2nd ed.,Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1989のChapter16及び17を参照されたい。
【0229】
いくつかの実施形態では、組換え哺乳動物発現ベクターは、特定の細胞タイプにおいて優先的に核酸の発現を誘導することができる(例えば、組織特異的調節エレメントを使用して核酸を発現させる)。組織特異的な調節エレメントは、当該技術分野において公知である。適切な組織特異的プロモーターの非限定的な例としては、アルブミンプロモーター(肝臓特異的、Pinkert,et al.,1987.Genes Dev.1:268-277)、リンパ球特異的プロモーター(Calame and Eaton,1988.Adv.Immunol.43:235-275)、特にT細胞受容体のプロモーター(Winoto and Baltimore,1989.EMBO J.8:729-733)及び免疫グロブリンのプロモーター(Baneiji,et al.,1983.Cell 33:729-740、Queen and Baltimore,1983.Cell 33:741-748)、ニューロン特異的プロモーター(例えば、ニューロフィラメントプロモーター、Byrne and Ruddle,1989.Proc.Natl.Acad.Sci.USA 86:5473-5477)、膵臓特異的プロモーター(Edlund,et al.,1985.Science 230:912-916)、ならびに乳腺特異的プロモーター(例えば、乳清プロモーター、米国特許第4,873,316号及び欧州出願公開第264,166号)が挙げられる。発生的に調節されたプロモーター、例えば、ネズミhoxプロモーター(Kessel and Gruss,1990.Science 249:374-379)及びα-フェトプロテインプロモーター(Campes and Tilghman,1989.Genes Dev.3:537-546)も含まれる。
【0230】
いくつかの実施形態では、調節エレメントは、CRISPR系の1つ以上のエレメントの発現を駆動するように、CRISPR系の1つ以上のエレメントに作動可能に連結されている。一般に、SPIDR(スペーサー散在型ダイレクトリピート(SPacer Interspersed Direct Repeat))としても知られるCRISPR(クラスター化され規則的に間隔が空いた短い回文構造の繰り返し)は、特定の細菌種に対して通常特異的であるDNA遺伝子座のファミリーを構成する。CRISPR遺伝子座は、E.coli中で認識された異なるクラスの散在する短い配列リピート(SSR)(Ishino et al.,J.Bacteriol.,169:5429-5433[1987]、及びNakata et al.,J.Bacteriol.,171:3553-3556[1989])ならびに関連する遺伝子を含む。同様の散在するSSRが、Haloferax mediterranei、Streptococcus pyogenes、Anabaena及びMycobacterium tuberculosisで同定されている(Groenen et al.,Mol.Microbiol.,10:1057-1065[1993]、Hoe et al.,Emerg.Infect.Dis.,5:254-263[1999]、Masepohl et al.,Biochim.Biophys.Acta 1307:26-30[1996]、及びMojica et al.,Mol.Microbiol.,17:85-93[1995]を参照されたい)。CRISPR遺伝子座は通常、リピートの構造によって他のSSRとは異なり、短く規則的に間隔が空いたリピート(short regularly spaced repeat)(SRSR)と称される(Janssen et al.,OMICS J.Integ. Biol.,6:23-33[2002]、及びMojica et al.,Mol.Microbiol.,36:244-246[2000])。一般に、リピートは、実質的に一定の長さであるユニークな介在配列によって規則的に間隔が空いた、クラスターで存在する短いエレメントである(Mojica et al.,[2000],上掲)。リピート配列は株間で高度に保存されているが、散在するリピートの数とスペーサー領域の配列は通常、株ごとに異なる(van Embden et al.,J.Bacteriol.,182:2393-2401[2000])。CRISPR遺伝子座は、40種を超える原核生物で同定されており(例えば、Jansen et al.,Mol.Microbiol.,43:1565-1575[2002]、及びMojica et al.,[2005]を参照されたい)、それらとしては、例えば、Aeropyrum、Pyrobaculum、Sulfolobus、Archaeoglobus、Halocarcula、Methanobacteriumn、Methanococcus、Methanosarcina、Methanopyrus、Pyrococcus、Picrophilus、Thernioplasnia、Corynebacterium、Mycobacterium、Streptomyces、Aquifrx、Porphvromonas、Chlorobium、Thermus、Bacillus、Listeria、Staphylococcus、Clostridium、Thermoanaerobacter、Mycoplasma、Fusobacterium、Azarcus、Chromobacterium、Neisseria、Nitrosomonas、Desulfovibrio、Geobacter、Myrococcus、Campylobacter、Wolinella、Acinetobacter、Erwinia、Escherichia、Legionella、Methylococcus、Pasteurella、Photobacterium、Salmonella、Xanthomonas、Yersinia、Treponema、及びThermotogaが挙げられるが、これらに限定されない。
【0231】
本明細書で使用される場合、「標的配列」は、ガイドRNAが相補性を有するように設計された配列を指し、標的配列とガイド配列との間のハイブリダイゼーションは、CRISPR複合体の形成を促進する。ハイブリダイゼーションを引き起こし、CRISPR複合体の形成を促進するのに十分な相補性があれば、必ずしも完全な相補性は必要ない。標的配列は、DNAまたはRNAポリヌクレオチドなどの任意のポリヌクレオチドを含み得る。いくつかの実施形態では、標的配列は、細胞の核または細胞質に位置する。いくつかの実施形態では、標的配列は、真核細胞の細胞小器官、例えば、ミトコンドリアまたは葉緑体内に存在し得る。標的配列を含む標的遺伝子座への組換えに使用することができる配列または鋳型は、「編集鋳型」または「編集ポリヌクレオチド」または「編集配列」と称される。本発明の態様では、外来鋳型ポリヌクレオチドは、編集鋳型と称されることもある。本発明の一態様では、組換えは、相同組換えである。
【0232】
ガイド配列を、任意の標的配列を標的とするように選択することができる。いくつかの実施形態では、標的配列は、細胞のゲノム内の配列である。例示的な標的配列には、標的ゲノムにおいてユニークなものが含まれる。例えば、S.pyogenes Cas9の場合、ゲノム中のユニークな標的配列は、形態MMMMMMMMNNNNNNNNNNNNXGGのCas9標的部位を含み得、NNNNNNNNNNNNXGG(NはA、G、TまたはCであり、Xは任意でよい)はそのゲノム中に1回出現する。ゲノム中のユニークな標的配列は、形態MMMMMMMMMNNNNNNNNNNNXGGのS.pyogenes Cas9標的部位を含み得、NNNNNNNNNNNXGG(NはA、G、TまたはCであり、Xは任意でよい)はそのゲノム中に1回出現する。S.thermophilus CRISPR1 Cas9の場合、ゲノム中のユニークな標的配列は、形態MMMMMMMMNNNNNNNNNNNNXXAGAAW(配列番号1)のCas9標的部位を含み得、NNNNNNNNNNNNXXAGAAW(配列番号2)(NはA、G、TまたはCであり、Xは任意でよく、WはAまたはTである)はそのゲノム中に1回出現する。ゲノム中のユニークな標的配列は、形態MMMMMMMMMNNNNNNNNNNNXXAGAAW(配列番号3)のS.thermophilus CRISPR1Cas9標的部位を含み得、NNNNNNNNNNNXXAGAAW(配列番号4)(NはA、G、TまたはCであり、Xは任意でよく、WはAまたはTである)はそのゲノム中に1回出現する。S.pyogenes Cas9の場合、ゲノム中のユニークな標的配列は、形態MMMMMMMMNNNNNNNNNNNNXGGXGのCas9標的部位を含み得、NNNNNNNNNNNNXGGXG(NはA、G、TまたはCであり、Xは任意でよい)はそのゲノム中に1回出現する。ゲノム中のユニークな標的配列は、形態MMMMMMMMMNNNNNNNNNNNXGGXGのS.pyogenes Cas9標的部位を含み得、NNNNNNNNNNNXGGXG(NはA、G、TまたはCであり、Xは任意でよい)はそのゲノム中に1回出現する。これらの配列のそれぞれにおいて、「M」はA、G、TまたはCであり得、配列をユニークであると同定する際にこれを考慮する必要はない。
【0233】
いくつかの実施形態では、ガイド配列を、ガイド配列内の二次構造の程度を低減させるように選択する。二次構造は、任意の適切なポリヌクレオチドフォールディングアルゴリズムによって決定することができる。一部のプログラムは、最小ギブズ自由エネルギーの計算に基づく。そのようなアルゴリズムの一例は、Zuker and Stiegler(Nucleic Acids Res.9(1981),133-148)によって説明されているmFoldである。別のフォールディングアルゴリズムの例は、University of ViennaのInstitute for Theoretical Chemistryにてセントロイド構造予測アルゴリズムを使用して開発された、オンラインウェブサーバーRNAfoldである(例えば、A.R.Gruber et al.,2008,Cell106(1):23-24、及びPA Carr and GM Church,2009,Nature Biotechnology27(12):1151-62を参照されたい)。
【0234】
一般に、tracrメイト配列は、(1)対応するtracr配列を含む細胞内のtracrメイト配列に隣接するガイド配列の切除、及び(2)tracr配列にハイブリダイズしたtracrメイト配列を含むCRISPR複合体の標的配列での形成、の1つ以上を促進するのに十分なtracr配列との相補性を有する任意の配列を含む。一般に、相補性の程度は、tracrメイト配列とtracr配列の、2つの配列のうちの短い方の長さに沿った最適なアラインメントを参照している。最適なアラインメントは、任意の適切なアラインメントアルゴリズムによって決定することができ、さらに、tracr配列内またはtracrメイト配列内のいずれかの自己相補性などの二次構造を説明することができる。いくつかの実施形態では、最適にアラインメントした場合、tracr配列とtracrメイト配列間の2つのうちの短い方の長さに沿った相補性の程度は、約25%以上、約30%以上、約40%以上、約50%以上、約60%以上、約70%以上、約80%以上、約90%以上、約95%以上、約97.5%以上、約99%以上であるか、またはそれより高い。いくつかの実施形態では、tracr配列は、約5ヌクレオチド長以上、約6ヌクレオチド長以上、約7ヌクレオチド長以上、約8ヌクレオチド長以上、約9ヌクレオチド長以上、約10ヌクレオチド長以上、約11ヌクレオチド長以上、約12ヌクレオチド長以上、約13ヌクレオチド長以上、約14ヌクレオチド長以上、約15ヌクレオチド長以上、約16ヌクレオチド長以上、約17ヌクレオチド長以上、約18ヌクレオチド長以上、約19ヌクレオチド長以上、約20ヌクレオチド長以上、約25ヌクレオチド長以上、約30ヌクレオチド長以上、約40ヌクレオチド長以上、約50ヌクレオチド長以上であるか、またはそれより長い。いくつかの実施形態では、tracr配列及びtracrメイト配列は、単一の転写物内に含まれ、その結果、2つの間のハイブリダイゼーションは、ヘアピンなどの二次構造を有する転写物を生成する。一実施形態では、ヘアピン構造で使用するためのループ形成配列は、4ヌクレオチド長である。一実施形態では、ヘアピン構造で使用するためのループ形成配列は、配列GAAAを有する。但し、代替配列と同様に、より長いまたはより短いループ配列を使用することもできる。配列は、ヌクレオチドトリプレット(例えば、AAA)、及び別のヌクレオチド(例えば、CまたはG)を含み得る。ループ形成配列の例としては、CAAA及びAAAGが挙げられる。本発明の一実施形態では、転写物または転写されたポリヌクレオチド配列は、少なくとも2つ以上のヘアピンを有する。いくつかの実施形態では、転写物は、2つ、3つ、4つ、または5つのヘアピンを有する。本発明のさらなる実施形態では、転写物は、最大で5つのヘアピンを有する。いくつかの実施形態では、単一の転写物は、転写終結配列をさらに含み、いくつかの実施形態では、転写終結配列は、ポリT配列、例えば、6つのTヌクレオチドである。
【0235】
核酸の編集及び送達方法
一実施形態では、本発明は、核酸分子、ゲノムまたは遺伝子などの遺伝物質を編集する方法を提供する。例えば、一実施形態では、編集は組み込みである。一実施形態では、編集はCRISPR媒介性編集である。
【0236】
一実施形態では、本方法は、融合タンパク質をコードする核酸分子;遺伝物質内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を遺伝物質に投与することを含む。一実施形態では、本方法は、融合タンパク質;遺伝物質内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を遺伝物質に投与することを含む。一実施形態では、本方法は、in vitro法であるか、またはin vivo法である。
【0237】
一実施形態では、本発明は、遺伝物質に核酸配列を送達する方法を提供する。一実施形態では、本方法は、融合タンパク質をコードする核酸分子;遺伝子内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を遺伝子に投与することを含む。一実施形態では、本方法は、融合タンパク質;遺伝物質内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を遺伝物質に投与することを含む。一実施形態では、本方法は、in vitro法であるか、またはin vivo法である。
【0238】
一実施形態では、本方法は、融合タンパク質をコードする核酸分子;遺伝子内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を細胞に投与することを含む。一実施形態では、本方法は、融合タンパク質;遺伝子内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を細胞に投与することを含む。
【0239】
一実施形態では、遺伝物質の編集方法は、遺伝子の編集方法である。一実施形態では、遺伝子は細胞のゲノムに位置している。一実施形態では、遺伝物質の編集方法は、核酸の編集方法である。
【0240】
一実施形態では、本発明は、ドナー鋳型配列を標的配列に挿入する方法を提供する。一実施形態では、本方法は、ドナー鋳型配列を細胞内の標的配列に挿入する。一実施形態では、本方法は、融合タンパク質をコードする核酸分子;標的配列内の領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を細胞に投与することを含む。一実施形態では、本方法は、融合タンパク質;標的配列内の領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を細胞に投与することを含む。
【0241】
CRISPR-Cas9媒介性HDRを使用したゲノム編集用の大型DNA配列の標的化送達は、依然として非効率的である。しかしながら、本方法は、大型のドナー鋳型配列を細胞内の標的配列に挿入するための方法を提供する。一実施形態では、本方法は、ドナー鋳型配列を、少なくとも1kb以上、少なくとも2kb以上、少なくとも3kb以上、少なくとも4kb以上、少なくとも5kb以上、少なくとも6kb以上、少なくとも7kb以上、少なくとも8kb以上、少なくとも9kb以上、少なくとも10kb以上、少なくとも11kb以上、少なくとも12kb以上、少なくとも13kb以上、少なくとも14kb以上、少なくとも15kb以上、少なくとも16kb以上、少なくとも17kb以上、または少なくとも18kb以上挿入する。一実施形態では、本方法は、融合タンパク質または融合タンパク質をコードする核酸分子;標的配列内の領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を細胞に投与することを含む。
【0242】
一実施形態では、標的配列は遺伝子内に位置する。一実施形態では、ドナー鋳型配列は、遺伝子配列を破壊し、それにより遺伝子の発現を阻害するかまたは低減させる。一実施形態では、標的配列は突然変異を有し、ドナー鋳型配列は、修復された配列を標的配列に挿入して、それにより遺伝子突然変異を修復する。一実施形態では、ドナー鋳型配列は遺伝子配列であり、ドナー鋳型配列を細胞内の標的配列に挿入することにより、遺伝子の発現が可能となる。
【0243】
一実施形態では、ドナー鋳型配列は、セーフハーバー部位に挿入される。したがって、一実施形態では、ガイド核酸は、遺伝子内のセーフハーバー領域に相補的なヌクレオチド配列を含む。セーフハーバー領域は、隣接遺伝子の発現に影響を及ぼすことなく、治療遺伝子の発現を可能にする。セーフハーバー領域には、隣接遺伝子から離れた遺伝子間領域、例えば、H11、または「非必須」遺伝子、例えば、CCR5、hROSA26もしくはAAVS1内が含まれ得る。例示的なセーフハーバー領域及びこれらの配列に相補的なガイド核酸配列は、例えば、Pellenz et al.,New Human Chromosomal Sites with “Safe Harbor” Potential for Targeted Transgene Insertion,2019,Hum Gene Ther 30(7):814-28に見出すことができ、これは参照により本明細書に組み込まれる。
【0244】
一実施形態では、ドナー鋳型配列を3’非翻訳領域(UTR)に挿入することにより、ドナー鋳型配列の発現を他の遺伝子のプロモーターによって制御することが可能となる。
【0245】
一実施形態では、核酸分子は、レトロウイルスインテグラーゼ(IN)またはその断片をコードする第1の核酸配列、CRISPR関連(Cas)タンパク質をコードする第2の核酸配列、及び核局在化シグナル(NLS)をコードする第3の核酸配列を含む。
【0246】
一実施形態では、レトロウイルスINは、ヒト免疫不全ウイルス(HIV)IN、ラウス肉腫ウイルス(RSV)IN、マウス乳癌ウイルス(MMTV)IN、モロニーマウス白血病ウイルス(MoLV)IN、ウシ白血病ウイルス(BLV)IN、ヒトTリンパ向性ウイルス(HTLV)IN、トリ肉腫白血病ウイルス(ASLV)IN、ネコ白血病ウイルス(FLV)IN、異種指向性マウス白血病ウイルス関連ウイルス(XMLV)IN、サル免疫不全ウイルス(SIV)IN、ネコ免疫不全ウイルス(FIV)IN、ウマ伝染性貧血ウイルス(EIAV)IN、プロトタイプフォーミーウイルス(PFV)IN、サルフォーミーウイルス(SFV)IN、ヒトフォーミーウイルス(HFV)IN、ウォールアイ皮膚肉腫ウイルス(WDSV)IN、またはウシ免疫不全ウイルス(BIV)INである。
【0247】
一実施形態では、レトロウイルスINは、HIV INである。一実施形態では、HIV INは、1つ以上のアミノ酸置換を含み、この置換は、触媒活性を改善するか、溶解性を改善するか、または1つ以上の宿主細胞補因子との相互作用を増加させる。一実施形態では、HIV INは、E85G、E85F、D116N、F185K、C280S、T97A、Y134R、G140S及びQ148Hからなる群から選択される1つ以上のアミノ酸置換を含む。一実施形態では、HIV INは、アミノ酸置換F185K及びC280Sを含む。一実施形態では、HIV INは、アミノ酸置換T97A及びY134Rを含む。一実施形態では、HIV INは、アミノ酸置換G140S及びQ148Hを含む。
【0248】
一実施形態では、レトロウイルスIN断片は、IN N末端ドメイン(NTD)及びIN触媒コアドメイン(CCD)を含む。一実施形態では、レトロウイルスIN断片は、IN CCD及びIN C末端ドメイン(CTD)を含む。一実施形態では、レトロウイルスIN断片は、IN NTDを含む。一実施形態では、レトロウイルスIN断片は、IN CCDを含む。一実施形態では、レトロウイルスIN断片は、IN CTDを含む。
【0249】
一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号1~40のうちの1つと少なくとも95%同一である配列をコードする核酸配列を含む。一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号1~40のうちの1つと少なくとも96%同一である配列をコードする核酸配列を含む。一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号1~40のうちの1つと少なくとも97%同一である配列をコードする核酸配列を含む。一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号1~40のうちの1つと少なくとも98%同一である配列をコードする核酸配列を含む。一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号1~40のうちの1つと少なくとも99%同一である配列をコードする核酸配列を含む。一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号1~40のうちの1つをコードする核酸配列を含む。
【0250】
一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号99~138のうちの1つと少なくとも95%同一である核酸配列を含む。一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号99~138のうちの1つと少なくとも96%同一である核酸配列を含む。一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号99~138のうちの1つと少なくとも97%同一である核酸配列を含む。一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号99~138のうちの1つと少なくとも98%同一である核酸配列を含む。一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号99~138のうちの1つと少なくとも99%同一である核酸配列を含む。一実施形態では、レトロウイルスINをコードする第1の核酸配列は、配列番号99~138のうちの1つの核酸配列を含む。
【0251】
一実施形態では、Casタンパク質は、Cas9、Cas13またはCpf1である。一実施形態では、Casタンパク質は、触媒的に欠損している(dCas)。
【0252】
一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号41~46のうちの1つと少なくとも95%同一である配列をコードする核酸配列を含む。一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号41~46のうちの1つと少なくとも96%同一である配列をコードする核酸配列を含む。一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号41~46のうちの1つと少なくとも97%同一である配列をコードする核酸配列を含む。一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号41~46のうちの1つと少なくとも98%同一である配列をコードする核酸配列を含む。一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号41~46のうちの1つと少なくとも99%同一である配列をコードする核酸配列を含む。一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号41~46のうちの1つをコードする核酸配列を含む。
【0253】
一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号139~144のうちの1つと少なくとも95%同一である核酸配列を含む。一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号139~144のうちの1つと少なくとも96%同一である核酸配列を含む。一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号139~144のうちの1つと少なくとも97%同一である核酸配列を含む。一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号139~144のうちの1つと少なくとも98%同一である核酸配列を含む。一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号139~144のうちの1つと少なくとも99%同一である核酸配列を含む。一実施形態では、Casタンパク質をコードする第2の核酸配列は、配列番号139~144のうちの1つの核酸配列を含む。
【0254】
一実施形態では、NLSは、レトロトランスポゾンNLSである。一実施形態では、NLSは、酵母GAL4、SKI3、L29、またはヒストンH2Bタンパク質、ポリオーマウイルス大型Tタンパク質、VP1もしくはVP2カプシドタンパク質、SV40 VP1もしくはSV40 VP2カプシドタンパク質、アデノウイルスE1aまたはDBPタンパク質、インフルエンザウイルスNS1タンパク質、肝炎ウイルスコア抗原または哺乳動物ラミン、c-myc、max、c-myb、p53、c-erbA、jun、Tax、ステロイド受容体またはMxタンパク質、またはサルウイルス40(「SV40」)T抗原に由来する。一実施形態では、NLSは、Ty1もしくはTy1由来のNLS、Ty2もしくはTy2由来のNLS、またはMAK11もしくはMAK11由来のNLSである。一実施形態では、Ty1 NLSは、配列番号51のアミノ酸配列を含む。一実施形態では、Ty2 NLSは、配列番号254のアミノ酸配列を含む。一実施形態では、MAK11 NLSは、配列番号256のアミノ酸配列を含む。
【0255】
一実施形態では、NLSをコードする第3の核酸配列は、配列番号47~56のうちの1つと少なくとも95%同一である配列をコードする核酸配列を含む。一実施形態では、NLSをコードする第3の核酸配列は、配列番号47~56のうちの1つと少なくとも96%同一である配列をコードする核酸配列を含む。一実施形態では、NLSをコードする第3の核酸配列は、配列番号47~56のうちの1つと少なくとも97%同一である配列をコードする核酸配列を含む。一実施形態では、NLSをコードする第3の核酸配列は、配列番号47~56のうちの1つと少なくとも98%同一である配列をコードする核酸配列を含む。一実施形態では、NLSをコードする第3の核酸配列は、配列番号47~56のうちの1つと少なくとも99%同一である配列をコードする核酸配列を含む。一実施形態では、NLSをコードする第3の核酸配列は、配列番号47~56のうちの1つをコードする核酸配列を含む。
【0256】
一実施形態では、NLSをコードする第3の核酸配列は、配列番号145~154のうちの1つと少なくとも95%同一である核酸配列を含む。一実施形態では、NLSをコードする第3の核酸配列は、配列番号145~154のうちの1つと少なくとも96%同一である核酸配列を含む。一実施形態では、NLSをコードする第3の核酸配列は、配列番号145~154のうちの1つと少なくとも97%同一である核酸配列を含む。一実施形態では、NLSをコードする第3の核酸配列は、配列番号145~154のうちの1つと少なくとも98%同一である核酸配列を含む。一実施形態では、NLSをコードする第3の核酸配列は、配列番号145~154のうちの1つと少なくとも99%同一である核酸配列を含む。一実施形態では、NLSをコードする第3の核酸配列は、配列番号145~154のうちの1つの核酸配列を含む。
【0257】
一実施形態では、核酸分子は、配列番号57~98のうちの1つと少なくとも95%同一である配列を含む融合タンパク質をコードする。一実施形態では、核酸分子は、配列番号57~98のうちの1つと少なくとも96%同一である配列を含む融合タンパク質をコードする。一実施形態では、核酸分子は、配列番号57~98のうちの1つと少なくとも97%同一である配列を含む融合タンパク質をコードする。一実施形態では、核酸分子は、配列番号57~98のうちの1つと少なくとも98%同一である配列を含む融合タンパク質をコードする。一実施形態では、核酸分子は、配列番号57~98のうちの1つと少なくとも99%同一である配列を含む融合タンパク質をコードする。一実施形態では、核酸分子は、配列番号57~98のうちの1つの配列を含む融合タンパク質をコードする。
【0258】
一実施形態では、核酸分子は、配列番号155~196のうちの1つと少なくとも95%同一である核酸配列を含む。一実施形態では、核酸分子は、配列番号155~196のうちの1つと少なくとも96%同一である核酸配列を含む。一実施形態では、核酸分子は、配列番号155~196のうちの1つと少なくとも97%同一である核酸配列を含む。一実施形態では、核酸分子は、配列番号155~196のうちの1つと少なくとも98%同一である核酸配列を含む。一実施形態では、核酸分子は、配列番号155~196のうちの1つと少なくとも99%同一である核酸配列を含む。一実施形態では、核酸分子は、配列番号155~196のうちの1つの核酸配列を含む。
【0259】
一実施形態では、U3配列及びU5配列は、レトロウイルスINに特異的である。
【0260】
いくつかの実施形態では、遺伝子は、任意の目的標的遺伝子である。例えば、一実施形態では、遺伝子は、疾患を有するかまたは発症するリスクの増加に関連する任意の遺伝子である。いくつかの実施形態では、本方法は、融合タンパク質をコードする核酸分子;遺伝子内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を導入することを含む。一実施形態では、IN-Cas9融合タンパク質は、標的ポリヌクレオチドに結合し遺伝子内の標的ポリヌクレオチドの切断をもたらす。一実施形態では、IN-Cas9融合タンパク質は、標的ポリヌクレオチド内の標的配列にハイブリダイズするガイド核酸と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ドナー鋳型核酸をコードする核酸配列と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ガイド核酸をコードする核酸配列と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ガイド核酸をコードする核酸配列及びドナー鋳型核酸をコードする核酸配列と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、標的ポリヌクレオチド内の標的配列にハイブリダイズするガイド核酸及びドナー鋳型核酸と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ドナー鋳型核酸と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ガイド核酸と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ガイド核酸及びドナー鋳型核酸と複合体を形成している。
【0261】
いくつかの実施形態では、IN-Cas9は、ドナー鋳型の遺伝子への組み込みを触媒する。一実施形態では、組み込みは、1つ以上の突然変異を遺伝子に導入する。いくつかの実施形態では、前記突然変異は、標的配列を含む遺伝子からのタンパク質発現において1つ以上のアミノ酸変化を生じさせる。
【0262】
一実施形態では、DNA配列のIN媒介性組み込みは、標的DNA配列のいずれの方向にも生じ得る。一実施形態では、Cas及びINレトロウイルスクラスのタンパク質の様々な組み合わせを使用して指向性編集を容易にする。例えば、一実施形態では、レトロウイルスクラスに由来するINの融合体は、Cas特異的ガイドRNAを利用した特定の標的配列への結合を可能とする、第1の触媒的に死んだCasに結合する。一実施形態では、ドナー配列は、HIV LTR及びBIV LTR配列の両方を含む。したがって、一実施形態では、この配列は、標的DNAに単一の方向で組み込まれる。
【0263】
一実施形態では、LoxPに隣接する(Floxed)配列は、目的遺伝子周囲に導入される。floxed配列を含めることにより、Cre媒介性組換え及び条件付き突然変異誘発が可能となる。CRISPR-Cas9を使用してFloxed対立遺伝子を作製する現行の方法は、非効率的である。最も広く利用されているアプローチは、隣接する標的配列でのDNA切断を誘導するための2本のガイドRNA、及びLoxP配列を含有するssDNA鋳型を挿入するための相同組換え修復を使用することである。しかしながら、二重sgRNAを使用して切断を誘導する場合、最も好ましい反応は、介在配列が欠失し、その結果全体的な遺伝子欠失が生じることである。したがって、一実施形態では、インテグラーゼ-Cas媒介性遺伝子挿入の使用により、DNA配列のタンデム挿入の効率が上昇する。一実施形態では、IN媒介性組み込みがいずれの方向にも生じ得るため、反転したLoxP配列を含有する配列の組み込みにより、LoxPに隣接する配列の組換えが可能となる。
【0264】
治療方法及び使用方法
本発明は、疾患または障害及び/または遺伝子改変を治療し、それらの症状を低減させ、及び/またはそれらが生じるリスクを低減させて、所望の表現型の結果をもたらす方法を提供する。例えば、一実施形態では、本発明の方法は、哺乳動物における疾患または障害を治療し、それらの症状を低減させ、及び/またはそれらが生じるリスクを低減させる。一実施形態では、本発明の方法は、植物における疾患または障害を治療し、それらの症状を低減させ、及び/またはそれらが生じるリスクを低減させる。一実施形態では、本発明の方法は、酵母生物における疾患または障害を治療し、それらの症状を低減させ、及び/またはそれらが生じるリスクを低減させる。
【0265】
一実施形態では、疾患または障害は、ゲノム遺伝子座における1つ以上の突然変異によって引き起こされる。したがって、一実施形態では、疾患または障害を、1つ以上の突然変異を有する領域の野生型配列に対応する核酸配列の導入、及び/または1つ以上の突然変異を有するゲノム配列の発現を防止もしくは低減させるエレメントの導入を介して治療するか、低減させるか、またはリスクを低減させることができる。したがって、一実施形態では、本方法は、標的配列内のゲノム遺伝子座のコーディングエレメント、非コーディングエレメント、または調節エレメント内の標的配列の操作を含む。
【0266】
例えば、一実施形態では、疾患は単一遺伝子性疾患である。一実施形態では、疾患には、デュシェンヌ型筋ジストロフィー(ジストロフィンに発生する突然変異)、肢帯型筋ジストロフィー2B型(LGMD2B)及び三好型ミオパチー(ジスフェルリンに発生する突然変異)、嚢胞性線維症(CFTRに発生する突然変異)、ウィルソン病(ATP7Bに発生する突然変異)ならびにシュタルガルト黄斑変性(ABCA4に発生する突然変異)が含まれるが、これらに限定されない。
【0267】
本発明はまた、遺伝子または遺伝物質の発現を調節する方法を提供する。例えば、一実施形態では、本発明の方法は、細胞または生物に表現型を付与するための遺伝物質の送達を提供する。例えば、一実施形態では、本方法は、病原体に対する耐性をもたらす。一実施形態では、本方法は、代謝経路の調節をもたらす。一実施形態では、本方法は、生物における物質の産生及び使用をもたらす。例えば、一実施形態では、本方法は、真核生物、酵母、細菌または植物などの生物において、生物学的物質、薬学的物質及びバイオ燃料などの物質を生成する。
【0268】
一実施形態では、本方法は、融合タンパク質または融合タンパク質をコードする核酸分子;遺伝子内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列を含むドナー鋳型核酸を投与することを含む。一実施形態では、本方法は、ドナー鋳型配列を投与することをさらに含む。
【0269】
一実施形態では、標的配列は遺伝子内に位置する。一実施形態では、ドナー鋳型配列は、遺伝子配列を破壊し、それにより遺伝子の発現を阻害するかまたは低減させる。一実施形態では、標的配列は突然変異を有し、ドナー鋳型配列は、修復された配列を標的配列に挿入して、それにより遺伝子突然変異を修復する。一実施形態では、ドナー鋳型配列は遺伝子配列であり、ドナー鋳型配列を細胞内の標的配列に挿入することにより、遺伝子の発現が可能となる。
【0270】
一実施形態では、融合タンパク質は、CRISPR関連(Cas)タンパク質及び核局在化シグナル(NLS)を含む。一実施形態では、融合タンパク質は、Casタンパク質、NLS及びレトロウイルスインテグラーゼ(IN)またはその断片を含む。
【0271】
一実施形態では、レトロウイルスINは、ヒト免疫不全ウイルス(HIV)IN、ラウス肉腫ウイルス(RSV)IN、マウス乳癌ウイルス(MMTV)IN、モロニーマウス白血病ウイルス(MoLV)IN、ウシ白血病ウイルス(BLV)IN、ヒトTリンパ向性ウイルス(HTLV)IN、トリ肉腫白血病ウイルス(ASLV)IN、ネコ白血病ウイルス(FLV)IN、異種指向性マウス白血病ウイルス関連ウイルス(XMLV)IN、サル免疫不全ウイルス(SIV)IN、ネコ免疫不全ウイルス(FIV)IN、ウマ伝染性貧血ウイルス(EIAV)IN、プロトタイプフォーミーウイルス(PFV)IN、サルフォーミーウイルス(SFV)IN、ヒトフォーミーウイルス(HFV)IN、ウォールアイ皮膚肉腫ウイルス(WDSV)IN、またはウシ免疫不全ウイルス(BIV)INである。
【0272】
一実施形態では、レトロウイルスINは、HIV INである。一実施形態では、HIV INは、1つ以上のアミノ酸置換を含み、この置換は、触媒活性を改善するか、溶解性を改善するか、または1つ以上の宿主細胞補因子との相互作用を増加させる。一実施形態では、HIV INは、E85G、E85F、D116N、F185K、C280S、T97A、Y134R、G140S及びQ148Hからなる群から選択される1つ以上のアミノ酸置換を含む。一実施形態では、HIV INは、アミノ酸置換F185K及びC280Sを含む。一実施形態では、HIV INは、アミノ酸置換T97A及びY134Rを含む。一実施形態では、HIV INは、アミノ酸置換G140S及びQ148Hを含む。
【0273】
一実施形態では、レトロウイルスIN断片は、IN N末端ドメイン(NTD)及びIN触媒コアドメイン(CCD)を含む。一実施形態では、レトロウイルスIN断片は、IN CCD及びIN C末端ドメイン(CTD)を含む。一実施形態では、レトロウイルスIN断片は、IN NTDを含む。一実施形態では、レトロウイルスIN断片は、IN CCDを含む。一実施形態では、レトロウイルスIN断片は、IN CTDを含む。
【0274】
一実施形態では、レトロウイルスINは、配列番号1~40のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、レトロウイルスINは、配列番号1~40のうちの1つの配列を含む。
【0275】
一実施形態では、レトロウイルスINをコードする核酸配列は、配列番号99~138のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である核酸配列を含む。一実施形態では、レトロウイルスINをコードする核酸配列は、配列番号99~138のうちの1つの核酸配列を含む。
【0276】
一実施形態では、Casタンパク質は、Cas9、Cas13またはCpf1である。一実施形態では、Casタンパク質は、触媒的に欠損している(dCas)。
【0277】
一実施形態では、Casタンパク質は、配列番号41~46のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、Casタンパク質は、配列番号41~46のうちの1つの配列を含む。
【0278】
一実施形態では、Casタンパク質をコードする核酸配列は、配列番号139~144のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である核酸配列を含む。一実施形態では、Casタンパク質をコードする核酸配列は、配列番号139~144のうちの1つの核酸配列を含む。
【0279】
一実施形態では、NLSは、レトロトランスポゾンNLSである。一実施形態では、NLSは、酵母GAL4、SKI3、L29、またはヒストンH2Bタンパク質、ポリオーマウイルス大型Tタンパク質、VP1もしくはVP2カプシドタンパク質、SV40 VP1もしくはSV40 VP2カプシドタンパク質、アデノウイルスE1aまたはDBPタンパク質、インフルエンザウイルスNS1タンパク質、肝炎ウイルスコア抗原または哺乳動物ラミン、c-myc、max、c-myb、p53、c-erbA、jun、Tax、ステロイド受容体またはMxタンパク質、またはサルウイルス40(「SV40」)T抗原に由来する。一実施形態では、NLSは、Ty1もしくはTy1由来のNLS、Ty2もしくはTy2由来のNLS、またはMAK11もしくはMAK11由来のNLSである。一実施形態では、Ty1 NLSは、配列番号51のアミノ酸配列を含む。一実施形態では、Ty2 NLSは、配列番号254のアミノ酸配列を含む。一実施形態では、MAK11 NLSは、配列番号256のアミノ酸配列を含む。
【0280】
一実施形態では、NLSは、配列番号47~56、配列番号254~256及び配列番号275~887のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列をコードする核酸配列を含む。一実施形態では、NLSは、配列番号47~56、配列番号254~256及び配列番号275~887のうちの1つをコードする核酸配列を含む。
【0281】
一実施形態では、NLSをコードする核酸配列は、配列番号145~154のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である核酸配列を含む。一実施形態では、NLSをコードする核酸配列は、配列番号145~154のうちの1つの核酸配列を含む。
【0282】
一実施形態では、融合タンパク質は、配列番号57~98のうちの1つと少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一である配列を含む。一実施形態では、融合タンパク質は、配列番号57~98のうちの1つの配列を含む。
【0283】
一実施形態では、U3配列及びU5配列は、レトロウイルスINに特異的である。
【0284】
いくつかの実施形態では、遺伝子は、任意の目的標的遺伝子である。例えば、一実施形態では、遺伝子は、疾患を有するかまたは発症するリスクの増加に関連する任意の遺伝子である。いくつかの実施形態では、本方法は、融合タンパク質をコードする核酸分子;遺伝子内の標的領域に相補的な標的化ヌクレオチド配列を含むガイド核酸;ならびにU3配列、U5配列及びドナー鋳型配列を含むドナー鋳型核酸を導入することを含む。一実施形態では、IN-Cas9融合タンパク質は、標的ポリヌクレオチドに結合し遺伝子内の標的ポリヌクレオチドの切断をもたらす。一実施形態では、IN-Cas9融合タンパク質は、標的ポリヌクレオチド内の標的配列にハイブリダイズするガイド核酸と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ドナー鋳型核酸をコードする核酸配列と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ガイド核酸をコードする核酸配列と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ガイド核酸をコードする核酸配列及びドナー鋳型核酸をコードする核酸配列と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、標的ポリヌクレオチド内の標的配列にハイブリダイズするガイド核酸及びドナー鋳型核酸と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ドナー鋳型核酸と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ガイド核酸と複合体を形成している。一実施形態では、IN-Cas9融合タンパク質は、ガイド核酸及びドナー鋳型核酸と複合体を形成している。
【0285】
いくつかの実施形態では、IN-Cas9は、ドナー鋳型の遺伝子への組み込みを触媒する。一実施形態では、組み込みは、1つ以上の突然変異を遺伝子に導入する。いくつかの実施形態では、前記突然変異は、標的配列を含む遺伝子からのタンパク質発現において1つ以上のアミノ酸変化を生じさせる。
【実施例】
【0286】
以下の実験的実施例を参照することにより、本発明をさらに詳細に説明する。これらの実施例は例示目的のためのみに提供され、別段の定めがない限り、限定することを意図したものではない。したがって、本発明は、以下の実施例に限定されると決して解釈されるべきではなく、むしろ、本明細書で提供される教示の結果として明らかとなるあらゆるすべての変形を包含すると解釈されるべきである。
【0287】
さらなる説明なしに、当業者は、前述の説明及び以下の例示的な実施例を使用して、本発明を作製及び利用し、特許請求された方法を実施することができると考えられる。したがって、以下の実施例は、本発明の特定の実施形態を具体的に示すものであり、いかなる意味においても本開示の残りの部分を制限するものとして解釈されるべきではない。
【0288】
実施例1:哺乳動物のゲノムDNAを編集するためのレトロウイルスインテグラーゼ-dCas9融合タンパク質の核局在化の向上
哺乳動物のゲノムDNAを効率的にCRISPR-Cas9で編集するには、核膜を欠く原核細胞で通常機能する、大型の細菌RNA誘導エンドヌクレアーゼであるCas9の核局在化が必要である。哺乳動物細胞におけるCas9の効率的な核局在化には、1つはN末端に、もう1つはC末端に位置する少なくとも2つの哺乳動物核局在化シグナルの付加が必要であることが示されている(Cong et al.,2013,Science 339:819-23)。
【0289】
編集のためのレトロウイルスインテグラーゼ-dCas9融合タンパク質の核局在化を促進するために、dCas9上のC末端SV40 NLSに加えて、N末端SV40 NLSをインテグラーゼに含めた(
図1A)。意外にも、哺乳動物細胞で発現させた場合、dCas9上のC末端3xFLAGエピトープを認識するFLAG抗体を使用して検出されたように、IN-dCas9融合タンパク質のごく一部のみが核に局在した(
図1B)。興味深いことに、完全長IN-dCas9融合タンパク質は細胞質凝集体を生じさせたが、インテグラーゼのC末端ドメインの欠失(INΔC)により、溶解性が高まり、核局在化が増加した(
図1B)。
【0290】
レトロウイルスインテグラーゼのdCas9への融合は、核に局在するその能力を劇的に減少させるように思われる。インテグラーゼdCas9融合タンパク質の核局在化をさらに向上させるために、IN-dCas9の核内輸送を誘導する能力について、いくつかの異なる哺乳動物の核局在化配列を試験した(
図1B)。SV40 NLSの3つのコピーの多量体化(3xSV40)は、IN-dCas9またはINΔC-dCas9の核局在化の程度に明らかな効果を示さなかった。しかしながら、ヌクレオプラスミン(NPM)由来の双節型(bipartite)NLSの付加により、INΔC-dCas9融合タンパク質の核局在化が増加したが、完全長IN融合タンパク質の核局在化は増加しなかった。3xSV40とNPM NLSの組み合わせは、NPM単独と同様であるように思われた。
【0291】
興味深いことに、酵母LTRレトロトランスポゾン(例えば、Ty1)はレトロウイルスの進化上の祖先であり、細胞質内のRNA中間体の逆転写を通じてそれらのゲノムを複製する(Curcio et al.,2015,Microbiol Spectr 3:MDNA3-0053-2014)。LTRレトロトランスポゾンは、レトロトランスポゾンゲノムの挿入に必要なインテグラーゼ酵素を含有する。細胞分裂中に開放型有糸分裂を経る高等真核生物とは対照的に、酵母は閉鎖型有糸分裂を経るため、核膜はそのまま維持される。したがって、Ty1新生の場合、インテグラーゼ/レトロトランスポゾンゲノム複合体の核内輸送には、能動的な核内輸送が必要である。そのため、哺乳動物のインテグラーゼ酵素とは対照的に、Ty1インテグラーゼはレトロ転位に必要な大型のC末端双節型NLSを含有する(Moore et al.,1998,Mol Cell Biol 18:1105-14)。興味深いことに、本明細書に示された結果は、両方のIN-dCas9融合タンパク質のC末端へのTy1 NLSの融合が、哺乳動物細胞中で強力な核局在化をもたらしたことを実証している(
図1B)。
【0292】
INΔC-dCas9融合タンパク質の核局在化の増加は、培養中の分裂哺乳動物細胞における編集を大幅に向上させた。Ty1 NLSの付加により、HEK293細胞中のEF1-アルファの3’UTREを標的とするIRES-mCherry鋳型を組み込むための、INΔC-dCas9融合タンパク質の活性が増強された(
図1C)。強力なTy1 NLSを利用することにより、核膜を常に維持する非分裂細胞での編集(例えば、in vivoでの治療適用)がさらに可能となり得る。
【0293】
実施例2:筋ジストロフィーの修復のための統合的遺伝子編集アプローチ
本明細書の他の箇所に示されているように、レンチウイルスインテグラーゼのCRISPR-Cas9への融合により、ゲノムDNAへの大型DNA配列の配列特異的な組み込みが可能となる。このアプローチは、ヒトの遺伝性疾患を永続的に修復するために、非病原性のゲノム位置(セーフハーバー)に治療上有益な遺伝子を送達するために利用することができる(
図2)。この技術により、短いウイルス末端モチーフを含有する大型DNAドナー配列の配列特異的な組み込みが可能となる。
【0294】
本発明の遺伝子治療アプローチの主な利点は、ドナーDNA配列を標的ゲノム位置に送達する能力である。さらに、このアプローチは、相同性アームを不要にしてガイドRNAによる標的化に依存し、ゲノム編集を大幅に簡素化する。したがって、特定のレポータードナー配列を一旦作製すると、多種多様な適用のために、それを任意の場所(または複数の場所)に誘導することができる。
【0295】
レンチウイルスインテグラーゼのdCas9への融合は、哺乳動物細胞中でCRISPRガイドRNAを使用して、短いウイルス末端を含有するドナーDNA配列を標的配列に挿入するのに十分である(
図3)。哺乳動物細胞中のインテグラーゼ-Cas媒介性組み込みをモニタリングするために、IGR IRES配列とそれに続くmCherry-2a-ピューロマイシン遺伝子及びSV40ポリアデニル化配列を含有するドナーベクターを作製した(
図3)。次に、COS-7細胞中の安定したヒトCMV-eGFP安定細胞株を標的とするsgRNAを設計した。hCMV-eGFPの安定した導入遺伝子は、強力に発現しているが必須ではない発現遺伝子座での編集を判定するために使用することができる異種標的配列をもたらした。ドナーmCherry-2a-puro鋳型を精製し、sgRNA及びIN-dCas9とともにGFP安定細胞にコトランスフェクトし、48時間培養した。48時間後、mCherry陽性細胞が培養液中に見られ、GFP陽性シグナルに取って代わった(
図3)。
【0296】
ヒトジストロフィンの哺乳動物ゲノムへのインテグラーゼ-Cas媒介性組み込みの有効性及び忠実度。
インテグラーゼ-Cas媒介性遺伝子送達は、哺乳動物のゲノムDNAへの大型DNA配列の配列特異的な組み込みを誘導する。インテグラーゼ-Casは、培養細胞中のヒトAAVS1及びマウスROSA26ゲノムDNAに特異的なCRISPRガイドRNAを使用して、ヒトα-骨格アクチン(HSA)プロモーターの制御下で、ヒトジストロフィン遺伝子をセーフハーバー位置に送達するために使用される。ジストロフィンの正確な標的化を、PCRベースの遺伝子型同定を使用して評価する。
【0297】
インテグラーゼ-Cas媒介性ジストロフィン遺伝子治療は、デュシェンヌ型筋ジストロフィーのマウスモデルの筋機能を回復させる。
ヒトジストロフィンのInscritpr媒介性送達の有効性を、筋ジストロフィーに最も一般的に使用されているマウスモデルであるMDXマウス系統で判定する。全身送達後、ジストロフィン発現のレベルを、2ヶ月、4ヶ月、及び6ヶ月の時間経過にわたり、抗ジストロフィン抗体を使用して、四肢骨格筋、心臓及び横隔膜で定量化及び測定する。DMD疾患の病因の軽減を、血清クレアチンキナーゼ(CK)(骨格筋損傷のマーカー及びDMD患者の診断マーカー)のレベル、握力、ならびに四肢骨格筋、心臓及び横隔膜の組織学的分析を定量化することにより評価する。
【0298】
遺伝子発現の組織学的分析。
8週齢で、左後肢四頭筋、心臓、及び横隔膜を回収し、重量を測定し、PBS中の4%ホルムアルデヒドで固定して、パラフィン組織学的検査用の日常的な方法を使用して処理する。HSA-ジストロフィン/GFP融合タンパク質を発現する筋線維のパーセンテージをDMDMdx/y及びWTマウスの両方で抗GFP抗体を使用して実施する。右後肢筋を、後続のPCRベースの遺伝子型同定、RT-PCRによる遺伝子発現、及びウエスタンブロットによるタンパク質発現解析のために、液体窒素で急速冷凍する。
【0299】
インテグラーゼ-Cas媒介性送達は、デュシェンヌ型筋ジストロフィーのマウスモデルにおける疾患の病因を軽減する。
横断組織切片のヘマトキシリン・エオジン(H&E)染色、フォン・コッサ染色及びマッソントリクローム染色を使用して、中心核、石灰化及び筋内膜線維症を含有する筋線維をそれぞれ同定する。定量的比較と統計分析を使用して、中心核を伴う筋線維の比率を比較するか、または四頭筋肢筋(quadriceps limb muscle)中で染色された石灰化または線維症の領域を比較する。各遺伝子型の3匹の異なるマウスから、各筋肉について少なくとも3つの異なる平面断面を比較する。マウスが重症度が低い表現型を示すインテグラーゼ-Casで処置したDmdmdx/yは、中心核を伴う筋線維の比率が低下し、線維症及び石灰化の総面積が減少している。
【0300】
血清クレアチンキナーゼ(CK)測定。
血清CKは、骨格筋損傷の相関マーカーであり、DMD患者の診断マーカーである。CK測定を、非致死性手順を使用して、前述の動物コホートで2週間、4週間、6週間及び8週間で実施する。簡潔に述べると、血液を眼窩周囲の血管叢から直接マイクロヘマトクリットチューブに回収し、室温で30分間凝固させた後、1,700×gで10分間遠心分離する。Dmdmdx/yKOよりも重症度が低い表現型を示す処置マウスは、血清CKレベルが大幅に低下している。
【0301】
実施例3:ゲノム編集-指向性非相同DNA組み込み
ここに示されるデータは、哺乳動物ゲノムの効率的な編集を可能にするために最適化されたインテグラーゼ-Casを示している。
【0302】
最適化された編集
IN媒介性組み込みを最適化するために、インテグラーゼの触媒活性、溶解性、または宿主細胞の補因子との相互作用を増強させるアミノ酸突然変異が、編集を向上させるかどうかを判定する。さらに、レトロウイルスの7つのユニークなクラスから単離されたINタンパク質の効率及び忠実度を評価する。
【0303】
哺乳動物細胞中のIN-dCas9媒介性組み込みを定量化及び特性決定するために、Escherichia coli中で発現すると濃青色のコロニーを生成するサンゴAcropora millepora(amilCP)由来の青色色素タンパク質を利用する、プラスミドベースのレポーター系を使用する。amilCPオープンリーディングフレームの破壊により青色タンパク質の発現が消失し、これを、標的化忠実度の直接的な読み取り値として使用することができる。さらに、HIV由来のU3及びU5レトロウイルス末端配列に隣接する、クロラムフェニコール抗生物質耐性遺伝子をコードするドナー鋳型を作製した。このドナー鋳型の組み込みはクロラムフェニコールに対する耐性を付与し、これを利用して、インテグラーゼ-Cas媒介性のDNA組み込みをモニタリングすることができる。このレポーターアッセイでは、IN-dCas9融合タンパク質、amilCPを標的とするsgRNA及びドナー鋳型を含有する発現プラスミドを、細菌amilCPレポーターとともに哺乳動物のCOS-7細胞にコトランスフェクトする。48時間後、カラム精製を使用して全プラスミドDNAを回収し、E.coliに形質転換させる。IN-dCas9は、クロラムフェニコールをコードする鋳型DNAをamilCPレポータープラスミドに組み込むのに十分であり、それにより、amilCPの発現を妨害し、クロラムフェニコールに対する耐性を付与する。個々の組み込み事象の定量化及びクローン配列解析を可能とするこの迅速なアッセイを、編集を最適化するために使用する。
【0304】
インテグラーゼ活性の増強:IN内の大部分の突然変異はその活性を消失させるが、過去数十年の研究により、IN触媒活性(D116N)、二量体化(E85F)、溶解性(F185K/C280S)、及び宿主細胞タンパク質との相互作用(K71R)を増加させることによりINの組み込みを向上させる、いくつかの突然変異が同定されている。活性化IN突然変異を含有するIN-dCas9融合タンパク質を、プラスミドベースのレポーターアッセイを使用して、この融合タンパク質が活性を増強させるかどうかを判定するために使用する。
【0305】
宿主細胞タンパク質によるインテグラーゼ活性の修飾:INはin vitroでプロウイルスDNAを組み込むために必要かつ十分な唯一のタンパク質であるが、宿主細胞タンパク質との相互作用は、IN媒介性のDNA組み込み18を大幅に変化させ得る。特に、LEDGF/p75、VBP1及びSNF5は、IN媒介性組み込みを促進することができる、特性が十分に明らかにされているHIV IN相互作用タンパク質である。これらの因子をプラスミドレポーターアッセイを使用して発現させ、これらがドナー鋳型の組み込みを促進するかどうかを判定する。
【0306】
様々なレトロウイルスクラス由来のインテグラーゼを比較及び対比する:レトロウイルスクラス由来のすべてのIN酵素には保存されたコア触媒D,D(35)E残基が含まれているが、それらは、ゲノムサイズ、複雑性、U3及びU5末端配列、ならびにDNA結合効率について大幅に異なっている。様々なレトロウイルスINの編集効率を判定するために、アルファ(RSV)、ベータ(MMTV)、ガンマ(MoLV)、デルタ(BLV)、イプシロン(WDSV)及びスプーマウイルス(HFV)を含む各レトロウイルスクラスからのモデル例を、dCas9への融合体としてクローニングした。それぞれのU3及びU5末端モチーフを含有するドナープラスミドを作製する。タンパク質発現をウエスタンブロットによって検証し、核局在化を、dCas9のC末端に位置する3xFLAGエピトープを検出するためのFLAG抗体を使用した免疫細胞化学を使用して検証する。
【0307】
哺乳動物のゲノムDNAの編集効率
哺乳動物のゲノムDNAの編集の有効性及び忠実度を、安定CMV駆動型GFPレポーター細胞株を使用して判定し、RFP及びピューロマイシン選択カセットを含有するドナー鋳型を作製する。組み込み事象を定量化しクローン的に特性決定して、新規ゲノム編集技術としての本方法の有効性及び忠実度を判定する。
【0308】
細胞ベースのレポーターアッセイの作製:この遺伝子座での組み込み事象を定量化するために、IRES-RFP-2A-ピューロマイシンカセットとGFPコード配列を標的とするガイドRNAとを含有するドナー鋳型を使用する。ドナーカセットをCMV-GFP遺伝子座に挿入すると、RFP発現がGFP発現に取って代わり、抗生物質ピューロマイシンに対する耐性がもたらされる。FACSソーティングを使用してトランスフェクション及び48時間の培養後にRFP+/GFP-(標的化組み込み)である細胞のパーセンテージを測定し、Inscripr編集の効率及び忠実度を定量化する。クローン組み込み事象を選択するためにピューロマイシンを使用する。これは、PCRプライマーを使用してGFP遺伝子座とドナーカセットとの間の配列を増幅することを特徴とする。
【0309】
複数の内在性遺伝子座での編集:インテグラーゼ-Casを、CMV-GFP遺伝子座及びHEK293ヒト細胞株中のヒトEF1-アルファ遺伝子座の3’UTRに特異的なsgRNAを使用して、RFP-2Aピューロマイシンカセットをノックインするために使用する。3’UTRを標的とすると、正常な遺伝子発現を妨害せずにIRES依存性ベクターを発現させることができる。ピューロマイシンを使用したクローン選択後、PCR遺伝子型同定を使用して、両方の遺伝子座にドナー鋳型を組み込んだクローンのパーセンテージを測定する。
【0310】
実施例4:Incriptrの作製及び特性決定
機能的なIN-dCas9融合タンパク質の作製。
哺乳動物細胞中で使用するための機能的なIN-dCas9融合タンパク質を作製するために、完全長レトロウイルスINをHIV-1(gag-polポリタンパク質のアミノ酸1148~1435)から、可撓性のある15アミノ酸のリンカー[(GGGGS)3)]で分離させて、ヒトコドン最適化dCas9のN末端にクローニングした(
図6)。SV40核局在化シグナル(NLS)をINのN末端に含め、これは、dCas9上のC末端SV40 NLSとともに、IN-dCas9融合タンパク質の核局在化をもたらした。C末端非特異的DNA結合ドメインを欠くIN-dCas9融合体を作製するために、dCas9へのN末端融合体としてINのN末端及び触媒コアドメイン(a.a.1148~1369)のみを含有する追加の構築物を作製した(
図6)。
【0311】
プラスミドDNAの編集をモニタリングするためのレポーターの作製。
哺乳動物細胞中のIN-dCas9媒介性組み込みを定量化及び特性決定するために、Escherichia coli中で発現すると濃青色のコロニーを生成するサンゴAcropora millepora(amilCP)由来の青色色素タンパク質を利用する、プラスミドベースのレポーターアッセイを設計した(
図6)。amilCPオープンリーディングフレームの破壊により青色タンパク質の発現が消失し、これを、標的化忠実度の直接的な読み取り値として、及びインテグラーゼ-Cas媒介性組み込みの標的DNAとして使用することができる。標的DNAでのN末端dCas9融合タンパク質の効率的な二量体化を促進するために、単一ガイドRNA(sgRNA)標的配列を、16bpのスペーサー配列によって分離して「PAM外部(PAM-out)」方向で設計した(
図4)。
【0312】
インテグラーゼ-Cas媒介性組み込みのためのウイルス末端ドナー配列の作製。
インテグラーゼ-Cas媒介性組み込み用のドナー配列を作製するために使用することができる標的化ベクターを構築するために、U3 HIV末端及びU5 HIV末端を含む30塩基対をpCRIIにサブクローニングした(
図6)。ドナー配列のサブクローニングを容易にするために、9つのユニークな制限酵素を含有するマルチクローニングサイトをU3とU5の間に含めた。U3及びU5がそれらの末端で同じ3ヌクレオチド(それぞれACTとAGT)を共有しているため、プラスミド骨格から平滑末端ドナー配列を作製するために使用できるScaI制限部位を両端に作製するために、追加の半部位(half-site)配列を含めた(
図6)。さらに、隣接するIIS型制限酵素部位をFauI用に含め、FauIは、2つの5’ヌクレオチドオーバーハングを切断して残し、露出したCAジヌクレオチドを含むプレプロセシングされたウイルス3’末端を模倣する(
図6)。ゲル精製及びプラスミド骨格からのFauI消化鋳型の分離を補助するために、多部位指向性突然変異誘発を使用して、pCR IIプラスミド骨格に存在する6つのFauI部位を除去した。
【0313】
プロトコル:トランスフェクション用のINsrtドナー鋳型の調製
1)INsrtプラスミドDNAの制限消化を設定する
2)制限消化反応
3)骨格DNAからドナー鋳型をゲル精製する
4)トランスフェクション用にドナーDNAを溶出させる
【0314】
哺乳動物細胞におけるプラスミドDNAへのドナー配列のインテグラーゼ-Cas媒介性組み込み。
協調的IN-dCas9媒介性組み込みの陽性選択を可能にするために、発現プラスミドのレポーターには存在しないクロラムフェニコール耐性遺伝子(CAT)を保有するINsrtドナーベクターを設計した(
図7)。Plautia stali腸管ウイルス(PSIV)由来のIGR IRESをCAT遺伝子の前に含めた。このIGR IRESは、原核生物細胞及び真核生物細胞の両方で翻訳を開始させて、複数の組み込み部位での翻訳を補助することができる。クロラムフェニコール耐性遺伝子とウイルス末端とを含有する鋳型を、ScaI(平滑末端)またはFauI(プロセシングされた末端)のいずれかを使用して消化し、プラスミド骨格DNAからゲル精製した。INsrt鋳型、amilCP配列を標的とするIN-dCas9ベクターのコトランスフェクションを、Cos7細胞にコトランスフェクトした(
図7)。48時間後、カラム精製を使用して全プラスミドDNAを回収し、E.coliに形質転換させた。クロラムフェニコール耐性クローンは、全長IN及びINDC-dCas9融合タンパク質の両方で観察された。プラスミドの配列決定により、IG3-CATプラスミド配列がamilCPレポーターに組み込まれたことが明らかとなった。興味深いことに、ウイルスDNA末端の3’プレプロセシングを模倣するFauI消化ドナー配列の使用により、ScaI消化平滑末端鋳型と比較して2倍のクロラムフェニコール耐性クローンが生じた。インテグラーゼ-Cas媒介性組み込みは、組み込み部位に隣接する宿主DNAの5塩基対のリピートを含む、HIV INレンチウイルス組み込みの特徴を含んでいた。興味深いことに、組み込み部位は2つのsgRNA標的部位間には生じなかったが、amilCP標的配列の両側で生じた。
【0315】
哺乳動物細胞における、平滑末端(ScaI切断)または3’プロセシング模倣(FauI切断)末端のいずれかを有するInsrt IGR-CATドナー鋳型のpCRII-amilCPレポーターへの組み込み。興味深いことに、dCas9への融合体としてのC末端非特異的DNA結合ドメインの欠失は、インテグラーゼ-Cas媒介性組み込みを阻害しない。3’プロセシングを模倣する末端を使用すると、CAT耐性クローンの約2倍の増加が示される(
図29B)。二量体化阻害突然変異(E85G及びE85F)は、IGR-CATドナー鋳型のamilCPへの二重ガイドRNA標的化組み込みを使用したインテグラーゼ-Cas媒介性組み込みを妨害しない。しかしながら、IN E87G突然変異を、対形成した標的化sgRNAによって回復させることはできない。興味深いことに、dCas9へのタンデムINΔCd融合体(tdINΔC-dCas9)は、約2倍向上した組み込みを示す(
図29C)。
【0316】
プロトコル:哺乳動物細胞におけるプラスミドDNAへのドナー配列のインテグラーゼ-Cas媒介性組み込み。
1)マルチシストロン性sgRNA及びIN-dCas9プラスミド、細菌amilCPレポータープラスミド及びINsrtドナー鋳型を、哺乳動物(例えば、Cos7)細胞にコトランスフェクトする。
a.細胞をプレーティングする直前にトランスフェクション反応を設定する。
b.細胞を回収し、プレーティングし、トランスフェクトする。
2)トランスフェクトした細胞からプラスミドDNAを回収する。
3)回収したプラスミドDNAを化学的にコンピテントなE.coliに形質転換する。
【0317】
ゲノムDNAへのインテグラーゼ-Cas媒介性組み込みのためのCMV-GFP安定哺乳動物細胞株の作製。
哺乳動物細胞における個々の組み込み事象の忠実度を定量化及び特性決定するために使用可能な安定GFPレポーター細胞株を作製した(
図3)。ヒトCMVプロモーターの制御下にあるGFPをコードするプラスミド(pcDNA3.1-GFP)を線状化し、Cos7細胞にトランスフェクトして、G418及び段階希釈を使用して安定クローンを選択した。この人工遺伝子座は、必須宿主遺伝子を標的とする場合にさもなければ起こり得る正常細胞の生存率を低下させずに、破壊の標的となり得る強力な遺伝子発現を可能とする。
【0318】
哺乳動物のゲノムDNAへのドナー配列のインテグラーゼ-Cas媒介性組み込み。
CMV-GFP遺伝子座での組み込み事象を定量化するために、IGR-mCherry-2A-ピューロマイシン-pAカセットとGFPコード配列を標的とする対形成したガイドRNAとを含有するドナー鋳型を構築した(
図3)。ドナーカセットをCMV-GFP遺伝子座へ組み込むと、mCherryの発現が駆動され、GFPの発現が妨害されて、抗生物質ピューロマイシンに対する耐性がもたらされる。トランスフェクション及び48時間の培養後、mCherry陽性細胞が観察され、その一部には、弱いが検出可能なレベルのGFP発現が依然として含まれていた(
図3)。
【0319】
内在性遺伝子座でのドナー配列のインテグラーゼ-Cas媒介性組み込み。
標的化戦略を設計し、ヒトEF1-アルファ遺伝子座の3’UTRに特異的なガイドRNAを選択して、IGR-mCherry-2A-ピューロマイシン-pAカセットをヒトHEK293細胞株にノックインした(
図8)。EF1-アルファ発現のオープンリーディングフレームを破壊することなくIGR-mCherryカセットを発現させるため、3’UTRを標的とした。トランスフェクション及び48時間の培養後、培養液中にmCherry陽性細胞が観察された(
図8)。
【0320】
プロトコル:哺乳動物のゲノムDNAへのドナー配列のインテグラーゼ-Cas媒介性組み込み
1)Fugene6またはLipofectamine2000を使用して、sgRNAをコードするプラスミド、IN-dCas9をコードするプラスミド及びINsrtドナー鋳型をコードするプラスミドを、1:1:1で哺乳動物細胞(COS7、HEK293など)にコトランスフェクトする。
a.細胞を回収し、プレーティングし、トランスフェクトする。
2)組み込まれた配列の抗生物質選択
a.抗生物質選択を含有する10mlの培地で細胞を洗浄し、この培地にプレーティングする。
b.細胞を培養後、クローンを作製する。
【0321】
指向性編集。
DNA配列のIN媒介性組み込みは、標的DNA配列のいずれの方向にも生じ得る。Cas及びINレトロウイルスクラスのタンパク質の様々な組み合わせの利用により、指向性編集を促進する能力がもたらされる。例えば、触媒的に死んだLbCpf1(LbCpf1)に融合したBIV(ウシ免疫不全ウイルスまたは他のHIV関連ウイルス)由来のINの融合体は、Cpf1特異的ガイドRNAを利用した特定の標的配列への結合を可能にする。HIVとBIVの両方の末端配列を含有するドナー配列の利用により、標的DNAとの単一方向への結合が固定される(
図9)。
【0322】
Floxed対立遺伝子の作製のための多重ゲノム編集。
目的遺伝子周囲のLoxPに隣接する(Floxed)配列の導入により、Cre媒介性組換え及び条件付き突然変異誘発が可能となる。CRISPR-Cas9を使用してFloxed対立遺伝子を作製する現行の方法は、非効率的である。最も広く利用されているアプローチは、隣接する標的配列でのDNA切断を誘導するための2本のガイドRNA、及びLoxP配列を含有するssDNA鋳型を挿入するための相同組換え修復を使用することである。しかしながら、二重sgRNAを使用して切断を誘導する場合、最も好ましい反応は、介在配列が欠失し、その結果全体的な遺伝子欠失が生じることである。宿主DNAとのIN媒介性の鎖導入で介在配列の効率的な欠失が行えない場合、インテグラーゼ-Cas媒介性遺伝子挿入の使用は、DNA配列のタンデム挿入に、より効率的な代替アプローチを提供する。IN媒介性組み込みはいずれの方向でも生じ得るため、反転したLoxP配列を含有する配列の組み込みにより、LoxPに隣接する配列の組換えが可能となる(
図10)。
【0323】
実施例5:Ty1 NLS様配列の同定及び活性
酵母Ty1レトロトランスポゾン由来のインテグラーゼ酵素は、比較的大型のリンカー配列によって分離されたタンデムKKRモチーフで構成される非古典的な双節型核局在化シグナルを含有する。酵母における先行研究により、核局在化及びTy1転位のためにこれらの基本的なモチーフが必要であることが実証されている(Kenna et al.,1998,Mol Cell Biol 18,1115-1124、Moore et al.,1998,Mol Cell Biol 18,1105-1114)。Ty1転位はTy1 NLSの存在に完全に依存しており、興味深いことに、古典的なNLSは、転位に必要なTy1 NLS活性を再現するには不十分である。興味深いことに、別の酵母タンパク質がこのタンデムKKRモチーフを共有しており、これらのタンパク質の多くが核に局在していることを考慮すると、これらはNLSとしての機能を果たす可能性がある(Kenna et al.,1998,Mol Cell Biol 18,1115-1124)。
【0324】
実施例1に示されるように、酵母Ty1 NLSは、哺乳動物細胞中でCasタンパク質及びCas融合タンパク質の強力な核局在化をもたらす。この活性がTy1 NLSの固有の特性であるかどうかを判断するために、Ty2インテグラーゼ及び他の酵母Ty1 NLS様モチーフに由来する近縁のNLSが、インテグラーゼ-dCas9融合タンパク質(INΔC-Cas9)を哺乳動物細胞中の核に局在させるのに十分であるかどうかを試験した。興味深いことに、Ty1 NLSに高度に保存されているTy2 NLSは、核局在化についてTy1 NLSと同等に効率的であった(
図11)。Ty1/Ty2 NLS配列とは異なる、酵母中で同定された3つの異なるTy1 NLS様配列の融合体(Kenna et al.,1998)は、強力なNLS活性を示したか(MAK11)、または明らかなNLS活性を示さなかったか(INO4及びSTH1)のいずれかであった。MAK11配列は酵母核タンパク質に由来し、またタンパク質のC末端に存在する。これをさらにスクリーニングしたところ、この配列が実際にNLSとして機能していることが示唆された。モチーフKKR
N20-40KKRを使用するSWISS-PROT Protein Sequence Databank内のすべてのタンパク質により、多種多様な種にわたり、多数の潜在的なTy1 NLS様配列が同定された(配列番号275~887)。これらのデータは、他のTy1 NLS様配列が強力なNLS活性を有する可能性があり、分裂真核細胞及び非分裂真核細胞におけるタンパク質(Cas及びCas融合タンパク質を含む)の局在化に有用である可能性があることを示している。
【0325】
実施例6:Ty1 NLSを用いた向上したCRISPR-Cas9 DNA編集
CRISPR-Cas DNA切断系は細菌に由来し、Casタンパク質は大型であり、かつ内在性の哺乳動物核局在化シグナル(NLS)を欠いているため、哺乳動物細胞中でのそれらの効率的な核局在化が妨げられている。これまで、哺乳動物細胞中のCRISPR-Cas9による効率的な核局在化及びDNAの編集には、2つの古典的な核局在化シグナル(N末端SV40及びC末端ヌクレオプラスミン(NPM)双節型NLS)の付加が必要であることが示されてきた(Cong et al.,2013,Science 339,819-823)。哺乳動物細胞中でCas融合タンパク質を局在化させるための、非古典的な酵母レトロトランスポゾンTy1 NLSの強力な性質(実施例1)を理由として、Ty1 NLSが哺乳動物細胞中で従来のCRISPR-Cas9の編集効率を向上させるようにも機能し得るかどうかを試験した。
【0326】
Ty1がCRISPR-Cas9編集を向上させるかどうかを判断するために、既存のCRISPR-Cas9発現プラスミド(px330)を、C末端のNPM NLSを非古典的なTy1 NLS(px330-Ty1)に置き換えることにより改変した(
図12A)。次に、標的配列(ts)の下流でアウトオブフレームのルシフェラーゼコード配列をコードする、フレームシフト応答性ルシフェラーゼレポーターを作製した(
図12B)。このレポーターアッセイでは、標的配列付近の切断及び細胞の非相同末端結合(NHEJ)経路による不完全な修復により、ルシフェラーゼコード配列を再構成してルシフェラーゼ発現を生じさせる可能性のあるヌクレオチドの挿入または欠失が誘発され得る。
【0327】
NPM NLSを含有するCas9と20ヌクレオチドの標的配列に特異的な単一ガイドRNAとをコードするベクターとのルシフェラーゼレポーターの共発現は、非標的化ガイドRNAと比較して、バックグラウンドに対する約20倍のルシフェラーゼ活性の増加をもたらした(
図12C)。特に、Ty1 NLSを含有するCas9の発現は、NPM NLSを含有するCas9と比較して、COS-7細胞中のレポーター活性を有意に(約44%)増強させた(
図12C)。
【0328】
実施例7:編集のためのゲノム標的化戦略
インテグラーゼ-DNA結合融合タンパク質を使用したDNAドナー配列の標的化組み込みは、所望の結果に応じて、ゲノム内の様々な場所を標的とすることができる。例えば、遺伝子発現カセット(例えば、プロモーター、遺伝子配列及び転写ターミネーター)からなる治療用DNAドナー配列は、隣接遺伝子の発現に影響を及ぼすことなく治療遺伝子を発現させることができる、「セーフハーバー」位置を標的とすることができる(ヒトゲノムにおけるセーフハーバー部位の概説及びリストについては、Pellenz et al.,2019,Hum Gene Ther 30,814-828を参照されたい)。これらには、隣接遺伝子から離れた遺伝子間領域、例えばH11、または「非必須」遺伝子、例えばCCR5、hROSA26もしくはAAVS1内が含まれ得る(
図13A及び
図13B)。
【0329】
疾患を引き起こす遺伝子突然変異の発現を元に戻すために、治療遺伝子配列の内在性疾患遺伝子座への標的化組み込みが有利である可能性があり、その理由としては、この遺伝子座がすでに欠損しており、この遺伝子座の空間的及び時間的発現が内在性の調節制御下にあるためである。1回の反復で、スプライスアクセプターを含有する治療遺伝子をコードするDNAドナー配列を内在性遺伝子座の第1イントロンに組み込むことができ、これにより、スプライシングは、1)導入された遺伝子配列を発現させ、かつ2)変異配列の下流の発現を阻止する(組み込まれたポリ(A)配列またはLTR配列からの終止による)(
図13C)。これが下流のイントロンを標的とする場合、より小さなDNAドナー配列を送達または発現させることができる(
図13D)。
【0330】
遺伝子の3’非翻訳領域(3’UTR)へのIRES配列を含有するDNAドナー配列の標的化挿入は、このアプローチが標的遺伝子座と同じ空間的及び時間的発現での発現を可能にし、標的遺伝子座を破壊する可能性が低いという点で有益であり得る(
図13E)。
【0331】
実施例8:CRISPR-CASを使用した哺乳動物ゲノムへの標的化レンチウイルス組み込み
ここに示されるデータは、哺乳動物ゲノムへのレンチウイルスドナー配列の送達及び標的化組み込みのための異なる3つのアプローチを示している。
【0332】
レンチウイルスの生活環
レンチウイルスは、それらのプロウイルスゲノムの永続的な二本鎖DNA(dsDNA)コピーを宿主細胞DNAに組み込む、一本鎖RNAウイルスである(
図14)。レンチウイルスゲノムは、ウイルス遺伝子の転写を制御し、プロウイルスゲノムの組み込みに必要な短い(約20塩基対)配列モチーフをU3末端及びU5末端に含有する、ロングターミナルリピート(LTR)配列に隣接している。ウイルス感染に続いて、レンチウイルスRNAゲノムは、ウイルスにコードされた逆転写酵素(RT)により平滑末端dsDNAとしてコピーされ、インテグラーゼ(IN)により宿主ゲノムに挿入される。INは、DNAに非特異的に結合するC末端ドメイン(CTD)を含む、IN活性に不可欠な3つの機能ドメインからなる。レトロウイルスDNAのIN媒介性挿入は、DNA標的配列特異性をほとんど伴わずに生じ、活性遺伝子座へ組み込むことができるが、これは、正常遺伝子機能を破壊する可能性があり、ヒトにおいて疾患を引き起こす可能性がある。このことにより、大きな配列搭載容量という利点にもかかわらず、遺伝子治療のためのレンチウイルスベクターの有用性が制限されている。
【0333】
ゲノム編集
CRISPR-Cas9は、短い単一ガイドRNAを利用してDNAを認識しそれに結合することにより、プログラム可能なDNA標的化を可能にする。触媒的に不活性なCas9(dCas9)は、DNAを標的とする能力を保持しており、近年、ゲノムの照合及び調節用の多種多様な用途のためのプログラム可能なDNA結合プラットフォームとして再利用されている。実施例1に示したように、レンチウイルスインテグラーゼのdCas9への融合は、哺乳動物細胞中でCRISPRガイドRNAを使用して、短いウイルス末端を含有するドナーDNA配列を標的配列に挿入するのに十分である(
図15)。哺乳動物細胞中のインテグラーゼ-Cas媒介性組み込みをモニタリングするために、IGR IRES配列とそれに続くmCherry-2a-ピューロマイシン遺伝子及びSV40ポリアデニル化配列を含有するドナーベクターを作製した(
図15)。COS-7細胞中の安定したヒトCMV-eGFP安定細胞株を標的とするsgRNAを設計した(
図15C及び15D)。hCMV-eGFPの安定した導入遺伝子は、強力に発現しているが必須ではない発現遺伝子座での編集を判定するために使用することができる異種標的配列をもたらした。ドナーmCherry-2a-puro鋳型を精製し、sgRNA及びIN-dCas9とともにGFP安定細胞にコトランスフェクトし、48時間培養した。48時間後、mCherry陽性細胞が培養液中に見られ、GFP陽性シグナルに取って代わった(
図15E)。編集成分(インテグラーゼ-CRISPR-Cas9融合体)をレンチウイルス粒子に導入することにより、標的化され容易にプログラム可能な宿主DNAへのレンチウイルスゲノムの組み込みが可能となり、これにより、レンチウイルス遺伝子治療の主要な制限(すなわち、非特異的なレンチウイルスの組み込み)が取り除かれる。このアプローチは、基礎研究及び治療用途の両方に有用である。
【0334】
レンチウイルス遺伝子送達系
レンチウイルスベクターは、研究用途のための強力な遺伝子送達ツールとして適合されている(
図16)。レンチウイルスの構造タンパク質及び酵素タンパク質は、大型ポリタンパク質(gag-pol及びエンベロープ)として転写及び翻訳される(
図16A)。出芽ウイルス粒子に導入されると、ポリタンパク質はウイルスプロテアーゼによって個々のタンパク質にプロセシングされる。レンチウイルスベクター遺伝子発現系では、これらのポリタンパク質はウイルスゲノムから取り除かれ、別々の哺乳動物発現プラスミドを使用して発現される(
図16B)。次に、目的のドナーDNA配列をウイルスポリタンパク質の代わりに、隣接するLTR配列の間にクローニングすることができる。哺乳動物細胞におけるこれらのベクターのコトランスフェクションにより、コードされたドナー配列を送達及び組み込むことができるレンチウイルス粒子が形成されるが、しかしながら、後続のウイルス増殖に必要なインテグラーゼ及び他のウイルスタンパク質についてのコード情報は必要とされない(
図16B)。レンチウイルス粒子は、ウイルスタンパク質(例えば、インテグラーゼ及び逆転写酵素)ならびにdsDNAドナー配列の両方を送達するための天然のベクターであり、哺乳動物細胞へのインテグラーゼ媒介性の挿入に要する必要なウイルス末端配列を含有する(
図16C)。
【0335】
インテグラーゼ-dCas9融合タンパク質のレンチウイルス粒子へのパッケージング。
既存のレンチウイルス送達系を改変して、哺乳動物細胞におけるゲノム編集のための、標的化レンチウイルスドナー鋳型の組み込みを目的とした編集成分を導入することができる(
図17~
図20)。ここでは、哺乳動物ゲノムへのレンチウイルスドナー配列の送達及び標的化組み込みのための異なる3つのアプローチを記載する。
【0336】
第1のアプローチは、gag-polポリタンパク質をコードするレンチウイルスパッケージングプラスミド(例えば、psPax2)内に、インテグラーゼ(またはそのC末端非特異的DNA結合ドメインを欠くインテグラーゼ(INΔC))への融合体としてdCas9を直接導入することである(
図17A)。このアプローチでは、修飾gag-polポリタンパク質を他のウイルス成分とともにポリタンパク質として翻訳し、ガイドRNAとともに搭載してレンチウイルス粒子にパッケージングする(
図4B)。インテグラーゼ-dCas9融合タンパク質は、プロテアーゼ切断(PR)に必要な配列を保持しており、これにより、粒子成熟中にgag-polポリタンパク質から正常に切断される。哺乳動物細胞の形質導入により、IN-dCas9融合タンパク質、sgRNA及びレンチウイルスドナー配列を含むウイルスタンパク質が送達される。逆転写酵素によるssRNAゲノムの逆転写によって正確なウイルス末端配列(U3及びU5)を含有するdsDNA配列が生成され、次いで、この配列はIN-dCas9融合タンパク質により哺乳動物ゲノムに組み込まれる。
【0337】
第2のアプローチは、インテグラーゼ-dCas9とHIVウイルスタンパク質R(VPR)のN末端及びC末端融合体を生成することである(
図18A)。VPRは、アクセサリータンパク質としてレンチウイルス粒子に効率的にパッケージングされており、異種タンパク質(例えば、GFP)のレンチウイルス粒子へのパッケージングに使用されている。ウイルスプロテアーゼ切断配列がVPRとIN-dCas9融合タンパク質との間に含まれており、これにより、成熟後にIN-dCas9がVPRから遊離する(
図18A)。パッケージング細胞とレンチウイルス成分とのコトランスフェクションにより、VPR-IN-dCas9タンパク質及びsgRNAを含有するウイルス粒子が生成される。ウイルス粒子形成に必要なパッケージングプラスミド(例えば、psPax2)は、インテグラーゼ内にその触媒活性を阻害する突然変異を含んでおり、それにより非媒介性組み込みを阻害する(
図18B)。ウイルスの形質導入時に、インテグラーゼ-dCas9タンパク質が送達され、このタンパク質がレンチウイルスドナー配列の組み込みを媒介する(
図18C)。IN-dCas9融合体及びsgRNAをリボタンパク質として送達する利点は、これが標的細胞中で一過性にのみ発現することである。
【0338】
第3の方法は、インテグラーゼ-dCas9融合タンパク質及びsgRNA発現カセットをレンチウイルス導入プラスミドまたは他のウイルスベクター(AAVなど)に直接導入することである(
図19A)。IN-dCas9融合タンパク質とsgRNAとを含有する導入プラスミドを、レンチウイルス粒子を生成するのに必要なパッケージングプラスミド及びエンベローププラスミドとともにコトランスフェクトする。レンチウイルスを使用する場合、パッケージングプラスミドには、非特異的組み込みを阻害するための触媒性突然変異をインテグラーゼ内に含める(
図19B)。哺乳動物細胞を形質導入すると、IN-dCas9融合タンパク質及びsgRNAの発現は、標的化組み込みのためにそれ自身のウイルスドナーベクターを標的とすること(自己組み込み)ができる成分を生成する(
図19C)。この方法は、標的遺伝子の破壊のために、または遺伝子ドライブとして使用される。あるいは、ドナー配列をコードする追加のレンチウイルス粒子との共形質導入は、組み込まれたドナー鋳型として機能する(
図19)。このアプローチにおいて、自身のウイルスをコードする配列の自己組み込みの防止は、異なるレトロウイルス科のメンバーに由来するインテグラーゼ酵素及びそれらの対応する導入プラスミドを使用することにより行われる。例えば、FIV IN-dCas9融合タンパク質をコードするHIVレンチウイルス粒子を利用して、FIVレンチウイルス粒子内にコードされたFIVドナー鋳型を組み込む(
図20)。
【0339】
単一遺伝子座であり、構成的に活性な遍在性ROSA26
mGFP/+レポーターマウス系統の作製
ROSA26mT/mGレポーターマウス系統(Jackson Labs、ストック番号007576)には、floxed膜局在tdTO(mT)蛍光レポーターカセットが含まれており、これをCREリコンビナーゼを用いて組換えると、mTレポーターが除去され、膜局在eGFP(mG)レポーターが発現する。単一遺伝子座を生成するために、in vivo GFPレポーター系統であるROSA26mT/mGマウスを汎用CAG-CREリコンビナーゼマウスと交配させ、構成的かつ遍在的に発現するROSA26mGレポーターマウスを作製した。ヘテロ接合ROSA26
mG/+マウスからのマウス胚性線維芽細胞(MEF)の単離により、培養中のすべての細胞における強力な膜GFP発現が明らかとなった(
図21)。同様の戦略を利用して、ROSA26nT/nGマウス系統(Jackson Labs、ストック番号023035)の組換えにより、遍在的で構成的に活性な核GFPレポーターを作製する。
【0340】
ROSA-mGFP遺伝子座への標的化組み込みのためのレンチウイルス粒子への成分のパッケージング。
ROSA26mG/+MEF中のGFPコード配列へのIRES-tdTO配列の標的化組み込みのために、パッケージング細胞株(Lenti-X 293T、Clontech)でレンチウイルス粒子を作製した。レンチウイルス粒子を、第2世代SINレンチウイルスLTR間のIRES-tdTO蛍光レポーターをコードするレンチウイルス導入プラスミド(Lenti-IRES-tdTO)、汎親和性エンベロープタンパク質(VSV-G)をコードする発現ベクター、GFPを標的とするガイドRNAの反転させた対をコードする発現プラスミド、及びpsPax2パッキングプラスミド中のGag-Polレンチウイルスポリタンパク質の状態でINΔC-dCas9融合体をコードするパッキングプラスミド(INΔC-dCas9-psPax2)のコトランスフェクションにより作製した。レンチウイルス粒子を上清から回収し、0.45μmのPESフィルターを使用して濾過した。
【0341】
哺乳動物細胞における標的化レンチウイルス組み込み
Incriptr改変レンチウイルス粒子を使用して、培養液中のROSA26
mG/+MEFを形質導入した。2日後、IRES-tdTOレポーターをコードするレンチウイルスで形質導入したMEF中で、遍在性の赤色蛍光タンパク質の発現が検出可能であったが、GFP蛍光が保持されていた。この最初の広範な発現はレンチウイルスIRES-tdTOにコードされたウイルスRNAの翻訳による可能性が高く、これは、レンチウイルスパッケージングがパッケージングプラスミドの改変によって阻害されなかったことを示している(
図21)。従来のレンチウイルス形質導入では、ウイルスの組み込みの非存在下では、レンチウイルス導入遺伝子の発現は維持されない。注目すべきことに、形質導入の7日後、ROSA26
mG/+一次細胞において(
図21)、または前述のCMV-GFP COS-7安定細胞株を標的とした場合に(
図22)、培養液中で今回は緑色蛍光を欠くtdTO赤色蛍光細胞が検出可能であった。これらのデータは、Gag-Polレンチウイルスポリタンパク質の状態でインテグラーゼ(C末端DNA結合ドメインを欠く)を触媒的に死んだCas9に融合させることにより、哺乳動物細胞におけるレンチウイルスのパッケージング、送達及びレンチウイルスにコードされたドナー配列の標的化が可能となることを示す。さらに、これらのデータは、レンチウイルスパッケージング細胞中のガイドRNAの発現がレンチウイルス粒子への導入に十分であり、これが、dCas9との強力な相互作用によって生じ得ることを示唆している。ガイドRNAをレンチウイルス粒子に送達するための代替的アプローチは、例えば、導入プラスミドにおけるガイドRNA(複数可)の構成的発現などを通じて、標的化組み込みを向上させ得る。
【0342】
レンチウイルス粒子の標的化組み込みのための代替的DNA結合ドメイン。
このデータは、インテグラーゼの非特異的DNA結合ドメインをdCas9のプログラム可能なDNA結合ドメインに置き換えることにより、レンチウイルスにコードされたドナー配列の送達のための、dsDNAドナー鋳型の標的化組み込み、またはレンチウイルス粒子での送達を介した標的化組み込みが可能となることを示す。CRISPR-Cas系は2成分であり、標的化のためのCasタンパク質及び小さなガイドRNAの両方に依存する。場合によっては、レンチウイルス粒子を介した送達にTALENなどの単一成分DNA標的化タンパク質を利用することが有益であり得、それは、コードされたタンパク質によってのみそれらが標的化されるためである。同様のレンチウイルス産生アプローチを使用して、以前のパッケージング戦略におけるdCas9を所与の配列(例えば、eGFP及びセーフハーバー遺伝子座)を標的とするTALENに置き換えることで、ガイドRNAの送達を必要とせずにレンチウイルスのパッケージング及び標的化が可能となる(
図23)。例えば、TALENは、gag-polポリタンパク質(
図23A)、VPRなどのウイルスに導入されたタンパク質への融合体としてのIN-TALEN(
図23B)、または導入プラスミド内に送達されたIN-TALEN(
図23C)の状態のいずれかで、インテグラーゼへの融合体としてパッケージング及び送達される。
【0343】
実施例9:Ty1 NLSを用いた向上したCRISPR-Cas9 DNA編集
CRISPR-Cas DNA切断系は細菌に由来し、Casタンパク質は大型であり、かつ内在性の哺乳動物核局在化シグナル(NLS)を欠いているため、哺乳動物細胞中でのそれらの効率的な核局在化が妨げられている。
【0344】
Ty1がCRISPR-Cas9編集を向上させるかどうかを判断するために、既存のCRISPR-Cas9発現プラスミド(px330)を、C末端のNPM NLSを非古典的なTy1 NLS(px330-Ty1)に置き換えることにより改変した(
図24A)。次に、標的配列(ts)の下流でアウトオブフレームのルシフェラーゼコード配列をコードする、フレームシフト応答性ルシフェラーゼレポーターを作製した(
図24B)。このレポーターアッセイでは、標的配列付近の切断及び細胞の非相同末端結合(NHEJ)経路による不完全な修復により、ルシフェラーゼコード配列を再構成してルシフェラーゼ発現を生じさせる可能性のあるヌクレオチドの挿入または欠失が誘発され得る。
【0345】
NPM NLSを含有するCas9と20ヌクレオチドの標的配列に特異的な単一ガイドRNAとをコードするベクターとのルシフェラーゼレポーターの共発現は、非標的化ガイドRNAと比較して、バックグラウンドに対する約20倍のルシフェラーゼ活性の増加をもたらした(
図24C)。特に、Ty1 NLSを含有するCas9の発現は、NPM NLSを含有するCas9と比較して、COS-7細胞中のレポーター活性を有意に(約44%)増強させた(
図24C)。
【0346】
実施例10:インテグラーゼ-TALEN融合タンパク質による非相同DNA組み込み
転写活性化因子様エフェクターヌクレアーゼ(TALEN)は、個々のヌクレオチド標的化ドメインをタンデムに組み立てることによって構築される、十分に研究されたプログラム可能なDNA結合タンパク質である(Reyon et al.,2012)。Inscriptrについて実証された同様のアプローチでは、TALENを利用して、ドナーDNA鋳型のレトロウイルスインテグラーゼ媒介性の組み込みを誘導することができる(
図25)。TALEN-インテグラーゼ融合タンパク質を作製するために、前述のTALEN発現ベクターからTALEN標的化リピートを得てIN-TALENまたはTALEN-IN融合体のいずれかが生成されるように、哺乳動物発現ベクターを構築した。各融合タンパク質には、3xFLAGエピトープ、Ty1 NLS、及びC末端非特異的DNA結合ドメインを欠くHIVインテグラーゼ(INΔC)間のリンカー配列によって分離されたTALENリピートが導入された。場合によっては、IN突然変異を導入して、INの活性、二量体化、細胞タンパク質との相互作用、二量体化阻害剤に対する耐性、またはINΔCのタンデムコピー(tdINΔC)を変化させることができる。例えば、E85G突然変異を導入して、偏性(obligate)二量体形成を阻害することができる。
【0347】
eGFPを標的とするTALEN対は、標的化効率について以前に記載及び検証されている(Reyon et al.,2012;Addgeneより入手可能)。TALEN対(ClaI/BamHI断片)をサブクローニングして、16bp長または28bp長のスペーサーを有するeGFPを対象としたTALEN-IN融合タンパク質を作製した。
【0348】
プラスミドDNA組み込みアッセイ(
図26)を使用して、eGFPを標的とするTALEN-IN対、IGR-CAT耐性遺伝子をコードする直鎖状二本鎖DNAドナー配列、及びamilCP細菌発現レポーターのコトランスフェクションを哺乳動物のCOS-7細胞にコトランスフェクトした。トランスフェクションの2日後、編集したプラスミドを哺乳動物細胞から回収し、e.coliに形質転換して、クロラムフェニコールプレートで選択した。興味深いことに、16bp離したTALEN対は約6倍多いクロラムフェニコール耐性コロニーを生じさせたが、その一方で、28bp離したTALEN対は非標的化インテグラーゼと同様であった(
図27)。これらのデータは、TALENペアの近接性が標的化及び組み込みに重要であることを示唆しており、これは、TALEN-FokI媒介性のdsDNA切断について以前に報告された特徴である。
【0349】
【表1-1】
【表1-2】
【表1-3】
【表1-4】
【表1-5】
【表1-6】
【表1-7】
【表1-8】
【表1-9】
【表1-10】
【表1-11】
【表1-12】
【表1-13】
【表1-14】
【表1-15】
【表1-16】
【表1-17】
【表1-18】
【表1-19】
【表1-20】
【表1-21】
【表1-22】
【表1-23】
【表1-24】
【表1-25】
【表1-26】
【表1-27】
【表1-28】
【表1-29】
【表1-30】
【表1-31】
【表1-32】
【表1-33】
【0350】
本明細書で引用されるありとあらゆる特許、特許出願、及び刊行物の開示は、参照によりそれらの全体が本明細書に組み込まれる。
【0351】
本発明は、具体的な実施形態を参照して開示されてきたが、当業者によって、本発明の真の趣旨及び範囲から逸脱することなく、本発明の他の実施形態及び変形が考案されてもよいことは明らかである。添付の特許請求の範囲は、そのようなすべての実施形態及び同等の変形を含むと解釈されることを意図している。
【配列表】