IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ メタゲノミ,インコーポレイテッドの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024133476
(43)【公開日】2024-10-02
(54)【発明の名称】RUVCドメインを有する酵素
(51)【国際特許分類】
   C12N 15/09 20060101AFI20240925BHJP
   C12N 15/11 20060101ALN20240925BHJP
   C12N 15/55 20060101ALN20240925BHJP
   C12N 9/22 20060101ALN20240925BHJP
   C12N 15/10 20060101ALN20240925BHJP
【FI】
C12N15/09 100
C12N15/11 Z ZNA
C12N15/55
C12N9/22
C12N15/10 200Z
C12N15/11 Z
【審査請求】有
【請求項の数】27
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024091759
(22)【出願日】2024-06-05
(62)【分割の表示】P 2023146414の分割
【原出願日】2020-02-14
(31)【優先権主張番号】62/805,868
(32)【優先日】2019-02-14
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/805,878
(32)【優先日】2019-02-14
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/805,899
(32)【優先日】2019-02-14
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/874,414
(32)【優先日】2019-07-15
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】522185863
【氏名又は名称】メタゲノミ,インク.
(74)【代理人】
【識別番号】110003797
【氏名又は名称】弁理士法人清原国際特許事務所
(72)【発明者】
【氏名】トーマス,ブライアン
(72)【発明者】
【氏名】ブラウン,クリストファー
(72)【発明者】
【氏名】カンター,ローズ
(72)【発明者】
【氏名】デヴォート,オードラ
(72)【発明者】
【氏名】バターフィールド,クリスティーナ
(72)【発明者】
【氏名】アレクサンダー,リサ
(72)【発明者】
【氏名】ゴルツマン,ダニエラ エス.エー.
(72)【発明者】
【氏名】リュー,ジェイソン
(57)【要約】      (修正有)
【課題】際立ったドメイン特徴を有するエンドヌクレアーゼ酵素、ならびにそのような酵素またはその変異体を使用する方法を提供する。
【解決手段】操作されたヌクレアーゼシステムであって、前記操作されたヌクレアーゼシステムは、(a)RuvC_IIIドメインを含むエンドヌクレアーゼであって、ここで、前記エンドヌクレアーゼは、特定の配列に対して少なくとも80%の配列同一性を有するアミノ酸配列を含む、エンドヌクレアーゼと、(b)前記エンドヌクレアーゼと複合体を形成するように構成される、操作されたガイドリボ核酸構造であって、前記操作されたガイドリボ核酸構造は、(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と、(ii)前記エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列と、を含む操作されたガイドリボ核酸構造と、を含む、操作されたヌクレアーゼシステムである。
【選択図】図1
【特許請求の範囲】
【請求項1】
操作されたヌクレアーゼシステムであって、前記操作されたヌクレアーゼシステムは、
(a)RuvC_IIIドメインとHNHドメインとを含むエンドヌクレアーゼであって、ここで、前記エンドヌクレアーゼは難培養性微生物に由来し、ここで、前記エンドヌクレアーゼは、クラス2のII型Casエンドヌクレアーゼである、エンドヌクレアーゼと、
(b)前記エンドヌクレアーゼと複合体を形成するように構成される、操作されたガイドリボ核酸構造であって、前記操作されたガイドリボ核酸構造は、
(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と、
(ii)前記エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列と、を含む、操作されたガイドリボ核酸構造と、を含む、
操作されたヌクレアーゼシステム。
【請求項2】
前記RuvC_IIIドメインは、配列番号:1827-3637のいずれか1つに対して少なくとも70%、少なくとも75%、少なくとも80%、または少なくとも90%の配列同一性を有する配列を含む、請求項1に記載の操作されたヌクレアーゼシステム。
【請求項3】
操作されたヌクレアーゼシステムであって、前記操作されたヌクレアーゼシステムは、
(a)配列番号:1827-3637のいずれか1つに対して少なくとも75%の配列同一性を有するRuvC_IIIドメインを含むエンドヌクレアーゼと、
(b)前記エンドヌクレアーゼと複合体を形成するように構成される、操作されたガイドリボ核酸構造であって、前記操作されたガイドリボ核酸構造は、
(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と、
(ii)前記エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列と、を含む、操作されたガイドリボ核酸構造と、を含む、
操作されたヌクレアーゼシステム。
【請求項4】
操作されたヌクレアーゼシステムであって、前記操作されたヌクレアーゼシステムは、
(a)配列番号:5512-5537を含むプロトスペーサー隣接モチーフ(PAM)配列に結合するように構成されたエンドヌクレアーゼであって、ここで、前記エンドヌクレアーゼはクラス2のII型Casエンドヌクレアーゼである、エンドヌクレアーゼと、
(b)前記エンドヌクレアーゼと複合体を形成するように構成される、操作されたガイドリボ核酸構造であって、前記操作されたガイドリボ核酸構造は、
(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と、
(ii)前記エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列と、を含む、操作されたガイドリボ核酸構造と、を含む、
操作されたヌクレアーゼシステム。
【請求項5】
前記エンドヌクレアーゼは難培養性微生物に由来する、請求項4に記載の操作されたヌクレアーゼシステム。
【請求項6】
前記エンドヌクレアーゼは、異なるPAM配列に結合するように操作されていない、請求項4-5のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項7】
前記エンドヌクレアーゼは、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、またはCas13dエンドヌクレアーゼではない、請求項4に記載の操作されたヌクレアーゼシステム。
【請求項8】
前記エンドヌクレアーゼは、Cas9エンドヌクレアーゼに対して80%未満の同一性を有する、請求項4に記載の操作されたヌクレアーゼシステム。
【請求項9】
前記エンドヌクレアーゼはHNHドメインをさらに含む、請求項3-8のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項10】
前記tracrリボ核酸配列は、配列番号:5476-5511および配列番号:5538のいずれか1つから選択される約60~90の連続するヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む、請求項1-9のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項11】
操作されたヌクレアーゼシステムであって、前記操作されたヌクレアーゼシステムは、
(a)操作されたガイドリボ核酸構造であって、前記操作されたガイドリボ核酸構造は、
(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と、
(ii)エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列であって、ここで、前記tracrリボ核酸配列は、配列番号:5476-5511および配列番号:5538のいずれか1つから選択される約60~90の連続するヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む、tracrリボ核酸配列と、を含む、
操作されたガイドリボ核酸構造と、
(b)前記操作されたガイドリボ核酸に結合するように構成されたクラス2のII型Casエンドヌクレアーゼと、を含む、
操作されたヌクレアーゼシステム。
【請求項12】
前記エンドヌクレアーゼは、配列番号:5512-5537を含む群から選択されるプロトスペーサー隣接モチーフ(PAM)配列に結合するように構成される、請求項1-3または11のいずれかに記載の操作されたヌクレアーゼシステム。
【請求項13】
前記操作されたガイドリボ核酸構造は、少なくとも2つのリボ核酸ポリヌクレオチドを含む、請求項1-11のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項14】
前記操作されたガイドリボ核酸構造は、前記ガイドリボ核酸配列と前記tracrリボ核酸配列とを含む1つのリボ核酸ポリヌクレオチドを含む、請求項1-11のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項15】
前記ガイドリボ核酸配列は、原核生物、細菌、古細菌、真核生物、真菌、植物、哺乳動物、またはヒトのゲノム配列に相補的である、請求項1-14のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項16】
前記ガイドリボ核酸配列は15~24ヌクレオチド長である、請求項1-15のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項17】
前記エンドヌクレアーゼは、前記エンドヌクレアーゼのN末端またはC末端の近位にある1つ以上の核局在化配列(NLS)を含む、請求項1-16のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項18】
前記NLSは、配列番号:5597-5612から選択される配列を含む、請求項1-17のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項19】
5’から3’に、前記標的デオキシリボ核酸配列の5’に少なくとも20のヌクレオチドの配列を含む第1の相同性アームと、少なくとも10のヌクレオチドの合成DNA配列と、前記標的デオキシリボ核酸配列の3’に少なくとも20のヌクレオチドの配列を含む第2の相同性アームとを含む、一本鎖または二本鎖のDNA修復鋳型をさらに含む、請求項1-18のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項20】
前記第1の相同性アームまたは前記第2の相同性アームは、少なくとも40、80、120、150、200、300、500、または1,000のヌクレオチドの配列を含む、請求項19に記載の操作されたヌクレアーゼシステム。
【請求項21】
前記操作されたヌクレアーゼシステムは、Mg2+の供給源をさらに含む、請求項1-20のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項22】
前記エンドヌクレアーゼおよび前記tracrリボ核酸配列は、同じ門内の別個の細菌種に由来する、請求項1-21のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項23】
前記エンドヌクレアーゼは、Dermabacter属に属する細菌に由来する、請求項1-22のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項24】
前記エンドヌクレアーゼは、Verrucomicrobia門、Candidatus Peregrinibacteria門、またはCandidatus Melainabacteria門に属する細菌に由来する、請求項1-22のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項25】
前記エンドヌクレアーゼは、配列番号:5592-5595のいずれか1つに対して少なくとも90%の同一性を有する16S rRNA遺伝子を含む細菌に由来する、請求項1-22のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項26】
前記HNHドメインは、配列番号:5638-5460のいずれか1つに対して少なくとも70%または少なくとも80%の同一性を有する配列を含む、請求項1-25のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項27】
前記エンドヌクレアーゼは、配列番号:1-1826またはそられに対して少なくとも55%の同一性を有するその変異体を含む、請求項1-26のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項28】
前記エンドヌクレアーゼは、配列番号:1827-1830あるいは配列番号:1827-2140からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項29】
前記エンドヌクレアーゼは、配列番号:3638-3641あるいは配列番号:3638-3954からなる群から選択される配列に対して少なくとも70%、80%、90%同一である配列を含む、請求項1-28のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項30】
前記エンドヌクレアーゼは、配列番号:5615-5632からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-29のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項31】
前記エンドヌクレアーゼは、配列番号:1-4あるいは配列番号:1-319からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-30のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項32】
前記ガイドRNA構造は、配列番号:5461-5464、配列番号:5476-5479、あるいは配列番号:5476-5489からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-31のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項33】
前記ガイドRNA構造は、ステムおよびループからなるヘアピンを含むと予想されるRNA配列を含み、ここで、前記ステムは、少なくとも10、少なくとも12、または少なくとも14の塩基対のリボヌクレオチド、および前記ループの4つの塩基対以内の非対称バルジを含む、請求項1-32のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項34】
前記エンドヌクレアーゼは、配列番号:5512-5515あるいは配列番号:5527-5530からなる群から選択される配列を含むPAMに結合するように構成される、請求項1-33のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項35】
a)前記エンドヌクレアーゼは、配列番号:1827に対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5461あるいは配列番号:5476の少なくとも1つに対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5512あるいは配列番号:5527を含むPAMに結合するように構成される、請求項1-34のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項36】
a)前記エンドヌクレアーゼは、配列番号:1828に対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5462あるいは配列番号:5477の少なくとも1つに対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5513あるいは配列番号:5528を含むPAMに結合するように構成される、請求項1-34のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項37】
a)前記エンドヌクレアーゼは、配列番号:1829に対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5463あるいは配列番号:5478の少なくとも1つに対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5514あるいは配列番号:5529を含むPAMに結合するように構成される、請求項1-34のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項38】
a)前記エンドヌクレアーゼは、配列番号:1830に対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5464あるいは配列番号:5479の少なくとも1つに対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5515あるいは配列番号:5530を含むPAMに結合するように構成される、請求項1-34のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項39】
前記エンドヌクレアーゼは、配列番号:2141-2142あるいは配列番号:2141-2241からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項40】
前記エンドヌクレアーゼは、配列番号:3955-3956あるいは配列番号:3955-4055からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または39のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項41】
前記エンドヌクレアーゼは、配列番号:5632-5638からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または39-40のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項42】
前記エンドヌクレアーゼは、配列番号:320-321あるいは配列番号:320-420からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または39-41のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項43】
前記ガイドRNA構造は、配列番号:5465、配列番号:5490-5491、あるいは配列番号:5490-5494からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または39-42のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項44】
前記ガイドRNA構造は、少なくとも8、少なくとも10、または少なくとも12の塩基対のリボヌクレオチドを含むヘアピンを含む、tracrリボ核酸配列を含む、請求項1-27または39-43のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項45】
前記エンドヌクレアーゼは、配列番号:5516および配列番号:5531からなる群から選択される配列を含むPAMに結合するように構成される、請求項1-27または39-44のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項46】
a)前記エンドヌクレアーゼは、配列番号:2141に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5490に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5531を含むPAMに結合するように構成される、請求項1-27または39-45のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項47】
a)前記エンドヌクレアーゼは、配列番号:2142に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5465あるいは配列番号:5491に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5516を含むPAMに結合するように構成される、請求項1-27または39-45のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項48】
前記エンドヌクレアーゼは、配列番号:2245-2246からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項49】
前記エンドヌクレアーゼは、配列番号:4059-4060からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または48のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項50】
前記エンドヌクレアーゼは、配列番号:5639-5648からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または48-49のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項51】
前記エンドヌクレアーゼは、配列番号:424-425からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または48-50のいずれか1つに記載の操作されたヌクレアーゼシステム
【請求項52】
前記ガイドRNA構造は、配列番号:5498-5499および配列番号:5539からなる群から選択される配列に対して少なくとも70%、80%、90%同一である配列を含む、請求項1-27または48-51のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項53】
前記ガイドRNA構造は、ガイドリボ核酸配列の少なくとも8つのヌクレオチドおよびtracrリボ核酸配列の少なくとも8つのヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予想されるガイドリボ核酸配列を含み、ここで、前記tracrリボ核酸配列は、5’から3’に、第1のヘアピンと第2のヘアピンとを含み、ここで、前記第1のヘアピンは前記第2のヘアピンよりも長いステムを有する、請求項1-27または48-52のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項54】
前記エンドヌクレアーゼは、配列番号:2242-2244あるいは配列番号:2247-2249からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項55】
前記エンドヌクレアーゼは、配列番号:4056-4058および配列番号:4061-4063からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または54のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項56】
前記エンドヌクレアーゼは、配列番号:5639-5648からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または54-55のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項57】
前記エンドヌクレアーゼは、配列番号:421-423あるいは配列番号:426-428からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または54-56のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項58】
前記ガイドRNA構造は、配列番号:5466-5467、配列番号:5495-5497、配列番号:5500-5502、および配列番号:5539からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または54-57のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項59】
前記ガイドRNA構造は、ガイドリボ核酸配列の少なくとも8つのヌクレオチドおよびtracrリボ核酸配列の少なくとも8つのヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予想されるガイドリボ核酸配列を含み、ここで、前記tracrリボ核酸配列は、5’から3’に、第1のヘアピンと第2のヘアピンとを含み、ここで、前記第1のヘアピンは前記第2のヘアピンよりも長いステムを有する、請求項1-27または54-58のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項60】
前記エンドヌクレアーゼは、配列番号:5517-5518あるいは配列番号:5532-5534からなる群から選択される配列を含むPAMに結合するように構成される、請求項1-27または54-59のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項61】
a)前記エンドヌクレアーゼは、配列番号:2247に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5500に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5517あるいは配列番号:5532を含むPAMに結合するように構成される、請求項1-27または54-60のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項62】
a)前記エンドヌクレアーゼは、配列番号:2248に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5501に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5518あるいは配列番号:5533を含むPAMに結合するように構成される、請求項1-27または54-60のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項63】
a)前記エンドヌクレアーゼは、配列番号:2249に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5502に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5534を含むPAMに結合するように構成される、請求項1-27または54-60のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項64】
前記エンドヌクレアーゼは、配列番号:2253あるいは配列番号:2253-2481からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項65】
前記エンドヌクレアーゼは、配列番号:4067あるいは配列番号:4067-4295からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または64のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項66】
前記エンドヌクレアーゼは、配列番号:5649のペプチドモチーフを含む、請求項1-27または64-65のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項67】
前記エンドヌクレアーゼは、配列番号:432あるいは配列番号:432-660からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または64-66のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項68】
前記ガイドRNA構造は、配列番号:5468あるいは配列番号:5503からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または64-67のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項69】
前記エンドヌクレアーゼは、配列番号:5519からなる群から選択される配列を含むPAMに結合するように構成される、請求項1-27または64-68のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項70】
a)前記エンドヌクレアーゼは、配列番号:2253に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5468あるいは配列番号:5503に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5519を含むPAMに結合するように構成される、請求項1-27または64-69のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項71】
前記エンドヌクレアーゼは、配列番号:2482-2489からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項72】
前記エンドヌクレアーゼは、配列番号:4296-4303からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または71のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項73】
前記エンドヌクレアーゼは、配列番号:661-668からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または71-72のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項74】
前記エンドヌクレアーゼは、配列番号:2490-2498からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項75】
前記エンドヌクレアーゼは、配列番号:4304-4312からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または74のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項76】
前記エンドヌクレアーゼは、配列番号:669-677からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または74-75のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項77】
前記ガイドRNA構造は、配列番号:5504からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または74-76のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項78】
前記エンドヌクレアーゼは、配列番号:2499あるいは配列番号:2499-2750からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項79】
前記エンドヌクレアーゼは、配列番号:4313あるいは配列番号:4313-4564からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または78のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項80】
前記エンドヌクレアーゼは、配列番号:5650-5667からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または78-79のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項81】
前記エンドヌクレアーゼは、配列番号:678あるいは配列番号:678-929からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または78-80のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項82】
前記ガイドRNA構造は、配列番号:5469あるいは配列番号:5505に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または78-81のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項83】
前記エンドヌクレアーゼは、配列番号:5520あるいは配列番号:5535を含むPAMに結合するように構成される、請求項1-27または78-82のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項84】
a)前記エンドヌクレアーゼは、配列番号:2499に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5469あるいは配列番号:5505に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5520あるいは配列番号:5535を含むPAMに結合するように構成される、請求項1-27または78-83のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項85】
前記エンドヌクレアーゼは、配列番号:2751あるいは配列番号:2751-2913からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項86】
前記エンドヌクレアーゼは、配列番号:4565あるいは配列番号:4565-4727からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または85のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項87】
前記エンドヌクレアーゼは、配列番号:5668-5678からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または85-86のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項88】
前記エンドヌクレアーゼは、配列番号:930あるいは配列番号:930-1092からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または85-87のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項89】
前記ガイドRNA構造は、配列番号:5470あるいは配列番号:5506に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または85-88のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項90】
前記エンドヌクレアーゼは、配列番号:5521あるいは配列番号:5536からなる群から選択される配列を含むPAMに結合するように構成される、請求項1-27または85-89のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項91】
a)前記エンドヌクレアーゼは、配列番号:2751に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5470あるいは配列番号:5506に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5521あるいは配列番号:5536を含むPAMに結合するように構成される、請求項1-27または85-90のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項92】
前記エンドヌクレアーゼは、配列番号:2914あるいは配列番号:2914-3174からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項93】
前記エンドヌクレアーゼは、配列番号:4728あるいは配列番号:4728-4988からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または92のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項94】
前記エンドヌクレアーゼは、配列番号:5676-5678からなる群から選択される少なくとも1つ、少なくとも2つ、または少なくとも3つのペプチドモチーフを含む、請求項1-27または92-93のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項95】
前記エンドヌクレアーゼは、配列番号:1093あるいは配列番号:1093-1353からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または92-94のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項96】
前記ガイドRNA構造は、配列番号:5471、配列番号:5507、および配列番号:5540-5542からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または92-95のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項97】
前記ガイドRNA構造は、5つ未満の塩基対のリボヌクレオチドを含む少なくとも2つのヘアピンを含むと予想されるtracrリボ核酸配列を含む、請求項1-27または92-96のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項98】
前記エンドヌクレアーゼは、配列番号:5522を含むPAMに結合するように構成される、請求項1-27または92-97のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項99】
a)前記エンドヌクレアーゼは、配列番号:2914に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5471あるいは配列番号:5507に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5522を含むPAMに結合するように構成される、請求項1-27または92-98のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項100】
前記エンドヌクレアーゼは、配列番号:3175あるいは配列番号:3175-3330からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項101】
前記エンドヌクレアーゼは、配列番号:4989あるいは配列番号:4989-5146からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または100のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項102】
前記エンドヌクレアーゼは、配列番号:5679-5686からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または100-101のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項103】
前記エンドヌクレアーゼは、配列番号:1354あるいは配列番号:1354-1511からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または100-102のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項104】
前記ガイドRNA構造は、配列番号:5472あるいは配列番号:5508からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または100-103のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項105】
前記エンドヌクレアーゼは、配列番号:5523あるいは配列番号:5537からなる群から選択される配列を含むPAMに結合するように構成される、請求項1-27または100-104のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項106】
a)前記エンドヌクレアーゼは、配列番号:3175に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5472あるいは配列番号:5508に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5523あるいは配列番号:5537を含むPAMに結合するように構成される、請求項1-27または100-105のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項107】
前記エンドヌクレアーゼは、配列番号:3331あるいは配列番号:3331-3474からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項108】
前記エンドヌクレアーゼは、配列番号:5147あるいは配列番号:5147-5290からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または107のいずれか1つに記載の操作されたヌクレアーゼシステム
【請求項109】
前記エンドヌクレアーゼは、配列番号:5674-5675および配列番号:5687-5693からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または107-108のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項110】
前記エンドヌクレアーゼは、配列番号:1512あるいは配列番号:1512-1655からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または107-109のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項111】
前記ガイドRNA構造は、配列番号:5473あるいは配列番号:5509からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または107-110のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項112】
前記エンドヌクレアーゼは、配列番号:5524を含むPAMに結合するように構成される、請求項1-27または107-111のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項113】
a)前記エンドヌクレアーゼは、配列番号:3331に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5473あるいは配列番号:5509に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5524を含むPAMに結合するように構成される、請求項1-27または107-112のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項114】
前記エンドヌクレアーゼは、配列番号:3475あるいは配列番号:3475-3568からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項115】
前記エンドヌクレアーゼは、配列番号:5291あるいは配列番号:5291-5389からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または114のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項116】
前記エンドヌクレアーゼは、配列番号:5694-5699からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または114-115のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項117】
前記エンドヌクレアーゼは、配列番号:1656あるいは配列番号:1656-1755からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または114-116のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項118】
前記ガイドRNA構造は、配列番号:5474あるいは配列番号:5510に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または114-117のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項119】
前記エンドヌクレアーゼは、配列番号:5525を含むPAMに結合するように構成される、請求項1-27または114-118のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項120】
a)前記エンドヌクレアーゼは、配列番号:3475に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5474あるいは配列番号:5510に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5525を含むPAMに結合するように構成される、請求項1-27または114-119のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項121】
前記エンドヌクレアーゼは、配列番号:3569あるいは配列番号:3569-3637からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項122】
前記エンドヌクレアーゼは、配列番号:5390あるいは配列番号:5390-5460からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または121のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項123】
前記エンドヌクレアーゼは配列番号:5700-5717からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む、請求項1-27または121-122のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項124】
前記エンドヌクレアーゼは、配列番号:1756あるいは配列番号:1756-1826からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または121-123のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項125】
前記ガイドRNA構造は、配列番号:5475あるいは配列番号:5511に対して少なくとも70%、80%、または90%同一である配列を含む、請求項1-27または121-124のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項126】
前記エンドヌクレアーゼは、配列番号:5526を含むPAMに結合するように構成される、請求項1-27または121-125のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項127】
a)前記エンドヌクレアーゼは、配列番号:3569に対して少なくとも70%、80%、または90%同一である配列を含み、
b)前記ガイドRNA構造は、配列番号:5475あるいは配列番号:5511に対して少なくとも70%、80%、または90%同一である配列を含み、および、
c)前記エンドヌクレアーゼは、配列番号:5526を含むPAMに結合するように構成される、請求項1-27または121-126のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項128】
配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、またはSmith-Waterman相同性検索アルゴリズムによって決定される、請求項1-127のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項129】
前記配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータ、および、11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリックスを使用して、ならびに、条件付き組成スコアマトリックス調整を使用して、BLASTP相同性検索アルゴリズムによって決定される、請求項128に記載の操作されたヌクレアーゼシステム。
【請求項130】
操作されたガイドリボ核酸ポリヌクレオチドであって、前記操作されたガイドリボ核酸ポリヌクレオチドは、
a)標的DNA分子中の標的配列に相補的なヌクレオチド配列を含む、DNAを標的とするセグメントと、
b)ハイブリダイズして二本鎖RNA(dsRNA)二重鎖を形成するヌクレオチドの2つの相補的なストレッチを含む、タンパク質結合セグメントであって、
ここで、前記ヌクレオチドの2つの相補的なストレッチは介在ヌクレオチドで互いに共有結合し、および、
ここで、前記操作されたガイドリボ核酸ポリヌクレオチドは、配列番号:1827-3637のいずれか1つに対して少なくとも75%の配列同一性を有するRuvC_IIIドメインを含むエンドヌクレアーゼと複合体を形成し、前記複合体を標的DNA分子の標的配列に標的化するように構成される、
操作されたガイドリボ核酸ポリヌクレオチド。
【請求項131】
前記DNA標的化セグメントは、前記ヌクレオチドの2つの相補的なストレッチの両方の5’に位置する、請求項130に記載の操作されたガイドリボ核酸ポリヌクレオチド。
【請求項132】
a)前記タンパク質結合セグメントは、配列番号:5476-5479あるいは配列番号:5476-5489からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
b)前記タンパク質結合セグメントは (配列番号:5490-5491あるいは配列番号:5490-5494)および配列番号:5538からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
c)前記タンパク質結合セグメントは、配列番号:5498-5499からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
d)前記タンパク質結合セグメントは、配列番号:5495-5497および配列番号:5500-5502からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
e)前記タンパク質結合セグメントは、配列番号:5503に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
f)前記タンパク質結合セグメントは、配列番号:5504に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
g)前記タンパク質結合セグメントは、配列番号:5505に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
h)タンパク質結合セグメントは、配列番号:5506に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
i)タンパク質結合セグメントは、配列番号:5507に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
j)前記タンパク質結合セグメントは、配列番号:5508に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
k)前記タンパク質結合セグメントは、配列番号:5509に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、
l)前記タンパク質結合セグメントは、配列番号:5510に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み、または、
m)前記タンパク質結合セグメントは、配列番号:5511に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含む、請求項130-131のいずれかに記載の操作されたガイドリボ核酸ポリヌクレオチド。
【請求項133】
a)前記ガイドリボ核酸ポリヌクレオチドは、ステムとループとを含むヘアピンを含むRNA配列を含み、ここで、前記ステムは、少なくとも10、少なくとも12、または少なくとも14の塩基対のリボヌクレオチド、および前記ループの4つの塩基対内の非対称バルジを含み、
b)前記ガイドリボ核酸ポリヌクレオチドは、少なくとも8、少なくとも10、または少なくとも12の塩基対のリボヌクレオチドを含むヘアピンを含むと予想されるtracrリボ核酸配列を含み、
c)前記ガイドリボ核酸ポリヌクレオチドは、ガイドリボ核酸配列の少なくとも8つのヌクレオチドとtracrリボ核酸配列の少なくとも8つのヌクレオチドとを含む中断されていない塩基対領域を有するヘアピンを含むと予想されるガイドリボ核酸配列を含み、ここで、前記tracrリボ核酸配列は、5’から3’に、第1のヘアピンと第2のヘアピンとを含み、ここで、前記第1のヘアピンは前記第2のヘアピンよりも長いステムを有し、または、
d)前記ガイドリボ核酸ポリヌクレオチドは、5つ未満の塩基対のリボヌクレオチドを含む少なくとも2つのヘアピンを含むと予想されるtracrリボ核酸配列を含む、請求項130-132のいずれかに記載の操作されたガイドリボ核酸ポリヌクレオチド。
【請求項134】
請求項130-133のいずれか1つに記載の操作されたガイドリボ核酸ポリヌクレオチドをコードする、デオキシリボ核酸ポリヌクレオチド。
【請求項135】
生物における発現のために最適化された、操作された核酸配列を含む核酸であって、ここで、前記核酸は、RuvC_IIIドメインとHNHドメインとを含むクラス2のII型Casエンドヌクレアーゼをコードし、ここで、前記クラス2のII型Casエンドヌクレアーゼは難培養性微生物に由来する、核酸。
【請求項136】
生物における発現のために最適化された、操作された核酸配列を含む核酸であって、ここで、前記核酸は、配列番号:1827-3637のいずれか1つに対して少なくとも70%の配列同一性を有するRuvC_IIIドメインを含むエンドヌクレアーゼをコードする、核酸。
【請求項137】
前記エンドヌクレアーゼは、配列番号:3638-5460のいずれか1つに対して少なくとも70%または少なくとも80%の配列同一性を有するHNHドメインを含む、請求項135-136のいずれか1つに記載の核酸。
【請求項138】
前記エンドヌクレアーゼは、配列番号:5572-5591またはそれらに対して少なくとも70%の配列同一性を有するその変異体を含む、請求項135-137のいずれか1つに記載の核酸。
【請求項139】
前記エンドヌクレアーゼは、前記エンドヌクレアーゼのN末端またはC末端の近位にある1つ以上の核局在化配列(NLS)をコードする配列を含む、請求項135-138のいずれか1つに記載の核酸。
【請求項140】
前記NLSは、配列番号:5597-5612から選択される配列を含む、請求項139に記載の核酸。
【請求項141】
前記生物は、原核生物、細菌、真核生物、真菌、植物、哺乳動物、げっ歯類、またはヒトである、請求項135-140のいずれか1つに記載の核酸。
【請求項142】
前記生物は大腸菌であり、ここで、
a)前記核酸配列は、配列番号:5572-5575からなる群から選択される配列に対して少なくとも70%、80%、または90%の同一性を有する、
b)前記核酸配列は、配列番号:5576-5577からなる群から選択される配列に対して少なくとも70%、80%、または90%の同一性を有する、
c)前記核酸配列は、配列番号:5578-5580からなる群から選択される配列に対して少なくとも70%、80%、または90%の同一性を有する、
d)前記核酸配列は、配列番号:5581に対して少なくとも70%、80%、または90%の同一性を有する、
e)前記核酸配列は、配列番号:5582に対して少なくとも70%、80%、または90%の同一性を有する、
f)前記核酸配列は、配列番号:5583に対して少なくとも70%、80%、または90%の同一性を有する、
g)前記核酸配列は、配列番号:5584に対して少なくとも70%、80%、または90%の同一性を有する、
h)前記核酸配列は、配列番号:5585に対して少なくとも70%、80%、または90%の同一性を有する、
i)前記核酸配列は、配列番号:5586に対して少なくとも70%、80%、または90%の同一性を有する、あるいは、
j)前記核酸配列は、配列番号:5587に対して少なくとも70%、80%、または90%の同一性を有する、請求項141に記載の核酸。
【請求項143】
前記生物はヒトであり、ここで、
a)前記核酸配列は、配列番号:5588あるいは配列番号:5589に対して少なくとも70%、80%、または90%の同一性を有する、あるいは、
b)前記核酸配列は、配列番号:5590あるいは配列番号:5591に対して少なくとも70%、80%、または90%の同一性を有する、請求項141に記載の核酸。
【請求項144】
RuvC_IIIドメインとHNHドメインとを含むクラス2のII型Casエンドヌクレアーゼをコードする核酸配列を含むベクターであって、前記クラス2のII型Casエンドヌクレアーゼは、難培養性微生物に由来する、ベクター。
【請求項145】
請求項135-143のいずれかに記載の核酸を含むベクター。
【請求項146】
前記クラス2のII型Casエンドヌクレアーゼと複合体を形成するように構成される操作されたガイドリボ核酸構造をコードする核酸をさらに含み、前記操作されたガイドリボ核酸構造は、
a)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と、
b)前記クラス2のII型Casエンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列と、
を含む、請求項144-145のいずれかに記載のベクター。
【請求項147】
前記ベクターは、プラスミド、ミニサークル、CELiD、アデノ随伴ウイルス(AAV)由来のビリオン、またはレンチウイルスである、請求項144-146のいずれかに記載のベクター。
【請求項148】
請求項144-147のいずれかに記載のベクターを含む細胞。
【請求項149】
エンドヌクレアーゼを製造する方法であって、前記方法は、請求項146の前記細胞を培養する工程を含む、方法。
【請求項150】
二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、標識、または修飾するための方法であって、前記方法は、
(a)クラス2のII型Casエンドヌクレアーゼおよび前記二本鎖デオキシリボ核酸ポリヌクレオチドに結合するように構成される操作されたガイドリボ核酸構造と複合体を形成するクラス2のII型Casエンドヌクレアーゼに、前記二本鎖デオキシリボ核酸ポリヌクレオチドを接触させる工程を含み、
(b)前記二本鎖デオキシリボ核酸ポリヌクレオチドは、プロトスペーサー隣接モチーフ(PAM)を含み、および、
(c)前記PAMは、配列番号:5512-5526あるいは配列番号:5527-5537からなる群から選択される配列を含む、
方法。
【請求項151】
前記二本鎖デオキシリボ核酸ポリヌクレオチドは、前記操作されたガイドリボ核酸構造の配列に相補的な配列を含む第1の鎖と、PAMを含む第2の鎖とを含む、請求項149に記載の方法。
【請求項152】
前記PAMは、前記操作されたガイドリボ核酸構造の前記配列に相補的な前記配列の3’末端に直接隣接している、請求項151に記載の方法。
【請求項153】
前記クラス2のII型Casエンドヌクレアーゼは、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、またはCas13dエンドヌクレアーゼではない、請求項149-152のいずれか1つに記載の方法。
【請求項154】
前記クラス2のII型Casエンドヌクレアーゼは、難培養性微生物に由来する、請求項149-153のいずれか1つに記載の方法。
【請求項155】
前記二本鎖デオキシリボ核酸ポリヌクレオチドは、真核生物、植物、真菌、哺乳動物、げっ歯類、またはヒトの二本鎖デオキシリボ核酸ポリヌクレオチドである、請求項149-154のいずれか1つに記載の方法。
【請求項156】
a)前記PAMは、配列番号:5512-5515および配列番号:5527-5530からなる群から選択される配列を含む、
b)前記PAMは配列番号:5516あるいは配列番号:5531を含む、
c)前記PAMは配列番号:5539を含む、
d)前記PAMは配列番号:5517あるいは配列番号:5518を含む、
e)前記PAMは配列番号:5519を含む、
f)前記PAMは配列番号:5520あるいは配列番号:5535を含む、
g)前記PAMは配列番号:5521あるいは配列番号:5536を含む、
h)前記PAMは配列番号:5522を含む、
i)前記PAMは配列番号:5523あるいは配列番号:5537を含む、
j)前記PAMは配列番号:5524を含む、
k)前記PAMは配列番号:5525を含む、または、
l)前記PAMは配列番号:5526を含む、
請求項149-155のいずれか1つに記載の方法。
【請求項157】
標的核酸遺伝子座を改変する方法であって、前記方法は、請求項1-129のいずれか1つに記載の前記操作されたヌクレアーゼシステムのいずれかを、前記標的核酸遺伝子座に送達する工程を含み、ここで、前記エンドヌクレアーゼは、前記操作されたガイドリボ核酸構造と複合体を形成するように構成され、ここで、前記複合体は、前記複合体が前記標的核酸遺伝子座に結合すると、前記複合体が前記標的核酸遺伝子座を改変するように構成される、方法。
【請求項158】
前記標的核酸遺伝子座を改変することは、前記標的核酸遺伝子座を結合、ニッキング、切断、または標識することを含む、請求項156に記載の方法。
【請求項159】
前記標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む、請求項156-158のいずれかに記載の方法。
【請求項160】
前記標的核酸は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含む、請求項159に記載の方法。
【請求項161】
前記標的核酸遺伝子座はインビトロにある、請求項156-160のいずれか1つに記載の方法。
【請求項162】
前記標的核酸遺伝子座は細胞内にある、請求項156-160のいずれか1つに記載の方法。
【請求項163】
前記細胞は、原核細胞、細菌細胞、真核細胞、真菌細胞、植物細胞、動物細胞、哺乳動物細胞、げっ歯類細胞、霊長類細胞、またはヒト細胞である、請求項162に記載の方法。
【請求項164】
前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座に送達する工程は、請求項135-140のいずれかに記載の核酸または請求項142-146のいずれかに記載のベクターを送達することを含む、請求項162-163のいずれか1つに記載の方法。
【請求項165】
前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座に送達する工程は、前記エンドヌクレアーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む、請求項162-163のいずれか1つに記載の方法。
【請求項166】
前記核酸は、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームが動作可能に連結されるプロモーターを含む、請求項164に記載の方法。
【請求項167】
前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座に送達する工程は、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAを送達することを含む、請求項162-163のいずれか1つに記載の方法。
【請求項168】
前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座に送達する工程は、翻訳されたポリペプチドを送達することを含む、請求項162-163のいずれか1つに記載の方法。
【請求項169】
前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座に送達する工程は、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結される前記操作されたガイドリボ核酸構造をコードするデオキシリボ核酸(DNA)を送達することを含む、請求項162-163のいずれか1つに記載の方法。
【請求項170】
前記エンドヌクレアーゼは、前記標的核酸遺伝子座で、またはその近位で、一本鎖切断または二本鎖切断を引き起こす、請求項156-169のいずれか1つに記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
相互参照
本出願は、2019年2月14日に出願された「MG1 ENZYMES WITH RUVC DOMAINS」と題される米国仮出願第62/805,868号、および2019年7月15日に出願された「MG1 ENZYMES WITH RUVC DOMAINS」と題される米国仮出願第62/874,414号、および、2019年2月14日に出願された「MG2 ENZYMES CONTAINING RUVC DOMAINS」と題される米国仮出願第62/805,878号、および2019年2月14日に出願された「MG3 ENZYMES WITH RUVC DOMAINS」と題される米国仮出願第62/805,899号の利益を主張し、これらの各々は、参照により完全に本明細書に組み込まれる。
【背景技術】
【0002】
Cas酵素は、それらの関連するクラスター化して規則的な配置の短い回文配列リピート(CRISPR)ガイドリボ核酸(RNA)とともに、原核生物免疫系に広がる(~45%の細菌、~84%の古細菌)構成成分であり、CRISPR-RNAガイド核酸切断(CRISPR-RNA guided nucleic acid cleavage)によって、感染性ウイルスおよびプラスミドなどの非自己核酸からそのような微生物を保護する役割を果たすように思われる。CRISPR RNAエレメントをコードするデオキシリボ核酸(DNA)エレメントは、構造と長さが比較的保存されている場合があるが、それらのCRISPR関連(Cas)タンパク質は非常に多様であり、種々様々な核酸相互作用ドメインを含有している。CRISPR DNAエレメントは早くとも1987年には観察されていたが、CRISPR/Cas複合体のプログラム可能なエンドヌクレアーゼ切断能力は比較的最近になって認識され、多様なDNA操作および遺伝子編集の用途における、組換えCRISPR/Casシステムの使用につながっている。
【0003】
配列表
本出願は配列表を含んでおり、この配列表はASCIIフォーマットで電子的に提出され、参照によりその全体が本明細書に組み込まれる。前記ASCIIのコピーは、2020年2月13日に作成され、55921-703_601_SL.txtというファイル名であり、23,363,113バイトのサイズである。
【発明の概要】
【0004】
いくつかの態様では、本開示は操作されたヌクレアーゼシステムを提供し、上記操作されたヌクレアーゼシステムは:(a)RuvC_IIIドメインとHNHドメインとを含むエンドヌクレアーゼであって、ここで、上記エンドヌクレアーゼは難培養性微生物(uncultivated microorganism)に由来し、ここで、上記エンドヌクレアーゼは、クラス2のII型Casエンドヌクレアーゼである、エンドヌクレアーゼと;(b)上記エンドヌクレアーゼと複合体を形成するように構成される、操作されたガイドリボ核酸構造であって、上記操作されたガイドリボ核酸構造は:(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と;(ii)上記エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列とを含む、操作されたガイドリボ核酸構造と、を含む。いくつかの実施形態では、RuvC_IIIドメインは、配列番号:1827-3637のいずれか1つに対して少なくとも70%、少なくとも75%、少なくとも80%、または少なくとも90%の配列同一性を有する配列を含む。
【0005】
いくつかの態様では、本開示は操作されたヌクレアーゼシステムを提供し、上記操作されたヌクレアーゼシステムは:(a)配列番号:1827-3637のいずれか1つに対して少なくとも75%の配列同一性を有するRuvC_IIIドメインを含むエンドヌクレアーゼと;(b)上記エンドヌクレアーゼと複合体を形成するように構成される、操作されたガイドリボ核酸構造であって、上記操作されたガイドリボ核酸構造は:(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と;(ii)上記エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列と、を含む、ガイドリボ核酸構造と、を含む。
【0006】
いくつかの態様では、本開示は操作されたヌクレアーゼシステムを提供し、上記操作されたヌクレアーゼシステムは:(a)配列番号:5512-5537を含むプロトスペーサー隣接モチーフ(PAM)配列に結合するように構成されたエンドヌクレアーゼであって、ここで、上記エンドヌクレアーゼはクラス2のII型Casエンドヌクレアーゼである、エンドヌクレアーゼと;(b)上記エンドヌクレアーゼと複合体を形成するように構成される、操作されたガイドリボ核酸構造であって、上記操作されたガイドリボ核酸構造は:(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と;(ii)上記エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列と、を含む、操作されたガイドリボ核酸構造と、を含む。
【0007】
いくつかの実施形態では、エンドヌクレアーゼは難培養性微生物に由来する。いくつかの実施形態では、エンドヌクレアーゼは、異なるPAM配列に結合するように操作されていない。いくつかの実施形態では、エンドヌクレアーゼは、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、またはCas13dエンドヌクレアーゼではない。いくつかの実施形態では、エンドヌクレアーゼは、Cas9エンドヌクレアーゼに対して80%未満の同一性を有する。いくつかの実施形態では、エンドヌクレアーゼはHNHドメインをさらに含む。いくつかの実施形態では、tracrリボ核酸配列は、配列番号:5476-5511および配列番号:5538のいずれか1つから選択される約60~90の連続するヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む。
【0008】
いくつかの態様では、本開示は操作されたヌクレアーゼシステムを提供し、上記操作されたヌクレアーゼシステムは、(a)操作されたガイドリボ核酸構造であって、上記操作されたガイドリボ核酸構造は:(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と;(ii)エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列であって、ここで、上記tracrリボ核酸配列は、配列番号:5476-5511および配列番号:5538のいずれか1つから選択される約60~90の連続するヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む、tracrリボ核酸配列と;を含む、操作されたガイドリボ核酸構造と、(b)操作されたガイドリボ核酸に結合するように構成されたクラス2のII型Casエンドヌクレアーゼと、を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5512-5537を含む群から選択されるプロトスペーサー隣接モチーフ(PAM)配列に結合するように構成される。
【0009】
いくつかの実施形態では、操作されたガイドリボ核酸構造は、少なくとも2つのリボ核酸ポリヌクレオチドを含む。いくつかの実施形態では、操作されたガイドリボ核酸構造は、ガイドリボ核酸配列とtracrリボ核酸配列とを含む1つのリボ核酸ポリヌクレオチドを含む。
【0010】
いくつかの実施形態では、ガイドリボ核酸配列は、原核生物、細菌、古細菌、真核生物、真菌、植物、哺乳動物、またはヒトのゲノム配列に相補的である。いくつかの実施形態では、ガイドリボ核酸配列は、15~24ヌクレオチド長である。いくつかの実施形態では、エンドヌクレアーゼは、エンドヌクレアーゼのN末端またはC末端の近位にある1つ以上の核局在化配列(NLS)を含む。いくつかの実施形態では、NLSは、配列番号:5597-5612から選択される配列を含む。
【0011】
いくつかの実施形態では、操作されたヌクレアーゼシステムは、5’から3’に、標的デオキシリボ核酸配列の5’に少なくとも20のヌクレオチドの配列を含む第1の相同性アームと、少なくとも10のヌクレオチドの合成DNA配列と、標的デオキシリボ核酸配列の3’に少なくとも20のヌクレオチドの配列を含む第2の相同性アームとを含む、一本鎖または二本鎖のDNA修復鋳型をさらに含む。いくつかの実施形態では、第1または第2の相同性アームは、少なくとも40、80、120、150、200、300、500、または1,000のヌクレオチドの配列を含む。
【0012】
いくつかの実施形態では、上記操作されたヌクレアーゼシステムは、Mg2+の供給源(source)をさらに含む。
【0013】
いくつかの実施形態では、エンドヌクレアーゼおよびtracrリボ核酸配列は、同じ門内の別個の細菌種に由来する。いくつかの実施形態では、エンドヌクレアーゼは、Dermabacter属に属する細菌に由来する。いくつかの実施形態では、エンドヌクレアーゼは、Verrucomicrobia門、Candidatus Peregrinibacteria門、またはCandidatus Melainabacteria門に属する細菌に由来する。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5592-5595のいずれか1つに対して少なくとも90%の同一性を有する16S rRNA遺伝子を含む細菌に由来する。
【0014】
いくつかの実施形態では、HNHドメインは、配列番号:5638-5460のいずれか1つに対して少なくとも70%または少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1-1826またはそれらに対して少なくとも55%の同一性を有するその変異体を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1827-1830あるいは配列番号:1827-2140からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。
【0015】
いくつかの実施形態では、エンドヌクレアーゼは、配列番号:3638-3641あるいは配列番号:3638-3954からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5615-5632からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1-4あるいは配列番号:1-319からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。
【0016】
いくつかの実施形態では、ガイドRNA構造は、配列番号:5461-5464、配列番号:5476-5479、あるいは配列番号:5476-5489からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、ステムおよびループからなるヘアピンを含むと予想されるRNA配列を含み、ここで、上記ステムは、少なくとも10、少なくとも12、または少なくとも14の塩基対のリボヌクレオチド、および上記ループの4つの塩基対以内の非対称バルジを含む。
【0017】
いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5512-5515あるいは配列番号:5527-5530からなる群から選択される配列を含むPAMに結合するように構成される。
【0018】
いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:1827に対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5461あるいは配列番号:5476の少なくとも1つに対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5512あるいは配列番号:5527を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:1828に対して少なくとも70%、少なくとも80%、または少なくとも90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5462あるいは配列番号:5477の少なくとも1つに対して少なくとも70%、少なくとも80%、あるいは少なくとも90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5513あるいは配列番号:5528を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:1829に対して少なくとも70%、少なくとも80%、あるいは少なくとも90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5463あるいは配列番号:5478の少なくとも1つに対して少なくとも70%、少なくとも80%、あるいは少なくとも90%同一である配列を含み;および、(c)エンドヌクレアーゼは、配列番号:5514あるいは配列番号:5529を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:1830に対して少なくとも70%、少なくとも80%、あるいは少なくとも90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5464あるいは配列番号:5479の少なくとも1つに対して少なくとも70%、少なくとも80%、あるいは少なくとも90%同一である配列を含み;および、(c)エンドヌクレアーゼは、配列番号:5515あるいは配列番号:5530を含むPAMに結合するように構成される。
【0019】
いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2141-2142あるいは配列番号:2141-2241からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:3955-3956あるいは配列番号:3955-4055からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5632-5638からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:320-321あるいは配列番号:320-420からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5465、配列番号:5490-5491、あるいは配列番号:5490-5494からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、少なくとも8、少なくとも10、または少なくとも12の塩基対のリボヌクレオチドを含むヘアピンを含む、tracrリボ核酸配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5516および配列番号:5531からなる群から選択される配列を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2141に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5490に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5531を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2142に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5465あるいは配列番号:5491に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5516を含むPAMに結合するように構成される。
【0020】
いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2245-2246からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4059-4060からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5639-5648からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:424-425からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5498-5499および配列番号:5539からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、ガイドリボ核酸配列の少なくとも8つのヌクレオチドおよびtracrリボ核酸配列の少なくとも8つのヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予想されるガイドリボ核酸配列を含み、ここで、上記tracrリボ核酸配列は、5’から3’に、第1のヘアピンと第2のヘアピンとを含み、ここで、上記第1のヘアピンは上記第2のヘアピンよりも長いステムを有する。
【0021】
いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2242-2244あるいは配列番号:2247-2249からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4056-4058および配列番号:4061-4063からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5639-5648からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:421-423あるいは配列番号:426-428からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5466-5467、配列番号:5495-5497、配列番号:5500-5502、および配列番号:5539からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、ガイドリボ核酸配列の少なくとも8つのヌクレオチドおよびtracrリボ核酸配列の少なくとも8つのヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予想されるガイドリボ核酸配列を含み、ここで、上記tracrリボ核酸配列は、5’から3’に、第1のヘアピンと第2のヘアピンとを含み、ここで、上記第1のヘアピンは上記第2のヘアピンよりも長いステムを有する。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5517-5518あるいは配列番号:5532-5534からなる群から選択される配列を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2247に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5500に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5517あるいは配列番号:5532を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2248に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5501に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5518あるいは配列番号:5533を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2249に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5502に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5534を含むPAMに結合するように構成される。
【0022】
いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2253あるいは配列番号:2253-2481からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4067あるいは配列番号:4067-4295からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5649のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:432あるいは配列番号:432-660からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5468あるいは配列番号:5503からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5519からなる群から選択される配列を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2253に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5468あるいは配列番号:5503に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5519を含むPAMに結合するように構成される。
【0023】
いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2482-2489からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4296-4303からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:661-668からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2490-2498からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4304-4312からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:669-677からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5504からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。
【0024】
いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2499あるいは配列番号:2499-2750からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4313あるいは配列番号:4313-4564からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5650-5667からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:678あるいは配列番号:678-929からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5469あるいは配列番号:5505に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5520あるいは配列番号:5535を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2499に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5469あるいは配列番号:5505に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5520あるいは配列番号:5535を含むPAMに結合するように構成される。
【0025】
いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2751あるいは配列番号:2751-2913からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4565あるいは配列番号:4565-4727からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5668-5678からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:930あるいは配列番号:930-1092からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5470あるいは配列番号:5506に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5521あるいは配列番号:5536からなる群から選択される配列を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2751に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5470あるいは配列番号:5506に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5521あるいは配列番号:5536を含むPAMに結合するように構成される。
【0026】
いくつかの実施形態では、エンドヌクレアーゼは、配列番号:2914あるいは配列番号:2914-3174からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4728あるいは配列番号:4728-4988からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5676-5678からなる群から選択される少なくとも1つ、少なくとも2つ、または少なくとも3つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1093あるいは配列番号:1093-1353からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5471、配列番号:5507、および配列番号:5540-5542からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、5つ未満の塩基対のリボヌクレオチドを含む少なくとも2つのヘアピンを含むと予想されるtracrリボ核酸配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5522を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:2914に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5471あるいは配列番号:5507に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5522を含むPAMに結合するように構成される。
【0027】
いくつかの実施形態では、エンドヌクレアーゼは、配列番号:3175あるいは配列番号:3175-3330からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:4989あるいは配列番号:4989-5146からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5679-5686からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1354あるいは配列番号:1354-1511からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5472あるいは配列番号:5508からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5523あるいは配列番号:5537からなる群から選択される配列を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:3175に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5472あるいは配列番号:5508に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5523あるいは配列番号:5537を含むPAMに結合するように構成される。
【0028】
いくつかの実施形態では、エンドヌクレアーゼは、配列番号:3331あるいは配列番号:3331-3474からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5147あるいは配列番号:5147-5290からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5674-5675および配列番号:5687-5693からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1512あるいは配列番号:1512-1655からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5473あるいは配列番号:5509からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5524を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:3331に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5473あるいは配列番号:5509に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5524を含むPAMに結合するように構成される。
【0029】
いくつかの実施形態では、エンドヌクレアーゼは、配列番号:3475あるいは配列番号:3475-3568からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5291あるいは配列番号:5291-5389からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5694-5699からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1656あるいは配列番号:1656-1755からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5474あるいは配列番号:5510に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5525を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:3475に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5474あるいは配列番号:5510に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5525を含むPAMに結合するように構成される。
【0030】
いくつかの実施形態では、エンドヌクレアーゼは、配列番号:3569あるいは配列番号:3569-3637からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5390あるいは配列番号:5390-5460からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは配列番号:5700-5717からなる群から選択される少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:1756あるいは配列番号:1756-1826からなる群から選択される配列に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号:5475あるいは配列番号:5511に対して少なくとも70%、80%、または90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5526を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号:3569に対して少なくとも70%、80%、または90%同一である配列を含み;(b)ガイドRNA構造は、配列番号:5475あるいは配列番号:5511に対して少なくとも70%、80%、または90%同一である配列を含み;および(c)エンドヌクレアーゼは、配列番号:5526を含むPAMに結合するように構成される。いくつかの実施形態では、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、またはSmith-Waterman相同性検索アルゴリズムによって決定される。いくつかの実施形態では、配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータ、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリックスのパラメータを使用して、ならびに条件付き組成スコアマトリックス調整(conditional compositional score matrix adjustment)を使用して、BLASTP相同性検索アルゴリズムによって決定される。
【0031】
いくつかの態様では、本開示は操作されたガイドリボ核酸ポリヌクレオチドを提供し、上記操作されたガイドリボ核酸ポリヌクレオチドは:(a)標的DNA分子中の標的配列に相補的なヌクレオチド配列を含むDNA標的化セグメントと;(b)ハイブリダイズして二本鎖RNA(dsRNA)二重鎖を形成するヌクレオチドの2つの相補的なストレッチを含むタンパク質結合セグメントであって、ここで、上記ヌクレオチドの2つの相補的なストレッチは介在ヌクレオチドで互いに共有結合し、ここで、上記操作されたガイドリボ核酸ポリヌクレオチドは、配列番号:1827-3637のいずれか1つに対して少なくとも75%の配列同一性を有するRuvC_IIIドメインを含むエンドヌクレアーゼと複合体を形成し、上記複合体を標的DNA分子の標的配列に標的化するように構成される。いくつかの実施形態では、DNA標的化セグメントは、ヌクレオチドの2つの相補的なストレッチの両方の5’に位置する。
【0032】
いくつかの実施形態では、(a)タンパク質結合セグメントは、配列番号:5476-5479あるいは配列番号:5476-5489からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(b)タンパク質結合セグメントは、(配列番号:5490-5491あるいは配列番号:5490-5494)および配列番号:5538からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(c)タンパク質結合セグメントは、配列番号:5498-5499からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(d)タンパク質結合セグメントは、配列番号:5495-5497および配列番号:5500-5502からなる群から選択される配列に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(e)タンパク質結合セグメントは、配列番号:5503に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(f)タンパク質結合セグメントは、配列番号:5504に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(g)タンパク質結合セグメントは、配列番号:5505に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(h)タンパク質結合セグメントは、配列番号:5506に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(i)タンパク質結合セグメントは、配列番号:5507に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(j)タンパク質結合セグメントは、配列番号:5508に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(k)タンパク質結合セグメントは、配列番号:5509に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;(l)タンパク質結合セグメントは、配列番号:5510に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含み;あるいは、(m)タンパク質結合セグメントは、配列番号:5511に対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含む。
【0033】
いくつかの実施形態では、(a)ガイドリボ核酸ポリヌクレオチドは、ステムとループとを含むヘアピンを含むRNA配列を含み、ここで、上記ステムは、少なくとも10、少なくとも12、または少なくとも14の塩基対のリボヌクレオチド、および上記ループの4つの塩基対内の非対称バルジを含み;(b)ガイドリボ核酸ポリヌクレオチドは、少なくとも8、少なくとも10、または少なくとも12の塩基対のリボヌクレオチドを含むヘアピンを含むと予想されるtracrリボ核酸配列を含み;(c)ガイドリボ核酸ポリヌクレオチドは、ガイドリボ核酸配列の少なくとも8つのヌクレオチドとtracrリボ核酸配列の少なくとも8つのヌクレオチドとを含む中断されていない塩基対領域を有するヘアピンを含むと予想されるガイドリボ核酸配列を含み、ここで、上記tracrリボ核酸配列は、5’から3’に、第1のヘアピンと第2のヘアピンとを含み、ここで、上記第1のヘアピンは上記第2のヘアピンよりも長いステムを有し;あるいは、(d)ガイドリボ核酸ポリヌクレオチドは、5つ未満の塩基対のリボヌクレオチドを含む少なくとも2つのヘアピンを含むと予想されるtracrリボ核酸配列を含む。
【0034】
いくつかの態様では、本開示は、本明細書に記載される操作されたガイドリボ核酸ポリヌクレオチドのいずれかをコードするデオキシリボ核酸ポリヌクレオチドを提供する。
【0035】
いくつかの態様では、本開示は、生物における発現のために最適化された、操作された核酸配列を含む核酸を提供し、ここで、上記核酸は、RuvC_IIIドメインとHNHドメインとを含むクラス2のII型Casエンドヌクレアーゼをコードし、ここで、上記クラス2のII型Casエンドヌクレアーゼは、難培養性微生物に由来する。
【0036】
いくつかの態様では、本開示は、生物における発現のために最適化された、操作された核酸配列を含む核酸を提供し、ここで、上記核酸は、配列番号:1827-3637のいずれか1つに対して少なくとも70%の配列同一性を有するRuvC_IIIドメインを含むエンドヌクレアーゼをコードする。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:3638-5460のいずれか1つに対して少なくとも70%または少なくとも80%の配列同一性を有するHNHドメインを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号:5572-5591またはそれらに対して少なくとも70%の配列同一性を有するその変異体を含む。いくつかの実施形態では、エンドヌクレアーゼは、エンドヌクレアーゼのN末端またはC末端の近位にある1つ以上の核局在化配列(NLS)をコードする配列を含む。いくつかの実施形態では、NLSは、配列番号:5597-5612から選択される配列を含む。
【0037】
いくつかの実施形態では、生物は、原核生物、細菌、真核生物、真菌、植物、哺乳動物、げっ歯類、またはヒトである。いくつかの実施形態では、生物は大腸菌であり、および:(a)核酸配列は、配列番号:5572-5575からなる群から選択される配列に対して少なくとも70%、80%、または90%の同一性を有する;(b)核酸配列は、配列番号:5576-5577からなる群から選択される配列に対して少なくとも70%、80%、または90%の同一性を有する;(c)核酸配列は、配列番号:5578-5580からなる群から選択される配列に対して少なくとも70%、80%、または90%の同一性を有する;(d)核酸配列は、配列番号:5581に対して少なくとも70%、80%、または90%の同一性を有する;(e)核酸配列は、配列番号:5582に対して少なくとも70%、80%、または90%の同一性を有する;(f)核酸配列は、配列番号:5583に対して少なくとも70%、80%、または90%の同一性を有する;(g)核酸配列は、配列番号:5584に対して少なくとも70%、80%、または90%の同一性を有する;(h)核酸配列は、配列番号:5585に対して少なくとも70%、80%、または90%の同一性を有する;(i)核酸配列は、配列番号:5586に対して少なくとも70%、80%、または90%の同一性を有する;あるいは、(j)核酸配列は、配列番号:5587に対して少なくとも70%、80%、または90%の同一性を有する。いくつかの実施形態では、生物はヒトであり、および:(a)核酸配列は、配列番号:5588あるいは配列番号:5589に対して少なくとも70%、80%、または90%の同一性を有する;あるいは、(b)核酸配列は、配列番号:5590あるいは配列番号:5591に対して少なくとも70%、80%、または90%の同一性を有する。
【0038】
いくつかの態様では、本開示は、RuvC_IIIドメインとHNHドメインとを含むクラス2のII型Casエンドヌクレアーゼをコードする核酸配列を含むベクターを提供し、ここで、上記エンドヌクレアーゼは難培養性微生物に由来する。
【0039】
いくつかの態様では、本開示は、本明細書に記載される核酸のいずれかを含むベクターを提供する。いくつかの実施形態では、ベクターは、エンドヌクレアーゼと複合体を形成するように構成される操作されたガイドリボ核酸構造をコードする核酸をさらに含み、上記操作されたガイドリボ核酸構造は:(a)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と;(b)エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列と、を含む。いくつかの実施形態では、ベクターは、プラスミド、ミニサークル、CELiD、アデノ随伴ウイルス(AAV)由来のビリオン、またはレンチウイルスである。
【0040】
いくつかの態様では、本開示は、本明細書に記載されるベクターのいずれかを含む細胞を提供する。
【0041】
いくつかの態様では、本開示は、エンドヌクレアーゼを製造する方法を提供し、上記方法は、本明細書に記載される細胞のいずれかを培養する工程を含む。
【0042】
いくつかの態様では、本開示は、二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、標識、または修飾するための方法を提供し、上記方法は:(a)クラス2のII型Casエンドヌクレアーゼおよび上記二本鎖デオキシリボ核酸ポリヌクレオチドに結合するように構成される操作されたガイドリボ核酸構造と複合体を形成するクラス2のII型Casエンドヌクレアーゼに、上記二本鎖デオキシリボ核酸ポリヌクレオチドを接触させる工程を含み;(b)ここで、上記二本鎖デオキシリボ核酸ポリヌクレオチドは、プロトスペーサー隣接モチーフ(PAM)を含み;(c)上記PAMは、配列番号:5512-5526あるいは配列番号:5527-5537からなる群から選択される配列を含む。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、操作されたガイドリボ核酸構造の配列に相補的な配列を含む第1の鎖と、PAMを含む第2の鎖とを含む。いくつかの実施形態では、PAMは、操作されたガイドリボ核酸構造の配列に相補的な配列の3’末端に直接隣接している。
【0043】
いくつかの実施形態では、クラス2のII型Casエンドヌクレアーゼは、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、またはCas13dエンドヌクレアーゼではない。いくつかの実施形態では、クラス2のII型Casエンドヌクレアーゼは、難培養性微生物に由来する。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、真核生物、植物、真菌、哺乳動物、げっ歯類、またはヒトの二本鎖デオキシリボ核酸ポリヌクレオチドである。
【0044】
いくつかの実施形態では、(a)PAMは、配列番号:5512-5515および配列番号:5527-5530からなる群から選択される配列を含む;(b)PAMは配列番号:5516あるいは配列番号:5531を含む;(c)PAMは配列番号:5539を含む;(d)PAMは配列番号:5517あるいは配列番号:5518を含む;(e)PAMは配列番号:5519を含む;(f)PAMは配列番号:5520あるいは配列番号:5535を含む;(g)PAMは配列番号:5521あるいは配列番号:5536を含む;(h)PAMは配列番号:5522を含む;(i)PAMは配列番号:5523あるいは配列番号:5537を含む;(j)PAMは配列番号:5524を含む;(k)PAMは配列番号:5525を含む;または、(l)PAMは配列番号:5526を含む。
【0045】
いくつかの態様では、本開示は、標的核酸遺伝子座を改変するための方法を提供し、上記方法は、本明細書に記載される操作されたヌクレアーゼシステムのいずれかを上記標的核酸遺伝子座に送達する工程を含み、ここで、エンドヌクレアーゼは、操作されたガイドリボ核酸構造と複合体を形成するように構成され、ここで、上記複合体は、上記複合体が上記標的核酸遺伝子座に結合すると、上記複合体が標的核酸遺伝子座を改変するように構成される。いくつかの実施形態では、標的核酸遺伝子座を改変することは、標的核酸遺伝子座を結合、ニッキング、切断、標識することを含む。いくつかの実施形態では、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。いくつかの実施形態では、標的核酸は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含む。いくつかの実施形態では、標的核酸遺伝子座はインビトロである。いくつかの実施形態では、標的核酸遺伝子座は細胞内にある。いくつかの実施形態では、細胞は、原核細胞、細菌細胞、真核細胞、真菌細胞、植物細胞、動物細胞、哺乳動物細胞、げっ歯類細胞、霊長類細胞、またはヒト細胞である。
【0046】
いくつかの実施形態では、操作されたヌクレアーゼシステムを標的核酸遺伝子座に送達することは、請求項135-140のいずれかに記載の核酸または請求項142-146のいずれかに記載のベクターを送達することを含む。いくつかの実施形態では、操作されたヌクレアーゼシステムを標的核酸遺伝子座に送達することは、エンドヌクレアーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む。いくつかの実施形態では、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されるプロモーターを含む。いくつかの実施形態では、標的核酸遺伝子座への操作されたヌクレアーゼシステムは、エンドヌクレアーゼをコードするオープンリーディングフレームを含有するキャップされたmRNA(capped mRNA)を送達することを含む。いくつかの実施形態では、標的核酸遺伝子座への操作されたヌクレアーゼシステムは、翻訳されたポリペプチドを送達することを含む。いくつかの実施形態では、標的核酸遺伝子座への操作されたヌクレアーゼシステムは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結される操作されたガイドリボ核酸構造をコードするデオキシリボ核酸(DNA)を送達することを含む。いくつかの実施形態では、エンドヌクレアーゼは、標的遺伝子座で、またはその近位で、一本鎖切断または二本鎖切断を引き起こす。
【0047】
本開示のさらなる態様および利点は、以下の詳細な説明から当業者に容易に明白となり、ここでは、本開示の例示的な実施形態のみが示され、説明されている。理解されるように、本開示は、他の実施形態および異なる実施形態においても可能であり、その様々な詳細は、そのすべてが本開示から逸脱することなく様々な明白な点で修正することができる。したがって、図面および説明は本来、例示的なものとしてみなされ、限定的なものであるとはみなされない。
【0048】
参照による組み込み
本明細書で言及される全ての出版物、特許、および特許出願は、あたかも個々の出版物、特許、または特許出願が参照によって組み込まれるよう具体的かつ個別に示されるかのように、同じ程度まで参照により本明細書に組み込まれる。
【図面の簡単な説明】
【0049】
本発明の新規な特徴は、とりわけ、添付の特許請求の範囲内に明記される。本発明の特徴および利点のより良い理解は、本発明の原理が用いられる例示的実施形態を説明する以下の詳細な説明と、以下の添付図面(本明細書では「図(”Figure”および”FIG.”)」とも称される)とを参照することによって得られるであろう。
【0050】
図1】様々なクラスおよび型のCRISPR/Cas遺伝子座の典型的な組織を示す。
図2】両方が結合されるハイブリッドsgRNAと比較した、天然のクラス2/II型crRNA/tracrRNAペアの構造を示す。
図3】MG1ファミリーからの酵素をコードするCRISPR遺伝子座の構成を示す概念図を示す。
図4】MG2ファミリーからの酵素をコードするCRISPR遺伝子座の構成を示す概念図を示す。
図5】MG3ファミリーからの酵素をコードするCRISPR遺伝子座の構成を示す概念図を示す。
図6】黄色ブドウ球菌からのCas9(配列番号:5613)に対する、本開示(MG1-1)の酵素の構造に基づいたアラインメントを示す。
図7】黄色ブドウ球菌からのCas9(配列番号:5613)に対する、本開示(MG2-1)の酵素の構造に基づいたアラインメントを示す。
図8】Actinomyces naeslundiiからのCas9(配列番号:5614)に対する、本開示(MG3-1)の酵素の構造に基づいたアラインメントを示す。
図9A】MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。
図9B】MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。
図9C】MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。
図9D】MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。
図9E】MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。
図9F】MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。
図9G】MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。
図9H】MG1ファミリー酵素MG1-1~MG1-6(配列番号:5、6、9、1、2、および3)の構造に基づいたアラインメントを示す。
図10】様々な長さの標的化配列を含有するその対応するsgRNAと複合体を形成するMG1-4による、DNAのインビトロ切断を示す。
図11】MG1-4とその対応するsgRNAを使用した、大腸菌ゲノムDNAの細胞切断を示す。標的スペーサーまたは非標的スペーサーと共にMG1-4で形質転換された細胞の希釈系列が示される(上);下パネルは定量化されたデータを示し、左のバーは非標的sgRNAを表し、右のバーは標的sgRNAを表す。
図12】ヒトゲノム中の様々な位置を標的とする様々な異なる標的化配列を含有するそれらの対応するsgRNAと一緒に、実施例11に記載されるMG1-4またはMG1-6の構築物を用いたHEK細胞のトランスフェクションによって生成された細胞インデル形成を示す。
図13】様々な長さの標的化配列を含有するその対応するsgRNAと複合体を形成するMG3-6によるDNAのビトロ切断を示す。
図14】MG3-7とその対応するsgRNAを使用した、大腸菌ゲノムDNAの細胞切断を示す。標的スペーサーまたは非標的スペーサーと共にMG3-7で形質転換された細胞の希釈系列が示される(上);下パネルは定量化されたデータを示し、左のバーは非標的sgRNAを表し、右のバーは標的sgRNAを表す。
図15】ヒトゲノム中の様々な位置を標的とする様々な異なる標的化配列を含有するそれらの対応するsgRNAと一緒に、実施例13に記載されるMG3-7の構築物を用いたHEK細胞のトランスフェクションによって生成された細胞インデル形成を示す。
図16】様々な長さの標的化配列を含有するその対応するsgRNAと複合体を形成するMG15-1によるDNAのインビトロ切断を示す。
図17】アガロースゲルを示し、これは、様々なMGファミリーのヌクレアーゼおよびそれらの対応するtracrRNAまたはsgRNAを含有するTXTL抽出物の存在下でのPAMベクターライブラリー切断の結果を示す。
図18】アガロースゲルを示し、これは、様々なMGファミリーのヌクレアーゼおよびそれらの対応するtracrRNAまたはsgRNAを含有するTXTL抽出物の存在下でのPAMベクターライブラリー切断の結果を示す。
図19】アガロースゲルを示し、これは、様々なMGファミリーのヌクレアーゼおよびそれらの対応するtracrRNAまたはsgRNAを含有するTXTL抽出物の存在下でのPAMベクターライブラリー切断の結果を示す。
図20】アガロースゲルを示し、これは、様々なMGファミリーのヌクレアーゼおよびそれらの対応するtracrRNAまたはsgRNAを含有するTXTL抽出物の存在下でのPAMベクターライブラリー切断の結果を示す。
図21】本明細書に記載されるMG酵素の対応するsgRNAの予想される構造(例えば、実施例7でのように予想される)を示す。
図22】本明細書に記載されるMG酵素の対応するsgRNAの予想される構造(例えば、実施例7でのように予想される)を示す。
図23】本明細書に記載されるMG酵素の対応するsgRNAの予想される構造(例えば、実施例7でのように予想される)を示す。
図24】本明細書に記載されるMG酵素の対応するsgRNAの予想される構造(例えば、実施例7でのように予想される)を示す。
図25】本明細書に記載されるMG酵素の対応するsgRNAの予想される構造(例えば、実施例7でのように予想される)を示す。
図26】本明細書に記載されるMG酵素の対応するsgRNAの予想される構造(例えば、実施例7でのように予想される)を示す。
図27】本明細書に記載される(例えば、実施例6に記載される)NGSを介して導き出されたPAM配列のseqLogo表現を示す。
図28】本明細書に記載される(例えば、実施例6に記載される)NGSを介して導き出されたPAM配列のseqLogo表現を示す。
図29】本明細書に記載される(例えば、実施例6に記載される)NGSを介して導き出されたPAM配列のseqLogo表現を示す。
図30】本明細書に記載される(例えば、実施例6に記載される)NGSを介して導き出されたPAM配列のseqLogo表現を示す。
図31】本明細書に記載される(例えば、実施例6に記載される)NGSを介して導き出されたPAM配列のseqLogo表現を示す。
図32】本明細書に記載される(例えば、実施例6に記載される)NGSを介して導き出されたPAM配列のseqLogo表現を示す。
図33】本明細書に記載される(例えば、実施例6に記載される)NGSを介して導き出されたPAM配列のseqLogo表現を示す。
図34】MG2-7とその対応するsgRNAを使用した、大腸菌ゲノムDNAの細胞切断を示す。標的スペーサーまたは非標的スペーサーと共にMG2-7で形質転換された細胞の希釈系列が示される(上);下パネルは定量化されたデータを示し、右のバーは非標的sgRNAを表し、左のバーは標的sgRNAを表す。
図35】MG14-1とその対応するsgRNAを使用した、大腸菌ゲノムDNAの細胞切断を示す。標的スペーサーまたは非標的スペーサーと共にMG14-1で形質転換された細胞の希釈系列が示される(上);下パネルは定量化されたデータを示し、右のバーは非標的sgRNAを表し、左のバーは標的sgRNAを表す。
図36】MG15-1とその対応するsgRNAを使用した、大腸菌ゲノムDNAの細胞切断を示す。標的スペーサーまたは非標的スペーサーと共にMG15-1で形質転換された細胞の希釈系列が示される(上);下パネルは定量化されたデータを示し、右のバーは非標的sgRNAを表し、左のバーは標的sgRNAを表す。
【0051】
配列表の簡単な説明
本明細書とともに出願された配列表は、本開示の方法、組成物、およびシステムで使用される例示的なポリヌクレオチドおよびポリペプチド配列を提供する。以下は配列表における配列の例示的な説明である。
【0052】
MG1
【0053】
配列番号:1-319は、MG1ヌクレアーゼの完全長ペプチド配列を示す。
【0054】
配列番号:1827-2140は、上記のMG1ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
【0055】
配列番号:3638-3955は、上記のMG1ヌクレアーゼのHNHドメインのペプチドを示す。
【0056】
配列番号:5476-5479は、上記のMG1ヌクレアーゼと同じ遺伝子座(例えば、それぞれ配列番号:1-4と同じ遺伝子座)に由来するMG1 tracrRNAのヌクレオチド配列を示す。
【0057】
配列番号:5461-5464は、MG1ヌクレアーゼ(例えば、それぞれ配列番号:1-4)と機能するように操作されたsgRNAのヌクレオチド配列を示し、ここで、Nsは標的化配列のヌクレオチドを表示する。
【0058】
配列番号:5572-5575は、MG1ファミリー酵素(配列番号:1-4)の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。
【0059】
配列番号:5588-5589は、MG1ファミリー酵素(配列番号:1および3)のヒトのコドン最適化コード配列のヌクレオチド配列を示す。
【0060】
配列番号:5616-5632は、MG1ファミリー酵素のペプチドモチーフ特性を示す。
【0061】
MG2
【0062】
配列番号:320-420は、MG2ヌクレアーゼの完全長ペプチド配列を示す。
【0063】
配列番号:2141-2241は、上記のMG2ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
【0064】
配列番号:3955-4055は、上記のMG2ヌクレアーゼのHNHドメインのペプチドを示す。
【0065】
配列番号:5490-5494は、上記のMG2ヌクレアーゼと同じ遺伝子座(例えば、それぞれ配列番号:320、321、323、325、および326と同じ遺伝子座)に由来するMG2 tracrRNAのヌクレオチド配列を示す。
【0066】
配列番号:5465は、MG2ヌクレアーゼ(例えば、上記の配列番号:321)と機能するように操作されたsgRNAのヌクレオチド配列を示す。
【0067】
配列番号:5572-5575は、MG2ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。
【0068】
配列番号:5631-5638は、MG2ファミリー酵素のペプチド配列特性を示す。
【0069】
MG3
【0070】
配列番号:421-431は、MG3ヌクレアーゼの完全長ペプチド配列を示す。
【0071】
配列番号:2242-2251は、上記のMG3ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
【0072】
配列番号:4056-4066は、上記のMG3ヌクレアーゼのHNHドメインのペプチドを示す。
【0073】
配列番号:5495-5502は、上記のMG3ヌクレアーゼと同じ遺伝子座(例えば、それぞれ配列番号:421-428と同じ遺伝子座)に由来するMG3 tracrRNAのヌクレオチド配列を示す。
【0074】
配列番号:5466-5467は、MG3ヌクレアーゼ(例えば、配列番号:421-423)と機能するように操作されたsgRNAのヌクレオチド配列を示す。
【0075】
配列番号:5578-5580は、MG3ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。
【0076】
配列番号:5639-5648は、MG3ファミリー酵素のペプチド配列特性を示す。
【0077】
MG4
【0078】
配列番号:432-660は、MG4ヌクレアーゼの完全長ペプチド配列を示す。
【0079】
配列番号:2253-2481は、上記のMG4ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
【0080】
配列番号:4067-4295は、上記のMG4ヌクレアーゼのHNHドメインのペプチドを示す。
【0081】
配列番号:5503は、上記のMG4ヌクレアーゼと同じ遺伝子座に由来するMG4 tracrRNAのヌクレオチド配列を示す。
【0082】
配列番号:5468は、MG4ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示す。
【0083】
配列番号:5649は、MG4ファミリー酵素のペプチド配列特性を示す。
【0084】
MG6
【0085】
配列番号:661-668は、MG6ヌクレアーゼの完全長ペプチド配列を示す。
【0086】
配列番号:2482-2489は、上記のMG6ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
【0087】
配列番号:4296-4303は、上記のMG3ヌクレアーゼのHNHドメインのペプチドを示す。
【0088】
MG7
【0089】
配列番号:669-677は、MG7ヌクレアーゼの完全長ペプチド配列を示す。
【0090】
配列番号:2490-2498は、上記のMG7ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
【0091】
配列番号:4304-4312は、上記のMG3ヌクレアーゼのHNHドメインのペプチドを示す。
【0092】
配列番号:5504は、上記のMG7ヌクレアーゼと同じ遺伝子座に由来するMG7 tracrRNAのヌクレオチド配列を示す。
【0093】
MG14配列番号:678-929は、MG14ヌクレアーゼの完全長ペプチド配列を示す。
【0094】
配列番号:2499-2750は、上記のMG14ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
【0095】
配列番号:4313-4564は、上記のMG14ヌクレアーゼのHNHドメインのペプチドを示す。
【0096】
配列番号:5505は、上記のMG14ヌクレアーゼと同じ遺伝子座に由来するMG14 tracrRNAのヌクレオチド配列を示す。
【0097】
配列番号:5581は、MG14ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。
【0098】
配列番号:5650-5667は、MG14ファミリー酵素のペプチド配列特性を示す。
【0099】
MG15
【0100】
配列番号:930-1092は、MG15ヌクレアーゼの完全長ペプチド配列を示す。
【0101】
配列番号:2751-2913は、上記のMG15ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
【0102】
配列番号:4565-4727は、上記のMG15ヌクレアーゼのHNHドメインのペプチドを示す。
【0103】
配列番号:5506は、上記のMG15ヌクレアーゼと同じ遺伝子座に由来するMG15 tracrRNAのヌクレオチド配列を示す。
【0104】
配列番号:5470は、MG15ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示す。
【0105】
配列番号:5582は、MG15ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。
【0106】
配列番号:5668-5675は、MG15ファミリー酵素のペプチド配列特性を示す。
【0107】
MG16
【0108】
配列番号:1093-1353は、MG16ヌクレアーゼの完全長ペプチド配列を示す。
【0109】
配列番号:2914-3174は、上記のMG16ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
【0110】
配列番号:4728-4988は、上記のMG16ヌクレアーゼのHNHドメインのペプチドを示す。
【0111】
配列番号:5507は、上記のMG3ヌクレアーゼと同じ遺伝子座に由来するMG16 tracrRNAのヌクレオチド配列を示す。
【0112】
配列番号:5471は、MG16ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示す。
【0113】
配列番号:5583は、MG16ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。
【0114】
配列番号:5676-5678は、MG16ファミリー酵素のペプチド配列特性を示す。
【0115】
MG18
【0116】
配列番号:1354-1511は、MG18ヌクレアーゼの完全長ペプチド配列を示す。
【0117】
配列番号:3175-3330は、上記のMG18ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
【0118】
配列番号:4989-5146は、上記のMG18ヌクレアーゼのHNHドメインのペプチドを示す。
【0119】
配列番号:5508は、上記のMG18ヌクレアーゼと同じ遺伝子座に由来するMG18 tracrRNAのヌクレオチド配列を示す。
【0120】
配列番号:5472は、MG18ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示す。
【0121】
配列番号:5584は、MG18ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。
【0122】
配列番号:5679-5686は、MG18ファミリー酵素のペプチド配列特性を示す。
【0123】
MG21
【0124】
配列番号:1512-1655は、MG21ヌクレアーゼの完全長ペプチド配列を示す。
【0125】
配列番号:3331-3474は、上記のMG21ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
【0126】
配列番号:5147-5290は、上記のMG21ヌクレアーゼのHNHドメインのペプチドを示す。
【0127】
配列番号:5509は、上記のMG21ヌクレアーゼと同じ遺伝子座に由来するMG21 tracrRNAのヌクレオチド配列を示す。
【0128】
配列番号:5473は、MG21ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示す。
【0129】
配列番号:5585は、MG21ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。
【0130】
配列番号:5687-5692および5674-5675は、MG21ファミリー酵素のペプチド配列特性を示す。
【0131】
MG22
【0132】
配列番号:1656-1755は、MG22ヌクレアーゼの完全長ペプチド配列を示す。
【0133】
配列番号:3475-3568は、上記のMG22ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
【0134】
配列番号:5291-5389は、上記のMG22ヌクレアーゼのHNHドメインのペプチドを示す。
【0135】
配列番号:5510は、上記のMG22ヌクレアーゼと同じ遺伝子座に由来するMG22 tracrRNAのヌクレオチド配列を示す。
【0136】
配列番号:5474は、MG22ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示す。
【0137】
配列番号:5586は、MG22ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。
【0138】
配列番号:5694-5699は、MG22ファミリー酵素のペプチド配列特性を示す。
【0139】
MG23
【0140】
配列番号:1756-1826は、MG23ヌクレアーゼの完全長ペプチド配列を示す。
【0141】
配列番号:3569-3637は、上記のMG23ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
【0142】
配列番号:5390-5460は、上記のMG23ヌクレアーゼのHNHドメインのペプチドを示す。
【0143】
配列番号:5511は、上記のMG23ヌクレアーゼと同じ遺伝子座に由来するMG23 tracrRNAのヌクレオチド配列を示す。
【0144】
配列番号:5475は、MG23ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示す。
【0145】
配列番号:5587は、MG23ファミリー酵素の大腸菌のコドン最適化コード配列のヌクレオチド配列を示す。
【0146】
配列番号:5700-5717は、MG23ファミリー酵素のペプチド配列特性を示す。
【発明を実施するための形態】
【0147】
本発明の様々な実施形態が本明細書中で示され、かつ説明されているが、このような実施形態はほんの一例として提供されるものであることは、当業者には明らかであろう。多数の変形、変更、および置き換えは、本発明から逸脱することなく、当業者によって想到され得る。本明細書に記載される本発明の実施形態の様々な代案が利用され得ることを理解されたい。
【0148】
本明細書で開示されるいくつかの方法の実施は、特段の定めのない限り、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノミクス、および組換えDNAの技術を利用する。例えば、Sambrook and Green,Molecular Cloning:A Laboratory Manual,4th Edition(2012);the series Current Protocols in Molecular Biology(F.M.Ausubel,et al.eds.);the series Methods In Enzymology(Academic Press,Inc.),PCR 2:A Practical Approach(M.J.MacPherson,B.D.Hames and G.R.Taylor eds.(1995)),Harlow and Lane,eds.(1988)Antibodies,A Laboratory Manual,and Culture of Animal Cells:A Manual of Basic Technique and Specialized Applications,6th Edition(R.I.Freshney,ed.(2010)))(これらは、参照によりその全体が本明細書に組み込まれる)。
【0149】
本明細書で使用されるように、単数形「1つ(a)」、「1つ(an)」、および「その(the)」は、文脈上他の意味を明白に示すものでない限り、同様に複数形を含むことを意図している。さらに、用語「含んでいる(including)」、「含む(includes)」、「有している(having)」、「有する(has)」、「含んだ(with)」、または、その変異形態が詳細な記載および/または請求項のいずれかで使用される程度には、上記のような用語は「含んでいる(comprising)」との用語に類似する手法で包括的であることを意図している。
【0150】
「約」または「およそ」との用語は、当業者によって決定されるような特定の値の許容可能な誤差範囲内であることを意味し、その誤差範囲は、その値がどのように測定または決定されるか、つまり、測定システムの制限に部分的に依存する。例えば、「約」とは、当該技術分野での実践につき1または1を超える標準偏差を意味し得る。代替的に、「約」は、任意の値の最大20%、最大15%、最大10%、最大5%、または最大1%の範囲を意味する場合がある。
【0151】
本明細書で使用されるように、「細胞」とは一般に、生体細胞を指す。細胞は、生体の基本構造単位、機能単位、および/または生物学的単位であり得る。細胞は、1つ以上の細胞を有する任意の生物に起源を持つ場合がある。いくつかの非限定的な例としては、原核細胞、真核細胞、細菌細胞、古細菌細胞、単一細胞の真核生物の細胞、原生動物細胞、植物の細胞(例えば、作物、果物、野菜、穀類、ダイズ、トウモロコシ(corn)、トウモロコシ(maize)、小麦、種子、トマト、イネ、キャッサバ、サトウキビ、カボチャ、干し草、ジャガイモ、綿、アサ、タバコ、顕花植物、針葉樹、裸子植物、シダ、ヒカゲノカズラ類、ツノゴケ類、苔類、蘚類の細胞)、藻細胞(例えば、Botryococcus braunii、Chlamydomonas reinhardti、Nannochloropsis gaditana、Chlorella pyrenoidosa、Sargassum patens C.Agardhなど)、海草(例えば、ケルプ)、真菌細胞(例えば、酵母菌細胞、キノコからの細胞)、動物細胞、無脊髄動物(例えば、ショウジョウバエ、刺胞動物、棘皮動物、線虫など)の細胞、脊椎動物(例えば、魚、両生類、爬虫類、鳥、哺乳動物)の細胞、哺乳動物(例えば、ブタ、雌ウシ、ヤギ、ヒツジ、げっ歯類、ラット、マウス、非ヒト霊長類、ヒトなど)の細胞などが挙げられる。細胞は、天然の生物に起源を持たないこともある(例えば、細胞は合成的に作られ、人工細胞と呼ばれることもある)。
【0152】
「ヌクレオチド」との用語は、本明細書で使用されるように、一般に、塩基-糖-リン酸塩の組み合わせを指す。ヌクレオチドは合成ヌクレオチドを含むことがある。ヌクレオチドは合成ヌクレオチドアナログを含むことがある。ヌクレオチドは、核酸配列(例えば、デオキシリボ核酸(DNA)およびリボ核酸(RNA))の単量体単位である場合がある。ヌクレオチドとの用語には、リボヌクレオシド三リン酸アデノシン三リン酸(ATP)、ウリジン三リン酸(UTP)、シトシン三リン酸(CTP)、グアノシン三リン酸(GTP)、およびデオキシリボヌクレオシド三リン酸、例えば、dATP、dCTP、dITP、dUTP、dGTP、dTTP、またはそれらの誘導体が含まれ得る。そのような誘導体は、例えば、[αS]dATP、7-デアザ-dGTPおよび7-デアザ-dATP、および、それらを含有する核酸分子にヌクレアーゼ耐性を与えるヌクレオチド誘導体を含む場合がある。ヌクレオチドとの用語は、本明細書に使用されるように、ジデオキシリボヌクレオシド三リン酸(ddNTP)およびそれらの誘導体を指し得る。ジデオキシリボヌクレオシド三リン酸の例示的な例としては、限定されないが、ddATP、ddCTP、ddGTP、ddITP、およびddTTPが挙げられ得る。ヌクレオチドは標識されない場合があるか、または、光学的に検出可能な部分(例えば、フルオロフォア)を含む部分を使用するなどして、検出できるように標識される場合がある。標識化はまた、量子ドットを用いて実施されてもよい。検出可能な標識としては、例えば、放射性同位元素、蛍光標識、化学発光標識、生物発光標識、および酵素標識が挙げられ得る。ヌクレオチドの蛍光標識としては、限定されないが、フルオレセイン、5-カルボキシフルオセイン(FAM)、2’7’-ジメトキシ-4’5-ジクロロ-6-カルボキシフルオセイン(JOE)、ローダミン、6-カルボキシローダミン(R6G)、N,N,N’,N’-テトラメチル-6-カルボキシローダミン(TAMRA)、6-カルボキシ-X-ローダミン(ROX)、4-(4’ジメチルアミノフェニルアゾ)安息香酸(DABCYL)、Cascade Blue、Oregon Green、Texas Red、シアニン、および5-(2’-アミノエチル)アミノナフタレン-1-スルホン酸(EDANS)が挙げられ得る。蛍光標識されたヌクレオチドの特定の例としては、Perkin Elmer(Foster City,Calif)から利用可能な[R6G]dUTP、[TAMRA]dUTP、[R110]dCTP、[R6G]dCTP、[TAMRA]dCTP、[JOE]ddATP、[R6G]ddATP、[FAM]ddCTP、[R110]ddCTP、[TAMRA]ddGTP、[ROX]ddTTP、[dR6G]ddATP、[dR110]ddCTP、[dTAMRA]ddGTP、および[dROX]ddTTP;Amersham(Arlington Heights,Ill)から利用可能なFluoroLink DeoxyNucleotides、FluoroLink Cy3-dCTP、FluoroLink Cy5-dCTP、FluoroLink Fluor X-dCTP、FluoroLink Cy3-dUTP、およびFluoroLink Cy5-dUTP;Boehringer Mannheim(Indianapolis,Ind.)から利用可能なフルオレセイン-15-dATP、フルオレセイン-12-dUTP、テトラメチル-rodamine-6-dUTP、IR770-9-dATP、フルオレセイン-12-ddUTP、フルオレセイン-12-UTP、およびフルオレセイン-15-2’-dATP;および、Molecular Probes(Eugene,Oreg)から利用可能なChromosome Labeled Nucleotides、BODIPY-FL-14-UTP、BODIPY-FL-4-UTP、BODIPY-TMR-14-UTP、BODIPY-TMR-14-dUTP、BODIPY-TR-14-UTP、BODIPY-TR-14-dUTP、Cascade Blue-7-UTP、Cascade Blue-7-dUTP、フルオレセイン-12-UTP、フルオレセイン-12-dUTP、Oregon Green 488-5-dUTP、ローダミン Green-5-UTP、ローダミン Green-5-dUTP、テトラメチルローダミン6-UTP、テトラメチルローダミン6-dUTP、Texas Red-5-UTP、Texas Red-5-dUTP、およびTexas Red-12-dUTPが挙げられ得る。ヌクレオチドも化学修飾によって標識(labeled)または標識(marked)され得る。化学的に修飾された単一ヌクレオチドはビオチンdNTPである場合がある。ビオチン化されたdNTPのいくつかの非限定的な例としては、ビオチン-dATP(例えば、bio-N6-ddATP、biotin-14-dATP)、ビオチン-dCTP(例えば、ビオチン-11-dCTP、ビオチン-14-dCTP)、およびビオチン-dUTP(例えば、ビオチン-11-dUTP、ビオチン-16-dUTP、ビオチン-20-dUTP)が挙げられ得る。
【0153】
「ポリヌクレオチド」、「オリゴヌクレオチド」、および「核酸」との用語は、一般に、一本鎖、二本鎖、あるいは多重鎖(multi-stranded)の形態のいずれかの、任意の長さのヌクレオチドの高分子形態((デオキシリボヌクレオチドまたはリボヌクレオチドのいずれか)、またはそのアナログを指すために交換可能に使用される。ポリヌクレオチドは、細胞に対して外因性または内因性であり得る。ポリヌクレオチドは、無細胞環境に存在することがある。ポリヌクレオチドは、遺伝子またはその断片であることがある。ポリヌクレオチドはDNAであることがある。ポリヌクレオチドはRNAであることがある。ポリヌクレオチドは、任意の三次元構造も有していてもよく、任意の機能を実施してもよい。ポリヌクレオチドは、1つ以上のアナログ(例えば、改変された骨格、糖、または核酸塩基)を含むことがある。存在する場合、ヌクレオチド構造に対する改変は、ポリマーのアセンブリの前または後で与えられ得る。アナログのいくつかの非限定的な例としては、5-ブロモウラシル、ペプチド核酸、xeno核酸、モルフォリノ、ロックド核酸、グリコール核酸、トレオース核酸、ジデオキシヌクレオチド、コルジセピン、7-デアザ-GTP、フルオロフォア(例えば、糖に結合したローダミンまたはフルオレセイン)、ヌクレオチドを含有するチオール、ビオチン結合ヌクレオチド、蛍光塩基アナログ(fluorescent base analogs)、CpGアイランド、メチル-7-グアノシン、メチル化ヌクレオチド、イノシン、チオウリジン、シュードウリジン(pseudourdine)、ジヒドロウリジン、キューオシン、およびワイオシンが挙げられる。ポリヌクレオチドの非限定的な例としては、遺伝子あるいは遺伝子断片のコード領域あるいは非コード領域、連鎖解析から定義された遺伝子座、エクソン、イントロン、メッセンジャーRNA(mRNA)、転移RNA(tRNA)、リボソームRNA(rRNA)、低分子干渉RNA(siRNA)、低分子ヘアピン型RNA(shRNA)、マイクロRNA(miRNA)、リボザイム、cDNA、組換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたDNA、任意の配列の単離されたRNA、無細胞DNA(cfDNA)を含む無細胞のポリヌクレオチド、および無細胞RNA(cfRNA)、核酸プローブ、およびプライマーが挙げられる。ヌクレオチドの配列は、非ヌクレオチド構成要素によって中断される場合がある。
【0154】
「トランスフェクション」または「トランスフェクトされた」との用語は、一般に、非ウイルスベースの方法あるいはウイルスベースの方法によって、核酸を細胞内に導入することを指す。核酸分子は、完全タンパク質あるいはその機能性部分をコードする遺伝子配列であり得る。例えば、Sambrook et al.,1989,Molecular Cloning:A Laboratory Manual,18.1-18.88を参照されたい。
【0155】
「ペプチド」、「ポリペプチド」、および「タンパク質」との用語は、一般に、ペプチド結合によって結合された少なくとも2つのアミノ酸残基のポリマーを指すために、本明細書において交換可能に使用される。この用語は、ポリマーの特定の長さを暗示せず、また、ペプチドが組換え技術、化学的合成あるいは酵素的合成を使用して産生されるか、または天然に存在するかを暗示または識別することを意図しない。この用語は、天然に存在するアミノ酸ポリマー、ならびに、少なくとも1つの修飾されたアミノ酸を含むアミノ酸ポリマーに適用される。場合によっては、ポリマーが非アミノ酸によって中断される場合がある。この用語には、完全長のタンパク質を含む任意の長さのアミノ酸鎖、ならびに、2次構造および/または3次構造(例えば、ドメイン)を有するまたは有していないタンパク質が含まれる。この用語はまた、例えば、ジスルフィド結合形成、グリコシル化、脂質修飾、アセチル化、リン酸化、酸化、および他の操作、例えば、標識化成分とのコンジュゲートによって修飾されたアミノ酸ポリマーを包含する。「アミノ酸」との用語は、本明細書で使用されるように、一般に、天然アミノ酸、および、修飾されたアミノ酸およびアミノ酸アナログを含む非天然アミノ酸を指す。修飾されたアミノ酸は、天然アミノ酸および非天然アミノ酸を含むことがあり、これは自然に存在しない基あるいは化学的部分をアミノ酸上に含むように化学的に修飾されている。アミノ酸アナログはアミノ酸誘導体を指すこともある。「アミノ酸」との用語には、D-アミノ酸とL-アミノ酸の両方が含まれる。
【0156】
本明細書で使用されるように、「非天然」とは、一般に、天然の核酸またはタンパク質では見られない核酸またはポリペプチド配列を指す。非天然はアフィニティータグを指すことがある。非天然は融合を指すことがある。非天然は、突然変異、挿入、および/または欠失を含む天然に存在する核酸またはポリペプチド配列を指すことがある。非天然の配列は、非天然の配列が融合される核酸および/またはポリペプチド配列によって示される可能性がある活性(例えば、酵素活性、メチルトランスフェラーゼ活性、アセチルトランスフェラーゼ活性、キナーゼ活性、ユビキチン化活性など)を示す、および/またはコードする場合がある。非天然の核酸またはポリペプチド配列は、遺伝子操作によって、天然に存在する核酸またはポリペプチド配列(あるいは、その変異体)に結合され、キメラ核酸、および/または、キメラ核酸ならびに/あるいはポリペプチドをコードするポリペプチド配列を生成する場合がある。
【0157】
「プロモーター」との用語は、本明細書で使用されるように、一般に、遺伝子の転写または発現を制御する調節DNA領域を指し、RNA転写が開始されるヌクレオチドあるいはヌクレオチドの領域に隣接または重複して位置する場合がある。プロモーターは、しばしば転写因子とも呼ばれる、タンパク質因子に結合する特異的DNA配列を含有する場合があり、これは、DNAへのRNAポリメラーゼの結合を促進し、遺伝子転写を引き起こす。「コアプロモーター」とも呼ばれる「基本プロモーター」は、一般に、動作可能に連結されたポリヌクレオチドの転写発現を促進するために必要な基本的な要素をすべて含有しているプロモーターを指す。真核生物の基本プロモーターは典型的に、必ずしもそうとは限らないが、TATAボックスおよび/またはCAATボックスを含有している。
【0158】
「発現」との用語は、本明細書で使用されるように、一般に、DNA鋳型から核酸配列またはポリヌクレオチドが(mRNAあるいは他のRNA転写物などに)転写されるプロセス、および/または、転写されたmRNAがその後、ペプチド、ポリペプチド、あるいはタンパク質へと翻訳されるプロセスを指す。転写産物およびコードされたポリペプチドは、まとめて「遺伝子産物」と呼ばれることがある。ポリヌクレオチドがゲノムDNAに由来する場合、発現は、真核細胞におけるmRNAのスプライシングを含むことがある。
【0159】
本明細書で使用されるように、「動作可能に連結する」、「動作可能な連結」、または「動作可能なように連結する」、またはその文法的等価物は一般に、遺伝要素、例えば、プロモーター、エンハンサー、ポリアデニル化配列などの並置を指し、これらの要素は、それらが予期された方法で動作することを可能にする関係にある。例えば、プロモーターおよび/またはエンハンサー配列を含み得る調節エレメントは、その調節エレメントがコード配列の転写を始めるのを支援する場合、コード領域に動作可能に連結される。この機能的関係が維持される限り、調節エレメントとコード領域の間に介在する残基が存在する場合がある。
【0160】
「ベクター」とは、本明細書で使用されるように、一般に、ポリヌクレオチドを含むか、あるいはポリヌクレオチドと会合する高分子または高分子の集合体(association)を指し、細胞へのポリヌクレオチドの送達を媒介するために使用され得る。ベクターの例としては、プラスミド、ウイルスベクター、リポソーム、および他の遺伝子送達ビヒクルが挙げられる。ベクターは一般に、標的中の遺伝子の発現を促進するために遺伝子に動作可能に連結された遺伝エレメント、例えば、調節エレメントを含む。
【0161】
本明細書で使用されるように、「発現カセット」および「核酸カセット」は一般に、ともに発現されるか、あるいは発現のために動作可能に連結される核酸配列または要素の組み合わせを指すために交換可能に使用される。場合によっては、発現カセットは、調節エレメントと、それらが発現のために動作可能に連結される遺伝子との組み合わせを指す。
【0162】
DNAまたはタンパク質配列の「機能的断片」とは一般に、完全長のDNAまたはタンパク質配列の生物学的活性に実質的に類似する生物学的活性(機能的または構造的)を保持する断片を指す。DNA配列の生物学的活性は、完全長の配列に起因すると知られている様式で発現に影響を与えるその能力であり得る。
【0163】
本明細書で使用されるように、「操作された」対象は一般に、その対象がヒトの介入によって改変されていることを示す。非限定的な例によると、核酸は、その配列を自然界で生じない配列に変更することによって改変される場合がある;核酸は、ライゲーションされた産物がもとの核酸には存在しない機能を保有するように、その核酸を、その核酸が自然界では会合しない核酸にライゲーションすることによって改変される場合がある;操作された核酸は、自然界では存在しない配列とインビトロで合成される場合がある;タンパク質は、そのアミノ酸配列を自然界では存在しない配列に変更することによって改変される場合がある;操作されたタンパク質は、新しい機能あるいは特性を得る場合がある。「操作された」システムは、少なくとも1つの操作された構成要素を含む。
【0164】
本明細書で使用されるように、「合成」および「人工」は、天然に存在するヒトタンパク質に対して低い配列同一性(例えば、50%未満の配列同一性、25%未満の配列同一性、10%未満の配列同一性、5%未満の配列同一性、1%未満の配列同一性)を有するタンパク質またはそのドメインを指すために交換可能に使用される。例えば、VPRとVP64のドメインは、合成トランス活性化ドメインである。
【0165】
「tracrRNA」または「tracr配列」との用語は、本明細書で使用されるように、一般に、野生型の例示的なtracrRNA配列(例えば、S.pyogenes、黄色ブドウ球菌などからのtracrRNA、または配列番号:5476-5511)に対して少なくとも約5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、または100%の配列同一性を有する核酸、および/またはその野生型の例示的なtracrRNA配列に類似する配列を指す場合がある。tracrRNAは、野生型の例示的なtracrRNA配列(例えば、S.pyogenes、黄色ブドウ球菌などからのtracrRNA)に対して最大で約5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、あるいは100%の配列同一性を有する核酸、および/またはその野生型の例示的なtracrRNA配列に類似する配列を指す場合がある。tracrRNAは、欠失、挿入、または置換などのヌクレオチド変化、変異体、突然変異、あるいはキメラを含む、tracrRNAの改変された形態を指す場合がある。tracrRNAは、少なくとも6つの連続するヌクレオチドのストレッチにわたって、野生型の例示的なtracrRNA(例えば、S.pyogenes、黄色ブドウ球菌などからのtracrRNA)配列に対して少なくとも約60%同一である核酸を指す場合がある。例えば、tracrRNA配列は、少なくとも6つの連続するヌクレオチドのストレッチにわたって、野生型の例示的なtracrRNA(例えばS.pyogenes、黄色ブドウ球菌などからのtracrRNA)配列に対して少なくとも約60%同一、少なくとも約65%同一、少なくとも約である70%同一、少なくとも約である75%同一、少なくとも約である80%同一、少なくとも約である85%同一、少なくとも約である90%同一、少なくとも約である95%同一、少なくとも約である98%、少なくとも約99%同一、または100%同一である場合がある。II型tracrRNA配列は、隣接したCRISPRアレイ中の反復配列の一部に相補性を有する領域を同定することによって、ゲノム配列上で予測することができる。
【0166】
本明細書で使用されるように、「ガイド核酸」は一般に、別の核酸にハイブリダイズすることができる核酸を指す場合がある。ガイド核酸はRNAであることがある。ガイド核酸はDNAであることがある。ガイド核酸は、核酸の配列に部位特異的に結合するようにプログラムされてもよい。標的とされた核酸または標的核酸は、ヌクレオチドを含むことがある。ガイド核酸はヌクレオチドを含むことがある。標的核酸の一部は、ガイド核酸の一部に相補的であり得る。ガイド核酸に相補的であり、そのガイド核酸とハイブリダイズする二本鎖標的ポリヌクレオチドの鎖は、相補鎖と呼ばれることがある。相補鎖に相補的であり、したがって、ガイド核酸に相補的でない場合がある二本鎖標的ポリヌクレオチドの鎖は、非相補鎖(noncomplementary strand)と呼ばれることがある。ガイド核酸は、1つのポリヌクレオチド鎖を含む場合があり、「単一ガイド核酸(single guide nucleic acid)」と呼ばれることがある。ガイド核酸は、2つのポリヌクレオチド鎖を含む場合があり、「二重ガイド核酸(double guide nucleic acid)」と呼ばれることがある。特に明記しない限り、「ガイド核酸」との用語は包括的であり、単一ガイド核酸および二重ガイド核酸の両方を指す場合がある。ガイド核酸は、「核酸を標的とするセグメント」または「核酸を標的とする配列」と呼ばれることがある、セグメントを含んでいてもよい。核酸を標的とするセグメントは、「タンパク質結合セグメント」または「タンパク質結合配列」または「Casタンパク質結合セグメント」と呼ばれることがあるサブセグメントを含んでいてもよい。
【0167】
2つ以上の核酸あるいはポリペプチド配列の文脈において、「配列同一性」または「パーセント同一性」との用語は一般に、2つ(例えば、ペアワイズアラインメント)、またはそれ以上(例えば、多重配列アライメント)の配列を指し、それらの配列は、配列比較アルゴリズムを使用して測定されるように、局所的または全体的な比較ウィンドウにわたる最大の対応のために比較または整列されたとき、同じであるか、あるいは同じアミノ酸残基またはヌクレオチドの指定された割合を有する。ポリペプチド配列に適切な配列比較アルゴリズムには、例えば、3のwordlength(W)、10のexpectation(E)、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリックスのパラメータを使用する、および30の残基よりも長いポリペプチド配列の条件付き組成スコアマトリックス調整(conditional compositional score matrix adjustment)を使用するBLASTP;2のwordlength(W)、1000000のexpectation(E)のパラメータ、および30残基未満の配列に対してギャップを開くために9で、ギャップを拡張するために1でギャップコストを設定するPAM30スコアリングマトリックスを使用するBLASTP(これらは、https://blast.ncbi.nlm.nih.govで利用可能なBLAST suiteにおけるBLASTPのデフォルトパラメータである);パラメータを用いるCLUSTALW;2のmatch、-1のmismatch、および-1のgapのパラメータを用いるSmith-Waterman相同性検索アルゴリズム;デフォルトパラメータを用いるMUSCLE;2のretreeおよび1000のmaxiterationsのパラメータを用いるMAFFT;デフォルトパラメータを用いるNovafold;デフォルトパラメータを用いるHMMER hmmalignが含まれる。
【0168】
本明細書で使用されるように、「RuvC_IIIドメイン」との用語は一般に、RuvCエンドヌクレアーゼドメイン(3つの不連続セグメントであるRuvC_I、RuvC_II、およびRuvC_IIIで構成されているRuvCヌクレアーゼドメイン)の3つ目の不連続セグメントを指す。RuvCドメインまたはそのセグメントは一般に、既知のドメイン配列に対するアラインメント、注釈されたドメインを有するタンパク質に対する構造アラインメントによって、あるいは、既知のドメイン配列に基づいて構築された隠れマルコフモデル(HMM)(例えば、RuvC_IIIではPfam HMM PF18541)との比較によって、同定することができる。
【0169】
本明細書で使用されるように、「HNHドメイン」との用語は一般に、特徴的なヒスチジンおよびアスパラギン残基を有するエンドヌクレアーゼドメインを指す。HNHドメインは一般に、既知のドメイン配列に対するアラインメント、注釈されたドメインを有するタンパク質に対する構造アラインメントによって、あるいは、既知のドメイン配列に基づいて構築された隠れマルコフモデル(HMM)(例えば、ドメインHNHではPfam HMM PF01844)との比較によって同定することができる。
【0170】
概要
【0171】
特有の機能および構造を有する新しいCas酵素の発見は、デオキシリボ核酸(DNA)編集技術をさらに混乱させる(disrupt)可能性を提示し、速度、特異性、機能性、および使いやすさを改善することができる。微生物における、クラスター化して規則的な配置の短い回文配列リピート(CRISPR)システムの予測された有病率(prevalence)および多種多様な微生物種と比較して、機能的に特徴づけられたCRISPR/Cas酵素は、文献には比較的ほとんど存在しない。これは部分的に、莫大な数の微生物種が実験室条件で容易に培養されない可能性があるためである。多くの微生物種を表す自然環境的ニッチからのメタゲノム配列決定により、既知の新しいCRISPR/Casシステムの数が急激に増加し、新しいオリゴヌクレオチド編集機能の発見が促進される可能性が提示され得る。そのようなアプローチの有益さの最近の例は、天然微生物群のメタゲノム解析からのCasX/CasY CRISPRシステムの2016年の発見によって示される。
【0172】
CRISPR/Casシステムは、微生物中の適応免疫系として機能すると説明されている、RNA指向性ヌクレアーゼ複合体である。それらの自然な文脈では、CRISPR/CasシステムがCRISPR(クラスター化して規則的な配置の短い回文配列リピート)オペロンまたは遺伝子座に生じ、これは一般に2つの部分:(i)RNAベースの標的化要素をコードする、等しく短いスペーサー配列によって分離された短い反復配列のアレイ(30-40bp)と;(ii)アクセサリータンパク質/アクセサリー酵素とともに、RNAベースの標的化要素によって向けられたヌクレアーゼポリペプチドをコードするCasをコードするORFとを含む。特定の標的核酸配列の効率的なヌクレアーゼ標的化は一般に、(i)標的の最初の6~8の核酸(標的シード(target seed))とcrRNAガイドとの間の相補的なハイブリダイゼーションと;(ii)標的シードの定義された近傍内のプロトスペーサー隣接モチーフ(PAM)配列の存在(PAMは一般に、宿主ゲノム内では一般的に表されない配列である)との両方を必要とする。上記システムの正確な機能および構成に応じて、CRISPR-Casシステムは、共有される機能特性および進化の類似性に基づいて、2つのクラス、5つの型、および16の亜型へと一般的に組織化される。
【0173】
クラスIのCRISPR-Casシステムは、大きなマルチサブユニットエフェクター複合体を有しており、I型、III型、およびIV型を含む。
【0174】
I型のCRISPR-Casシステムは、構成要素の観点から中程度の複雑さであると考えられる。I型のCRISPR-Casシステムでは、RNAを標的とする要素のアレイは長い前駆体crRNA(プレcrRNA)として転写され、これは反復要素で処理されて、短く成熟したcrRNAを遊離し、この短く成熟したcrRNAは、それらの後にプロトスペーサー隣接モチーフ(PAM)と呼ばれる適切な短いコンセンサス配列が続くと、ヌクレアーゼ複合体を核酸標的に向ける。この処理は、カスケードと呼ばれる大きなエンドヌクレアーゼ複合体のエンドリボヌクレアーゼサブユニット(Cas6)を介して行われ、これはさらに、crRNA指向性ヌクレアーゼ複合体のヌクレアーゼ(Cas3)タンパク質成分を含む。Cas Iヌクレアーゼは、DNAヌクレアーゼとして主に機能する。
【0175】
III型のCRISPRシステムは、CsmまたはCmrのタンパク質サブユニットを含むリピート関連ミステリアスタンパク質(repeat-associated mysterious protein)(RAMP)とともに、Cas10として知られる中央ヌクレアーゼの存在を特徴とする場合がある。I型のシステムのように、成熟したcrRNAは、Cas6のような酵素を使用してプレcrRNAから処理される。I型およびII型のシステムとは異なり、III型のシステムは、DNA-RNA二重鎖(RNAポリメラーゼの鋳型として使用されるDNA鎖など)を標的とし、切断するように思われる。
【0176】
IV型のCRISPR-Casシステムは、高度に還元された(highly reduced)大サブユニットヌクレアーゼ(csf1)と、Cas5(csf3)とCas7(csf2)の群のRAMPタンパク質の2つの遺伝子と、場合によっては、予測された小サブユニットの1つの遺伝子とからなるエフェクター複合体を持ち;そのようなシステムは一般的に、内因性のプラスミド上で見られる。
【0177】
クラスIIのCRISPR-Casシステムは一般に、単一のポリペプチドのマルチドメインヌクレアーゼエフェクターを有しており、II型、V型、およびVI型を含む。
【0178】
II型のCRISPR-Casシステムは、構成要素の観点から最も単純であると考えられる。II型のCRISPR-Casシステムでは、CRISPRアレイを成熟したcrRNAに処理するには、アレイ反復配列に相補的な領域を有する小さなトランスコードされた(trans-encoded)crRNA(tracrRNA)ではなく、特別なエンドヌクレアーゼサブユニットの存在が必要となり;tracrRNAは、その対応するエフェクターヌクレアーゼ(例えば、Cas9)と反復配列の両方と相互作用することで前駆体dsRNA構造を形成し、この前駆体dsRNA構造は、内因性のRNAse IIIによって切断されて、tracrRNAとcrRNAの両方がロードされた成熟したエフェクター酵素を生成する。Cas IIヌクレアーゼはDNAヌクレアーゼとして知られている。2型エフェクターは一般に、無関係なHNHヌクレアーゼドメインがRuvC様ヌクレアーゼドメインのフォールド内に挿入されたRNase Hフォールドを採用する、RuvC様エンドヌクレアーゼドメインからなる構造を示す。RuvC様ドメインは、標的(例えば、crRNA相補的な)DNA鎖の切断の原因となり、一方で、HNHドメインは置換されたDNA鎖の切断の原因となる。
【0179】
V型のCRISPR-Casシステムは、RuvC様ドメインを含む、II型エフェクターのヌクレアーゼエフェクターと類似するヌクレアーゼエフェクター(例えば、Cas12)構造を特徴とする。II型と同様に、ほとんどの(しかし、すべてでない)V型のCRISPRシステムは、プレcrRNAを成熟したcrRNAへと処理するためにtracrRNAを使用する;しかし、プレcrRNAを切断して複数のcrRNAにするためにRNAse IIIを必要とするII型のシステムとは異なり、V型のシステムは、プレcrRNAを切断するために、エフェクターヌクレアーゼそれ自体を使用することができる。II型のCRISPR-Casシステムと同様に、V型のCRISPR-CasシステムはDNAヌクレアーゼとしても知られている。II型のCRISPR-Casシステムとは異なり、いくつかのV型酵素(例えば、Cas12a)は、二本鎖標的配列の第1のcrRNA指向性切断によって活性化される、頑強な一本鎖の非特異的なデオキシリボヌクレアーゼ活性を有するように思われる。
【0180】
VI型のCRIPSR-Casシステムは、RNAガイドRNAエンドヌクレアーゼ(RNA-guided RNA endonucleases)を有する。RuvC様ドメインの代わりに、VI型のシステム(例えば、Cas13)の単一のポリペプチドエフェクターは、2つのHEPNリボヌクレアーゼドメインを含む。II型およびV型のシステムの両方とは異なり、VI型のシステムは、プレcrRNAをcrRNAへと処理するために、tracrRNAを必要としないように思われる。しかし、V型のシステムと同様に、いくつかのVI型のシステム(例えば、C2C2)は、標的RNAの第1のcrRNA指向性切断によって活性化された、頑強な一本鎖の非特異的ヌクレアーゼ(リボヌクレアーゼ)活性を持つように思われる。
【0181】
クラスIIのCRISPR-Casは、そのより単純な構造ゆえに、デザイナーヌクレアーゼ(designer nuclease)/ゲノム編集用途として、エンジニアリングおよび開発のために最も広く採用されている。
【0182】
インビトロでの使用のためのそのようなシステムの初期の適応のうちの1つは、Jinekら(Science.2012 Aug 17;337(6096):816-2、これは参照によって完全に本明細書に組み込まれる)において見ることができる。Jinekの試験では、(i)S.pyogenes SF370から単離された、組換え的に(recombinantly)発現されて精製された完全長のCas9(例えば、クラスIIのII型Cas酵素)、(ii)切断されることが望まれる標的DNA配列に相補的な~20nt5’配列と、それに続く3’tracr結合配列とを有する、精製された成熟~42nt crRNA(crRNA全体が、T7プロモーター配列を有する合成DNA鋳型からインビトロで転写される);(iii)T7プロモーター配列を有する合成DNA鋳型からインビトロで転写された、精製されたtracrRNA、および(iv)Mg2+を含むシステムが最初に説明された。Jinekは、その後、改善された操作されたシステムを説明し、そのシステムでは、それ自体でCas9を標的に向けることができる単一の融合された合成ガイドRNA(sgRNA)を形成するために、(ii)のcrRNAが、リンカー(例えば、GAAA)によって、(iii)の5’末端に結合される(図2の上パネルと下パネルを比較する)。
【0183】
Maliら(Science.2013 Feb 15;339(6121):823-826.)(これは、参照により完全に本明細書に組み込まれる)は、その後、(i)C末端の核局在化配列(例えば、SV40 NLS)および適切なポリアデニル化シグナル(例えば、TK pAシグナル)を有する適切な哺乳動物プロモーター下で、コドン最適化Cas9(例えば、クラスIIのII型Cas酵素)をコードするORFと;(ii)適切なポリメラーゼIIIプロモーター(例えば、U6プロモーター)下でsgRNAをコードするORF(Gで始まる5’配列と、それに続く相補的な標的化核酸配列の20ntと、それに結合した3’tracr結合配列と、リンカーと、tracrRNA配列とを有する)とをコードするDNAベクターを提供することによって、哺乳動物細胞で使用するためにこのシステムを適合させた。
【0184】
MG1酵素
【0185】
一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼはRuvC_IIIドメインを含む場合があり、ここで、前記RuvC_IIIドメインは、配列番号:1827-2140のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含む場合があり、ここで、上記RuvC_IIIドメインは、配列番号:1827-2140.のいずれか1つに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含む場合があり、ここで、配列番号:1827-2140のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:1827-1831のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1827-1831のいずれか1つに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1827-1831のいずれか1つと実質的に同一のRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1827に対して少なくとも約70%、、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1828に対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1829に対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1830に対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1831に対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含む場合がある。
【0186】
エンドヌクレアーゼは、配列番号:3638-3955のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3638-3955のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3638-3955のいずれか1つと実質的に同一のHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3638-3955のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3638-3955のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3638-3955のいずれか1つと実質的に同一のHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3638-3641のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3638-3641のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3638-3641のいずれか1つと実質的に同一のHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3638のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3638のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3638のいずれか1つと実質的に同一のHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3639のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3639のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3639のいずれか1つと実質的に同一のHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3640のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3640のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3640のいずれか1つと実質的に同一のHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3641のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3641のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3641のいずれか1つと実質的に同一のHNHドメインを含む場合がある。
【0187】
場合によっては、エンドヌクレアーゼは、配列番号:1-6あるいは9-319のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1-6あるいは9-319のいずれか1つと実質的に同一である場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1-4のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:1-4のいずれか1つと実質的に同一の場合がある。場合によっては、エンドヌクレアーゼは、配列番号:5615、5616、あるいは5617のいずれか1つと実質的に同一のペプチドモチーフを含む場合がある。
【0188】
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含むことがある。NLSは、前記エンドヌクレアーゼのN末端またはC末端の近位にあり得る。NLSは、配列番号:1-6あるいは9-319のいずれか1つのN末端あるいはC末端に付加され得るか、あるいは、配列番号:1-319のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端あるいはC末端に付加され得る。NLSはSV40ラージT抗原NLSである場合がある。NLSはc-myc NLSである場合がある。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含む場合がある。NLSは、配列番号:5593-5608のいずれか1つと実質的に同一の配列を含む場合がる。NLSは、下記の表1中の配列のいずれか、またはその組み合わせを含み得る。
【0189】
【表1】
場合によっては、エンドヌクレアーゼは、組換え型であり得る(例えば、大腸菌中の発現とそれに続くエピトープタグ精製などの適切な方法によって、クローン化され、発現され、および精製される)。場合によっては、エンドヌクレアーゼは、配列番号:5592-5595のいずれか1つに対して少なくとも約90%の同一性を有する16S rRNA遺伝子を有する細菌に由来する場合がある。エンドヌクレアーゼは、配列番号:5592-5595のいずれか1つと少なくとも約80%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%同一の16S rRNA遺伝子を有する種に由来する場合がある。エンドヌクレアーゼは、配列番号:5592-5595のいずれか1つと実質的に同一の16S rRNA遺伝子を有する種に由来する場合がある。エンドヌクレアーゼは、Verrucomicrobia門またはCandidatus Peregrinibacteria門に属する細菌に由来する場合がある。
【0190】
場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定され得る。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用して、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリックスを使用して、および条件付き組成スコアマトリックス調整(conditional compositional score matrix adjustment)を使用して、BLASTPアルゴリズムによって決定される場合がある。
【0191】
場合によっては、上記のシステムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含む場合がある。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含み得る。場合によっては、標的化領域の最も5’側(5’most nucleotide)のヌクレオチドはGである場合がある。場合によっては、5’標的化領域は15~23ヌクレオチド長である場合がある。ガイド配列およびtracr配列は、別個のリボ核酸(RNA)あるいは単一のリボ核酸(RNA)として供給され得る。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでいてもよい。sgRNAは、5’から3’に:細胞中の標的配列にハイブリダイズすることができる非天然のガイド核酸配列と;tracr配列とを含み得る。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。
【0192】
場合によっては、tracr配列は特定の配列を有する場合がある。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%を有する。tracr配列は、配列番号:5476-5489のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有することがある。場合によっては、tracrRNAは、配列番号:5476-5489のいずれか1つの少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する場合がある。場合によっては、tracrRNAは、配列番号:5476-5489のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一である場合がある。tracrRNAは、配列番号:5476-5489のいずれかを含む場合がある。
【0193】
場合によっては、エンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5461-5464のいずれか1つに対して少なくとも約80%の同一性を有する配列を含む場合がある。sgRNAは、配列番号:5461-5464のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む場合がる。sgRNAは、配列番号:5461-5464のいずれか1つと実質的に同一の配列を含む場合がある。
【0194】
場合によっては、上記のシステムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含む場合があり、ここで、第2の部位は第1の部位の3’である。場合によっては、上記のシステムは、5’~3’まで、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、あるいは1kb)のヌクレオチドの配列を含む第1の相同性アームと、少なくとも約10のヌクレオチドの合成DNA配列と、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、あるいは1kb)のヌクレオチドの配列を含む第2の相同性アームとを含む、一本鎖または二本鎖のDNA修復鋳型を含む場合がある。
【0195】
他の態様では、本開示は、標的核酸遺伝子座を改変するための方法を提供する。上記方法は、酵素および本明細書で開示される少なくとも1つの合成ガイドRNA(sgRNA)を含む、本明細書で開示される非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含み得る。酵素は、少なくとも1つのsgRNAと複合体を形成し、その複合体が標的核酸遺伝子座に結合すると、標的核酸遺伝子座を改変する場合がある。前記遺伝子座に酵素を送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含み得る。前記遺伝子座にヌクレアーゼを送達することは、上記システムまたは上記システムをコードする核酸で細胞を電気穿孔することを含み得る。前記遺伝子座にヌクレアーゼを送達することは、対象の遺伝子座を含む核酸と上記システムを緩衝液中でインキュベートすることを含み得る。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含むことがある。標的核酸遺伝子座は細胞内にあることがある。標的核酸遺伝子座はインビトロであることがある。標的核酸遺伝子座は、真核細胞または原核細胞内にあることがある。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であることがある。酵素は、対象の標的遺伝子座で、またはその近位で、一本鎖切断または二本鎖切断を引き起こすことがある。
【0196】
標的核酸遺伝子座が細胞内にある可能性がある場合、酵素は、配列番号:1827-2140のいずれか1つに対して少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含有する核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含有するデオキシリボ核酸(DNA)は、配列番号:5572-5575のいずれか1つ、または、配列番号:5572-5575のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、あるいは少なくとも約99%の同一性を有するその変異体と実質的に同一の配列を含み得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されるプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターである場合がある。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含有する、キャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして供給されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含有するデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物を真核生物であってもよい。場合によっては、生物を真菌であってもよい。場合によっては、生物をヒトであってもよい。
【0197】
場合によっては、本開示は、本明細書で開示されるシステムを含む発現カセット、または本明細書に記載される核酸を提供し得る。場合によっては、発現カセットまたは核酸はベクターとして供給されてもよい。場合によっては、発現カセット、核酸、またはベクターは、細胞中で供給されてもよい。場合によっては、細胞は、配列番号:5592-5595のいずれか1つに対して少なくとも約90%(例えば、少なくとも約99%)の同一性を有する16S rRNA遺伝子を有する、細菌細胞である。
【0198】
MG2酵素
【0199】
一態様では、本開示は、(a)エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼはRuvC_IIIドメインを含む場合があり、ここで、前記RuvC_IIIドメインは、配列番号:2141-2241のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含む場合があり、ここで、RuvC_IIIドメインは、配列番号:2141-2241のいずれか1つに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含む場合があり、配列番号:2141-2142のいずれか1つと実質的に同一である。エンドヌクレアーゼは、配列番号:2141-2142のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:2141-2142のいずれか1つに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する、RuvC_IIIドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:2141-2142のいずれか1つと実質的に同一のRuvC_IIIドメインを含む場合がある。
【0200】
エンドヌクレアーゼは、配列番号:3955-4055のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3955-4055のいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%同一であるHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3955-4055のいずれか1つと実質的に同一のHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3955-3956のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含む場合がある。場合によっては、エンドヌクレアーゼは、配列番号:3955-3956のうちのいずれか1つに対して少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%同一であるHNHドメインを含む場合がある。エンドヌクレアーゼは、配列番号:3955-3956のいずれか1つと実質的に同一のHNHドメインを含む場合がある。
【0201】
場合によっては、エンドヌクレアーゼは、配列番号:320-420のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:320-420のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:320-321のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:320-321のいずれか1つと実質的に同一であってもよい。
【0202】
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:320-420のいずれか1つのN末端またはC末端で、あるいは、配列番号:320-420のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる:
【0203】
場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。
【0204】
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。
【0205】
場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5490-5494のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5490-5494のいずれか1つの少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5490-5494のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5490-5494のいずれかを含んでもよい。
【0206】
場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5465に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5465に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5465と実質的に同一の配列を含んでもよい。
【0207】
いくつかの態様では、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。
【0208】
他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。
【0209】
標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2141-2241のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5576-5577のいずれか1つと実質的に同一の配列、あるいは、配列番号:5576-5577のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。
【0210】
MG3酵素
【0211】
一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:2242-2251のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:2242-2251のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:2242-2251のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:2242-2244のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2242-2244のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2242-2244のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。
【0212】
エンドヌクレアーゼは、配列番号:4056-4066のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4056-4066のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4056-4066のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:4056-4058のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4056-4058のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4056-4058のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。
【0213】
場合によっては、エンドヌクレアーゼは、配列番号:421-431のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:421-431のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:421-423のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:421-423のいずれか1つと実質的に同一であってもよい。
【0214】
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:421-431のいずれか1つのN末端またはC末端で、あるいは、配列番号:421-431のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる:
【0215】
場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。
【0216】
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。
【0217】
場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5495-5502のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5495-5502のいずれか1つの少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5495-5502のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5495-5502のいずれかを含んでもよい。
【0218】
場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5466-5467のいずれか1つに対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5466-5467のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5466-5467のいずれか1つと実質的に同一の配列を含んでもよい。
【0219】
場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。
【0220】
他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。
【0221】
標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2242-2251のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5578-5580のいずれか1つと実質的に同一の配列、あるいは、配列番号:5578-5580のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。
【0222】
MG4酵素
【0223】
一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:2253-2481のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:2253-2481のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:2253-2481のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:2253-2481のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2253-2481のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2253-2481のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。
【0224】
エンドヌクレアーゼは、配列番号:4067-4295のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4067-4295のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4067-4295のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:4067-4295のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4067-4295のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4067-4295のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。
【0225】
場合によっては、エンドヌクレアーゼは、配列番号:432-660のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:432-660のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:432-660のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:432-660のいずれか1つと実質的に同一であってもよい。
【0226】
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:432-660のいずれか1つのN末端またはC末端で、あるいは、配列番号:432-660のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる:
【0227】
場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。
【0228】
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。
【0229】
場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5503の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5503の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5503の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5503を含んでもよい。
【0230】
場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5468に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5468に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5468と実質的に同一の配列を含んでもよい。
【0231】
場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。
【0232】
他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。
【0233】
標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2253-2481のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。
【0234】
MG6酵素
【0235】
一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:2482-2489のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:2482-2489のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:2482-2489のいずれか1つに実質的に同一である。
【0236】
エンドヌクレアーゼは、配列番号:4296-4303のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4296-4303のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4056-4066のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。
【0237】
場合によっては、エンドヌクレアーゼは、配列番号:661-668のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:661-668のいずれか1つと実質的に同一であってもよい。
【0238】
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:661-668のいずれか1つのN末端またはC末端で、あるいは、配列番号:661-668のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる:
【0239】
場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。
【0240】
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。
【0241】
場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。
【0242】
場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるガイドRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。
【0243】
他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。
【0244】
標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2482-2489のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。
【0245】
MG7酵素
【0246】
一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:2490-2498のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:2490-2498のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:2490-2498のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:2490-2498のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2490-2498のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2490-2498のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。
【0247】
エンドヌクレアーゼは、配列番号:4304-4312のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4304-4312のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4304-4312のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:4304-4312のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4304-4312のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4304-4312のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。
【0248】
場合によっては、エンドヌクレアーゼは、配列番号:669-677のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:669-677のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:669-677のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:669-677のいずれか1つと実質的に同一であってもよい。
【0249】
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:669-677のいずれか1つのN末端またはC末端で、あるいは、配列番号:669-677のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる:
【0250】
場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。
【0251】
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。
【0252】
場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5504の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5504の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5504の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5504を含んでもよい。
【0253】
場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。
【0254】
他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。
【0255】
標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2490-2498のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。
【0256】
MG14酵素
【0257】
一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:2499-2750のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:2499-2750のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:2499-2750のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:2499-2750のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2499-2750のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2499-2750のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。
【0258】
エンドヌクレアーゼは、配列番号:4313-4564のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4313-4564のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4313-4564のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:4313-4564のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4067-4295のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4313-4564のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。
【0259】
場合によっては、エンドヌクレアーゼは、配列番号:678-929のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:678-929のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:678-929のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:678-929のいずれか1つと実質的に同一であってもよい。
【0260】
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:678-929のいずれか1つのN末端またはC末端で、あるいは、配列番号:678-929のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる:
【0261】
場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。
【0262】
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。
【0263】
場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5505の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5505の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5505の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5505を含んでもよい。
【0264】
場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5469に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5469に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5469と実質的に同一の配列を含んでもよい。
【0265】
場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。
【0266】
他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。
【0267】
標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2499-2750のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5581と実質的に同一の配列、あるいは、配列番号:5581に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。
【0268】
MG15酵素
【0269】
一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:2751-2913のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:2751-2913のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:2751-2913のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:2751-2913のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2751-2913のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2751-2913のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。
【0270】
エンドヌクレアーゼは、配列番号:4565-4727のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4565-4727のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4565-4727のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:4565-4727のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4565-4727のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4565-4727のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。
【0271】
場合によっては、エンドヌクレアーゼは、配列番号:930-1092のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:930-1092のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:930-1092のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:930-1092のいずれか1つと実質的に同一であってもよい。
【0272】
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:930-1092のいずれか1つのN末端またはC末端で、あるいは、配列番号:930-1092のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる:
【0273】
場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。
【0274】
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。
【0275】
場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5506の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5506の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5506の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5506を含んでもよい。
【0276】
場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5470に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5470に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5470と実質的に同一の配列を含んでもよい。
【0277】
場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。
【0278】
他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。
【0279】
標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2751-2913のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5582と実質的に同一の配列、あるいは、配列番号:5582に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。
【0280】
MG16酵素
【0281】
一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:2914-3174のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:2914-3174のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:2914-3174のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:2914-3174のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2914-3174のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:2914-3174のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。
【0282】
エンドヌクレアーゼは、配列番号:4728-4988のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4728-4988のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4728-4988のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:4728-4988のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4728-4988のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4728-4988のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。
【0283】
場合によっては、エンドヌクレアーゼは、配列番号:1093-1353のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1093-1353のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:1093-1353のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1093-1353のいずれか1つと実質的に同一であってもよい。
【0284】
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:1093-1353のいずれか1つに対してN末端またはC末端で、あるいは、配列番号:1093-1353のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体に、付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる:
【0285】
場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。
【0286】
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。
【0287】
場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5507の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5507の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5507の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5507を含んでもよい。
【0288】
場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5471に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5471に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5471と実質的に同一の配列を含んでもよい。
【0289】
場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。
【0290】
他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。
【0291】
標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:2914-3174のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5583と実質的に同一の配列、あるいは、配列番号:5583に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。
【0292】
MG18酵素
【0293】
一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:3175-3300のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:3175-3300のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:3175-3300のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:3175-3300のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3175-3300のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3175-3300のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。
【0294】
エンドヌクレアーゼは、配列番号:4989-5146のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4989-5146のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4989-5146のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:4989-5146のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:4989-5146のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:4989-5146のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。
【0295】
場合によっては、エンドヌクレアーゼは、配列番号:1354-1511のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1354-1511のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:1354-1511のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1354-1511のいずれか1つと実質的に同一であってもよい。
【0296】
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:1354-1511のいずれか1つのN末端またはC末端で、あるいは、配列番号:1354-1511のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる:
【0297】
場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。
【0298】
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。
【0299】
場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5508の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5508の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5508の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5508を含んでもよい。
【0300】
場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5472に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5472に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5472と実質的に同一の配列を含んでもよい。
【0301】
場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。
【0302】
他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。
【0303】
標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:3175-3300のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5584と実質的に同一の配列、あるいは、配列番号:5584に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。
【0304】
MG21酵素
【0305】
一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:3331-3474のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:3331-3474のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:3331-3474のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:3331-3474のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3331-3474のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3331-3474のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。
【0306】
エンドヌクレアーゼは、配列番号:5147-5290のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:5147-5290のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:5147-5290のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:5147-5290のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:5147-5290のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:5147-5290のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。
【0307】
場合によっては、エンドヌクレアーゼは、配列番号:1512-1655のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1512-1655のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:1512-1655のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1512-1655のいずれか1つと実質的に同一であってもよい。
【0308】
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:1512-1655のいずれか1つのN末端またはC末端で、あるいは、配列番号:1512-1655のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる:
【0309】
場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。
【0310】
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。
【0311】
場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5509の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5509の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5509の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5509を含んでもよい。
【0312】
場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5473に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5473に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5473と実質的に同一の配列を含んでもよい。
【0313】
場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。
【0314】
他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。
【0315】
標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:3331-3474のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5585と実質的に同一の配列、あるいは、配列番号:5585に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。
【0316】
MG22酵素
【0317】
一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:3475-3568のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:3475-3568のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:3475-3568のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:3475-3568のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3475-3568のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3475-3568のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。
【0318】
エンドヌクレアーゼは、配列番号:5291-5389のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:5291-5389のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:5291-5389のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:5291-5389のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:5291-5389のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:5291-5389のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。
【0319】
場合によっては、エンドヌクレアーゼは、配列番号:1656-1755のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1656-1755のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:1656-1755のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1656-1755のいずれか1つと実質的に同一であってもよい。
【0320】
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:432-660のいずれか1つのN末端またはC末端で、あるいは、配列番号:1656-1755のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる:
【0321】
場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。
【0322】
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。
【0323】
場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5510の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5510の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5510の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5510を含んでもよい。
【0324】
場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5474に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5474に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5474と実質的に同一の配列を含んでもよい。
【0325】
場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。
【0326】
他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。
【0327】
標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:3475-3568のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5586と実質的に同一の配列、あるいは、配列番号:5586に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。
【0328】
MG23酵素
【0329】
一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼはCasエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型のクラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、前記RuvC_IIIドメインは、配列番号:3569-3637のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、RuvC_IIIドメインは、配列番号:3569-3637のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、RuvC_IIIドメインを含んでいてもよく、ここで、配列番号:3569-3637のいずれか1つに実質的に同一である。エンドヌクレアーゼは、配列番号:3569-3637のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3569-3637のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:3569-3637のいずれか1つに実質的に同一であるRuvC_IIIドメインを含んでいてもよい。
【0330】
エンドヌクレアーゼは、配列番号:5390-5640のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:5390-5460のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:5390-5460のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。エンドヌクレアーゼは、配列番号:5390-5460のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:5390-5460のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するHNHドメインを含んでいてもよい。エンドヌクレアーゼは配列番号:5390-5460のいずれか1つと実質的に同一のHNHドメインを含んでいてもよい。
【0331】
場合によっては、エンドヌクレアーゼは、配列番号:1756-1826のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1756-1826のいずれか1つと実質的に同一であってもよい。場合によっては、エンドヌクレアーゼは、配列番号:1756-1826のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでいてもよい。場合によっては、エンドヌクレアーゼは、配列番号:1756-1826のいずれか1つと実質的に同一であってもよい。
【0332】
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有する変異体を含んでもよい。NLSは前記エンドヌクレアーゼのN末端またはC末端の近位であってもよい。NLSは、配列番号:1756-1826のいずれか1つのN末端またはC末端で、あるいは、配列番号:1756-1826のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体のN末端またはC末端で付加されてもよい。NLSはSV40ラージT抗原NLSであってもよい。NLSはc-myc NLSであってもよい。NLSは、配列番号:5593-5608のいずれか1つに対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含むことができる。NLSは配列番号:5593-5608のいずれか1つと実質的に同一の配列を含むことができる。NLSは、表1の配列のいずれか、またはその組み合わせを含むことができる:
【0333】
場合によっては、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、またはSmith-Waterman相同性検索アルゴリズムによって決定されてもよい。配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータを使用し、および11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリクスを使用し、および条件付き組成スコアマトリクス調整を使用して、BLASTPアルゴリズムで決定することができる。
【0334】
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を有するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)を含んでもよい。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合可能なPAM配列を含んでもよい。場合によっては、標的化領域の5’のほとんどのヌクレオチドがGであってもよい。場合によっては、5’標的化領域は15~23ヌクレオチド長であってもよい。ガイド配列およびtracr配列は、別のリボ核酸(RNA)または単一リボ核酸(RNA)として供給されてもよい。ガイドRNAは、標的化領域の3’にcrRNA tracrRNA結合配列を含んでもよい。ガイドRNAは、crRNA tracrRNA結合領域の3’に4-ヌクレオチドリンカーが先行するtracrRNA配列を含んでもよい。sgRNAは、5’から3’に、細胞の標的配列にハイブリダイズすることができる非天然ガイド核酸配列、および、tracr配列を含んでもよい。場合によっては、非天然ガイド核酸配列およびtracr配列は共有結合される。
【0335】
場合によっては、tracr配列は特別な配列を有していてもよい。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%を有してもよい。tracr配列は、配列番号:5511の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して少なくとも約80%の配列同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5511の少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有してもよい。場合によっては、tracrRNAは、配列番号:5511の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、または少なくとも約90)の連続するヌクレオチドと実質的に同一であってもよい。tracrRNAは、配列番号:5511を含んでもよい。
【0336】
場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号:5475に対して少なくとも約80%の同一性を有する配列を含んでもよい。sgRNAは、配列番号:5475に対して少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含んでもよい。sgRNAは配列番号:5475と実質的に同一の配列を含んでもよい。
【0337】
場合によっては、上記システムは、標的DNA遺伝子座における切断のために第1の領域および第2の領域を標的とする2つの異なるsgRNAを含んでいてもよく、ここで、第2の領域は第1の領域に対して3’である。場合によっては、上記システムは、5’から3’に、第1の領域の5’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第1の相同性アーム、少なくとも約10ヌクレオチドの合成DNA配列、および、第2の領域の3’に少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、または1kb)のヌクレオチドの配列を含む第2の相同性アームを含む、一本鎖または二本鎖のDNA修復鋳型を含んでいてもよい。
【0338】
他の態様では、本開示は、所望の標的核酸遺伝子座を改変するための方法を提供する。本方法は、本明細書に開示された酵素および少なくとも1つの合成ガイドRNA(sgRNA)を含む本明細書で開示された非天然のシステムのいずれかを、標的核酸遺伝子座に送達する工程を含んでもよい。酵素は、少なくとも1つのsgRNAと複合体を形成してもよく、複合体が所望の標的核酸遺伝子座に結合すると、所望の標的核酸遺伝子座を改変してもよい。酵素を前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をトランスフェクトすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、上記システムまたは上記システムをコードする核酸で細胞をエレクトロポレーションすることを含んでもよい。ヌクレアーゼを前記遺伝子座に送達することは、所望の遺伝子座を含む核酸を有する緩衝液中でシステムをインキュベートすることを含んでもよい。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含んでもよい。標的核酸遺伝子座は細胞内にあってもよい。標的核酸遺伝子座はインビトロであってもよい。標的核酸遺伝子座は、真核細胞内にあっても、原核細胞内にあってもよい。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、または植物細胞であってもよい。酵素は、所望の標的遺伝子座で、またはその近辺で、一本鎖または二本鎖の切断を誘導してもよい。
【0339】
標的核酸の遺伝子座が細胞内にあり得る場合では、酵素は、配列番号:3569-3637のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードするオープンリーディングフレームを含む核酸として供給されてもよい。前記エンドヌクレアーゼをコードするオープンリーディングフレームを含むデオキシリボ核酸(DNA)は、配列番号:5587と実質的に同一の配列、あるいは、配列番号:5587に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含んでもよい。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトβアクチン、CAG、TRE、またはCaMKIIaプロモーターであってもよい。エンドヌクレアーゼは、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含むキャップされたmRNAとして供給されてもよい。エンドヌクレアーゼは、翻訳されたポリペプチドとして提供されてもよい。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含むデオキシリボ核酸(DNA)として供給されてもよい。場合によっては、生物は真核生物であってもよい。場合によっては、生物は真菌であってもよい。場合によっては、生物はヒトであってもよい。
【実施例0340】
実施例1.-新規なタンパク質のためのメタゲノム解析
メタゲノム試料を堆積物、土壌、および動物から集めた。デオキシリボ核酸(DNA)を、ZymobiomicsのDNA mini-prep kitを用いて抽出し、Illumina HiSeqR 2500で配列決定した。所有者の同意を得て試料を採取した。公的な情報源からの生の配列データは、動物のマイクロバイオーム、堆積物、土壌、温泉、熱水噴出孔、海洋、泥炭湿地、永久凍土、および下水のシーケンスを含んでいた。メタゲノム配列データは、タイプIIのCasエフェクタータンパク質を含む既知のCasタンパク質配列に基づいて生成された隠れマルコフモデルを用いて検索された。検索により同定された新規なエフェクタータンパク質を、既知のタンパク質にアラインメントして、潜在的な活性部位を特定した。このメタゲノムワークフローにより、本明細書に記載されるクラスII、タイプIIのCRISPRエンドヌクレアーゼのMG1、MG2、MG3、MG4、MG6、MG14、MG15、MG16、MG18、MG21、MG22、およびMG23のファミリーを解明した。
【0341】
実施例2A.-CRISPRシステムのMG1ファミリーの発見
実施例1のメタゲノム解析のデータを解析すると、当初は6つのメンバー(それぞれ配列番号:5、6、1、2、および3として記録されたMG1-1、MG1-2、MG1-3、MG1-4、MG1-5、およびMG1-6)を含むこれまでに記載されていない推定CRISPRシステムの新しいクラスターが明らかとなった。このファミリーは、HNHドメインとRuvCドメインを有する酵素を特徴としている。このファミリーのRuvCドメインは、これまでに記載されたCas9ファミリーメンバーとの相同性が低いRuvC_III部分を有している。当初のファミリーメンバーは最大56.8%の同一性を有しているが、6つの酵素はすべてRuvCドメインのRuvC_III部分が分岐しており、RHHALDAMV(配列番号:5615)、KHHALDAMC(配列番号:5616)、またはKHHALDAIC(配列番号:5617)の共通モチーフを持っている。これらのモチーフは、記載されている他のCas9様酵素には見られないものである。これらの新しい酵素とその関連するサブドメインに対応するタンパク質と核酸の配列は、配列表に提示されている。推定tracrRNA配列は、他の遺伝子との相対的な位置関係に基づいて同定され、配列番号:5476-5479として提示されている。酵素システムは、CRISPRシステムを含むゲノムビンからの16S rRNAの配列に基づいて、Phylum Verrucomicrobia、Phylum Candidatus Peregrinibacteria、またはPhylum Candidatus Melainabacteriaに由来すると思われる。16S rRNAの配列は、配列番号:5592-5596として提示されている。Shmakovらによって記載された特徴を呼び起こすCRISPRシステム配列の詳細なドメインレベルのアラインメント(Mol Cell.2015 Nov 5;60(3):385-97)が図9A、9B、9C、9D、9E、9F、9G、および9Hに描かれている。MG1-1、1-2、および1-3と、追加の独自のタンパク質データセットとを比較すると、配列番号:7-319として提示されている類似のアーキテクチャを有する追加のタンパク質配列が明らかになった。これらのMG1タンパク質の配列により、配列番号:5618-5632に示されるような追加のMG1モチーフが発見された。
【0342】
実施例2B.-CRISPRシステムのMG2ファミリーの発見
実施例1のメタゲノム解析からのデータを解析すると、6つのメンバー(MG2-1、MG2-2、MG2-3、MG2-5、およびMG2-6)を含むこれまでに記載されていない推定CRISPRシステムの新しいクラスターが明らかになった。これらの新しい酵素と例示的なサブドメインに対応するタンパク質と核酸の配列は、配列番号:320、322-325として提示されている。他の遺伝子との相対的な位置関係から、推定tracrRNA配列がオペロン内で同定され、配列番号:5490、5492-5494、および5538として提示されている。これらの配列対Cas9の詳細なドメインレベルのアラインメントは、Shmakovらにより示されているように(Mol Cell. 2015 Nov 5;60(3):385-97.)、図7に描かれている。
【0343】
MG2-1、MG2-2、MG2-3、MG2-5、およびMG2-6の組み合わせと、追加の独自のタンパク質データセットとを比較すると、配列番号:321および326-420として提示されている類似のアーキテクチャを有する追加のタンパク質配列が明らかになった。MG2ファミリーメンバーによく見られるモチーフは、配列番号:5631-5638として提示されている。
【0344】
実施例2C.-CRISPRシステムのMG3ファミリーの発見
実施例1のメタゲノム解析のデータを解析すると、新たにこれまでに記載されていない推定CRISPRシステム:MG3-1が明らかになった。この新しい酵素とその例示的なサブドメインの対応するアミノ酸配列は、配列番号:424、2245、および4059として提示されている。オペロンの他の要素との近接性に基づいて、推定tracrRNA含有配列が同定され、配列番号:5498として含まれている。この配列対Actinomyces naeslundii由来のCas9とのドメインレベルの詳細なアラインメントが図8に示されている。
【0345】
MG3-1と、その他の独自のタンパク質データセットを比較すると、SEQ NO:421-423、425-431として提示されている、類似した構造のさらなるタンパク質配列が明らかになった。
【0346】
実施例2D.-CRISPRシステムのMG4、7、14、15、16、18、21、22、23ファミリーの発見
実施例1のメタゲノム解析のデータを解析すると、1メンバーずつの9ファミリー(MG4-5、MG7-2、MG14-1、MG15-1、MG16-2、MG18-1、MG21-1、MG22-1、MG23-1)を含む、これまでに記載されていない推定CRISPRシステムの新たなクラスターが明らかになった。これらの新しい酵素とその例示的なサブドメインに対応するタンパク質および核酸の配列は、配列番号:432、669、678、930、1093、1354、1512、1656、1756として提示されている。オペロンの他の要素との近接性に基づいて、各ファミリーについて推定tracr含有配列が同定された。これらの配列は、それぞれ配列番号:5503-5511として配列表に提示されている。
【0347】
MG4-5、MG7-2、MG14-1、MG15-1、MG16-2、MG18-1、MG21-1、MG22-1、MG23-1と、その他の独自のタンパク質データセットを比較すると、SEQ NO:433-660、670-677、679-929、931-1092、1094-1353、1355-1511、1513-1655、1657-1755、および1757-1826として提示されている、類似のアーキテクチャを持つ追加のタンパク質配列が明らかになった。これらのセットのCRISPRシステムのヌクレアーゼに共通するモチーフは、MG4については配列番号:5649、MG14については配列番号:5650-5667、MG15については配列番号:5668-5675、MG16については配列番号:5676-5678、MG18については配列番号:5679-5686、MG21については配列番号:5687-5693および配列番号:5674-5675、MG22については配列番号:5694-5699、ならびにMG23については配列番号:5700-5717として提示されている。
【0348】
実施例3.-予言的(Prophetic)--プロトスペーサー隣接モチーフ(Protospacer-Adjacent Motif)の決定.
実験は、Karvelis et al. Methods. 2017 May 15;121-122:3-8(参照により本明細書に全体として組み込まれる)の例のいずれかのように行われ、本明細書に記載される新規の酵素に対するプロトスペーサー隣接モチーフ(PAM)配列特異性を特定して、最適な合成配列の標的化を可能にする。
【0349】
一例(インビボスクリーン)では、本明細書に記載されている酵素のいずれかをコードするプラスミドと、プロトスペーサーを標的とするガイドRNAとを有する細胞は、抗生物質耐性遺伝子を含むプラスミドライブラリ、およびランダム化されたPAM配列と隣接しているプロトスペーサー配列で同時形質転換される。機能的なPAMを含むプラスミドは、酵素によって切断され、細胞死に至る。生き残った細胞から単離された酵素切断抵抗性プラスミドプールをディープシーケンシングすると、機能的な切断を可能にするPAMを含む枯渇したプラスミドのセットが示される。
【0350】
別の例(インビトロスクリーニング)では、DNAプラスミドまたは鎖状体リピートの形態のPAMライブラリは、インビトロまたは細胞溶解物中で組み立てられたRNP複合体(例えば、酵素、tracrRNAおよびcrRNA、または酵素およびハイブリッドsgRNAを含む)による切断に晒される。成功した切断事象から生じる遊離DNA末端は、アダプターライゲーションによって捕捉され、その後、PAM側の生成物のPCR増幅に晒される。増幅された機能的PAMのライブラリは、ディープシーケンシングにかけられ、DNAの切断をライセンス化するPAMが同定される。
【0351】
実施例4.-予言的--ゲノム編集のための哺乳動物細胞における本明細書に記載される合成CRISPRシステムの使用例
i)細胞適合性のあるC末端核局在化配列(例えば、ヒト細胞の場合はSV40 NLS)および適切なポリアデニル化シグナル(例えば、ヒト細胞の場合はTK pAシグナル)を有する細胞適合性のあるプロモーターの下で、コドン最適化酵素をコードするORF、および、(ii)適切なポリメラーゼIIIプロモーター(例えば、哺乳動物細胞の場合はU6プロモーター)の下で、sgRNA(Gで始まる5’配列と、続いてゲノムDNAを標的とする相補的な標的化核酸配列20ntと、その後、実施例3を介して同定された対応する適合性のあるPAMと、3’tracr結合配列、リンカー、およびtracrRNA配列を有する)をコードするORF、をコードするDNA/RNA配列が調製される。いくつかの実施形態では、これらの配列は、同じまたは別々のプラスミドベクター上で調製され、これらのプラスミドベクターは、適切な技術を介して真核細胞にトランスフェクトされる。いくつかの実施形態では、これらの配列は、別々のDNA配列として調製され、これが細胞にトランスフェクトされるか、または微量注入される。いくつかの実施形態では、これらの配列は、細胞にトランスフェクトされるか、微量注入される、合成RNAまたはインビトロ転写RNAとして調製される。いくつかの実施形態では、これらの配列は、タンパク質に翻訳され、細胞にトランスフェクトされるか、または微量注入される。
【0352】
いずれのトランスフェクション方法が選択されても、(i)と(ii)は細胞内に導入される。酵素および/またはsgRNAが活性形態に転写および/または翻訳されるように、インキュベーション期間を経過させる。インキュベーション期間後、標的化配列の近傍にあるゲノムDNAが(例えば、配列決定によって)解析される。酵素を媒介とした切断と非相同末端結合の結果、標的化配列の近傍にあるゲノムDNAにインデルが導入される。
【0353】
いくつかの実施形態では、(i)および(ii)は、25bp以上のサイズの切断部位に隣接しているゲノムの領域をコードする第3の修復ヌクレオチドとともに細胞に導入されることで、相同性指向の修復が促進される。これらの隣接配列内には、単一の塩基対突然変異、機能的な遺伝子断片、発現のための外来性または天然の遺伝子、あるいは生化学的経路を構成する複数の遺伝子が含まれることがある。
【0354】
実施例5.-予言的--インビトロの本明細書に記載される合成CRISPRシステムの使用
本明細書に記載される酵素のいずれかは、精製タグを含む適切な大腸菌発現プラスミドにクローン化され、大腸菌で組換え発現され、組換えタグを用いて精製される。5’Gと、続いて20ntの標的化配列とPAM配列、適合性のあるcrRNAのtracrRNA結合領域、GAAAリンカー、および適合性のあるtracrRNAを含むRNAは、適切な固相RNA合成方法によって合成される。組換え酵素とsgRNAは、Mg2+を含む適切な切断緩衝液(例えば、20mMのHEPES pH7.5、100mMのKCl、5mMのMgCl、1mMのDTT、5%グリセロール)に配合され、標的化配列とPAM配列に相補的な配列を含む標的DNAを導入することで、反応が開始する。DNAの切断は、適切なアッセイ(例えば、アガロースゲル電気泳動と、その後の臭化エチジウム染色(または同様に作用するDNA挿入剤)およびUV可視化)によってモニタリングされる。
【0355】
実施例6.-(一般プロトコル)本明細書に記載されるエンドヌクレアーゼのPAM配列同定/確認
PAM配列は、大腸菌ライセートベースの発現システム(myTXTL、Arbor Biosciences)で発現した推定エンドヌクレアーゼで切断できるランダムに生成されたPAM配列を含むプラスミドを配列決定することによって決定された。このシステムでは、大腸菌コドン最適化ヌクレオチド配列が、T7プロモーターの制御下でPCR断片から転写および翻訳された。T7プロモーター下でtracr配列と、T7プロモーターとその後のリピート-スペーサー-リピート配列から構成される最小CRISPRアレイとを有する第2のPCR断片が同じ反応で転写された。TXTLシステムにおけるエンドヌクレアーゼとtracr配列の発現に成功し、その後のCRISPRアレイ処理を行うことで、インビトロで活性のCRISPRヌクレアーゼ複合体が得られた。
【0356】
最小限のアレイに一致するスペーサー配列と、その後の8Nの混合塩基(推定PAM配列)とを含む標的プラスミドのライブラリは、TXTL反応の出力と一緒にインキュベートされた。1-3時間後に反応を停止し、DNAクリーンアップキット、例えば、Zymo DCC、AMPure XP beads、QiaQuickなどを用いてDNAを回収した。アダプター配列は、エンドヌクレアーゼによって切断された活性なPAM配列を持つDNAに平滑末端ライゲーションされ、一方、切断されなかったDNAはライゲーションに利用できなかった。次に、活性なPAM配列を含むDNAセグメントは、ライブラリとアダプター配列に特異的なプライマーを用いてPCRで増幅された。PCR増幅産物をゲル上で分離させ、切断事象に対応するアンプリコンを同定した。切断反応の増幅セグメントは、NGSライブラリを調製するための鋳型としても使用された。最初の8Nライブラリのサブセットであった、この結果として生じたライブラリを配列決定することで、活性なCRISPR複合体の正確なPAMを含む配列が明らかになった。単一のRNAコンストラクトを用いたPAMテストでは、インビトロで転写されたRNAがプラスミドライブラリとともに加えられ、tracr/最少CRISPRアレイ鋳型が省略された以外は、同じ手順が繰り返された。NGSライブラリが調製されたエンドヌクレアーゼについては、seqLogo(例えば、Huber et al.Nat Methods.2015 Feb;12(2):115-21)の表現が構築され、図27、38、29、30、31、32、33、34、および35で提示されている。これらの表現を構築するために使用されるseqLogoモジュールは、DNA配列モチーフ(例えば、PAM配列)の位置特異的重み行列(position weight matrix)を取り、SchneiderとStephensが導入した対応する配列ロゴをプロットする(例えば、Schneider et al.Nucleic Acids Res.1990 Oct 25;18(20):6097-100を参照)。seqLogo表現における配列を表す文字は,アラインメントされた配列(例えば、PAM配列)の各位置について互いに重ねられている。各文字の高さはその頻度に比例しており、最も多いものが上にくるように文字を並べ替えている。
【0357】
実施例7.-(一般的なプロトコル)tracrRNAとsgRNAの構造のRNA折り畳み
ガイドRNA配列の37℃での折り畳み構造は、Andronescu et al. Bioinformatics.2007 Jul 1;23(13):i19-28の方法を用いて計算された。本明細書に記載される例示的なsgRNAの予測構造を、図21、22、23、24、25、および26に示す。
【0358】
実施例8.-(一般的なプロトコル)MG CRISPR複合体のインビトロ切断効率
エンドヌクレアーゼは、プロテアーゼ欠損大腸菌B株において、誘導性T7プロモーターからHisタグ付けされた融合タンパク質として発現した。Hisタグ付けされたタンパク質を発現する細胞を超音波で溶解し、Hisタグ付けされたタンパク質は、AKTA Avant FPLC(GE Lifescience)上のHisTrap FFカラム(GE Lifescience)でのNi-NTAアフィニティークロマトグラフィーによって精製された。溶出物をアクリルアミドゲル(Bio-Rad)上でSDS-PAGEにより分解し、InstantBlue Ultrafastクーマシー(Sigma-Aldrich)で染色した。純度は、ImageLabソフトウェア(Bio-Rad)を用いたタンパク質バンドの濃度測定を用いて決定された。精製されたエンドヌクレアーゼは、50mMのTris-HCl、300mMのNaCl、1mMのTCEP、5%グリセロール;pH7.5からなる保存緩衝液に透析され、-80℃で保存された。
【0359】
スペーサー配列とPAM配列(例えば、実施例6のように決定される)を含む標的DNAはDNA合成により構築された。代表的な1つのPAMは、PAMが縮重塩基を有する場合に、試験のために選択された。標的DNAは、一端から700bpに位置するPAMとスペーサーを用いたPCR増幅によってプラスミドから得られた2200bpの直鎖状DNAを含んでいた。切断に成功すると、700bpと1500bpの断片が得られた。標的DNA、インビトロ転写された単一のRNA、および精製された組換えタンパク質を、余剰なタンパク質とRNAを含む切断緩衝液(10mMのTris、100mMのNaCl、10mMのMgCl)で組み合わせ、5分から3時間、通常は1時間インキュベートした。反応を、RNAse Aの添加と60分でのインキュベーションによって停止させた。その後、反応物を1.2%TAEアガロースゲルで分解し、ImageLabソフトウェアで切断された標的DNAの割合を定量化する。
【0360】
実施例9.-(一般的なプロトコル)大腸菌中のMG CRISPR複合体のゲノム切断活性の試験
大腸菌は、二本鎖DNAの切断を効率的に修復する能力を持っていない。そのため、ゲノムDNAの切断は致死的な事象となり得る。この現象を利用して、ゲノムDNAにスペーサー/標的配列とPAM配列を組み込んだ標的株でエンドヌクレアーゼとtracrRNAを組換え発現させることによって、大腸菌においてエンドヌクレアーゼ活性を試験した。
【0361】
このアッセイでは、PAM配列は、実施例6に記載される方法で決定されたように試験対象のエンドヌクレアーゼに特異的である。sgRNA配列は、tracrRNAの配列と予測される構造に基づいて決定された。リピートの5’末端から始めて、8~12bp(一般的には10bp)のリピート-アンチリピートの対を選択した。残りのリピートの3’末端とtracrRNAの5’末端をテトラループに置き換えた。一般に、テトラループはGAAAであったが、特にGAAA配列が折り畳みを阻害すると予測される場合には、他のテトラループを使用することができる。このような場合には、TTCGテトラループを用いた。
【0362】
ゲノムDNAにPAM配列を組み込んだ組換え株を、エンドヌクレアーゼをコードするDNAで形質転換した。その後、形質転換体を化学的に適合させ、標的配列に特異的(「オンターゲット(on target)」)または標的に非特異的(「ノンターゲット(non target)」)な単一のガイドRNA50ngを用いて、形質転換した。熱ショック後、形質転換体をSOC中で37℃にて2時間回収した。その後、ヌクレアーゼ効率は、誘導培地で培養した5倍希釈系列によって決定された。コロニーは3連で(in triplicate)希釈系列から定量化された。
【0363】
実施例10.-(一般的なプロトコル)哺乳動物細胞中のMG CRISPR複合体のゲノム切断活性の試験
哺乳動物細胞における標的化および切断活性を示すために、MG Casエフェクタータンパク質配列を2つの哺乳動物発現ベクター:(a)C末端のSV40 NLSと2A-GFPタグを有するものと、(b)GFPタグを持たず、N末端に1つとC末端に1つの、2つのSV40 NLS配列を有するもので試験した。いくつかの例では、エンドヌクレアーゼをコードするヌクレオチド配列は、哺乳動物細胞での発現にコドン最適化されている。
【0364】
標的化配列が付加された対応する単一のガイドRNA配列(sgRNA)を、第2の哺乳動物発現ベクターにクローン化する。2つのプラスミドをHEK293T細胞にコトランスフェクトする。発現プラスミドとsgRNA標的化プラスミドをHEK293T細胞にコトランスフェクトしてから72時間後に、DNAを抽出し、NGS-ライブラリの作成に使用する。哺乳動物細胞における酵素の標的化効率を実証するために、標的部位の配列決定におけるインデルを介してパーセントNHEJを測定する。各タンパク質の活性を試験するために、少なくとも10の異なる標的部位が選択された。
【0365】
実施例11.-MG1ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNA検証
【0366】
MG1ファミリーエンドヌクレアーゼシステムの標的となるエンドヌクレアーゼ活性は、実施例6に記載したmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17-20に示すように、ゲル中で約170bpで遊走する産物が得られる。増幅産物は、MG1-4(二重ガイド:ゲル1、レーン3を参照、単一ガイド:ゲル6、レーン2を参照)、MG1-5(ゲル2、レーン10)、MG1-6(二重ガイド:ゲル5、レーン6を参照、単一ガイド:ゲル6、レーン5を参照)、MG1-7(二重ガイド:ゲル3、レーン13を参照、単一ガイド:ゲル3、レーン2を参照)(それぞれタンパク質配列番号:1-4)について観察された。PCR産物の配列決定により、表2に示されるように、これらの酵素の活性PAM配列が明らかになった。
【0367】
【表2】
【0368】
合成単一ガイドRNA(sgRNA)は、tracrRNAの配列と予測される構造に基づいて設計され、配列番号:5461-5464として提示されている。実施例6のPAM配列スクリーンは、sgRNAを用いて繰り返された。この実験の結果は表2にも示されており、sgRNAを使用するとPAMの特異性がわずかに変化したことが明らかになっている。
【0369】
インビトロでの標的となるエンドヌクレアーゼ活性
【0370】
PAM配列CAGGAAGGを有する標的DNAに対する、MG1-4エンドヌクレアーゼシステム(sgRNA 配列番号:5461を有する、タンパク質配列番号:1)のインビトロ活性が、実施例8の方法を用いて実証された。上記で報告されている単一ガイド配列(配列番号:5461)を使用し、配列のNsを置き換えてスペーサー/標的化配列の長さを18~24ntの範囲で変化させた。その結果を図10に示す。左パネルは、異なる標的化配列長(18~24nt)を有する対応する単一ガイドsgRNAと組み合わせたMG1-4によるDNA切断を実証するゲルを示し、右パネルは、同じデータを棒グラフとして定量化したものを示す。このデータは、18~24ヌクレオチドの標的化配列がMG1-4/sgRNAシステムで機能的であることを実証した。
【0371】
細菌細胞における標的となるエンドヌクレアーゼ活性
【0372】
MG1-4エンドヌクレアーゼシステム(タンパク質配列番号:1、sgRNA 配列番号:5461)のインビボ活性は、実施例9と同様にPAM配列CAGGAAGGを用いて試験された。形質転換した大腸菌を連続希釈でプレーティングし、その結果(左パネルに大腸菌の連続希釈を示し、右パネルに定量化した成長を示す)を図11に提示する。非標的sgRNAを発現する大腸菌と比較して、オンターゲットsgRNAを発現する大腸菌の増殖の大幅な減少は、ゲノムDNAが大腸菌細胞内でエンドヌクレアーゼによって特異的に切断されたことを示している。
【0373】
哺乳動物細胞における標的となるエンドヌクレアーゼ活性
【0374】
実施例10の方法を用いて、哺乳動物細胞における標的化および切断活性を実証した。MG1-4(タンパク質配列番号:5527)およびMG1-6(タンパク質配列番号:5529)の配列をコードするオープンリーディングフレームは、C末端SV40 NLSと2A-GFPタグを有するもの(大腸菌MG-BB)と、GFPタグを持たず、N末端に1つとC末端に1つの2つのNLS配列を持つもの(大腸菌pMG5-BB)の2つの哺乳動物発現ベクターにクローン化された。MG1-6については、オープンリーディングフレームはさらに哺乳動物の発現のためにコドン最適化され(配列番号:5589)、2-NLSプラスミド骨格にクローン化された(MG-16hs)。この実験の結果を図12に示す。エンドヌクレアーゼ発現ベクターは、エンドヌクレアーゼに特異的なtracr配列と表3~4から選択されたガイド配列とを有するsgRNA(例えば、配列番号:5512または5515)を発現させるための第2のベクターとともにHEK293T細胞にコトランスフェクトされた。コトランスフェクションの72時間後に、DNAを抽出し、NGS-ライブラリの調製に使用した。切断活性は、標的部位の配列に近接の内部欠失(NHEJレムナント)の出現により検出された。哺乳動物細胞における酵素の標的化効率を実証するために、標的部位の配列におけるインデルを介してNHEJの割合を測定し、図12に示した。
【0375】
【表3】
【0376】
【表4】
【0377】
実施例12.-MG2ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
【0378】
MG2ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されたようにmyTXTLシステムで確認された。このアッセイの結果を図17~20で示す。図17~20に示すアッセイでは、ライブラリの切断に成功した活性タンパク質は、ゲル中におよそ170bpのバンドを生じさせる。MG2-1(ゲル2、レーン11、およびゲル4、レーン6を参照)およびMG2-7(ゲル11、レーン10を参照)について増幅産物が観察された(それぞれ配列番号:320および321)。PCR産物の配列決定により、以下の表5に示す活性PAM配列が明らかになった。
【0379】
【表5】
【0380】
細菌細胞における標的となるエンドヌクレアーゼ活性
【0381】
sgRNAを有するMG2-7エンドヌクレアーゼシステム(エンドヌクレアーゼ配列番号:321;sgRNA 配列番号:5465)およびAGCGTAAG PAM配列のインビボ活性は、実施例9に記載される方法を用いて確認された。形質転換した大腸菌を連続希釈でプレーティングし、その結果(左パネルに大腸菌の連続希釈を示し、右パネルに定量化した成長を示す)を図34に提示する。非標的sgRNAを発現する大腸菌と比較して、オンターゲットsgRNAを発現する大腸菌の増殖の大幅な減少は、ゲノムDNAが大腸菌細胞内でMG1-4エンドヌクレアーゼによって特異的に切断されたことを示している。
【0382】
実施例13.-MG3ファミリーメンバーの特徴付け
【0383】
PAM特異性、tracrRNA/sgRNAの検証
【0384】
MG3ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、tracr配列およびCRISPRアレイを使用して、実施例6に記載されたようなmyTXTLシステムを使用して確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。MG3-6(二重ガイド:ゲル2、レーン8を参照、単一ガイド:ゲル3、レーン3を参照)、MG3-7(二重ガイド:ゲル2、レーン3を参照、単一ガイド:ゲル3、レーン4を参照)、MG3-8(二重ガイド:ゲル9、レーン5を参照)では、増幅産物が観察された(それぞれ配列番号:421、422、および423)。PCR産物の配列決定により、以下の表6に示す活性PAM配列が明らかになった。
【0385】
【表6】
【0386】
合成単一ガイドRNA(sgRNA)は、tracrRNAの配列と予測される構造に基づいて設計され、配列番号:5466-5467として提示されている。実施例6のPAM配列スクリーンは、sgRNAを用いて繰り返された。この実験の結果は表6にも示されており、sgRNAを使用するとPAMの特異性がわずかに変化したことが明らかになっている。
【0387】
インビトロでの標的となるエンドヌクレアーゼ活性
【0388】
MG3-6(エンドヌクレアーゼ配列番号:421)のインビトロ活性は、実施例8の方法を使用して、PAM配列GTGGGTTAで実証された。上記で報告されている単一ガイド配列(配列番号:5466)を使用し、配列のNsを置き換えてスペーサー/標的化配列の長さを18~24ntの範囲で変化させた。その結果を図13に示す。上パネルは、異なる標的化配列長(18~24nt)を有する様々なsgRNAと組み合わせたMG3-6によるDNA切断を実証するゲルを示し、下パネルは、同じデータを棒グラフとして定量化したものを示す。このデータは、18~24ヌクレオチドの標的化配列がMG3-6/sgRNAシステムで機能的であることを実証した。
【0389】
細菌細胞における標的となるエンドヌクレアーゼ活性
【0390】
MG3-7エンドヌクレアーゼシステム(タンパク質配列番号:422、sgRNA 配列番号:5467)のインビボ活性は、実施例9の方法を使用してPAM配列TGGACCTGを用いて試験された。形質転換した大腸菌を連続希釈でプレーティングし、その結果(上パネルに大腸菌の連続希釈を示し、下パネルに定量化した成長を示す)を図14に提示する。非標的sgRNAを発現する大腸菌と比較して、オンターゲットsgRNAを発現する大腸菌の増殖の大幅な減少は、ゲノムDNAがMG3-7エンドヌクレアーゼシステムによって特異的に切断されていたことを示している。
【0391】
哺乳動物細胞における標的となるエンドヌクレアーゼ活性
【0392】
実施例10の方法を用いて、哺乳動物細胞における標的化および切断活性を実証した。MG3-7(タンパク質配列番号:422)の配列をコードするオープンリーディングフレームは、C末端SV40 NLSと2A-GFPタグを有するもの(大腸菌MG-BB)と、GFPタグを持たず、N末端に1つとC末端に1つの2つのNLSを持つもの(大腸菌pMG5-BB)の2つの哺乳動物発現ベクターにクローン化された。エンドヌクレアーゼ発現ベクターは、表7から選択されたガイド配列を用いて上記のsgRNAを発現するための第2のベクターでHEK293T細胞へコトランスフェクトされた。この実験の結果を図12に示す。コトランスフェクションの72時間後に、DNAを抽出し、NGS-ライブラリの調製に使用した。切断活性は、標的部位の近傍にある内部欠失(NHEJレムナント)の出現により検出された。結果を図15に示す。
【0393】
sgRNAプラスミド上でコードされた標的部位を以下の表7に示す。
【0394】
【表7】
【0395】
実施例13.-MG4ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
【0396】
MG4ファミリーエンドヌクレアーゼシステムの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。MG4-2(二重ガイド:ゲル2、レーン9、単一ガイド:ゲル10、レーン7を参照)について増幅産物が観察された(配列番号:432)。PCR産物の配列決定により、以下の表8に示される活性PAM配列が明らかになった。
【0397】
【表8】
【0398】
実施例14.MG14ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
【0399】
MG14ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。MG14-1(二重ガイド:ゲル2、1レーン4、単一ガイド:ゲル3、レーン8を参照)について増幅産物が観察された(配列番号:678)。PCR産物の配列決定により、以下の表9に示される活性PAM配列特異性が明らかになった。
【0400】
【表9】
【0401】
細菌細胞における標的となるエンドヌクレアーゼ活性
【0402】
sgRNAを有するMG14-1エンドヌクレアーゼシステム(エンドヌクレアーゼ配列番号:678;sgRNA 配列番号:5469)およびGGCGGGGA PAM配列のインビボ活性は、実施例9に記載される方法を用いて確認された。形質転換した大腸菌を連続希釈でプレーティングし、その結果(左パネルに大腸菌の連続希釈を示し、右パネルに定量化した成長を示す)を図35に提示する。非標的sgRNAを発現する大腸菌と比較して、オンターゲットsgRNAを発現する大腸菌の増殖の大幅な減少は、ゲノムDNAが大腸菌細胞内でMG1-4エンドヌクレアーゼによって特異的に切断されたことを示している。
【0403】
実施例15.-MG15ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
【0404】
MG15ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。MG15-1(二重ガイド:ゲル2、レーン7、単一ガイド:ゲル3、レーン9を参照)について増幅産物が観察された(配列番号:930)。PCR産物の配列決定により、以下の表10で詳細に説明される活性PAM配列特異性が明らかになった。
【0405】
【表10】
【0406】
インビトロ活性
【0407】
MG15-1エンドヌクレアーゼシステム(タンパク質配列番号:930、sgRNA 配列番号:5470)のインビトロ活性は、実施例8の方法を使用してPAM配列GGGTCAAAを用いて試験された。上記で報告されている単一ガイド配列(配列番号:5470)を使用し、配列のNsを置き換えてスペーサー/標的化配列の長さを18~24ntの範囲で変化させた。その結果を図16に示す。上パネルは、異なる標的化配列長(18~24nt)を有する様々なsgRNAと組み合わせたMG15-1によるDNA切断を実証するゲルを示し、下パネルは、同じデータを棒グラフとして定量化したものを示す。このデータは、18~24ヌクレオチドの標的化配列がMG15-1/sgRNAシステムで機能的であることを実証した。
【0408】
細菌細胞における標的となるエンドヌクレアーゼ活性
【0409】
sgRNAを有するMG15-1エンドヌクレアーゼシステム(エンドヌクレアーゼ配列番号:930;sgRNA 配列番号:5470)およびGGGTCAAA PAM配列のインビボ活性は、実施例9に記載される方法を用いて確認された。形質転換した大腸菌を連続希釈でプレーティングし、その結果(左パネルに大腸菌の連続希釈を示し、右パネルに定量化した成長を示す)を図35に提示する。非標的sgRNAを発現する大腸菌と比較して、オンターゲットsgRNAを発現する大腸菌の増殖の大幅な減少は、ゲノムDNAが大腸菌細胞内でMG1-4エンドヌクレアーゼによって特異的に切断されたことを示している。
【0410】
実施例16.-MG16ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
【0411】
MG16ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。増幅産物は、MG16-2(ゲル11、レーン17を参照)(配列番号:1093)について観察された。PCR産物の配列決定により、以下の表11で詳細に説明される活性PAM配列特異性が明らかになった。
【0412】
【表11】
【0413】
実施例17.-MG18ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
【0414】
MG18ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。MG18-1(二重ガイド:ゲル2、レーン9、単一ガイド:ゲル11、レーン12を参照)について増幅産物が観察された(配列番号:1354)。PCR産物の配列決定により、以下の表12で詳細に説明される活性PAM配列特異性が明らかになった。
【0415】
【表12】
【0416】
実施例18.-MG21ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
【0417】
MG21ファミリーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。増幅産物は、MG21-1(ゲル11、レーン2を参照)について観察された(配列番号:1512)。PCR産物の配列決定により、以下の表13で詳細に説明される活性PAM配列特異性が明らかになった。
【0418】
【表13】
【0419】
実施例19.-MG22ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
【0420】
MG22ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。図17~20に示すアッセイでは、ライブラリの切断に成功した活性タンパク質は、ゲル中におよそ170bpのバンドを生じさせる。増幅産物は、MG22-1(ゲル11、レーン3を参照)について観察された(タンパク質配列番号:1656)。PCR産物の配列決定により、以下の表14で詳細に説明される活性PAM配列特異性が明らかになった。
【0421】
【表14】
【0422】
実施例20.-MG23ファミリーメンバーの特徴付け
PAM特異性、tracrRNA/sgRNAの検証
【0423】
MG23ファミリーメンバーの標的となるエンドヌクレアーゼ活性は、実施例6に記載されるようなmyTXTLシステムを用いて確認された。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~20に示すように、ゲル中で約170bpで遊走する産物が得られる。増幅産物は、MG23-1(ゲル11、レーン4を参照)について観察された(配列番号:1756)。PCR産物の配列決定により、以下の表15で詳細に説明されるこれらの酵素について活性PAM配列特異性が明らかになった。
【0424】
【表15】
本開示のシステムは、例えば、核酸編集(例えば、遺伝子編集)、核酸分子への結合(例えば、配列特異的結合)など、様々な用途に使用することができる。このようなシステムは、例えば、ウイルスゲノムを標的とすることでウイルスを不活性化したり、宿主細胞に感染できないようにしたりするために、価値の高い低分子、高分子、または二次代謝産物を生成するように生物を操作するべく遺伝子を追加したり、代謝経路を変更したりするために、進化的選択のための遺伝子駆動要素を確立するために、バイオセンサーとして外来の低分子およびヌクレオチドによる細胞摂動を検出するために、特定のヌクレオチド配列(例えば、細菌における抗生物質耐性をコードする配列)を標的とするとともに検出するためにプローブと組み合わせた不活性化酵素のように、疾患を引き起こす遺伝的要素を検出するための診断ツールとして(例えば、逆転写されたウイルスRNAまたは疾患を引き起こす突然変異をコードする増幅されたDNA配列の切断を介して)、被験体において疾患を引き起こす可能性のある遺伝的に受け継がれた突然変異をアドレス指定(例えば、除去または置換)して、遺伝子を不活性化することで細胞内での遺伝子の機能を確認するために使用されてもよい。
【0425】
本発明の好ましい実施形態が本明細書中で示され、記載されてきたが、このような実施形態はほんの一例として提供されているに過ぎないことが当業者に明らかであろう。本発明が明細書内で提供される特定の例によって制限されることは意図していない。本発明は前述の明細書に関して記載されているが、本明細書中の実施形態の記載および例示は、限定的な意味で解釈されることを目的としていない。当業者であれば、多くの変更、変化、および置換が、本発明から逸脱することなく思いつくだろう。さらに、本発明のすべての態様は、様々な条件および変数に依存する、本明細書で説明された特定の描写、構成、または相対的な比率に限定されないことが理解されよう。本明細書に記載される本発明の実施形態の様々な代替案が、本発明の実施に際して利用され得ることを理解されたい。それゆえ、本発明は、任意のそのような代替物、修正物、変形物、または同等物にも及ぶものと企図される。以下の請求項は本発明の範囲を定義するものであり、この請求項とその均等物の範囲内の方法、および構造体がそれによって包含されるものであるということが意図されている。
図1
図2
図3
図4
図5
図6
図7
図8
図9A
図9B
図9C
図9D
図9E
図9F
図9G
図9H
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
図27
図28
図29
図30
図31
図32
図33
図34
図35
図36
【配列表】
2024133476000001.xml
【手続補正書】
【提出日】2024-07-05
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
操作されたヌクレアーゼシステムであって、前記操作されたヌクレアーゼシステムは、
(a)RuvC_IIIドメインを含むエンドヌクレアーゼであって、ここで、前記エンドヌクレアーゼは、配列番号:423に対して少なくとも80%の配列同一性を有するアミノ酸配列を含む、エンドヌクレアーゼと、
(b)前記エンドヌクレアーゼと複合体を形成するように構成される、操作されたガイドリボ核酸構造であって、前記操作されたガイドリボ核酸構造は、
(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と、
(ii)前記エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列と、を含む操作されたガイドリボ核酸構造と、
を含む、操作されたヌクレアーゼシステム。
【請求項2】
前記RuvC_IIIドメインは、配列番号:2244に対して少なくとも90%の配列同一性を有するアミノ酸配列を含む、請求項1に記載の操作されたヌクレアーゼシステム。
【請求項3】
前記RuvC_IIIドメインは、配列番号:2244のアミノ酸配列を含む、請求項1または2に記載の操作されたヌクレアーゼシステム。
【請求項4】
前記エンドヌクレアーゼはHNHドメインを含む、請求項1-3のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項5】
前記HNHドメインは配列番号:4063に対して少なくとも90%の配列同一性を有するアミノ酸配列を含む、請求項4に記載の操作されたヌクレアーゼシステム。
【請求項6】
前記HNHドメインは、配列番号:4063のアミノ酸配列を含む、請求項4または5に記載の操作されたヌクレアーゼシステム。
【請求項7】
前記エンドヌクレアーゼは、配列番号:423に対して少なくとも90%の配列同一性を有するアミノ酸配列を含む、請求項1-6のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項8】
前記エンドヌクレアーゼは、配列番号:423を含む、請求項1-7のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項9】
前記エンドヌクレアーゼは、配列番号:5534のプロトスペーサー隣接モチーフ(PAM)配列に結合するように構成される、請求項1-8のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項10】
前記エンドヌクレアーゼは、前記エンドヌクレアーゼのN末端またはC末端の近位にある1つ以上の核局在化配列(NLS)をさらに含む、請求項1-9のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項11】
前記1つ以上のNLSは、配列番号:5597-5612のいずれか1つから選択される配列を含む、請求項10に記載の操作されたヌクレアーゼシステム。
【請求項12】
前記tracrリボ核酸配列は、配列番号:5497に対して少なくとも80%の配列同一性を有する配列を含む、請求項1-11のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項13】
前記tracrリボ核酸配列は、配列番号:5497に対して少なくとも90%の配列同一性を有する配列を含む、請求項1-12のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項14】
前記tracrリボ核酸配列は、配列番号:5497の配列を含む、請求項1-13のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項15】
前記操作されたガイドリボ核酸構造は、少なくとも2つのリボ核酸ポリヌクレオチドを含む、請求項1-14のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項16】
前記操作されたガイドリボ核酸構造は、前記ガイドリボ核酸配列と前記tracrリボ核酸配列とを含む1つのリボ核酸ポリヌクレオチドを含む、請求項1-14のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項17】
前記ガイドリボ核酸配列は、原核生物、細菌、古細菌、真核生物、真菌、植物、哺乳動物、またはヒトのゲノム配列に相補的である、請求項1-16のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項18】
前記ガイドリボ核酸配列は15~24ヌクレオチド長である、請求項1-17のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項19】
5’から3’に、前記標的デオキシリボ核酸配列の5’の配列を含む第1の相同性アームと、合成デオキシリボ核酸配列と、前記標的デオキシリボ核酸配列の3’の配列を含む第2の相同性アームとを含む、一本鎖または二本鎖のデオキシリボ核酸配列の修復鋳型をさらに含む、請求項1-18のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項20】
前記第1の相同性アームまたは前記第2の相同性アームは、少なくとも20、40、80、120、150、200、300、500、または1,000のヌクレオチドの配列を含む、請求項19に記載の操作されたヌクレアーゼシステム。
【請求項21】
前記操作されたヌクレアーゼシステムは、Mg 2+ の供給源をさらに含む、請求項1-20のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項22】
前記エンドヌクレアーゼおよび前記tracrリボ核酸配列は、同じ門内の別個の細菌種に由来する、請求項1-21のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項23】
前記操作されたガイドリボ核酸構造は、ステムおよびループからなるヘアピンを含み、ここで、前記ステムは、少なくとも10の塩基対のリボヌクレオチド、および前記ループの4つの塩基対以内の非対称バルジを含む、請求項1-22のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項24】
前記tracrリボ核酸配列は、少なくとも8の塩基対のリボヌクレオチドを含むヘアピンを含む、請求項1-22のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項25】
前記操作されたガイドリボ核酸構造は、前記ガイドリボ核酸配列の少なくとも8つのヌクレオチドおよび前記tracrリボ核酸配列の少なくとも8つのヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含み、ここで、前記tracrリボ核酸配列は、5’から3’に、第1のヘアピンと第2のヘアピンとを含み、ここで、前記第1のヘアピンは前記第2のヘアピンよりも長いステムを有する、請求項1-22のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項26】
前記配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFT、またはSmith-Waterman相同性検索アルゴリズムによって決定される、請求項1-25のいずれか1つに記載の操作されたヌクレアーゼシステム。
【請求項27】
前記配列同一性は、3のwordlength(W)、10のexpectation(E)のパラメータ、および、11のexistence、1のextensionでギャップコストを設定するBLOSUM62スコアリングマトリックスを使用して、ならびに、条件付き組成スコアマトリックス調整を使用して、前記BLASTP相同性検索アルゴリズムによって決定される、請求項26に記載の操作されたヌクレアーゼシステム。
【外国語明細書】