特許7546689 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ メタゲノミ，インコーポレイテッドの特許一覧

特許7546689クラス２のＩＩ型ＣＲＩＳＰＲシステム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3-1
3-2
4-1
4-2
5
6
7
8
9
10
11
12
13
14
15

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-08-29

(45)【発行日】2024-09-06

(54)【発明の名称】クラス２のＩＩ型ＣＲＩＳＰＲシステム

(51)【国際特許分類】

C12N 15/09 20060101AFI20240830BHJP

C12N 9/16 20060101ALI20240830BHJP

C12N 15/113 20100101ALI20240830BHJP

【ＦＩ】

C12N15/09 110

C12N9/16 Z ZNA

C12N15/113 Z

【請求項の数】 29

(21)【出願番号】P 2022559475

(86)(22)【出願日】2021-03-30

(65)【公表番号】

(43)【公表日】2023-05-15

(86)【国際出願番号】 US2021024945

(87)【国際公開番号】W WO2021202568

(87)【国際公開日】2021-10-07

【審査請求日】2024-03-29

(31)【優先権主張番号】63/003,159

(32)【優先日】2020-03-31

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】63/116,149

(32)【優先日】2020-11-19

(33)【優先権主張国・地域又は機関】US

【早期審査対象出願】

(73)【特許権者】

【識別番号】522185863

【氏名又は名称】メタゲノミ，インク．

(74)【復代理人】

【識別番号】110003797

【氏名又は名称】弁理士法人清原国際特許事務所

(74)【代理人】

【識別番号】100082072

【弁理士】

【氏名又は名称】清原義博

(72)【発明者】

【氏名】トーマス，ブライアン

(72)【発明者】

【氏名】ブラウン，クリストファー

(72)【発明者】

【氏名】デヴォート，オードラ

(72)【発明者】

【氏名】バターフィールド，クリスティーナ

(72)【発明者】

【氏名】アレクサンダー，リサ

(72)【発明者】

【氏名】ゴルツマン，ダニエラエス．エー．

【審査官】西賢二

(56)【参考文献】

【文献】特表２０１９－５３４６９５（ＪＰ，Ａ）

【文献】RAN, F. Ann et al.，"In vivo genome editing using Staphylococcus aureus Cas9"，Nature，2015年，Vol. 520，pp. 186-191, Supplementary Information，Published online: 2015 Apr 1

【文献】Burstein, D. et al.，"New CRISPR-Cas systems from uncultivated microbes"，Nature，2017年，Vol. 542，pp. 237-241

【文献】Database: UniProtKB, [online]，Accession No. A0A1F8ZSN4，HNH nuclease domain-containing protein，2019年12月11日，[令和6年4月15日検索], インターネット，<URL: https://rest.uniprot.org/unisave/A0A1F8ZSN4?format=txt&versions=11>

【文献】Database: UniProtKB, [online]，Accession No. A0A3D5Y812，HNHc domain-containing protein，2019年12月11日，[令和6年4月15日検索], インターネット，<URL: https://rest.uniprot.org/unisave/A0A3D5Y812?format=txt&versions=6>

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｃ１２Ｎ１５／００－１５／９０

Ｃ１２Ｎ９／００－９／９９

ＣＡｐｌｕｓ／ＲＥＧＩＳＴＲＹ／ＭＥＤＬＩＮＥ／ＥＭＢＡＳＥ／ＢＩＯＳＩＳ（ＳＴＮ）

ＵｎｉＰｒｏｔ／ＧｅｎｅＳｅｑ

ＧｅｎＢａｎｋ／ＥＭＢＬ／ＤＤＢＪ／ＧｅｎｅＳｅｑ

(57)【特許請求の範囲】

【請求項1】

操作されたヌクレアーゼシステムであって、前記操作されたヌクレアーゼシステムは、
（ａ）ＲｕｖＣ－ＩドメインおよびＨＮＨドメインを含むエンドヌクレアーゼと、
（ｂ）前記エンドヌクレアーゼと複合体を形成するように構成された、操作されたガイドリボ核酸構造であって、
（ｉ）標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列、および
（ｉｉ）前記エンドヌクレアーゼに結合するように構成され、配列番号２０３、２０２、６１３、または６１４のいずれか１つの非可変ヌクレオチドに対して少なくとも９０％の配列同一性を有する配列を含む、リボ核酸配列
を含む、操作されたガイドリボ核酸構造と
を含み、
ここで前記エンドヌクレアーゼは、配列番号２に対して少なくとも９０％の配列同一性を有する配列を含む、操作されたヌクレアーゼシステム。

【請求項2】

前記エンドヌクレアーゼは、古細菌エンドヌクレアーゼである、請求項１に記載の操作されたヌクレアーゼシステム。

【請求項3】

前記エンドヌクレアーゼは、クラス２のＩＩ型Ｃａｓエンドヌクレアーゼである、請求項１または２に記載の操作されたヌクレアーゼシステム。

【請求項4】

前記エンドヌクレアーゼは、ＲＲ×ＲＲモチーフを含むアルギニンリッチ領域またはＰＦ１４２３９相同性を有するドメインをさらに含む、請求項１－３のいずれか１つに記載の操作されたヌクレアーゼシステム。

【請求項5】

前記アルギニンリッチ領域または前記ＰＦ１４２３９相同性を有するドメインは、配列番号１～１９８、２２１～４５９、４６３～６１２、または６１７～６６８のうちのいずれか１つのアルギニンリッチ領域に対して少なくとも９０％の配列同一性を有する、請求項４に記載の操作されたヌクレアーゼシステム。

【請求項6】

前記エンドヌクレアーゼは、ＲＥＣ（認識）ドメインをさらに含む、請求項１－５のいずれか１つに記載の操作されたヌクレアーゼシステム。

【請求項7】

前記ＲＥＣドメインは、配列番号１～１９８、２２１～４５９、４６３～６１２、または６１７～６６８のうちのいずれか１つのＲＥＣドメインに対して少なくとも９０％の配列同一性を有する、請求項６に記載の操作されたヌクレアーゼシステム。

【請求項8】

前記エンドヌクレアーゼは、ＢＨドメイン、ＷＥＤドメイン、およびＰＩドメインをさらに含む、請求項１－７のいずれか１つに記載の操作されたヌクレアーゼシステム。

【請求項9】

前記ＢＨドメイン、前記ＷＥＤドメイン、または前記ＰＩドメインは、配列番号１～１９８、２２１～４５９、４６３～６１２、または６１７～６６８のいずれか１つのＢＨドメイン、ＷＥＤドメイン、またはＰＩドメインに対して少なくとも９０％の配列同一性を有する、請求項８に記載の操作されたヌクレアーゼシステム。

【請求項10】

前記エンドヌクレアーゼは、ＳｐＣａｓ９エンドヌクレアーゼに対して８０％未満の配列同一性を有する、請求項１－９のいずれか１つに記載の操作されたヌクレアーゼシステム。

【請求項11】

前記配列同一性は、ｗｏｒｄｌｅｎｇｔｈ（Ｗ）が３、ｅｘｐｅｃｔａｔｉｏｎ（Ｅ）が１０のパラメータを使用し、およびＢＬＯＳＵＭ６２スコアリングマトリックスのギャップコストをｅｘｉｓｔｅｎｃｅが１１、ｅｘｔｅｎｓｉｏｎが１に設定し、ならびに条件付き組成スコアマトリックス調整を使用する、ＢＬＡＳＴＰ相同性検索アルゴリズムによって求められる、請求項１－１０のいずれか１つに記載の操作されたヌクレアーゼシステム。

【請求項12】

前記エンドヌクレアーゼは、前記エンドヌクレアーゼのＮ末端の近位に１つ以上の核局在化配列（ＮＬＳ）を含む、請求項１－１１のいずれか１つに記載の操作されたヌクレアーゼシステム。

【請求項13】

一本鎖または二本鎖デオキシリボ核酸修復鋳型をさらに含み、前記一本鎖または二本鎖デオキシリボ核酸修復鋳型が、５’から３’で、前記標的デオキシリボ核酸配列に対して５’に少なくとも２０ヌクレオチドの配列を含む第１の相同性アームと、少なくとも１０ヌクレオチドの合成デオキシリボ核酸配列と、前記標的デオキシリボ核酸配列に対して３’に少なくとも２０ヌクレオチドの配列を含む第２の相同性アームとを含む、請求項１－１２のいずれか１つに記載の操作されたヌクレアーゼシステム。

【請求項14】

前記第１の相同性アームは、少なくとも４０ヌクレオチドの配列を含む、請求項１３に記載の操作されたヌクレアーゼシステム。

【請求項15】

前記エンドヌクレアーゼは、配列番号２に対して少なくとも９５％の配列同一性を有する配列を含む、請求項１－１４のいずれか１つに記載の操作されたヌクレアーゼシステム。

【請求項16】

前記エンドヌクレアーゼは、１２０ｋＤａ以下、１００ｋＤａ以下、９０ｋＤａ以下、または６０ｋＤａ以下の分子量を有する、請求項１－１５のいずれか１つに記載の操作されたヌクレアーゼシステム。

【請求項17】

前記操作されたガイドリボ核酸構造は、前記ガイドリボ核酸配列、および前記エンドヌクレアーゼに結合するように構成された前記リボ核酸配列を含む単一のリボ核酸ポリヌクレオチドを含む、請求項１－１６のいずれか１つに記載の操作されたヌクレアーゼシステム。

【請求項18】

前記ガイドリボ核酸配列は、真核生物、真菌、植物、哺乳動物、またはヒトのゲノム配列に相補的である、請求項１－１７のいずれか１つに記載の操作されたヌクレアーゼシステム。

【請求項19】

前記ガイドリボ核酸配列は、１５～２４ヌクレオチド長である、請求項１－１８のいずれか１つに記載の操作されたヌクレアーゼシステム。

【請求項20】

前記エンドヌクレアーゼは、前記エンドヌクレアーゼのＣ末端の近位に１つ以上のＮＬＳを含む、請求項１－１９のいずれか１つに記載の操作されたヌクレアーゼシステム。

【請求項21】

前記第２の相同性アームは、少なくとも４０ヌクレオチドの配列を含む、請求項１３に記載の操作されたヌクレアーゼシステム。

【請求項22】

前記操作されたガイドリボ核酸構造は、ステムおよびループを含むヘアピンを含むリボ核酸配列を含み、ここで前記ステムは、少なくとも１２対のリボヌクレオチドを含む、請求項１－２１のいずれか１つに記載の操作されたヌクレアーゼシステム。

【請求項23】

前記操作されたガイドリボ核酸構造は、第２のステムおよび第２の環をさらに含み、ここで前記第２のステムは、少なくとも５対のリボヌクレオチドを含む、請求項２２に記載の操作されたヌクレアーゼシステム。

【請求項24】

前記操作されたガイドリボ核酸構造は、少なくとも２本のヘアピンを含むリボ核酸構造をさらに含む、請求項２２に記載の操作されたヌクレアーゼシステム。

【請求項25】

前記エンドヌクレアーゼに結合するように構成された前記リボ核酸配列は、配列番号２０２のヌクレオチド２３～９３、配列番号２０３のヌクレオチド２３～１５７、配列番号６１３のヌクレオチド２３～１４５、または配列番号６１４のヌクレオチド２３～１５７に対して少なくとも９０％の配列同一性を有する配列を含む、請求項１－２４のいずれか１つに記載の操作されたヌクレアーゼシステム。

【請求項26】

前記エンドヌクレアーゼに結合するように構成された前記リボ核酸配列は、配列番号２０２のヌクレオチド２３～９３、配列番号２０３のヌクレオチド２３～１５７、配列番号６１３のヌクレオチド２３～１４５、または配列番号６１４のヌクレオチド２３～１５７に対して少なくとも９５％の配列同一性を有する配列を含む、請求項２５に記載の操作されたヌクレアーゼシステム。

【請求項27】

前記エンドヌクレアーゼに結合するように構成された前記リボ核酸配列は、配列番号２０２のヌクレオチド２３～９３、配列番号２０３のヌクレオチド２３～１５７、配列番号６１３のヌクレオチド２３～１４５、または配列番号６１４のヌクレオチド２３～１５７を有する配列を含む、請求項２６に記載の操作されたヌクレアーゼシステム。

【請求項28】

前記ガイドリボ核酸構造は、配列番号２０２、２０３、６１３または配列番号６１４のいずれか１つを有する配列を含む、請求項１－２７のいずれか１つに記載の操作されたヌクレアーゼシステム。

【請求項29】

前記エンドヌクレアーゼは、配列番号２の配列を含む、請求項１－２８のいずれか１つに記載の操作されたヌクレアーゼシステム。

【発明の詳細な説明】

【技術分野】

【0001】

＜相互参照＞
本出願は、２０２０年１１月１９日に出願され、「ＣＬＡＳＳＩＩ，ＴＹＰＥＩＩＣＲＩＳＰＲＳＹＳＴＥＭＳ」と題された米国仮特許出願第６３／１１６，１４９号、および、２０２０年３月３１日に出願され、「ＣＬＡＳＳＩＩ，ＴＹＰＥＩＩＣＲＩＳＰＲＳＹＳＴＥＭＳ」と題された第米国仮特許出願第６３／００３，１５９号の利益を主張し、その両方は全体が本明細書に組込まれる。

【0002】

＜配列表＞
本出願は配列表を含んでおり、この配列表はＡＳＣＩＩフォーマットで電子的に提出され、参照によりその全体が本明細書に組み込まれる。前述のＡＳＣＩＩコピーは、２０２１年３月２７日に作成され、５５９２１－７１１＿６０１＿ＳＬ．ｔｘｔというファイル名であり、２，２３５，５２６バイトのサイズである。

【背景技術】

【0003】

Ｃａｓ酵素は、それらの関連するクラスター化して規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）ガイドリボ核酸（ＲＮＡ）とともに、原核生物免疫系で広く見られる（～４５％の細菌、～８４％の古細菌）構成成分であり、ＣＲＩＳＰＲ－ＲＮＡ誘導核酸切断によって、感染性ウイルスおよびプラスミドなどの非自己核酸からそのような微生物を保護する役割を果たすように思われる。ＣＲＩＳＰＲＲＮＡエレメントをコードするデオキシリボ核酸（ＤＮＡ）エレメントは、構造と長さが比較的保存されている場合があるが、それらのＣＲＩＳＰＲ関連（Ｃａｓ）タンパク質は非常に多様であり、種々様々な核酸相互作用ドメインを含有している。ＣＲＩＳＰＲＤＮＡエレメントは早くとも１９８７年には観察されていたが、ＣＲＩＳＰＲ／Ｃａｓ複合体のプログラム可能なエンドヌクレアーゼ切断能力は比較的最近になって認識され、多様なＤＮＡ操作および遺伝子編集の用途における、組換えＣＲＩＳＰＲ／Ｃａｓシステムの使用につながっている。これらの酵素は、その有用性により、多種多様な生物工学、遺伝子編集、および治療の用途に再利用されている。単一エフェクターのアーキテクチャーにより、ゲノム工学のために現在再利用されている大多数のシステムは、ＣＲＩＳＰＲクラス２のＩＩ型およびクラス２のＶ型カテゴリーに属する。

【発明の概要】

【0004】

多くのクラス２のＣａｓエフェクターの大きなサイズ（およそ１２００アミノ酸より大きい）は、治療適用のための送達を困難にする。よって、本明細書に記載されるのは、ＳＭＡＲＴ（ＳＭａｌｌＡＲｃｈａｅａｌ－ａｓｓｏｃｉａＴｅｄ）ヌクレアーゼシステムと呼ばれる新規な推定上のガイドされるｄｓＤＮＡヌクレアーゼに関する、方法、組成物、およびシステムである。これらのエンドヌクレアーゼエフェクターは、それらの小さなサイズ（４００ａａ～１０５０ａａ）、ＲｕｖＣとＨＮＨの触媒ドメインの存在、および一体的に新規な生化学的機構を示唆する他の予測されるタンパク質の特徴により定義される。

【0005】

いくつかの態様では、本開示は操作されたヌクレアーゼシステムを提供し、上記操作されたヌクレアーゼシステムは、（ａ）ＲｕｖＣドメインとＨＮＨドメイン（を含む、難培養性微生物（ｕｎｃｕｌｔｉｖａｔｅｄｍｉｃｒｏｏｒｇａｎｉｓｍ）由来のエンドヌクレアーゼ、および、（ｂ）前述のエンドヌクレアーゼと複合体を形成するように構成された、操作されたガイドリボ核酸構造であって、（ｉ）標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と、（ｉｉ）前述のエンドヌクレアーゼに結合するように構成されたｔｒａｃｒリボ核酸配列とを含む、ガイドリボ核酸構造を含み、ここで前述のエンドヌクレアーゼは、およそ９６ｋＤａ以下の分子量を有する。いくつかの実施形態では、前述のエンドヌクレアーゼは、古細菌エンドヌクレアーゼである。いくつかの実施形態では、エンドヌクレアーゼはクラス２のＩＩ型Ｃａｓエンドヌクレアーゼである。いくつかの実施形態では、前述のエンドヌクレアーゼは、配列番号１－１９８、２２１－４５９、４６３－６１２、または６１７－６６８のいずれか１つに対して少なくとも７０％、少なくとも７５％、少なくとも８０％、または少なくとも９０％の配列同一性を有する配列を含む。いくつかの実施形態では、前述のエンドヌクレアーゼは、ＲＲ×ＲＲモチーフを含むアルギニンリッチ領域またはＰＦ１４２３９相同性を有するドメインをさらに含む。いくつかの実施形態では、前述のアルギニンリッチ領域または前述のＰＦ１４２３９相同性を有するドメインは、配列番号１－１９８、２２１－４５９、４６３－６１２、または６１７－６６８のうちのいずれか１つのアルギニンリッチ領域またはＰＦ１４２３９相同性を有するドメインに対して、少なくとも８５％、少なくとも９０％、または少なくとも９５％の同一性を有する。いくつかの実施形態では、前述のエンドヌクレアーゼは、ＲＥＣ（認識（ｒｅｃｏｇｎｉｔｉｏｎ））ドメインをさらに含む。いくつかの実施形態では、前述のＲＥＣドメインは、配列番号１－１９８、２２１－４５９、４６３－６１２、または６１７－６６８のうちのいずれか１つのＲＥＣドメインに対して、少なくとも８５％、少なくとも９０％、または少なくとも９５％の同一性を有する。いくつかの実施形態では、前述のエンドヌクレアーゼは、ＢＨ（ブリッジヘリックス（ｂｒｉｄｇｅｈｅｌｉｘ））ドメイン、ＷＥＤ（ウェッジ（ｗｅｄｇｅ））ドメイン、およびＰＩ（ＰＡＭ相互作用）ドメインをさらに含む。いくつかの実施形態では、前述のＢＨドメイン、前述のＷＥＤドメイン、または前述のＰＩドメインは、配列番号１－１９８、２２１－４５９、４６３－６１２、または６１７－６６８のＢＨドメイン、ＷＥＤドメイン、および／またはＰＩドメインに対して、少なくとも８５％、少なくとも９０％、または少なくとも９５％の同一性を有する。

【0006】

いくつかの態様では、本開示は操作されたヌクレアーゼシステムを提供し、前述の操作されたヌクレアーゼシステムは、（ａ）ＲｕｖＣ－ＩドメインとＨＮＨドメインとを含むエンドヌクレアーゼ、および（ｂ）前述のエンドヌクレアーゼと複合体を形成するように構成された、操作されたガイドリボ核酸構造であって、（ｉ）標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と、（ｉｉ）前述のエンドヌクレアーゼに結合するように構成されたリボ核酸配列とを含む、ガイドリボ核酸構造を含み、ここで前述のエンドヌクレアーゼは、配列番号１－１９８、２２１－４５９、４６３－６１２、または６１７－６６８のいずれか１つに対して少なくとも７０％、少なくとも７５％、少なくとも８０％、または少なくとも９０％の配列同一性を有する配列を含む。いくつかの実施形態では、前述のエンドヌクレアーゼは、古細菌エンドヌクレアーゼである。いくつかの実施形態では、エンドヌクレアーゼは、クラス２のＩＩ型Ｃａｓエンドヌクレアーゼである。いくつかの実施形態では、前述のエンドヌクレアーゼは、ＲＲ×ＲＲモチーフを含むアルギニンリッチ領域またはＰＦ１４２３９相同性を有するドメインをさらに含む。いくつかの実施形態では、前述のアルギニンリッチ領域または前述のＰＦ１４２３９相同性を有するドメインは、配列番号１－１９８、２２１－４５９、４６３－６１２、６１７－６６８のうちのいずれか１つのアルギニンリッチ領域に対して、少なくとも８５％、少なくとも９０％、または少なくとも９５％の同一性を有する。いくつかの実施形態では、前述のエンドヌクレアーゼは、ＲＥＣ（認識）ドメインをさらに含む。いくつかの実施形態では、前述のＲＥＣドメインは、配列番号１－１９８、２２１－４５９、４６３－６１２、または６１７－６６８のうちのいずれか１つのＲＥＣドメインに対して、少なくとも８５％、少なくとも９０％、少なくとも９５％の同一性を有する。いくつかの実施形態では、前述のエンドヌクレアーゼは、ＢＨドメイン、ＷＥＤドメイン、およびＰＩドメインをさらに含む。いくつかの実施形態では、前述のＢＨドメイン、前述のＷＥＤドメイン、または前述のＰＩドメインは、配列番号１－１９８，２２１－４５９、４６３－６１２、または６１７－６６８のいずれか１つのＢＨドメイン、ＷＥＤドメイン、および／またはＰＩドメインに対して、少なくとも８５％、少なくとも９０％、または少なくとも９５％の同一性を有する。いくつかの実施形態では、前述のエンドヌクレアーゼは難培養性微生物に由来する。いくつかの実施形態では、前述のエンドヌクレアーゼに結合するように構成された前述のリボ核酸配列は、配列番号１９９－２００、４６０－４６１、または６６９－６７３のうちのいずれか１つに対して少なくとも８０％の配列同一性を有する配列を含むか、または、配列番号２０１－２０３または６１３－６１６のうちのいずれか１つの非縮重ヌクレオチドに対して少なくとも８０％の配列同一性を有する配列を含む。いくつかの実施形態では、ガイド核酸構造は、配列番号２０１－２０３、６１３－６１６のうちのいずれか１つの非変性ヌクレオチドに対して少なくとも８０％の同一性を有する配列を含む。

【0007】

いくつかの態様では、本開示は操作されたヌクレアーゼシステムを提供し、当該操作されたヌクレアーゼシステムは、（ａ）操作されたガイドリボ核酸構造であって、（ｉ）標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と、（ｉｉ）エンドヌクレアーゼに結合するように構成されたリボ核酸配列とを含み、ここで前述のリボ核酸配列は、配列番号１９９－２００、４６０－４６１、または６６９－６７３のうちのいずれか１つに対して少なくとも８０％の配列同一性を有する配列を含むか、または、配列番号２０１－２０３または６１３－６１６のうちのいずれか１つの非可変ヌクレオチドに対して少なくとも８０％の配列同一性を有する配列を含む、操作されたガイドリボ核酸構造、および、（ｂ）前述の操作されたガイドリボ核酸に結合するように構成されたＲＮＡ誘導型エンドヌクレアーゼ（ＲＮＡ－ｇｕｉｄｅｄｅｎｄｏｎｕｃｌｅａｓｅ）を含む。いくつかの実施形態では、前述のＲＮＡ誘導型エンドヌクレアーゼは、古細菌エンドヌクレアーゼである。いくつかの実施形態では、前述のエンドヌクレアーゼは、約１２０ｋＤａ以下、１００ｋＤａ以下、９０ｋＤａ以下、または６０ｋＤａ以下の分子量を有する。いくつかの実施形態では、前述の操作されたガイドリボ核酸構造は、少なくとも２つのリボ核酸ポリヌクレオチドを含む。いくつかの実施形態では、前述の操作されたガイドリボ核酸構造は、前述のガイドリボ核酸配列と前述のｔｒａｃｒリボ核酸配列とを含む単一のリボ核酸ポリヌクレオチドを含む。いくつかの実施形態では、前述のガイドリボ核酸配列は、原核生物、細菌、古細菌、真核生物、真菌、植物、哺乳動物、またはヒトのゲノム配列に相補的である。いくつかの実施形態では、前述のガイドリボ核酸配列は、１５～２４ヌクレオチド長である。いくつかの実施形態では、前述のエンドヌクレアーゼは、前述のエンドヌクレアーゼのＮ末端またはＣ末端の近位にある１つ以上の核局在化配列（ＮＬＳ）を含む。いくつかの実施形態では、前述のＮＬＳは、配列番号２０５－２２０から選択される配列を含む。いくつかの実施形態では、システムは、一本鎖または二本鎖のＤＮＡ修復鋳型をさらに含み、該一本鎖または二本鎖のＤＮＡ修復鋳型は、５’から３’で、前述の標的デオキシリボ核酸配列に対して５’に、少なくとも２０ヌクレオチドの配列を含む第１の相同性アームと、少なくとも１０ヌクレオチドの合成ＤＮＡ配列と、前述の標的配列に対して３’に少なくとも２０ヌクレオチドの配列を含む第２の相同性アームとを含む。いくつかの実施形態では、前述の第１の相同性アームまたは第２の相同性アームは、少なくとも４０、８０、１２０、１５０、２００、３００、５００、または１，０００ヌクレオチドの配列を含む。いくつかの実施形態では、前述の操作されたヌクレアーゼシステムは、Ｍｇ^２＋の供給源をさらに含む。いくつかの実施形態では、前述のエンドヌクレアーゼおよび前述のｔｒａｃｒリボ核酸配列は、同じ門内の別個の細菌種に由来する。いくつかの実施形態では、前述のエンドヌクレアーゼは、配列番号２－２４のいずれか１つに対して少なくとも７０％の配列同一性を有する配列を含み、および、前述のガイドＲＮＡ構造は、ステムとループとを含むヘアピンを含むことが予測されるＲＮＡ配列を含み、ここで前述のステムは、少なくとも１２対のリボヌクレオチドを含む。いくつかの実施形態では、前述のガイドＲＮＡ構造は、第２のステムおよび第２のループをさらに含み、ここで第２のステムは少なくとも５対のリボヌクレオチドを含む。いくつかの実施形態では、前述のガイドＲＮＡ構造は、少なくとも２本のヘアピンを含むＲＮＡ構造をさらに含む。いくつかの実施形態では、前述のエンドヌクレアーゼは、配列番号１に対して少なくとも７０％の配列同一性を有する配列を含み、および前述のガイドＲＮＡ構造は、ステムとループを含む少なくとも４本のヘアピンを含むことが予測されるＲＮＡ配列を含む。いくつかの実施形態では、ａ）前述のエンドヌクレアーゼは、配列番号１、２、１０、１７、または６１３－６１６のいずれか１つに対して少なくとも７０％、少なくとも８０％、または少なくとも９０％同一である配列を含み、ｂ）前述のガイドＲＮＡ構造は、配列番号１９９－２００または６６９－６７３のいずれか１つに対して、あるいは配列番号２０１－２０３または６１３－６１６のうちのいずれか１つの非可変ヌクレオチドに対して、少なくとも７０％、少なくとも８０％、または少なくとも９０％同一である配列を含む。いくつかの実施形態では、ａ）前述のエンドヌクレアーゼは、配列番号１－２４、４６２－４８８、または５０１－６１２のいずれか１つに対して少なくとも７０％、少なくとも８０％、または少なくとも９０％同一である配列を含み、および、ｂ）前述のガイドＲＮＡ構造は、配列番号１９９－２００または６６９－６７３のいずれか１つに対して、あるいは配列番号２０１－２０３または６１３－６１６のうちのいずれか１つの非可変ヌクレオチドに対して、少なくとも７０％、少なくとも８０％、または少なくとも９０％同一である配列を含む。いくつかの実施形態では、ａ）前述のエンドヌクレアーゼは、配列番号２、１０、または１７のいずれか１つに対して少なくとも７０％、少なくとも８０％、または少なくとも９０％同一である配列を含み、および、ｂ）前述のガイドＲＮＡ構造は、配列番号２０２－２０３または６１３－６１４の非可変ヌクレオチドのうちのいずれか１つに対して少なくとも７０％、少なくとも８０％、あるいは少なくとも９０％同一である配列を含む。いくつかの実施形態では、ａ）前述のエンドヌクレアーゼは、配列番号２５－１９８、２２１－４５９、または４８９－５８０のいずれか１つに対して少なくとも７０％、少なくとも８０％、または少なくとも９０％同一である配列を含み、および、ｂ）前述のガイドＲＮＡ構造は、クラス２のＩＩ型のｓｇＲＮＡまたはｔｒａｃｒ配列に対して、少なくとも７０％、少なくとも８０％、または少なくとも９０％同一である配列を含む。いくつかの実施形態では、前述の配列同一性は、ＢＬＡＳＴＰ、ＣＬＵＳＴＡＬＷ、ＭＵＳＣＬＥ、ＭＡＦＦＴによって、またはＳｍｉｔｈ－Ｗａｔｅｒｍａｎ相同性検索アルゴリズムのパラメータを用いるＣＬＵＳＴＡＬＷによって、求められる。いくつかの実施形態では、配列同一性は、前述のＢＬＡＳＴＰ相同性検索アルゴリズムによって求められ、ここでパラメータとして３のｗｏｒｄｌｅｎｇｔｈ（Ｗ）、１０のｅｘｐｅｃｔａｔｉｏｎ（Ｅ）を使用し、およびギャップコストを１１のｅｘｉｓｔｅｎｃｅ、１のｅｘｔｅｎｓｉｏｎに設定するスコアリングマトリックスＢＬＯＳＵＭ６２を使用し、ならびに条件付き組成スコアマトリックス調整（ｃｏｎｄｉｔｉｏｎａｌｃｏｍｐｏｓｉｔｉｏｎａｌｓｃｏｒｅｍａｔｒｉｘａｄｊｕｓｔｍｅｎｔ）を使用する。いくつかの実施形態では、前述のエンドヌクレアーゼは、Ｃａｓ９エンドヌクレアーゼ、Ｃａｓ１４エンドヌクレアーゼ、Ｃａｓ１２ａエンドヌクレアーゼ、Ｃａｓ１２ｂエンドヌクレアーゼ、Ｃａｓ１２ｃエンドヌクレアーゼ、Ｃａｓ１２ｄエンドヌクレアーゼ、Ｃａｓ１２ｅエンドヌクレアーゼ、Ｃａｓ１３ａエンドヌクレアーゼ、Ｃａｓ１３ｂエンドヌクレアーゼ、Ｃａｓ１３ｃエンドヌクレアーゼ、またはＣａｓ１３ｄエンドヌクレアーゼではない。いくつかの実施形態では、前述のエンドヌクレアーゼは、Ｃａｓ９エンドヌクレアーゼに対して８０％未満の同一性を有する。

【0008】

いくつかの態様では、本開示は単一の操作されたガイドリボ核酸ポリヌクレオチドを提供し、前述の単一の操作されたガイドリボ核酸ポリヌクレオチドは、ａ）標的ＤＮＡ分子中の標的配列に相補的なヌクレオチド配列を含む、ＤＮＡ標的化セグメント（ＤＮＡ－ｔａｒｇｅｔｉｎｇｓｅｇｍｅｎｔ）と、ｂ）ハイブリダイズして二本鎖ＲＮＡ（ｄｓＲＮＡ）二重鎖を形成するヌクレオチドの２つの相補的なストレッチを含むタンパク質結合セグメントとを含み、ここで前述のヌクレオチドの２つの相補的なストレッチは介在ヌクレオチドで互いに共有結合し、ここで操作されたガイドリボ核酸ポリヌクレオチドは、配列番号１－１９８、２２１－４５９、４６３－６１２、または６１７－６６８のいずれか１つに対して少なくとも７５％の配列同一性を有する変異体を含むエンドヌクレアーゼと複合体を形成するように構成される。いくつかの実施形態では、前述のＤＮＡ標的化セグメントは、前述のヌクレオチドの２つの相補的なストレッチの両方の５’側に位置する。いくつかの実施形態では、ａ）前述のタンパク質結合セグメントは、配列番号１９９－２００または６６９－６７３のうちのいずれか１つに対して少なくとも７０％、少なくとも８０％、または少なくとも９０％同一である配列を含み、ｂ）前述のタンパク質結合セグメントは、配列番号２０１－２０３または６１３－６１６のうちのいずれか１つの非可変ヌクレオチドに対して、少なくとも７０％、少なくとも８０％、少なくとも９０％同一である配列を含む。いくつかの実施形態では、ａ）前述のエンドヌクレアーゼは、配列番号２、１０、または１７のいずれか１つに対して少なくとも７０％、少なくとも８０％、あるいは少なくとも９０％同一である配列を含み、および、ｂ）前述のガイドＲＮＡ構造は、配列番号２００、あるいは配列番号２０２－２０３または６１３－６１４の非可変ヌクレオチドの少なくとも１つに対して少なくとも７０％、少なくとも８０％、または少なくとも９０％同一である配列を含む。いくつかの実施形態では、ａ）前述のエンドヌクレアーゼは、配列番号２５－１９８、２２１－４５９、または４８９－５８０のいずれか１つに対して少なくとも７０％、少なくとも８０％、あるいは少なくとも９０％同一である配列を含み、および、ｂ）前述のガイドＲＮＡ構造は、クラス２のＩＩ型ｓｇＲＮＡに対して少なくとも７０％、少なくとも８０％、または少なくとも９０％同一の配列を含む。いくつかの実施形態では、前述のエンドヌクレアーゼは、該エンドヌクレアーゼに連結された塩基エディターまたはヒストンエディターをさらに含む。いくつかの実施形態では、前述の塩基エディターは、アデノシンデアミナーゼである。いくつかの実施形態では、前述のアデノシンデアミナーゼはＡＤＡＲ１またはＡＤＡＲ２を含む。いくつかの実施形態では、前述の塩基エディターはシトシンデアミナーゼである。いくつかの実施形態では、前述のシトシンデアミナーゼは、ＡＰＯＢＥＣ１、ＡＰＯＢＥＣ２、ＡＰＯＢＥＣ３Ａ、ＡＰＯＢＥＣ３Ｂ、ＡＰＯＢＥＣ３Ｃ、ＡＰＯＢＥＣ３Ｄ、ＡＰＯＢＥＣ３Ｆ、ＡＰＯＢＥＣ３Ｇ、ＡＰＯＢＥＣ３Ｈ、またはＡＰＯＢＥＣ４を含む。

【0009】

いくつかの態様では、本開示は、本明細書に記載される操作されたガイドリボ核酸ポリヌクレオチドのいずれかをコードするデオキシリボ核酸ポリヌクレオチドを提供する。

【0010】

いくつかの態様では、本開示は、生物における発現のために最適化された、操作された核酸配列を含む核酸を提供し、ここで前述の核酸は、ＲｕｖＣドメインとＨＮＨドメインとを含むクラス２のＩＩ型Ｃａｓエンドヌクレアーゼをコードし、前述のエンドヌクレアーゼは、難培養性微生物に由来し、および、ここで前述のエンドヌクレアーゼは、約１２０ｋＤａ以下、１００ｋＤａ以下、９０ｋＤａ以下、６０ｋＤａ以下、または３０ｋＤａ以下の分子量を有する。いくつかの実施形態では、前述のエンドヌクレアーゼは、配列番号１－１９８、２２１－４５９、４６３－６１２、または６１７－６６８、あるいはそれらに対して少なくとも７０％の配列同一性を有する変異体を含む。いくつかの実施形態では、前述のエンドヌクレアーゼは、該エンドヌクレアーゼのＮ末端またはＣ末端の近位にある１つ以上の核局在化配列（ＮＬＳ）をコードする配列をさらに含む。いくつかの実施形態では、前述のＮＬＳは、配列番号２０５－２２０から選択される配列を含む。いくつかの実施形態では、前述の生物は、原核生物、細菌、真核生物、真菌、植物、哺乳動物、げっ歯類、またはヒトである。いくつかの実施形態では、前述の生物は原核生物または細菌であり、および、前述の生物は、前述のエンドヌクレアーゼが由来する生物とは異なる生物である。いくつかの実施形態では、前述の生物は、前述の難培養性微生物ではない。

【0011】

いくつかの態様では、本開示は、ＲｕｖＣ－ＩドメインとＨＮＨドメインとを含むＲＮＡ誘導型エンドヌクレアーゼをコードする核酸配列を含むベクターを提供し、ここで前述のエンドヌクレアーゼは、難培養性微生物に由来し、および、ここで前述のエンドヌクレアーゼは、約１２０ｋＤａ以下、１００ｋＤａ以下、９０ｋＤａ以下、または６０ｋＤａ以下の分子量を有し、ここでＲＮＡ誘導型エンドヌクレアーゼは、任意選択的に古細菌のものである。いくつかの実施形態では、前述のエンドヌクレアーゼは、ＲＲ×ＲＲモチーフを含むアルギニンリッチ領域またはＰＦ１４２３９相同性を有するドメインをさらに含む。いくつかの実施形態では、前述のエンドヌクレアーゼは、ＲＥＣ（認識）ドメインをさらに含む。いくつかの実施形態では、前述のエンドヌクレアーゼは、ＢＨドメイン、ＷＥＤドメイン、およびＰＩドメインをさらに含む。

【0012】

いくつかの態様では、本開示は、本明細書に記載される核酸のいずれかを含むベクターを提供する。いくつかの実施形態では、ベクターは、前述のエンドヌクレアーゼと複合体を形成するように構成された、操作されたガイドリボ核酸構造をコードする核酸をさらに含み、前述の操作されたガイドリボ核酸構造は：ａ）標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列と、ｂ）前述のエンドヌクレアーゼに結合するように構成されたｔｒａｃｒリボ核酸配列とを含む。いくつかの実施形態では、ベクターは、プラスミド、ミニサークル、ＣＥＬｉＤ、アデノ随伴ウイルス（ＡＡＶ）由来のビリオン、またはレンチウイルスである。

【0013】

いくつかの態様では、本開示は、本明細書に記載されるベクターのいずれかを含む細胞を提供する。いくつかの実施形態では、前述の細胞は、細菌、古細菌、真菌、真核生物、哺乳動物、または植物の、細胞である。いくつかの実施形態では、前述の細胞は、細菌の細胞である。

【0014】

いくつかの態様では、本開示は、エンドヌクレアーゼを製造する方法を提供し、前述の方法は、本明細書に記載される細胞のいずれかを培養する工程を含む。

【0015】

いくつかの態様では、本開示は、二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、標識、または修飾するための方法を提供し、上記方法は：（ａ）クラス２のＩＩ型Ｃａｓエンドヌクレアーゼおよび前述の二本鎖デオキシリボ核酸ポリヌクレオチドに結合するように構成された操作されたガイドリボ核酸構造と複合体を形成しているクラス２のＩＩ型Ｃａｓエンドヌクレアーゼに対して、前述の二本鎖デオキシリボ核酸ポリヌクレオチドを接触させる工程を含み、（ｂ）前述の二本鎖デオキシリボ核酸ポリヌクレオチドは、プロトスペーサー隣接モチーフ（ＰＡＭ）を含み、ここで前述のエンドヌクレアーゼは、約１２０ｋＤａ以下、１００ｋＤａ以下、９０ｋＤａ以下、または６０ｋＤａ以下の分子量を有する。いくつかの実施形態では、前述のエンドヌクレアーゼは、前述の二本鎖デオキシリボ核酸ポリヌクレオチドを切断し、ここで前述のＰＡＭはＮＧＧを含む。いくつかの実施形態では、前述のエンドヌクレアーゼは、前述の二本鎖デオキシリボ核酸ポリヌクレオチドを、前述のＰＡＭから６～８ヌクレオチドで、または７ヌクレオチドで、切断する。いくつかの実施形態では、前述のエンドヌクレアーゼは、配列番号１－１９８、２２１－４５９、４６３－６１２、または６１７－６６８のいずれか１つに対して少なくとも７０％、少なくとも７５％、少なくとも８０％、または少なくとも９０％の配列同一性を有する変異体を含む。

【0016】

いくつかの態様では、本開示は、二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、標識、または修飾するための方法を提供し、上記方法は：（ａ）前述の二本鎖デオキシリボ核酸ポリヌクレオチドを、ＲＮＡ誘導型古細菌エンドヌクレアーゼおよび前述の二本鎖デオキシリボ核酸ポリヌクレオチドに結合するように構成された操作されたガイドリボ核酸構造と複合体を形成するＲＮＡ誘導型古細菌エンドヌクレアーゼに、接触させる工程を含み、ここで前述の二本鎖デオキシリボ核酸ポリヌクレオチドは、プロトスペーサー隣接モチーフ（ＰＡＭ）を含み、および、ここで前述のエンドヌクレアーゼは、配列番号１－１９８、２２１－４５９、４６３－６１２、または６１７－６６８のいずれか１つに対して少なくとも７０％、少なくとも７５％、少なくとも８０％、または少なくとも９０％の配列同一性を有する変異体を含む。いくつかの実施形態では、前述のエンドヌクレアーゼは、前述の二本鎖デオキシリボ核酸ポリヌクレオチドを切断し、ここで前述のＰＡＭはＮＧＧを含む。いくつかの実施形態では、前述のエンドヌクレアーゼは、前述の二本鎖デオキシリボ核酸ポリヌクレオチドを、前述のＰＡＭから６～８ヌクレオチド、または７ヌクレオチドで、切断する。いくつかの実施形態では、前述のクラス２のＩＩ型Ｃａｓエンドヌクレアーゼは、Ｃａｓ９エンドヌクレアーゼ、Ｃａｓ１４エンドヌクレアーゼ、Ｃａｓ１２ａエンドヌクレアーゼ、Ｃａｓ１２ｂエンドヌクレアーゼ、Ｃａｓ１２ｃエンドヌクレアーゼ、Ｃａｓ１２ｄエンドヌクレアーゼ、Ｃａｓ１２ｅエンドヌクレアーゼ、Ｃａｓ１３ａエンドヌクレアーゼ、Ｃａｓ１３ｂエンドヌクレアーゼ、Ｃａｓ１３ｃエンドヌクレアーゼ、またはＣａｓ１３ｄエンドヌクレアーゼではない。いくつかの実施形態では、前述のクラス２のＩＩ型Ｃａｓエンドヌクレアーゼは、難培養性微生物に由来する。いくつかの実施形態では、前述の二本鎖デオキシリボ核酸ポリヌクレオチドは、原核生物、古細菌、細菌、真核生物、植物、真菌、哺乳動物、げっ歯類、またはヒトの二本鎖デオキシリボ核酸ポリヌクレオチドである。いくつかの実施形態では、前述の二本鎖デオキシリボ核酸ポリヌクレオチドは、前述のエンドヌクレアーゼが由来する種以外の種に由来する原核生物、古細菌、または細菌の二本鎖デオキシリボ核酸ポリヌクレオチドである。

【0017】

いくつかの態様では、本開示は、標的核酸遺伝子座を改変するための方法を提供し、上記方法は、本明細書に記載される操作されたヌクレアーゼシステムのいずれかを上記標的核酸遺伝子座に送達する工程を含み、ここで、前述のエンドヌクレアーゼは、前述の操作されたガイドリボ核酸構造と複合体を形成するように構成され、ここで、上記複合体は、上記複合体が上記標的核酸遺伝子座に結合すると、上記複合体が上記標的核酸遺伝子座を改変するように構成される。いくつかの実施形態では、前述の標的核酸遺伝子座を改変することは、前述の標的核酸遺伝子座を結合、ニッキング、切断、標識することを含む。いくつかの実施形態では、前述の標的核酸遺伝子座は、デオキシリボ核酸（ＤＮＡ）またはリボ核酸（ＲＮＡ）を含む。いくつかの実施形態では、前述の標的核酸は、ゲノム真核生物ＤＮＡ、古細菌ＤＮＡ、ウイルスＤＮＡ、または細菌ＤＮＡを含む。いくつかの実施形態では、前述の標的核酸は細菌ＤＮＡを含み、ここで前述の細菌ＤＮＡは、前述のエンドヌクレアーゼが由来する種とは異なる細菌または古細菌の種に由来する。いくつかの実施形態では、前述の標的核酸遺伝子座はインビトロである。いくつかの実施形態では、前述の標的核酸遺伝子座は細胞内にある。いくつかの実施形態では、前述のエンドヌクレアーゼおよび前述の操作されたガイド核酸構造は、別々の核酸分子によってコードされる。いくつかの実施形態では、前述の細胞は、原核細胞、細菌細胞、古細菌細胞、真核細胞、真菌細胞、植物細胞、動物細胞、哺乳動物細胞、げっ歯類細胞、霊長類細胞、またはヒト細胞である。いくつかの実施形態では、前述の細胞は、前述のエンドヌクレアーゼが由来する種とは異なる種に由来する。いくつかの実施形態では、前述の標的核酸遺伝子座に前述の操作されたヌクレアーゼシステムを送達する工程は、本明細書に記載される核酸のいずれか、または本明細書に記載されるベクターのいずれかを送達することを含む。いくつかの実施形態では、前述の操作されたヌクレアーゼシステムを前述の標的核酸遺伝子座に送達する工程は、前述のエンドヌクレアーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む。いくつかの実施形態では、前述の核酸は、前述のエンドヌクレアーゼをコードする前述のオープンリーディングフレームが動作可能に連結されるプロモーターを含む。いくつかの実施形態では、前述の操作されたヌクレアーゼシステムを前述の標的核酸遺伝子座に送達する工程は、前述のエンドヌクレアーゼをコードする前述のオープンリーディングフレームを含有するキャッピングしたｍＲＮＡ（ｃａｐｐｅｄｍＲＮＡ）を送達することを含む。いくつかの実施形態では、前述の操作されたヌクレアーゼシステムを前述の標的核酸遺伝子座に送達する工程は、翻訳されたポリペプチドを送達することを含む。いくつかの実施形態では、前述の操作されたヌクレアーゼシステムを前述の標的核酸遺伝子座に送達する工程は、リボ核酸（ＲＮＡ）ｐｏｌＩＩＩプロモーターに動作可能に連結される前述の操作されたガイドリボ核酸構造をコードするデオキシリボ核酸（ＤＮＡ）を送達することを含む。いくつかの実施形態では、前述のエンドヌクレアーゼは、前述の標的遺伝子座に、またはその近位に、一本鎖切断または二本鎖切断を引き起こす。いくつかの実施形態では、前述のエンドヌクレアーゼは、プロトスペーサー隣接モチーフ（ＰＡＭ）から５’で、前述の標的遺伝子座の近位に二本鎖切断を引き起こす。いくつかの実施形態では、前述のエンドヌクレアーゼは、前述のＰＡＭから６～８ヌクレオチド、または７ヌクレオチド５’で、二本鎖切断を引き起こす。いくつかの実施形態では、前述の操作されたヌクレアーゼシステムは、前述の標的遺伝子座の内部または近位でヌクレオチド塩基の化学修飾を引き起こすか、または、前述の標的遺伝子座の内部または近位でヒストンの化学修飾を引き起こす。いくつかの実施形態では、前述の化学修飾はアデノシンまたはシトシンヌクレオチドの脱アミノ化である。いくつかの実施形態では、前述のエンドヌクレアーゼは、前述のエンドヌクレアーゼに連結された塩基エディターをさらに含む。いくつかの実施形態では、前述の塩基エディターは、アデノシンデアミナーゼである。いくつかの実施形態では、前述のアデノシンデアミナーゼはＡＤＡＲ１またはＡＤＡＲ２を含む。いくつかの実施形態では、前述の塩基エディターはシトシンデアミナーゼである。いくつかの実施形態では、前述のシトシンデアミナーゼは、ＡＰＯＢＥＣ１、ＡＰＯＢＥＣ２、ＡＰＯＢＥＣ３Ａ、ＡＰＯＢＥＣ３Ｂ、ＡＰＯＢＥＣ３Ｃ、ＡＰＯＢＥＣ３Ｄ、ＡＰＯＢＥＣ３Ｆ、ＡＰＯＢＥＣ３Ｇ、ＡＰＯＢＥＣ３Ｈ、またはＡＰＯＢＥＣ４を含む。

【0018】

本開示のさらなる態様および利点は、以下の詳細な説明から当業者に容易に明白となり、ここでは、本開示の例示的な実施形態のみが示され、説明されている。理解されるように、本開示は、他の実施形態および異なる実施形態においても可能であり、その様々な詳細は、そのすべてが本開示から逸脱することなく様々な明白な点で修正することができる。したがって、図面および説明は本来、例示的なものとしてみなされ、限定的なものであるとはみなされない。

【0019】

＜参照による組み込み＞
本明細書で言及される全ての出版物、特許、および特許出願は、あたかも個々の出版物、特許、または特許出願が参照によって組み込まれるよう具体的かつ個別に示されるかのように、同じ程度まで参照により本明細書に組み込まれる。

【図面の簡単な説明】

【0020】

本発明の新規な特徴は、とりわけ、添付の特許請求の範囲内に明記される。本発明の特徴および利点のより良い理解は、本発明の原理が用いられる例示的実施形態を説明する以下の詳細な説明と、以下の添付図面（本明細書では「図（”Ｆｉｇｕｒｅ”および”ＦＩＧ．”）」とも称される）とを参照することによって得られるであろう。

【0021】

【図1】様々なクラスおよび型のＣＲＩＳＰＲ／Ｃａｓ遺伝子座の相同性の関係性を示すデンドログラムを表わす。ここでＳＭＡＲＴＩおよびＩＩＣａｓ酵素クラスが、クラス２のＩＩ－Ａ、ＩＩ－Ｂ、およびＩＩ－Ｃ型Ｃａｓシステムとの比較で説明され、これらのシステムがＩＩ－Ａ、ＩＩ－Ｂ、およびＩＩ－Ｃ型ではなく別々のクラスへとグループ化されることを示している。（Ａ）はＣａｓ９基準配列のコンテキストにおいてＳＭＡＲＴ系統樹を示し、ここでＳＭＡＲＴエフェクターは、Ｃａｓ９基準配列（ＩＩ－Ａ、ＩＩ－Ｂ、およびＩＩ－Ｃ型）から遠く離れてクラスター化される。（Ｂ）はＳＭＡＲＴ酵素のサブグループを例示するＳＭＡＲＴ系統樹を示す。

【図2】本明細書に記載されるＳＭＡＲＴエフェクターの長さ分布を示し、ＳＭＡＲＴＩおよびＩＩ酵素は、Ｃａｓ９様の酵素よりも低い分子量でクラスター化されることを示す。ＳＭＡＲＴヌクレアーゼは、４００ａａあたりに１つのピーク（ＳＭＡＲＴＩＩ）、および７５０ａａあたりに第２のピーク（ＳＭＡＲＴＩ）を有する、二峰性分布を示す。Ｃａｓ９ヌクレアーゼはまた、１，１００ａａ（例えば、ＳａＣａｓ９）および１，３００ａａ（例えば、ＳｐＣａｓ９）あたりにピークを有する二峰性分布を示す。

【図3】「小さな」ＩＩ型ヌクレアーゼであるＭＧ３３－１、ＭＧ３５－２３６のゲノムコンテキストを表わす。ＳＭＡＲＴヌクレアーゼおよびＣＲＩＳＰＲアクセサリータンパク質は、ダークグレーの矢として示され、他の遺伝子はライトグレーの矢として表わされる。ゲノムの断片におけるすべての遺伝子について予測されたドメインは、矢の下のグレーのボックスとして示される。図中、（Ａ）は、ＳＭＡＲＴＩＭＧ３３－１ヌクレアーゼおよびＳＭＡＲＴＩＩヌクレアーゼＭＧ３５－２３６から上流でコードされるＣＲＩＳＰＲ遺伝子座のゲノムコンテキストであり、ＳＭＡＲＴＩＩから下流に、トランスポザーゼＴｎｐＡとＴｎｐＢを持つ予測された挿入配列を示しており、（Ｂ）は、ＳＭＡＲＴＩヌクレアーゼＭＧ３４－１のゲノムコンテキストであり、ここで環境的発現の配列決定リードが、ＣＲＩＳＰＲアレイおよび予測されるｔｒａｃｒＲＮＡの下にアラインメントされて示され、および、当該領域に対するトランスクリプトームのカバレッジは、コンティグ配列より上に例示され、（Ｃ）は、ＳＭＡＲＴＩヌクレアーゼＭＧ３４－１６のゲノムコンテキストであり、ここで環境的発現の配列決定リードが、ＣＲＩＳＰＲアレイおよび予測されるｔｒａｃｒＲＮＡの下にアラインメントされて示され、および、当該領域に対するトランスクリプトームのカバレッジは、コンティグ配列より上に例示され、および、（Ｄ）は、図中のＭＧ３４－１６ＣＲＩＳＰＲアレイ由来のスペーサー７によって標的とされるゲノムの断片であり、ここでゲノムの断片は、ウイルス特異的な遺伝子アノテーションのターミナーゼおよびポータルに基づいてファージに由来するものと同定された。挿入図は、未知の機能のウイルス遺伝子のＣ末端を標的とする、ＭＧ３４－１６スペーサー７の位置を示し、ＭＧ３４－１６のための推定上のＮＧＧＰＡＭは、当該スペーサー一致から下流でグレーのボックスによって強調される。

【図4】例となるＳＭＡＲＴエンドヌクレアーゼの多重配列アラインメント（ＭＧ３３－１（配列番号１）、ＭＧ３３－２（配列番号４６３）、ＭＧ３３－３（配列番号４６４）、ＭＧ３４－１（配列番号２）、ＭＧ３４－９（配列番号１０）、ＭＧ３４－１６（配列番号１７）、ＭＧ１０２－１（配列番号５８１）、ＭＧ１０２－２（配列番号５８２）、ＭＧ３５－１（配列番号２５）、ＭＧ３５－２（配列番号２６）、ＭＧ３５－３（配列番号２７）、ＭＧ３５－１０２（配列番号１２６）、ＭＧ３５－２３６（配列番号２８４）、ＭＧ３５－４１９（配列番号２２２）、ＭＧ３５－４２０（配列番号２２３）、およびＭＧ３５－４２１（配列番号２２４））を示し、ここでＳａＣａｓ９の配列は、基準ドメインとして使用され、基準配列の下に長方形として示され、および、触媒残基は、各配列の上に正方形として示される。図中、（Ａ）は、ＲｕｖＣ－Ｉとブリッジヘリックスドメインを包含するエンドヌクレアーゼ領域のアラインメントであり、（Ｂ）は、ＲｕｖＣ－ＩＩＩドメインを包含する領域のアラインメントであり、および、（Ｃ）は、ＲｕｖＣＩＩおよびＨＮＨドメインを包含している領域のアラインメントである。

【図5】具体例としてＭＧ３４－１を使用し、ＳＭＡＲＴＩエンドヌクレアーゼについてのドメイン構成の例を表わす。図中、（Ａ）は、３つのＲｕｖＣドメインから成るＳＭＡＲＴＩヌクレアーゼの予測されたドメインアーキテクチャを示すダイヤグラムであり、ブリッジヘリックス（「ＢＨ」）、ＰｆａｍＰＦ１４２３９に対して相同性を有するドメイン、それに中断される認識ドメイン（「ＲＥＣ」）、ＨＮＨエンドヌクレアーゼドメイン（「ＨＮＨ」）、ウェッジドメイン（「ＷＥＤ」）、およびＰＡＭ相互作用メイン（ＰＩ）を示し、および（Ｂ）は、基準Ｃａｓ９ヌクレアーゼ配列に対する２つのＳＭＡＲＴＩヌクレアーゼの多重配列アラインメントの概観であり、ここでＲｕｖＣとＨＮＨの触媒残基は各配列より上の黒いバーとして示され、３Ｄ空間においてＳａＣａｓの結晶構造と整列する領域は、丸みを帯びたボックスによって表わされ、および、破線は、ＳＭＡＲＴとＳａＣａｓ９の３Ｄ構造予測の間の３Ｄ空間においてアラインメントが乏しいかまたは皆無の領域を表わす。

【図6】例としてＭＧ３５ファミリー酵素（ＭＧ３５－３、ＭＧ３５－４）を使用して、ＳＭＡＲＴＩＩエンドヌクレアーゼについてのドメイン構成の例を表す。図中、（Ａ）は、３つのＲｕｖＣドメイン、ＰｆａｍＰＦ１４２３９に対して相同性を有するドメイン、ＨＮＨエンドヌクレアーゼドメイン、未知のドメイン、および認識ドメイン（ＲＥＣ）からなるＳＭＡＲＴＩＩヌクレアーゼの予測されたドメインアーキテクチャを示すダイヤグラムであり、および（Ｂ）は、基準Ｃａｓ９ヌクレアーゼ配列に対する２つのＳＭＡＲＴＩＩヌクレアーゼの多重配列アラインメントの概観であり、ここでＲｕｖＣとＨＮＨの触媒残基は各配列より上の黒いバーとして示され、３Ｄ空間においてＳａＣａｓの結晶構造と整列する領域は、丸みを帯びたボックスによって表わされ、および、ガイド／標的／ＰＡＭ配列を認識することに関わり得る３Ｄ構造予測から同定された残基は、ＭＧ３５－４１９配列より上のダークグレーのボックス（ＲＲＸＲＲおよびＲＥＣドメイン内）によって表わされる。

【図7】ＳＭＡＲＴ酵素の様々な特徴を例示する。図中、（Ａ）は、本明細書で説明される様々な酵素のＳＭＡＲＴＩドメインの、ｓｐＣａｓ９のものに対する同一性を示すドットプロットであり、これらが最大約３５％の配列同一性を有していることを示しており、（Ｂ）は、本明細書に記載される酵素の個別のＳＭＡＲＴＩドメインの長さのドットプロットである。

【図8】様々なＳＭＡＲＴ特異的モチーフの、Ｃａｓ９ヌクレアーゼ配列において予測されたモチーフに対する、カウント分布を例示し、これらのモチーフがＳＭＡＲＴ酵素において、より頻繁に見られることを示しており、モチーフは、８０３の基準Ｃａｓ９配列（ＩＩ－Ａ、ＩＩ－Ｂ、およびＩＩ－Ｃ型）、８４のＳＭＡＲＴＩ配列、および４７１のＳＭＡＲＴＩＩ配列において予測された。図中、（Ａ）は、様々な型のクラス２のＣａｓ酵素における、Ｚｎ結合リボンモチーフ（ＣＸ_{［２－４］}ＣおよびＣＸ_{［２－４］}Ｈ）のカウント頻度のボックスプロットであり、および（Ｂ）は、様々な型のクラス２のＣａｓ酵素におけるＲＲＸＲＲモチーフのカウント頻度のヒストグラムである。（Ａ）と（Ｂ）において、線は平均カウント値をトラッキングし、一方、外れ値は、ドットによって表わされる。

【図9】ＳＭＡＲＴＩエンドヌクレアーゼによる切断活性のために設計された単一ガイドＲＮＡ（ｓｇＲＮＡ）の予測されたガイドＲＮＡ構造を例示する。図中、（Ａ）は、ＭＧ３４－１ｓｇＲＮＡ１であり、（Ｂ）は、ＭＧ３４－１ｓｇＲＮＡ２であり、（Ｃ）は、ＭＧ３４－９ｓｇＲＮＡ１であり、および（Ｄ）は、ＭＧ３４－１６ｓｇＲＮＡ１である。

【図10】実施例１に記載されるＳＭＡＲＴＩヌクレアーゼの切断のキャラクタリゼーションを表わす。（Ａ）は、２つのｓｇＲＮＡデザインを有するＭＧ３４－１についての切断アッセイのライゲーション生成物のＡｇｉｌｅｎｔＴａｐｅＳｔａｔｉｏｎゲルを、陰性対照と対比して示す。レーンＬ３はラダーである。レーンＡ４はＡｐｏ、ｓｇＲＮＡなし、である。レーンＢ４およびＣ４は、試験されたＭＧ３４－１ｓｇＲＮＡ（ｓｇ１：配列番号６１２、ｓｇ２：６１３）である。切断生成物のバンドは、矢で標識される。レーンＧ３およびＨ３は、グレイアウトされており、この実験には関係しない。（Ｂ）は、ライゲーション生成物のＰＣＲゲルを示し、ＭＧ３４－１、３４－９、および３４－１６の活性を示す。レーン１は、ラダーである。レーン２－７は、ＭＧ３４－１のための６つのスペーサー長を有するｓｇＲＮＡ設計。レーン８および９は、それぞれ、３４－９および３４－１６のためのｓｇＲＮＡ設計である。矢は、切断確認バンドを指す。

【図11】ＭＧ３４ヌクレアーゼについて、配列切断プレファレンスを例示する。（Ａ）は、ｓｇＲＮＡ１（上、配列番号６１２）およびｓｇＲＮＡ２（下、配列番号６１３）を有するＭＧ３４－１について、コンセンサスＰＡＭ配列（ＮＧＧＮ）のＳｅｑＬｏｇｏ表現を示す。（Ｂ）は、ＭＧ３４－１について、切断部位の位置を示すヒストグラムを示し、ＭＧ３４－１がＰＡＭから７の位置あたりでの切断を選好することを実証している。（Ｃ）は、サンガー配列決定法のクロマトグラムを示し、ＭＧ３４－９に選好されるＮＧＧＰＡＭ（ボックスで強調される）を示す。矢は、ＰＡＭから７の位置における切断部位を指す。

【図12】ＭＧ３４－１についての大腸菌（Ｅ．ｃｏｌｉ）におけるプラスミド標的実験（ｐｌａｓｍｉｄｔａｒｇｅｔｉｎｇｅｘｐｅｒｉｍｅｎｔｓ）の結果を例示する。（Ａ）は、プラスミド切断を実証する大腸菌株のレプリカ平板法を示し、ＭＧ３４－１を発現させる大腸菌およびｓｇＲＮＡは、ｓｇＲＮＡ（＋ｓｐ）に対する標的を包含しているカナマイシン耐性プラスミドで形質転換された。成長欠陥（＋ｓｐ）対陰性対照（標的なし、およびＰＡＭ（－ｓｐ））を示すこれらの象限は、酵素による標的化と切断が成功したことを表わす。実験は、２度模写され、および３回繰り返して行なわれた。（Ｂ）は、（Ａ）で標的条件（＋ｓｐ）対非標的対照（－ｓｐ）における成長抑制を示すレプリカ平板法実験からの、コロニー形成単位（ｃｆｕ）測定のグラフを示し、プラスミドが切断されたことを実証している。

【図13】ＭＧ３５－４１９について、ＳＭＡＲＴシステムのゲノムコンテキストの例を示す。ＳＭＡＲＴヌクレアーゼはダークグレーの矢として示され、他の遺伝子はより明るいグレーの矢として表わされる。ゲノムの断片におけるすべての遺伝子について予測されたドメインは、矢の下のグレーのボックスとして示される。環境的発現の配列決定リードは、（Ａ）においてＣＲＩＳＰＲアレイの下に、および（Ｂ）においてエフェクターから上流にアラインメントされて示される。発現を示す領域に対するトランスクリプトームのカバレッジは、コンティグ配列より上に図示される。（Ａ）は、ＳＭＡＲＴＩＩＭＧ３５－４１９エフェクターおよび近辺においてコードされたＣＲＩＳＰＲ遺伝子座のゲノムコンテキストを示す。（Ｂ）は、転写された５’ＵＴＲを示しているＳＭＡＲＴＩＩエフェクターＭＧ３５－３のゲノムコンテキストを示す。

【図14】ＳＭＡＲＴＩＩＭＧ３５－４１９についての３Ｄ構造の予測を示す。この３Ｄモデルは、ＳａＣａｓ９結晶構造の領域と、半分未満のサイズであるにもかかわらず、よくアラインメントする。ＳａＣａｓ９鋳型とアラインメントされる領域は、触媒性ローブ（ｃａｔａｌｙｔｉｃｌｏｂｅ）（ＲｕｖＣ－Ｉ、ＨＮＨおよびＲｕｖＣ－ＩＩＩドメイン）ならびに認識（ＲＥＣ）ローブの短い領域を含む。ＳＭＡＲＴＩＩに特異的なドメインは、ＲＲＸＲＲモチーフおよびＰｆａｍＰＦ１４２３９に対する相同性を包含するドメイン、ならびに未知の機能のドメインを含む。

【図15】ＳＭＡＲＴＩＩエフェクターについての予備的な切断アッセイの結果を表す。ＭＧ３５－４２０（配列番号２２３）タンパク質調製物は、全遺伝子座が発現されたＴＸＴＬ抽出物における切断活性に関して試験された。実験は、ＰＡＭライブラリ（ｄｓＤＮＡ標的）、順方向および逆方向の両方の配向（ｆｗとｒｖ）で予測された反復領域、ならびに潜在的に必要な補因子をコードする遺伝子間領域を有するタンパク質調製物をインキュベートした。レーン２－９（非ｃｒアレイ）は、反復の領域のない対照試験である。Ａｐｏは、標的ＰＡＭライブラリを有するタンパク質調製物のみである。ラベル１－２．５は、７つの異なる遺伝子間領域を表わす。－ＩＧは、対照として含まれた遺伝子間領域がない。ライゲーション生成物のＰＣＲゲルは、ｄｓＤＮＡ切断を示唆する推定の切断バンド（矢）を示す。

【0022】

＜配列表の簡単な説明＞
本明細書とともに出願された配列表は、本開示の方法、組成物、およびシステムで使用される例示的なポリヌクレオチドおよびポリペプチド配列を提供する。以下は配列表における配列の例示的な説明である。

【0023】

ＭＧ３３ヌクレアーゼ

【0024】

配列番号１および４６３－４８６は、ＭＧ３３ヌクレアーゼの完全長ペプチド配列を示す。

【0025】

配列番号１９９および６６９－６７０は、ＭＧ３３ヌクレアーゼと共に機能すると予測されたｔｒａｃｒＲＮＡのヌクレオチド配列を示す。

【0026】

配列番号２０１は、ＭＧ３３ヌクレアーゼと共に機能すると予測された、予測された単一ガイドＲＮＡ（ｓｇＲＮＡ）配列のヌクレオチド配列を示す。「Ｎ」は、可変残渣を意味し、および、非－Ｎ残渣は、スキャフォールド配列を代表する。

【0027】

ＭＧ３４ヌクレアーゼ

【0028】

配列番号２－２４および４８７－４８８は、ＭＧ１ヌクレアーゼの完全長ペプチド配列を示す。

【0029】

配列番号２００は、ＭＧ４ヌクレアーゼと共に機能すると予測されたｓｇＲＮＡのヌクレオチド配列を示す。

【0030】

配列番号２０２，２０３、および、６１３－６１６は、ＭＧ３４ヌクレアーゼと共に機能すると予測された、予測された単一ガイドＲＮＡ（ｓｇＲＮＡ）配列のヌクレオチド配列を示す。「Ｎ」は可変残渣を意味する。そして、非－Ｎ残渣はスキャフォールド配列を表わす。

【0031】

ＭＧ３５ヌクレアーゼ

【0032】

配列番号２５－１９８、２２１－４５９、４８９－５８０、および６１７－６６８は、ＭＧ３５ヌクレアーゼの完全長ペプチド配列を示す。

【0033】

配列番号４６０－４６１は、ＭＧ３５ヌクレアーゼと同じ遺伝子座に由来するＭＧ３５ｔｒａｃｒＲＮＡｓのヌクレオチド配列を示す。

【0034】

配列番号４６２は、本明細書に記載されるＭＧ３５ヌクレアーゼの反復を示す。

【0035】

ＭＧ１０２ヌクレアーゼ

【0036】

配列番号５８１－６１２は、ＭＧ１０２ヌクレアーゼの完全長ペプチド配列を示す。

【0037】

配列番号６７２－６７３は、ＭＧ１０２ヌクレアーゼと同じ遺伝子座に由来するＭＧ１０２ｔｒａｃｒＲＮＡのヌクレオチド配列を示す。

【0038】

配列番号２０５－２２０は、本開示によるヌクレアーゼに追加することができる核局在化配列（ＮＬＳ）の例の配列を示す。

【発明を実施するための形態】

【0039】

本発明の様々な実施形態が本明細書中で示され、かつ説明されているが、このような実施形態はほんの一例として提供されるものであることは、当業者には明らかであろう。多数の変形、変更、および置き換えは、本発明から逸脱することなく、当業者によって想到され得る。本明細書に記載される本発明の実施形態の様々な代案が利用され得ることを理解されたい。

【0040】

本明細書で開示されるいくつかの方法の実施は、特段の定めのない限り、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノミクス、および組換えＤＮＡの技術を利用する。例えば、ＳａｍｂｒｏｏｋａｎｄＧｒｅｅｎ，ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，４ｔｈＥｄｉｔｉｏｎ（２０１２）；ｔｈｅｓｅｒｉｅｓＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ（Ｆ．Ｍ．Ａｕｓｕｂｅｌ，ｅｔａｌ．ｅｄｓ．）；ｔｈｅｓｅｒｉｅｓＭｅｔｈｏｄｓＩｎＥｎｚｙｍｏｌｏｇｙ（ＡｃａｄｅｍｉｃＰｒｅｓｓ，Ｉｎｃ．），ＰＣＲ２：ＡＰｒａｃｔｉｃａｌＡｐｐｒｏａｃｈ（Ｍ．Ｊ．ＭａｃＰｈｅｒｓｏｎ，Ｂ．Ｄ．ＨａｍｅｓａｎｄＧ．Ｒ．Ｔａｙｌｏｒｅｄｓ．（１９９５）），ＨａｒｌｏｗａｎｄＬａｎｅ，ｅｄｓ．（１９８８）Ａｎｔｉｂｏｄｉｅｓ，ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，ａｎｄＣｕｌｔｕｒｅｏｆＡｎｉｍａｌＣｅｌｌｓ：ＡＭａｎｕａｌｏｆＢａｓｉｃＴｅｃｈｎｉｑｕｅａｎｄＳｐｅｃｉａｌｉｚｅｄＡｐｐｌｉｃａｔｉｏｎｓ，６ｔｈＥｄｉｔｉｏｎ（Ｒ．Ｉ．Ｆｒｅｓｈｎｅｙ，ｅｄ．（２０１０））を参照されたい（参照により全体が本明細書に組み込まれる）。

【0041】

本明細書で使用されるように、単数形「１つ（ａ）」、「１つ（ａｎ）」、および「その（ｔｈｅ）」は、文脈上他の意味を明白に示すものでない限り、同様に複数形を含むことを意図している。さらに、用語「含んでいる（ｉｎｃｌｕｄｉｎｇ）」、「含む（ｉｎｃｌｕｄｅｓ）」、「有している（ｈａｖｉｎｇ）」、「有する（ｈａｓ）」、「含んだ（ｗｉｔｈ）」、または、その変異形態が詳細な記載および／または請求項のいずれかで使用される程度には、上記のような用語は「含んでいる（ｃｏｍｐｒｉｓｉｎｇ）」との用語に類似する手法で包括的であることを意図している。

【0042】

「約」または「およそ」との用語は、当業者によって決定されるような特定の値の許容可能な誤差範囲内であることを意味し、その誤差範囲は、その値がどのように測定または決定されるか、つまり、測定システムの制限に部分的に依存する。例えば、「約」とは、当該技術分野での実践につき１または１を超える標準偏差を意味し得る。代替的に、「約」は、任意の値の最大２０％、最大１５％、最大１０％、最大５％、または最大１％の範囲を意味する場合がある。

【0043】

本明細書で使用されるように、「細胞」とは通常、生体細胞を指す。細胞は、生体の基本構造単位、機能単位、および／または生物学的単位であり得る。細胞は、１つ以上の細胞を有する任意の生物に起源を持つ場合がある。いくつかの非限定的な例としては、原核細胞、真核細胞、細菌細胞、古細菌細胞、単一細胞の真核生物の細胞、原生動物細胞、植物の細胞（例えば、作物、果物、野菜、穀類、ダイズ、トウモロコシ（ｃｏｒｎ）、トウモロコシ（ｍａｉｚｅ）、小麦、種子、トマト、イネ、キャッサバ、サトウキビ、カボチャ、干し草、ジャガイモ、綿、アサ、タバコ、顕花植物、針葉樹、裸子植物、シダ、ヒカゲノカズラ類、ツノゴケ類、苔類、蘚類の細胞）、藻細胞（例えば、Ｂｏｔｒｙｏｃｏｃｃｕｓｂｒａｕｎｉｉ、Ｃｈｌａｍｙｄｏｍｏｎａｓｒｅｉｎｈａｒｄｔｉ、Ｎａｎｎｏｃｈｌｏｒｏｐｓｉｓｇａｄｉｔａｎａ、Ｃｈｌｏｒｅｌｌａｐｙｒｅｎｏｉｄｏｓａ、ＳａｒｇａｓｓｕｍｐａｔｅｎｓＣ．Ａｇａｒｄｈなど）、海草（例えば、ケルプ）、真菌細胞（例えば、酵母菌細胞、キノコからの細胞）、動物細胞、無脊髄動物（例えば、ショウジョウバエ、刺胞動物、棘皮動物、線虫など）の細胞、脊椎動物（例えば、魚、両生類、爬虫類、鳥、哺乳動物）の細胞、哺乳動物（例えば、ブタ、雌ウシ、ヤギ、ヒツジ、げっ歯類、ラット、マウス、非ヒト霊長類、ヒトなど）の細胞などが挙げられる。細胞は、天然の生物に起源を持たないこともある（例えば、細胞は合成的に作られ、人工細胞と呼ばれることもある）。

【0044】

「ヌクレオチド」との用語は、本明細書で使用されるように、通常、塩基－糖－リン酸塩の組み合わせを指す。ヌクレオチドは合成ヌクレオチドを含むことがある。ヌクレオチドは合成ヌクレオチドアナログを含むことがある。ヌクレオチドは、核酸配列（例えば、デオキシリボ核酸（ＤＮＡ）およびリボ核酸（ＲＮＡ））の単量体単位であり得る。ヌクレオチドとの用語には、リボヌクレオシド三リン酸アデノシン三リン酸（ＡＴＰ）、ウリジン三リン酸（ＵＴＰ）、シトシン三リン酸（ＣＴＰ）、グアノシン三リン酸（ＧＴＰ）、およびデオキシリボヌクレオシド三リン酸、例えば、ｄＡＴＰ、ｄＣＴＰ、ｄＩＴＰ、ｄＵＴＰ、ｄＧＴＰ、ｄＴＴＰ、またはそれらの誘導体が含まれ得る。そのような誘導体は、例えば、［αＳ］ｄＡＴＰ、７－デアザ－ｄＧＴＰおよび７－デアザ－ｄＡＴＰ、および、それらを含有する核酸分子にヌクレアーゼ耐性を与えるヌクレオチド誘導体を含む場合がある。ヌクレオチドとの用語は、本明細書に使用されるように、ジデオキシリボヌクレオシド三リン酸（ｄｄＮＴＰ）およびそれらの誘導体を指し得る。ジデオキシリボヌクレオシド三リン酸の例示的な例としては、限定されないが、ｄｄＡＴＰ、ｄｄＣＴＰ、ｄｄＧＴＰ、ｄｄＩＴＰ、およびｄｄＴＴＰが挙げられ得る。ヌクレオチドは標識されない場合があるか、または、光学的に検出可能な部分（例えば、フルオロフォア）を含む部分を使用するなどして、検出できるように標識される場合がある。標識化はまた、量子ドットを用いて実施されてもよい。検出可能な標識としては、例えば、放射性同位元素、蛍光標識、化学発光標識、生物発光標識、および酵素標識が挙げられ得る。ヌクレオチドの蛍光性標識としては、限定されないが、フルオレセイン、フルオレセイン、５－カルボキシフルオレセイン（ＦＡＭ）、２’７’－ジメトキシ－４’５－ジクロロ－６－カルボキシフルオレセイン（ＪＯＥ）、ローダミン、６－カルボキシローダミン（Ｒ６Ｇ）、Ｎ，Ｎ，Ｎ’，Ｎ’－テトラメチル－６－カルボキシローダミン（ＴＡＭＲＡ）、６－カルボキシ－Ｘ－ローダミン（ＲＯＸ）、４－（４’ジメチルアミノフェニルアゾ）安息香酸（ＤＡＢＣＹＬ）、ＣａｓｃａｄｅＢｌｕｅ、ＯｒｅｇｏｎＧｒｅｅｎ、ＴｅｘａｓＲｅｄ、シアニン、および５－（２’－アミノエチル）アミノナフタレン－１－スルホン酸（ＥＤＡＮＳ）が挙げられ得る。蛍光標識されたヌクレオチドの特定の例としては、ＰｅｒｋｉｎＥｌｍｅｒ（ＦｏｓｔｅｒＣｉｔｙ，Ｃａｌｉｆ）から利用可能な［Ｒ６Ｇ］ｄＵＴＰ、［ＴＡＭＲＡ］ｄＵＴＰ、［Ｒ１１０］ｄＣＴＰ、［Ｒ６Ｇ］ｄＣＴＰ、［ＴＡＭＲＡ］ｄＣＴＰ、［ＪＯＥ］ｄｄＡＴＰ、［Ｒ６Ｇ］ｄｄＡＴＰ、［ＦＡＭ］ｄｄＣＴＰ、［Ｒ１１０］ｄｄＣＴＰ、［ＴＡＭＲＡ］ｄｄＧＴＰ、［ＲＯＸ］ｄｄＴＴＰ、［ｄＲ６Ｇ］ｄｄＡＴＰ、［ｄＲ１１０］ｄｄＣＴＰ、［ｄＴＡＭＲＡ］ｄｄＧＴＰ、および［ｄＲＯＸ］ｄｄＴＴＰ；Ａｍｅｒｓｈａｍ（ＡｒｌｉｎｇｔｏｎＨｅｉｇｈｔｓ，Ｉｌｌ）から利用可能なＦｌｕｏｒｏＬｉｎｋＤｅｏｘｙＮｕｃｌｅｏｔｉｄｅｓ、ＦｌｕｏｒｏＬｉｎｋＣｙ３－ｄＣＴＰ、ＦｌｕｏｒｏＬｉｎｋＣｙ５－ｄＣＴＰ、ＦｌｕｏｒｏＬｉｎｋＦｌｕｏｒＸ－ｄＣＴＰ、ＦｌｕｏｒｏＬｉｎｋＣｙ３－ｄＵＴＰ、およびＦｌｕｏｒｏＬｉｎｋＣｙ５－ｄＵＴＰ；ＢｏｅｈｒｉｎｇｅｒＭａｎｎｈｅｉｍ（Ｉｎｄｉａｎａｐｏｌｉｓ，Ｉｎｄ．）から利用可能なフルオレセイン－１５－ｄＡＴＰ、フルオレセイン－１２－ｄＵＴＰ、テトラメチル－ｒｏｄａｍｉｎｅ－６－ｄＵＴＰ、ＩＲ７７０－９－ｄＡＴＰ、フルオレセイン－１２－ｄｄＵＴＰ、フルオレセイン－１２－ＵＴＰ、およびフルオレセイン－１５－２’－ｄＡＴＰ；および、ＭｏｌｅｃｕｌａｒＰｒｏｂｅｓ（Ｅｕｇｅｎｅ，Ｏｒｅｇ）から利用可能なＣｈｒｏｍｏｓｏｍｅＬａｂｅｌｅｄＮｕｃｌｅｏｔｉｄｅｓ、ＢＯＤＩＰＹ－ＦＬ－１４－ＵＴＰ、ＢＯＤＩＰＹ－ＦＬ－４－ＵＴＰ、ＢＯＤＩＰＹ－ＴＭＲ－１４－ＵＴＰ、ＢＯＤＩＰＹ－ＴＭＲ－１４－ｄＵＴＰ、ＢＯＤＩＰＹ－ＴＲ－１４－ＵＴＰ、ＢＯＤＩＰＹ－ＴＲ－１４－ｄＵＴＰ、ＣａｓｃａｄｅＢｌｕｅ－７－ＵＴＰ、ＣａｓｃａｄｅＢｌｕｅ－７－ｄＵＴＰ、フルオレセイン－１２－ＵＴＰ、フルオレセイン－１２－ｄＵＴＰ、ＯｒｅｇｏｎＧｒｅｅｎ４８８－５－ｄＵＴＰ、ローダミンＧｒｅｅｎ－５－ＵＴＰ、ローダミンＧｒｅｅｎ－５－ｄＵＴＰ、テトラメチルローダミン６－ＵＴＰ、テトラメチルローダミン６－ｄＵＴＰ、ＴｅｘａｓＲｅｄ－５－ＵＴＰ、ＴｅｘａｓＲｅｄ－５－ｄＵＴＰ、およびＴｅｘａｓＲｅｄ－１２－ｄＵＴＰが挙げられ得る。ヌクレオチドも化学修飾によって標識（ｌａｂｅｌｅｄ）または標識（ｍａｒｋｅｄ）され得る。化学的に修飾された単一ヌクレオチドはビオチンｄＮＴＰであり得る。ビオチン化されたｄＮＴＰのいくつかの非限定的な例としては、ビオチン－ｄＡＴＰ（例えば、ｂｉｏ－Ｎ６－ｄｄＡＴＰ、ｂｉｏｔｉｎ－１４－ｄＡＴＰ）、ビオチン－ｄＣＴＰ（例えば、ビオチン－１１－ｄＣＴＰ、ビオチン－１４－ｄＣＴＰ）、およびビオチン－ｄＵＴＰ（例えば、ビオチン－１１－ｄＵＴＰ、ビオチン－１６－ｄＵＴＰ、ビオチン－２０－ｄＵＴＰ）が挙げられ得る。ヌクレオチドはヌクレオチドアナログを含むことがある。いくつかの実施形態では、ヌクレオチドアナログは、ヌクレオチドの一定の化学的性質を変更するためにいずれかの位置で修飾されるが、それでもなお当該ヌクレオチドアナログが意図された機能を発揮する能力を保持する、天然のヌクレオチドの構造を含む場合がある（例えば、ＲＮＡまたはＤＮＡにおける他のヌクレオチドに対するハイブリダイゼーション）。誘導体化され得るヌクレオチドの位置の例は、５位（例えば、５－（２－アミノ）プロピルウリジン（５－（２－ａｍｉｎｏ）ｐｒｏｐｙｌｕｒｉｄｉｎｅ）、５－ブロモウリジン（５－ｂｒｏｍｏｕｒｉｄｉｎｅ）、５－プロピンウリジン（５－ｐｒｏｐｙｎｅｕｒｉｄｉｎｅ）、５－プロペニルウリジン（５－ｐｒｏｐｅｎｙｌｕｒｉｄｉｎｅ）など）、６位（例えば、６－（２アミノ）プロピルウリジン）（６－（２－ａｍｉｎｏ）ｐｒｏｐｙｌｕｒｉｄｉｎｅ）、アデノシンおよび／またはグアノシンの８位、例えば、８－ブロモグアノシン（８－ｂｒｏｍｏｇｕａｎｏｓｉｎｅ）、８－クロログアノシン（８－ｃｈｌｏｒｏｇｕａｎｏｓｉｎｅ）、８－フルオログアノシン（８－ｆｌｕｏｒｏｇｕａｎｏｓｉｎｅ）などを含む。ヌクレオチドアナログはまた、デアザヌクレオチド、例えば、７－デアザ－アデノシン、Ｏ－およびＮ－修飾（例えば、アルキル化、例えば、Ｎ－６メチルアデノシン（Ｎ６－ｍｅｔｈｙｌａｄｅｎｏｓｉｎｅ）、さもなければ当該技術分野で既知の）ヌクレオチド、ならびに、Ｈｅｒｄｅｗｉｊｎ，ＡｎｔｉｓｅｎｓｅＮｕｃｌｅｉｃＡｃｉｄＤｒｕｇＤｅｖ．，２０００Ａｕｇ．１０（４）：２９７－３１０に記載されるものなどの、他の複素環式的に修飾されるヌクレオチドアナログを含む。ヌクレオチドアナログはまた、ヌクレオチドの糖部分に対する修飾を含む場合がある。例えば、２’ＯＨ基は、Ｈ、ＯＲ、Ｒ、Ｆ、Ｃｌ、Ｂｒ、Ｉ、ＳＨ、ＳＲ、ＮＨ２、ＮＨＲ、ＮＲ２、ＣＯＯＲ、あるいはＯＲから選択される基と置換される場合があり、ここでＲは、置換または非置換のＣ１－Ｃ６アルキル、アルケニル、アルキニル、アリールなどである。他の可能な修飾は、米国特許第５，８５８，９８８号、および第６，２９１，４３８号に記載されたものを含む。誘導体化され得るヌクレオチドの位置の例は、５位、例えば、５－（２－アミノ）プロピルウリジン、５－ブロモウリジン、５－プロピンウリジン、５－プロペニルウリジンなど、６位、例えば、６－（２－アミノ）プロピルウリジン、アデノシンおよび／またはグアノシンの８位、例えば、８－ブロモグアノシン、８－クロログアノシン、８－フルオログアノシンなどを含む。ヌクレオチドアナログはまた、デアザヌクレオチド、例えば、７－デアザ－アデノシン、Ｏ－およびＮ－修飾（例えば、アルキル化、例えば、Ｎ－６メチルアデノシン（Ｎ６－ｍｅｔｈｙｌａｄｅｎｏｓｉｎｅ）、さもなければ当該技術分野で既知の）ヌクレオチド、ならびに、Ｈｅｒｄｅｗｉｊｎ，ＡｎｔｉｓｅｎｓｅＮｕｃｌｅｉｃＡｃｉｄＤｒｕｇＤｅｖ．，２０００Ａｕｇ．１０（４）：２９７－３１０に記載されるものなどの、他の複素環式的に修飾されるヌクレオチドアナログを含む。ヌクレオチドアナログはまた、ヌクレオチドの糖部分に対する修飾を含む場合がある。例えば、２’ＯＨ基は、Ｈ、ＯＲ、Ｒ、Ｆ、Ｃｌ、Ｂｒ、Ｉ、ＳＨ、ＳＲ、ＮＨ２、ＮＨＲ、ＮＲ２、ＣＯＯＲ、あるいはＯＲから選択される基と置換される場合があり、ここでＲは、置換または非置換のＣ１－Ｃ６アルキル、アルケニル、アルキニル、アリールなどである。他の可能な修飾は、米国特許第５，８５８，９８８号、および第６，２９１，４３８号に記載されたものを含む。

【0045】

「ポリヌクレオチド」、「オリゴヌクレオチド」、および「核酸」との用語は、通常、一本鎖、二本鎖、あるいは多重鎖（ｍｕｌｔｉ－ｓｔｒａｎｄｅｄ）の形態のいずれかの、任意の長さのヌクレオチドの高分子形態（（デオキシリボヌクレオチドまたはリボヌクレオチドのいずれか）、またはそのアナログを指すために交換可能に使用される。ポリヌクレオチドは、細胞に対して外因性または内因性であり得る。ポリヌクレオチドは、無細胞環境に存在することがある。ポリヌクレオチドは、遺伝子またはその断片であり得る。ポリヌクレオチドはＤＮＡであり得る。ポリヌクレオチドはＲＮＡであり得る。ポリヌクレオチドは、任意の三次元構造も有していてもよく、任意の機能を実施してもよい。ポリヌクレオチドは、１つ以上のアナログ（例えば、改変された骨格、糖、または核酸塩基）を含むことがある。存在する場合、ヌクレオチド構造に対する修飾は、ポリマーのアセンブリの前または後で与えられ得る。アナログのいくつかの非限定的な例としては、５－ブロモウラシル、ペプチド核酸、ｘｅｎｏ核酸、モルフォリノ、ロックド核酸、グリコール核酸、トレオース核酸、ジデオキシヌクレオチド、コルジセピン、７－デアザ－ＧＴＰ、フルオロフォア（例えば、糖に結合したローダミンまたはフルオレセイン）、チオール含有ヌクレオチド、ビオチン結合ヌクレオチド、蛍光塩基アナログ（ｆｌｕｏｒｅｓｃｅｎｔｂａｓｅａｎａｌｏｇｓ）、ＣｐＧアイランド、メチル－７－グアノシン、メチル化ヌクレオチド、イノシン、チオウリジン、シュードウリジン（ｐｓｅｕｄｏｕｒｄｉｎｅ）、ジヒドロウリジン、キューオシン、およびワイオシンが挙げられる。ポリヌクレオチドの非限定的な例としては、遺伝子あるいは遺伝子断片のコード領域あるいは非コード領域、連鎖解析から定義された遺伝子座、エクソン、イントロン、メッセンジャーＲＮＡ（ｍＲＮＡ）、転移ＲＮＡ（ｔＲＮＡ）、リボソームＲＮＡ（ｒＲＮＡ）、低分子干渉ＲＮＡ（ｓｉＲＮＡ）、低分子ヘアピン型ＲＮＡ（ｓｈＲＮＡ）、マイクロＲＮＡ（ｍｉＲＮＡ）、リボザイム、ｃＤＮＡ、組換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたＤＮＡ、任意の配列の単離されたＲＮＡ、無細胞ＤＮＡ（ｃｆＤＮＡ）および無細胞ＲＮＡ（ｃｆＲＮＡ）を含む無細胞のポリヌクレオチド、核酸プローブ、およびプライマーが挙げられる。ヌクレオチドの配列は、非ヌクレオチド構成要素によって中断される場合がある。

【0046】

「トランスフェクション」または「トランスフェクトされた」との用語は、通常、非ウイルスベースの方法あるいはウイルスベースの方法によって、核酸を細胞内に導入することを指す。核酸分子は、完全タンパク質あるいはその機能性部分をコードする遺伝子配列であり得る。例えば、Ｓａｍｂｒｏｏｋｅｔａｌ．，１９８９，ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，１８．１－１８．８８を参照されたい（参照により全体が本明細書に組み込まれる）。

【0047】

「ペプチド」、「ポリペプチド」、および「タンパク質」との用語は、通常、ペプチド結合によって結合された少なくとも２つのアミノ酸残基のポリマーを指すために、本明細書において交換可能に使用される。この用語は、ポリマーの特定の長さを暗示せず、ペプチドが組換え技術、化学的合成あるいは酵素的合成を使用して産生されるか、または天然に存在するかを暗示または識別することを意図しない。この用語は、天然に存在するアミノ酸ポリマー、ならびに、少なくとも１つの修飾されたアミノ酸を含むアミノ酸ポリマーに適用される。場合によっては、ポリマーが非アミノ酸によって中断される場合がある。この用語には、完全長のタンパク質を含む任意の長さのアミノ酸鎖、ならびに、２次構造および／または３次構造（例えば、ドメイン）を有するまたは有していないタンパク質が含まれる。この用語はまた、例えば、ジスルフィド結合形成、グリコシル化、脂質修飾、アセチル化、リン酸化、酸化、および他の操作、例えば、標識化成分とのコンジュゲートによって修飾されたアミノ酸ポリマーを包含する。「アミノ酸」との用語は、本明細書で使用されるように、通常、天然アミノ酸、および、修飾されたアミノ酸およびアミノ酸アナログを含む非天然アミノ酸を指す。修飾されたアミノ酸は、天然アミノ酸および非天然アミノ酸を含むことがあり、これはアミノ酸上に自然に存在しない基あるいは化学的部分を含むように化学的に修飾されている。アミノ酸アナログはアミノ酸誘導体を指すこともある。「アミノ酸」との用語には、Ｄ－アミノ酸とＬ－アミノ酸の両方が含まれる。

【0048】

本明細書で使用されるように、用語「非天然」は、通常、天然の核酸またはタンパク質では見られない核酸またはポリペプチド配列を指す。非天然は、アフィニティータグを指すことがある。非天然は融合を指すことがある。非天然は、突然変異、挿入、および／または欠失を含む天然に存在する核酸またはポリペプチド配列を指すことがある。非天然の配列は、非天然の配列が融合される核酸および／またはポリペプチド配列によって示される可能性がある活性（例えば、酵素活性、メチルトランスフェラーゼ活性、アセチルトランスフェラーゼ活性、キナーゼ活性、ユビキチン化活性など）を示す、および／またはコードする場合がある。非天然の核酸またはポリペプチド配列は、遺伝子操作によって、天然に存在する核酸またはポリペプチド配列（あるいは、その変異体）に結合され、キメラ核酸、および／またはキメラ核酸ならびに／あるいはポリペプチドをコードするポリペプチド配列を生成する場合がある。

【0049】

「プロモーター」との用語は、本明細書で使用されるように、通常、遺伝子の転写または発現を制御する調節ＤＮＡ領域を指し、ＲＮＡ転写が開始されるヌクレオチドあるいはヌクレオチドの領域に隣接または重複して位置する場合がある。プロモーターは、しばしば転写因子とも呼ばれる、タンパク質因子に結合する特異的ＤＮＡ配列を含有する場合があり、これは、ＤＮＡへのＲＮＡポリメラーゼの結合を促進し、遺伝子転写を引き起こす。「コアプロモーター」とも呼ばれる「基本プロモーター」は、通常、動作可能に連結されたポリヌクレオチドの転写発現を促進するために必要な基本的な要素をすべて含有しているプロモーターを指す。真核生物の基本プロモーターは典型的に、必ずしもそうとは限らないが、ＴＡＴＡボックスおよび／またはＣＡＡＴボックスを含有している。

【0050】

「発現」との用語は、本明細書で使用されるように、通常、ＤＮＡ鋳型から核酸配列またはポリヌクレオチドが（ｍＲＮＡあるいは他のＲＮＡ転写物などに）転写されるプロセス、および／または、転写されたｍＲＮＡがその後、ペプチド、ポリペプチド、あるいはタンパク質へと翻訳されるプロセスを指す。転写産物およびコードされたポリペプチドは、まとめて「遺伝子産物」と呼ばれることがある。ポリヌクレオチドがゲノムＤＮＡに由来する場合、発現は真核細胞中にｍＲＮＡのスプライシングを含むことがある。

【0051】

本明細書で使用されるように、「動作可能に連結する」、「動作可能な連結」、または「動作可能なように連結する」は、またはその文法的等価物は一般に、遺伝要素、例えば、プロモーター、エンハンサー、ポリアデニル化配列などの並置を指し、これらの要素は、それらが予期された方法で動作することを可能にする関係にある。例えば、プロモーターおよび／またはエンハンサー配列を含み得る調節エレメントは、その調節エレメントがコード配列の転写を始めるのを支援する場合、コード領域に動作可能に連結される。この機能的関係が維持される限り、調節エレメントとコード領域の間に介在する残基が存在する場合がある。

【0052】

「ベクター」とは、本明細書で使用されるように、一般に、ポリヌクレオチドを含むか、あるいはポリヌクレオチドと会合する高分子または高分子の集合体（ａｓｓｏｃｉａｔｉｏｎ）を指し、細胞へのポリヌクレオチドの送達を媒介するために使用され得る。ベクターの例としては、プラスミド、ウイルスベクター、リポソーム、および他の遺伝子送達ビヒクルを含む。ベクターは一般に、標的中の遺伝子の発現を促進するために遺伝子に動作可能に連結された遺伝要素、例えば、調節エレメントを含む。

【0053】

本明細書で使用されるように、「発現カセット」および「核酸カセット」は一般に、ともに発現されるか、あるいは発現のために動作可能に連結される核酸配列または要素の組み合わせを指すために交換可能に使用される。場合によっては、発現カセットは、調節エレメントと、それらが発現のために動作可能に連結される遺伝子との組み合わせを指す。

【0054】

ＤＮＡまたはタンパク質配列の「機能的断片」とは一般に、完全長のＤＮＡまたはタンパク質配列の生物学的活性に実質的に類似する生物学的活性（機能的または構造的な）を保持する断片を指す。ＤＮＡ配列の生物学的活性は、完全長の配列に起因すると知られている様式で発現に影響を与えるその能力であり得る。

【0055】

本明細書で使用されるように、「操作された」対象は一般に、その対象がヒトの介入によって修飾されていることを示す。非限定的な例によると、核酸は、その配列を自然界で生じない配列に変更することによって修飾される場合があり、核酸は、ライゲーションされた産物がもとの核酸には存在しない機能を保有するように、その核酸を、その核酸が自然界では会合しない核酸にライゲーションすることによって修飾される場合があり、操作された核酸は、自然界では存在しない配列とインビトロで合成される場合があり、タンパク質は、そのアミノ酸配列を自然界では存在しない配列に変更することによって修飾される場合があり、操作されたタンパク質は、新しい機能あるいは特性を得る場合がある。「操作された」システムは、少なくとも１つの操作された構成要素を含む。

【0056】

本明細書に使用されるように、用語「最適にアラインメントされた」は、一般に最も高いパーセントの同一性スコアを示すか、または一致した残渣の数を最大限にする、２つのアミノ酸配列のアラインメントを指す。

【0057】

本明細書で使用されるように、「合成」および「人工」は、天然に存在するヒトタンパク質に対して低い配列同一性（例えば、５０％未満の配列同一性、２５％未満の配列同一性、１０％未満の配列同一性、５％未満の配列同一性、１％未満の配列同一性）を有するタンパク質またはそのドメインを指すために交換可能に使用される。例えば、ＶＰＲとＶＰ６４のドメインは、合成トランス活性化ドメインである。

【0058】

用語「ｔｒａｃｒＲＮＡ」または「ｔｒａｃｒ配列」は、本明細書で使用されるように、一般に、野生型の例示的なｔｒａｃｒＲＮＡ配列（例えば、Ｓ．ｐｙｏｇｅｎｅｓ、黄色ブドウ球菌などからのｔｒａｃｒＲＮＡ、または配列番号５４７６－５５１１）に対して少なくとも約５％、１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％、または１００％の配列同一性を有する核酸、および／またはその野生型の例示的なｔｒａｃｒＲＮＡ配列に類似する配列を指す場合がある（例えば、化膿レンサ球菌（Ｓ．ｐｙｏｇｅｎｅｓ）、黄色ブドウ球菌（Ｓ．ａｕｒｅｕｓ）などからのｔｒａｃｒＲＮＡ、または配列番号１９９－２０３）。ｔｒａｃｒＲＮＡは、野生型の例示的なｔｒａｃｒＲＮＡ配列（例えば、化膿レンサ球菌、黄色ブドウ球菌などからのｔｒａｃｒＲＮＡ）に対して最大で約５％、１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、あるいは１００％の配列同一性を有する核酸、および／またはその野生型の例示的なｔｒａｃｒＲＮＡ配列に類似する配列を指す場合がある。ｔｒａｃｒＲＮＡは、欠失、挿入、または置換などのヌクレオチド変化、変異体、突然変異、あるいはキメラを含む、ｔｒａｃｒＲＮＡの改変された形態を指す場合がある。ｔｒａｃｒＲＮＡは、少なくとも６つの連続するヌクレオチドのストレッチにわたって、野生型の例示的なｔｒａｃｒＲＮＡ（例えば、化膿レンサ球菌、黄色ブドウ球菌などからのｔｒａｃｒＲＮＡなど）配列に対して少なくとも約６０％同一である核酸を指す場合がある。例えば、ｔｒａｃｒＲＮＡ配列は、少なくとも６つの連続するヌクレオチドのストレッチにわたって、野生型の例示的なｔｒａｃｒＲＮＡ（例えば、化膿レンサ球菌、黄色ブドウ球菌などからのｔｒａｃｒＲＮＡ）配列に対して、少なくとも約６０％同一、少なくとも約６５％同一、少なくとも約７０％同一、少なくとも約７５％同一、少なくとも約８０％同一、少なくとも約８５％同一、少なくとも約９０％同一、少なくとも約９５％同一、少なくとも約９８％同一、少なくとも約９９％同一、または１００％同一である。ＩＩ型ｔｒａｃｒＲＮＡ配列は、隣接したＣＲＩＳＰＲアレイ中の反復配列の一部に相補性を有する領域を同定することによって、ゲノム配列上で予測することができる。

【0059】

本明細書で使用されるように、「ガイド核酸」は一般に、別の核酸にハイブリダイズすることができる核酸を指す場合がある。ガイド核酸はＲＮＡであり得る。ガイド核酸はＤＮＡであり得る。ガイド核酸は、核酸の配列に部位特異的に結合するようにプログラムされてもよい。標的とされた核酸または標的核酸は、ヌクレオチドを含むことがある。ガイド核酸はヌクレオチドを含むことがある。標的核酸の一部は、ガイド核酸の一部に相補的であり得る。ガイド核酸に相補的であり、そのガイド核酸とハイブリダイズする二本鎖標的ポリヌクレオチドの鎖は、相補鎖と呼ばれることがある。相補鎖に相補的であり、したがって、ガイド核酸に相補的でない場合がある二本鎖標的ポリヌクレオチドの鎖は、非相補鎖（ｎｏｎｃｏｍｐｌｅｍｅｎｔａｒｙｓｔｒａｎｄ）と呼ばれることがある。ガイド核酸は、１つのポリヌクレオチド鎖を含む場合があり、単一ガイド核酸（ｓｉｎｇｌｅｇｕｉｄｅｎｕｃｌｅｉｃａｃｉｄ）と呼ばれることがある。ガイド核酸は、２つのポリヌクレオチド鎖を含む場合があり、二重ガイド核酸（ｄｏｕｂｌｅｇｕｉｄｅｎｕｃｌｅｉｃａｃｉｄ）と呼ばれることがある。特に明記しない限り、「ガイド核酸」との用語は包括的であり、シングルガイド核酸およびダブルガイド核酸の両方を指し場合がある。ガイド核酸は、「核酸を標的とするセグメント」または「核酸を標的とする配列」と呼ばれることがある、セグメントを含んでいてもよい。核酸を標的とするセグメントは、「タンパク質結合セグメント」または「タンパク質結合配列」または「Ｃａｓタンパク質結合セグメント」と呼ばれることがあるサブセグメントを含んでいてもよい。

【0060】

２つ以上の核酸あるいはポリペプチド配列の文脈において「配列同一性」または「パーセント同一性」との用語は一般に、２つ（例えば、ペアワイズアラインメント）、またはそれ以上（例えば、多重配列アラインメント）の配列を指し、それらの配列は、配列比較アルゴリズムを使用して測定されるように、局所的または全体的な比較ウィンドウにわたる最大の対応のために、比較または整列されたとき、同じであるか、あるいは同じアミノ酸残基またはヌクレオチドの指定された割合を有する。ポリペプチド配列に適切な配列比較アルゴリズムには、例えば、３のｗｏｒｄｌｅｎｇｔｈ（Ｗ）、１０のｅｘｐｅｃｔａｔｉｏｎ（Ｅ）、および１１のｅｘｉｓｔｅｎｃｅ、１のｅｘｔｅｎｓｉｏｎでギャップコストを設定するＢＬＯＳＵＭ６２スコアリングマトリックスのパラメータを使用する、および３０の残基よりも長いポリペプチド配列の条件付き組成スコアマトリックス調整（ｃｏｎｄｉｔｉｏｎａｌｃｏｍｐｏｓｉｔｉｏｎａｌｓｃｏｒｅｍａｔｒｉｘａｄｊｕｓｔｍｅｎｔ）を使用するＢＬＡＳＴＰ；２のｗｏｒｄｌｅｎｇｔｈ（Ｗ）、１００００００のｅｘｐｅｃｔａｔｉｏｎ（Ｅ）、および３０残基未満の配列に対してギャップを開くために９で、ギャップを拡張するために１でギャップコストを設定するＰＡＭ３０スコアリングマトリックスのパラメータを使用するＢＬＡＳＴＰ（これらは、ｈｔｔｐｓ：／／ｂｌａｓｔ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖで利用可能なＢＬＡＳＴｓｕｉｔｅにおけるＢＬＡＳＴＰのデフォルトパラメータである）；または、２のｍａｔｃｈ、－１ｍｉｓｍａｔｃｈ、および－１のｇａｐパラメータを用いるＳｍｉｔｈ－Ｗａｔｅｒｍａｎ相同性検索アルゴリズムのパラメータを用いるＣＬＵＳＴＡＬＷ；デフォルトパラメータを用いるＭＵＳＣＬＥ；２のｒｅｔｒｅｅおよび１０００のｍａｘｉｔｅｒａｔｉｏｎｓのパラメータを用いるＭＡＦＦＴ；デフォルトパラメータを用いるＮｏｖａｆｏｌｄ；デフォルトパラメータを用いるＨＭＭＥＲｈｍｍａｌｉｇｎが含まれる。

【0061】

本明細書で使用されるように、「ＲｕｖＣ＿ＩＩＩドメイン」との用語は一般に、ＲｕｖＣエンドヌクレアーゼドメイン（３つの不連続セグメントであるＲｕｖＣ＿Ｉ、ＲｕｖＣ＿ＩＩ、およびＲｕｖＣ＿ＩＩＩで構成されているＲｕｖＣヌクレアーゼドメイン）の第３の不連続セグメントを指す。ＲｕｖＣドメインまたはそのセグメントは一般に、既知のドメイン配列へのアライメント、アノテーション付けされたドメインを有するタンパク質への構造アライメントによって、あるいは、既知のドメイン配列に基づいて構築された隠れマルコフモデル（ＨＭＭ）との比較によって、同定することができる（例えば、ＲｕｖＣ＿ＩＩＩのためのＰｆａｍＨＭＭＰＦ１８５４１）。

【0062】

本明細書で使用されるように、「ＨＮＨドメイン」との用語は一般に、特徴的なヒスチジンおよびアスパラギン残基を有するエンドヌクレアーゼドメインを指す。ＨＮＨドメインは一般に、既知のドメイン配列へのアライメント、アノテーション付けされたドメインを有するタンパク質への構造アライメントによって、あるいは、既知のドメイン配列に基づいて構築された隠れマルコフモデル（ＨＭＭ）との比較によって同定することができる（例えば、ドメインＨＮＨのためのＰｆａｍＨＭＭＰＦ０１８４４）。

【0063】

本明細書に使用されるように、用語「ブリッジヘリックスドメイン」または「ＢＨドメイン」は、標的ＤＮＡの結合と同時に切断活性を発生させることにおいて重要な役割を果たす、Ｃａｓ酵素内に存在する、アルギニンリッチなヘリックスドメインを一般に指す。

【0064】

本明細書に使用されるように、用語「認識ドメイン」または「ＲＥＣドメイン」は、ｇＲＮＡのリピート：アンチリピート二本鎖と相互作用してＣａｓエンドヌクレアーゼ／ｇＲＮＡ複合体の形成を媒介するすると考えられるドメインを一般にドメインを指す。

【0065】

本明細書に使用されるように、用語「ウェッジドメイン（ｗｅｄｇｅｄｏｍａｉｎ）」または「ＷＥＤドメイン」は、一般に４つのαヘリックスによって側面に位置される捻じれた５－ストランドベータシート（ｆｉｖｅ－ｓｔｒａｎｄｅｄｂｅｔａｓｈｅｅｔ）を含むフォールドを一般に指し、Ｃａｓ酵素についての歪んだリピート：アンチリピート二本鎖の認識に一般に役割を担う。ＷＥＤドメインは、単一ガイドＲＮＡのスキャフォールドの認識の役割を担い得る。

【0066】

本明細書に使用されるように、用語「ＰＡＭ相互作用ドメイン」または「ＰＩドメイン」は、ガイドＲＮＡの非相補ＤＮＡ鎖におけるＰＡＭ配列を認識するためにエンドヌクレアーゼ－ＤＮＡ複合体に配置されたＣａｓ酵素内で見られるドメインを一般に指す。

【0067】

＜概要＞

【0068】

特有の機能および構造を有する新しいＣａｓ酵素の発見は、デオキシリボ核酸（ＤＮＡ）編集技術をさらに混乱させる（ｄｉｓｒｕｐｔ）可能性を提示し、速度、特異性、機能性、および使いやすさを改善することができる。微生物におけるクラスター化して規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）システムの予測される存在率、および微生物種の膨大な多様性に鑑みると、文献に存在する機能的に特徴づけられたＣＲＩＳＰＲ／Ｃａｓ酵素は比較的わずかである。これは部分的に、莫大な数の微生物種が実験室条件で容易に培養されない可能性があるためである。多くの微生物種を表す自然環境的ニッチからのメタゲノム配列決定により、既知の新しいＣＲＩＳＰＲ／Ｃａｓシステムの数は急激に増加し、新しいオリゴヌクレオチド編集機能の発見が促進される可能性を提示し得る。そのようなアプローチの有益さの最近の例は、天然微生物群のメタゲノム解析からのＣａｓＸ／ＣａｓＹＣＲＩＳＰＲシステムの２０１６年の発見によって示される。

【0069】

ＣＲＩＳＰＲ／Ｃａｓシステムは、微生物中の適応免疫システムとして機能すると説明されている、ＲＮＡ指向性ヌクレアーゼ複合体である。それらの自然な文脈で、ＣＲＩＳＰＲ／ＣａｓシステムがＣＲＩＳＰＲ（クラスター化して規則的な配置の短い回文配列リピート）オペロンまたは遺伝子座に生じ、これは一般に以下の２つの部分、（ｉ）ＲＮＡベースの標的化要素をコードする、等しく短いスペーサー配列によって分離された短い反復配列のアレイ（３０－４０ｂｐ）、および（ｉｉ）アクセサリータンパク質／アクセサリー酵素とともに、ＲＮＡベースの標的化要素によって向けられたヌクレアーゼポリペプチドをコードするＣａｓをコードするＯＲＦ、を含む。特定の標的核酸配列の効率的なヌクレアーゼ標的化は一般に、（ｉ）標的の最初の６～８の核酸（標的シード（ｔａｒｇｅｔｓｅｅｄ））とｃｒＲＮＡガイドとの間の相補的なハイブリダイゼーションと、（ｉｉ）標的シードの定義された近傍内のプロトスペーサー隣接モチーフ（ＰＡＭ）配列の存在（ＰＡＭは一般に、宿主ゲノム内では一般的に表されない配列である）と、の両方を必要とする。上記システムの正確な機能および構成に応じて、ＣＲＩＳＰＲ－Ｃａｓシステムは、共有される機能特性および進化の類似性に基づいて、２つのクラス、５つの型、および１６の亜型へと一般的に組織化される。

【0070】

クラスＩのＣＲＩＳＰＲ－Ｃａｓシステムは、大きなマルチサブユニットエフェクター複合体を有しており、Ｉ型、ＩＩＩ型、およびＩＶ型を含む。

【0071】

Ｉ型のＣＲＩＳＰＲ－Ｃａｓシステムは、構成要素の観点から中程度の複雑さであると考えられる。Ｉ型のＣＲＩＳＰＲ－Ｃａｓシステムでは、ＲＮＡを標的とする要素のアレイは、反復要素で処理される長い前駆体ｃｒＲＮＡ（プレｃｒＲＮＡ）として転写され、短く成熟したｃｒＲＮＡを遊離し、この短く成熟したｃｒＲＮＡは、それらの後にプロトスペーサー隣接モチーフ（ＰＡＭ）と呼ばれる適切な短いコンセンサス配列が続くと、ヌクレアーゼ複合体を核酸標的に向ける。この処理は、カスケードと呼ばれる大きなエンドヌクレアーゼ複合体のエンドリボヌクレアーゼサブユニット（Ｃａｓ６）を介して行われ、これはさらに、ｃｒＲＮＡ指向性ヌクレアーゼ複合体のヌクレアーゼ（Ｃａｓ３）タンパク質成分を含む。ＣａｓＩヌクレアーゼは、ＤＮＡヌクレアーゼとして主に機能する。

【0072】

ＩＩＩ型のＣＲＩＳＰＲシステムは、ＣｓｍまたはＣｍｒのタンパク質サブユニットを含む反復関連ミステリアスタンパク質（ｒｅｐｅａｔ－ａｓｓｏｃｉａｔｅｄｍｙｓｔｅｒｉｏｕｓｐｒｏｔｅｉｎ）（ＲＡＭＰ）とともに、Ｃａｓ１０として知られる中央ヌクレアーゼの存在を特徴とする場合がある。Ｉ型のシステムにように、成熟したｃｒＲＮＡは、Ｃａｓ６のような酵素を使用してプレｃｒＲＮＡから処理される。Ｉ型およびＩＩ型のシステムとは異なり、ＩＩＩ型のシステムは、ＤＮＡ－ＲＮＡ二重鎖（ＲＮＡポリメラーゼの鋳型として使用されるＤＮＡ鎖など）を標的とし、切断するように思われる。

【0073】

ＩＶ型のＣＲＩＳＰＲ－Ｃａｓシステムは、高度に還元された（ｈｉｇｈｌｙｒｅｄｕｃｅｄ）大サブユニットヌクレアーゼ（ｃｓｆ１）と、Ｃａｓ５（ｃｓｆ３）とＣａｓ７（ｃｓｆ２）の群のＲＡＭＰタンパク質の２つの遺伝子と、場合によっては、予測された小サブユニットの１つの遺伝子とからなるエフェクター複合体を持ち、そのようなシステムは一般的に、内因性のプラスミド上で見られる。

【0074】

クラスＩＩのＣＲＩＳＰＲ－Ｃａｓシステムは一般に、単一のポリペプチドのマルチドメインヌクレアーゼエフェクターを有しており、ＩＩ型、Ｖ型、およびＶＩ型を含む。

【0075】

ＩＩ型のＣＲＩＳＰＲ－Ｃａｓシステムは、構成要素の観点から最も単純であると考えられる。ＩＩ型のＣＲＩＳＰＲ－Ｃａｓシステムでは、ＣＲＩＳＰＲアレイを成熟したｃｒＲＮＡに処理するには、特別なエンドヌクレアーゼサブユニットの存在を必要としないが、むしろアレイ反復配列に相補的な領域を有する小さなトランスコードされた（ｔｒａｎｓ－ｅｎｃｏｄｅｄ）ｃｒＲＮＡ（ｔｒａｃｒＲＮＡ）を必要とし、ｔｒａｃｒＲＮＡは、その対応するエフェクターヌクレアーゼ（例えば、Ｃａｓ９）と反復配列の両方と相互作用することで前駆体ｄｓＲＮＡ構造を形成し、この前駆体ｄｓＲＮＡ構造は、内因性のＲＮＡｓｅＩＩＩによって切断されて、ｔｒａｃｒＲＮＡとｃｒＲＮＡの両方がロードされた成熟したエフェクター酵素を生成する。ＣａｓＩＩヌクレアーゼはＤＮＡヌクレアーゼとして知られている。ＩＩ型エフェクターは一般に、無関係なＨＮＨヌクレアーゼドメインがＲｕｖＣ様ヌクレアーゼドメインのフォールド内に挿入されたＲＮａｓｅＨフォールドを採用する、ＲｕｖＣ様エンドヌクレアーゼドメインからなる構造を示す。ＲｕｖＣ様ドメインは、標的（例えば、ｃｒＲＮＡ相補的な）ＤＮＡ鎖の切断の原因となり、一方で、ＨＮＨドメインは置換されたＤＮＡ鎖の切断の原因となる。

【0076】

Ｖ型のＣＲＩＳＰＲ－Ｃａｓシステムは、ＲｕｖＣ様ドメインを含む、ＩＩ型エフェクターのヌクレアーゼエフェクターと類似するヌクレアーゼエフェクター（例えば、Ｃａｓ１２）構造を特徴とする。ＩＩ型と同様に、ほとんどの（しかし、すべてでない）Ｖ型のＣＲＩＳＰＲシステムは、プレｃｒＲＮＡを成熟したｃｒＲＮＡへと処理するためにｔｒａｃｒＲＮＡを使用し、しかし、プレｃｒＲＮＡを切断して複数のｃｒＲＮＡにするためにＲＮＡｓｅＩＩＩを必要とするＩＩ型システムとは異なり、Ｖ型システムは、プレｃｒＲＮＡを切断するために、エフェクターヌクレアーゼそれ自体を使用することができる。ＩＩ型のＣＲＩＳＰＲ－Ｃａｓシステムのように、Ｖ型のＣＲＩＳＰＲ－Ｃａｓシステムもまた、ＤＮＡヌクレアーゼとして知られている。ＩＩ型のＣＲＩＳＰＲ－Ｃａｓシステムとは異なり、いくつかのＶ型の酵素（例えば、Ｃａｓ１２ａ）は、二本鎖標的配列の第１のｃｒＲＮＡ指向性切断によって活性化される、頑強な一本鎖の非特異的なデオキシリボヌクレアーゼ活性を有するように思われる。

【0077】

ＶＩ型のＣＲＩＰＳＲ－Ｃａｓシステムは、ＲＮＡ誘導型ＲＮＡエンドヌクレアーゼを有する。ＲｕｖＣ様ドメインの代わりに、ＶＩ型のシステム（例えば、Ｃａｓ１３）の単一のポリペプチドエフェクターは、２つのＨＥＰＮリボヌクレアーゼドメインを含む。ＩＩ型およびＶ型のシステムの両方とは異なり、ＶＩ型のシステムは、プレｃｒＲＮＡをｃｒＲＮＡへと処理するために、ｔｒａｃｒＲＮＡを必要としないように思われる。しかし、Ｖ型のシステムと同様に、いくつかのＶＩ型のシステム（例えば、Ｃ２Ｃ２）は、標的ＲＮＡの第１のｃｒＲＮＡ指向性切断によって活性化される、頑強な一本鎖の非特異的ヌクレアーゼ（リボヌクレアーゼ）活性を持つように思われる。

【0078】

それらのより単純な構造ゆえに、クラスＩＩのＣＲＩＳＰＲ－Ｃａｓは、デザイナーヌクレアーゼ（ｄｅｓｉｇｎｅｒｎｕｃｌｅａｓｅ）／ゲノム編集用途として、エンジニアリングおよび開発のために最も広く採用されている。

【0079】

インビトロでの使用のためのそのようなシステムの初期の適応のうちの１つは、Ｊｉｎｅｋら（Ｓｃｉｅｎｃｅ．２０１２Ａｕｇ１７；３３７（６０９６）：８１６－２１，参照により全体が本明細書に組み込まれる）において見ることができる。Ｊｉｎｅｋの試験では、（ｉ）Ｓ．ｐｙｏｇｅｎｅｓＳＦ３７０から単離された、組換え的に（ｒｅｃｏｍｂｉｎａｎｔｌｙ）発現されて精製された完全長のＣａｓ９（例えば、クラスＩＩのＩＩ型Ｃａｓ酵素）、（ｉｉ）切断されることが望まれる標的ＤＮＡ配列に相補的な～２０ｎｔ５’配列と、それに続く３’ｔｒａｃｒ結合配列とを有する、精製された成熟～４２ｎｔｃｒＲＮＡ（ｃｒＲＮＡ全体が、Ｔ７プロモーター配列を有する合成ＤＮＡ鋳型からインビトロで転写される）、（ｉｉｉ）Ｔ７プロモーター配列を有する合成ＤＮＡ鋳型からインビトロで転写された、精製されたｔｒａｃｒＲＮＡ、および（ｉｖ）Ｍｇ^２＋を含むシステムが、最初に説明された。Ｊｉｎｅｋは、その後、改善された操作されたシステムを説明し、そのシステムでは、それ自体でＣａｓ９を標的に向けることができる単一の融合された合成ガイドＲＮＡ（ｓｇＲＮＡ）を形成するために、（ｉｉ）のｃｒＲＮＡが、リンカー（例えば、ＧＡＡＡ）によって、（ｉｉｉ）の５’末端に結合される（図２の上パネルと下パネルを比較する）。

【0080】

Ｍａｌｉら（Ｓｃｉｅｎｃｅ．２０１３Ｆｅｂ１５；３３９（６１２１）：８２３－８２６．）（これは、参照により完全に本明細書に組み込まれる）は、その後、（ｉ）Ｃ末端の核局在化配列（例えば、ＳＶ４０ＮＬＳ）および適切なポリアデニル化シグナル（例えば、ＴＫｐＡシグナル）を有する適切な哺乳動物プロモーター下で、コドン最適化Ｃａｓ９（例えば、クラスＩＩのＩＩ型Ｃａｓ酵素）をコードするＯＲＦと、（ｉｉ）適切なポリメラーゼＩＩＩプロモーター（例えば、Ｕ６プロモーター）下でｓｇＲＮＡをコードするＯＲＦ（Ｇで始まる５’配列と、それに続く相補的な標的化核酸配列の２０ｎｔと、それに結合した３’ｔｒａｃｒ結合配列と、リンカーと、ｔｒａｃｒＲＮＡ配列とを有する）とをコードするＤＮＡベクターを提供することによって、哺乳動物細胞で使用するためにこのシステムを適合させた。

【0081】

＜ＭＧ酵素＞

【0082】

ある態様では、本開示は操作されたヌクレアーゼシステムを提供する。操作されたヌクレアーゼシステムは、（ａ）エンドヌクレアーゼを含む場合がある。場合によっては、エンドヌクレアーゼは、ＲｕｖＣドメインおよびＨＮＨドメインを含む。エンドヌクレアーゼは、難培養性微生物由来であり得る。エンドヌクレアーゼは、Ｃａｓエンドヌクレアーゼであり得る。エンドヌクレアーゼは、クラス２のエンドヌクレアーゼであり得る。エンドヌクレアーゼはクラス２のＩＩ型Ｃａｓエンドヌクレアーゼであり得る。操作されたヌクレアーゼシステムは、（ｂ）操作されたガイドリボ核酸構造を含む場合がある。操作されたガイドリボ核酸構造は、エンドヌクレアーゼと複合体を形成するように構成される場合がある。場合によっては、エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造は、ガイドリボ核酸配列を含む。ガイドリボ核酸配列は、標的デオキシリボ核酸配列にハイブリダイズするように構成され得る。場合によっては、エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造は、ｔｒａｃｒリボ核酸配列を含む。ｔｒａｃｒリボ核酸配列は、エンドヌクレアーゼに結合するように構成される場合がある。場合によっては、エンドヌクレアーゼは、約１２０ｋＤａ以下、約１１０ｋＤａ以下、約１００ｋＤａ以下、約９０ｋＤａ以下、約８０ｋＤａ以下、約７０ｋＤａ以下、約６０ｋＤａ以下、約５０ｋＤａ以下、約４０ｋＤａ以下、約３０ｋＤａ以下、約２０ｋＤａ以下または約１０ｋＤａ以下の分子量を有する。

【0083】

場合によっては、エンドヌクレアーゼは、配列番号１－１９８、２２１－４５９、４６３－６１２、または６１７－６６８のいずれか１つに対して、少なくとも５０％、少なくとも５５％、少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、あるいは少なくとも９９％の配列同一性を有する配列を含む。

【0084】

ある態様では、本開示は操作されたヌクレアーゼシステムを提供する。操作されたヌクレアーゼシステムは、（ａ）エンドヌクレアーゼを含む場合がある。エンドヌクレアーゼは、ＲｕｖＣ－１ドメインまたはＲｕｖＣドメインを含む場合がある。エンドヌクレアーゼは、ＨＮＨドメインを含む場合がある。エンドヌクレアーゼは、ＲｕｖＣ－１ドメインとＨＮＨドメインを含む場合がある。エンドヌクレアーゼは、Ｃａｓエンドヌクレアーゼであり得る。エンドヌクレアーゼは、クラス２のエンドヌクレアーゼであり得る。エンドヌクレアーゼはクラス２のＩＩ型Ｃａｓエンドヌクレアーゼであり得る。操作されたヌクレアーゼシステムは、（ｂ）操作されたガイドリボ核酸を含む場合がある。操作されたガイドリボ核酸構造は、エンドヌクレアーゼと複合体を形成するように構成される場合がある。エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造は、ガイドリボ核酸配列を含み得る。ガイドリボ核酸配列は、標的デオキシリボ核酸配列にハイブリダイズするように構成され得る。エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造は、ｔｒａｃｒリボ核酸配列を含み得る。ｔｒａｃｒリボ核酸配列は、エンドヌクレアーゼに結合するように構成される場合がある。エンドヌクレアーゼは、１－１９８、２２１－４５９、４６３－６１２、または６１７－６６８のいずれか１つに対して、少なくとも５０％、少なくとも５５％、少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも８１％、少なくとも８２％、少なくとも８３％、少なくとも８４％、少なくとも８５％、少なくとも８６％、少なくとも８７％、少なくとも８８％、少なくとも８９％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、あるいは少なくとも約９９％の配列同一性を有する配列を含み得る。エンドヌクレアーゼは、古細菌エンドヌクレアーゼであり得る。エンドヌクレアーゼは、クラス２のＩＩ型Ｃａｓエンドヌクレアーゼであり得る。エンドヌクレアーゼは、ＲＲモチーフを含むアルギニンリッチ領域またはＰＦ１４２３９相同性を有するドメインを含み得る。アルギニンリッチ領域またはＰＦ１４２３９相同性を有するドメインは、配列番号１－１９８、２２１－４５９、４６３－６１２、または６１７－６６８のいずれか１つのアルギニンリッチ領域またはＰＦ１４２３９相同性を有するドメインに対して、少なくとも５０％、少なくとも５５％、少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも８１％、少なくとも８２％、少なくとも８３％、８４％、少なくとも８５％、少なくとも８６％、少なくとも８７％、少なくとも８８％、少なくとも８９％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、あるいは少なくとも９９％の配列同一性を有する配列を含み得る。アルギニンリッチドメインまたはＰＦ１４２３９相同性を有するドメインのドメイン境界は、ＭＧ３４－１またはＭＧ３４－９に対する最適なアラインメントによって同定することができる。エンドヌクレアーゼは、ＲＥＣドメインを含む場合がある。ＲＥＣドメインは、配列番号１－１９８、２２１－４５９、４６３－６１２、または６１７－６６８のいずれか１つのＲＥＣドメインに対して、少なくとも５０％、少なくとも５５％、少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも８１％、少なくとも８２％、少なくとも８３％、少なくとも８４％、少なくとも８５％、少なくとも８６％、少なくとも８７％、少なくとも８８％、少なくとも８９％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、あるいは少なくとも約９９％の配列同一性を有する配列を含み得る。ＲＥＣドメインのドメイン境界は、ＭＧ３４－１またはＭＧ３４－９に対する最適なアラインメントによって同定することができる。エンドヌクレアーゼは、ＢＨ（ブリッジヘリックス）ドメインを含む場合がある。ＢＨドメインは、配列番号１－１９８、２２１－４５９、４６３－６１２、または６１７－６６８のいずれか１つのＢＨドメインに対して、少なくとも５０％、少なくとも５５％、少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも８１％、少なくとも８２％、少なくとも８３％、少なくとも８４％、少なくとも８５％、少なくとも８６％、少なくとも８７％、少なくとも８８％、少なくとも８９％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、あるいは少なくとも約９９％の配列同一性を有する配列を含み得る。ＢＨドメインのドメイン境界は、ＭＧ３４－１またはＭＧ３４－９に対する最適なアラインメントによって同定することができる。

【0085】

エンドヌクレアーゼは、ＷＥＤ（ウェッジ）ドメインを含む場合がある。ＷＥＤドメインは、配列番号１－１９８、２２１－４５９、４６３－６１２、または６１７－６６８のいずれか１つのＷＥＤドメインに対して、少なくとも５０％、少なくとも５５％、少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも８１％、少なくとも８２％、少なくとも８３％、少なくとも８４％、少なくとも８５％、少なくとも８６％、少なくとも８７％、少なくとも８８％、少なくとも８９％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、あるいは少なくとも約９９％の配列同一性を有する配列を含み得る。ＷＥＤドメインのドメイン境界は、ＭＧ３４－１またはＭＧ３４－９に対する最適なアラインメントによって同定することができる。エンドヌクレアーゼは、ＰＩ（ＰＡＭ相互作用）ドメインを含む場合がある。ＰＩドメインは、配列番号１－１９８、２２１－４５９、４６３－６１２、または６１７－６６８のいずれか１つのＰＩドメインに対して、少なくとも５０％、少なくとも５５％、少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも８１％、少なくとも８２％、少なくとも８３％、少なくとも８４％、少なくとも８５％、少なくとも８６％、少なくとも８７％、少なくとも８８％、少なくとも８９％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、あるいは少なくとも約９９％の配列同一性を有する配列を含み得る。ＰＩドメインのドメイン境界は、ＭＧ３４－１またはＭＧ３４－９に対する最適なアラインメントによって同定することができる。

【0086】

場合によっては、エンドヌクレアーゼは、難培養性微生物由来である。場合によっては、ｔｒａｃｒリボ核酸配列は、配列番号１９９－２００、４６０－４６１、または６６９－６７３のいずれか１つに由来する少なくとも５０、少なくとも６０、少なくとも７０、少なくとも８０の連続するヌクレオチドに対して、少なくとも５０％、少なくとも５５％、少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、あるいは少なくとも９９％の配列同一性を有する配列を含むか、または、配列番号２０１－２０３または６１３－６１６のいずれか１つの非可変ヌクレオチドの少なくとも５０、少なくとも６０、少なくとも７０、少なくとも８０の連続するヌクレオチドに対して、少なくとも５０％、少なくとも５５％、少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、あるいは少なくとも９９％の配列同一性を有する配列を含む。

【0087】

場合によっては、ガイド核酸構造は、配列番号２０１を含む。場合によっては、ガイド核酸構造は、配列番号２０２を含む。場合によっては、ガイド核酸構造は、配列番号２０３を含む。場合によっては、ガイド核酸構造は、配列番号２０１－２０３を含む。場合によっては、ガイド核酸構造は、配列番号６１３を含む。場合によっては、ガイド核酸構造は、配列番号６１４を含む。場合によっては、ガイド核酸構造は、配列番号６１５を含む。場合によっては、ガイド核酸構造は、配列番号６１６を含む。

【0088】

ある態様では、本開示は操作されたヌクレアーゼシステムを提供する。操作されたヌクレアーゼシステムは、（ａ）操作されたガイドリボ核酸構造を含む場合がある。操作されたガイドリボ核酸構造は、ガイドリボ核酸配列を含む場合がある。ガイドリボ核酸配列は、標的デオキシリボ核酸配列にハイブリダイズするように構成され得る。操作されたガイドリボ核酸構造は、ｔｒａｃｒリボ核酸配列を含む場合がある。ｔｒａｃｒリボ核酸配列は、エンドヌクレアーゼに結合するように構成される場合がある。場合によっては、ｔｒａｃｒリボ核酸配列は、配列番号１９９－２００、４６０－４６１、または６６９－６７３のいずれか１つに由来する少なくとも５０、少なくとも６０、少なくとも７０、少なくとも８０の連続するヌクレオチドに対して、少なくとも５０％、少なくとも５５％、少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、あるいは少なくとも９９％の配列同一性を有する配列を含むか、または、配列番号２０１－２０３または６１３－６１６のいずれか１つの非可変ヌクレオチドの少なくとも１５、少なくとも２０、少なくとも２５、少なくとも３０、少なくとも３５、少なくとも４０、少なくとも４５、少なくとも５０、少なくとも６０、少なくとも７０、少なくとも８０の連続するヌクレオチドに対して、少なくとも５０％、少なくとも５５％、少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、あるいは少なくとも９９％の配列同一性を有する配列を含む。

【0089】

いくつかの場合には、操作されたヌクレアーゼシステムは、エンドヌクレアーゼを含む。エンドヌクレアーゼは、クラス２のエンドヌクレアーゼであり得る。エンドヌクレアーゼは、Ｃａｓエンドヌクレアーゼであり得る。エンドヌクレアーゼは、クラス２のＩＩ型Ｃａｓエンドヌクレアーゼであり得る。

【0090】

場合によっては、エンドヌクレアーゼは特定の分子量範囲を有する。いくつかの実施形態では、エンドヌクレアーゼは、約１２０ｋＤａ以下、約１１０ｋＤａ以下、約１０５ｋＤａ以下、約１００ｋＤａ以下、９５ｋＤａ以下、約９０ｋＤａ以下、約９５ｋＤａ以下、約８０ｋＤａ以下、約７５ｋＤａ以下、約７０ｋＤａ以下、約６５ｋＤａ以下、約６０ｋＤａ以下、約５５ｋＤａ以下、約５０ｋＤａ以下、約４５ｋＤａ以下、約４０ｋＤａ以下、約３５ｋＤａ以下、約３０ｋＤａ以下、約２５ｋＤａ以下、約２０ｋＤａ以下、約１５ｋＤａ以下、または約１０ｋＤａ以下の分子量を有する。場合によっては、操作されたガイドリボ核酸構造は、少なくとも２つのリボ核酸ポリヌクレオチドを含む。場合によっては、エンドヌクレアーゼは、特定の数の残基を含む。エンドヌクレアーゼは、約１，１００以下の残基、約１，０００以下の残基、約９５０以下の残基、約９００以下の残基、約８５０以下の残基、約８００以下の残基、約７５０以下の残基、約７００以下の残基、約６５０以下の残基、約６００以下の残基、約５５０以下の残基、約５００以下の残基、約４５０以下の残基、約４００以下の残基、または約３５０以下の残基を含み得る。エンドヌクレアーゼは、約７００～約１，１００の残基を含み得る。エンドヌクレアーゼは、約４００～約６００の残基を含み得る。場合によっては、操作されたガイドリボ核酸構造は、単一のリボ核酸ポリヌクレオチドを含む。単一のリボ核酸ポリヌクレオチドは、ガイドリボ核酸配列とｔｒａｃｒリボ核酸配列とを含む場合がある。

【0091】

場合によっては、ガイドリボ核酸配列は、原核生物、細菌、古細菌、真核生物、真菌、植物、哺乳動物、またはヒトのゲノム配列に相補的である。場合によっては、ガイドリボ核酸配列は、原核生物のゲノムの配列に相補的である。場合によっては、ガイドリボ核酸配列は、細菌のゲノムの配列に相補的である。場合によっては、ガイドリボ核酸配列は、古細菌のゲノムの配列に相補的である。場合によっては、ガイドリボ核酸配列は、真核生物のゲノムの配列に相補的である。場合によっては、ガイドリボ核酸配列は、真菌のゲノムの配列に相補的である。場合によっては、ガイドリボ核酸配列は、植物のゲノムの配列に相補的である。場合によっては、ガイドリボ核酸配列は、哺乳動物のゲノムの配列に相補的である。場合によっては、ガイドリボ核酸配列は、ヒトのゲノムの配列に相補的である。

【0092】

場合によっては、配列またはスペーサーを標的とするガイドリボ核酸は、１０～３０ヌクレオチド長、１２～２８ヌクレオチド長、または１５～２４ヌクレオチド長である。場合によっては、エンドヌクレアーゼは、当該エンドヌクレアーゼのＮ末端またはＣ末端の近位に１つ以上の核局在化配列（ＮＬＳ）を含む。場合によっては、ＮＬＳは、配列番号２０５－２２０から選択される配列を含む。

【0093】

【表1】

【0094】

１つ以上の保存的なアミノ酸置換を有する、本明細書に記載された酵素のうちのいずれかの変異体が、本開示に含まれる。保存的置換は、ポリペプチドの三次元構造又は機能を妨害することなく、ポリペプチドのアミノ酸配列において行われ得る。保存的置換は、互いに同様の疎水性、極性、及びＲ鎖長を持つアミノ酸を置換することにより、によって達成され得る。加えて、または代替的に、異なる種からの相同タンパク質のアラインメントされた配列を比較することにより、保存的置換は、コードされたタンパク質の基本機能を変えることなく、種の間に突然変異されたアミノ酸残基（例えば、非保存的残基）を位置付けることにより識別され得る。そのような保守的に置換された変異体は、本明細書に記載されるエンドヌクレアーゼタンパク質配列のいずれか１つに対して、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％含む、少なくとも約４０％、少なくとも約４５％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約８６％、少なくとも約８７％、少なくとも約８８％、少なくとも約８９％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％の同一性を有する変異体を含み得る。いくつかの実施形態では、そのような保守的に置換された変異体は機能的な変異体である。そのような機能的な変異体は、１つ以上の重要な活性部位残基またはエンドヌクレアーゼのガイドＲＮＡ結合残基の活性が妨害されないように置換を伴う配列を包含し得る。いくつかの実施形態では、本明細書に記載されるタンパク質のうちのいずれかの機能的な変異体は、図４に挙げられた、保存された又は機能的な残基の少なくとも１つの置換を欠く。いくつかの実施形態では、本明細書に記載されるタンパク質のうちのいずれかの機能的な変異体は、図４に挙げられた、全ての保存された又は機能的な残基の置換を欠く。また、本開示によって、本明細書に記載されるヌクレアーゼのうちのいずれかの改変された活性変異体が提供される。そのような改変された活性変異体は、本発明で（例えば、図４において）同定された、またはＲｕｖＣドメインについて一般に説明された、１つ以上の触媒残基において不活性化する変異を含む場合がある。そのような変更された活性変異体は、ＲｕｖＣＩ、ＲｕｖＣＩＩまたはＲｕｖＣＩＩＩドメインの触媒現象の残渣における変化スイッチ変異を含む場合がある。

【0095】

機能的に類似するアミノ酸を提供する保存的置換の表は、様々な参考文献から利用可能である（例えば、Ｃｒｅｉｇｈｔｏｎ，Ｐｒｏｔｅｉｎｓ：ＳｔｒｕｃｔｕｒｅｓａｎｄＭｏｌｅｃｕｌａｒＰｒｏｐｅｒｔｉｅｓ（ＷＨＦｒｅｅｍａｎ＆Ｃｏ．；２ｎｄｅｄｉｔｉｏｎ（Ｄｅｃｅｍｂｅｒ１９９３）を参照）。以下の８つの群は各々、互いに対して保存的な置換であるアミノ酸を包含する。
１）アラニン（Ａ）、グリシン（Ｇ）、
２）アスパラギン酸（Ｄ）、グルタミン酸（Ｅ）、
３）アスパラギン（Ｎ）、グルタミン（Ｑ）、
４）アルギニン（Ｒ）、リジン（Ｋ）、
５）イソロイシン（Ｉ）、ロイシン（Ｌ）、メチオニン（Ｍ）、バリン（Ｖ）、
６）フェニルアラニン（Ｆ）、チロシン（Ｙ）、トリプトファン（Ｗ）、
７）セリン（Ｓ）、トレオニン（Ｔ）、および
８）システイン（Ｃ）、メチオニン（Ｍ）

【0096】

特定のドメインに対する同一性を有する、本明細書に記載されたエンドヌクレアーゼのうちのいずれかの変異体が、本開示に含まれる。ドメインは、アルギニンリッチドメイン（例えば、ＰＦ１４２３９相同性を有するドメイン）、ＲＥＣ（認識）ドメイン、ＢＨ（ブリッジヘリックス）ドメイン、ＷＥＤ（ウェッジ）ドメイン、ＰＩ（ＰＡＭ相互作用）ドメイン、ＰＦ１４２３９相同性ドメイン、または本明細書に記載のいずれかの他のドメインであり得る。いくつかの実施形態では、これらのドメインを包含する残基の１つ以上は、以下のタンパク質のうちの１つに対するアラインメントによって、タンパク質において同定され（例えば、下記のタンパク質のうちの１つと関心のタンパク質が、最適にアラインメントされる時）、ここでドメインの例の残基境界が記載される。

【0097】

【表2】

【0098】

場合によっては、操作されたヌクレアーゼシステムは、一本鎖ＤＮＡ修復鋳型をさらに含む。場合によっては、操作されたヌクレアーゼシステムは、二本鎖ＤＮＡ修復鋳型をさらに含む。場合によっては、一本鎖または二本鎖のＤＮＡ修復鋳型は、５’から３’で、標的デオキシリボ核酸配列に対して５’に、少なくとも２０ヌクレオチドの配列を含む第１の相同性アームを含む。場合によっては、一本鎖または二本鎖のＤＮＡ修復鋳型は、５’から３’で、少なくとも１０ヌクレオチドの合成ＤＮＡ配列を含む。場合によっては、一本鎖または二本鎖ＤＮＡの修復鋳型は、５’から３’で、標的配列に対して３’に、少なくとも２０ヌクレオチドの配列を含む、第２の相同性アームを含む。場合によっては、一本鎖または二本鎖ＤＮＡ修復鋳型は、５’から３’で、標的デオキシリボ核酸配列の５’に、少なくとも２０ヌクレオチドの配列を含む第１の相同性アーム、少なくとも１０ヌクレオチドの合成ＤＮＡ配列、または前述の標的配列の３’に少なくとも２０ヌクレオチドの配列を含む第２の相同性アームを含む。

【0099】

場合によっては、第１の相同性アームは、少なくとも１０、少なくとも２０、少なくとも３０、少なくとも４０、少なくとも５０、少なくとも６０、少なくとも７０、少なくとも８０、少なくとも９０、少なくとも１００、少なくとも１１０、少なくとも１２０、少なくとも１３０、少なくとも１４０、少なくとも１５０、少なくとも１７５、少なくとも２００、少なくとも２５０、少なくとも３００、少なくとも４００、少なくとも５００、少なくとも７５０、または少なくとも１０００ヌクレオチドの配列を含む。場合によっては、操作されたヌクレアーゼシステムは、Ｍｇ^２＋の供給源をさらに含む。場合によっては、エンドヌクレアーゼとｔｒａｃｒリボ核酸配列は異なる細菌の種に由来する。場合によっては、エンドヌクレアーゼとｔｒａｃｔリボ核酸配列は、同じ門内の別個の細菌種に由来する。

【0100】

場合によっては、エンドヌクレアーゼは、配列番号１－２４または４６２－４８８のいずれか１つに対して、少なくとも５０％、少なくとも５５％、少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、あるいは少なくとも９９％の配列同一性を有する配列を含む。場合によっては、ガイドＲＮＡ構造は、ヘアピンを含むことが予測されるＲＮＡ配列を含む。場合によっては、ヘアピンは、ステムおよびループを含む。場合によっては、ステムは、少なくとも１２対、少なくとも１４対、少なくとも１６対、または少なくとも１８対のリボヌクレオチドを含む。

【0101】

場合によっては、ガイドＲＮＡ構造は、第２のステムおよび第２のループをさらに含み得る。場合によっては、第２のステムは、少なくとも５対、少なくとも６対、少なくとも７対、少なくとも８対、少なくとも９対、または少なくとも１０対の、リボヌクレオチドを含む。場合によっては、ガイドＲＮＡ構造は、ＲＮＡ構造を含み、およびこのＲＮＡ構造は、少なくとも２本のヘアピンを含む。場合によっては、エンドヌクレアーゼは、配列番号１に対して、少なくとも５０％、少なくとも５５％、少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、あるいは少なくとも９９％の配列同一性を有する配列を含み、およびガイドＲＮＡ構造は、少なくとも４つのヘアピンを含むことが測されるＲＮＡ配列を含む。場合によっては、これらの４本のヘアピンの各々は、ステムとループを含む。

【0102】

場合によっては、操作されたヌクレアーゼシステムは、配列番号１に対して、少なくとも５０％、少なくとも５５％、少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、あるいは少なくとも９９％同一である配列を含む。場合によっては、操作されたヌクレアーゼシステムは、配列番号１９９または配列番号２０１の非可変ヌクレオチドの少なくとも１つに対して、少なくとも５０％、少なくとも５５％、少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、あるいは少なくとも９９％同一である配列を含む、ガイドＲＮＡ構造配列を含む。

【0103】

場合によっては、操作されたヌクレアーゼシステムは、配列番号１－２４または４６２－４８８のいずれか１つに対して、少なくとも５０％、少なくとも５５％、少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、あるいは少なくとも９９％同一である配列を含む。場合によっては、操作されたヌクレアーゼシステムは、配列番号１９９－２００または６６９－６７３のいずれか１つ、あるいは配列番号２０１－２０３または６１３－６１６のいずれか１つの非可変ヌクレオチドに対して、少なくとも５０％、少なくとも５５％、少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、あるいは少なくとも９９％同一である配列を含む。

【0104】

場合によっては、配列同一性は、ＢＬＡＳＴＰ、ＣＬＵＳＴＡＬＷ、ＭＵＳＣＬＥ、ＭＡＦＦＴ、またはＳｍｉｔｈ－Ｗａｔｅｒｍａｎ相同性検索アルゴリズムのパラメータを伴うＣＬＵＳＴＡＬＷによって決定される。場合によっては、配列同一性は、前述のＢＬＡＳＴＰ相同性検索アルゴリズムによって求められ、ここでパラメータとして３のｗｏｒｄｌｅｎｇｔｈ（Ｗ）、１０のｅｘｐｅｃｔａｔｉｏｎ（Ｅ）を使用し、およびギャップコストを１１のｅｘｉｓｔｅｎｃｅ、１のｅｘｔｅｎｓｉｏｎに設定するスコアリングマトリックスＢＬＯＳＵＭ６２を使用し、ならびに条件付き組成スコアマトリックス調整を使用する。

【0105】

場合によっては、エンドヌクレアーゼは、Ｃａｓ９エンドヌクレアーゼ、Ｃａｓ１４エンドヌクレアーゼ、Ｃａｓ１２ａエンドヌクレアーゼ、Ｃａｓ１２ｂエンドヌクレアーゼ、Ｃａｓ１２ｃエンドヌクレアーゼ、Ｃａｓ１２ｄエンドヌクレアーゼ、Ｃａｓ１２ｅエンドヌクレアーゼ、Ｃａｓ１３ａエンドヌクレアーゼ、Ｃａｓ１３ｂエンドヌクレアーゼ、Ｃａｓ１３ｃエンドヌクレアーゼ、またはＣａｓ１３ｄエンドヌクレアーゼではない。場合によっては、エンドヌクレアーゼは、Ｃａｓ９エンドヌクレアーゼに対して、８０％未満の同一性、７５％未満の同一性、７０％未満の同一性、６５％未満の同一性、６０％未満の同一性、５５％未満の同一性、または５０％未満の同一性を有する。

【0106】

一態様では、本開示は、（ａ）ＤＮＡ標的化セグメントを含む、操作されたガイドＲＮＡを提供する。場合によっては、ＤＮＡ標化セグメントは、標的ＤＮＡ分子中の標的配列に相補的なヌクレオチド配列を含む。場合によっては、操作された単一ガイドリボ核酸ポリヌクレオチドは、タンパク質結合セグメントを含む。タンパク質結合セグメントは、二本鎖ＲＮＡ（ｄｓＲＮＡ）二重螺旋を形成するようにハイブリダイズするヌクレオチドの２つの相補的なストレッチを含む。場合によっては、ヌクレオチドの２つの相補的なストレッチは、互いに介在するヌクレオチドにより、共有結合で連結される。場合によっては、操作されたガイドリボ核酸ポリヌクレオチドは、配列番号１－１９８、２２１－４５９、４６３－６１２、または６１７－６６８のいずれか１つに対して、少なくとも５０％、少なくとも５５％、少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、あるいは少なくとも９９％の配列同一性を有する変異体を含むエンドヌクレアーゼと、複合体を形成するように構成される。

【0107】

場合によっては、ＤＮＡ標的化セグメントは、ヌクレオチドの２つの相補的なストレッチの両方の５’に位置する。場合によっては、タンパク質結合セグメントは、配列番号１９９－２００または６６９－６７３のいずれか１つ、あるいは配列番号２０１－２０３または６１３－６１６のいずれか１つの非可変ヌクレオチドに対して、少なくとも５０％、少なくとも５５％、少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、あるいは少なくとも９９％同一である配列を含む。場合によっては、デオキシリボ核酸ポリヌクレオチドは、本明細書に記載された、操作されたガイドリボ核酸ポリヌクレオチドをコードする。

【0108】

一態様では、本開示は、操作された核酸配列を含む核酸を提供する。場合によっては、操作された核酸配列は、生物内の発現のために最適化される。場合によっては、核酸は、エンドヌクレアーゼをコードする。エンドヌクレアーゼは、Ｃａｓエンドヌクレアーゼであり得る。エンドヌクレアーゼは、クラス２のエンドヌクレアーゼであり得る。エンドヌクレアーゼはクラス２のＩＩ型Ｃａｓエンドヌクレアーゼであり得る。場合によっては、エンドヌクレアーゼは、ＲｕｖＣドメインおよびＨＮＨドメインを含む。場合によっては、エンドヌクレアーゼは、難培養性微生物由来である。場合によっては、エンドヌクレアーゼは特定の分子量範囲を有する。いくつかの実施形態では、エンドヌクレアーゼは、約１２０ｋＤａ以下、約１１０ｋＤａ以下、約１０５ｋＤａ以下、約１００ｋＤａ以下、９５ｋＤａ以下、約９０ｋＤａ以下、約９５ｋＤａ以下、約８０ｋＤａ以下、約７５ｋＤａ以下、約７０ｋＤａ以下、約６５ｋＤａ以下、約６０ｋＤａ以下、約５５ｋＤａ以下、約５０ｋＤａ以下、約４５ｋＤａ以下、約４０ｋＤａ以下、約３５ｋＤａ以下、約３０ｋＤａ以下、約２５ｋＤａ以下、約２０ｋＤａ以下、約１５ｋＤａ以下、または約１０ｋＤａ以下の分子量を有する。場合によっては、操作されたガイドリボ核酸構造は、少なくとも２つのリボ核酸ポリヌクレオチドを含む。場合によっては、エンドヌクレアーゼは、特定の数の残基を含む。エンドヌクレアーゼは、約１，１００以下の残基、約１，０００以下の残基、約９５０以下の残基、約９００以下の残基、約８５０以下の残基、約８００以下の残基、約７５０以下の残基、約７００以下の残基、約６５０以下の残基、約６００以下の残基、約５５０以下の残基、約５００以下の残基、約４５０以下の残基、約４００以下の残基、または約３５０以下の残基を含み得る。エンドヌクレアーゼは、約７００～約１，１００の残基を含み得る。エンドヌクレアーゼは、約４００～約６００の残基を含み得る。場合によっては、エンドヌクレアーゼは、配列番号１－１９８、２２１－４５９、４６３－６１２、または６１７－６６８、あるいはそれらに対して、少なくとも５０％、少なくとも５５％、少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、あるいは少なくとも９９％の配列同一性を有する変異体を含む。場合によっては、エンドヌクレアーゼは、該エンドヌクレアーゼのＮ末端またはＣ末端の近位に１つ以上の核局在化配列（ＮＬＳ）をコードする配列をさらに含む。場合によっては、ＮＬＳは、配列番号２０５－２２０から選択される配列を含む。

【0109】

場合によっては、生物は、原核生物、細菌、真核生物、真菌、植物、哺乳動物、げっ歯類、またはヒトである。場合によっては、生物は、原核生物である。場合によっては、生物は、細菌である。場合によっては、生物は、古細菌である。場合によっては、生物は、真菌である。場合によっては、生物は、植物である。場合によっては、生物は、哺乳動物である。場合によっては、生物は、真菌である。場合によっては、生物は、ヒトである。生物が原核生物または細菌の場合、生物はエンドヌクレアーゼが由来する生物とは異なる生物であり得る。場合によっては、生物は、難培養性微生物ではない。

【0110】

一態様では、本開示は、核酸配列を含むベクターを提供する。いくつかの場合には、核酸配列は、エンドヌクレアーゼをコードする。場合によっては、エンドヌクレアーゼは、Ｃａｓエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、クラス２のエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、クラス２のＩＩ型Ｃａｓエンドヌクレアーゼである。エンドヌクレアーゼは、ＲｕｖＣ－ＩドメインとＨＮＨドメインとを含む場合がある。場合によっては、エンドヌクレアーゼは、難培養性微生物由来である。場合によっては、エンドヌクレアーゼは特定の分子量範囲を有する。いくつかの実施形態では、エンドヌクレアーゼは、約１２０ｋＤａ以下、約１１０ｋＤａ以下、約１０５ｋＤａ以下、約１００ｋＤａ以下、９５ｋＤａ以下、約９０ｋＤａ以下、約９５ｋＤａ以下、約８０ｋＤａ以下、約７５ｋＤａ以下、約７０ｋＤａ以下、約６５ｋＤａ以下、約６０ｋＤａ以下、約５５ｋＤａ以下、約５０ｋＤａ以下、約４５ｋＤａ以下、約４０ｋＤａ以下、約３５ｋＤａ以下、約３０ｋＤａ以下、約２５ｋＤａ以下、約２０ｋＤａ以下、約１５ｋＤａ以下、または約１０ｋＤａ以下の分子量を有する。場合によっては、操作されたガイドリボ核酸構造は、少なくとも２つのリボ核酸ポリヌクレオチドを含む。場合によっては、エンドヌクレアーゼは、特定の数の残基を含む。エンドヌクレアーゼは、約１，１００以下の残基、約１，０００以下の残基、約９５０以下の残基、約９００以下の残基、約８５０以下の残基、約８００以下の残基、約７５０以下の残基、約７００以下の残基、約６５０以下の残基、約６００以下の残基、約５５０以下の残基、約５００以下の残基、約４５０以下の残基、約４００以下の残基、または約３５０以下の残基を含み得る。エンドヌクレアーゼは、約７００～約１，１００の残基を含み得る。エンドヌクレアーゼは、約４００～約６００の残基を含み得る。

【0111】

いくつかの態様では、本開示は、プロトスペーサー隣接モチーフ（ＰＡＭ）の５’側で、前述の標的遺伝子座の近位に二本鎖切断を引き起こすように構成される、本明細書に記載のエンドヌクレアーゼを提供する。エンドヌクレアーゼは、ＰＡＭから６～８ヌクレオチドまたはＰＡＭから７ヌクレオチドに、二本鎖切断を引き起こし得る。いくつかの態様では、本開示は、プロトスペーサー隣接モチーフ（ＰＡＭ）の５’側で、前述の標的遺伝子座の近位に一本鎖切断を引き起こすように構成される、本明細書に記載のエンドヌクレアーゼを提供する。エンドヌクレアーゼは、ＰＡＭから６～８ヌクレオチドまたはＰＡＭから７ヌクレオチドに、二本鎖切断を引き起こし得る。場合によっては、一本鎖切断を引き起こすように構成されたエンドヌクレアーゼは、本明細書に記載のエンドヌクレアーゼの１つ以上の触媒残基における不活性化変異を含む。

【0112】

いくつかの態様では、本開示は、エンドヌクレアーゼシステムによって標的とされる遺伝子座の内側または近位に、ヌクレオチド塩基の化学修飾を引き起こすように構成された本明細書に記載のエンドヌクレアーゼを提供する。この場合、ヌクレオチド塩基の化学修飾は、一般にヌクレオチドの糖またはリン酸塩部分の修飾ではなく、むしろ塩基対合に関与する化学的部分の修飾を指す。化学修飾は、アデノシンまたはシトシンヌクレオチドの脱アミノを含み得る。場合によっては、化学修飾を引き起こすように構成されたエンドヌクレアーゼシステムは、前述のエンドヌクレアーゼに対して連結されるかまたはフレームに融合される塩基エディターを有するエンドヌクレアーゼを含む。塩基エディターが融合または結合されるエンドヌクレアーゼは、エンドヌクレアーゼの少なくとも１つの触媒残基内（例えば、ＲｕｖＣドメイン内）に、不活性化変異を含み得る。塩基エディターは、前述のエンドヌクレアーゼに対してＮ末端またはＣ末端に融合されるか、または化学的コンジュゲーションを介して連結される場合がある。塩基エディターは、任意のアデノシンまたはシトシンのデアミナーゼを含んでよく、限定されないが、ＡｄｅｎｏｓｉｎｅＤｅａｍｉｎａｓｅＲＮＡＳｐｅｃｉｆｉｃ１（ＡＤＡＲ１）、ＡｄｅｎｏｓｉｎｅＤｅａｍｉｎａｓｅＲＮＡＳｐｅｃｉｆｉｃ２（ＡＤＡＲ２）、ＡｐｏｌｉｐｏｐｒｏｔｅｉｎＢＭＲＮＡＥｄｉｔｉｎｇＥｎｚｙｍｅＣａｔａｌｙｔｉｃＳｕｂｕｎｉｔ１（ＡＰＯＢＥＣ１）、ＡｐｏｌｉｐｏｐｒｏｔｅｉｎＢＭＲＮＡＥｄｉｔｉｎｇＥｎｚｙｍｅＣａｔａｌｙｔｉｃＳｕｂｕｎｉｔ２（ＡＰＯＢＥＣ２）、ＡｐｏｌｉｐｏｐｒｏｔｅｉｎＢＭＲＮＡＥｄｉｔｉｎｇＥｎｚｙｍｅＣａｔａｌｙｔｉｃＳｕｂｕｎｉｔ３Ａ（ＡＰＯＢＥＣ３Ａ）、ＡｐｏｌｉｐｏｐｒｏｔｅｉｎＢＭＲＮＡＥｄｉｔｉｎｇＥｎｚｙｍｅＣａｔａｌｙｔｉｃＳｕｂｕｎｉｔ３Ｂ（ＡＰＯＢＥＣ３Ｂ）、ＡｐｏｌｉｐｏｐｒｏｔｅｉｎＢＭＲＮＡＥｄｉｔｉｎｇＥｎｚｙｍｅＣａｔａｌｙｔｉｃＳｕｂｕｎｉｔ３Ｃ（ＡＰＯＢＥＣ３Ｃ）、ＡｐｏｌｉｐｏｐｒｏｔｅｉｎＢＭＲＮＡＥｄｉｔｉｎｇＥｎｚｙｍｅＣａｔａｌｙｔｉｃＳｕｂｕｎｉｔ３Ｄ（ＡＰＯＢＥＣ３Ｄ）、ＡｐｏｌｉｐｏｐｒｏｔｅｉｎＢＭＲＮＡＥｄｉｔｉｎｇＥｎｚｙｍｅＣａｔａｌｙｔｉｃＳｕｂｕｎｉｔ３Ｆ（ＡＰＯＢＥＣ３Ｆ）、ＡｐｏｌｉｐｏｐｒｏｔｅｉｎＢＭＲＮＡＥｄｉｔｉｎｇＥｎｚｙｍｅＣａｔａｌｙｔｉｃＳｕｂｕｎｉｔ３Ｇ（ＡＰＯＢＥＣ３Ｇ）、ＡｐｏｌｉｐｏｐｒｏｔｅｉｎＢＭＲＮＡＥｄｉｔｉｎｇＥｎｚｙｍｅＣａｔａｌｙｔｉｃＳｕｂｕｎｉｔ３Ｈ（ＡＰＯＢＥＣ３Ｈ）、ｏｒＡｐｏｌｉｐｏｐｒｏｔｅｉｎＢＭＲＮＡＥｄｉｔｉｎｇＥｎｚｙｍｅＣａｔａｌｙｔｉｃＳｕｂｕｎｉｔ４（ＡＰＯＢＥＣ４）、またはそれらの機能的断片を含む。塩基エディターは、酵母、真核生物、哺乳動物、またはヒトの塩基エディターを含み得る。

【0113】

いくつかの態様では、本開示は、エンドヌクレアーゼシステムによって標的とされる遺伝子座の内側または近位に、ヒストンの化学修飾を引き起こすように構成された本明細書に記載のエンドヌクレアーゼを提供する。場合によっては、ヒストンの化学修飾を引き起こすように構成されたエンドヌクレアーゼシステムは、前述のエンドヌクレアーゼに対して連結されるかまたはフレームに融合されるヒストンエディターを有するエンドヌクレアーゼを含む。ヒストンエディターは、エンドヌクレアーゼに対してＮ末端またはＣ末端に連結されるか融合され得る。いくつかの実施形態では、化学修飾は、メチル化、アセチル化、脱メチル化、または脱アセチル化を含み得る。ヒストンエディターが融合または結合されるエンドヌクレアーゼは、エンドヌクレアーゼの少なくとも１つの触媒残基内（例えば、ＲｕｖＣドメイン内）に、不活性化変異を含み得る。ヒストンエディターは、ヒストンメチルトランスフェラーゼ（例えば、ＡＳＨ１Ｌ、ＤＯＴ１Ｌ、ＥＨＭＴ１、ＥＨＭＴ２、ＥＺＨ１、ＥＺＨ２、ＭＬＬ、ＭＬＬ２、ＭＬＬ３、ＭＬＬ４、ＭＬＬ５、ＮＳＤ１、ＰＲＤＭ２、ＳＥＴ、ＳＥＴＢＰ１、ＳＥＴＤ１Ａ、ＳＥＴＤ１Ｂ、ＳＥＴＤ２、ＳＥＴＤ３、ＳＥＴＤ４、ＳＥＴＤ５、ＳＥＴＤ６、ＳＥＴＤ７、ＳＥＴＤ８、ＳＥＴＤ９、ＳＥＴＤＢ１、ＳＥＴＤＢ２、ＳＥＴＭＡＲ、ＳＭＹＤ１、ＳＭＹＤ２、ＳＭＹＤ３、ＳＭＹＤ４、ＳＭＹＤ５、ＳＵＶ３９Ｈ１、ＳＵＶ３９Ｈ２、ＳＵＶ４２０Ｈ１、またはＳＵＶ４２０Ｈ２）、ヒストンデメチラーゼ（例えば、ＫＤＭ１、ＫＤＭ２、ＫＤＭ３、ＫＤＭ４、ＫＤＭ５、またはＫＤＭ６ファミリー）、ヒストンアセチルトランスフェラーゼ（例えば、ＧＮＡＴまたはＨＡＴファミリー・アセチルトランスフェラーゼ）、またはヒストンデアセチラーゼ（例えば、ＨＤＡＣ１、ＨＤＡＣ２、ＨＤＡＣ３、ＨＤＡＣ４、ＨＤＡＣ５、ＨＤＡＣ６、ＨＤＡＣ７、ＨＤＡＣ８、ＨＤＡＣ９、ＨＤＡＣ１０、ＨＤＡＣ１１、ＳＩＲＴ１、ＳＩＲＴ２、ＳＩＲＴ３、ＳＩＲＴ４、ＳＩＲＴ５、ＳＩＲＴ６、またはＳＩＲＴ７）を含み得る。ヒストンエディターは、酵母、真核生物、哺乳動物、またはヒトのヒストンエディターを含み得る。

【0114】

一態様では、本開示は、本明細書に記載の核酸配列を含むベクターを提供する。場合によっては、ベクターは、操作されたガイドリボ核酸構造をコードする核酸をさらに含む。操作されたガイドリボ核酸構造は、エンドヌクレアーゼと複合体を形成するように構成される場合がある。場合によっては、操作されたガイドリボ核酸構造は、ガイドリボ核酸配列を含む。場合によっては、ガイドリボ核酸配列は、標的デオキシリボ核酸配列にハイブリダイズするように構成される。場合によっては、操作されたガイドリボ核酸構造は、ｔｒａｃｒリボ核酸配列を含む。場合によっては、ｔｒａｃｒリボ核酸配列は、エンドヌクレアーゼに結合するように構成される。場合によっては、前述のベクターは、プラスミド、ミニサークル、ＣＥＬｉＤ、アデノ随伴ウイルス（ＡＡＶ）由来のビリオン、またはレンチウイルスである。

【0115】

一態様では、本開示は、本明細書に記載されるベクターのいずれかを含む細胞を提供する。

【0116】

一態様では、本開示は、エンドヌクレアーゼを製造する方法を提供する。方法は、本明細書に記載の細胞のうちのいずれかを培養する工程を含み得る。

【0117】

一態様では、いくつかの態様では、本開示は、二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、標識、または修飾するための方法を提供する。方法は、二本鎖デオキシリボ核酸ポリヌクレオチドをエンドヌクレアーゼに接触させる工程を含み得る。場合によっては、エンドヌクレアーゼはＣａｓエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼはクラス２のエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、クラス２のＩＩ型Ｃａｓエンドヌクレアーゼである。エンドヌクレアーゼは、操作されたガイドリボ核酸構造と複合体化する場合がある。場合によっては、操作されたガイドリボ核酸構造は、エンドヌクレアーゼおよび二本鎖デオキシリボ核酸ポリヌクレオチドに結合するように構成される。場合によっては、二本鎖デオキシリボ核酸ポリヌクレオチドは、プロトスペーサー隣接モチーフ（ＰＡＭ）を含む。場合によっては、エンドヌクレアーゼは、約１２０ｋＤａ以下、約１１０ｋＤａ以下、約１００ｋＤａ以下、９０ｋＤａ以下、約８０ｋＤａ以下、約７０ｋＤａ以下、約６０ｋＤａ以下、約５０ｋＤａ以下、約４０ｋＤａ以下、約３０ｋＤａ以下、約２０ｋＤａ以下、または約１０ｋＤａ以下の分子量を有する。場合によっては、エンドヌクレアーゼは、配列番号１－１９８、２２１－４５９、４６３－６１２、または６１７－６６８のいずれか１つに対して、少なくとも５０％、少なくとも５５％、少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、あるいは少なくとも９９％の配列同一性を有する変異体を含む。

【0118】

一態様では、いくつかの態様では、本開示は、二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、標識、または修飾するための方法を提供する。方法は、二本鎖デオキシリボ核酸ポリヌクレオチドをエンドヌクレアーゼに接触させる工程を含み得る。場合によっては、エンドヌクレアーゼはＣａｓエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼはクラス２のエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、クラス２のＩＩ型Ｃａｓエンドヌクレアーゼである。エンドヌクレアーゼは、操作されたガイドリボ核酸構造と複合体化する場合がある。場合によっては、操作されたガイドリボ核酸構造は、エンドヌクレアーゼおよび二本鎖デオキシリボ核酸ポリヌクレオチドに結合するように構成され得る。場合によっては、二本鎖デオキシリボ核酸ポリヌクレオチドは、プロトスペーサー隣接モチーフ（ＰＡＭ）を含む。場合によっては、ＰＡＭは、ＮＧＧである。場合によっては、エンドヌクレアーゼは、配列番号１－１９８、２２１－４５９、４６３－６１２、または６１７－６６８のいずれか１つに対して、少なくとも５０％、少なくとも５５％、少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９６％、少なくとも９７％、少なくとも９８％、あるいは少なくとも９９％の配列同一性を有する変異体を含む。

【0119】

場合によっては、エンドヌクレアーゼは、Ｃａｓ９エンドヌクレアーゼ、Ｃａｓ１４エンドヌクレアーゼ、Ｃａｓ１２ａエンドヌクレアーゼ、Ｃａｓ１２ｂエンドヌクレアーゼ、Ｃａｓ１２ｃエンドヌクレアーゼ、Ｃａｓ１２ｄエンドヌクレアーゼ、Ｃａｓ１２ｅエンドヌクレアーゼ、Ｃａｓ１３ａエンドヌクレアーゼ、Ｃａｓ１３ｂエンドヌクレアーゼ、Ｃａｓ１３ｃエンドヌクレアーゼ、またはＣａｓ１３ｄエンドヌクレアーゼではない。場合によっては、エンドヌクレアーゼは、難培養性微生物由来である。場合によっては、前述の二本鎖デオキシリボ核酸ポリヌクレオチドは、原核生物、古細菌、細菌、真核生物、植物、真菌、哺乳動物、げっ歯類、またはヒトの二本鎖デオキシリボ核酸ポリヌクレオチドである。場合によっては、二本鎖デオキシリボ核酸ポリヌクレオチドは、エンドヌクレアーゼが由来する種以外の種に由来する原核生物、古細菌、または細菌の二本鎖デオキシリボ核酸ポリヌクレオチドである。

【0120】

一態様では、本開示は、標的核酸遺伝子座を改変する方法を提供する。方法は、本明細書に記載の操作されたヌクレアーゼシステムを標的核酸遺伝子座に送達する工程を含み得る。場合によっては、エンドヌクレアーゼは、操作されたガイドリボ核酸構造との複合体を形成するように構成される。場合によっては、複合体は、該複合体が標的核酸遺伝子座に結合すると、該複合体が標的核酸遺伝子座を改変するように、構成される。場合によっては、標的核酸遺伝子座を改変することは、標的核酸遺伝子座を結合、ニッキング、切断、標識することを含む。

【0121】

場合によっては、標的核酸遺伝子座は、デオキシリボ核酸（ＤＮＡ）またはリボ核酸（ＲＮＡ）を含む。場合によっては、標的核酸は、ゲノム真核生物ＤＮＡ、ウイルスＤＮＡ、または細菌ＤＮＡを含む。場合によっては、標的核酸は、細菌ＤＮＡを含む。細菌ＤＮＡは、エンドヌクレアーゼが由来する種と異なる細菌種に由来する場合がある。場合によっては、標的核酸遺伝子座はインビトロにある。場合によっては、核酸遺伝子座は細胞内にある。場合によっては、エンドヌクレアーゼおよび操作されたガイド核酸構造は、提供され、別々の核酸分子によってコードされる。場合によっては、細胞は、原核細胞、細菌細胞、真核細胞、真菌細胞、植物細胞、動物細胞、哺乳動物細胞、げっ歯類細胞、霊長類細胞、またはヒト細胞である。場合によっては、細胞は、エンドヌクレアーゼが由来する種とは異なる種に由来する、

【0122】

場合によっては、標的核酸遺伝子座に操作されたヌクレアーゼシステムを送達する工程は、本明細書に記載される核酸の、または本明細書に記載されるベクターを送達することを含む。場合によっては、操作されたヌクレアーゼシステムを標的核酸遺伝子座に送達する工程は、エンドヌクレアーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されるプロモーターを含む。場合によっては、操作されたヌクレアーゼシステムを標的核酸遺伝子座に送達する工程は、エンドヌクレアーゼをコードするオープンリーディングフレームを含有するキャッピングしたｍＲＮＡを送達することを含む。場合によっては、操作されたヌクレアーゼシステムを前述の標的核酸遺伝子座に送達する工程は、翻訳されたポリペプチドを送達することを含む。

【0123】

場合によっては、操作されたヌクレアーゼシステムを標的核酸遺伝子座に送達する工程は、リボ核酸（ＲＮＡ）ｐｏｌＩＩＩプロモーターに動作可能に連結される操作されたガイドリボ核酸構造をコードするデオキシリボ核酸（ＤＮＡ）を送達することを含む。場合によっては、エンドヌクレアーゼは、標的遺伝子座に、またはその近位に、一本鎖切断または二本鎖切断を引き起こす。

【0124】

例えば、本開示のシステムは、例えば、核酸編集（例えば、遺伝子編集）、核酸分子への結合（例えば、配列特異的結合）などの、各種用途のために使用され得る。このようなシステムは、例えば、ウイルスゲノムを標的とすることでウイルスを不活性化したり、宿主細胞に感染できないようにしたりするために、価値の高い低分子、高分子、または二次代謝産物を生成するように生物を操作するべく遺伝子を追加したり、代謝経路を変更したりするために、進化的選択のための遺伝子駆動要素を確立するために、バイオセンサーとして外来の低分子およびヌクレオチドによる細胞摂動を検出するために、特定のヌクレオチド配列（例えば、細菌における抗生物質耐性をコードする配列）を標的とするとともに検出するためにプローブと組み合わせた不活性化酵素のように、疾患を引き起こす遺伝的要素を検出するための診断ツールとして（例えば、逆転写されたウイルスＲＮＡまたは疾患を引き起こす突然変異をコードする増幅されたＤＮＡ配列の切断を介して）、被験体において疾患を引き起こす可能性のある遺伝的に受け継がれた突然変異をアドレス指定（例えば、除去または置換）して、遺伝子を不活性化することで細胞内での遺伝子の機能を確認するために使用されてもよい。

【実施例】

【0125】

実施例１．メタゲノミクスによる新しいＣａｓエフェクターの発見
メタゲノムマイニング（ＭｅｔａｇｅｎｏｍｉｃＭｉｎｉｎｇ）
メタゲノムのサンプルを堆積物、土、および動物から収集した。デオキシリボ核酸（ＤＮＡ）はＺｙｍｏｂｉｏｍｉｃｓＤＮＡｍｉｎｉ－ｐｒｅｐｋｉｔで抽出し、ＩｌｌｕｍｉｎａＨｉＳｅｑ^{（登録商標）}２５００で配列決定した。サンプルは、土地所有者の承諾のもと収集された。ＱｉａｇｅｎＤＮｅａｓｙＰｏｗｅｒＳｏｉｌＫｉｔまたはＺｙｍｏＢＩＯＭＩＣＳＤＮＡＭｉｎｉｐｒｅｐＫｉｔを用いて、サンプルよりＤＮＡを抽出した。ＤＮＡは、配列決定ライブラリ作成（ＩｌｌｕｍｉｎａＴｒｕＳｅｑ）およびＩｌｌｕｍｉｎａＨｉＳｅｑ４０００またはＮｏｖａｓｅｑでの配列決定のために、ＵＣＢｅｒｋｅｌｅｙのＶｉｎｃｅｎｔＪ．ＣｏａｔｅｓＧｅｎｏｍｉｃｓＳｅｑｕｅｎｃｉｎｇＬａｂｏｒａｔｏｒｙへ送られた（１５０塩基対（ｂａｓｅｐａｉｒ）（ｂｐ）リード、標的挿入サイズ４００～８００ｂｐ）。さらに、一般に公開されている高温、ならびに土壌と海洋のメタゲノム配列データをＮＣＢＩＳＲＡからダウンロードした。ＢＢＭａｐ（ＢｕｓｈｎｅｌｌＢ．，ｓｏｕｒｃｅｆｏｒｇｅ．ｎｅｔ／ｐｒｏｊｅｃｔｓ／ｂｂｍａｐ／）を使用して配列決定リードをトリミングし、およびＭｅｇａｈｉｔ（ｈｔｔｐｓ：／／ｐａｐｅｒｐｉｌｅ．ｃｏｍ／ｃ／ＱＳＺＧ６Ｋ／ｃｌＭｒｈ）でアセンブルした。タンパク質の配列をＰｒｏｇｄｉｇａｌ（ｈｔｔｐｓ：／／ｐａｐｅｒｐｉｌｅ．ｃｏｍ／ｃ／ＱＳＺＧ６Ｋ／ＢＪ６ｏＷ）で予測した。既知のＩＩ型ＣＲＩＳＰＲヌクレアーゼのＨＭＭプロファイルを構築し、ＨＭＭＥＲ３（ｈｍｍｅｒ．ｏｒｇ）を使用して全予測タンパク質に対して検索を行った。Ｍｉｎｃｅｄ（ｈｔｔｐｓ：／／ｇｉｔｈｕｂ．ｃｏｍ／ｃｔＳｋｅｎｎｅｒｔｏｎ／ｍｉｎｃｅｄ＞またはｈｔｔｐｓ：／／ｐａｐｅｒｐｉｌｅ．ｃｏｍ／ｃ／ＱＳＺＧ６Ｋ／ＯＰＣ４４）でアセンブルしたコンティグに対してＣＲＩＳＰＲアレイを予測した。Ｋａｉｊｕｈｔｔｐｓ：／／ｐａｐｅｒｐｉｌｅ．ｃｏｍ／ｃ／ＱＳＺＧ６Ｋ／ｎＭｉ６ｋを用いて分類を割り当て、すべてのコードされたタンパク質のコンセンサスを見つけることによりコンティグ分類を決定した。

【0126】

ＩＩ型エフェクタータンパク質の予測されたものと標準（ＳｐＣａｓ９，ＳａＣａｓ９，ＡｓＣａｓ９など）とをＭＡＦＦＴ（ｈｔｔｐｓ：／／ｐａｐｅｒｐｉｌｅ．ｃｏｍ／ｃ／ＱＳＺＧ６Ｋ／ｓＶＨＮＨ）でアラインメントし、ＦａｓｔＴｒｅｅ２（ｈｔｔｐｓ：／／ｐａｐｅｒｐｉｌｅ．ｃｏｍ／ｃ／ＱＳＺＧ６Ｋ／ｏｓＺＮＭ）を使用して系統樹を推測した。本研究で回収した配列から構成されるクレードから、新規のファミリーを同定した。ファミリーの中から、実験室での解析に必要な要素をすべて含むものを候補として選択した（すなわち、十分にアセンブルされアノテーション付けされたコンティグにおいてＣＲＩＳＰＲアレイを用いて見出した）。選択した代表配列と標準配列をＭＵＳＣＬＥ（ｈｔｔｐｓ：／／ｐａｐｅｒｐｉｌｅ．ｃｏｍ／ｃ／ＱＳＺＧ６Ｋ／ＩＴＯｌａ）を用いてアラインメントし、触媒残基とＰＡＭ相互作用残基を同定した。

【0127】

このメタゲノム解析のワークフローは、本明細書に記載のＳＭＡＲＴ（ＳＭａｌｌＡＲｃｈａｅａｌ－ａｓｓｏｃｉａＴｅｄ）エンドヌクレアーゼシステムの描写をもたらした。

【0128】

活性残基シグネチャーを有するＳＭＡＲＴエンドヌクレアーゼの発見メタゲノムデータから構築された数万の高品質なＣＲＩＳＰＲＣａｓシステムをマイニングした結果、ＲｕｖＣとＨＮＨドメインの両方を含むがサイズが異常に小さい（９００ａａ）新規エフェクターを発見した。これらのエフェクターヌクレアーゼは、古細菌のＣａｓ９エンドヌクレアーゼと低い配列類似性（アミノ酸同一性２０％未満）しか示さなかった。エフェクタータンパク質の配列の系統解析は、ＳＭＡＲＴシステムは、亜型Ａ、Ｂ、Ｃのよく研究されているＩＩ型システムと比較して、分岐したグループであることを示した（図１Ａ）。

【0129】

これらのコンパクトな「ＳＭＡＲＴ」エフェクター（～４００－１０００アミノ酸、図２）は、ＣＲＩＳＰＲアレイに隣接するゲノムの遺伝子座に出現した。これらの隣接するＳＭＡＲＴ遺伝子座のいくつかは、ｔｒａｃｒＲＮＡとＣＲＩＳＰＲ適応遺伝子（例えば、スペーサー獲得に関わる遺伝子）ｃａｓ１、ｃａｓ２、および／またはｃａｓ４をコードすることが予測される配列も同じオペロン内に含んだ（図３）。コンパクトなサイズにもかかわらず、ＳＭＡＲＴエフェクターは、基準ＳａＣａｓ９配列（図４）とアラインメントされる時、６つの推定のＨＮＨおよびＲｕｖＣ触媒残基を包含する。さらに、３Ｄ構造予測は、ガイドおよび標的の結合に、ならびにＰＡＭの認識にも関与する残渣を同定し、ＳＭＡＲＴエフェクターが活性なｄｓＤＮＡエンドヌクレアーゼであることを示唆した。

【0130】

ＳＭＡＲＴエンドヌクレアーゼの多数のグループ重要な触媒残基および結合残基の位置に基づき、ＳＭＡＲＴヌクレアーゼは、３つのＲｕｖＣ領域、ＲＲｘＲＲモチーフ（例えば、ＰＦ１４２３９相同を有する領域）を通常含んでいるアルギニンリッチ領域、ＨＮＨエンドヌクレアーゼドメインおよび推定の認識領域を含む（図５および図６）。これらのドメインは、基準配列との低い配列類似性を共有する（図７）。加えて、ＳＭＡＲＴエフェクター、ならびに基準古細菌配列は、Ｃａｓ９ヌクレアーゼよりも有意に頻繁にＲＲｘＲＲモチーフおよび亜鉛結合リボンモチーフ（ＣＸ_{［２－４］}ＣあるいはＣＸ_{［２－４］}Ｈ）を包含する（図８）。加えて、Ｃａｓ９エフェクター配列と異なり、ほとんどのＳＭＡＲＴエフェクターは、ＰｆａｍドメインＰＦ１４２３９に対する有意なヒットを包含し、それはしばしば多様なエンドヌクレアーゼに関連付けられる。ＳＭＡＲＴエフェクターのサイズにおける差異、系統発生の関係性、およびオペロンとドメインアーキテクチャの両方に基づいて、これらのシステムを２つの一次集団、ＳＭＡＲＴＩとＳＭＡＲＴＩＩに分類した。これらの群の顕著な特徴は、表３に下に概説され、ここではクラス２のＩＩ型Ａ／Ｂ／ＣＣａｓ酵素と比較して、差異も例示される。

【0131】

【表3】

【0132】

ＳＭＡＲＴＩエンドヌクレアーゼ
ＳＭＡＲＴＩエフェクターのサイズは、およそ７００アミノ酸～１，０５０アミノ酸の間の範囲に及ぶ。それらのゲノムコンテキストにおける共通の特徴は、適応モジュール遺伝子（例えば、スペーサーの獲得に関与する遺伝子）、およびＣＲＩＳＰＲアレイの近くの予測されたｔｒａｃｒＲＮＡｓであり、その機構は、ＩＩ型およびＶ型ＣＲＩＳＰＲシステム（図３Ａ、３Ｂ、および３Ｃ）に似ていた。ＳＭＡＲＴＩエフェクターにおけるＲＲＸＲＲモチーフ包含領域は、固有のものであるが、Ｃａｓ９ヌクレアーゼにおけるアルギニンリッチなブリッジヘリックスと類似する機能的な役割を果たし得る。ＳａＣａｓ９結晶構造に対してモデル化された時、ＳＭＡＲＴＩエフェクターの予測された３Ｄ構造は、認識ローブ内のアラインメントされていない領域（しばしばＰｆａｍドメインＰＦ１４２３９を包含する）、およびＲｕｖＣＩＩドメインを示した（図５）。結果は、これらのドメインが他のＩＩ型エフェクターとは異なる起源を有していることを示した。ＩＩ型エフェクター系統樹におけるそれらの分岐配置、および既知のＩＩ型エフェクターとの低い配列類似性と総合すると（図１Ａ）、これらの結果は、ＳＭＡＲＴＩエンドヌクレアーゼがＩＩ型ＣＲＩＳＰＲシステムの新しい群に属することを示す。ＣＲＩＳＰＲシステムの受容された分類に従って、これらのＳＭＡＲＴＩシステムはＩＩ－Ｄ型として分類された。

【0133】

推定の単一のガイドＲＮＡ（ｓｇＲＮＡ）は、ＳＭＡＲＴＩＭＧ３４－１システムについての環境的ＲＮＡ発現データを使用して操作された。加えて、Ｉが繰り返すＳＭＡＲＴとｔｒａｃｒＲＮＡ予測から設計された複数のｓｇＲＮＡｓは、ＰＡＭ濃縮アッセイにおいてインビトロで試験された。ＳＭＡＲＴＩ酵素の場合、ＰＡＭ配列の最適な同定は、この工程で端末修復と平滑末端ライゲーションを使用して行なわれ、これらの酵素が突出した（ｓｔａｇｇｅｒｅｄ）二本鎖ＤＮＡ切断をもたらすことができることを示唆した。アッセイは、ＭＧ３４－１（配列番号２）、ＭＧ３４－９（配列番号９）、および複数のｓｇＲＮＡ設計を伴う（図７、配列番号６１２－６１５の使用を表わす）ＭＧ３４－１６（配列番号１７）に対するｄｓＤＮＡ切断を確認した。ＭＧ３４－１は、ＮＧＧＮＰＡＭに対する、標的認識と切断のプレファレンスを実証した（図８Ａ）。切断部位の解析は、位置７での選択的な切断を示した（図８Ｂ）。これらの結果はＰＡＭから２～３位置で選択的に切断する他のＩＩ型酵素の切断機構との比較で、新規な生化学的機構を示唆し、ＳＭＡＲＴＩＣＲＩＳＰＲシステムについて新しい分類を支持する。

【0134】

いくつかのＳＭＡＲＴＩシステムのための環境的発現データは、予測されたｔｒａｃｒＲＮＡ（図３Ｂと３Ｃ）をコードする、ＣＲＩＳＰＲアレイと遺伝子間領域のイン・シトゥー転写を確認した。さらに、ＣＲＩＳＰＲターゲティングが活発に行われている事例を、同一または関連するメタゲノムからアセンブルされた他のゲノム配列と一致するスペーサー配列を検索することにより評価した。これに伴い、ＳＭＡＲＴＩＣＲＩＳＰＲアレイにおいてコードされるスペーサーの１つによって標的とされるファージゲノムが同定された（図３Ｃおよび図３Ｄ）。標的配列に隣接する領域の解析は、ＧＧモチーフを包含する３’ＰＡＭ配列を示唆した（図３Ｄ）。これらの結果は、ＳＭＡＲＴＩＣＲＩＳＰＲシステムが、ファージ防御に関わるＲＮＡガイドエフェクターとして自然環境下で活性があり、標的ＤＮＡまたはＲＮＡを切断または分解するヌクレアーゼとして機能する可能性が高いことを示す。

【0135】

ＳＭＡＲＴＩエフェクターは、活性な、ＲＮＡ誘導ｄｓＤＮＡＣＲＩＳＰＲエンドヌクレアーゼであるＳＭＡＲＴＩＭＧ３４－１システムおよびＭＧ３４－１６システム（図３Ｂおよび図３Ｃ、ならびに図９）の環境ＲＮＡ発現データを用いて、推定上の単一ガイドＲＮＡ（ｓｇＲＮＡ）を設計した。さらに、ＳＭＡＲＴＩリピートおよびｔｒａｃｒＲＮＡの予測から設計された複数のｓｇＲＮＡを、インビトロのＰＡＭ濃縮アッセイでテストした（図１０）。アッセイでは、ＭＧ３４－１、ＭＧ３４－９、および複数のｓｇＲＮＡ設計を有するＭＧ３４－１６に対するプログラム可能なｄｓＤＮＡ切断が確認された（図１０）。ＭＧ３４－１およびＭＧ３４－９は、標的の認識と切断のためにＮＧＧＮＰＡＭを必要とする（図１１Ａおよび図１１Ｃ）。切断部位の解析は、７位置での選択的な切断を示した（図１１Ｂおよび図１１Ｃ）。これらの結果は、ＰＡＭから３位置で選択的に切断するＣａｓ９酵素の切断機構との比較で、新規な生化学的切断機構を示唆し、およびＳＭＡＲＴＩＣＲＩＳＰＲシステムについて新しい分類をさらに支持する。

【0136】

端末修復工程のないＰＡＭ濃縮アッセイは、ＳＭＡＲＴＩヌクレアーゼについて活性を示さなかった。ＰＡＭ濃縮プロトコルでライゲーション前に平滑末端フラグメントを作るために末端修復を必要とすることは、これらの酵素が突出した（ｓｔａｇｇｅｒｅｄ）二本鎖ＤＮＡ切断を生じることを示している。

【0137】

大腸菌で行った実験では、当該システムは細胞内でヌクレアーゼとして機能するために必要な活性を持つことが確認された。ＭＧ３４－１とｓｇＲＮＡを発現している大腸菌を、ｓｇＲＮＡの標的を含むカナマイシン耐性プラスミドで形質転換した。抗生物質が存在する場合、抗生物質耐性プラスミドの標的化と切断に成功すると、成長異常をもたらすことになる。このアッセイでは、ｓｇＲＮＡの標的を含まないカナマイシン耐性プラスミドで行った対照実験との比較で、約２倍の成長抑制が確認された（図１２）。

【0138】

ＳＭＡＲＴＩＩエンドヌクレアーゼ
ＳＭＡＲＴＩＩエフェクターは、ＳＭＡＲＴＩエフェクターに比較して、より小さいほうへ偏ったサイズ分布を有する（～４００アミノ酸－６００のアミノ酸）。それらのゲノムコンテキストは、普通でない反復領域またはＣＲＩＳＰＲアレイを示唆した。非ＣＲＩＳＰＲの反復領域は、約１０から３０ｂｐの範囲にわたるにサイズのダイレクトリピートを包含する。場合によっては、これらは複数の異なる反復単位を含む。時には、共通のＣＲＩＳＰＲ同定アルゴリズムはＣＲＩＳＰＲシステムとしてこれらの領域にフラグを立てるだろうが、しかしながら、より綿密な調査は、スペーサー配列として同定された領域がアレイにおいて繰り返されることを明らかにするだろう。アレイは、エフェクターに直ちに隣接していないが、それらは同じゲノム領域にある。（図３Ａ、ＭＧ３５－２３６および図１３Ａ、例えば、エフェクター遺伝子から＞２０ｋｂ））。ＳＭＡＲＴＩＩシステムのオペロンは、適応モジュール遺伝子（例えば、スペーサーの獲得に関与する遺伝子）を一般に欠いていた。

【0139】

構造予測により、クラス２のＩＩ型Ｃａｓエフェクターにしばしば見られる６つすべてのＲｕｖＣおよびＨＮＨヌクレアーゼ触媒残基に加え、ガイドＲＮＡ結合、標的切断、およびＰＡＭの認識と相互作用に関わるＣａｓ酵素の特徴的残基が同定された（図６）。また、ＳＭＡＲＴＩＩエフェクターは、複数のＲＲＸＲＲと亜鉛結合リボンモチーフ（ＣＸ_{［２－４］}ＣまたはＣＸ_{［２－４］}Ｈ）を包含したが、これらは標的核酸モチーフの認識と結合に関与している可能性がある。重要な残基の位置に基づいて、ＳＭＡＲＴＩＩヌクレアーゼの予測されるドメイン構造は、３つのＲｕｖＣサブドメイン、ＲＲｘＲＲモチーフを含むアルギニンリッチな領域（例えば、ＰＦ１４２３９相同性を持つドメイン）、ＨＮＨエンドヌクレアーゼドメイン、未知ドメイン、および認識ドメイン（ＲＥＣ）から成った（図６）。ＳＭＡＲＴＩＩエフェクターのドメインアーキテクチャは、ＩＩ型Ｃａｓ９ヌクレアーゼの既知のドメインアーキテクチャとは異なっていた（図６および図１４）。

【0140】

いくつかのＳＭＡＲＴＩＩシステムの環境トランスクリプトームデータでは、自然環境におけるＣＲＩＳＰＲアレイおよびその他の繰り返し領域の発現がインサイチュで確認された（図１３Ａ）。いくつかのＳＭＡＲＴＩＩエフェクターの５’非翻訳領域（ＵＴＲ）の転写も、環境発現データから観察され（図１３Ｂ）、この領域がヌクレアーゼ活性またはＳＭＡＲＴシステムの調整のいずれかにとって重要である可能性が示唆された。

【0141】

ＳＭＡＲＴＩＩエフェクタータンパク質、反復領域、および関連する遺伝子間領域を用いて行われた予備的なインビトロ実験は、これらの酵素が、おそらくプログラム可能な方法でｄｓＤＮＡを切断する能力を有するかもしれないことを示している（図１５参照）。結果は、ＳＭＡＲＴＩＩのヌクレアーゼ活性が、ＲＮＡおよび／またはＤＮＡにガイドされ、ＣＲＩＳＰＲアレイのような繰り返し領域を使用すること、またはＴＩＲや５’ＵＴＲなどの遺伝子座内にコードされた特徴の認識を必要とすることが示唆された。

【0142】

いくつかのＳＭＡＲＴＩＩエフェクターは、トランスポザーゼＴｎｐＡとＴｎｐＢをコードする推定挿入配列（ＩＳ）に隣接して観察された（図３Ａ）。ＩＳの端末は、予測されたＵ字型の構造で端末逆くり返し配列（ｔｅｒｍｉｎａｌｉｎｖｅｒｔｅｄｒｅｐｅａｔ）（ＴＩＲ）を包含しているものと判断され、およびＩＳが組み込まれる可能性が最も高い標的部位重複も特定された。さらに、いくつかのＳＭＡＲＴＩＩ遺伝子座は、ＳＭＡＲＴＩＩエフェクターを挟む推定ＴＩＲをコードした（例えば、図３）。

【0143】

実施例２．本明細書に記載されたエンドヌクレアーゼのＰＡＭ配列の同定／確認
大腸菌溶解液ベースの発現システム（ＰＵＲＥｘｐｒｅｓｓ，ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）で推定ＳＭＡＲＴエンドヌクレアーゼを発現させた。このシステムでは、エンドヌクレアーゼは、大腸菌に最適化され、Ｔ７プロモーターおよびＣ末端Ｈｉｓタグを有するベクターにクローン化されたコドンだった。それぞれ、Ｔ７プロモーターから１５０ｂｐ上流および下流のプライマー結合部位とターミネーター配列を用いて遺伝子をＰＣＲ増幅した。このＰＣＲ産物をＮＥＢＰＵＲＥｘｐｒｅｓｓに加え、５ｎＭの終末濃度および３７度で２時間発現させ、ＰＡＭアッセイのためのエンドヌクレアーゼを産生させた。

【0144】

本明細書に記載の各ＳＭＡＲＴＣａｓ酵素と適合する推定のｓｇＲＮＡｓを、配列決定データからアセンブルされたコンティグＣＲＩＳＰＲ遺伝子座に対してアセンブルされたＲＮＡｓｅｑリードから同定し、ＲＮＡｓｅｑデータからのｔｒａｃｒ領域ならびにＧｅｎｅｉｏｕｓソフトウェア・パッケージ（ｈｔｔｐｓ：／／ｗｗｗ．ｇｅｎｅｉｏｕｓ．ｃｏｍ）のＣＲＩＳＰＲアレイからリピート配列について、二次構造を決定し、および、最終的なヘリックスをトリミングし、ＧＡＡＡテトラ・ループに連結した。複数の長さのリピート－アンチリピートヘリックスのトリミング、ならびに、異なるスペーサー長さおよび異なるｔｒａｃｒ伸長停止ポイントを試験した（図１２、配列番号６１２－６１５を実証）。その後、アセンブリＰＣＲを介してｓｇＲＮＡをアセンブルし、ＳＰＲＩビーズを用いて精製し、および、メーカーに推奨される短いＲＮＡ転写物のためのプロトコル（ＨｉＳｃｒｉｂｅＴ７キット、ＮＥＢ）に従い、インビトロで転写した（ＩＶＴ）。ＲＮＡ転写反応物をＭｏｎａｒｃｈＲＮＡキットで浄化し、Ｔａｐｅｓｔａｔｉｏｎ（Ａｇｉｌｅｎｔ）を介して純度をチェックした。

【0145】

推定ヌクレアーゼにより切断可能なランダム生成された候補ＰＡＭ配列を包含する配列決定プラスミドにより、ＰＡＭ配列を決定した。このシステムにおいて、インビトロで、Ｔ７プロモーターの制御下にあるＰＣＲ断片から、大腸菌コドンに最適化された、推定ヌクレアーゼをコードするヌクレオチド配列が転写され、翻訳された。Ｔ７プロモーターとそれに続くリピート－スペーサー－リピート配列からなる最小限のＣＲＩＳＰＲアレイを有する第２のＰＣＲ断片は、同じ反応で転写された。ＣＲＩＳＰＲアレイ処理が後続するＴＸＴＬシステムでのエンドヌクレアーゼとリピート－スペーサー－リピート配列の優れた発現は、活性なインビトロのＣＲＩＳＰＲヌクレアーゼ複合体をもたらした。

【0146】

８Ｎ混合縮重塩基（可能性のあるＰＡＭ配列）に先行される最小限のアレイ内の配列に一致するスペーサー配列を包含する標的プラスミドのライブラリを、それを一致するスペーサー配列を、ＴＸＴＬ反応産物（翻訳されたＣａｓ酵素の５倍希釈液を伴う１０ｍＭＴｒｉｓｐＨ７．５、１００ｍＭＮａＣｌ、および１０ｍＭＭｇＣｌ_２、８ＮのＰＡＭプラスミドライブラリ５ｎＭ、および上記ＰＡＭライブラリを標的とするｓｇＲＮＡ５０ｎＭ）とともにインキュベートした。１～３時間後、反応を停止し、そしてＤＮＡクリーンアップ・キットを介してＤＮＡを回収した。アダプター配列は、エンドヌクレアーゼによって切断された活性なＰＡＭ配列を用いるＤＮＡに連結された、切断されていなかったＤＮＡがライゲーションのためのアクセス不能だった平滑末端だった。その後、活性なＰＡＭ配列を含むＤＮＡセグメントをライブラリおよびアダプター配列に特異的なプライマーを用いるＰＣＲによって増幅した。切断事象に対応するアンプリコンを同定するために、ＰＣＲ増幅産物をゲルに溶解させた。切断反応の増幅されたセグメントは、鋳型としてＮＧＳライブラリ調製のための鋳型、またはサンガー配列決定の基質としても使用された。この結果として生じたライブラリは、出発の８Ｎライブラリのサブセットであるが、ＣＲＩＳＰＲ複合体に適合するＰＡＭ活性を伴う配列を明らかにした。処理されたＲＮＡ構築物を用いるＰＡＭ試験については、インビトロの転写されたＲＮＡがプラスミドライブラリと共に添加される点と、最小限のＣＲＩＳＰＲアレイ／ｔｒａｃｒ鋳型が除外されるという点とを除いて、同じ手順を反復した。これらのアッセイでは、標的として以下のスペーサー配列を使用した（５’－ＣＧＵＧＡＧＣＣＡＣＣＡＣＧＵＣＧＣＡＡＧＣＣＵＣＧＡＣ－３’）。

【0147】

ＰＡＭアッセイから生のシーケンスリードを得た後、リードをＰｈｒｅｄｑｕａｌｉｔｙｓｃｏｒｅ＞２０でフィルタリングした。ＰＡＭに隣接するバックボーン由来の既知のＤＮＡ配列を表わす２４ｂｐを基準として使用して、ＰＡＭ近位領域を見つけ、隣接する８ｂｐを推定ＰＡＭとして特定した。また、各リードについて、ＰＡＭとライゲーションアダプター間の距離も測定した。基準配列またはアダプター配列と完全に一致しないリードを除外した。最も頻度の高い切断部位±２ｂｐを有するＰＡＭのみが解析に含まれるように、切断部位の頻度でＰＡＭ配列をフィルタリングした。ＰＡＭのフィルタリングされたリストを使用して、Ｌｏｇｏｍａｋｅｒにより配列ロゴを生成した（ＴａｒｅｅｎＡ，ＫｉｎｎｅｙＪＢ．Ｌｏｇｏｍａｋｅｒ：ｂｅａｕｔｉｆｕｌｓｅｑｕｅｎｃｅｌｏｇｏｓｉｎＰｙｔｈｏｎ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２０２０；３６（７）：２２７２－２２７４、参照により本明細書に組み込まれる）。

【0148】

実施例３．予測されたＲＮＡ折り畳みのためのプロトコル
活性な単一のＲＮＡ配列の予測されるＲＮＡ折りたたみを、Ａｎｄｒｏｎｅｓｃｕ２００７の方法を使用して、３７度にて計算した。塩基の色は、その塩基の塩基対合の確率に対応し、ここで赤は高い確率であり、青は低い確率である。

【0149】

実施例４．インビトロの切断効率
エンドヌクレアーゼを、プロテアーゼ欠損大腸菌Ｂ株における誘導可能なＴ７プロモーターから、Ｈｉｓタグ付き融合タンパク質として発現させた。エンドヌクレアーゼを、２つの核移行シグナル（Ｎ末端ＮＬＳヌクレオプラスミン双節、およびＣ末端シミアンウイルス４０Ｔ抗原ＮＬＳＰＰＫＫＫＲＫ）、マルトース結合タンパク質（ＭＢＰ）タグ、タバコエッチウイルス（ＴＥＶ）プロテアーゼ切断部位、および６ＸＨｉｓタグに、Ｎ末端からＣ末端に６ＸＨｉｓ－ＭＢＰ－ＴＥＶ－ＮＬＳ－ｇｅｎｅ－ＮＬＳ－ＳＴＯＰの順で、融合させた。このタンパク質を、ＮＥＢＩｑ大腸菌におけるｐＴａｃプロモーターのもとで、自己誘導培地（ＭａｇｉｃＭｅｄｉａＴｈｅｒｍｏＦｉｓｈｅｒ）により発現させ、３０℃で成長させ、１６℃でインキュベートした。

【0150】

Ｈｉｓタグ付きタンパク質を発現する細胞を、音波粉砕によって溶解させ、そのＨｉｓタグ付きタンパク質を、ＡＫＴＡＡｖａｎｔＦＰＬＣ（ＧＥＬｉｆｅｓｃｉｅｎｃｅ）において、でＨｉｓＴｒａｐＦＦカラム（ＧＥＬｉｆｅｓｃｉｅｎｃｅ）上のＮｉ－ＮＴＡ親和クロマトグラフィーによって精製した。溶出液を、アクリルアミド・ゲル（Ｂｉｏ－Ｒａｄ）上のＳＤＳ－ＰＡＧＥによって分析し、ＩｎｓｔａｎｔＢｌｕｅＵｌｔｒａｆａｓｔＣｏｏｍａｓｓｉｅ（Ｓｉｇｍａ－Ａｌｄｒｉｃｈ）で染色した。。ＩｍａｇｅＬａｂソフトウェア（Ｂｉｏ－Ｒａｄ）によるタンパク質バンドのデンシトメトリーを使用して、純度を求めた。精製されたエンドヌクレアーゼを、５０ｍＭのＴｒｉｓ－ＨＣｌ、３００ｍＭのＮａＣｌ、１ｍＭのＴＣＥＰ、５％グリセロールからなる、ｐＨ７．５のストレージ緩衝液中に透析し、－８０℃で保存した。

【0151】

スペーサー配列とＰＡＭ配列（例えば、実施例２で求められた）を含有している標的ＤＮＡを、ＤＮＡ合成によって構築した。ＰＡＭが縮重塩基を有するとき、単一の代表的なＰＡＭを選択する。標的ＤＮＡは、プラスミドからＰＣＲ増幅によって得られた２２００ｂｐの線状ＤＮＡからなり、一端から７００ｂｐのところにＰＡＭとスペーサーが配置されている。切断に成功すると、７００ｂｐと１５００ｂｐの断片が得られる。標的ＤＮＡ、インビトロで転写された単一ＲＮＡ、および精製された組換えタンパク質を、過剰のタンパク質とＲＮＡを含む切断バッファ（１０ｍＭＴｒｉｓ，１００ｍＭＮａＣｌ，１０ｍＭＭｇＣｌ_２）中で組み合わせ、５分～３時間、通常は１時間、インキュベートする。ＲＮＡｓｅＡの添加により、６０分のインキュベーションの後、反応を停止する。その後、その反応物を１．２％のＴＡＥアガロースゲル上で分析し、切断されたターゲットＤＮＡ断片をＩｍａｇｅＬａｂソフトウェアで定量した。

【0152】

実施例５．大腸菌における活性
大腸菌は、効率的に二本鎖ＤＮＡ切断を修復する能力を欠く。従って、ゲノムＤＮＡの切断は致死事象であり得る。この現象を利用して、ゲノムＤＮＡにスペーサー／ターゲット配列とＰＡＭ配列を組み込んだ標的株において、エンドヌクレアーゼとガイドＲＮＡを組換え発現させることにより、大腸菌でエンドヌクレアーゼの活性をテストする。

【0153】

細菌細胞におけるヌクレアーゼ活性を試験するために、ＢＬ２１（ＤＥ３）株（ＮＥＢ）を、Ｔ７駆動エフェクターとｓｇＲＮＡを包含するプラスミド（各プラスミド１０ｎｇ）を用いて形質転換し、プレートに接種し、夜通し増殖させた。最終的なコロニーは、３回繰り返して夜通し培養され、次にＳＯＢにおいて二次培養され、ＯＤ０．４～０．６まで増殖させた。ＯＤ０．５相当の細胞培養物を標準キットプロトコル（ＺｙｍｏＭｉｘａｎｄＧｏｋｉｔ）に従って化学合成し、バックボーンにスペーサーとＰＡＭを含むか含まないかのいずれかの１３０ｎｇのカナマイシンプラスミドで形質転換した。熱ショック後、形質転換体をＳＯＣ中で、１時間３７℃で回収し、誘導培地（抗生物質と０．０５ｍＭＩＰＴＧを含むＬＢ寒天プレート）で培養した５倍希釈系列によりヌクレアーゼ効率を決定した。コロニーを希釈系列から定量し、ヌクレアーゼによるプラスミド切断による全体的な抑制を測定した。

【0154】

このようなアッセイの結果を、図１２に示す。図１２では、パネル（Ａ）は、プラスミド切断を実証する大腸菌株のレプリカ平板法を示し、ＭＧ３４－１を発現させる大腸菌およびｓｇＲＮＡは、ｓｇＲＮＡ（＋ｓｐ）のための標的を包含しているカナマイシン耐性プラスミドで形質転換された。成長障害（＋ｓｐ）対陰性コントロール（ターゲットとＰＡＭなし（－ｓｐ））を示すプレート象限は、酵素による標的化と切断が成功したことを示す。実験は２回複製され、３回繰り返して行なわれた。図１２では、パネル（Ｂ）は、（Ａ）における標的条件（＋ｓｐ）対非標的対照（－ｓｐ）における成長抑制を示すレプリカ平板法実験からの、コロニー形成単位（ｃｆｕ）測定のグラフを示し、プラスミドが切断されたことを実証している。

【0155】

ゲノムＤＮＡにＰＡＭ配列（例えば、実施例２のように求められた）が組み込まれた操作された菌株を、エンドヌクレアーゼをコードするＤＮＡで形質転換させる。その後、形質転換体を化学合成し、標的配列に特異的な（「オンターゲット」）、または標的に対して非特異的な（「ノンターゲット」）５０ｎｇのガイドＲＮＡ（例えば、ｃｒＲＮＡ）で形質転換させる。熱ショックの後、ＳＯＣ中で、２時間３７℃で形質転換体を回収する。その後、誘導培地で培養した５倍希釈系列でヌクレアーゼ効率を求める。コロニーを３倍の希釈系列から定量する。

【0156】

実施例６．哺乳類細胞におけるＭＧＣＲＩＳＰＲ複合体のゲノム切断活性の検証
哺乳動物細胞における標的化および切断活性を示すために、ＭＧＣａｓエフェクタータンパク質配列を２つの哺乳動物発現ベクター、（ａ）Ｃ末端にＳＶ４０ＮＬＳと２Ａ－ＧＦＰタグを持つもの、（ｂ）ＧＦＰタグを持たず、Ｎ末端とＣ末端に２つのＳＶ４０ＮＬＳ配列を持つもので、試験する。ＮＬＳ配列は、本明細書に記載のＮＬＳ配列のいずれかを含む。いくつかの例では、エンドヌクレアーゼをコードするヌクレオチド配列を、哺乳動物細胞での発現にコドン最適化する。標的化配列が付加された対応するｃｒＲＮＡ配列を、第２の哺乳動物発現ベクターにクローン化する。２つのプラスミドをＨＥＫ２９３Ｔ細胞へコトランスフェクションする。ＨＥＫ２９３Ｔ細胞に発現プラスミドとｇＲＮＡ標的化プラスミドをコトランスフェクションして７２時間後にＤＮＡを抽出し、ＮＧＳ－ライブラリの調製に使用する。哺乳動物細胞における酵素の標的化効率を実証するために、標的部位の配列決定におけるインデルを介してＮＨＥＪの割合を測定する。各タンパク質の活性を試験するために、少なくとも１０種類の標的部位を選択した。

【0157】

実施例７．本明細書に記載のＭＧファミリーの予測された活性
インサイチュでの発現とタンパク質配列の解析は、これらの酵素は活性なヌクレアーゼであることを示す。それらは、予測されるエンドヌクレアーゼ関連ドメイン（ＲＲＸＲＲおよびＨＮＨ＿エンドヌクレアーゼＰｆａｍドメインに一致、図２、図３Ａ、および図３Ｂ）を包含し、および、予測されるＨＮＨおよびＲｕｖＣ触媒残基（例えば、図２、図３Ａ、および図３Ｂ、長方形）を包含する。さらに、リボヌクレアーゼＨ様タンパク質ファミリーに見られるＲＲＸＲＲモチーフの存在は、ＲＮＡの標的化やヌクレアーゼ活性の可能性を示す（図２参照）。

【0158】

発現データから、ＭＧ３４－１ヌクレアーゼ候補、ｔｒａｃｒＲＮＡ、およびＣＲＩＳＰＲアレイのインサイチュの天然活性が確認された（図４）。

【0159】

実施例８．ｍＲＮＡ送達を伴う哺乳動物細胞における活性
ｍＲＮＡを用いた細胞トランスフェクション／形質転換によるゲノム編集では、コーディング配列はＴｗｉｓｔＢｉｏｓｃｉｅｎｃｅまたはＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ（ＧｅｎｅＡｒｔ）のアルゴリズムを用いて最適化されたマウスまたはヒトのコドンである。コーディングエンドヌクレアーゼ配列に２つの核局在シグナル、ＮおよびＣ端末にそれぞれＳＶ４０およびヌクレオプラスミン、を付加したカセットを構築する。加えて、ヒト補体３（Ｃ３）由来の非翻訳領域を、カセット内のコード配列の５’および３’の両方に付加する。

【0160】

次に、このカセットを、長いポリＡストレッチの上流にあるｍＲＮＡ産生ベクターにクローニングする。ｍＲＮＡ構築物の構成は、以下のようにすることができる。Ｃ３由来の５’ＵＴＲ－ＳＶ４０ＮＬＳ－コドン最適化ＳＭＡＲＴ遺伝子－ヌクレオプラスミンＮＬＳ－Ｃ３由来の３’ＵＴＲ－１０７ｐｏｌｙＡテール。その後、操作されたＴ７ＲＮＡポリメラーゼ（Ｈｉ－Ｔ７：ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）を用いて、Ｔ７プロモーターによりｍＲＮＡの転写を実行する。ＣｌｅａｎＣａｐＡＧ（ＴｒｉｌｉｎｋＢｉｏｌａｂｓ）を用いて、ｍＲＮＡの５’キャッピングを共転写的に引き起こす。その後、ＭＥＧＡｃｌｅａｒＴｒａｎｓｃｒｉｐｔｉｏｎＣｌｅａｎ－Ｕｐｋｉｔ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）を用いてｍＲＮＡを精製する。

【0161】

ＬｉｐｏｆｅｃｔａｍｉｎｅＭｅｓｓｅｎｇｅｒＭａｘ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）を用いて、哺乳動物細胞に転写されたｍＲＮＡと、目的のゲノム領域を標的とする少なくとも１０のガイドのセットとを、コトランスフェクションする。細胞を一定時間（例えば、４８時間）インキュベートした後、ＰｕｒｅｌｉｎｋＧｅｎｏｍｉｃＤＮＡｅｘｔｒａｃｔｉｏｎｋｉｔ（ＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）を用いてゲノムＤＮＡを単離する。特定のプライマーを用いて、目的の領域を増幅する。その後、ＩｎｆｅｒｅｎｃｅｏｆＣＲＩＳＰＲＥｄｉｔｓを用いたサンガー配列決定により編集を評価し、ＮＧＳにより編集結果を徹底的に解析する。

【0162】

本明細書では、本発明の好ましい実施形態を示し、説明したが、このような実施形態が例示としてのみ提供されることは、当業者には明らかであろう。本発明が本明細書内で提供された特定の実施例により限定されることは、意図されていない。本発明は前述の明細書を参照して記載されている一方、本明細書における実施形態の記載および例示は限定的な意味で解釈されることは意図されていない。多くの変更、変化、および置換が、本発明から逸脱することなく、当業者の心に思い浮かぶであろう。さらに、本発明の全ての態様は、様々な条件および変数に依存する、本明細書で述べられた特定の描写、構成、または相対的比率に限定されないことが理解されるだろう。本明細書に記載される本発明の実施形態の様々な代案が、本発明の実施において利用されるかもしれないことを理解されたい。したがって、本発明は、任意のそのような代替案、修正、変形、または同等物にも及ぶことが考えられる。以下の請求項は本発明の範囲を定義するものであり、この請求項とその均等物の範囲内の方法、および構造体がそれによって包含されるものであるということが意図されている。

【図1】