2024-43578 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

2024-43578新規Ｃａｓタンパク質

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024043578

(43)【公開日】2024-04-01

(54)【発明の名称】新規Ｃａｓタンパク質

(51)【国際特許分類】

C12N 15/55 20060101AFI20240325BHJP

C12N 9/22 20060101ALI20240325BHJP

C12N 15/63 20060101ALI20240325BHJP

C12N 5/10 20060101ALI20240325BHJP

C12N 1/21 20060101ALI20240325BHJP

C12N 1/19 20060101ALI20240325BHJP

C12N 1/15 20060101ALI20240325BHJP

C12N 15/09 20060101ALI20240325BHJP

C12N 15/11 20060101ALI20240325BHJP

【ＦＩ】

C12N15/55 ZNA

C12N9/22

C12N15/63 Z

C12N5/10

C12N1/21

C12N1/19

C12N1/15

C12N15/09 110

C12N15/11 Z

【審査請求】未請求

【請求項の数】10

【出願形態】ＯＬ

(21)【出願番号】P 2023148437

(22)【出願日】2023-09-13

(31)【優先権主張番号】P 2022148657

(32)【優先日】2022-09-19

(33)【優先権主張国・地域又は機関】JP

(71)【出願人】

【識別番号】522370931

【氏名又は名称】石野良純

(71)【出願人】

【識別番号】501379247

【氏名又は名称】日本ソフトウェアマネジメント株式会社

(74)【代理人】

【識別番号】100098121

【弁理士】

【氏名又は名称】間山世津子

(74)【代理人】

【識別番号】100107870

【弁理士】

【氏名又は名称】野村健一

(72)【発明者】

【氏名】石野良純

(72)【発明者】

【氏名】沼田倫征

(72)【発明者】

【氏名】松本俊介

(72)【発明者】

【氏名】石野園子

(72)【発明者】

【氏名】吉村萌由

(72)【発明者】

【氏名】中野華歩

(72)【発明者】

【氏名】奈須永典

(72)【発明者】

【氏名】神山春風

(72)【発明者】

【氏名】横山頌弥

【テーマコード（参考）】

4B065

【Ｆターム（参考）】

4B065AA26X

4B065AB01

4B065AC14

4B065BA02

4B065CA24

4B065CA46

4B065CA60

(57)【要約】

【課題】新規なCRISPR-Casを探索し、そこから得られるCasタンパク質を提供すること。
【解決手段】下記(a), (b)又は(c)のいずれかのタンパク質。
(a) 配列番号１のアミノ酸配列からなるタンパク質
(b) 配列番号１のアミノ酸配列と50%以上かつ100%未満の同一性を持つアミノ酸配列からなり、ガイドRNAと複合体を形成して、ガイドRNAに相補的な配列を有するDNAに結合することができるタンパク質
(c) 配列番号１のアミノ酸配列において、1～10個のアミノ酸が変異した配列からなり、ガイドRNAと複合体を形成して、ガイドRNAに相補的な配列を有するDNAに結合することができるタンパク質
前記タンパク質をコードする核酸、組換えベクター及び形質転換細胞も提供される。
【選択図】図５

【特許請求の範囲】

【請求項1】

下記(a), (b)又は(c)のいずれかのタンパク質。
(a) 配列番号１のアミノ酸配列からなるタンパク質
(b) 配列番号１のアミノ酸配列と50%以上かつ100%未満の同一性を持つアミノ酸配列からなり、ガイドRNAと複合体を形成して、ガイドRNAに相補的な配列を有するDNAに結合することができるタンパク質
(c) 配列番号１のアミノ酸配列において、1～10個のアミノ酸が変異した配列からなり、ガイドRNAと複合体を形成して、ガイドRNAに相補的な配列を有するDNAに結合することができるタンパク質

【請求項2】

ヌクレアーゼ活性を持つ請求項１記載のタンパク質。

【請求項3】

ヌクレアーゼ活性を持たない請求項１記載のタンパク質。

【請求項4】

請求項１記載のタンパク質をコードする核酸。

【請求項5】

請求項１記載のタンパク質をコードするDNAを含む発現ベクター。

【請求項6】

請求項５記載の発現ベクターで形質転換された細胞。

【請求項7】

請求項６記載の細胞を培養することを含む、下記(a), (b)又は(c)のいずれかのタンパク質を製造する方法。
(a) 配列番号１のアミノ酸配列からなるタンパク質
(b) 配列番号１のアミノ酸配列と50%以上かつ100%未満の同一性を持つアミノ酸配列からなり、ガイドRNAと複合体を形成して、ガイドRNAに相補的な配列を有するDNAに結合することができるタンパク質
(c) 配列番号１のアミノ酸配列において、1～10個のアミノ酸が変異した配列からなり、ガイドRNAと複合体を形成して、ガイドRNAに相補的な配列を有するDNAに結合することができるタンパク質

【請求項8】

請求項１記載のタンパク質及びガイドRNAを用いて、ガイドRNAに相補的な配列を有するDNAを切断する方法。

【請求項9】

請求項１記載のタンパク質及びガイドRNAを用いて、ゲノム編集する方法。

【請求項10】

請求項１記載のタンパク質、請求項１記載のタンパク質をコードするmRNA及び請求項１記載のタンパク質をコードするDNAを含む発現ベクターからなる群より選択される少なくとも１つを含む、ゲノム編集するためのキット。

【発明の詳細な説明】

【技術分野】

【0001】

発明はゲノム編集など遺伝子工学のツールとなる新規Casタンパク質に関するものである。

【背景技術】

【0002】

CRISPR (clustered regularly interspaced short palindromic repeat)は、原核生物のバクテリア、アーキアのゲノム中に存在する数十塩基対（リピート）を１単位とする繰り返し配列が等間隔に並んだDNA配列のことであり、原核生物における獲得免疫機能を有することがわかっている（非特許文献１）。また、CRISPRの近傍には、ヌクレアーゼやヘリカーゼをコードするCRISPR-associated (cas)遺伝子群が存在する。通常のCRISPRの特徴として、cas遺伝子群、リーダー配列、リピート・スペーサー列の3要素が含まれる。しかし、CRISPR-Casは多様性に富んでおり、Casタンパク質群の種類や、それらの作用機序の違いに応じて、クラス１、クラス２に分けられ、それぞれクラス１にタイプI型、III型、IV型、クラス２にタイプII型、V型、VI型が含まれる。さらに、それそれのタイプの中を再分していくつかのサブタイプに分類されることが提唱されている（非特許文献２）。
CRISPR-Casシステムはリピート間に挿入されたDNA配列から転写されてできる CRISPR RNA (crRNA)がCasヌクレアーゼと複合体を形成し、crRNAと相同な配列を有するDNAの場所にCasヌクレアーゼを導くことによって、その位置でDNA鎖を二本鎖とも切断するという性質を有するため、それを利用した実用的なゲノム編集技術が開発されて、世界中に普及している（非特許文献３）。もっとも利用されているのはバクテリアの化膿レンサ球菌Streptococcus pyrogenes由来のCas9を利用した方法であり、これはタイプIIに属するCRISPR-Casである。その後、同じくバクテリアのFrancisella novicida由来のCRISPR-Casが利用されるようになった。ヌクレアーゼとして働くタンパク質はCpf1と名付けられていたが、CRISPR-Casシステムの分類に沿って現在Cas12aと呼ばれている。

【0003】

CRISPR-Casシステムは、ゲノム編集技術として応用されたばかりか、目的のタンパク質をゲノム上の狙った位置に自在に誘導できる性質を利用して、特定の遺伝子の転写制御、部位特異的なエピジェネティック変換、部位特異的なイメージング、核酸検出法など、様々な応用方法が検討されている（非特許文献４, ５）。

【先行技術文献】

【非特許文献】

【0004】

【非特許文献1】Barrangou R.ら、Science、315巻、6号、1709～1712ページ、2007年

【非特許文献2】MakarovaKSら、Nat Rev Microbiol.、18巻、１１号、67～83ページ、2019年

【非特許文献3】Jinek Mら、Science、337巻、810～821ページ、2012年

【非特許文献4】Knott GJら、Science、361巻、6405、866～869ページ、2018年

【非特許文献5】Mazhar Aら、Nature Communications、9巻、1911ページ、2018年

【発明の概要】

【発明が解決しようとする課題】

【0005】

実用的なゲノム編集技術に利用可能なCRISPR-Casシステムは原核生物のバクテリアとアーキアに広く存在し、それは極めて多様である。そのために、性質も個々に異なる。現在、広く利用されているStreptococcus pyrogenes由来のCRISPR-Cas9や、Francisella novicida由来のCRISPR-Cas12aを比較しても、自己と非自己を見分けるためのPAM (プロトスペーサー隣接モチーフ) の配列や相対的位置、DNA切断様式、切断後のDNA鎖の形、活性化RNA (tracrRNA) の必要性など異なる点が多い。CRISPR-Casシステムをゲノム編集ツールとして利用する場合、PAM配列によるターゲットの制限、ヌクレアーゼの切断効率や、標的部位以外での切断（オフターゲット）の頻度、編集する細胞へのCRISPR-Cas導入の仕方と効率などの要素を考慮する必要があり、ツールとして使える選択肢が多いほど望ましい。したがって、さらなる新規CRISPR-Casの開発が依然として望まれている。未だ知られていないCRISPR-Casの中には既存のものとは異なる性質を有するものが存在することが期待され、それらを探索して性質解析を行うことによって、既知のものとは異なる性質を有するものを見出すことができ、それらには有用なゲノム編集ツールとしての応用が期待できる。すなわち、本発明の目的は、新規なCRISPR-Casを探索し、そこから得られるCasタンパク質を提供することにある。

【課題を解決するための手段】

【0006】

本発明者らは、自ら採取した環境DNA試料を網羅的に配列解析して作成したメタゲノムライブラリーより、CRISPR-Casと予想される遺伝子を探索し、それを発現させて得られたcrRNAとCasエフェクタータンパク質候補を解析して、ゲノム編集ツールとしての性質を示すものを見出した。かくして、ゲノム編集に利用できる新規CRISPR-Casを提供することによって、本発明を完成させた。本発明の要旨は以下のとおりである。
（１）下記(a), (b)又は(c)のいずれかのタンパク質。
(a) 配列番号１のアミノ酸配列からなるタンパク質
(b) 配列番号１のアミノ酸配列と50%以上かつ100%未満の同一性を持つアミノ酸配列からなり、ガイドRNAと複合体を形成して、ガイドRNAに相補的な配列を有するDNAに結合することができるタンパク質
(c) 配列番号１のアミノ酸配列において、1～10個のアミノ酸が変異した配列からなり、ガイドRNAと複合体を形成して、ガイドRNAに相補的な配列を有するDNAに結合することができるタンパク質
（２）ヌクレアーゼ活性を持つ（１）記載のタンパク質。
（３）ヌクレアーゼ活性を持たない（１）記載のタンパク質。
（４）（１）記載のタンパク質をコードする核酸。
（５）（１）記載のタンパク質をコードするDNAを含む発現ベクター。
（６）（５）記載の発現ベクターで形質転換された細胞。
（７）（６）記載の細胞を培養することを含む、下記(a), (b)又は(c)のいずれかのタンパク質を製造する方法。
(a) 配列番号１のアミノ酸配列からなるタンパク質
(b) 配列番号１のアミノ酸配列と50%以上かつ100%未満の同一性を持つアミノ酸配列からなり、ガイドRNAと複合体を形成して、ガイドRNAに相補的な配列を有するDNAに結合することができるタンパク質
(c) 配列番号１のアミノ酸配列において、1～10個のアミノ酸が変異した配列からなり、ガイドRNAと複合体を形成して、ガイドRNAに相補的な配列を有するDNAに結合することができるタンパク質
（８）（１）記載のタンパク質及びガイドRNAを用いて、ガイドRNAに相補的な配列を有するDNAを切断する方法。
（９）（１）記載のタンパク質及びガイドRNAを用いて、ゲノム編集する方法。
（１０）（１）記載のタンパク質、（１）記載のタンパク質をコードするmRNA及び（１）記載のタンパク質をコードするDNAを含む発現ベクターからなる群より選択される少なくとも１つを含む、ゲノム編集するためのキット。

【発明の効果】

【0007】

本発明により、新規なCRISPR-Casおよびその製造方法が提供される。新規なCRISPR-Casは、現在知られている分類法ではClass 2のType Vに属し、標的DNAの切断に関わるエフェクターとして、単独のペプチドで機能することから、実用的なゲノム編集ツールが提供される。さらに、このエフェクターペプチドのサイズが、現在ゲノム編集に利用されているものと比べて、顕著に小さいことから、扱い易く、より導入効率が高いツールが提供される。

【図面の簡単な説明】

【0008】

【図1】環境メタゲノム解析の手順。有明海のある定点から採取した海水2２リットルを段階的にろ過して、0.22 μmのフィルター上に残った微生物からDNAを調製して、NGS配列解析に供した。

【図2】メタゲノム配列からのCRISPR-Cas領域の発見。得られた配列データをアセンブルして、できるだ連続した配列データを得で作成したデータベースより、CRISPR様の繰り返し配列を探索した結果、図のような遺伝子領域を発見した。矢印はアミノ酸配列への翻訳領域とその翻訳方向を示している。

【図3】海水試料DNAの塩基配列確認による翻訳領域の延長。元のメタゲノム配列に読み誤りが含まれる可能性を考えて、NGS解析に供したDNAを鋳型にして、PCRにより当該翻訳領域の上流域を増幅し、ジデオキシ法により配列解析を行なった。その結果、図中に示す１塩基が異なっていた(a)。そのため、終始コドンが解消されて、翻訳読み枠がさらに上流に211 アミノ酸残基分伸びることになった(b)。

【図4】ゲルろ過によるARIタンパク質の精製。大腸菌で産生させたHis-Tagged ARIタンパク質をNi-NTAアフィニティクロマト、ゲルろ過、ヘパリンアフィニティクロマトで精製した後、ゲルろ過（Superdex 200 Increase 10/300 GL）を行なった結果、ARIタンパク質はシングルピークで溶出され、高純度に精製された。

【図5】推定CRISPR領域の共発現。ARIタンパク質と結合するcrRNAを同定するために、CRISPR領域から転写されてできるRNAをcrRNAと想定して、CRISPR領域を大腸菌の発現ベクターに挿入して、構築したプラスミドを大腸菌細胞に導入して共発現させた。

【図6】ARIとCRISPRアレイを含む周辺領域との共産生。大腸菌の細胞抽出液をARIに付加されているHis-TagによるNi-NTAアフィニティ、ゲルろ過の後、ヘパリンセファロースでNACl濃度勾配により分画した。ARIは単一ピークで溶出され、また、そのピーク画分はA₂₆₀の吸収がA₂₈₀よりも大きく、核酸が含まれていることを示していた。

【図7】ARIと結合している核酸の同定。ヘパリンセファロースで分画されたヒーク画分をフェノール・クロロホルム抽出に供し、水溶性画分に含まれる核酸を分取して、DNase処理、RNase処理を行なった。その結果、ARIタンパク質と一緒に含まれていた核酸はDNaseに耐性で、RNaseで分解されたので、RNA鎖であることが示された。またその長さは75塩基のtRNAよりも小さく、50塩基程度であることを示していた。

【図8】ARIと結合している核酸の配列解析。分画したRNA画分をNGS解析により配列解読した結果、得られた各配列データ（リード）をpETDue-1-M2に挿入された領域のDNA配列（横軸）にマッピングした結果を示している。縦軸は、何回その配列が読まれたかを表示している。

【図9】ARIによるpre-crRNAのプロセッシング。crRNAの鎖長（図７）とNGSのリードの出現頻度（図８）から、pre-crRNAからプロセッシングによってcrRNAが産生される切断位置を予想した。ARIがCRISPRのリピート内のステムループ構造を認識して、スペーサーの途中とステムループの5′側の二箇所を切断することが予想される。

【図10】crRNAプロセッシングを調べる基質RNAの調製。実際にpre-crRNAのプロセッシングがどのように起きるのか分析するため、pre-crRNAを予想して、両方向のpre-crRNAをインビトロ転写させるためのプラスミドを構築した。これらを用いて、インビトロ転写反応によりpre-crRNA鎖を調製した。

【図11】ARIによるcrRNAプロセッシング検出。図１０で調製したPre-crRNA鎖を ARIタンパク質と混合して反応させた後、変性ポリアクリルアミドゲル電気泳動で反応産物を分離した。その結果、センス鎖から合成されたRNA鎖がARIタンパク質によって切断されて短いRNA鎖が生成されることがわかった。この反応はアンチセンス鎖から合成された RNA鎖では起こらないこともわかった。

【図12】ARI-crRNAによる標的DNAの切断。本発明のARI-crRNAが標的DNAを特異的に切断するか調べた。標的配列として、本CRISPRの１番目のスペーサー配列を用いた。用いた基質はpUC18に予想PAM配列と標的配列をクローニングしたものを調製した。target-Fwは、crRNAのターゲット鎖、非ターゲット鎖のうち、非ターゲット鎖の5′側がPAMであると予想して、ここに予想PAM配列のTTTTAを付加して、その下流に標的配列を挿入した。target-Rvは、target-Fw の逆向きで、非ターゲット鎖の5′側がPAM配列だとすると、予想PAM領域がベクター由来のGATCCという配列になっている。反応液をアガロースゲル電気泳動で分析した。標的配列に二本鎖切断が起きると、スーパーコイル状のプラスミドが開環し、線状DNAとなって泳動度が変わる。結果は、ARI-crRNAの存在下で切断反応が起きている。標的配列が含まれないプラスミドDNAでは、切断反応は起きていない。切断のコントロールとしてpUC118に一箇所含まれる制限酵素のEcoRI認識配列が、EcoRIで切断されて線状化することを示している。

【図13】ARI-crRNAによる標的DNAの切断位置解析。標的DNA領域の配列解析を行うためのフォアードプライマー、リバースプライマーをそれぞれ設定し、capture1_Tm67、pUC18-MCS-300_Fとした。それぞれのプライマーを用いて、ジデオキシチェーンターミネータ法により配列解析を行なった。

【図14】ARI-crRNAによる標的DNAの切断位置の決定解析。capture1_Tm67、pUC18-MCS-300_Fをプライマーとして用いた蛍光標識によるジデオキシ反応解析の結果を示している。シグナルが出なくなる位置が切断部位と考えられる。本解析のジデオキシ反応に用いたDNAポリメラーゼは鋳型鎖の末端で反応が止まるのではなく、末端に鋳型鎖に依存しない１ヌクレオチド付加反応が起き、部分的にAが付加されることがわかっている。従って、切断点は二種のヌクレオチドが混じったシグナルになる。

【発明を実施するための形態】

【0009】

以下、本発明を実施するための形態について説明する。

【0010】

本発明は、下記(a), (b)又は(c)のいずれかのタンパク質を提供する。
(a) 配列番号１のアミノ酸配列からなるタンパク質
(b) 配列番号１のアミノ酸配列と50%以上かつ100%未満の同一性を持つアミノ酸配列からなり、ガイドRNAと複合体を形成して、ガイドRNAに相補的な配列を有するDNAに結合することができるタンパク質
(c) 配列番号１のアミノ酸配列において、1～10個のアミノ酸が変異した配列からなり、ガイドRNAと複合体を形成して、ガイドRNAに相補的な配列を有するDNAに結合することができるタンパク質
本発明のタンパク質は、配列番号1記載のアミノ酸配列を含むものであり、既知のCasタンパク質の中では type VのCas12に最も近いが、それでも低い相同性で、例えば、既知のFrancisella由来 Cas12/Cpf1とは21%の同一性しか示さない。本発明のタンパク質は新規なアミノ酸配列を有する。また部分的にも、特に高い同一性を有するものもない。

【0011】

配列番号１のアミノ酸からなるタンパク質（上記(a)のタンパク質）はヌクレアーゼ活性を有する。その活性は、CRISPR領域が転写されてできるpre-crRNAがプロセッシングされて産生されるcrRNAとで複合体を形成し、crRNAが有する配列に依存して、その相補的な配列を有するDNA鎖を標的として配列番号１のポリペプチドをその位置に誘導し、二本鎖ともに切断する特性を有する。しかし、本発明のタンパク質には必ずしもヌクレアーゼ活性は無くてもよい。本発明のタンパク質は、ガイドRNA（crRNA）と複合体を形成して、ガイドRNAに相補的な配列を有するDNA（標的DNA）に結合することができればよい。ガイドRNAの配列として、5′-AGAGCUUAAGGCCCCUGUGCAGUGGGGUGUAACUGCAACGACUCCAGCACCUCAGACAAGUCCAAGUCGGCUUAAGGCCCCUGUGCAGUGGGGUGUAACUGCAACCGGUCGACGAAGCU（下線はCRISPRリピート配列）を例示することができる。複合体と標的DNAの結合は、標的DNAの切断（本発明のタンパク質がヌクレアーゼ活性を持つ場合）、標的DNAの標識化（本発明のタンパク質がヌクレアーゼ活性を持たず、標識化されている場合）、標識法に応じた各種分子生物学的実験手法を用いるか、もしくは結晶構造解析などにより直接確認することができる。

【0012】

本発明のタンパク質とcrRNA複合体は複合体を形成して、crRNAが本発明のタンパク質を標的DNA鎖上に導く特性を有するが、現在広く利用されているCas9が必要とするtracrRNAは必ずしも必要としない。すなわちよりシンプルな分子構成で上記特性を現しうる。また、自己DNAと標的DNAを区別するためのPAM (protospacer adjacent motif)配列としては、少なくともTTTTA またはGGATCCであれば標的配列の特異的な切断が可能である。

【0013】

本発明において配列番号１のアミノ酸配列からなるタンパク質で標的DNA鎖を切断、または標的DNAの部位へ誘導するためにはcrRNAを人工的に合成することができる。ゲノム編集では、crRNAは一般にガイドRNAと呼ばれ、標的DNAを切断するポリペプチドをエフェクターと呼ぶことが多い。ガイドRNAはエフェクターと複合体を形成した状態で、標的DNAと塩基対形成できればよく、その長さに限定はないが、通常の長さとしては100ヌクレオチド程度である。目的の活性を期待するためには、エフェクターとガイドRNAは別々に用意して、使用時に混合してもよく、また両者を複合体として準備し、反応に使うことも可能である。

【0014】

上記(b)のタンパク質は、配列番号１のアミノ酸配列と50%以上かつ100%未満の同一性を持つアミノ酸配列からなり、ガイドRNAと複合体を形成して、ガイドRNAに相補的な配列を有するDNAに結合することができる。

【0015】

上記(c)のタンパク質は、配列番号１のアミノ酸配列において、1～10個のアミノ酸が変異した配列からなり、ガイドRNAと複合体を形成して、ガイドRNAに相補的な配列を有するDNAに結合することができる。

【0016】

上記(b)及び(c)のタンパク質は、配列番号１のアミノ酸配列において、１又は複数個のアミノ酸が欠失、置換若しくは付加されたアミノ酸配列からなるとよい。欠失、置換又は付加されるアミノ酸の総数は１又は複数個であり、その具体的な範囲は、欠失に関しては通常１～１０個、好ましくは１～５個、さらに好ましくは１～２個であり、置換に関しては通常１～１０個、好ましくは１～５個、さらに好ましくは１～２個であり、付加に関しては通常１～１０個、好ましくは１～５個、さらに好ましくは１～２個である。

【0017】

本発明のタンパク質は、糖鎖が付加されたタンパク質又は糖鎖が付加されていないタンパク質のいずれであってもよい。タンパク質に付加される糖鎖の種類、位置等は、タンパク質の製造の際に使用される宿主細胞の種類によって異なるが、糖鎖が付加されたタンパク質には、いずれの宿主細胞を用いて得られるタンパク質も含まれる。

【0018】

本発明は、上記(a), (b)又は(c)のいずれかのタンパク質をコードする核酸も提供する。核酸は、１本鎖DNA、１本鎖RNA（例えば、mRNA）、DNAとRNAが混合した１本鎖ポリヌクレオチド、２本鎖DNA、２本鎖RNA、DNA-RNAのハイブリッドポリヌクレオチド、DNAとRNAが混合した２種のポリヌクレオチドからなる２本鎖ポリヌクレオチドなどのいずれであってもよい。上記(a), (b)又は(c)のいずれかのタンパク質をコードするDNAを用いて、上記(a), (b)又は(c)のいずれかのタンパク質を製造することができる。また、上記(a), (b)又は(c)のいずれかのタンパク質をコードするRNA（mRNA）は、ゲノム編集に利用することができる。

【0019】

配列番号１のアミノ酸配列からなるタンパク質をコードするDNAの配列を配列番号２に示す。配列番号２の配列を有するDNAは、公知の人工遺伝子合成法で製造することができる。例えば、配列がオーバーラップした一連のオリゴヌクレオチドを合成し、これらをアニーリングさせると、両鎖にニックを含む二本鎖DNA断片が形成する。このニックをDNAリガーゼで修復することで、目的の配列を有する人工遺伝子が得られる。配列番号２の配列を有するRNA（mRNA）は、配列番号２の配列をコードしたプラスミドDNAを調製し、鋳型となるDNAをPCRで増幅及び精製した上で、RNAポリメラーゼを用いる転写反応により製造することができる。

【0020】

上記(b)及び(c)のタンパク質をコードするDNAは、配列番号２の配列を有するDNAに部位特異的変異誘発法等の公知の方法を用いて人為的に変異を導入することにより得ることができる。変異の導入は、例えば、変異導入用キット、例えば、Mutan-K（TAKARA社製）、Mutan-G（TAKARA社製）、TAKARA社のLA PCR in vitro Mutagenesis シリーズキットや、各社から市販されている同様の原理によるキットを用いて行うことができる。目的の位置に変異を含めたオリゴDNAを調製して、上記の方法で全遺伝合成を行うことでも得られる。

【0021】

本発明のタンパク質は、例えば、本発明のタンパク質をコードするDNAを発現ベクターに挿入した組換えベクターを作製し、この組換えベクターで宿主細胞を形質転換し、形質転換した細胞を培養し、形質転換した細胞が産生するタンパク質を精製することにより製造することができる。

【0022】

組換えベクターを作製する際には、まず、目的とするタンパク質のコード領域を含む適当な長さのＤＮＡ断片を調製する。目的とするタンパク質のコード領域のヌクレオチド配列において、宿主細胞における発現に最適なコドンとなるように、ヌクレオチドを置換してもよい。

【0023】

次いで、上記ＤＮＡ断片を適当な発現ベクターのプロモーターの下流に挿入して組換えベクターを作製する。上記ＤＮＡ断片は、その機能が発揮されるようにベクターに組み込まれることが必要であり、ベクターは、プロモーターの他、エンハンサー等のシスエレメント、スプライシングシグナル、ポリＡ付加シグナル、選択マーカー（例えば、ジヒドロ葉酸還元酵素遺伝子、アンピシリン耐性遺伝子、ネオマイシン耐性遺伝子）、リボソーム結合配列（ＳＤ配列）等を含有することができる。

【0024】

発現ベクターとしては、宿主細胞において自立複製が可能なものであれば特に限定されず、例えば、プラスミドベクター、ファージベクター、ウイルスベクター等を使用することができる。プラスミドベクターとしては、例えば、大腸菌由来のプラスミド（例えば、pRSET、pBR322、pBR325、pUC118、pUC119、pUC18、pUC19）、枯草菌由来のプラスミド（例えば、pUB110、pTP5）、酵母由来のプラスミド（例えば、YEp13、YEp24、YCp50）を使用することができ、ファージベクターとしては、例えば、λファージ（例えば、Charon4A、Charon21A、EMBL3、EMBL4、λgt10、λgt11、λZAP）等を使用することができ、ウイルスベクターとしては、例えば、レトロウイルス、ワクシニアウイルス、アデノウイルス、アデノ随伴ウイルス（AAV）等の動物ウイルス、バキュロウイルス等の昆虫ウイルスを使用することができる。

【0025】

本発明のタンパク質をコードするDNAを発現ベクターに挿入した組換えベクターは、ゲノム編集に利用することもできる。

【0026】

目的とするタンパク質を生産し得る形質転換細胞は、組換えベクターを適当な宿主細胞に導入することにより得ることができる。

【0027】

宿主細胞としては、目的とするタンパク質をコードするＤＮＡを発現し得る限り、原核細胞、酵母、動物細胞、昆虫細胞、植物細胞等のいずれを使用してもよい。また、動物個体、植物個体、カイコ虫体等を使用してもよい。

【0028】

細菌を宿主細胞とする場合、例えば、エッシェリヒア・コリ（Escherichia coli）等のエシェリヒア属、バチルス・ズブチリス（Bacillus subtilis）等のバチルス属、シュードモナス・プチダ（Pseudomonas putida）等のシュードモナス属、リゾビウム・メリロティ（Rhizobium meliloti）等のリゾビウム属に属する細菌を宿主細胞として使用することができる。具体的には、Escherichia coli BL21、Escherichia coli XL1-Blue、Escherichia coli XL2-Blue、Escherichia coli DH1、Escherichia coli K12、Escherichia coli JM109、Escherichia coli HB101等の大腸菌、Bacillus subtilis MI 114、Bacillus subtilis 207-21等の枯草菌を宿主細胞として使用することができる。この場合のプロモーターは、大腸菌等の細菌中で発現できるものであれば特に限定されず、例えば、trpプロモーター、lacプロモーター、Ｐ_Lプロモーター、Ｐ_Rプロモーター等の大腸菌やファージ等に由来するプロモーターを使用することができる。また、tacプロモーター、lacT7プロモーター、let Iプロモーターのように人為的に設計改変されたプロモーターも使用することができる。

【0029】

細菌への組換えベクターの導入方法としては、細菌にＤＮＡを導入し得る方法であれば特に限定されず、例えば、カルシウムイオンを用いる方法、エレクトロポレーション法等を使用することができる。

【0030】

酵母を宿主細胞とする場合、サッカロミセス・セレビシエ（Saccharomycescerevisiae）、シゾサッカロミセス・ポンベ（Schizosaccharomyces pombe）、ピキア・パストリス（Pichia pastoris）等を宿主細胞として使用することができる。この場合のプロモーターは、酵母中で発現できるものであれば特に限定されず、例えば、gal1プロモーター、gal10プロモーター、ヒートショックタンパク質プロモーター、MFα1プロモーター、PHO5プロモーター、PGKプロモーター、GAPプロモーター、ADHプロモーター、AOX1プロモーター等を使用することができる。

【0031】

酵母への組換えベクターの導入方法は、酵母にＤＮＡを導入し得る方法であれば特に限定されず、例えば、エレクトロポレーション法、スフェロプラスト法、酢酸リチウム法等を使用することができる。

【0032】

動物細胞を宿主細胞とする場合、サル細胞COS-7、Vero、チャイニーズハムスター卵巣細胞（CHO細胞）、マウスL細胞、ラットGH3、ヒトFL細胞等を宿主細胞として使用することができる。この場合のプロモーターは、動物細胞中で発現できるものであれば特に限定されず、例えば、SRαプロモーター、SV40プロモーター、LTR(Long Terminal Repeat)プロモーター、CMVプロモーター、ヒトサイトメガロウイルスの初期遺伝子プロモーター等を使用することができる。

【0033】

動物細胞への組換えベクターの導入方法は、動物細胞にＤＮＡを導入し得る方法であれば特に限定されず、例えば、エレクトロポレーション法、リン酸カルシウム法、リポフェクション法等を使用することができる。

【0034】

昆虫細胞を宿主とする場合には、Spodoptera frugiperdaの卵巣細胞、Trichoplusia niの卵巣細胞、カイコ卵巣由来の培養細胞等を宿主細胞として使用することができる。Spodoptera frugiperdaの卵巣細胞としてはSf9、Sf21等、Trichoplusia niの卵巣細胞としてはHigh 5、BTI-TN-5B1-4（インビトロジェン社製）等、カイコ卵巣由来の培養細胞としてはBombyx mori N4等を使用することができる。

【0035】

昆虫細胞への組換えベクターの導入方法は、昆虫細胞にＤＮＡを導入し得る限り特に限定されず、例えば、リン酸カルシウム法、リポフェクション法、エレクトロポレーション法等を使用することができる。

【0036】

目的とするタンパク質をコードするＤＮＡを組み込んだ組換えベクターを導入した形質転換細胞を培養することにより、目的とするタンパク質が生産される。形質転換細胞の培養は、宿主細胞の培養に用いられる通常の方法に従って行うことができる。

【0037】

大腸菌、酵母等の微生物を宿主として得られた形質転換細胞を培養する培地としては、該微生物が資化し得る炭素源、窒素源、無機塩類等を含有し、形質転換細胞の培養を効率的に行える培地であれば天然培地及び合成培地のいずれを使用してもよい。

【0038】

炭素源としては、グルコース、フラクトース、スクロース、デンプン等の炭水化物、酢酸、プロピオン酸等の有機酸、エタノール、プロパノール等のアルコール類を使用することができる。窒素源としては、アンモニア、塩化アンモニウム、硫酸アンモニウム、酢酸アンモニウム、リン酸アンモニウム等の無機酸又は有機酸のアンモニウム塩、ペプトン、肉エキス、酵母エキス、コーンスチープリカー、カゼイン加水分解物等を使用することができる。無機塩としては、リン酸第一カリウム、リン酸第二カリウム、リン酸マグネシウム、硫酸マグネシウム、塩化ナトリウム、硫酸第一鉄、硫酸マンガン、硫酸銅、炭酸カルシウム等を使用することができる。

【0039】

大腸菌、酵母等の微生物を宿主として得られた形質転換細胞の培養は、例えば、振盪培養又は通気攪拌培養等の好気的条件下で行うことができる。培養温度は通常２５～３７℃、培養時間は通常１２～４８時間であり、培養期間中はｐＨを通常６～８に保持する。ｐＨの調整は、無機酸、有機酸、アルカリ溶液、尿素、炭酸カルシウム、アンモニア等を用いて行うことができる。培養の際、必要に応じてアンピシリン、テトラサイクリン等の抗生物質を培地に添加してもよい。

【0040】

プロモーターとして誘導性のプロモーターを用いた発現ベクターで形質転換した微生物を培養するときには、必要に応じてインデューサーを培地に添加してもよい。例えば、lacプロモーターを用いた発現ベクターで形質転換した微生物を培養するときにはイソプロピル－β－Ｄ－チオガラクトピラノシド等を、trpプロモーターを用いた発現ベクターで形質転換した微生物を培養するときにはインドールアクリル酸等を培地に添加してもよい。

【0041】

動物細胞を宿主として得られた形質転換細胞を培養する培地としては、一般に使用されているRPMI1640培地、EagleのMEM培地、DMEM培地、Ham F12培地、Ham F12K培地又はこれら培地に牛胎児血清等を添加した培地等を使用することができる。形質転換細胞の培養は、通常、５％ＣＯ_２存在下、３７℃で３～１０日間行う。培養の際、必要に応じてカナマイシン、ペニシリン、ストレプトマイシン等の抗生物質を培地に添加してもよい。

【0042】

昆虫細胞を宿主として得られた形質転換細胞を培養する培地としては、一般に使用されているTNM-FH培地（ファーミンジェン社製）、Sf-900 II SFM培地（Gibco BRL社製）、ExCell400、ExCell405（JRHバイオサイエンシーズ社製）等を使用することができる。形質転換細胞の培養は、通常、２７℃で３～１０日間行う。培養の際、必要に応じてゲンタマイシン等の抗生物質を培地に添加してもよい。

【0043】

目的とするタンパク質は、分泌タンパク質又は融合タンパク質として発現させてもよい。融合させるタンパク質としては、例えば、β－ガラクトシダーゼ、プロテインＡ、プロテインＡのＩｇＧ結合領域、クロラムフェニコール・アセチルトランスフェラーゼ、ポリ（Ａｒｇ）、ポリ（Ｇｌｕ）、プロテインＧ、マルトース結合タンパク質、グルタチオンＳ-トランスフェラーゼ、ポリヒスチジン鎖（His-tag）、Ｓペプチド、ＤＮＡ結合タンパク質ドメイン、Ｔａｃ抗原、チオレドキシン、グリーン・フルオレッセント・プロテイン等を使用することができる。

【0044】

形質転換細胞の培養物から目的とするタンパク質を採取することにより、目的とするタンパク質が得られる。ここで、「培養物」には、培養上清、培養細胞、培養菌体、細胞又は菌体の破砕物のいずれもが含まれる。

【0045】

目的とするタンパク質が形質転換細胞の細胞内に蓄積される場合には、培養物を遠心分離することにより、培養物中の細胞を集め、該細胞を洗浄した後に細胞を破砕して、目的とするタンパク質を抽出する。目的とするタンパク質が形質転換細胞の細胞外に分泌される場合には、培養上清をそのまま使用するか、遠心分離等により培養上清から細胞又は菌体を除去する。

【0046】

得られたタンパク質は、溶媒抽出法、硫安等による塩析法脱塩法、有機溶媒による沈殿法、ジエチルアミノエチル（ＤＥＡＥ）－セファロース、イオン交換クロマトグラフィー法、疎水性クロマトグラフィー法、ゲルろ過法、アフィニティークロマトグラフィー法等により精製することができる。

【0047】

本発明のタンパク質は、そのアミノ酸配列に基づいて、Fmoc法（フルオレニルメチルオキシカルボニル法）、tBoc法（ｔ－ブチルオキシカルボニル法）等の化学合成法によって製造することもできる。この際、市販のペプチド合成機を使用することができる。

【0048】

本発明のタンパク質はcrRNA（ガイドRNA）と複合体を形成して、crRNAがタンパク質を標的DNA鎖上に導くことができる。この特性を利用して、ゲノム編集が可能となる。本発明は、上記(a), (b)又は(c)のタンパク質及びガイドRNAを用いて、ゲノム編集する方法を提供する。

【0049】

本発明のタンパク質がヌクレアーゼ活性を持つ場合には、ガイドRNAに導かれた標的DNA鎖を切断することができるので、これによりDNAの改変が可能となる。本発明は、上記(a), (b)又は(c)のタンパク質及びガイドRNAを用いて、ガイドRNAに相補的な配列を有するDNAを切断する方法も提供する。CRISPRによる遺伝子ターゲティングには、細胞内で標的配列特異的なガイドRNAとヌクレアーゼ（Casタンパク質）が共発現している必要がある。本発明のタンパク質とガイドRNAは一つのベクターから発現されてもよいし、本発明のタンパク質とガイドRNAをそれぞれ独立したベクターから発現させることによって共発現させてもよい。本発明のタンパク質とガイドRNAによるDNA二本鎖切断は、非相同末端結合（nonhomologous end joining: NHEJ）又は相同組換え修復（homology directed repair: HDR）のいずれかにより修復される。NHEJでは、標的部位の切断が繰り返し発生するために修復のエラーが高頻度で発生し、塩基の挿入や欠失が生じる。これにより遺伝子の機能を破壊できる（ノックアウト）。また、HDRでは、切断されていない染色体の相同領域を鋳型にして修復がなされる。これを利用して、染色体上の特定の部位のDNA配列の置換や、特定の部位への外来DNAの挿入（ノックイン）が可能となる。すなわち、置換又は挿入したいDNAを染色体の標的部位の前後の配列で挟んだDNA断片（ドナーDNA）を用意する。そのドナーDNAをDNA二本鎖切断の場に共存させれば、ドナーDNAが切断部位に挿入されることになる（ノックイン）。ゲノム編集による遺伝子改変により、遺伝子機能の解明、品種改良、疾患の治療、ヒトの遺伝子異常を再現した疾患モデル動物の創製などが可能となる。

【0050】

本発明のタンパク質がヌクレアーゼ活性を持たない場合には、特定の遺伝子の転写調節（活性化や抑制）に利用することができる。また、本発明のタンパク質を蛍光色素、ビオチン、酵素などで標識することにより、部位特異的なイメージング、核酸の検出法などに利用することができる。また、本発明のタンパク質にエピゲノムを修飾する酵素を連結させれば、部位特異的なエピジェネティック変換も可能となる。

【0051】

本発明は、ゲノム編集するためのキットも提供する。本発明のキットは、下記の(i), (ii)及び(iii) からなる群より選択される少なくとも１つを含む。
(i) 上記(a), (b)又は(c)のタンパク質、
(ii) 上記(a), (b)又は(c)のタンパク質をコードするmRNA及び
(iii) 上記(a), (b)又は(c)のタンパク質をコードするDNAを含む発現ベクター。

【0052】

上記(a), (b)又は(c)のタンパク質は、ヌクレアーゼ活性を持っていても、持っていなくてもよく、また、蛍光色素、ビオチン、酵素などで標識されていてもよい。

【0053】

上記(a), (b)又は(c)のタンパク質をコードするmRNAは、プソイドウリジン (pseudouridine)、5-メチルシトシン、5-メトキシウリジン (5-methoxyuridine)などによる化学修飾、コドンの最適化などがなされてもよく、Cap構造、ポリA鎖（poly-A tail）などを含んでもよい。

【0054】

上記(a), (b)又は(c)のタンパク質をコードするDNAを含む発現ベクターでは、発現ベクターとして、アデノウイルスやアデノ随伴ウイルス（AAV）等のウイルスベクターやプラスミドベクターを用いることができる。ベクターは、プロモーターの他、エンハンサー等のシスエレメント、スプライシングシグナル、ポリＡ付加シグナル、選択マーカー（例えば、ジヒドロ葉酸還元酵素遺伝子、アンピシリン耐性遺伝子、ネオマイシン耐性遺伝子）、リボソーム結合配列（ＳＤ配列）等を含有することができる。発現ベクターは線状化されていてもよい。

【0055】

本発明のキットは、さらに、バッファー、ネガティブコントロールとしてのcrRNA、ポジティブコントロールとしてのcrRNA、使用説明書などを含んでもよい。

【実施例0056】

以下に本発明を具体的に説明する。

〔実施例１〕
メタゲノム解析
発明者らは、九州の有明海の定点から採取した海水を３段回のポアサイズ（8, 1, 0.2μm）でフィルターろ過し、細胞の大きさを基に分画した。バクテリア/アーキア画分（0.22μmフィルターで保持された画分）、ウイルス/ファージ画分（（0.22μmフイルター通過画分）のそれぞれから調製したDNA試料を次世代シークエンサー（NGS）にかけて配列解析を行った（図１）。解析にはイルミナ社のMiseqを用いた。そうして得られたメタゲノム配列のライブラリーを用いて配列アセンブリ操作を行い、できるかぎり連続した配列データを構築した。このデータベース中から、CRISPR様の繰り返し配列を探索した結果、いくつかのCRISPRが推定された。その近傍に位置するCasタンパク質候補について詳細に配列比較を行い、その中からタイプVのCasエフェクター様の配列をコードするオープンリーディングフレーム（ORF）を発見した。（図２）

【0057】

この遺伝子がコードするポリペプチドの機能を解析するために、遺伝子を大腸菌で発現させるためのベクター（pET22a、メルク社）に挿入して発現プラスミドを構築した。この発現プラスミドを大腸菌宿主（BL21(DE3) CodonPlus-RIL、アジレント社）に導入して、目的のポリペプチドを産生させたが、不安定なためか精製が困難であったため、遺伝子配列を見直した。発現させたORFの周辺のメタゲノム配列を再解析するため、海水から調製し、NGSに供した元のDNAを用いてPCR法により当該領域を増幅し、NGSよりもより精度の高いジデオキシシーケンス解析法による配列解析を行った。その結果、NGS解析によるメタゲノム配列データに間違いがあることがわかり、上記ORFの開始コドンの180塩基上流に存在した終止コドンが解消されて翻訳の読み枠がアミノ末端側に211 アミノ酸残基伸長したORFが得られた（図３）。

【0058】

この新しいORFをCasエフェクター候補として大腸菌で産生させるために、当該ORFを同様の発現ベクターに組み込んで宿主大腸菌細胞で発現させた。その結果、産生されたポリペプチド（これをARIと名付けた）の性状は格段に良くなり、取り扱いが容易になった。

【0059】

ORFにコードされるポリペプチドの調製
発現ベクターの形から、発現して得られるポリペプチドにはアミノ末端にヒスチジン(His）が6個付くように設計されているので、大腸菌で産生された6His-ARIをまず、Ni-NTA Agarose（キアゲン社）を用いて、アフィニティ精製を行った。Ni-NTA Agarose に特異的に結合したポリペプチドを分画し、限外ろ過法によって濃縮したあと、HiLoad 16/600 Superdex 200 pg（サイティバ社、Cytiva）を用いてゲルろ過クロマトグラフィーを行った。ピーク画分をHiTrap Heparin HP（サイティバ社、Cytiva）によって分画し、そのピーク画分を限外ろ過によって濃縮してSuperdex 200 Increase 10/300 GL（サイティバ社、Cytiva）に供した。その結果、6His-ARIが単一のピークとして溶出された(図４)。限外ろ過によって濃縮して最終精製産物とした。A₂₈₀の測定値は2.2であり、2.4 mg/mlの濃度で6His-ARIが得られ、9 LのLB培地で培養した菌体から430 μgの6His-ARIが得られたことになる。

【0060】

6His-ARIと周辺領域との共発現
ARI遺伝子、CRISPRアレイ、その直ぐ隣の推定ORF1(図５)をCRISPR領域と予想して、このDNA配列が得られた、元の海水試料から調製したDNAを鋳型としてPCRにより増幅させた。反応溶液50 μl (1 × PrimeSTAR Buffer、10 pmol M2-F primer（5′-AGTCATGCACTAACACTCAAACTGGAC-3′）、10 pmol M2-R primer（5′-ACTGGTGGACAATAGCTTATCGCTG-3′）、200 μM dNTP、1.25 U PrimeSTAR HS DNA Polymerase、47 ng genomic DNA) を変性:98℃、10 秒、アニーリング:55℃、5 秒、伸長:72℃、4 分を30 サイクルの条件でPCRを行った。この増幅断片を、大腸菌の発現ベクターであるpETDuet-1（メルク社）のマルチクローニングサイトのBamHI、NotＩを使って挿入した。反応溶液10 μl (1 × In-Fusion HD Enzyme Premix、80 ngの制限酵素処理されたpETDuet-1、2 μlのPCR後の溶液) を50℃で15 分インキュベートすることでクローニングを行った。以下、このプラスミドをpETDuet-1-M2とする（図５）。

【0061】

pETDuet-1-M2を用いて大腸菌BL21-(DE3) CodonPlus-RIL（アジレント社）を形質転換し、得られた菌体を50 μg/mlアンピシリンおよび34 μg/mlクロラムフェニコールを加えたLB培地5 mLに植菌し、37℃で4 時間振とう培養した。次に、この培養液を50 μg/mlアンピシリンおよび34 μg/mlクロラムフェニコールを加えたLB培地1 Lに植菌し、37℃で振とう培養した。OD₆₀₀値が0.5になったところでイソプロピル-β-D(-)-チオガラクトピラノシド (IPTG) を終濃度が0.1 mMになるように加えて遺伝子の発現誘導を行い、20℃で18時間培養した後、遠心分離 (5180 × g、4℃、10 分間) により集菌した。菌体を、50 mM Tris-HCl(pH8.0)、0.3 M NaCl、20 mM Imidazole、1 mM PMSFを含む溶液で懸濁し、氷水上で超音波破砕を行った。超音波破砕液を遠心分離し (4000 × g、4℃、10 分間と23708 × g、4℃、10 分間)、上清画分を回収した。上清画分を洗浄溶液(50 mM Tris-HCl, pH8.0,0.3 M NaCl,20 mM Imidazole)を用いてNi-NTA Resinによる粗精製を行った。この溶出画分をゲルろ過クロマトグラフィーHiLoad 16/60 Superdex200によって精製した後、アフィニティークロマトグラフィーHiTrap Heparin HP 5 mlを用いて塩化ナトリウム0.1 -1 Mの濃度勾配をかけて分画した（図６）。単一のピークで溶出された画分にはARIタンパク質が含まれ、またピーク画分の紫外線吸収はA280よりもA260の方が高かったことから、この画分には核酸が含まれていることが予想された。

【0062】

ARIに結合する核酸の同定
上記の、CRISPR領域と一緒に共発現したARIタンパク質と共精製された核酸を同定するために、図６のピーク画分に含まれる成分を、フェノール・クロロホルム・イソアミルアルコール (PCI)抽出によってポリペプチドと核酸に分離し、エタノール沈殿によって核酸を回収した。この核酸に対して、DNase処理もしくはRNase処理を行なった後、変性PAGEにより分析した（図７）。結果、複合体に含まれている核酸はDNaseで分解されず、RNaseで分解されるものであり、tRNAのサイズより小さいものであるということで、50鎖長程度のRNAであることがわかった。分離したRNAを、NGSを用いた配列解析（RNAseq）に供した。全リードの内、98.56%のリードがpETDuet-1-M2に由来しており、CRISPRアレイの領域(1985から2351番目)の発現が顕著に多かった (図８)。その中でも最も発現量が多い領域は、CRISPRのスペーサーとリピートの一部の配列と一致していることがわかった。このことから、ARIと結合していたRNAはcrRNAであり、リピートとスペーサーの一部であることから、ARI自身がcrRNA前駆体のプロセッシングも担い、切断によって適切な長さのcrRNAを生じさせると考えられる(図９)。すなわち、ARIがリピートのステムループ構造を認識して結合し、ステムループの上流とスペーサーの途中の二箇所を切断すると予想される。しかしこの段階では、大腸菌由来のエンドヌクレアーゼが働いている可能性や、ARIが結合していないRNA鎖を非特異的なエンド/エキソヌクレアーゼが分解した可能性もあるのでさらに分析した。

【0063】

プロセッシング活性の検出
プロセシング検討のための基質として、CRISPRアレイのうちリピート配列 (36 nt) 、スペーサー配列 (30 nt) 、リピート配列 (36 nt) の最小の繰り返し配列を含むRNAを調製した。その際に、CRISPRアレイのセンス鎖とアンチセンス鎖のそれぞれのRNA鎖を作製した（図１０）。以下、最小の繰り返し配列を含むCRISPRアレイのセンス鎖の基質をCRISPR array-Sとし、アンチセンス鎖の基質をCRISPR array-ASとする。このような配列を有するRNAの転写を誘導するため、上流にT7プロモーターの配列を導入したDNAの配列を付加したDNA断片を合成し、pUC18プラスミド（タカラバイオ社）のHindIII、EcoRIに挿入した(図１０)。

【0064】

CRISPR array-Sの転写を誘導するプラスミドであるpUC18-CRISPR array-Sを反応溶液300 μl × 4本 (203 μgのpUC18-CRISPR array-S、1 × M Buffer、210 U HindIII)で処理した。また、CRISPR array-ASの転写を誘導するプラスミドであるpUC18-CRISPR array-ASを反応溶液300 μl × 4本 (180 μgのpUC18-CRISPR array-AS、1 × M Buffer、210 U HindIII)で処理した。反応溶液に等量のPhenol/Chloroform/Isoamyl alcohol (25:24:1)を加え、フェノール・クロロホルム抽出を行った。さらに750 μlの100%エタノールを加え、-80 ℃で30 分間静置してエタノール沈殿を行ってDNAを精製した。精製したDNAを鋳型として、反応溶液2.9 ml × 2本 (690 μg のHindIII処理したpUC18-CRISPR array-Sもしくは630 μg のHindIII処理したpUC18-CRISPR array-AS、67 mM HEPES-Na (pH 8.1)、1.7 mM Spermidine、17 mM DTT、34 mM KCl、4.25 mM NTP、30 mM MgCl2、600 U RNase inhibitor、1.25 U pyrophosphatase、400 μg T7 RNA Polymerase)を37 ℃ 、16 時間の条件でインキュベートし、in vitro転写反応を行った。反応溶液を遠心分離 (15300× g、4℃、5 分間) し、上清画分を回収した。上清画分を6% 変性PAGEにより展開し、UV 254 nmを照射して吸収された部分を切り出して、電気的にRNAをゲルから溶出させた。得られたCRISPR array-SおよびCRISPR arrau-ASを含む溶液を限界ろ過によって濃縮し、1 M KClとMilliQ水を用いて洗浄して、精製転写産物とした。

【0065】

Pre-crRNAのプロセシング
基質のCRISPR array-SとCRISPR array-ASを95℃で5 分間インキュベートし、その後氷冷することでRefoldingさせてから反応に使用した。反応溶液20 μl (2.2 μM CRISPR array-SもしくはCRISPR array-AS、4.4 μM 精製6His-ARI、1 × CutSmart Buffer)を37 ℃ で17 時間インキュベートした。反応溶液20 μlに反応停止溶液 (40 mM EDTA、0.2% SDS、8 M Urea、0.05% BPB、2 × TBE)を20 μl加えて95℃で2 分間インキュベートし、氷冷して反応停止させた。反応産物は15% 変性PAGEで分画し、エチジウムブロマイドを用いて検出した。

【0066】

6His-ARIと反応させたCRISPR array-SおよびCRISPR array-ASを変性PAGEによって分画した (図１１) 。CRISPR array-Sを基質とした反応では、6His-ARIを加えない場合 (レーン2) と比較し、50 nt付近にバンドが検出された(レーン3)。一方で、CRISPR array-ASについては、6His-ARIの有無にかかわらず、50 nt付近のバンドは検出されなかった。この結果、6His-ARI はCRISPR array-S RNAに作用して切断して50 nt程度の鎖長の切断産物を与え、これが成熟crRNAであると考えられる。ARIはCRISPR array-Sを認識し、プロセシングする活性を有する結論した。

【0067】

標的DNAの特異的切断活性
精製したARI-crRNA複合体を用いて標的DNAの切断反応を行った。標的DNAはCRISPRアレイ中の最も5′側のスペーサー配列を用いた。DNA基質はpUC18に推定PAM配列を接続させた標的配列を挿入して調製した。2種類のターゲットプラスミド、target-Fwとtarget-Rvを調製した。PAM配列はCas12j（TTA,TTC）を参考にして設計した。
・target-Fw：crRNAのターゲット鎖、非ターゲット鎖のうち、非ターゲット鎖の5′側がPAMであると予想して、ここに推定PAM配列のTTTTAをクローニングし、その下流にターゲット配列をクローニングしたもの
・target-Rv：Fwの逆向きで、crRNAの非ターゲット鎖の5′側がPAM配列だとすると、推定PAM領域がベクター由来のGATCCという配列になる。

【0068】

ターゲットプラスミド、ARIをそれぞれ、14 nM、690 nMになるように加えて、反応液20μlで37℃、30分と60分の反応を行なった。バッファーは1×Cutsmartを用いた。反応液をアガロースゲル電気絵移動に供し、DNAを臭化エチジウムで染色した(図１２)。その結果、両プラスミド共にARIによって、ターゲット配列特異的に切断されて線状化していることが検出された。また、FwとRvを比較すると、Rvの方が切断効率が高かった。これはおそらく仮定したPAM配列の違いによるものではないかと推測される。

【0069】

切断位置の同定
上記実験により、ARIはターゲットDNAの二本鎖を切断し、環状のプラスミドを線状化することがわかったので、その切断位置を調べた。上記の切断反応を行なった後、その産物をアガロースゲル電機泳動で分離して、切断産物をゲルから抽出した。このDNAを鋳型として、近傍に設定したプライマーから、ジデオキシ法によりシークエンシングを行なった。DNAの配列と設定したプライマーの位置を図１３に示す。プライマー伸長産物がランオフする位置がARIによる切断位置であると推定できる。配列解析の結果を図１４に示す。

【産業上の利用可能性】

【0070】

本発明は、ゲノム編集に利用できる。

【配列表フリーテキスト】

【0071】

配列番号１：ARIのアミノ酸配列を示す。
>results for 599 residue sequence ARI
Met Arg Glu Gly Pro Ala Leu Asn Leu Pro Gly Ser Gly Leu Ile Met Ala Thr Arg Val
1 5 10 15 20
Tyr Lys Tyr Gly Leu Val Pro Ile Gly Tyr Leu Ala Gln Glu Ala Arg Asp Glu Leu Trp
25 30 35 40
Arg Ala Asn Lys Leu Trp Asn Thr Leu Val Ala Ile His Arg Glu Ser Gln Glu Leu Arg
45 50 55 60
Asp Asp Ala Leu Arg Ala Ala Ser Val Glu Tyr Ser Ala Leu Leu Asp Asp Leu Asp Ala
65 70 75 80
Lys Asn Ala Glu Ile Gly Glu Ala Phe Val Gly Leu Arg Gln Val Arg Gln Glu Gln Gly
85 90 95 100
Thr Lys Asp Glu Ser Asn Pro Ala Leu Lys Ala Glu Arg Ala Thr Ile Asp Arg Leu Lys
105 110 115 120
Lys Glu Arg Asn Glu Leu Tyr Gly Pro Leu Lys Lys Ala Arg Gln Thr Ala Thr Lys Ser
125 130 135 140
Ile Asp Ser Lys Lys Leu Asn Asp Asp Phe Asn Ser Lys Val Arg Ala Ala Val Arg Val
145 150 155 160
Glu Ser Ser Gly Leu Tyr Ala Lys Thr Ala Asp Glu Val Ala Arg Asn Phe Lys Glu Ala
165 170 175 180
Arg Asp Lys Ala Leu Lys Ser Gly Ala Thr Leu Arg Phe His Arg Phe Asp Gly Thr Gly
185 190 195 200
Tyr Tyr Gln Phe Arg Phe Arg Arg Lys Gly Leu Met Val Asp Gly Val Ser Phe Ala Glu
205 210 215 220
Leu Phe Ala Gln Ser Glu Thr Asp Gly Arg Arg Leu Ile Phe Leu Asn Arg Asp Glu Thr
225 230 235 240
Arg Lys Lys Thr Arg Leu Arg Val Arg Ala Ile Leu Val Gly Gly Lys Ser Lys Asp Ser
245 250 255 260
Lys Val Tyr Gln Glu Phe Asp Leu Ile Leu His Arg Pro Ile Pro Asp Asp Ala Gln Ile
265 270 275 280
Gln Asn Gly Lys Ile Val Val Thr Arg Ala Gly Asp Arg Phe Lys Tyr Asp Leu Cys Leu
285 290 295 300
Thr Leu Arg Leu Pro Asp Thr Pro Leu Leu Gln Pro Asn Met Leu Lys Gly Thr Ile Gly
305 310 315 320
Val Asp Val Gly Phe Arg Lys Lys Gly Asp Thr Ile Ile Val Ala Thr Ser Ser Ser Glu
325 330 335 340
Asp Val His Glu Lys Pro Lys Glu Phe Val Val Pro Glu Glu Ile Ile Ser Ser Leu Thr
345 350 355 360
His Val Ile Asp Leu Gln Ser Glu Leu Asp Glu Thr Ala Glu Ala Leu Gly Lys Ser Val
365 370 375 380
Thr Ala Glu Leu Arg Ala Asn Pro Leu Pro Glu Glu His Gly Lys Phe Arg Leu Trp Ser
385 390 395 400
Ala Val Ala Asn Arg Pro Ala His Val Thr Leu Ser Phe Glu Thr Ala Tyr Lys Phe Ala
405 410 415 420
Leu Trp Leu Asn His Glu Pro Asp Asn Phe Thr Lys Glu Val Arg Asp Lys Phe Phe Tyr
425 430 435 440
Trp Trp Lys Gly Asn Ser Arg Lys Phe Arg Glu Leu His Asn Leu Arg Arg Lys Ala Leu
445 450 455 460
Leu Ser Arg Lys His Phe Tyr Arg Gln Ile Ala Ser Asp Met Val Ala Gln Lys Lys Leu
465 470 475 480
Ile Val Leu Glu Asp Ile Asp Leu Thr Val Phe Ala Glu Thr Arg Asp Lys Asn Thr Lys
485 490 495 500
Leu Ser Asn Lys Ala Arg Ala Gln Arg Phe Leu Ala Ser Leu Ala Glu Leu Lys Gly Ala
505 510 515 520
Ile Lys Asn Ala Ala Asp Arg Glu Gly Val Pro Val Val Glu Val Asn Pro Ala Tyr Thr
525 530 535 540
Ser Lys Thr Cys Ser Ala Cys Gly Tyr Ile Asn Lys Asp Leu Lys Ala Glu Lys Glu Trp
545 550 555 560
Thr Cys Pro Ser Cys Gly Ile Val His Asp Arg Asp Val Asn Ala Ala Ala Asn Leu Thr
565 570 575 580
Asn Met Gly Gln Arg Tyr Leu Leu Asp Ile Lys Asn Arg Thr Glu Glu Val Leu Glu
585 590 595

配列番号２：ARIをコードするヌクレオチド配列を示す。
DNA
ATGCGTGAAG GCCCCGCTTT GAACTTGCCC GGGAGCGGCT TGATTATGGC TACACGTGTC 60
TACAAGTACG GCTTAGTCCC CATAGGTTAC CTTGCTCAAG AAGCGAGAGA CGAGTTATGG 120
CGTGCAAATA AGCTATGGAA CACACTCGTA GCCATTCACC GTGAGAGCCA AGAACTGAGG 180
GATGACGCAC TTCGTGCTGC ATCAGTGGAA TACTCTGCTT TGCTTGATGA CCTTGATGCA 240
AAGAATGCCG AAATCGGTGA AGCCTTTGTT GGATTACGTC AGGTCCGTCA GGAGCAAGGT 300
ACTAAGGATG AAAGTAACCC CGCCTTAAAA GCAGAAAGAG CTACGATTGA CAGGCTGAAG 360
AAAGAACGAA ACGAACTCTA TGGCCCCCTG AAAAAGGCAA GGCAGACGGC AACAAAATCC 420
ATAGACAGTA AAAAGCTAAA CGACGATTTC AATTCAAAGG TTCGGGCCGC TGTCAGGGTT 480
GAGAGTTCAG GCTTATATGC CAAAACTGCC GATGAAGTTG CACGAAACTT TAAGGAAGCA 540
AGAGACAAGG CTCTTAAGTC TGGCGCCACC TTAAGGTTTC ATAGATTTGA TGGGACGGGC 600
TACTACCAGT TCCGGTTCCG GCGCAAAGGC TTAATGGTTG ATGGCGTGAG CTTCGCTGAG 660
TTGTTCGCTC AGAGTGAGAC CGATGGACGC CGCCTCATTT TCCTAAACAG GGACGAAACC 720
CGCAAAAAGA CTAGGCTTAG GGTACGTGCA ATATTGGTTG GTGGCAAATC GAAGGACAGT 780
AAAGTCTATC AGGAGTTTGA CCTTATCCTT CACAGACCCA TCCCAGATGA TGCTCAGATT 840
CAGAACGGCA AGATCGTTGT AACTAGGGCT GGTGACAGGT TTAAATACGA CCTTTGCCTC 900
ACTTTGAGGT TGCCTGATAC GCCGCTGCTA CAGCCGAATA TGCTCAAGGG AACTATAGGG 960
GTTGATGTAG GCTTCCGCAA AAAAGGTGAC ACGATCATCG TTGCTACTTC ATCAAGTGAA 1020
GATGTCCATG AAAAGCCAAA AGAGTTTGTT GTTCCAGAGG AGATCATCTC CTCCTTGACC 1080
CACGTCATTG ATCTGCAGTC AGAGCTAGAT GAAACGGCAG AGGCATTAGG GAAATCGGTC 1140
ACTGCAGAAC TTAGGGCCAA CCCACTTCCT GAAGAACATG GCAAATTCAG GCTCTGGTCT 1200
GCTGTCGCAA ATAGACCAGC CCACGTGACG CTCTCTTTTG AGACTGCGTA CAAGTTTGCT 1260
CTTTGGCTGA ACCACGAACC GGACAACTTT ACGAAGGAAG TCAGAGACAA GTTCTTCTAC 1320
TGGTGGAAGG GCAACAGCCG GAAGTTTAGG GAGCTACACA ACCTCCGCCG CAAAGCTCTG 1380
CTGTCACGCA AACATTTCTA CCGTCAGATT GCGTCTGATA TGGTCGCACA GAAAAAGCTA 1440
ATTGTGCTGG AGGACATTGA CCTAACTGTC TTTGCCGAGA CCAGAGACAA GAACACCAAG 1500
CTCTCCAACA AAGCTAGAGC ACAGCGGTTC CTTGCATCAT TGGCGGAACT CAAAGGAGCC 1560
ATAAAAAATG CCGCAGATAG AGAAGGTGTT CCGGTAGTTG AGGTTAACCC AGCTTATACG 1620
TCAAAGACTT GCTCTGCTTG CGGGTACATC AACAAAGACC TTAAGGCAGA AAAGGAATGG 1680
ACCTGTCCTT CCTGTGGCAT TGTTCATGAT CGTGACGTCA ATGCCGCAGC CAACCTAACG 1740
AACATGGGGC AACGATATTT GCTGGACATA AAAAACCGGA CAGAAGAGGT CTTAGAGTGA 1800

【図1】