(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-03-14
(45)【発行日】2024-03-25
(54)【発明の名称】CRISPRタイプI-Dシステムを利用した標的ヌクレオチド配列改変技術
(51)【国際特許分類】
C12N 15/09 20060101AFI20240315BHJP
C12N 15/55 20060101ALI20240315BHJP
C12N 15/85 20060101ALI20240315BHJP
A01K 67/027 20240101ALI20240315BHJP
A01H 1/00 20060101ALI20240315BHJP
C12N 5/10 20060101ALI20240315BHJP
C12P 21/02 20060101ALI20240315BHJP
【FI】
C12N15/09 110
C12N15/55 ZNA
C12N15/85 Z
A01K67/027
A01H1/00 A
C12N5/10
C12P21/02 C
(21)【出願番号】P 2022555567
(86)(22)【出願日】2021-10-07
(86)【国際出願番号】 JP2021037194
(87)【国際公開番号】W WO2022075419
(87)【国際公開日】2022-04-14
【審査請求日】2023-02-13
(31)【優先権主張番号】P 2020170714
(32)【優先日】2020-10-08
(33)【優先権主張国・地域又は機関】JP
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成28年度、国立研究開発法人新エネルギー・産業技術総合開発機構「植物等の生物を用いた高機能品生産技術の開発/植物の生産性制御に係る共通基盤技術開発/進化工学的および分子動力学的手法による新規ゲノム編集システムの創出」委託研究、産業技術力強化法第17条の適用を受ける特許出願
【早期審査対象出願】
(73)【特許権者】
【識別番号】304020292
【氏名又は名称】国立大学法人徳島大学
(74)【代理人】
【識別番号】100106518
【氏名又は名称】松谷 道子
(74)【代理人】
【識別番号】100122301
【氏名又は名称】冨田 憲史
(74)【代理人】
【識別番号】100170520
【氏名又は名称】笹倉 真奈美
(72)【発明者】
【氏名】刑部 敬史
(72)【発明者】
【氏名】刑部 祐里子
(72)【発明者】
【氏名】和田 直樹
【審査官】松田 芳子
(56)【参考文献】
【文献】国際公開第2019/039417(WO,A1)
【文献】国際公開第2020/184723(WO,A1)
【文献】Mol. Cell,2020年11月27日,vol.80, p.971-979
【文献】Commun. Biol.,2020年11月06日,vol.3,article no.648
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/09
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
標的ヌクレオチド配列を標的化する方法であって、細胞(但し、ヒトの生殖細胞、ヒトの受精卵、およびヒトの胚細胞を除く)中に、
(i)CRISPRタイプI-DのCasタンパク質 Cas5d、Cas6d、およびCas7d、およびCas10d、またはこれらのタンパク質をコードする核酸、
(ii)Cas10dのC末端部分配列からなるポリペプチドであって、Cas10dのN末端側のHDドメインを含まず、かつ、C末端
から135~170アミノ酸を含むポリペプチド、または該ポリペプチドをコードする核酸、および
(iii)前記標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、または該crRNAをコードするDNA
を導入することを含む方法、
但し、ヒトの生体内における方法を除く。
【請求項2】
標的ヌクレオチド配列を改変する方法であって、細胞(但し、ヒトの生殖細胞、ヒトの受精卵、およびヒトの胚細胞を除く)中に、
(i)CRISPRタイプI-DのCasタンパク質 Cas3d、Cas5d、Cas6d、およびCas7d、およびCas10d、またはこれらのタンパク質をコードする核酸、
(ii)Cas10dのC末端部分配列からなるポリペプチドであって、Cas10dのN末端側のHDドメインを含まず、かつ、C末端
から135~170アミノ酸を含むポリペプチド、または該ポリペプチドをコードする核酸、および
(iii)前記標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、または該crRNAをコードするDNA
を導入することを含む方法、
但し、ヒトの生体内における方法を除く。
【請求項3】
改変が塩基の欠失、挿入、又は置換である、請求項2記載の方法。
【請求項4】
標的遺伝子の転写を制御する方法であって、細胞(但し、ヒトの生殖細胞、ヒトの受精卵、およびヒトの胚細胞を除く)中に、
(i)CRISPRタイプI-DのCasタンパク質 Cas5d、Cas6d、およびCas7d、およびCas10d、またはこれらのタンパク質をコードする核酸、
(ii)Cas10dのC末端部分配列からなるポリペプチドであって、Cas10dのN末端側のHDドメインを含まず、かつ、C末端から135~170アミノ酸を含むポリペプチド、または該ポリペプチドをコードする核酸、および
(iii)前記標的遺伝子の少なくとも一部のヌクレオチド配列と塩基対を形成する配列を含むcrRNA、または該crRNAをコードするDNA
を導入することを含む方法
、
但し、ヒトの生体内における方法を除く。
【請求項5】
標的遺伝子の転写を制御する方法であって、細胞(但し、ヒトの生殖細胞、ヒトの受精卵、およびヒトの胚細胞を除く)中に、
(i)CRISPRタイプI-DのCasタンパク質 Cas3d、Cas5d、Cas6d、およびCas7d、およびCas10d、またはこれらのタンパク質をコードする核酸、
(ii)Cas10dのC末端部分配列からなるポリペプチドであって、Cas10dのN末端側のHDドメインを含まず、かつ、C末端から135~170アミノ酸を含むポリペプチド、または該ポリペプチドをコードする核酸、および
(iii)前記標的遺伝子の少なくとも一部のヌクレオチド配列と塩基対を形成する配列を含むcrRNA、または該crRNAをコードするDNA
を導入することを含む方法
、
但し、ヒトの生体内における方法を除く。
【請求項6】
前記細胞が真核細胞である、請求項1~5のいずれか1項記載の方法。
【請求項7】
(i)CRISPRタイプI-DのCasタンパク質 Cas5d、Cas6d、およびCas7d、およびCas10d、
(ii)Cas10dのC末端部分配列からなるポリペプチドであって、Cas10dのN末端側のHDドメインを含まず、かつ、C末端
から135~170アミノ酸を含むポリペプチド、および
(iii)標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA
を含む複合体。
【請求項8】
Cas3dをさらに含む、請求項
7記載の複合体。
【請求項9】
(i)CRISPRタイプI-DのCasタンパク質 Cas5d、Cas6d、およびCas7d、およびCas10dをコードする核酸、
(ii)Cas10dのC末端部分配列からなるポリペプチドであって、Cas10dのN末端側のHDドメインを含まず、かつ、C末端
から135~170アミノ酸を含むポリペプチドをコードする核酸、および
(iii)標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNAまたは該crRNAをコードするDNA
を含むベクター。
【請求項10】
Cas3dをコードする核酸をさらに含む、請求項
9記載のベクター。
【請求項11】
(i)CRISPRタイプI-DのCasタンパク質 Cas5d、Cas6d、およびCas7d、およびCas10dをコードする核酸、
(ii)Cas10dのC末端部分配列からなるポリペプチドであって、Cas10dのN末端側のHDドメインを含まず、かつ、C末端側から135~170アミノ酸を含むポリペプチドをコードする核酸、および
(iii)標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNAまたは該crRNAをコードする核酸、または
前記(i)~(iii)の核酸およびCas3dをコードする核酸
が2以上のベクターに含まれる、
該2つ以上のベクターを含む組成物。
【請求項12】
請求項
7または8記載の複合体をコードするDNA分子。
【請求項13】
標的ヌクレオチド配列を標的化するためのキットであって、
(i)CRISPRタイプI-DのCasタンパク質 Cas5d、Cas6d、およびCas7d、およびCas10d、またはこれらのタンパク質をコードする核酸、
(ii)Cas10dのC末端部分配列からなるポリペプチドであって、Cas10dのN末端側のHDドメインを含まず、かつ、C末端
から135~170アミノ酸を含むポリペプチド、または該ポリペプチドをコードする核酸、および
(iii)前記標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、または該crRNAをコードするDNA
を含むキット。
【請求項14】
標的ヌクレオチド配列を改変するためのキットであって、
(i)CRISPRタイプI-DのCasタンパク質 Cas3d、Cas5d、Cas6d、およびCas7d、およびCas10d、またはこれらのタンパク質をコードする核酸、
(ii)Cas10dのC末端部分配列からなるポリペプチドであって、Cas10dのN末端側のHDドメインを含まず、かつ、C末端
から135~170アミノ酸を含むポリペプチド、または該ポリペプチドをコードする核酸、および
(iii)前記標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、または該crRNAをコードするDNA
を
含むキット。
【請求項15】
CRISPRタイプI-Dシステムを細胞(但し、ヒトの生殖細胞、ヒトの受精卵、およびヒトの胚細胞を除く)に導入することを含む標的ヌクレオチド配列の標的化において標的化効率を改善する方法であって、Cas10dのC末端部分配列からなるポリペプチドであって、Cas10dのN末端側のHDドメインを含まず、かつ、C末端
から135~170アミノ酸を含むポリペプチド、または該ポリペプチドをコードする核酸を用いることを含む方法、
但し、ヒトの生体内における方法を除く。
【請求項16】
CRISPRタイプI-Dシステムを細胞(但し、ヒトの生殖細胞、ヒトの受精卵、およびヒトの胚細胞を除く)に導入することを含む標的ヌクレオチド配列の改変において改変効率を改善する方法であって、Cas10dのC末端部分配列からなるポリペプチドであって、Cas10dのN末端側のHDドメインを含まず、かつ、C末端
から135~170アミノ酸を含むポリペプチド、または該ポリペプチドをコードする核酸を用いることを含む方法、
但し、ヒトの生体内における方法を除く。
【請求項17】
CRISPRタイプI-Dシステムを用いる標的ヌクレオチド配列の標的化において標的化効率を改善するための組成物であって、Cas10dのC末端部分配列からなるポリペプチドであって、Cas10dのN末端側のHDドメインを含まず、かつ、C末端
から135~170アミノ酸を含むポリペプチド、または該ポリペプチドをコードする核酸を含む組成物。
【請求項18】
CRISPRタイプI-Dシステムを用いる標的ヌクレオチド配列の改変において改変効率を改善するための組成物であって、Cas10dのC末端部分配列からなるポリペプチドであって、Cas10dのN末端側のHDドメインを含まず、かつ、C末端
から135~170アミノ酸を含むポリペプチド、または該ポリペプチドをコードする核酸を含む組成物。
【請求項19】
細胞(但し、ヒトの生殖細胞、ヒトの受精卵、およびヒトの胚細胞を除く)中に、
(i)CRISPRタイプI-DのCasタンパク質 Cas3d、Cas5d、Cas6d、およびCas7d、およびCas10d、またはこれらのタンパク質をコードする核酸、
(ii)Cas10dのC末端部分配列からなるポリペプチドであって、Cas10dのN末端側のHDドメインを含まず、かつ、C末端
から135~170アミノ酸を含むポリペプチド、または該ポリペプチドをコードする核酸、および
(iii)標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、または該crRNAをコードするDNA
を導入することを含む、標的ヌクレオチド配列が改変された細胞の製造方法、
但し、ヒトの生体内における方法を除く。
【請求項20】
請求項
19に記載の方法によって標的ヌクレオチド配列が改変された植物細胞を製造することを含む、標的ヌクレオチド配列が改変された植物の製造方法。
【請求項21】
請求項
19に記載の方法によって標的ヌクレオチド配列が改変された非ヒト動物細胞を製造することを含む、標的ヌクレオチド配列が改変された非ヒト動物の製造方法。
【請求項22】
標的ヌクレオチド配列を標的化する方法であって、標的ヌクレオチド配列を含む単離核酸に、
(i)CRISPRタイプI-DのCasタンパク質 Cas5d、Cas6d、およびCas7d、およびCas10d、
(ii)Cas10dのC末端部分配列からなるポリペプチドであって、Cas10dのN末端側のHDドメインを含まず、かつ、C末端
から135~170アミノ酸を含むポリペプチド、および
(iii)前記標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、または該crRNAをコードするDNA
を接触させることを含む方法。
【請求項23】
標的ヌクレオチド配列を改変する方法であって、標的ヌクレオチド配列を含む単離核酸に、
(i)CRISPRタイプI-DのCasタンパク質 Cas3d、Cas5d、Cas6d、およびCas7d、およびCas10d、
(ii)Cas10dのC末端部分配列からなるポリペプチドであって、Cas10dのN末端側のHDドメインを含まず、かつ、C末端
から135~170アミノ酸を含むポリペプチド、および
(iii)前記標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、または該crRNAをコードするDNA
を接触させことを含む方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)タイプI-Dシステムを利用した、標的ヌクレオチド配列を標的化する方法、標的ヌクレオチド配列を特異的に改変する方法、標的遺伝子の発現を抑制する方法、および該方法に用いられるCas(CRISPR-associated(CRISPR関連))タンパク質およびcrRNA(CRISPR RNA)を含む複合体ならびにキット等に関する。
【背景技術】
【0002】
CRISPR-Casシステムは、ウイルス、プラスミドおよびその他の外来遺伝子エレメントから細菌および古細菌を保護する、細菌および古細菌に見られる獲得免疫システムである。CRISPR-Casシステムは、該システムを構成しているCasタンパク質および分子メカニズムの違いによって、2つのクラス、6つの異なるタイプ(I~VI)、および少なくとも34種類のサブタイプに分類される。
【0003】
タイプIおよびIIシステムのメカニズムでは、crRNAとCasエフェクタータンパク質との複合体が、外来DNA中のプロトスペーサー隣接モチーフ(PAM)と呼ばれる短い(典型的には3~5塩基長の)配列エレメントを認識する。タイプIまたはII crRNAとCasエフェクタータンパク質との複合体は、PAM認識後、局所的にDNA対合を崩壊してR-ループ構造を形成し、crRNAガイドエレメントが相補的な標的鎖と塩基対を形成して非標的DNA鎖と置き換わる。該crRNA-Cas複合体による二本鎖DNA標的の結合および巻き戻しが、Cas3、Cas9およびCas12ヌクレアーゼなどのタイプ特異的CasエフェクターヌクレアーゼによるDNA切断および分解に必要とされる。
【0004】
CRISPRタイプIには、種々のサブタイプが存在する。クラス1システムには、Cascade(CRISPR-associated-complex for antiviral defense)と呼ばれる、Cas5、Cas6、Cas7およびCas8などの標的認識モジュールと、Cas3などのDNA切断モジュールが存在する(非特許文献1、非特許文献2)。ゲノム編集技術において、クラス1 CRISPRシステムは、クラス2よりも一般的ではないが、ゲノム編集ツールとして、例えば長い領域のゲノム欠失および長いgRNA配列を包含する多様な変異プロフィールなど、Cas9およびCpf1と比べていくつかの利点を有する可能性が示唆された(非特許文献1、特許文献1)。今までに研究されたクラス1 CRISPR type I-Eシステムでは、2-300bから100kbの塩基欠失が主にPAM配列の5’上流側に生じることが報告された(非特許文献3)。
【0005】
今までに研究されたクラス1 CRISPR type I-Eシステムは、6つのCasタンパク質(Cas3e、Cas5e、Cas6e、Cas7e、Cas8eおよびCas11e)と標的化を行うcrRNAから構成される。ここでCas8eおよびCas11eはそれぞれラージサブユニット(large subunit)およびスモールサブユニット(small subunit)と呼ばれ、Casタンパク質複合体と標的DNAとの結合を安定に保持するサポートタンパク質の機能を持っていると考えられている(非特許文献1)。
【0006】
一方、発明者らは以前に、CRISPRクラス1タイプIのサブタイプ:CRISPR type I-D(以下、「TiD」という)システムをコードするCRISPRゲノム遺伝子座を同定し、該システムがCas3d、Cas5d、Cas6d、Cas7d、およびCas10dの5つのCasタンパク質および標的化を行うcrRNAによってゲノム編集が実現できることを見出した(特許文献1、特許文献2)。ここで、TiD遺伝子座には、CRISPR type I-EシステムのスモールサブユニットであるCas11eに相当する遺伝子は見出されなかった。
【0007】
近年、McBrideらは、Synechocystis sp. PCC6803株のTiD遺伝子座の解析を行い、Cas10d遺伝子座の遺伝子内部にリボソーム結合部位(RBS)および翻訳開始コドンが存在し、一つのストップコドンを共通にして、Cas10d遺伝子座から2つのタンパク質、Cas10dおよびCas11dが翻訳されていること示した(非特許文献4)。しかしながら、現在に至るまで、Cas11dが標的配列改変技術に果たす機能は見出されていない。
【先行技術文献】
【特許文献】
【0008】
【文献】国際公開第2019/039417
【文献】国際公開第2020/184723
【非特許文献】
【0009】
【文献】Makarova K.S., et al., Nat. Rev. Microbiol., 13, 722-736(2015)図
【文献】Makarova, K.S., et al., Cell,168,946-946(2017)
【文献】Dolan, A.E. et al., Mol Cell 74, 936-950 (2019)
【文献】McBride, T.M. et al., bioRxiv, doi: https://doi.org/10.1101/2020.04.18.045682(2020)
【発明の概要】
【発明が解決しようとする課題】
【0010】
本発明は、TiDによる標的配列標的化および改変効率を向上させることを目的とした。
【課題を解決するための手段】
【0011】
発明者らは、鋭意研究の結果、驚くべきことに、これまで報告されていたTiDシステムを構成する5種のCasタンパク質の発現に加え、Cas10dのC末端領域を含む部分アミノ酸配列を含むポリペプチドを別途発現させることによって、標的ヌクレオチド配列を高効率で改変できることを見出した。かくして本発明を完成させた。
【0012】
すなわち、本発明は以下の態様を提供する。
[1]標的ヌクレオチド配列を標的化する方法であって、細胞中に、
(i)CRISPRタイプI-DのCasタンパク質 Cas5d、Cas6d、およびCas7d、およびCas10dのN末端側のHDドメインを含むポリペプチド、またはこれらのタンパク質およびポリペプチドをコードする核酸、
(ii)Cas10dのN末端側のHDドメインを含まず、Cas10dのC末端部分配列を含むポリペプチド、または該ポリペプチドをコードする核酸、および
(iii)前記標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、または該crRNAをコードするDNA
を導入することを含む方法。
[2]標的ヌクレオチド配列を改変する方法であって、細胞中に、
(i)CRISPRタイプI-DのCasタンパク質 Cas3d、Cas5d、Cas6d、およびCas7d、およびCas10dのN末端側のHDドメインを含むポリペプチド、またはこれらのタンパク質およびポリペプチドをコードする核酸、
(ii)Cas10dのN末端側のHDドメインを含まず、Cas10dのC末端部分配列を含むポリペプチド、または該ポリペプチドをコードする核酸、および
(iii)前記標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、または該crRNAをコードするDNA
を導入することを含む方法。
[3]標的遺伝子の転写を制御する方法であって、前記標的ヌクレオチド配列が標的遺伝子の少なくとも一部のヌクレオチド配列である、上記[1]または[2]記載の方法。
[4]前記Cas10dのC末端部分配列が100~400アミノ酸からなる配列である、上記[1]~[3]のいずれか1項記載の方法。
[5]前記細胞が真核細胞である、上記[1]~[4]のいずれか1項記載の方法。
[6]改変が塩基の欠失、挿入、又は置換である、上記[2]~[5]のいずれか1項記載の方法。
[7](i)CRISPRタイプI-DのCasタンパク質 Cas5d、Cas6d、およびCas7d、およびCas10dのN末端側のHDドメインを含むポリペプチド、
(ii)Cas10dのN末端側のHDドメインを含まず、Cas10dのC末端部分配列を含むポリペプチド、および
(iii)標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA
を含む複合体。
[8]Cas3dをさらに含む、上記[7]記載の複合体。
[9]前記Cas10dのC末端部分配列が100~400アミノ酸からなる配列である、上記[7]または[8]記載の複合体。
[10](i)CRISPRタイプI-DのCasタンパク質 Cas5d、Cas6d、およびCas7d、およびCas10dのN末端側のHDドメインを含むポリペプチドをコードする核酸、
(ii)Cas10dのN末端側のHDドメインを含まず、Cas10dのC末端部分配列を含むポリペプチドをコードする核酸、および
(iii)標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNAまたは該crRNAをコードするDNA
を含むベクター。
[11]Cas3dをコードする核酸をさらに含む、上記[10]記載のベクター。
[12]前記(i)~(iii)の核酸、または前記(i)~(iii)の核酸およびCas3dをコードする核酸が1つまたは2以上のベクターに含まれる、上記[10]または[11]記載の発現ベクター。
[13]前記Cas10dのC末端部分配列が100~400アミノ酸からなる配列である、上記[11]または[12]記載のベクター。
[14]上記[7]~[9]のいずれか1項記載の複合体をコードするDNA分子。
[15]標的ヌクレオチド配列を標的化するためのキットであって、
(i)CRISPRタイプI-DのCasタンパク質 Cas5d、Cas6d、およびCas7d、およびCas10dのN末端側のHDドメインを含むポリペプチド、またはこれらのタンパク質およびポリペプチドをコードする核酸、
(ii)Cas10dのN末端側のHDドメインを含まず、Cas10dのC末端部分配列を含むポリペプチド、または該ポリペプチドをコードする核酸、および
(iii)前記標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、または該crRNAをコードするDNA
を含むキット。
[16]標的ヌクレオチド配列を改変するためのキットであって、
(i)CRISPRタイプI-DのCasタンパク質 Cas3d、Cas5d、Cas6d、およびCas7d、およびCas10dのN末端側のHDドメインを含むポリペプチド、またはこれらのタンパク質およびポリペプチドをコードする核酸、
(ii)Cas10dのN末端側のHDドメインを含まず、Cas10dのC末端部分配列を含むポリペプチド、または該ポリペプチドをコードする核酸、および
(iii)前記標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、または該crRNAをコードするDNA
をキット。
[17]前記Cas10dのC末端部分配列が100~400アミノ酸からなる配列である、上記[15]または[16]記載のキット。
[18]CRISPRタイプI-Dシステムを用いる標的ヌクレオチド配列の標的化において標的化効率を改善する方法であって、Cas10dのN末端側のHDドメインを含まず、Cas10dのC末端部分配列を含むポリペプチド、または該ポリペプチドをコードする核酸を用いることを含む方法。
[19]CRISPRタイプI-Dシステムを用いる標的ヌクレオチド配列の改変において改変効率を改善する方法であって、Cas10dのN末端側のHDドメインを含まず、Cas10dのC末端部分配列を含むポリペプチド、または該ポリペプチドをコードする核酸を用いることを含む方法。
[20]CRISPRタイプI-Dシステムを用いる標的ヌクレオチド配列の標的化において標的化効率を改善するための組成物であって、Cas10dのN末端側のHDドメインを含まず、Cas10dのC末端部分配列を含むポリペプチド、または該ポリペプチドをコードする核酸を含む組成物。
[21]CRISPRタイプI-Dシステムを用いる標的ヌクレオチド配列の改変において改変効率を改善するための組成物であって、Cas10dのN末端側のHDドメインを含まず、Cas10dのC末端部分配列を含むポリペプチド、または該ポリペプチドをコードする核酸を含む組成物。
[22]細胞中に、
(i)CRISPRタイプI-DのCasタンパク質 Cas3d、Cas5d、Cas6d、およびCas7d、およびCas10dのN末端側のHDドメインを含むポリペプチド、またはこれらのタンパク質およびポリペプチドをコードする核酸、
(ii)Cas10dのN末端側のHDドメインを含まず、Cas10dのC末端部分配列を含むポリペプチド、または該ポリペプチドをコードする核酸、および
(iii)標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、または該crRNAをコードするDNA
を導入することを含む、標的ヌクレオチド配列が改変された細胞の製造方法。
[23]上記[22]に記載の方法によって標的ヌクレオチド配列が改変された植物細胞を製造することを含む、標的ヌクレオチド配列が改変された植物の製造方法。
[24]上記[22]に記載の方法によって標的ヌクレオチド配列が改変された非ヒト動物細胞を製造することを含む、標的ヌクレオチド配列が改変された非ヒト動物の製造方法。
[25]標的ヌクレオチド配列を標的化する方法であって、標的ヌクレオチド配列を含む単離核酸に、
(i)CRISPRタイプI-DのCasタンパク質 Cas5d、Cas6d、およびCas7d、およびCas10dのN末端側のHDドメインを含むポリペプチド、
(ii)Cas10dのN末端側のHDドメインを含まず、Cas10dのC末端部分配列を含むポリペプチド、および
(iii)前記標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、または該crRNAをコードするDNA
を接触させることを含む方法。
[26]標的ヌクレオチド配列を改変する方法であって、標的ヌクレオチド配列を含む単離核酸に、
(i)CRISPRタイプI-DのCasタンパク質 Cas3d、Cas5d、Cas6d、およびCas7d、およびCas10dのN末端側のHDドメインを含むポリペプチド、
(ii)Cas10dのN末端側のHDドメインを含まず、Cas10dのC末端部分配列を含むポリペプチド、および
(iii)前記標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、または該crRNAをコードするDNA
を接触させことを含む方法。
【発明の効果】
【0013】
本発明によれば、特定のDNAを標的化するように操作されたTiD crRNAを含むTiDシステムを用いることにより、細胞、好ましくは動物および植物細胞において効率的に部位特異的変異を誘導することができる。驚くべきことに、本発明によれば、TiDシステムのCasエフェクタータンパク質であるCas3d、Cas5d、Cas6d、Cas7d、およびCas10dに加えて、Cas10dのC末端部分配列(以下、「Cas10d C-ter」ともいう)を発現させることで、TiDシステムによる標的配列の標的化および改変の効率を数倍上昇させることができる。さらに、本発明の技術を用いれば、標的配列近傍の変異様式として、より長い欠失を生じさせる。
【図面の簡単な説明】
【0014】
【
図1-1】各種type I-D Cas10d C-terをCas11eとアラインメント解析により比較した。
【
図1-2】各種type I-D Cas10d C-terをCas11eとアラインメント解析により比較した(
図1-1のつづき)。
【
図1-3】各種type I-D Cas10d C-terをCas11eとアラインメント解析により比較した(
図1-2のつづき)。
【
図2】動物細胞内におけるCas10d C-terタンパク質過剰発現によるゲノム編集活性に及ぼす効果を示す。
【
図3】CRISPR TiDによって誘導されるAAVS遺伝子における長鎖領域欠失変異の検出。A)ヒトAAVS遺伝子構造、gRNA位置(白抜き三角)、および変異を増幅するための種々のプライマーセット(黒矢印)を示した。B)アガロースゲル上で分離したPCR増幅フラグメントを示した。黒三角は長鎖欠失由来のPCR産物を示す。C)Cas11d発現ベクターを含むTiDによって誘導された長鎖領域欠失パターン。図中の黒バーは、標的配列から5’上流領域の欠失を、灰色バーは標的配列から3’下流領域の欠失をそれぞれ示す。バーの左側の数値は総塩基欠失長を示す。D)Cas11d発現ベクターを含まないTiDによって誘導された長鎖領域欠失パターン。図中の黒バーは、標的配列から5’上流領域の欠失を、灰色バーは標的配列から3’下流領域の欠失をそれぞれ示す。バーの左側の数値は総塩基欠失長を示す。
【発明を実施するための形態】
【0015】
TiDシステムは、具体的には、TiD Casタンパク質のうち、Casエフェクタータンパク質として、Cas3d、Cas5d、Cas6d、Cas7dおよびCas10dと、TiD crRNAとを含む。TiDシステムにおいて、Cas5d、Cas6dおよびCas7dは標的認識モジュール(Cascade)を構成し、Cas3dおよびCas10dはポリヌクレオチド切断モジュールを構成することが知られていた(特許文献1)。さらに、発明者らの以前の研究により、切断モジュールの構成要素のうちCas10dがポリヌクレオチド分解作用(ヌクレアーゼ活性)を有し、Cas3dはヌクレアーゼ活性を有しないことが明らかにされた。すなわち、TiDシステムでは、TiD crRNAと標的認識モジュールとが標的ヌクレオチド配列を標的化してポリヌクレオチド切断モジュールを該標的ヌクレオチド配列付近に導き、Cas10dの作用により該標的ヌクレオチド配列が切断される。TiDシステムにおいて、TiD crRNAは、標的ヌクレオチド配列と塩基対を形成する配列(例えば、標的ヌクレオチド配列に相補的な配列)を含む。
【0016】
本発明は、TiDシステムを利用した標的ヌクレオチド配列を標的化する方法(以下、「本発明の標的配列ターゲティング方法」ともいう)、標的ヌクレオチド配列を改変する方法(以下、「本発明の標的配列改変方法」ともいう)、および標的遺伝子の発現を制御する方法(以下、「本発明の標的遺伝子発現制御方法」ともいう)を提供する。さらに、本発明は、これらの方法に使用される、CRISPRタイプI-D関連Casタンパク質およびcrRNAを含む複合体(以下、「本発明の複合体」ともいう)、および該複合体をコードする核酸分子を含むベクター(以下、「本発明のベクター」ともいう)およびキット(以下、「本発明のキット」ともいう)を提供する。
【0017】
とりわけ本発明は、TiDシステムにおける上記Casタンパク質の他に、Cas10dのC末端部分配列を含むポリペプチドを用いることを特徴とする。興味深いことに、Cas10dのC末端側配列にはCas11eと共通のα-ヘリックス領域が保存されていることが分かった(実施例1)。Cas10dのC末端がCas11eの機能を果たしていると考えられ、それ故、TiDでは、CRISPR type I-EのようにCas11eの発現は必要とされないと考えられた。しかしながら、驚くべきことに、Cas10dのC末端部分配列を含むポリペプチドを発現させることにより、TiDシステムの効果が改善されることが分かった。したがって、本発明はさらに、Cas10dのC末端部分配列を含むポリペプチドを用いることにより、TiDシステムを利用した標的ヌクレオチド配列の標的化および改変の効率を改善する方法、ならびにCas10dのC末端部分配列を含むポリペプチドを含む、TiDシステムを利用した標的ヌクレオチド配列の標的化および改変の効率を改善する組成物を提供する。
【0018】
(1)細胞
本発明において、細胞は、原核細胞または真核細胞のいずれの細胞であってもよく、特に限定されない。例えば、細菌、古細菌、真菌類(例えば、糸状菌、酵母等)、植物細胞、昆虫細胞、動物細胞(例えば、ヒト細胞、非ヒト動物細胞、哺乳類動物細胞、非哺乳動物脊椎動物細胞、無脊椎動物細胞等)が挙げられる。好ましくは、真核細胞が使用される。本明細書において使用される場合、「細胞」とは、生体から単離された細胞、生体内(例えば、動物体または植物の体内)に存在している細胞、生体(例えば、動物体、または植物体)、または培養細胞のいずれも包含する。本発明の方法は、生体から単離された細胞、生体内に存在する細胞、または生体のいずれの器官および組織に由来する細胞に適用してもよい。例えば、ヒト以外の動物の体内に存在する細胞またはヒト以外動物体に適用してもよい。例えば、動物細胞には、限定するものではないが、生殖細胞、受精卵、胚細胞、幹細胞(例えば、iPS細胞、胚性幹細胞、体性幹細胞等も含む)、体細胞などが包含される。例えば、植物細胞には、限定するものではないが、生殖細胞、受精卵、胚細胞、体細胞などが包含され、プロトプラストを用いてもよい。
【0019】
(2)Casエフェクタータンパク質および該タンパク質をコードする核酸
本発明で使用されるCasエフェクタータンパク質は、TiDのCasタンパク質のうち、Cas3d、Cas5d、Cas6d、Cas7d、およびCas10dである。Cas3d、Cas5d、Cas6d、Cas7d、およびCas10dは、いずれの細菌または古細菌由来のものであってもよく、例えば、Microcystis aeruginosa、Acetohalobium arabaticum、Ammonifex degensii、Anabaena cylindrica、Anabaena variabilis、Caldicellulosiruptor lactoaceticus、Caldilinea aerophila、Crinalium epipsammum、Cyanothece Sp.、Cylindrospermum stagnale、Haloquadratum walsbyi、Halorubrum lacusprofundi、Methanocaldococcus vulcanius、Methanospirillum hungatei、Natrialba asiatica、Natronomonas pharaonis、Nostoc punctiforme、Phormidesmis priestleyi、Oscillatoria acuminata、Picrophilus torridus、Spirochaeta thermophila、Stanieria cyanosphaera、Sulfolobus acidocaldarius、Sulfolobus islandicus、Synechocystis Sp.、Thermacetogenium phaeum、Thermofilum pendens、Calothrix parietina、Gloeothece citriformis、Gloeobacter kilaueensis、Gloeocapsa sp.、Halothece sp.、Nostoc sp.、Rivularia sp.などの菌株由来のものであってもよい。本発明において、Cas3d、Cas5d、Cas6d、Cas7d、およびCas10dは、2種以上の菌種由来のものであってもよく、または同じ菌種由来のものであってもよい。好ましくは同じ菌種由来のものが用いられる。上記Casタンパク質のアミノ酸配列およびヌクレオチド配列情報は、例えば、NCBI GenBank等の公開されたデータベースから入手可能である。また、メタゲノム解析などにより得られた微生物ゲノムデータからBLASTプログラムを利用することで、新規の微生物種からの配列取得も可能である。
【0020】
上記Casタンパク質は、既知の方法によって得ることができ、例えば、アミノ酸配列情報を基に化学合成するか、またはCasタンパク質をコードする核酸を適当なベクター等を介して細胞中に導入し、該細胞中で産生させてもよい。上記Casタンパク質をコードする核酸は、既知の方法によって得ることができ、例えば、アミノ酸配列情報を基に、該核酸を導入する宿主細胞における翻訳に最適化されたコドンを選択し、化学合成等により構築してもよい。宿主細胞において使用頻度の高いコドンを使用することにより、タンパク質の発現量の増加させることができる。該核酸としては、例えば、mRNA等のRNA、またはDNAが挙げられる。
【0021】
Cas10dは、N末端領域にHD(ヒスチジン-アスパラギン酸)ドメインを有し、該ドメインがDNA切断において機能することが知られている(特許文献2)。また、本発明において、Cas10dのC末端側には複数のα-ヘリックス領域が存在することが見出された(実施例1)。したがって、本発明においてCas10dは、少なくともN末端側のHDドメインを含むポリペプチドであればよい。例えば、限定するものではないが、Cas10dは、全長Cas10dタンパク質、Cas10dのN末端側のHDドメインからC末端側の1以上のα-ヘリックス領域を含むポリペプチド、またはCas10dのN末端側のHDドメインを含み、かつC末端側の1以上のα-ヘリックス領域を欠くポリペプチドであってもよい。Cas10dは、C末端側の全てのα-ヘリックス領域を欠いていてもよい。本明細書において、「Cas10d」なる語は、全長Cas10dポリペプチド、および上記のようなN末端側のHDドメインを含むCas10dフラグメントのいずれも包含する。
【0022】
Cas3d、Cas5d、Cas6d、Cas7d、およびCas10dの各Casタンパク質またはそれらをコードする核酸は、上記Casタンパク質とcrRNAとの複合体が標的配列を標的化または改変するかぎりにおいて、1以上の、例えば1~数個のアミノ酸変異、または1以上の、例えば1~数個のヌクレオチド変異を有していてもよい。本明細書において「数個」とは、2~10個程度をいい、例えば3、4、5、6、7、8または9個をいう。本明細書において、「変異」とは、天然配列と比べたアミノ酸またはヌクレオチドの欠失、置換、挿入または付加を包含する。
【0023】
例えば、上記Casタンパク質の例として、限定するものではないが、Microcystis aeruginosa(以下、M.aeruginosaという)由来のCas3d(配列番号1)、Cas5d(配列番号2)、Cas6d(配列番号3)、Cas7d(配列番号4)、およびCas10d(配列番号5)が挙げられる。したがって、本発明に用いられるCas3dの例として、配列番号1で示されるアミノ酸配列を含むタンパク質、Cas5dの例として、配列番号2で示されるアミノ酸配列を含むタンパク質、Cas6dの例として、配列番号3で示されるアミノ酸配列を含むタンパク質、Cas7dの例として、配列番号4で示されるアミノ酸配列を含むタンパク質、およびCas10dの例として、配列番号5で示されるアミノ酸配列を含むタンパク質が挙げられる。好ましくは、本発明に用いられるCas3dの例として、配列番号1で示されるアミノ酸配列からなるタンパク質、Cas5dの例として、配列番号2で示されるアミノ酸配列からなるタンパク質、Cas6dの例として、配列番号3で示されるアミノ酸配列からなるタンパク質、Cas7dの例として、配列番号4で示されるアミノ酸配列からなるタンパク質、およびCas10dの例として、配列番号5で示されるアミノ酸配列からなるタンパク質が挙げられる。
【0024】
また、本発明に用いられる上記Casタンパク質のさらなる例として、配列番号1、配列番号2、配列番号3、配列番号4、および配列番号5に対してそれぞれ、30%以上、40%以上、60%以上、50%以上、70%以上、または80%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは96%以上、さらに好ましくは97%以上、さらに好ましくは98%以上、またはさらに好ましくは99%以上の配列同一性を有するアミノ酸配列を含むタンパク質が挙げられる。好ましくは、本発明に用いられる上記Casタンパク質のさらなる例として、配列番号1、配列番号2、配列番号3、配列番号4、および配列番号5に対してそれぞれ、30%以上、40%以上、60%以上、50%以上、70%以上、または80%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは96%以上、さらに好ましくは97%以上、さらに好ましくは98%以上、またはさらに好ましくは99%以上の配列同一性を有するアミノ酸配列からなるタンパク質が挙げられる。上記のいずれかのCasタンパク質は、上記の他のCasタンパク質およびcrRNAと複合体を形成した場合に標的配列を標的化または改変する能力を有するものである。
【0025】
TiDシステムを導入する細胞が真核細胞である場合、好ましくは、Casタンパク質の末端に核移行シグナルを付加してもよい。核移行シグナルは、当該分野で公知であり、導入対象の細胞が由来する生物種に応じて適宜選択することができる。また、核移行シグナルは、2個以上をタンデムに並べてCasタンパク質に付加してもよい。また、核移行シグナルは、Casタンパク質のN末端側またはC末端側のいずれか、あるいは両方に付加されていてもよい。
【0026】
本発明に用いられるCas3dをコードする核酸の例として、配列番号1で示されるアミノ酸配列を含むタンパク質をコードするヌクレオチド配列を含む核酸、Cas5dをコードする核酸の例として、配列番号2で示されるアミノ酸配列を含むタンパク質をコードするヌクレオチド配列を含む核酸、Cas6dをコードする核酸の例として、配列番号3で示されるアミノ酸配列を含むタンパク質をコードするヌクレオチド配列を含む核酸、Cas7dをコードする核酸の例として、配列番号4で示されるアミノ酸配列を含むタンパク質をコードするヌクレオチド配列を含む核酸、およびCas10dをコードする核酸の例として、配列番号5で示されるアミノ酸配列を含むタンパク質をコードするヌクレオチド配列を含む核酸が挙げられる。好ましくは、本発明に用いられるCas3dをコードする核酸の例として、配列番号1で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列を含む核酸、Cas5dをコードする核酸の例として、配列番号2で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列を含む核酸、Cas6dをコードする核酸の例として、配列番号3で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列を含む核酸、Cas7dをコードする核酸の例として、配列番号4で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列を含む核酸、およびCas10dをコードする核酸の例として、配列番号5で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列を含む核酸が挙げられる。さらに好ましくは、本発明に用いられるCas3dをコードする核酸の例として、配列番号1で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列からなる核酸、Cas5dをコードする核酸の例として、配列番号2で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列からなる核酸、Cas6dをコードする核酸の例として、配列番号3で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列からなる核酸、Cas7dをコードする核酸の例として、配列番号4で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列からなる核酸、およびCas10dをコードする核酸の例として、配列番号5で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列からなる核酸が挙げられる。
【0027】
また、本発明に用いられる上記Casタンパク質をコードする核酸のさらなる例として、配列番号1、配列番号2、配列番号3、配列番号4、および配列番号5に対してそれぞれ、30%以上、40%以上、60%以上、50%以上、70%以上、または80%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは96%以上、さらに好ましくは97%以上、さらに好ましくは98%以上、またはさらに好ましくは99%以上の配列同一性を有するアミノ酸配列を含むタンパク質をコードするヌクレオチド配列を含む核酸が挙げられる。好ましくは、本発明に用いられる上記Casタンパク質をコードする核酸のさらなる例として、配列番号1、配列番号2、配列番号3、配列番号4、および配列番号5に対してそれぞれ、30%以上、40%以上、60%以上、50%以上、70%以上、または80%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは96%以上、さらに好ましくは97%以上、さらに好ましくは98%以上、またはさらに好ましくは99%以上の配列同一性を有するアミノ酸配列からなるタンパク質をコードするヌクレオチド配列を含む核酸が挙げられる。さらに好ましくは、本発明に用いられる上記Casタンパク質をコードする核酸のさらなる例として、配列番号1、配列番号2、配列番号3、配列番号4、および配列番号5に対してそれぞれ、30%以上、40%以上、60%以上、50%以上、70%以上、または80%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは96%以上、さらに好ましくは97%以上、さらに好ましくは98%以上、またはさらに好ましくは99%以上の配列同一性を有するアミノ酸配列からなるタンパク質をコードするヌクレオチド配列からなる核酸が挙げられる。上記のいずれかの核酸から発現するCasタンパク質は、上記の他の核酸から発現するCasタンパク質およびcrRNAと複合体を形成した場合に標的配列を標的化または改変する能力を有するものである。
【0028】
TiDシステムを導入する細胞が真核細胞である場合、好ましくは、Casタンパク質をコードする核酸の末端に核移行シグナルをコードするヌクレオチド配列が付加してもよい。核移行シグナル配列は、当該分野で公知であり、導入対象の細胞が由来する生物種に応じて適宜選択することができる。また、核移行シグナル配列は、2個以上をタンデムに並べてCasタンパク質をコードする核酸に付加してもよい。また、核移行シグナル配列は、Casタンパク質をコードする核酸の5’末端側または3’末端側のいずれか、あるいは両方に付加されていてもよい。
【0029】
(3)Cas10dのC末端部分配列(Cas10d C-ter)を含むポリペプチドおよび該ポリペプチドをコードする核酸
本発明において、Cas10dのC末端部分配列(Cas10d C-ter)は、Cas10dのN末端側のHDドメインを含まず、かつ、C末端側の1以上のα-ヘリックス領域を含む配列である。また、本発明において、Cas10d C-terを含むポリペプチド(以下、「Cas11d」ともいう)は、Cas10dのN末端側のHDドメインを含まない。
【0030】
Cas10d C-terの配列長は、本発明の効果が達成されるかぎりにおいて、すなわち、TiDシステムによる標的ヌクレオチド配列の効率的な標的化および改変が達成されるかぎりにおいて特に限定されないが、例えば、約100アミノ酸長~約400アミノ酸長、好ましくは約120アミノ酸長~約270アミノ酸長、より好ましくは約130アミノ酸長~約180アミノ酸長、さらに好ましくは約135アミノ酸長~約170アミノ酸長であってもよい。例えば、Cas10d C-terとして、Cas10dの全長アミノ酸配列のC末端から約100アミノ酸長~約400アミノ酸長、好ましくは約120アミノ酸長~約270アミノ酸長、より好ましくは約130アミノ酸長~約180アミノ酸長、さらに好ましくは約135アミノ酸長~約170アミノ酸長を用いることができ、また例えば、Cas10d C-terをコードする核酸として、Cas10d遺伝子のストップコドンから5’側上流の約0.3kb配列長~約1.2kb配列長、好ましくは約0.36kb配列長~約0.81kb配列長、より好ましくは約0.39kb配列長~約0.54kb配列長、さらに好ましくは約0.41kb配列長~約0.51kb配列長を用いることができる。したがって、Cas11dは、例えば、Cas10dの全長アミノ酸配列のC末端から約100アミノ酸~約400アミノ酸、好ましくは約120アミノ酸~約270アミノ酸、より好ましくは約130アミノ酸~約180アミノ酸、さらに好ましくは約135アミノ酸~約170アミノ酸を含む。Cas11dの好ましい例として、Cas10dの全長アミノ酸配列のC末端から約100アミノ酸~約400アミノ酸、好ましくは約120アミノ酸~約270アミノ酸、より好ましくは約130アミノ酸~約180アミノ酸、さらに好ましくは約135アミノ酸~約170アミノ酸からなるポリペプチドが挙げられる。Cas11dをコードする核酸は、例えば、Cas10d遺伝子のストップコドンの5’側上流約0.3kb~約1.2kb、好ましくは約0.36kb~約0.81kb、より好ましくは約0.39kb~約0.54kb、さらに好ましくは約0.41kb~約0.51kbを含む。Cas11dをコードする核酸の好ましい例として、Cas10d遺伝子のストップコドンの5’側上流約0.3kb~約1.2kb、好ましくは約0.36kb~約0.81kb、より好ましくは約0.39kb~約0.54kb、さらに好ましくは約0.41kb~約0.51kbからなる核酸が挙げられる。但し、Cas11dは、全長Cas10dではない。
【0031】
Cas11dおよびCas11dをコードする核酸は、既知の方法によって得ることができる。例えば、Cas11dは、アミノ酸配列情報を基に化学合成するか、またはCas11dをコードする核酸を適当なベクター等を介して細胞中に導入し、該細胞中で産生させてもよい。Cas11dをコードする核酸は、例えば、アミノ酸配列情報を基に、該核酸を導入する宿主細胞における翻訳に最適化されたコドンを選択し、化学合成等により構築してもよい。宿主細胞において使用頻度の高いコドンを使用することにより、タンパク質の発現量の増加させることができる。該核酸としては、例えば、mRNA等のRNA、またはDNAが挙げられる。
【0032】
Cas11dまたはCas11dをコードする核酸は、本発明の効果が達成されるかぎりにおいて、すなわち、Cas11dと上記Casタンパク質およびcrRNAとの複合体が標的配列の効率的な標的化および改変をもたらすかぎりにおいて、1以上の、例えば1~数個のアミノ酸変異、または1以上の、例えば1~数個のヌクレオチド変異を有していてもよい。
【0033】
例えば、Cas11dの例として、限定するものではないが、M.aeruginosaのCas10d(配列番号5)由来のCas10d C-terを含むポリペプチドが挙げられる。したがって、本発明に用いられるCas11dの例として、配列番号5で示されるアミノ酸配列のC末端から約100アミノ酸~約400アミノ酸、好ましくは約120アミノ酸~約270アミノ酸、より好ましくは約130アミノ酸~約180アミノ酸、さらに好ましくは約135アミノ酸~約170アミノ酸を含むポリペプチドが挙げられる。好ましくは、本発明に用いられるCas11dの例として、配列番号5で示されるアミノ酸配列のC末端から約100アミノ酸~約400アミノ酸、好ましくは約120アミノ酸~約270アミノ酸、より好ましくは約130アミノ酸~約180アミノ酸、さらに好ましくは約135アミノ酸~約170アミノ酸からなるポリペプチドが挙げられる。M.aeruginosa由来のCas11dの一例として、配列番号5で示されるアミノ酸配列の997位~1156位のアミノ酸からなる配列(配列番号6)を含むポリペプチドが挙げられ、さらに好ましくは、配列番号6で示されるアミノ酸配列からなるポリペプチドが挙げられる。
【0034】
さらに、Anabaena cylindrica、Calothrix PCC6303 (Calothrix parietina)、Crinalium epipsammum、Cyanothece PCC7424 (Gloeothece citriformis)、Gloeobacter kilaueensis、Gloeocapsa sp. PCC7428、Halothece PCC7418、Methanospirillum hungatei、Nostoc sp. NIES-2111、Rivularia sp. PCC7116、Stanieria cyanosphaera、およびSynechocystis sp. PCC6803由来のCas11dの例として、それぞれ配列番号8~19に示されるアミノ酸配列を含むポリペプチドが挙げられる。さらに好ましくは、配列番号8~19で示されるアミノ酸配列からなるポリペプチドが挙げられる。本発明において、Cas11dは、上記Casタンパク質(Cas3d、Cas5d、Cas6d、Cas7d、および/またはCas10d)と異なる菌種または同じ菌種由来のCas10d C-terを含んでいてもよい。好ましくは、上記Casタンパク質のいずれかと同じ菌株由来のCas10d C-terを含むポリペプチドがCas11dとして用いられる。
【0035】
また、本発明に用いられるCas11dのさらなる例として、配列番号5で示されるアミノ酸配列のC末端から約100アミノ酸~約400アミノ酸、好ましくは約120アミノ酸~約270アミノ酸、より好ましくは約130アミノ酸~約180アミノ酸、さらに好ましくは約135アミノ酸~約170アミノ酸からなる配列に対して、30%以上、40%以上、60%以上、50%以上、70%以上、または80%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは96%以上、さらに好ましくは97%以上、さらに好ましくは98%以上、またはさらに好ましくは99%以上の配列同一性を有するアミノ酸配列を含むポリペプチドが挙げられる。好ましくは、本発明に用いられるCas11dのさらなる例として、配列番号5で示されるアミノ酸配列のC末端から約100アミノ酸~約400アミノ酸、好ましくは約120アミノ酸~約270アミノ酸、より好ましくは約130アミノ酸~約180アミノ酸、さらに好ましくは約135アミノ酸~約170アミノ酸からなる配列に対して、30%以上、40%以上、60%以上、50%以上、70%以上、または80%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは96%以上、さらに好ましくは97%以上、さらに好ましくは98%以上、またはさらに好ましくは99%以上の配列同一性を有するアミノ酸配列からなるポリペプチドが挙げられる。Cas11dのまたさらなる例として、配列番号6、配列番号8~19のいずれかで示されるアミノ酸配列に対して、30%以上、40%以上、60%以上、50%以上、70%以上、または80%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは96%以上、さらに好ましくは97%以上、さらに好ましくは98%以上、またはさらに好ましくは99%以上の配列同一性を有するアミノ酸配列を含むポリペプチドが挙げられる。Cas11dの好ましい例として、配列番号6、配列番号8~19のいずれかで示されるアミノ酸配列に対して、30%以上、40%以上、60%以上、50%以上、70%以上、または80%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは96%以上、さらに好ましくは97%以上、さらに好ましくは98%以上、またはさらに好ましくは99%以上の配列同一性を有するアミノ酸配列からなるポリペプチドが挙げられる。上記のいずれのCas11dも、上記のCasタンパク質およびcrRNAと複合体を形成した場合に標的配列の効率的な標的化および改変をもたらす能力を有するものである。
【0036】
TiDシステムを導入する細胞が真核細胞である場合、好ましくは、Cas11dの末端に核移行シグナルを付加してもよい。核移行シグナルは、当該分野で公知であり、導入対象の細胞が由来する生物種に応じて適宜選択することができる。また、核移行シグナルは、2個以上をタンデムに並べてCas11dに付加してもよい。また、核移行シグナルは、Cas11dのN末端側またはC末端側のいずれか、あるいは両方に付加されていてもよい。
【0037】
本発明に用いられるCas11dをコードする核酸の例として、配列番号5で示されるアミノ酸配列を含むタンパク質をコードするヌクレオチド配列のストップコドンの5’側上流約0.3kb~約1.2kb、好ましくは約0.36kb~約0.81kb、より好ましくは約0.39kb~約0.54kb、さらに好ましくは約0.41kb~約0.51kbを含む核酸が挙げられる。好ましくは、本発明に用いられるCas11dをコードする核酸の例として、配列番号5で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列のストップコドンの5’側上流約0.3kb~約1.2kb、好ましくは約0.36kb~約0.81kb、より好ましくは約0.39kb~約0.54kb、さらに好ましくは約0.41kb~約0.51kbを含む核酸が挙げられる。さらに好ましくは、本発明に用いられるCas11dをコードする核酸の例として、配列番号5で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列のストップコドンの5’側上流約0.3kb~約1.2kb、好ましくは約0.36kb~約0.81kb、より好ましくは約0.39kb~約0.54kb、さらに好ましくは約0.41kb~約0.51kbからなる核酸が挙げられる。Cas11dをコードする核酸の一例として、配列番号6で示されるアミノ酸配列を含むポリペプチドをコードするヌクレオチド配列を含む核酸が挙げられ、さらに好ましくは、配列番号6で示されるアミノ酸配列からなるポリペプチドをコードするヌクレオチド配列を含む核酸が挙げられ、またさらに好ましくは、配列番号6で示されるアミノ酸配列からなるポリペプチドをコードするヌクレオチド配列からなる核酸が挙げられる。Cas11dをコードする核酸の他の例として、配列番号8~19で示されるアミノ酸配列を含むポリペプチドをコードするヌクレオチド配列を含む核酸が挙げられ、さらに好ましくは、配列番号8~19で示されるアミノ酸配列からなるポリペプチドをコードするヌクレオチド配列を含む核酸が挙げられ、またさらに好ましくは、配列番号8~19で示されるアミノ酸配列からなるポリペプチドをコードするヌクレオチド配列からなる核酸が挙げられる。
【0038】
また、本発明に用いられるCas11dをコードする核酸のさらなる例として、配列番号5で示されるアミノ酸配列を含むタンパク質をコードするヌクレオチド配列のストップコドンの5’側上流約0.3kb~約1.2kb、好ましくは約0.36kb~約0.81kb、より好ましくは約0.39kb~約0.54kb、さらに好ましくは約0.41kb~約0.51kbからなる配列に対して、30%以上、40%以上、60%以上、50%以上、70%以上、または80%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは96%以上、さらに好ましくは97%以上、さらに好ましくは98%以上、またはさらに好ましくは99%以上の配列同一性を有するヌクレオチド配列を含む核酸が挙げられる。好ましくは、本発明に用いられるCas11dをコードする核酸の例として、配列番号5で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列のストップコドンの5’側上流約0.3kb~約1.2kb、好ましくは約0.36kb~約0.81kb、より好ましくは約0.39kb~約0.54kb、さらに好ましくは約0.41kb~約0.51kbからなる配列に対して、30%以上、40%以上、60%以上、50%以上、70%以上、または80%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは96%以上、さらに好ましくは97%以上、さらに好ましくは98%以上、またはさらに好ましくは99%以上の配列同一性を有するヌクレオチド配列を含む核酸が挙げられる。さらに好ましくは、本発明に用いられるCas11dをコードする核酸の例として、配列番号5で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列のストップコドンの5’側上流約0.3kb~約1.2kb、好ましくは約0.36kb~約0.81kb、より好ましくは約0.39kb~約0.54kb、さらに好ましくは約0.41kb~約0.51kbからなる配列に対して、30%以上、40%以上、60%以上、50%以上、70%以上、または80%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは96%以上、さらに好ましくは97%以上、さらに好ましくは98%以上、またはさらに好ましくは99%以上の配列同一性を有するヌクレオチド配列からなる核酸が挙げられる。Cas11dをコードする核酸の他の例として、配列番号6、配列番号8~19のいずれかで示されるアミノ酸配列を含むポリペプチドをコードするヌクレオチド配列に対して、30%以上、40%以上、60%以上、50%以上、70%以上、または80%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは96%以上、さらに好ましくは97%以上、さらに好ましくは98%以上、またはさらに好ましくは99%以上の配列同一性を有するヌクレオチド配列を含む核酸が挙げられる。Cas11dをコードする核酸のまた別の例として、配列番号6、配列番号8~19のいずれかで示されるアミノ酸配列からなるポリペプチドをコードするヌクレオチド配列に対して、30%以上、40%以上、60%以上、50%以上、70%以上、または80%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは96%以上、さらに好ましくは97%以上、さらに好ましくは98%以上、またはさらに好ましくは99%以上の配列同一性を有するヌクレオチド配列を含む核酸が挙げられる。Cas11dをコードする核酸のまた別の例として、配列番号6、配列番号8~19のいずれかで示されるアミノ酸配列からなるポリペプチドをコードするヌクレオチド配列に対して、30%以上、40%以上、60%以上、50%以上、70%以上、または80%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは96%以上、さらに好ましくは97%以上、さらに好ましくは98%以上、またはさらに好ましくは99%以上の配列同一性を有するヌクレオチド配列からなる核酸が挙げられる。上記のいずれの核酸から発現するCas11dポリペプチドも、上記のCasタンパク質およびcrRNAと複合体を形成した場合に標的配列の効率的な標的化および改変をもたらす能力を有するものである。
【0039】
TiDシステムを導入する細胞が真核細胞である場合、好ましくは、Cas11dをコードする核酸の末端に核移行シグナルをコードするヌクレオチド配列が付加してもよい。核移行シグナル配列は、当該分野で公知であり、導入対象の細胞が由来する生物種に応じて適宜選択することができる。また、核移行シグナル配列は、2個以上をタンデムに並べてCas11dをコードする核酸に付加してもよい。また、核移行シグナル配列は、Cas11dをコードする核酸の5’末端側または3’末端側のいずれか、あるいは両方に付加されていてもよい。
【0040】
(4)crRNA
crRNAは、CRISPR遺伝子座に由来するリピート配列および該リピート配列に挟まれたスペーサー配列からなる1以上の構造単位(「リピート-スペーサー-リピート」)を含む。リピート配列は、好ましくは、パリンドローム様配列を含む。crRNAは、スペーサー配列として標的ヌクレオチド配列に結合するRNA配列(すなわち、プロトスペーサー配列)を含むことによって、CRISPR-Casシステムの標的認識に寄与する。crRNAのリピート配列および該リピート配列に挟まれたプロトスペーサー配列からなる構造を含むRNA分子は、ガイドRNA(gRNA)とも呼ばれる。crRNAは、Casエフェクタータンパク質の作用によりプロセッシングされてそのリピート配列が切断され、リピート配列の部分配列と該リピート配列の部分配列に挟まれたプロトスペーサー配列からなる成熟型(mature)crRNAになる。プロセッシングされる前のcrRNAはプレ成熟型(pre-mature)crRNAと呼ばれる。
【0041】
本発明で使用されるcrRNAは、CRISPRタイプI-D遺伝子座に由来するリピート配列と、該リピート配列に挟まれたプロトスペーサー配列として、標的ヌクレオチド配列と塩基対を形成する配列を含む。本発明で使用されるcrRNAは、好ましくは、プレ成熟型crRNAである。
【0042】
プレ成熟型crRNAは、Cascade(Cas5d、Cas6d、およびCas7dの複合体)に取り込まれる前にCas6dによるプロセッシングを受けて、成熟型crRNAとなる。プレ成熟型crRNAが2以上の「リピート-スペーサー-リピート」構造単位を含む場合、該プレ成熟型crRNAは、2種以上のプロトスペーサー配列を含んでいてもよい。2種以上のプロトスペーサー配列を含むプレ成熟型crRNAからは、2種以上の成熟型crRNAが生じ、次いで、これらの成熟型crRNAは個別にCascadeに取り込まれる。
【0043】
crRNAに含まれるプロトスペーサー配列は、標的ヌクレオチド配列と塩基対を形成する配列である。「標的ヌクレオチド配列と塩基対を形成する配列」は、例えば、標的ヌクレオチド配列に相補的な配列、または標的ヌクレオチド配列に対し実質的に相補的な配列である。ここで、「実質的に相補的」とは、標的配列に対して完全に相補的ではないが、標的配列に結合できる(標的配列と塩基対を形成する)配列を包含する。標的ヌクレオチド配列に対し実質的に相補的な配列は、標的配列と塩基対を形成するかぎりにおいて、標的配列に対しミスマッチを含んでいてもよい。
【0044】
crRNAのリピート配列部分は、少なくとも1つのヘアピン構造を有していてもよい。例えば、プロトスペーサー配列の5’末端側にあるリピート配列部分がヘアピン構造を有し、プロトスペーサー配列の3’末端側にあるリピート配列部分は一本鎖であってもよい。本発明において、crRNAは、好ましくは1つのヘアピン構造を有する。
【0045】
CRISPRタイプI-D遺伝子座に由来するリピート配列は、タイプI-D遺伝子群に隣接するcrRNA遺伝子配列領域から、タンデムリピート検索プログラムを利用して見出すことができる。タイプI-D遺伝子座に由来するリピート配列は、いずれの細菌または古細菌由来のものであってもよく、例えば、上記のCasエフェクタータンパク質に関して例示した細菌および古細菌由来のものであってもよい。
【0046】
crRNAに含まれるリピート配列の塩基長は、Cascadeと相互作用して標的ヌクレオチド配列を標的化するという目的が達成されるかぎり、特に限定されない。例えば、プロトスペーサー配列の前後のリピート配列は各々、約10~70塩基長であってもよく、例えば、約30~50塩基長であってもよく、好ましくは約35~45塩基長であってもよい。
【0047】
本発明で使用されるcrRNAは、約10塩基~70塩基長のプロトスペーサー配列を含むことができる。該crRNAに含まれるプロトスペーサー配列は、好ましくは20塩基~50塩基、より好ましくは25塩基~45塩基からなる配列、さらに好ましくは30塩基~40塩基からなる配列、例えば、31塩基、32塩基、33塩基、34塩基、35塩基、36塩基、37塩基、38塩基、または39塩基からなる配列である。標的化可能な配列が長いほど、crRNAによる標的認識の配列特異性が増す。また、標的化可能な配列が長いほど、crRNAと標的配列との間に形成される塩基対のTm値が高くなり、標的認識の安定性が増す。従来のゲノム編集技術に用いられるRNA誘導性エンドヌクレアーゼ(例えば、Cas9およびCpf1)ではcrRNAが標的化できる配列の長さは約20~24塩基であるので、本発明では、従来法よりも配列特異性および安定性が優れている。
【0048】
本発明で使用されるcrRNAの例として、限定するものではないが、M.aeruginosa由来のcrRNAのリピート配列を含むものが挙げられる。例えば、GUUCCAAUUAAUCUUAAGCCCUAUUAGGGAUUGAAACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGUUCCAAUUAAUCUUAAGCCCUAUUAGGGAUUGAAAC(配列番号7;Nは標的ヌクレオチド配列と塩基対を形成する配列を構成する任意のヌクレオチドである)で示される配列を含むプレ成熟型crRNAが挙げられる。上記crRNAの配列中、Nの数は10~70の範囲で変更してもよく、好ましくは20~50、より好ましくは25~45、さらに好ましくは30~40の範囲で変更してもよい。
【0049】
上記crRNAは、RNAとして、またはcrRNAをコードするDNAとして細胞中に導入されてもよい。crRNAをコードするDNAは、例えば、ベクターまたは発現カセットに含まれていてもよく、該DNA配列は、好ましくは、プロモーターおよびターミネーター等の調節配列に作動可能に連結される。ベクターおよび調節配列は、例えば宿主細胞等に基づいて、当業者が適宜選択することができる。例えば、限定するものではないが、pol III系のプロモーター(例えば、SNR6、SNR52、SCR1、RPR1、U6、H1プロモーター等)、pol II系のプロモーター、ターミネーター(例えばT6配列)、またはヒトU6 snRNAプロモーターを用いることができる。
【0050】
上記crRNAをコードするDNAは、上記Casタンパク質およびCas11dポリペプチドをコードする核酸のいずれかと同じベクター中または同じ発現カセット中に含まれていてもよく、または上記Casタンパク質およびCas11dポリペプチドをコードする核酸のいずれとも別のベクター中または別の発現カセット中に含まれていてもよい。
【0051】
(5)標的ヌクレオチド配列
本発明において、標的ヌクレオチド配列(本明細書において、単に「標的配列」ともいう)は、任意の核酸の配列であり、TiDシステムのプロトスペーサー近接モチーフ(PAM)の近傍に位置する配列を標的配列として選択することを除き、特に限定されない。該核酸は、生体内または細胞内における核酸、または生体または細胞から単離された核酸であってもよい。標的ヌクレオチド配列は、二本鎖DNA配列、一本鎖DNA配列、またはRNA配列のいずれであってもよい。DNAとしては、例えば、真核生物核ゲノムDNA、ミトコンドリアDNA、プラスチドDNA、原核生物ゲノムDNA、ファージDNA、あるいはプラスミドDNA等が挙げられる。本発明において、標的ヌクレオチド配列は、好ましくは、ゲノムDNA上の配列である。したがって、標的とする核酸のセンス鎖において、PAM配列の近傍に位置する配列、好ましくはPAM配列の3’側下流の近傍に位置する配列、さらに好ましくはPAM配列の3’側下流に隣接する配列を標的ヌクレオチド配列として選択する。また、標的核酸のアンチセンス鎖において、標的ヌクレオチド配列は、PAM配列の近傍に位置する配列、好ましくはPAM配列の5’側の近傍に位置する配列、さらに好ましくはPAM配列の5’側に隣接する配列から選択される。なお、本明細書において、「近傍に位置する」とは、隣接すること、および近くにあることの両方を包含する。また、本明細書において、「近傍」とは、隣接する位置または近くの位置の両方を包含する。なお、本明細書においては、特記しないかぎり、核酸のセンス鎖に基づいて記載される。
【0052】
CRISPRシステムの標的認識に利用されるPAM配列は、CRISPRシステムの種類によって異なる。例えば、M.aeruginosaを含むいくつかの菌株由来のTiDシステムのPAM配列は、標的とする核酸のセンス鎖において、5’-GTH-3’(H=A、CまたはT)であり、標的核酸のアンチセンス鎖において、5’-HTG-3’(H=A、CまたはT)である(特許文献1)。
【0053】
例えば、標的ヌクレオチド配列は、上記PAM配列の近傍に位置し、かつ、標的遺伝子のイントロン内、コーディング領域内、非コーディング領域内、または制御領域内に存在する配列であってもよい。標的遺伝子は、任意の遺伝子であり、随意に選択すればよい。
【0054】
標的ヌクレオチド配列の長さは、例えば、10~70塩基長、好ましくは20~50塩基長、より好ましくは25~45塩基長、さらに好ましくは30~40塩基長の範囲である。
【0055】
(6)本発明の標的配列ターゲティング方法
本発明の標的配列ターゲティング方法は、TiDのCasエフェクタータンパク質のうちCas5d、Cas6d、Cas7d、およびCas10dと、Cas10d C-terを含むポリペプチド(Cas11d)と、crRNAとを細胞中に導入することを特徴とする。すなわち、本発明の標的配列ターゲティング方法は、(i)Cas5d、Cas6d、Cas7d、およびCas10d、またはこれらのタンパク質をコードする核酸、(ii)Cas11dポリペプチド、または該ポリペプチドをコードする核酸、および(iii)標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、または該crRNAをコードするDNAを上記細胞中に導入することを特徴とする。本発明の標的配列ターゲティング方法は、イン・ビトロ、イン・ビボ、またはエクス・ビボのいずれで行ってもよい。また、本発明の標的配列ターゲティング方法は、単離された核酸の標的ヌクレオチド配列に適用することもでき、この場合、該方法は、上記(i)のCasタンパク質、上記(ii)のCas11dポリペプチドおよび上記(iii)のcrRNAを、標的ヌクレオチド配列を含む単離核酸に接触させることを含む。
【0056】
本発明の標的配列ターゲティング方法において、上記Casタンパク質は、Cas5d、Cas6d、Cas7d、およびCas10dのうち2以上を含む単離された複合体、例えば4つを含む単離された複合体として細胞中に導入または標的ヌクレオチド配列を含む単離核酸に接触してもよく、またはCas5d、Cas6d、Cas7d、およびCas10dの各々が単離されたタンパク質として単独で細胞中に導入または標的ヌクレオチド配列を含む単離核酸に接触してもよい。また、本発明の標的配列ターゲティング方法において、上記Casタンパク質は、上記Casタンパク質Cas5d、Cas6d、Cas7d、およびCas10dをコードする核酸として細胞中に導入してもよい。該核酸としては、例えば、mRNA等のRNA、またはDNAが挙げられる。
【0057】
本発明の標的配列ターゲティング方法において、Cas11dは、上記Casタンパク質との複合体として細胞中に導入または標的ヌクレオチド配列を含む単離核酸に接触されてもよく、またはCas11dは単離されたポリペプチドとして単独で細胞中に導入または標的ヌクレオチド配列を含む単離核酸に接触してもよい。また、本発明の標的配列ターゲティング方法において、Cas11dは、Cas11dをコードする核酸として細胞中に導入してもよい。該核酸としては、例えば、mRNA等のRNA、またはDNAが挙げられる。
【0058】
上記Casタンパク質およびCas11dをコードする核酸は、例えば、ベクターに含まれていてもよく、該核酸配列は、好ましくは、プロモーターおよびターミネーター等の調節配列に作動可能に連結されている。上記Casタンパク質Cas5d、Cas6d、Cas7dおよびCas10d、およびCas11dを導入する細胞が真核細胞である場合、好ましくは、上記Casタンパク質およびCas11dをコードする核酸配列に核移行シグナル配列が付加される。上記Casタンパク質Cas5d、Cas6dCas7dおよびCas10d、およびCas11dをコードする核酸の2以上または全てが単一のベクターまたは発現カセット中に含まれていてもよく、または別々のベクターまたは発現カセット中に含まれていてもよい。ベクターまたは発現カセットの数、ならびに各ベクターまたは発現カセットに組み込む核酸の種類および組み合わせに制限はない。上記Casタンパク質およびCas11dをコードする2以上の核酸が一つのベクターまたは発現カセット中に含まれる場合、これらの核酸配列は、ポリシストロニックに発現するように、例えば自己開裂型ペプチドをコードする配列等を介して、相互に連結されていてもよい。なお、上記Casタンパク質およびCas11dをコードする2以上の核酸を連結する順番は、いずれであってもよい。
【0059】
上記crRNAは、RNAとして、またはcrRNAをコードするDNAとして細胞中に導入されてもよい。上記crRNAはまた、上記Casタンパク質および/またはCas11dとの複合体として細胞中に導入または標的ヌクレオチド配列を含む単離核酸に接触してもよい。crRNAまたはcrRNAをコードするDNAは、例えば、ベクターに含まれていてもよく、該RNAまたはDNA配列は、好ましくは、プロモーターおよびターミネーター等の調節配列に作動可能に連結される。crRNAまたはcrRNAをコードするDNAは、上記Casタンパク質をコードする核酸および/またはCas11dをコードする核酸と同じベクターまたは発現カセット中に含まれていてもよく、または別々のベクターまたは発現カセット中に含まれていてもよい。
【0060】
ベクターは、対象細胞中に目的タンパク質をコードする核酸を運び、該細胞中で該目的タンパク質を発現させるための発現ベクターである。発現カセットとは、目的タンパク質をコードする核酸の転写および/または翻訳を指示して該目的タンパク質の発現を可能にする核酸分子を意味する。発現カセットは、ベクターに含まれていてもよい。ベクターとしては、当該分野において一般的に使用される種々のベクターを使用することができ、特に限定されず、導入される細胞又は導入方法に応じて適宜選択することができる。例えば、限定するものではないが、プラスミドベクター、ウイルスベクター、レトロウイルスベクター、ファージ、ファージミド、コスミド、人工/ミニ染色体、トランスポゾン等が挙げられる。
【0061】
上記調節配列としては、例えば、プロモーター、エンハンサー、ターミネーター、内部リボソーム侵入部位(IRES)、ポリアデニル化シグナル、ポリU配列、翻訳エンハンサー等が挙げられる。調節配列は、特に限定されず、宿主細胞等に基づき当業者が適宜選択することができる。例えば、プロモーターとしては、宿主が植物細胞である場合、CaMV35Sプロモーター、2xCaMV35Sプロモーター、CaMV19Sプロモーター、NOSプロモーター等が挙げられ、宿主が動物細胞である場合、SRαプロモーター、SV40プロモーター、LTRプロモーター、CMVプロモーター、RSVプロモーター、MoMuLV LTRプロモーター、HSV-TSプロモーター、ヒト翻訳伸長因子遺伝子プロモーター、CAGキメラ合成プロモーター等が挙げられる。
【0062】
上記核移行シグナル配列は、当該分野で公知であり、上記Casタンパク質、Cas11dおよびcrRNAを導入する細胞が由来する生物種に応じて適宜選択することができる。例えば、モノパータイト型核移行シグナルまたはバイパータイト型核移行シグナルを使用してもよい。
【0063】
上記Casタンパク質、Cas11d、およびcrRNAの細胞中への導入は、当該分野で知られた種々の手段によって行うことができる。例えば、トランスフェクション、例えば、リン酸カルシウム仲介性トランスフェクション、エレクトロポレーション、リポソームトランスフェクション等、ウイルス形質導入、リポフェクション、遺伝子銃、マイクロインジェクション、アグロバクテリウム法、アグロインフィルトレーション法、PEG-カルシウム法等が挙げられる。
【0064】
上記Casタンパク質、Cas11d、およびcrRNA、またはこれらをコードする核酸は、同時にまたは連続的に細胞中に導入すればよい。また、上記Casタンパク質Cas5d、Cas6d、Cas7dおよびCas10d、またはこれらの各Casタンパク質をコードする核酸は、同時にまたは連続的に細胞中に導入すればよい。例えば、イン・ビトロまたはイン・ビボにおいてそれぞれ合成した上記Casタンパク質Cas5d、Cas6d、Cas7dおよびCas10d、およびCas11dと、イン・ビトロまたはイン・ビボにおいて合成したcrRNAを、イン・ビトロにおいてインキュベートして複合体を形成させ、該複合体を細胞中に導入することができる。
【0065】
上記Casタンパク質、Cas11d、およびcrRNAの導入の際、細胞は、標的ヌクレオチド配列のターゲティングに適当な条件下で培養される。次いで、該細胞は、細胞増殖および維持に適当な条件下で培養される。培養条件は、導入される細胞が由来する生物種に適切な培養条件であればよく、例えば、既知の細胞培養技術に基づいて当業者により適宜決定可能である。
【0066】
本発明の標的配列ターゲティング方法において、上記Casタンパク質と機能性ポリペプチドとを含む融合タンパク質を用いてもよい。この場合、上記Casタンパク質およびcrRNAの作用により機能性ポリペプチドが細胞中の標的ヌクレオチド配列に誘導され、該機能性ポリペプチドの作用により該標的ヌクレオチド配列が改変または修飾される。したがって、本発明はさらに、上記融合タンパク質、Cas11dおよびcrRNAを細胞中に導入または標的ヌクレオチド配列を含む単離核酸に接触することを含む、標的ヌクレオチド配列の改変または修飾方法を提供する。機能性ポリペプチドは、標的配列に対して何らかの機能を示すポリペプチドである。機能性ポリペプチドとしては、例えば、限定するものではないが、制限酵素、転写因子、DNAメチル化酵素、ヒストンアセチル化酵素、蛍光タンパク質、ならびに、ポリヌクレオチド切断モジュールとして制限酵素のヌクレオチド切断モジュール、遺伝子発現調節モジュールとして、転写因子の転写活性化モジュールおよび転写抑制モジュール、エピゲノム修飾モジュールとして、DNAメチル化酵素のメチル化モジュールおよびヒストンアセチル化酵素のアセチル化モジュール、塩基置換を誘発させるモジュールとしてシトシンデアミナーゼおよびアデニンデアミナーゼなどが挙げられる。蛍光タンパク質としては、例えば、GFPが挙げられる。
【0067】
本発明の標的配列ターゲティング方法によれば、Cas11dの存在により、効率よく標的配列を標的化することができる。
【0068】
(7)本発明の標的配列改変方法
本発明の標的配列改変方法は、Casエフェクタータンパク質Cas5d、Cas6d、Cas7d、Cas3dおよびCas10dと、Cas10d C-terを含むポリペプチド(Cas11d)と、crRNAとを細胞中に導入することを特徴とする。すなわち、本発明の標的配列改変方法は、細胞中に、(i)Cas3d、Cas5d、Cas6d、Cas7d、およびCas10d、またはこれらのタンパク質をコードする核酸、(ii)Cas11dポリペプチド、または該ポリペプチドをコードする核酸、および(iii)標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、または該crRNAをコードするDNAを上記細胞中に導入することを特徴とする。本発明の標的配列改変方法は、本発明の標的配列ターゲティング方法により標的化したヌクレオチド配列を、Cas3dおよびCas10dの作用により切断することを含む。本発明の標的配列改変方法は、イン・ビトロ、イン・ビボ、またはエクス・ビボのいずれで行ってもよい。本発明において、改変には、少なくとも1つのヌクレオチドの欠失、挿入、または置換、あるいはそれらの組み合わせが含まれる。また、本発明の標的配列改変方法は、単離された核酸の標的ヌクレオチド配列に適用することもでき、この場合、該方法は、上記(i)のCasタンパク質、上記(ii)のCas11dポリペプチドおよび上記(iii)のcrRNAを、標的ヌクレオチド配列を含む単離核酸に接触させることを含む。本発明の標的配列改変方法は、単離された核酸の標的ヌクレオチド配列に適用する場合、好ましくは、標的ヌクレオチド配列の切断方法が提供される。
【0069】
本発明の標的配列改変方法において、上記Cas5d、Cas6d、Cas7d、Cas3d、およびCas10dは、これら5つのCasタンパク質のうち2以上を含む単離された複合体、例えば5つを含む単離された複合体、またはCas5d、Cas6d、およびCas7dを含む単離された複合体および/またはCas3dおよびCas10dを含む単離された複合体として細胞中に導入または標的ヌクレオチド配列を含む単離核酸に接触してもよく、あるいはCas5d、Cas6d、Cas7d、Cas3d、およびCas10dの各々が単離されたタンパク質として単独で細胞中に導入または標的ヌクレオチド配列を含む単離核酸に接触してもよい。あるいは、上記Casタンパク質Cas5d、Cas6d、Cas7d、Cas3d、およびCas10dをコードする核酸として細胞中に導入されてもよい。該核酸としては、例えば、mRNA等のRNA、またはDNAが挙げられる。
【0070】
本発明の標的配列改変方法において、Cas11dは、上記Casタンパク質との複合体として細胞中に導入または標的ヌクレオチド配列を含む単離核酸に接触してもよく、またはCas11dは単離されたポリペプチドとして単独で細胞中に導入または標的ヌクレオチド配列を含む単離核酸に接触してもよい。また、本発明の標的配列改変方法において、Cas11dは、Cas11dをコードする核酸として細胞中に導入されてもよい。該核酸としては、例えば、mRNA等のRNA、またはDNAが挙げられる。
【0071】
上記Casタンパク質およびCas11dをコードする核酸は、例えば、ベクターに含まれていてもよく、該核酸配列は、好ましくは、プロモーターおよびターミネーター等の調節配列に作動可能に連結されている。導入する細胞が真核細胞である場合、好ましくは、上記Casタンパク質およびCas11dをコードする核酸に核移行シグナル配列が付加される。上記Casタンパク質Cas5d、Cas6d、Cas7d、Cas3dおよびCas10d、ならびにCas11dをコードする核酸の2以上または全てが単一のベクターまたは発現カセット中に含まれていてもよく、または別々のベクターまたは発現カセット中に含まれていてもよい。ベクターまたは発現カセットの数、ならびに各ベクターまたは発現カセットに組み込む核酸の種類および組み合わせに制限はない。上記Casタンパク質およびCas11dをコードする2以上の核酸が一つのベクターまたは発現カセット中に含まれる場合、これらの核酸配列は、ポリシストロニックに発現するように、例えば自己開裂型ペプチドをコードする配列等を介して、相互に連結されていてもよい。なお、上記Casタンパク質およびCas11dをコードする2以上の核酸を連結する順番は、いずれであってもよい。
【0072】
上記crRNAは、RNAとして、またはcrRNAをコードするDNAとして細胞中に導入されてもよい。上記crRNAはまた、上記Casタンパク質および/またはCas11dとの複合体として細胞中に導入または標的ヌクレオチド配列を含む単離核酸に接触してもよい。crRNAまたはcrRNAをコードするDNAは、例えば、ベクターに含まれていてもよく、該RNAまたはDNA配列は、好ましくは、プロモーターおよびターミネーター等の調節配列に作動可能に連結される。crRNAまたはcrRNAをコードするDNAは、上記Casタンパク質をコードする核酸および/またはCas11dをコードする核酸と同じベクターまたは発現カセット中に含まれていてもよく、または別々のベクターまたは発現カセット中に含まれていてもよい。
【0073】
ベクターとしては、当該分野において一般的に使用される種々のベクターを使用することができ、特に限定されず、導入される細胞又は導入方法に応じて適宜選択することができる。例えば、限定するものではないが、プラスミドベクター、ウイルスベクター、レトロウイルスベクター、ファージ、ファージミド、コスミド、人工/ミニ染色体、トランスポゾン等が挙げられる。
【0074】
上記調節配列としては、例えば、プロモーター、エンハンサー、ターミネーター、内部リボソーム侵入部位(IRES)、ポリアデニル化シグナル、ポリU配列、翻訳エンハンサー等が挙げられる。調節配列は、特に限定されず、宿主細胞等に基づき当業者が適宜選択することができる。例えば、プロモーターとしては、宿主が植物細胞である場合、CaMV35Sプロモーター、2xCaMV35Sプロモーター、CaMV19Sプロモーター、NOSプロモーター等が挙げられ、宿主が動物細胞である場合、SRαプロモーター、SV40プロモーター、LTRプロモーター、CMVプロモーター、RSVプロモーター、MoMuLV LTRプロモーター、HSV-TSプロモーター、ヒト翻訳伸長因子遺伝子プロモーター、CAGキメラ合成プロモーター等が挙げられる。
【0075】
上記核移行シグナル配列は、当該分野で公知であり、上記Casタンパク質、Cas11dおよびcrRNAを導入する細胞が由来する生物種に応じて適宜選択することができる。例えば、モノパータイト型核移行シグナルまたはバイパータイト型核移行シグナルを使用してもよい。
【0076】
本発明の標的配列改変方法においては、上記Casタンパク質、Cas11d、およびcrRNAに加えて、ドナーポリヌクレオチドを細胞中に導入または標的ヌクレオチド配列を含む単離核酸に接触してもよい。ドナーポリヌクレオチドは、標的部位に導入したい改変を含む少なくとも1つのドナー配列を含む。ドナーポリヌクレオチドは、ドナー配列に加えて、該ドナー配列の両端に標的配列の上流および下流の配列と相同性の高い配列(好ましくは、標的配列の上流および下流の配列と実質的に同一の配列)を含んでいてもよい。ドナーポリヌクレオチドは、一本鎖または二本鎖のDNAであってもよい。ドナーポリヌクレオチドは、当該分野で既知の技術に基づいて当業者が適宜設計することができる。
【0077】
本発明の標的配列改変方法においてドナーポリヌクレオチドが存在しない場合、標的ヌクレオチド配列における切断は、非相同末端結合(NHEJ)により修復されうる。NHEJはエラーが発生しやすいことが知られており、少なくとも1つのヌクレオチドの欠失、挿入、または置換、あるいはそれらの組み合わせが該切断の修復中に起こりうる。かくして、該配列は、標的配列部位において改変され、それにより、フレームシフトや未成熟終止コドンを誘発し、標的配列領域がコードしている遺伝子の発現が不活性化またはノックアウトされうる。
【0078】
本発明の標的配列改変方法においてドナーポリヌクレオチドが存在する場合、ドナーポリヌクレオチドのドナー配列は、切断された標的ヌクレオチド配列の相同組換え修復(HDR)により、標的配列部位に挿入されるか、または標的配列部位がドナー配列に置換される。その結果、標的配列部位に所望の改変が導入される。
【0079】
上記Casタンパク質、Cas11d、およびcrRNAの細胞中への導入は、当該分野で知られた種々の手段によって行うことができる。ドナーポリヌクレオチドを用いる場合、ドナーポリヌクレオチドもまた、当該分野で知られた種々の手段によって細胞中に導入すればよい。例えば、トランスフェクション、例えば、リン酸カルシウム仲介性トランスフェクション、エレクトロポレーション、リポソームトランスフェクション等、ウイルス形質導入、リポフェクション、遺伝子銃、マイクロインジェクション、アグロバクテリウム法、アグロインフィルトレーション法、PEG-カルシウム法等が挙げられる。
【0080】
上記Casタンパク質、Cas11d、およびcrRNA、またはこれらをコードする核酸、あるいは上記Casタンパク質等の複合体は、同時にまたは連続的に細胞中に導入すればよい。ドナーポリヌクレオチドを用いる場合は、該ドナーポリヌクレオチドもまた、上記Casタンパク質、Cas11d、およびcrRNA、またはこれらをコードする核酸、あるいは上記Casタンパク質等の複合体と同時にまたは連続的に細胞中に導入すればよい。
【0081】
上記Casタンパク質、Cas11dおよびcrRNAの導入の際、細胞は、標的配列部位での切断に適当な条件下で培養される。次いで、該細胞は、細胞増殖および維持に適当な条件下で培養される。ドナーポリヌクレオチドを導入する際も同様である。培養条件は、導入される細胞が由来する生物種に適切な培養条件であればよく、例えば、既知の細胞培養技術に基づいて当業者により適宜決定可能である。
【0082】
本発明の標的配列改変方法によれば、細胞中に導入されたTiDシステムにより標的ヌクレオチド配列上の部位が切断され、該切断配列の修復時に、標的配列が改変される。例えば、本発明の標的配列改変方法は、ゲノム上の標的ヌクレオチド配列の改変のために用いることができ、該方法によりゲノム上の二本鎖DNAが切断され、標的部位が改変される。かくして、本発明の標的配列改変方法によれば、標的配列が改変された細胞が製造される。さらに、標的配列が改変された細胞が植物細胞である場合、該細胞から標的配列が改変された植物を製造することもできる。該植物には、植物体、組織、器官(例えば、根、茎、葉など)、繁殖材料(例えば、種子、塊茎など)、子孫植物、クローン植物等が包含される。例えば、該標的配列が改変された植物細胞から植物体を再生することにより、標的配列が改変された植物体を製造することができる。植物細胞からの植物体の再生は、当該分野で既知の方法によって実施することができる。該植物体からさらに、標的配列が改変された組織、器官、繁殖材料、子孫植物、クローン等を得ることもできる。また、本発明の標的配列改変方法を用いて標的配列が改変された動物細胞を製造し、該動物細胞を用いて標的配列が改変された動物を製造することもできる。該動物には、動物個体、組織、器官、子孫、クローン動物等も包含される。動物は、好ましくは非ヒト動物である。動物細胞から動物を製造する方法として、当該分野で既知の方法を用いることができる。動物細胞としては、例えば、生殖細胞、受精卵、または多能性幹細胞が用いられる。例えば、本発明のTiDシステムを受精卵に導入し、該受精卵を非ヒト動物の子宮に移植し、仔を得ることによって、標的配列が改変された動物個体を製造してもよい。該動物個体からはさらに、標的配列が改変された組織、器官、子孫、クローン等を得ることもできる。
【0083】
本発明の標的配列改変方法によれば、標的配列に、数塩基から数十塩基の短鎖領域の挿入および/または欠失を導入するだけでなく、数キロベースないし数十キロベースの長鎖領域の塩基欠失も導入することができる。数キロベースないし数十キロベースとしては、限定するものではないが、例えば1000~90000塩基長、好ましくは2000~80000塩基長、より好ましくは2000~70000塩基長、さらに好ましくは2000~60000塩基長、2000~50000塩基長、2000~40000塩基長、2000~30000塩基長、または2000~20000塩基長が挙げられる。したがって、本発明の標的配列改変方法を用いれば、1つのガイドRNAを設計するだけで、1遺伝子座全体を欠失させることが可能となる。また、本発明の標的配列改変方法を用いれば、動物の遺伝子のように長いイントロンが存在する場合でも、特定のエキソンを完全に欠落させることも可能である。さらに、本発明の標的配列改変方法を用いれば、隣接して存在する遺伝子群をまとめて欠落させることも可能である。
【0084】
本発明の標的配列改変方法によれば、PAM配列の上流方向または下流方向、あるいはPAM配列の上流および下流の両方(すなわち、二方向性)の塩基欠失をもたらすことができる。
【0085】
(8)本発明の標的遺伝子発現制御方法
さらに、本発明の標的配列ターゲティング方法または標的配列改変方法において、標的ヌクレオチド配列として、標的遺伝子の配列または標的遺伝子の転写調節配列(例えば、転写因子結合配列、プロモーター配列、エンハンサー配列など)の少なくとも一部の配列を選択することにより、標的遺伝子の転写を抑制し、それにより当該標的遺伝子の発現を抑制することができる。また、本発明の標的配列ターゲティング方法において、標的ヌクレオチド配列として標的遺伝子の転写調節配列の少なくとも一部の配列を選択し、Casタンパク質と遺伝子発現調節モジュール(例えば、転写因子の転写活性化モジュールまたは転写抑制モジュール)とを含む融合タンパク質を用いることにより、当該標的遺伝子の転写を制御(活性化または不活性化)し、それにより標的遺伝子の発現を制御(増幅または抑制)することができる。かくして、本発明は、標的遺伝子発現制御方法を提供する。
【0086】
本発明の標的遺伝子発現制御方法では、標的ヌクレオチド配列として、標的遺伝子の配列または転写調節配列の少なくとも一部の配列が選択され、該配列と塩基対を形成する配列を含むcrRNAを使用する。本発明の標的遺伝子発現制御方法は、本発明の標的配列ターゲティング方法においてヌクレオチド配列を標的化する際に、Casタンパク質とcrRNAとの複合体が標的配列に結合することにより、該標的遺伝子の転写が抑制されることを含む。この場合、標的遺伝子配列は切断されないが、上記Casタンパク質とcrRNAとの複合体が標的ヌクレオチド配列に結合することにより、該標的遺伝子領域の機能または該遺伝子の転写もしくは発現が阻害される。あるいは、本発明の標的遺伝子発現制御方法は、本発明の標的配列改変方法においてヌクレオチド配列を標的化および切断することにより、該標的遺伝子の転写が抑制されることを含む。本発明の標的遺伝子発現制御方法は、イン・ビトロ、イン・ビボまたはエクス・ビボのいずれで行ってもよい。
【0087】
上記Casタンパク質、Cas11dおよびcrRNA、それらの細胞中への導入方法、および導入時および導入後の細胞培養等については、上記「(6)本発明の標的配列ターゲティング方法」および「(7)本発明の標的配列改変方法」において記載したのと同様である。
【0088】
(9)本発明の複合体
本発明の複合体は、上記Casタンパク質、Cas11d、およびcrRNAを含む。本発明は、特に、Cas5d、Cas6d、Cas7d、Cas10d、Cas11d、およびcrRNAを含む複合体、およびCas5d、Cas6d、Cas7d、Cas3d、Cas10d、Cas11d、およびcrRNAを含む複合体を提供する。さらに、本発明では、Cas5d、Cas6d、Cas7d、Cas10dおよび機能性ポリペプチドを含む融合タンパク質と、Cas11d、およびcrRNAを含む複合体も提供される。さらに、上記複合体をコードするDNA分子も提供される。本発明の複合体は、本発明の標的配列ターゲティング方法、標的配列改変方法、および標的遺伝子発現制御方法に使用することができる。例えば、Cas5d、Cas6d、Cas7d、Cas3dおよびCas10dを含む複合体、Cas11d、およびcrRNAを含む複合体を細胞に導入して、該細胞内で該複合体を機能させることにより、該細胞のゲノム上の標的配列を改変することができる。また、Cas5d、Cas6d、Cas7dおよびCas10dを含む複合体、Cas11dおよびcrRNAを含む複合体を細胞に導入して、該細胞内で該複合体を機能させることにより、該細胞中の標的配列を標的化することができ、また、標的遺伝子の発現を制御することができる。
【0089】
本発明の複合体は、常法により、イン・ビトロ、イン・ビボまたはエクス・ビボで製造することができる。例えば、上記Casタンパク質をコードする核酸、Cas11dをコードする核酸、およびcrRNAまたはcrRNAをコードするDNAを細胞中に導入し、該細胞内で複合体を形成させてもよい。
【0090】
本発明の複合体の例として、限定するものではないが、Microcystis aeruginosaのCas5d(配列番号2)、Cas6d(配列番号3)、Cas7d(配列番号4)およびCas10d(配列番号5)と、Cas11d(配列番号6)と、GUUCCAAUUAAUCUUAAGCCCUAUUAGGGAUUGAAACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGUUCCAAUUAAUCUUAAGCCCUAUUAGGGAUUGAAAC(配列番号7;Nは、標的ヌクレオチド配列に相補的な配列を構成する任意のヌクレオチドである)で示される配列からなるcrRNAとを含む複合体、およびMicrocystis aeruginosaのCas5d(配列番号2)、Cas6d(配列番号3)、Cas7d(配列番号4)、Cas3d(配列番号1)およびCas10d(配列番号5)と、Cas11d(配列番号6)と、GUUCCAAUUAAUCUUAAGCCCUAUUAGGGAUUGAAACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGUUCCAAUUAAUCUUAAGCCCUAUUAGGGAUUGAAAC(配列番号7;Nは、標的ヌクレオチド配列に相補的な配列を構成する任意のヌクレオチドである)で示される配列からなるcrRNAとを含む複合体が挙げられる。上記crRNAの配列中、Nの数は10~70の範囲で変更してもよく、好ましくは20~50、より好ましくは25~45、さらに好ましくは30~40、またさらに好ましくは32~37の範囲で変更してもよい。
【0091】
(10)本発明の発現ベクター
本発明はさらに、上記Casタンパク質Cas5d、Cas6d、Cas7dおよびCas10dをコードする核酸、上記Cas11dをコードする核酸、および上記crRNAまたは上記crRNAをコードするDNAを含む発現ベクター、ならびに上記Casタンパク質Cas3d、Cas5d、Cas6d、Cas7dおよびCas10dをコードする核酸、上記Cas11dをコードする核酸、および上記crRNAまたは上記crRNAをコードするDNAを含む発現ベクターを提供する。
【0092】
本発明のベクターは、上記「(6)本発明の標的配列ターゲティング方法」、「(7)本発明の標的配列改変方法」、および「(8)本発明の標的遺伝子発現制御方法」に記載したような、上記Casタンパク質、Cas11dおよびcrRNAを細胞中に導入するためのベクターである。該ベクターの導入後、該細胞中で上記Casタンパク質、Cas11dおよびcrRNAを発現する。本発明のベクターは、また、上記crRNAに含まれる標的配列を、制限部位を含む任意の配列に替えたベクターであってもよい。このようなベクターは、該任意の配列部位に所望の標的ヌクレオチド配列を組み込んで使用される。該任意の配列としては、例えば、CRISPRタイプI-Dの遺伝子座にあるスペーサー配列またはその一部であってもよい。
【0093】
各Casタンパク質をコードする核酸、Cas11dをコードする核酸、およびcrRNAまたはcrRNAをコードするDNAは同じベクター中に含まれていてもよく、または2以上のベクターに別れて含まれていてもよい。
【0094】
(11)本発明のキット
本発明のキットは、上記した本発明の標的配列ターゲティング方法、標的配列改変方法、および標的遺伝子発現制御方法に使用するためのキットであり、上記Casタンパク質Cas5d、Cas6d、Cas7dおよびCas10d、またはこれらのタンパク質をコードする核酸、Cas11dまたはCas11dをコードする核酸、および上記crRNAまたはcrRNAをコードするDNAを含むか、あるいは上記Casタンパク質Cas3d、Cas5d、Cas6d、Cas7d、およびCas10dまたはこれらのタンパク質をコードする核酸、Cas11dまたはCas11dをコードする核酸、および上記crRNAまたはcrRNAをコードするDNAを含む。上記Casタンパク質およびCas11dをコードする核酸、および/またはcrRNAをコードするDNAはベクター系または発現カセット系に含まれていてもよい。本発明のキットの構成成分については、上記(2)~(7)に記載のとおりである。
【0095】
さらに、Cas11dを用いることを特徴とする、TiDシステムを利用した標的ヌクレオチド配列の標的化および改変の効率を改善する方法、ならびにCas11dを含む、TiDシステムを利用した標的ヌクレオチド配列の標的化および改変の効率を改善する組成物が提供される。上記方法において、Cas11dは標的配列を含む細胞中に導入される。上記方法および組成物の実施および構成成分等については、上記(1)~(7)に記載のとおりである。
【0096】
以下に、本発明の実施例を示した。ただし、本発明はこれらの実施例に限定されない。
【実施例】
【0097】
実施の一形態として、M.aeruginosa由来のTiD遺伝子座由来の遺伝子群(Cas3d、Cas5d、Cas6d、Cas7d、Cas10d)を、クローン化して用いた。M.aeruginosa由来のCas3d、Cas5d、Cas6d、Cas7d、およびCas10dのアミノ酸配列情報(配列番号1~5)を基に、各Casタンパク質をコードするDNA配列を人工合成した。実施例中のDNA配列の加工および構築操作には、人工遺伝子化学合成、PCR法、制限酵素処理、ライゲーション、Gibson Assembly法のいずれかを用いた。また、塩基配列の決定にはサンガー法あるいは次世代シーケンス法を用いた。
【0098】
Cas10d C-ter配列については、Cas10dのストップコドンより5’上流の483塩基の領域をクローン化して用いた。
【0099】
標的配列については、以下を用いた。PAMはGTCである。
AAVS1_GTC_70-107(+): cctagtggccccactgtggggtggaggggacagat(配列番号20)
【0100】
<方法>
(1)ベクターの構築
遺伝子フラグメントのクローニングのためのPCR増幅は、PrimeSTAR Max(TaKaRa)を用いて行た。アセンブリングのためのクローニングは、Quick ligation kit(NEB)、NEBuilder HiFi DNA Assembly(NEB)、およびMultisite gateway Pro(Thermo Fisher Scientific)を用いて行った。
【0101】
(1-1)哺乳動物ベクター
ヒトコドンに最適化したCasエフェクター遺伝子(Cas3d、Cas5d、Cas6d、Cas7d、およびCas10d)、およびCas11dをN末端のSV40核移行シグナル(NLS)(配列番号21:KKKKRK)と共に合成し(gBlocks(登録商標))(IDT)、アセンブルし、pEFsベクター(Lopez-Perrote et al,(2016), Nucleic Acids Res, 44:1909-1923. doi:10.1093/nar/gkv1527)中に別々にクローン化して、単一Cas発現ベクター pEFs-myc-SV40NLS-Cas3d、pEFs-myc-SV40NLS-Cas5d、pEFs-myc-SV40NLS-Cas6d、pEFs-myc-SV40NLS-Cas7d、pEFs-myc-SV40NLS-Cas10d、およびpEFs-myc-SV40NLS-Cas11dを得た。各Casタンパク質にはmycタグを融合した。
【0102】
crRNA発現ベクターのために、リピート-スペーサー-リピート配列(配列番号22)を含有するDNAフラグメントを人工合成し、pEX-A2J1(Eurofins Genomics)中、ヒトU6プロモーター下でクローン化して、pAEX-hU6crRNAを得た。gRNA配列の挿入のために、標的配列を含有する2つのオリゴヌクレオチドをアニールし、制限酵素BsaI(NEB)を用いるGolden Gateクローニングを用いて、crRNA発現ベクター中にクローン化した。
【0103】
【0104】
(1-2)ルシフェラーゼレポーターアッセイプラスミド
ルシフェラーゼ(luc)レポーターアッセイのために、NanoLUxxUC発現ベクターを構築した。まず、NLUxxUC_Block1およびNLUxxUC_Block2 DNAフラグメントを合成した(IDT社製)。NLUxxUC_Block1は、NanoLUCTM(登録商標)遺伝子(Promega社製)配列の最初の351bpおよびマルチクローニングサイトを含む。XbaI部位をNanoLUC遺伝子の5’末端に付加した。NLUxxUC_Block2は、NanoLUC遺伝子の3’末端の465bpを含む。XhoI部位をNanoLUC遺伝子の3’末端に付加した。これらのフラグメントをアセンブルし、pCAG-EGxxFPベクター(addgene、#50716)中にクローン化した。NLUxxUC_Block1をXbaIおよびBamHI消化によって、NLUxxUC_Block2をXbaIおよびEcoRI消化によって、pCAG-NLUxxUCベクターからそれぞれ除去することによって、各スプリットタイプNLUxxUCレポーターを構築した。各消化ベクターをマルチクローニングサイトと共にアセンブルし、pCAG-NLUxxUC_Block1およびpCAG-NLUxxUC_Block2を得た。
【0105】
(2)細胞培養およびトランスフェクション
ヒト胚性腎細胞株293T(HEK293T,RIKEN BRC)を、10%胎仔ウシ血清(Thermo Fisher Scientific)、GlutalMAX(登録商標)サプリメント(Thermo Fisher Scientific)、100単位/mLペニシリン、および100μg/mLストレプトマイシンを補足したダルベッコ改変イーグル培地(DMEM)中、37℃で60分、5%CO2インキュベーションで培養した。トランスフェクションの前日にHEK293T細胞を6ウェルプレート(Corning, USA)に播種した。TurboFect Transfection Reagent(Thermo Fisher Scientific)を製造者の推奨プロトコルに従って用いて、細胞をトランスフェクトした。6ウェルプレートの各ウェルについて、NucleoSpin(登録商標)Plasmid Transfection-gradeキット(Macherey-Nagel, Germany)を用いて抽出された全4μgのプラスミドを用いた。変異分析のために、48時間後にトランスフェクト細胞を回収した。
【0106】
(3)ルシフェラーゼレポーターアッセイ
トランスフェクションの前日に、HEK293T細胞を96ウェルプレート(Corning)に、密度2.0x104細胞/ウェルで播種した。TurboFect Transfection Reagent(Thermo Fisher Scientific)を製造者の推奨するプロトコルに従って用いて、細胞をトランスフェクトした。96ウェルプレートの各ウェルについて、(1)Fluc遺伝子をコードするpGL4.53ベクター(Promega,USA)、(2)標的DNAフラグメントの挿入により中断されたpCAG-nLUxxUCベクター、および(3)TiD成分をコードしているプラスミドDNAを含む全200ngのプラスミドDNAを用いた。NanoLucおよびFlucルシフェラーゼ活性は、トランスフェクションの3日後に、Nano-Glo(登録商標)Dual-Luciferase(登録商標)Reporter Assay System(Promega)を用いて測定した。ホタル(Fluc)活性を内部対照として用いた。NanoLuc/Fluc比を各サンプルについて計算し、非標的化gRNAでトランスフェクトした対照サンプルのNanoLuc/Fluc比と比較した。相対的NanoLuc/Fluc活性を用いて、gRNA活性を評価した。実験は独立して3回繰り返し、同様の結果を得た。
【0107】
(4)長鎖DNA領域(long range)PCRによるDNA欠失分析
HEK293T細胞中のDNA欠失を検出するために、長鎖DNA領域PCRおよび長鎖DNA領域PCR産物のプールのクローニングを行った。最初に、Geno Plus(登録商標)Genomic DNA Extraction Miniprep System (Viogene-BioTek, Taiwan)を用いて、ゲノムDNAをHEK293T細胞から抽出した。次に、ネステッドPCRを行って、長鎖DNA領域を特異的に増幅した。まず、抽出したゲノムDNAを鋳型として用い、種々の長さ(10kb~19kb)の標的DNA領域を増幅するように設計された、長鎖DNA領域PCR用の特異的プライマーセットを用いて、標的DNA領域を増幅した。最初のPCR反応は、KOD ONE Master Mix(TOYOBO, Osaka, Japan)を用いて、下記の条件下で行った。10秒98℃、5秒60℃および50秒(アンプリコン:15-20kb)または150秒(アンプリコン:10-15kb)または200秒(アンプリコン:<10kb)68℃を35サイクル。次いで、PCR産物を100~10,000倍に希釈し、ネステッドPCRの鋳型として用いた。ネステッドPCRは、また、上記と同じ条件下で行った。PCR産物を1%アガロースゲル上の電気泳動によって分離し、GelRed(登録商標)Nucleic Acid Gel Stain(Biotium)での染色によって視覚化した。ネステッドPCR産物をプールし、Monofas(登録商標)DNA purification Kit I(GL Sciences, Japan)を用いて精製した。PCR産物の精製混合物を、Mighty TA-cloning Kit(Takara Bio, Japan)を用いてpMD20-Tベクター中にクローン化した。クローンをピックアップし、M13 UniおよびM13 RVプライマーを用いてサンガー配列決定した。サンガー配列決定の結果をBLATNサーチおよびClustalWプログラムを用いて分析して、DNA欠失を同定した。
【0108】
実施例1:Cas10d配列中のCas11e様配列(Cas11d)の同定
M.aeruginosa由来のCasエフェクタータンパク質のうち、Cas10d配列についてCLASTAL Wプログラムを用いて、CRISPR type I-EのCas11e配列(Escherichia coli、Acetobacter pasteurianus、Acidimicrobium ferrooxidans、Amycolatopsis mediterranei、Bifidobacterium animalis、Cellulomonas fimi、Coriobacterium glomerans、Cyanothece (Gloeothece citriformis) PCC7424、Desulfococcus oleovorans、Erwinia amylovora、Frankia alni、Geobacter sulfurreducens、Kitasatospora setae、Lactobacillus fermentum由来)とのアラインメント解析を行ったところ、Cas10dのC末端領域にはCas11eに特徴的なα-ヘリックス領域が数カ所保存されていることが見出された(
図1)。さらに、各種type I-D Cas10d C-ter(Anabaena cylindrica、Calothrix PCC6303 (Calothrix parietina)、Crinalium epipsammum、Cyanothece PCC7424 (Gloeothece citriformis)、Gloeobacter kilaueensis、Gloeocapsa sp. PCC7428、Halothece PCC7418、Methanospirillum hungatei、Nostoc sp. NIES-2111、Rivularia sp. PCC7116、Stanieria cyanosphaera、Synechocystis sp. PCC6803由来)をCas11eとアラインメント解析により比較した。
【0109】
実施例2:Cas10d C-ter(Cas11d)の発現が細胞中でのゲノム編集活性に及ぼす影響の解析
Cas11dの発現が真核生物におけるTiDのゲノム編集活性に及ぼす影響を解析するため、Microcystis aeruginosa PC9808株のCas10d遺伝子から、Cas11d配列に相当すると考えられる遺伝子配列領域(Cas10d遺伝子のストップコドンより483b上流まで)をクローン化し動物細胞発現ベクターを構築し、Cas11d発現ベクターとした。Cas3d、Cas5d、Cas6d、Cas7d、Cas10d及びgRNAの各発現ベクターと共に、Cas11d発現ベクターを同時にHEK293細胞に導入し、Lucレポーターアッセイによりゲノム編集活性を解析した。終止コドンによって分離される300bp相同性アームならびにTiD標的部位を含有するヒトAAVS1遺伝子フラグメントを含有するNanoLucルシフェラーゼを組換えレポーターとして用いた。各単一Cas発現ベクター、TiD crRNA発現ベクター、および標的配列が導入されたLUCレポーターベクターをHEK293T細胞中に同時トランスフェクトし、トランスフェクション後72時間、ルミネッセンスによりエンドヌクレアーゼ切断を検出した。
【0110】
その結果、Cas11dを別途発現させる事によって、Cas3d、Cas5d、Cas6d、Cas7d、Cas10d及びcrRNAの各発現ベクターによるゲノム編集活性と比較し、2.5倍の活性上昇が示された(
図2)。また、標的化に用いるcrRNA長について、短縮形である30塩基長の標的配列(配列番号23:5’-CCTAGTGGCCCCACTGTGGGGTGGAGGGGA-3’)を標的とするcrRNAの場合でもCas11dの発現効果が認められた(
図2)。
【0111】
実施例3:Cas10d C-ter(Cas11d)の発現による、ヒトゲノム編集の解析
Cas11dの発現効果として、ヒトゲノム上の標的にどのような変異が誘導されるか解析した。Lucレポーターアッセイに用いたヒトAAVS遺伝子の標的化gRNA AAVS GTC_70-107(35b)を組み込んだgRNA発現ベクターおよび各単一Cas発現ベクターと共に、Cas11d発現ベクターをHEK293T細胞中にトランスフェクトした。AAVS標的部位付近を含む10-19kbを増幅するプライマーセットを用いて、TiDベクター導入HEK293T細胞の全DNAから、DNAフラグメントをPCR増幅し、得られたPCR産物をクローン化し、サンガー法によって配列決定した。
【0112】
プライマーとして、F1(配列番号24:5’-CTTAGCATAATGTCCTCAAGATACATCTAC-3’)およびR1(配列番号25:5’-GATATGTAACCATTATTCTAGATGGCTATG-3’)、ならびにプライマーF2(配列番号26:5’-GGGTCCAAGGGAAAAGGAGGACTGATCC-3’)およびR2(配列番号27:5’-ATAAACACAAACTCATAAACAACATACATC-3’)を用いた。
【0113】
まず
図3Aに示すプライマーF1およびR1を用いてPCRを行い得られた増幅DNAを、これを1st-PCR産物とした。次に1st-PCR産物を20倍~50倍希釈し、
図3Aに示すプライマーF2およびR2を用いてPCRを行い、電気泳動解析を行った。結果を
図3Bに示す。レーン1はTiDを発現させない野生型HEK293細胞由来DNAを用いたPCR産物である。レーン2および3はCas11d発現ベクターを含まないTiDを導入した実験の結果であり、レーン2は標的配列の代わりに非特異的な配列(配列番号28:5’-AAATAAATAGCGGTCGGGTGCCCCGAATTTCACAT-3’)に対応する配列を含むgRNA用い、レーン3は標的配列AAVS GTC_70-107(35b)に対応する配列を含むgRNAを用いた結果である。レーン4および5はCas11d発現ベクターを含むTiDを導入した実験の結果であり、レーン4は、標的配列の代わりに非特異的な配列に対応する配列を含むgRNAを用い、レーン5はAAVS GTC_70-107(35b)に対応する配列を含むgRNAを用いた結果である。
【0114】
その結果、TiDの導入により、標的部位で6kbを超える長鎖領域欠失が生じた。興味深いことに、Cas11d発現ベクターを導入した実験区では、Cas11d発現ベクターを含まない実験区に比べ、より長い欠失が生じることがシーケンス解析の結果から明らかとなった(
図3C,D)。
【配列表フリーテキスト】
【0115】
SEQ ID NO:1; Microcystis aeruginosa Cas3d amino acid sequence
SEQ ID NO:2; Microcystis aeruginosa Cas5d amino acid sequence
SEQ ID NO:3; Microcystis aeruginosa Cas6d amino acid sequence
SEQ ID NO:4; Microcystis aeruginosa Cas7d amino acid sequence
SEQ ID NO:5; Microcystis aeruginosa Cas10d amino acid sequence
SEQ ID NO:6; Microcystis aeruginosa Cas11d amino acid sequence
SEQ ID NO:7; TiDcrRNA containing repeat (37b) and spacer (35b of N). N is any nucleotide constituting a sequence that forms base pairs with a target nucleotide sequence
SEQ ID NO:8; Anabaena cylindrica Cas11d amino acid sequence
SEQ ID NO:9; Calothrix PCC6303 (Calothrix parietina) Cas11d amino acid sequence
SEQ ID NO:10; Crinalium epipsammum Cas11d amino acid sequence
SEQ ID NO:11; Cyanothece PCC7424 (Gloeothece citriformis) Cas11d amino acid sequence
SEQ ID NO:12; Gloeobacter kilaueensis Cas11d amino acid sequence
SEQ ID NO:13; Gloeocapsa sp. PCC7428 Cas11d amino acid sequence
SEQ ID NO:14; Halothece PCC7418 Cas11d amino acid sequence
SEQ ID NO:15; Methanospirillum hungatei Cas11d amino acid sequence
SEQ ID NO:16; Nostoc sp. NIES-2111 Cas11d amino acid sequence
SEQ ID NO:17; Rivularia sp. PCC7116 Cas11d amino acid sequence
SEQ ID NO:18; Stanieria cyanosphaera Cas11d amino acid sequence
SEQ ID NO:19; Synechocystis sp. PCC6803 Cas11d amino acid sequence
SEQ ID NO:20; Target sequence (35b)
SEQ ID NO:21; Monopartite nuclear localizing signal (NLS) amino acid sequence
SEQ ID NO:22; DNA fragment for pre-mature crRNA
SEQ ID NO:23; Target sequence (30b)
SEQ ID NO:24; Primer F1
SEQ ID NO:25; Primer R1
SEQ ID NO:26; Primer F2
SEQ ID NO:27; Primer R2
SEQ ID NO:28; Non-specific sequence
SEQ ID NO:29; Escherichia coli Cas11e amino acid sequence
SEQ ID NO:30; Acetobacter pasteurianus Cas11e amino acid sequence
SEQ ID NO:31; Acidimicrobium ferrooxidans Cas11e amino acid sequence
SEQ ID NO:32; Amycolatopsis mediterranei Cas11e amino acid sequence
SEQ ID NO:33; Bifidobacterium animalis Cas11e amino acid sequence
SEQ ID NO:34; Cellulomonas fimi Cas11e amino acid sequence
SEQ ID NO:35; Coriobacterium glomerans Cas11e amino acid sequence
SEQ ID NO:36; Cyanothece (Gloeothece citriformis) PCC7424 Cas11e amino acid sequence
SEQ ID NO:37; Desulfococcus oleovorans Cas11e amino acid sequence
SEQ ID NO:38; Erwinia amylovora Cas11e amino acid sequence
SEQ ID NO:39; Frankia alni Cas11e amino acid sequence
SEQ ID NO:40; Geobacter sulfurreducens Cas11e amino acid sequence
SEQ ID NO:41; Kitasatospora setae Cas11e amino acid sequence
SEQ ID NO:42; Lactobacillus fermentum Cas11e amino acid sequence
【配列表】