(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-02-08
(45)【発行日】2023-02-16
(54)【発明の名称】熱安定性CAS9ヌクレアーゼ
(51)【国際特許分類】
C12N 15/09 20060101AFI20230209BHJP
C12N 15/11 20060101ALI20230209BHJP
C12N 5/10 20060101ALI20230209BHJP
C12N 9/22 20060101ALI20230209BHJP
【FI】
C12N15/09 110
C12N15/11 Z ZNA
C12N5/10
C12N9/22
(21)【出願番号】P 2019533103
(86)(22)【出願日】2017-08-16
(86)【国際出願番号】 EP2017070797
(87)【国際公開番号】W WO2018108339
(87)【国際公開日】2018-06-21
【審査請求日】2020-08-13
(31)【優先権主張番号】PCT/EP2016/081077
(32)【優先日】2016-12-14
(33)【優先権主張国・地域又は機関】EP
【前置審査】
(73)【特許権者】
【識別番号】519213698
【氏名又は名称】ヴァーヘニンゲン ユニヴェルシテット
(73)【特許権者】
【識別番号】513175723
【氏名又は名称】スティッチング フォール デ テクニッシュ ウェテンスシャペン
(74)【代理人】
【識別番号】100092783
【氏名又は名称】小林 浩
(74)【代理人】
【識別番号】100120134
【氏名又は名称】大森 規雄
(74)【代理人】
【識別番号】100126354
【氏名又は名称】藤田 尚
(72)【発明者】
【氏名】ファン デル ウースト,ジョン
(72)【発明者】
【氏名】ファン クラーネンブルク,リチャード
(72)【発明者】
【氏名】ボスマ,エレッケ フェンナ
(72)【発明者】
【氏名】モウギアコス,イオアニス
(72)【発明者】
【氏名】モハンラジュ,プラルタナ
【審査官】松原 寛子
(56)【参考文献】
【文献】UniProtKB,[online],A0A178TEJ9_GEOSE,検索日[2020/12/01],2016年11月02日,<https://www.uniprot.org/uniprot/A0A178TEJ9.txt?version=3>
【文献】Molecular Cell,2016年04月07日,vol.62,p.137-147
【文献】Genome Biology,2015年,16:253,1-13
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/09
C12N 15/11
C12N 5/10
C12N 9/22
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
CAplus/REGISTRY/MEDLINE/EMBASE/BIOSIS(STN)
GenBank/EMBL/DDBJ/GeneSeq
(57)【特許請求の範囲】
【請求項1】
標的核酸配列を含む二本鎖標的ポリヌクレオチドに結合する、切断する、標識するまたは改変するための核タンパク質複合体であって、
Casタンパク質、前記二本鎖標的ポリヌクレオチドにおいて前記標的核酸配列を認識する少なくとも1つのターゲッティングRNA分子、および前記標的ポリヌクレオチドを含み、
前記Casタンパク質が、配列番号1のアミノ酸配列を有し、
前記二本鎖標的ポリヌクレオチドが、前記標的核酸配列を含む標的核酸鎖、ならびに前記標的核酸配列に相補的であるプロトスペーサー核酸配列および前記プロトスペーサー配列の3’末端に直接隣接したプロトスペーサー隣接モチーフ(PAM)配列を含む非標的核酸鎖を含み、前記PAM配列が、5’-NNNNCSAA-3’(配列番号49)を含み、前記核タンパク質複合体がヒト細胞におけるものであり、前記細胞が胚性幹細胞ではない、核タンパク質複合体。
【請求項2】
標的核酸配列を含む二本鎖標的ポリヌクレオチドを有する形質転換ヒト細胞であって、前記二本鎖標的ポリヌクレオチドが、前記標的核酸配列を含む標的核酸鎖、および前記標的核酸配列に相補的であるプロトスペーサー核酸配列を含む非標的核酸鎖を含み、前記細胞が、
配列番号1のアミノ酸配列を有する、Cas(clustered regularly interspaced short palindromic repeat associated:CRISPR関連)タンパク質、
前記標的核酸配列を含む前記二本鎖標的ポリヌクレオチドに結合する、切断する、標識するまたは改変するための前記標的核酸鎖中の前記標的核酸配列を認識する少なくとも1つのターゲティングRNA分子であって、前記非標的
核酸鎖が、前記プロトスペーサー配列の3’末端に直接隣接するプロトスペーサー隣接モチーフ(PAM)配列をさらに含み、前記PAM配列が5’-NNNNCSAA-3’(配列番号49)を含む、少なくとも1つのターゲティングRNA分子、および
少なくとも1つの前記Casタンパク質および前記ターゲティングRNA分子をコードする核酸を含む発現ベクター
を含み、前記ヒト細胞が胚性幹細胞ではない、形質転換ヒト細胞。
【請求項3】
前記Casタンパク質が、発現ベクターから発現される、請求項2に記載の形質転換
ヒト細胞。
【請求項4】
前記結合、切断、標識もしくは改変、または前記核タンパク質複合体が、55℃と65℃の間の温度で発生する、請求項1から3のいずれかに記載の形質転換
ヒト細胞または核タンパク質複合体。
【請求項5】
前記標的核酸配列を含む前記二本鎖標的ポリヌクレオチドが前記Casタンパク質により切断され、前記切断がDNA切断である、請求項1から4のいずれかに記載の形質転換
ヒト細胞または核タンパク質複合体。
【請求項6】
前記標的
核酸配列を含む前記標的ポリヌクレオチドが二本鎖DNAであり、前記結合、切断、標識または改変が、前記標的ポリヌクレオチド中の二本鎖切断をもたらす、請求項1から5のいずれかに記載の形質転換
ヒト細胞または核タンパク質複合体。
【請求項7】
前記PAM配列が、5’-NNNNCCAA-3’(配列番号51)を含む、請求項1から6のいずれかに記載の形質転換
ヒト細胞または核タンパク質複合体。
【請求項8】
前記ターゲティングRNA分子が、crRNAおよびtracrRNAを含む、請求項1から7のいずれかに記載の形質転換
ヒト細胞または核タンパク質複合体。
【請求項9】
前記少なくとも1つのターゲティングRNA分子の長さが、35~200ヌクレオチド残基の範囲である、および/または、前記標的核酸配列が、15~32ヌクレオチド残基長である、請求項1から8のいずれかに記載の形質転換
ヒト細胞または核タンパク質複合体。
【請求項10】
前記Casタンパク質の前記ヌクレアーゼ活性が不活性であり、前記Casタンパク質が、ヘリカーゼ、ヌクレアーゼ、ヘリカーゼ-ヌクレアーゼ、DNAメチラーゼ、ヒストンメチラーゼ、アセチラーゼ、ホスファターゼ、キナーゼ、転写(共)活性化因子、転写リプレッサー、DNA結合タンパク質、DNA構築タンパク質、マーカータンパク質、レポータータンパク質、蛍光タンパク質、リガンド結合タンパク質、シグナルペプチド、細胞内局在配列、抗体エピトープまたは親和性精製タグから選択される少なくとも1つの機能的部分をさらに含む、請求項1から9のいずれかに記載の形質転換
ヒト細胞または核タンパク質複合体。
【請求項11】
ヒト細胞中における二本鎖標的ポリヌクレオチドに結合する、これを切断する、標識するまたは改変するin vitroの方法であって、前記二本鎖標的ポリヌクレオチドが、標的核酸配列を含む標的核酸鎖、および前記標的核酸配列に相補的であるプロトスペーサー核酸配列を含む非標的核酸
鎖を含み、前記方法が、
a.少なくとも1つのターゲティングRNA分子を設計するステップであって、前記ターゲティングRNA分子が、前記標的
核酸鎖の前記標的
核酸配列を認識し、前記非標的
核酸鎖が、前記プロトスペーサー配列の3’末端に直接隣接するプロトスペーサー隣接モチーフ(PAM)配列をさらに含み、前記PAM配列が、5’-NNNNCSAA-3’(配列番号49)を含む、ステップ、
b.前記ターゲティングRNA分子およびCasタンパク質を含むリボ核タンパク質複合体を形成するステップであって、前
記Casタンパク質が、配列番号1のアミノ酸配列を有する、ステップ、および
c.前記標的ポリヌクレオチドに結合する、これを切断する、標識するまたは改変する前記リボ核タンパク質複合体であって、前記ヒト細胞が胚性幹細胞ではなく、前記方法が前記ヒトの生殖細胞系遺伝的同一性を改変しない、リボ核タンパク質複合体
を含む、方法。
【請求項12】
標的核酸配列を含む二本鎖標的ポリヌクレオチドにin vitroで結合する、切断する、標識するまたは改変するための、少なくとも1つのターゲッティングRNA分子およびCasタンパク質の使用であって、
前記二本鎖標的ポリヌクレオチドが、前記標的核酸配列を含む標的核酸鎖、および前記標的核酸配列に相補的であるプロトスペーサー核酸配列を含む非標的核酸鎖を含み、
前記Casタンパク質が、配列番号1のアミノ酸配列を有し、
前記少なくとも1つのターゲッティングRNA分子が、前記標的
核酸配列を認識し、
前記非標的核酸鎖が、前記プロトスペーサー核酸配列の3’末端に直接隣接するプロトスペーサー隣接モチーフ(PAM)配列をさらに含み、前記PAM配列が、5’-NNNNCSAA-3’(配列番号49)を含み、前記使用が、ヒト細胞におけるものあり
、前記ヒト細胞が胚性幹細胞ではない、使用。
【請求項13】
二本鎖標的ポリヌクレオチドに結合する、切断する、標識するまたは改変するための前記方法または前記使用が、55℃と65℃との間の温度で行われる、請求項11に記載の方法または請求項12に記載の使用。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、遺伝子工学の分野に関し、さらに詳細には核酸編集およびゲノム改変に関する。本発明は、遺伝物質の配列依存部位特異的結合、ニッキング、切断および改変のために構成することができるヌクレアーゼ;その上、遺伝物質の配列特異的部位に活性、特にヌクレアーゼ活性を働かせるリボ核タンパク質、ならびにマーカーとして使用するための修飾ヌクレアーゼおよびリボ核タンパク質の形態での遺伝子工学ツールに関する。したがって、本発明は、細胞内でのヌクレアーゼおよびガイドRNAの送達および発現のための関連発現構築物にも関する。さらに、本発明は、in vitroまたはin vivoでの核酸の配列特異的編集およびそれを達成するのに使用される方法に関する。
【背景技術】
【0002】
CRISPR-Casが多くの細菌および大半の古細菌での適応免疫系であることは2007年に初めて実証された(Barrangou et al., 2007, Science 315: 1709-1712)、Brouns et al., 2008, Science 321: 960-964)。機能的および構造的判断基準に基づいて、3つのタイプをそれぞれ含む2種類のCRISPR-Cas系がこれまで特徴付けられており、その大半が相補的であるDNA配列を標的にするためのガイドとして小型RNA分子を使用している(Makarova et al., 2015, Nat Rev Microbiol 13: 722-736;Mahanraju et al., 2016, Science 353: aad5147)。
【0003】
Doudna/Charpentier研究室による最近の研究では、クラス2/II型CRISPR-Cas系(Cas9)のエフェクター酵素の徹底的な特徴付けが実施され、設計されたCRISPR RNAガイド(特異的スペーサー配列を有する)の導入によりプラスミド上の相補的配列(プロトスペーサー)が標的にされ、このプラスミドの二本鎖切断が引き起こされることが実証された(Jinek et al., 2012, Science 337: 816-821)。Jinek et al., 2012に続いて、Cas9はゲノム編集のためのツールとして使用される。
【0004】
Cas9は様々な真核細胞(例えば、魚、植物、ヒト)のゲノムを操作するのに使用されてきた(Charpentier and Doudna, 2013, Nature 495: 50-51)。
【0005】
さらに、Cas9は、特定の組換え事象を選び出すことにより細菌での相同組換えの収率を改善するのに使用されてきた(Jiang et al., 2013, Nature Biotechnol 31: 233-239)。これを達成するためには、毒性断片(ターゲティング構築物)に所望の変化をもつレスキュー断片(編集構築物、点突然変異または欠失を有する)を共トランスフェクトする。ターゲティング構築物は、デザインCRISPRと組み合わせたCas9および宿主染色体上で所望の組換え部位を規定する抗生物質耐性マーカーからなり、対応する抗生物質の存在下では宿主染色体でのターゲティング構築物の組込みが選択される。CRISPR標的部位を有する編集構築物の追加の組換えが宿主染色体で起こる場合のみ、宿主は自己免疫問題から逃れることが可能である。したがって、抗生物質の存在下では、所望の(マーカーなし)突然変異体のみが生き延びて成長することができる。染色体から組み込まれたターゲティング構築物のその後の除去を選ぶ関連戦略も提起されており、本物のマーカーなし突然変異体を生み出している。
【0006】
CRISPR-Cas媒介ゲノム編集は遺伝子工学のための有用なツールを成すことが近年確立された。原核生物CRISPR系が適応免疫系としてその宿主に役立ち(Jinek et al., 2012, Science 337: 816-821)、迅速で効果的な遺伝子工学のために使用することが可能であり(例えば、Mali et al., 2013, Nat Methods 10:957-963)、目的の配列を標的にするためにはガイド配列の改変のみが必要であることが確立されている。
【0007】
しかし、遺伝子研究およびゲノム編集の分野での応用のために種々の実験条件下で改良された配列特異的核酸検出、切断および操作ができる作用因子の開発の必要性が続けて存在している。特に、Cas9を含む現在利用可能な配列特異的ゲノム編集ツールは、あらゆる条件または生物での使用に適用可能なわけではなく、例えば、配列特異的ヌクレアーゼは相対的に熱感受性であり、したがって、厳密に好熱性の微生物(41℃と122℃の間で成長することができ、最適には45℃超から80℃の温度範囲で成長し、超好熱菌は80℃より上で最適成長できる)、例えば、工業用発酵においてまたは高温で行われるin vitro実験工程のために使用される微生物での使用には適用可能ではない。
【0008】
好熱菌において活性Cas9タンパク質についての実験的証拠は現在まで存在しない。細菌におけるCas9の存在下でのChylinski et al. (2014; Nucleic Acids Research 42: 6091-6105)による比較ゲノムスクリーニングに基づいて、II-C型CRISPR-Cas系はすべての細菌ゲノムのおおよそ3.3%に存在するだけであることが見いだされた。好熱性細菌のなかで、II型系は統計分析(P=0.0019)に基づいて過小に見積もられている。さらに、古細菌ではII型系は見いだされていないが、これはおそらく古細菌にはリボヌクレアーゼIIIタンパク質(II型系に関与する)が存在しないせいであろう。Chylinski, et al., (2014; Nucleic Acids Research 42: 6091-6105)は、II型CRISPR-Cas系の分類および進化を過去に報告しており、特に、これらの系を示す2つの種が同定されているが、これらの種は最大55℃で成長し、最適成長温度が60~80℃であり、超好熱菌では80℃より上で最適に成長できる厳密に好熱性の成長を示してはいない。
【0009】
細菌ゲノムにおけるCRISPR-Cas系の希少性、特に、Cas9が最適成長温度が45℃よりも低い細菌(古細菌ではない)でしか見つかっていないという事実にもかかわらず、本発明者らは、驚くべきことに、ゲノム編集を高温で実行するのを可能にするいくつかの熱安定性Cas9変異体を発見した。発明者はまた、高温を含めた、幅広い範囲の温度にわたるゲノム編集の実施を可能にする、熱安定性Cas9変異体と共に働く、最適化プロトスペーサー隣接モチーフ(PAM)配列を発見した。関連PAM配列の認識により設計された、これらのCas9ヌクレアーゼおよびRNA分子は、高温での遺伝子工学のための新規のツールとなり、好熱性生物、特に微生物の遺伝子操作に特に価値がある。
【0010】
好熱性ゲオバチルス(Geobacillus)属の系統発生学的再評価が、最近行われ、これにより、新しい属、すなわちパラゲオバチルス(Parageobacillus)の創生をもたらした。これにより、ゲオバチルス(Geobacillus)の以前の一部の属種は、パラゲオバチルス(Parageobacillus)に系統的に、再度、帰属され、したがって、再命名された(Aliyu et al.,(2016) Systematic and Applied Microbiology 39:527-533)。
【0011】
クラスター化し規則的に間隔を置いた短い回文配列の繰り返し(CRISPR)およびCRISPR関連(Cas)タンパク質は、侵入遺伝的エレメントに対して、原核生物における、適応免疫および遺伝免疫をもたらす(Brouns et al. Science 321,(2008);Barrangou et al. CRISPR provides acquired resistance against viruses in prokaryotes. Science 315,(2007);Wright et al. Cell 164, 29-44(2016);Mohanraju et al. Science 353, aad5147(2016))。CRISPR-Cas系は、その複雑さおよびシグネチャタンパク質に応じて、2つのクラス(1および2)および6つのタイプ(I~VI)に分類される(Makarova et al. Nat. Rev. Microbiol. 13, 722-736(2015))。II型CRISPR-Cas9およびV型CRISPR-Cas12a(以前には、CRISPR-Cpf1と呼ばれていた)を含むクラス2系が、最近、真核生物(Komor et al. Cell 168, 20-36(2017);Puchta, Curr. Opin. Plant Biol. 36, 1-8(2017);Xu et al. J. Genet. Genomics 42, 141-149(2015);Tang et al. Nat. Plants 3, 17018(2017);Zetsche et al. Nat. Biotechnol. 35, 31-34(2016))と原核生物(Mougiakos, et al. Trends Biotechnol. 34,、575-587(2016))の両方に対するゲノム工学ツールとして活用された。これらの系は、単一CasエンドヌクレアーゼおよびRNAガイドRNAにより形成されるリボ核タンパク質(RNP)複合体に基づいた、標的二本鎖DNA切断(DSB)を導入するので、それらの系は、最も簡単なCRISPR-Cas系のなかで知られているものである。
【0012】
現在まで、化膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)は、最もよく特徴付けられており、ゲノム工学のための最も広範に使用されているCas9である。数種の他のII型系が特徴付けられているが、それらのどれも、好熱性生物から誘導されたものではない(Nakade, et al. Bioengineered 1-9(2017). doi:10.1080/21655979.2017.1282018)。このようなCRISPR-Cas系の特徴付けは、基礎的な考察、および新規な用途にとって興味深いものとなろう。
【0013】
いくつかの好熱菌の場合、基礎的な遺伝的ツールが利用可能であるが(Taylor et al. Microb. Biotechnol. 4, 438-448(2011);Olson, et al. Curr. Opin. Biotechnol. 33, 130-141(2015);Zeldes, et al. Front. Microbiol. 6, 1209(2015))、これらのツールの効率は、依然として低すぎるため、この興味深い生物群の完全な探索および実施は可能ではない。SpCas9は、in vivoでは、≧42℃で活性ではないという本発明者らの知見に基づくと、本発明者らは、高温での相同組換えと中温でのSpCas9に基づく対向選択とを組み合わせた、条件的好熱菌に対するSpCas9に基づく工学ツールを以前に開発した(Mougiakos et al. ACS Synth. Biol. 6, 849-861(2017))。しかし、SpCas9は、42℃以上では活性ではないので、偏性好熱菌に対するCas9に基づく編集およびサイレンシングツールは、依然として利用可能ではなく(Mougiakos et al. ACS Synth. Biol. 6, 849-861(2017))、これまで、好熱性Cas9は特徴付けられていない。
【発明の概要】
【0014】
発明者らは、ThermoCas9:好熱性細菌であるゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)T12のCRISPR-Cas IIC型系からRNA-ガイドDNA-エンドヌクレアーゼを発見して、特徴付けた。発明者らは、驚くべきことに、幅広い温度範囲にわたる、そのin vitroで活性を示し、熱安定性に対するsgRNA-構造の重要性を実証し、幅広い温度範囲にわたる、in vivoでのゲノム編集に、ThermoCas9を適用した。
本開示は、以下の[1]から[100]を含む。
[1]標的核酸配列を含む二本鎖標的ポリヌクレオチドに結合する、切断する、標識するまたは改変するための、少なくとも1つのターゲッティングRNA分子およびCasタンパク質の使用であって、
上記二本鎖標的ポリヌクレオチドが、上記標的核酸配列を含む標的核酸鎖、および上記標的核酸配列に相補的であるプロトスペーサー核酸配列を含む非標的核酸鎖を含み、
上記Casタンパク質が、配列番号1のアミノ酸配列、またはそれと少なくとも77%の同一性の配列を有し、
上記少なくとも1つのターゲッティングRNA分子が、上記標的配列を認識し、
上記非標的核酸鎖が、上記プロトスペーサー核酸配列の3’末端に直接隣接するプロトスペーサー隣接モチーフ(PAM)配列をさらに含み、上記PAM配列が、5’-NNNNCNN-3’を含み、上記使用が、ヒト細胞におけるものあり、任意選択で上記ヒト細胞が胚性幹細胞ではない、使用。
[2]上記結合、切断、標識または改変が、20℃と100℃の間の温度で、30℃と80℃の間の温度で、37℃と78℃の間の温度で、好ましくは55℃超の温度で、より好ましくは55℃と80℃の間の温度で、さらにより好ましくは、55℃と65℃の間または60℃と65℃の間の温度で起こる、上記[1]に記載の使用。
[3]上記標的核酸配列を含む上記ポリヌクレオチドが上記Casタンパク質により切断され、好ましくは、上記切断がDNA切断である、上記[1]または上記[2]に記載の使用。
[4]上記標的配列を含む上記標的核酸鎖が二本鎖DNAであり、上記使用が、上記標的核酸配列を含む上記ポリヌクレオチド中の二本鎖切断をもたらす、上記[1]から[3]のいずれかに記載の使用。
[5]上記標的核酸配列を含む上記ポリヌクレオチドが二本鎖DNAであり、上記Casタンパク質が上記二本鎖DNAを切断する能力を欠き、上記使用が上記ポリヌクレオチドの遺伝子サイレンシングをもたらす、上記[1]または上記[2]に記載の使用。
[6]上記Casタンパク質を含む上記ポリヌクレオチドが、変異D8AおよびH582Aを含む、上記[5]に記載の使用。
[7]上記PAM配列が、5’-NNNNCNNA-3’[配列番号47]を含む、上記[1]から[6]のいずれかに記載の使用。
[8]上記PAM配列が、5’-NNNNCSAA-3’[配列番号48]を含む、上記[1]から[7]のいずれかに記載の使用。
[9]上記PAM配列が、5’-NNNNCCAA-3’[配列番号50]を含む、上記[8]に記載の使用。
[10]上記結合、切断、標識または改変が、20℃と70℃の間の温度で起こる、上記[8]または上記[9]に記載の使用。
[11]結合、切断、標識または改変が、25℃と65℃の間の温度で起こる、上記[7]から[10]のいずれかに記載の使用。
[12]上記Casタンパク質が、細菌、古細菌またはウイルスから、好ましくは好熱性細菌から得られる、上記[1]から[11]のいずれかに記載の使用。
[13]上記Casタンパク質が、ゲオバチルス(Geobacillus)属種、好ましくはゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)から得ることができる、上記[1]から[12]のいずれかに記載の使用。
[14]上記ターゲティングRNA分子が、crRNAおよびtracrRNAを含む、上記[1]から[13]のいずれかに記載の使用。
[15]上記少なくとも1つのターゲティングRNA分子の長さが、35~200ヌクレオチド残基の範囲である、上記[1]から[14]のいずれかに記載の使用。
[16]上記標的核酸配列が、15~32ヌクレオチド残基長である、上記[1]から[15]のいずれかに記載の使用。
[17]上記Casタンパク質が、少なくとも1つの機能的部分をさらに含む、上記[1]から[16]のいずれかに記載の使用。
[18]上記Casタンパク質が、少なくとも1つのさらなる機能的または非機能的タンパク質を含むタンパク質複合体の一部として提供され、任意選択で、上記少なくとも1つのさらなるタンパク質が、少なくとも1つの機能的部分をさらに含む、上記[1]から[17]のいずれかに記載の使用。
[19]上記Casタンパク質またはさらなるタンパク質が、上記Casタンパク質またはタンパク質複合体のN終端および/もしくはC終端、好ましくはC終端に融合または連結している、少なくとも1つの機能的部分を含む、上記[17]または上記[18]に記載の使用。
[20]上記少なくとも1つの機能的部分がタンパク質であり、任意選択で、ヘリカーゼ、ヌクレアーゼ、ヘリカーゼ-ヌクレアーゼ、DNAメチラーゼ、ヒストンメチラーゼ、アセチラーゼ、ホスファターゼ、キナーゼ、転写(共)活性化因子、転写リプレッサー、DNA結合タンパク質、DNA構築タンパク質、マーカータンパク質、レポータータンパク質、蛍光タンパク質、リガンド結合タンパク質、シグナルペプチド、細胞内局在配列、抗体エピトープまたは親和性精製タグ、例えば緑色蛍光タンパク質(GFP)から選択される、上記[17]から[19]のいずれかに記載の使用。
[21]上記Cas9ヌクレアーゼの天然の活性が不活化されており、上記Casタンパク質が少なくとも1つの機能的部分に連結している、上記[20]に記載の使用。
[22]上記少なくとも1つの機能的部分がヌクレアーゼドメイン、好ましくはFokIヌクレアーゼドメインである、上記[20]または上記[21]に記載の使用。
[23]上記少なくとも1つの機能的部分がマーカータンパク質である、上記[20]から[22]のいずれかに記載の使用。
[24]ヒト細胞中における二本鎖標的ポリヌクレオチドに結合する、これを切断する、標識するまたは改変する方法であって、上記二本鎖標的ポリヌクレオチドが、標的核酸配列を含む標的核酸鎖、および上記標的核酸配列に相補的であるプロトスペーサー核酸配列を含む非標的核酸を含み、上記方法が、
a.少なくとも1つのターゲティングRNA分子を設計するステップであって、上記ターゲティングRNA分子が、上記標的鎖の上記標的配列を認識し、上記非標的鎖が、上記プロトスペーサー配列の3’末端に直接隣接するプロトスペーサー隣接モチーフ(PAM)配列をさらに含み、上記PAM配列が、5’-NNNNCNN-3’を含む、ステップ、b.上記ターゲティングRNA分子およびCasタンパク質を含むリボ核タンパク質複合体を形成するステップであって、上記単離Casタンパク質が、配列番号1のアミノ酸配列、またはそれと少なくとも77%の同一性の配列を有する、ステップ、および
c.上記標的ポリヌクレオチドに結合する、これを切断する、標識するまたは改変する上記リボ核タンパク質複合体であって、任意選択で上記ヒト細胞が胚性幹細胞ではなく、任意選択で上記方法が上記ヒトの生殖細胞系遺伝的同一性を改変しない、リボ核タンパク質複合体
を含む、方法。
[25]上記結合、切断、標識または改変が、20℃と100℃の間の温度で、30℃と80℃の間の温度で、37℃と78℃の間の温度で、好ましくは55℃超の温度で、より好ましくは55℃と80℃の間の温度で、さらにより好ましくは、55℃と65℃の間または60℃と65℃の間の温度で起こる、上記[24]に記載の方法。
[26]上記標的核酸配列を含む上記二本鎖標的ポリヌクレオチドが上記Casタンパク質により切断され、好ましくは上記切断がDNA切断である、上記[24]または上記[25]に記載の方法。
[27]上記標的ポリヌクレオチドが二本鎖DNAであり、上記使用が、上記ポリヌクレオチド中の二本鎖切断をもたらす、上記[24]から[26]のいずれかに記載の方法。
[28]上記標的核酸配列を含む上記標的ポリヌクレオチドが二本鎖DNAであり、上記Casタンパク質が、上記二本鎖DNAを切断する能力を欠き、上記方法が、上記標的ポリヌクレオチドの遺伝子サイレンシングをもたらす、上記[24]または上記[25]に記載の方法。
[29]上記PAM配列が、5’-NNNNCNNA-3’[配列番号47]を含む、上記[24]から[28]のいずれかに記載の方法。
[30]上記PAM配列が、5’-NNNNCSAA-3’[配列番号48]を含む、上記[29]に記載の方法。
[31]上記PAM配列が、5’-NNNNCCAA-3’[配列番号50]を含む、上記[30]に記載の方法。
[32]上記結合、切断、標識または改変が、20℃と70℃の間の温度で起こる、上記[30]または上記[31]に記載の方法。
[33]結合、切断、標識または改変が、25℃と65℃の間の温度で起こる、上記[29]から上記[32]のいずれかに記載の方法。
[34]上記Casタンパク質が、細菌、古細菌またはウイルスから、好ましくは好熱性細菌から得られる、上記[24]から[33]のいずれかに記載の使用。
[35]上記Casタンパク質が、ゲオバチルス(Geobacillus)属種、好ましくはゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)から得ることができる、上記[24]から[34]のいずれかに記載の方法。
[36]上記ターゲティングRNA分子が、crRNAおよびtracrRNAを含む、上記[24]から[35]のいずれかに記載の方法。
[37]上記少なくとも1つのターゲティングRNA分子の長さが、35~200ヌクレオチド残基の範囲である、上記[24]から[36]のいずれかに記載の方法。
[38]上記標的核酸配列が、15~32ヌクレオチド残基長である、上記[24]から[37]のいずれかに記載の方法。
[39]上記Casタンパク質が、少なくとも1つの機能的部分をさらに含む、上記[24]から[39]のいずれかに記載の方法。
[40]上記Casタンパク質が、少なくとも1つのさらなる機能的または非機能的タンパク質を含むタンパク質複合体の一部として提供され、任意選択で、上記少なくとも1つのさらなるタンパク質が、少なくとも1つの機能的部分をさらに含む、上記[24]から[40]のいずれかに記載の方法。
[41]上記Casタンパク質またはさらなるタンパク質が、上記Casタンパク質またはタンパク質複合体のN終端および/もしくはC終端、好ましくはC終端に融合または連結している、少なくとも1つの機能的部分を含む、上記[39]または上記[40]に記載の方法。
[42]上記少なくとも1つの機能的部分がタンパク質であり、任意選択で、ヘリカーゼ、ヌクレアーゼ、ヘリカーゼ-ヌクレアーゼ、DNAメチラーゼ、ヒストンメチラーゼ、アセチラーゼ、ホスファターゼ、キナーゼ、転写(共)活性化因子、転写リプレッサー、DNA結合タンパク質、DNA構築タンパク質、マーカータンパク質、レポータータンパク質、蛍光タンパク質、リガンド結合タンパク質、シグナルペプチド、細胞内局在配列、抗体エピトープまたは親和性精製タグ、例えば緑色蛍光タンパク質(GFP)から選択される、上記[39]から[41]のいずれかに記載の方法。
[43]上記Cas9ヌクレアーゼの天然の活性が不活化されており、上記Casタンパク質が少なくとも1つの機能的部分に連結している、上記[42]に記載の方法。
[44]上記少なくとも1つの機能的部分がヌクレアーゼドメイン、好ましくはFokIヌクレアーゼドメインである、上記[42]または上記[43]に記載の方法。
[45]上記少なくとも1つの機能的部分がマーカータンパク質である、上記[42]から[44]のいずれかに記載の方法。
[46]上記二本鎖標的ポリヌクレオチドがdsDNAであり、上記少なくとも1つの機能的部分がヌクレアーゼまたはヘリカーゼ-ヌクレアーゼであり、上記改変が、所望の遺伝子座における一本鎖または二本鎖切断である、上記[20]に記載の使用または上記[42]に記載の方法。
[47]上記二本鎖標的ポリヌクレオチドがdsDNAであり、上記機能的部分が、DNA改変酵素(例えば、メチラーゼまたはアセチラーゼ)、転写活性因子または転写リプレッサーから選択され、上記結合、切断、標識または改変が、遺伝子発現の改変をもたらす、上記[20]に記載の使用、または上記[42]に記載の方法。
[48]上記結合、切断、標識または改変が、in vivoで行われる、上記[20]に記載の使用、または上記[42]に記載の方法。
[49]上記結合、切断、標識または改変が、所望の位置に、所望のヌクレオチド配列を改変または欠失および/もしくは挿入をもたらし、かつ/または上記結合、切断、標識または改変が、所望の遺伝子座にサイレンシング遺伝子発現をもたらす、上記[1]から[4]、[7]から[23]、もしくは[46]のいずれかに記載の使用、または上記[24]から[27]、[29]から[46]のいずれかに記載の方法。
[50]標的核酸配列を含む二本鎖標的ポリヌクレオチドを有する形質転換ヒト細胞であって、上記二本鎖標的ポリヌクレオチドが、上記標的核酸配列を含む標的核酸鎖、および上記標的核酸配列に相補的であるプロトスペーサー核酸配列を含む非標的核酸鎖を含み、上記細胞が、
配列番号1のアミノ酸配列、またはそれと少なくとも77%の同一性の配列を有する、Cas(CRISPR(clustered regularly interspaced short palindromic repeat:クラスター化し規則的に間隔を置いた短い回文配列の繰り返し)associated:CRISPR関連)タンパク質、
上記標的核酸鎖中の上記標的核酸配列を認識する少なくとも1つのターゲティングRNA分子であって、上記非標的鎖が、上記プロトスペーサー配列の3’末端に直接隣接するプロトスペーサー隣接モチーフ(PAM)配列をさらに含み、上記PAM配列が5’-NNNNCNN-3’を含む、少なくとも1つのターゲティングRNA分子、および
少なくとも1つの上記Casタンパク質および上記ターゲティングRNA分子をコードする核酸を含む発現ベクター
を含み、任意選択で、上記ヒト細胞が胚性幹細胞ではない、形質転換ヒト細胞。
[51]上記Casタンパク質および上記ターゲティングRNA分子により、上記細胞中の上記標的ポリヌクレオチドの結合、切断、標識または改変が可能になり、上記結合、切断、標識または改変が、20℃と100℃の間の温度で、30℃と80℃の間の温度で、37℃と78℃の間の温度で、好ましくは55℃超の温度で、より好ましくは55℃と80℃の間の温度で、さらにより好ましくは、55℃と65℃の間または60℃と65℃の間の温度で起こる、上記[50]に記載の形質転換細胞。
[52]上記標的核酸配列を含む上記標的核酸鎖がCasタンパク質により切断され、好ましくは上記切断がDNA切断である、上記[50]または上記[51]に記載の形質転換細胞。
[53]上記標的配列を含む上記標的ポリヌクレオチドが二本鎖DNAであり、上記結合、切断、標識または改変が、上記標的ポリヌクレオチド中の二本鎖切断をもたらす、上記[50]から[52]のいずれかに記載の形質転換細胞。
[54]上記標的核酸配列を含む上記標的ポリヌクレオチドが二本鎖DNAであり、上記Casタンパク質が、上記二本鎖DNAを切断する能力を欠き、上記結合、切断、標識または改変が、上記標的ポリヌクレオチドの遺伝子サイレンシングをもたらす、上記[50または上記[51]に記載の形質転換細胞。
[55]上記PAM配列が、5’-NNNNCNNA-3’[配列番号47]を含む、上記[50]から[54]のいずれかに記載の形質転換細胞。
[56]上記PAM配列が、5’-NNNNCSAA-3’[配列番号48]を含む、上記[55]に記載の形質転換細胞。
[57]上記PAM配列が、5’-NNNNCCAA-3’[配列番号50]を含む、上記[56]に記載の形質転換細胞。
[58]上記結合、切断、標識または改変が、20℃と70℃の間の温度で起こる、上記[56]または上記[57]に記載の形質転換細胞。
[59]結合、切断、標識または改変が、25℃と65℃の間の温度で起こる、上記[55]から上記[58]のいずれかに記載の形質転換細胞。
[60]上記Casタンパク質が、細菌、古細菌またはウイルスから、好ましくは好熱性細菌から得られる、上記[50]から[59]のいずれかに記載の形質転換細胞。
[61]上記Casタンパク質が、ゲオバチルス(Geobacillus)属種、好ましくはゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)から得ることができる、上記[50]から[60]のいずれかに記載の形質転換細胞。
[62]上記ターゲティングRNA分子が、crRNAおよびtracrRNAを含む、上記[50]から[61]のいずれかに記載の形質転換細胞。
[63]上記少なくとも1つのターゲティングRNA分子の長さが、35~200ヌクレオチド残基の範囲である、上記[50]から[62]のいずれかに記載の形質転換細胞。
[64]上記標的核酸配列が、15~32ヌクレオチド残基長である、上記[50]から[63]のいずれかに記載の形質転換細胞。
[65]上記Casタンパク質が、少なくとも1つの機能的部分をさらに含む、上記[50]から[64]のいずれかに記載の形質転換細胞。
[66]上記Casタンパク質が、少なくとも1つのさらなる機能的または非機能的タンパク質を含むタンパク質複合体の一部として提供され、任意選択で、上記少なくとも1つのさらなるタンパク質が、少なくとも1つの機能的部分をさらに含む、上記[50]から[65]のいずれかに記載の形質転換細胞。
[67]上記Casタンパク質またはさらなるタンパク質が、上記Casタンパク質またはタンパク質複合体のN終端および/またはC終端に、好ましくはN終端に融合または連結している、少なくとも1つの機能的部分を含む、上記[65]または上記[66]に記載の形質転換細胞。
[68]上記少なくとも1つの機能的部分がタンパク質であり、任意選択で、ヘリカーゼ、ヌクレアーゼ、ヘリカーゼ-ヌクレアーゼ、DNAメチラーゼ、ヒストンメチラーゼ、アセチラーゼ、ホスファターゼ、キナーゼ、転写(共)活性化因子、転写リプレッサー、DNA結合タンパク質、DNA構築タンパク質、マーカータンパク質、レポータータンパク質、蛍光タンパク質、リガンド結合タンパク質、シグナルペプチド、細胞内局在配列、抗体エピトープまたは親和性精製タグ、例えば緑色蛍光タンパク質(GFP)から選択される、上記[65]から[67]のいずれかに記載の形質転換細胞。
[69]上記Cas9ヌクレアーゼの天然の活性が不活化されており、上記Casタンパク質が少なくとも1つの機能的部分に連結している、上記[68]に記載の形質転換細胞。
[70]上記少なくとも1つの機能的部分がヌクレアーゼドメイン、好ましくはFokIヌクレアーゼドメインである、上記[65]から[69]のいずれかに記載の形質転換細胞。
[71]上記少なくとも1つの機能的部分がマーカータンパク質である、上記[65]から[69]のいずれかに記載の形質転換細胞。
[72]上記二本鎖標的ポリヌクレオチドがdsDNAであり、上記少なくとも1つの機能的部分がヌクレアーゼまたはヘリカーゼ-ヌクレアーゼであり、上記改変が、所望の遺伝子座における一本鎖または二本鎖切断である、上記[65]から[70]のいずれかに記載の形質転換細胞。
[73]上記二本鎖標的ポリヌクレオチドがdsDNAであり、上記機能的部分が、DNA改変酵素(例えば、メチラーゼまたはアセチラーゼ)、転写活性因子または転写リプレッサーから選択され、上記結合、切断、標識または改変が、遺伝子発現の改変をもたらす、上記[65]から[69]のいずれかに記載の形質転換細胞、または上記[42]に記載の方法。
[74]上記Casタンパク質が、発現ベクターから発現される、上記[65]から[70]のいずれかに記載の形質転換細胞。
[75]上記結合、切断、標識または改変が、所望の位置に、所望のヌクレオチド配列を改変または欠失および/もしくは挿入をもたらし、かつ/または上記結合、切断、標識または改変が、所望の遺伝子座にサイレンシング遺伝子発現をもたらす、上記[50]から[74]のいずれかに記載の形質転換細胞。
[76]Casタンパク質、二本鎖標的ポリヌクレオチドにおいて標的核酸配列を認識する少なくとも1つのターゲッティングRNA分子、および上記標的ポリヌクレオチドを含む、核タンパク質複合体であって、
上記Casタンパク質が、配列番号1のアミノ酸配列、またはそれと少なくとも77%の同一性の配列を有し、
上記二本鎖標的ポリヌクレオチドが、上記標的核酸配列を含む標的核酸鎖、ならびに上記標的核酸配列に相補的であるプロトスペーサー核酸配列および上記プロトスペーサー配列の3‘末端に直接隣接したプロトスペーサー隣接モチーフ(PAM)配列を含む非標的核酸鎖を含み、上記PAM配列が、5‘-NNNNCNN-3’を含み、上記核タンパク質複合体がヒト細胞におけるものではなく、任意選択で、上記細胞が胚性幹細胞ではない、核タンパク質複合体。
[77]20℃と100℃の間の温度で、30℃と80℃の間の温度で、37℃と78℃の間の温度で、好ましくは55℃超の温度で、より好ましくは55℃と80℃の間の温度で、さらにより好ましくは、55℃と65℃の間または60℃と65℃の間の温度で発生する、上記[76]に記載の核タンパク質複合体。
[78]上記標的核酸配列を含む上記二本鎖標的ポリヌクレオチドが上記Casタンパク質により切断され、好ましくは上記切断がDNA切断である、上記[76]または上記[77]に記載の核タンパク質複合体。
[79]上記標的配列を含む上記標的ポリヌクレオチドが二本鎖DNAであり、上記結合、切断、標識または改変が、上記標的ポリヌクレオチド中の二本鎖切断をもたらす、上記[76]から[78]のいずれかに記載の核タンパク質複合体。
[80]上記標的核酸配列を含む上記標的ポリヌクレオチドが二本鎖DNAであり、上記Casタンパク質が、上記二本鎖DNAを切断する能力を欠き、上記核タンパク質複合体が存在することにより、上記標的ポリヌクレオチドの遺伝子サイレンシングがもたらされる、上記[76]または上記[77]に記載の核タンパク質複合体。
[81]上記PAM配列が、5’-NNNNCNNA-3’[配列番号47]を含む、上記[76]から[80]のいずれかに記載の核タンパク質複合体。
[82]上記PAM配列が、5’-NNNNCSAA-3’[配列番号48]を含む、上記[81]に記載の核タンパク質複合体。
[83]上記PAM配列が、5’-NNNNCCAA-3’[配列番号50]を含む、上記[82]に記載の核タンパク質複合体。
[84]上記結合、切断、標識または改変が、20℃と70℃の間の温度で起こる、上記[82]または上記[83]に記載の核タンパク質複合体。
[85]結合、切断、標識または改変が、25℃と65℃の間の温度で起こる、上記[81]から上記[84]のいずれかに記載の核タンパク質複合体。
[86]上記Casタンパク質が、細菌、古細菌またはウイルスから、好ましくは好熱性細菌から得られる、上記[76]から[85]のいずれかに記載の核タンパク質複合体。
[87]上記Casタンパク質が、ゲオバチルス(Geobacillus)属種、好ましくはゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)から得ることができる、上記[76]から[86]のいずれかに記載の核タンパク質複合体。
[88]上記ターゲティングRNA分子が、crRNAおよびtracrRNAを含む、上記[76]から[87]のいずれかに記載の核タンパク質複合体。
[89]上記少なくとも1つのターゲティングRNA分子の長さが、35~200ヌクレオチド残基の範囲である、上記[76]から[88]のいずれかに記載の核タンパク質複合体。
[90]上記標的核酸配列が、15~32ヌクレオチド残基長である、上記[76]から[89]のいずれかに記載の核タンパク質複合体。
[91]上記Casタンパク質が、少なくとも1つの機能的部分をさらに含む、上記[76]から[90]のいずれかに記載の核タンパク質複合体。
[92]上記Casタンパク質が、少なくとも1つのさらなる機能的または非機能的タンパク質を含むタンパク質複合体の一部として提供され、任意選択で、上記少なくとも1つのさらなるタンパク質が、少なくとも1つの機能的部分をさらに含む、上記[76]から[91]のいずれかに記載の核タンパク質複合体。
[93]上記Casタンパク質またはさらなるタンパク質が、上記Casタンパク質またはタンパク質複合体のN終端および/もしくはC終端、好ましくはC終端に融合または連結している、少なくとも1つの機能的部分を含む、上記[91]または上記[92]に記載の核タンパク質複合体。
[94]上記少なくとも1つの機能的部分がタンパク質であり、任意選択で、ヘリカーゼ、ヌクレアーゼ、ヘリカーゼ-ヌクレアーゼ、DNAメチラーゼ、ヒストンメチラーゼ、アセチラーゼ、ホスファターゼ、キナーゼ、転写(共)活性化因子、転写リプレッサー、DNA結合タンパク質、DNA構築タンパク質、マーカータンパク質、レポータータンパク質、蛍光タンパク質、リガンド結合タンパク質、シグナルペプチド、細胞内局在配列、抗体エピトープまたは親和性精製タグ、例えば緑色蛍光タンパク質(GFP)から選択される、上記[91]から[93]のいずれかに記載の核タンパク質複合体。
[95]上記Cas9ヌクレアーゼの天然の活性が不活化されており、上記Casタンパク質が少なくとも1つの機能的部分に連結している、上記[94]に記載の核タンパク質複合体。
[96]上記少なくとも1つの機能的部分がヌクレアーゼドメイン、好ましくはFokIヌクレアーゼドメインである、上記[91]から[95]のいずれかに記載の核タンパク質複合体。
[97]上記少なくとも1つの機能的部分がマーカータンパク質である、上記[91]から[95]のいずれかに記載の核タンパク質複合体。
[98]上記核酸がdsDNAであり、上記少なくとも1つの機能的部分がヌクレアーゼまたはヘリカーゼ-ヌクレアーゼであり、上記標的ポリヌクレオチドが、所望の遺伝子座における一本鎖または二本鎖切断を有する、上記[91]から[96]のいずれかに記載の核タンパク質複合体。
[99]上記核酸がdsDNAであり、上記機能的部分が、DNA改変酵素(例えば、メチラーゼまたはアセチラーゼ)、転写活性因子または転写リプレッサーから選択され、上記核タンパク質複合体形成により、遺伝子発現の改変がもたらされる、上記[91]から[95]のいずれかに記載の核タンパク質複合体。
[100]上記核タンパク質形成により、所望の位置に、所望のヌクレオチド配列を改変または欠失および/もしくは挿入がもたらされ、かつ/または上記核タンパク質複合体形成により、所望の遺伝子座にサイレンシング遺伝子発現がもたらされる、上記[76]から[99]のいずれかに記載の核タンパク質複合体。
【0015】
したがって、本発明は、
a.アミノ酸モチーフEKDGKYYC[配列番号2];および/または
b.アミノ酸モチーフX1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);および/または
c.アミノ酸モチーフX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);および/または
d.アミノ酸モチーフX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである);および/または
e.アミノ酸モチーフX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)
を含む、単離されたCas(CRISPR(clustered regularly interspaced short palindromic repeat:クラスター化し規則的に間隔を置いた短い回文配列の繰り返し)associated:CRISPR関連)タンパク質またはポリペプチドを提供する。
【0016】
疑義タンパク質を回避するため、本発明のCasタンパク質をコードするポリペプチドまたは核酸はまた、「GtCas9」または「ThermoCas9」と称することができる。「GtCas9」および「ThermoCas9」は、本明細書全体にわたって互換的に使用され、同じ意味を有する。
【0017】
本発明の状況でのポリペプチドは、完全長Casタンパク質の断片と見なしてもよい。そのような断片は不活性であり、遺伝物質の結合、編集および/または切断と直接関連のない方法でおよび目的のために、例えば、アッセイでの標準または抗体を産生するなどのために使用してもよい。
【0018】
しかし、好ましい実施形態では、Casタンパク質またはポリペプチドは、少なくとも1つのターゲティングRNA分子、およびターゲティングRNA分子により認識される標的核酸配列を含むポリヌクレオチドと会合すると、20℃から100℃までの範囲の温度で機能的であり、切断、結合、標識または改変することができる。好ましくは、Casタンパク質またはポリペプチドは、機能的であり、50℃から70℃までの範囲の温度、例えば55℃または60℃で、前記切断、結合、標識または改変が可能である。
【0019】
特定の実施形態では、本発明は、アミノ酸モチーフEKDGKYYC[配列番号2]を含むCasタンパク質またはポリペプチドを提供することができる。他の実施形態では、Casタンパク質またはポリペプチドはアミノ酸モチーフX1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである)をさらに含んでいてもよい。
【0020】
他の実施形態では、本明細書で定義されるCasタンパク質またはポリペプチドはアミノ酸モチーフX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される)を追加でさらに含んでいてもよい。
【0021】
他の実施形態では、本明細書で定義されるCasタンパク質またはポリペプチドはアミノ酸モチーフX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである)を追加でさらに含んでいてもよい。
【0022】
他の実施形態では、本明細書で定義されるCasタンパク質またはポリペプチドはアミノ酸モチーフX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)を追加でさらに含んでいてもよい。
【0023】
本発明に従えば、本発明のCasタンパク質またはポリペプチドは配列番号2から6のモチーフのうちのいずれでも、単独でまたは組み合わせて含むことができることが認識されうる。以下は、本発明のCasタンパク質またはポリペプチドを特徴付けることができるモチーフの組合せのそれぞれを要約している。
【0024】
EKDGKYYC[配列番号2]
【0025】
EKDGKYYC[配列番号2];およびX1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである)。
【0026】
EKDGKYYC[配列番号2];およびX1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);およびX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される)。
【0027】
EKDGKYYC[配列番号2];およびX1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);およびX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである)。
【0028】
EKDGKYYC[配列番号2];およびX1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);およびX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0029】
EKDGKYYC[配列番号2];およびX1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);およびX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0030】
EKDGKYYC[配列番号2];およびX1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0031】
EKDGKYYC[配列番号2];およびX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0032】
EKDGKYYC[配列番号2];およびX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される)。
【0033】
EKDGKYYC[配列番号2];およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである)。
【0034】
EKDGKYYC[配列番号2];およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0035】
EKDGKYYC[配列番号2];およびX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである)。
【0036】
EKDGKYYC[配列番号2];およびX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0037】
EKDGKYYC[配列番号2];およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0038】
X1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);およびX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される)。
【0039】
X1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);およびX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである)。
【0040】
X1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);およびX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0041】
X1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0042】
X1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである)。
【0043】
X1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0044】
X5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0045】
X5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである)。
【0046】
X5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0047】
X7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0048】
別の態様では、本発明は、配列番号1のアミノ酸配列、またはそれと少なくとも77%の同一性の配列を有する、単離Casタンパク質またはそのポリペプチド断片を提供し、Casタンパク質またはそのポリペプチド断片は、以下のモチーフまたはアミノ酸:
IGLDIGITSIG[配列番号23]、好ましくはIGLDIGITSIGWAVINLD[配列番号24]を含む、RuvC-Iドメイン
RSARR[配列番号25]、好ましくはPRRLARSARRRLRRRKHRLERIRRL[配列番号26]を含む架橋ドメイン;および/または
WQLR[配列番号27]を含む、α-ヘリカル/認識ローブドメイン;および/または
HLAKRRG[配列番号28]、好ましくはLARILLHLAKRRG[配列番号29]を含む、α-ヘリカル/認識ローブドメイン;および/または
IFAKQ[配列番号30]、好ましくはEIKLIFAKQ[配列番号31]を含む、α-ヘリカル/認識ローブドメイン;および/または
IWASQR[配列番号32];および/または
KVGFCTFEPKEKRAPK[配列番号33];および/または
FTVWEHINKLRL[配列番号34]を含む、α-ヘリカル/認識ローブドメイン;および/または
モチーフIANPVVMRALTQ[配列番号35]、好ましくはIANPVVMRALTQARKVVNAIIKKYG[配列番号36]を含む、RuvC-IIドメイン;および/または
モチーフELAR[配列番号37]、好ましくはIHIELARE[配列番号38]を含む、RuvC-IIドメイン;および/または
モチーフQNGKCAY[配列番号39]、好ましくはIVKFKLWSEQNGKCAY[配列番号40]を含む、HNHドメイン;および/または
モチーフVDHVIP[配列番号41]、好ましくはVDHVIPYSRSLDDSYTNKVL[配列番号42]を含む、HNHドメイン;および/または
モチーフDTRYISRFLAN[配列番号43]を含む、RuvC-IIIドメイン;および/または
モチーフVYTVNGRITAHLRSRW[配列番号44]を含む、RuvC-IIIドメイン;および/または
モチーフHHAVDA[配列番号45]、好ましくはHHAVDAAIVA[配列番号46]を含む、RuvC-IIIドメイン
のいずれかを、単独または組合せのどちらかで含む。
【0049】
好ましくは、本発明は、配列番号1のアミノ酸配列、またはそれと少なくとも77%の同一性の配列を有する、単離Casタンパク質またはそのポリペプチド断片を提供し、Casタンパク質またはそのポリペプチド断片は、アミノ酸モチーフ[配列番号23]~[配列番号46]の各々を組み合わせて含む。
【0050】
別の態様では、本発明は、配列番号1のアミノ酸配列またはそれと少なくとも77%の同一性の配列を有する単離されたCasタンパク質またはそのポリペプチド断片を提供する。好ましくは、Casタンパク質またはポリペプチドは、20℃から100℃までの範囲の温度で、結合、切断、標識または改変が可能である。好ましくは、Casタンパク質またはポリペプチドは、20℃と70℃の間の範囲、例えば25℃、55℃、60℃または65℃で、前記切断、結合、標識または改変が可能である。好ましくは、Casタンパク質またはポリペプチドは、50℃と70℃の間の範囲の温度、例えば55℃または60℃で、前記切断、結合、標識または改変が可能である。好ましくは、Casタンパク質またはポリペプチドは、30℃と80℃の間の範囲の温度で、37℃と78℃の間の温度で、好ましくは55℃超の温度で、より好ましくは55℃と80℃の間の温度で、さらにより好ましくは、55℃と65℃の間または60℃と65℃の間の温度で、前記切断、結合、標識または改変が可能である。
【0051】
本発明はまた、標的核酸配列を含む標的ポリヌクレオチドに結合する、これを切断する、標識するまたは改変するための、本明細書で提供されるターゲティングRNA分子およびCasタンパク質またはポリペプチドの使用を提供する。ターゲティングRNA分子は、ポリヌクレオチドの標的核酸鎖上の標的核酸配列を認識する。
【0052】
標的核酸配列を含む標的ポリヌクレオチドは、二本鎖であってもよく、したがって、前記標的核酸配列を含む標的核酸配列鎖、およびプロトスペーサー核酸配列を含む非標的核酸鎖を含む。プロトスペーサー核酸配列は、この標的核酸配列に実質的に相補的であり、二本鎖標的ポリヌクレオチドにおいて、それと対合する。非標的核酸鎖は、プロトスペーサー配列の3’末端に直接隣接するプロトスペーサー隣接モチーフ(PAM)配列をさらに含むことができる。このPAM配列は、長さが少なくとも6つ、7つまたは8つの核酸とすることができる。好ましくは、PAM配列は、5位にシトシンを有する。好ましくは、PAM配列は、配列5’-NNNNC-3’を含み、したがって、PAM配列は、5’末端から、5’-NNNNC-3’が始まる。さらにまたは代替的に、PAM配列は、8位にアデニンを有することができ、したがってPAM配列は、配列5’-NNNNNNNA-3’を含み、PAM配列は、5’末端から、5’-NNNNNNNA-3’が始まる。さらにまたは代替的に、PAM配列は、1位、2位、3位、4位および6位のうちの1つまたは複数にシトシンを有してもよく、こうして、PAM配列は、5’末端から、5’-CNNNN-3’、5’-NCNNN-3’、5’-NNCNN-3’、5’-NNNCN-3’および/または5’-NNNNNC-3’が始まる。任意選択で、PAM配列は、PAM配列が、5’末端から、5’-CCCCCCNA-3’[配列番号10]から始まるように含み、さらに好ましくは、PAM配列は、5’末端から、PAM配列が5’-CCCCCCAA-3’[配列番号11]で始まるように含む。他の好ましいPAM配列は、5’-ATCCCCAA-3’[配列番号21]および5’-ACGGCCAA-3’[配列番号22]を含む。
【0053】
好ましくは、Casタンパク質またはポリペプチドは、40℃から80℃までの範囲、好ましくは45℃から80℃までの範囲、さらに好ましくは50℃から80℃までの範囲の温度で、結合、切断、標識または改変することができる。例えば、結合、切断、標識または改変は、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃または80℃の温度で行われる。より好ましくは、Casタンパク質またはポリペプチドは、55から65℃までの範囲の温度で、結合、切断、標識または改変が可能である。好ましい態様では、本発明のCasタンパク質またはポリペプチド断片は、配列番号1に対して少なくとも75%の同一性;好ましくは少なくとも85%;より好ましくは少なくとも90%;さらにより好ましくは少なくとも95%の同一性のアミノ酸配列を含むことができる。
【0054】
Casタンパク質またはポリペプチドは、標的核酸鎖上の標的核酸配列を認識するターゲティングRNA分子と組み合わせて使用することができ、非標的核酸配列は、本明細書に開示される通り、非標的鎖上のプロトスペーサー配列の3’末端に直接隣接するPAM配列を有する。したがって、PAM配列は、配列5’-NNNNC-3’を含むことができ、Casタンパク質は、20℃から100℃までの範囲、好ましくは30℃から90℃までの範囲、37℃から78℃までの範囲、40℃から80℃までの範囲、50℃から70℃までの範囲、または55℃から65℃までの範囲の温度で、標的鎖に結合する、これを切断する、標識するまたは改変することができる。好ましくは、5’末端から、PAM配列は、5’-NNNNC-3’で始まり、Casタンパク質は、20℃から100℃までの範囲、好ましくは30℃から90℃までの範囲、37℃から78℃までの範囲、40℃から80℃までの範囲、50℃から70℃までの範囲、または55℃から65℃までの範囲の温度で、標的鎖に結合する、これを切断する、標識するまたは改変することができる。好ましくは、5’末端から、PAM配列は、5’-NNNNNNNA-3’で始まり、Casタンパク質は、20℃から100℃までの範囲、好ましくは30℃から90℃までの範囲、37℃から78℃までの範囲、40℃から80℃までの範囲、50℃から70℃までの範囲、または55℃から65℃までの範囲の温度で、標的鎖に結合する、これを切断する、標識するまたは改変することができる。さらに好ましくは、PAM配列の5’末端は、5’-NNNNCNNA-3’[配列番号47]で始まり、Casタンパク質は、20℃から100℃までの範囲、好ましくは30℃から90℃までの範囲、37℃から78℃までの範囲、40℃から80℃までの範囲、50℃から70℃までの範囲、または55℃から65℃までの範囲の温度で、標的鎖に結合する、これを切断する、標識するまたは改変することができる。
【0055】
さらに詳細には、本発明のCasタンパク質またはポリペプチドは、配列番号1と以下の通り:少なくとも60%、少なくとも61%、少なくとも62%、少なくとも63%、少なくとも64%、少なくとも65%、少なくとも66%、少なくとも67%、少なくとも68%、少なくとも69%、少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.5%または少なくとも99.8%のパーセント同一性を有するアミノ酸配列を含むことができる。パーセント同一性は、少なくとも89%とすることができる。パーセント同一性は、少なくとも90%とすることができる。好ましくは、パーセント同一性は、少なくとも95%、例えば98%となろう。
【0056】
配列番号1とのパーセントアミノ酸配列同一性は、2つの配列の最適整列のために導入する必要があるギャップの数およびそれぞれのギャップの長さを考慮に入れて、選択された比較窓において配列により共有されている同一の位置の数の関数として決定可能である。
【0057】
本発明のCasタンパク質またはポリペプチド断片は、基準配列の配列番号1とパーセント配列同一性により定義されるその任意の前述のパーセント変異体の両方の点から、単独でまたは本質的特徴としての前述のアミノ酸モチーフ(すなわち、配列番号2および/または3および/または4および/または5および/または6)のいずれかと組み合わせて、特徴付けることができる。
【0058】
本発明は、標的核酸配列を含む標的核酸鎖に結合する、これを切断する、標識するまたは改変するための、本明細書で提供されるターゲティングRNA分子、および本発明のCasタンパク質またはポリペプチドの使用を提供する。好ましくは、前記結合、切断、標識または改変は、本明細書に開示される温度で、例えば20と100℃の間の温度で行われる。本発明はまた、本明細書で提供されるターゲティングRNA分子の設計、ならびに本発明のターゲティングRNA分子およびCasタンパク質またはポリペプチドを含むリボ核タンパク質複合体の形成を含む標的核酸鎖中の標的核酸配列に結合する、これを切断する、標識するまたは改変する方法を提供する。好ましくは、標的核酸配列のリボ核タンパク質複合体結合、切断、標識または改変は、本明細書に開示される温度で、例えば37と100℃の間の温度で行われる。
【0059】
本発明の使用および方法を行うことができ、本発明の核タンパク質は、例えばヒト細胞において、in vivoで、形成して使用される。任意選択で、本発明の使用および方法を行うことができ、本発明の核タンパク質は、in vivoで、例えば胚性幹細胞ではないヒト細胞において形成し、使用することができる。任意選択で、本発明の使用および方法を行うことができ、本発明の核タンパク質は、in vivoで、例えばヒトの生殖細胞系遺伝的同一性を改変することを含まない方法で、ヒト細胞において形成し、使用することができる。代替として、本発明の使用および方法を行うことができ、本発明の核タンパク質は、in vitroで、形成して使用される。本発明のCasタンパク質は、例えば、in vitroで使用する場合、またはトランスフェクションにより細胞に添加する場合、単離形態で提供されてもよく、Casタンパク質は、例えば、Casタンパク質をコードする核酸によって細胞の一過性または安定的な転換後に、非相同的に発現されてもよく、ターゲティングRNA分子は、RNA分子をコードする核酸によって細胞の一過性または安定的な転換後に、発現ベクターから転写されてもよく、かつ/またはRNA分子は、例えば、in vitroで使用した場合、またはトランスフェクションにより細胞に添加する場合、単離形態で提供されてもよい。好ましい実施形態では、Casタンパク質またはポリペプチドが、宿主細胞のゲノムにおいて、Casタンパク質またはポリペプチドをコードする核酸の安定な統合後に、宿主細胞のゲノムから発現される。したがって、Casタンパク質および/またはRNA分子は、そうでなければ存在しない、細胞にタンパク質または核酸分子を加えるための人為的または意図的方法のいずれかを使用して、in vivoまたはin vitroでの環境に加えることができる。
【0060】
標的核酸配列を含むポリヌクレオチドは、Casタンパク質によって切断することができ、任意選択で、切断は、DNA切断とすることができる。標的配列を含む標的核酸鎖は、二本鎖DNAとすることができ、本方法または使用は、標的核酸配列を含むポリヌクレオチドにおける二本鎖切断をもたらすことができる。標的核酸配列を含むポリヌクレオチドは、二本鎖DNAとすることができ、Casタンパク質は、二本鎖DNAを切断する能力を欠いてもよく、その使用または方法は、ポリヌクレオチドの遺伝子サイレンシングをもたらすことができる。
【0061】
Casタンパク質またはポリペプチドを本方法、使用、および本発明の核タンパク質を、250nM以下の濃度で、例えば200nM以下、150nM以下、100nM以下、50nM以下、25nM以下、10nM以下、5nM以下、1nM以下、または0.5nM以下の濃度で提供することができる。代替的に、Casタンパク質またはポリペプチドは、少なくとも0.5nM、少なくとも1nM、少なくとも5nM、少なくとも10nM、少なくとも25nM、少なくとも50nM、少なくとも100nM、少なくとも150nM、少なくとも200nMまたは少なくとも250nMの濃度で提供することができる。本発明のPAM配列は、8位にアデニンを有することができ、したがって、PAM配列は、配列5’-NNNNNNNA-3’[配列番号47]を含み、Casタンパク質またはポリペプチドの濃度は、100nM以下、50nM以下、25nM以下、10nM以下、5nM以下、1nM以下または0.5nM以下とすることができる。PAM配列は、配列5’-NNNNCNNA-3’を含むことができ、Casタンパク質またはポリペプチドの濃度は、100nM以下、50nM以下、25nM以下、10nM以下、5nM以下、1nM以下または0.5nM以下とすることができる。PAM配列は、配列5’-CCCCCCNA-3’[配列番号10]を含むことができ、Casタンパク質またはポリペプチドの濃度は、100nM以下、50nM以下、25nM以下、10nM以下、5nM以下、1nM以下または0.5nM以下とすることができる。
【0062】
その上、本発明は本発明の前述のタンパク質またはポリペプチドのいずれかをコードする核酸を提供する。核酸は単離されていても発現構築物の形態であってもよい。
【0063】
本発明のすべての前述の態様では、アミノ酸残基は保存的にも非保存的にも置換されていてよい。保存的アミノ酸置換とは、アミノ酸残基が類似する化学的特性(例えば、電荷または疎水性)を有する他のアミノ酸残基で置換され、したがって、得られるポリペプチドの機能的特性を変化させないアミノ酸置換のことである。
【0064】
同様に、核酸配列がポリペプチドの機能に影響を与えずに保存的にも非保存的にも置換されうることは当業者であれば認識している。保存的に改変された核酸とは、アミノ酸配列の同一のまたは機能的に同一の変異体をコードする核酸で置換された核酸のことである。核酸のそれぞれのコドン(AUGおよびUGGを除く;典型的にはそれぞれメチオニンまたはトリプトファンの唯一のコドン)は改変して機能的に同一の分子を生じることが可能であることは当業者であれば認識している。したがって、ポリヌクレオチドまたはポリペプチドのそれぞれのサイレント変異(すなわち、同義コドン)は、本発明のポリペプチドをコードし、それぞれの記載されているポリペプチド配列に潜在的に含まれている。
【0065】
本発明は、二本鎖標的ポリヌクレオチドに標的核酸配列を有する形質転換ヒト細胞を提供し、前記細胞は、本明細書で提供されるCasタンパク質またはポリペプチド、および本明細書で提供される少なくとも1つのターゲティングRNA分子を含み、発現ベクターは、前記Casタンパク質および前記ターゲティングRNA分子のうちの少なくとも1つをコードする核酸を含む。任意選択で、形質転換されたヒト細胞は、単離ヒト細胞である。任意選択で、ヒト細胞は、胚性幹細胞ではない。Casタンパク質およびターゲティングRNA分子により、高温で、または、例えば本明細書に開示される37と100℃の間の温度の範囲の形質転換細胞において、標的配列の結合、切断、標識または改変を行うことが可能となり得る、またはこれらを許容することができる。本発明は、1)本発明のCasタンパク質またはポリペプチドをコードするヌクレオチド配列、および本発明のターゲティングRNA分子をコードするヌクレオチド配列を含む発現ベクターを細胞に形質転換、トランスフェクトまたは形質導入する、ステップ;または2)本発明のCasタンパク質またはポリペプチドをコードするヌクレオチド配列を含む発現ベクター、およびさらには本発明のターゲティングRNA分子をコードするヌクレオチド配列を含むさらなる発現ベクターを細胞に形質転換、トランスフェクトまたは形質導入する、ステップ;または3)本発明のCasタンパク質またはポリペプチドをコードするヌクレオチド配列を含む、および本発明において提供されているターゲティングRNA分子を細胞にまたは細部内に送達する発現ベクターを細胞に形質転換、トランスフェクトまたは形質導入する、ステップのいずれかを含む、ヒト細胞中における標的核酸に結合する、それを切断する、標識するまたは改変する方法をさらに提供する。Casタンパク質またはポリペプチドは、例えば、Casタンパク質またはポリペプチドをコードするヌクレオチド配列のゲノムへの安定な統合後に、形質転換細胞のゲノムから発現することができる。任意選択で、ヒト細胞は、胚性幹細胞ではない。任意選択で、本方法は、ヒトの生殖細胞系遺伝的同一性を改変することを含まない。
【0066】
本発明はまた、本発明の使用および方法を行うため、または本発明の形質転換ヒト細胞もしくは核タンパク質複合体を生成するための、1種または複数の試薬を含むキットであって、本発明のCasタンパク質もしくはポリペプチド、または本発明のCasタンパク質もしくはポリペプチドをコードする核酸配列を含む発現ベクター;および/または本発明のターゲティングRNA分子、もしくは本発明のターゲティングRNA分子をコードする核酸配列を含む発現ベクターを含む、キットを提供する。本キットは、本発明を行うための指示書、例えば、本発明により、ターゲティングRNA分子を設計する方法に関する指示書をさらに含むことができる。
【0067】
RNAガイドおよび標的配列
本発明のCasタンパク質は、高温での標的核酸の配列特異的結合、切断、タグ付け、標識付けまたは改変を可能にする。標的核酸は、DNA(一本鎖または二本鎖)でもRNAでも合成核酸でもよい。本発明の特に有用な応用は、ゲノムDNAの標的配列に相補的に結合する1つまたは複数のガイドRNA(gRNA)と複合した本発明の1つまたは複数のCasタンパク質によるゲノムDNAの配列特異的ターゲティングおよび改変である。したがって、標的核酸は好ましくは二本鎖DNAである。そのようなターゲティングはin vitroでもin vivoでも実施することができる。好ましくは、そのようなターゲティングはin vivoで実施される。この方法で、本発明のCasタンパク質を使用してヒト細胞のゲノムDNAに位置する特定のDNA配列を標的にして改変することができる。Cas系を使用して、異なる生物の種々の細胞型でおよび/または異なる生物でゲノムを改変することができることが想定されている。任意選択で、本発明のCasタンパク質および系は、様々なヒト細胞タイプの、特に、胚性幹細胞を除く、単離ヒト細胞のゲノムを改変するために使用することができる。
【0068】
ターゲティングRNA分子とも呼ばれるgRNAは、ポリヌクレオチド標的鎖上の標的核酸配列を認識する。RNA分子はまた、二本鎖標的ポリヌクレオチドにおける標的配列を認識するよう設計され得、非標的鎖は、プロトスペーサー配列の3’末端に直接隣接するプロトスペーサー隣接モチーフ(PAM)配列を含む。本発明のCasタンパク質およびポリペプチドを用いて、最適な方法で働くPAM配列が本明細書に開示される。これらのPAM配列の認識により、gRNAは、本発明の温度範囲および高い温度にわたり、本発明のCasタンパク質およびポリペプチドとの使用のために設計することができる。
【0069】
したがって、本発明は、上文に記載される本発明のCasタンパク質またはポリペプチドを含み、標的ポリヌクレオチド中の特定のヌクレオチド配列を認識するという点でターゲティング機能を有する少なくとも1つのRNA分子をさらに含むリボ核タンパク質複合体を提供する。本発明はまた、標的核酸鎖に結合する、これを切断する、標識するまたは改変するための、少なくとも1つのターゲティングRNA分子およびCasタンパク質またはポリペプチドの使用、および本発明のリボ核タンパク質または核タンパク質、およびCasタンパク質またはポリペプチドおよびターゲティングRNA分子を有する形質転換ヒト細胞を使用する、標的核酸鎖の標的核酸配列に結合する、これを切断する、標識するまたは改変する方法を提供する。標的ポリヌクレオチドは、本明細書で提供されるPAM配列により、プロトスペーサー配列の3’末端に直接隣接する、規定されたPAM配列をさらに含むことができる。このPAM配列は、長さが6、7または8またはそれより長い、好ましくは長さが8の核酸とすることができる。好ましくは、RNA分子は、一本鎖RNA分子、例えば、CRISPR RNA(crRNA)であり、例えば、ハイブリダイゼーションによりtracrRNAと会合する。ターゲティングRNAはcrRNAとtracrRNAのキメラでもよい。前述のRNA分子は、標的ヌクレオチド配列に対して少なくとも90%の同一性、または相補性のリボヌクレオチド配列を有することができる。任意選択で、RNA分子は、標的ヌクレオチド配列に対して少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%もしくは100%の同一性または相補性のリボヌクレオチド配列を有する。好ましい標的ヌクレオチド配列はDNAである。任意選択で、本発明のリボ核タンパク質または核タンパク質を使用する、標的核酸鎖に結合する、これを切断する、標識するまたは改変するための、少なくとも1つのターゲティングRNA分子およびCasタンパク質またはポリペプチドの使用、ならびに標的核酸鎖中の標的核酸配列に結合する、これを切断する、標識するまたは改変する方法を、ヒト細胞において使用することができる。任意選択で、ヒト細胞は単離されるであろう。任意選択で、ヒト細胞は胚性幹細胞ではない。任意選択で、本発明のCasタンパク質またはポリペプチドまたはリボ核タンパク質または核タンパク質は、ヒトの生殖細胞系遺伝的同一性を改変するために使用されないであろう。
【0070】
好ましい態様では、本発明は、少なくとも1つのターゲティングRNA分子が標的DNA配列にその長さに沿って実質的に相補的である、上文に記載されるリボ核タンパク質複合体を提供する。
【0071】
ターゲティングRNA分子は、核タンパク質複合体内の標的配列に結合し得るまたはこれと会合することができ、その結果、非標的鎖上の標的配列およびPAM配列を含む標的ポリヌクレオチドは、本発明の核タンパク質複合体と会合し、その結果、本発明の核タンパク質複合体の一部を形成することができる。
【0072】
したがって、本発明のCasタンパク質と会合するRNAガイドの配列を変化させると、Casタンパク質をガイドRNAに相補的である部位で二本鎖DNAを標識または切断するようプログラムすることが可能になる。
【0073】
好ましくは、本発明のリボ核タンパク質複合体中の少なくとも1つのターゲティングRNA分子の長さは、35から135残基の範囲、任意選択で、35から134残基、35から133残基、35から132残基、35から131残基、35から130残基、35から129残基、35から128残基、35から127残基、35から126残基、35から125残基、35から124残基、35から123残基、35から122残基、35から121残基、35から120残基、35から119残基、35から118残基、35から117残基、35から116残基、35から115残基、35から114残基、35から113残基、35から112残基、35から111残基、35から100残基、35から109残基、35から108残基、35から107残基、35から106残基、35から105残基、35から104残基、35から103残基、35から102残基、35から101残基、35から100残基、35から99残基、35から98残基、35から97残基、35から96残基、35から95残基、35から94残基、35から93残基、35から92残基、35から91残基、35から90残基、35から89残基、35から88残基、35から87残基、35から86残基、35から85残基、35から84残基、35から83残基、35から82残基、35から81残基、35から80残基、35から79残基、35から78残基、35から77残基、35から76残基、35から75残基、35から74残基、35から73残基、35から72残基、35から71残基、35から70残基、35から69残基、35から68残基、35から67残基、35から66残基、35から65残基、35から64残基、35から63残基、35から62残基、35から61残基、35から60残基、35から59残基、35から58残基、35から57残基、35から56残基、35から55残基、35から54残基、35から53残基、35から52残基、35から51残基、35から50残基、35から49残基、35から48残基、35から47残基、35から46残基、35から45残基、35から44残基、35から43残基、35から42残基、35から41残基、35から40残基、35から39残基、35から38残基、35から37残基、35から36残基、または35残基の範囲である。好ましくは、少なくとも1つのRNA分子の長さは、36から174残基、37から173残基、38から172残基、39から171残基、40から170残基、41から169残基、42から168残基、43から167残基、44から166残基、45から165残基、46から164残基、47から163残基、48から162残基、49から161残基、50から160残基、51から159残基、52から158残基、53から157残基、54から156残基、36から74残基、37から73残基、38から72残基、39から71残基、40から70残基、41から69残基、42から68残基、43から67残基、44から66残基、45から65残基、46から64残基、47から63残基、48から62残基、49から61残基、50から60残基、51から59残基、52から58残基、53から57残基、54から56残基の範囲である。
【0074】
好ましい態様では、本発明は、少なくとも1つのRNA分子の相補的部分が少なくとも30残基長である、リボ核タンパク質複合体を提供する。代わりに、少なくとも1つのRNA分子の相補的部分は、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74または75残基長でもよい。
【0075】
ターゲティングRNA分子は、好ましくは、標的核酸配列に対する高い特異性および親和性を必要とすることになる。未変性ゲル電気泳動、または代わりに等温滴定熱量測定、表面プラズモン共鳴、もしくは蛍光ベースの滴定法により決定することができる場合、1μMから1pM、好ましくは1nMから1pM、より好ましくは1~100pMの範囲の解離定数(Kd)が望ましい。親和性は、ゲル遅延度アッセイとも呼ばれる電気泳動移動度シフトアッセイ(EMSA)を使用して決定してもよい(Semenova et al. (2011) PNAS 108: 10098-10103参照)。
【0076】
ターゲティングRNA分子は、好ましくは、CRISPR RNA(crRNA)分子として原核生物の性質から分かっていることに合わせて作られる。crRNA分子の構造はすでに確立されており、Jore et al., 2011, Nature Structural & Molecular Biology 18: 529-537でさらに詳細に説明されている。手短に言えば、I-E型の成熟crRNAは、多くの場合、61ヌクレオチド長であり、8ヌクレオチドの5’「ハンドル」領域、32ヌクレオチドの「スペーサー」配列、およびテトラヌクレオチドループを有するヘアピンを形成する21ヌクレオチドの3’配列からなる(
図5)。I型系はII型(Cas9)とは異なり、異なる系の詳細はVan der Oost 2014 Nat Rev Micr 12: 479-492に記載されている。II型(Cas9)系には異なるプロセシング機構が存在しており、第2のRNA(tracrRNA)および2つのリボヌクレアーゼを利用している。ヘアピンよりはむしろ、II型中の成熟crRNAはtracrRNAの断片に結合したままである(
図5)。しかし、本発明で使用されるRNAは、長さであれ、領域であれまたは特定のRNA配列であれ、天然に存在するcrRNAの設計に厳密に合わせて設計する必要はない。しかし、明白なのは、本発明で使用するためのRNA分子は、公開データベース中のまたは新たに発見された遺伝子配列情報に基づいて設計され、次に、例えば、化学合成により全体をまたは部分を人工的に作ってもよいことである。本発明のRNA分子は、遺伝的に改変された細胞または無細胞発現系での発現のために設計および作製されてもよく、この選択肢にはRNA配列の一部または全部の合成が含まれてもよい。
【0077】
II型(Cas9)中のcrRNAの構造および必要条件もJinek et al., 2012 ibidに記載されている。I型には、スペーサー配列の5’末端を形成し、そこの5’で8ヌクレオチドの5’ハンドルと隣接しているいわゆる「シード(SEED)」部分が存在する。Semenova et al. (2011, PNAS 108: 10098-10103)は、シード配列のすべての残基が標的配列に相補的であるはずであるが、6位の残基ではミスマッチが許容されうることを見いだした(
図5)。II型には、スペーサーの3’末端に位置している10~12ヌクレオチドのシードが存在する(
図5)(Van der Oost 2014 ibid.により概説されている)。同様に、標的遺伝子座(すなわち、配列)に向けられている本発明のリボ核タンパク質複合体のRNA成分を設計し作る場合、II型シード配列についての必要なマッチおよびミスマッチルールを適用することが可能である。
【0078】
したがって、本発明は、標的核酸分子において単一塩基変化を検出するおよび/または位置付ける方法であって、核酸試料を上文に記載される本発明のリボ核タンパク質複合体と、または上文に記載される本発明のCasタンパク質もしくはポリペプチドおよび別のターゲティングRNA成分と接触させることを含み、ターゲティングRNAの配列(リボ核タンパク質複合体中にある場合を含めて)は、例えば、8ヌクレオチド残基の連続する配列の6位での単一塩基変化に基づいて正常対立遺伝子と突然変異対立遺伝子を区別するようになっている、方法を含む。
【0079】
特定の理論に縛られたくはないが、本発明のリボ核タンパク質複合体のターゲティングRNA成分の調製に使用してもよいデザインルールは、二本鎖標的ポリヌクレオチドにいわゆる「PAM」(プロトスペーサー隣接モチーフ)配列を含む。大腸菌(E. coli)のI-E型系において、PAM配列は、5’-CTT-3’、5’-CAT-3’、5’-CCT-3’、5’-CAC-3’、5’-TTT-3’、5’-ATT-3’、および5’-AWG-3’などのヌクレオチド残基の保存されたトリプレットとすることができ、WはA、TまたはUである。I型では、標的鎖に位置しているPAM配列は、通常、シードの5’に対応する位置にある。しかし、II型では、PAMは、シードの3’に対応する位置で、crRNAスペーサーの3’末端に近い置換または非標的鎖上のもう一方の末端に位置している(
図5)(Jinek et al., 2012, op. cit.)。化膿性連鎖球菌(Streptococcus pyogenes)Cas9では、PAM配列は保存された対のヌクレオチド残基、5’-NGG-3’を有する。最近、異なるCas9変異体(IIA型およびIIC型)(Ran et al., 2015 Nature 520:186-191)-
図1A)が特徴付けられ、PAMが明らかにされた(Ran et al., 2015, ibid.参照-
図1C)。現在確立されているCas9 PAMは、IIA型5’-NGGNNNN-3’(化膿性連鎖球菌(Streptococcus pyogenes))、5’-NNGTNNN-3’(ストレプトコッカス・パスツリアヌス(Streptococcus pasteurianus))、5’-NNGGAAN-3’(ストレプトコッカス・サーモフィルス(Streptococcus thermophilus))、5’-NNGGGNN-3’(黄色ブドウ球菌(Staphylococcus aureus))、およびIIC型5’-NGGNNNN-3’(ジフテリア菌(Corynebacterium difteriae))、5’-NNGGGTN-3’(カンピロバクター・ラリ(Campylobacter lari))、5’-NNNCATN-3’(パルビバクラム・ラバメンティボランス(Parvobaculum lavamentivorans))、5’-NNNNGTA-3’(ナイセリア・シネレア(Neiseria cinerea))を含む。ゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)T12のCas9(本発明)はIIC型に属する(Ran et al., 2015, ibid.)。本発明者は、驚くべきことに、本発明により使用するためのPAM配列の選択により、本発明のCasタンパク質およびポリペプチドが標的配列と相互作用する温度に、影響を及ぼすことができるということを見いだした。特に、本発明者は、標的配列の3’末端の後の5位にシトシン、および/または8位にアデニンを有する、8merのPAM配列が、幅広い温度範囲にわたり、活性を付与するのに好ましいことを見いだした。プロトスペーサー配列の3’末端の後の、PAM配列の1位、2位、3位、4位および/または6位にシトシンが存在することがやはり好ましい。
【0080】
特定の態様では、幅広い温度範囲、例えば20℃から100℃、20℃から80℃、30から80℃、20℃から70℃または25℃から65℃の幅広い温度範囲内での、標的配列との相互作用は、5’-NNNNCVAA-3’[配列番号48]のPAM配列を利用することにより実現することができる。最初の4つのPAM位が、特に好ましいわけではない。したがって、最初の4つのヌクレオチドは、任意のヌクレオチド(NNNN)であることが好都合とすることができる。好ましくは、このような幅広い温度範囲内での標的配列との相互作用は、5’-NNNNCSAA-3’[配列番号49]であるPAM配列を利用することにより行うことができる。最適には、PAMは、配列5’-NNNNCGAA-3’[配列番号50]または5’-NNNNCCAA-3’[配列番号51]とすることができる。
【0081】
標的配列との相互作用が、≧30℃、例えば、30℃から100℃で、好ましくは、30℃から70℃、30℃から65℃、または45℃から65℃の範囲で必要となる場合、PAM配列は、最適には、配列5’-NNNNCNAA-3’[配列番号52]または5’-NNNNCMCA-3’[配列番号53]とすることができる。最初の4つのPAM位が、特に好ましいわけではない。したがって、最初の4つのヌクレオチドは、任意のヌクレオチド(NNNN)であるのが好都合とすることができる。任意選択で、例えば、PAM配列は、5’-CCCCCNAA-3’または5’-CCCCCMCA-3’とすることができる。任意選択で、例えば、PAM配列は、5’-CCCCCAAA-3’、5’-CCCCCATA-3’、5’-CCCCCAGA-3’、5’-CCCCCACA-3’、5’-CCCCCTAA-3’、5’-CCCCCTTA-3’、5’-CCCCCTGA-3’、5’-CCCCCTCA-3’、5’-CCCCCGAA-3’、5’-CCCCCGTA-3’、5’-CCCCCGGA-3’、5’-CCCCCGCA-3’、5’-CCCCCCAA-3’[配列番号11]、5’-CCCCCCTA-3’、5’-CCCCCCGA-3’、または5’-CCCCCCCA-3’から選択することができる。
【0082】
本発明の実施形態では、ターゲティングRNA分子は35~200残基の範囲の長さを有していてもよい。好ましい実施形態では、RNAのうち所望の核酸配列に相補的であり、これを標的にするために使用される部分は15から32残基長である。天然に存在するcrRNAの文脈では、これは、例えば、Semenova et al. (2011 ibid.)の
図1に示されているスペーサー部分と一致する。
【0083】
本発明のリボ核タンパク質複合体は、DNA標的配列に実質的な相補性を有するRNA配列の5’にCRISPR繰り返しに由来する8残基を含むターゲティング成分を有していてもよい。DNA標的配列に相補性を有するRNA配列は、スペーサー配列であるcrRNAの文脈で一致すると理解される。RNAの5’隣接配列は、例えば、Semenova et al. (2011 ibid.)の
図1に示されているように、crRNAの5’ハンドルに一致すると見なされるであろう。
【0084】
本発明のリボ核タンパク質複合体は、DNA標的配列に相補性を有するターゲティングRNA配列の3’に、すなわち、例えば、Semenova et al. (2011 ibid.)の
図1に示されているように、crRNA中のスペーサー配列に隣接する3’ハンドルに一致するものの3’にヘアピンおよびテトラヌクレオチドループ形成配列を有していてもよい。
【0085】
特定の理論に縛られたくはないが、好ましいリボ核タンパク質複合体および二本鎖標的ポリヌクレオチドにおいて、リボ核タンパク質複合体のターゲティングRNAと対合しない非標的核酸鎖は、5’-NNNNCNNA-3’[配列番号47]、5’-CNNNCNN-3’、5’-NNNCCNN-3’、5’-NNCNCNN-3’、5’-NNNNCCN-3’および5’-NCNNCNN-3’のうちの1つまたは複数から選択される、直接3’隣接PAM配列を含むことができる。任意選択で、例えば、PAM配列は、5’-NNNNC-3’、5’-NNNNCNNA-3’[配列番号47]、5’-CNNNC-3’、5’-CNNNCNNA-3’、5’-NCNNC-3’、5’-NCNNCNNA-3’、5’-NNCNC-3’、5’-NNCNCNNA-3’、5’-NNNCC-3’、5’-NNNCCNNA-3’、5’-NNNNCC-3’、5’-NNNNCCNA-3’、5’-CCNNC-3’、5’-CCNNCNNA-3’、5’-CNCNC-3’、5’-CNCNCNNA-3’、5’-CNNCCN-3’、5’-CNNCCNNA-3’、5’-CNNNCC-3’、5’-CNNNCCNA-3’、5’-CCCNCN-3’、5’-CCCNCNNA-3’、5’-CCNCCN-3’、5’-CCNCCNNA-3’、5’-CCNNCC-3’、5’-CCNNCCNA-3’、5’-CCCCC-3’[配列番号12]、5’-CCCCCNNA-3’[配列番号13]、5’-CCCCCC-3’[配列番号14]、5’-CCCCCCNA-3’[配列番号10]、5’-NCCNC-3’、5’-NCCNCNNA-3’、5’-NCCCC-3’、5’-NCCCCNNA-3’、5’-NCCCCC-3’[配列番号15]、5’-NCCCCCNA-3’[配列番号16]、5’-NNCCC-3’、5’-NNCCCNNA-3’、5’-NNCCCC-3’、5’-NNCCCCNA-3’、5’-NNNCCC-3’、および5’-NNNCCCNA-3’から選択することができる。PAM配列は、5’-CNCCCCAC-3’[配列番号17]、5’-CCCCCCAG-3’[配列番号18]、5’-CCCCCCAA-3’[配列番号11]、5’-CCCCCCAT-3’[配列番号19]、5’-CCCCCCAC-3’[配列番号20]、5’-ATCCCCAA-3’[配列番号21]、または5’-ACGGCCAA-3’[配列番号22]とすることができる。好ましくは、PAM配列は、配列5’-NNNNCNNA-3’[配列番号47]となろう。しかし、ヌクレオチドの他の組合せを所望の用途、および/またはCasタンパク質もしくはポリペプチドの濃度に応じて使用してもよいことは認識されている。特に、最初の4つのPAM位が、特に好ましいわけではない。したがって、最初の4つのヌクレオチドは、任意のヌクレオチド(NNNN)であることが好都合となり得る。これらの配列は、天然に存在するcrRNAの文脈で「プロトスペーサー隣接モチーフ」または「PAM」と呼ばれているものと一致している。IIC型CRISPR/Cas系では、これらのPAM配列は、天然系標的でも、したがって好ましくは本発明に従ったRNAでも、標的配列に対するcrRNAの高度な特異性を保証するために、そのdsDNA標的とのCascade/crRNA複合体の安定な相互作用を促進する。好ましくは、プロトスペーサーに直接隣接する配列は、5’-NNNCATN-3’ではないであろう。
【0086】
さらに、PAM配列は、配列5’-NNNNCNNA-3’[配列番号47]、例えば5’-NNNNCNAA-3’[配列番号52]、または5’-NNNNCMCA-3’[配列番号53]とすることができる。
【0087】
中温性SpCas9が限定される1つは、それが、25と44℃の間でしか活性を示さないことである。これらの温度より高いと、SpCas9活性は、非検出可能レベルまで、急速に低下する(Mougiakos et al., 2017, ACS Synth Biol. 6: 849-861)。中温オルソログSpCas9が25~44℃の範囲であることと対照的に、本発明のThermoCas9は、20~70℃とかなり幅広い温度範囲で、in vitroで活性である。ThermoCas9の活性の延長および安定性により、20~70℃の温度においてDNA操作を必要とする、分子生物学技法におけるその応用、および強固な酵素活性を必要とする過酷な環境でのその実施が可能となる。したがって、ThermoCas9はまた、ヒト細胞のためのゲノム編集ツールとして使用することができる。任意選択で、前記ヒト細胞は、胚性幹細胞ではないであろう。
【0088】
幅広い機能温度活性範囲を有する、すなわち低温および高温の両方において、例えば、20℃と70℃、または20℃と65℃、または25℃と65℃の両方で機能があることに加え、ThermoCas9が、ターゲティング切断または結合を可能にする温度範囲、またはThermoCas9もしくは関連エレメント(例えば、sgRNAまたはtracRNAなど)の構造的特徴を改変することにより、標的化切断または結合が効率的に行われる温度範囲を操作する能力により、核酸配列操作にわたり一層高いレベルの制御を行うことが可能となる。しかし、これまで、特定の温度において、Cas9活性の分子決定因子に関してほとんど知られていなかった。
【0089】
発明者らは、ThermoCas9の熱安定性を付与するために重要ないくつかの因子を特定し、その1つは、ThermoCas9のPAM優先性である。ThermoCas9のPAM優先性は、温度範囲(≦30℃)の低い方の部分で活性に対して非常に厳密である一方、PAMの多数の変化が、中温から最適温度(37℃から60℃)において、活性となり得る。したがって、PAM配列が改変されて、所与の温度において、標的物の最も効率的な結合、切断、標識または改変を得ることができる。これは、特定の用途に応じて、ThermoCas9の用途に、非常に大きな適応性をもたらす。例えば、一部の用途では、標的結合、切断、標識または改変の非常に幅広い温度範囲、例えば、20℃から70℃、好ましくは20℃から65℃または25℃から65℃が望ましいものとなり得る。このような幅広い温度範囲内での標的配列の結合、切断、標識または改変は、5’-NNNNCVAA-3’[配列番号48]であるPAM配列を利用することにより行うことができる。好ましくは、このような幅広い温度範囲内での標的配列の結合、切断、標識または改変は、5’-NNNNCSAA-3’[配列番号49]、例えば5’-NNNNCGAA-3’[配列番号50]または5’-NNNNCCAA-3’[配列番号51]であるPAM配列を利用することにより行うことができる。最初の4つのPAM位が、特に好ましいわけではない。したがって、最初の4つのヌクレオチドは、任意のヌクレオチド(NNNN)であることが好都合となり得る。任意選択で、例えば、5’-CCCCCGAA-3’または5’-CCCCCCAA-3’[配列番号11]。
【0090】
標的物の結合、切断、標識または改変は、≧30℃、例えば、30℃から100℃で、好ましくは、30℃から70℃、30℃から65℃、または45℃から65℃の範囲で必要な場合、PAM配列は、最適には、配列5’-NNNNCNAA-3’[配列番号52]または5’-NNNNCMCA-3’[配列番号53]とすることができる。最初の4つのPAM位が、特に好ましいわけではない。したがって、最初の4つのヌクレオチドは、任意のヌクレオチド(NNNN)であることが好都合となり得る。任意選択で、例えば、PAM配列は、5’-CCCCCNAA-3’または5’-CCCCCMCA-3’とすることができる。任意選択で、例えば、PAM配列は、5’-CCCCCAAA-3’、5’-CCCCCATA-3’、5’-CCCCCAGA-3’、5’-CCCCCACA-3’、5’-CCCCCTAA-3’、5’-CCCCCTTA-3’、5’-CCCCCTGA-3’、5’-CCCCCTCA-3’、5’-CCCCCGAA-3’、5’-CCCCCGTA-3’、5’-CCCCCGGA-3’、5’-CCCCCGCA-3’、5’-CCCCCCAA-3’[配列番号11]、5’-CCCCCCTA-3’、5’-CCCCCCGA-3’、または5’-CCCCCCCA-3’から選択することができる。
【0091】
本明細書で提供される本発明のPAM配列は、例えば、6mer、7merまたは8merの配列として、本明細書に開示される配列を含む。6mer、7merまたは8merの配列は、非標的鎖上のプロトスペーサー配列の3’で直接、始まってもよく、標的RNAにより結合したプロトスペーサー配列に相補的なプロトスペーサー配列と、PAM配列の5’末端との間に間隔を置いた追加の核酸は存在しない。しかし、6mer、7merまたは8merの配列の3’末端における、PAM配列の部分を形成する追加の核酸が存在してもよいことが認識されよう。さらにまたは代替的に、非標的鎖は、PAM配列の追加の核酸3’を含むことができる。
【0092】
本発明の核タンパク質複合体は、本発明のリボ核タンパク質複合体、および該リボ核タンパク質が会合する核酸の標的核酸鎖を含むことができる。
【0093】
結合、切断、標識および改変の温度
活性、例えば本発明のCasタンパク質のヌクレアーゼ活性の最適温度範囲を含めた、温度範囲は、既知のCas9タンパク質の温度範囲よりもかなり高い。同様に、活性を維持する範囲の高い側の程度は、既知のCas9タンパク質のそれよりもかなり高い。最適温度および機能範囲がより高いことにより、高温での遺伝子工学に大きな利点をもたらす。したがって、本発明の方法、使用、核タンパク質および形質転換ヒト細胞は、高温でゲノム編集に有用となり得る。非標的鎖のプロトスペーサー配列に直接隣接する本発明のPAM配列が存在することにより、標的配列に対するCasタンパク質およびポリペプチドの特異性が改善され、より高い温度において、およびより大きな機能的温度範囲にわたり、Casタンパク質およびポリペプチドの使用を支持する。
【0094】
かなり大きな熱安定性により、本発明のCasタンパクは、既知のCas9タンパク質の温度範囲よりもかなり大きな温度範囲にわたり、機能、例えばヌクレアーゼ活性を保持する。同様に、活性を維持する、範囲の高い側の程度は、既知のCas9タンパク質のそれよりもかなり高い。最適温度および機能範囲がより高いことにより、高温での遺伝子工学、したがって、高温でのヒト細胞のゲノムの編集に大きな利点をもたらす。任意選択で、胚性幹細胞の操作を含まない。ThermoCas9の活性および安定性の延長により、例えば、20~70℃の幅広い温度範囲内でDNA操作を必要とする、分子生物学技法におけるその応用、および強固な酵素活性を必要とする過酷な環境でのその実施が可能となる。
【0095】
有利には、本発明者らはまた、本発明のCasタンパク質は、標的配列に配列特異的に結合することによって、標的配列の直接的な転写制御、例えば、サイレンシング転写に使用することもできることを示す。したがって、ThermoCas9はまた、ヒト細胞において、例えば、標的遺伝子のサイレンシングまたは活性転写において、転写制御ツールとして使用することもできる。したがって、ThermoCas9はまた、ヒト細胞における、遺伝子-サイレンシングツールとして使用することもできる。任意選択で、本発明のCasタンパク質は、胚性幹細胞に使用されない。任意選択で、本発明のCasタンパク質は、ヒトの生殖細胞系遺伝的同一性の改変に使用されない。
【0096】
有利には、本発明のCasタンパク質またはポリペプチドは、20℃から100℃までの温度で、核酸の結合、切断、標識または改変が可能であるが、高温で、例えば、41℃と122℃の間の温度、好ましくは50℃と100℃の間の温度で、特に有用である。本発明のCasタンパク質およびポリペプチドは、DNA、RNAおよび合成核酸に結合する、これを切断する、標識するまたは改変することが可能である。本発明のCasタンパク質またはポリペプチドは、例えば、20℃から50℃までの範囲の温度で、ヌクレアーゼ活性、遺伝子編集および核酸標識の用途に関する操作性をやはり実現することができる。
【0097】
温度範囲が、本明細書に含まれている場合、開示されている温度範囲に端点が含まれる、すなわちこの範囲を「含む」ことが意図される。例えば、20℃と100℃の間の範囲の温度で活性があると明記する場合、20℃と100℃の温度が、前記範囲に含まれる。
【0098】
好ましくは、本発明のCasタンパク質またはポリペプチドは、結合される、切断される、標識されるまたは改変されるポリヌクレオチド分子の標的配列を認識する、好適なgRNA(ターゲティングRNA分子とも呼ばれる、ガイドRNA)と会合する場合、20℃から100℃の範囲、任意選択で20℃から70℃、20℃から65℃、25℃から70℃、25℃から65℃、55℃から100℃、50℃から70℃、55℃から70℃、または55℃から65℃の範囲の温度において、上記のことを行う。
【0099】
好ましくは、本発明のCasタンパク質またはポリペプチドは、結合される、切断される、標識されるまたは改変されるポリヌクレオチド分子の標的配列を認識する、好適なgRNA(ターゲティングRNA分子とも呼ばれる、ガイドRNA)と会合する場合、50℃から100℃、任意選択で55℃から100℃、60℃から100℃、65℃から100℃、70℃から100℃、75℃から100℃、80℃から100℃、85℃から100℃、90℃から100℃、95℃から100℃の範囲の温度において、上記のことが行われる。より好ましくは、本発明のCasタンパク質は、51℃から99℃、52℃から98℃、53℃から97℃、54℃から96℃、55℃から95℃、56℃から94℃、57℃から93℃、58℃から92℃、59℃から91℃、60℃から90℃、61℃から89℃、62℃から88℃、63℃から87℃、64℃から86℃、65℃から85℃、66℃から84℃、67℃から83℃、68℃から82℃、69℃から81℃、70℃から80℃、71℃から79℃、72℃から78℃、73℃から77℃、74℃から76℃の範囲の温度で、または75℃の温度において、核酸を切断、標識または改変する。好ましくは、本発明のCasタンパク質は、60℃から80℃、61℃から79℃、62℃から78℃、63℃から77℃、64℃から76℃、60℃から75℃、60℃から70℃の範囲の温度で、核酸に結合する、これを切断する、標識するまたは改変する。最適には、本発明のCasタンパク質は、60℃から65℃の範囲の温度で、好ましくは65℃で核酸に結合する、核酸を切断する、標識するまたは改変する。
【0100】
標的RNA分子は、本発明のCasタンパク質およびポリペプチドと共に使用するよう設計することができ、標的RNA分子は、標的鎖における標的配列に結合し、非標的鎖は、プロトスペーサー配列の直後の3’の本明細書に提供されるPAM配列をさらに含む。PAM配列は、5’-NNNNNNNA-3’、好ましくは5’-NNNNCNNA-3’[配列番号47]、任意選択で、例えば5’-CCCCCCNA-3’[配列番号10]または5’-CCCCCCAA-3’[配列番号11]を含み、本発明の使用、方法、形質転換細胞および核タンパク質は、55℃から65℃の温度範囲、好ましくは50℃から70℃、40℃から65℃、45℃から75℃、37℃から78℃、および/または20℃から80℃の温度範囲にわたる、標的鎖への結合、この切断、標識および/または改変を実現することができる。
【0101】
PAM配列が改変されて、所与の温度において、標的物の最も効率的な切断を得ることができる。これは、特定の用途に応じて、本発明のCasタンパク質の適用に、非常に大きな適応性をもたらす。結合、切断、標識または改変活性、例えば切断活性が、20℃から100℃、好ましくは20℃から70℃、または20℃から65℃、または25℃から65℃の温度範囲において必要な場合、活性は、5’-NNNNCVAA-3’[配列番号48]となるPAM配列を利用することにより実現することができ、好ましくは、このような温度範囲内の活性は、5’-NNNNCSAA-3’[配列番号49]、例えば5’-NNNNCGAA-3’[配列番号50]または5’-NNNNCCAA-3’[配列番号51]となるPAM配列を利用することにより実現することができる。任意選択で、例えば、5’-CCCCCGAA-3’[配列番号52]または5’-CCCCCCAA-3’[配列番号11]。
【0102】
発明者らは、ThermoCas9の熱安定性は、ガイドRNA(sgRNA)の会合と共に増大して、リボ核タンパク質複合体を形成することを見いだした。ガイドRNA(sgRNA)は、tracrRNAおよびcrRNAを好適に含むことができる。このような配置では、ガイドは、ヌクレオチドスペーサー断片および繰り返し断片を含むcrRNAを好適に含むことができる。crRNAは、長さが17~20ntであるのが好適となり得る。任意選択で、crRNAは、長さが17ntとすることができる。代替的に、crRNAは、長さが18nt、長さが19ntまたは長さが20ntとすることができる。ガイドはまた、tracrRNA(抗繰り返し断片(crRNAの繰り返し断片との対合塩基))を含むことができる。tracrRNAおよびcrRNAは、合成リンカーによって分離され得る。以下のガイドが、好ましい配置:5’-[crRNA(17~20ヌクレオチドスペーサー-断片および繰り返し断片)-(任意選択:2つのRNAを連結する合成ループ)-tracrRNA(抗繰り返し断片(crRNAの繰り返し断片との対合塩基)および一部の可変ステムループ構造(以下に示されているものに関する)、これは、一部の系では、ある程度、トランケートされていてもよい)]-3’ を表す。
【0103】
通常、tracrRNAは、例えば、crRNAおよびtracrRNAを含む、キメラ単一ガイドRNA(sgRNA)の一部として提供されるであろう。tracrRNAは、抗繰り返し領域、その後の1つまたは複数のヘアピン構造、好ましくは2つ以上のヘアピン構造、またはより好ましくは3つ以上のヘアピン構造からなることができる。スペーサー遠位終端において、(4-ヌクレオチドリンカー、例えば5’-GAAA-3’によって融合された合成sgRNAキメラにおける、相補的であるtracrRNA部分(抗繰り返し)のcrRNA部分(繰り返し)の3’末端、およびその5’末端により形成された)完全長繰り返し/抗繰り返しヘアピンの存在は、ヌクレアーゼへのアンカーとして機能するが、標的選択および切断活性に必須ではない。例えば、tracrRNA部分の最大で50nt長の欠失のスペーサー遠位末端における欠失は、DNA切断効率に及ぼす効果はほとんどまたは全くなしに許容され得る。したがって、完全長繰り返し-抗繰り返しヘアピンのスペーサー遠位終端の欠失は、標的DNA切断効率に関して妥協点なしに、最大で50nt、最大で45nt、最大で40nt、最大で35nt、最大で30nt、最大で25nt、最大で20nt、最大で15nt、最大で10nt、または最大で5ntまで作製することができる。
【0104】
驚いたことに、発明者らは、tracrRNAの構造が、ThermoCas9の熱安定性、および活性、特に切断活性の効率に影響を及ぼすことも見いだした。具体的には、所与の温度における、標的物の最も効率的な結合、切断、標識または改変を得るため、tracrRNAまたはsgRNAにおけるヘアピン(または、ステムループ)構造の数を修正することができる。これは、特定の用途に応じて、本発明のCasタンパク質の適用に、非常に大きな適応性をもたらす。任意選択で、tracrRNAまたはsgRNAは、1つまたは複数のステムループ構造、2つ以上のステムループ構造、または3つ以上のステムループ構造を形成することができる、核酸配列を含んで提供され得る。任意選択で、tracrRNAまたはsgRNAは、1つまたは複数のステムループ構造、2つ以上のステムループ構造、または3つ以上のステムループ構造を形成するよう配列された、核酸配列を含んで提供され得る。好ましくは、sgRNAは、少なくとも3つのステムループ構造を形成することができる、核酸配列を含んで提供されよう。
【0105】
任意選択で、活性物に結合する、これを切断する、標識するまたは改変する、例えば、切断活性は、20℃から60℃、好ましくは37℃から60℃、または37℃、40℃、45℃、50℃、55℃または60℃の温度範囲内で必要とされる場合、活性は、1つまたは複数のステムループ構造を形成することが可能な、sgRNA配列を利用することにより実現することができる。
【0106】
任意選択で、活性物に結合する、これを切断する、標識するまたは改変する、例えば、切断活性は、20℃から65℃、好ましくは37℃から65℃、より好ましくは45℃から55℃、または37℃、40℃、45℃、50℃、55℃または60℃の温度範囲内で必要とされる場合、活性は、2つ以上のステムループ構造を形成することが可能な、sgRNA配列を利用することにより実現することができる。
【0107】
任意選択で、活性物に結合する、これを切断する、標識するまたは改変する、例えば、切断活性は、20℃から100℃、好ましくは20℃から70℃、より好ましくは37℃から65℃または37℃、40℃、45℃、50℃、55℃、60℃または65℃の温度範囲内で必要とされる場合、活性は、3つ以上のステムループ構造を形成することが可能な、sgRNA配列を利用するにより実現することができる。
【0108】
好ましくは、tracrRNAに対応するsgRNAの一部は、5’ヘアピンを例示する、配列;AAGGGCUUUCUGCCUAUAGGCAGACUGCCC[配列番号54]を含むであろう。好ましくは、tracrRNAに対応するsgRNAの部分は、「ミドル」ヘアピンを例示する、配列;GUGGCGUUGGGGAUCGCCUAUCGCC[配列番号55]をさらに含むであろう。好ましくは、tracrRNAに対応するsgRNAの部分は、3’ヘアピンを例示する、配列;CGCUUUCUUCGGGCAUUCCCCACUCUUAGGCGUUUU[配列番号56]をさらに含むであろう。
【0109】
好ましくは、tracrRNAに対応するsgRNAの部分は、配列;AAGGGCUUUCUGCCUAUAGGCAGACUGCCCGUGGCGUUGGGGAUCGCCUAUCGCC[配列番号57]を含み、すなわち5’ヘアピンおよびミドルを含むであろう。好ましくは、tracrRNAに対応するsgRNAの部分は、配列;
AAGGGCUUUCUGCCUAUAGGCAGACUGCCCGUGGCGUUGGGGAUCGCCUAUCGCCCGCUUUCUUCGGGCAUUCCCCACUCUUAGGCGUUUU[配列番号58]を含むことができ、すなわち、5’ヘアピン、ミドルヘアピンおよび3’ヘアピンを含む。
【0110】
発明者らは、tracrRNA足場の予測されたステムループの数が、特に高温において、DNA切断に重大な役割を果たすことを発見した。本発明者らは、3つのループすべてが存在する場合、tracrRNA足場の3つのステムループの存在は、切断活性に必須ではないが、切断は、この範囲の温度すべてにおいて最も効率的であることを決定し、完全長tracrRNAは、高温において、最適なThermoCas9に基づくDNA切断に必要であることを示している。対照的に、3‘ヘアピンの除去により、切断効率の低下がもたらされる。さらに、本発明者らは、ミドルヘアピンと3‘ヘアピンの両方を除去すると、特に、機能的温度範囲の高い方の端と低い方の端において、ThermoCas9の切断効率の劇的な低下がもたらされることを見いだした。好ましくは、標的配列の結合、切断、標識または改変は、高温、例えば45℃から100℃、50℃から100℃、50℃から70℃、50℃から65℃、55℃から65℃、または20℃から100℃、20℃から70℃、20℃から65℃などの幅広い温度範囲内が必要とされる。好ましくは、3つのステムループ構造を有するsgRNAと会合するThermoCas9は、20℃から100℃、20℃から70℃、20℃から65℃、45℃から100℃、50℃から100℃、50℃から70℃、50℃から65℃、または55℃から65℃の範囲の選択した温度で、少なくとも1分間、少なくとも2分間、少なくとも3分間、少なくとも4分間または少なくとも5分間、好ましくは5分間、安定のままであり、かつ標的配列の結合、切断、標識または改変を可能にするであろう。
【0111】
さらに、発明者らはまた、sgRNAのスペーサー配列の長さが、ThermoCas9活性、例えば、結合、切断、標識または改変活性の効率を操作するために、様々となり得ることを発見した。通常、スペーサー配列は、長さが、18nt~25ntの範囲になろう。任意選択で、スペーサー配列は、長さが、18nt、19nt、20nt、21nt、22nt、23nt、24ntまたは25ntになろう。好ましくは、19nt、20nt、21ntまたは23ntのスペーサー長さが使用され、なぜなら、これらのスペーサー長さを有するsgRNAと会合した場合に、本発明のCas9タンパク質が、最も高い効率で標的配列を切断するからである。18ntのスペーサーが使用される場合、切断効率は、著しく低下する。好ましくは、スペーサーの長さは、23ntとなろう。
【0112】
本発明のすべての態様において、Casタンパク質またはポリペプチドは、細菌、古細菌またはウイルスから得ることができるか、もしくはこれらに由来することができ、または代替として、de novoで合成されてもよい。好ましい実施形態では、本発明のCasタンパク質またはポリペプチドは、好熱性原核生物に由来し、これらの生物は、古細菌または細菌として分類することができるが、好ましくは細菌である。より好ましくは、本発明のCasタンパク質またはポリペプチドは、好熱性細菌に由来する。本明細書において、好熱性という用語は、比較的高い温度で、生存および成長することが可能である、例えば、本発明の文脈では、41と122℃(106と252°F)の間の温度で、核酸の切断、結合または改変を行うことができるという意味として理解されるべきである。好ましくは、本発明のCasタンパク質またはポリペプチドは、1つまたは複数の好熱性細菌から単離されてもよく、60℃超で機能するであろう。好ましくは、本発明のCasタンパク質またはポリペプチドは、1つまたは複数の好熱性細菌から単離されてもよく、60℃から80℃の範囲で、最適には60℃と65℃の間で機能するであろう。好ましい実施形態では、本発明のCasタンパク質またはポリペプチドは、ゲオバチルス(Geobacillus)属種に由来する。より好ましくは、本発明のCasタンパク質は、ゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)に由来する。さらにより好ましくは、本発明のCasタンパク質は、ゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)T12に由来する。本発明のCasタンパク質またはポリペプチドは、ウイルスに由来することができる。
【0113】
機能的部分
有利なことに、任意のポリヌクレオチド配列を配列特異的に標的にする本発明のCasタンパク質、ポリペプチドおよびリボ核タンパク質複合体の能力は、何らかの方法で、例えば、標的核酸を切断および/または標識および/または修飾することにより、標的核酸を改変するために利用することができる。したがって、これを達成するためにはCasタンパク質またはポリペプチドと共に追加のタンパク質を提供してもよいことが認識されよう。したがって、本発明のCasタンパク質またはポリペプチドは、少なくとも1つの機能的部分をさらに含んでもよく、かつ/または本発明のCasタンパク質、ポリペプチドまたはリボ核タンパク質複合体は、少なくとも1つのさらなるタンパク質を含むタンパク質複合体の一部として提供されてもよい。好ましい態様では、本発明は、Casタンパク質または少なくとも1つのさらなるタンパク質が少なくとも1つの機能的部分をさらに含む、Casタンパク質、ポリペプチドまたはリボ核タンパク質複合体を提供する。少なくとも1つの機能的部分は、Casタンパク質に融合または連結していてもよい。好ましくは、少なくとも1つの機能的部分は、天然のまたは人工的タンパク質発現系での発現を通じてCasタンパク質に翻訳によって融合してもよい。代わりに、少なくとも1つの機能的部分は、化学合成ステップによりCasタンパク質に共有結合によって連結してもよい。好ましくは、少なくとも1つの機能的部分は、Casタンパク質のN終端および/またはC終端、好ましくはC終端に融合または連結している。
【0114】
少なくとも1つの機能的部分はタンパク質であることが望ましい。タンパク質は、異種タンパク質であってもよく、または代わりにCasタンパク質が由来した細菌種に固有であってもよい。少なくとも1つの機能的部分はタンパク質であってもよく、任意選択で、ヘリカーゼ、ヌクレアーゼ、ヘリカーゼ-ヌクレアーゼ、DNAメチラーゼ、ヒストンメチラーゼ、アセチラーゼ、ホスファターゼ、キナーゼ、転写(共)活性化因子、転写リプレッサー、DNA結合タンパク質、DNA構築タンパク質、マーカータンパク質、レポータータンパク質、蛍光タンパク質、リガンド結合タンパク質、シグナルペプチド、細胞内局在配列、抗体エピトープまたは親和性精製タグから選択されうる。
【0115】
特に好ましい態様では、本発明は、少なくとも1つの機能的部分がマーカータンパク質、例えば、GFPである、Casタンパク質、ポリペプチドまたはリボ核タンパク質複合体を提供する。
【0116】
ヌクレアーゼ活性
本発明のCasリボ核タンパク質は、本明細書にて開示される温度で、好ましくは高温で、例えば、50℃と100℃の間の温度で、核酸結合、切断、標識または改変活性を有する。本発明のリボ核タンパク質は、DNA、RNAまたは合成核酸に結合する、これを切断する、標識する、または改変することが可能となり得る。好ましい態様では、本発明のCasリボ核タンパク質は、DNAを、特に二本鎖DNAを配列特異的に切断することができる。
【0117】
本発明のCasタンパク質、ポリペプチドまたはリボ核タンパク質は、1つよりも多いヌクレアーゼドメインを有してもよい。部位特異的ヌクレアーゼは、DNAの鎖に沿って選択された位置で二本鎖切断(DSB)を生じさせることができる。標的宿主細胞では、これによりゲノム内の特定の前選択した位置でDSBを作ることができる。部位特異的ヌクレアーゼによるそのような切断の作製に促されて、目的のゲノム内の所望の位置でDNAを挿入、欠失または改変するために内在性細胞修復機構が別の目的で利用される。
【0118】
タンパク質またはポリペプチド分子の1つまたは複数のヌクレアーゼ活性部位は、例えば、タンパク質またはポリペプチドに連結または融合している別の機能的部分、例えば、FokIヌクレアーゼなどのヌクレアーゼドメインの活性を可能にするように不活化され得る。
【0119】
したがって、本発明のCasタンパク質、ポリペプチドおよびリボ核タンパク質がある特定の応用のために内在性ヌクレアーゼ活性を有する場合があるにもかかわらず、Casタンパク質の天然のヌクレアーゼ活性を不活化し、天然のCas9ヌクレアーゼ活性が不活化されCasタンパク質が少なくとも1つの機能的部分に連結しているCasタンパク質またはリボ核タンパク質複合体を提供するのが望ましい場合がある。天然のCas9ヌクレアーゼ活性の相補性によるミスターゲティング事象の発生率を減らすことは1つのそのような応用である。これは、望ましくは、Casタンパク質またはリボ核タンパク質複合体の天然のCas9ヌクレアーゼ活性を不活化させ、好ましくはCasタンパク質に融合している、異種ヌクレアーゼを提供することにより達成することもできる。したがって、本発明は、少なくとも1つの機能的部分がヌクレアーゼドメイン、好ましくはFokIヌクレアーゼドメインである、Casタンパク質またはリボ核タンパク質複合体を提供する。特に好ましい態様では、FokIヌクレアーゼドメインに融合している本発明のCasタンパク質またはリボ核タンパク質複合体は、好ましくは、FokIヌクレアーゼドメインに融合している本発明の別のCasタンパク質またはリボ核タンパク質複合体を含み、2つの複合体が標的ゲノムDNAの反対の鎖を標的にする、タンパク質複合体の一部として提供される。
【0120】
いくつかの応用では、例えば、Casタンパク質またはリボ核タンパク質複合体が核酸中の特定の標的配列を認識し改変する、例えば、その標的配列を診断検査の一部として標識するのに利用する応用では、Casタンパク質、ポリペプチドまたはリボ核タンパク質のヌクレアーゼ活性を完全に減弱させるのが望ましい場合がある。そのような応用では、Casタンパク質のヌクレアーゼ活性は不活化されてもよく、Casタンパク質に融合している機能的部分はタンパク質でもよく、任意選択で、ヘリカーゼ、ヌクレアーゼ、ヘリカーゼ-ヌクレアーゼ、DNAメチラーゼ、ヒストンメチラーゼ、アセチラーゼ、ホスファターゼ、キナーゼ、転写(共)活性化因子、転写リプレッサー、DNA結合タンパク質、DNA構築タンパク質、マーカータンパク質、レポータータンパク質、蛍光タンパク質、リガンド結合タンパク質、シグナルペプチド、細胞内局在配列、抗体エピトープまたは親和性精製タグから選択されうる。
【0121】
好ましい態様では、触媒として不活性な、またはヌクレアーゼ活性を欠く「死滅した」Casタンパク質もしくはポリペプチド(dCas)は、標的核酸配列に結合することができ、それにより、その配列の活性を立体的に抑制する。例えば、遺伝子のプロモーターまたはエクソンの配列に相補的である標的RNAを設計することができ、その結果、遺伝子へのdCasおよび標的RNAの結合は、遺伝子配列の転写開始または伸長を立体的に抑制し、それにより、遺伝子の発現を抑制する。代替的に、本明細書に記載される方法および使用は、ニッカーゼであるgtCas9の改変ヌクレアーゼ変異体を使用することができる。ニッカーゼは、HNHまたはgtCas9ヌクレアーゼのRuvC触媒ドメインの一方において変異により作製することができる。これは、それぞれ、不活性なRuvCまたはHNHヌクレアーゼドメインを有する、spCas9-変異体D10AおよびH840Aを含む化膿性連鎖球菌(S. pyogenes)Cas9(spCas)の場合に示される。これらの2つの変異を組み合わせることにより、触媒的に死滅したCas9変異体に至る(Standage-Beier, K. et al., 2015, ACS Synth. Biol. 4, 1217-1225;Jinek, M. et al., 2012, Science 337, 816-821;Xu, T. et al., 2015, Appl. Environ. Microbiol. 81, 4423-4431)。配列相同性に基づいて(
図3)、これらの残基は、gtCas9のD8(
図3におけるD17)およびD581またはH582(
図3)とすることができる。
【0122】
好ましくは、gtCas9(ThermoCas9)における変異D8AおよびH582Aを使用して、ヌクレアーゼ活性を欠いている、ThermoCas9(dCas)の触媒的に不活性な、または「死滅」Casタンパク質もしくはポリペプチド変異体を作製することができる。このようなdCasは、dsDNA切断を導入することなく、DNAエレメントに安定してかつ特異的に結合することができる、例えば、効率的な熱活性転写サイレンシングCRISPRiツールとしての用途を有用にも見いだすことができる。有利には、このようなシステムは、とりわけ、ヒト細胞の代謝検討をかなり容易にすることができる。
【0123】
特に好ましい態様では、本発明は、Casタンパク質のヌクレアーゼ活性が不活化され少なくとも1つの機能的部分がマーカータンパク質、例えば、GFPである、Casタンパク質またはリボ核タンパク質複合体を提供する。この方法で、目的の核酸配列を特異的に標的にし、光シグナルを発生させるマーカーを使用してその核酸配列を可視化することが可能になりうる。適切なマーカーは、例えば、蛍光レポータータンパク質、例えば、緑色蛍光タンパク質(GFP)、黄色蛍光タンパク質(YFP)、赤色蛍光タンパク質(RFP)、シアン蛍光タンパク質(CFP)またはmCherryを含んでいてもよい。そのタンパク質の発現は蛍光測定により簡単に直接的にアッセイすることが可能なので、そのような蛍光レポーター遺伝子はタンパク質発現の可視化に適したマーカーを提供する。代わりに、レポーター核酸は、ルシフェラーゼ(例えば、ホタルルシフェラーゼ)など発光タンパク質をコードしてもよい。代わりに、レポーター遺伝子は、光シグナルを発生させるのに使用することが可能な発色酵素、例えば、発色酵素(ベータ-ガラクトシダーゼ(LacZ)またはベータ-グルクロニダーゼ(Gus)など)でもよい。発現の測定に使用されるレポーターは、抗原ペプチドタグでもよい。他のレポーターまたはマーカーは当技術分野では公知であり、必要に応じて使用してもよい。
【0124】
マーカーは可視化することができるので、標的核酸がRNA、具体的にはmRNAであるある特定の実施形態では、特に、マーカーにより発生する光シグナルが発現産物の量に正比例している場合、マーカーにより発生する光シグナルの検出および定量化により遺伝子の転写活性を定量化することが可能でありうる。したがって、本発明の好ましい実施形態では、本発明のCasタンパク質またはリボ核タンパク質を使用して、目的の遺伝子の発現産物をアッセイすることができる。
【0125】
一態様では、本明細書に記載されるgtCas9は、相同組換え(HR)媒介性ゲノム改変方法で使用されてもよい。このような方法は、HRおよび部位特異的gtCas9活性を含み、これにより、対向選択は、gtCas9活性が、HRにより導入された所望の改変を有していない細胞を除去することにより行われる。
【0126】
したがって、本明細書で提供される方法および使用により、第1の工程の間に好都合となる相同組換え方法が可能になり、こうして、ゲノムは、所望の変異、および非改変細胞が、gtCas9リボヌクレアーゼ複合体によりターゲティングされて、非改変細胞のゲノムにDSDBを導入することができる第2の工程により改変することができる。これらの方法および使用は、いずれの非改変細胞を除去すると同時に、所望の変異を有する細胞の集団全体を増大する。好ましくは、このような方法および使用は、実質的に、内因性NHEJ修復機構を有していない微生物において使用される。代替的に、本方法および使用は、内因性NHEJ修復機構を有する細胞に適用してもよい。本明細書に記載される方法および使用は、内因性NHEJ修復機構を有する細胞に適用することができるが、この場合、NHEJ修復機構は、条件付きで低下されるか、またはNHEJ活性がノックアウトされるかのどちらかとなる。
【0127】
本明細書で提供される方法および使用は、ガイドRNAと少なくとも1つのミスマッチを有する、相同組換えポリヌクレオチドの配列を利用することができ、こうして、ガイドRNAは、改変ゲノムをもはや認識することができない。これは、gtCas9リボヌクレアーゼ複合体が、改変ゲノムを認識しないことを意味する。したがって、DSDBは、gtCas9リボヌクレアーゼ複合体によって導入することはできず、その結果、改変細胞は、生存することになろう。しかし、非改変ゲノムを有する細胞は、ガイドRNAに対して実質的な相補性を依然として有しており、その結果、gtCas9リボヌクレアーゼ複合体により部位特異的に切断され得る。
【0128】
本発明の方法および使用の別の態様では、gtCas9リボヌクレオアーゼ複合体が、微生物ゲノムを切断させる作用を防止する方法は、ガイドによって標的とされる配列を改変または除外することではなく、むしろ、gtCas9リボヌクレアーゼ複合体によって必要とされるPAMを改変または除外することである。PAMは、特定の切断部位に対してgtCas9リボヌクレアーゼ複合体を結合させるために、改変または除去のどちらか一方が行われる。したがって、本発明の方法および使用は、gtCas9リボヌクレアーゼ複合体によって認識されるPAM配列を含まない、相同組換えポリヌクレオチドの配列を使用するものを含むことができる。したがって、DSDBは、gtCas9リボヌクレアーゼ複合体によって導入することはできず、その結果、HR改変細胞は、生存することになろう。しかし、非修飾細胞は、gtCas9リボヌクレアーゼ複合体およびそのガイドにより依然として認識され、その結果、部位特異的に切断される。
【0129】
したがって、細胞のゲノムを改変するために、HRに頼る方法および使用が、明細書において提供される。好ましくは、上流隣接部および下流隣接部は、長さが、それぞれ、0.5キロ塩基(kb)から1.0kbである。しかし、それより長い断片またはそれより短い断片を使用する組換えが、同様に可能である。相同組換えポリヌクレオチドは、上流と下流の隣接領域との間にポリヌクレオチド配列をさらに含んでもよい。このポリヌクレオチド配列は、例えば、ゲノムに導入されることになる、改変を含むことができる。
【0130】
相同組換えは、標的領域に対して実質的な相補性を有する、上流隣接部および下流領隣接部に依存する一方、ミスマッチも同様に収容可能である。したがって、一部の実施形態では、相同組換えは、上流隣接部および下流隣接部に対して広範な相同性を有する、DNAセグメント間に行われることが知られている。代替実施形態では、上流および下流隣接部は、標的領域に対して完全な相補性を有する。上流および下流隣接部は、サイズが同一である必要がない。しかし、一部の例では、上流および下流隣接部は、サイズが同一である。相同組換えの効率は、隣接部の最小断片長さの相同組換えの可能性に応じて様々となろう。しかし、相同組換え法が、非効率である場合でさえも、有利には、本明細書に記載される方法は、非改変細胞よりも、所望の改変を有する任意の細胞を選択することになろう。相同組換えにより、やはり、完全遺伝子クラスターを包含する大きな欠失(例えば、50kb以上)を作製することが可能となる。相同組換えは組換えに使用され、これは、より小さな断片(45~100nt)に組換えを可能にする周知の方法である。本明細書に記載される方法および使用は、ゲノムにおいて、標的を含有する第2の標的領域に実質的に相補的である配列を有する相同組換えポリヌクレオチドをコードする配列を含む、少なくとも別の相同組換えポリヌクレオチドまたはポリヌクレオチドをさらに任意選択で含むことができる。
【0131】
好ましい実施形態では、本明細書に記載される方法および使用は、DNAである相同組換えポリヌクレオチドを利用する。一部の実施形態では、DNAは一本鎖である。他の実施形態では、DNAは二本鎖である。さらなる実施形態では、DNAは、二本鎖であり、プラスミド媒介性である。
【0132】
本明細書で提供される方法および使用にHRを使用して、ゲノムからポリヌクレオチド配列を除去することができる。代替的に、本明細書で提供される方法および使用におけるHRを使用して、ゲノムに1つまたは複数の遺伝子またはその断片を挿入することができる。さらなる選択として、本明細書で提供される方法および使用においてHRを使用し、ゲノムにおける少なくとも1つのヌクレオチドを改変、またはこれに置き換えることができる。これにより、本明細書で提供される方法および使用は、任意の所望の種類のゲノム改変に使用することができる。
【0133】
代替的に、本明細書に記載されるgtCas9は、細胞において、HR媒介性ゲノム改変方法に使用してもよく、それにより、gtCas9活性により、DSDBが導入され、spCas9に関して示されている通り、細胞における細胞HRを誘発することができる(Jiang et al. (2013) Nature Biotech, 31, 233-239;Xu et al. (2015) Appl Environ Microbiol, 81, 4423-4431;Huang et al. (2015) Acta Biochimica et Biophysica Sinica, 47, 231-243)。
【0134】
代替的に、相同組換えは、例えば、Mougiakosらによって概説されている、RecTまたはベータプロテインをコードする遺伝子を発現する、細胞にオリゴヌクレオチドを導入することによる組換えによって促進することができる((2016), Trends Biotechnol. 34: 575-587)。さらなる実施形態では、Cas9は、Rondaらにより例示されている、Multiplex Automated Genome Engineering(MAGE)と組み合わせることができる((2016), Sci. Rep. 6: 19452.)。
【0135】
初めから終わりまで、本発明のCasタンパク質の基準配列は、アミノ酸配列をコードするヌクレオチド配列として定義することができる。例えば、配列番号2から6に定義されるモチーフのアミノ酸配列は、そのアミノ酸配列をコードするすべての核酸配列も含む。
【0136】
したがって、本発明は、
a.アミノ酸モチーフEKDGKYYC[配列番号2];および/または
b.アミノ酸モチーフX1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);および/または
c.アミノ酸モチーフX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);および/または
d.アミノ酸モチーフX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである);および/または
e.アミノ酸モチーフX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)
を含むCasタンパク質であって、
少なくとも1つのターゲティングRNA分子、およびターゲティングRNA分子により認識される標的核酸配列を含むポリヌクレオチドと会合すると50℃と100℃の間でDNAを結合、切断、標識または改変することができるCasタンパク質をコードする単離された核酸分子も提供する。任意選択で、Casタンパク質は、ヒト細胞において前記切断、標識または改変が可能である。任意選択で、前記ヒト細胞は胚性幹細胞ではない。任意選択で、前記結合、切断、標識または改変はヒトの生殖細胞系遺伝的同一性を改変しない。
【0137】
別の態様では、本発明は、配列番号1のアミノ酸配列またはそれと少なくとも77%の同一性の配列を有するCas(CRISPR(clustered regularly interspaced short palindromic repeat)associated)タンパク質をコードする単離された核酸分子も提供する。
【0138】
別の態様では、本発明は、翻訳されるとCasタンパク質に融合するペプチドをコードする少なくとも1つの核酸配列をさらに含む、単離された核酸分子も提供する。
【0139】
別の態様では、本発明は、Casタンパク質をコードする核酸分子に融合する少なくとも1つの核酸配列が、ヘリカーゼ、ヌクレアーゼ、ヘリカーゼ-ヌクレアーゼ、DNAメチラーゼ、ヒストンメチラーゼ、アセチラーゼ、ホスファターゼ、キナーゼ、転写(共)活性化因子、転写リプレッサー、DNA結合タンパク質、DNA構築タンパク質、マーカータンパク質、レポータータンパク質、蛍光タンパク質、リガンド結合タンパク質、シグナルペプチド、細胞内局在配列、抗体エピトープまたは親和性精製タグから選択されるタンパク質をコードする、単離された核酸分子も提供する。
【0140】
ThermoCas9ヌクレアーゼ活性:二価陽イオン
以前に特徴付けられた、中温性Cas9エンドヌクレアーゼは、標的DNAにおいて、二価陽イオンを使用して、DSBの生成を触媒する。発明者らは、以下の二価陽イオンMg2+、Ca2+、Mn2+、Co2+、Ni2+、およびCu2+のいずれかの存在下で、ThermoCas9は、dsDNA切断を媒介することができることを示した。
【0141】
ThermoCas9ヌクレアーゼ活性:基質
発明者らはまた、あるIIC型系は、効率的な一本鎖DNAカッターとなることが報告されているにもかかわらず(Ma, et al., Mol. Cell 60, 398-407(2015);Zhang, et al., Mol. Cell 60, 242-255(2015))、ThermoCas9は、ssDNAを直接切断することができないことを驚くべきことに示した。ThermoCas9のヌクレアーゼ活性は、dsDNA基質に限定される。
【0142】
発現ベクター
本発明の核酸は単離されていてもよい。しかし、核酸感知構築物の発現が選ばれた細胞で実行されうるように、Casタンパク質またはリボ核タンパク質をコードするポリヌクレオチド配列は、好ましくは、発現構築物中に提供されている。いくつかの実施形態では、Casタンパク質またはリボ核タンパク質をコードするポリヌクレオチドは、適切な発現ベクターの一部として提供されることになる。ある特定の実施形態では、本発明の発現ベクター(発現するとCasタンパク質に融合するアミノ酸残基をコードするヌクレオチド配列ありまたはなしで)は、上文に定義されているターゲティングRNA分子をコードするヌクレオチド配列をさらに含んでいてもよい。したがって、そのような発現ベクターを適切な宿主で使用して、所望のヌクレオチド配列を標的にすることが可能な本発明のリボ核タンパク質複合体を産生することができる。代わりに、上文に定義されるターゲティングRNA分子をコードするヌクレオチド配列は別の発現ベクターで提供してもよく、または代わりに他の手段によって標的細胞に送達してもよい。
【0143】
適切な発現ベクターは受容細胞に応じて変化することになり、適宜、標的細胞での発現を可能にし、好ましくは高レベルの発現を促進する調節エレメントを組み込んでもよい。そのような調節配列は、例えば、開始、正確さ、速度、安定性、下流プロセシングおよび可動性の点で遺伝子または遺伝子産物の転写または翻訳に影響を与えることができてもよい。
【0144】
そのようなエレメントは、例えば、強力なおよび/または構成プロモーター、5’および3’UTR、転写および/または翻訳エンハンサー、転写因子またはタンパク質結合配列、開始部位および終結配列、リボソーム結合部位、組換え部位、ポリアデニル化配列、センスまたはアンチセンス配列、転写の正確な開始を確実にする配列ならびに任意選択で、宿主細胞における転写の終結および転写物安定化を確実にするポリAシグナルを含んでいてもよい。調節配列は、植物、動物、細菌、真菌またはウイルス由来でもよい。適切な調節エレメントが目的の宿主細胞に応じて変化することになるのは明らかである。ヒト宿主細胞で高レベルの発現を促進する調節エレメントは、酵母ではAOX1またはGAL1プロモーターあるいはヒト細胞ではCMVもしくはSV40プロモーター、CMVエンハンサー、SV40エンハンサー、単純ヘルペスウイルス(Herpes simplex virus)VIP16転写活性化因子またはグロビンイントロンの包含を含んでいてもよい。
【0145】
適切な調節エレメントは構成的であってよく、この調節エレメントは大半の環境条件または発生段階、特異的もしくは誘導性の発生段階下で発現を指示する。好ましくは、プロモーターは誘導性であり、温度、光、化学物質、乾燥、および他の刺激などの環境的、化学的または発生的合図に応答して発現を指示する。適宜、特定の発生段階であるいは細胞外もしくは細胞内状態、シグナル、または外部から与えられる刺激に応答して目的のタンパク質の発現を可能にするプロモーターを選んでもよい。例えば、大腸菌(E.coli)で使用するための、特定の成長段階で(例えば、osmY静止期プロモーター)または特定の刺激に応答して(例えば、HtpG熱ショックプロモーター)高レベルの発現を与える様々なプロモーターが存在する。
【0146】
適切な発現ベクターは、適切な宿主細胞においておよび/または特定の条件下で前記ベクターの選択を可能にする選択可能マーカーをコードする追加の配列を含んでいてもよい。
【0147】
本発明は、ヒト細胞中で標的核酸を改変する方法であって、細胞を上文に記載される発現ベクターのうちのいずれかでトランスフェクト、形質転換または形質導入することを含む方法も含む。トランスフェクション、形質転換または形質導入の方法は当業者には周知のタイプのものである。本発明のリボ核タンパク質複合体の発現を生み出すのに使用される1つの発現ベクターが存在する場合、およびターゲティングRNAが細胞に直接添加される場合、トランスフェクション、形質転換または形質導入の同じまたは異なる方法を使用してもよい。同様に、本発明のリボ核タンパク質複合体の発現を生み出すのに使用される1つの発現ベクターが存在する場合、および別の発現ベクターが発現を介してターゲティングRNAをin situで生み出すのに使用されている場合、トランスフェクション、形質転換または形質導入の同じまたは異なる方法を使用してもよい。
【0148】
他の実施形態では、Casタンパク質またはポリペプチドをコードするmRNAは、細胞中でCascade複合体が発現されるように細胞内に導入される。Casタンパク質複合体を所望の標的配列まで導くターゲティングRNAも、mRNAと同時でも、別々にでもまたは逐次でも、必要なリボ核タンパク質複合体が細胞中で形成されるように、細胞内に導入される。
【0149】
したがって、本発明は、標的核酸を改変する、すなわち、切断、タグ付け、改変、標識または結合する方法であって、核酸を上文で定義されるリボ核タンパク質複合体と接触させることを含む方法も提供する。任意選択で、前記核酸はヒト細胞に存在する。任意選択で、前記ヒト細胞は胚性幹細胞ではない。
【0150】
さらに、本発明は標的核酸を改変する方法であって、核酸を、上文で定義されるターゲティングRNA分子に加えて、上文で定義されるCasタンパク質またはポリペプチドと接触させることを含む方法も含む。
【0151】
上記方法に従って、標的核酸の改変は、したがって、in vitroでおよび無細胞環境で実行することができる。無細胞環境では、標的核酸、Casタンパク質およびターゲティングRNA分子のそれぞれの添加は、同時でも、逐次でも(希望通りのいかなる順番でも)、または別々でもよい。したがって、標的核酸とターゲティングRNAが反応混合物に同時に添加され、次に、本発明のCasタンパク質またはポリペプチドが後の段階で別々に添加されることが可能である。
【0152】
同様に、標的核酸の改変は、単離された細胞であれ多細胞組織、器官または生物の一部としてであれ、in vivo、すなわち、ヒト細胞中in situで行うことができる。全組織および器官の文脈では、ならびに生物の文脈では、方法はin vivoで実行されるのが望ましい場合があり、または代わりに、全組織、器官もしくは生物からヒト細胞を単離し、方法に従って細胞をリボ核タンパク質複合体で処理し、それに続いてリボ核タンパク質複合体で処理された細胞を、同じ生物内であれ異なる生物内であれ、その前の位置に、もしくは異なる位置に戻すことにより実行してもよい。任意選択で、前記ヒト細胞は胚性幹細胞ではない。
【0153】
これらの実施形態では、リボ核タンパク質複合体またはCasタンパク質もしくはポリペプチドは、細胞内への適切な形態の送達を必要とする。そのような適切な送達系および方法は当業者には周知であり、細胞質または核マイクロインジェクションを含むがこれらに限定されない。好ましい送達様式では、アデノ随伴ウイルス(AAV)が使用され、この送達系はヒトでは病因性ではなく、欧州では臨床使用に承認されている。
【0154】
したがって、本発明は標的核酸を改変する方法であって、核酸を、
a.上文で定義されるリボ核タンパク質複合体、または
b.上文で定義されるタンパク質もしくはタンパク質複合体および上文で定義されるRNA分子
と接触させることを含む方法を提供する。
【0155】
さらなる態様では、本発明はヒト細胞中で標的核酸を改変する方法であって、細胞を上文で定義されるリボ核タンパク質複合体をコードするヌクレオチド配列を含む発現ベクターで形質転換、トランスフェクトもしくは形質導入すること、または代わりに細胞を上文で定義されるタンパク質もしくはタンパク質複合体をコードするヌクレオチド配列を含む発現ベクターおよび上文で定義されるターゲティングRNA分子をコードするヌクレオチド配列を含むさらなる発現ベクターで形質転換、トランスフェクトもしくは形質導入することを含む方法を提供する。任意選択で、前記標的核酸はヒト細胞中に存在し、前記ヒト細胞は胚性幹細胞ではない。
【0156】
さらなる態様では、本発明はヒト細胞中で標的核酸を改変する方法であって、細胞を上文で定義されるタンパク質もしくはタンパク質複合体をコードするヌクレオチド配列を含む発現ベクターで形質転換、トランスフェクトまたは形質導入し、次いで上文で定義されるターゲティングRNA分子を細胞内に送達することを含む方法を提供する。任意選択で、前記標的核酸はヒト細胞中に存在し、前記ヒト細胞は胚性幹細胞ではない。
【0157】
ガイド(すなわち、ターゲティング)RNA(gRNA)分子およびCasタンパク質またはポリペプチドが、リボ核タンパク質複合体の一部としてというよりむしろ別々に提供される実施形態では、gRNA分子は、Casタンパク質またはタンパク質複合体と同時であれ、別々にであれ、逐次であれ、ヒト細胞内への適切な形態の送達を必要とする。RNAを細胞内に導入するそのような形態は当業者には周知であり、従来のトランスフェクション法を介したin vitroまたはex vivo送達を含んでもよい。マイクロインジェクションおよび電気穿孔法、ならびにカルシウム共沈、ならびに市販のカチオンポリマーおよび脂質、ならびに細胞透過性ペプチド、細胞透過性(微粒子銃)粒子などの物理的方法をそれぞれ使用してもよい。例えば、ウイルス、特に好ましくはAAVを、例えば、本発明のCasタンパク質複合体または本発明のリボ核タンパク質複合体のウイルス粒子への(可逆的)融合を介して、細胞質にであれおよび/または核にであれ送達媒体として使用してもよい。
【0158】
別の態様では、本発明は標的核酸を改変する方法であって、少なくとも1つの機能的部分がマーカータンパク質またはレポータータンパク質であり、マーカータンパク質またはレポータータンパク質が標的核酸と会合し、好ましくは、マーカーが蛍光タンパク質、例えば、緑色蛍光タンパク質(GFP)である、方法を提供する。
【0159】
標的核酸を改変する上述の方法では、機能的部分はマーカーでもよく、マーカーは標的核酸と会合し、好ましくは、マーカーはタンパク質であり、任意選択で、蛍光タンパク質、例えば、緑色蛍光タンパク質(GFP)、黄色蛍光タンパク質(YFP)、赤色蛍光タンパク質(RFP)またはmCherryである。in vitroであれ、ex vivoであれ、またはin vivoであれ、本発明の方法を使用すれば、好ましくは、高次コイルのプラスミドもしくは染色体などの高次構造、またはmRNAなどの一本鎖標的核酸の形態で、核酸分子中の標的遺伝子座を直接可視化することが可能である。標的遺伝子座の直接可視化は電子顕微鏡写真、または蛍光顕微鏡法を使用してもよい。しかし、本発明の方法の文脈では、有機色素分子、放射性標識および小分子でもよいスピン標識を含む、他の種類の標識をマーカーとして使用してもよいことは認識される。
【0160】
標的核酸がdsDNAである標的核酸を改変するための本発明の方法では、機能的部分はヌクレアーゼでもヘリカーゼ-ヌクレアーゼでもよく、改変は好ましくは所望の遺伝子座での一本鎖または二本鎖切断である。この方法で、DNAの独特な配列特異的切断は、リボ核タンパク質複合体に融合している適切な機能的部分を使用することにより操作することが可能である。最終的なリボ核タンパク質複合体のRNA成分の選ばれた配列は、機能的部分の作用に対する所望の配列特異性を提供する。
【0161】
したがって、本発明は、dsDNA分子からヌクレオチド配列の少なくとも一部を取り除くための、任意選択で遺伝子(単数または複数)の機能をノックアウトするための、ヒト細胞中の所望の遺伝子座でのdsDNA分子の非相同末端結合の方法であって、上文に記載される標的核酸を改変する方法のうちのいずれかを使用して二本鎖切断を作ることを含む方法も提供する。任意選択で、前記方法はヒト細胞において行われ、前記ヒト細胞は胚性幹細胞ではない。
【0162】
本発明は、既存のヌクレオチド配列を改変する、または所望のヌクレオチド配列を挿入するために、ヒト細胞中の所望の遺伝子座でdsDNA分子内に核酸を相同組換えする方法であって、上文に記載される標的核酸を改変する方法のうちのいずれかを使用して所望の遺伝子座で二本鎖切断を作ることを含む方法をさらに提供する。任意選択で、前記方法はヒト細胞において行われ、前記ヒト細胞は胚性幹細胞ではない。
【0163】
したがって、本発明はまた、生物における遺伝子発現を改変する方法であって、以上に記載の方法のいずれかによる標的核酸配列を改変するステップを含み、核酸がdsDNAであり、機能的部分がDNA修飾酵素(例えば、メチラーゼまたはアセチラーゼ)、転写活性化因子または転写リプレッサーから選択され、前記生物がヒトである、方法を提供する。
【0164】
本発明は、上文に記載される方法のうちのいずれかに従って標的核酸配列を改変することを含む、生物中で遺伝子発現を改変する方法であって、核酸がmRNAであり、機能的部分はリボヌクレアーゼであり、任意選択でエンドヌクレオアーゼ、3’エキソヌクレアーゼまたは5’エキソヌクレアーゼから選択され、前記生物がヒトである、方法をさらに提供する。
【0165】
標的核酸はDNA、RNAまたは合成核酸でもよい。好ましくは、標的核酸はDNA、好ましくはdsDNAである。
【0166】
しかし、標的核酸はRNA、好ましくはmRNAでも可能である。代わりに、したがって、本発明は、標的核酸を改変する方法であって、標的核酸がRNAである、方法も提供する。
【0167】
別の態様では、本発明は、ヒト細胞における標的核酸を改変する方法であって、核酸がdsDNAであり、少なくとも1つの機能的部分がヌクレアーゼまたはヘリカーゼ-ヌクレアーゼであり、改変が所望の遺伝子座での一本鎖または二本鎖切断である、方法を提供する。任意選択で、前記ヒト細胞は胚性幹細胞ではない。任意選択で、前記方法はヒトの生殖細胞系遺伝的同一性を改変しない。
【0168】
別の態様では、本発明は、ヒト細胞における標的核酸を改変する方法であって、改変が、所望の遺伝子座における遺伝子発現のサイレンシングをもたらし、本方法は、
a.dsDNA分子中で二本鎖切断を行うステップ、および
b.非相同性末端結合(NHEJ)による細胞中のdsDNA分子を修復するステップ
を含み、任意選択で前記ヒト細胞は胚性幹細胞ではない、方法を提供する。任意選択で、前記方法は、ヒトの生殖細胞系遺伝的同一性を改変しない。
【0169】
別の態様では、本発明は、ヒト細胞における標的核酸を改変する方法であって、存在するヌクレオチド配列が改変されるかもしくは欠失される、かつ/または所望のヌクレオチド配列が所望の位置に挿入されており、本方法が、
a.所望の遺伝子座において二本鎖切断を行うステップ、および
b.相同組換えによる細胞中のdsDNA分子を修復するステップ
を含み、任意選択で前記ヒト細胞が胚性幹細胞ではない、方法を提供する。任意選択で、前記方法は、ヒトの生殖細胞系遺伝的同一性を改変しない。
【0170】
別の態様では、本発明は、ヒト細胞における遺伝子発現を改変する方法であって、以上に記載の標的核酸配列を改変するステップを含み、核酸がdsDNAであり、機能的部分が、DNA修飾酵素(例えば、メチラーゼまたはアセチラーゼ)、転写活性化因子または転写リプレッサーから選択され、任意選択で前記ヒト細胞が胚性幹細胞ではない、方法を提供する。任意選択で、前記方法は、ヒトの生殖細胞系遺伝的同一性を改変しない。
【0171】
別の態様では、本発明は、ヒト細胞における遺伝子発現を改変する方法であって、以上に記載の標的核酸配列を改変するステップを含み、核酸がmDNAであり、機能的部分がリボヌクレアーゼであり、任意選択で、エンドヌクレアーゼ、3’エクソヌクレアーゼまたは5’エクソヌクレアーゼから選択され、任意選択で前記ヒト細胞が胚性幹細胞ではない、方法を提供する。任意選択で、前記方法は、ヒトの生殖細胞系遺伝的同一性を改変しない。
【0172】
別の態様では、本発明は上文に記載の標的核酸を改変する方法であって、45℃と100℃の間の温度で実行される方法を提供する。好ましくは、方法は50℃でまたはそれよりも高い温度で実行される。より好ましくは、方法は55℃と80℃の間の温度で実行される。最適には、方法は60℃と65℃の間の温度で実行される。代替的に、本方法は、20℃と45℃の間の温度で行うことができる。より好ましくは、30℃と45℃の間の温度である。さらにより好ましくは、37℃および45℃の間の温度であり、任意選択で、標的核酸はヒト細胞中に存在する。任意選択で、前記ヒト細胞は胚性幹細胞ではない。任意選択で、前記方法は、ヒトの生殖細胞系遺伝的同一性を改変しない。
【0173】
以上に記載の標的核酸を改変する方法のいずれかにおいて、細胞は、ヒト細胞とすることができる。任意選択で、以上に記載の標的核酸を改変する方法のいずれかにおいて、前記ヒト細胞は、胚性幹細胞でなくてもよい。任意選択で、前記方法は、ヒトの生殖細胞系遺伝的同一性を改変しない。
【0174】
宿主細胞
有利には、本明細書に記載されている方法は、幅広い応用性があり、本発明の宿主細胞は、培養することができる任意のヒト細胞から誘導することができる。したがって、本発明は、以上に記載の方法により、形質転換されたヒト細胞を提供する。本発明は、二本鎖標的ポリヌクレオチドにおける標的核酸配列を有する形質転換ヒト細胞を提供し、前記細胞は、本明細書で提供されるCasタンパク質またはポリペプチド、および本明細書で提供される少なくとも1つのターゲティングRNA分子を含み、発現ベクターは、前記Casタンパク質および前記ターゲティングRNA分子のうちの少なくとも1つをコードする核酸を含む。任意選択で、前記ヒト細胞は、胚性幹細胞でなくてもよい。
【0175】
遺伝子学的に利用可能なヒト細胞を含む、一般に使用される宿主細胞であって、例えばヒト細胞(胚性幹細胞ではない)を含めた、培養することができる宿主細胞を、本発明による使用のために選択することができる。本発明に従って使用するための好ましい宿主細胞は、一般に、典型的には高成長速度を示し、容易に培養されおよび/もしくは形質転換され、短い世代時間を示し、付随する確立した遺伝資源を有するもの、または特定の条件下で異種タンパク質の最適発現のために選択され、改変されもしくは合成された細胞である。目的のタンパク質が最終的には特定の工業的または治療的状況で使用されることになる本発明の好ましい実施形態では、適切な宿主細胞は、目的のタンパク質が配置されることになる所望の特定の条件または細胞状況に基づいて選択してもよい。好ましくは、宿主細胞はヒト細胞になる。
【0176】
本明細書に記載される本発明の方法および使用は、ヒト細胞のゲノムを改変するために使用することができる。
【0177】
本発明は、今や特定の実施形態に関連しておよび添付図に関連して詳細に説明されることになる。
【図面の簡単な説明】
【0178】
【
図1】Cas9タンパク質配列の近隣結合樹を示す図である。pBLASTまたはPSI-BLASTに基づいて菌株T12と40%を超える配列類似性を有するすべての配列、ならびに現在十分に特徴付けられている配列(化膿性連鎖球菌(S. pyogenes)、ストレプトコッカス・サーモフィルス(S. thermophiles)およびアクチノマイセス・ネスランディ(A. naeslundii))、ならびに、これらの配列が40%より低い同一性であった場合、現在同定されている好熱性配列も含まれた。すべての好熱性配列では、T12に対するパーセント同一性は菌株名の後に示される。遺伝子識別子(gi)番号は種名の前に示される。説明文:閉環:好熱性(最適60℃より高い)Cas9配列、閉四角:熱耐性(最適<50℃)Cas9配列、開三角:中温性起源由来のゲノム編集目的で現在最も使用されているCas9配列;符号なし:中温性Cas9。結節点の値は1000レプリケートブートストラップ値を表し;スケールバーは部位当たりの推定アミノ酸置換を表す。
【
図2】Cas9遺伝子配列の近隣結合樹を示す図である。遺伝子レベルでの同一性は極端に乏しかった;タンパク質整列のために使用された生物と同じ生物由来の配列を遺伝子整列のために使用した。遺伝子識別子(gi)番号は種名の前に示されている。説明文:閉環:好熱性(最適60℃より高い)Cas9配列、閉四角:熱耐性(最適<50℃)Cas9配列、開三角:中温性起源由来のゲノム編集目的で現在最も使用されているCas9配列;符号なし:中温性Cas9。結節点の値は1000レプリケートブートストラップ値を表す。
【
図3-1】gtCas9(配列番号1)(II-C型)と十分に特徴付けられているII-C型(アクチノマイセス・ネスランディ(A. naeslundii)|「ana」;配列番号8)およびII-A型(化膿性連鎖球菌(S. pyogenes)|「pyo」;配列番号9およびストレプトコッカス・サーモフィルス(S. thermophilus))Cas9配列とのタンパク質配列整列を示す図である。重要な活性部位残基はよく保存されており、黒色矢印で示されている。Ana-Cas9およびPyo-Cas9について記載されているタンパク質ドメイン(Jinek, et al., 2014, Science 343: 1247997)は斜線囲みおよび類似の色付き文字で示されている。PAM認識ドメインは、化膿性連鎖球菌(S. pyogenes)II-A型系では決定されているが、いかなるII-C型系についても決定されておらず、したがって、化膿性連鎖球菌(S. pyogenes)配列でのみ示されている。
【
図3-2】gtCas9(配列番号1)(II-C型)と十分に特徴付けられているII-C型(アクチノマイセス・ネスランディ(A. naeslundii)|「ana」;配列番号8)およびII-A型(化膿性連鎖球菌(S. pyogenes)|「pyo」;配列番号9およびストレプトコッカス・サーモフィルス(S. thermophilus))Cas9配列とのタンパク質配列整列を示す図である。重要な活性部位残基はよく保存されており、黒色矢印で示されている。Ana-Cas9およびPyo-Cas9について記載されているタンパク質ドメイン(Jinek, et al., 2014, Science 343: 1247997)は斜線囲みおよび類似の色付き文字で示されている。PAM認識ドメインは、化膿性連鎖球菌(S. pyogenes)II-A型系では決定されているが、いかなるII-C型系についても決定されておらず、したがって、化膿性連鎖球菌(S. pyogenes)配列でのみ示されている。
【
図4】アクチノマイセス・ネスランディ(A. naeslundii)Cas9(Cas9-Ana)のタンパク質構成を示す図である(Jinek et al., 2014)。gtCas9は同じII-C型CRISPR系に属し、活性部位残基を同定することができた。
【
図5】相補的dsDNAのcrRNAガイドターゲティングの比較を示す図である。塩基対合は破線で示されている。RNAは黒色で、DNAは灰色で描かれている。crRNAスペーサーと標的プロトスペーサー間の塩基対合は太い黒色破線で示され、DNA鎖間およびRNA鎖間の塩基対合は太い灰色破線で示されている。crRNAの5’末端が示されている。I型中のPAM(小さい白色囲み)は標的鎖(プロトスペーサー)の下流に存在し、II型ではPAMは置き換えられた鎖のもう一方の末端に存在することに注目されたい。同様に、シード(標的DNA鎖との塩基対合が始まり、ミスマッチが許されないガイドの予想配列)はPAMの近くに位置しており、したがって、I型とII型で異なる(Van der Oost, 2014 ibid.)。パネルAは大腸菌(E. coli)のI型Cascade系の模式図を示している。crRNAは、内部スペーサー(灰色囲み、標的認識を可能にする31~32ヌクレオチド)を有し、8ヌクレオチド5’ハンドルおよびステムループ構造(ヘアピン)からなる29ヌクレオチド3’ハンドルで隣接している(Jore 2011 ibid.)。パネルBは化膿性連鎖球菌(S. pyogenes)のII型Cas9系の模式図を示している。crRNAはtracrRNAと塩基対合し、リボヌクレアーゼIIIによるプロセシングを可能にする(向かい合った黒色三角)。さらに、crRNAの5’末端はリボヌクレアーゼにより刈り込まれ(黒色三角)、典型的には20ヌクレオチドスペーサーを生じる。合成ループを導入してcrRNAとtracrRNAを連結し、単一ガイドRNA(sgRNA)を生じてもよいことに注目されたい(Jinek et al., 2012 ibid.)。
【
図6】G・サーモデニトリフィカンス(G. thermodenitrificans)T12型IIc CRISPR系の配列のアライメントを示す図である。
【
図7-1】gtCas9のin silicoでの、PAM予測をもたらすために得た6つの単一ヒットを示す図である。
【
図7-2】gtCas9のin silicoでの、PAM予測をもたらすために得た6つの単一ヒットを示す図である。
【
図8】
図7に例示したアライメントの結果を組み合わせたweblogoを示す図である。このweblogoは、weblogo.berkeley.eduを使用して生成した。
【
図9】精製済みgtCas9による、プラスミドを標的とした、60℃でのin vitro切断アッセイの結果を示すグラフである。このプラスミドは、PAM配列の8ヌクレオチド長の特異的配列変異体を含んだ。
【
図10】CCCCCCAA[配列番号11]PAM配列を含む標的プラスミドを使用する、gtCas9濃度の効果を検討するためのin vitroアッセイの結果を示すグラフである。
【
図11】ある範囲の温度にわたる、CCCCCCAA[配列番号11]PAM配列を含む標的プラスミドを使用する、in vitroアッセイの結果を示すグラフである。
【
図12】実施例9に説明した通り、選択プレート上のバチルス・スミシイ(Bacillus smithii)ET138細胞のコロニーの成長または不在により、gtCas9および8nt PAM配列を使用するバチルス・スミシイ(Bacillus smithii)ET138細胞のin vivoゲノム編集の結果を示すグラフである。コロニーは、
図12中に矢印で示している。
【
図13】pyrF遺伝子を除外する、コロニーのPCRスクリーニングの結果を示すグラフである。このコロニーは、構築物3(ネガティブ対照)による、バチルス・スミシイ(Bacillus smithii)ET138細胞の変換後に生成した。15のコロニーをスクリーニングしたが、実施例9に説明されている通り、欠失遺伝子型-2.1kbのバンドサイズを示すものはなく、代わりにすべてが、野生型-2.9kbのバンドサイズを示した。
【
図14】pyrF遺伝子が欠失された、コロニーのPCRスクリーニングの結果を示すグラフである。このコロニーは、構築物1(PAM配列ATCCCCAA[配列番号21])による、バチルス・スミシイ(Bacillus smithii)ET138細胞の変換後に生成した。20のコロニーをスクリーニングし、実施例9に説明されている通り、1つが、欠失遺伝子型-2.1kbのバンドサイズを示した一方、残りは、野生型-2.9kbのバンドサイズと欠失遺伝子型-2.1kbのバンドサイズの両方を示した。野生型のみの遺伝子型は観察されなかった。
【
図15】ゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)T12 IIC型CRISPR-Cas遺伝子座は、熱安定性Cas9ホモログであるThermoCas9をコードする図である。 (A)ThermoCas9をコードするゲノム遺伝子座の概略図。赤色で強調した予測活性部位残基を含む配列比較に基づく、ThermoCas9のドメインアーキテクチャ。Phyre2を使用して生成した、ThermoCas9の相同性モデル(Kelley et al. Nat. Protoc. 10, 845-858(2015))が、ドメインに対して様々な色を付けて示されている。 (B) ThermoCas9と高度に同一のCas9オルソログの進化系統樹。進化的解析は、MEGA7において行った(Kumar et al. Mol. Biol. Evol. 33, 1870-1874(2016))。 (C) 金属-アフィニティークロマトグラフィーおよびゲルろ過による精製後のThermoCas9のSDS-PAGE。得られた単一バンドの移動は、アポ-ThermoCas9の126kDという理論分子量に一致する。
【
図16-1】ThermoCas9 PAM解析を示す図である。 (A) プロトスペーサー隣接モチーフ(PAM)の位置および同一性(5’-NNNNNNN-3’)を発見するためのin vitro 切断アッセイの例示概略図である。黒色三角は、切断位を示す。 (B)標的ライブラリーのThermoCas9に基づく切断の比較解析によって得られた、ThermoCas9のコンセンサス7nt長のPAMの配列ロゴである。各位置の文字の高さは、情報内容により測定される。 (C) in vitro切断アッセイにより8位とPAM同一性の伸長その各々が、個別の5’-CCCCCCAN-3’PAMを含有する、4つの線形プラスミド標的を、55℃で1時間、ThermoCas9およびsgRNAと共にインキュベートし、次に、アガロースゲル電気泳動により解析した。 (D)30℃および55℃において、様々なPAMを有するDNA標的に対するin vitro切断アッセイである。その各々が、1つの個別の5’-CCCCCNNA-3’[配列番号13]PAMを含有する、16の線形プラスミド標的を、ThermoCas9およびsgRNAと共にインキュベートし、次に、アガロースゲル電気泳動によって、切断効率を解析した。
図21も参照されたい。
【
図16-2】ThermoCas9 PAM解析を示す図である。 (A) プロトスペーサー隣接モチーフ(PAM)の位置および同一性(5’-NNNNNNN-3’)を発見するためのin vitro 切断アッセイの例示概略図である。黒色三角は、切断位を示す。 (B)標的ライブラリーのThermoCas9に基づく切断の比較解析によって得られた、ThermoCas9のコンセンサス7nt長のPAMの配列ロゴである。各位置の文字の高さは、情報内容により測定される。 (C) in vitro切断アッセイにより8位とPAM同一性の伸長その各々が、個別の5’-CCCCCCAN-3’PAMを含有する、4つの線形プラスミド標的を、55℃で1時間、ThermoCas9およびsgRNAと共にインキュベートし、次に、アガロースゲル電気泳動により解析した。 (D)30℃および55℃において、様々なPAMを有するDNA標的に対するin vitro切断アッセイである。その各々が、1つの個別の5’-CCCCCNNA-3’[配列番号13]PAMを含有する、16の線形プラスミド標的を、ThermoCas9およびsgRNAと共にインキュベートし、次に、アガロースゲル電気泳動によって、切断効率を解析した。
図21も参照されたい。
【
図17-1】ThermoCas9は、幅広い温度範囲で活性であり、sgRNAに結合するとその熱安定性が増大することを示す図である。 (A)sgRNAの概略図、および標的DNAのマッチング。標的DNAは、黒色輪郭により長方形として示されており、PAMは、黒色の輪郭により横方向の楕円で暗グレー色として示されている。crRNAは、黒色輪郭で暗グレー色の長方形として示されており、crRNAの3’末端がtracrRNAの5’末端と連結している部分は、黒色の縦方向の楕円として示されている。白色の文字による黒色の四角、および黒色文字による明グレーの四角は、それぞれ、tracrRNAの3’側における3つおよび2つの予測ループを示している。crRNAの相補的である3’末端およびtracrRNAの5’末端により形成された、繰り返し/抗繰り返し領域の41ntトランケートは、明グレー色の縦方向長点線で示されている。第1のtracrRNAの予測3’位置は、黒色三角および黒色点線により印が付けられている。第2のtracrRNAループの予測3’位置は、白色三角および黒色点線により印が付けられている。第3のtracrRNAループの予測3’位置は、白色三角および白色点線により印が付けられている。 (B) tracrRNA足場の予測される3つのステムループの重要性は、sgRNAのトランケートした変異体を転写して、ガイドRNAThermoCas9が様々な温度で標的DNAを切断する能力を評価することにより試験した。少なくとも2つの生物学的繰り返しの平均値が示されており、エラーバーは、S.D.を表す。 (C) 最大温度を特定するため、ThermoCas9:sgRNA RNP複合体のエンドヌクレアーゼ活性を60℃、65℃および70℃で5分間または10分間、インキュベートした後にアッセイした。予め加熱したDNA基質を加え、この反応物を、対応する温度で1時間、インキュベートした。 (D)指示温度で5分間、インキュベートした後に行った活性アッセイにより、ThermoCas9およびSpCas9の活性温度範囲の比較。予め加熱したDNA基質を加え、この反応物を、同一温度で1時間、インキュベートした。
【
図17-2】ThermoCas9は、幅広い温度範囲で活性であり、sgRNAに結合するとその熱安定性が増大することを示す図である。 (A)sgRNAの概略図、および標的DNAのマッチング。標的DNAは、黒色輪郭により長方形として示されており、PAMは、黒色の輪郭により横方向の楕円で暗グレー色として示されている。crRNAは、黒色輪郭で暗グレー色の長方形として示されており、crRNAの3’末端がtracrRNAの5’末端と連結している部分は、黒色の縦方向の楕円として示されている。白色の文字による黒色の四角、および黒色文字による明グレーの四角は、それぞれ、tracrRNAの3’側における3つおよび2つの予測ループを示している。crRNAの相補的である3’末端およびtracrRNAの5’末端により形成された、繰り返し/抗繰り返し領域の41ntトランケートは、明グレー色の縦方向長点線で示されている。第1のtracrRNAの予測3’位置は、黒色三角および黒色点線により印が付けられている。第2のtracrRNAループの予測3’位置は、白色三角および黒色点線により印が付けられている。第3のtracrRNAループの予測3’位置は、白色三角および白色点線により印が付けられている。 (B) tracrRNA足場の予測される3つのステムループの重要性は、sgRNAのトランケートした変異体を転写して、ガイドRNAThermoCas9が様々な温度で標的DNAを切断する能力を評価することにより試験した。少なくとも2つの生物学的繰り返しの平均値が示されており、エラーバーは、S.D.を表す。 (C) 最大温度を特定するため、ThermoCas9:sgRNA RNP複合体のエンドヌクレアーゼ活性を60℃、65℃および70℃で5分間または10分間、インキュベートした後にアッセイした。予め加熱したDNA基質を加え、この反応物を、対応する温度で1時間、インキュベートした。 (D)指示温度で5分間、インキュベートした後に行った活性アッセイにより、ThermoCas9およびSpCas9の活性温度範囲の比較。予め加熱したDNA基質を加え、この反応物を、同一温度で1時間、インキュベートした。
【
図18-1】好熱菌における、ThermoCas9に基づくゲノム工学を示す図である。 (A) 基礎的な対象pThermoCas9_Δgene(goi)構築物の概略図である。pNW33n(B.スミシイ(B. smithii))またはpEMG(P.プチダ(P. putida))ベクターのどちらか一方に、thermocas9遺伝子を導入した。相同組換え隣接部を、標的ゲノムにおいて、上流でthermocas9に導入し、この隣接部は、上流領域に1kb(B.スミシイ(B. smithii))または0.5kb(P.プチダ(P. putida))を、および下流領域に1kbまたは0.5kbの目的の遺伝子(goi)を包含した。sgRNA発現モジュールは、thermocas9遺伝子の下流に導入した。複製(ori)の起源、複製タンパク質(rep)、抗生物質耐性マーカー(AB)および可能な補助エレメント(AE)は、主鎖特異的であり、それらは、点線の輪郭で示されている。 (B)B.スミシイ(B. smithii)ET138のゲノムに由来する、ThermoCas9に基づくpyrF欠失過程からの10のコロニー上のゲノム特異的PCRから得られた生成物を示す、アガロースゲル電気泳動である。10のコロニーはすべて、ΔpyrF遺伝子型を含み、1つのコロニーは、野生型生成物を欠いた、クリーンなΔpyrF変異体であった。 (C)基礎pThermoCas9i_goi構築物の概略図である。触媒的に不活性なThermoCas9(Thermo-dCas9:D8A、H582A変異体)の発現を目的として、対応する変異を導入して、thermo-dcas9遺伝子を作製した。thermo-dcas9遺伝子は、pNW33nベクターに導入した。sgRNA発現モジュールは、thermo-dcas9の下流に導入した。 (D) Thermo-dCas9を使用したldhLサイレンシング実験からの生成、成長およびRT-qPCR結果のグラフ表示である。このグラフは、対照培養物と比較した、抑制培養物における、ラクテート生成、600nmにおける光学密度およびldhL転写率を示すグラフである。少なくとも2つの生物学的繰り返しからの平均値が示されており、エラーバーは、S.D.を表す。
【
図18-2】好熱菌における、ThermoCas9に基づくゲノム工学を示す図である。 (A) 基礎的な対象pThermoCas9_Δgene(goi)構築物の概略図である。pNW33n(B.スミシイ(B. smithii))またはpEMG(P.プチダ(P. putida))ベクターのどちらか一方に、thermocas9遺伝子を導入した。相同組換え隣接部を、標的ゲノムにおいて、上流でthermocas9に導入し、この隣接部は、上流領域に1kb(B.スミシイ(B. smithii))または0.5kb(P.プチダ(P. putida))を、および下流領域に1kbまたは0.5kbの目的の遺伝子(goi)を包含した。sgRNA発現モジュールは、thermocas9遺伝子の下流に導入した。複製(ori)の起源、複製タンパク質(rep)、抗生物質耐性マーカー(AB)および可能な補助エレメント(AE)は、主鎖特異的であり、それらは、点線の輪郭で示されている。 (B)B.スミシイ(B. smithii)ET138のゲノムに由来する、ThermoCas9に基づくpyrF欠失過程からの10のコロニー上のゲノム特異的PCRから得られた生成物を示す、アガロースゲル電気泳動である。10のコロニーはすべて、ΔpyrF遺伝子型を含み、1つのコロニーは、野生型生成物を欠いた、クリーンなΔpyrF変異体であった。 (C)基礎pThermoCas9i_goi構築物の概略図である。触媒的に不活性なThermoCas9(Thermo-dCas9:D8A、H582A変異体)の発現を目的として、対応する変異を導入して、thermo-dcas9遺伝子を作製した。thermo-dcas9遺伝子は、pNW33nベクターに導入した。sgRNA発現モジュールは、thermo-dcas9の下流に導入した。 (D) Thermo-dCas9を使用したldhLサイレンシング実験からの生成、成長およびRT-qPCR結果のグラフ表示である。このグラフは、対照培養物と比較した、抑制培養物における、ラクテート生成、600nmにおける光学密度およびldhL転写率を示すグラフである。少なくとも2つの生物学的繰り返しからの平均値が示されており、エラーバーは、S.D.を表す。
【
図19-1】II型A、BおよびC Cas9オルソログの多重配列整列を示す図である。化膿性連鎖球菌(Streptococcus pyogenes)(Sp)、ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)(St)、ウオリネラ・サクシノゲネス(Wolinella succinogenes)(Ws)、ネイッセリア・メニンギティデス(Neisseria meningitides)(Nm)、アクチノマイセス・ナエスルンディイ(Actinomyces naeslundii)(An)、およびゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)(Thermo)のCas9タンパク質配列を、デフォルト設定のMEGA7 2におけるClustalW1を使用して整列させた。ESPript3を使用して、可視化した。厳密に保存された残基は、グレーの背景上の白色の文字で示す。類似残基は、黒色輪郭により白色の縦方向の長方形に、黒色の文字で示す。ピラミッドは、すべての配列において、2つの保存されたヌクレアーゼドメインを示している。横方向の黒色矢印および渦は、それぞれ、SpCas9二次構造における、β鎖およびα-ヘリックスを示している(タンパク質データベース nr 4CMP4)。構造ドメインは、
図15Aと同様に、同じ色のスキームを使用して、SpCas9およびThermoCas9について示している。
【
図19-2】II型A、BおよびC Cas9オルソログの多重配列整列を示す図である。化膿性連鎖球菌(Streptococcus pyogenes)(Sp)、ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)(St)、ウオリネラ・サクシノゲネス(Wolinella succinogenes)(Ws)、ネイッセリア・メニンギティデス(Neisseria meningitides)(Nm)、アクチノマイセス・ナエスルンディイ(Actinomyces naeslundii)(An)、およびゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)(Thermo)のCas9タンパク質配列を、デフォルト設定のMEGA7 2におけるClustalW1を使用して整列させた。ESPript3を使用して、可視化した。厳密に保存された残基は、グレーの背景上の白色の文字で示す。類似残基は、黒色輪郭により白色の縦方向の長方形に、黒色の文字で示す。ピラミッドは、すべての配列において、2つの保存されたヌクレアーゼドメインを示している。横方向の黒色矢印および渦は、それぞれ、SpCas9二次構造における、β鎖およびα-ヘリックスを示している(タンパク質データベース nr 4CMP4)。構造ドメインは、
図15Aと同様に、同じ色のスキームを使用して、SpCas9およびThermoCas9について示している。
【
図20】in silico PAM決定結果を示す図である。パネル(A)は、CRISPRtarget6を使用して、ファージゲノムを用いて得られた2つのヒットを示している。パネル(B)は、in silico PAM解析により得られた、ThermoCas9の7nt長のコンセンサスPAMの配列ロゴを示している。各位置の文字の高さは、情報内容により測定される。
【
図21】ThermoCas9 PAM発見を示す図である。20℃、37℃、45℃および60℃における、様々なPAMを有するDNA標的のin vitro切断アッセイ。その各々が、1つの個別の5’-CCCCCNNA-3’[配列番号13]PAMを含有する、7(20℃)または16(37℃、45℃、60℃)の線形プラスミド標的を、ThermoCas9およびsgRNAと共にインキュベートし、次に、アガロースゲル電気泳動によって、解析した。
【
図22】1つのループを含有する、sgRNAを使用する幅広い温度範囲のThermoCas9の活性を示している。tracrRNA足場の予測される3つのステムループの重要性は、sgRNAのトランケートした変異体を転写して、ガイドRNAThermoCas9が様々な温度で標的DNAを切断する能力を評価することにより試験した。上には、様々な温度における、ThermoCas9の活性に及ぼす1つのループの影響を示す。少なくとも2つの生物学的繰り返しからの平均値が示されており、エラーバーは、S.D.を表す。
【
図23-1】ThermoCas9が、触媒として二価陽イオンを使用して、dsDNA標的化を媒介し、ssDNAを切断しないことを示す図である。パネル(A)は、EDTAおよび様々な金属イオンを含むThermoCas9によって、in vitroプラスミドDNA切断を示す。M=1kbのDNAラダー。パネル(B)は、ssDNA基質に及ぼすThermoCas9の活性を示す。M=10bpのDNAラダー。
【
図23-2】ThermoCas9が、触媒として二価陽イオンを使用して、dsDNA標的化を媒介し、ssDNAを切断しないことを示す図である。パネル(A)は、EDTAおよび様々な金属イオンを含むThermoCas9によって、in vitroプラスミドDNA切断を示す。M=1kbのDNAラダー。パネル(B)は、ssDNA基質に及ぼすThermoCas9の活性を示す。M=10bpのDNAラダー。
【
図24】ldhLサイレンシング実験に関するスペーサー選択を示す図である。ldhLサイレンシング過程の間の、スペーサー(sgRNA)-プロトスペーサーアニールの概略図である。選択したプロトスペーサーは、ldhL遺伝子の開始コドンの下流の非鋳型鎖および39ntに存在する。
【
図25】pEMG主鎖、シュードモナス・プチダ(Pseudomonas putida)pyrF隣接領域およびthermocas9遺伝子、およびシュードモナス・プチダ(Pseudomonas putida)pyrFターゲッティングsgRNAからなる、プラスミドpThermoCas9_ppΔpyrFのマップを示す図である。
【
図26】シュードモナス・プチダ(Pseudomonas putida)のゲノムに由来するThermoCas9に基づくpyrF欠失過程から得られたコロニーに関する、ゲノム特異的PCRから得られた生成物を示す、キャピラリーゲル電気泳動の結果を示す図である。1854bpのバンドおよび1112bpのバンドは、それぞれ、pyrFおよびΔpyrF遺伝子型に対応する。
【発明を実施するための形態】
【0179】
以下は、本発明に従って使用されるCasタンパク質のポリヌクレオチドおよびアミノ酸配列である。
【0180】
[配列番号1]ゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)T12 Cas9タンパク質アミノ酸配列
【0181】
【0182】
[配列番号7]ゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)T12 Cas9 DNA配列
【0183】
【0184】
【実施例】
【0185】
[実施例1]
ゲオバチルス・サーモデニトリフィカンス(G. thermodenitrificans)の単離
驚くべきことに、ゲオバチルス・サーモデニトリフィカンス(G. thermodenitrificans)は、嫌気性条件下でリグノセルロース基質を分解することができる好熱菌についての±500単離菌のライブラリーの探索中に発見された。当初、±500単離菌のライブラリーが確立され、これはセルロースおよびキシラン上での単離により数回の選択ラウンド後に、110単離菌にまで削減された。110単離菌のこのライブラリーはゲオバチルス(Geobacillus)単離菌のみからなり、ゲオバチルス・サーモデニトリフィカンス(G. thermodenitrificans)がライブラリーの79%を占めていた。
【0186】
単離されたゲオバチルス・サーモデニトリフィカンス(G. thermodenitrificans)菌株は「T12」と命名された。G・サーモデニトリフィカンス(G. thermodenitrificans)T12に由来するCas9タンパク質は、「gtCas9」と命名された。
【0187】
[実施例2]
ゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)でのCas9について必須のコンセンサス配列を定義する
以下のデータベース探索および整列が実施された。
pBLASTおよびnBLASTは社内BLASTサーバーで実施し、ゲオバチルス・サーモデニトリフィカンス(G. thermodenitrificans)T12のタンパク質または遺伝子配列を問い合わせ配列として使用した。このデータベースは2014年5月に最後にアップデートされ、したがって、最も最近に追加されたゲオバチルス(Geobacillus)ゲノムを含有していないが、通常のオンラインBLASTはT12配列の公開を防ぐために使用されなかった。BLAST中の40%を超えることが分かった配列同一性を
図1に含む。
【0188】
もっと最近の配列データを含めるために、ゲオバチルス(Geobacillus)MAS1(gtCas9に最も密接に関係している)の配列を使用してNCBIウェブサイト上でPSI-BLASTを実施した(Johnson et al., 2008 Nucleic Acids Res. 36(Web Server issue): W5-9)。2連続ラウンドのPSI-BLASTが実施され、そこでは以下の基準:第1のラウンドでは最小配列包括度96%、ならびに第2および第3のラウンドでは97%、最小同一性40%、種当たり1つの菌株のみを満たした配列のみが次のラウンドで使用された。
【0189】
PSI-BLASTから生じる配列、ならびに内部サーバーpBLAST由来のT12に対して40%よりも大きな同一性を有し、PSI-BLASTには現われなかった配列を、現在十分に特徴付けられている中温性配列と、および、これらの配列がもっと離れた関係にある場合には、現在同定されているすべての好熱性配列とも整列させ、それから近隣結合樹を構築した(
図1参照)。整列はClustalWを使用してMega6で実施し、この後近隣結合法を使用して樹を構築し、ブートストラップ解析は1000レプリケートを使用して実施した。
【0190】
問い合わせ配列としてゲオバチルス(Geobacillus)属種MAS1を使用してBLASTnを実施した場合、ゲオバチルス(Geobacillus)属種JF8 Cas9のみが88%の同一性で同定され、遺伝子レベルでは相同性が極めて少ないことを示していた。
図2はClustal整列Cas9遺伝子配列の近隣結合樹である。
【0191】
ゲオバチルス・サーモデニトリフィカンス(G. thermodenitrificans)T12、アクチノマイセス・ネスランディ(A. naeslundii)および化膿性連鎖球菌(S. pyogenes)のタンパク質配列は、デフォルト設定のBLOSUM62を使用してCloneManagerでその配列を整列させることによりタンパク質ドメイン相同性についてさらに解析した(
図3参照)。
【0192】
[実施例3]
CAS9の機能に不可欠であるコアアミノ酸モチーフおよび好熱性Cas9ヌクレアーゼの熱安定性を与えるコアアミノ酸モチーフを同定する
上記整列されたタンパク質配列のパーセント同一性は
図1に与えられている。gtCas9はII-C型に属している。II-C型系の最もよく研究され、最近結晶化された構造はアクチノマイセス・ネスランディ(Actinomyces naeslundii)由来である(Jinek et al., 2014, Science 343: 1247997)。このタンパク質配列はgtCas9に対して20%の同一性しか示していないが、高度に保存された残基を推定するのに使用することが可能である。2つの十分に特徴付けられているII-A型系(化膿性連鎖球菌(S. pyogenes)およびストレプトコッカス・サーモフィルス(S. thermophilus))も分析に含まれた(Jinek et al., 2014, Science 343: 1247997;Nishimasu et al., 2014, Cell 156: 935-949)。これら4つのタンパク質配列の整列は
図3に示されており、
図4はアクチノマイセス・ネスランディ(A. naeslundii)について決定されたタンパク質構成(「Ana-Cas9」)を示している(Jinek et al., 2014, Science 343: 1247997)。T12(gtCas9)およびアクチノマイセス・ネスランディ(Actinomyces naeslundii)由来のCas9の長さは極めて類似しており(アクチノマイセス・ネスランディ(A. naeslundii)1101アミノ酸、gtCas9 1082アミノ酸)、gtCas9は類似するタンパク質構成を有すると予想されるが、Cas9-Anaに対する全体の配列同一性が20%にすぎないために、これはまだ確定されていない。Jinek et al.(Jinek et al., 2014, Science 343: 1247997)により記載されているアクチノマイセス・ネスランディ(A. naeslundii)および化膿性連鎖球菌(S. pyogenes)由来のCas9中の活性部位残基はすべてgtCas9において同定することができた(
図3参照)。PAM結合ドメインは化膿性連鎖球菌(S. pyogenes)II-A型系については決定されているが、いかなるII-C型系についても決定されておらず、したがって、化膿性連鎖球菌(S. pyogenes)配列においてのみ示されている。さらに、PAM認識部位は、CRISPR系間だけでなく、同じ系を含有する種間でも大きく変化する。PAMに関するさらなる情報については、問題点4および将来計画を参照されたい。
【0193】
[実施例4]
ゲオバチルス・サーモデニトリフィカンス(G. thermodenitrificans)gtCas9のPAM配列の決定
原核生物CRISPR系が適応免疫系としてその宿主に役立ち(Jinek et al., 2012, Science 337: 816-821)、迅速で効果的な遺伝子工学のために使用することが可能であること(Mali et al., 2013, Nat Methods 10: 957-963)は確立されている。
【0194】
Cas9タンパク質はII型CRISPR系のための配列特異的ヌクレアーゼとして機能する(Makarova et al., 2011, Nat Rev Micro 9: 467-477)。小型crRNA分子は、繰り返し領域に連結している「スペーサー」(標的)からなり、CRISPR遺伝子座の転写およびプロセシング産物である。「スペーサー」は天然にはバクテリオファージのゲノムおよび可動遺伝要素に起源をもつが、遺伝子工学工程中に特定のヌクレオチド配列を標的にするように設計することも可能である(Bikard et al., 2013, Nucleic Acids Research 41: 7429-7437)。crRNA分子はそのDNA標的の同定のためのガイドとしてCas9により用いられる。スペーサー領域は、切断DNA領域の標的物、「プロトスペーサー」と同一である(Brouns et al., 2012, Science 337: 808-809)。PAM(プロトスペーサー隣接モチーフ)は、プロトスペーサーの隣にあり、Cas9による標的の認識に必要である(Jinek et al., 2012, Science 337: 816-821)。
【0195】
II型系に関する、in vitroまたはin vivoでのPAM決定検討を行うために、tracrRNA発現モジュールであるこの系のCRISPRアレイをin silicoで予測することが必要である。CRISPRアレイを、crRNAモジュールの特定に使用する。tracrRNA発現配列は、500bp窓隣接Cas9内、またはCas遺伝子とCRISPR遺伝子座との間のどちらかに位置する(Chylinski, K., et al. (2014) Classification and evolution of type II CRISPR-Cas systems. Nucleic Acids Res. 42, 6091-6105)。tracrRNAは、CRISPRアレイの直接繰り返しに対する相補性のレベルが高い、5’配列からなるはずであり、2つ以上のステムループ構造の予測構造、およびRho独立性転写停止シグナルが後に続く(Ran, F.A., et al. (2015) In vivo genome editing using Staphylococcus aureus Cas9. Nature 520, 186-191)。次に、キメラsgRNAモジュールを設計するために、crRNAおよびtracrRNA分子を使用することができる。sgRNAの5’末端は、トランケートされた20nt長のスペーサー、その後に、CRISPRアレイの16~20nt長のトランケートされた繰り返しからなる。この繰り返しの後に、対応するトランケートされた抗繰り返しおよびtracrRNAモジュールのステムループが続く。sgRNAの繰り返しおよび抗繰り返し部分は、GAAAリンカーにより一般に接続されている(Karvelis, T., et al. (2015) Rapid characterization of CRISPR-Cas9 protospacer adjacent motif sequence elements. Genome Biol. 16, 253)。
【0196】
G・サーモデニトリフィカンス(G.thermodenitrificans)T12型IIc CRISPR系のcas遺伝子(cas9、次いでcas1およびcas2の遺伝子が続く)は、T12染色体のアンチセンス鎖を使用して転写される。cas2遺伝子の後に、転写時に、多重ループを有するRNA構造を形成する、100bp長のDNA断片が続く。この構造は、明らかに、転写ターミネータとして働く。
【0197】
11の繰り返しおよび10のスペーサー配列を有するCRISPRアレイは、転写終止配列の上流に位置し、このアレイのリーダーは、このアレイの5’末端に位置する。tracrRNAに転写されるDNA遺伝子座は、cas9遺伝子の下流であることが予想される。CRISPRアレイから36bp長の繰り返しを含むcas9遺伝子の右側下流の325bp長の配列のアライメントにより、tracrRNA遺伝子座における36bp長の配列が、この繰り返しにほとんど同一であることが明らかになった(
図6に示されている)。この結果により、本発明者らは、tracrRNA遺伝子座の転写の方向は、CRISPRアレイの転写の方向とは反対となるはずであるという結論に至った。したがって、tracrRNAの5’末端は、crRNAの3’末端に相補的であり、Cas9二重RNA分子により必要とされるものの形成に至る。
【0198】
[実施例5]
無作為化されたPAMを有する標的生成
ゲオバチルス・サーモデニトリフィカンス(G. thermodenitrificans)T12菌株のCRISPR II遺伝子座由来の2つの異なるスペーサーを、鋳型としてゲオバチルス・サーモデニトリフィカンス(G. thermodenitrificans)T12ゲノムDNAを使用してPCRにより増幅させた。2対の縮重プライマーをそれぞれのスペーサーの増幅のために使用した。
【0199】
第1に、「プロトスペーサー」断片の上流に6つの無作為ヌクレオチドの導入を引き起こす対を使用し、無作為化されたPAM配列を有するプロトスペーサーのプールを作製した。
【0200】
第2に、「プロトスペーサー」断片の下流に6つの無作為ヌクレオチドの導入を引き起こす対を使用し、無作為化されたPAM配列を有するプロトスペーサーのプールを作製した。
【0201】
作製された断片はpNW33nベクターにライゲートされ、6ヌクレオチド長PAMそれぞれの考えられる4096の異なる組合せすべてを有する「プロトスペーサー」構築物の4プールを作製した。構築されたDNAはゲオバチルス・サーモデニトリフィカンス(G. thermodenitrificans)T12細胞の形質転換のために使用された。細胞はクロラムフェニコール選択上に蒔かれ、それぞれのプロトスペーサープールから2×106を超える細胞がプールされることになる。プラスミドDNAはプールから抽出され、標的領域はPCR増幅されることになり、その産物はディープシークエンシングのために送られた。最も少ないリードを有するPAMは活性であると見なされ、その工程はこれらのPAMを有するスペーサーを含有するpNW33n構築物のみを用いて繰り返されることになる。ゲオバチルス・サーモデニトリフィカンス(G. thermodenitrificans)T12の形質転換効率が減少していることはPAMの活性を立証することになる。
【0202】
[実施例6]
gtCas9のPAM配列のin vitro決定
pRham:cas9gtベクターの構築
cas9gt遺伝子は、BG6927およびBG6928プライマーを使用する、G・サーモデニトリフィカンス(G. thermodenitrificans)T12ゲノムからPCR増幅し、1つの混合物中のpRham C-His Kanベクター(Lucigen)と一緒にした。この混合物を、提示されているプロトコルに従い、E.cloniサーモコンピテント細胞を変換するために使用した。変換混合物からの100μlを、37℃で一晩、成長させるため、LB+50カナマイシンプレート上でプレート培養した。形成したE.cloni::pRham:cas9gt単一コロニー3の中から、無作為に選択し、50μg/mlのカナマイシンを含有する10mlのLB培地中に播種した。各培養物からの1mlに滅菌グリセロールを最大で20%(v/v)の最終濃度まで添加することにより、グリセロール保存溶液を培養物から分離した。グリセロール保存溶液を-80℃で保管した。各培養物からの残りの9mlを、「GeneJET Plasmid Miniprep Kit」(Thermoscientific)プロトコルに従い、プラスミド単離に使用した。このプラスミドをcas9gtの配列確認のために送り、これらのプラスミドの1つを、右側配列を含む遺伝子を含有していることを確認した。対応する培養物は、gtCas9の非相同性の発現および精製のためにさらに使用した。
【0203】
E.cloni::pRham:cas9gtベクターにおける、gtCas9の非相同性の発現
対応するグリセロール保存溶液を含む10mlのLB+50カナマイシンを接種した後に、E.cloni::pRham:cas9gt事前培養物を調製した。37℃および180rpmで一晩、成長させた後、LB+50カナマイシン培地の200mlを接種するため、事前培養物から2mlを使用した。E.cloni::pRham:cas9gt培養物を37℃、180rpmで、OD600が0.7になるまで、インキュベートした。次に、0.2%w/vの最終濃度まで、L-ラムノースを加えることにより、gtCas9発現を誘発させた。この発現を8時間、進行させ、この後に、培養物を4700rpm、4℃で10分間、遠心分離し、細胞を収穫した。培地を廃棄し、ペレット化した細胞を、-20℃で保管するか、または以下のプロトコルに従い、細胞不含抽出物(CFE)の調製に使用した。
1.20ml音波照射緩衝液(20mMのリン酸ナトリウム緩衝液(pH=7.5)、100mMのNaCl、5mM MgCl2、5%(v/v)グリセロール、1mMのDTT)中に上記のペレットを再懸濁させる。
2.超音波処理(30秒のパルスを8回、その間、氷上で20秒間、冷却)によって1mlの細胞を破壊する。
3.不溶部分を沈殿させるために、35000g、4℃で15分間、遠心分離する。
4.上澄み液を除き、4℃で、または氷上でこの上澄み液を保管する。
【0204】
gtCas9に対するsgRNAモジュールを標的とするPAMライブラリーの設計および構築
G・サーモデニトリフィカンス(G. thermodenitrificans)T12株(上の実施例4を参照されたい)のゲノムにおいて、tracrRNAを発現するDNAモジュールのin silico決定の後に、単一分子におけるCRISPR/Cas9系のcrRNAおよびtracrRNAモジュールを組み合わせる、単一ガイド(sg)RNA発現DNAモジュールを設計した。プラスミドライブラリーのプロトスペーサーに相補的であるように、sgRNAの5’末端におけるスペーサーを設計し、モジュールを、T7プロモーターの転写制御下で設定した。pT7_sgRNA DNAモジュールは、Baseclearにより合成して、pUC57ベクターに受け、pUC57:pT7_sgRNAベクターを形成させた。DH5αの有能な大腸菌(E. coli)細胞(NEB)をベクターで形質転換し、この変換混合物を、100μg/mlアンピシリンを含有するLB寒天プレート上でプレート培養した。このプレートを37℃で一晩、インキュベートした。形成した単一コロニーのうちの3つを、100μg/mlのアンピシリンを含有する10mlのLB培地に播種した。各培養物からの1mlに滅菌グリセロールを最大で20%(v/v)の最終濃度まで添加することにより、グリセロール保存溶液を培養物から分離した。グリセロール保存溶液を-80℃で保管した。各培養物からの残りの9mlを、「GeneJET Plasmid Miniprep Kit」(Thermoscientific)プロトコルに従い、プラスミド単離に使用した。単離したプラスミドを使用して、pT7_sgRNAモジュールの増幅用のPCR鋳型として使用した。218bp長のpT7_sgRNA DNAモジュール(その中で、第1の18bpがpT7に相当する)は、プライマーBG6574およびBG6575を使用して得た。完全PCR混合物を1.5%アガロースゲル上で泳動させた。所望のサイズを有するバンドを切り取り、「Zymoclean(商標)ゲルDNA回収キット」プロトコルに従い精製した。
【0205】
in vitro転写(IVT)は、「HiScribe(商標)T7 High Yield RNA Synthesis Kit」(NEB)を使用して行った。精製済みpT7_sgRNA DNAモジュールを鋳型として使用した。IVT混合物を等しい体積のRNAローディング色素(NEB)と混合し、二次構造を破壊するため、70℃で15分間、加熱した。熱処理したIVT混合物を、変性ウレア-PAGE上で泳動し、得られたポリアクリルアミドゲルを、染色目的のため、SYBR Gold(Invitrogen)を10μl含有する100mlの0.5×TBE緩衝液中で10分間、エンバプティズ(embaptise)した。所望のサイズ(200nt)のバンドを切り取り、以下のRNA精製プロトコルに従い、sgRNAを精製した:
1.外科用メスを用いてRNAゲル剤断片を裁断し、1mlのRNA溶出緩衝液を加え、室温で一晩、放置した。
2.330μLの一定分量分を、新しい1.5mlの管に分割する。
3.事前冷却(-20℃)した100%EtOHを3体積分(990μl)加える。
4.-20℃で、60分間、インキュベートする。
5.マイクロ遠心器中、室温で、20分間、13000rpmで遠心分離する。
6.EtOHを除去して、70%EtOH1mlによりペレットを洗浄する。
7.マイクロ遠心器中、室温で、5分間、13000rpmで遠心分離する。
8.990μlの上澄み液を除去する。
9.55℃で15~20分間、サーモミキサー中の残りのEtOHを蒸発させる。
10.20μlのMQ中にペレットを再懸濁し、-20℃で保管する。
【0206】
7nt長のPAMライブラリーの設計および構築、ならびにライブラリーの線形化
PAMライブラリーの設計および構築は、pNW33nベクターに基づいた。20bp長のプロトスペーサーを、長さ7の縮重ヌクレオチド配列により、その3’側で隣接しているベクターに導入した。縮重配列は、PAMとして働き、プロトスペーサーが、右PAMにより隣接すると、sgRNAを搭載したCas9により標的として認識されて切断され得る。PAMライブラリーは、以下のプロトコルによって調製した:
1.一本鎖DNAオリゴ1(BG6494)および2(BG6495)をアニールすることによりSpPAM二本鎖DNAインサートを調製する。
I.10μlの10×NE緩衝液2.1
II.1μlの50μMオリゴ1(約1.125μg)
III.1μlの50μMオリゴ2(約1.125μg)
IV.85μlのMQ
V.この混合物を94℃で5分間、インキュベートし、0.03℃/秒の速度で37℃まで冷却する。
2.1μlのKlenow 3’→5’エキソ-ポリメラーゼ(NEB)を加え、それぞれアニールしたオリゴ混合物、次に、10μMのdNTP2.5μlを加える。37℃で1時間、次に、75℃で20分間、インキュベートする。
3.アニール混合物46μlに2μlのHF-BamHIおよび2μlのBspHI制限酵素を加える。37℃で1時間、インキュベートする。この過程により、粘着末端を有するSpPAMbbインサートとなる。Zymo DNAクリーニングおよびコンセントレータキット(Zymo Research)を使用して、作製したインサートを清浄する。
4.HF-BamHIおよびBspHI(NEB)によりpNW33nを消化し、Zymo DNAクリーニングおよびコンセントレータキット(Zymo Research)を使用して、粘着端部を有する3.400bp長の線形pNW33nbb断片を精製する。
5.提示されているプロトコルに準拠し、NEB T4リガーゼを使用して、11ngのSPPAMbbインサートにより50ngのpNW33nBBをライゲートする。Zymo DNAクリーニングおよび コンセントレータキット(Zymo Research)を使用して、ライゲート混合物を精製する。
6.DH10bエレクトロコンピテント細胞(500ngのDNAを含む200μlの細胞)を形質転換する。SOC培地(800μlのSOC中に200μlの細胞)中に1時間、細胞を回収し、次に、回収した細胞を50mlのLB+12.5μg/mlクロラムフェニコールに接種する。37℃および180rpmで、培養物を一晩、インキュベートする。
7.JetStar 2.0maxiprepキット(GENOMED)を使用して、この培養物からプラスミドDNAを単離する。
8.単離したプラスミドを線形化するために提示されているプロトコルに準拠し、SapI(NEB)制限液を使用する。
【0207】
PAM決定反応の設計および実施
標的したプロトスペーサーの3’末端の右側PAM下流を含有する、PAMライブラリーメンバーへのdsDNA切断のgtCas9誘発性導入を行うために、以下の切断反応を設定した:
1.反応あたり、E.cloni::pRham:cas9gt CFEを2.5μg
2.sgRNAを30nMの最終濃度まで
3.反応あたり、線形化PAMライブラリーを200ng
4.切断緩衝液(100mMのリン酸ナトリウム緩衝液(pH=7.5)、500mMのNaCl、25mMのMgCl2、25%(v/v)グリセロール、5mMのDTT)を2μl
5.MQ水を最大20μlの最終体積まで
【0208】
この反応物を60℃で1時間、インキュベートし、6×ゲル搭載色素(NEB)4μlを加えた後に停止した。この反応混合物を、1%のアガロースゲルにロードした。ゲルに100Vで1時間15分の長さの電気泳動にかけ、次に、10μlのSYBR Gold 色素(ThermoFisher)を含有する0.5×TAE緩衝液100ml中で30分間、インキュベートした。青色光を用いてDNAバンドを可視化した後、首尾よく切断され、かつPAMを含有するDNA断片に対応するバンドをゲルから切り出し、提示されているプロトコルに準拠して、「Zymoclean(商標)ゲルDNA回収キット」を使用してゲルを精製した。
【0209】
配列決定するための、PAM含有gtCAs9切断DNA断片のタグ付け
Cas9誘発性DNA切断は、PAM配列に対して近位の、プロトスペーサーの第3と第4のヌクレオチドとの間に、通常、導入される。その結果、さらなるオンシークエンス(on sequence)およびPAM配列を決定するため、切断したDNA断片のPAM含有部分をPCR増幅することができる、一対のプライマーを設計することができない。この目的の場合、5つの工程を使用した:
工程1:TaqポリメラーゼによるAテーリング
Aテーリングは、Taqポリメラーゼを使用する、平滑二本鎖DnA分子の3’末端に鋳型化されていないアデニンを付加する過程である。
反応構成成分:
・gtCas9切断およびPAM含有DNA断片 - 200ng
・10×ThermoPol(登録商標)緩衝液(NEB) - 5μl
・1mM dATP - 10μl
・Taq DNAポリメラーゼ(NEB) - 0.2μl
・H2O-最大で50μlの最終反応体積
・インキュベート時間 - 20分間
・インキュベート温度 - 72℃
【0210】
工程2:配列決定アダプターの構築
2つの短い相補的ssDNAオリゴヌクレオチドをリン酸化し、アニールして、工程1からのDNA断片のPAM近位部に対する配列決定アダプターを形成させた。オリゴヌクレオチドのうちの1つは、Aテールド断片に対するアダプターのライゲートを容易にするため、その3’末端におけるさらなるチミンを有した。
アダプターオリゴヌクレオチドリン酸化(各オリゴの個々のリン酸化反応)
・100μMオリゴヌクレオチド保存溶液 - 2μL
・10×T4 DNAリガーゼ緩衝液(NEB) - 2μL
・滅菌MQ水 - 15μL
・T4ポリヌクレオチドキナーゼ(NEB) - 1μL
・インキュベート時間 - 60分間
・インキュベート温度 - 37℃
・T4 PNK不活性化 - 65℃で20分間
リン酸化オリゴヌクレオチドのアニール
・オリゴヌクレオチド1 - 対応するリン酸化混合物から5μL
・オリゴヌクレオチド1 - 対応するリン酸化混合物から5μL
・滅菌MQ水 - 90μL
・リン酸化オリゴを、95℃で3分間、インキュベートする。室温で約30分間から1時間、反応物をゆっくりと冷却する。
【0211】
工程3:配列決定アダプターによる、gtCas9切断した、Aテールド断片のライゲート
工程1および2の生成物は、以下のプロトコルに従い、ライゲートした。
・10×T4 DNAリガーゼ緩衝液 - 2μl
・生成物工程1 - 50ng
・生成物工程2 - 4ng
・T4 DNAリガーゼ - 1μl
・滅菌MQ水 - 20μlまで
・インキュベート時間 - 10分間
・インキュベート温度 - 20~25℃
・65℃で10分間、熱不活性化
【0212】
工程4:150ヌクレオチド長のPAM含有断片のPCR増幅
工程4のライゲート混合物からの5μlを、Q5 DNAポリメラーゼ(NEB)を使用して、PCR増幅の鋳型として使用した。工程2からのチミン伸長によるオリゴヌクレオチドを、フォワードプライマーとして使用し、PAM配列の下流の150ヌクレオチドをアニールするようリバースプライマーを設計した。
【0213】
非gtCas9処理PAMライブラリーDNAを鋳型として使用して、同一配列を増幅した。両方のPCR生成物をゲル精製し、Illumina HiSeq2500ペアド末端配列決定(Baseclear)に送った。
【0214】
候補PAM配列の配列決定結果および決定の解析
配列決定の結果を解析後、以下の頻度マトリックスを構築した。このマトリックスは、gtCas9により消化した、および消化されなかったライブラリーの各PAM位における、各ヌクレオチドの相対存在量を図示している。
【0215】
【0216】
これらの結果は、PAM5位におけるシトシンを標的とすることが明確に好ましいこと、および最初の4つのPAM位におけるシトシンを標的とすることが好ましいことを示している。
【0217】
[実施例7]
gtCas9のIn silico PAM予測
十分なプロトスペーサー配列が、ゲノムデータベースに利用可能である場合、PAMのIn silico予測が可能である。gtCas9 PAMのin silico予測は、GenBankなどのゲノムデータベースにおける配列と比較することにより、G・サーモデニトリフィカンス(G. thermodenitrificans)T12株のゲノムにおける、CRISPRアレイからのスペーサーのヒットを特定することから始まった。「CRISPRファインダー」(http://crispr.u-psud.fr/Server/)ツールを使用して、T12における候補CRISPR遺伝子座を特定した。次に、特定したCRISPR遺伝子座出力値を、選択データベースを検索し、プロトスペーサーとマッチする出力値をもたらす、「CRISPR標的」(http://bioanalysis.otago.ac.nz/CRISPRTarget/crispr_analysis.html)ツールにロードした。次に、これらのプロトスペーサー配列を、特有のヒットに関して、およびスペーサーに対する相補性に関してスクリーニングした。例えば、シード配列のミスマッチは、ポジティブヒットの不良である可能性が高いと見なし、さらなる解析から除外した。プロファージ配列および(統合)プラスミドに対する同一性を伴うヒットにより、得られたヒットは真のポジティブとなることが実証された。全体として、この過程により、6つの単一ヒットが生じた(
図7)。続いて、残りの特有のプロトスペーサーヒットの隣接領域(II型gtCasヌクレアーゼの場合、3’)をアラインし、WebLogo(http://weblogo.berkeley.edu/logo.cgi)を使用して、コンセンサス配列を比較した(Crooks GE, Hon G, Chandonia JM, Brenner SE WebLogo: A sequence logo generator, Genome Research, 14:1188-1190, (2004))ツール(
図8)。
【0218】
in silicoの結果を、in vitroでのPAMの同定実験結果と比較し(実施例6を参照されたい)、この場合、PAM配列の第5の残基をシトシンと同一であるとバイアスをかけた。
【0219】
[実施例8]
gtCas9の8ヌクレオチド長のPAM配列の決定
実施例8からのin silicoデータは、gtCas9が、8位にアデノシンが存在することがある程度好ましいことが示唆され、したがって、さらなるPAM決定実験を行い、この場合、PAM配列の8位も同様に試験した。これは、プロトスペーサーの3’末端における、5位と8位との間に伸長していることが見いだされた、中温ブレビバチルス・ラテロスポラス(Brevibacillus laterosporus)SSP360D4(Karvelisら、2015年)であるCas9PAM配列の特徴と一致する。
【0220】
PAMの特異的な長さ8のヌクレオチド配列変異体を、gtCas9で予備試験した:
1)CNCCCCAC[配列番号17]、
2)CCCCCCAG[配列番号18]、
3)CCCCCCAA[配列番号11]、
4)CCCCCCAT[配列番号19]、
5)CCCCCCAC[配列番号20]、
6)NNNNTNNC(ネガティブ対照PAM)
【0221】
CCCCCCAA[配列番号11]配列をPAMとして使用した場合、60℃でin vitroで切断アッセイを行った後、精製gtCas9によるこれらのターゲティング(非線形化)プラスミド、およびgtCas9切断活性の向上前と同じsgRNA(実施例6を参照されたい)が観察された(
図9)。しかし、切断活性は、ネガティブ対象のPAM配列の場合、かすかな切断バンドが観察された場合でさえも、すべての試験PAM配列に対して、切断活性が明確に検出可能であった。特定の理論に縛られたくはないが、ネガティブ対照の場合に観察される切断に寄与する高いgtCas9濃度の使用が可能である。in vitroアッセイにおいてCas9濃度が高いと、厳密なPAM要件なしに、Cas9誘発性DNA切断に至ることが一般に観察されている。
【0222】
Cas9濃度は、一般に、Cas9誘発性DNA切断の効率に影響を及ぼすことが知られている(Cas9濃度が高いほど、Cas9活性は高い)。このことは、CCCCCCAA[配列番号11]PAM配列を含む標的プラスミドおよび異なるgtCas9濃度を使用して、in vitroアッセイを行った場合にも観察された(
図10)。
【0223】
上記のin vitroアッセイの場合のCCCCCCAA[配列番号11]PAM配列を含む標的プラスミドを、38と78℃の間の幅広い温度範囲で行った(
図11)。驚くべきことに、gtCas9は、すべての温度において活性であり、最高の活性は、40.1と64.9℃の間にあった。
【0224】
したがって、ゲオバチルス(Geobacillus)属種由来のCas9の最適温度範囲は今日まで特徴付けられているCas9タンパク質よりもはるかに高い。同様に、ゲオバチルス(Geobacillus)属種由来のCas9がヌクレアーゼ活性を保持する範囲の最上方は既知のCas9タンパク質よりもはるかに高い。より高い最適温度および機能的範囲は高温での遺伝子工学に、したがって、好熱性生物のゲノムの編集に著しい利点を与え、これは高温で実行される様々な工業、農業および製薬工程において有用性がある。
【0225】
[実施例9]
gtCas9および8ヌクレオチド長のPAM配列による、バチルス・スミシイ(Bacillus smithii)ET138のin vivoゲノム編集
8ヌクレオチドPAMもやはり、in vivoでgtCas9により認識されることを確認するため、55℃でバチルス・スミシイ(Bacillus smithii)ET138のゲノムにおけるpyrF遺伝子を欠失するよう設計を行った。
【0226】
この方法は、相同組換え鋳型構築物の提供に依存し、ここでは、標的(pyrF)遺伝子の上流および下流に相補的である領域が、B・スミシイ(B. smithii)ET138細胞にもたらされる。鋳型の導入により、相同組換え法を使用して、相同組換え鋳型(pyrF遺伝子を含まない)をゲノムに導入し、こうして、細胞のゲノムにおけるWT pyrF遺伝子を置き換える。
【0227】
相同組換え構築物にgtCas9およびsgRNAを含ませることを使用して、WT pyrFを含有する細菌ゲノムに二本鎖DNA切断(DSDB)を導入することができる。細菌のゲノムにおけるDSDBは、通常、細胞死をもたらす。したがって、WT pyrFの配列を認識するsgRNAは、DSDB、およびWT pyrFしか含有しない細胞の死滅をもたらす。DSDBの導入は、好適なPAM配列が、gtCas9により認識されるプロトスペーサーの3’末端において、下流に位置していることにやはり依存する。
【0228】
pNW33nプラスミドは、主鎖としてクローニングに使用した:
i)自家開発グルコース抑制プロモーターの制御下でのcas9gt遺伝子、および
ii)B.スミシイ(B. smithii)ET138のゲノムからのpyrF遺伝子の欠失をもたらす相同組換えの鋳型として、B.スミシイ(B. smithii)ET138のゲノムにおける、pyrF遺伝子の1kb上流領域および1kb下流領域、および
iii)構成プロモーターの転写制御下での単一ガイドRNA(sgRNA)発現モジュール。
【0229】
単一ガイドRNAの配列が、ゲノムにおけるその特異的DNA標的にgtCas9をガイドする配列に相当する最初の20ヌクレオチドにおいて相違点がある、3種の個別の構築物が生成された(スペーサーとしても知られている)。B・スミシイ(B. smithii)ET138のpyrF遺伝子におけるすべての3つの異なる候補プロトスペーサーを標的とするよう、3つの異なるスペーサー配列を設計した。これらの構築物は、本明細書において、それぞれ、構築物1、2および3と呼ばれる。
【0230】
3つの異なる標的プロトスペーサーは、それらの3’末端において、以下の候補PAM配列を有した:
1.TCCATTCC (in vitroアッセイの結果によるネガティブ対照;構築物番号3にコードされるsgRNAによりターゲティングされたプロトスペーサーの3’末端)
2.ATCCCCAA(構築物番号1[配列番号21]にコードされるsgRNAによりターゲティングされたプロトスペーサーの3’末端)
3.ACGGCCAA(構築物番号2;[配列番号22]にコードされるsgRNAによりターゲティングされたプロトスペーサーの3’末端)
【0231】
3つの構築物の1つおよび選択プレート上のプレート培養を、B・スミシイ(B. smithii)ET138細胞に形質転換した後、以下の結果が得られた:
1.細胞が、3’末端(構築物番号3)においてネガティブ対照であるTCCATTCC PAM配列を有するプロトスペーサーを標的とする構築物により形質転換しても、形質転換効率は影響を受けなかった(
図12A)。コロニー数は、pNW33nポジティブ対照構築物による変換後のコロニー数と同じ範囲にあった(
図12B)。pyrF遺伝子が欠失されたコロニーをスクリーニングするために、コロニーPCRに施した15のコロニーの中で、欠失遺伝子型-2.1kb予期バンドサイズを示すものはなく、すべて、野生型-2.9kb予期バンドサイズであった(
図13)。このことは、試験したPAMは、確かに、in vivoでgtCas9により認識されなかったことを示している。
2.ポジティブ対照(pNW33nで形質転換した細胞)と比較すると、細胞が構築物番号1により形質転換されると、わずか数個のコロニーしか得られなかった(
図12C)。20のコロニーに、pyrF遺伝子を欠失したコロニーをスクリーニングするためのコロニーPCRを施した。コロニーの大部分(19)は、野生型およびpyrF欠失遺伝子型の両方を含有した一方、1つのコロニーは、pyrF欠失遺伝子型を有した(
図14)。この結果により、WTのみの遺伝子型が観察されなかったので、PAM配列ATCCCCAA[配列番号21]は、gtCas9によってin vivoで認識されることが示された。低下した形質転換効率はまた、細胞集団の割合が低下したことをやはり示し、このことは、gtCas9によるターゲティングの成功によって、DSDBによるWTのみの遺伝子型細胞に引き起こされる細胞死に寄与し得る。
3.細胞が構築物番号2により形質転換されると、コロニーが得られなかった(
図12D)。コロニーが欠如したことは、細胞集団のすべてがgtCas9により首尾よくターゲティングされ、これにより、DSDBにより引き起こされる細胞死に至ったことを示す。これは、ACGGCCAA[配列番号22]PAM配列が、gtCas9によって認識されることを示唆する。
【0232】
これらの結果は、gtCas9が、55℃で、in vivoで、上記のPAM配列により活性となること、すなわち、in vitroでのPAM決定結果と一致する結果となることを示している。さらに、それは、プラスミド媒介性相同組換え鋳型と組み合わせて、同一温度においてゲノム編集ツールとして使用することができる。
【0233】
[実施例10]
ThermoCas9の同定および精製
本発明者らは、65℃で、最適成長温度を有する中程度のグラム陽性好熱性細菌である、ゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)株T12を単離して配列決定した(Daas et al. Biotechnol. Biofuels 9, 210(2016))。II型CRISPR-Cas系が好熱性細菌に存在しない以前の特許請求とは対照的に(Li et al. Nucleic Acids Res. 44, e34-e34(2016))、配列決定結果により、G.サーモデニトリフィカンス(G. thermodenitrificans)T12のゲノムにおいて、IIC型CRISPR-Cas系が存在することが明らかになった(
図15A)。この系(ThermoCas9)のCas9エンドヌクレアーゼは、SpCas9(1368アミノ酸)などの他のCas9オルソログと比べて、比較的小さな(1082アミノ酸)であると予測された。サイズ差異は大部分が、他の小さなCas9オルソログに関して実証された通り、トランケートされたRECローブによるものである(
図19)(Ran et al. Nature 520, 186-191 (2015))。さらに、ThermoCas9は、少なくともG.サーモデニトリフィカンス(G. thermodenitrificans)T12の最適温度付近で、活性であることが予期された(Daas et al. Biotechnol. Biofuels 9, 210(2016))。本発明者らは、クエリーとしてThermoCas9配列を使用して、NCBI/非冗長タンパク質配列データセットにおいて、BLAST-P検索を行い、大部分がゲオバチルス属(Geobacillus)内に、いくつかの高度に同一性のCas9オルソログ(タンパク質レベルで87~99%の同一性、表1)であることを見いだし、ThermoCas9が、好熱性細菌の高度の保存された防御系の部分となるという考えが支持された(
図15B)。これらの特徴により、好熱性微生物の場合、およびタンパク質の頑健性の増強が必要な条件の場合の、ゲノム編集およびサイレンシングツールとして実施するための候補可能性となり得ることが示唆される。
【0234】
本発明者らは、既に記載した手法を使用して、G.サーモデニトリフィカンス(G.thermodenitrificans)T12 CRISPR-Cas系のcrRNAおよびtracrRNAモジュールのin silico予測を最初に行った(Mougiakos et al. Trends Biotechnol. 34, 575-587(2016);Ran et al. Nature 520, 186-191(2015))。この予測に基づいて、予測した全サイズのcrRNA(30nt長のスペーサー、その後に36nt長の繰り返し)とtracrRNA(36nt長の抗繰り返し、その後に3つの予測ヘアピン構造を有する88nt配列が続く)とを連結することにより、190ntのsgRNAキメラを設計した。ThermoCas9は、大腸菌(E. coli)に異種発現させ、均一に精製した。ThermoCas9にsgRNAを搭載すると、タンパク質が安定化すると仮定して、本発明者らは、in vitroで転写されたsgRNAを搭載した精製済みアポThermoCas9およびThermoCas9を、60℃および65℃で、15分間および30分間、インキュベートした。SDS-PAGE解析により、精製したThermoCas9は65℃において変性するが60℃では変性しない一方、ThermoCas9-sgRNA複合体の変性温度は、65℃を超えることが示された(
図15C)。ThermoCas9の実証された熱安定性により、熱耐性CRISPR-Cas9ゲノム編集ツールとして、その潜在性があることが示され、本発明者らに、一層詳細に、一部の関連分子特徴の解析を促した。
【0235】
【0236】
[実施例11]
ThermoCas9 PAM決定
ThermoCas9の特徴付けに対する第1の工程は、DNA標的の切断の成功に対するそのPAM優先性のin silico予測であった。本発明者らは、G.サーモデニトリフィカンス(G. thermodenitrificans)T12 CRISPR遺伝子座の10のスペーサーを使用し、CRISPRtargetを使用する、ウイルス中の潜在的なプロトスペーサーおよびプラスミド配列を探索した(Biswas et al. RNA Biol. 10, 817-827(2013))。ファージゲノムにより、わずか2つのヒットしか得られなかったので(
図20A)、in vitroでのPAM決定手法を用いて進めることに決めた。本発明者らは、マッチングプロトスペーサーにより、ThermoCas9に基づくターゲティング線形dsDNA基質に対するスペーサーを含有する、予測sgRNA配列をin vitroで転写した。プロトスペーサーは、無作為化した7塩基対(bp)配列により、3’末端において隣接した。55℃でThermoCas9に基づく切断アッセイを行った後、ThermoCas9 PAM優先性を特定するため、ライブラリーの切断されたメンバーにディープ配列決定を行い(対照として非標的ライブラリー試料も一緒)、比較した(
図16A)。配列決定結果により、ThermoCas9は、中温性Cas9変異体と同様に、3位と4位のPAM近位ヌクレオチドとの間に大部分位置する、二本鎖DNA切断を導入することが明らかとなった。さらに、切断された配列は、ThermoCas9が、5’-NNNNCNR-3’PAMを認識し、PAM1、3、4および6位において、わずかにシトシン優先性がある(
図16B)。最近の検討により、ある種のIIC型Cas9オルソログの標的認識に対するPAM8位の重要性が明らかとなった(Karvelis et al. Genome Biol. 16, 253(2015);Kim et al. Genome Res. 24, 1012-9(2014))。この目的のために、およびin silicoでのThermoCas9PAM予測からの結果を考慮すると、本発明者らは、追加的なPAM決定アッセイを行った。これにより、PAM8位におけるアデニンの存在下で、最適標的効率となることが明らかになった(
図16C)。興味深いことに、ヒット数が限定されるにも関わらず、上述のin silico PAM予測(
図20B)はまた、PAM5位におけるシトシンおよびPAM8位におけるアデニンの重要性がやはり示唆された。
【0237】
PAM6位およびPAM7位におけるPAMの不明確さをさらに明確にするため、本発明者らは、マッチングプロトスペーサーが、5’-CCCCCNNA-3’[配列番号13]PAMにより隣接された、一式の16の異なる標的DNA断片を生成した。これらの断片の切断アッセイ(各々は、第6および第7のヌクレオチドの特有の組合せを有する)を行い、この場合、様々な構成成分(ThermoCas9、sgRNAガイドRNA、dsDNA標的)を、異なる温度(20℃、30℃、37℃、45℃、55℃および60℃)で10分間、個別に予め加熱した後、それらを一緒にして、対応するアッセイ温度で1時間、インキュベートした。アッセイを37℃と60℃との間の温度で行った場合、異なるDNA基質はすべて切断された(
図16D、
図21)。しかし、最も消化された標的断片は、PAM配列(PAM5から8位)5’-CNAA-3’および5’-CMCA-3’からなる一方、最も消化されなかった標的は、5’-CAKA-3’PAMを含有した。30℃では、最適なPAM配列(PAM5から8位)5’-CNAA-3’および5’-CMCA-3’を有するDNA基質の切断しか、観察されなかった(
図2D)。最後に、20℃では、(PAM5から8位)5’-CVAA-3’および5’-CCCA PAM配列を有するDNA基質しか標的とならず(
図21)、これらの配列が最も好ましいPAMになった。これらの知見により、その温度下限値では、ThermoCas9は、好ましいPAMを有する断片しか切断しないことが実証される。この特徴は、例えば、標的外作用を回避するため、in vivoでの編集過程の間に利用することができる。
【0238】
[実施例12]
熱安定性およびトランケート
予測したtracrRNAは、抗繰り返し領域と、その後の3つのヘアピン構造からなる(
図17A)。crRNAと共にtracrRNAを使用して、sgRNAキメラを形成させると、DNA基質RNAの案内された切断が成功した。二重ガイド天然状態に良好に類似する可能性が最も高い、完全長繰り返し-抗繰り返しヘアピンのスペーサー遠位末端の41-nt長の欠失(
図17A)は、DNA切断効率にほとんどまたは全く影響を及ぼさなかったことが観察された。ThermoCas9の切断効率に及ぼす予測ヘアピン(
図17A)のさらなるトランケートの影響を、一連の時間で切断を行うことにより評価し、この場合、すべての構成成分(sgRNA、ThermoCas9、基質DNA)を、様々な温度(37~65℃)で1分間、2分間および5分間、個別に事前加熱した後、それらを一緒にして、様々なアッセイ温度(37~65℃)において1時間、インキュベートした。tracrRNA足場の予測したステム-ループの数は、DNA切断において重要な役割を果たすように思われる。3つのループがすべて存在する場合、切断効率は、すべての試験温度で最高であった一方、その効率は、3’ヘアピンの除去時に、低下した(
図17B)。さらに、切断効率は、ミドルヘアピンと3’ヘアピンの両方を除去すると、劇的に低下した(
図22)。ThermoCas9を65℃で1分間または2分間、事前加熱すると検出可能な切断がもたらされた一方、切断活性は、5分間のインキュベート後、消失した。熱安定性アッセイにより、3’ステムループのないsgRNA変異体は、65℃において、ThermoCas9タンパク質の安定性が低下し、完全長tracrRNAは、高温において、最適なThermoCas9に基づくDNA切断にとって必要であることを示している。さらに、本発明者らはまた、スペーサー配列の長さ(25~18nt)を変えて、23、21、20および19のスペーサー長さは、最も高い効率で標的を切断することを見いだした。切断効率は、18ntのスペーサーを使用した場合、著しく低下する。
【0239】
in vivoでは、ThermoCas9:sgRNA RNP複合体は、おそらくは、数分以内に形成される。上記の知見と一緒にすると、このことにより、本発明者らは、RNPの活性および熱安定性を評価することが促された。事前に構築されたRNP複合体を60℃、65℃および70℃で5分間および10分間、加熱した後、予め加熱したDNAを加え、次いで、60℃、65℃および70℃で1時間、インキュベートした。顕著なことに、本発明者らは、ThermoCas9 RNPは、70℃で5分間、事前加熱したにもかかわらず、70℃まで活性であることを観察した(
図17C)。この知見により、ThermoCas9安定性は、適切なsgRNAガイドの会合と強く関連しているという本発明者らの仮説が確認された(Ma et al., Mol. Cell 60, 398-407(2015))。
【0240】
一部の用途では、ThermoCas9は、幅広い温度活性範囲を有することが有利である、すなわち、低温と高温の両方で機能的であると思われる。同様に、一部の状況では、ThermoCas9の活性が、より狭い温度範囲に制限され得る場合、例えば、低温または高温でしか活性でない場合に、有利になると思われる。したがって、ThermoCas9が、標的化切断もしくは結合を可能にする温度の範囲、または標的化切断または結合が、ThermoCas9または関連エレメント(sgRNAなど)の構造的特徴を改変することによって効率的に行われる温度の範囲を操作する能力により、核酸配列の操作全体にわたり、より高いレベルの制御を行い得ると思われる。したがって、本発明者らは、ThermoCas9の温度範囲と、化膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)の温度範囲との比較に着手した。Cas9ホモログのどちらにも、20と65℃の間のin vitro活性アッセイを施した。どちらもタンパク質も、sgRNAおよび標的DNA分子を添加する前に、対応するアッセイ温度で5分間、インキュベートした。以前の解析
26に一致して、中温性SpCas9は、25と44℃の間でしか活性でなかった(
図17D)。これらの温度より高い場合、SpCas9は活性は、非検出レベルまで急速に低下した。対照的に、ThermoCas9切断活性は、25と65℃の間で検知された(
図17D)。このことは、好熱性生物と中温生物の両方に対するゲノム編集ツールとして、ThermoCas9を使用する可能性を示している。
【0241】
以前に特徴付けられた中温性Cas9エンドヌクレアーゼは、二価陽イオンを使用して、標的DNAにおけるDSBの生成を触媒する(Jinek et al. Science 337, 816-821(2012);Chen et al. J. Biol. Chem. 289, 13284-13294(2014))。陽イオンが、ThermoCas9によってDNA切断に寄与することを評価するため、プラスミド切断アッセイは、以下の二価陽イオン:Mg
2+、Ca
2+、Mn
2+、Co
2+、Ni
2+およびCu
2+のうちの1つの存在下で行った。陽イオンキレート剤であるEDTAを用いるアッセイをネガティブ対照として含めた。予期される通り、標的dsDNAは、二価陽イオンの存在下で切断され、EDTAの存在下では不活性のままであった(
図23A)。あるIIC型系は、効率的な一本鎖DNAカッターであるという報告(Ma et al. Mol. Cell 60, 398-407(2015);Zhang et al. Mol. Cell 60, 242-255(2015))に基づいて、本発明者らは、ssDNA基質に及ぼすThermoCas9の活性を試験した。しかし、切断は観察されず、ThermoCas9は、dsDNAヌクレアーゼであることが示される(
図23B)。
【0242】
[実施例13]
好熱性B.スミシイ(B. smithii)における、ThermoCas9に基づく遺伝子欠失
本発明者らは、好熱性細菌に対するThermoCas9に基づくゲノム編集ツールの開発に着手した。ここで、本発明者らは、55℃で培養した、バチルス・スミシイ(Bacillus smithii)ET138を使用して、原理の証明を示す。最小限の遺伝部分を使用するため、本発明者らは、単一プラスミド手法に従った。本発明者らは、バチルス・コアグランス(Bacillus coagulans)に由来する構成的ptaプロモーター(Ppta)の制御下で、目的の遺伝子内のCas9誘発性二本鎖DNA切断、およびsgRNA発現モジュールを修復するための、相同組換え鋳型である、天然のxylLプロモーター(PxylL)の制御下で、thermocas9遺伝子を含有するpNW33nをベースとする、一連のpThermoCas9プラスミドを構築した。
【0243】
第1の目的は、B.スミシイ(B. smithii)ET138のゲノムに由来する完全長pyrF遺伝子の欠失であった。pyrF遺伝子の様々な部位を標的とするスペーサーを有する、様々なThermoCas9ガイドの発現について、pNW33nに由来するプラスミドpThermoCas9_bsΔpyrF1およびpThermoCas9_bsΔpyrF2を使用した一方、第3のプラスミド(pThermoCas9_ctrl)は、sgRNA発現モジュールにおいて、ランダム非標的スペーサーを含有した。対照プラスミドpNW33n(ガイドなし)およびpThermoCas9_ ctrlによる、55℃でのB.スミシイ(B. smithii)ET138コンピテント細胞の形質転換により、それぞれ、約200のコロニーが形成した。スクリーニングした10のpThermoCas9_ ctrlコロニーの中から、ΔpyrF遺伝子型を含有するものはなく、B.スミシイ(B. smithii)ET138における相同組換えは、クリーンな変異体を得るには不十分であるという以前の検討からの知見が確認された(Mougiakos et al. ACS Synth. Biol. 6, 849-861(2017);Bosma et al. Microb. Cell Fact. 14, 99(2015))。対照的に、pThermoCas9_bsΔpyrF1およびpThermoCas9_bsΔpyrF2プラスミドによる形質転換は、それぞれ、20および0のコロニーとなり、55℃におけるThermoCas9のin vivo活性を確認し、タンパク質の上記の幅広いin vitroでの温度範囲が立証付けられた。10のスクリーニングされたpThermoCas9_ΔpyrF1コロニーのなかで、1つが、クリーンなΔpyrF変異体となった一方、残りは、混合型の野生型/ΔpyrF遺伝子型(
図4B)を有し、標的されたpyrF遺伝子の設計された相同性特異的な修復が成功したので、この系の適応性が証明された。それにもかかわらず、厳密に制御されたSpCas9に基づく対向選択系では、本発明者らは、pyrF欠失効率が一層高くなることを以前に開発した(Olson et al., Curr. Opin. Biotechnol. 33, 130-141(2015))。ThermoCas9に基づくツールでは、得られた形質転換体およびクリーンな変異体の数が少ないことは、非常に活性なThermoCas9の構成的発現を組み合わされた、B.スミシイ(B. smithii)では、低い相同組換え効率となることにより説明することができる(Olson et al., Curr. Opin. Biotechnol. 33, 130-141(2015))。厳密に制御可能なプロモーターの使用は、効率が向上することが予測される。
【0244】
[実施例14]
中温性生物シュードモナス・プチダ(Pseudomonas putida)におけるThermoCas9に基づく遺伝子欠失
ThermoCas9に基づくゲノム編集ツールの適用性を広げるため、およびin vitroの結果が、in vivoで確認することができるかどうかを評価するため、中温性グラム陰性菌であるP.プチダ(P. putida)KT2440におけるその活性を、相同組換えとThermoCas9に基づく対向選択とを組み合わせることにより評価した。この生物の場合、Cas9をベースとするツールは、これまで、報告されてこなかった。本発明者らは、もう一度、単一プラスミド手法に従った。本発明者らは、pyrF遺伝子の欠失のための相同組換え鋳型である、3ーメチルベンゾエート誘発性Pm-プロモーターの制御下でのthermocas9遺伝子、および構成的P3プロモーターの制御下でのsgRNA発現モジュールを含有するpEMGをベースとするpThermoCas9_ppΔpyrFプラスミドを構築した。P.プチダ(P. putida)KT2440細胞の形質転換、およびプラスミド統合のPCR確認後、コロニーを37℃で一晩の培養のために、選択的な液体培地中に接種した。一晩、培養物を選択的培地の接種に使用し、ThermoCas9発現を3ーメチルベンゾエートにより誘発させた。続いて、希釈物を3-メチルベンゾエートを補給した、非選択的培地上にプレート培養した。比較のため、3-メチルベンゾエートによる誘発性ThermoCas9発現のない並行実験を行った。その過程は、誘発性培養物の場合、76のコロニーとなり、非誘発性対照培養物の場合、52のコロニーとなった。誘発性培養物の場合、38のコロニー(50%)は、クリーンな欠失遺伝子型を有し、6つのコロニーが混合型野生型/欠失遺伝子型を有した。それどころか、非誘発性培養物のわずか1つのコロニー(2%)しか、欠失遺伝子型を有しておらず、混合型野生型/欠失遺伝子型を有するコロニーは回収されなかった(
図24)。これらの結果は、ThermoCas9を使用して、37℃で成長すると、中温性P.プチダ(P. putida)KT2440における効率的な対向選択ツールとして使用することができることを示している。
【0245】
[実施例15]
ThermoCas9に基づいた遺伝子サイレンシング
効率的な熱活性転写サイレンシングCRISPRiツールは、現在、利用可能ではない。このような系は、いくつかの用途に有用となり得る。例えば、このような系は、好熱菌の代謝検討をかなり容易にすると思われる。ThermoCas9の触媒的に死滅した変異体は、dsDNA切断を導入することなく、DNAエレメントに容易に結合することにより、この目的を果たすことができる。この目的のため、本発明者らは、ThermoCas9のRuvCおよびHNH触媒ドメインを特定し、死滅(d)ThermoCas9を作製するための対応するD8AおよびH582A変異を導入した。設計した配列の確認後、Thermo-dCas9は、異種生成して、精製し、上述のThermoCas9アッセイにおいて使用されものと同一のDNA標的によるin vitroでの切断アッセイに使用した。切断は観察されず、ヌクレアーゼの触媒的不活性が確認された。
【0246】
Thermo-dCas9に基づくCRISPRiツールの開発に対して、本発明者らは、B.スミシイ(B. smithii)ET138のゲノムから、高度に発現したldhL遺伝子の転写サイレンシングを目的とした。本発明者らは、pNW33nベースとするベクターpThermoCas9i_ldhLおよびpThermoCas9i_ctrlを構築した。どちらのベクターも、P
xylLプロモーターの制御下でのthermo-dCas9遺伝子、および構成的P
ptaプロモーターの制御下でのsgRNA発現モジュールを含有した(
図4C)。pThermoCas9i_ldhLプラスミドは、B.スミシイ(B. smithii)ET138において、138ldhL遺伝子の5’末端における非鋳型DNA鎖を標的とするスペーサーを含有した(
図S7)。位置および標的鎖選択は、これまでの検討に基づき(Bikard et al. Nucleic Acids Res. 41. 7429-7437(2013);Larson et al. Nat. Protoc. 8, 2180-2196(2013))、ldhL遺伝子の有効な下方調節を目的とした。pThermoCas9i_ctrlプラスミドは、sgRNA発現モジュールにおける、無作為非標的スペーサーを含有した。構築物を使用して、55℃でB.スミシイ(B. smithii)ET138コンピテント細胞を形質転換し、次いでLB2寒天プレート上に播種して、当量のコロニーが得られた。構築物あたり約700のコロニーのうちの2つを、既に示した通り、非好気性ラクテート生成条件下で、24時間、培養するために選択した。(Bosma et al. Appl. Environ. Microbiol. 81, 1874-1883(2015))。pThermoCas9i_ldhL培養物の成長は、pThermoCas9i_ctrl培養物の成長より50%少なかった(
図4E)。本発明者らは、ldhL遺伝子の欠失は、微好気性条件下で、LdhをベースとするNAD
+再生成能力の欠如により、B.スミシイ(B. smithii)ET138において、深刻な成長遅延に至ることを以前に示している(Bosma et al. Microb. Cell Fact. 14, 99 (2015))。したがって、成長の観察された低下は、ldhL遺伝子の転写阻害、およびNAD
+再生成能力の欠失による、その後の酸化還元不均衡により引き起こされる可能性が高い。実際に、HPLC分析により、ldhLサイレンシングした培養物のラクテート生成が40%低下することが明らかになり、RT-qPCR解析により、ldhL遺伝子の転写レベルは、pThermoCas9i_ctrl培養物と比べて、pThermoCas9i_ldhL培養物中で顕著に低下することが示された(
図4E)。
【0247】
[実施例16]
まとめ
大部分のCRISPR-Casの用途は、Cas9およびCas12aなどのクラス2CRISPR-Casタンパク質によるRNAにより案内されるDNA干渉に基づく(Komor et al., Cell 168, 20-36(2017);Puchta, Curr. Opin. Plant Biol. 36, 1-8(2017);Xu et al. J. Genet. Genomics 42, 141-149(2015);Tang et al. Nat. Plants 3, 17018(2017);Zetsche et al. Nat. Biotechnol. 35, 31-34(2016);Mougiakos et al., Trends Biotechnol. 34, 575-587(2016))。本検討の前に、その数種が好熱菌のゲノム編集に使用されてきた、好熱性細菌および古細菌に存在する非常に多量のクラス1 CRISPR-Cas系(Li et al. Nucleic Acids Res. 44, e34-e34(2016))とは対照的に、クラス2 CRISPR-Cas免疫系は、特定されておらず、好熱性微生物に特徴付けられていない(Makarova et al., Nat. Rev. Microbiol. 13, 722-736(2015);Weinberger et al., MBio 3, e00456-12(2012))。その結果、CRISPR-Cas技術の応用は、使用したCas-エンドヌクレアーゼの中温性性質のため、42℃未満の温度に主に限定された。したがって、これは、偏性好熱菌における、および高温を必要とし、かつ/またはタンパク質安定性の改善された実験手法におけるこれらの技法の用途を除外する。
【0248】
発明者らは、本発明者らが、以前にコンポストから単離した株である、好熱性細菌G・サーモデニトリフィカンス(G. thermodenitrificans)T12に由来する、ThermoCas9、Cas9オルソログを特徴付けている(Daas et al. , Biotechnol. Biofuels 9, 210(2016))。データマイニングにより、他の好熱菌のゲノムにおいて、ThermoCas9とほぼ同一のさらなるCas9オルソログが存在することが明らかになり、バチルス属(Bacillus)およびゲオバチルス属(Geobacillus)の少なくとも一部の群では、CRISPR-CasII型系が好熱菌に存在することを最初に示した。本発明者らは、ThermoCas9が、20~70℃の幅広い温度範囲において、in vitroで、活性であり、この温度範囲は、その中温性オルソログSpCas9の25~44℃の範囲よりもかなり幅広いことを示した。ThermoCas9の活性および安定性の延長により、20~70℃の温度においてDNA操作を必要とする、分子生物学技法におけるその応用、および強固な酵素活性を必要とする過酷な環境でのその実施が可能となる。さらに、本発明者らは、ThermoCas9の熱安定性を付与するのに重要な、いくつかの因子を特定した。第1に、本発明者らは、ThermoCas9のPAM優先性は、温度範囲の低い方(≦30℃)の部分で活性に対して非常に厳密である一方、PAMの多数の種類が、中温から最適温度(37~60℃)において、活性となり得ることを実証した。第2に、発明者らは、ThermoCas9活性および熱安定性は、適切なsgRNA案内との会合に強く依存することを実証した。特定の理論に縛られたくはないが、本発明者らは、多重ドメインCas9タンパク質のこのような安定化は、案内結合時に、SpCas9に関して記載されている通り、開放/従順状態からむしろ小さくまとまった状態への主要な立体構造変化の結果である可能性が最も高い(Jinek et al. Science 343, 1247997-1247997(2014))。
【0249】
新規なThermoCas9のここで記載されている特徴付けに基づいて、発明者らは、厳密な好熱性原核生物に対するゲノム工学ツールの開発に成功した。本発明者らは、55℃および37℃において、in vivoで、ThermoCas9が活発であることを示し、本発明者らは、好熱性B.スミシイ(B. smithii)ET138および中温性P.プチダ(P. putida)KT2440に関する現在のCas9に基づく工学技術を適用した。ThermoCas9の幅広い温度範囲により、単純で有効かつ単一のプラスミドに基づくThermoCas9手法は、37℃から70℃までの温度で成長することができる、好熱性および中温性微生物の幅広い範囲に好適となることが予期される。これは、既存の中温技法を補完し、これらの効率的なツールは、これまで利用不能であった、大きな生物群のための使用することが可能になる。
【0250】
所望の形質を有する新規酵素に関する天然源のスクリーニングは、疑問の余地なく、価値がある。これまでの検討により、指向性進化およびタンパク質工学を用いて、一層高い温度まで中温性Cas9オルソログを適用することは、好熱性Cas9タンパク質の構築29に対して最良手法になると思われることが示唆される。代わりに、本発明者らは、ある好熱性細菌において、Cas9の分岐群を特定し、好熱性生物と中温生物の両方に対する強力なゲノム工学ツールにこれらの熱安定性ThermoCas9変異体の1つを形質転換した。この検討により、本発明者らは、Cas9に基づくゲノム編集技術の可能性をさらに拡大し、厳しい条件または幅広い温度範囲にわたり活性を必要とする条件下で新規な用途におけるCas9技術を使用する新しい可能性を広げる。
【0251】
[実施例17]物質および方法:
a. 細菌株および成長条件
中等度の好熱菌B.スミシイ(B. Smithii)ET138ΔsigF ΔhsdR(Mougiakos, et al.,(2017) ACS Synth. Biol. 6, 849-861)を、ThermoCas9を使用して遺伝子編集およびサイレンシング実験に使用した。これを、LB2培地中にて、55℃で成長させた(Bosma, et al. Microb. Cell Fact. 14, 99(2015))。プレート培養の場合、培地1リットル当たり30gの寒天(Difco)をすべての実験に使用した。必要な場合、クロラムフェニコールを7μg/mLの濃度で加えた。タンパク質発現の場合、大腸菌(E.coli)Rosetta(DE3)を、温度を16℃に変更した後、0.5のOD600nmに到達するまで、120rpmで震とう式インキュベータ中、37℃のフラスコ中、LB培地中で成長させた。30分後、0.5mMの最終濃度になるまで、イソプロピル-1-チオ-β-d-ガル-アクトピラノシド(IPTG)を添加することにより発現を誘発させて、この後、インキュベートを16℃で継続した。PAM6位および7位および8位の構築物のクローニングに関すると、製造業者により提供されているマニュアルに従い、DH5-アルファコンピテント大腸菌(E. coli)(NEB)を形質転換し、LB寒天プレート上にて、37℃で一晩、成長させた。縮重7-nt長のPAMライブラリーをクローニングするため、標準的手順に従い(Sambrook, Fritsch & Maniatis, T. Molecular cloning: a laboratory manual.(Cold Spring Harbor Laboratory, 1989)、エレクトロコンピテントDH10B大腸菌(E. coli)細胞を形質転換し、37℃で一晩、LB寒天プレート上で成長させた。大腸菌(E. coli)DH5α λpir(Invitrogen)を、Ausubelらにより記載されている形質転換手順を使用して、P.プチダ(P. putida)プラスミド構築に使用した(Current Protocols in Molecular Biology (John Wiley & Sons, Inc., 2001). doi:10.1002/0471142727)。すべての大腸菌(E. coli)株に関すると、必要な場合、クロラムフェニコールを25mg/Lの濃度で、およびカナマイシンを50mg/Lで使用した。特に明記しない場合、シュードモナス・プチダ(Pseudomonas putida)KT2440(DSM6125)株を、LB培地中、37℃で培養した。必要な場合、カナマイシンを50mg/Lの濃度で、および3ーメチルベンゾエートを3mMの濃度で加えた。
【0252】
b. ThermoCas9発現および精製
ThermoCas9をG.サーモデニトリフィカンス(G. thermodenitrificans)T12のゲノムからPCR増幅し、次に、クローニングし、大腸菌(E. coli)Rosetta(DE3)において異種発現させて、Ni2+-親和性陰イオン交換とゲルろ過クロマトグラフィー工程とを組み合わせることによりFPLCを使用して精製した。遺伝子配列を、オリゴヌクレオチド(表2)を使用して、ライゲート非依存性クローニングにより、プラスミドpML-1B(UC Berkeley MacroLab、Addgene #29653から入手)に挿入し、ヘキサヒスチジン配列およびタバコエッチウイルス(TEV)のプロテアーゼ切断部位を含むN末端タグと融合した、ThermoCas9ポリペプチド配列(残基1~1082)をコードするタンパク質発現構築物を生成した。触媒的に不活性なThermoCas9タンパク質(Thermo-dCas9)を発現するため、PCRを使用してD8AおよびH582Aポイント変異を挿入し、DNA配列決定により確認した。
【0253】
【0254】
【0255】
【0256】
【0257】
【0258】
【0259】
【0260】
【0261】
【0262】
【0263】
タンパク質は、大腸菌(E. coli)Rosetta2(DE3)株で発現した。培養物を、0.5~0.6のOD600nmまで成長させた。発現は、0.5mMの最終濃度までIPTGを添加することにより誘発させて、インキュベートを16℃で一晩、継続した。細胞を遠心分離により収穫し、プロテアーゼ阻害剤(Roche cOmplete、EDTA不含)およびリゾチームを補給した溶解緩衝液(50mMのリン酸ナトリウム、pH8、500mMのNaCl、1mMのDTT、10mMのイミダゾール)20mLに、細胞ペレットを再懸濁した。一旦、超音波MS72マイクロチッププローブ(Bandelin)を使用して、30%振幅で2秒のパルスおよび2.5秒の休止からなる、5~8分間の音波照射(Sonoplus、Bandelin)によりホモジナイズした細胞を溶解し、次に、16,000×gで、4℃で1時間、遠心分離にかけ、不溶性物質を除去した。透明になった溶解物を0.22ミクロンのフィルター(Mdi membrane technologies)によりろ過して、ニッケルカラム(Histrap HP、GE Lifesciences)に適用し、次に、250mMのイミダゾールにより溶出した。ThermoCas9を含むフラクションをプールし、透析用緩衝液に一晩、透析した(250mMのKCl、20mMのHEPES/KOHおよび1mMのDTT、pH7.5)。透析後、試料は、10mMのHEPES/KOH(pH8)に1:1で希釈し、IEX-A緩衝液(150mMのKCl、20mMのHEPES/KOH、pH8)中で予め平衡したヘパリンFFカラムにロードした。カラムをIEX-Aにより洗浄し、次に、IEX-C(2MのKCl、20mMのHEPES/KOH、pH8)のグラジエントにより溶出した。ゲルろ過カラム(HiLoad 16/600 Superdex 200)にロードする前に、FPLC(AKTA Pure)により、試料を700μLまで濃縮した。ゲルろ過からのフラクションを、SDS-PAGEにより解析した。ThermoCas9を含有するフラクションをプールし、200μL(50mMのリン酸ナトリウム、pH8、2mMのDTT、5%グリセロール、500mMのNaCl)まで濃縮し、生化学的アッセイのために直接、使用するか、または保管のため、-80℃で凍結するかのどちらかとした。
【0264】
c. sgRNAのin vitro合成
sgRNAモジュールを、5’-GAAA-3’リンカーを含む予測crRNAおよびtracrRNA配列を融合することにより設計した。sgRNAを発現するDNA配列は、T7プロモーターの転写制御下に置いた。これを合成し(Baseclear、Leiden、オランダ)、pUC57骨格に提供した。生化学反応に使用したsgRNAをすべて、HiScribe(商標)T7 High Yield RNA合成キット(NEB)を使用して合成した。5’末端にT7配列を有する、sgRNAをコードするPCR断片をin vitroでの転写反応のための鋳型として、利用した。T7転写を4時間、行った。sgRNAを電気泳動させて、ウレアPAGEゲルから切り離し、エタノールによる沈殿を使用して精製した。
【0265】
d. in vitro切断アッセイ
in vitro切断アッセイを精製した組換えThermoCas9で行った。ThermoCas9タンパク質、in vitroで転写したsgRNAおよびDNA基質(表2に記載されているプライマーを使用したPCR増幅を使用して生成した)を、(他に示さない限り)明記した温度で10分間、個別にインキュベートし、次いで、構成要素を一緒にして、切断用緩衝液(100mMのリン酸ナトリウム緩衝液(pH=7)、500mMのNaCl、25mMのMgCl2、25(V/V%)グリセロール、5mMのジチオトレイトール(DTT))中、様々なアッセイ温度で1時間、インキュベートした。各切断反応物は、160nMのThermoCas9タンパク質、4nMの基質DNAおよび150nMの合成したsgRNAを含んだ。反応物は、6xのロード用色素(NEB)を加えることにより停止し、1.5%アガロースゲル上で電気泳動した。ゲルをSYBR safe DNA染色剤(Life Technologies)により染色し、ゲルDocTM EZゲル画像化システム(Bio-rad)で画像化した。
【0266】
e. in vitroでのPAMスクリーニング用ライブラリー構築
PAMライブラリーの構築の場合、その3’末端にプロトスペーサーおよび7-bp長の縮重配列を含有する122-bp長のDNA断片を、プライマーをアニールおよびKlenow断片(エキソ-)(NEB)をベースとする伸長により構築した。PAM-ライブラリー断片およびpNW33nベクターをBspHIおよびBamHI(NEB)により消化し、次に、ライゲートした(T4リガーゼ、NEB)。ライゲート混合物をエレクトロコンピテント大腸菌(E. coli)DH10B細胞に形質転換し、プラスミドを液体培養物から単離した。7nt長のPAM決定法に関しては、プラスミドライブラリーをSapI(NEB)により線形化し、標的として使用した。アッセイの残りに関すると、DNA基質をPCR増幅により線形化した。
【0267】
f. PAMスクリーニングアッセイ
thermoCas9のPAMスクリーニングを、(反応当たり)160nMのThermoCas9、150nMのin vitroで転写したsgRNA、4nMのDNA標的、4μlの切断用緩衝液(100mMのリン酸ナトリウム緩衝液、pH7.5、500mMのNaCl、5mMのDTT、25%グリセロール)、およびMQ水を20μlまでの最終反応容積からなる、in vitro切断アッセイを使用して行った。55℃の反応から切断断片を含有するPAMをゲル精製し、Illumina配列決定アダプターを用いてライゲートし、Illumina HiSeq2500配列決定(Baseclear)に移送した。PAMライブラリーにより処理した等量の非thermoCas9に、同じ過程を施し、参照として、Illumina HiSeq2500配列決定に移送した。基準配列と完全に配列が一致したHiSeqの読み取り値を、さらに解析するために選択した。選択された読み取り値から、対照ライブラリーと比べて、ThermoCas9処置ライブラリーで1000倍超で存在しているもの、およびThermoCas9処置ライブラリーで少なくとも10倍超で存在しているものを、WebLogo分析(Crooks et al., Genome Res. 14, 1188-1190(2004))に使用した。
【0268】
g. B.スミシイ(B. smithii)およびP.プチダ(P. putida)に関する編集およびサイレンシング構築物
プラスミド構築に使用したプライマーおよびプラスミドはすべて、NEBuilder HiFi DNAアセンブリ(NEB)を行うことにより適切な突出部で設計し、それらをそれぞれ、表2および表3に列挙している。プラスミドを組み立てるための断片は、Q5ポリメラーゼ(NEB)またはPhusion Flash High-Fidelity PCR Master Mix(ThermoFisher Scientific)を用いてPCRにより得て、PCR生成物に1%アガロースゲル電気泳動を施し、チモーゲンゲルDNA回収キット(Zymo Research)を使用して精製した。化学的コンピテント大腸菌(E. coli)DH5α細胞(NEB)に、またはP.プチダ(P. putida)構築物では、大腸菌(E. coli)DH5α λpir(Invitrogen)に、組み立てたプラスミドを形質転換した(後者は、直接的なベクター結合を容易にする)。単一コロニーをLB培地に接種し、GeneJetプラスミドminiprepキット(ThermoFisher Scientific)を使用してプラスミド物質を単離し、配列を確認して(GATC-biotech)、1μgの各構築物を、既に記載したプロトコルに従って調製した、B.スミシイ(B. smithii)ET138エレクトロコンピテント細胞から形質転換した(Bosma, et al. Microb. Cell Fact. 14, 99(2015))。B.スミシイ(B. smithii)およびP.プチダ(P. putida)液体培養物からゲノムDNA単離するため、MasterPure(商標)グラム陽性DnA精製キット(Epicentre)を使用した。
【0269】
pThermoCas9_ctrlの構築の場合、ΔpyrF相同組換え隣接部と一緒にしたpThermoCas9_bsΔpyrF1およびpThermoCas9_bsΔpyrF2ベクター、pNW33n主鎖を、pWUR_Cas9sp1_hrベクターからPCR増幅した(Mougiakos, et al. ACS Synth. Biol. 6,849-861(2017))(BG8191およびBG8192)。天然PxylAプロモーターを、B.スミシイ(B. smithii)ET138(BG8194およびBG8195)のゲノムからPCR増幅した。thermocas9遺伝子は、G.サーモデニトリフィカン(G. thermodenitrificans)T12(BG8196およびBG8197)のゲノムからPCR増幅した。Pptaプロモーターは、pWUR_Cas9sp1_hrベクターからPCR増幅した(Mougiakos, et al. ACS Synth. Biol. 6,849-861(2017))(BG8198およびBG8261_2/BG8263_nc2/BG8317_3)。sgRNA足場の後のスペーサーは、pUC57_T7t12sgRNAベクターからPCR増幅した(BG8266_2/BG8268_nc2/8320_3およびBG8210)。
【0270】
4つの断片アセンブリを設計して、pThermoCas9i_ldhLベクターの構築を実施した。鋳型としてpThermoCas9_ctrlを使用する2工程PCR手法により、最初に、標的ポイント変異をthermocas9触媒残基(変異D8AおよびH582A)のコドンに導入した。第1のPCR工程(BG9075、BG9076)の間に、所望の変異が、生成したPCR断片の終了時に導入され、第2の工程の間(BG9091、BG9092)に、生成した断片を適切なアセンブリ-突出部の導入のためのPCR鋳型として使用した。ldhLサイレンシングスペーサーと共に第2の変異の下流にthermocas9の一部を、鋳型として、pThermoCas9_ctrlを使用してPCR増幅した(BG9077およびBG9267)。pNW33n主鎖を一緒にしたsgRNA足場を、鋳型としてpThermoCas9_ctrlを使用してPCR増幅した(BG9263およびBG9088)。第1の変異の上流にthermocas9の部分と一緒にしたプロモーターを鋳型としてpThermoCas9_ctrlを使用してPCR増幅した(BG9089、BG9090)。
【0271】
2つの断片アセンブリを設計して、pThermoCas9i_ctrlベクターの構築を実施した。pThermoCas9i_ldhLベクターにおけるスペーサー配列を、両末端にBaeI制限部位を含有するランダム配列で置き換えた。pNW33n主鎖を一緒にしたsgRNA足場を、鋳型としてpThermoCas9_ctrlを使用してPCR増幅した(BG9548、BG9601)。構築物の他の半分は、Thermo-dCas9からなり、プロモーターを鋳型としてpThermoCas9i_ldhLを使用して増幅した(BG9600、BG9549)。
【0272】
5つの断片アセンブリを設計して、P.プチダ(P. putida)KT2440ベクターpThermoCas9_ppΔpyrFの構築を実施した。自殺ベクターpEMG由来のレプリコンをPCR増幅した(BG2365、BG2366)。pyrFの隣接領域を、KT2440ゲノムDNAから増幅した(576bp上流隣接部の場合、BG2367、BG2368であり、540bp下流隣接部の場合、BG2369、BG2370)。隣接部は、プライマーBG2367およびBG2370を使用して重複伸長PCRで融合し、プライマーBG2368およびBG2369の重複を利用した。sgRNAは、pThermoCas9_ctrlプラスミドから増幅した(BG2371、BG2372)。構成的P3プロモーターは、pSW_I-SceIから増幅した(BG2373、BG2374)。プロモーター断片は、プライマーBG2372およびBG2373を使用して重複伸長PCRでsgRNA断片に融合し、プライマーBG2371およびBG2374の重複を利用した。ThermoCas9は、pThermoCas9_ctrlプラスミドから増幅した(BG2375、BG2376)。ThermoCas9の3ーメチルベンゾエート誘発に使用されることになる、誘発性Pm-XylS系は、pSW_I-SceIから増幅した(BG2377、BG2378)。
【0273】
【0274】
【0275】
【0276】
h. P.プチダ(P. putida)の編集プロトコル
Choiら(Choi et al., J. Microbiol. Methods 64, 391-397(2006))に従い、P.プチダ(P. putida)へのプラスミドの形質転換を行った。統合体の形質転換および選択後に、培養物を一晩、接種した。3mlの新しい選択培地を接種するために、一晩の培養物10μlを使用し、37℃で2時間の成長後、ThermoCas9に3-メチルベンゾエートで誘発させた。さらに6時間後、3-メチルベンゾエートを補給した、非選択的培地上に培養物の希釈物をプレート培養した。対照培養物の場合、3ーメチルベンゾエートの添加をすべての工程において省略した。P.プチダ(P. putida)染色体におけるプラスミド統合の確認は、プライマーBG2381およびBG2135を用いるコロニーPCRにより行った。pyrF欠失の確認は、プライマーBG2381およびBG2382を用いるコロニーPCRにより行った。
【0277】
i. RNA単離
RNA単離は、既に記載したプロトコルに基づいて、フェノール抽出により行った(van Hijum et al. BMC Genomics 6, 77 (2005))。10mL培養物を4℃、4816×gで15分間、一晩、遠心分離にかけ、直ちにRNA単離に使用した。培地の除去後、細胞を0.5mLの氷冷TE緩衝液(pH8.0)中で懸濁させ、氷上で維持した。試料をすべて、0.5gのジルコニウムビーズ、30μLの10%SDS、30μLの3M酢酸ナトリウム(pH5.2)および500μLのRoti-フェノール(pH4.5~5.0、Carl Roth GmbH)を含有する2つの2mLのスクリューキャップ付き管に分割した。細胞を、5500rpmで45秒間、FastPrep-24装置(MP Biomedicals)を使用して破壊し、4℃および10000rpmで5分間、遠心分離にかけた。各管からの水相400μLを新しい管に移送し、ここに、400μLのクロロホルム-イソアミルアルコール(Carl Roth GmbH)を加え、この後、試料を4℃および18400×gで3分間、遠心分離にかけた。水相300μLを新しい管に移送し、高純度のRNA単離キット(Roche)からの溶解緩衝液300μLと混合した。続いて、DNアーゼインキュベート工程を除き(これは、45分間、行った)、このキットからの手順の残りを、製造業者のプロトコルに従って行った。cDNAの濃度および統合を、Nanodrop-1000 Integrityを使用して決定し、単離したRNAの濃度は、NanoDrop100で確認した。
【0278】
j.RT-qPCRによるmRNAの定量
製造業者のプロトコルに従いSuperScript(商標)III逆転写酵素(Invitrogen)を使用して、単離RNAのための、第1の鎖cDNA合成を行った。Quanta Biosciences製のPerfeCTa SYBR Green Supermix for iQを使用して、qPCRを行った。40ngのcDNAライブラリーをそれぞれ、鋳型としてqPCRに使用した。2組のプライマー:ldhL遺伝子の150nt長の領域を増幅するBG9665:BG9666、およびrpoD(RNAポリメラーゼシグマ因子)遺伝子の150nt長の配列を増幅するBG9889:BG9890を使用し、これは、qPCRの対照として使用した。qPCRは、Bio-Rad C1000サーマルサイクラーで行った。
【0279】
k.HPLC
高速液体クロマトグラフィー(HPLC)システムICS-5000をラクテート定量に使用した。210nmで作動するUV1000検出器およびRI-150 40℃屈折率検出器を装備した、Bio-Rad Laboratories製のAminex HPX 87Hカラムを用いて系を操作した。移動相は、0.16N H2SO4からなり、カラムを0.8mL/分で操作した。試料はすべて、0.01N H2SO4中の10mM DMSOで4:1に希釈した。
【0280】
説明の以下の項目は、本明細書に既に記載されている、本発明の記述を単に提示する番号付けした段落からなる。この項目における番号付けした段落は、特許請求の範囲ではない。特許請求の範囲は、後の項目「特許請求の範囲」において以下に説明されている。
【0281】
1.a.アミノ酸モチーフEKDGKYYC[配列番号2];および/または
b.アミノ酸モチーフX1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);および/または
c.アミノ酸モチーフX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);および/または
d.アミノ酸モチーフX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである);および/または
e.アミノ酸モチーフX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)
を含む、単離されたCas(CRISPR(clustered regularly interspaced short palindromic repeat:クラスター化し規則的に間隔を置いた短い回文配列の繰り返し)associated:CRISPR関連)タンパク質またはポリペプチドであって
少なくとも1つのターゲティングRNA分子と会合すると、Casタンパク質は、50℃と100℃の間の核酸切断が可能であり、ポリヌクレオチドは、ターゲティングRNA分子により認識される標的核酸配列を含む、上記タンパク質またはポリペプチド。
【0282】
2.配列番号1のアミノ酸配列、またはそれと少なくとも77%の同一性の配列を有する単離Casタンパク質またはポリペプチド断片であって、標的配列を認識する少なくとも1つのRNA分子と会合すると、Casタンパク質は、50℃と100℃の間の温度で、標的核酸配列を含むポリヌクレオチドに結合する、これを切断する、改変するまたは標識することができる、単離Casタンパク質またはポリペプチド断片。
【0283】
3.Casタンパク質またはポリペプチド断片が、50℃と75℃の間の温度、好ましくは60℃超の温度、より好ましくは60℃と80℃の間の温度、より好ましくは60℃と65℃の間の温度で、核酸の結合、切断、標識または改変が可能である、段落番号1または段落番号2のCasタンパク質またはポリペプチド断片。
【0284】
4.核酸の結合、切断、標識または改変が、DNA切断である、段落番号1から3のいずれかのCasタンパク質またはポリペプチド断片。
【0285】
5.アミノ酸配列が、配列番号1、またはそれと少なくとも77%の同一性の配列を含む、前記段落番号のいずれかのCasタンパク質またはポリペプチド断片。
【0286】
6.前記Casタンパク質が細菌、古細菌またはウイルスから入手可能である、前記段落番号のいずれかのCasタンパク質またはポリペプチド断片。
【0287】
7.前記Casタンパク質がゲオバチルス(Geobacillus)属種から、好ましくはゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)から入手可能である、前記段落番号のいずれかのCasタンパク質またはポリペプチド断片。
【0288】
8.前記段落番号のいずれのCasタンパク質を含み、標的ポリヌクレオチド中の配列を認識する少なくとも1つのターゲティングRNA分子を含む、リボ核タンパク質複合体。
【0289】
9.前記ターゲティングRNA分子がcrRNAおよび任意選択でtracrRNAを含む、段落番号8のリボ核タンパク質複合体。
【0290】
10.前記少なくとも1つのRNA分子の長さが35~135ヌクレオチド残基の範囲である、段落番号7から9のいずれかのリボ核タンパク質複合体。
【0291】
11.前記標的配列が31または32ヌクレオチド残基長である、段落番号8または9のリボ核タンパク質複合体。
【0292】
12.タンパク質またはポリペプチドが、少なくとも1つのさらなる機能的または非機能的タンパク質を含むタンパク質複合体の一部として提供される、段落番号1から7のいずれかのCasタンパク質またはポリペプチド、または8から11のいずれかのリボ核タンパク質複合体。
【0293】
13.前記Casタンパク質もしくはポリペプチドおよび/または前記少なくとも1つのさらなるタンパク質が少なくとも1つの機能的部分をさらに含む、段落番号12のCasタンパク質、ポリペプチド、またはリボ核タンパク質複合体。
【0294】
14.前記少なくとも1つの機能的部分が、前記Casタンパク質、ポリペプチドまたはリボ核タンパク質複合体のN終端および/またはC終端、好ましくはN終端に融合または連結している、段落番号13のCasタンパク質もしくはポリペプチド、またはリボ核タンパク質複合体。
【0295】
15.前記少なくとも1つの機能的部分がタンパク質であり、任意選択で、ヘリカーゼ、ヌクレアーゼ、ヘリカーゼ-ヌクレアーゼ、DNAメチラーゼ、ヒストンメチラーゼ、アセチラーゼ、ホスファターゼ、キナーゼ、転写(共)活性化因子、転写リプレッサー、DNA結合タンパク質、DNA構築タンパク質、マーカータンパク質、レポータータンパク質、蛍光タンパク質、リガンド結合タンパク質、シグナルペプチド、細胞内局在配列、抗体エピトープまたは親和性精製タグから選択される、段落番号13または14のCasタンパク質もしくはポリペプチド、またはリボ核タンパク質複合体。
【0296】
16.Cas9ヌクレアーゼの天然の活性が不活化されており、Casタンパク質が少なくとも1つの機能的部分に連結している、段落番号15のCasタンパク質もしくはポリペプチド、またはリボ核タンパク質複合体。
【0297】
17.前記少なくとも1つの機能的部分がヌクレアーゼドメイン、好ましくはFokIヌクレアーゼドメインである、段落番号15または16のCasタンパク質もしくはポリペプチド、またはリボ核タンパク質複合体。
【0298】
18.少なくとも1つの機能的部分が、マーカータンパク質、例えばGFPである、段落番号15から17のいずれかのCasタンパク質またはポリペプチドまたはリボ核タンパク質複合体。
【0299】
19.Casタンパク質またはポリペプチドをコードする、単離核酸分子であって、
a.アミノ酸モチーフEKDGKYYC[配列番号2];および/または
b.アミノ酸モチーフX1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);および/または
c.アミノ酸モチーフX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);および/または
d.アミノ酸モチーフX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである);および/または
e.アミノ酸モチーフX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)
を含み、
少なくとも1つのターゲティングRNA分子と会合すると、Casタンパク質またはポリペプチドが、50℃と100℃の間で、DNA結合、切断、標識または改変が可能であり、ポリヌクレオチドが、ターゲティングRNA分子により認識される標的核酸配列を含む、上記単離核酸分子。
【0300】
20.配列番号1のアミノ酸配列もしくはそれと少なくとも77%の同一性の配列を有するCas(CRISPR(clustered regularly interspaced short palindromic repeat:クラスター化し規則的に間隔を置いた短い回文配列の繰り返し)associated:CRISPR関連)タンパク質、またはそのポリペプチド断片をコードする単離された核酸分子。
【0301】
21.翻訳されると前記Casタンパク質またはポリペプチドと融合するアミノ酸配列をコードする少なくとも1つの核酸配列をさらに含む、段落番号19または20の単離された核酸分子。
【0302】
22.前記Casタンパク質またはポリペプチドをコードする核酸分子に融合する前記少なくとも1つの核酸配列が、ヘリカーゼ、ヌクレアーゼ、ヘリカーゼ-ヌクレアーゼ、DNAメチラーゼ、ヒストンメチラーゼ、アセチラーゼ、ホスファターゼ、キナーゼ、転写(共)活性化因子、転写リプレッサー、DNA結合タンパク質、DNA構築タンパク質、マーカータンパク質、レポータータンパク質、蛍光タンパク質、リガンド結合タンパク質、シグナルペプチド、細胞内局在配列、抗体エピトープまたは親和性精製タグから選択されるタンパク質をコードする、段落番号21の単離された核酸分子。
【0303】
23.段落番号19から22のいずれかの核酸分子を含む発現ベクター。
【0304】
24.少なくとも1つのターゲティングRNA分子をコードするヌクレオチド配列をさらに含む、段落番号23の発現ベクター。
【0305】
25.ヒト細胞における標的核酸を改変する方法であって、核酸を
a.段落番号6~11のいずれかのリボ核タンパク質複合体;または
b.段落番号12から18のいずれかのタンパク質またはタンパク質複合体、および段落番号6から11のいずれかに定義されている少なくとも1つのターゲティングRNA分子
と接触させるステップを含み、任意選択で前記ヒト細胞が胚性幹細胞ではなく、任意選択で本方法がヒトの生殖細胞系遺伝的同一性を改変しない、方法。
【0306】
26.ヒト細胞における標的核酸を改変する方法であって、細胞を段落番号24の発現ベクターで形質転換、トランスフェクトまたは形質導入するステップ、または代替として細胞を、段落番号23の発現ベクター、および段落番号6から11のいずれかに定義されているターゲティングRNA分子をコードするヌクレオチド配列を含むさらなる発現ベクターで形質転換、トランスフェクトまたは形質導入するステップを含み、任意選択で前記ヒト細胞が胚性幹細胞ではなく、任意選択で本方法がヒトの生殖細胞系遺伝的同一性を改変しない、方法。
【0307】
27.ヒト細胞における標的核酸を改変する方法であって、細胞を段落番号23の発現ベクターで形質転換、トランスフェクトまたは形質導入するステップ、次に細胞にまたは細胞内に段落番号6から11のいずれかに定義されているターゲティングRNA分子を送達するステップを含み、任意選択で前記ヒト細胞が胚性幹細胞ではなく、任意選択で本方法がヒトの生殖細胞系遺伝的同一性を改変しない、方法。
【0308】
28.段落番号25から28のいずれかの標的核酸を改変する方法であって、前記少なくとも1つの機能的部分がマーカータンパク質またはレポータータンパク質であり、前記マーカータンパク質またはレポータータンパク質が前記標的核酸と会合し、好ましくは前記マーカーが蛍光タンパク質、例えば、緑色蛍光タンパク質(GFP)である、方法。
【0309】
29.前記標的核酸がDNA、好ましくはdsDNAである、段落番号25から28のいずれかの方法。
【0310】
30.前記標的核酸がRNAである、段落番号25から28のいずれかの方法。
【0311】
31.段落番号29の標的核酸を改変する方法であって、前記核酸がdsDNAであり、前記少なくとも1つの機能的部分がヌクレアーゼまたはヘリカーゼ-ヌクレアーゼであり、前記改変が所望の遺伝子座での一本鎖または二本鎖切断である、方法。
【0312】
32.段落番号26、27、29または31の方法のいずれかに従って所望の遺伝子座で遺伝子発現をサイレンシングする方法。
【0313】
33.段落番号26、27、29または31の方法のいずれかに従って所望の位置で所望のヌクレオチド配列を改変または欠失および/もしくは挿入する方法。
【0314】
34.段落番号25から29のいずれかの方法の標的核酸配列を改変することを含む、細胞中で遺伝子発現を改変する方法であって、前記核酸がdsDNAであり、前記機能的部分がDNA修飾酵素(例えば、メチラーゼまたはアセチラーゼ)、転写活性化因子または転写リプレッサーから選択される、方法。
【0315】
35.段落番号30の方法の標的核酸配列を改変することを含む、細胞中で遺伝子発現を改変する方法であって、前記核酸がmRNAであり、前記機能的部分がリボヌクレアーゼであり、任意選択でエンドヌクレアーゼ、3’エキソヌクレアーゼまたは5’エキソヌクレアーゼから選択される、方法。
【0316】
36.50℃と100℃の間の温度で実行される、段落番号25から35のいずれかの標的核酸を改変する方法。
【0317】
37.60℃または60℃より上、好ましくは60℃と80℃の間、より好ましくは60℃と65℃の間の温度で実行される、段落番号36の標的核酸を改変する方法。
【0318】
38.段落番号22から36のいずれかにおける方法により形質転換された宿主細胞であって、細胞がヒト細胞であり、任意選択で前記ヒト細胞が胚性幹細胞ではなく、任意選択で本方法がヒトの生殖細胞系遺伝的同一性を改変しない、宿主細胞。
【配列表】