(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-06-13
(45)【発行日】2022-06-21
(54)【発明の名称】熱安定性CAS9ヌクレアーゼ
(51)【国際特許分類】
C12N 15/55 20060101AFI20220614BHJP
C12N 9/16 20060101ALI20220614BHJP
C12N 15/62 20060101ALI20220614BHJP
C07K 19/00 20060101ALI20220614BHJP
C12N 15/63 20060101ALI20220614BHJP
C12N 15/09 20060101ALI20220614BHJP
C12N 15/65 20060101ALI20220614BHJP
C12N 1/15 20060101ALI20220614BHJP
C12N 1/19 20060101ALI20220614BHJP
C12N 1/21 20060101ALI20220614BHJP
C12N 5/10 20060101ALI20220614BHJP
【FI】
C12N15/55 ZNA
C12N9/16 Z
C12N15/62 Z
C07K19/00
C12N15/63 Z
C12N15/09 110
C12N15/65 Z
C12N1/15
C12N1/19
C12N1/21
C12N5/10
(21)【出願番号】P 2017564480
(86)(22)【出願日】2016-06-06
(86)【国際出願番号】 EP2016062817
(87)【国際公開番号】W WO2016198361
(87)【国際公開日】2016-12-15
【審査請求日】2019-06-03
(32)【優先日】2015-06-12
(33)【優先権主張国・地域又は機関】GB
(73)【特許権者】
【識別番号】519213698
【氏名又は名称】ヴァーヘニンゲン ユニヴェルシテット
(74)【代理人】
【識別番号】100092783
【氏名又は名称】小林 浩
(74)【代理人】
【識別番号】100120134
【氏名又は名称】大森 規雄
(74)【代理人】
【識別番号】100126354
【氏名又は名称】藤田 尚
(74)【代理人】
【識別番号】100104282
【氏名又は名称】鈴木 康仁
(72)【発明者】
【氏名】ウースト,ファン デル,ジョン
(72)【発明者】
【氏名】ダース,マーティナス ヨハネス アルノルダス
(72)【発明者】
【氏名】ケンゲン,セルヴァティウス ウィルヘルムス マリア
(72)【発明者】
【氏名】ヴォス,デ,ウィレム メインデルト
【審査官】藤澤 雅樹
(56)【参考文献】
【文献】米国特許出願公開第2014/0068797(US,A1)
【文献】Database DDBJ/EMBL/GenBank [online], Accession No. ESU73649.1, <https://www.ncbi.nlm.nih.gov/protein/ESU73649.1/> 25-NOV-2013 uploaded, [retrieved on 2020.6.4], Siddiqui,M.A., et al., Definition: CRISPR-associated protein Csn1 [Geobacillus sp. MAS1].
【文献】Cell (2013) Vol.154, pp.442-451
【文献】Genome Announcements (2014) Vol.2, No.3, e00559-14, pp.1-2
【文献】Database DDBJ/EMBL/GenBank [online], Accession No. ESU73649.1, <https://www.ncbi.nlm.nih.gov/protein/ESU73649.1/> 25-NOV-2013 uploaded, [retrieved on 2020.6.4], Siddiqui,M.A., et al., Definition: CRISPR-associated protein Csn1 [Geobacillus sp. MAS1].
【文献】Cell (2013) Vol.154, pp.442-451
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00
UniProt/GeneSeq
PubMed
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
配列番号1のアミノ酸配列またはそれと少なくとも90%の同一性の配列を含む、単離されたCasタンパク質またはそのポリペプチド断片であって、前記Casタンパク質またはそのポリペプチド断片が、標的核酸配列を認識する少なくとも1つのRNA分子と会合すると、50℃から100℃の範囲の温度で前記標的核酸配列を含むポリヌクレオチドを切断することができる、単離されたCasタンパク質またはそのポリペプチド断片。
【請求項2】
50℃から75℃の範囲の温度で、任意選択で60℃から65℃の範囲の温度で標的核酸配列を含むポリヌクレオチドを切断することができる、請求項1に記載のCasタンパク質またはそのポリペプチド断片。
【請求項3】
前記標的核酸配列を含むポリヌクレオチドの切断がDNAの切断である、請求項1または請求項2に記載のCasタンパク質またはそのポリペプチド断片。
【請求項4】
前記Casタンパク質が細菌、古細菌またはウイルスから入手可能である、請求項1から3のいずれかに記載のCasタンパク質またはそのポリペプチド断片。
【請求項5】
前記Casタンパク質がゲオバチルス(Geobacillus)属種から、任意選択でゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)から入手可能である、請求項1から4のいずれかに記載のCasタンパク質またはそのポリペプチド断片。
【請求項6】
請求項1から5のいずれかに記載のCasタンパク質を含み、前記標的核酸配列を認識する少なくとも1つのターゲティングRNA分子を含む、リボ核タンパク質複合体。
【請求項7】
前記少なくとも1つのターゲティングRNA分子が(a)crRNAおよび任意選択でtracrRNAまたは(b)単一ガイドRNAを含む、請求項6に記載のリボ核タンパク質複合体。
【請求項8】
前記少なくとも1つのターゲティングRNA分子の長さが35~135ヌクレオチド残基の範囲である、請求項6または請求項7に記載のリボ核タンパク質複合体。
【請求項9】
前記標的核酸配列が31または32ヌクレオチド残基長である、請求項6または請求項7に記載のリボ核タンパク質複合体。
【請求項10】
前記Casタンパク質またはそのポリペプチド断片が、少なくとも1つのさらなるタンパク質を含むタンパク質複合体の一部として提供される、請求項1から5のいずれかに記載のCasタンパク質もしくはそのポリペプチド断片または請求項6から9のいずれかに記載のリボ核タンパク質複合体。
【請求項11】
前記Casタンパク質もしくはそのポリペプチド断片および/または前記少なくとも1つのさらなるタンパク質が少なくとも1つの機能的部分をさらに含む、請求項10に記載のCasタンパク質、そのポリペプチド断片、またはリボ核タンパク質複合体。
【請求項12】
前記少なくとも1つの機能的部分が、前記Casタンパク質、またはそのポリペプチド断片のN終端および/またはC終端に融合または連結している、請求項11に記載のCasタンパク質もしくはそのポリペプチド断片、またはリボ核タンパク質複合体。
【請求項13】
前記少なくとも1つの機能的部分がタンパク質であり、任意選択で、ヘリカーゼ、ヌクレアーゼ、ヘリカーゼ-ヌクレアーゼ、DNAメチラーゼ、ヒストンメチラーゼ、アセチラーゼ、ホスファターゼ、キナーゼ、転写(共)活性化因子、転写リプレッサー、DNA結合タンパク質、DNA構築タンパク質、マーカータンパク質、レポータータンパク質、蛍光タンパク質、リガンド結合タンパク質、シグナルペプチド、細胞内局在配列、抗体エピトープまたは親和性精製タグから選択される、請求項11または請求項12に記載のCasタンパク質もしくはそのポリペプチド断片、またはリボ核タンパク質複合体。
【請求項14】
Cas9ヌクレアーゼの天然のヌクレアーゼ活性が不活化されており、Casタンパク質が少なくとも1つの機能的部分に連結している、請求項13に記載のCasタンパク質もしくはそのポリペプチド断片、またはリボ核タンパク質複合体。
【請求項15】
前記少なくとも1つの機能的部分がヌクレアーゼドメイン、任意選択でFokIヌクレアーゼドメインである、請求項13または請求項14に記載のCasタンパク質もしくはそのポリペプチド断片、またはリボ核タンパク質複合体。
【請求項16】
前記少なくとも1つの機能的部分がマーカータンパク質である、請求項13から15のいずれかに記載のCasタンパク質もしくはそのポリペプチド断片、またはリボ核タンパク質複合体。
【請求項17】
配列番号1のアミノ酸配列もしくはそれと少なくとも90%の同一性の配列を含む
、Cas(CRISPR(clustered regularly interspaced short palindromic repeat:クラスター化し規則的に間隔を置いた短い回文配列の繰り返し)associated:CRISPR関連)タンパク
質またはそのポリペプチド断片をコードする単離された核酸分子であって、前記Casタンパク質またはそのポリペプチド断片が、標的核酸配列を認識する少なくとも1つのRNA分子と会合すると、50℃から100℃の範囲の温度で前記標的核酸配列を含むポリヌクレオチドを切断することができる、前記Casタンパク質またはそのポリペプチド断片をコードする単離された核酸分子。
【請求項18】
翻訳されると前記Casタンパク質またはそのポリペプチド断片と融合するアミノ酸配列をコードする少なくとも1つの核酸配列をさらに含む、請求項17に記載の単離された核酸分子。
【請求項19】
前記Casタンパク質またはそのポリペプチド断片をコードする核酸分子に融合する前記少なくとも1つの核酸配列が、ヘリカーゼ、ヌクレアーゼ、ヘリカーゼ-ヌクレアーゼ、DNAメチラーゼ、ヒストンメチラーゼ、アセチラーゼ、ホスファターゼ、キナーゼ、転写(共)活性化因子、転写リプレッサー、DNA結合タンパク質、DNA構築タンパク質、マーカータンパク質、レポータータンパク質、蛍光タンパク質、リガンド結合タンパク質、シグナルペプチド、細胞内局在配列、抗体エピトープまたは親和性精製タグから選択されるタンパク質をコードする、請求項18に記載の単離された核酸分子。
【請求項20】
請求項17から19のいずれかに記載の核酸分子を含む発現ベクター。
【請求項21】
少なくとも1つのターゲティングRNA分子をコードするヌクレオチド配列をさらに含む、請求項20に記載の発現ベクター。
【請求項22】
標的核酸を改変する方法(但し、ヒトを手術または治療する方法を除く)であって、前記核酸を、
a.請求項6から16のいずれかに記載のリボ核タンパク質複合体、または
b.請求項1から4または10から16のいずれかに記載のCasタンパク質またはそのポリペプチド断片および請求項6から9のいずれかに記載の少なくとも1つのターゲティングRNA分子
と接触させることを含む方法。
【請求項23】
細胞中で標的核酸を改変する方法(但し、ヒトを手術または治療する方法を除く)であって、前記細胞を請求項21に記載の発現ベクターで形質転換、トランスフェクトもしくは形質導入すること、または代わりに前記細胞を請求項20に記載の発現ベクターおよび請求項6から9のいずれかに記載のターゲティングRNA分子をコードするヌクレオチド配列を含むさらなる発現ベクターで形質転換、トランスフェクトもしくは形質導入することを含む方法。
【請求項24】
細胞中で標的核酸を改変する方法(但し、ヒトを手術または治療する方法を除く)であって、前記細胞を請求項20に記載の発現ベクターで形質転換、トランスフェクトもしくは形質導入し、次いで、請求項6から9のいずれかに記載のターゲティングRNA分子を前記細胞内に送達することを含む方法。
【請求項25】
請求項22から24のいずれかに記載の標的核酸を改変する方法であって、前記Casタンパク質、そのポリペプチド断片、またはリボ核酸複合体が少なくとも1つの機能的部分をさらに含み、前記少なくとも1つの機能的部分がマーカータンパク質またはレポータータンパク質であり、前記マーカータンパク質またはレポータータンパク質が前記標的核酸と会合し、任意選択で前記マーカーが蛍光タンパク質、例えば、緑色蛍光タンパク質(GFP)である、方法。
【請求項26】
前記標的核酸がDNA、任意選択でdsDNAである、請求項22から25のいずれかに記載の方法。
【請求項27】
前記標的核酸がRNAである、請求項22から25のいずれかに記載の方法。
【請求項28】
請求項26に記載の標的核酸を改変する方法であって、前記核酸がdsDNAであり、前記Casタンパク質、そのポリペプチド断片、またはリボ核酸複合体が少なくとも1つの機能的部分をさらに含み、前記少なくとも1つの機能的部分がヌクレアーゼまたはヘリカーゼ-ヌクレアーゼであり、前記改変が所望の遺伝子座での一本鎖または二本鎖切断である、方法。
【請求項29】
請求項23、24、26または28に記載の方法のいずれかに従って所望の遺伝子座で遺伝子発現をサイレンシングする方法。
【請求項30】
請求項23、24、26または28に記載の方法のいずれかに従って所望の位置で所望のヌクレオチド配列を改変または欠失および/もしくは挿入する方法。
【請求項31】
請求項22から26のいずれかに記載の標的核酸を改変することを含む、細胞中で遺伝子発現を改変する方法であって、前記核酸がdsDNAであり、前記Casタンパク質またはそのポリペプチド断片における前記Cas9ヌクレアーゼの前記天然のヌクレアーゼ活性が不活化され、前記機能的部分がDNA修飾酵素(例えば、メチラーゼまたはアセチラーゼ)、転写活性化因子または転写リプレッサーから選択される、方法。
【請求項32】
請求項27に記載の標的核酸を改変することを含む、細胞中で遺伝子発現を改変する方法であって、前記核酸がmRNAであり、前記Casタンパク質またはそのポリペプチド断片における前記Cas9ヌクレアーゼの前記天然のヌクレアーゼ活性が不活化され、前記機能的部分がリボヌクレアーゼであり、任意選択でエンドヌクレアーゼ、3’エキソヌクレアーゼまたは5’エキソヌクレアーゼから選択される、方法。
【請求項33】
50℃から100℃の範囲の温度で実行される、請求項22から32のいずれかに記載の標的核酸を改変する方法。
【請求項34】
60℃から80℃の範囲の温度、任意選択で60℃から65℃の範囲の温度で実行される、請求項33に記載の標的核酸を改変する方法。
【請求項35】
前記細胞が原核細胞である、請求項22から34のいずれかに記載の方法。
【請求項36】
前記細胞が真核細胞である、請求項22から35のいずれかに記載の方法。
【請求項37】
請求項17から18のいずれかに記載の核酸分子または請求項20もしくは21に記載の発現ベクターを含む、形質転換された宿主細胞。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、遺伝子工学の分野に関し、さらに詳細には核酸編集およびゲノム改変に関する。本発明は、遺伝物質の配列依存部位特異的ニッキングまたは切断のために構成することができるヌクレアーゼ;その上、遺伝物質の配列特異的部位にヌクレアーゼ活性を働かせるリボ核タンパク質、ならびにマーカーとして使用するための修飾ヌクレアーゼおよびリボ核タンパク質の形態での遺伝子工学ツールに関する。したがって、本発明は、細胞内でのヌクレアーゼおよびガイドRNAの送達および発現のための関連発現構築物にも関する。さらに、本発明は、in vitroまたはin vivoでの核酸の配列特異的編集およびそれを達成するのに使用される方法に関する。本発明が関係する特定の分野は、好熱性生物、特に微生物の遺伝子操作である。
【背景技術】
【0002】
CRISPR-Casが多くの細菌および大半の古細菌での適応免疫系であることは2007年に初めて実証された(Barrangou et al., 2007, Science 315: 1709-1712)、Brouns et al., 2008, Science 321: 960-964)。機能的および構造的判断基準に基づいて、3種類のCRISPR-Cas系がこれまで特徴付けられており、その大半が相補的DNA配列を標的にするためのガイドとして小型RNA分子を使用している(Makarova et al., 2011, Nat Rev Microbiol 9: 467-477;Van der Oost et al., 2014, Nat Rev Microbiol 12: 479-492)。
【0003】
Doudna/Charpentier研究室による最近の研究では、II型CRISPR-Cas系(Cas9)のエフェクター酵素の徹底的な特徴付けが実施され、設計されたCRISPR RNAガイド(特異的スペーサー配列を有する)の導入によりプラスミド上の相補的配列(プロトスペーサー)が標的にされ、このプラスミドの二本鎖切断が引き起こされることが実証された(Jinek et al., 2012, Science 337: 816-821)。Jinek et al., 2012に続いて、Cas9はゲノム編集のためのツールとして使用される。
【0004】
Cas9は様々な真核細胞(例えば、魚、植物、ヒト)のゲノムを操作するのに使用されてきた(Charpentier and Doudna, 2013, Nature 495: 50-51)。
【0005】
さらに、Cas9は、特定の組換え事象を選び出すことにより細菌での相同組換えの収率を改善するのに使用されてきた(Jiang et al., 2013, Nature Biotechnol 31: 233-239)。これを達成するためには、毒性断片(ターゲティング構築物)に所望の変化をもつレスキュー断片(編集構築物、点突然変異または欠失を有する)を共トランスフェクトする。ターゲティング構築物は、デザインCRISPRと組み合わせたCas9および宿主染色体上で所望の組換え部位を規定する抗生物質耐性マーカーからなり、対応する抗生物質の存在下では宿主染色体でのターゲティング構築物の組込みが選択される。CRISPR標的部位を有する編集構築物の追加の組換えが宿主染色体の他の場所で起こる場合のみ、宿主は自己免疫問題から逃れることが可能である。したがって、抗生物質の存在下では、所望の(マーカーなし)突然変異体のみが生き延びて成長することができる。染色体から組み込まれたターゲティング構築物のその後の除去を選ぶ関連戦略も提起されており、本物のマーカーなし突然変異体を生み出している。
【0006】
CRISPR-Cas媒介ゲノム編集は遺伝子工学のための有用なツールを成すことが近年確立された。原核生物CRISPR系が適応免疫系としてその宿主に役立ち(Jinek et al., 2012, Science 337: 816-821)、迅速で効果的な遺伝子工学のために使用することが可能であり(例えば、Mali et al., 2013, Nat Methods 10:957-963)、目的の配列を標的にするためにはガイド配列の改変のみが必要であることが確立されている。
【0007】
しかし、遺伝子研究およびゲノム編集の分野での応用のために種々の実験条件下で改良された配列特異的核酸検出、切断および操作ができる作用因子の開発の必要性が続けて存在している。特に、Cas9を含む現在利用可能な配列特異的ゲノム編集ツールは、あらゆる条件または生物での使用に適用可能なわけではなく、例えば、配列特異的ヌクレアーゼは相対的に熱感受性であり、したがって、厳密に好熱性の微生物(41℃と122℃の間で成長することができ、最適には60℃超から80℃の温度範囲で成長し、超好熱菌は80℃より上で最適成長できる)、例えば、工業用発酵においてまたは高温で行われるin vitro実験工程のために使用される微生物での使用には適用可能ではない。
【0008】
好熱菌において活性Cas9タンパク質についての実験的証拠は現在まで存在しない。細菌におけるCas9の存在下でのChylinski et al. (2014; Nucleic Acids Research 42: 6091-6105)による比較ゲノムスクリーニングに基づいて、II-C型CRISPR-Cas系はすべての細菌ゲノムのおおよそ3.3%に存在するだけであることが見出された。好熱性細菌のなかで、II型系は統計分析(P=0.0019)に基づいて過小に見積もられている。さらに、古細菌ではII型系は見出されていないが、これはおそらく古細菌にはリボヌクレアーゼIIIタンパク質(II型系に関与する)が存在しないせいであろう。Chylinski, et al., (2014; Nucleic Acids Research 42: 6091-6105)は、II型CRISPR-Cas系の分類および進化を過去に報告しており、特に、これらの系を示す2つの種が同定されているが、これらの種は最大55℃で成長し、最適成長温度が60~80℃であり、超好熱菌では80℃より上で最適に成長できる厳密に好熱性の成長を示してはいない。
【0009】
細菌ゲノムにおけるCRISPR-Cas系の希少性、特に、Cas9が最適成長温度が45℃よりも低い細菌(古細菌ではない)でしか見つかっていないという事実にもかかわらず、本発明者らは、驚くべきことに、ゲノム編集を高温で実行するのを可能にするいくつかの熱安定性Cas9変異体を発見した。これらのCas9ヌクレアーゼは、高温での遺伝子工学のための新規のツールとなり、好熱性生物、特に微生物の遺伝子操作で特に価値がある。
【発明の概要】
【0010】
本開示は、以下の[1]から[37]を含む。
[1]配列番号1のアミノ酸配列またはそれと少なくとも77%の同一性の配列を有する、単離されたCasタンパク質またはポリペプチド断片であって、上記Casタンパク質が、標的核酸配列を認識する少なくとも1つのRNA分子と会合すると、50℃と100℃の間で上記標的配列を含むポリヌクレオチドを切断することができる、単離されたCasタンパク質またはポリペプチド断片。
[2]50℃と75℃の間で、好ましくは60℃より上で、より好ましくは60℃と80℃の間で、さらにより好ましくは60℃と65℃の間で核酸を切断することができる、上記[1]に記載のCasタンパク質またはポリペプチド断片。
[3]上記核酸の切断がDNAの切断である、上記[1]または上記[2]に記載のCasタンパク質またはポリペプチド断片。
[4]上記Casタンパク質が細菌、古細菌またはウイルスから入手可能である、上記[1]から[3]のいずれかに記載のCasタンパク質またはポリペプチド断片。
[5]上記Casタンパク質がゲオバチルス(Geobacillus)属種から、好ましくはゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)から入手可能である、上記[1]から[4]のいずれかに記載のCasタンパク質またはポリペプチド断片。
[6]上記[1]から[5]のいずれかに記載のCasタンパク質を含み、標的ポリヌクレオチド中の配列を認識する少なくとも1つのターゲティングRNA分子を含む、リボ核タンパク質複合体。
[7]上記ターゲティングRNA分子がcrRNAおよび任意選択でtracrRNAを含む、上記[6]に記載のリボ核タンパク質複合体。
[8]上記少なくとも1つのRNA分子の長さが35~135ヌクレオチド残基の範囲である、上記[6]または上記[7]に記載のリボ核タンパク質複合体。
[9]上記標的配列が31または32ヌクレオチド残基長である、上記[6]または上記[7]に記載のリボ核タンパク質複合体。
[10]上記タンパク質またはポリペプチドが、少なくとも1つのさらなる機能的または非機能的タンパク質を含むタンパク質複合体の一部として提供される、上記[1]から[5]のいずれかに記載のCasタンパク質もしくはポリペプチドまたは上記[6]から[9]のいずれかに記載のリボ核タンパク質複合体。
[11]上記Casタンパク質もしくはポリペプチドおよび/または上記少なくとも1つのさらなるタンパク質が少なくとも1つの機能的部分をさらに含む、上記[10]に記載のCasタンパク質、ポリペプチド、またはリボ核タンパク質複合体。
[12]上記少なくとも1つの機能的部分が、上記Casタンパク質、ポリペプチドまたはリボ核タンパク質複合体のN終端および/またはC終端、好ましくはN終端に融合または連結している、上記[11]に記載のCasタンパク質もしくはポリペプチド、またはリボ核タンパク質複合体。
[13]上記少なくとも1つの機能的部分がタンパク質であり、任意選択で、ヘリカーゼ、ヌクレアーゼ、ヘリカーゼ-ヌクレアーゼ、DNAメチラーゼ、ヒストンメチラーゼ、アセチラーゼ、ホスファターゼ、キナーゼ、転写(共)活性化因子、転写リプレッサー、DNA結合タンパク質、DNA構築タンパク質、マーカータンパク質、レポータータンパク質、蛍光タンパク質、リガンド結合タンパク質、シグナルペプチド、細胞内局在配列、抗体エピトープまたは親和性精製タグから選択される、上記[11]または上記[12]に記載のCasタンパク質もしくはポリペプチド、またはリボ核タンパク質複合体。
[14]Cas9ヌクレアーゼの天然の活性が不活化されており、Casタンパク質が少なくとも1つの機能的部分に連結している、上記[13]に記載のCasタンパク質もしくはポリペプチド、またはリボ核タンパク質複合体。
[15]上記少なくとも1つの機能的部分がヌクレアーゼドメイン、好ましくはFokIヌクレアーゼドメインである、上記[13]または上記[14]に記載のCasタンパク質もしくはポリペプチド、またはリボ核タンパク質複合体。
[16]上記少なくとも1つの機能的部分がマーカータンパク質である、上記[13]から[15]のいずれかに記載のCasタンパク質もしくはポリペプチド、またはリボ核タンパク質複合体。
[17]配列番号1のアミノ酸配列もしくはそれと少なくとも77%の同一性の配列を有するCas(CRISPR(clustered regularly interspaced short palindromic repeat:クラスター化し規則的に間隔を置いた短い回文配列の繰り返し)associated:CRISPR関連)タンパク質、またはそのポリペプチド断片をコードする単離された核酸分子。
[18]翻訳されると上記Casタンパク質またはポリペプチドと融合するアミノ酸配列をコードする少なくとも1つの核酸配列をさらに含む、上記[17]に記載の単離された核酸分子。
[19]上記Casタンパク質またはポリペプチドをコードする核酸分子に融合する上記少なくとも1つの核酸配列が、ヘリカーゼ、ヌクレアーゼ、ヘリカーゼ-ヌクレアーゼ、DNAメチラーゼ、ヒストンメチラーゼ、アセチラーゼ、ホスファターゼ、キナーゼ、転写(共)活性化因子、転写リプレッサー、DNA結合タンパク質、DNA構築タンパク質、マーカータンパク質、レポータータンパク質、蛍光タンパク質、リガンド結合タンパク質、シグナルペプチド、細胞内局在配列、抗体エピトープまたは親和性精製タグから選択されるタンパク質をコードする、上記[18]に記載の単離された核酸分子。
[20]上記[17]から[19]のいずれかに記載の核酸分子を含む発現ベクター。
[21]少なくとも1つのターゲティングRNA分子をコードするヌクレオチド配列をさらに含む、上記[20]に記載の発現ベクター。
[22]標的核酸を改変する方法であって、上記核酸を、
a.上記[6]から[9]のいずれかに記載のリボ核タンパク質複合体、または
b.上記[10]から[16]のいずれかに記載のタンパク質またはタンパク質複合体および上記[4]から[9]のいずれかに記載の少なくとも1つのターゲティングRNA分子と接触させることを含む方法。
[23]細胞中で標的核酸を改変する方法であって、上記細胞を上記[21]に記載の発現ベクターで形質転換、トランスフェクトもしくは形質導入すること、または代わりに上記細胞を上記[20]に記載の発現ベクターおよび上記[4]から[9]のいずれかに記載のターゲティングRNA分子をコードするヌクレオチド配列を含むさらなる発現ベクターで形質転換、トランスフェクトもしくは形質導入することを含む方法。
[24]細胞中で標的核酸を改変する方法であって、上記細胞を上記[20]に記載の発現ベクターで形質転換、トランスフェクトもしくは形質導入し、次いで、上記[4]から[9]のいずれかに記載のターゲティングRNA分子を上記細胞に、または上記細胞内に送達することを含む方法。
[25]上記[22]から[24]のいずれかに記載の標的核酸を改変する方法であって、上記少なくとも1つの機能的部分がマーカータンパク質またはレポータータンパク質であり、上記マーカータンパク質またはレポータータンパク質が上記標的核酸と会合し、好ましくは上記マーカーが蛍光タンパク質、例えば、緑色蛍光タンパク質(GFP)である、方法。
[26]上記標的核酸がDNA、好ましくはdsDNAである、上記[22]から[25]のいずれかに記載の方法。
[27]上記標的核酸がRNAである、上記[22]から[25]のいずれかに記載の方法。
[28]上記[26]に記載の標的核酸を改変する方法であって、上記核酸がdsDNAであり、上記少なくとも1つの機能的部分がヌクレアーゼまたはヘリカーゼ-ヌクレアーゼであり、上記改変が所望の遺伝子座での一本鎖または二本鎖切断である、方法。
[29]上記[23]、[24]、[26]または[28]に記載の方法のいずれかに従って所望の遺伝子座で遺伝子発現をサイレンシングする方法。
[30]上記[23]、[24]、[26]または[28]に記載の方法のいずれかに従って所望の位置で所望のヌクレオチド配列を改変または欠失および/もしくは挿入する方法。
[31]上記[22]から[26]のいずれかに記載の方法]に記載の標的核酸配列を改変することを含む、細胞中で遺伝子発現を改変する方法であって、上記核酸がdsDNAであり、上記機能的部分がDNA修飾酵素(例えば、メチラーゼまたはアセチラーゼ)、転写活性化因子または転写リプレッサーから選択される、方法。
[32]上記[27]に記載の方法]に記載の標的核酸配列を改変することを含む、細胞中で遺伝子発現を改変する方法であって、上記核酸がmRNAであり、上記機能的部分がリボヌクレアーゼであり、任意選択でエンドヌクレアーゼ、3’エキソヌクレアーゼまたは5’エキソヌクレアーゼから選択される、方法。
[33]50℃と100℃の間の温度で実行される、上記[22]から[32]のいずれかに記載の標的核酸を改変する方法。
[34]60℃または60℃より上、好ましくは60℃と80℃の間、より好ましくは60℃と65℃の間の温度で実行される、上記[33]に記載の標的核酸を改変する方法。
[35]上記細胞が原核細胞である、上記[22]から[34]のいずれかに記載の方法。
[36]上記細胞が真核細胞である、上記[22]から[35]のいずれかに記載の方法。
[37]上記[22]から[33]のいずれかに記載の方法により形質転換される宿主細胞。
したがって、本発明は、
a.アミノ酸モチーフEKDGKYYC[配列番号2];および/または
b.アミノ酸モチーフX1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);および/または
c.アミノ酸モチーフX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);および/または
d.アミノ酸モチーフX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである);および/または
e.アミノ酸モチーフX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)
を含む、単離されたCas(CRISPR(clustered regularly interspaced short palindromic repeat:クラス
ター化し規則的に間隔を置いた短い回文配列の繰り返し)associated:CRISPR関連)タンパク質またはポリペプチドを提供する。
【0011】
本発明の状況でのポリペプチドは、よい。そのような断片は不活性であり、遺伝物質の編集または切断と直接関連のない方完全長Casタンパク質の断片と見なしても法でおよび目的のために、例えば、アッセイでの標準または抗体を産生するなどのために使用してもよい。
【0012】
しかし、好ましい実施形態では、Casタンパク質またはポリペプチドは、少なくとも1つのターゲティングRNA分子、およびターゲティングRNA分子により認識される標的核酸配列を含むポリヌクレオチドと会合すると、50℃から100℃までの範囲の温度で機能的であり、DNAを切断することができる。
【0013】
特定の実施形態では、本発明は、アミノ酸モチーフEKDGKYYC[配列番号2]を含むCasタンパク質またはポリペプチドを提供することができる。他の実施形態では、Casタンパク質またはポリペプチドはアミノ酸モチーフX1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである)をさらに含んでいてもよい。
【0014】
他の実施形態では、本明細書で定義されるCasタンパク質またはポリペプチドはアミノ酸モチーフX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される)を追加でさらに含んでいてもよい。
【0015】
他の実施形態では、本明細書で定義されるCasタンパク質またはポリペプチドはアミノ酸モチーフX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである)を追加でさらに含んでいてもよい。
【0016】
他の実施形態では、本明細書で定義されるCasタンパク質またはポリペプチドはアミノ酸モチーフX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)を追加でさらに含んでいてもよい。
【0017】
本発明に従えば、本発明のCasタンパク質またはポリペプチドは配列番号2から6のモチーフのうちのいずれでも、単独でまたは組み合わせて含むことができることが認識されうる。以下は、本発明のCasタンパク質またはポリペプチドを特徴付けることができるモチーフの組合せのそれぞれを要約している。
【0018】
EKDGKYYC[配列番号2]
【0019】
EKDGKYYC[配列番号2];およびX1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである)。
【0020】
EKDGKYYC[配列番号2];およびX1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);およびX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される)。
【0021】
EKDGKYYC[配列番号2];およびX1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);およびX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである)。
【0022】
EKDGKYYC[配列番号2];およびX1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);およびX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0023】
EKDGKYYC[配列番号2];およびX1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);およびX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0024】
EKDGKYYC[配列番号2];およびX1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0025】
EKDGKYYC[配列番号2];およびX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0026】
EKDGKYYC[配列番号2];およびX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される)。
【0027】
EKDGKYYC[配列番号2];およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである)。
【0028】
EKDGKYYC[配列番号2];およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0029】
EKDGKYYC[配列番号2];およびX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである)。
【0030】
EKDGKYYC[配列番号2];およびX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0031】
EKDGKYYC[配列番号2];およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0032】
X1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);およびX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される)。
【0033】
X1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);およびX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである)。
【0034】
X1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);およびX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0035】
X1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0036】
X1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである)。
【0037】
X1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0038】
X5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0039】
X5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);およびX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである)。
【0040】
X5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0041】
X7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである);およびX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)。
【0042】
別の態様では、本発明は、配列番号1のアミノ酸配列またはそれと少なくとも77%の同一性の配列を有する単離されたCasタンパク質またはそのポリペプチド断片であって、50℃から100℃までの範囲の温度でDNAを切断することができるCasタンパク質またはポリペプチドを提供する。
【0043】
好ましくは、Casタンパク質またはポリペプチドは60℃から80℃までの範囲の温度でDNAを切断することができる。例えば、DNA切断は、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃または80℃の温度で起こる。より好ましくは、Casタンパク質またはポリペプチドは、60℃から65℃の範囲の温度でDNAを切断することができる。好ましい態様では、本発明のCasタンパク質またはポリペプチド断片は、配列番号1に対して少なくとも75%の同一性;好ましくは少なくとも85%;より好ましくは少なくとも90%;さらにより好ましくは少なくとも95%の同一性のアミノ酸配列を含むことができる。
【0044】
さらに詳細には、本発明のCasタンパク質またはポリペプチドは、配列番号1と以下の通り:少なくとも60%、少なくとも61%、少なくとも62%、少なくとも63%、少なくとも64%、少なくとも65%、少なくとも66%、少なくとも67%、少なくとも68%、少なくとも69%、少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.5%または少なくとも99.8%のパーセント同一性を有するアミノ酸配列を含むことができる。
【0045】
配列番号1とのパーセントアミノ酸配列同一性は、2つの配列の最適整列のために導入する必要があるギャップの数およびそれぞれのギャップの長さを考慮に入れて、選択された比較窓において配列により共有されている同一の位置の数の関数として決定可能である。
【0046】
本発明のCasタンパク質またはポリペプチド断片は、基準配列の配列番号1とパーセント配列同一性により定義されるその任意の前述のパーセント変異体の両方の点から、単独でまたは本質的特徴としての前述のアミノ酸モチーフ(すなわち、配列番号2および/または3および/または4および/または5および/または6)のいずれかと組み合わせて、特徴付けることができる。
【0047】
その上、本発明は本発明の前述のタンパク質またはポリペプチドのいずれかをコードする核酸を提供する。核酸は単離されていても発現構築物の形態であってもよい。
【0048】
本発明のすべての前述の態様では、アミノ酸残基は保存的にも非保存的にも置換されていてよい。保存的アミノ酸置換とは、アミノ酸残基が類似する化学的特性(例えば、電荷または疎水性)を有する他のアミノ酸残基で置換され、したがって、得られるポリペプチドの機能的特性を変化させないアミノ酸置換のことである。
【0049】
同様に、核酸配列がポリペプチドの機能に影響を与えずに保存的にも非保存的にも置換されうることは当業者であれば認識している。保存的に改変された核酸とは、アミノ酸配列の同一のまたは機能的に同一の変異体をコードする核酸で置換された核酸のことである。核酸のそれぞれのコドン(AUGおよびUGGを除く;典型的にはそれぞれメチオニンまたはトリプトファンの唯一のコドン)は改変して機能的に同一の分子を生じることが可能であることは当業者であれば認識している。したがって、ポリヌクレオチドまたはポリペプチドのそれぞれのサイレント変異(すなわち、同義コドン)は、本発明のポリペプチドをコードし、それぞれの記載されているポリペプチド配列に潜在的に含まれている。
【0050】
切断温度
本発明のCasタンパク質のヌクレアーゼ活性の最適温度範囲を含む温度範囲は、既知のCas9タンパク質よりも著しく高い。その上、本発明のCasタンパク質がヌクレアーゼ活性を保持する範囲の最上方は、既知のCas9タンパク質よりもはるかに高い。より高い最適温度および機能範囲は高温での遺伝子工学に、したがって、例えば、好熱性生物のゲノムの編集に著しい利点を与え、この好熱性生物の多くが高温で行われる様々な工業、農業および製薬工程において有用性がある。
【0051】
有利なことに、本発明のCasタンパク質またはポリペプチドは20℃から100℃で核酸を切断することができるが、高温、例えば、41℃と122℃の間、好ましくは50℃と100℃の間で特に有用である。本発明のCasタンパク質およびポリペプチドは、DNA、RNAおよび合成核酸を切断することができる。本発明のCasタンパク質またはポリペプチドは、例えば、20から40℃の範囲の温度でヌクレアーゼ活性および遺伝子編集適用に操作性を与えることもできる。
【0052】
好ましくは、本発明のCasタンパク質またはポリペプチドは、ポリヌクレオチド分子(複数可)中の、切断され、標識されまたは改変される標的配列を認識する適切なgRNA(ガイドRNA)と会合する場合、50℃から100℃の範囲の、任意選択で55℃から100℃、60℃から100℃、65℃から100℃、70℃から100℃、75℃から100℃、80℃から100℃、85℃から100℃、90℃から100℃、95℃から100℃の範囲の温度で会合する。より好ましくは、本発明のCasタンパク質は、51℃から99℃、52℃から98℃、53℃から97℃、54℃から96℃、55℃から95℃、56℃から94℃、57℃から93℃、58℃から92℃、59℃から91℃、60℃から90℃、61℃から89℃、62℃から88℃、63℃から87℃、64℃から86℃、65℃から85℃、66℃から84℃、67℃から83℃、68℃から82℃、69℃から81℃、70℃から80℃、71℃から79℃、72℃から78℃、73℃から77℃、74℃から76℃、75℃の範囲の温度で核酸を切断する、標識または改変する。好ましくは、本発明のCasタンパク質は、60℃から80℃、61℃から79℃、62℃から78℃、63℃から77℃、64℃から76℃、60℃から75℃、60℃から70℃の範囲の温度で核酸を切断する、標識または改変する。本発明のCasタンパク質は、60℃から65℃の範囲の温度で、好ましくは65℃で、核酸を切断、標識または改変するのが最適である。
【0053】
本発明のすべての態様では、Casタンパク質またはポリペプチドは、細菌、古細菌またはウイルスから入手するもしくはこれらに由来してもよく、または代わりに新規に合成してもよい。好ましい実施形態では、本発明のCasタンパク質またはポリペプチドは、古細菌または細菌として分類してもよい、しかし好ましくは細菌である好熱性原核生物に由来する。より好ましくは、本発明のCasタンパク質またはポリペプチドは、好熱性細菌に由来することになる。本明細書では、用語好熱性は、相対的に高い温度で生存し成長することができる、例えば、本発明の文脈では、41℃と122℃(106と252゜F)の間で核酸を切断することができることを意味すると理解されるべきである。好ましくは、本発明のCasタンパク質またはポリペプチドは、1つまたは複数の好熱性細菌から単離することができ、60℃よりも上で機能する。好ましくは、本発明のCasタンパク質またはポリペプチドは、1つまたは複数の好熱性細菌から単離することができ、60℃から80℃の範囲で、最適には60℃と65℃の間で機能する。好ましい実施形態では、本発明のCasタンパク質またはポリペプチドは、ゲオバチルス種(Geobacillus sp.)に由来する。より好ましくは、本発明のCasタンパク質はゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)に由来する。さらにより好ましくは、本発明のCasタンパク質はゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)T12に由来する。本発明のCasタンパク質またはポリペプチドはウイルスに由来してもよい。
【0054】
RNAガイドおよび標的配列
本発明のCasタンパク質は、高温での標的核酸の配列特異的切断、タグ付け、標識付けまたは改変を可能にする。標的核酸は、DNA(一本鎖または二本鎖)でもRNAでも合成核酸でもよい。本発明の特に有用な応用は、ゲノムDNAの標的配列に相補的に結合する1つまたは複数のガイドRNA(gRNA)と複合した本発明の1つまたは複数のCasタンパク質によるゲノムDNAの配列特異的ターゲティングおよび改変である。したがって、標的核酸は好ましくは二本鎖DNAである。そのようなターゲティングはin vitroでもin vivoでも実施することができる。好ましくは、そのようなターゲティングはin vivoで実施される。この方法で、本発明のCasタンパク質を使用して細胞のゲノムDNAに位置する特定のDNA配列を標的にして改変することができる。Cas系を使用して、異なる生物の種々の細胞型でおよび/または異なる生物でゲノムを改変することができることが想定されている。
【0055】
したがって、本発明は、上文に記載される本発明のCasタンパク質またはポリペプチドを含み、標的ポリヌクレオチド中の特定のヌクレオチド配列を認識するという点でターゲティング機能を有する少なくとも1つのRNA分子をさらに含むリボ核タンパク質複合体を提供する。好ましくは、RNA分子は、一本鎖RNA分子、例えば、CRISPR RNA(crRNA)であり、例えば、ハイブリダイゼーションによりtracrRNAと会合する。ターゲティングRNAはcrRNAとtracrRNAのキメラでもよい。前述のRNA分子は、標的ヌクレオチド配列に対して少なくとも90%の同一性、または相補性のリボヌクレオチド配列を有することができる。任意選択で、RNA分子は、標的ヌクレオチド配列に対して少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%もしくは100%の同一性または相補性のリボヌクレオチド配列を有する。好ましい標的ヌクレオチド配列はDNAである。
【0056】
好ましい態様では、本発明は、少なくとも1つのターゲティングRNA分子が標的DNA配列にその長さに沿って実質的に相補的である、上文に記載されるリボ核タンパク質複合体を提供する。
【0057】
したがって、本発明のCasタンパク質と会合するRNAガイドの配列を変化させると、Casタンパク質をガイドRNAに相補的である部位で二本鎖DNAを標識または切断するようプログラムすることが可能になる。
【0058】
好ましくは、本発明のリボ核タンパク質複合体中の少なくとも1つのターゲティングRNA分子の長さは、35から135残基の範囲、任意選択で、35から134残基、35から133残基、35から132残基、35から131残基、35から130残基、35から129残基、35から128残基、35から127残基、35から126残基、35から125残基、35から124残基、35から123残基、35から122残基、35から121残基、35から120残基、35から119残基、35から118残基、35から117残基、35から116残基、35から115残基、35から114残基、35から113残基、35から112残基、35から111残基、35から100残基、35から109残基、35から108残基、35から107残基、35から106残基、35から105残基、35から104残基、35から103残基、35から102残基、35から101残基、35から100残基、35から99残基、35から98残基、35から97残基、35から96残基、35から95残基、35から94残基、35から93残基、35から92残基、35から91残基、35から90残基、35から89残基、35から88残基、35から87残基、35から86残基、35から85残基、35から84残基、35から83残基、35から82残基、35から81残基、35から80残基、35から79残基、35から78残基、35から77残基、35から76残基、35から75残基、35から74残基、35から73残基、35から72残基、35から71残基、35から70残基、35から69残基、35から68残基、35から67残基、35から66残基、35から65残基、35から64残基、35から63残基、35から62残基、35から61残基、35から60残基、35から59残基、35から58残基、35から57残基、35から56残基、35から55残基、35から54残基、35から53残基、35から52残基、35から51残基、35から50残基、35から49残基、35から48残基、35から47残基、35から46残基、35から45残基、35から44残基、35から43残基、35から42残基、35から41残基、35から40残基、35から39残基、35から38残基、35から37残基、35から36残基、または35残基の範囲である。好ましくは、少なくとも1つのRNA分子の長さは、36から174残基、37から173残基、38から172残基、39から171残基、40から170残基、41から169残基、42から168残基、43から167残基、44から166残基、45から165残基、46から164残基、47から163残基、48から162残基、49から161残基、50から160残基、51から159残基、52から158残基、53から157残基、54から156残基、36から74残基、37から73残基、38から72残基、39から71残基、40から70残基、41から69残基、42から68残基、43から67残基、44から66残基、45から65残基、46から64残基、47から63残基、48から62残基、49から61残基、50から60残基、51から59残基、52から58残基、53から57残基、54から56残基の範囲である。
【0059】
好ましい態様では、本発明は、少なくとも1つのRNA分子の相補的部分が少なくとも30残基長である、リボ核タンパク質複合体を提供する。代わりに、少なくとも1つのRNA分子の相補的部分は、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74または75残基長でもよい。
【0060】
ターゲティングRNA分子は、好ましくは、標的核酸配列に対する高い特異性および親和性を必要とすることになる。未変性ゲル電気泳動、または代わりに等温滴定熱量測定、表面プラズモン共鳴、もしくは蛍光ベースの滴定法により決定することができる場合、1μMから1pM、好ましくは1nMから1pM、より好ましくは1~100pMの範囲の解離定数(Kd)が望ましい。親和性は、ゲル遅延度アッセイとも呼ばれる電気泳動移動度シフトアッセイ(EMSA)を使用して決定してもよい(Semenova E et al. (2011) PNAS 108: 10098-10103参照)。
【0061】
ターゲティングRNA分子は、好ましくは、CRISPR RNA(crRNA)分子として原核生物の性質から分かっていることに合わせて作られる。crRNA分子の構造はすでに確立されており、Jore et al., 2011, Nature Structural & Molecular Biology 18: 529-537でさらに詳細に説明されている。手短に言えば、I-E型の成熟crRNAは、多くの場合、61ヌクレオチド長であり、8ヌクレオチドの5’「ハンドル」領域、32ヌクレオチドの「スペーサー」配列、およびテトラヌクレオチドループを有するヘアピンを形成する21ヌクレオチドの3’配列からなる(
図5)。I型系はII型(Cas9)とは異なり、異なる系の詳細はVan der Oost 2014 Nat Rev Micr 12: 479-492に記載されている。II型(Cas9)系には異なるプロセシング機構が存在しており、第2のRNA(tracrRNA)および2つのリボヌクレアーゼを利用している。ヘアピンよりはむしろ、II型中の成熟crRNAはtracrRNAの断片に結合したままである(
図5)。しかし、本発明で使用されるRNAは、長さであれ、領域であれまたは特定のRNA配列であれ、天然に存在するcrRNAの設計に厳密に合わせて設計する必要はない。しかし、明白なのは、本発明で使用するためのRNA分子は、公開データベース中のまたは新たに発見された遺伝子配列情報に基づいて設計され、次に、例えば、化学合成により全体をまたは部分を人工的に作ってもよいことである。本発明のRNA分子は、遺伝的に改変された細胞または無細胞発現系での発現のために設計および作製されてもよく、この選択肢にはRNA配列の一部または全部の合成が含まれてもよい。
【0062】
II型(Cas9)中のcrRNAの構造および必要条件もJinek et al., 2012 ibidに記載されている。I型には、スペーサー配列の5’末端を形成し、そこの5’で8ヌクレオチドの5’ハンドルと隣接しているいわゆる「シード(SEED)」部分が存在する。Semenova et al. (2011, PNAS 108: 10098-10103)は、シード配列のすべての残基が標的配列に相補的であるはずであるが、6位の残基ではミスマッチが許容されうることを見出した(
図5)。II型には、スペーサーの3’末端に位置している10~12ヌクレオチドのシードが存在する(
図5)(Van der Oost 2014 ibid.により概説されている)。同様に、標的遺伝子座(すなわち、配列)に向けられている本発明のリボ核タンパク質複合体のRNA成分を設計し作る場合、II型シード配列についての必要なマッチおよびミスマッチルールを適用することが可能である。
【0063】
したがって、本発明は、標的核酸分子において単一塩基変化を検出するおよび/または位置付ける方法であって、核酸試料を上文に記載される本発明のリボ核タンパク質複合体と、または上文に記載される本発明のCasタンパク質もしくはポリペプチドおよび別のターゲティングRNA成分と接触させることを含み、ターゲティングRNAの配列(リボ核タンパク質複合体中にある場合を含めて)は、例えば、8ヌクレオチド残基の連続する配列の6位での単一塩基変化に基づいて正常対立遺伝子と突然変異対立遺伝子を区別するようになっている、方法を含む。
【0064】
特定の理論に縛られたくはないが、本発明のリボ核タンパク質複合体のターゲティングRNA成分を調製するのに使用してもよいデザインルールは、標的ポリヌクレオチド鎖にいわゆる「PAM」(プロトスペーサー隣接モチーフ)配列を含む。PAM配列は、大腸菌(E.coli)のI-E型系中のヌクレオチド残基の保存されたトリプレット、5’-CTT-3’、5’-CAT-3’、5’-CCT-3’、5’-CAC-3’、5’-TTT-3’、5’-ATT-3’、および5’-AWG-3’でもよく、WはA、TまたはUである。I型では、標的鎖に位置しているPAM配列は通常、シードの5’に対応する位置にある。しかし、II型では、PAMは、シードの3’に対応する位置で、crRNAスペーサーの3’末端に近い置換鎖上のもう一方の末端に位置している(
図5)(Jinek et al., 2012, op. cit.)。化膿性連鎖球菌(Streptococcus pyogenes)Cas9では、PAM配列は保存された対のヌクレオチド残基、5’-NGG-3’を有する。最近、異なるCas9変異体(IIA型およびIIC型)(Ran et al., 2015 Nature 520:186-191)-
図1A)が特徴付けられ、PAMが明らかにされた(Ran et al., 2015, ibid.参照-
図1C)。現在確立されているCas9 PAMは、IIA型5’-NGGNNNN-3’(化膿性連鎖球菌(Streptococcus pyogenes))、5’-NNGTNNN-3’(ストレプトコッカス・パスツリアヌス(Streptococcus pasteurianus))、5’-NNGGAAN-3’(ストレプトコッカス・サーモフィルス(Streptococcus thermophilus))、5’-NNGGGNN-3’(黄色ブドウ球菌(Staphylococcus aureus))、およびIIC型5’-NGGNNNN-3’(ジフテリア菌(Corynebacterium difteriae))、5’-NNGGGTN-3’(カンピロバクター・ラリ(Campylobacter lari))、5’-NNNCATN-3’(パルビバクラム・ラバメンティボランス(Parvobaculum lavamentivorans))、5’-NNNNGTA-3’(ナイセリア・シネレア(Neiseria cinerea))を含む。ゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)T12のCas9(本発明)はIIC型に属する(Ran et al., 2015, ibid.)。したがって、特定の理論に縛られたくはないが、本発明者らは、PAM配列のほうがIIC型Cas9リボ核タンパク質複合体について確立された配列にもっと密接に近似すると予想している。
【0065】
本発明の実施形態では、ターゲティングRNA分子は35~75残基の範囲の長さを有していてもよい。好ましい実施形態では、RNAのうち所望の核酸配列に相補的であり、これを標的にするために使用される部分は31または32残基長である。天然に存在するcrRNAの文脈では、これは、例えば、Semenova et al. (2011 ibid.)の
図1に示されているスペーサー部分と一致する。
【0066】
本発明のリボ核タンパク質複合体は、DNA標的配列に実質的な相補性を有するRNA配列の5’にCRISPR繰り返しに由来する8残基を含むターゲティング成分を有していてもよい。DNA標的配列に相補性を有するRNA配列は、スペーサー配列であるcrRNAの文脈で一致すると理解される。RNAの5’隣接配列は、例えば、Semenova et al. (2011 ibid.)の
図1に示されているように、crRNAの5’ハンドルに一致すると見なされるであろう。
【0067】
本発明のリボ核タンパク質複合体は、DNA標的配列に相補性を有するターゲティングRNA配列の3’に、すなわち、例えば、Semenova et al. (2011 ibid.)の
図1に示されているように、crRNA中のスペーサー配列に隣接する3’ハンドルに一致するものの3’にヘアピンおよびテトラヌクレオチドループ形成配列を有していてもよい。
【0068】
特定の理論に縛られたくはないが、好ましいリボ核タンパク質複合体では、リボ核タンパク質複合体のターゲティングRNAと対合しない標的配列DNA鎖は、5’-NGGNNNN-3’、5’-NNGTNNN-3’、5’-NNGGAAN-3’、5’-NNGGGNN-3’、5’-NGGNNNN-3’、5’-NNGGGTN-3’、5’-NNNCATN-3’、5’-NNNNGTA-3’から選択される直接3’隣接トリプレットを含んでもよく、前記トリプレット残基はそれぞれがそれぞれの相補的DNA鎖残基と対合しない。しかし、他のトリプレットまたはヌクレオチドの組合せを所望の応用に応じて使用してもよいことは認識されている。これらのトリプレットは、天然に存在するcrRNAの文脈で「プロトスペーサー隣接モチーフ」または「PAM」と呼ばれているものと一致している。IIC型CRISPR/Cas系では、これらのPAMトリプレットは、天然系標的でも、したがって好ましくは本発明に従ったRNAでも、標的配列に対するcrRNAの高度な特異性を保証するために、そのdsDNA標的とのCascade/crRNA複合体の安定な相互作用に必要とされる。
【0069】
機能的部分
有利なことに、任意のポリヌクレオチド配列を配列特異的に標的にする本発明のCasタンパク質、ポリペプチドおよびリボ核タンパク質複合体の能力は、何らかの方法で、例えば、標的核酸を切断および/または標識および/または修飾することにより、標的核酸を改変するために利用することができる。したがって、これを達成するためにはCasタンパク質またはポリペプチドと共に追加のタンパク質を提供してもよいことが認識されよう。したがって、本発明のCasタンパク質、ポリペプチドまたはリボ核タンパク質複合体は、少なくとも1つのさらなるタンパク質を含むタンパク質複合体の一部として提供されてもよい。好ましい態様では、本発明は、Casタンパク質または少なくとも1つのさらなるタンパク質が少なくとも1つの機能的部分をさらに含む、Casタンパク質、ポリペプチドまたはリボ核タンパク質複合体を提供する。少なくとも1つの機能的部分は、Casタンパク質に融合または連結していてもよい。好ましくは、少なくとも1つの機能的部分は、天然のまたは人工的タンパク質発現系での発現を通じてCasタンパク質に翻訳によって融合してもよい。代わりに、少なくとも1つの機能的部分は、化学合成ステップによりCasタンパク質に共有結合によって連結してもよい。好ましくは、少なくとも1つの機能的部分は、Casタンパク質のN終端および/またはC終端、好ましくはN終端に融合または連結している。
【0070】
少なくとも1つの機能的部分はタンパク質であることが望ましい。タンパク質は、異種タンパク質であってもよく、または代わりにCasタンパク質が由来した細菌種に固有であってもよい。少なくとも1つの機能的部分はタンパク質であってもよく、任意選択で、ヘリカーゼ、ヌクレアーゼ、ヘリカーゼ-ヌクレアーゼ、DNAメチラーゼ、ヒストンメチラーゼ、アセチラーゼ、ホスファターゼ、キナーゼ、転写(共)活性化因子、転写リプレッサー、DNA結合タンパク質、DNA構築タンパク質、マーカータンパク質、レポータータンパク質、蛍光タンパク質、リガンド結合タンパク質、シグナルペプチド、細胞内局在配列、抗体エピトープまたは親和性精製タグから選択されうる。
【0071】
特に好ましい態様では、本発明は、少なくとも1つの機能的部分がマーカータンパク質、例えば、GFPである、Casタンパク質、ポリペプチドまたはリボ核タンパク質複合体を提供する。
【0072】
ヌクレアーゼ活性
本発明の任意の態様のCasリボ核タンパク質は、50℃と100℃の間で核酸切断活性を有する。本発明のリボ核タンパク質は、DNA、RNAまたは合成核酸を切断することができる。好ましい態様では、本発明のCasリボ核タンパク質は、DNAを、特に二本鎖DNAを配列特異的に切断することができる。
【0073】
本発明のいかなる態様でも、本発明のCasタンパク質、ポリペプチドまたはリボ核タンパク質は、1つよりも多いヌクレアーゼドメインを有してもよい。部位特異的ヌクレアーゼは、DNAの鎖に沿って選択された位置で二本鎖切断(DSB)を生じさせることができる。標的宿主細胞では、これによりゲノム内の特定の前選択した位置でDSBを作ることができる。部位特異的ヌクレアーゼによるそのような切断の作製に促されて、目的のゲノム内の所望の位置でDNAを挿入、欠失または改変するために内在性細胞修復機構が別の目的で利用される。
【0074】
タンパク質またはポリペプチド分子の1つまたは複数のヌクレアーゼ活性部位は、例えば、タンパク質またはポリペプチドに連結または融合している別の機能的な部分、例えば、Fok1ヌクレアーゼの活性を可能にするように不活化させてもよい。
【0075】
したがって、本発明のCasタンパク質、ポリペプチドおよびリボ核タンパク質がある特定の応用のために内在性ヌクレアーゼ活性を有するにもかかわらず、Casタンパク質の天然のヌクレアーゼ活性を不活化し、天然のCas9ヌクレアーゼ活性が不活化されCasタンパク質が少なくとも1つの機能的部分に連結しているCasタンパク質またはリボ核タンパク質複合体を提供するのが望ましい場合がある。天然のCas9ヌクレアーゼ活性の相補性によるミスターゲティング事象の発生率を減らすことは1つのそのような応用である。これは、望ましくは、Casタンパク質またはリボ核タンパク質複合体の天然のCas9ヌクレアーゼ活性を不活化させ、好ましくはCasタンパク質に融合している、異種ヌクレアーゼを提供することにより達成することもできる。したがって、本発明は、少なくとも1つの機能的部分がヌクレアーゼドメイン、好ましくはFokIヌクレアーゼドメインである、Casタンパク質またはリボ核タンパク質複合体を提供する。特に好ましい態様では、FokIヌクレアーゼドメインに融合している本発明のCasタンパク質またはリボ核タンパク質複合体は、好ましくは、FokIヌクレアーゼドメインに融合している本発明の別のCasタンパク質またはリボ核タンパク質複合体を含み、2つの複合体が標的ゲノムDNAの反対の鎖を標的にする、タンパク質複合体の一部として提供される。
【0076】
いくつかの応用では、例えば、Casタンパク質またはリボ核タンパク質複合体が核酸中の特定の標的配列を認識し改変する、例えば、その標的配列を診断検査の一部として標識するのに利用する応用では、Casタンパク質、ポリペプチドまたはリボ核タンパク質のヌクレアーゼ活性を完全に減弱させるのが望ましい場合がある。そのような応用では、Casタンパク質のヌクレアーゼ活性は不活化されてもよく、Casタンパク質に融合している機能的部分はタンパク質でもよく、任意選択で、ヘリカーゼ、ヌクレアーゼ、ヘリカーゼ-ヌクレアーゼ、DNAメチラーゼ、ヒストンメチラーゼ、アセチラーゼ、ホスファターゼ、キナーゼ、転写(共)活性化因子、転写リプレッサー、DNA結合タンパク質、DNA構築タンパク質、マーカータンパク質、レポータータンパク質、蛍光タンパク質、リガンド結合タンパク質、シグナルペプチド、細胞内局在配列、抗体エピトープまたは親和性精製タグから選択されうる。
【0077】
特に好ましい態様では、本発明は、Casタンパク質のヌクレアーゼ活性が不活化され少なくとも1つの機能的部分がマーカータンパク質、例えば、GFPである、Casタンパク質またはリボ核タンパク質複合体を提供する。この方法で、目的の核酸配列を特異的に標的にし、光シグナルを発生させるマーカーを使用してその核酸配列を可視化することが可能になりうる。適切なマーカーは、例えば、蛍光レポータータンパク質、例えば、緑色蛍光タンパク質(GFP)、黄色蛍光タンパク質(YFP)、赤色蛍光タンパク質(RFP)、シアン蛍光タンパク質(CFP)またはmCherryを含んでいてもよい。そのタンパク質の発現は蛍光測定により簡単に直接的にアッセイすることが可能なので、そのような蛍光レポーター遺伝子はタンパク質発現の可視化に適したマーカーを提供する。代わりに、レポーター核酸は、ルシフェラーゼ(例えば、ホタルルシフェラーゼ)など発光タンパク質をコードしてもよい。代わりに、レポーター遺伝子は、光シグナルを発生させるのに使用することが可能な発色酵素、例えば、発色酵素(ベータ-ガラクトシダーゼ(LacZ)またはベータ-グルクロニダーゼ(Gus)など)でもよい。発現の測定に使用されるレポーターは、抗原ペプチドタグでもよい。他のレポーターまたはマーカーは当技術分野では公知であり、必要に応じて使用してもよい。
【0078】
マーカーは可視化することができるので、標的核酸がRNA、具体的にはmRNAであるある特定の実施形態では、特に、マーカーにより発生する光シグナルが発現産物の量に正比例している場合、マーカーにより発生する光シグナルの検出および定量化により遺伝子の転写活性を定量化することが可能でありうる。したがって、本発明の好ましい実施形態では、本発明のCasタンパク質またはリボ核タンパク質を使用して、目的の遺伝子の発現産物をアッセイすることができる。
【0079】
初めから終わりまで、本発明のCasタンパク質の基準配列は、アミノ酸配列をコードするヌクレオチド配列として定義することができる。例えば、配列番号2から6に定義されるモチーフのアミノ酸配列は、そのアミノ酸配列をコードするすべての核酸配列も含む。
【0080】
したがって、本発明は、
a.アミノ酸モチーフEKDGKYYC[配列番号2];および/または
b.アミノ酸モチーフX1X2CTX3X4[配列番号3](式中、X1はイソロイシン、メチオニンまたはプロリンから独立して選択され、X2はバリン、セリン、アスパラギンまたはイソロイシンから独立して選択され、X3はグルタミン酸またはリシンから独立して選択され、X4はアラニン、グルタミン酸またはアルギニンのうちの1つである);および/または
c.アミノ酸モチーフX5LKX6IE[配列番号4](式中、X5はメチオニンまたはフェニルアラニンから独立して選択され、X6はヒスチジンまたはアスパラギンから独立して選択される);および/または
d.アミノ酸モチーフX7VYSX8K[配列番号5](式中、X7はグルタミン酸またはイソロイシンであり、X8はトリプトファン、セリンまたはリシンのうちの1つである);および/または
e.アミノ酸モチーフX9FYX10X11REQX12KEX13[配列番号6](式中、X9はアラニンまたはグルタミン酸であり、X10はグルタミンまたはリシンであり、X11はアルギニンまたはアラニンであり、X12はアスパラギンまたはアラニンであり、X13はリシンまたはセリンである)
を含むCasタンパク質であって、
少なくとも1つのターゲティングRNA分子、およびターゲティングRNA分子により認識される標的核酸配列を含むポリヌクレオチドと会合すると50℃と100℃の間でDNAを切断することができるCasタンパク質をコードする単離された核酸分子も提供する。
【0081】
別の態様では、本発明は、配列番号1のアミノ酸配列またはそれと少なくとも77%の同一性の配列を有するCas(CRISPR(clustered regularly interspaced short palindromic repeat)associated)タンパク質をコードする単離された核酸分子も提供する。
【0082】
別の態様では、本発明は、翻訳されるとCasタンパク質に融合するペプチドをコードする少なくとも1つの核酸配列をさらに含む、単離された核酸分子も提供する。
【0083】
別の態様では、本発明は、Casタンパク質をコードする核酸分子に融合する少なくとも1つの核酸配列が、ヘリカーゼ、ヌクレアーゼ、ヘリカーゼ-ヌクレアーゼ、DNAメチラーゼ、ヒストンメチラーゼ、アセチラーゼ、ホスファターゼ、キナーゼ、転写(共)活性化因子、転写リプレッサー、DNA結合タンパク質、DNA構築タンパク質、マーカータンパク質、レポータータンパク質、蛍光タンパク質、リガンド結合タンパク質、シグナルペプチド、細胞内局在配列、抗体エピトープまたは親和性精製タグから選択されるタンパク質をコードする、単離された核酸分子も提供する。
【0084】
発現ベクター
本発明の核酸は単離されていてもよい。しかし、核酸感知構築物の発現が選ばれた細胞で実行されうるように、Casタンパク質またはリボ核タンパク質をコードするポリヌクレオチド配列は、好ましくは、発現構築物中に提供されている。いくつかの実施形態では、Casタンパク質またはリボ核タンパク質をコードするポリヌクレオチドは、適切な発現ベクターの一部として提供されることになる。ある特定の実施形態では、本発明の発現ベクター(発現するとCasタンパク質に融合するアミノ酸残基をコードするヌクレオチド配列ありまたはなしで)は、上文に定義されているターゲティングRNA分子をコードするヌクレオチド配列をさらに含んでいてもよい。したがって、そのような発現ベクターを適切な宿主で使用して、所望のヌクレオチド配列を標的にすることが可能な本発明のリボ核タンパク質複合体を産生することができる。代わりに、上文に定義されるターゲティングRNA分子をコードするヌクレオチド配列は別の発現ベクターで提供してもよく、または代わりに他の手段によって標的細胞に送達してもよい。
【0085】
適切な発現ベクターは受容細胞に応じて変化することになり、適宜、標的細胞での発現を可能にし、好ましくは高レベルの発現を促進する調節エレメントを組み込んでもよい。そのような調節配列は、例えば、開始、正確さ、速度、安定性、下流プロセシングおよび可動性の点で遺伝子または遺伝子産物の転写または翻訳に影響を与えることができてもよい。
【0086】
そのようなエレメントは、例えば、強力なおよび/または構成プロモーター、5’および3’UTR、転写および/または翻訳エンハンサー、転写因子またはタンパク質結合配列、開始部位および終結配列、リボソーム結合部位、組換え部位、ポリアデニル化配列、センスまたはアンチセンス配列、転写の正確な開始を確実にする配列ならびに任意選択で、宿主細胞における転写の終結および転写物安定化を確実にするポリAシグナルを含んでいてもよい。調節配列は、植物、動物、細菌、真菌またはウイルス由来でもよく、好ましくは、宿主細胞と同じ生物に由来してもよい。適切な調節エレメントが目的の宿主細胞に応じて変化することになるのは明らかである。例えば、大腸菌(E.coli)などの原核宿主細胞で高レベルの発現を促進する調節エレメントはpLac、T7、P(Bla)、P(Cat)、P(Kat)、trpまたはtacプロモーターを含んでいてもよい。真核宿主細胞で高レベルの発現を促進する調節エレメントは、酵母ではAOX1またはGAL1プロモーターあるいは動物細胞ではCMVもしくはSV40プロモーター、CMVエンハンサー、SV40エンハンサー、単純ヘルペスウイルス(Herpes simplex virus)VIP16転写活性化因子またはグロビンイントロンの包含を含んでいてもよい。植物では、構成的高レベルの発現は、例えば、トウモロコシ(Zea mays)ユビキチン1プロモーターまたはカリフラワーモザイクウイルスの35Sおよび19Sプロモーターを使用して得ることができる。
【0087】
適切な調節エレメントは構成的であってよく、この調節エレメントは大半の環境条件または発生段階、特異的もしくは誘導性の発生段階下で発現を指示する。好ましくは、プロモーターは誘導性であり、温度、光、化学物質、乾燥、および他の刺激などの環境的、化学的または発生的合図に応答して発現を指示する。適宜、特定の発生段階であるいは細胞外もしくは細胞内状態、シグナル、または外部から与えられる刺激に応答して目的のタンパク質の発現を可能にするプロモーターを選んでもよい。例えば、大腸菌(E.coli)で使用するための、特定の成長段階で(例えば、osmY静止期プロモーター)または特定の刺激に応答して(例えば、HtpG熱ショックプロモーター)高レベルの発現を与える様々なプロモーターが存在する。
【0088】
適切な発現ベクターは、適切な宿主細胞においておよび/または特定の条件下で前記ベクターの選択を可能にする選択可能マーカーをコードする追加の配列を含んでいてもよい。
【0089】
本発明は、細胞中で標的核酸を改変する方法であって、細胞を上文に記載される発現ベクターのうちのいずれかでトランスフェクト、形質転換または形質導入することを含む方法も含む。トランスフェクション、形質転換または形質導入の方法は当業者には周知のタイプのものである。本発明のリボ核タンパク質複合体の発現を生み出すのに使用される1つの発現ベクターが存在する場合、およびターゲティングRNAが細胞に直接添加される場合、トランスフェクション、形質転換または形質導入の同じまたは異なる方法を使用してもよい。同様に、次に、本発明のリボ核タンパク質複合体の発現を生み出すのに使用される1つの発現ベクターが存在し、別の発現ベクターが発現を介してターゲティングRNAをin situで生み出すのに使用されている場合、トランスフェクション、形質転換または形質導入の同じまたは異なる方法を使用してもよい。
【0090】
他の実施形態では、Casタンパク質またはポリペプチドをコードするmRNAは、細胞中でCascade複合体が発現されるように細胞内に導入される。Casタンパク質複合体を所望の標的配列まで導くターゲティングRNAも、mRNAと同時でも、別々にでもまたは逐次でも、必要なリボ核タンパク質複合体が細胞中で形成されるように、細胞内に導入される。
【0091】
したがって、本発明は、標的核酸を改変する、すなわち、切断、タグ付け、標識または結合する方法であって、核酸を上文で定義されるリボ核タンパク質複合体と接触させることを含む方法も提供する。
【0092】
さらに、本発明は標的核酸を改変する方法であって、核酸を、上文で定義されるターゲティングRNA分子に加えて、上文で定義されるCasタンパク質またはポリペプチドと接触させることを含む方法も含む。
【0093】
上記方法に従って、標的核酸の改変は、したがって、in vitroでおよび無細胞環境で実行することができる。無細胞環境では、標的核酸、Casタンパク質およびターゲティングRNA分子のそれぞれの添加は、同時でも、逐次でも(希望通りのいかなる順番でも)、または別々でもよい。したがって、標的核酸とターゲティングRNAが反応混合物に同時に添加され、次に、本発明のCasタンパク質またはポリペプチドが後の段階で別々に添加されることが可能である。
【0094】
同様に、標的核酸の改変は、単離された細胞であれ多細胞組織、器官または生物の一部としてであれ、in vivo、すなわち、細胞中in situで行うことができる。全組織および器官の文脈では、ならびに生物の文脈では、方法はin vivoで実行されるのが望ましい場合があり、または代わりに、全組織、器官もしくは生物から細胞を単離し、方法に従って細胞をリボ核タンパク質複合体で処理し、それに続いてリボ核タンパク質複合体で処理された細胞を、同じ生物内であれ異なる生物内であれ、その前の位置に、もしくは異なる位置に戻すことにより実行してもよい。
【0095】
これらの実施形態では、リボ核タンパク質複合体またはCasタンパク質もしくはポリペプチドは、細胞内への適切な形態の送達を必要とする。そのような適切な送達系および方法は当業者には周知であり、細胞質または核マイクロインジェクションを含むがこれらに限定されない。好ましい送達様式では、アデノ随伴ウイルス(AAV)が使用され、この送達系はヒトでは病因性ではなく、欧州では臨床使用に承認されている。
【0096】
したがって、本発明は標的核酸を改変する方法であって、核酸を、
a.上文で定義されるリボ核タンパク質複合体、または
b.上文で定義されるタンパク質もしくはタンパク質複合体および上文で定義されるRNA分子
と接触させることを含む方法を提供する。
【0097】
さらなる態様では、本発明は細胞中で標的核酸を改変する方法であって、細胞を上文で定義されるリボ核タンパク質複合体をコードするヌクレオチド配列を含む発現ベクターで形質転換、トランスフェクトもしくは形質導入すること、または代わりに細胞を上文で定義されるタンパク質もしくはタンパク質複合体をコードするヌクレオチド配列を含む発現ベクターおよび上文で定義されるターゲティングRNA分子をコードするヌクレオチド配列を含むさらなる発現ベクターで形質転換、トランスフェクトもしくは形質導入することを含む方法を提供する。
【0098】
さらなる態様では、本発明は細胞中で標的核酸を改変する方法であって、細胞を上文で定義されるタンパク質もしくはタンパク質複合体をコードするヌクレオチド配列を含む発現ベクターで形質転換、トランスフェクトまたは形質導入し、次いで上文で定義されるターゲティングRNA分子を細胞内に送達することを含む方法を提供する。
【0099】
ガイド(すなわち、ターゲティング)RNA(gRNA)分子およびCasタンパク質またはポリペプチドが、リボ核タンパク質複合体の一部としてというよりむしろ別々に提供される実施形態では、gRNA分子は、Casタンパク質またはタンパク質複合体と同時であれ、別々にであれ、逐次であれ、細胞内への適切な形態の送達を必要とする。RNAを細胞内に導入するそのような形態は当業者には周知であり、従来のトランスフェクション法を介したin vitroまたはex vivo送達を含んでもよい。マイクロインジェクションおよび電気穿孔法、ならびにカルシウム共沈、ならびに市販のカチオンポリマーおよび脂質、ならびに細胞透過性ペプチド、細胞透過性(微粒子銃)粒子などの物理的方法をそれぞれ使用してもよい。例えば、ウイルス、特に好ましくはAAVを、例えば、本発明のCasタンパク質複合体または本発明のリボ核タンパク質複合体のウイルス粒子への(可逆的)融合を介して、細胞質にであれおよび/または核にであれ送達媒体として使用してもよい。
【0100】
別の態様では、本発明は標的核酸を改変する方法であって、少なくとも1つの機能的部分がマーカータンパク質またはレポータータンパク質であり、マーカータンパク質またはレポータータンパク質が標的核酸と会合し、好ましくは、マーカーが蛍光タンパク質、例えば、緑色蛍光タンパク質(GFP)である、方法を提供する。
【0101】
標的核酸を改変する上述の方法では、機能的部分はマーカーでもよく、マーカーは標的核酸と会合し、好ましくは、マーカーはタンパク質であり、任意選択で、蛍光タンパク質、例えば、緑色蛍光タンパク質(GFP)、黄色蛍光タンパク質(YFP)、赤色蛍光タンパク質(RFP)またはmCherryである。in vitroであれ、ex vivoであれ、またはin vivoであれ、本発明の方法を使用すれば、好ましくは、高次コイルのプラスミドもしくは染色体などの高次構造、またはmRNAなどの一本鎖標的核酸の形態で、核酸分子中の標的遺伝子座を直接可視化することが可能である。標的遺伝子座の直接可視化は電子顕微鏡写真、または蛍光顕微鏡法を使用してもよい。しかし、本発明の方法の文脈では、有機色素分子、放射性標識および小分子でもよいスピン標識を含む、他の種類の標識をマーカーとして使用してもよいことは認識される。
【0102】
標的核酸がdsDNAである標的核酸を改変するための本発明の方法では、機能的部分はヌクレアーゼでもヘリカーゼ-ヌクレアーゼでもよく、改変は好ましくは所望の遺伝子座での一本鎖または二本鎖切断である。この方法で、DNAの独特な配列特異的切断は、リボ核タンパク質複合体に融合している適切な機能的部分を使用することにより操作することが可能である。最終的なリボ核タンパク質複合体のRNA成分の選ばれた配列は、機能的部分の作用に対する所望の配列特異性を提供する。
【0103】
したがって、本発明は、dsDNA分子からヌクレオチド配列の少なくとも一部を取り除くための、任意選択で遺伝子(単数または複数)の機能をノックアウトするための、細胞中の所望の遺伝子座でのdsDNA分子の非相同末端結合の方法であって、上文に記載される標的核酸を改変する方法のうちのいずれかを使用して二本鎖切断を作ることを含む方法も提供する。
【0104】
本発明は、既存のヌクレオチド配列を改変する、または所望のヌクレオチド配列を挿入するために、細胞中の所望の遺伝子座でdsDNA分子内に核酸を相同組換えする方法であって、上文に記載される標的核酸を改変する方法のうちのいずれかを使用して所望の遺伝子座で二本鎖切断を作ることを含む方法をさらに提供する。
【0105】
したがって、本発明は、上文に記載される方法のうちのいずれかに従って標的核酸配列を改変することを含む、生物中で遺伝子発現を改変する方法であって、核酸がdsDNAであり、機能的部分がDNA修飾酵素(例えば、メチラーゼまたはアセチラーゼ)、転写活性化因子または転写リプレッサーから選択される、方法も提供する。
【0106】
本発明は、上文に記載される方法のうちのいずれかに従って標的核酸配列を改変することを含む、生物中で遺伝子発現を改変する方法であって、核酸がmRNAであり、機能的部分はリボヌクレアーゼであり、任意選択でエンドヌクレオアーゼ、3’エキソヌクレアーゼまたは5’エキソヌクレアーゼから選択される、方法をさらに提供する。
【0107】
本明細書に記載される本発明の方法の任意の態様では、標的核酸はDNA、RNAまたは合成核酸でもよい。好ましくは、標的核酸はDNA、好ましくはdsDNAである。
【0108】
しかし、標的核酸はRNA、好ましくはmRNAでも可能である。代わりに、したがって、本発明は、標的核酸を改変する方法であって、標的核酸がRNAである、方法も提供する。
【0109】
別の態様では、本発明は、標的核酸を改変する方法であって、核酸がdsDNAであり、少なくとも1つの機能的部分がヌクレアーゼまたはヘリカーゼ-ヌクレアーゼであり、改変が所望の遺伝子座での一本鎖または二本鎖切断である、方法を提供する。
【0110】
別の態様では、本発明は、細胞中で標的核酸を改変する方法であって、改変により所望の遺伝子座で遺伝子発現のサイレンシングが生じ、
a.dsDNA分子で二本鎖切断を作るステップと、
b.非相同末端結合(NHEJ)により細胞中でdsDNA分子を修復するステップと
を含む方法を提供する。
【0111】
別の態様では、本発明は、細胞中で標的核酸を改変する方法であって、既存のヌクレオチド配列が改変もしくは欠失され、および/または所望の位置で所望のヌクレオチド配列が挿入され、
a.所望の遺伝子座で二本鎖切断を作るステップと、
b.相同組換えにより細胞中でdsDNA分子を修復するステップと
を含む方法を提供する。
【0112】
別の態様では、本発明は、上文に記載の標的核酸配列を改変することを含む、細胞中で遺伝子発現を改変する方法であって、核酸がdsDNAであり、機能的部分がDNA修飾酵素(例えば、メチラーゼまたはアセチラーゼ)、転写活性化因子または転写リプレッサーから選択される、方法を提供する。
【0113】
別の態様では、本発明は、上文に記載の標的核酸配列を改変することを含む、細胞中で遺伝子発現を改変する方法であって、核酸がmRNAであり、機能的部分がリボヌクレアーゼであり、任意選択でエンドヌクレオアーゼ、3’エキソヌクレアーゼまたは5’エキソヌクレアーゼから選択される、方法を提供する。
【0114】
別の態様では、本発明は上文に記載の標的核酸を改変する方法であって、50℃と100℃の間の温度で実行される方法を提供する。好ましくは、方法は60℃でまたはそれよりも高い温度で実行される。より好ましくは、方法は60℃と80℃の間の温度で実行される。最適には、方法は60℃と65℃の間の温度で実行される。
【0115】
上文に記載される標的核酸を改変する方法のうちのいずれにおいても、細胞は原核細胞でもよく、または代わりに真核細胞でもよい。
【0116】
宿主細胞
有利なことに、本発明は広範な適用性があり、本発明の宿主細胞は、培養することが可能であるいかなる遺伝的に扱いやすい生物に由来してもよい。したがって、本発明は上文に記載される方法により形質転換される宿主細胞を提供する。
【0117】
適切な宿主細胞は原核生物でも真核生物でもよい。特に、遺伝的に利用しやすく、培養することが可能である原核または真核細胞、例えば、原核細胞、真菌細胞、植物細胞およびヒト細胞を含む(が胚性幹細胞は含まない)動物細胞を含む、一般に使用されている宿主細胞を、本発明に従って使用するために選択することができる。好ましくは、宿主細胞は原核細胞、真菌細胞、植物細胞、原生生物細胞または動物細胞から選択されることになる。本発明に従って使用するための好ましい宿主細胞は、典型的には高成長速度を示し、容易に培養されおよび/もしくは形質転換され、短い世代時間を示す種、付随する確立した遺伝資源を有する種または特定の条件下で異種タンパク質の最適発現のために選択され、改変されもしくは合成された種に一般に由来している。目的のタンパク質が最終的には特定の工業的、農業的、化学的または治療的状況で使用されることになる本発明の好ましい実施形態では、適切な宿主細胞は、目的のタンパク質が配置されることになる所望の特定の条件または細胞状況に基づいて選択してもよい。好ましくは、宿主細胞は原核細胞になる。好ましい実施形態では、宿主細胞は細菌細胞である。宿主細胞は、例えば、大腸菌(Escherichia coli(E. coli))細胞でもよい。好ましくは、宿主細胞は好熱性細菌の細胞になる。
【0118】
本発明は、今や特定の実施形態に関連しておよび添付図に関連して詳細に説明されることになる。
【図面の簡単な説明】
【0119】
【
図1】
図1はCas9タンパク質配列の近隣結合樹を示す図である。pBLASTまたはPSI-BLASTに基づいて菌株T12と40%を超える配列類似性を有するすべての配列、ならびに現在十分に特徴付けられている配列(化膿性連鎖球菌(S. pyogenes)、ストレプトコッカス・サーモフィルス(S. thermophiles)およびアクチノマイセス・ネスランディ(A. naeslundii))、ならびに、これらの配列が40%より低い同一性であった場合、現在同定されている好熱性配列も含まれた。すべての好熱性配列では、T12に対するパーセント同一性は菌株名の後に示される。遺伝子識別子(gi)番号は種名の前に示される。説明文:閉環:好熱性(最適60℃より高い)Cas9配列、閉四角:熱耐性(最適<50℃)Cas9配列、開三角:中温性起源由来のゲノム編集目的で現在最も使用されているCas9配列;符号なし:中温性Cas9。結節点の値は1000レプリケートブートストラップ値を表し;スケールバーは部位当たりの推定アミノ酸置換を表す。
【
図2】
図2はCas9遺伝子配列の近隣結合樹を示す図である。遺伝子レベルでの同一性は極端に乏しかった;タンパク質整列のために使用された生物と同じ生物由来の配列を遺伝子整列のために使用した。遺伝子識別子(gi)番号は種名の前に示されている。説明文:閉環:好熱性(最適60℃より高い)Cas9配列、閉四角:熱耐性(最適<50℃)Cas9配列、開三角:中温性起源由来のゲノム編集目的で現在最も使用されているCas9配列;符号なし:中温性Cas9。結節点の値は1000レプリケートブートストラップ値を表す。
【
図3-1】
図3は、T12-Cas9(配列番号1)(II-C型)と十分に特徴付けられているII-C型(アクチノマイセス・ネスランディ(A. naeslundii)|「ana」;配列番号8)およびII-A型(化膿性連鎖球菌(S. pyogenes)|「pyo」;配列番号9およびストレプトコッカス・サーモフィルス(S. thermophilus))Cas9配列とのタンパク質配列整列を示す図である。重要な活性部位残基はよく保存されており、黒色矢印で示されている。Ana-Cas9およびPyo-Cas9について記載されているタンパク質ドメイン(Jinek, et al., 2014, Science 343: 1247997)は斜線囲みおよび類似の色付き文字で示されている。PAM認識ドメインは、化膿性連鎖球菌(S. pyogenes)II-A型系では決定されているが、いかなるII-C型系についても決定されておらず、したがって、化膿性連鎖球菌(S. pyogenes)配列でのみ示されている。
【
図3-2】
図3は、T12-Cas9(配列番号1)(II-C型)と十分に特徴付けられているII-C型(アクチノマイセス・ネスランディ(A. naeslundii)|「ana」;配列番号8)およびII-A型(化膿性連鎖球菌(S. pyogenes)|「pyo」;配列番号9およびストレプトコッカス・サーモフィルス(S. thermophilus))Cas9配列とのタンパク質配列整列を示す図である。重要な活性部位残基はよく保存されており、黒色矢印で示されている。Ana-Cas9およびPyo-Cas9について記載されているタンパク質ドメイン(Jinek, et al., 2014, Science 343: 1247997)は斜線囲みおよび類似の色付き文字で示されている。PAM認識ドメインは、化膿性連鎖球菌(S. pyogenes)II-A型系では決定されているが、いかなるII-C型系についても決定されておらず、したがって、化膿性連鎖球菌(S. pyogenes)配列でのみ示されている。
【
図4】
図4はアクチノマイセス・ネスランディ(A. naeslundii)Cas9(Cas9-Ana)のタンパク質構成を示す図である(Jinek et al., 2014)。T12-Cas9は同じII-C型CRISPR系に属し、活性部位残基を同定することができた。
【
図5】
図5は相補的dsDNAのcrRNAガイドターゲティングの比較を示す図である。塩基対合は破線で示されている。RNAは黒色で、DNAは灰色で描かれている。crRNAスペーサーと標的プロトスペーサー間の塩基対合は太い黒色破線で示され、DNA鎖間およびRNA鎖間の塩基対合は太い灰色破線で示されている。crRNAの5’末端が示されている。I型中のPAM(小さい白色囲み)は標的鎖(プロトスペーサー)の下流に存在し、II型ではPAMは置き換えられた鎖のもう一方の末端に存在することに注目されたい。同様に、シード(標的DNA鎖との塩基対合が始まり、ミスマッチが許されないガイドの予想配列)はPAMの近くに位置しており、したがって、I型とII型で異なる(Van der Oost, 2014 ibid.)。パネルAは大腸菌(E. coli)のI型Cascade系の模式図を示している。crRNAは、内部スペーサー(灰色囲み、標的認識を可能にする31~32ヌクレオチド)を有し、8ヌクレオチド5’ハンドルおよびステムループ構造(ヘアピン)からなる29ヌクレオチド3’ハンドルで隣接している(Jore 2011 ibid.)。パネルBは化膿性連鎖球菌(S. pyogenes)のII型Cas9系の模式図を示している。crRNAはtracrRNAと塩基対合し、リボヌクレアーゼIIIによるプロセシングを可能にする(向かい合った黒色三角)。さらに、crRNAの5’末端はリボヌクレアーゼにより刈り込まれ(黒色三角)、典型的には20ヌクレオチドスペーサーを生じる。合成ループを導入してcrRNAとtracrRNAを連結し、単一ガイドRNA(sgRNA)を生じてもよいことに注目されたい(Jinek et al., 2012 ibid.)。
【発明を実施するための形態】
【0120】
以下は、本発明に従って使用されるCasタンパク質のポリヌクレオチドおよびアミノ酸配列である。
【0121】
[配列番号1]ゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)T12 Cas9タンパク質アミノ酸配列
【0122】
【0123】
[配列番号7]ゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)T12 Cas9 DNA配列
【0124】
【0125】
【0126】
【実施例1】
【0127】
ゲオバチルス・サーモデニトリフィカンス(G. thermodenitrificans)の単離
驚くべきことに、ゲオバチルス・サーモデニトリフィカンス(G. thermodenitrificans)は、嫌気性条件下でリグノセルロース基質を分解することができる好熱菌についての±500単離菌のライブラリーの探索中に発見された。当初、±500単離菌のライブラリーが確立され、これはセルロースおよびキシラン上での単離により数回の選択ラウンド後に、110単離菌にまで削減された。110単離菌のこのライブラリーはゲオバチルス(Geobacillus)単離菌のみからなり、ゲオバチルス・サーモデニトリフィカンス(G. thermodenitrificans)がライブラリーの79%を占めていた。
【0128】
単離されたゲオバチルス・サーモデニトリフィカンス(G. thermodenitrificans)菌株は「T12」と命名された。
【実施例2】
【0129】
ゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)でのCas9について必須のコンセンサス配列を定義する
以下のデータベース探索および整列が実施された。
pBLASTおよびnBLASTは社内BLASTサーバーで実施し、ゲオバチルス・サーモデニトリフィカンス(G. thermodenitrificans)T12のタンパク質または遺伝子配列を問い合わせ配列として使用した。このデータベースは2014年5月に最後にアップデートされ、したがって、最も最近に追加されたゲオバチルス(Geobacillus)ゲノムを含有していないが、通常のオンラインBLASTはT12配列の公開を防ぐために使用されなかった。これの最も関連性の高い配列である、社内pBLASTのエクセルフォーマットでの結果は添付物1を参照されたい(40%よりも大きな配列同一性は
図1に含まれている)。
【0130】
もっと最近の配列データを含めるために、ゲオバチルス(Geobacillus)MAS1(T12 Cas9に最も密接に関係している)の配列を使用してNCBIウェブサイト上でPSI-BLASTを実施した(Johnson et al., 2008 Nucleic Acids Res. 36(Web Server issue): W5-9)。2連続ラウンドのPSI-BLASTが実施され、そこでは以下の基準:第1のラウンドでは最小配列包括度96%、ならびに第2および第3のラウンドでは97%、最小同一性40%、種当たり1つの菌株のみを満たした配列のみが次のラウンドで使用された。
【0131】
PSI-BLASTから生じる配列、ならびに内部サーバーpBLAST由来のT12に対して40%よりも大きな同一性を有し、PSI-BLASTには現われなかった配列を、現在十分に特徴付けられている中温性配列と、および、これらの配列がもっと離れた関係にある場合には、現在同定されているすべての好熱性配列とも整列させ、それから近隣結合樹を構築した(
図1参照)。整列はClustalWを使用してMega6で実施し、この後近隣結合法を使用して樹を構築し、ブートストラップ解析は1000レプリケートを使用して実施した。
【0132】
問い合わせ配列としてゲオバチルス(Geobacillus)属種MAS1を使用してBLASTnを実施した場合、ゲオバチルス(Geobacillus)属種JF8 Cas9のみが88%の同一性で同定され、遺伝子レベルでは相同性が極めて少ないことを示していた。
図2はClustal整列Cas9遺伝子配列の近隣結合樹である。
【0133】
ゲオバチルス・サーモデニトリフィカンス(G. thermodenitrificans)T12、アクチノマイセス・ネスランディ(A. naeslundii)および化膿性連鎖球菌(S. pyogenes)のタンパク質配列は、デフォルト設定のBLOSUM62を使用してCloneManagerでその配列を整列させることによりタンパク質ドメイン相同性についてさらに解析した(
図3参照)。
【実施例3】
【0134】
CAS9の機能に不可欠であるコアアミノ酸モチーフおよび好熱性Cas9ヌクレアーゼの熱安定性を与えるコアアミノ酸モチーフを同定する
上記整列されたタンパク質配列のパーセント同一性は
図1に与えられている。T12-Cas9はII-C型に属している。II-C型系の最もよく研究され、最近結晶化された構造はアクチノマイセス・ネスランディ(Actinomyces naeslundii)由来である(Jinek et al., 2014, Science 343: 1247997)。このタンパク質配列はT12-Cas9に対して20%の同一性しか示していないが、高度に保存された残基を推定するのに使用することが可能である。2つの十分に特徴付けられているII-A型系(化膿性連鎖球菌(S. pyogenes)およびストレプトコッカス・サーモフィルス(S. thermophilus))も分析に含まれた(Jinek et al., 2014, Science 343: 1247997;Nishimasu et al., 2014, Cell 156: 935-949)。これら4つのタンパク質配列の整列は
図3に示されており、
図4はアクチノマイセス・ネスランディ(A. naeslundii)について決定されたタンパク質構成(「Ana-Cas9」)を示している(Jinek et al., 2014, Science 343: 1247997)。T12およびアクチノマイセス・ネスランディ(Actinomyces naeslundii)由来のCas9の長さは極めて類似しており(アクチノマイセス・ネスランディ(A. naeslundii)1101アミノ酸、T12 1082アミノ酸)、T12は類似するタンパク質構成を有すると予想されるが、Cas9-Anaに対する全体の配列同一性が20%にすぎないために、これはまだ確定されていない。Jinek et al.(Jinek et al., 2014, Science 343: 1247997)により記載されているアクチノマイセス・ネスランディ(A. naeslundii)および化膿性連鎖球菌(S. pyogenes)由来のCas9中の活性部位残基はすべてT12-Cas9において同定することができた(
図3参照)。PAM結合ドメインは化膿性連鎖球菌(S. pyogenes)II-A型系については決定されているが、いかなるII-C型系についても決定されておらず、したがって、化膿性連鎖球菌(S. pyogenes)配列においてのみ示されている。さらに、PAM認識部位は、CRISPR系間だけでなく、同じ系を含有する種間でも大きく変化する。PAMに関するさらなる情報については、問題点4および将来計画を参照されたい。
【実施例4】
【0135】
ゲオバチルス・サーモデニトリフィカンス(G. thermodenitrificans)T12 Cas9のPAM配列の決定
原核生物CRISPR系が適応免疫系としてその宿主に役立ち(Jinek et al., 2012, Science 337: 816-821)、迅速で効果的な遺伝子工学のために使用することが可能であること(Mali et al., 2013, Nat Methods 10: 957-963)は確立されている。
【0136】
Cas9タンパク質はII型CRISPR系のための配列特異的ヌクレアーゼとして機能する(Makarova et al., 2011, Nat Rev Micro 9: 467-477)。小型crRNA分子は、繰り返し領域に連結している「スペーサー」(標的)からなり、CRISPR遺伝子座の転写およびプロセシング産物である。「スペーサー」は天然にはバクテリオファージのゲノムおよび可動遺伝要素に起源をもつが、遺伝子工学工程中に特定のヌクレオチド配列を標的にするように設計することも可能である(Bikard et al., 2013, Nucleic Acids Research 41: 7429-7437)。crRNA分子はそのDNA標的の同定のためのガイドとしてCas9により用いられる。スペーサー領域は、切断DNA領域の標的物、「プロトスペーサー」と同一である(Brouns et al., 2012, Science 337: 808-809)。PAM(プロトスペーサー隣接モチーフ)は、プロトスペーサーの隣にあり、Cas9による標的の認識に必要である(Jinek et al., 2012, Science 337: 816-821)。
【実施例5】
【0137】
無作為化されたPAMを有する標的生成
ゲオバチルス・サーモデニトリフィカンス(G. thermodenitrificans)T12菌株のCRISPR II遺伝子座由来の2つの異なるスペーサーを、鋳型としてゲオバチルス・サーモデニトリフィカンス(G. thermodenitrificans)T12ゲノムDNAを使用してPCRにより増幅させた。2対の縮重プライマーをそれぞれのスペーサーの増幅のために使用した。
【0138】
第1に、「プロトスペーサー」断片の上流に6つの無作為ヌクレオチドの導入を引き起こす対を使用し、無作為化されたPAM配列を有するプロトスペーサーのプールを作製した。
【0139】
第2に、「プロトスペーサー」断片の下流に6つの無作為ヌクレオチドの導入を引き起こす対を使用し、無作為化されたPAM配列を有するプロトスペーサーのプールを作製した。
【0140】
作製された断片はpNW33nベクターにライゲートされ、6ヌクレオチド長PAMそれぞれの考えられる4096の異なる組合せすべてを有する「プロトスペーサー」構築物の4プールを作製した。構築されたDNAはゲオバチルス・サーモデニトリフィカンス(G. thermodenitrificans)T12細胞の形質転換のために使用された。細胞はクロラムフェニコール選択上に蒔かれ、それぞれのプロトスペーサープールから2×106を超える細胞がプールされることになる。プラスミドDNAはプールから抽出され、標的領域はPCR増幅されることになり、その産物はディープシークエンシングのために送られた。最も少ないリードを有するPAMは活性であると見なされ、その工程はこれらのPAMを有するスペーサーを含有するpNW33n構築物のみを用いて繰り返されることになる。ゲオバチルス・サーモデニトリフィカンス(G. thermodenitrificans)T12の形質転換効率が減少していることはPAMの活性を立証することになる。
【実施例6】
【0141】
ゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)Cas9のための機能的温度範囲
一般公開されているいかなるCas9タンパク質にも今日まで温度範囲実験は実行されたことがない。研究で使用されるCas9タンパク質はすべて中温性起源を有し、宿主生物化膿性連鎖球菌(Streptococcus pyogenes)(ATCC_700294)で最大成長温度45℃である。
【0142】
ここで、ゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)由来のCas9が安定で機能的である温度およびさらにそのCas9の活性が最適である温度の範囲が実験的に決定された。さらに、他のゲオバチルス(Geobacillus)属種由来のCas9ヌクレアーゼについての機能的で好ましい温度範囲も決定された。
【0143】
ゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)T12 Cas9ヌクレアーゼの温度範囲は、単一ガイドRNA(sgRNA)を使用することによりin vitroで決定された。sgRNAは単一キメラ転写物にした内在性細菌crRNAとtracrRNAからなり、20塩基対(bp)標的配列に続くcrRNA:tracrRNA骨格を含有するpT7クローニングベクターを使用することにより生み出された(Jao et al., 2013, PNAS 110: 13904-13909)。標的配列は20bp標的で開始しT12 PAM配列(実施例4由来の)で終わる。所望の単一ターゲティングsgRNAは、プラスミドを直線化した後、T7プロモーターからのin vitro転写により生み出された。標準クローニングベクターpUC19は我々のin vitro活性アッセイでは標的として使用されてきた。プラスミド中の標的部位(20ヌクレオチド+PAM)は、アニールされsgRNAクローニングベクターにライゲートされた2つの相補的オリゴにより構築された。生成されたsgRNAは、20℃から100℃までに及ぶ温度でT12のCas9ヌクレアーゼと一緒にインキュベートされた。Cas9切断活性はアガロースゲル電気泳動によりアッセイされた。
【0144】
ここで単離され特徴付けられた生物(T12)は、そのCas9タンパク質についての最適温度も表す65℃の最適成長温度を有する。Cas9タンパク質が活性である温度範囲は20℃から100℃まで、特に20℃から80℃である。
【0145】
ゲオバチルス(Geobacillus)属種由来のCas9の最適温度範囲は今日まで特徴付けられているCas9タンパク質よりもはるかに高い。同様に、ゲオバチルス(Geobacillus)属種由来のCas9がヌクレアーゼ活性を保持する範囲の最上方は既知のCas9タンパク質よりもはるかに高い。より高い最適温度および機能的範囲は高温での遺伝子工学に、したがって、好熱性生物のゲノムの編集に著しい利点を与え、これは高温で実行される様々な工業、農業および製薬工程において有用性がある。
【配列表】