IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ シグマ−アルドリッチ・カンパニー・リミテッド・ライアビリティ・カンパニーの特許一覧

特許7629673ゲノム改変のための高忠実度SpCas9ヌクレアーゼ
<>
  • 特許-ゲノム改変のための高忠実度SpCas9ヌクレアーゼ 図1A
  • 特許-ゲノム改変のための高忠実度SpCas9ヌクレアーゼ 図1B
  • 特許-ゲノム改変のための高忠実度SpCas9ヌクレアーゼ 図2
  • 特許-ゲノム改変のための高忠実度SpCas9ヌクレアーゼ 図3A
  • 特許-ゲノム改変のための高忠実度SpCas9ヌクレアーゼ 図3B
  • 特許-ゲノム改変のための高忠実度SpCas9ヌクレアーゼ 図3C
  • 特許-ゲノム改変のための高忠実度SpCas9ヌクレアーゼ 図3D
  • 特許-ゲノム改変のための高忠実度SpCas9ヌクレアーゼ 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-02-05
(45)【発行日】2025-02-14
(54)【発明の名称】ゲノム改変のための高忠実度SpCas9ヌクレアーゼ
(51)【国際特許分類】
   C12N 15/55 20060101AFI20250206BHJP
   C12N 9/22 20060101ALI20250206BHJP
   C12N 15/09 20060101ALI20250206BHJP
   C12N 15/62 20060101ALI20250206BHJP
   C12N 15/63 20060101ALI20250206BHJP
   C12N 15/86 20060101ALI20250206BHJP
   C12N 5/10 20060101ALI20250206BHJP
   C12N 1/15 20060101ALI20250206BHJP
   C07K 19/00 20060101ALI20250206BHJP
   A61K 38/46 20060101ALI20250206BHJP
   A61P 43/00 20060101ALI20250206BHJP
   C07K 14/315 20060101ALN20250206BHJP
   C12N 15/31 20060101ALN20250206BHJP
【FI】
C12N15/55 ZNA
C12N9/22
C12N15/09 110
C12N15/62 Z
C12N15/63 Z
C12N15/86 Z
C12N5/10
C12N1/15
C07K19/00
A61K38/46
A61P43/00 105
C07K14/315
C12N15/31
【請求項の数】 27
(21)【出願番号】P 2022549484
(86)(22)【出願日】2021-03-11
(65)【公表番号】
(43)【公表日】2023-04-05
(86)【国際出願番号】 US2021021922
(87)【国際公開番号】W WO2021183771
(87)【国際公開日】2021-09-16
【審査請求日】2022-08-17
(31)【優先権主張番号】62/988,279
(32)【優先日】2020-03-11
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】311016949
【氏名又は名称】シグマ-アルドリッチ・カンパニー・リミテッド・ライアビリティ・カンパニー
【氏名又は名称原語表記】Sigma-Aldrich Co. LLC
(74)【代理人】
【識別番号】100145403
【弁理士】
【氏名又は名称】山尾 憲人
(74)【代理人】
【識別番号】100170520
【弁理士】
【氏名又は名称】笹倉 真奈美
(74)【代理人】
【識別番号】100221545
【弁理士】
【氏名又は名称】白江 雄介
(72)【発明者】
【氏名】チェン,フーチアン
【審査官】小田 浩代
(56)【参考文献】
【文献】特表2018-522546(JP,A)
【文献】特表2019-533996(JP,A)
【文献】Casini A. et al.,A highly specific SpCas9 variant is identified by in vivo screening in yeast,Nat Biotechnol,2018年,Vol. 36,pp. 265-271
(58)【調査した分野】(Int.Cl.,DB名)
C07K 1/00-19/00
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
UniProt/GeneSeq
PubMed
(57)【特許請求の範囲】
【請求項1】
配列番号1に対して少なくとも99%の同一性を有する、並びに、以下の群:
K562L-R661L-K855Q;
K562Q-R661L-K855Q;
K652L-R661L-K855Q;
K652Q-R661L-K855Q;
R661L-K855Q-K1003Q;
R661L-K855Q-R1060Q;
R661L-R691L-K855Q;
R661L-R780L-K855Q;
R661L-R780Q-K855Q;
R661L-K810L-K855Q;
R661L-K848L-K855Q;
R661L-K810Q-K855Q;
R661L-K855Q-K1003L;および
R661L-K855Q-R1060L;
より選択される変異(配列番号1に示される改変されていない成熟野生型Streptococcus pyogenes Cas9の対応する位置におけるアミノ酸番号を参照する)を含むアミノ酸配列を含む、操作されたStreptococcus pyogenes Cas9(SpCas9)タンパク質であって、ここで前記操作されたSpCas9タンパク質を含むCas9系が、配列番号1に示される前記野生型SpCas9タンパク質を含むCas9系と比較して、ゲノム編集においてオフターゲット活性の低減を示す、操作されたSpCas9タンパク質。
【請求項2】
変異が、K652L-R661L-K855Qである、請求項1に記載の操作されたSpCas9タンパク質
【請求項3】
N末端、C末端、内部位置、またはそれらの組合せに融合される1つ以上の異種ドメインをさらに含む、請求項1または2に記載の操作されたSpCas9タンパク質
【請求項4】
異種ドメインが、核局在化シグナル、細胞膜透過ドメイン、検出を容易にするマーカーもしくはレポータードメイン、クロマチン改変ドメイン、エピジェネティック修飾ドメイン、転写調節ドメイン、DNAもしくはRNAデアミナーゼドメイン、ウラシル-DNA-グリコシラーゼドメイン、逆転写酵素ドメイン、リコンビナーゼドメイン、RNAアプタマー結合ドメイン、および非Cas9ヌクレアーゼドメインから選択される、請求項3に記載の操作されたSpCas9タンパク質
【請求項5】
N末端、C末端、内部位置またはそれらの組合せに融合される少なくとも1つの核局在化シグナルをさらに含む、請求項1~4の何れか1項に記載の操作されたSpCas9タンパク質
【請求項6】
RuvCドメインにおける少なくとも1つの変異、および/またはHNHドメインにおける少なくとも1つの変異をさらに含む、並びにここで前記RuvCドメインにおける少なくとも1つの変異が、存在する場合には、D10A、D8A、E762A、およびD986Aから選択される少なくとも1つの変異(配列番号1に示される改変されていない成熟野生型Streptococcus pyogenes Cas9の対応する位置におけるアミノ酸番号を参照する)を含み;および前記HNHドメインにおける少なくとも1つの変異が、存在する場合には、H840A、H559A、N854A、N856A、およびN863Aから選択される少なくとも1つの変異(配列番号1に示される改変されていない成熟野生型Streptococcus pyogenes Cas9の対応する位置におけるアミノ酸番号を参照する)を含む、請求項1~5の何れか1項に記載の操作されたSpCas9タンパク質
【請求項7】
請求項1~6の何れか1項に記載の操作されたSpCas9タンパク質よび少なくとも1つの操作されたガイドRNAを含む操作されたCas9系であって、ここで前記少なくとも1つの操作されたガイドRNAは前記操作されたSpCas9タンパク質複合体を形成するように設計される、操作されたCas9系。
【請求項8】
請求項1~6の何れか1項に記載の操作されたSpCas9タンパク質コードする複数の核酸。
【請求項9】
請求項7に記載の操作されたSpCas9系をコードする複数の核酸。
【請求項10】
操作されたSpCas9タンパク質コードする少なくとも1つの核酸および操作されたガイドRNAをコードする少なくとも1つの核酸を含む、請求項9に記載の複数の核酸。
【請求項11】
少なくとも1つの核酸がRNAである、請求項8~10の何れか1項に記載の複数の核酸。
【請求項12】
少なくとも1つの核酸がDNAである、請求項8~10の何れか1項に記載の複数の核酸。
【請求項13】
操作されたSpCas9タンパク質コードする少なくとも1つの核酸が、真核細胞での発現のためにコドン最適化されている、請求項8~12の何れか1項に記載の複数の核酸。
【請求項14】
真核細胞が、ヒト細胞、非ヒト哺乳動物細胞、非哺乳動物脊椎動物細胞、無脊椎動物細胞、植物細胞、または単細胞真核生物である、請求項13に記載の複数の核酸。
【請求項15】
操作されたガイドRNAをコードする少なくとも1つの核酸がDNAである、請求項9に記載の複数の核酸。
【請求項16】
操作されたSpCas9タンパク質コードする少なくとも1つの核酸が、in vitroRNA合成または細菌細胞におけるタンパク質発現のためにファージプロモーター配列に作動可能に連結されており、および操作されたガイドRNAをコードする少なくとも1つの核酸が、in vitroRNA合成のためにファージプロモーター配列に作動可能に連結されている、請求項9に記載の複数の核酸。
【請求項17】
操作されたCas9タンパク質コードする少なくとも1つの核酸が、真核細胞における発現のために真核プロモーター配列に作動可能に連結されており、および操作されたガイドRNAをコードする少なくとも1つの核酸が、真核細胞における発現のために真核プロモーター配列に作動可能に連結されている、請求項9に記載の複数の核酸。
【請求項18】
請求項8~17の何れか1項に記載の複数の核酸を含む少なくとも1つのベクター。
【請求項19】
プラスミドベクター、ウイルスベクターまたは自己複製性ウイルスRNAレプリコンである、請求項18に記載の少なくとも1つのベクター。
【請求項20】
請求項7に記載の少なくとも1つの操作されたCas9系、または請求項9もしくは10に記載の複数の核酸を含む真核細胞であって、ヒト胚細胞を除く、真核細胞。
【請求項21】
ヒト細胞、非ヒト哺乳動物細胞、植物細胞、非哺乳動物脊椎動物細胞、無脊椎動物細胞、または単細胞真核生物である、およびヒト胚細胞を除く、請求項20に記載の真核細胞。
【請求項22】
ex vivoまたはin vitroである、請求項21に記載の真核細胞。
【請求項23】
Cas9ホモログである、請求項1~6の何れか1項に記載の操作されたSpCas9タンパク質
【請求項24】
請求項1~6の何れか1項に記載の操作されたSpCas9タンパク質含むリボ核タンパク質(RNP)複合体。
【請求項25】
請求項1~6の何れか1項に記載の操作されたSpCas9タンパク質含む融合タンパク質。
【請求項26】
請求項1~6の何れか1項に記載の操作されたSpCas9タンパク質よび少なくとも1つの薬学的に許容される賦形剤を含む医薬組成物。
【請求項27】
真核細胞の染色体配列を改変する方法における使用のための、請求項1~6の何れか1項に記載の操作されたSpCas9タンパク質含む組成物であって、ここで前記方法は、前記操作されたSpCas9タンパク質前記真核細胞においてガイドRNAと共に発現させる事を含む、およびここで前記真核細胞はヒト胚細胞を除く、組成物。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本願は、2020年3月11日に出願された米国仮出願第62/988,279号の優先権の利益を主張するものであり、ここに本明細書の一部として参照によりその全体を援用する。
【0002】
配列表
本願は、ASCII形式で電子的に提出された配列表を含み、ここに本明細書の一部として参照によりその全体を援用する。2021年3月11日に作成された該ASCIIコピーは、P20-035_WO-PCT_SL.txtと名付けられ、49,120バイトサイズである。
【0003】
本開示の技術分野
本開示は、操作されたCas9タンパク質変異体および系、当該タンパク質変異体および系をコードする核酸、ならびにゲノム改変のための当該タンパク質変異体および系の生産および使用方法に関する。
【0004】
本開示の背景
Streptococcus pyogenes CRISPR Cas9(SpCas9)は、多くの細胞種および生物種においてゲノム編集エンドヌクレアーゼとして広く採用されている。しかし、野生型ヌクレアーゼは、標的部位に似た配列を持つ意図しないゲノム部位に変異を引き起こす性質を有する。この欠点を改善するために、特異性を向上させたいくつかのSpCas9変異体が開発されてきた。これらには、eSpCas9 1.0(K810A、K1003A、R1060A)、eSpCas9 1.1(K848A、K1003A、R1060A)、SpCas9-HF1(N497A、R661A、Q695A、Q926A)、HypaCas9(N692A、M694A、Q695A、H698A)、EvoCas9(M495V、Y515N、K526E、R661L)、Sniper Cas9(F539S、M763I、K890N)、HiFi Cas9 V3(R691A)、Opti-SpCas9(R661A およびK1003H)、およびOptiHF-SpCas9(Q695A、K848A、E293M、T924V およびQ926A)(Slaymaker et al.,Science 351,84-88;Kleinstiver et al.,Nature 523,490-495;Chen et al.Nature 550,407-410;Casini et al.,Nature Biotechnology 36,265-271;Lee et al.,Nature Communications 9,3048;Vakulskas et al.,Nature Medicine 24,1216-1224;Choi et al.,Nature Methods 16,722-730)を含む。しかし、これらの変異体のほとんどはプラスミド形態におけるスクリーニングによって同定されたものであり、およびリボ核タンパク質(RNP)送達によるゲノム編集のための組み換えタンパク質への変換ではしばしば低い活性となった。
【0005】
ゲノム改変におけるSpCas9組み換えタンパク質の需要が大きく増加しているため、異なるゲノム部位にわたって向上した特異性および持続的な活性で機能し得る組み換えタンパク質形態のヌクレアーゼが必要とされている。
【発明の概要】
【課題を解決するための手段】
【0006】
本開示の概要
本発明の種々の態様の中には、操作されたCas9タンパク質変異体およびこれを含む系の提供がある。
【0007】
したがって略述すると、本開示は、アミノ酸位置526、562、652、661、691、780、810、848、855、1003、および1060の1つ、2つまたはそれ以上において改変を含む、操作されたStreptococcus pyogenes Cas9(SpCas9)タンパク質変異体に関し、ここで前述のアミノ酸位置の1つ以上におけるリジン(K)がロイシン(L)またはグルタミン(Q)に変更され、および/または前述のアミノ酸位置の1つ以上におけるアルギニン(R)がロイシン(L)またはグルタミン(Q)に変更される。例えば、1つの例示的な実施形態では、操作されたSpCas9タンパク質変異体はK855L/Q変異、ならびにアミノ酸位置526、562、652、661、691、780、810、848、1003、および1060(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)における少なくとも1つのその他の変異を含む。別の例示的な実施形態では、操作されたSpCas9タンパク質変異体はR661L/Q変異、ならびにアミノ酸位置526、562、652、691、780、810、848、855、1003、および1060(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)における少なくとも1つのその他の変異を含む。特定の実施形態では、変異は以下の群から選択される:K562L-R661L-K855Q;K562Q-R661L-K855Q;K652L-R661L-K855Q;およびK652Q-R661L-K855Q(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)。
【0008】
本開示の別の態様は、本明細書で開示する操作されたCAs9タンパク質変異体および少なくとも1つの操作されたガイドRNAを含む操作されたCas9系に関し、ここで各々の操作されたRNAは操作されたCas9タンパク質変異体と複合体を形成するように設計される。
【0009】
本開示の別の態様は、操作されたCas9タンパク質変異体およびこれを含む系をコードする核酸に関する。当該核酸を含むベクターもまた提供される。
【0010】
本開示の別の態様は、本明細書に記載の操作されたCas9タンパク質変異体および系の生産および使用方法に関する。
【0011】
その他の目的および特徴は、以下においてある部分明らかにされ、ある部分指摘されることとなる。
【図面の簡単な説明】
【0012】
図1A図1Aは、K855残基の5種類の異なる置換の、ヒトU-2 OS細胞におけるHEKSite4標的部位でのオンターゲット活性を示す。K855EおよびK855Aはオンターゲット活性が低下した(実施例1)。図は配列番号73を開示する。
【0013】
図1B図1Bは、K855残基の5種類の異なる置換の、ヒトU-2 OS細胞におけるHEKSite4オフターゲット部位でのオフターゲット活性を示す(実施例1)図は配列番号74を開示する。
【0014】
図2図2は、R661、N692、またはQ695残基の異なる置換の、ヒトU-2 OS細胞におけるHEKSite4標的部位でのオンターゲット活性を示す(実施例2)。図は配列番号73を開示する。
【0015】
図3A図3Aは、3重および4重変異体タンパク質の、ヒトK562細胞におけるFANCF02標的部位でのオンターゲット活性を示す(実施例3)。図は配列番号75を開示する。
【0016】
図3B図3Bは、3重および4重変異体タンパク質の、ヒトK562細胞におけるFANCF02単一ミスマッチオフターゲット部位でのオフターゲット活性を示す(実施例3)。図は配列番号76を開示する。
【0017】
図3C図3Cは、3重および4重変異体タンパク質の、ヒトK562細胞におけるHBB03標的部位でのオンターゲット活性を示す(実施例3)。図は配列番号77を開示する。
【0018】
図3D図3Dは、3重および4重変異体タンパク質の、ヒトK562細胞におけるヒトK562細胞におけるHBB03単一ミスマッチオフターゲット部位でのオフターゲット活性を示す(実施例3)。図には配列番号78は開示する。
【0019】
図4図4は、K562細胞の異なる5つのゲノム部位における、変異体タンパク質の選択群のオンターゲット活性を示す(実施例4)。図には出現順にそれぞれ配列番号79~83を開示されている。
【発明を実施するための形態】
【0020】
詳細な説明
ゲノム改変におけるSpCas9組み換えタンパク質の需要が大きく増加しているため、異なるゲノム部位にわたって向上した特異性および持続的な活性で機能し得る組み換えタンパク質形態のヌクレアーゼが必要とされている。組み換えタンパク質ベースのスクリーニングアプローチを用いて、異なるレベルの特異性および活性を持つ少なくとも2つの異なるSpCas9変異体の群が同定された。1つの群は、その他のSpCas9変異体に比べて非常に高いレベルの特異性を有するが、異なるゲノム部位間で大きく異なった活性を有する。もう一方の群は、バランスのとれた特異性と活性を有し、活性においては十分確立されたeSpCas9 1.1を上回り、特異性においては近年開発されたHiFi Cas9 V3を上回る。この群のヌクレアーゼは真核細胞のゲノム改変に広く応用し得る大きな可能性を秘めている。
【0021】
高忠実度のSpCas9変異体を開発する従来の試みは、特定のプラスミド発現をベースとした選択スキームに大きく依存するものであった。これらの変異体は組み換えタンパク質として用いた際にしばしば低い活性を示した。特定の理論に拘束されるものではないが、哺乳類細胞におけるプラスミドの過剰発現によって、特異性を向上する変異に起因するこれらの変異体の活性の減衰が偽装され得る事が推測される。プラスミドの過剰発現によるこの混乱を回避するために、ヌクレアーゼを改良するための組み換えタンパク質ベースのスクリーニングアプローチを採用した。加えて、鍵となる残基の変異には必ずアラニン置換を用いていた従来の試みとは対照的に、特異性を向上させながらオンターゲット活性を維持するために最適アミノ酸置換を使用した。これらの方法論の違いによって、本開示のタンパク質は、従来のSpCas9タンパク質を操作する試みによるものよりも際立って優れたものとなる。
【0022】
変異とその組み合わせには、Cas9のDNA基質結合の安定性の根底にあるさまざまなメカニズムにおそらく関与する重要な残基が含まれるが、以前の試みでは、変異の組み合わせは、おそらく1つのメカニズムに関与する重要な残基に限定されていた。例えば、eSpCas9は、非標的鎖の負に荷電したリン酸主鎖と相互作用する正に荷電した保存的アミノ酸残基を変異させる事で開発されたが、これはこれらの正に荷電した残基が鎖の解離の際に非標的鎖を安定化させ、続いてガイドRNA-標的DNAヘテロ二本鎖の形成を安定化させるという仮説に基づくものである(Slaymaker et al.,Science 351,84-88)。対照的に、SpCas9-HF1は標的鎖のリン酸主鎖との水素結合または電荷相互作用を減らす事で開発された(Kleinstiver et al.,Nature 523,490-495)。一方で、HypaCas9は、RNA-DNA相互作用を感知し、このシグナルを伝達することでHNHヌクレアーゼドメインの構造的切り替えを誘起すると推測されるREC3ドメインの保存的残基群(N692、M694、Q695およびH698)をアラニンに変異させる事で得られた(Chen et al.,Nature 550,407-410)。
【0023】
組み換えタンパク質ベースの独自のスクリーニングアプローチを採用し、本明細書に開示するように異なるメカニズムの組み合わせに合理的な設計を広げることによって、本開示では異なるレベルの特異性および活性を持つ少なくとも3つの異なるSpCas9変異体の群を同定した。
【0024】
(I)操作されたCas9タンパク質
本開示の1つの態様は操作されたCasタンパク質に関する。操作されたCasタンパク質は、その野生型タンパク質と比較して少なくとも1つ、少なくとも2つ、または少なくとも3つのアミノ酸置換、挿入または欠失を含む;すなわち、操作されたCas9タンパク質は、野生型Casタンパク質と比較して、アミノ酸配列に改変または変異を含む。種々のCasタンパク質の内、Cas9タンパク質は例えば、様々な細菌中に存在するII型CRISPR系の単一のエフェクタータンパク質である。
【0025】
1つの実施形態では、本明細書で開示する操作されたCas9タンパク質はStreptococcus spp.に由来する。別の実施形態では、例えば、操作されたCas9タンパク質変異体はStreptococcus pyogenes(SpCas9)に由来する。よって、いくつかの実施形態では、本明細書に記載の操作されたCas9タンパク質はSpCas9のホモログである。
【0026】
野生型Cas9タンパク質は、2つのヌクレアーゼドメイン、すなわち、RuvCおよびHNHドメインを含み、これらそれぞれは二本鎖配列の内の1つの鎖を切断する。Cas9タンパク質はまた、ガイドRNAと相互作用するRECドメイン(例えば、REC1、REC2)またはRNA/DNAヘテロ二本鎖と相互作用するRECドメイン(例えば、REC3)、およびプロトスペーサー隣接モチーフ(PAM)と相互作用するドメイン(すなわち、PAM相互作用ドメイン)を含む。
【0027】
本明細書に記載するように、本開示のCas9タンパク質は、Cas9タンパク質が変更された活性、特異性、および/または安定性を有するように1つ以上の改変(すなわち、少なくとも1つのアミノ酸の置換、少なくとも1つのアミノ酸の欠失、少なくとも1つのアミノ酸の挿入)を含むように操作される。これらの操作されたCas9タンパク質は天然には生じない。
【0028】
一般に、周知および/または市販のCas9変異体は、タンパク質の特定の領域における点変異に焦点が当てられており、他の領域およびタンパク質の異なる領域における変異の組み合わせは考慮されていない。Cas9タンパク質の異なる領域における変異の組み合わせが、周知のCas9変異体と比較して、向上した特異性、活性(例えば、オンターゲット活性またはオフターゲット活性)および/またはその他有益な性質をもたらし得ることが有利には見出された。
【0029】
例えば、本明細書に開示するCas9タンパク質は、非標的DNA鎖接触残基を含むタンパク質の構造領域に少なくとも1つの変異を有し、および/または標的DNA/ガイドRNAヘテロ二本鎖接触残基を含むタンパク質の構造領域に少なくとも1つの変異を有し、および/またはアルファへリックスローブ(alpha-helical lobe)を含むタンパク質の構造領域に少なくとも1つの変異を有する。本開示の目的のために、非標的DNA鎖接触残基には、例えば、アミノ酸R780、K810、K848、K855、K1003、およびR1060を含み;標的DNA/ガイドRNAヘテロ二本鎖接触残基には例えば、アミノ酸R661およびR691を含み;およびアルファヘリックスローブ残基には、例えば、アミノ酸K526、K562、およびK652を含む(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)。よって、種々の実施形態において、本明細書で開示するCas9タンパク質は非標的DNA鎖接触残基を含むタンパク質の構造領域に少なくとも1つの変異を有し、および標的DNA/ガイドRNAヘテロ二本鎖接触残基を含むタンパク質の構造領域に少なくとも1つの変異を有する。その他の実施形態では、本明細書に開示するCas9タンパク質は、非標的DNA鎖接触残基を含むタンパク質の構造領域に少なくとも1つの変異を有し、アルファヘリックスローブを含むタンパク質の構造領域に少なくとも1つの変異を有する。さらにその他の実施形態では、本明細書に開示するCas9タンパク質は、標的DNA/ガイドRNAヘテロ二本鎖接触残基を含むタンパク質の構造領域に少なくとも1つの変異を有し、およびアルファヘリックスローブを含むタンパク質の構造領域に少なくとも1つの変異を有する。さらにその他の実施形態では、本明細書に開示するCas9タンパク質は、非標的DNA鎖接触残基を含むタンパク質の構造領域に少なくとも1つの変異を有し、標的DNA/ガイドRNAヘテロ二本鎖接触残基を含むタンパク質の構造領域に少なくとも1つの変異を有し、およびアルファヘリックスローブを含むタンパク質の構造領域に少なくとも1つの変異を有する。
【0030】
本明細書に開示するCas9タンパク質変異体は、改変されていない成熟(野生型)Streptococcus pyogenes Cas9(配列番号1)の対応する位置におけるアミノ酸番号を参照する事で同定される改変アミノ酸配列を有する。本明細書に開示するCas9タンパク質変異体は、好ましくは少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも98%、または少なくとも99%の配列番号1に対する同一性を有する。
【化1】
【0031】
参照しやすいように、20の必須アミノ酸の表記とその一文字コードを表Aに示す。
【表A】
【0032】
本明細書に記載するアミノ酸の改変は、改変が及ぼされるアミノ酸を参照する文字(一文字コード)で始まり、変更を指定する文字(一文字コード)で終わり、アミノ酸残基の位置は2つの文字の間である、命名法を利用する事が理解されるはずである。例えば、仮想的なタンパク質がアラニン残基を仮想のアミノ酸位置100に有しているとすると、A100と指定される。さらなる例として、仮想的なアミノ酸位置100におけるアラニンからバリンへの改変は、A100Vと指定される。2つ以上の選択肢から選択される改変は、「/」を付して指定され、例えば、仮想的なアミノ酸位置100におけるアラニンからバリンまたはセリンへの改変は、A100V/Sと指定される。
【0033】
1つの実施形態では、操作されたCas9タンパク質変異体は、アミノ酸位置526、562、652、661、691、780、810、848、855、1003、および1060(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)の1つ以上において変異を含む。別の実施形態では、操作されたCas9タンパク質変異体は、アミノ酸位置526、562、652、661、691、780、810、848、855、1003、および1060(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)の2つ以上において変異を含む。よって、例えば操作されたCas9タンパク質は、以下:K526、K562、K652、R661、R691、R780、K810、K848、K855、K1003およびR1060、の内の1つ以上において変異を含み得る。別の例では、操作されたCas9タンパク質は、以下:K526、K562、K652、R661、R691、R780、K810、K848、K855、K1003およびR1060の内の2つ以上において変異を含み得る。別の例では、操作されたCas9タンパク質は、以下:K526、K562、K652、R661、R691、R780、K810、K848、K855、K1003およびR1060の内の3つ以上において変異を含み得る。別の例では、操作されたCas9タンパク質は、以下:K526、K562、K652、R661、R691、R780、K810、K848、K855、K1003およびR1060の内の4つ以上において変異を含み得る。別の例では、操作されたCas9タンパク質は、以下:K526、K562、K652、R661、R691、R780、K810、K848、K855、K1003およびR1060の内の5つ以上において変異を含み得る。別の例では、操作されたCas9タンパク質は、以下:K526、K562、K652、R661、R691、R780、K810、K848、K855、K1003およびR1060の内の6つ以上において変異を含み得る。別の例では、操作されたCas9タンパク質は、以下:K526、K562、K652、R661、R691、R780、K810、K848、K855、K1003およびR1060の内の7つ以上において変異を含み得る。別の例では、操作されたCas9タンパク質は、以下:K526、K562、K652、R661、R691、R780、K810、K848、K855、K1003およびR1060の内の8つ以上において変異を含み得る。別の例では、操作されたCas9タンパク質は、以下:K526、K562、K652、R661、R691、R780、K810、K848、K855、K1003およびR1060の内の9つ以上において変異を含み得る。別の例では、操作されたCas9タンパク質は、以下:K526、K562、K652、R661、R691、R780、K810、K848、K855、K1003およびR1060の内の10以上において変異を含み得る。別の例では、操作されたCas9タンパク質は、以下:K526、K562、K652、R661、R691、R780、K810、K848、K855、K1003およびR1060の各々において変異を含み得る。これらの種々の実施形態のある場合では、例えば、前述のアミノ酸位置の1つ以上におけるリジン(K)は、ロイシン(L)またはグルタミン(Q)に変更されており、および/または前述のアミノ酸位置の1つ以上におけるアルギニン(R)はロイシン(L)またはグルタミン(Q)に変更されている。
【0034】
1つの実施形態では、例えば操作されたSpCas9変異体は、K526L/Q変異およびアミノ酸位置562、652、661、691、780、810、848、855、1003、および1060(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)における少なくとも1つのその他の変異を含む。別の実施形態では、例えば操作されたSpCas9変異体は、K562L/Q変異およびアミノ酸位置526、652、661、691、780、810、848、855、1003、および1060(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)における少なくとも1つのその他の変異を含む。別の実施形態では、例えば操作されたSpCas9変異体は、K652L/Q変異およびアミノ酸位置526、562、661、691、780、810、848、855、1003、および1060(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)における少なくとも1つのその他の変異を含む。別の実施形態では、例えば操作されたSpCas9変異体は、R661L/Q変異およびアミノ酸位置526、562、691、780、810、848、855、1003、および1060(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)における少なくとも1つのその他の変異を含む。別の実施形態では、例えば操作されたSpCas9変異体は、R691L/Q変異およびアミノ酸位置526、562、661、780、810、848、855、1003、および1060(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)における少なくとも1つのその他の変異を含む。別の実施形態では、例えば操作されたSpCas9変異体は、R780L/Q変異およびアミノ酸位置526、562、661、691、810、848、855、1003、および1060(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)における少なくとも1つのその他の変異を含む。別の実施形態では、例えば操作されたSpCas9変異体は、K810L/Q変異およびアミノ酸位置526、562、661、691、780、848、855、1003、および1060(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)における少なくとも1つのその他の変異を含む。別の実施形態では、例えば操作されたSpCas9変異体は、K848L/Q変異およびアミノ酸位置526、562、661、691、780、810、855、1003、および1060(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)における少なくとも1つのその他の変異を含む。別の実施形態では、例えば操作されたSpCas9変異体は、K855L/Q変異およびアミノ酸位置526、562、661、691、780、810、848、1003、および1060(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)における少なくとも1つのその他の変異を含む。別の実施形態では、例えば操作されたSpCas9変異体は、K1003L/Q変異およびアミノ酸位置526、562、661、691、780、810、848、855、および1060(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)における少なくとも1つのその他の変異を含む。別の実施形態では、例えば操作されたSpCas9変異体は、R1060L/Q変異およびアミノ酸位置526、562、661、691、780、810、848、855、および1003(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)における少なくとも1つのその他の変異を含む。
【0035】
よって、ある実施形態では、例えば、操作されたSpCas9タンパク質変異体は、K526L/Q、K562L/Q、K652L/Q、K810L/Q、K848L/Q、K855L/Q、R661L/Q、R691L/Q、R780L/Q、K1003L/Q、およびR1060L/Q(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)から選択される、2つの異なるアミノ酸位置における2つの変異を含む。その他の実施形態では、例えば操作されたSpCas9タンパク質変異体は、K526L/Q、K562L/Q、K652L/Q、K810L/Q、K848L/Q、K855L/Q、R661L/Q、R691L/Q、R780L/Q、K1003L/Q、およびR1060L/Q(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)から選択される、3つの異なるアミノ酸位置における3つの変異を含む。K526L/Q、K562L/Q、K652L/Q、K810L/Q、K848L/Q、K855L/Q、R661L/Q、R691L/Q、R780L/Q、K1003L/Q、およびR1060L/Q(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)から選択されるアミノ酸位置における4、5、6、7、8、9、10および11個の変異が存在するその他の実施形態が提供される事が理解されるはずである。
【0036】
前述の段落において、特定の実施形態または実施例の範囲内の当技術分野で知られている変異体は、もしあれば、但し書きにより除外されるべきであることが理解されよう。
【0037】
別の特定の実施形態では、操作されたSpCas9タンパク質変異体は、以下の変異:K526L、K526Q、K562L、K562Q、K652L、K652Q、K810L、K810Q、K848L、K848Q、K855L、K855Q、R661L、R661Q、R691L、R691Q、R780L、R780Q、K1003L、K1003Q、R1060L、およびR1060Q(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)の内の少なくとも1つを含む。
【0038】
別の特定の実施形態では、操作されたSpCas9タンパク質変異体は、以下の変異:K526L、K526Q、K562L、K562Q、K652L、K652Q、K810L、K810Q、K848L、K848Q、K855L、K855Q、R661L、R661Q、R691L、R691Q、R780L、R780Q、K1003L、K1003Q、R1060L、およびR1060Q(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)の内の少なくとも2つを含む。
【0039】
さらに別の特定の実施形態では、操作されたSpCas9タンパク質変異体は、以下の変異:K526L、K526Q、K562L、K562Q、K652L、K652Q、K810L、K810Q、K848L、K848Q、K855L、K855Q、R661L、R661Q、R691L、R691Q、R780L、R780Q、K1003L、K1003Q、R1060L、およびR1060Q(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)の内の少なくとも3つを含む。
【0040】
さらに別の特定の実施形態では、操作されたSpCas9タンパク質変異体は、以下の変異:K526L、K526Q、K562L、K562Q、K652L、K652Q、K810L、K810Q、K848L、K848Q、K855L、K855Q、R661L、R661Q、R691L、R691Q、R780L、R780Q、K1003L、K1003Q、R1060L、およびR1060Q(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)の内の少なくとも4、5、6、7、8、9、10または11個を含む。
【0041】
1つの特定の実施形態では、操作されたSpCas9タンパク質は、以下の変異体の群:K562L-R661L-K855Q;K562Q-R661L-K855Q;K652L-R661L-K855Q;K652Q-R661L-K855Q;R661L K855Q-K1003Q;およびR661L-K855Q-R1060Q(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)の内の1つから選択される。別の特定の実施形態では、操作されたSpCas9タンパク質は、以下の変異体の群:K562L-R661L-K855Q;K562Q-R661L-K855Q;K652L-R661L-K855Q;およびK652Q-R661L-K855Qの内の1つから選択される。よって、例えば操作されたSpCas9タンパク質変異体は、K562L-R661L-K855Qであり得る。あるいは、例えば操作されたSpCas9タンパク質変異体はK562Q R661L K855Qであり得る。あるいは、例えば操作されたSpCas9タンパク質変異体はK652L-R661L-K855Qであり得る。あるいは、例えば操作されたSpCas9タンパク質変異体はK652Q-R661L-K855Qであり得る。あるいは、例えば操作されたSpCas9タンパク質変異体はR661L K855Q-K1003Qであり得る。あるいは、例えば操作されたSpCas9タンパク質変異体はR661L-K855Q-R1060Qであり得る。この変異体の群の一員は、比較的バランスの取れた特異性および活性を有し、活性においては十分確立されたeSpCas9 1.1を上回り、特異性においては近年開発されたHiFi Cas9 V3を上回る。
【0042】
別の特定の実施形態では、操作されたSpCas9タンパク質は、以下の変異体の群:K526L-R661L-K855Q;R661L-R691L-K855Q;R661L-R780L-K855Q;R661L-R780Q-K855Q;R661L K810L-K855Q、およびR661L-K848L-K855Q(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)の内の1つから選択される。よって、例えば操作されたSpCas9タンパク質変異体はK526L-R661L-K855Qであり得る。あるいは、例えば操作されたSpCas9タンパク質変異体はR661L R691L K855Qであり得る。あるいは、例えば操作されたSpCas9タンパク質変異体はR661L-R780L-K855Qであり得る。あるいは、例えば操作されたSpCas9タンパク質変異体は、R661L-R780Q-K855Qであり得る。あるいは、例えば操作されたSpCas9タンパク質変異体はR661L K810L K855Qであり得る。あるいは、例えば操作されたSpCas9タンパク質変異体はR661L-K848L-K855Qであり得る。この変異体の群の一員は、非常に高いレベルの特異性を有するが、標的部位間で活性が大きく異なる。
【0043】
別の特定の実施形態では、操作されたSpCas9タンパク質は、以下の変異体の群:K526Q-R661L-K855Q;R661L-K810Q-K855Q;R661L-K855Q-K1003L;およびR661L-K855Q-R1060L(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)の内の1つから選択される。よって、例えば操作されたSpCas9タンパク質変異体はK526Q R661L K855Qであり得る。あるいは、例えば操作されたSpCas9タンパク質変異体はR661L-K810Q-K855Qであり得る。 あるいは、例えば操作されたSpCas9タンパク質変異体はR661L-K855Q-K1003Lであり得る。あるいは、例えば操作されたSpCas9タンパク質変異体はR661L K855Q R1060Lであり得る。この変異体の群の一員は、特異性および活性のレベルの両者においてeSpCas9 1.1と類似する;しかし、これらはその変異プロファイルにおいてeSpCas9 1.1と異なる。
【0044】
上記の種々の変異体に加えて、Cas9タンパク質は、ヌクレアーゼドメインの1つまたは両方を不活性化するように1つ以上の変異および/または欠失により操作されてもよい。1つのヌクレアーゼドメインの不活性化は、二本鎖配列の一本鎖を切断するCas9タンパク質(すなわち、Cas9ニッカーゼ)を産生する。RuvCドメインは、変異、例えばD10A、D8A、E762A、および/またはD986Aにより不活性化されてもよく、HNHドメインは、変異、例えばH840A、H559A、N854A、N856A、および/またはN863A(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)により不活性化されてもよい。両方のヌクレアーゼドメインの不活性化は、切断活性を有しないCas9タンパク質(すなわち、触媒的に不活性な、または不活性型(dead)Cas9)を産生する。
【0045】
上記の種々の変異体に加えてさらに、Cas9タンパク質はまた、向上した標的化特異性、向上した忠実性、変更されたPAM特異性、減少したオフターゲット効果、および/または増加した安定性を有するように1つ以上のアミノ酸置換、欠失、および/または挿入により操作されてよい。標的化特異性を向上させる、忠実性を向上させる、および/またはオフターゲット効果を減少させる1つ以上の変異の非限定的な例には、N497A、R661A、Q695A、K810A、K848A、K855A、Q926A、K1003A、R1060A、および/またはD1135E(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)を含む。
【0046】
上記の種々の変異体に加えて、Cas9タンパク質は、少なくとも1つの異種ドメインを含むように操作されてよい、すなわち、Cas9はまた、1つ以上の異種ドメインに融合される。2つ以上の異種ドメインがCas9と融合される状況において、2つ以上の異種ドメインは同じであってよく、またはそれらは異なっていてよい。1つ以上の異種ドメインは、N末端、C末端、内部位置またはそれらの組合せに対して融合されてよい。融合は化学結合を介して直接的であってよく、または結合は1つ以上のリンカーを介して間接的であってよい。種々の実施形態では、異種ドメインは、核局在化シグナル、細胞膜透過ドメイン、検出を容易にするマーカーもしくはレポータードメイン(蛍光または酵素レポータータンパク質)、クロマチン改変ドメイン、エピジェネティック修飾ドメイン(例えば、シチジンデアミナーゼドメイン、ヒストンアセチルトランスフェラーゼドメインなど)、転写調節ドメイン、DNAもしくはRNAデアミナーゼドメイン、ウラシル-DNA-グリコシラーゼドメイン、逆転写酵素ドメイン、リコンビナーゼドメイン、RNAアプタマー結合ドメイン、または非Cas9ヌクレアーゼドメインから選択される。
【0047】
(a)核局在化シグナル
いくつかの実施形態では1つ以上の異種ドメインは、核局在化シグナル(NLS)であってよい。核局在化シグナルの非限定的な例は、PKKKRKV(配列番号2)、PKKKRRV(配列番号3)、KRPAATKKAGQAKKKK(配列番号4)、YGRKKRRQRRR(配列番号5)、RKKRRQRRR(配列番号6)、PAAKRVKLD(配列番号7)、RQRRNELKRSP(配列番号8)、VSRKRPRP(配列番号9)、PPKKARED(配列番号10)、PQPKKKPL(配列番号11)、SALIKKKKKMAP(配列番号12)、PKQKKRK(配列番号13)、RKLKKKIKKL(配列番号14)、REKKKFLKRR(配列番号15)、KRKGDEVDGVDEVAKKKSKK(配列番号16)、RKCLQAGMNLEARKTKK(配列番号17)、NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(配列番号18)、およびRMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(配列番号19)を含む。
【0048】
(b)細胞膜透過ドメイン
その他の実施形態では、1つ以上の異種ドメインは、細胞膜透過ドメインであってよい。好適な細胞膜透過ドメインの例は、非限定的に、GRKKRRQRRRPPQPKKKRKV(配列番号20)、PLSSIFSRIGDPPKKKRKV(配列番号21)、GALFLGWLGAAGSTMGAPKKKRKV(配列番号22)、GALFLGFLGAAGSTMGAWSQPKKKRKV(配列番号23)、KETWWETWWTEWSQPKKKRKV(配列番号24)、YARAAARQARA(配列番号25)、THRLPRRRRRR(配列番号26)、GGRRARRRRRR(配列番号27)、RRQRRTSKLMKR(配列番号28)、GWTLNSAGYLLGKINLKALAALAKKIL(配列番号29)、KALAWEAKLAKALAKALAKHLAKALAKALKCEA(配列番号30)、およびRQIKIWFQNRRMKWKK(配列番号31)を含む。
【0049】
(c)マーカードメイン
代替の実施形態では、1つ以上の異種ドメインは、マーカードメインであってよい。マーカードメインは、蛍光タンパク質および精製またはエピトープタグを含む。好適な蛍光タンパク質は、非限定的に、緑色蛍光タンパク質(例えば、GFP、eGFP、GFP-2、tagGFP、turboGFP、Emerald、Azami Green、Monomeric Azami Green、CopGFP、AceGFP、ZsGreen1)、黄色蛍光タンパク質(例えば、YFP、EYFP、Citrine、Venus、YPet、PhiYFP、ZsYellow1)、青色蛍光タンパク質(例えば、BFP、EBFP、EBFP2、Azurite、mKalama1、GFPuv、Sapphire、T-sapphire)、シアン色蛍光タンパク質(例えば、ECFP、Cerulean、CyPet、AmCyan1、Midoriishi-Cyan)、赤色蛍光タンパク質(例えば、mKate、mKate2、mPlum、DsRed monomer、mCherry、mRFP1、DsRed-Express、DsRed2、DsRed-Monomer、HcRed-Tandem、HcRed1、AsRed2、eqFP611、mRasberry、mStrawberry、Jred)、橙色蛍光タンパク質(例えば、mOrange、mKO、Kusabira-Orange、Monomeric Kusabira-Orange、mTangerine、tdTomato)、またはそれらの組合せを含む。マーカードメインは、1つ以上の蛍光タンパク質のタンデムリピート(例えば、Suntag)を含んでよい。好適な精製またはエピトープタグの非限定的な例は、6xHis(配列番号32)、FLAG(登録商標)、HA、GST、Myc、SAMなどを含む。CRISPR複合体の検出または濃縮を容易にする異種融合の非限定的な例は、ストレプトアビジン(Kipriyanov et al.,Human Antibodies,1995,6(3):93-101)、アビジン(Airenne et al.,Biomolecular Engineering,1999,16(1-4):87-92)、アビジンの単量体形態(in(Laitinen et al.,Journal of Biological Chemistry,2003,278(6):4010-4014)、組み換え体の生産中におけるビオチン化を容易にするペプチドタグ(Cull et al.,Methods in Enzymology,2000,326:430-440)を含む。
【0050】
(d)クロマチン調節モチーフ
さらに他の実施形態では、1つ以上の異種ドメインは、クロマチン調節モチーフ(CMM)であってよい。CMMの非限定的な例は、高移動度グループ(HMG)タンパク質(例えば、HMGB1、HMGB2、HMGB3、HMGN1、HMGN2、HMGN3a、HMGN3b、HMGN4、およびHMGN5タンパク質)、ヒストンH1変異体の中央球状ドメイン(例えば、ヒストンH1.0、H1.1、H1.2、H1.3、H1.4、H1.5、H1.6、H1.7、H1.8、H1.9、およびH.1.10)、またはクロマチンリモデリング複合体のDNA結合ドメイン(例えば、SWI/SNF(スイッチ/スクロース非発酵性(SWItch/Sucrose Non-Fermentable))、ISWI(模倣スイッチ(Imitation SWItch))、CHD(クロモドメイン-ヘリカーゼ-DNA結合(Chromodomain-Helicase-DNA binding))、Mi-2/NuRD(ヌクレオソームリモデリングおよびデアセチラーゼ)、INO80、SWR1、およびRSC複合体に由来するヌクレオソーム相互作用ペプチドを含む。その他の実施形態では、CMMはまた、トポイソメラーゼ、ヘリカーゼ、またはウイルスタンパク質に由来してよい。CMMの供給源は変化してよく、且つ変化するはずである。CMMは、ヒト、動物(すなわち、脊椎動物および無脊椎動物)、植物、藻類、または酵母由来であってよい。特定のCMMの非限定的な例は、以下の表Bに列挙されている。当業者は、他の種におけるホモログおよび/またはそれとの関連融合モチーフを容易に同定することができる。
【表B】
【0051】
(e)エピジェネティック修飾ドメイン
さらにその他の実施形態では、1つ以上の異種ドメインは、エピジェネティック修飾ドメインであってよい。好適なエピジェネティック修飾ドメインの非限定的な例は、DNA脱アミノ化(例えば、シチジンデアミナーゼ、アデノシンデアミナーゼ、グアニンデアミナーゼ)、DNAメチルトランスフェラーゼ活性(例えば、シトシンメチルトランスフェラーゼ)、DNAデメチラーゼ活性、DNAアミノ化、DNA酸化活性、DNAヘリカーゼ活性、ヒストンアセチルトランスフェラーゼ(HAT)活性(例えば、E1A結合タンパク質p300に由来するHATドメイン)、ヒストンデアセチラーゼ活性、ヒストンメチルトランスフェラーゼ活性、ヒストンデメチラーゼ活性、ヒストンキナーゼ活性、ヒストンホスファターゼ活性、ヒストンユビキチンリガーゼ活性、ヒストン脱ユビキチン化活性、ヒストンアデニル化活性、ヒストン脱アデニル化活性、ヒストンSUMO化活性、ヒストン脱SUMO化活性、ヒストンリボシル化活性、ヒストン脱リボシル化活性、ヒストンミリストイル化活性、ヒストン脱ミリストイル化活性、ヒストンシトルリン化活性、ヒストンアルキル化活性、ヒストン脱アルキル化活性、またはヒストン酸化活性を有するものを含む。特定の実施形態では、エピジェネティック修飾ドメインは、シチジンデアミナーゼ活性、アデノシンデアミナーゼ活性、ヒストンアセチルトランスフェラーゼ活性、またはDNAメチルトランスフェラーゼ活性を含んでよい。
【0052】
(f)転写調節ドメイン
その他の実施形態では、1つ以上の異種ドメインは、転写調節ドメイン(すなわち、転写活性化ドメインまたは転写リプレッサードメイン)であってよい。好適な転写活性化ドメインは、非限定的に、単純ヘルペスウイルスVP16ドメイン、VP64(すなわち、VP16の4つのタンデムコピー)、VP160(すなわち、VP16の10個のタンデムコピー)、NFκB p65活性化ドメイン(p65)、エプスタイン-バールウイルスR転写活性化因子(Rta)ドメイン、VPR(すなわち、VP64+p65+Rta)、p300-依存性転写活性化ドメイン、p53活性化ドメイン1および2、ヒートショック因子1(HSF1)活性化ドメイン、Smad4活性化ドメイン(SAD)、cAMP応答要素結合タンパク質(CREB)活性化ドメイン、E2A活性化ドメイン、活性化T細胞の核因子(NFAT)活性化ドメイン、またはそれらの組合せを含む。好適な転写リプレッサードメインの非限定的な例は、Kruppel関連ボックス(KRAB)リプレッサードメイン、Mxiリプレッサードメイン、誘導cAMP初期リプレッサー(ICER)ドメイン、YY1グリシンリッチリプレッサードメイン、Sp1様リプレッサー、E(spl)リプレッサー、IκBリプレッサー、Sin3リプレッサー、メチル-CpG結合タンパク質2(MeCP2)リプレッサー、またはそれらの組合せを含む。転写活性化または転写リプレッサードメインは、Cas9タンパク質に遺伝的に融合されてよく、または非共有タンパク質-タンパク質、タンパク質-RNA、またはタンパク質-DNA相互作用を介して結合されてよい。
【0053】
(g)RNAアプタマー結合ドメイン
さらなる実施形態では、1つ以上の異種ドメインは、RNAアプタマー結合ドメイン(Konermann et al.,Nature,2015,517(7536):583-588;Zalatan et al.,Cell,2015,160(1-2):339-50)であってよい。好適なRNAアプタマータンパク質ドメインの例は、MS2コートタンパク質(MCP)、PP7バクテリオファージコートタンパク質(PCP)、MuバクテリオファージComタンパク質、ラムダバクテリオファージN22タンパク質、ステムループ結合タンパク質(SLBP)、脆弱性X精神遅滞症候群-関連タンパク質1(FXR1)、バクテリオファージに由来するタンパク質、例えばAP205、BZ13、f1、f2、fd、fr、ID2、JP34/GA、JP501、JP34、JP500、KU1、M11、M12、MX1、NL95、PP7、ΦCb5、ΦCb8r、ΦCb12r、ΦCb23r、Qβ、R17、SP-β、TW18、TW19、およびVK、それらのフラグメント、またはそれらの誘導体を含む。
【0054】
(h)非Cas9ヌクレアーゼドメイン
さらにその他の実施形態では、1つ以上の異種ドメインは、非Cas9ヌクレアーゼドメインであってよい。好適なヌクレアーゼドメインは、あらゆるエンドヌクレアーゼまたはエキソヌクレアーゼから得ることができる。ヌクレアーゼドメインが由来することができるエンドヌクレアーゼの非限定的な例は、非限定的に、制限エンドヌクレアーゼおよびホーミングエンドヌクレアーゼを含む。いくつかの実施形態では、ヌクレアーゼドメインは、タイプII-S制限エンドヌクレアーゼに由来してよい。タイプII-Sエンドヌクレアーゼは、典型的に認識/結合部位から数塩基対離れた部位でDNAを切断し、分離可能な結合および切断ドメインを有する。これらの酵素は、一般的に、一時的に会合して二量体を形成し、互いにずれた位置でDNAの各鎖を切断する、単量体である。好適なタイプII-Sエンドヌクレアーゼの非限定的な例は、BfiI、BpmI、BsaI、BsgI、BsmBI、BsmI、BspMI、FokI、MboII、およびSapIを含む。いくつかの実施形態では、ヌクレアーゼドメインは、FokIヌクレアーゼドメインまたはその誘導体であってよい。タイプII-Sヌクレアーゼドメインは、2つの異なるヌクレアーゼドメインの二量化を容易にするように改変されてよい。例えば、FokIの切断ドメインは、特定のアミノ酸残基を変異することによって改変されてよい。非限定的な例として、FokIヌクレアーゼドメインの位置446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537、および538でのアミノ酸残基が、改変のための標的である。特定の実施形態では、FokIヌクレアーゼドメインは、Q486E、I499L、および/またはN496D変異を含む第1のFokIハーフドメイン、およびE490K、I538K、および/またはH537R変異を含む第2のFokIハーフドメインを含んでよい。
【0055】
(i)核酸塩基改変酵素
本明細書に記載する操作されたCas9変異体はまた、核酸塩基改変酵素またはその触媒ドメインを含み得る。
【0056】
種々の核酸塩基改変酵素は、本明細書に開示する系において使用するのに好適である。核酸塩基改変酵素はDNA塩基エディターであり得る。いくつかの実施形態では、DNA塩基エディターは、ポリメラーゼ酵素にチミンとして読まれるウリジンへとシチジンを変換するシチジンデアミナーゼであり得る。シチジンデアミナーゼの非限定的な例は、シチジンデアミナーゼ1(CDA1)、シチジンデアミナーゼ2(CDA2)、活性化誘導シチジンデアミナーゼ(AICDA)、アポリポタンパク質B mRNA-編集複合体(APOBEC)ファミリーシチジンデアミナーゼ(例えば、APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D/E、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4)、APOBEC1相補因子(complementation factor)/APOBEC1刺激因子(ACF1/ASF)シチジンデアミナーゼ、RNAに作用するシトシンデアミナーゼ(CDAR)、細菌性長アイソフォームシチジンデアミナーゼ(CDDL)およびtRNAに作用するシトシンデアミナーゼ(CDAT)を含む。その他の実施形態では、DNA塩基エディターは、アデノシンをポリメラーゼ酵素にグアノシンと読まれるイノシンへと変換する、アデノシンデアミナーゼであり得る。アデノシンデアミナーゼの非限定的な例は、tRNA アデニンデアミナーゼ、アデノシンデアミナーゼ、RNAに作用するアデノシンデアミナーゼ(ADAR)、およびtRNAに作用するアデノシンデアミナーゼ(ADAT)を含む。
【0057】
核酸塩基改変酵素(塩基エディター)は、野生型またはそのフラグメント、その改変バージョン(例えば、必須でないドメインを削除することができる)、またはその操作したバージョンであり得る。核酸塩基改変酵素(塩基エディター)は、真核生物由来、細菌由来または古細菌由来であり得る。
【0058】
いくつかの実施形態では、核酸塩基改変酵素(塩基エディター)はシチジンデアミナーゼまたはその触媒ドメインであり得る。シチジンデアミナーゼは、ヒト、マウス、ヤツメウナギ、アワビ、またはE.coli由来であり得る。核酸塩基改変酵素がシチジンデアミナーゼである実施形態では、RNAにガイドされる核酸塩基改変系にはさらに少なくとも1つのウラシルグリコシラーゼ阻害(UGI)ドメインを含み得る。シトシンの脱アミノ化の結果であるDNAからのウラシルの除去は、UGIによって阻害される。好適なUGIドメインは当分野で知られている。
【0059】
いくつかの実施形態では、シチジンデアミナーゼおよびUGIを採用する系は、それらの成分が過剰発現された際には、負の効果を有し得る。過剰発現を防止するために、分解タグが付加されてもよい。分解タグは、タンパク質リサイクル系によって分解されるべきタンパク質の目印となる。これらの分解タグは、異なるタンパク質半減期をもたらす。非限定的な分解タグの例は、LVA、AAV、ASVおよびLAAである。
【0060】
(j)逆転写酵素
いくつかの実施形態では、本明細書に記載の操作されたSpCas9変異体に融合するドメインは逆転写酵素である。逆転写酵素の例には、鳥類骨髄芽球症ウイルス(avian myeloblastosis virus)(AMV)逆転写酵素とモロニーマウス白血病ウイルス(Moloney murine leukemia virus)(MMLV)逆転写酵素を含む。
【0061】
(k)リコンビナーゼ/インテグラーゼ
いくつかの実施形態では、本明細書に記載の操作されたSpCas9変異体に融合するドメインはリコンビナーゼまたはインテグラーゼである。好適なリコンビナーゼの非限定的な例には、Creリコンビナーゼ、FLPリコンビナーゼ、Ginリコンビナーゼ、バクテロイデス(Bacteroides)intN2チロシンインテグラーゼ(NBU2遺伝子にコードされる)、ストレプトマイセスファージ(Streptomyces phage)phiC31(φC31)リコンビナーゼ、大腸菌ファージ(coliphage)P4リコンビナーゼ、大腸菌ファージラムダインテグラーゼ、リステリアA118ファージ(Listeria A118phage)リコンビナーゼ、レンチウイルスまたはHIVインテグラーゼ、およびアクチノファージ(actinophage)R4 Sreリコンビナーゼを含む。リコンビナーゼ/インテグラーゼは、2つの配列特異的認識(または付着)部位(例えば、attP部位とattB部位または2つのCre/loxP部位)間の組換えを仲介するか、HIVインテグラーゼのように無作為にDNAを挿入し得る、
【0062】
(l)リンカー
1つ以上の異種ドメインはCas9タンパク質に1つ以上の化学結合(例えば、共有結合)を介して直接的に連結されてよく、または1つ以上の異種ドメインはCas9タンパク質に1つ以上のリンカーを介して間接的に連結されてよい。
【0063】
リンカーは、少なくとも1つの共有結合を介して1つ以上の他の化学基に連結する化学基である。好適なリンカーは、アミノ酸、ペプチド、ヌクレオチド、核酸、有機リンカー分子(例えば、マレイミド誘導体、N-エトキシベンジルイミダゾール、ビフェニル-3、4’、5-トリカルボン酸、p-アミノベンジルオキシカルボニル、など)、ジスルフィドリンカー、およびポリマーリンカー(例えば、PEG)を含む。リンカーは、非限定的に、アルキレン、アルケニレン、アルキニレン、アルキル、アルケニル、アルキニル、アルコキシ、アリール、ヘテロアリール、アラルキル、アラルケニル、アラルキニルなどを含む、1つ以上のスペーサー(spacing)基を含んでよい。リンカーは、中性であってよく、または正または負の電荷を有してもよい。さらに、リンカーは、リンカーを別の化学基に連結するリンカーの共有結合が、pH、温度、塩濃度、光、触媒、または酵素を含む特定の条件下で破壊または切断することができるように切断可能であってよい。いくつかの実施形態では、リンカーは、ペプチドリンカーであってよい。ペプチドリンカーは、フレキシブルな(flexible)アミノ酸リンカー(例えば、小さい非極性または極性アミノ酸を含む)であってよい。フレキシブルなリンカーの非限定的な例は、LEGGGS(配列番号33)、TGSG(配列番号34)、GGSGGGSG(配列番号35)、(GGGGS)1-4(配列番号36)、および(Gly)6-8(配列番号37)を含む。あるいは、ペプチドリンカーは硬い(rigid)アミノ酸リンカーであってよい。かかるリンカーは、(EAAAK)1-4(配列番号38)、A(EAAAK)2-5A(配列番号39)、PAPAP(配列番号40)、および(AP)6-8(配列番号41を含む。好適なリンカーのさらなる例は当分野でよく知られており、リンカーを設計するプログラムは容易に利用できる(例えば、 Crasto et al.,Protein Eng.,2000,13(5):309-312)。
【0064】
(m)操作されたCas9タンパク質の生産
いくつかの実施形態では、操作されたCas9タンパク質は、無細胞系、細菌細胞、または真核細胞において組換え的に生産されてよく、従来的な精製方法を使用して精製されてよい。その他の実施形態では、操作されたCas9タンパク質は、操作されたCas9タンパク質をコードする核酸から関心のある真核細胞においてin vivoで生産される(以下のセクション(III)を参照し、およびこのセクション(I)に参照により援用する)。
【0065】
操作されたCas9タンパク質がヌクレアーゼまたはニッカーゼ活性を含む実施形態では、操作されたCas9タンパク質は、少なくとも1つの核局在化シグナル、細胞膜透過ドメイン、および/またはマーカードメイン、ならびに少なくとも1つのクロマチン破壊ドメインをさらに含んでよい。操作されたCas9タンパク質がエピジェネティック修飾ドメインに連結される実施形態では、操作されたCas9タンパク質は、少なくとも1つの核局在化シグナル、細胞膜透過ドメイン、および/またはマーカードメイン、ならびに少なくとも1つのクロマチン破壊ドメインをさらに含んでよい。さらに、操作されたCas9タンパク質が転写調節ドメインに連結される実施形態では、操作されたCas9タンパク質は、少なくとも1つの核局在化シグナル、細胞膜透過ドメイン、および/またはマーカードメイン、ならびに少なくとも1つのクロマチン破壊ドメインおよび/または少なくとも1つのRNAアプタマー結合ドメインをさらに含んでよい。
【0066】
(II)操作されたCas9系
本開示の別の態様は、参照によりこのセクション(II)において援用される上記のセクション(I)で記載されるような操作されたCas9タンパク質変異体(例えば、操作されたCas9タンパク質変異体はアミノ酸位置526、562、652、661、691、780、810、848、855、1003、および1060(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)の1つ以上(例えば2つまたは3つ)における改変を含む)、ここで、前述のアミノ酸位置の1つ以上におけるリジン(K)は、ロイシン(L)またはグルタミン(Q)に変更されており、および/または前述のアミノ酸位置の1つ以上におけるアルギニン(R)はロイシン(L)またはグルタミン(Q)に変更されている、ならびに操作されたガイドRNA、ここで、各操作されたガイドRNAは特異的な操作されたCas9タンパク質と複合体を形成するように設計されている、を含む操作されたCas9系を提供する。各操作されたガイドRNAは、二本鎖配列の標的配列とハイブリダイズするように設計された5’ガイド配列を含み、ここで、標的配列はプロトスペーサー隣接モチーフ(PAM)の5’にある。
【0067】
(a)操作されたガイドRNA
操作されたガイドRNAは、特定の操作されたCas9タンパク質と複合体を形成するように設計される。ガイドRNAは、(i)標的配列とハイブリダイズするガイド配列を5’末端に含むCRISPR RNA(crRNA)および(ii)Cas9タンパク質を動員するトランス作用crRNA(tracrRNA)配列を含む。各ガイドRNAのcrRNAガイド配列は、異なっている(すなわち、配列特異的である)。tracrRNA配列は、一般的に、特定の細菌種に由来するCas9タンパク質と複合体を形成するように設計されたガイドRNAにおいて同じである。
【0068】
crRNAガイド配列は、二本鎖配列において標的配列(すなわち、プロトスペーサー)とハイブリダイズするように設計される。一般的に、crRNAおよび標的配列間の相補性は、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%である。特定の実施形態では、相補性は完全である(すなわち、100%)。種々の実施形態では、crRNAガイド配列の長さは、約15ヌクレオチドから約25ヌクレオチドの範囲であってよい。例えば、crRNAガイド配列は、約15、16、17、18、19、20、21、22、23、24、または25ヌクレオチド長であってよい。特定の実施形態では、crRNAは、約19、20、または21ヌクレオチド長である。1つの実施形態では、crRNAガイド配列は、20ヌクレオチドの長さを有する。
【0069】
ガイドRNAは、Cas9タンパク質と相互作用する少なくとも1つのステムループ構造を形成するリピート配列、および一本鎖のままである3’配列を含む。各ループおよびステムの長さは変化してよい。例えば、ループは約3から約10ヌクレオチド長の範囲であってよく、ステムは約6から約20塩基対の長さの範囲であってよい。ステムは、1から約10ヌクレオチドの1つ以上の突出部を含んでよい。一本鎖3’領域の長さは変化してよい。操作されたガイドRNAにおけるtracrRNA配列は、一般的に、関心のある細菌種における野生型tracrRNAをコード配列に基づく。野生型配列は、二次構造の形成を容易にする、二次構造の安定性を増加させる、真核細胞における発現を容易にするなどのために改変されてよい。例えば、1つ以上のヌクレオチド変化は、ガイドRNAコード配列に導入されてよい(以下の実施例3参照)。tracrRNA配列は、約50ヌクレオチドから約300ヌクレオチドの長さの範囲であってよい。種々の実施形態では、tracrRNAは、約50から約90ヌクレオチド、約90から約110ヌクレオチド、約110から約130ヌクレオチド、約130から約150ヌクレオチド、約150から約170ヌクレオチド、約170から約200ヌクレオチド、約200から約250ヌクレオチド、または約250から約300ヌクレオチドの長さの範囲であってよい。
【0070】
一般的に、操作されたガイドRNAは、crRNA配列がtracrRNA配列に連結されている単一の分子(すなわち、単一のキメラガイドRNAまたはsgRNA)である。いくつかの実施形態では、しかしながら、操作されたガイドRNAは、2つの別々の分子(例えば、2分子ガイドRNA)であってよい。例えば、ガイドRNAは、第2の分子の5’末端と塩基対合することができる3’配列(約6から約20ヌクレオチドを含む)を含むcrRNAを含む第1の分子(または領域)、および第1の分子の3’末端(または領域)と塩基対合することができる5’配列(約6から約20ヌクレオチドを含む)を含むtracrRNAを含む第2の分子(または領域)を含み得る。
【0071】
いくつかの実施形態では、操作されたガイドRNAのtracrRNA配列は、1つ以上のアプタマー配列を含むように改変されてよい(Konermann et al.,Nature,2015,517(7536):583-588;Zalatan et al.,Cell,2015,160(1-2):339-50)。好適なアプタマー配列は、MCP、PCP、Com、SLBP、FXR1、AP205、BZ13、f1、f2、fd、fr、ID2、JP34/GA、JP501、JP34、JP500、KU1、M11、M12、MX1、NL95、PP7、ΦCb5、ΦCb8r、ΦCb12r、ΦCb23r、Qβ、R17、SP-β、TW18、TW19、VK、それらのフラグメント、またはそれらの誘導体から選択され、アダプタータンパク質に結合するアプタマー配列を含む。当業者は、アプタマー配列の長さが変化してよいことを理解する。
【0072】
その他の実施形態では、ガイドRNAは、少なくとも1つの検出可能な標識をさらに含んでよい。検出可能な標識は、フルオロフォア(例えば、FAM、TMR、Cy3、Cy5、Texas Red、Oregon Green、Alexa Fluors、Halo tags、または好適な蛍光色素)、検出タグ(例えば、ビオチン、ジゴキシゲニンなど)、量子ドット、または金粒子であってよい。
【0073】
ガイドRNAは、標準リボヌクレオチドおよび/または修飾リボヌクレオチドを含んでよい。いくつかの実施形態では、ガイドRNAは、標準または修飾デオキシリボヌクレオチドを含んでよい。ガイドRNAが酵素的に合成される(すなわち、in vivoまたはin vitro)実施形態では、ガイドRNAは、一般的に、標準リボヌクレオチドを含む。ガイドRNAが化学的に合成される実施形態では、ガイドRNAは、標準または修飾リボヌクレオチドおよび/またはデオキシリボヌクレオチドを含み得る。修飾リボヌクレオチドおよび/またはデオキシリボヌクレオチドは、塩基修飾(例えば、シュードウリジン、2-チオウリジン、N6-メチルアデノシンなど)および/または糖修飾(例えば、2’-O-メチル、2’-フルオロ、2’-アミノ、ロックド核酸(LNA)など)を含む。ガイドRNAの骨格はまた、ホスホロチオエート結合、ボラノホスフェート結合、またはペプチド核酸を含むように改変されてよい。
【0074】
(b)PAM配列
上記に詳述する操作されたCas9系はPAM配列の上流に位置する二本鎖DNAの特異的配列を標的とする。PAM配列は典型的な5’-NGG-3’PAMまたは非典型的なPAM、例えば5’-NAG-3’PAMを含み得る。いくつかの実施形態では、上記に詳述する操作されたCas9系は、5’-NGAN-3’、5’-NGNG-3’、および5’-NGCG-3’PAMなどの代替PAMを認識するように改変されてもよい。
【0075】
(III)核酸
本開示のさらなる態様は、参照によりこのセクション(III)において援用される上記のせクション(I)および(II)に記載する操作されたCas9タンパク質変異体および系をコードする核酸を提供する(例えば、操作されたCas9タンパク質変異体はアミノ酸位置526、562、652、661、691、780、810、848、855、1003、および1060(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)の1つ以上(例えば2つまたは3つ)における改変を含み、ここで、前述のアミノ酸位置の1つ以上におけるリジン(K)は、ロイシン(L)またはグルタミン(Q)に変更されており、および/または前述のアミノ酸位置の1つ以上におけるアルギニン(R)はロイシン(L)またはグルタミン(Q)に変更されている)。当該タンパク質および系は、単一の核酸または複数の核酸によってコードされてよい。核酸は、DNAまたはRNA、線状または環状、一本鎖または二本鎖であってよい。RNAまたはDNAは、関心のある真核細胞においてタンパク質への効率的な翻訳のためにコドン最適化されてよい。コドン最適化プログラムは、フリーウェアとしてまたは市販のソースから利用できる。
【0076】
いくつかの実施形態では、操作されたCas9タンパク質をコードする核酸はRNAであってよい。RNAは、in vitroで酵素的に合成されてよい。このために、操作されたCas9タンパク質をコードするDNAは、in vitroでのRNA合成のためのファージRNAポリメラーゼにより認識されるプロモーター配列に作動可能に連結されてよい。例えば、プロモーター配列は、T7、T3、またはSP6プロモーター配列またはT7、T3、またはSP6プロモーター配列の変異型であってよい。操作されたタンパク質をコードするDNAは、以下に詳述されるようにベクターの一部であってよい。このような実施形態では、in vitroで転写されたRNAは、精製、キャップ付加、および/またはポリアデニル化されてよい。他の実施形態では、操作されたCas9タンパク質をコードするRNAは、自己複製RNAの一部であってよい(Yoshioka et al.,Cell Stem Cell,2013,13:246-254)。自己複製RNAは、限られた数の細胞分裂のために自己複製を可能にする一本鎖プラス鎖RNAであり、関心のあるタンパク質をコードするように修飾することができる、非感染性の自己複製のベネズエラウマ脳炎(VEE)ウイルスRNAレプリコンに由来してもよい(Yoshioka et al.,Cell Stem Cell,2013,13:246-254)。
【0077】
その他の実施形態では、操作されたCas9タンパク質をコードする核酸はDNAであってよい。DNAコード配列は、関心のある細胞における発現のための少なくとも1つのプロモーター制御配列に作動可能に連結されてよい。ある実施形態では、DNAコード配列は、細菌(例えば、大腸菌)細胞または真核(例えば、酵母、昆虫、または哺乳動物)細胞における、操作されたCas9タンパク質の発現のためのプロモーター配列に作動可能に連結されてよい。好適な細菌プロモーターは、非限定的に、T7プロモーター、lacオペロンプロモーター、trpプロモーター、tacプロモーター(trpおよびlacプロモーターのハイブリッドである)、前記いずれかの変異型、および前記いずれかの組合せを含む。好適な真核プロモーターの非限定的な例は、構成的、調節、または細胞もしくは組織特異的なプロモーターを含む。好適な真核構成的プロモーター制御配列は、非限定的に、サイトメガロウイルス前初期プロモーター(CMV)、シミアンウイルス(SV40)プロモーター、アデノウイルス主要後期プロモーター、ラウス肉腫ウイルス(RSV)プロモーター、マウス乳房腫瘍ウイルス(MMTV)プロモーター、ホスホグリセリン酸キナーゼ(PGK)プロモーター、延長因子(ED1)-アルファプロモーター、ユビキチンプロモーター、アクチンプロモーター、チューブリンプロモーター、免疫グロブリンプロモーター、それらのフラグメント、または前述のいずれかの組合せを含む。好適な真核調節プロモーター制御配列の例は、非限定的に、熱ショック、金属、ステロイド、抗生物質、またはアルコールによって調節されるものを含む。組織特異的なプロモーターの非限定的な例は、B29プロモーター、CD14プロモーター、CD43プロモーター、CD45プロモーター、CD68プロモーター、デスミンプロモーター、エラスターゼ-1プロモーター、エンドグリンプロモーター、フィブロネクチンプロモーター、Flt-1プロモーター、GFAPプロモーター、GPIIbプロモーター、ICAM-2プロモーター、INF-βプロモーター、Mbプロモーター、NphsIプロモーター、OG-2プロモーター、SP-Bプロモーター、SYN1プロモーター、およびWASPプロモーターを含む。プロモーター配列は野生型であってよく、またはそれはより効率的または有効な発現のために改変されてよい。いくつかの実施形態では、DNAコード配列はまた、ポリアデニル化シグナル(例えば、SV40 polyAシグナル、ウシ成長ホルモン(BGH)polyAシグナルなど)および/または少なくとも1つの転写終結配列に連結されてよい。いくつかの状況において、操作されたCas9タンパク質は、細菌または真核細胞から精製されてよい。
【0078】
さらにその他の実施形態では、操作されたガイドRNAはDNAによってコードされてよい。場合によっては、操作されたガイドRNAをコードするDNAは、in vitroでのRNA合成のためのファージRNAポリメラーゼにより認識されるプロモーター配列に作動可能に連結されてよい。例えば、プロモーター配列は、T7、T3、またはSP6プロモーター配列またはT7、T3、またはSP6プロモーター配列の変異型であってよい。他の例では、操作されたガイドRNAをコードするDNAは、関心のある真核細胞における発現のためのRNAポリメラーゼIII(Pol III)により認識されるプロモーター配列に作動可能に連結されてよい。好適なPol IIIプロモーターの例は、非限定的に、哺乳動物U6、U3、H1、および7SL RNAプロモーターを含む。
【0079】
種々の実施形態では、操作されたCas9タンパク質をコードする核酸は、ベクター中に存在してよい。いくつかの実施形態では、ベクターは、操作されたガイドRNAをコードする核酸をさらに含んでよい。好適なベクターは、プラスミドベクター、ウイルスベクター、および自己複製RNAを含む(Yoshioka et al.,Cell Stem Cell,2013,13:246-254)。いくつかの実施形態では、複合または融合タンパク質をコードする核酸は、プラスミドベクターにおいて存在してよい。好適なプラスミドベクターの非限定的な例は、pUC、pBR322、pET、pBluescript、およびそれらの変異型を含む。他の実施形態では、複合または融合タンパク質をコードする核酸は、ウイルスベクター(例えば、レンチウイルスベクター、アデノ随伴ウイルスベクター、アデノウイルスベクターなど)の一部であってよい。プラスミドまたはウイルスベクターは、さらなる発現制御配列(例えば、エンハンサー配列、Kozak配列、ポリアデニル化配列、転写終結配列など)、選択可能なマーカー配列(例えば、抗生物質耐性遺伝子)、複製起点などを含んでよい。ベクターおよびその使用についてのさらなる情報は、“Current Protocols in Molecular Biology” Ausubel et al.,John Wiley &Sons,New York,2003 または “Molecular Cloning:A Laboratory Manual” Sambrook &Russell,Cold Spring Harbor Press,Cold Spring Harbor,NY,3rd edition,2001に見出だされ得る。
【0080】
(IV)真核細胞
本開示の別の態様は、参照によりこのセクション(IV)において援用される上記のセクション(I)で詳述される少なくとも1つの操作されたCas9タンパク質変異体(例えば、アミノ酸位置526、562、652、661、691、780、810、848、855、1003、および1060(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)の1つ以上(例えば2つまたは3つ)における改変を含み、ここで、前述のアミノ酸位置の1つ以上におけるリジン(K)は、ロイシン(L)またはグルタミン(Q)に変更されており、および/または前述のアミノ酸位置の1つ以上におけるアルギニン(R)はロイシン(L)またはグルタミン(Q)に変更されている、操作されたCas9タンパク質変異体)、および/または、上記のセクション(I)、(II)および(III)(これら各々は参照によりこのセクション(V)において援用される)に詳述される、操作されたCas9タンパク質をコードする少なくとも1つの核酸、および/または系、および/または操作されたガイドRNAを含む真核細胞を含む。
【0081】
真核細胞は、ヒト細胞、非ヒト哺乳動物細胞、非哺乳動物脊椎動物細胞、無脊椎動物細胞、植物細胞、または単細胞真核生物であってよい。好適な真核細胞の例は、以下のセクション(V)(c)において詳述される。真核細胞は、in vitro、ex vivo、またはin vivoであってよい。
【0082】
(V)配列の改変方法。
本開示のさらなる態様は、真核細胞の染色体配列を改変するための方法を包含する。一般に、当該方法は、上記セクション(I)に詳述される操作されたCas9タンパク質変異体をさらに含む、上記セクション(II)に詳述される少なくとも1つの操作されたCas9系を、関心のある真核細胞に導入する事を含み、ここでセクション(I)および(II)の各々は参照によりこのセクション(V)において援用される(例えば、アミノ酸位置526、562、652、661、691、780、810、848、855、1003、および1060(Streptococcus pyogenes Cas9、SpCas9の付番方式を参照)の1つ以上(例えば2つまたは3つ)における改変を含み、ここで、前述のアミノ酸位置の1つ以上におけるリジン(K)は、ロイシン(L)またはグルタミン(Q)に変更されており、および/または前述のアミノ酸位置の1つ以上におけるアルギニン(R)はロイシン(L)またはグルタミン(Q)に変更されている、操作されたCas9タンパク質変異体、および/または、上記のセクション(I)、(II)および(III)(これら各々は参照によりこのセクション(IV)において援用される)に詳述される、操作されたCas9タンパク質をコードする少なくとも1つの核酸、および/または系、および/または操作されたガイドRNA)。
【0083】
操作されたCas9タンパク質がヌクレアーゼまたはニッカーゼ活性を含む実施形態では、染色体配列改変は、少なくとも1つのヌクレオチドの置換、少なくとも1つのヌクレオチドの欠失、少なくとも1つのヌクレオチドの挿入を含んでよい。いくつかの反復において、方法は、操作されたCas9の1つの系または複数の系が染色体配列における標的部位に二本鎖切断を導入し、細胞性DNA修復プロセスによる二本鎖切断の修復が少なくとも1つのヌクレオチド変化(すなわち、インデル)を導入し、それにより染色体配列を不活性化する(すなわち、遺伝子ノックアウト)ように、真核細胞にドナーポリヌクレオチドを含まず、ヌクレアーゼ活性を含む1つの操作されたCas9系またはニッカーゼ活性を含む2つの操作されたCas9系を導入することを含む。その他の反復において、方法は、操作されたCas9の1つの系または複数の系が染色体配列における標的部位に二本鎖切断を導入し、細胞性DNA修復プロセスによる二本鎖切断の修復によってドナーポリヌクレオチド中の配列が染色体配列の標的部位へと挿入または交換(すなわち、遺伝子修正または遺伝子ノックイン)されるように、ヌクレアーゼ活性を含む1つの操作されたCas9系またはニッカーゼ活性を含む2つの操作されたCas9系をドナーポリヌクレオチドと共に真核細胞に導入することを含む。
【0084】
操作されたCas9タンパク質がエピジェネティック的修飾活性または転写調節活性を含む実施形態では、染色体配列改変は、染色体配列における、標的部位内または付近での少なくとも1つのヌクレオチドの変換、標的部位内または付近での少なくとも1つのヌクレオチドの修飾、標的部位内または付近での少なくとも1つのヒストンタンパク質の修飾、および/または標的部位内または付近での転写の変化を含み得る。
【0085】
さらに、本明細書に記載の操作されたCas9変異体が真核細胞以外、例えば微生物ゲノムを改変するためにも使用され得ることは理解されるはずである。
【0086】
(a)細胞への導入
上記のとおり、方法は少なくとも1つの操作されたCas9系および/またはこの系をコードする核酸(および所望のドナーポリヌクレオチド)を真核細胞に導入することを含む。少なくとも1つの系および/または核酸/ドナーポリヌクレオチドは、種々の手段により関心のある細胞に導入されてよい。
【0087】
いくつかの実施形態では、細胞は、好適な分子(すなわち、タンパク質、DNA、および/またはRNA)でトランスフェクトされてよい。好適なトランスフェクション方法は、ヌクレオフェクション(nucleofection)(またはエレクトロポレーション)、リン酸カルシウム媒介トランスフェクション、カチオン性ポリマートランスフェクション(例えば、DEAE-デキストランまたはポリエチレンイミン)、ウイルス形質導入、ビロゾームトランスフェクション、ビリオントランスフェクション、リポソームトランスフェクション、カチオン性リポソームトランスフェクション、免疫リポソームトランスフェクション、非リポソーム脂質トランスフェクション、デンドリマートランスフェクション、熱ショックトランスフェクション、マグネトフェクション、リポフェクション、遺伝子銃送達、インペールフェクション、ソノポレーション、光学的トランスフェクション、および核酸のプロプライエタリー(proprietary)剤で増強された摂取を含む。トランスフェクション方法は、当分野でよく知られている(例えば、“Current Protocols in Molecular Biology” Ausubel et al.,John Wiley &Sons,New York,2003または“Molecular Cloning:A Laboratory Manual” Sambrook &Russell,Cold Spring Harbor Press,Cold Spring Harbor,NY,3rd edition,2001参照)。他の実施形態では、分子は、マイクロインジェクションにより細胞に導入されてよい。例えば、分子は、関心のある細胞の細胞質または核に注入されてよい。細胞に導入される各分子の量は変動してよいが、当業者は好適な量を決定するための手段をよく知っている。
【0088】
種々の分子は、同時にまたは連続して細胞に導入されてよい。例えば、操作されたCas9系(またはそのコードする核酸)およびドナーポリヌクレオチドは同時に導入されてよい。あるいは、一方が最初に細胞に導入されてよく、そしてもう一方がその後に導入されてよい。
【0089】
一般的に、細胞は細胞増殖および/または維持のために適当な条件下で維持される。好適な細胞培養条件は、当分野でよく知られており、例えば、Santiago et al.,Proc.Natl.Acad.Sci.USA,2008,105:5809-5814;Moehle et al.Proc.Natl.Acad.Sci.USA,2007,104:3055-3060;Urnov et al.,Nature,2005,435:646-651;およびLombardo et al.,Nat.Biotechnol.,2007,25:1298-1306に記載されている。当業者は、細胞を培養するための方法が当分野で知られており、細胞種に依存して変化してよく、且つ変化するはずであることを理解する。すべての場合において、日常的な最適化が使用されて、特定の細胞種のための最適な技術を決定することができる。
【0090】
(b)任意のドナーポリヌクレオチド
操作されたCas9タンパク質がヌクレアーゼまたはニッカーゼ活性を含む実施形態では、方法は、少なくとも1つのドナーポリヌクレオチドを細胞に導入することをさらに含んでよい。ドナーポリヌクレオチドは、一本鎖または二本鎖、線状または環状、および/またはRNAまたはDNAであってよい。いくつかの実施形態では、ドナーポリヌクレオチドは、ベクター、例えばプラスミドベクターであってよい。
【0091】
ドナーポリヌクレオチドは少なくとも1つのドナー配列を含む。いくつかの態様では、ドナーポリヌクレオチドのドナー配列は内因性または天然の染色体配列の改変バージョンであってよい。例えば、ドナー配列は操作されたCas9系によって標的化される配列の、またはその付近の染色体配列の一部と実質的に同一であってよいが、少なくとも1つのヌクレオチドの変更を含む。したがって天然配列との組み込みまたは交換時に、標的化される染色体位置における配列は、少なくとも1つのヌクレオチドの変更を含む。例えば、当該変更は、1つ以上のヌクレオチドの挿入、1つ以上のヌクレオチドの欠失、1つ以上のヌクレオチドの置換、またはそれらの組合せであってよい。改変される配列の「遺伝子修正」組み込みの結果として、細胞は、標的化された染色体配列から改変された遺伝子産物を生産することができる。
【0092】
他の態様では、ドナーポリヌクレオチドのドナー配列は外因性配列であってよい。本明細書において使用される「外因性」配列は、細胞について天然でない配列、またはその天然の位置が細胞のゲノムにおける異なる位置である配列を指す。例えば、外因性配列は、外因性プロモーター制御配列に作動可能に連結され得るタンパク質コード配列を含んでよく、これによりゲノムに組み込まれた際に、組み込まれる配列によってコードされるタンパク質を細胞が発現することができる。あるいは、外因性配列は、その発現が内因性プロモーター制御配列によって調節されるように染色体配列に組み込まれてよい。他の反復において、外因性配列は、転写制御配列、別の発現制御配列、RNAコード配列などであってよい。上記のとおり、外因性配列の染色体配列への組み込みは、「ノックイン」と称される。
【0093】
当業者によって理解され得るように、ドナー配列の長さは、変化してよく、且つ変化するはずである。例えば、ドナー配列の長さは、数ヌクレオチドから数百ヌクレオチド、数十万ヌクレオチドまで様々である。
【0094】
典型的に、ドナーポリヌクレオチドにおけるドナー配列は、操作されたCas9系によって標的化される配列の上流および下流それぞれに位置する配列に対して実質的な配列同一性を有する上流配列および下流配列に挟まれている。これらの配列類似性のため、ドナーポリヌクレオチドの上流および下流配列は、ドナー配列が染色体配列に組み込まれ得る(または交換される)ように、ドナーポリヌクレオチドおよび標的化される染色体配列間の相同組換えを可能にする。
【0095】
本明細書において使用する場合、上流配列とは、操作されたCas9系によって標的化される配列の上流にある染色体配列と実質的な配列同一性を共有する核酸配列を指す。同様に下流配列とは、操作されたCas9系によって標的化される配列の下流にある染色体配列と実質的な配列同一性を共有する核酸配列を指す。本明細書において使用する場合、「実質的な配列同一性」なるフレーズは、少なくとも約75%の配列同一性を有する配列を指す。したがって、ドナーポリヌクレオチドにおける上流および下流配列は、標的配列に対する上流または下流配列と約75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有してよい。例示的な実施形態では、ドナーポリヌクレオチドにおける上流および下流の配列は、操作されたCas9系によって標的化される配列の上流または下流にある染色体配列と約95%または100%配列同一性を有してよい。
【0096】
いくつかの実施形態では、上流配列は、操作されたCas9系によって標的化される配列のすぐ上流に位置する染色体配列と実質的な配列同一性を共有する。他の実施形態では、上流配列は、標的配列から上流約百(100)ヌクレオチド内に位置される染色体配列と実質的な配列同一性を共有する。したがって、例えば、上流配列は、標的配列から上流約1から約20、約21から約40、約41から約60、約61から約80、または約81から約100ヌクレオチドに位置される染色体配列と実質的な配列同一性を共有してよい。いくつかの実施形態では、下流配列は、操作されたCas9系によって標的化される配列のすぐ下流に位置する染色体配列と実質的な配列同一性を共有する。他の実施形態では、下流配列は、標的配列から下流約百(100)ヌクレオチド内に位置される染色体配列と実質的な配列同一性を共有する。したがって、例えば、下流配列は、標的配列から下流約1から約20、約21から約40、約41から約60、約61から約80、または約81から約100ヌクレオチドに位置される染色体配列と実質的な配列同一性を共有してよい。
【0097】
各上流または下流配列は、長さにおいて約20ヌクレオチドから約5000ヌクレオチドの範囲であってよい。いくつかの実施形態では、上流および下流配列は、約50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2800、3000、3200、3400、3600、3800、4000、4200、4400、4600、4800、または5000ヌクレオチドを含んでよい。特定の実施形態では、上流および下流配列は、長さにおいて約50から約1500ヌクレオチドの範囲であってよい。
【0098】
(c)細胞種
種々の細胞は、本明細書に記載されている方法における使用のために好適であり、原核細胞(例えば、細菌)および真核細胞(例えば、動物、昆虫および植物細胞)を含む。例えば、細胞は、ヒト細胞、非ヒト哺乳動物細胞、非哺乳動物脊椎動物細胞、無脊椎動物細胞、昆虫細胞、植物細胞、酵母細胞、または単細胞真核生物であってよい。いくつかの実施形態では、細胞は、1つの細胞胚であってよい。例えば、非ヒト哺乳動物胚は、ラット、ハムスター、齧歯動物、ウサギ、ネコ、イヌ、ヒツジ、ブタ、ウシ、ウマ、および霊長類胚を含む。さらに他の実施形態では、細胞は、幹細胞、例えば、胚性幹細胞、ES様幹細胞、胎児幹細胞、成体幹細胞などであってよい。1つの実施形態では、幹細胞は、ヒト胚性幹細胞ではない。さらに、幹細胞は、その全体がここに援用されるWO2003/046141またはChung et al.(Cell Stem Cell,2008,2:113-117)に記載されている技術によって作られるものを含んでよい。細胞は、in vitroで(すなわち、培養物において)、ex vivoで(すなわち、生物体から単離された組織内で)、またはin vivoで(すなわち、生物体内で)あってよい。例示的な実施形態では、細胞は、哺乳動物細胞または哺乳動物細胞系である。特定の実施形態では、細胞は、ヒト細胞またはヒト細胞株である。
【0099】
例として、いくつかの実施形態では、真核細胞もしくは真核細胞集団は、T細胞、CD8+T細胞、CD8+ナイーブT細胞、中央メモリーT細胞、エフェクターメモリーT細胞、CD4+T細胞、幹細胞メモリーT細胞、ヘルパーT細胞、調節性T細胞、細胞傷害性T細胞、ナチュラルキラーT細胞、造血幹細胞、長期造血系幹細胞、短期造血幹細胞、多分化能前駆細胞、系列拘束された前駆細胞、リンパ系前駆細胞、膵臓前駆細胞、内分泌前駆細胞、外分泌前駆細胞、骨髄系前駆細胞、一般的な骨髄系前駆細胞、赤血球系前駆細胞、巨核球系赤血球系前駆細胞、単球系前駆細胞、内分泌前駆細胞、外分泌細胞、線維芽細胞、肝芽細胞、筋芽細胞、マクロファージ、膵島ベータ細胞、心筋細胞、血球、管細胞、腺房細胞、アルファ細胞、ベータ細胞、デルタ細胞、PP細胞、胆管細胞、網膜細胞、視細胞、杆体細胞、錐体細胞、網膜色素上皮細胞、トラベキュラーメッシュワーク細胞、蝸牛の有毛細胞、外有毛細胞、内有毛細胞、肺上皮細胞、気管支上皮細胞、肺胞上皮細胞、肺上皮前駆細胞、横紋筋細胞、心筋細胞、筋衛星細胞、筋細胞、神経細胞、神経幹細胞、間葉系幹細胞、人工多能性幹(iPS)細胞、胚性幹細胞、単細胞、巨核球、好中球、好酸球、好塩基球、肥満細胞、網目状細胞、B細胞、例えば、前駆B細胞、プレB細胞、プロB細胞、メモリーB細胞、プラズマB細胞、胃腸上皮細胞、胆道上皮細胞、膵管上皮細胞、腸管幹細胞、肝細胞癌、肝星細胞、クッパー細胞、骨芽細胞、破骨細胞、脂肪細胞(例えば、褐色脂肪細胞、または白色脂肪細胞)、脂肪前駆細胞、膵臓前駆細胞、膵島細胞、膵臓ベータ細胞、膵臓アルファ細胞、膵臓デルタ細胞、膵臓外分泌細胞、シュワン細胞、もしくはオリゴデンドロサイト、またはかかる細胞集団である。好適な哺乳類細胞または細胞株の非限定的な例には、ヒト人工多能性幹細胞(hiPSC)、ヒトT細胞(自己または同種)、ヒトB細胞、ヒトマクロファージ、ヒト造血幹細胞、(hHSC)、ヒト肝細胞、ヒト網膜細胞、膵臓膵島、ヒト胚性腎臓細胞(HEK293、HEK293T);ヒト子宮頸癌細胞(HELA);ヒト肺細胞(W138);ヒト肝細胞(Hep G2);ヒトU2-OS骨肉腫細胞、ヒトA549細胞、ヒトA-431細胞、およびヒトK562細胞;チャイニーズハムスター卵巣(CHO)細胞、ベビーハムスター腎臓(BHK)細胞;マウス骨髄腫NS0細胞、マウス胚性線維芽細胞3T3細胞(NIH3T3)、マウスBリンパ腫A20細胞;マウスメラノーマB16細胞;マウス筋芽細胞C2C12細胞;マウス骨髄腫SP2/0細胞;マウス胚性間葉系C3H-10T1/2細胞;マウス癌腫CT26細胞、マウス前立腺DuCuP細胞;マウス乳房EMT6細胞;マウス肝細胞癌Hepa1c1c7細胞;マウス骨髄腫J5582細胞;マウス上皮細胞MTD-1A細胞;マウス心筋MyEnd細胞;マウス腎臓RenCa細胞;マウス膵臓RIN-5F細胞;マウスメラノーマX64細胞;マウスリンパ腫YAC-1細胞;ラットグリオブラストーマ9L細胞;ラットBリンパ腫RBL細胞;ラット神経芽細胞腫B35細胞;ラット肝細胞(HTC);バッファローラット肝臓BRL 3A細胞;イヌ腎臓細胞(MDCK);イヌ乳腺(CMT)細胞;ラット骨肉腫D17細胞;ラット単球/マクロファージDH82細胞;サル腎臓SV-40形質転換線維芽細胞(COS7)細胞;サル腎臓CVI-76細胞;アフリカミドリザル腎臓(VERO-76)細胞を含む。哺乳動物細胞株の広範なリストは、アメリカン・タイプ・カルチャー・コレクションカタログ(ATCC、Manassas、VA)において見つけることができる。
【0100】
本開示のその他の態様は、上述のように核酸またはベクターをコードするよう操作された動物、または本開示の操作されたSpcas9変異体によって永続的に改変された動物を含む。例えば、動物はモデル動物(ショウジョウバエ(Drosophila melanogaster)、マウス、蚊、ラット)、または動物は家畜または養殖魚、またはペットであり得る。別の例として、動物は少なくとも1つの疾患のためのベクターとすることができる。別の例として、生物はヒト疾患に対するベクター(すなわち、蚊、ダニ、鳥)とすることができる。
【0101】
本開示のさらにその他の態様は、上述のように核酸もしくはベクターを使用して操作された植物、または本開示の操作されたSpCas9によって一時的にもしくは永続的に改変された植物を含む。例えば、植物は作物(すなわち、米、大豆、小麦、タバコ、綿、アルファルファ、カノーラ、トウモロコシ、テンサイなど)であり得る。
【0102】
(VI)応用
本明細書に開示される組成物および方法は、種々の治療、診断、産業、および研究用途において使用することができる。いくつかの実施形態において、本開示は、遺伝子の機能をモデル化および/または研究する事、関心のある遺伝的またはエピジェネティックな状態を研究する事、または種々の疾患または障害に関与する生化学的経路を研究する事を目的として、細胞、動物、または植物における関心のある染色体配列を改変するために使用することができる。例えば、疾患または障害と関連する1つ以上の核酸配列の発現が変更されている疾患または障害をモデル化するトランスジェニック生物を作成することができる。疾患モデルは、生物体における変異の効果を研究する、疾患の発症および/または進行を研究する、薬学的に活性のある化合物の疾患における効果を研究する、および/または可能性のある遺伝子治療戦略の有効性を評価するために使用することができる。
【0103】
他の実施形態では、組成物および方法は、特定の生物学的プロセスに関与する遺伝子の機能、および遺伝子発現における何れの変更が生物学的プロセスにどのように影響し得るか、を研究するために使用し得る効率的且つ費用対効果の高い機能性ゲノムスクリーニングを実施するために、または細胞表現型と合わせてゲノム遺伝子座の突然変異誘発(mutagenesis)の飽和(saturating)またはディープスキャニング(deep scanning)を実施するために使用することができる。突然変異誘発の飽和またはディープスキャニングは、例えば、遺伝子発現、薬剤耐性、および疾患の反転のために必要な機能要素の重要な最小限の特徴および個々の脆弱性を決定するために使用することができる。
【0104】
さらなる実施形態では、本明細書に開示される組成物および方法は、疾患または障害の存在を確立するための診断試験のために、および/または処置選択肢の決定における使用のために用いることができる。好適な診断試験の例は、癌細胞における特定の変異の検出(例えば、EGFR、HER2などにおける特定の変異)、特定の疾患と関連する特定の変異の検出(例えば、トリヌクレオチドリピート、鎌状赤血球症と関連するβ-グロビンにおける変異、特定のSNPなど)、肝炎の検出、ウイルスの検出(例えば、Zika)などを含む。
【0105】
さらなる実施形態では、本明細書に開示される組成物および方法は、特定の疾患または障害と関連する遺伝子変異を修正するために使用することができ、例えば、鎌状赤血球症またはサラセミアと関連するグロビン遺伝子変異を修正する、重症複合免疫不全(SCID)と関連するアデノシンデアミナーゼ遺伝子における変異を修正する、ハンチントン病の原因遺伝子であるHTTの発現を低下させる、または網膜色素変性の処置のためにロドプシン遺伝子における変異を修正するために使用することができる。かかる改変は、ex vivoで細胞において行われてよい。
【0106】
さらに他の実施形態では、本明細書に開示される組成物および方法は、改善された特性または環境ストレスに対する耐性の増加を有する作物植物を生成するために使用することができる。本開示はまた、改善された特性を有する家畜または生産動物を生成するために使用することができる。例えば、ブタは、とりわけ再生医療または異種移植において、生物医学モデルとして魅力的な多くの特徴を有する。
【0107】
例として、本開示は上述のように、遺伝子療法のための医薬として使用するための、ヌクレオチドまたは核酸またはベクターの配列を提供する。本開示はまた、上述のようなヌクレオチドまたは核酸またはベクターの配列および少なくとも1つの薬学的に許容できる賦形剤を含む医薬組成物を提供する。本開示はまた、上述の変異を含む組み換えCas9ポリペプチドおよび少なくとも1つの薬学的に許容できる賦形剤を含む医薬組成物を提供する。薬学的に許容できる賦形剤には、典型的に、ビヒクル、希釈剤、または剤形を構成する成分、もしくは治療剤などの薬剤を含む医薬組成物を構成する成分として用いられる不活性成分を含む。薬学的に許容できる賦形剤には、典型的には、結着機能(すなわち、結着剤)、崩壊機能(すなわち、崩壊剤)、潤滑機能(潤滑剤)、および/またはその他の機能(すなわち、溶媒、界面活性剤など)を組成物に付与する不活性成分を含む。さらに、本開示は、ゲノム工学、細胞工学、タンパク質発現またはその他のバイオテクノロジー用途のための、上述のようなヌクレオチドまたは核酸またはベクターの配列のin vitro での使用を提供する。さらに本開示は、ゲノム工学、細胞工学、タンパク質発現またはその他のバイオテクノロジー用途のための、ガイドRNA(例えば、単一分子(すなわち、キメラ)ガイドRNAまたは2分子(すなわち、2部分)ガイドRNAと共に、上述の変異を含む組み換えCas9ポリペプチドのin vitroでの使用を提供する。
【0108】
本開示のその他の態様は、本明細書に記載の種々の成分、例えば本明細書に記載のCas9タンパク質変異体、ガイドRNA、ベクター、プライマー等を含み、ゲノム工学、細胞工学、タンパク質発現またはその他のバイオテクノロジー用途におけるそれらの使用のための指示を含むキットに関する。
【0109】
定義
以下の定義および方法は、本発明をよりよく定義し、本発明の実施へと当業者を導くために提供される。別段の記載が無い限り、用語は、関連する分野における当業者による従来的な使用法に従って理解されるものである。
【0110】
他に定義されていない限り、本明細書において使用される全ての専門用語および科学用語は、本発明が属する当業者によって一般的に理解される意味を有する。以下の文献は、本発明において使用される多くの用語の一般的な定義を当業者に提供する:Singleton et al.,Dictionary of Microbiology and Molecular Biology(2nd Ed.1994);The Cambridge Dictionary of Science and Technology(Walker ed.,1988);The Glossary of Genetics,5th Ed.,R.Rieger et al.(eds.),Springer Verlag(1991);およびHale &Marham,The Harper Collins Dictionary of Biology(1991)。本明細書において使用される以下の用語は、別段の指定がない限り、それらに帰する意味を有する。
【0111】
本開示またはその好ましい実施形態の要素を紹介するとき、冠詞「a」、「an」、「the」および「said」は、1つ以上の要素が存在することを意味することを意図する。「含む」、「含有する」および「有する」なる用語は、包括的であることを意図し、リストされた要素以外の追加の要素があってもよいことを意味することを意図する。
【0112】
「約」なる用語は、数値xに関して使用された場合には例えばx±5%を意味する。
【0113】
本明細書において使用される「相補的」または「相補性」なる用語は、特定の水素結合を介する塩基対合による二本鎖核酸の会合を指す。塩基対合は、標準のワトソンクリック塩基対合であり得る(例えば、5’-AGTC-3’は、相補的配列3’-TCAG-5’と対合する)。塩基対合はまた、フーグスティーン型(Hoogsteen)または逆フーグスティーン型水素結合であってよい。相補性は、典型的に二本鎖領域に対して測定され、したがって例えばオーバーハングを除く。二本鎖領域の2つの鎖間の相補性は、部分的であってよく、一部の塩基(例えば、70%)のみが相補的であるとき、パーセンテージ(例えば、70%)として表現されてよい。相補的でない塩基は「不一致」である。相補性はまた、二本鎖領域における全ての塩基が相補的であるとき、完全(すなわち、100%)であってよい。
【0114】
本明細書において使用される「CRISPR/Cas系」または「Cas9系」なる用語は、Cas9タンパク質(すなわち、ヌクレアーゼ、ニッカーゼ、または触媒的に不活性型のタンパク質)およびガイドRNAを含む複合体を指す。
【0115】
本明細書において使用される「内因性配列」なる用語は、細胞において天然の染色体配列を指す。
【0116】
本明細書において使用される「外因性」なる用語は、細胞において天然でない配列、または細胞のゲノムにおける天然の位置が異なる染色体位置にある染色体配列を指す。
【0117】
本明細書において使用される「遺伝子」は、遺伝子産物をコードするDNA領域(エクソンおよびイントロンを含む)、および遺伝子産物の生産を調節する全てのDNA領域を指し、係る調節配列がコード配列および/または転写配列に隣接しているか否かにかかわらない。したがって、遺伝子は、必ずしも限定されないが、プロモーター配列、ターミネーター、翻訳調節配列、例えばリボソーム結合部位および内部リボソーム侵入部位、エンハンサー、サイレンサー、インシュレーター(insulator)、境界要素(boundary element)、複製起点、マトリックス付着部位(matrix attachment site)、および遺伝子座制御領域を含む。
【0118】
「異種」なる用語は、関心のある細胞に対して内因性または天然でない実体(entity)を指す。例えば、異種タンパク質は、外因性に導入された核酸配列のような外因性供給源に由来するかまたは当初由来されたタンパク質を指す。場合によっては、異種タンパク質は、通常、関心のある細胞によって産生されない
【0119】
「ニッカーゼ」なる用語は、二本鎖核酸配列の一本鎖を切断する(すなわち、二本鎖配列にニックを入れる)酵素を指す。例えば、二本鎖切断活性を有するヌクレアーゼを、変異および/または欠失によって、ニッカーゼとして機能し、二本鎖配列の一本鎖のみを切断するように改変し得る。
【0120】
本明細書において使用される「ヌクレアーゼ」なる用語は、二本鎖核酸配列の両方の鎖を切断する酵素を指す。
【0121】
「核酸」および「ポリヌクレオチド」なる用語は、線状または環状構造における、および一本鎖または二本鎖形態のいずれかにおけるデオキシリボヌクレオチドまたはリボヌクレオチドポリマーを指す。本開示の目的のために、これらの用語は、ポリマーの長さを限定するものとして解釈されるべきではない。この用語は、天然ヌクレオチドの既知のアナログ、ならびに塩基、糖、および/またはリン酸部分(例えば、ホスホロチオエート骨格)において修飾されているヌクレオチドを包含してよい。一般的に、特定のヌクレオチドのアナログは、同じ塩基対合特異性を有する;すなわち、AのアナログはTと塩基対を形成する。
【0122】
「ヌクレオチド」なる用語は、デオキシリボヌクレオチドまたはリボヌクレオチドを指す。ヌクレオチドは、標準ヌクレオチド(すなわち、アデノシン、グアノシン、シチジン、チミジン、およびウリジン)、ヌクレオチド異性体、またはヌクレオチドアナログであってよい。ヌクレオチドアナログは、修飾されたプリンまたはピリミジン塩基または修飾されたリボース部分を有するヌクレオチドを指す。ヌクレオチドアナログは、天然ヌクレオチド(例えば、イノシン、シュードウリジンなど)または非天然ヌクレオチドであってよい。ヌクレオチドの糖または塩基部分における修飾の非限定的な例は、アセチル基、アミノ基、カルボキシル基、カルボキシメチル基、ヒドロキシル基、メチル基、ホスホリル基、およびチオール基の付加(または除去)、ならびに塩基の炭素原子および窒素原子の他の原子での置換(例えば、7-デアザプリン)を含む。ヌクレオチドアナログはまた、ジデオキシヌクレオチド、2’-O-メチルヌクレオチド、ロックド核酸(LNA)、ペプチド核酸(PNA)、およびモルホリノを含む。
【0123】
「ポリペプチド」および「タンパク質」なる用語は、アミノ酸残基のポリマーを指すように互換的に使用される。
【0124】
「標的配列」、「標的染色体配列」および「標的部位」なる用語は、操作されたCas9系が標的とする染色体DNAにおける特定の配列、および操作されたCas9系がDNAを改変する部位、または当該DNAと関連するタンパク質を改変する部位を指すように互換的に使用される。
【0125】
核酸およびアミノ酸配列の同一性を決定するための技術は当分野で知られている。典型的には、かかる技術は、遺伝子に対するmRNAのヌクレオチド配列を決定することおよび/またはそれによりコードされるアミノ酸配列を決定すること、およびこれらの配列と第2のヌクレオチドまたはアミノ酸配列とを比較することを含む。ゲノム配列もまた、この様式において決定および比較されてもよい。一般的に、同一性は、2つのポリヌクレオチドまたはポリペプチド配列のそれぞれの正確なヌクレオチド-対-ヌクレオチドまたはアミノ酸-対-アミノ酸対応を指す。2つ以上の配列(ポリヌクレオチドまたはアミノ酸)は、これらの同一性パーセントを決定することによって比較されてもよい。核酸またはアミノ酸配列のいずれであれ、2つの配列の同一性パーセントは、2つの整列された配列間の正確な一致の数を、より短い方の配列の長さで割り、100を掛けたものである。核酸配列のおおよそのアラインメントは、Smith and Waterman,Advances in Applied Mathematics 2:482-489(1981)の局所相同性アルゴリズムによって提供される。このアルゴリズムは、Dayhoff,Atlas of Protein Sequences and Structure,M.O.Dayhoff ed.,5 suppl.3:353-358,National Biomedical Research Foundation,Washington,D.C.,USAによって開発され、Gribskov,Nucl.Acids Res.14(6):6745-6763(1986)によって正規化されるスコアリングマトリックスを使用することによってアミノ酸配列に適用することができる。配列の同一性パーセントを決定するためのこのアルゴリズムの例示的な実施は、「BestFit」ユーティリティアプリケーションにおいてGenetics Computer Group(Madison,Wis.)により提供される。配列間の同一性パーセントまたは類似性パーセントを計算するための他の好適なプログラムは、一般的に当分野で知られており、例えば、別のアライメントプログラムはデフォルトパラメーターで使用されるBLASTである。例えば、BLASTNおよびBLASTPは、次のデフォルトパラメーターを使用して使用することができる:genetic code=standard;filter=none;strand=both;cutoff=60;expect=10;Matrix=BLOSUM62;Descriptions=50sequences;sort by=HIGH SCORE;Databases=non-redundant,GENBANK+EMBL+DDBJ+PDB+GENBANK CDS translations+Swiss protein+Spupdate+PIR。これらのプログラムの詳細は、GENBANK NIH 遺伝子配列データベースウェブサイトにて見る事ができる。
【0126】
本発明について詳述してきたが、添付する特許請求の範囲において定義される発明の範囲を逸脱することなしに改変および変更が可能である事は明らかであろう。さらに、本開示における全ての実施例は、非限定的な例として提供されることを理解されたい。
【実施例
【0127】
以下の非限定的な例は本発明をさらに説明するために提供される。以下の実施例に開示される技術は、本発明の実施において良好に機能する事を本発明者らが見出したアプローチを表しており、およびよって本発明の実施のための様式の例を構成するものと考えられ得ることは、当業者に理解されるべきである。しかし、当業者は、本開示に照らして、開示される特定の実施形態において多くの変更を行うことができ、それでも本発明の精神および範囲から逸脱することなく同様のまたは類似の結果を得ることができることを理解すべきである。
【0128】
実施例1:K855の異なるアミノ酸置換は異なるオンターゲット活性を持つ
野生型SpCas9のK855残基をアラニン、グルタミン酸、イソロイシン、メチオニン、またはグルタミンに変異させ、および組み換えタンパク質をE.coliから95%以上の均質性をもって精製した。K855Q変異体タンパク質のアミノ酸配列を表1に示した。全てのK855変異体タンパク質は、K855単一変異を除いて同一のポリペプチドは配列を共有する。コントロールとして用いるために野生型のSpCas9タンパク質をMilliporeSigma社から購入した。ガイド配列5’-GGCACUGCGGCUGGAGGUGG-3’(配列番号42)を持つ、化学的に合成されたHEKSite4一本鎖ガイドRNA(sgRNA)もまたMilliporeSigma社から購入した。各タンパク質を3連の生物学的複製について試験した。
【0129】
1.5mLの微量遠心管に、緩衝液(20mM HEPES、100mM KCl、0.5mM DTT、0.1mM EDTA、pH 7.5)、150pmol sgRNA、および8μgのCas9タンパク質を10μLの総反応液量で加える事でリボ核タンパク質(RNP)複合体を調製した。sgRNAとCas9タンパク質のモル比はおおよそ3:1であった。複合体を室温で15分間インキュベートし、トランスフェクションまで氷上に置いた。80%コンフルエントのヒトU-2 OS細胞をトリプシン溶液で剥離させ、ハンクス平衡塩類溶液で2回洗浄した。100μLあたり約0.25×10細胞で細胞をNucleofector Solution V(Lonza)に再懸濁した。ヌクレオフェクションは、100μLの細胞をRNP複合体に移し入れ、気泡が入らないようにすぐに穏やかに上下にピペッティングする事で混合してから、その後Amaxa program X-001を用いたエレクトロポレーションのためのキュベットに移して実施した。すぐに細胞を1ウェル当たり2mLの温めておいた培地を加えた6ウェルプレートに移し、および37℃、5%COで3日間増殖してから、ゲノム改変アッセイのために回収した。
【0130】
トランスフェクションした細胞のゲノムDNA抽出物をQuickExtract Solutionを用いて調製した。標的ゲノム領域を、KAPA HiFi HotStart ReadyMix PCR Kit(Roche)を使用し、次世代シーケンシング(NGS)プライマーで以下のサイクル条件でPCR増幅した:95°C/3m;98°C/20s、68°C/30s、および72°C/45sを34サイクル;72°C/5m。HEKSite4標的部位のNGSプライマーは以下である:5’-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGNNNNNNGGAACCCAGGTAGCCAGAGA-3’(フォワード)(配列番号43)および5’-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGNNNNNNGGGGTGGGGTCAGACGT-3’(リバース)(配列番号44)。HEKSite4オフターゲット部位のNGSプライマーは以下である:5’-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGNNNNNNCTAGAGCAAACCTTGGCATTGTCC-3’(フォワード)(配列番号45)および5’-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGNNNNNNACCCTCTACCCTCCCTGATG-3’(リバース)(配列番号46)。そして一次PCR産物を、Quantitative PCR Kit(MilliporeSigma)用のJumpStart(商標)Taq ReadyMix(商標)を使用して、Illumina index primersを用いて以下のサイクル条件で再増幅した:95°C/3m;95°C/30s、55°C/30s、および72°C/30sで8サイクル;72°C/5m。インデックス付加されたPCR産物をSelect-a-Size DNA Clean &Concentrator kit(Zymo)を用いて精製し、およびPicoGreen(ThermoFisher)で定量した。そしてPCR産物を正規化およびプールし、NGSライブラリーを作成した。Illumina MiSeq 装置および2x300bp kitを使用してNGSを行った。NGS解析パイプラインを使用して、各サンプルのFASTQファイルをゲノム編集頻度について解析した。
【0131】
結果を図1Aおよび1Bに示す。この結果は、異なるK855変異体タンパク質は、異なるレベルのオンターゲット活性を有し、および5つのK855変異体タンパク質の全てが同等のレベルまでオフターゲット効果を実質的に低減する事を示す。この結果はまた、グルタミン酸およびアラニンはオンターゲット活性を維持するためのK855の最適な置換基ではない事を示す。
【表1】
【0132】
実施例2:最適なアミノ酸置換の二重変異体はオンターゲット活性を維持する
K855MおよびK855Q変異体バックグラウンドに対してR611、N692またはQ695における異なるアミノ酸置換を導入し、二重変異体を作成した。組み換えタンパク質をE.coliから、95%以上の均質性で精製した。全ての二重変異体は、表1に示したK855Q変異体のポリペプチド配列と、指定された変異を除いて、同一のポリペプチド配列を共有する。各タンパク質を、U2-OS細胞の同一のHEKSite4標的部位について3連の生物学的複製において試験した。RNP複合体の調製、細胞トランスフェクション、およびNGS解析については実施例1に記載するとおりである。
【0133】
結果を図2に示す。結果は、R661、N692、またはQ695における異なるアミノ酸置換によって異なるレベルのオンターゲット活性がもたらされる事を示す。R661残基について、イソロイシンへの置換は活性の実質的な減少をもたらしたが、ロイシン、アスパラギンまたはグルタミンへの置換はWT Cas9の活性と同レベルの活性を維持した。2つの非電荷残基における置換効果は予想しにくいものであった。
【0134】
実施例3:特異性と活性のバランスが取れた特徴を持つ三重変異体
R661L-K855Qバックグランドに、K526、K562、K652、R691、R780、K810、K848、K1003、またはR1060においてロイシンまたはグルタミンへの置換を導入し、18個の三重変異体および1つの四重変異体(R661L-K855Q-K1003Q-R1060Q)を生成した。全ての三重変異体および四重変異体は、表1に示したK855Qのポリペプチド配列と、指定された変異を除いて同一のポリペプチド配列を共有する。組み換えタンパク質をE.coliから、95%以上の均質性で精製した。ヒトFANCF02およびHBB03を標的とする合成sgRNAをMilliporeSigma社から購入した。これらのsgRNAのガイド配列を表2に示す。 eSpCas9 1.1タンパク質はMilliporeSigma社から購入しおよびHiFi Cas9 V3タンパク質はIntegrated DNA Technologies社から購入した。各タンパク質を3連の生物学的複製において試験した。
【0135】
実施例1に記載するようにRNP複合体を調製した。トランスフェクションの前日にヒトK562細胞を1mLあたり0.25×10細胞で播種し、トランスフェクション時にはおおよそ1mLあたり0.5×10細胞であった。細胞を、ハンクス平衡塩類溶液で2回洗浄し、そして100μLあたり約0.35×10細胞で細胞をNucleofector Solution V(Lonza)に再懸濁した。ヌクレオフェクションは、100μLの細胞をRNP複合体に移し入れ、気泡が入らないようにすぐに穏やかに上下にピペッティングする事で混合してから、その後Amaxa program T-016を用いたエレクトロポレーションのためのキュベットに移して実施した。すぐに細胞を1ウェル当たり2mLの温めておいた培地を加えた6ウェルプレートに移し、および37℃、5%COで3日間増殖してから、ゲノム改変アッセイのために回収した。トランスフェクションした細胞のゲノムDNA抽出物をQuickExtract Solutionを用いて調製した。標的ゲノム領域を、JumpStart(商標)Taq ReadyMix(商標)for Quantitative PCR Kit(MilliporeSigma)を使用し、NGSプライマーで以下のサイクル条件でPCR増幅した:98°C/2m;98°C/15s、62°C/30s、および72°C/45sで34サイクル;72°C/5m。NGSプライマー配列を表2に示す。NGSライブラリー調製、シーケンシングおよびデータ解析は実施例1に記載するとおりである。
【0136】
結果を図3A、3B、3Cおよび3Dに示す。図3Aおよび図3Bの結果は、全てのタンパク質がFANCF02標的部位において高い活性を有し、およびそれらの間でのばらつきは僅かであったことを示す。しかし、FANCF02シングルミスマッチオフターゲット部位でのオフターゲットな変異頻度ではタンパク質間で幅広いばらつきが存在した。6つの三重変異体タンパク質が、eSpCas9 1.1よりもオフターゲット活性の低減において優れていた。これらには、K526L-R661L-K855Q、R661L-R691L-K855Q、R661L-R780L-K855Q、R661L-R780Q-K855Q、R661L-K810L-K855Q、およびR661L-K848L-K855Qを含む。残りの変異体タンパク質は、外れ値の変異体タンパク質R661L-R691Q-K855Qを除いて、WT Cas9と比較して、オフターゲット変異頻度の低減においてeSpCas9 1.1と同程度であるか、またはeSpCas9 1.1とHiFi Cas9 V3の間のいずれかであった。図3Cおよび3Dの結果は、これらのタンパク質間のオンターゲット活性および特異性レベルをさらに区別する。FANCF02部位で同定された非常に特異性の高い変異体タンパク質は、HBB03部位ではほとんど全てのオンターゲット活性を失っていた。しかし、6つの三重変異体タンパク質はeSpCas9 1.1と同レベルのオフターゲット変異頻度を有するが、HBB03部位においてeSpCas9 1.1よりも実質的に高いレベルのオンターゲット活性を有する。これらの結果をまとめると、この変異体タンパク質の群はバランスの取れた特異性および活性を有する。この変異体タンパク質の選択的な群には、K562L-R661L-K855Q、K562Q-R661L-K855Q、K652L-R661L-K855Q、K652Q-R661L-K855Q、R661L-K855Q-K1003Q、およびR661L-K855Q-R1060Qを含む。まとめた結果に基づいて、eSpCas9 1.1様の4つの3重変異体タンパク質もまた同定され、これらにはK526Q-R661L-K855Q、R661L-K810Q-K855Q、R661L-K855Q-K1003L、およびR661L-K855Q-R1060Lを含む。
【表2】
【0137】
実施例4:特異性が向上したSPCAS9ヌクレアーゼは、異なるゲノム部位にわたって効率的な編集を仲介する。
5つのヒトゲノム部位を標的とするsgRNAをMilliporeSigma社から購入した。これらのsgRNAのガイド配列を表3に示す。RNP複合体を実施例1に記載するように調製した。ヒトK562細胞を1mLあたり0.25×10細胞でトランスフェクションの前日に播種し、トランスフェクション時にはおおよそ1mLあたり0.5×10細胞であった。細胞を、ハンクス平衡塩類溶液で2回洗浄し、そして100μLあたり約0.35×10細胞で細胞をNucleofector Solution V(Lonza)に再懸濁した。ヌクレオフェクションは、100μLの細胞をRNPに移し入れ、気泡が入らないようにすぐに穏やかに上下にピペッティングする事で混合してから、その後Amaxa program T-016を用いたエレクトロポレーションのためのキュベットに移して実施した。すぐに細胞を1ウェル当たり2mLの温めておいた培地を加えた6ウェルプレートに移し、および37℃、5%COで3日間増殖してから、ゲノム改変アッセイのために回収した。
【0138】
トランスフェクションした細胞のゲノムDNA抽出物をQuickExtract Solutionを用いて調製した。標的ゲノム領域を、JumpStart(商標)Taq ReadyMix(商標)for Quantitative PCR Kit(MilliporeSigma)を使用し、NGSプライマーで以下のサイクル条件でPCR増幅した:98°C/2m;98°C/15s、62°C/30s、および72°C/45sで34サイクル;72°C/5m。NGSプライマー配列を表3に示す。NGSライブラリー調製、シーケンシングおよびデータ解析は実施例1に記載するとおりである。結果を図4に示す。この結果は、バランスの取れた特異性および活性を有すると同定された4つの三重変異体タンパク質が、実質的にeSpCas9 1.1よりも高い編集効率を有し、5つのゲノム標的領域すべてにおいてWT Cas9と同等であった事を示す。
【表3】
図1A
図1B
図2
図3A
図3B
図3C
図3D
図4
【配列表】
0007629673000001.app