(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-06-27
(54)【発明の名称】拡張されたDNA標的化範囲を有する操作されたCAS9
(51)【国際特許分類】
C12N 15/55 20060101AFI20220620BHJP
C12N 9/16 20060101ALI20220620BHJP
C12N 15/10 20060101ALI20220620BHJP
C12N 15/63 20060101ALI20220620BHJP
C12N 15/11 20060101ALI20220620BHJP
C12N 15/09 20060101ALI20220620BHJP
C12Q 1/34 20060101ALI20220620BHJP
【FI】
C12N15/55
C12N9/16 Z ZNA
C12N15/10 200Z
C12N15/63 Z
C12N15/11 Z
C12N15/09 110
C12Q1/34
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2021563030
(86)(22)【出願日】2020-04-24
(85)【翻訳文提出日】2021-12-16
(86)【国際出願番号】 US2020029855
(87)【国際公開番号】W WO2020219908
(87)【国際公開日】2020-10-29
(32)【優先日】2019-04-25
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】503115205
【氏名又は名称】ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー
(74)【代理人】
【識別番号】100078282
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【氏名又は名称】森下 夏樹
(72)【発明者】
【氏名】コン, リー
【テーマコード(参考)】
4B050
4B063
【Fターム(参考)】
4B050CC04
4B050DD02
4B050LL01
4B050LL03
4B063QA13
4B063QA18
4B063QQ34
4B063QR14
4B063QS39
(57)【要約】
本開示は、プロトスペーサー隣接モチーフ(PAM)配列に対する改変された特異性を有するバリアントStaphylococcus aureus Cas9(SaCas9)タンパク質を提供する。本開示は、CRISPR/Cas9系およびバリアントSaCas9タンパク質を使用してゲノムDNA配列を改変する方法も対象とする。改変されたPAM特異性を有するバリアントCas9タンパク質を生成する方法も開示されている。本発明は、拡張されたDNA標的化範囲を有する操作されたCAS9タンパク質、ならびにそれを使用する方法、キット、組成物および系に関する。
【特許請求の範囲】
【請求項1】
E782、N968、N986およびR991の1またはそれを超える残基が異なるアミノ酸で置換されている、配列番号1のアミノ酸配列を含むバリアントStaphylococcus aureus Cas9(SaCas9)タンパク質。
【請求項2】
配列番号1のアミノ酸残基N986が異なるアミノ酸で置換されている、請求項1に記載のバリアントSaCas9タンパク質。
【請求項3】
前記アミノ酸置換がN986A、N986R、N986KおよびN986Hから選択される、請求項1または請求項2に記載のバリアントSaCas9タンパク質。
【請求項4】
配列番号1のアミノ酸残基R991が異なるアミノ酸で置換されている、請求項1に記載のバリアントSaCas9タンパク質。
【請求項5】
前記アミノ酸置換がR991A、R991K、R991L、R991CおよびR991Vから選択される、請求項1または請求項4に記載のバリアントSaCas9タンパク質。
【請求項6】
配列番号1のアミノ酸残基N986およびR991の両方が異なるアミノ酸で置換されている、請求項1~5のいずれか一項に記載のバリアントSaCas9タンパク質。
【請求項7】
E782、N885、K886、L887、N888、A889、N968、R1015およびT1019から選択される配列番号1の1またはそれを超える残基のアミノ酸置換をさらに含む、請求項1~6のいずれか一項に記載のバリアントSaCas9タンパク質。
【請求項8】
以下のアミノ酸置換:E782K、N885K、K886N、K886R、L887K、N888K、A889H、A889K、A889N、N968K、R1015H、T1019R、T1019KおよびT1019Hの1またはそれより多くをさらに含む、請求項7に記載のバリアントSaCas9タンパク質。
【請求項9】
配列番号1のアミノ酸配列と、
(a)N986RおよびR991A;
(b)N986RおよびR991K;
(c)N986RおよびR991L;
(d)N986R、R991AおよびT1019R;
(e)N986R、R991AおよびT1019K;
(f)N986R、R991AおよびT1019H;
(g)N986R、R991KおよびT1019R;
(h)N986R、R991KおよびT1019K;
(i)N986R、R991KおよびT1019H;
(j)N986R、R991LおよびT1019R;
(k)N986R、R991LおよびT1019K;
(l)N986R、R991LおよびT1019H;
(m)N986R、R991CおよびT1019R;
(n)N986R、R991CおよびT1019K;
(o)N986R、R991CおよびT1019H;
(p)N986R、R991VおよびT1019R;
(q)N986R、R991VおよびT1019K;
(r)N986R、R991VおよびT1019H;
(s)N885KおよびN986R;
(t)K886NおよびN986R;
(u)K886RおよびN986R;
(v)L887KおよびN986R;
(w)N888KおよびN986R;
(x)A889HおよびN986R;
(y)A889KおよびN986R;
(z)A889NおよびN986R;
(aa)N885K、N986RおよびR991L;
(bb)K886N、N986RおよびR991L;
(cc)K886R、N986RおよびR991L;
(dd)L887K、N986RおよびR991L;
(ee)N888K、N986RおよびR991L;
(ff)A889H、N986RおよびR991L;
(gg)A889K、N986RおよびR991L;
(hh)A889N、N986RおよびR991L;
(ii)E782KおよびN986R;
(jj)N968KおよびN986R;
(kk)E782K、N968KおよびN986R;
(ll)E782K、N986RおよびR1015H;
(mm)N968K、N986RおよびR1015H;
(nn)E782K、N968K、N986RおよびR1015H;
(oo)E782K、N986RおよびR991L;
(pp)N968K、N986RおよびR991L;
(qq)E782K、N968K、N986RおよびR991L;
(rr)E782K、N986R、R991LおよびR1015H;
(ss)N968K、N986R、R991LおよびR1015H;ならびに
(tt)E782K、N968K、N986R、R991LおよびR1015H;
から選択される2またはそれを超えるアミノ酸置換とを含む、請求項8に記載のバリアントSaCas9タンパク質。
【請求項10】
請求項1~9のいずれか一項に記載のSaCas9タンパク質と少なくとも95%のアミノ酸配列同一性を含むバリアントSaCas9タンパク質。
【請求項11】
請求項1~10のいずれか一項に記載のバリアントSaCas9タンパク質をコードする単離された核酸配列。
【請求項12】
請求項11に記載の核酸配列を含むベクター。
【請求項13】
(a)宿主細胞中の標的ゲノムDNA配列に相補的なガイドRNA配列であって、前記標的ゲノムDNA配列が少なくとも1つの遺伝子産物をコードする、ガイドRNA配列と、
(b)請求項1~10のいずれか一項に記載のバリアントSaCas9タンパク質をコードする核酸配列を含む核酸分子と、
を含む系。
【請求項14】
(a)の前記ガイドRNA配列と(b)の前記核酸分子が異なるベクター中に存在する、請求項13に記載の系。
【請求項15】
(a)の前記ガイドRNA配列と(b)の前記核酸分子が同一のベクター中に存在する、請求項13に記載の系。
【請求項16】
(a)宿主細胞中の標的ゲノムDNA配列に相補的なガイドRNA配列であって、前記標的ゲノムDNA配列が少なくとも1つの遺伝子産物をコードする、ガイドRNA配列と、
(b)請求項1~10のいずれか一項に記載のバリアントSaCas9タンパク質と、
を含む系。
【請求項17】
宿主細胞中の標的ゲノムDNA配列を改変する方法であって、標的ゲノムDNA配列を含む宿主細胞を、請求項13~16のいずれか一項に記載の系と接触させることを含み、
(a)前記ガイドRNA配列は前記宿主細胞中で発現され、前記宿主細胞ゲノム中の前記標的ゲノムDNA配列に結合し、
(b)前記バリアントSaCas9タンパク質は前記宿主細胞中で発現され、前記標的ゲノムDNA配列中に二本鎖切断を誘導し、それによって前記宿主細胞中の前記標的ゲノムDNA配列を改変する、
方法。
【請求項18】
前記宿主細胞ゲノムが、前記標的ゲノムDNA配列に隣接して位置する核酸配列NNGRR[T/A/C/G]を含むプロトスペーサー隣接モチーフ(PAM)を含み、「N」はグアニン、アデニン、チミンまたはシトシンであり、「R」はグアニンまたはアデニンである、請求項17に記載の方法。
【請求項19】
前記PAMが、核酸配列NNGRRT、NNGRRC、NNGRRAまたはNNGRRGを含む、請求項18に記載の方法。
【請求項20】
前記標的ゲノムDNA配列がタンパク質をコードする、請求項17~19のいずれか一項に記載の方法。
【請求項21】
前記宿主細胞が哺乳動物細胞である、請求項17~20のいずれか一項に記載の方法。
【請求項22】
前記宿主細胞がヒト細胞である、請求項21に記載の方法。
【請求項23】
宿主細胞中の標的DNA配列の改変のための、請求項13~16のいずれか一項に記載の系の使用。
【請求項24】
所望のPAM特異性を有するバリアントCas9タンパク質を生成する方法であって、
(a)1またはそれを超える変異体Cas9タンパク質の所望のPAMへの結合を分子的にシミュレートすることと、
(b)(a)の前記シミュレーションにおいて前記所望のPAMに結合する1またはそれを超える変異体Cas9タンパク質を合成的に生成することと、
(c)宿主細胞中の標的DNA配列に相補的なガイドRNA配列と組み合わせて、前記宿主細胞中で、前記1またはそれを超える変異体Cas9タンパク質を発現させることであって、前記宿主細胞ゲノムは、前記標的DNA配列および前記所望のPAMを含む、発現させることと、
(d)前記もう1つの変異体Cas9タンパク質の切断活性を測定することと、
(e)前記所望のPAMに結合し、前記標的DNA配列を切断する1またはそれを超える変異体Cas9タンパク質を選択することであって、それにより、所望のPAM特異性を有するバリアントCas9が生成される、選択することと、
を含む、方法。
【請求項25】
1またはそれを超える変異体Cas9タンパク質の所望のPAMへの結合を分子的にシミュレートすることが、自由エネルギー摂動(FEP)計算を含む、請求項24に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
[関連出願の相互参照]
本願は、2019年4月25日に出願された米国仮特許出願第62/838,498号の恩典を主張し、その全体は、参照により、本明細書に組み込まれる。
【0002】
本発明は、拡張されたDNA標的化範囲を有する操作されたCAS9タンパク質、ならびにそれを使用する方法、キット、組成物および系に関する。
【背景技術】
【0003】
細菌および古細菌中に最初に見出されたクラスター化して規則的な配置の短い回文配列リピート(CRISPR)系は、RNAによってガイドされるタンパク質機構と複雑な分子機序とを使用する微生物免疫を提供するために外来遺伝物質に適応的に抵抗することができる(Mojicaら、J.Mol.Evol.,60:174-182(2005);Bolotinら、Microbiology,151:2551-2561(2005);Barrangouら、Science,315:1709-1712(2007);Garneauら、Nature,468:67(2010);Deltchevaら、Nature,471:602(2011);Sapranauskasら、Nucl.Acids Res.,39:9275-9282(2011);Jinekら、Science,337:816-821(2012);Gasiunasら、Proc.Natl.Acad.Sci.USA,109:E2579-E2586(2012);およびWiedenheftら、Nature,482:331(2012))。最近の進歩により、真核生物におけるゲノム編集のために、カスタマイズされたCRISPR系を利用することが可能である(Congら、Science,339:819-823(2013);Maliら、Science,339:823-826(2013);Jiangら、Nature Biotech.,31:233-239(2013);Jinekら、Elife,2:e00471(2013);Choら、Nature Biotech.,31:230(2013);およびHwangら、Nature Biotech.,31:227(2013))。例示的なII型CRISPR系は、シングルガイドRNA(sgRNA)と複合体を形成したCas9タンパク質を使用し、二本鎖DNA(dsDNA)標的を切断するプログラム可能なエンドヌクレアーゼを形成する。dsDNA基質は、sgRNA中のガイド配列に相補的な標的鎖(Jinekら、Science,337:816-821(2012))と、標的認識のために必要とされるプロトスペーサー隣接モチーフ(PAM)を有する非標的鎖(Mojicaら、J.Mol.Evol.,60:174-182(2005);Bolotinら、Microbiology,151:2551-2561(2005))とを含有する。
【0004】
Streptococcus pyogenes由来の広く使用されているCas9(SpCas9)はPAM配列NGGを認識する(Jinekら、上記)のに対して、Staphylococcus aureus由来の新たに同定されたCas9(SaCas9)はNNGRRTというより長いPAM配列を認識する(Ranら、Nature,520:186-191(2015))。SaCas9はSpCas9よりも有意に小さく、遺伝子治療用途のために、その送達がより便利で、効率的になる(Ranら、上記)。そのコンパクトなサイズ故に、臨床移転が有望であるにもかかわらず、SaCas9のより長いPAMは、例えば、そのPAMが疾患関連遺伝子座に近接していない場合に、SaCas9の標的化範囲および応用の可能性を制限する。最近、一連の三重変異E782K/N968K/R1015H(KKH)が、SaCas9 PAMの特異性をNNGRRTからNNNRRTへと効果的に改変することが判明した(Kleinstiverら、Nature Biotech.,33:1293-1298(2015))。さらに、sgRNA/DNAと結合した野生型SaCas9の構造が解明されており(Nishimasuら、Cell,162:1113-1126(2015))、SaCas9機能の分子的基礎に関する貴重な洞察を与える。
しかしながら、より広いPAM特異性を有するCas9タンパク質およびCas9タンパク質のPAM特異性を改変するための方法に対する要求がなお存在する。
【先行技術文献】
【非特許文献】
【0005】
【非特許文献1】Mojicaら、J.Mol.Evol.,60:174-182(2005)
【非特許文献2】Bolotinら、Microbiology,151:2551-2561(2005)
【非特許文献3】;Barrangouら、Science,315:1709-1712(2007)
【発明の概要】
【課題を解決するための手段】
【0006】
本開示は、例えば、アミノ酸残基E782、N968、N986およびR991のうちの1またはそれより多くが異なるアミノ酸で置換されている、配列番号1のアミノ酸配列を含むバリアントStaphylococcus aureus Cas9(SaCas9)タンパク質を提供する。バリアントSaCas9タンパク質をコードする核酸配列およびベクター、ならびに宿主細胞中の標的ゲノムDNA配列を改変するための系および方法も提供される。
【0007】
本開示は、所望のPAM特異性を有するバリアントCas9タンパク質を生成する方法であって、(a)1またはそれを超える変異体Cas9タンパク質の所望のPAMへの結合を分子的にシミュレートすることと、(b)(a)の前記シミュレーションにおいて前記所望のPAMに結合する1またはそれを超える変異体Cas9タンパク質を合成的に生成することと、(c)宿主細胞中の標的DNA配列に相補的なガイドRNA配列と組み合わせて、前記宿主細胞中で、前記1またはそれを超える変異体Cas9タンパク質を発現させることであって、前記宿主細胞ゲノムは、前記標的DNA配列および前記所望のPAMを含む、発現させることと、(d)前記もう1つの変異体Cas9タンパク質の切断活性を測定することと、(e)前記所望のPAMに結合し、前記標的DNA配列を切断する1またはそれを超える変異体Cas9タンパク質を選択することであって、それにより、所望のPAM特異性を有するバリアントCas9が生成される、選択することと、を含む、方法も提供する。
【0008】
本明細書に記載の方法のいずれかを実施するために有用な、必要な、または十分な1またはそれを超える試薬または他の成分を含むキットがさらに提供される。例えば、キットは、CRISPR試薬(Cas9タンパク質、ガイド配列、プラスミドなど)、形質移入または投与試薬、陰性および陽性対照試料(例えば、細胞、テンプレートDNA)、細胞、1またはそれを超える成分を収容する容器(例えば、微量遠心管、箱)、検出可能な標識、検出および分析機器、ソフトウェア、指示(instruction)などを含み得る。
【図面の簡単な説明】
【0009】
【
図1】
図1Aは、結合したDNAおよびRNAを有するSaCas9のMDシミュレーションのためのモデル系を図解する模式図である。DNAのPAM領域とその周囲のタンパク質残基の間の相互作用が拡大されている。
図1Bは、対E782-K910およびE782-G0の時間依存性距離を示すグラフである。
図1Cは、対N968-G3およびR1015-G3の時間依存性距離を示すグラフである。
図1Dは、0、57および80nsにおけるE782の配位を示す一連の画像である。E782K変異のFEP計算において、
図1D中のNa+イオンは、新たに出現したK782との好ましくない衝突(または静電的反発)を回避するために、E782とともに消滅させた。したがって、遊離状態のFEP計算においては、電解質中の余分なNa+(タンパク質複合体に近接していない)はE782と同時に消滅させた。
【0010】
【
図2】
図2A~2Cは、結晶化したSaCas9複合体の原子構造の模式図である。
図2Aは、A、B、CおよびDと表示された4つの複雑なコピーを含む単位セルを示している。
図2Bは、コピーAとB、またはCとDの間の結晶の接触の拡大図を示している。
図2Cは、コピーBとCの間の結晶接触の拡大図を示している。
【0011】
【
図3】
図3A~3Cは、SaCas9複合体のMDシミュレーションの模式図である。
図3Aは、約200nsのシミュレーション中のタンパク質、DNAおよびRNA骨格の二乗平均平方根偏差(RMSD)を示している
図3Bは、SaCas9中のPIドメインと非標的DNA鎖中のPAMとの間の原子配位を示している。
図3Cは、結晶構造(灰色)と最終的なシミュレート構造(緑色)の重なりを示している。
【0012】
【
図4】
図4は、結合したsgRNAのみを有するSaCas9に対するMDシミュレーションにおけるタンパク質骨格の二乗平均平方根偏差を示すグラフである。挿入図:MDシミュレーションの最後での複合体のスナップショット。
【0013】
【
図5】
図5Aは、変異R1015HのΔΔGを計算するための熱力学的サイクルを示す一連の模式図である。ΔG
AおよびΔG
Bは、それぞれ、野生型および変異体タンパク質に結合するdsDNAの自由エネルギーの変化であり、ΔG
1およびΔG
2は、それぞれ、DNA結合状態およびDNA遊離状態において生じる、該変異の自由エネルギーの変化である。タンパク質残基993および1015中の原子は、ファンデルワールス球として強調表示されている。
図5Bは、PAM認識に関与する選択された残基に対するアラニンスキャニングの自由エネルギー変化を示すグラフである。
図5Cは、計算解析において実行された変異スキャニングに対応する分子構築物を使用する哺乳動物細胞実験で測定された正規化されたCas9効率を示すグラフである。
図5Dは、FEPの結果と実験的なCas9効率の間の頑強な線形相関を示すグラフであり、COMETワークフローの妥当性を実証している。線形回帰は、ΔΔGと野生型対照に対する試験された各変異体Cas9の効率比の自然対数(natural log)(ln)とを用いて行った。決定係数による適合度は0.92であった。
【0014】
【
図6】
図6Aは、KKH SaCas9変異体と関連する様々な変異の自由エネルギー変化を示すグラフである。
図6Bは、SaCas9中のE782K変異を示す模式図である。タンパク質残基K782およびK910中の原子は、ファンデルワールス球として強調表示されている。
図6Cは、E782KおよびN968K変異における水の役割を示す模式図である。
図6Dは、KKH-SaCas9タンパク質と結合したDNAとの間の鍵となる相互作用の斜視図の模式図である。
【0015】
【
図7】
図7Aは、拡張されたPAM範囲を有するSaCas9バリアントのCOMETをベースとした最適化のための様々な変異に対するFEP計算を示すグラフである。
図7Bは、NNGRRT=C=G=A PAMを標的とする操作されたsaCas9バリアントの正規化されたCas9効率を示すグラフである。
図7Cは、DNA骨格とのR986の配位、およびR986とL991の間の疎水性相互作用(R991L変異後)の模式図である。
図7Dは、COMETワークフローを通じて発見された新規SaCas9バリアントの内因性ゲノム標的化活性を示すグラフであり、破線は、正規化の基礎としての野生型SaCas9活性を表す。X軸上に示されている各PAM配列について、異なる標的からの結果をエラーバーとして平均値の標準誤差(S.E.M.)とともに表した。
図7Eは、CRISPRゲノム編集ツールを理解し、操作するための、複合アプローチに対するCOMETをまとめた図である。
【0016】
【
図8】
図8は、その標的化範囲をさらに増強するために、N986Rと追加のR991コンビナトリアル変異とを有するSaCas9バリアントの実験的検証および特性決定を示すグラフであり、野生型SaCas9に対して正規化されたSaCas9バリアントのCas9効率が示されている。異なる色のバー(bards)は、異なるPAM配列を有する標的を表し、標的の最後の位置は、4つのDNA塩基全てを含むように変えられている。
【0017】
【
図9】
図9A~9Dは、異なるPAM配列群にわたって野生型SaCas9と比較した異なるSaCas9バリアントの活性を示すグラフであり、アッセイにおいて試験された個々のゲノム部位を列挙している。各データバーは、独立した反復から得た結果を表し、エラーバーは平均値の標準誤差を示す。
【0018】
【
図10】
図10は、PAM認識を増強するSaCas9の追加の残基に対する構造分析の模式図である。
【0019】
【
図11】
図11は、変異の組み合わせを有するSaCas9バリアントのCas9活性を示すグラフであり、標的DNA上のPAM二重鎖の認識に焦点を当てている。結果は、異なるPAM配列を有するDNA標的への結合によって色分けされている。
【0020】
【
図12】
図12は、変異の組み合わせを有するSaCas9バリアントのCas9活性を示すグラフであり、標的DNAの一般的結合親和性の増強に焦点を当てている。結果は、異なるPAM配列を有するDNA標的への結合によって色分けされている。
【0021】
【
図13】
図13は、ゲノム標的の切断によって測定されたSaCas9バリアントのCas9活性を示すグラフであり、標的DNAに対する切断活性は、
図7で測定された結合活性とは異なるであろう。異なる色は、異なるPAM配列を有するDNA標的の切断から得られた結果を表している。
【発明を実施するための形態】
【0022】
本開示は、少なくとも部分的には、改変されたPAM特異性を有するバリアントCas9タンパク質を同定するための計算解析および実験的アッセイを組み合わせる方法の開発に基づいている。特に、開示された方法は、以前には標的とすることができなかった配列に対する遺伝子編集のために拡張されたPAM活性を有するバリアントSaCas9タンパク質の設計を可能にする。本明細書に記載されている方法論は、計算物理化学と遺伝子編集の力を兼ね備える非天然CRISPRユーティリティを探索する上で一般的なモチーフとしての役割を果たし得る。
定義
【0023】
本技術の理解を容易にするために、いくつかの用語および句を以下に定義する。追加の定義は、詳細な説明全体に記載されている。
【0024】
本明細書で使用される場合、「核酸」または「核酸配列」は、ピリミジンおよび/またはプリン塩基、好ましくはそれぞれシトシン、チミン、およびウラシル、ならびにアデニンおよびグアニンのポリマーまたはオリゴマーを指す(Albert L.Lehninger,Principles of Biochemistry,at 793-800(Worth Pub.1982)を参照)。本技術は、任意のデオキシリボヌクレオチド、リボヌクレオチドまたはペプチド核酸成分、ならびにこれらの任意の化学的バリアント、例えば、これらの塩基のメチル化された形態、ヒドロキシメチル化された形態またはグリコシル化された形態などを企図する。ポリマーまたはオリゴマーは、組成が不均一または均一であり得、天然に存在する供給源から単離され得るか、または人工的もしくは合成的に生成され得る。さらに、核酸は、DNAもしくはRNAまたはこれらの混合物であり得、ホモ二本鎖、ヘテロ二本鎖およびハイブリッド状態を含む一本鎖または二本鎖形態で恒久的にまたは移行的に存在し得る。いくつかの実施形態において、核酸または核酸配列は、例えば、DNA/RNAヘリックス、ペプチド核酸(PNA)、モルホリノ核酸(例えば、BraaschおよびCorey,Biochemistry,41(14):4503-4510(2002))および米国特許第5,034,506号を参照)、ロックされた核酸(LNA;Wahlestedtら、Proc.Natl.Acad.Sci.U.S.A.,97:5633-5638(2000)を参照)、シクロヘキセニル核酸(Wang,J.Am.Chem.Soc.,122:8595-8602(2000)参照)および/またはリボザイムなどの他の種類の核酸構造を含む。したがって、「核酸」または「核酸配列」という用語は、天然ヌクレオチドと同じ機能を示すことができる、非天然ヌクレオチド、修飾されたヌクレオチドおよび/または非ヌクレオチド基本要素(例えば、「ヌクレオチド類似体」)を含む鎖も包含し得、さらに、本明細書で使用される「核酸配列」という用語は、オリゴヌクレオチド、ヌクレオチドまたはポリヌクレオチドおよびこれらの断片または部分、ならびに一本鎖または二本鎖であり得、センス鎖またはアンチセンス鎖を表し得るゲノムまたは合成起源のDNAまたはRNAを指す。「核酸」、「ポリヌクレオチド」、「ヌクレオチド配列」および「オリゴヌクレオチド」という用語は、交換可能に使用される。「核酸」、「ポリヌクレオチド」、「ヌクレオチド配列」および「オリゴヌクレオチド」という用語は、デオキシリボヌクレオチドもしくはリボヌクレオチドのいずれかまたはこれらの類似体である、任意の長さのヌクレオチドのポリマー形態を指す。
【0025】
「相補的」および「相補性」という用語は、従来のワトソン-クリック塩基対形成またはその他の非従来の型の対形成のいずれかによって別の核酸配列と水素結合(複数可)を形成する核酸の能力を指す。2つの核酸配列間の相補性の程度は、第2の核酸配列と水素結合(例えば、ワトソン-クリック塩基対形成)を形成することができる核酸配列中のヌクレオチドの百分率によって示すことができる(例えば、50%、60%、70%、80%、90%および100%相補的)。核酸配列の全ての連続するヌクレオチドが第2の核酸配列中の同じ数の連続するヌクレオチドと水素結合すれば、2つの核酸配列は「完全に相補的」である。2つの核酸配列間の相補性の程度が、少なくとも8ヌクレオチド(例えば、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50またはそれを超えるヌクレオチド)の領域にわたって少なくとも60%(例えば、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%または100%)であれば、または2つの核酸配列が少なくとも中程度の、好ましくは高いストリンジェンシー条件下でハイブリッドを形成すれば、2つの核酸配列は「実質的に相補的」である。例示的な中程度のストリンジェンシー条件には、20%ホルムアミド、5×SSC(150mM NaCl、15mMクエン酸三ナトリウム)、50mMリン酸ナトリウム(pH7.6)、5×デンハルト溶液、10%デキストラン硫酸および20mg/mlの変性した剪断されたサケ精子DNAを含む溶液中において、37℃で一晩インキュベートした後、約37~50℃で1×SSC中において、または実質的に同様の条件、例えば、以下のSambrookらに記載されている中程度にストリンジェントな条件でフィルタを洗浄することが含まれる。高ストリンジェンシー条件は、例えば、(1)洗浄のために、50°Cで0.015M塩化ナトリウム/0.0015Mクエン酸ナトリウム/0.1%ドデシル硫酸ナトリウム(SDS)などの低イオン強度および高温を使用する、(2)ハイブリダイゼーション中に変性剤、例えば、ホルムアミド、例えば、pH6.5の0.1%ウシ血清アルブミン(BSA)/0.1%フィコール/0.1%ポリビニルピロリドン(PVP)/50mMリン酸ナトリウム緩衝液を含む50%(v/v)ホルムアミドを750mM塩化ナトリウムおよび75mMクエン酸ナトリウムとともに42°Cで使用する、または(3)50%ホルムアミド、5×SSC(0.75M NaCl、0.075Mクエン酸ナトリウム)、50mMリン酸ナトリウム(pH6.8)、0.1%ピロリン酸ナトリウム、5×デンハルト溶液、超音波処理したサケ精子DNA(50μg/ml)、0.1%SDSおよび10%デキストラン硫酸を42℃で使用し、(i)0.2×SSC中において42℃、(ii)50%ホルムアミド中において55℃および(iii)0.1×SSC中において55℃(好ましくは、EDTAと組み合わせて)で洗浄する条件である。ハイブリダイゼーション反応のストリンジェンシーのさらなる詳細および説明は、例えば、Sambrookら、Molecular Cloning:A Laboratory Manual,3rd ed.,Cold Spring Harbor Press,Cold Spring Harbor,N.Y.(2001)およびAusubelら、Current Protocols in Molecular Biology,Greene Publishing Associates and John Wiley&Sons,New York(1994)に提供されている。
【0026】
本明細書で使用される場合、「パーセント配列同一性」という用語は、2つの配列を整列させ、必要であれば、最大のパーセント同一性を達成するためにギャップを導入した後に、参照配列中の対応するヌクレオチドまたはアミノ酸と同一である、核酸配列中のヌクレオチドもしくはヌクレオチド類似体、またはアミノ酸配列中のアミノ酸の百分率を指す。したがって、本技術による核酸が参照配列よりも長い場合には、参照配列と整列しない核酸中の追加のヌクレオチドは、配列同一性を決定するために考慮されない。整列のための方法およびコンピュータプログラムは、BLAST、Align2およびFASTAを含み、当技術分野において周知である。
【0027】
「相同性」および「相同な」という用語は、同一性の程度を指す。部分的な相同性または完全な相同性が存在し得る。部分的に相同な配列は、別の配列と100%未満同一である配列である。
【0028】
本明細書で使用される場合、「ハイブリダイゼーション」という用語は、相補的な核酸の対形成に関して使用される。ハイブリダイゼーションおよびハイブリダイゼーションの強度(すなわち、核酸間の会合の強度)は、核酸間の相補性の程度、関与する条件のストリンジェンシーおよび形成されたハイブリッドのTmなどの要因によって影響を受ける。「ハイブリダイゼーション」法は、ある核酸を別の相補的核酸、例えば、相補的ヌクレオチド配列を有する核酸にアニーリングすることを含む。相補的な配列を含む核酸の2つのポリマーがお互いを見出し、塩基対形成相互作用を介して「アニーリング」または「ハイブリッド形成」することができる能力は、よく認識された現象である。Marmur and Lane、Proc.Natl.Acad.Sci.USA,46:453(1960)およびDotyら、Proc.Natl.Acad.Sci.USA,46:461(1960)による「ハイブリダイゼーション」過程の最初の観察に続いて、この過程は洗練され、現代生物学の不可欠なツールになった。例えば、ハイブリダイゼーションおよび洗浄条件は現在周知であり、Sambrook,J.,Fritsch,E.F.and Maniatis,T.Molecular Cloning:A Laboratory Manual,Second Edition,Cold Spring Harbor Laboratory Press,Cold Spring Harbor(1989)、特に第11章とその中の表11.1;およびSambrook,J.and Russell,W.,Molecular Cloning:A Laboratory Manual,Third Edition,Cold Spring Harbor Laboratory Press,Cold Spring Harbor(2001)に例示されている。温度とイオン強度の条件が、ハイブリダイゼーションの「ストリンジェンシー」を決定する。
【0029】
本明細書で使用される場合、「二本鎖核酸」は、核酸の一部、より長い核酸の領域、または核酸全体であり得る。「二本鎖核酸」は、例えば、これらに限定されないが、二本鎖DNA、二本鎖RNA、二本鎖DNA/RNAハイブリッドなどであり得る。二次構造(例えば、塩基対形成した二次構造)および/またはより高次の構造(例えば、ステムループ構造)を有する一本鎖核酸は、「二本鎖核酸」を構成する。例えば、三重構造は「二本鎖」と見なされる。いくつかの実施形態において、任意の塩基対形成した核酸は「二本鎖核酸」である。
【0030】
「遺伝子」という用語は、非コード機能を有するRNA(例えば、リボソームRNAまたはトランスファーRNA)、ポリペプチドまたは前駆体の産生に必要な制御およびコード配列を含むDNA配列を指す。RNAまたはポリペプチドは、完全長コード配列によって、または所望の活性もしくは機能が保持されている限り、コード配列の任意の一部によってコードされ得る。したがって、「遺伝子」は、生物内で果たすべき機能的役割を有するポリペプチドまたはRNA鎖をコードするDNAもしくはRNAまたはこれらの一部を指す。本開示において、遺伝子は、そのような調節配列がコード配列および/または転写される配列に隣接しているか否かを問わず、遺伝子産物の産生を調節する領域を含むと考えることができる。したがって、遺伝子には、プロモーター配列、ターミネーター、リボソーム結合部位および内部リボソーム進入部位などの翻訳調節配列、エンハンサー、サイレンサー、インスレーター、境界エレメント、複製起点、マトリックス付着部位および遺伝子座制御領域が含まれるが、必ずしもこれらに限定されない。
【0031】
「野生型」という用語は、天然に存在する供給源から単離された場合にその遺伝子または遺伝子産物の特徴を有する遺伝子または遺伝子産物を指す。野生型遺伝子は、集団で最も頻繁に観察される遺伝子であり、したがって、遺伝子の「正常」または「野生型」形態と任意に指定される。対照的に、「修飾された」、「変異体」または「多形性の」という用語は、野生型遺伝子または遺伝子産物と比較した場合に、配列および/または機能的特性の修飾(すなわち、改変された特性)を示す遺伝子または遺伝子産物を指す。天然に存在する変異体を単離できることに留意すべきであり、これらは、野生型遺伝子または遺伝子産物と比較した場合、改変された特性を有するという事実によって特定される。
【0032】
本明細書で使用される場合、「バリアント」という用語は、自然界で発生するものから逸脱するパターンを有する性質の発出を表す。いくつかの実施形態において、バリアントは変異体でもあり得る。
【0033】
「天然に存在しない」または「操作された(engineered)」という用語は互換的に使用され、人間の手の関与を示す。これらの用語は、核酸分子またはポリペプチドに言及する場合、その核酸分子またはポリペプチドは、自然界でそれらが天然に会合し、自然界で見出されるように少なくとも1つの他の成分を少なくとも実質的に含まないことを意味する。
【0034】
本明細書で使用される「オリゴヌクレオチド」という用語は、2またはそれを超えるデオキシリボヌクレオチドまたはリボヌクレオチド、好ましくは少なくとも5ヌクレオチド、より好ましくは少なくとも約10~15ヌクレオチド、より好ましくは少なくとも約15~50ヌクレオチド(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49または50またはそれを超えるヌクレオチド)を含む分子として定義される。正確なサイズは多くの要因に依存し、これは次いでオリゴヌクレオチドの最終的な機能または使用に依存する。オリゴヌクレオチドは、化学合成、DNA複製、逆転写、PCRまたはこれらの組み合わせを含む任意の様式で生成され得る。
【0035】
「ペプチド」および「ポリペプチド」および「タンパク質」という用語は、本明細書では互換的に使用され、コードおよび非コードアミノ酸、化学的にまたは生化学的に修飾されたまたは誘導体化されたアミノ酸、および修飾されたペプチド骨格を有するポリペプチドを含むことができる任意の長さのアミノ酸のポリマー形態を指す。
【0036】
本明細書で使用される「結合」(例えば、ポリペプチドのRNA結合ドメインに関して)は、高分子間(例えば、タンパク質と核酸の間)での非共有結合性相互作用を指す。非共有結合性相互作用の状態にある間、高分子は「会合した」または「相互作用している」または「結合している」と称される(例えば、分子Xが分子Yと相互作用すると称される場合、分子Xは、非共有結合性の様式で分子Yに結合することを意味する。)。結合相互作用の全ての成分が配列特異的であることを必要とするわけではない(例えば、DNA骨格中のホスファート残基との接触)が、結合相互作用のいくつかの部分は配列特異的であり得る。結合相互作用は、一般に、10-6M未満、10-7M未満、10-8M未満、10-9M未満、10-10M未満、10-11M未満、10-12M未満、10-13M未満、10-14M未満または10-15M未満の解離定数(Kd)によって特徴付けられる。「親和性」は、結合の強度を表し、増加した結合親和性はより低いKdと相関する。
【0037】
「結合ドメイン」とは、別の分子に非共有結合的に結合することができるタンパク質ドメインを意味する。結合ドメインは、例えば、DNA分子(DNA結合タンパク質)、RNA分子(RNA結合タンパク質)および/またはタンパク質分子(タンパク質結合タンパク質)に結合することができる。タンパク質ドメイン結合タンパク質の場合には、タンパク質ドメイン結合タンパク質はそれ自体に結合して(ホモ二量体、ホモ三量体などを形成する)ことができ、および/または1もしくは複数の異なるタンパク質の1もしくはそれを超える分子に結合することができる。
【0038】
本明細書で使用される「組換え」は、特定の核酸(DNAまたはRNA)が、クローニング、制限、ポリメラーゼ連鎖反応(PCR)および/または連結ステップの様々な組み合わせの産物であり、自然系において見られる内因性核酸と区別可能な構造的コードまたは非コード配列を有する構築物をもたらすことを意味する。ポリペプチドをコードするDNA配列は、細胞中または無細胞転写および翻訳系中に含有される組換え転写ユニットから発現されることができる合成核酸を提供するために、cDNA断片からまたは一連の合成オリゴヌクレオチドから組み立てることができる。組換え遺伝子または転写ユニットの形成において、関連する配列を含むゲノムDNAも使用することができる。オープンリーディングフレームから5’または3’に、翻訳されないDNAの配列が存在し得、このような配列はコード領域の操作または発現を妨害せず、様々な機序によって所望の産物の産生をモジュレートするように実際に作用し得る)。あるいは、翻訳されないRNA(例えば、DNA標的化RNA)をコードするDNA配列も、組換え体と見なされ得る。したがって、例えば、「組換え」核酸という用語は、天然に存在しない核酸、例えば、ヒトの介入を通じて、そうでなければ分離されていた2つの配列セグメントの人工的な組み合わせによって作られる核酸を表す。この人工的な組み合わせは、化学合成手段によって、または例えば遺伝子工学技術による核酸の単離されたセグメントの人工的な操作によってしばしば達成される。このようなことは、通常、コドンを、同じアミノ酸、保存的アミノ酸、または非保存的アミノ酸をコードするコドンで置き換えるために行われる。あるいは、所望の機能の核酸セグメントを一緒に結合して、機能の所望の組み合わせを生成するために行われる。この人工的な組み合わせは、化学合成手段によって、または例えば遺伝子工学技術による核酸の単離されたセグメントの人工的な操作によってしばしば達成される。組換えポリヌクレオチドがポリペプチドをコードする場合、コードされるポリペプチドの配列は、天然に存在することができ(「野生型」)、または天然に存在する配列のバリアント(例えば、変異体)であり得る。したがって、「組換え」ポリペプチドという用語は、必ずしも、その配列が天然に存在しないポリペプチドを指すとは限らない。むしろ、「組換え」ポリペプチドは、組換えDNA配列によってコードされるが、ポリペプチドの配列は、天然に存在することができ(「野生型」)または天然に存在しないことができる(例えば、バリアント、変異体など)。したがって、「組換え」ポリペプチドは、ヒトの介入の結果であるが、天然に存在するアミノ酸配列であり得る。
【0039】
「ベクター」または「発現ベクター」は、付着されたセグメントの細胞中での複製をもたらすように、別のDNAセグメント、すなわち「挿入物」が付着されまたは組み込まれ得るレプリコン、例えば、プラスミド、ファージ、ウイルスまたはコスミドである。
【0040】
外因性DNAが細胞内に導入されている場合に、細胞は、外因性DNA、例えば、組換え発現ベクターによって、「遺伝子改変」、「形質転換」または「形質移入」されている。外因性DNAの存在は、恒久的なまたは一過性の遺伝的変化をもたらす。形質転換DNAは、細胞のゲノム中に組み込まれる(共有結合される)ことがあり得、または組み込まれないことがあり得る。例えば、原核生物、酵母および哺乳動物細胞では、形質転換DNAは、プラスミドなどのエピソームエレメント上に維持され得る。真核細胞に関して、安定して形質転換された細胞とは、形質転換DNAが染色体複製を通じて娘細胞によって受け継がれるように、形質転換DNAが染色体中に組み込まれた細胞である。この安定性は、形質転換DNAを含有する娘細胞の集団を含む細胞系またはクローンを確立する真核細胞の能力によって実証される。「クローン」は、有糸分裂によって単一の細胞または共通の祖先から生じる細胞の集団である。「細胞系」は、何世代にもわたってインビトロで安定した成長が可能な初代細胞のクローンである。
【0041】
CRISPR/Cas遺伝子編集系は、真核細胞内の関心対象の特定の遺伝子への標的とされた修飾を可能にするために開発された。CRISPR/Cas遺伝子編集系は、II型原核生物のクラスター化して規則的な配置の短い回文配列リピート(CRISPR)適応免疫系からのRNA誘導型Cas9ヌクレアーゼに基づいている(例えば、Jinekら、Science,337:816(2012);Gasiunasら、Proc.Natl.Acad.Sci.U.S.A.,109,E2579(2012);Garneauら、Nature,468:67(2010);Deveauら、Annu.Rev.Microbiol.,64:475(2010);Horvath and Barrangou,Science,327:167(2010);Makarovaら、Nat.Rev.Microbiol.,9,467(2011);Bhayaら、Annu.Rev.Genet.,45:273(2011);およびCongら、Science,339:819-823(2013)を参照)。細菌および古細菌では、CRISPR/Cas系は、侵入するファージ、ウイルスおよびプラスミドDNAの断片をCRISPR遺伝子座に組み込み、対応するCRISPR RNA(「crRNA」)を使用して相同配列の分解を誘導することにより、免疫を提供する。各CRISPR遺伝子座は、リピート配列によって隔てられている獲得された「スペーサー」をコードする。CRISPR遺伝子座の転写により「プレcrRNA」が生成され、プレcrRNAは処理されて、スペーサーに相補的なdsDNA配列を切断するようにエフェクターヌクレアーゼ複合体をガイドするスペーサー・リピート断片を含有するcrRNAが生成される。
【0042】
II型CRISPR遺伝子座は、Cas9タンパク質をコードする遺伝子を含む4つの遺伝子、2つの非コードcrRNA:トランス活性化crRNA(tracrRNA)および同一のダイレクトリピート(DR)によって間隔が空けられたヌクレアーゼガイド配列(「スペーサー」とも呼ばれる)を含有する前駆体crRNA(プレcrRNA)アレイを含む(Congら、上記)。tracrRNAは、プレcrRNAの処理およびCas9複合体の形成に重要である。CRISPRによって誘導される病原性配列の分解は、3段階で起こる。第一に、tracrRNAがプレcrRNAのリピート領域にハイブリッド形成する。第二に、内因性リボヌクレアーゼIIIがハイブリッド形成したcrRNA-tracrRNAを切断し、第二の事象が各スペーサーの5’末端を除去して、tracrRNAとCas9の両方に会合したままの成熟crRNAを生成する。第三に、各成熟複合体は、標的二本鎖DNA(dsDNA)配列の位置を特定し、両方の鎖を切断する。
【0043】
真核細胞において使用するためのCRISPR/Cas系の改変操作は、典型的には、crRNA-tracrRNA-Cas9複合体の再構成を伴う。ヒト細胞では、例えば、適切な核局在化シグナルを含めるために、Cas9アミノ酸配列をコドン最適化および修飾することができ、RNAポリメラーゼIIプロモーターを介して、個別にまたは単一のキメラ分子としてcrRNAおよびtracrRNA配列を発現させ得る。典型的には、crRNAとtracrRNA配列はキメラとして発現され、まとめて「ガイドRNA」(gRNA)またはシングルガイドRNA(sgRNA)と呼ばれる。したがって、「ガイドRNA」、「シングルガイドRNA」および「合成ガイドRNA」という用語は、本明細書では互換的に使用され、ガイド配列を含有するtracrRNAとプレcrRNAのアレイを含む核酸配列を指す。「ガイド配列」、「ガイド」および「スペーサー」という用語は、本明細書では互換的に使用され、標的部位を特定するガイドRNA内の約20ヌクレオチド配列を指す。CRISPR/Cas9系では、ガイドRNAは、20ヌクレオチドのガイド配列とこれに後続する、ワトソン-クリック塩基対形成を介してCas9を標的配列に誘導するプロトスペーサー隣接モチーフ(PAM)とを含有する(Deveauら、Annu.Rev.Microbiol.,64:475-493(2010);Jinekら、Science,337:816-821(2012);およびXieら、Genome Res.,24(9):1526-1533(2014))。標準的なPAM配列は、Streptococcus pyogenesのCas9についてはNGGまたはNAGであり、髄膜炎菌(Neisseria meningitidis)のCas9についてはNNNNGATTである。
【0044】
本開示は、バリアントCasタンパク質を提供する。バリアントCasタンパク質は、任意の適切なCasタンパク質(またはその相同体または修飾されたバージョン)に基づき得る、またはこれらに由来し得る。Casタンパク質の非限定的な例には、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(Csn1およびCsx12としても知られる)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3およびCsf4が含まれる。Casタンパク質ファミリーは、例えば、Haftら、PLoS Comput.Biol.,1(6):e60(2005)にさらに詳細に記載されている。一実施形態において、バリアントCasタンパク質は、野生型Cas9タンパク質に基づき、または野生型Cas9タンパク質に由来する。Cas9タンパク質は任意の適切な微生物から得ることができ、多くの細菌がCas9タンパク質バリアントを発現する。Streptococcus pyogenesおよびS.thermophilus由来のCas9は当技術分野で広く使用されているが、他のCas9タンパク質は、S.pyogenesのCas9と高レベルの配列同一性を有し、同一のガイドRNAを使用する。他の種のCas9タンパク質は当技術分野において公知であり(例えば、米国特許出願公開第2017/0051312号を参照)、本開示に関連して使用され得る。Cas9タンパク質は、例えば、Maliら、Nat Methods,10(10):957-963(2013)にさらに記載されており、様々な種からのCasタンパク質のアミノ酸配列は、GenBankおよびUniProtデータベースを通じて公に入手可能である。
【0045】
一実施形態において、バリアントCas9タンパク質は、Staphylococcus aureus Cas9(SaCas9)タンパク質、理想的には野生型S.aureus Cas9タンパク質から得られ、またはこれらに基づく。SaCas9は、小さく、効率的で、広範囲に標的化するCas9オルソログの検索において最近同定され、遺伝子治療用途のために、それらの送達がより便利で、効率的になった(Ranら、Nature,520(7546):186-191(2015))。SaCas9は、21~23ntの長さのガイドRNA配列を使用して、哺乳動物細胞中で最も高い公知の編集効率を達成し、ダイレクトリピート:アンチリピート領域に関して一連の長さに適応することができる。SaCas9はNNGRRTのPAM配列を介して最も効率的にゲノム標的を切断するが、全てのNNGRR PAMはSaCas9によって切断することができる(Ranら、上記;およびFriedlandら、Genome Biology,16:257(2015))。例示的な野生型SaCas9アミノ酸配列には、UniProtデータベースにアクセッション番号J7RUA5(CAS9_STAAU)で寄託されたアミノ酸配列、および配列番号1が含まれる。SaCas9をコードする核酸配列を含むプラスミドは、Addgeneリポジトリから公に入手可能である。
【0046】
一実施形態において、バリアントSaCas9タンパク質は、配列番号1のアミノ酸配列を含むが、配列番号1の1またはそれを超えるアミノ酸残基の置換をさらに含む。アミノ酸の「置き換え」または「置換」は、所与の位置または残基における1つのアミノ酸の、ポリペプチド配列内の同じ位置または残基における別のアミノ酸による置き換えを指す。アミノ酸は、「芳香族」または「脂肪族」として広く分類される。芳香族アミノ酸は芳香環を含む。「芳香族」アミノ酸の例には、ヒスチジン(HまたはHis)、フェニルアラニン(FまたはPhe)、チロシン(YまたはTyr)およびトリプトファン(WまたはTrp)が含まれる。非芳香族アミノ酸は、「脂肪族」として広く分類される。「脂肪族」アミノ酸の例には、グリシン(GまたはGly)、アラニン(AまたはAla)、バリン(VまたはVal)、ロイシン(LまたはLeu)、イソロイシン(IまたはHe)、メチオニン(MまたはMet)、セリン(SまたはSer)、スレオニン(TまたはThr)、システイン(CまたはCys)、プロリン(PまたはPro)、グルタミン酸(EまたはGlu)、アスパラギン酸(AまたはAsp)、アスパラギン(NまたはAsn)、グルタミン(QまたはGin)、リジン(KまたはLys)およびアルギニン(RまたはArg)が含まれる。
【0047】
脂肪族アミノ酸は4つのサブグループに細分され得る。「大きな脂肪族非極性サブグループ」は、バリン、ロイシンおよびイソロイシンからなる。「脂肪族のわずかに極性のサブグループ」は、メチオニン、セリン、スレオニンおよびシステインでからなる。「脂肪族極性/荷電サブグループ」は、グルタミン酸、アスパラギン酸、アスパラギン、グルタミン、リジンおよびアルギニンからなる。「小残基サブグループ」は、グリシンおよびアラニンからなる。荷電/極性アミノ酸のグループは、リジンおよびアルギニンからなる「正に荷電したサブグループ」、グルタミン酸およびアスパラギン酸からなる「負に荷電したサブグループ」ならびにアスパラギンおよびグルタミンからなる「極性サブグループ」という3つのサブグループに細分され得る。
【0048】
芳香族アミノ酸は、ヒスチジンおよびトリプトファンからなる「窒素環サブグループ」ならびにフェニルアラニンおよびチロシンからなる「フェニルサブグループ」という2つのサブグループに細分され得る。
【0049】
アミノ酸の置き換えまたは置換は、保存的、半保存的または非保存的であり得る。「保存的アミノ酸置換」または「保存的変異」という句は、あるアミノ酸を共通の特性を有する別のアミノ酸によって置き換えることを指す。個々のアミノ酸間の共通の特性を定義するための機能的な方法は、相同的生物の対応するタンパク質間のアミノ酸変化の正規化された頻度を分析することである(Schulz and Schirmer,Principles of Protein Structure,Springer-Verlag,New York(1979))。このような分析によれば、グループ内のアミノ酸が互いと優先的に交換し、したがって、全体的なタンパク質構造に対するそれらの影響において互いに最も類似している場合に、アミノ酸のグループが定義され得る(SchulzおよびSchirmer、前出)。
【0050】
保存的アミノ酸置換の例には、上記のサブグループ内でのアミノ酸の置換、例えば、正電荷が維持され得るようにアルギニンをリジンに、およびその逆、負電荷が維持され得るようにアスパラギン酸をグルタミン酸に、およびその逆、遊離-OHが維持され得るようにスレオニンをセリンに、および遊離-NH2が維持され得るようにアスパラギンをグルタミンに置換することが含まれる。
【0051】
「半保存的変異」には、上に列記された同じグループ内であるが、同じサブグループ内ではないアミノ酸のアミノ酸置換が含まれる。例えば、アスパラギンをアスパラギン酸に、またはリジンをアスパラギンに置換することは、同じグループ内であるが、異なるサブグループのアミノ酸を含む。「非保存的変異」は、例えば、トリプトファンをリジンに、またはセリンをフェニルアラニンに置換するなど、異なるグループ間でのアミノ酸置換を含む。
【0052】
バリアントSaCas9タンパク質は、該バリアントSaCas9が親SaCas9タンパク質の有用な活性を保持している限り、または、より好ましくは、親タンパク質と比較して増強された活性または特性(例えば、ヌクレアーゼ活性、ガイドRNAおよび標的DNAと相互作用する能力など)を示す限り、配列番号1の適切なアミノ酸置換の任意の1つもしくはそれらの組み合わせを含み得る、配列番号1の適切なアミノ酸置換の任意の1つもしくはそれらの組み合わせから本質的になり得る、または配列番号1の適切なアミノ酸置換の任意の1つもしくはそれらの組み合わせからなり得る。一実施形態において、バリアントSaCas9タンパク質は、アミノ酸残基E782、N968、N986およびR991の1またはそれより多くが異なるアミノ酸で置換されていることを除いて、配列番号1のアミノ酸配列を含む。これらの位置のアミノ酸はそれぞれ個別に修飾され得、または組み合わせが修飾され得る(例えば、位置986および991、位置968および986、位置782および986、位置782、986および991、位置968、986および991が修飾されている)。配列番号1の986位のアスパラギン残基は、例えば、アラニン(N986A)、アルギニン(N986R)、リジン(N986K)またはヒスチジン(N986H)などの任意の適切なアミノ酸残基で置換され得る。同様に、配列番号1の991位のアルギニン残基は、例えば、アラニン(R991A)、リジン(R991K)、ロイシン(R991L)、システイン(R991C)またはバリン(R991V)などの任意の適切なアミノ酸残基で置換され得る。配列番号1の782位のグルタミン酸残基は、例えば、リジン(E782K)、アルギニン(E782R)またはヒスチジン(E782H)などの任意の適切なアミノ酸残基で置換され得る。配列番号1の968位のアスパラギン残基は、例えば、リジン(N968K)、アルギニン(N968R)またはヒスチジン(N968H)などの任意の適切なアミノ酸残基で置換され得る。
【0053】
いくつかの実施形態において、バリアントSaCas9タンパク質は、N885(アスパラギン、Asn)、K886(リジン、K)、L887(ロイシン、L)、N888(アスパラギン、Asn)、A889(アラニン、Ala)、R1015(アルギニン、Arg)およびT1019(スレオニン、Thr)から選択される配列番号1の1またはそれを超える残基のアミノ酸置換をさらに含み得る。配列番号1の885位のアスパラギン残基は、例えば、リジン(N885K)などの任意の適切なアミノ酸残基で置換され得る。配列番号1の886位のリジン残基は、例えば、アスパラギン(K886N)またはアルギニン(K886R)などの任意の適切なアミノ酸残基で置換され得る。配列番号1の887位のリジン残基は、例えば、ロイシン(L887K)などの任意の適切なアミノ酸残基で置換され得る。配列番号1の888位のリジン残基は、例えば、アスパラギン(N888K)などの任意の適切なアミノ酸残基で置換され得る。配列番号1の889位のアラニン残基は、例えば、ヒスチジン(A889H)、リジン(A889K)またはアスパラギン(A889N)などの任意の適切なアミノ酸残基で置換され得る。配列番号1の1015位のアルギニン残基は、例えば、ヒスチジン(R1015H)などの任意の適切なアミノ酸残基で置換され得る。配列番号1の1019位のスレオニンは、例えば、アルギニン(T1019R)、リジン(T1019K)またはヒスチジン(T1019H)などの任意の適切なアミノ酸残基で置換され得る。
【0054】
バリアントSaCas9タンパク質は、配列番号1の上記アミノ酸置換の任意の1つもしくはそれらの組み合わせを含み得る、配列番号1の上記アミノ酸置換の任意の1つもしくはそれらの組み合わせから本質的になり得る、または配列番号1の上記アミノ酸置換の任意の1つもしくはそれらの組み合わせからなり得る。いくつかの実施形態において、バリアントCas9タンパク質は、配列番号1のアミノ酸配列および2またはそれを超える(例えば、2、3、4、5またはそれを超える)アミノ酸置換を含む。例えば、バリアントSaCas9タンパク質は、N986RおよびR991A;N986RおよびR991K;N986RおよびR991L;N885KおよびN986R;K886NおよびN986R;K886RおよびN986R;L887KおよびN986R;N888KおよびN986R;A889HおよびN986R;A889KおよびN986R;A889NおよびN986R;E782KおよびN986R;N968KおよびN986R;E782KおよびN986R;N968KおよびN986Rまたは前述の置換の2つの任意のその他の組み合わせを含むがこれらに限定されない、配列番号1の2つのアミノ酸残基の置換を含み得る、配列番号1の2つのアミノ酸残基の置換から本質的になり得る、または配列番号1の2つのアミノ酸残基の置換からなり得る。他の実施形態において、バリアントSaCas9タンパク質は、N986R、R991AおよびT1019R;N986R、R991AおよびT1019K;N986R、R991AおよびT1019H;N986R、R991KおよびT1019R;N986R、R991KおよびT1019K;N986R、R991KおよびT1019H;N986R、R991LおよびT1019R;N986R、R991LおよびT1019K;N986R、R991LおよびT1019H;N986R、R991CおよびT1019R;N986R、R991CおよびT1019K;N986R、R991CおよびT1019H;N986R、R991VおよびT1019R;N986R、R991VおよびT1019K;N986R、R991VおよびT1019H;N885K、N986RおよびR991L;K886N、N986RおよびR991L;K886R、N986RおよびR991L;L887K、N986RおよびR991L;N888K、N986RおよびR991L;A889H、N986RおよびR991L;A889K、N986RおよびR991L;A889N、N986RおよびR991L;E782K、N968KおよびN986R;E782K、N986RおよびR1015H;N968K、N986RおよびR1015H;E782K、N986RおよびR991L;N968K、N986RおよびR991L;または前述の置換の3つの任意の組み合わせを含むがこれらに限定されない、配列番号1の3つのアミノ酸残基の置換を含み得る、配列番号1の3つのアミノ酸残基の置換から本質的になり得る、または配列番号1の3つのアミノ酸残基の置換からなり得る。他の実施形態において、バリアントSaCas9タンパク質は、E782K、N968K、N986RおよびR1015H;E782K、N968K、N986RおよびR991L;E782K、N986R、R991LおよびR1015H;N968K、N986R、R991LおよびR1015H、または前述の置換の4つの任意の組み合わせを含むがこれらに限定されない、配列番号1の4つのアミノ酸残基の置換を含み得る、配列番号1の4つのアミノ酸残基の置換から本質的になり得る、または配列番号1の4つのアミノ酸残基の置換からなり得る。いくつかの実施形態において、バリアントSaCas9タンパク質は、E782K、N968K、N986R、R991LおよびR1015H、または前述の置換の5つの任意の組み合わせを含むがこれらに限定されない、配列番号1の5つのアミノ酸残基の置換を含み得る、配列番号1の5つのアミノ酸残基の置換から本質的になり得る、または配列番号1の5つのアミノ酸残基の置換からなり得る。5を超えるアミノ酸置換(例えば、6、7、8、9、10またはそれを超える置換)を含むバリアントSaCas9タンパク質も、本開示の範囲内である。
【0055】
いくつかの実施形態において、本開示は、本明細書に記載されているアミノ酸置換のいずれかを有するまたは有さない、配列番号1と少なくとも90%同一(例えば、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%同一)であるアミノ酸配列を含むCas9タンパク質を提供する。核酸またはアミノ酸配列の同一性は、本明細書に記載されるように、関心対象の核酸またはアミノ酸配列を参照核酸またはアミノ酸配列と比較することによって決定することができる。
【0056】
本開示は、本明細書に記載のバリアントSaCas9タンパク質をコードする単離されたまたは精製された核酸配列も提供する。宿主細胞(例えば、哺乳動物細胞)中での核酸配列の発現を与える1またはそれを超える発現制御配列(例えば、プロモーター、エンハンサー、ポリアデニル化シグナル、転写ターミネーター、内部リボソーム進入部位(IRES)など)に必要に応じて機能的に連結された、前記単離された核酸を含むベクターも提供される。ベクターは、例えば、プラスミド、エピソーム、コスミド、ウイルスベクター(例えば、レトロウイルス、アデノウイルス、レンチウイルスまたはアデノ随伴ウイルスベクター)、またはファージであり得る。適切なベクターおよびベクター調製の方法は当技術分野で周知である(例えば、Sambrookら、Molecular Cloning,a Laboratory Manual,3rd edition,Cold Spring Harbor Press,Cold Spring Harbor,N.Y.(2001)およびAusubelら、Current Protocols in Molecular Biology,Greene Publishing Associates and John Wiley&Sons,New York,N.Y.(1994)参照)。ベクター系における遺伝子発現を制御するための例示的な発現制御配列には、例えば、Goeddel,Gene Expression Technology:Methods in Enzymology,Vol.185,Academic Press,San Diego,Calif.(1990),Sambrookら、前出;およびAusubelら、前出に記載されている原核生物および真核生物の配列が含まれる。
【0057】
プロモーターなどの発現制御配列の選択は、本明細書に記載のベクターおよび系の特定の用途に依存する。様々な異なる供給源からの構成的、誘導性および抑制性プロモーターを含む多数のプロモーターが当技術分野で周知である。プロモーターの代表的な供給源には、例えば、ウイルス、哺乳動物、昆虫、植物、酵母および細菌が含まれ、これらの供給源からの適切なプロモーターは、容易に入手可能であり、または、例えば、ATCCなどの寄託機関および他の商業的なまたは個人的な供給源から公に入手可能な配列に基づいて、合成的に作製することができる。プロモーターは、一方向(すなわち、一方向に転写を開始する)または双方向(すなわち、3’または5’方向に転写を開始する)であり得る。プロモーターの非限定的な例には、例えば、T7細菌発現系、pBAD(araA)細菌発現系、サイトメガロウイルス(CMV)プロモーター、SV40プロモーター、RSVプロモーターが含まれる。誘導性プロモーターには、例えば、Tet系(米国特許第5,464,758号および同第5,814,618号)、エクジソン誘導系(Noら、Proc.Natl.Acad.Sci.,93:3346-3351(1996))、T-REX(商標)系(Invitrogen,Carlsbad,Calif.)、LACSWITCH(商標)系(Stratagene,San Diego,Calif.)、およびCre-ERTタモキシフェン誘導性リコンビナーゼ系(Indraら、Nuc.Acid.Res.,27:4324-4327(1999);Nuc.Acid.Res.,28:e99(2000);米国特許第7,112,715号;およびKramer&Fussenegger,Methods Mol.Biol.,3086:123-144(2005))が含まれる。
【0058】
バリアントSaCas9タンパク質をコードする核酸配列は、同族のガイドRNA配列(sgRNA)と同じベクター上で(すなわち、シスで)細胞に提供することができる。このような実施形態では、各核酸配列の発現を制御するために、一方向性プロモーターを使用することができる。別の実施形態では、複数の核酸配列の発現を制御するために、双方向性プロモーターと一方向性プロモーターの組み合わせを使用することができる。他の実施形態では、バリアントSaCas9タンパク質をコードする核酸配列およびその同族のガイドRNA配列は、別個のベクター上で(すなわち、トランスで)細胞に提供され得る。別個のベクターの各々における核酸配列の各々は、同一のまたは異なる発現制御配列を含むことができる。別個のベクターは、同時にまたは逐次に細胞に提供することができる。
【0059】
バリアントSaCas9タンパク質をコードする核酸配列を含むベクターは、任意の適切な原核細胞または真核細胞を含む、該ベクターによってコードされるポリペプチドを発現することができる宿主細胞中に導入することができる。したがって、本開示は、本明細書に開示されるベクターまたは核酸配列を含む単離された細胞を提供する。好ましい宿主細胞は、容易かつ確実に成長させることができ、適度に速い成長速度を有し、十分に特徴付けられた発現系を有し、容易かつ効率的に形質転換または形質移入することができるものである。適切な原核細胞の例には、Bacillus属(Bacillus subtilisおよびBacillus brevisなど)、Escherichia属(大腸菌など)、Pseudomonas属、Streptomyces属、Salmonella属およびEnvinia属からの細胞が含まれるが、これらに限定されない。適切な真核細胞は当技術分野で公知であり、例えば、酵母細胞、昆虫細胞および哺乳動物細胞が含まれる。適切な酵母細胞の例には、Kluyveromyces属、Pichia属、Rhino-sporidium属、Saccharomyces属およびSchizosaccharomyces属からの細胞が含まれる。例示的な昆虫細胞には、Sf-9およびHIS(Invitrogen,Carlsbad,Calif.)が含まれ、例えば、Kittsら、Biotechniques,14:810-817(1993);Lucklow,Curr.Opin.Biotechnol.,4:564-572(1993);およびLucklowら、J.Virol.,67:4566-4579(1993)に記載されている。望ましくは、宿主細胞は哺乳動物細胞であり、いくつかの実施形態において、宿主細胞はヒト細胞である。多くの適切な哺乳動物およびヒト宿主細胞が当技術分野で公知であり、多くはアメリカ培養細胞系統保存機関(ATCC、Manassas、Va.)から入手可能である。適切な哺乳動物細胞の例には、チャイニーズハムスター卵巣細胞(CHO)(ATCC番号CCL61)、CHO DHFR細胞(Urlaubら、Proc.Natl.Acad.Sci.USA,97:4216-4220(1980))、ヒト胎児由来腎臓(HEK)293または293T細胞(ATCC番号CRL1573)および3T3細胞(ATCC番号CCL92)が含まれるが、これらに限定されない。他の適切な哺乳動物細胞系は、サルCOS-1(ATCC番号CRL1650)およびCOS-7細胞系(ATCC番号CRL1651)、ならびにCV-1細胞系(ATCC番号CCL70)である。さらなる例示的な哺乳動物宿主細胞には、形質転換された細胞系を含む、霊長類、齧歯類およびヒト細胞系が含まれる。正常な二倍体細胞、初代組織のインビトロ培養に由来する細胞株、ならびに初代外植片も適切である。他の適切な哺乳動物細胞系には、マウス神経芽細胞腫N2A細胞、HeLa、マウスL-929細胞、およびBHKまたはHaKハムスター細胞系が含まれるが、これらに限定されず、これらは全て、ATCCから入手可能である。適切な哺乳動物宿主細胞を選択するための方法、ならびに細胞の形質転換、培養、増幅、スクリーニングおよび精製のための方法は、当技術分野で公知である。
【0060】
本開示は、本明細書に記載のバリアントSaCas9タンパク質を含むCRISPR/Cas系を提供する。本明細書で使用される場合、「CRISPR/Cas系」は、Cas遺伝子、Casタンパク質、tracr(トランス活性化CRISPR)配列(例えば、tracrRNAまたは活性を有する部分的tracrRNA)、cr(CRISPR)配列(例えば、crRNAまたは活性を有する部分的crRNA)をコードする配列またはCRISPR遺伝子座からのその他の配列および転写物を含む、CRISPR関連(「Cas」)遺伝子の発現および/またはその活性の誘導に関わる転写物およびその他の要素を総称する。いくつかの実施形態において、CRISPR系の1またはそれを超える要素は、I型、II型またはIII型のCRISPR系に由来する。いくつかの実施形態において、CRISPR系の1またはそれを超える要素は、Staphylococcus aureusまたはStreptococcus pyogenesなどの内因性CRISPR系を含む特定の生物に由来する。ある特定の実施形態において、Cas9タンパク質は、ベクターとは別個の、ベクターと関連する、またはベクターによってコードされる系中に含まれ得る。したがって、本開示は、(a)宿主細胞中の標的ゲノムDNA配列に相補的なガイドRNA配列であって、前記標的ゲノムDNA配列が少なくとも1つの遺伝子産物をコードする、ガイドRNA配列と、(b)本明細書に記載のバリアントSaCas9タンパク質をコードする核酸配列を含む核酸分子と、を含む系を提供する。他の実施形態において、本開示は、(a)宿主細胞中の標的ゲノムDNA配列に相補的なガイドRNA配列であって、前記標的ゲノムDNA配列が少なくとも1つの遺伝子産物をコードする、ガイドRNA配列と、(b)本明細書に記載のバリアントSaCas9タンパク質と、を含む系を提供する。系がガイドRNA配列とバリアントSaCas9タンパク質をコードする核酸配列とを含む場合、上記のように、ガイドRNA配列およびバリアントSaCas9タンパク質をコードする核酸分子は、異なるベクター中に存在し得る、または同一のベクター中に存在し得る。Cas9タンパク質がベクターとは別個の系に含まれる場合、Cas9タンパク質は、望ましくは、単独でまたはガイドRNA配列を含むベクターと組み合わせて単一の組成物(例えば、薬学的組成物)中に含まれ、物理的または化学的にベクターには結合されない。他の実施形態では、Cas9タンパク質がベクターに物理的にまたは化学的に連結または結合されていれば、Cas9タンパク質とベクターの間で複合体が形成されるように(例えば、Cas9タンパク質とウイルスベクターの間の複合体)、Cas9タンパク質を、ガイドRNA配列を含むベクターと「会合」させ得る。Cas9タンパク質を、当技術分野で公知のタンパク質-タンパク質連結またはタンパク質-ウイルス連結のための任意の適切な方法を使用して、ベクターと会合させることができる。
【0061】
「標的配列」、「標的核酸」および「標的部位」(例えば、「標的ゲノムDNA配列」)という用語は、ガイド配列(例えば、ガイドRNA)がそれに対して相補性を有するように設計されている宿主細胞中のポリヌクレオチド(核酸、遺伝子、染色体、ゲノムなど)を表すために、本明細書で互換的に使用され、標的配列とガイド配列間のハイブリダイゼーションは、結合のために十分な条件が存在すれば、CRISPR複合体の形成を促進する。本明細書で使用される「ゲノム(genomic)」という用語は、細胞内の染色体上に位置する核酸配列(例えば、遺伝子または遺伝子座)を指す。ハイブリダイゼーションを引き起こし、CRISPR複合体の形成を促進するのに十分な相補性が存在すれば、標的配列とガイド配列は完全な相補性を示す必要はない。標的配列は、DNAまたはRNAなどの任意のポリヌクレオチドを含み得る。適切なDNA/RNA結合条件には、細胞中に通常存在する生理学的条件が含まれる。他の適切なDNA/RNA結合条件(例えば、無細胞系における条件)は当技術分野で公知であり、例えば、本明細書で参照され、参照により組み込まれるSambrookを参照されたい。DNAを標的とするRNAに相補的で、該RNAとハイブリッドを形成する標的DNAの鎖は「相補鎖」と呼ばれ、「相補鎖」に相補的である(したがって、DNAを標的とするRNAに対しては相補的でない)標的DNAの鎖は「非相補鎖(noncomplementary strand)」または「非-相補鎖(non-complementary strand)」と呼ばれる。
【0062】
標的ゲノムDNA配列は、望ましくは、遺伝子産物をコードする。本明細書で使用される「遺伝子産物」という用語は、遺伝子の発現から生じる任意の生化学的産物を指す。遺伝子産物はRNAまたはタンパク質であり得る。RNA遺伝子産物には、tRNA、rRNA、マイクロRNA(miRNA)、低分子干渉RNA(siRNA)などの非コードRNA、およびメッセンジャーRNA(mRNA)などのコードRNAが含まれる。いくつかの実施形態において、標的ゲノムDNA配列は、タンパク質またはポリペプチドをコードする。
【0063】
本開示は、宿主細胞中の標的ゲノムDNA配列を改変する方法であって、標的ゲノムDNA配列を含む宿主細胞を、本明細書に記載の系と接触させることを含み、(a)前記ガイドRNA配列は前記宿主細胞中で発現され、前記宿主細胞ゲノム中の前記標的ゲノムDNA配列に結合し、(b)前記バリアントSaCas9タンパク質は前記宿主細胞中で発現され、前記標的ゲノムDNA配列中に二本鎖切断を誘導し、それによって前記宿主細胞中の前記標的ゲノムDNA配列を改変する、方法も提供する。本発明の系に関連して上記したバリアントSaCas9タンパク質、ガイドRNA配列、宿主細胞、標的ゲノムDNA配列およびこれらの構成成分の説明は、宿主細胞中の標的ゲノムDNA配列を改変する方法にも該当し得る。
【0064】
本明細書で使用される「DNA配列を改変する」という句は、関心対象の野生型DNA配列の少なくとも1つの物理的特徴を修飾することを指す。DNAの改変には、例えば、一本鎖または二本鎖DNAの切断、1またはそれを超えるヌクレオチドの欠失または挿入、およびDNA配列の構造的完全性またはヌクレオチド配列に影響を与えるその他の修飾が含まれる。一実施形態において、この方法は、標的DNA配列中に一本鎖または二本鎖切断を導入する。この点で、バリアントSaCas9タンパク質は、標的ゲノムDNA配列内および/または標的配列の相補物(complement)内など、標的DNA配列の一方または両方の鎖の切断を誘導する。いくつかの実施形態において、バリアントSaCas9タンパク質は、標的配列の最初または最後のヌクレオチドから約1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500またはそれを超える塩基対以内で、標的配列の一方または両方の鎖の切断を誘導する。
【0065】
望ましくは、開示された方法は、標的DNA配列の発現をモジュレートするように、すなわち、標的DNA配列の発現が増加または減少するように、宿主細胞内の標的ゲノムDNA配列を改変する。一実施形態において、バリアントSaCas9タンパク質は、宿主細胞の標的DNA配列を切断して、二本鎖DNA切断を生成する。二本鎖切断は、非相同末端結合(NHEJ)または相同組換えのいずれかによって宿主細胞によって修復することができる。NHEJでは、二本鎖切断は、切断端を互いに直接連結することによって修復される。そのため、DNA切断位置中に新たな核酸材料は挿入されないが、一部の核酸材料が失われることがあり得、欠失をもたらす。相同組換え修復では、切断された標的DNA配列の修復のためのテンプレートとして、切断された標的DNA配列に対して相同性を有する別のDNA配列を含むドナー核酸分子が使用され、ドナー核酸分子から標的DNAへの遺伝情報の伝達が生じる。その結果、新たな核酸材料がDNA切断部位中に挿入/コピーされる。NHEJおよび/または相同組換え修復による標的配列の修飾は、例えば、遺伝子修正、遺伝子置換、遺伝子タグ付け、導入遺伝子挿入、ヌクレオチド欠失、遺伝子破壊、遺伝子変異、遺伝子ノックダウンなどをもたらす。
【0066】
いくつかの実施形態において、本明細書に記載の系および方法は、遺伝子中の1またはそれを超える欠陥または変異を修正するために使用され得る(「遺伝子修正(gene correction)」と呼ばれる)。このような事例では、標的ゲノムDNA配列は遺伝子の欠陥のあるバージョンをコードし、CRISPR/Cas系は、該遺伝子の野生型または修正されたバージョンをコードするドナー核酸分子をさらに含む。したがって、言い換えれば、標的ゲノムDNA配列は「疾患関連」遺伝子である。「疾患関連遺伝子」という用語は、その遺伝子産物が、疾患に罹患していない個体から得られた組織または細胞と比較して、疾患に罹患した個体から得られた細胞において異常なレベルでまたは異常な形態で発現される任意の遺伝子またはポリヌクレオチドを指す。疾患関連遺伝子は、異常に高いレベルまたは異常に低いレベルで発現され得、変化した発現は、疾患の発生および/または進行と相関する。疾患関連遺伝子は、その変異または遺伝的変異(genetic variation)が直接的に原因である遺伝子、または疾患の病因に関与する遺伝子(複数可)と連鎖不平衡にある遺伝子も指す。このような「単一遺伝子(single gene)」または「単一遺伝子(monogenic)」疾患の原因となる遺伝子の例には、アデノシンデアミナーゼ、α-1アンチトリプシン、嚢胞性線維症膜貫通コンダクタンス調節因子(CFTR)、β-ヘモグロビン(HBB)、眼皮膚白皮症II(OCA2)、ハンチンチン(HTT)、筋緊張性ジストロフィータンパク質キナーゼ(DMPK)、低密度リポタンパク質受容体(LDLR)、アポリポタンパク質B(APOB)、ニューロフィブロミン1(NF1)、多嚢胞性腎疾患1(PKD1)、多嚢胞性腎疾患2(PKD2)、凝固因子VIII(F8)、ジストロフィン(DMD)、リン酸調節エンドペプチダーゼホモログ、X連鎖性(PHEX)、メチル-CpG結合タンパク質2(MECP2)およびユビキチン特異的ペプチダーゼ9Y、Y連鎖性(USP9Y)が含まれるが、これらに限定されない。他の単一遺伝子(single gene)または単一遺伝子(monogenic)疾患は当技術分野で公知であり、例えば、Chial,H.Rare Genetic Disorders:Learning About Genetic Disease Through Gene Mapping,SNPs,and Microarray Data,Nature Education 1(1):192(2008);Online Mendelian Inheritance in Man(OMIM)(www.ncbi.nim.nih.gov/entrez/query.fcgi?db=OMIM);およびHuman Gene Mutation Database(HGMD)(www.hgmd.cf.ac.uk)に記載されている。別の実施形態において、標的ゲノムDNA配列は、その変異が、他の遺伝子中の変異と相まって特定の疾患に寄与する遺伝子を含むことができる。単純な(すなわち、メンデル)遺伝パターンを欠く、複数の遺伝子の寄与によって引き起こされる疾患は、当技術分野では「多因子性」または「多遺伝子性」疾患と呼ばれている。多因子性または多遺伝子性疾患の例には、喘息、糖尿病、てんかん、高血圧、双極性障害および統合失調症が含まれるが、これらに限定されない。ある特定の発達異常も、多因子性または多遺伝子性パターンで遺伝することがあり得、例えば、口唇裂/口蓋裂、先天性心欠損および神経管欠損が含まれる。
【0067】
別の実施形態において、標的ゲノムDNA配列を改変する方法は、標的配列を切断し、外因的に提供されたドナー核酸分子の非存在下において宿主細胞が切断された配列を修復できるようにすることによって、宿主細胞中の標的配列から核酸を欠失させるために使用することができる。この様式での核酸配列の欠失は、例えば、神経細胞中の疾患を引き起こすトリヌクレオチドリピート配列を除去するために、遺伝子ノックアウトまたはノックダウンを作製するために、および研究において疾患モデルのために変異を生成するためになど、様々な用途において使用することができる。
【0068】
本明細書で論述されているように、バリアントSaCas9タンパク質は、野生型SaCas9タンパク質と比較して、変更されたおよび改善されたPAM特異性を示す。改変されたPAM特異性により、SaCas9バリアントは、現在標的とすることができないゲノム遺伝子座を効率的に破壊することができる。したがって、いくつかの実施形態において、バリアントSaCas9タンパク質は、標的ゲノムDNA配列に隣接して位置する核酸配列NNGRR[T/A/C/G](「N」はグアニン、アデニン、チミンまたはシトシンであり、「R」はグアニンまたはアデニンである。)を含むプロトスペーサー隣接モチーフ(PAM)を含む宿主細胞ゲノムにおいて活性を有する。PAMは、典型的には、標的配列の直後に続くという点で、標的ゲノムDNA配列に「隣接」している。特定のバリアントSaCas9タンパク質によって認識されるPAM配列は、バリアント中に存在する特定のアミノ酸置換に応じて異なる。ある特定の実施形態において、開示されたバリアントSaCas9タンパク質によって認識されるPAMは、核酸配列NNGRRT、NNGRRC、NNGRRAまたはNNGRRGを含む。
【0069】
本明細書に記載の系および方法では、適宜、当技術分野で公知の任意の適切なCRISPR/Cas遺伝子編集系の任意の要素を使用することができる。CRISPR/Cas遺伝子編集技術は、例えば、Congら、前出;Xieら、前出;米国特許出願公開第2014/0068797号;米国特許第8,697,359号;同第8,771,945号;および同第8,945,839号;米国特許出願公開第2010/0076057号;同第2011/0189776号;同第2011/0223638号;同第2013/0130248号;国際公開第2008/108989号;同第2010/054108号;同第2012/164565号;同第2013/098244号;同第2013/176772号;米国特許出願公開第20150050699号;同第20150045546号;同第20150031134号;同第20150024500号;同第20140377868号;同第20140357530号;同第20140349400号;同第20140335620号;同第20140335063号;同第20140315985号;同第20140310830号;同第20140310828号;同第20140309487号;同第20140304853号;同第20140298547号;同第20140295556号;同第20140294773号;同第20140287938号;同第20140273234号;同第20140273232号;同第20140273231号;同第20140273230号;同第20140271987号;同第20140256046号;同第20140248702号;同第20140242702号;同第20140242700号;同第20140242699号;同第20140242664号;同第20140234972号;同第20140227787号;同第20140212869号;同第20140201857号;同第20140199767号;同第20140189896号;同第20140186958号;同第20140186919号;同第20140186843号;同第20140179770号;同第20140179006;および同第20140170753号;Makarovaら、Nature Reviews Microbiology,9(6):467-477(2011);Wiedenheftら、Nature,482:331-338(2012);Gasiunasら、Proceedings of the National Academy of Sciences USA,109(39):E2579-E2586(2012);Jinekら、Science,337:816-821(2012);Carroll,Molecular Therapy,20(9):1658-1660(2012);Al-Attarら、Biol Chem.,392(4):277-289(2011);およびHaleら、Molecular Cell,45(3):292-302(2012)に詳しく記載されている。
【0070】
本開示は、さらに、分子動力学および実験的標的検証を組み合わせた、所望のPAM特異性を有するバリアントCas9タンパク質を生成する方法を提供する。この方法は、(a)1またはそれを超える変異体Cas9タンパク質の所望のPAMへの結合を分子的にシミュレートすることと、(b)(a)の前記シミュレーションにおいて前記所望のPAMに結合する1またはそれを超える変異体Cas9タンパク質を合成的に生成することと、(c)宿主細胞中の標的DNA配列に相補的なガイドRNA配列と組み合わせて、前記宿主細胞中で、前記1またはそれを超える変異体Cas9タンパク質を発現させることであって、前記宿主細胞ゲノムは、前記標的DNA配列および前記所望のPAMを含む、発現させることと、(d)前記もう1つの変異体Cas9タンパク質の切断活性を測定することと、(e)前記所望のPAMに結合し、前記標的DNA配列を切断する1またはそれを超える変異体Cas9タンパク質を選択することであって、それにより、所望のPAM特異性を有するバリアントCas9が生成される、選択することと、を含む。
【0071】
本明細書で使用される「分子動力学(MD)」という用語は、原子および分子の物理的運動を研究するためのコンピュータシミュレーション方法を指す。原子および分子を一定期間相互作用させて、系の動的発展についての視点を与える。実験的研究を補完するMDシミュレーションは、タンパク質とDNAの相互作用を理解する上で効果的であることが証明されている。(Palermoら、Proc.Natl.Acad.Sci.USA,114:7260-7265(2017);およびCongら、Nat.Commun.,3:968(2012))。PAM配列とのCas9結合相互作用を含む、CRISPR/Cas9系の様々な構造的構成成分を探索するための方法は、当技術分野において記載されており、本開示に関連して使用することができる(例えば、Estarellasら、Biochim Biophys Acta,1850(5):1072-1090(2015);Palermoら、J Am Chem Soc.,139(45):16028-16031(2017);Palermoら、ACS Cent Sci.,2(10):756-76(2016);Huaiら、Nat Commun.,8(1):1375(2017);およびWanら、Sci Rep.,9(1):3188(2019)を参照)。本明細書に記載のバリアントSaCas9タンパク質の詳細なMDシミュレーション方法論は、実施例に記載されている。変異体Cas9タンパク質は、本明細書に記載されているものなど、任意の種に由来する任意の適切な野生型Cas9タンパク質に基づき得る、またはこれに由来し得る。
【0072】
いくつかの実施形態において、1またはそれを超える変異体Cas9タンパク質の所望のPAMへの結合を分子的にシミュレートすることは、自由エネルギー摂動(FEP)計算を含む。本明細書で使用される「自由エネルギー摂動」という用語は、分子動力学から自由エネルギー差を計算するための計算化学において使用される統計力学に基づく方法を指す。FEP計算は、タンパク質のインシリコ変異誘発研究のために、ならびにホスト-ゲスト結合エネルギー、pKa予測、反応に対する溶媒効果および酵素反応を研究するために広く使用されている。FEP法は、例えば、Chipot、C.;Pohorille,A.(eds.),Free Energy Calculations,Springer(2007);およびSteinbrecherら、J Mol Biol.,429(7):923-929(2017)に詳しく記載されている。
【0073】
分子動力学的シミュレーションにより、PAM特異性を変化(例えば、改善または拡張)させ得るCas9タンパク質中の潜在的アミノ酸置換の特定が可能となる。したがって、1またはそれを超える変異体Cas9タンパク質の所望のPAM配列への結合を分子的にシミュレートした後に、前記方法は、(a)のシミュレーションにおいて所望のPAM配列に結合する1またはそれを超える変異体Cas9タンパク質を合成的に生成することを含む。1またはそれを超える変異体Cas9タンパク質は、当技術分野で公知の組換えDNA技術および/またはインビトロタンパク質合成方法を使用して合成的に生成され得る(例えば、Sambrookら、前出を参照のこと)。野生型Cas9アミノ酸配列は、Cas9変異体を生成するために、例えば、挿入、欠失および/または置換などの当技術分野で公知の任意の適切な方法によって変異させることができる。例えば、変異は、野生型Cas9タンパク質をコードする核酸配列中に、ランダムにまたは部位特異的に導入され得る。ランダムな変異は、例えば、Cas9テンプレート配列のエラープローンPCRによって生成され得る。部位特異的変異は、例えば、修飾された部位を含む合成されたオリゴヌクレオチドを発現ベクター中に連結することによって導入することができる。あるいは、Walderら、Gene,42:133(1986);Bauerら、Gene,37:73(1985);Craik,Biotechniques,12-19(January 1995);および米国特許第4,518,584号および同第4,737,462号に開示されているようなオリゴヌクレオチド指定部位特異的変異誘発手順を使用することができる。
【0074】
分子動力学シミュレーションによって予測された1またはそれを超えるCas9変異体タンパク質のPAM特異性を評価するために、宿主細胞中の標的DNA配列に相補的なガイドRNA配列と組み合わせて、1またはそれを超える変異体Cas9タンパク質を宿主細胞中で発現させることができ、ここで、宿主細胞ゲノムは標的DNA配列および所望のPAMを含む。本発明の系および核酸配列を改変する方法に関連して上記した宿主細胞、ガイドRNA配列、標的DNA配列およびこれらの構成成分の説明は、バリアントCas9タンパク質を生成する方法にも適用し得る。宿主細胞中で発現されたら、1またはそれを超える変異体Cas9タンパク質の切断活性は、エンドヌクレアーゼ活性を測定するための任意の適切なアッセイを使用して測定することができる。このようなアッセイは、例えば、Ander,C.and M.Jinek,Methods Enzymol.,546:1-20(2014);Maria J.Yebra and Ashok S.Bhagwat,Nucleic Acids Research,21(24):5797-5798(1993);Zhangら、Chem Sci.,7(8):4951-495(2016);およびSeamonら、Anal.Chem.,90(11):6913-6921(2018)に記載されている。本明細書に記載されている操作戦略は、標的とすることが可能なPAMの範囲をさらに多様化するために、任意の野生型もしくは合成Cas9タンパク質またはこれらの誘導体を使用して実行され得る。
【0075】
以下の実施例は、本発明をさらに例示するが、もちろん、その範囲を限定するものと決して解釈されるべきではない。
【実施例】
【0076】
材料および方法
MDシミュレーション
図1Aに示されているように、0.15M NaCl電解質中で溶媒和されている、結合されたDNAありまたはなしのSaCas9-sgRNA複合体に対して、全原子分子動力学(MD)シミュレーションを実行した。タンパク質折り畳み動態を研究するため(Zhouら、Proc.Natl.Acad.Sci.USA,100:13280-13285(2003);Liuら、Nature,437:159-162(2005))、タンパク質-リガンド結合における分子機構を発見するため(Wantら、Proc.Natl.Acad.Sci.USA,109:1937-1942(2012);およびChipot,C.and A.Pohorille,Free Energy Calculations;Springer(2007))、バイオナノ界面での相互作用を調べるため(Geら、Proc.Natl.Acad.Sci.USA,108:16968-16973(2011)、Tuら、Nature Nanotechnol.,8:594-601(2013);Luanら、ACS Nano,9:663-669(2015);Luanら、ACS Nano,11:12615-12623(2017))などに使用された以前のプロトコルに従って、全てのMDシミュレーションおよびFEP計算は、ソフトウェアパッケージNAMD2.11(Phillipsら、J.Comp.Chem.,26:1781-1802(2005))を用いて行った。各エッジが約126.3Åである立方体のウォーターボックス中で複合体(PDB ID:5CZZ)を溶媒和した後、249Na
+と175Cl
-を系中に添加し、複合体の電荷を中和し、イオン濃度を、実験的に検証されたSaCas9の活性条件に対応する0.15Mに設定した(Ranら、Nature,520:186-191(2015))。Mg2+または類似の二価金属イオンはSaCas9中のRuvCおよびHNHドメインのDNA切断活性にとって重要であるが、ヌクレアーゼドメインの活性部位に位置しており、ここに記載されている研究が注目するPAM認識プロセスに結合することも、それに影響を及ぼすこともない。したがって、このシミュレーションには2価イオンは含まれなかった。
図1Aに示されている最終的な系は、206,984原子を含み、10ps間最小化され、NPTアンサンブル(圧力約1barおよび温度約300K)でさらに10ns間平衡化され、骨格内の原子は調和的に拘束されている(ばね定数k=1kcal/mol/Å2)。S9拘束を除去した後、次いで、NPTアンサンブルで系全体をさらに5ns間平衡化し、その後、NVTアンサンブルでプロダクションランを実行した。
【0077】
タンパク質、DNAおよびRNA分子には、CHARMM力場(MacKerellら、J.Phys.Chem.B,102:3586-3616(1998))を適用し、水には、TIP3Pモデル(Jorgensenら、J.Chem.Phys.,79:926-935(1983);Neriaら、J.Chem.Phys.,105:1902-1921(1996))を選択し、イオンには、標準的な力場(Beglov,D.and B.Roux,J.Chem.Phys.,100:9050-9063(1994))を使用した。3つの次元全てに、周期的境界条件(PBC)を適用した。長距離クーロン相互作用は、各次元約1Åのグリッドサイズで、粒子メッシュ・エバルト(PME)完全静電学を使用して計算された。原子間のファンデルワールス(vdW)エネルギーは、スムーズな(10~12Å)カットオフを使用して計算された。水中の全ての酸素原子およびシミュレートされた分子中の骨格原子に対してランジュバンサーモスタット(Allen,M.P.and Tildesley,D.J.,Computer Simulation of Liquids;Oxford University Press:New York(1987))を適用することによって、温度Tを300Kに維持した。Nose-Hoover法(Martinez,T.and K.Schulten,Neur.Netw.,7:507-522(1994))を使用して、圧力を1バールで一定に保った。全ての結合を堅固に保つことを可能にしたSETTLEアルゴリズム(Miyamotoら、J.Comp.Chem.,13:952-962(1992))を用いて、結合したおよび結合していない(例えば、vdW、角度および二面角)相互作用に対しては、シミュレーション時間ステップは2fsであり、電気的相互作用は、複数時間ステップアルゴリズムを使用して4fsごとに計算した(Tuckermanら、The Journal of Chemical Physics,97:1990-2001(1992);およびMorroneら、Journal of Chemical Theory and Computation,6:1798-1804(2010))。
自由エネルギー摂動計算
【0078】
自由エネルギー摂動(FEP)法は、Chipot,C.;Pohorille,A.Free energy calculations;Springer,2007に記載されている。ここでは、複合体の平衡化された結合状態および遊離状態を取得した後、SaCas9上のそれぞれの提案された変異に対して結合自由エネルギーの変化を計算するために、この方法を使用した。
図2Aは、変異R1015Hに関して自由エネルギー差ΔΔGを計算するためにFEP法において使用された熱力学的サイクルを示す。ΔG
AおよびΔG
Bは、それぞれ、野生型SaCas9および変異されたSaCas9に結合しているdsDNAの自由エネルギー変化であり、ΔG
1およびΔG
2は、それぞれ、結合(dsDNAあり)状態および遊離(dsDNAなし)状態で、R1015を消滅させて同時にH1015を作り出すための自由エネルギーの変化である。
【0079】
R1015H変異については、dsDNAの結合自由エネルギー間の差は、次の式によって計算できる。
【数1】
【0080】
一般に、ΔG
AおよびΔG
Bの直接計算は困難であり、代わりにΔG
1およびΔG
2を計算することによって回避することができる(上記式1を参照)。以下のアンサンブル平均(Chipot、前出)から、ΔG
1およびΔG
2は次の式を使用して理論的に計算することができる。
【数2】
【0081】
式中、kBはボルツマン定数であり、Tは温度であり、HiおよびHfは、それぞれ最初(i)および最終(f)の段階のハミルトニアンである。例えば、R1015H変異の場合、最初の状態は野生型SaCas9であり、最終の状態はR1015がH1015に置き換えられた状態である。摂動法を使用して、精度を向上させるために、そのハミルトニアンがH(λ)=λHf+(1-λ)Hiである多くの中間段階(λによって表される)を最初の状態と最終の状態の間に挿入すべきである。ΔG1およびΔG2の計算では、ソフトコアポテンシャルが使用可能な18個の摂動ウィンドウ内で、λは0から1まで変化し、それぞれR1015およびH1015の段階的な消滅および創出過程を生成する。
SaCas9実験
【0082】
実験的アッセイは、エンジニアリング設計または計算シミュレーションに対応する変異または改変を導入するために分子クローニングを用いた元のSaCas9研究からの構築物を使用して行った。使用した骨格ベクターは、Ranら、Nature,520:186-19(2015)に以前に記載されているように、pX601-SaCas9プラスミド(Addgeneから入手可能)であった。簡単に説明すると、オリゴプライマー(IDT DNA)は、SaCas9構築物の望ましい変異を含むDNA断片を増幅するように設計され、テンプレートpX601プラスミドとともにPCR反応で使用された。得られたPCR産物をPCR精製キット(QIAGEN)を使用して精製し、アガロースゲル電気泳動によるさらなる分離に供し、次いで、ゲル抽出キット(QIAGEN)で再度精製した後、下流でのアセンブリ用に正規化した。ベクターの最終的なクローニングは、ギブソンアセンブリ法を使用して実行され、プラスミドを単離するために細菌に形質転換された。Sanger Sequencing(Genewiz)によって全てのプラスミドを確認し、細胞形質移入実験のために保存した。
【0083】
哺乳動物細胞でのSaCas9活性を測定するために、FBSおよびGlutaMAX(ThermoFisher)を補充したダルベッコ改変イーグル培地(DMEM)中において、37°Cで、5%CO2を供給したインキュベータ中でヒト胎児腎臓293FT細胞(Thermo Fisher)を維持した。形質移入の約24時間前に、細胞を24ウェルプレート(Corning)中に2.5×105細胞/ウェルの密度で播種し、Lipofectamine 2000(Thermo Fisher)を使用して、メーカーの推奨プロトコルに従って適切な培養密度で形質移入した。24ウェルプレートの各ウェルに対して合計600ngのDNAを使用した。次いで、いつでも回収できるようになるまで細胞をインキュベートした。ゲノム修飾の検出および定量は、例えば、Congら、Science,339:819-823(2013);およびNishimasuら、Cell,162:1113-1126(2015)に記載されているものと同様のワークフローを使用して行われた。簡単に説明すると、形質移入の約72時間後に、段階的インキュベーション法とともにQuickExtract DNA Extraction Solution(Epicentre)を使用して、形質移入された細胞からのゲノムDNAを回収し、その後、前述のようにSURVEYORアッセイを使用してInDel分析を行った(Congら、前出)。全ての標的についてアンプリコンサイズが500~900bpのSURVEYORアッセイ用のプライマーを使用して、標的とされたゲノム領域を増幅した。SURVEYORアッセイでは、精製されたPCR産物は再アニーリングされ、SURVEYORヌクレアーゼ消化に供され、次いで、ポリアクリルアミドゲル電気泳動によって分析および定量された(Congら、前出)。誤差統計を取得するために、アッセイで起こりうる技術的ノイズを考慮して、全ての実験は3連で行った。
実施例1
【0084】
本実施例は、SaCas9複合体の全原子分子動力学シミュレーションを実証する。
【0085】
高解像度SaCas9複合体構造(Nishimasuら、前出)の検査を行った(ただし、結晶接触が局所構造に影響を与え得る。
図2を参照)。天然状態にあるSaCas9複合体の動力学的な詳細を確立するために、分子動力学(MD)法を使用して、生理学的条件下で複合体をモデル化した。実験的研究を補完するMDシミュレーションは、タンパク質-DNA相互作用を理解する上で効果的であることが証明されている(Palermoら、Proceedings of the National Academy of Sciences,114:7260-7265(2017);およびCongら、Nat.Commun.,3:968(2012))。DNA標的のSaCas9-sgRNA複合体との結合の分子機構を特徴づけるために、全原子MDシミュレーションを実施した(
図1Aを参照)。
【0086】
MD分析において、標的DNA基質との結合した状態での平衡化後に(
図3A)、結晶構造に対して計算された飽和二乗平均平方根偏差(RMSD)の平均はいずれも約2.5Åであったので、RNAおよびDNA分子の二次構造は安定していた。同様のプロトコルに従って、結合したDNAがない平衡化された複合体が独立して得られた。大局的に見ると、骨格原子の飽和RMSDは、基質DNAとのSaCas9複合体ではわずか約3.2Åであったが(
図3A)、結晶環境中において隣接するタンパク質からの認識(REC)ローブによって遮断されていない(
図2C)ヌクレアーゼ(NUC)ローブのHNHドメイン(HNHドメインはガイドRNA配列に相補的なDNA鎖を切断する)は、標的DNA鎖上の切断部位の方向に7.6Åの距離を移動し、これは、生理学的プロセスを正確に再現した(
図3C)。同様に、RECローブおよびDNA-RNAヘテロ二本鎖の末端断片は、NUCローブに近づいた(
図3C)。他方、結合したDNAがないSaCas9の場合(
図4)、RMSDは増加して、7.5Åで飽和し、これは、関連するドメインの立体構造の変化がより大きいことを示している。それにもかかわらず、(提案された変異が存在する)DNA結合領域のRMSDは小さいままであった(約3.5Å)(
図4)。これらの観察結果は全て、以前の報告における生化学的および生物物理学的分析と一致している(Sternbergら、Nature,527:110(2015);Jiangら、Science,351:867-871(2016);Dagdasら、Science Advances,3:eaao0027(2017);およびChenら、Nature,550:407(2017))。実験的知見とよく関連する、結合状態と遊離状態の両方から得たこれらの平衡構造を使用して、次いで、SaCas9 PAM認識の分子的基礎を調べ、新規SaCas9バリアントの変異に対して自由エネルギー摂動(FEP)計算を行った(すなわち、インシリコ変異誘発研究)。
【0087】
図1A中で拡大および強調表示されているように、PAM相互作用(PI)ドメイン中の結合部位は、その特異性が改変されたNNGRRT中のGとともに、KKH SaCas9からの3つの残基全て、すなわちE782、N968、R1015を含有する(Kleinstiverら、Nature Biotech.,33:1293-1298(2015))。以下では、PAMの3番目の位置(KKH SaCas9 PAMで変更された塩基)を表すためにG3を使用し、標的DNA鎖上のPAM近位末端における最初のヌクレオチドを表すために、G0を使用した。MDの結果から、全ての鍵となるPAM認識残基の相互作用が結晶構造において観察された。すなわち、それぞれ、R1015はG3に配位し、N985は4番目の位置のAに配位し、R991は、5番目および6番目の位置のAおよびTの両方に動的に配位する(
図3Bを参照)。5番目の位置のA(または、一般的にはR)に配位する上でのR991の役割は、いずれの残基もこのAと接触していない(静的)結晶構造からは得ることができなかった。
【0088】
より細かい細部を間近に見ると、PIドメインの近くに位置するいくつかの鍵となる残基が、結晶内での位置と比較して側鎖位置を調整することが観察された。これは、インビボでの活性状態により類似する環境によるものであり得る。残基対の距離(非水素原子間の最短距離として定義した)を計算することにより、残基E782はK910またはG0のいずれかに近接し得ることが見出され、PAM相互作用に直接関与している可能性があることを示唆した(
図1Bを参照)。他方、柔軟なN968はG3に近かったが、直接接触を形成するほど十分には近接していなかった(
図1Cを参照)。とりわけ、K910は結晶構造では示されない動的配位を形成した。
図1Dは、負に帯電したE782とG3に挟まれたK910の(0nsにおける結晶環境中での)立体構造を示している。しかしながら、K910中の正に帯電したアミン基(NH3+)は、E782のカルボキシル基(COO
-)やG3のリン酸基(PO
4
-1)のいずれとも塩橋を形成しなかった。MDシミュレーション中に、K910はE782に向かって移動し、57ns後にE782と塩橋を形成した(
図1D)。この塩橋は、後に、Na+がこの領域中に拡散した後で破壊された。
図1Dは、80nsで、K910がG3と新しい塩橋を形成し、同時にE782がこのNa+を結合し、標的DNA鎖中のG0のリン酸基をさらに配位してdsDNA結合を安定化することを示している。これらの配位は、基質のない状態では存在せず、SaCas9の強力なPAM認識のための、動的な立体構造遷移の極めて重要な役割をさらに実証する。
実施例2
【0089】
本実施例では、Cas9 PAM認識を探索するための自由エネルギー摂動と実験的アッセイの使用について記載する。
【0090】
系平衡化およびMD分析を完了することによって、これまで正しく評価されていなかったPAM認識の動力学が明らかになり、標的認識へのタンパク質残基の寄与をどのようにして定量的に伝えるかという、ゲノム編集ツールのモデル化における基本的な課題の1つに対処した。この目的のために、構造的な洞察が計算解析を導き、Cas9バリアント活性のさらなる計算マッピングを正しいとする標的化遺伝子編集実験がそれに続く複合的な方法が使用され、そしてそこでは、インシリコ予測は実験的なCas9編集効率と相関し得る。
【0091】
まず、SaCas9 PAM認識へのPIドメイン残基の寄与を、自由エネルギー摂動(FEP)計算を用いて定量した(
図5A)。PAM配列のすぐ近くの残基のアラニンスキャン分析を行った。
図5Bは、変異R991AおよびR1015Aは結合自由エネルギーを有意に低下させたのに対して、N986Aは(ΔΔGの値が小さいために)はるかに重要ではなかったことを示している。変異N985AおよびE993Aも、ΔΔGの約2~4kcal/molの増加をもたらし、PAM結合を不安定にする可能性がある。実験的に、標的化されたアラニン変異を有する対応するSaCas9変異体を生成し、3つの異なるゲノム標的にわたる切断効率として測定されたCas9活性を定量的に評価するために、ガイドRNA(gRNA)とともに発現させた。アラニン変異を導入した後の活性の低下が試験された当該残基の重要性を示すように、野生型Cas9に対する効率を正規化した(
図5C)。次に、計算データと実験データの相関関係を調べるために、
図5C(挿入図)にプロットされているように、各アラニン変異対実験的対応物の変換された活性(野生型対照に対して変異体SaCas9効率の自然対数を取ることによって計算された)からDDGの線形フィッティングを行った。測定された生物学的活性は、0.92に達する適合度によって示されるように、FEP計算とよく一致した(
図5C挿入図)。全体として、これらの結果は、この分子動力学と実験的標的を組み合わせた(COmbined Molecular dynamics and Experimental Target)(「COMET」)検証アプローチの強力な予測可能性を明らかにし、内因性ゲノムコンテキストなどの計算-実験解釈に影響を及ぼし得る、可能性がある非線形因子が示された。
実施例3
【0092】
本実施例では、その拡張されたPAMの分子機構を明らかにするためのKKH SaCas9バリアントの分析について記載する。
【0093】
SaCas9のKKH変異体は、E782K、N968KおよびR1015Hという3つの置換を含む(Kleinstiverら、Nature Biotech.,33:1293-1298(2015))。R1015Hの熱力学的サイクルが
図5Aに図解されている。結合状態では、R1015はG3を2つの水素結合によって結合し、PAM特異性NNGRRTに関与している。この相互作用は、R1015の立体構造的変動を有意に低減することができるE993とR1015間の塩橋によってさらに安定化された。
図5Aに示されるように、同じ塩橋は、SaCas9の遊離状態にも存在する。R1015H変異後、結合状態では、H1015はG3から離れるように移動し、それによってNNGRRT PAM中のG3に対する特異性を解放した。しかしながら、このような変異(
図5Aでは、ΔG1によって表されている)は、結合自由エネルギー(または結合親和性)を有意に低下させた。遊離状態での同じ変異プロセス(
図5Aでは、ΔG2によって表されている)と比較して、結合自由エネルギーの正味の変化は+11.3kcal/molであった(
図3A)。これは結合親和性の有意な低下であり、R1015A変異のΔΔG(約16.9kcal/mol、
図5Bを参照)と比較すると、さらに不利であった。したがって、PAM特異性が低下しているにもかかわらず、SaCas9のPIドメインとdsDNAのPAM領域の間の結合はR1015Hによって不安定化された。これを補い、タンパク質-DNA結合を安定化させるために、以前の研究(Kleinstiverら、前出)では追加の変異(E782KおよびN968K)が導入された。
図1Dに示されているように、E782K変異は、局所的な配位に対して多大な変化を有すると予想された。すなわち、1)K782のNH
3+基は標的DNA鎖中のG0のリン酸基に直接結合し、2)K782によって反発されたK910はG3により安定的に結合する。実際、FEP計算の最終段階において、K910およびK782は、アミンおよびリン酸基によって形成された塩橋を介して、それぞれ、2つの相補的DNA鎖中のG3およびG0に結合され(
図6B)、DNA-タンパク質結合自由エネルギーを有意に増加させることができる。これと一致して、E782K変異の計算されたΔΔGは-13.1kcal/molであり、これは、約1.1kcal/molの計算されたDDGで局所配位(E782-Na
+-G0、
図1D)を不安定化したE782A変異よりもはるかに有利であった(
図6A)。さらに、N968K変異は基質結合を増強することが示唆された(Kleinstiverら、前出)。実験結果と一致して、FEP計算は、この残基変化のΔΔGが約-2.3kcal/molであることを明らかにした(
図6A)。結合状態のFEP分析の最後には、K968中のアミン基とG3中のリン酸基間の静電引力により、K968はPAM配列中のG3に近づくことがあり得る。K910は、G3にも一瞬で結合することがあり得る(
図1D)。したがって、E782Kと比較してN968K変異の自由エネルギーの低下がより小さかったのは、K910とK968間の一時的な静電反発、すなわち、K968とPAMのG3間の結合がより弱いことの結果であった。
【0094】
N968をアラニンに変異させることは、タンパク質-DNA結合に対してほとんど影響がなく(ΔΔG=0.5kcal/mol)、野生型SaCas9でのPAM認識に対するその相対的な中立性が示され、MDシミュレーションから得られた以前の結果を裏付ける(
図1C)。二重変異E782KおよびN968K(KK)は、さらに強力なタンパク質-DNA結合をもたらし、結合自由エネルギーを14.2kcal/mol増加させた(
図6A)。単純な相加的方法によって作用する場合、KK二重変異は、(2つの-ΔΔG値の加算を通じて)少なくとも結合自由エネルギーを15.3kcal/mol増加させると予想された。E782K変異の結果として、K910はPAM配列中のG3に安定的に結合することができる。しかしながら、K968も、同じG3と競合的に相互作用することができる。このため、KK変異の-ΔΔGの変化は、2つの独立した-ΔΔGの変化の単純な加算よりも小さく、これらの変異された残基間での複雑な相互作用を示している 最後に、同時三重変異E782K、N968KおよびR1015H(KKH)は、-3.9kcal/molのΔΔG、すなわち、結合自由エネルギーの正味の増加をもたらした(
図6A)。予想通り、R1015とG3間の特異的結合が解放されると、エントロピー計算によって示されるように、非標的DNA鎖上のPAM領域は、より大きな立体構造の変動を許容された。簡単に説明すると、KKH変異のFEP計算の前(l=0)および後(l=1)に、PAM配列TTGAAT中のトリプレットTGAの立体構造をサンプリングするために、シミュレーション系をさらに2ns間実行した。R1015H変異後には、PAM配列中のヌクレオチドGはPIドメインによる配位がより少なくなり、より大きな変動を有し得ると予想された。KKH変異の前および後の立体構造のエントロピーを計算するためのSchlitter法(Schlitter,J.,Chemical Physics Letters,215:617-621(1993))。結果は、KKH変異によって、トリプレットの立体構造エントロピーが1400J/(mol・K)から1341J/(mol・K)に変化したことを示している。その結果、FEP計算は、K968がT(TTGAAT PAM中のG3の1ヌクレオチド前)のリン酸基に結合することができ、K910がG3に結合することができることを示し、これが、K968とK910間の静電的反発を軽減し、タンパク質-DNA結合の親和性を向上させる(
図6C)。
【0095】
K968とTによって形成される塩橋は水に十分に曝露されており、塩橋の4Å以内に12個の水分子が存在する(
図6C)。しかしながら、K782とG0によって形成される塩橋は、複合体内にかなり埋もれており、塩橋の4Å以内に6つの水分子しか存在しない。このように、誘電環境の相違のため、K968-T塩橋からの結合自由エネルギーの増強は、K782-G0塩橋よりはるかに小さくなり得る(Zhou,R.,Proc.Natl.Acad.Sci.USA,100:13280-13285(2003))。したがって、FEP計算に基づけば、KKH変異は、分析の誤差を考慮に入れると、タンパク質-DNA結合をわずかに増強することしかできなかった(
図6A)。KKH変異の分子機構は、
図3Dに要約されており、E782KおよびN968Kが、PAM中のG3への拘束を取り除くR1015H変異による自由エネルギーの喪失を補うので、そのエネルギー特性を損なうことなくKKH SaCas9の標的化範囲の拡張をもたらす。
【0096】
エネルギー計算に加えて、シミュレーションにより、野生型SaCas9と結合したDNA間の他の全ての配位が保持されていることが明らかになった。例えば、リン酸ロッカー(phosphate locker)T787は、G0(
図6D)と水素結合を形成し、R991は、TTGAAT PAM中のATを配位し、これらはいずれも、標的DNA結合に関与する極めて重要な残基である。
実施例4
【0097】
本実施例は、PAM範囲を拡張するためのCOMETをベースとするSaCas9バリアントのエンジニアリングを記載する。
【0098】
上記KKH SaCas9の分析およびそれが以前の実験と一致したことから、PAM特異性を改変するための新たなSaCas9設計の合理的な探索にCOMETアプローチを拡張した。この目的のために、SaCas9 PAMの残りのゆらぎのない位置、すなわち、遺伝子編集用途における主要な制約であるNNGRRTの最後の(6番目の)T塩基を標的とした。構造の情報および上記のMDシミュレーションから、N986はこのPAM位置に配位するための重要な残基として機能する。したがって、最初の段階として、COMETワークフローを使用してN986に対して様々な変異のスクリーニングを行い、N986を代わりのアミノ酸(タンパク質-DNA相互作用を維持するために、多くは荷電している)に変化させ、一連のFEP計算を行って下流の実験を導いた(
図7A)。自由エネルギーの結果に基づくと、最も有望な候補はN986H/K/R変異体であった。N986A、N986EおよびN986Q変異体のエネルギー予測は好ましくなかったので、これらのバリアントが実験的な試験から除外され得るように、実験上の努力を行った。ここで、Cas9 PAMの特異性を定めるために、標的位置における4つの異なる塩基にわたる編集部位の完全なセット、すなわち、NNGRRT=C=G=Aに対して個々の各変異体を試験しなければならないことを考えると、COMETワークフローは、有意な時間およびコストを節約した。SaCas9 N986H/K/Rバリアントに対する標的化実験によって、それらのPAM認識プロファイルが実際に様々な程度に修飾され、SaCas9 N986Rが単一の最も注目すべき候補であることが明らかになった(
図7B)。野生型と比較すると、SaCas9 N986Rは、非天然のPAMであるNNGRRGをやや好み、NNGRRTに対する活性は減少していたが、6番目のPAM位置における他の塩基のPAM認識活性をほぼ維持していた 予想された通り、単一の変異は強力な新しいバリアントに影響を与えることはできるが、強力な新しいバリアントを十分に作出することはできず、COMETをさらに繰り返して、追加の変異から得られる組み合わせ効果を探索する必要がある。
【0099】
コンビナトリアル変異誘発のためのさらなる標的残基の選択の指針とするために、最も上位にランクされたSaCas9 N986Rバリアントに対して新たなMDシミュレーションモデル化を行って、そのPAM認識プロセスを探索した(
図7C)。残基配位の分子的詳細から、R991は、N986Rに極めて近接して、N986Rとネガティブな様式で相互作用する可能性があるという仮説を立てた。このため、R991上の可能な変異を計算でスクリーニングした後、R991A/L/KバリアントをN986Rと組み合わせて、その非TのPAM認識をさらに強化した。COMETワークフローから得られたこの手掛かりを基にして、これらのコンビナトリアルSaCas9バリアントの最後のPAM位置の塩基選好性を試験するために、DNA標的化アッセイを適用し、同じく野生型参照と比較した。
【0100】
その結果、標的内因性ゲノム配列に対して適用された場合に、異なる標的にわたって若干改善されたNNGRRA PAM結合活性を示したのみならず、NNGRRCおよびNNGRRGの有意に増強された認識を示した非T PAM SaCas9バリアントである別の候補、SaCas9 N986R+R991Lが得られた(
図8参照)。元のSaCas9と比較すると、両バリアントの活性は、以前にはこの小さなCas9に接近できなかった新たなPAM配列の効率的な標的化を初めて可能にし、ヒト細胞において実証されているように、SaCas9の作用の範囲が潜在的に3重または4重に拡張する(
図7D、
図9)。哺乳動物細胞環境内の複数の標的に対して確認されたこれらの有望な結果により、これらの新しいバリアントは、SaCas9-NR(SaCas9 N986Rに対して)およびSaCas9-RL(SaCas9 N986R+R991Lに対して)と名付けられるに至った。これらのSaCas9バリアントは、SaCas9天然PAM中の最後の位置が編集戦略の最適な設計を妨げる疾患関連遺伝子座を標的とするためのCas9ツールのファミリーにおける有望な要素としての役割を果たす。特に、増強のために、SaCas9-NRおよびSaCas9-RLを他の強力なCas9ベースのツールと組み合わせることができることに鑑みると、この拡張は、利用できる小さなCas9ツールの範囲を増加させ得る(Slaymakerら、Science,351:84(2016))。
【0101】
これらの結果は、修飾された特性を有する新規Cas9タンパク質を設計するCOMETの能力を実証した。
実施例5
【0102】
本実施例は、PAM二重鎖とのより強い相互作用を提供し、より高い活性を有するさらなるSaCas9変異体について説明する。
【0103】
エンジニアリング設計または計算シミュレーションに対応する変異または改変を導入するために分子クローニングを使用して、新しいSaCas9バリアントを生成した。使用した骨格ベクターは、前述したとおりのpX601-SaCas9プラスミド(Addgeneから入手可能)であった。簡単に説明すると、オリゴプライマー(IDT DNA)は、SaCas9構築物の望ましい変異を含むDNA断片を増幅するように設計され、テンプレートpX601プラスミドとともにPCR反応で使用された。得られたPCR産物をPCR精製キット(QIAGEN)を使用して精製し、アガロースゲル電気泳動によるさらなる分離に供し、ゲル抽出キット(QIAGEN)で再度精製した後、下流でのアセンブリ用に正規化した。ベクターの最終的なクローニングは、ギブソンアセンブリ法を使用して実行され、プラスミドを単離するために細菌に形質転換された。Sanger Sequencing(Genewiz)によって全てのプラスミドを確認し、細胞形質移入実験のために保存した。
【0104】
哺乳動物細胞でのSaCas9活性を測定するために、FBSおよびGlutaMAX(Thermo Fisher)を補充したダルベッコ改変イーグル培地(DMEM)中において、37°Cで、5%CO2を供給したインキュベータ中でヒト胎児腎臓293T細胞を維持した。形質移入の約24時間前に、細胞を24ウェルプレート(Corning)中に播種し、Lipofectamine 2000(Thermo Fisher)を使用して、メーカーの推奨プロトコルに従って適切な培養密度で形質移入した。24ウェルプレートの各ウェルに対して合計600ng~800ngのDNAを使用した。次いで、いつでも収集できるようになるまで細胞をインキュベートした。
【0105】
さらなる構造および計算解析により、SaCas9のPAM認識活性を改善するための潜在的な候補として、SaCas9タンパク質内に追加のアミノ酸残基が同定された。これらは、本発明者らの既存のバリアントと相乗作用し得ると結論付けられた。実験的に試験されたアミノ酸残基は、N885;K886;L887;N888;A889であった。
図10に示されるように、これらの残基は、標的DNA部位内に位置するPAM二重鎖との比較的短い距離を有する。したがって、2つの上位バリアント:(1)
図10において986Rと表記されているSaCas9-N986R(SaCas9-NR);(2)
図10において986R/991Lと表記されているSaCas9-N986R/R991L(SaCas9-RL)と組み合わせて、さらなるアミノ酸変異を有する新たなSaCas9バリアントを作製した。元の986Rおよび986R/991Lバリアントを、参照として試験に含めた。
【0106】
これらの新たなバリアントでは、
図11に示されているように、より高い結合活性を得るためにPAM二重鎖とのより強く、より有利な相互作用を与えるために、元のアミノ酸残基は高度に帯電した残基に変異された。
実施例6
【0107】
本実施例では、E782、N968に対する変異が、既存のSaCas9バリアントに対して組み合わせ増強を有することを示す追加の構造モデリングと実験について説明する。
【0108】
これまでの一連の変異は、SaCas9タンパク質の追加の分析ならびに変異および試験するべきさらなる残基の提案につながった。これらの新しいアミノ酸残基、すなわちE782およびN968は、標的DNA部位のPAM二重鎖への結合に焦点を当てた実施例5において変異された残基の群(N885;K886;L887;N888;A889)とは構造的に異なる領域に位置している。代わりに、この分析におけるE782およびN968残基は、必ずしもPAM二重鎖に限定されるとは限らないが、SaCas9のその標的DNAとの一般的な結合を潜在的に強化し得る。したがって、これらの残基の変異を本明細書に記載されている他のバリアントと組み合わせることによって、非天然PAM配列を有するDNA標的を結合する能力をさらに強化し、より高い遺伝子編集活性を有するSaCas9-NRおよびSaCas9-RLバリアントの「v2.0」が作出され得る。注目すべきことに、これらの2つの残基は、異なるPAM配列を結合することが以前に示された設計の一部であった(Kleinstiverら、上記)。
【0109】
SaCas9-NRおよびSaCas9-RL変異と組み合わせてE782KまたはN968Kのいずれかを有する変異体は、既存のバリアントを強化することができた。E782K/N986R、N968K/N986R、E782K/N986R/R991L、N968K/N986R/R991Lが、非天然のPAM配列NNGRR[A/C/G]に対してより高い効率を有する最上位のバリアントであった。これらのバリアントは、表1に示されている一連のv2.0 SaCas9バリアントを構成する。
表1
【表1-1】
【表1-2】
【0110】
結合と切断の差(デカップリング)は、結合(
図12)およびゲノム切断/編集(
図13)を測定する試験によって明らかになった。例えば、SaCas9-E782K/N986Rは高い結合活性を有していなかったが、高いゲノム切断活性を示した。他方で、SaCas9-N968K/N986R/R991Lは、標的への結合において優れていたが、ゲノムDNA部位の切断についてはそれほど効率的ではなかった。
【0111】
本明細書に記載されている追加の「v2.0」SaCas9は、結合をベースとした遺伝子活性化/抑制または切断をベースとした遺伝子編集のために使用することができる。最適な結果を得るために、所望の用途に基づいて、特定のSaCas9バリアントが選択され得る。
配列番号1
【化1】
【0112】
本明細書で引用されている刊行物、特許出願、および特許を含む全ての参考文献は、各参考文献が個別にかつ具体的に参照により組み込まれることが示され、その全体が本明細書に記載される場合と同じ程度まで、参照により本明細書に組み込まれる。
【0113】
本発明を記載する文脈における(特に、以下の特許請求の範囲との関係における)用語「a」および「an」および「the」および「少なくとも1つの(at least one)」および類似の指示語の使用は、本明細書に別段の記載がなければまたは文脈上明確に矛盾しなければ、単数形と複数形の両方を包含するものと解釈すべきである。1またはそれを超える項目の列記が後続する用語「少なくとも1つ」(例えば、「AおよびBの少なくとも1つ」)の使用は、列記された項目から選択される1つの項目(AまたはB)を意味する、または本明細書に別段の記載がない限りもしくは文脈上明確に矛盾しない限り、列記された項目の2もしくはそれより多くの任意の組み合わせ(AおよびB)を意味すると解釈すべきである。用語「含む(comprising)」、「有する(having)」、「含む(including)」および「含有する(containing)」は、別段の記載がなければ、非限定的な用語(すなわち、「含むが、限定されない」という意味)として解釈されなければならない。本明細書に別段の記載がなければ、本明細書における値の範囲の記述は、この範囲内に属する各個別の値を個別的に表すことの簡略な方法としての役割を果たすことが単に意図され、各個別の値は、個別的に本明細書に記載されているごとく、本明細書に組み込まれる。本明細書に別段の記載がなければ、または文脈上明らかに矛盾しなければ、本明細書に記載されている全ての方法は、任意の適切な順序で実施することができる。本明細書中に提供されるあらゆる全ての例または例示的な語句(例えば、「など(such as)」の使用は、本発明を単によりよく明らかにすることが意図され、別段の主張がなければ、本発明の範囲に限定を加えるものではない。本明細書中のいずれの語句も、権利主張されていないいずれかの要素が本発明の実施に不可欠であることを示すものと解釈すべきではない。
【0114】
本発明を実施するための本発明者らが知る最良の態様を含む本発明の好ましい実施形態が本明細書に記載されている。前記記載を読めば、これらの好ましい実施形態の変形が当業者に自明なものとなり得る。本発明者らは、当業者が適宜このような変形を利用することを予期し、本発明者らは、本発明が本明細書に具体的に記載されているものとは異なって実施されることを意図する。したがって、本発明は、適法される法によって許容されるところにより、本明細書に添付された特許請求の範囲に記載された主題の全ての改変および均等物を含む。さらに、本明細書に別段の記載がなければ、または文脈上明らかに矛盾しなければ、全ての可能なその変形中での上記要素のあらゆる組み合わせが本発明によって包含される。
【配列表】
【国際調査報告】