(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-02-22
(45)【発行日】2023-03-03
(54)【発明の名称】高忠実度CAS9バリアントおよびそれらの利用
(51)【国際特許分類】
C12N 15/09 20060101AFI20230224BHJP
C12N 15/55 20060101ALI20230224BHJP
C12N 15/63 20060101ALI20230224BHJP
C12N 1/15 20060101ALI20230224BHJP
C12N 1/19 20060101ALI20230224BHJP
C12N 1/21 20060101ALI20230224BHJP
C12N 5/10 20060101ALI20230224BHJP
A01H 5/00 20180101ALI20230224BHJP
A01K 67/027 20060101ALI20230224BHJP
C12N 9/16 20060101ALI20230224BHJP
C07K 19/00 20060101ALI20230224BHJP
A61K 31/7088 20060101ALI20230224BHJP
A61K 48/00 20060101ALI20230224BHJP
A61K 38/46 20060101ALI20230224BHJP
【FI】
C12N15/09 110
C12N15/55 ZNA
C12N15/63 Z
C12N1/15
C12N1/19
C12N1/21
C12N5/10
A01H5/00 A
A01K67/027
C12N9/16 Z
C07K19/00
A61K31/7088
A61K48/00
A61K38/46
(21)【出願番号】P 2019565062
(86)(22)【出願日】2018-02-14
(86)【国際出願番号】 EP2018053717
(87)【国際公開番号】W WO2018149888
(87)【国際公開日】2018-08-23
【審査請求日】2021-02-12
(31)【優先権主張番号】102017000016321
(32)【優先日】2017-02-14
(33)【優先権主張国・地域又は機関】IT
(73)【特許権者】
【識別番号】519295812
【氏名又は名称】ウニヴェルシタ デリ ストゥディ ディ トレント
(74)【代理人】
【識別番号】100092783
【氏名又は名称】小林 浩
(74)【代理人】
【識別番号】100120134
【氏名又は名称】大森 規雄
(74)【代理人】
【識別番号】100103182
【氏名又は名称】日野 真美
(74)【代理人】
【識別番号】100104282
【氏名又は名称】鈴木 康仁
(72)【発明者】
【氏名】チェレゼート,アンナ
(72)【発明者】
【氏名】カッシーニ,アントニオ
(72)【発明者】
【氏名】ペトリス,ジャンルカ
(72)【発明者】
【氏名】インガ,アルベルト
(72)【発明者】
【氏名】オリヴィエリ,ミケーレ
【審査官】藤澤 雅樹
(56)【参考文献】
【文献】国際公開第2016/205613(WO,A1)
【文献】Science (2016) Vol.351, No.6268, pp.84-88
【文献】Nature (2016) Vol.529, pp.490-495, METHODS, Extended Data Figure 1-9 and Table 1
【文献】Human Gene Therapy (2016) Vol.27, No.11, p.A41, OR50
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00
MEDLINE/EMBASE/BIOSIS(STN)
CAplus/REGISTRY(STN)
UniProt/GeneSeq
(57)【特許請求の範囲】
【請求項1】
K526EまたはK526Nの変異を含み、配列番号1に記載のアミノ酸配列に対して少なくとも90%以上の同一性を有するアミノ酸配列を有する、改変Cas9タンパク質であって、ここで、前記変異の位置は、配列番号1に記載の非改変の成熟ストレプトコッカス・ピオゲネス(streptococcus pyogenes)Cas9(SpCas9)におけるアミノ酸番号付けを参照して同定されるものであり、配列番号1に記載の非改変の成熟SpCas9と比較して忠実度が増加している、改変Cas9タンパク質。
【請求項2】
配列番号1に記載のアミノ酸配列に対して少なくとも95%以上の同一性を有するアミノ酸配列を有する、請求項1に記載の改変Cas9タンパク質。
【請求項3】
K526位における前記変異がK526Eである、請求項1または2に記載の改変Cas9タンパク質。
【請求項4】
K526位における前記変異がK526Nである、請求項1または2に記載の改変Cas9タンパク質。
【請求項5】
K377、E387、D397、R400、Q402、R403、F405、D406、N407、A421、L423、R424、Q426、Y430、K442、P449、Y450、V452、A456、R457、W464、M465、K468、E470、T472、I473、T474、P475、W476、F478、K484、S487、A488、M495、T496、N497、F498、L502、N504、K506、P509、Y515、F518、N522、E523、L540、S541、I548、D550、F553、V561、K562、E573、A589、L598、D605、L607、N609、N612、E617、D618、D628、R629、R635、K637、L651、K652、R654、T657、G658、W659、R661、L666、K673、S675、I679、L680、L683、N690、R691、N692、F693、Q695、H698、S701、F704、Q712、G715、Q716、H721、H723、I724、L727、A728、I733、L738、およびQ739から選択される1つ以上のアミノ酸残基位置に位置する1つ以上のさらなる変異をさらに含み、ここで、前記1つ以上のさらなる変異の位置は、配列番号1におけるアミノ酸番号付けを参照して同定される、請求項1~4のいずれか一項に記載の改変Cas9タンパク質。
【請求項6】
前記1つ以上のさらなる変異が、
K377E、E387V、D397E、R400H、Q402R、R403H、F405L、D406Y、D406V、N407P、N407H、A421V、L423P、R424G、Q426R、Y430C、K442N、P449S、Y450A、Y450S、Y450H、Y450N、V452I、A456T、R457P、R457Q、W464L、M465R、K468N、E470D、T472A、I473F、I473V、T474A、P475H、W476R、F478Y、F478V、K484M、S487Y、A488V、M495V、M495T、T496A、N497A、F498I、F498Y、L502P、N504S、K506N、P509L、Y515N、F518L、F518I、N522K、N522I、E523K、E523D、L540Q、S541P、I548V、D550N、F553L、V561M、V561A、K562E、E573D、A589T、L598P、D605V、L607P、N609D、N609S、N612Y、N612K、E617K、D618N、D628G、R629G、R635G、K637N、L651P、L651H、K652E、R654H、T657A、G658E、W659R、R661A、R661W、R661L、R661Q、R661S、L666P、K673M、S675C、I679V、L680P、L683P、N690I、R691Q、R691L、N692I、F693Y、Q695A、Q695H、Q695L、H698Q、H698P、S701F、F704S、Q712R、G715S、Q716H、H721R、H723L、I724V、L727H、A728G、A728T、I733V、L738P、Q739E、Q739PおよびQ739Kから選択される、請求項5に記載の改変Cas9タンパク質。
【請求項7】
前記1つ以上のさらなる変異が、Y450、M495、Y515、R661、N690、R691、Q695、およびH698から選択される1つ以上の位置にある、請求項5に記載の改変Cas9タンパク質。
【請求項8】
前記1つ以上のさらなる変異が、Y450S、M495V、Y515N、R661X、N690I、R691Q、Q695H、およびH698Qから選択され、XがL、QまたはSである、請求項7に記載の改変Cas9タンパク質。
【請求項9】
(a) K526E+Y450Sの変異;
(b) K526E+M495Vの変異;
(c) K526E+Y515Nの変異;
(d) K526E+R661Lの変異;
(e) K526E+N690Iの変異;
(f) K526E+R691Qの変異;
(g) K526E+Q695Hの変異;
(h) K526E+H698Qの変異;
(i) K526E+Y515N+R661Xの変異;
(j) K526E+R661L+H698Qの変異;
(k) K526E+M495V+Y515Nの変異;
(l) K526E+M495V+R661Lの変異;
(m) K526E+M495V+R661X+H698Qの変異;
(n) K526E+M495V+Y515N+R661Xの変異;または
(o) K526E+R403H+N612Y+L651P+K652E+G715Sの変異
を含み、XがL、QまたはSである、請求項7に記載の改変Cas9タンパク質。
【請求項10】
(p) K526E+Y515N+R661Lの変異;
(q) K526E+Y515N+R661Qの変異;
(r) K526E+Y515N+R661Sの変異;
(s) K526E+M495V+R661L+H698Qの変異;
(t) K526E+M495V+R661Q+H698Qの変異;
(u) K526E+M495V+R661S+H698Qの変異;
(v) K526E+M495V+Y515N+R661Lの変異;
(w) K526E+M495V+Y515N+R661Qの変異;または
(x) K526E+M495V+Y515N+R661Sの変異
を含む、請求項9に記載の改変Cas9タンパク質。
【請求項11】
K526E+M495V+Y515N+R661Qの変異を含む、請求項10に記載の改変Cas9タンパク質。
【請求項12】
K526E+M495V+Y515N+R661Sの変異を含む、請求項10に記載の改変Cas9タンパク質。
【請求項13】
K377E、E387V、D397E、R400H、Q402R、R403H、F405L、D406Y、D406V、N407P、N407H、A421V、L423P、R424G、Q426R、Y430C、K442N、P449S、Y450S、Y450H、Y450N、V452I、A456T、R457P、R457Q、W464L、M465R、K468N、E470D、T472A、I473F、I473V、T474A、P475H、W476R、F478Y、F478V、K484M、S487Y、A488V、M495V、M495T、T496A、F498I、F498Y、L502P、N504S、K506N、P509L、Y515N、F518L、F518I、N522K、N522I、E523K、E523D
、L540Q、S541P、I548V、D550N、F553L、V561M、V561A、K562E、E573D、A589T、L598P、D605V、L607P、N609D、N609S、N612Y、N612K、E617K、D618N、D628G、R629G、R635G、K637N、L651P、L651H、K652E、R654H、T657A、G658E、W659R、R661W、R661L、R661Q、R661S、L666P、K673M、S675C、I679V、L680P、L683P、N690I、R691Q、R691L、N692I、F693Y、Q695H、Q695L、H698Q、H698P、S701F、F704S、Q712R、G715S、Q716H、H721R、H723L、I724V、L727H、A728G、A728T、I733V、L738P、Q739E、Q739PおよびQ739Kから選択される少なくとも1つの変異を含む、請求項1に記載の改変Cas9タンパク質。
【請求項14】
(a)M495V+K526N+S541P+K562Eの変異;または
(b)R403H+K526E+N612Y+L651P+K652E+G715Sの変異
を含み、前記変異の位置は配列番号1に記載の非改変の成熟ストレプトコッカス・ピオゲネス(streptococcus pyogenes)Cas9(SpCas9)におけるアミノ酸番号付けを参照して同定される、請求項1または2に記載の改変Cas9タンパク質。
【請求項15】
D10、E762、D839、H840、N863、H983およびD986から選択される位置においてヌクレアーゼ活性を減少させる少なくとも1つのさらなる変異をさらに含む、請求項1~14のいずれか一項に記載の改変Cas9タンパク質。
【請求項16】
D1135、G1218、R1335、T1337から選択される位置においてPAM認識特異性を変更する少なくとも1つのさらなる変異をさらに含む、請求項1~14のいずれか一項に記載の改変Cas9タンパク質。
【請求項17】
ストレプトコッカス・ピオゲネス(S. pyogenes)のCas9タンパク質である、請求項1~16のいずれか一項に記載の改変Cas9タンパク質。
【請求項18】
ストレプトコッカス・ピオゲネス(S. pyogenes)のCas9タンパク質のオルソログである、請求項1~16のいずれか一項に記載の改変Cas9タンパク質。
【請求項19】
請求項1~18のいずれか一項に記載の改変Cas9タンパク質を生成する
インビトロの方法であって、前記改変Cas9タンパク質を1つまたは複数の断片から再構築することを含む、方法。
【請求項20】
請求項1~18のいずれか一項に記載の改変Cas9タンパク質を含有する、タンパク質複合体、リボヌクレオタンパク質(RNP)複合体、混合タンパク質リボヌクレオタンパク質複合体、または脂質複合体。
【請求項21】
請求項1から18のいずれか一項に記載の改変Cas9タンパク質を含む融合タンパク質。
【請求項22】
請求項1から18のいずれか一項に記載の改変Cas9タンパク質をコードする核酸。
【請求項23】
請求項22に記載の核酸を含むベクター。
【請求項24】
請求項1から18のいずれか一項に記載の改変Cas9タンパク質を生成する
インビトロの方法であって、前記改変Cas9タンパク質を請求項22に記載の核酸によって発現することを含む、方法。
【請求項25】
請求項22に記載の核酸または請求項23に記載のベクターを含む細胞、
非ヒト動物または植物。
【請求項26】
遺伝子治療の医薬としての使用のための、請求項22に記載の核酸または請求項23に記載のベクター。
【請求項27】
請求項1~18のいずれか1項に記載の改変Cas9タンパク質、請求項20に記載のタンパク質複合体、リボヌクレオタンパク質(RNP)複合体、混合タンパク質リボヌクレオタンパク質複合体、または脂質複合体、請求項21に記載の融合タンパク質、請求項22に記載の核酸、または請求項23に記載のベクター、および少なくとも1つの薬学的に許容される賦形剤を含む、医薬組成物。
【請求項28】
ゲノム工学、細胞工学、タンパク質発現または他のバイオテクノロジー利用のための、 (i)ガイドRNA(gRNA)と一緒の請求項1~18のいずれか1項に記載の組換え改変Cas9タンパク質、(ii)請求項22に記載の核酸、または(iii)請求項23に記載のベクターの、インビトロでの使用。
【請求項29】
(i)gRNAと一緒の請求項1~18のいずれか1項に記載の組換え改変Cas9タンパク質、(ii)請求項22に記載の核酸、または(iii)請求項23に記載のベクターを含む、キットオブパーツ。
【請求項30】
細胞のゲノムを変更するインビトロでの方法であって、特定のゲノム配列を標的化するガイドRNAと一緒に、請求項1~18のいずれか1項に記載の改変Cas9タンパク質を細胞内で発現させることを含む、方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、酵素および核酸結合タンパク質、特にCas9バリアントの分野に関する。
【背景技術】
【0002】
CRISPR-Cas9システムを含むバイオテクノロジー利用の数は、この新しいゲノム編集ツールのフレキシビリティおよび有効性によって駆り立てられ、ここ数年で大幅に増加している。標的部位は通常、プロトスペーサー配列を含む、標的核酸に相補的な、いわゆる「ガイドRNA」(gRNA)配列を通して、Cas9によって認識される。標的認識は、短い隣接するPAM(プロトスペーサー隣接モチーフ)配列の存在も必要とする。標的核酸は通常DNAであるが、ある環境下ではRNAであってもよい。ガイドRNAは1つまたは複数の小分子RNAによって形成され得る。CRISPR-Cas9手法によるゲノム編集は、様々な細胞型および種に成功裏に利用されており、大きな影響を与える革新的な技術を特徴づける有効性および頑強性をはっきりと実証する。重要なことに、基礎研究および治療に向けた利用のどちらも、効果は別として、編集のための高い標的化特異性を必要とする。しかしながら、いくつかの研究は、ゲノムのCas9切断はいつも意図した部位に向かうわけではなく、望まない損傷が、選択した標的と異なるレベルの類似性を共有するDNA領域に導入され得ることを示した。さらに、現象を決定する簡単なルールがないため、そのような望まない活性の予測は困難であり、信頼できないことが多い。さらに、オフターゲット効果の評価はいつも簡単なわけではなく、異なる方法を利用して得られた結果は一致しないことが多い。したがって、CRISPR-Cas9ツールキットの特異性の増強は、全ての利用分野、特にヒト治療利用におけるその安全な使用を可能にするこの主要技術の非常に望ましい改善である。
【0003】
ストレプトコッカス・ピオゲネス(化膿性連鎖球菌:streptococcus pyogenes)Cas9(SpCas9)細胞内レベルの厳格なコントロール、標的配列に相補性がより低い短いプロトスペーサーによって特徴づけられる工学的に操作されたgRNA(トランケートgRNA)の導入、その結合または対のSpCas9ニッカーゼおよびFokIエンドヌクレアーゼドメインに融合した対の触媒的に不活性なSpCas9の利用を方向付けるSpCas9の特異的DNA結合ドメインへの融合のような、CRISPR-Cas9による望まないオフターゲット変異の導入を減らすために異なる戦略が提案されている。しかしながら、これらの手法はオフターゲットが無いものはなく、それらの固有な分子の複雑性により、オンターゲット活性を欠損していることが多い。
【0004】
近年、2つのグループが、オフターゲット部位を切断する低い傾向によって特徴づけられるSpCas9バリアントの構造情報に基づく合理的な工学的作製を報告した。
【0005】
Slaymaker et al. (Science. 2016, 351(6268):84-8)は、効率(野生型レベルに近いオンターゲット挿入-欠損(インデル)形成)および特異性(EMX(1)およびVEGFA(1)オフターゲット部位、特異性アッセイのための標準的な遺伝子座での検出可能なインデル形成無し)の両方が高い3つのSpCas9変異体を生成した:SpCas9(K855A)、SpCas9(K810A/K1003A/R1060A)[eSpCas9(1.0)とも呼ばれる]、およびSpCas9(K848A/K1003A/R1060A)[eSpCas9(1.1)とも呼ばれる]。
【0006】
Kleinstiver BP et al. (Nature. 2016, 529(7587):490-5)は、N497A、R661A、Q695A、およびQ926A置換の全ての可能な1ヵ所、2重、3重および4重の組合せを有する15の異なるSpCas9バリアントを生成した。3重変異のバリアント(R661A/Q695A/Q926A)および4重置換のバリアント(N497A/R661A/Q695A/Q926A、以降SpCas9-HF1と呼ぶ)の両方は、4つのミスマッチsgRNAによるほぼバックグラウンドレベルでの最小のEGFP破壊を示した。
【0007】
これらの近年の努力からも、この分野の主な必要性が、オフターゲット活性のないゲノム編集システムの生成であることが明らかである。
【0008】
本発明の目的は、新規の、少なくとも代替えの、高忠実度Cas9バリアントを提供することである。
【発明の概要】
【課題を解決するための手段】
【0009】
本発明の主題は、K377、E387、D397、R400、D406、A421、L423、R424、Q426、Y430、K442、P449、V452、A456、R457、W464、M465、K468、E470、T474、P475、W476、F478、K484、S487、A488、T496、F498、L502、N504、K506、P509、F518、N522、E523、K526、L540、S541、I548、D550、F553、V561、K562、E573、A589、L598、D605、L607、N609、N612、E617、D618、D628、R629、R635、K637、L651、K652、R654、T657、G658、L666、K673、S675C、I679V、L680、L683、N690、R691、N692、F693、S701、F704、Q712、G715、Q716、H723、I724、L727、I733、L738およびQ739からなる群から選択されるアミノ酸残基位置に位置する少なくとも1つの変異を含む、単離した改変Cas9分子であり、ここで、改変アミノ酸配列の位置は、配列番号1によって同定される非改変の成熟ストレプトコッカス・ピオゲネスCas9(SpCas9)の対応位置のアミノ酸番号を参照して同定される。
【0010】
好ましい実施形態では、改変Cas9は、K526位に少なくとも1つの変異を含む。
本発明によるSpCas9バリアントは、まずそのREC1-IIドメインのランダム変異誘発によって得られ、工学的に操作された2つのゲノム標的に対するオンおよびオフターゲット活性を同時に評価することを可能にするイーストベースのアッセイによってオン/オフ比が増加したヒットの同定のためにスクリーニングされた。哺乳動物細胞におけるさらなる検証後、本発明によるCas9バリアントが生成された。驚くべきことに、本発明による改変SpCas9は、野生型SpCas9と比較した場合に、著しく減少したオフターゲット活性を示し、以前に報告された合理的に設計されたバリアントとの比較分析により本発明のSpCas9バリアントの忠実度の著しい改善を実証した。さらに、本発明による、および転写活性化ドメイン(VP64)と融合したさらなるD10AおよびH840A変異を有する改変SpCas9は、D10AおよびH840A変異を含有する野生型Cas9バリアントと比較した場合、著しく減少したオフターゲット活性を示した。
【図面の簡単な説明】
【0011】
【
図1】SpCas9のオンおよびオフターゲット活性を定量するインビボイーストアッセイの設計を示す。
【
図2】野生型SpCas9を使用するyACMO株の検証を示す。
【
図3】ランダムなライブラリー生成のための標的ドメインの選択を示す。
【
図4】高特異性SpCas9バリアントのイーストスクリーニングを示す。
【
図5】哺乳動物細胞において最適化されたSpCas9バリアントの選択を示す。
【
図6】EGFPに対するevoCas9オンターゲット活性を示す。
【
図7】内因性遺伝子座へのevoCas9活性を示す。
【
図8】evoCas9およびSpCas9-HF1特異性の対照比較を示す。
【
図9】標的化ディープシーケンシングによるevoCas9特異性の検証を示す。
【
図10】evoCas9のゲノム全体での特異性を示す。
【発明を実施するための形態】
【0012】
本発明は、Cas9のREC1-IIドメインのランダム変異誘発、ならびに各生成したバリアントのオンおよびオフターゲット活性を同時に評価するイーストベースアッセイを使用するスクリーニングによって得られた特異性の増加した単離したCas9分子を記載する。選択されたヒットは、哺乳動物システムにおけるスクリーニングによってさらに洗練された。
【0013】
本発明の第1の態様では、Cas9バリアントは、K526、K377、E387、D397、R400、D406、A421、L423、R424、Q426、Y430、K442、P449、V452、A456、R457、W464、M465、K468、E470、T474、P475、W476、F478、K484、S487、A488、T496、F498、L502、N504、K506、P509、F518、N522、E523、L540、S541、I548、D550、F553、V561、K562、E573、A589、L598、D605、L607、N609、N612、E617、D618、D628、R629、R635、K637、L651、K652、R654、T657、G658、L666、K673、S675、I679、L680、L683、N690、R691、N692、F693、S701、F704、Q712、G715、Q716、H723、I724、L727、I733、L738およびQ739からなる群から選択されるアミノ酸残基位置に位置する少なくとも1つの変異を含み、ここで、改変アミノ酸配列の位置は、配列番号1によって同定される非改変の成熟ストレプトコッカス・ピオゲネスCas9(SpCas9)の対応位置のアミノ酸番号を参照して同定される。
【0014】
好ましくは、本発明によると、K526位における変異は、K526NおよびK526Eからなる群から選択される;より好ましくはK526Eである。
【0015】
本発明の好ましい実施形態によると、K526変異を有する改変Cas9は、
K377、E387、D397、R400、Q402、R403、F405、D406、N407、A421、L423、R424、Q426、Y430、K442、P449、Y450、V452、A456、R457、W464、M465、K468、E470、T472、I473、T474、P475、W476、F478、K484、S487、A488、M495、T496、N497、F498、L502、N504、K506、P509、Y515、F518、N522、E523、L540、S541、I548、D550、F553、V561、K562、E573、A589、L598、D605、L607、N609、N612、E617、D618、D628、R629、R635、K637、L651、K652、R654、T657、G658、W659、R661、L666、K673、S675、I679、L680、L683、N690、R691、N692、F693、Q695、H698、S701、F704、Q712、G715、Q716、H721、H723、I724、L727、A728、I733、L738、Q739
からなる群から選択されるアミノ酸残基位置に位置する1つまたは複数のさらなる変異を含む。
【0016】
1つまたは複数のさらなる変異は、1~8の間に含まれる数である。
【0017】
好ましくは、1つまたは複数のさらなる変異は、
K377E、E387V、D397E、R400H、Q402R、R403H、F405L、D406Y、D406V、N407P、N407H、A421V、L423P、R424G、Q426R、Y430C、K442N、P449S、Y450A、Y450S、Y450H、Y450N、V452I、A456T、R457P、R457Q、W464L、M465R、K468N、E470D、T472A、I473F、I473V、T474A、P475H、W476R、F478Y、F478V、K484M、S487Y、A488V、M495V、M495T、T496A、N497A、F498I、F498Y、L502P、N504S、K506N、P509L、Y515N、F518L、F518I、N522K、N522I、E523K、E523D、L540Q、S541P、I548V、D550N、F553L、V561M、V561A、K562E、E573D、A589T、L598P、D605V、L607P、N609D、N609S、N612Y、N612K、E617K、D618N、D628G、R629G、R635G、K637N、L651P、L651H、K652E、R654H、T657A、G658E、W659R、R661A、R661W、R661L、R661Q、R661S、L666P、K673M、S675C、I679V、L680P、L683P、N690I、R691Q、R691L、N692I、F693Y、Q695A、Q695H、Q695L、H698Q、H698P、S701F、F704S、Q712R、G715S、Q716H、H721R、H723L、I724V、L727H、A728G、A728T、I733V、L738P、Q739E、Q739PおよびQ739K
からなる群から選択される。
【0018】
好ましい実施形態では、上記の前記変異の総数は1~9の間;好ましくは1~5の間;最も好ましくは1~4の間に含まれる。
【0019】
配列番号1は、SpCas9を指す、受託番号NP_269215(NCBI)を有する配列である。
【0020】
本発明によると、改変ポリペプチドは、変異を除いて、好ましくは配列番号1と少なくとも50%、60%、70%、80%、90%、95%、99%または100%の同一性を有する。
【0021】
2つのポリペプチドまたは核酸配列の間のパーセント同一性は、アライメントソフトウェア(すなわち、BLASTプログラム)を使用して当業者に決定され得る。
【0022】
好ましくは、改変Cas9は、ストレプトコッカス・ピオゲネス(S. pyogenes)Cas9である。いくつかの実施形態では、Cas9は、SpCas9オルソログ(すなわち、ストレプトコッカス・サーモフィルス(S. thermophilus)、黄色ブドウ球菌(スタフィロコッカス・アウレウス:S. aureus)、髄膜炎菌(ナイセリア・メニンギティディス:N. meningitidis))である。いくつかの実施形態では、Cas9オルソログは、SpCas9のRec1-IIドメインと少なくとも10%または25%アミノ酸同一性を有し、SpCas9と10%または25%~100%の間の任意のパーセンテージの完全アミノ酸同一性を有する。当業者は、配列および/または構造アライメントによって改変される適切な相同残基を決定できる。同定したアミノ酸は、以下のグループ内:グリシン、アラニン;バリン、イソロイシン、ロイシン;アスパラギン酸、グルタミン酸、アスパラギン、グルタミン;セリン、スレオニン;リシン、アルギニン;フェニルアラニン、チロシンの置換によって保存的に改変され得る。
【0023】
改変ポリペプチドは、gRNAおよび/または標的DNAもしくはRNAと相互作用する能力を保持する。
【0024】
本発明により、変異X1nnnX2は、nnn位に、野生型ポリペプチド内に存在するアミノ酸X1の代わりにアミノ酸X2が存在することを意味する;したがって、例えば、K526Eは、526位のアミノ酸が、野生型ポリペプチド内に存在するアミノ酸リシン(LysまたはK)の代わりにグルタミン酸(GluまたはE)に相当することを意味する。
【0025】
本発明の好ましい実施形態によると、改変Cas9ポリペプチドは、K526位に変異、およびY450、M495、Y515、R661、N690、R691、Q695、H698;好ましくはM495、Y515、R661、H698からなる群から選択される位置に1つまたは複数のさらなる変異を含む。
【0026】
本発明の好ましい実施形態によると、少なくとも1つのさらなる変異は、Y450S、M495V、Y515N、R661X、N690I、R691Q、Q695H、H698Qからなる群から選択され;好ましくは、M495V、Y515N、K526E、R661X、H698Qからなる群から選択され;ここで、Xは、L、QおよびSからなる群から選択されるアミノ酸であり;好ましくは、XはQまたはSである。
【0027】
本発明の好ましい実施形態によると、改変Cas9ポリペプチドは、K526E+Y450S、K526E+M495V、K526E+Y515N、K526E+R661X、K526E+N690I、K526E+R691Q、K526E+Q695HおよびK526E+H698Qからなる群から選択される2重の変異を含み;ここで、Xは、L、QおよびSからなる群から選択されるアミノ酸であり;好ましくは、XはQまたはSである。
【0028】
本発明の好ましい実施形態によると、上記の改変Cas9ポリペプチドは、M495V+K526E+R661X、Y515N+K526E+R661X、K526E+R661X+H698QおよびM495V+Y515N+K526Eからなる群から選択される3重の変異を含み;ここで、Xは、L、QおよびSからなる群から選択されるアミノ酸であり;好ましくは、XはQまたはSである。
【0029】
本発明の好ましい実施形態によると、上記の改変Cas9ポリペプチドは、M495V+Y515N+K526E+R661XおよびM495V+K526E+R661X+H698Qからなる群から選択される4重の変異を含み;ここで、Xは、L、QおよびSからなる群から選択されるアミノ酸であり;好ましくは、XはQまたはSである。
【0030】
最も好ましいのは、上記の改変Cas9ポリペプチドは、4重の変異M495V+Y515N+K526E+R661Q(以降、evoCas9とも呼ばれる)またはM495V+Y515N+K526E+R661S(以降、evoCas9-IIとも呼ばれる)を含む改変Cas9ポリペプチドである。一態様では、本発明の主題は、K377E、E387V、D397E、R400H、Q402R、R403H、F405L、D406Y、D406V、N407P、N407H、A421V、L423P、R424G、Q426R、Y430C、K442N、P449S、Y450S、Y450H、Y450N、V452I、A456T、R457P、R457Q、W464L、M465R、K468N、E470D、T472A、I473F、I473V、T474A、P475H、W476R、F478Y、F478V、K484M、S487Y、A488V、M495V、M495T、T496A、F498I、F498Y、L502P、N504S、K506N、P509L、Y515N、F518L、F518I、N522K、N522I、E523K、E523D、K526E、K526N、L540Q、S541P、I548V、D550N、F553L、V561M、V561A、K562E、E573D、A589T、L598P、D605V、L607P、N609D、N609S、N612Y、N612K、E617K、D618N、D628G、R629G、R635G、K637N、L651P、L651H、K652E、R654H、T657A、G658E、W659R、R661W、R661L、R661Q、R661S、L666P、K673M、S675C、I679V、L680P、L683P、N690I、R691Q、R691L、N692I、F693Y、Q695H、Q695L、H698Q、H698P、S701F、F704S、Q712R、G715S、Q716H、H721R、H723L、I724V、L727H、A728G、A728T、I733V、L738P、Q739E、Q739PおよびQ739Kからなる群から選択される少なくとも1つの変異を含む、単離した改変Cas9ポリペプチドである。
【0031】
好ましい実施形態によると、本発明は、改変Cas9ポリペプチドであって、
D406Y、W464L、T474A、K526E、N612K、L683Pからなる群から選択される1ヵ所変異;または
R400H+Y450S、D406V+E523K、A421V+R661W、R424G+Q739P、W476R+L738P、P449S+F704S、N522K+G658E、E523D+E617K、L540Q+L607P、W659R+R661W、S675C+Q695LおよびI679V+H723Lからなる群から選択される2重変異;または
K377E+L598P+L651H、D397E+Y430C+L666P、Q402R+V561M+Q695L、N407P+F498I+P509L、N407H+K637N+N690I、Y450H+F553L+Q716H、Y450N+H698P+Q739K、T472A+P475H+A488V、I473F+D550N+Q739E、F478Y+N522I+L727H、K484M+Q695H+Q712R、S487Y+N504S+E573D、T496A+N609D+A728G、R654H+R691Q+H698QおよびR691L+H721R+I733Vからなる群から選択される3重変異;
F405L+F518L+L651P+I724V、L423P+M465R+Y515N+K673M、R457P+K468N+R661W+G715S、E470D+I548V+A589T+Q695H、A488V+D605V+R629G+T657AおよびM495V+K526N+S541P+K562Eからなる群から選択される4重変異;または
R403H+N612Y+L651P+K652E+G715Sからなる群から選択される5ヵ所変異;
E387V+V561A+D618N+D628G+L680P+S701F、R403H+K526E+N612Y+L651P+K652E+G715S、R403H+M495T+N612Y+L651P+K652E+G715S、R403H+L502P+N612Y+L651P+K652E+G715S、R403H+K506N+N612Y+L651P+K652E+G715S、R403H+N612Y+L651P+K652E+N692I+G715Sからなる群から選択される6ヵ所変異;または
R403H+A456T+N612Y+L651P+K652E+G715S+G728T、R403H+F498Y+N612Y+L651P+K652E+R661L+G715S、R403H+Q426R+F478V+N612Y+L651P+K652E+G715Sからなる群から選択される7ヵ所変異;または
R403H+R442N+V452I+N609S+N612Y+R635G+L651P+K652E+F693Y+G715Sからなる群から選択される8ヵ所変異;または
R403H+R457Q+F518I+N612Y+R635G+L651P+K652E+F693Y+G715Sからなる群から選択される9ヵ所変異
を含む改変Cas9ポリペプチドに関する。
【0032】
好ましくは、本発明によると、改変Cas9ポリペプチドは、Y450S、M495V、Y515N、K526E、R661X、N690I、R691Q、Q695H、H698Qからなる群から選択される少なくとも1つの変異を含み;ここで、Xは、L、QおよびSからなる群から選択され;好ましくは、XはQまたはSである。
【0033】
いくつかの実施形態では、Cas9について同定された前記変異は、これまでに報告された他のCas9ヌクレアーゼバリアント(SpCas9-HF1-4、eSpCas9(1.0)-(1.1.))の特異性を改善するのに好適である。したがって、任意選択により、上記のCas9バリアントは、L169A、K810A、K848A、Q926A、R1003A、R1060A、D1135E残基において1つまたは複数のさらなる変異をさらに含み得る。
【0034】
いくつかの実施形態では、Cas9について同定された前記変異は、他のCas9ニッカーゼ、dCas9-FokIまたはdCas9の特異性を改善するのに好適である。したがって、任意選択により、上記のCas9バリアントは、D10、E762、D839、H840、N863、H983およびD986からなる群から選択される残基において少なくとも1つのさらなる変異をさらに含み、ヌクレアーゼ活性を減少させることができる。好ましくは、そのようなさらなる変異は、D10A、またはD10NおよびH840A、H840NまたはH840Yである。好ましくは、前記変異は、Cas9ニッカーゼまたは触媒的に不活性なCas9をもたらす(Ran F et al. Cell. 2013, 154(6):1380-1389; Maeder M et al. Nature Methods. 2013, 10(10):977-979)。
【0035】
いくつかの実施形態では、Cas9について同定された前記変異は、代替えのPAM配列を認識するCas9ヌクレアーゼバリアントの特異性を改善するのに好適である。したがって、任意選択により、上記のCas9バリアントは、米国特許出願公開第2016/0319260号により、D1135V/R1335Q/T1337R(QVRバリアント)、D1135E/R1335Q/T1337R(EVRバリアント)、D1135V/G1218R/R1335Q/T1337R(VRQRバリアント)、D1135V/G1218R/R1335E/T1337R(VRERバリアント)残基において1つまたは複数のさらなる変異をさらに含み得る。
【0036】
本発明のさらなる主題はまた、他のポリペプチド配列に融合した上記のとおりのバリアントSpCas9タンパク質である。
【0037】
好ましくは、Cas9バリアントはタンパク質タグ(すなわち、V5-タグ、FLAG-タグ、myc-タグ、HA-タグ、GST-タグ、ポリHis-タグ、MBP-タグ)、タンパク質、タンパク質ドメイン、転写モジュレーター、小分子基質に作用する酵素、DNA、RNAおよびタンパク質修飾酵素(すなわち、アデノシンデアミナーゼ、シチジンデアミナーゼ、グアノシルトランスフェラーゼ、DNAメチルトランスフェラーゼ、RNAメチルトランスフェラーゼ、DNAデメチラーゼ、RNAデメチラーゼ、ジオキシゲナーゼ、ポリアデニル酸ポリメラーゼ、プソイドウリジン合成酵素、アセチルトランスフェラーゼ、デアセチラーゼ、ユビキチン-リガーゼ、デユビキチナーゼ、キナーゼ、ホスファターゼ、NEDD8-リガーゼ、脱NEDD化酵素(de-NEDDylase)、SUMO-リガーゼ、脱SUMO化酵素(deSUMOylase)、ヒストンデアセチラーゼ、ヒストンアセチルトランスフェラーゼ、ヒストンメチルトランスフェラーゼ、ヒストンデメチラーゼ)、タンパク質DNA結合ドメイン、RNA結合タンパク質、特異的な生物学的機能を有するポリペプチド配列(すなわち、核局在シグナル、ミトコンドリア局在シグナル、プラスチド局在シグナル、細胞内局在シグナル、不安定化シグナル、ジェミニン破壊ボックスモチーフ)、生物学的係留ドメイン(すなわち、MS2、Csy4およびラムダNタンパク質)をコードするアミノ酸配列に融合される。
【0038】
本発明のさらなる主題は、上記のCas9バリアントを産生する方法であって、前記方法は、その1つまたは複数の断片からCas9バリアントを再構築するステップを含み;好ましくはそれにより、インテインまたはタンパク質イントロンまたは二量体化ドメインがCas9ポリペプチド内に含まれる。
【0039】
いくつかの実施形態では、再構築ステップはインビトロ(in vitro)で実施され得、いくつかの他の実施形態では、それはインビボ(in vivo)で実施され得る(以下を参照)。
【0040】
好ましくは、そのような断片は、split-Cas9の二量体化によって導入され、Cas9タンパク質を再構築することができる(Wright AV et al. PNAS 2015 12(10):2984-9; Liu KI et al. Nat Chem Biol. 2016, 12(11):980-987)。
【0041】
好ましくは、そのような断片は、split-Cas9のインテイン二量体化によって導入され、触媒的に活性なCas9タンパク質を再構築することができる(Truong DJ et al. Nucleic Acids Res 43(13):6450-8)。
【0042】
本発明によると、ベクターは、ヌクレオチドまたはタンパク質配列の送達または発現に好適なシステムである。
【0043】
本発明のさらなる主題は、改変Cas9ポリペプチドを含有する、タンパク質またはリボヌクレオタンパク質複合体または混合タンパク質、リボヌクレオタンパク質および脂質複合体(Cas9-sgRNA複合体、ならびに例えば、限定はされないが、細胞浸透ペプチド、核酸アプタマーおよび脂質小胞などのさらなるタンパク質、核酸または脂質成分とのそれらのコンジュゲーション)でもある。
【0044】
本発明のさらなる主題は、改変Cas9ポリペプチドを含有するタンパク質またはタンパク質リボヌクレオチドベクターである。いくつかの実施形態では、そのようなベクターは天然のまたは人工的な複合体または小胞である(上記を参照)。いくつかの実施形態では、そのようなベクターは、パッケージングまたは放出セルに由来する。いくつかの実施形態では、そのようなベクターは、本発明によるCas9改変ポリペプチドを含有する細胞外小胞ベース構造(すなわち、限定はされないが、エクソソームおよびエクソソーム様構造)、またはウイルス粒子もしくはウイルス様粒子である。
【0045】
本発明のさらなる主題は、上記の改変Cas9ポリペプチドおよびその断片をコードするヌクレオチドの配列である。
【0046】
好ましくは、本発明によると、上記の改変Cas9またはその断片をコードするヌクレオチドの配列は、受託番号NC_002737を有する配列である配列番号2、またはヒト細胞における発現のためのコドン最適化によって得られた、上記の変異に相当する塩基置換を示す配列番号3に基づく。改変Cas9ポリペプチドをコードする本発明のヌクレオチドの配列は、好ましくは、変異を除いて、配列番号2または配列番号3と少なくとも50%、60%、70%、80%、90%、95%、99%もしくは100%の同一性を有する。
【0047】
本発明のさらなる主題は、上記のヌクレオチドの配列を含む核酸である。
【0048】
上記の改変Cas9ポリペプチドを生産する方法は、それにより改変Cas9ポリペプチドが上記の核酸によって発現される。
【0049】
本発明のさらなる主題は、上記の核酸を含むベクターであり;ここで前記ベクターは、原核細胞または真核細胞(例えば、イースト、哺乳動物細胞、昆虫細胞、植物細胞)における遺伝子発現に好適である。好ましくは、ベクターは、限定はされないが、プラスミド、ファージミド、バクテリアもしくはイースト人工染色体、DNAもしくはRNA断片、またはアグロバクテリウム(Agrobacterium)ベースベクター、またはウイルスベクターであってよい。
【0050】
本発明の核酸は、好ましくは、lentiSLiCESによって送達され、イタリア特許出願第102016000102542号に記載のとおり自己制御回路によってさらなる特異性を可能にする。本発明の核酸は、好ましくは、レトロウイルスベクター、EIAVベクター、SIVベクター、アデノウイルスベクター、AAVベクター、ヘルペスベクター、バキュロウイルスベクター、ワクシニアウイルスベクター、センダイウイルスベクターまたはバクテリオファージによって送達される。好ましくは、バクテリオファージベクターは、λファージ、M13ファージ、またはP1ファージに基づく。
【0051】
本発明のさらなる主題は、上記のヌクレオチドの配列の断片を含む核酸である。
【0052】
好ましくは、上記のヌクレオチドの配列の断片を含む2つまたはそれ以上の異なる核酸によってコードされる翻訳されたポリペプチドを、インビトロまたはインビボで使用して、上記の触媒的に活性なCas9バリアントを再構築できる。
【0053】
好ましくは、Cas9のそのような断片を使用して、異なるウイルスベクター間の組換えを用いることによってDNAレベルでCas9タンパク質発現を再構築できる(すなわち、Wu Z et al. Mol Ther. 2010, 18(1)80-86)。
【0054】
好ましくは、Cas9のそのような断片を使用して、トランススプライシングを用いることによって転写レベルでCas9タンパク質を再構築できる(Fine EJ et al. Sci Rep. 2015, 5:10777)。
【0055】
本発明のさらなる主題はまた、上記の核酸もしくはベクターをコードするように工学的に操作された細胞または本発明のCas9バリアントによって恒的に改変された細胞である。
【0056】
好ましくは、工学的に操作された細胞は、原核細胞、より好ましくはバクテリアである。
【0057】
好ましくは、工学的に操作された細胞は、真核細胞である。好ましくは、工学的に操作された細胞は、動物細胞である。好ましくは、工学的に操作された細胞は、哺乳動物細胞である。より好ましくは、工学的に操作された細胞は、ヒト細胞である。好ましくは、工学的に操作された細胞は、体細胞であり、より好ましくは、腫瘍細胞であり、最も好ましくは幹細胞または人工多能性幹細胞である。
【0058】
本発明のさらなる主題はまた、上記の核酸またはベクターをコードするように工学的に操作された動物、または本発明のCas9バリアントによって恒久的に改変された動物である。好ましくは、動物はモデル生物であり(すなわち、キイロショウジョウバエ(Drosophila melanogaster)、マウス、蚊、ラット)、または動物は家畜動物もしくは養殖魚もしくはペットである。好ましくは、動物は少なくとも疾患のベクターである。より好ましくは、生物は、ヒト疾患のベクターである(すなわち、蚊、ダニ、トリ)。
【0059】
本発明のさらなる主題は、上記の核酸もしくはベクターを使用して工学的に操作された植物、または本発明のCas9バリアントによって永久に改変された植物である。好ましくは、植物は作物(すなわち、米、大豆、麦、タバコ、綿、アルファルファ、キャノーラ、トウモロコシ、テンサイ)である。
【0060】
本発明のさらなる主題はまた、細胞、動物または植物を恒久的に改変する方法であって、前記方法は、細胞、動物または植物のDNAを編集するための本発明のCas9分子を使用するステップを含む。
【0061】
本発明のさらなる主題はまた、遺伝子治療の医薬としての使用のための、上記のヌクレオチドの配列または核酸またはベクターである。本発明のさらなる主題はまた、上記の配列ヌクレオチドまたは核酸またはベクターおよび少なくとも1つの薬学的に許容される賦形剤を含む医薬組成物である。
【0062】
本発明のさらなる主題はまた、上記の変異を含有する組換えCas9ポリペプチドおよび少なくとも1つの薬学的に許容される賦形剤を含む医薬組成物である。
【0063】
本発明のさらなる主題はまた、ゲノム工学、細胞工学、タンパク質発現または他のバイオテクノロジー利用のための、上記の配列ヌクレオチドまたは核酸またはベクターのインビトロでの使用である。
【0064】
本発明のさらなる主題は、ゲノム工学、細胞工学、タンパク質発現または他のバイオテクノロジー利用のための、gRNAを一緒に用いる、上記の変異を含有する組換えCas9ポリペプチドのインビトロでの使用である。
【0065】
本発明のさらなる主題は、上記のヌクレオチドの配列または核酸またはベクターまたは組換えCas9ポリペプチドを含む、同時に、別々に、または順に使用するためのキットオブパーツである。
【0066】
細胞のゲノムを変更するインビトロまたはインビボでの方法であって、この方法は、特定のゲノム配列を標的化するガイドRNAと一緒に、上記の改変Cas9を細胞で発現させることを含む。
【0067】
細胞の転写を変更するインビトロまたはインビボでの方法であって、この方法は、特定のゲノム配列を標的化するガイドRNAと一緒に、上記の改変dCas9ベースの転写調節因子を細胞で発現させることを含む。
【0068】
細胞のエピゲノムを変更するインビトロまたはインビボでの方法であって、この方法は、特定のゲノム配列を標的化するガイドRNAと一緒に、上記の改変dCas9ベースのエピゲノムエディターを細胞で発現させることを含む。
【実施例】
【0069】
本発明は、以下の実験に照らしてより理解される。
【0070】
図1:SpCas9のオンおよびオフターゲット活性を定量するインビボイーストアッセイの設計を示す。イーストレポーター株の生成を示す図である。TRP1およびADE2遺伝子座は、オンターゲット部位(TRP1)または異なるオフターゲット配列(ADE2、配列は右上の箱に報告する)を含有するレポーターカセットの挿入によって改変された。標的の両側の相同領域(HR)の存在は、Cas9による切断時の一本鎖アニーリングによる効果的な修復を可能にする。適切な選択プレートを使用して、2つの遺伝子座の編集状態を追跡することが可能である。コロニーの生存は、TRP1オンターゲット切断を示すが、コロニーの色はADE2オフターゲットの切断の評価を可能にする。
【0071】
図2:野生型SpCas9を使用するyACMO株の検証を示す。TRP1遺伝子座のオンターゲット配列にマッチングするsgRNAを安定に発現するyACMO-オフ1/オフ4レポーター株への野生型(wt) SpCas9によるトランスフォーメーション後の、赤(オンターゲット)および白(オフターゲット)コロニーの平均パーセンテージの定量を示す図である。Cas9発現はプレーティングの24時間前に誘導された。エラーバーは、n=3のs.e.m.を表す。
【0072】
図3:ランダムなライブラリー生成のための標的ドメインの選択を示す。SpCas9ドメインの概略図である。Rec1-IIドメイン(ハイライトした)は、アルファヘリックス認識ローブの一部である。BH:架橋ヘリックス。
【0073】
図4:高特異性SpCas9バリアントのイーストスクリーニングを示す。(a)イーストスクリーニングワークフローを表す概略図である。(b)yACMO-オフ4レポーター株による分析によってイーストスクリーニングから得られたSpCas9バリアントのオンターゲット活性および特異性の評価を示す図である。Cas9発現は、プレーティングの5時間前に誘導された。添付資料の表1を参照。(c)C13バリアントの特異性の評価を示す図である。C13は、オンターゲットのsgRNAを発現するyACMO-オフ1/オフ4レポーター株をトランスフォームし、赤(オンターゲット)および白(オフターゲット)コロニーのパーセンテージがCas9発現の24時間後に評価された。エラーバーは、n=3のs.e.m.を表す。
【0074】
図5:哺乳動物細胞において最適化されたSpCas9バリアントの選択を示す図である。EGFPを安定に発現する293細胞に、オンターゲットsgRNA(sgGFPオン)または各ミスマッチガイドと一緒に優良イースト単離バリアントから得られた変異体の階層的な組合せによって生成された1重および2重(a)ならびに3重(b)の変異体をトランスフェクトした。EGFP蛍光の消失を、トランスフェクション後7日目にFACS分析によって測定した。(c)最良の生成バリアントの以前に報告された変異体との対照比較を示す図である。293細胞株のEGFPノックアウトアッセイを使用して、トップの単離したバリアント(VNEL、VNEQおよびVNESバリアント)の特異性を評価し、それらの性能を以前に報告された高忠実度の変異体と比較した。EGFP蛍光の消失を、トランスフェクション後7日目にFACS分析によって測定した。sgGFP1314はスペーサー配列のPAMから13および14位にミスマッチを含有し;sgGFP1819は18および19位にミスマッチを含有し;sgGFP18は18位に単一のミスマッチを含有する。点線は、示したオン/オフ対について算出したオン/オフターゲット比を示す。破線は、EGFP蛍光のバックグラウンド消失を示す。エラーバーは、n≧2のs.e.m.を表す。
【0075】
図6:EGFPに対するevoCas9オンターゲット活性を示す。(a)EGFP遺伝子座に対するevoCas9活性を示す図である。EGFPを安定に発現する293細胞に、EGFPコード配列の異なる領域を標的化するsgRNAと一緒に、wt SpCas9、evoCas9(VNEQ)またはVNELバリアントをトランスフェクトした。EGFP蛍光の消失を、トランスフェクション後7日目にFACS分析によって測定した。破線は、EGFP蛍光のバックグラウンド消失を示す。エラーバーは、n≧2のs.e.m.を表す。(b)EGFP遺伝子座上で算出したevoCas9およびVNELバリアントのオンターゲット活性の、野生型SpCas9に対する比を示す図である。中央値および四分位範囲が示される。wtタンパク質の70%を超えるオンターゲット活性のレベルは、斜線部によって示される。(c)evoCas9細胞内発現を示す図である。wt SpCas9、evoCas9または他の高忠実度バリアントをトランスフェクトされた293T細胞由来のライセートの代表的なウェスタンブロット。チューブリンをローディングコントロールとして使用した。SpCas9を抗FLAG抗体を使用して検出した。
【0076】
図7:内因性遺伝子座へのevoCas9活性を示す。(a)内因性遺伝子座に対するwt SpCas9、evoCas9およびSpCas9-HF1活性を、293T細胞にトランスフェクトするステップおよびTIDEツールを使用してトランスフェクション後の7日目のインデル形成を測定するステップによって比較した図である。(b)内因性遺伝子座上で算出したevoCas9およびSpCas9-HF1のオンターゲット活性の、野生型SpCas9に対する比を示す図である。中央値および四分位範囲を示す。wtタンパク質の70%を超えるオンターゲット活性のレベルは、斜線部によって示される。エラーバーは、n=2のs.e.m.を表す。
【0077】
図8:evoCas9およびSpCas9-HF1特異性の対照比較を示す。(a)選択した遺伝子座上のevoCas9のオフターゲット活性を示す図である。293T細胞は、FANCF部位2またはCCR5sp11遺伝子座を標的化するsgRNAと一緒に、wt SpCas9、evoCas9またはSpCas9-HF1をトランスフェクトされた。以前に検証された2つのオフターゲット部位におけるインデル形成を、TIDEツールを使用してトランスフェクション後の7日目に評価した。エラーバーは、n=2のs.e.m.を表す。(b)オン/オフ比を、(a)で得られた平均インデルパーセンテージから算出した図である。破線は、1に等しいオン/オフ比を示す。(c)高度に相同なCCR2遺伝子におけるCCR5遺伝子座およびそのオフターゲット部位の概略図である。2つの部位の同時切断は、およそ16kbの染色体欠失を生成する。半定量的PCRを、wt SpCas9、evoCas9またはSpCas9-HF1およびCCR5ガイドRNAをトランスフェクトされた293T細胞のゲノムDNAで実施し、各条件で生成された染色体欠失の量を評価した。FANCF遺伝子座を内部基準(normalizer)として使用した。欠失の量は、ImageJによるデンシトメトリーを使用して定量した。エラーバーは、n=2のs.e.m.を表す。
【0078】
図9:標的化ディープシーケンシングによるevoCas9特異性の検証を示す。EMX1部位1遺伝子座(a)およびVEGFA部位3遺伝子座(b)に対して以前に検証したオフターゲット部位の標的化ディープシーケンシングを、各特異的sgRNAと一緒にwt SpCas9またはevoCas9のいずれかを発現する293T細胞のゲノムDNAに実施した。Cas9を発現しない細胞は、バックグラウンドインデルレベルを決定するためにシーケンスした。3つの生物学的複製物からのゲノムDNAを、ライブラリー調整の前に混合した。
【0079】
図10:evoCas9のゲノム全体での特異性を示す。(a)293T細胞におけるwt SpCas9およびevoCas9両方に実施した、VEGFA部位2遺伝子座に対するオフターゲット部位のGUIDE配列分析を示す図である。黒い四角はオンターゲット部位を示す。(b)wt SpCas9およびevoCas9の検出されたオフターゲット部位の総数を示す図である。3つの生物学的複製物からのゲノムDNAを、ライブラリー調整の前に混合した。
【0080】
図11:evoCas9の転写活性を示す。(a)Tet応答因子(TRE)-EGFPベースの転写活性化因子レポーターの概略図である。dCas9-VP64のTetOリピートへの結合時に、EGFP発現が活性化される。(b)EGFP活性化は、マッチングsgRNA(5’ミスマッチG有りもしくは無しの両方)またはミスマッチガイドと一緒にdCas9またはevo-dCas9ベースの転写活性化因子をトランスフェクトされた293T細胞において測定された。TetO-オフ6はPAMから6位にミスマッチを含有し、TetO-オフ1314は13~14位に2つのミスマッチを含有し、TetO-オフ1819は18~19位に2つのミスマッチを含有する。(c)(b)のデータから算出した非標的化コントロールに関するEGFP発現の活性化倍数を示す図である。エラーバーは、n=2のs.e.m.を表す。EGFP発現を、トランスフェクション後の2日目にFACS分析によって測定した。
【0081】
図12:evoCas9の長期特異性を示す図である。SpCas9(a)、evoCas9(b)およびSpCas9-HF1(c)は、EGFPを安定に発現する293T細胞中でレンチウイルス送達によって安定に発現される。各レンチウイルスベクターは、EGFPコード配列に対するオンターゲットまたは
図5に示す異なるミスマッチガイドのsgRNAを有した。EGFPノックアウトを、グラフに示した時点でのFACS分析によって評価した。形質導入細胞を、ピューロマイシン選択培地中で培養した。エラーバーは、n=2のs.e.m.を表す。
【0082】
Cas9活性の検出のためのレポーターイースト株の設計
サッカロミセス・セレビシエ(Saccaromyces cerevisiae)を、指向進化スクリーニングを開発するための実験モデルとして使用し、高特異性SpCas9バリアントを単離した。イーストベースのアッセイプラットフォームを使用する利点は、一面では、速い倍化速度、単一のクローンを容易に単離する能力および迅速かつ信頼性のあるトランスフォーメーションプロトコールの利用可能性などの、イーストがバクテリアと共有する類似性にあり、別の面ではイーストのDNA編成および代謝が高等真核細胞のものと類似していることにある。したがって、イーストモデルは、スクリーニング結果の頑強性を増大する哺乳動物システムとの類似性と合わせたハイスループットスクリーニングのためのフレキシブルなプラットフォームを提供する。最初は、Cas9オン対オフターゲット活性の同時測定のための栄養要求性レポーターイースト株を生成する戦略が設計された。この手法は、2つのイーストゲノム遺伝子座:TRP1(染色体IV)およびADE2(染色体XV)の改変の試験からなる。delitto perfetto手法を使用することにより、2つの遺伝子座の野生型コード配列は、TRP1遺伝子座の場合にはオンターゲットsgRNAにマッチする特異的標的配列によって分けられ、またはADE2遺伝子座の場合には異なるオフターゲット配列によって分けられた2等分に分割された(
図1に図式化する)。各オフターゲット(ADE2オフ1~オフ4、添付資料の表4)は、PAM配列からの距離が増加した位置で単一のミスマッチを含有した。100bpの重複を標的配列(TRP1またはADE2)の両側に追加し、終止コドンは、2つの相同領域の間のすぐ上流に配置されて、翻訳の早期中断を確実にした(
図1)。レポーターカセット挿入によるTRP1およびADE2遺伝子のノックアウトは、トリプトファンおよびアデニン代謝経路の欠損をもたらし、トリプトファンの非存在下での増殖を抑制し、細胞が低濃度のアデニンで増殖する場合、アデニン生合成の中間産物の細胞液胞における蓄積をもたらし、よってアガープレート上のコロニーに特徴的な赤色の着色を与えた。Cas9によって誘導される二本鎖切断の形成後、各遺伝子座は、2つの隣接している相同領域の存在のおかげで一本鎖アニーリング修復経路を使用してイースト細胞によって効果的に修復され、2つの栄養素の原栄養性への復帰を得ることができる。2つの遺伝子座のそれぞれにおける成功裏の編集イベントは、次に、トリプトファンを欠いた、アデニンを低濃度でのみ含有する適切なレポータープレートを使用して可視化できる(SDluta
5、
図1)。アッセイの完全な読み出しは、2ステッププロセスからなる。最初のステップは、SDluta
5レポータープレートで得られたコロニー数を形質転換体の総数(SDluプレート)のみを選択する場合に得られたものと比較するステップによるオンターゲット切断効率の評価からなる。第2のステップは、オンターゲット活性対オフターゲット活性の評価のためのレポータープレート上で、オンターゲット切断に対応する赤色コロニー(TRP1
+/ADE2
-)およびオフターゲット遺伝子座が編集された白色コロニー(TRP1
+/ADE2
+)の数を数えるステップからなる。4つの潜在的なオフターゲット部位(ADE2オフ1~オフ4)を含有する4つのイースト株が生成され、yACMO-オフ1/オフ4と名付けた。次に、異なるyACMO株のADE2遺伝子座およびTRP1遺伝子座の自然発生的な復帰の割合を見積り、アッセイの読み出しにおける複雑化させる任意の変数の加入を回避した。TRP1遺伝子座の復帰は、実際には、擬陽性クローンの単離をもたらし得るが、ADE2遺伝子の自然発生的な組換えは偽陰性コロニーを生成し得る。本発明者らのアッセイ中に使用した実験条件を近づけるため、4つの株のそれぞれが別々にSpCas9をコードするプラスミドによってトランスフォームされ;選択培地中での24時間インキュベーション後、細胞を選択プレート上に広げ、形質転換体の総数を測定し、1000倍多くの細胞をトリプトファンまたはアデニンを欠損した選択プレート上にプレートし、各遺伝子座の復帰変異体の数を数えた。異なる選択条件下で得られたコロニーの数を比較することにより、TRP1遺伝子座とADE2遺伝子座との両方に関しておよそ1~1.5×10
-5の平均復帰頻度を見積もることができ、したがって自然発生的な復帰が無視できることを示した。
【0083】
yACMOレポーター株の検証
レポーターアッセイの機能性は、野生型SpCas9と組み合わせて4つのレポーター株(yACMO-オフ1/オフ4)を試験することによって検証した。全体的な有効性を最大にするため、SpCas9によるチャレンジの前に、それぞれの株を、TRP1遺伝子座においてオンターゲット配列に完全にマッチングするsgRNA-オンを発現するプラスミドによって安定にトランスフォームした。4つの株は、次いで、ガラクトース誘導性プロモーターによって制御される野生型SpCas9の発現のためのプラスミドによってトランスフォームされ、4時間の回復インキュベーション後、ガラクトース含有培地中で一晩誘導して、SDluおよびレポーターSDluta
5プレートにプレーティングした。これらの実験条件で、本発明者らは100%のオンターゲット切断に一貫して達した。また、オフターゲット活性は、レポータープレート上の白色コロニー(TRP1
+/ADE2
+)のパーセンテージとして測定して、予測した通り、PAM配列からのミスマッチ塩基の距離にしたがって増加した(
図2)。最もPAM遠位の2つのオフターゲット(オフ3およびオフ4)については、SpCas9は、マッチング配列と2つのミスマッチ配列との間を区別することが全くできなかった(
図2)。
【0084】
これらの結果を考慮して、SpCas9バリアントは、忠実度が明らかに増加する変異体を選択するため、最強のオフターゲット配列を含有するyACMO-オフ4株を使用してスクリーニングされた。
【0085】
高特異性SpCas9バリアントのイーストベーススクリーニング
公表された研究(Slaymaker IM et al., Science. 2016, 351(6268):84-8; Kleinstiver BP et al., Nature. 2016, 529(7587):490-5)とは異なり、本発明者らは、バイアスなしの手法は、高忠実度のSpCas9バリアントを得る見込みを増加する重要なアミノ酸置換の単離をもたらし得ると考えた。ランダム変異誘発に好適な標的を見出すため、利用可能な構造データを分析し、どのSpCas9ドメインがそのような種類の相互作用の形成に、より関与し得るか同定した。Cas9のヌクレアーゼローブは、切断活性を維持するために保存されなければならない触媒部位を2つ含有するため、この分析から除外された。Rec1、Rec2および架橋ヘリックスドメインを含有する認識ローブは、gRNA:DNA二量体とのいくつかの接触を生じることが報告されている。さらに、認識ローブは、全体として、II型CRISPRシステムに属する3つのCas9ファミリー全てにわたって最小限の保存領域の1つであり、高い配列可変性を示す。対照的に、架橋ヘリックスは異なるCas9オルソログ中の最も保存された領域の1つであり、その配列はヌクレアーゼ機能に特に重要であることを示唆している。Rec1-Rec2領域は、600アミノ酸超のランダム変異導入に適さない範囲にわたるが、相互作用する残基の大部分はRec1-IIドメインの最後の部分、およそ400~700残基の間に位置する(
図3)。エラープローンPCRによって分子あたりおよそ4~5個の変異を含有するように生成されたREC1-IIバリアントのライブラリーは、変異誘発されたREC1-II断片(適切な相同アームを含有するもの)と、ガラクトース誘導性SpCas9を発現するプラスミド(同領域が事前に除去されたもの)との間の相同組換えを利用して、yACMO-オフ4レポーターのイースト株において直接構築された。全体的なスクリーニングワークフローを
図4aに図式化した。コトランスフォーメーションおよびSDlu培地中での終夜の回復インキュベーションにより相同組換えによるCas9コードプラスミドの修復およびトランスフォームした細胞の選択を可能にした後、培養物はガラクトースを用いて5時間誘導されてSpCas9を発現し、次いでいくつかのSDluta
5レポータープレート上にプレートされた。本発明者らは野生型SpCas9がこの制限された時間間隔でオンターゲット配列を完全に切断できることを観察したため(データは示さない)、誘導時間は、以前の実験に対して短くされ、高オンターゲット活性を維持するバリアントを得た。2日後、複数のコロニーが得られ、赤色コロニーをデキストロースの代わりにガラクトースを含有する新しいレポータープレートにストリークして、SpCas9発現を再活性化し、その発現をオンにしたまま一定に維持して、任意のオフターゲット効果を悪化させた。48時間後、最も赤いストリークからプラスミドを回収し、バクテリア中での増幅後、サンガー法配列決定を行い、REC1-IIドメインに導入された変異を同定した。いくつかのアミノ酸置換が同定され、そのいくつかは、異なる変異の群と組み合わせた変異体のプール中で1回より多く存在した。注目すべきことに、バリエーション尾同じセットを含有する変異体は、回復インキュベーション中に複製した同起源の細胞から誘導されたクローンを表すようである。しかしながら、得られた置換の多様性を考慮すると、この現象はスクリーニングの結果に影響しなかった。次いで、各単離したバリアントを含むyACMO-オフ4株において再チャレンジ実験を実施して、より正確にその切断活性を測定し、野生型SpCas9と比較してそれらの標的を効果的に切断しなかったものを除去して、残りのものを、それらのパラメーターおよびオフターゲット部位を区別するそれらの能力にしたがってランク付けした(
図4b)。スクリーニングの結果をさらに検証するため、得られたバリアントの1つ(C13バリアント)の特異性を、4つのyACMOレポーター株全てをチャレンジするステップにより、より詳細に評価した。Cas9発現の24時間後、レポータープレート上の白色コロニーおよび赤色コロニーの定量によって、野生型SpCas9と比較した場合にオフターゲット活性が著しく低減されたことが示された(
図4cおよび
図2を比較)。
【0086】
哺乳動物細胞における高忠実度SpCas9バリアントの最適化
オンターゲット切断効率および非特異的活性の減少の両方によるイーストのスクリーニングから単離した優良バリアントに属する置換のプールを選択した。同定した変異体に対して著しく増加した忠実度を得るために、ランダムに生成された各バリアントにおけるいくつかの置換が中間的または有害であり得たと予想されたので、これらの変異の階層的な組合せを企図した。利用可能な構造データによる各置換およびsgRNA:DNA二量体の相対位置を最初のフィルタリング基準として用い、変異の最初のサブセットを同定した。さらに、標的DNA配列のよりPAM遠位の部分(nt.17~20)と接触するREC1-IIドメインの末端に位置する置換の立体構造クラスターが注目を集めた。したがって、このクラスターに属する変異は、これまでにsgRNA:DNA二量体との相互作用が報告されていなかったとしても選択された。特に、K562E変異体から出発して変異を順次追加することが決定され、これをイーストアッセイにおいて特によく実施した(
図4c)。とりわけ、K562E変異は、上述のREC1-IIドメインに含まれる(
図3)。
【0087】
EGFPを安定に発現するレポーター細胞株(293multiGFP)を使用して、二重の変異体のオンターゲット活性(sgGFPオン)を、EGFPコード配列へのフレームシフト変異によって誘導された蛍光の消失を測定することによって試験した。並行して、PAMトリヌクレオチドから遠位の1つまたは2つ(sgGFP18の18位およびsgGFP1819の18~19位)のミスマッチ塩基のsgRNAへの導入後、当該部位の切断を回避する能力を評価した。野生型SpCas9は、マッチおよびミスマッチsgRNAの両方によってガイドされた場合、等しい効率で標的配列を切断し、EGFP
+細胞の同じパーセンテージ減少をもたらしたという観察から確かめられるように、これらの代用オフターゲット配列を区別することができなかった(
図5a)。初回の選択後、最良の置換を、EGFPレポーター細胞系のチャレンジを繰り返すために使用した3重の変異体に組み合わせた(
図5b)。次いで、最終回の選択を、前の回の最良の置換を組み合わせることによって4重の変異体(VNELバリアント)を生成した後に実施した。さらに、PAMにより近位の領域に2つのミスマッチを含有する別のsgRNA(13および14位、sgGFP1314)を試験して、VNELバリアントの忠実度の観察された増加が全スペーサー配列にわたる変異に保存されたことを実証した。VNELバリアントは、全てのミスマッチガイドRNAに関してEGFP蛍光のロスほとんどまたはまったく誘導せず、これは、PAMから18位の単一の置換を含有するsgRNA(sgGFP18)での特に目立つ結果であった。一方で、特異性のこの強い増加は、オンターゲット活性における小さいけれども測定可能な減少をもたらした(約20%減少、
図5c)。この問題に取り組むため、VNELバリアントの2つの代替えの誘導体(VNEQおよびVNESバリアント)を合理的設計によって生成し、同じEGFPノックアウトアッセイを使用して試験した。予測されたように、オフターゲット活性のわずかな増加と並行して、オンターゲット切断効率の完全な回復が観察された。全体的に、VNEQバリアント変異体は最良のオン/オフターゲット比を示した(
図5c)。
【0088】
4重変異体(VNEL、VNEQ、VNESバリアント)の、上記のEGFPレポーター細胞系を使用する、以前に公表された高忠実度バリアントSpCas9-HF1およびeSpCas9(1.1)との対照比較により忠実度の明白な増加を明らかにした。このことは、18位に単一のミスマッチを含有するsgRNAを使用して特に明らかである。この特別な代用のオフターゲットに関して、VNEL、VNEQおよびVNESバリアントを、本実験によるとeSpCas9(1.1)よりもずっと良好にミスマッチ部位をすでに識別していたSpCas9-HF1と比較する場合、非特異的な切断においておよそ17分の1~4分の1への絶対的な減少が測定された(
図5c)。この観察は、2つの最強の代用のオフターゲット(sgGFP1819およびsgGFP18)に関して算出した異なるSpCas9バリアントのオン/オフターゲット比を分析することによって、さらに確かめられた(
図5cの点線を比較)。次に、EGFPコード配列の異なる領域を標的化することによって、293multiGFPレポーター細胞株を使用してEGFP蛍光の消失を測定して、VNELおよびVNEQバリアントのオンターゲット活性をより詳細に評価した。VNESバリアントは、VNEQ変異体と似た挙動を示したため分析から除外した。先の結果(
図5c)にしたがって、本発明者らはVNEQの活性の野生型レベルを観察し、VNELは、試験した遺伝子座の1つについては活性が著しく落ち、いくつかの部位でわずかに低く働いていた(
図6aおよび6b)。オンターゲット部位およびオフターゲット部位に対して測定された異なる切断挙動が、SpCas9バリアントの細胞内レベルの変更によるものであった可能性を除外するため、野生型SpCas9、VNELおよびVNEQ、ならびに以前に公表された2つの高忠実度バリアントeSpCas9(1.1)およびSpCas9-HF1のタンパク質レベルを、等量の発現プラスミドをトランスフェクトされた293T細胞で分析した。結果によりはっきりと示されたように(
図6c)、タンパク質レベルの大きな差は観察されなかった。これらの結果を考慮して、VNEQバリアントは、本明細書で分析した変異体の中でもほぼ野生型レベルの活性を維持し、EGFP-破壊細胞モデルにおいて非マッチング配列の切断を徹底的に減少させたため、さらに特徴付けを行った。VNEQ変異体をevoCas9(進化したCas9)と名付けた。
【0089】
内因性遺伝子座に対するevoCas9活性
次いで、上記の発見を、内因性遺伝子座を標的化することによってさらに検証した。以前に試験したゲノム標的部位の群は、各遺伝子座におけるevoCas9の切断活性を野生型SpCas9の切断活性と比較するために選択された。さらに、SpCas9-HF1もまた、さらなるベンチマークとして比較に導入された。異なる遺伝子座を標的化するsgRNAと一緒に各SpCas9バリアントによる293T細胞のトランスフェクション後、インデル形成が、各標的部位に対してサンガー法配列決定したアンプリコンについて、トラッキング-オブ-インデル-バイ-デコンポジッション(TIDE)ソフトウェアパッケージを使用することにより分析された(Brinkman EK et al., Nucleic Acids Res. 2014, 42(22):e168)。大部分の遺伝子座に関して、本発明者らは、野生型SpCas9とevoCas9との間の標的化効率の大きな違いは観察せず、evoCas9は概ねわずかに低い活性であり、全体的な平均活性が野生型タンパク質の平均活性の80%であった(
図7aおよび
図7b)。本発明者らは、一つの標的部位であるZSCAN2遺伝子座に関して、非常に弱い切断効率を観察したが、その挙動に関する理解しやすい説明はない(
図7a)。SpCas9-HF1バリアントは、野生型と比較して60%の全体的な平均活性であり、全体的に低い切断効率を示した(
図7aおよび
図7b)。これは、以前に公表された観察(Kleinstiver BP et al., Nature. 2016, 529(7587):490-5)とは一致せず、この不一致は異なる実験手順によるものであり得ると推測できる。これらのデータは、evoCas9が、試験した実験条件下で、内因性遺伝子座のパネルに対してほぼ野生型レベルのオンターゲット活性を維持し、以前に報告されたSpCas9-HF1バリアントに勝ることを実証するものである。
【0090】
evoCas9オフターゲット活性の評価
オンターゲット部位に対する活性と併せて、evoCas9の特異性を、2つの遺伝子座:FANCF部位2およびCCR5 sp11における編集と関連する以前に検証した2つのオフターゲット部位における編集率を確かめることによって測定した。これらの遺伝子座のCas9編集は興味深いものである。なぜなら、FANCF部位2関連オフターゲットは、SpCas9-HF1が特異的なオンターゲット部位と区別できない数少ない非反復性部位の1つであり、一方、CCR5sp11遺伝子座は、AIDS処置におけるその治療利用に価値があるものであり、相同性が高いCCR2遺伝子のオフターゲット切断と相関するためである。293T細胞の一過性トランスフェクション後、これら2つのオフターゲット遺伝子座におけるインデル形成はTIDEを使用して測定され、野生型SpCas9をトランスフェクトした細胞と比較した場合、evoCas9を発現する細胞における切断が著しく減少したことが明らかにされた(
図8a)。さらに、野生型SpCas9、evoCas9およびSpCas9-HF1のオン/オフターゲット比の算出によって、本発明のバリアントがこれら2つの遺伝子座においてその競合物に勝り得ることが確認された(
図8b)。CCR5sp11遺伝子座とCCR2遺伝子中のオフターゲットとの協調的切断により、およそ16キロベースの染色体欠失が生成される(
図8cに図式化した)。この染色体再配置の頻度は、野生型SpCas9、evoCas9またはSpCas9-HF1を、CCR5遺伝子座を標的化するsgRNAと一緒にトランスフェクトした細胞における半定量的PCRによって測定された。特に野生型SpCas9によって編集された細胞において転座イベントが明らかであり、一方、SpCas9-HF1存在下およびevoCas9存在下の両方では欠失がわずかに検出可能なレベルの量まで大きく低減されたことが観察され、evoCas9は、SpCas9-HF1に対して測定される欠失をほぼ2分の1までさらに減少させた(
図8c)。
【0091】
次に、evoCas9が望ましくないゲノム切断を回避する能力を、VEGFA部位3ゲノム部位およびEMX1-Kゲノム部位における編集と関連するオフターゲット部位の選択されたセットに対して標的化ディープシーケンシングを実施することによって調べた。全ての選択部位は、オンターゲット遺伝子座と一緒に編集されることが以前に示された(Kleinstiver BP, et al., Nature. 2015, 523(7561):481-5)。アンプリコンシーケンス手法の利点は、広範囲のいくつかの標的を同時に測定して、大量ではない編集イベントでさえも検出する可能性にある。シーケンスデータの分析は、両ゲノム遺伝子座において高いオンターゲット活性を維持しながら、evoCas9が試験したオフターゲット部位の大部分における編集がバックグラウンドレベルであることによって特徴づけられることを実証した(
図9aおよび9b)。第1のVEGFA部位3オフターゲット部位(VEGFA3-OT1)は、evoCas9編集活性がバックグラウンドを超えることを示す唯一の遺伝子座であった(
図9b)。しかしながら、同じ遺伝子座が野生型SpCas9によりほぼオンターゲット部位として編集され、以前に報告されたSpCas9-HF1バリアントがこの配列の非特異的な切断を完全には抑制できなかったことを考慮しなければならない(Kleinstiver BP et al. Nature., 2016, 529(7587):490-5)。この結果は、この特定の遺伝子座が高度に反復性の性質をもつことによって説明され得ると推測されている。4つのVEGFA部位3オフターゲット部位(VEGFA3-OT1、-OT4、-OT5、-OT7)に関して、著しく高いバックグラウンド編集率は、より壊れやすく、よって変異を蓄積しやすい特定位置のクロマチンの固有の特徴に起因する可能性が高いことを明らかにした(
図9b)。
【0092】
要するに、このデータは、evoCas9が、試験したオフターゲット部位のほとんどで望ましくないゲノム切断を検出できないレベルまで著しく減少することを示している。さらに、選択されたオフターゲット部位の以前に公表されたSpCas9-HF1バリアントとの対照比較によって、ミスマッチ部位を区別する能力の増加が実証された。
【0093】
evoCas9のゲノムワイドな特異性
evoCas9オフターゲット活性のゲノムワイドなレベルでの分析を、以前に確率されたGUIDEシーケンス技術を使用して拡張した(Tsai SQ et al., Nat Biotechnol. 2015, 33(2):187-97)。この手法は、Cas9によって切断された部位に34bpのオリゴヌクレオチドタグを挿入してそれらの捕捉をライブラリー調製および次世代シーケンシングのために可能にすることに基づく。このように、Cas9によって非特異的に標的化される特定のガイドRNAと関連する新規のゲノム部位のコレクションを、公平な様式で同定することが可能である。GUIDEシーケンス分析を実施して、高度に反復性であり、細胞ゲノムに多くの望ましくない切断を生成することが示されているVEGFA部位2遺伝子座の編集と関連するオフターゲット部位を分析した。さらに、過去の報告(Kleinstiver BP et al., Nature. 2016, 529(7587):490-5)は、いくつかの検出されたオフターゲットが依然として高忠実度SpCas9-HF1バリアントによって切断されたことを示した。従って、GUIDEシーケンスライブラリーを、野生型SpCas9またはevoCas9のいずれかをVEGFA部位2sgRNAおよびベイト二本鎖オリゴヌクレオチドと一緒にトランスフェクトした293T細胞のゲノムDNAから調製した。配列決定データを、オープンソースソフトウェアのパイプライン(Tsai SQ et al., Nat Biotechnol. 2016, 34(5):483)を使用して分析し、野生型SpCas9の600の異なるオフターゲット部位が、オンターゲット配列との7つ以下のミスマッチによって特徴づけられることを明らかにした(
図10aおよび
図10b)。注目すべきことに、各特定の部位での実際の切断活性の良い代わりとなることが報告されている(Tsai SQ et al., Nat Biotechnol. 2015, 33(2):187-97)GUIDEシーケンス分析後に得たリードの数によると、およそ100のこれらのオフターゲット配列は、オンターゲット部位よりもより効果的に編集されていた(
図10a)。evoCas9試料について同じ分析を実施した場合、全部で10個の部位のみが検出され、その大部分がオンターゲットと高い類似性を共有し、VEGFA部位2遺伝子座と5未満のミスマッチによって特徴づけられた(
図10a)。evoCas9による高頻度切断を示す分析(オンターゲットより多い)から、1つのオフターゲットのみが明らかになった。これは、おそらくは、その配列が意図した標的から2つのヌクレオチドのみ異なり、各ミスマッチのレベルでシトシンの2つの連続したストレッチを含有し(
図10a)、バルジ部位を形成して非マッチングヌクレオチドに対応可能にしたという、その配列の特定の性質に起因したのであろう。全体的に、上記のGUIDEシーケンス分析は、evoCas9が、細胞ゲノムへの複数のオフターゲットによって特徴づけられる反復性標的配列を使用して試験した場合でさえも、ゲノムワイドなレベルでの非常に高い特異性を保持することを実証した。
【0094】
evo-dCas9ベース転写活性化因子の特異性
Cas9の代替の利用は、そのヌクレアーゼ活性とは独立して、触媒的に不活性なバージョンのCas9(dCas9)を、転写を刺激できる様々なタンパク質ドメインに融合することによって、RNAガイド型転写活性化因子を生成することである。evoCas9の触媒的に不活性な変異体を使用してVP64ベースの転写活性化因子(evo-dCas9)を工学的に作製し、野生型dCas9-VP64活性化因子と並べて試験した。転写活性化は、最小CMVプロモーター内に組み込まれたTetオペレーターエレメントを通してTetRベースのトランス活性化因子によって制御される誘導性EGFP発現ベクターに基づくレポーターシステムを使用することによって試験した。Tetトランス活性化因子は、反復Tetオペレーター配列を標的化するsgRNAによってガイドされるCas9ベースの転写活性化因子で置換した(
図11a)。余分な5’-Gヌクレオチドの存在または不在のみが異なる2つの異なるオンターゲットsgRNAが、レポータープラスミドのTetオペレーター遺伝子座に対して設計され、さらに、1つまたは2つのいずれかの変異をスペーサー配列に沿って異なる位置に有する、同じオンターゲット配列に基づく3つの追加のミスマッチガイドも設計した。マッチングガイドRNAおよびミスマッチガイドRNAの両方に対して、dCas9-VP64と比較してevo-dCas9-VP64を用いると、EGFP発現のより低い絶対レベルが観察された。このことは、野生型dCas9が標的DNAにより強く結合したことを示唆している(
図11b)。しかしながら、野生型dCas9およびevo-dCas9の両方に関して、コントロールsgRNAに対するオンターゲットの活性化倍率は、evo-dCas9で観察された低いバックグラウンド活性化に起因して、類似していた。この結果は、evo-Cas9の非特異的にDNAに結合する傾向がより低いことに起因する可能性がある(
図11c)。興味深いことに、evo-dCas9-VP64によって示された特異性の増加は、dCas9-VP64と比較した場合に控えめであった。このことは、evoCas9が、効率がより低くともミスマッチ標的に結合するが、その場合、切断反応を完了できないことを示唆する(
図11c)。全体的に、これらの結果は、evoCas9が、絶対活性化能力がより低いもののより低いバックグラウンド活性化、およびわずかに増加した活性化忠実度によって特徴づけられる転写制御因子を構築するために利用され得ることを示す。
【0095】
evoCas9の長期特異性
細胞へのCas9の持続的な発現は、オフターゲット活性の増加と関連しているため、調べなければならない重要な問題は、細胞へのevoCas9の長期挙動であった。この点を解決するため、野生型SpCas9、evoCas9またはSpCas9-HF1を、目的のsgRNAと一緒に安定発現させ得るように、レンチウイルス粒子を生成した。高特異性バリアントをスクリーニングするために以前に用いられたものに類似の細胞のEGFPノックアウトモデルを用いるために、EGFPコード配列に対するsgRNAであって、標的遺伝子座に完全にマッチングするsgRNA、またはスペーサー配列の異なる位置に1つまたは複数のミスマッチを含有することによって代用のオフターゲットとして作用するsgRNAのいずれかのsgRNAの同じセットを使用して実験を行った。レポーター細胞株は、等量の異なるレンチウイルスベクターを用いて形質導入された。その培養物を実験の全期間にわたり選択して、形質導入された集団を単離し、編集される細胞の消失または形質導入細胞の適合の減少によって時間内に生じる、編集イベントが希釈化される可能性を回避した。一過性のトランスフェクション実験で観察されたものと同様に、異なる時点でのEGFP蛍光の消失は、野生型SpCas9が、完全にマッチングするsgRNAまたはミスマッチsgRNAのいずれかを用いる場合と類似の有効性で標的配列を切断することを明らかにした(
図12aおよび
図5c参照)。反対に、evoCas9とSpCas9-HF1の両方は、sgGFP1314およびsgGF1819sgRNA(両方とも2重のミスマッチを含有する)を使用すると、EGFPを効果的に切断しなかった(
図12b~c)。注目すべきことに、evoCas9試料に関して蛍光の消失は全ての時点でバックグラウンドレベルであり、一方、SpCas9-HF1発現ベクターによって形質導入された培養物ではEGFP陰性細胞の測定可能な数は経時的に一定のまま存在した(
図12c)。さらに、PAM遠位に単一のミスマッチを含有する最強の代用オフターゲット、sgGFP18を検討する場合、2つのバリアントの挙動は著しく異なった:SpCas9-HF1は、マッチングsgRNAとミスマッチsgRNAとの間を正確に区別することはできず、類似の効率で標的遺伝子座を切断したが、evoCas9は蛍光細胞の消失の増加傾向を示し、形質導入後40日目でのオンターゲットノックアウトの半分より少ないレベルに達した(
図12b~c)。これらのデータは、ガイドRNAの注意深い選択により、本発明の高特異性Cas9バリアントevoCas9が、細胞ゲノム中の切断が制限されヌクレアーゼまたは望まない切断がないヌクレアーゼの長期の発現を可能にすることを示唆する。
【0096】
材料および方法
プラスミドおよび構築物。プラスミドp415-GalL-Cas9-CYC1tを使用して、イーストでCas9を発現させた(Addgeneから取得した、♯43804)(Di Carlo JE, et al., Nucleic Acids Res. 2013, 41(7):4336-43)。制限酵素消化によるREC1-IIドメインの正確な除去を可能にするため、それぞれREC1-IIドメインの上流および下流に、2つの制限部位、NcoIおよびNheIを導入するためにPCRを通して同義の変異を生成した(プライマーについては添付資料の表2参照)。sgRNAの発現カセットは、p426-SNR52p-gRNA.CAN1.Y-SUP4tプラスミドから取得した(Addgeneから取得した、♯43803)(Di Carlo JE, et al., Nucleic Acids Res. 2013, 41(7):4336-43)。オリジナルのスペーサー配列を所望の標的と交換するため、アセンブリー-PCRベース戦略を利用した。sgRNA発現カセットの5’部分を、T3フォワードプライマー(SNR52プロモーターの前にアニーリングする)およびスペーサー配列のすぐ上流にアニーリングし、所望のオンターゲット配列に対応する5’オーバーハングを含有するリバースプライマーを使用してPCR増幅した(添付資料の表2参照)。同じことを、プライマーT7リバースプライマーおよびスペーサー配列のすぐ後にアニーリングし、先に述べたものに逆平行の5’オーバーハングを含有するフォワードプライマーを使用して、sgRNAの3’断片に対して行った。gRNAカセットを得るためのアセンブリー反応は、両方のPCRアンプリコンを混合して、変性、アニーリングおよび伸長の単回ステップその後にT3およびT7の外側プライマーのみを使用する指数的増幅を実施することによって調製した。次いで、得られた断片を、ゲル精製して、SacII/XhoIによって予備消化および平滑末端化したpRS316(ATCC)(URA3イースト選択可能マーカーを有する低コピー数のセントロメアプラスミド(centromeric plasmid))に平滑末端クローニングして、pRS316-SNR52p-gRNA.ON-SUP4tプラスミドを生成した。
【0097】
哺乳動物細胞でのSpCas9の発現のため、本発明者らは、sgRNAコードカセットが除去されている、pX330-U6-Chimeric_BB-CBh-hSpCas9(Addgeneから取得した、♯42230)(Cong L et al., Science. 2013, 339(6121):819-23)由来のプラスミド、pX-Cas9を用いた。Sp-Cas9コード配列は、ヒトコドン最適化されており、CBhプロモーターによって制御される。さらに、2つの核局在シグナル(NLS)がSpCas9のNおよびC末端に追加されており、核移入を可能にし、3重のFLAGをタンパク質のN末端に配置して、検出を容易にしている。改善したCas9バリアントをコードするプラスミドを、pX-Cas9プラスミドから出発し、連続した部位特異的変異誘発によって得た。以前に公表された増強したSpCas9変異体の発現のため、VP12プラスミド(Addgeneから得た、♯72247)(Kleinstiver BP et al., Nature. 2016, 529(7587):490-5)およびeSpCas9(1.1)プラスミド(Addgeneから取得した、♯71814)(Slaymaker IM et al., Science. 2016, 351(6268):84-8)を使用した。所望のスペーサー配列を、適切なオーバーハングを有するアニーリングしたオリゴヌクレオチドとして、U6プロモーター駆動発現カセットを含有するpUC19プラスミドのガイドRNA定常部分上流の2つのBbsI部位にクローニングした。レンチウイルスベクターを含む実験のため、lentiCRISPRv1送達ベクター(Addgeneから取得した、♯49535)(Cong L et al., Science. 2013, 339(6121):819-23)を、pCMV-delta8.91パッケージングベクター(Didier Trono、EPFL、スイスからご厚意によりいただいた)および水疱性口内炎ウイルス糖タンパク質(VSVG)をコードするpMD2.G(Addgeneから取得した、♯12259)と一緒に用いてウイルス粒子を産生した。lentiCRISPRv1送達ベクターは、2Aペプチドを介してピューロマイシンコード配列と融合した、ヒト化コドン型のN末端FLAG-タグ化SpCas9のための発現カセットを含有し、形質導入細胞の選択を可能にする。U6駆動発現カセットはsgRNAを転写する。所望のスペーサーに相当するアニールしたオリゴを、2つのBsmBI部位を使用してガイドRNAにクローニングした。SpCas9コード配列の一部分を、変異を含有するCDSの領域に相当するPCR断片と交換することにより、増強したSpCas9バリアントをコードするlentiCRISPRv1ベースのベクターを生成した(プライマーについては、添付資料の表2参照)。pTRE-GFPプラスミドを、pEGFP-N1(Clontech)プラスミド由来のEGFPコード配列をpTRE-Tightクローニングベクター(Clontech)にサブクローニングすることによって得た。ガイドRNA標的部位の完全なリストは、添付資料から入手できる。全てのオリゴヌクレオチドをEurofins Genomicsから購入した。
【0098】
イースト培養。yLFM-ICOREイースト株(Richard lggoからご厚意によりいただいた親ylG397株から、本発明者らの研究室の1つが生成した)(Jegga AG et al., Proc Natl Acad Sci U S A. 2008, 105(3):944-9; Tomso DJ et al., Proc Natl Acad Sci U S A. 2005, 102(18):6431-6)を使用して、本研究で使用されるレポーターイースト株を生成した。全てのイースト実験において、合成最少培地(SD)を用いた(アミノ酸を含まないイースト窒素塩基6.7g/L、L-イソロイシン600mg/L、L-バリン150mg/L、L-アデニン200mg/L、L-アルギニン20mg/L、L-ヒスチジン10mg/L、L-ロイシン100mg/L、L-リシン90mg/L、L-メチオニン20mg/L、L-フェニルアラニン50mg/L、L-スレオニン200g/L、L-トリプトファン20mg/L、L-ウラシル20mg/L、L-グルタミン酸100mg/L、L-アスパラギン酸200g/L、L-セリン400mg/L、D-(+)-グルコース20g/L)。選択培地が必要な場合には、実験設定にしたがって単一のアミノ酸を取り除いた。p415-GalL-Cas9-CYC1tの誘導のため、20g/LのD-(+)-ガラクトースおよび10g/LのD-(+)-ラフィノースをデキストロースの代わりに使用した。ADE2変異体のカラースクリーニングのための特定培地を、低濃度のアデニン(5mg/L)を使用して調製した。非選択培地が必要な場合には、YPDA富栄養培地を用いた(イースト抽出物10g/L、ペプトン20g/L、D-(+)グルコース20g/L、L-アデニン200mg/L)。全ての溶液を、ddH2Oを使用して調製し、フィルター滅菌し、4℃で保存した。固体培地を、オートクレーブによる滅菌によって調製し、20g/Lのアガーを溶液に添加した。イースト培地を調製するための全ての化学物質は、Sigma-Aldrichから得た。
【0099】
イーストトランスフォーメーション。トランスフォーメーションの前日、およそ1mm3の所望のイースト株を5mLの富栄養培地または選択合成培地に播種し、200rpmで振盪しながら30℃で終夜増殖させた。次の日、3~5mLの培養物を全部で30mLの同じ培地に播種し、さらに2~4時間200rpm、30℃で増殖した。次いで、細胞を2分間2000×gの遠心分離により回収し、30mLのddH2Oで洗浄し、2分間2000×gで再度遠心分離し、10mLのLiAc/TE 1×(酢酸リチウム0.1MおよびTris 10mM EDTA 1mM、pH7.5)中に再懸濁した。この溶液を、2分間2000×gで再度遠心分離し、適切な容積のLiAc/TE 1×中に再懸濁した(500μL中に100mgのイーストペレット)。トランスフォーメーションミックスは、500ngのプラスミドDNA、前もって超音波処理で切断して10分間100℃でボイルしたキャリアサケ精子DNA5μl(およそ1μg、Sigma-Aldrich)、50μLの再懸濁したイースト培養物、および分子量約36,500のポリエチレングリコール(PEG)(Sigma-Aldrich)をLiAc/TE 1×中で500g/Lに希釈したもの300μLを含有した。ボルテックス後、トランスフォーメーションミックスを30℃で30分間置き、次いで42℃で30分間乾燥浴を使用して熱ショックを与えた。次いで、細胞を、3分間3000×gで遠心分離し、5mLの適切なSD選択培地中に再懸濁または選択SDアガロースプレートに直接プレーティングし、30℃でインキュベートした。自然復帰頻度評価のため、p415-GalL-Cas9-CYC1tによるトランスフォーメーション後の細胞を選択培地中で24時間増殖させた。次いで、細胞の濃度を、OD600を測定することによって評価し、1000個の細胞をロイシン欠失選択プレート(SDl)にプレーティングするか、または106個の細胞をトリプトファン(SDlt)のアデニン(SDla)をさらに欠失するプレートに広げ、復帰変異体の数を評価した。
【0100】
イーストコロニーPCR。およそ1mm3のイーストのコロニーを、49μLのddH2O中に再懸濁することによって、コロニーPCRを実施した。1μLのリティカーゼ(lyticase)(10000U/mL、Sigma-Aldrich)を添加して、細胞壁を消化し、次いで懸濁液を30分間30℃でインキュベートした。細胞をペレットにし、上澄み液を除去し、乾燥ペレットを100℃で10分間ボイルした。次いで、ペレットを50μLのddH2O中に再懸濁し、5μLを、Phusion High-Fidelity DNAポリメラーゼ(Thermo Scientific)を使用するPCR反応の鋳型として使用した。
【0101】
イーストからのプラスミドDNAの回収。イーストから変異体Cas9プラスミドを単離するため、単一コロニーを、ロイシンを含まない5mLのSD培地(SDl)中、200rpmで振盪しながら30℃で終夜増殖させ、p415-GalL-Cas9-CYC1tプラスミドの存在を選択し、一方でガイドRNAプラスミドの選択を緩和して、その希釈および欠損を誘導した。翌日、細胞を5000×gで5分間遠心分離によって回収し、0.1mg/mlのRNase Aを含有する250μlの緩衝液A1に再懸濁した(ヌクレオスピンプラスミド、Macherey-Nagel)。次いで、細胞を、100μLの酸洗浄済みガラスビーズ(Sigma-Aldrich)を添加し、5分間続けてボルテックスすることによって機械的に溶解した。次いで、プラスミドDNAを、製造業者の指示に従って標準的なミニプレップシリカカラム使用して上澄み液から回収した。DNAを、30μLの10mM TrisHCl pH8.5で溶出した。溶出したDNAを、NcoI酵素およびNheI酵素(New England BioLabs)によって消化し、sgRNAベクターを除去して、後者プラスミド由来の夾雑を回避した。このことはアンピシリン耐性によっても選択可能である。消化後、10μLを化学的にコンピテントな大腸菌(E. coli)にトランスフォームさせた。次いで、回収したプラスミドを消化し、それらの同一性を確認し、次いでサンガーシーケンスによってREC1-IIドメインに導入された変異を同定した。
【0102】
改変TRP1およびADE2ゲノムカセットのアセンブリー。ADE2(ADE2-オフ1、ADE2-オフ2、ADE2-オフ3およびADE2-オフ4)およびTRP1(TRP1-オン)ゲノム遺伝子座を工学的に操作するために使用されるDNAカセットは、同様の戦略を使用して構築した。2つの異なるコロニーPCRを実施して、各野生型遺伝子座を2等分して別々に増幅した。前半は、遺伝子CDSの上流のフォワードプライマー、およびそれぞれKpnIまたはBamHI制限部位に続くオンまたはオフ1~4標的配列を含有するリバースオーバーハングプライマーを用いた(添付資料の表3参照)。全てのリバースプライマーは、オン/オフターゲット配列の前に終止コドンを含有し、タンパク質の中断を確実にした。カセットの後半は、ADE2およびTRP1コード配列の下流にアニールするリバースプライマー、ならびにカセットの前半を構築するために使用したリバースプライマーの100bp前にアニーリングするフォワードプライマーを使用してアセンブルした。このようにして、2つの部分が一緒に合わされた場合、最終構築物は、オン/オフターゲット配列の上流および下流に100bp長の相同領域を含有した。さらに、これらのフォワードプライマーは、カセットの前半に対応するリバースプライマー中に存在する同じ制限部位を含有した。したがって、TRP1およびADE2断片は、2等分をKpnIまたはBamHI(New England BioLabs)によって消化してライゲートすることによってアセンブルした。生成物をアガロースゲル上で分離し、ホモライゲーション由来の断片を除去した。最終カセットを、最も外側のプライマーを使用するPCRによって濃縮し、イーストに直接トランスフォームした。
【0103】
イーストレポーター株の生成。delitto perfetto手法は、イーストで特に有効である相同性指向型修復メカニズムの利用を介した一般的な選択システムの実用性により、特定の遺伝子座の遺伝的標的化を可能にする(Stuckey S and Storici F, Methods Enzymol. 2013, 533:103-31)。最初のステップは、目的の特定の遺伝子座における、カウンター選択可能なレポーターI-SceIカセット(COunter selectable REporter I-SceI:CORE-I-SceI)の挿入に在る。カセットは、I-SceIの認識部位、ならびにガラクトース誘導性GAL1プロモーター、耐性遺伝子kanMX4(G418)およびクリベロマイセス・ラクティス(Kluyveromyces lactis)(KIURA3)由来の対抗選択可能なマーカーURA3遺伝子の制御下のエンドヌクレアーゼ自体のコード配列を含有する。CORE-I-SceIカセットを、ADE2遺伝子座およびTRP1遺伝子座の特定のオーバーハングを含有するプライマーによって増幅した(添付資料の表3参照)。同じ手順にしたがって、ADE2遺伝子座から始めて各遺伝子座を続けて編集した。500ngの遺伝子座特異的なCORE-I-SceIカセットをイーストにトランスフォームし、細胞をYPDAプレート上にプレーティングし、30℃で終夜インキュベートした。次の日、コロニーを、200μg/mLのG418(Invivogen)を含有するYPDA培地上にレプリカプレートした。耐性コロニーを、挿入部位に隣接するゲノム配列にアニーリングするプライマーおよびカセットにアニーリングするプライマーを使用するコロニーPCRによって所望の遺伝子座へのカセットの挿入の成功に関してスクリーニングした。標的遺伝子座内にインテグレートされたCORE-I-SceIカセットを、次いで最終編集した配列(TRP1-オン、ADE2-オフ1、ADE2-オフ2、ADE2-オフ3およびADE2-オフ4)と交換し、同じオンターゲット配列および4つの異なるオフターゲットによって特徴づけられる、全部で4つの異なるイースト株を生成した。標的CORE-I-SceIカセットを含有する適切な中間イースト株を、5mLのYPDAに終夜播種した。次の日、トランスフォーメーションの前に、デキストロースの代わりにガラクトースおよびラフィノースを含有する合成培地(SRG)30mL中に、接種菌を再懸濁した。このステップは、COREカセット内に在る標的部位を切断するI-SceIエンドヌクレアーゼの転写を誘導するのに必須である。このDSBは、HR駆動修復イベントの通常の頻度を増加し、所望の新しい配列とのカセットの交換に適している。SRG中で4時間後、イーストを、標準的なトランスフォーメーションプロトコールにしたがって、所望の配列を含有する500ngのHR鋳型によってトランスフォームさせた。形質転換体を、次いで、60mg/Lのウラシルおよび1g/lの5-フルオロオロチン酸(5-FOA)(Toronto Research Chemicals)を含有するSDにプレーティングした。オロチジン5’-リン酸デカルボキシラーゼ(KIURA3によってコードされる)の存在下で5-FOAは、強力なチミジル酸合成酵素阻害剤であるフルオロウラシルに変換される。5-FOA耐性コロニーを、次いで、YPDAおよびG418を補足したYPDAにレプリカプレートし、COREカセットの欠失をさらに選択した。2つのレプリカプレートを比較することにより、陽性クローンに対応するG418感受性FOA耐性コロニーを選択することができる。ゲノム遺伝子座全体の上流および下流にアニールするゲノムプライマーを使用して実施したコロニーPCRは、サンガーシーケンスによって分析され、編集した遺伝子座の配列を確認した。改変TRP1およびADE2遺伝子座を含有する新しく生成されたイースト株は、yACMO-オフ1、yACMO-オフ2、yACMO-オフ3およびyACMO-オフ4と呼ばれ、TRP1遺伝子座の選択されたオンターゲット配列およびADE2遺伝子座の4つの異なるオフターゲット配列によって特徴づけられ、オンターゲット配列に関してそれぞれオフ1はよりPAM近位であり、オフ4はよりPAM遠位である位置に単一のミスマッチを含有する(添付資料の表4参照)。
【0104】
イーストアッセイ読み出し。ADE2およびTRP1遺伝子は、アデニンおよびトリプトファンの産生をもたらす代謝経路の重要な酵素であり、このため、それらのノックアウトは、イーストがこれら2つの関連栄養素を欠失した培地中で増殖する能力を破壊する。本研究で生成されたyACMOイースト株は、Cas9が各コード配列を切断して標的配列を中断させない限りTRP1およびADE2遺伝子活性を欠失し:標的部位の両側における2つの100bp相同領域の間の一本鎖アニーリング媒介組換えは、野生型遺伝子座の再構築を確実にする。次いで、栄養素要求性選択に基づくスクリーニングを使用して、2つのゲノム遺伝子座におけるCas9切断活性を評価することができ、オンターゲットおよびオフターゲットイベントの両方を測定する。p415-GalL-Cas9-CYC1tおよびpRS316-SNR52p-gRNA.ON-SUP4tによるトランスフォーメーション後、細胞を、ロイシンおよびウラシルを含まない合成培地(SDlu)中で4時間増殖させて、ガラクトースを含有する培地(SRGlu)中で終夜誘導した。次いでSDluプレート上に等しい数の細胞をプレートし、形質転換体の総数を測定し、そしてトリプトファンを欠失して低濃度のアデニンを含むSDluプレート(SDluta5)上で、Cas9がオンターゲット配列のみ切断したコロニーまたはオフターゲット配列もまた切断したコロニーを区別した。特に、SDluta5読み出しプレートを観察する場合、異なる表現型が存在し得た:増殖しないことはTRP1遺伝子座の編集の欠如を示す(TRP1-/ADE2+/-);赤色コロニー(TRP1+/ADE2-)の増殖はTRP1遺伝子座においてのみの編集を示し、オフターゲット活性は検出されない;白色コロニー(TRP1+/ADE2+)の増殖はTRP1遺伝子座およびADE2遺伝子座両方における編集を示し、オフターゲット切断を検出する。コロニーの典型的な赤色の色素形成は、ADE2遺伝子産物のレベルでの遮断によって生成されたアデニン生合成経路の中間体の細胞液胞への蓄積によって決定される。SDluおよびSDluta5で得られたコロニーの総数を比較することにより、オンターゲット切断効率を測定することができ、SDluta5の赤色および白色コロニーのパーセンテージを定量することにより、試験したオフターゲット配列に対するCas9活性の特異性の評価を得ることができる。
【0105】
SpCas9変異体のイーストスクリーニング。変異体のライブラリーを、GeneMorph IIキット(Agilent)を使用して、エラープローンPCR(epPCR)によって生成した。製造業者の指示にしたがって、鋳型DNA(p415-GalL-Cas9-CYC1t)の最初の量およびサイクル数を、キロベースあたり平均5個の変異を得るように設定した。50bp長のプライマーを、REC1-IIコード配列の150bp上流および下流にアニールするように選択した(添付資料の表5を参照)。PCRライブラリーを、NcoIおよびNheI(New England BioLabs)によって前もって消化してREC1-IIドメインを除去したp415-GalL-Cas9-CYC1tプラスミドと、変異誘発したアンプリコンプールとのコトランスフォーメーション(インサート/プラスミド比が3:1である)によってインビボで直接アセンブルした。アンプリコンの両端の2つの150bpの相同領域を使用し、イーストによる相同組換えにより消化したプラスミドを修復し、よって変異誘発した部分を組み込んだ。これらの150bpの隣接する領域に変異を含有するクローンは、完全な相同性の欠失により、このインビボアセンブリーステップ中にネガティブ選択される可能性がある。それにもかかわらず、これらの変異は、本発明者らの目的の領域(REC1-IIドメイン)の外側にあった。変異原性のライブラリーを、TRP1遺伝子座に含有されたオンターゲット配列にマッチングするsgRNAを安定に発現するyACMO-オフ4イースト株中に、上記断片をコトランスフォーメーションすることによって、そのアセンブリーに付随してスクリーニングした。トランスフォーメーション後、培養物を、ウラシルおよびロイシンを欠くSD培地中で終夜増殖させ(SDlu、sgRNA発現プラスミドおよびCas9発現プラスミドの両方を有する細胞を選択するため)、回復及び正確な組換えを可能にした。次の日、ガラクトース含有培地(SRGlu)中で5時間、培養物を増殖させることによってCas9発現を誘導して、トリプトファンを欠き低濃度のアデニンを含有するいくつかの選択プレート(SDluta5)にプレーティングして、TRP1遺伝子座およびADE2遺伝子座の編集状態にしたがってコロニーを区別した。48時間後、TRP1+/ADE2-(赤)コロニーを、ガラクトースおよびラフィノースを含有し、低アデニンおよびトリプトファン無しの選択プレート(SRGluta5)上にストリークし、構成的に誘導されるCas9発現を維持し、オフターゲット切断を生成させた。さらに48時間のインキュベーション後、Cas9発現プラスミドを、Cas9がオンターゲット部位のみを切断するコロニーに対応する、最も赤色のストリークから抽出し、変異をサンガー法配列決定によって特徴づけた。
【0106】
イーストコロニーカラー分析および定量。全てのプレート画像をCanon EOS 1100D(1/60、f/9.0およびISO800)によって得て、OpenCFUによって分析した(Geissmann Q, PLoS One. 2013;8(2):e54072)。全ての画像に関して、8~50ピクセルの間の半径で逆閾値(inverted threshold)(値=2)を使用した。白色コロニーと赤色コロニーとの間の区別を、RGBチャンネルの平均シグナルを計算すること、および各実験の赤色と白色のコロニーの間を正確に区別する手動の閾値を設定することによって算出した。
【0107】
哺乳動物細胞およびトランスフェクション。293T/17細胞を、アメリカ培養細胞系統保存機関(American Type Culture Collection)から取得して(ATCCから取得した)、10%のウシ胎仔血清(FCS;Life Technologies)および抗生物質(PenStrep;Life Technologies)を補足したダルベッコ改変イーグル培地(DMEM;Life Technologies)中で培養した。293multiGFP細胞を、pEGFP-IRES-Puromycinによる安定なトランスフェクションによって生成し、1μg/mlのピューロマイシンで選択した。293blastEGFPを、EGFP発現レンチウイルスベクターpAIB-GFPによるHEK293T細胞の低MOI感染、その後の5μg/mlのブラスチシジンによるクローン選択によって得た。トランスフェクションについては、ウェル当たり1×105個の293multiGFPまたは293T細胞を24ウェルプレートに播種し、400~750ngのCas9発現プラスミドおよび200~250ngのsgRNA発現プラスミドを使用して、製造業者のプロトコールに従ってTransIT-LT1(Mirus Bio)を使用して次の日トランスフェクションを行った。EGFP発現を含む一過性のトランスフェクション実験については、100ngのpEGFP-N1プラスミドを使用した。293multiGFPへのトランスフェクション後のCas9によるEGFPのレベルの下方制御を決定するため、細胞をトランスフェクションの7日後に回収し、FACSCanto(BD Biosciences)を使用するフローサイトメトリーによって分析した。
【0108】
レンチウイルスベクター産生および形質導入。レンチウイルス粒子を、10cmディッシュに4×106個の293T細胞を播種することによって産生した。次の日、プレートに、ポリエチレンイミン(PEI)法を使用して、6.5μgのpCMV-deltaR8.91パッケージングベクターおよび3.5μgのpMD2.Gと一緒に10μgの各lentiCRISPRベース(Cong L et al., Science. 2013, 339(6121):819-23)の移入ベクターをトランスフェクトした。終夜のインキュベーション後、培地を新しい完全DMEMと置き換え、48時間後、ウイルス粒子を含有する上澄み液を回収し、500×gで5分間遠心沈殿し、0.45μmのPESフィルターを通して濾過した。ベクター力価の定量を、SG-PERT法を使用して実施した(Pizzato M et al., J Virol Methods. 2009, 156(1-2):1-7)。ベクターストックを、将来使用するために-80℃で保存した。
【0109】
形質導入については、105個の293blastGFP細胞を24ウェルプレートに播種し、次の日に2時間1600×g、16℃で遠心分離することにより、0.4逆転写酵素単位(RTU)/ウェルの各ベクターで形質導入した。終夜のインキュベーション後、ウイルス上澄み液を除去し、細胞を全部で48時間にわたって培養して維持して、その後、0.5μg/mlピューロマイシンを添加して実験中を通して選択を維持した。感染後のCas9によるEGFPのレベルの下方制御を決定するため、形質導入後の示した時点で293blastGFP細胞を回収し、FACSCanto(BD Biosciences)を使用するフローサイトメトリーによって分析した。
【0110】
Cas9誘導ゲノム変異の検出。ゲノムDNAを、QuickExtract DNA抽出溶液(Epicentre)を使用して、トランスフェクション後の7日目に得た。ゲノム遺伝子座を増幅するためのPCR反応を、Phusion High-Fidelity DNAポリメラーゼ(Thermo Fisher)を使用して実施した。試料を添付資料の表8に列挙したオリゴを使用して増幅した。精製したPCR産物を、シーケンシングおよびTIDEツールを利用することによって分析した(Brinkman EK et al., Nucleic Acids Res. 2014, 42(22):e168)。CCR2-CCR5染色体欠失を定量するため、半定量的PCR手法を、CCR5オンターゲット部位およびCCR2オフターゲット遺伝子座に隣接するプライマーを使用して設定した(添付資料の表8)。PCRサイクル数を、増幅プラトーに達しないように調節した。定量を、ImageJソフトウェアを使用し、内部基準としてFANCFゲノム遺伝子座を用いる濃度測定分析を実施することによって得た。
【0111】
ウェスタンブロット。細胞はNEHN緩衝液(20mM HEPES pH7.5、300mM NaCl、0.5% NP40、NaCl、1mM EDTA、20%グリセロール、1%のプロテアーゼインヒビターカクテル(Pierce)を補足した)中で溶解した。細胞抽出物は、標準分子量マーカーとしてPageRuler Plus Protein Standards(Thermo Fisher Scientific)を使用してSDS-PAGEによって分離した。電気泳動後、試料を0.22μmのPVDF膜(GE Healthcare)に移した。膜は、SpCas9および異なる高忠実度バリアントを検出するためにマウス抗FLAG(Sigma)と、ローディングコントロールのためにマウス抗αチューブリン(Sigma)と、ECL検出のために適切なHRPコンジュゲートゴート抗マウス(KPL)二次抗体とインキュベートした。画像は、UVltec Alliance検出システムを使用して得た。
【0112】
標的化ディープシーケンシング。野生型SpCas9もしくはevoCas9を、EMX1遺伝子座およびVEGFA3遺伝子座を標的化するsgRNAまたはpUC空ベクターと一緒にトランスフェクションして7日後に抽出した293TのゲノムDNAから、VEGFA3ゲノム遺伝子座およびEMX1ゲノム遺伝子座の選択したオフターゲット部位を、それらの相対オンターゲットと一緒に、Phusion high-fidelityポリメラーゼ(Thermo Scientific)またはEuroTaqポリメラーゼ(Euroclone)を使用して増幅した。オフターゲットアンプリコンを、精製およびインデックス付けの前にほぼ等モル濃度でプールした。ライブラリーを、Nexteraインデックス(Illumina)を使用するPCRによってインデックス付けし、Qubit dsDNA High Sensitivity Assayキット(Invitrogen)によって定量し、標的の数によってプールし、Illumina Miseq ReagentキットV3-150サイクル(単回リード150bp)を使用してIllumina Miseqシステムで配列決定した。アンプリコンを生成するために使用した完全なプライマーリストを添付資料の表7に報告する。
【0113】
参照ゲノムを、検討したオン/オフターゲット領域のDNA配列から、Picard(http://broadinstitute.github.io/picard)およびsamtools(Li H at al., Bioinformatics. 2009, 25(16):2078-9)を使用して構築した。生シーケンスデータ(FASTQファイル)を、標準パラメーターを用いたBWA-MEM(Li H and Durbin R, Bioinformatics. 2010, 26(5):589-95)を使用して、作成した参照ゲノムに対してマッピングし、生じたアライメントファイルを、samtoolsを使用してソートした。30以上のマッピングクオリティーのあるリードのみを保持した。それぞれの検討した領域に対する各リード中のインデルの存在を、予測の切断部位に直接隣接するサイズ1bpのインデル、または予測の切断部位の周辺5bpサイズの隣接領域とオーバーラップするサイズが≧2bpのインデルを検索することによって決定した。
【0114】
GUIDEシーケンス実験およびデータ分析。GUIDEシーケンスは、ほとんど改変せずに、以前に記載されたように実施した(Bolukbasi MF et al., Nat Methods. 2015,12(12):1150-6)。簡潔に言うと、2×105個の293T細胞に、Lipofectamine3000トランスフェクション試薬(Invitrogen)を使用して、750ngのCas9発現プラスミドを、250ngのsgRNAコードプラスミドまたは空pUC19プラスミドおよび両端にホスホロチオエート結合を含有する10pmolのベイトdsODN(オリジナルのGUIDEシーケンスプロトコールに従って設計した)と一緒にトランスフェクトした。トランスフェクションの3日後、製造業者の指示に従って、DNeasy Blood and Tissueキット(Qiagen)を使用してゲノムDNAを抽出し、Bioruptor Pico音波処理装置(Diagenode)によって500bpの平均長に切断した。ライブラリー調製を、オリジナルアダプターおよび以前の研究によるプライマーによって実施した(Tsai SQ et al., Nat Biotechnol. 2015, 33(2):187-97)。ライブラリーを、Qubit dsDNA High Sensitivity Assayキット(Invitrogen)によって定量し、Illumina Miseq ReagentキットV2-300サイクル(2×150bp対の末端)を使用してMiseqシーケンシングシステム(Illumina)で配列決定した。
【0115】
生シーケンスデータ(FASTQファイル)を、GUIDEシーケンス計算パイプラインを使用して分析した(Tsai SQ et al., Nat Biotechnol. 2015, 33(2):187-97)。デマルチプレクシング後、推定のPCR複製を単一リードに集結した。集結したリードは、BWA-MEMを使用してヒト参照ゲノムGrCh37にマッピングし(Li H and Durbin R, Bioinformatics. 2010, 26(5):589-95);マッピングクオリティーが50より低いリードは除外した。二本鎖オリゴデオキシヌクレオチド(dsODN)を挿入しているゲノム領域を整列データにおいて同定する際、標的に対して多くて8個のミスマッチが存在する場合、およびバックグラウンドコントロールが無い場合は、RGN部位を保持した。アラインしたオフターゲット部位の可視化は、カラーコード配列グリッドとして利用できる。
添付資料
【0116】
【0117】
【0118】
【0119】
【0120】
【0121】
【0122】
【0123】
【配列表】