(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-06-11
(54)【発明の名称】エンジニアリングされたCas12iヌクレアーゼ、エフェクタータンパク質及びその用途
(51)【国際特許分類】
C12N 9/16 20060101AFI20240604BHJP
C12N 15/09 20060101ALI20240604BHJP
C12N 15/55 20060101ALI20240604BHJP
C12N 15/864 20060101ALI20240604BHJP
C12Q 1/6883 20180101ALI20240604BHJP
C12N 5/10 20060101ALI20240604BHJP
C12Q 1/68 20180101ALI20240604BHJP
A01K 67/0275 20240101ALI20240604BHJP
A61K 38/46 20060101ALI20240604BHJP
A61P 35/00 20060101ALI20240604BHJP
A61P 9/00 20060101ALI20240604BHJP
A61P 37/02 20060101ALI20240604BHJP
A61P 3/00 20060101ALI20240604BHJP
A61P 25/28 20060101ALI20240604BHJP
A61P 27/02 20060101ALI20240604BHJP
A61P 31/04 20060101ALI20240604BHJP
A61P 31/12 20060101ALI20240604BHJP
【FI】
C12N9/16 Z ZNA
C12N15/09 110
C12N15/55
C12N15/864 100Z
C12Q1/6883 Z
C12N5/10
C12Q1/68 100Z
A01K67/0275
A61K38/46
A61P35/00
A61P9/00
A61P37/02
A61P3/00
A61P25/28
A61P27/02
A61P31/04
A61P31/12
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023573318
(86)(22)【出願日】2022-05-25
(85)【翻訳文提出日】2023-11-27
(86)【国際出願番号】 CN2022095072
(87)【国際公開番号】W WO2022247873
(87)【国際公開日】2022-12-01
(31)【優先権主張番号】PCT/CN2021/096477
(32)【優先日】2021-05-27
(33)【優先権主張国・地域又は機関】CN
(31)【優先権主張番号】202110581290.3
(32)【優先日】2021-05-27
(33)【優先権主張国・地域又は機関】CN
(31)【優先権主張番号】202111347952.7
(32)【優先日】2021-11-15
(33)【優先権主張国・地域又は機関】CN
(81)【指定国・地域】
(71)【出願人】
【識別番号】520176566
【氏名又は名称】中国科学院動物研究所
【氏名又は名称原語表記】INSTITUTE OF ZOOLOGY,CHINESE ACADEMY OF SCIENCES
【住所又は居所原語表記】No.5, 1 Beichen West Road, Chaoyang District, Beijing 100101, China
(71)【出願人】
【識別番号】523142607
【氏名又は名称】北京幹細胞与再生医学研究院
【氏名又は名称原語表記】BEIJING INSTITUTE FOR STEM CELL AND REGENERATIVE MEDICINE
【住所又は居所原語表記】3A, Datun Road, Chaoyang District, Beijing 100101, China
(74)【代理人】
【識別番号】100136629
【氏名又は名称】鎌田 光宜
(74)【代理人】
【識別番号】100080791
【氏名又は名称】高島 一
(74)【代理人】
【識別番号】100125070
【氏名又は名称】土井 京子
(74)【代理人】
【識別番号】100121212
【氏名又は名称】田村 弥栄子
(74)【代理人】
【識別番号】100174296
【氏名又は名称】當麻 博文
(74)【代理人】
【識別番号】100137729
【氏名又は名称】赤井 厚子
(74)【代理人】
【識別番号】100152308
【氏名又は名称】中 正道
(74)【代理人】
【識別番号】100201558
【氏名又は名称】亀井 恵二郎
(72)【発明者】
【氏名】李偉
(72)【発明者】
【氏名】周▲き▼
(72)【発明者】
【氏名】陳陽燦
(72)【発明者】
【氏名】胡▲艶▼萍
(72)【発明者】
【氏名】王▲金▼閣
(72)【発明者】
【氏名】駱勝球
(72)【発明者】
【氏名】陳逸
【テーマコード(参考)】
4B063
4B065
4C084
【Fターム(参考)】
4B063QA18
4B063QA19
4B063QQ06
4B063QQ07
4B063QQ08
4B063QQ09
4B063QQ42
4B063QR14
4B063QR31
4B063QR56
4B063QS34
4B063QX01
4B065AA90X
4B065AB01
4B065AC14
4B065BA02
4B065CA43
4C084AA02
4C084BA44
4C084DC22
4C084NA14
4C084ZA151
4C084ZA331
4C084ZA661
4C084ZB071
4C084ZB261
4C084ZB331
4C084ZB351
4C084ZC192
4C084ZC211
(57)【要約】
本出願は(1)参照Cas12iヌクレアーゼ中のPAMと相互作用する1以上のアミノ酸を正に帯電したアミノ酸に置換すること、及び/または(2)参照Cas12iヌクレアーゼ中のDNA二本鎖の開放に関与する1つまたは複数のアミノ酸を芳香環付きアミノ酸に置換すること、及び/または(3)参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換すること、及び/または(4)参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換すること、及び/または(5)参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数の極性または正に帯電したアミノ酸を疎水性アミノ酸に置換することの1つまたは複数の、参照Cas12iヌクレアーゼに基づくの変異を含む、エンジニアリングされたCas12iヌクレアーゼ提供する。このエンジニアリングされたCas12iヌクレアーゼは、参照Cas12iヌクレアーゼに比べて有意に向上した遺伝子編集効率及び/又は有意に低下したオフターゲット現象を有する。
【選択図】なし
【特許請求の範囲】
【請求項1】
エンジニアリングされたCas12iヌクレアーゼであって、それは参照Cas 12iに基づく1つまたは複数のヌクレアーゼの変異を含み、前記変異は:
(1)参照Cas12iヌクレアーゼ中のPAMと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換すること;
(2)参照Cas12iヌクレアーゼ中のDNA二本鎖の開放に関与する1つまたは複数のアミノ酸を芳香環付きアミノ酸に置換すること;
(3)参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換すること;
(4)参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換すること;及び
(5)参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数の極性または正電荷を有するアミノ酸を疎水性アミノ酸に置換することから選択され;
好ましくは、前記参照Cas12iヌクレアーゼはアミノ酸配列がSEQ ID NO:1の野生型Cas12i2ヌクレアーゼである、エンジニアリングされたCas12iヌクレアーゼ。
【請求項2】
前記PAMと相互作用的一つまたは複数のアミノ酸はPAMと3次元構造上9Å以内の距離にあるアミノ酸であり、好ましくは、前記PAMと相互作用する1つまたは複数のアミノ酸は176、178、226、227、229、237、238、264、447及び563位の1つまたは複数のアミノ酸であり、
さらに好ましくは、前記PAMと相互作用する1つまたは複数のアミノ酸は、E176、E178、Y226、A227、N229、E237、K238、K264、T447及びE563の1つまたは複数のアミノ酸であり、
さらに好ましくは、前記PAMと相互作用する1つまたは複数のアミノ酸は、E176、K238、T447及びE563の1つまたは複数のアミノ酸であり、
そのうち、前記アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、請求項1に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項3】
前記正に帯電したアミノ酸R、KまたはHである、請求項1または2に記載のエンジニアリングCas12i核酸酵素。
【請求項4】
前記参照Cas12iヌクレアーゼ中のPAMと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換することは、E176R、K238R、T447R及びE563R置換の1つまたは複数であり、;
好ましくは、前記エンジニアリングされたCas12iヌクレアーゼは(1)E563R;(2)E176R、T447R、E176R及びE563R;(3)K238RとE563R;(4)E176R、K238R及びT447R;(5)E176R、K238R及びE563R;(6)E176R、T447R及びE563R;及び(7)E176R、K238R、T447R及びE563R、のいずれの変異或いは変異の組み合わせを含み;
そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、請求項1から3のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項5】
前記DNA二本鎖の開放に関与する1つまたは複数のアミノ酸は、PAM中の標的鎖に対する3’末端の最後の塩基対と相互作用するアミノ酸であり;
好ましくは、前記DNA二本鎖の開放に関与する1つ又は複数のアミノ酸は163と164位の1つまたは複数のアミノ酸であり;
さらに好ましくは、前記DNA二本鎖の開放に関与する1つ又は複数のアミノ酸Q163とN164位の1つまたは複数のアミノ酸であり;さらに好ましくは、前記DNA二本鎖の開放に関与するアミノ酸はN164であり;
そのうち、前記アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、請求項1から4のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項6】
前記DNA二本鎖の開放に関与する1つ又は複数のアミノ酸は芳香環付きアミノ酸に置換され、前記芳香環付きアミノ酸はF、YまたはWであり、好ましくは、前記芳香環付きアミノ酸はFまたはYである、請求項1から5のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項7】
前記参照Cas12iヌクレアーゼ中のDNA二本鎖の開放に関与する一つ又は複数のアミノ酸は芳香環付きアミノ酸に置換することはQ163F、Q163Y、Q163W、及びN164Fの一つまたは複数の置換を含み;好ましくは、前記Cas12iヌクレアーゼはN164YまたはN164F変異を含み;さらに好ましくは、前記エンジニアリングされたCas12iヌクレアーゼはN164Yを含む、請求項1から6のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項8】
前記RuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸は一本鎖DNA基質と三次元構造上9Å以内の距離にあるアミノ酸であり;
好ましくは、前記RuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸は323、327、355、359、360、361、362、388、390、391、392、393、414、417、418、421、424、425、650、652、653、696、705、708、709、751、752、755、840、848、851、856、885、897、925、926、928、929、932、1022位の1つまたは複数のアミノ酸であり;
さらに好ましくは、前記RuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸は、E323、L327、V355、G359、G360、K361、D362、L388、N390、N391、F392、K393、Q414、L417、L418、K421、Q424、Q425、S650、E652、G653、I696、K705、K708、E709、L751、S752、E755、N840、N848、S851、A856、Q885、M897、N925、I926、T928、G929、Y932、A1022の1つまたは複数のアミノ酸であり;
さらに好ましくは、前記RuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸はE323、D362、Q425、N925、I926、N391、Q424及びG929の1つまたは複数のアミノ酸であり;
そのうち、前記アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、請求項1から7のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項9】
参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換することはR或いはKに置換することを含み、好ましくは、前記正に帯電した該アミノ酸はRである、請求項1から8のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項10】
参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換することはE323R、D362R、N391R、Q424R、Q425R、N925R、I926R及びG929Rの1つまたは複数の置換を含み;
好ましくは、前記エンジニアリングされたCas12iヌクレアーゼは(1)E323R;(2)D362R;(3)Q425R; (4)N925R; (5)I926R;(6)E323RとD362R;(7)E323RとQ425R;(8)E323RとI926R;(9)Q425RとI926R; (10)D362RとI926R; (11)N925RとI926R; (12) E323R、D362R及びQ425R; (13)E323R、D362R及びI926R;(14)E323R、Q425R及びI926R;(15)D362R、N925R及びI926R;及び(16) E323R、D362R、Q425R及びI926Rのいずれの変異或いは変異の組み合わせを含み;
そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、請求項1から9のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項11】
前記DNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸はDNA-RNA二重らせんと三次元構造上9Å以内の距離にあるアミノ酸であり;
好ましくは、前記DNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸は116、117、156、159、160、161、247、293、294、297、301、305、306、308、312、313、316、319、320、343、348、349、427、433、438、441、442、679、683、691、782、783、797、800、852、853、855、861、865、957、958位の1つまたは複数のアミノ酸であり;
さらに好ましくは、前記DNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸はG116、E117、A156、T159、E160、S161、E247、G293、E294、N297、T301、I305、K306、T308、N312、F313、Q316、E319、Q320、E343、E348、E349、D427、K433、V438、N441、Q442、N679、E683、E691、D782、E783、E797、E800、M852、D853、L855、N861、Q865、S957、D958の1つまたは複数のアミノ酸であり;
さらに好ましくは、前記DNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸はG116、E117、T159、S161、E319、E343及びD958の1つまたは複数のアミノ酸であり;そのうち、前記アミノ酸の位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、請求項1から10のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項12】
参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換することはR或いはKに置換することを含み、好ましくは、前記正に帯電したアミノ酸はRである、請求項1から11のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項13】
参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換することはG116R、E117R、T159R、S161R、E319R、E343R及びD958Rの1つまたは複数に置換することを含み;
好ましくは、前記エンジニアリングされたCas12iヌクレアーゼはD958R置換を含む;
そのうち、前記アミノ酸の位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、請求項1から12のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項14】
前記DNA-RNA二重らせんと相互作用する1つまたは複数の極性または正に帯電したアミノ酸は、357、394、715、719、807、844、848、857、861位の1つまたは複数のアミノ酸から選択され、即ちH357、K394、R715、R719、K807、K844、N848、R857、R861の1つまたは複数のアミノ酸であり;
そのうち、前記アミノ酸の位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、請求項1から13のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項15】
参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数の極性または正に帯電したアミノ酸を疎水性アミノ酸に置換することはアラニン(A)に置換することを含む、請求項1から14のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項16】
H357A、K394A、R715A、R719A、K807A、K844A、N848A、R857A、R861Aかななる群より選択された一つまたは複数の変異を含み;
好ましくは、K394A、R719A、K844A、R857Aかななる群より選択された一つまたは複数の変異を含み;
そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、請求項1から15のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項17】
それはR719AとK844Aアミノ酸置換を含み、またはR857AとK844Aアミノ酸置換を含み; そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、請求項1から16のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項18】
一つまたは複数のフレキシブル領域変異をさらに含み、前記変異は参照Cas12iヌクレアーゼ中のフレキシブル領域の柔軟性を増加させ、前記フレキシブル領域はアミノ酸残基439-443またはアミノ酸残基925-929から選択され;
好ましくは、前記フレキシブル領域変異は439と/または926部位に位置し;
さらに好ましくは、前記フレキシブル領域変異はL439と/またはI926の変異であり;
そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、請求項1から17のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項19】
前記一つまたは複数のフレキシブル領域変異は、該フレキシブル領域アミノ酸をGに置換し、および/またはその後ろに1つまたは2つのGを挿入することであり;
好ましくは、前記一つまたは複数のフレキシブル領域変異はI926G、L439(L+G)またはL439(L+GG)を含み;
さらに好ましくは、前記一つまたは複数のフレキシブル領域変異はL439(L+G)またはL439(L+GG)を含み;
そのうち、前記アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、請求項18に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項20】
エンジニアリングされたCas12iヌクレアーゼであって;
前記エンジニアリングされたCas12iヌクレアーゼは
(1)E563R;(2)E176RとT447R;(3)E176RとE563R;(4)K238RとE563R;(5)E176R、K238R及びT447R;(6)E176R、T447R及びE563R;(7)E176R、K238R及びE563R;(8)E176R、K238R、T447R及びE563R;(9)N164Y;(10)N164F;(11)E323R;(12)D362R;(13)Q425R;(14)N925R;(15)I926R;(16)D958R;(17)E323RとD362R;(18)E323RとQ425R;(19)E323RとI926R;(20)Q425RとI926R;(21)D362RとI926R;(22)N925RとI926R;(23)E323R、D362R及びQ425R;(24)E323R、D362R及びI926R;(25)E323R、Q425R及びI926R;(26)D362R、N925R及びI926R;(27)E323R、D362R、Q425R及びI926R;(28)D362RとI926G;(29)N925RとI926G;(30)D362R、N925R及びI926G;(31)I926RとL439(L+G);(32)I926RとL439(L+GG);(33)E323R、D362RとI926G;(34)R719AとK844A;及び(35)R857AとK844Aのいずれかの1つ群または複数群の変異を含み;
好ましくは、前記エンジニアリングされたCas12iヌクレアーゼは(1)E176R、K238R、T447R及びE563R;(2)N164Y;(3)I926R;(4)E323R及びD362R;(4)I926G;(5)I926R及びL439(L+G);(6)I926R及びL439(L+GG);ならびに(7)D958Rのいずれかの1つ群または複数群の変異を含み;
そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、エンジニアリングされたCas12iヌクレアーゼ。
【請求項21】
エンジニアリングされたCas12iヌクレアーゼであって、前記エンジニアリングされたCas12iヌクレアーゼは(1)E176R、K238R、T447R、E563R及びN164Y;(2)E176R、K238R、T447R、E563R及びI926R;(3)N164Y、E323R及びD362R;(4)E176R、K238R、T447R、E563R、E323R及びD362R;(5)N164YとI926R;(6)E176R、K238R、T447R、E563R、N164Y及びI926R;(7)E176R、K238R、T447R、E563R、N164Y、E323R及びD362R;(8)E176R、K238R、T447R、E563R、N164Y、I926R、E323R及びD362R;(9)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びI926G;(10)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G及びL439(L+GG);(11)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G及びL439(L+G);(12)E176R、K238R、T447R、E563R、N164Y及びD958R;(13)E176R、K238R、T447R、E563R、I926R及びD958R;(14)E176R、K238R、T447R、E563R、E323R、D362R及びD958R;(15)N164Y、I926R及びD958R;(16)N164Y、E323R、D362R及びD958R;(17)E176R、K238R、T447R、E563R、N164Y、I926R及びD958R;(18)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びD958R;(19)E176R、K238R、T447R、E563R、N164Y、I926R、E323R、D362R及びD958R;(20)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G及びD958R;(21)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G、L439(L+GG)及びD958R;(22)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G、L439(L+G)及びD958R;(23)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びR857A;(24)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びN861A;(25)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びK807A;(26)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びN848A;(27)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びR715A;(28)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びR719A;(29)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びK394A;(30)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びH357A;(31)E176R、K238R、T447R、E563R、N164Y、E323R、D362R 及びK844A;(32)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、R719A及びK844A;または(33)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、R857A及びK844Aのいずれの群の変異を含み;そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、エンジニアリングされたCas12iヌクレアーゼ。
【請求項22】
SEQ ID NOs:2~24のいずれかに示すアミノ酸配列を含むエンジニアリングされたCas12iヌクレアーゼであり、またはSEQ ID NOs:2~24のいずれかの配列に示すアミノ酸配列と少なくとも80%同一性を有するアミノ酸配列を含む、請求項1から21のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項23】
エンジニアリングされたCas12iエフェクタータンパク質であって、請求項1から22のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼまたはその機能的誘導体を含み;
任意に、前記エンジニアリングされたCas12iヌクレアーゼまたはその機能的誘導体は酵素活性を有し、または前記エンジニアリングされたCas12iヌクレアーゼまたはその機能的誘導体は酵素不活性変異体である、エンジニアリングされたCas12iエフェクタータンパク質。
【請求項24】
前記Cas12iエフェクタータンパク質はDNA分子中の二本鎖切断または一本鎖切断を誘導することができる、請求項23に記載のエンジニアリングされたCas12iエフェクタータンパク質。
【請求項25】
前記エンジニアリングされたCas12iヌクレアーゼまたはその機能的誘導体はD599A、E833A、S883A、H884A、R900A及びD1019Aの1つまたは複数の変異を含む酵素不活性変異体であり;そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、請求項23に記載のエンジニアリングされたCas12iエフェクタータンパク質。
【請求項26】
前記エンジニアリングされたCas12iヌクレアーゼまたはその機能的誘導体と融合する機能ドメインをさらに含む、請求項23から25のいずれか一項に記載のエンジニアリングされたCas12iエフェクタータンパク質。
【請求項27】
前記機能ドメインは翻訳開始ドメイン、転写抑制ドメイン、トランス活性化ドメイン、エピジェネティック修飾ドメイン、核酸塩基編集ドメイン、逆転写酵素ドメイン、レポーター分子ドメイン、ヌクレアーゼドメインからなる群より選択される一つまたは複数である、請求項26に記載のエンジニアリングされたCas12iエフェクタータンパク質。
【請求項28】
前記エンジニアリングされたCas12iエフェクタータンパク質は、前記エンジニアリングされたCas12iヌクレアーゼまたはその機能的誘導体のN末端部分を含む第一ポリペプチドと、前記エンジニアリングされたCas12iヌクレアーゼまたはその機能的誘導体のC末端部分を含む第二ポリペプチドとを備え、そのうち前記第一ポリペプチドと前記第二ポリペプチドは、標的核酸と特異的に結合するクラスター化され、規則的に間隔があいた短い回文構造の繰り返し配列(CRISPR)複合体を形成するために、ガイド配列を含むガイドRNAの存在下で互いに会合することができ、前記標的核酸は前記ガイド配列に相補的なターゲット配列を含み;
好ましくは、前記第一ポリペプチドは項1-22のいずれかに記載のエンジニアリングされたCas12iヌクレアーゼのN末端部分アミノ酸残基1~Xを含み、前記第二ポリペプチドは項1-22のいずれかに記載のエンジニアリングされたCas12iヌクレアーゼのアミノ酸残基X+1~前記Cas12iヌクレアーゼのC末端を含み;
あるいは、前記第一ポリペプチドと前記第二ポリペプチドはそれぞれ二量化ドメインを含み;
あるいは、前記第一ポリペプチドの二量体ドメインと前記第二ポリペプチドの二量体ドメインは誘導剤の存在下で互いに会合している、請求項23から27のいずれか一項に記載のエンジニアリングされたCas12iエフェクタータンパク質。
【請求項29】
エンジニアリングされたCRISPR-Cas12iシステムであって、
(a)請求項1から28のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ、または請求項23から28のいずれか一項に記載のエンジニアリングされたCas12iエフェクタータンパク質;及び
(b)ターゲット配列に相補的なガイド配列を含むガイドRNA、または前記ガイドRNAをコードする1つまたは複数の核酸、を含み、
そのうち、前記エンジニアリングされたCas12iヌクレアーゼまたはエンジニアリングされたCas12iエフェクタータンパク質と前記ガイドRNAとはCRISPR複合体を形成することができ、前記CRISPR複合体は前記ターゲット配列を含む標的核酸に特異的に結合し、且つ前記標的核酸の修飾を誘導し;
好ましくは、前記ガイドRNAは前記ガイド配列を含むcrRNAであり;
さらに好ましくは、前記エンジニアリングされたCRISPR-Cas12iシステムは複数のcrRNAをコードする前駆体ガイドRNAアレイ(array)を含み;
または、好ましくは前記エンジニアリングされたCas12iヌクレアーゼまたはエンジニアリングされたCas12iエフェクタータンパク質はメインエディタであり、前記ガイドRNAは、プライム編集ガイドRNA(pegRNA)である、エンジニアリングされたCRISPR-Cas12iシステム。
【請求項30】
前記エンジニアリングされたCas12iヌクレアーゼまたはエンジニアリングされたCas12iエフェクタータンパク質をコードする一つまたは複数のベクターを含み;
好ましくは、前記一つまたは複数のベクターはレトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ベクター、および単純ヘルペスベクターの群から選択され:;
さらに好ましくは、前記一つまたは複数のベクターはアデノ随伴ウイルスAAVベクターであり;
さらに好ましくは、前記AAVベクターはまた前記ガイドRNAをコードする、請求項29に記載のエンジニアリングされたCRISPR-Cas12iシステム。
【請求項31】
(a)サンプルを請求項29におけるエンジニアリングされたCRISPR-Cas12iシステム及びタグ付けされた検出核酸と接触させ、該検出核酸は一本鎖であり、前記ガイドRNAのガイド配列とハイブリダイズしないこと;及び
(b)前記エンジニアリングされたCas12iヌクレアーゼまたはエンジニアリングされたCas12iエフェクタータンパク質が前記タグ付けされた検出核酸を切断することによって生成される検出可能なシグナルを測定し、標的核酸を検出することを含む、サンプル中の標的核酸を検出する方法。
【請求項32】
前記標的核酸を請求項29または30に記載の前記エンジニアリングされたCRISPR-Cas12iシステムに接触させることを含み;
好ましくは、前記方法はインビトロで、エクスビボまたはインビボで行われ;
さらに好ましくは、前記標的核酸は細胞中に存在しており;
さらに好ましくは、前記細菌細胞、酵母細胞、哺乳動物細胞、植物細胞または動物細胞であり;
さらに好ましくは、前記標的核酸はゲノムDNAであり;
さらに好ましくは、前記ターゲット配列は疾患または障害に関連し;
さらに好ましくは、前記エンジニアリングされたCRISPR-Cas12iシステムは複数のcrRNAをコードする前駆体ガイドRNAアレイを含み、そのうち、各crRNAは異なるガイド配列を含む、ターゲット配列を含む標的核酸を修飾する方法。
【請求項33】
請求項29或30に記載の前記エンジニアリングされたCRISPR-Cas12iシステムの個体の細胞中の標的核酸に関連する疾患または障害を治療するための薬剤の製造における使用であって、好ましくは、前記疾患または障害は、がん、心血管疾患、遺伝性疾患、自己免疫疾患、代謝性疾患、神経変性疾患、眼病、細菌感染、及びウイルス感染の群から選択される、使用。
【請求項34】
請求項32に記載の方法を使用して個体の細胞中の標的核酸を修飾することにより、前記疾患または障害を治療することを含み、好ましくは、前記疾患または障害は、がん、心血管疾患、遺伝性疾患、自己免疫疾患、代謝性疾患、神経変性疾患、眼病、細菌感染、及びウイルス感染の群から選択される、個体の細胞中の標的核酸に関連する疾患または障害を治療する方法。
【請求項35】
標的核酸を請求項29または30に記載の前記エンジニアリングされたCRISPR-Cas12iシステムに接触させることを含む、ターゲット配列を含む標的核酸を修飾する方法。
【請求項36】
請求項1から22のいずれか一項に記載の前記エンジニアリングされたCas12iヌクレアーゼ、請求項23から28のいずれか一項に記載の前記エンジニアリングされたCas12iエフェクタータンパク質を含む組成物またはキット。
【請求項37】
修飾された標的核酸を含み、そのうち、標的核酸が請求項32または35に記載の方法で修飾される、エンジニアリングされた細胞。
【請求項38】
請求項37に記載の一つまたは複数の前記エンジニアリングされた細胞を含む、エンジニアリングされた非ヒト動物。
【発明の詳細な説明】
【技術分野】
【0001】
優先権情報
本出願の要求:2021年11月15日に出願された中国特許出願CN202111347952.7、2021年5月27日に出願された中国特許出願CN202110581290.3、及び2021年5月27日に出願された国際出願PCT/CN2021/096477に基づく優先権を主張し、これらの内容は、参照によりその全体が本明細書に組み込まれる。
【0002】
同時に提出された配列表ファイル
下記のASCIIコードテキストファイルのすべての内容は参照により本明細書に組み込まれる:コンピュータ読み取り可能なフォーマット(CRF)の配列表(FF00614PCT-NSequence6thVersion-20220525.txt、日付:2022年5月25日、大きさ:218kb)
【0003】
本出願はバイオ技術分野に属する。より具体的には、本出願は、向上された触媒活性(例えば、遺伝子編集活性)を有するCas12iヌクレアーゼ、エフェクタータンパク質、及びその用途に関する。
【背景技術】
【0004】
ゲノム編集は、ゲノム研究において重要かつ有用な技術である。ゲノム編集には、クラスター化され、規則的に間隔があいた短い回文構造の繰り返し配列(CRISPR)-Casシステム、転写活性因子様エフェクターヌクレアーゼ(TALEN)システム、及びジンクフィンガーヌクレアーゼ(ZFN)システムなど、複数のシステムが利用できる。
【0005】
CRISPR-Casシステムは効率的で且つ費用対効果の高いゲノム編集技術であり、酵母、植物からゼブラフィッシュ及び人間までの一連の真核生物に広く適用することができる(総説を参照する:Van der Oost 2013, Science 339: 768-770,以及Charpentier and Doudna, 2013, Nature 495: 50-51)。CRISPR-Casシステムは、Cas12iエフェクトタンパク質とCRISPR RNA(crRNA)を結合することにより、古細菌と細菌の中で適応免疫を提供する。これまでに、六つのタイプ(I-VI型)と2種類(第1類と第2類)を含むCRISPR-Casシステムは、このシステムの顕著な機能的及び進化的モジュール性に基づいて特徴付けられてきた。第2類CRISPR-Casシステムでは、II型Cas9システムとV型A/B/E/J Cas12a/Cas12b/Cas12e/Cas12jシステムがゲノム編集に利用されており、生物医学研究に広い将来性を提供している。
【0006】
しかし、現在のCRISPR-Casシステムは、限られた遺伝子編集効率を含む様々な限界を有する。したがって、複数の遺伝子座にまたがる効果的なゲノム編集のためには、改善された方法及びシステムが必要とされている。
【発明の概要】
【0007】
本出願は下記技術的解決手段を提供する:
1.参照Cas12iヌクレアーゼに基づく一つ又は複数の変異を含み、前記変異は
(1)参照Cas12iヌクレアーゼ中のPAMと相互作用する一つ又は複数のアミノ酸を正に帯電したアミノ酸に置換すること;
(2)参照Cas12iヌクレアーゼ中のDNA二本鎖の開放に関与する一つ又は複数のアミノ酸を芳香環付きアミノ酸に置換すること;
(3)参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換すること;
(4)参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換すること;及び
(5)参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数の極性または正に帯電したアミノ酸を疎水性アミノ酸に置換することから選択され;
好ましくは、前記参照Cas12iヌクレアーゼはアミノ酸配列がSEQ ID NO:1である野生型Cas12iヌクレアーゼである、エンジニアリングされたCas12iヌクレアーゼ。
【0008】
2.前記PAMと相互作用する1つまたは複数のアミノ酸が、PAMと三次元構造上9Å以内の距離にあるアミノ酸である;好ましくは、前記PAMと相互作用する1つまたは複数のアミノ酸は、176、178、226、227、229、237、238、264、447、及び563位のうちの1つまたは複数の位置にあるアミノ酸であり、
さらに好ましくは、前記PAMと相互作用する1つまたは複数のアミノ酸は、E176、E178、Y226、A227、N229、E237、K238、K264、T447、及びE563のうちの1つまたは複数のアミノ酸であり、
さらに好ましくは、前記PAMと相互作用する1つまたは複数のアミノ酸は、E176、K238、T447及びE563のうちの1つまたは複数のアミノ酸であり、
そのうち、前記アミノ酸の位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、項1に記載のエンジニアリングされたCas12iヌクレアーゼ。
【0009】
3.前記正に帯電したアミノ酸はR、K或いはHである、項1または2に記載のエンジニアリングされたCas12iヌクレアーゼ。
【0010】
4.前記参照Cas12iヌクレアーゼ中のPAMと相互作用する一つ又は複数のアミノ酸を正に帯電したアミノ酸に置換することはE176R、K238R、T447R及びE563Rのうちの1つまたは複数の置換を指し;
好ましくは、前記エンジニアリングされたCas12iヌクレアーゼは下記:(1)E563R;(2)E176R、T447R、E176R及びE563R;(3)K238RとE563R;(4)E176R、K238R及びT447R;(5)E176R、K238R及びE563R;(6)E176R、T447R及びE563R;及び(7)E176R、K238R、T447R及びE563Rのうちのいずれかの変異または変異の組み合わせを含み;
そのうち、前記アミノ酸の位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、項1から3のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【0011】
5.前記DNA二本鎖の開放に関与する一つ又は複数のアミノ酸はPAM中の標的鎖に対する3’末端の最後の塩基対と相互作用するアミノ酸であり;
好ましくは、前記DNA二本鎖の開放に関与する一つ又は複数のアミノ酸は163と164位のうちの1つまたは複数の位置にあるアミノ酸であり;
さらに好ましくは、前記DNA二本鎖の開放に関与する一つ又は複数のアミノ酸はQ163とN164の1つまたは複数のアミノ酸であり;さらに好ましくは、前記DNA二本鎖の開放に関与するアミノ酸はN164であり;
そのうち、前記アミノ酸の位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、項1から4のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【0012】
6.前記DNA二本鎖の開放に関与する一つ又は複数のアミノ酸は芳香環付きアミノ酸に置換し、前記芳香環付きアミノ酸はF、Y或いはWであり、好ましくは、前記芳香環付きアミノ酸はF或いはYである、項1から5のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【0013】
7.前記参照Cas12iヌクレアーゼ中のDNA二本鎖の開放に関与する一つ又は複数のアミノ酸を芳香環付きアミノ酸に置換することはQ163F、Q163Y、Q163W、及びN164Fのうちの1つまたは複数の置換を含み;好ましくは、前記Cas12iヌクレアーゼはN164Y或いはN164F変異を含み;さらに好ましくは、前記エンジニアリングされたCas12iヌクレアーゼはN164Yを含む、項1から6のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【0014】
8.前記RuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸は一本鎖DNA基質と三次元構造上9Å以内の距離にあるアミノ酸であり;
好ましくは、前記RuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸は323、327、355、359、360、361、362、388、390、391、392、393、414、417、418、421、424、425、650、652、653、696、705、708、709、751、752、755、840、848、851、856、885、897、925、926、928、929、932、1022のうちの1つまたは複数の位置のアミノ酸である。
さらに好ましくは、前記RuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸はE323、L327、V355、G359、G360、K361、D362、L388、N390、N391、F392、K393、Q414、L417、L418、K421、Q424、Q425、S650、E652、G653、I696、K705、K708、E709、L751、S752、E755、N840、N848、S851、A856、Q885、M897、N925、I926、T928、G929、Y932、A1022のうちの1つまたは複数のアミノ酸であり;
さらに好ましくは、前記RuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸はE323、D362、Q425、N925、I926、N391、Q424及びG929のうちの1つまたは複数のアミノ酸であり;
そのうち、前記アミノ酸の位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、項1から7のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【0015】
9.参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換することはR或いはKに置換することを含み、好ましくは、前記正に帯電した該アミノ酸はRである、項1から8のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【0016】
10.参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換することはE323R、D362R、N391R、Q424R、Q425R、N925R、I926R及びG929Rのうちの一つまたは複数の置換を含み;
好ましくは、前記エンジニアリングされたCas12iヌクレアーゼは(1)E323R;(2)D362R;(3)Q425R; (4)N925R; (5)I926R;(6)E323RとD362R;(7)E323RとQ425R;(8)E323RとI926R;(9)Q425RとI926R; (10)D362RとI926R; (11)N925RとI926R; (12) E323R、D362R及びQ425R; (13)E323R、D362R及びI926R;(14)E323R、Q425R及びI926R;(15)D362R、N925R及びI926R;及び(16) E323R、D362R、Q425R及びI926Rのうちのいずれかの変異または変異の組み合わせを含み;
そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、項1から9のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【0017】
11.前記DNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸はDNA-RNA二重らせんと三次元構造上9Å以内の距離にあるアミノ酸であり;
好ましくは、前記DNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸は116、117、156、159、160、161、247、293、294、297、301、305、306、308、312、313、316、319、320、343、348、349、427、433、438、441、442、679、683、691、782、783、797、800、852、853、855、861、865、957、958のうちの1つまたは複数の位置のアミノ酸であり;
さらに好ましくは、前記DNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸G116、E117、A156、T159、S161、T301、I305、K306、T308、N312、F313、D427、K433、V438、N441、Q442、M852、L855、N861、Q865、E160、Q316、E319、Q320、E247、E343、E348、E349、N679、E683、E691、D782、E783、E797、E800、D853、S957、D958、G293、E294及びN297;G116、E117、A156、T159、E160、S161、E247、G293、E294、N297、T301、I305、K306、T308、N312、F313、Q316、E319、Q320、E343、E348、E349、D427、K433、V438、N441、Q442、N679、E683、E691、D782、E783、E797、E800、M852、D853、L855、N861、Q865、S957、D958のうちの1つまたは複数のアミノ酸であり;
さらに好ましくは、前記DNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸はG116、E117、T159、S161、E319、E343及びD958のうちの1つまたは複数のアミノ酸であり;そのうち、前記アミノ酸の位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、項1から10のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【0018】
12.参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換することはR或いはKに置換することを含み、好ましくは、前記正に帯電したアミノ酸はRである、項1から11のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【0019】
13.参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換することはG116R、E117R、T159R、S161R、E319R、E343R及びD958Rのうちの一つまたは複数の置換を含み;
好ましくは、前記エンジニアリングされたCas12iヌクレアーゼはD958R置換を含み;
そのうち、前記アミノ酸の位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、項1から12のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【0020】
14.前記DNA-RNA二重らせんと相互作用する1つまたは複数の極性または正に帯電したアミノ酸は357、394、715、719、807、844、848、857、861のうちの一つまたは複数の位置のアミノ酸から選択され、即ち、H357、K394、R715、R719、K807、K844、N848、R857、R861のうちの一つまたは複数のアミノ酸であり;
そのうち、前記アミノ酸の位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、項1から13のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【0021】
15.参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数の極性または正に帯電したアミノ酸を疎水性アミノ酸に置換することはアラニン(A)に置換することを含む、項1から14のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【0022】
16.H357A、K394A、R715A、R719A、K807A、K844A、N848A、R857A、R861Aからなる群から選択された一つまたは複数の変異を含み;
好ましくは、K394A、R719A、K844A、R857Aからなる群から選択された一つまたは複数の変異を含み;
そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、項1から15のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【0023】
17.R719AとK844Aアミノ酸置換を含み、またはR857AとK844Aアミノ酸置換を含み;そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、項1から16のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【0024】
18.一つまたは複数のフレキシブル領域変異をさらに含み、前記変異は参照Cas12iヌクレアーゼ中のフレキシブル領域の柔軟性を増加させ、前記フレキシブル領域はアミノ酸残基439-443またはアミノ酸残基925-929から選択され;
好ましくは、前記フレキシブル領域変異は439及び/または926位に位置し;
さらに好ましくは、前記フレキシブル領域変異はL439と/またはI926の変異であり;
そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、項1から17のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【0025】
19.前記一つまたは複数のフレキシブル領域変異は、該フレキシブル領域のアミノ酸をGに置換し、及び/またはその後ろに1つまたは2つのGを挿入することであり;
好ましくは、前記一つまたは複数のフレキシブル領域変異はI926G、L439(L+G)またはL439(L+GG)を含み;
さらに好ましくは、前記一つまたは複数のフレキシブル領域突然変異はL439(L+G)またはL439(L+GG)を含み;
そのうち、前記アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、項18に記載のエンジニアリングされたCas12iヌクレアーゼ。
【0026】
20.エンジニアリングされたCas12iヌクレアーゼであって;
前記エンジニアリングされたCas12iヌクレアーゼは
(1)E563R;(2)E176RとT447R;(3)E176RとE563R;(4)K238RとE563R;(5)E176R、K238R及びT447R;(6)E176R、T447R及びE563R;(7)E176R、K238R及びE563R;(8)E176R、K238R、T447R及びE563R;(9)N164Y;(10)N164F;(11)E323R;(12)D362R;(13)Q425R;(14)N925R;(15)I926R; (16)D958R;(17)E323RとD362R;(18)E323RとQ425R;(19)E323RとI926R;(20)Q425RとI926R;(21)D362RとI926R;(22)N925RとI926R;(23)E323R、D362R及びQ425R;(24) E323R、D362R及びI926R;(25)E323R、Q425R及びI926R;(26)D362R、N925R及びI926R;(27)E323R、D362R、Q425R及びI926R;(28)D362RとI926G;(29)N925RとI926G;(30)D362R、N925R及びI926G;(31)I926RとL439(L+G);(32)I926RとL439(L+GG);(33)E323R、D362RとI926G;(34)R719AとK844A;及び(35)R857AとK844Aの1つまたは複数群の変異を含み;
好ましくは、前記エンジニアリングされたCas12iヌクレアーゼは(1)E176R、K238R、T447R及びE563R;(2)N164Y;(3)I926R;(4)E323RとD362R;(4)I926G;(5)I926RとL439(L+G);(6)I926RとL439(L+GG);及び(7)D958Rの1つまたは複数群の変異を含み;
そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される。
【0027】
21.エンジニアリングされたCas12iヌクレアーゼであって、 前記エンジニアリングされたCas12iヌクレアーゼは(1)E176R、K238R、T447R、E563R及びN164Y;(2)E176R、K238R、T447R、E563R及びI926R;(3)N164Y、E323R及びD362R;(4)E176R、K238R、T447R、E563R、E323R及びD362R;(5)N164YとI926R;(6)E176R、K238R、T447R、E563R、N164Y及びI926R;(7)E176R、K238R、T447R、E563R、N164Y、E323R及びD362R;(8)E176R、K238R、T447R、E563R、N164Y、I926R、E323R及びD362R;(9)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びI926G;(10)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G及びL439(L+GG);(11)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G及びL439(L+G);(12)E176R、K238R、T447R、E563R、N164Y及びD958R;(13)E176R、K238R、T447R、E563R、I926R及びD958R;(14)E176R、K238R、T447R、E563R、E323R、D362R及びD958R;(15)N164Y、I926R及びD958R;(16)N164Y、E323R、D362R及びD958R;(17)E176R、K238R、T447R、E563R、N164Y、I926R及びD958R;(18)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びD958R;(19)E176R、K238R、T447R、E563R、N164Y、I926R、E323R、D362R及びD958R;(20)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G及びD958R;(21)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G、L439(L+GG)及びD958R;(22)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G、L439(L+G)及びD958R;(23)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びR857A;(24)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びN861A;(25)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びK807A;(26)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びN848A;(27)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びR715A;(28)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びR719A;(29)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びK394A;(30)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びH357A;(31)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びK844A;(32)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、R719A及びK844A;または(33)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、R857A及びK844Aのいずれかの群の変異を含み;そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される。
【0028】
22.SEQ ID NOs:2~24のいずれかに示すアミノ酸配列のエンジニアリングされたCas12iヌクレアーゼ、またはSEQ ID NOs:2~24のいずれかの配列に示すアミノ酸配列と少なくとも80%同一性を有するアミノ酸配列を含む、項1から21のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ。
【0029】
23.エンジニアリングされたCas12iエフェクタータンパク質であって、項1から22のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼまたはその機能的誘導体を含み;
任意に、前記エンジニアリングされたCas12iヌクレアーゼまたはその機能的誘導体は酵素活性を有し、または前記エンジニアリングされたCas12iヌクレアーゼまたはその機能的誘導体は酵素不活性変異体である、エンジニアリングされたCas12iエフェクタータンパク質。
【0030】
24.前記Cas12iエフェクタータンパク質はDNA分子中の二本鎖断裂または一本鎖断裂を誘導することができる、項23に記載のエンジニアリングされたCas12iエフェクタータンパク質。
【0031】
25.前記エンジニアリングされたCas12iヌクレアーゼまたはその機能的誘導体はD599A、E833A、S883A、H884A、R900A及びD1019Aの1つまたは複数の変異を含む酵素不活性変異体であり;そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、項23に記載のエンジニアリングされたCas12iエフェクタータンパク質。
【0032】
26.前記エンジニアリングされたCas12iヌクレアーゼまたはその機能的誘導体と融合する機能ドメインをさらに含む、項23から25のいずれか一項に記載のエンジニアリングされたCas12iエフェクタータンパク質。
【0033】
27.前記機能ドメインは以下:翻訳開始ドメイン、転写阻止ドメイン、トランス活性化ドメイン、エピジェネティック修飾ドメイン、核酸塩基編集ドメイン、逆転写酵素ドメイン、レポーター分子ドメイン、ヌクレアーゼドメインからなる群の一つまたは複数から選択される、項26に記載のエンジニアリングされたCas12iエフェクタータンパク質。
【0034】
28.前記エンジニアリングされたCas12iエフェクタータンパク質は、前記エンジニアリングされたCas12iヌクレアーゼまたはその機能的誘導体のN末端部分を含む第一ポリペプチドと前記エンジニアリングされたCas12iヌクレアーゼまたはその機能的誘導体のC末端部分を含む第二ポリペプチドを備え、そのうち前記第一ポリペプチドと前記第二ポリペプチドは、標的核酸と特異的に結合するクラスター化され、規則的に間隔があいた短い回文構造の繰り返し配列(CRISPR)複合体を形成するために、ガイド配列を含むガイドRNAの存在下で互いに会合することができ、前記標的核酸は前記ガイド配列に相補的なターゲット配列を含み;
好ましくは、前記第一ポリペプチドは項1-22のいずれかに記載のエンジニアリングされたCas12iヌクレアーゼのN末端部分アミノ酸残基1~Xを含み、前記第二ポリペプチドは項1-22のいずれかに記載のエンジニアリングされたCas12iヌクレアーゼのアミノ酸残基X+1~前記Cas12iヌクレアーゼのC末端を含み;
選択的に、前記第一ポリペプチドと前記第二ポリペプチドはそれぞれ二量化ドメインを含み;
選択的に、前記第一二量体ドメインと前記第二二量体ドメインは誘導剤の存在下で互いに会合している、項23から27のいずれか一項に記載のエンジニアリングされたCas12iエフェクタータンパク質。
【0035】
29.エンジニアリングされたCRISPR-Cas12iシステムであって
(a)項1から28のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ、または項23から28のいずれか一項に記載のエンジニアリングされたCas12iエフェクタータンパク質;及び
(b)ターゲット配列に相補的なガイド配列を含むガイドRNA、または前記ガイドRNAをコードする1つまたは複数の核酸を含み、
そのうち、前記エンジニアリングされたCas12iヌクレアーゼまたはエンジニアリングされたCas12iエフェクタータンパク質と前記ガイドRNAはCRISPR複合体を形成することができ、前記CRISPR複合体の特異的結合は前記ターゲット配列の標的核酸を含み、且つ標的核酸の修飾を誘導し;
好ましくは、前記ガイドRNAは前記ガイド配列を含むcrRNAであり;
さらに好ましくは、前記エンジニアリングされたCRISPR-Cas12iシステムは複数のcrRNAをコードする前駆体ガイドRNAアレイ(array)を含み;
または、好ましくは、前記エンジニアリングされたCas12iヌクレアーゼまたはエンジニアリングされたCas12iエフェクタータンパク質はメインエディタであり、前記ガイドRNAは、プライム編集ガイドRNA(pegRNA)である、エンジニアリングされたCRISPR-Cas12iシステム。
【0036】
30.前記エンジニアリングされたCas12iヌクレアーゼまたはエンジニアリングされたCas12iエフェクタータンパク質をコードする一つまたは複数のベクターを含み;
好ましくは、前記一つまたは複数のベクターは以下:レトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ベクター、単純ヘルペスベクターの群から選択され;
さらに好ましくは、前記一つまたは複数のベクターはアデノ随伴ウイルスAAVベクターであり;
さらに好ましくは、前記AAVベクターはまた前記ガイドRNAをコードする、項29に記載のエンジニアリングされたCRISPR-Cas12iシステム。
【0037】
31.サンプル中の標的核酸を検出する方法であって、
(a)サンプルを項29に記載のエンジニアリングされたCRISPR-Cas12iシステム及びタグ付けされた検出核酸と接触させ、該検出核酸は一本鎖であり、前記ガイドRNAのガイド配列とハイブリダイズしないこと;及び
(b)標的核酸を検出するために、前記エンジニアリングされたCas12iヌクレアーゼまたはエンジニアリングされたCas12iエフェクタータンパク質が前記タグ付けされた検出核酸を切断することによって生成される検出可能な信号を測定することを含む方法。
【0038】
32.ターゲット配列を含む標的核酸を修飾する方法であって、前記標的核酸を項29または30に記載のエンジニアリングされたCRISPR-Cas12iシステムに接触させることを含み;
好ましくは、前記方法はインビトロで、エクスビボまたはインビボで行われ;
さらに好ましくは、前記標的核酸は細胞中に存在し;
さらに好ましくは、前記細菌細胞、酵母細胞、哺乳動物細胞、植物細胞または動物細胞であり;
さらに好ましくは、前記標的核酸はゲノムDNAであり;
さらに好ましくは、前記ターゲット配列は疾患または障害に関連し;
さらに好ましくは、前記エンジニアリングされたCRISPR-Cas12iシステムは複数のcrRNAをコードする前駆体ガイドRNAアレイを含み、そのうち、各crRNAは異なるガイド配列を含む、方法。
【0039】
33.項29または30に記載のエンジニアリングされたCRISPR-Cas12iシステムの、個体の細胞中の標的核酸に関連する疾患または障害を治療するための薬剤の製造における使用であって;好ましくは、前記疾患または障害は、癌、心血管疾患、遺伝性疾患、自己免疫疾患、代謝性疾患、神経退行性疾患、眼病、細菌感染、及びウイルス感染からなる群より選択される、使用。
【0040】
34.個体の細胞中の標的核酸に関連する疾患または障害を治療する方法であって、前記方法は、項32に記載の方法によって前記個体の細胞中の標的核酸を修飾し、前記疾患または障害を治療することを含み、好ましくは、疾患または障害は、癌、心血管疾患、遺伝性疾患、自己免疫疾患、代謝性疾患、神経退行性疾患、眼病、細菌感染、及びウイルス感染からなる群より選択される、方法。
【0041】
35.ターゲット配列を含む標的核酸を修飾する方法であって、前記標的核酸を項29または30に記載のエンジニアリングされたCRISPR-Cas12iシステムに接触させることを含む、方法。
【0042】
36.項1から22のいずれか一項に記載のエンジニアリングされたCas12iヌクレアーゼ、項23から28のいずれか一項に記載のエンジニアリングされたCas12iエフェクタータンパク質を含む組成物またはキット。
【0043】
37.項32または35に記載の方法で修飾された標的核酸を含む、エンジニアリングされた細胞。
【0044】
38.一つまたは複数の項37に記載のエンジニアリングされた細胞を含む、エンジニアリングされた非ヒト動物。
【本出願の技術案が得た有益な効果】
【0045】
本出願でエンジニアリングされたCas12iヌクレアーゼ及びそのエフェクタータンパク質は、核酸基質を切断する触媒効率及び細胞内の遺伝子編集効率など、より高い活性を持っている。本出願におけるエンジニアリングされたCas12iヌクレアーゼは、従来のCas遺伝子編集ツールよりも優れた哺乳動物細胞(例えばヒト細胞)内の遺伝子編集効率を有し、例えば、本出願におけるいくつかの例示的なCas12i2ヌクレアーゼ変異体は、ヒト細胞中の複数の部位(例えば62個の部位)で遺伝子編集効率を試験したところ、57個の部位の遺伝子編集効率が約60%を超え、平均遺伝子編集効率は70%に近い。いくつかの実施形態では、本出願のエンジニアリングされたCas12iヌクレアーゼ及びそのエフェクタータンパク質は、タンパク質が小さく(1054aa)、crRNA成分が簡単であり、PAM配列が簡単であり、タンパク質自体が前駆体crRNAを加工することができるという1つまたは複数の利点も有する。さらに、本出願は、高活性エンジニアリングされたCas12iヌクレアーゼ(例えば、SEQ ID NO.8)に基づいてさらに人工的に改造された、より低いオフターゲット率とより高い特異性を有するCas12iヌクレアーゼを提供する。これらの利点により、本出願の効率的なエンジニアリングされたCas12iヌクレアーゼ及びそのエフェクタータンパク質は、インビボでの遺伝子編集または遺伝子制御に非常に適している。
【図面の簡単な説明】
【0046】
【
図1a】参照Cas12iヌクレアーゼ(SEQ ID NO.1に示す野生型Cas12iヌクレアーゼ)におけるPAMと相互作用するアミノ酸を正に帯電したアミノ酸に置き換えることにより、遺伝子編集効率を高める。同図に示すように、E176R、K238R、T447R、E563Rの4つの変異体はヒト293T細胞における遺伝子編集効率を著しく向上させることができる。
【
図1b】
図1aにおいて遺伝子編集効率を顕著に高めることができるアミノ酸変異(E176R、K238R、T447R、E563R)を組み合わせたところ、組み合わせた変異体がヒト293T細胞においてより高い遺伝子編集効率を示すことができる。
【
図2】参照Cas12iヌクレアーゼ中のDNA二本鎖の開放に関与するアミノ酸を芳香環付きアミノ酸に置換することにより、遺伝子編集の効率を高める。同図に示すように、Q163F、Q163Y、Q163W、N164F、N164Yのような変異体は、ヒト293T細胞における遺伝子編集効率を著しく向上させることができる。
【
図3a-3c】参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用するアミノ酸を正に帯電したアミノ酸に置き換えることにより、遺伝子編集の効率を高める。
図3a、3b、3cに示すように、E323R、L327R、V355R、G359R、G360R、D362R、N391R、Q424R、Q425R、N925R、I926R、G929Rなどの変異体はヒト293T細胞における遺伝子編集効率を著しく向上させることができる。
【
図3d】
図3a、3bにおける効率を高めた点突然変異を組み合わせたところ、組み合わせた変異体がヒト293T細胞においてより高い遺伝子編集効率を示すことができる。
【
図3e】
図3a、3bにおける効率を高める点突然変異と分子柔軟性原理に基づいて改造された変異(L439(L+GG)、I926G)を組み合わせたところ、組み合わせた変異体はヒト293T細胞においてより高い遺伝子編集効率を示すことができる。
【
図4】参照Cas12i酵素中のDNA-RNA二重らせんと相互作用するアミノ酸を正に帯電したアミノ酸に置換することにより、遺伝子編集効率を高める。
図4に示すように、G116R、E117R、T159R、S161R、E319R、E343R、D958Rとの変異体はヒト293T細胞における遺伝子編集効率を明らかに高めることができる。そのうち、D958R変異が最適である。
【
図5】
図1a~
図3e中の3つの改造策から得られた高効率変異体と分子柔軟性原理に基づいて改造された変異(L439(L+GG)、I926G)を組み合わせたところ、組み合わせた変異体はヒト293T細胞においてより高い遺伝子編集効率を示すことができる。組み合わせることにより遺伝子編集効率を大幅に向上させることができる。遺伝子編集効果が最も優れた変異体を選出し、CasXXと命名して後続の実験に使用する。CasXX(SEQ ID NO:8)は、E176R+K238R+T447R+E563R+N164Y+E323R+D362R変異の組み合わせ(アミノ酸配列SEQ ID NO:1に基づく参照Cas12i2)を有するCas12iエンジニアリング酵素である。
【
図6a】62個のヒトゲノム部位におけるCasXXの遺伝子編集効率のまとめである。PAM=NTTN。
【
図6b】CasXXとAsCas12a、BhCas12b v4遺伝子編集効率の比較である。
【
図6c】CasXXとSpCas9、SaCas9、SaCas9-KKH遺伝子編集効率の比較である。
【
図6d】マウスHepa1-6細胞系におけるCasXXの遺伝子編集効率の統計である。CasXXはマウスHepa1-6細胞内の65部位で強力な遺伝子編集能力を示し、平均遺伝子編集効率は60%を超えていることが分かった。
【
図7】
図7は、64ヒトゲノム部位におけるCasXXの遺伝子編集効率を示す。そのうち、この64部位に含まれるPAM配列は、NTTN、NTAN、NTCN、NTGN、NATN、NAAN、NACN、NAGN、NCTN、NCAN、NCCN、NCGN、NGTN、NGAN、NGCN、NGGNというすべてのNNNNの組み合わせをカバーする。
図7に示すように、CasXXはNTTN、NTAN、NTCN、NTGN、NATN、NAAN、NCTN、NCAN、NGTNというPAM配列で効率的な遺伝子編集効率を示し、これらの部位での平均遺伝子編集効率は40%を超えている。
【
図8】
図8は、野生型Cas12i2タンパク質(SEQ ID NO:1)及びCasXXタンパク質がインビトロで二本鎖DNAを切断した結果を示す。野生型Cas12i2タンパク質はNTTN PAMを含む二本鎖DNAに対してのみ部分切断の効率を持つが、残りのPAMに対して切断活性はほとんどない。しかし、CasXXタンパク質はNTTN、NTAN、NTCN、NTGN、NATN、NAAN、NACN、NCTN、NCAN、NGTN、NGAN PAMを含む二本鎖DNAに対していずれも効率的な切断効率を示している。NTTN、NTAN、NTCN、NATN、NAAN、NACN、NCTN、NCAN、NGTN PAMを含む二本鎖DNAをほぼ完全に切断することができる。
【
図9】Cas12i2(SEQ ID NO:1)とCas12i1(SEQ ID NO:13)のアミノ酸配列の相同性アライメントである。陰影で表示されたアミノ酸は2種類のCas12iタンパク質が同じであるアミノ酸を表し、白枠で表示されたアミノ酸は2種類のCas12iタンパク質の性質が似ているアミノ酸を表す。
【
図10】
図10は、GUIDE-Seqを用いたEMX1-7ターゲット部位におけるCasXXのオフターゲット効果の検出である。配列に続く数字は、各配列について測定された読み取り(reads)を表す。第1行の配列は参照ターゲット配列(SEQID NO:77)であり、下の配列はそれぞれターゲット配列とオフターゲット配列、及びターゲット配列とオフターゲット配列に二本鎖DNAタグが濃縮された読み取り(reads)を表す。該図は、CasXXがEMX1-7部位でオフターゲット効果があることを示している。
【
図11】
図11はCasXXの元の配列に新しい点突然変異を追加するか、元の点突然変異を削除し、新しいHF変異体を構築することである。実験結果により、R857A、N861a、K807A、N848A、R715A、R719A、K394A、H357A、K844AのCasXX配列に基づく単点突然変異体はEMX1-7-OT-1、EMX1-7-OT-2、EMX1-7-OT-3での挿入欠失の割合を効果的に低減できることが分かった。
【
図12】
図12はCasXXの元の配列に新しい点突然変異を追加するか、元の点突然変異を削除し、新しいHF変異体を構築することである。実験の結果により、R857A、N861a、K807A、N848A、R715A、R719A、K394A、H357A、K844AのCasXX配列に基づく単点突然変異体は、オフターゲットを模擬するcrRNA-RNF2-1-Mis-1/2、crRNA-RNF2-1-Mis-5/6、crRNA-RNF2-1-Mis-17/18とcrRNA-RNF2-1-Mis-19/20を使用する際に挿入欠失の割合を効果的に低減できることが分かった。
【
図13】
図13は、蛍光報告システムを用いて遺伝子編集の特異性を高める変異体(CasXXに基づくHF変異体)をスクリーニングする実験フローである。Casタンパク質をコードするプラスミド600ng、crRNAをコードするプラスミド300ng、mCherryをコードするプラスミド100ngを、24ウェル細胞培養ディッシュで培養した細胞にトランスフェクションした。3日間トランスフェクションした後、フローサイトメトリー分析を用いて各サンプルの残留mCherry陽性の割合を計算した。計算式を図のように示す。
【
図14】
図14は、CasXX及び変異体が293T細胞中でプラスミド上に位置するmCherry遺伝子を編集する図である。プラスミドのトランスフェクションした後、3日間培養し、フローサイトメトリー分析を行った。Casタンパク質の遺伝子編集効率が高いほど、細胞中のmCherry陽性の割合は低くなる。実験フローは
図13の実験フロー概略図に対応する;mCherry-FM、mCherry-Mis-1/2、mCherry-Mis-5/6、及びmCherry-Mis-19/20に対するスペーサー配列がそれぞれSEQ ID NO:37、38、39、40に示されている。
【
図15】
図15は、CasXXの元の配列に基づいて新しいHF変異体の組み合わせを構築する図である。実験の結果により、R857A、R719A、K394A、K844A、R719A/K844A及びR857A/K844AのようなCasXX配列に基づく変異体は、EMX1-7-OT-1、EMX1-7-OT-2、EMX1-7-OT-3でのオフターゲット挿入欠失の割合を効果的に低下させ、ターゲット部位での効率を犠牲にしないことが分かった。
【
図16】CasXXの元の配列に基づいて新しいHF変異体の組み合わせを構築する図である。実験結果により、R857A、R719A、K394A、K844A、R719A/K844A及びR857A/K844AのようなCasXX配列に基づく変異体は、オフターゲットを模擬するcrRNA-RNF2-1-Mis-1/2、crRNA-RNF2-1-Mis-5/6、crRNA-RNF2-1-Mis-17/18及びcrRNA-RNF2-1-Mis-19/20を用いた場合、挿入欠失の割合を効果的に低減することができ、ターゲット部位での効率を犠牲しないことが分かった。
【
図17】
図17は、CD34-7ターゲット部位におけるGUIDE-Seqを用いたCasXX及びCasXX+K394A変異体のオフターゲット効果の検出である。配列に続く数字は、各配列で測定されたreadsの数を表す。第1行の配列は参照ターゲット配列(SEQID NO:78)であり、下の配列はそれぞれターゲット配列とオフターゲット配列、及びターゲット配列とオフターゲット配列に二本鎖DNAタグが濃縮されたreadsの数を表す。該図は、CasXXがCD34-7部位でオフターゲット効果が存在することを示しているが、CasXX+K394A変異体はこの部位ではオフターゲット効果がないことを示している。
【発明を実施するための形態】
【0047】
なお、明細書及び特許請求の範囲では、特定の構成要素を指すためにいくつかの用語が使用されていることに留意されたい。当業者であれば、同じ構成要素を異なる用語を使用する場合があることを理解するのであろう。本明細書及び特許請求の範囲は、構成要素を区別する方法として名詞の差異を使用するのではなく、構成要素の機能上の差異を区分の基準として使用する。明細書及び特許請求の範囲全体で言及された「含有する」又は「含む」は開放的な用語であるため、「含むがこれに限定されない」と解釈すべきである。明細書における以下の記載は、本発明を実施するための好ましい実施形態であるが、これらの記載は、明細書の一般的な原理を目的としたものであり、本発明の範囲を限定するためのものではない。本発明の保護範囲は、添付の請求の範囲に定義されたものに準拠する。特に定義されていない限り、本明細書で使用されるすべての技術用語及び科学用語は、本開示が属する分野の一般的な技術者が通常理解しているものと同じ意味を有する。
【0048】
I.用語
本明細書で使用される場合、「エフェクタータンパク質」とは、部位特異的結合活性、一本鎖DNA切断活性、二鎖DNA切断活性、一本鎖RNA切断活性、DNAまたはRNA修飾(例えば切断、塩基置換、挿入、削除)または転写調節活性などの活性を有するタンパク質を指す。
【0049】
本明細書で使用される場合、「ガイドRNA」と「gRNA」は、本明細書で交換可能に使用され、Cas12iエフェクタータンパク質及び標的核酸(例えば、二本鎖DNA)と複合体を形成することができるRNAを指す。本明細書はまた、複数のcrRNAに加工することができる前駆体ガイドRNAアレイを考慮した。「crRNA」または「CRISPR RNA」は、CRISPR複合体が標的核酸のターゲット配列に特異的に結合することを指示する、標的核酸(例えば、二本鎖DNA)のターゲット配列と十分な相補性を有するガイド配列を含む。
【0050】
本明細書で使用される「CRISPRアレイ」という用語は、最初のCRISPRリピートの最初のヌクレオチドから始まり、最後の(末端の)CRISPRリピートの最後のヌクレオチドで終わる、CRISPRリピートとスペーサーとを含む核酸(例えばDNA)断片を指す。典型的には、CRISPRアレイ内の各スペーサーは2つのリピートの間に位置する。本明細書で使用される用語「CRISPRリピート」または「CRISPR直接リピート」または「直接リピート」は、CRISPRアレイにおいて非常に小さな配列変化または配列変化のない複数の短い直接リピート配列を意味する。適切には、直接リピートがステムループ構造を形成することができる。
【0051】
用語「核酸」、「ポリヌクレオチド」及び「ヌクレオチド配列」は交換可能に使用され、デオキシリボヌクレオチド、リボヌクレオチド、それらの組み合わせ及びそれらの類似物を含む任意の長さのヌクレオチドの重合形態を指す。「オリゴヌクレオチド」及び「Oligonucleotide」は交換可能に使用され、約50ヌクレオチド未満の短いポリヌクレオチドを指す。本明細書で使用される場合、「相補性」とは、従来のワトソン・クリーク(Watson-Crick)塩基対を介して核酸が他の核酸と水素結合を形成する能力を意味する。相補性パーセントは、第2の核酸と水素結合(すなわち、ワトソン-クリーク塩基対)を形成することができる核酸分子中の残基のパーセント(例えば、10分の5、6、7、8、9、10、それぞれ約50%、60%、70%、80%、90%、100%)を表す。「完全相補的」とは、核酸配列のすべての連続残基が第2の核酸配列中の同じ数の連続残基と水素結合を形成することを意味する。本明細書で使用される場合、「基本的に相補的」とは、約40、50、60、70、80、100、150、200、250またはそれ以上のヌクレオチドの領域において、相補性の程度が少なくとも約70%、75%、80%、85%、90%、95%、97%、98%、99%、または100のいずれかであるか、またはストリンジェントな条件下でハイブリダイゼーションされた2つの核酸を指す。
【0052】
本明細書で使用される場合、ハイブリダイゼーションのための「ストリンジェントな条件」とは、ターゲット配列と相補性を有する核酸が主としてターゲット配列とハイブリダイゼーションされ、非ターゲット配列と基本的にハイブリダイゼーションされない条件を指す。ストリンジェントな条件は通常、配列依存性であり、多くの要因に応じて変化する。一般に、配列が長いほど、配列とそのターゲット配列との特異的なハイブリダイゼーションの温度は高くなる。ストリンジェントな条件の非限定的な例は、Tijssen (1993), Laboratory Techniques In Biochemistry And Molecular Biology- Hybridization With Nucleic Acid Probes、第一部第2章「Overview of principles of hybridization and the strategy of nucleic acid probe assay,」,Elsevier, N,Yに詳細に記述されている。
【0053】
「ハイブリダイゼーション」とは、一つまたは複数のポリヌクレオチドが反応して複合体を形成する反応を意味し、前記複合体がヌクレオチド残基の塩基間の水素結合によって安定化される。水素結合は、ウォゼンクリーク塩基対、ホグスタイン(Hoogstein)結合、または任意の他の配列特異的な方法で発生することができる。所定の配列とハイブリダイゼーション可能な配列を、所定の配列の「相補体」と呼ぶ。
【0054】
核酸配列に対する「配列同一性パーセント(%)」は、(必要に応じて)最大の配列同一性パーセントを達成するためにギャップ(gaps)を許容することによって配列をアライメントした後、候補配列中の特定の核酸配列中のヌクレオチドと同じヌクレオチドのパーセントと定義される。ペプチド、ポリペプチドまたはタンパク質配列の「配列同一性パーセント(%)」は、(必要に応じて)最大の配列同一性パーセントを達成するためにギャップを許容することによって配列をアライメントした後、候補配列中の特定のペプチドまたはアミノ酸配列中のアミノ酸残基と同じ置換されたアミノ酸残基のパーセントである。アミノ酸配列の同一性パーセントを決定する目的で、例えば、BLAST、BLAST-2、ALIGNまたはMEGALIGNTM(DNASTAR)ソフトウェアのような一般的に入手可能なコンピュータソフトウェアを使用し、当該技術分野の技術範囲内の様々な方法で実現することができる。当業者は、比較される配列の全長にわたって最大のアライメントを達成するために必要な任意のアルゴリズムを含む、測定とアライメントのための適切なパラメータを決定することができる。
【0055】
用語「ポリペプチド」及び「ペプチド」は、本明細書で交換可能に使用され、任意の長さのアミノ酸のポリマーを指す。前記ポリマーは、直鎖または分岐鎖であってもよく、修飾アミノ酸を含んでもよく、非アミノ酸によって中断されてもよい。タンパク質は、1つまたは複数のポリペプチドを有することができる。この用語は、例えば、ジスルフィド結合の形成、グリコシル化、脂質化、アセチル化、リン酸化、または他の任意の操作(標識成分との結合)など修飾されたアミノ酸ポリマーも含まれている。
【0056】
本明細書で使用される場合、「バリアント(Variant)」は、それぞれ参照ポリヌクレオチドまたはポリペプチドとは異なるが、必要な特性を保持するポリヌクレオチドまたはポリペプチドと解釈される。ポリヌクレオチドの典型的なバリアントは、別の参照ポリヌクレオチドの核酸配列とは異なる。バリアント核酸配列の変化は、参照ポリヌクレオチドによってコードされるポリペプチドのアミノ酸配列を変化させてもよいし、変化させなくてもよい。ヌクレオチドの変化は、以下に説明するように、参照配列によってコードされるポリペプチド中のアミノ酸置換、添加、欠失、融合、及びトランケートをもたらすことがある。ポリペプチドの典型的なバリアントは、アミノ酸配列上の別の参照ポリペプチドとは異なる。一般に、差異は限られており、参照ポリペプチドとバリアントの配列は全体的に非常に類似し、多くの領域で同じである。バリアント及び参照ポリペプチドのアミノ酸配列は、1つまたは複数の置換、添加、欠失の任意の組み合わせによって異なることができる。置換または挿入されたアミノ酸残基は、遺伝暗号でコードされたアミノ酸残基であってもよく、またはそうでなくてもよい。ポリヌクレオチドまたはポリペプチドのバリアントは天然に存在する(対立遺伝子バリアントなど)ことができ、あるいは未知の天然に存在するバリアントであることができる。ポリヌクレオチド及びポリペプチドの天然に存在しないバリアントは、変異誘発技術、直接合成、及び当業者に知られている他の組換え方法によって製造することができる。
【0057】
本明細書で使用される場合、用語「野生型」は、自然の中に存在するときに変異体またはバリアントと区別される、典型的な形態の生物、菌株、遺伝子または特徴を意味する、当業者に一般的に理解されている意味を有する。自然界の資源から隔離され、意図的に修飾されていない。
【0058】
本明細書で使用される場合、用語「天然に存在しない」または「エンジニアリングされた(操作された」は交換可能に使用され、人為的関与を意味する。これらの用語が核酸分子またはポリペプチドを記述するために使用される場合、前記核酸分子またはポリペプチドは、その天然結合または天然に存在する少なくとも1つの他の成分を少なくとも基本的に含まないことを意味する。
【0059】
本明細書で使用される場合、用語「オーソログ(orthologue/ortholog)」は、当業者に一般的に理解される意味を有する。さらなる指導として、本明細書でいうタンパク質の「オーソログ」とは、そのオーソログであるタンパク質と同一または類似の機能を実行する異なる種に属するタンパク質を指す。
【0060】
本明細書で使用される場合、用語「同一性」は、2つのポリペプチド間または2つの核酸間の配列マッチングを表すために使用される。2つの比較配列の1つ位置が同じ塩基またはアミノ酸モノマーサブユニットによって占められている場合(例えば、2つのDNA分子のそれぞれの1つの位置がアデニンによって占められているか、または2つのポリペプチドのそれぞれの1つの位置がリシンによって占められている)、その位置にはそれぞれの分子が同じである。2つの配列間の「同一性パーセント」は、2つの配列に共通するマッチング位置数を、比較する位置数で割ったものx100の関数です。例えば、2つの配列の10の位置のうち6つが一致している場合、2つの配列は60%の同一性を持っている。例えば、DNA配列CTGACTとCAGTTは50%の同一性を有している(合計6箇所中3箇所が一致している)。通常、この比較は、最大の同一性を達するように2つの配列をアライメントする場合に行われる。この比較は、例えば、Needleman et al. (1970) J. Mol. Biol. 48: 443-453の方法によって実現することができ、前記方法は、比較(Align)プログラム(DNAstar,Inc.)のようなコンピュータプログラムによって容易に行うことができる。PAM120の重み付き残基テーブルを用いてもよく、E.MeyersとW.ミラーのアルゴリズム(Comput. Appl Biosci., 4: 11-17 (1988))を用いてALIGNプログラム(バージョン2.0)に統合されている。2つのアミノ酸配列間の同一性パーセントを決定するために、ギャップ長ペナルティ12とギャップペナルティ4にする。さらに、2つのアミノ酸配列間の同一性パーセントを決定するために、16、14、12、10、8、6または4のギャップ重み、1、2、3、4、5または6の長さ重みを持つBlossum62行列またはPAM250行列を用いて、GCGパッケージ(www.gcg.comから入手可能)に統合されたGAPプログラム内のNeedleman及びWunsch(J MoI Biol.48:444-453(1970))アルゴリズムを使用することができる。
【0061】
本明細書で使用される「細胞」は、特定の単一細胞だけでなく、その細胞の子孫(後代)または潜在的子孫を指すと理解されるべきである。変異や環境影響により子孫に何らかの修飾が生じる可能性があるため、そのような子孫は実際には親細胞とは異なるかもしれないが、本明細書の用語の範囲内に含まれている。
【0062】
本明細書で使用される場合、用語「形質導入」及び「トランスフェクション」は、目的のタンパク質または分子を発現するために、当技術分野で知られている感染剤(例えばウイルス)または他の方法を用いてDNAを細胞に導入する方法を含む。ウイルスまたはウイルスに類似する試薬の他に、リン酸カルシウム、樹状ポリマー、リポソームまたはカチオン性ポリマー(例えばDEAE-デキストランまたはポリエチレンイミン)を用いたトランスフェクションなどの化学的トランスフェクション方法、エレクトロポレーション、細胞押出(cell squeesing)、ソノポレーション(sonoporation)、光学トランスフェクション、穿刺トランスフェクション(impalefection)、原形質体融合、プラスミド送達またはトランスポゾンなどの非化学的方法、遺伝子銃、磁気トランスフェクションまたは磁石を利用したトランスフェクション、粒子衝撃などの粒子に基づく方法、及びハイブリダイゼーション方法(ヌクレオフェクションなど)がある。
【0063】
本明細書で使用される場合、用語「トランスフェクションされた」、「形質転換された」または「形質導入された」は、外来性核酸を宿主細胞に移動または導入するプロセスを指す。「トランスフェクションされた」、「形質転換された」、または「形質導入された」細胞は、外因性核酸でトランスフェクションされ、形質転換され、または形質導入された細胞である。
【0064】
用語「インビボ」は、細胞がそこから得られる生物の体内を指す。「インビトロ」または「エクスビボ」とは、そこから細胞を得るこの生物の体外を意味する。
【0065】
本明細書で使用される場合、「治療(treatment/treating)」は、有益な結果または所望の結果(臨床結果を含む)を得るための方法である。本発明の目的のために、有益なまたは所望の臨床結果としては、下記の1つまたは複数を含むが、これらに限定されない:疾患による一つまたは複数の症状の軽減、疾患の程度の軽減、疾患の安定化(例えば、疾患の悪化の予防または遅延)、疾患の拡散(例えば、転移)の予防または遅延、疾患の再発の予防または遅延、疾患の再発率の低下、疾患の進行の遅延または遅延、疾患状態の改善、疾病の(一部または全部)緩和を提供し、該疾病の治療に必要な1つまたは複数の他の薬物の用量を減らし、疾病の進展を遅らせ、生活の質を高め、及び/または生存期間を延長する。「治療」には、病気、病状、または病気の病理的結果を減少させることも含まれる。本発明の方法は、これらの治療の態様のいずれか1つまたは複数を考慮した。
【0066】
本明細書で使用される場合、用語「有効量」は、特定の障害、状態または疾患(例えば、1つまたは複数の症状の改善、緩和、軽減、及び/または遅延)を治療するのに十分な化合物または組成物の量を意味する。当技術分野で理解されるように、「有効量」は、1回または複数回の投与ができ、即ち、所望の治療終点を達成するために一回または複数回の投与を必要とする。
【0067】
「被験者」、「個体」、または「患者」は、本明細書において交換可能に使用され、治療の目的を達成するために、哺乳動物として分類される任意の動物を指し、ヒト、家畜、及び農場動物、犬、馬、猫、牛などの動物園、農場またはペット動物が含まれる。いくつかの実施形態では、前記個体はヒト個体である。
【0068】
本明細書に記載の本発明の実施形態は、「…からなる」及び/または「基本的に…からなる」実施形態を含むことが理解されるべきである。本明細書における「約」値またはパラメータの言及には、その値またはパラメータ自体に対する変化が含まれる(及び記述される)。例えば、「約X」についての説明は、「X」についての説明を含む。
【0069】
本明細書で使用される場合、「ノー」値またはパラメータの言及は、一般に、「…以外」値またはパラメータを意味して記述している。例えば、前記方法はX型癌の治療には使用されないというのは、X型以外の癌の治療に使用されることを意味する。
【0070】
本明細書で使用される場合、用語「約X-Y」は、「約X~約Y」と同じ意味を持つ。
【0071】
本明細書及び添付の特許請求の範囲で使用されるように、単数形「1つ/1種(a/an)」及び「前記」は、文脈が特に明記しない限り、複数のオブジェクトを含む。特許請求の範囲は、任意のオプションの要素を除外するように記述することもできることにも注意してください。したがって、この記述は、特許請求の範囲の要素の記述と組み合わせて、「ただ」、「のみ」などの排他的な用語を使用するための先行的な基礎として、または「ノー」を使用するための制限として意図されている。
【0072】
本明細書で使用される場合、用語「及び/または」は、「A及び/またはB」などの用語において、A及びBの両方を含むことを意図し、AまたはB、A(単独)、及びB(単独)。同様に、本明細書で使用される場合、用語「及び/または」は、「A、B、及び/またはC」などの用語において、以下:A、B、及びC、A、BまたはC、AまたはC、AまたはB、BまたはC、AとC、AとB、BとC、A(単独)、B(単独)、及びC(単独)の各実施形態を含むことを目的とする。
【0073】
II.Cas12iヌクレアーゼ及びエフェクタータンパク質
エンジニアリングされたCas12iヌクレアーゼ
いくつかの実施形態では、エンジニアリングされたCas12iヌクレアーゼを提供し、前記エンジニアリングされたCas12iヌクレアーゼは、参照Cas12iヌクレアーゼに基づく下記の1つまたは複数(例えば、2つ、3つ、4つまたは5つ)の変異を含み、前記変異は以下の
(1)参照Cas12iヌクレアーゼ中のPAMと相互作用するアミノ酸を正に帯電したアミノ酸(R、H、Kなど)に置換すること;
(2)参照Cas12iヌクレアーゼ中のDNA二本鎖の開放に関与するアミノ酸を、芳香環付きアミノ酸(例えば、F、YまたはW)に置換すること;
(3)参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用するアミノ酸を、正に帯電したアミノ酸(例えばR、HまたはK)に置換すること;
(4)参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用するアミノ酸を、正に帯電したアミノ酸(例えばR、HまたはK)に置換すること;及び
(5)参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数の極性または正に帯電したアミノ酸を疎水性アミノ酸(例えば、A、V、I、L、M、F、Y、P、CまたはW)に置換することから選択される。いくつかの実施形態では、前記参照Cas12iヌクレアーゼは、SEQ ID NO:1に示されるようなアミノ酸配列を有する野生型Cas12i2ヌクレアーゼなどの天然Cas12iヌクレアーゼである。いくつかの実施形態では、前記参照Cas12iヌクレアーゼは、天然バリアントなどのCas12iヌクレアーゼのバリアントである。いくつかの実施形態では、前記参照Cas12iヌクレアーゼは、上記(1)~(5)の1つまたは複数の変異を含まないエンジニアリングされたCas12i(例えば、Cas12i2またはCas12i1)ヌクレアーゼである。いくつかの実施形態では、前記アミノ酸位置は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記アミノ酸位置は、SEQ ID NO:1と異なる配列を有する野生型Cas12iヌクレアーゼのSEQ ID NO:1に対応するアミノ酸位置によって定義される。
【0074】
本明細書で使用される場合、「アミノ酸はX位置にあり、そのうち、前記アミノ酸位置はSEQ ID NO:1に示される野生型Cas12iヌクレアーゼの対応するアミノ酸位置によって定義される」、または「該アミノ酸は、SEQ ID NO:1と異なる配列を有する野生型Cas12iヌクレアーゼのSEQ ID NO:1に対応するアミノ酸位置によって定義されるようなX位置にあり、そのアミノ酸残基は、参照酵素Cas12iのある位置にあり、SEQ ID NO:1のX位置に相当し、また、参照酵素Cas12iのアミノ酸配列とSEQ ID NO:1のアミノ酸配列は配列同一性に基づいて互いに整列している。例えば、
図7はCas12i2(SEQ ID NO:1)とCas12i1(SEQ ID NO:13)のアミノ酸配列の相同性比較を示している。当業者は、Clustal Omegaのような当業者によく使用されるソフトウェアを用いて、いずれかに記載の参照Cas12iヌクレアーゼのアミノ酸配列とSEQ ID NO:1との配列同一性比較と整列(alignment)を行い、さらに、本出願に記載のSEQ ID NO:1に基づいて定義されたアミノ酸部位に対応する参照Cas12iヌクレアーゼ中のアミノ酸部位を得ることができる。
【0075】
本出願は、上述の5つの改造原理の任意の1つまたは複数の組合せに基づくアミノ酸変異を導入することにより、インビトロ及び/またはインビボ酵素活性(例えばDNA一本鎖または二本鎖切断活性)の増加(例えば遺伝子の切断効率が約100倍増加した)、PAM数の増加を識別することができ(例えば、
図8から分かるように、野生型の酵素はPAMを識別することができ、上述のアミノ酸突然変異に基づくCasXX酵素は少なくとも11種類のPAMを識別することができる)、及び/またはオフターゲット率を低下させ、特異性を高める(例えば、表18から分かるように、CasXXに対するHF-Casのオフターゲット効率は約99%低下することができる)。前記エンジニアリングされたCas12iヌクレアーゼは、下記の1)~6)セクションに記載の1つまたは複数の特定の変異を含む。いくつかの実施形態では、本明細書に記載された任意の1つまたは複数の変異を、より高い活性を有するエンジニアリングされたCas12iヌクレアーゼを提供するために、既存のCas12i変異(例えば、下記の7)セクションに記載された変異)と組み合わせることができる。
【0076】
いくつかの実施形態では、エンジニアリングされたCas12iヌクレアーゼを提供し、前記エンジニアリングされたCas12iヌクレアーゼは、参照Cas12iヌクレアーゼ中のPAMと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する変異を含む。いくつかの実施形態では、エンジニアリングされたCas12iヌクレアーゼを提供し、前記エンジニアリングされたCas12iヌクレアーゼは、参照Cas12iヌクレアーゼ中のDNA二本鎖の開放に関与する1つまたは複数のアミノ酸を芳香環付きアミノ酸に置換する変異を含む。いくつかの実施形態では、エンジニアリングされたCas12iヌクレアーゼを提供し、前記エンジニアリングされたCas12iヌクレアーゼは、参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する変異を含む。いくつかの実施形態では、エンジニアリングされたCas12iヌクレアーゼを提供し、前記エンジニアリングされたCas12iヌクレアーゼは、参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する変異を含む。いくつかの実施形態では、エンジニアリングされたCas12iヌクレアーゼを提供し、前記エンジニアリングされたCas12iヌクレアーゼは、参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数の極性または正に帯電したアミノ酸を疎水性アミノ酸に置換する変異を含む。
【0077】
いくつかの実施形態では、エンジニアリングされたCas12iヌクレアーゼを提供し、前記エンジニアリングされたCas12iヌクレアーゼは、1)参照Cas12iヌクレアーゼ中のPAMと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する変異、及び2)参照Cas12iヌクレアーゼ中のDNA二本鎖の開放に関与する1つまたは複数のアミノ酸を芳香環付きアミノ酸に置換する変異を含む。いくつかの実施形態では、エンジニアリングされたCas12iヌクレアーゼを提供し、前記エンジニアリングされたCas12iヌクレアーゼは、1)参照Cas12iヌクレアーゼ中のPAMと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する変異、及び2)参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する変異を含む。いくつかの実施形態では、エンジニアリングされたCas12iヌクレアーゼを提供し、前記エンジニアリングされたCas12iヌクレアーゼは、1)参照Cas12iヌクレアーゼ中のDNA二本鎖の開放に関与する1つまたは複数のアミノ酸を芳香環付きアミノ酸に置換する変異、及び2)参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数の極性または正に帯電したアミノ酸を疎水性アミノ酸に置換する変異も含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、フレキシブル領域の柔軟性を高めるために、1つまたは複数のフレキシブル領域の変異(例えば、Gに置換し、及び/または、その後に1つまたは2つのGを挿入する)をさらに含む。いくつかの実施形態では、このように修正されたCas12iエンジニアリングされた酵素は、少なくとも約10%の柔軟性、例えば、少なくとも約20%、30%、50%、100%、150%、200%、500%、1000%またはより高い柔軟性を増加させる。
【0078】
いくつかの実施形態では、エンジニアリングされたCas12iヌクレアーゼを提供し、前記エンジニアリングされたCas12iヌクレアーゼは、1)参照Cas12iヌクレアーゼ中のPAMと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する変異、及び2)参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸アミノ酸を正に帯電したアミノ酸に置換する変異を含む。いくつかの実施形態では、エンジニアリングされたCas12iヌクレアーゼを提供し、前記エンジニアリングされたCas12iヌクレアーゼは、1)参照Cas12iヌクレアーゼ中のDNA二本鎖の開放に関与する1つまたは複数のアミノ酸を芳香環付きアミノ酸に置換する変異、及び2)参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する変異を含む。いくつかの実施形態では、エンジニアリングされたCas12iヌクレアーゼを提供し、前記エンジニアリングされたCas12iヌクレアーゼは、1)参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する変異、及び2)参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸アミノ酸を正に帯電したアミノ酸に置換する変異含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数の極性または正に帯電したアミノ酸を疎水性アミノ酸に置換する変異も含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、フレキシブル領域の柔軟性を高めるための1つまたは複数のフレキシブル領域の変異をさらに含む。
【0079】
いくつかの実施形態では、エンジニアリングされたCas12iヌクレアーゼを提供し、前記エンジニアリングされたCas12iヌクレアーゼは、1)参照Cas12iヌクレアーゼ中のPAMと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する変異、2)参照Cas12iヌクレアーゼ中のDNA二本鎖の開放に関与する1つまたは複数のアミノ酸を芳香環付きアミノ酸に置換する変異、及び3)参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する変異を含む。いくつかの実施形態では、エンジニアリングされたCas12iヌクレアーゼを提供し、前記エンジニアリングされたCas12iヌクレアーゼは、1)参照Cas12iヌクレアーゼ中のPAMと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する変異、2)参照Cas12iヌクレアーゼ中のDNA二本鎖の開放に関与する1つまたは複数のアミノ酸を芳香環付きアミノ酸に置換する変異、及び3)参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸アミノ酸を正に帯電したアミノ酸に置換する変異を含む。いくつかの実施形態では、エンジニアリングされたCas12iヌクレアーゼを提供し、前記エンジニアリングされたCas12iヌクレアーゼは、1)参照Cas12iヌクレアーゼ中のPAMと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する変異、2)参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する変異、及び3)参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸アミノ酸を正に帯電したアミノ酸に置換する変異を含む。いくつかの実施形態では、エンジニアリングされたCas12iヌクレアーゼを提供し、前記エンジニアリングされたCas12iヌクレアーゼは、1)参照Cas12iヌクレアーゼ中のDNA二本鎖の開放に関与する1つまたは複数のアミノ酸を芳香環付きアミノ酸に置換する変異、2)参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する変異、及び3)参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸アミノ酸を正に帯電したアミノ酸に置換する変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数の極性または正に帯電したアミノ酸を疎水性アミノ酸に置換する変異も含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、フレキシブル領域の柔軟性を高めるための1つまたは複数のフレキシブル領域変異をさらに含む。
【0080】
いくつかの実施形態では、エンジニアリングされたCas12iヌクレアーゼを提供し、前記エンジニアリングされたCas12iヌクレアーゼは、1)参照Cas12iヌクレアーゼ中のPAMと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する変異、2)参照Cas12iヌクレアーゼ中のDNA二本鎖の開放に関与する1つまたは複数のアミノ酸を芳香環付きアミノ酸に置換する変異、3)参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換すること、及び4)参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸アミノ酸を正に帯電したアミノ酸に置換する変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数の極性または正に帯電したアミノ酸を疎水性アミノ酸に置換する変異も含む。いくつかの実施形態では、エンジニアリングされたCas12iヌクレアーゼを提供し、前記エンジニアリングされたCas12iヌクレアーゼは、1)参照Cas12iヌクレアーゼ中のPAMと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する変異、2)参照Cas12iヌクレアーゼ中のDNA二本鎖の開放に関与する1つまたは複数のアミノ酸を芳香環付きアミノ酸に置換する変異、3)参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する変異、4)参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸アミノ酸を正に帯電したアミノ酸に置換する変異、及び5)参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数の極性または正に帯電したアミノ酸を疎水性アミノ酸に置換する変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、フレキシブル領域の柔軟性を高めるための1つまたは複数のフレキシブル領域変異をさらに含む。
【0081】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、SEQ ID NO:1に示される対応するアミノ酸位置に対する変異:N164Y+E176R+K238R+E323R+D362R+T447R+E563R(これから「CasXX」と命名する)を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、SEQ ID NO:8の配列を含む。
【0082】
1)参照Cas12iヌクレアーゼ中のPAMと相互作用するアミノ酸を正に帯電したアミノ酸に置換すること
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、参照Cas12iヌクレアーゼ中のPAMと相互作用するアミノ酸をR、H、Kなどの正に帯電したアミノ酸に置換するための参照Cas12iヌクレアーゼ(例えばCas12i2)に基づく1つまたは複数の変異を含む。いくつかの実施形態では、エンジニアリングされたCas12iヌクレアーゼは、1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つまたはそれ以上の前記アミノ酸残基の置換を含む。
【0083】
いくつかの実施形態では、前記PAMと相互作用するアミノ酸は、PAMと三次元構造上距離が9Å以内のアミノ酸であり、例えば、PAMと三次元構造上距離が9Å以内のアミノ酸、PAMと三次元構造上距離が8Å以内のアミノ酸、PAMと三次元構造上距離が7Å以内のアミノ酸、PAMと三次元構造上距離が6Å以内のアミノ酸、PAMと三次元構造上距離が5Å以内のアミノ酸、PAMと三次元構造上距離が4Å以内のアミノ酸、PAMと三次元構造上距離が3Å以内のアミノ酸、PAMと三次元構造上距離が2Å以内のアミノ酸、またはより近いアミノ酸であってもよい。
【0084】
PAMとアミノ酸の空間構造上の距離は、解析されたCasタンパク質-RNA-DNA三次元複合体の3D構造(PDBファイル)中の原子間の距離によって定義され、原子間の相互距離はPDBファイル識別ソフトウェアによって表示されることができる。いくつかの実施形態では、前記PAMとアミノ酸の空間構造上の距離は、アミノ酸残基とヌクレオチドに含まれる原子との間の最小距離によって定義される。PAMとアミノ酸の空間構造上の距離を測定するために用いることができるプログラム、またはPDBファイル識別ソフトウェアは当技術分野で広く知られており、PyMOL、ChimeraX、Swiss-pdbviewerなどを含むが、これらに限定されない。
【0085】
いくつかの実施形態では、前記参照Cas12iヌクレアーゼ中のPAMと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する変異は、176、178、226、227、229、237、238、264、447、563のうちの1つまたは複数の位置におけるアミノ酸の変異である。いくつかの実施形態では、前記参照Cas12iヌクレアーゼ中のPAMと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する変異は、E176、E178、Y226、A227、N229、E237、K238、K264、T447、E563のうちの1つまたは複数のアミノ酸の変異である。いくつかの実施形態では、前記参照Cas12iヌクレアーゼ中のPAMと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する変異は、E176、K238、T447及びE563のうちの1つまたは複数のアミノ酸の変異である。いくつかの実施形態では、前記参照Cas12iヌクレアーゼ中のPAMと相互作用するアミノ酸を正に帯電したアミノ酸に置換する変異は、E563などの563番アミノ酸残基に位置する。いくつかの実施形態では、前記アミノ酸位置は、SEQ ID NO:1に示される野生型Cas12iヌクレアーゼの対応するアミノ酸位置によって定義される。
【0086】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、E176R、E178R、Y226R、A227R、N229R、E237R、K238R、K264R、T447R、及びE563Rのうちの1つまたは複数のアミノ酸の変異を含み、SEQ ID NO:1に示される野生型Cas12iヌクレアーゼの対応するアミノ酸位置によって定義される。
【0087】
本明細書の文脈において、E176の意味は、引用されたアミノ酸配列(例えば、SEQ ID NO:1に対して)において、176番目のアミノ酸E(グルタミン酸)であり、そのうち、一般的なアミノ酸とその三文字と一文字の略語は下記のように説明される:アラニンAla A、アルギニンArg R、アスパラギンAsp D、システインCys C、グルタミンGln Q、グルタミン酸Glu E、ヒスチジンHisH、イソロイシンIle I、グリシンGly G、アスパラギンAsn N、ロイシンLeu L、リジンLys K、メチオニンMet M、フェニルアラニンPhe F、プロリンProP、セリンSer S、トレオニンThr T、ロイシンTrp W、チロシンTyr Y、バリンVal V。
【0088】
いくつかの実施形態では、前記参照Cas12iヌクレアーゼ中のPAMと相互作用するアミノ酸を正に帯電したアミノ酸に置換する変異は、参照Cas12iヌクレアーゼ中の対応するアミノ酸残基をR、HまたはK、例えばRまたはKに置換することである。いくつかの実施形態では、前記参照Cas12iヌクレアーゼ中のPAMと相互作用するアミノ酸を正に帯電したアミノ酸に置換する変異は、参照Cas12iヌクレアーゼ中の対応するアミノ酸残基をRに置換することである。
【0089】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、176R、238R、447R、及び563Rのうちの1つまたは複数のアミノ酸変異を含み、そのうち、前記アミノ酸の位置が、SEQ ID NO:1に示される野生型Cas12iヌクレアーゼの対応するアミノ酸位置に定義される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、参照Cas12iヌクレアーゼに基づく下記の1つまたは複数の変異を含む:E176、K238、T447、及びE563、そのうち、アミノ酸位置番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、参照Cas12iヌクレアーゼに基づく下記の1つまたは複数の変異を含む:E176R、K238R、T447R及びE563R、そのうち、アミノ酸位置番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはE563R変異を含む、そのうち、アミノ酸位置番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、遺伝子編集効率を改善する目的で、上記のエンジニアリングされたCas12iヌクレアーゼ(参照Cas12iヌクレアーゼ中のPAMと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する)と少なくとも約85%(例えば、少なくとも約86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%)の配列同一性を有するエンジニアリングされたCas12iヌクレアーゼを使用することもできる。
【0090】
本明細書の文脈において、E176Rは、引用されたアミノ酸配列において、176番目のアミノ酸E(グルタミン酸)をR(アルギニン)に置換することを意味する。
【0091】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは下記の(i)176、238、264、447、563、176+238、176+447、176+563、238+447、238+563、447+563、176+238+447、176+238+563、176+447+563、238+447+563、176+238+447+563、のアミノ酸残基位置におけるいずれかの変異または変異の組み合わせを含み;そのうち、アミノ酸位置番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、参照Cas12iヌクレアーゼ中のPAMと相互作用する1つまたは複数のアミノ酸をプラスに帯電したアミノ酸に置換することは、R、H、またはK、例えばRまたはK、好ましくはRに置換することが含まれる。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、下記の:E176、K238、E264、T447、E563、E176+K238、E176+T447、E176+E563、K238+T447、K238+E563、T447+E563、E176+K238+T447、E176+K238+E563、E176+T447+E563、K238+T447+E563、及びE176+K238+T447+E563のアミノ酸残基のいずれかの変異または変異の組み合わせを含み;そのうち、アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される。
【0092】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは下記のE176R、K238R、E264R、T447R、E563R、E176R+K238R、E176R+T447R、E176R+E563R、K238R+T447R、K238R+E563R、T447R+E563R、E176R+K238R+T447R、E176R+K238R+E563R、E176R+T447R+E563R、K238R+T447R+E563R、及びE176R+K238R+T447R+E563Rの変異/変異の組み合わせのいずれかを含み;そのうち、アミノ酸位置番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは下記のE563R、E176R+T447R、E176R+E563R、K238R+E563R、E176R+K238R+T447R、E176R+K238R+E563R、E176R+T447R+E563R、及びE176R+K238R+T447R+E563Rの変異/変異の組み合わせのいずれかを含み;そのうち、アミノ酸位置番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、E176R+K238R+T447R+E563R変異の組み合わせを含み;そのうち、アミノ酸位置番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。遺伝子編集効率を改善する目的で、前記エンジニアリングされたCas12iヌクレアーゼ(参照Cas12iヌクレアーゼ中のPAMと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換する)と少なくとも約85%(例えば、少なくとも約86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%)の配列同一性を有するエンジニアリングされたCas12iヌクレアーゼを使用することもできる。
【0093】
2)参照Cas12iヌクレアーゼ中のDNA二本鎖の開放に関与するアミノ酸を芳香環付きアミノ酸に置換すること
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、参照Cas12iヌクレアーゼ中のDNA二本鎖の開放に関与する1つまたは複数のアミノ酸を芳香環付きアミノ酸(F、YまたはWなど)に置換する1つまたは複数の参照Cas12iヌクレアーゼ(例えばCas12i2)に基づく変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、1つ、2つ、3つ、4つ、5つ、6つ、またはそれ以上の前記アミノ酸残基の置換を含む。
【0094】
そのうち、前記DNA二本鎖の開放に関与する一つ又は複数のアミノ酸は標的鎖に対するPAM中の3’末端の最後の塩基対と相互作用するアミノ酸である。例えば、Cas12i2によって識別されるPAM配列は5’-NTTN-3’塩基対であり、PAM配列中の3’末端のN塩基と標的鎖とが形成された塩基対は、「標的鎖に対するPAM中の3’末端の最後の塩基対」であり、この塩基対の後は標的部位の配列である。
【0095】
いくつかの実施形態では、前記DNA二本鎖の開放に関与する1つまたは複数のアミノ酸は163及び/または164位置にあり;そのうち、アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される。いくつかの実施形態では、前記DNA二本鎖の開放に関与する1つまたは複数のアミノ酸はQ163、N164の1つまたは複数のアミノ酸であり;そのうち、アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される。いくつかの実施形態では、前記DNA二本鎖の開放に関与するアミノ酸はN164であり;そのうち、アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される。
【0096】
いくつかの実施形態では、前記DNA二本鎖の開放に関与するアミノ酸は、F、YまたはWに置換される。いくつかの実施形態では、前記DNA二本鎖の開放に関与するアミノ酸はFに置換される。いくつかの実施形態では、前記DNA二本鎖の開放に関与するアミノ酸はYに置換される。
【0097】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは163F、163Y、163W、164W、164F、または164Yのいずれか1つまたは複数のアミノ酸残基の変異を含み;そのうち、アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは163F、163Y、163W、164Fまたは164Yのいずれか1つまたは複数のアミノ酸残基の変異を含み;そのうち、アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される。
【0098】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはQ163及び/またはN164のいずれかの変異を含み;そのうち、アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはQ163F、Q163Y、Q163W、N164W、N164F、またはN164Yのいずれかの変異を含み;そのうち、アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはQ163F、Q163Y、Q163W、N164FまたはN164Yのいずれかの変異を含み;そのうち、アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、N164YまたはN164F変異を含む;そのうち、アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはN164Y変異を含む;そのうち、アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される。いくつかの実施形態では、遺伝子編集効率を改善する目的を達成するために、上記のエンジニアリングされたCas12iヌクレアーゼ(参照Cas12iヌクレアーゼ中のDNA二本鎖の開放に関与する1つまたは複数のアミノ酸を芳香環付きアミノ酸に置換する)と少なくとも約85%(例えば、少なくとも約86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%)の配列同一性を有するエンジニアリングされたCas12iヌクレアーゼを使用することもできる。
【0099】
3)参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用するアミノ酸を正に帯電したアミノ酸に置換すること
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、1つまたは複数の、参照Cas12iヌクレアーゼ(例えばCas12i2)に基づく変異を含み、前記変異は参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用するアミノ酸を正に帯電したアミノ酸(R、H、Kなど)に置換することである。いくつかの実施形態では、前記エンジニアリングされたCas12i酵素は、1つ、2つ、3つ、4つ、5つ、6つまたはそれ以上のアミノ酸残基の置換を含む。
【0100】
そのうち、前記RuvC構造域に位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸は、三次元構造上で一本鎖DNA基質と距離が9Å以内のアミノ酸であり、例えば、三次元構造上で一本鎖DNA基質と距離が8Å以内のアミノ酸、三次元構造上で一本鎖DNA基質と距離が7Å以内のアミノ酸、三次元構造上で一本鎖DNA基質と距離が6Å以内のアミノ酸、三次元構造上で一本鎖DNA基質と5Å以内の距離のアミノ酸、三次元構造上で一本鎖DNA基質と4Å以内の距離のアミノ酸、三次元構造上で一本鎖DNA基質と3Å以内の距離のアミノ酸、三次元構造上で一本鎖DNA基質と2Å以内の距離のアミノ酸、またはより近いアミノ酸であってもよい。
【0101】
RuvCドメインは、Cas12iタンパク質中の一本鎖DNAまたは二鎖DNAの切断を担当する酵素活性ドメインである。タンパク質の一次配列では、Cas12iのRuvCドメインは、RuvC-1、RuvC-2、及びRuvC-3の3つの部分に分けられる。これら3つの部分は三次元構造の中で隣接しており、共に酵素切断活性を有する触媒ポケットを構成している。Cas12i2の三次元結晶構造、そのドメイン組成、DNA基質との相互作用についての記述はHuang X. et al., Nature Communications, 11, Article number: 5241 (2020)を参照。Cas12i1の三次元結晶構造、そのドメイン組成、及びDNA基質との相互作用についての記述はZhang H.etal.Nature Structural&Molecular Biology27,1069-1076(2020)を参照。相同性構造比較とモデル化(homology modeling)により、既知のCas12i三次元結晶構造を通じて、参照Cas12iと基質との相互作用の三次元構造モデルを得ることができる。実施例3には、Cas12i2中のRuvCドメインに位置し、一本鎖DNA基質から9Å以内の距離を有するアミノ酸を得るためのモデリング方法が記載されている。
【0102】
いくつかの実施形態では、RuvCドメイン中のアミノ酸と一本鎖DNA基質の空間構造上の距離は、解析されたCasタンパク質-RNA-DNA三次元複合体の3D構造(PDBファイル)中の原子間の距離によって定義されることができ、原子間の相互距離はPDBファイル識別ソフトウェアによって表示されることができる。いくつかの実施形態では、前記RuvCドメイン中のアミノ酸と一本鎖DNA基質の空間構造上の距離は、アミノ酸残基とヌクレオチドに含まれる原子との間の最小距離によって定義される。RuvCドメイン中のアミノ酸と一本鎖DNA基質との空間構造上の距離を測定するために用いることができるプログラム、またはPDBファイル識別ソフトウェアは当技術分野で広く知られており、PyMOL、ChimeraX、Swiss-pdbviewerなどを含むが、これらに限定されない。
【0103】
いくつかの実施形態では、前記RuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸は323、327、355、359、360、361、362、388、390、391、392、393、414、417、418、421、424、425、650、652、653、696、705、708、709、751、752、755、840、848、851、856、885、897、925、926、928、929、932、及び1022の位置の1つまたは複数のアミノ酸である。いくつかの実施形態では、前記RuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸はE323、L327、V355、G359、G360、K361、D362、L388、N390、N391、F392、K393、Q414、L417、L418、K421、Q424、Q425、S650、E652、G653、I696、K705、K708、E709、L751、S752、E755、N840、N848、S851、A856、Q885、M897、N925、I926、T928、G929、Y932、A1022の1つまたは複数のアミノ酸である。いくつかの実施形態では、前記RuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸はE323、D362、L388、N391、L417、Q424、Q425、N925、I926、及びG929の1つまたは複数のアミノ酸である。いくつかの実施形態では、前記アミノ酸位置は、SEQ ID NO:1に示される野生型Cas12iヌクレアーゼの対応するアミノ酸位置によって定義される。
【0104】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸をR、HまたはK(例えばRまたはK)に置換する変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸をRに置換する変異を含む。
【0105】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはN390R、N391R、F392R、L751R、E755R、N840R、N848R、S851R、A856R、Q885R、M897R、I926R、G929R、Y932R、E323R、L327R、V355R、G359R、G360R、K361R、D362R、Q414R、K421R、Q425R、S650R、E652R、K705R、K708R、E709R、S752R、N925R、T928R、E323R+D362R、E323R+Q425R、E323R+I926R、Q425R+I926R、E323R+D362R+Q425R、E323R+D362R+I926R、E323R+Q425R+I926R、E323R+D362R+Q425R+I926R、D362R+I926R、N925R+I926R、D362R+N925R+I926R、D362R+N925Rの1つまたは複数の変異または変異の組み合わせを含む;前記アミノ酸位置は、SEQ ID NO:1に示される野生型Cas12iヌクレアーゼの対応するアミノ酸位置によって定義される。
【0106】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはE323、D362、Q425、N925、I926、G929いずれかのアミノ酸残基の位置の変異または変異の組み合わせを含み;そのうち、アミノ酸位置番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはE323、D362、Q425、N925、I926、E323+D362、E323+Q425、E323+I926、D362+Q425、D362+N925、D362+I926、Q425+I926、N925+I926、E323+D362+Q425、E323+D362+I926、E323+Q425+I926、D362+N925+I926、D362+Q425+I926、E323+D362+Q425+I926のいずれかのアミノ酸残基の位置の変異または変異の組み合わせを含み;そのうち、アミノ酸位置番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記変異は、前記位置のアミノ酸残基をR、HまたはK(例えばR)に置換する変異である。いくつかの実施形態において、前記エンジニアリングされたCas12iヌクレアーゼは323R、362R、425R、925R、926R、323R+362R、323R+425R、323R+926R、362R+425R、362R+926R、425R+926R、925R+926R、323R+362R+425R、323R+362R+926R、323R+425R+926R、362R+925R+926R 323R+362R+425R+926R、及び362R+425R+926Rのいずれかのアミノ酸またはアミノ酸の組み合わせを含み;そのうち、アミノ酸位置番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはE323R、D362R、Q424R、Q425R、N925R、I926R、及びG929Rのいずれかの変異または変異の組み合わせを含み;そのうち、アミノ酸位置番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはE323R、D362R、Q425R、N925R、I926R、E323R+D362R、E323R+Q425R、E323R+I926R、D362R+Q425R、Q425R+I926R、D362R+I926R、N925R+I926R、E323R+D362R+Q425R、E323R+D362R+I926R、E323R+Q425R+I926R、D362R+N925R+I926R、D362R+Q425R+I926R、及びE323R+D362R+Q425R+I926Rのいずれかの変異または変異の組み合わせを含み;そのうち、アミノ酸位置番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはI926R変異を含み;そのうち、アミノ酸位置番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはE323R+D362R変異を含み;そのうち、アミノ酸位置番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、遺伝子編集効率を改善する目的を達成するために、上記のエンジニアリングされたCas12iヌクレアーゼ(参照Cas12iヌクレアーゼのRuvCドメインに位置させ、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換したもの)と少なくとも約85%(例えば、少なくとも約86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%)の配列同一性を有するエンジニアリングされたCas12iヌクレアーゼを使用することもできる。
【0107】
4)参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換すること
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸をR、H、Kなどの正に帯電したアミノ酸に置換するための1つまたは複数の参照Cas12iヌクレアーゼ(例えばCas12i2)に基づく変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12i酵素は、1つ、2つ、3つ、4つ、5つ、6つ、またはそれ以上の前記アミノ酸残基の置換を含む。
【0108】
そのうち、前記DNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸は、三次元構造上でDNA-RNA二重らせんと9Å以内の距離を有するアミノ酸であり、例えば、三次元構造上でDNA-RNA二重らせんと8Å以内の距離を有するアミノ酸、三次元構造上でDNA-RNA二重らせんと7Å以内の距離を有するアミノ酸、三次元構造上でDNA-RNA二重らせんと6Å以内の距離を有するアミノ酸、三次元構造上DNA-RNAと二重らせん距離が5Å以内のアミノ酸、三次元構造上DNA-RNAと二重らせん距離が4Å以内のアミノ酸、三次元構造上DNA-RNAと二重らせん距離が3Å以内のアミノ酸、三次元構造上DNA-RNAと二重らせん距離が2Å以内のアミノ酸、またはより近いアミノ酸である。いくつかのCasヌクレアーゼの動作原理は下記の通りである:CasはcrRNAなどのガイドRNAと複合体を形成し、その中でcrRNAと標的DNAが互いに対になってDNA-RNA二重らせんを形成し、そしてCasヌクレアーゼと相互作用し、二本鎖標的DNAを開放し、そしてR-loopを形成し、Casの酵素切断活性部位にdsDNAの切断を完成させることができる。Cas12i2の三次元結晶構造、そのドメイン組成、及びDNA-RNA二重らせんとの相互作用の記述はHuang X. et al., Nature Communications, 11, Article number: 5241 (2020)を参照。
【0109】
いくつかの実施形態では、空間構造上のDNA-RNA二重らせんとCasアミノ酸との距離は、解析されたCasタンパク質-RNA-DNA三次元複合体の3D構造(PDBファイル)中のアミノ酸残基とヌクレオチドに含まれる原子との最小距離によって定義されることができ、原子間の相互距離はPDBファイル識別ソフトウェアによって表示されることができる。いくつかの実施形態では、前記Casアミノ酸とDNA-RNA二重らせんの空間構造上の距離は、原子仮説位置からの距離によって定義される。Casアミノ酸とDNA-RNA二重らせんの空間構造上の距離を測定するために使用できるプログラム、またはPDBファイル識別ソフトウェアは当技術分野で広く知られており、PyMOL、ChimeraX、Swiss-pdbviewerなどを含むがこれらに限定されない。
【0110】
いくつかの実施形態では、前記DNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸は116、117、156、159、160、161、247、293、294、297、301、305、306、308、312、313、316、319、320、343、348、349、427、433、438、441、442、679、683、691、782、783、797、800、852、853、855、861、865、957、958の位置の1つまたは複数のアミノ酸である。いくつかの実施形態では、前記DNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸はG116、E117、A156、T159、E160、S161、E247、G293、E294、N297、T301、I305、K306、T308、N312、F313、Q316、E319、Q320、E348、E348、E349、D427、K433、V438、N441、Q442、N679、E683、E691、D782、E783、E797、E800、M852、D853、L855、N861、Q865、S957、D958の1つまたは複数のアミノ酸である。いくつかの実施形態では、前記DNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸はG116、E117、T159、S161、E319、E343、またはD958の1つまたは複数のアミノ酸である。いくつかの実施形態では、前記DNA-RNA二重らせんと相互作用するアミノ酸はD958である。いくつかの実施形態では、前記アミノ酸位置は、SEQ ID NO:1に示される野生型Cas12iヌクレアーゼの対応するアミノ酸位置によって定義される。
【0111】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸をR、HまたはK(例えばRまたはK)に置換する変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、参照Cas12iヌクレアーゼ中のDNA-RNA二重らせん相互作用に関与する1つまたは複数のアミノ酸をRに置換する変異を含む。
【0112】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはG116R、E117R、A156R、T159R、S161R、T301R、I305R、K306R、T308R、N312R、F313R、D427R、K433R、V438R、N441R、Q442R、M852R、L855R、N861R、Q865R、E160R、Q316R、E319R、Q320R、E247R、E343、E348R、E349R、N679R、E683R、E691R、D782R、E783R、E797R、E800R、D853R、S957R、D958R、G293R、E294R、N297Rの1つまたは複数のアミノ酸突然変異を含み;アミノ酸位置は、SEQ ID NO:1に示される野生型Cas12iヌクレアーゼの対応するアミノ酸位置によって定義される。
【0113】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはG116、E117、T159、S161、E319、E343、またはD958のアミノ酸残基の位置のいずれかの変異または変異の組み合わせを含み;そのうち、アミノ酸位置番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記変異は、前記位置のアミノ酸残基をR、HまたはK(例えばR)に置換する変異である。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは116R、117R、159R、161R、319R、343R、または958Rのいずれかの部位のアミノ酸またはアミノ酸変異の組み合わせを含み;そのうち、アミノ酸位置番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはG116R、E117R、T159R、S161R、E319R、E343R、またはD958Rのいずれかの変異または変異の組み合わせを含み;そのうち、アミノ酸位置番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはD958R変異を含む;そのうち、アミノ酸位置番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、遺伝子編集効率を改善する目的を達成するために、上述のエンジニアリングされたCas12iヌクレアーゼと少なくとも約85%(例えば、少なくとも約86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%)の配列同一性を有するエンジニアリングされたCas12iヌクレアーゼを使用することもできる。
【0114】
5)参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数の極性または正に帯電したアミノ酸を疎水性アミノ酸に置換すること
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数の極性または正に帯電したアミノ酸を疎水性アミノ酸(A、V、I、L、M、F、Y、P、CまたはWなど)に置換する、1つまたは複数の参照Cas12iヌクレアーゼに基づく変異を含む。前記変異(そのうちは「高特異性」または「HF」変異とも呼ばれる)は、Cas12iヌクレアーゼのオフターゲット率を低下させる(すなわち特異性を高める)ことができる。いくつかの実施形態では、CasXX-HFのCasXXに対するオフターゲット率は、少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%またはそれ以上減少することができる。いくつかの実施形態では、前記エンジニアリングされたCas12i酵素は、1つ、2つ、3つ、4つ、5つ、6つまたはそれ以上の前記アミノ酸残基の置換を含む。
【0115】
そのうち、前記DNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸は、三次元構造上でDNA-RNA二重らせんと9Å以内の距離を有するアミノ酸であり、例えば、三次元構造上でDNA-RNA二重らせんと8Å以内の距離を有するアミノ酸、三次元構造上でDNA-RNA二重らせんと7Å以内の距離を有するアミノ酸、三次元構造上でDNA-RNA二重らせんと6Å以内の距離を有するアミノ酸、三次元構造上DNA-RNAと二重らせん距離が5Å以内のアミノ酸、三次元構造上DNA-RNAと二重らせん距離が4Å以内のアミノ酸、三次元構造上DNA-RNAと二重らせん距離が3Å以内のアミノ酸、三次元構造上DNA-RNAと二重らせん距離が2Å以内のアミノ酸、またはより近いアミノ酸であってもよい。Cas12i2の三次元結晶構造、そのドメイン組成、及びDNA-RNA二重らせんとの相互作用の記述はHuang X. et al., Nature Communications, 11, Article number: 5241 (2020)を参照。
【0116】
いくつかの実施形態では、前記DNA-RNA二重らせんと相互作用する1つまたは複数の極性または正に帯電したアミノ酸は119、164、297、308、309、312、346、357、394、395、402、441、433、565、715、719、766、782、807、841、844、845、848、857、861、865の位置の1つまたは複数のアミノ酸である。いくつかの実施形態では、前記DNA-RNA二重らせんと相互作用する1つまたは複数の極性または正に帯電したアミノ酸はY119、Y164、N297、T308、R309、N312、S346、H357、K394、E395、R402、N441、K433、S565、R715、R719、S766、D782、K807、N841、K844、K845、N848、R857、N861、Q865の1つまたは複数のアミノ酸である。いくつかの実施形態では、前記DNA-RNA二重らせんと相互作用する1つまたは複数の極性または正に帯電したアミノ酸はR857、R861、K807、N848、R715、R719、K394、H357、及びK844の1つまたは複数のアミノ酸である。いくつかの実施形態では、前記DNA-RNA二重らせんと相互作用する1つまたは複数の極性または正に帯電したアミノ酸はR857、R719、K394、及びK844の1つまたは複数のアミノ酸である。そのうち、上述のようにアミノ酸位置は、SEQ ID NO:1または8に示す対応するアミノ酸位置によって定義される。
【0117】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはS565A、N297A、Q865A、T308A、R309A、N312A、N441A、R857A、N861A、Y119F、K433A、K807A、N841A、N848A、K845A、D782A、R715A、R719A、S766A、K394A、H357A、K844A、E395A、S346A、R402A、YY164Nの1つまたは複数の変異を含み;そのうち、アミノ酸位置番号は、SEQ ID NO:1または8に示される対応するアミノ酸位置によって定義される。
【0118】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、参照Cas12iヌクレアーゼ中の357、394、715、719、807、844、848、857、861に位置する1つまたは複数の極性または正に帯電したアミノ酸を疎水性アミノ酸に置換する変異を含む。いくつかの実施形態では、前記疎水性アミノ酸は、A、V、L、I、P及びF、例えばA、V、L又はIから選択される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、参照Cas12iヌクレアーゼ中のH357、K394、R715、R719、K807、K844、N848、R857及び/またはR861に位置する1つまたは複数の極性または正に帯電したアミノ酸をAに置換する変異を含む。そのうち、前記アミノ酸位置番号は、SEQ ID NO:1または8に示す対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはH357A、K394A、R715A、R719A、K807A、K844A、N848A、R857A、及びR861Aのいずれかの位置におけるアミノ酸またはアミノ酸の組み合わせの変異を含み;そのうち、アミノ酸位置番号は、SEQ ID NO:1または8に示される対応するアミノ酸位置によって定義される。
【0119】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは857、719、394、または844のアミノ酸残基の位置のいずれかの変異または変異の組み合わせを含み、そのうち、アミノ酸位置番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記変異は、前記の位置アミノ酸残基を疎水性アミノ酸(例えばA)に置換する変異である。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはR857、R719、K394、またはK844のいずれかの位置におけるアミノ酸またはアミノ酸の組み合わせの変異を含み;そのうち、アミノ酸位置番号は、SEQ ID NO:1または8に示される対応するアミノ酸位置によって定義される。いくつかの実施形態において、前記エンジニアリングされたCas12iヌクレアーゼはR857、R719、K394、K844、R719+K394、K394+K844、R857+K394、R719+K844、R857+R719、R857+K844、R719+K394+K844、R857+R719+K394、R857+K394+K844、R857+K394+K844、R857+R719+K394+K844のアミノ酸残基の位置のいずれかの変異または変異の組み合わせを含み;そのうち、アミノ酸位置番号はSEQ ID NO:1または8に示す対応するアミノ酸位置によって定義される;前記変異は、位置アミノ酸残基を疎水性アミノ酸(例えばA)に置換する変異である。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはR857A、R719A、K394A、K844A、R719A+K394A、K394A+K844A、R857A+K394A、R719A+K844A、R857A+R719A、R857A+K844A、R719A+K394A+K844A、、R857A+R719A+K394A、R857A+K394A+K844A、R857A+R719A+K844A、R857A+R719A+K394A+K844Aのアミノ酸残基の位置のいずれかの変異または変異の組み合わせを含み;そのうち、アミノ酸位置番号は、SEQ ID NO:1または8に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはR857A、R719A、K394A、またはK844Aのいずれかの変異または変異の組み合わせを含み;そのうち、アミノ酸位置番号は、SEQ ID NO:1または8に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはK844A変異を含む;そのうち、アミノ酸位置番号は、SEQ ID NO:1または8に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはR719A及びK844A変異を含む;そのうち、アミノ酸位置番号は、SEQ ID NO:1または8に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはR857A及びK844A変異を含む;そのうち、アミノ酸位置番号は、SEQ ID NO:1または8に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、遺伝子編集効率を改善する目的を達成するために、上述のエンジニアリングされたCas12iヌクレアーゼ(参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数の極性または正に帯電したアミノ酸を疎水性アミノ酸に置換する)と少なくとも約85%(例えば、少なくとも約86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%)の配列同一性を有するエンジニアリングされたCas12iヌクレアーゼを使用することもできる。
【0120】
6)その他の変異
特に指定されない場合、本明細書に記載の変異は挿入、削除、置換の1つまたは複数を含むことができ、1つまたは複数のアミノ酸の変異であり得る。
【0121】
1)~5)セクションに記載のいずれかまたは複数の変異は、標的結合、二本鎖切断活性、ニッカーゼ活性、及び/または遺伝子編集活性など、Cas12i活性を増加させる任意または複数の既知の変異と結合することができる。例示的な行の変異は、例えば、PCT/CN2020/0134249及びCN112195164Aの文献に見られ、これらの文献は全体的な参照により本明細書に組み込まれた。1)~5)セクションに記載されたいずれかまたは複数の変異は、標的結合、二本鎖切断活性、ニッカーゼ活性、及び/または遺伝子編集活性など、Cas12i活性を低下させる任意または複数の既知の変異と組み合わせることもできる。
【0122】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼ(例えば、上記1)~5)セクションにおける1つまたは複数の変異を含むエンジニアリングされたCas12iヌクレアーゼ)は、1つまたは複数のフレキシブル領域変異をさらに含み、前記変異は、参照Cas12iヌクレアーゼ(または(1)~(5)節のいずれか1つまたは複数の変異を含むエンジニアリングされたCas12iヌクレアーゼ)中のフレキシブル領域の柔軟性(flexibility)(例えば、少なくとも約10%、20%、50%、60%、70%、80%、90%、1倍、1.1倍、1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、20倍、50倍、100倍またはそれ以上)を増加させる。前記参照Cas12iヌクレアーゼ中のフレキシブル領域は、当技術分野で知られている任意の方法を用いて決定することができる。いくつかの実施形態では、前記参照Cas12iヌクレアーゼのアミノ酸配列にのみ基づいて複数のフレキシブル領域を決定する。いくつかの実施形態では、2次構造、結晶構造、NMR構造などを含む複数のフレキシブル領域は、前記参照Cas12iヌクレアーゼの構造情報に基づいて決定される。
【0123】
ここで前記Cas12iヌクレアーゼのフレキシブル領域を工学的に改造する方法は(a)複数のエンジニアリングされたCas12iヌクレアーゼを獲得し、各エンジニアリングされたCas12iヌクレアーゼは1つまたは複数の変異を含み、前記変異は参照Cas12iヌクレアーゼの1つまたは複数のフレキシブル領域中のフレキシブル領域の柔軟性を増加させること、及び(b)前記複数のエンジニアリングされたCas12iヌクレアーゼの中から1つまたは複数のエンジニアリングされたCas12iヌクレアーゼを選択し、そのうち、前記1つまたは複数のエンジニアリングされたCas12iヌクレアーゼは前記参照Cas12iヌクレアーゼに比べて増加する活性(標的結合、二本鎖切断活性、ニッカーゼ活性、及び/または遺伝子編集活性など)を有することを含む。いくつかの実施形態では、前記方法はさらに、前記参照Cas12iヌクレアーゼ中の1つまたは複数のフレキシブル領域を決定することを含む。いくつかの実施形態では、前記方法は、哺乳動物細胞(例えばヒト細胞)などの真核細胞中でエンジニアリングされたCas12iヌクレアーゼの活性を測定することをさらに含む。
【0124】
いくつかの実施形態では、PredyFlexy、FoldUnfold、PROFbval、Flexserv、FlexPred、DynaMine、及びDisomineの群から選択されるプログラムを使用して複数のフレキシブル領域が決定される。いくつかの実施形態では、前記1つまたは複数のフレキシブル領域はランダムコイルに位置する。いくつかの実施形態では、前記1つまたは複数のフレキシブル領域は、参照Cas12iヌクレアーゼ(または、前記(1)~(5)セクションのうちのいずれか1つまたは複数の変異を含むエンジニアリングされたCas12iヌクレアーゼ)のDNA及び/またはRNAと相互作用するドメイン内にある。いくつかの実施形態では、前記フレキシブル領域は、少なくとも長さが約5つ(例えば、5つ)のアミノ酸を有する。
【0125】
いくつかの実施形態では、前記1つまたは複数の変異は、フレキシブル領域に1つまたは複数(例えば、2つ)のグリシン(G)残基を挿入することを含む。いくつかの実施形態では、前記1つまたは複数のG残基がフレキシブル領域における柔軟性アミノ酸残基のN末端に挿入され、そのうち、前記柔軟性アミノ酸残基はG、セリン(S)、アスパラギン(N)、アスパラギン(D)、ヒスチジン(H)、メチオニン(M)、トレオニン(T)、グルタミン酸(E)、グルタミン(Q)、リジン(K)、アルギニン(R)、アラニン(A)、プロリン(P)からなる群より選択される。いくつかの実施形態では、柔軟性アミノ酸残基は、G>S>N>D>H>M>T>E>Q>K>R>A>Pの優先順位に従って選択される。いくつかの実施形態では、前記1つまたは複数の変異は、1つまたは複数のG残基を1つまたは複数の非G残基に置換することを含む。
【0126】
いくつかの実施形態では、前記1つまたは複数の変異は、フレキシブル領域における疎水性アミノ酸残基をG残基で置換することを含み、そのうち、前記疎水性アミノ酸残基は、ロイシン(L)、イソロイシン(I)、バリン(V)、システイン(C)、チロシン(Y)、フェニルアラニン(F)、及びトリプトファン(W)の群から選択される。
【0127】
いくつかの実施形態では、前記活性は部位特異的ヌクレアーゼ活性である。いくつかの実施形態では、前記活性は真核細胞(例えばヒト細胞)中の遺伝子編集活性である。いくつかの実施形態では、前記遺伝子編集効率は、T7エンドヌクレアーゼ1(T7E1)アッセイ、標的DNAの配列測定、分解追跡挿入欠失(TIDE)アッセイ、または増幅子解析による挿入欠失検出(IDAA)アッセイを用いて測定される。
【0128】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼ(例えば、(1)~(5)セクションのいずれか1つまたは複数の変異を含むエンジニアリングされたCas12iヌクレアーゼ)は、参照Cas12iヌクレアーゼ(例えば、Cas12i2ヌクレアーゼ、または(1)~(5)セクションのいずれか1つまたは複数の変異を含むエンジニアリングされたCas12iヌクレアーゼ)中のフレキシブル領域の柔軟性を増加させる1つまたは複数のフレキシブル領域変異を含み、前記フレキシブル領域は、アミノ酸残基228-232、アミノ酸残基439-443、アミノ酸残基478-482、アミノ酸残基500-504、アミノ酸残基775-779、及びアミノ酸残基925-929の領域に対する群から選択され、前記アミノ酸残基番号はSEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記フレキシブル領域は、アミノ酸残基439-443またはアミノ酸残基925-929から選択され、そのうち前記アミノ酸残基番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記参照Cas12i酵素はCas12i2(SEQ ID NO:1)である。いくつかの実施形態では、前記1つまたは複数のフレキシブル領域変異は、フレキシブル領域に1つまたは複数(例えば2つ)のG残基を挿入することを含む。いくつかの実施形態では、前記1つまたは複数のG残基は、前記フレキシブル領域中の柔軟性アミノ酸残基のN末端に挿入され、前記柔軟性アミノ酸残基は、G、S、N、D、H、M、T、E、Q、K、R、A、Pの群から選択される。いくつかの実施形態では、前記柔軟性アミノ酸残基は、G>S>N>D>H>M>T>E>Q>K>R>A>Pの優先順位に従って選択される。いくつかの実施形態では、前記1つまたは複数のフレキシブル領域変異は、フレキシブル領域中の疎水性アミノ酸残基をG残基で置換することを含み、そのうち、前記疎水性アミノ酸残基は、A、V、I、L、M、F、Y、P、CまたはW、好ましくは、L、I、V、C、Y、F及びWから選択される。
【0129】
いくつかの実施形態では、前記フレキシブル領域変異は439及び/または926に位置する。いくつかの実施形態では、それらはL439、I926の1つまたは複数のアミノ酸である。そのうち、前記アミノ酸位置は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。
【0130】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼ(例えば、(1)~(5)セクションのいずれか1つまたは複数の変異を含むエンジニアリングされたCas12iヌクレアーゼ)は926G及び/または439(L+G)変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、I926G、L439(L+G)及びL439(L+GG)の1つまたは複数のフレキシブル領域変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはI926G突然変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはL439(L+G)変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはL439(L+GG)変異を含む。そのうち、前記アミノ酸残基番号はSEQ ID NO:1に基づく。
【0131】
本明細書の文脈において、L439(L+G)の意味は、引用されたアミノ酸配列(例えばSEQ ID NO:1)において、439番目のアミノ酸の後にひとつのグリシン(G)を挿入し、元の439位のL配列は変わらないことで、本出願の文脈及び図面において、439Gと表記されることもある。L439(L+GG)の意味は、引用されたアミノ酸配列の中で、439番目のアミノ酸の後に2つのグリシン(GG)を挿入し、元の439番目のL配列は変わらないことで、本出願の文脈及び図面においては、439GGと表記されることもある。
【0132】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼ(例えば、(1)~(5)セクションのいずれか1つまたは複数の変異を含むエンジニアリングされたCas12iヌクレアーゼ)は926、439、925+926、362+925+926、439+926、323+362+926(例えば、I926、L439、N925+I926、D362+N925+I926、L439+I926、E323+D362+I926)のアミノ酸残基の位置のいずれかの変異または変異の組み合わせを含み;そのうち、アミノ酸位置番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記アミノ酸位置323、362、925または926に位置する変異は、前記位置のアミノ酸残基をR、HまたはK(例えばR)に置換する変異であり、そのうち、アミノ酸位置番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記アミノ酸位置439または926に位置する変異は、前記位置のアミノ酸残基をGに置換するか、または前記アミノ酸残基の後にGまたはGGを挿入する変異である、そのうち、アミノ酸位置の番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。
【0133】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼ(例えば、(1)~(5)セクションのいずれか1つまたは複数の変異を含むエンジニアリングされたCas12iヌクレアーゼ)は、926G、439(L+GG)、925R+926G、362R+925R+926G、439(L+GG)+926R、または323R+362R+926Gのいずれかに記載のアミノ酸残基またはアミノ酸残基の組み合わせの変異を含む。そのうち、アミノ酸位置番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。
【0134】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼはI926G、L439(L+GG)、L439(L+GG)+I926R、N925R+I926G、D362R+N925R+I926G、E323R+D362R+I926Gのいずれかの変異または変異の組み合わせを含み;そのうち、アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される。
【0135】
いくつかの実施形態では、遺伝子編集効率を改善する目的を達成するために、前記エンジニアリングされたCas12iヌクレアーゼ(例えば、(1)~(5)セクションのいずれか1つまたは複数の変異を含むエンジニアリングされたCas12iヌクレアーゼ、及び/または前記フレキシブル領域変異を含むエンジニアリングされたCas12iヌクレアーゼは、少なくとも約85%(例えば、少なくとも約86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%)の配列同一性を有するエンジニアリングされたCas12iヌクレアーゼを使用することもできる。
【0136】
7)組み合わせの変異
本明細書における1)~6)セクションに記載された変異及び表1~表5、表9、表12、表14、表16~18の1つまたは複数のアミノ酸置換/挿入の組合せによって得られたエンジニアリングされたCas12iヌクレアーゼは、いずれも本出願の請求保護範囲にある。
【0137】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは164、176、238、323、357、362、394、439、447、563、715、719、807、844、848、857、861、925、926、958、176+238+447+563、323+362、176+238+447+563+164、176+238+447+563+926、176+238+447+563+323+362、164+926、164+323+362、176+238+447+563+164+926、176+238+447+563+164+323+362、176+238+447+563+164+926+323+362、176+238+447+563+164+323+362+926+439、719+844、857+844、362+926、925+926、362+925+926、439+926、323+362+926のアミノ酸残基の位置のいずれかの変異または変異の組み合わせを含み;そのうち、アミノ酸位置番号は、SEQ ID NO:1に示される対応するアミノ酸位置によって定義される。いくつかの実施形態では、前記アミノ酸位置176、238、323、362、447、563、926、または958に位置する変異は、前記位置のアミノ酸残基をR、H、またはK(例えばR)に置換する変異である。いくつかの実施形態では、前記アミノ酸位置164に位置する変異は、前記位置のアミノ酸残基をYまたはF(例えばY)に置換する変異である。いくつかの実施形態では、前記アミノ酸位置439または926に位置する変異は、前記位置のアミノ酸残基をGに置換するか、または前記アミノ酸残基の後にGまたはGGを挿入する変異である。いくつかの実施形態では、前記アミノ酸位置357、394、715、719、807、844、848、857、または861に位置する変異は、前記位置のアミノ酸残基を疎水性アミノ酸(例えばA)に置換することである。そのうち、アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される。
【0138】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、N164、E176;K238;E323、D362、T447;E563、I926、I926、D958、L439、R857、N861、K807、N848、R715、R719、K394、H357、K844、E176+K238+T447+E563、E323+D362、E176+K238+T447+E563+N164、E176+K238+T447+E563+I926、E176+K238+T447+E563+E323+D362、N164+I926、N164+E323+D362、E176+K238+T447+E563+N164+I926、E176+K238+T447+E563+N164+E323+D362、E176+K238+T447+E563+N164+I926+E323+D362、E176+K238+T447+E563+N164+E323+D362+I926、E176+K238+T447+E563+N164+E323+D362+I926+L439、E176+K238+T447+E563+N164+E323+D362+I926+L439;
E176+K238+T447+E563+N164+D958;
E176+K238+T447+E563+I926+D958;
E176+K238+T447+E563+E323+D362+D958;
N164+I926+D958;
N164+E323+D362+D958;
E176+K238+T447+E563+N164+D958;
E176+K238+T447+E563+N164+I926+D958;
E176+K238+T447+E563+N164+E323+D362+D958;
E176+K238+T447+E563+N164+I926+E323+D362+D958;
E176+K238+T447+E563+N164+E323+D362+I926+D958;
E176+K238+T447+E563+N164+E323+D362+I926+L439+D958;
E176+K238+T447+E563+N164+E323+D362+I926+L439+D958;
R719+K844;
R857+K844;
E176+K238+T447+E563+N164+E323+D362+R857;
E176+K238+T447+E563+N164+E323+D362+N861;
E176+K238+T447+E563+N164+E323+D362+K807;
E176+K238+T447+E563+N164+E323+D362+N848;
E176+K238+T447+E563+N164+E323+D362+R715;
E176+K238+T447+E563+N164+E323+D362+R719;
E176+K238+T447+E563+N164+E323+D362+K394;
E176+K238+T447+E563+N164+E323+D362+H357;
E176+K238+T447+E563+N164+E323+D362+K844;
E176+K238+T447+E563+N164+E323+D362+R719+K844;
E176+K238+T447+E563+N164+E323+D362+R857+K844;または
E176+K238+T447+E563+N164+E323+D362+K394のいずれかのアミノ酸残基またはアミノ酸残基の組み合わせの変異を含み;
そのうち、アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される。
【0139】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、N164Y;E176R;K238R;E323R;D362R;T447R;E563R;I926R;D958R;L439(L+G);L439(L+GG);R857A;N861A;K807A;N848A;R715A;R719A;K394A;H357A;K844A;R719A+K844A;N164Y+I926R;E323R+D362R;R857A+K844A;R857A+K844A;N164Y+I926R+D958R;N164Y+E323R+D362R;N164Y+E323R+D362R+D958R;E176R+K238R+T447R+E563R;E176R+K238R+T447R+E563R+N164Y;E176R+K238R+T447R+E563R+I926R;E176R+K238R+T447R+E563R+E323R+D362R;E176R+K238R+T447R+E563R+N164Y+I926R;E176R+K238R+T447R+E563R+N164Y+E323R+D362R;E176R+K238R+T447R+E563R+N164Y+I926R+E323R+D362R;E176R+K238R+T447R+E563R+N164Y+E323R+D362R+I926G;E176R+K238R+T447R+E563R+N164Y+E323R+D362R+I926G+L439(L+GG);E176R+K238R+T447R+E563R+N164Y+E323R+D362R+I926G+L439(L+G);E176R+K238R+T447R+E563R+N164Y+D958R;
E176R+K238R+T447R+E563R+I926R+D958R;
E176R+K238R+T447R+E563R+E323R+D362R+D958R;E176R+K238R+T447R+E563R+N164Y+D958R;E176R+K238R+T447R+E563R+N164Y+I926R+D958R;
E176R+K238R+T447R+E563R+N164Y+E323R+D362R+D958R;
E176R+K238R+T447R+E563R+N164Y+I926R+E323R+D362R+D958R;
E176R+K238R+T447R+E563R+N164Y+E323R+D362R+I926G+D958R;
E176R+K238R+T447R+E563R+N164Y+E323R+D362R+I926G+L439(L+GG)+D958R;E176R+K238R+T447R+E563R+N164Y+E323R+D362R+I926G+L439(L+G)+D958R;E176R+K238R+T447R+E563R+N164Y+E323R+D362R+R857A;
E176R+K238R+T447R+E563R+N164Y+E323R+D362R+N861A;
E176R+K238R+T447R+E563R+N164Y+E323R+D362R+K807A;
E176R+K238R+T447R+E563R+N164Y+E323R+D362R+N848A;E176R+K238R+T447R+E563R+N164Y+E323R+D362R+R715A;E176R+K238R+T447R+E563R+N164Y+E323R+D362R+R719A;E176R+K238R+T447R+E563R+N164Y+E323R+D362R+K394A;E176R+K238R+T447R+E563R+N164Y+E323R+D362R+H357A;E176R+K238R+T447R+E563R+N164Y+E323R+D362R+K844A;E176R+K238R+T447R+E563R+N164Y+E323R+D362R+R719A+K844A;E176R+K238R+T447R+E563R+N164Y+E323R+D362R+R857A+K844A;または
E176R+K238R+T447R+E563R+N164Y+E323R+D362R+K394Aのいずれかの変異または変異の組み合わせを含み;
そのうち、アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される。
【0140】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、E176R+K238R+T447R+E563R+N164Y+E323R+D362Rの変異組み合わせを含み;そのうち、アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される。この変異体は以下にCasXXと命名され、その配列番号はSEQ ID NO:8である。
【0141】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、
E176R+K238R+T447R+E563R+N164Y+E323R+D362R+R857A;
E176R+K238R+T447R+E563R+N164Y+E323R+D362R+R719A;
E176R+K238R+T447R+E563R+N164Y+E323R+D362R+K394A;
E176R+K238R+T447R+E563R+N164Y+E323R+D362R+K844A;
E176R+K238R+T447R+E563R+N164Y+E323R+D362R+R719A+K844A;
E176R+K238R+T447R+E563R+N164Y+E323R+D362R+R857A+K844Aのいずれかの変異の組み合わせを含み;そのうち、アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される。これらCas12i変異体は、CasXX(SEQ ID NO:8)に加えて更なる最適化を行った最適化された変異体である。
【0142】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、以下:E176R+K238R+T447R+E563R+N164Y+E323R+D362R+K394Aの変異の組み合わせを含み、そのうち、アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される。この変異体は以下に「HF-20」と命名され、その配列はSEQ ID NO:20に示される。
【0143】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、E176R、K238R、T447R、E563R、N164Y、E323R、及びD362R変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、E176R、K238R、T447R、E563R、N164Y、及びI926R変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、E176R、K238R、T447R、E563R、E323R、及びD362R変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、E176R、K238R、T447R、E563R、N164Y、E323R、D362R、及びI926G変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G、及びL439(L+GG)変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G、及びL439(L+G)変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、E176R、K238R、T447R、E563R、N164Y、及びD958R変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、E176R、K238R、T447R、E563R、N164Y、I926R、及びD958R変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、E176R、K238R、T447R、E563R、N164Y、E323R、D362R、及びD958R変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、E176R、K238R、T447R、E563R、N164Y、I926R、E323R、D362R、及びD958R変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G、及びD958R変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G、L439(L+GG)、及びD958R変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、E176R、K238R、T447R、E563R、N164Y、E323R、D362R、及びK844A変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、E176R、K238R、T447R、E563R、N164Y、E323R、D362R、R819a及びK844A変異を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、E176R、K238R、T447R、E563R、N164Y、E323R、D362R、R857A及びK844A変異を含む。そのうち、前記アミノ酸位置番号は、SEQ ID NO:1に示す対応するアミノ酸位置に定義される。
【0144】
いくつかの実施形態では、遺伝子編集効率を改善する目的を達成するために、前記エンジニアリングされたCas12iヌクレアーゼと少なくとも約80%(例えば、少なくとも約81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%)の配列同一性を有するエンジニアリングされたCas12iヌクレアーゼを使用することもできる。
【0145】
いくつかの実施形態では、SEQ ID NOs:2~24に示されるいずれかのアミノ酸配列、またはSEQ ID NOs:2~24に示されるいずれかのアミノ酸配列と少なくとも約80%(例えば、少なくとも約81%、82%、83%、84%、85%、86%、87%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%)の配列同一性を有するアミノ酸配列を含む、エンジニアリングされたCas12iヌクレアーゼを提供する。
【0146】
参照Cas12iヌクレアーゼ
いくつかの実施形態では、前記参照Cas12iヌクレアーゼはCas12i1、Cas12i2、またはそのオーソログである。いくつかの実施形態では、前記参照Cas12iヌクレアーゼは天然Cas12i1、またはそのバリアント(例えば自然に存在するバリアント)である。いくつかの実施形態では、前記参照Cas12iヌクレアーゼは、天然Cas12i2(SEQ ID NO:1に示されるように)、またはそのバリアント(たとえば自然に存在するバリアント)である。いくつかの実施形態では、前記参照Cas12iヌクレアーゼは、工程的に改造されたCas12iヌクレアーゼ(本発明に記載の(1)~(5)セクションのいずれか1つまたは複数の変異を含むエンジニアリングされたCas12iヌクレアーゼ)である。いくつかの実施形態では、前記参照Cas12iヌクレアーゼはCasXX(SEQ ID NO:8)である。
【0147】
V-I型CRISPR-Cas12iは、RNAガイド型DNAエンドヌクレアーゼシステムと同定されている。Cas12bやCas9のようなCRISPR-Casシステムとは異なり、Cas12iベースのCRISPRシステムにはtracRNA配列は必要がない。いくつかの実施形態では、前記RNAガイド配列はcrRNAを含む。一般に、本明細書に記載のcrRNAは、直接リピート配列及びスペーサー配列を含む。ある実施形態では、前記crRNAは、ガイド配列またはスペーサー配列に連結された直接リピート配列を含み、基本的には直接リピート配列からなり、または直接リピート配列で構成される。いくつかの実施形態では、前記crRNAは、他のCRISPRシステムにおける前駆体crRNA(pre-crRNA)構造の典型的な特徴である直接リピート配列、スペーサー配列、及び直接リピート配列(DR-スペーサー-DR)を含む。いくつかの実施形態では、前記crRNAは、加工されたまたは成熟したcrRNAの典型的な特徴であるトランケートされた直接リピート配列及びスペーサー配列を含む。いくつかの実施形態では、前記CRISPR-Cas12iエフェクタータンパク質はRNAガイド配列と複合体を形成し、前記スペーサー配列は、少なくとも70%相補的なスペーサー配列と相補的な(例えば、少なくとも70%相補的)標的核酸との配列特異的結合に複合体を導く。
【0148】
いくつかの実施形態では、本出願のエンジニアリングされたCas12iは、ターゲット配列の特定の部位に結合し、ガイドRNAの指導の下で切断され、DNA及びRNAエンドヌクレアーゼ活性を有するヌクレアーゼである。いくつかの実施形態では、前記Cas12iは前駆体crRNAアレイを加工することによって自律的なcrRNA生物発生を行うことができる。自律的前駆体crRNA処理は、単一crRNA転写物から2つの別個のゲノム部位に標的化できるので、Cas12iの送達を促進し、それによってダブルニックの適用を実現することができる。次に、Cas12iタンパク質はCRISPRアレイを2つの相同性のcrRNAに加工し、それによって対になったニック複合体を形成する。V-I型(Cas12i)エフェクタータンパク質の多重化(Multiplexing)は、前記エフェクタータンパク質の前駆体crRNA処理能力を用いて行われ、そのうちは、異なる配列を有する複数の標的に対して単一のRNAガイド配列上でプログラムすることができる。これにより、複数の遺伝子またはDNAターゲットを同時に操作して治療用途に使用することができる。いくつかの実施形態では、前記ガイドRNAは、未加工のDR配列と交錯するターゲット配列で構成されるCRISPR配列によって発現される前駆体crRNAを含み、前記エフェクタータンパク質の内因性前駆体crRNA加工によって1つ、2つまたはそれ以上の部位を同時に標的にすることができるように繰り返している。
【0149】
複数の生物由来のCas12iヌクレアーゼは、本出願のエンジニアリングされたCas12iヌクレアーゼ及びエフェクタータンパク質を提供するための参照Cas12iヌクレアーゼとして使用することができる。例示的なCas12iヌクレアーゼは、全体的な参照により本明細書に組み込まれるWO2019/201331a1及びUS2020/0063126A1に記載されている。いくつかの実施形態では、前記参照Cas12iヌクレアーゼは酵素活性を有する。いくつかの実施形態では、前記参照Cas12iは、ヌクレアーゼ、すなわちターゲットの二重らせん核酸(例えば、二重らせんDNA)の2本の鎖を切断する。いくつかの実施形態では、前記参照Cas12iは、ターゲットの二重らせん核酸(例えば、二重らせんDNA)の一本鎖を切断するニッケーゼである。いくつかの実施形態では、前記参照Cas12iヌクレアーゼは酵素不活性化されたものである。いくつかの実施形態では、前記参照Cas12iヌクレアーゼはCas12i1、Cas12i2、またはCas12i-Phiである。いくつかの実施形態では、前記参照Cas12iヌクレアーゼはSEQID NO:1の配列を含む。Cas12i(例えば、Cas12i2)またはその機能性誘導体と配列同一性(例えば、少なくとも約60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、またはそれ以上のいずれか)を有するオーソログは、本出願のエンジニアリングされたCas12iヌクレアーゼまたはエフェクタータンパク質を設計するための基礎として使用することができる。
【0150】
エンジニアリングされたCas12iヌクレアーゼの機能的バリアント
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼは、天然に存在するCas12iヌクレアーゼに基づく機能的バリアント(または機能的誘導体)である。いくつかの実施形態では、機能バリアント(または機能誘導体)のアミノ酸配列は、上記(1)~(7)のいずれか1つまたは複数の変異を含むエンジニアリングされたCas12iヌクレアーゼのような、対応するエンジニアリングされたCas12iヌクレアーゼのアミノ酸配列と比較して、少なくとも1つのアミノ酸残基の違い(例えば、欠失、挿入、置換、及び/または融合)を有する。いくつかの実施形態では、機能性バリアントは、アミノ酸置換、挿入、及び欠失などの1つまたは複数の変異を有する。例えば、前記機能バリアントは、野生型天然に存在するCas12iヌクレアーゼと比較し、または前述のエンジニアリングされたCas12iヌクレアーゼと比較し、1、2、3、4、5、6、7、8、9、10またはそれ以上のアミノ酸のいずれか1つの置換を含むことができる。いくつかの実施形態では、バリアント1つまたは複数の置換は保存的置換である。いくつかの実施形態では、前記機能性バリアントは天然に存在するCas12iヌクレアーゼの全ドメインを有する。いくつかの実施形態では、前記機能性バリアントは天然に存在するCas12iヌクレアーゼの1つまたは複数のドメインを有しない。いくつかの実施形態では、前記機能性バリアントは、エンジニアリングされたCas12iヌクレアーゼのすべてのドメインを有する。いくつかの実施形態では、前記機能性バリアントは、エンジニアリングされたCas12iヌクレアーゼの1つまたは複数のドメインを有しない。いくつかの実施形態では、Cas12iヌクレアーゼの機能的バリアントの生物学的活性は、天然ヌクレアーゼから酵素不活性変異体への変換など、そのアミノ酸の変化によって変化する。
【0151】
本明細書に記載のCas12iバリアントタンパク質(例えば、ニッカーゼCas12iタンパク質、不活性化または触媒不活性化Cas12i(dCas12i))のいずれかについて、前記Cas12iバリアントは、上述の同じパラメータ(例えば、存在するドメイン、同一性パーセントなど)を有するCas12iタンパク質配列を含むことができる。
【0152】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼの機能的バリアントは、DNA二本鎖または一本鎖切断活性のような酵素活性、または少なくとも参照Cas12iヌクレアーゼ(またはその親エンジニアリングされたCas12iヌクレアーゼ)の少なくとも約60%(例えば、少なくとも約65%、70%、80%、90%、95%、96%、97%、98%、99%、または100%のいずれか)の酵素活性を有する。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼの機能的変異体の酵素活性は、その親エンジニアリングされたCas12iヌクレアーゼの少なくとも1.1倍(例えば、少なくとも1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍またはそれ以上)の酵素活性である。
【0153】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼの機能的バリアントは、エンジニアリングされたCas12iヌクレアーゼの非機能的バリアントの変異形態とは異なる触媒活性を有する。いくつかの実施形態では、前記機能性バリアント変異(例えば、アミノ酸置換、挿入、及び/または欠失)は、Cas12iヌクレアーゼの触媒ドメイン(例えば、RuvCドメイン)中にある。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼの機能的バリアントは、1つまたは複数の触媒ドメイン中の変異を含む。二本鎖標的核酸の一本鎖を切断して他の鎖を切断しないCas12iヌクレアーゼは、本明細書で「ニッカーゼ」(例えば「Cas12iニッカーゼ」)と呼ばれる。本明細書では、基本的にヌクレアーゼ活性を有さないCas12iヌクレアーゼを失活Cas12iタンパク質(「dCas12i」)と呼ぶ(それと融合した異種ポリペプチド(融合パートナー)はヌクレアーゼ活性を提供することができ、詳細には下記の「工学的Cas12iエフェクタータンパク質」の章を参照)。いくつかの実施形態において、Cas12iヌクレアーゼ機能変異体は、その非機能バリアントの変異形態に対して、機能バリアント変異酵素のDNA切断活性が約25%、10%、5%、1%、0.1%、0.01%またはより低い場合、このCas12iヌクレアーゼ機能バリアントは基本的にすべてのDNA切断活性を欠いていると考えられている。
【0154】
Cas12iヌクレアーゼ活性部位における1つまたは複数のアミノ酸残基の変異によって酵素活性が低下させまたは失われたCas12i(dCas12i)は、本発明では「ヌクレアーゼ活性欠失Cas12i」または「酵素不活性変異体」とも呼ばれる。いくつかの実施形態では、本明細書で提供するエンジニアリングされたCas12iヌクレアーゼは、減少または欠失させたヌクレアーゼ活性を有するように修飾することができ、例えば、ヌクレアーゼ活性が欠失したCas12iは、野生型Cas12iヌクレアーゼ(またはその親エンジニアリングされたCas12iヌクレアーゼ)と比較し、ヌクレアーゼ活性(例えば、DNA二本鎖または一本鎖切断活性)は、少なくとも約50%(例えば、少なくとも約60%、70%、80%、90%、95%、96%、97%、98%、99%、または100%のいずれか)を低下する。前記Cas12iヌクレアーゼ活性は、変異を、PAMと相互作用するドメイン、DNA二本鎖の開放に関与するドメイン、RuvCドメイン、核酸(DNA/RNA)と相互作用するエリアなど、前記Cas12iヌクレアーゼの1つまたは複数のドメインに導入することなど、いくつかの方法によって低下させることができる。いくつかの実施形態では、前記Cas12iヌクレアーゼ活性の触媒残基(例えば、任意の汎用の同定方法によって同定された触媒残基)は、異なるアミノ酸残基(例えば、グリシンまたはアラニン)に置き換えられて前記ヌクレアーゼ活性を低下させることができる。Cas12i1(SEQ ID NO:13に示すなど)のような変異の例としては、D647A、E894A、及び/またはD948Aが挙げられる。Cas12i2(SEQ ID NO:1に示すなど)のような変異の例としては、D599a、E833A、S883A、H884A、D886A、R900a、及び/またはD1019aが挙げられる。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼまたはその機能誘導体(例えば、上記(1)~(7)のいずれか1つまたは複数の変異を含むエンジニアリングされたCas12iヌクレアーゼ)はD599a、E833A、S883A、H884A、R900a、及びD1019aの1つまたは複数のヌクレアーゼ活性欠失変異を含み;そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される。
【0155】
エンジニアリングされたCas12iヌクレアーゼまたはその機能バリアントの特性
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼ(またはその機能バリアント)は、前記参照Cas12iヌクレアーゼと比較して増加した活性を有する。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼ(またはその機能バリアント)は、前記参照Cas12iヌクレアーゼと比較して低下した活性を有する。いくつかの実施形態では、前記活性は標的DNA結合活性である。いくつかの実施形態では、前記活性は部位特異的ヌクレアーゼ活性である。いくつかの実施形態では、前記活性はDNA二本鎖を開く活性である。いくつかの実施形態では、前記活性は二本鎖DNA切断活性である。いくつかの実施形態では、前記活性は一本鎖DNA切断活性であり、例えば部位特異的DNA切断活性または非特異的DNA切断活性を含む。いくつかの実施形態では、前記活性は一本鎖RNA切断活性、例えば部位特異的RNA切断活性または非特異的RNA切断活性である。いくつかの実施形態では、前記活性はインビトロで測定される。いくつかの実施形態では、前記活性は、細菌細胞、植物細胞、または真核細胞などの細胞中で測定される。いくつかの実施形態では、前記活性はげっ歯類細胞またはヒト細胞などの哺乳動物細胞中で測定される。いくつかの実施形態では、前記活性は293T細胞などのヒト細胞で測定される。いくつかの実施形態では、前記活性はマウス細胞、例えばHepa1~6細胞で測定される。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼ(またはその機能バリアント)は、参照Cas12iヌクレアーゼに比べて少なくとも約10%、20%、30%、40%、50%、60%、80%、90%、95%、1倍、1.1倍、1.5倍、2倍、3倍、4倍、5倍、10倍またはそれ以上増加させるいずれかの活性(上記のような1つまたは複数の活性、例えば部位特異的ヌクレアーゼ活性)を有する。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼ(またはその機能バリアント)は、参照Cas12iヌクレアーゼと比較して少なくとも約10%、20%、30%、40%、50%、60%、80%、90%、95%、1倍、1.1倍、1.5倍、2倍、3倍、4倍、5倍、10倍またはそれ以上低下させるいずれかの活性(上記のような1つまたは複数の活性、例えば部位特異的ヌクレアーゼ活性)を有する。前記エンジニアリングされたCas12iヌクレアーゼ(またはその機能バリアント)の部位特異的ヌクレアーゼ活性は、例えば、本明細書で提供される実施形態に記載のアガロースゲル電気泳動に基づくインビトロ切断アッセイを含むゲルシフトアッセイなど、当技術分野で公知の方法を用いて測定することができる。
【0156】
いくつかの実施形態では、前記活性は細胞中の遺伝子編集活性である。いくつかの実施形態では、前記細胞は細菌細胞、植物細胞、または真核細胞である。いくつかの実施形態では、前記細胞はげっ歯類細胞またはヒト細胞などの哺乳動物細胞である。いくつかの実施形態では、前記細胞は293T細胞である。いくつかの実施形態では、前記活性は、例えばHepa1~6細胞などのマウス細胞で測定される。いくつかの実施形態では、前記活性は、細胞中の標的ゲノム部位の挿入欠失形成活性であり、例えば、前記エンジニアリングされたCas12iヌクレアーゼ(またはその機能バリアント)による標的核酸の部位特異的切断、及び非相同末端結合(NHEJ)メカニズムによるDNA修復である。いくつかの実施形態では、前記活性は、細胞中の標的ゲノム部位に外因性核酸配列を挿入する活性であり、例えば、前記エンジニアリングされたCas12iヌクレアーゼ(またはその機能バリアント)により標的核酸の部位特異的切断、及び相同組換え(HR、修復テンプレートをさらに導入することによる)メカニズムによるDNA修復である。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼ(またはその機能バリアント)は、参照Cas12iヌクレアーゼと比べて、細胞(例えば、293T細胞のようなヒト細胞、またはマウスHepa1-6細胞)の標的ゲノム部位において、少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、1倍、1.1倍、1.5倍、2倍、3倍、4倍、5倍、10倍またはそれ以上のいずれかの遺伝子編集(例えば、切断、挿入欠失形成、または修復)活性を増加させる。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼ(またはその機能バリアント)は、参照Cas12iヌクレアーゼと比べて、293T細胞のようなヒト細胞またはマウスHepa1-6細胞の複数(例えば、2、3、4、5、6、7、8、9、10またはそれ以上)の標的ゲノム部位において、少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、1倍、1.1倍、1.5倍、2倍、3倍、4倍、5倍、10倍またはそれ以上のいずれかの遺伝子編集(例えば、切断、挿入欠失形成、または修復)活性を増加させる。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼ(またはその機能バリアント)は、参照Cas12iヌクレアーゼと比べて、より多くの数(例えば、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70またはそれ以上)のゲノム部位を編集することができ、例えば、より多く(例えば、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70またはそれ以上)のPAM配列を識別することができる。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼ(またはその機能バリアント)の共有PAM配列は、前記参照Cas12iヌクレアーゼと同じである。
【0157】
インビトロまたは細胞中でエンジニアリングされたCas12iヌクレアーゼ(またはその機能バリアント)の遺伝子編集効率は、例えばT7エンドヌクレアーゼ1(T7E1)アッセイ、標的DNAの配列決定(例えば、Sanger配列、及び二世代シーケンスを含む)、分解によるインデルの追跡(TIDE)アッセイ、またはアンプリコン解析によるインデル検出(IDAA)アッセイを含む、当技術分野で知られている方法を用いて決定することができる。例えば、Sentmanat MF etal.,“A survey of validation strategies for CRISPR-Cas9 editing,”Scientific Reports,2018,8,記事番号888を参照し、これは全体的な参照により本明細書に組み込まれている。いくつかの実施形態では、例えば、本明細書の実施形態で説明されるように、標的化された二世代シーケンス(NGS)を用い、細胞中で前記エンジニアリングされたCas12iヌクレアーゼの遺伝子編集効率を測定する。前記エンジニアリングされたCas12iヌクレアーゼ(またはその機能バリアント)の遺伝子編集効率を決定するのに有用な例示的なゲノム部位としては、CCR5、AAVS、CD34、RNF2、及びEMX1が挙げられるが、これらに限定されない。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼ(またはその機能バリアント)の遺伝子編集効率は、前記エンジニアリングされたCas12iヌクレアーゼの少なくとも5、10、15、20、25、30、35、40、45、50、55、60、65またはそれ以上の部位(例えばヒト細胞ゲノム部位)における平均遺伝子編集効率である。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼ(またはその機能バリアント)の遺伝子編集効率(例えば、挿入欠失率)は、少なくとも10%、20%、30%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%またはそれ以上に達する。
【0158】
いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼ(またはその機能的バリアント)は、前記参照Cas12iヌクレアーゼと比較して増加した標的特異性、減少したオフターゲット率(例えば、識別されたオフターゲット部位を減少させ、及び/または1つまたは複数のオフターゲット部位に対する編集効率を低下させる)、及び/または増加したターゲット配列編集効率を有する。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼ(またはその機能バリアント)は、前記参照Cas12iヌクレアーゼと比べて、少なくとも約5%(例えば、少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、または100%のいずれか)のオフターゲット率を低下させる。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼ(またはその機能バリアント)は、前記参照Cas12iヌクレアーゼと比べて、少なくとも1つ(例えば、少なくとも2、3、4、5、6、7、8、9、10、20、50またはそれ以上)のオフターゲット部位を減少させる。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼ(またはその機能的バリアント)は、前記参照Cas12iヌクレアーゼと比べて、ターゲット配列の編集効率が同じまたは類似している(例えば1.1倍以内)、またはターゲット配列の編集効率が増加する(例えば参照Cas12iヌクレアーゼの少なくとも1.2倍、1.5倍、2倍、3倍、5倍、10倍またはそれ以上)。いくつかの実施形態では、前記エンジニアリングされたCas12iヌクレアーゼ(またはその機能バリアント)は、前記参照Cas12iヌクレアーゼと比べて、少なくとも約5%のオフターゲット率を低下させ、ターゲット配列に対する編集効率が同じ、類似(例えば1.1倍以内)、または増加させる。
【0159】
ガイドRNAまたはcrRNA
いくつかの実施形態では、ガイドRNAまたはcrRNAは、5’から3’まで、直接リピート配列、スペーサー配列を含むか、またはそれらで構成される。いくつかの実施形態では、ガイドRNAは5’から3’まで、直接リピート配列、スペーサー配列、直接リピート配列の連結により構築されたヌクレオチド配列を含むか、またはそれらで構成される。いくつかの実施形態では、RNAガイドはcrRNAを含む。いくつかの実施形態では、ガイドRNAはtraccrRNAを含まない。
【0160】
一般的に、本明細書に記載されるcrRNAは、直接リピート配列及びスペーサー配列を含む。いくつかの実施形態では、crRNAは、ガイド配列またはスペーサー配列に連結された直接リピート配列を含み、基本的にはそれで構成される、またはそれで構成される。いくつかの実施形態では、crRNAは、直接リピート配列、スペーサー配列、及び直接リピート配列(DR-スペーサー-DR)を含み、それは他のCRISPRシステムに典型的な前駆体crRNA(前crRNA)構造である。いくつかの実施形態では、crRNAは、トランケートされた直接リピート配列及びスペーサー配列を含み、それは典型的な加工された又は成熟したcrRNAである。いくつかの実施形態では、CRISPR-Casエフェクタータンパク質は、RNAガイドと複合体を形成し、スペーサー配列は、この複合体を、スペーサー配列に相補的な標的核酸と配列特異的に結合させるように導く。
【0161】
いくつかの実施形態では、RNAガイドは直接リピートを含む。いくつかの実施形態では、RNAガイドは、例えば、本明細書で説明するようなステムループ構造の2次構造を形成することができる。
【0162】
いくつかの実施形態では、本明細書に記載のCRISPRシステムは、複数のRNAガイド(例えば、2、3、4、5、10、15またはそれ以上)または複数のRNAガイドをコードする複数の核酸を含む。いくつかの実施形態では、本明細書に記載のCRISPRシステムは、単一のRNA鎖または単一のRNA鎖をコードする核酸を含み、そのうちRNAガイドは直列に配置される。単一のRNA鎖は、同じRNAガイドの複数のコピー、異なるRNAガイドの複数のコピー、またはそれらの組み合わせを含むことができる。いくつかの実施形態では、各RNAガイドは異なる標的核酸に特異的である。
【0163】
いくつかの実施形態では、本明細書に記載のCRISPRシステムは、RNAガイドまたはRNAガイドをコードする核酸を含む。いくつかの実施形態では、RNAガイドは、直接リピート配列と、標的核酸とハイブリダイズすることができる(例えば、適切な条件下でハイブリダイズする)スペーサー配列と、を含むか、またはそれらで構成される。
【0164】
いくつかの実施形態では、RNAガイド配列は、CRISPRエフェクター複合体を形成し、ターゲット配列との結合に成功することを可能にし、同時に、成功したヌクレアーゼ活性を可能にしない(すなわち、ヌクレアーゼ活性がない/挿入欠失を起こさない)ように修飾される。これらの修飾されたガイド配列は、「不活化ガイド」または「不活化ガイド配列」と呼ばれる。これらの不活性化ガイドまたは不活性化ガイド配列は、ヌクレアーゼ活性に対して触媒的に不活性化されてもよいし、立体的に不活性化されてもよい。不活性化ガイド配列は、通常、活性RNA切断をもたらす対応するガイド配列より短い。いくつかの実施形態では、不活性化ガイドは、ヌクレアーゼ活性を有する対応するRNAガイドより少なくとも約5%、10%、20%、30%、40%、または50%短い。RNAガイドの不活性化ガイド配列の長さは、13~15ヌクレオチド(例えば、13、14又は15ヌクレオチド)、15~19ヌクレオチド、又は17~18ヌクレオチド(例えば、17ヌクレオチド)であってもよい。いくつかの実施形態では、不活性化ガイドRNAは、CRISPRシステムが検出可能な切断活性なしに細胞中の目的ゲノム遺伝子座に向けられるように、ターゲット配列とハイブリダイズすることができる。
【0165】
本明細書に記載されたRNAガイド及びcrRNAの配列及び長さは、最適化することができる。いくつかの実施形態では、RNAガイドの最適化された長さは、crRNAの加工形態を同定することによって、またはcrRNAのRNAガイドの経験的な長さの研究によって決定することができる。いくつかの実施形態では、RNAガイド配列は塩基修飾を含む。
【0166】
いくつかの実施形態では、本発明はまた核酸(例えばcDNA)の可能なすべてのバリアントを提供し、前記バリアントは可能なコドン選択に基づいて組み合わせを選択することによって調製することができる。これらの組み合わせは、天然に存在するバリアントをコードするポリヌクレオチドに適用される標準的なトリプレット遺伝暗号に基づいて行われ、これらのすべてのバリアントは具体的に開示されていると考えられている。
【0167】
スペーサー(spacer)配列
いくつかの実施形態では、スペーサー配列(またはスペーサー、ガイド配列)は、DNAなどの標的核酸のターゲット配列、例えば、少なくとも約70%(例えば、少なくとも約75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%)と相補的であってもよい。いくつかの実施形態では、スペーサー配列は、DNAなどの標的核酸のターゲット配列と少なくとも15(例えば、少なくとも16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50またはそれ以上)ヌクレオチド相補的である。
【0168】
十分な相補性が機能することを前提として、完全な相補性は必要ないことが当技術分野で知られている。切断効率の調整は、ミスマッチ(例えば、1つまたは複数のミスマッチ、たとえばスペーサー/ターゲットに沿ったミスマッチの位置を含む、スペーサー配列とターゲット配列との間の1つまたは2つのミスマッチ)を導入することによって利用することができる。ミスマッチ、例えば二重ミスマッチは、中心部に位置する(すなわち、3’または5’端に位置しない)ほど、切断効率が受ける影響は大きい。したがって、スペーサー配列に沿ったミスマッチ位置を選択することにより、切断効率を調整することができる。例えば、標的の100%未満の切断(例えば、細胞集団内)が所望される場合、スペーサー配列とターゲット配列との間の1つまたは2つのミスマッチをスペーサー配列に導入することができる。
【0169】
前記ガイド配列は適切な長さを有することができる。RNAガイドのスペーサー長は、約11~50ヌクレオチド(例えば、約15~50ヌクレオチド)の範囲であり得る。いくつかの実施形態では、前記ガイド配列は約18~約35ヌクレオチドの間にあり、例えば、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34または35ヌクレオチドを含む。いくつかの実施形態では、RNAガイドのスペーサー長は、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、または少なくとも22ヌクレオチドである。いくつかの実施形態では、スペーサー長は15~17ヌクレオチド、15~23ヌクレオチド、16~22ヌクレオチド、17~20ヌクレオチド、20~24ヌクレオチド(例えば、20、21、22、23又は24ヌクレオチド)、23~25ヌクレオチド(例えば、23、24又は25ヌクレオチド)、24~27ヌクレオチド、27~30ヌクレオチド、30~45ヌクレオチド(例えば、30、31、32、33、34、35、40又は45ヌクレオチド)、30または35~40ヌクレオチド、41~45ヌクレオチド、45~50ヌクレオチド、またはそれ以上。いくつかの実施形態では、RNAガイドのスペーサー長は31ヌクレオチドである。いくつかの実施形態では、RNAガイドの直接リピート長は、少なくとも21ヌクレオチド、または21~37ヌクレオチド(例えば、23、24、25、30、35または36ヌクレオチド)である。いくつかの実施形態では、スペーサー配列は、約15~約34ヌクレオチド(例えば、16、17、18、19、20、21、または22ヌクレオチド)を含むか、またはそれで構成される。いくつかの実施形態では、スペーサー配列長は17ヌクレオチドと31ヌクレオチドの間である。いくつかの実施形態では、スペーサー配列長は15ヌクレオチドと24ヌクレオチドの間である。いくつかの実施形態では、RNAガイドの直接リピート長は23または20ヌクレオチドである。
【0170】
直接リピート(DR)配列
直接リピート配列は、Cas12iタンパク質(本発明のいずれかに記載のエンジニアリングされたCas12iヌクレアーゼ、その機能バリアントまたはエフェクタータンパク質)をガイドして、ガイドgRNA(またはcrRNA)に結合させ、ターゲット配列を標的とするCRISPR-Cas複合体を形成することができる。本出願においてエンジニアリングされたCas12iヌクレアーゼまたはエフェクタータンパク質をガイドgRNA(またはcrRNA)に結合させてターゲット配列を標的とするCRISPR-Cas複合体を形成することができるDRのいずれか、例えば米国11168324(そのすべてが全体的な参照により本明細書に組み込まれる)に記載されたDR配列は、本発明に使用することができる。
【0171】
直接リピートは、介在されたヌクレオチドによって分離された、互いに相補的な2つのヌクレオチドセグメントを含むことができ、これにより、直接リピートは、ハイブリダイゼーションして二本鎖RNA二重鎖 (dsRNA二重鎖)を形成し、ステムループ構造になっており、ここで、2つの相補的なヌクレオチドセグメントがステムを形成し、介在されたヌクレオチドがループまたはヘアピンを形成する。例えば、「ループ」を形成する中間ヌクレオチドは、約6ヌクレオチド~約8ヌクレオチド、または約7個のヌクレオチドの長さを有する。異なる実施形態では、ステムは、少なくとも2つ、少なくとも3つ、少なくとも4つ、または5つの塩基対を含むことができる。
【0172】
いくつかの実施形態では、直接リピートは、長さが約4~約7(例えば、4、5、6、7)ヌクレオチドの2つのヌクレオチド相補セグメントを含むことができ、その間に約5~約9(例えば、5、6、7、8、9)ヌクレオチドがある。当業者は、公知の直接リピート構造をシミュレーションすることができる。
【0173】
直接リピートは、約13~約23ヌクレオチド、約22~約40ヌクレオチド、または約23~約38ヌクレオチド、または約23~約36ヌクレオチドを含むか、またはそれで構成され得る。
【0174】
いくつかの実施形態では、直接リピート配列は、3’末端付近(スペーサー配列に隣接)のステムループ構造を含む。いくつかの実施形態では、直接リピート配列は、ステムの長さが5ヌクレオチドである3’末端に近いステムループを含む。いくつかの実施形態では、直接リピート配列は、ステムの長さが5ヌクレオチドであり、ループの長さが7ヌクレオチドである3’末端に近いステムループを含む。いくつかの実施形態では、直接リピート配列は、ステムの長さが5ヌクレオチドであり、ループの長さが6、7または8ヌクレオチドである3’末端に近いステムループを含む。
【0175】
いくつかの実施形態では、直接リピート配列は、3’末端に近い配列5’-CCGUCNNNNNNUGACGG-3’(SEQ ID NO:68)を含み、そのうちNは任意の核酸塩基を指す。いくつかの実施形態では、直接リピート配列は、3’末端に近い配列5’-GUGCCNNNNNNUGGCAC-3’(SEQ ID NO:69)を含み、そのうちNは任意の核酸塩基を指す。
【0176】
いくつかの実施形態では、直接リピート配列は、3’末端に近い配列5’-GUGUCN5-6UGACAX1-3’(SEQ ID NO:70または71)を含み、そのうちN5-6は任意の5または6個の核酸塩基の連続配列を指し、X1はCまたはTまたはUを指す。いくつかの実施形態では、直接リピート配列は、3’末端に近い配列5’-UCX3UX5X6X7UUGACGG-3’(SEQ ID NO:72)を含み、そのうちX3はCまたはTまたはUを指し、X5はAまたはTまたはUを指し、X6はAまたはCまたはGを指し、X8はAまたはGを指す。いくつかの実施形態では、直接リピート配列は、3’末端に近い配列5’-CCX3X4X5CX7UUGGCAC-3’(SEQ ID NO:73)を含み、そのうちX3はCまたはTまたはUを指し、X4はAまたはTまたはUを指し、X5はCまたはTまたはUを指し、X7はAまたはGを指す。いくつかの実施形態では、直接リピート配列をコードするヌクレオチドは、SEQ ID NO:59(AGAAATCCGTCTTTCATTGACGG)またはSEQ ID NO:79(GTTGCAAAACCCAAGAAAT CCGTCTTTCATTGACGG)と少なくとも約80%同じ、例えば、少なくとも約85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%と同じヌクレオチド配列を含むか、またはそれで構成される。いくつかの実施形態では、直接リピート配列をコードするヌクレオチドは、SEQ ID NO:79の少なくとも21(例えば、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35又は36)ヌクレオチドを含む。
【0177】
「ステムループ構造」とは、二本鎖(ステム部)を形成することが知られているまたは予測されているヌクレオチド領域を含む二次構造を有する核酸を意味し、前記二本鎖(ステム部)は、一側で主に一本鎖ヌクレオチドである領域(ループ部)によって連結されている。用語「ヘアピン」及び「折り返し」構造は、本明細書ではステムリング構造を指すためにも使用される。このような構造は当技術分野において公知であり、これらの用語は当技術分野における公知の意味と一致して使用される。当技術分野で知られているように、ステムループ構造は正確な塩基対合を必要としない。したがって、ステムは1つまたは複数の塩基ミスマッチを含むことができる。代替的には、塩基対合は正確であり得、すなわち、ミスマッチを含まない。いくつかの実施形態では、直接リピートのステムは、互いにハイブリダイゼーションされた5つの相補的核酸塩基からなり、ループ長は6、7または9ヌクレオチドである。
【0178】
いくつかの実施形態では、直接リピートをコードする配列は、SEQ ID NO:79に示される配列を含むか、またはそれで構成される。いくつかの実施形態では、直接リピートをコードする配列は、SEQ ID NO:79核酸配列の最初の3つの5’ヌクレオチドを有するトランケートされた核酸を含むか、またはそれで構成される。いくつかの実施形態では、直接リピートをコードする配列は、SEQ ID NO:79核酸配列の最初の4つの5’ヌクレオチドを有するトランケートされた核酸を含むか、またはそれで構成される。いくつかの実施形態では、直接リピートをコードする配列は、SEQ ID NO:79核酸配列の最初の5’ヌクレオチドを有するトランケートされた核酸を含むか、またはそれで構成される。いくつかの実施形態では、直接リピートをコードする配列は、SEQ ID NO:79核酸配列の最初の六つの5’ヌクレオチドを有するトランケートされた核酸を含むか、またはそれで構成される。いくつかの実施形態では、直接リピートをコードする配列は、SEQ ID NO:79核酸配列の最初の七つの5’ヌクレオチドを有するトランケートされた核酸を含むか、またはそれで構成される。いくつかの実施形態では、直接リピートをコードする配列は、SEQ ID NO:79核酸配列の最初の八つの5’ヌクレオチドを有するトランケートされた核酸を含むか、またはそれで構成される。いくつかの実施形態では、直接リピートをコードする配列は、SEQ ID NO:59によって示される配列を含むか、またはそれで構成される。
【0179】
いくつかの実施形態では、直接リピートは、SEQ ID NO:59または79によってコードされたRNA配列の「機能的バリアント」、例えば「機能的短縮バージョン」、「機能的延長バージョン」、または「機能的置換バージョン」、例えばSEQ ID NO:79の一部(短縮バージョン)であり、依然としてDR機能を有する。DR「機能性バリアント」は、参照DR(例えば、親DR)の5’及び/または3’末端延長(機能性延長バージョン)またはトランケート(機能性トランケートバージョン)、及び/または参照DR配列に1つまたは複数のヌクレオチドを挿入、欠失、及び/または置換(機能性置換バージョン)した後、依然として参照DRの少なくとも20%(例えば、少なくとも約30%、40%、50%、60%、70%、80%、90%、95%、またはそれ以上)の機能を有するDR配列であり、すなわち、対応するcrRNAにCas12iタンパク質を結合させる機能を媒介する。DR機能性バリアントは一般的にCas12iタンパク質結合のために使用できるステムループ様二次構造またはその部分を保持する。いくつかの実施形態では、DRまたはその機能性バリアントは、Cas12iタンパク質結合のために使用され得るステムループ様二次構造またはその一部を含む。いくつかの実施形態では、DRまたはその機能性バリアントは、Cas12iタンパク質結合のために使用できる少なくとも2つ(例えば、2、3、4、5またはそれ以上)のステムループ様二次構造またはその部分を含む。
【0180】
プライム編集ガイドprime editing guide RNA (pegRNA)
PEgRNA(標準ガイドRNAに対して)は、編集される標的内因性DNA配列の鎖と相同であるが所望の1つまたは複数のヌクレオチド変化を含み、ポリメラーゼ(例えば、逆転写酵素)によって合成された後に標的DNA分子に組み込まれる一本鎖DNAフラップをコードするDNA合成テンプレート配列を提供する延長部分を含むように変化する。PEgRNAはすでにWO2020191246、WO2021226558などに記載され、それは全体的な参照により本明細書に組み込まれる。
【0181】
異なる実施形態では、延長されたガイドRNAは、(a)ガイドRNA及び(b)がガイドRNAの5’または3’末端、またはガイドRNAの分子内位置におけるRNA延長を含む。好ましくは、延長部分の分子内局在化は、プロトスペーサー領域の機能を損なわない。RNA延長は、(i)所望のヌクレオチド変化を含む逆転写テンプレート配列、(ii)逆転写プライマー結合部位、及び(iii)任意のリンカー配列を含むことができる。異なる実施形態では、逆転写テンプレート配列は、ニック部位に隣接する内因性DNA配列に相補的な一本鎖DNAフラップをコードすることができ、一本鎖DNAフラップが所望のヌクレオチド変化を含む。一本鎖DNAフラップは、内因性一本鎖DNAをニック部位で置換することができる。異なる実施形態において、標的DNAに組み込まれる所望のヌクレオチド変化は、単一ヌクレオチドの変化(例えば、トランジションまたはトランスバージョン)、1つまたは複数のヌクレオチドの挿入、または1つまたは複数のヌクレオチドの欠失であり得る。
【0182】
異なる実施形態では、所望のヌクレオチド変化は、単一ヌクレオチドの変化(例えば、トランジションまたはトランスバージョン変化)、欠失または挿入であり得る。例えば、所望のヌクレオチド変化は、(1)G~T置換、(2)G~A置換、(3)G~C置換、(4)T~G置換、(5)T~A置換、(6)T~C置換、(7)C~G置換、(8)C~T置換、(9)C~A置換、(10)A~T置換、(11)A~G置換、または(12)A~C置換であってもよい。
【0183】
PAM
本発明に記載されたエンジニアリングされたCas12iヌクレアーゼ(またはその機能バリアント)は、プロトスペーサー隣接モチーフ(PAM)を識別することができる。いくつかの実施形態では、前記標的核酸はPAMを含む。いくつかの実施形態では、PAMは標的核酸中のRNAを誘導するターゲット配列に相補的な配列の5’末端に位置する。いくつかの実施形態では、PAMは、核酸配列5’-TTN-3’、5’-TTH-3’、5’-TTY-3’、または5’-TTC-3’を含むか、またはそれで構成される。いくつかの実施形態では、本発明に記載のエンジニアリングされたに適したCas12iヌクレアーゼ(またはその機能バリアント)のPAMは、核酸配列5’-NNNN-3’(N=A、T、G、C)例えば5’-NTTN-3’、5’-NTAN-3’、5’-NTCN-3’、5’-NTGN-3’、5’-NATN-3’、5’-NAAN-3’、5’-NACN-3’、5’-NAGN-3’、5’-NCTN-3’、5’-NCAN-3’、5’-NCCN-3’、5’-NCGN-3’,5’-NGTN-3’,5’-NGAN-3’,5’-NGCN-3’,5’-NGGN-3’を含むか、またはそれで構成される。いくつかの実施形態では、前記PAMは、核酸配列5’-TTTN-3’を含むかまたはそれで構成される。いくつかの実施形態では、前記PAMは核酸配列5’-TTN-3’を含むか、またはそれで構成される。
【0184】
いくつかの実施形態では、本発明に記載のエンジニアリングされたに適したCas12iヌクレアーゼ(またはその機能バリアント)のPAMは、核酸配列5’-TTTA-3’、5’-CTTA-3’、5’-GTTA-3’、5’-ATTA-3’、5’-TTTC-3’、5’-CTTC-3’、5’-GTTC-3’、5’-ATTC-3’、5’-TTTG-3’、5’-CTTG-3’、5’-GTTG-3’、5’-ATTG-3’、5’-TTTT-3’、5’-CTTT-3’、5’-GTTT-3’、5’-ATTT-3’を含む。
【0185】
エンジニアリングされたCas12iエフェクタータンパク質
本出願はエンジニアリングされたCas12i(例えば、Cas12i2)エフェクタータンパク質を提供し、それは標的結合、二本鎖切断活性、ニッカーゼ活性、及び/または遺伝子編集活性などの改善された活性を有する、本発明に記載の任意のエンジニアリングされたCas12iヌクレアーゼまたはその機能バリアント(例えば、SEQID NO:8に示すCasXX)を含む。いくつかの実施形態では、本明細書に記載のエンジニアリングされたCas12iヌクレアーゼまたはその機能誘導体(例えばdCas12i)のいずれかを含む、エンジニアリングされたCas12iエフェクタータンパク質(例えば、Cas12iヌクレアーゼ、Cas12iニッカーゼ、Cas12i融合エフェクタータンパク質または分割型(split)Cas12iエフェクタータンパク質)が提供する。いくつかの実施形態では、エンジニアリングされたCas12iエフェクタータンパク質は、本発明に記載の任意のエンジニアリングされたCas12iヌクレアーゼまたはその機能的バリアントを含むか、または主にそれで構成されるか、またはそれで構成される。
【0186】
本明細書に記載のエンジニアリングされたCas12i2ヌクレアーゼまたはその機能バリアント(例えばSEQ ID NO:8に示されるCasXX)のいずれかに基づくエンジニアリングされたCas12iエフェクタータンパク質をさらに提供する。いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は、DNA二本鎖切断活性などの酵素活性を有する。いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は、標的の二重らせん核酸(例えば、二重らせんDNA)の2本鎖を切断するヌクレアーゼ活性を有する。いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は、標的の二重らせん核酸(例えば、二重らせんDNA)の一本鎖を切断するニッケーゼ活性を有する。いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は、前記エンジニアリングされたCas12iヌクレアーゼの酵素不活性変異体を含む。
【0187】
分割型Cas12iエフェクタータンパク質
本出願はまた、本明細書に記載のエンジニアリングされたCas12iヌクレアーゼまたはその機能バリアント(例えば、SEQ ID NO:8に示されるCasXX)のいずれかに基づく分割型Cas12iエフェクタータンパク質を提供する。分割型Cas12iエフェクタータンパク質は送達に有利である可能性がある。いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は、酵素の2つの部分に分割され、この2つの部分が、基本的に機能するCas12iエフェクタータンパク質を提供するために一緒に再構成されることができる。公知の方法を用いてCasエフェクタータンパク質を提供することができ、例えば、Cas12及びCas9タンパク質の分割形態は、すでにWO2016/112242、WO2016/205749及びPCT/CN2020/11057に記載され、それは全体的な参照により本明細書に組み込まれる。
【0188】
いくつかの実施形態では、分割型Cas12iエフェクタータンパク質を提供し、それは第1のポリペプチドと第2のポリペプチドを含み、前記第1のポリペプチドは本明細書で説明するエンジニアリングされたCas12iヌクレアーゼまたはその機能誘導体のいずれかのN末端部分を含み、第2のポリペプチドはエンジニアリングされたCas12iヌクレアーゼまたはその機能誘導体のいずれかのC末端部分を含み、そのうち、前記第1のポリペプチドと第2のポリペプチドは、前記ガイド配列に相補的なターゲット配列を含む標的核酸と特異的に結合するCRISPR複合体を形成するために、ガイド配列を含むガイドRNAの存在下で互いに会合することができる。いくつかの実施形態では、前記第1のポリペプチド及び第2のポリペプチドはそれぞれ二量化ドメインを含む。いくつかの実施形態では、前記第1の二量化ドメインと第2の二量化ドメインは、誘導剤(例えばラパマイシン)の存在下で互いに会合している。いくつかの実施形態では、前記第1のポリペプチド及び第2のポリペプチドは二量化ドメインを含まない。いくつかの実施形態では、前記分割型Cas12iエフェクタータンパク質は自己誘導される。
【0189】
本発明に記載のエンジニアリングされたCas12iエフェクタータンパク質は、触媒ドメインに影響を与えないように分割することができる。Cas12iエフェクタータンパク質は、ヌクレアーゼ(ニッケーゼを含む)として使用することができ、または本質的には触媒活性が少ない、または触媒活性がない(例えば、その触媒ドメインにおける変異のため)RNAによって誘導されるDNA結合タンパク質である不活性化酵素であることができる。
【0190】
いくつかの実施形態では、エンジニアリングされたCas12iエフェクタータンパク質のヌクレアーゼローブ及びα-ヘリックスローブは分離ポリペプチドとして発現される。前記ヌクレアーゼローブ及びα-ヘリックスローブは自己相互作用しないが、RNAガイド配列はそれらを一つの複合体にリクルートし、前記複合体は全長Cas12iヌクレアーゼの活性を再現し、部位特異性のDNA切断を触媒する。いくつかの実施形態では、修飾されたRNAガイド配列を使用し、二量化を防止することによって分割型酵素の活性を除去し、誘導型二量化システムの発展を可能にすることができる。この分割型酵素は、例えば、Wright, Addison V., et al. “Rational design of a split-Cas9 enzyme complex,” Proc. Nat’l. Acad. Sci., 112.10 (2015): 2984-2989に記述され、それは全体的な参照により本明細書に組み込まれる。
【0191】
本明細書に記載の分割型Cas12iエフェクタータンパク質部分は、参照エンジニアリングされたCas12iエフェクタータンパク質(例えば、全長エンジニアリングされたCas12iヌクレアーゼ)を1つの分割位置で2つに分ける(すなわち、分割)ように設計されていてもよく、前記位置は、前記参照Cas12iエフェクタータンパク質のN端部とC端部と分離する点である。いくつかの実施形態では、前記N末端部分は前記参照Cas12iエフェクタータンパク質アミノ酸残基1~Xを含み、前記C末端部分はアミノ酸残基X+1~前記参照Cas12iエフェクタータンパク質のC末端を含む。この例では、番号付けが連続しているが、必須ではない。それは、アミノ酸(またはそれらをコードするヌクレオチド)が分割された末端及び/または変異(例えば、挿入、削除、置換)のいずれかからポリペプチド鎖の内部領域でトリミングされ得ることも考慮されているためであり、条件は、再構成されたエンジニアリングされたCas12iエフェクタータンパク質が十分なDNA結合活性(必要であれば)、DNAニッカーゼ、またはカット活性、例えば、前記参照Cas12iエフェクタータンパク質と比べて、少なくとも約40%(例えば、少なくとも約50%、60%、70%、80%、90%、95%またはそれ以上)の活性を保持していることである。
【0192】
コンピュータ(in silico)により分割点を設計し、構築物にクローンすることができる。この過程で、変異を分割型Cas12iエフェクタータンパク質に導入することができ、非機能ドメインを除去することができる。いくつかの実施形態では、前記分割型Cas12iエフェクタータンパク質の2つの部分または断片(すなわち、N末端及びC末端断片)は、完全なCas12iエフェクタータンパク質を形成することができ、完全なCas12iエフェクタータンパク質配列の少なくとも約70%(例えば、少なくとも約80%、90%、95%、96%、97%、98%、99%、またはそれ以上)を含む。
【0193】
前記分割型Cas12iエフェクタータンパク質は、それぞれ1つまたは複数の二量化ドメインを含むことができる。いくつかの実施形態では、前記第1のポリペプチドは、第1の分割型Cas12iエフェクタータンパク質と部分的に融合する第1の二量体ドメインを含み、前記第2のポリペプチドは、第2の分割型Cas12iエフェクタータンパク質と部分的に融合する第2の二量体ドメインを含む。二量化ドメインは、ペプチドリンカー(例えば、GSリンカーなどのフレキシブルペプチドリンカー)または化学結合によって分割型Cas12iエフェクタータンパク質部分に融合することができる。いくつかの実施形態では、前記二量化ドメインは、分割型Cas12iエフェクタータンパク質部分のN末端と融合する。いくつかの実施形態では、前記二量化ドメインは、分割型Cas12iエフェクタータンパク質部分のC末端と融合する。
【0194】
いくつかの実施形態では、該分割型Cas12iエフェクタータンパク質は、二量化ドメインを含まない。
【0195】
いくつかの実施形態では、前記二量化ドメインは、2つの分割型Cas12iエフェクタータンパク質部分の会合を促進する。いくつかの実施形態では、前記分割型Cas12iエフェクタータンパク質部分は誘導剤によって誘導され、機能性Cas12iエフェクタータンパク質に会合または二量化される。いくつかの実施形態では、前記分割型Cas12iエフェクタータンパク質は、誘導可能な二量化ドメインを含む。いくつかの実施形態では、前記二量化ドメインは誘導性二量化ドメインではない、すなわち、前記二量化ドメインは誘導剤の非存在下で二量化する。
【0196】
誘導剤は、ガイドRNA(例えばcrRNA)以外の誘導エネルギー源または誘導分子であってもよい。前記誘導剤は、誘導された二量化ドメインの二量化により、2つの分割型Cas12iエフェクタータンパク質部分を機能性Cas12iエフェクタータンパク質に再構成する。いくつかの実施形態では、前記誘導剤は、誘導可能な二量化ドメインの誘導会合の作用によって2つの分割型Cas12iエフェクタータンパク質部分を結合させる。いくつかの実施形態では、誘導剤がない場合、2つの分割型Cas12iエフェクタータンパク質部分は互いに会合せず、機能性Cas12iエフェクタータンパク質として再構成される。いくつかの実施形態では、誘導剤がない場合、2つの別個のCas12iエフェクタータンパク質部分は、ガイドRNA(例えばcrRNA)の存在下で互いに会合して機能性Cas12iエフェクタータンパク質として再構成することができる。
【0197】
本出願の誘導剤は、熱、超音波、電磁エネルギー、または化合物であってもよい。いくつかの実施形態では、前記誘導剤は抗生物質、小分子、ホルモン、ホルモン誘導体、ステロイドまたはステロイド誘導体である。いくつかの実施形態では、前記誘導剤は、アブシジン酸(ABA)、ドキシサイクリン(DOX)、イソプロピル安息香酸(cumate)、ラパマイシン、4-ヒドロキシタモキシフェン(4OHT)、エストロゲン、または脱皮ホルモンである。いくつかの実施形態では、前記分割型Cas12iエフェクターシステムは、抗生物質ベースの誘導システム、電磁エネルギーベースの誘導システム、小分子ベースの誘導システム、核内受容体ベースの誘導システム、ホルモンベースの誘導システムからなる群より選択される誘導剤制御のシステムである。いくつかの実施形態では、前記分割型Cas12iエフェクターシステムは、テトラサイクリン(Tet)/DOX誘導システム、光誘導システム、ABA誘導システム、イソプロピル安息香酸(cumate)阻害物/オペロンシステム、4OHT/エストロゲン誘導システム、脱皮ホルモンに基づく誘導システム、FKBP12/FRAP(FKBP12-ラパマイシン複合体)誘導システムからなる群より選択される誘導剤制御のシステムである。そのような誘導剤も、本明細書及びPCT/US2013/051418に議論され、それは全体的な参照により本明細書に組み込まれる。FRB/FKBP/レパマイシンシステムは、Paulmurugan and Gambhir, Cancer Res, August 15, 2005 65; 7413、及びCrabtree et al., Chemistry & Biology 13, 99-107, Jan 2006に記載され、全体的な参照により本明細書に組み込まれる。
【0198】
いくつかの実施形態では、ペアとなる分割型Cas12iエフェクタータンパク質は、機能性Cas12iエフェクタータンパク質ヌクレアーゼの再構築をもたらす二量化ドメインの二量化(例えば、FRB及びFKBP)が誘導されるまで、分離され、不活性である。いくつかの実施形態では、誘導型二量体(例えばFRB)の第1の半分を含む第1分割型Cas12iエフェクタータンパク質は、分離して送達され、および/または誘導型二量体(例えばFKBP)の第2の半分を含む第2分割型Cas12iエフェクタータンパク質から分離された位置にある。
【0199】
本明細書に記載の誘導剤制御に用いることができる分割型Cas12iエフェクターシステムの他の例示的なFKBPベース誘導システムとしては、FK506の存在下でカルシニューリン(CNA)と二量化したFKBP、FKCsAの存在下でCyP-Fasと二量化されたFKBP、ラパマイシンの存在下でFRBと二量化するFKBP、クマリンマイシンの存在下でGryBと二量化するGyrB、ジベレリンの存在下でGID1と二量化するGAI、またはHaXSの存在下でHaloTagと二量化するSnap-tagを含むが、これらに限定されない。
【0200】
FKBPファミリー自体内の代替案も考えられている。例えば、FK1012の存在下でFKBPはホモダイマー化される(すなわち、1つのFKBPが別のFKBPとダイマー化される)。
【0201】
いくつかの実施形態では、前記二量化ドメインはFKBPであるが、誘導剤はFK1012である。いくつかの実施形態では、前記二量化ドメインはGryBであるが、誘導剤はクマリンマイシンである。いくつかの実施形態では、前記二量化ドメインはABAであるが、誘導剤はエリスロマイシンである。
【0202】
いくつかの実施形態では、分割型Cas12iエフェクタータンパク質部分は、機能性Cas12iエフェクタータンパク質に会合/二量化されるために誘導剤なしで自動的に誘導(すなわち、自動活性化または自己誘導)されることができる。いかなる理論または仮定にも縛られないが、crRNAのようなガイドRNAと結合することによって、分割型Cas12iエフェクタータンパク質部分の自動誘導を媒介することができる。いくつかの実施形態では、前記第1のポリペプチド及び第2のポリペプチドは二量化ドメインを含まない。いくつかの実施形態では、前記第1のポリペプチド及び第2のポリペプチドは、二量化ドメインを含む。
【0203】
いくつかの実施形態では、本明細書に記載の分割型Cas12iエフェクターシステム(誘導剤制御及び自動誘導システムを含む)の再構成されたCas12iエフェクタータンパク質は、参照Cas12iエフェクタータンパク質編集効率に対し、少なくとも約60%(例えば、少なくとも約70%、75%、80%、85%、90%、95%、98%、99%、またはそれ以上のいずれか)の編集効率を有する。
【0204】
いくつかの実施形態では、本明細書に記載の誘導剤制御分割型Cas12iエフェクターシステムの再構成されたCas12iエフェクタータンパク質は、誘導剤のない状況(すなわち自動誘導による)では、参照Cas12iエフェクタータンパク質編集効率に対して、約50%(例えば、約45%、40%、35%、30%、25%、20%、15%、10%、5%またはそれ下記のいずれか)未満の編集効率を有する。
【0205】
融合Cas12iエフェクタータンパク質
本出願はまた、接合部、核局在化/輸送配列、機能ドメイン、及び/またはレポータータンパク質などの追加のタンパク質ドメイン及び/または成分を含む、エンジニアリングされたCas12iエフェクタータンパク質を提供する。
【0206】
いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は、1つまたは複数の異種タンパク質ドメイン(例えば、約1、2、3、4、5、6、7、8、9、10またはそれ以上のドメイン)と、本発明に記載されたエンジニアリングされたCas12iヌクレアーゼのいずれかの核酸標的ドメインまたはその機能誘導体を含むタンパク質複合体である。いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は、前記エンジニアリングされたCas12iヌクレアーゼまたはその機能的バリアント(例えば、SEQ ID NO:8に示されるCasXX)と融合した1つまたは複数の異種タンパク質ドメイン(例えば、約1、2、3、4、5、6、7、8、9、10またはそれ以上のドメイン)を含む融合タンパク質である。
【0207】
いくつかの実施形態では、本出願のエンジニアリングされたCas12iエフェクタータンパク質は、(例えば、GSペプチドリンカーなどの1つまたは複数のペプチドリンカーによるタンパク質の融合により)1つまたは複数の機能ドメインを含み、または1つまたは複数の機能ドメインが(例えば、複数のタンパク質の共発現による)それに会合されることができる。いくつかの実施形態では、前記1つまたは複数の機能ドメインは酵素ドメインである。これらの機能ドメインは、DNA及び/またはRNAメチラーゼ活性、ヌクレオチドデアミナーゼ活性(アデノシンデアミナーゼ活性、シチジンデアミナーゼ活性)、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写放出因子活性、ヒストン修飾活性、RNA切断活性、DNA切断活性(例えば、二本鎖エンドヌクレアーゼ活性、ニッカーゼ活性)、核酸結合活性及びスイッチング活性(例えば、光誘導又は化学誘導)など、多くの活性を有することができる。いくつかの実施形態では、前記1つまたは複数の機能ドメインは、転写活性化ドメイン(すなわち、トランス活性化ドメイン)またはリプレッサードメインである。いくつかの実施形態では、前記1つまたは複数の機能ドメインは、ヒストン修飾ドメインである。いくつかの実施形態では、前記1つまたは複数の機能ドメインは、トランスポザーゼドメイン、HR(相同性組換え)機構ドメイン、リコンビナーゼドメイン、及び/またはインテグラーゼドメインである。いくつかの実施形態では、前記機能ドメインは、Kruppel相関カセット(KRAB)、VP64、VP16、Fok1、P65、HSF1、MyoD1、ビオチン-APEX、APOBEC1、AID、PmCDA1、Tad1、及びM-MLV逆転写酵素である。いくつかの実施形態では、前記機能ドメインは、翻訳開始ドメイン、転写抑制ドメイン、トランス活性化ドメイン、エピジェネティック修飾ドメイン、核塩基編集ドメイン(例えばCBEまたはABEドメイン)、逆転写酵素ドメイン、レポーター分子ドメイン(例えば蛍光ドメイン)、及びヌクレアーゼドメインの群から選択される。
【0208】
いくつかの実施形態では、前記機能ドメインは、標的DNAまたは標的DNA関連タンパク質を修飾する活性を有し、前記活性は、ヌクレアーゼ活性(例えば、HNHヌクレアーゼ、RuvCヌクレアーゼ、Trex1ヌクレアーゼ、Trex2ヌクレアーゼ)、メチル化活性、脱メチル化活性、DNA修復活性、DNA損傷活性、脱アミノ化活性、ジスムターゼ活性、アルキル化活性、脱プリン活性、酸化活性、ピリミジン二量体形成活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、グリコシラーゼ活性、アセチルトランスフェラーゼ活性、脱アセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデノシン酸化活性、脱アデノシン酸化活性、SUMO化活性、脱SUMO化活性、リボキシル化活性、脱リボキシル化活性、ミリスチル化活性、脱ミリスチル化活性、グリコシル化活性(例えば、O-GlcNAc転移酵素由来)、脱グリコシル化活性、転写抑制活性及び転写活性化活性のうちの1種または複数の種類から選択される。標的DNA関連タンパク質とは、ヒストン、転写因子、Mediatorなど、標的DNAを結合することができるタンパク質、または標的DNAを結合することができるタンパク質と結合可能なタンパク質、を指す。
【0209】
いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質中の1つまたは複数の機能ドメインの局在化は、与えられた機能的作用を有する標的に影響を与えるために機能ドメインの正確な空間配向を可能にする。例えば、前記機能ドメインが転写アクチベーター(例えば、VP16、VP64、またはp65)である場合、前記転写アクチベーターは、ターゲット転写に影響を与えることができる空間方位上に配置される。同様に、転写リプレッサーは標的の転写に影響を与えるように配置され、ヌクレアーゼ(例えば、Fok1)は標的を切断または部分的に切断するように配置される。いくつかの実施形態では、前記機能ドメインは、前記エンジニアリングされたCas12iエフェクタータンパク質のN末端に位置する。いくつかの実施形態では、前記機能ドメインは、エンジニアリングされたCas12iエフェクタータンパク質のC末端に位置する。いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は、N末端に第1の機能ドメインを含み、C末端に第2の機能ドメインを含む。いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は、1つまたは複数の機能ドメインと融合した、本明細書でエンジニアリングされたCas12iヌクレアーゼのいずれかの触媒失活変異体(dCas12i)を含む。
【0210】
いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は転写アクチベーターである。いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は、トランス活性化ドメインと融合した、本明細書でエンジニアリングされたCas12iヌクレアーゼのいずれかの酵素不活性化バリアントを含む。いくつかの実施形態では、前記トランス活性化ドメインは、VP64、p65、HSF1、VP16、MyoD1、HSF1、RTA、SET7/9、及びそれらの組み合わせの群から選択される。いくつかの実施形態では、前記トランス活性化ドメインはVP64、p65、及びHSF1を含む。いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は、2つの分割型Cas12iエフェクトポリペプチドを含み、それぞれがトランス活性化ドメインと融合している。
【0211】
いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は転写リプレッサーである。いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は、転写抑制ドメインと融合した、本明細書でエンジニアリングされたCas12iヌクレアーゼのいずれかの酵素不活性化バリアントを含む。いくつかの実施形態では、前記転写リプレッサードメインは、Kruppel相関カセット(KRAB)、EnR、NuE、NcoR、SID、SID4X、及びそれらの組み合わせの群から選択される。いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は、2つの分割型Cas12iエフェクトポリペプチドを含み、それぞれが転写抑制ドメインと融合する。
【0212】
いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は、シトシンエディターまたはアデノシンエディターなどの塩基エディターである。いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は、シトシン塩基編集(CBE)ドメインまたはアデノシン塩基編集(ABE)ドメインなどの核塩基編集ドメインと融合した、本明細書に記載の任意のエンジニアリングされたCas12iヌクレアーゼのいずれかの酵素不活性化バリアントを含む。いくつかの実施形態では、前記核酸塩基編集ドメインはDNA編集ドメインである。いくつかの実施形態では、前記核酸塩基編集ドメインはデアミナーゼ活性を有する。いくつかの実施形態では、前記核酸塩基編集ドメインはシトシンデアミナーゼドメインである。いくつかの実施形態では、前記核酸塩基編集ドメインはアデノシンデアミナーゼドメインである。Casヌクレアーゼに基づく例示的な塩基エディターは、例えば、全体的な参照により本明細書に組み込まれるWO2018/165629A1及びWO2019/226953A1に記載されている。例示的なCBEドメインには、活性化誘導シトシンデアミナーゼまたはAID(例えばhAID)、アポリポタンパク質B mRNA編集複合体またはAPOBEC(例えばラットAPOBEC1、hAPOBEC3A/B/C/D/E/F/G)、及びPmCDA1が含まれるが、これらに限定されない。例示的なABEドメインとしては、TadA、ABE8及びそのバリアントが挙げられるが、これらに限定されない(例えば、Gaudelli et al., 2017, Nature 551: 464-471; and Richter et al., 2020, Nature Biotechnology 38: 883-891を参照)。いくつかの実施形態では、前記機能ドメインは、ラットAPOBEC1ドメインなどのAPOBEC1ドメインである。いくつかの実施形態では、前記機能的ドメインは、大腸菌(E.coli)TadAドメインなどのTadAドメインである。いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は、さらに1つまたは複数の核局在配列を含む。
【0213】
アデノシンデアミナーゼ
本明細書で使用される場合、用語「アデノシンデアミナーゼ」または「アデノシンデアミナーゼタンパク質」は、以下に示すように、アデニン(または分子のアデニン部分)をヒポキサンチン(または分子のヒポキサンチン部分)に変換する加水分解脱アミノ反応を触媒することができる、タンパク質、ポリペプチド、またはタンパク質またはポリペプチドの1つまたは複数の機能ドメインを指す。いくつかの実施形態では、アデニン含有分子はアデノシン(A)であり、ヒポキサンチン含有分子はイノシン(I)である。アデニン含有分子は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)であり得る。
【0214】
本発明のエンジニアリング可能なCas12iヌクレアーゼのいずれかの酵素不活性化バリアントと組み合わせて使用できるアデノシンデアミナーゼには、RNAに作用するアデノシンデアミナーゼと呼ばれる酵素ファミリーメンバー(ADAR)、tRNAに作用するアデノシンデアミナーゼと呼ばれる酵素ファミリーメンバー(ADAT)、及びその他のアデノシンデアミナーゼドメイン(ADAD)を含むファミリーメンバーが含まれるが、これらに限定されない。アデノシンデアミナーゼはRNA/DNAとRNA二本鎖中のアデニンを標的にすることができる。実際、Zhengら(Nucleic Acids Res.2017、45(6):3369-3377)は、ADARがRNA/DNAとRNA/RNA二本鎖体にアデノシンからイノシンへの編集反応を行うことができることを確認した。いくつかの実施形態では、アデノシンデアミナーゼは、RNA二本鎖のRNA/DNA異種二本鎖中のDNAを編集する能力を高めるように修飾されることができる。
【0215】
いくつかの実施形態では、アデノシンデアミナーゼは1種または複数の後生動物種に由来し、哺乳類、鳥類、カエル、イカ、魚、ハエ、及びワームを含むが、これらに限定されない。いくつかの実施形態では、アデノシンデアミナーゼは、ヒト、イカ、またはショウジョウバエのアデノシンデアミナーゼである。
【0216】
いくつかの実施形態では、アデノシンデアミナーゼはヒトADARであり、hADAR1、hADAR2、hADAR3を含む。いくつかの実施形態では、アデノシンデアミナーゼは、ADR-1及びADR-2を含む、カエノラブディティス・エレガンス(Caenorhabditis elegans)ADARタンパク質である。いくつかの実施形態では、アデノシンデアミナーゼは、dAdarを含むショウジョウバエADARタンパク質である。いくつかの実施形態では、アデノシンデアミナーゼはイカ(Loligo pealeii)ADARタンパク質であり、sqADAR2a及びsqADAR2bを含む。いくつかの実施形態では、アデノシンデアミナーゼはヒトADATタンパク質である。いくつかの実施形態では、アデノシンデアミナーゼはショウジョウバエADATタンパク質である。いくつかの実施形態では、アデノシンデアミナーゼは、TENR(hADAD1)及びTENRL(hADAD2)を含むヒトADADタンパク質である。いくつかの実施形態では、アデノシンデアミナーゼはTadA8eである。
【0217】
いくつかの実施形態では、アデノシンデアミナーゼは、大腸菌TadAなどのTadAタンパク質である。Kimら、Biochemistry45:6407-6416(2006)、Wolfら、EMBO J.21:3841-3851(2002)を参照。いくつかの実施形態では、アデノシンデアミナーゼはマウスADAである。Grunebaumら、Curr.Opin.Allergy Clin. Immunol.13:630-638(2013)を参照。いくつかの実施形態では、アデノシンデアミナーゼはヒトADAT2である。Fukuiら、J.Nucleic Acids 2010:260512(2010)を参照。いくつかの実施形態において、デアミナーゼ(例えばアデノシンまたはシチジンデアミナーゼ)は、下記の文献に記載するもののうちの1つまたは複数である:Coxら、Science.2017年11月24日、358(6366):1019-1027;Komoreら、Nature.2016年5月19日、533(7603):420-4;そしてGaudelliら、Nature.2017年11月23日、551(7681):464-471を参照。
【0218】
いくつかの実施形態では、アデノシンデアミナーゼタンパク質は1つまたは複数のデアミナーゼドメインを含む。特定の理論に縛られることを望ましくないが、2本鎖核酸基質中に含まれる1つまたは複数の標的アデノシン(A)残基を識別し、それをイノシン(I)残基に変換するためにデアミナーゼドメインが使用されることが予想される。
【0219】
シチジンデアミナーゼ
いくつかの実施形態では、デアミナーゼはシチジンデアミナーゼである。本明細書で使用される場合、用語「シトシンデアミナーゼ」または「シトシンデアミナーゼタンパク質」は、シトシン(または分子のシトシン部分)をウラシル(または分子のウラシル部分)に変換する加水分解脱アミノ反応を触媒することができるタンパク質、ポリペプチドまたはタンパク質またはポリペプチドの1つまたは複数の機能ドメインを指す。いくつかの実施形態では、シトシン含有分子はシトシン(C)であり、ウラシル含有分子はウリジン(U)である。前記シトシン含有分子は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)であり得る。
【0220】
本発明のエンジニアリングされたCas12iヌクレアーゼのいずれかの酵素不活性化バリアントと組み合わせて使用することができるシトシンデアミナーゼには、アポリポタンパク質B mRNA編集複合体(APOBEC)ファミリーデアミナーゼと呼ばれる酵素ファミリーのメンバー、活性化誘導デアミナーゼ(AID)、またはシトシンデアミナーゼ1(CDA1)が含まれるが、これらに限定されない。いくつかの実施形態では、APOBEC1デアミナーゼ、APOBEC2デアミナーゼ、APOBEC3Aデアミナーゼ、APOBEC3Bデアミナーゼ、APOBEC3Cデアミナーゼ、APOBEC3Dデアミナーゼ、APOBEC3Eデアミナーゼ、APOBEC3Fデアミナーゼ、APOBEC3Gデアミナーゼ、APOBEC3Hデアミナーゼ、またはAPOBEC4デアミナーゼ中のデアミナーゼである。
【0221】
いくつかの実施形態では、シトシンデアミナーゼはDNA一本鎖中のシトシンを標的化することができる。いくつかの実施形態では、シトシンデアミナーゼは、結合成分の外部に存在する一本鎖上で編集することができる。いくつかの実施形態では、シトシンデアミナーゼは、標的編集部位においてガイド配列のミスマッチにより形成された局所的なバブルなど、局所的なバブルで編集することができる。いくつかの実施形態では、シトシンデアミナーゼは、Kimら、Nature Biotechnology(2017)35(4):371-377(doi:10.1038/nbt.3803に記載されているような活性の集中に寄与する変異を含むことができる。
【0222】
いくつかの実施形態では、シチジンデアミナーゼは一つまたは複数の後生動物種から由来し、哺乳類、鳥類、カエル、イカ、魚、ハエ、及びワームを含むが、これらに限定されない。いくつかの実施形態では、シチジンデアミナーゼは、ヒト、霊長類、ウシ、イヌ、ラットまたはマウスのシチジンデアミナーゼである。
【0223】
いくつかの実施形態では、シトシンデアミナーゼはhAPOBEC1またはhAPOBEC3を含むヒトAPOBECである。いくつかの実施形態では、シチジンデアミナーゼはヒトAIDである。
【0224】
いくつかの実施形態では、シトシンデアミナーゼタンパク質は1つまたは複数のデアミナーゼドメインを含む。理論に縛られることは望ましくないが、RNA二本鎖体の一本鎖バブルに含まれる1つまたは複数の標的シトシン(C)残基を識別し、ウラシル(U)残基に変換するためにデアミナーゼドメインが使用されることが予想される。
【0225】
いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質はメインエディタである。Cas9ベースのメインエディタは、例えば、A. Anzalone et al., Nature, 2019, 576 (7785): 149-157に記述され、これは全体的な参照により本明細書に組み込まれている。いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は、逆転写酵素のドメインと融合した、本明細書でエンジニアリングされたCas12iヌクレアーゼのいずれかのニッカーゼバリアントを含む。いくつかの実施形態では、前記機能ドメインは逆転写酵素ドメインである。いくつかの実施形態では、前記逆転写酵素ドメインは、D200N、T306K、W313F、T330P及びL603Wを有する1つまたは複数の変異体などのM-MLV逆転写酵素またはそのバリアントである。いくつかの実施形態では、前記メインエディタを含むエンジニアリングされたCRISPR/Cas12iシステムが提供される。いくつかの実施形態では、前記エンジニアリングされたCRISPR/Cas12iシステムはまた、第2のCas12iニッカーゼを含み、例えば、メインエディタと同じエンジニアリングされたCas12iヌクレアーゼに基づく。いくつかの実施形態では、前記エンジニアリングされたCRISPR/Cas12iシステムは、プライマー結合部位及び逆転写酵素(RT)テンプレート配列を含むプライム編集ガイドRNA(pegRNA)を含む。
【0226】
いくつかの実施形態では、本出願は、分割型Cas12iエフェクタータンパク質部分の1つまたは2つと会合(すなわち、結合または融合)する1つまたは複数(例えば、1、2、3、4、5、6つまたはそれ以上)の機能ドメインを有する分割型Cas12iエフェクトシステムを提供する。前記機能ドメインは、構築体内の融合物として、第1及び/または第2の分割型Cas12iエフェクタータンパク質の一部として提供することができる。前記機能ドメインは、一般に、GSリンカーなどのペプチドリンカーを介して分割型Cas12iエフェクタータンパク質中の他の部分(例えば、分割型Cas12iエフェクタータンパク質部分)と融合する。これらの機能ドメインは、触媒不活性化Cas12iエフェクタータンパク質に基づいて分割型Cas12iエフェクトシステムを再変換する機能に使用することができる。
【0227】
いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は、1つまたは複数の核局在配列(NLS)及び/または1つまたは複数の核外輸送配列(NES)を含む。例示的なNLS配列は、例えば、PKKKRKVPG(SEQ ID NO:66)及びASPKKKRKV(SEQ ID NO:67)を含む。NLS及び/又はNESは、前記エンジニアリングされたCas12iエフェクタータンパク質のN末端及び/又はC末端又は前記エンジニアリングされたCas12iエフェクタータンパク質中のポリペプチド鎖に動作可能に連結することができる。いくつかの実施形態では、NLS及び/またはNESは、本発明による任意のエンジニアリングされたCas12iヌクレアーゼまたはその機能バリアントのN末端及び/またはC末端に連結することができる。
【0228】
いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は、レポータータンパク質などの追加の成分をコードすることができる。いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は、蛍光タンパク質、例えばGFPを含む。このようなシステムは、ゲノム部位のイメージングを可能にすることができる(例えば、「Dynamic Imaging of Genomic Loci in Living Human Cells byan Optimized CRISPR/Cas System」Chen B etal.Cell2013を参照)。いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は、ゲノム部位のイメージングに有用な誘導可能な分割型Cas12iエフェクターシステムである。
【0229】
いくつかの実施形態では、エンジニアリングされたCas12iエフェクタータンパク質を提供し、そのうち、前記エフェクタータンパク質はDNA分子中の二本鎖切断または一本鎖切断を誘導することができる。
【0230】
いくつかの実施形態では、エンジニアリングされたCas12iエフェクタータンパク質を提供し、そのうち、前記エンジニアリングされたCas12iヌクレアーゼの機能的誘導体が、D599A、E833A、S883A、H884A、D886A、R900A、及び/またはD1019Aを含むCas12i2ヌクレアーゼ不活性変異体(前記アミノ酸位置はSEQ ID NO:1に示される対応するアミノ酸位置に定義される)、及びD647A、E894A及び/またはD948AのCas12i1ヌクレアーゼ不活性変異体(前記アミノ酸位置はSEQ ID NO:13に示される対応するアミノ酸位置によって定義される)である。既知のCas12i2ヌクレアーゼの酵素不活化変異体、例えば、US10808245B2及びHuang X.etal.、Nature Communications、11、Article number:5241(2020)に記載のCas12i2ヌクレアーゼのいかなる酵素不活化変異も、本出願における変異と組み合わせて、エンジニアリングされたCas12iヌクレアーゼの機能的誘導体及びそれに対応するエフェクタータンパク質を提供することができる。
【0231】
エンジニアリングされたCRISPR-Cas12iシステム
いくつかの実施形態では、エンジニアリングされたCRISPR-Cas12iシステムを提供し、(a)本出願に記載のいずれかのエンジニアリングされたCas12iエフェクタータンパク質(例えば、エンジニアリングされたCas12iヌクレアーゼまたはその機能バリアント、例えばSEQ ID NO:8に示すCasXX)、及び(b)ターゲット配列に相補的なガイド配列を含むガイドRNA、または前記ガイドRNAをコードする1つまたは複数の核酸を含む;
そのうち、前記エンジニアリングされたCas12iエフェクタータンパク質及び前記ガイドRNAは、前記ターゲット配列の標的核酸を含み、前記標的核酸の修飾(例えば、二本鎖又は一本鎖切断、塩基編集など)を誘導するCRISPR複合体を形成することができる。本明細書の文脈において、「修飾」という用語は、核酸二本鎖または一本鎖上の標的部位に対するヌクレアーゼの切断、塩基編集、置換、修復などを含む。
【0232】
いくつかの実施形態では、前記エンジニアリングされたCRISPR-Cas12iシステムは、(a)本明細書で記載されたエンジニアリングされたCas12iエフェクタータンパク質のいずれか(例えば、エンジニアリングされたCas12iヌクレアーゼまたはその機能性バリアントのいずれか、またはエンジニアリングされたCas12iヌクレアーゼまたはその機能性バリアントに基づくニッカーゼ、分割型Cas12i、転写リプレッサー質、転写アクチベーター、塩基エディター、またはメインエディタ)、及び(b)ターゲット配列に相補的なガイド配列を含むガイドRNA、または前記ガイドRNAをコードする1つまたは複数の核酸を含む;そのうち、前記エンジニアリングされたCas12iエフェクタータンパク質及びガイドRNAは、前記ターゲット配列を含む標的核酸に特異的に結合し、前記標的核酸の修飾(例えば、二本鎖又は一本鎖切断、塩基編集など)を誘導するCRISPR複合体を形成することができる。いくつかの実施形態では、前記エンジニアリングされたCRISPR-Cas12iシステムは、前記エンジニアリングされたCas12iエフェクタータンパク質(例えば、エンジニアリングされたCas12iヌクレアーゼまたはその機能バリアント、例えばSEQ ID NO:8に示されるCasXX)及び/または前記ガイドRNAの1つまたは複数の核酸を含む。いくつかの実施形態では、前記エンジニアリングされたCRISPR-Cas12iシステムは、例えばエンジニアリングされたCas12iエフェクタータンパク質によって複数のcrRNAに加工されることができる前駆体ガイドRNAアレイを含む。いくつかの実施形態では、前記エンジニアリングされたCRISPR-Cas12iシステムは、エンジニアリングされたCas12iエフェクタータンパク質及び/またはガイドRNAをコードする1つまたは複数のベクターを含む。いくつかの実施形態では、前記エンジニアリングされたCRISPR-Cas12iシステムは、前記ガイドRNAに結合した前記エンジニアリングされたCas12iエフェクタータンパク質を含む、リボ核タンパク質(RNP)複合体を含む。
【0233】
本出願のエンジニアリングされたCRISPR-Cas12iシステムは、任意の適切なガイドRNAを含むことができる。ガイドRNA(gRNA)は、細胞中の標的ゲノム部位などの標的核酸中のターゲット配列とハイブリダイゼーション可能なガイド配列を含むことができる。いくつかの実施形態では、前記gRNAは、前記ガイド配列を含むCRISPR RNA(crRNA)配列を含む。
【0234】
一般的に、本明細書に記載のcrRNAは、直接リピート配列及びスペーサー配列を含む。ある実施形態では、前記crRNAは、ガイド配列またはスペーサー配列に連結された直接リピート配列を含み、基本的にはそれで構成され、またはそれで構成される。いくつかの実施形態では、前記crRNAは、直接リピート配列、スペーサー配列、及び直接リピート配列(DR-スペーサー配列-DR)を含み、それは、前駆体crRNA(pre-crRNA)構造の典型的な特徴である。いくつかの実施形態では、前記crRNAは、加工されたまたは成熟したcrRNAの典型的な特徴である、トランケートされた直接リピート配列及びスペーサー配列を含む。いくつかの実施形態では、前記CRISPR-Cas12iエフェクタータンパク質はRNAガイド配列と複合体を形成し、前記スペーサー配列は、前記複合体を、スペーサー配列と相補的な(例えば、少なくとも70%相補的な)標的核酸と配列特異的に結合するように誘導する。
【0235】
いくつかの実施形態では、前記ガイドRNAはガイド配列を含むcrRNAである。いくつかの実施形態では、前記エンジニアリングされたCRISPR-Cas12iシステムは、複数のcrRNAをコードする前駆体ガイドRNAアレイを含む。いくつかの実施形態では、前記Cas12iエフェクタータンパク質は、複数のcrRNAを生成するために前記前駆体ガイドRNAアレイを切断する。いくつかの実施形態では、前記エンジニアリングされたCRISPR-Cas12iシステムは、複数のcrRNAをコードする前駆体ガイドRNAアレイを含み、各crRNAは異なるガイド配列を含む。
【0236】
構築物とベクター
本明細書はまた、本明細書に記載のエンジニアリングされたCas12iエフェクタータンパク質(例えば、エンジニアリングされたCas12iヌクレアーゼまたはその機能バリアント)のいずれかをコードする構築物、ベクター、及び発現システムを提供する。いくつかの実施形態では、前記構築物、ベクター、または発現システムは、1つまたは複数のgRNAまたはcrRNAアレイをさらに含む。
【0237】
「ベクター」は、分離された核酸を含み、分離された核酸を細胞内部に送達するために使用することができる物質組成物である。多くのベクターは当技術分野で知られ、線状ポリヌクレオチド、イオンまたは両親媒性化合物と会合するポリヌクレオチド、プラスミド、及びウイルスを含むが、これらに限定されない。一般に、適切なベクターは、少なくとも1つの生物において作用する複製開始点、プロモーター配列、便利な制限的ヌクレオチダーゼ部位、及び1つまたは複数の選択的マーカーを含む。用語「ベクター」はまた、例えばポリリジン化合物、リポソームなどの核酸の細胞への転移を促進する非プラスミド及び非ウイルス化合物を含むと解釈されるべきである。
【0238】
いくつかの実施形態では、前記ベクターはウイルスベクターである。ウイルスベクターの例としては、アデノウイルスベクター、アデノ随伴ウイルスベクター、レンチウイルスベクター、レトロウイルスベクター、ワクシニアウイルスベクター、単純ヘルペスウイルスベクター及びその誘導体が挙げられるが、これらに限定されない。いくつかの実施形態では、前記ベクターはファージベクターである。ウイルスベクター技術は当技術分野で周知であり、例えばSambrookら(2001, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, New York)、その他のウイルス学及び分子生物学的マニュアルに記載されている。
【0239】
哺乳動物細胞に遺伝子を導入するために、ウイルスに基づく多くのシステムが開発されてきた。例えば、レトロウイルスは遺伝子送達システムに便利なプラットフォームを提供する。異種核酸は、当該技術分野で公知の技術を用いてベクターに挿入され、レトロウイルス粒子中に包装されてもよい。次いで、組換えウイルスを分離し、インビトロまたはエクスビボで哺乳動物細胞に送達することができる。多くのレトロウイルスシステムは当技術分野で知られている。いくつかの実施形態では、アデノウイルスベクターが使用される。多くのアデノウイルスベクターは当技術分野で知られている。いくつかの実施形態では、レンチウイルスベクターが使用される。いくつかの実施形態では、自己不活化レンチウイルスベクターを使用する。
【0240】
ある実施形態では、前記ベクターは、アデノ随伴ウイルス (AAV) ベクター、たとえばAAV2、AAV8、または AAV9であり、それは少なくとも1×105個の粒子(粒子単位、puとも呼ばれる)を含む単回投与によってアデノウイルスまたはアデノ随伴ウイルスを投与してもよい。いくつかの実施形態では、前記投与量は少なくとも約1×106個の粒子、少なくとも約1×107個の粒子、少なくとも約1×108個の粒子、または少なくとも約1×109の粒子のアデノ随伴ウイルス。送達方法及び投与量は、WO2016205764及び米国特許第8454972号に記載され、全体的な参照により本明細書に組み込まれる。
【0241】
いくつかの実施形態では、前記ベクターは組換えアデノ随伴ウイルス(rAAV)ベクターである。例えば、いくつかの実施形態では、修飾されたAAVベクターによる送達を使用することができる。修飾されたAAVベクターは、AAV1、AV2、AAV5、AAV6、AAV8、AAV8.2、AAV9、AAV rh10、修飾されたAAVベクター(例えば、修飾されたAAV2、修飾されたAAV3、修飾されたAAV6)及び偽AAV(例えば、AAV2/8、AAV2/5及びAAV2/6)を含むいくつかのカプシドタイプのうちの1つ以上に基づくことができる。rAAV粒子の生成に用いることができる例示的なAAVベクター及び技術は、当技術分野で知られている(例えば、Aponte-Ubillus etal.(2018)Appl.Microbiol. Biotechnol.102(3):1045-54;Zhong etal. (2012) J. Genet. Syndr. Gene Ther. S1: 008;West etal. (1987) Virology160:38-47(1987);Tratschin etal. (1985) Mol. Cell. Biol.5:3251-60;米国特許No.4797368及び5173414、国際公開第WO2015/054653号と第WO93/24641号を参照し、それぞれ参照により本明細書に組み込まれている)。
【0242】
Cas9及び他のCasタンパク質を送達するための任意の公知のAAVベクターは、本出願のエンジニアリングされたCas12iシステムを送達するために使用することができる。
【0243】
いくつかの実施形態では、rAAV構築物は、経腸的に被験者に投与することができる。いくつかの実施形態では、rAAV構築物は非経口的に被験者に投与することができる。いくつかの実施形態では、rAAV粒子は、皮下、眼内、硝子体内、網膜下、静脈内(IV)、脳室内、筋肉内、鞘内(IT)、脳槽内、腹膜内、吸入、局所的または直接注射により1つまたは複数の細胞、組織または器官に注射することができる。いくつかの実施形態では、rAAV粒子は肝動脈または門脈に注射することによって被験者に投与することができる。
【0244】
哺乳動物細胞にベクターを導入する方法は当技術分野で知られている。ベクターは、物理的、化学的、または生物学的方法によって宿主細胞に移すことができる。
【0245】
ベクターを宿主細胞に導入するための物理的方法としては、リン酸カルシウム沈殿、リポフェクション、粒子ボンバードメント、マイクロインジェクション、エレクトロポレーションなどが挙げられる。ベクター及び/または外因性核酸を含む細胞を産生する方法は、当技術分野で周知である。Sambrook etal.(2001)Molecular Cloning:A Laboratory Manual、Cold Spring Harbor Laboratory、New Yorkなどを参照。いくつかの実施形態では、前記ベクターはエレクトロポレーションによって細胞に導入される。
【0246】
異種核酸を宿主細胞に導入するための生物学的方法としては、DNA及びRNAベクターの使用が挙げられる。ウイルスベクターは、ヒト細胞などの哺乳動物に遺伝子を挿入する最も広く用いられる方法となっている。
【0247】
ベクターを宿主細胞に導入するための化学的方法は、高分子複合体、ナノカプセル、マイクロスフェア、ビーズ、及び脂質ベースシステムなどのコロイド分散系を含み、前記脂質ベースシステムには水中油エマルジョン、ミセル、混合ミセル、及びリポソームを含む。インビトロ送達ベクターとして使用される典型的なコロイド系は、リポソーム(例えば、人工膜小胞)である。いくつかの実施形態では、前記エンジニアリングされたCRISPR-Cas12iシステムは、RNPの形態でナノ粒子中に送達される。
【0248】
いくつかの実施形態では、前記CRISPR-Cas12iシステムまたはその成分をコードするベクターまたは発現システムは、CRISPR-Cas12iシステム(例えば、初期及び大規模)によって修飾された細胞を分離または効率的に選択する手段を提供する1つまたは複数の選択可能または検出可能なマーカーを含む。
【0249】
レポーター遺伝子は、トランスフェクションの可能性がある細胞を同定し、調節配列の機能を評価するために使用することができる。一般に、レポーター遺伝子は受容体生体または組織中に存在しないか、または発現しない遺伝子であり、コードされるポリペプチドの発現は、酵素活性などの検出しやすい性質によって証明される。DNAを受容体細胞に導入した後の適切な時間において、レポーター遺伝子の発現を決定する。適切なレポーター遺伝子には、ルシフェラーゼを、β-ガラクトシダーゼ、クロラムフェニコールアセチルトランスフェラーゼ、分泌されるアルカリホスファターゼをコードする遺伝子または緑色蛍光タンパク質遺伝子(例えば、Ui-Tei etal.FEBS Letters 479:79-82(2000)))を含むことができる。
【0250】
宿主細胞中の異種核酸の存在を確認する他の方法としては、Southern及びNorthernブロッティング、RT-PCR及びPCRなどの当業者に周知の分子生物学的アッセイ、ELISA及びWesternブロッティングなどの免疫学的方法により特定のペプチドの存在又は不存在を検出する生化学的アッセイを含む。
【0251】
いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質及び/または前記ガイドRNAをコードする核酸配列はプロモーターと動作可能に連結される。いくつかの実施形態では、前記プロモーターは、前記エンジニアリングされたCRISPR-Cas12iシステムを用いて工学的に改変される細胞の内因性プロモーターである。例えば、前記エンジニアリングされたCas12iエフェクタータンパク質をコードする核酸は、当該技術分野で知られている任意の方法を用いてエンジニアリングされた哺乳類細胞のゲノム中で内因性プロモーターの下流に位置するようにノックインすることができる。いくつかの実施形態では、内因性プロモーターは豊富なタンパク質(例えば、β-アクチン)のプロモーター。いくつかの実施形態では、前記内因性プロモーターは誘導可能なプロモーターであり、例えば、エンジニアリングされた哺乳類細胞の内因性活性化シグナルによって誘導することができる。いくつかの実施形態では、前記エンジニアリングされた哺乳類細胞はT細胞であり、前記プロモーターはT細胞活性化依存プロモーター(IL-2プロモーター、NFATプロモーター、またはNFκBプロモーターなど)である。
【0252】
いくつかの実施形態では、前記プロモーターは、前記エンジニアリングされたCRISPR-Cas12iシステムを用いて工学的に改変される細胞に対する異種プロモーターである。哺乳動物細胞中で遺伝子を発現するために複数のプロモーターが探索され、当技術分野で知られている任意のプロモーターが本出願に使用できる。プロモーターは、構成型プロモーターまたは制御されたプロモーター、例えば誘導型プロモーターに大別することができる。
【0253】
いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質及び/またはガイドRNAをコードする核酸配列は、構成型プロモーターと動作可能に連結される。構成型プロモーターは、異種遺伝子(トランスジェニックとも呼ばれる)の宿主細胞中での構成的発現を可能にする。本明細書で考慮される例示的な構成型プロモーターにはサイトメガロウイルス(CMV)プロモーター、ヒト伸長因子-1α (hEF1α)、ユビキチンCプロモーター(UbiC)、ホスホグリセロールキナーゼプロモーター(PGK)、シミアンマウイルス40初期プロモーター(SV40)及びニワトリβ-アクチンプロモーターとCMV最初期エンハンサー(CAG)と結合したものを含むが、それに限定されない。いくつかの実施形態では、前記プロモーターはCAGプロモーターであり、それが、サイトメガロウイルス(CMV)最初期エンハンサー要素、プロモーター、ニワトリβ-アクチン遺伝子の第1のエクソンと第1のイントロン、及びウサギβ-グロビン遺伝子のスプライシング受容体を含む。
【0254】
いくつかの実施形態では、前記エンジニアリングされたCRISPR-Cas12iエフェクタータンパク質及び/または前記RNAをコードする核酸配列は、誘導型プロモーターに動作可能に連結される。誘導型プロモーターは制御されたプロモータータイプに属する。誘導型プロモーターは、物理的条件、微小環境、または宿主細胞の生理的状態、誘導物(すなわち誘導剤)、またはそれらの組み合わせなどの1つまたは複数の条件によって誘導することができる。いくつかの実施形態では、前記誘導条件は、誘導剤、照射(例えば電離放射線、光)、温度(例えば熱)、酸化還元状態、腫瘍環境、及びエンジニアリングされるCRISPR-Cas12iシステムによって工学的に改造されるべき細胞の活性化状態の群から選択される。いくつかの実施形態では、前記プロモーターは化合物などの小分子誘導剤によって誘導されてもよい。いくつかの実施形態では、前記小分子は、ドキシサイクリン、テトラサイクリン、アルコール、金属またはステロイドの群から選択される。化学誘導プロモーターは最も広く研究されている。そのようなプロモーターには、その転写活性がドキシサイクリン、テトラサイクリン、アルコール、ステロイド、金属及び他の化合物の存在または非存在によって調節される小分子化学物質を含む。逆テトラサイクリン制御性トランス活性化因子(rtTA)とテトラサイクリン応答素子プロモーター(TRE)を有するドキシサイクリン誘導システムは現在最も成熟したシステムである。WO9429442は、テトラサイクリン応答性プロモーターによる真核細胞中の遺伝子発現の厳格な制御を記述している。WO9601313はテトラサイクリン調節転写調節剤を開示している。さらに、Tet-onシステムのようなTet技術は、例えばTetSystems.comウェブサイトに記載されている。本出願では、前記エンジニアリングされたCRISPR-Cas12iタンパク質をコードする、及び/または前記ガイドRNAの発現を駆動するために、任意の既知の化学的調節プロモーターを使用することができる。
【0255】
いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質をコードする核酸配列はコドンによって最適化される。
【0256】
いくつかの実施形態では、コドンによって最適化された配列を含む発現構築物が提供され、前記エンジニアリングされたCas12iエフェクタータンパク質をコードするこの配列は、BPK2104-ccdBベクターに結合される。いくつかの実施形態では、前記発現構築物は、前記エンジニアリングされたCas12iエフェクタータンパク質のC末端に動作可能に連結されたラベル(例えば10×Hisラベル)をコードする。
【0257】
いくつかの実施形態では、各エンジニアリングされた分割型Cas12i構築物は、GFPまたはRFPなどの蛍光タンパク質をコードする。前記レポータータンパク質は、前記エンジニアリングされたCas12iタンパク質の共局在化及び/または二量化の、例えば顕微鏡を用いた評価に使用されることができる。エンジニアリングされたCas12iエフェクタータンパク質をコードする核酸配列は、T2A、P2A、E2AまたはF2Aペプチドなどの自己切断ペプチドをコードする配列を用いて、追加の成分をコードする核酸配列と融合されることができる。
【0258】
いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質をコードする核酸配列を含む、哺乳動物細胞(例えばヒト細胞)に用いる発現構築物が提供される。いくつかの実施形態では、前記発現構築物は、pCAG-2A-eGFPベクターに挿入されたエンジニアリングされたCas12iエフェクタータンパク質をコードするコドン最適化配列を含み、それによりCas12iタンパク質をeGFPに動作可能に連結する。いくつかの実施形態では、哺乳動物細胞(例えばヒト細胞)におけるガイドRNA(例えばcrRNA又は前駆体crRNAアレイ)の発現のための第2のベクターが提供される。いくつかの実施形態では、前記ガイドRNAをコードする配列は、pUC19-U6-i2-cr RNAベクター主鎖中で発現する。
【0259】
いくつかの実施形態では、CRISPR-Cas12iシステムの1つまたは複数の要素が発現した1つまたは複数のベクターが宿主細胞に導入され、CRISPR-Cas12iシステムの要素の発現が1つまたは複数の標的部位での核酸標的化複合体の形成をガイドする。例えば、Cas12i核酸標的化エフェクター酵素及び核酸標的化ガイドRNAは、それぞれ別々のベクター上の別々の調節要素に動作可能に連結することができる。核酸標的化システムのRNAは、トランスジェニックCas12i核酸標的化エフェクタータンパク質動物または哺乳動物、例えば、核酸標的化エフェクタータンパク質を構成的または誘導的または条件付きで発現する動物または哺乳動物に送達することができ、あるいは核酸標的エフェクタータンパク質または核酸標的エフェクタータンパク質を含む細胞を有する動物または哺乳動物に、ほかの方法例えば、インビボ核酸標的化エフェクタータンパク質をコードし発現する1つまたは複数のベクターを事前に投与することにより発現することができる。あるいは、同一または異なる制御要素によって発現される2つ以上の要素を単一のベクターに組み込むことができ、一方、1つまたは複数の追加のベクターは、第1のベクターに含まれない核酸標的化システムの任意の成分を提供する。単一のベクターに組み込まれた核酸標的化系要素は、例えば、1つの要素が第2の要素に対して(「上流」)5′に位置しているか、または第2の要素に対して(「下流」)3′に位置しているかのように、任意の適切な方向に配列することができる。1つの要素のコード配列は、第2の要素のコード配列のセンス鎖またはアンチセンス鎖上に位置し、同一または逆の方向に配向することができる。いくつかの実施形態では、単一プロモーターが、Cas12i核酸標的化エフェクタータンパク質及び核酸標的化ガイドRNAをコードする転写物の発現を駆動し、前記転写物は1つまたは複数のイントロン配列内に組み込まれた(例えば、それぞれが異なるイントロン中に、2つ以上は少なくとも1つのイントロン中に、又はすべては単一イントロン中に)。いくつかの実施形態では、核酸標的化エフェクタータンパク質及び核酸標的化ガイドRNAは、同じプロモーターに動作可能に連結され、同じプロモーターで発現することができる。核酸標的化システムの1つまたは複数の要素を発現するための送達媒体、ベクター、粒子、ナノ粒子、製剤、及びその成分は、WO2014/093622(PCT/US2013/074667)などの上述の文書で使用されている通りである。いくつかの実施形態では、ベクターは1つまたは複数の挿入部位、例えば制限エンドヌクレアーゼ認識配列(「クローニング部位」とも呼ばれる)を含む。いくつかの実施形態では、1つまたは複数の挿入部位(例えば、約1、2、3、4、5、6、7、8、9、10またはそれ以上の挿入部位)は、1つまたは複数のベクターの1つまたは複数の配列要素の上流及び/または下流に位置する。複数の異なるガイド配列を使用する場合、単一発現構築物を使用して、核酸標的化活性を細胞内の複数の異なる対応するターゲット配列に標的化することができる。例えば、単一ベクターは、約1、2、3、4、5、6、7、8、9、10、15、20またはそれ以上のガイド配列を含むことができる。いくつかの実施形態では、約1、2、3、4、5、6、7、8、9、10またはそれ以上のこのようなガイド配列を含むベクターを提供し、任意に細胞に送達することができる。いくつかの実施形態では、ベクターは、核酸標的化エフェクタータンパク質をコードする酵素コード配列に動作可能に連結された制御要素を含む。Cas12i核酸標的化エフェクタータンパク質又は1種以上の核酸標的化ガイドRNAは別々に送達することができ、そして有利には、これらのうちの少なくとも1つは粒子複合体を介して送達される。Cas12i核酸標的化エフェクタータンパク質を発現する時間を残すために、核酸標的化ガイドRNAの前に核酸標的化エフェクタータンパク質mRNAを送達することができる。核酸標的化エフェクタータンパク質mRNAは、核酸標的化ガイドRNAを投与する1~12時間前(好ましくは約2~6時間)に投与することができる。あるいは、核酸標的化エフェクタータンパク質mRNAと核酸標的化ガイドRNAとを一緒に投与することができる。有利には、最初に核酸標的化エフェクタータンパク質mRNA+ガイドRNAを投与した後1~12時間(好ましくは約2~6時間)にガイドRNAの第2強化用量を投与することができる。核酸標的化エフェクタータンパク質mRNA及び/またはガイドRNAの他の投与を指示することは、最も有効なゲノム修飾レベルを達成するのに有用である可能性がある。
【0260】
いくつかの実施形態では、CRISPR-Cas12iシステムを提供し、(1)いずれかに記載のエンジニアリングされたCas12iエフェクタータンパク質(いずれかに記載のエンジニアリングされたCas12iヌクレアーゼまたはその機能バリアント)、またはいずれかに記載のエンジニアリングされたCas12iエフェクタータンパク質をコードするポリヌクレオチドと、(2)crRNAまたはcrRNAをコードするポリヌクレオチドを含み、前記crRNAは(i)標的DNAのターゲット配列とハイブリダイズすることができるスペーサー配列と、(ii)スペーサー配列に連結され、エンジニアリングされたCas12iエフェクタータンパク質を、ターゲット配列を標的とするCRISPR-Cas12i複合体を形成するために前記crRNAに結合させることを誘導することができる直接リピート配列とを含む。
【0261】
いくつかの実施形態では、CRISPR-Cas12iシステムを提供し、それは一つまたは複数のベクターを含み、前記1つまたは複数のベクターは(1)前記エンジニアリングされたCas12iエフェクタータンパク質(例えば、エンジニアリングされたCas12iヌクレアーゼまたはその機能バリアント)のいずれかをコードするヌクレオチド配列に動作可能に連結された第1の調節要素と、(2)crRNAをコードするポリヌクレオチドに動作可能に連結された第2の制御要素を含む。前記crRNAは(i)標的DNAのターゲット配列とハイブリダイズすることができるスペーサー配列と、(ii)前記スペーサー配列に連結された、前記エンジニアリングされたCas12iエフェクタータンパク質を前記crRNAに結合させて前記ターゲット配列を標的とするCRISPR-Cas12i複合体を形成することが誘導可能な直接リピート配列とを含み、前記第1の制御要素と前記第2の制御要素は、前記CRISPR-Cas12iシステムの同一又は異なるベクター上に位置する。
【0262】
いくつかの実施形態では、前記第1の制御要素及び第2の制御要素は、前記CRISPR-Cas12iシステムの異なるベクター上に配置される。いくつかの実施形態では、前記第1の制御要素と前記第2の制御要素は、前記CRISPR-Cas12iシステムの同じベクター上に配置される。いくつかの実施形態では、前記第1の制御要素及び前記エンジニアリングされたCas12iエフェクタータンパク質をコードするヌクレオチド配列は、前記第2の制御要素及び前記crRNAをコードするポリヌクレオチドの上流にある。いくつかの実施形態では、前記第1の制御要素及び前記エンジニアリングされたCas12iエフェクタータンパク質をコードするヌクレオチド配列は、前記第2の制御要素及び前記crRNAをコードするポリヌクレオチドの下流にある。いくつかの実施形態では、前記第1の制御要素と前記第2の制御要素は同じである。いくつかの実施形態では、前記第1の制御要素と前記第2の制御要素は異なる。
【0263】
いくつかの実施形態では、CRISPR-Cas12iシステムを提供し、それは一つのベクターを含み、前記ベクターは(1)いずれかの前記エンジニアリングされたCas12iエフェクタータンパク質(エンジニアリングされたCas12iヌクレアーゼまたはその機能バリアントのいずれか)をコードするポリヌクレオチド、(2)crRNAをコードするポリヌクレオチドを含み、前記crRNAは、(i)標的DNAのターゲット配列とハイブリダイズすることができるスペーサー配列と、(ii)前記スペーサー配列に連結され、前記エンジニアリングCas12iエフェクタータンパク質を前記crRNAに結合させて前記ターゲット配列を標的とするCRISPR-Cas12i複合体を形成することを誘導することができる直接リピート配列と、(3)前記エンジニアリングされたCas12iエフェクタータンパク質をコードするポリヌクレオチドと前記crRNAをコードするポリヌクレオチドとに動作可能に連結される制御要素とを含む。
【0264】
いくつかの実施形態では、前記ベクターは、5’から3’まで、前記制御要素、前記エンジニアリングされたCas12iエフェクタータンパク質をコードするポリヌクレオチド、及び前記crRNAをコードするポリヌクレオチドを含む。いくつかの実施形態では、前記ベクターは、5’から3’まで、前記制御要素、前記crRNAをコードするポリヌクレオチド、及び前記エンジニアリングされたCas12iエフェクタータンパク質をコードするポリヌクレオチドを含む。いくつかの実施形態では、前記crRNAをコードするポリヌクレオチド及び前記エンジニアリングされたCas12iエフェクタータンパク質をコードするポリヌクレオチドはリンカー配列例えば、P2A、T2A、E2A、F2A、BmCPV2A、BmIFV2A、(GS)n(SEQ ID NO:74)、(GGS)n(SEQ ID NO:75)及び(GGGS)n(SEQ ID NO:76)のいずれかをコードするポリヌクレオチド配列(nは少なくとも1の整数)、又はいずれのIRES、SV40、CMV、UBC、EF1α、PGK及びCAGGのポリヌクレオチド配列、またはそれらの任意の組み合わせによって結合される。
【0265】
いくつかの実施形態では、本発明に記載されたCRISPR-Cas12iシステムの成分は、DNA/RNAまたはRNA/RNAまたはタンパク質RNAの組み合わせなど、様々な形態で送達され得る。例えば、エンジニアリングされたCas12iエフェクタータンパク質(前記エンジニアリングされたCas12iヌクレアーゼまたはその機能バリアントのいずれか)は、DNAをコードするポリヌクレオチドとして、またはRNAをコードするポリヌクレオチドとして、またはタンパク質として送達されることができる。前記ガイドは、DNAコードポリヌクレオチドまたはRNAとして送達されることができる。混合された送達方法を使用してもよい。
【0266】
いくつかの態様では、本発明は、1つまたは複数のポリヌクレオチド、例えば、本明細書に記載の1つまたは複数のベクター、その1つまたは複数の転写物、及び/またはそれから転写された1つまたは複数のタンパク質を宿主細胞に送達することを含む方法を提供する。
【0267】
III.使用方法
本出願は、本明細書に記載のエンジニアリングされたCas12iエフェクタータンパク質(前記エンジニアリングされたCas12iヌクレアーゼまたはその機能バリアントのいずれか)またはCRISPR-Cas12iシステムのいずれかを用いて標的核酸または修飾核酸をインビトロ、エクスビボ、またはインビボで検出する方法、及び前記エンジニアリングされたCas12iエフェクタータンパク質またはCRISPR-Cas12iシステムを用いて治療(例えば遺伝子編集)または診断する方法を提供する。また細胞中の核酸を検出または修飾するための本明細書に記載のエンジニアリングされたCas12iエフェクタータンパク質またはCRISPR-Cas12iシステム、ならびに被験者の疾患または状態を治療または診断するための用途、及び細胞中の核酸の検出または修飾、ならびに被験者の疾患または状態の治療または診断のための医薬品の製造における、エンジニアリングされたCas12iエフェクタータンパク質のいずれかまたは前記エンジニアリングされたCas12iエフェクタータンパク質の1つまたは複数の成分を含む組成物の用途を提供する。
【0268】
試料中の標的核酸の検出方法
本出願はまた、改善された活性を有する前記エンジニアリングされたCas12iエフェクタータンパク質またはCRISPR-Cas12iシステムのいずれかを用いて標的核酸を検出する方法を提供する。検出試薬としてCas12iエフェクタータンパク質を使用することは、標的DNAを検出することによって活性化されると、V型CRISPR/Casタンパク質(例えば、Cas12i)は、非標的一本鎖DNA(ssDNAまたはRNA、すなわちガイドRNAのガイド配列がハイブリダイズしない一本鎖核酸)を混在して切断することができることが利用できる。したがって、試料中に標的DNA(二本鎖または一本鎖)が存在する場合(例えば、場合によっては閾値量を超える)、その結果、試料中の一本鎖核酸の切断であり、これは任意の便利な検出方法を用いて検出することができる(例えば、DNAまたはRNAなどのラベル付き一本鎖を用いて検出する)。Cas12iはssDNAとssRNAを切断することができる。例えば、Casタンパク質を検出試薬として使用する方法は、US10253365及びWO2020/056924に記載され、全体的な参照により本明細書に組み込まれる。
【0269】
いくつかの実施形態では、試料中の標的DNA(例えば、二本鎖または一本鎖)を検出する方法が提供され、それは、(a)前記試料を、(i)本明細書に記載のエンジニアリングされたCas12iエフェクタータンパク質(いずれかのエンジニアリングされたCas12iヌクレアーゼまたはその機能バリアント)、(ii)前記標的DNAとハイブリダイゼーションするためのガイド配列を含むガイドRNA、及び(iii)一本鎖(すなわち「一本鎖検出核酸」)であって、前記ガイドRNAのガイド配列とハイブリダイズしない検出核酸のいずれかを接触させることと、(b)前記エンジニアリングされたCas12iエフェクタータンパク質によって前記一本鎖検出核酸を切断することによって生成される検出可能なシグナルを測定することとを含む。場合によっては、前記一本鎖検出核酸は、蛍光を放出する染料対(例えば、蛍光を放出する染料対は蛍光共鳴エネルギー移動(FRET)対、消光剤/蛍光対)を含む。場合によっては、前記標的DNAはウイルスDNA(例えば、パピローマウイルス、ヘパドナウイルス、ヘルペスウイルス、アデノウイルス、ポックスウイルス、パルボウイルスなど)である。いくつかの実施形態では、前記一本鎖検出核酸はDNAである。いくつかの実施形態では、前記一本鎖検出核酸はRNAである。
【0270】
本開示のサンプル中の標的DNA(一本鎖または二本鎖)を検出するための方法は、高感度で標的DNAを検出することができる。場合によっては、本開示の方法は、複数のDNA(前記標的DNA及び複数の非標的DNAを含む)を含むサンプル中に存在する標的DNAを検出するために使用することができ、そのうち、前記標的DNAが非標的DNA107個当たり1つ又は複数のコピーで存在する(例えば、非標的DNA106個当たり1つ又は複数のコピー、非標的DNA105個当たり1つ又は複数のコピー、非標的DNA104個当たり1つ又は複数のコピー、非標的DNA103個当たり1つ又は複数のコピー、非標的DNA102個当たり1つ又は複数のコピー、非標的DNA50個当たり1つ又は複数のコピー、非標的DNA20個当たり1つ又は複数のコピー、非標的DNA10個当たり1つ又は複数のコピー、または非標的DNA5個当たり1つまたは複数のコピー)。いくつかの実施形態では、本明細書に記載のエンジニアリングされたCas12iエフェクタータンパク質は、前記参照Cas12iヌクレアーゼよりも高い感度で標的DNAを検出することができる。いくつかの実施形態では、前記エンジニアリングされたCas12iエフェクタータンパク質は、前記参照Cas12iヌクレアーゼと比較し、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、95%またはそれ以上の感度で標的DNAを検出することができる。
【0271】
修飾の方法
いくつかの実施形態では、本出願はターゲット配列を含む標的核酸を修飾する方法を提供し、前記方法は本明細書に記載のエンジニアリングされたCRISPR-Cas12iシステムのいずれかに前記標的核酸を接触させることを含む。いくつかの実施形態では、前記方法はインビトロで行われる。いくつかの実施形態では、前記標的核酸は細胞中に存在する。いくつかの実施形態では、前記細胞は細菌細胞、酵母細胞、哺乳動物細胞、植物細胞または動物細胞である。いくつかの実施形態では、方法はエクスビボで行われる。いくつかの実施形態では、前記方法はインビボで行われる。標的核酸の修飾は、標的核酸の一本鎖切断、二本鎖切断、塩基置換、塩基挿入、塩基削除、変異(例えば、病原性変異)配列修復などが含まれるが、これらに限定されない。
【0272】
いくつかの実施形態では、前記エンジニアリングされたCRISPR-Cas12iシステムによって前記標的核酸を切断するか、または標的核酸中のターゲット配列を変化させる。いくつかの実施形態では、前記標的核酸の発現は、前記エンジニアリングされたCRISPR-Cas12iシステムによって変化する。いくつかの実施形態では、前記標的核酸はゲノムDNAである。いくつかの実施形態では、前記ターゲット配列は、例えば、ターゲット配列の誤った発現(過発現、非発現、または病原性RNAまたはタンパク質の発現)に基づく疾患または状態に関連している。いくつかの実施形態では、前記エンジニアリングされたCRISPR-Cas12iシステムは、複数のcrRNAをコードする前駆体ガイドRNAアレイを含み、各crRNAは異なるガイド配列を含む。
【0273】
いくつかの実施形態では、本出願は、本明細書に記載の方法のいずれかを用いて、疾患または状態を処理するために、個体細胞中の標的核酸を修飾することを含む、前記個体細胞中の前記標的核酸に関連する疾患または状態を処理する方法を提供する。いくつかの実施形態では、前記疾患または状態は、がん、心血管疾患、遺伝性疾患(例えば鎌状赤血球貧血(SCD)またはβ-サラセミア(TDT)などの遺伝的欠陥疾患、自己免疫疾患、代謝性疾患、神経変性疾患、眼病、細菌感染、ウイルス感染の群から選択される。
【0274】
本明細書に記載のエンジニアリングされたCRISPR-Cas12iシステムは、CRISPR-Cas12iシステムにおいてエンジニアリングされたCas12iエフェクタータンパク質のタイプに応じて、細胞中の標的核酸を様々な方法で修飾することができる。いくつかの実施形態では、前記方法は標的核酸中の部位特異的切断を誘導する。いくつかの実施形態では、前記方法は、細胞、例えば細菌細胞、植物細胞又は動物細胞(例えば哺乳動物細胞)中でゲノムDNAを切断する。いくつかの実施形態では、前記方法は細胞中のゲノムDNAを切断することによって細胞を殺す。いくつかの実施形態では、前記方法は細胞中でウイルス核酸を切断する。
【0275】
いくつかの実施形態では、前記方法は、細胞中の前記標的核酸の発現レベルを変化させる(例えば、増加または減少させる)。いくつかの実施形態では、前記方法は、例えば、トランス活性化ドメインに融合した酵素活性のないCas12iタンパク質に基づき、エンジニアリングされたCas12iエフェクタータンパク質を使用することにより、細胞中の前記標的核酸の発現レベルを高める。いくつかの実施形態では、前記方法は、例えば、転写抑制ドメインに融合された酵素活性のないCas12iタンパク質に基づいて、エンジニアリングされたCas12iエフェクタータンパク質を使用することにより、細胞中の前記標的核酸の発現レベルを低下させる。いくつかの実施形態では、前記方法は、例えば、エピジェネティック修飾ドメインに融合された酵素活性のないCas12iタンパク質に基づいて、エンジニアリングされたCas12iエフェクタータンパク質を使用することにより、細胞における前記標的核酸または標的核酸関連タンパク質(例えば、標的核酸に結合されたまたはその近傍のタンパク質、例えば転写因子またはヒストン)にエピジェネティック修飾を導入する。本明細書に記載のエンジニアリングされたCas12iシステムは、エンジニアリングされたCas12iエフェクタータンパク質に含まれる機能ドメインに応じて、前記標的核酸に他の修飾を導入するために使用することができる。
【0276】
いくつかの実施形態では、前記方法は、細胞中の前記標的核酸中のターゲット配列を変化させる。いくつかの実施形態では、前記方法は、変異を細胞中の前記標的核酸に導入し、例えば、病原性変異を非病原性配列に変異させる(例えば、アデノシンデアミナーゼまたはシチシンデアミナーゼに融合したいずれかの本発明のdCas12iにより)。いくつかの実施形態では、前記方法は、CRISPR複合体による配列特異的切断の結果として、非相同末端結合(NHEJ)または相同性配向型修復(HDR)などの1つまたは複数の内因性DNA修復経路を使用し、細胞中で標的DNAに誘導される二本鎖切断を修復する。例示的な変異には、挿入、欠失、置換、及びフレームシフトが含まれるが、これらに限定されない。いくつかの実施形態では、ターゲット配列切断を同時に行い、DNA修復テンプレートを提供するためにpegRNAを使用する。いくつかの実施形態では、前記方法は標的部位にドナーDNAを挿入する。いくつかの実施形態では、ドナーDNAの挿入は、選択マーカーまたはレポータータンパク質の細胞への導入をもたらす。いくつかの実施形態では、ドナーDNAの挿入は遺伝子のノックインをもたらす。いくつかの実施形態では、ドナーDNAの挿入はノックアウト変異をもたらす。いくつかの実施形態では、ドナーDNAの挿入は、モノヌクレオチド置換などの置換変異をもたらす。いくつかの実施形態では、前記方法は細胞の表現型変化を誘導する。
【0277】
いくつかの実施形態では、前記エンジニアリングされたCRISPR-Cas12iシステムは、遺伝子回路(genetic circuit)の一部、または遺伝子回路を細胞のゲノムDNAに挿入するために使用される。本明細書に記載される誘導剤で制御されたエンジニアリングされた分割型Cas12iエフェクタータンパク質は、特に遺伝子回路の成分として使用されることができる。遺伝子回路は遺伝子療法に用いることができる。遺伝子回路を設計し使用する方法及び技術は当技術分野で知られている。さらに、例えば、Brophy, Jennifer AN, and Christopher A. Voigt. “Principles of genetic circuit design.” Nature methods 11.5 (2014): 508を参照することができる。
【0278】
本明細書に記載のエンジニアリングされたCRISPR-Cas12iシステムは、複数の標的核酸を修飾するために使用することができる。いくつかの実施形態では、前記標的核酸は細胞中にある。いくつかの実施形態では、前記標的核酸はゲノムDNAである。いくつかの実施形態では、前記標的核酸は染色体外DNAである。いくつかの実施形態では、前記標的核酸は細胞に対して外因性である。いくつかの実施形態では、前記標的核酸はウイルスDNAなどのウイルス核酸である。いくつかの実施形態では、前記標的核酸は細胞中のプラスミドである。いくつかの実施形態では、前記標的核酸は水平移動(horizontally transferred)されたプラスミドである。いくつかの実施形態では、前記標的核酸はRNAである。
【0279】
いくつかの実施形態では、前記標的核酸は、分離されたDNAなどの分離された核酸である。いくつかの実施形態では、前記標的核酸は細胞のない環境に存在する。いくつかの実施形態では、前記標的核酸は、分離されたプラスミドなどのベクターである。いくつかの実施形態では、前記標的核酸は分離された線状DNA断片である。
【0280】
本明細書に記載された方法は、任意の適切な細胞型に適している。いくつかの実施形態では、前記細胞は細菌、酵母細胞、真菌細胞、藻類細胞、植物細胞または動物細胞(例えば、ヒト細胞などの哺乳動物細胞)である。いくつかの実施形態では、前記細胞は、組織生検によって分離された細胞などの自然由来の細胞である。いくつかの実施形態では、前記細胞はインビトロ培養細胞系から分離された細胞である。いくつかの実施形態では、前記細胞は初代細胞株由来である。いくつかの実施形態では、前記細胞は永生化細胞株由来である。いくつかの実施形態では、前記細胞は遺伝子操作された細胞である。
【0281】
いくつかの実施形態では、前記細胞は、ウシ、ヒツジ、ヤギ、ウマ、ブタ、シカ、ニワトリ、アヒル、ガチョウ、ウサギ、魚の群から選択される生物の動物細胞である。
【0282】
いくつかの実施形態において、前記細胞は、トウモロコシ、小麦、大麦、オーツ麦、イネ、大豆、アブラヤシ、ベニバナ、ゴマ、タバコ、亜麻、綿、ヒマワリ、真珠粟、粟、ソルガム、キャノーラ、大麻、野菜作物、飼料作物、工業作物、木本作物、バイオマス作物の群から選択される生物の植物細胞である。
【0283】
いくつかの実施形態では、前記細胞は哺乳動物細胞である。いくつかの実施形態では、前記細胞はヒト細胞である。いくつかの実施形態では、前記ヒト細胞はヒト胚性腎293T(HEK293Tまたは293T)細胞またはHeLa細胞である。いくつかの実施形態では、前記細胞はヒト胚腎(HEK293T)細胞である。いくつかの実施形態では、前記細胞はマウスHepa1~6細胞である。いくつかの実施形態では、前記哺乳動物細胞は、免疫細胞、肝細胞、腫瘍細胞、幹細胞、血液細胞、神経細胞、接合子、筋肉細胞(例えば心筋細胞)、及び皮膚細胞の群から選択される。
【0284】
いくつかの実施形態では、前記細胞は、細胞傷害性T細胞、ヘルパーT細胞、ナチュラルキラー(NK)T細胞、iNK-T細胞、NK-T様細胞、γδT細胞、腫瘍浸潤性T細胞、及び樹状細胞(DC)により活性化されるT細胞の群から選択される免疫細胞である。いくつかの実施形態では、前記方法は、CAR-T細胞またはTCR-T細胞などの修飾された免疫細胞を産生する。
【0285】
いくつかの実施形態では、前記細胞は胚性幹(ES)細胞、人工多能性幹(iPS)細胞、配偶子の前駆細胞、配偶子、接合子または胚内の細胞である。
【0286】
本明細書に記載の方法は、標的細胞をインビボ、エクスビボ、またはインビトロで修飾するために使用することができ、修飾されると、修飾された細胞の子孫または細胞株が改変された表現型を保持するように、細胞を変更する方法で行うことができる。前記修飾された細胞及び子孫は、ゲノム編集及び遺伝子療法のようなエクスビボ又はインビボ応用を有する植物又は動物のような多細胞生物の一部であってもよい。
【0287】
いくつかの実施形態では、前記方法はエクスビボで行われる。いくつかの実施形態では、前記エンジニアリングされたCRISPR-Cas12iシステムを細胞に導入した後、前記修飾された細胞(例えば、哺乳類細胞)がエクスビボで増殖する。いくつかの実施形態では、前記修飾細胞を培養して少なくとも約1日、2日、3日、4日、5日、6日、7日、10日、12日または14日のいずれかを増殖させる。いくつかの実施形態では、前記修飾された細胞は、約1日、2日、3日、4日、5日、6日、7日、10日、12日、または14日のいずれかを超えないように培養される。いくつかの実施形態では、前記修飾された細胞をさらに評価またはスクリーニングし、1つまたは複数の所望の表現型または特性を有する細胞を選択する。
【0288】
いくつかの実施形態では、前記ターゲット配列は疾患または状態に関連する配列である。例示的な疾患または状態としては、癌、心血管疾患、遺伝性疾患、自己免疫性疾患、代謝性疾患、神経変性疾患、眼病、細菌感染、及びウイルス感染が挙げられるが、これらに限定されない。いくつかの実施形態では、前記疾患または状態は遺伝的疾患である。いくつかの実施形態では、前記疾患または状態は単一遺伝子疾患または状態である。いくつかの実施形態では、前記疾患または状態は多遺伝子疾患または状態である。
【0289】
いくつかの実施形態では、前記ターゲット配列は、野生型配列と比較して変異を有する。いくつかの実施形態では、前記ターゲット配列は、疾患または状態に関連する一塩基多型(SNP)を有する。
【0290】
いくつかの実施形態では、前記標的核酸に挿入されたドナーDNAは、レポータータンパク質、抗原特異的受容体、治療的タンパク質、抗生物質耐性タンパク質、RNAi分子、サイトカイン、キナーゼ、抗原、抗原特異的受容体、細胞因子受容体、及び自殺ポリペプチドの群から選択される生物産物をコードする。いくつかの実施形態では、前記ドナーDNAは治療的タンパク質をコードする。いくつかの実施形態では、前記ドナーDNAは、遺伝子療法に使用できる治療的タンパク質をコードする。いくつかの実施形態では、前記ドナーDNAは治療的抗体をコードする。いくつかの実施形態では、前記ドナーDNAは、キメラ抗原受容体(CAR)または操作されたTCRなどの操作された受容体をコードする。いくつかの実施形態では、前記ドナーDNAは、低分子RNA(例えば、siRNA、shRNAまたはmiRNA)または長鎖ノンコーディングRNA(lincRNA)などの治療的RNAをコードする。
【0291】
本明細書に記載の方法は、2つまたはそれ以上(例えば、2、3、4、5、6、8、10またはそれ以上)の異なる標的部位における多重遺伝子編集または調節のために使用することができる。いくつかの実施形態では、前記方法は、複数の標的核酸または標的核酸配列を検出または修飾する。いくつかの実施形態では、前記方法は、各crRNAが異なるターゲット配列を含む複数(例えば、2、3、4、5、6、8、10またはそれ以上)のcrRNA配列を含むガイドRNAに標的核酸を接触させることを含む。
【0292】
本明細書に記載のいずれかの方法を用いて生成された、修飾された標的核酸を含むエンジニアリングされた細胞も提供される。前記エンジニアリングされた細胞は細胞療法に使用することができる。本明細書に記載された細胞療法のための方法を用いて自己または同種の細胞からエンジニアリングされた細胞を作製することができる。
【0293】
本明細書に記載の方法は、遺伝的バリアントを研究するために細胞(例えば哺乳動物細胞)の同質遺伝子系を生成するためにも使用することができる。
【0294】
本明細書に記載のエンジニアリングされた細胞を含むエンジニアリングされた非ヒト動物も提供される。いくつかの実施形態では、前記エンジニアリングされた非ヒト動物は、ゲノム編集された非ヒト動物である。前記エンジニアリングされた非ヒト動物は、疾患モデルとして使用することができる。
【0295】
非ヒトゲノム編集またはトランスジェニック動物を生成する技術は、前核マイクロインジェクション、ウイルス感染、胚性幹細胞及び人工多能性幹(iPS)細胞への形質転換を含むが、これらに限定されない、当技術分野で周知である。使用できる詳細な方法としては、Sundberg及びIchikiによって記述された方法(2006, Genetically Engineered Mice Handbook, CRC Press)及びGibsonによって記述された方法(2004, A Primer Of Genome Science 2nd ed. Sunderland, Mass.: Sinauer)が挙げられるが、これらに限定されない。
【0296】
エンジニアリングされた動物は、ウシ、ウマ、ヒツジ、イヌ、シカ、ネコ科動物、ヤギ、ブタ、霊長類、及びゾウ、シカ、シマウマまたはラクダなどのあまり理解されていない哺乳類を含む任意の適切な種であってもよいが、これらに限定されない。
【0297】
治療方法
いくつかの実施形態では、個体の細胞中の標的核酸に関連する疾患または障害を治療するための医薬の製造における、前記エンジニアリングされたCRISPR-Cas12iシステムの用途が提供される。いくつかの実施形態では、前記エンジニアリングされたCRISPR-Cas12iシステムにより、個体の細胞中の標的核酸に関連する疾患または障害を治療する方法が提供される。
【0298】
いくつかの実施形態では、本発明は、必要とされる被験者(例えばヒト)の疾患を治療する方法を提供し、前記方法は、本発明のCRISPR-Cas12iシステムを前記被験者に投与(例えば静脈注射または点滴)することを含み、前記CRISPR-Cas12iシステムは(1)いずれかのエンジニアリングされたCas12iエフェクタータンパク質(例えば、エンジニアリングされたCas12iヌクレアーゼまたはその機能バリアントのいずれか)、またはエンジニアリングされたCas12iエフェクタータンパク質をコードするポリヌクレオチド、及び(2)crRNA、または前記crRNAをコードするポリヌクレオチドを含み、前記crRNAは、(i)該疾患に関連する標的核酸上のターゲット配列とハイブリダイゼーションすることができるスペーサー配列と、(ii)前記スペーサー配列に連結され、前記エンジニアリングされたCas12iエフェクタータンパク質を前記crRNAに結合させて前記ターゲット配列を標的とするCRISPR-Cas12i複合体を形成することを誘導することができる直接リピート配列を含み、前記スペーサー配列と前記ターゲット配列のハイブリダイゼーションは、前記エンジニアリングされたCas12iエフェクタータンパク質と前記ターゲット配列との接触を媒介し、前記エンジニアリングされたCas12iエフェクタータンパク質が前記ターゲット配列を修飾(例えば切断または塩基編集)することをもたらし、それによって前記被験者の疾患を治療する。そのうち、前記CRISPR-Cas12iシステムの任意の成分は、同時に送達されてもよく、順次送達されてもよく、又はDNA/RNA、DNA/DNA、RNA/RNA、タンパク質/RNA、又はタンパク質/DNAのいずれの形態で送達されてもよい。
【0299】
本明細書に記載の細胞中の標的核酸を修飾するための方法のいずれかを使用する治療方法をさらに提供する。いくつかの実施形態において、本出願は、本明細書に記載の工学的CRISPR-Cas12iシステムのいずれかに標的核酸を接触させることを含む、個体細胞中の標的核酸に関連する疾患または状態を治療する方法を提供し、前記ガイドRNAのガイド配列は前記標的核酸のターゲット配列に相補的であり、そのうち、標的核酸を修飾(例えば切断または塩基置換)するために、前記エンジニアリングされたCas12iエフェクタータンパク質と前記ガイドRNAは、前記標的核酸に結合するために互いに会合し、それによって前記疾患または状態を治療する。いくつかの実施形態では、変異(例えばノックアウトまたはノックアウト変異)を前記標的核酸に導入する。いくつかの実施形態では、前記標的核酸の発現が増強される。いくつかの実施形態では、前記標的核酸の発現は抑制される。いくつかの実施形態では、本出願は、本明細書に記載のエンジニアリングされたCRISPR-Cas12iシステムのうちの1つと、治療剤をコードするドナーDNA(例えば、非病原性天然配列を修復テンプレートとして使用する)との有効量を個体に投与することを含む個体の疾患または状態を治療する方法を提供し、そのうち、前記ガイドRNAのガイド配列は、前記個体の標的核酸のターゲット配列に相補的であり、前記エンジニアリングされたCas12iエフェクタータンパク質と前記ガイドRNAとが互いに結合して、前記標的核酸に結合しかつドナーDNAを前記ターゲット配列に挿入するようにし、それによって前記疾患または病状を治療する。
【0300】
いくつかの実施形態において、本出願は、本明細書でエンジニアリングされたCRISPR-Cas12iシステムのいずれかに細胞を接触させることによって作製された、修飾された標的核酸を含むエンジニアリングされた細胞を個体に有効量投与することを含む、前記個体の疾患または状態を治療する方法を提供し、そのうち、前記ガイドRNAのガイド配列は前記標的核酸のターゲット配列に相補的であり、前記エンジニアリングされたCas12iエフェクタータンパク質と前記ガイドRNAは、標的核酸を修飾するために標的核酸に結合するように互いに会合される。いくつかの実施形態では、前記エンジニアリングされた細胞は免疫細胞である。いくつかの実施形態では、前記エンジニアリングされた細胞は、造血幹細胞、神経幹細胞などの幹細胞である。いくつかの実施形態では、前記エンジニアリングされた細胞は神経細胞である。いくつかの実施形態では、前記個体はヒトである。いくつかの実施形態では、前記個体はげっ歯動物、ペット、または農場動物などのモデル動物である。いくつかの実施形態では、前記個体は、ネコ、イヌ、ウサギ、ハムスターなどの哺乳動物である。
【0301】
いくつかの実施形態では、前記疾患または状態は、癌、心血管疾患、遺伝性疾患、自己免疫性疾患、代謝性疾患、神経変性疾患、眼病、細菌感染、及びウイルス感染の群から選択される。いくつかの実施形態では、前記標的核酸はPCSK9である。いくつかの実施形態では、前記疾患または状態は心血管疾患である。いくつかの実施形態では、前記疾患または状態は冠動脈疾患である。いくつかの実施形態では、前記方法は個体のコレステロールレベルを低下させる。いくつかの実施形態では、前記方法は個体の糖尿病を治療する。
【0302】
本発明のCRISPR-Cas12iシステムを用いて治療することができる障害または疾患としては、嚢胞性線維症、遺伝性血管浮腫、糖尿病、進行性仮性肥大性筋ジストロフィー、ベイカー型筋ジストロフィー、α-1-アンチトリプシン欠損症、ポンペイ病、強直性筋ジストロフィー、ハンチントン病、脆弱X症候群、フリードライヒ運動失調、筋萎縮側索硬化、前頭側頭型認知症、遺伝性慢性腎臓病、高脂血症、高コレステロール血症、レーバー先天性黒内障、鎌状赤血球症またはβサラセミアなどが挙げられるが、これらに限定されない。いくつかの実施形態では、前記障害または疾患は、野生型トランスサイレチンアミロイドーシス(transthyretin-related wild-type amyloidosis、ATTRwt)、遺伝性トランスサイレチンアミロイドーシス(transthyretin-related hereditary amyloidosis、ATTRm)、家族性アミロイドポリニューロパチー(familial amyloid polineuropathy、FAP、ATTR-PN)、または家族性アミロイド心筋症(familial amyloid cardiomyopathy、FAC、ATTR-CM)のようなトランスサイレチンアミロイドーシスである。いくつかの実施形態では、前記障害または疾患は、TTR遺伝子の変異または異常発現(例えば高発現)によるトランスチロキシンタンパク質の不安定性である。いくつかの実施形態では、前記障害または疾患はTTR遺伝子変異または異常発現(高発現など)に起因する他の障害または疾患、または派生障害または疾患である。
【0303】
送達方法
いくつかの実施形態では、本明細書に記載のエンジニアリングされたCRISPR-Cas12iシステムまたはその成分、その核酸分子、またはその成分をコードまたは提供する核酸分子は、プラスミドまたはウイルスなどの様々な送達系を介して宿主細胞(例えば、上記「構築物及びベクター」セクションに記載のベクターのいずれか)に送達することができる。いくつかの実施形態または方法では、前記エンジニアリングされたCRISPR-Cas12iシステムは、前記エンジニアリングされたCas12iエフェクタータンパク質及びその1つまたは複数の相同性RNAガイド配列で構成されるリボ核タンパク質複合体のヌクレオフェクションまたはエレクトロポレーションなどの他の方法によって送達することができる。
【0304】
いくつかの実施形態では、ナノ粒子またはエクソソームを介して送達される。
【0305】
いくつかの実施形態では、ペアとなるCas12iニッカーゼ複合体は、2つのペアとなるcrRNA要素を含む複合体が共に送達されるように、ナノ粒子または他の直接タンパク質送達方法を用いて直接送達することができる。さらに、タンパク質は、ウイルスベクターを介して、または細胞に直接送達することができ、次いで、二重ニックのための2つの対のスペーサー領域を含むCRISPRアレイを直接送達することができる。場合によっては、直接RNA送達に対し、N-アセチルガラクトサミン(GalNAc)(特にトライアングルGalNAc)などの少なくとも1つの糖部分にRNAを結合することができる。
【0306】
いくつかの実施形態または方法では、前記エンジニアリングされたCRISPR-Cas12iシステムは、静脈注射または点滴による送達、または腫瘍内送達などの疾患部位の局所送達など、治療に適した任意の送達方法を用いて送達することができる。本明細書に記載のエンジニアリングされたCRISPR-Cas12iシステムを投与するための適切な方法としては、局所、皮下、経皮、皮内、病巣内、関節内、腹腔内、膀胱内、経粘膜、歯肉、歯内、蝸牛内、経鼓膜、臓器内、硬膜外、髄腔内、筋肉内、静脈内、血管内、骨内、眼周、腫瘍内、脳内、脳室内投与が挙げられるが、これらに限定されない。いくつかの実施形態では、本明細書に記載のエンジニアリングされたCRISPR-Cas12iシステムは、注射、カテーテル、座薬、またはインプラントを介して被験者に投与され、前記インプラントは、シアル酸膜のようなフィルム、または繊維を含む多孔質、非多孔質、またはゲル状の材料である。
【0307】
IV.キットと製品
本明細書に記載のエンジニアリングされたCas12iヌクレアーゼまたはその機能バリアント、エンジニアリングされたCas12iエフェクタータンパク質、またはエンジニアリングされたCRISPR-Cas12iシステムのいずれか1つまたは複数の成分を含む組成物、キット、単位薬剤及び製品も提供される。
【0308】
いくつかの実施形態では、キットを提供し、それは本明細書で説明するようにエンジニアリングされたCas12iヌクレアーゼまたはその機能バリアント、エンジニアリングされたCas12iエフェクタータンパク質、またはエンジニアリングCRISPR-Cas12iシステムのいずれかをコードする1つまたは複数のAAVベクターを含む。いくつかの実施形態では、前記キットは、1つまたは複数のガイドRNA(またはそれをコードするDNAまたはベクター)をさらに含む。いくつかの実施形態では、前記キットはドナーDNAをさらに含む。いくつかの実施形態では、前記キットは、ヒト細胞などの細胞をさらに含む。
【0309】
前記キットは、エンジニアリングされた細胞の増殖を可能にするために、容器、試薬、培地、サイトカイン、緩衝液、抗体などの1つまたは複数の追加成分を含んでもよい。前記キットはまた、組成物を投与するための装置を含むことができる。
【0310】
前記キットはまた、本明細書に記載のエンジニアリングされたCRISPR-Cas12iシステムを使用するためのプロトコール、例えば標的核酸を検出または修飾する方法を含むことができる。いくつかの実施形態では、前記キットは、疾患または状態を処理または診断するためのプロトコールを含む。前記キットの成分の使用に関するプロトコールは、通常、意図的に処理された投与量、投与スケジュール、及び投与経路に関する情報を含む。前記容器は、単位用量、バルク包装(例えば、多用量包装)又はサブユニット用量であってもよい。例えば、このようなキット(十分な量の本明細書に開示された組成物)を提供し、延長された期間にわたって個体に対する有効な処理を提供することができる。キットはまた、複数の単位用量の組成物及び取扱説明書を含むことができ、その包装数量は、薬局(例えば、病院薬局及び複方薬局)に保存及び使用するのに十分である。
【0311】
本発明のキットは、適切なパッケージ内にある。適切な包装としては、限定されないが、バイアル、ボトル、広口ボトル、軟包装(例えば、密封されたポリエステルフィルムまたはビニール袋)などが挙げられる。キットは、バッファ液や説明的情報などの追加の成分を任意に提供することができる。したがって、本出願は、バイアル(密封されたバイアルなど)、ボトル、広口バイアル、フレキシブルパッケージなどを含む製品も提供する。
【0312】
前記製品は、容器と、容器上または容器に接着されたラベルまたは包装インサートとを含むことができる。適切な容器としては、例えばボトル、バイアル、注射器などが挙げられる。前記容器は、ガラスやプラスチックなどの様々な材料で形成することができる。一般に、前記容器は、本明細書に記載の疾患または障害を効果的に処理するための組成物を収容し、無菌入口(例えば、容器は静脈注射溶液バッグであってもよく、皮下注射針により穿刺可能な栓を有するバイアルであってもよい)を有することができる。前記ラベルまたは包装インサートは、組成物が個体中の特定の状態を処理するために使用されることを示す。前記ラベルまたは包装インサートは、組成物を個体に投与するためのプロトコールをさらに含む。
【0313】
パッケージインサートとは、通常、そのような治療製品を使用する適応症、用法、投与量、投与、禁忌症及び/または警告に関する情報を含む治療製品の商業パッケージに含まれる説明を指す。
【0314】
さらに、前記製品は、静菌注射用水(BWFI)、リン酸塩緩衝食塩水、リンゲル溶液、及びグルコース溶液などの薬学的に許容される緩衝液を含む第2の容器を含むことができる。ビジネス及びユーザーの観点から見ると、他の緩衝液、希釈剤、フィルター、針、注射器などの他の材料を含むこともできる。必要に応じて、注射部位の痛みを緩和するために、可溶化剤及び局所麻酔剤(例えば、リドカイン)を含むこともできる。
【0315】
一般に、成分は、アンプルまたは小袋などの活性用量を示す密封容器中の乾燥凍結乾燥粉末または無水濃縮物などの単位剤形で単独で提供または混合して提供される。薬物が輸液によって投与される場合、無菌の薬学的レベルの水または塩水を入れた輸液瓶で調剤することができる。医薬組成物を注射により投与する場合、投与前に成分を混合できるように、無菌注射用水または塩水のアンプルを提供することができる。
実施例部分
【0316】
以下、図面を参照して本発明の具体的な実施例についてより詳細に説明する。図面には本発明の具体的な実施例が示されているが、本明細書に記載された実施例に限定されることなく、様々な形態で本発明を実現することができることを理解すべきである。対照的に、これらの実施例を提供することは、本発明をより完全に理解し、本発明の範囲を当業者に完全に伝えることができるようにするためである。
【0317】
実施例1:参照Cas12i2酵素中のPAMと相互作用するアミノ酸を正に帯電したアミノ酸に置換し、その遺伝子編集効率を検証する。
プラスミド構築
Cas12i2のコード配列はコドン最適化(ヒト)され合成された。PCRに基づく部位特異的突然変異誘発によりCasタンパク質のバリアントが生成された。具体的な方法は変異の部位を中心にCas12i2タンパク質のDNA配列を2つの部分に分けて設計し、2対のプライマーを設計してそれぞれこの2つの部分のDNA配列を増幅し、同時にプライマーに変異を必要とする配列を導入し、最後にGibsonクローニングの方式で2つの断片をpCAG-2A-eGFPベクター(ペニシリン耐性を持つ)に組み込んだ。変異体の組み合わせは、Cas12i2タンパク質のDNAを多段に分割し、PCR、Gibson cloneを用いて構築を実現した。変異体の位置決定は、Cas12i2の構造情報を分析するために、当技術分野で一般的に使用されているタンパク質構造可視化ソフトウェア(例えばPyMol、Chimeraなどのソフトウェア)を使用して得られた。Cas12i2の構造情報はPDB:6LTU、6LTR、6LU0、6LTP)を参照する。Cas12i2エフェクタータンパク質は、pCAG-2A-eGFPベクターを介してヒト293T細胞中で発現された。Cas12i2タンパク質をコードするDNAをXmaIとNheIの間に挿入した。293TでCas12i2を発現するcrRNAのベクターは、ターゲット配列を含むアニールオリゴヌクレオチドをBasIにより消化したpUC19-U6-i2-crRNA骨格に連結合することにより構築された。DRをコードするヌクレオチド配列はSEQ ID NO:59である。
【0318】
細胞培養、トランスフェクション及び蛍光活性化細胞選別法(FACS)
HEK293T細胞を1%ペニシリン-ストレプトマイシン(Gibco)と10%ウシ胎児血清(Gibco)を含むDMEM(Gibco)で培養した。細胞を24ウェル-細胞シャーレ(Corning)に播種して、細胞密度が70%に達するまでに16時間培養した。Lipofectamine3000(Invitrogen)を使用することにより、Cas12i2タンパク質をコードするプラスミド600ngとcrRNAをコードするプラスミド300ngを各24ウェル細胞シャーレにトランスフェクションした。約72hトランスフェクションした後、蛍光活性化細胞選別(FACS)されるHEK293T細胞をトリプシン-EDTA(0.05%)(Gibco)で消化した。GFPチャネルを有するMoFlo XDP(Beckman Coulter)を用いて細胞選別を行った。
【0319】
ゲノム修飾のためのターゲットディープシーケンス解析
FACSで選別したGFP-陽性HEK293T細胞を緩衝液Lで溶解し、55℃で3時間インキュベートした後、95℃で10分間インキュベートした。異なるゲノム部位に標的部位を含むdsDNA断片を、対応するプライマーを用いてPCR増幅した。ターゲットのディープシーケンスには、細胞分解液をテンプレートとして直接使用し、バーコード(barcoded)PCRにより標的部位を直接増幅した。PCR生成物を精製し、高スループットシーケンスのためにいくつかのライブラリーにまとめた。挿入または欠失を含む読み取り(reads)の比率を計算することにより、CRISPResso2ソフトウェアを使用して挿入欠失の頻度(%)を分析した。本出願では、遺伝子編集効率の比較と分析のために、挿入欠失の頻度(%)という指標を統一的に用いる。完全な読み取りの0.05%未満の読み取りが破棄される。
【0320】
実施例1-A 単一のアミノ酸置換を有する4つのエンジニアリングされたCas12i2を選出した
実施例1に記載の方法に従って、アミノ酸配列が単一の変異を有するエンジニアリングされたCas12i2酵素をそれぞれ発現し、好ましいアミノ酸置換方法及びその対応する遺伝子編集効率を
図1a、
図1b及び表1に示す。我々はまずCas12i2がPAM DNAに9Å以内にある10個のアミノ酸E176、E178、Y226、A227、N229、E237、K238、K264、T447、E563を選択して、アルギニン(R)の点突然変異試験を行った。
図1a及び表1に示すように、これらCas12i変異体と野生型Cas12i2(SEQ ID NO:1)の2つのゲノム部位:CCR5-3、RNF2-7における遺伝子編集効率を293T細胞で比較することにより、下記のアミノ酸置換を有するCas12i変異体:E176R、K238R、T447RとE563Rは遺伝子編集効率を効果的に高めることができ(
図1aに示すように、E176R、K238R、T447RとE563Rの4種類のモノアミノ酸置換はすべて約10%より高い(これはCCR5-3に対する参照酵素の遺伝子編集効率である)、及び約12%より高い(これはRNF2-7に対する参照酵素の遺伝子編集効率である)挿入欠失率が得られ、他の単一アミノ酸置換スキームより明らかに優れている)、残りの6種類の変異体は遺伝子編集効率の向上に役立たず、ひいては低下した。ここで使用されるCCR5-3及びRNF2-7に対するcrRNAスペーサー配列のコード配列は、それぞれSEQ ID NO:60及び61に示す。
【0321】
実施例1-B 複数の好ましいアミノ酸置換を同時に有するエンジニアリングされたCas12i2を比較する
実施例1に記載された方法に従って、そのアミノ酸配列が2つ以上の好ましいアミノ酸置換を同時に有するエンジニアリングされたCas12i2酵素をそれぞれ発現し、その組み合わせ方及びその遺伝子編集効率の比較を表1及び
図1bに示す。実施例1-Aのスクリーニングにより得られたE176R、K238R、T447R、E563Rの4つの効率を高めることができる変異体中の点突然変異を組み合わせる。
図1bと表1に示すように、CCR5-3、CCR5-5、RNF2-7の3つのゲノム部位におけるこれらの変異体と野生型Cas12i2との遺伝子編集効率を293T細胞中で比較することにより、点突然変異の組み合わせ後に効率がさらに向上する変異体を得ることができることを発見した。特に、4種類の変異を組み合わせた場合(E176R+K238R+T447R+E563R)に効率が最も優れた組み合わせ変異を得ることができる。そのうち使用されるCCR5-3、RNF2-7、及びCCR5-5に対するcrRNAスペーサー配列のコード配列は、それぞれSEQ ID NO:60、61、62に示す。
【0322】
【0323】
実施例2:参照Cas12i2酵素中のDNA二本鎖開放に関与するアミノ酸を芳香環付きアミノ酸に置換し、それぞれの遺伝子編集の効率を検証する
プラスミド構築
PCRに基づく部位特異的突然変異誘発によりCas12i2タンパク質の変異体を産生し、具体的な方法は変異の部位を中心にCas12i2タンパク質のDNA配列を2つの部分に分け、2対のプライマーを設計してそれぞれこの2つの部分DNA配列を増幅し、同時にプライマーに変異を必要とする配列を導入し、最後にGibson cloneの方式で2つの断片をpCAG-2A-eGFPベクターに組み込んだ。アミノ酸置換位置の決定は、一般的なタンパク質構造可視化ソフトウェア(例えば、PyMol、Chimeraなどのソフトウェアを用いることができる)を用いてCas12i2の構造情報を解析して得ることができる。Cas12i2の構造情報はPDB:6LTU、6LTR、6LU0、6LTPを参照する。Cas12i2エフェクタータンパク質は、pCAG-2A-eGFPベクターを介してヒト293T細胞中で発現する。Cas12i2タンパク質をコードするDNAをXmaIとNheIの間に挿入した。293TでCas12i2crRNAを発現するベクターは、ターゲット配列を含むアニールオリゴヌクレオチドをBasIにより消化したpUC19-U6-i2-crRNA骨格に結合することによって構築された。DRをコードするヌクレオチド配列はSEQ ID NO:59である。
【0324】
細胞培養、トランスフェクション及び蛍光活性化細胞選別法(FACS)
HEK293T細胞を1%ペニシリン-ストレプトマイシン(Gibco)と10%ウシ胎児血清(Gibco)を含むDMEM(Gibco)で培養した。細胞を24ウェル-細胞シャーレ(Corning)に播種し、細胞密度が70%に達するまでに16時間培養た。Lipofectamine3000(Invitrogen)を使用することにより、Cas12i2タンパク質をコードするプラスミド600ngとcrRNAをコードするプラスミド300ngを各24ウェル細胞シャーレにトランスフェクションした。68hトランスフェクションした後、蛍光活性化細胞選別(FACS)されるHEK293T細胞をトリプシン-EDTA(0.05%)(Gibco)で消化した。GFPチャネルを有するMoFlo XDP(Beckman Coulter)を用いて細胞選別を行った。
【0325】
ゲノム修飾のためのターゲットディープシーケンス解析
FACSで選別したGFP-陽性HEK293T細胞を緩衝液Lで溶解し、55℃で3時間インキュベートした後、95℃で10分間インキュベートした。異なるゲノム部位に標的部位を含むdsDNA断片を、対応するプライマーを用いてPCR増幅した。ターゲットのディープシーケンスには、細胞分解液をテンプレートとして直接使用し、バーコード(barcoded)PCRにより標的部位を直接増幅した。PCR生成物を精製し、高スループットシーケンスのためにいくつかのライブラリーにまとめた。挿入または欠失を含む読み取り(reads)の比率を計算することにより、CRISPResso2ソフトウェアを使用して挿入欠失の頻度(%)を分析する。完全な読み取りの0.05%未満の読み取りは破棄される。
【0326】
まず、Cas12i2酵素中のDNA二本鎖開放に関与するアミノ酸:Q163とN164を選択し、芳香環付きアミノ酸(Y、F、W)の点突然変異試験を行った。
図2と表2から、293T細胞中でこれらの変異体と野生型Cas12i2の3つのゲノム部位:CCR5-3、CCR5-5、RNF2-7での遺伝子編集効率を比較することにより、5つの変異体:Q163W、Q163Y、Q163F、N164Y、N164Fが有効に遺伝子編集効率を高めることができることを発見した(少なくとも1つのゲノム部位)。特に、N164Y及びN164Fは3つのゲノム部位で優れた遺伝子編集効率を示している。N164Wは参照酵素に比べて遺伝子編集効率を改善する効果がない。
【0327】
【0328】
実施例3:参照Cas12i2酵素中のRuvCドメインに位置し、一本鎖DNA基質と相互作用するアミノ酸を正に帯電したアミノ酸に置換し、その遺伝子編集の効率を検証する
プラスミド構築
PCRに基づく部位特異的突然変異誘発によりCas12i2タンパク質のバリアントを産生し、具体的な方法は変異の部位を中心にCas12i2タンパク質のDNA配列を2つの部分に分け、2対のプライマーを設計してそれぞれこの2つの部分のDNA配列を増幅し、同時にプライマーに変異を必要とする配列を導入し、最後にGibson cloneの方式で2つの断片をpCAG-2A-eGFPベクターに組み込んだ。変異体の組み合わせは、Cas12i2タンパク質のDNAを多段に分割し、PCR、Gibson cloneを用いて構築を実現する。変異体の位置決定は、Cas12i2の構造情報を一般的なタンパク質構造可視化ソフトウェア(例えば、PyMol、Chimeraなどのソフトウェアで使用可能)を用いて分析することにより得られたものである。Cas12i2の構造情報はPDB ID:6LTU、6LTR、6LU0、6LTPを参照する。これらのCas12i2構造で示されるssDNA基質は5ntのみである。より長いssDNAとCas12i2との相互作用の情報を得るために、Cas12i1の構造(PDB ID:6W5C、6W62と6W64、Zhang H.etal.Nature Structural&Molecular Biology27,1069-1076(2020))をCas12i2の構造と相同性アラインメントをし、Cas12i1構造中のssDNA基質(9nt)をCas12i2のRuvC触媒ポケットに入れ、このモデルを通じて9a内のアミノ酸をさらに探した。Cas12i2エフェクタータンパク質は、pCAG-2A-eGFPベクターを介してヒト293T細胞中で発現される。Cas12i2タンパク質をコードするDNAをXmaIとNheIの間に挿入した。293TでCas12i2crRNAを発現するベクターは、ターゲット配列を含むアニールオリゴヌクレオチドをBasIにより消化されたpUC19-U6-i2-crRNA骨格に結合することによって構築された。DRをコードするヌクレオチド配列はSEQ ID NO:59である。CCR5-3及びRNF2-7に対するcrRNAスペーサー配列のためのコード配列は、それぞれSEQ ID NO:60及び61に示される。
【0329】
細胞培養、トランスフェクション及び蛍光活性化細胞選別法(FACS)
HEK293T細胞を1%ペニシリン-ストレプトマイシン(Gibco)と10%ウシ胎児血清(Gibco)を含むDMEM(Gibco)で培養した。細胞を24ウェル-細胞シャーレ(Corning)に播種し、細胞密度が70%に達するまでに16時間培養した。Lipofectamine3000(Invitrogen)を使用することにより、Cas12i2タンパク質をコードするプラスミド600ngとcrRNAをコードするプラスミド300ngを各24ウェル細胞シャーレにトランスフェクションした。68hトランスフェクションした後、蛍光活性化細胞選別(FACS)されるHEK293T細胞をトリプシン-EDTA(0.05%)(Gibco)で消化した。GFPチャネルを有するMoFlo XDP(Beckman Coulter)を用いて細胞選別を行った。
【0330】
ゲノム修飾のためのターゲットディープシーケンス解析
FACSで選別したGFP-陽性HEK293T細胞を緩衝液Lで溶解し、55℃で3時間インキュベートした後、95℃で10分間インキュベートした。異なるゲノム部位に標的部位を含むdsDNA断片を、対応するプライマーを用いてPCR増幅した。ターゲットのディープシーケンスには、細胞分解液をテンプレートとして直接使用し、バーコード(barcoded)PCRにより標的部位を直接増幅した。PCR生成物を精製し、高スループットシーケンスのためにいくつかのライブラリーにまとめた。挿入または欠失を含む読み取り(reads)の比率を計算することにより、CRISPResso2ソフトウェアを使用して挿入欠失の頻度(%)を分析する。完全な読み取りの0.05%未満の読み取りが破棄される。
【0331】
参照Cas12i2酵素中のRuvCドメインに位置し、一本鎖DNA基質と相互作用するアミノ酸を正に帯電したアミノ酸に置き換えた。これらの変異体と野生型Cas12i2のCCR5-3及び/またはRNF2-7ゲノム部位における遺伝子編集効率を293T細胞で比較した。
図3a及び表3に示すように、N391R、I926R、G929Rは、遺伝子編集効率(少なくとも1つのゲノム部位)を効果的に向上させることができる。その中でI926Rは2つのゲノム部位で優れた遺伝子編集効率を示している。
図3b、3c及び表3に示すように、多くの変異体は遺伝子編集効率(少なくとも1つのゲノム部位)を効果的に向上させることができる。そのうち、遺伝子編集効率が向上した単一アミノ酸置換スキームの順位は、D362R>E323R>Q425R>N925R>その他の効率が向上した変異体である。
【0332】
図3a、3b、3cでスクリーニングして得られたE323R、D362R、Q425R、I926Rの4つの効率を高めることができる変異体中の点変異を組み合わせた。
図3dと表3に示すように、2つのゲノム部位:CCR5-3、RNF2-7におけるこれらの変異体と野生型Cas12i2の遺伝子編集効率を293T細胞で比較することにより、点変異を組み合わせ後に遺伝子編集効率がより向上した変異体(少なくとも1つの部位)を得ることができることを発見した。
【0333】
図3a、3b、3c、3dのスクリーニングで得られた、効率を高めることができる変異体の一部中の点変異または組み合わせをフレキシブル領域変異I926G、L439(L+GG)と組み合わせた。
図3eと表3に示すように、RNF2-7部位におけるこれらの変異体と野生型Cas12i2の遺伝子編集効率を293T細胞で比較することにより、点変異を組み合わせた後、より効率的に向上した変異体、例えばN925R+I926G、I926R+L439(L+GG)を得ることができることを発見した。このことから、フレキシブル領域変異のさらなる導入はCas12i変異体の遺伝子編集効率を高めることができる。
【0334】
【0335】
【0336】
実施例4:参照Cas12i2酵素中のDNA-RNA二重らせんと相互作用するアミノ酸を正に帯電したアミノ酸に置換し、その遺伝子編集の効率を検証する
プラスミド構築
PCRに基づく部位特異的突然変異誘発によりCas12i2タンパク質のバリアントを産生し、具体的な方法は変異の部位を中心にCas12i2タンパク質のDNA配列を2つの部分に分け、2対のプライマーを設計してそれぞれこの2つの部分DNA配列を増幅し、同時にプライマーに変異を必要とする配列を導入し、最後にGibson cloneの方式で2つの断片をpCAG-2A-eGFPベクターに組み込んだ。変異体の組み合わせは、Cas12i2タンパク質のDNAを多段に分割し、PCR、Gibson cloneを用いて構築を実現する。変異体の位置決定は、Cas12i2の構造情報を一般的なタンパク質構造可視化ソフトウェア(例えば、PyMol、Chimeraなどのソフトウェアで使用可能)を用いて分析することにより得られたものである。Cas12i2の構造情報はPDB:6LTU、6LTR、6LU0、6LTP)を参照する。Cas12i2エフェクタータンパク質は、pCAG-2A-eGFPベクターを介してヒト293T細胞中で発現される。Cas12i2タンパク質をコードするDNAをXmaIとNheIの間に挿入した。293TでCas12i2crRNAを発現するベクターは、ターゲット配列を含むアニールオリゴヌクレオチドをBasIにより消化されたpUC19-U6-i2-crRNA骨格に連結することによって構築された。DRをコードするヌクレオチド配列はSEQ ID NO:59である。CCR5-3及びRNF2-7に対するcrRNAスペーサー配列のためのコード配列は、それぞれSEQ ID NO:60及び61に示される。
【0337】
細胞培養、トランスフェクション及び蛍光活性化細胞選別法(FACS)
HEK293T細胞を1%ペニシリン-ストレプトマイシン(Gibco)と10%ウシ胎児血清(Gibco)を含むDMEM(Gibco)で培養した。細胞を24ウェル-細胞シャーレ(Corning)に播種し、細胞密度が70%に達するまでに16時間培養した。Lipofectamine3000(Invitrogen)を使用することにより、Cas12i2タンパク質をコードするプラスミド600ngとcrRNAをコードするプラスミド300ngを各24ウェル細胞シャーレにトランスフェクションした。68hトランスフェクションした後、蛍光活性化細胞選別(FACS)されるHEK293T細胞をトリプシン-EDTA(0.05%)(Gibco)で消化した。GFPチャネルを有するMoFlo XDP(Beckman Coulter)を用いて細胞選別を行った。
【0338】
ゲノム修飾のためのターゲットディープシーケンス解析
FACSで選別したGFP-陽性HEK 293 T細胞を緩衝液Lで溶解し、55℃で3時間インキュベートした後、95℃で10分間インキュベートした。異なるゲノム部位に標的部位を含むdsDNA断片を、対応するプライマーを用いてPCR増幅した。ターゲットのディープシーケンスには、細胞分解液をテンプレートとして直接に使用し、バーコード(barcoded)PCRにより標的部位を直接に増幅した。PCR生成物を精製し、高スループットシーケンスのためにいくつかのライブラリーにまとめた。挿入または欠失を含む読み取り(reads)の比率を計算することにより、CRISPResso2ソフトウェアを使用して挿入欠失の頻度(%)を分析する。完全な読み取りの0.05%未満の読み取りは破棄される。
【0339】
図4と表4は、293T細胞における本実施例におけるCas12i2変異体と野生型Cas12i2との2つのゲノム部位:CCR5-3、RNF2-7における遺伝子編集効率の比較をまとめたものである。我々はがG116R、E117R、T159R、S161R、E319R、E343R、及びD958Rという7つの変異体は遺伝子編集効率を効果的に高めることができる(少なくとも1つのゲノム部位にある)ことを発見した。そのうちD958Rは2つのゲノム部位で優れた遺伝子編集効率を示している。
【0340】
【0341】
実施例5:実施例1~4でスクリーニングして得られた遺伝子編集効率を向上したCas12i2のエンジニアリングされたアミノ酸変異の一部を組み合わせ、それらの遺伝子編集の効率を検証する。
プラスミド構築
変異体の組み合わせは、Cas12i2タンパク質のDNAを多段に分割し、PCR、Gibson cloneを用いて構築を実現する。変異体の位置決定は、一般的なタンパク質構造可視化ソフトウェア(例えば、PyMol、Chimeraなどのソフトウェアで使用可能)によりCas12i2の構造情報を解析して得られる。Cas12i2の構造情報はPDB:6LTU、6LTR、6LU0、6LTP)を参照する。Cas12i2エフェクタータンパク質は、pCAG-2A-eGFPベクターを介してヒト293T細胞中で発現される。Cas12i2タンパク質をコードするDNAをXmaIとNheIの間に挿入した。293TでCas12i2crRNAを発現するベクターは、ターゲット配列を含むアニールオリゴヌクレオチドをBasIにより消化されたpUC19-U6-i2-crRNA骨格に結合することによって構築された。DRをコードするヌクレオチド配列はSEQ ID NO:59である。
【0342】
細胞培養、トランスフェクション及び蛍光活性化細胞選別法(FACS)
HEK293T細胞を1%ペニシリン-ストレプトマイシン(Gibco)と10%ウシ胎児血清(Gibco)を含むDMEM(Gibco)で培養した。細胞を24ウェル-細胞シャーレ(Corning)に播種し、細胞密度が70%に達するまでに16時間培養した。Lipofectamine3000(Invitrogen)を使用することにより、Cas12i2タンパク質をコードするプラスミド600ngとcrRNAをコードするプラスミド300ngを各24ウェル細胞シャーレにトランスフェクションした。約68hトランスフェクションした後、蛍光活性化細胞選別(FACS)されるHEK 293 T細胞をトリプシン-EDTA(0.05%)(Gibco)で消化した。細胞選別は、GFPチャネルを有するMoFlo XDP(Beckman Coulter)を用いて行った。
【0343】
ゲノム修飾のためのターゲットディープシーケンス解析
FACSで選別したGFP-陽性HEK293T細胞を緩衝液Lで溶解し、55℃で3時間インキュベートした後、95℃で10分間インキュベートした。異なるゲノム部位に標的部位を含むdsDNA断片を、対応するプライマーを用いてPCR増幅した。ターゲットのディープシーケンスには、細胞分解液をテンプレートとして直接使用し、バーコード(barcoded)PCRにより標的部位を直接増幅した。PCR生成物を精製し、高スループットシーケンスのためにいくつかのライブラリーにまとめた。挿入または欠失を含む読み取り(reads)の比率を計算することにより、CRISPResso2ソフトウェアを使用して挿入欠失の頻度(%)を分析する。完全な読み取りの0.05%未満の読み取りは破棄される。
【0344】
実施例1~4でスクリーニングしたアミノ酸変異またはアミノ酸変異の組み合わせ:E176R+K238R+T447R+E563R、N164Y、E323R+D362R、I926R、E323R+D362R+I926R、E323R+D362R+I926G、E323R+D362R+I926G+L439(L+G)、E323R+D362R+I926G+L439(L+GG)をさらに組み合わせた。
図5と表5に示すように、これらの変異体と野生型Cas12iが5つのゲノム部位:CCR5-3、CCR5-5、CD34-8、CD34-9、RNF2-14に作用する遺伝子編集効率を293T細胞で比較することにより、異なる種類の点突然変異を組み合わせた後、より効率的に向上した変異体を得ることができることを発見した。同時に、効率が最も優れていると考えられている変異体(E176R+K238R+T447R+E563R+N164Y+E323R+D362R)をCasXXと命名した。そのうち、使用されるCD34-8、CD34-9及びRNF2-14に対するcrRNAスペーサー配列のコード配列は、SEQ ID NO:63、64及び65にそれぞれ示される。
【0345】
【0346】
また、下記の変異の組み合わせを構築した:E176R+K238R+T447R+E563R+N164Y+D958R;
E176R+K238R+T447R+E563R+I926R+D958R;
E176R+K238R+T447R+E563R+E323R+D362R+D958R;
N164Y+I926R+D958R;N164Y+E323R+D362R+D958R;
E176R+K238R+T447R+E563R+N164Y+I926R+D958R;
E176R+K238R+T447R+E563R+N164Y+E323R+D362R+D958R;
E176R+K238R+T447R+E563R+N164Y+I926R+E323R+D362R+D958R;
E176R+K238R+T447R+E563R+N164Y+E323R+D362R+I926G+D958R;
E176R+K238R+T447R+E563R+N164Y+E323R+D362R+I926G+L439(L+GG)+D958R;及びE176R+K238R+T447R+E563R+N164Y+E323R+D362R+I926G+L439(L+G)+D958R。その遺伝子編集効率は、T77エンドヌクレアーゼ1(T7E1)アッセイ及びターゲットディープシーケンスによって検出することができる。
【0347】
実施例6:CasXXと従来の遺伝子編集ツールの比較による遺伝子編集効率の検証。
プラスミド構築
CasXXと他のCasの遺伝子編集活性を比較するために、AsCas12a、BhCas12b v4、SpCas9、SaCas9、SaCas9-KKHのコード配列をコドン最適化(ヒト)して合成した。Casエフェクタータンパク質は、pCAG-2A-eGFPベクターを介してヒト293T細胞中で発現される。Casタンパク質をコードするDNAをXmaIとNheIの間に挿入した。ターゲット配列を含むアニーリングオリゴヌクレオチドを、BasIにより消化されたpUC19-U6-i2-crRNA骨格に連結することにより、293TでAsCas12a、BhCas12b v4、SpCas9、SaCas9、SaCas9-KKH、Cas12i2を発現するsgRNAまたはcrRNAのベクターを構築した。CasXXをコードするDRのヌクレオチド配列はSEQ ID NO:59である。
【0348】
細胞培養、トランスフェクション及び蛍光活性化細胞選別法(FACS)
HEK 293 T細胞を1%ペニシリン-ストレプトマイシン(Gibco)と10%ウシ胎児血清(Gibco)を含むDMEM(Gibco)で培養した。細胞を24ウェル-細胞シャーレ(Corning)に播種し、細胞密度が70%に達するまでに16時間培養した。Lipofectamine 3000(Invitrogen)を使用することにより、Cas12i 2タンパク質をコードするプラスミド600 ngとcrRNAをコードするプラスミド300 ngを各24ウェル細胞シャーレにトランスフェクションした。約68 hトランスフェクションした後、蛍光活性化細胞選別(FACS)されるHEK293T細胞をトリプシン-EDTA(0.05%)(Gibco)で消化した。GFPチャネルを有するMoFlo XDP(Beckman Coulter)を用いて細胞選別を行った。
【0349】
ゲノム修飾のためのターゲットディープシーケンス解析
FACSで選別したGFP-陽性HEK293T細胞を緩衝液Lで溶解し、55℃で3時間インキュベートした後、95℃で10分間インキュベートした。異なるゲノム部位に標的部位を含むdsDNA断片を、対応するプライマーを用いてPCR増幅した。ターゲットのディープシーケンスには、細胞分解液をテンプレートとして直接使用し、バーコード(barcoded)PCRにより標的部位を直接増幅した。PCR生成物を精製し、高スループットシーケンスのためにいくつかのライブラリーにまとめた。挿入または欠失を含む読み取り(reads)の比率を計算することにより、CRISPResso2ソフトウェアを使用して挿入欠失の頻度(%)を分析する。完全な読み取りの0.05%未満の読み取りは破棄される。
【0350】
我々はまず、異なるPAM配列を含む62パーソナルゲノム部位におけるCasXXの遺伝子編集効率を試験した。設計されたスペーサー配列は20ヌクレオチドである。
図6aに示すように、CasXXは極めて強力な遺伝子編集能力を示し、平均遺伝子編集効率は60%を超え、試験されたすべての部位の遺伝子編集効率は50%を超えた。また、任意のNTTN PAM(N=A、T、G、C)に対して高い遺伝子編集効率を示した。
【0351】
エンジニアリングされたCasXXの遺伝子編集能力をさらに示すために、CasXXをAsCas12aと、TTTN PAM部位で比較し、さらにBhCas12b v4とTTN PAM部位で比較した。
図6bに示すように、CasXXは2種類のPAMを持つ標的部位でより高い平均遺伝子編集効率を示している。
【0352】
また、CasXXとSpCas9、SaCas9、SaCas9-KKHを同じ位置で比較した。
図6cに示すように、CasXXは試験部位でより高い平均遺伝子編集効率を示した。
【0353】
体内でのCasXXの遺伝子編集活性を試験するために、CasXXをコードするpCAG-2A-eGFPベクター及びcrRNAをコードするpUC19-U6-i2-crRNAベクターをリポソームトランスフェクション法でマウスHepa1-6肝癌細胞系にトランスフェクションした。そのうち、それぞれ65個の内因性遺伝子部位に対応するcrRNAを設計した。設計されたspacer配列は20ヌクレオチドである。挿入欠失頻度はPCR増幅シーケンスから得られ、外来遺伝子編集分析方法と類似している。
【0354】
図6dに示すように、CasXXはマウスHepa1-6細胞系の65個の内因性遺伝子部位に対して強大な遺伝子編集能力を示し、平均遺伝子編集効率は60%を超えた。
【0355】
実施例7:異なるPAMを含むゲノム部位でのCasXXを用いた遺伝子編集。
プラスミド構築
CasXXをコードするDNA配列をpCAG-2A-EGFPプラスミドに組み込んで、CasXX発現するプラスミドを構築した。HEK293TにおけるcrRNAの発現のためのベクターは、ターゲット配列を含むアニールオリゴヌクレオチドをBasI消化pUC19-U6-crRNA骨格に連結することによって構築された。そのうち、64の異なるcrRNAが64のヒト内因性部位を標的として設計された。前記内因性標的核酸の5’末端は、異なるPAMに対するCasXXの認識能力を検出するために、
図7に示すように異なるPAM5’-NNNN-3’(N=A、T、GまたはC)を有し、。そのうち、この64個の部位に含まれるPAM配列は、すべてのNNNNの組み合わせをカバーする:NTTN、NTAN、NTCN、NTGN、NATN、NAAN、NACN、NAGN、NCTN、NCAN、NCCN、NCGN、NGTN、NGAN、NGCN、NGGN。DRをコードするヌクレオチド配列はSEQ ID NO:59である。設計されたスペーサー配列は20のヌクレオチドである。
【0356】
細胞培養、トランスフェクション及び蛍光活性化細胞選別法(FACS)
HEK293T細胞を1%ペニシリン-ストレプトマイシン(Gibco)と10%ウシ胎児血清(Gibco)を含むDMEM(Gibco)で培養した。細胞を24細胞シャーレ(Corning)に播種し、細胞密度が70%に達するまでに16時間培養した。Lipofectamine3000(Invitrogen)を用いて、Casタンパク質をコードするプラスミド600ngとcrRNAをコードするプラスミドを300ng24ウェル細胞シャーレで培養した細胞中にトランスフェクションした。72hトランスフェクションした後、細胞をトリプシン-EDTA(0.05%)(Gibco)で消化した後、GFP蛍光活性化細胞選別(FACS)を行った。
【0357】
ゲノム修飾のためのターゲットディープシーケンス解析
FACSで選別したGFP-陽性293FT細胞を緩衝液Lで溶解し、55℃で3時間インキュベートした後、95℃で10分間インキュベートした。異なるゲノム部位に標的部位を含むdsDNA断片を、対応するプライマーを用いてPCR増幅した。ターゲットのディープシーケンスには、細胞分解液をテンプレートとして直接使用し、バーコード(barcoded)PCRにより標的部位を直接増幅した。PCR生成物を精製し、高スループットシーケンスのためにいくつかのライブラリーにまとめた。挿入または欠失を含む読み取り(reads)の比率を計算することにより、CRISPResso2ソフトウェアを使用して挿入欠失の頻度(%)を分析する。完全な読み取りの0.05%未満の読み取りは破棄される。実験結果を
図7に示す。
【0358】
図7に示すように、CasXXは5’末端にNTTN、NTAN、NTCN、NTGN、NATN、NAAN、NCTN、NCAN、NGTNというPAMを有する標的部位はいずれも効率的な遺伝子編集効率を示し、これらの部位での平均遺伝子編集効率は40%を超えている。
【0359】
実施例8:CasXXを用いた異なるPAMを含む二本鎖DNAのインビトロ切断
変異体の発現プラスミドの構築
野生型Cas12i2(SEQ ID NO:1)及びCasXX(SEQ ID NO:8)をコードするDNA配列をBPK2014プラスミド(クロラムフェニコール耐性を有する)に組み込んで、Cas12i2及びCasXXタンパク質の原核発現プラスミドを構築した。
【0360】
タンパク質精製
BPK2014原核発現プラスミドを大腸菌株BL21(λDE3)(TransGen Biotech)に形質転換した。形質転換された菌液をクロラムフェニコール含有固体LB上に塗布した。3つのクローンを5mlの液体LBに採取し、一晩培養した。その後、細菌を3L液体LBに移して、OD600が0.6~ 0.8に達するまで培養を続けた。その後、IPTG(0.5mM)を用いて16℃で20時間誘導した。超遠心分離し、Cas12iを発現する細菌を収穫し、分解緩衝液(50mM Tris-HCl、pH7.5、300mM NaCl)に再懸濁し、超音波により破砕した。遠心分離後、まず上澄み中のCas12iタンパク質をNiカラムで精製した。簡単に言えば、上澄み液と共にインキュベートした後、Niカラムは0mM、20mM、50mMイミダゾールを添加した溶解緩衝液で順次洗浄した。その後、Cas12iタンパク質を500mMイミダゾール添加溶解緩衝液で溶出した。その後、収集したサンプルをイオン交換カラム(CM Sepharose Fast Flow,GE)にロードした。野生型Cas12i2とCasXXタンパク質を貯蔵緩衝液(20mM Tris-HCl、300mM NaCl、1mM TCEP、10%グリセリン、pH7.5)で溶出した。タンパク質はフィルターを通じて滅菌され、-80°Cに貯蔵される。
【0361】
crRNA インビトロ転写
DRをコードするヌクレオチド配列はSEQ ID NO:59である。T7プロモーター配列を含むオリゴヌクレオチド(T7-Fと命名)とcrRNAとT7プロモーター相補配列を含むオリゴヌクレオチド(T7-12i-crRNA-Rと命名)を合成し、1x NEBufferTM2(NEB)中でアニールした。これらのオリゴヌクレオチドの配列を表6に示す。アニーリング生成物をテンプレートとして使用し、HiScribeTM T7Quick High Yield RNA Synthesis Kit(NEB)によりcrRNAを製造した。Monarch(R) RNA Cleanup Kit(NEB)を用いて転写されたcrRNAを精製する。
【0362】
【0363】
Cas12iタンパク質のインビトロ酵素切断
インビトロ切断用の線状dsDNA基質を調製するために、まず同じプロトタイプスペーサー領域と異なるPAMを含むターゲットをEcoR1とHindIIIで処理されたpUC19(ペニシリン耐性を有する)にクローニングした。5’のPAMを有するターゲット配列を表7に示す。次にターゲットを担持したpUC19プラスミドをSacIにより線形化し、DNA Clean&Concentrator(Zymo Research)を用いて精製した。インビトロ切断実験では、まず400nM Cas12iタンパク質を2μM crRNAと37℃で15分間インキュベートした。次に、1x NEBufferTM3.1(NEB)を含む10μl反応系において、Cas12i-crRNA RNPと150ng線形化標的DNAを37℃で40分間反応させた。その後、50mM EDTAを用いて反応を終了し、RNAをRNase cocktail(Invitrogen)を用いて37°Cで15分間消化した。最後に、試料をプロテアーゼ(NEB)で37°Cで15分間処理した。反応生成物を1.2%アガロースゲル上で電気泳動により分離した。
【0364】
図8に示すように、野生型Cas12i2タンパク質は5’-NTTN-3’PAMを含む二本鎖DNAに対してのみ部分切断の効率を持つが、残りのPAMに対しては切断活性はほとんどない。しかし、CasXXタンパク質はNTTN、NTAN、NTCN、NTGN、NATN、NAAN、NACN、NCTN、NCAN、NGTN、NGAN PAMを含む二本鎖DNAに対して効率的な切断効率を示している。CasXXは、NTTN、NTAN、NTCN、NATN、NAAN、NACN、NCTN、NCAN、NGTN PAMを含む二本鎖DNAをほぼ完全に切断することができる。したがって、本発明が提供するエンジニアリングされたCas12iヌクレアーゼは、より広範な遺伝子編集または治療に使用することができる。
【0365】
【0366】
実施例9:GUIDE-Seqを用いたCasXXのオフターゲット効果の検出
プラスミド構築
CasXXをコードするDNA配列をpCAG-2A-EGFPプラスミドに組み込んで、CasXXを発現するプラスミドを構築した。293T(ヒト腎上皮細胞系)においてCasタンパク質crRNAを発現するベクターを、ターゲット配列を含むアニールオリゴヌクレオチドをBasI消化pUC19-U6-crRNA骨格に連結することにより構築した。そのうち、crRNAは、EMX1-7の内因性部位を標的とすることができるスペーサー配列(spacer、SEQ ID NO:77)を含む。DRをコードするヌクレオチド配列はSEQ ID NO:59である。
【0367】
細胞培養、トランスフェクション及び蛍光活性化細胞選別法(FACS)
HEK293T細胞を1%ペニシリン-ストレプトマイシン(Gibco)と10%ウシ胎児血清(Gibco)を含むDMEM(Gibco)で培養した。細胞を24細胞シャーレ(Corning)に播種し、細胞密度が70%に達するまでに16時間培養した。Lipofectamine3000(Invitrogen)を用いて、Casタンパク質をコードするプラスミド600ng、crRNAをコードするプラスミド300ng、及び10pmolのアニールした二本鎖DNAタグ(配列は表8参照)を24ウェル細胞シャーレで培養した細胞にトランスフェクションした。72hトランスフェクションした後、細胞をトリプシン-EDTA(0.05%)(Gibco)で消化した後、GFP蛍光活性化細胞選別(FACS)を行った。選ばれたのはCas酵素の発現に成功した細胞である。
【0368】
【0369】
全ゲノム範囲におけるCasXXのオフターゲット効果の検出
E.Z.N.A.(R) MicroElute Genomic DNA Kit (Omega)キットを使用して、FACSによって選別されたGFP-陽性293T細胞用のゲノムを抽出した。精製したゲノムはQubitを用いて定量した。Covaris S220機器を用いて、機器推奨プログラムに従ってゲノムを500bp程度まで断片化した。その後、VAHTS Universal Pro DNA Library Prep Kit for Illumina(Vazyme)キットを用いてDNAライブラリー構築を行った。ライブラリー作成プロセスは参考文献(Tsai,SQ etal.“GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nucleases,”Nat Biotechnol.2015、33(2):187-197を参照し、その内容は参照により全体的に本明細書に組み込まれる)。ライブラリー生成物を高スループットシーケンスした。シーケンスの結果を分析し、潜在的なオフターゲット部位を探した。EMX1-7部位におけるCasXXのオフターゲット効果について系統的な分析を行い、具体的な分析結果は
図10を参照。第1行の配列は参照ターゲット配列であり、下記の配列はそれぞれターゲット配列とオフターゲット配列、及びターゲット配列とオフターゲット配列に二本鎖DNAタグが濃縮されたreads数を表す。
より高いオフターゲット数から分かるように、哺乳動物細胞におけるCasXX酵素の編集特異性はあまり理想的ではなく、さらに最適化する必要がある。
【0370】
実施例10:CasXX配列(SEQ ID NO:8)に基づいて新しいアミノ酸変異を導入し、この変異体の特異性向上の特徴を検証する(2つの標的部位を選択して変異体スクリーニング実験を行った、すなわちEMX1-7部位とRNF2-1部位)
スクリーニング実験準備:変異体の発現プラスミドの構築
CasXX(SEQ ID NO:1に基づくN164Y+E176R+K238R+E323R+D362R+T447R+E563R変異を含む)に基づいて、私たちはさらに新しいアミノ酸点変異を導入してCasXX遺伝子編集の特異性を高め、オフターゲット効果を低下させる。我々はCasXXの配列(SEQ ID NO:8)に基づいて、変異塩基を有するプライマーを用いてCasXXのDNA配列に対してPCRをし、NEBuilder(R) HiFi DNAAssembly Master Mix(NEB)キットを用いて、精製されたPCR生成物をpCAG-2A-EGFPプラスミドに組み込んで、それにより、導入された関連点変異を発現するCasXXプラスミドを構築した。CasXX配列に基づく、単一アミノ酸変異を含む26種類の変異体を獲得し、それぞれCasXX-HF-1からHF-26と命名した。具体的な変異方式を表9に示す。そのうち、CasXX-HF-26はCasXX中のN164Y点変異を野生型Cas12i2の原始アミノ酸N、すなわちY164Nに回復した(すなわち、N164Yという変異を削除した)。
【0371】
【0372】
EMX1~7部位を標的とするcrRNAの発現プラスミドを構築する
ターゲット配列を含むアニールオリゴヌクレオチドをT4ligase(NEB)でBasI(NEB)で消化処理されたpUC19-U6-crRNA骨格に連結することにより、293TでCasタンパク質crRNAを発現するベクターを構築した。前記crRNAは、EMX1~7部位を標的とするように設計されている。具体的な配列を表10に示す。DRをコードするヌクレオチド配列はSEQ ID NO:59である。
【0373】
【0374】
細胞培養、トランスフェクション及び蛍光活性化細胞選別法(FACS)
HEK293T細胞を1%ペニシリン-ストレプトマイシン(Gibco)と10%ウシ胎児血清(Gibco)を含むDMEM(Gibco)で培養した。細胞を24細胞シャーレ(Corning)に播種し、細胞密度が70%に達するまでに16時間培養した。Lipofectamine 3000(Invitrogen)を用いて、Casタンパク質をコードするプラスミド600ngとcrRNAをコードするプラスミド300ngを24ウェル細胞シャーレで培養した細胞中にトランスフェクションした。72hトランスフェクションした後、細胞をトリプシン-EDTA(0.05%)(Gibco)で消化した後、GFP蛍光活性化細胞選別(FACS)を行った。
【0375】
T7E1酵素消化法を用いたEMX1-7標的部位及びオフターゲット部位におけるCasタンパク質の編集効率の検出
FACSにより選別されたGFP陽性HEK293T細胞を40μL緩衝液L(bimake)で分解し、55°Cで3時間インキュベートした後、95°Cで10分間インキュベートした。異なるゲノム部位にターゲット部位またはオフターゲット部位を含むdsDNA断片を、EMX1-7ターゲット部位、EMX1-7オフターゲット部位1、EMX1-7オフターゲット部位2、及びEMX1-7オフターゲット部位3(
図10)に対するプライマーを用いてPCR増幅した。ターゲット部位またはオフターゲット部位の配列は表11を参照。その後、10μL PCR生成物を再アニールして異種二本鎖dsDNAを形成した。次に、混合物を1/10体積のNEBuffer
TM2.1と0.2μL T7endonuclease I(NEB)を37°Cで50分間処理した。消化生成物を~2.5%アガロースゲル電気泳動により分析した。バンドのグレースケール値に基づいて挿入欠失の割合(Indel,%)を計算した。各Cas12i変異体のターゲット部位またはオフターゲット部位への挿入欠失の割合の値を表12に示し、
図11に対応する。実験の結果、R857A、N861A、K807A、N848A、R715A、R719A、K394A、H357A、K844AというCasXX配列(SEQ ID NO:8)に基づく単点変異体(SEQ ID NO:14-22のエンジニアリングされたCas12iヌクレアーゼに対応し、表9参照)は、オフターゲット部位EMX1-7-OT-1、EMX1-7-OT-2、EMX1-7-OT-3での挿入欠失割合を効果的に低下させることができ、より高い特異性を持つことが分かった。実験結果では、オフターゲット部位における挿入欠失率の低下とターゲット部位における編集効率の基本的な不変(または上昇)を編集特異性の向上と定義した。
【0376】
【0377】
【0378】
【0379】
RNF2-1部位を標的とするcrRNAの発現プラスミドを構築する
ターゲット配列を含むアニールオリゴヌクレオチドをT4ligase(NEB)でBasI(NEB)で消化処理されたpUC19-U6-crRNA骨格に連結することにより、HEK293T中でCasタンパク質crRNAを発現するベクターを構築した。最終的なcrRNAはすべて同じRNF2-1部位に標的化されるが、spacer配列は異なる。これらのspacerをコードする具体的な配列を表13に示す。そのうち、RNF2-1-FMは、crRNA中のspacer配列がRNF2-1部位と完全にマッチングすることを表す。RNF2-1-Mis-1/2は、crRNA中のspacer配列がRNF2-1部位と1番目と2番目の塩基位置でマッチングせず、残りの位置でマッチングしていることを表す。RNF2-1-Mis-5/6は、crRNA中のspacer配列がRNF2-1部位と5番目と6番目の塩基位置でマッチングせず、残りの位置でマッチングしていることを表す。RNF2-1-Mis-17/1は、crRNA中のspacer配列がRNF2-1部位と17番目と18番目の塩基位置でマッチングせず、残りの位置でマッチングしていることを表す。RNF2-1-Mis-19/20は、crRNA中のspacer配列がRNF2-1部位と19番目と20番目の塩基位置でマッチングせず、残りの位置でマッチングしていることを表す。そのうち、塩基不整合を設定する目的は、オフターゲット効果をシミュレーションするためである。DRをコードするヌクレオチド配列はSEQ ID NO:59である。
【0380】
【0381】
細胞培養、トランスフェクション及び蛍光活性化細胞選別法(FACS)
HEK293T細胞を1%ペニシリン-ストレプトマイシン(Gibco)と10%ウシ胎児血清(Gibco)を含むDMEM(Gibco)で培養した。細胞を24細胞シャーレ(Corning)に播種し、細胞密度が70%に達するまでに16時間培養した。Lipofectamine3000(Invitrogen)を用いて、Casタンパク質をコードするプラスミド600ngとcrRNAをコードするプラスミド300ngを、24ウェル細胞シャーレで培養した細胞中にトランスフェクションした。72hトランスフェクションした後、細胞をトリプシン-EDTA(0.05%)(Gibco)で消化した後、GFP蛍光活性化細胞選別(FACS)を行った。選ばれたのはCas酵素の発現に成功した細胞である。
【0382】
T7E1酵素消化法を用いたRNF2-1及びオフターゲット部位におけるCas12i変異体の編集効率の検出
FACSにより選別されたGFP陽性HEK293T細胞を40μL緩衝液L(bimake)で分解し、55°Cで3時間インキュベートした後、95°Cで10分間インキュベートした。RNF2-1部位dsDNA断片をPCR増幅するためにRNF2-1プライマーを使用した。その後、10μL PCR生成物を再アニールして異種二本鎖dsDNAを形成した。次に、混合物を1/10体積のNEBuffer
TM2.1と0.2μL T7endonuclease I(NEB)を37°Cで50分間処理した。消化生成物をアガロースゲル電気泳動の2.5%により分析した。バンドのグレースケール値に基づいて挿入欠失の割合(Indel,%)を計算する。異なるcrRNAを用いた場合の各Cas12i変異体のターゲット部位への挿入欠失の割合の値を表14に示し、
図12に対応する。実験の結果、R857A、N861A、K807A、N848A、R715A、R719A、K394A、H357A、K844AというCasXX配列に基づく単点変異体(SEQ ID NOs:14-22のエンジニアリングされたCas12iヌクレアーゼに対応し、表9を参照)は、オフターゲットを模擬したcrRNA-RNF2-1-Mis-1/2、crRNA-RNF2-1-Mis-5/6、crRNA-RNF2-1-Mis-17/18及びcrRNA-RNF2-1-Mis-19/20を用いても挿入欠失の割合を効果的に低減できることが分かった。実験結果では、オフターゲット部位における挿入欠失率の低下とターゲット部位における編集効率の基本的な不変(または向上)を編集特異性の向上と定義した。
【0383】
【0384】
【0385】
実施例11:CasXX配列に基づいて新規アミノ酸変異を導入した変異体
CasXX配列に新たなアミノ酸変異を導入した変異体について、蛍光報告システムにおいて特異性が向上したものをスクリーニングし、本実施例と実施例10の違いは、編集効率を示す分析手段がアガロースゲル電気泳動から蛍光に変更されたことである。
【0386】
mCherry遺伝子を標的とするcrRNAの発現プラスミドを構築する
ターゲット配列を含むアニールオリゴヌクレオチドをT4ligase(NEB)でBasI(NEB)で消化処理されたpUC19-U6-crRNA骨格に連結することにより、HEK293T中でCasタンパク質crRNAを発現するベクターを構築した。最終的なcrRNAはすべて同じmCherry部位に標的化されるが、spacer配列は異なる。spacerをコードする具体的な配列を表15に示す。そのうち、mCherry-FMは、crRNA中のspacer配列がmCherry部位と完全にマッチングすることを表す。crRNA-mCherry-Mis-1/2は、crRNA中のspacer配列がcrRNA-mCherry部位と1番目と2番目の塩基位置でマッチングせず、残りの位置でマッチングしていることを表す。crRNA-mCherry-Mis-5/6は、crRNA中のspacer配列がcrRNA-mCherry部位と5番目と6番目の塩基位置でマッチングせず、残りの位置でマッチングしていることを表す。crRNA-mCherry-Mis-19/20は、crRNA中のspacer配列がcrRNA-mCherry部位と19番目と20番目の塩基位置でマッチングせず、残りの位置でマッチングしていることを表す。DRをコードするヌクレオチド配列はSEQ ID NO:59である。
【0387】
【0388】
細胞培養、トランスフェクション
HEK293T細胞を1%ペニシリン-ストレプトマイシン(Gibco)と10%ウシ胎児血清(Gibco)を含むDMEM(Gibco)で培養した。細胞を24細胞シャーレ(Corning)に播種し、細胞密度が70%に達するまでに16時間培養した。Lipofectamine3000(Invitrogen)を用いて、Casタンパク質をコードするプラスミド600ng、crRNAをコードするプラスミド300ng、mCherryをコードするプラスミド100ngを、24ウェル細胞シャーレで培養した細胞中にトランスフェクションした。
【0389】
mCherry部位におけるCasタンパク質の編集効率を測定するためのフローサイトメトリー分析法
72hトランスフェクションした後、トリプシン-EDTA(0.05%)(Gibco)を用いて細胞を消化し、次いでフローサイトメトリー分析を行い、GFP、mCherry蛍光の割合を計算した。mCherryの割合が低いほど、Casタンパク質がmCherry遺伝子を編集する効率が高いことを意味する。フローチャート及びmCherry編集効率式は、
図13を参照する。
【0390】
実験結果により、R857A、R719A、K394A、K844A(それぞれSEQ ID NO:14、19、20、22に対応)とのCasXX配列に基づく単点変異体は、オフターゲットを模擬するcrRNA-mCherry-Mis-1/2、crRNA-mCherry-Mis-5/6とcrRNA-mCherry-Mis-19/20を使用するとmCherry遺伝子を編集する効率が明らかに低下し、
図14(オフターゲット部位mCherry%が高いほどオフターゲット効率が低下する)を参照。そのうち、オフターゲット部位における挿入欠失率の低下とターゲット部位における編集効率の基本的な不変(または上昇)を編集特異性の向上と定義した。
【0391】
実施例12:CasXX配列にアミノ酸の組み合わせ変異を導入し、内因性遺伝子(組み合わせ)部位で特異性が向上した変異体をスクリーニングする
スクリーニング実験準備:変異体の発現プラスミドを構築する
実施例10と11に基づいて、R857A、R719A、K394A、K844Aのいくつかの点変異を選択し、さらに組み合わせて検討した。我々はCasXXの配列に基づいて、変異塩基を有するプライマーを用いてCasXXのDNA配列に対してPCRをし、我々はNEBuilder(R) HiFi DNA Assembly Master Mix(NEB)キットを用いて、精製されたPCR生成物をpCAG-2A-EGFPプラスミドに組み込んで、組み合わせ変異を有するCasXXプラスミドを構築した。CasXX配列(SEQ ID NO:8)に基づく11種類の変異体命名及び組み合わせ変異を含む変異体命名及び具体的な変異方式を表16に示す。
【0392】
【0393】
EMX1-7部位及びRNF2-1を標的とするcrRNAの発現プラスミドを構築する
ターゲット配列を含むアニールオリゴヌクレオチドをT4ligase(NEB)でBasI(NEB)消化処理されたpUC19-U6-crRNA骨格に連結することにより、293TでCasタンパク質crRNAを発現するベクターを構築した。crRNAは、EMX1-7またはRNF2-1を標的とするか、RNF2-1のオフターゲットを模擬し、実施例10に記載されているように設計される。Spacerコード配列を表10及び13に示す。
【0394】
細胞培養、トランスフェクション及び蛍光活性化細胞選別法(FACS)
HEK293T細胞を1%ペニシリン-ストレプトマイシン(Gibco)と10%ウシ胎児血清(Gibco)を含むDMEM(Gibco)で培養した。細胞を24細胞シャーレ(Corning)に播種し、細胞密度が70%に達するまでに16時間培養した。Lipofectamine3000(Invitrogen)を用いて、Casタンパク質をコードするプラスミド600ngとcrRNAをコードするプラスミド300ngを、24ウェル細胞シャーレで培養した細胞中にトランスフェクションした。72hトランスフェクションした後、トリプシン-EDTA(0.05%)(Gibco)で細胞を消化し、その後蛍光活性化細胞選別(FACS)を行った。選ばれたのはCas酵素の発現に成功した細胞である。
【0395】
T7E1酵素消化法を用いた標的部位及びオフターゲット部位におけるCasタンパク質の編集効率の検出
FACSにより選別されたGFP陽性HEK293T細胞を40μL緩衝液L(bimake)で分解し、55°Cで3時間インキュベートした後、95°Cで10分間インキュベートした。実施例10に記載の対応するプライマーを用いて、異なるゲノム部位に標的部位またはオフターゲット部位を含むdsDNA断片をPCR増幅した。標的部位またはオフターゲット部位の配列は表11及び13を参照。その後、10μL PCR生成物を再アニールして異種二本鎖dsDNAを形成した。次に、混合物を1/10体積のNEBuffer
TM2.1と0.2μL T7endonuclease I(NEB)を37°Cで50分間処理した。消化生成物を~2.5%アガロースゲル電気泳動により分析した。バンドのグレースケール値に基づいて挿入欠失の割合(Indel,%)を計算した。実験結果により、R857A、R719A、K394A、K844A、R719A/K844A(SEQ ID NO:23)及びR857A/K844A(SEQ ID NO:24)のようなCasXX配列に基づく変異体はEMX1-7-OT-1、EMX1-7-OT-2、EMX1-7-OT-3オフターゲット部位での挿入欠失割合を、ターゲット部位での編集効率を犠牲にすることなく効果的に低減でき、表17に示し、
図15に対応する。同時に、R857A、R719A、K394A、K844A、R719A/K844A及びR857A/K844AのようなCasXX配列に基づく変異体は、オフターゲットを模擬するcrRNA-RNF2-1-Mis-1/2、crRNA-RNF2-1-Mis-5/6、crRNA-RNF2-1-Mis-17/18及びcrRNA-RNF2-1-Mis-19/20を使用すると、挿入欠失の割合を、ターゲット部位での効率を犠牲にすることはなく効果的に低減することができ、表18に示し、
図16に対応する。そのうち、オフターゲット部位における挿入欠失率の低下とターゲット部位における編集効率の基本的な不変(または上昇)を編集特異性の向上と定義した。
【0396】
【0397】
【0398】
本明細書におけるSEQ ID NO:23及びSEQ ID NO:24に示す変異体(表16において配列番号が付されている変異体に対応)は、明らかに高い特異性を有する。
【0399】
実施例13:GUIDE-Seqを用いてCasXX及びCasXX+K394A変異体のオフターゲット効果の検出。
プラスミド構築
CasXX(SEQ ID NO:8)及びCasXX+K394A変異体(SEQ ID NO:20)をコードするDNA配列をpCAG-2A-EGFPプラスミドに組み込んで、CasXXまたは(CasXX+K394A)を発現するプラスミドを構築した。HEK293T中でCas12iタンパク質crRNAを発現するベクターは、ターゲット配列を含むアニールオリゴヌクレオチドをBasI消化pUC19-U6-crRNA骨格に連結することによって構築された。そのうち、crRNAは、CD34-7内因性部位を標的とすることができるスペーサー配列を含むように設計されている。DRをコードするヌクレオチド配列はSEQ ID NO:59である。spacerをコードするヌクレオチド配列は、SEQ ID NO:78を含む。
【0400】
細胞培養、トランスフェクション及び蛍光活性化細胞選別法(FACS)
HEK293T細胞を1%ペニシリン-ストレプトマイシン(Gibco)と10%ウシ胎児血清(Gibco)を含むDMEM(Gibco)で培養した。細胞を24細胞シャーレ(Corning)に播種し、細胞密度が70%に達するまでに16時間培養した。Lipofectamine3000(Invitrogen)を用いて、CasXXまたは(CasXX+K394A)タンパク質をコードするプラスミド600ng、crRNAをコードするプラスミド300ng、及び10pmolのアニールした二本鎖DNAタグ(配列は表8参照)を24ウェル細胞シャーレで培養した細胞にトランスフェクションした。72hトランスフェクションした後、細胞をトリプシン-EDTA(0.05%)(Gibco)で消化した後、GFP蛍光活性化細胞選別を行った。
【0401】
Cas12i2変異体のオフターゲット効果を全ゲノム範囲で検出する
E.Z.N.A.(R) MicroElute Genomic DNA Kit (Omega)キットを使用し、FACSによって選別されたGFP-陽性HEK293T細胞用のゲノムを抽出した。精製したゲノムはQubitを用いて定量した。Covaris S220機器を用いて、機器推奨プログラムに従ってゲノムを500bp程度まで断片化した。その後、VAHTS Universal Pro DNA Library Prep Kit for Illumina(Vazyme)キットを用いてDNAライブラリー構築を行った。ライブラリー作成プロセスは参考文献(Tsai, SQ et al. “GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nucleases,” Nat Biotechnol. 2015;33(2):187-197)を参照する。ライブラリー生成物を高スループットシーケンスした。シーケンシング結果を分析し、潜在的なオフターゲット部位を探した。CD34-7内のCasXXと(CasXX+K394A)の内因性部位におけるオフターゲット効果について系統的な分析を行い、具体的な分析結果は
図17を参照。第1行の配列は参照ターゲット配列であり、下記の配列はそれぞれターゲット配列とオフターゲット配列、及びターゲット配列とオフターゲット配列に二本鎖DNAタグが濃縮されたreads数を表す。
図17は、CasXXがCD34-7部位でオフターゲット効果を有することを示しているが、CasXX+K394A変異体はこの部位ではオフターゲット効果を有しない。したがって、CasXX配列に加えてK394A点変異を追加導入することで、CasXXの忠実度を大幅に高めることができ、CasXXに高い特異性を持たせることができる。
【0402】
以上、添付図面に関連して本発明の実施形態について説明したが、本発明は上述の具体的な実施形態及び応用分野に限定されるものではなく、上述の具体的な実施形態は例示的、指導的であり、限定的ではない。当業者は、本明細書の啓示の下で、及び本発明の特許請求の範囲によって保護された範囲を逸脱することなく、さらに多くの形態をとることができ、これらはすべて本発明の保護の範囲に属する。
【0403】
【配列表】
【手続補正書】
【提出日】2023-11-27
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
エンジニアリングされたCas12iヌクレアーゼであって、それは参照Cas 12iに基づく1つまたは複数のヌクレアーゼの変異を含み、前記変異は:
(1)参照Cas12iヌクレアーゼ中のPAMと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換すること;
(2)参照Cas12iヌクレアーゼ中のDNA二本鎖の開放に関与する1つまたは複数のアミノ酸を芳香環付きアミノ酸に置換すること;
(3)参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換すること;
(4)参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換すること;及び
(5)参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数の極性または正電荷を有するアミノ酸を疎水性アミノ酸に置換することから選択され;
好ましくは、前記参照Cas12iヌクレアーゼはアミノ酸配列がSEQ ID NO:1の野生型Cas12i2ヌクレアーゼである、エンジニアリングされたCas12iヌクレアーゼ。
【請求項2】
前記PAMと相互作用的一つまたは複数のアミノ酸はPAMと3次元構造上9Å以内の距離にあるアミノ酸であり、好ましくは、前記PAMと相互作用する1つまたは複数のアミノ酸は176、178、226、227、229、237、238、264、447及び563位の1つまたは複数のアミノ酸であり、
さらに好ましくは、前記PAMと相互作用する1つまたは複数のアミノ酸は、E176、E178、Y226、A227、N229、E237、K238、K264、T447及びE563の1つまたは複数のアミノ酸であり、
さらに好ましくは、前記PAMと相互作用する1つまたは複数のアミノ酸は、E176、K238、T447及びE563の1つまたは複数のアミノ酸であり、
そのうち、前記アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、
又は
前記正に帯電したアミノ酸R、KまたはHである、
請求項1に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項3】
前記参照Cas12iヌクレアーゼ中のPAMと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換することは、E176R、K238R、T447R及びE563R置換の1つまたは複数であり、;
好ましくは、前記エンジニアリングされたCas12iヌクレアーゼは(1)E563R;(2)E176R、T447R、E176R及びE563R;(3)K238RとE563R;(4)E176R、K238R及びT447R;(5)E176R、K238R及びE563R;(6)E176R、T447R及びE563R;及び(7)E176R、K238R、T447R及びE563R、のいずれの変異或いは変異の組み合わせを含み;
そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、請求項
1に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項4】
前記DNA二本鎖の開放に関与する1つまたは複数のアミノ酸は、PAM中の標的鎖に対する3’末端の最後の塩基対と相互作用するアミノ酸であり;
好ましくは、前記DNA二本鎖の開放に関与する1つ又は複数のアミノ酸は163と164位の1つまたは複数のアミノ酸であり;
さらに好ましくは、前記DNA二本鎖の開放に関与する1つ又は複数のアミノ酸Q163とN164位の1つまたは複数のアミノ酸であり;さらに好ましくは、前記DNA二本鎖の開放に関与するアミノ酸はN164であり;
そのうち、前記アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義され
、
更に好ましく前記DNA二本鎖の開放に関与する1つ又は複数のアミノ酸は芳香環付きアミノ酸に置換され、前記芳香環付きアミノ酸はF、YまたはWであり、好ましくは、前記芳香環付きアミノ酸はFまたはYであり、
更に好ましく、前記参照Cas12iヌクレアーゼ中のDNA二本鎖の開放に関与する一つ又は複数のアミノ酸は芳香環付きアミノ酸に置換することはQ163F、Q163Y、Q163W、及びN164Fの一つまたは複数の置換を含み;好ましくは、前記Cas12iヌクレアーゼはN164YまたはN164F変異を含み;さらに好ましくは、前記エンジニアリングされたCas12iヌクレアーゼはN164Yを含む、請求項
1に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項5】
前記RuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸は一本鎖DNA基質と三次元構造上9Å以内の距離にあるアミノ酸であり;
好ましくは、前記RuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸は323、327、355、359、360、361、362、388、390、391、392、393、414、417、418、421、424、425、650、652、653、696、705、708、709、751、752、755、840、848、851、856、885、897、925、926、928、929、932、1022位の1つまたは複数のアミノ酸であり;
さらに好ましくは、前記RuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸は、E323、L327、V355、G359、G360、K361、D362、L388、N390、N391、F392、K393、Q414、L417、L418、K421、Q424、Q425、S650、E652、G653、I696、K705、K708、E709、L751、S752、E755、N840、N848、S851、A856、Q885、M897、N925、I926、T928、G929、Y932、A1022の1つまたは複数のアミノ酸であり;
さらに好ましくは、前記RuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸はE323、D362、Q425、N925、I926、N391、Q424及びG929の1つまたは複数のアミノ酸であり;
そのうち、前記アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義され
、
更に好ましく、参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換することはR或いはKに置換することを含み、好ましくは、前記正に帯電した該アミノ酸はRであり、
更に好ましく、参照Cas12iヌクレアーゼ中のRuvCドメインに位置し、一本鎖DNA基質と相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換することはE323R、D362R、N391R、Q424R、Q425R、N925R、I926R及びG929Rの1つまたは複数の置換を含み;
好ましくは、前記エンジニアリングされたCas12iヌクレアーゼは(1)E323R;(2)D362R;(3)Q425R; (4)N925R; (5)I926R;(6)E323RとD362R;(7)E323RとQ425R;(8)E323RとI926R;(9)Q425RとI926R; (10)D362RとI926R; (11)N925RとI926R; (12) E323R、D362R及びQ425R; (13)E323R、D362R及びI926R;(14)E323R、Q425R及びI926R;(15)D362R、N925R及びI926R;及び(16) E323R、D362R、Q425R及びI926Rのいずれの変異或いは変異の組み合わせを含み;
そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、請求項
1に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項6】
前記DNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸はDNA-RNA二重らせんと三次元構造上9Å以内の距離にあるアミノ酸であり;
好ましくは、前記DNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸は116、117、156、159、160、161、247、293、294、297、301、305、306、308、312、313、316、319、320、343、348、349、427、433、438、441、442、679、683、691、782、783、797、800、852、853、855、861、865、957、958位の1つまたは複数のアミノ酸であり;
さらに好ましくは、前記DNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸はG116、E117、A156、T159、E160、S161、E247、G293、E294、N297、T301、I305、K306、T308、N312、F313、Q316、E319、Q320、E343、E348、E349、D427、K433、V438、N441、Q442、N679、E683、E691、D782、E783、E797、E800、M852、D853、L855、N861、Q865、S957、D958の1つまたは複数のアミノ酸であり;
さらに好ましくは、前記DNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸はG116、E117、T159、S161、E319、E343及びD958の1つまたは複数のアミノ酸であり;そのうち、前記アミノ酸の位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義され
、
更に好ましく、参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換することはR或いはKに置換することを含み、好ましくは、前記正に帯電したアミノ酸はRである、請求項
1に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項7】
参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数のアミノ酸を正に帯電したアミノ酸に置換することはG116R、E117R、T159R、S161R、E319R、E343R及びD958Rの1つまたは複数に置換することを含み;
好ましくは、前記エンジニアリングされたCas12iヌクレアーゼはD958R置換を含む;
そのうち、前記アミノ酸の位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、請求項
1に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項8】
前記DNA-RNA二重らせんと相互作用する1つまたは複数の極性または正に帯電したアミノ酸は、357、394、715、719、807、844、848、857、861位の1つまたは複数のアミノ酸から選択され、即ちH357、K394、R715、R719、K807、K844、N848、R857、R861の1つまたは複数のアミノ酸であり;
そのうち、前記アミノ酸の位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、請求項
1に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項9】
参照Cas12iヌクレアーゼ中のDNA-RNA二重らせんと相互作用する1つまたは複数の極性または正に帯電したアミノ酸を疎水性アミノ酸に置換することはアラニン(A)に置換することを含む、請求項
1に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項10】
H357A、K394A、R715A、R719A、K807A、K844A、N848A、R857A、R861Aかななる群より選択された一つまたは複数の変異を含み;
好ましくは、K394A、R719A、K844A、R857Aかななる群より選択された一つまたは複数の変異を含み;
そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義され
、
好ましく、それはR719AとK844Aアミノ酸置換を含み、またはR857AとK844Aアミノ酸置換を含み;
そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、請求項
1に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項11】
一つまたは複数のフレキシブル領域変異をさらに含み、前記変異は参照Cas12iヌクレアーゼ中のフレキシブル領域の柔軟性を増加させ、前記フレキシブル領域はアミノ酸残基439-443またはアミノ酸残基925-929から選択され;
好ましくは、前記フレキシブル領域変異は439と/または926部位に位置し;
さらに好ましくは、前記フレキシブル領域変異はL439と/またはI926の変異であり;
そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義され
、
好ましく、前記一つまたは複数のフレキシブル領域変異は、該フレキシブル領域アミノ酸をGに置換し、および/またはその後ろに1つまたは2つのGを挿入することであり;
好ましくは、前記一つまたは複数のフレキシブル領域変異はI926G、L439(L+G)またはL439(L+GG)を含み;
さらに好ましくは、前記一つまたは複数のフレキシブル領域変異はL439(L+G)またはL439(L+GG)を含み;
そのうち、前記アミノ酸位置番号はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、請求項
1に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項12】
エンジニアリングされたCas12iヌクレアーゼであって;
前記エンジニアリングされたCas12iヌクレアーゼは
(1)E563R;(2)E176RとT447R;(3)E176RとE563R;(4)K238RとE563R;(5)E176R、K238R及びT447R;(6)E176R、T447R及びE563R;(7)E176R、K238R及びE563R;(8)E176R、K238R、T447R及びE563R;(9)N164Y;(10)N164F;(11)E323R;(12)D362R;(13)Q425R;(14)N925R;(15)I926R;(16)D958R;(17)E323RとD362R;(18)E323RとQ425R;(19)E323RとI926R;(20)Q425RとI926R;(21)D362RとI926R;(22)N925RとI926R;(23)E323R、D362R及びQ425R;(24)E323R、D362R及びI926R;(25)E323R、Q425R及びI926R;(26)D362R、N925R及びI926R;(27)E323R、D362R、Q425R及びI926R;(28)D362RとI926G;(29)N925RとI926G;(30)D362R、N925R及びI926G;(31)I926RとL439(L+G);(32)I926RとL439(L+GG);(33)E323R、D362RとI926G;(34)R719AとK844A;及び(35)R857AとK844Aのいずれかの1つ群または複数群の変異を含み;
好ましくは、前記エンジニアリングされたCas12iヌクレアーゼは(1)E176R、K238R、T447R及びE563R;(2)N164Y;(3)I926R;(4)E323R及びD362R;(4)I926G;(5)I926R及びL439(L+G);(6)I926R及びL439(L+GG);ならびに(7)D958Rのいずれかの1つ群または複数群の変異を含み;
そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、エンジニアリングされたCas12iヌクレアーゼ。
【請求項13】
エンジニアリングされたCas12iヌクレアーゼであって、前記エンジニアリングされたCas12iヌクレアーゼは(1)E176R、K238R、T447R、E563R及びN164Y;(2)E176R、K238R、T447R、E563R及びI926R;(3)N164Y、E323R及びD362R;(4)E176R、K238R、T447R、E563R、E323R及びD362R;(5)N164YとI926R;(6)E176R、K238R、T447R、E563R、N164Y及びI926R;(7)E176R、K238R、T447R、E563R、N164Y、E323R及びD362R;(8)E176R、K238R、T447R、E563R、N164Y、I926R、E323R及びD362R;(9)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びI926G;(10)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G及びL439(L+GG);(11)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G及びL439(L+G);(12)E176R、K238R、T447R、E563R、N164Y及びD958R;(13)E176R、K238R、T447R、E563R、I926R及びD958R;(14)E176R、K238R、T447R、E563R、E323R、D362R及びD958R;(15)N164Y、I926R及びD958R;(16)N164Y、E323R、D362R及びD958R;(17)E176R、K238R、T447R、E563R、N164Y、I926R及びD958R;(18)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びD958R;(19)E176R、K238R、T447R、E563R、N164Y、I926R、E323R、D362R及びD958R;(20)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G及びD958R;(21)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G、L439(L+GG)及びD958R;(22)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、I926G、L439(L+G)及びD958R;(23)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びR857A;(24)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びN861A;(25)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びK807A;(26)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びN848A;(27)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びR715A;(28)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びR719A;(29)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びK394A;(30)E176R、K238R、T447R、E563R、N164Y、E323R、D362R及びH357A;(31)E176R、K238R、T447R、E563R、N164Y、E323R、D362R 及びK844A;(32)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、R719A及びK844A;または(33)E176R、K238R、T447R、E563R、N164Y、E323R、D362R、R857A及びK844Aのいずれの群の変異を含み;そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義される、エンジニアリングされたCas12iヌクレアーゼ。
【請求項14】
SEQ ID NOs:2~24のいずれかに示すアミノ酸配列を含むエンジニアリングされたCas12iヌクレアーゼであり、またはSEQ ID NOs:2~24のいずれかの配列に示すアミノ酸配列と少なくとも80%同一性を有するアミノ酸配列を含む、請求項
1に記載のエンジニアリングされたCas12iヌクレアーゼ。
【請求項15】
エンジニアリングされたCas12iエフェクタータンパク質であって、請求項
1に記載のエンジニアリングされたCas12iヌクレアーゼまたはその機能的誘導体を含み;
任意に、前記エンジニアリングされたCas12iヌクレアーゼまたはその機能的誘導体は酵素活性を有し、または前記エンジニアリングされたCas12iヌクレアーゼまたはその機能的誘導体は酵素不活性変異体であ
り、
好ましく、前記Cas12iエフェクタータンパク質はDNA分子中の二本鎖切断または一本鎖切断を誘導することができ、
更に好ましく、前記エンジニアリングされたCas12iヌクレアーゼまたはその機能的誘導体はD599A、E833A、S883A、H884A、R900A及びD1019Aの1つまたは複数の変異を含む酵素不活性変異体であり;そのうち、前記アミノ酸位置はSEQ ID NO:1に示す対応するアミノ酸位置に定義され、
更に好ましく、前記エンジニアリングされたCas12iヌクレアーゼまたはその機能的誘導体と融合する機能ドメインをさらに含む、
前記機能ドメインは翻訳開始ドメイン、転写抑制ドメイン、トランス活性化ドメイン、エピジェネティック修飾ドメイン、核酸塩基編集ドメイン、逆転写酵素ドメイン、レポーター分子ドメイン、ヌクレアーゼドメインからなる群より選択される一つまたは複数である、エンジニアリングされたCas12iエフェクタータンパク質。
【請求項16】
前記エンジニアリングされたCas12iエフェクタータンパク質は、前記エンジニアリングされたCas12iヌクレアーゼまたはその機能的誘導体のN末端部分を含む第一ポリペプチドと、前記エンジニアリングされたCas12iヌクレアーゼまたはその機能的誘導体のC末端部分を含む第二ポリペプチドとを備え、そのうち前記第一ポリペプチドと前記第二ポリペプチドは、標的核酸と特異的に結合するクラスター化され、規則的に間隔があいた短い回文構造の繰り返し配列(CRISPR)複合体を形成するために、ガイド配列を含むガイドRNAの存在下で互いに会合することができ、前記標的核酸は前記ガイド配列に相補的なターゲット配列を含み;
好ましくは、前記第一ポリペプチドは項1-22のいずれかに記載のエンジニアリングされたCas12iヌクレアーゼのN末端部分アミノ酸残基1~Xを含み、前記第二ポリペプチドは項1-22のいずれかに記載のエンジニアリングされたCas12iヌクレアーゼのアミノ酸残基X+1~前記Cas12iヌクレアーゼのC末端を含み;
あるいは、前記第一ポリペプチドと前記第二ポリペプチドはそれぞれ二量化ドメインを含み;
あるいは、前記第一ポリペプチドの二量体ドメインと前記第二ポリペプチドの二量体ドメインは誘導剤の存在下で互いに会合している、請求項
15に記載のエンジニアリングされたCas12iエフェクタータンパク質。
【請求項17】
エンジニアリングされたCRISPR-Cas12iシステムであって、
(a)請求項
1に記載のエンジニアリングされたCas12iヌクレアーゼ、または
当該Cas12iヌクレアーゼを含むエンジニアリングされたCas12iエフェクタータンパク質;及び
(b)ターゲット配列に相補的なガイド配列を含むガイドRNA、または前記ガイドRNAをコードする1つまたは複数の核酸、を含み、
そのうち、前記エンジニアリングされたCas12iヌクレアーゼまたはエンジニアリングされたCas12iエフェクタータンパク質と前記ガイドRNAとはCRISPR複合体を形成することができ、前記CRISPR複合体は前記ターゲット配列を含む標的核酸に特異的に結合し、且つ前記標的核酸の修飾を誘導し;
好ましくは、前記ガイドRNAは前記ガイド配列を含むcrRNAであり;
さらに好ましくは、前記エンジニアリングされたCRISPR-Cas12iシステムは複数のcrRNAをコードする前駆体ガイドRNAアレイ(array)を含み;
または、好ましくは前記エンジニアリングされたCas12iヌクレアーゼまたはエンジニアリングされたCas12iエフェクタータンパク質はメインエディタであり、前記ガイドRNAは、プライム編集ガイドRNA(pegRNA)であ
り、前記エンジニアリングされたCas12iヌクレアーゼまたはエンジニアリングされたCas12iエフェクタータンパク質をコードする一つまたは複数のベクターを含み;
好ましくは、前記一つまたは複数のベクターはレトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ベクター、および単純ヘルペスベクターの群から選択され;
さらに好ましくは、前記一つまたは複数のベクターはアデノ随伴ウイルスAAVベクターであり;
さらに好ましくは、前記AAVベクターはまた前記ガイドRNAをコードする、エンジニアリングされたCRISPR-Cas12iシステム。
【請求項18】
(a)サンプルを請求項
17におけるエンジニアリングされたCRISPR-Cas12iシステム及びタグ付けされた検出核酸と接触させ、該検出核酸は一本鎖であり、前記ガイドRNAのガイド配列とハイブリダイズしないこと;及び
(b)前記エンジニアリングされたCas12iヌクレアーゼまたはエンジニアリングされたCas12iエフェクタータンパク質が前記タグ付けされた検出核酸を切断することによって生成される検出可能なシグナルを測定し、標的核酸を検出することを含む、サンプル中の標的核酸を検出する方法。
【請求項19】
前記標的核酸を請求項
17に記載の前記エンジニアリングされたCRISPR-Cas12iシステムに接触させることを含み;
好ましくは、前記方法はインビトロで、エクスビボまたはインビボで行われ;
さらに好ましくは、前記標的核酸は細胞中に存在しており;
さらに好ましくは、前記細菌細胞、酵母細胞、哺乳動物細胞、植物細胞または動物細胞であり;
さらに好ましくは、前記標的核酸はゲノムDNAであり;
さらに好ましくは、前記ターゲット配列は疾患または障害に関連し;
さらに好ましくは、前記エンジニアリングされたCRISPR-Cas12iシステムは複数のcrRNAをコードする前駆体ガイドRNAアレイを含み、そのうち、各crRNAは異なるガイド配列を含む、ターゲット配列を含む標的核酸を修飾する方法。
【請求項20】
請求項
17に記載の前記エンジニアリングされたCRISPR-Cas12iシステムの個体の細胞中の標的核酸に関連する疾患または障害を治療するための薬剤の製造における使用であって、好ましくは、前記疾患または障害は、がん、心血管疾患、遺伝性疾患、自己免疫疾患、代謝性疾患、神経変性疾患、眼病、細菌感染、及びウイルス感染の群から選択される、使用。
【請求項21】
標的核酸を請求項
17に記載の前記エンジニアリングされたCRISPR-Cas12iシステムに接触させることを含む、ターゲット配列を含む標的核酸を修飾する方法。
【請求項22】
請求項
1に記載の前記エンジニアリングされたCas12iヌクレアーゼ、
当該Cas12iヌクレアーゼを含むエンジニアリングされたCas12iエフェクタータンパク質を含む組成物またはキット。
【請求項23】
修飾された標的核酸を含み、そのうち、標的核酸が請求項
19に記載の方法で修飾される、エンジニアリングされた細胞。
【請求項24】
請求項
23に記載の一つまたは複数の前記エンジニアリングされた細胞を含む、エンジニアリングされた非ヒト動物。
【国際調査報告】