IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ フイダージーン・セラピューティクス(シンガポール)プライベート・リミテッドの特許一覧

特表2024-540337新型CRISPR-Cas12iシステム及びその用途
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-10-31
(54)【発明の名称】新型CRISPR-Cas12iシステム及びその用途
(51)【国際特許分類】
   C12N 9/16 20060101AFI20241024BHJP
   C12N 15/09 20060101ALI20241024BHJP
   C07K 19/00 20060101ALI20241024BHJP
   C12N 9/14 20060101ALI20241024BHJP
   C12N 9/24 20060101ALI20241024BHJP
   C12N 15/11 20060101ALI20241024BHJP
   C12N 5/10 20060101ALI20241024BHJP
   C12N 1/21 20060101ALI20241024BHJP
   C12N 1/19 20060101ALI20241024BHJP
   C12N 1/15 20060101ALI20241024BHJP
   A61K 38/43 20060101ALI20241024BHJP
   A61K 35/17 20150101ALI20241024BHJP
   A61K 35/12 20150101ALI20241024BHJP
   A61P 9/00 20060101ALI20241024BHJP
   A61P 3/06 20060101ALI20241024BHJP
【FI】
C12N9/16 Z ZNA
C12N15/09 110
C07K19/00
C12N9/14
C12N9/24
C12N15/11 Z
C12N5/10
C12N1/21
C12N1/19
C12N1/15
A61K38/43
A61K35/17
A61K35/12
A61P9/00
A61P3/06
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024526749
(86)(22)【出願日】2022-11-02
(85)【翻訳文提出日】2024-07-02
(86)【国際出願番号】 CN2022129376
(87)【国際公開番号】W WO2023078314
(87)【国際公開日】2023-05-11
(31)【優先権主張番号】202111289092.6
(32)【優先日】2021-11-02
(33)【優先権主張国・地域又は機関】CN
(31)【優先権主張番号】202210081981.1
(32)【優先日】2022-01-24
(33)【優先権主張国・地域又は機関】CN
(31)【優先権主張番号】PCT/CN2022/089074
(32)【優先日】2022-04-25
(33)【優先権主張国・地域又は機関】CN
(81)【指定国・地域】
(71)【出願人】
【識別番号】523300964
【氏名又は名称】フイダージーン・セラピューティクス(シンガポール)プライベート・リミテッド
(74)【代理人】
【識別番号】100118902
【弁理士】
【氏名又は名称】山本 修
(74)【代理人】
【識別番号】100106208
【弁理士】
【氏名又は名称】宮前 徹
(74)【代理人】
【識別番号】100196508
【弁理士】
【氏名又は名称】松尾 淳一
(74)【代理人】
【識別番号】100107386
【弁理士】
【氏名又は名称】泉谷 玲子
(72)【発明者】
【氏名】チャン,ハイナン
(72)【発明者】
【氏名】コング,シャンフォン
(72)【発明者】
【氏名】チェン,キジア
(72)【発明者】
【氏名】チョウ,チンシン
(72)【発明者】
【氏名】ワン,ハオチアン
(72)【発明者】
【氏名】チャン,ウェイホン
【テーマコード(参考)】
4B065
4C084
4C087
4H045
【Fターム(参考)】
4B065AA01X
4B065AA57X
4B065AA72X
4B065AA87X
4B065AB01
4B065AC14
4B065AC20
4B065BA01
4B065CA31
4B065CA44
4B065CA46
4C084AA02
4C084AA03
4C084BA44
4C084CA53
4C084DC01
4C084NA14
4C084ZC51
4C087AA01
4C087AA02
4C087BB65
4C087CA12
4C087NA14
4C087ZC51
4H045AA10
4H045AA30
4H045BA10
4H045BA41
4H045DA89
4H045EA20
4H045EA50
4H045FA74
(57)【要約】
Cas12iポリペプチド、そのようなCas12iポリペプチドを含む融合タンパク質、そのようなCas12iポリペプチド又は融合タンパク質を含むCRISPR-Cas12iシステム及びその使用方法を提供した。
【特許請求の範囲】
【請求項1】
Cas12iポリペプチドであって、
(1)SEQ ID NO:1~3、6と10のうちのいずれか一つに示すとおりであり、
(2)SEQ ID NO:1~3、6と10のうちのいずれか一つのアミノ酸配列を含み、又は、
(3)SEQ ID NO:1~3、6と10のうちのいずれか一つのアミノ酸配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%又は100%)の配列同一性を有するアミノ酸配列を含む、Cas12iポリペプチド。
【請求項2】
Cas12iポリペプチドであって、SEQ ID NO:1~3、6と10のうちのいずれか一つの参照Cas12iポリペプチドのアミノ酸配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%又は99.9%)且つ100%未満の配列同一性を有するアミノ酸配列を含み、
任意選択的に、ここで、前記Cas12iポリペプチドは、前記参照Cas12iポリペプチドの機能(例えば、前記参照Cas12iポリペプチドの機能と比べて増加又は低減した修飾機能)
(例えば、
(a)前記参照Cas12iポリペプチドと複合体を形成できるガイドRNAと複合体を形成する能力、及び/又は、
(b)スペーサー配列特異的なdsDNA切断活性)を有する、
Cas12iポリペプチド。
【請求項3】
両方が同じガイドRNAと組み合わせて使用される時、SEQ ID NO:1~3、6と10のうちのいずれか一つの前記参照Cas12iポリペプチドと比べて、前記Cas12iポリペプチドは、増加したスペーサー配列特異的なdsDNA及び/又はssDNA切断活性を有し、例えば少なくとも約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%又はそれ以上増加する、請求項1又は2に記載のCas12iポリペプチド。
【請求項4】
両方が同じガイドRNAと組み合わせて使用される時、SEQ ID NO:1~3、6と10のうちのいずれか一つの前記参照Cas12iポリペプチドと比べて、前記Cas12iポリペプチドは、低減したスペーサー配列特異的なdsDNA及び/又はssDNA切断活性を有し、例えば少なくとも約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%又は100%低減する、請求項1又は2に記載のCas12iポリペプチド。
【請求項5】
前記Cas12iポリペプチドは、基本的にスペーサー配列特異的なdsDNA及び/又はssDNA切断活性を有さず、例えばSEQ ID NO:1~3、6と10のうちのいずれか一つの前記参照Cas12iポリペプチドの多くとも約5%、10%、15%、20%、25%、30%、35%、40%、45%又は50%のスペーサー配列特異的なdsDNA及び/又はssDNA切断活性を有する死Cas12iポリペプチドである、請求項1又は2に記載のCas12iポリペプチド。
【請求項6】
前記Cas12iポリペプチドは、SEQ ID NO:1のD650A、D700A、E875AとD1049A又はその組み合わせから選択される置換を含む、請求項1又は2に記載のCas12iポリペプチド。
【請求項7】
前記Cas12iポリペプチドは、スペーサー配列特異的なssDNA切断活性を有するCas12iニッカーゼである、請求項1又は2に記載のCas12iポリペプチド。
【請求項8】
前記Cas12iポリペプチドは、表11~14におけるSEQ ID NO:1の突然変異体又はその組み合わせから選択される置換を含む、請求項1又は2に記載のCas12iポリペプチド。
【請求項9】
前記Cas12iポリペプチドは、SEQ ID NO:1~3、6と10のいずれでもない、請求項1又は2に記載のCas12iポリペプチド。
【請求項10】
両方が同じガイドRNAと組み合わせて使用される時、SEQ ID NO:1~3、6と10のうちのいずれか一つの前記参照Cas12iポリペプチドと比べて、前記Cas12iポリペプチドは、低減したスペーサー配列非依存的な(オフターゲット)dsDNA及び/又はssDNA切断活性を有し、例えば少なくとも約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%又は100%低減する、請求項1又は2に記載のCas12iポリペプチド。
【請求項11】
前記Cas12iポリペプチドは、一つ又は複数のアミノ酸に一つ又は複数の突然変異(例えば、挿入、欠失又は置換)を含み、前記一つ又は複数のアミノ酸は、SEQ ID NO:1~3、6と10のうちのいずれか一つの前記参照Cas12iポリペプチドのアミノ酸配列の一つ又は複数のアミノ酸に対応する、請求項1又は2に記載のCas12iポリペプチド。
【請求項12】
前記一つ又は複数の突然変異は、SEQ ID NO:1~3、6と10のうちのいずれか一つの前記参照Cas12iポリペプチドに対応するPIドメイン、REC-Iドメイン及び/又はRuvC-IIドメインのドメイン内にある、請求項11に記載のCas12iポリペプチド。
【請求項13】
前記一つ又は複数の突然変異は、SEQ ID NO:1の前記参照Cas12iポリペプチドの位置173~291における前記PIドメイン、位置427~473における前記REC-Iドメイン及び/又は位置800~1082におけるRuvC-IIドメイン内にある、請求項11に記載のCas12iポリペプチド。
【請求項14】
前記Cas12iポリペプチドは、一つ又は複数のアミノ酸に一つ又は複数の突然変異(例えば、挿入、欠失又は置換)を含み、前記一つ又は複数のアミノ酸は、SEQ ID NO:1の前記参照Cas12iポリペプチドのアミノ酸配列の
S118、D119、F121、W123、Q136、E138、E143、V146、S155、V158、E161、S162、T163、A165、N166、G178、D180、T185、K189、A193、D196、N199、N200、E202、L203、S221、V233、E235、N236、S241、N243、S245、K251、D255、L257、N273、D287、S295、V302、S332、E336、S338、V339、E362、D375、A377、N378、D381、T382、E385、D387、N390、E395、E396、Q398、N399、V400、D403、E406、Q407、V409、D411、C412、N416、N418、L440、L448、V451、Q455、E464、S806、S817、V818、S819、S832、M833、F835、T836、F837、C839、A840、E842、E843、K844、T846、N847、K848、N854、A856、S858、Q862、K863、Y865、L866、G868、K870、M871、D876、D877、V880、G883、K884、G886、K887、A888、A891、D892、M894、A900、K903、K904、N906、V910、M912、S913、C915、Y916、A918、M923、S925、H926、Q927、V931、M933、Q934、D935、K936、K937、T938、S939、V940、F945、M946、V948、N949、K950、D951、S952、D955、Y956、A959、G960、N966、S967、K968、S969、D970、A971、G972、S974、V975、Y976、Q979、A980、L982、H983、C985、E986、A987、G989、V990、S991、P992、E993、L994、V995、K996、N997、K998、K999、T1000、H1001、A1002、A1003、E1004、G1006、G1010、A1012、M1013、L1014、W1017、V1022、K1028、D1032、K1034、K1037、C1039、G1040、Q1045、H1047、C1063とG1069のうちの一つ又は複数の位置における一つ又は複数のアミノ酸に対応する、
請求項1又は2に記載のCas12iポリペプチド。
【請求項15】
前記Cas12iポリペプチドは、一つ又は複数のアミノ酸に一つ又は複数の突然変異(例えば、挿入、欠失又は置換)を含み、前記一つ又は複数のアミノ酸は、SEQ ID NO:1の前記参照Cas12iポリペプチドのアミノ酸配列の
N243、E336、V880、G883、D892とM923のうちの一つ又は複数の位置における一つ又は複数のアミノ酸に対応する、
請求項1又は2に記載のCas12iポリペプチド。
【請求項16】
N243における前記置換は、R、A、V、L、I、M、F、W、S、T、C、Y、N、Q、E、K又はHで置換される、請求項15に記載のCas12iポリペプチド。
【請求項17】
前記一つ又は複数の突然変異は、Rで置換される、請求項15に記載のCas12iポリペプチド。
【請求項18】
前記Cas12iポリペプチドは、さらに一つ又は複数のアミノ酸に一つ又は複数の突然変異(例えば、挿入、欠失又は置換)を含み、前記一つ又は複数のアミノ酸は、SEQ ID NO:1の前記参照Cas12iポリペプチドのアミノ酸配列の
V880、G883、D892とM923のうちの一つ又は複数の位置における一つ又は複数のアミノ酸に対応する、
請求項1から17のいずれか1項に記載のCas12iポリペプチド。
【請求項19】
前記一つ又は複数の突然変異は、Rで置換される、請求項18に記載のCas12iポリペプチド。
【請求項20】
前記Cas12iポリペプチドは、一つ又は複数のアミノ酸に一つ又は複数の突然変異(例えば、挿入、欠失又は置換)を含み、前記一つ又は複数のアミノ酸は、SEQ ID NO:1の前記参照Cas12iポリペプチドのアミノ酸配列の
K109、L112、D125、127、F144、L147、A148、L151、L157、V195、Y226、F252、I258、M293、W305、A308、I309、S312、A314、D315、V316、A318、L324、I327、A348、L352、Y365、L372、L376、L379、L383、I405、L424、I427、A436、F439、A443、V447、A457、H458、P459、T460、S463、S814、F859、A864、H867、Y977、S1031、A1053とF1068のうちの一つ又は複数の位置における一つ又は複数のアミノ酸に対応する、
請求項1又は2に記載のCas12iポリペプチド。
【請求項21】
前記一つ又は複数の突然変異は、Rで置換される、請求項20に記載のCas12iポリペプチド。
【請求項22】
前記突然変異は、非極性アミノ酸残基(例えばグリシン(Gly/G)、アラニン(Ala/A)、バリン(Val/V)、システイン(Cys/C)、プロリン(Pro/P)、ロイシン(Leu/L)、イソロイシン(Ile/I)、メチオニン(Met/M)、トリプトファン(Trp/W)、フェニルアラニン(Phe/F))、極性アミノ酸残基(例えばセリン(Ser/S)、スレオニン(Thr/T)、チロシン(Tyr/Y)、アスパラギン(Asn/N)、グルタミン(Gln/Q))、正に荷電したアミノ酸残基(例えばリジン(Lys/K)、アルギニン(Arg/R)、ヒスチジン(His/H))又は負に荷電したアミノ酸残基(例えばアスパラギン酸(Asp/D)、グルタミン酸(Glue/E))で行われる置換である、請求項1から21のいずれか1項に記載のCas12iポリペプチド。
【請求項23】
前記置換は、正に荷電したアミノ酸残基、例えばアルギニン(R)で置換される、請求項22に記載のCas12iポリペプチド。
【請求項24】
前記置換は、非極性アミノ酸残基、例えばアラニン(A)で置換される、請求項22に記載のCas12iポリペプチド。
【請求項25】
前記Cas12iポリペプチドは、表6におけるいずれか一つの突然変異体又はその組み合わせに対応する置換を含み、且つ、ここで、前記アミノ酸の位置は、SEQ ID NO:1に対するものである、請求項1又は2に記載のCas12iポリペプチド。
【請求項26】
前記Cas12iポリペプチドは、表6におけるいずれか一つの突然変異体又はその組み合わせに対応する置換を含み、両方が同じガイドRNAと組み合わせて使用される時、SEQ ID NO:1の前記参照Cas12iポリペプチドと比べて、増加したスペーサー配列特異的なdsDNA切断活性を有し、例えば少なくとも約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%又はそれ以上増加し、且つ、ここで、前記アミノ酸の位置は、SEQ ID NO:1に対するものである、
請求項1又は2に記載のCas12iポリペプチド。
【請求項27】
前記Cas12iポリペプチドは、xCas12i-N243R突然変異体である、請求項1又は2に記載のCas12iポリペプチド。
【請求項28】
前記Cas12iポリペプチドは、表8におけるいずれか一つの突然変異体又はその組み合わせに対応する置換を含み、且つ、ここで、前記アミノ酸の位置は、SEQ ID NO:1に対するものである、請求項1又は2に記載のCas12iポリペプチド。
【請求項29】
前記Cas12iポリペプチドは、xCas12i-N243R+E336R+D892R突然変異体である、請求項1又は2に記載のCas12iポリペプチド。
【請求項30】
前記Cas12iポリペプチドは、xCas12i-N243R+E336R+G883R突然変異体である、請求項1又は2に記載のCas12iポリペプチド。
【請求項31】
Cas12iポリペプチドであって、
(1)xCas12i-N243R突然変異体のアミノ酸配列に示すとおりであり、
(2)xCas12i-N243R突然変異体のアミノ酸配列を含み、又は、
(3)xCas12i-N243R突然変異体のアミノ酸配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%又は100%)の配列同一性を有するアミノ酸配列を含む、
Cas12iポリペプチド。
【請求項32】
Cas12iポリペプチドであって、
(1)xCas12i-N243R+E336R+D892R突然変異体のアミノ酸配列に示すとおりであり、
(2)xCas12i-N243R+E336R+D892R突然変異体のアミノ酸配列を含み、又は、
(3)xCas12i-N243R+E336R+D892R突然変異体のアミノ酸配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%又は100%)の配列同一性を有するアミノ酸配列を含む、
Cas12iポリペプチド。
【請求項33】
Cas12iポリペプチドであって、
(1)xCas12i-N243R+E336R+G883R突然変異体のアミノ酸配列に示すとおりであり、
(2)xCas12i-N243R+E336R+G883R突然変異体のアミノ酸配列を含み、又は、
(3)xCas12i-N243R+E336R+G883R突然変異体のアミノ酸配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%又は100%)の配列同一性を有するアミノ酸配列を含む、
Cas12iポリペプチド。
【請求項34】
前記Cas12iポリペプチドは、標的dsDNAの非標的鎖上のプロトスペーサー配列5’の隣りにある標的隣接モチーフ(TAM)を認識することができ、且つ、ここで、前記TAMは、5’-NTTN-3’であり、ここで、Nは、A、T、G又はCである、請求項1から33のいずれか1項に記載のCas12iポリペプチド。
【請求項35】
請求項1から34のいずれか1項に記載のCas12iポリペプチドと機能ドメインとを含む、融合タンパク質。
【請求項36】
前記機能ドメインは、前記Cas12iポリペプチドに対してN-末端、C-末端又は内部で融合される、請求項35に記載の融合タンパク質。
【請求項37】
前記機能ドメインは、リンカーを介して前記Cas12iポリペプチドに融合され、前記リンカーは、例えばXTENリンカー(SEQ ID NO:442)、複数のグリシンとセリン残基とを含むGSリンカー、複数のグリシンとセリン残基とを含むGSリンカー及びXTENリンカー(SEQ ID NO:442)、複数のグリシンとセリン残基とを含むGSリンカー及びBP NLS(SEQ ID NO:443)である、
請求項35又は36に記載の融合タンパク質。
【請求項38】
前記機能ドメインは、核局在化シグナル(NLS)、核外輸送シグナル(NES)、デアミナーゼ又はその触媒ドメイン、ウラシルグリコシダーゼ阻害剤(UGI)、ウラシルグリコシダーゼ(UNG)、メチルプリングリコシダーゼ(MPG)、メチラーゼ又はその触媒ドメイン、デメチラーゼ又はその触媒ドメイン、転写活性化ドメイン(例えば、VP64又はVPR)、転写阻害ドメイン(例えば、KRAB部分又はSID部分)、逆転写酵素又はその触媒ドメイン、エキソヌクレアーゼ又はその触媒ドメイン、ヒストン残基修飾ドメイン、ヌクレアーゼ触媒ドメイン(例えば、FokI)、転写修飾因子、光ゲーティング因子、化学誘導因子、クロマチン可視化因子、標的細胞又は標的細胞型上の細胞表面部分との結合を提供するためのターゲッティングポリペプチド、レポーター(例えば、蛍光)ポリペプチド又は検出マーカー(例えば、GST、HRP、CAT、GFP、HcRed、DsRed、CFP、YFP、BFP)、局在化シグナル、ポリペプチドターゲッティング部分、DNA結合ドメイン(例えば、MBP、Lex A DBD、Gal4 DBD)、エピトープタグ(例えば、His、myc、V5、FLAG、HA、VSV-G、Trxなど)、転写放出因子、HDAC、ssRNA切断活性を有する部分、dsRNA切断活性を有する部分、ssDNA切断活性を有する部分、dsDNA切断活性を有する部分、DNA又はRNAリガーゼ、標的DNAを修飾する活性を示す機能ドメインとその触媒ドメイン及びその機能断片及びその任意の組み合わせから選択され、前記標的DNAを修飾する活性は、メチルトランスフェラーゼ活性、DNA修復活性、DNA損傷活性、ジスムターゼ活性、アルキル化活性、脱アルキル化活性、脱プリン活性、酸化活性、脱酸素活性、ピリミジンダイマー形成活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、グリコシダーゼ活性、アセチルトランスフェラーゼ活性、脱アセチル化酵素活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、脱ミリストイル化活性、グリコシル化活性(例えば、O-GlcNAcトランスフェラーゼ由来)、脱グリコシル化活性から選択される、
請求項1から37のいずれか1項に記載の融合タンパク質。
【請求項39】
前記NLSは、SV40 NLS(SEQ ID NO:444)、bpSV40 NLS(BP NLS、bpNLS、SEQ ID NO:443)又はNP NLS(アフリカツメガエル核質タンパク質NLS、核質タンパク質NLS、SEQ ID NO:445)を含むか又はそれである、請求項38に記載の融合タンパク質。
【請求項40】
前記機能ドメインは、デアミナーゼ又はその触媒ドメインを含む、請求項38に記載の融合タンパク質。
【請求項41】
前記デアミナーゼ又はその触媒ドメインは、アデニンデアミナーゼ(例えば、TadA、例えばTadA8e、TadA8.17、TadA8.20、TadA9)又はその触媒ドメインである、請求項40に記載の融合タンパク質。
【請求項42】
前記デアミナーゼ又はその触媒ドメインは、シチジンデアミナーゼ(例えば、APOBEC、例えばAPOBEC3、例えばAPOBEC3A、APOBEC3B、APOBEC3C、DddA)又はその触媒ドメインである、請求項40に記載の融合タンパク質。
【請求項43】
前記機能ドメインは、ウラシルグリコシダーゼ阻害剤(UGI)を含む、請求項35に記載の融合タンパク質。
【請求項44】
前記機能ドメインは、ウラシルグリコシダーゼ(UNG)を含む、請求項35に記載の融合タンパク質。
【請求項45】
前記機能ドメインは、メチルプリングリコシダーゼ(MPG)を含む、請求項35に記載の融合タンパク質。
【請求項46】
前記アデニンデアミナーゼドメインは、野生型TadA又はその変異体であり、それは、
(1)SEQ ID NO:439に示すとおりであり、
(2)SEQ ID NO:439のアミノ酸配列を含み、又は、
(3)SEQ ID NO:439のアミノ酸配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%又は100%)の配列同一性を有するアミノ酸配列を含む、
請求項35に記載の融合タンパク質。
【請求項47】
前記アデニンデアミナーゼドメインは、SEQ ID NO:439のTadA8e-V106Wであるか又はTadA8eである、請求項41に記載の融合タンパク質。
【請求項48】
前記UGIドメインは、
(1)SEQ ID NO:441に示すとおりであり、
(2)SEQ ID NO:441のアミノ酸配列を含み、又は、
(3)SEQ ID NO:441のアミノ酸配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%又は100%)の配列同一性を有するアミノ酸配列を含む、
請求項43に記載の融合タンパク質。
【請求項49】
前記シチジンデアミナーゼドメインは、APOBEC3又はその変異体であり、それは、
(1)SEQ ID NO:440に示すとおりであり、
(2)SEQ ID NO:440のアミノ酸配列を含み、又は、
(3)SEQ ID NO:440のアミノ酸配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%又は100%)の配列同一性を有するアミノ酸配列を含む、
請求項42に記載の融合タンパク質。
【請求項50】
前記シチジンデアミナーゼドメインは、SEQ ID NO:440のヒトAPOBEC3-W104Aである、請求項42に記載の融合タンパク質。
【請求項51】
前記機能ドメインは、逆転写酵素又はその触媒ドメインを含む、請求項35に記載の融合タンパク質。
【請求項52】
前記機能ドメインは、メチラーゼ又はその触媒ドメインを含む、請求項35に記載の融合タンパク質。
【請求項53】
前記機能ドメインは、転写活性化ドメインを含む、請求項35に記載の融合タンパク質。
【請求項54】
ガイドRNAであって、
(1)Cas12iポリペプチド、又は前記Cas12iポリペプチドと機能ドメインとを含む融合タンパク質と複合体を形成できるダイレクトリピート配列と、
(2)標的dsDNAの標的鎖上の標的配列にハイブリダイズすることによって、前記複合体を前記標的dsDNAに導くことができるスペーサー配列とを含む、
ガイドRNA。
【請求項55】
前記ダイレクトリピート配列は、前記スペーサー配列の5’にある、請求項54に記載のガイドRNA。
【請求項56】
前記ダイレクトリピート配列は、
(1)SEQ ID NO:11~13、16、20と501~507のうちのいずれか一つに示すとおりであり、
(2)SEQ ID NO:11~13、16、20と501~507のうちのいずれか一つのポリヌクレオチド配列を含み、又は、
(3)SEQ ID NO:11~13、16、20と501~507のうちのいずれか一つのポリヌクレオチド配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%又は100%)の配列同一性を有するポリヌクレオチド配列を含む、
請求項54に記載のガイドRNA。
【請求項57】
前記ダイレクトリピート配列は、SEQ ID NO:11~13、16、20と501~507のうちのいずれか一つの二次構造と実質的に同じ二次構造を有する、請求項54に記載のガイドRNA。
【請求項58】
前記ダイレクトリピート配列は、SEQ ID NO:11~13、16と20のいずれでもない、請求項54に記載のガイドRNA。
【請求項59】
前記標的配列は、標的遺伝子の少なくとも約16個の連続したヌクレオチド、例えば、標的遺伝子の約16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69又は70個の連続したヌクレオチド、又はいずれか二つの前記値の間の数値範囲を含み、例えば、標的遺伝子の約16から約50個の連続したヌクレオチドは、基本的にそれによって構成されるか、又はそれによって構成される、
請求項54に記載のガイドRNA。
【請求項60】
前記標的配列の長さは、少なくとも約16個のヌクレオチドであり、例えば長さは、約16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69又は70個のヌクレオチドであり、又は長さは、いずれか二つの前記値の間の数値範囲にあり、例えば、長さは、約16から約50個のヌクレオチドである、
請求項54に記載のガイドRNA。
【請求項61】
前記スペーサー配列の長さは、少なくとも約16個のヌクレオチドであり、例えば長さは、約16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69又は70個のヌクレオチドであり、又は長さは、いずれか二つの前記値の間の数値範囲にあり、例えば、長さは、約16から約50個のヌクレオチドである、
請求項54に記載のガイドRNA。
【請求項62】
前記ガイドRNAは、複数の標的配列とそれぞれハイブリダイズ可能な複数の(例えば、2、3、4、5個又はそれ以上)スペーサー配列を含む、請求項54に記載のガイドRNA。
【請求項63】
前記複数の標的配列は、同一のポリヌクレオチド上にあるか、又は単独のポリヌクレオチド上にある、請求項54に記載のガイドRNA。
【請求項64】
前記スペーサー配列は、SEQ ID NO:82~125、130、131~381、382、391、398~438のうちのいずれか一つの少なくとも16個の連続したヌクレオチドを含む、請求項54に記載のガイドRNA。
【請求項65】
前記dsDNAは、細胞内にある、請求項54に記載のガイドRNA。
【請求項66】
システム(又は組成物)であって、
(1)Cas12iポリペプチド、又は前記Cas12iポリペプチドと機能ドメインとを含む融合タンパク質、又は前記Cas12iポリペプチド又は前記融合タンパク質をコードするポリヌクレオチドと、
(2)ガイドRNA(「CRISPR RNA」又は「crRNA」とも呼ばれる)、又は前記ガイドRNAをコードするポリヌクレオチドとを含み、前記ガイドRNAは、
(i)前記Cas12iポリペプチド又は前記融合タンパク質と複合体を形成できるダイレクトリピート配列と、
(ii)標的dsDNAの標的鎖上の標的配列にハイブリダイズすることによって、前記複合体を前記標的dsDNAに導くことができるスペーサー配列とを含む、
システム(又は組成物)。
【請求項67】
前記システムは、天然に存在しない、操作されたシステムである、請求項66に記載のシステム。
【請求項68】
前記Cas12iポリペプチド又は前記融合タンパク質は、請求項1から34のいずれか1項に記載のCas12iポリペプチド又は請求項35から53のいずれか1項に記載の融合タンパク質である、請求項66に記載のシステム。
【請求項69】
前記ガイドRNAは、請求項54から65のいずれか1項に記載のガイドRNAである、請求項66に記載のシステム。
【請求項70】
標的dsDNAを修飾するための方法であって、前記標的dsDNAを請求項66から69のいずれか1項に記載のシステムに接触させることを含み、ここで前記スペーサー配列は、前記標的dsDNAの標的鎖の標的配列にハイブリダイズ可能であり、ここで、前記標的配列は、前記複合体によって修飾される、方法。
【請求項71】
前記標的dsDNAは、ヒトTRAC遺伝子である、請求項70に記載の方法。
【請求項72】
前記スペーサー配列は、SEQ ID NO:123~125のうちのいずれか一つの連続したヌクレオチドを少なくとも含む、請求項70に記載の方法。
【請求項73】
請求項1から34のいずれか1項に記載のCas12iポリペプチド、請求項35から53のいずれか1項に記載の融合タンパク質、請求項54から65のいずれか1項に記載のガイドRNA、又は請求項66から69のいずれか1項に記載のシステムを含む、細胞又はその後代。
【請求項74】
請求項70から72のいずれか1項に記載の方法によって修飾される、修飾された細胞又はその後代。
【請求項75】
前記細胞は、インビボ、エクスビボ又はインビトロである、請求項54から65のいずれか1項に記載のガイドRNA又は請求項73又は74に記載の細胞。
【請求項76】
前記細胞は、真核細胞(例えば、動物細胞、脊椎動物細胞、哺乳動物細胞、非ヒト哺乳動物細胞、非ヒト霊長類動物細胞、げっ歯動物(例えば、マウス又はラット)細胞、ヒト細胞、植物細胞又は酵母細胞)又は原核細胞(例えば、細菌細胞)である、請求項75に記載のガイドRNA又は細胞。
【請求項77】
前記細胞は、培養された細胞、単離された初代細胞又は生体内の細胞である、請求項75に記載のガイドRNA又は細胞。
【請求項78】
前記細胞は、T細胞(例えば、CAR-T細胞)、B細胞、NK細胞(例えば、CAR-NK細胞)、又は幹細胞(例えば、iPS細胞、HSC細胞)である、請求項75に記載のガイドRNA又は細胞。
【請求項79】
前記細胞は、被験体に由来するか又は前記被験体とは異種である、請求項75に記載のガイドRNA又は細胞。
【請求項80】
請求項73から79のいずれか1項に記載の細胞又はその後代を含む、宿主。
【請求項81】
請求項1から34のいずれか1項に記載のCas12iポリペプチド、請求項35から53のいずれか1項に記載の融合タンパク質、請求項54から65のいずれか1項に記載のガイドRNA、請求項66から69のいずれか1項に記載のシステム、又は請求項73から79のいずれか1項に記載の細胞又はその後代を含む、(例えば、医薬)組成物。
【請求項82】
被験体の疾患又は障害を診断、予防又は治療するための方法であって、前記被験体に(例えば、有効量の)請求項66から69のいずれか1項に記載のシステム、請求項73から79のいずれか1項に記載の細胞又はその後代、又は請求項81に記載の組成物を投与することを含む、方法。
【請求項83】
前記疾患又は障害は、TTR関連疾患又は障害、例えばATTRである、請求項82に記載の方法。
【請求項84】
前記スペーサー配列は、SEQ ID NO:107の少なくとも16個の連続したヌクレオチドを含む、請求項83に記載の方法。
【請求項85】
前記疾患又は障害は、PCSK9関連疾患又は障害である、請求項82に記載の方法。
【請求項86】
前記スペーサー配列は、SEQ ID NO:122の少なくとも16個の連続したヌクレオチドを含む、請求項85に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2021年11月2日に提案された、「NOVEL CRISPR-CAS12I SYSTEMS[新型CRISPR-Cas12iシステム]」と称される中国特許出願番号202111289092.6、2022年1月24日に提案された、「NOVEL CRISPR-CAS12I SYSTEMS[新型CRISPR-Cas12iシステム]」と称される中国特許出願番号202210081981.1及び2022年4月25日に提案された、「NOVEL CRISPR-CAS12I SYSTEMS[新型CRISPR-Cas12iシステム]」と称されるPCT特許出願番号PCT/CN2022/089074の権益と優先権を主張しており、これらの特許出願の内容のすべて(任意の配列表と図面を含む)は、その全体が参照により本明細書に組み込まれる。
電子配列表の援用
【0002】
電子配列表(「xxx.xml」、サイズがxxxバイト、且つxxxに作成)の内容は、その全体が参照により本明細書に組み込まれる。配列がRNA配列である場合、該配列におけるTは、Uとみなされるべきである。
[技術分野]
【0003】
本開示は、全体的にCas12iポリペプチド、そのようなCas12iポリペプチドを含む融合タンパク質、そのようなCas12iポリペプチド又は融合タンパク質を含むCRISPR-Cas12iシステム及びその使用方法に関する。
【背景技術】
【0004】
クラスター化規則的間隔の短鎖回分リピート配列-Cas(CRISPR-Cas)システム(II型Cas9とV型Cas12システムとを含み、原核生物のウイルスに対応する適応免疫に役割を果たす)は、既にゲノム編集ツールとして開発された1-3。II型システムと比べて、V-AからV-Kを含むV型システムは、より多くの機能多様性を示す4,5。ここで、SpCas9とCas12aと比べて、Cas12iは、比較的に小さいサイズ(1033-1093aa)を有し、且つ5’-TTNプロトスペーサー隣接モチーフ(PAM)の好みを有する4,6,7。Cas12iの特徴は、前駆体crRNA(pre-crRNA)を自律的に加工して短い成熟crRNAを形成できることである。Cas12iは、先に非標的鎖を切断し、そして標的鎖を切断することによって単一のRuvCドメインを有するdsDNAの切断を媒介する8-10。Cas12iのこれらの固有の特徴は、多重高忠実度ゲノム編集を実現することができる。しかしながら、以前のCas12i(Cas12i1とCas12i2)は、低い編集効率を示し、これは、それらの治療遺伝子編集への効果を制限している。そのため、実用化に向けてより効率的なCRISPR-Cas12iシステムを開発する必要がある。
【0005】
本出願における任意の文献の引用又は識別は、いずれも該文献が本開示の従来の技術として得られることを認めるものではない。
【発明の概要】
【0006】
以前のCas12iの限界を解決するために、出願人は、10種類のCas12iをスクリーニングし、1種類のxCas12i(本明細書では、「SiCas12i」とも呼ばれる)がHEK293T細胞において頑強で高い活性を有することを発見した。PAM相互作用(PI)ドメイン、RECドメインとRuvCドメインにおけるアルギニン置換によるxCas12iの操作により、著しく上昇した編集活性と最小限のオフターゲット切断効率を有する変異体高忠実度Cas12Max(hfCas12Max)が産生される。また、出願人は、xCas12iベースの塩基エディタの塩基編集効率を評価し、そのため、ゲノム編集ツールボックスを拡張した。出願人はさらに、hfCas12Maxがそれぞれリボ核タンパク質(RNP)と脂質ナノリポソーム(LNP)を介してエクスビボとインビボで有効なゲノム編集ツールとなり得ることを証明し、治療性ゲノム編集応用の優れた潜在力を示した。
【0007】
いくつかの態様によれば、本開示は、Cas12iポリペプチドを提供し、前記Cas12iポリペプチドは、
(1)SEQ ID NO:1~3、6と10のうちのいずれか一つに示すとおりであり、
(2)SEQ ID NO:1~3、6と10のうちのいずれか一つのアミノ酸配列を含み、又は、
(3)SEQ ID NO:1~3、6と10のうちのいずれか一つのアミノ酸配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%又は100%)の配列同一性を有するアミノ酸配列を含む。
【0008】
いくつかの態様によれば、本開示は、Cas12iポリペプチドを提供し、前記Cas12iポリペプチドは、SEQ ID NO:1~3、6と10のうちのいずれか一つの参照Cas12iポリペプチドのアミノ酸配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%又は99.9%)且つ100%未満の配列同一性を有するアミノ酸配列を含み、
任意選択的に、ここで、前記Cas12iポリペプチドは、前記参照Cas12iポリペプチドの機能(例えば、前記参照Cas12iポリペプチドの機能と比べて増加又は低減した修飾機能)
(例えば、
(a)前記参照Cas12iポリペプチドと複合体を形成できるガイドRNAと複合体を形成する能力、及び/又は、
(b)スペーサー配列特異的なdsDNA切断活性)を有する。
【0009】
いくつかの実施の形態では、両方が同じガイドRNAと組み合わせて使用される時、SEQ ID NO:1~3、6と10のうちのいずれか一つの前記参照Cas12iポリペプチドと比べて、前記Cas12iポリペプチドは、増加したスペーサー配列特異的なdsDNA及び/又はssDNA切断活性を有し、例えば少なくとも約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%又はそれ以上増加する。
【0010】
いくつかの実施の形態では、両方が同じガイドRNAと組み合わせて使用される時、SEQ ID NO:1~3、6と10のうちのいずれか一つの前記参照Cas12iポリペプチドと比べて、前記Cas12iポリペプチドは、低減したスペーサー配列特異的なdsDNA及び/又はssDNA切断活性を有し、例えば少なくとも約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%又は100%低減する。
【0011】
いくつかの実施の形態では、前記Cas12iポリペプチドは、基本的にスペーサー配列特異的なdsDNA及び/又はssDNA切断活性を有さず、例えばSEQ ID NO:1~3、6と10のうちのいずれか一つの前記参照Cas12iポリペプチドの多くとも約5%、10%、15%、20%、25%、30%、35%、40%、45%又は50%のスペーサー配列特異的なdsDNA及び/又はssDNA切断活性を有する死Cas12iポリペプチドである。
【0012】
いくつかの実施の形態では、前記Cas12iポリペプチドは、SEQ ID NO:1のD650A、D700A、E875AとD1049A又はその組み合わせから選択される置換を含む。
【0013】
いくつかの実施の形態では、前記Cas12iポリペプチドは、スペーサー配列特異的なssDNA切断活性を有するCas12iニッカーゼである。
【0014】
いくつかの実施の形態では、前記Cas12iポリペプチドは、標的dsDNAの標的鎖に対するスペーサー配列特異的なssDNA切断活性を有するCas12iニッカーゼである。
【0015】
いくつかの実施の形態では、前記Cas12iポリペプチドは、標的dsDNAの標的鎖に対するスペーサー配列特異的なssDNA切断活性を有し、且つ基本的にスペーサー配列特異的なdsDNA切断活性を有さず、例えばSEQ ID NO:1~3、6と10のうちのいずれか一つの前記参照Cas12iポリペプチドの多くとも約5%、10%、15%、20%、25%、30%、35%、40%、45%又は50%のスペーサー配列特異的なdsDNA切断活性を有するCas12iニッカーゼである。
【0016】
いくつかの実施の形態では、前記Cas12iポリペプチドは、表11-14におけるSEQ ID NO:1の突然変異体又はその組み合わせから選択される置換を含む。
【0017】
いくつかの実施の形態では、前記Cas12iポリペプチドは、SEQ ID NO:1~3、6と10のいずれでもない。
【0018】
いくつかの実施の形態では、両方が同じガイドRNAと組み合わせて使用される時、SEQ ID NO:1~3、6と10のうちのいずれか一つの前記参照Cas12iポリペプチドと比べて、前記Cas12iポリペプチドは、低減したスペーサー配列非依存的な(オフターゲット)dsDNA及び/又はssDNA切断活性を有し、例えば少なくとも約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%又は100%低減する。
【0019】
いくつかの実施の形態では、前記Cas12iポリペプチドは、一つ又は複数のアミノ酸に一つ又は複数の突然変異(例えば、挿入、欠失又は置換)を含み、前記一つ又は複数のアミノ酸は、SEQ ID NO:1~3、6と10のうちのいずれか一つの前記参照Cas12iポリペプチドのアミノ酸配列の一つ又は複数のアミノ酸に対応する。
【0020】
いくつかの実施の形態では、前記一つ又は複数の突然変異は、SEQ ID NO:1~3、6と10のうちのいずれか一つの前記参照Cas12iポリペプチドに対応するPIドメイン、REC-Iドメイン及び/又はRuvC-IIドメインのドメイン内にある。
【0021】
いくつかの実施の形態では、前記一つ又は複数の突然変異は、SEQ ID NO:1の前記参照Cas12iポリペプチドの位置173~291における前記PIドメイン、位置427~473における前記REC-Iドメイン及び/又は位置800~1082におけるRuvC-IIドメイン内にある。
【0022】
いくつかの実施の形態では、前記Cas12iポリペプチドは、一つ又は複数のアミノ酸に一つ又は複数の突然変異(例えば、挿入、欠失又は置換)を含み、前記一つ又は複数のアミノ酸は、SEQ ID NO:1~3、6と10のうちのいずれか一つの前記参照Cas12iポリペプチドのアミノ酸配列の
SEQ ID NO:1~3、6と10のうちのいずれか一つの前記参照Cas12iポリペプチドの位置1から末端のいずれか一つの位置、例えば1080、例えば位置1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499、500、501、502、503、504、505、506、507、508、509、510、511、512、513、514、515、516、517、518、519、520、521、522、523、524、525、526、527、528、529、530、531、532、533、534、535、536、537、538、539、540、541、542、543、544、545、546、547、548、549、550、551、552、553、554、555、556、557、558、559、560、561、562、563、564、565、566、567、568、569、570、571、572、573、574、575、576、577、578、579、580、581、582、583、584、585、586、587、588、589、590、591、592、593、594、595、596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、615、616、617、618、619、620、621、622、623、624、625、626、627、628、629、630、631、632、633、634、635、636、637、638、639、640、641、642、643、644、645、646、647、648、649、650、651、652、653、654、655、656、657、658、659、660、661、662、663、664、665、666、667、668、669、670、671、672、673、674、675、676、677、678、679、680、681、682、683、684、685、686、687、688、689、690、691、692、693、694、695、696、697、698、699、700、701、702、703、704、705、706、707、708、709、710、711、712、713、714、715、716、717、718、719、720、721、722、723、724、725、726、727、728、729、730、731、732、733、734、735、736、737、738、739、740、741、742、743、744、745、746、747、748、749、750、751、752、753、754、755、756、757、758、759、760、761、762、763、764、765、766、767、768、769、770、771、772、773、774、775、776、777、778、779、780、781、782、783、784、785、786、787、788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、805、806、807、808、809、810、811、812、813、814、815、816、817、818、819、820、821、822、823、824、825、826、827、828、829、830、831、832、833、834、835、836、837、838、839、840、841、842、843、844、845、846、847、848、849、850、851、852、853、854、855、856、857、858、859、860、861、862、863、864、865、866、867、868、869、870、871、872、873、874、875、876、877、878、879、880、881、882、883、884、885、886、887、888、889、890、891、892、893、894、895、896、897、898、899、900、901、902、903、904、905、906、907、908、909、910、911、912、913、914、915、916、917、918、919、920、921、922、923、924、925、926、927、928、929、930、931、932、933、934、935、936、937、938、939、940、941、942、943、944、945、946、947、948、949、950、951、952、953、954、955、956、957、958、959、960、961、962、963、964、965、966、967、968、969、970、971、972、973、974、975、976、977、978、979、980、981、982、983、984、985、986、987、988、989、990、991、992、993、994、995、996、997、998、999、1000、1001、1002、1003、1004、1005、1006、1007、1008、1009、1010、1011、1012、1013、1014、1015、1016、1017、1018、1019、1020、1021、1022、1023、1024、1025、1026、1027、1028、1029、1030、1031、1032、1033、1034、1035、1036、1037、1038、1039、1040、1041、1042、1043、1044、1045、1046、1047、1048、1049、1050、1051、1052、1053、1054、1055、1056、1057、1058、1059、1060、1061、1062、1063、1064、1065、1066、1067、1068、1069、1070、1071、1072、1073、1074、1075、1076、1077、1078、1079、1080のうちの一つ又は複数の位置における一つ又は複数のアミノ酸に対応する。
【0023】
いくつかの実施の形態では、前記Cas12iポリペプチドは、一つ又は複数のアミノ酸に一つ又は複数の突然変異(例えば、挿入、欠失又は置換)を含み、前記一つ又は複数のアミノ酸は、SEQ ID NO:1の前記参照Cas12iポリペプチドのアミノ酸配列の
位置1から1080のうちのいずれか一つの位置、例えば位置1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499、500、501、502、503、504、505、506、507、508、509、510、511、512、513、514、515、516、517、518、519、520、521、522、523、524、525、526、527、528、529、530、531、532、533、534、535、536、537、538、539、540、541、542、543、544、545、546、547、548、549、550、551、552、553、554、555、556、557、558、559、560、561、562、563、564、565、566、567、568、569、570、571、572、573、574、575、576、577、578、579、580、581、582、583、584、585、586、587、588、589、590、591、592、593、594、595、596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、615、616、617、618、619、620、621、622、623、624、625、626、627、628、629、630、631、632、633、634、635、636、637、638、639、640、641、642、643、644、645、646、647、648、649、650、651、652、653、654、655、656、657、658、659、660、661、662、663、664、665、666、667、668、669、670、671、672、673、674、675、676、677、678、679、680、681、682、683、684、685、686、687、688、689、690、691、692、693、694、695、696、697、698、699、700、701、702、703、704、705、706、707、708、709、710、711、712、713、714、715、716、717、718、719、720、721、722、723、724、725、726、727、728、729、730、731、732、733、734、735、736、737、738、739、740、741、742、743、744、745、746、747、748、749、750、751、752、753、754、755、756、757、758、759、760、761、762、763、764、765、766、767、768、769、770、771、772、773、774、775、776、777、778、779、780、781、782、783、784、785、786、787、788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、805、806、807、808、809、810、811、812、813、814、815、816、817、818、819、820、821、822、823、824、825、826、827、828、829、830、831、832、833、834、835、836、837、838、839、840、841、842、843、844、845、846、847、848、849、850、851、852、853、854、855、856、857、858、859、860、861、862、863、864、865、866、867、868、869、870、871、872、873、874、875、876、877、878、879、880、881、882、883、884、885、886、887、888、889、890、891、892、893、894、895、896、897、898、899、900、901、902、903、904、905、906、907、908、909、910、911、912、913、914、915、916、917、918、919、920、921、922、923、924、925、926、927、928、929、930、931、932、933、934、935、936、937、938、939、940、941、942、943、944、945、946、947、948、949、950、951、952、953、954、955、956、957、958、959、960、961、962、963、964、965、966、967、968、969、970、971、972、973、974、975、976、977、978、979、980、981、982、983、984、985、986、987、988、989、990、991、992、993、994、995、996、997、998、999、1000、1001、1002、1003、1004、1005、1006、1007、1008、1009、1010、1011、1012、1013、1014、1015、1016、1017、1018、1019、1020、1021、1022、1023、1024、1025、1026、1027、1028、1029、1030、1031、1032、1033、1034、1035、1036、1037、1038、1039、1040、1041、1042、1043、1044、1045、1046、1047、1048、1049、1050、1051、1052、1053、1054、1055、1056、1057、1058、1059、1060、1061、1062、1063、1064、1065、1066、1067、1068、1069、1070、1071、1072、1073、1074、1075、1076、1077、1078、1079、1080のうちの一つ又は複数の位置における一つ又は複数のアミノ酸に対応する。
【0024】
いくつかの実施の形態では、前記Cas12iポリペプチドは、一つ又は複数のアミノ酸に一つ又は複数の突然変異(例えば、挿入、欠失又は置換)を含み、前記一つ又は複数のアミノ酸は、SEQ ID NO:1の前記参照Cas12iポリペプチドのアミノ酸配列の
K109、N110、Y111、L112、M113、S114、N115、I116、D117、S118、D119、F121、V122、W123、V124、D125、C126、127、K128、F129、A130、K131、D132、F133、A134、Y135、Q136、M137、E138、L139、G140、F141、H142、E143、F144、T145、V146、L147、A148、E149、T150、L151、L152、A153、N154、S155、I156、L157、V158、L159、N160、E161、S162、T163、K164、A165、N166、W167、A168、W169、G170、T171、V172、S173、A174、L175、Y176、G177、G178、G179、D180、K181、E182、D183、S184、T185、L186、K187、S188、K189、I190、L191、L192、A193、F194、V195、D196、A197、L198、N199、N200、H201、E202、L203、K204、T205、K206、E208、I209、L210、N211、Q212、V213、C214、E215、S216、L217、K218、Y219、Q220、S221、Y222、Q223、D224、M225、Y226、V227、D228、F229、S231、V232、V233、D234、E235、N236、G237、N238、K239、K240、S241、P242、N243、G244、S245、M246、P247、I248、V249、T250、K251、F252、E253、T254、D255、D256、L257、I258、S259、D260、N261、Q262、K264、A265、M266、I267、S268、N269、F270、T271、K272、N273、A274、A275、A276、K277、A278、A279、K280、K281、P282、I283、P284、Y285、L286、D287、288、L289、K290、E291、M293、V294、S295、L296、C297、D298、Y300、N301、V302、Y303、A304、W305、A306、A307、A308、I309、T310、N311、S312、N313、A314、D315、V316、T317、A318、N320、T321、L324、T325、F326、I327、G328、E329、Q330、N331、S332、K335、E336、L337、S338、V339、L340、Q341、T342、T343、T344、N345、E346、K347、A348、K349、D350、I351、L352、N353、K354、N356、D357、N358、L359、I360、Q361、E362、V363、Y365、T366、P367、A368、K370、H371、L372、G373、D375、L376、A377、N378、L379、F380、D381、T382、L383、K384、E385、K386、D387、I388、N389、N390、I391、E392、N393、E394、E395、E396、K397、Q398、N399、V400、I401、N402、D403、C404、I405、E406、Q407、Y408、V409、D410、D411、C412、L415、N416、N418、P419、I420、A421、A422、L423、L424、K425、H426、I427、S428、Y430、Y431、E432、D433、F434、S435、A436、K437、N438、F439、L440、D441、G442、A443、K444、L445、N446、V447、L448、T449、E450、V451、V452、N453、Q455、K456、A457、H458、P459、T460、I461、W462、S463、E464、I800、S801、L802、K803、M804、I805、S806、D807、F808、K809、G810、V811、V812、Q813、S814、Y815、F816、S817、V818、S819、G820、C821、V822、D823、D824、A825、S826、K827、K828、A829、H830、D831、S832、M833、L834、F835、T836、F837、M838、C839、A840、A841、E842、E843、K844、T846、N847、K848、E850、E851、K852、T853、N854、A856、A857、S858、F859、I860、L861、Q862、K863、A864、Y865、L866、H867、G868、C869、K870、M871、I872、V873、C874、E875、D876、D877、L878、P879、V880、A881、D882、G883、K884、T885、G886、K887、A888、Q889、N890、A891、D892、M894、D895、W896、C897、A898、A900、L901、A902、K903、K904、V905、N906、D907、G908、C909、V910、A911、M912、S913、I914、C915、Y916、A918、P920、A921、Y922、M923、S924、S925、H926、Q927、D928、P929、F930、V931、H932、M933、Q934、D935、K936、K937、T938、S939、V940、L941、P943、F945、M946、E947、V948、N949、K950、D951、S952、I953、D955、Y956、H957、V958、A959、G960、L961、L965、N966、S967、K968、S969、D970、A971、G972、T973、S974、V975、Y976、Y977、Q979、A980、A981、L982、H983、F984、C985、E986、A987、L988、G989、V990、S991、P992、E993、L994、V995、K996、N997、K998、K999、T1000、H1001、A1002、A1003、E1004、L1005、G1006、M1009、G1010、S1011、A1012、M1013、L1014、M1015、P1016、W1017、G1019、G1020、V1022、Y1023、I1024、A1025、S1026、K1027、K1028、L1029、T1030、S1031、D1032、A1033、K1034、S1035、V1036、K1037、Y1038、C1039、G1040、E1041、D1042、M1043、W1044、Q1045、Y1046、H1047、A1048、D1049、E1050、I1051、A1052、A1053、V1054、N1055、I1056、A1057、M1058、Y1059、E1060、V1061、C1062、C1063、Q1064、T1065、G1066、A1067、F1068、G1069、K1070、K1071、Q1072、K1073、K1074、S1075、D1076、E1077、L1078、P1079とG1080のうちの一つ又は複数の位置における一つ又は複数のアミノ酸に対応する。
【0025】
いくつかの実施の形態では、前記Cas12iポリペプチドは、一つ又は複数のアミノ酸に一つ又は複数の突然変異(例えば、挿入、欠失又は置換)を含み、前記一つ又は複数のアミノ酸は、SEQ ID NO:1の前記参照Cas12iポリペプチドのアミノ酸配列の
S118、D119、F121、W123、Q136、E138、E143、V146、S155、V158、E161、S162、T163、A165、N166、G178、D180、T185、K189、A193、D196、N199、N200、E202、L203、S221、V233、E235、N236、S241、N243、S245、K251、D255、L257、N273、D287、S295、V302、S332、E336、S338、V339、E362、D375、A377、N378、D381、T382、E385、D387、N390、E395、E396、Q398、N399、V400、D403、E406、Q407、V409、D411、C412、N416、N418、L440、L448、V451、Q455、E464、S806、S817、V818、S819、S832、M833、F835、T836、F837、C839、A840、E842、E843、K844、T846、N847、K848、N854、A856、S858、Q862、K863、Y865、L866、G868、K870、M871、D876、D877、V880、G883、K884、G886、K887、A888、A891、D892、M894、A900、K903、K904、N906、V910、M912、S913、C915、Y916、A918、M923、S925、H926、Q927、V931、M933、Q934、D935、K936、K937、T938、S939、V940、F945、M946、V948、N949、K950、D951、S952、D955、Y956、A959、G960、N966、S967、K968、S969、D970、A971、G972、S974、V975、Y976、Q979、A980、L982、H983、C985、E986、A987、G989、V990、S991、P992、E993、L994、V995、K996、N997、K998、K999、T1000、H1001、A1002、A1003、E1004、G1006、G1010、A1012、M1013、L1014、W1017、V1022、K1028、D1032、K1034、K1037、C1039、G1040、Q1045、H1047、C1063とG1069のうちの一つ又は複数の位置における一つ又は複数のアミノ酸に対応する。
【0026】
いくつかの実施の形態では、前記Cas12iポリペプチドは、一つ又は複数のアミノ酸に一つ又は複数の突然変異(例えば、挿入、欠失又は置換)を含み、前記一つ又は複数のアミノ酸は、SEQ ID NO:1の前記参照Cas12iポリペプチドのアミノ酸配列の
N243、E336、V880、G883、D892とM923のうちの一つ又は複数の位置における一つ又は複数のアミノ酸に対応する。
【0027】
いくつかの実施の形態では、前記一つ又は複数の突然変異は、Rで置換される。
【0028】
いくつかの実施の形態では、前記Cas12iポリペプチドは、さらに一つ又は複数のアミノ酸に一つ又は複数の突然変異(例えば、挿入、欠失又は置換)を含み、前記一つ又は複数のアミノ酸は、SEQ ID NO:1の前記参照Cas12iポリペプチドのアミノ酸配列の
V880、G883、D892とM923のうちの一つ又は複数の位置における一つ又は複数のアミノ酸に対応する。
【0029】
いくつかの実施の形態では、前記一つ又は複数の突然変異は、Rで置換される。
【0030】
いくつかの実施の形態では、前記Cas12iポリペプチドは、一つ又は複数のアミノ酸に一つ又は複数の突然変異(例えば、挿入、欠失又は置換)を含み、前記一つ又は複数のアミノ酸は、SEQ ID NO:1の前記参照Cas12iポリペプチドのアミノ酸配列の
K109、L112、D125、127、F144、L147、A148、L151、L157、V195、Y226、F252、I258、M293、W305、A308、I309、S312、A314、D315、V316、A318、L324、I327、A348、L352、Y365、L372、L376、L379、L383、I405、L424、I427、A436、F439、A443、V447、A457、H458、P459、T460、S463、S814、F859、A864、H867、Y977、S1031、A1053とF1068のうちの一つ又は複数の位置における一つ又は複数のアミノ酸に対応する。
【0031】
いくつかの実施の形態では、前記一つ又は複数の突然変異は、Rで置換される。
【0032】
いくつかの実施の形態では、N243における前記置換は、R、A、V、L、I、M、F、W、S、T、C、Y、N、Q、E、K又はHで置換される。
【0033】
いくつかの実施の形態では、前記突然変異は、置換である。
【0034】
いくつかの実施の形態では、前記置換は、非極性アミノ酸残基(例えばグリシン(Gly/G)、アラニン(Ala/A)、バリン(Val/V)、システイン(Cys/C)、プロリン(Pro/P)、ロイシン(Leu/L)、イソロイシン(Ile/I)、メチオニン(Met/M)、トリプトファン(Trp/W)、フェニルアラニン(Phe/F))、極性アミノ酸残基(例えばセリン(Ser/S)、スレオニン(Thr/T)、チロシン(Tyr/Y)、アスパラギン(Asn/N)、グルタミン(Gln/Q))、正に荷電したアミノ酸残基(例えばリジン(Lys/K)、アルギニン(Arg/R)、ヒスチジン(His/H))又は負に荷電したアミノ酸残基(例えばアスパラギン酸(Asp/D)、グルタミン酸(Glue/E))で行われる置換である。
【0035】
いくつかの実施の形態では、前記置換は、正に荷電したアミノ酸残基、例えばアルギニン(R)で置換される。
【0036】
いくつかの実施の形態では、前記置換は、非極性アミノ酸残基、例えばアラニン(A)で置換される。
【0037】
いくつかの実施の形態では、前記Cas12iポリペプチドは、表6におけるいずれか一つの突然変異体又はその組み合わせに対応する置換を含み、且つ、ここで、前記アミノ酸の位置は、SEQ ID NO:1に対するものである。
【0038】
いくつかの実施の形態では、前記Cas12iポリペプチドは、表6におけるいずれか一つの突然変異体又はその組み合わせに対応する置換を含み、両方が同じガイドRNAと組み合わせて使用される時、SEQ ID NO:1の前記参照Cas12iポリペプチドと比べて、増加したスペーサー配列特異的なdsDNA切断活性を有し、例えば少なくとも約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%又はそれ以上増加し、且つ、ここで、前記アミノ酸の位置は、SEQ ID NO:1に対するものである。
【0039】
いくつかの実施の形態では、前記Cas12iポリペプチドは、xCas12i-N243R突然変異体である。
【0040】
いくつかの実施の形態では、前記Cas12iポリペプチドは、表8におけるいずれか一つの突然変異体又はその組み合わせに対応する置換を含み、且つ、ここで、前記アミノ酸の位置は、SEQ ID NO:1に対するものである。
【0041】
いくつかの実施の形態では、前記Cas12iポリペプチドは、xCas12i-N243R+E336R+D892R突然変異体である。
【0042】
いくつかの実施の形態では、前記Cas12iポリペプチドは、xCas12i-N243R+E336R+G883R突然変異体である。
【0043】
ある態様によれば、本開示は、Cas12iポリペプチドを提供し、前記Cas12iポリペプチドは、
(1)xCas12i-N243R突然変異体のアミノ酸配列に示すとおりであり、
(2)xCas12i-N243R突然変異体のアミノ酸配列を含み、又は、
(3)xCas12i-N243R突然変異体のアミノ酸配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%又は100%)の配列同一性を有するアミノ酸配列を含む。
【0044】
ある態様によれば、本開示は、Cas12iポリペプチドを提供し、前記Cas12iポリペプチドは、
(1)xCas12i-N243R+E336R+D892R突然変異体のアミノ酸配列に示すとおりであり、
(2)xCas12i-N243R+E336R+D892R突然変異体のアミノ酸配列を含み、又は、
(3)xCas12i-N243R+E336R+D892R突然変異体のアミノ酸配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%又は100%)の配列同一性を有するアミノ酸配列を含む。
【0045】
ある態様によれば、本開示は、Cas12iポリペプチドを提供し、前記Cas12iポリペプチドは、
(1)xCas12i-N243R+E336R+G883R突然変異体のアミノ酸配列に示すとおりであり、
(2)xCas12i-N243R+E336R+G883R突然変異体のアミノ酸配列を含み、又は、
(3)xCas12i-N243R+E336R+G883R突然変異体のアミノ酸配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%又は100%)の配列同一性を有するアミノ酸配列を含む。
【0046】
いくつかの実施の形態では、前記Cas12iポリペプチドは、標的dsDNAの非標的鎖上のプロトスペーサー配列5’の隣りにある標的隣接モチーフ(TAM)を認識することができ、且つ、ここで、前記TAMは、5’-NTTN-3’であり、ここで、Nは、A、T、G又はCである。
【0047】
いくつかの実施の形態では、前記Cas12iポリペプチドは、Cas12iポリペプチドに関連する機能ドメインをさらに含む。
【0048】
いくつかの実施の形態では、機能ドメインは、トランスポザーゼ活性、メチラーゼ活性、デメチラーゼ活性、翻訳活性化活性、翻訳阻害活性、転写活性化活性、転写阻害活性、転写放出因子活性、クロマチン修飾又はリモデリング活性、ヒストン修飾活性、ヌクレアーゼ活性、一本鎖RNA切断活性、二本鎖RNA切断活性、一本鎖DNA切断活性、二本鎖DNA切断活性、核酸結合活性、検出可能活性又はそれらの任意の組み合わせを有する。
【0049】
ある態様によれば、本開示は、融合タンパク質を提供し、前記融合タンパク質は、本開示のCas12iポリペプチドと機能ドメインとを含む。
【0050】
いくつかの実施の形態では、前記機能ドメインは、前記Cas12iポリペプチドに対してN-末端、C-末端又は内部で融合される。
【0051】
いくつかの実施の形態では、前記機能ドメインは、リンカーを介して前記Cas12iポリペプチドに融合され、前記リンカーは、例えばXTENリンカー(SEQ ID NO:442)、複数のグリシンとセリン残基とを含むGSリンカー、複数のグリシンとセリン残基とを含むGSリンカー及びXTENリンカー(SEQ ID NO:442)、複数のグリシンとセリン残基とを含むGSリンカー及びBP NLS(SEQ ID NO:443)である。
【0052】
いくつかの実施の形態では、前記機能ドメインは、核局在化シグナル(NLS)、核外輸送シグナル(NES)、デアミナーゼ又はその触媒ドメイン、ウラシルグリコシダーゼ阻害剤(UGI)、ウラシルグリコシダーゼ(UNG)、メチルプリングリコシダーゼ(MPG)、メチラーゼ又はその触媒ドメイン、デメチラーゼ又はその触媒ドメイン、転写活性化ドメイン(例えば、VP64又はVPR)、転写阻害ドメイン(例えば、KRAB部分又はSID部分)、逆転写酵素又はその触媒ドメイン、エキソヌクレアーゼ又はその触媒ドメイン、ヒストン残基修飾ドメイン、ヌクレアーゼ触媒ドメイン(例えば、FokI)、転写修飾因子、光ゲーティング因子(light gating factor)、化学誘導因子、クロマチン可視化因子、標的細胞又は標的細胞型上の細胞表面部分との結合を提供するためのターゲッティングポリペプチド、レポーター(例えば、蛍光)ポリペプチド又は検出マーカー(例えば、GST、HRP、CAT、GFP、HcRed、DsRed、CFP、YFP、BFP)、局在化シグナル、ポリペプチドターゲッティング部分、DNA結合ドメイン(例えば、MBP、Lex A DBD、Gal4 DBD)、エピトープタグ(例えば、His、myc、V5、FLAG、HA、VSV-G、Trxなど)、転写放出因子、HDAC、ssRNA切断活性を有する部分、dsRNA切断活性を有する部分、ssDNA切断活性を有する部分、dsDNA切断活性を有する部分、DNA又はRNAリガーゼ、標的DNAを修飾する活性を示す機能ドメインとその触媒ドメイン及びその機能断片及びその任意の組み合わせから選択され、前記標的DNAを修飾する活性は、メチルトランスフェラーゼ活性、DNA修復活性、DNA損傷活性、ジスムターゼ活性、アルキル化活性、脱アルキル化活性、脱プリン活性、酸化活性、脱酸素活性、ピリミジンダイマー形成活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、グリコシダーゼ活性、アセチルトランスフェラーゼ活性、脱アセチル化酵素活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、脱ミリストイル化活性、グリコシル化活性(例えば、O-GlcNAcトランスフェラーゼ由来)、脱グリコシル化活性から選択される。
【0053】
いくつかの実施の形態では、NLSは、SV40 NLS(SEQ ID NO:444)、bpSV40 NLS(BP NLS、bpNLS、SEQ ID NO:443)又はNP NLS(アフリカツメガエル(Xenopus laevis)核質タンパク質NLS、核質タンパク質NLS、SEQ ID NO:445)を含むか又はそれである。
【0054】
いくつかの実施の形態では、前記機能ドメインは、デアミナーゼ又はその触媒ドメインを含む。
【0055】
いくつかの実施の形態では、前記デアミナーゼ又はその触媒ドメインは、アデニンデアミナーゼ(例えば、TadA、例えばTadA8e、TadA8.17、TadA8.20、TadA9)又はその触媒ドメインである。
【0056】
いくつかの実施の形態では、デアミナーゼ又はその触媒ドメインは、シチジンデアミナーゼ(例えば、APOBEC、例えばAPOBEC3、例えばAPOBEC3A、APOBEC3B、APOBEC3C、DddA)又はその触媒ドメインである。
【0057】
いくつかの実施の形態では、前記機能ドメインは、ウラシルグリコシダーゼ阻害剤(UGI)を含む。
【0058】
いくつかの実施の形態では、前記機能ドメインは、ウラシルグリコシダーゼ(UNG)を含む。
【0059】
いくつかの実施の形態では、前記機能ドメインは、メチルプリングリコシダーゼ(MPG)を含む。
【0060】
いくつかの実施の形態では、前記アデニンデアミナーゼドメインは、野生型TadA又はその変異体であり、それは、
(1)SEQ ID NO:439に示すとおりであり、
(2)SEQ ID NO:439のアミノ酸配列を含み、又は、
(3)SEQ ID NO:439のアミノ酸配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%又は100%)の配列同一性を有するアミノ酸配列を含む。
【0061】
いくつかの実施の形態では、前記アデニンデアミナーゼドメインは、SEQ ID NO:439のTadA8e-V106Wであるか又はTadA8eである。
【0062】
いくつかの実施の形態では、UGIドメインは、
(1)SEQ ID NO:441に示すとおりであり、
(2)SEQ ID NO:441のアミノ酸配列を含み、又は、
(3)SEQ ID NO:441のアミノ酸配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)の配列同一性を有するアミノ酸配列を含む。
【0063】
いくつかの実施の形態では、前記シチジンデアミナーゼドメインは、APOBEC3又はその変異体であり、それは、
(1)SEQ ID NO:440に示すとおりであり、
(2)SEQ ID NO:440のアミノ酸配列を含み、又は、
(3)SEQ ID NO:440のアミノ酸配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%又は100%)の配列同一性を有するアミノ酸配列を含む。
【0064】
いくつかの実施の形態では、前記シチジンデアミナーゼドメインは、SEQ ID NO:440のヒトAPOBEC3-W104Aである。
【0065】
いくつかの実施の形態では、前記機能ドメインは、逆転写酵素又はその触媒ドメインを含む。
【0066】
いくつかの実施の形態では、前記機能ドメインは、メチラーゼ又はその触媒ドメインを含む。
【0067】
いくつかの実施の形態では、前記機能ドメインは、転写活性化ドメインを含む。
【0068】
いくつかの実施の形態では、前記機能ドメインは、エキソヌクレアーゼ又はその触媒ドメイン、例えばT5エキソヌクレアーゼ(T5E)(SEQ ID NO:449)を含む。
【0069】
いくつかの実施の形態では、エキソヌクレアーゼは、N-末端又はC-末端でCas12iポリペプチドに融合される。
【0070】
いくつかの実施の形態では、エキソヌクレアーゼは、C-末端でCas12iポリペプチドに融合される。
【0071】
いくつかの実施の形態では、T5エキソヌクレアーゼは、
(1)SEQ ID NO:449に示すとおりであり、
(2)SEQ ID NO:449のアミノ酸配列を含み、又は、
(3)SEQ ID NO:449のアミノ酸配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%又は100%)の配列同一性を有するアミノ酸配列を含む。
【0072】
ある態様によれば、本開示は、融合タンパク質を提供し、前記融合タンパク質は、
(1)Cas12iポリペプチド、及び
(2)アデニンデアミナーゼドメインを含む。
【0073】
いくつかの実施の形態では、前記アデニンデアミナーゼドメインは、アデニンデアミナーゼ(例えば、TadA、例えばTadA8e、TadA8.17、TadA8.20、TadA9)又はその触媒ドメインである。
【0074】
いくつかの実施の形態では、前記アデニンデアミナーゼドメインは、野生型TadA又はその変異体であり、それは、
(1)SEQ ID NO:439に示すとおりであり、
(2)SEQ ID NO:439のアミノ酸配列を含み、又は、
(3)SEQ ID NO:439のアミノ酸配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%又は100%)の配列同一性を有するアミノ酸配列を含む。
【0075】
いくつかの実施の形態では、前記アデニンデアミナーゼドメインは、SEQ ID NO:439のTadA8e-V106Wであるか又はTadA8eである。
【0076】
ある態様によれば、本開示は、融合タンパク質を提供し、前記融合タンパク質は、
(1)Cas12iポリペプチド、及び
(2)シチジンデアミナーゼドメインを含む。
【0077】
いくつかの実施の形態では、前記融合タンパク質は、ウラシルグリコシダーゼ阻害剤(UGI)ドメインをさらに含む。
【0078】
いくつかの実施の形態では、UGIドメインは、
(1)SEQ ID NO:441に示すとおりであり、
(2)SEQ ID NO:441のアミノ酸配列を含み、又は、
(3)SEQ ID NO:441のアミノ酸配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)の配列同一性を有するアミノ酸配列を含む。
【0079】
いくつかの実施の形態では、前記シチジンデアミナーゼドメインは、シチジンデアミナーゼ(例えば、APOBEC(アポリポタンパク質B mRNA編集触媒ポリペプチド様)、例えばAPOBEC3、例えばAPOBEC3A、APOBEC3B、APOBEC3C、DddA)又はその触媒ドメインである。
【0080】
いくつかの実施の形態では、前記シチジンデアミナーゼドメインは、APOBEC3又はその変異体であり、それは、
(1)SEQ ID NO:440に示すとおりであり、
(2)SEQ ID NO:440のアミノ酸配列を含み、又は、
(3)SEQ ID NO:440のアミノ酸配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%又は100%)の配列同一性を有するアミノ酸配列を含む。
【0081】
いくつかの実施の形態では、前記シチジンデアミナーゼドメインは、SEQ ID NO:440のヒトAPOBEC3-W104Aである。
【0082】
いくつかの実施の形態では、前記融合タンパク質は、SEQ ID NO:85又は184のアミノ酸配列を含む。
【0083】
ある態様によれば、本開示は、融合タンパク質を提供し、前記融合タンパク質は、
(1)Cas12iポリペプチド、及び
(2)非LTR逆転写トランスポゾンドメインを含む。
【0084】
ある態様によれば、本開示は、融合タンパク質を提供し、前記融合タンパク質は、
(1)Cas12iポリペプチド、及び
(2)転写活性化ドメインを含む。
【0085】
いくつかの実施の形態では、前記Cas12iポリペプチドは、本開示のCas12iポリペプチドである。
【0086】
いくつかの実施の形態では、前記アデニンデアミナーゼドメインは、N-末端又はC-末端でCas12iポリペプチドに融合される。
【0087】
いくつかの実施の形態では、前記シチジンデアミナーゼドメインは、N-末端又はC-末端でCas12iポリペプチドに融合される。
【0088】
いくつかの実施の形態では、前記ウラシルグリコシダーゼ阻害剤ドメインは、N-末端又はC-末端でCas12iポリペプチドに融合される。
【0089】
いくつかの実施の形態では、前記ウラシルグリコシダーゼ阻害剤ドメインは、N-末端又はC-末端で前記シチジンデアミナーゼドメインに融合される。
【0090】
いくつかの実施の形態では、非LTR逆転写トランスポゾンドメインは、N-末端又はC-末端でCas12iポリペプチドに融合される。
【0091】
いくつかの実施の形態では、前記融合タンパク質は、一つ、二つ、三つ又はそれ以上UGIドメインを含む。
【0092】
いくつかの実施の形態では、前記融合タンパク質は、リンカーを介し又はリンカーを介さずに直列連結される一つ、二つ、三つ又はそれ以上のUGIドメインを含む。
【0093】
いくつかの実施の形態では、前記融合タンパク質は、一つ、二つ、三つ、四つ又はそれ以上のNLS及び/又はNESを含む。
【0094】
いくつかの実施の形態では、前記融合タンパク質は、Cas12iポリペプチドのN-末端及び/又はC-末端にNLS又はNESを含む。
【0095】
いくつかの実施の形態では、前記融合タンパク質は、アデニンデアミナーゼドメインのN-末端及び/又はC-末端にNLS又はNESを含む。
【0096】
いくつかの実施の形態では、前記融合タンパク質は、シチジンデアミナーゼドメインのN-末端及び/又はC-末端にNLS又はNESを含む。
【0097】
いくつかの実施の形態では、前記融合タンパク質は、UGIドメインのN-末端及び/又はC-末端にNLS又はNESを含む。
【0098】
いくつかの実施の形態では、前記融合タンパク質は、逆転写酵素ドメインのN-末端及び/又はC-末端にNLS又はNESを含む。
【0099】
いくつかの実施の形態では、前記融合タンパク質は、非LTR逆転写トランスポゾンドメインのN-末端及び/又はC-末端にNLS又はNESを含む。
【0100】
いくつかの実施の形態では、前記融合は、リンカーを介して行われる。
【0101】
いくつかの実施の形態では、前記リンカーは、GSリンカー、XTENリンカー(SEQ ID NO:442)、XTENを含むリンカー、NLS又はNESを含むリンカー、XTENを含むGSリンカー、NLS又はNESを含むGSリンカーである。
【0102】
いくつかの実施の形態では、前記融合タンパク質は、誘導的要素、例えば誘導的ポリペプチドを含む。
【0103】
いくつかの実施の形態では、NLSは、SV40 NLS(SEQ ID NO:444)、bpSV40 NLS(BP NLS、bpNLS、SEQ ID NO:443)又はNP NLS(アフリカツメガエル核質タンパク質NLS、核質タンパク質NLS、SEQ ID NO:445)を含むか又はそれである。
【0104】
ある態様によれば、本開示は、ベクターを提供し、ここで、前記ベクターは、AAVベクターゲノムであり、前記AAVベクターゲノムは、
(1)プロモーターに動作可能に連結された本開示の融合タンパク質をコードして含むポリヌクレオチドと、
(2)プロモーターに動作可能に連結されたガイドRNAのポリヌクレオチドとを含み、前記ガイドRNAは、
(i)前記Cas12iポリペプチド又は前記融合タンパク質と複合体を形成できるダイレクトリピート配列と、
(ii)標的dsDNAの標的鎖上の標的配列にハイブリダイズすることによって、前記複合体を前記標的dsDNAに導くことができるスペーサー配列とを含む。
【0105】
いくつかの実施の形態では、SEQ ID NO:1~3、6と10のうちのいずれか一つの参照ポリペプチドを含む、他の方面が同じである対照融合タンパク質又は対照複合体又は対照融合タンパク質と比べて、前記融合タンパク質は、増加した効率(例えば、塩基編集効率、メチル化効率、転写活性化効率)を有し、例えば、効率が少なくとも約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%又はそれ以上増加する。
【0106】
ある態様によれば、本開示は、ガイドRNAを提供し、前記ガイドRNAは、
(1)Cas12iポリペプチド、又は前記Cas12iポリペプチドと機能ドメインとを含む融合タンパク質と複合体を形成できるダイレクトリピート配列と、
(2)標的dsDNAの標的鎖上の標的配列にハイブリダイズすることによって、前記複合体を前記標的dsDNAに導くことができるスペーサー配列とを含む。
【0107】
いくつかの実施の形態では、ダイレクトリピート配列は、スペーサー配列の5’末端にある。
【0108】
いくつかの実施の形態では、前記ガイドRNAは、アプタマーをさらに含む。
【0109】
いくつかの実施の形態では、前記ガイドRNAは、RNAテンプレートを付加するための伸長をさらに含む。
【0110】
いくつかの実施の形態では、前記ガイドRNAは、標的dsDNAに挿入するためのドナー配列をさらに含む。
【0111】
いくつかの実施の形態では、前記ダイレクトリピート配列は、
(1)SEQ ID NO:11~13、16、20と501~507のうちのいずれか一つに示すとおりであり、
(2)SEQ ID NO:11~13、16、20と501~507のうちのいずれか一つのポリヌクレオチド配列を含み、又は、
(3)SEQ ID NO:11~13、16、20と501~507のうちのいずれか一つのポリヌクレオチド配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%又は100%)の配列同一性を有するポリヌクレオチド配列を含む。
【0112】
いくつかの実施の形態では、前記ダイレクトリピート配列は、SEQ ID NO:11~13、16、20と501~507のうちのいずれか一つのポリヌクレオチド配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%又は99.9%)且つ100%未満の配列同一性を有するヌクレオチド配列を含むダイレクトリピート配列である。
【0113】
いくつかの実施の形態では、前記ダイレクトリピート配列は、SEQ ID NO:11~13、16、20と501~507のうちのいずれか一つの二次構造と実質的に同じ二次構造を有する。
【0114】
いくつかの実施の形態では、前記ダイレクトリピート配列は、SEQ ID NO:11~13、16と20のいずれでもない。
【0115】
いくつかの実施の形態では、ガイドRNAがCas12iポリペプチド(例えば、本開示のCas12iポリペプチド)と組み合わせて使用される時、Cas12iポリペプチドと組み合わせて使用される、SEQ ID NO:11~13、16、20と501~507のうちのいずれか一つを含む、他の方面が同じである対照ガイドRNAと比べて、増加したスペーサー配列特異的なdsDNA及び/又はssDNA切断活性を示し、例えば、少なくとも約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%又はそれ以上増加する。
【0116】
いくつかの実施の形態では、ガイドRNAがCas12iポリペプチド(例えば、本開示のCas12iポリペプチド)と組み合わせて使用される時、Cas12iポリペプチドと組み合わせて使用される、SEQ ID NO:11~13、16、20と501~507のうちのいずれか一つを含む、他の方面が同じである対照ガイドRNAと比べて、低減したスペーサー配列特異的なdsDNA及び/又はssDNA切断活性を示し、例えば、少なくとも約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%又は100%低減する。
【0117】
いくつかの実施の形態では、ガイドRNAが、Cas12iポリペプチド(例えば、本開示のCas12iポリペプチド)と機能ドメイン(例えば、本開示の機能ドメイン)とを含む融合タンパク質(例えば、本開示の融合タンパク質)と組み合わせて使用される時、融合タンパク質と組み合わせて使用される、SEQ ID NO:11~13、16、20と501~507のうちのいずれか一つを含む、他の方面が同じである対照ガイドRNAと比べて、増加した効率(例えば、塩基編集効率、メチル化効率、転写活性化効率)を示し、例えば、少なくとも約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%又はそれ以上増加する。
【0118】
いくつかの実施の形態では、ダイレクトリピート配列は、一つ又は複数のヌクレオチドに一つ又は複数の突然変異(例えば、挿入、欠失又は置換)を含み、前記一つ又は複数のヌクレオチドは、SEQ ID NO:11~13、16、20と501~507のうちのいずれか一つのポリヌクレオチド配列の一つ又は複数のヌクレオチドに対応する。
【0119】
いくつかの実施の形態では、前記一つ又は複数の突然変異は、ステムループ領域内にあり、前記ステムループ領域は、SEQ ID NO:11~13、16、20と501~507のうちのいずれか一つのポリヌクレオチド配列のステムループ領域(例えば、R1領域、R2領域、R3領域、R4領域)に対応する。
【0120】
いくつかの実施の形態では、ダイレクトリピート配列は、一つ又は複数のヌクレオチドに一つ又は複数の突然変異(例えば、挿入、欠失又は置換)を含み、前記一つ又は複数のヌクレオチドは、SEQ ID NO:11~13、16、20と501~507のうちのいずれか一つのポリヌクレオチド配列の
SEQ ID NO:11~13、16、20と501~507のうちのいずれか一つの位置1から末端のいずれか一つの位置、例えば36、例えば位置1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36のうちの一つ又は複数の位置における一つ又は複数のヌクレオチドに対応する。
【0121】
いくつかの実施の形態では、ダイレクトリピート配列は、一つ又は複数のヌクレオチドに一つ又は複数の突然変異(例えば、挿入、欠失又は置換)を含み、前記一つ又は複数のヌクレオチドは、SEQ ID NO:11のポリヌクレオチド配列の
位置1から36のいずれか一つの位置、例えば位置1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36のうちの一つ又は複数の位置における一つ又は複数のヌクレオチドに対応する。
【0122】
いくつかの実施の形態では、前記突然変異は、欠失である。
【0123】
いくつかの実施の形態では、前記突然変異は、置換である。
【0124】
いくつかの実施の形態では、前記突然変異は、A、U、G又はCで置換される。
【0125】
いくつかの実施の形態では、ダイレクトリピート配列は、欠失を含む。
【0126】
いくつかの実施の形態では、欠失は、ダイレクトリピート配列のステムループ領域(例えば、R1領域、R2領域、R3領域、R4領域、R5領域)内にある。
【0127】
いくつかの実施の形態では、欠失は、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99又は100個のヌクレオチドを含む。
【0128】
いくつかの実施の形態では、欠失を含むステムループ領域は、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29又は30個の塩基対を保持する。
【0129】
いくつかの実施の形態では、欠失を含むステムループ領域は、多くとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29又は30個の塩基対を保持する。
【0130】
いくつかの実施の形態では、欠失を含むステムループ領域は、多くとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29又は30個の非A-U又は非G-Cミスマッチを含有する。
【0131】
いくつかの実施の形態では、ダイレクトリピート配列は、一つ又は複数のG-C又はC-G塩基対で一つ又は複数の熱力学的に不安定な塩基対を置換することを含む。
【0132】
いくつかの実施の形態では、熱力学的に不安定な塩基対は、A-U又はU-A塩基対、A-G又はG-A塩基対、又はU-G又はG-U塩基対である。
【0133】
いくつかの実施の形態では、熱力学的に不安定な塩基対は、ダイレクトリピート配列のステムループ領域のステム内にある。
【0134】
いくつかの実施の形態では、熱力学的に不安定な塩基対は、ステムループ領域のステムとループの両方に共通する塩基対から始まり、且つ前記塩基対の1番目、2番目、3番目、4番目、5番目、6番目、7番目、8番目、9番目、10番目、11番目、12番目、13番目、14番目、15番目、16番目、17番目、18番目、19番目、20番目、21番目、22番目、23番目、24番目、25番目、26番目、27番目、28番目、29番目又は30番目の塩基対を含む。
【0135】
いくつかの実施の形態では、前記ダイレクトリピート配列は、
(1)SEQ ID NO:501~507のうちのいずれか一つに示すとおりであり、
(2)SEQ ID NO:501~507のうちのいずれか一つのポリヌクレオチド配列を含み、又は、
(3)SEQ ID NO:501~507のうちのいずれか一つのポリヌクレオチド配列と少なくとも約60%(例えば、少なくとも約65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%又は100%)の配列同一性を有するポリヌクレオチド配列を含む。
【0136】
いくつかの実施の形態では、前記標的配列は、標的遺伝子の少なくとも約16個の連続したヌクレオチド、例えば、標的遺伝子の約16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69又は70個の連続したヌクレオチド、又はいずれか二つの前記値の間の数値範囲を含み、例えば、標的遺伝子の約16から約50個の連続したヌクレオチドは、基本的にそれによって構成されるか、又はそれによって構成される。
【0137】
いくつかの実施の形態では、前記標的配列の長さは、少なくとも約16個のヌクレオチドであり、例えば長さは、約16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69又は70個のヌクレオチドであり、又は長さは、いずれか二つの前記値の間の数値範囲にあり、例えば、長さは、約16から約50個のヌクレオチドである。
【0138】
いくつかの実施の形態では、前記プロトスペーサー配列は、標的遺伝子の少なくとも約16個の連続したヌクレオチド、例えば、標的遺伝子の約16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69又は70個の連続したヌクレオチド、又はいずれか二つの前記値の間の数値範囲を含み、例えば、標的遺伝子の約16から約50個の連続したヌクレオチドは、基本的にそれによって構成されるか、又はそれによって構成される。
【0139】
いくつかの実施の形態では、前記プロトスペーサー配列の長さは、少なくとも約16個のヌクレオチドであり、例えば長さは、約16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69又は70個のヌクレオチドであり、又は長さは、いずれか二つの前記値の間の数値範囲にあり、例えば、長さは、約16から約50個のヌクレオチドである。
【0140】
いくつかの実施の形態では、前記標的配列は、前記標的配列5’にあるプロトスペーサー隣接モチーフ(PAM)配列を含む。
【0141】
いくつかの実施の形態では、前記標的配列は、標的配列と逆相補的なプロトスペーサー配列5’のプロトスペーサー隣接モチーフ(PAM)配列を含む。
【0142】
いくつかの実施の形態では、前記スペーサー配列の長さは、少なくとも約16個のヌクレオチドであり、例えば長さは、約16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69又は70個のヌクレオチドであり、又は長さは、いずれか二つの前記値の間の数値範囲にあり、例えば、長さは、約16から約50個のヌクレオチドである。
【0143】
いくつかの実施の形態では、スペーサー配列は、標的配列に対して約90%~100%相補的であり、及び/又は標的配列に対して1、2、3、4又は5個を超えないミスマッチを含む。
【0144】
いくつかの実施の形態では、前記ガイドRNAは、複数の標的配列とそれぞれハイブリダイズ可能な複数の(例えば、2、3、4、5個又はそれ以上)スペーサー配列を含む。
【0145】
いくつかの実施の形態では、前記複数の標的配列は、同一のポリヌクレオチド上にあるか、又は単独のポリヌクレオチド上にある。
【0146】
いくつかの実施の形態では、前記スペーサー配列は、SEQ ID NO:82~125、130、131~381、382、391、398~438のうちのいずれか一つの少なくとも16個の連続したヌクレオチドを含む。
【0147】
いくつかの実施の形態では、dsDNAは、細胞内にある。
【0148】
ある態様によれば、本開示は、ポリヌクレオチドを提供し、前記ポリヌクレオチドは、本開示のCas12iポリペプチド又は融合タンパク質をコードする。
【0149】
ある態様によれば、本開示は、ポリヌクレオチドを提供し、前記ポリヌクレオチドは、本開示のガイドRNAをコードする。
【0150】
いくつかの実施の形態では、前記ポリヌクレオチドは、真核(例えば、哺乳動物、例えばヒト)細胞において発現するようにコドンによって最適化される。
【0151】
いくつかの実施の形態では、前記ポリヌクレオチドは、ポリデオキシリボヌクレオチド又はポリリボヌクレオチドである。
【0152】
いくつかの実施の形態では、前記ポリヌクレオチドの一つ又は複数のヌクレオチドは、修飾されている。
【0153】
ある態様によれば、本開示は、システム又は組成物を提供し、前記システム又は組成物は、
(1)Cas12iポリペプチド、又は前記Cas12iポリペプチドと機能ドメインとを含む融合タンパク質、又は前記Cas12iポリペプチド又は前記融合タンパク質をコードするポリヌクレオチド、及び
(2)ガイドRNA(「CRISPR RNA」又は「crRNA」とも呼ばれる)、又は前記ガイドRNAをコードするポリヌクレオチドを含み、前記ガイドRNAは、
(i)前記Cas12iポリペプチド又は前記融合タンパク質と複合体を形成できるダイレクトリピート配列と、
(ii)標的dsDNAの標的鎖上の標的配列にハイブリダイズすることによって、前記複合体を前記標的dsDNAに導くことができるスペーサー配列とを含む。
【0154】
いくつかの実施の形態では、前記システム又は組成物は、天然に存在しない、操作されたシステム又は組成物である。
【0155】
いくつかの実施の形態では、前記Cas12iポリペプチド又は前記融合タンパク質は、本開示のCas12iポリペプチド又は融合タンパク質である。
【0156】
いくつかの実施の形態では、前記ガイドRNAは、本開示のガイドRNAである。
【0157】
いくつかの実施の形態では、前記ダイレクトリピート配列は、本開示のダイレクトリピート配列である。
【0158】
いくつかの実施の形態では、前記スペーサー配列は、本開示のスペーサー配列である。
【0159】
いくつかの実施の形態では、前記システム又は組成物は、誘導システム、例えばTMP、DOX、Degronをさらに含む。
【0160】
いくつかの実施の形態では、前記誘導システムは、誘導要素を含む融合タンパク質を活性化することができる誘導剤を含む。
【0161】
いくつかの実施の形態では、前記誘導システムは、Cas12iポリペプチド、又は誘導要素を含む融合タンパク質の発現を活性化することができる誘導剤を含む。
【0162】
いくつかの実施の形態では、前記システム又は組成物は、転写活性化ドメインを含む融合タンパク質を活性化することができる活性化剤を含む。
【0163】
いくつかの実施の形態では、コード配列は、DNAコード配列又はRNAコード配列である。
【0164】
いくつかの実施の形態では、前記システム又は組成物は、セリン又はチロシンリコンビナーゼをさらに含む。
【0165】
いくつかの実施の形態では、前記システム又は組成物は、ドナー構築体をさらに含み、前記ドナー構築体は、標的dsDNAに挿入するためのドナーポリヌクレオチドを含み、且つ非LTR逆転写トランスポゾンタンパク質と複合体を形成できる二つの結合要素の間に位置する。
【0166】
いくつかの実施の形態では、前記Cas12iポリペプチドは、非LTR逆転写トランスポゾンタンパク質のN-末端に融合される。
【0167】
いくつかの実施の形態では、前記Cas12iポリペプチドは、ニッカーゼである。
【0168】
いくつかの実施の形態では、前記ガイドRNAは、融合タンパク質をターゲッティング挿入部位5’の標的配列に導き、且つ、ここで、前記Cas12iポリペプチドは、ターゲッティング挿入部位に二本鎖切断を生成する。
【0169】
いくつかの実施の形態では、前記ガイドRNAは、融合タンパク質をターゲッティング挿入部位5’又は3’の標的配列に導き、且つ、ここで、前記Cas12iポリペプチドは、ターゲッティング挿入部位に二本鎖切断を生成する。
【0170】
いくつかの実施の形態では、ドナーポリヌクレオチドは、ドナーポリヌクレオチド配列の5’末端又は3’末端の加工を促進するためのポリメラーゼ加工要素をさらに含む。
【0171】
いくつかの実施の形態では、ドナーポリヌクレオチドは、ドナー構築体の5’末端、ドナー構築体の3’末端又は両末端上の標的配列の相同領域をさらに含む。
【0172】
いくつかの実施の形態では、相同領域は、8から25個の塩基対である。
【0173】
ある態様によれば、本開示は、ベクターを提供し、前記ベクターは、本開示のCas12iポリペプチド又は融合タンパク質をコードするポリヌクレオチドを含む。
【0174】
いくつかの実施の形態では、前記ポリヌクレオチドは、プロモーターに動作可能に連結される。
【0175】
ある態様によれば、本開示は、ベクターを提供し、前記ベクターは、本開示のガイドRNAをコードするポリヌクレオチドを含む。
【0176】
いくつかの実施の形態では、前記ポリヌクレオチドは、プロモーターに動作可能に連結される。
【0177】
ある態様によれば、本開示は、ベクターを提供し、前記ベクターは、本開示のCas12iポリペプチド又は融合タンパク質をコードするポリヌクレオチドと、本開示のガイドRNAをコードするポリヌクレオチドとを含む。
【0178】
いくつかの実施の形態では、本開示のCas12iポリペプチド、又は融合タンパク質をコードするポリヌクレオチド及び本開示のガイドRNAをコードするポリヌクレオチドは、同一のプロモーターに動作可能に連結される。
【0179】
いくつかの実施の形態では、本開示のCas12iポリペプチド又は融合タンパク質をコードするポリヌクレオチド及び本開示のガイドRNAをコードするポリヌクレオチドは、それぞれプロモーターに動作可能に連結される。
【0180】
いくつかの実施の形態では、プロモーターは、広域スペクトルプロモーター、組織特異的プロモーター、細胞種特異的プロモーター、構成的プロモーターと誘導的プロモーターから選択される。
【0181】
いくつかの実施の形態では、プロモーターは、(ヒト)U6プロモーター(例えばSEQ ID NO:446)、エロンゲーションファクター1αショート(EFS)プロモーター、(ヒト)Cbhプロモーター、MHCK7プロモーター、Cbaプロモーター、pol Iプロモーター、pol IIプロモーター、pol IIIプロモーター、T7プロモーター、H1プロモーター、レトロウイルスラウス肉腫ウイルスLTRプロモーター、(ヒト)サイトメガロウイルス(CMV)プロモーター(例えばSEQ ID NO:447)、SV40プロモーター、ジヒドロ葉酸還元酵素プロモーター、β-アクチンプロモーター、βグルクロニダーゼ(GUSB)プロモーター、サイトメガロウイルス(CMV)前初期(Ie)エンハンサー及び/又はプロモーター、ニワトリβ-アクチン(CBA)プロモーター又はその誘導体、例えばCAGプロモーター(例えばSEQ ID NO:500)、CBプロモーター、(ヒト)エロンゲーションファクター1α-サブユニット(EF1α)プロモーター、ユビキチンC(UBC)プロモーター、プリオンプロモーター、ニューロン特異的エノラーゼ(NSE)プロモーター、ニューロフィラメント軽鎖(NFL)プロモーター、ニューロフィラメント重鎖(NFH)プロモーター、血小板由来増殖因子(PDGF)プロモーター、血小板由来増殖因子B鎖(PDGF-β)プロモーター、シナプシン(Syn)プロモーター、シナプシン1(Syn1)プロモーター、メチル-CpG結合ポリペプチド2(MeCP2)プロモーター、Ca2+/カルモジュリン依存性ポリペプチドキナーゼII(CaMKII)プロモーター、代謝型グルタミン酸受容体2(mGluR2)プロモーター、β-グロビン ミニ遺伝子nβ2プロモーター、プレプロエンケファリン(PPE)プロモーター、エンケファリン(Enk)プロモーター、興奮性アミノ酸トランスポーター2(EAAT2)プロモーター、グリア原線維酸性ポリペプチド(GFAP)プロモーターとミエリン塩基性ポリペプチド(MBP)プロモーターから選択されるプロモーターを含むか又はそれである。
【0182】
いくつかの実施の形態では、本開示のCas12iポリペプチド又は融合タンパク質をコードするポリヌクレオチドは、本開示のガイドRNAをコードするポリヌクレオチドの5’又は3’にある。
【0183】
いくつかの実施の形態では、前記ベクターは、プラスミドである。
【0184】
いくつかの実施の形態では、前記ベクターは、ウイルスベクターである。
【0185】
いくつかの実施の形態では、前記ベクターは、レトロウイルスベクター、ファージベクター、アデノウイルスベクター、単純ヘルペスウイルス(HSV)ベクター、AAVベクター又はレンチウイルスベクターである。
【0186】
いくつかの実施の形態では、AAVベクターは、DNAカプシド化AAVベクター又はRNAカプシド化AAVベクターである。
【0187】
いくつかの実施の形態では、AAVベクターは、カプシドを含み、カプシドの血清型は、AAV1、AAV2、AAV3、AAV3A、AAV3B、AAV4、AAV5、AAV6、AAV7、AAVrh74、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13、AAV-DJ、AAV.PHP.eB(AAV1-AAV13のうちのいずれか一つが属するクレードのメンバー)又はその機能切断変異体又は機能突然変異体である。
【0188】
ある態様によれば、本開示は、組換えAAV(rAAV)粒子を提供し、前記rAAV粒子は、本開示のベクターを含む。
【0189】
いくつかの実施の形態では、rAAV粒子は、カプシドを含み、カプシドの血清型は、AAV1、AAV2、AAV3、AAV3A、AAV3B、AAV4、AAV5、AAV6、AAV7、AAVrh74、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13、AAV-DJ、AAV.PHP.eB(AAV1-AAV13のうちのいずれか一つが属するクレードのメンバー)、その機能切断変異体又はその機能突然変異体であり、それによってベクターをカプシド化する。
【0190】
ある態様によれば、本開示は、脂質ナノ粒子(LNP)を提供し、前記脂質ナノ粒子(LNP)は、本開示のCas12iポリペプチド、又は融合タンパク質と本開示のガイドRNAをコードするポリヌクレオチドを含む。
【0191】
いくつかの実施の形態では、本開示のCas12iポリペプチド又は融合タンパク質をコードするポリヌクレオチドは、mRNA形式である。
【0192】
いくつかの実施の形態では、Cas12iポリペプチド又は融合タンパク質をコードするポリヌクレオチドは、5’UTRを含む。
【0193】
いくつかの実施の形態では、Cas12iポリペプチド又は融合タンパク質をコードするポリヌクレオチドは、3’polyA尾部を含む。
【0194】
ある態様によれば、本開示は、標的dsDNAを修飾するための方法を提供し、前記方法は、標的dsDNAを本開示のシステム、ベクター、rAAV粒子又はLNPに接触させることを含み、ここで、前記スペーサー配列は、前記標的dsDNAの標的鎖の標的配列にハイブリダイズ可能であり、ここで、前記標的配列は、前記複合体によって修飾される。
【0195】
ある態様によれば、本開示は、本開示のシステム、ベクター、rAAV粒子又はLNPの、標的dsDNAを修飾するための薬剤の製造における用途を提供し、ここで、前記スペーサー配列は、前記標的dsDNAの標的鎖の標的配列にハイブリダイズ可能であり、ここで、前記標的配列は、前記複合体によって修飾される。
【0196】
ある態様によれば、本開示は、標的dsDNAの修飾に使用される本開示のシステム、ベクター、rAAV粒子又はLNPを提供し、ここで、前記スペーサー配列は、前記標的dsDNAの標的鎖の標的配列にハイブリダイズ可能であり、ここで、前記標的配列は、前記複合体によって修飾される。
【0197】
いくつかの実施の形態では、前記標的dsDNAは、ヒトTRAC遺伝子である。
【0198】
いくつかの実施の形態では、前記スペーサー配列は、SEQ ID NO:123~125のうちのいずれか一つの連続したヌクレオチドを少なくとも含む。
【0199】
ある態様によれば、本開示は、細胞又はその後代を提供し、前記細胞又はその後代は、本開示のCas12iポリペプチド、融合タンパク質、ガイドRNA、システム、ポリヌクレオチド、ベクター、rAAV粒子及び/又はLNPを含む。
【0200】
ある態様によれば、本開示は、修飾された細胞又はその後代を提供し、ここで、前記修飾された細胞は、本開示の方法によって修飾される。
【0201】
いくつかの実施の形態では、前記細胞は、インビボ、エクスビボ又はインビトロである。
【0202】
いくつかの実施の形態では、細胞は、真核細胞(例えば、動物細胞、脊椎動物細胞、哺乳動物細胞、非ヒト哺乳動物細胞、非ヒト霊長類動物細胞、げっ歯動物(例えば、マウス又はラット)細胞、ヒト細胞、植物細胞又は酵母細胞)又は原核細胞(例えば、細菌細胞)である。
【0203】
いくつかの実施の形態では、前記細胞は、培養された細胞、単離された初代細胞又は生体内の細胞である。
【0204】
いくつかの実施の形態では、前記細胞は、T細胞(例えば、CAR-T細胞)、B細胞、NK細胞(例えば、CAR-NK細胞)、又は幹細胞(例えば、iPS細胞、HSC細胞)である。
【0205】
いくつかの実施の形態では、前記細胞は、被験体に由来するか又は前記被験体とは異種である。
【0206】
ある態様によれば、本開示は、宿主を提供し、前記宿主は、本開示の細胞又はその後代を含む。
【0207】
いくつかの実施の形態では、前記宿主は、非ヒト動物又は植物である。
【0208】
いくつかの実施の形態では、前記非ヒト動物は、ヒト遺伝性障害に対する動物(例えば、げっ歯動物又は非ヒト霊長類動物)モデルである。
【0209】
いくつかの態様によれば、本開示は、(例えば、医薬)組成物を提供し、前記組成物は、本開示のCas12iポリペプチド、融合タンパク質、ガイドRNA、ポリヌクレオチド、システム、ベクター、rAAV粒子、LNP及び/又は細胞又はその後代を含む。
【0210】
いくつかの実施の形態では、前記組成物は、薬学的に許容可能な賦形剤を含む。
【0211】
いくつかの実施の形態では、前記組成物は、ナノ粒子、例えば脂質ナノ微粒子、リポソーム、エキソソーム、微小胞、核酸(例えば、DNA)ナノアセンブリ、遺伝子銃又は植え込み可能な装置を介して送達するために調製される。
【0212】
ある態様によれば、本開示は、送達システムを提供し、前記送達システムは、
(1)送達媒体(vehicle)と、
(2)本開示のCas12iポリペプチド、融合タンパク質、ガイドRNA、ポリヌクレオチド、システム、ベクター、rAAV粒子、LNP、細胞又はその後代、及び/又は組成物とを含む。
【0213】
いくつかの実施の形態では、送達媒体は、ナノ粒子、例えば脂質ナノ粒子、リポソーム、エキソソーム、微小胞、核酸(例えば、DNA)ナノアセンブリ、遺伝子銃又は植え込み可能な装置である。
【0214】
ある態様によれば、本開示は、キットを提供し、前記キットは、本開示のCas12iポリペプチド、融合タンパク質、ガイドRNA、ポリヌクレオチド、システム、ベクター、rAAV粒子、LNP、細胞又はその後代、組成物及び/又は送達システムを含む。
【0215】
いくつかの実施の形態では、前記キットは、標的dsDNAを修飾するための説明書をさらに含む。
【0216】
ある態様によれば、本開示は、被験体の疾患又は障害を診断、予防又は治療するための方法を提供し、前記方法は、被験体に(例えば、有効量の)本開示のシステム、ベクター、rAAV粒子、LNP、細胞又はその後代、組成物、送達システム、及び/又はキットを投与することを含む。
【0217】
ある態様によれば、本開示は、(例えば、有効量の)本開示のシステム、ベクター、rAAV粒子、LNP、細胞又はその後代、組成物、送達システム、及び/又はキットの、被験体の疾患又は障害を診断、予防又は治療するための薬物又はキットの製造における用途を提供する。
【0218】
ある態様によれば、本開示は、(例えば、有効量の)本開示のシステム、ベクター、rAAV粒子、LNP、細胞又はその後代、組成物、送達システム、及び/又はキットの、被験体の疾患又は障害の診断、予防又は治療における使用を提供する。
【0219】
いくつかの実施の形態では、前記疾患又は障害は、被験体における標的dsDNAの歪みに関連する。
【0220】
いくつかの実施の形態では、前記スペーサー配列は、標的dsDNAの標的鎖の標的配列にハイブリダイズ可能であり、ここで、標的dsDNAの歪みは、前記複合体によって修飾される。
【0221】
いくつかの実施の形態では、前記方法又は用途は、被験体に有効量の同じ組換えドナーテンプレートを投与することをさらに含み、前記同じ組換えドナーテンプレートは、標的dsDNAに挿入するためのドナー配列を含み、ここで、前記ドナー配列の挿入は、標的dsDNAの歪みを修正する。
【0222】
いくつかの実施の形態では、修飾された細胞又はその後代によって疾患又は障害を予防又は治療する。
【0223】
いくつかの実施の形態では、前記疾患又は障害は、TTR関連疾患又は障害、例えばATTRである。
【0224】
いくつかの実施の形態では、前記スペーサー配列は、SEQ ID NO:107の少なくとも16個の連続したヌクレオチドを含む。
【0225】
いくつかの実施の形態では、前記疾患又は障害は、PCSK9関連疾患又は障害である。
【0226】
いくつかの実施の形態では、前記スペーサー配列は、SEQ ID NO:122の少なくとも16個の連続したヌクレオチドを含む。
【0227】
いくつかの実施の形態では、前記システムは、同じ組換えドナーテンプレートをさらに含み、前記同じ組換えドナーテンプレートは、標的dsDNAに挿入するためのドナー配列を含む。
【0228】
いくつかの実施の形態では、前記の、複合体を標的dsDNAに導くことは、複合体と標的dsDNAとの結合を引き起こす。
【0229】
いくつかの実施の形態では、前記の、複合体を標的dsDNAに導くことは、標的dsDNAの修飾を引き起こす。
【0230】
いくつかの実施の形態では、標的dsDNAの修飾は、標的dsDNAの二本鎖切断(DSB)を含む。
【0231】
いくつかの実施の形態では、DSBは、欠失及び/又は挿入突然変異(挿入欠失突然変異)を生じる。
【0232】
いくつかの実施の形態では、挿入欠失突然変異は、標的dsDNAの転写及び/又は発現を修飾する。
【0233】
いくつかの実施の形態では、ドナーDNAテンプレートは、DSBの部位に挿入される。
【0234】
いくつかの実施の形態では、標的dsDNAの修飾は、標的dsDNAの標的鎖の標的配列の一本鎖切断(SSB)を含む。
【0235】
いくつかの実施の形態では、dsDNAの修飾は、標的配列と逆相補的なプロトスペーサー配列の一つ又は複数のヌクレオチドの置換を含む。
【0236】
いくつかの実施の形態では、置換は、AからTへの置換、AからGへの置換、AからCへの置換、CからAへの置換、CからTへの置換、CからGへの置換、TからAへの置換、TからGへの置換、TからCへの置換、GからAへの置換、GからTへの置換及び/又はGからCへの置換である。
【0237】
いくつかの実施の形態では、dsDNAの修飾は、標的dsDNAの非標的鎖の一本鎖切断(SSB)を含む。
【0238】
いくつかの実施の形態では、dsDNAの修飾は、非標的鎖の一つ又は複数のヌクレオチドの挿入、欠失及び/又は置換を含む。
【0239】
いくつかの実施の形態では、前記修飾は、a.一つ又は複数の塩基編集を導入すること、b.早期停止コドンを修正又は導入すること、c.スプライス部位を破壊すること、d.スプライス部位を挿入又は回復すること、e.標的ポリヌクレオチドの一つ又は二つの対立遺伝子に遺伝子又は遺伝子断片を挿入すること、又はf.その組み合わせである。
【0240】
いくつかの実施の形態では、前記複合体は、逆転写酵素ドメインを標的配列に導き、且つ逆転写酵素は、ドナー配列のガイドRNAから標的dsDNAへの挿入を促進する。
【0241】
いくつかの実施の形態では、前記ドナー配列の挿入は、a.一つ又は複数の塩基編集を導入すること、b.早期停止コドンを修正又は導入すること、c.スプライス部位を破壊すること、d.スプライス部位を挿入又は回復すること、e.標的ポリヌクレオチドの一つ又は二つの対立遺伝子に遺伝子又は遺伝子断片を挿入すること、又はf.その組み合わせである。
【0242】
いくつかの実施の形態では、前記複合体は、非LTR逆転写トランスポゾンタンパク質を標的配列に導き、且つ非LTR逆転写トランスポゾンタンパク質は、ドナーポリヌクレオチド配列のドナー構築体から標的dsDNAへの挿入を促進する。
【0243】
いくつかの実施の形態では、前記ドナー配列の挿入は、a.一つ又は複数の塩基編集を導入すること、b.早期停止コドンを修正又は導入すること、c.スプライス部位を破壊すること、d.スプライス部位を挿入又は回復すること、e.標的ポリヌクレオチドの一つ又は二つの対立遺伝子に遺伝子又は遺伝子断片を挿入すること、又はf.その組み合わせである。
【0244】
いくつかの実施の形態では、前記の、複合体を標的dsDNAに導くことは、標的dsDNAの転写修飾を引き起こす。
【0245】
いくつかの実施の形態では、転写された修飾は、上方制御された転写、下方制御された転写、活性化された転写又は阻害された転写である。
【0246】
いくつかの実施の形態では、標的dsDNAの修飾は、標的dsDNAの一つ又は複数のヌクレオチドのメチル化又は脱メチル化を含む。
【0247】
提示される例示的な実施の形態の以下の詳細な記述を考慮することによって、当業者にとって、例示的な実施の形態のこれらと他の態様、目的、特徴と利点は、明らかになる。
【0248】
理解すべきこととして、本明細書に記述されている本開示のいずれか一つの実施の形態は、実施例もしくは特許請求の範囲のみ、又は以下の一つの態様/部分のみに記述されているそれらの実施の形態を含み、明示的に否定され、又は不当であるとみなされない限り、本開示の他の任意の一つ又は複数の実施の形態と組み合わせることができる。
以下の詳細な記述と図面を参照することにより、本開示のいくつかの特徴と利点に対する理解を得、以下の詳細な記述は、本開示の原理を利用し得る説明的実施の形態を述べており、且つこれらの図面において以下を示す。
【図面の簡単な説明】
【0249】
図1図1は、xCas12iの操作された変異体hfCas12Maxが、効率的かつ高度に特異的なゲノム編集を媒介し、且つdCas12i塩基エディタが哺乳動物細胞において高い塩基編集活性を示した、ことを示す。A、フローサイトメトリーによって決定されるxCas12i媒介性EGFP活性化効率である。NCは、非特異性(非ターゲッティング)対照を表す。B、オンターゲットとオフターゲットcrRNAを有する活性化可能なEGFPレポータースクリーニングシステムを用いて、高効率と高忠実度で突然変異体に対して行ったタンパク質操作戦略の概略図である。C-D、Cas12Maxは、レポータープラスミド(C)又は様々なゲノム(D)標的部位にxCas12iよりも著しく増加した切断活性を示す。各点は、一つのターゲッティング部位における平均挿入欠失頻度(n=3)を表す。E、NGS分析により、hfCas12MaxがTTR.2-ONターゲットでCas12Maxと同等な活性を保持し、且つ6個のOT部位でほとんど活性がないことを示す。F、Cas12MaxとhfCas12Maxの両方は、いずれも他のCasタンパク質よりも広いPAM認識スペクトルを示し、5’-TNと5’-TNN PAMとを含む。G、TTR遺伝子座におけるCas12Max、hfCas12Max、LbCas12a、Ultra AsCas12a、SpCas9とKKH-saCas9の挿入欠失活性の比較である。hfCas12Maxは、Cas12Maxと同等な活性を保持し、且つ他のCasタンパク質よりも高い遺伝子編集効率を保持する。各点は、単一の標的部位の三つの繰り返しの一つを表す。H、異なるバージョンのdxCas12iアデニン塩基エディタの概略図である。I、TadA8e.1-dxCas12i-v1.2、v2.2とv4.3の、KLF4部位におけるAからG編集頻度と生成物純度の比較であり、v4.3は、80%の高い編集活性を示す。TadA8e-dxCas12i-v4.3は、ABE-dCas12Maxと命名される。TadA8e.1は、TadA8e V106Wを表す。J、異なるバージョンのdxCas12iシトシン塩基エディタの概略図である。K、hA3A.1-dxCas12i-v1.2、v2.2とv3.1の、DYRK1A部位におけるCからT編集頻度と生成物純度の比較であり、v3.1は、50%の高い編集活性を示す。hA3A.1-dxCas12i-v3.1は、CBE-dCas12Maxと命名される。hA3A.1は、ヒトAPOBEC3A W104Aを表す。
図2図2は、hfCas12Maxがエクスビボとインビボの高効率遺伝子編集を媒介することを示す。A、初代ヒト細胞におけるhfCas12Max遺伝子編集の概略図である。B、それぞれ1.6μMと3.2μMで三種類の異なるターゲッティングTRACを有するcrRNAのhfCas12Max RNPを送達した後のヒトCD3+ T細胞の活力と挿入欠失活性(n=2又は3)である。NCは、RNPで処理されていないブランク対照を表す。C、RNP送達から5日後の編集されたCD3+ T細胞の代表的なフローサイトメトリー分析である。NCは、RNPで処理されていないブランク対照を表す。D、IVT-mRNAを含有するインビボ非リポソーム送達、LNPパッケージングプロセスの概略図である。E、N2a細胞に濃度を増加させるhfCas12Max mRNAとTtr crRNAを標的とするLNPがパッケージングされている編集効率(n=8)である。F、Ttr遺伝子座の概略図である。G、C57マウスに三つの投与量(0.1、0.3と0.5mpk)のhfCas12Max mRNAとTtr crRNAを標的とするLNPがパッケージングされている挿入欠失率(n=6)である。H、C57マウスに3mpkのdCas12i-ABE mRNAとTtr crRNAを標的とするLNPがパッケージングされているAからG編集百分率(n=2)である。
図3図3は、HEK293T細胞における機能性Cas12iのスクリーニングを示す。A、Cas12iとcrRNAをコードするプラスミドのトランスフェクションは、EGFP活性化を媒介する。B、10種類のCas12iヌクレアーゼのうちの5種類は、HEK293T細胞におけるEGFP活性化効率を媒介する。
図4図4は、V-I型システムの同定と特徴付けを示す。A、SpCas9、LbCas12aとxCas12iのヌクレアーゼドメイン組織である。B、xCas12iの有効スペーサー配列長さである。C、LbCas12aとxCas12iのPAM範囲の比較である。xCas12iは、5’-TTN PAMにおいてCas12aよりも高いdsDNA切断活性を示す。D、xCas12iとターゲッティングgRNAを含有する一体化プラスミドをHEK293T細胞にトランスフェクションし、次にFACSとNGS分析を行うことによってゲノム切断活性を検出するフローチャートである。E-F、xCas12iは、N2a細胞におけるTtr遺伝子座及びHEK293T細胞におけるTTRとPCSK9において頑強なゲノム切断を媒介する(90%と高い)。
図5図5は、増加したdsDNA切断活性を有する、操作されたxCas12i突然変異体のスクリーニングを示す。A、500種類を超える、合理的に操作されたxCas12i突然変異体の相対的なdsDNA切断活性である。v1.1は、N243Rを有するxCas12iを表し、Cas12Maxと命名される。
図6図6は、他の突然変異体によって媒介される高効率編集を示す。A、N243の飽和突然変異体において、N243Rは、EGFP活性化の蛍光を最も多く増加させる。B-C、N243Rを有するxCas12i突然変異体は、DMD.1、DMD.2とDMD.3遺伝子座において1.2、5、20倍の活性を増加させた。D、Cas12Max(xCas12i-N243R)とCas12Max-E336Rとの両方は、異なるPAM認識部位においてEGFP活性化蛍光を上昇させる。
図7図7は、Cas12Maxがレポーターシステム(A)とターゲッティングディープ配列(B)を用いて、ミスマッチを有する部位においてオフターゲットdsDNA切断活性を誘導した、ことを示す。
図8図8は、hfCas12Maxが効率的で高度に特異的な編集を媒介することを示す。A、高忠実度Cas12Maxの200種類を超える突然変異体の合理的なタンパク質操作されたスクリーニングである。4種類の突然変異体は、OT(オフターゲット)部位において著しく低減させた活性を示し、ON.1(オンターゲット)部位において活性を維持する。B、異なるバージョンのxCas12i突然変異体である。C、v1.1-Cas12Maxと比べて、v6.3は、OT.1、OT.2とOT.3部位におけるオフターゲットを減少させ、且つTTR-ONターゲットにおける挿入欠失活性を保持する。D、v6.3は、DMD.1、DMD.2遺伝子座においてv1.1-Cas12Maxと同等な挿入欠失活性を示し、且つDMD.3遺伝子座においてより高い挿入欠失活性を示す。v1.1は、Cas12Maxと命名される。v6.3は、hfCas12Maxと命名される。
図9図9は、hfCas12MaxとLbCas12a、Ultra AsCas12a、SpCas9とKKH-saCas9の、TTR遺伝子座における遺伝子編集効率の比較を示す。
図10図10は、hfCas12Maxが効率的で高度に特異的な編集を媒介したことを示す。A-B、hfCas12Max、LbCas12aとUltraAsCas12aのコンピュータによって予測されるオフターゲット部位におけるオフターゲット効率は、ターゲッティングディープシーケンシングによって決定される。オンターゲット部位と予測オフターゲット部位の配列を示しており、PAM配列は、青色を呈し、且つミスマッチ塩基は、赤色を呈する。
図12図12は、Cas12iの保存的切断部位を示す。A、xCas12i、Cas12i1とCas12i2の配列比較は、D650、D700、E875とD1049がRuvCドメインにおいて保存的切断部位であることを示す。B、D650A、E875AとD1049Aの点突然変異を導入することにより、xCas12iの活性が消失される。
図13-1】図13は、効率的なdxCas12i-ABEを操作することを示す。A、TadA8e.1-dxCas12iの操作された概略図である。操作された四つの部分を指示した。
図13-2】図13は、効率的なdxCas12i-ABEを操作することを示す。A、TadA8e.1-dxCas12iの操作された概略図である。操作された四つの部分を指示した。B、様々な変異体において、TadA8e.1-dxCas12i-v1.2とv1.3は、ゲノムのKLKF4部位において著しく増加したAからG編集活性を示す。C、v1.2とv1.3を組み合わせることにより、TadA8e-dxCas12i-v2.2のAからG編集活性を増加させる。D、N末端に異なるNLSを担持する様々なdCas12-ABEと比べて編集活性が改変していないか又はひいては低減している。E、v2.2、NLS改変リンカーと高活性Tade8eを組み合わせることにより、TadA8e-dxCas12i-v4.3のAからG編集活性を増加させる。
図14図14は、効率的なdxCas12i-ABEの他の戦略を示す。A、異なるバージョンのdxCas12iアデニン塩基エディタの概略図である。B、dCas12のC末端にTadAを結合したdxCas12i-ABE-Nは、わずかに編集活性を増加させる。
図15図15は、異なるゲノム標的部位において様々なdCas12-ABEによって誘導される編集頻度の比較を示す。A-B、PCSK9とTTR遺伝子座において指示されるTadA8e.1-dxCas12i-v1.2、v2.2とTadA8e.1-dLbCas12aによって導入されるAからG編集頻度の比較である。
図16図16は、HEK293T細胞におけるdxCas12i-ABEの特徴付けを示す。A-C、TTN(A)、ATN(B)とCTN(C)PAMを有する各標的部位のdCas12Max-ABE塩基編集である。D、AのTTN PAMを有する各標的部位のdCas12Max-ABE塩基編集生成物純度である。標的部位を指示しており、各標的プロトスペーサー領域とPAMの配列は、補足表4に示される。
図17図17は、異なるゲノム標的部位において様々なdCas12-CBEによって誘導される編集頻度の比較を示す。A-B、DYRK1Aと部位4遺伝子座において指示されるhA3A.1-dxCas12i、v1.2、v2.2とhA3A.1-dCas12aによって誘導されるCからT編集頻度と生成物純度の比較である。hA3A.1は、ヒトAPOBEC3A-W104Aを表す。
図18図18は、hfCas12MaxがHEK293細胞において高い編集効率を媒介することを示す。A-C、増加濃度下でターゲッティングTTR又はTRAC crRNAを有するhfCas12Max RNPを送達した後のHEK293細胞の活力と増殖が改変しておらず、且つ挿入欠失活性が増加する(n=1)。
図19図19は、hfCas12Maxがマウス胚盤胞において高い編集効率を媒介することを示す。A、マウス胚盤胞におけるhfCas12Max遺伝子編集の概略図である。hfCas12Max mRNAとターゲッティングTtr crRNAをマウス受精卵に注射し、注射された受精卵を胚盤胞段階まで培養し、ターゲッティングディープシーケンシングによる遺伝子型分析に用いる。B、マウス胚盤胞におけるTtr.3とTtr.12を標的とするhfCas12Maxの挿入欠失率(n=12)である。
図20図20は、CRISPR-Cas12iシステムのガイドRNAと標的dsDNAとの相互作用を示す。
図21図21は、様々なDR配列変異体を用いた時のxCas12iのdsDNA切断活性を示す。
【発明を実施するための形態】
【0250】
本明細書の図面は、説明のみを目的としており、且つ必ずしも比例して描かれているわけではない。
概要
本研究では、出願人は、V-I型Cas12iシステムが哺乳動物細胞において多用途かつ効率的なゲノム編集を実現できることを証明した。出願人は、TTN-PAM部位において高い編集効率を示すCas12i、xCas12i(本明細書で「SiCas12i」とも呼ばれる)を発見した。そのPI、REC、RuvCドメインの半合理的設計とタンパク質工学化により、出願人は、N243R、E336RとD892R置換を含有する高効率、高忠実度の変異体hfCas12Maxを取得した。重要な部位にアルギニンを導入することでCasとDNAとの間の結合を補強できるという仮説と一致して、PIドメインにN243Rを導入し、RECドメインにE336Rを導入することで、編集活性が著しく増加し、PAM認識が拡大された。興味深いことに、RuvCドメインにおけるD892R又はG883R置換は、オフターゲットを低減させ、オンターゲット切断活性を保持したが、オフターゲット活性を低減させるためのアラニン置換28,29は、そうではなかった(図S6C)。D892R置換hfCas12Maxは、ミスマッチに対して明らかにより敏感であり、これは、D892R又はG883RがsgRNA結合特異性を改善したことを示す。xCas12iとCas12i2の配列比較と予測構造によると、アスパラギン892をNUCドメイン上に位置させ、RuvCドメインとともに裂け目を形成し、crRNA:DNAヘテロ二本鎖は、該裂け目に位置する。D892Rを有する変異体は、オンターゲット活性を改変しないが、アスパラギンのアルギニン置換が非標的crRNAの結合に影響を与えている可能性があるため、オフターゲット活性を除去した。我々のデータは、EGFP活性化レポーターシステムに基づいてアルギニン置換の半合理的工学戦略は、CRISPR編集ツール活性を改善する汎用方法として利用できることを示している。
【0251】
工学化により、本開示のCas12iシステムは、高い編集活性、高い特異性と広いPAM範囲を実現しており、SpCas9と同等であり、且つ他のCas12システムよりも優れている。その比較的小さい寸法、比較的短いcrRNAガイドと自己加工特徴4,8,10を考慮すると、V-I型Cas12iシステムは、AAV30又はLNP12,13を含むインビボ多重遺伝子編集応用に適している。実際に、本開示のデータは、V-I型Cas12iシステムがそれぞれリボ核タンパク質(RNP)送達と脂質ナノリポソーム(LNP)送達を介して頑強なエクスビボ又はインビボゲノム編集効率を媒介することを指示し、それによって治療性ゲノム編集応用の巨大な潜在力を証明している。
【0252】
また、出願人は、すでにV-I型Cas12iシステムが塩基編集応用に利用できることを確認した。塩基エディタについて、dCas12iシステムは、KLF遺伝子座のA9-A11部位ひいてはA19部位においてAからGまでの高い編集を示し、且つA7-A10部位においてCからTまでの高い編集を示し、これは、dCas12aシステムに類似するが、dCas9/nCas9システムと異なる。dCas12aと同等にし、dCas12i-BEは、KLF4、PCSK9とDYRK1A遺伝子座においてより高い塩基編集活性(図1K図S13A図S15A)を示し、それによってそれが塩基エディタとしてより大きな潜在力を有することができることを示す。これは、dCas12iシステムが、エピゲノム編集、ゲノム活性化とクロマチンイメージングを含む広いゲノム工学応用に用いられてもよいことを示す1,31-34
【0253】
まとめると、ここで記述されるCas12iシステムは、頑強な編集活性と高い特異性を有し、哺乳動物細胞におけるゲノム編集又は塩基編集の多用途プラットフォームであり、且つ将来的にはインビボ又はエクスビボ治療性応用に利用可能である。
【0254】
Cas12iは、プログラマブルRNAによってガイドされるdsDNAエンドヌクレアーゼであり、それは、ガイドRNA(gRNA)と呼ばれる、スペーサー配列とダイレクトリピート配列とを含むプログラマブルRNAによってガイドされるように、標的dsDNA上で二本鎖切断(DSB)を産生することができる。理論に束縛されることは望ましくないが、ダイレクトリピート配列は、Cas12iと複合体を形成することを担当し、且つスペーサー配列は、標的dsDNAの標的配列にハイブリダイズすることによって、gRNAとCas12iの複合体を標的dsDNAに導くことを担当すると考えられる。
【0255】
図20を参照すると、標的dsDNAは、5’から3’の上向き鎖と3’から5’の下向き鎖とを含むように描かれる。ガイドRNAは、緑色のスペーサー配列とオレンジ色のダイレクトリピート配列とを含むように描かれる。スペーサー配列は、一部の下向き鎖にハイブリダイズするように設計されるため、スペーサー配列は、下向き鎖の一部を「標的とする」。そのため、下向き鎖は、標的dsDNAの「標的DNA鎖」又は「標的鎖(TS)」と呼ばれるが、上向き鎖は、標的dsDNAの「非標的DNA鎖」又は「非標的鎖(NTS)」と呼ばれる。スペーサー配列を設計する時に根拠となり、且つスペーサー配列がハイブリダイズできる標的鎖の部分は、「標的配列」と呼ばれるが、非標的鎖上の該部分の対応する部分は、「標的配列の逆相補配列」又は「逆相補配列」又は「プロトスペーサー配列」と呼ばれる。本開示の他の箇所と矛盾する場合、本段落の定義が優先される。
【0256】
特に明記しない限り、本発明は、当分野における化学、生化学、有機化学、分子生物学、微生物学、組換えDNA技術、遺伝学、免疫学、細胞生物学、幹細胞方案、細胞培養とトランスジェニック生物学の従来の方法を使用して実施され、これらの多くの方法は、説明の目的のために以下で説明される。そのような技術は、文献に十分に記述されている。
【0257】
本明細書で引用されるすべての出版物、特許と特許出願は、その全体が参照により本明細書に組み込まれる。
【0258】
特に断りのない限り、本明細書で使用されるすべての技術と科学用語は、いずれも本発明が属する技術分野の当業者が一般的に理解する意味を有する。本発明の目的のために、以下の用語は、当分野で一般的に理解される意味に適合するものとして定義される。
【0259】
冠詞「一つ/種(a/an)」と「該(the)」は、本明細書において一つ/種又は一つ/種よりも多い(即ち、少なくとも一つ/種)該冠詞の文法上の目的語を指すためのものである。例えば、「要素」とは、一つの要素又は一つよりも多い要素を指す。
【0260】
代替方案(例えば「又は」)の使用は、両方のいずれか一つ、両方又はそれらの任意の組み合わせを意味するものとして理解されるべきである。
【0261】
用語である「及び/又は」は、これらの代替方案のうちのいずれか一つ又は両方を意味するものとして理解されるべきである。
【0262】
本明細書で使用されるように、用語である「約」又は「およそ」とは、基準量、レベル、値、数量、頻度、百分率、寸法、サイズ、質量、重量又は長さと比べて、最大15%、10%、9%、8%、7%、6%、5%、4%、3%、2%又は1%変化する量、レベル、値、数量、頻度、百分率、寸法、サイズ、質量、重量又は長さを指す。一つの実施の形態では、用語である「約」又は「およそ」とは、基準量、レベル、値、頻度、百分率、スケール、サイズ、質量、数量、重量又は長さの±15%、±10%、±9%、±8%、±7%、±6%、±5%、±4%、±3%、±2%又は±1%程度の量、レベル、値、数量、頻度、百分率、寸法、サイズ、質量、重量又は長さの範囲を指す。
【0263】
本明細書で使用されるように、用語である「基本的に(substantially/essentially」とは、基準の程度、量、レベル、値、数量、頻度、百分率、寸法、サイズ、質量、重量又は長さの約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%又は99%又はそれ以上の程度、量、レベル、値、数量、頻度、百分率、寸法、サイズ、質量、重量又は長さを指す。
【0264】
数値範囲は、範囲のエンドバリューと該範囲内の各特定値を含み、例えば、「16~100個のヌクレオチド」は、16と100及び16~100の間の各特定値を含む。
【0265】
本説明書全体では、文脈上別段の要求がない限り、用語である「含む(comprise)」、「包括(include)」、「含有(contain)」と「有する(have)」は、説明されるステップ又は要素又は1組のステップ又は要素を含むことを示唆するものとして理解されるが、任意の他のステップ又は要素又は他の組のステップ又は要素を除外するものではない。いくつかの実施の形態では、用語である「含む」、「包括」、「含有」と「有する」は、同義で使用される。
【0266】
「……からなる」とは、「……からなる」という語句のうちの任意の要素を含むが、それらに限らないことを意味する。そのため、「……からなる」という語句は、列挙される要素が必須又は不可欠であり、且つ他の要素が存在してはならないことを指示する。
【0267】
「基本的に……からなる」は、「基本的に……からなる」という語句に列挙される任意の要素を含むことを意図しており、且つ列挙される要素の本開示で指定される活性又は作用を妨げないか又はそれに寄与する他の要素に限定される。そのため、「基本的に…からなる」という語句は、列挙される要素が必須又は不可欠であるが、それらが列挙される要素の活性又は作用に影響を与えるかどうかに応じて、他の要素が任意選択的ではなく且つ存在しても存在しなくてもよいことを指示する。
【0268】
明細書全体では、「一つの実施の形態」、「実施の形態」、「一つの特定の実施の形態」、「一つの関連する実施の形態」、「一つの実施の形態」、「別の実施の形態(another embodiment)」又は「別の実施の形態(a further embodiment)」又はその組み合わせの言及は、該実施の形態に関連して記述される特定の特徴、構造又は特性が本発明の少なくとも一つの実施の形態に含まれることを意味する。そのため、明細書全体の異なる場所に出現する前述の語句は、必ずしもすべてが同じ実施の形態を指すとは限らない。さらに、特定の特徴、構造又は特性は、一つ又は複数の実施の形態において任意の適切な方式で組み合わされてもよい。
【0269】
二つのポリペプチド又は核酸配列の間の「配列同一性」とは、配列の間の同じ残基の数の総残基数に対する百分率を指し、且つ総残基数の計算は、突然変異のタイプに基づいて決定される。突然変異のタイプは、配列のいずれか一端又は両端での挿入(伸長)、配列のいずれか一端又は両端での欠失(切断)、一つ又は複数のアミノ酸/ヌクレオチドの置換/置き換え、配列内の挿入、配列内の欠失を含む。ポリペプチドを例にすると(ヌクレオチドも同様)、突然変異タイプが、一つ又は複数のアミノ酸/ヌクレオチドの置換/置き換え、配列内の挿入と配列内の欠失のうちの一つ又は複数である場合、比較される分子のうち大きい方の分子の残基数を総残基数とみなす。突然変異タイプが、配列のいずれか一端又は両端での挿入(伸長)又は配列のいずれか一端又は両端での欠失(切断)をさらに含む場合、いずれか一端又は両端で挿入又は欠失されるアミノ酸数(例えば、両端で20個未満の挿入又は欠失)を総残基数に計上しない。同一性百分率を計算する時、配列の間で最大の一致が生じる方式で比較される配列を比較し、且つ特定のアルゴリズムによって比較におけるギャップ (存在する場合)を解析する。
【0270】
重要でないアミノ酸の保存的置換は、タンパク質の正常な機能に影響を与えることなく行うことができる。保存的置換とは、化学的又は機能的に類似するアミノ酸でアミノ酸を置換することを指す。類似するアミノ酸の保存的置換表を提供することは、当分野で周知のものである。例えば、いくつかの実施の形態では、以下に提供されるアミノ酸基は、相互の保存的置換と考えられる。
【0271】
いくつかの実施の形態では、互いに保存的に置換されると考えられる選定アミノ酸群は、以下のとおりである。
【0272】
【表1】
【0273】
いくつかの実施の形態では、互いに保存的に置換されると考えられる他の選定アミノ酸群は、以下のとおりである。
【0274】
【表2】
【0275】
いくつかの実施の形態では、互いに保存的に置換されると考えられる他の選定アミノ酸群は、以下のとおりである。
【0276】
【表3】
【0277】
用語である「アミノ酸」とは、20種類の一般的な、天然に存在するアミノ酸を意味する。天然に存在するアミノ酸は、アラニン(Ala、A)、アルギニン(Arg、R)、アスパラギン(Asn、N)、アスパラギン酸(Asp、D)、システイン(Cys、C)、グルタミン酸(Glu、E)、グルタミン(Gln、Q)、グリシン(Gly、G)、ヒスチジン(His、H)、イソロイシン(Ile、I)、ロイシン(Leu、L)、リジン(Lys、K)、メチオニン、M)、フェニルアラニン(Phe、F)、プロリン(Pro、P)、セリン(Ser、S)、スレオニン(Thr、T)、トリプトファン(Trp、W)、チロシン(Tyr、Y)とバリン(Val、V)を含む。
【0278】
本明細書で使用されるように、用語である「Cas12iタンパク質」は、その最も広い意味で使用され、親又は参照Cas12iタンパク質(例えば、SEQ ID NO:1~10のうちのいずれか一つを含むCas12iタンパク質)、その誘導体又は変異体及び機能断片、例えばそのオリゴヌクレオチド結合断片を含む。
【0279】
本明細書で使用されるように、用語である「crRNA」は、ガイド分子、gRNA及びガイドRNAと互換的に使用されることができ、且つ核酸ベースの分子を指し、CRISPR-Casタンパク質(例えば、本明細書に記載の任意のCas12iタンパク質)と複合体(例えば、ダイレクトリピート配列、DRを介して)を形成できるRNAベースの分子を含むが、それに限らず、且つ標的核酸配列にハイブリダイズするように標的核酸配列に十分に相補的であり、複合体と標的核酸配列との配列特異的結合をガイドする配列(例えば、スペーサー領域)を含む。
【0280】
本明細書で使用されるように、用語である「CRISPRアレイ」とは、CRISPR反復配列とスペーサー領域の核酸(例えば、DNA)断片を含み、それは、第1のCRISPR反復配列の最初のヌクレオチドから始まり、且つ最後(末端)のCRISPR反復配列の最後のヌクレオチドで終わる。一般的には、CRISPRアレイにおける各スペーサー領域は、二つの反復配列の間に位置する。本明細書で使用されるように、用語である「CRISPR反復配列」又は「CRISPRダイレクトリピート配列」又は「ダイレクトリピート配列」とは、CRISPRアレイにおいて配列変化をほとんど又は全く示さない複数の短いダイレクトリピート配列である。適当に、V-Iダイレクトリピート配列は、ステム-ループ構造を形成することができる。
【0281】
「ステム-ループ構造」とは、二次構造を有する核酸であり、該二次構造は、主に一本鎖ヌクレオチドである領域(ループ)を介して片側が連結された二本鎖(ステム)を形成することが知られている、又は予測されているヌクレオチド領域を含む。用語である「ヘアピン」と「ターンバック」構造は、本明細書においてステム-ループ構造を指すためにも用いられる。そのような構造は、当分野においてよく知られており、且つこれらの用語は、当分野でよく知られている意味に従って使用される。当分野で知られているように、ステム-ループ構造は、正確な塩基対を必要としない。そのため、ステムは、一つ又は複数の塩基ミスマッチを含んでもよい。代替的に、塩基対は、正確で、即ちミスマッチを含まなくてもよい。
【0282】
本明細書で使用されるように、標的核酸は、crRNAにおけるスペーサー領域の全部又は一部に相補的な核酸配列を含む特定の核酸を指すために、標的配列又は標的核酸配列と互換的に使用されることができる。いくつかの例では、標的核酸は、遺伝子又は遺伝子内の配列を含む。いくつかの例では、標的核酸は、非コード領域(例えば、プロモーター)を含む。いくつかの例では、標的核酸は、一本鎖である。いくつかの例では、標的核酸は、二本鎖である。
【0283】
本明細書で使用されるように、「ドナーテンプレート核酸」又は「ドナーテンプレート」は、本明細書に記載のCRISPR酵素が標的核酸を改変した後に一つ又は複数の細胞タンパク質によって標的核酸の構造を改変するために用いられる核酸分子を指すために、互換的に使用されることができる。いくつかの例では、ドナーテンプレート核酸は、二本鎖核酸である。いくつかの例では、ドナーテンプレート核酸は、一本鎖核酸である。いくつかの例では、ドナーテンプレート核酸は、線状である。いくつかの例では、ドナーテンプレート核酸は、環状(例えば、プラスミド)である。いくつかの例では、ドナーテンプレート核酸は、外因性核酸分子である。いくつかの例では、ドナーテンプレート核酸は、内在性核酸分子(例えば、染色体)である。
【0284】
標的核酸は、PAM(プロトスペーサー隣接モチーフ)、即ち、CRISPR複合体によって認識される短い配列に関連付けられるべきである。CRISPR-Casタンパク質の性質に応じて、DNA二本鎖におけるその相補の配列(標的配列の相補の配列)がPAMの上流又は下流になるように標的配列を選択すべきである。本発明の一つの実施の形態では、標的配列の相補の配列は、PAMの下流又は3’にある。PAMの正確な配列と長さの要求は、使用するCas12iタンパク質によって異なる。
【0285】
当業者であれば理解するように、ウラシルが「u」で表され、チミンが「t」で表されるのではなく、ウラシルとチミンとも「t」で表されてもよく、リボ核酸の文脈では、別段の指示がない限り、「t」がウラシルを表すために用いられることを理解すべきである。
【0286】
本明細書で使用されるように、用語である「切断」とは、本明細書に記載のCRISPRシステムのヌクレアーゼによって産生される標的核酸におけるDNA切断である。いくつかの例では、切断は、二本鎖DNA切断である。いくつかの例では、切断は、一本鎖DNA切断である。
【0287】
本明細書で使用されるように、「標的核酸を切断する」又は「標的核酸を修飾する」の意味は、重複してもよい。標的核酸を修飾することは、単一ヌクレオチドの修飾を含むだけでなく、核酸断片の挿入又は欠失をさらに含む。
【0288】
本出願は、SEQ ID NO:1~10のような一本鎖又は二本鎖DNA切断活性を有するCas12iタンパク質を提供する。本明細書に記載のCas12iタンパク質は、他の既知のCas12iと約50%未満の配列同一性を有し、他のCas、例えばCas9又はCas12よりも小さく、且つより良い送達効率を有する。いくつかの実施の形態では、Cas12iタンパク質は、SEQ ID NO:1~10のうちのいずれか一つの配列、例えばSEQ ID NO:1~3、6と10のうちのいずれか一つ又はSEQ ID NO:1を含む。いくつかの実施の形態では、Cas12iタンパク質は、単離されたものである。いくつかの実施の形態では、Cas12iタンパク質は、操作されたものである。いくつかの実施の形態では、Cas12iタンパク質は、人工的なものである。
【0289】
本明細書に記載のCas12iタンパク質、例えばSiCas12i、Si2Cas12i、WiCas12iとSaCas12iは、インビトロ又は細胞レベルで外因性又は内在性遺伝子に対して優れた切断活性を有し、SpCas9、LbCas12aとCas12i.3の切断活性と同等又はそれ以上である。本明細書に記載のCas12iタンパク質、例えばSiCas12i、Si2Cas12i、WiCas12iとSaCas12iは、外因性又は内在性遺伝子の特定の標的配列に対する切断活性が、細胞レベルで約15%、20%、30%、40%、50%、60%、70%、80%、90%、95%又はひいては99%よりも大きい値のうちのいずれか一つよりも大きくてもよい。一般的には、本明細書に記載のCas12iタンパク質は、細胞レベルで外因性又は内在性遺伝子の特定の標的配列に対する切断活性が、Cas12i.3よりも優れている。
【0290】
SiCas12iは、インビトロ又は細胞レベルで外因性又は内在性遺伝子に対する切断活性が、SpCas9又はLbCas12aに同等であり、又はひいてはそれ以上であり、且つCas12i.3よりも著しく優れている。それは、細胞レベルで外因性又は内在性遺伝子の特定の標的配列に対する切断活性は、約15%、20%、30%、40%、50%、60%、70%、80%、90%、95%又はひいては99%よりも大きい値のうちのいずれか一つよりも大きくてもよい。一般的には、SiCas12iは、細胞レベルで外因性又は内在性遺伝子の特定の標的配列に対する切断活性が、Cas12i.3よりも著しく優れている。
【0291】
上記Cas12iタンパク質は、Cas12iの触媒活性(エンドヌクレアーゼ切断活性)又は核酸結合機能(例えば、約5%、4%、3%、2%、1%又はより小さい値のうちのいずれか一つ以下の影響)に基本的に影響を及ぼさないアミノ酸突然変異をさらに含んでもよい。
【0292】
いくつかの実施の形態では、本発明のCas12iタンパク質(変異体、dCas、ニッカーゼなどを含む)、例えばSiCas12iは、そのN-末端及び/又はC-末端に一つ又は複数の核局在化配列(NLS)を含み、好ましくは、そのN-末端に一つのNLSを含み、且つC-末端に一つのNLSを含む。いくつかの実施の形態では、NLSは、SV40 NLS(例えば、SEQ ID NO:444に示す)であり、好ましくは、Cas12iタンパク質が切断に用いられる時である。いくつかの実施の形態では、NLSは、BP NLSであり、例えばSEQ ID NO:443に示すとおりであり、好ましくは、Cas12iタンパク質が塩基編集に用いられる時であり、より好ましくは、Cas12iタンパク質は、そのN-末端にSEQ ID NO:443のBP NLSを融合し、そのC-末端にSEQ ID NO:443のBP NLSを融合する。
【0293】
本発明は、本明細書に記載の任意のCas12iタンパク質の変異体、例えばSEQ ID NO:1~10のうちのいずれか一つ(好ましくは、SEQ ID NO:1~3、6と10、より好ましくは、SEQ ID NO:1)と少なくとも約80%(例えば、少なくとも約81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%又はそれ以上のうちのいずれか一つ)であるが100%未満の同一性を有する配列を有するCas12i変異体をさらに提供する。いくつかの実施の形態では、Cas12i変異体は、参照Cas12iタンパク質(例えば、SEQ ID NO:1~10のうちのいずれか一つのアミノ酸配列を含むCas12iタンパク質)のアミノ酸配列に対して一つ又は複数の置換、挿入、欠失又は切断を含む。
【0294】
本明細書で使用されるように、「変異体」とは、それぞれ参照(例えば、親)ポリヌクレオチド又はポリペプチドとは異なるが、必要な特性を保持するポリヌクレオチド又はポリペプチドである。ポリヌクレオチドの典型的な変異体は、参照ポリヌクレオチドとは核酸配列が異なる。ヌクレオチド変化は、参照ポリヌクレオチドによってコードされるポリペプチドのアミノ酸配列を改変しても、改変しなくてもよい。ヌクレオチド変化は、参照ポリヌクレオチドによってコードされるポリペプチドにおけるアミノ酸の置換、付加、欠失又は切断を引き起こすことができる。ポリペプチドの典型的な変異体は、参照ポリペプチドとはアミノ酸配列が異なる。一般的には、このような異なりは、参照ポリペプチドと変異体ポリペプチドの配列が多くの領域で一般的に非常に類似しており、同じであるように限定されている。変異体ポリペプチドと参照ポリペプチドのアミノ酸配列は、置換、付加、欠失又は切断のうちの一つ又は複数の任意の組み合わせによって異なってもよい。置換又は挿入されるアミノ酸残基は、遺伝暗号によってコードされるアミノ酸残基であっても、ではなくてもよい。ポリヌクレオチド又はポリペプチドの変異体は、天然に存在するもの(例えば対立遺伝子変異体)であってもよく、又は天然に存在しないものであってもよい。ポリヌクレオチドとポリペプチドの天然に存在しない変異体は、突然変異誘発技術、直接合成又は当業者に既知の他の組換え方法によって製造されてもよい。
【0295】
本明細書で使用されるように、用語である「野生型」は、当業者が一般的に理解する意味を有し、且つ生物、株、遺伝子又は形質の典型的な形態を意味する。それは、自然界の資源から単離されることができ、且つ意図的に装飾されていない。
【0296】
本明細書で使用されるように、用語である「天然に存在しない」と「操作された」は、互換的に使用されることができ、且つ人間の関与を指す。これらの用語が核酸分子又はポリペプチドを記述するために用いられる場合、それは、該核酸分子又はポリペプチドが、それが自然に関連するか又は自然界に一緒に存在する少なくとも一つの他の成分を少なくとも基本的に含まないことを意味する。
【0297】
いくつかの実施の形態では、Cas12i変異体は、単離されている。いくつかの実施の形態では、Cas12i変異体は、操作されたか又は天然に存在しない。いくつかの実施の形態では、Cas12i変異体は、人工的に合成される。いくつかの実施の形態では、Cas12i変異体は、参照Cas12iタンパク質(例えば、親Cas12iタンパク質)に対して一つ又は複数のドメイン、例えばPIドメイン、螺旋ドメイン、RuvCドメイン、WEDドメイン、Nucドメインなどに一つ又は複数のアミノ酸突然変異(例えば、挿入、欠失又は置換)を有する。
【0298】
いくつかの実施の形態では、Cas12i変異体は、SiCas12i(SEQ ID NO:1)に対する変異体である。これは、Cas12i変異体(例えば、Si2Cas12iの変異体)がその元の配列(例えば、Si2Cas12i、SEQ ID NO:2)において元のSiCas12i(SEQ ID NO:1)と比較することができ、且つアミノ酸突然変異(例えば挿入、欠失又は置換)を有する一つ又は複数の位置を同定することができることを意味する。いくつかの実施の形態では、Cas12i変異体は、操作されたSiCas12iである。
【0299】
いくつかの実施の形態では、該当する参照Cas12iタンパク質(例えば、SEQ ID NO:1~10のうちのいずれか一つを含むCas12iタンパク質)と比べて、Cas12i変異体(例えば、SiCas12i変異体)は、ガイド配列に相補的な標的DNAの標的配列に対してより高いスペーサー領域特異的エンドヌクレアーゼ切断活性を有し、例えば該当する参照Cas12iタンパク質の少なくとも約1.2倍(例えば、少なくとも約1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、2.5、3、3.5、4、5、10、20、50倍又はそれ以上のうちのいずれか一つ)である。
【0300】
いくつかの実施の形態では、該当するCas12i変異体(例えば、SiCas12i変異体)と比べて、元の参照Cas12iタンパク質(例えば、SEQ ID NO:1~10のうちのいずれか一つを含むCas12iタンパク質)は、ガイド配列に相補的な標的DNAの標的配列に対してより高いスペーサー領域特異的エンドヌクレアーゼ切断活性を有し、例えばCas12i変異体の少なくとも約1.2倍(例えば、少なくとも約1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、2.5、3、3.5、4、5、10、20、50倍又はそれ以上のうちのいずれか一つ)である。
【0301】
いくつかの実施の形態では、Cas12i変異体(例えば、SiCas12i変異体)の、ガイド配列に相補的な標的DNAの標的配列に対するスペーサー領域特異的エンドヌクレアーゼ切断活性は、該当する元のCas12iタンパク質(例えば、SEQ ID NO:1~10のうちのいずれか一つを含むCas12iタンパク質)と同じである又は著しく異なっていない(例えば、約1.2倍以内)。例えば、いくつかの実施の形態では、Cas12i変異体の、ガイド配列に相補的な標的DNAの標的配列に対するスペーサー領域特異的エンドヌクレアーゼ切断活性は、該当する元のCas12iタンパク質と同じである。いくつかの実施の形態では、Cas12i変異体の、ガイド配列に相補的な標的DNAの標的配列に対するスペーサー領域特異的エンドヌクレアーゼ切断活性は、該当する元のCas12iタンパク質の約1.2倍以下(例えば、約1.2、1.19、1.15、1.1、1.01、1.001倍以下などのうちのいずれか一つ)である。いくつかの実施の形態では、元のCas12iタンパク質の、ガイド配列に相補的な標的DNAの標的配列に対するスペーサー領域特異的エンドヌクレアーゼ切断活性は、該当するCas12i変異体の約1.2倍以下(例えば、約1.2、1.19、1.15、1.1、1.01、1.001倍以下などのうちのいずれか一つ)である。
【0302】
本発明は、触媒活性を有しないか又は基本的に有さない死Cas12i(dCas12i)タンパク質をさらに提供する。例えば、いくつかの実施の形態では、dCas12iタンパク質は、該当する親Cas12iタンパク質(例えば、SEQ ID NO:1~10のうちのいずれか一つを含むCas12iタンパク質)の、ガイド配列に相補的な標的DNAの標的配列に対するスペーサー領域特異的エンドヌクレアーゼ切断活性の約50%未満(例えば、約40%、35%、30%、27.5%、25%、22.5%、20%、17.5%、15%、12.5%、10%、7.5%、5%、4%、3%、2.5%、2%、1%未満又はそれ以下のうちのいずれか一つ)を保持する。いくつかの実施の形態では、dCas12iタンパク質は、RuvCドメイン(例えば、SEQ ID NO:1~10のうちのいずれか一つを含むCas12iタンパク質のRuvCドメイン)に一つ又は複数のアミノ酸置換を含むことにより、触媒活性を基本的に有さない。いくつかの実施の形態では、非突然変異のCas12i形式と比べて、dCas12iのDNA切断活性は、ゼロであるか又は無視できる。いくつかの実施の形態では、dCas12iは、触媒活性のないCas12iタンパク質であり、それは、RuvCドメインに突然変異を含有し、該突然変異は、CRISPR複合体の形成及び標的核酸との成功した結合を許可するが、成功したヌクレアーゼ活性(触媒/切断活性)を許可しない。
【0303】
いくつかの実施の形態では、dCas12iは、触媒活性を基本的に有さないdSiCas12iである。いくつかの実施の形態では、dSiCas12iは、SEQ ID NO:1に対するアミノ酸残基650、700、875及び/又は1049において、一つ又は複数の置換を含む。いくつかの実施の形態では、dSiCas12iは、SEQ ID NO:1に対して、D700A、D700V、D650A、D650V、E875A、E875V、D1049AとD1049Vから選択される一つ又は複数の置換を含む。一つの実施の形態では、dSiCas12iは、それぞれdSiCas12i-D700A、dSiCas12i-D650A、dSiCas12i-E857AとdSiCas12i-D1049Aのうちのいずれか一つのアミノ酸配列を含む。いくつかの実施の形態では、dSiCas12iは、SEQ ID NO:1に対して、D650A、D700A、E875A、D1049A、D650A+D700A、D700A+E875A、D700A+D1049A、D650A+E875A、D650A+D1049A、E875A+D1049A、D650A+D700A+E875A、D650A+D700A+D1049A、D650A+E875A+D1049A、D700A+E875A+D1049AとD650A+D700A+E875A+D1049Aから選択される一つ又は複数の置換を含む。
【0304】
また、dCas12iは、以前に記述されたそれら以外の突然変異を含有してもよく、これらの突然変異は、dCas12iタンパク質の触媒活性又は核酸結合機能に基本的に影響を及ぼさない(例えば、約5%、4%、3%、2%、1%以下又はより小さい値のうちのいずれか一つの影響)。触媒活性を基本的に有さないdCas12iタンパク質は、DNA結合タンパク質として用いられてもよい。
【0305】
いくつかの実施の形態では、本明細書に記載のdCas12iは、アデノシンデアミナーゼ(ADA)又はシチジンデアミナーゼ(CDA)又はその触媒ドメインに融合して、一塩基編集を実現することができる。いくつかの実施の形態では、本明細書に記載の任意のdCas12iタンパク質とADA又はCDA(又はその触媒ドメイン)とを含む融合タンパク質の一塩基編集効率は、本発明に由来しないdCas12iと健全なADA又はCDA(又はその触媒ドメイン)とを含む融合タンパク質よりも少なくとも約10%(例えば、少なくとも約20%、30%、40%、50%、60%、70%、80% 90%、100%、120%、150%、200%、500%、1000%又はそれ以上のうちのいずれか一つ)高い。
【0306】
上記任意のCas12i又はdCas12iタンパク質の全長配列におけるアミノ酸数は、他のタイプのCas12タンパク質のアミノ酸数よりも明らかに少なく、且つそれらの分子サイズが小さいことにより、Casシステムのインビボでの後続の組立と送達を促進する。
【0307】
いくつかの実施の形態では、アデノシンデアミナーゼは、TadA8e、例えばSEQ ID NO:439の配列を含むTadA8eである。
【0308】
いくつかの実施の形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)のC’末端は、任意選択的なペプチドリンカー(例えばSEQ ID NO:442を含むペプチドリンカー)を介してdCas12iのN’末端に融合される。いくつかの実施の形態では、デアミナーゼ(例えばアデノシンデアミナーゼ)のN’末端は、任意選択的なペプチドリンカー(例えばSEQ ID NO:442を含むペプチドリンカー)を介してdCas12iのC’末端に融合される。いくつかの実施の形態では、dSiCas12iとアデノシンデアミナーゼ(例えば、TadA8e)とを含む融合タンパク質、例えば融合タンパク質TadA8e-dSiCas12i-D1049A、又は融合タンパク質TadA8e-dSiCas12i-E875Aを提供する。
【0309】
特に断りのない限り、本明細書に記載の「Cas12i」又は「Cas12iタンパク質」は、本発明に記述の任意のCas12iタンパク質及びその変異体(例えば突然変異体)、誘導体(例えばCas12i融合タンパク質)、及び触媒活性を基本的に有さないdCas12iタンパク質及びその誘導体(例えばdCas12i融合タンパク質、例えばdCas12i-TadA)を含む。本発明は、任意のCas12iタンパク質及びその変異体と誘導体をコードするヌクレオチド配列、例えばSEQ ID NOs:21~40のうちのいずれか一つのポリヌクレオチド配列をさらに提供する。
【0310】
一般的には、本明細書に記載のcrRNA(ガイドRNA/gRNAと交換可能)は、ダイレクトリピート配列(DR)とスペーサー領域とを含み、基本的にダイレクトリピート配列(DR)とスペーサー領域によって構成されるか、又はダイレクトリピート配列(DR)とスペーサー領域によって構成される。いくつかの実施の形態では、crRNAは、スペーサー領域に連結されるDRを含み、基本的にそれによって構成されるか、又はそれによって構成される。いくつかの実施の形態では、crRNAは、DR、スペーサー領域とDR(DR-スペーサー領域-DR)を含む。これは、pre-crRNAの典型的な配置である。いくつかの実施の形態では、crRNAは、DR、スペーサー領域、DRとスペーサー領域(DR-スペーサー領域-DR-スペーサー領域)を含む。いくつかの実施の形態では、crRNAは、2つ又はそれ以上のDRと2つ又はそれ以上のスペーサー領域を含む。いくつかの実施の形態では、crRNAは、切断されたDRとスペーサー領域とを含む。これは、加工された又は成熟したcrRNAに典型的である。いくつかの実施の形態では、CRISPR-Cas12iエフェクタータンパク質は、crRNAと複合体を形成し、且つスペーサー領域は、複合体をスペーサー領域に相補的な標的核酸に導いて配列特異的結合を行う。
【0311】
いくつかの実施の形態では、本明細書に記載のCRISPR-Cas12iシステムは、一つ又は複数のcrRNA(例えば、1、2、3、4、5、10、15種類又はそれ以上)又はそのコード核酸を含む。いくつかの実施の形態では、この2種類又はそれ以上のcrRNAは、異なる標的部位、例えば、同一の標的DNA又は遺伝子の2つの標的部位、又は2つの異なる標的DNA又は遺伝子の2つの標的部位を標的とする。
【0312】
本明細書に記載のcrRNAの配列と長さを最適化することができる。いくつかの実施の形態では、crRNAの最適な長さは、crRNAの加工形式を同定することによって、又はcrRNAの経験的な長さ研究によって決定されてもよい。いくつかの実施の形態では、crRNAは、塩基修飾を含む。
ダイレクトリピート配列(DR)
【0313】
表Aは、本発明の該当するCas12iタンパク質のDR配列例を示した。例えば、SiCas12i(又はその変異体又は誘導体、又はdSiCas12i又はその融合タンパク質)に対応するDR配列は、SEQ ID NO:11に示すヌクレオチド配列又はその機能変異体を含んでもよい。本明細書に記載のCas12iタンパク質と該当するcrRNAとの結合を媒介できる任意のDR配列は、いずれも本発明に用いられてもよい。いくつかの実施の形態では、DRは、SEQ ID NO:11~20と501~507のうちのいずれか一つのRNA配列を含む。いくつかの実施の形態では、DRは、SEQ ID NO:11~20の任意のRNA配列の「機能変異体」、例えば「機能切断バージョン」、「機能伸長バージョン」又は「機能置換バージョン」である。例えば、SEQ ID NO:501又は502のDR配列は、SEQ ID NO:11(切断形式)の一部であり、それは、実施例に示すように、依然としてDR機能を有するため、機能的変異体又は機能的に切断されたDR変異体である。DRの「機能変異体」は、参照DR(例えば、親DR)の5’及び/又は3’が伸長(機能伸長バージョン)又は切断された(機能切断バージョン)変異体であり、又は参照DR(例えば、親DR)に対して一つ又は複数のヌクレオチドの一つ又は複数の挿入、欠失及び/又は置換(機能置換バージョン)を含み、同時に依然として参照DRの少なくとも約20%(例えば少なくとも約30%、40%、50%、60%、60%、70%、80%、90%、95%又はそれ以上のうちのいずれか一つ)の機能性、即ち、Cas12iタンパク質と該当するcrRNAとの結合を媒介する機能を保持する。DR機能変異体は、一般的にCas12iタンパク質の結合に使用できるステムループ様二次構造又はその部分を保持する。図21に示すように、DR-T2(SEQ ID NO:502)は、SEQ ID NO:11に示すDRの機能切断バージョンの一つである。いくつかの実施の形態では、DR又はその機能変異体は、Cas12iタンパク質の結合に使用できるステムループ様二次構造又はその部分を含む。いくつかの実施の形態では、DR又はその機能変異体は、Cas12iタンパク質の結合に使用できる、少なくとも二つ(例えば、2、3、4、5つ又はそれ以上)のステムループ様二次構造又はその部分を含む。
【0314】
いくつかの実施の形態では、DR又はその機能変異体は、少なくとも約16個のヌクレオチド(nt)、例えば16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40又はそれ以上のヌクレオチドを含む。いくつかの実施の形態では、DRは、約20ntから約40nt、例えば約20ntから約30nt、約22ntから約40nt、約23ntから約38nt、約23ntから約36nt、又は約30ntから約40ntを含む。いくつかの実施の形態では、DRは、22nt、23nt又は24ntを含む。いくつかの実施の形態では、DRは、35nt、36nt又は37ntを含む。
【0315】
いくつかの実施の形態では、DR配列は、3’末端付近(スペーサー配列のすぐ隣)にステム-ループ構造を含む。「ステム-ループ構造」とは、二次構造を有する核酸であり、該二次構造は、二本鎖(ステム)部分を形成することが知られている、又は予測されている、基本的に一本鎖ヌクレオチドである連結領域(ループ)を介して一端が連結されたヌクレオチド領域を含む。用語である「ヘアピン」構造は、本明細書においてステム-ループ構造を指すためにも用いられる。そのような構造は、当分野においてよく知られており、且つこれらの用語は、当分野で一般的に知られている意味に従って使用される。ステム-ループ構造は、正確な塩基対を必要としない。そのため、ステムは、一つ又は複数の塩基ミスマッチを含んでもよい。代替的に、塩基対は、正確で、即ち任意のミスマッチを含まなくてもよい。
【0316】
本発明のcrRNAは、DR配列の3’末端付近にステム-ループ構造を含むDRを含む。SiCas12iのDRステム-ループ構造は、図11に示すとおりである。いくつかの実施の形態では、DRに含まれるステムは、互いにハイブリダイズする5対の相補的塩基からなり、且つループ長さは、6、7、8又は9個のヌクレオチドである。いくつかの実施の形態では、ループ長さは、7個のヌクレオチドである。いくつかの実施の形態では、ステムは、少なくとも2つ、少なくとも3つ、少なくとも4つ又は少なくとも5つの塩基対を含んでもよい。いくつかの実施の形態では、DRは、長さが約5個のヌクレオチドであり、約7個のヌクレオチドから離間している2つの相補的ヌクレオチドセグメントを含む。いくつかの実施の形態では、ステム-ループ構造は、長さが5個のヌクレオチドである第1のステムヌクレオチド鎖と、長さが5個のヌクレオチドである第2のステムヌクレオチド鎖であって、第1のステムヌクレオチド鎖と第2のステムヌクレオチド鎖とが互いにハイブリダイズできる第2のステムヌクレオチド鎖と、第1のステムヌクレオチド鎖と第2のステムヌクレオチド鎖との間に並べられ、6、7又は8個のヌクレオチドを含む環状ヌクレオチド鎖とを含む。
【0317】
本明細書で使用されるように、2つ又はそれ以上のcrRNAの二次構造が基本的に同じであるか又は実質的な差異がないことは、これらのcrRNAが、長さの差が1、2又は3個のヌクレオチド以下のステム及び/又はループを含有することを意味し、ヌクレオチドタイプ(A、U、G又はC)に関して、配列比較により比較する時、これらのcrRNAのヌクレオチド配列の差は、1、2、3、4、5、6、7又は8個のヌクレオチド以下である。いくつかの実施の形態では、2つ又はそれ以上のcrRNAの二次構造が基本的に同じであるか又は実質的な差異がないことは、crRNAが、長さの差が多くとも1対の相補的塩基であるステム、及び/又は長さの差が多くとも1つのヌクレオチドであるループを含有し、及び/又は同じ長さを有するがミスマッチ塩基を有するステムを含有することを意味する。いくつかの実施の形態では、ステム-ループ構造は、5’-XNNNnNNNX10-3’を含み、ここで、X、X、X、X、X、X、X、X、XとX10は、任意の塩基であってもよく、nは、任意の塩基又は欠失であってもよく、且つNは、任意の塩基であってもよく、ここで、XとX10は、互いにハイブリダイズしてステムを形成し、且つNNNnNNNにループを形成させることができる。いくつかの実施の形態では、ステム-ループ構造は、SEQ ID NO:503~507のうちのいずれか一つの配列を含む。
【0318】
いくつかの実施の形態では、本発明の任意のCas12iを標的部位に導くことができるDR配列は、ヌクレオチド付加、挿入、欠失と置換から選択される一つ又は複数のヌクレオチド変化を含み、これらのヌクレオチド変化は、SEQ ID NO:11~20と501~507のうちのいずれか一つに示すDR配列又はその機能的に短縮されたバージョンと比べて二次構造の実質的な差異を引き起こさない。
スペーサー領域
【0319】
いくつかの実施の形態では、スペーサー配列の長さは、少なくとも約16個のヌクレオチドであり、好ましくは約16から約100個のヌクレオチド、より好ましくは約16から約50個のヌクレオチド(例えば、約16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個のヌクレオチドのうちのいずれか一つ)である。いくつかの実施の形態では、スペーサー領域は、約16から約27個のヌクレオチド、例えば約17から約24個のヌクレオチド、約18から約24個のヌクレオチド又は約18から約22個のヌクレオチドのうちのいずれか一つである。
【0320】
いくつかの実施の形態では、スペーサー領域は、標的配列と少なくとも約70%(例えば、少なくとも約75%、80%、85%、90%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%のうちのいずれか一つ)相補的である。いくつかの実施の形態では、スペーサー配列と標的核酸(例えば、DNA)の標的配列との間には、少なくとも約15個(例えば、少なくとも約16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50個又はそれ以上のうちのいずれか一つ)存在する。
【0321】
crRNAが十分な相補性を有して機能を発揮する(即ち、Cas12iタンパク質を標的部位に導く)ことを条件として、スペーサー領域にとって完全な相補性を必要としない。crRNAによって媒介されるCas12iの切断効率は、一つ又は複数のミスマッチ(例えば、スペーサー領域/標的配列に沿うミスマッチの位置を含む、スペーサー配列と標的配列との間の1つ又は2つのミスマッチ)を導入することによって調節することができる。ミスマッチ(例えば二重ミスマッチ)がスペーサー領域のより中央に位置する(即ち、スペーサー領域の3’末端又は5’末端にない)場合、切断効率により大きな影響を与える。そのため、スペーサー配列に沿うミスマッチの位置を選択することにより、Cas12iの切断効率を調節することができる。例えば、標的配列の切断が100%未満であることが望ましい場合(例えば、細胞集団において)、スペーサー配列と標的配列との間の1つ又は2つのミスマッチをスペーサー配列に導入することができる。
【0322】
いくつかの実施の形態では、本発明のCas12iタンパク質は、PAM(プロトスペーサー隣接モチーフ、protospacer adjacent motif)を認識して標的配列に作用することができる。いくつかの実施の形態では、PAMは、5’-NTTN-3’を含むか又はそれによって構成される(ここで、Nは、A、T、G又はCである)。いくつかの実施の形態では、PAMは、5’-TTC-3’、5’-TTA-3’、5’-TTT-3’、5’-TTG-3’、5’-ATA-3’又は5’-ATG-3’を含むか又はそれらによって構成される。いくつかの実施の形態では、PAMは、5’-TTC-3’を含むか又はそれによって構成される。
【0323】
1. SEQ ID NO:1~10(好ましくはSEQ ID NO:1~3、6と10、且つより好ましくはSEQ ID NO:1)のうちのいずれか一つに示すアミノ酸配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%又は100%の同一性を有するアミノ酸配列を含む、Cas12iタンパク質。
前記Cas12iタンパク質は、Cas12iの触媒活性(エンドヌクレアーゼ切断活性)又は核酸結合機能に基本的に影響を及ぼさないアミノ酸突然変異をさらに含有してもよい。
【0324】
2. 前記Cas12iタンパク質は、該当する親Cas12iタンパク質(例えば、SEQ ID NO:1~10のうちのいずれか一つを含むCas12iタンパク質)の、ガイド配列に相補的な標的DNAの標的配列に対するスペーサー領域特異的エンドヌクレアーゼ切断活性(例えば、50%、40%、35%、30%、27.5%、25%、22.5%、20%、17.5%、15%、12.5%、10%、7.5%、5%、4%、3%、2.5%、2%、1%よりも少なく又はそれ以下を保持する)を基本的に有さない、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
一つの実施の形態では、前記Cas12iは、該当する親Cas12iタンパク質(例えば、SEQ ID NO:1~10のうちのいずれか一つを含むCas12iタンパク質)のスペーサー領域特異的エンドヌクレアーゼ切断活性又はスペーサー領域非特異性バイパス活性(例えば、50%、40%、35%、30%、27.5%、25%、22.5%、20%、17.5%、15%、12.5%、10%、7.5%、5%、4%、3%、2.5%、2%、1%よりも少なく又はそれ以下を保持する)を基本的に有さない。
【0325】
3. 前記Cas12iタンパク質は、前記Cas12iタンパク質が、該当する親Cas12iタンパク質(例えば、SEQ ID NO:1~10のうちのいずれか一つを含むCas12iタンパク質)の、ガイド配列に相補的な標的DNAの標的配列に対するスペーサー領域特異的エンドヌクレアーゼ切断活性(例えば、50%、40%、35%、30%、27.5%、25%、22.5%、20%、17.5%、15%、12.5%、10%、7.5%、5%、4%、3%、2.5%、2%、1%よりも少なく又はそれ以下を保持する)を基本的に有さないように、そのRuvCドメインに一つ又は複数のアミノ酸変異が含まれる、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0326】
4. 前記アミノ酸変異は、アミノ酸の付加、挿入、欠失と置換から選択される、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0327】
5. 前記Cas12iタンパク質は、SEQ ID NO:1に示す配列の位置700(D700)、650(D650)、875(E875)又は1049(D1049)に対応する一つ又は複数の位置にアミノ酸置換を含む、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
上記アミノ酸部位(D700、D650、E875又はD1049)におけるアミノ酸は、エンドヌクレアーゼ切断活性を基本的に喪失するように、親配列(例えば、SEQ ID NO:1~10のうちのいずれか一つを含む親Cas12iタンパク質)上の該当するアミノ酸とは異なる別のアミノ酸に突然変異してもよい。
前記Cas12iタンパク質は、Cas12iの触媒活性又は核酸結合機能に実質的な影響を及ぼさない他の突然変異をさらに含有してもよい。
【0328】
6. 前記アミノ酸置換は、D700A/V、D650A/V、E875A/VとD1049A/Vから選択される、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0329】
7. 前記アミノ酸置換は、D700A、D650A、E875AとD1049Aから選択される、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0330】
8. 前記アミノ酸置換は、D700A、D650A、E875A、D1049A、D700A+D650A、D700A+E875A、D700A+D1049A、D650A+E875A、D650A+D1049A、E875A+D1049A、D700A+D650A+E875A、D700A+D650A+D1049A、D650A+E875A+D1049AとD700A+D650A+E875A+D1049Aから選択される、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0331】
10. 前記Cas12iタンパク質は、一つ又は複数の機能ドメインに連結される、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0332】
11. 前記機能ドメインは、前記Cas12iタンパク質のN-末端及び/又はC-末端に連結される、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
前記連結は、直接連結又はリンカーを介した間接連結であってもよい。
【0333】
12. 前記機能ドメインは、核局在化シグナル(NLS)、核外輸送シグナル(NES)、デアミナーゼ(例えば、アデノシンデアミナーゼ又はシチジンデアミナーゼ)触媒ドメイン、DNAメチル化触媒ドメイン、DNA脱メチル化触媒ドメイン、ヒストン残基修飾ドメイン、ヌクレアーゼ触媒ドメイン、蛍光タンパク質、転写修飾因子(例えば、転写活性化触媒ドメイン、転写阻害触媒ドメイン)、光ゲーティング因子、化学誘導因子、クロマチン可視化因子、標的細胞又は標的細胞型上の細胞表面部分との結合を提供するためのターゲッティングポリペプチドから選択される、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0334】
13. 前記機能ドメインは、標的DNAを修飾する活性を示し、前記活性は、ヌクレアーゼ活性、メチル化活性、脱メチル化活性、DNA修復活性、DNA損傷活性、脱アミノ活性、ジスムターゼ活性、アルキル化活性、脱プリン活性、酸化活性、ピリミジンダイマー形成活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、グリコシダーゼ活性、アセチルトランスフェラーゼ活性、脱アセチル化酵素活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、肉ミリストイル化活性、脱肉ミリストイル化活性、グリコシル化活性(例えば、O-GlcNAcトランスフェラーゼ由来)、脱グリコシル化活性、転写阻害活性、転写活性化活性から選択される、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0335】
14. 前記機能ドメインは、アデノシンデアミナーゼ触媒ドメイン又はシチジンデアミナーゼ触媒ドメインから選択される、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0336】
15. 前記機能ドメインは、TadA8eの全長又は機能断片である、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0337】
17. 前記Cas12iタンパク質は、スペーサー領域非特異性エンドヌクレアーゼバイパス活性を低減又は消失させるように修飾される、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0338】
18. 前述実施の形態のいずれか1項に記載のCas12iタンパク質をコードする、ポリヌクレオチド。
【0339】
19. 前記ポリヌクレオチドは、真核細胞において発現するようにコドンによって最適化されている、前述実施の形態のいずれか1項に記載のポリヌクレオチド。
【0340】
20. 前記ポリヌクレオチドは、SEQ ID NO:21~40のうちのいずれか一つに示すヌクレオチド配列と少なくとも80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%又は100%の同一性を有するヌクレオチド配列を含む、前述実施の形態のいずれか1項に記載のポリヌクレオチド。
【0341】
21. 前述実施の形態のいずれか1項に記載のポリヌクレオチドを含む、ベクター。
【0342】
22. 前記ポリヌクレオチドは、プロモーターに動作可能に連結される、前述実施の形態のいずれか1項に記載のベクター。
【0343】
23. 前記プロモーターは、構成的プロモーター、誘導的プロモーター、広域スペクトルプロモーター、細胞種特異的プロモーター又は組織特異的プロモーターである、前述実施の形態のいずれか1項に記載のベクター。
【0344】
24. 前記ベクターは、プラスミドである、前述実施の形態のいずれか1項に記載のベクター。
【0345】
25. 前記ベクターは、レトロウイルスベクター、ファージベクター、アデノウイルスベクター、単純ヘルペスウイルス(HSV)ベクター、アデノ随伴ウイルス(AAV)ベクター又はレンチウイルスベクターである、前述実施の形態のいずれか1項に記載のベクター。
【0346】
26. 前記AAVベクターは、血清型AAV1、AAV2、AAV4、AAV5、AAV6、AAV7、AAVrh74、AAV8、AAV9、AAV10、AAV11、AAV12とAAV13の組換えAAVベクターから選択される、前述実施の形態のいずれか1項に記載のベクター。
【0347】
27. (1)送達媒体と、(2)前述実施の形態のいずれか1項に記載のCas12iタンパク質、ポリヌクレオチド又はベクターとを含む、送達システム。
【0348】
28. 前記送達媒体は、ナノ粒子、リポソーム、エキソソーム、微小胞又は遺伝子銃である、前述実施の形態のいずれか1項に記載の送達システム。
【0349】
29. 操作された、天然に存在しないCRISPR-Casシステムであって、
前述実施の形態のいずれか1項に記載のCas12iタンパク質、又は前記Cas12iタンパク質をコードするポリヌクレオチドと、
CRISPR RNA(crRNA)、又は前記crRNAをコードするポリヌクレオチドとを含み、前記crRNAは、
標的DNAの標的配列にハイブリダイズ可能なスペーサー領域と、
前記スペーサー領域に連結され且つ前記Cas12iタンパク質と前記crRNAとの結合をガイドして前記標的配列を標的とするCRISPR-Cas複合体を形成することができるダイレクトリピート配列(DR)とを含む、CRISPR-Casシステム。
前記Cas12iタンパク質は、前記crRNAに結合して前記標的配列を標的とすることができ、ここで、前記標的配列は、一本鎖又は二本鎖DNA又はRNAである。
【0350】
30. 一つ又は複数のベクターを含むCRISPR-Casシステムであって、前記一つ又は複数のベクターは、
前述実施の形態のいずれか1項に記載のCas12iタンパク質をコードするヌクレオチド配列に動作可能に連結される第1の調節要素と、
CRISPR RNA(crRNA)をコードするポリヌクレオチドに動作可能に連結される第2の調節要素とを含み、前記crRNAは、
標的DNAの標的配列にハイブリダイズ可能なスペーサー領域と、
前記スペーサー領域に連結される、前記Cas12iタンパク質と前記crRNAとの結合をガイドして前記標的配列を標的とするCRISPR-Cas複合体を形成することができるダイレクトリピート配列(DR)とを含み、
ここで、前記第1の調節要素と前記第2の調節要素は、前記CRISPR-Casベクターシステムの同じ又は異なるベクター上に位置する、CRISPR-Casシステム。
【0351】
31. 操作された、天然に存在しないCRISPR-Cas複合体であって、
上記実施の形態のいずれか1項に記載のCas12iタンパク質と、
CRISPR RNA(crRNA)とを含み、前記crRNAは、
標的DNAの標的配列にハイブリダイズ可能なスペーサー領域と、
前記スペーサー領域に連結されるダイレクトリピート配列(DR)とを含み、前記DRは、前記Cas12iタンパク質と前記crRNAとの結合をガイドする、CRISPR-Cas複合体。
【0352】
32. 前記スペーサー領域の長さは、16個のヌクレオチドよりも大きく、好ましくは16から100個のヌクレオチド、より好ましくは16から50個のヌクレオチド(例えば、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個のヌクレオチド)、より好ましくは16から27個のヌクレオチド、より好ましくは17から24個のヌクレオチド、より好ましくは18から24個のヌクレオチド、且つ最も好ましくは18から22個のヌクレオチドである、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0353】
33. 前記DRは、SEQ ID NO:11~20のうちのいずれか一つに示すDRの二次構造と実質的に同じ二次構造を有する、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0354】
34. 前記DRは、ヌクレオチド付加、挿入、欠失又は置換を有し、SEQ ID NO:11~20のうちのいずれか一つに示すDRと比べて二次構造の実質的な差異を生じない、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0355】
35. 前記DRは、前記DRの3’末端近傍のステム-ループ構造を含み、
ここで、前記ステム-ループ構造は、5’-XNNNnNNNX10-3’(X、X、X、X、X、X、X、X、XとX10は、任意の塩基であり、nは、任意の核塩基又は欠失であり、Nは、任意の核塩基である)を含み、ここで、XとX10は、互いにハイブリダイズ可能である、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0356】
36. 前記DRは、以下のいずれかから選択されるステム-ループ構造を含み、
前記DRの3’末端近傍の5’-CUCCCNNNNNNUGGGAG-3’(SEQ ID NO:)、ここで、Nは、任意の核塩基であり、
前記DRの3’末端近傍の5’-CUCCUNNNNNNUGGGAG-3’(SEQ ID NO:)、ここで、Nは、任意の核塩基であり、
前記DRの3’末端近傍の5’-GUCCCNNNNNNUGGGAC-3’(SEQ ID NO:)、ここで、Nは、任意の核塩基であり、
前記DRの3’末端近傍の5’-GUGUCNNNNNNUGACAC-3’(SEQ ID NO:)、ここで、Nは、任意の核塩基であり、
前記DRの3’末端近傍の5’-GUGCCNNNNNNUGGCAC-3’(SEQ ID NO:)、ここで、Nは、任意の核塩基であり、
前記DRの3’末端近傍の5’-UGUGUNNNNNNUCACAC-3’(SEQ ID NO:)、ここで、Nは、任意の核塩基であり、
前記DRの3’末端近傍の5’-CCGUCNNNNNNUGACGG-3’(SEQ ID NO:)、ここで、Nは、任意の核塩基であり、
前記DRの3’末端近傍の5’-GUUUCNNNNNNUGAAAC-3’(SEQ ID NO:)、ここで、Nは、任意の核塩基であり、
前記DRの3’末端近傍の5’-GUGUUNNNNNNUAACAC-3’(SEQ ID NO:)、ここで、Nは、任意の核塩基であり、及び
前記DRの3’末端近傍の5’-UUGUCNNNNNNUGACAA-3’(SEQ ID NO:)、ここで、Nは、任意の核塩基である、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0357】
37. 前記CRISPR-Casシステム又は複合体は、前記スペーサー領域にハイブリダイズ可能な標的DNAをさらに含む、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0358】
38. 前記標的DNAは、真核DNAである、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0359】
39. 前記標的DNAは、細胞にあり、好ましくは前記細胞は、原核細胞、真核細胞、動物細胞、植物細胞、真菌細胞、脊椎動物細胞、無脊椎動物細胞、げっ歯動物細胞、哺乳動物細胞、霊長類動物細胞、非ヒト霊長類動物細胞とヒト細胞から選択される、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0360】
40. 前記crRNAは、前記標的DNAの標的配列にハイブリダイズして複合体を形成し、前記Cas12iタンパク質による前記標的配列の切断を引き起こす、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0361】
41. 前記標的配列は、プロトスペーサー隣接モチーフ(PAM)の3’末端にある、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0362】
42. 前記PAMは、5’-Tに富むモチーフを含む、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0363】
43. 前記PAMは、5’-TTA、5’-TTT、5’-TTG、5’-TTC、5’-ATA又は5’-ATGである、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0364】
44. 前記一つ又は複数のベクターは、一つ又は複数のレトロウイルスベクター、ファージベクター、アデノウイルスベクター、単純ヘルペスウイルス(HSV)ベクター、アデノ随伴ウイルス(AAV)ベクター、又はレンチウイルスベクターを含む、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0365】
45. 前記AAVベクターは、血清型AAV1、AAV2、AAV4、AAV5、AAV6、AAV7、AAVrh74、AAV8、AAV9、AAV10、AAV11、AAV12とAAV13の組換えAAVベクターから選択される、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0366】
46. 前記調節要素は、プロモーターを含む、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0367】
47. 前記プロモーターは、構成的プロモーター、誘導的プロモーター、広域スペクトルプロモーター、細胞種特異的プロモーター又は組織特異的プロモーターから選択される、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0368】
48. 前記プロモーターは、真核細胞に機能を有する、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0369】
49. 前記真核細胞は、動物細胞、植物細胞、真菌細胞、脊椎動物細胞、無脊椎動物細胞、げっ歯動物細胞、哺乳動物細胞、霊長類動物細胞、非ヒト霊長類動物細胞とヒト細胞を含む、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0370】
50. 前記CRISPR-Casシステム又は複合体は、任意選択的に、相同性指向修復(HDR)によって関心のある遺伝子座に挿入されるDNAドナーテンプレートをさらに含む、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0371】
51. 細胞又はその子孫であって、前述実施の形態のいずれか1項に記載のCas12iタンパク質、ポリヌクレオチド、ベクター、送達システム、CRISPR-Casシステム又は複合体を含み、ここで、好ましくは、前記細胞は、原核細胞、真核細胞、動物細胞、植物細胞、真菌細胞、脊椎動物細胞、無脊椎動物細胞、げっ歯動物細胞、哺乳動物細胞、霊長類動物細胞、非ヒト霊長類動物細胞とヒト細胞から選択される、細胞又はその子孫。
【0372】
52. 非ヒト多細胞生物であって、前述実施の形態のいずれか1項に記載の細胞又はその子孫を含み、好ましくは、前記非ヒト多細胞生物は、ヒト遺伝子関連疾患の動物(例えば、げっ歯動物又は非ヒト霊長類動物)モデルである、非ヒト多細胞生物。
【0373】
53. 標的DNAを修飾する方法であって、標的DNAを前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体に接触させることを含み、前記接触は、前記標的DNAのCas12iタンパク質による修飾を引き起こす、方法。
【0374】
54. 前記修飾は、インビトロ細胞外部で発生する、前述実施の形態のいずれか1項に記載の方法。
【0375】
55. 前記修飾は、インビトロ細胞内部で発生する、前述実施の形態のいずれか1項に記載の方法。
【0376】
56. 前記修飾は、インビボ細胞内部で発生する、前述実施の形態のいずれか1項に記載の方法。
【0377】
57. 前記細胞は、真核細胞である、前述実施の形態のいずれか1項に記載の方法。
【0378】
58. 前記真核細胞は、動物細胞、植物細胞、真菌細胞、脊椎動物細胞、無脊椎動物細胞、げっ歯動物細胞、哺乳動物細胞、霊長類動物細胞、非ヒト霊長類動物細胞とヒト細胞から選択される、前述実施の形態のいずれか1項に記載の方法。
【0379】
59. 前記修飾は、前記標的DNAを切断することであり、
任意選択的に、前記切断は、一本鎖DNAを切断する方式で行われ、又は任意選択的に、二本鎖DNAの同じ部位又は異なる部位を順次切断する方式で行われる、前述実施の形態のいずれか1項に記載の方法。
【0380】
60. 前記切断は、ヌクレオチド配列の欠失及び/又はヌクレオチド配列の挿入を引き起こす、前述実施の形態のいずれか1項に記載の方法。
【0381】
61. 前記切断は、二つの部位で前記標的核酸を切断し、前記二つの部位の間の配列の欠失又は反転を引き起こすことを含む、前述実施の形態のいずれか1項に記載の方法。
【0382】
62. 前記修飾は、塩基変異であり、好ましくはA→G又はC→T塩基変異である、前述実施の形態のいずれか1項に記載の方法。
【0383】
63. 前述実施の形態のいずれか1項に記載の方法からの細胞又はその子孫であって、前記方法を受けていない細胞に存在しない修飾を含む、細胞又はその子孫。
【0384】
64. 前記方法を受けていない細胞は、異常を含み且つ前記方法による前記細胞における異常は、既に解決又は修正されている、前述実施の形態のいずれか1項に記載の細胞又はその子孫。
【0385】
65. 前述実施の形態のいずれか1項に記載の細胞又はその子孫からの細胞生成物であって、前記方法を受けていない細胞からの細胞生成物の性質又は量に対して、修飾されている、細胞生成物。
【0386】
66. 前記方法を受けていない細胞は、異常を含み、且つ前記細胞生成物は、前記異常が既に前記方法によって解決又は修正されていることを反映する、前述実施の形態のいずれか1項に記載の細胞生成物。
【0387】
67. 非標的DNAを非特異的に切断する方法であって、前記標的DNAを前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体と接触させることによって、前記スペーサー領域と前記標的DNAの標的配列とのハイブリダイズ及び前記標的配列の前記Cas12iタンパク質による切断により、前記Cas12iタンパク質がスペーサー領域非特異性エンドヌクレアーゼバイパス活性によって前記非標的DNAを切断することを含む、方法。
【0388】
68. サンプルにおける標的DNAを検出する方法であって、
前記サンプルを、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体及び切断後に検出可能なシグナルを放出することができるレポーター核酸と接触させることによって、前記スペーサー領域と前記標的DNAの標的配列とのハイブリダイズ及び前記標的配列の前記Cas12iタンパク質による切断により、前記Cas12iタンパク質がスペーサー領域非特異性エンドヌクレアーゼバイパス活性によって前記レポーター核酸を切断することと、
前記レポーター核酸の切断によって産生される検出可能なシグナルを測定することによって、前記サンプルにおける前記標的DNAの存在を検出することとを含む、方法。
【0389】
69. 前記方法は、前記検出可能なシグナルのレベルと参照シグナルのレベルとを比較し、前記検出可能なシグナルのレベルに基づいて前記サンプルにおける前記標的DNAのレベルを決定することをさらに含む、前述実施の形態のいずれか1項に記載の方法。
【0390】
70. 前記測定は、金ナノ粒子検出、蛍光偏光、コロイド相転移/分散、電気化学の検出又は半導体ベースの検知を用いて行われる、前述実施の形態のいずれか1項に記載の方法。
【0391】
71. 前記レポーター核酸は、蛍光発光色素対、蛍光共鳴エネルギー伝達(FRET)対又はクエンチャ/蛍石対を含み、且つ前記レポーター核酸の前記Cas12iタンパク質による切断により、前記レポーター核酸の切断によって産生される前記検出可能なシグナルのレベルが増加するか又は低減する、前述実施の形態のいずれか1項に記載の方法。
【0392】
72. それを必要とする被験体の病症又は疾患を治療する方法であって、前記被験体に前述実施の形態のいずれか1項に記載のCRISPR-Casシステムを投与することを含む、方法。
【0393】
73. 前記病症又は疾患は、癌又は感染性疾患又は神経疾患であり、
任意選択的に、前記癌は、
ウィルムス腫瘍、ユーイング肉腫、神経内分泌腫瘍、神経膠芽腫、神経芽細胞腫、黒色腫、皮膚癌、乳癌、結腸癌、直腸癌、前立腺癌、肝癌、腎癌、膵癌、肺癌、胆道癌、子宮頸癌、子宮体癌、食道癌、胃癌、頭頚部癌、髄様甲状腺癌、卵巣癌、神経膠腫、リンパ腫、白血病、骨髄瘤、急性リンパ芽球性白血病、急性骨髄性白血病、慢性リンパ球性白血病、慢性骨髄性白血病、ホジキンリンパ腫、非ホジキンリンパ腫と膀胱癌から選択され、
任意選択的に、前記感染性疾患は、
ヒト免疫不全ウイルス(HIV)、単純ヘルペスウイルス-1(HSV1)と単純ヘルペスウイルス-2(HSV2)によって引き起こされ、
任意選択的に、前記神経障害は、
緑内障、加齢に伴うRGCの喪失、視神経損傷、網膜虚血、レーベル遺伝性視神経症、RGCニューロンの変性に関連する神経疾患、それを必要とする被験者の線条体の機能性ニューロン変性に関連する神経疾患、パーキンソン病(Parkinson’s disease)、アルツハイマー病(Alzheimer’s disease)、ハンチントン病(Huntington’s disease)、統合失調症、うつ病、薬物依存症、運動障害(例えば舞踏病、舞踏病様症状と運動障害)、双極性障害、自閉症スペクトラム障害(ASD)又は機能不全から選択される、前述実施の形態のいずれか1項に記載の方法。
【0394】
74. 前記病症又は疾患は、嚢胞性線維症、進行性偽肥大性筋ジストロフィー、ベッカー型筋ジストロフィー(Becker muscular dystrophy)、α-1-アンチトリプシン欠乏症、ポンペ病(Pompe disease)、筋強直性ジストロフィー、ハンチントン病、脆弱X症候群、フリードライヒ失調症(Friedreich ataxia)、筋萎縮性側索硬化症、前頭側頭型認知症、遺伝性慢性腎臓病、高脂血症、高コレステロール血症、レーベル先天性黒内障(Leber congenital amaurosis)、鎌状赤血球症とβサラセミアから選択される、前述実施の形態のいずれか1項に記載の方法。
【0395】
75. 前記病症又は疾患は、病原性点突然変異の存在によって引き起こされる、前述実施の形態のいずれか1項に記載の方法。
【0396】
76. 前述実施の形態のいずれか1項に記載のCRISPR-Casシステムを含み、好ましくは、前記システムの成分は、同の一容器又は単独の容器にある、キット。
【0397】
77. 前述実施の形態のいずれか1項に記載のCRISPR-Casシステムを含み、好ましくは、前記無菌容器は、注射器である、無菌容器。
【0398】
78. 前述実施の形態のいずれか1項に記載のCRISPR-Casシステムを含み、好ましくは、前記CRISPR-Casシステムは、リザーバーに保存される、植え込み可能な装置。
バイパス活性
【0399】
Cas12iタンパク質は、バイパス活性を有してもよく、即ち、いくつかの条件下で、活性化されたCas12iタンパク質は、標的配列に結合した後に活性を維持し、非標的オリゴヌクレオチドを非特異的に切断し続けるこのようなバイパス活性は、Cas12iシステムを用いて特定の標的オリゴヌクレオチドの存在を検出することを可能にする。一つの実施の形態では、Cas12iシステムは、ssDNA又は転写物を非特異的に切断するように操作される。いくつかの実施の形態では、Cas12iは、インビトロ系又は細胞において一時的又は安定的に提供又は発現され、細胞核酸、例えばssDNA、例えばウイルスssDNAを非特異的に切断するようにターゲッティング又は誘発される。いくつかの実施の形態では、本明細書に記載のCas12iタンパク質は、スペーサー領域非特異性エンドヌクレアーゼ切断活性を低減(例えば、少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%又はそれ以上のうちのいずれか一つほど低減)又は消失させるように修飾される。いくつかの実施の形態では、本明細書に記載のCas12iタンパク質は、(例えば、少なくとも約50%、60%、70%、80%、90%、95%又は100%のうちのいずれか一つほどない)親/参照Cas12iタンパク質(例えば、SEQ ID NO:1~10のうちのいずれか一つのCas12iタンパク質)の、非標的DNAに対するスペーサー領域非特異性エンドヌクレアーゼバイパス活性を基本的に有さない。
【0400】
バイパス活性は最近、SHERLOCKと呼ばれる高感度且つ特異的な核酸検出プラットフォームに利用されており、該プラットフォームは、多くの臨床診断に用いられてもよい(Gootenberg,J.S.ら,Nucleic acid detection with CRISPR-Cas13a/C2c2.[CRISPR-Cas13a/C2c2による核酸検出]Science[サイエンス]356,438-442(2017))。
レポーター核酸
【0401】
「レポーター核酸」とは、本明細書に記載の活性化されたCRISPRシステムタンパク質によって切断又は不活性化され得る分子である。レポーター核酸は、CRISPRタンパク質によって切断され得る核酸要素を含む。核酸要素の切断は、薬剤を放出するか、又はコンホメーション変化を生じ、それによって検出可能なシグナルを産生する。レポーター核酸は、切断前又はレポーター核酸が「活性」状態にある時に陽性の検出可能なシグナルの産生又は検出を防止する。理解すべきこととして、いくつかの例示的な実施の形態では、活性レポーター核酸の存在下で最小限のバックグラウンドシグナルが産生され得る。陽性の検出可能なシグナルは、光学、蛍光、化学発光、電気化学的方法又は当分野において既知の他の検出方法を使用して検出可能な任意のシグナルであってもよい。例えば、いくつかの実施の形態では、レポーター核酸が存在する時、第1のシグナル(即ち、陰性の検出可能なシグナル)を検出することができるとともに、そして、標的分子を検出し、且つレポーター核酸が、活性化されたCRISPRタンパク質によって切断又は不活性化される時、第1のシグナルは、第2のシグナル(例えば、陽性の検出可能なシグナル)に変換される。
機能ドメイン
【0402】
機能ドメインは、その最も広い意味で使用され、タンパク質、例えば酵素又は因子自体又はその特定の機能断片(ドメイン)を含む。
【0403】
Cas12iタンパク質(例えば、dCas12i)は、デアミナーゼ(例えば、アデノシンデアミナーゼ又はシチジンデアミナーゼ)触媒ドメイン、DNAメチル化触媒ドメイン、DNA脱メチル化触媒ドメイン、ヒストン残基修飾ドメイン、ヌクレアーゼ触媒ドメイン、蛍光タンパク質、転写修飾因子(例えば、転写活性化触媒ドメイン、転写阻害触媒ドメイン)、核局在化シグナル(NLS)、核外輸送シグナル(NES)、光ゲーティング因子、化学誘導因子又はクロマチン可視化因子から選択される一つ又は複数の機能ドメインに関連し、好ましくは、該機能ドメインは、アデノシンデアミナーゼ触媒ドメイン又はシチジンデアミナーゼ触媒ドメインから選択される。
【0404】
いくつかの実施の形態では、該機能ドメインは、転写活性化ドメインであってもよい。いくつかの実施の形態では、該機能ドメインは、転写阻害ドメインである。いくつかの実施の形態では、該機能ドメインは、エピジェネティック修飾ドメインであり、それによってエピジェネティック修飾酵素を提供する。いくつかの実施の形態では、該機能ドメインは、活性化ドメインである。いくつかの実施の形態では、該Cas12iタンパク質は、一つ又は複数の機能ドメインに関連し、且つ該Cas12iタンパク質は、RuvCドメイン内に一つ又は複数の突然変異を含有し、且つ得られたCRISPR複合体は、エピジェネティック修飾物を送達するか、又は活性化シグナル又は阻害シグナルを転写又は翻訳することができる。
【0405】
いくつかの実施の形態では、該機能ドメインは、標的DNA、又は標的DNAに関連するタンパク質を修飾する活性を示し、ここで、該活性は、ヌクレアーゼ活性(例えば、HNHヌクレアーゼ、RuvCヌクレアーゼ、Trex1ヌクレアーゼ、Trex2ヌクレアーゼ)、メチル化活性、脱メチル化活性、DNA修復活性、DNA損傷活性、脱アミノ活性、ジスムターゼ活性、アルキル化活性、脱プリン活性、酸化活性、ピリミジンダイマー形成活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、グリコシダーゼ活性、アセチルトランスフェラーゼ活性、脱アセチル化酵素活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、肉ミリストイル化活性、脱肉ミリストイル化活性、グリコシル化活性(例えば、O-GlcNAcトランスフェラーゼ由来)、脱グリコシル化活性、転写阻害活性と転写活性化活性から選択される一つ又は複数である。標的DNA関連タンパク質は、標的DNAに結合可能なタンパク質、又は標的DNAに結合されるタンパク質に結合可能なタンパク質、例えばヒストン、転写因子、メディエーターなどを含むが、それらに限らない。
【0406】
該機能ドメインは、例えば、メチラーゼ活性、デメチラーゼ活性、転写活性化活性、転写阻害活性、転写放出因子活性、ヒストン修飾活性、RNA切断活性、DNA切断活性、核酸結合活性と分子スイッチ(例えば、光誘導)から選択される一つ又は複数を有するドメインであってもよい。一つ以上の機能ドメインを含む場合、これらの機能ドメインは、同じであっても異なってもよい。
塩基編集
【0407】
いくつかの例示的な実施の形態では、Cas12i(例えば、dCas12i)は、塩基編集目的のためにアデノシンデアミナーゼ又はシチジンデアミナーゼに融合されてもよい。
アデノシンデアミナーゼ
【0408】
本明細書で使用されるように、用語である「アデノシンデアミナーゼ」又は「アデノシンデアミナーゼタンパク質」とは、以下に示すように、アデニン(又は分子のアデニン部分)をヒポキサンチン(又は分子のヒポキサンチン部分)に変換するために水解脱アミノ反応を触媒することができるタンパク質、ポリペプチド、又はタンパク質又はポリペプチドの一つ又は複数の機能ドメインである。いくつかの実施の形態では、アデニン含有分子は、アデノシン(A)であり、且つヒポキサンチン含有分子は、イノシン(I)である。アデニン含有分子は、デオキシリボ核酸(DNA)又はリボ核酸(RNA)であってもよい。
【0409】
本開示によれば、本開示と組み合わせて使用され得るアデノシンデアミナーゼは、RNAに作用するアデノシンデアミナーゼ(ADAR)と呼ばれる酵素ファミリーメンバー、tRNAに作用するアデノシンデアミナーゼ(ADAT)と呼ばれる酵素ファミリーメンバー、及びアデノシンデアミナーゼドメイン(ADAD)を含む他のファミリーメンバーを含むが、それらに限らない。本開示によれば、アデノシンデアミナーゼは、RNA/DNAとRNA二本鎖におけるアデニンを標的とすることができる。事実的に、Zhengら(Nucleic Acids Res.[核酸研究]2017,45(6):3369-3377)は、ADARがRNA/DNAとRNA/RNA二本鎖においてアデノシンをイノシンに編集できることを証明した。特定の実施の形態では、以下に詳細に記述するように、アデノシンデアミナーゼは、それがRNA二本鎖のRNA/DNAヘテロ二本鎖におけるDNAを編集する能力を増加させるように修飾されている。
【0410】
いくつかの実施の形態では、該アデノシンデアミナーゼは、一つ又は複数の後生動物種に由来し、哺乳動物、鳥類、カエル類、イカ、魚類、ハエとワームを含むが、それらに限らない。いくつかの実施の形態では、該アデノシンデアミナーゼは、ヒト、イカ又はショウジョウバエのアデノシンデアミナーゼである。
【0411】
いくつかの実施の形態では、該アデノシンデアミナーゼは、hADAR1、hADAR2とhADAR3を含むヒトADARである。いくつかの実施の形態では、該アデノシンデアミナーゼは、ADR-1とADR-2とを含むカエノラブディティス・エレガンスADARタンパク質である。いくつかの実施の形態では、該アデノシンデアミナーゼは、dAdarを含むショウジョウバエADARタンパク質である。いくつかの実施の形態では、該アデノシンデアミナーゼは、sqADAR2aとsqADAR2bとを含むイカ(ロリゴペアリ(Loligo pealeii))ADARタンパク質である。いくつかの実施の形態では、該アデノシンデアミナーゼは、ヒトADATタンパク質である。いくつかの実施の形態では、該アデノシンデアミナーゼは、ショウジョウバエADATタンパク質である。いくつかの実施の形態では、該アデノシンデアミナーゼは、TENR(hADAD1)とTENRL(hADAD2)とを含むヒトADADタンパク質である。
【0412】
いくつかの実施の形態では、該アデノシンデアミナーゼは、TadAタンパク質、例えば大腸菌(E. coli)TadAである。Kimら,Biochemistry[生化学]45:6407-6416(2006)、Wolfら,EMBO J.[欧州分子生物学機構ジャーナル]21:3841-3851(2002)を参照する。いくつかの実施の形態では、該アデノシンデアミナーゼは、マウスADAである。Grunebaumら,Curr. Opin. Allergy Clin. Immunol.[アレルギーと臨床免疫学の最新の観点]13:630-638(2013)を参照する。いくつかの実施の形態では、該アデノシンデアミナーゼは、ヒトADAT2である。Fukuiら,J. Nucleic Acids[核酸ジャーナル]2010:260512(2010)を参照する。いくつかの実施の形態では、該デアミナーゼ(例えば、アデノシンデアミナーゼ又はシチジンデアミナーゼ)は、以下の文献Coxら,Science.[サイエンス]2017年11月24日;358(6366):1019-1027、Komoreら,Nature.[ネイチャー]2016年5月19日;533(7603):420-4、とGaudelliら,Nature.[ネイチャー]2017年11月23日;551(7681):464-471に記述されるそれらのデアミナーゼのうちの一つ又は複数である。
【0413】
いくつかの実施の形態では、該アデノシンデアミナーゼタンパク質は、二本鎖核酸基質における一つ又は複数の標的アデノシン残基を認識し、それらをイノシン残基に変換する。いくつかの実施の形態では、二本鎖核酸基質は、RNA-DNAヘテロ二本鎖である。いくつかの実施の形態では、アデノシンデアミナーゼタンパク質は、二本鎖基質上の結合窓を認識する。いくつかの実施の形態では、結合窓は、少なくとも一つの標的アデノシン残基を含む。いくつかの実施の形態では、結合窓は、約3bpから約100bpの範囲内にある。いくつかの実施の形態では、結合窓は、約5bpから約50bpの範囲内にある。いくつかの実施の形態では、結合窓は、約10bpから約30bpの範囲内にある。いくつかの実施の形態では、結合窓は、約1bp、2bp、3bp、5bp、7bp、10bp、15bp、20bp、25bp、30bp、40bp、45bp、50bp、55bp、60bp、65bp、70bp、75bp、80bp、85bp、90bp、95bp又は100bpである。
【0414】
いくつかの実施の形態では、該アデノシンデアミナーゼタンパク質は、一つ又は複数のデアミナーゼドメインを含む。特定の理論に束縛されることは望ましくないが、該デアミナーゼドメインが二本鎖核酸基質に含まれる一つ又は複数の標的アデノシン(A)残基を認識、それらをイノシン(I)残基に変換するために用いられることを考慮する。いくつかの実施の形態では、該デアミナーゼドメインは、活性中心を含む。いくつかの実施の形態では、活性中心は、亜鉛イオンを含む。いくつかの実施の形態では、A-I編集期間に、標的アデノシン残基における塩基対が破壊され、且つ標的アデノシン残基が二重螺旋から「反転」してアデノシンデアミナーゼによって近接可能になる。いくつかの実施の形態では、活性中心における又は付近のアミノ酸残基は、標的アデノシン残基5’の一つ又は複数のヌクレオチドと相互作用する。いくつかの実施の形態では、活性中心における又は付近のアミノ酸残基は、標的アデノシン残基3’の一つ又は複数のヌクレオチドと相互作用する。いくつかの実施の形態では、活性中心における又は付近のアミノ酸残基は、反対鎖上の標的アデノシン残基に相補的なヌクレオチドとも相互作用する。いくつかの実施の形態では、アミノ酸残基は、ヌクレオチドの2’水酸基と水素結合を形成する。
【0415】
いくつかの実施の形態では、該アデノシンデアミナーゼは、ヒトADAR2全タンパク質(hADAR2)又はそのデアミナーゼドメイン(hADAR2-D)を含む。いくつかの実施の形態では、該アデノシンデアミナーゼは、hADAR2又はhADAR2-Dに相同なADARファミリーのメンバーである。
【0416】
具体的には、いくつかの実施の形態では、相同ADARタンパク質は、ヒトADAR1(hADAR1)又はそのデアミナーゼドメイン(hADAR1-D)である。いくつかの実施の形態では、hADAR1-Dのグリシン1007は、グリシン487hADAR2-Dに対応し、且つhADAR1-Dのグルタミン酸1008は、hADAR2-Dのグルタミン酸488に対応する。
【0417】
いくつかの実施の形態では、該アデノシンデアミナーゼは、hADAR2-Dの野生型アミノ酸配列を含む。いくつかの実施の形態では、該アデノシンデアミナーゼは、hADAR2-Dの編集効率及び/又は基質編集の好みが必要に応じて変化するように、hADAR2-D配列に一つ又は複数の突然変異を含む。
【0418】
いくつかの実施の形態では、アデノシンデアミナーゼは、TadA8e、例えばSEQ ID NO:182の配列を含むTadA8eである。いくつかの実施の形態では、本明細書に記載のCas12iタンパク質(例えば、dCas12i)は、TadA8e又はその機能性断片に融合している(即ち、AからIの一塩基編集が可能である)。
シチジンデアミナーゼ
【0419】
いくつかの実施の形態では、該デアミナーゼは、シチジンデアミナーゼである。本明細書で使用されるように、用語である「シチジンデアミナーゼ」又は「シチジンデアミナーゼタンパク質」とは、以下に示すように、シトシン(又は分子のシトシン部分)をウラシル(又は分子のウラシル部分)に変換するために水解脱アミノ反応を触媒することができるタンパク質、ポリペプチド、又はタンパク質又はポリペプチドの一つ又は複数の機能ドメインである。いくつかの実施の形態では、シトシン含有分子は、シチジン(C)であり、且つウラシル含有分子は、ウリジン(U)である。シトシン含有分子は、デオキシリボ核酸(DNA)又はリボ核酸(RNA)であってもよい。
【0420】
本開示によれば、本開示と組み合わせて使用され得るシチジンデアミナーゼは、アポリポタンパク質B mRNA編集複合体(APOBEC)ファミリーデアミナーゼ、活性化誘導デアミナーゼ(AID)又はシチジンデアミナーゼ1(CDA1)と呼ばれる酵素ファミリーのメンバーを含むが、それらに限らず、且つ発明を実施するための形態では、APOBEC1デアミナーゼ、APOBEC2デアミナーゼ、APOBEC3Aデアミナーゼ、APOBEC3Bデアミナーゼ、APOBEC3CデアミナーゼとAPOBEC3Dデアミナーゼ、APOBEC3Eデアミナーゼ、APOBEC3Fデアミナーゼ、APOBEC3Gデアミナーゼ、APOBEC3Hデアミナーゼ又はAPOBEC4デアミナーゼのうちのデアミナーゼである。
【0421】
本発明の方法とシステムでは、シチジンデアミナーゼは、DNA一本鎖におけるシトシンを標的とすることができる。いくつかの例示的な実施の形態では、シチジンデアミナーゼは、結合成分の外部に存在する一本鎖上で編集されてもよく、例えばCas13に結合される。他の例示的な実施の形態では、シチジンデアミナーゼは、局所バブルで編集されてもよく、例えば標的編集部位に形成されるがガイド配列ミスマッチを有するバブルで編集される。いくつかの例示的な実施の形態では、該シチジンデアミナーゼは、集束活性に寄与する突然変異、例えばKimら,Nature Biotechnology[ネイチャー・バイオテクノロジー](2017)35(4):371-377(doi:10.1038/nbt.3803)に記述されるそれらの突然変異を含んでもよい。
【0422】
いくつかの実施の形態では、該シチジンデアミナーゼは、一つ又は複数の後生動物種に由来し、哺乳動物、鳥類、カエル類、イカ、魚類、ハエとワームを含むが、それらに限らない。いくつかの実施の形態では、該シチジンデアミナーゼは、ヒト、霊長類、ウシ、イヌ、ラット又はマウスシチジンデアミナーゼである。
【0423】
いくつかの実施の形態では、該シチジンデアミナーゼは、hAPOBEC1又はhAPOBEC3を含むヒトAPOBECである。いくつかの実施の形態では、該シチジンデアミナーゼは、ヒトAIDである。
【0424】
いくつかの実施の形態では、該シチジンデアミナーゼタンパク質は、RNA二本鎖の一本鎖バブルにおける一つ又は複数の標的シトシン残基を認識し、それらをウラシル残基に変換する。いくつかの実施の形態では、該シチジンデアミナーゼタンパク質は、RNA二本鎖の一本鎖バブル上の結合窓を認識する。いくつかの実施の形態では、結合窓は、少なくとも一つの標的シトシン残基を含む。いくつかの実施の形態では、結合窓は、約3bpから約100bpの範囲内にある。いくつかの実施の形態では、結合窓は、約5bpから約50bpの範囲内にある。いくつかの実施の形態では、結合窓は、約10bpから約30bpの範囲内にある。いくつかの実施の形態では、結合窓は、約1bp、2bp、3bp、5bp、7bp、10bp、15bp、20bp、25bp、30bp、40bp、45bp、50bp、55bp、60bp、65bp、70bp、75bp、80bp、85bp、90bp、95bp又は100bpである。
【0425】
いくつかの実施の形態では、該シチジンデアミナーゼタンパク質は、一つ又は複数のデアミナーゼドメインを含む。理論に束縛されることは望ましくないが、デアミナーゼドメインがRNA二本鎖の一本鎖バブルに含まれる一つ又は複数の標的シトシン(C)残基を認識し、それらをウラシル(U)残基に変換するために用いられることを考慮する。いくつかの実施の形態では、該デアミナーゼドメインは、活性中心を含む。いくつかの実施の形態では、活性中心は、亜鉛イオンを含む。いくつかの実施の形態では、活性中心における又は付近のアミノ酸残基は、標的シトシン残基5’における一つ又は複数のヌクレオチドと相互作用する。いくつかの実施の形態では、活性中心における又は付近のアミノ酸残基は、標的シトシン残基3’における一つ又は複数のヌクレオチドと相互作用する。
【0426】
いくつかの実施の形態では、該シチジンデアミナーゼは、ヒトAPOBEC1全タンパク質(hAPOBEC1)又はそのデアミナーゼドメイン(hAPOBEC1-D)又はそのC-末端切断形式(hAPOBEC-T)を含む。いくつかの実施の形態では、該シチジンデアミナーゼは、hAPOBEC1、hAPOBEC-D又はhAPOBEC-Tに相同なAPOBECファミリーのメンバーである。いくつかの実施の形態では、該シチジンデアミナーゼは、ヒトAID1全タンパク質(hAID)又はそのデアミナーゼドメイン(hAID-D)又はそのC-末端切断形式(hAID-T)を含む。いくつかの実施の形態では、該シチジンデアミナーゼは、hAID、hAID-D又はhAID-Tに相同なAIDファミリーのメンバーである。いくつかの実施の形態では、hAID-Tは、C-末端の約20個のアミノ酸が切断されたhAIDである。
【0427】
いくつかの実施の形態では、該シチジンデアミナーゼは、シトシンデアミナーゼの野生型アミノ酸配列を含む。いくつかの実施の形態では、該シチジンデアミナーゼは、シトシンデアミナーゼの編集効率及び/又は基質編集の好みが必要に応じて変化するように、シトシンデアミナーゼ配列に一つ又は複数の突然変異を含む。
【0428】
本明細書で使用されるように、「関連」は、その最も広い意味で使用され、且つそのうちの二つの機能モジュールが直接的又は間接的に(リンカーを介して)融合タンパク質を形成する状況、及びそのうちの二つの機能モジュールがそれぞれ独立して共有結合(例えば、ジスルフィド結合)又は非共有結合によって結合される状況をカバーする。
【0429】
用語である「ベクター」とは、それに連結される別の核酸を輸送することができる核酸分子を指す。それは、レプリコン、例えばプラスミド、ファージ又はコスミドであり、その中に別のDNAセグメントを挿入して、挿入されたセグメントの複製を実現することができる。一般的には、適切な制御要素と組み合わせると、ベクターは、複製可能である。
【0430】
場合によっては、ベクターシステムは、単一のベクターを含む。代替的に、ベクターシステムは、複数のベクターを含む。ベクターは、ウイルスベクターであってもよい。
【0431】
ベクターは、一本鎖、二本鎖又は部分的に二本鎖の核酸分子と、一つ又は複数の自由端を含むか、又は自由端(例えば、環状)がない核酸分子と、DNA、RNA又は両方を含む核酸分子と、当分野において既知の他のポリヌクレオチド変異体とを含むが、それらに限らない。一つのタイプのベクターは、「プラスミド」であり、それは、環状二本鎖DNA環を指し、その中に他のDNAセグメントを挿入することができ、例えば標準分子クローニング技術によって挿入される。別のタイプのベクターは、ウイルスベクターであり、その中にウイルス(例えば、レトロウイルス、複製欠損型レトロウイルス、アデノウイルス、複製欠損型アデノウイルスとアデノ随伴ウイルス)にパッケージングするためのウイルス由来のDNA又はRNA配列が存在している。ウイルスベクターは、宿主細胞にトランスフェクションするためにウイルスによって担持されるポリヌクレオチドをさらに含む。いくつかのベクターは、それらが導入される宿主細胞において自律的に複製可能である(例えば、細菌複製始点を有する細菌ベクターとエピソーム哺乳動物ベクター)。これらのベクターを宿主細胞に導入した後、他のベクター(例えば、非エピソーム哺乳動物ベクター)は、宿主細胞のゲノムに組み込まれて宿主ゲノムと共に複製される。また、いくつかのベクターは、それに操作可能に連結される遺伝子の発現をガイドすることができる。このようなベクターは、本明細書において、「発現ベクター」と呼ばれる。真核細胞において発現するベクターと、真核細胞において発現を引き起こすベクターとは、本明細書において「真核発現ベクター」と呼ばれてもよい。組換えDNA技術に使用され得る一般的な発現ベクターは、通常、プラスミド形式である。
【0432】
組換え発現ベクターは、宿主細胞における発現に適した形式の本発明の核酸を含んでもよく、これは、組換え発現ベクターが、一つ又は複数の調節要素を含み、該調節要素が、発現のための宿主細胞に従って選択され得、且つ核酸が、発現すべき核酸配列に動作可能に連結されることを意味する。組換え発現ベクター内で、「動作可能に連結される」とは、関心のあるヌクレオチド配列が、ヌクレオチド配列の発現(例えば、インビトロ転写/翻訳系において発現するか、又はベクターを宿主細胞に導入する時に宿主細胞において発現する)を可能にする方式で調節要素に連結されることを意味することを意図する。有利なベクターは、レンチウイルスとアデノ随伴ウイルスとを含み、且つこれらのベクターのタイプを選択して特定のタイプの細胞を標的とすることもできる。
【0433】
用語である「調節要素」は、プロモーター、エンハンサー、内部リボソーム侵入部位(IRES)と他の発現制御要素(例えば、転写終結シグナル、例えばポリアデニル化シグナルとpoly-U配列)を含むことを意図する。そのような調節要素は、例えば、Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY[遺伝子発現技術:酵素学方法]185,Academic Press,San Diego,Calif.(カリフォルニア州サンディエゴ、学術出版社)(1990)(1990)に記述されている。調節要素は、多くのタイプの宿主細胞においてヌクレオチド配列の構成的発現をガイドするそれらの要素、及びいくつかの宿主細胞においてのみヌクレオチド配列の発現をガイドするそれらの要素(例えば、組織特異的調節配列)を含む。組織特異的プロモーターは、主に所望の標的組織、例えば筋肉、ニューロン、骨、皮膚、血液、特定の器官(例えば、肝臓、膵臓腺)又は特定の細胞型(例えば、リンパ球)における発現をガイドすることができる。調節要素は、時間依存性方式、例えば細胞周期依存性又は発生段階依存性方式で発現をガイドすることもでき、それは、組織又は細胞型特異的であってもよく、そうではなくてもよい。
【0434】
いくつかの実施の形態では、ベクターは、一つ又は複数の核局在化配列(NLS)、例えば約1、2、3、4、5、6、7、8、9、10個又はそれ以上のNLSを含むCas12iタンパク質をコードする。より具体的に、ベクターは、Cas12iタンパク質に天然に存在しない一つ又は複数のNLSを含む。最も特に、NLSは、Cas12iタンパク質配列のベクターの5’及び/又は3’に存在する。いくつかの実施の形態では、ターゲッティングRNAのタンパク質は、アミノ末端又は付近に約1、2、3、4、5、6、7、8、9、10個又はそれ以上のNLSを含み、且つカルボキシル末端又は付近に約1、2、3、4、5、6、7、8、9、10個又はそれ以上のNLS、又はこれらの組み合わせを含む(例えば、アミノ末端に0個又は少なくとも一つ又は複数のNLSを含み、且つカルボキシル末端に0個又は一つ又は複数のNLSを含む)。一つ以上のNLSが存在する場合、それらのうちの各NLSは、単一のNLSが一つ以上のコピーで存在し、及び/又は一つ又は複数の他のNLSと組み合わせて一つ又は複数のコピーで存在できるように、他から独立して選択されてもよい。いくつかの実施の形態では、NLSに最も近いアミノ酸が、N-末端又はC-末端からポリペプチド鎖に沿って約1、2、3、4、5、10、15、20、25、30、40、50個又はそれ以上のアミノ酸以内である場合、NLSがN-末端又はC-末端に付属しているとみなされる。
【0435】
「コドン最適化」とは、天然のアミノ酸配列を維持すると同時に、以下の方式で標的宿主細胞における核酸配列を修飾して発現を補強する方法であり、該宿主細胞の遺伝子においてより頻繁に使用されるか又は最も頻繁に使用されるコドンで、天然配列の少なくとも一つのコドン(例えば、約1、2、3、4、5、10、15、20、25、50個又はそれ以上のコドン)を代替する。複数の種は、特定のアミノ酸のいくつかのコドンに対して特定のバイアスを示す。コドンバイアス(生物体におけるコドン使用の違い)は通常、メッセンジャーRNA(mRNA)の翻訳効率と関係があり、翻訳効率が特に翻訳されたコドンの特徴と特定のトランスファーRNA(tRNA)分子の利用可能性に依存すると考えられる。細胞において選択されたtRNAの優位性は通常、ペプチド合成において最も一般的に使用されているコドンを反映している。そのため、コドン最適化に基づいて所定の生物における遺伝子発現を最適化するように、遺伝子をカスタマイズすることができる。コドン使用テーブルは、取得しやすく、例えばwww.kazusa.orjp/codon/の「コドン使用データベース」から取得され、且つ様々な方式で変更することができる。Nakamura,Y.ら”Codon usage tabulated from the international DNA Sequence databases:status for the year 2000[国際DNA配列データベースから作成されたコドン使用テーブル:2000年の状況]” Nucl. Acids Res.[核酸研究]28:292(2000)を参照する。特定の宿主細胞において発現する特定の配列コドン最適化のためのコンピュータアルゴリズム、例えばGene Forgeも取得可能である(Aptagen、Jacobus,PA(ペンシルベニア州ジェイコブス))。いくつかの実施の形態では、Casタンパク質を標的とするDNA/RNAをコードする配列における一つ又は複数のコドン(例えば、1、2、3、4、5、10、15、20、25、50個又はそれ以上又はすべてコドン)は、特定のアミノ酸の最一般的に使用されているコドンに対応する。酵母におけるコドン使用については、www.yeastgenome.org/community/codon_usage.shtmlから入手可能なオンライン酵母ゲノムデータベース、又はCodon selection in yeast[酵母におけるコドン選択],BennetzenとHall,J Biol Chem.[生化学ジャーナル]1982年3月25日;257(6):3026-31を参照されたい。植物(藻類を含む)におけるコドン使用については、Codon usage in higher plants,green algae,and cyanobacteria[高等植物、緑藻と藍藻におけるコドン使用],CampbellとGowri,Plant Physiol.[植物生理学],1990年1月;92(1):1-11.、とCodon usage in plant genes[植物遺伝子におけるコドン使用],Murrayら,Nucleic Acids Res.[核酸研究]1989年1月25日;17(2):477-98、又はSelection on the codon bias of chloroplast and cyanelle genes in different plant and algal lineages[異なる植物と藻類系統における葉緑体とシアネル遺伝子コドンバイアスの選択],Morton BR,J Mol Evol.[分子進化ジャーナル]1998年4月;46(4):449-59を参照する。
送達システム
【0436】
いくつかの実施の形態では、CRISPR-Casシステムの成分は、様々な形式、例えばDNA/RNA又はRNA/RNA又はタンパク質RNAの組み合わせで送達されてもよい。例えば、Cas12iタンパク質は、DNAをコードするポリヌクレオチド又はRNAをコードするポリヌクレオチドとして、又はタンパク質として送達されてもよい。該ガイドは、DNA又はRNAをコードするポリヌクレオチドとして送達されてもよい。混合送達形式を含むすべての可能な組み合わせが考慮されている。
【0437】
いくつかの態様によれば、本発明は、一つ又は複数のポリヌクレオチド、例えば本明細書に記載の一つ又は複数のベクター、その一つ又は複数の転写物、及び/又はそれから転写された一つ又は複数のタンパク質を宿主細胞に送達するための方法を提供する。
【0438】
いくつかの実施の形態では、核酸ターゲッティングシステムの一つ又は複数の要素の発現を駆動する一つ又は複数のベクターを宿主細胞に導入することによって、核酸ターゲッティングシステムの要素の発現は、核酸ターゲッティング複合体が一つ又は複数の標的部位において形成されるようにガイドする。例えば、エフェクター酵素をコードする核酸及びガイドRNAをコードする核酸は、それぞれ単独のベクター上の単独の調節要素に動作可能に連結され得る。核酸ターゲッティングシステムのRNAをトランスジェニック核酸ターゲッティングエフェクタータンパク質動物又は哺乳動物、例えば構成的又は誘導的又は条件的に核酸ターゲッティングエフェクタータンパク質を発現する動物又は哺乳動物、又は他の方式で核酸ターゲッティングエフェクタータンパク質を発現し、又は、核酸ターゲッティングエフェクタータンパク質を含有する細胞を有する動物又は哺乳動物に送達してもよく、例えば前記送達は、インビボ核酸ターゲッティングエフェクタータンパク質をコードし発現する一つ又は複数のベクターをそれに事前に投与することである。代替的に、同じ又は異なる調節要素によって調節される2つ又はそれ以上の要素は、単一のベクターで組み合わされてもよいが、一つ又は複数の別のベクターは、第1のベクターに含まれない核酸ターゲッティングシステムの任意の成分を提供する。単一のベクターに組み合わされた核酸ターゲッティングシステムの要素は、任意の適切な配向で並べられてもよく、例えば、一つの要素は、第2の要素に対して5’(「上流」)に位置するか、又は第2の要素に対して3’(「下流」)に位置する。一つの要素のコード配列は、第2の要素のコード配列の同じ又は反対の鎖上にあり、且つ同じ又は逆の方向で配向されてもよい。いくつかの実施の形態では、単一のプロモーターは、核酸ターゲッティングエフェクタータンパク質と核酸ターゲッティングガイドRNAをコードする転写物の発現を駆動し、且つ転写物は、一つ又は複数のイントロン配列に埋め込まれる(例えば、それぞれ単独のイントロンにあり、2つ又はそれ以上が少なくとも一つのイントロンにあるか、又はすべて単一のイントロンにある)。いくつかの実施の形態では、核酸ターゲッティングエフェクタータンパク質と核酸ターゲッティングガイドRNAは、同一のプロモーターに動作可能に連結され、同一のプロモーターによって発現されてもよい。核酸ターゲッティングシステムの一つ又は複数の要素を発現するための送達媒体、ベクター、粒子、ナノ粒子、製剤及びその成分は、以前の文書、例えばWO2014/093622に使用されるようになる(PCT/US2013/074667、その内容は、その全体が参照により本明細書に組み込まれる)。いくつかの実施の形態では、ベクターは、一つ又は複数の挿入部位、例えば制限的エンドヌクレアーゼ認識配列(「クローニング部位」とも呼ばれる)を含む。いくつかの実施の形態では、一つ又は複数の挿入部位(例えば、約1、2、3、4、5、6、7、8、9、10個又はそれ以上の挿入部位)は、一つ又は複数のベクターの一つ又は複数の配列要素の上流及び/又は下流に位置する。複数の異なるガイド配列を使用する場合、単一の発現構築体は、活性標的細胞内の様々な該当する標的配列に核酸を標的とするために用いられてもよい。例えば、単一のベクターは、約1、2、3、4、5、6、7、8、9、10、15、20個又はそれ以上のガイド配列を含んでもよい。いくつかの実施の形態では、約1、2、3、4、5、6、7、8、9、10個又はそれ以上のそのようなガイド配列を含有するベクターを提供し、且つ任意選択的に、それを細胞に送達してもよい。いくつかの実施の形態では、ベクターは、核酸ターゲッティングエフェクタータンパク質をコードする酵素コード配列に動作可能に連結される調節要素を含む。該核酸ターゲッティングエフェクタータンパク質又は一つ又は複数の核酸ターゲッティングガイドRNAは、単独で送達されてもよく、且つ、有利には、これらのうちの少なくとも一つは、粒子複合体を介して送達される。核酸ターゲッティングエフェクタータンパク質mRNAは、核酸ターゲッティングエフェクタータンパク質の発現時間を確保するために、核酸ターゲッティングガイドRNAの前に送達されてもよい。核酸ターゲッティングエフェクタータンパク質mRNAは、核酸ターゲッティングガイドRNAを投与する1~12時間(好ましくは約2~6時間)前に投与されてもよい。代替的に、核酸ターゲッティングエフェクタータンパク質mRNAと核酸ターゲッティングガイドRNAは、一緒に投与されてもよい。有利には、第2の増強投与量のガイドRNAは、核酸ターゲッティングエフェクタータンパク質mRNA+ガイドRNAの最初の投与から1~12時間(好ましくは約2~6時間)後に投与されてもよい。核酸ターゲッティングエフェクタータンパク質mRNA及び/又はガイドRNAの追加投与は、最も効果的なレベルのゲノム修飾を実現するために用いられてもよい。
【0439】
一般的なウイルス又は非ウイルスに基づく遺伝子導入法は、哺乳動物細胞又は標的組織に核酸を導入するために用いられてもよい。そのような方法は、核酸ターゲッティングシステムの成分をコードする核酸を培養物又は宿主生体内の細胞に投与するために用いられてもよい。非ウイルスベクター送達システムは、DNAプラスミド、RNA(例えば、本明細書に記載のベクターの転写物)、ネイキッド核酸及び、送達媒体、例えばリポソームと複合化される核酸を含む。ウイルスベクター送達システムは、DNAとRNAウイルスとを含み、これらのウイルスを細胞に送達した後、エピソーム又は整合ゲノムを有する。遺伝子治療手順の総説について、Anderson,Science[サイエンス]256:808-813(1992)、NabelとFelgner,TIBTECH[バイオテクノロジートレンド]11:211-217(1993)、MitaniとCaskey,TIBTECH[バイオテクノロジートレンド]11:162-166(1993)、Dillon,TIBTECH[バイオテクノロジートレンド]11:167-175(1993)、Miller,Nature[ネイチャー]357:455-460(1992)、Van Brunt,Biotechnology[バイオテクノロジー]6(10):1149-1154(1988)、Vigne,Restorative Neurology and Neuroscience[回復神経学と神経科学]8:35-36(1995)、KremerとPerricaudet,British Medical Bulletin[英国医学公報]51(1):31-44(1995)、Haddadaら,Current Topics in Microbiology and Immunology[微生物学と免疫学の現在のトピックス],DoerflerとBohm(編集)(1995)、及び、Yuら,Gene Therapy[遺伝子療法]1:13-26(1994)を参照する。
【0440】
核酸の非ウイルス送達方法は、リポフェクション、ヌクレオフェクション、マイクロインジェクション、バイオリスティック(biolistics)、ビリオン、リポソーム、免疫リポソーム、ポリカチオン又は脂質:核酸複合体、ネイキッドDNA、人工ビリオン及び試薬によって補強されるDNA取り込みを含む。リポフェクションは、例えば米国特許第5,049,386号、第4,946,787号と第4,897,355号に記述されており、且つリポフェクション試薬は、市販されている(例えば、Transfectam(商標)とLipofectin(商標))。ポリヌクレオチドの効果的な受容体認識リポフェクションに適切なカチオンと中性脂質は、Felgner、WO91/17424、WO91/16024のものを含み、これらの脂質は、細胞(例えば、インビトロ又はエクスビボ投与)又は標的組織(例えば、インビボ投与)に送達されてもよいと考慮される。
【0441】
プラスミド送達は、CRISPR-Casタンパク質を発現するプラスミドにガイドRNAをクローニングし、細胞培養物においてDNAをトランスフェクションすることに関する。プラスミドバックボーンは、市販されており、且つ特定の機器を必要としない。有利には、それらは、モジュール化されており、且つ異なるサイズのCRISPR-Casコード配列(より大きなサイズをコードするタンパク質の配列を含む)、及び選択マーカーを担持することができる。また、プラスミドは、一時的であるが連続的な発現を確保するため、有利である。しかしながら、プラスミドの送達は、直接的ではなく、通常は低いインビボ効率を引き起こす。連続的な発現は、オフターゲット編集を増やすことがあるため、不利になる可能性もある。また、CRISPR-Casタンパク質の過剰な蓄積は、細胞に有毒である可能性がある。最後に、プラスミドは、常にdsDNAを宿主ゲノムにランダムに組み込むリスクを有し、より具体的に、二本鎖切断(オンターゲットとオフターゲット)のリスクを考慮している。
【0442】
脂質:核酸複合体(ターゲッティングリポソーム、例えば免疫脂複合体を含む)の製造は、当業者によく知っており(例えばCrystal,Science[サイエンス]270:404-410(1995)、Blaeseら,Cancer Gene Ther.[癌遺伝子療法]2:291-297(1995)、Behrら,Bioconjugate Chem.[生物複合体化学]5:382-389(1994)、Remyら,Bioconjugate Chem.[生物複合体化学]5:647-654(1994)、Gaoら,Gene Therapy[遺伝子療法]2:710-722(1995)、Ahmadら,Cancer Res.[癌研究]52:4817-4820(1992)、米国特許第4,186,183号、第4,217,344号、第4,235,871号、第4,261,975号、第4,485,054号、第4,501,728号、第4,774,085号、第4,837,028号と第4,946,787号を参照する)、以下により詳細に検討する。
【0443】
RNA又はDNAウイルスベースのシステムを用いて核酸を送達することは、ウイルスをインビボの特定の細胞にターゲッティングし、ウイルスペイロードを細胞核に輸送する高度に進化したプロセスを利用している。ウイルスベクターは、患者(インビボ)に直接投与されてもよく、又はそれらは、インビトロで細胞を治療するために用いられてもよく、且つ任意選択的に、患者に修飾された細胞(エクスビボ)を投与してもよい。一般的なウイルスベースのシステムは、遺伝子導入のためのレトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルスと単純ヘルペスウイルスベクターを含んでもよい。レトロウイルス、レンチウイルスとアデノ随伴ウイルスの遺伝子導入法による宿主ゲノムへの組み込みは、常に挿入されたトランスジェニックの長期発現を引き起こす。また、多くの異なる細胞型と標的組織において高い形質導入効率が観察される。
【0444】
レトロウイルスの指向性は、外因性エンベロープタンパク質の組み込みによって改変されて、標的細胞の潜在的な標的集団を拡大してもよい。レンチウイルスベクターは、非分裂細胞を形質導入するか又は感染させ、通常、高いウイルス力価を産生するレトロウイルスベクターである。そのため、レトロウイルス遺伝子導入システムの選択は、標的組織に依存する。レトロウイルスベクターは、最大6~10kbのパッケージング能力を有する外来配列のシス作用性長末端反復配列からなる。最小限のシス作用LTRは、ベクターの複製とパッケージングに十分であり、そして該ベクターは、恒久的なトランスジェニック発現を提供するために治療遺伝子を標的細胞に組み込むために用いられる。広く使用されているレトロウイルスベクターは、マウス白血病ウイルス(MuLV)、テナガザル白血病ウイルス(GaLV)、サル免疫不全ウイルス(SIV)、ヒト免疫不全ウイルス(HIV)及びその組み合わせに基づくベクターを含む(例えばBuchscherら,J.Virol.[ウイルス学ジャーナル]66:2731-2739(1992)、Johannら,J.Virol.[ウイルス学ジャーナル]66:1635-1640(1992)、Sommnerfeltら,Virol.[ウイルス学]176:58-59(1990)、Wilsonら,J.Virol.[ウイルス学ジャーナル]63:2374-2378(1989)、Millerら,J.Virol.[ウイルス学ジャーナル]65:2220-2224(1991)、PCT/US94/05700を参照する)。
【0445】
好ましくは、一時的発現の応用では、アデノウイルスベースのシステムを使用することができる。アデノウイルスベースのベクターは、多くの細胞型において高い形質導入効率を提供し、且つ細胞分裂を必要としない。そのようなベクターを使用することで、すでに高い力価と高い発現レベルを実現した。ベクターは、比較的簡単なシステムで大量に産生することができる。アデノ随伴ウイルス(「AAV」)ベクターは、例えば核酸とペプチドのインビトロ産生において、及びインビボとエクスビボ遺伝子治療手順において標的核酸を細胞に形質導入するために用いられてもよい(例えば、Westら,Virology[ウイルス学]160:38-47(1987)、米国特許第4,797,368号、WO93/24641、Kotin,Human Gene Therapy[ヒト遺伝子療法]5:793-801(1994)、Muzyczka,J. Clin. Invest.[臨床研究ジャーナル]94:1351(1994)を参照する)。組換えAAVベクターの構築は、多くの出版物に記述されており、米国特許第5,173,414号、Tratschinら,Mol. Cell. Biol.[分子と細胞生物学]5:3251-3260(1985)、Tratschinら,Mol. Cell. Biol.[分子と細胞生物学]4:2072-2081(1984)、HermonatとMuzyczka,PNAS[米国国家科学院院刊]81:6466-6470(1984)、とSamulskiら,J. Virol.[ウイルス学ジャーナル]63:03822-3828(1989)を含む。
【0446】
本発明は、AAVを提供し、該AAVは、CRISPRシステムをコードする外因性核酸分子を含むか又は基本的にそれらによって構成され、該外因性核酸分子は、例えば以下のカセットを含むか又は以下のカセットによって構成される複数のカセットであり、プロモーター、CRISPR関連(Cas)タンパク質(推定されるヌクレアーゼ又はヘリカーゼタンパク質)(例えば、Cas12i)をコードする核酸分子とターミネーター又はそれらによって構成される第1のカセット、及び一つ又は複数のカセット、有利には多くともベクターのパッケージングサイズ限界、例えば合計五つのカセットを含み(第1のカセットを含み)、これらのカセットは、プロモーター、ガイドRNA(gRNA)をコードする核酸分子とターミネーターを含むか又は基本的にそれらによって構成され(例えば、各カセットは、プロモーター-gRNA1-ターミネーター、プロモーター-gRNA2-ターミネーター...プロモーター-gRNA(N)-ターミネーターとして概略的に表され、ここで、Nは、挿入可能なベクターのパッケージングサイズ限界の上限である)、又は本発明は、2つ又はそれ以上の単独のrAAVを提供し、ここで、各rAAVは、いずれもCRISPRシステムの一つ又は複数のカセットを含有し、例えば、第1のrAAVは、第1のカセットを含有し、該第1のカセットは、プロモーター、Casをコードする核酸分子、例えばCas(Cas12i)とターミネーターを含むか又は基本的にそれらによって構成され、且つ第2のrAAVは、一つ又は複数のカセットを含有し、各カセットは、プロモーター、ガイドRNA(gRNA)をコードする核酸分子とターミネーターを含むか又は基本的にそれらによって構成される(例えば、各カセットは、プロモーター-gRNA1-ターミネーター、プロモーター-gRNA2-ターミネーター...プロモーター-gRNA(N)-ターミネーターとして概略的に表され、ここで、Nは、挿入可能なベクターのパッケージングサイズ限界の上限である)。代替的に、Cas12iがその自体のcrRNA/gRNAを加工できるため、単一のcrRNA/gRNAアレイは、多重遺伝子編集に用いられてもよい。そのため、gRNAを送達するための複数のカセットを含むことではなく、rAAVは、プロモーターと、複数のcrRNA/gRNAと、ターミネーターとを含むかそれらによって構成される単一のカセットを含有してもよい(例えば、プロモーター-gRNA1-gRNA2...gRNA(N)-ターミネーターとして概略的に表され、ここで、Nは、挿入可能なベクターのパッケージングサイズ限界の上限である)。Zetscheら,Nature Biotechnology[ネイチャー・バイオテクノロジー]35,31-34(2017)を参照すると、それは、その全体が参照により本明細書に組み込まれる。rAAVがDNAウイルスであるため、本明細書のAAV又はrAAVに関する検討における核酸分子は、有利にはDNAである。いくつかの実施の形態では、該プロモーターは、有利にはヒトシナプトフィジンIプロモーター(hSyn)である。核酸を細胞に送達する他の方法は、当業者に既知のものである。例えば、US20030087817を参照すると、それは、引用により本明細書に組み込まれる。
【0447】
別の実施の形態では、コカル水疱ウイルス(cocal vesiculovirus)エンベロープの擬似レトロウイルスベクター粒子が考慮されている(例えば、フレッドハッチンソン癌研究センター(Fred Hutchinson Cancer Research Center)に譲渡された米国特許開示第20120164118号を参照する)。コカルウイルスは、水疱ウイルス属に属し、且つ哺乳動物の水疱性口内炎の病原体である。コカルウイルスは、もともとトリニダードのダニから単離され(Jonkersら、Am. J. Vet. Res.[米国獣医研究ジャーナル]25:236-242(1964))、且つすでにトリニダード島、ブラジル、アルゼンチンの昆虫、ウシとウマにコカルウイルス感染が同定された。哺乳動物に感染する多くの水疱ウイルスは、すでに自然に感染した節足動物から単離されており、それらが媒介性に伝染することを示す。水疱ウイルス抗体は、現地でウイルスを取得した農村地域及び実験室に広く存在しており、それらのヒトへの感染は、通常、インフルエンザ様症状を引き起こす。コカルウイルスのエンベロープ糖タンパク質は、アミノ酸レベル上でVSV-Gインディアナ株と71.5%の同一性を有し、且つ水疱ウイルスエンベロープ遺伝子の系統学的発育の比較により、コカルウイルスは、血清学的に水疱ウイルスのVSV-Gインディアナ株と異なるが、それと最も密接に関連していることが示された。Jonkersら,Am. J. Vet. Res.[米国獣医研究ジャーナル]25:236-242(1964)とTravassos da Rosaら,AM. J. Tropical Med. & Hygiene[米国熱帯医学と衛生ジャーナル]33:999-1006(1984)。コカル水疱ウイルスエンベロープ擬似レトロウイルスベクター粒子は、例えばレンチウイルス、αレトロウイルス、βレトロウイルス、γレトロウイルス、δレトロウイルスとεレトロウイルスベクター粒子を含んでもよく、これらの粒子は、レトロウイルスGag、Pol及び/又は一つ又は複数のアクセサリータンパク質とコカル水疱ウイルスエンベロープタンパク質を含んでもよい。これらの実施の形態のいくつかの態様では、Gag、Polとアクセサリータンパク質は、レンチウイルス及び/又はγレトロウイルスである。
【0448】
いくつかの実施の形態では、本明細書に記載の一つ又は複数のベクターで一時的又は非一時的に宿主細胞をトランスフェクションする。いくつかの実施の形態では、細胞が被験体に天然に存在する場合、細胞をトランスフェクションし、任意選択的にその中に再導入する。いくつかの実施の形態では、トランスフェクションされた細胞は、被験体から採取される。いくつかの実施の形態では、これらの細胞は、被験体からの細胞、例えば細胞株に由来する。組織培養に用いられる様々な細胞株は、当分野において既知のものである。細胞株の例は、C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLa-S3、Huh1、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panc1、PC-3、TF1、CTLL-2、C1R、Rat6、CV1、RPTE、A10、T24、J82、A375、ARH-77、Calu1、SW480、SW620、SKOV3、SK-UT、CaCo2、P388D1、SEM-K2、WEHI-231、HB56、TIB55、Jurkat、J45.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、HeLa B、HeLa T4、COS、COS-1、COS-6、COS-M6A、BS-C-1サル腎臓上皮細胞、BALB/3T3マウス胎児線維芽細胞、3T3 Swiss、3T3-L1、132-d5ヒト胎児線維芽細胞、10.1マウス線維芽細胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1細胞、BEAS-2B、bEnd.3、BHK-21、BR293、BxPC3、C3H-10T1/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-K1、CHO-K2、CHO-T、CHO Dhfr-/-、COR-L23、COR-L23/CPR、COR-L23/5010、COR-L23/R23、COS-7、COV-434、CML T1、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepa1c1c7、HL-60、HMEC、HT-29、Jurkat、JY細胞、K562細胞、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCK II、MDCK II、MOR/0.2R、MONO-MAC 6、MTD-1A、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT細胞株、Peer、PNT-1A/PNT 2、RenCa、RIN-5F、RMA/RMAS、Saos-2細胞、Sf-9、SkBr3、T2、T-47D、T84、THP1細胞株、U373、U87、U937、VCaP、Vero細胞、WM39、WT-49、X63、YAC-1、YAR及びそのトランスジェニック品種を含むが、それらに限らない。細胞株は、当業者に知られている様々な供給源(例えば、米国典型培養物寄託センター(ATCC)(バージニア州マナサス(Manassus,Va.))を参照する)から入手可能である。
【0449】
特定の実施の形態では、AD官能化のCRISPRシステムの一つ又は複数の成分の一時的発現及び/又は存在は、例えば、オフターゲット効果を減少させるために関心のあるものであってもよい。いくつかの実施の形態では、本明細書に記載の一つ又は複数のベクターでトランスフェクションされた細胞は、一つ又は複数のベクターに由来する配列を含む新型細胞株の確立に用いられる。いくつかの実施の形態では、本明細書に記載のAD官能化のCRISPRシステムの成分で一時的にトランスフェクションされ(例えば、一つ又は複数のベクターで一時的にトランスフェクションされ、又はRNAでトランスフェクションされ)、且つCRISPR複合体の活性によって修飾された細胞は、これらの修飾を含有するが任意の他の外来配列のない細胞を含む新細胞株の確立に用いられる。いくつかの実施の形態では、本明細書に記載の一つ又は複数のベクターで一時的又は非一時的にトランスフェクションされる細胞又はそのような細胞に由来する細胞株は、一つ又は複数の試験化合物を評価するために用いられる。
【0450】
いくつかの実施の形態では、RNA及び/又はタンパク質を宿主細胞に直接導入することが考慮される。例えば、CRISPR-Casタンパク質は、コードされたmRNAとしてインビトロ転写からのガイドRNAとともに送達されてもよい。そのような方法は、CRISPR-Casタンパク質の作用時間を減少させて確保し、且つCRISPRシステムの成分の長期発現をさらに防止することができる。
【0451】
いくつかの実施の形態では、本発明のRNA分子は、リポソーム又はlipofectin製剤などとして送達され、且つ当業者がよく知っている方法で製造することができる。そのような方法は、例えば米国特許第5,593,972号、第5,589,466号と第5,580,859号に記述されており、これらの特許は、その全体が参照により本明細書に組み込まれる。哺乳動物細胞へのsiRNA送達を補強・改善するために特別に設計された送達システムが開発されており(例えばShenら、FEBS Let.[欧州生化学連合速報]2003,539:111-114、Xiaら,Nat. Biotech.[ネイチャー・バイオテクノロジー]2002,20:1006-1010、Reichら,Mol. Vision.[分子視覚]2003,9:210-216、Sorensenら,J. Mol. Biol.[分子生物学ジャーナル]2003,327:761-766、Lewisら,Nat. Gen.[自然遺伝学]2002,32:107-108、とSimeoniら,NAR[核酸研究]2003,31,11:2717-2724を参照する)、且つ本発明に応用可能である。siRNAは、最近、霊長類動物における遺伝子発現を阻害するために使用することに成功しており(例えば、Tolentinoら,Retina[網膜]24(4):660を参照する)、それも、本発明に応用可能である。
【0452】
事実的に、RNA送達は、有用なインビボ送達方法である。リポソーム又は粒子を用いてCas12i、アデノシンデアミナーゼとガイドRNAを細胞に送達することができる。そのため、本発明のCRISPR-Casタンパク質(例えば、Cas12i)の送達、アデノシンデアミナーゼ(それは、CRISPR-Casタンパク質又はアダプタータンパク質に融合可能である)の送達及び/又はRNAの送達は、RNAの形式であり、且つ微小胞、リポソーム又は粒子又はナノ粒子を介して行うことができる。例えば、インビボ送達のために、Cas12i mRNA、アデノシンデアミナーゼmRNAとガイドRNAをリポソーム粒子にパッケージングする。リポソームトランスフェクション試薬、例えばライフテクノロジーズ社(Life Technologies)からのlipofectamineと市場上の他の試薬は、RNA分子を肝臓に効率的に送達することができる。いくつかの実施の形態では、脂質ナノ粒子(LNP)は、50mM:50mM:10mM:20mMのモル比でALC-0315:コレステロール:PEG-DMG:DOPEを含む。いくつかの実施の形態では、LNPは、Cas12i及びその該当するcrRNA(例えば、SiCas12i:crRNA、重量比1:1)又はそのコード核酸をカプセル化する。いくつかの実施の形態では、静脈内注入によって個体(例えば、ヒト)にCas12i及び/又はcrRNA(又はそのコード核酸)を含むLNPを投与する。
【0453】
RNAの送達は、また、好ましくは、粒子(Cho,S.,Goldberg,M.,Son,S.,Xu,Q.,Yang,F.,Mei,Y.,Bogatyrev,S.,Langer,R.とAnderson,D.,Lipid-like nanoparticles for small interfering RNA delivery to endothelial cells[内皮細胞に低分子干渉RNAを送達するための脂質様ナノ粒子],Advanced Functional Materials[先進機能材料],19:3112-3118,2010)を介して、又はエキソソーム(Schroeder,A.,Levins,C.,Cortez,C.,Langer,R.とAnderson,D.,Lipid-based nanotherapeutics for siRNA delivery[siRNA送達のための脂質ベースナノ治療剤],Journal of Internal Medicine[内科医学ジャーナル],267:9-21,2010,PMID:20059641)を介してRNAを送達することを含む 。事実的に、エキソソームがsiRNA送達に特に有用であり、且つ該システムがCRISPRシステムと若干類似していることを示した。例えば、El-Andaloussi Sら(「Exosome-mediated delivery of siRNA in vitro and in vivo.[インビトロとインビボエキソソーム媒介性siRNA送達]」 Nat Protoc.[自然実験ハンドブック]2012年12月;7(12):2112-26. doi:10.1038/nprot.2012.131.2012年11月15日に電子開示)は、エキソソームが、どのように薬物送達が異なる生物障壁を通過するため及びインビトロとインビボにおけるsiRNA送達のための有望なツールとなるかを記述した。彼らの方法は、ペプチド配体に融合するエキソソームタンパク質を含む発現ベクターをトランスフェクションすることによってターゲッティングエキソソームを産生することに関する。そして、トランスフェクションされた細胞上清からエキソソームを精製して特徴付け、RNAをエキソソームにロードする。本発明による送達又は投与は、エキソソーム、特に脳(それに限らない)を用いて行うことができる。ビタミンE(α-トコフェロール)は、CRISPR Casと合体して高密度リポタンパク質(HDL)とともに脳に送達されることができ、例えば、Unoら(HUMAN GENE THERAPY[ヒト遺伝子療法]22:711-719(2011年6月))が短干渉RNA(siRNA)を脳に送達する方式に類似する。リン酸緩衝生理食塩水(PBS)又は遊離TocsiBACE又はToc-siBACE/HDLが充填されており、脳注入キット3(アルゼット社(Alzet))に連結される浸透圧ミニポンプ(型番1007D、アルゼット社、カリフォルニア州クパチーノ(Cupertino,CA))を介してマウスへの注入を行う。第3脳室の背側に注入するために、正中線のブレグマの後方約0.5mmに脳注入カニューレを置く。Unoらは、同じICV注入方法によって、3nmolまで低いHDLを含有するToc-siRNAが標的低減を大きく誘導できることを発見した。本発明では、ヒトにとって、α-トコフェロールに合体し、且つ脳を標的とするHDLと共に投与される、似ている投与量のCRISPR Casを考慮することができ、例えば、脳を標的とする約3nmolから約3μMolのCRISPR Casを考慮することができる。Zouら(HUMAN GENE THERAPY[ヒト遺伝子療法]22:465-475(2011年4月))は、ラット脊髓におけるインビボ遺伝子サイレンシングのためのPKCγを標的とする短ヘアピンRNAのレンチウイルス媒介性送達方法を記述した。Zouらは、鞘内カテーテルを介して約10μlの組換えレンチウイルスを投与し、力価は、1×10個の形質導入単位(TU)/mlである。本発明では、ヒトにとって、脳を標的とするレンチウイルスベクターにおいて発現する、似ている投与量のCRISPR Casを考慮することができ、例えば、レンチウイルスにおいて脳を標的とする約10~50mのlCRISPR Casを考慮することができ、力価は、1×10個の形質導入単位(TU)/mlである。
【0454】
本明細書に記載の本発明の方法の他の適切な修正と変化は、当業者にとって明らかであり、且つ本発明又は本明細書に開示される実施の形態の範囲から逸脱することなく、適切な等価物を使用して行うことができる。
例示的な実施の形態
【0455】
実施の形態1.SEQ ID NO:1~10(好ましくはSEQ ID NO:1~3、6と10、且つより好ましくはSEQ ID NO:1)のうちのいずれか一つに示すアミノ酸配列と少なくとも80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%又は100%の同一性を有するアミノ酸配列を含む、Cas12iタンパク質。
【0456】
実施の形態2.前記Cas12iタンパク質は、該当する親Cas12iタンパク質(例えば、SEQ ID NO:1~10のうちのいずれか一つを含むCas12iタンパク質)の、ガイド配列に相補的な標的DNAの標的配列に対するスペーサー領域特異的エンドヌクレアーゼ切断活性(例えば、50%、40%、35%、30%、27.5%、25%、22.5%、20%、17.5%、15%、12.5%、10%、7.5%、5%、4%、3%、2.5%、2%、1%よりも少なく又はそれ以下を保持する)を基本的に有さない、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0457】
実施の形態3.前記Cas12iタンパク質は、前記Cas12iタンパク質が、該当する親Cas12iタンパク質(例えば、SEQ ID NO:1~10のうちのいずれか一つを含むCas12iタンパク質)の、ガイド配列に相補的な標的DNAの標的配列に対するスペーサー領域特異的エンドヌクレアーゼ切断活性(例えば、50%、40%、35%、30%、27.5%、25%、22.5%、20%、17.5%、15%、12.5%、10%、7.5%、5%、4%、3%、2.5%、2%、1%よりも少なく又はそれ以下を保持する)を基本的に有さないように、そのRuvCドメインに一つ又は複数のアミノ酸変異が含まれる、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0458】
実施の形態4.前記アミノ酸変異は、アミノ酸の付加、挿入、欠失と置換から選択される、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0459】
実施の形態5.前記Cas12iタンパク質は、SEQ ID NO:1に示す配列の位置700(D700)、650(D650)、875(E875)又は1049(D1049)に対応する一つ又は複数の位置にアミノ酸置換を含む、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0460】
実施の形態6.前記アミノ酸置換は、D700A/V、D650A/V、E875A/VとD1049A/Vから選択される、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0461】
実施の形態7.前記アミノ酸置換は、D700A、D650A、E875AとD1049Aから選択される、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0462】
実施の形態8.前記アミノ酸置換は、D700A、D650A、E875A、D1049A、D700A+D650A、D700A+E875A、D700A+D1049A、D650A+E875A、D650A+D1049A、E875A+D1049A、D700A+D650A+E875A、D700A+D650A+D1049A、D650A+E875A+D1049AとD700A+D650A+E875A+D1049Aから選択される、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0463】
実施の形態10.前記Cas12iタンパク質は、一つ又は複数の機能ドメインに連結される、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0464】
実施の形態11.前記機能ドメインは、前記Cas12iタンパク質のN-末端及び/又はC-末端に連結される、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0465】
実施の形態12.前記機能ドメインは、核局在化シグナル(NLS)、核外輸送シグナル(NES)、デアミナーゼ(例えば、アデノシンデアミナーゼ又はシチジンデアミナーゼ)触媒ドメイン、DNAメチル化触媒ドメイン、ヒストン残基修飾ドメイン、ヌクレアーゼ触媒ドメイン、蛍光タンパク質、転写修飾因子、光ゲーティング因子、化学誘導因子、クロマチン可視化因子、標的細胞又は標的細胞型上の細胞表面部分との結合を提供するためのターゲッティングポリペプチドから選択される、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0466】
実施の形態13.前記機能ドメインは、標的DNAを修飾する活性を示し、前記活性は、ヌクレアーゼ活性、メチル化活性、脱メチル化活性、DNA修復活性、DNA損傷活性、脱アミノ活性、ジスムターゼ活性、アルキル化活性、脱プリン活性、酸化活性、ピリミジンダイマー形成活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、グリコシダーゼ活性、アセチルトランスフェラーゼ活性、脱アセチル化酵素活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、肉ミリストイル化活性、脱肉ミリストイル化活性、グリコシル化活性(例えば、O-GlcNAcトランスフェラーゼ由来)、脱グリコシル化活性、転写阻害活性、転写活性化活性から選択される、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0467】
実施の形態14.前記機能ドメインは、アデノシンデアミナーゼ触媒ドメイン又はシチジンデアミナーゼ触媒ドメインから選択される、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0468】
実施の形態15.前記機能ドメインは、TadA8eの全長又は機能断片である、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0469】
実施の形態17.前記Cas12iタンパク質は、スペーサー領域非特異性エンドヌクレアーゼバイパス活性を低減又は消失させるように修飾される、前述実施の形態のいずれか1項に記載のCas12iタンパク質。
【0470】
実施の形態18.前述実施の形態のいずれか1項に記載のCas12iタンパク質をコードする、ポリヌクレオチド。
【0471】
実施の形態19.前記ポリヌクレオチドは、真核細胞において発現するようにコドンによって最適化されている、前述実施の形態のいずれか1項に記載のポリヌクレオチド。
【0472】
実施の形態20.前記ポリヌクレオチドは、SEQ ID NO:21~40に示すいずれか一ヌクレオチド配列と少なくとも80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99%、99.5%又は100%の同一性を有するヌクレオチド配列を含む、前述実施の形態のいずれか1項に記載のポリヌクレオチド。
【0473】
実施の形態21.前述実施の形態のいずれか1項に記載のポリヌクレオチドを含む、ベクター。
【0474】
実施の形態22.前記ポリヌクレオチドは、プロモーターに動作可能に連結される、前述実施の形態のいずれか1項に記載のベクター。
【0475】
実施の形態23.前記プロモーターは、構成的プロモーター、誘導的プロモーター、広域スペクトルプロモーター、細胞種特異的プロモーター又は組織特異的プロモーターである、前述実施の形態のいずれか1項に記載のベクター。
【0476】
実施の形態24.前記ベクターは、プラスミドである、前述実施の形態のいずれか1項に記載のベクター。
【0477】
実施の形態25.前記ベクターは、レトロウイルスベクター、ファージベクター、アデノウイルスベクター、単純ヘルペスウイルス(HSV)ベクター、アデノ随伴ウイルス(AAV)ベクター又はレンチウイルスベクターである、前述実施の形態のいずれか1項に記載のベクター。
【0478】
実施の形態26.前記AAVベクターは、血清型AAV1、AAV2、AAV4、AAV5、AAV6、AAV7、AAVrh74、AAV8、AAV9、AAV10、AAV11、AAV12とAAV13の組換えAAVベクターから選択される、前述実施の形態のいずれか1項に記載のベクター。
【0479】
実施の形態27.(1)送達媒体と、(2)前述実施の形態のいずれか1項に記載のCas12iタンパク質、ポリヌクレオチド又はベクターとを含む、送達システム。
【0480】
実施の形態28.前記送達媒体は、ナノ粒子、リポソーム、エキソソーム、微小胞又は遺伝子銃である、前述実施の形態のいずれか1項に記載の送達システム。
【0481】
実施の形態29.操作された、天然に存在しないCRISPR-Casシステムであって、
前述実施の形態のいずれか1項に記載のCas12iタンパク質、又は前記Cas12iタンパク質をコードするポリヌクレオチドと、
CRISPR RNA(crRNA)、又は前記crRNAをコードするポリヌクレオチドとを含み、前記crRNAは、
標的DNAの標的配列にハイブリダイズ可能なスペーサー領域と、
前記スペーサー領域に連結され且つ前記Cas12iタンパク質と前記crRNAとの結合をガイドして前記標的配列を標的とするCRISPR-Cas複合体を形成することができるダイレクトリピート配列(DR)とを含む、CRISPR-Casシステム。
【0482】
実施の形態30.一つ又は複数のベクターを含むCRISPR-Casシステムであって、前記一つ又は複数のベクターは、
前述実施の形態のいずれか1項に記載のCas12iタンパク質をコードするヌクレオチド配列に動作可能に連結される第1の調節要素と、
CRISPR RNA(crRNA)をコードするポリヌクレオチドに動作可能に連結される第2の調節要素とを含み、前記crRNAは、
標的DNAの標的配列にハイブリダイズ可能なスペーサー領域と、
前記スペーサー領域に連結され且つ前記Cas12iタンパク質と前記crRNAとの結合をガイドして前記標的配列を標的とするCRISPR-Cas複合体を形成することができるダイレクトリピート配列(DR)とを含み、
ここで、前記第1の調節要素と前記第2の調節要素は、前記CRISPR-Casベクターシステムの同じ又は異なるベクター上に位置する、CRISPR-Casシステム。
【0483】
実施の形態31.操作された、天然に存在しないCRISPR-Cas複合体であって、
前述実施の形態のいずれか1項に記載のCas12iタンパク質と、
CRISPR RNA(crRNA)とを含み、前記crRNAは、
標的DNAの標的配列にハイブリダイズ可能なスペーサー領域と、
前記スペーサー領域に連結されるダイレクトリピート配列(DR)とを含み、前記DRは、前記Cas12iタンパク質と前記crRNAとの結合をガイドする、CRISPR-Cas複合体。
【0484】
実施の形態32.前記スペーサー領域の長さは、16個のヌクレオチドよりも大きく、好ましくは16から100個のヌクレオチド、より好ましくは16から50個のヌクレオチド、より好ましくは16から27個のヌクレオチド、より好ましくは17から24個のヌクレオチド、より好ましくは18から24個のヌクレオチド、且つ最も好ましくは18から22個のヌクレオチドである、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0485】
実施の形態33.前記DRは、SEQ ID NO:11~20のうちのいずれか一つに示すDRの二次構造と実質的に同じ二次構造を有する、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0486】
実施の形態34.前記DRは、ヌクレオチド付加、挿入、欠失又は置換を有し、SEQ ID NO:11~20のうちのいずれか一つに示すDRと比べて二次構造の実質的な差異を生じない、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0487】
実施の形態35.前記DRは、前記DRの3’末端近傍のステム-ループ構造を含み、
ここで、前記ステム-ループ構造は、5’-XNNNnNNNX10-3’(X、X、X、X、X、X、X、X、XとX10は、任意の塩基であり、nは、任意の核塩基又は欠失であり、Nは、任意の核塩基である)を含み、ここで、XとX10は、互いにハイブリダイズ可能である、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0488】
実施の形態36.前記DRは、以下のいずれか一つから選択されるステム-ループ構造を含み、
前記DRの3’末端近傍の5’ CUCCCNNNNNNUGGGAG 3’、ここで、Nは、任意の核塩基であり、
前記DRの3’末端近傍の5’ CUCCUNNNNNNUGGGAG 3’、ここで、Nは、任意の核塩基であり、
前記DRの3’末端近傍の5’ GUCCCNNNNNNUGGGAC 3’、ここで、Nは、任意の核塩基であり、
前記DRの3’末端近傍の5’ GUGUCNNNNNNUGACAC 3’、ここで、Nは、任意の核塩基であり、
前記DRの3’末端近傍の5’ GUGCCNNNNNNUGGCAC 3’、ここで、Nは、任意の核塩基であり、
前記DRの3’末端近傍の5’ UGUGUNNNNNNUCACAC 3’、ここで、Nは、任意の核塩基であり、及び
前記DRの3’末端近傍の5’ CCGUCNNNNNNUGACGG 3’、ここで、Nは、任意の核塩基であり、
前記DRの3’末端近傍の5’ GTTTCNNNNNNUGAAAC 3’、ここで、Nは、任意の核塩基であり、
前記DRの3’末端近傍の5’ GTGTTNNNNNNUAACAC 3’、ここで、Nは、任意の核塩基であり、
前記DRの3’末端近傍の5’ TTGTCNNNNNNUGACAA 3’、ここで、Nは、任意の核塩基である、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0489】
実施の形態37.前記CRISPR-Casシステム又は複合体は、前記スペーサー領域にハイブリダイズ可能な標的DNAをさらに含む、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0490】
実施の形態38.前記標的DNAは、真核DNAである、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0491】
実施の形態39.前記標的DNAは、細胞にあり、好ましくは前記細胞は、原核細胞、真核細胞、動物細胞、植物細胞、真菌細胞、脊椎動物細胞、無脊椎動物細胞、げっ歯動物細胞、哺乳動物細胞、霊長類動物細胞、非ヒト霊長類動物細胞とヒト細胞から選択される、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0492】
実施の形態40.前記crRNAは、前記標的DNAの標的配列にハイブリダイズして複合体を形成し、前記Cas12iタンパク質による前記標的配列の切断を引き起こす、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0493】
実施の形態41.前記標的配列は、プロトスペーサー隣接モチーフ(PAM)の3’末端にある、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0494】
実施の形態42.前記PAMは、5’-Tに富むモチーフを含む、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0495】
実施の形態43.前記PAMは、5’-TTA、5’-TTT、5’-TTG、5’-TTC、5’-ATA又は5’-ATGである、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0496】
実施の形態44.前記一つ又は複数のベクターは、一つ又は複数のレトロウイルスベクター、ファージベクター、アデノウイルスベクター、単純ヘルペスウイルス(HSV)ベクター、アデノ随伴ウイルス(AAV)ベクター、又はレンチウイルスベクターを含む、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0497】
実施の形態45.前記AAVベクターは、血清型AAV1、AAV2、AAV4、AAV5、AAV6、AAV7、AAVrh74、AAV8、AAV9、AAV10、AAV11、AAV12とAAV13の組換えAAVベクターから選択される、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0498】
実施の形態46.前記調節要素は、プロモーターを含む、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0499】
実施の形態47.前記プロモーターは、構成的プロモーター、誘導的プロモーター、広域スペクトルプロモーター、細胞種特異的プロモーター又は組織特異的プロモーターから選択される、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0500】
実施の形態48.前記プロモーターは、真核細胞に機能を有する、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0501】
実施の形態49.前記真核細胞は、動物細胞、植物細胞、真菌細胞、脊椎動物細胞、無脊椎動物細胞、げっ歯動物細胞、哺乳動物細胞、霊長類動物細胞、非ヒト霊長類動物細胞とヒト細胞を含む、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0502】
実施の形態50.前記CRISPR-Casシステム又は複合体は、任意選択的に、相同性指向修復(HDR)によって関心のある遺伝子座に挿入されるDNAドナーテンプレートをさらに含む、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体。
【0503】
実施の形態51.細胞又はその子孫であって、前述実施の形態のいずれか1項に記載のCas12iタンパク質、ポリヌクレオチド、ベクター、送達システム、CRISPR-Casシステム又は複合体を含み、ここで、好ましくは、前記細胞は、原核細胞、真核細胞、動物細胞、植物細胞、真菌細胞、脊椎動物細胞、無脊椎動物細胞、げっ歯動物細胞、哺乳動物細胞、霊長類動物細胞、非ヒト霊長類動物細胞とヒト細胞から選択される、細胞又はその子孫。
【0504】
実施の形態52.非ヒト多細胞生物であって、前述実施の形態のいずれか1項に記載の細胞又はその子孫を含み、好ましくは、前記非ヒト多細胞生物は、ヒト遺伝子関連疾患の動物(例えば、げっ歯動物又は非ヒト霊長類動物)モデルである、非ヒト多細胞生物。
【0505】
実施の形態53.標的DNAを修飾する方法であって、標的DNAを前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体に接触させることを含み、前記接触は、前記標的DNAのCas12iタンパク質による修飾を引き起こす、方法。
【0506】
実施の形態54.前記修飾は、インビトロ細胞外部で発生する、前述実施の形態のいずれか1項に記載の方法。
【0507】
実施の形態55.前記修飾は、インビトロ細胞内部で発生する、前述実施の形態のいずれか1項に記載の方法。
【0508】
実施の形態56.前記修飾は、インビボ細胞内部で発生する、前述実施の形態のいずれか1項に記載の方法。
【0509】
実施の形態57.前記細胞は、真核細胞である、前述実施の形態のいずれか1項に記載の方法。
【0510】
実施の形態58.前記真核細胞は、動物細胞、植物細胞、真菌細胞、脊椎動物細胞、無脊椎動物細胞、げっ歯動物細胞、哺乳動物細胞、霊長類動物細胞、非ヒト霊長類動物細胞とヒト細胞から選択される、前述実施の形態のいずれか1項に記載の方法。
【0511】
実施の形態59.前記修飾は、前記標的DNAを切断することである、前述実施の形態のいずれか1項に記載の方法。
【0512】
実施の形態60.前記切断は、ヌクレオチド配列の欠失及び/又はヌクレオチド配列の挿入を引き起こす、前述実施の形態のいずれか1項に記載の方法。
【0513】
実施の形態61.前記切断は、二つの部位で前記標的核酸を切断し、前記二つの部位の間の配列の欠失又は反転を引き起こすことを含む、前述実施の形態のいずれか1項に記載の方法。
【0514】
実施の形態62.前記修飾は、塩基変異であり、好ましくはA→G又はC→T塩基変異である、前述実施の形態のいずれか1項に記載の方法。
【0515】
実施の形態63.前述実施の形態のいずれか1項に記載の方法からの細胞又はその子孫であって、前記方法を受けていない細胞に存在しない修飾を含む、細胞又はその子孫。
【0516】
実施の形態64.前記方法を受けていない細胞は、異常を含み且つ前記方法による前記細胞における異常は、既に解決又は修正されている、前述実施の形態のいずれか1項に記載の細胞又はその子孫。
【0517】
実施の形態65.前述実施の形態のいずれか1項に記載の細胞又はその子孫からの細胞生成物であって、前記方法を受けていない細胞からの細胞生成物の性質又は量に対して、修飾されている、細胞生成物。
【0518】
実施の形態66.前記方法を受けていない細胞は、異常を含み、且つ前記細胞生成物は、前記異常が既に前記方法によって解決又は修正されていることを反映する、前述実施の形態のいずれか1項に記載の細胞生成物。
【0519】
実施の形態67.非標的DNAを非特異的に切断する方法であって、前記標的DNAを前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体と接触させることによって、前記スペーサー領域と前記標的DNAの標的配列とのハイブリダイズ及び前記標的配列の前記Cas12iタンパク質による切断により、前記Cas12iタンパク質がスペーサー領域非特異性エンドヌクレアーゼバイパス活性によって前記非標的DNAを切断することを含む、方法。
【0520】
実施の形態68.サンプルにおける標的DNAを検出する方法であって、
(1)前記サンプルを、前述実施の形態のいずれか1項に記載のCRISPR-Casシステム又は複合体及び切断後に検出可能なシグナルを放出することができるレポーター核酸と接触させることによって、前記スペーサー領域と前記標的DNAの標的配列とのハイブリダイズ及び前記標的配列の前記Cas12iタンパク質による切断により、前記Cas12iタンパク質がスペーサー領域非特異性エンドヌクレアーゼバイパス活性によって前記レポーター核酸を切断することと、
(2)前記レポーター核酸の切断によって産生される検出可能なシグナルを測定することによって、前記サンプルにおける前記標的DNAの存在を検出することとを含む、方法。
【0521】
実施の形態69.前記方法は、前記検出可能なシグナルのレベルと参照シグナルのレベルとを比較し、前記検出可能なシグナルのレベルに基づいて前記サンプルにおける前記標的DNAの含有量を決定することをさらに含む、前述実施の形態のいずれか1項に記載の方法。
【0522】
実施の形態70.前記測定は、金ナノ粒子検出、蛍光偏光、コロイド相転移/分散、電気化学の検出又は半導体ベースの検知を用いて行われる、前述実施の形態のいずれか1項に記載の方法。
【0523】
実施の形態71.前記レポーター核酸は、蛍光発光色素対、蛍光共鳴エネルギー伝達(FRET)対又はクエンチャ/蛍石対を含み、且つ前記レポーター核酸の前記Cas12iタンパク質による切断により、前記レポーター核酸の切断によって産生される前記検出可能なシグナルのレベルが増加するか又は低減する、前述実施の形態のいずれか1項に記載の方法。
【0524】
実施の形態72.それを必要とする被験体の病症又は疾患を治療する方法であって、前記被験体に前述実施の形態のいずれか1項に記載のCRISPR-Casシステムを投与することを含む、方法。
【0525】
実施の形態73.前記病症又は疾患は、癌又は感染性疾患又は神経疾患であり、
任意選択的に、前記癌は、
ウィルムス腫瘍、ユーイング肉腫、神経内分泌腫瘍、神経膠芽腫、神経芽細胞腫、黒色腫、皮膚癌、乳癌、結腸癌、直腸癌、前立腺癌、肝癌、腎癌、膵癌、肺癌、胆道癌、子宮頸癌、子宮体癌、食道癌、胃癌、頭頚部癌、髄様甲状腺癌、卵巣癌、神経膠腫、リンパ腫、白血病、骨髄瘤、急性リンパ芽球性白血病、急性骨髄性白血病、慢性リンパ球性白血病、慢性骨髄性白血病、ホジキンリンパ腫、非ホジキンリンパ腫と膀胱癌から選択され、
任意選択的に、前記感染性疾患は、
ヒト免疫不全ウイルス(HIV)、単純ヘルペスウイルス-1(HSV1)と単純ヘルペスウイルス-2(HSV2)によって引き起こされ、
任意選択的に、前記神経疾患は、
緑内障、加齢に伴うRGCの喪失、視神経損傷、網膜虚血、レーベル遺伝性視神経症、RGCニューロンの変性に関連する神経疾患、それを必要とする被験者の線条体の機能性ニューロン変性に関連する神経疾患、パーキンソン病、アルツハイマー病、ハンチントン病、統合失調症、うつ病、薬物依存症、運動障害(例えば舞踏病、舞踏病様症状と運動障害)、双極性障害、自閉症スペクトラム障害(ASD)又は機能不全から選択される、前述実施の形態のいずれか1項に記載の方法。
【0526】
実施の形態74.前記病症又は疾患は、嚢胞性線維症、進行性偽肥大性筋ジストロフィー、ベッカー型筋ジストロフィー、α-1-アンチトリプシン欠乏症、ポンペ病、筋強直性ジストロフィー、ハンチントン病、脆弱X症候群、フリードライヒ失調症、筋萎縮性側索硬化症、前頭側頭型認知症、遺伝性慢性腎臓病、高脂血症、高コレステロール血症、レーベル先天性黒内障、鎌状赤血球症とβサラセミアから選択される、前述実施の形態のいずれか1項に記載の方法。
【0527】
実施の形態75.前記病症又は疾患は、病原性点突然変異の存在によって引き起こされる、前述実施の形態のいずれか1項に記載の方法。
【0528】
実施の形態76.前述実施の形態のいずれか1項に記載のCRISPR-Casシステムを含み、好ましくは、前記システムの成分は、同の一容器又は単独の容器にある、キット。
【0529】
実施の形態77.前述実施の形態のいずれか1項に記載のCRISPR-Casシステムを含み、好ましくは、前記無菌容器は、注射器である、無菌容器。
【0530】
実施の形態78.前述実施の形態のいずれか1項に記載のCRISPR-Casシステムを含み、好ましくは、前記CRISPR-Casシステムは、リザーバーに保存される、植え込み可能な装置。
【0531】
本開示は、以下の実施の形態をさらに提供する。
【0532】
項目1.操作された、天然に存在しないCRISPR-Casシステムであって、
(1)SEQ ID NO:1~3と6のうちのいずれか一つと少なくとも約90%の同一性を有するアミノ酸配列を含むCas12iタンパク質、又は前記Cas12iタンパク質をコードするポリヌクレオチドと、
(2)CRISPR RNA(crRNA)、又は前記crRNAをコードするポリヌクレオチドとを含み、前記crRNAは、
(i)標的DNAの標的配列にハイブリダイズ可能なスペーサー領域と、
(ii)前記スペーサー領域に連結され且つ前記Cas12iタンパク質と前記crRNAとの結合をガイドして前記標的配列を標的とするCRISPR-Cas複合体を形成することができるダイレクトリピート配列(DR)とを含む、操作された、天然に存在しないCRISPR-Casシステム。
【0533】
項目2.前記Cas12iタンパク質は、SEQ ID NO:1~3と6のうちのいずれか一つの該当する親Cas12iタンパク質の、前記標的DNAの標的配列に対するスペーサー領域特異的エンドヌクレアーゼ切断活性を基本的に有さない、項目1に記載の操作された、天然に存在しないCRISPR-Casシステム。
【0534】
項目3.前記Cas12iタンパク質は、SEQ ID NO:1の前記親Cas12iタンパク質配列のD700、D650、E875とD1049の一つ又は複数から選択される位置にアミノ酸置換を含む、項目2に記載の操作された、天然に存在しないCRISPR-Casシステム。
【0535】
項目4.前記アミノ酸置換は、D700A、D700V、D650A、D650V、E875A、E875V、D1049A、D1049V、D700A+D650A、D700A+E875A、D700A+D1049A、D650A+E875A、D650A+D1049A、E875A+D1049A、D700A+D650A+E875A、D700A+D650A+D1049A、D650A+E875A+D1049AとD700A+D650A+E875A+D1049Aから選択される、項目3に記載の操作された、天然に存在しないCRISPR-Casシステム。
【0536】
項目5.前記Cas12iタンパク質は、SEQ ID NO:79~82のうちのいずれか一つのアミノ酸配列を含む、項目3に記載の操作された、天然に存在しないCRISPR-Casシステム。
【0537】
項目6.前記Cas12iタンパク質は、一つ又は複数の機能ドメインに融合して融合タンパク質を形成する、項目2に記載の操作された、天然に存在しないCRISPR-Casシステム。
【0538】
項目7.前記機能ドメインは、アデノシンデアミナーゼ触媒ドメイン、シチジンデアミナーゼ触媒ドメイン、DNAメチル化触媒ドメイン、DNA脱メチル化触媒ドメイン、転写活性化触媒ドメイン、転写阻害触媒ドメイン、核外輸送シグナルと核局在化シグナルから選択される、項目6に記載の操作された、天然に存在しないCRISPR-Casシステム。
【0539】
項目8.前記Cas12iタンパク質は、TadA8e又はその機能断片に融合して前記融合タンパク質を形成する、項目7に記載の操作された、天然に存在しないCRISPR-Casシステム。
【0540】
項目9.前記融合タンパク質は、SEQ ID NO:85又は184のアミノ酸配列を含む、項目8に記載の操作された、天然に存在しないCRISPR-Casシステム。
【0541】
項目10.前記Cas12iタンパク質は、SEQ ID NO:1~3と6のうちのいずれか一つの前記親Cas12iタンパク質の、非標的DNAに対するスペーサー領域非特異性エンドヌクレアーゼバイパス活性を基本的に有さない、項目1に記載の操作された、天然に存在しないCRISPR-Casシステム。
【0542】
項目11.前記DRは、SEQ ID NO:21~23、26と101~106のうちのいずれか一つの前記DRの二次構造と実質的に同じ二次構造を有する、項目1に記載の操作された、天然に存在しないCRISPR-Casシステム。
【0543】
項目12.前記DRは、前記DRの3’末端付近の、SEQ ID NO:114~123のうちのいずれか一つから選択されるステム-ループ構造を含み、ここで、Nは、任意の核塩基である、項目11に記載の操作された、天然に存在しないCRISPR-Casシステム。
【0544】
項目13.前記標的配列は、プロトスペーサー隣接モチーフ(PAM)の3’末端にある、項目1に記載の操作された、天然に存在しないCRISPR-Casシステム。
【0545】
項目14.前記PAMは、5’-TTA、5’-TTT、5’-TTG、5’-TTC、5’-ATAと5’-ATGから選択される、項目13に記載の操作された、天然に存在しないCRISPR-Casシステム。
【0546】
項目15.前記操作された、天然に存在しないCRISPR-Casシステムは、同じ又は異なるベクター上に位置する、前記Cas12iタンパク質をコードするポリヌクレオチドと、前記crRNAをコードするポリヌクレオチドとを含む、項目1に記載の操作された、天然に存在しないCRISPR-Casシステム。
【0547】
項目16.同じベクター上に位置する、前記Cas12iタンパク質をコードするポリヌクレオチドと、前記crRNAをコードするポリヌクレオチドとは、それぞれ調節要素に動作可能に連結される、項目15に記載の操作された、天然に存在しないCRISPR-Casシステム。
【0548】
項目17.前記スペーサー領域の長さは、少なくとも約16個のヌクレオチドである、項目1に記載の操作された、天然に存在しないCRISPR-Casシステム。
【0549】
項目18.標的DNAを修飾する方法であって、前記標的DNAを、項目1に記載の操作された、天然に存在しないCRISPR-Casシステムと接触させることを含み、ここで、前記crRNAは、前記crRNAのスペーサー領域を介して前記標的DNAの標的配列にハイブリダイズし、且つ、ここで、前記Cas12iタンパク質は、前記crRNAに結合してCRISPR-Cas複合体を形成し、前記標的DNAの標的配列を修飾する、方法。
【0550】
項目19.前記修飾は、前記標的DNAの切断と、一塩基編集と、修復とのうちの一つ又は複数を含む、項目18に記載の方法。
【0551】
項目20.前記修飾は、前記標的DNAの修復を含み、且つ、ここで、前記方法は、修復テンプレートDNAを導入することをさらに含む、項目19に記載の方法。
【0552】
項目21.前記修飾は、インビトロ、エクスビボ又はインビボで発生する、項目18に記載の方法。
【0553】
項目22.項目18に記載の方法から得られる細胞又はその子孫。
【0554】
項目23.項目22に記載の細胞又はその子孫を含む、非ヒト多細胞生物。
【0555】
項目24.それを必要とする被験体の病症又は疾患を治療する方法であって、前記被験体に有効量の項目1に記載の操作された、天然に存在しないCRISPR-Casシステムを投与することを含み、ここで、前記病症又は疾患は、標的DNAにおける突然変異に関連し、ここで、前記crRNAは、前記crRNAのスペーサー領域を介して前記標的DNAの突然変異を含む標的配列にハイブリダイズし、ここで、前記Cas12iタンパク質は、前記crRNAに結合してCRISPR-Cas複合体を形成し、前記標的DNAの標的配列を修飾し、且つ、ここで、前記標的DNAにおける前記突然変異の修飾は、前記病症又は疾患を治療する、方法。
【0556】
項目25.前記病症又は疾患は、トランスサイレチンアミロイドーシス(ATTR)、嚢胞性線維症、遺伝性血管浮腫、糖尿病、進行性偽肥大性筋ジストロフィー、ベッカー型筋ジストロフィー、α-1-アンチトリプシン欠乏症、ポンペ病、筋強直性ジストロフィー、ハンチントン病、脆弱X症候群、フリードライヒ失調症、筋萎縮性側索硬化症、前頭側頭型認知症、遺伝性慢性腎臓病、高脂血症、高コレステロール血症、レーベル先天性黒内障、鎌状赤血球症とβサラセミアから選択される、項目24に記載の方法。
【0557】
項目26.前記病症又は疾患は、ATTRである、項目25に記載の方法。
【0558】
項目27.前記操作された、天然に存在しないCRISPR-Casシステムは、脂質ナノ粒子において投与される、項目24に記載の方法。
【0559】
さらなる実施の形態を以下の実施例に説明しているが、これらの実施例は、説明のみを目的としており、本開示の範囲を制限することを意図するものではない。
【実施例
【0560】
実施例
材料と方法
別段の指定がない限り、実施例で使用される実験方法は、一般的なものである。
【0561】
別段の指定がない限り、実施例で使用される材料、試薬などは、市販から入手可能である。
【0562】
別段の指定がない限り、実施例で以下の材料と実験方法を使用する。
【0563】
プラスミドベクターの構築。
金斯瑞有限責任公司(GenScript Co.,Ltd.)によってヒトコドン最適化されたCas12i、TadA8eとヒトAPOBEC3A遺伝子を合成し、且つGibsonアセンブリによってクローニングしてpCAG_NLS-Cas12i-NLS_pA_pU6_BpiI_pCMV_mCherry_pAを生成した。HuaGene有限責任公司(HuaGene Co.,Ltd.)によってcrRNAオリゴマーを合成し、アニーリングし、BpiI部位に産生してpCAG_NLS-Cas12i-NLS_pA_pU6_crRNA_pCMV_mCherry_pAを生成した。
【0564】
細胞培養、トランスフェクションとフローサイトメトリー分析。
この研究で使用された哺乳動物細胞株は、HEK293TとN2Aである。細胞を10% FBS、ペニシリン/ストレプトマイシンとGlutMAXを補足したダルベッコ改変イーグル培地(DMEM)で培養した。ポリエーテルイミド(PEI)を用いてトランスフェクションを行った。変異体スクリーニングについて、HEK293T細胞を24ウェルプレートで培養し、且つ12時間後、4μL PEIで2μgのプラスミド(1μgの発現プラスミドと1μgのレポータープラスミド)をこれらの細胞にトランスフェクションした。トランスフェクションの48時間後、Beckman CytoFlexフローサイトメーターを用いてBFP、mCherryとEGFP蛍光を分析した。内在性遺伝子の標的部位における突然変異のアッセイについて、1μgの発現プラスミドをHEK293T又はN2A細胞にトランスフェクションし、そしてトランスフェクションの48時間後にBD FACS Aria III、BD LSRFortessa X-20フローサイトメーターを用いてそれを選別した。
【0565】
遺伝子編集頻度の検出。
20μlの開裂緩衝液(バザイム社(Vazyme))において6000個の選別細胞を開裂した。Phanta Max超高忠実度DNAポリメラーゼ(バザイム社)によってターゲッティング配列プライマーを合成し、ネステッドPCR増幅に使用した。ターゲッティングディープ配列分析を用いて挿入欠失頻度を決定した。ターゲッティングディープ配列分析又はSangerシーケンシングとEditRによってAからG又はCからT編集頻度を計算した。AからG編集純度をAからG編集効率/(AからT編集効率+AからC編集効率+AからG編集効率)として計算した。CからT編集純度をCからT編集効率/(CからA編集効率+CからG編集効率+CからT編集効率)として計算した。
【0566】
PEM-seq。
前述のように、HEK293細胞においてPEM-seq23を行った。簡単に言えば、LbCas12a、Ultra-AsCas12a、hfCas12Max、ABR001又はCas12i2HiFi及び、TTR.2を標的とするcrRNAを含有する一体化プラスミドを、PEIを介してそれぞれHEK293細胞にトランスフェクションし、且つ48時間後に陽性細胞を採取してDNA抽出を行った。Covaris超音波処理によって20μgのゲノムDNAを断片化し、ピーク長は、300-700bpである。5’末端において一輪のビオチン化プライマー伸長によってビオチンでDNA断片を標識し、そしてAMPure XPビーズによってプライマーを除去し、ストレプトアビジンビーズによって精製した。ストレプトアビジンビーズ上の一本鎖DNAを、14-bp RMBを含有するブリッジアダプターに連結し、且つPCR生成物をネステッドPCRしてベイトDSBを含有するDNA断片を濃縮し、illumineアダプター配列で標識した。Hi-seq 2500上において2x150bpで、製造されたシーケンシングライブラリをシーケンシングした。
【0567】
RNP送達とエクスビボ編集。
1X PBSにおいて1:2のモル比で、精製されたhfCas12Maxタンパク質と、化学合成されたRNAオリゴヌクレオチド(金斯瑞社)とを混合することによってRNPを複合化した。RNPを室温下で15min以上インキュベートし、そしてLonza(R) 4D-Nucleofector(商標)でエレクトロポレーションを行った。0.2×10個の細胞を20μLのLonza緩衝液に再懸濁し、且つLonza規範に基づいてエレクトロポレーションした異なる濃度の5μLのRNPと混合した。エレクトロポレーションの72時間後にHEK293又はCD3+T細胞を採取し、ターゲッティングディープ配列分析を行った。
【0568】
LNP送達とインビボ編集。
100%エタノールにおいてALC0315、コレステロール、DMG-PEG2k、DSPCでLNPを調製し、インビトロ転写(IVT)mRNAと化学合成されたRNAオリゴヌクレオチド(金斯瑞社)とを担持し、重量比は、1:1である。製造業者の方案に従って、精密ナノシステムNanoAssemblrベンチトップ計器を用いて脂質とRNA溶液マイクロ流体とを混合してLNPを形成した。PBSで希釈したLNP以0.1、0.3、0.5、1μg RNAをN2a細胞にトランスフェクションし、又は尾静脈内注射により異なる投与量でC57マウスに送達した。トランスフェクションの48時間後に細胞を採取し、開裂とターゲッティングディープ配列分析を行った。インビボ編集について、注射の7日後に各マウスの左葉又は正中葉から肝臓組織を収集し、DNA抽出とターゲッティングディープ配列分析に用いた。
【0569】
受精卵注射と胚培養。
5IU妊馬血清ゴナドトロピン(PMSG)を注射し、次いで48時間後に5IUヒト絨毛性ゴナドトロピン(hCG)を注射した、過剰排卵された雌C57マウス(7-8週齢)をB6D2F1雄と交配させ、且つhCG注射の20時間後に卵管から受精胚を採取した。受精卵注射について、hfCas12Max mRNA(100ng/μL)とsgRNA(100ng/μL)とを混合し、且つ一定流量設定を有するFemtoJetマイクロシリンジ(Eppendorf)を用いて、5mg/mlのサイトカラシンB(CB)を含有するHEPES-CZB培地液滴における受精卵の細胞質に注射した。注射された受精卵を、しアミノ酸を有するKSOM培地において37℃で、5% CO下で空気において胚盤胞まで培養し、採取してターゲッティングディープ配列分析を行った。
【0570】
実施例1 Cas12iタンパク質の同定及びCas12iタンパク質を含むCRISPR-Cas12iシステムのdsDNA切断活性の評価
より多くのCas12iを同定するために、出願人は、Cas12iタンパク質、CRISPRアレイと予測されたPAMの好みを注釈するバイオインフォマティクスパイプラインを開発して採用し、且つ次の表1における10種類のCRISPR-Cas12iシステムを同定した。
【0571】
【表4】
【0572】
これらのCas12iの哺乳動物細胞における活性を評価するために、出願人は、Cas媒介性dsDNA切断又は二本鎖切断によって活性化された改良型緑色蛍光タンパク質(EGFP)シグナル強度の増加を検出するデュアルプラスミド蛍光レポーターシステムを設計した(図3A)。このシステムは、mCherryをコードする発現プラスミド、核局在化シグナル(NLS)標識のCasタンパク質及びそのガイドRNA(gRNA)又はcrRNA及びBFPと活性化可能なEGxxFPカセットをコードするレポータープラスミド(即ち、EGxx-標的部位-xxFP)のコトランスフェクション 11に依存した。Cas媒介性DSBと一本鎖アニーリング(SSA)媒介性修復によってEGFP活性化を行った。
【0573】
特に、図3Aを参照すると、レポータープラスミドは、ポリヌクレオチドを含み、該ポリヌクレオチドは、5’から3’にBFP-P2A-活性化可能なEGxxxxFP(SEQ ID NO:41)(EGxx-挿入配列(SEQ ID NO:42)(5’から3’にCas12iのTTCが含有されるプロトスペーサー隣接モチーフ(PAM)、プロトスペーサー配列(SEQ ID NO:43)(それが標的配列(SEQ ID NO:44)の逆相補配列である)とCas9のGGGのプロトスペーサー隣接モチーフ(PAM))-xxFP)をコードし、次はbGH polyA(SEQ ID NO:448)コード配列であり、それは、ヒトCMVプロモーター(SEQ ID NO:447)に動作可能に連結された。プロトスペーサー配列(SEQ ID NO:43)は、EGFP発現を阻止し、且つそのため、緑色蛍光シグナル放出を阻止する早期停止コドンTAGを含有した。BFPコード配列は、青色蛍光によってレポータープラスミドの宿主細胞へのトランスフェクションの成功を指示するためにBFPを発現した。
【0574】
ほとんどの既知のCas12iタンパク質は、dsDNAにおける5’-Tに富むPAMを認識したが、Cas9は、dsDNAにおける3’-Gに富むPAMを認識した。Cas12iのTTCの5’ PAM及びプロトスペーサー配列(SEQ ID NO:43)が側接するCas9のGGGの3’ PAMの共存により、Cas12iとCas9のdsDNA切断活性の同時比較が可能となった。
【0575】
活性化可能なEGxxxxFPコード配列、SEQ ID NO:41
atgagcgagctgattaaggagaacatgcacatgaagctgtatatggagggcaccgtggacaaccatcacttcaagtgcacatccgagggcgaaggcaagccctacgagggcacccagaccatgagaatcaaggtggtcgagggcggccctctccccttcgccttcgacatcctggctactagcttcctctacggcagcaagaccttcatcaaccacacccagggcatccccgacttcttcaagcagtccttccctgagggcttcacatgggagagagtcaccacatacgaggacgggggcgtgctgaccgctacccaggacaccagcctccaggacggctgcctcatctacaacgtcaagatcagaggggtgaacttcacatccaacggccctgtgatgcagaagaaaacactcggctgggaggccttcaccgagacactgtaccccgctgacggcggcctggaaggcagaaacgacatggccctgaagctcgtgggcgggagccatctgatcgcaaacatcaagaccacatatagatccaagaaacccgctaagaacctcaagatgcctggcgtctactatgtggactacagactggaaagaatcaaggaggccaacaacgagacatacgtcgagcagcacgaggtggcagtggccagatactgcgacctccctagcaaactggggcacaagctgaatgaattcgagggcaggggcagcctgctgacctgcggcgacgtggaggagaaccccggccccatggtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggcgacgtaaacggccacaagttcagcgtgtccggcgagggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggcccaccctcgtgaccaccctgacctacggcgtgcagtgcttcagccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttcttcaaggacgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatcctggggcacaagctggagtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaacggcatcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgccgaccactaccagcagaacaccGGATCCGTGTCTTTCCCATTACAGTAGGAGCATACGGGAGACAAGCTTTGgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggcccaccctcgtgaccaccctgacctacggcgtgcagtgcttcagccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttcttcaaggacgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatcctggggcacaagctggagtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaacggcatcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgccgaccactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccactacctgagcacccagtccgccctgagcaaagaccccaacgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctcggcatggacgagctgtacaagtaa
挿入配列、SEQ ID NO:42
GGATCCGTGTCTTTCCCATTACAGTAGGAGCATACGGGAGACAAGCTTTG
プロトスペーサー配列(標的配列の逆相補配列)、20bp、SEQ ID NO:43
CCATTACAGTAGGAGCATAC
Cas12iの標的配列、20nt、SEQ ID NO:44
GTATGCTCCTACTGTAATGG
EGxxxxFPターゲッティングスペーサー配列、20nt、SEQ ID NO:45
CCATTACAGTAGGAGCATAC
非ターゲッティング(「NT」)スペーサー配列、20nt、SEQ ID NO:46
GGTCTTCGATAAGAAGACCT
Cas12iのPAM
TTC
Cas9のPAM
GGG
【0576】
図3Aをさらに参照すると、発現プラスミドは、5’から3’まで、i)コドン最適化されいて哺乳動物細胞において発現するためのCas12iコード配列(SEQ ID NO:31-40)であって、それは、5’末端においてSV40 NLS(SEQ ID NO:444)コード配列に側接し、且つ3’末端においてNP NLS(SEQ ID NO:445)コード配列に側接し、次いでCAGプロモーター(SEQ ID NO:500)に動作可能に連結されるbGH polyA(SEQ ID NO:448)コード配列であるCas12iコード配列(SEQ ID NO:31-40)と、ii)5’-DR配列-スペーサー配列-3’に構成され且つヒトU6プロモーター(SEQ ID NO:446)に動作可能に連結される、ガイドRNA(gRNA)をコードする配列と、iii)mCherryのコード配列であって、次いでヒトCMVプロモーター(SEQ ID NO:447)に動作可能に連結されるbGH polyA(SEQ ID NO:448)コード配列であるmCherryのコード配列とを含んだ。mCherryコード配列は、赤色蛍光によってプラスミドの宿主細胞へのトランスフェクションの成功を発現することを指示するためにmCherryを発現した。
【0577】
標的dsDNAの標的鎖上の標的配列と非標的鎖上のプロトスペーサー配列がいずれもgRNAガイドのCas12iポリペプチドによって切断されて二本鎖切断(DSB)を生成することに成功した場合、その後のDNA修復(例えば、DSBによって誘発された一本鎖アニーリング(SSA)によって媒介される修復)は、EGFPを発現するためにEGFPコード配列を回復し、緑色蛍光発光は、dsDNA切断活性を指示した。
【0578】
テスト群について、gRNA(SEQ ID NO:51-60)に含まれる、各テストCas12iポリペプチド(SEQ ID NO:1~10)用のスペーサー配列は、EGxxxxFPターゲッティングスペーサー配列(SEQ ID NO:45)であり、該スペーサー配列は、標的配列(SEQ ID NO:44)を標的とし、且つそれにハイブリダイズするように設計され、且つgRNA(SEQ ID NO:51-60)におけるDR配列は、各テストCas12iポリペプチド(SEQ ID NO:1~10)に対応するDR配列(SEQ ID NO:11~20)であり、表2に示すとおりである。
【0579】
【表5】
【0580】
各テストCRISPR-Casシステム(Cas12i、SpCas9、LbCas12a)の陰性対照(「NT」)について、標的配列(SEQ ID NO:44)にハイブリダイズできない非ターゲッティングスペーサー配列(「NT」、SEQ ID NO:46)でEGxxxxFPターゲッティングスペーサー配列(SEQ ID NO:45)を代替し、同時に各CRISPRシステムの他の要素を保持した。
【0581】
陽性対照について、次の表3に示すCRISPR-SpCas9とCRISPR-LbCas12aシステムでテストしたCRISPR-Cas12iシステムを代替し、ここで、同じEGxxxxFPターゲッティングスペーサー配列(SEQ ID NO:45)と該当するcrRNA(SEQ ID NO:48又は50)を用いた。また、CRISPR-SpCas9システムについて、gRNAは、5’-スペーサー配列-足場配列-3’の配置を呈した。
【0582】
【表6】
【0583】
標準方法に従ってHEK293T細胞を24ウェル組織培養プレートにおいて12時間培養し、そして標準ポリエチレンイミン(PEI)トランスフェクションを用いてレポータープラスミドと発現プラスミドコを細胞にトランスフェクションした。そして、トランスフェクションされた細胞を37℃で、5% CO下で48時間培養した。そして、フローサイトメトリーによって培養細胞のBFP、EGFPとmCherry蛍光シグナルを分析した。「ブランク」対照群も設定しており、ここで、レポータープラスミドのみをトランスフェクションし、且つ発現プラスミドを導入しなかった。
【0584】
Casタンパク質のdsDNA切断活性をBFPとmCherry二重陽性細胞におけるEGFP陽性細胞の百分率(「EGFP」、レポータープラスミド上の指示標的部位におけるdsDNA切断を指示し、「mCherry BFP」、発現プラスミドとレポータープラスミドのコトランスフェクションと共発現の成功を指示した)として計算した。%EGFP/mCherry BFPが高いほど、dsDNA切断活性が高くなった。
【0585】
このデュアルプラスミド蛍光レポーターシステムを用いて、五種類のCas12i(Cas12i3、Cas12i7、Cas12i10、Cas12i11とCas12i12)が、ターゲッティングgRNA誘導によるEGFP発現の著しい活性化を示すことが観察され、それによって著しいdsDNA切断を指示し(図1A図3B)、ここで、Cas12i12(本明細書においてSiCas12i又はxCas12iとも呼ばれる)は、蛍光活性化セルソーティング(FACS)分析によって決定されるように、LbCas12a又はSpCas9よりも高いdsDNA切断を示した(図1A)。SpCas9及びLbCas12aと比べて、xCas12iの寸法がより小さかった(図4A)。
【0586】
実施例2 xCas12iの有効スペーサー配列長さの評価
実施例1におけるデュアルプラスミド蛍光レポーターシステムを用いて、xCas12iの有効スペーサー配列長さをテストするために、実施例1におけるGFxxxxFPレポータープラスミドの挿入配列(SEQ ID NO:42)の該当するプロトスペーサー配列(SEQ ID NO:45とSEQ ID NO:61-81でもある)の逆相補配列を標的とし、それにハイブリダイズし、且つ20ntスペーサー配列がちょうど実施例1におけるEGxxxxFPターゲッティングスペーサー配列(SEQ ID NO:45)となるように、10~50ntの範囲を有する異なる長さのスペーサー配列(SEQ ID NO:45と61-81、以下の表4に示す)を設計した。別のスペーサー領域の長さを評価するために、レポータープラスミドにおけるEGxxxxFPターゲッティングスペーサー配列(SEQ ID NO:45)を該当する長さのスペーサー配列(SEQ ID NO:61-81)に置き換え、同時にデュアルプラスミド蛍光レポーターシステムの他の要素を保持した。
【0587】
【表7】
【0588】
実施例1における実験手順を使用することにより、少なくとも16個のヌクレオチドのスペーサー配列長さ範囲がxCas12iの活性に有効であり、且つこの範囲内において、17-22ntが最適であることが観察された(図4B)。
【0589】
実施例3 xCas12iのPAM認識の評価
Cas12iの5’-TTN PAMの好みを考慮すると、出願人は、実施例1におけるデュアルプラスミド蛍光レポーターシステムを用いてNTTN PAM同定アッセイを行い、ここで、様々な5’ PAMでTTCの元の5’ PAMを代替し、同時にデュアルプラスミド蛍光レポーターシステムの他の要素を保持した。
【0590】
実施例1における実験手順を使用することにより、xCas12iが、5’-NTTN PAM配列を有する標的部位において一貫して高いEGFP活性化頻度を示し、ここで、NがA、T、C又はGであり、LbCas12aが5’-TTTN PAMにおいて同等な活性を有することがそれぞれ観察された(図4C)。
【0591】
実施例4 DR配列のxCas12iのdsDNA切断活性に対する影響
xCas12iの元のDR配列(SEQ ID NO:11)が突然変異に耐えられるかどうかをテストするために、出願人は、元のDR配列の二次構造を破壊することなく、元のDR配列を切断してSEQ ID NO:501と502の二つの機能断片DR-T1とDR-T2をそれぞれ生成し、且つそしてSEQ ID NO :503~507のDR-A、DR-B、DR-C、DR-DとDR-E配列をそれぞれ生成するように、DR-T2の五種類のDR変異体を設計し、各配列は、元のDR配列の二次構造を破壊することなく(即ちDR変異体の二次構造は、元のDR配列の二次構造と基本的に同じである)、ステムループ領域に5%~30%の突然変異を含有した。
【0592】
SEQ ID NO:501 DR-T1、30nt
ATGACTCAGAAATGTGTCCCCAGTTGACAC
SEQ ID NO:502 DR-T2配列、23nt
AGAAATGTGTCCCCAGTTGACAC
SEQ ID NO:503 DR-A配列、23nt
AGAAATCCGTCCTTAGTTGACGG
SEQ ID NO:504 DR-B配列、22nt
AGACATGTGTCCCCAGTGACAC
SEQ ID NO:505 DR-C配列、23nt
AGAAATGTTTCCCCAGTTGAAAC
SEQ ID NO:506 DR-D配列、23nt
AGAAATGTGTTCCCAGTTAACAC
SEQ ID NO:507 DR-E配列、23nt
AGAAATTTGTCCCCAGTTGACAA
【0593】
実施例1におけるxCas12iのデュアルプラスミド蛍光レポーターシステムを使用することにより、元のDR配列をDR変異体(DR-T1、DR-T2、DR-A、DR-B、DR-C、DR-DとDR-E)の各種に置き換え、同時にレポーターシステムの他の要素を保持した結果(図21)、xCas12iが依然として様々なDR配列変異体を有するgRNAによって媒介される高いdsDNA切断活性を示すことが示された。上記から分かるように、DR配列の二次構造を維持することを条件とし(即ち、DR変異体の二次構造は、元のDR配列の二次構造と基本的に同じである)、CRISPR-SiCas12iシステムは、dsDNA切断活性に損失がなく、DR配列上のミスマッチ又は欠失に耐えられ、且つDR配列変化に対して広い適応性を有した。これらのデータは、SEQ ID NO:11(36nt)の元のxCas12i DR配列の二つの機能切断バージョン、即ちDR-T1(SEQ ID NO:501、30nt)とDR-T2(SEQ ID NO:502、23nt)が、依然としてxCas12iを媒介できる高いdsDNA切断活性をさらに証明した。
【0594】
実施例5 内在性遺伝子におけるxCas12iのdsDNA切断活性の評価
哺乳動物細胞における内在性遺伝子におけるxCas12iのdsDNA切断活性(ゲノム切断)をさらに検証するために、出願人は、HEK293T(ヒト胚腎293細胞)におけるヒトTTR12遺伝子とヒトPCSK913遺伝子又はN2a細胞(快速生長するマウス神経芽腫細胞株であるNeuro2a細胞)におけるマウスTtr遺伝子を標的とする37部位のgRNAで、実施例1においてNLS標識のxCas12iをコードする発現プラスミドをトランスフェクションした(図3A図4D)。実施例1におけるEGxxxxFPターゲッティングスペーサー配列(SEQ ID NO:45)を該当する遺伝子ターゲッティングスペーサー配列(表5におけるSEQ ID NO:82-126)に置き換え、DR-T1配列(SEQ ID NO:501)で元のDR配列を代替し(SEQ ID NO:11)(且つ別段の指定がない限り、以下の実施例においても同様)、同時に実施例1におけるCRISPR-xCas12iシステムの他の要素を保持した。トランスフェクションの48時間後にFACSとターゲッティングディープシーケンシングで、これらの遺伝子座におけるdsDNA切断活性、即ち挿入欠失(挿入及び/又は欠失)の形成を測定した。
【0595】
xCas12iが、Ttr、TTRとPCSK9由来のほとんどの部位において高頻度(最大90%)の挿入欠失形成を媒介し、平均挿入欠失形成率が50%を超えたことが観察された(図4E-F)。これらのデータは、xCas12iが哺乳動物細胞において頑強なゲノム編集効率を示すことを指示し、それによってそれが治療性ゲノム編集応用において優れた潜在力を有することを示した。
【0596】
【表8-1】
【表8-2】
【0597】
実施例6 xCas12i突然変異体の開発及びそのdsDNA切断活性の評価
xCas12iの活性を改変し、そのPAM部位認識範囲を拡大するために、出願人は、突然変異誘発によってxCas12iタンパク質を操作し、且つ、実施例1におけるデュアルプラスミド蛍光レポーターシステムに類似するデュアルプラスミド蛍光レポーターシステムを用いて、より効率かつ広範なPAMを有する変異体をスクリーニングし、相違点は、EGxxxxFPターゲッティングガイドRNA(SEQ ID NO:51)コード配列がxCas12iコード配列(SEQ ID NO:31)とともに発現プラスミド上に位置するのではなく、BFP-P2A-EGxxxxFPコード配列(SEQ ID NO:41)とともにレポータープラスミド上に位置することである(図1Bにおける「オンターゲットレポーター遺伝子」を参照する)。xCas12iの予測性構造分析と組み合わせて、出願人は、xCas12iのPIドメイン(アミノ酸残基位置173~291)、REC-Iドメイン(アミノ酸残基位置427~473)とRuvC-IIドメイン(アミノ酸残基位置800~1082)においてアルギニン(R)スキャニング突然変異誘発方法を行うことによって、500種類以上のxCas12i突然変異体のライブラリを生成し、ここで、Rで単一の非Rアミノ酸置換を行った。発現プラスミド上のxCas12i(SEQ ID NO:1)コード配列を各種類のxCas12i突然変異体をコードする配列に置き換え、DR-T1配列(SEQ ID NO:501)で元のDR配列(SEQ ID NO:11)を代替し、同時にレポーターシステムの他の要素を保持した。そして、出願人は、発現プラスミドとレポータープラスミドを単独でHEK293T細胞にトランスフェクションし、FACSによってそれを分析した(図1B)。
【0598】
陰性対照(「NT」)について、標的配列(SEQ ID NO:44)にハイブリダイズできない非ターゲッティングスペーサー配列(「NT」、SEQ ID NO:46)でEGxxxxFPターゲッティングスペーサー配列(SEQ ID NO:45)を代替し、且つxCas12i(SEQ ID NO:1)と組み合わせて使用し、同時にレポーターシステムの他の要素を保持した。
【0599】
陽性対照(「WT」)について、元のxCas12i(SEQ ID NO:1)を使用した。
【0600】
【表9-1】
【表9-2】
【表9-3】
【表9-4】
【0601】
EGFPを活性化した細胞を有する蛍光強度に基づいて、192種類のxCas12i突然変異体が野生型(WT)xCas12i(SEQ ID NO:1)に対して増加したdsDNA切断活性(図5A、表6)を示し、且つ、そのうちの1種類である突然変異体xCas12i-N243R(Cas12Maxと呼ばれる)が約3.6倍の改善を示したことが観察された(図5A)。また、51種類のxCas12i突然変異体は、WT xCas12iに対して5%以下のdsDNA切断活性(SEQ ID NO:1)を有した。
【0602】
そして、出願人は、N243に対して飽和突然変異誘発を行い、且つRへの突然変異が確かに最も高いdsDNA切断活性を示したことが観察された(図6A)。
【0603】
次に、出願人は、蛍光レポーターシステムを用いてDMD又はTtr部位(DMD又はTtrプロトスペーサーを含有する挿入配列及び表5に列挙された該当する5’ PAMで挿入配列(SEQ ID NO:42)を代替する)を標的とし、且つWT xCas12i、Cas12Maxに対して明らかに増加したEGFP活性化頻度を提示したことが観察された(図1C図6B-C)。
【0604】
Cas12Maxのターゲッティング遺伝子座における効能をさらにテストするために、出願人は、合計8個のgRNAを設計してHEK293T細胞におけるTTRとPCSK9部位を標的とし、且つ別の三つのgRNAを設計してN2a細胞におけるTtr(表5)を標的とし、且つDR-T2(SEQ ID NO:502)を使用した。以前の結果と一致して、WT xCas12iと比べて、Cas12Maxは、著しく増加した挿入欠失頻度を示した(図1D)。
【0605】
実施例7 Cas12Maxに基づく突然変異体のさらなる開発及びそのオフターゲットdsDNA切断活性の評価
Cas12Maxの特異性を検査するために、出願人は、TTR12を標的とするgRNA(SEQ ID NO:130を有するTTRターゲッティング(オンターゲット)スペーサー配列)で、Cas12Maxを発現するために設計された構築体をトランスフェクションし、且つCas-OFFinder17によって予測されたオンターゲットとオフターゲット(OT)部位の挿入欠失頻度分析を行った。
【0606】
【表10】
【0607】
オフターゲットdsDNA切断活性を評価するためのデュアルプラスミド蛍光レポーターシステム(オフターゲットレポーターシステムであって、図1Bにおける「オフターゲットレポーター遺伝子」を参照する)を確立し、それは、実施例5におけるdsDNA切断活性を評価するためのデュアルプラスミド蛍光レポーターシステムに類似し、相違点は、EGxxxxFPコード配列の挿入配列がTTRオフターゲットプロトスペーサー配列(SEQ ID NO:127-129)を含有し、該プロトスペーサー配列が、TTRプロトスペーサー配列(SEQ ID NO:130でもある)を含有することではなく、TTRターゲッティングスペーサー配列(SEQ ID NO:130)との一つ又は複数のミスマッチ(太字、下線)を含有し、且つDR-T1配列(SEQ ID NO:501)を使用したことである。
【0608】
オフターゲットレポーターシステム(図7A)又は内在性遺伝子のターゲッティングディープ配列分析(図7B)を用いて、出願人は、Cas12Maxが標的部位(「ON.1」)を効果的に編集し、同時に3つの予測オフターゲット部位(「OT.1」、「OT.2」と「OT.3」)の2つ(「OT.1」と「OT.2」)において挿入欠失形成を引き起こすことによって、オフターゲットdsDNA切断活性を指示したことが観察された。
【0609】
Cas12Maxのオフターゲット活性を消失させるために、出願人は、実施例5においてRECとRuvCドメインに単一の突然変異18を有し、且つオンターゲット切断活性が弱まっていない(WTに相当する)それらの突然変異体を選択し、且つそしてそれぞれTTR OT1とOT2を有する上記二つのオフターゲットレポーターシステムを用いてそのオフターゲットdsDNA切断活性をテストした(図1B)。
【0610】
四つのxCas12i突然変異体(xCas12i-V880R(v4.1)、xCas12i-M923R(v4.2)、xCas12i-D892R(v4.3)とxCas12i-G883R(v4.4))が高レベルのオンターゲットdsDNA切断活性を維持し、且つTTR OT1とOT2の二箇所においてオフターゲットdsDNA切断活性を基本的に有さないように示したことが観察された(図8A)。
【0611】
出願人は、さらにこの4種類のアミノ酸置換のうちの一つ又は複数をN243R又はN243R+E336Rと組み合わせて(図8B)、且つ変異体v6.3(N243R+E336R+D892R)がOT.1とOT.2部位において最も低いオフターゲットEGFP活性化を示したが、ON.1部位において高いオンターゲットを示したことが観察された(図8B-C)。HEK293Tにおける内在性TTR.2部位及びそのオフターゲット部位のターゲッティングディープシーケンシング分析により、Cas12Maxと比べて、v6.3(N243R+E336R+D892R)が6つのOT部位においてオフターゲット挿入欠失頻度を著しく低減させ、且つON部位においてオンターゲットを保持したことが示された(図1E)。また、Cas12Max(v1.1)、v6.3(N243R+E336R+D892R)に対してDMD.1、DMD.2とDMD.3部位において同等又はひいてはより高いオンターゲット活性を保持した(図8D)。そのため、出願人は、v6.3を高忠実度Cas12Max(hfCas12Max)と命名した。
【0612】
【表11】
【0613】
また、hfCas12MaxのPAMの好みを研究するために、出願人は、実施例3に類似しており、同じ標的配列を有するが異なるPAMを有するレポータープラスミドを設計することによって5’-NNN PAM認識アッセイを行った。5’-TTN PAMを有する部位において一致するか又はそれ以上の切断活性を示すことに加えて、一般的に使用されているCas127,19(LbCas12a、Ultra-AsCas12a)及び最近報告された改良されたCas12i220,21(ABR001、Cas12i2HiFi)と比べて、hfCas12MaxとCas12MaxがTNN、ATN、GTNとCTN PAM部位を有するターゲットに対して類似した高い切断活性を示した(図1F)。まとめると、これらの結果は、hfCas12Maxが高度に柔軟な5’-TN又は5’-TNN PAM認識を有する効率的な編集活性を示したことを証明した。
【0614】
実施例8 TTR遺伝子におけるhfCas12MaxのオンターゲットとオフターゲットdsDNA切断活性の検証と比較
hfCas12Maxのヒト細胞における性能を全面的に評価するために、出願人は、様々なCasヌクレアーゼを対象にTTRのエクソンに多数の標的部位を設計した。別段の指定がない限り、本実施例と後続の実施例でDR-T2(SEQ ID NO:502)を使用した。
【0615】
TTN PAMを有するhfCas12Maxの43部位、TTN PAMを有するABR001(ZHANG Feng教授の操作されたCas12i2由来)の43部位、TTN PAMを有するCas12i2HiFi(LI Wei教授)の43部位、NGG PAMを有するSpCas9の45部位、は、TTTN PAMを有するLbCas12aの12部位、TTTN PAMを有するUltra AsCas12aの12部位及びNNNRRT PAMを有するKKH-saCas9の20部位における編集活性を合計でモニタリングした(表9)。挿入欠失分析により、hfCas12Maxが他のCasヌクレアーゼとCas12Maxよりも70%ほど高い平均オンターゲットdsDNA切断活性を示したことが示された(図1G図9)。
【0616】
【表12-1】
【表12-2】
【表12-3】
【表12-4】
【表12-5】
【表12-6】
【表12-7】
【0617】
hfCas12Maxのヒト細胞における内在性遺伝子に対する特異性をさらに評価するために、出願人は、P2RX5とNLRC4オンターゲット部位及びそのコンピュータによって予測される該当するオフターゲット部位の挿入欠失頻度22を決定した。ターゲッティングディープ配列分析により、Ultra AsCas12a及びLbCas12aと比べて、hfCas12Maxが、より高いオンターゲット編集効率を有し、且つ類似して潜在的なオフターゲット部位においてほとんど挿入欠失活性がないことが示された(図10A-B、図10Aにおいて上側から下側へSEQ ID NO:382-390のプロトスペーサー配列/スペーサー配列、図10Bにおいて上側から下側へSEQ ID NO:391-397のプロトスペーサー配列/スペーサー配列)。
【0618】
hfCas12Maxのオフターゲットを十分に検出し、他のCasタンパク質と比較するために、出願人は、PEM-seq23を用いて、TTR.2ライブラリの挿入欠失と転座イベント生殖系列イベント(未切断又は完全な再結合)と編集イベントを定量化した。まとめると、これらの結果は、hfCas12Maxが高い効率と特異性を有し、且つSpCas9と他のCas12ヌクレアーゼよりも優れていることを証明した。
【0619】
実施例9 デッドxCas12iに基づく塩基エディタの開発と評価
出願人は、ヌクレアーゼが不活性化されたxCas12i(デッドxCas12i、dxCas12i)を生成することによってxCas12iの塩基編集をさらに探求した。これは、まずCas12i1及びCas12i210の比較に基づいてxCas12iの保存的活性部位に単一の突然変異(D650A、D700A、E875A又はD1049A)を導入することによって完了された(図12A-B)。
【0620】
そして、dxCas12i-D1049Aは、XTENリンカー(SEQ ID NO:442)を含有するGSリンカー又はBP NLS(SEQ ID NO:443)を含有するGSリンカーを介してC-末端においてTadA8eV106W(SEQ ID NO:439、TadA8e.1)に融合されてアデニン塩基エディタTadA8e.1-dxCas12iを形成し、且つdxCas12i-D1049Aは、XTENリンカー(SEQ ID NO:442)を含有するGSリンカー又はBP NLS(SEQ ID NO:443)を含有するGSリンカーと一つのUGI(SEQ ID NO:441)を介してC-末端においてヒトAPOBEC3AW104A(SEQ ID NO:440、hA3A.1)に融合されて、シチジン塩基エディタhA3A.1-dxCas12i24-26図1H図1J)を形成した。アデニン塩基エディタについて、それは、N-末端SV40 NLS(SEQ ID NO:444)とC-末端BP NLS(SEQ ID NO:443)とを含有した。シチジン塩基エディタについて、それは、N-末端BP NLS(SEQ ID NO:443)とC-末端BP NLS(SEQ ID NO:443)とを含有した。
【0621】
TadA8eV106W、SEQ ID NO:439
SEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGWRNSKRGAAGSLMNVLNYPGMNHRVEITEGILADECAALLCDFYRMPRQVFNAQKKAQSSIN
hAPOBEC3W104A、SEQ ID NO:440
MEASPASGPRHLMDPHIFTSNFNNGIGRHKTYLCYEVERLDNGTSVKMDQHRGFLHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISYSPCFSAGCAGEVRAFLQENTHVRLRIFAARIFDYDPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQPWDGLDEHSQALSGRLRAILQNQGN
UGI、SEQ ID NO:441
TNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKML
XTENリンカー、SEQ ID NO:442
SGSETPGTSESATPES
bpNLS(BP NLS又はbpSV40 NLSとも呼ばれる)、(doi:10.1038/nature20565.)、SEQ ID NO:443
KRTADGSEFESPKKKRKV
SV40 NLS、アカゲザルβポリオーマウイルス由来(Betapolyomavirus macacae)、SEQ ID NO:444
PKKKRKV
NP NLS(アフリカツメガエル核質タンパク質NLS又は核質タンパク質NLSとも呼ばれる)、(doi:10.1126/science.abj6856.)、二成分NLSでもあり、SEQ ID NO:445
KRPAATKKAGQAKKKK
ヒトU6プロモーター、241bp、SEQ ID NO:446
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggac
ヒトCMVプロモーター、204bp、SEQ ID NO:447
gtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagct
bGH polyAシグナル、208bp、SEQ ID NO:448
ctgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagagaatagcaggcatgctgggga
T5 EXO、SEQ ID NO:449
MSKSWGKFIEEEEAEMASRRNLMIVDGTNLGFRFKHNNSKKPFASSYVSTIQSLAKSYSARTTIVLGDKGKSVFRLEHLPEYKGNRDEKYAQRTEEEKALDEQFFEYLKDAFELCKTTFPTFTIRGVEADDMAAYIVKLIGHLYDHVWLISTDGDWDTLLTDKVSRFSFTTRREYHLRDMYEHHNVDDVEQFISLKAIMGDLGDNIRGVEGIGAKRGYNIIREFGNVLDIIDQLPLPGKQKYIQNLNASEELLFRNLILVDLPTYCVDAIAAVGQDVLDKFTKDILEIAEQ
CAGプロモーター(ヒトCMVエンハンサー + ニワトリβ-アクチンプロモーター)(ハイブリッドイントロン含有)、SEQ ID NO:500
cgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattGtgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtcgaggtgagccccacgttctgcttcactctccccatctcccccccctccccacccccaattttgtatttatttattttttaattattttgtgcagcgatgggggcggggggggggggggggcgcgcgccaggcggggcggggcggggcgaggggcggggcggggcgaggcggagaggtgcggcggcagccaatcagagcggcgcgctccgaaagtttccttttatggcgaggcggcggcggcggcggccctataaaaagcgaagcgcgcggcgggcgggagtcgctgcgacgctgccttcgccccgtgccccgctccgccgccgcctcgcgccgcccgccccggctctgactgaccgcgttactcccacaggtgagcgggcgggacggcccttctcctccgggctgtaattagctgagcaagaggtaagggtttaagggatggttggttggtggggtattaatgtttaattacctggagcacctgcctgaaatcactttttttcag
【0622】
TadA8e.1-dxCas12iとhA3A.1-dxCas12iの初始バージョンは、低塩基編集活性を示し、頻度は、それぞれ約8%のAからGと約2%のCからTである(図1l、図1K)。この問題を解決するために、出願人は、dxCas12iのPIとRecドメインに高い切断活性のための単一と組み合わせ突然変異を導入し、これにより、AからGまでの編集活性が著しく増加した(図13A)。改良された変異体において、TadA8e.1-dxCas12i-v2.2(N243R+E336R)は、KLF4遺伝子座のA9とA11部位において50%の活性を実現し、明らかにTadA8e.1-dLbCas12aの30%の活性よりも高かった(図1l、図13B-C)。PCSK9とTTR内の標的部位において、TadA8e.1-dxCas12i-v2.2は、AからGへの転換の媒介に類似した効率増加を示し、且つPCSK9部位においてTadA8e.1-dLbCas12aよりも高かった(図15)。デアミナーゼ融合の配向が塩基編集効率に影響を与えるかどうかをテストするために、出願人は、TadA8e.1をdxCas12iのN末端又はC末端に融合させることでdxCas12i-ABEを構築し、且つdxCas12iのC末端におけるTadA8e.1がN末端よりわずかに高い活性を示したことを発見した(図14)。そして、出願人は、NLS、リンカーとTadA8e.1タンパク質をさらに操作(TadA8eに回復)して(図13A)v3.1-v3.8とv4.1-v4.4を産生し、ここで、TadA8e-dxCas12i-v4.3は、80%に近いAからGまでの編集効率と>95%の編集純度を示したが、他のdxCas12i-ABEバージョンの編集活性は、変わらなかった(図1H-I、図13D-E)。出願人は、TadA8e-dxCas12i-v4.3をdCas12Max-ABEと命名した。
【0623】
dCas12Max-ABEの塩基編集活性をさらに特徴付けるために、出願人は、TTN PAMを有する21部位、ATN PAMを有する13部位及びCTN PAMを有する13部位に対して実験を行った(表10)。dCas12Max-ABEがTTN PAMを有する部位においてAからGまでの著しい活性を示したことが観察された(図16)。
【0624】
また、hA3A.1-dxCas12i-v1.2(N243R)、hA3A.1-dxCas12i-v2.2(N243R+E336R)とhA3A.1-dxCas12i-v4.3(N243R+E336R-bpNLS)は、RUNX1、DYRK1Aと部位4遺伝子座のC7とC10部位において、持続的に上昇したCからTまでの編集効率及び>95%の編集純度を示し、ひいてはRUNX1とDYRK1AにおけるhA3A.1-dLbCas12aよりも高かった(図1J-K)。
【0625】
これらの結果は、dxCas12iに基づく操作されたエディタは、哺乳動物細胞において高い塩基編集活性を示したことを共同で証明した。
【0626】
【表13-1】
【表13-2】
【0627】
実施例10 T細胞におけるhfCas12MaxのRNP送達の評価
hfCas12Maxの治療潜在力応用を探求するために、出願人は、CD3+T細胞においてTRACを標的とするhfCas12Max RNP19を送達した(図2A)。出願人は、事前にHEK293細胞においてTTRとTRACを標的とするhfCas12Max RNPをテストし、且つRNP投与量を増加させた後、遺伝子編集効率も増加し、細胞活力と増殖が影響を受けないことを発見した(図18A-C)。出願人は、HEK293細胞において3.2μMの投与量でTRACに対して約90%のdsDNA切断活性と>95%の活力を実現した(図18A-C)。三つのガイド配列を設計してTRACを標的とし(表5)、且つTRAC sg.2とsg.3の両方は、CD3+T細胞において1.6μMと3.2μMの投与量で~90%の編集及び~80%の活力を生成した(図2B)。フローサイトメトリー分析により、未処理細胞の96.6%と比べて、sg.2又はsg.3を標的とするRNPによるエレクトロポレーション処理の5日後、CD3+ T細胞におけるTRAC発現が2%~3%のレベルまで低減したことを検出したことが示された(図2C)。本実施例で使用されるガイドRNAは、5’ DR-T1-スペーサー配列-DR-T2-スペーサー配列-3’の配置を呈した。
【0628】
実施例11 インビボhfCas12MaxのLNP送達の評価
hfCas12Max又はその塩基エディタインビボ遺伝子編集の実行可能性を評価するために、出願人は、LNPパッケージングによりガイドRNAとコードhfCas12MaxのmRNAを、尾静脈内注射を介してC57マウスの肝臓に送達した27図2D)。出願人は、遺伝子編集(dsDNA切断)と塩基編集により、マウストランスサイレチン(Ttr)遺伝子(表5におけるTtr_sg12)におけるエクソン3を標的とした(図2E)。N2a細胞において、4種類の濃度下で頑強な編集効率を検出し、且つ1μgの投与量で接近100%に近い編集効率を検出した(図2F)。類似的に、ターゲッティングディープ配列分析により、飽和した0.3と0.5mg/kg(mpk)に相当する投与量下で、マウス肝臓の編集効率が約70%であることを指示した(図2G)。さらに、LNPパッケージングにより送達され、TadA8e-dxCas12i-v4.3(dCas12Max-ABE)は、3mpkの投与量下でマウス肝臓におけるTtr遺伝子座においてA13の約25%のAからG効率を実現した(図2H)。本実施例で使用されるガイドRNAは、5’ DR-T1-スペーサー配列-DR-T2-スペーサー配列-3’の配置を呈した。
【0629】
また、出願人は、hfCas12Max mRNAと、Ttr遺伝子を標的とする二つのgRNA(表5におけるTtr_sg3と12)をマウス受精卵に注射し、それを胚盤胞段階まで培養して遺伝子型分析を行った(図19A)。ターゲッティングディープ配列分析により、ほとんどの受精卵が編集され、且ついくつかが100%に達したことが示された(図19B)。これらの結果は、hfCas12Maxが頑強なエクスビボとインビボ遺伝子編集を媒介することによって、疾患モデリングと療法に用いられる巨大な潜在力を示すことを指示した。
【0630】
トランスサイレチン(TTR)のミスフォールディングと凝集は、トランスサイレチン関連野生型アミロイドーシス(ATTRwt)、トランスサイレチン関連遺伝性アミロイドーシス(ATTRm)、家族性アミロイドポリニューロパチー(FAP)と家族性アミロイド心筋症(FAC)を含むアミロイド疾患に関連した。TTR遺伝子をサイレンシングしてTTRタンパク質の産生を減少させることは、TTRに関連するアミロイド疾患に治療作用を有する可能性がある。本実施例では、マウスにおけるTTR標的部位の高効率切断は、本発明のSiCas12i-crRNAシステムが、TTR関連アミロイド疾患、例えばATTR(例えば、ATTRwt又はATTRm)の治療において非常に有望な見通しを有することを証明した。
【0631】
実施例12:ニッカーゼ活性を有するxCas12i突然変異体のスクリーニング
ニッカーゼ活性(即ち、ssDNA切断活性を有し且つ基本的にdsDNA切断活性を欠く)を有するxCas12i突然変異体をスクリーニングするために、実施例1におけるdsDNA切断活性を有するレポーターシステムと、実施例1におけるdsDNA切断活性を有するレポーターシステムに基づいて確立された、ニッカーゼ活性を有するレポーターシステムとを用いて、表11-14におけるxCas12i突然変異体を設計し、そのニッカーゼ活性とdsDNA切断活性をテストし、ここで、挿入配列を、5’から3’に5’ PAM、プロトスペーサー配列(SEQ ID NO:43)、リンカー、標的配列(SEQ ID NO:44)、5’ PAMが含有される逆相補配列の挿入配列に置き換えた。
【0632】
xCas12i突然変異体がニッカーゼ活性のみを有する時、dsDNA切断活性を有するレポーターシステムの場合に、それは、緑色蛍光を生成しかなったが、ニッカーゼ活性を有するレポーターシステムの場合に、緑色蛍光を生成することができた。xCas12i突然変異体がdsDNA切断活性を有する時、それは、ニッカーゼ活性とdsDNA切断活性を有するレポーターシステムの場合にいずれも緑色蛍光を生成することができた。そのため、ニッカーゼ活性を有するレポーターシステムは、dsDNA切断活性とニッカーゼ活性との合計を指示した。ニッカーゼ活性を、ニッカーゼ活性を有するレポーターシステムからの緑色蛍光から、dsDNA切断活性を有するレポーターシステムからの緑色蛍光を差し引いたものとして計算した。ニッカーゼ百分率をニッカーゼ活性/dsDNA切断活性として計算した。
【0633】
xCas12i-W896R、xCas12i-S924RとxCas12i-S925RがWT xCas12iに対して著しいニッカーゼ活性を示すことが観察された。
【0634】
【表14】
【0635】
xCas12iのW896、S924又はS925において、表12-14における突然変異体を生成するためにさらなる誘発を行った。8種類のxCas12i突然変異体W896R、W896P、W896K、S924F、S924D、S924E、S924HとS925Tが、より著しくいニッカーゼの好み(ニッカーゼ活性/dsDNA切断活性>1.0)とより高いニッカーゼ活性(20%より高い)を実現したことが観察された。
【0636】
【表15】
【0637】
【表16】
【0638】
【表17】
【0639】
本開示の範囲と精神から逸脱することなく、本開示の前記生成物、方法と用途の様々な修正と変化は、当業者にとって明らかである。特定の実施の形態と結び付けて本開示を記述したが、理解すべきこととして、さらなる修正が可能であり、且つ請求項に係る本開示は、そのような特定の実施の形態に不当に限定されるべきではない。実は、当業者にとって明らかな、本開示に記述される方式を実行するための様々な修正は、本開示の範囲内に含まれることが意図されている。本出願は、一般的に本開示の原理に従う本開示の任意の変化、用途又は改作をカバーすることを意図しており、且つ、それが、本開示が属する分野の既知の慣習的な操作内にあり、且つ以前に示された基本的な特徴に適用可能であるという本開示の内容から逸脱するような内容を含む。
【0640】
参考文献
1. Anzalone,A.V.,Koblan,L.W. & Liu,D.R. Genome editing with CRISPR-Cas nucleases,base editors,transposases and prime editors. Nat Biotechnol 38,824-844(2020).
2. Doudna,J.A. The promise and challenge of therapeutic genome editing. Nature 578,229-236(2020).
3. Makarova,K.S. et al. Evolutionary classification of CRISPR-Cas systems:a burst of class 2 and derived variants. Nat Rev Microbiol 18,67-83(2020).
4. Yan,W.X. et al. Functionally diverse type V CRISPR-Cas systems. Science 363,88-91(2019).
5. Kleinstiver,B.P. et al. Genome-wide specificities of CRISPR-Cas Cpf1 nucleases in human cells. Nat Biotechnol 34,869-+(2016).
6. Cong,L. et al. Multiplex Genome Engineering Using CRISPR/Cas Systems. Science 339,819-823(2013).
7. Zetsche,B. et al. Cpf1 is a single RNA-guided endonuclease of a class 2 CRISPR-Cas system. Cell 163,759-771(2015).
8. Zhang,B. et al. Mechanistic insights into the R-loop formation and cleavage in CRISPR-Cas12i1. Nat Commun 12,3476(2021).
9. Zhang,H.,Li,Z.,Xiao,R. & Chang,L. Mechanisms for target recognition and cleavage by the Cas12i RNA-guided endonuclease. Nat Struct Mol Biol 27,1069-1076(2020).
10. Huang,X. et al. Structural basis for two metal-ion catalysis of DNA cleavage by Cas12i2. Nat Commun 11,5241(2020).
11. Yang,Y. et al. Highly Efficient and Rapid Detection of the Cleavage Activity of Cas9/gRNA via a Fluorescent Reporter. Appl Biochem Biotechnol 180,655-667(2016).
12. Gillmore,J.D. et al. CRISPR-Cas9 In Vivo Gene Editing for Transthyretin Amyloidosis. N Engl J Med 385,493-502(2021).
13. Musunuru,K. et al. In vivo CRISPR base editing of PCSK9 durably lowers cholesterol in primates. Nature 593,429-434(2021).
14. Strecker,J. et al. Engineering of CRISPR-Cas12b for human genome editing. Nat Commun 10,212(2019).
15. Kleinstiver,B.P. et al. Engineered CRISPR-Cas12a variants with increased activities and improved targeting ranges for gene,epigenetic and base editing. Nat Biotechnol 37,276-282(2019).
16. Xu,X. et al. Engineered miniature CRISPR-Cas system for mammalian genome regulation and editing. Mol Cell 81,4333-4345 e4334(2021).
17. Bae,S.,Park,J. & Kim,J.S. Cas-OFFinder:a fast and versatile algorithm that searches for potential off-target sites of Cas9 RNA-guided endonucleases. Bioinformatics 30,1473-1475(2014).
18. Yuen,C.T.L. et al. High-fidelity KKH variant of Staphylococcus aureus Cas9 nucleases with improved base mismatch discrimination. Nucleic Acids Res 50,1650-1660(2022).
19. Zhang,L. et al. AsCas12a ultra nuclease facilitates the rapid generation of therapeutic cell medicines. Nat Commun 12,3908(2021).
20. McGaw,C. et al. Engineered Cas12i2 is a versatile high-efficiency platform for therapeutic genome editing. Nat Commun 13,2833(2022).
21. Chen,Y. et al. Synergistic engineering of CRISPR-Cas nucleases enables robust mammalian genome editing. Innovation(Camb)3,100264(2022).
22. Kim,D.Y. et al. Efficient CRISPR editing with a hypercompact Cas12f1 and engineered guide RNAs delivered by adeno-associated virus. Nat Biotechnol 40,94-102(2022).
23. Yin,J. et al. Optimizing genome editing strategy by primer-extension-mediated sequencing. Cell Discov 5,18(2019).
24. Wang,X. et al. Cas12a Base Editors Induce Efficient and Specific Editing with Low DNA Damage Response. Cell Rep 31,107723(2020).
25. Richter,M.F. et al. Phage-assisted evolution of an adenine base editor with improved Cas domain compatibility and activity. Nat Biotechnol 38,883-891(2020).
26. Li,X. et al. Base editing with a Cpf1-cytidine deaminase fusion. Nat Biotechnol 36,324-327(2018).
27. Finn,J.D. et al. A Single Administration of CRISPR/Cas9 Lipid Nanoparticles Achieves Robust and Persistent In Vivo Genome Editing. Cell Rep 22,2227-2235(2018).
28. Bravo,J.P.K. et al. Structural basis for mismatch surveillance by CRISPR-Cas9. Nature 603,343-347(2022).
29. Kleinstiver,B.P. et al. High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects. Nature 529,490-495(2016).
30. Wang,D.,Zhang,F. & Gao,G. CRISPR-Based Therapeutic Genome Editing:Strategies and In Vivo Delivery by AAV Vectors. Cell 181,136-150(2020).
31. Wang,H. et al. CRISPR-Mediated Programmable 3D Genome Positioning and Nuclear Organization. Cell 175,1405-1417 e1414(2018).
32. Konermann,S. et al. Genome-scale transcriptional activation by an engineered CRISPR-Cas9 complex. Nature 517,583-588(2015).
33. Nakamura,M.,Gao,Y.,Dominguez,A.A. & Qi,L.S. CRISPR technologies for precise epigenome editing. Nat Cell Biol 23,11-22(2021).
34. Fellmann,C.,Gowen,B.G.,Lin,P.C.,Doudna,J.A. & Corn,J.E. Cornerstones of CRISPR-Cas in drug discovery and therapy. Nat Rev Drug Discov 16,89-100(2017).
例示的な配列
SEQ ID NO:1 >SiCas12iタンパク質
MSSDVVRPYNTKLLPDNRKHNMFLQTFKRLNSISLNHFDLLICLYAAITNKKAEEYKSEKEAHVTADSLCAINWFRPMSKRYSKYATTTFNMLELFKEYSGHEPDAYSKNYLMSNIDSDRFVWVDCRKFAKDFAYQMELGFHEFTVLAETLLANSILVLNESTKANWAWGTVSALYGGGDKEDSTLKSKILLAFVDALNNHELKTKREILNQVCESLKYQSYQDMYVDFRSVVDENGNKKSPNGSMPIVTKFETDDLISDNQRKAMISNFTKNAAAKAAKKPIPYLDRLKEHMVSLCDEYNVYAWAAAITNSNADVTARNTRNLTFIGEQNSRRKELSVLQTTTNEKAKDILNKINDNLIQEVRYTPAPKHLGRDLANLFDTLKEKDINNIENEEEKQNVINDCIEQYVDDCRSLNRNPIAALLKHISRYYEDFSAKNFLDGAKLNVLTEVVNRQKAHPTIWSEKAYTWISKFDKNRRQANSSLVGWVVPPEEVHKEKIAGQQSMMWVTLTLLDDGKWVKHHIPFSDSRYYSEVYAYNPNLPYLDGGIPRQSKFGNKPTTNLTAESQALLANSKYKKANKSFLRAKENATHNVRVSPNTSLCIRLLKDSAGNQMFDKIGNVLFGMQINHKITVGKPNYKIEVGDRFLGFDQNQSENHTYAVLQRVSESSHDTHHFNGWDVKVLEKGKVTSDVIVRDEVYDQLSYEGVPYDSSKFAEWRDKRRRFVLENLSIQLEEGKTFLTEFDKLNKDSLYRWNMNYLKLLRKAIRAGGKEFAKIAKTEIFELAVERFGPINLGSLSQISLKMIASFKGVVQSYFSVSGCVDDASKKAHDSMLFTFMCAAEEKRTNKREEKTNRAASFILQKAYLHGCKMIVCEDDLPVADGKTGKAQNADRMDWCARALAKKVNDGCVAMSICYRAIPAYMSSHQDPFVHMQDKKTSVLRPRFMEVNKDSIRDYHVAGLRRMLNSKSDAGTSVYYRQAALHFCEALGVSPELVKNKKTHAAELGKHMGSAMLMPWRGGRVYIASKKLTSDAKSVKYCGEDMWQYHADEIAAVNIAMYEVCCQTGAFGKKQKKSDELPG
SEQ ID NO:2 >Si2Cas12iタンパク質
MSSDVVRPYNTKLLPDNRKYNMFLQTFKRLNLISSNHFDLLVCLYAAITNKKAEEYKSEKEDHVTADSLCAINWFRPMSKRYIKYATTTFKMLELFKEYSGHEPDTYSKNYLMSNIVSDRFVWVDCRKFAKDFANQMELSFHEFTTLSETLLANSILVLNESTKANWAWGAVSALYGGGDKEDSTLKSKILLAFVDALNNPELKTRREILNHVCESLKYQSYQDMYVDFRSVVDDKGNKKSPNGSMPIVTKFESDDLIGDNQRKTMISSFTKNAAAKASKKPIPYLDILKDHMISLCEEYNVYAWAAAITNSNADVTARNTRNLTFIGEQNTRRKELSVLQTSTNEKAKDILNKINDNLIPEVRYTPAPKHLGRDLANLFEMFKEKDINQIGNEEEKQNVINDCIEQYVDDCRSLNRNPVAALLKHISGYYEDFSAKNFLDGAKLNVLTEVVNRQKAHPTICSEKAYTWISKIDKNRRQANSSLVGWVVPPEEVHKEKIAGQQSMMWVTLTLLDDGKWVKHHIPFADSRYYSEVYAYNPNLPYLEGGIPRQSKFGNKPTTNLTAESQALLANSKHKKANKTFLRAKENITHNVRVSPNTSLCIRPLKDSAGNQMFDNIGNMLFGMQINHRITVGKPNYKIEVGDRFLGFDQNQSENHTYAVLQRVSESSHGTHHFNGWDVKVIEKGKVTSDVVVRDEVYDQLSYEGVPYDSPKFTEWREKRRKFVLENMSIQIEEGKTFLTEFDKLNKDSLYRWNMNYMKLLRKAIRAGGKEFAKITKAEIFELGVMRFGPMNLGSLSQVSLKMIAAFKGVIQSYFSVSGCIDDASKKAHDSMLFAFLCSADEKRTNKREEKTNRAASFILQKAYSHGCKMIVCEDDLPIADGKVGKAQNADRMDWCARSLAKKVNDGCVAMSICYRAIPAYMSSHQDPFTHMQDKKTSVLRPRFMEVGKDSIRDHHVAGLRRMLNSKGNTGTSVYYREAALRFCEALGVLPELVKNKKTHASELGKHMGSAMLMPWRGGRIYVASKKLTSDAKSIKYCGEDMWQYHADEIAAINIAMYEV
SEQ ID NO:3 >WiCas12iタンパク質
MGISISRPYGTKLRPDARKKEMLDKFFTTLAKGQRVFADLGLCIYGSLTLEMVKRLEPESDSELVCAIGWFRLVDKVTWSENEIKQENLVRQYETYSGKEASEVIKTYLSSPSSDKYVWIDCRQKFLRFQRDLGTRNLSEDFECMLFEQYLRLTKGELDGHTAMSNMFGTKTKEDRATKLRYAARMKEWLEANEEITWEQYHQALQDKLDANTLEEAVDNYKGKAGGSNPFFSYTLLNRGQIDKKTHEQQLKKFNKVLKTKSKNLNFPNKEKLKQYLETAIGIPVDAQVYGQMFNNGVSEVQPKTTRNMSFSMEKLELLNELKSLNKTDGFERANEVLNGFFDSELHTTEDKFNITSRYLGGDRNNRLPKLYELWKKEGVDREEGIQQFSQAIQDKMGQIPVKNVLRYIWEFRETVSAEDFEAAAKANQLEEKITRTKAHPVVISNRYWTFGSSALVGNIMPADKMHKDQYAGQSFKMWLEAELHYDGKKVKHHLPFYNARFFEEVYCYHPSVAEVTPFKTKQFGYAIGKDIPADVSVVLKDNPYKKATKRFLRAISNPVANTVDVNKPTVCSFMIKRENDEYKLVINRKIGVDRPKRIKVGRKVMGYDRNQTASDTYWIGELVPHGTTGAYRIGEWSVQYIKSGPVLSSTQGVNDSTTDQLIYNGMPSSSERFKAWKKSRMSFIRKLIRQLNAEGLESKGQDYVPENPSSFDVRGETLYVFNSNYMKALVSKHRKAKKPVEGILEEIEALTSKAKDSCSLMRLSSLSDAAMQGIASLKSLINSYFNKNGCKTIEDKEKFNPDLYVKLVEVEQKRTNKRKEKVGRIAGSLEQLALLNGVDVVIGEADLGEVKKGKSKKQNSRNMDWCAKQVAERLEYKLTFHCIGYFGVNPMYTSHQDPFEHRRVADHLVMRARFEEVNVSNVSEWHMRNFSNYLRADSGTGLYYKQATLDFLKHYDLEEHADDLEKQNIKFYDFRKILEDKQLTSVIVPKRGGRIYMATNPVTSDSTPVTYAGKTYNRCNADEVAAANIAISVLAPHSKKEEKEDKIPIISKKPKSKNTPKARKNLKTSQLPQK
SEQ ID NO:4 >Wi2Cas12iタンパク質
MASKHVVRPFNGKVTATGKRLAYLEETFHYLEKAAGGVSTLFAALGSYLDATTISNLINKNQDLAVVIFRYHVVPKGEAHTLPVGTDMVSRFVADYGMEPNEFQRAYLDSPIDQEKYCWQDNRDVGCWLGEQLGVSEADMRAIAVTFYNNQMLYDCVKGTGSGNAVSLLFGSGKKSDYSMKGVIAGKAASVLAKYRPATYQDARKMILEANGFTSVKDLVTSYGITGRSSALQIFMEGIESGPISSKTLDARIKKFTEDSERNGRKNLVPHAGAIRNWLIEQAGSSVENYQMAWCEVYGNVSADWNAKVESNFNFVAEKVKALTELSNIQKSTPDLGKALKLFEEYLTTCQDEFAIAPYHFSVMEEVRMEMATGREFNDAYDDALNSLDMESKQPIQPLCKFLIERGGSISFDTFKSAAKYLKTQSKIAGRYPHPFVKGNQGFTFGSKNIWAAINDPMMEYADGRIAGGSAMMWVTATLLDGKKWVRHHIPFANTRYFEEVYASKKGLPVLPCARDGKHSFKLGNNLSVERVEKVKEGGRTKATKAQERILSNLTHNVQFDSSTTFIIRRQEESFVICVNHRHPAPLMKKEMEVGDKIIGIDQNVTAPTTYAIVERVASGGIERNGKQYKVTAMGAISSVQKTRGGEVDVLSYMGVELSDSKNGFQSLWNKCLDFVTKHGTENDVKYYNNTAVWANKLYVWHKMYFRLLKQLMRRAKDLKPFRDHLQHLLFHPNLSPLQRHSLSLTSLEATKIVRNCIHSYFSLLGLKTLDERKAADINLLEVLEKLYAGLVERRKERTKLTAGLLVRLCNEHGISFAAIEGDLPVVGEGKSKAANNTQQDWTARELEKRLSEMAEVVGIKVIAVLPHYTSHQDPFVYSKNTKKMRCRWNWRTTKTFTDRDALSIRRILSKPETGTNLYYQKGLKAFAEKHGLDLAEMKKRKDAQWYLERIQDKNFLVPMNGGRVYLSSVKLAGKETIDMGGEILYLNDADQVAALNVLLVKI
SEQ ID NO:5 >Wi3Cas12iタンパク質
MAKKEHIIRPFKGTLPLRGDRLRYLQDTMKYMKKVEDTITELCAAVIAYAKPTIIQQILGEEIETTSTFCSFRLVGIHENFTMPLTTNMIKHFQKTFNINPSEKQAIYLSSGFDSDKYRWQDTSEVSRNFANKCRLTNQEFQEFAEQALLNMCFIGCSGSPGATNAVSQIFGTGEKSDYQRKSQIAKIAADTLENHKPSTYESARLMVLNTLGHKTIEDCVNDYGAIGAKSAFRLFMESKEIGPITSEQLTTKIKKFREDHKKNSIKKQLPHVEKVRNALLSQFKEQYLPSAWAEAWCNIMGEFNSKLSNNNNFIDQKTKMVNDCDNIKKSNPQLDKAVNMLDEWKYKNWDDNSAIHPYHIGDLKKLMAIFNINNEGTFDERFSASWEQFSTSLEYGEKPPVRDLLAHIIKNMNDLTYTDVINAAKFLKLQDNIRNKYPHPFVMPNKGCTFGKDNLWGEINDPTAKIKSTEEVAGQRPMMWLTAKLLDNGKWVEHHIPFASSRYFAEVYYTNPALPTLPIARDGKHSYKLTKTIDANTAKTLVNNPRDKAAKLIARTKANTTHNVKWIKPTYRIQKENNQFVITINHRHPCITPPKEIILGDRILSFDQNETAPTAFSILEKTTKGTEFCGHHIKVLKTGMLEAKIKTSKKSIDAFTYMGPMEDDHASGFPTLLNICEKFISENGDEKDKSFSSRKLPFKRSLYFFHGSHFDLLKKMIRKAKNDPKKLKLVRIHINEILFNSNLSPIKLHSLSIHSMENTKKVIAAISCYMNVHEWKTIDEQKNADITLYNAKEKLYNNLVNRRKERVKVTAGMLIRLARENNCRFMVGEAELPTQQQGKSKKNNNSKQDWCARDIAQRCEDMCEVVGIKWNGVTPHNTSHQNPFIYKNTSGQQMRCRYSLVKKSEMTDKMAEKIRNILHAEPVGTTAYYREGILEFAKHHGLDLGMMKKRRDAKYYDNLPDEFLLPTRGGRIYLSENQLGGNETIVINGKKYFVNQADQVAAVNIGLLYLLPKKNQS
SEQ ID NO:6 >SaCas12iタンパク質
MSEKKFHIRPYRCSISPNARKADMLKATISYLDSLTSVFRSGFTALLAGIDPSTVSRLAPSGAVGSPDLWSAVNWFRIVPLAEAGDARVGQASLKNLFRGYAGHEPDEEASIYMESRVDDKRHAWVDCRAMFRAMALECGLEEAQLASDVFALASREVIVFKDGEINGWGIASLLFGEGEKADSQKKVALLRSVRLALEGDYATYEELSGLMLAKTGASSGSDLLDEYKRSEKGGSSGGRHPFFDEVFRRGGRVKQEERERLLKSCDTAIQKQGQALPLSHVASWRQWFLRRVTLLRNRRQESFAVCITNALMDLQPKNLRNVHYVTNPKSEKDKGVLELRVDVKNNEGPDVAGAQAVFDAYMARLAPDLRFSVMPRHLGSLKDLYALWAKLGRDEAIEEYLEGYEGPFSKRPIAGILQIIHAHRGKVGHDSLLRAARLNRAMDRLERKRAHACAAGNKGYVYGKSSMVGRINPQSLEVGGRKSGRSPMMWVTLDLVDGDRFAQHHLPFQSARFFSEVYCHGDGLPATRVPGMVRNRRNGLAIGNGLGEGGLSALRAGSDRRKRANKRTLRALENITHNVEIDPSTSFTLREDGIIISHRIEKIEPKLVAFGDRALGFDLNQTGAHTFAVLQKVDSGGLDVGHSRVSIVLTGTVRSICKGNQASGGRDYDLLSYDGPERDDGAFTAWRSDRQAFLMSAIRELPTPAEGEKDYKADLLSQMASLDHYRRLYAYNRKCLGIYIGALRRATRRQAVAAFKDEILSIANHRCGPLMRGSLSVNGMESLANLKGLATAYLSKFKDSKSEDLLSKDEEMADLYRACARRMTGKRKERYRRAASEIVRLANEHGCLFVFGEKELPTTSKGNKSKQNQRNTDWSARAIVKAVKEACEGCGLGFKPVWKEYSSLTDPFERDGDGRPALRCRFAKVAAPDSELPPRLTKAVGSYVKNALKADKAEKKQTCYQRGAIEFCSRHGIDVRKATDKAIRKAVRGSSDLLVPFDGGRTFLLSTRLSPESRKVEWAGRTLYEFPSDMVAAINIACRGLEPRKA
SEQ ID NO:7 >Sa2Cas12iタンパク質
MDEQAVVSSGSDKTLKIVRPYRAKVTATGIRLEGIKNTLNYLKRTEICLSRLNAACGAFLTPAIVEQICKDDPALVCAIARFQLVPVGSEATLSDSGLMRHFKAALGELTPLQEAYLNSSYNDELYAWQDTLVLARQIIAETGLTEDQFRAFAHACFKNGNIIGCAGGPGASNAISGIFGEGIKSDYSLRSEMTAAVAKVFEEKRPITYEEARALALEATGHASVQSFVEAFGKQGRKGTLILFMEDTKTGAFPSNEFDYKLKKLKEDAERVGRKGIIPHRDVIASYLRNQTGADIEYNSKAWCESYCCAVSEYNSKMSNNVRFATEKSLDLTKLDETIRETPKISEAMLVFENYMARIDADLRFIVSKHHLGNLAKFRQTMMHVSASEFEEAFKAMWADYLAGLEYGEKPAICELVRYVLTHGNDLPVEAFYAACKFLSLDDKIKNRYPHPFVPGNKGYTFGAKNLWAEINDPFKPIRQGNPEVAGQRPMMWATADLLDNNKWVLHHIPFASSRYFEEVYYTDPSLPTAQKARDGKHGYRLGKVLDEAARERLKANNRQRKAAKAIERIKANCEHNVAWDPTTTFMLQLDSEGNVKMTINHRHIAYRAPKEIGVGDRVIGIDQNETAPTTYAILERTENPRDLEYNGKYYRVVKMGSVTSPNVSKYRTVDALTYDGVSLSDDASGAVNFVVLCREFFAAHGDDEGRKYLERTLGWSSSLYSFHGNYFKCLTQMMRRSARSGGDLTVYRAHLQQILFQHNLSPLRMHSLSLRSMESTMKVISCMKSYMSLCGWKTDADRIANDRSLFEAARKLYTSLVNRRTERVRVTAGILMRLCLEHNVRFIHMEDELPVAETGKSKKSNGAKMHWCARELAVRLSQMAEVTSVKFTGVSPHYTSHQDPFVHSKTSKVMRARWSWRNRADFTDKDAERIRTILGGDDAGTKAYYRSALAEFASRYGLDMEQMRKRRDAQWYQERLPETFIIPQRGGRVYLSSHDLGSGQKVDGIYGGRAFVNHADEVAALNVALVRL
SEQ ID NO:8 >Sa3Cas12iタンパク質
MKTETLIRPYPGKLNLQPRRAQFLEDSIQYHQKMTEFFYQFLQAVGGATTHQNISDFIDNKATDEHQATLLFQVVSKDSTTPECPAEELLARFAQYTGKQPNEAVTHYLTSRINTDKYRWQDNRLLAQNIASQLNISETQFQEIAHAILSNNLYIGQTASNAAANFISQVTGTGQKAPKAARLDVLFQTNQALAKTQPTTFGQLQQIIVQACGESTTDAVLAKFGNKGAATSLQLALKTDPNTTLDQKKYEALQKKFAEDETKYRNKVDIPHKTQLRNLILNTSNQFCNWHTKPAIEAFKCAIADIQSKVSNNLRIMQEKAKLYEAFRNVDPQVQIAVQALENHMNTLEEPYAPYAHSFGSVKDFYEDLNNGSNLDEAIQTIVHDSDNFNRKPDPNWLRIIAPLHSSHSASQIMEAVKYLSSKQDYELRKPFPFVATNLPATYGKFNIPGTLNPPTDSLHGRLNGSHSNMWLTALLLDGRDWKNHHLCFASSRYFEEVYFTNPSLPTTDKVRSPKCGFTLKSVLDSEAKDRIRNAPKSRTKAVKAIERIKANSTHNVAWNPETSFQMQKRNDEFYITINHRIEMEKIPGQKKTDDGFTIHPKGLFAILKEGDRILSQDLNQTAATHCAVYEVAKPDQNTFNHHGIHLKLIATEELKMPLKTKKSTIPDALSYQGIHAHDRENGLQQLKDACGAFISPRLDPKQKATWDNSVSKKENLYPFITAYMKLLKKVMKAGRQELKLFRTHLDHILFKHNLSPLKLHGVSMIGLESSRATKSVINSFFNLQNAKTEQQQIALDRPLFEAGKTLINNQTRRRQERVRLETSLTMRLAHKYNAKAIIIEGELPHSSTGTSQYQNNVRLDWSAKKSAKLKTESANCAGIAICQIDPCHTSHQNPFRHTPTNPDLRPRFAQVKKGKMFQYQLNGLQRLLNPRSKSSTAIYYRQAVQSFCAHHNLTERDITSAKFPSDLEKKIKDDTYLIPQRGGRIYISSFPVTSCARPCTSNHYFGGGQFECNADAVAAVNIMLKVHP
SEQ ID NO:9 >WaCas12iタンパク質
MPIRGYKCTVVPNVRKKKLLEKTYSYLQEGSDVFFDLFLSLYGGIAPKMIPQDLGINEQVICAANWFKIVEKTKDCIADDALLNQFAQYYGEKPNEKVVQFLTASYNKDKYVWVDCRQKFYTLQKDLGVQNLENDLECLIREDLLPVGSDKEVNGWHSISKLFGCGEKEDRTIKAKILNGLWERIEKEDILTEEDARNELLHSAGVLTPKEFRKVYKGAAGGRDCYHTLLVDGRNFTFNLKTLIKQTKDKLKEKSVDVEIPNKEALRLYLEKRIGRSFEQKPWSEMYKTALSAVMPKNTLNYCFAIDRHAQYTKIQTLKQPYDSAITALNGFFESECFTGSDVFVISPSHLGKTLKKLYNYKDVESGISEIVEDEDNSLRSGVNVNLLRYIFTLKDMFSAEDFIKAAEYNVVFERYNRQKVHPTVKGNQSFTFGNSALSGKVIPPSKCLSNLPGQMWLAINLLDQGEWKEHHIPFHSARFYEEIYATSDNQNNPVDLRTKRFGCSLNKTFSAADIEKVKESAKKKHGKAAKRILRAKNTNTAVNWVDCGFMLEKTEVNFKITVNYKLPDQKLGKFEPIVGTKILAYDQNQTAPDAYAILEICDDSEAFDYKGYKIKCLSTGDLASKSLTKQTEVDQLAYKGVDKTSNFYKKWKQQRRLFVKSLNIPDALKSFENINKEYLYGFNNSYLKLLKQILRGKFGPILVDIRPELIEMCQGIGSIMRLSSLNHDSLDAIQSLKSLLHSYFDLKVKEEIKTEELREKADKEVFKLLQQVIQKQKNKRKEKVNRTVDAILTLAADEQVQVIVGEGDLCVSTKGTKKRQNNRTIDWCARAVVEKLEKACKLHGLHFKEIPPHYTSHQDCFEHNKDIENPKEVMKCRFNSSENVAPWMIKKFANYLKCETKYYVQGMQDFLEHYGLVEYKDHIKKGKISIGDFQKLIKLALEKVGEKEIVFPCKGGRIYLSTYCLTNESKPIVFNGRRCYVNNADHVAAINVGICLLNFNARAKVAEKTP
SEQ ID NO:10 >Wa2Cas12iタンパク質
MAKKDFIARPYNSFLLPNDRKLAYLEETWTAYKSIKTVLHRFLIAAYGAIPFQTFAKTIENTQEDELQLAYAVRMFRLVPKDFSKNENNIPPDMLISKLASYTNINQSPTNVLSYVNSNYDPEKYKWIDSRNEAISLSKEIGIKLDELADYATTMLWEDWLPLNKDTVNGWGTTSGLFGAGKKEDRTQKVQMLNALLLGLKNNPPKDYKQYSTILLKAFDAKSWEEAVKIYKGECSGRTSSYLTEKHGDISPETLEKLIQSIQRDIADKQHPINLPKREEIKAYLEKQSGTPYNLNLWSQALHNAMSSIKKTDTRNFNSTLEKYEKEIQLKECLQDGDDVELLGNKFFSSPYHKTNDVFVICSEHIGTNRKYNVVEQMYQLASEHADFETVFTLLKDEYEEKGIKTPIKNILEYIWNNKNVPVGTWGRIAKYNQLKDRLAGIKANPTVECNRGMTFGNSAMVGEVMRSNRISTSTKNKGQILAQMHNDRPVGSNNMIWLEMTLLNNGKWQKHHIPTHNNKFFEEVHAFNPELKQSVNVRNRMYRSQNYSQLPTSLTDGLQGNPKAKIFKRQYRALNNMTANVIDPKLSFIVNKKDGRFEISIIHNVEVIRARRDVLVGDYLVGMDQNQTASNTYAVMQVVQPNTPDSHEFRNQWVKFIESGKIESSTLNSRGEYIDQLSHDGVDLQEIKDSEWIPAAEKFLNKLGAINKDGTPISISNTSKRAYTFNSIYFKILLNYLRANDVDLNLVREEILRIANGRFSPMRLGSLSWTTLKMLGNFRNLIHSYFDHCGFKEMPERESKDKTMYDLLMHTITKLTNKRAERTSRIAGSLMNVAHKYKIGTSVVHVVVEGSLSKTDKSSSKGNNRNTTDWCSRAVVKKLEDMCVFYGFNLKAVSAHYTSHQDPLVHRADYDDPKLALRCRYSSYSRADFEKWGEKSFAAVIRWATDKKSNTCYKVGAVEFFKNYKIPEDKITKKLTIKEFLEIMCAESHYPNEYDDILIPRRGGRIYLTTKKLLSDSTHQRESVHSHTAVVKMNGKEYYSSDADEVAAINICLHDWVVPLNWTNHCLPAGWCSDHLKECVQCHTPDPVRISM
SEQ ID NO:11 >SiCas12iダイレクトリピート配列
CTAGCAATGACTCAGAAATGTGTCCCCAGTTGACAC
SEQ ID NO:12 >Si2Cas12iダイレクトリピート配列
ATCGCAACATCTTAGAAATCCGTCCTTAGTTGACGG

EQ ID NO:13 >WiCas12iダイレクトリピート配列
TCTCAACGATAGTCAGACATGTGTCCCCAGTGACAC
SEQ ID NO:14 >Wi2Cas12iダイレクトリピート配列
CTCAAAGTGTCAAAAGAATGTCCCTGCTAATGGGAC
SEQ ID NO:15 >Wi3Cas12iダイレクトリピート配列
TCCCAAAGTGGCAAAAGAATCTCCCTGTTAATGGGAG
SEQ ID NO:16 >SaCas12iダイレクトリピート配列
GTCTAACTGCCATAGAATCGTGCCTGCAATTGGCAC
SEQ ID NO:17 >Sa2Cas12iダイレクトリピート配列
TCGGGGCACCAAAATAATCTCCTTGGTAATGGGAG
SEQ ID NO:18 >Sa3Cas12iダイレクトリピート配列
CCACAACAACCAAAAGAATGTCCCTGAAAGTGGGAC
SEQ ID NO:19 >WaCas12iダイレクトリピート配列
GTAACAGTGGCTAAGTAATGTGTCTTCCAATGACAC
SEQ ID NO:20 >Wa2Cas12iダイレクトリピート配列
GAGAGAATGTGTGCAAAGTCACAC
SEQ ID NO:21 >SiCas12iコード配列
ATGTCTAGTGATGTCGTTCGTCCATATAACACCAAACTGCTTCCAGATAATCGCAAACACAATATGTTTTTGCAAACTTTCAAGCGACTTAATTCTATTTCTCTTAATCATTTTGATCTCTTAATTTGTCTTTATGCTGCCATTACCAACAAGAAGGCAGAAGAATATAAGTCTGAAAAAGAAGCTCATGTAACCGCTGATAGCCTTTGTGCTATCAATTGGTTCCGTCCTATGTCCAAGCGTTACAGCAAATACGCAACTACAACTTTCAATATGCTTGAATTGTTCAAAGAATACTCTGGGCATGAACCAGATGCTTATTCCAAGAATTATCTTATGTCCAATATTGACTCAGACAGGTTTGTCTGGGTTGATTGCCGTAAATTTGCCAAAGATTTTGCGTATCAAATGGAACTTGGTTTCCATGAATTTACAGTCTTGGCAGAAACCTTGTTGGCAAATAGTATTCTTGTACTCAACGAATCAACTAAGGCAAATTGGGCATGGGGCACCGTTTCTGCACTTTACGGTGGAGGCGATAAGGAAGATTCTACGCTGAAGTCGAAAATCCTTTTGGCTTTTGTTGATGCACTCAATAACCACGAACTTAAAACTAAGCGTGAAATTCTCAATCAAGTTTGTGAATCACTAAAATATCAATCATACCAAGACATGTATGTTGATTTCCGTTCTGTTGTTGACGAAAATGGAAACAAGAAGTCTCCCAATGGCTCAATGCCAATCGTCACCAAGTTTGAAACAGATGATTTGATTTCTGATAATCAACGCAAAGCAATGATTTCTAATTTCACAAAGAATGCTGCTGCTAAAGCGGCTAAAAAACCTATTCCCTACCTAGACAGACTCAAGGAACATATGGTTTCCTTGTGCGATGAATATAATGTTTATGCTTGGGCAGCAGCTATCACTAACTCTAATGCCGATGTAACAGCTAGGAATACTCGCAATTTAACATTCATCGGGGAACAAAATTCTCGAAGGAAAGAACTATCGGTTTTACAAACTACAACAAACGAAAAAGCAAAAGATATCTTGAATAAGATTAATGACAATCTTATTCAAGAAGTAAGGTATACCCCTGCCCCCAAGCACTTGGGGCGTGATCTTGCCAATCTTTTTGATACTCTGAAAGAAAAAGATATCAATAATATTGAAAACGAAGAAGAGAAGCAGAATGTAATTAATGATTGCATTGAGCAATATGTTGATGATTGCCGTTCACTGAACCGCAATCCCATTGCTGCTTTGCTCAAGCACATTAGCCGATACTATGAAGATTTTTCAGCCAAGAATTTCTTGGATGGTGCCAAGTTGAATGTCTTGACTGAAGTTGTAAATCGTCAAAAGGCACATCCAACTATTTGGTCTGAAAAGGCTTATACTTGGATTTCCAAGTTTGACAAGAATAGGCGACAAGCAAACTCTTCTTTGGTTGGATGGGTTGTTCCACCAGAAGAAGTCCATAAAGAGAAGATTGCTGGTCAACAAAGCATGATGTGGGTCACTTTGACTCTGCTTGATGATGGCAAGTGGGTAAAGCACCATATTCCTTTTTCAGATTCCAGATATTATTCTGAAGTCTATGCCTACAATCCAAATTTGCCATATCTTGATGGTGGTATTCCACGCCAGTCAAAGTTTGGCAATAAACCAACCACTAATCTGACTGCTGAAAGTCAAGCGTTACTTGCAAACAGCAAGTATAAAAAGGCAAATAAGTCATTTCTCCGTGCCAAGGAAAATGCTACTCACAATGTCCGTGTTAGTCCAAACACTTCCTTGTGCATTCGTTTGCTCAAGGATAGTGCTGGTAATCAAATGTTTGATAAGATTGGCAATGTTCTGTTTGGAATGCAGATCAACCATAAAATCACCGTTGGCAAGCCCAACTACAAGATCGAAGTTGGTGATAGGTTCCTTGGTTTCGACCAGAACCAAAGTGAAAACCACACTTATGCTGTCTTGCAACGAGTCTCTGAAAGCTCTCATGACACTCATCATTTTAATGGATGGGATGTCAAGGTTCTTGAAAAGGGCAAAGTAACAAGTGATGTCATCGTTAGAGATGAGGTCTATGACCAACTTAGCTATGAGGGCGTTCCTTATGATTCTTCAAAGTTTGCAGAATGGAGAGACAAGAGGAGAAGGTTTGTTTTGGAAAACTTGTCTATCCAGTTGGAAGAAGGCAAAACATTCTTGACTGAATTCGACAAATTAAATAAAGATTCTCTTTATCGTTGGAATATGAATTATCTGAAACTGCTCAGGAAAGCTATTCGTGCCGGTGGCAAGGAATTTGCCAAGATTGCTAAGACTGAGATTTTTGAATTGGCAGTTGAAAGGTTTGGACCAATCAACCTTGGTAGTTTGTCACAAATTAGCTTGAAGATGATTGCATCTTTCAAGGGAGTGGTTCAGTCTTACTTTTCTGTATCTGGTTGTGTTGATGACGCATCCAAGAAGGCACATGATTCCATGCTCTTCACTTTCATGTGTGCAGCAGAAGAAAAAAGGACAAACAAAAGAGAAGAAAAGACTAATCGTGCAGCATCTTTTATCTTGCAGAAAGCATATTTGCATGGCTGCAAGATGATTGTTTGCGAAGACGATCTTCCTGTTGCTGATGGAAAAACAGGCAAGGCACAAAATGCGGATCGTATGGACTGGTGTGCCCGTGCTTTGGCAAAGAAAGTCAACGATGGTTGTGTGGCAATGTCTATCTGCTATCGTGCCATTCCAGCTTATATGTCTAGCCACCAAGATCCATTTGTTCACATGCAAGACAAAAAGACTTCTGTTTTGCGTCCAAGGTTCATGGAAGTTAACAAGGATAGCATCAGGGATTATCATGTTGCTGGTTTGCGGAGAATGCTGAACAGCAAGAGTGATGCAGGCACTTCCGTTTACTATCGTCAGGCAGCTTTGCATTTCTGCGAAGCGTTGGGCGTGTCTCCAGAATTAGTCAAGAACAAAAAGACTCATGCTGCCGAATTAGGAAAGCATATGGGTTCTGCCATGTTGATGCCTTGGCGGGGTGGCAGGGTTTATATTGCCAGCAAGAAGTTGACTTCGGATGCTAAAAGTGTAAAATACTGTGGAGAAGATATGTGGCAGTATCATGCTGATGAGATTGCTGCTGTCAATATCGCAATGTATGAAGTTTGCTGCCAGACAGGTGCGTTTGGCAAGAAGCAAAAGAAGAGTGATGAACTACCGGGATAA
SEQ ID NO:22 >Si2Cas12iコード配列
CATGTCTAGTGATGTTGTTCGTCCATATAACACTAAGCTGCTTCCTGATAATCGCAAATACAATATGTTTTTGCAAACTTTCAAAAGACTCAATTTGATTTCATCAAATCATTTTGATCTCTTGGTTTGTCTTTATGCTGCTATCACCAACAAAAAAGCTGAAGAATATAAGTCAGAAAAAGAAGATCATGTAACCGCTGATAGCCTTTGCGCCATCAATTGGTTCCGTCCTATGTCCAAGCGTTATATCAAATACGCAACCACTACTTTTAAGATGCTTGAATTGTTTAAGGAGTACTCTGGTCATGAACCAGATACTTATTCCAAGAATTATCTCATGTCCAATATCGTCTCAGATAGGTTTGTTTGGGTTGATTGCCGCAAATTTGCCAAAGATTTTGCCAATCAAATGGAACTTAGTTTCCACGAATTTACCACTTTGTCAGAGACTTTGTTGGCAAATAGTATCCTTGTACTCAATGAGTCAACCAAGGCAAATTGGGCATGGGGTGCTGTTTCAGCACTTTATGGTGGAGGCGACAAAGAAGATTCTACGCTGAAGTCCAAAATCCTTTTGGCTTTTGTTGATGCTCTCAATAATCCTGAACTTAAAACTAGGCGGGAAATTCTCAATCATGTTTGTGAATCACTAAAATATCAATCATACCAAGATATGTATGTTGATTTTCGATCTGTCGTTGATGATAAGGGAAACAAGAAGTCTCCCAATGGCTCAATGCCAATCGTCACTAAGTTTGAATCAGATGATTTGATTGGTGACAATCAACGCAAAACTATGATTTCTAGTTTCACAAAAAACGCCGCTGCCAAAGCGTCTAAGAAGCCCATTCCATATCTAGACATTCTAAAAGACCACATGATTTCCTTGTGCGAGGAATACAATGTCTATGCTTGGGCAGCAGCTATTACCAATTCCAATGCTGATGTAACTGCTAGAAACACTCGCAATCTGACATTCATCGGGGAACAAAATACCCGAAGGAAAGAACTATCGGTTTTACAAACTTCTACAAACGAAAAAGCAAAAGATATCTTAAATAAGATTAACGACAATCTTATTCCAGAAGTAAGGTACACCCCTGCTCCCAAGCACTTGGGGCGTGATCTTGCCAATCTTTTTGAAATGTTCAAAGAAAAAGATATAAATCAGATTGGAAATGAAGAAGAAAAGCAAAATGTGATCAATGATTGCATTGAGCAATATGTCGATGATTGCCGTTCATTGAACCGCAATCCTGTTGCAGCTTTGCTCAAGCATATTAGCGGATATTATGAAGATTTTTCAGCCAAGAATTTCTTGGATGGTGCCAAGTTGAATGTCTTGACGGAAGTTGTCAATCGTCAAAAGGCACATCCAACTATTTGTTCTGAAAAGGCTTATACTTGGATTTCCAAGATTGACAAGAATAGGCGACAAGCAAACTCTTCTTTGGTTGGATGGGTTGTTCCACCGGAGGAAGTCCATAAGGAAAAAATTGCCGGTCAACAAAGCATGATGTGGGTCACTTTGACTTTGCTTGATGACGGCAAGTGGGTAAAGCATCATATTCCTTTTGCAGACTCAAGATATTATTCTGAAGTCTATGCCTATAATCCAAATTTGCCATATCTTGAAGGTGGTATTCCACGACAATCAAAGTTTGGCAATAAACCAACAACTAATTTGACCGCTGAAAGCCAAGCATTACTTGCCAACAGTAAGCACAAGAAAGCCAACAAGACATTTCTCCGTGCCAAGGAGAATATCACTCACAATGTTCGTGTTAGTCCAAATACTTCATTGTGCATTCGTCCCCTCAAGGATAGTGCTGGTAATCAAATGTTTGACAACATTGGTAATATGTTGTTTGGAATGCAGATCAATCACAGAATTACTGTCGGCAAGCCAAACTACAAGATCGAAGTTGGTGATCGGTTCCTTGGTTTTGACCAGAACCAAAGCGAAAACCACACCTATGCAGTTCTTCAACGAGTATCCGAAAGCTCTCATGGCACTCATCATTTCAATGGTTGGGATGTCAAAGTGATTGAGAAGGGCAAGGTGACAAGTGATGTCGTCGTCAGAGATGAAGTCTATGATCAATTAAGCTACGAGGGTGTCCCTTACGATTCTCCAAAGTTTACAGAATGGAGAGAGAAGAGGCGAAAGTTTGTCTTGGAAAATATGTCAATCCAGATTGAAGAAGGCAAAACATTCTTGACTGAATTTGACAAGTTAAACAAAGACTCTTTGTATCGTTGGAACATGAATTACATGAAATTGCTTAGGAAGGCAATTCGTGCTGGTGGCAAGGAATTTGCCAAGATTACAAAGGCTGAGATTTTTGAACTAGGAGTTATGAGATTTGGACCAATGAACTTGGGCAGCTTGTCGCAAGTCAGCTTGAAGATGATTGCTGCTTTTAAGGGAGTTATTCAGTCTTACTTTTCCGTATCTGGTTGCATTGATGACGCATCCAAGAAAGCTCATGATTCGATGTTATTCGCTTTCTTGTGTTCAGCAGATGAGAAAAGGACAAACAAGAGGGAAGAAAAGACAAATCGTGCAGCATCTTTCATATTGCAGAAAGCATACTCGCATGGTTGCAAGATGATTGTTTGCGAGGATGATCTTCCCATTGCCGATGGCAAGGTGGGCAAGGCACAAAATGCGGATCGCATGGACTGGTGCGCCCGTTCATTGGCAAAGAAAGTCAACGATGGTTGTGTGGCTATGTCCATATGTTATCGTGCCATTCCAGCATATATGTCAAGCCATCAAGATCCATTTACTCATATGCAAGATAAAAAGACTTCTGTTTTGCGTCCAAGGTTCATGGAAGTCGGCAAGGATAGCATTAGGGATCATCATGTTGCTGGTCTGCGGAGAATGCTGAACAGTAAAGGTAATACTGGCACTTCTGTTTACTATCGTGAGGCAGCTTTGCGTTTCTGCGAAGCGTTGGGTGTGCTTCCCGAATTAGTCAAGAACAAAAAGACTCATGCTTCGGAATTAGGAAAGCATATGGGTTCTGCCATGTTGATGCCTTGGCGGGGTGGCAGGATCTATGTCGCCAGCAAGAAATTGACTTCGGATGCCAAGAGTATAAAATATTGTGGAGAAGATATGTGGCAATATCATGCTGATGAGATTGCTGCTATCAATATCGCAATGTATGAGGTCTGCTGTCAGACAGGTGCTTTTGGCAAAAAACAAAAGAAGAGTGATGAACTACCGGGATAA
SEQ ID NO:23 >WiCas12iコード配列
ATGGGTATTAGCATTTCACGTCCGTACGGTACAAAGTTGCGTCCTGATGCTCGTAAGAAGGAAATGTTGGATAAGTTTTTCACCACGCTAGCAAAAGGTCAGCGTGTTTTTGCGGATCTGGGACTGTGCATTTACGGCAGCCTTACTTTAGAAATGGTAAAGCGGCTTGAGCCAGAATCCGATTCTGAACTTGTCTGTGCAATTGGTTGGTTTCGTCTTGTAGATAAGGTAACTTGGTCTGAGAATGAAATTAAACAAGAGAACCTGGTTAGACAATATGAGACGTATTCAGGAAAAGAAGCGTCTGAGGTTATCAAGACTTACCTAAGCTCTCCAAGTTCAGACAAGTATGTGTGGATAGACTGCCGACAAAAGTTTCTTAGGTTTCAAAGGGATCTGGGAACACGTAATCTGTCTGAAGACTTTGAGTGCATGCTTTTTGAACAGTACCTCAGACTCACAAAGGGAGAGCTTGATGGGCATACCGCTATGTCCAACATGTTTGGAACAAAAACAAAAGAAGATCGCGCCACAAAACTGAGATATGCCGCAAGGATGAAAGAATGGCTCGAGGCTAACGAAGAAATTACTTGGGAACAATATCACCAAGCGTTGCAAGATAAATTAGACGCCAATACTTTAGAGGAGGCTGTTGATAATTACAAAGGCAAAGCGGGAGGCTCTAATCCATTTTTTAGTTACACGCTTTTAAACAGAGGTCAGATTGATAAAAAAACTCACGAGCAGCAATTAAAGAAATTCAACAAAGTTCTAAAAACCAAATCCAAAAATTTAAATTTTCCAAACAAAGAGAAGTTAAAACAATATTTAGAAACAGCAATTGGTATTCCTGTTGATGCTCAGGTCTACGGTCAGATGTTTAATAACGGCGTTTCTGAAGTTCAACCAAAGACAACGCGCAACATGTCTTTTTCTATGGAGAAGCTTGAGCTTTTAAACGAGTTGAAAAGTCTCAACAAGACTGACGGTTTTGAACGCGCTAATGAAGTCTTGAATGGTTTCTTTGATTCTGAACTTCACACTACTGAAGACAAGTTCAACATCACTTCCAGGTATTTGGGTGGAGACAGAAACAATCGGCTACCAAAGCTGTACGAGCTTTGGAAAAAGGAAGGAGTAGATCGTGAGGAAGGTATCCAGCAATTCAGCCAAGCAATCCAAGATAAGATGGGTCAGATACCTGTTAAGAATGTCCTTAGGTATATTTGGGAATTTCGTGAGACTGTTTCTGCCGAAGACTTTGAAGCGGCAGCGAAAGCGAATCAGTTGGAAGAAAAAATCACGCGTACCAAAGCGCACCCCGTTGTTATATCTAACAGGTATTGGACATTTGGCTCTTCGGCTCTTGTTGGTAATATCATGCCAGCAGACAAGATGCACAAAGACCAGTACGCAGGTCAAAGTTTCAAGATGTGGCTTGAAGCCGAACTGCACTACGACGGTAAGAAAGTCAAACATCACTTGCCGTTCTACAACGCCAGGTTCTTTGAAGAGGTCTACTGCTATCACCCGAGCGTAGCTGAAGTTACACCATTCAAAACCAAGCAGTTTGGTTATGCAATTGGAAAAGATATTCCAGCTGACGTTTCGGTTGTACTGAAAGACAATCCTTATAAAAAGGCAACCAAGCGCTTCCTTCGGGCTATCAGCAATCCAGTCGCCAACACAGTGGATGTAAACAAGCCTACAGTTTGCTCATTCATGATTAAACGAGAAAATGACGAATACAAACTAGTCATTAATCGAAAGATCGGTGTTGATCGCCCAAAGCGTATTAAAGTAGGTAGGAAGGTCATGGGCTATGACCGTAACCAAACTGCTTCTGATACTTACTGGATTGGAGAGCTTGTTCCACATGGAACAACCGGAGCGTACCGTATTGGAGAATGGAGCGTCCAGTATATCAAGAGCGGTCCCGTGTTGTCTTCTACGCAAGGCGTAAATGACAGTACTACGGATCAACTTATATACAACGGAATGCCGAGCTCCAGCGAACGTTTTAAAGCTTGGAAGAAATCTAGGATGTCTTTCATTCGTAAGTTGATACGCCAACTGAACGCCGAAGGCTTGGAAAGTAAAGGACAGGACTATGTTCCTGAAAATCCAAGTAGCTTTGATGTTAGGGGCGAAACACTTTACGTATTCAACAGCAACTATATGAAAGCTTTGGTGTCTAAGCATCGAAAAGCCAAGAAACCTGTTGAAGGTATTCTTGAAGAAATAGAAGCCTTGACAAGCAAAGCTAAAGATTCTTGTTCGTTGATGCGTTTGAGTTCTTTGTCTGATGCGGCTATGCAAGGTATTGCTTCGTTGAAGAGTTTGATCAACTCATACTTCAACAAGAATGGTTGCAAAACAATTGAAGACAAAGAAAAGTTTAACCCAGATCTGTATGTGAAACTTGTTGAAGTTGAGCAAAAGAGAACTAACAAGAGAAAAGAAAAAGTTGGTCGAATCGCCGGTTCTCTTGAACAGTTAGCTTTGCTTAACGGTGTTGACGTTGTTATCGGTGAAGCTGATCTTGGCGAAGTCAAGAAAGGCAAATCCAAAAAACAAAATAGTCGAAACATGGACTGGTGTGCCAAGCAAGTCGCTGAGCGGCTTGAGTACAAGCTGACCTTCCATTGTATTGGTTATTTTGGTGTCAACCCGATGTATACGTCTCATCAAGATCCATTTGAACATCGTCGCGTTGCTGACCACCTAGTAATGCGTGCGAGGTTTGAAGAAGTGAATGTAAGTAATGTTTCGGAATGGCACATGCGAAACTTCTCAAACTATCTGCGTGCGGACTCAGGTACTGGTTTGTATTACAAACAAGCTACCTTGGATTTCCTCAAGCATTATGATTTGGAAGAGCACGCCGATGATTTGGAAAAGCAGAATATCAAATTCTATGACTTCAGGAAAATTCTTGAAGACAAACAATTGACTTCTGTTATTGTTCCAAAACGTGGCGGTCGCATTTACATGGCGACTAACCCGGTAACTTCCGATAGTACGCCTGTCACTTATGCCGGTAAAACTTACAACCGGTGTAATGCTGACGAAGTGGCTGCGGCTAACATCGCTATCAGCGTCTTAGCTCCTCACTCTAAGAAAGAAGAAAAGGAAGATAAGATCCCGATTATTTCTAAGAAGCCTAAGTCTAAGAATACTCCCAAGGCCCGGAAGAATTTAAAGACTTCTCAACTTCCTCAGAAA
SEQ ID NO:24 >Wi2Cas12iコード配列
ATGGCTAGCAAACATGTAGTGCGTCCCTTTAATGGCAAAGTAACAGCTACTGGCAAGCGTTTGGCATACTTGGAAGAAACTTTTCATTATTTGGAAAAAGCTGCTGGTGGTGTTAGTACTTTGTTTGCTGCCCTTGGTTCTTATCTTGATGCAACCACAATAAGCAATTTAATTAATAAAAATCAAGATTTAGCCGTTGTAATATTTCGTTATCATGTGGTTCCCAAAGGTGAGGCTCATACTTTACCTGTAGGTACAGACATGGTTAGTCGTTTTGTTGCCGACTATGGTATGGAGCCGAATGAGTTTCAGAGAGCTTATTTGGACAGTCCGATTGACCAAGAAAAGTATTGTTGGCAGGATAATAGGGATGTTGGTTGTTGGTTGGGTGAGCAATTGGGTGTTAGCGAAGCGGACATGCGGGCAATAGCAGTAACTTTTTATAACAATCAGATGCTTTATGATTGTGTAAAAGGTACTGGGAGTGGTAATGCTGTGAGTCTTTTGTTTGGCAGTGGTAAAAAGTCTGATTACAGTATGAAGGGCGTTATAGCAGGTAAGGCTGCTTCAGTACTGGCAAAATATCGCCCAGCTACCTATCAAGATGCCCGAAAGATGATTTTGGAAGCTAATGGTTTCACCTCAGTAAAAGATTTGGTTACTTCTTATGGAATAACTGGAAGGTCTAGTGCTTTGCAGATATTTATGGAAGGGATTGAAAGTGGTCCTATTAGCAGCAAGACATTAGATGCTCGTATTAAGAAGTTCACAGAGGATTCGGAGCGCAATGGCAGGAAGAATCTAGTCCCTCATGCTGGGGCTATACGAAATTGGCTGATTGAGCAAGCTGGTAGTAGTGTAGAAAACTATCAGATGGCATGGTGCGAGGTTTACGGTAATGTGTCTGCCGACTGGAATGCCAAAGTAGAAAGTAATTTCAATTTCGTAGCGGAGAAAGTAAAGGCATTAACAGAATTATCCAACATTCAGAAATCGACTCCTGATTTGGGTAAGGCTTTGAAATTATTTGAAGAATATTTGACTACTTGTCAGGATGAATTTGCTATTGCGCCTTATCATTTTAGCGTCATGGAAGAGGTGCGAATGGAAATGGCAACAGGCAGGGAATTCAATGATGCTTATGATGACGCCCTAAATAGCTTGGACATGGAGTCTAAGCAGCCCATTCAGCCTTTGTGTAAGTTTTTGATTGAGCGTGGAGGTAGTATCAGTTTTGATACTTTCAAGAGTGCAGCCAAGTATTTGAAAACACAGAGCAAGATTGCTGGTCGATATCCACATCCATTTGTAAAAGGTAATCAGGGATTTACTTTTGGTTCCAAAAACATTTGGGCAGCCATCAACGATCCTATGATGGAGTATGCAGATGGTCGTATTGCTGGTGGTTCTGCAATGATGTGGGTGACGGCTACATTGTTGGATGGGAAAAAGTGGGTTCGCCATCATATCCCATTTGCCAATACTCGATACTTTGAGGAGGTTTATGCTAGCAAGAAAGGGTTGCCTGTATTGCCTTGTGCTAGAGATGGCAAACACTCATTTAAATTGGGCAATAATTTGAGTGTAGAGAGAGTTGAAAAGGTCAAAGAAGGCGGTAGAACTAAAGCAACCAAGGCACAAGAGCGTATTTTAAGCAACTTGACTCACAATGTGCAGTTTGACAGTTCGACAACTTTTATTATTCGTCGTCAGGAAGAAAGTTTTGTAATTTGCGTGAATCATCGACATCCAGCTCCGCTCATGAAGAAGGAGATGGAAGTTGGCGACAAAATCATTGGTATCGACCAGAATGTGACGGCACCCACAACCTATGCCATAGTTGAGCGTGTGGCTTCTGGCGGCATTGAGCGTAACGGCAAGCAGTACAAAGTGACGGCGATGGGAGCCATTTCCAGCGTTCAGAAGACCAGAGGCGGTGAGGTGGATGTTTTGAGTTATATGGGGGTTGAACTTTCTGACAGCAAAAATGGATTTCAAAGCTTGTGGAATAAATGTTTGGACTTTGTTACCAAACATGGCACTGAAAATGATGTTAAATATTATAACAACACTGCTGTCTGGGCCAACAAGCTGTATGTGTGGCACAAGATGTATTTCCGGCTTTTGAAGCAGTTGATGCGTCGGGCAAAGGACTTGAAACCTTTCAGGGACCATTTACAGCATCTATTATTCCATCCTAATCTTAGTCCCTTGCAACGCCATAGCTTGTCCTTAACAAGTCTGGAAGCAACTAAGATAGTGCGGAATTGCATTCATTCGTATTTCAGTCTATTGGGGTTGAAGACCTTGGATGAACGCAAAGCCGCTGACATCAATTTATTGGAAGTTTTGGAAAAGCTGTATGCTGGTTTGGTTGAGAGGCGAAAAGAAAGAACCAAACTAACCGCTGGGCTATTGGTTCGCTTATGTAATGAGCATGGGATTTCTTTTGCAGCTATTGAGGGTGATTTGCCGGTCGTTGGAGAGGGCAAATCTAAAGCTGCCAACAATACACAACAGGATTGGACAGCCAGAGAGTTAGAGAAGCGATTATCTGAGATGGCGGAGGTGGTTGGCATCAAGGTAATAGCTGTTTTGCCCCACTATACCAGTCATCAGGACCCATTTGTTTATAGTAAAAATACCAAGAAAATGAGATGTCGTTGGAACTGGAGGACCACCAAGACCTTCACTGATCGTGATGCTTTGAGTATACGCAGGATATTAAGCAAGCCTGAGACGGGTACAAATTTGTATTATCAGAAGGGCTTGAAAGCATTTGCTGAAAAGCATGGTCTGGATTTGGCAGAGATGAAGAAGCGCAAGGATGCTCAATGGTATCTTGAGCGCATTCAAGACAAGAATTTTTTGGTGCCAATGAATGGTGGTAGAGTTTATTTGAGTTCTGTCAAATTAGCCGGGAAAGAAACAATTGACATGGGTGGCGAAATTTTATATCTTAACGATGCCGATCAAGTCGCAGCGTTGAATGTTTTGTTAGTGAAGATTTGA
SEQ ID NO:25 >Wi3Cas12iコード配列
ATGGCTAAGAAAGAACATATTATAAGACCATTCAAAGGAACACTACCACTTCGTGGTGATAGACTAAGGTATCTTCAAGATACCATGAAATATATGAAAAAGGTTGAAGATACTATCACAGAACTCTGCGCCGCTGTTATCGCCTATGCCAAACCCACCATCATTCAACAAATACTTGGCGAAGAAATTGAAACCACCAGCACATTTTGTAGCTTCCGCTTAGTAGGCATTCATGAAAACTTTACCATGCCACTAACCACAAATATGATAAAACACTTCCAGAAAACCTTTAACATAAACCCATCAGAAAAACAAGCAATCTATCTCTCCAGTGGATTCGATTCAGATAAATATCGCTGGCAAGATACTTCCGAAGTATCCAGAAACTTCGCCAACAAATGCCGACTTACTAATCAAGAATTCCAAGAATTTGCCGAACAAGCACTACTCAATATGTGCTTCATAGGTTGCTCTGGTAGCCCCGGTGCAACTAATGCCGTCTCACAAATCTTTGGCACAGGCGAAAAAAGCGATTACCAACGCAAAAGCCAAATCGCTAAAATTGCTGCTGATACCCTCGAAAACCACAAACCTAGCACCTATGAGTCTGCTAGATTAATGGTTCTTAATACACTTGGACACAAAACAATAGAAGATTGTGTCAATGACTATGGCGCAATAGGAGCCAAATCCGCCTTCCGACTATTCATGGAATCAAAAGAAATAGGACCAATTACATCTGAACAACTCACAACCAAAATTAAGAAGTTCAGAGAAGATCATAAAAAGAACTCCATCAAGAAACAACTTCCACATGTAGAAAAAGTTCGTAACGCTTTGCTATCACAATTCAAAGAACAATACCTGCCCTCAGCATGGGCAGAAGCATGGTGCAATATCATGGGCGAATTTAACTCCAAATTATCAAATAATAATAACTTCATCGACCaaaaaacaaaaaTGGTCAATGACTGCGATAATATTAAAAAATCTAATCCACAACTAGACAAAGCTGTTAATATGCTCGATGAATGGAAATATAAAAACTGGGATGATAATTCTGCTATACACCCATATCATATTGGCGATCTTAAAAAACTCATGGCAATATTCAATATCAATAACGAAGGAACCTTCGACGAAAGATTTTCAGCTAGCTGGGAACAATTCTCCACATCACTAGAATACGGGGAGAAACCACCCGTTCGTGATCTACTAGCCCATATCATCAAAAATATGAATGACCTCACCTACACAGACGTAATCAACGCCGCAAAATTTCTCAAACTTCAAGATAATATAAGAAATAAATACCCACACCCTTTCGTTATGCCAAATAAAGGATGTACCTTTGGTAAAGATAACCTTTGGGGCGAAATTAATGACCCCACAGCCAAAATCAAATCAACAGAAGAAGTTGCTGGACAAAGACCTATGATGTGGCTGACAGCCAAACTTCTCGATAATGGAAAATGGGTAGAACACCACATCCCTTTCGCCTCCAGTAGATACTTTGCCGAAGTTTATTATACCAATCCAGCACTCCCCACTCTACCAATAGCTAGAGATGGAAAACATTCATACAAATTAACAAAAACTATAGATGCCAATACTGCAAAAACTCTAGTAAATAATCCTAGAGATAAAGCAGCTAAACTAATCGCACGAACTAAAGCCAATACTACACACAATGTAAAATGGATTAAACCTACATACAGAATCCAAAAAGAAAATAACCAATTCGTTATTACTATCAATCATCGACACCCATGCATAACACCACCAAAGGAAATCATACTCGGAGATCGTATCCTATCCTTCGACCAAAACGAAACAGCCCCCACAGCATTCTCCATTCTCGAAAAAACAACCAAAGGTACAGAATTCTGTGGCCACCACATTAAAGTGCTAAAGACTGGTATGCTAGAAGCTAAAATTAAAACCAGTAAGAAATCAATAGATGCATTCACATACATGGGACCAATGGAAGATGATCATGCGTCTGGCTTCCCAACACTACTCAACATATGTGAAAAATTCATATCAGAGAATGGAGATGAAAAAGACAAAAGTTTCTCTTCTCGTAAATTGCCCTTTAAAAGGTCTTTGTACTTCTTTCATGGCTCACACTTCGATTTACTAAAGAAAATGATCAGAAAGGCCAAAAATGACCCCAAGAAATTGAAGTTAGTAAGAATTCATATCAATGAAATTCTATTCAATTCCAATTTGTCACCAATAAAACTACACAGTCTGTCTATTCACAGCATGGAAAATACCAAAAAAGTTATAGCTGCTATTAGCTGCTATATGAATGTTCATGAATGGAAAACTATCGATGAACAAAAGAATGCTGATATAACATTGTATAATGCTAAAGAAAAACTATACAACAACCTTGTTAACCGCCGTAAAGAAAGAGTAAAAGTAACTGCAGGTATGTTGATTCGATTAGCTAGAGAAAACAATTGCAGATTCATGGTCGGGGAAGCAGAATTACCCACCCAACAACAAGGCAAATCAAAAAAGAACAATAACTCCAAACAGGATTGGTGCGCCAGAGATATAGCACAACGATGTGAAGATATGTGCGAAGTCGTAGGTATAAAATGGAATGGCGTTACTCCGCATAATACCAGCCATCAAAACCCATTCATCTATAAAAATACTAGTGGACAACAAATGCGATGCCGTTATAGTCTCGTAAAGAAGTCAGAAATGACAGACAAGATGGCAGAAAAAATTAGAAATATTTTACACGCTGAACCTGTAGGCACTACAGCATACTACCGTGAAGGCATTTTGGAATTCGCCAAACATCATGGATTAGATCTGGGAATGATGAAAAAACGAAGAGATGCTAAGTATTATGATAATCTTCCAGATGAGTTTCTGCTTCCTACTAGAGGTGGTAGAATCTATCTGTCCGAAAATCAACTAGGCGGAAACGAAACCATTGTTATTAATGGGAAAAAATATTTTGTCAATCAGGCAGATCAAGTCGCTGCCGTAAATATTGGCCTGCTTTATCTTCTGCCGAAGAAAAACCAGAGTTAAG
SEQ ID NO:26 >SaCas12iコード配列
ATGTCCGAGAAGAAGTTCCACATCAGGCCCTACCGCTGCTCGATAAGCCCGAACGCCCGCAAGGCCGATATGCTCAAGGCGACGATCTCCTACCTTGACTCCCTGACCTCCGTGTTCAGGTCGGGATTCACCGCACTACTTGCGGGCATAGACCCGTCGACGGTGAGCCGCCTGGCGCCTTCGGGGGCCGTCGGCAGCCCGGACCTGTGGAGCGCCGTCAACTGGTTCCGCATCGTGCCGCTCGCAGAGGCCGGCGACGCCCGAGTCGGCCAGGCATCGCTCAAGAACCTCTTCCGTGGCTACGCAGGCCACGAGCCCGACGAAGAGGCGTCGATCTATATGGAGTCGAGAGTGGACGATAAGAGGCACGCGTGGGTGGACTGCCGTGCCATGTTCAGGGCGATGGCGCTCGAGTGCGGGCTGGAGGAGGCCCAGCTCGCCTCCGACGTGTTCGCCCTCGCCTCAAGGGAGGTCATAGTCTTCAAGGACGGCGAGATCAACGGCTGGGGCATAGCCTCCCTGCTGTTCGGCGAGGGCGAGAAGGCCGACTCGCAAAAGAAGGTCGCCCTGCTCCGCTCCGTGAGGCTGGCCCTTGAGGGGGACTACGCGACCTACGAGGAACTCTCCGGGCTCATGCTGGCCAAGACCGGAGCCTCCAGCGGCTCCGACCTCCTTGACGAGTACAAGAGGAGCGAGAAGGGCGGCAGCAGCGGCGGCAGGCACCCCTTCTTCGACGAGGTCTTCCGGAGGGGCGGCAGGGTCAAGCAGGAGGAGCGCGAGAGGCTGCTGAAGAGCTGCGACACAGCGATCCAGAAGCAGGGGCAGGCGCTGCCGCTGTCGCACGTCGCATCTTGGAGGCAATGGTTCCTGCGCAGGGTCACGCTGCTGCGCAACCGCAGGCAAGAGTCGTTCGCAGTCTGCATCACCAACGCCCTCATGGACCTACAGCCCAAGAACCTACGCAACGTCCACTACGTGACGAACCCCAAGAGCGAGAAGGACAAGGGCGTGCTCGAGCTGCGCGTCGACGTCAAGAACAACGAGGGGCCGGACGTGGCGGGCGCGCAGGCGGTCTTCGACGCCTACATGGCGAGGCTGGCACCCGACCTGCGCTTCTCCGTGATGCCACGGCACCTCGGCTCCCTCAAGGACCTCTACGCCCTTTGGGCCAAGCTCGGGCGGGACGAGGCCATCGAGGAGTACCTCGAGGGCTACGAGGGACCATTCAGCAAGAGGCCCATCGCAGGCATTCTACAAATCATCCACGCACACCGTGGCAAGGTGGGCTACGATAGCCTGTTGCGTGCGGCGAGGCTCAACAGGGCGATGGACAGGCTGGAGAGGAAGAGGGCCCACGCCTGCGCAGCCGGCAACAAGGGTTACGTCTACGGCAAGAGCTCGATGGTCGGCCGCATCAACCCGCAGAGCCTCGAGGTCGGCGGCCGCAAGTCGGGCCGAAGCCCGATGATGTGGGTGACCCTCGACCTGGTGGACGGCGACAGGTTCGCGCAGCACCACCTTCCCTTCCAGAGCGCCCGCTTCTTCTCCGAGGTCTACTGCCACGGCGACGGGCTCCCGGCCACCCGTGTCCCCGGCATGGTCAGGAACCGTCGCAACGGGCTGGCGATAGGGAACGGGCTCGGGGAGGGTGGACTCTCAGCGCTGCGCGCAGGCAGCGACAGGAGGAAGAGGGCCAACAAGAGGACGCTGCGCGCCCTCGAGAACATCACGCACAACGTGGAGATCGACCCCAGCACCTCCTTCACGCTGCGGGAGGACGGGATAATCATTTCGCACAGGATCGAGAAGATTGAGCCGAAGCTTGTCGCCTTCGGGGACAGGGCGCTCGGCTTCGACCTCAACCAGACAGGGGCTCATACGTTTGCGGTGCTCCAGAAGGTGGACTCGGGCGGCCTAGACGTCGGCCACTCTCGCGTGTCGATCGTGCTCACCGGCACTGTTCGCAGCATCTGCAAGGGCAACCAGGCGAGCGGCGGACGGGACTACGACCTGCTTTCCTACGACGGCCCCGAGCGCGACGACGGGGCGTTCACGGCATGGAGGTCGGACAGGCAGGCCTTCCTGATGTCTGCCATACGGGAGCTGCCCACGCCCGCCGAGGGGGAAAAGGACTACAAGGCAGACCTCCTCTCCCAGATGGCGAGCCTTGACCACTACAGGCGACTGTACGCGTACAACAGGAAGTGCCTCGGCATCTACATCGGGGCCTTGAGACGCGCGACCAGGAGGCAGGCCGTGGCCGCATTCAAGGACGAGATACTCTCGATCGCGAATCACCGCTGCGGGCCTCTCATGCGTGGGAGCCTTTCGGTGAACGGCATGGAGTCCCTCGCGAACCTCAAGGGCCTAGCCACGGCATACCTGAGCAAGTTCAAGGACAGCAAGTCCGAGGACCTGCTGTCGAAGGACGAGGAGATGGCCGACCTGTACAGGGCTTGCGCGCGCAGAATGACTGGCAAGCGCAAGGAGAGGTACAGGAGGGCGGCTAGCGAGATCGTCCGGCTGGCCAACGAGCACGGCTGCCTGTTCGTCTTCGGCGAGAAAGAGCTGCCCACCACCAGCAAGGGCAACAAGAGCAAGCAGAACCAGAGGAACACCGACTGGTCGGCCCGTGCCATAGTGAAGGCGGTCAAGGAGGCCTGCGAGGGCTGCGGTCTCGGCTTCAAGCCCGTGTGGAAGGAGTACTCGAGCCTCACGGACCCGTTCGAGAGGGACGGGGACGGAAGGCCTGCCCTCCGCTGCCGGTTCGCCAAGGTGGCCGCACCCGACTCCGAACTCCCGCCTCGCCTGACGAAGGCCGTCGGCTCCTATGTGAAGAACGCCCTCAAGGCCGACAAGGCGGAGAAGAAGCAGACCTGCTACCAGCGTGGCGCCATCGAGTTCTGCTCAAGGCACGGCATCGACGTCCGGAAGGCGACCGACAAGGCCATTCGCAAGGCAGTCCGTGGCTCCTCCGACCTGCTTGTGCCGTTCGACGGGGGGAGGACCTTCCTGCTCTCGACGAGGCTGTCCCCGGAGTCGCGAAAGGTGGAGTGGGCCGGGCGCACCCTGTACGAGTTCCCCAGCGACATGGTCGCCGCAATCAACATCGCCTGCAGGGGCCTAGAGCCACGCAAGGCCTAG
SEQ ID NO:27 >Sa2Cas12iコード配列
ATGGACGAGCAAGCTGTTGTTTCCTCTGGTTCCGACAAGACCCTCAAGATCGTACGCCCTTACAGGGCAAAAGTAACCGCTACTGGAATTCGCCTTGAGGGAATTAAAAATACCCTGAATTACCTGAAGCGTACAGAAATTTGTCTGTCACGCCTGAATGCAGCTTGTGGAGCTTTTCTCACTCCTGCCATCGTGGAGCAGATCTGTAAGGACGATCCTGCCCTAGTTTGTGCCATTGCTCGCTTTCAATTGGTTCCGGTTGGTAGTGAAGCCACTTTGTCCGACAGTGGGCTAATGCGTCATTTTAAGGCTGCTCTCGGTGAATTGACCCCGCTACAAGAAGCCTACCTGAATAGCAGCTATAACGACGAATTGTACGCATGGCAGGATACTCTTGTCTTAGCGCGACAGATTATTGCTGAAACCGGATTGACTGAAGATCAATTCCGCGCCTTTGCTCATGCCTGTTTCAAGAACGGCAATATTATCGGGTGCGCTGGTGGTCCCGGTGCCAGCAACGCCATCTCTGGCATTTTTGGCGAGGGAATTAAATCCGATTATTCACTCCGAAGTGAAATGACCGCTGCCGTTGCAAAGGTGTTTGAAGAGAAACGTCCTATCACTTACGAAGAAGCTCGGGCTCTCGCTCTGGAAGCAACTGGACACGCCAGCGTTCAGTCTTTCGTGGAAGCATTTGGTAAACAGGGGCGTAAAGGCACTCTGATTCTTTTCATGGAAGATACCAAGACAGGCGCATTCCCAAGCAATGAATTCGATTACAAGCTCAAGAAACTGAAGGAGGATGCAGAGCGTGTCGGGCGTAAGGGTATCATCCCGCACCGCGATGTGATTGCTTCTTATCTCCGCAATCAGACTGGTGCTGATATTGAATACAACTCCAAGGCATGGTGCGAGTCCTACTGTTGTGCCGTGAGCGAATACAACTCAAAGATGAGCAACAATGTTCGATTTGCCACGGAAAAAAGTCTTGATTTGACCAAGCTTGATGAAACGATCAGGGAAACGCCCAAGATCAGTGAAGCCATGCTTGTTTTTGAAAACTACATGGCGCGAATTGATGCCGATCTCCGGTTCATTGTGAGCAAGCATCATCTCGGCAATCTCGCCAAATTCCGTCAGACCATGATGCATGTCTCTGCATCAGAATTTGAAGAGGCTTTTAAGGCGATGTGGGCTGATTACTTGGCTGGTCTGGAATACGGTGAAAAACCCGCGATCTGTGAACTGGTGCGGTATGTCCTGACCCATGGCAACGATTTGCCTGTCGAAGCGTTTTACGCTGCGTGCAAGTTCCTTAGCTTGGATGACAAGATCAAGAATCGTTACCCTCACCCATTTGTTCCGGGTAACAAAGGCTACACCTTTGGCGCGAAAAACTTGTGGGCAGAAATCAATGATCCCTTCAAGCCCATCCGTCAAGGCAACCCAGAGGTTGCTGGTCAACGCCCCATGATGTGGGCTACCGCCGACCTTCTGGACAACAACAAATGGGTCTTGCATCACATCCCCTTTGCCTCCAGCAGGTATTTCGAGGAAGTGTACTACACCGATCCCTCGCTTCCTACGGCTCAAAAGGCGCGAGACGGCAAGCATGGCTATCGGTTGGGCAAAGTGCTGGATGAGGCTGCTCGGGAGCGTTTAAAAGCAAATAATCGCCAGCGCAAGGCAGCTAAAGCCATCGAGCGGATCAAAGCCAACTGTGAGCACAATGTGGCTTGGGATCCGACCACCACCTTCATGCTTCAGTTGGATTCTGAGGGTAATGTGAAAATGACGATCAATCATCGTCACATTGCCTATCGCGCACCCAAGGAAATTGGTGTTGGGGACAGGGTGATTGGCATCGACCAAAACGAGACTGCTCCTACAACCTACGCCATTCTTGAGCGCACGGAAAATCCTCGCGATCTTGAATACAACGGCAAGTATTACCGTGTAGTCAAGATGGGTAGTGTGACTTCACCGAATGTCAGCAAGTATCGCACGGTGGACGCTTTGACTTACGATGGCGTGTCCTTGTCGGATGATGCTTCTGGTGCTGTGAACTTTGTGGTATTGTGTCGCGAGTTTTTTGCAGCACATGGCGACGATGAGGGTCGCAAGTACCTTGAGAGGACTTTGGGGTGGAGTTCAAGCCTGTATTCCTTCCATGGAAACTATTTCAAGTGCCTTACGCAGATGATGCGTCGATCCGCTCGTTCTGGTGGTGATTTGACGGTCTATCGCGCCCATTTGCAGCAGATCCTGTTCCAACACAATCTGTCGCCCTTGAGGATGCACAGCTTGTCTTTAAGGAGCATGGAATCGACGATGAAGGTCATCAGTTGCATGAAGAGCTACATGTCTCTTTGTGGCTGGAAGACCGACGCGGATCGGATTGCCAATGATAGGTCGCTGTTTGAGGCTGCTCGTAAGCTTTACACCAGTTTGGTAAATCGTCGGACGGAGCGGGTTCGTGTGACTGCTGGCATTCTGATGCGTCTGTGCTTGGAGCACAACGTTAGGTTTATTCACATGGAGGATGAACTTCCTGTGGCTGAAACGGGCAAAAGCAAGAAAAGCAATGGCGCGAAGATGCATTGGTGTGCCCGGGAGCTTGCCGTTCGTTTGTCCCAGATGGCAGAGGTGACGAGCGTCAAGTTCACAGGTGTGTCACCGCATTACACTAGCCATCAAGACCCATTTGTGCATTCCAAGACTAGTAAGGTAATGCGTGCCCGTTGGAGTTGGCGGAATCGTGCCGATTTCACGGACAAGGATGCGGAGCGTATTCGGACGATTCTGGGTGGTGATGACGCAGGGACGAAGGCTTATTATCGCTCGGCGTTGGCTGAATTTGCCTCGCGCTATGGTCTGGACATGGAGCAGATGCGGAAGAGGCGCGATGCTCAGTGGTATCAAGAGAGACTGCCAGAAACCTTTATTATTCCTCAGCGGGGTGGTAGAGTGTACTTGTCTTCTCACGATCTGGGATCAGGTCAAAAAGTTGACGGGATTTATGGTGGTCGTGCTTTCGTGAATCACGCTGACGAGGTTGCTGCGCTGAATGTGGCGTTGGTCAGGCTGTGA
SEQ ID NO:28 >Sa3Cas12iコード配列
ATGAAGACTGAAACTCTTATCCGTCCCTACCCCGGCAAACTCAACCTCCAACCCCGTCGAGCACAATTCCTCGAAGACTCCATTCAATATCACCAGAAAATGACGGAATTTTTCTACCAATTCCTCCAAGCAGTCGGCGGTGCCACCACGCACCAAAACATCAGCGATTTCATCGACAATAAAGCCACCGATGAACACCAAGCCACTCTCCTCTTCCAAGTAGTCTCCAAAGACAGCACAACACCAGAATGCCCCGCAGAAGAACTCCTAGCCCGATTTGCCCAATACACCGGCAAACAACCCAATGAGGCTGTCACCCACTACCTGACCAGCAGAATCAATACAGATAAATACCGCTGGCAGGACAATCGACTCCTCGCCCAAAACATCGCTTCACAACTGAACATCTCCGAAACTCAATTCCAAGAGATCGCTCACGCAATCCTGTCCAACAACCTATACATCGGTCAAACTGCATCCAACGCAGCAGCCAACTTCATCAGCCAAGTCACAGGCACAGGCCAGAAAGCCCCCAAGGCAGCACGGCTCGATGTCCTGTTCCAGACCAACCAAGCCCTCGCCAAAACACAACCCACAACCTTCGGCCAACTCCAACAGATCATCGTACAAGCCTGCGGTGAATCCACCACCGATGCAGTCCTCGCCAAATTCGGCAACAAAGGCGCTGCAACCAGCCTTCAACTGGCCCTTAAAACCGACCCCAACACAACGCTGGATCAGAAGAAGTACGAAGCCCTGCAAAAGAAATTTGCAGAGGACGAAACCAAATATCGCAACAAGGTCGATATCCCCCACAAGACCCAACTGCGCAACCTCATCCTCAACACCTCAAACCAATTCTGCAACTGGCACACCAAGCCAGCCATCGAAGCCTTTAAGTGCGCCATCGCTGACATCCAGTCCAAAGTCAGCAACAACCTCCGCATCATGCAGGAAAAGGCCAAACTCTACGAGGCATTCAGAAATGTCGATCCACAAGTCCAGATCGCCGTCCAAGCTCTTGAAAACCACATGAACACACTTGAGGAACCCTACGCACCCTACGCCCACTCGTTCGGCAGCGTCAAAGACTTCTACGAAGACCTCAACAACGGCTCCAACTTAGATGAGGCCATTCAAACCATCGTCCACGATTCCGACAACTTCAACAGGAAGCCAGACCCCAACTGGCTCCGCATCATCGCACCTCTCCACTCATCCCATTCCGCAAGCCAAATCATGGAGGCAGTAAAATACCTGTCCAGCAAACAGGATTACGAACTCCGTAAACCCTTCCCATTCGTCGCCACTAACCTGCCAGCAACCTACGGGAAATTTAACATTCCCGGCACCCTCAACCCACCCACCGACAGCCTTCACGGCAGACTGAACGGTAGCCACTCCAATATGTGGCTCACAGCCCTGCTCCTCGACGGCAGGGATTGGAAAAACCACCACCTTTGCTTCGCCTCAAGCCGCTACTTCGAGGAGGTCTACTTCACAAACCCCAGCCTGCCCACTACAGACAAAGTCCGTAGCCCCAAATGCGGCTTCACACTCAAGAGCGTGCTCGACTCCGAAGCCAAAGACAGGATTCGCAACGCTCCCAAATCCCGCACCAAGGCCGTGAAAGCCATCGAACGCATCAAGGCCAACTCCACCCACAATGTGGCGTGGAACCCCGAAACCTCTTTCCAGATGCAGAAAAGAAACGATGAGTTCTACATCACCATCAACCACCGCATCGAAATGGAAAAAATCCCCGGTCAGAAAAAGACCGATGACGGTTTCACAATCCACCCCAAAGGTCTCTTCGCCATCCTCAAGGAAGGCGACAGAATCCTGTCACAAGACCTCAACCAGACCGCAGCCACACATTGCGCCGTCTATGAAGTCGCCAAACCCGACCAGAACACCTTCAACCACCACGGCATTCACCTCAAGCTGATTGCCACAGAAGAACTCAAAATGCCCCTCAAGACCAAAAAGTCCACAATCCCAGATGCCCTCTCCTACCAAGGCATCCACGCCCACGACCGTGAAAACGGCTTACAACAACTCAAAGATGCCTGCGGAGCTTTCATCAGCCCCAGACTCGATCCCAAACAAAAGGCTACTTGGGACAACTCCGTCTCCAAGAAGGAGAATCTCTATCCATTCATCACCGCCTACATGAAACTCCTCAAGAAGGTCATGAAGGCAGGTCGTCAAGAACTGAAACTTTTCAGGACACACCTTGACCACATCCTCTTTAAACACAACCTCAGCCCCCTCAAGCTGCACGGTGTGTCCATGATCGGTCTGGAATCATCCAGAGCAACCAAATCCGTCATCAACAGCTTCTTCAACCTTCAGAACGCCAAGACGGAACAGCAGCAGATCGCCCTCGACCGACCCCTGTTTGAGGCCGGTAAAACCCTCATCAACAACCAAACCCGCCGACGACAGGAAAGGGTCAGGTTAGAAACCAGTCTCACCATGAGACTGGCACACAAATACAACGCCAAGGCAATCATCATCGAGGGTGAACTGCCACACTCCAGCACCGGAACCTCGCAGTACCAGAACAATGTCCGTCTGGACTGGTCTGCCAAGAAATCCGCAAAGCTGAAAACCGAATCAGCCAACTGTGCAGGCATTGCCATATGCCAGATCGATCCGTGCCACACAAGCCACCAAAATCCCTTCCGGCACACTCCAACTAACCCAGACCTCAGACCACGATTTGCGCAAGTCAAAAAGGGCAAAATGTTCCAGTATCAACTCAATGGACTACAGAGGCTGCTCAACCCCAGAAGCAAATCCTCAACTGCCATCTACTACAGGCAGGCAGTCCAAAGTTTCTGCGCCCACCACAACCTGACGGAGAGGGACATCACCTCTGCCAAATTCCCCAGCGATCTGGAGaaaaaaaTCAAGGATGACACCTATCTGATTCCCCAGAGAGGTGGTAGAATATACATCAGCAGCTTCCCCGTCACTAGCTGCGCCCGTCCCTGCACCAGCAACCATTATTTCGGGGGTGGACAATTCGAGTGCAATGCTGACGCTGTCGCAGCCGTCAACATCATGCTGAAGGTTCACCCGTAA
SEQ ID NO:29 >WaCas12iコード配列
ATGCCCATTCGCGGATATAAATGCACTGTTGTCCCAAACGTACGCAAAAAGAAACTCTTGGAAAAAACCTATAGCTACTTACAAGAGGGTTCTGATGTATTTTTTGATCTTTTCTTGAGTCTGTATGGTGGGATCGCCCCAAAAATGATTCCACAAGACCTGGGGATCAATGAACAAGTAATTTGTGCTGCCAATTGGTTCAAAATTGTTGAAAAAACGAAAGATTGCATCGCTGATGATGCGTTGTTGAATCAATTTGCTCAATATTATGGGGAAAAACCCAATGAAAAGGTTGTTCAATTTTTGACGGCATCTTACAATAAAGACAAATATGTTTGGGTCGATTGTCGTCAAAAATTTTACACTCTGCAAAAGGATTTGGGAGTCCAAAACCTAGAAAACGACCTGGAGTGTTTGATTCGAGAAGATTTGTTGCCCGTAGGAAGCGACAAAGAAGTTAATGGATGGCACTCGATATCAAAATTGTTTGGTTGTGGAGAAAAAGAAGACAGAACAATTAAGGCTAAAATTCTGAATGGCCTATGGGAAAGAATTGAGAAAGAAGATATTCTAACAGAAGAAGACGCAAGAAATGAACTATTGCACTCTGCTGGGGTGTTGACTCCAAAAGAATTTAGAAAAGTATATAAAGGGGCTGCTGGTGGGCGTGATTGTTATCACACGTTGCTGGTAGATGGGAGAAACTTCACTTTTAACCTTAAAACACTCATTAAGCAGACCAAGGATAAATTAAAAGAAAAGTCTGTTGATGTTGAAATCCCCAATAAAGAAGCATTGCGTCTATATCTCGAAAAACGAATTGGACGGTCTTTCGAGCAAAAGCCATGGAGCGAAATGTATAAAACGGCCCTCTCAGCCGTTATGCCAAAAAATACGCTAAATTATTGTTTCGCCATTGATAGGCACGCCCAATATACAAAAATTCAAACACTAAAGCAGCCATATGATTCGGCAATTACTGCCCTAAATGGGTTTTTTGAGTCTGAATGCTTTACAGGCTCAGATGTTTTTGTTATTTCTCCCTCCCATTTGGGGAAAACTCTTAAAAAACTTTATAATTACAAAGATGTTGAATCTGGCATTAGCGAAATTGTTGAAGATGAAGACAATAGTTTGCGATCTGGGGTAAATGTAAATTTACTTAGATATATTTTTACTCTTAAAGATATGTTTTCTGCTGAGGATTTCATCAAAGCGGCAGAATATAATGTTGTATTTGAACGCTACAACAGGCAAAAAGTCCACCCTACAGTAAAAGGGAATCAATCGTTCACTTTCGGCAATTCCGCATTGAGCGGTAAAGTTATTCCTCCATCAAAATGCTTGTCCAATTTGCCTGGACAAATGTGGCTGGCCATTAATCTACTTGACCAGGGCGAATGGAAAGAACATCACATTCCTTTTCACAGTGCAAGATTCTATGAAGAAATCTATGCAACAAGTGACAATCAAAATAATCCCGTAGATTTGCGAACTAAACGTTTTGGCTGCTCTCTTAACAAGACTTTTTCTGCTGCTGACATCGAAAAGGTGAAAGAAAGTGCCAAGAAAAAACATGGCAAAGCAGCTAAACGTATTTTGAGAGCCAAAAACACCAATACAGCCGTAAATTGGGTTGATTGCGGTTTTATGTTGGAAAAAACAGAGGTTAACTTTAAAATTACTGTTAACTACAAACTTCCAGACCAAAAGTTGGGAAAATTTGAACCAATTGTTGGGACGAAGATTTTGGCTTATGACCAAAATCAAACCGCTCCTGATGCTTATGCGATTCTTGAAATTTGCGATGATAGCGAAGCTTTTGATTACAAGGGATATAAAATCAAATGTTTGTCTACTGGTGATTTGGCTTCAAAGTCATTGACCAAACAAACAGAAGTTGATCAGCTAGCTTATAAGGGTGTGGACAAAACTAGCAATTTTTACAAAAAGTGGAAACAGCAACGAAGGCTTTTTGTCAAAAGTCTTAACATTCCAGATGCCCTAAAGAGTTTTGAAAACATCAATAAAGAATATCTTTATGGGTTCAACAATTCGTATCTGAAGTTGCTTAAACAAATTTTACGGGGCAAATTTGGACCAATTCTTGTTGATATTCGACCAGAACTTATTGAAATGTGTCAGGGAATTGGCTCTATCATGCGATTGTCTAGTCTAAACCATGATAGTTTGGACGCAATTCAATCTCTCAAATCCTTGCTTCACTCCTATTTTGATCTCAAAGTAAAGGAAGAAATCAAAACAGAAGAATTGAGAGAAAAAGCAGATAAAGAGGTTTTTAAGTTGCTTCAACAAGTGATTCAAAAACAAAAGAATAAACGCAAAGAAAAAGTTAATAGAACTGTTGATGCCATTTTGACTTTGGCGGCTGATGAGCAAGTACAAGTCATTGTAGGAGAGGGAGATCTTTGTGTTTCCACCAAAGGAACAAAAAAGAGACAAAACAACAGAACCATTGATTGGTGTGCCAGAGCAGTTGTGGAAAAACTAGAAAAAGCATGCAAACTACATGGGTTGCATTTTAAGGAAATTCCACCACATTACACTTCACATCAAGATTGTTTTGAACACAACAAGGATATTGAAAATCCAAAAGAAGTCATGAAGTGTCGTTTCAATAGCAGCGAAAATGTAGCTCCTTGGATGATCAAGAAATTCGCAAATTATCTTAAATGCGAAACAAAATATTATGTTCAAGGAATGCAAGATTTTCTAGAGCATTATGGTCTAGTAGAATACAAAGATCACATCAAAAAGGGAAAAATCTCAATTGGGGATTTTCAAAAACTTATCAAACTTGCTCTTGAGAAAGTTGGAGAAAAAGAGATTGTTTTTCCATGTAAAGGTGGTAGAATCTATTTGTCAACCTATTGCTTAACAAATGAGTCTAAACCCATTGTTTTCAATGGCAGAAGATGCTATGTTAATAATGCAGACCATGTTGCTGCGATTAATGTTGGCATTTGTCTTTTGAATTTTAATGCGAGAGCCAAGGTGGCGGAAAAAACCCCTTGA
SEQ ID NO:30 >Wa2Cas12iコード配列
ATGGCTAAGAAGGATTTTATCGCTCGTCCCTACAATTCATTCCTGCTCCCCAACGACAGAAAGCTTGCTTATCTGGAAGAAACTTGGACTGCCTACAAGTCAATCAAAACAGTACTGCACCGTTTCCTCATCGCAGCATACGGCGCTATTCCCTTCCAGACCTTTGCAAAAACCATCGAAAACACACAAGAAGACGAATTGCAATTGGCATATGCCGTTAGAATGTTCAGACTAGTTCCAAAAGACTTCTCCAAGAATGAAAACAACATACCCCCCGATATGCTCATTAGCAAGCTTGCTAGCTATACAAATATAAATCAATCACCAACCAATGTCTTGAGCTATGTAAACAGCAACTACGATCCAGAAAAGTATAAGTGGATCGACTCACGCAACGAAGCCATCTCATTGTCCAAAGAAATCGGCATCAAACTCGATGAGTTGGCAGACTACGCTACCACCATGCTTTGGGAGGACTGGCTTCCACTTAACAAAGACACAGTCAACGGTTGGGGCACCACTAGCGGCCTATTCGGCGCAGGaaaaaaaGAGGATCGTACCCAAAAGGTACAAATGCTCAACGCATTGCTTTTGGGGCTTAAAAACAACCCTCCCAAGGACTACAAACAGTATTCGACCATCCTTCTCAAGGCATTTGATGCCAAATCATGGGAAGAGGCTGTTAAAATTTATAAAGGCGAATGCTCAGGTAGAACCAGTAGCTACCTGACAGAAAAGCATGGAGACATTTCCCCAGAAACTTTGGAAAAACTAATTCAAAGTATTCAGAGAGATATTGCTGACAAACAACACCCCATCAATCTACCTAAAAGAGAAGAAATTAAGGCATACTTGGAAAAGCAGAGTGGTACTCCATACAATCTCAATCTCTGGTCACAAGCCCTACACAACGCTATGTCTTCTATCAAGAAGACAGATACTCGCAATTTCAATAGCACACTAGAAAAATATGAAAAAGAAATTCAACTCAAGGAGTGCTTGCAAGATGGTGATGATGTAGAATTACTTGGCAACAAATTCTTTTCATCTCCATATCATAAGACCAACGATGTCTTTGTCATTTGCTCTGAGCATATCGGCACCAATCGCAAATACAATGTCGTTGAGCAGATGTACCAACTCGCTAGCGAACATGCCGATTTTGAAACAGTGTTCACTCTCCTCAAAGATGAATACGAAGAAAAAGGTATCAAAACCCCAATCAAAAACATTCTTGAATACATTTGGAACAACAAGAATGTGCCTGTAGGCACTTGGGGTAGAATTGCCAAATACAATCAGCTGAAAGATAGATTGGCTGGAATCAAAGCCAATCCTACCGTTGAATGCAACCGTGGCATGACATTTGGCAATTCTGCGATGGTTGGCGAAGTTATGCGATCCAATCGCATTTCGACCAGCACGAAGAATAAAGGCCAGATTTTGGCCCAAATGCACAACGATAGGCCCGTTGGGTCAAACAACATGATCTGGCTGGAAATGACGCTTTTAAACAACGGGAAATGGCAAAAACACCACATCCCGACCCACAATAATAAGTTCTTTGAAGAAGTCCATGCTTTCAATCCAGAACTGAAGCAATCCGTGAATGTGCGAAATAGAATGTATCGTTCTCAAAACTATTCGCAACTTCCAACATCTCTGACCGATGGGCTGCAAGGCAACCCAAAAGCCAAGATTTTCAAGCGTCAATATCGTGCGCTCAATAACATGACGGCAAACGTGATTGATCCAAAGTTGAGTTTTATTGTTAACAAAAAGGATGGCAGATTCGAAATTAGCATCATTCACAATGTTGAAGTGATCAGGGCCAGACGAGATGTTCTGGTCGGGGATTACTTGGTCGGCATGGATCAAAACCAGACTGCCAGCAACACTTACGCTGTCATGCAGGTGGTTCAGCCAAACACTCCTGACTCCCATGAATTTCGCAACCAATGGGTGAAGTTTATTGAGAGTGGCAAGATTGAATCTTCTACTCTCAATTCTAGAGGCGAATACATTGACCAGTTGAGTCATGATGGCGTGGATTTGCAAGAAATCAAGGATTCTGAATGGATTCCAGCTGCTGAGAAATTCTTAAACAAGTTGGGAGCAATCAACAAGGACGGCACTCCAATCAGCATCTCTAATACTTCAAAGAGGGCTTACACCTTCAACTCCATATATTTCAAAATCTTATTGAATTATCTTCGTGCTAATGATGTTGATCTGAATTTGGTGAGAGAGGAGATTCTGCGTATTGCCAACGGCAGGTTTTCGCCCATGCGTCTGGGTAGTCTGTCGTGGACTACTCTTAAGATGTTGGGCAACTTTAGAAATTTGATTCATAGTTATTTCGATCACTGTGGTTTCAAGGAAATGCCTGAAAGGGAATCTAAAGACAAAACCATGTACGATCTGTTGATGCATACCATCACAAAGCTGACAAACAAGCGTGCCGAAAGAACGAGTAGGATTGCTGGTTCTTTGATGAATGTAGCCCATAAGTATAAAATTGGCACAAGCGTTGTGCATGTTGTCGTTGAAGGCAGTCTAAGCAAGACCGACAAATCCAGCAGCAAGGGTAATAACCGAAATACCACTGATTGGTGCTCAAGGGCTGTAGTCAAAAAGCTGGAAGACATGTGCGTCTTTTATGGGTTCAATTTGAAAGCAGTTTCGGCGCATTACACTAGTCACCAAGACCCATTGGTTCATCGGGCTGATTATGATGATCCCAAGCTTGCTTTGCGGTGTCGATATTCGTCGTATAGTCGGGCTGATTTTGAAAAGTGGGGTGAGAAGTCGTTTGCTGCTGTGATTCGTTGGGCTACCGACAAAAAGAGCAATACTTGTTACAAGGTTGGGGCTGTGGAGTTCTTTAAAAATTATAAAATCCCAGAGGACAAGATCACCAAGAAGCTGACCATAAAGGAATTCCTTGAGATAATGTGTGCAGAGTCACACTATCCGAATGAGTATGACGATATTTTGATTCCTCGCCGTGGAGGCAGGATTTATCTGACAACGAAGAAGTTGCTAAGTGATTCGACCCACCAAAGAGAAAGTGTGCATAGTCACACGGCTGTTGTCAAAATGAACGGGAAAGAGTATTATTCCTCAGATGCAGATGAGGTGGCTGCGATCAACATCTGCCTACATGACTGGGTTGTCCCACTGAATTGGACCAATCACTGCCTACCTGCTGGCTGGTGCTCTGACCACCTGAAAGAATGTGTGCAATGTCACACTCCAGACCCAGTACGAATATCCATGTAA
SEQ ID NO:31 >SiCas12iコドン最適化コード配列
ATGAGTTCTGATGTGGTGCGGCCTTATAACACAAAGCTGCTCCCAGATAACAGAAAGCACAATATGTTCCTGCAGACCTTCAAGCGGCTGAACAGCATCTCTCTGAACCACTTCGACCTGCTGATCTGCCTGTACGCTGCAATCACCAACAAGAAGGCCGAGGAATACAAGTCTGAAAAGGAAGCCCACGTGACCGCCGATAGCCTGTGTGCCATCAATTGGTTCAGACCCATGAGCAAGAGATACAGCAAATACGCCACCACCACCTTCAACATGTTAGAACTGTTTAAGGAGTACAGCGGCCACGAGCCTGATGCCTATTCCAAGAACTACCTGATGAGCAATATCGACAGCGACAGATTCGTGTGGGTGGATTGTAGGAAGTTCGCTAAGGACTTTGCCTATCAGATGGAACTGGGTTTCCACGAGTTCACCGTGTTGGCCGAAACCCTGCTGGCTAATTCTATCCTGGTGCTGAACGAGAGCACCAAGGCCAATTGGGCTTGGGGAACCGTGTCTGCCCTGTACGGCGGCGGAGATAAGGAGGACAGCACACTGAAGAGCAAGATTCTGCTGGCCTTCGTGGACGCCCTGAACAACCACGAGCTGAAAACAAAGAGAGAAATCTTGAATCAAGTGTGTGAATCTCTGAAATACCAGAGCTACCAGGACATGTACGTGGATTTTAGAAGCGTGGTTGACGAAAACGGCAACAAGAAGTCTCCTAACGGCTCTATGCCTATCGTGACCAAGTTCGAGACAGACGACCTGATCAGCGACAACCAAAGAAAGGCCATGATCAGCAACTTCACTAAGAACGCCGCTGCCAAGGCAGCTAAGAAACCTATCCCTTACTTGGACCGCCTGAAGGAGCACATGGTGTCCCTGTGCGACGAGTACAATGTGTATGCCTGGGCCGCGGCCATCACAAACAGCAACGCCGACGTGACCGCCCGGAATACCAGAAACCTGACATTCATCGGCGAACAGAACAGCAGACGAAAGGAACTGAGCGTGCTGCAGACAACAACCAACGAGAAGGCTAAGGACATCCTGAACAAGATCAACGACAACCTGATTCAGGAGGTGCGGTACACCCCTGCCCCTAAGCACCTGGGCAGAGATCTGGCCAACCTGTTTGATACACTGAAGGAAAAGGACATCAACAACATCGAGAACGAAGAAGAGAAACAGAACGTGATCAATGACTGTATCGAGCAGTACGTGGACGATTGCAGAAGCCTCAACCGGAACCCCATCGCAGCCCTCCTGAAGCACATCTCTAGGTACTACGAGGATTTCAGCGCCAAGAATTTCCTGGACGGCGCCAAGCTGAACGTGCTGACTGAGGTGGTGAACCGGCAGAAGGCCCACCCCACCATCTGGAGCGAGAAGGCTTACACCTGGATCAGCAAGTTCGACAAGAACCGGAGACAGGCCAACAGCAGCCTGGTCGGATGGGTTGTGCCCCCCGAGGAGGTGCACAAGGAGAAAATCGCCGGACAGCAGAGCATGATGTGGGTGACCCTCACCCTGCTGGACGACGGCAAGTGGGTCAAACATCACATCCCCTTCAGCGACAGCAGATACTACAGCGAAGTGTACGCCTACAACCCTAATCTGCCTTATCTGGACGGAGGCATCCCAAGACAGAGCAAGTTCGGCAACAAACCAACAACCAACCTGACAGCCGAGTCCCAGGCCCTCCTGGCTAATTCTAAGTACAAGAAAGCCAACAAGAGCTTCCTGCGGGCTAAAGAGAATGCCACACACAACGTGCGGGTGTCCCCTAACACCTCTCTGTGCATTAGACTGCTGAAGGACAGCGCCGGAAACCAGATGTTCGACAAAATCGGCAACGTGCTCTTCGGCATGCAGATCAACCACAAGATCACCGTGGGAAAACCTAACTACAAGATCGAGGTGGGCGACAGATTCCTGGGCTTCGATCAGAACCAGAGCGAGAACCACACCTACGCCGTGCTGCAGAGAGTGTCCGAGAGCAGTCACGACACCCACCACTTTAACGGCTGGGACGTGAAGGTGCTGGAAAAGGGCAAAGTGACCAGCGATGTGATCGTGCGGGACGAGGTCTACGACCAACTGTCTTACGAGGGCGTCCCCTACGATAGCAGCAAGTTCGCCGAGTGGCGGGACAAGCGCAGAAGATTTGTGCTTGAGAACCTGAGCATCCAGCTGGAAGAGGGCAAGACCTTCCTGACAGAGTTCGACAAGCTGAATAAGGACAGCCTGTACCGCTGGAACATGAACTACCTGAAACTGCTGAGAAAGGCCATCCGGGCCGGAGGCAAAGAGTTCGCCAAGATCGCTAAGACAGAGATCTTCGAGCTGGCGGTGGAAAGATTCGGCCCTATTAACCTGGGCAGCCTGTCCCAGATCAGCCTTAAGATGATTGCCTCCTTTAAGGGCGTGGTCCAGTCCTACTTCTCCGTGAGCGGCTGCGTGGATGATGCCTCCAAAAAGGCCCATGATTCTATGCTGTTCACATTTATGTGCGCCGCCGAAGAAAAGCGGACCAACAAGAGAGAAGAAAAGACCAACAGAGCCGCCAGCTTTATCCTGCAAAAAGCCTACCTGCATGGCTGCAAGATGATCGTGTGCGAGGACGACCTTCCTGTGGCCGACGGCAAGACAGGCAAAGCCCAGAATGCCGACCGGATGGACTGGTGCGCCAGAGCCCTGGCCAAGAAGGTGAACGACGGCTGTGTTGCCATGAGCATCTGCTACAGAGCTATCCCTGCCTACATGAGCAGCCACCAGGACCCCTTTGTGCACATGCAGGATAAGAAAACCAGCGTGCTGCGGCCTAGATTCATGGAAGTTAATAAGGATAGCATCAGAGACTACCACGTGGCGGGCCTGAGAAGAATGCTGAACAGCAAGAGTGACGCTGGCACCAGTGTTTATTACCGGCAAGCTGCCCTGCATTTCTGCGAAGCCCTGGGCGTGAGCCCTGAACTGGTGAAAAACAAGAAAACCCACGCCGCCGAACTGGGCAAGCACATGGGCAGCGCTATGCTGATGCCCTGGAGAGGCGGTAGAGTGTACATCGCCAGCAAAAAGCTGACCTCCGATGCCAAATCAGTGAAGTACTGCGGCGAGGATATGTGGCAGTACCACGCCGATGAGATCGCCGCTGTTAACATCGCCATGTATGAGGTGTGCTGCCAGACCGGCGCTTTCGGAAAGAAACAGAAAAAATCGGACGAGCTGCCTGGA
SEQ ID NO:32 >Si2Cas12iコドン最適化コード配列
ATGAGCTCTGACGTGGTGCGGCCTTACAATACCAAGCTGCTGCCAGACAACCGGAAGTACAACATGTTTCTGCAGACCTTCAAGAGACTGAACCTGATCTCCAGCAACCACTTCGACCTGCTGGTGTGCCTGTACGCCGCTATCACCAACAAGAAAGCTGAGGAATACAAGAGCGAAAAAGAGGATCACGTTACAGCCGACAGCCTGTGTGCCATCAACTGGTTCCGGCCTATGTCTAAGCGGTACATCAAGTACGCTACAACCACCTTTAAGATGCTGGAACTGTTCAAGGAGTACAGCGGCCACGAGCCTGACACCTACAGCAAGAACTACCTGATGTCTAATATCGTGAGCGATAGGTTCGTGTGGGTGGACTGCCGGAAATTCGCTAAGGACTTCGCCAATCAAATGGAACTGTCCTTCCACGAGTTCACCACCCTGAGTGAAACCCTGCTGGCTAACAGCATCCTGGTGCTAAATGAGTCTACAAAGGCCAACTGGGCCTGGGGCGCCGTGAGTGCTCTGTACGGCGGCGGCGACAAAGAGGACTCTACACTGAAAAGCAAGATCCTTCTGGCCTTTGTGGACGCCCTGAACAACCCTGAACTGAAAACACGTAGAGAAATTCTGAACCACGTGTGCGAATCTCTGAAGTATCAGAGCTACCAGGACATGTACGTCGATTTCAGAAGCGTGGTCGATGATAAGGGCAACAAGAAGAGCCCAAACGGCAGCATGCCTATCGTGACCAAGTTCGAGAGCGATGATCTGATCGGCGATAACCAGAGAAAGACAATGATCTCTAGCTTTACGAAGAACGCCGCCGCCAAGGCCAGCAAGAAGCCCATCCCATACCTGGACATCCTCAAGGACCACATGATCAGCCTGTGTGAAGAGTACAACGTGTATGCCTGGGCCGCTGCCATCACCAACAGCAACGCCGACGTGACAGCCCGCAACACCAGAAACCTGACATTCATCGGAGAACAGAACACCCGGAGGAAGGAACTGAGCGTGCTGCAGACAAGCACCAACGAGAAGGCTAAAGACATCCTGAACAAAATCAACGACAACCTGATCCCTGAGGTGCGGTACACACCTGCCCCTAAGCACCTGGGTCGGGACCTGGCCAATCTGTTCGAGATGTTCAAGGAAAAGGACATCAACCAGATCGGCAACGAGGAGGAGAAGCAGAACGTGATCAACGACTGCATCGAACAGTACGTGGACGACTGTAGAAGCCTGAACAGAAACCCAGTGGCCGCCCTGCTAAAGCACATCAGCGGATACTACGAGGATTTCAGCGCCAAAAATTTCCTGGACGGCGCCAAGCTGAATGTGCTGACCGAAGTGGTCAACAGACAGAAGGCTCATCCTACAATCTGCAGCGAAAAGGCCTACACCTGGATTAGCAAGATCGATAAGAACCGGCGGCAGGCCAATTCCTCCCTGGTCGGATGGGTGGTGCCCCCCGAGGAAGTGCACAAGGAAAAGATTGCCGGCCAGCAGAGCATGATGTGGGTGACACTGACACTGCTGGACGACGGCAAGTGGGTTAAGCACCACATCCCCTTCGCCGATTCTAGATACTACAGCGAGGTGTATGCCTATAATCCTAACCTGCCTTATCTCGAGGGCGGCATCCCCAGACAGTCTAAGTTTGGCAACAAACCTACCACCAACCTGACCGCCGAATCTCAGGCCCTGTTGGCCAACTCCAAGCACAAAAAAGCCAACAAGACCTTCCTGAGGGCCAAAGAGAACATCACCCACAACGTGAGAGTGTCTCCTAATACCAGCCTGTGCATCAGACCACTGAAGGACTCTGCTGGCAATCAAATGTTCGACAACATCGGCAACATGCTGTTCGGTATGCAGATCAACCATAGAATCACCGTAGGAAAACCCAACTACAAGATAGAGGTGGGCGATAGATTTCTCGGATTCGACCAGAATCAGAGCGAGAACCACACCTACGCAGTGCTGCAAAGAGTATCTGAGAGCAGCCACGGCACACACCACTTTAACGGCTGGGACGTGAAAGTGATCGAGAAGGGCAAGGTGACCAGCGACGTGGTGGTGCGGGACGAGGTGTACGATCAGCTGTCCTACGAAGGCGTTCCTTACGACTCCCCTAAGTTTACCGAATGGCGGGAAAAACGGAGAAAGTTCGTGCTGGAAAACATGAGCATCCAGATCGAGGAGGGCAAGACTTTTCTGACCGAGTTCGATAAGCTGAATAAAGACAGCCTGTATAGATGGAACATGAACTACATGAAACTGCTGAGGAAGGCCATCAGAGCCGGCGGAAAAGAGTTCGCCAAGATCACCAAGGCCGAGATCTTCGAACTGGGCGTGATGAGATTCGGGCCTATGAACCTGGGCAGCCTGAGCCAAGTGAGTCTCAAGATGATCGCCGCCTTCAAGGGAGTGATCCAGAGCTACTTCTCTGTGTCTGGCTGCATCGATGATGCTTCCAAGAAGGCCCACGACAGCATGCTGTTCGCCTTCCTGTGTAGCGCCGATGAAAAGCGGACCAACAAGCGGGAAGAAAAGACCAATCGGGCCGCCAGCTTCATCCTTCAAAAGGCCTACTCCCACGGCTGTAAAATGATTGTGTGCGAGGACGACCTTCCTATCGCCGATGGCAAAGTGGGAAAGGCCCAGAACGCCGACAGAATGGACTGGTGCGCCCGGAGCCTGGCTAAGAAAGTGAACGATGGCTGCGTGGCCATGTCCATCTGCTACAGAGCCATCCCCGCCTACATGAGCTCCCACCAGGACCCCTTCACCCATATGCAGGATAAGAAAACCAGCGTGCTGCGGCCTAGATTTATGGAAGTTGGCAAGGACAGCATCCGGGACCACCACGTGGCTGGCCTGAGACGGATGCTGAATAGCAAGGGCAACACAGGCACCAGCGTGTACTACAGAGAGGCCGCACTGCGCTTCTGCGAGGCCCTGGGCGTGCTGCCTGAGCTGGTGAAGAATAAGAAAACACACGCCAGCGAGCTGGGAAAGCATATGGGCAGCGCAATGCTGATGCCTTGGAGAGGCGGCAGAATCTACGTGGCCAGCAAGAAACTGACAAGCGACGCCAAATCTATCAAGTACTGCGGCGAGGATATGTGGCAGTACCACGCCGACGAGATCGCTGCTATCAACATCGCCATGTACGAGGTC
SEQ ID NO:33 >WiCas12iコドン最適化コード配列
ATGGGCATCTCTATCAGCAGACCTTACGGCACCAAACTGCGGCCTGATGCCAGAAAGAAAGAAATGCTGGATAAATTCTTCACCACCCTGGCCAAAGGCCAGAGAGTGTTCGCCGACCTGGGCCTGTGCATCTACGGCAGCCTGACACTGGAGATGGTGAAAAGACTGGAGCCTGAGAGCGACAGCGAGCTGGTGTGCGCCATCGGCTGGTTCCGGCTGGTGGATAAAGTGACCTGGAGCGAAAACGAGATCAAGCAGGAAAACCTGGTGCGGCAGTACGAAACCTACTCTGGCAAGGAAGCCAGCGAGGTGATCAAGACCTATCTGAGCAGTCCCTCTTCTGATAAGTACGTGTGGATAGATTGCAGACAGAAGTTTCTGCGGTTCCAGCGGGACCTGGGCACAAGAAACCTGTCCGAGGATTTCGAGTGCATGCTGTTCGAGCAGTATCTGAGACTGACTAAGGGCGAGCTGGATGGACACACCGCCATGAGCAATATGTTCGGCACCAAGACAAAGGAGGATAGAGCCACCAAGCTGCGATACGCCGCCAGAATGAAGGAGTGGCTGGAAGCTAATGAGGAGATCACCTGGGAACAGTACCACCAGGCCCTGCAGGATAAGCTCGACGCGAACACTCTGGAGGAAGCCGTGGATAACTACAAGGGCAAGGCTGGCGGAAGCAACCCTTTCTTTAGCTACACCCTGCTGAACCGAGGACAGATCGACAAGAAAACCCACGAGCAGCAGCTGAAGAAGTTCAACAAGGTGCTGAAAACCAAGTCTAAGAACCTGAACTTCCCTAACAAAGAGAAGCTAAAGCAGTACCTCGAGACAGCGATCGGAATCCCCGTGGACGCTCAGGTGTACGGCCAGATGTTTAACAACGGCGTGTCTGAGGTTCAACCTAAGACAACCAGAAACATGTCCTTTAGCATGGAAAAGCTGGAGCTCCTGAACGAACTGAAGAGCCTGAACAAGACCGACGGATTCGAGAGAGCCAACGAGGTGCTCAATGGCTTCTTCGACAGCGAACTGCACACAACAGAGGACAAATTCAATATCACAAGCAGATACCTGGGCGGCGACAGAAACAACCGGCTCCCTAAGCTGTATGAGTTGTGGAAGAAGGAGGGCGTGGACAGAGAGGAGGGCATCCAGCAATTTTCCCAAGCCATCCAGGACAAGATGGGCCAAATCCCTGTTAAGAACGTGCTCCGCTACATCTGGGAGTTCCGGGAAACCGTGAGCGCAGAAGATTTCGAGGCTGCTGCCAAGGCCAACCAGCTGGAGGAAAAGATCACCCGGACCAAAGCCCACCCCGTCGTGATCAGCAACAGATACTGGACCTTCGGGTCCAGCGCCCTGGTGGGCAACATCATGCCTGCCGACAAGATGCACAAGGACCAGTACGCCGGCCAGAGCTTTAAGATGTGGCTGGAAGCTGAGCTGCACTACGACGGCAAgAAGGTGAAGCACCACCTGCCCTTCTACAATGCCAGATTCTTCGAGGAGGTGTACTGCTACCACCCATCAGTGGCCGAAGTGACCCCTTTTAAGACCAAGCAGTTCGGATATGCCATCGGCAAGGACATCCCAGCTGACGTGTCTGTGGTGCTGAAAGATAACCCCTACAAGAAGGCCACCAAGAGATTTCTGAGGGCCATCAGCAATCCAGTCGCCAACACTGTGGACGTGAACAAGCCTACAGTGTGTAGCTTCATGATCAAGCGGGAAAACGACGAGTACAAGCTGGTGATCAACAGAAAgATCGGAGTGGACAGACCCAAGAGAATCAAGGTGGGCAGAAAAGTGATGGGCTACGACAGAAACCAGACCGCCAGCGACACATATTGGATCGGCGAGCTGGTTCCTCATGGGACCACAGGCGCCTACAGAATCGGAGAATGGAGCGTGCAATACATTAAAAGCGGCCCTGTGCTTTCTTCTACACAGGGCGTGAACGATTCTACCACCGATCAGCTGATCTACAACGGAATGCCCAGCAGCAGCGAGCGGTTCAAGGCCTGGAAGAAGTCCAGAATGAGCTTCATCCGGAAGCTGATCAGACAGCTGAATGCCGAAGGCCTGGAAAGCAAAGGACAGGACTACGTGCCCGAGAACCCTAGCAGCTTCGACGTCAGAGGAGAAACACTGTACGTGTTTAACAGCAACTACATGAAAGCCCTGGTGTCCAAGCACAGGAAGGCCAAgAAGCCCGTGGAAGGCATCCTGGAAGAAATCGAGGCTCTGACCTCCAAAGCCAAGGACAGCTGCAGCCTGATGCGCCTGAGCTCTCTGAGCGACGCCGCCATGCAGGGCATCGCCAGCCTGAAGTCCCTGATCAACTCTTATTTCAACAAGAATGGCTGTAAAACCATCGAGGACAAGGAAAAGTTCAACCCCGACCTGTACGTGAAGCTGGTCGAGGTCGAACAGAAAAGAACCAACAAGCGGAAGGAGAAGGTGGGCCGGATCGCCGGCAGCCTGGAACAGCTCGCCCTGCTGAATGGTGTTGACGTGGTGATCGGCGAGGCCGATCTGGGGGAAGTCAAGAAAGGCAAGTCTAAgAAGCAGAATAGCAGAAACATGGACTGGTGCGCCAAGCAGGTCGCTGAGCGCCTGGAATACAAACTGACCTTCCACTGTATCGGCTACTTCGGCGTGAACCCTATGTACACAAGCCACCAAGATCCTTTTGAACACCGGAGAGTGGCCGACCACCTGGTGATGAGAGCTAGGTTCGAAGAGGTGAACGTTAGCAACGTAAGCGAATGGCACATGAGAAACTTCAGCAATTACCTGCGGGCCGACAGCGGCACAGGTCTGTACTACAAGCAAGCCACCCTGGACTTTCTGAAACATTACGACCTGGAGGAGCACGCCGACGACCTGGAGAAACAGAATATCAAGTTCTACGATTTCAGAAAGATCCTGGAGGACAAGCAGCTGACATCTGTTATAGTGCCTAAGCGGGGCGGCAGAATCTACATGGCCACAAACCCCGTGACATCAGACAGCACCCCTGTGACCTACGCCGGCAAGACCTACAATAGATGCAACGCCGATGAGGTGGCTGCCGCTAATATCGCTATTTCTGTGCTGGCCCCTCACAGCAAGAAGGAAGAgAAAGAGGATAAGATCCCTATCATCAGCAAGAAGCCTAAGTCCAAGAACACCCCAAAGGCTAGAAAGAACCTGAAAACAAGCCAGCTGCCTCAGAAG
SEQ ID NO:34 >Wi2Cas12iコドン最適化コード配列
ATGGCCAGCAAACACGTGGTGCGGCCTTTTAACGGCAAAGTGACCGCTACCGGCAAGCGGCTGGCCTACCTGGAGGAAACCTTTCATTACCTGGAGAAGGCCGCCGGCGGCGTGTCTACCCTGTTCGCCGCTCTGGGCAGCTACCTCGACGCCACAACCATCAGCAACCTGATCAACAAgAACCAGGACTTGGCTGTCGTGATCTTCCGGTACCACGTGGTGCCTAAGGGCGAAGCCCACACACTGCCCGTGGGCACCGACATGGTGTCAAGGTTCGTGGCCGACTACGGCATGGAGCCTAATGAGTTCCAAAGAGCCTACCTGGATAGCCCCATCGATCAGGAGAAGTACTGCTGGCAGGACAATCGGGACGTGGGATGTTGGCTGGGCGAACAGCTGGGTGTTTCTGAGGCCGACATGCGGGCTATCGCCGTGACTTTTTACAACAACCAGATGCTGTACGACTGTGTGAAGGGAACTGGCAGCGGCAATGCCGTCTCTCTGCTGTTTGGCAGCGGCAAgAAGTCCGACTACAGCATGAAGGGAGTCATTGCCGGCAAGGCTGCCTCAGTGCTGGCTAAGTATAGACCTGCCACCTACCAGGATGCCAGAAAGATGATCCTGGAAGCTAATGGCTTCACCAGCGTGAAAGATCTGGTCACATCTTACGGCATCACCGGCAGAAGCAGCGCCCTGCAAATCTTCATGGAAGGCATTGAAAGCGGACCTATCTCCTCCAAAACATTGGACGCCAGAATCAAGAAGTTCACGGAAGATAGTGAGCGGAACGGCCGCAAGAACCTGGTCCCCCACGCCGGCGCCATTAGAAATTGGCTGATCGAGCAGGCCGGTTCTTCTGTGGAAAACTACCAAATGGCCTGGTGCGAGGTTTACGGCAACGTGAGCGCTGACTGGAACGCCAAGGTGGAAAGCAACTTCAACTTCGTGGCCGAGAAGGTGAAAGCCCTGACCGAGCTGAGCAATATCCAGAAGAGCACCCCTGATCTGGGCAAGGCTCTGAAACTGTTTGAGGAGTACCTGACCACATGCCAGGACGAGTTCGCCATCGCCCCATACCACTTCAGCGTGATGGAAGAGGTGCGGATGGAAATGGCCACAGGCAGAGAGTTTAACGATGCATACGACGACGCTCTGAACAGCCTGGACATGGAAAGCAAGCAGCCTATCCAGCCTCTGTGTAAATTCCTGATCGAGCGGGGCGGAAGCATCAGCTTCGACACCTTCAAGAGCGCCGCCAAATACCTGAAAACCCAGAGCAAGATTGCCGGCAGATACCCTCATCCATTCGTGAAGGGAAACCAGGGCTTCACATTCGGCTCCAAgAACATCTGGGCCGCCATAAACGACCCCATGATGGAGTACGCCGACGGCCGGATCGCCGGCGGCTCTGCCATGATGTGGGTCACCGCTACCCTGCTGGACGGCAAGAAGTGGGTGAGACACCACATCCCCTTCGCCAACACAAGATACTTCGAGGAGGTTTACGCCAGCAAGAAGGGCCTGCCTGTCCTGCCGTGCGCCAGAGATGGCAAGCACAGCTTTAAGCTGGGTAACAACCTGAGCGTGGAGAGAGTGGAAAAGGTGAAGGAAGGCGGCAGAACAAAGGCCACAAAGGCTCAGGAGAGAATCCTGAGCAACCTGACACACAACGTGCAGTTCGACAGCAGCACCACCTTCATCATCCGGAGACAGGAGGAATCCTTTGTGATCTGCGTGAACCACAGACACCCCGCCCCTCTGATGAAgAAGGAGATGGAAGTGGGCGACAAGATCATCGGCATCGACCAGAACGTGACCGCCCCTACCACCTACGCCATCGTGGAGAGGGTGGCCAGCGGAGGCATCGAGCGGAACGGCAAACAGTACAAGGTGACAGCCATGGGCGCCATCTCCTCTGTGCAGAAAACCAGAGGCGGAGAGGTGGACGTGCTGAGCTACATGGGTGTGGAGCTGTCCGACTCGAAGAACGGATTCCAGAGCCTGTGGAACAAGTGTCTGGACTTCGTGACCAAGCACGGCACAGAGAACGACGTGAAGTACTACAACAACACAGCCGTGTGGGCCAACAAGCTTTACGTGTGGCACAAGATGTACTTCAGACTGCTCAAGCAACTGATGAGAAGAGCCAAGGACCTGAAGCCTTTCAGAGATCACCTGCAACACCTGCTGTTCCACCCTAACCTGTCTCCTCTGCAGCGGCATAGCCTGTCTCTTACAAGCCTGGAGGCTACCAAGATCGTGCGCAATTGCATCCACAGCTATTTCAGCCTTCTCGGGCTGAAAACCCTGGATGAGAGAAAGGCAGCCGACATCAACCTGCTCGAGGTGCTGGAAAAGCTGTATGCCGGCCTTGTGGAAAGAAGGAAGGAGAGAACCAAGCTGACAGCCGGCCTGCTGGTCAGACTGTGCAACGAGCACGGAATTAGCTTTGCCGCCATCGAAGGCGACCTGCCTGTGGTGGGCGAAGGCAAGAGCAAGGCCGCTAACAACACCCAGCAGGACTGGACCGCCCGGGAACTGGAGAAGAGACTGAGCGAAATGGCTGAGGTGGTGGGCATCAAGGTGATCGCTGTTCTACCACACTACACCAGCCACCAGGACCCTTTCGTTTACTCCAAGAATACCAAGAAAATGCGGTGCAGATGGAATTGGCGGACCACCAAGACCTTCACCGATAGAGATGCCCTGAGCATCCGGAGAATCCTGAGCAAGCCCGAAACCGGAACCAACCTGTATTACCAGAAGGGACTGAAGGCCTTCGCCGAGAAGCACGGCCTGGATCTGGCCGAAATGAAGAAGCGGAAGGACGCCCAGTGGTACCTGGAAAGAATCCAGGATAAGAACTTCCTGGTGCCCATGAACGGCGGAAGAGTGTACCTGAGCAGCGTGAAGCTGGCCGGCAAAGAGACAATCGACATGGGCGGCGAGATTCTGTACCTGAACGACGCCGATCAGGTGGCCGCCCTCAACGTGCTGCTGGTGAAGATC
SEQ ID NO:35 >Wi3Cas12iコドン最適化コード配列
ATGGCCAAAAAGGAACACATTATCAGACCTTTCAAGGGCACCCTGCCACTGCGGGGGGACAGACTGAGATACCTGCAGGACACCATGAAGTACATGAAGAAGGTTGAGGACACCATCACCGAGCTGTGCGCCGCCGTGATCGCCTACGCCAAGCCTACAATCATCCAGCAGATTCTGGGAGAAGAAATCGAGACTACCTCCACCTTCTGCAGCTTCAGACTGGTTGGGATTCATGAGAACTTCACTATGCCCCTGACAACCAATATGATCAAGCACTTCCAGAAAACCTTCAACATCAATCCTTCTGAGAAGCAGGCCATCTATCTGAGCAGCGGATTTGATAGCGACAAATACAGATGGCAGGATACAAGCGAGGTGTCTAGAAATTTCGCTAATAAGTGCCGCCTGACCAACCAGGAGTTCCAGGAGTTCGCCGAGCAAGCTCTGTTAAACATGTGCTTTATCGGCTGTAGCGGATCTCCTGGCGCCACAAACGCCGTGTCCCAGATCTTCGGCACCGGCGAAAAGTCTGATTACCAGCGGAAGTCTCAGATCGCCAAGATCGCCGCTGATACCCTCGAGAACCACAAACCTAGCACATACGAGTCTGCTAGGCTGATGGTGCTGAACACACTGGGACACAAGACGATCGAAGATTGCGTGAACGACTACGGCGCTATTGGAGCCAAGTCCGCCTTCCGGCTGTTTATGGAAAGTAAAGAAATCGGCCCAATCACCAGCGAACAACTGACCACAAAAATCAAGAAATTCAGAGAGGACCACAAGAAGAACAGCATCAAGAAGCAGCTGCCTCATGTGGAAAAGGTGCGGAACGCACTACTGAGCCAGTTCAAGGAGCAGTACCTGCCAAGCGCCTGGGCCGAGGCCTGGTGTAACATCATGGGAGAGTTCAATAGCAAGCTGTCCAACAACAACAATTTCATCGACCAAAAAACCAAGATGGTCAACGACTGCGACAACATCAAAAAATCTAACCCCCAGCTGGATAAGGCCGTGAATATGCTGGACGAATGGAAGTACAAGAATTGGGACGACAATTCTGCCATCCACCCCTACCACATCGGCGATCTGAAAAAGCTGATGGCCATCTTCAACATCAACAATGAGGGCACCTTCGACGAGAGATTCAGCGCCAGCTGGGAGCAGTTTTCTACCAGCCTGGAGTACGGCGAGAAGCCCCCCGTGCGGGACCTGCTGGCCCACATCATCAAGAACATGAACGACCTGACTTACACCGACGTGATCAATGCCGCTAAGTTCCTGAAGCTGCAAGATAATATCAGAAACAAGTATCCTCACCCTTTTGTGATGCCTAACAAGGGATGTACCTTCGGCAAGGATAACCTGTGGGGCGAGATCAATGATCCTACAGCTAAGATCAAGTCCACAGAGGAAGTGGCCGGCCAGCGGCCTATGATGTGGCTGACCGCCAAGCTCCTGGACAACGGCAAATGGGTCGAGCACCATATCCCCTTCGCCTCTAGCAGATACTTCGCCGAAGTGTACTACACCAACCCCGCCCTGCCTACCTTACCCATCGCCCGCGACGGCAAGCACAGCTACAAGCTGACCAAGACCATCGACGCCAACACCGCCAAAACCCTGGTGAACAACCCTAGAGACAAGGCCGCCAAGCTCATTGCCAGAACAAAGGCGAACACCACCCACAACGTGAAGTGGATCAAACCTACATACAGAATCCAGAAAGAGAACAACCAGTTCGTGATCACCATCAATCACAGACACCCATGTATCACCCCTCCTAAGGAAATCATCTTGGGCGATAGAATCCTGTCATTCGACCAAAACGAGACAGCCCCTACCGCCTTTAGCATCCTGGAAAAGACCACCAAGGGCACAGAGTTCTGCGGCCACCACATCAAAGTGCTGAAAACCGGCATGCTGGAAGCCAAGATCAAGACATCGAAGAAATCCATCGACGCCTTCACCTACATGGGCCCTATGGAGGACGACCACGCCAGCGGTTTCCCCACCCTGCTGAACATCTGTGAAAAGTTCATCAGCGAGAACGGCGACGAGAAGGACAAGAGCTTCAGCAGCAGAAAGCTGCCTTTTAAGAGAAGCCTGTATTTTTTCCACGGCAGCCACTTCGACCTGCTGAAGAAGATGATCCGGAAGGCTAAAAATGACCCTAAGAAACTGAAGCTGGTGAGAATCCACATCAACGAGATCCTATTCAACAGCAACCTGTCCCCTATCAAGCTGCACAGCCTGAGCATCCACTCTATGGAGAACACAAAAAAGGTGATCGCTGCCATCTCTTGCTACATGAACGTACACGAGTGGAAAACCATCGATGAGCAAAAAAACGCCGACATCACACTGTACAACGCCAAGGAAAAGCTGTACAACAACCTGGTTAATAGAAGAAAGGAAAGAGTGAAGGTGACCGCTGGCATGCTGATCCGGCTGGCCCGGGAAAACAACTGCAGATTCATGGTGGGCGAAGCCGAACTGCCAACACAGCAGCAGGGCAAGAGCAAGAAGAACAACAACAGCAAGCAGGACTGGTGCGCCAGAGACATCGCACAGAGATGCGAGGATATGTGCGAGGTGGTGGGCATCAAATGGAACGGCGTGACACCTCACAACACCAGCCACCAGAATCCATTCATCTACAAGAACACCTCCGGCCAGCAGATGCGGTGCAGATACAGCCTGGTCAAAAAGTCTGAGATGACCGATAAGATGGCTGAGAAGATCCGGAACATTCTGCACGCCGAGCCTGTGGGCACAACCGCTTATTACAGAGAGGGCATCCTGGAGTTTGCCAAGCACCACGGACTGGACCTGGGCATGATGAAGAAAAGAAGAGATGCCAAGTATTACGACAACCTGCCCGACGAATTTCTGCTGCCGACAAGAGGCGGAAGAATATACCTGTCGGAAAACCAGCTGGGCGGCAACGAGACAATCGTGATCAACGGCAAGAAATACTTCGTGAATCAGGCCGACCAGGTGGCCGCCGTGAACATAGGGCTGCTGTACCTGCTGCCTAAGAAGAACCAGAGC
SEQ ID NO:36 >SaCas12iコドン最適化コード配列
ATGAGCGAGAAGAAATTCCACATCAGACCCTACAGATGCAGCATCTCCCCTAACGCCCGGAAGGCCGACATGCTGAAGGCTACCATCTCCTACCTGGACAGCCTGACCTCTGTGTTCAGAAGCGGGTTTACCGCCCTGCTGGCTGGAATCGATCCTAGCACCGTGTCCAGGCTGGCTCCTAGCGGCGCCGTGGGCAGCCCCGACCTGTGGAGCGCCGTGAACTGGTTCAGAATCGTGCCCCTGGCCGAAGCCGGCGATGCCAGAGTCGGCCAGGCAAGCCTGAAAAACCTGTTTAGAGGCTACGCCGGGCACGAACCTGACGAGGAAGCCAGCATCTACATGGAAAGCAGAGTGGACGACAAACGGCACGCCTGGGTCGACTGCAGGGCCATGTTCAGAGCTATGGCCCTCGAGTGCGGCCTGGAGGAAGCCCAGCTGGCTTCCGACGTGTTCGCCCTGGCCAGCAGAGAGGTGATCGTGTTCAAGGACGGCGAAATCAACGGCTGGGGCATCGCCAGTCTGCTGTTCGGCGAAGGAGAGAAGGCTGATTCTCAGAAAAAGGTGGCCCTGCTGAGAAGCGTGAGACTGGCCCTCGAGGGCGATTACGCTACCTACGAGGAGCTGTCTGGCCTGATGCTGGCCAAGACCGGCGCCAGCTCTGGCTCCGATCTGCTGGACGAGTACAAACGGTCCGAAAAAGGTGGCTCTTCTGGAGGCAGACATCCTTTCTTTGACGAGGTGTTTCGGAGAGGCGGCAGAGTTAAACAGGAGGAAAGAGAGAGACTCCTGAAAAGCTGCGACACCGCAATCCAGAAGCAGGGACAGGCCCTGCCTCTGTCTCACGTGGCCAGCTGGCGGCAGTGGTTCCTGAGAAGAGTGACCCTGCTGAGGAATAGACGGCAGGAGAGCTTCGCTGTGTGCATCACAAACGCCCTGATGGACCTGCAACCCAAGAACCTGAGAAATGTGCACTACGTGACCAACCCCAAGAGCGAGAAGGATAAGGGGGTTCTGGAACTGCGGGTGGACGTCAAAAACAACGAGGGCCCTGATGTGGCTGGCGCCCAAGCCGTGTTTGACGCCTACATGGCCAGACTTGCCCCAGATCTGAGATTCAGCGTGATGCCTAGACATCTGGGCTCACTGAAGGACCTGTACGCCTTGTGGGCCAAGCTGGGAAGAGATGAGGCGATCGAGGAGTACCTGGAAGGCTATGAGGGCCCTTTCAGCAAAAGACCAATCGCCGGCATCCTGCAGATCATCCACGCCCATCGGGGCAAGGTGGGGCACGACAGCCTGTTGAGAGCCGCCAGACTTAACAGAGCTATGGATAGACTGGAGAGAAAAAGAGCCCACGCCTGTGCCGCCGGCAACAAGGGATATGTGTACGGCAAGAGCAGCATGGTGGGCCGGATCAACCCTCAGAGCCTTGAAGTGGGCGGACGGAAGTCTGGCCGGAGCCCCATGATGTGGGTGACACTGGACCTGGTCGACGGCGACAGATTCGCCCAGCACCACCTGCCCTTTCAATCTGCCCGGTTCTTCAGCGAAGTGTACTGCCACGGAGACGGCCTGCCCGCCACCAGAGTGCCAGGCATGGTCAGAAACCGGAGAAATGGCCTGGCCATCGGAAATGGCCTGGGCGAGGGAGGACTGAGTGCTCTGAGAGCCGGAAGCGACCGGAGAAAGCGGGCTAACAAGAGAACACTGAGAGCCCTGGAGAATATCACCCACAACGTGGAAATCGATCCTAGCACATCCTTCACACTGAGAGAGGACGGCATCATCATCAGCCACAGAATCGAGAAGATCGAGCCTAAGCTGGTGGCTTTTGGAGACAGAGCTCTGGGCTTCGACCTGAACCAGACCGGCGCCCACACCTTTGCCGTGCTGCAGAAGGTGGACAGCGGCGGGCTGGATGTGGGTCACAGCCGGGTCAGCATTGTGCTGACCGGCACCGTGCGGAGCATCTGCAAGGGCAATCAGGCCAGCGGGGGCCGGGACTACGACCTGCTGTCTTACGACGGCCCCGAGAGAGATGATGGCGCTTTTACCGCCTGGAGGTCTGACAGACAGGCCTTTCTGATGAGCGCCATTCGGGAACTGCCTACCCCTGCCGAGGGCGAGAAAGATTACAAGGCCGACCTGCTGTCCCAGATGGCCAGCCTGGACCACTACCGGAGGCTGTACGCCTACAACAGAAAGTGCCTGGGCATCTACATCGGTGCCCTGCGGCGCGCCACAAGACGGCAGGCCGTTGCCGCCTTCAAGGACGAGATTCTGTCCATCGCCAACCACAGATGCGGCCCCCTGATGAGAGGCTCCCTGAGCGTCAACGGCATGGAAAGCCTGGCCAACCTGAAGGGCCTGGCAACCGCTTATCTGTCTAAGTTCAAGGACAGCAAGTCCGAGGACCTGCTGAGTAAGGACGAAGAAATGGCCGACCTGTACAGAGCTTGCGCCAGACGCATGACCGGAAAAAGAAAGGAACGGTACCGGCGTGCTGCCAGCGAAATCGTGAGACTGGCTAACGAGCACGGCTGTCTGTTCGTGTTCGGCGAGAAGGAACTGCCTACAACCAGCAAGGGCAACAAGTCTAAACAGAACCAGCGGAACACCGACTGGTCGGCCCGGGCCATCGTGAAGGCCGTGAAGGAGGCCTGCGAGGGATGTGGCCTGGGCTTCAAGCCGGTGTGGAAGGAATACTCTAGCTTGACCGACCCCTTCGAGAGGGACGGCGATGGCCGGCCTGCTCTGAGATGTAGATTCGCCAAGGTGGCTGCTCCCGACAGCGAGCTCCCACCTAGACTGACAAAGGCCGTGGGAAGCTATGTGAAGAACGCCCTAAAGGCCGATAAGGCCGAGAAGAAACAAACATGTTACCAGAGAGGAGCCATCGAGTTCTGCAGCAGGCACGGCATCGACGTCCGGAAAGCTACAGATAAGGCCATTCGGAAAGCTGTGCGGGGTAGCAGTGACCTATTAGTGCCTTTCGATGGAGGCAGAACCTTCCTGCTATCAACAAGACTGAGCCCTGAGAGCAGAAAGGTGGAATGGGCCGGAAGAACACTGTACGAGTTCCCTTCTGATATGGTGGCCGCCATCAACATCGCCTGCCGGGGCCTGGAACCTAGAAAGGCA
SEQ ID NO:37 >Sa2Cas12iコドン最適化コード配列
ATGGACGAGCAGGCCGTGGTGAGCAGCGGCTCTGATAAGACCCTGAAGATCGTGAGGCCCTACAGAGCTAAGGTGACCGCTACTGGAATCAGATTGGAAGGGATCAAAAACACCCTGAATTACCTGAAGAGAACAGAGATTTGTCTGTCCAGACTGAACGCCGCTTGCGGCGCCTTTCTGACCCCTGCCATCGTGGAGCAGATCTGTAAAGACGATCCCGCCCTGGTGTGCGCCATAGCTAGATTCCAGCTGGTGCCTGTGGGCAGCGAAGCTACCCTGAGCGATAGCGGACTGATGCGGCACTTCAAGGCGGCGCTGGGCGAACTGACCCCTCTGCAGGAAGCCTACCTGAACAGCAGTTATAACGATGAGCTGTACGCCTGGCAGGATACCCTGGTGCTGGCCAGACAGATCATCGCGGAAACCGGCCTGACCGAGGACCAGTTCCGGGCATTTGCCCACGCCTGCTTCAAGAACGGTAATATCATCGGTTGTGCCGGAGGCCCTGGCGCAAGCAATGCCATTAGCGGCATCTTCGGCGAGGGAATCAAGAGCGACTACAGCCTCCGCAGCGAGATGACAGCCGCTGTGGCTAAGGTGTTCGAGGAAAAGCGGCCCATCACATACGAGGAAGCCAGAGCCCTGGCCCTCGAAGCCACCGGCCACGCCTCTGTGCAGAGCTTTGTCGAGGCCTTTGGCAAACAGGGCAGAAAGGGCACCCTGATCCTGTTCATGGAGGACACCAAAACAGGCGCCTTCCCCTCCAACGAGTTCGACTATAAGCTGAAGAAGCTGAAGGAGGACGCAGAGCGGGTGGGCAGAAAGGGCATCATCCCACATCGGGACGTGATCGCCTCTTACCTCCGGAACCAGACCGGAGCCGACATCGAGTACAACAGCAAGGCCTGGTGCGAAAGCTACTGCTGCGCCGTTTCTGAATACAACAGCAAGATGAGCAACAACGTGCGGTTCGCTACAGAGAAGAGCCTGGACCTGACTAAGCTGGACGAGACAATCAGGGAAACCCCAAAGATCAGCGAGGCCATGCTGGTGTTCGAGAACTACATGGCCAGAATCGATGCCGACCTGAGGTTCATCGTGTCGAAGCACCACCTGGGAAACCTGGCCAAGTTCCGGCAAACAATGATGCACGTGTCCGCCAGCGAGTTCGAGGAAGCCTTCAAGGCCATGTGGGCCGATTACCTGGCTGGCTTGGAGTATGGCGAGAAACCTGCTATCTGCGAGCTGGTTAGATACGTGCTGACCCACGGCAATGACCTGCCTGTGGAAGCCTTTTACGCCGCCTGCAAGTTTCTGTCCCTGGACGACAAGATCAAGAACAGATACCCTCATCCTTTCGTGCCCGGCAACAAGGGCTATACATTCGGCGCAAAGAACCTCTGGGCCGAGATCAACGACCCTTTCAAGCCTATCAGACAGGGCAATCCTGAGGTAGCCGGCCAAAGACCCATGATGTGGGCCACAGCTGATCTGCTGGACAACAACAAGTGGGTGCTGCACCATATTCCTTTTGCCTCGAGCAGATACTTTGAGGAAGTGTACTACACAGACCCATCTCTCCCAACCGCCCAGAAGGCCAGAGACGGCAAGCACGGCTACAGACTGGGAAAGGTGCTGGATGAGGCCGCCAGAGAAAGACTGAAGGCCAACAACAGACAAAGAAAGGCCGCCAAGGCCATCGAGCGGATCAAGGCCAATTGCGAGCACAATGTGGCCTGGGACCCTACCACCACCTTCATGCTGCAACTGGACAGCGAGGGCAACGTGAAGATGACCATCAACCACAGACACATCGCCTACCGGGCTCCTAAGGAAATCGGCGTGGGCGACCGGGTTATCGGCATCGACCAGAACGAAACCGCCCCTACAACATACGCCATCTTGGAAAGAACGGAAAACCCCCGGGACCTGGAATATAACGGCAAGTACTACAGAGTGGTGAAGATGGGCAGCGTGACCTCTCCTAACGTGTCCAAATACAGAACCGTGGACGCCCTGACTTACGACGGCGTGTCTCTGAGCGACGACGCCAGCGGAGCCGTGAACTTCGTCGTGCTGTGCAGAGAGTTCTTCGCCGCTCATGGCGACGACGAGGGCCGGAAATACCTGGAGAGAACCCTGGGCTGGAGCTCCAGCCTGTATAGCTTCCACGGCAACTACTTCAAGTGCCTGACCCAGATGATGCGGAGAAGCGCCCGCTCTGGCGGCGATCTGACCGTGTACCGCGCTCACCTGCAGCAGATCCTGTTTCAGCACAACCTGTCCCCTCTGAGAATGCACAGCCTGAGCCTGCGGAGCATGGAATCTACCATGAAGGTGATCAGCTGCATGAAGTCTTACATGAGCCTGTGCGGCTGGAAAACCGATGCTGACAGAATCGCCAACGACCGGAGCCTGTTCGAAGCCGCCAGAAAGCTGTACACATCTCTGGTCAATCGGCGGACCGAAAGAGTGCGGGTGACAGCAGGCATCCTTATGAGACTGTGTCTGGAGCACAATGTGCGGTTTATCCACATGGAGGACGAGCTGCCTGTGGCTGAAACCGGCAAAAGCAAAAAAAGCAACGGCGCCAAGATGCACTGGTGTGCCCGGGAGCTGGCAGTTAGACTGTCTCAGATGGCCGAAGTGACCAGCGTTAAGTTCACCGGAGTGAGCCCCCACTACACTAGTCACCAGGACCCCTTCGTGCACTCTAAAACCAGCAAAGTGATGCGCGCCAGATGGTCCTGGCGGAACCGGGCCGACTTCACAGATAAGGACGCCGAGAGAATCCGGACTATCCTGGGCGGCGATGACGCCGGGACCAAAGCTTACTACAGAAGCGCCCTGGCCGAGTTCGCCAGCAGATACGGCCTGGATATGGAGCAAATGAGAAAGAGACGGGATGCCCAGTGGTACCAGGAGAGACTGCCTGAAACCTTCATCATCCCCCAGAGAGGCGGGAGAGTGTACCTGAGCTCCCACGACCTGGGCAGCGGCCAGAAAGTGGACGGCATCTACGGCGGAAGGGCCTTCGTGAATCACGCTGATGAGGTGGCCGCCCTTAACGTGGCTCTGGTCCGCCTC
SEQ ID NO:38 >Sa3Cas12iコドン最適化コード配列
ATGAAAACAGAGACACTGATCCGCCCTTACCCCGGCAAGCTGAACCTGCAGCCTCGGCGGGCCCAATTCCTGGAGGATTCAATCCAGTACCACCAGAAAATGACCGAGTTCTTCTACCAGTTCCTGCAGGCCGTAGGCGGCGCGACCACACATCAGAACATCAGCGATTTCATTGACAACAAGGCCACTGATGAGCACCAGGCCACCCTTCTCTTCCAGGTCGTGTCCAAGGACAGCACCACCCCTGAGTGCCCTGCCGAGGAACTGCTGGCCAGATTCGCCCAGTACACCGGCAAACAGCCCAACGAGGCCGTGACCCACTACCTGACCAGCAGAATCAACACCGACAAGTACAGATGGCAGGACAATAGACTACTGGCCCAGAACATCGCCAGCCAACTTAACATCTCCGAGACACAATTCCAGGAAATCGCGCACGCTATCCTCAGCAACAACCTGTACATCGGACAGACCGCCAGCAACGCTGCCGCCAACTTCATCTCTCAGGTGACCGGCACCGGCCAGAAAGCCCCAAAGGCTGCCAGACTGGACGTGCTGTTCCAGACGAACCAAGCCCTGGCCAAAACCCAGCCTACAACCTTTGGCCAGCTCCAGCAGATTATCGTGCAGGCTTGTGGAGAAAGCACCACCGACGCCGTGCTGGCCAAGTTCGGCAACAAAGGTGCCGCCACCTCGCTGCAGCTGGCTCTGAAAACCGACCCCAACACCACCCTGGATCAGAAAAAGTATGAGGCCCTGCAAAAGAAATTCGCCGAGGACGAAACAAAGTACCGGAACAAGGTTGACATTCCCCACAAAACGCAGCTGAGAAATCTGATCCTGAACACAAGCAATCAATTTTGCAACTGGCACACAAAGCCTGCCATCGAGGCTTTTAAGTGCGCCATCGCCGACATCCAGAGCAAGGTGTCCAACAACCTGAGGATCATGCAGGAGAAGGCCAAGCTGTACGAGGCCTTCAGAAACGTGGACCCCCAGGTGCAGATCGCTGTCCAAGCCCTGGAGAATCACATGAACACCCTCGAAGAACCCTACGCCCCTTACGCCCACAGCTTCGGCAGCGTGAAGGACTTCTATGAGGACCTGAACAACGGCAGCAATCTGGACGAGGCAATTCAGACCATCGTGCACGATTCTGATAACTTCAACCGGAAGCCTGATCCTAACTGGCTGAGAATCATCGCCCCACTGCACTCTAGCCACAGCGCCTCTCAGATCATGGAAGCTGTGAAATACCTGAGCAGCAAGCAGGACTACGAACTGAGGAAGCCCTTCCCATTCGTGGCCACCAACCTGCCTGCCACATACGGCAAGTTCAATATCCCCGGCACCCTGAACCCTCCTACAGACTCTCTGCACGGCAGACTGAACGGCTCTCACAGCAACATGTGGCTGACAGCCCTGCTGCTGGACGGCAGAGACTGGAAGAACCACCACCTGTGCTTCGCCAGCAGCAGATACTTCGAAGAAGTCTACTTCACCAACCCTAGCCTGCCCACCACCGATAAAGTGCGGTCCCCAAAGTGCGGCTTTACCCTGAAGAGCGTGCTGGACAGCGAGGCTAAGGATAGAATCCGTAATGCCCCTAAGAGCAGAACCAAGGCCGTGAAGGCCATCGAGAGAATTAAGGCTAATTCTACCCACAACGTGGCCTGGAACCCCGAGACAAGCTTCCAGATGCAGAAGAGAAACGACGAGTTCTACATCACAATCAACCACAGGATCGAGATGGAAAAGATCCCCGGCCAAAAGAAAACAGACGACGGCTTCACCATCCACCCCAAGGGCCTGTTTGCTATCCTGAAGGAAGGAGATAGAATCCTGAGCCAGGATCTGAATCAGACAGCCGCTACACACTGCGCCGTGTACGAGGTGGCCAAGCCTGACCAGAACACCTTCAACCACCATGGCATCCACCTGAAGCTGATCGCCACCGAAGAACTGAAGATGCCTCTGAAAACCAAGAAGTCTACCATCCCAGATGCCCTGTCATACCAGGGCATCCACGCCCACGACCGGGAAAACGGCCTGCAGCAGCTGAAGGACGCTTGCGGAGCCTTCATCTCACCTAGACTGGACCCCAAGCAGAAGGCCACCTGGGACAACAGCGTGTCCAAGAAAGAAAACCTGTACCCTTTCATCACCGCCTACATGAAGCTGCTGAAGAAGGTGATGAAGGCGGGCCGGCAGGAGCTGAAGCTGTTTCGGACTCATCTGGATCACATCCTGTTCAAACACAATCTCAGCCCTCTGAAACTGCACGGCGTGAGCATGATCGGCCTGGAGAGCAGCAGAGCTACAAAAAGCGTGATCAACAGCTTCTTCAACCTGCAGAACGCTAAGACTGAGCAGCAGCAGATCGCCTTAGACAGACCCCTGTTCGAGGCCGGCAAGACACTGATCAATAATCAGACCAGAAGAAGGCAGGAAAGAGTGCGGCTGGAAACATCTCTGACCATGAGACTGGCCCATAAGTATAACGCTAAAGCCATCATCATTGAGGGAGAGCTGCCTCACAGCTCCACCGGCACATCTCAGTACCAGAACAACGTGCGGCTGGATTGGAGTGCCAAGAAGAGCGCCAAGCTGAAAACCGAAAGCGCCAACTGCGCTGGAATCGCCATCTGCCAGATCGACCCTTGTCACACCTCCCACCAGAACCCTTTTCGGCACACCCCTACAAACCCTGACCTGCGGCCACGGTTCGCCCAGGTGAAGAAAGGCAAGATGTTCCAGTACCAGCTTAATGGCCTCCAGCGGCTGCTGAATCCTAGATCAAAGTCTAGCACAGCAATCTACTACCGGCAGGCCGTGCAAAGCTTTTGTGCCCACCACAACCTGACCGAGAGAGACATCACCTCTGCCAAATTTCCCAGCGACCTGGAAAAGAAGATCAAGGACGACACCTACCTGATCCCTCAGAGAGGCGGCCGGATCTACATCAGTAGCTTCCCTGTTACAAGCTGCGCCAGACCTTGCACAAGCAACCATTATTTCGGCGGAGGCCAGTTCGAGTGTAATGCTGATGCCGTGGCCGCCGTGAACATCATGCTGAAGGTCCACCCT
SEQ ID NO:39 >WaCas12iコドン最適化コード配列
ATGCCTATCCGGGGCTATAAGTGCACCGTGGTGCCTAATGTGCGGAAAAAGAAACTGCTGGAGAAAACATACAGCTACCTGCAGGAGGGCAGCGACGTGTTTTTCGATCTGTTCCTGTCACTGTATGGCGGCATCGCCCCTAAGATGATCCCTCAGGATCTGGGCATCAACGAGCAAGTGATCTGTGCCGCAAACTGGTTCAAGATCGTGGAAAAGACCAAGGACTGCATCGCCGACGACGCCCTGCTGAACCAGTTTGCCCAGTACTACGGCGAGAAGCCTAACGAGAAGGTTGTGCAGTTTCTGACAGCTTCTTATAACAAAGATAAGTACGTGTGGGTCGACTGCCGTCAAAAGTTCTACACCCTGCAGAAAGACCTGGGAGTGCAGAACCTCGAGAACGACCTGGAGTGCCTGATCCGCGAGGACCTGCTGCCTGTGGGATCTGATAAGGAAGTGAATGGATGGCACAGCATCAGCAAACTCTTCGGCTGCGGCGAGAAGGAGGACAGAACCATCAAGGCCAAGATTCTGAACGGCCTGTGGGAGCGGATCGAGAAGGAAGATATTCTGACCGAGGAGGACGCCAGAAACGAGCTGCTGCATAGCGCTGGCGTGCTGACCCCTAAGGAGTTCAGAAAGGTGTACAAGGGCGCCGCCGGCGGACGGGACTGCTACCACACCCTGCTGGTTGACGGCAGAAACTTCACCTTCAACCTGAAAACCCTGATCAAGCAGACCAAGGACAAGCTCAAGGAAAAGTCCGTGGATGTGGAAATCCCCAACAAGGAGGCCCTGAGGCTGTACCTGGAAAAGCGAATCGGAAGATCTTTCGAGCAGAAGCCTTGGTCCGAGATGTACAAAACCGCCCTGAGCGCTGTTATGCCCAAGAACACCCTGAATTACTGCTTTGCCATCGATAGACACGCCCAGTACACGAAGATCCAGACCCTGAAGCAACCTTACGACTCTGCCATCACCGCCCTGAACGGCTTCTTCGAGAGCGAATGCTTCACCGGGAGCGACGTGTTCGTGATCAGCCCTAGCCACCTGGGAAAAACCCTGAAGAAGCTGTACAACTACAAGGACGTTGAGAGCGGAATCAGCGAGATCGTCGAGGACGAGGATAATAGCCTGCGGAGCGGCGTGAACGTGAATCTGCTTCGGTACATCTTCACACTGAAGGATATGTTCAGCGCCGAGGACTTCATCAAGGCCGCCGAGTACAACGTAGTGTTTGAGAGATACAATAGACAGAAAGTCCACCCTACAGTGAAGGGCAATCAAAGCTTCACATTTGGCAACAGCGCTCTGTCTGGCAAGGTGATCCCTCCATCTAAGTGTCTGAGCAACCTGCCTGGACAGATGTGGCTGGCCATCAATCTGCTGGACCAGGGCGAGTGGAAGGAGCACCACATTCCCTTCCACAGCGCCAGATTCTACGAGGAAATCTACGCTACATCTGATAACCAGAACAACCCCGTGGACCTGCGGACCAAGAGATTCGGCTGTTCTCTGAACAAGACCTTCAGCGCCGCTGACATCGAGAAGGTGAAGGAGTCTGCCAAGAAAAAGCACGGAAAGGCCGCTAAGAGAATCCTGCGTGCCAAGAACACAAACACCGCCGTGAACTGGGTGGATTGCGGCTTCATGCTGGAAAAGACCGAAGTGAACTTCAAAATCACCGTCAATTACAAACTGCCCGATCAGAAGCTGGGCAAGTTCGAGCCTATCGTGGGCACAAAAATCCTGGCTTATGACCAGAATCAGACCGCCCCAGATGCCTACGCCATCCTGGAAATTTGCGACGATTCTGAAGCCTTCGACTACAAGGGCTACAAAATCAAATGTCTGAGCACCGGGGACCTGGCCAGCAAGTCCCTGACAAAGCAGACAGAAGTGGACCAGCTGGCATATAAGGGCGTAGACAAAACCAGCAACTTCTACAAGAAGTGGAAGCAGCAGCGGAGACTTTTTGTGAAGAGCCTGAATATCCCAGACGCCCTGAAATCTTTTGAAAACATCAACAAGGAGTACCTGTACGGCTTTAACAATAGTTACCTGAAGCTACTGAAGCAAATTCTGAGAGGCAAATTCGGACCTATCCTGGTGGACATCAGACCTGAGCTGATCGAGATGTGCCAGGGCATCGGCAGCATCATGCGGCTGTCCAGCTTGAACCACGACAGCCTGGACGCCATTCAGTCCCTGAAGAGCCTGCTGCACTCTTACTTCGACCTGAAGGTGAAGGAAGAAATCAAGACCGAAGAGCTGAGAGAGAAGGCCGATAAGGAAGTGTTTAAGCTGCTGCAACAGGTGATCCAGAAGCAGAAGAATAAGAGAAAGGAAAAGGTGAACAGAACAGTGGATGCTATCCTGACACTGGCCGCCGACGAGCAAGTGCAGGTGATCGTGGGCGAAGGCGACCTGTGCGTGTCCACCAAGGGCACCAAAAAGAGACAGAACAACCGGACAATCGACTGGTGCGCGAGAGCCGTGGTCGAGAAACTGGAAAAAGCCTGCAAGCTGCACGGCCTGCACTTCAAGGAAATCCCCCCCCACTACACCAGCCACCAGGACTGTTTCGAGCACAACAAGGACATCGAGAATCCTAAGGAAGTGATGAAGTGTAGATTCAACAGCAGCGAGAACGTGGCCCCTTGGATGATTAAGAAGTTCGCCAACTACCTTAAATGCGAGACAAAATACTACGTGCAGGGCATGCAGGACTTCCTGGAACATTACGGCCTGGTGGAATACAAGGACCATATCAAGAAGGGAAAGATCAGTATCGGCGATTTTCAGAAACTGATCAAGCTGGCCCTGGAAAAAGTAGGCGAGAAGGAAATCGTGTTTCCTTGCAAAGGCGGCAGAATCTACCTGAGCACCTACTGTCTGACCAACGAGTCCAAACCCATCGTGTTCAACGGCAGACGGTGCTATGTGAACAACGCCGACCACGTGGCCGCTATCAACGTGGGCATCTGCCTGTTGAATTTCAACGCCAGAGCTAAGGTGGCTGAAAAGACACCA
SEQ ID NO:40 >Wa2Cas12iコドン最適化コード配列
ATGGCCAAGAAGGACTTCATCGCCAGACCTTACAACAGCTTTCTGCTGCCTAACGACAGAAAGCTGGCTTACCTGGAAGAAACATGGACCGCCTACAAGAGCATCAAGACCGTGCTGCACAGATTTCTGATCGCGGCCTATGGCGCCATCCCCTTCCAGACATTCGCCAAAACCATTGAAAACACCCAAGAGGACGAGCTGCAACTGGCCTATGCCGTGCGGATGTTCAGACTGGTGCCCAAGGACTTCAGCAAGAACGAGAACAACATTCCACCTGACATGCTGATCAGCAAGCTGGCCAGCTACACCAATATCAACCAGTCCCCAACAAACGTTCTCAGCTACGTGAATAGCAACTACGACCCAGAGAAATACAAGTGGATCGATTCTAGAAACGAGGCCATCAGCCTGAGCAAGGAGATCGGCATCAAGCTGGACGAGCTCGCTGATTACGCCACCACCATGCTGTGGGAGGATTGGCTGCCCCTGAACAAGGACACAGTGAACGGCTGGGGAACCACCTCTGGCCTGTTCGGCGCCGGCAAAAAAGAGGATAGGACCCAAAAGGTGCAGATGCTGAACGCCCTGCTGCTGGGCCTGAAAAACAACCCCCCCAAGGATTACAAGCAGTACAGCACCATCCTACTGAAGGCATTTGATGCCAAGAGCTGGGAAGAGGCCGTGAAGATTTACAAAGGCGAGTGTTCTGGCCGAACAAGTAGTTACCTGACTGAGAAGCACGGTGACATCAGCCCTGAGACACTGGAAAAGCTGATCCAGAGCATCCAGCGGGACATCGCCGACAAACAGCACCCAATCAACCTGCCAAAGAGAGAAGAAATCAAAGCCTACCTGGAGAAACAGTCTGGCACCCCATACAACCTGAACCTGTGGAGCCAGGCCCTGCACAACGCCATGAGCTCTATCAAGAAAACCGACACCAGAAATTTCAACTCTACCCTGGAGAAGTACGAGAAGGAAATCCAGCTGAAGGAGTGCCTTCAAGATGGCGACGATGTGGAGCTGCTGGGGAACAAGTTTTTCTCTTCTCCTTACCACAAGACAAATGATGTGTTCGTGATCTGCTCTGAACACATCGGAACAAATAGAAAGTACAACGTGGTCGAGCAGATGTATCAGCTGGCCAGCGAGCACGCCGACTTCGAGACAGTTTTCACCCTGCTGAAGGACGAGTATGAGGAAAAGGGCATCAAGACACCCATCAAAAACATCCTGGAGTACATCTGGAACAACAAGAACGTCCCTGTGGGCACATGGGGCCGGATCGCTAAATACAACCAGCTGAAGGACAGATTAGCAGGGATCAAGGCCAATCCCACAGTGGAATGCAACAGAGGCATGACATTTGGCAACAGCGCCATGGTGGGCGAAGTGATGCGCTCCAACCGGATCAGCACCAGCACCAAGAACAAGGGCCAGATCTTGGCCCAGATGCACAACGACCGGCCTGTGGGCAGCAACAACATGATTTGGCTGGAAATGACCCTCCTGAACAACGGCAAGTGGCAGAAGCACCACATCCCCACACACAACAACAAATTTTTCGAGGAAGTGCACGCCTTCAACCCTGAACTGAAGCAGAGCGTGAACGTGAGAAACAGAATGTACAGAAGCCAGAACTACTCACAGCTGCCTACCAGCCTGACCGACGGCCTGCAGGGAAATCCTAAGGCCAAGATCTTCAAGAGACAGTACAGAGCCCTGAACAACATGACCGCTAATGTGATCGACCCTAAGCTGTCCTTCATCGTGAACAAGAAAGATGGAAGATTCGAGATCAGCATCATCCACAACGTGGAAGTGATCCGAGCCAGACGGGACGTGCTGGTCGGCGACTACCTGGTGGGCATGGACCAAAACCAGACGGCTTCTAATACCTACGCCGTCATGCAGGTGGTGCAGCCTAACACCCCCGACAGCCATGAGTTCAGAAACCAGTGGGTCAAGTTCATCGAGAGCGGCAAGATCGAGAGCTCAACACTGAACTCCCGGGGTGAGTACATCGACCAGCTGAGCCACGATGGCGTCGACCTGCAGGAGATTAAGGATTCTGAGTGGATTCCTGCCGCCGAAAAATTCCTGAACAAGCTAGGAGCTATCAACAAAGACGGCACCCCCATCAGCATCTCCAACACCAGCAAACGGGCCTACACATTCAATAGCATCTATTTCAAAATCCTGCTGAATTATCTGAGAGCCAACGACGTGGACCTGAATCTGGTGCGGGAAGAGATCCTGCGGATCGCCAACGGCAGATTCAGCCCTATGCGGCTGGGATCTCTGTCCTGGACCACACTAAAAATGCTGGGCAATTTCCGGAACCTAATTCACAGCTACTTCGACCACTGTGGCTTTAAGGAAATGCCTGAGAGAGAAAGCAAGGACAAGACCATGTACGATCTGCTGATGCACACCATCACCAAGCTGACCAACAAGCGGGCCGAGCGCACCAGCAGAATCGCTGGAAGCCTGATGAACGTGGCTCACAAGTACAAGATCGGCACAAGCGTGGTCCACGTGGTGGTGGAAGGCTCTCTGAGCAAAACCGACAAGAGCAGCTCCAAGGGCAACAATCGGAATACCACAGACTGGTGCAGCCGGGCCGTGGTGAAGAAGCTTGAAGATATGTGCGTGTTCTACGGCTTCAACCTGAAAGCCGTGAGCGCCCACTACACCAGCCACCAGGACCCTCTGGTTCATAGAGCCGATTACGATGATCCTAAGTTGGCCCTGAGATGCAGATACTCTTCTTACAGCAGAGCTGATTTTGAGAAGTGGGGCGAAAAATCTTTCGCCGCCGTGATCAGATGGGCCACAGACAAGAAGAGCAACACCTGCTACAAGGTGGGAGCCGTAGAGTTCTTCAAGAACTACAAAATCCCTGAGGACAAGATCACCAAAAAGCTGACCATCAAAGAGTTCCTGGAAATTATGTGCGCTGAGAGCCACTACCCTAATGAGTACGACGACATTCTGATCCCTAGAAGGGGCGGCAGAATCTACCTCACAACTAAGAAGCTGCTGTCCGATAGCACCCACCAGAGAGAGTCTGTGCATAGCCATACCGCCGTGGTGAAGATGAACGGCAAGGAATACTATAGCAGCGACGCCGATGAGGTGGCTGCTATCAATATCTGCCTGCACGACTGGGTGGTCCCCCTGAATTGGACAAATCACTGCCTGCCTGCCGGATGGTGTAGCGACCACCTGAAGGAATGCGTGCAATGTCACACCCCTGATCCTGTGAGAATCAGCATG
SpCas9タンパク質、SEQ ID NO:47
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
SpCas9足場配列、SEQ ID NO:48
CCATTACAGTAGGAGCATACGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGC
LbCas12aタンパク質、SEQ ID NO:49
MAIPVGKTQENIDNKRLLVEDEKRAEDYKGVKKLLDRYYLSFINDVLHSIKLKNLNNYISLFRKKTRTEKENKELENLEINLRKEIAKAFKGNEGYKSLFKKDIIETILPEFLDDKDEIALVNSFNGFTTAFTGFFDNRENMFSEEAKSTSIAFRCINENLTRYISNMDIFEKVDAIFDKHEVQEIKEKILNSDYDVEDFFEGEFFNFVLTQEGIDVYNAIIGGFVTESGEKIKGLNEYINLYNQKTKQKLPKFKPLYKQVLSDRESLSFYGEGYTSDEEVLEVFRNTLNKNSEIFSSIKKLEKLFKNFDEYSSAGIFVKNGPAISTISKDIFGEWNVIRDKWNAEYDDIHLKKKAVVTEKYEDDRRKSFKKIGSFSLEQLQEYADADLSVVEKLKEIIIQKVDEIYKVYGSSEKLFDADFVLEKSLKKNDAVVAIMKDLLDSVKSFENYIKAFFGEGKETNRDESFYGDFVLAYDILLKVDHIYDAIRNYVTQKPYSKDKFKLYFQNPQFMGGWDKDKETDYRATILRYGSKYYLAIMDKKYAKCLQKIDKDDVNGNYEKINYKLLPGPNKMLPKVFFSKKWMAYYNPSEDIQKIYKNGTFKKGDMFNLNDCHKLIDFFKDSISRYPKWSNAYDFNFSETEKYKDIAGFYREVEEQGYKVSFESASKKEVDKLVEEGKLYMFQIYNKDFSDKSHGTPNLHTMYFKLLFDENNHGQIRLSGGAELFMRRASLKKEELVVHPANSPIANKNPDNPKKTTTLSYDVYKDKRFSEDQYELHIPIAINKCPKNIFKINTEVRVLLKHDDNPYVIGIDRGERNLLYIVVVDGKGNIVEQYSLNEIINNFNGIRIKTDYHSLLDKKEKERFEARQNWTSIENIKELKAGYISQVVHKICELVEKYDAVIALEDLNSGFKNSRVKVEKQVYQKFEKMLIDKLNYMVDKKSNPCATGGALKGYQITNKFESFKSMSTQNGFIFYIPAWLTSKIDPSTGFVNLLKTKYTSIADSKKFISSFDRIMYVPEEDLFEFALDYKNFSRTDADYIKKWKLYSYGNRIRIFRNPKKNNVFDWEEVCLTSAYKELFNKYGINYQQGDIRALLCEQSDKAFYSSFMALMSLMLQMRNSITGRTDVDFLISPVKNSDGIFYDSRNYEAQENAILPKNADANGAYNIARKVLWAIGQFKKAEDEKLDKVKIAISNKEWLEYAQTSVKH
LbCas12a DR配列、SEQ ID NO:50
TAATTTCTACTAAGTGTAGATCCATTACAGTAGGAGCATAC
SEQ ID NO:51 >SiCas12i-crRNA
CTAGCAATGACTCAGAAATGTGTCCCCAGTTGACACCCATTACAGTAGGAGCATAC
SEQ ID NO:52 >Si2Cas12i-crRNA
ATCGCAACATCTTAGAAATCCGTCCTTAGTTGACGGCCATTACAGTAGGAGCATAC
SEQ ID NO:53 >WiCas12i-crRNA
TCTCAACGATAGTCAGACATGTGTCCCCAGTGACACCCATTACAGTAGGAGCATAC
SEQ ID NO:54 >Wi2Cas12i-crRNA
CTCAAAGTGTCAAAAGAATGTCCCTGCTAATGGGACCCATTACAGTAGGAGCATAC
SEQ ID NO:55 >Wi3Cas12i-crRNA
TCCCAAAGTGGCAAAAGAATCTCCCTGTTAATGGGAGCCATTACAGTAGGAGCATAC
SEQ ID NO:56 >SaCas12i-crRNA
GTCTAACTGCCATAGAATCGTGCCTGCAATTGGCACCCATTACAGTAGGAGCATAC
SEQ ID NO:57 >Sa2Cas12i-crRNA
TCGGGGCACCAAAATAATCTCCTTGGTAATGGGAGCCATTACAGTAGGAGCATAC
SEQ ID NO:58 >Sa3Cas12i-crRNA
CCACAACAACCAAAAGAATGTCCCTGAAAGTGGGACCCATTACAGTAGGAGCATAC
SEQ ID NO:59 >WaCas12i-crRNA
GTAACAGTGGCTAAGTAATGTGTCTTCCAATGACACCCATTACAGTAGGAGCATAC
SEQ ID NO:60 >Wa2Cas12i-crRNA
GAGAGAATGTGTGCAAAGTCACACCCATTACAGTAGGAGCATAC
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図12
図13-1】
図13-2】
図14
図15
図16
図17
図18
図19
図20
図21
【配列表】
2024540337000001.xml
【国際調査報告】